You are on page 1of 27

DANIEL BOGOYA MALDONADO

*

Evaluación Educativa en Colombia
ICFES - COLOMBIA
SEMINARIO INTERNACIONAL DE EVALUACIÓN Cartagena de Indias, 16 y 17 de febrero de 2006

1. INTRODUCCIÓN
La política educativa colombiana se ha basado en las últimas décadas en cuatro ejes principales: calidad, pertinencia, cobertura y eficiencia. En relación con la eficiencia, el país viene trabajando en conjunto con entidades territoriales y con las instituciones educativas para alcanzar cada vez un uso más racional de los recursos financieros, de infraestructura y de talento humano, a partir del uso intensivo de tecnologías de información y comunicaciones, del establecimiento de estándares y de la formación de directivos con un fuerte componente en el campo de la gestión. En términos de cobertura, el país aspira a que en el año 2019, cuando cumplamos dos siglos como república independiente, el 100% de nuestros niños logre concluir los niveles de educación básica y media y el 40% el nivel de educación superior1. Respecto de la pertinencia, se señala la participación sistemática de los distintos actores sociales en la construcción de los estándares curriculares, los planes de desarrollo de largo plazo y los proyectos educativos institucionales, con el fin de lograr que el sistema educativo forme

ciudadanos integrales y capaces de interpretar el mundo por venir y de generar soluciones satisfactorias a múltiples y variados tipos de problemas. Y sobre la calidad, es imperativo reconocer el compromiso de estudiantes y familias, docentes y directivos, investigadores y tomadores de decisiones para lograr una oferta educativa capaz de formar a todos los ciudadanos2 con los más altos niveles de comprensión y competencia en los distintos campos del saber. Este compromiso se consigna en la esperanza colombiana de lograr, en el 2019, que el 100% de los estudiantes de grado quinto, en las áreas de lenguaje, matemática y ciencias naturales, alcance el nivel de logro C en las pruebas del proyecto SABER; el 100% de los estudiantes de grado noveno, en las áreas de lenguaje y ciencias naturales, y el 80% en el área de matemática, alcancen el nivel de logro D en las pruebas del proyecto ya referido SABER; el 50% de las instituciones escolares que forman bachilleres alcance la categoría de puntajes altos en las pruebas del proyecto ICFES; y de

* 1 2

Director General del Instituto Colombiano para el Fomento de la Educación Superior, ICFES Al respecto, ver Visión Colombia II Centenario: 2019, tabla 4.5, página 231; y tabla 4.7, página 235.

Al referir que todos los ciudadanos deben alcanzar un alto nivel de comprensión y competencia, se compromete un concepto de equidad en el acceso, cuando se brindan las oportunidades para que todos los estudiantes potenciales ingresen al sistema educativo, y de equidad en el proceso, cuando se requieren mecanismos para que todos los proyectos educativos institucionales –PEI– alcancen el punto de llegada esperado con todos sus estudiantes.

N1

disminuir la tasa de deserción en educación superior hasta el 25%3. Inscritos en el eje de la calidad, para lograr las metas mencionadas, el país acude a un proceso cíclico que comprende tres etapas: definición de metas, evaluación de aprendizajes y competencias desarrolladas por los estudiantes a su paso por las instituciones escolares y establecimiento e implementación de planes de mejoramiento. Ahora bien, la consistencia y coherencia de estos planes se fundamenta en una información cierta acerca de los estados de desarrollo de cada uno de los proyectos educativos en el momento de la evaluación de aprendizajes y competencias, tarea que justamente le corresponde realizar al ICFES, como entidad especializada en el tema. Enseguida, se muestran algunos giros decisivos para construir condiciones de posibilidad que permiten implementar un sistema de evaluación en todos los niveles de educación y se presentan los proyectos de evaluación actualmente en desarrollo en Colombia.

2.1. De lo oculto a lo visible
La evaluación ha dejado de ser un ejercicio oculto, que se realizaba en forma secreta por parte de unos actores expertos o portadores de alguna autoridad administrativa, y se ha convertido en una práctica visible que puede ser observada, analizada e interpretada por quienes son objeto de la evaluación. Este giro conlleva a los evaluados a cualificar su entendimiento alrededor del tema, a reconocer la importancia de la evaluación, a tomar conciencia acerca de la validez de los resultados alcanzados y a precisar y profundizar en sus reclamaciones. La visibilidad, en tanto implica la exposición de los procedimientos, trae consigo la necesidad de fundamentar y robustecer las argumentaciones y explicaciones que los evaluadores dan a las interpelaciones de los evaluados y al final el perfeccionamiento del sistema.

2.2. De lo omnímodo a lo dialógico
La definición de los propósitos, los procedimientos implicados y el uso de los resultados de una evaluación, que fueron una tarea exclusiva de expertos, usualmente contratados temporalmente para orientar un determinado proyecto, constituyen en la actualidad una labor colectiva en la que una comunidad calificada puede aportar contribuciones significativas. Se trata de girar hacia un diálogo y una concertación con todos los actores, como base para la definición de marcos teóricos, referentes conceptuales, instrumentos y métodos de análisis: un diálogo real y efectivo en el que puedan escucharse, analizarse y tenerse en cuenta las distintas voces del saber en cuestión que se evalúa y en el que cada actor pueda reconocer su aporte, con miras a la apropiación de un proyecto y a una participación genuina por parte de los evaluados.

2. GIROS EN LA EVALUACIÓN
La implementación y la sostenibilidad de un sistema de evaluación requieren condiciones técnicas4, tecnológicas5 y políticas adecuadas y la concertación de propósitos y metodologías con los distintos actores que participan en la evaluación. En este caso, a manera de giros, se ilustran las condiciones políticas construidas y adoptadas, con el fin de alcanzar la legitimidad de los proyectos de evaluación censal colocados en escena en Colombia principalmente en los últimos diez años.

3 4

Ver Visión Colombia II Centenario: 2019, tabla 4.6, página 233; y tabla 4.7, página 235.

Se trata de procedimientos consolidados al nivel internacional para elaborar marcos teóricos, instrumentos de evaluación, procesamiento de datos, análisis de ítems y generación de reportes. Colombia está comprometida con una evaluación centrada en el enfoque de competencias, con un procesamiento basado en la teoría de respuesta al ítem con un parámetro y con la generación de reportes que dan cuenta de variables cuantitativas y de dimensiones cualitativas. Colombia ha tomado la decisión de utilizar tecnologías de información y de comunicaciones de punta para llevar a cabo todos sus procesos en línea, en forma automática vía web, desde el registro de los participantes en una evaluación hasta la disposición de reportes de resultados.
5

N2

De acto final a práctica permanente La evaluación que usualmente se confundía con la realización de un examen final. un grupo o una institución rendían cuentas a una autoridad y se jugaban en un solo momento la aprobación de su trabajo.4. entendidas como la capacidad de interpretar en toda su complejidad una porción del mundo bajo análisis. donde un estudiante. La evaluación cobra sentido si los resultados alcanzados pueden utilizarse para realimentar los procesos evaluados y lo pierde si dichos resultados proceden sólo al final. Este giro implica un acto de reconocimiento hacia la naturaleza. 2. La información que se deriva al evaluar los estudiantes de un proyecto educativo mediante exámenes es genuina para él y le reporta con certeza fortalezas y debilidades. en el que queda entonces incorporada la evaluación como una de sus entidades conceptuales. la lógica particular y la gramática de un cierto campo. para tomar así decisiones informadas y oportunas acerca de la confirmación o el re-direccionamiento necesario en los procesos y lograr el nivel de avance previsto. proponer y argumentar soluciones plausibles a problemas nuevos y generar nuevos espacios conceptuales. se reconstruye la evaluación de un campo desde la lógica de dicho campo. 2. al concluir un proceso. metodológicos y de acción. De definiciones a competencias El balance mundial muestra gran rapidez y efectividad en la propagación de información a través de las redes de datos y a la vez un crecimiento cada vez mayor en la cantidad generada de tales datos. más allá de sólo trasmitirles datos..5.CONFERENCIA: Evaluación educativa en Colombia 2. explora al mismo tiempo varios procesos y adquiere entonces un carácter politómico: cada una las opciones que brinda constituye un mundo posible con distintos alcances de validez y universalidad. ha venido girando hacia una actividad permanente que permite conocer la progresión y tendencia de un proceso en todo momento.3. Este giro permite reconocer niveles más profundos de dominio por parte de los evaluados con un menor número de unidades. que si bien interactúan con un entorno similar también reúnen características propias y probablemente diferentes. es decir. En la nueva concepción. de carácter dicotómico. pero debe adaptarse cuando va a ser utilizada por la institución. para los individuos evaluados a través de un Examen de Estado. De un mundo ajeno a uno propio La relación entre el trabajo de los expertos en evaluación y el de los expertos en las disciplinas que deben evaluarse ha dejado de ser subordinada para dar paso a una labor coordinada de equipo. Este balance sugiere que los sistemas educativos piensen en formar ciudadanos capaces de seleccionar y utilizar con sentido la abundante información disponible. 6 N3 . construir. Cada unidad dialoga ahora con las demás y revela varias dimensiones del saber. De unidimensional a multidimensional El diseño de los instrumentos de evaluación ha dejado de considerar pequeños corpúsculos unitarios e independientes. para girar hacia la fijación de un contexto que determina un conglomerado de unidades y que comprende aspectos más amplios y complejos de un campo conceptual y niveles de desempeño. La evaluación se convierte en una actividad permanente para las instituciones. Este giro desencadena una paradoja. pues corresponde a una cohorte determinada que concluye un proceso y las acciones que se tomen recaerán sobre otros estudiantes. El giro que aquí se muestra consiste en abandonar la evaluación basada en definiciones para asumirla con un enfoque de competencias. desde la particularidad de su misma esencia y no sólo desde la lógica universal de la evaluación. pero en un ejercicio final. definiciones y técnicas para que los recuerden. donde a partir de dos saberes especializados se teje un nuevo concepto que emerge ahora desde el propio campo evaluado. cuando tales procesos han concluido y en caso de presentar algunas fallas ya no pueden corregirse6. se piensa y se estructura la evaluación de un determinado saber.6. que indagan por una dimensión de un microdominio temático y un dominio cognitivo. 2.

De operaciones manuales a automáticas La irrupción de la tecnología ha permitido automatizar múltiples operaciones que anteriormente se realizaban de manera manual y que requerían enormes esfuerzos. independiente del tamaño y la dispersión de los grupos que deben atenderse. ha cedido el lugar a escenarios de discusión. operaciones que siempre se atienden con las mismas condiciones de diseño y con los mismos parámetros establecidos. El giro hacia la instalación de procesos en tiempo real conlleva a ofrecer una interacción con respuestas satisfactorias y pertinentes para los usuarios evaluados. De programas solitarios a sistemas expertos La posibilidad de programar máquinas computadoras con estrategias complejas y visiones integrales ha permitido el paso de soluciones puntuales con programas específicos y solitarios a soluciones integrales con sistemas expertos que cubren toda una red o cadena de procesos. contempla ahora otra señal: el hilo conductor que lo coloca en diálogo con otros ítems y que le confiere sentido justo cuando él hace parte vital de un conjunto. 2. Los vasos comunicantes que ahora transfieren información entre ítems conducen a una condición de dependencia entre ellos y a mantener más estable su relación con los evaluados en situación de prueba. Los sistemas expertos permiten que los usuarios de la evaluación reciban sus resultados de manera ágil. analistas y jueces. El giro de la automatización garantiza unicidad y consistencia en el uso de la técnica que se despliega para la confirmación de cada transacción. el tratamiento de los datos. mismas operaciones.10. Este giro consiste en hacer explícitas las reglas de decisión complejas que grupos humanos utilizan –al terminar un proceso y justo para establecer las condiciones iniciales de otro proceso que hace parte de la red y que sigue en la cadena– y en programarlas para efectos de llevarlas a cabo en forma automática. Del ítem peregrino al ítem concertado La metodología de elaboración y selección de ítems. para lograr una atención más oportuna de las expectativas de los evaluados. soportada en un recorrido extenso y riguroso desde el momento de su escritura primigenia – que se basaba en una lógica y una interpretación de supeditación– hasta el de la aprobación que se apoyaba en la fuerza de la decisión. Del instrumento fragmentado al cohesionado El mapa o tabla de especificaciones de un instrumento que solía indicar las características puras y únicas de un ítem. en virtud de compartir alguna singularidad. con respuestas inmediatas para todos los usuarios de la evaluación. es posible llevar a cabo las . aislado e independiente de los demás. reproducible y robusta y que quienes la administran puedan dedicar su energía a la conceptualización. De colas de espera a procesos en tiempo real La evaluación como fuente de información valiosa en la toma de decisiones ha comprendido la necesidad de disminuir los tiempos de las colas de espera que se formaban con sus usuarios pendientes de un resultado.11. Aparece entonces mediante este giro la cohesión como propiedad de un instrumento. siempre fragmentado.7. 2. donde sus autores no podían sustentarlos en los juicios realizados sólo por expertos ni conocer el resultado del estudio ni ajustarlos para someterlos a un nuevo análisis. gestión y dirección de procesos. posible en un primer momento a expensas de un contexto que constituye el imán que atrae y mantiene unidos a los ítems. 2. donde cada actor reconoce a los demás y aporta y argumenta su conocimiento para lograr un ítem satisfactorio ante la mirada interdisciplinar de constructores.2. el análisis de los ítems y la estructura de reportes. diseño y construcción colegiada.8. Ahora. espacios y tiempos. que además cada vez se incrementan en mayor grado.9. El peregrinaje dispendioso de los ítems. diseño. ha girado hacia la construcción concertada entre los distintos actores. justo en el momento que ellos las requieren y cuando se poseen los insumos necesarios para N4 2.

El proyecto comenzó en 1991 con aplicaciones muestrales y entre los años 2002 y 2003 se llevó a cabo la primera aplicación censal que constituye una línea de base.626 estudiantes evaluados. con 1. pues ahora quienes conforman el mundo más próximo al de los evaluados juegan un papel más protagonista y adquieren la responsabilidad de implementar la evaluación.1. en las mismas áreas más ciencias sociales. implementación de esta evaluación en el país.2 se combinan los resultados de promedios de puntajes alcanzados por los estudiantes evaluados en el área de lenguaje. a continuación en las gráficas 3. Del centro a las regiones El reconocimiento del desarrollo local. 7 N5 . Los resultados alcanzados en el proyecto SABER en la aplicación de los años 2002 y 2003 pueden consultarse en el sitio www. A manera de ejemplo. y sólo al calendario sur (A) que comprende aproximadamente al 80% de la población para la aplicación del año 2005. La ejecución descentralizada de operaciones hace visibles otros actores e incrementa su conocimiento y capacidad en el tema. respectivamente.gov. de promedio y desviación estándar de puntajes y del número de estudiantes evaluados en cada área. 3. para continuar con una observación sistemática de los efectos de las políticas de mejoramiento. pues las decisiones involucradas pueden lograr un efecto más temprano de las correcciones que deban efectuarse. con miras a servir de insumo para el establecimiento de los planes de mejoramiento en cada institución educativa. departamento o país.12. Este giro conlleva un cambio significativo de valoración y de relación entre evaluados y evaluadores. en las áreas de lenguaje. tanto para la aplicación realizada entre los años 2002 y 2003 como para la aplicación del año 20057.CONFERENCIA: Evaluación educativa en Colombia producir tales respuestas. se comunica significado y sentido a la evaluación.mineducacion. de acuerdo con los mismos parámetros y estándares que se siguen en todas las regiones. Cada punto de la nube representa los resultados de una entidad territorial. en términos de porcentaje de estudiantes en cada categoría de desempeño. ciencias naturales y competencias ciudadanas. junto con la formación.1. han permitido poner en escena la descentralización de diversas operaciones asociadas con la evaluación y debidamente documentadas en manuales. al 100% de la población. PROYECTOS DE EVALUACIÓN Se entiende que la evaluación de los aprendizajes y las competencias desarrolladas por los estudiantes a su paso por el sistema educativo.1. es decir.1 y 3. De esta manera. respectivamente. de quinto y noveno grados. misión que realiza con base en los proyectos que se enuncian enseguida. SABER Comprende la evaluación de los estudiantes que terminan quinto y noveno grados de educación básica primaria y secundaria. empoderamiento y acompañamiento correspondientes en términos de procedimientos y estándares. en los niveles de educación básica. Entre los años 2005 y 2006 se realiza una segunda aplicación censal. Los procesos en tiempo real consideran al evaluado como el centro de gravitación del ejercicio de la evaluación.030. agrupados por entidad territorial. matemática. constituye una herramienta valiosa para informar a todos los actores del sistema acerca del impacto de cada proyecto pedagógico. con el valor de la desviación estándar. El ICFES ha sido la entidad especializada del estado colombiano encargada del diseño y la Los resultados presentados para la línea de base (2002 – 2003) corresponden a los dos calendarios. Los resultados en las aplicaciones consideradas utilizan la misma técnica de procesamiento y la misma escala de puntajes para facilitar los estudios de comparación. Las medias al nivel nacional –de los promedios y la desviación estándar de puntajes– se representan mediante líneas 2. co/saber al nivel de cada institución. en términos de infraestructura y de talento humano. municipio. 3. media y superior.

puesto que siempre es deseable lograr un aumento del promedio y simultáneamente una disminución de la desviación estándar como consecuencia de la implementación de políticas de mejoramiento de la calidad de la educación. pues las diferencias entre los resultados de los estudiantes y su resultado promedio son más pequeñas en el año 2005 que las observadas entre los años 2002 y 2003. para el año 2005. En esta representación se espera un corrimiento del lugar ocupado por un grupo hacia la zona superior izquierda. se logró un aumento en el promedio de puntajes de apenas medio punto y también una disminución de la desviación estándar de 0. con el transcurso del tiempo entre una y otra aplicación de las pruebas.1. Esta situación corresponde a un avance en términos de la equidad del sistema. porque la desviación estándar aumentó en 0. La gráfica 3. y líneas punteadas. Tendencias de promedio y desviación estándar para lenguaje en quinto grado Fuente: ICFES Gráfica 3. para los años 2002 y 2003.2.0 puntos en el promedio de puntajes y al mismo tiempo una disminución en la equidad del sistema. Por su parte. Tendencias de promedio y desviación estándar para lenguaje en noveno grado N6 .1.continuas.1.1. pero también a una estabilidad en el rendimiento global.2 muestra que en el mismo período los resultados variaron de un modo distinto para la misma área en el grado noveno: se aprecia un incremento de 3. que se intersectan para dar origen a cuatro cuadrantes donde se localizan las entidades territoriales referidas. la gráfica 3. Fuente: ICFES Gráfica 3.1 advierte que en el lapso de tres años transcurridos entre una y otra aplicación.2 puntos. A la luz de los parámetros considerados es deseable que haya incrementos en el promedio de puntajes y simultáneamente disminuciones en la desviación estándar.1.2 puntos en los resultados de lenguaje para el grado quinto.

se reconoce con la posición relativa de un punto en el eje horizontal: localizaciones en la zona izquierda de la gráfica reflejan mayor equidad interna de la entidad territorial que otras ubicadas en la zona derecha.4 refieren los resultados para el área de matemática en el mismo período. La primera.1. pues hay un aumento de la desviación estándar de 0.5 puntos.3 y 3. al interior de cada grupo.CONFERENCIA: Evaluación educativa en Colombia Las gráficas 3. pues la desviación estándar disminuye 0.4. Por su parte. y segunda.1. inter-entidades. Las gráficas mencionadas también permiten observar dos componentes de la equidad: primera.3. que a su vez representan diferencias entre promedios de puntajes de los estudiantes de una y otra entidad territorial. La segunda. entre los grupos considerados. intra-entidades.1. inter-entidades. Para el grado quinto se observa al nivel nacional un progreso consistente en términos de equidad y de rendimiento.2 puntos y el promedio de puntajes aumenta en 3.4 puntos. Tendencias de promedio y desviación estándar para matemática en noveno grado N7 .3 puntos. Fuente: ICFES Gráfica 3. Tendencias de promedio y desviación estándar para matemática en quinto grado Fuente: ICFES Gráfica 3. pero la equidad disminuye.1. se aprecia con las distancias verticales entre uno y otro punto. intraentidades. la tendencia de los resultados presenta una diferencia: el rendimiento mejora porque el promedio de puntajes aumenta en 2. para el caso del grado noveno. con base también en las variables de promedio de puntajes y de desviación estándar.

5.2 puntos. en el período considerado.1. por ejemplo) en un espacio bidimensional. La representación de los resultados de grupos de estudiantes (bien sean instituciones. Tendencias de promedio y desviación estándar para ciencias en noveno grado N8 .6muestranconsistentemente en los dos grados evaluados. permite colocar en escena al mismo tiempo dos atributos de la calidad.5y3.1. mediante el par de datos de promedio y desviación estándar. En este período.Lasgráficas3. quinto y noveno. en el grado quinto hay un aumento de 2.1 puntos en la desviación estándar.7 puntos y en la desviación estándar es de 0. regiones o países. Ahora el análisis puede ser más complejo porque requiere considerar posiciones relativas en un plano y que se desplazan en distintas direcciones posibles como consecuencia de un determinado proceso educativo. Fuente: ICFES Gráfica 3.6. un avance de rendimiento en términos de promedios de puntajes. ciudades. Tendencias de promedio y desviación estándar para ciencias en quinto grado Fuente: ICFES Gráfica 3.1. pero también una disminución de la equidad del sistema en el área de ciencias naturales. mientras que en el grado noveno el aumento en el promedio es de 2.2 puntos en el promedio de puntajes y un incremento de 0.1.

geografía.1 muestra el número total de personas que han presentado la prueba del proyecto ICFES. Para todos ellos se generan reportes y se brindan claves de acceso que permiten consultar directamente las bases de datos disponibles en el sitio www. desde el año 2000. si logran los niveles requeridos.CONFERENCIA: Evaluación educativa en Colombia 3. La primera aplicación de las pruebas del proyecto ICFES se llevó a cabo en 1968 con el fin de proveer información a las instituciones de educación superior para realizar sus procesos de selección y admisión de estudiantes. para conocer el nuevo estado que han alcanzado luego de llevar a cabo estudios de perfeccionamiento y superación de las debilidades detectadas cuando presentaron pruebas anteriores.2. En ambas ocasiones. los cuales también se encuentran disponibles en otras formas de agrupación y de manera más desagregada.co. pueden presentarse nuevamente personas que ya han sido evaluadas. química. propósito que aún se mantiene sumado al de servir de señal de la calidad de la educación media tanto para las instituciones educativas como para las familias. 8 N9 .2. Los destinatarios de los resultados alcanzados en este proyecto son principalmente los mismos estudiantes evaluados. Adicionalmente. biología. quienes lo hacen como egresados porque desean mejorar sus resultados. las instituciones educativas donde ellos se forman y obtienen la titulación de bachiller al concluir el nivel de educación media. instituto especializado en el otorgamiento de crédito educativo. Para este efecto. una en el primer semestre dirigida a los estudiantes de grado once de instituciones de calendario norte (denominado B) y la otra en el segundo semestre para los estudiantes de instituciones de calendario sur (llamado A). la sociedad en general y agentes tomadores de decisiones. historia. La gráfica 3. comprende tanto a los estudiantes de grado once que presentan la prueba por primera vez como a quienes lo hacen en calidad de egresados. idioma extranjero (electivo entre inglés. francés y alemán) e interdisciplinar (electiva entre medio ambiente y violencia y sociedad8). filosofía. desde 1968. Como ejemplo. en las áreas de lenguaje. los resultados que se reportan luego de cada aplicación. Este número. el Proyecto ICFES comprendía una prueba de Medios de Comunicación que fue aplicada hasta el año 2004. Cualquier persona puede presentar esta prueba todas las veces que considere pertinente. son comparables en virtud de un procesamiento de datos basado en la teoría de respuesta al ítem con un parámetro que comprende también la calibración de los instrumentos utilizados. los responsables dentro de las instituciones de educación superior de la admisión de sus estudiantes y el ICETEX. o aquellos que sin pertenecer al sistema de educación formal quieren conocer su desempeño en la prueba para obtener por esta vía mediante validación su diploma de bachiller. matemática. ICFES Constituye el proyecto de evaluación de mayor consolidación en el país y está destinado a los estudiantes que terminan el grado once de educación media. física. que ha pasado de 26 mil personas evaluadas hasta 557 mil luego de 38 años. a continuación se presentan algunos tipos de resultados globales al nivel del país. Este proyecto se realiza con dos aplicaciones cada año.icfesinteractivo. gov.

1 puntos en geografía y 1 punto en historia.2.2.2 a 3.1 puntos en el área de física.2. Para cada año se colocan en forma separada los promedios de las dos aplicaciones que se realizan. 1.1.2 puntos en filosofía. 2 en química. En el período considerado. Se toma este período de tiempo porque justo en él se ha mantenido estable el enfoque de competencias como referente de la prueba. de 0.2 puntos en el área de lenguaje. en cada una de las áreas referidas.Gráfica 3. pero también revelan una disminución en el rendimiento de 0.1 puntos en biología y de 1. de 2. el diseño y la estructura de los instrumentos. agrupados al nivel nacional. Número de evaluados en el proyecto ICFES. entre 1968 y 2005 Fuente: ICFES En las gráficas 3. los resultados en términos de promedios indican con algunos altibajos un avance de 3.5 puntos en matemática. las técnicas de N 10 procesamiento y de equiparación y los formatos de los reportes de resultados.9 se representan las tendencias observadas en los promedios de los puntajes obtenidos por los estudiantes de grado once evaluados desde el año 2000 hasta el 2005. .

Tendencias del promedio nacional de puntaje en matemática. entre 2000 y 2005 Fuente: ICFES Gráfica 3.2.CONFERENCIA: Evaluación educativa en Colombia Fuente: ICFES Gráfica 3.2.4. entre 2000 y 2005 Fuente: ICFES Gráfica 3.2.2.3. Tendencias del promedio nacional de puntaje en lenguaje. Tendencias del promedio nacional de puntaje en física. entre 2000 y 2005 N 11 .

Tendencias del promedio nacional de puntaje en geografía.2.2.2. Tendencias del promedio nacional de puntaje en biología.6. entre 2000 y 2005 Fuente: ICFES Gráfica 3. entre 2000 y 2005 N 12 . entre 2000 y 2005 Fuente: ICFES Gráfica 3.Fuente: ICFES Gráfica 3.5. Tendencias del promedio nacional de puntaje en química.7.

2. Es necesario disponer esfuerzos para detener esta tendencia y lograr en cambio una reducción de la brecha observada.9. entre 2000 y 2005 La gráfica 3. pues la distancia entre los promedios de estos dos grupos poblacionales aumenta desde 23 hasta 29 puntos.2.2. derivado a partir de la distancia observada entre el promedio nacional alcanzado por el 5% de los estudiantes evaluados con resultados más altos y el 5% de aquellos con resultados más bajos. N 13 La tendencia en este período es sistemática y revela una situación preocupante. entre 2000 y 2005 Fuente: ICFES Gráfica 3. en el mismo período considerado en las gráficas anteriores. .10 muestra la tendencia de un indicador de equidad. Tendencias del promedio nacional de puntaje en historia.8. Tendencias del promedio nacional de puntaje en filosofía.CONFERENCIA: Evaluación educativa en Colombia Fuente: ICFES Gráfica 3.

9 puntos. .8 puntos y una desviación estándar de 9.0 puntos en la segunda aplicación del año 2005. Cada punto representa la integración del promedio. y la desviación estándar.1 hasta 9. Para el caso del área de lenguaje. N 14 En ambas áreas consideradas se aprecia un aumento del rendimiento promedio al nivel del país. el espacio referido comprende valores para el promedio de puntajes que oscilan entre 44. El área de lenguaje comienza una sucesión de estados en la primera aplicación del año 2000 con un promedio de 44.Gráfica 3. se localiza en un promedio de 43. dentro del cual es probable encontrar un estado.2. mediante la posición en el eje horizontal. sugiere una menor variabilidad y mayor consistencia de los resultados alcanzados para el caso de matemática. pero una disminución de la equidad y poca consistencia entre los resultados de las distintas cohortes representadas en este período.5 y 52.8 hasta 45.12.2. en el período mostrado.4 puntos y de la desviación estándar que fluctúan desde 5. Por su parte. referidas a las áreas de lenguaje y matemática.5 puntos y una desviación estándar de 6. con una distribución heterogénea de la densidad.4 puntos y para la desviación estándar entre 5. al evaluar distintas cohortes.3 puntos y después de ir y venir.0 puntos.11 y 3. el área de matemática comienza el trazado con un promedio de 44. El comportamiento de los parámetros observados sugiere más bien reconocer un espacio de movimiento de los resultados. ilustran la forma como varía la combinación del par rendimiento y equidad durante el mismo período del año 2000 al 2005.8 puntos y una desviación estándar de 9. Por su parte.9 y 9. el área de matemática describe un espacio acotado por valores del promedio de puntajes que van desde 40. mediante la posición en el eje vertical.10. en un espacio más limitado que el definido para el área de lenguaje.3 puntos y luego de recorrer su propio camino de altibajos encuentra un estado con un promedio de 45. entre 2000 y 2005 Fuente: ICFES Las gráficas 3. Tendencias nacionales del promedio de puntaje del 5% más alto y el 5% más bajo de los estudiantes evaluados. con una mayor densidad de estados que en caso del área de lenguaje.2. La comparación entre los tamaños de los espacios de movimiento de los resultados de las áreas consideradas.9 puntos en la segunda aplicación del año 2005.7 puntos y una desviación de 6.

A partir del año 2006. desviación estándar para matemática entre 2000 y 2005 Fuente: ICFES 3. uno que se evalúa en el primer semestre y el otro en el segundo. ECAES Es un proyecto orientado a la evaluación de los aprendizajes y las competencias desarrolladas por los estudiantes que concluyen el nivel de educación superior. Promedio vs. . Promedio vs. desviación estándar para lenguaje entre 2000 y 2005 Fuente: ICFES Gráfica 3. en las áreas y componentes propios de su programa académico.3. El proyecto se realiza con una aplicación anual. en la que también pueden participar egresados del nivel de educación superior o ciudadanos que aspiren a confrontar su dominio en un determinado campo. se mantiene la aplicación anual para cada programa pero se ofrece en dos grupos distintos de programas.CONFERENCIA: Evaluación educativa en Colombia Gráfica 3. El marco teórico.2.2.12. los instrumentos y la estructura de los reportes de resultados han sido posibles gracias a una gran discusión y concertación nacional N 15 con la correspondiente comunidad académica.11.

entre dos o más aplicaciones en distintos momentos y con distintas cohortes de estudiantes. Este sitio brinda también la posibilidad de realizar ejercicios de referenciación institucional cuando se comparan los desempeños de los estudiantes de un determinado programa en un campo específico. . dentro de los años considerados.3. logrando cada vez una mayor equidad inter-programas: cuando los promedios de puntajes de una aplicación aumenten en mayor proporción para los programas más débiles y estos programas acerquen sus resultados a los de los programas con mayores fortalezas y promedios de puntajes más altos. A manera de ejemplo.1. mientras que la escala del año 2004 utiliza un valor medio de 100 puntos y la misma desviación estándar de 10 puntos. en el año 2004. Adicionalmente. Los resultados alcanzados en el proyecto ECAES y que sirven para identificar fortalezas y debilidades relativas con miras a emprender planes de mejoramiento. enseguida se ilustran algunas relaciones entre distintos tipos de resultados alcanzados en el proyecto.3.icfesinteractivo. 83.2 y 3. La referenciación de un programa también es posible frente a sí mismo. De otra parte. cuando se ubica en la parte superior de la línea de tendencia. alrededor de la línea de tendencia. al pasar de 2003 a 2004. Desde luego. Cada lugar señalado dentro de la nube representa un programa y su localización en el plano advierte si incrementa el rendimiento relativo. señala una mayor estabilidad en el efecto de los proyectos pedagógicos en juego. derecho e ingeniería mecánica y luego se estableció con presentación obligatoria a partir del año 2003. investigadores y tomadores de decisiones. 82. la mayor compacidad de los puntos que representan los programas de fisioterapia. la disminución de la pendiente de la línea de tendencia tiene un requisito irrenunciable: mantener o superar los promedios de puntajes de los programas más destacados.878 estudiantes y 2. y en 2006 se evaluarán cerca de 100 mil personas de 55 programas. lo cual ilustra una disminución de las distancias entre los promedios de los estudiantes de ingenierías y de derecho y un aumento de estas distancias en el caso de fisioterapia. derecho y fisioterapia. respectivamente. La escala empleada en el año 2003 tiene un valor medio de 50 puntos y una N 16 desviación estándar de 10 puntos. Las gráficas 3. es decir.541 estudiantes y 1. en el año 2005.91 para ingenierías.3 muestran el comportamiento de desempeños globales en términos de rendimiento. decanos y directores de los programas.co con destino a cada uno de los evaluados. 3. En este año se evaluaron 57.3. respecto del promedio de toda la población.97 para derecho y 1. 0.02 para fisioterapia.El proyecto comenzó con aplicaciones experimentales y presentación voluntaria en los programas de medicina. o si lo diminuye cuando se ubica en la parte inferior. Sería trascendental mantener esta compacidad como sistema en todos los grupos de programas pero con una pendiente cada vez menor. en los programas referidos y en el período considerado hay un resultado diferenciado en términos de equidad inter-programas.gov. se disponen en el sitio www. rectores. agrupados por cada programa ofrecido en ingenierías. las pendientes de las líneas de tendencia son 0. por la técnica de procesamiento de datos basada en la teoría de respuesta al ítem y la calibración de los instrumentos utilizados.360 egresados de 27 programas. es decir.059 estudiantes y 5. mediante la correlación entre los promedios de puntajes obtenidos por los estudiantes en los años 2003 y 2004.386 egresados de 50 programas. con los de otros estudiantes de programas que se consideren pares. expresando la existencia de una comunidad en este campo al nivel nacional.654 egresados de 43 programas.

Promedio de puntajes de programas de derecho. Promedio de puntajes de programas de fisioterapia.2.CONFERENCIA: Evaluación educativa en Colombia Fuente: ICFES Gráfica 3.3. 2004 vs. 2003 Fuente: ICFES Gráfica 3. 2003 Fuente: ICFES Gráfica 3.3. 2004 vs.3.3.1. Promedio de puntajes de programas de ingeniería. 2004 vs. 2003 N 17 .

si se localiza en la parte inferior de la línea de tendencia. mediante la correlación entre los promedios de puntajes obtenidos por los estudiantes en las pruebas del proyecto ICFES y los promedios de puntajes obtenidos por los mismos estudiantes en las pruebas del proyecto ECAES en el año 2003.6 y 3.6 puntos. Cada programa. mediante la correlación entre las desviaciones estándar de puntajes obtenidos por los estudiantes en los mismos años 2003 y 2004. respectivamente.3. sin descuidar el otro propósito esencial de aumentar el promedio de puntajes.3.La gráfica 3. En contraste.3.4.4 muestra el comportamiento de la dispersión de los desempeños. representado por un punto de la nube. 2003 Fuente: ICFES En las gráficas 3. con una valor extremo de 5. . Fisioterapia se coloca en el medio de los dos comportamientos referidos y mantiene una constancia autoregulada en la pendiente del valor académico agregado con una media discriminación. En el caso que se ilustra de ingeniería. Ingeniería de sistemas es un ejemplo de programas con pendiente creciente del valor N 18 académico agregado y alta discriminación: los resultados son cada vez más altos en la medida en que las condiciones de ingreso también siguen este patrón. Desviación estándar de puntajes de programas de ingeniería.3. muestra un aumento de la equidad intra-programa. derecho representa el caso de programas con pendiente decreciente del valor académico agregado y baja discriminación: los resultados son cada vez menos altos en la medida en que las condiciones de ingreso son más altas. 174 programas de los 346 considerados aumentan la desviación estándar.3.9 puntos. agrupados por cada programa académico de ingeniería de sistemas. Es deseable que los programas con menores niveles de equidad a su interior avancen más rápidamente en la dirección de disminuir su desviación estándar. para el caso de ingenierías. y 172 disminuyen este parámetro.5. derecho y fisioterapia. y una disminución de esta equidad intra-programa cuando su localización corresponda en la parte superior de dicha línea de tendencia.7 se muestra el valor académico agregado en el nivel de educación superior. 3. Gráfica 3. para lograr en suma que haya menores distancias entre los resultados de los estudiantes de un programa. con un valor máximo de 3. 2004 vs.

ICFES Fuente: ICFES Fuente: ICFES Gráfica 3.5.3.CONFERENCIA: Evaluación educativa en Colombia Fuente: ICFES Gráfica 3. Promedio de puntajes por programa ECAES ing.3. Promedio de puntajes por programa ECAES fisioterapia (2003) vs.7. Promedio de puntajes por programa ECAES Derecho (2003) vs. ICFES Fuente: ICFES Gráfica 3. Sistemas (2003) vs. ICFES N 19 .3.6.

con los resultados por programa de fisioterapia en el año 2004.3. Las dos nubes expresan una forma similar aunque más esbelta la del año 2004.10 cada punto de las nubes representa el par de puntajes ICFES y ECAES para cada estudiante de fisioterapia.8. aquellos estudiantes que logran un alto resultado ICFES poseen una alta probabilidad de lograr también un alto resultado ECAES al concluir sus estudios superiores. pues aunque las tendencias de los resultados son globalmente claras. es decir. . Al observar la tendencia global. Se insiste en esta lectura en el carácter probabilístico del proceso. ICFES Fuente: ICFES En las gráficas 3.3. mientras que quienes tienen bajos resultados en la N 20 prueba ICFES están fatalmente determinados a una alta probabilidad de repetir un bajo resultado en la prueba ECAES. Promedio de puntajes por programa ECAES fisioterapia (2004) vs. sistemáticamente se distribuyen en distintos resultados ECAES en función del proyecto educativo que abordan y desde luego de factores externos que aquí se consideran opacos y distribuidos en forma uniforme entre todos los eventos observados. también son nítidas las variaciones entre los resultados de distintos proyectos educativos: estudiantes con similares resultados ICFES.La gráfica 3.3. respectivamente. lo que indica menores diferencias respecto del promedio.8. permite confirmar la compacidad observada en el año 2003 pero muestra un decaimiento en la pendiente del valor académico agregado. Gráfica 3.3. en los años 2003 y 2004. se infiere que el puntaje alcanzado en las pruebas ECAES aumenta en forma directamente proporcional al aumento de los puntajes obtenidos en las pruebas ICFES. en la zona de promedios de puntajes más altos.9 y 3.

3.10. Uno de ellos. Puntajes individuales ECAES fisioterapia (2004) vs. Al mismo . N 21 Dos programas distintos y que reciben estudiantes en condiciones académicas semejantes.9. Puntajes individuales ECAES fisioterapia (2003) vs.11 y 3. ICFES Fuente: ICFES Gráfica 3. La calificación del impacto se deriva de la relación de dos parámetros de la línea de tendencia correspondiente: pendiente e intercepto con el eje vertical.3.3. con mayor efectividad que el otro. con puntajes similares en las pruebas ICFES.3.12 se han seleccionado los pares de puntajes ICFES y ECAES de los estudiantes de tres programas de fisioterapia: uno de alto impacto académico. es decir. con círculos. otro de medio impacto. con cuadrados. y el otro de bajo impacto. logra que sus estudiantes alcancen puntajes más altos en las pruebas ECAES y al representar sus resultados en estas gráficas se genera una línea de tendencia con un mayor valor del intercepto con el eje vertical de puntajes. ICFES Fuente: ICFES En las gráficas 3. arrojan resultados diferentes. representado con triángulos.CONFERENCIA: Evaluación educativa en Colombia Gráfica 3.

representa un proyecto de mayor impacto académico. con mayor equidad que el otro.11. Gráfica 3.3. en tres programas Fuente: ICFES N 22 . ICFES. ICFES. Uno de ellos.3. Una línea de tendencia con menor pendiente y mayor valor del intercepto con el eje vertical de puntajes que otra. Puntajes individuales ECAES fisioterapia (2004) vs. dos programas que se comparan y que reciben estudiantes en condiciones académicas semejantes.12. desarrollan brechas diferentes. en tres programas Fuente: ICFES Gráfica 3. generando en estas gráficas una línea de tendencia con una menor pendiente.tiempo. logra que sus estudiantes más débiles académicamente superen esta condición y se acerquen a los de mayores fortalezas y que así sus diferencias en las pruebas ECAES sean pequeñas. Puntajes individuales ECAES fisioterapia (2003) vs.

3. Ingeniería química e ingeniería de materiales muestran el resultado más destacado en la aplicación del año 2004. que se aplica en todos los programas.3.CONFERENCIA: Evaluación educativa en Colombia La gráfica 3.13. Gráfica 3.13 presenta el promedio de puntajes en el componente de Comprensión Lectora. Promedio de puntajes en Comprensión Lectora por programa evaluado en 2004 Fuente: ICFES N 23 .

49 38.04 26. Tabla 3. con aplicación de pruebas cada año.30 43.4. a través de concursos convocados por las entidades territoriales del país. El proyecto está diseñado para llevar a cabo un proceso de selección que permita proveer cargos docentes y directivos.65 40.00 37.33 47.63 41.78 34.4. Resultados de aspirantes en las pruebas aplicadas en diciembre de 2005 Prueba Número de ítems 33 31 39 46 39 37 48 40 39 38 37 37 39 39 38 39 40 38 26 39 Número de aspirantes evaluados 2181 581 3401 4163 22823 764 4782 5549 11342 1645 726 3743 13 3156 1523 5689 60577 1451 134109 134109 Porcentaje de respuestas correctas 44. y por tanto certifica como aprobados sólo a quienes obtengan un puntaje mayor que el valor mínimo determinado de 60 puntos para docentes y 70 puntos para directivos docentes.74 Fuente: ICFES CIENCIAS NATURALES QUÍMICA CIENCIAS NATURALES FÍSICA HUMANIDADES Y LENGUA CASTELLANA CIENCIAS SOCIALES GESTION ESCOLAR FILOSOFIA CIENCIAS NATURALES Y EDUCACION AMBIENTAL MATEMÁTICA PREESCOLAR EDUCACIÓN ÉTICA Y VALORES EDUCACIÓN RELIGIOSA IDIOMA EXTRANJERO INGLÉS IDIOMA EXTRANJERO FRANCÉS EDUCACIÓN FÍSICA RECREACIÓN Y DEPORTE CIENCIAS ECONÓMICAS Y POLÍTICAS TECNOLOGÍA E INFORMÁTICA BASICA PRIMARIA EDUCACIÓN ARTÍSTICA APTITUD NUMÉRICA APTITUD VERBAL N 24 .10 35.54 39. antes de ingresar a la Carrera Docente y llevar a cabo un período de prueba de un año. valores que se asignan al alcanzar un porcentaje de respuestas correctas que se calcula en función de la media de la población y la desviación estándar.50 50.1. Las personas que obtienen la certificación de aprobado.74 30. continúan el proceso de selección con una entrevista y un análisis de antecedentes.92 49. DOCENTES Y DIRECTIVOS DOCENTES Este proyecto se encamina a evaluar las competencias disciplinares de los aspirantes a ingresar a la carrera docente o a ocupar el cargo de directivo docente.63 51.26 41.08 38.37 42.84 41.3.79 33.

CONFERENCIA: Evaluación educativa en Colombia A manera de ejemplo.7%.03 58.24 61.4.80 61. La gráfica 3.2. Resultados de aspirantes aprobados en las pruebas aplicadas en diciembre de 2005 Prueba Número de aspirantes aprobados 1052 354 1076 1282 6909 258 2044 3204 1923 513 176 1343 6 889 532 2518 8120 528 32727 32727 Porcentaje de respuestas correctas 55.74 58. Los resultados también advierten la alta discriminación que se alcanza dentro de la población de las 134. .1 ilustra esta discriminación.05 46.35 30.46 45.1 y 3.90 53.4.03 55. en este caso a 60.95 41. La discriminación se hace visible mediante la diferencia entre el porcentaje de respuestas correctas de quienes aprobaron la prueba y quienes no la aprobaron.86 39. sin considerar los resultados de la prueba psicotécnica.62 47. Tabla 3. en las pruebas generales y específicas aplicadas en diciembre de 2005.577 personas.92 50. las tablas 3.95 CIENCIAS NATURALES QUÍMICA CIENCIAS NATURALES FÍSICA HUMANIDADES Y LENGUA CASTELLANA CIENCIAS SOCIALES GESTION ESCOLAR FILOSOFIA CIENCIAS NATURALES Y EDUCACION AMBIENTAL MATEMÁTICA PREESCOLAR EDUCACIÓN ÉTICA Y VALORES EDUCACIÓN RELIGIOSA IDIOMA EXTRANJERO INGLÉS IDIOMA EXTRANJERO FRANCÉS EDUCACIÓN FÍSICA RECREACIÓN Y DEPORTE CIENCIAS ECONÓMICAS Y POLÍTICAS TECNOLOGÍA E INFORMÁTICA BASICA PRIMARIA EDUCACION ARTÍSTICA APTITUD NUMÉRICA APTITUD VERBAL Fuente: ICFES Las cifras presentadas revelan que la prueba de Básica Primaria atrae a la mayor cantidad de aspirantes. siendo más alta en el caso de la prueba de aptitud numérica con 26.79 52.11 46.4.4.44 39.92 46.00 56. mientras que en la prueba de Francés tan solo se presentan 13 personas en todo el país.16 49.8% y más baja en el caso de gestión escolar con 8.2 muestran los resultados alcanzados por los aspirantes a ingresar a la carrera docente y a ocupar un cargo directivo.109 personas que N 25 presentaron las pruebas.

N 26 SERCE 2006 (Segundo Estudio Regional Comparativo y Explicativo) es un proyecto del Laboratorio Latinoamericano de la Evaluación de la Calidad de la Educación (LLECE) de OREALC/ UNESCO Santiago y está diseñado para evaluar competencias básicas y habilidades para la vida en las áreas de lectura y matemática. REFERENCIACIÓN INTERNACIONAL Colombia ha tenido especial interés en conocer el impacto de sus políticas en educación básica y media.5.1. Porcentaje de respuestas correctas de las poblaciones de Aprobados y No Aprobados en las pruebas aplicadas en diciembre 2005 Fuente: ICFES 3. mediante pruebas internacionales estandarizadas dirigidas a jóvenes de 15 años de edad que estén cursando al menos grado séptimo. matemática y científica. TIMSS 2007 (Trends in Internacional Mathematics and Science Study) es un proyecto de la International Association for the Evaluation of Educational Achievement (IEA). con una evaluación opcional del área de ciencias naturales. participa actualmente en PISA 2006. concebido para proveer información confiable y oportuna sobre el logro académico de estudiantes de Estados Unidos de cuarto y octavo grados de educación básica. La prueba piloto se aplicó a 1. En el proyecto participan estudiantes de tercero y sexto grados de educación básica de 17 países latinoamericanos y 3 entidades subnacionales.000 estudiantes de alrededor de 150 instituciones escolares en el año 2006. La aplicación piloto tuvo lugar en el año 2005 con la evaluación de 5.Gráfica 3.720 estudiantes de 55 instituciones escolares en el año 2005 y se espera aplicar la prueba definitiva a 5.610 estudiantes de 79 instituciones escolares y se prevé la aplicación definitiva con cerca de 9. Para este propósito. PISA 2006 (Programme for Internacional Student Assessment) es un programa de la Organisation for Economic Co-operation and Development (OECD) y está dirigido a evaluar conocimientos y habilidades para la vida que son esenciales para una participación plena en la sociedad.4. en relación con el de otros países y mediante el resultado alcanzado por estudiantes de distintos niveles y en diferentes áreas del conocimiento cuyas competencias se desarrollan en el trabajo escolar. El programa evalúa en 58 países los dominios de comprensión lectora. en las áreas de matemática y ciencias naturales. comparado con el de otros estudiantes en otros países.250 estudiantes de 150 instituciones durante el mes de mayo de 2006. En el proyecto participan . SERCE 2006 y TIMSS 2007.

con la evaluación de 3. en los distintos proyectos de evaluación que realiza el ICFES. pero niveles bajos si la comparación se hace con estudiantes de países del primer mundo. fomentar la referenciación institucional entre las distintas instituciones que participan en una evaluación. se ha confirmado en los proyectos internacionales que los estudiantes colombianos alcanzan niveles medios de desempeño en los campos evaluados. técnicas y procedimientos probados que confieren altos niveles de calidad. Colombia hizo parte también en el Estudio TIMSS organizado por la IEA en 1995. crear y pulir nuevas estrategias y modelos de evaluación. La presencia activa de Colombia en estos proyectos ha permitido consolidar una cultura de la evaluación con el rigor requerido en cada una de las etapas de cada proyecto. confiable y oportuna acerca de los hallazgos que se revelan al realizar cada evaluación. N 27 . brindar información robusta. observación que también corresponde con los análisis efectuados acerca de los resultados alcanzados en las pruebas nacionales. 4. Es reiterativa la observación sobre nuestras dificultades en la comprensión analítica de textos y en la solución de problemas complejos que requieren un juicio crítico y un saber teórico específico. en el momento que un usuario lo requiera y desde el sitio donde se encuentre. El logro de estos desafíos permitirá colocar al país a la vanguardia del tema en la región latinoamericana y en una posición apropiada para dialogar con solvencia conceptual con países del primer mundo sobre evaluación. en el Primer Estudio Internacional Comparativo organizado por el LLECE en el año 1997. y la aplicación definitiva entre los años 2006 y 2007 con 9.123 estudiantes de 50 instituciones escolares. contrastar y perfeccionar las experiencias y metodologías que el país ha venido desarrollando y orientar el uso de tecnologías de información y comunicaciones de vanguardia para implementar los distintos procesos necesarios dentro de un proyecto de evaluación. tercero. y cuarto. en el Estudio Internacional de Cívica que realizó la IEA en el año 1999 y en el Progress in Internacional Reading Literacy Study (PIRLS) organizado por la misma IEA en el año 2001. promover la conformación de grupos de trabajo interesados y dispuestos a investigar algún campo particular de la evaluación. identificar modelos de elaboración de reportes de resultados útiles para los distintos usuarios. Además de la participación en los estudios descritos. comparados con los estudiantes de los demás países de la región de América Latina y El Caribe. Adicionalmente. apropiar estándares. segundo.CONFERENCIA: Evaluación educativa en Colombia 59 países y se prevé realizar el estudio piloto durante el año 2006. En términos de los resultados asociados con las áreas académicas y las habilidades evaluadas. convertir la evaluación en un campo de investigación propio de universidades en sus niveles de maestría y doctorado y de institutos especializados. es decir.736 estudiantes de 260 instituciones. DESAFÍOS Colombia tiene cuatro grandes desafíos para su sistema de evaluación educativa: primero. es necesario desarrollar aplicaciones con tecnología de punta para ofrecer la presentación asincrónica y virtual de pruebas.