You are on page 1of 9

XXI Simposio de Estadística

Modelos de Regresión
Bogotá, D.C., Julio 19 al 23 de 2011

Análisis de la situación regional de la educación media en


Colombia (2009-2010): una visión con análisis factorial múltiple
Regional situation analysis of education media in Colombia (2009-2010):
an vision with Multiple Factor Analysis
Melba Vertel Morinsón1*, Jesús Cepeda Coronado1**, José Cortina Guerrero2***
1UNIVERSIDAD DE SUCRE, DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA, SINCELEJO
2UNIVERSIDAD DE SUCRE, DEPARTAMENTO DE HUMANIDADES, SINCELEJO

Resumen

El propósito fundamental es presentar un panorama general de la situación actual de la


educación media en Colombia. Para este estudio, se parte de la información aportada por el ICFES
para evaluar la educación media; se hace seguimiento de variables que expresan características de la
población colombiana y variables socioeconómicas que la afectan. Se construyen tablas de
frecuencias para calidad educativa por propiedad jurídica (oficial y no oficial) con los resultados de las
pruebas Saber 11-2010; pirámide poblacional por grupos de edad - sexo; y asistencia escolar por grupos de
edad. El objetivo es caracterizar los diferentes departamentos colombianos (individuos-filas) en
función de la información global (calidad educativa por propiedad jurídica, pirámide poblacional y
asistencia escolar por grupos de edad) y de cada una de las subtablas. La metodología de análisis
utilizada es el Análisis Factorial Múltiple (AFM) para tablas de frecuencias (Abdessemed & Escofier
1992; Bécue & Pagès 2003). El AFM ofrece una descripción global de la tabla múltiple, y
descripción parcial de cada tabla de frecuencias. Para ejecutar el análisis estadístico se utilizo el
lenguaje estadístico R (R Development Core Team 2011), los paquetes ade4 (Chessel et al. 2005) y
FactoClass (Pardo & Del Campo 2007). El análisis continuo de la calidad educativa colombiana en
educación media implica la realización de un balance que pueda llegar a explicar su nivel de
desempeño.

Palabras claves: Análisis multivariado de datos, calidad educativa, demografía.


Abstract

The main purpose is to present an overview of the current situation of secondary education in
Colombia. For this study, some of the information provided by the ICFES to evaluate secondary
education is made up of variables that express characteristics of the Colombian population and
socioeconomic variables that affect it. The analysis methodology used is the Multiple Factorial
Analysis (MFA) for tables of frequencies (Abdessemed & Escofier 1992, Bécue & Pagès 2003).

Keywords: Multivariate data analysis, quality education, demography.

* Profesor Titular. Email: melba.vertel@unisucre.edu.co


** Profesor Asistente. Email: jesus.cepeda@unisucre.edu.co
*** Profesor Asociado. Email: jose.cortina@unisucre.edu.co

1
Melba Vertel Morinsón, Jesús Cepeda Coronado & José Cortina Guerrero

1. Introducción
El activo más importante de una empresa del siglo XX fue su aparato de producción. En el siglo
XXI serán sus trabajadores del conocimiento y la productividad de los mismos. Para la construcción
de un verdadero proyecto de nación hay que formar integralmente al Capital humano: gente que sabe,
aprende y asume retos. La educación en Colombia está reglamentada por la ley 115 de 1994 y la
entidad encargada de la coordinación de la misma es el Ministerio de Educación Nacional.
Para evaluar la calidad del sistema educativo se han utilizado los resultados del ICFES, en este
trabajo se hace énfasis en la educación media, con base en la información generada en las pruebas Saber
11-2010, el examen cumple diversos propósitos con los diferentes actores del sistema educativos:
autoevaluación y desarrollo de su proyecto de vida (estudiantes); autoevaluación y orientación de
prácticas pedagógicas (establecimientos educativos); selección de candidatos idóneos para sus programas
de formación y hacer seguimiento de su evolución académica (Instituciones de Educación Superior);
Construir indicadores de calidad (Autoridades Educativas). Los exámenes de estado han sido objeto de
reestructuración en donde con asesoría internacional se adecuaron aspectos técnicos,
metodológicos, psicométricos que permiten al país contar con una prueba que mida de manera
pertinente y clara la calidad de la educación media.
Este trabajo tiene como objetivo, dar una visión amplia de la educación media colombiana,
evaluar el comportamiento reciente de indicadores de calidad educativa (eficiencia entre colegios
públicos y privados) y el impacto de factores socioeconómicos determinantes del aprendizaje
(analfabetismo, desempleo, necesidades básicas insatisfechas y PIB percapita). Las variables a
evaluar son: calidad educativa asociada a personería jurídica (oficial o privada); Pirámide poblacional por
grupos de edad según género (hombre y mujer) y asistencia escolar.
El análisis factorial múltiple para tablas de frecuencias (Bécue & Pagès, 1999, 2000,2003) facilita
la comparación de varias tablas de frecuencias con una sola dimensión en común (la información en
las columnas se toma sobre un mismo conjunto de individuos), permite tenerlas como elementos
activos en un único análisis factorial. El método busca un análisis de las tendencias generales de las
tablas (calidad educativa por propiedad jurídica, pirámide poblacional y asistencia escolar por
grupos de edad) y una comparación sistemática de las subtablas (descripción parcial) mediante
diversos índices. El objetivo consiste en contestar a preguntas como: ¿existen asociaciones entre los
departamentos y la clasificación por calidad educativa, que no provengan solamente de las diferencias
entre pirámide de edad y asistencia escolar?, ¿existe una relación entre la estructura regional de la calidad
educativa en el sector oficial y la estructura regional de la calidad educativa en el sector no oficial?

2. Datos
Para este estudio se parte de información aportada por el ICFES (2010) y del DANE (2005).
Después de una primera exploración se decidió eliminar los departamentos con una muy baja
cobertura (se restringió la tabla a aquellos departamentos cuyo número de planteles no supera el 1
% del total nacional llamados departamentos nuevos), al departamento del Chocó por tener una
distribución muy atípica.

XXI Simposio de Estadística 2011


AFM para tablas de frecuencias 3

Calidad Educativa Calidad Educativa Pirámide de edad Asistencia Escolar


Propiedad jurídica oficial Propiedad jurídica no oficial Masculina Femenina
Sup Alto Medio Bajo Inf Sup Alto Medio Bajo Inf <15 15-19 20-59 60> <15 15-19 20-59 60> 5-6a 7-11a 12-17a 18-24a
Departamento

Antioquia
.
.
.

.
.
.
Valle

Figura 1. Tabla de frecuencias Múltiple: 23 departamentos-filas; 4 grupos de columnas: Calidad educativa por
propiedad jurídica oficial; Calidad educativa por propiedad jurídica no oficial;
Pirámide de edad masculina y femenina; asistencia escolar.

Datos de Calidad Educativa: El ICFES clasifica los planteles educativos teniendo en cuenta los
resultados obtenidos por los estudiantes que egresan de los mismos. Cada colegio es clasificado en
una de 7 categorías desde Muy Superior a Muy Inferior. El criterio de clasificación es el promedio
de los puntajes obtenidos en un conjunto de pruebas del núcleo común correspondientes a las áreas
de Química, Física, Biología, Ciencias Sociales, Filosofía, Matemáticas, Lenguaje e Inglés, que son
obligatorias para todos los evaluados (Resolución 489 de 2008/MEN). La clasificación busca
premiar tanto los puntajes altos como la homogeneidad.
A partir de los datos de calidad educativa, se construyen tablas de contingencia por propiedad
jurídica (oficial, no oficial), con los departamentos colombianos en filas y la cantidad de planteles
clasificados según la prueba Saber 11-2010 en columna. Después de una primera exploración de la
tabla usando el análisis de correspondencias se convino en juntar las categorías extremas Muy Inferior
e Inferior en una sola categoría que llamamos Inf, y Muy Superior y Superior en una sola categoría Sup.
En consecuencia, solo quedaron cinco columnas (Superior: muy superior - superior, alta, media, baja,
Inferior: inferior - muy inferior).

Pirámide de dad: La tercera tabla de frecuencias (Figura 1) es la distribución de los habitantes por
edad (4 categorías, <15, 15-19, 20-59, >59 años), sexo y departamento. Los efectivos son las
proyecciones realizadas por el DANE (Departamento Administrativo Nacional de Estadísticas) a
partir del censo del 2005. Los datos de edad llevan a construir una tabla de contingencia, con los
departamentos en fila y los intervalos de edad en columna para hombres y mujeres.
Asistencia escolar: La cuarta tabla de frecuencias (Figura 1) es la distribución de los habitantes por
asistencia escolar (%), entendida como la proporción de población de un grupo de edad que reporta
asistir a una institución educativa, mide la capacidad de integración de la población al sistema
educativo, sin precisar aún la vinculación al nivel escolar correspondiente a su edad.
Información Suplementaria: se dispone también de indicadores económicos y sociales sobre los
departamentos (tasa de analfabetismo (%), Producto Interno Bruto percapita 2005, Necesidades
Básicas Insatisfechas 2005 (%), y tasa de desempleo 2005 (%)).

XXI Simposio de Estadística 2011


Melba Vertel Morinsón, Jesús Cepeda Coronado & José Cortina Guerrero

3. El análisis en componentes principales ponderado , ,

El marco teórico general que permite definir métodos factoriales particulares es el análisis en
componentes principales ponderado. Se utiliza la notación , ,
para indicar el análisis en
componentes principales (Escofier & Pagès 1988-1998; Lebart et al., 1995; Vertel & Pardo, 2010)
con ponderaciones tanto en las filas (“individuos”) como en las columnas (variables), donde:  es la
matriz que contiene los datos a analizar (transformados);  es la matriz diagonal de pesos de las
columnas (variables), y es la matriz diagonal de pesos de las filas ("individuos").

3.1. Ejemplos.
Consideremos la tabla de frecuencias múltiple y la información suplementaria (Figura 1). Existen
diferentes posibilidades del análisis en componentes principales ponderado, , ,
para
analizar esta tabla.
Ejemplo 1. El análisis de correspondencias simples (ACS) de las tablas de frecuencias  ,
es el  ,  ,  , se utiliza frecuentemente en ecología para la distribución de especies de
flora y fauna (Cabarcas & Pardo 2001; Escofier & Pagès 1988-1998; Vertel & Pardo 2010).

 . .


La matriz de frecuencias estandarizada P, tiene término general  
..

Ejemplo 2. El Análisis factorial múltiple (AFM) de la tabla de frecuencias global



    !, es el "    !, % & ,  ' en este análisis cada tabla individual es
#$
ponderada por el inverso del primer valor propio obtenido en los ACP separado (tablas de
frecuencias  ) (Bécue & Pagès, 1988-1998, 2003). La lectura de los resultados viene facilitada por
numerosos ayudas a la interpretación del Análisis factorial múltiple.

Para ejecutar los métodos se utilizo el lenguaje estadístico R (Development Core Team 2011) y
los paquetes ade4 (Chessel et al. 2005) y FactoClass (Pardo & Del Campo 2007).

4. Resultados
Este conjunto de datos es interesante desde un punto de vista metodológico: la similitud entre
los grupos de variables justifica el análisis simultáneo; las diferencias entre los grupos son
suficientemente importantes para justificar la utilización de un método específico que ponga de
relieve los rasgos comunes y los rasgos específicos (Vertel & Pardo 2010).

4.1. Análisis separados.


Los primeros valores propios de los análisis separados valen: 0.1724 (calidad educativa propiedad
jurídica oficial, explica el 83.7%), 0.1416 (calidad educativa propiedad jurídica no oficial, explica el 78.3%),
0.0063 (Pirámide poblacional, explica el 67.3%) y 0.0021 (Asistencia escolar, 75.5%). La gran diferencia
entre los valores propios de los análisis separados justifica la necesidad de equilibrar la influencia de
los grupos de variables (tablas de frecuencias).

XXI Simposio de Estadística 2011


AFM para tablas de frecuencias 5

En esta aplicación, la inercia total asociada al análisis de correspondencias simples de la tabla de


calidad educativa propiedad jurídica oficial, es de 0.2060, los dos primeros valores propios se destacan
sobre los demás y retienen el 94.3% de esta inercia. El primer eje opone departamentos de la costa
Caribe como Magdalena, Bolívar y Guajira con instituciones calificadas en categoría Inferior con
Bogotá y Santander, clasificadas con Alto y Superior (Ver figura 2).

Figura 2. Plano factorial 1-2 de ACS: Calidad educativa propiedad jurídica oficial en departamentos colombianos

La inercia total asociada al análisis de correspondencias simples de la tabla de calidad educativa


propiedad jurídica no oficial, es de 0.1919, los dos primeros valores propios se destacan sobre los demás
y retienen el 89.3% de esta inercia. El primer eje opone departamentos de la costa como Valle,
Atlántico, Magdalena y Sucre tienen abundantes instituciones calificadas en categoría Bajo e Inferior
contrapuesta con Bogotá, clasificada con Alto y Superior (Ver figura 3).

Figura 3. Plano factorial 1-2 de ACS: Calidad educativa propiedad jurídica no oficial en departamentos colombianos

XXI Simposio de Estadística 2011


Melba Vertel Morinsón, Jesús Cepeda Coronado & José Cortina Guerrero

La inercia total asociada al análisis de correspondencias simples de la tabla de Pirámide de edad


es de 0.0093 (Vertel 2011), los dos primeros valores propios se destacan sobre los demás y retienen
el 91% de esta inercia (Ver figura 4). El primer eje opone departamentos de la costa Caribe como
Guajira, Córdoba, Cesar y Magdalena que tienen exceso de población (hombres, mujeres) infantil
(<15 años) con Bogotá, que tiene más personas (hombres, mujeres) en edad adulta (20-59 años). El
segundo eje, opone a Cundinamarca incluida su capital Bogotá que tiene exceso de población
(hombres, mujeres) adulta (20-59 años), con Boyacá, Huila y Tolima con exceso de población en
edad mayor (>59 años).

Figura 4. Plano factorial 1-2 de ACS: representación de Pirámide poblacional para departamentos colombianos

4.2. Análisis global


El primer valor propio del análisis global vale 2.286 (43.0% de la inercia total). Los dos primeros
ejes retienen el 65.2% de la inercia total. Por esta razón, podemos concentrar la atención en el
análisis del primer plano factorial.

Los cuatro grupos contribuyen a la construcción del primer eje con un 32.5%, 33.6%, 3.6% y
30.3% de la inercia, respectivamente. Esta dirección de dispersión es común a tres grupos (calidad
educativa propiedad jurídica oficial - no oficial y Pirámide poblacional). Las correlaciones entre factores
parciales de cada grupo y el factor global cercanas a 1 (0.86 grupo 1, 0.87 grupo 2, 0.80 grupo 4).
Los tres grupos activos mencionados anteriormente contribuyen en forma similar (0.74 grupo 1,
0.77 grupo 2, 0.70 grupo 4) a la formación del primer eje del ().

La contribución al segundo eje está dada por dos de los cuatro grupos: Asistencia escolar y Pirámide
poblacional, representando globalmente el 93.1%.

XXI Simposio de Estadística 2011


AFM para tablas de frecuencias 7

En el análisis factorial múltiple global () 


, los dos primeros ejes retienen el 65.2% de la
inercia total, suficiente para resumir la información de la relación entre los grupos en estudio. Para
observar las relaciones entre calidad educativa propiedad jurídica oficial - no oficial, Pirámide poblacional y
Asistencia escolar en departamentos colombianos se utiliza el biplot y el círculo de correlaciones
(Figura 5):

Figura 5. Plano factorial 1-2 del AFM: Departamentos colombianos, categorías de calidad educativa
Oficial – no oficial, asistencia escolar y Pirámide edad – genero y variables socio-económicas

Primer eje: en la lectura el primer eje, opone los departamentos de la costa Caribe que tienen
exceso de población (hombres, mujeres) menor de 15 años con Bogotá, que tiene más personas
(hombres, mujeres) en edades comprendidas entre 20-59 años. La pirámide poblacional colombiana
tiene perfil expansivo, presenta una base dilatada y una cúspide estrecha se considera una estructura
de población joven, con una alta proporción de niños y jóvenes, debido a una alta fecundidad y una
alta mortalidad. En este caso, los menores de 20 años representan entre el 40 y 50 % de toda la
población y los ancianos menos del 5 %, y se asocia a países subdesarrollados en las primeras etapas
de la transición demográfica. El primer eje, tiene correlación negativa con los índices de
analfabetismo (-0.50), necesidades básicas insatisfechas (-0.55) y correlación positiva con el
desempleo (0.62).

En Colombia la calidad de la educación puede estar asociada al sector y la zona del plantel
educativo. En esta sección se hace un análisis comparativo con los resultados de las pruebas Saber
11-2010, y se observa una gran diferencia a favor de los planteles educativos de Bogotá
categorizados en calificación alta y superior, tanto oficiales como no oficiales (superposición de las
estructuras parciales) con respecto a la Costa Caribe que muestran porcentajes muy elevados en

XXI Simposio de Estadística 2011


Melba Vertel Morinsón, Jesús Cepeda Coronado & José Cortina Guerrero

Inferior y Bajo. Para este año, se encontró mejores resultados para los planteles de carácter no
oficial (16-20% a favor), con un intervalo de confianza del 95% para la diferencia entre promedios
poblacionales (agrupados # planteles en cada sector: Muy Superior, Superior, Alta y Media). Esto,
es aún más grave para la educación básica en el Caribe colombiano, ya que la participación de la
educación oficial y de los planteles rurales es mayor en esta región que en el total nacional. Además,
los factores extraescolares explican cerca del 60% del rendimiento escolar (Viloria, 2006), como los
años de estudio de los adultos del hogar, la capacidad económica de los padres y el nivel de
organización familiar (hogares con padres separados, mujer cabeza de familia o los integrados por
ambos cónyuges).

Segundo eje: opone departamentos que tienen exceso de personas mayores con edad >59 años
(Tolima, Caldas y Huila) con Bogotá y Guajira que tiene mayor cantidad de personas en edad adulta
(20-59 años) y Asistencia Escolar en edad comprendida entre 18-24 años. El segundo eje tiene
correlación positiva con el producto interno bruto (0.60).

5. Conclusiones
Aunque los departamentos de la costa Caribe tienen valores altos de Producto Interno Bruto per
cápita no hay inversión en educación, salud, vivienda e industrialización (aparece el factor corrupción),
tienen exceso de personas menores de 15 años, como altas tasas de analfabetismo, necesidades
básicas insatisfechas y bajos índices de desempleo. En esta zona del país altamente agropecuaria, el
trabajo de los menores de edad es una constante. La fuente de trabajo en gran porcentaje es el
subempleo. Muchas familias de la Región Caribe se vieron obligadas a dejar su lugar de origen o
residencia, debido al alto grado de inseguridad que se vivió en algunas zonas de la región. De ahí la
urgente necesidad de mejorar la calidad de la educación en los colegios de la Costa Caribe
(clasificadas en Bajo e Inferior), poniendo especial énfasis en los oficiales. Por lo general, los
planteles no oficiales tienen mejor calidad que los oficiales, aunque esto se ha mejorado con el
transcurrir de los años.
Como proyecto de nación mejorar la intervención del Estado, buscar la equidad en la
distribución de la riqueza y la presencia de una democracia social y política.

Referencias
Abdessemed L, Escofier B. (1992) ‘Generalisation de l’analyse factorielle multiple a l’etude des
tableaux de frequence et comparaison avec l’analyse canonique des correspondances’,
Technical Report 688, INRIA.
Bécue, M., Pagès, J., Álvarez, R. & Hernández, M. L. (2003), 'Análisis factorial múltiple para tablas
de contingencia: estudio de la mortalidad en las comunidades autónomas de España', 27
Congreso Nacional de Estadística e Investigación Operativa. Lleida, 8-11 de abril de 2003.
Cabarcas, G. & Pardo, C.-E. (2001), `Métodos estadísticos multivariados en investigación social',
Cursillo, Simposio de Estadística - Santa Marta. Universidad Nacional. Departamento de
Estadística.
*http://es.geocities.com/socccad colombia/documentos/cepardot/MetEstMulInvSoc.html

XXI Simposio de Estadística 2011


AFM para tablas de frecuencias 9

DANE (2005), 'Económicas', Web. *http://www.dane.gov.co


Escofier, B. & Pagès, J. (1988-1998), Análisis factoriales simples y múltiples. Objetivos, métodos e
interpretación, Universidad del País Vasco, Bilbao.
Lebart, L., Morineau, A. & Piron, M. (1995), Statisitique exploratoire multidimensionnelle, Dunod,
Paris.
Observatorio del Caribe colombiano. (2010). ‘Características de la región Caribe. Observatorio del
Caribe Colombiano’, Colombia.
Pardo, C. E. & Del Campo, P. C. (2007), 'Combinación de métodos factoriales y de análisis de
conglomerados en R: el paquete FactoClass', Revista Colombiana de Estadística 30.
R Development Core Team. (2011). R: A language and environment for statistical computing, R Foundation
for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org
Thioulouse, J., Dufour, A. & Chessel, D. (2004), ADE4: Analysis of Environmental Data : Exploratory
and Euclidean method Multivariate data analysis and graphical display, Lyon, France.
*http://cran.univ-lyon1.fr/src/contrib/Descriptions/ade4.html
Vertel M & Pardo C.-E. (2010), ‘Comparación entre el análisis canónico de correspondencias y el
análisis factorial múltiple en tablas de frecuencias-variables continuas’, Master´s thesis,
Universidad Nacional de Colombia, sede Bogotá.
Vertel M. (2010). “Complementarity between multiple factor analysis and canonical correspondence
analysis to analyze continuous variables – frequency tables” en el ICAMI 2010 “International
Conference on Applied Mathematics and Informatics”, Area: Applied probability and statistics. San
Andrés (Colombia).
Viloria, J. (2006). “Políticas para transformar el capital humano en el Caribe colombiano”,
Documentos de Trabajo sobre Economía Regional, N° 81, Banco de la República, Cartagena, 2006.
ISBN 1692-3715

XXI Simposio de Estadística 2011

You might also like