You are on page 1of 6
FACULTAD DE CIENCIAS E INGENIERÍA ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMA E INFORMÁTICA TRABAJO DE INVESTIGACIÓN

FACULTAD DE CIENCIAS E INGENIERÍA

ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMA E INFORMÁTICA

TRABAJO DE INVESTIGACIÓN DE ESTADÍSTICA Y PROBABILIDADES

APORTACIONES DESDE LA MINERÍA DE DATOS AL PROCESO DE CAPTACIÓN DE MATRÍCULA EN INSTITUCIONES DE EDUCACIÓN SUPERIOR PARTICULARES

PRESENTADO POR:

LUNAREJO APONTE, LUIS FERNANDEZ CARRANZA, GUILLERMO RODRÍGUEZ, JEREMY VENTOCILLA GOMERO, FANNY

DOCENTE:

LIC. NEYRA LOPEZ WALTER JESUS

LIMA PERÚ

2018

IDENTIFICACIÓN DE PROBLEMA

¿De qué manera la MD puede aportar la optimización del proceso de captación de matrícula en las IES particulares?

IDENTIFICACIÓN DE OBJETIVO GENERAL

Analizar la forma en que la minería de datos (MD) permite optimizar el proceso de captación de matrícula en las IES particulares.

RESUMEN EJECUTIVO

Con la intensión de diseñar el proceso de captación de matrícula para las IES particulares, se analizara situaciones actuales de las instituciones educativas Superiores (IES) con su proceso de captación de matrículas y la aplicación del método de MD disminuyendo errores con el software Rapid Miner en lo que se muestra que es posible mejorar el proceso de captación para las IEP particulares.

El crecimiento acelerado de educación superior en el mundo es una realidad evidente en el 2005 el 24% de la población mundial está matriculado en la educación terciaria, en el 2012 ascendió al 32% lo que se vio un 8% de aumento en siete años. Entre el periodo 2008 y 2012 tanto instituciones públicas como privadas incrementaron un crecimiento de 50%, el número de IES. En el 2008 33% fueron atendidos por IES particulares, mientras que el sistema público capto el 67%, de la misma forma en el año 2014 el 31% por IES particulares y el 69% por sistemas públicos.

Por lo anterior por la ardua competencia de captación de matrícula de IES particulares como públicas y la suma de crecimientos de oferta y captación de sistema público la MD ante la situación descrita impone una importante oportunidad para hacer más eficiente su proceso de matrícula. La minería de datos representa una oportunidad de optimización de proceso de captación de matrícula en IES particulares, así como el diseño de un modelo predictivo de gestión de matrícula.

PANORAMA DE LA EDUCACIÓN SUPERIOR PARTICULAR EN MÉXICO

En el 2012, el 43% de la población de América Latina se encontraba matriculado en educación superior, México en el mismo año registraba el 29% de participación en este rubro, parece que en América Latina se optado principalmente por vía de apertura del sector privado.

En la tabla 1 se observa que las IES particulares han ganado cada vez más terreno y matricula se muestra de que México y Argentina tiene una alto crecimiento de instituciones (72% y 53%) y un bajo crecimiento en matricula (33% y 24%).

IDENTIFICACIÓN DE PROBLEMA ¿De qué manera la MD puede aportar la optimización del proceso de captación
El mercado para la captación de matrícula, si bien aumenta, se reparte con preferencia hacia el

El mercado para la captación de matrícula, si bien aumenta, se reparte con preferencia hacia el sistema público; el proceso de expansión acelerado del sector privado en el ramo educativo, de las últimas décadas, no ha estado asenso de críticas. Numerosos estudios denuncian que el crecimiento de IES particulares han puesto en riesgo la calidad educativa superiores según la BD de la COPAES, existe actualmente 3 mil307 programas acreditados de los cuales solo 883 son programas de IES particular, lo cual representa apenas el 27%, es decir solo 1% cuenta con al menos un programa acreditado por COPAES.

Resulta indispensable generar estrategias que permitan a las IES particulares atraer prospectos del reducido y saturado mercado de la actualidad, por lo que las investigaciones que aporten a la mejora del proceso de captación de matrícula son fundamentales para la sobrevivencia de IES particulares.

EL PROCESO DE CAPTACIÓN DE MATRÍCULA DE LAS IES PARTICULARES

El proceso de captación de matrícula tiene por objetivo captar la mayor cantidad de alumnos para que se inscriban en la IES. De ellos se obtienen sus datos y se almacenan en la BD de prospectos de la IES particular.

Las personas responsables de la captación también deben de hacer seguimiento a estos prospectos para lograr que se inscriban. Existen retos que implica el captar matricula en la actualidad:

  • 1. La recolección de los datos sobre los prospectos deben ser protegidos por lo que se debe tratar con mucho cuidado ya que se utilizara en la modelación.

  • 2. La recolección debe ser eficiente ya que se pueden registrar datos que no son válidos.

  • 3. Los datos de los prospectos son dinámicos y deben ser actualizados constantemente.

  • 4. Las BD contienen mucha información lo cual requiere de un eficiente trabajo.

  • 5. Los reportes que se extraen de las BD muestran información que apoya principalmente la identificación y el seguimiento de contactos con el prospecto.

MINERÍA DE DATOS

Para afrontar los retos de la captación de la matrícula, se pueden apoyar en el uso de la tecnología de información, la realidad virtual se vuelto un componente principal de organizaciones contemporáneas.

El uso de tecnología denominada sociedad de la información donde cada minuto se generan cantidades descomunales de datos los cuales se organizan en BD generando silos de información almacenada. A este gran volumen se le conoce como big data.

La organización en la BD se realiza a través de agrupación de caracteres que forman campos y al juntarse forman registros. Este conjunto de registros forman un archivo y cuando estos se relacionan con otros se forman las BD.

La MD es justamente ese conjunto de herramientas que facilitan la obtención de conocimiento valioso; se puede entender la MD como una especie de ariete que rompe la impenetrable fortaleza de los silos de la información. El objetivo es generar modelos que permitan comprender y predecir el comportamiento de los procesos a partir de los registros almacenados en las BD. La MD inicia con los datos, a los cuales se les aplican métodos computacionales especializados para descubrir estructuras y patrones inicialmente ocultos (Kotu y Deshpande, 2015).

Los métodos son conocidos como algoritmos. Uno de estos son los árboles de decisión que permiten crear modelos de predicción. Consisten en una técnica que clasifica casos basados en las variables conocidas como predictoras. Cada variable y su posible valor se muestran en un nodo del árbol (Van Der Aalst, 2012).

Los árboles de decisión son un tipo de aprendizaje supervisado en analítica predictiva. Un aprendizaje supervisado significa que uno de sus atributos es definido como variable de respuesta, por lo que el modelo generado ofrece un esquema predictivo de dicha variable de respuesta en términos de las variables de entrada, los arboles de decisiones se utilizan para hacer predicciones sobre un atributo en particular.

Como muchos modelos predictivos, el árbol de decisión requiere trabajar con un porcentaje de la BD para la construcción del modelo, este porcentaje se conoce como data de entrenamiento y el otro porcentaje para la evaluación del modelo, que se conoce como data de prueba.

Minería de datos y captación de matrícula en la IES

Resultados: Modelo predictivo de gestión de matrícula

Este árbol de decisión se observan colores en cada cuadro de predicción. Estos colores representan el número de sujetos clasificados en forma correcta en la data de prueba.

La organización en la BD se realiza a través de agrupación de caracteres que forman campos

Cuanto más azul la barra, más confiable es la predicción. En esta BD se observó un

56% de precisión en la predicción de “inscritos” y un 44% para la predicción de “no

inscritos”.

El árbol fue generado con el 60% de la BD y, posteriormente se prueba su capacidad predictiva en el restante 40%. Se debe extraer el conjunto de reglas de inducción que se encuentra en el árbol de decisiones.

Las reglas generadas en el árbol de decisión permite realizar predicciones concretas para nueva BD en base previa es decir se actualizara en cada ciclo de proceso y cada vez más exacta.

En la figura 3 se muestra el análisis de proceso de matrícula de una IES particular, este modelo integra todo los elementos generados a lo largo del proceso que son:

Capturar de datos del prospecto.- debe ser válida y confiable no se debe almacenar datos erróneos para ello es muy importante la tecnología; también se debe capturar datos de entrevistas, correos electrónicos y comentarios en redes sociales.

Almacenamiento de datos.-Se debe almacenar y organizar en una BD por ello es necesario un software que permita la aplicación de operaciones sobre los datos.

Construcción del árbol de decisiones.-El árbol de decisiones debe de ser construida basada en la BD refinada se debe probar para medir su efectividad.

Generación de reglas del modelo.- Se interpreta el árbol de decisión para generar las reglas del modelo. Se debe enunciar una regla generalizada que resuma en una expresión qué sujetos prospectos tienen mayor probabilidad de que se inscriban

Sistema de información predictivo.- El sistema de información debe de estar basada en la regla del modelo y la de la BD para que pueda generar la lista de sujetos prospectos que se predice se inscriban en la IES particular.

Estrategias de medida.- Al conocer los sujetos del prospecto que provee el sistema de información, se debe diseñar estrategias específicas enfocadas a ellos para lograr sus inscripción esta debe derivar en objetivos, metas y planes de trabajo de lo contrario no se lograra el existo.

Inscritos.- Los estudiantes inscritos forman parte de los datos de entrada para la BD.

La interacción son secuencias o ciclos que consideran la retroalimentación de la BD en dos momentos distintos el primero al general las reglas y el segundo al finalizar un ciclo.

IDENTIFICACIÓN DE VARIABLES ESTADÍSTICAS

POBLACIÓN

Estudiantes de las instituciones educativas superiores.

MUESTRA

80 estudiantes.

UNIDAD DE

 

ANÁLISIS

Cada estudiante de las instituciones educativas superiores.

VARIABLE

Número de estudiantes que se matriculan cada año en IES particulares.

TIPO VARIABLE

Cuantitativa discreta.