You are on page 1of 19

UNIVERSIDAD NACIONAL DE TRUJILLO

Facultad de Ciencias físicas y matemáticas


Escuela Académico Profesional de Informática

DESARROLLO DE UN SISTEMA EXPERTO BASADO EN


PROCESAMIENTO DE LENGUAJE NATURAL PARA
BRINDAR INFORMACIÓN DE LOS PROGRAMAS
OFRECIDOS A LOS USUARIOS DEL CENTRO DE
IDIOMAS DE LA UNIVERSIDAD NACIONAL DE
TRUJILLO

Nombre de autor(es):
Jonathan Brian Baca Huamán
Junior Eladio Luna Victoria Lozano

Nombre del Asesor:


Juan Orlando Salazar Campos

Trujillo - La Libertad
2017

1
PROYECTO DE INVESTIGACIÓN PARA TRABAJO DE
GRADUACIÓN
ESCUELA ACADÉMICO PROFESIONAL DE INFORMÁTICA

1. GENERALIDADES
1.1. Título
Desarrollo de un sistema experto basado en procesamiento de lenguaje natural para brin-
dar información de los programas ofrecidos a los usuarios del Centro de Idiomas de la Univer-
sidad Nacional de Trujillo.

1.2. Autor(es)

Código(s) Nombres y Apellidos Cargo en el proyecto Email


10227006-12 Jonathan Brian Baca Huamán Estudiante invest. jbbecs@gmail.com
10227012-12 Junior Eladio Luna Victoria Lozano Estudiante invest. juniorlunavictoria@gmail.com

1.3. Tipo de investigación


1.3.1. De acuerdo al fin que se persigue (Básica/Aplicada):
Investigación Aplicada

1.3.2. De acuerdo al diseño de investigación (Descriptiva / Explicativa):


Investigación Explicativa

1.4. Área y línea de Investigación


1.4.1. Área de investigación:
Inteligencia Artificial

1.4.2. Línea de Investigación:


Sistemas Expertos

1.4.3. Tema de investigación :


Desarrollo de un sistema experto basado en procesamiento de lenguaje natural para
brindar información de los programas ofrecidos a los usuarios del Centro de Idiomas de la
Universidad Nacional de Trujillo.

2
1.5. Localidad e Institución donde se desarrollará el proyecto
1.5.1. Localidad (Dirección, Distrito, Provincia, Departamento) :
Dirección: Av. Juan Pablo II S/N; Ciudad Universitaria
Distrito: Trujillo
Provincia: Trujillo
Departamento: La Libertad

1.5.2. Institución (Universidad/Facultad/Departamento):


Universidad: Universidad Nacional de Trujillo (UNT)
Facultad: Facultad de Ciencias Físicas y Matemáticas
Departamento: Informática.

1.6. Duración de la ejecución del proyecto (en meses)


DEL 24/04/2017 AL 02/03/2018 (10 meses + 6 días)

3
1.7. Cronograma de ejecución
1.7.1. Cronograma de ejecución del proyecto de investigación (tesis)

Tabla 1: Cronograma de ejecución de Tesis

Etapas Actividades/Tareas Fecha de Inicio Fecha de Término Horas Semanales


Búsqueda de antecedentes 26/04/2017 26/05/2017 21
Recolección de datos
Investigación bibliográfica 27/05/2017 13/06/2017 14

Análisis de la realidad realidad 14/06/2017 21/06/2017 12


problemática

Análisis de los Datos Justificación del proyecto 22/06/2017 25/06/2017 8

Planteamiento del problema 26/06/2017 28/06/2017 8

Formulación de la hipótesis 29/06/2017 05/07/2017 8

Formulación de los objetivos 06/07/2017 10/05/2017 10

Selección de la metodología 11/07/2017 16/07/2017 10

Metodología de Trabajo Población y muestra 17/07/2017 21/07/2017 10

Marco teórico 22/07/2017 18/08/2017 21

Diseño del sistema experto 19/08/2017 21/10/2017 21


Diseño e Implementación
Implementación del prototipo 22/10/2017 18/11/2017 21
del sistema experto

Pruebas del prototipo 19/11/2017 17/12/2017 21


Pruebas
del sistema experto

Análisis de resultados Contrastación de la hipótesis 18/12/2017 31/01/2018 21

Marco teórico 01/02/2018 10/02/2018 21

Redacción del informe Metodología 11/02/2018 20/02/2018 21

Resultados y conclusiones 20/02/2017 02/03/2018 21

4
1.7.2. Cronograma de ejecución del trabajo de graduación - TG

Tabla 2: Cronograma de ejecución del trabajo de graduación - TG

Etapas Actividades/Tareas Fecha de Inicio Fecha de Término Horas Semanales

Preparación del TG Selección y determinación 24/04/2017 25/04/2017 6


del tema

Búsqueda de antecedentes 26/04/2017 26/05/2017 21


Recolección de datos
Investigación bibliográfica 27/05/2017 13/06/2017 14

Análisis de la realidad realidad 14/06/2017 21/06/2017 12


problemática

Análisis de los Datos Justificación del proyecto 22/06/2017 25/06/2017 8

Planteamiento del problema 26/06/2017 28/06/2017 8

Formulación de la hipótesis 29/06/2017 05/07/2017 8

Formulación de los objetivos 06/07/2017 10/05/2017 10

Selección de la metodología 11/07/2017 16/07/2017 10

Metodología de Trabajo Población y muestra 17/07/2017 21/07/2017 10

Marco teórico 22/07/2017 18/08/2017 21

5
1.8. Recursos disponibles
1.8.1. Personal:
A) Investigadores:

Baca Huamán, Jonathan Brian


Luna Victoria Lozano, Junior Eladio

B) Asesor:

Salazar Campos, Juan Orlando

1.8.2. Materiales y Equipos:


A) Materiales:

Dos Resaltadores Faber-Castell


Dos Cuadernos Anillados Shark
Dos Lápiz Faber-Castell 2B
Dos Lapicero Pilot
Dos Borradores
Un Engrapador
Un Perforador
Dos Correctores
Diez Folder Manila

B) Equipos:

Laptop Lenovo Ideapad Y580


Laptop Lenovo Thinkpad Y720
Computadora de escritorio
Memoria USB Kingston

C) Servicios:

Servicio eléctrico
Servicio de Internet
Servicio de transporte
Servicio de impresión
Servicio de anillado
Servicio de empastado

6
1.8.3. Locales:
A) Aulas de la escuela de Informática

B) Laboratorios de la escuela de Informática

C) Biblioteca de la Facultad de CC.FF.MM

1.9. Presupuesto

Tabla 3: Presupuesto de Materiales y Servicios


Descripción Unidad Cantidad Costo Unitario Costo Total
Materiales
Resaltador Faber-Castell Unidad 2 1.00 2.00
Cuaderno Anillado Shark Unidad 2 4.00 8.00
Lapiz Faber-Castell 2B Unidad 2 2.50 5.00
Lapicero Pilot Unidad 2 3.50 7.00
Borrador Artesco Unidad 2 0.50 1.00
Engrapador Artesco Unidad 1 6.00 6.00
Perforador Artesco Unidad 1 4.00 4.00
Corrector Faber-Castell Unidad 2 2.00 4.00
Fólder manila Unidad 10 0.50 5.00
Total Materiales 42.00
Equipos
Laptop Lenovo Ideapad Y580 Unidad 1 781.50 781.50
Laptop Lenovo Thinkpad Y720 Unidad 1 782.50 782.50
Computadora de escritorio Unidad 1 550.00 550.00
Memoria USB Kingston Unidad 2 6.25 12.50
Total Equipos 2126.50
Servicios
Servicio eléctrico Horas 720 0.16 115.2
Servicio de Internet Horas 720 0.18 129.60
Servicio de transporte Global 145 0.90 130.50
Servicio de impresión Unidad 150 0.10 15.00
Servicio de anillado Juego 2 2.50 5.00
Servicio de empastado Juego 1 20 40.00
Total Servicios 435.30
Costo Total 2603.80

1.10. Financiamiento
1.10.1. Autofinanciación:
El costo total del proyecto será financiado por los investigadores, los cuales se divi-
dirán los gastos en partes iguales.

7
1.11. Resumen del proyecto
El presente trabajo de investigación se origina como innovación en el servicio de aten-
ción al cliente del Centro de idiomas de la Universidad Nacional de Trujillo (CIDUNT). Se
plantea el desarrollo de un sistema experto que interactúe a través de lenguaje natural para re-
solver las dudas con respecto a los programas ofrecidos al usuario del CIDUNT, tales como
fechas de matrícula, cursos disponibles, información de los cursos y además información ge-
neral del CIDUNT. Para esto se plantean dos etapas dentro del desarrollo; la primera para el
desarrollo de un sistema experto que nos facilite la planificación y control del proceso de desa-
rrollo, y una segunda etapa para el procesamiento de lenguaje natural. Como resultado de éste
trabajo se espera un sistema experto basado en procesamiento de lenguaje natural que propor-
cione información en el Centro de idiomas de la Universidad Nacional de Trujillo.

8
2. PLAN DE INVESTIGACIÓN
2.1. Antecedentes y fundamentación científica, técnica o humanística

2.1.1. Realidad Problemática:

En las empresas el servicio de atención al cliente es primordial para el desarrollo y


progreso de la empresa, esto se evidencia mediante una investigación realizada a finales del
2016 por Forrester Research, empresa independiente de investigación de mercados que brinda
asesoramiento sobre el impacto existente y potencial de la tecnología a sus clientes y al público
en general, reveló que el 71 % de empresas tienen como prioridad mejorar la experiencia del
cliente.(Oracle, 2016)

Oracle se asoció con Coleman Parkes Research para explorar como las marcas están
innovando en sus funciones de marketing, ventas y servicios para ofrecer una mejor experiencia
para el cliente. Esta sociedad nos alcanza un reporte en el cual se explora como el boom digital
y la tecnología móvil han reformado el comportamiento del cliente y sus relaciones con las
marcas. La investigación nos muestra que el 80 % de las empresas encuestadas para el año 2020
utilizaran Inteligencia Artificial para la atención al cliente, desplazando al personal humano.
(Oracle, 2016)

En este contexto, se percibe que las empresas de distintos rubros en el Perú también
se están sumando a este boom digital, en nuestro país se observa un crecimiento del mercado
tecnológico debido a que en los últimos años ha crecido sustancialmente el ámbito económico.
Es por ello que IBM se ha enfocado en masificar el uso de Inteligencia Artificial en las empresas
del Perú. (Paan, 2017)

IBM, una de las empresas de tecnología con más proyectos en nuestro país, revela que
a nivel nacional hay tres proyectos en ejecución y un total de 20 proyectos que se están desa-
rrollando con Inteligencia Artificial para este año en los distintos rubros empresariales. Uno de
sus proyectos ya gestados es Arturito BCP, un canal de respuestas automáticas por inbox con
un alcance ilimitado debido a su implementación por la plataforma tecnológica IBM Watson.
(Mendoza Riofrío, 2017)

Asimismo, se puede percibir en instituciones locales de Trujillo del departamento de


La Libertad, que este tipo de tecnología aún no se han implementado en ningún rubro em-
presarial. Las empresas locales se muestran indiferentes al uso de esta tecnología, causando
deficiencias en su servicio de atención al cliente y generando no solo un malestar en sus clien-
tes sino también en su personal encargado de este proceso.

En contraste con esa situación, el Centro de Idiomas de la Universidad Nacional de


Trujillo presenta una realidad semejante. A pesar de la importancia que tiene el servicio de
atención al cliente, no se aprecia como prioridad en los planes de la institución. El tiempo em-
pleado en los servicios de atención al cliente para hablar con el personal asignado y resolver un
problema llega a ser algo molesto, lo cual produce insatisfacción en el usuario.

9
2.1.2. Antecedentes:

Según Domínguez (2011) la implementación y uso de agentes conversacionales es


uno de los nuevos e importantes desarrollos dentro del servicio de atención al cliente. El uso de
estos agentes permiten a las personas tener interacción con la institución sin restringirse como
lo hacen con un personal humano. En este documento, se presentó una metodología para orga-
nizar y diseñar la estructura de diálogos de un agente conversacional animado que proporciona
sobre la maestría en Ciencias de la Computación del Instituto Tecnológico de la Ciudad de Ma-
dero. Esta metodología se dividió en cinco fases: a) establecer objetivo, b) definir atributos de
la conversación, c) recabar información relacionada, d) análisis de la información recabada y e)
desarrollar la base de conocimiento. Asimismo se usó AIML (Artificial Intelligence Mark-up
Language) para crear una base de conocimiento a base de una serie de patrones y respuestas,
además se creó una base de datos para almacenar links de paginas con información complemen-
taria sobre la maestría en Ciencias de la Computación. El único inconveniente detectado fue el
limitado dominio que se ejerció en el agente conversacional, sin embargo al realizar preguntas
sobre el dominio establecido se obtuvo un 100 % de funcionabilidad.

Rojas (2016) desarrolló una interfaz de lenguaje natural que incorpora la resolución
de problemas lingüísticos diversos, como la anáfora y la elípsis. Además, es capaz de procesar
una serie de preguntas encadenadas (serie de preguntas contextuales). Se realiza una evaluación
que prueba la efectividad de la paroximación con una fortaleza que debe resaltarse ya que se co-
nectan diversas bases de datos heterogeneas (información estrucurada y datos no estructurados
externos obtenidos de la web) sin que el usuario requiera de conocimientos técnicos expertos.
Esta tesis propuso una arquitectura la cual se compone de cinco módulos principales: a) cone-
xión e interacción con la fuente de datos, b) recepción de consulta, c) tratamiento de consulta,
d) recuperación y presentación de resultados y e) respuesta del usuario. Además presentó al-
gortimos propios para la resolución de la anáfora, elípsis y preguntas contextuales, problemas
puntuales y comúnes para el procesamiento de lenguaje natural. El resultado que se obtiene de
este proyecto fue de un 81.4 % de precisión, los principales errores detectados se debieron a la
detección incorrecta de la consulta, ademas se calculó un tiempo de respuesta de 35.7 segundos.
Luego de detectar de forma incorrecta la consulta la reformulación de esta se dió con un 75 %
de exactitud, teniendo un promedio de 1.4 reformulaciones por pregunta y un 71 % de reformu-
laciones de preguntas en la primera iteracción.

Martínez et al. (2006) describe los aspectos mas relevantes del sistema de asistencia
interactiva que se ha diseñado. Este entorno presenta una interfaz textual que permite estable-
cer comunicaciones con diferentes usuarios en lenguaje natural escrito. El objetivo principal de
este trabajo fue que el sistema comprenda los mensajes de los usuarios. Para llevar a cabo esta
tarea se utilizan técnicas de análisis y extracción de información, entre la que se encuentra el
uso de ontologías del dominio y otros recursos lingüísticos como WordNet. Para llevar a cabo
la implementación de este sistema se ha utilizado el entorno jCOLIBRI, debido a su sencillez
y a su capacidad para poder crear sistemas CBR (Case Base-Reasoning) para cualquier tipo
de dominio. Además este entorno proporcionó una extensión textual compuesta por una serie
de métodos: filtro de palabras, glosario, indentificador de expresiones propias y clasificación

10
por temas; gracias a esto desarrollaron su etapa de generación de respuesta. Este proyecto se
constituyó por cuatro fases: 1) sistema inicial con interfaz textual básica, 2) extracción de la
información e implementación de sinónimos que utiliza la base léxica de Wordnet y por el pro-
pio desarrollador, 3) confirmación de información extraída y 4) interacción con ontologías. Se
realizó una evaluación en 3 fases, fase 1, 2 y 4, y además se tomó en cuenta el evaluar a personas
con conocimiento del tema y a personas ajenas al proyecto. Los resultados obtenidos al realizar
20 consultas de diferentes tipos en 2 grupos correspondientes fueron 48 % en la primera fase,
61 % en la segunda y un 84 % en la cuarta etapa, todos estos resultados evaluaron la efectividad
del sistema en usuarios que tenían relación con el proyecto. Al realizar las pruebas en personas
ajenas al proyecto los resultados fueron: un 18 % en la fase inicial, asimismo un 33 % en la fase
siguiente y por último un 55 % de efectividad en la fase 4.

Se ha implementado un asistente virtual cuyo propósito principal es facilitar la bús-


queda de información dentro del dominio de la Facultad de Informática de la Universidad Com-
plutense (Vallejo Ruiz, 2015). El programa es capaz de analizar las peticiones del usuario en
lenguaje natural para intentar ofrecer respuestas que satisfagan sus necesidades. Para ello, se
hace uso del lenguaje de programación AIML, así como de una base de datos, que son capaces
de reconocer patrones de entrada, para mostrar una salida coherente en lenguaje humano, y en
caso de no encontrar un patrón de entrada, utilizar un repositorio de urls indexadas para devol-
ver las que más se ajusten. El proyecto se ha realizado utilizando un marco de desarrollo ágil,
tipo scrum, la cual constó de 11 sprints. Además, presentó una qrquitectura que se compuso
por seis módulos: a)controlador, b)analizador, c)base de datos, d)buscador (SOLR), e)chatbot
y f)interfaz. La implementacion al realizarse sobre la página web de la facultad se realizó de
manera web, lo que implicó el usó de lenguajes para el desarrollo de este tipo de sistema. Se
llegó a la conclusión de que tuvo un desempeño notable tras realizar un test en dos momentos
distintos. El primer momento fue tras la primera versión funcional de la aplicación al finalizar
el sprint 9, en el cual obtuvo un porcentaje de calidad del 56 %. Sin embargo en el segundo
momento, el cual fue tras la versión final del sistema logró obtener un porcentaje de calidad del
76 %.

Según Batarseh and Gonzalez (2011) se realizó una investigación la cual presentó un
método novedoso para la validación de los sistemas basados en conocimiento. Los métodos de
validación para sistemas basados en conocimiento son importantes por que reducen las perdidas
de todo tipo, tienen la certeza de ser aceptados por parte del usuario/cliente y permite una mejor
comercialización del sistema. Se presento como el estandar de facto para los sistemas basados
en conocimientos la metodología CommonKADS y además fue usado en esta investigación
como base para el desarrollo de un nuevo método. Este metódo fue llamado MAVERICK (Met-
hod for Automated Validation Embedded into the Reusable and Incremental CommonKADS)
y consto de tres partes principales: a) extracción de casos de prueba, b)inspección y validad-
ción y c) Reducción de casos de pruebas basados en contexto. El objetivo final de la detección
de errores y de tener un sistema completamente validado es obtener un nivel de validadción y
verificación del 100 %, en contexto con ello esta investigación alcanzo un nivel de validación y
verificación del 94 %, ajustandose a la hipótesis planteada.

En la investigación Lovera Raffo (2011) permitió al cliente resolver sus inquietudes


de forma inmediata mediante el módulo de correo electrónico haciendo uso de sistemas exper-

11
tos. Su propuesta presentó una arquitectura muy viable para la solución de sistemas expertos
en contact centers. La arquitectura presentada se organizó en 3 grandes servidores: a)servidor
de correo el cuál estuvo compuesto por el servidor de correos Postfix y el filto de correos Spa-
mAssitant, b)servidor de base de datos MySQL y c)servidor de aplicaciones que consta de la
aplicación en JAVA y del Sistema Experto implementado gracias a JESS (Java Expert System
Shell) que generará el mensaje de respuesta. Los resultados obtenidos por este proyecto fueron
destacables, debido a que logró un 91.94 % de confiabilidad, además, la velocidad de respuesta
era muy rápida, llegando a un promedio de 961 milisegundos y la respuesta del cleinte al surgir
la interrogante de la satisfacción fue positiva.

2.2. Justificación
La oportunidad de poder aplicar conocimientos adquiridos durante nuestro tiempo en
la universidad, tales como los de Inteligencia Artificial, Inteniería del Software y Tópicos en
Ciencias de la Computación I. Además, a partir de estos conocmientos poder generar un siste-
ma experto basado en procesamiento de lenguaje natural, el cual sirva como un aporte hacia la
comunidad científica.

La prioridad que el servicio de atención al cliente en las empresas es máxima, ya que


estas saben que muchas empresas no logran fidelizar a sus usuario no por el producto que ofre-
cen sino por la atención que dan, significando una pérdida económica, este es el caso del Centro
de Idiomas de la Universidad Nacional de Trujillo. El presente proyecto de investigación se
desarrolla con la finalidad de evitar incomodidades en el usuario a la hora de pedir información
sobre los programas ofrecidos por el Centro de Idiomas de la Universidad Nacional de Trujillo.

2.3. Problema
¿De que manera brindar información de los programas ofrecidos a los usuarios del Cen-
tro de Idiomas de la Universidad Nacional de Trujillo?

2.4. Hipótesis
Mediante un sistema experto basado en procesamiento de lenguaje natural se brinda
información de los programas ofrecidos a los usuarios del Centro de Idiomas de la Universidad
Nacional de Trujillo.

2.4.1. Variables:
A) Variables Independientes:
Sistema experto basado en procesamiento de lenguaje natural.

B) Variables Dependientes:
Brindar información de los programas ofrecidos a los usuarios del Centro de Idiomas
de la Universidad Nacional de Trujillo.

12
2.4.2. Indicadores:
A) Porcentaje de cumplimiento de las funciones.

B) Nivel de exactitud sintáctica de los Datos.

C) Tiempo de respuesta del sistema experto.

D) Nivel de usabilidad del sistema experto.

E) Nivel de satisfacción de los usuarios.

F) Porcentaje de efectividad del sistema experto.

2.5. Objetivos
2.5.1. Objetivo General:
A) Desarrollar un sistema experto basado en procesamiento de lenguaje natural para brin-
dar información de los programas ofrecidos a los usuarios del Centro de Idiomas de la
Universidad Nacional de Trujillo.

2.5.2. Objetivos Específicos:


A) Determinar los requerimientos funcionales para el sistema experto a través de una entre-
vista con el personal de la institución encargado de brindar información sobre los cursos
ofrecidos por el Centro de Idiomas de la Universidad Nacional de Trujillo.

B) Demostrar que el sistema experto puede mantener una comunicación fluida con el clien-
te a través del procesamiento de lenguaje natural, mediante un nivel de exactitud sintác-
tica mayor al 85 %.

C) Evaluar el tiempo y la precisión de respuesta que brinda el sistema experto correspon-


diente a brindar información sobre los programas ofrecidos del Centro de Idiomas de la
Universidad Nacional de Trujillo.

D) Determinar el nivel de usabilidad del Sistema experto frente al usuario del Centro de
Idiomas de la Universidad Nacional de Trujillo, a través de una evaluación heurística
aplicada a la interfaz gráfica del sistema experto.

E) Evaluar la satisfacción de los usuarios del Centro de Idiomas de la Universidad Nacional


de Trujillo, a través de encuestas dirigidas al usuario.

F) Demostrar que el sistema experto realiza un 100 % de las funciones planteadas, median-
te la comparación de los requerimientos funcionales otorgados por el personal encarga-
do de la institución (experto humano) y las funciones que realiza el sistema.

13
2.6. Metodología de trabajo
2.6.1. Diseño Experimental
La presente investigación presenta un diseño experimental, para ser mas exactos es ti-
po de experimento puro, Diseño con posprueba únicamente y grupo de control. Este diseño
incluye dos grupos: uno recibe el tratamiento experimental y el otro no (grupo de control).
Es decir, la manipulación de la variable independiente alcanza sólo dos niveles: presencia y
ausencia. Los sujetos se asignan a los grupos de manera aleatoria. Cuando concluye la ma-
nipulación, a ambos grupos se les administra una medición sobre la variable dependiente en
estudio.(Hernández Sampieri et al., 2014)
En este diseño, la única diferencia entre los grupos debe ser la presencia-ausencia de la variable
independiente. Inicialmente son equivalentes y para asegurarse de que durante el experimento
continúen siéndolo (salvo por la presencia o ausencia de dicha manipulación) el experimentador
debe observar que no ocurra algo que sólo afecte a un grupo. La hora en que se efectúa el experi-
mento debe ser la misma para ambos grupos (o ir mezclando un sujeto de un grupo con un sujeto
del otro grupo, cuando la participación es individual), al igual que las condiciones ambientales y
demás factores mencionados al hablar sobre la equivalencia de los grupos(Hernández Sampieri
et al., 2014)

Este diseño de la presente investigación se diagrama tal como se observa en la figura 1.

Figura 1: Diseño experimental

Donde:
G1 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo.
X = Sistema experto basado en procesamiento de lenguaje natural.
O1 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo que usan
el sistema experto.
G2 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo.
O2 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo que no
usan el sistema experto.

14
2.6.2. Población y Muestra
A) Población:
Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo.

B) Muestra:
Un total de 343 usuarios elegidos de forma aleatoria.

En la presente investigación se optó por la recomendación de Hernández Sampieri et al.


(2014) y se hizo uso del programa STATS para calcular la muestra. El programa STATS
nos exige cinco datos para poder hacer el cálculo, los cuales son:

Tamaño del universo: Este dato lo obtenemos del Centro de Idiomas de la Universi-
dad Nacional de Trujillo

Error máximo aceptable: Este dato hace referencia al % de error que se permite to-
lerar de que la muestra no sea representativa de equivocarse.

Porcentaje estimado de la muestra: Es la probabilidad de ocurrencia del fenómeno:


representatividad de la muestra vs no representatividad, la certeza total es igual a 1.
Cuando no se tiene marcos de muestreos previos se utiliza el 50 %.

Nivel deseado de confianza: Es el complemento del error máximo aceptable( % de


acertar en la representatividad de la muestra).

En la figura 2 se calcula que el tamaño de la muestra es de 343 usuarios con un error


máximo aceptable del 5 %.

Figura 2: Uso del programa STATS para obtener la muestra.

15
2.6.3. Metodología a Aplicar
La metodología CommonKADS abarca todo el ciclo de desarrollo de software, me-
diante un número de modelos interrelacionados que capturan los principales rasgos del sistema
organizacional y su entorno. Lo anterior se logra detallando información a través de plantillas
referentes a cada modelo. Asociados a estas plantillas, CommonKADS define estados, los cua-
les caracterizan el alcance para el desarrollo de cada modelo. Los modelos mencionados reflejan
diferentes puntos de vista del conocimiento inmerso en un problema y en su solución, cada uno
tiene un propósito específico, unos productos asociados y unas estrategias para su desarrollo.

Según Schreiber (2000) un ciclo de proyecto con la metodología CommonKADS está


compuesto por tres niveles conformados por modelos. El primer nivel o nivel de contexto se
compone del modelo organizacional, modelo de tarea y modelo de agente. El segundo nivel
llamado de concepto esta compuesto por el modelo de conocimiento y el modelo de la comuni-
cación. Finalmente el nivel de artefacto tiene al modelo del diseño.

A) Nivel de contexto
Responde a las preguntas del porqué se debe diseñar el sistema, justificando las razones
por las cuales se construye el sistema experto. Determina los problemas y oportunida-
des a resolver, considerando el impacto que se produce en la organización.

a) Modelo de la Organización(OM); Es una herramienta para analizar la organización


para la cual el SBC va a ser introducido, pretende descubrir problemas y oportuni-
dades de mejora.

b) Modelo de la Tarea(TM); Describe a un nivel general las tareas que son realizadas
o serán realizadas en el entorno organizativo en que se propone instalar el SBC pro-
porcionando el marco para la distribución de tareas entre agentes.

c) Modelo de Agente(AM); Un agente es un ejecutor de una tarea. Puede ser humano,


software o cualquier otra entidad capaz de realizar una tarea. Este modelo describe
las competencias, características, autoridad y restricciones para actuar de los agen-
tes.

B) Nivel de concepto
Describe el sistema de conocimiento a construir. Analiza la estructura y naturaleza del
conocimiento utilizado y la comunicación existente. Es la descripción conceptual del
conocimiento aplicado a las tareas; utiliza el modelo del conocimiento y el de comuni-
cación.

a) Modelo de Comunicaciones(CM); Detalla el intercambio de información entre los


diferentes agentes involucrados en la ejecución de las tareas descritas en el modelo
de tarea.

16
b) Modelo del Conocimiento(EM); Este es el corazón de la metodología Common-
KADS y modela el conocimiento de resolución de problemas empleado por un agen-
te para realizar una tarea. El modelo de la experiencia distingue entre el conocimien-
to de la aplicación y el conocimiento de resolución del problema. El conocimiento
de la aplicación se divide en tres subniveles: nivel del dominio (conocimiento decla-
rativo sobre el dominio), nivel de inferencia (una biblioteca de estructuras genéricas
de inferencia) y nivel de tarea (orden de las inferencias).

C) Nivel de artefacto
Identifica los aspectos técnicos de programación y de construcción en el ordenador.
Da solución a preguntas del cómo: ¿Cómo tiene que ser implementado el conocimiento
en un sistema basado en ordenador? ¿Cómo debe ser la arquitectura del software? ¿Có-
mo se debe traducir el conocimiento a un lenguaje comprensible por el ordenador? En
este nivel está el modelo de diseño.

a) Modelo de Diseño (DM): Mientras que los otros cinco modelos tratan del análisis
del SBC, este modelo se utiliza para describir la arquitectura y el diseño técnico
del SBC como paso previo a su implementación. En general, produce la especifica-
ción técnica en términos de arquitectura, plataforma de implementación, módulos
de software, construcciones de representación, y mecanismos computacionales para
la implementación de SC.

17
Referencias
Batarseh, F. A. and Gonzalez, A. J. (2011). Incremental lifecycle validation of knowledge-based
systems through CommonKADS. PhD thesis, University of Central Florida.

Domínguez, J. R. M. (2011). Diseño de un asistente virtual con diálogo emocional. Master’s


thesis, Instituto Tecnológico de la ciudad de Madero.

Hernández Sampieri, R., Fernández Collado, C., and Baptista Lucio, P. (2014). Metodología de
la investigación, volume 6. Mcgraw-hill México.

Lovera Raffo, A. J. (2011). Diseño e implementación de un sistema experto para una plataforma
de contact center. Repositorio Digital de Tesis PUCP.

Martínez, D. Á., Ortega, E. C., and Arteaga, A. S. R. (2006). Sistema de asistencia interactiva
en lenguaje natural. E-Prints Complutense.

Mendoza Riofrío, M. (2017). Al menos 20 grandes empresas locales ya trabajan proyectos de


inteligencia artificial. El Comercio.

Oracle, C. P. (2016). Can virtual experiences replace reality? Technical report, Oracle Corpo-
ration, 500 Oracle Parkway,Redwood Shores,CA 94065,USA.

Paan, C. (2017). Ibm: “queremos masificar el uso de la inteligencia artificial en el perú”. El


Comercio.

Rojas, Y. (2016). Interfaz en lenguaje natural en sistemas de toma de decisiones para trata-
miento de preguntas contextuales con anáfora y elipsis. PhD thesis, Universitat d’Alacant-
Universidad de Alicante.

Schreiber, G. (2000). Knowledge engineering and management: the CommonKADS methodo-


logy. MIT press.

Vallejo Ruiz, I. (2015). Asistente virtual (chatbot) para la web de la facultad de informática.
E-Prints Complutense.

18
Jonathan Brian Baca Huaman Junior Eladio Luna V ictoria Lozano

Juan Orlando Salazar Campos


Asesor

19