Professional Documents
Culture Documents
Semantic Analysis Technique of Logics Retrieval For - En.es
Semantic Analysis Technique of Logics Retrieval For - En.es
com
Abstracto—Las pruebas de software a menudo se enfocan en documentos de especificación del sector como Fig.1. El idioma japonés tiene
documentos de especificación de lenguaje natural. La creación de casos una estructura diferente del idioma inglés. Esta técnica es un enfoque para
de prueba depende de las habilidades del ingeniero, por lo que es aplicar el procesamiento del lenguaje natural para resolver los problemas en
importante la automatización de la creación de casos de prueba a partir
la creación de casos de prueba. La armonización entre las técnicas de
de la especificación del lenguaje natural. La recuperación de lógicas es
procesamiento del lenguaje natural y las pruebas de software es un área
una técnica necesaria para automatizar la creación de casos de prueba,
clave para determinar cómo dirigimos el desarrollo de casos de prueba.
porque una vez que se recuperan las lógicas podemos transformarlas en
tablas de decisión y también crear casos de prueba a partir de las tablas Creemos que este es un diseño de arquitectura de prueba. Este enfoque se
de decisión. Además, la estructura del idioma japonés es diferente del clasifica en el diseño de la arquitectura de prueba y también esta técnica de
inglés. Si nos dirigimos al lenguaje natural japonés, también se requiere lógica de recuperación es una de análisis de requisitos de prueba.
una nueva técnica. Proponemos una Técnica de Análisis Semántico de
Recuperación de Lógicas para Pruebas de Software a partir de
Documentos de Especificación del Sector Público Japonés. Esta técnica
es una recuperación de nueva lógica a partir de la armonización entre la
técnica de procesamiento del lenguaje natural y las pruebas de
software.
Palabras clave: caso de prueba; procesamiento natural del lenguaje; análisis Fig. 1. La técnica de análisis recupera la lógica de los documentos de especificación.
2015 IEEE Octava Conferencia Internacional sobre Talleres de Prueba, Verificación y Validación de Software (ICSTW) 2.º
Taller Internacional sobre Arquitectura de Prueba de Software (InSTA 2015)
978-1-4799-1885-0/15/$31.00 ©2015 IEEE
las empresas siguen creciendo en el idioma japonés. Luego, hay Al igual que las diferencias de dependencia de las palabras, los árboles de sintaxis tienden a profundizarse
oportunidades para aplicar el procesamiento del lenguaje natural en el lado izquierdo y así sucesivamente.
japonés al desarrollo y prueba del sistema. Como la gente sabe, existen Fukui1988 [8] presentó la derivación de las diferencias entre
diferencias entre el idioma japonés y el inglés en cuanto al carácter, la inglés y japonés en un estudio de caso en sintaxis paramétrica. Ese
estructura y la gramática. Ha habido un proceso de desarrollo de fue un modelo de solución de las diferencias entre el idioma inglés
software a partir del proceso del lenguaje natural [11]. Este no es el y japonés hacia la gramática universal. Estos documentos son muy
punto de vista de las pruebas de software. esenciales para establecer el procesamiento del lenguaje natural
La técnica de análisis recupera la lógica de cada oración en los documentos japonés.
de especificación como talón de condición (CS), entrada de condición (CE), En este artículo, sin embargo, no nos centramos en las diferencias
talón de acción (AS) y entrada de acción (AE). Estos elementos lógicos del idioma japonés, porque la técnica de procesamiento del
provienen de la definición de la tabla de decisiones [1]. El lenguaje natural japonés ya ha resuelto las diferencias en su
la lógica se puede describir como (1). análisis morfométrico y/o análisis estadístico japonés. Nos
enfocamos en aplicar los resultados del natural japonés
Si (CS) es (CE), (AS) es (AE). (1) procesamiento del lenguaje en pruebas de software.
Cuando apuntamos al idioma japonés, Tanaka1993 [16] presentó
Definimos reglas y algoritmos para la recuperación de lógicas. En futuras la estructura lógica recuperada de los documentos legales
investigaciones, si establecemos más reglas, la proporción de memoria japoneses. Katayama2007 [17] también propuso ingeniería legal
crecerá. En este documento, nos enfocamos en los documentos de [14] y las investigó. Shimazu2012 [12] propuso una metodología
especificación del sector público japonés. Las razones son que el tamaño de para diseñar un sistema social confiable mediante el análisis de
la empresa de desarrollo y prueba del sistema del sector público japonés documentos legales japoneses. Estos análisis de documentos
alcanzó los 2200 millones de yenes japoneses, lo que representó alrededor legales japoneses son útiles para nuestro problema. La gran
del 20 % del mercado total de servicios de TI de Japón [6], y podemos diferencia entre ellos y nosotros es que se dirigen a documentos
obtener los documentos de especificación de ellos en Internet. legales que se describen de manera más formal que los
documentos de requisitos del sistema. Los documentos legales
tercero ROBRAS ELEVADAS están escritos por expertos eficientes que tienen licencias, para no
Muchos investigadores ya intentaron aplicar el procesamiento del tener ambigüedad, exhaustividad, coherencia, etc. Los documentos
lenguaje natural al desarrollo de software y/o pruebas de software de especificación del sistema están escritos por muchas personas
[3, 13]. Sneed2007 [2] presentó pruebas contra los requisitos del que no son especialistas en idiomas.
lenguaje natural. El enfoque fue analizar los requisitos y extraer Con base en estos trabajos relacionados, proponemos nuestra técnica de
casos de prueba de ellos. El documento ilustraba el enfoque en una análisis semántico de recuperación de lógica para documentos de
aplicación industrial. El documento no menciona las técnicas de especificación de sistemas japoneses.
procesamiento del lenguaje natural y el idioma de destino es el
inglés.
Saeki1989 [11] presentó el proceso de desarrollo de software a partir
IV. STÉCNICA DE ANÁLISIS EMÁNTICO DE RECUPERACIÓN DE LÓGICAS
de la especificación del lenguaje natural. Ese fue un enfoque para Discutimos la técnica de análisis. En primer lugar, usamos la
resolver problemas sobre la especificación del lenguaje natural oración de especificación de muestra (a) y explicamos la técnica de
mediante el proceso que se definió como "diseño" y "elaboración". El análisis de manera intuitiva. Cuando tenemos una oración (a),
enfoque era no tratar de automatizar mediante el uso de técnicas de sigamos para recuperar los pasos lógicos de la oración. La oración
procesamiento de lenguaje natural. (a) muestra (a)-1 oración en japonés descrita por caracteres
IEEE830 [7] recomienda la práctica para las especificaciones de alfabéticos y (a)-2 oración en inglés que significa lo mismo que la
requisitos de software. El estándar describe la consideración para oración en japonés para ambos idiomas.
producir una buena especificación de requisitos de software, partes de (a) Oración de especificación de muestra
ellos y proporciona plantillas. Kim2008 [9] presentó la medición del 1. Japonés:
nivel de las actividades de control de calidad en el desarrollo de
software. La definición de ambigüedad se describió en el documento. Miraini betsuno detaga haitteitabaai, sono jitennno
Cuando nos enfocamos en los requisitos del lenguaje natural, estos dos tyokuzennwo shuuryoubitosurukoto.
documentos son muy efectivos desde el punto de vista de cómo se
deben describir los requisitos y cómo medirlos. 2. Inglés:
Uetsuki2013 [5] presentó un método de prueba de software eficiente
mediante la verificación de la tabla de decisiones. Eso fue para verificar Si existen otros datos en un campo futuro, establezca una fecha justo antes de los
la lógica entre documentos y códigos fuente comparando cada tabla de datos como fecha de finalización.
decisiones que se extraía de documentos y códigos. Tenían como
objetivo que el documento se describiera en lenguaje formal. El objetivo de la técnica de análisis es recuperar una lógica como la de la
figura 2 a partir de esta oración. La figura 2 muestra una estructura de lógica
En este documento nos enfocamos en el lenguaje natural japonés, como "si (A) es (B) entonces (C) es (D)" en inglés, y "(A) ga (B) nobaai (C) ha (D)
luego analizamos los trabajos de investigación del lenguaje. Kuno1973 dearu" en inglés. Japonés. Esta lógica describe la lógica de ramificación de la
[10] presentó diferencias entre el idioma japonés y el idioma inglés especificación. Las lógicas de ramificación son importantes para
Casos de prueba. Cuando recuperamos la condición de rama, podemos • Paso 4: busque la palabra más cercana (A) que dependa de (B)
poner cada elemento de rama en elementos de tabla de decisiones y
oAl igual que el paso 3, la palabra más cercana tiene la más fuerte
transformarlos en casos de prueba.
dependencia con la palabra objetivo.
a.
* 1: japonés (inglés)
oLa palabra más cercana tiene una dependencia más fuerte con
Entonces podemos obtener la lógica de la condición de la oración como "si
la palabra objetivo.
(A) es (B), (C) es (D)”. La definición de la tabla de decisiones [1] es como la Fig.
4.
Las oraciones se han analizado morfológicamente y se ha
analizado la dependencia.
(B)
Paso 1: tyokuzennwo shuuryoubitosurukoto.
miraini Betsuno detaga haiteitabaai sono jitennno
(campo futuro) (otro) (datos) (si existe) (el) (una cita) (justo antes) (establecer como fecha de finalización)
(B) (D)
Paso 2: tyokuzennwo shuuryoubitosurukoto.
miraini Betsuno detaga haiteitabaai sono jitennno
(campo futuro) (otro) (datos) (si existe) (el) (una cita) (justo antes) (establecer como fecha de finalización)
Búsqueda de dependencia
(A) (B) (D)
Paso 3: tyokuzennwo shuuryoubitosurukoto.
miraini Betsuno detaga haiteitabaai sono jitennno
(campo futuro) (otro) (datos) (si existe) (el) (una cita) (justo antes) (establecer como fecha de finalización)
Búsqueda de dependencia
(A) (B) (C) (D)
Etapa 4: tyokuzennwo
miraini Betsuno detaga haiteitabaai sono jitennno shuuryoubitosurukoto.
(campo futuro) (otro) (datos) (si existe) (el) (una cita) (justo antes) (establecer como fecha de finalización)
FI(K, Pmetro(i))
o DE(CE, Pmetro(i))
Una vez que recuperamos una lógica de condición, podemos mapear la lógica en la - PAGmetro(i)es la frase más cercana que
tabla de decisiones como la Tabla II. depende deAE. EstePAGmetro(i)Se define
comoCOMO.
TABLA II. LMAPEO ÓGICO ENDDEFINICIÓN DE LA TABLA DE ECISIÓN
o CDN(CE, Pmetro(i))
talón de condición Entrada de condición
(A) (B) - PAGmetro(i)es la frase más cercana que
talón de acción Entrada de acción depende deCE. EstePAGmetro(i) Se
(C) (D) define comoCS.
Las tablas de decisiones se utilizan en muchos dominios de soporte de El diagrama de flujo de la técnica de análisis es como la Figura 3.
o k={k1, k2,…kyo}
Fig. 5. Diagrama de flujo de la técnica de análisis
o En este papel,k=k1=”baai”(si)
Algoritmo 1El algoritmo de la técnica de análisis. precisión = (a) / ((a) + (b)) (2)
Aporte:documentos que han sido analizados momorfológicamente y analizados
según la dependencia
1: para cadaDmetrohacer
recordar = (a) / ((a) + (c)) (3)
2: para todosPAGmetro(i)hacer
3: siPAGmetro(i)=K1entonces
4: CEi=i
5: PAGmetro(i)=CE CUADRO III. TLISTA DE DOCUMENTOS DE OBJETIVO
6: siPm(Depmetro(i))∈DmetroyPAGmetro(Dep.metro(i))∈Tentonces
7: Docu- Caracteres
AEi = yo
8: mento (Doble Tamaño del archivo
PAGmetro(Dep.metro(i)) = EA otra
9: Grupos Paginas bytes) (Bytes) Fecha de Creación
cosa siguienteDmetro
número para cada palabra,PAGmetro(i)es una frase de los resultados del B 9 7,844 140.800 2014/01/01
análisis morfológico, yDepmetro(i)son los resultados del análisis de C 157 152,568 1,995,521 2012/11/01
dependencia. La Tabla IV muestra la lista de documentos de este C 56 55,738 609,407 2005/07/01
experimento. Los documentos están abiertos al público en Internet. Los
C 73 70,167 2.775.933 2011/07/06
documentos provienen del gobierno y las ciudades casi japonesas como
D 11 9,060 37,888 2012/04/01
sector público. El gobierno japonés ordena que su software y sistemas
se hagan públicos para que la empresa de servicios de TI pueda ofertar D 41 38,527 653,312 2012/04/01
el pedido. Luego, los documentos son documentos de especificación D 327 296,451 6,210,032 2012/04/01
del sistema que la empresa de servicios de TI puede estimar la función mi 25 20,364 880,640 2009/12/02
y calcular sus costos. En estos experimentos, agrupamos los mi 8 6,717 77,312 2012/04/01
documentos de la A a la F. Usamos el grupo A y B en el experimento
mi 7 9,852 313,871 2014/04/01
inicial para verificar nuestra técnica de análisis y ajustarla. Una vez
mi 10 8,035 72,192 2013/05/01
fijado el algoritmo de la técnica de análisis y el programa Perl,
aplicamos el programa del grupo C al F. F 10 4,419 90,624 2011/10/01
Los expertos en pruebas de software que tienen 20 años de F 173 188,919 1,172,389 2007/04/01
experiencia en pruebas de software evalúan los resultados de la técnica F 18 26,466 618,214 2013/04/01
de análisis. Los puntos de evaluación son si recuperan las lógicas
manualmente, comparan los resultados de la técnica de análisis y los
manuales por exhaustividad, corrección de frases y se pueden CUADRO IV. RRESULTADOSTEL TÉCNICA DE ANÁLISIS VS. miVALUACIÓN
transformar en una tabla de decisiones. En la tabla IV se muestran los
El
resultados de la técnica de análisis versus evaluación por positivo y análisis Positivo Negativo
negativo. Por ejemplo, cuando la técnica de análisis recupera la lógica técnica
de condición y los expertos en pruebas de software, la lógica es buena, Positivo Negativo Positivo Negativo
Evaluaciones
(a) (b) (C) (d)
entonces la lógica de recuperación cuenta para positivo-positivo. Otro
A 31 1 15 2
ejemplo, cuando la técnica de análisis excluye una oración pero los
expertos en pruebas de software deben recuperar la lógica que evalúa B 15 1 4 3
las oraciones, entonces la lógica cuenta para negativo-positivo. C 43 2 17 4
La Tabla V muestra los resultados de los experimentos usando factores de D 62 5 33 21
memoria y precisión. El recuerdo y la precisión se calculan mediante la
mi 35 1 19 6
ecuación (2) y (3) usando (a) a (c) en la tabla IV. Como muestra la tabla V, la
F 107 8 40 26
precisión alcanzó de 0,93 a 0,97 y la recuperación alcanzó
CUADRO V. RRESULTADOS DERLLAMADA Y PRECISIÓN mesas de decisión y examinó las oportunidades del futuro de la mesa de
decisión. La técnica de análisis puede detectar la ambigüedad lógica de los
Grupos de documentos
documentos de especificación y las mediciones de retroalimentación para la
A B C D mi F
calidad del documento. Kim2008 propone las medidas de los documentos de
Precisión 0.97 0,94 0,96 0,93 0.97 0,93 especificación como métricas de calidad, por ejemplo, densidad de defectos
Recordar 0,67 0.79 0.72 0,65 0,65 0.73 de documentos, reutilización de documentos, etc. La técnica de análisis
Observamos sobre razones de evaluación negativa de los puede retroalimentar cómo escribimos documentos de especificación
resultados como (b), (c) y (d). En el caso (b), la técnica de análisis manualmente con precisión. Cuanto más correcto podamos describir la
es positiva y la evaluación es negativa. Cuando hay paréntesis, lógica en los documentos de especificación por adelantado, menor será la
caracteres alfabéticos y otros caracteres especiales en frases carga de trabajo para corregir la lógica incorrecta.
entendieron la lógica de las oraciones, debe haber algo [10] S. KUNO, "La estructura del idioma japonés", en Cambridge,
MA:MIT Press., 1973
incorrecto en las oraciones. Entonces es importante para
[11] M. Saeki, H. Horai y H. Enomoto, "Proceso de desarrollo de software a partir
nosotros investigar el caso (d) para el trabajo futuro. de la especificación del lenguaje natural", en ACM Actas de la 11ª conferencia
internacional sobre ingeniería de software, 1989, pp.64-73
VI. CONCLUSIÓN [12] A. Shhimazu, "Ingeniería Jurídica: Metodología para el Diseño de
Propusimos la técnica de análisis, una técnica de análisis semántico de Sistemas Sociales Confiables -Análisis de Documentos Legales-", en
IEICE Foundamentals Review, 2012, pp.320-328
recuperación de lógica para pruebas de software a partir del concepto
[13] T. Kudo y Y. Matsumoto, "Análisis de dependencia japonés mediante
de documentos de especificación del sector público japonés, técnica y
fragmentación en cascada", en Journal of Information Processing Society of
presentamos los resultados de los experimentos. El resultado fue que la Japan, 2002, pp.1834-1842
precisión alcanzó de 0,93 a 0,97 y la recuperación de 0,65 a 0,79. Eso [14] Y. Kimura, M. Nakamura, A. Shimazu, "Expresión lógica de transformación de
mostró que la técnica de análisis funcionó para recuperar la lógica de documentos legales que tienen listados y referencias", en Asociación para el
las condiciones. Confirmamos que la técnica de análisis podía recuperar procesamiento del lenguaje natural, 2008, pp.612-615
[15] Y. Tang y R. Meersman, "Sobre la construcción de tablas de decisiones semánticas",
la lógica de los documentos de especificación del lenguaje natural
en SpringerDatabase and Expert Systems Applications, 2007, pp.34-44
japonés. Cuando apuntamos a recuperar lógicas de condiciones, la
[16] K. Tanaka, I. Kawazoe y H. Narita, "Estructura estándar de disposiciones
cantidad de palabras clave para condiciones es limitada. Luego, la legales - Para el procesamiento de conocimiento legal por lenguaje natural
técnica de análisis funciona para las condiciones de recuperación de los -", en Information Processing Society of Japan Natural Language Processing,
documentos de especificación. 1993, pp.79-86
Este resultado es el punto de partida para la investigación sobre la [17] T. Katayama, "Ingeniería jurídica: un enfoque de ingeniería de las leyes en la era de la
sociedad", en Proc. de la 1ra Internacional Taller sobre JURISIN, 2007
armonización entre el procesamiento del lenguaje natural y las pruebas
[18] S. Masuda, T. Matsuodani y K. Tsuda, "Un método para crear un patrón de prueba para el
de software. Matsuodani2012[4] también propuso los beneficios de
método por pares mediante el uso del conocimiento de los valores de los parámetros", en
recuperar la lógica de los documentos de especificación en Procedia Computer Science, 2013, pp.521-528