Professional Documents
Culture Documents
RESUMEN
Apertium es una plataforma de traduccin automtica libre y de cdigo abierto que ha sido creado
inicialmente para traducciones entre lenguas emparentadas, sin embargo por su evolucin permite crear
pares de lenguas divergentes. El objetivo del estudio fue la comparacin traductora entre una lengua
nativa aglutinante e idioma flexivo. La medicin de la calidad del traductor automtico fue entre espaol
y quechua mediante el mtodo Word Error Rate. La implementacin del traductor automtico
correspondi al Quechua del Este de Apurmac. El estudio se realiz durante el ao 2013 en la Regin
Apurmac-Per. Las etapas en la traduccin correspondieron a: incubacin del sistema traductor
automtico, creacin del diccionario monolinge quechua y reutilizacin del diccionario monolinge
espaol, creacin del diccionario bilinge y creacin de las reglas de transferencia estructural. El
resultado del sistema de traduccin automtica presenta, ms de 4000 palabras races, 5000 traducciones
de palabras races entre espaol y quechua, reglas de transferencia estructural de quechua a espaol y
reglas de transferencia estructural de espaol a quechua implementadas. Finalmente, la calidad del
traductor automtico aplicando el mtodo WER, present un promedio de error de calidad de traduccin
de quechua a espaol de 19,48 y calidad de traduccin de espaol a quechua con error de 24,19.
Palabras claves: Apertium, espaol, quechua, software libre, traductor automtico, traduccin
automtica.
ABSTRACT
Apertium is a translation automatic platform free and open code that has been initially created for
translations between related languages; however its evolution creates pairs from divergent language. The
aim of the study was the compared translation between a binder translator native language and
inflectional language. The quality measurement translator was between Spanish and Quechua using the
Word Error Rate method. The implementation of automatic translation corresponded to East Apurimac
Quechua. The study was conducted during 2013 in the Apurimac Region, Peru. The stages in the
translation corresponded to: incubation of the machine translator, creation of Quechua monolingual
dictionary and to reuse a Spanish monolingual dictionary, creation of a bilingual dictionary and creation
of structural transfer rules system. The result of automatic translation system has more than 4,000 root
words, 5000 translations of root words between Spanish and Quechua, structural transfer rules from
Quechua to Spanish and structural transfer rules from Spanish to Quechua were implemented. Finally, the
quality of the automatic translator using the WER method had an error average of 19.48 translating from
Spanish to Quechua and 24.19 of average error translating from Spanish to Quechau. .
Keywords: Apertium, Spanish, Quechua, free software, automatic translation, machine translation.
81
desarrollo
INTRODUCCION
de
sistemas
de
de
en
que,
espaol,
la
calidad
de
oficial de Apertium.
traduccin
Error Rate).
beneficiar
profesionales
portugus
quechua
quechua
gallegoespaol,
midiendo
que
programas
espaol
los
entre
de
lenguas
automtico
adems
la
en
de
todava
Transducens
la
trascienden
investigacin
la plataforma
aportado
traduccin
a
e
la
los
educacin,
estudiantes,
investigadores
de
morfolgicamente
complejas.
Como
quechua.
Asimismo
2009),
Ghring,
&
investigacin
(Rios
una
82
experimentaron
entre
los
alineamientos
idiomas
Alemn,
variantes
de
quechua
se
encuentran
(SIL, 2013).
de
en
los
familias
639-1 y
2013).
traduccin
mtodos
automtica
estadsticos,
basados
llegando
informacin,
dictado
automtico.
Procesamiento
generacin de palabras.
contempla
del
Lenguaje
Natural
como:
Anlisis
elementos
2004).
La
considerada
83
lingstica
como
computacional
una
rama
est
de
la
lingstica
computacional,
objetivo
embargo,
su
el
preocupacin
necesariamente
construir
psicolgicamente
no
es
un
modelo
realista
del
2002).
Apertium es una plataforma de traduccin
lenguaje
natural,
sin
tomar
en
contribuciones
de
la
lingstica
(Helsinki
Automtica de Apertium
Fuente: Armentano et al (2007).
morfolgico,
desarrollado
por
84
invocado
transferencia
Armentano et al (2007):
blanco <b></b>.
cada
El
mdulo
de
transferencia
El analizador morfolgic.-Segmenta el
entre
como:
gnero,
nmero,
cambios
de
reordenamientos,
preposicionales
etc.
La
verbo,
otros)
tales
lenguas
cambios
postchunk.
la
tratadas
como
formas
lxicas
lee
preposicin,
estructural,
de
lxica
mdulo
categora
el
por
Markov
traduccin.
de
primer
orden,
que
observables
son
clases
MATERIALES Y MTODOS
de
La investigacin se ha realizado en la
Apurmac
contexto.
en
la
Escuela
Acadmico
85
Rate):
Internacional.
La poblacin para la lengua quechua son
todas las palabras races. La muestra est
Dnde:
S es el nmero de sustituciones,
B es el nmero de borrados,
I es el nmero de inserciones,
entre
nombres,
adjetivos,
verbos,
frase de referencia.
para
el
domicilio
del
traductor automtico
traduccin automtica.
Software utilizado
Etapa de Implementacin de
diccionarios monolinges(quechua y
espaol)
Etapa de implementacin de
diccionarios bilinge
essential,
g++,
pkg-config,
transferencia estructural
libxml2,
libxml2-dev,
xsltproc,
flex,
traductor automtico
libtool y libpcre3-dev.
gawk,
libxml2-utils,
automake,
autoconf,
Traduccin
en lnea
Automtica
instalado:
Software
traduccin automtica
especializado
de
anlisis
86
$lt-
complrapertium-es-qve.es.dix
chunker $apertium-preprocess-transfer
apertium-es-qve.es-qve.t1x
$hfst-lexc
$hfst-twolc
lexc
twol
qve.t2x.bin
preprocess-transfer
diccionario
qve-es.t1x.bin
bilinge
interchunk
es-qve.es-qve.dixqve-es.autobil.bin
Compilando
diccionario
de
$apertium-preprocess-
transferapertium-es-qve.qve-es.t1x
es-qve.es-qve.dix es-qve.autobil.bin.
Compilando
bilinge
apertium-es-
fst2fst -O o qve-es.automorf.hfst
diccionario
$apertium-
qve.es-qve.t3x es-qve.t3x.bin
Compilando
Espaol-
Quechuanivelpostchunk
qve.twol.hfst-o qve.hfst
$hfst-
compose-intersect -1qve.lexc.hfst -2
Espaol-Quechuaes
--
o qve.twol.hfst
Composicin
de
qve.qve.lexcqve.lexc.hfst
es-qve.qve.twol
es-
qve.t1x.bin
--
formatfomaapertium-es
es-
qve.automorf.bin
apertium-es-qve.es-qve.rlx
es-qve.rlx.bin
diccionario
espaol
quechua
morfolgico
auto-
de
es-qve.es.dixqve-es.autogen.bin
RESULTADOS Y DISCUSIN
Compilando
diccionario
Compilando
transfer
auto-
$apertium-preprocessapertium-es-qve.qve-es.t2x
qve-es.t2x.bin
qve.hfst -o es-qve.autogen.hfst
87
$apertium-preprocess-
transfer
apertium-es-qve.qve-es.t3x
qve-es.t3x.bin.
Segn
Tyers
investigacin
et
al
(2010),
presentan
en
su
Recursos
de
automticos,
describe
los
ambas
implementando
cada
la
diccionario
utilizando
los
se
logra
diccionarios
para
analizar
esto
automtica
direcciones,
el
mismo
diccionario para
plataforma
direccin contraria.
Apertium.
Significado en espaol
%<n%>
%<adj%>
%<prnp%>
%<adv%>
%<vblex%>
%<m%>
%<sg%>
%<pl%>
Otros
! nombre
! adjetivo
! pronombre
! advervio
! verbo
! masculino
! singular
! plural
Nombres ;
Adjetivos ;
!Nombres
!Adjetivos
88
!PronombresP
!Adverbios
!Verbos
Lexicon Plural
%<pl%>:%>kuna N-FLEX-Incl ;
LEXICON Caso
%<acc%>:%>ta
%<abl%>:%>manta
LEXICON Posv
%<px1sg%>
! plural s
Lexicon Nombres
wasi:wasi N ;
t%'anta:t%'anta N ;
Lexicon Adjetivos
hatun:hatun ADJ;
musuq:musuq ADJ;
LexiconPrnPerson
nuqa:nuqa PRNP;
Lexicon Advervio
may:may ADV;
Lexicon verbos
mikhuy:mikhu V;
munay:muna V;
otros
Significado
!casa
!pan
! acusativo a
! ablativo
(desde, de)
! posesivo 1ra persn singular
!grande
!nuevo
!yo
!dnde
!comer
!querer
...
ortogrfico
Quechua
una
lengua
aglutinante:
Recursos
la plataforma
confirma
con
se
un
analizador
morfolgico
89
de
la
cdigo
abierto
en
la
utilizacin
de
recursos
parte de espaol,
confirmando de esta
se
tiene
la
columna
(TEXTO
quechua
resultados:
Cuadro 2. Resultado de la medicin del traductor automtico Quechua a Espaol con la mtrica WER.
No
Texto a traducir
Traductor
Traducido por WER
automtico
el humano
pukawasinchismanrisun
a nuestra casa roja iremos a
0,00
iremos
nuestra casa
1
roja
sumaqalquchachinkamusqawasiykima Perro lindo perdi un perro lindo
33,50
nta
de tu casa
se perdi de tu
2
casa
mihusun chiri lawata
comeremos *a
comeremos una 25,00
3
sopa fra
sopa fra
chirimantawausunkunanp'unchaw
de fro moriremos de fro
0,00
hoy da
moriremos hoy
4
da
yuraqmankaykitaapamusaq
a tu olla blanca
traer tu olla
25,00
5
traer
blanca
MarawanJaimewanmihushankulawat Mara y Jaime
Mara y Jaime
16,67
6 a
comen a sopa
comen una sopa
apasunrumitawasiykipirqanapaq
llevaremos piedra llevaremos
25,00
tu casa construir
piedra a tu casa
muro
para construir
7
muro
mamaywatukuyrirqaniAndahuaylasta mi madre visitar
fui a visitar a
25,00
fui a Andahuaylas mi madre a
8
Andahuaylas
90
11,11
33,50
19,48
Cuadro 3. Resultado de la medicin del traductor automtico espaol a quechua con la mtrica WER.
No
Texto a traducir
yo quiero comprar una casa para mi
hijo
1
la casa blanca est bonita
2
esas cinco piedras son para ti
3
quiero mucho azcar para m caf
Traductor
automtico
uqamunanirantiy
hukwasi *para
*mo churi
*La
wasiyuraqkashans
umaq
Chay
pisqarumikunakan
kuqanpaq
munaniaskhamisk'i
uqapaq *caf
uqanchisMikhuy
kut'antap'unchawn
intin
paykunaqunkuway
lla *el quwi
munaniupiyunu
*con misk'ikunan
ruwankichist'anta
*para
mikhuykunanp'unc
hay
*La
tiyanaq'illukashan
p'akiy
PayKashanMikhus
paaskha,
aknawiranqanishi
wta
25,00
4
nosotras comemos pan todo el da
5
ellos dan pasto al cuy
6
quiero tomar agua con azcar hoy
7
hagan pan para comer hoy da
8
la silla amarilla est rota
9
l est comiendo mucho, as
engordar demasiado
10
Promedio
yuraqwasisuma
qkashan
25,00
chay
pisqarumikunaq
anpaqkanku
askhamisk'imun
aniuqapaq
*caf
uqanchist'anta
tap'unchawninti
nMikhuyku
paykunaquwiw
ayllaqunku
kunanunumisk'i
upiymunani
t'antaruwankich
iskunanp'uncha
ymikhuy
20,00
q'illutiyanap'aki
ykashan
25,00
Pay
askhaMikhuspa
Kashan,
aknanishiwtawi
ranqa
28,57
20,00
25,00
20,00
20,00
24,19
91
modelo
quechua,
el
24.19%
ms
menos
de
transferencia
evolucionan
Date
Version
Direction
Unknown
words
fr eo
apertium-eo-fr
eo fr
22.4 %
Yes
en mk
apertium-mk-bg 31st August 2010
0.1.0
mk bg
bg mk
0.6.1
nb nn
Yes
apertium-eu-es
apertium-cy-en
apertium-eo-en
apertium-es-pt
apertium-oc-ca
apertium-pt-ca
apertium-en-es
May 2009
0.5.0
sv da
da sv
eu es
es eu
cy en
en cy
0.9.0
en eo
eo en
es pt
pt es
oc ca
ca oc
pt ca
ca pt
en es
es en
92
26.67 %
-
Yes
fr br
apertium-sv-da
nn nb
apertium-nn-nb
WER
32.5%,
17.7%
-
Yes
Unknown
Unknown
Unknown
Unknown
Unknown
Unknown
Unknown
30.3 %
72.4 %
55.7 %
21.0 %
4.7 %
11.3 %
9.6 %
16.6%
14.1%
-
cuanto
experimentaron
(Rios
et.
Al.,
espaol,
gallegoespaol,
portugus
paralelos
utiliza
las
alineamientos
2009),
herramientas
GIZA++
de
oficial
(http://www.apertium.org).
expresan
para
permite
ser
utilizado
para
las
lenguas
de
Apertum
conceptos
crear
sistemas
relaciones
de
traduccin
minoritarias.
automtica
(Rios
la
idioma
que,
que
son aceptables.
adems
de
los
programas
93
&
entre
pares
Ghring,
espaol
de
2009),
mediante
su
lenguas
en
su
anlisis
Resultados
verificables
de
la
investigacin
monolinge
espaol
en
el
sitio
ms
de
5,000
http://www.lenguasandinas.org,
espaol
reglas
de
quechua implementadas.
investigacin.
con
Diccionario
con
ms
de
4,000
palabras races
comprensin de textos.
Pruebas de entrada y salida del sistema de traduccin automtica entre espaol y quechua
Anlisis morfolgico de la palabra wasiykuna
Entrada: $echo "wasiykuna" | hfst-proc -x qve-es.automorf.hfst
Traduccin: Casas
94
Yo se escribir
95
Sucesivamente
quechua
puede
tener
mas
grande
las
palabras
aglutinadas
"wasi+yki+kuna+manta"
Entrada: $echo "wasiykikunamanta" | apertium -d .qve-es
Salida: de tus casas.
96
CONCLUSIONES
entre
espaol
quechua
aceptable
con
sus
morfolgicos
del
textos
idioma
AGRADECIMIENTOS
por
de
apoyo
constante
en
la
su
la
de
aceptable
comprensin
diccionarios
respectivamente.
Diccionarios
la
Cusco.
textos
97
superficial.
REFERENCIAS BIBLIOGRFICAS
APERTIUM,
Plataforma
libre
Departament
Llenguatges
de
Sistemas
InformticsUniversitat
Alacant.
ISO
639
Code
Gonzales
Tables,
Traduccin
Departamento
Tesis
de
la
Teora
de
Guinovart
A.
Tusn
Valls.
EdicinEguren.
de la Universidad de Alicante.
Techniques.
9781456210779
C.
2004.
Construccin
de
Url:
Thomson.
[http://homepages.mty.itesm.mx/rbr
Mooney
ena/AyL.html].
A.
&
Raymond
J.
2003.
IV,
Estudios Rurales
V.
Oxford
Handbook
of
University Pres.
Noviembre.
(RuslanMitkow
Ed.).
Madrid, Ctedra.
abierto
OpentradApertium
de
Traduccin
de
transferencia
de
Automtica.
Informticas
Traduccin
Centro de
Estocsticos
de
Valencia.
Aprendizaje
Sistemas
d'
de http://www.sil.org.
ISBN:
2009.
Transductores
Mxico.
J.
de
Automtica
sintctica
Lexicografa
98
Traduccin
Volumen
9,
Url:
[http://elies.rediris.es/elies9/index.h
Educacin S.A.
20
Arbor, University of
http://www.sil.org.
Michigan
Press.
Nils
N.
2004.
Inteligencia
McGraw
S.A.
investigacin
Espaa.
Edicin.
McGraw-
Hill/Interamericana S.A.
Ricardo
in
Language
UANCV,
Technology LiLT.
Andina
Nstor
2009.
Contrastiva
Quechua/Aymara/Castellano.
Treebank.
Escuela
Segunda
Investigacin.
Velsquez.
Morfologa
Spell
Universidad
Cceres
Parallel
de
Direccin
ISBN 9786034502109.
Spanish-Quechua,
Issues
palma,
Universitaria
de
desarrollo
en el Espaol Andino.
Artificial.
traductores automticos.
2011.
de
Madrid.
Faculta LatedraRomanistiky.
A.
2013,
MasarykovaUniverzitaFilozofika
Rios
de
Artificial.
Hill/Interamericana
Spanish
mayo
Madrid.
Linguistic
de
de
Postgrado
de
Especializacin
la,
en
an
99