You are on page 1of 6

Estndares W3C VoiceXML

Juan Carlos Gmez Gmez Daniel Alejandro Ferrndiz Montero Ingeniera Multimedia

Introduccin
Muchos usuarios encuentran mucho ms prctico los servicios automatizados por voz, y en la contaste evolucin de la web no ha podido faltar VoiceXML, que se ha convertido en un estandard W3C capaz de darnos la oportunidad de navegar interactuando con el ordenador utilizando exclusivamente nuestra voz, se deja de lado los perifricos como el ratn y el teclado para dar lugar al micrfono. Como si se tratara de una conversacin se establecen los roles de emisor y receptor, alternndose entre ordenador y usuario.

Historia
AT&T, IBM, Lucent, y Motorola creo el foro de VoiceXML en 1999, antes del septiembre de 1999 el foro lanz VoiceXML 0.9 y en 2000 publicaron VoiceXML 1.0. El W3C lo acepto como estandard en marzo de 2004 en su version 2.0, algo ms tarde surgi la 2.1 aadiendo algunas pequeas mejoras, las cuales se convirtieron en recomendacion W3C en 2007. Actualmente se esta trabajando en VoiceXML 3.0, el cual utilizar un nuevo idioma descriptivo del statechart de XML llamado SCXML.

Qu es?
VoiceXML, es un lenguaje destinado al manejo y creacin de aplicaciones de voz, que son empleadas para navegar, de forma auditiva en vez de utilizar la forma visual, ms convencional y extendida hasta el momento. Los documentos que origina, son los llamados XML (eXtensible Markup Language), que admiten y poseen las caractersticas necesarias para dar lugar a la reproduccin de sonidos digitales y sintetizados. Posee un tipo de arquitectura no delimitada y de alto nivel de compatibilidades con respecto a las distintas salidas o recursos de la informtica e internet.

Componentes

Las aplicaciones de VoiceXML, contienen ciertos componentes, normalmente comunes entre ellos como: El Servidor de aplicaciones que es el encargado al igual que cualquier funcin de un servidor, de proporcionar y almacenar datos de las aplicaciones e interfaces, para poder facilitarlas a otras externas. Por otra parte, el Servidor de VoiceXML de Telefona que es una plataforma que acta como cliente frente al servidor de aplicaciones acabado de mencionar. ste controla los dilogos producidos en VoiceXML, y los entiende para su control del habla y los diferentes recursos que posee (Como al ADR, o TTS) Tambin posee una red de paquetes TCP / IP basada en la conexin del servidor de aplicaciones y el servidor de telefona a travs de protocolos HTTP. Y a su vez, contiene una red telefnica comnmente pblica (PSTN), aunque no descarta la posibilidad de ser privada (PBX).

Funcionamiento
El usuario utiliza su voz para empezar a dar ordenes, de modo VoiceXML pone en marcha su ASR (un sistema encargado de reconocer la voz humana) transformando as la voz en una seal digital formada por 0s y 1s. Una vez se procesa y si es necesario, la mquina puede contestar tambin mediante voz al usuario, poniendo en marcha el TTS y mediante ste se crean los documentos XML nombrados con anterioridad. ,Para la creacin de estos documentos, se utiliza sta tecnologa especfica denominada TTS, que es referente a tecnologa de sntesis de voz. Y la sntesis de voz consiste en la reproduccin de manera no natural, es decir, artificial, del lenguaje natural y su origen proviene de las seales de voz que son generadas por el ordenador, que da lugar a un proceso inverso al ASR, es decir, transforma la seal digital que crea (respuesta) en voz entendible para el usuario.

Aplicaciones
VoiceXML esta en expansin, y seguramente tenga cabida en multitud de entornos, actualmente es ms usado en servicios telefnicos, un ejemplo claro lo encontramos cuando hacemos llamadas a nuestro operador telefnico, donde una voz nos va pidiendo datos para poder emparejarnos despus con una persona real. Otra aplicacin importante es en los sistemas de informacin, incluso en el mbito turstico, dando la opcin de comunicarse con la mquina en mltiples idiomas. Pero adems de la comodidad que nos puede proporcionar una navegacin mediante VoiceXML nos encontramos con una muy buena opcin para dotar a cualquier pgina web de ms usabilidad para gente con problemas de movilidad, incapaces de moverse con la soltura necesaria mediante los perifricos como el ratn y el teclado.

Ejemplo de sintaxis
Como ya sabemos, una de las primeras pruebas a la hora de empezar con un lenguaje es el famoso Hola mundo que en C++ y Java como ya sabemos sera algo as : C++ class MainClass { public static void Main() { System.Console.WriteLine(Hello World"); } }

Java public class HolaMundo { public static void main(String[] args) { System.out.println(Hello World"); } }

Y as quedara en VXML <?xml version="1.0" encoding="iso-8859-1"?> <vxml xmlns="http://www.w3.org/2001/vxml" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2001/vxml http://www.w3.org/TR/voicexml20/vxml.xsd" version="2.0"> <property name="xml:lang" value="es"/> <form id="saludo"> <block> <prompt> Hola mundo! </prompt> <disconnect/> </block> </form> En http://www.vxml.org/ podemos encontrar ayuda muy util a la hora de desarrollar una aplicacion VXML, equivale a lo que sera la API en Java.

Bibliografia http://www.voicexml.org http://www.scis.ulster.ac.uk/~kevin/top_voi2.html http://www.linguatec.es/products/tts/information/technology http://web-sisop.disca.upv.es/~fsmm/projectes/2k8-2k9/VoiceXML/VoiceXMLPresentacion.pdf http://www.w3.org/TR/voicexml20/ http://www.w3.org/TR/voicexml21// http://www.voxeo.com/library/voicexml.jsp

You might also like