You are on page 1of 54

Internacionalizacin (i18n)

Pedro Valero Universidad de Valencia

Objetivos
Valorar la importancia de la internacionalizacin de las interfaces Reconocer los problemas derivados de la traduccin a otros lenguajes y los diferentes alfabetos existentes Saber cmo evaluar si el software est adecuadamente internacionalizado Conocer los recursos tcnicos sobre como internacionalizar las interfaces Conocer la internacionalizacin de las interfases Conocer los alfabetos y esquemas de codificacin

Contenidos
Introduccin Internacionalizacin y localizacin Ventajas Elementos Escritura Esquemas de codificacin Modelo de internacionalizacin y localizacin Guia tcnica

Introduccin

Software internacional

Definiciones

Es un producto que esta preparado para ser vendido en un mbito fuera de la regin o pas donde fue creado En un sentido completo es si se puede vender en todo el mundo Como veremos hay diferentes niveles de internacionalizacin

Internacionalizacin

Ventajas

Los productos se pueden colocar en el mercado mas fcilmente El mantenimiento del cdigo es ms fcil si solo hay una versin

Internacionalizacin
Internacionalizacin
Es el proceso de disear una aplicacin de tal manera que pueda adaptarse a diferentes lenguajes y regiones sin necesidad de cambiar el cdigo

Localizacin
Es el proceso de adaptar software para una regin especifica o lenguaje aadindole componentes especficos y traduciendo texto

Localizacin
Convenciones locales, la cultura y el lenguaje de una regin particular El conjunto de letras que se utilizan para escribir una lengua se dice escritura. Cada localizacin solo tiene una escritura

Beneficios
Aadiendo la localizacin el mismo ejecutable funciona en todo el mundo Los elementos textuales, como los mensajes o las etiquetas de los componentes no estn en el cdigo, estn fuera y se cogen dinmicamente Las dependencias culturales como fechas, monedas, aparecen en formatos que estn acorde con la localizacin

Elementos
Cultura Lengua hablada Colores Nmeros Unidades de medida Monedas Escritura

Elementos
Iconos Texto Audio clips Ayuda en lnea Formato de moneda, fechas y nmeros Calendarios Medidas Colores Grficos Nmeros de telfono Direcciones Ttulos honorficos

Iconos
Mullet y Sano (1995) sealan que la comunicabilidad de cualquier representacin depende de que haya un contexto compartido entre el que enva el mensaje y el que lo recibe que permita que los signos sean interpretados dentro de una lgica similar a la que fueron codificados.

Elementos

Cultura

La cultura de una regin o pais puede hacer percibir un mismo objeto de dos maneras diferentes en puntos geogrficos diferentes Ejemplos
Tan pronto como sea posible es inmediatamente en Estados Unidos y puede ser este mes en la cultura latinoamericana La mano izquierda es ofensiva en algunas culturas

Elementos

Cultura

Hay que cuidar como de dibujan hombres y mujeres juntos y como van vestidos Algunos simbolos com la esvastica, martillo y hoz, sol naciente, cruces, estrellas representan ideas politicas y relogiosas En un pais islmico puede entenderse como ofensivas cosas que en Occidente no tiene ningun significado Mover la cabeza, hacer adis con la mano, mujeroes en bikin, bebidas alcoholicas

Elementos

Colores
Tienen significado a travs de la tradicin en la mayor parte de las culturas
Occidental
Negro es un color asociado con la muerte y con funerales Blanco asociado con pureza Verde y azul fro y tranquilo Rojo, caliente y smbolo de riesgo, peligro

Oriental
Blanco asociado con la muerte Rojo casamiento

Elementos

Colores
Cada cultura tiene sus estndares, por lo que es difcil generalizar Semforo
Rojo (parar), ambar (precaucin) i verde (adelante), pero no tan solo estos los podemos asmuir de una manera generalizada

Elementos

Calendarios, formato y separadores de fecha y hora


Hay otros tipos de calendario aparte Gregoriano
Budista, el chino, hebreo, etc...

Formato calendario gregoriano


aa/mm/dd aa dos ultimos digitos del ao aaddd mm mes aaaa/nn/dd dd dia dd/mm/aa aaaa ao mm/dd/aa

Elementos

Formatos de nmeros y monedas


Para cada pas hace falta tener en cuenta el smbolo de la moneda y el formato numrico
USA $1,234,56 Noruega kr1.234,56 Suiza sFr1234,56 Alemania 1.234,56DM Euro ?

Ordenacin
Las ordenaciones son importantes en el proceso de internacionalizacin y un tema complejo En un principio las ordenaciones de caracteres son de la A a la Z, maysculas primero y despus las minsculas, los nmero de ordenan de 0 a 9 Este tipo de regla no siempre es aceptable, porque hay reglas ms complicadas cuando hay que considerar un segundo carcter al mismo tiempo

Ordenacin en castellano
Mal caracola chacal cura danza llama luna marmota Bien caracola cura chacal danza luna llama marmota

Ordenacin en castellano
En castellano por ejemplo, ch es un doble caracter, que se ha tratar como un solo caracter y se ordena despues de la c y antes de la d. La ll es un doble caracter que tamben hay que considerarlo como uno solo y se ordena despues de la l y antes de la m

Elementos especficos

Unidades de medida

La mayor parte del mundo utiliza el sistema mtrico excepto Estados Unidos Utiliza la milla, la pulgada, etc..

Zonas
Europ ea Europa, oeste, central y este, griego, ruso, turco,indonesio Arabe, Hebreo Un byte Un byte Latin, griego, Cirlico Izquierda a derecha Oriente medio Extremo oriente Arabe, Hebreo, Latin Bidireccional Horizontal y vertical

Chino tradicional, Chino simplificado, Japons, Koreano Thai

Multib yte

Kana, hangul, caracteres ideogrficos

Thai

Un byte

Thai

Izquierda a derecha

Elementos

Escrituras
Las escrituras se pueden clasificar en ideogramas y escrituras fonticas
Un ideograma tien un significado especial y no tiene relacin con su pronuciacin Las letras de una escritura fontica representan determinados sonidos, como por ejemplo M

Los tres sistemas de escritura mas importantes son:


Occidentales Oriente medio Oriente lejano

Escrituras Occidentales
Las escrituras occidentales son: Latn, griego y cirlico Las siguientes caractersticas son comunes a las tres escrituras:
Fonticas
Se leen de izquierda a derecha en una lnea horizontal Utilizan letras maysculas y minsculas diferentes Utilizan numeracin arbiga 0,1,2,3,4,5,6,7,8,9

Escrituras

Extremo Oriente
Las escrituras del oriente lejano estan basados en caracteres ideogrficos chinos Los caracteres chinos son nicos, por su sistema especial de construccin, su larga histria y su pronunciacin Su antigedad se remonta a 4000 aos y se utilizan de esta forma desde hace mas de 2000 aos Actualmente se utilizan unos cuantos miles de caracteres

Escrituras

Lejano oriente

Escrituras

Esquemas de codificacin
Cada tipo de escritura ha de ser representada en sistemas informticos Esta representacin se concreta en un esquema

de codificacin de caracteres

Estos esquemas se codifican a travs de mapas

ASCII
El mapa de carcteres ASCII consta de 128 carcteres
Los caracteres en el rango de o a 31 y el carcter 127 son especiales, tipicamente de control

Cada carcter es un indice en el mapa de caracteres, por ejemplo el nmero 65 es la letra A y el 97 la letra a El codigo ASCII de 128 caracters solo se utilizaba para el ingls
En principio con 128 caracteres habia bastante Al necesitar nuevos idiomas se empez a utilizar el resto de 128 caracteres

Tipos de esquemas de codificacin


Mapa de caracteres de un octeto (SBCS) Mapa de caracteres de doble octeto (DBCS) Unicode

Mapa de caracteres de un solo octeto (SBCS)


Son mapas de caracteres de hasta 256 caracteres (256 = 2^8). Es una extensin del cdigo ASCII, al que se han aadido 128 caracteres del 128 al 255 Se denomina mapa de caracteres extendido ISO 8859-2 Latn europa del este 8859-5 Cirilico Europa del este 8859-1 Latin Europa Oeste 8859-7 Griego 8859-3 Turco 8859-8 Hebreo 8859-6 Arabe

ISO 8859 - I Latin

ASCII ISO 8879

Mapa de carcters de doble octeto (DBCS)


Las escrituras del extremo oriente utilizan caracteres ideogrficos Necesitan un mapa de caracteres mas grande de 256 caracteres Para resolverlo se hizo el mapa de caracteres de doble octeto Notacin de 16 bits
65536 (2^16) carcters

El DBCS de un solo octeto se corresponde con el cdigo ASCII Algunos caracteres se definen como octetos de comienzo y un segundo de cdigo

Codigo KANJI

Codi KANJI
El codigo Kanji definido por el JIS (Japan Industry Standard JIS.).
El JIS nivel I contiene alrededor de 3000 de los caracteres mas normales El nivel 2 aade 3500 caracteres mas El tercer nivel se ha definido recientemente e incrementa el mapa de caracteres en mas de 6000 caracteres

JIS est basado en un formato de 7 bits que requieren secuencias de ESCAPE especiales para entrar o salir del modo DBCS.

Problemas
Duplicidad en la codificacin de caracteres Multiples cdigos de caracteres incosistentes debido al conflicto entre estndares nacionales y de la indstria El cdigo ASCII de 7 bits o el de 8 bits, estan limitados a 128 y 256 posiciones de cdigo y son inadecuados en un entorno global Internet ha aadido un punto ms a la demanda de un conjunto de caracteres nico en el mundo

Unicode
Unicode es una codificacin de caracteres de 16 bits Consensuado, participan
Apple, Borland, Digital, Hewlett-Packard, IBM, Lotus, Metaphor, Microsoft, Next, Novell, Research Libraries Group, Sun, WordPerfect, i Xerox

Se puede hacer un acceso aleatorio en los caracteres Los programas no tienen que guardar estados al analizar cadenas El codigo Unicode es nico para un carcter determinado

Unicode

Unicode

Unicode

Disposicin de smbolos i letras

Un modelo de localizacin

Recursos localizados

Cdigo de la + aplicacin

Producto localizado

Gua tcnica
En esta parte de discuten problemas generales de conversiones a diferentes versiones del lenguaje y las diferentes necesidades que se preveen para planificar la localizacin

Desarrollo
Activacin en el momento de la ejecucin o al menos en el de la compilacin

Puntos a revisar
Elementos especficos de la localizacin Convenciones en el procesamiento de texto que incluye
ordenaci, classificaci de carcters, pronunciacin, guionado, funciones de gestin de cadenas e intercambio de ficheros (Importacin y exportacin de ficheros)

Gestin de las entradas Gestin de les salidas

Traduccin del texto


Todas las lenguas tienen gramtica y sintaxis diferentes El texto traducido cambia de tamao, hay que prever que pueda crecer Ejemplo:
Mover se traduce como verschieben en alemn 5 contra 11

Organizacin de dilogos (Layout)


La organizacin de controles y elementos en una ventana ha de considerar la expansin de las etiquetas de texto En hebreo y rabe la informacin se escribe de derecha a izquierda (Hace falta invertir la presentacin ) Algunos idiomas incluyen marcas diacrticas que requieren espaci adicional

Permite un 30% de expansin

Barra de estado
La versin inglesa solo ha de ocupar el 50% de la barra de estado

Mens
Evitar mens muy densos
Lmite 80 caractere

Aceleradores coinciden con el primer carcter de una palabra

Desarrollo de codigo internacional


Documentar todos los recursos que tienen que ser localizados Es til hacer dos localizaciones en paralelo para poder evaluar la i18n Es importante dispones de herramientas y utilidades para hacer la localizacin

Bibliografa (1)
Apple Computer. Guide to Macintosh Software Localization. (1992) Fernandez Tony. Global Interface Design: A Guide to Designing International User Interfaces. Boston A.P Professional (1995) Galdo del. Eliza, Jakob Nielsen.International User Interfaces. John Wiley & Sons. (1996) Kano Nadine, Microsoft Corporation.Developing International Software for Windows 95 and Windows NT. W.A Microsoft Press. (1995) Martin O'Donnell Sandra. Programming for the World: A guide to Internationalization. Prentice-Hall(1994)

Bibliografa (2)
Microsoft Press . The GUI Guide. International Terminology for the Windows Interface. Microsoft.(1993) Uren Emmanuel, et al . Software Internationalization and localization. Van Nostrand Reinhold.(1993) Addison and Wesley. The Unicode Standard; Worldwide Character Encoding Volume I i II (ISBN 0-201-56788-1 and ISBN 0-201-608456). Unicode Consortium . The Unicode Standard. (1991) Prespectives on Design and Internationalization. SIGCHI Bulletin Vol 28. Enero 1996.

Enlaces
Internacionalitzaci i Localitzaci: Internationalization (Tutorial) Internationalization FAQ Internationalization of User Interfaces. Windows Interface Guidelines: Internationalization W3C Internationalization and Localization. Unicode: Unicode Home Page Java Tools: International classes for Unicode ASCII: ASCII-ISO8859 Java: Java Internationalization.

Conclusiones
La globalizacin de la economia es una realidad Esta presentacin pretende ser una puerta de entrada a la internacionalizacin La internacionalizacin de interfases es una necesidad que hay que tener en cuenta al principio

You might also like