You are on page 1of 9

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los

lenguajes de marcas.

UNIDAD 1 Reconocimiento de las caractersticas de los lenguajes de marcas Concepto de lenguaje de marcas.Las personas utilizamos en nuestro lenguaje hablado ciertos gestos, diferente entonacin, pausas, etc. que acompaan al contenido que queremos transmitir. De modo parecido en el lenguaje escrito utilizamos tamaos de letra, negrita, numeracin, vietas, tablas, colores, etc. que tambin acompaan a la informacin para que sea ms fcil de entender. En definitiva estamos aplicando un determinado formato a la informacin que transmitimos. En el caso de los documentos que intercambiamos a travs de Internet, como las pginas web, son los lenguajes de marcas quienes nos permiten aplicar dicho formato . Un documento que contenga exclusivamente texto es perfectamente legible por nosotros, aunque evidentemente, tedioso e inapropiado para publicar pginas web. Si le aplicamos formato mediante un lenguaje de marcas como por ejemplo HTML, obtenemos un archivo tambin legible pero ms difcil de interpretar. De esta tarea se encargar el navegador o mejor dicho el agente de usuario , quien interpreta las marcas de formato y las aplica convenientemente al texto para dar lugar a una pgina web, que ser mucho ms agradable de leer que el texto original. Una marca es una seal colocada dentro de un texto, con el fin de delimitar una parte del mismo y en muchos casos, aplicarle un determinado formato (aunque existen marcas con otros propsitos). Las marcas ms comunes estn formadas por una palabra que describe su funcin encerrada entre los smbolos menor que (<) y mayor que (>) como <html>. Los lenguajes de marcas no son equivalentes a los lenguajes de programacin aunque se llamen tambin lenguajes . De hecho, no debemos utilizar la palabra programa cuando nos referimos a lenguajes de marcas, puesto que no disponen de los elementos tpicos como variables, arrays, sentencias de control, funciones, etc. Sin embargo, los lenguajes de marcas se pueden combinar dentro del mismo documento, con otros lenguajes como JavaScript o PHP, que s son lenguajes de programacin, con el objetivo de aportar funcionalidad y dinamismo a la pgina web. Otro aspecto importante a tener en cuenta cuando hablamos de lenguajes de marcas es el destinatario de la informacin. Quizs lo ms habitual, es un usuario final utilizando un navegador web en el PC de su casa, pero tenemos que considerar el resto de opciones que van en aumento, otros destinatarios podran ser: usuarios en dispositivos mviles, usuarios con deficiencias visuales o motrices, usuarios de avanzada edad, un perifrico

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

como la impresora, los robots de los buscadores, etc. Por esta razn, es ms correcto utilizar el trmino general agente de usuario (user-agent) en lugar de navegador. La presentacin de la misma pgina web para cada uno de estos usuarios debe ser lgicamente muy distinta, as por ejemplo, un texto en negrita puede representarse respectivamente, por caracteres con mayor grosor, por un volumen ms alto en el sintetizador de voz, por ms puntos en el papel, etc. La cuestin es que el lenguaje de marcas debe ser independiente del destinatario final, es el intrprete del lenguaje quien se encarga de representar las marcas de la forma adecuada. HTML por ejemplo, no especifica en sus etiquetas cmo sern representadas ms tarde por el navegador. Esta es una de las razones por la que podemos encontrar ciertas diferencias en la visualizacin de una misma pgina, por parte de diferentes navegadores. Por otro lado, para independizar an ms la representacin de la pgina web de su contenido, se cre CSS, que no es un lenguaje de marcas sino de estilos. Mediante CSS podemos especificar con mayor precisin y eficacia la representacin de la informacin, para cada intrprete y para diferentes soportes, como monitores, dispositivos mviles, papel, voz, etc. Dado el auge de los dispositivos mviles, muchas pginas presentan diferentes versiones adaptadas al dispositivo que utilice el usuario, en este caso, se trata de documentos html diferentes o bien del mismo documento html, pero aplicndole una hoja de estilos distinta.

Actividad:
Visita la web http://www.w3c.es, utiliza las vistas de la parte superior de la pgina e indica las diferencias que observes entre escritorio, mvil e impresora. Descarga el complemento User Agent Switcher o similar para Firefox, modifica el agente de usuario y comprueba cmo cambia el aspecto de un sitio que est configurado para dispositivos mviles.

SGML. El origen.En los aos 60 las empresas de publicacin y manejo de documentos electrnicos tenan el problema de falta de compatibilidad entre aplicaciones. El problema existente era que cada aplicacin utilizaba sus propias marcas para describir los diferentes elementos, esto impeda el intercambio de documento entre plataformas. Otra carencia importante era la separacin entre estructura y aspecto del documento. IBM, empresa pionera en investigacin en informtica e electrnica (ms de 5.000 patentes en 100 aos de historias) intent resolver estos problemas a travs de un lenguaje de marcas denominado GML (Generalizad Markup Lenguaje). GML independiza el documento del dispositivo que lo va a utilizar, usando marcas genricas. Por otro lado GML incorpora marcas descriptivas para la estructura del documento que permiten distinguir el texto, de las listas, las tablas, etc. El mismo

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

documento puede, entonces, ser utilizado por varios dispositivos, simplemente especificando un perfil para cada uno. En 1986 GML pas a manos de ISO y se convirti en SGML (ISO 8879), Standard Generalizad Markup Lenguaje, software libre y de cdigo abierto. Es importante tener en cuenta que SGML no es estrictamente un lenguaje sino un metalenguaje, es decir, un conjunto de normas que permiten crear otros lenguajes de marcas. Esto se hace definiendo un vocabulario o conjunto de elementos a utilizar, y una gramtica o conjunto de reglas que rigen el uso de los elementos y sus atributos. SGML, por tanto, es un metalenguaje que permite definir lenguaje de marcado HTML por ejemplo, es uno de los lenguajes creados a partir de SGML . Ventajas de SGML: Reutilizacin de los datos, integridad y control sobre los datos, portabilidad, adaptabilidad. Inconvenientes de SGML: Alta complejidad. Un documento SGML consta de 2 partes: El prologo: contiene la estructura. - La declaracin: indica que el documento es SGML y algunos parmetros. - La definicin de tipo de documento (DTD) : indica la sintaxis particular del lenguaje creado. La instancia de documento: contiene los datos.

Caractersticas de los lenguajes de marcas.TEXTO PLANO Los archivos de texto plano son aquellos que estn compuestos nicamente por caracteres de texto, a diferencia de los archivos binarios que pueden contener imgenes, sonido, archivos comprimidos, programas compilados, etc . Estos caracteres se pueden codificar con distintos cdigos dependiendo del idioma o alfabeto que se necesite, por ejemplo: ASCII, ISO-8859-15, UTF-8. Una de las principales ventajas de los archivos de texto plano es que pueden ser interpretados directamente por un simple editor de texto, a diferencia de los binarios que necesitan software especfico (visores multimedia, descomprensores, compiladores, etc.). Esta caracterstica hace que los documentos sean independientes del sistema operativo o programa con el que fueron creados, esto facilita la interoperabilidad, que constituye una importante ventaja para el intercambio de informacin en Internet. COMPACIDAD Las instrucciones de marcado se mezclan con el propio contenido , por ejemplo, <h2>Contenido</h2>. 3

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

El cdigo entre corchetes como <h2>, son instrucciones de marcado, tambin llamadas etiquetas. Esta etiqueta en concreto es una etiqueta de presentacin, indica que el texto comprendido debe tener el formato asignado a la cabecera n 2. El texto entre las marcas es el propio contenido del documento. INDEPENDENCIA DEL DISPOSITIVO FINAL El mismo documento puede ser interpretado de diferentes formas dependiendo del dispositivo final, as tendremos diferentes resultados si se usa un dispositivo mvil, un ordenador de sobremesa o una impresora. ESPECIALIZACIN Inicialmente los lenguajes de marcas se idearon para visualizar documentos de texto, pero progresivamente se han empezado a utilizar en muchas otras reas como grficos vectoriales, sindicacin de contenidos, notacin cientfica, interfaces de usuarios, sntesis de voz, etc. FLEXIBILIDAD Los lenguajes de marcas se pueden combinar en el mismo archivo con otros lenguajes como HTML con PHP y JavaScript. Incluso hay etiquetas especficas para ello como es <script>. XML ha permitido que se puedan combinar varios lenguajes de marcas diferentes en un mismo archivo, como es el caso de XHTML con MathML y SVG.

Clasificacin de los lenguajes de marcas.Normalmente los lenguajes de marcas se suelen clasificar en tres tipos, atendiendo al tipo de marcas que utilizan: De presentacin: Indican el formato del texto o tipografa, sin especificar su estructura , por ejemplo aumentar el tamao de la fuente, centrar o cambiar a negrita. Esta categora incluye los lenguajes de procedimiento que agrupan a varias marcas de presentacin en una macro. Por ejemplo, para fomentar un ttulo, debe haber una serie de directivas inmediatamente antes del texto indicando: tamao de letra 16p, fuente Arial, negrita. Justo despus del ttulo debe haber etiqueta inversas que anulen en formato, para continuar con el texto normal. El software que representa el documento debe interpretar el cdigo en el mismo orden en que aparece. Los procesadores de texto y en general las aplicaciones de edicin profesional utilizan este tipo de marcado. 4

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

Descriptivo, estructural o semntico: Indican las diferentes partes en las que se estructura el documento, pero sin especificar cmo deben representarse ni en qu orden . XML es un metalenguaje expresamente diseado para generar marcado descriptivo y los lenguajes derivados de XML con este propsito son: EBML, RDF, XFML, OWL y XTM. Aunque XML almacena informacin de todo tipo, los dems tienen contenido especfico. Estos lenguajes crean documentos con estructura en rbol que almacenan informacin, por eso son bases de datos, sin embargo no usan tablas ni respetan las reglas de integridad propias de las BD Relacionales, por ello se les llama bases de datos semiestructuradas. Hibrido: Lenguajes que contienen marcas de los dos tipos anteriores indistintamente. Ejemplos: HTML (derivado de SGML); XHTML, WML (derivados de XML). Una clasificacin de lenguajes de marcas atendiendo a su funcionalidad:

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

Organizaciones y estndares.-

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

Actividades:
1. Visita la pgina del W3C, http://www.w3c.es/ y consulta la especificacin HTML 4.0.1. 2. Averigua el estado de las publicaciones sobre HTML 5. 3. Consulta los objetivos del W3C. 4. Consulta el listado de miembros espaoles.

Introduccin a los principales lenguajes de marcas.El origen de los lenguajes de marcas como ya sabemos es SGML, del cual se derivan directamente algunos lenguajes como HTML. Tambin se cre a partir de l por simplificacin XML, otro metalenguaje ms fcil de usar y entender. A partir de XML se han creado muchos lenguajes como XHTML, RSS y un largo etc. HTML HTML es un lenguaje destinado a la creacin de pginas web, que nos permite mezclar en un mismo documento, texto y contenido multimedia. Adems dispone de una potente herramienta que son los enlaces o hipervnculos, para conectar con otras pginas cuyo contenido est relacionado la pgina actual. Esto supone una ventaja importante frente a los documentos impresos (libros, revistas, etc.). 7

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

Mdulo: LENGUAJES DE MARCAS Y SISTEMAS DE GESTIN DE INFORMACIN // Grupos: DW1 y ASR1 // Curso: 1 Unidad 1: Reconocimiento de las caractersticas de los lenguajes de marcas.

XML Es una simplificacin y adaptacin de SGML que permite definir lenguajes especficos. Por lo tanto, XML no es un lenguaje en particular, sino una manera de definir lenguajes para diferentes necesidades, es decir, lo que hemos llamado un metalenguaje. Para describir la relacin con SGML a menudo se utiliza la regla 80/20: 80% de funcionalidad y 20% de complejidad. Algunos de los lenguajes que se basan en XML para su definicin son XHTML, SVG, MathML, RSS, etc. Como caractersticas podemos citar: Extensible: se pueden definir nuevas etiquetas. Verstil: separa contenido, estructura y presentacin. Estructurado: se pueden modelar datos a cualquier nivel de complejidad. Validable: cada documento se pude validar frente a un DTD/Schema. Abierto: independiente de empresas, sistemas operativos, lenguajes programacin o entorno de desarrollo. Sencillo: fcil de aprender y de usar.

de

XML no se utiliza solo en Internet, sino que se est convirtiendo en un estndar para el intercambio de informacin estructurada entre diferentes plataformas. Se puede usar en bases de datos ligeras, editores de texto, hojas de clculo, transacciones comerciales y en general donde se necesite almacenar informacin sin las restricciones de un SGBD Relacional.