Professional Documents
Culture Documents
Introducci a XML
Llenguatges de marques
Un llenguatge de marques combina dades i etiquetes que les marquen i que contenen informaci addicional sobre l'estructura del text o la seua presentaci. Les marques estan barrejades amb el propi text.
<persona> <nom> Xavier </nom> <cognom> Sala </cognom> </persona>
Administraci de Sistemes Informtics i Xarxes
Llenguatges de marques
Tot i que els sistemes de marques en que ens concentrarem sn els d'estil web cal no oblidar que n'hi ha d'altres:
Llenguatges de marques
SGML
La primera tecnologia estandarditzada de llenguatges de marques va ser lSGML Es va fer servir com estndard de la informaci de propsit general Partia de la idea de que s'han de separar les dades d'un document de la seva forma Per:
La majoria dels documents estaven destinats a la impressi Era terriblement complex de manera que noms el feien servir els especialistes
HTML
El 1989, Tim Berners-Lee i Anders Berglund, dos investigadors del CERT, van crear un llenguatge basat en etiquetes destinat a compartir informaci per Internet: HTML
Tecnologia web
HTML ha tingut un xit extraordinari i molt rpid
Aix ha fet que les tecnologies web no parin d'evolucionar HTML ha sofert molts canvis al llarg dels anys El suport HTML dels navegadors cada vegada s ms complexe
Tecnologia web
Tecnologia Web
Cada dia es generen milions de pgines web amb informaci Aix implica que cal buscar per trobar la informaci que ens interessa
Tecnologies web
Tecnologia web
Feia falta una forma de:
Naixement d'XML
El consorci W3C va desenvolupar una alternativa a lHTML que pods satisfer les necessitats futures del web. El 1996 el consorci W3C es va proposar introduir el poder i la flexibilitat de lSGML al web. SGML oferia tres avantatges que lHTML no tenia:
Especificacions XML
http://www.w3.org/TR/2004/REC-xml-20040204/
http://www.w3.org/TR/xml11/
Qu s XML?
XML s un format de text estandarditzat que serveix per representar i transportar informaci estructurada.
Presentaci
XML no es preocupa de com es presentaran les dades als usuaris Per fer la presentaci ja s'han desenvolupat mecanismes:
Etiquetes
A HTML li ha anat b amb un nmero finit d'etiquetes Per tots els intents per crear un conjunt finit d'etiquetes van fallar
Estructuraci de dades
Fitxers binaris
Els fitxers binaris sn simplement una tira de bits La informaci que contenen noms la entenen els programes que l'han generat
Per aix els fitxers binaris noms es poden llegir amb els programes que els han creat
Els fitxers binaris estan molt b perqu sn llegits fcilment pels ordinadors
Fitxers binaris
A vegades els fitxers binaris contenen informaci sobre el seu contingut per diferents motius
2B2N3B1N2B1N2B1N2B1N2B4N2 B1N2B1N2B1N2B1N1B
Fitxers de text
Els fitxers de text tamb sn tires de bits per estan agrupats de forma estandarditzada
Grcies a l'estndard aquests fitxers es poden obrir en diferents programes La informaci es comparteix ms fcilment amb fitxers de text que amb fitxers binaris
Fitxers de text
Els sistemes operatius tracten de forma diferent alguns dels seus aspectes (com els salts de lnia) s complicat afegir-hi informaci sobre les dades, metadades, ja que no seran interpretades
Poden arrunar-ne totalment la facilitat de lectura No existeix una forma estndard d'afegir-les
Fitxers de text
Antigament per representar dades es feia separant els valors amb comes o algun altre smbol
Nom,Cognom,Ofici,Naixement,Poblacio,Punts Filomenu,Garcia,Professor, 10/04/1902,Cabanes,12 Mariano,Puigdevall,Informtic,19/05/1972,Cabanes,23 Federicu, Pi, Mestre,20/03/1968,Girona,40
S'ha de saber que la primera lnia sn metadades Afegir-hi noves dades pot ser molt problemtic pel programa que les llegeixi
Fitxers de marques
Poden ser creats amb qualsevol editor de textos Per no estan pensats per ser llegits
Administraci de Sistemes Informtics i Xarxes
Transport de dades
A diferncia d'HTML si que es pot determinar de forma automtica qu signifiquen les dades
<professors> <professor> <nom>Federicu</nom> <cognom>Pi</cognom> </professor> <professor> <nom>Mariano</nom> <cognom>Po</cognom> </professor> </professors>
Podem respondre:
Formats Estndards
No necessita llicncia Al fer servir el mateix format la comunicaci de dades s ms fcil Ja hi ha vocabularis estndards XML:
Pensat per grfics vectorials escalables 2D Representaci de frmules matemtiques Intercanvi d'informaci qumica Tractament de la informaci multimdia Sntesi de la veu
Administraci de Sistemes Informtics i Xarxes
SVG
Formats estndard
Molts programes que feien servir formats binaris han passat a algun tipus d'XML:
Microsoft Office
Va passar de guardar els documents en binari .DOC a XML .DOCX (OOXML) al estandaritzar-lo
OpenOffice.org
Extensible
Creem els tags que tinguin significat per nosaltres Podem crear el vocabulari que ens faci falta per all que busquem
Hi ha diversos estndards DTD, XML Schema Language, Relax NG, etc.. Ens serviran per comprovar que el document compleix amb les normes del vocabulari
Administraci de Sistemes Informtics i Xarxes
Perqu es fa servir?
Un dels estndards que es fan servir en pgines web XHTML est basat en XML Per XML de forma inherent t mltiples formes en que pot ser representat (XSL-FO, CSS, ...) L'intercanvi de dades entre sistemes diferents que permetin les crides entre objectes entre mquines Bussines to Bussines, Bussines to Consumer
Computaci distribuda
Comer electrnic
Problemes
XML ocupa ms espai a disc que els seus equivalents en format binari
Hi ha tendncia a crear fitxers molt grans Aix pot tenir un impacte en el rendiment dels programes