Professional Documents
Culture Documents
XML
Bevezetés
XML (Extensible Markup Language – Kiterjesztett Jelölő Nyelv) a World Wide Web
Consortium (W3C) által kifejlesztett megjelenítési és dokumentumtárolási formátum.
Egy XML alapú dokumentum logikai szerkezete elemekből áll : Fejezet, bekezdés, táblázat.
A fizikai szerkezet részeit egyedeknek hívjuk, akár külön állományokban is lehetnek.
A logikai szerkezetnek meg kell felelnie bizonyos megkötéseknek, amelyet értelmező
ellenőriz. A több egyedből áló dokumentumot az ellnerzős előtt fel kell építeni, ez az
egyedkezelő feladat. A mindkét feladatra alkalmas szoftvert a szabvány XML
feldolgozóknak nevezi, néha az értelmező is ilyen értelemben használt.
Az XML köztes nyelv, azaz más nyelvek leírását tartalmazza. Nincs elöre definiált elemlista,
tetszöleges, beszédes nevek alkalmazhatóak. A DTD (Document Type Definition) lehetőséget
nyújt egy adott dokumentum típusban felhasználható elemek meghatározására.
Jelölőelemek
Stag: ‘<’, ‘<’ Etag: ‘>’, ‘>’
‘<’ … ‘>’; ‘</’ … ‘>’;
Jellemzők - Attributes
Név
Érték - AttValue
Fenntartott
Xml:space “preserve” “default”
Xml:lang “en” “en-US” “en-GB” ISO639 ország, IANA kód
jellemzőtípus
Jelölésdeklaráció
<! … >
beágyazott jelölésdeklaráció
<! … [
<! … >
<! … >
]>
Megjegyzés
<!-- … -->
Dokumentumtípus
<!DOCTYPE … >
Karakteradat
<![CDATA[
<! … >
<! … >
]>
Feldolgozási utasítás
<? … ?>
XML deklaráció
<?XML version=”1.0” encoding=”UTF.8” standalone=”YES” ?>
Fizikai felépítés
Az XML dokumentum több adatfile-ra – egyedre – bontható. Az egyed deklaráció a
dokumentum elején definiálja az egyedet, melyet több helyen hivatkozhatunk
(egyedhivatkozás).
Egyed
Az egyed közvetve vagy közvetetten sem hivatkozhat önmagára.
Az egyedeket osztályozhatjuk típus szerint: XML és nem XML dokumentumok; valamint
tárolás szerint: belső és külső egyed.
Az XML adatot tartalmazó egyedet értelmezett egyed; amely helyettesítő szöveget
tartalmaz, azaz tartalma helyettesíti a hivatkozást.
Egyedmeghatározás
Deklarációval hívjuk létre az egyedeket, az első hivatkozás előtt dokumentumdeklarációval
(doctypedecl) egyed deklaráció (GEDecl vagy PEDecl) segítségével.
Lehetséges egy egyedet egynél többször definiálni, ilyenkor az első érvényes.
<!DOCTYPE név … [
<!ENTITY … >
]>
Dokumentum egyed
<!ENTITY … >
hivatkozás
&név; pl. &XML;
Beépített egyedek
Minden XML-feldolgozóprogramban létezik egy beépített egyed deklaráció készlet. A
dokumentum szerzőinek ezeket kell használni a tényleges karakterek helyett:
< <
> >
& &
‘ '
“ "
Karakter egyedek
A karakter egyedekre ugyanúgy hivatkozunk, mint szöveg egyedre, csak ‘#’ szerepel
közvetlenül az ‘&’ után. Egy decimális vagy hexadecimális szám azonosítja a szükséges
karaktert.
&#szám < 0-255 között ASCII (ISO 8859-1)
256-65535 között Unicode (ISO 10646)
&#xszám hexa-ban adott szám
DTD
Paraméter egyed
<!ENTITY % “ … “ >
hivatkozás %név
Külső szöveg
<!ENTITY név SYSTEM “URL szabvány” >