You are on page 1of 4

XML Kántor Csaba

XML

Bevezetés
XML (Extensible Markup Language – Kiterjesztett Jelölő Nyelv) a World Wide Web
Consortium (W3C) által kifejlesztett megjelenítési és dokumentumtárolási formátum.
Egy XML alapú dokumentum logikai szerkezete elemekből áll : Fejezet, bekezdés, táblázat.
A fizikai szerkezet részeit egyedeknek hívjuk, akár külön állományokban is lehetnek.
A logikai szerkezetnek meg kell felelnie bizonyos megkötéseknek, amelyet értelmező
ellenőriz. A több egyedből áló dokumentumot az ellnerzős előtt fel kell építeni, ez az
egyedkezelő feladat. A mindkét feladatra alkalmas szoftvert a szabvány XML
feldolgozóknak nevezi, néha az értelmező is ilyen értelemben használt.
Az XML köztes nyelv, azaz más nyelvek leírását tartalmazza. Nincs elöre definiált elemlista,
tetszöleges, beszédes nevek alkalmazhatóak. A DTD (Document Type Definition) lehetőséget
nyújt egy adott dokumentum típusban felhasználható elemek meghatározására.

Jelölőelemek
Stag: ‘<’, ‘&lt;’ Etag: ‘>’, ‘&gt;’
‘<’ … ‘>’; ‘</’ … ‘>’;

Jellemzők - Attributes
Név
Érték - AttValue

Fenntartott
Xml:space “preserve” “default”
Xml:lang “en” “en-US” “en-GB” ISO639 ország, IANA kód

jellemzőtípus

Jelölésdeklaráció
<! … >

beágyazott jelölésdeklaráció
<! … [
<! … >
<! … >
]>

22.07.30 11:41 XML.doc 1/4


XML Kántor Csaba

Megjegyzés
<!-- … -->

Dokumentumtípus
<!DOCTYPE … >

Karakteradat
<![CDATA[
<! … >
<! … >
]>

Feldolgozási utasítás
<? … ?>

XML deklaráció
<?XML version=”1.0” encoding=”UTF.8” standalone=”YES” ?>

Fizikai felépítés
Az XML dokumentum több adatfile-ra – egyedre – bontható. Az egyed deklaráció a
dokumentum elején definiálja az egyedet, melyet több helyen hivatkozhatunk
(egyedhivatkozás).

Egyed
Az egyed közvetve vagy közvetetten sem hivatkozhat önmagára.
Az egyedeket osztályozhatjuk típus szerint: XML és nem XML dokumentumok; valamint
tárolás szerint: belső és külső egyed.
Az XML adatot tartalmazó egyedet értelmezett egyed; amely helyettesítő szöveget
tartalmaz, azaz tartalma helyettesíti a hivatkozást.

Egyedmeghatározás
Deklarációval hívjuk létre az egyedeket, az első hivatkozás előtt dokumentumdeklarációval
(doctypedecl) egyed deklaráció (GEDecl vagy PEDecl) segítségével.
Lehetséges egy egyedet egynél többször definiálni, ilyenkor az első érvényes.
<!DOCTYPE név … [
<!ENTITY … >
]>

Belső szöveg egyed


Lehetővé teszi többször elöforduló kifejezés, szövegrész definiálását. A helyettesítő szöveg
neve után idézőjelek között áll. Aposztróf és idézőjel is használható hatoroló karakter.
<!ENTITY XML “eXtensibleMarkup Language”>

22.07.30 11:41 XML.doc 2/4


XML Kántor Csaba

A hivatkozásban ‘&’ (and) karakte a kezdő határoló és a ‘;’ (pontosvessző a záró:


Az &XML; formátum egyedeket tartalmaz.

Külső szöveg egyed


Fájl mérete nem korlátozott.
Gyakran használt ISO szabványú deklarációk:
• ISOnum jelek
• ISOlat1 ékezetes nyuhat –európai betűk
• ISOgrk görög betűk
• ISOpub szövegformázó jelek
• ISOtech műszaki jelek

Külső bináris egyed


Bináris egyed csak külső lehet, hiszen jelei zavarhatnák a feldolgozó programot.

Általános egyed
A dokumentumon belül hivatkozunk rá; így elérhető a dokumentum szerzők számára.

Paraméter egyed
Csak jelölőelemek deklarációján belül hivatkozhatunk rájuk; ezért általában csak DTD
tervezők rendelkezésére áll.
Az entity kulcsszó után százalékjellel kezdődik.
<!ENTITY % EgyEgyed “(para | list)”>

A hivatkozásban az általános egyedtől való megkülönböztetés érdekében ‘%’ jelet kell


használni ‘&’ helyett.
%EgyEgyed;

Dokumentum egyed
<!ENTITY … >

belső szöveg egyed


<!ENTITY XML “…” >

hivatkozás
&név; pl. &XML;

Beépített egyedek
Minden XML-feldolgozóprogramban létezik egy beépített egyed deklaráció készlet. A
dokumentum szerzőinek ezeket kell használni a tényleges karakterek helyett:
< &lt;
> &gt;
& &amp;

22.07.30 11:41 XML.doc 3/4


XML Kántor Csaba

‘ &apos;
“ &quot;

Karakter egyedek
A karakter egyedekre ugyanúgy hivatkozunk, mint szöveg egyedre, csak ‘#’ szerepel
közvetlenül az ‘&’ után. Egy decimális vagy hexadecimális szám azonosítja a szükséges
karaktert.
&#szám &#60 0-255 között ASCII (ISO 8859-1)
256-65535 között Unicode (ISO 10646)
&#xszám hexa-ban adott szám

DTD

Paraméter egyed
<!ENTITY % “ … “ >

hivatkozás %név

Külső szöveg
<!ENTITY név SYSTEM “URL szabvány” >

22.07.30 11:41 XML.doc 4/4

You might also like