Professional Documents
Culture Documents
A HUNMARC FORMÁTUM
A HUNMARC mint a bibliográfiai rekordok adatcsere formátuma a nemzeti MARC
formátumok rendszeréhez csatlakozik.
A rekordok szerkezete a szabvány (MSZ ISO 2709:1997) által megadott keretekben, a hazai
bibliográfiai adatcsere szabályozása érdekében határozza meg a bibliográfiai adatok
tartalomjelölőit (a bibliográfiai tételekben szereplő kötelező központozást is helyettesítő
minősítők: hívójelek, indikátorok, almezőazonosítók) és egyéb jellemzőit. A mágneses
adathordozón megvalósuló adatcserében résztvevő adatok közlésmódjára a vonatkozó MSZ
könyvtári szabványok előírásai az irányadók. A HUNMARC formátum három elemből áll,
ezek mindegyike szabványosított vagy szabványosítást igényel: rekordszerkezet,
tartalomjelölők, adattartalom.
A rekordszerkezet: a géppel olvasható rekordok fizikai megjelenítése. A bibliográfiai
adatokat tartalmazó rekordok szerkezetét a már hivatkozott MSZ ISO 2709:1997-es szabvány
határozza meg. Eszerint minden cserére szánt rekordnak tartalmaznia kell a rekordfejet
(record label), amely a rekord szerkezetével kapcsolatos; a mutatót, amelynek egy-egy tétele
1
három részből áll (a mező hívójele, a mezőben található karakterek száma, a mező első
karakterének a rekordon belüli pozíciója); a változó hosszúságú adatmezőket. Az adatmezők
indikátorokat, almezőazonosítókat és adatelemeket tartalmaznak.
A tartalomjelölők meghatározzák a hívójeleket, az indikátorokat, az almezőazonosítókat,
illetve ezek értékeit, amelyek az adatelemeket azonosítják. A jegyzet alapvetően e
tartalomjelölőket veszi sorra a HUNMARC kézikönyv 2002-es kiadása alapján, csak a
könyvdokumentumokra vonatkozóan.
Az adattartalom tekintetében az MSZ szabványok, szabályzatok, útmutatók a meghatározók
(a bibliográfiai leírás szabványa, a besorolási adatok egységesítésére vonatkozó szabványok,
az országnevek, nyelvek kódjai, ETO stb.)
A DUBLIN CORE
A Dublin Core Metadata Initiative (DCMI = Dublin Core Metaadat Kezdeményezés)
Igazgatósága az OCLC Kutatási és Speciális Projekt Irodája keretében működik, amely a
szabályzat gondozásáért felelős. (URL: http://dublincore.org/).
A szabvány előszava leírja annak eredetét, amely 1995-re nyúlik vissza, amikor is
könyvtárosok, elektronikus források szakértői, tartalom-szolgáltatók gyűltek össze, hogy
megállapodjanak egy könnyen érthető és alkalmazható forrás-leíró szabályzatban bármely
tudományág területén. A Dublin Core-nak (a továbbiakban: DC) egyszerre vannak erősségei
és gyenge pontjai. A metaadatok létrehozásának egyszerűsége csökkenti a költségeket és
elősegíti az együttműködést, de nem jelent megoldást minden jelentésbeli és funkcionális
követelmény kielégítésére. Ugyanakkor mindezekkel kiegészíthető és összeegyeztethető, azaz
kiinduló alapként szolgál a teljesebb körű leírások elkészítéséhez. A metaadat elemek
beilleszthetők a MARC formátumú rekordokba. A DC HTML-ben és XML-ben egyaránt
címkézhető 15 adatelemet tartalmaz. Az elemek mindegyike szabadon válaszható és
ismételhető, sorrendjük nem meghatározott, de az általános érthetőség céljából kötött
szókészlet alkalmazása szükséges. Az elemek jelentését minősítőkkel lehet finomítani.
A Dublin Core legfontosabb jellemzői:
egyszerű – a leíró rekordokat könnyű létrehozni és karbantartani
érthető – az egyes elemek jelentése nem szorul magyarázatra
bővíthető – együtt használható más készletek metaadat-elemeivel
nemzetközi
A 15 adatelem a következő:
1. Cím (Title) A dokumentumban szereplő szó, kifejezés vagy egyéb jelcsoport, amely a
dokumentum megnevezésére szolgál. Kitüntetett szerepe van a főcímnek, illetve az
egységesített címnek, amelyek nem ismételhetők. Valamennyi további cím ismételhető (pl.
alcím, párhuzamos cím, címváltozat). Kötelező, ismételhető adatelem.
2. Téma (Subject) A dokumentum tartalmát leíró tárgyszavak, illetve kifejezések vagy osztá-
lyozási jelzetek. A dokumentum tartalmát leíró kulcsszavak, kifejezések vagy osztályozási
jelzetek. Ajánlatos előírt tárgyszójegyzék (tezaurusz) vagy hivatalos (szabványos)
osztályozási rendszer (pl. az ETO) használata. Kötelező, ismételhető adatelem.
3. Kiadó (Publisher) Az a természetes vagy jogi személy, vagy jogi személyiséggel nem
rendelkező gazdasági társaság, aki/amely anyagi és/vagy irányítási, igazgatási felelősséget
vállal a dokumentum nyilvánossághoz közvetítéséért. A dokumentum kiadójának a neve.
Kötelező, ismételhető adatelem.
4. Dátum (Date) A dokumentumhoz kapcsolódó események dátuma. A dokumentum létre-
hozásával, nyilvánossághoz közvetítésével kapcsolatos időpont. Megadása az ISO 8601
előírásai szerint ajánlatos. Kötelező, ismételhető adatelem.
5. Típus (Type) A dokumentum típusát, műfaját, általánosabb sajátosságait jelölő kifejezés.
Általános kifejezés, amely a funkciót, dokumentumtípust, a gyűjteményes forráson belüli
2
szintet nevezi meg. A dokumentum fizikai (digitális) megjelenítésének megnevezését a „For-
mátum” adatelemben kell megadni. Ajánlatos egységes kifejezések (kódszótár) használata.
Kötelező, ismételhető adatelem.
6. Formátum (Format) A dokumentum megjelenésének formája és megjelenítésének módja,
eszköze. A dokumentum megjelenésének (manifesztációjának) megnevezése. Ide tartozik: a
médium, adathordozó fajtája és terjedelme (mérete), a hozzáférés módja, a működési követel-
mények (szoftver, hardver vagy egyéb, a dokumentum használatához szükséges eszközök, az
elérés lejárati ideje). Ajánlatos egységes kifejezések (kódszótár) használata. Kötelező,
ismételhető adatelem.
7. Azonosító (Identifier) A dokumentumot egyértelműen azonosító kód. Ajánlatos a doku-
mentum azonosítása hivatalosan elismert kóddal, amilyen többek között az Egységes Forrás
Azonosító (URI=Uniform Resource Identifier), a Digitális Objektum Azonosító (DOI=Digital
Object Identifier), a Könyvek Nemzetközi Szabványos Azonosító Száma (ISBN=International
Standard Book Number). Ezek hiányában egyéb azonosító(ka)t (pl. leltári szám, raktári jelzet
és egyéb nyilvántartási szám/jelzet) kell megadni. Kötelező, ismételhető adatelem.
8. Létrehozó (Creator) Az a természetes vagy jogi személy vagy jogi személyiséggel nem ren-
delkező gazdasági társaság, aki/amely a dokumentum vagy annak fő része szellemi tartalmának
alkotója, aki/amely e tartalomért elsősorban felelős. A szellemi (szakmai, tudományos, irodalmi,
művészi stb.) tartalom létrehozójának a neve. Feltételesen kötelező, ismételhető adatelem.
9. Forrás (Source) Hivatkozás a leírt dokumentum forrásául szolgáló dokumentumra. A leírt
dokumentum részben vagy egészben származhat egy másik dokumentumból. A hivatkozásban
ajánlatos megadni a forrás hivatalos azonosítóját. Feltételesen kötelező, ismételhető adatelem.
10. Nyelv (Language) A dokumentumban előforduló szövegek nyelve. A nyelvkód az ISO
639 háromjegyű azonosító kódja. Megfelelője magyarországi használatra az MSZ 3400-2001.
Feltételesen kötelező, ismételhető adatelem.
11. Jogok (Rights) Adatok a dokumentum felhasználásával kapcsolatos jogokról és a
hungarikum fajtájáról (területi, személyi, nyelvi, tartalmi). Jogkezelésre vonatkozó adatok,
amelyek kiterjedhetnek a szellemi, szerzői és különböző tulajdonosi jogokra. Ha a jogtulaj-
donos(ok)ra való adatelem hiányzik, feltehetően a forrásra nem vonatkozik ilyen adat. A
hungarikum minősítést kóddal kell jelölni. Feltételesen kötelező, ismételhető adatelem.
12. Tartalmi leírás (Description) A dokumentum tartalmának összegző leírása. Szabad
szöveges összefoglalás, kivonat, tartalomjegyzék. Megengedett, ismételhető adatelem.
13. Közreműködő (Contributor) Az a természetes vagy jogi személy, vagy jogi személyi-
séggel nem rendelkező gazdasági társaság, aki/amely a dokumentum szellemi tartalmának
alkotásában részt vesz, és a létrehozóhoz képest alárendelt, illetve járulékos szerepet tölt be,
illetve aki/amely a dokumentum valamely járulékos részének létrehozója. A szellemi (szak-
mai, tudományos, irodalmi, művészi stb.) tartalom létrejöttéhez hozzájáruló(k) neve. Meg-
engedett, ismételhető adatelem.
14. Kapcsolat (Relation) Hivatkozás a dokumentummal kapcsolatos másik dokumentumra. A
hivatkozásban ajánlatos megadni a kapcsolódó dokumentum hivatalos azonosítóját.
Megengedett, ismételhető adatelem.
15. Tér-idő vonatkozás (Coverage) A dokumentum tartalmának térbeli vagy időbeli vonat-
kozásai. Földrajzi (térbeli) nevek vagy időbeli adatok (időhatárok), amelyekre a dokumentum
vonatkozik (amelyeket magába foglal). Ajánlatos földrajzi nevek tezauruszának használata,
illetve az időhatárok megadása számokkal kifejezve. Megengedett, ismételhető adatelem.1
Az Apple Computer cég által kidolgozott Meta Content Framework (MCF) nemcsak a
www tartalmi feltárását, hanem az ftp file-ok, a gopher, az adatbázisok, a destkop file-ok stb.
tartalmi feltárását is célul tűzte ki. Egy olyan szitaxisból áll, amely XML (Extensible Markup
Language) nyelven rendeli hozzá a dokumentumhoz a hozzá tartozó tulajdonságokat. Az
összefüggés világosan érzékelhető: az említett cég szoros kapcsolatban áll a metaadatokkal is
foglalkozó W3Consortiummal, akik viszont a HTML nyelv korlátainak megszüntetésére
kidolgoztak egy szabványosított, újfajta jelölő nyelvet, az SGML (Standard Generalized
Markup Language) egyszerűsített változatát, az XML-t. Ezt alkalmazta az Apple
frameworkje. Nyilvánvalóan azért, hogy a Web fejlesztők szükség szerint maguk is
definiálhassanak új címkéket (tag-eket).
Ugyancsak a W3C Konzorcium a kidolgozója és fejlesztője a Resource Description
Framework (RDF) technológiának is, amely a Források Leírására Szolgáló Szerkezet, és
amely a web alapú információforrások és dokumentumok különböző metadata szabványainak
4
egységes kezelését tűzte ki céljául. Az RDF is egy adatmodellből és a web források
metaadaataihoz szolgáló szintakszisból áll. Természetesen ez is XML nyelven.
A PICS (Platform for Internet Content Selection – Program az Internet Tartalmi
Válogatásához) programjában ugyancsak a W3C ad segítséget a címkézéseknek az Internet
tartalmához való hozzárendelésében.
A PICS-SE szabványtervezet a Warwick-féle tervezethez hasonlóan a különféle típusú
metaadatok egységes, koherens rendszerben való kezelésében kíván segítséget nyújtani.
A DC-t alkalmazó NORDIC metaadat project már befejeződött. Sikeres alkalmazásának
szemtanúi lehetünk az északi országok webes gyakorlatának tanulmányozásakor. A finn és
dán weboldalakon már nemcsak az általuk kifejlesztett DC űrlapot alkalmazzák, hanem
kialakítottak egy DC-MARC konvertáló programot is.
DC alapú az ausztrál METAWeb Project is, melynek fő célkitűzése az
indexszolgáltatások, a felhasználói- és a metaadatok használatát segítő eszközök fejlesztése. E
téren elöl járnak a Dublin Core metaadatokat tartalmazó, URL (Uniform Resource Locator)
címeket kereső keresőgép használatával és egy olyan szoftwer kidolgozásával, amely 15 DC
elem/címke közül hatot automatikusan generál és keret rekordot hoz létre.
Bizonyos DC elemek részletesebb kiterjesztésével (amelyek a kutatási, felhasználási és
fejlesztési jogokra stb. vonatkoznak) a múzeumi információk kölcsönös számítógépes
cseréjére szakosodott a Computer Interchange of Museum Information (CIMI) project.
Valamennyi projekt, szabvány azonban egyöntetűen megegyezik abban, hogy a metaadatnak
• biztosítania kell az adott témához tartozó, rá vonatkozó, bármely típusú
dokumentum, (a szakirodalom sokszor objektumot is említ) egyszerre, egy
helyen történő megtalálhatóságát,
• el kell különítenie a keresés folyamán fontos fogalmakat a mellékes
fogalmaktól,
• meg kell oldania a többjelentésű szavak, szinonimák és a nem egyértelmű
kifejezések okozta nehézségeket is.
A már említett W3C-n és a Dublin Core-on kívül nem hagyhatjuk figyelmen kívül a
nemzetközi szabványügyi szervezet, az ISO (International Standards Organization)
tevékenységét. Jelenlegi szabványa az ISO 11179-es szabvány, amely az adatelemek
specifikációját és szabványosítási kérdéseit taglalja.
5
Ez 1jó kis összefoglalás, ezt érdemes kinyomtatni innentől
A metaadat szabványok leírására szolgáló legismertebb szabvány a „szabványok szabványa”
az SGML (Standard Generalized Markup Language), amely elsősorban szövegszerű formában
kódolható digitális objektumok rögzítésére használható. Ez utóbbi objektumok
katalogizálásához kétféle típusú szabványokból válogathatunk: az SGML és a nem SGML
alapúakból.
Az SGML alapúak:
• DOI (Digital Object Identifier): a web egyik legkellemetlenebb,
legnehezebben megszokható jelensége a dokumentumok gyakori
helyváltoztatásából adódó nehézkes követési lehetőség. Ennek kiküszöbölése a
dokumentum olyan azonosítása, amely a lelőhelytől függetlenül is képes
azonosítani a forrást. A DOI ezt teszi: a weben publikált művek, elektronikus
dokumentumok, számítógépes képek és hangfelvételek, valamint egyéb digitális
állományok tulajdonságait azonosítja és azokat nyomon követi. Jelenleg még
mindig fejlesztés alatt álló kódrendszer ez. (E törekvések képviselői a Handle
rendszer és az URN (Uniform Resource Names) is.)
• EAD (Encoded Archival Description): levéltári, múzeumi, kézirattári
segédletek, mutatók leírására, illetve ezen közintézmények közötti adatcserére
alkalmas rendszer
• Dublini alap metaadatok: 15 elemből álló jelkészlet, amely a HTML
formátumú web anyagok leírására szolgál és a file fejlécében elhelyezhető
„meta” kódok használatát szabályozza. Az elemek három fő csoportba
oszthatók: 1. tartalomra vonatkozó adatok (cím, szerző vagy létrehozó, tárgy és
kulcsszavak, leírás, egyéb közreműködő, dátum, forrás, forrástípus,
forrásazonosító, nyelv, az adott forrás kapcsolata más forrásokkal) 2.
Intellektuális kapcsolatok (tulajdonos, alkotó, kiadó, jogok), 3. Megjelenéssel
kapcsolatos adatok (dátum, típus, forma)
• TEI (Text Encoding Initiative): nemzetközi project és szabványjavaslat az
elektronikus dokumentumok szerkezetének leírására és gépek közötti átvitelére
vonatkozóan
3
Pajor Enikő: A láthatatlan/mély web felhasználása a könyvtári tájékoztatásban (Doktori
disszertáció). <http://szilleri.tvn.hu/disszertacio.pdf> [Letöltve: 2009. június 4.]
6
Képek digitalizálása (metaadat szabványok)
Exif (Exchangable Image File )
A kép készítésekor automatikusan rendelkezésre álló adatok rögzítésére szolgál. Így
tartalmazza a gép gyártóját, típusát, a pontos dátumot és időpontot, a fényképezőgép szinte
összes beállítását és még néhány a képre jellemző adatot (a záridőt, a fókusztávolságot, a
fehér egyenes mértékét). Mindezen adatokon túl az Exif fejlécben megtalálható a kép
kisméretű változata is, ami lehetővé teszi a kép megjelenítését a fényképezőgép monitorán
anélkül, hogy a kártyáról a gép beolvasná a teljes állományt.
Ezek az elsőre talán haszontalannak tűnő adatok a képek rendszerezésénél, feldolgozásánál
lehetnek nagyon hasznosak. Míg a fájl dátuma már a kép elforgatásakor megváltozik, az Exif
fejlécben tárolt készítési dátum a kép módosítása után is az eredeti időpontra mutat. Így
mindig megkereshetők egy adott időszak képei, de ez lehetőséget biztosít a képek sorrendbe
tételéhez, dátum szerinti átnevezéséhez is.
A fényképezőgép beállításainak elmentése soha nem látott lehetőséget biztosít a tanulásra.
Minden elkészült fotó tartalmazza ugyanis, hogy milyen gyújtótávolsággal, milyen blendével
és milyen záridővel készült, így a képek utólagos elemzésénél megtanulható, hogy milyen
szituációban mi vezet a megfelelő eredményhez és mi nem. Persze a fájlokba ennél sokkal
több adat kerül.
IPTC (International Pres Telecomunications Council)
Az elnevezés nem helyes ugyan, de a köztudatban ezen a néven terjedt el a másik adattárolási
szabvány. A név a rendszer egyik kidolgozójára utal, miközben maga a szabvány az IMM
(Information Interchange Model) nevet viseli.
Mint ahogy a létrehozó szervezet nevéből is következtetni lehet, ezeket az adatokat elsősorban
a sajtófotósok és képügynökségek használják a képek rendszerezésére, katalogizálására. Az
adatok között nem találhatók meg a fényképezőgép beállításai (hiszen azok az Exif fejlécben
már szerepelnek), helyettük a következők adhatók meg a kép elkészítése után (a teljesség
igénye nélkül):
• A kép készítésének helye: város, állam, ország
• Adatbázis: objektum neve, kategória, kulcsszavak, stb.
• Készítő fotós neve
• Készítés dátuma
• Leírás és a leírás készítőjének neve
• Cím
• Speciális megjegyzések az ügynökségnek
• stb. 4
Képkatalogizáló programok:
Google Picasa
PicaJet
ACDSee Photo Manager
Photoshop Elements
4
http://digiretus.hu/nyomtatas.php?link=dosszie07.html&tipus=dosszie&SORSZAM=59