Professional Documents
Culture Documents
Χρήστος
Παπαθεοδώρου
Αναπληρωτής
Καθηγητής
Ομάδα
Βάσεων
Δεδομένων
και
Πληροφοριακών
Συστημάτων,
Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας, Ιόνιο Πανεπιστήμιο
Εισαγωγικά
Οργάνωση
Γνώσης:
περικλείει
κάθε
τύπο
και
μέθοδο
ευρετηρίασης,
περιγραφής,
ταξινόμησης,
διαχείρισης
τεκμηρίων,
που
βοηθούν
στην
ανάκτηση
της
πληροφορίας.
διανοητική
διαδικασία
που
ενισχύει
την
πρόσληψη
του
κόσμου
μέσω
της
ανάπτυξης
νοητικών
δομών
οι
νοητικές
δομές
αυξάνουν
την
αξία
της
πληροφορίας
αφού
καθιστούν
ευχερέστερη
την
αναζήτηση
και
τη
διάχυσή
της
στις
κοινότητες
χρηστών
παρέχει
μια
βαθύτερη
αντίληψη
για
το
θεματικό
περιεχόμενο
του
τομέα
ενδιαφέροντος
των
χρηστών
των
υπηρεσιών
πληροφόρησης
Συστήματα
Οργάνωσης
Γνώσης
(ΣΟΓ)
εξελιγμένα
εργαλεία
αναζήτησης
ψηφιακής
πληροφορίας
ταξινομικά
συστήματα,
καταλόγους
θεματικών
επικεφαλίδων,
αρχεία
καθιερωμένων
ονομάτων,
σημασιολογικά
δίκτυα
και
οντολογίες
2
Προσεγγίσεις
για
την
Οργάνωση
Γνώσης
(1/3)
Παραδοσιακή:
Τα
συστήματα
ταξινόμησης
που
χρησιμοποιούν
οι
Βιβλιοθήκες
(π.χ.
DDC,
LCC,
UDC)
για
να
οργανώσουν
την
επιστημονική
βιβλιογραφία.
Βασική
αρχή
οργάνωσης
από
τα
γενικότερα
στα
ειδικότερα,
ενώ
τα
αντικείμενα
ταξινομούνται
σε
μια
μοναδική
κατηγορία
Αναλυτικο‐συνθετική
(πολυεδρική,
facet‐analymcal):
Θεσπίσθηκε
από
τον
Ranganathan,
και
βασίζεται
στην
εφαρμογή
λογικών
αρχών.
Η
θεματική
περιγραφή
ενός
αντικειμένου
μπορεί
να
αναφέρεται
σε
περισσότερες
από
μια
έννοιες.
Οι
έννοιες
αναλύονται
σε
επιμέρους
κατηγορίες
(ανάλυση
εννοιών)
οι
οποίες
συνθέτουν
την
περιγραφή
του
θέματος
(σύνθεση).
Έτσι
το
θέμα
δεν
ταξινομείται
σε
μια
μοναδική
κατηγορία.
Βασικές
κατηγορίες
για
την
ανάλυση
των
θεμάτων
είναι
οι:
Προσωπικότητα
(Personality):
το
βασικό
διακριτικό
γνώρισμα
που
χαρακτηρίζει
ένα
θέμα
(π.χ.
όνομα)
Υλικό
(Maver):
το
φυσικό
υλικό
από
το
οποίο
αποτελείται
μια
έννοια
Ενέργεια
(Energy):
κάθε
ενέργεια
στην
οποία
ένα
θέμα
μπορεί
να
συμμετέχει
(π.χ.
το
ξύλο
στην
επίπλωση)
Χώρος
(Space):
ο
γεωγραφικός
τόπος
που
μπορεί
αναφέρεται
το
θέμα
Χρόνος
(Time):
is
the
period
associated
with
a
subject.
Προσεγγίσεις
για
την
Οργάνωση
Γνώσης
(2/3)
Ανάκτηση
Πληροφοριών:
Προέρχονται
από
το
χώρο
του
full
text
retrieval
και
της
αυτόματης
κατηγοριοποίησης
κειμένων,
με
ικανοποιητικά
αποτελέσματα.
Οι
σημασιολογικές
σχέσεις
βασίζονται
σε
στατιστικές
συσχετίσεις
μεταξύ
των
αντικειμένων
με
βάση
τις
συχνότητες
εμφάνισης
των
λέξεών
τους.
Ακολουθείται
μια
μεθοδολογία
από
τα
ειδικότερα
προς
τα
γενικότερα
(bovom‐up)
Χρηστοκεντρική:
Οι
σημασιολογικές
σχέσεις
βασίζονται
σε
εμπειρικές
έρευνες
χρηστών
και
όχι
στην
επιστημονική
βιβλιογραφία
Βιβλιομετρική:
Δύο
αντικείμενα
(τεκμήρια)
συσχετίζονται
εννοιολογικά
όταν
το
ένα
αναφέρει
το
άλλο,
ή
όταν
κάποιο
τρίτο
αντικείμενο
αναφέρει
και
τα
δύο
(co‐citamon).
Είναι
μια
μορφή
κοινωνικής/συνεργατικής
οργάνωσης
γνώσης
4
Προσεγγίσεις
για
την
Οργάνωση
Γνώσης
(3/3)
Ανάλυση
πεδίου:
Βασίζεται
στην
όσο
πιο
πλούσια
γνώση
του
πεδίου
που
επιτυγχάνεται
από
την
ευρετηρίαση,
την
ανάπτυξη
θησαυρών,
τις
μελέτες
χρηστών,
τις
βιβλιομετρικές
έρευνες
ενός
επιστημονικού
πεδίου
Επιστημολογικές
προσεγγίσεις
που
βασίζονται
στην
ερμηνευτική
και
σημειωτική
ανάλυση
των
αντικειμένων
Σύγχρονες
προσεγγίσεις
που
βασίζονται
στην
τεχνολογία
της
ηλεκτρονικής
δημοσίευσης,
όπως
στις
γλώσσες
σημειοθέτησης,
την
αρχιτεκτονική
των
δικτυακών
τόπων,
την
αναπαράσταση
των
αντικειμένων
και
την
τυπολογία
τους
κ.λπ.
Χαρακτηριστικά
Συστημάτων
Οργάνωσης
Γνώσης
Χρησιμοποιούνται
για
την
οργάνωση
του
υλικού
μιας
συλλογής
τεκμηρίων
σε
θεματικές
κατηγορίες
Θεωρούν
από
μια
συγκεκριμένη
οπτική
γωνία
μια
συλλογή
και
τα
αντικείμενά
της
Μια
οντότητα
μπορεί
να
χαρακτηρισθεί
με
διαφορετικούς
τρόπους
ανάλογα
με
το
ΣΟΓ
που
χρησιμοποιείται
Λειτουργούν
ως
γέφυρα
μεταξύ
του
υλικού
και
των
αναγκών
του
χρήστη
και
καθοδηγούν
/
διευκολύνουν
την
αναζήτηση
του
χρήστη
Τα
ΣΟΓ
χρησιμοποιούνται
για
τη
συσχέτιση
εννοιών
με
αντικείμενα
μιας
συλλογής
από
εξειδικευμένα
πρόσωπα.
Μια
έννοια
αποδίδεται
σε
ένα
αντικείμενο
Οι
χρήστες
που
αναζητούν
αντικείμενα
χρησιμοποιώντας
ΣΟΓ,
συνδέουν
τις
έννοιες
που
αντιλαμβάνονται
τον
κόσμο
με
τις
αναπαραστάσεις
τους
στο
ΣΟΓ
6
Συστήματα
Οργάνωσης
Γνώσης
(1/5)
Κατάλογοι
όρων
:
Καταλόγοι
καθιερωμένων
ονομάτων
(Authority
Files):
Ελεγχόμενα
λεξιλόγια
των
πολλαπλών
μορφών
ονομάτων
ή
οντοτήτων
ενός
τομέα
ή
πεδίου
(Library
of
Congress
Name
Authority
File,
Gevy
Geographic
Authority
File)
Γλωσσάρια
(Glossaries):
Κατάλογοι
ονομάτων
συνήθως
ενός
συγκεκριμένου
γνωστικού
τομέα
ή
έργου
με
τους
ορισμούς
τους
Λεξικά
(Dicmonaries):
Αλφαβητικοί
κατάλογοι
λέξεων,
των
ορισμών
τους,
της
προέλευσης
τους,
των
διαφορετικών
μορφών
τους,
των
συνωνύμων,
κ.λπ.
Γεωγραφικά
λεξικά
(Gazzevers):
Κατάλογοι
ονομάτων
τοποθεσιών
που
συνοδεύονται
από
τις
γεωγραφικές
συντεταγμένες
τους
Συστήματα Οργάνωσης Γνώσης (2/5)
Ταξινομικά
συστήματα
και
κατηγορίες
:
Καταλόγοι
θεματικών
επικεφαλίδων
(Subject
Headings):
Ελεγχόμενα
λεξιλόγια
που
αντιπροσωπεύουν
τα
θέματα
των
αντικειμένων
μιας
συλλογής
με
περιορισμένη
ιεραρχική
διάρθρωση
(LCSH,
MeSH)
Ταξινομικά
συστήματα,
ταξονομίες
και
σχήματα
κατηγοριοποιήσεων
(Classificamon
Schemes,
Taxonomies,
Categorizamon
Schemes):
Κατατάσσουν
ή
ομαδοποιούν
θέματα
σε
μεγάλες
κατηγορίες
είτε
με
ιεραρχική
διάταξη
είτε
με
χρήση
αλφαριθμητικής
σημειογραφίας
χωρίς
ρητά
εκφρασμένες
τις
σχέσεις
ανάμεσα
στους
όρους
(DDC,
UDC)
8
Συστήματα
Οργάνωσης
Γνώσης
(3/5)
Κατάλογοι
σχετιζόμενων
όρων
:
Θησαυροί
(Thesauri):
Υποδεικνύουν
τις
σχέσεις
που
υπάρχουν
ανάμεσα
σε
όρους
και
κύρια
τις
σχέσεις
ιεραρχίας,
ισοδυναμίας
και
τις
σχέσεις
συσχέτισης
(AAT)
Σημασιολογικά
δίκτυα
(Semanmc
networks):
Δομούν
τις
έννοιες
και
τους
όρους
όχι
σε
ιεραρχίες
αλλά
με
τη
μορφή
δικτύου
(με
κόμβους
τις
έννοιες
και
ακμές
τις
μεταξύ
τους
σχέσεις)
ενώ
οι
σχέσεις
ανάμεσα
στους
όρους
είναι
ευρύτερες
σε
σχέση
με
του
θησαυρού
(WorldNet)
Οντολογίες
(Ontologies):
Είναι
από
τα
πιο
πρόσφατα
συστήματα
και
αναπτύσσονται
κυρίως
στο
πλαίσιο
του
Σημασιολογικού
Ιστού
ως
ειδικά
μοντέλα
εννοιών
(specific
concept
models).
Αναπαριστούν
πολύπλοκες
σχέσεις
ανάμεσα
σε
αντικείμενα
και
περιλαμβάνουν
κανόνες
και
αξιώματα
ενώ
περιγράφουν
τη
γνώση
ενός
συγκεκριμένου
τομέα
(SUMO)
Συστήματα
Οργάνωσης
Γνώσης
(4/5)
Άλλοι
τύποι
συστημάτων
οργάνωσης
γνώσης
είναι:
Θεματικοί
χάρτες
(Topic
maps):
Βασίζονται
στην
αρχή
ότι
τα
αντικείμενα
(occurrences)
περιστρέφονται
γύρω
από
δομές
γνώσης
που
είναι
τα
θέματα
(topics)
με
τις
μεταξύ
τους
συσχετίσεις.
Περιγράφουν
δομές
γνώσης
και
η
πλοήγηση
σε
αυτές
οδηγεί
στον
εντοπισμό
αντικειμένων
Εννοιολογικοί
χάρτες
(Concept
maps):
Οπτική
αναπαράσταση
των
εννοιών
ενός
και
των
σχέσεών
τους.
Οι
έννοιες
αποτελούν
κόμβους
σε
ένα
γράφο
και
συνδέονται
με
ακμές
που
έχουν
ετικέτες
της
μορφής
«εγείρει
το»
,
«έχει
σαν
αποτέλεσμα»,
«απαιτείται
από»,
«συνεισφέρει
σε»
Βιβλιομετρικοί
χάρτες
(Bibliometric
maps):
Με
βάση
τις
βιβλιογραφικές
αναφορές
που
συνυπάρχουν
σε
επιστημονικά
τεκμήρια
(co‐citamon
analysis)
μπορούν
να
κατασκευαστούν
χάρτες
που
αποτυπώνουν
την
τρέχουσα
γνώση
(Atlas
of
Science)
Δακτύλιοι
συνωνύμων
(synonym
ring):
Συνώνυμοι
όροι
συνδέονται
μεταξύ
τους
και
σχηματίζουν
«κλάσεις
ισοδυναμίας».
Οι
κλάσεις
ισοδυναμίας
έχουν
προσδιορισθεί
αναλυτικά
(π.χ.
Syntacmc
variants,
Phrase
variants,
Quasi‐synonyms,
Synonyms,
Absolute
synonyms,
Cognimve
synonyms,
Contextual
synonyms)
10
Συστήματα
Οργάνωσης
Γνώσης
(5/5)
Υπερκείμενο
Τυπολογίες
(Typologies):
Το
υλικό
ταξινομείται
με
βάση
τον
τύπο
του
(π.χ.
οι
τύποι
των
ΣΟΓ)
Βιβλιογραφικοί
κατάλογοι
(OPAC,
WebOPAC)
Κοινωνικές
ταξονομίες
(folksonomies,
folk+taxonomy):
Επισημειώσεις
περιεχομένου
(αντικειμένων)
με
σκοπό
τη
θεματική
κατηγοριοποίησή
του
που
εισάγονται
από
κοινότητες
χρηστών
και
έχουν
τη
μορφή
ετικετών/λέξεων
κλειδιών
(tags,
tag
cloud)
χωρίς
μεταξύ
τους
συσχετίσεις
(Delicious)
Βιβλιογραφίες,
εγκυκλοπαίδιες,
γλώσσες
και
συμβολικά
συστήματα
Εννοιολογικά
συστήματα
και
θεωρίες
(για
συγκεκριμένα
επιστημονικά
πεδία)
Κανόνες,
μοντέλα
δρώντων
και
διεργασιών,
τομείς
κοινωνικής
δραστηριότητας
11
Ορισμοί
(1/2)
Εννοια
(concept)
είναι
η
νοητική
αντιπροσώπευση
ενός
ιδιαίτερου
αντικειµένου
ή
ενός
συνόλου
ιδιαίτερων
αντικειµένων
που
έχουν
ορισµένες
κοινές
ιδιότητες
Ορος
(term)
είναι
µια
λέξη
ή
φράση
που
αντιπροσωπεύει
και
προσδιορίζει
µια
έννοια.
Πλάτος
(έκταση)
µίας
έννοιας:
το
σύνολο
όλων
των
αντικειµένων
στα
οποία
αντιστοιχεί
µία
έννοια
π.χ.
{ακαδηµαϊκές,
σχολικές,
ειδικές,
…}
βιβλιοθήκες
Βάθος
(ένταση)
µίας
έννοιας:
το
σύνολο
των
ουσιωδών
χαρακτηριστικών
που
συνιστούν
την
έννοια
π.χ.
στην
έννοια
{ξύλινο
τραπέζι}
το
χαρακτηριστικό
της
σύνθεσης
(ξύλινο)
αποτελεί
ουσιώδες
χαρακτηριστικό
και
διακρίνει
την
έννοια
τραπέζι
Ατοµική
έννοια:
αντιστοιχεί
σε
ένα
µόνο
αντικείµενο
{νήσος
Κέρκυρα}
Γενική
έννοια:
αντιστοιχεί
σε
δύο
ή
περισσότερα
αντικείµενα
που
αποτελούν
οµάδα
µε
κοινές
ιδιότητες
{νήσος}
12
Ορισμοί
(2/2)
Χαρακτηριστικό
(avribute,
characterismc)
µιας
έννοιας
είναι
οποιαδήποτε
από
τις
ιδιότητες
ή
σχέσεις
που
συνιστούν
µία
έννοια
(π.χ.
ένα
χαρακτηριστικό
της
έννοιας
δέντρο
είναι
ο
ξυλώδης
κορµός)
Ενδογενή
χαρακτηριστικά
(σχήµα,
µέγεθος,
υλικό,
χρώµα)
π.χ.
οδοντωτός
(τροχός),
κόκκινο
(φως),
ξύλινο
(τραπέζι)
Εξωγενή
χαρακτηριστικά
(προέλευση,
προορισµός,
λειτουργία,
θέση,
εφευρέτης,
τοποθέτηση)
π.χ.
πεντελικό
(µάρµαρο),
ευκλείδεια
(γεωµετρία),
δοκιµαστικός
(σωλήνας)
13
Ορισμοί
εννοιών
Ορισµός
µιας
έννοιας
είναι
η
λεκτική
περιγραφή
της
έννοιας
για
διαφοροποίηση
από
συναφείς
έννοιες
Εντατικός:
περιγράφει
το
βάθος
µιας
έννοιας
π.χ
ισόπλευρο
τρίγωνο
είναι
το
τρίγωνο
που
έχει
και
τις
3
πλευρές
ίσες
Εκτατικός:
απαρίθµηση
των
υποτασσόµενων
εννοιών,
πλάτος
π.χ.
τρίγωνο:
ισόπλευρο,
ισοσκελές,
σκαληνό
Εµµεσος:
ορισµός
µέσω
παραδείγµατος
14
Λεξιλόγιο
Σύνολο
όρων
Eλεγχόμενο
λεξιλόγιο
(controlled
vocabulary):
μόνο
συγκεκριμένοι
όροι
ή
είδη
όρων
επιτρέπεται
να
συμμετέχουν
στις
δηλώσεις
θεμάτων
Ονομάζονται
περιγραφείς
(descriptors)
ή
προτιμώμενοι
όροι
(preferred
terms)
15
Πρότυπα
ΕΛΟΤ
402.
Αρχές
και
µέθοδοι
ορολογίας
ΕΛΟΤ
414.
Περιλήψεις
για
τις
δηµοσιεύσεις
και
την
τεκµηρίωση
ΕΛΟΤ
561‐1.
Λεξιλόγιο
Ορολογίας
ΕΛΟΤ
720
:1993.
Φύλλα
περιλήψεων
σε
περιοδικές
εκδόσεις.
(ISO
5122‐1979)
ΕΛΟΤ
743.
Μετατροπή
του
ελληνικού
αλφαβήτου
µε
λατινικούς
χαρακτήρες
ΕΛΟΤ
1213:1994.
Ευρετήριο
ενός
δηµοσιεύµατος.
(
ISO
999‐1996)
ΕΛΟΤ
1312:1993
(ΣΕΠ).
Θεµατική
ανάλυση
τεκµηρίων
:
Μέθοδοι
εξέτασης
τεκµηρίων,προσδιορισμού
των
θεμάτων
τους
και
επιλογής
των
όρων
ευρετηρίασης
(ISO
5963‐1985)
ΕΛΟΤ
1321:1993
(ΣΕΠ)
Κατευθυντήριες
οδηγίες
για
τη
συγκρότηση
και
ανάπτυξη
µονόγλωσσων
θησαυρών.
(ISO
2788‐1986)
ΕΛΟΤ
1381‐1
(ΣΕΠ).
Λεξιλόγιο
‐
Μέρος
1
:
Βασικές
έννοιες.
(ISO
5127/1‐1983)
ΕΛΟΤ
1381‐2‐1997(ΣΕΠ)
Λεξιλόγιο
‐
Μέρος
2
:
Παραδοσιακά
τεκµήρια.
(ISO
5127/2‐1983)
18
Βιβλιογραφία
Gail
Hodge,
«Systems
of
Knowledge
Organizamon
for
Digital
Libraries:
Beyond
Tradimonal
Authority
Files»,
hvp://www.clir.org/pubs/reports/
pub91/contents.html
Networked
Knowledge
Organizamon,
Systems/Services,
hvp://
nkos.slis.kent.edu/
Knowledge
organizamon
systems
(KOS),
hvp://www.db.dk/bh/
lifeboat_ko/CONCEPTS/knowledge_organizamon_systems.htm
Knowledge
Organizamon,
hvp://www.db.dk/bh/lifeboat_ko/concepts/
knowledge_organizamon.htm
Birger
Hjørland,
“What
is
Knowledge
Organizamon
(KO)?”
,
Knowledge
Organiza6on.
Interna6onal
Journal
devoted
to
Concept
Theory,
Classifica6on,
Indexing
and
Knowledge
Representa6on
35(2/3):pp.
86‐101
(υπάρχει
στο
eclass)
Birger
Hjørland,
“Semanmcs
and
Knowledge
Organizamon”,
Annual
Review
of
Informa6on
Science
and
Technology
41:367
‐405
(υπάρχει
στο
eclass)
19
Πρότυπα
Μεταδεδομένων
Περιεχόμενα
Εισαγωγή
στα
μεταδεδομένα
Dublin
Core
MODS
Αρχειακά
μεταδεδομένα
–
Encoding
archival
descripkon
(EAD)
2
Ψηφιακά
τεκμήρια
Οτιδήποτε
υπάρχει
σε
ψηφιακή
μορφή
και
προσπελαύνεται
με
τη
βοήθεια
υπολογιστή
κείμενα
εικόνες,
κινούμενες
εικόνες
ήχος,
βίντεο
ιστοσελίδες,
προγράμματα
3
Τύποι
δεδομένων
Ηλεκτρονικών
τεκμηρίων
Πώς
εντοπίζουμε
και
ανακτούμε
τα
ψηφιακά
τεκμήρια;
5
Μεταδεδομένα
Τα
μεταδεδομένα
είναι
δομημένη
πληροφορία
που
περιγράφει,
εξηγεί,
εντοπίζει
ή
διευκολύνει
την
ανάκτηση,
τη
χρήση
ή
την
διαχείριση
ενός
ψηφιακού
τεκμηρίου
Συχνά
καλούνται
(«δομημένα»)
«δεδομένα
για
άλλα
δεδομένα»
ή
«πληροφορία
για
άλλη
πληροφορία»
"Metadata
is
machine
understandable
informakon
about
web
resources
or
other
things."
(Tim
Berners‐Lee)
Διάφορα
πρότυπα
μεταδεδομένων
ανάλογα
με
το
είδος
του
τεκμηρίου
και
τις
πληροφοριακές
ανάγκες
ανακάλυψη:
περιγραφικά,
π.χ.
τίλος,
συγγραφέας
διατήρηση:
τεχνικά,
π.χ.
τύπος
υλικού,
ψηφιακής
μορφή
6
Που
Βρίσκονται
τα
Μεταδεδομένα
Στην
ετικέτα
ενός
CD
(ορατά)
Στη
σελίδα
τίλου
ενός
τεκμηρίου
(ορατά)
Στην
κορυφή
μιας
ιστοσελίδας
(ορατά)
Σε
διαφορετική
εγγραφή,
π.χ.
στον
κατάλογο
μιας
βιβλιοθήκης
(ορατά)
Στην
ηλεκτρονική
μορφή
μέσα
στον
πόρο
(ορατά)
Ενσωματωμένα
στο
ηλεκτρονικό
δημοσίευμα
(μέρος
της
κωδικοποίησης,
μη
ορατά)
7
Παράδειγμα:
Ιστοσελίδα
σε
HTML
<HTML>
<BODY>
<p> Fiction:</p>
<UL><LI>Author: Milan Kundera</LI>
<LI>Title: Identity</LI>
<LI>Published: 1998</LI>
</UL>
<p> Science: </p>
<UL><LI>Author: Richard Feynman</LI>
<LI>Title: The Character of Physical Law</LI>
<LI>Hardcover</LI>
</UL>
</BODY>
</HTML>
8
Πώς
θα
κάνουμε
«ορατά»
τα
μεταδεδομένα
από
τους
υπολογιστές
(μηχαναγνώσιμη
πληροφορία);
9
XML:
κωδικοποίηση
μεταδεδομένων
Η
HTML
ελέγχει
τον
τρόπο
εμφάνισης
των
ηλεκτρονικών
τεκμηρίων,
δεν
ασχολείται
με
τη
φύση
τους,
την
περιγραφή
τους,
τη
σημασία
τους
eXtensible
Markup
Language
(XML)
αποτελεί
μια
εξαιρετικά
απλή
διάλεκτο
της
γλώσσας
Standard
Generalized
Markup
Language
(SGML),
η
οποία
αναπτύχθηκε
με
στόχο
να
διευκολύνει
το
χειρισμό,
επεξεργασία,
διακίνηση
και
αποθήκευση
τεκμηρίων
στον
Παγκόσμιο
Ιστό
(web)
10
Αναγκαιότητα
Προτύπων
Μεταδεδομένων
Χρειάζονται
για
να
έχουμε
κοινή
αντίληψη
των
δεδομένων
που
περιγράφονται
με
αυτά
Μας
προσφέρουν
μεγαλύτερη
δομή
Μας
περιορίζουν
στην
ευελιξία
Επεξεργάζονται
ευκολότερα
μηχανικά
Είναι
αναγκαιότερα
σε
ψηφιακά
αντικείμενα
Αφού
στα
συμβατικά
έχουμε
αισθητήρια
αντίληψη
για
αναγνώριση,
θέση,
θέματος,
…
11
Κόστος
και
Λειτουργικότητα
Αναζήτησης
και
Μεταδεδομένων
AACR2/MARC
Λειτουργικότητα
κατά
την
χρήση
Μέτα-µηχανές αναζήτησης
Google (µε τεχνικές συνδέσµων)
Απλές µηχανές αναζήτησης
Κόστος
δημιουργίας
και
χρήσης
12
Πόσα
Πρότυπα
Μεταδεδομένων
Δεν
υπάρχει
ένα
μοναδικό
διεθνές
πρότυπο
για
μεταδεδομένα,
γιατί:
Χρειαζόμαστε
διαφορετικά
επίπεδα
πολυπλοκότητας,
από
πλούσιες
μέχρι
απλές
περιγραφές
Υπάρχουν
κάμποσα
σχήματα
μεταδεδομένων,
για
διαφορετικά
επίπεδα
και
απαιτήσεις
Επεκτείνουμε
τα
υπάρχοντα
πρότυπα
13
Πρότυπα
Μεταδεδομένων
AACR2
MARC
Text
Encoding
Inikakve
‐
TEI
Header
(1990)
Dublin
Core
‐
DC
(1995)
Encoded
Archival
Descripkon
–
EAD
(1996)
Open
Archives
Inikakve
‐
OAI
Visual
Resources
Associakon
Core–
VRA
(1997)
Federal
Geographic
Data
Commi–ee
for
Digital
Geospakal
Metadata
–
FGDC
Data
Documentakon
Inikakve
–
DDI
(1997)
Gateway
to
Educakonal
Materials
–
GEM
(1999)
Government
(Global)
Informakon
Locator
Service
‐
GILS
Metadata
Encoding
and
Transmission
Standard
–
METS
Metadata
Object
Descripkon
Schema
–
MODS
Computer
Interchange
of
Museum
Informakon
–
CIMI
Interoperability
of
Data
in
E‐Commerce
Systems
–
INDECS
Online
Informakon
Exchange
–
ONIX
(2000)
Extended
Markup
Language
–
XML,
MARCXML
14
Australian
Recordkeeping
Metadata
Schema
(RKMS)
Κατηγορίες
Μεταδεδομένων
Διαχειριστικά
(administra]ve)
Με
πληροφορίες
για
τη
διαχείριση
και
διατήρηση
της
εγγραφής,
όπως
δημιουργία,
μετατροπή
και
σχέσεις
με
άλλες
εγγραφές,
π.χ.
κάτοχος,
ημερομηνίες
δημιουργίας
ή/και
μεταβολής,
γλώσσα
εγγραφής,
διαχείρισης
δικαιωμάτων
κλπ.
Δομικά
(structural)
Με
πληροφορίες
για
την
αποθήκευση
και
παρουσίαση
Περιγραφικά
(descrip]ve)
Με
πληροφορίες
που
περιγράφουν
ιδιότητες
και
περιεχόμενο
του
αντικειμένου
στο
οποίο
αναφέρεται
η
εγγραφή
και
συμβάλλουν
στην
ανάκτηση
(ανακάλυψη),
π.χ.
τίτλος,
συγγραφέας,
θεματικοί
όροι,
περίληψη
15
Κατηγορίες
Μεταδεδομένων
Σύμφωνα με την IFLA:
Administrakve
Descripkve
Analykcal
(subject)
Rights
management
Technical
Other,
as
determined
16
Φακοί
και
Όψεις
Όλες
οι
κατηγοριοποιήσεις
παρέχουν
και
πρέπει
να
παρέχουν
μια
μεροληπτική
όψη
της
πραγματικότητας
Κάθε
όψη
τονίζει
συγκεκριμένα
χαρακτηριστικά
και
κρύβει
άλλα
Geospakal
Rights
Museum
17
Επιλογή
μεταδεδομένων
Είναι
σημαντικό
να
καθοριστούν
το
πεδίο
εφαρμογής
τα
κριτήρια
οι
μορφές
των
ψηφιακών
αντικειμένων
και
συλλογών
ο
βαθμός
λεπτομέρειας
στην
περιγραφή
και
παρουσίαση
προκειμένου
να
αξιολογηθούν
τα
πρότυπα
μεταδεδομένων
και
επιλεγεί
το
κατάλληλο.
Ερώτηση:
Ποια
μπορεί
να
είναι
τα
βασικά
στοιχεία
που
θα
περιγράφουν
μια
δεδομένη
ψηφιακή
συλλογή;
18
Απάντηση
(παράδειγμα)
Υποχρεωτικά
Τίτλος
Συγγραφέας
Θέμα
Ηλεκτρονική
διεύθυνση
Επιθυμητά
Εκδότης
Ημερομηνία
Κατηγορία
Σχόλια
Αλλα
σχετικά
με
συλλογή
Αναγνωριστικά
Γλώσσα
Έκδοση
Πνευματικά
δικαιώματα
………………………….
19
Τα
Μεταδεδομένα
είναι
Γλώσσα
Τα
σχήματα
μεταδεδομένων
είναι
γλώσσες
για
να
γίνονται
δηλώσεις
για
τους
πόρους:
«Το
βιβλίο»
έχει
Title
"Gone
with
the
Wind"
«Η
ιστοσελίδα»
έχει
Publisher
"Springer
Verlag"
Οι
όροι
των
λεξιλογίων
(στοιχεία)
ορίζονται
με
πρότυπα
–
όπως
το
Dublin
Core
Οι
γραμματικές
των
μεταδεδομένων
περιορίζουν
τις
δηλώσεις
και
τα
μοντέλα
δεδομένων
που
μπορεί
να
χρησιμοποιηθούν
–
κάνοντας
όμως
τη
σημασία
τους
πιο
έκδηλη
και
σαφή
20
Τα
Μεταδεδομένα
ως
Γλώσσα
Διαφορετικές
κοινωνίες
(περιγραφής
πόρων)
μιλούν
διαφορετικές
γλώσσες
Π.χ.
Τι
γλώσσες
περιγράφουν
Ιατρική
σε
Ελλάδα
και
Αγγλία;
Η
Ιατρική
ορολογία
είναι
κοινή.
Και
οι
φυσικοί
ομιλητές
των
διαφορετικών
γλωσσών
πρέπει
να
επικοινωνήσουν
…
Και
οι
τουρίστες
(και
οι
ομιλητές
των
διαφορετικών
γλωσσών)
μαθαίνουν
να
«μιλούν
πρωτόγονα»
για
να
επικοινωνήσουν
21
Κανόνες
Γραμματικής
DC
υπονοούµενο Τιµή ιδιότητας
µία από 15
ρήµα (κατάλληλη
ιδιότητες
περιγραφή)
υπονοούµενο DC:Creator
DC:Title
υποκείµενο DC:Subject
DC:Date...
εξειδικευτές
(επίθετα)
Παραδείγματα Γραμματικής DC
24
Dublin
Core
Το
Πρότυπο
«Dublin
Core»
Προτυποποίηση
ISO
15836‐2003
US:
NISO
Z39.85‐2001
Ευρώπη:
αναγνώριση
από
το
CEN/ISSS
Workshop
Agreement
13874‐2000
Συστήνεται
ανταλλαγή
με
RDF/XML
26
Χαρακτηριστικά του «Dublin Core»
«Dublin
Core»
σημαίνει
«Dublin,
Ohio»
/
OCLC
Πρωτοβουλία
για
να
βελτιώσει
την
ανακάλυψη
πόρων
στο
Διαδίκτυο
Κοινός
παρονομαστής
για
επικοινωνία
/
διαλειτουργικότητα
Έναυσμα
για
σύγκλιση
των
προτύπων
Επεκτάσιμο,
για
να
καλύψει
τις
επιπρόσθετες
ανάγκες
ανακάλυψης
πόρων
των
διαφορετικών
εφαρμογών
/
περιοχών
27
Dublin
Core
–
Simple
Το
Dublin
Core
έχει
15
στοιχεία.
Κάθε
ένα
από
αυτά
είναι
προαιρετικό
και
επαναλαμβανόμενο
Τα
15
στοιχεία
χωρίζονται
σε
3
κατηγορίες:
Περιεχόμενο:
Περιγράφουν
το
αντικείμενο
Πνευματική
Ιδιοκτησία:
Περιγράφουν
το
copyright
και
τη
δημιουργία
Στιγμιότυπο:
Περιγράφουν
την
εισαγωγή
και
διαχείριση
28
DC
–
Περιεχόμενο
Τίτλος
/
Title
–
(ονομασία
πηγής)
Θέμα
/
Subject,
π.χ.
λέξεις‐κλειδιά,
ταξινομικοί
κωδικοί
Περιγραφή
/
Descrip]on
Π.χ.
περίληψη,
περιεχόμενα,
περιγραφή
εικόνας
Πηγή
(ή
«Προέλευση)
/
Source
–
(παραγωγής)
Γλώσσα
/
Language
–
(του
περιεχομένου)
Σχέση
/
Rela]on
–
(αναφορά
σε
σχετική
πηγή)
Π.χ.
έκδοση
του
…
Κάλυψη
/
Coverage
–
(γεωγραφική
ή
χρονική)
29
DC
–
Πνευματική
Ιδιοκτησία
Δημιουργός
/
Creator
–
(πρόσωπο,
οργανισμός,
υπηρεσία)
Εκδότης
/
Publisher
–
(πρόσωπο,
οργανισμός,
υπηρεσία)
Συντελεστής
(ή
«Συνεργάτης»
ή
«Υπεύθυνος
συμβολής»)
/
Contributor
–
(πρόσωπο,
οργανισμός,
υπηρεσία
που
συμβάλλει
στο
περιεχόμενο)
Π.χ.
μεταφραστής,
εικονογράφος,
κριτής
Δικαιώματα
/
Rights
–
(κείμενο
σχετικά
με
την
πνευματική
ιδιοκτησία)
30
DC
–
Στιγμιότυπο
Ημερομηνία
/
Date
Π.χ.
δημιουργίας,
έκδοσης,
μετάφρασης,
πρόσκτησης,
καταλογογράφησης,
…
Τύπος
/
Type
–
(κατηγορία,
σχετικά
με
το
περιεχόμενο)
Π.χ.
ποίημα,
λεξικό,
so¡ware,
home‐page
Μορφότυπο
/
Format
–
(φυσική
ή
ψηφιακή
μορφή)
Π.χ.
Macintosh‐so¡ware,
pdf,
html,
διαστάσεις,
διάρκεια
Αναγνωριστικό
(ή
Προσδιοριστής
ή
Κωδικός
Ταύτισης)
/
Iden]fier
Μοναδικό
προσδιοριστικό,
π.χ.
URL,
ISBN,
…
31
Στόχοι
του
Dublin
Core
Απλότητα
δημιουργίας
και
διατήρησης
Μη
ειδικοί
να
δημιουργούν
περιγραφικές
εγγραφές
για
αποτελεσματική
ανάκτηση
σε
δικτυωμένο
περιβάλλον
Κοινά
κατανοητή
(διαθεματική)
σημασιολογία
Σύγκλιση
κοινών,
περισσότερο
γενικών
στοιχείων
Αυξημένη
ορατότητα
και
προσβασιμότητα
Κατάλληλο
και
για
τον
μη
ειδικό
της
αναζητητής
Τον
«ψηφιακό
τουρίστα»
32
Χρήση
του
Dublin
Core
Είναι
βασικός
πυρήνας
στοιχείων
Δεν
είναι
υποκατάστατο
σε
πλουσιότερα
περιγραφικά
πρότυπα
Παρέχει
15
«παράθυρα»
ή
ευρύχωρα
«καλάθια»
από
πλουσιότερη
περιγραφή
πόρων
Φανερώνει
πλούσιες
περιγραφές
σε
απλή
μορφή
Σημασιολογικά
σταυροδρόμια,
αντιστοιχίσεις
σε
υπάρχοντα
δεδομένα
33
Τα
Στοιχεία
Μεταδεδομένων
του
Dublin
Core
Διεπιστημονική
ομοφωνία
σε
απλά
σύνολα
στοιχείων
για
ανακάλυψη
πόρων
15
στοιχεία
(πεδία
μεταδεδομένων)
όλα
προαιρετικά
όλα
επαναλαμβανόμενα
Δεν
προορίζεται
για
περιγραφή
περίπλοκων
πόρων
Η
αρχική
ιδέα
των
«απλών
αντικειμένων
–
σαν
τεκμήρια»
Απλότητα
στη
σημασιολογία,
ευκολία
χρήσης
Παρέχει
βασική
«σημασιολογική
διαλειτουργικότητα»
Μεταξύ
επιστημονικών
περιοχών,
μεταξύ
γλωσσών
Δεν
παρέχει
λεπτομερείς
κανόνες
καταλογογράφησης
Επιτρέπει
επεκτασιμότητα
–
σε
άλλες
κατηγορίες
πόρων
34
Dublin
Core
Qualified
Dublin
Core
–
Qualified
Ως
επέκταση
του
απλού
(simple
ή
unqualified)
Dublin
Core
έχουμε
το
εξειδικευτικό
(qualified)
Dublin
Core,
που
προσφέρει:
Βελτίωση
της
σημασιολογικής
ακρίβειας
του
Dublin
Core
ορίζοντας
τους
εξειδικευτές
(qualifiers)
Εξειδίκευση
του
στοιχείου
(element
refinement)
Για
περισσότερη
λεπτομέρεια
στην
περιγραφή
Σύστημα
κωδικοποίησης
(encoding
scheme)
Σαν
χρήση
απλών
κανόνων
καταλογογράφησης
36
Ποικιλίες
Εξειδικευτών:
Εξειδίκευση
Στοιχείων
Προσφέρει
μεγαλύτερη
λεπτομέρεια
σε
αυτόν
που
τη
χρειάζεται
Κάνει
την
σημασία
ενός
στοιχείου
στενότερη
ή
πιο
ειδική
«Date
Created»
και
«Date
Modified»
«IsReplacedBy
Relakon»
και
«Replaces
Relakon»
Δεν
την
τροποποιεί
ή
επεκτείνει,
σε
καμία
περίπτωση
Αν
το
λογισμικό
δεν
καταλαβαίνει
κάποιο
εξειδικευτή,
μπορεί
με
ασφάλεια
να
τον
αγνοήσει!
37
Dublin
Core:
μη
Εξειδίκευση
Στοιχείων
Creator
Subject
Publisher
Contributor
Type
Idenkfier
Source
Language
Rights
38
Dublin
Core:
Εξειδίκευση
Στοιχείων
(1/2)
Στοιχείο
Εξειδίκευση
Title
Alternakve
Descripkon
Table
Of
Contents
Abstract
Date
Created
Valid
Available
Issued
Modified
Format
Extent
Medium
Coverage
Spakal
Temporal
39
Dublin
Core:
Εξειδίκευση
Στοιχείων
(2/2)
Στοιχείο
Εξειδίκευση
Relakon
Is
Version
Of
Has
Version
Is
Replaced
By
Replaces
Is
Required
By
Requires
Is
Part
Of
Has
Part
Is
Referenced
By
References
Is
Format
Of
Has
Format
40
Κωδικοποίηση
Τιμών
(encoding
schemes)
Δηλώνει
ότι
μια
τιμή
είναι
Ένας
όρος
από
ελεγχόμενο
λεξικό
(π.χ.,
Library
of
Congress
Subject
Headings)
Χαρακτήρες
μορφοποιημένοι
με
συγκεκριμένο
τρόπο
(π.χ.,
«2003‐05‐02»
σημαίνει
«2
Μαΐου»,
όχι
«5
Φεβρουαρίου»)
Ακόμα
και
αν
ένα
σχήμα
δεν
είναι
γνωστό
από
τον
ερμηνευτή
(λογισμικό),
η
τιμή
πρέπει
να
είναι
«κατάλληλη»
και
χρησιμοποιήσιμη
για
ανακάλυψη
πόρων
41
Dublin
Core:
μη
Κωδικοποίηση
Τιμών
Title
Creator
Descripkon
Publisher
Contributor
Rights
42
Κωδικοποίηση
Τιμών
(1/2)
Στοιχείο
Σχήμα
κωδικοποίησης
Date
W3C‐DTF
DCMI
Type
DCMI
Type
Vocabulary
Format IMT
Idenkfier URI
Source URI
Language
ISO
639‐2
RFC
1766
Relakon
URI
43
Κωδικοποίηση
Τιμών
(2/2)
Στοιχείο
Σχήμα
κωδικοποίησης
Subject
LCSH
MeSH
DDC
UDC
LCC
Coverage
DCMI
Point
ISO
3166
DCMI
Box
DCMI
Period
W3C‐DTF
44
Κωδικοποίησης
Τιμών
του
«Type»
Text
(βιβλία,
άρθρα,
email,
fax,
…)
Image
(εικόνες,
κινούμενες
εικόνες,
διαγράμματα,
…)
Sound
(μουσικό
CD,
αρχείο
μουσικής,
ομιλία,
…)
Interackve
Resource
(υπηρεσίες
συζήτησης,
…)
Service
(τραπεζικές
υπηρεσίες,
υπηρεσία
Z3950,
…)
So¡ware
(λογισμικό
υπολογιστή)
Dataset
(πίνακες,
βάσεις
δεδομένων,
…)
Event
(συνάντηση,
έκθεση,
συνέδριο,
δίκη,
γιορτή,
…)
Colleckon
(συλλογή
τεκμηρίων)
45
Παραδείγματα
Dublin
Core
Κωδικοποίηση
Dublin
Core
σε
HTML
Οι
κανόνες
σύνταξης
των
μεταδεδομένων
υπαγορεύονται
από
τις
γλώσσες
κωδικοποίησης:
HTML,
XML,
…
Το
πρόθεμα
DC
πριν
από
ένα
στοιχείο
δεδομένων
προσδιορίζει
ότι
αυτό
ορίζεται
με
το
πρότυπο
Dublin
Core
Γενικά,
η
σύνταξη
είναι
ως
εξής:
<meta
name
=
“PREFIX.ELEMENT_NAME”
lang=“LANG”
scheme=“SCHEME”
content
=
“ELEMENT_VALUE”>
Για
παράδειγμα:
<meta
name
=
“DC.Title”
content
=
“Το
λίγο
του
κόσμου”>
<meta
name
=
“DC.Creator”
content
=
“Δημουλά,
Κική”>
47
Παράδειγμα,
HTML
με
DC
<html>
<head>
<ktle>Το
λίγο
του
Κόσμου
</ktle>
<meta
name
=
“DC.Title”
content
=
“Το
λίγο
του
κόσμου”>
<meta
name
=
“DC.Creator”
content
=
“Δημουλά,
Κική”>
<meta
name
=
“DC.Publisher”
content
=
“Στιγμή”>
<meta
name
=
“DC.Date.Issued”
content
=
“1990”>
<meta
name
=
“DC.Language”
scheme
=
“ISO639‐2”
content
=
“gre”>
</head>
<body><pre>
…Υπήρξα
περίεργη
και
μελετηρή.
…
</pre></body>
</html>
48
Dublin
Core
σε
XML
S.
Abiteboul,
P.
Buneman,
D.
Suciu
“Data
on
the
Web:
From
Relaeons
to
Semistructured
Data
and
XML”
Morgan
Kaufmann
Publishers,
2000.
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
<?xml
version="1.0"
encoding="UTF‐8"?>
<book
xmlns:dc="h–p://purl.org/dc/elements/1.1/"
xmlns:isbn
="h–p://www.isbn.org/def">
<dc:ktle>
Data
on
the
Web:
From
Relakons
to
Semistructured
Data
and
XML</dc:ktle>
<dc:creator>
S.
Abiteboul</dc:creator>
<dc:creator>
P.
Buneman</dc:creator>
<dc:creator>
D.
Suciu</dc:creator>
<dc:publisher>Morgan
Kaufmann
Publishers
<dc:publisher>
<dc:date>2000</dc:date>
<dc:type>Text
</dc:type>
<isbn:number>0‐201‐06673‐4</isbn:number>
</book>
49
Dublin
Core
–
Επεκτασιμότητα
Η
αρχιτεκτονική
του
Dublin
Core
υποστηρίζει
πιο
εξελιγμένες
λύσεις
μεταδεδομένων
Αλλά
προσοχή:
προτιμάμε
επέκταση
του
DC
ή
επιλογή
άλλων
πλουσιοτέρων
σχημάτων;
Έχουμε
επεκτάσεις
του
Dublin
Core
σε
εξειδικευμένους
τομείς
(domain‐specific)
Ομάδες
εργασίας
(του
DCMI)
αναπτύσσουν
Προφίλ
Εφαρμογών
(applicaeon
profiles)
για
ειδικούς
τομείς
50
Προσαρμογή
Μεταδεδομένων
Τα
μεταδεδομένα
προσαρμόζονται
σε
πολλαπλές
παραλλαγές
/
ποικιλίες
Αποτυπώνοντας
την
ανομοιομορφία
των
δημιουργών
και
διατηρητών
μεταδεδομένων
Προσφέροντας
για
κάθε
κοινότητα
(συγκεκριμένο
χώρο)
εξειδικευμένη
λειτουργικότητα,
δημιουργία,
διαχείριση,
πρόσβαση,
…
Τηρώντας
τα
αντίστοιχα
πρότυπα
…
Μεγαλύτερη
εξειδίκευση
=
μεγαλύτερη
λειτουργικότητα
=
λιγότερη
διαλειτουργικότητα!
51
Τι
είναι
το
Προφίλ
Εφαρμογής
Ένα
σχήμα
μεταδεδομένων
που
ενσωματώνει
ένα
σύνολο
στοιχείων
από
ένα
ή
περισσότερα
σύνολα
στοιχείων
μεταδεδομένων
(ή
λεξιλογίων
ή
χώρους
ονομάτων
–
namespaces)
Ένα
σύνολο
από
πολιτικές
που
ορίζουν
πώς
τα
στοιχεία
πρέπει
να
εφαρμόζονται
στο
πεδίο
της
εφαρμογής
Ένα
σύνολο
οδηγιών
που
ξεκαθαρίζουν
τις
πολιτικές
που
αφορούν
τα
στοιχεία
52
Λεξιλόγια
και
Προφίλ
Εφαρμογών
Το
Λεξιλόγιο
δηλώνει
όρους
και
ορισμούς
Λεξιλόγιο
Dublin
Core
=
Πρότυπο
Dublin
Core
Το
Προφίλ
Εφαρμογής
επανα‐χρησιμοποιεί
όρους
από
ένα
ή
περισσότερα
λεξιλόγια
Μπορεί
να
συνδυάζει
όρους
από
πολλαπλά
λεξιλόγια
Μπορεί
να
προσαρμόζει
(εξειδικεύει)
ορισμούς
για
τοπικούς
σκοπούς
ή
εξειδικευμένους
τομείς
(domain‐
specific)
Όλοι
οι
όροι
πρέπει
να
ορίζονται
στα
λεξιλόγια
Μπορεί
να
περιλαμβάνει
τοπικά
ορισμένα
λεξιλόγια
53
Συμπεράσματα
Χρήση
προτύπων
και
καθιερωμένων
κανόνων
Όχι
αυτοσχεδιασμοί
στην
περιγραφή
των
δεδομένων
Έστω
και
να
φαινομενικά
επαρκούν
για
την
εφαρμογή
Δεν
φτάνει
να
δουλεύει
μια
εφαρμογή
Πρέπει
να
μπορεί
να
δια‐λειτουργεί
στο
μέλλον
54
Metadata
Object
Descrip]on
Schema
(MODS)
Dublin
Core
15
elements
+
qualifiers
Metadata
container
&
exchange
medium
Απλό,
με
μεγάλη
επιρροή
σε
έργα
ψηφιακών
βιβλιοθηκών
Διπλή
προσέγγιση
του
σημασιολογικού
εύρους
(fields
,
qualifiers)
Σημασιολογική
ευρύτητα
στοιχείων
(π.χ.
Creator:
authors,
editors,
κ.α.)
Τα
qualifiers
εμποδίζουν
τη
διαλειτουργικότητα
MODS:
ακρίβεια
και
διαλειτουργικότητα
58
MODS
Metadata
Object
Descripkon
Schema
Library
of
Congress
Network
Development
and
MARC
Standards
Office
Περιγράφει
τη
μορφή
του
περιεχομένου
19
elements,
64
sub‐elements
Επεκτείνει
το
σύνολο
των
στοιχείων
ενσωματώνοντας
άλλα
XML
documents
Υποσύνολο
του
MARC
αλλά
όχι
με
αριθμητικά
πεδία
Όλα
τα
στοιχεία
και
τα
γνωρίσματα
αντιστοιχούν
σε
MARC
21
fields
Crosswalk
MODS
‐
MARCXML
59
MODS
top
level
elements
ktleInfo
note
name
subject
typeOfresource
Classificakon
genre
relatedItem
originInfo
locakon
language
accessCondikon
physicalDescripkon
extension
(δήλωση
χρήσης
στοιχείων
άλλου
προτύπου
abstract
recordInfo
tableOfContents
idenkfier
targetAudience
60
A†ributes
ID
δίνει
κωδικό
στο
element
για
αναφορές
σε
αυτό
type
<name
type="personal">Christos<name>
lang,
xml:lang
κωδικοί
από
το
iso639‐2b,
δεν
υπάρχει
αντίστοιχο
στο
MARC
21
<descrip]on
lang="eng">District
Commissioner</descrip]on>
<]tleInfo
xml:lang="fr"
type="translated">
translitera]on
encoding
για
ημερομηνίες
w3cd)
για
ISO
8601
YYYY‐MM‐DD.
iso8601
YYYYMMDD.
marc
εφαρμόζεται
μόνο
στο
στοιχείο
<dateIssued>
Point:
για
ημερομηνίες
με
τιμές
start
και
end
xlink:
<abstract
xlink:href=
"h–p://www.ojp.usdoj.gov/bjs/abstract/cchrie98.htm"/>
61
MODS
Lite
(1/2)
<ktleInfo>
<ktle>
<name>
<namePart>
<typeOfResource>
text,
cartographic,
mulkmedia
<genre>
εξειδίκευση
του
<typeOfResource>
<originInfo>
προέλευση
του
αντικειμένου
<dateIssued>,
<dateCreated>,
<dateCaptured>,
<dateOther>
<publisher>
<language>
<physicalDescripkon>
<internetMediaType>
sub‐element
του
<physicalDescripkon>,
MIME
type
<extent>
sub‐element
του
<physicalDescripkon>
<form>
<abstract>
<tableOfContents>
τα
περιεχόμενα
του
αντικειμένου
<note>
62
MODS
Lite
(2/2)
<subject>
όροι
από
taxonomy
<topic>
sub‐element
του
<subject>,
θεματικός
όρος
<temporal>
sub‐element
του
<subject>,
χρονικά
διαστήματα
<geographic>
sub‐element
του
<subject>,
γεωγραφικοί
όροι,
γεωγραφική
ιεραρχία
<cartographics>
sub‐element
του
<subject>,
χωρικά
δεδομένα,
κλίμακες
κλπ
<classificakon>
το
ταξινομικό
σύστημα
<relatedItem>
για
τα
μέρη
μιας
συλλογής
<idenkfier>
<locakon>
<url>
<accessCondikon>
περιορισμοί
πρόσβασης
(MARC21
506,
540)
<recordInfo>
τρόπος
δημιουργίας
του
MODS
record
63
]tleInfo:
υποχρεωτικό
αντιστοιχεί
στα
DC
Creator,
Contributor
ή
MARC
21
1XX,
7XX
A–ributes
type
abbreviated
(MARC
21
field
210),
translated
(242,
246),
alternaeve
(246,
740),
uniform
(130,
240,
730)
authority
ο
τίτλος
ελέγχεται
από
ένα
record
σε
ένα
authority
file
(e.g.
authority="naf").
displayLabel
φαίνεται
πρόσθετο
κείμενο
(MARC
21
field
246
subfield
$i)
Sub‐elements
<ktle>
χωρίς
γνώρισμα
αντιστοιχεί
στο
245
MARC
21
field
<subktle>
MARC
21
fields
242,
245,
246
subfield
$b
<partNumber>
MARC
21
fields
130,
240,
242,
243,
245,
246,
247,
730,
740
subfield
$n.
<partName>
MARC
21
fields
130,
240,
242,
243,
245,
246,
247,
730,
740
subfield
$p
<nonSort>
το
κείμενο
που
βρίσκεται
σε
αυτές
τις
ετικέτες
δεν
λαμβάνεται
υπ’
όψη
στην
ταξινόμηση
64
Name
A–ributes
type
personal,
corporate,
conference
authority,
ID,
lang,
xml:lang,
xlink,
script,
translitera]on
Sub‐elements
<namePart>
type:date,
family,
given,
termsOfAddress
<affilia]on>,
<role>
<name
type="personal">
<namePart
type="termsOfAddress">Dr.</namePart>
<namePart>Brown,
B.
F.</namePart>
<affiliakon>Chemistry
Dept.,
American
University</affiliakon>
<role>
<roleTerm
type="text">creator</roleTerm>
<roleTerm
type="code">cre</roleTerm>
</role>
<role>
<roleTerm
type="text">author</roleTerm>
<roleTerm
type="code">aut</roleTerm>
</role></name>
65
Παράδειγμα
–
βιβλίο
(1/3)
<?xml
version="1.0"
encoding="UTF‐8"
?>
<mods
<ktleInfo>
<ktle>Sound
and
fury
:</ktle>
<subTitle>the
making
of
the
punditocracy
/</subTitle>
</ktleInfo>
<name
type="personal">
<namePart>Alterman,
Eric</namePart>
<role>
<roleTerm
type="text">creator</roleTerm>
</role>
</name>
<typeOfResource>text</typeOfResource>
<genre
authority="marc">bibliography</genre>
<originInfo>
<place>
<code
authority="marc"
nyu</code>
<text
>Ithaca,
N.Y</text>
</place>
66
Παράδειγμα
–
βιβλίο
(2/3)
<publisher>Cornell
University
Press</publisher>
<dateIssued>c1999</dateIssued>
<dateIssued
encoding="marc">1999</dateIssued>
<issuance>monographic</issuance>
</originInfo>
<language
authority="iso639‐2b"
type="code">eng</language>
<physicalDescripkon>
<form
authority="marcform">print</form>
<extent>vii,
322
p.
;
23
cm.</extent>
</physicalDescripkon>
<note
type="statement
of
responsibility">Eric
Alterman.</note>
<note>Includes
bibliographical
references
(p.
291‐312)
and
index.</note>
<subject
authority="lcsh">
<geographic>United
States</geographic>
<topic>Poli]cs
and
government</topic>
<temporal>20th
century.</temporal>
</subject>
67
Παράδειγμα
–
βιβλίο
(3/3)
<classificakon
authority="lcc">PN4888.P6
A48
1999</classificakon>
<classificakon
edikon="21"
authority="ddc">071/.3</classificakon>
<recordInfo>
<recordContentSource>DLC</recordContentSource>
<recordCreakonDate
encoding="marc">990730</recordCreakonDate>
<recordChangeDate
encoding="iso8601">20000406144503.0</recordChangeDate>
<recordIdenkfier>11761548</recordIdenkfier>
</recordInfo>
</mods>
68
Παράδειγμα
–
χάρτης
(1/3)
<?xml
version="1.0"
encoding="UTF‐8"
?>
<mods>
<ktleInfo>
<ktle>Campbell
County,
Wyoming
/</ktle>
</ktleInfo>
<name
type="corporate">
<namePart>Campbell
County
Chamber
of
Commerce</namePart>
</name>
<typeOfResource>cartographic</typeOfResource>
<genre
authority="marc">map</genre>
<originInfo>
<place>
<placeTerm
authority="marccountry"
type="code">wyu</placeTerm>
</place>
<place>
<placeTerm
type="text">[Gille†e,
Wyo.]</placeTerm>
</place>
<publisher>Campbell
County
Chamber
of
Commerce</publisher>
69
Παράδειγμα
–
χάρτης
(2/3)
<dateIssued>[1982?]</dateIssued>
<dateIssued
encoding="marc">1982</dateIssued>
<issuance>monographic</issuance>
</originInfo>
<language>
<languageTerm
authority="iso639‐2b"type="code">eng</languageTerm>
</language>‐
<physicalDescripkon>
<extent>1
map
;
33
x
15
cm.</extent>
</physicalDescripkon>
<note
type="statement
of
responsibility">this
map
reproduced
by
Campbell
County
Chamber
of
Commerce.</note>
<note>In
lower
right
corner:
Kintzels‐Casper.</note>
<subject
authority="lcsh">
<geographic>Campbell
County
(Wyo.)</geographic>
<topic>Maps</topic>
</subject>
<classificakon
authority="lcc">G4263.C3
1982
.C3</classificakon>
70
Παράδειγμα
–
χάρτης
(2/3)
<recordInfo>
<recordContentSource>DLC</recordContentSource>
<recordCreakonDate
encoding="marc">830222</recordCreakonDate>
<recordChangeDate
encoding="iso8601">19830426000000.0</recordChangeDate>
<recordIdenkfier>5466714</recordIdenkfier>
</recordInfo>
</mods>
71
Encoded
Archival
Descrip]on
(EAD)
Αρχειακά μεταδεδομένα
73
Αρχείο
Υπό-σειρά Τεκµήριο
Υπό-σειρά
Φάκελος
Τεκµήριο
74
Εργαλεία έρευνας (Finding aids)
Τελικό
προϊόν
της
αρχειακής
περιγραφής
Πληροφοριακό
εργαλείο
το
οποίο
περιλαμβάνει
μεταδεδομένα
που
εξυπηρετούν
την
αναζήτηση,
διαχείριση
και
ερμηνεία
ενός
αρχείου
και
εξηγούν
το
περιβάλλον
δημιουργίας
του
75
Ξεκινώντας...
Απαραίτητες
πληροφορίες
Τίτλος
Όνομα
δημιουργού
και
σκοπός
δημιουργίας
Ημερομηνίες
Μοναδικός
αριθμός
ταυτοποίησης
Διαδικασία
πρόσκτησης
Περιορισμοί
πρόσβασης
και
/
ή
αναπαραγωγής
Υλικό
που
έχει
αποκοπεί
από
το
κύριο
μέρος
76
EAD
Περιγραφικά
μεταδεδομένα
Έμπνευση:
Text
Encoding
Inikakve
(TEI,
1987)
Πρώτη
προσπάθεια:
Πανεπιστήμιο
Μπέρκλεϋ
της
Καλιφόρνια
(1993)
SGML/XML
DTD
EAD
version
1.0:
1998
EAD
version
2002:
η
νέα
έκδοση
Η
ανάπτυξη
του
EAD
ξεκίνησε
από
τις
ΗΠΑ
Γρήγορα
υπήρξε
ενδιαφέρον
από
τη
παγκόσμια
αρχειακή
κοινότητα
Society
of
American
Archivists
(h–p://www.archivists.org/)
και
Library
of
Congress
(h–p://www.loc.gov/ead/)
77
Περιλαμβάνει
επισκόπηση
του
αρχείου
(<did>),
διαχειριστικές
και
συμπληρωματικές
πληροφορίες
(π.χ.
<ead>
<bioghist>,
<accessrestrict>
κτλ),
περιγραφή
συστατικών
μερών
(<dsc>)
<ead>
<eadheader> <frontmatter> <archdesc>
υποχρεωτικό προαιρετικό υποχρεωτικό
Πληροφορίες
για
το
εργαλείο
Χρησιμοποιείται
για
την
παροχή
έρευνας
και
όχι
για
το
αρχείο.
πληροφοριών
έκδοσης,
όπως
της
Μεταδεδομένα
ηλεκτρονικού
σελίδας
τίτλου
του
έντυπου
εργαλείου
έρευνας
εργαλείου
έρευνας
ή
άλλων
προκαταρτικών
πληροφοριών
78
<eadheader>
Υποχρεωτικό
στοιχείο
Βασισμένο
στο
TEI
header
Πληροφορίες
για
το
εργαλείο
έρευνας
και
όχι
για
το
αρχείο
Μεταδεδομένα
ηλεκτρονικού
εργαλείου
έρευνας
«Ηλεκτρονική
σελίδα
τίτλου»
79
<eadheader>
<ead>
<eadheader>
<eadid> <filedesc> <profiledesc> <revisiondesc>
80
<eadheader>
<eadid>
Υποχρεωτικό
στοιχείο
Κωδικός
ταύτισης
του
εργαλείου
έρευνας
<filedesc>
Υποχρεωτικό
στοιχείο
Βασικές
βιβλιογραφικές
πληροφορίες
για
το
εργαλείο
έρευνας
<ktlestmt>,
<edikonstmt>,
<publicakonstmt>,
<seriesstmt>,
<notestmt>
81
<eadheader>
<profiledesc>
Πληροφορίες
για
την
κωδικοποίηση
του
εργαλείου
έρευνας
<creakon>,
<langusage>,
<descrules>
<revisiondesc>
Πληροφορίες
για
αλλαγές
στο
εργαλείο
έρευνας
<list>,
<change>
82
<archdesc>
Υποχρεωτικό
στοιχείο
Εργαλείο
έρευνας
Περιλαμβάνει
Επισκόπηση
του
αρχείου
(<did>)
Διαχειριστικές
και
συμπληρωματικές
πληροφορίες
(π.χ.
<bioghist>,
<accessrestrict>
κτλ)
Περιγραφή
συστατικών
μερών
(<dsc>)
83
<archdesc>
<accessrestrict> <accruals>
<acqinfo> <altformavail>
<appraisal> <arrangement>
<bibliography> <bioghist>
<controlaccess> <custodhist>
<dao> <daogrp>
<descgrp> <did>
<dsc> <fileplan>
<index> <note>
<odd> <originalsloc>
<otherfindaid> <phystech>
<prefercite> <processinfo>
<relatedmaterial> <runner>
<scopecontent> <separatedmaterial>
<userestrict>
84
<archdesc>
<did>
Υποχρεωτικό
στοιχείο
Εμφανίζεται
και
μέσα
στην
περιγραφή
των
συστατικών
μερών
(<c>
και
<c01>
‐
<c12>)
Βασικές
πληροφορίες
για
το
σύνολο
του
αρχείου
(υψηλότερο
επίπεδο)
<uni¹tle>,
<originakon>,
<langmaterial>,
<physdesc>,
<unitdate>,
<unikd>,
<abstract>,
<physloc>,
<repository>
...
85
<archdesc>
<accessrestrict>
Διαθεσιμότητα
του
αρχείου
<acqinfo>
Πηγή
πρόσκτησης
και
συνθήκες
πρόσκτησης
<bioghist>
Βιογραφία
ή
διοικητική
ιστορία
δημιουργού
<controlaccess>
Σημεία
πρόσβασης
<corpname>,
<famname>,
<geogname>,
<persname>,
<subject>,
<ktle>,
<genreform>
...
86
<archdesc>
<scopecontent>
Επισκόπηση
περιεχομένου
του
αρχείου
(σε
μορφή
κειμένου)
<separatedmaterial>
Υλικό
από
την
ίδια
πηγή
που
έχει
αποκοπεί
φυσικά
ή
εκκαθαριστεί
από
το
αρχείο
<userestrict>
Πληροφορίες
για
τις
συνθήκες
που
επηρεάζουν
τη
χρήση
του
αρχείου
εφόσον
έχει
επιτραπεί
η
πρόσβαση
87
<archdesc>
<dsc>
Προαιρετικό
στοιχείο
Αναλυτική
περιγραφή
του
αρχείου
Περιγραφή
από
το
γενικό
στο
ειδικό
Συστατικά
μέρη:
<c>
ή
<c01>
‐
<c12>
88
<archdesc>
Για
τη
σύνδεση
με
ένα
ή
περισσότερα
ψηφιακά
αντικείμενα
<daogrp>
Digital
Archival
Object
Group
<daodesc>
Digital
Archival
Object
Descripkon
<daoloc>
Digital
Archival
Object
Locakon
<daogrp>
<daodesc>
<head>Image
Sampler</head>
<p>Explanatory
paragraph</p>
</daodesc>
<daoloc
href="//images/Baker109.jpeg">
<daodesc>
<p>Ella
Baker,
head‐and‐shoulders
portrait</p>
</daodesc>
</daoloc>
</daogrp>
89
EAD
–
Γνωρίσματα
Πρόσθετες
πληροφορίες
για
τα
στοιχεία
Μεταδεδομένα
για
τα
στοιχεία
Επεξεργασία
από
λογισμικό
«Κωδικοποιημένα
δεδομένα»
Τιμές
Σταθερές
Προτεινόμενες
Ανεξάρτητες
90
Γνωρίσματα
level
Ιεραρχικό
επίπεδο
του
τεκμηρίου
που
περιγράφεται
<archdesc>
(Υποχρεωτικό),
<c>
και
<c01>
‐
<c12>
Τιμές:
colleckon,
fonds,
class,
recordgrp,
series,
subfonds,
subgrp,
subseries,
file,
item,
otherlevel
π.χ.
<archdesc
level=“fonds”>
<c
level=“item”>
<c02
level=“subseries”>
91
Γνωρίσματα
type
Διαθέσιμο
για
αρκετά
στοιχεία
<unitdate>
(bulk,
inclusive,
other)
<archdesc>
(inventory,
register,
other)
<dsc>
(analykcover,
combined,
in‐depth,
othertype)
92
Γνωρίσματα
audience
(external,
internal)
countrycode
(π.χ.
GR)
datechar
(π.χ.
creakon,
accumulakon,
ή
modificakon)
findaidstatus
(π.χ.
“edited‐full‐dra¡”
)
relatedencoding
(π.χ.
MARC
21)
encodinganalog
(π.χ.
500)
langcode
(π.χ.
gre)
mainagencycode
(π.χ.
ELIA)
normal
(π.χ.
1756/1868)
93
Παράδειγμα
<archdesc
level=“fonds”>
<did>
<uni¹tle>Αρχείο
Γραμματείας
/
Υπουργείου
επί
των
Οικονομικών
</uni¹tle>
<unikd
countrycode=“GR”
repositorycode=“GAK”>256.12</unikd>
<unitdate
normal=“1833/1862”>1833‐1862</unitdate>
<langmaterial>
<language
langcode=“fre”>Κυρίως
γαλλικά</language>
<language
langcode=“gre”>και
δευτερευόντως
Ελληνικ
</langmaterial>
<originakon>
<corpname>Ανάκτορα,
Γραμματεία
/
Υπουργείο
επί
των
Οικονομικ
</originakon>
</did>
94
<accessrestrict><p>Δεν
υπάρχουν
περιορισμοί
πρόσβασης
</p>
</accessrestrict>
<acqinfo><p>Η
πρόσκτηση
από
τα
Γ.Α.Κ.
πολλών
αρχείων
του
δημόσιου
τομέα
του
19ου
αιώνα
ήταν
ιδιαίτερα
δυσχερής...
</p>
</acqinfo>
<bioghist><p>Στις
25
Ιανουαρίου
/
1
Φεβρουαρίου
1833
καθιερώθηκε,
με
διάταγμα
της
Αντιβασιλείας,
οι
διευθύνοντες
στα
Υπουργεία
να
φέρουν
τον
τίτλο
του
«Γραμματέως
της
Επικρατείας»...
</p>
</bioghist>
<controlaccess>
<controlaccess>
<subject>Ελληνική
Επανάσταση</subject>
<subject>Οικονομικά</subject>
</controlaccess>
</controlaccess>
<scopecontent><p>Το
αρχείο
της
Γραμματείας
διαρθρώνεται
ως
εξής:…</p>
</
scopecontent>
95
<dsc>
<c01
level=“subfonds”>
<did>
<uni¹tle>Υπο‐αρχείο
Ανακτόρων</uni¹tle>
<unitdate>1833‐1844</unitdate>
<originakon>
<corpname>Ανάκτορα</corpname>
</originakon>
</did>
<c02
level=“series”>
<did>
<uni¹tle>Δάση</uni¹tle>
<unitdate>1833‐1844</unitdate>
</did>
<c03
level=“file”>…</c03>
</c02>
</c01>
</dsc>
96
Εισαγωγή
στη
γλώσσα
XML
HTML
Απλή
γλώσσα
σημειοθέτησης
(markup
language)
Το
κείμενο
εμπλουτίζεται
με
“εντολές”
της
γλώσσας
οι
οποίες
ονομάζονται
ετικέτες
(tags),
οι
οποίες
συνήθως
αποτελούνται
από
μια
ετικέτα
αρχής
(start
tag)
και
μια
ετικέτα
τέλους
(end
tag).
Με
την
HTML
περιγράφουμε
πως
θέλουμε
να
παρουσιάζεται
η
πληροφορία
ενός
κειμένου.
2
Παράδειγμα
HTML:
Λίστα
Βιβλίων
<HTML>
<BODY>
Fiction:
<UL><LI>Author: Milan Kundera</LI>
<LI>Title: Identity</LI>
<LI>Published: 1998</LI>
</UL>
Science:
<UL><LI>Author: Richard Feynman</LI>
<LI>Title: The Character of Physical Law</LI>
<LI>Hardcover</LI>
</UL>
</BODY>
</HTML>
3
Πέρα
από
την
HTML:
XML
eXtensible
Markup
Language
(XML)
αποτελεί
μια
εξαιρετικά
απλή
διάλεκτο
της
γλώσσας
Standard
Generalized
Markup
Language
(SGML),
η
οποία
αναπτύχθηκε
με
στόχο
να
διευκολύνει
το
χειρισμό,
επεξεργασία,
διακίνηση
και
αποθήκευση
τεκμηρίων
στον
Παγκόσμιο
Ιστό
(web).
Συνδυασμός
SGML
και
HTML:
Η
ισχύς
της
SGML
με
την
απλότητα
της
HTML.
Επιτρέπει
τον
ορισμό
νέων
γλωσσών
σημειοθέτησης,
με
τη
βοήθεια
δηλώσεων
τύπων
εγγράφων
(Document
Type
DeclaraXons)
(DTDs).
Τεχνικά
εγχειρίδια:
«Extensible
Markup
Language
(XML)
1.0
(Second
Ediwon)»
βρίσκεται
στη
διεύθυνση:
hZp://www.w3.org/TR/REC‐xml
4
Πως ξεκινά ένα XML τεκμήριο
Ένα
απλό
XML
τεκμήριο:
Δήλωση
XML
<?xml version="1.0"?>
<greeting>Hello, world!</greeting>
Ένα
απλό
στοιχείο
της
XML
5
XML:Στοιχεία
και
γνωρίσματα
Όνομα
Όνομα
στοιχείου
γνωρίσματος
Τιμή
γνωρίσματος
</ετικέτα>
Ετικέτα
τέλους
6
Παράδειγμα
XML
τεκμηρίου
Βιβλιογραφία
S.
Abiteboul,
P.
Buneman,
D.
Suciu
“Data
on
the
Web:
From
RelaXons
to
Semistructured
Data
and
XML”
Morgan
Kaufmann
Publishers,
2000.
Norman
Walsh
“A
Guide
to
XML”
World
Wide
Web
Journal,
Vol.
2,
Issue
4,
1997,
pages
97‐107.
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
<bibliography>
<book>
<author>S. Abiteboul</author>
<author>P. Buneman</author>
<author>D. Suciu</author>
<title>Data on the Web: From Relations to Semistructured Data and XML</title>
<publisher>Morgan Kaufmann Publishers</publisher>
<year>2000</year>
</book>
<article>
<author>Norman Walsh</author>
<title>A Guide to XML</title>
<journal>World Wide Web Journal</journal>
<volume>2</volume>
<issue>4</issue>
<year>1997</year>
<pages>97-107</pages>
</article>
</bibliography>
7
XML:
Βασικά
Δομικά
Στοιχεία
Στοιχεία
(elements).
Οι
βασικές
δομικές
μονάδες
της
XML.
Ετικέτα
αρχής,
ετικέτα
τέλους.
Πρέπει
να
είναι
κατάλληλα
εμφωλευμένα.
Τα
στοιχεία
μπορούν
να
διαθέτουν
γνωρίσματα
(aZributes)
τα
οποία
παρέχουν
επιπλέον
πληροφορία
αναφορικά
με
τα
στοιχεία.
Οντότητες:
όπως
οι
μακροεντολές,
αναπαριστούν
ένα
συχνά
εμφανιζόμενο
κείμενο.
Σχόλια.
Οδηγίες
επεξεργασίας
(processing
instrucXons):
αναπαριστούν
οδηγίες
για
εφαρμογές.
Δηλώσεις
τύπων
εγγράφων
(Document
type
declaraXons)
(DTDs).
8
Απλά
και
Σύνθετα
Στοιχεία
Ένα
απλό
στοιχείο
(έχει
για
περιεχόμενο
απλό
κείμενο):
<φοιτητής> Νίκος Νικολάου </φοιτητής>
Ένα
σύνθετο
στοιχείο
(περιλαμβάνει
άλλα
στοιχεία):
Περιεχόμενο
στοιχείων
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
9
Σύνθετα
Στοιχεία
με
Ανάμικτο
Περιεχόμενο
Στοιχείο
με
ανάμικτο
περιεχόμενο:
<φοιτητής>
Το όνοµα του φοιτητή είναι <όνοµα>Νίκος</όνοµα>
ενώ το επώνυµο του είναι <επώνυµο>Νικολάου</
επώνυµο>
</φοιτητής>
Ανάμικτο
περιεχόμενο
10
Καλά
Διαμορφωμένο
XML
Τεκμήριο
Για
να
είναι
ένα
XML
τεκμήριο
καλά
διαμορφωμένο
(well‐formed)
πρέπει
να
υπακούει
στους
κανόνες
σύνταξης
της
XML:
Οι
ετικέτες
του
τεκμηρίου
πρέπει
να
είναι
ισορροπημένες:
σε
κάθε
ετικέτα
αρχής
πρέπει
να
αντιστοιχεί
μια
ετικέτα
τέλους
η
οποία
να
βρίσκεται
μετά
την
ετικέτα
αρχής
μέσα
στο
τεκμήριο.
Αν
μια
ετικέτα
αρχής
E1
εμφανίζεται
νωρίτερα
από
μια
ετικέτα
αρχής
E2,
τότε
η
ετικέτα
τέλους
που
αντιστοιχεί
στην
E1
εμφανίζεται
αργότερα
από
την
ετικέτα
τέλους
που
αντιστοιχεί
στην
E2.
Επομένως,
οι
ετικέτες
τέλους
πρέπει
να
εμφανίζονται
με
την
ανάστροφη
σειρά
από
αυτήν
που
εμφανίζονται
οι
αντίστοιχες
ετικέτες
αρχής.
11
Καλά
Διαμορφωμένο
XML
Τεκμήριο
Καλά
Διαμορφωμένο
XML
Τεκμήριο:
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
Σειρά
εμφάνισης
ετικετών:
<φοιτητής><όνοµα></όνοµα><επώνυµο></επώνυµο></φοιτητής>
Λανθασμένη
σειρά
εμφάνισης
ετικετών:
<φοιτητής><όνοµα></όνοµα><επώνυµο></φοιτητής></επώνυµο>
12
Ένα
μεγαλύτερο
παράδειγμα
XML
τεκμηρίου
Αναπαράσταση
λίστας
φοιτητών
του
ΤΑΒ
σε
μορφή
XML
τεκμηρίου:
<ΤΑΒ>
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
<φοιτητής>
<όνοµα> Πέτρος </όνοµα>
<επώνυµο> Πέτρου </επώνυµο>
</φοιτητής>
<φοιτητής>
<όνοµα> Μίνα </όνοµα>
<επώνυµο> Μίνου </επώνυµο>
</φοιτητής>
...
</ΤΑΒ> 13
Κενά
στοιχεία
στην
XML
Η
σύνταξη
της
XML
επιτρέπει
κενά
στοιχεία
(empty
elements)
δηλαδή
στοιχεία
με
κενό
περιεχόμενο.
Τα
κενά
στοιχεία
έχουν
τη
μορφή:
<ετικέτα></ετικέτα>
Παρέχεται
και
η
ακόλουθη
συντομογραφία
για
τη
σύνταξη
κενών
στοιχείων:
<ετικέτα/>
14
Γνωρίσματα
στην
XML
Ένα
στοιχείο
της
XML
είναι
δυνατό
να
διαθέτει
ένα
σύνολο
από
γνωρίσματα
(a“ributes).
Τα
γνωρίσματα
ορίζονται
σαν
ζεύγη
ονομάτων
–
τιμών.
Τα
γνωρίσματα
τοποθετούνται
στην
ετικέτα
αρχής
του
στοιχείο
στο
οποίο
αναφέρονται.
Στο
παρακάτω
παράδειγμα
το
γνώρισμα
με
όνομα
ΑΜ
χρησιμοποιείται
για
να
αποτυπωθεί
ο
αριθμός
μητρώου
του
φοιτητή:
Γνώρισμα
<φοιτητής ΑΜ = "12345">
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
15
Γνωρίσματα
στην
XML
(συνέχεια)
Οι
τιμές
των
γνωρισμάτων
περικλείονται
ανάμεσα
σε
απλά
ή
διπλά
εισαγωγικά.
Ένα
στοιχείο
είναι
δυνατόν
να
διαθέτει
περισσότερα
του
ενός
γνωρίσματα.
<book isbn="1-55860-622-X" language="English">
<title> Data on the Web </title>
<price currency = "USD"> 100 </price>
</book>
Ενώ
ένα
στοιχείο
μπορεί
να
διαθέτει
υποστοιχεία
με
το
ίδιο
όνομα,
δεν
επιτρέπεται
σε
περισσότερα
του
ενός
γνωρίσματα
του
να
έχουν
το
ίδιο
όνομα.
Η
σειρά
με
εμφάνισης
των
γνωρισμάτων
ενός
στοιχείου
δεν
παίζει
κανένα
ρόλο
σε
αντίθεση
με
τη
σειρά
εμφάνισης
των
στοιχείων
που
είναι
σημαντική.
16
Σχόλια
Τα
σχόλια
(comments)
επιτρέπονται
οπουδήποτε
εκτός
από
το
εσωτερικό
των
ετικετών.
Ένα
σχόλιο
ξεκινά
με
το
<!--
και
τελειώνει
με
το
-->.
Παράδειγμα:
<!-- Αυτό είναι ένα σχόλιο -->
Τα
σχόλια
τοποθετούνται
για
να
κάνουν
το
τεκμήριο
ευανάγνωστο
από
τον
άνθρωπο.
17
Οδηγίες
Επεξεργασίας
Οι
οδηγίες
επεξεργασίας
(Processing
Instrucwons)
PI
επιτρέπουν
σε
ένα
XML
τεκμήριο
να
περιέχει
οδηγίες
που
απευθύνονται
σε
προγράμματα
εφαρμογών.
Μια
οδηγία
επεξεργασίας
περιλαμβάνει
το
όνομα
μιας
εφαρμογής
στην
οποία
απευθύνεται,
ακολουθούμενο
από
πληροφορίες
(οδηγίες
επεξεργασίες,
παραμέτρους
κ.λ.π.)
οι
οποίες
θέλουμε
να
περάσουν
στην
εφαρμογή.
Παράδειγμα:
Η
παρακάτω
οδηγία
επεξεργασίας
απευθύνεται
στην
εφαρμογή
xml‐stylesheet:
<?xml-stylesheet href="book.css" type="text/css"?>
18
CDATA
Ένα
τμήμα
CDATA
ξεκινά
με
<![CDATA[
και
τελειώνει
με
]]>.
Το
περιβάλλον
CDATA
χρησιμοποιείται
όταν
θέλουμε
να
συμπεριλαμβάνουμε
ετικέτες
και
άλλα
ειδικά
σύμβολα
τα
οποία
θέλουμε
να
εκληφθούν
απλά
σαν
ακολουθίες
χαρακτήρων
(συμβολοσειρές).
Παράδειγμα:
Το
ακόλουθο
είναι
ένα
συντακτικά
σωστό
τμήμα
XML
τεκμηρίου:
<![CDATA[ <αρχή> αυτό είναι ένα λανθασµένο στοιχείο </τέλος>]]>
19
Οντότητες
και
αναφορές
οντοτήτων
Ορισμένοι
χαρακτήρες
έχουν
ειδική
σημασία
στην
XML.
Ο
χαρακτήρας
<
υποδηλώνει
την
έναρξη
μιας
ετικέτας
ενώ
ο
χαρακτήρας
>
υποδηλώνει
το
τέλος
της
ετικέτας.
Oι
χαρακτήρες
&,
‘ και
",
έχουν
ειδική
σημασία
στην
XML.
Η
απευθείας
χρησιμοποίηση
τέτοιων
συμβόλων
στο
κείμενο
που
αποτελεί
το
περιεχόμενο
ενός
στοιχείου
οδηγεί
σε
συντακτικά
λανθασμένα
XML
τεκμήρια.
Παράδειγμα
1:
Το
παρακάτω
στοιχείο
είναι
συντακτικά
λανθασμένο:
<στοιχείο> Το σύµβολο < δεν µπορεί να εµφανίζεται έτσι </στοιχείο>
αφού
το
< στο
περιεχόμενο
του
θα
εκληφθεί
ως
έναρξη
ετικέτας.
Η
XML
παρέχει
ενσωματωμένες
οντότητες
οι
οποίες
ονομάζονται
εσωτερικές
οντότητες
(internal
enwwes)
για
την
αναπαράσταση
τέτοιων
συμβόλων
σε
ένα
XML
τεκμήριο
αποφεύγοντας
τα
προβλήματα
σύνταξης.
20
Οντότητες
και
αναφορές
οντοτήτων
(συνέχεια)
Η
τοποθέτηση
τέτοιων
συμβόλων
σε
ένα
XML
τεκμήριο
γίνεται
μέσω
αναφορών
στις
αντίστοιχες
οντότητες.
Μια
αναφορά
οντότητας
(enwty
reference)
ξεκινά
με
το
σύμβολο
&,
ακολουθείται
από
το
όνομα
της
οντότητας,
και
τελειώνει
με
το
σύμβολο
;.
Παράδειγμα
2:
το
<
αποτελεί
αναφορά
στην
οντότητα
με
όνομα
lt
που
αναπαριστά
το
<,
ενώ
με
τα
>,
&,
',
",
αναφερόμαστε
στις
οντότητες
που
αντιστοιχούν
στα
>,
&,
‘ και
" αντίστοιχα.
Παράδειγμα
3:
Το
στοιχείο
στο
Παράδειγμα
1
πρέπει
να
γραφτεί
σαν:
<στοιχείο>Το σύµβολο < δεν µπορεί να εµφανίζεται έτσι</στοιχείο>
21
Οντότητες
και
αναφορές
οντοτήτων
(συνέχεια)
Οντότητες
XML
μπορούν
επίσης
να
χρησιμοποιηθούν
για
να
αναφερθούμε
σε
κείμενο
που
επαναλαμβάνεται
συχνά.
Στην
περίπτωση
αυτή
οι
οντότητες
παίζουν
το
ρόλο
συντομογραφιών.
Επίσης,
οντότητες
μπορούν
να
χρησιμοποιηθούν
για
να
ενσωματώσουμε
το
περιεχόμενο
εξωτερικών
αρχείων.
Οι
οντότητες
της
κατηγορίας
αυτής
ονομάζονται
και
εξωτερικές
οντότητες
(external
enwwes),
και
θα
πρέπει
να
δηλωθούν
από
το
χρήστη
στο
DTD,
με
τον
τρόπο
που
θα
δούμε
στην
αντίστοιχη
ενότητα.
Κάθε
οντότητα
θα
πρέπει
να
έχει
ένα
μοναδικό
όνομα.
Οι
οντότητες
της
XML
μοιάζουν
με
τις
μακροεντολές
των
γλωσσών
προγραμματισμού.
22
Αναφορές
χαρακτήρων
Οι
αναφορές
χαρακτήρων
(character
references)
έχουν
παρόμοια
μορφή
με
τις
αναφορές
οντότητας.
Χρησιμοποιούνται
για
την
εισαγωγή
οποιουδήποτε
χαρακτήρα
του
συνόλου
ISO/IEC
10646
σε
ένα
XML
τεκμήριο.
Αυτό
γίνεται
περικλείοντας
το
κωδικό
του
χαρακτήρα
ανάμεσα
σε
&
και
;.
Αν
η
αναφορά
χαρακτήρα
ξεκινά
με
&#x
τότε
τα
ψηφία
που
ακολουθούν
μέχρι
το
σύμβολο
τερματισμού
; παρέχουν
τη
δεκαεξαδική
αναπαράσταση
του
χαρακτήρα
στο
ISO/IEC
10646.
Παράδειγμα:
℞
Αν
όμως
ξεκινά
απλά
με
το
&#
τότε
τα
ψηφία
που
ακολουθούν
μέχρι
το
σύμβολο
τερματισμού
; παρέχουν
τη
δεκαδική
αναπαράσταση
του
χαρακτήρα
στο
ISO/IEC
10646.
Παράδειγμα:
℞
Μέσω
των
αναφορών
χαρακτήρων
μπορούμε
να
εισάγουμε
χαρακτήρες
οι
οποίοι
δεν
είναι
προσπελάσιμοι
από
τις
διαθέσιμες
συσκευές
εισόδου.
23
XML:
Ταυτότητες
Αντικειμένων
(Oids)
και
Αναφορές
<person id=“o555”> <name> John </name>
<children idref=“o123”/>
</person>
<person id=“o456”> <name> Mary </name>
<children idref=“o123”/>
</person>
<person id=“o123” mother=“o456” father=“o555”
>
<name>Jim</name>
</person>
Τα
oids
και
οι
αναφορές
στην
XML
είναι
απλά
σύνταξη
24
Document
Type
Definifon
(DTD)
XML:
Document
Type
Definifons
(DTDs)
Πλεονέκτημα
της
XML:
επιτρέπει
να
ορίσουμε
και
να
χρησιμοποιήσουμε
στοιχεία,
γνωρίσματα
και
οντότητες
της
αρεσκείας
μας.
Ένα
έγγραφο
XML
είναι
καλά
διαμορφωμένο
(well‐formed)
αν:
Το
έγγραφο
ξεκινά
με
ένα
δηλωτικό
XML.
Διαθέτει
στοιχείο
ρίζα
που
περιέχει
όλα
τα
υπόλοιπα
στοιχεία.
Όλα
τα
στοιχεία
του
είναι
κατάλληλα
εμφωλευμένα.
Είναι
χρήσιμο
να
τίθενται
κοινά
αποδεκτοί
κανόνες
που
προδιαγράφουν
συγκεκριμένο
λεξιλόγιο
από
επιτρεπτά
ονόματα
στοιχείων
και
γνωρισμάτων,
και
θέτουν
περιορισμούς
ως
προς
την
πολλαπλότητα
εμφάνισης
των
στοιχείων,
την
μεταξύ
τους
σειρά
κ.λ.π.
Κάθε
κοινότητα
χρηστών
μπορεί
να
προδιαγράψει
τη
δική
της
XML
διάλεκτο
με
βάση
τις
ανάγκες
των
μελών
της.
Για
την
επιβολή
τέτοιων
περιορισμών
απαιτείται
ένας
τρόπος
να
περιγραφούν
αυτοί.
Αυτό
μπορεί
να
γίνει
με
τη
βοήθεια
Δηλώσεων
Τύπου
Τεκμηρίων
(Document
Type
Definiwons)
(DTD).
Δηλώσεις
τύπου
τεκμηρίων:
σύνολα
κανόνων
που
ορίζουν
τα
στοιχεία,
τα
γνωρίσματα
και
τις
οντότητες
που
επιτρέπεται
να
εμφανίζονται
στα
XML
έγγραφα.
26
XML:
Document
Type
Definifons
(DTDs)
(συνέχεια)
Το
περιεχόμενο
ενός
DTD
παρέχει
(μετα)πληροφορία
στα
προγράμματα
συντακτικής
ανάλυσης
(parsers)
των
XML
τεκμηρίων.
Η
πληροφορία
αφορά
τους
περιορισμούς
σύνταξης
που
πρέπει
να
πληρούν
τα
τεκμήρια
ώστε
να
θεωρούνται
έγκυρα
ως
προς
το
συγκεκριμένο
DTD.
Έγκυρο
(valid)
XML
τεκμήριο:
αν
συνοδεύεται
από
ένα
DTD
και
είναι
δομημένο
σύμφωνα
με
τους
κανόνες
που
ορίζει
το
DTD.
Ένα
DTD
λειτουργεί
ως
γραμματική
(grammar)
για
μια
κατηγορία
XML
τεκμηρίων,
αφού
παρέχει
ένα
λεξιλόγιο
(αποδεκτά
ονόματα
στοιχείων
και
γνωρισμάτων)
καθώς
και
σύνολο
από
κανόνες
που
διέπουν
τη
σειρά
εμφάνισης,
το
πλήθος
των
εμφανίσεων
κ.λ.π.
των
στοιχείων
σε
ένα
XML
τεκμήριο
προκειμένου
αυτό
να
θεωρείται
έγκυρο.
Το
DTD
από
την
οπτική
γωνία
των
βάσεων
δεδομένων
μπορεί
να
εκληφθεί
σαν
σχήμα
(schema)
για
τα
δεδομένα
που
αναπαριστά
το
XML
τεκμήριο,
με
μια
σημασία
παρόμοια
με
αυτή
των
σχεσιακών
βάσεων
δεδομένων.
Παρόλα
αυτά
ένα
XML
τεκμήριο
δεν
υποχρεούται
να
περιλαμβάνει
(ή
να
συνδέεται)
με
κάποιο
DTD.
27
Παράδειγμα
DTD
Παράδειγμα
XML
τεκμηρίου
που
κωδικοποιεί
στοιχεία
φοιτητών
του
ΤΑΒ:
<ΤΑΒ>
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
<φοιτητής> ... </φοιτητής>
...
</ΤΑΒ>
Ένα
DTD
για
το
πιο
πάνω
τεκμήριο:
<!DOCTYPE ΤΑΒ [ -Το
κεντρικό
στοιχείο
είναι
το ΤΑΒ...
<!ELEMENT ΤΑΒ (φοιτητής*)> -Αποτελείται
από
στοιχεία φοιτητής...
<!ELEMENT φοιτητής (όνοµα, επώνυµο)> -Το
στοιχείο φοιτητής περιλαμβάνει
τα
στοιχεία όνοµα και
επώνυµο...
<!ELEMENT όνοµα (#PCDATA)> -Το όνοµα περιλαμβάνει
χαρακτήρες
<!ELEMENT επώνυµο (#PCDATA)> -Το
επώνυµο περιλαμβάνει
χαρακτήρες....
]>
28
DTD:Δηλώσεις
Τύπου
Στοιχείων
Αυστηρή
Κωδική
λέξη
περιγραφή
του
ELEMENT
που
Όνομα
του
στοιχείου
περιεχομένου
δηλώνει
του
στοιχείου
έναρξη
δήλωσης
στοιχείου
29
Δηλώσεις
Τύπου
Στοιχείων
Δήλωση
Σημασία
R?
0
ή
1
στιγμιότυπο
του
R
R+ 1 ή περισσότερα στιγμιότυπα του R
R* 0 ή περισσότερα στιγμιότυπα του R
R1,
R2,
…
,
Rn
1
στιγμιότυπο
του
R1
ακολουθούμενο
από
1
στιγμ.
του
R2,....,ακολουθούμενο
από
1
στιγμ.
του
Rn
R1
|
R2
|
…
|
Rn
1
στιγμιότυπο
του
R1
ή
του
R2
ή
...
ή
του
Rn
EMPTY Κενό στοιχείο
ANY Οτιδήποτε
#PCDATA
Χαρακτήρες
που
έχουν
υποστεί
συντακτική
ανάλυση
30
DTD:Δηλώσεις
Τύπου
Στοιχείων:
Παράδειγμα
Με
την
έκφραση:
<!ELEMENT s (a, b?,c*)>
δηλώνεται
ότι:
κάθε
στοιχείο
με
ετικέτα
s
που
εμφανίζεται
σε
ένα
έγκυρο
XML
τεκμήριο,
περιλαμβάνει
ένα
ακριβώς
στοιχείο
με
ετικέτα
a
ακολουθούμενο
προαιρετικά
από
ένα
το
πολύ
στοιχείο
με
ετικέτα
b,
και
στη
συνέχεια
από
οσοδήποτε
μεγάλο
πλήθος
(μπορεί
και
μηδέν)
στοιχείων
με
ετικέτα
c.
31
DTD:Δηλώσεις
Τύπου
Στοιχείων:
Παράδειγμα
Με
την
έκφραση:
<!ELEMENT e ((c? , d)* | (d , c)*)>
δηλώνεται
ότι
κάθε
στοιχείο
με
ετικέτα
e που
εμφανίζεται
σε
ένα
έγκυρο
XML
τεκμήριο,
περιλαμβάνει:
μια
ακολουθία
από
(μηδέν
ή
περισσότερα)
ζεύγη
στοιχείων
c,
d
από
τα
οποία
το
c
είναι
προαιρετικό,
είτε
μια
ακολουθία
από
(μηδέν
ή
περισσότερα)
ζεύγη
στοιχείων
d,
c.
32
DTD:Δηλώσεις
Τύπου
Στοιχείων:
Παράδειγμα
(συνέχεια)
Στα
XML
τεκμήρια
που
ακολουθούν
έχουμε
για
ευκολία
θεωρήσει
ότι
τα
στοιχεία
c
και
d
είναι
κενά.
Τα
τεκμήρια
εξετάζονται
ως
προς
την
εγκυρότητα
τους
με
βάση
το
προηγούμενο
DTD.
Έγκυρο
XML
τεκμήριο:
Μη
έγκυρο
XML
τεκμήριο:
<e>
<e>
<d/>
<d/>
<d/>
<c/>
<c/>
<c/>
<d/>
<d/>
<d/>
</e>
</e>
33
Δηλώσεις
Τύπου
Στοιχείων
(συνέχεια)
Για
να
δηλώσουμε
ότι
το
περιεχόμενο
ενός
στοιχείου
είναι
ακολουθία
χαρακτήρων
χρησιμοποιούμε
δηλώσεις
της
μορφής:
<!ELEMENT όνοµα_στοιχείου (#PCDATA)>
Η
παράσταση
τύπος_στοιχείου
είναι
επίσης
δυνατό
να
πάρει
μια
από
τις
τιμές
EMPTY
και
ANY
που
σημαίνουν
το
κενό
στοιχείο,
και
το
στοιχείο
με
οποιοδήποτε
περιεχόμενο
αντίστοιχα.
Αποδεκτές
είναι
επίσης
τιμές
που
αποτελούν
ανάμιξη
#PCDATA
και
ονομάτων
στοιχείων.
Προσοχή:
ένα
στοιχείο
δεν
επιτρέπεται
να
δηλώνεται
περισσότερο
από
μια
φορά
σε
ένα
DTD.
34
DTD:Δηλώσεις
Λίστας
Γνωρισμάτων
Κωδική
λέξη
Δηλώσεις
ΑTTLIST
που
δηλώνει
έναρξη
γνωρισμάτων
Όνομα
του
δήλωσης
λίστας
στοιχείου
γνωρισμάτων
Τριάδες
της
μορφής:
όνομα_γνωρίσματος
τύπος_γνωρίσματος
προκαθορισμός_τιμής
35
Δηλώσεις
Λίστας
Γνωρισμάτων:
Παράδειγμα
<!ATTLIST φοιτητής ΑΜ CDATA #REQUIRED
ΑΔΤ CDATA #IMPLIED >
Το
στοιχείο
φοιτητής
έχει
δύο
γνωρίσματα
με
ονόματα
ΑΜ
και
ΑΔΤ.
Και
τα
δύο
γνωρίσματα
είναι
του
τύπου
CDATA.
Η
παρουσία
του
γνωρίσματος
ΑΜ
είναι
υποχρεωτική
σε
κάθε
εμφάνιση
του
στοιχείου
φοιτητής
(λόγω
του
#REQUIRED).
Η
παρουσία
του
γνωρίσματος
ΑΔΤ
δεν
είναι
υποχρεωτική
(λόγω
του
#IMPLIED).
36
Δηλώσεις
Λίστας
Γνωρισμάτων
(συνέχεια)
Ανάμεσα
στις
πιθανές
τιμές
που
μπορεί
να
πάρει
η
παράμετρος
τύπος_γνωρίσματος
περιλαμβάνονται
και
οι
ακόλουθες:
CDATA,
ID,
IDREF,
IDREFS,
ENTITY,
ENTITIES,
NMTOKEN,
NMTOKENS.
Τα
γνωρίσματα
του
τύπου
CDATA
μπορούν
να
πάρουν
για
τιμή
οποιοδήποτε
κείμενο
(ακολουθία
χαρακτήρων).
Τα
γνωρίσματα
του
τύπου
NMTOKEN
είναι
ειδική
περίπτωση
των
γνωρισμάτων
τύπου
CDATA και
μπορούν
να
πάρουν
για
τιμή
μια
απλή
λέξη.
Τα
γνωρίσματα
του
τύπου
NMTOKENS
μπορούν
να
πάρουν
για
τιμή
πολλαπλές
τιμές
τύπου
NMTOKEN
που
χωρίζονται
μεταξύ
τους
με
κενά.
Τα
γνωρίσματα
του
τύπου
ENTITY
μπορεί
να
πάρουν
για
τιμή
το
όνομα
μιας
απλής
οντότητας
ενώ
τα
γνωρίσματα
του
τύπου
ENTITIES
μπορούν
να
πάρουν
για
τιμή
πολλαπλές
τιμές
του
τύπου
ENTITY
οι
οποίες
χωρίζονται
μεταξύ
τους
με
κενά.
Πέρα
από
τις
παραπάνω
τιμές,
η
παράμετρος
τύπος_γνωρίσματος
είναι
δυνατό
να
πάρει
σαν
τιμή
τη
λίστα
των
πιθανών
τιμών
του
γνωρίσματος.
Στην
περίπτωση
αυτή
μιλάμε
για
απαριθμήσιμους
τύπους
γνωρισμάτων
(enumerated
a“ribute
types).
37
Δηλώσεις
Λίστας
Γνωρισμάτων:
Παράδειγμα
Στη
δήλωση
λίστας
γνωρισμάτων
που
ακολουθεί:
<!ATTLIST book color (red|green|blue) “blue”>
ορίζεται
ότι:
Το
στοιχείο
book
έχει
ένα
γνώρισμα
με
όνομα
color.
Το
γνώρισμα
αυτό
μπορεί
να
πάρει
μια
από
τις
τιμές
red,
green,
blue.
Σε
περίπτωση
που
το
γνώρισμα
απουσιάζει
από
ένα
στοιχείο
book
θεωρείται
ως
εάν
να
είναι
παρών
και
η
τιμή
του
να
είναι
η
blue
(προκαθορισμένη
τιμή).
38
Δηλώσεις
Λίστας
Γνωρισμάτων
(συνέχεια)
Τιμές
της
παράμετρου
προκαθορισμός_τιμής:
Μπορεί
να
πάρει
σαν
τιμή
μια
από
τις
πιθανές
τιμές
του
γνωρίσματος,
με
τη
σημασία
που
αναφέραμε
προηγούμενα.
Η
τιμή
#REQUIRED
η
οποία
επιβάλει
την
υποχρεωτική
εμφάνιση
του
γνωρίσματος
στο
αντίστοιχο
στοιχείο.
Η
τιμή
#IMPLIED
η
οποία
υποδηλώνει
ότι
δεν
παρέχεται
κάποια
προκαθορισμένη
τιμή
(και
δεν
είναι
υποχρεωτική
η
εμφάνιση
του
συγκεκριμένου
γνωρίσματος)
Η
τιμή
#FIXED
ακολουθούμενη
από
μια
συγκεκριμένη
τιμή.
Στην
περίπτωση
αυτή
όλες
οι
εμφανίσεις
του
αντίστοιχου
γνωρίσματος
στο
XML
τεκμήριο
θα
πρέπει
να
έχουν
για
τιμή
τη
συγκεκριμένη
τιμή
που
έχει
δηλωθεί
μετά
από
το
#FIXED.
39
Δηλώσεις
Λίστας
Γνωρισμάτων:
Παράδειγμα
Με
τη
δήλωση:
<!ATTLIST form method CDATA #FIXED "POST">
ορίζεται
ότι:
το
στοιχείο
form
διαθέτει
το
γνώρισμα
method
το
οποίο
είναι
τύπου
CDATA
και
έχει
πάντα
τη
τιμή
POST.
40
Οι
τύποι
γνωρίσματος
ID,
IDREF, και
IDREFS
Ο
τύπος
ID
δηλώνει
ότι
το
γνώρισμα
παίζει
ρόλο
ταυτότητας
για
το
στοιχείο,
παίρνει
δηλαδή
μοναδική
τιμή
που
προσδιορίζει
μονοσήμαντα
το
κάθε
στοιχείο.
Δεν
επιτρέπεται
να
υπάρχουν
περισσότερα
του
ενός
στοιχεία
σε
ένα
έγκυρο
XML
τεκμήριο
τα
οποία
να
διαθέτουν
γνώρισμα
τύπου ID
και
να
έχουν
την
ίδια
τιμή
στο
γνώρισμα
αυτό.
Ο
τύπος
IDREF
δηλώνει
γνωρίσματα
που
παίρνουν
σαν
τιμή
τη
τιμή
του
γνωρίσματος
τύπου ID
κάποιου
άλλου
στοιχείου.
Ένα
γνώρισμα
του
τύπου
ID
συμπεριφέρεται
όπως
ένα
“κλειδί”
σε
μια
σχεσιακή
βάση
δεδομένων,
ενώ
ένα
γνώρισμα
του
τύπου
IDREF
σαν
ένα
“ξένο
κλειδί”
σε
μια
σχεσιακή
βάση
δεδομένων.
Ως
IDREFS
δηλώνονται
γνωρίσματα
τα
οποία
παίρνουν
σαν
τιμή
μια
λίστα
τιμών
του
τύπου IDREF οι
οποίες
χωρίζονται
μεταξύ
τους
με
κενά.
Τα
γνωρίσματα
του
τύπου
ID
πρέπει
να
έχουν
ως
προκαθορισμό
τιμής
είτε
#REQUIRED
είτε
#IMPLIED.
Κάθε
τιμή
που
παίρνει
ένα
γνώρισμα
τύπου
IDREF,
ή
IDREFS
πρέπει
να
υπάρχει
στο
τεκμήριο
ως
τιμή
ενός
γνωρίσματος
του
τύπου
ID.
41
Οι
τύποι
γνωρίσματος
ID,
IDREF,
και
IDREFS:
Παράδειγμα
DTD
Ένα
DTD:
<!DOCTYPE
οικογένεια
[
<!ELEMENT
οικογένεια
(πρόσωπο)*>
<!ELEMENT
πρόσωπο
(όνομα,
επώνυμο)>
<!ATTLIST
πρόσωπο
ΑΔΤ
ID
#REQUIRED
μητέρα
IDREF
#IMPLIED
πατέρας
IDREF
#IMPLIED
παιδιά
IDREFS
#IMPLIED>
<!ELEMENT
όνομα
(#PCDATA)>
<!ELEMENT
επώνυμο
(#PCDATA)>
]>
42
Οι
τύποι
γνωρίσματος
ID,
IDREF, και
IDREFS:
Παράδειγμα
(συνέχεια)
Ένα
XML
τεκμήριο:
<οικογένεια>
<πρόσωπο
ΑΔΤ
=
"Κ123456"
παιδιά
=
"Μ345678
Ν456789">
<όνομα>
Πέτρος
</όνομα>
<επώνυμο>
Πέτρου
</επώνυμο>
</πρόσωπο>
<πρόσωπο
ΑΔΤ
=
"Λ234567"
παιδιά
=
"Μ345678
Ν456789">
<όνομα>
Μαρία
</όνομα>
<επώνυμο>
Πέτρου
</επώνυμο>
</πρόσωπο>
<πρόσωπο
ΑΔΤ
=
"Μ345678"
πατέρας
=
"Κ123456"
μητέρα=
"Λ234567"
>
<όνομα>
Γιώργος
</όνομα>
<επώνυμο>
Πέτρου
</επώνυμο>
</πρόσωπο>
<πρόσωπο
ΑΔΤ
=
“Ν456789”
πατέρας
=
"Κ123456"
μητέρα=
"Λ234567"
>
<όνομα>
Άννα
</όνομα>
<επώνυμο>
Πέτρου‐Ιωάννου
</επώνυμο>
</πρόσωπο>
....
....
</οικογένεια>
43
Δηλώσεις
Οντοτήτων
Βασική
ιδέα:
οι
οντότητες
αποτελούν
συντομογραφίες
σε
ένα
XML
τεκμήριο
και
επομένως
οι
δηλώσεις
των
οντοτήτων
στην
πραγματικότητα
αποτελούν
ορισμό
των
συντομογραφιών
αυτών.
Διακρίνουμε
τρία
είδη
οντοτήτων.
Οι
εσωτερικές
οντότητες
(internal
enwwes),
Οι
εξωτερικές
οντότητες
(external
enwwes),
Οι
οντότητες
παραμέτρων
(parameter
enwwes).
Η
δήλωση
μιας
εσωτερικής
οντότητας
γίνεται
μέσω
μιας
έκφρασης
της
μορφής:
<!ENTITY
όνομα_οντότητας
τιμή_οντότητας>
Στην
περίπτωση
αυτήν,
το
κείμενο
με
το
οποίο
αντικαθίσταται
η
εμφάνιση
της
οντότητας
αποθηκεύεται
μέσα
στη
δήλωση
της
οντότητας.
44
Δηλώσεις
Οντοτήτων
Δηλώσεις
εξωτερικών
οντοτήτων:
μαζί
με
το
όνομα
της
οντότητας
δηλώνεται
και
ένα
URI
το
οποίο
θα
πρέπει
να
ακολουθηθεί
προκειμένου
να
βρεθεί
το
κείμενο
το
οποίο
θα
δοθεί
σαν
τιμή
στην
οντότητα.
Παράδειγμα:
Με
τη
δήλωση:
<!ENTITY TABinfo
SYSTEM "/ionio/information/info.xml">
ορίζεται
η
οντότητα
TABinfo.Κατά
την
επεξεργασία
του
τεκμηρίου
κάθε
εμφάνιση
του
&TABinfo;
θα
αντικαθίσταται
με
το
περιεχόμενο
του
αρχείου
"/
ionio/information/info.xml".
45
Οι
οντότητες
παραμέτρων
Οι
οντότητες
παραμέτρων
εμφανίζονται
μόνο
στα
πλαίσια
ενός
DTD.
Στη
δήλωση
μιας
οντότητας
παραμέτρου
πριν
από
το
όνομα
της
οντότητας
πρέπει
να
τοποθετείται
ο
χαρακτήρας
%.
Το
ίδιο
σύμβολο
% εμφανίζεται
και
στις
αναφορές
σε
οντότητες
παραμέτρου
αντί
για
το
σύμβολο
&.
Οι
αναφορές
σε
οντότητες
παραμέτρου
αντικαθίσταται
άμεσα
με
το
κείμενο
που
αποτελεί
την
τιμή
της
οντότητας
το
οποίο
αποτελεί
πλέον
κομμάτι
του
DTD.
46
Σύνδεση
XML
με
DTD
Προκειμένου
να
εξεταστεί
η
εγκυρότητα
ενός
XML
τεκμηρίου
ως
προς
ένα
DTD,
θα
πρέπει
τα
δύο
αυτά
να
συσχετιστούν.
Γενικά
έχουμε
δύο
επιλογές.
Πρώτη
επιλογή:
να
συμπεριλάβουμε
το
DTD
στο
ίδιο
αρχείο
με
αυτό
που
βρίσκεται
το
XML
τεκμήριο.
Δεύτερη
επιλογή:
να
τοποθετήσουμε
τις
δηλώσεις
του
DTD
σε
ξεχωριστό
αρχείο
και
στη
συνέχεια
να
συσχετίσουμε
κατάλληλα
τα
δύο
αρχεία.
47
Σύνδεση
XML
με
DTD:Παράδειγμα
1
DTD
ενσωματωμένο
στο
XML
τεκμήριο:
DTD
<?xml version="1.0"?>
<!DOCTYPE greeting [
<!ELEMENT greeting (#PCDATA)>
]>
<greeting>Hello, world!</greeting>
48
Σύνδεση XML με DTD:Παράδειγμα 2
Σύνδεση
με
εξωτερικό
αρχείο
στο
οποίο
έχει
αποθηκευτεί
το
DTD:
Σύνδεση
με
DTD
<?xml version="1.0"?>
<!DOCTYPE greeting SYSTEM "hello.dtd">
<greeting>Hello, world!</greeting>
49
Υπό
συνθήκη
τμήματα
Ένα
υπό
συνθήκη
τμήμα
(condiwonal
secwon)
είναι
τμήμα
ενός
εξωτερικού
DTD
το
οποίο
συμπεριλαμβάνεται
ή
δεν
συμπεριλαμβάνεται
στη
λογική
δομή
του
DTD
με
βάση
κάποια
λέξη
κλειδί
(keyword)
η
οποία
συνδέεται
με
αυτό.
Aν
η
τιμή
της
λέξης
κλειδί
είναι
INCLUDE,
τότε
το
περιεχόμενο
του
υπό
συνθήκη
τμήματος
συμπεριλαμβάνεται
στο
DTD.
Αν
η
τιμή
της
λέξης
κλειδί
είναι
IGNORE,
τότε
το
περιεχόμενο
του
υπό
συνθήκη
τμήματος
δεν
συμπεριλαμβάνεται
στο
DTD.
Η
λέξη
κλειδί
σε
ένα
υπό
συνθήκη
τμήμα
μπορεί
να
είναι
αναφορά
σε
οντότητα
παραμέτρου.
Τότε
η
οντότητα
παραμέτρου
πρέπει
να
αντικατασταθεί
με
την
τιμή
της
για
να
μπορέσει
ο
επεξεργαστής
να
αποφασίσει
αν
θα
συμπεριλάβει
το
υπό
συνθήκη
τμήμα.
50
Υπό
συνθήκη
τμήματα:Παράδειγμα
Παράδειγμα:
<!ENTITY
%
dra®
‘INCLUDE’
>
<!ENTITY
%
final
‘IGNORE’
>
<!
[%dra®;
[
<!ELEMENT
arwcle
(comments*,
wtle,
body,
supplements?)>
]]>
<!
[%final;
[
<!ELEMENT
arwcle
(wtle,
body,
supplements?)>
]]>
Η
συμμετοχή
ή
όχι
των
υπό
συνθήκη
τμημάτων
καθορίζεται
από
την
τιμή
των
παραμέτρων
dra®
και
final.
Μεταβάλλοντας
τις
τιμές
των
παραμέτρων
αυτών
μπορούμε
εύκολα
να
εναλλάξουμε
τα
υπό
συνθήκη
τμήματα
τα
οποία
θα
συμπεριληφθούν
στο
DTD.
51
DTD
για
Εξειδικευμένα
Πεδία
Η
ανάπτυξη
τυποποιημένων
DTD
για
εξειδικευμένα
πεδία
επιτρέπει
την
ανταλλαγή
δεδομένων
ανάμεσα
σε
ετερογενείς
πηγές.
Παράδειγμα:
Μαθηματική
Γλώσσα
Σημειοθέτησης
(MathemaXcal
Markup
Language)
(MathML).
Τεχνικό
εγχειρίδιο
«MathemaXcal
Markup
Language
(MathML)
Version
2.0»
από
τη
διεύθυνση
hZp://
www.w3.org/TR/MathML2
Κωδικοποίηση
μαθηματικού
υλικού
στο
web.
Η
παράσταση
(x+y)^2
κωδικοποιείται
στην
MathML
ως:
<apply>
<power/>
<apply>
<plus/>
<ci>x</ci>
<ci>y</ci>
</apply>
<cn>2</cn>
</apply>
52
XML
Namespaces
Χώροι
Ονομάτων
XML
Οι
Χώροι
Ονομάτων
XML
(XML
Namespaces)
είναι
συλλογές
ονομάτων
που
προσδιορίζονται
από
μια
αναφορά
URI
(Uniform
Resource
Idenwfier)
και
χρησιμοποιούνται
για
την
ονομασία
στοιχείων
και
γνωρισμάτων
της
XML.
Όταν
χρησιμοποιούνται
χώροι
ονομάτων,
τα
ονόματα
στοιχείων
και
γνωρισμάτων
εμφανίζονται
με
δύο
συνθετικά,
το
πρόθεμα
(χώρου
ονομάτων)
(prefix)
και
το
τοπικό
τμήμα
(local
part),
τα
οποία
χωρίζονται
μεταξύ
τους
με
:.
Ο
μηχανισμός
αυτός
παράγει
ονόματα
τα
οποία
είναι
παγκοσμίως
μοναδικά.
54
Γιατί
χρησιμοποιούμε
χώρους
ονομάτων
Οι
σχεδιαστές
της
XML
προσβλέπουν
σε
εφαρμογές
στις
οποίες
ένα
XML
τεκμήριο
μπορεί
να
περιλαμβάνει
στοιχεία
και
γνωρίσματα
που
έχουν
οριστεί
και
απευθύνονται
σε
διαφορετικές
εφαρμογές
λογισμικού.
Στόχο
της
ύπαρξης
καλά
τεκμηριωμένων
και
κατανοητών
“λεξιλογίων
ετικετών”
για
το
οποίο
υπάρχει
διαθέσιμο
χρήσιμο
λογισμικό,
αποτελεί
η
επιθυμία
για
επαναχρησιμοποίηση
των
τεκμηρίων
από
πολλές
διαφορετικές
εφαρμογές.
Τα
τεκμήρια
που
περιέχουν
πολλαπλά
“λεξιλόγια
ετικετών”
εμφανίζουν
προβλήματα
αναγνώρισης
(σε
ποια
εφαρμογή
απευθύνεται
η
κάθε
ετικέτα)
και
“σύγκρουσης”
(ίδιες
ετικέτες
που
απευθύνονται
σε
διαφορετικές
εφαρμογές).
Οι
εφαρμογές
λογισμικού
πρέπει
να
μπορούν
να
αναγνωρίζουν
τα
στοιχεία
και
τα
γνωρίσματα
για
την
επεξεργασία
των
οποίων
έχουν
σχεδιαστεί,
ακόμη
και
στην
περίπτωση
που
εμφανίζεται
“σύγκρουση”
ονομάτων
στοιχείων
ή
γνωρισμάτων.
Τα
παραπάνω
απαιτούν
συντακτικές
δομές
που
επιτρέπουν
ονόματα
διαμορφωμένα
κατά
τρόπον
ώστε
να
αποφεύγεται
η
σύγκρουση
μεταξύ
ονομάτων
από
διαφορετικά
“λεξιλόγια
ετικετών”.
Η
λύση
είναι
η
χρησιμοποίηση
του
μηχανισμού
που
ονομάζεται
χώρος
ονομάτων
XML,
ο
οποίος
πετυχαίνει
τον
στόχο
αυτόν
επιτρέποντας
επεκταμένα
ονόματα
στοιχείων
και
γνωρισμάτων.
55
Δηλώσεις
χώρων
ονομάτων
Ένας
χώρος
ονομάτων
δηλώνεται
μέσω
μιας
οικογένειας
από
προκαθορισμένα
γνωρίσματα
όπως
το
γνώρισμα
xmlns
ή
οποιοδήποτε
γνώρισμα
έχει
το
xmlns:
σαν
πρόθεμα.
Η
τιμή
του
γνωρίσματος,
που
είναι
μια
αναφορά
URI,
είναι
το
όνομα
του
χώρου
ονομάτων
(namespace
name).
Παράδειγμα:
Στο
παρακάτω
τμήμα
XML
τεκμηρίου
βλέπουμε
μια
δήλωση
χώρου
ονομάτων
η
οποία
συσχετίζει
το
πρόθεμα
bk με
το
όνομα
χώρου
ονομάτων
www.books.org/book:
56
Πολλαπλές
δηλώσεις
χώρων
ονομάτων
Είναι
δυνατό
να
δηλωθούν
πολλοί
χώροι
ονομάτων
στο
ίδιο
στοιχείο.
Παράδειγμα:
Στο
τμήμα
XML
τεκμηρίου
που
ακολουθεί:
<book xmlns:bk="www.books.org/book"
xmlns:isbn="www.isbn.org/def" >
………
</book>
δηλώνονται
δύο
χώροι
ονομάτων:
Ο
πρώτος
συνδέει
το
πρόθεμα
bk
με
το
χώρο
ονομάτων
με
όνομα
www.books.org/book.
Ο
δεύτερος
συνδέει
το
πρόθεμα
isbn
με
το
όνομα
χώρου
ονομάτων
www.isbn.org/def.
57
Εμβέλεια
χώρων
ονομάτων
Μια
δήλωση
χώρου
ονομάτων
εφαρμόζεται
στο
στοιχείο
που
γίνεται
καθώς
και
σε
όλα
τα
στοιχεία
που
περικλείονται
μέσα
σ’
αυτό,
εκτός
εάν
αντικατασταθεί
από
μια
νέα
δήλωση
που
συνδέει
το
ίδιο
πρόθεμα
με
άλλο
όνομα
χώρου
ονομάτων
(διαφορετικό
URI).
Δεν
είναι
υποχρεωτικό
όλα
τα
στοιχεία
που
αποτελούν
το
περιεχόμενο
του
στοιχείου
στο
οποίο
έχει
οριστεί
ένας
χώρος
ονομάτων,
να
χρησιμοποιούν
το
συγκεκριμένο
χώρο
ονομάτων.
58
Η
χρήση
των
χώρων
ονομάτων
Σε
ένα
XML
τεκμήριο
που
χρησιμοποιεί
χώρους
ονομάτων,
μερικά
(ή
και
όλα)
από
τα
ονόματα
των
στοιχείων
και
των
γνωρισμάτων
που
περιλαμβάνει
μπορεί
να
αποτελούνται
από
δύο
συνθετικά.
Το
πρώτο
ονομάζεται
πρόθεμα
χώρου
ονομάτων
(namespace
prefix)
ενώ
το
δεύτερο
ονομάζεται
τοπικό
τμήμα
(local
part).
Τα
δύο
αυτά
συνθετικά
χωρίζονται
μεταξύ
τους
με
:.
Το
πρόθεμα
πρέπει
να
έχει
δηλωθεί
σε
μια
δήλωση
χώρου
ονομάτων
και
να
έχει
συνδεθεί
με
ένα
όνομα
χώρου
ονομάτων
(μια
αναφορά
URI).
Η
σύνταξη
των
ονομάτων
στοιχείων
και
γνωρισμάτων
τα
οποία
χρησιμοποιούν
χώρους
ονομάτων
έχουν
την
μορφή:
prefix:localpart
Ο
συνδυασμός
των
δύο
συνθετικών
παράγει
ονόματα
τα
οποία
είναι
μοναδικά.
59
Η
χρήση
των
χώρων
ονομάτων
Παράδειγμα:
Στο
το
παρακάτω
τμήμα
XML
τεκμηρίου:
<book xmlns:isbn="www.isbn.org/def">
<title> … </title>
Έχει
οριστεί
εδώ
<authors> … <authors>
<isbn:number> … </isbn:number>
</book>
στο
στοιχείο
book
έχει
δηλωθεί
χώρος
ονομάτων
ο
οποίος
συνδέει
το
πρόθεμα
isbn
με
το
όνομα
χώρου
ονομάτων
www.isbn.org/def.
Στη
συνέχεια,
στο
περιεχόμενο
του
στοιχείου
book
συμπεριλαμβάνεται
και
το
στοιχείο
isbn:number το
όνομα
του
οποίου
περιλαμβάνει
το
πρόθεμα
isbn.
60
Η
χρήση
των
χώρων
ονομάτων
(συνέχεια)
Παράδειγμα:
Στο
τεκμήριο
που
ακολουθεί
έχουμε
δήλωση
και
χρήση
δύο
χώρων
ονομάτων
που
συσχετίζονται
με
τα
προθέματα
bk
και
isbn:
<book xmlns:isbn="www.isbn.org/def"
xmlns:bk="www.books.org/book" >
<bk:title> … </bk:title>
<bk:authors> … </bk:authors>
<isbn:number> … </isbn:number>
</book>
61
Χρήση
χώρων
ονομάτων
σε
γνωρίσματα
Οι
χώροι
ονομάτων
μπορούν
να
χρησιμοποιηθούν
και
για
τον
σχηματισμό
ονομάτων
γνωρισμάτων.
Παράδειγμα:
Στο
παρακάτω
τμήμα
XML
τεκμηρίου:
<tab xmlns:sns="www.ionio.gr/sdef" >
<sns:student sns:scode = "12345">
<sns:name> … </sns:name>
</sns:student>
</tab>
έχουμε
δήλωση
χώρου
ονομάτων,
ο
οποίος
χρησιμοποιείται
για
την
παράγωγή
ονομάτων
των
στοιχείων
sns:student και
sns:name
και
του
γνωρίσματος
sns:scode.
62
Χρήση
χώρων
ονομάτων
Κάθε
πρόθεμα
που
χρησιμοποιείται
σε
ένα
όνομα
στοιχείου
ή
γνωρίσματος,
εκτός
από
τα
xmlns
και
xml,
πρέπει
να
έχει
δηλωθεί
σε
μια
δήλωση
χώρου
ονομάτων,
είτε
στην
ετικέτα
αρχής
του
στοιχείου
μέσα
στο
οποίο
χρησιμοποιείται,
είτε
σε
κάποιο
στοιχείο
“πρόγονο”
του
στοιχείου
αυτού.
Τα
ονόματα
στοιχείων
και
γνωρισμάτων
συνοδεύονται
από
το
πρόθεμα
τους
όταν
αυτά
δηλώνονται
σε
ένα
DTD.
63
Χώροι
ονομάτων
χωρίς
προθέματα
Συχνά
είναι
χρήσιμο
να
δηλωθεί
ένας
χώρος
ονομάτων
ο
οποίος
να
μην
διαθέτει
πρόθεμα.
Ένας
τέτοιος
χώρος
ονομάτων
ονομάζεται
προκαθορισμένος
χώρος
ονομάτων
(default
namespace).
Η
χρησιμότητα
του
έγκειται
στο
ότι
τα
ονόματα
στοιχείων
που
ανήκουν
στο
χώρο
αυτό
δεν
χρειάζεται
να
συνοδεύονται
από
συγκεκριμένο
πρόθεμα.
Ο
χώρος
ονομάτων
χωρίς
πρόθεμα
εφαρμόζεται
στο
στοιχείο
στο
οποίο
δηλώνεται
(αν
αυτό
δεν
έχει
πρόθεμα
χώρου
ονομάτων)
καθώς
και
σε
όλα
τα
στοιχεία
χωρίς
πρόθεμα
που
περιλαμβάνονται
στο
περιεχόμενο
του
στοιχείου
αυτού.
Η
αναφορά
URI
στη
δήλωση
του
χώρου
ονομάτων
χωρίς
πρόθεμα
μπορεί
να
είναι
κενή.
Τα
στοιχεία
χωρίς
πρόθεμα
και
βρίσκονται
στην
εμβέλεια
μιας
τέτοιας
δήλωσης
θεωρείται
ότι
δεν
ανήκουν
σε
κανένα
χώρο
ονομάτων.
Ο
χώρος
ονομάτων
χωρίς
πρόθεμα
δεν
εφαρμόζεται
απευθείας
σε
γνωρίσματα.
64
Χώροι
ονομάτων
χωρίς
προθέματα:
Παράδειγμα
1
Παράδειγμα:
Στο
παρακάτω
XML
τεκμήριο
φαίνεται
δήλωση
και
χρήση
του
χώρου
ονομάτων
χωρίς
πρόθεμα
(όλα
τα
στοιχεία
του
τεκμηρίου
ανήκουν
σε
αυτόν
τον
χώρο
ονομάτων):
<?xml version="1.0"?>
<!-- τα στοιχεία ανήκουν στον default χώρο ονοµάτων “HTML” -->
<html xmlns='http://www.w3.org/TR/REC-html40'>
<head>
<title>Frobnostication</title>
</head>
<body>
<p>Moved to <a href='http://frob.com'>here</a>.</p>
</body>
</html>
65
Χώροι
ονομάτων
χωρίς
προθέματα:
Παράδειγμα
2
Παράδειγμα:
Στο
ακόλουθο
XML
τεκμήριο
έχουμε
δήλωση
και
χρήση
χώρου
ονομάτων
χωρίς
πρόθεμα
καθώς
και
ενός
χώρου
ονομάτων
που
συνδέεται
με
το
πρόθεμα
isbn:
<?xml version="1.0"?>
<!—τα στοιχεία χωρίς πρόθεµα ανήκουν στον "books" -->
<book xmlns='urn:loc.gov:books'
xmlns:isbn='urn:ISBN:0-395-36341-6'>
<title>Cheaper by the Dozen</title>
<isbn:number>1568491379</isbn:number>
</book>
Έτσι,
εκτός
από
το
στοιχείο
isbn:number,
το
οποίο
ανήκει
στο
χώρο
ονομάτων
με
πρόθεμα
isbn,
όλα
τα
άλλα
ανήκουν
στον
χώρο
ονομάτων
'urn:loc.gov:books'.
66
Επαναορισμός
χώρου
ονομάτων
χωρίς
πρόθεμα
Παράδειγμα:
Στο
ακόλουθο
XML
τεκμήριο
φαίνεται
η
αλλαγή
του
χώρου
ονομάτων
χωρίς
όνομα
λόγω
επαναορισμού
του
σε
ένα
εσωτερικό
στοιχείο:
<?xml version="1.0"?>
<!-- αρχικά, ο default χώρος ονοµάτων είναι ο "books" -->
<book xmlns='urn:loc.gov:books'
xmlns:isbn='urn:ISBN:0-395-36341-6'>
<title>Cheaper by the Dozen</title>
<isbn:number>1568491379</isbn:number>
<notes>
<!-- κάνει τον "HTML" default χώρο ονοµάτων -->
<p xmlns='urn:w3-org-ns:HTML'>
This is a <i>funny</i> book!
</p>
</notes>
</book>
67
Μοναδικότητα
γνωρισμάτων
Στα
XML
τεκμήρια
τα
οποία
υπακούουν
στις
προδιαγραφές
που
περιγράψαμε,
καμιά
ετικέτα
στοιχείου
δεν
μπορεί
να
περιέχει
δύο
γνωρίσματα
τα
οποία:
έχουν
ταυτόσημα
ονόματα,
ή
έχουν
ονόματα
με
το
ίδιο
τοπικό
τμήμα
και
τα
προθέματα
των
οποίων
έχουν
συνδεθεί
με
ταυτόσημα
ονόματα
χώρων
ονομάτων.
Παράδειγμα:
Οι
ετικέτες
αρχής
bad
παρακάτω
δεν
είναι
έγκυρες
λόγω
της
ταύτισης
των
ονομάτων
των
γνωρισμάτων
τους:
<!-- http://www.w3.org is bound to n1 and n2 -->
<x xmlns:n1="http://www.w3.org"
xmlns:n2="http://www.w3.org" >
<bad a="1" a="2" />
<bad n1:a="1" n2:a="2" />
</x>
68
Μοναδικότητα
γνωρισμάτων
(συνέχεια)
Παράδειγμα:
Η
σύνταξη
των
στοιχείων
του
XML
τεκμηρίου
που
ακολουθεί
είναι
έγκυρη.
Το
δεύτερο
στοιχείο
good
είναι
έγκυρο
επειδή
ο
χώρος
ονομάτων
χωρίς
πρόθεμα
δεν
εφαρμόζεται
στα
ονόματα
γνωρισμάτων.
<!-- http://www.w3.org is bound to n1 and is the default -->
<x xmlns:n1="http://www.w3.org"
xmlns="http://www.w3.org" >
<good a="1" b="2" />
<good a="1" n1:a="2" />
</x>
69
XML
Schema
Η
γλώσσα
XML
Schema
Η
γλώσσα
XML
Schema
είναι
μια
γλώσσα
XML
κατάλληλη
για
την
περιγραφή
της
δομής
XML
τεκμηρίων.
Η
XML
Schema
(όπως
και
τα
DTD)
είναι
γλώσσα
περιγραφής
σχήματος.
Η
XML
Schema
προσφέρει
χαρακτηριστικά
και
δυνατότητες,
ισχυρότερα
αυτών
που
παρέχονται
από
τα
DTD.
71
XML
Schema:
Παράδειγμα
Ζητάμε
περιγραφή
σε
XML
Schema
της
δομής
των
τεκμηρίων
της
μομφής:
<ΤΑΒ>
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
<φοιτητής> ... </φοιτητής>
...
</ΤΑΒ>
72
XML
Schema:
Παράδειγμα
(συνέχεια)
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="TAB">
<!ELEMENT
ΤΑΒ
(φοιτητής*)>
<xs:complexType>
<xs:element name="φοιτητής" minOccurs=0
maxOccurs="unbounded">
<xs:complexType> <!ELEMENT
φοιτητής
(όνομα,
επώνυμο)>
<!ELEMENT
όνομα
(#PCDATA)>
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence> <!ELEMENT
επώνυμο
(#PCDATA)>
</xs:complexType>
</xs:element>
</xs:complexType>
</xs:element>
</xs:schema> 73
Χαρακτηριστικά
της
XML
Schema
Ένα
τεκμήριο
σε
XML
Schema
είναι
ένα
XML
τεκμήριο.
Τα
στοιχεία
στο
XML
Schema
του
παραδείγματος
έχουν
το
πρόθεμα
xs
το
οποίο
συνδέεται
με
το
χώρο
ονομάτων
της
XML
Schema
μέσω
της
δήλωσης:
xmlns:xs=”http://www.w3.org/2001/XMLSchema”.
H
XML
Schema
παρέχει
στοιχεία
(όπως
τα
element,
sequence,
complexType)
με
συγκεκριμένη
σημασία,
τα
οποία
μαζί
με
αντίστοιχα
γνωρίσματα
(όπως
τα
name,
type,
minOccurs,
maxOccurs)
επιτρέπουν
την
περιγραφή
της
δομής
XML
τεκμηρίων.
Μια
περιγραφή
σχήματος
στην
XML
Schema
έχει
ως
ετικέτα
αρχής
του
πιο
εξωτερικού
στοιχείου
(της
ρίζας)
την
ετικέτα
xs:schema.
Η
XML
Schema
παρέχει
αξιοσημείωτη
εκφραστικότητα
η
οποία
επιτρέπει
την
περιγραφή
της
δομής
XML
τεκμηρίων
με
πολλούς
διαφορετικούς
τρόπους.
74
Παράδειγμα
(μια
εναλλακτική
περιγραφή
του
προηγουμένου)
Η
ακόλουθη
περιγραφή
σε
XML
Schema
περιγράφει
ακριβώς
την
ίδια
κατηγορία
τεκμηρίων
με
την
προηγούμενη
περιγραφή:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="TAB" type="TABtype"/>
<xs:complexType name="TABtype">
<xs:element name="φοιτητής" type="studentType"
minOccurs=0 maxOccurs="unbounded"/>
</xs:complexType>
<xs:complexType name="studentType">
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:schema>
75
Δηλώσεις
στοιχείων
Στοιχεία
της
XML:
Σύνθετου
τύπου:
περιέχουν
υποστοιχεία
ή
διαθέτουν
γνωρίσματα.
Απλού
τύπου:
δεν
έχουν
υποστοιχεία,
ούτε
διαθέτουν
γνωρίσματα.
Τα
γνωρίσματα
θεωρούνται
ότι
είναι
απλού
τύπου.
Η
XML
Schema
παρέχει
το
στοιχείο
complexType
για
τη
δημιουργία
νέων
σύνθετων
τύπων.
Οι
σύνθετοι
τύποι
που
δημιουργούνται
αποκτούν
όνομα
μέσω
του
προαιρετικού
γνωρίσματος
name.
Οι
τύποι
TABtype
και
studentType
είναι
σύνθετοι.
Με
την
ακόλουθη
έκφραση
ορίζεται
ο
σύνθετος
τύπος
TABtype
:
<xs:complexType name="TABtype">
...
</xs:complexType>
Το
TABtype
χρησιμοποιείται
σε
άλλο
σημείο
της
περιγραφής
σχήματος
για
να
δηλώσουμε
ότι
ένα
στοιχείο
είναι
τύπου
TABtype.
Παράδειγμα:
Στη
δήλωση:
<xs:element name="TAB" type="TABtype"/>
δηλώνεται
ότι
το
στοιχείο
TAB
είναι
τύπου
TABtype.
Το
όνομα
ενός
σύνθετου
τύπου
μπορεί
χρησιμοποιηθεί
στη
δήλωση
πολλών
στοιχείων
μειώνοντας
έτσι
το
μέγεθος
των
περιγραφών.
76
Δηλώσεις
γνωρισμάτων
Για
τη
δήλωση
γνωρισμάτων
χρησιμοποιείται
το
στοιχείο
attribute.
Ένα
γνώρισμα
δηλώνεται
ως
εξής:
<xs:attribute name=" ... " type="..." .... />
Παράδειγμα:
Με
την
έκφραση
<xs:attribute name="ηλικία" type="xs:positiveInteger"
use="required"/>
δηλώνεται
το
γνώρισμα
ηλικία
το
οποίο
παίρνει
τιμές
του
τύπου
positiveInteger.
Ο
τύπος
positiveInteger,
είναι
απλός
τύπος
και
αντιπροσωπεύει
τους
θετικούς
ακέραιους
αριθμούς.
Η
παράσταση
use="required",
δηλώνει
ότι
η
εμφάνιση
του
συγκεκριμένου
γνωρίσματος
είναι
υποχρεωτική.
Ένα
στοιχείο
που
διαθέτει
γνωρίσματα
είναι
πάντα
σύνθετου
τύπου
και
επομένως
δηλώνεται
μέσω
του
complexType.
Οι
δηλώσεις
γνωρισμάτων
τοποθετούνται
στο
τέλος
της
δήλωσης
του
σύνθετου
τύπου
του
αντίστοιχου
στοιχείου,
ακριβώς
πριν
από
το
</xs:complexType>.
77
Δηλώσεις
γνωρισμάτων
(συνέχεια)
Παράδειγμα:
Το
στοιχείο
φοιτητής
στην
παρακάτω
δήλωση
εμφανίζεται
να
διαθέτει
το
γνώρισμα
ηλικία:
<xs:element name="φοιτητής" minOccurs=0 maxOccurs="unbounded">
<xs:complexType>
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
<xs:attribute name="ηλικία" type="xs:positiveInteger"
use="required"/>
</xs:complexType>
</xs:element>
Παρατηρήστε
ότι
το
στοιχείο
φοιτητής
περιλαμβάνει
τα
υποστοιχεία
όνοµα
και
επώνυµο,
καθώς
και
το
γνώρισμα
ηλικία,
το
οποίο
εμφανίζεται
υποχρεωτικά
σε
κάθε
στοιχείο
φοιτητής,
και
παίρνει
ως
τιμή
έναν
θετικό
ακέραιο.
78
Συχνότητα
εμφάνισης
στοιχείων
Η
XML
Schema
επιτρέπει
να
προδιαγράψουμε
το
πλήθος
των
εμφανίσεων
των
στοιχείων
με
εξαιρετική
ακρίβεια.
Αυτό
γίνεται
μέσω
δύο
γνωρισμάτων
του
element:
Του
minOccurs
μέσω
του
οποίου
δηλώνουμε
τον
ελάχιστο
αριθμό
εμφανίσεων
του
στοιχείου,
Του
maxOccurs
μέσω
του
οποίου
δηλώνουμε
τον
μέγιστο
αριθμό
εμφανίσεων
του
στοιχείου.
Οι
τιμές
των
γνωρισμάτων
αυτών
είναι
μη
αρνητικοί
ακέραιοι.
Όταν
κάποιο
από
τα
minOccurs
ή
maxOccurs
παραλείπεται
(και
τα
δύο
ή
ένα
από
αυτά)
τότε
θεωρείται
ότι
έχει
σαν
τιμή
το
1.
Παράδειγμα.
Στη
δήλωση:
<xs:element name="φοιτητής" type="studentType"
minOccurs=0 maxOccurs="unbounded"/>
η
τιμή
unbounded
του
maxOccurs
υποδηλώνει
απεριόριστο
αριθμό
εμφανίσεων
του
φοιτητής,
(είναι
δυνατό
να
μην
έχουμε
καμιά
εμφάνιση
λόγω
της
τιμής
0
του
γνωρίσματος
minOccurs).
79
Περιορισμοί
συχνότητας
εμφάνισης
στοιχείων
και
γνωρισμάτων
Ένα
γνώρισμα
μπορεί
να
εμφανίζεται
σε
ένα
στιγμιότυπο
στοιχείου
μία
φορά
ή
να
μην
εμφανίζεται
καθόλου.
Δεν
μπορεί
όμως
το
ίδιο
γνώρισμα
να
εμφανίζεται
στο
ίδιο
στοιχείο
περισσότερες
από
μια
φορές
(με
τη
ίδια
ή
διαφορετική
τιμή).
Η
XML
Schema
επιτρέπει
να
προσδιορίσουμε
την
υποχρεωτικότητα
ή
μη
της
εμφάνισης
ενός
γνωρίσματος
μέσω
του
γνωρίσματος
use
του
στοιχείου
attribute (μέσω
του
οποίου
δηλώνουμε
το
γνώρισμα).
Η
τιμή
required στο
γνώρισμα
use υποδηλώνει
υποχρεωτική
εμφάνιση
του
γνωρίσματος
ενώ
τιμή
optional
υποδηλώνει
προαιρετική
εμφάνιση
του
συγκεκριμένου
γνωρίσματος.
80
Απλοί
τύποι
Η
XML
Schema
διαθέτη
πλούσια
συλλογή
ενσωματωμένων
απλών
τύπων
όπως
οι
byte, integer, positiveInteger, negativeInteger, int,
decimal, long, float, double, boolean, date, dateTime, ID, string,
IDREF, IDREFS, ENTITY, ENTITIES, NMTOKEN, NMTOKENS.
Η
XML
Schema
επιτρέπει
να
ορίσουμε
νέους
απλούς
τύπους
μέσω
του
στοιχείου
simpleType. Οι
δηλώσεις
περιγράφουν
τον
τρόπο
που
παράγονται
οι
νέοι
τύποι
από
άλλους
απλούς
(ενσωματωμένους
ή
παραγόμενους)
τύπους.
Παράδειγμα.
Με
τη
δήλωση:
<xs:simpleType name="myInteger">
<xs:restriction base="xs:integer">
<xs:minInclusive value="0"/>
<xs:maxInclusive value="100"/>
</xs:restriction>
</xs:simpleType>
ορίζεται
ο
τύπος
myInteger,
μέσω
επιβολής
περιορισμών
στον
τύπο
integer.
Το
όνομα
του
τύπου
βάσης
δίνεται
ως
τιμή
στο
γνώρισμα
base
του
στοιχείου
restriction.
Οι
περιορισμοί
ορίζονται
μέσω
των
στοιχείων
minInclusive
και
maxInclusive και
ορίζουν
ως
ελάχιστη
επιτρεπτή
τιμή
το
0,
και
ως
μέγιστη
επιτρεπτή
τιμή
το
100.
81
Απλοί
τύποι
(συνέχεια)
Η
XML
Schema
παρέχει
πλούσια
ποικιλία
«όψεων»
(facets)
(όπως
οι
minInclusive
και
maxInclusive)
για
την
επιβολή
περιορισμών
κατά
τον
ορισμό
νέων
τύπων.
Μια
χρήσιμη
όψη
είναι
το
στοιχείο
enumeration
που
περιορίζει
έναν
απλό
τύπο
σε
ένα
σύνολο
διακριτών
τιμών:
Παράδειγμα.
Στην
περιγραφή:
<xs:simpleType name="νόµισµα">
<xs:restriction base="xs:string">
<xs:enumeration value="GRD"/>
<xs:enumeration value="EURO"/>
<xs:enumeration value="USD"/>
<!-- κ.λ.π. ... -->
</xs:restriction>
</xs:simpleType>
ορίζεται
ο
απλός
τύπος
νόµισµα,
με
τιμές
τα
(διεθνή)
σύμβολα
των
νομισμάτων
όπως
τα
GRD, EURO, USD,
κ.λ.π..
82
Ορισμός
γνωρισμάτων
σε
στοιχεία
απλού
τύπου
Στοιχεία
απλού
τύπου
δηλώνονται
όπως
στο
παράδειγμα:
<xs:element name="ονοµατεπώνυµο" type="xs:string"/>
Οι
απλοί
τύποι
(στοιχεία
απλού
τύπου)
δεν
επιτρέπεται
να
έχουν
γνωρίσματα.
Η
επισύναψη
γνωρισμάτων
σε
στοιχεία
απλού
τύπου
(π.χ.
το
γνώρισμα
ΑΔΤ‐αριθμός
δελτίου
ταυτότητας
στο
στοιχείο
ονοµατεπώνυµο)
γίνεται
με
τον
ορισμό
σύνθετου
τύπου
όπως
στο
επόμενο
παράδειγμα.
Το
περιεχόμενο
του
στοιχείου
παραμένει
απλού
τύπου
(του
τύπου
string
στην
περίπτωση
μας).
<xs:element name="ονοµατεπώνυµο">
<xs:complexType>
<xs:simpleContent>
<xs:extension base="xs:string">
<xs:attribute name="ΑΔΤ" type="xs:string"/>
</xs:extension>
</xs:simpleContent>
</xs:complexType>
</xs:element>
Το
simpleContent υποδηλώνει
στοιχεία
με
απλό
περιεχόμενο
χωρίς
υπο‐
στοιχεία
(στο
παράδειγμα
ακολουθία
απλών
χαρακτήρων).
Για
τον
ορισμό
του
νέου
τύπου,
επεκτείνουμε
τύπο
string.
Η
επέκταση
συνίσταται
στην
προσθήκη
του
γνωρίσματος
ΑΔΤ
μέσω
μιας
συνήθους
δήλωσης
γνωρίσματος.
83
Ομαδοποίηση
στοιχείων
Η
XML
Schema
παρέχει
τη
δυνατότητα
να
ορίζουμε
ομάδες
στοιχείων
(στις
οποίες
μπορούμε
να
δίνουμε
και
ονόματα).
Στόχος
η
χρήση
αυτών
των
ομάδων
για
τη
δόμηση
του
περιεχόμενου
των
συνθέτων
τύπων.
84
Ομαδοποίηση
στοιχείων
με
το
sequence
Το
στοιχείο
sequence
χρησιμοποιείται
για
να
δηλώσει
(διατεταγμένη)
ακολουθία
(υπο)στοιχείων.
Παράδειγμα.
Στο
παρακάτω:
<xs:complexType name="studentType">
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string”/>
<xs:element name="πατρώνυµο" type="xs:string"/>
</xs:sequence>
</xs:complexType>
δηλώνεται
ότι
κάθε
στοιχείο
τύπου
studentType
πρέπει
να
περιλαμβάνει
ένα
υποστοιχείο
όνοµα
ακολουθούμενο
από
ένα
υποστοιχείο
επώνυµο και
από
ένα
υποστοιχείο
πατρώνυµο.
Και
τα
τρία
(υπο)στοιχεία
είναι
τύπου
string.
85
Ομαδοποίηση
στοιχείων
με
το
choice
Το
στοιχείο
choice
επιτρέπει
την
εμφάνιση
κάθε
φορά
ενός
μόνο
από
τα
(υπο)στοιχεία
που
περιλαμβάνει,
ως
περιεχόμενο
του
στοιχείου
που
ανήκει
στον
συγκεκριμένο
τύπο.
Παράδειγμα.
Στο
παρακάτω
τμήμα
περιγραφής:
<xs:complexType name="studentType">
<xs:choice>
<xs:element name="ονοµατεπώνυµο" type="xs:string"/>
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
</xs:choice>
</xs:complexType>
δηλώνεται
ότι
κάθε
στοιχείο
του
τύπου
studentType
έχει
ως
περιεχόμενο
είτε
το
στοιχείο
ονοµατεπώνυµο
είτε
ένα
στοιχείο
όνοµα
ακολουθούμενο
από
ένα
στοιχείο
επώνυµο.
86
Ομαδοποίηση
στοιχείων
με
το
all
Με
το
στοιχείο
all δηλώνεται
ότι
κάθε
στοιχείο
της
ομάδας
εμφανίζεται
υποχρεωτικά
(ή
προαιρετικά
αν
συνοδεύεται
με
το
γνώρισμα
minOccurs=0).
Η
σειρά
εμφάνισης
δεν
παίζει
ρόλο.
Επιτρεπτές
τιμές
των
minOccurs και
maxOccurs στις
δηλώσεις
των
στοιχείων
του
all
είναι
οι
0
και
1.
Παράδειγμα.
Στο
παρακάτω
τμήμα
περιγραφής:
<xs:complexType name="studentType">
<xs:all>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
<xs:element name="πατρώνυµο" type="xs:string" minOccurs=0/>
</xs:all>
</xs:complexType>
δηλώνεται
ότι
κάθε
στοιχείο
του
τύπου
studentType
περιλαμβάνει
από
μια
εμφάνιση
καθενός
από
τα
στοιχεία
όνοµα,
επώνυµο
και
μια
ή
καμία
εμφάνιση
του
στοιχείου
πατρώνυµο
αλλά
με
οποιαδήποτε
σειρά.
87
Ομαδοποίηση
στοιχείων
με
το
all
(συνέχεια)
Το
all
πρέπει
να
εμφανίζεται
ως
το
μοναδικό
υποστοιχείο
του
complexType.
Παράδειγμα.
Δεν
είναι
επιτρέπονται
δηλώσεις
της
μορφής:
<xs:complexType name="studentType">
<xs:all>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
<xs:element name="πατρώνυµο" type="xs:string"/>
</xs:all>
<xs:sequence>
<xs:element name="ηλικία" type="xs:positiveInteger"/>
<xs:element name="διεύθυνση" type="xs:string"/>
</xs:sequence>
</xs:complexType>
Το
περιεχόμενο
του
all
μπορεί
να
είναι
μόνο
δηλώσεις
ξεχωριστών
στοιχείων
και
όχι
ομάδων
στοιχείων.
88
Ομαδοποίηση
γνωρισμάτων
Το
στοιχείο
attributeGroup
επιτρέπει
ομαδοποίηση
γνωρισμάτων.
Παράδειγμα.
Εδώ
ορίζεται
ομάδα
γνωρισμάτων
με
όνομα
personAttributes.
Περιλαμβάνει
το
γνώρισμα
ΑΔΤ
που
είναι
τύπου
string,
το
ΑΦΜ που
είναι
τύπου
positiveInteger, και
το
φύλο για
το
οποίο
ορίζεται
ανώνυμος
τύπος
που
περιλαμβάνει
τις
τιμές
άνδρας
και
γυναίκα:
<xs:attributeGroup name="personAttributes">
<xs:attribute name="ΑΔΤ" type="xs:string" use="required"/>
<xs:attribute name="ΑΦΜ" type="xs:positiveInteger"/>
<xs:attribute name="φύλο">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:enumeration value="άνδρας"/>
<xs:enumeration value="γυναίκα"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:attributeGroup>
89
Ομαδοποίηση
γνωρισμάτων
(συνέχεια)
Το
όνομα
ομάδας
γνωρισμάτων
μπορεί
να
χρησιμοποιηθεί
για
να
δηλωθεί
ότι
ένα
στοιχείο
διαθέτει
τα
γνωρίσματα
που
περιλαμβάνει
η
συγκεκριμένη
ομάδα.
Παράδειγμα.
Στην
παρακάτω
περιγραφή
γίνεται
επίκληση
της
δήλωσης
του
συνόλου
γνωρισμάτων
personAttributes,
μέσω
του
γνωρίσματος
ref,
προκειμένου
να
δηλώσουμε
ότι
το
στοιχείο
φοιτητής
διαθέτει
τα
γνωρίσματα
του
συνόλου
personAttributes:
<xs:element name="φοιτητής" minOccurs=0 maxOccurs="unbounded" >
<xs:complexType>
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
<xs:attributeGroup ref="personAttributes"/>
</xs:complexType>
</xs:element>
90
Ομαδοποίηση
γνωρισμάτων
(συνέχεια)
Για
να
ορίσουμε
και
άλλα
στοιχεία
που
διαθέτουν
την
ίδια
ομάδα
γνωρισμάτων
(π.χ.
τα
στοιχεία
µέλοςΔεπ,
εργαζόµενος
κ.λ.π.),
χρησιμοποιούμε
δηλώσεις
ορισμού
στοιχείων
παρόμοιες
με
αυτήν
του
στοιχείου
φοιτητής,
στις
οποίες
θα
υπάρχει
απλή
αναφορά
στην
ίδια
ομάδα
γνωρισμάτων,
χωρίς
να
χρειάζεται
να
οριστεί
ξανά
αυτή.
Χρησιμοποιώντας
ομάδες
γνωρισμάτων
διαμορφώνουμε
πιο
ευανάγνωστες
περιγραφές
σχήματος
και
διευκολύνουμε
τη
μελλοντική
ενημέρωση
του
σχήματος,
αφού
μια
ομάδα
γνωρισμάτων
μπορεί
να
οριστεί
(και
να
τροποποιείται)
σε
ένα
σημείο
και
να
χρησιμοποιείται
με
επίκληση
του
ονόματος
της
σε
πολλούς
ορισμούς
στοιχείων.
Μια
ομάδα
γνωρισμάτων
μπορεί
να
περιλαμβάνει
με
τη
σειρά
της
άλλες
ομάδες
γνωρισμάτων.
Οι
δηλώσεις
γνωρισμάτων
και
οι
αναφορές
σε
ομάδες
γνωρισμάτων
πρέπει
να
τοποθετούνται
στο
τέλος
των
ορισμών
συνθέτων
τύπων.
91
Περιληψη
Το
XML
Σχήμα
(XML
Schema)
ενοποιεί
προηγούμενες
προτάσεις
για
περιγραφή
σχήματος.
Γενικεύει
τα
DTDs.
Χρησιμοποιεί
τη
σύνταξη
της
XML.
Τεχνικά
εγχειρίδια:
«XML
Schema
Part
0:
Primer»
βρίσκεται
στη
διεύθυνση:
hZp://www.w3.org/TR/xmlschema‐0
«XML
Schema
Part
1:
Structures»
βρίσκεται
στη
διεύθυνση:
hZp://www.w3.org/TR/xmlschema‐1
«XML
Schema
Part
2:
Datatypes»
βρίσκεται
στη
διεύθυνση:hZp://www.w3.org/TR/xmlschema‐2
92
Ταξινόμηςη
3
Διαχείριςη τεκμηρίων
Περιγραφι τεκμθρίων (bibliographic description)
◦ Σίτλοσ, πνευματικι υπευκυνότθτα, επιμζλεια (edition), ζκδοςθ
(publication), φυςικι περιγραφι (αρ. ςελίδων, μζγεκοσ), ςχετικόσ
εξοπλιςμόσ κλπ
θμεία πρόςβαςθσ καταλόγου
◦ Ευρετιρια με βάςθ τα οποία γίνεται θ αναηιτθςθ ςτον κατάλογο
◦ Δθμιουργία/χριςθ αρχείου κακιερωμζνων όρων (authority file)
◦ τίτλοι – εναλλακτικοί τίτλοι – τίτλοι ςειρϊν, ονόματα, ςυλλογικά όργανα
Κεματικι ανάλυςθ - ταξινόμθςθ
◦ Προςδιοριςμόσ κεμάτων-εννοιϊν που καλφπτει ζνα τεκμιριο
◦ Ανάκεςθ κεματικϊν επικεφαλίδων
◦ Σαξινόμθςθ τεκμθρίου ςε κεματικζσ κατθγορίεσ με τθ χριςθ ταξινομικοφ
ςυςτιματοσ
Θεματική περιγραφή
Θ κεματικι περιγραφι μπορεί να περιλαμβάνει τθν ταξινόμθςθ, ευρετθρίαςθ,
περίλθψθ.
Παράγοντεσ που δυςκολεφουν το ζργο τθσ κεματικισ περιγραφισ:
Σο είδοσ και τον τφπο του δθμοςιεφματοσ
Σο επίπεδο παρουςίαςθσ του περιεχομζνου του
Σον τρόπο που ο χριςτθσ αντιλαμβάνεται και κατανοεί τθν πλθροφορία
Σθν υποκειμενικι δυνατότθτα του ευρετθριαςτι
Θ διαδικαςία τθσ κεματικισ περιγραφισ
Γνωριμία με το τεκμιριο
Κεματικι ανάλυςθ
Επιλογι κεμάτων
Διατφπωςθ ςε όρουσ ι φράςεισ
Επιβεβαίωςθ των όρων με άλλα
Μετάφραςθ των όρων ςτθ γλϊςςα κεματικισ περιγραφισ που χρθςιμοποιείται
Σαξινόμθςθ με βάςθ το κζμα μπορεί να γίνει:
ε μεγάλεσ κατθγορίεσ, ςε βαςικοφσ επιςτθμονικοφσ χϊρουσ
ε λεπτομερι κεματικι κατάταξθ (εξειδίκευςθ). ε αυτι τθ περίπτωςθ είναι αναγκαία θ
χριςθ και υιοκζτθςθ ανεπτυγμζνα και εξειδικευμζνα εργαλεία όπωσ τα ταξινομικά
ςυςτιματα.
.
5
Ενδεικτικζσ κατηγορίεσ θεματικών γλωςςών
Σαξoνομίεσ
◦ Προ-ςυνδυαςμζνεσ γλϊςςεσ
◦ Περιγράφουν τισ ζννοιεσ ςε ζνα γνωςτικό πεδίο
◦ Οι περιγραφείσ τουσ είναι ςυςτθματικά διατεταγμζνοι ςε ιεραρχίεσ με
ςυγκεκριμζνα κριτιρια που βαςίηονται είτε ςτισ λογικζσ ςυςχετίςεισ τουσ,
είτε ςτισ ςυςχετίςεισ του υλικοφ
◦ Αντιςτοίχιςθ του περιγραφζα με ζνα αρικμό
Σαξινομικά ςυςτιματα (DDC, UDC, LC)
◦ Καλφπτουν όλο το φάςμα τθσ γνϊςθσ με ιεραρχικό τρόπο
◦ ε οριςμζνα πεδία γνϊςθσ θ κεματικι απόδοςθ γίνεται από πολφ μακριά
αρικμοδότθςθ
Φαςετικι ταξινομθςθ (Colon classification, 1933)
◦ Πολυδιάςτατθ τακτοποίθςθ εννοιϊν και αντικειμζνων
◦ Οι φαςζτεσ μπορεί να προςαρμόηονται ςε κάκε κεματικι κατθγορία
6
Ταξονομίεσ
Θ ταξονομία είναι μια ιεραρχία όρων, ζνα είδοσ ελεγχόμενου λεξιλογίου, ζτςι ϊςτε οι κατϊτεροι και
ειδικότεροι όροι να είναι ςε διάταξθ κάτω από τουσ ανϊτερουσ και γενικότερουσ όρουσ.
Μια ταξινομία που περιλαμβάνει πολλαπλζσ μικρότερεσ ιεραρχικζσ δομζσ για κάκε τφπο όρου ι
χαρακτθριςτικοφ (ι φαςζτα) οι οποίοι μποροφν να αναηθτθκοφν ςε ςυνδυαςμό ονομάηεται
φαςετικι (πολυεδρικι) ταξονομία.
Παράδειγμα: Top-Level Categories for the ACM Taxonomy
General Literature
Hardware
Computer Systems Organization
Software/Software Engineering
Data
Theory of Computation
Mathematics of Computing
Information Technology and Systems
Computing Methodologies
Computer Applications
Computing Milieux
Haptics
Services Computing
Learning Technologies
7
Κανόνεσ ταξινόμηςησ
Σαξινομοφμε με βάςθ το κζμα και μετά με τθ μορφι εκτόσ από τισ κλάςεισ Γενικά και
Λογοτεχνία
598.2/03 Κζμα: πουλιά, μορφι: εγκυκλοπαίδεια
811 Μορφι: Αμερικάνικι ποίθςθ
Σαξινομοφμε ζνα τεκμιριο ςτθν κατθγορία που κα είναι πιο χριςιμθ
Θ βιογραφία ενόσ ακλθτι, αλλιϊσ ταξινομείται ςε μια ςχολικι βιβλιοκικθ και
αλλιϊσ ςε μια ακλθτικι βιβλιοκικθ
Σοποκετοφμε το τεκμιριο ςτθν πιο ειδικι κατθγορία που το περιλαμβάνει και όχι ςτθν
πιο γενικι
Όταν ζνα βιβλίο διαπραγματεφεται δφο ι τρία κζματα, το τοποκετοφμε ςτθν τάξθ του
κυρίαρχου κζματοσ ι αν είναι ιςότιμα ςτο πρϊτο που πραγματεφεται το βιβλίο.
Όταν ζχουμε δφο κζματα για ζνα τεκμιριο και το πρϊτο επθρεάηει το δεφτερο, τότε το
τεκμιριο ταξινομείται ςφμφωνα με το δεφτερο κζμα
Κρθςκευτικζσ αντιλιψεισ για τθ φιλοςοφία => Φιλοςοφία
Για πάνω από τρία κζματα τα τεκμιρια ταξινομοφνται ςτθ γενικι κατθγορία που τα
περιλαμβάνει όλα
10
11
Δεκαδική ταξινόμηςη Dewey (1)
Ζργο του αμερικανοφ βιβλιοκθκονόμου Melvil Dewey το 1873.
Είναι θ περιςςότερο διαδεδομζνθ ςφςτθματικι ταξινόμθςθ,
χρθςιμοποιείται από 135 χϊρεσ και μεταφράςτθκε ςε 30
γλϊςςεσ.
ιμερα υπάρχει θ 22θ ζκδοςθ του, από το 2003, και από το
2002 υπάρχει και θ θλεκτρονικι ζκδοςθ, θ οποία :
Ενθμερϊνεται 4 φορζσ το χρόνο
Αντιςτοιχεί ςτουσ ταξινομικοφσ αρικμοφσ ςε κεματικζσ επικεφαλίδεσ
(LCSH), ςτατιςτικά, εννοιολογικά,
υνδζει τισ επικεφαλίδεσ αυτζσ με τισ εγγραφζσ τουσ
Περιλαμβάνει πολλοφσ περιςςότερουσ όρουσ ςτο ευρετιριο Relative
Index.
12
13
Το Dewey αποτελείται :
τόμ. 1. Manual. Tables Σο εγχειρίδιο αποτελεί ζνα οδθγό
ταξινόμθςθσ για τα δφςκολα ςθμεία και παρζχει
πλθροφορίεσ για τουσ νζουσ ταξινομικοφσ Πίνακεσ. Οι
Πίνακεσ ςθμειογραφίασ προςτίκενται ςτουσ
ταξινομικοφσ αρικμοφσ για να προςφζρουν παραπάνω
πλθροφορία
τόμ. 2. Schedules 000-599 οργάνωςθ τθσ γνϊςθσ από το
000-599
τόμ. 3. Schedules 600-999 οργάνωςθ τθσ γνϊςθσ από το
600-999
τόμ. 4. Relative index ζνασ αλφαβθτικόσ κατάλογοσ
κεμάτων, κατατάςςοντασ αλφαβθτικά τουσ
επιςτθμονικοφσ κλάδουσ με τουσ οποίουσ ςχετίηονται .
14
18
19
Βοηθητικόσ Πίνακασ 1
05 Περιοδικζσ εκδόςεισ
06 Οργανιςμοί και Διοικθτικι
07 Εκπαίδευςθ, ζρευνα και ςυναφι
08 Λςτορία και περιγραφι ςε ςχζςθ με ομάδεσ ατόμων
09 Λςτορικι, γεωγραφικι , προςωποκεντρικι
κεϊρθςθ
20
21
Δόμηςη του ταξινομικοφ αριθμοφ
Ο ακριβισ και εξειδικευμζνοσ ταξινομικόσ αρικμόσ ενόσ
τεκμθρίου δεν αρκείται μόνο ςτουσ Κφριουσ Σαξινομικοφσ
Πίνακεσ (τόμοι 2 και 3).
Βαςίηεται ςτο ςυνδυαςμό του αρικμοφ των κυρίων
πινάκων και των αρικμϊν από τουσ βοθκθτικοφσ πίνακεσ
(τόμοσ 1).
Οι βοθκθτικοί πίνακεσ είναι :
1. τακερζσ υποδιαιρζςεισ
2. Γεωγραφικζσ περιοχζσ και πρόςωπα
3. Λογοτεχνίασ και λογοτεχνικϊν μορφϊν
4. Τποδιαιρζςεισ για οικογζνειεσ Γλωςςϊν
5. Εκνικζσ ομάδεσ
6. Γλϊςςεσ
22
Παράδειγμα: Ευρώπη
41 British isles
42 England and Wales
43 Central Europe Germany
44 France and Monaco
45 Italian Peninsula and adjacent islands Italy
46 Iberian Peninsula and adjacent islands Spain
47 Soviet Union Russia
48 Scandinavia
49 Other parts of Europe
23
Ελλάδα: Γεωγραφία, Ιςτορία, Λογοτεχνία
το ςφςτθμα Dewey θ Ελλάδα ςτον 2ο βοθκθτικό Πίνακα ζχει αρικμό 495.
Δθλαδι θ ιςτορία τθσ Ελλάδασ είναι ςτον 949.5, ενϊ θ αρχαία ιςτορία ςτο 938.
Από το 1977 εξαςφαλίςτθκαν τα πνευματικά δικαιϊματα για τθν αλλαγι τθν
ανάπτυξθ και επεξεργαςία των πινάκων που αφοροφςαν τα ελλθνικά κζματα.
(Από τθν Ζνωςθ Ελλινων Βιβλιοκθκονόμων).
Θ ιςτορία τθσ Ελλάδασ ταξινομείται ςτο 938 και καταργείται το 949.5
938. 1 Αρχαία Ελλάδα
938. 2 Αρχαία Ελλάδα – Γεωγραφικι υποδιαίρεςθ
938.3 Βυηαντινι Αυτοκρατορία
938.4 Σουρκοκρατία
938.5 Ελλθνικι Επανάςταςθ
938.6 Ελλθνικό Κράτοσ, 1830
938.7 1914-1974
938.8 1974-
938.9 Γεωγραφικι διαίρεςθ
24
25
Παραδείγματα δημιουργίασ
ταξινομικών αριθμών (2)
Πολιτικζσ εκλογζσ ςτθν Γαλλία το 2006.
◦ 324 Πολιτικζσ διαδικαςίεσ (Πολιτικά κόμματα, Εκλογζσ)
44 Γαλλία (Από τον Πίνακα 2 )
084 2000- “
ο ταξινομικόσ αρκιμόσ = 324.94409084
υμπεριφορά ετεροκαλϊν αδελφϊν ςτθν οικογζνεια τθσ
καναδικισ κοινωνίασ
◦ Περιοριςμζνθ ταξινόμθςθ: 306.8750971 (πλιρθσ αρικμόσ
ςε μια ερευνθτικι βιβλιοκικθ με μια μεγάλθ ςυλλογι
πάνω ςε κζματα κοινωνιολογίασ.
◦ Ευρεία ταξινόμθςθ: 306.875 ι και 306.87 (για λιγότερο
ειδικζσ βιβλιοκικεσ).
26
27
Το ταξινομικό ςφςτημα τησ
Βιβλιοθήκησ του Κογκρζςου (2)
φμφωνα με το ςφςτθμα αυτό θ ανκρϊπινθ γνϊςθ ταξινομείται ςε 26
γενικζσ κατθγορίεσ (classes) με βάςθ τα γράμματα του λατινικοφ
αλφαβιτου. Mε τθ ςειρά τθσ κακεμιά από τισ γενικζσ αυτζσ τάξεισ
υποδιαιρείται ιεραρχικά ςε μικρότερεσ κατθγορίεσ.
A Γενικζσ εργαςίεσ
B-BD Φιλοςοφία
BF Ψυχολογία
BH-BJ Aιςκθτικι, Hκικι
BL BX Κρθςκεία
C Bοθκθτικζσ Eπιςτιμεσ τθσ Iςτορίασ (ιςτορία του
Πολιτιςμοφ, Aρχαιολογία ωσ επιςτιμθ,
διπλωματικι, αρχεία, ςφραγίδεσ, χρονολογία,
νομιςματικι,επιγραφικι, εραλδικι, γενεαλογία,
βιογραφία)
28
30
31
Παράδειγμα ταξινομικοφ αριθμοφ
S AGRICULTURE (GENERAL) S
SB PLANT CULTURE SB
33
Colon Classification (CC)
Φαςετικι ανάλυςθ θ πιο ξεχωριςτι προςζγγιςθ ςτθν ιςτορία των
ςυςτθμάτων οργάνωςθσ γνϊςθσ. Θ πιο μεκοδικι από τα άλλα
«παραδοςιακά» ςυςτιματα. Δθμιοφργθμα του ινδοφ μακθματικοφ
και βιβλιοκθκονόμου S.R. Ranganathan, το 1933.
Ονομάηεται και αναλυτικο-ςυνκετικι ταξινόμθςθ.
34
9 από τισ ειδικζσ κοινζσ υποδιαιρζςεισ που προςδιορίηει τθ Λογοτεχνία και δείχνει ότι
1 θ διάταξθ αυτι επιτρζπεται για υψθλά δθμοφιλι τθσ κατθγορίασ (ςτο παράδειγμα
35
Άλλα ταξινομικά ςυςτήματα
Charles Ammi Cutter (Expansive Classification)
Βιβλιογραφικι ταξινόμθςθ (Bibliographic Classification, BC).
James Duff Brown subject classification.
Tο ταξινομικό ςφςτθμα τθσ Βιβλιοκικθσ του Λζνιν ςτθ
Μόςχα (30 τόμοι) από το 1960-1968.
Σο ταξινομικό ςφςτθμα τθσ Κίνασ από το 1953.
36
38
39
40
Λεξιλόγιο
Σύνολο όρων
Στις γλώσσες θεμάτων το λεξιλόγιο είναι ελεγχόμενο
(controlled vocabulary) δηλ. μόνο συγκεκριμένοι όροι ή είδη
όρων επιτρέπεται να συμμετέχουν στις δηλώσεις θεμάτων
Ονομάζονται περιγραφείς (descriptors) ή προτιμώμενοι όροι (preferred
terms)
Αναφορές (references, “see” or “use”) από μη προτιμώμενους
όρους σε προτιμώμενους
Κριτήρια επιλογής προτιμώμενων όρων
Από κάτω προς τα πάνω (bottom-up)
Συχνότητα χρήσης από τους συγγραφείς
Συχνότητα χρήσης στις αναζητήσεις των χρηστών
Από πάνω προς τα κάτω
με τη χρήση εργαλείων (Dewey, Ranganathan) 5
Είδη όρων
απλός όρος: όρος που περιλαµβάνει µόνο µία ρίζα
ήχος, φως
σύνθετος όρος: όρος που περιλαµβάνει δύο ή περισσότερες
ρίζες
ηχοαπορρόφηση, ταχύτητα του ήχου, φωτοβολία, υπέρυθρο φως
δάνειος όρος: όρος που έχει ληφθεί από άλλη γλώσσα ή από
άλλο θεµατικό πεδίο
νεολογισµός: µονολεκτικός όρος – απλός ή σύνθετος – που
σχηµατίζεται και χρησιµοποιείται για πρώτη φορά στη
γλώσσα για την απόδοση δεδοµένης έννοιας
9
Θεματική ανάλυση
Η θεματική ανάλυση γίνεται με την ταξινόμηση και την
θεματική ευρετηρίαση με σκοπό την υποστήριξη της
θεματική προσέγγιση του χρήστη στα τεκμήρια μιας
συλλογής. Είναι τόσο αντικειμενική όσο και υποκειμενική
ταυτόχρονα.
Αντικειμενική μέθοδος, μέτρηση αναφορών σε αντικείμενα και
πρόσωπα, ακόμα και αυτών που δεν αναφέρονται ξεκάθαρα
ο προσδιορισμός των θεμάτων που αφορούν σε ένα τεκμήριο είναι
υποκειμενική διαδικασία, εξαρτάται από τον αναγνώστη και από
τον ευρετηριαστή .
Προσδιορισμός συνόλου ή κανόνων κριτηρίων επιλογής ή
απόρριψης θεμάτων.
Η θεματική ευρετηρίαση προηγείται συνήθως της
ταξινόμησης
10
11
Ευρετηρίαση – Ευρετήρια
Ευρετήριο είναι ο κατάλογος αναγραφών με αλφαβητικό ή άλλο τρόπο, ο
οποίος συμβάλλει στον εντοπισμό πληροφοριών σε ένα τεκμήριο ή σε
συλλογή τεκμηρίων.
Σκοπός του ευρετηρίου είναι:
ο προσδιορισμός και εντοπισμός σχετικών πληροφοριών μέσα στο τεκμήριο που
ευρετηριάζεται
η ανάλυση των εννοιών που περικλείονται σε ένα τεκμήριο προκειμένου να
παραχθούν οι σχετικές επικεφαλίδες
η διασφάλιση ότι οι όροι ευρετηρίασης που χρησιμοποιούνται συμβάλλουν στη
γρήγορη ανάκτηση πληροφοριών και στον προσδιορισμό των κατάλληλων
τεκμηρίων μίας συλλογής
η καθιέρωση σχέσεων ανάμεσα στις έννοιες
η καθοδήγηση των χρηστών στη χρήση επιλεγμένων όρων αναζήτησης μέσω
παραπομπών
η κατάταξη των όρων με συστηματικό τρόπο
Κανόνες ευρετηρίασης
•Εξειδίκευση (υψηλή ακρίβεια) η χρησιμοποίηση στενών (ειδικών) εννοιών
•Εξαντλητικότητα (υψηλή ανάκληση) η χρησιμοποίηση όλων των εννοιών
•Συνέπεια (υψηλή ανάκληση και ακρίβεια)
12
Συστήματα ευρετηρίασης
Ανάλογα με το πώς χειρίζονται τα σύνθετα θέματα, τα συστήματα
ευρετηρίασης μπορούν να διακριθούν σε προσυνδυασμένα και
υστεροσυνδυασμένα.
Στα Προσυνδυασμένα συστήματα, οι όροι ευρετηρίασης συνδυάζονται κατά
την ευρετηρίαση και διαχειρίζονται τα σύνθετα θέματα με ολοκληρωμένες
θεματικές περιγραφές. Στα προσυνδυασμένα ευρετήρια, οι σχέσεις μεταξύ
των όρων δηλώνονται με σύμβολα, καθένα από τα οποία εκφράζει ειδική
σχέση, με τη θέση των όρων στην κάθε αναγραφή, την τυπογραφία και με τη
στίξη που τους συνδέει.
Στα Υστεροσυνδυασμένα συστήματα, οι όροι δεν συνδυάζονται κατά την
ευρετηρίαση, αλλά κατά την αναζήτηση. Οι όροι που αποδίδουν το
περιεχόμενο του τεκμηρίου καταχωρούνται ανεξάρτητοι. Ο συνδυασμός των
όρων γίνεται κατά τη διάρκεια της αναζήτησης των πληροφοριών με διάφορες
τεχνικές. Στα υστεροσυνδυασμένα συστήματα, το τεκμήριο ανακτάται, εάν
όλοι ή ένας από τους όρους αυτούς χρησιμοποιηθούν για την αναζήτησή του.
Στα προσυνδυασμένα συστήματα υπάγονται τα ταξινομικά συστήματα και οι
κατάλογοι θεματικών επικεφαλίδων ενώ στα υστεροσυνδυασμένα οι
θησαυροί.
13
Επικεφαλίδες
Επικεφαλίδα ονομάζουμε το κύριο στοιχείο μιας εγγραφής το οποίο χρησιμοποιείται σε μια
γλώσσα θεματικής ευρετηρίασης και αποτελεί μοναδική εγγραφή σε ένα αρχείο
καθιερωμένων εγγραφών.
Οι τύποι των επικεφαλίδων είναι ονόματα :
Personal names (X00)
Corporate names(X10)
Meeting names (X11)
Names of jurisdictions (X51)
Uniform titles (X30)
Name/title combinations
και θεμάτα:
Topical terms (X50)
Geographic names (X51)
Names with subject subdivisions
Terms and names used as subject subdivisions
Ακόμα η μορφή των επικεφαλίδων μπορεί να είναι :
Απλές, σύμμεικτες, σύνθετες και επικεφαλίδες φράσεις
14
Επικεφαλίδες (2)
Ακόμα οι επικεφαλίδες χωρίζονται με βάση τη λειτουργία τους :
Επικεφαλίδα καθιερωμένου τύπου
Παραπεμπτική επικεφαλίδα
Επεξηγηματική επικεφαλίδα
15
Κωδικοποίηση επικεφαλίδων : MARC και UNIMARC
To MARC είναι σύστημα κωδικοποίησης, η διάταξη καταχώρισης
βιβλιογραφικών δεδομένων σε υπολογιστικό σύστημα με στόχο τη διακίνηση
και την ανταλλαγή τους.
MARC21
το MARC21 αποτελεί σημείο αναφοράς. Έτσι, η βιβλιογραφική περιγραφή των
συμβατικών τεκμηρίων επιτυγχάνεται με τη βοήθεια των εργαλείων όπως
είναι το MARC, ενώ για τα ψηφιακά τεκμήρια η βιβλιογραφική περιγραφή και
ανταλλαγή μπορεί να συντελείται με σχήματα όπως το MODS, το EAD ή το
METS.
Το καθιερωμένο MARC21 διεκδικεί δυναμικά ρόλο στο νέο περιβάλλον
υιοθετώντας την XML και δημιουργώντας το MARCXML schema
UNIMARC
Σκοπός ανάπτυξης του η ενιαία διάταξη για την ανταλλαγή δεδομένων (IFLA).
16
UNIMARC Authorities
Βασική δομή
Πεδία (tags) που δηλώνουν:
τον τύπο μιας σειράς χαρακτήρων
τη λειτουργία που επιτελεί μια σειρά χαρακτήρων π.χ. αναφορές
(tracing, ίχνευμα)
Δείκτες (indicators): αριθμοί ή χαρακτήρες που η σημασία τους εξαρτάται
από τα tags αλλά έχουν την ίδια σημασία και χρήση σε όλα τα πεδία.
Υποπεδία (subfield): με αλφαβητικό ή αριθμητικό συμβολισμό που η
σημασία τους εξαρτάται από τα tags αλλά ως επί το πλείστον κοινά
δεδομένα ταυτοποιούνται από τα ίδια υποπεδία. Δεν παίζει ρόλο η σειρά
δήλωσης των υποπεδίων.
Υποχρεωτικά πεδία
001 Ταυτότητα εγγραφής
100 Γενικά Δεδομένα επεξεργασίας
2– Επικεφαλίδα
801 Πεδίο προέλευσης
17
Εγγραφή μιας επικεφαλίδας
001 GR-AtPPVa10001582 Επικεφαλίδα
003 GR-AtPPV καθιερωμένου τύπου
005 20081017155905.0
100 ## ‡a19920107agrey0105 ga Σημειώσεις
250 ## ‡aΚεφαλαιαγορά
300 1# ‡aΥποδιαιρείται γεωγραφικά
450 ## ‡aCapital market‡0750 Επικεφαλίδα
450 ## ‡aΑγορά κεφαλαίου εναλλακτικής γραφής
450 ## ‡aMarket, Capital Εγγραφές που δεν
550 ## ‡aΧρηματοοικονομική‡5g χρησιμοποιούνται
550 ## ‡aΑγορά χρήματος‡5g
550 ## ‡aΔάνεια‡5g
Παραπεμπτική
550 ## ‡aΧρεόγραφα‡5g αναγραφή για
550 ## ‡aΧρηματοοικονομικά ιδρύματα‡5g στενότερο όρο
550 ## ‡aΑγορά ομόλογων‡5h
550 ## ‡aΧρηματιστήρια αξιών‡5h Παραπεμπτική
801 #0 ‡aGR‡bΠάντειο Πανεπιστήμιο αναγραφή για
ευρύτερο όρο
18
19
Library of Congress Subject Headings (LCSH)
Από το 1910 η Βιβλιοθήκη του Κογκρέσου των ΗΠΑ δημοσιεύει : Library of Congress Subject
Headings (LCSH). Μαζί υπάρχουν σημερα και :
Subject Headings for Children
Medical Subject Headings (MESH)
Σήμερα υπάρχει η 30η έκδοση τους, μέσα στο 2009 η 31η , σε έντυπη και ηλεκτρονική.
Ανάλογο κατάλογο αναπτύσσει η ΕΒΕ και πολλές βιβλιοθήκες, με προβλήματα σήμερα στην
ομοιομορφία τους μέσα από το Συλλογικό κατάλογο, κύρια στην απόδοση των όρων
στην ελληνική γλώσσα. Παράδειγμα από κατάλογο :
ΗΛΕΚΤΡΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ -- ΔΙΚΤΥΑ -- ΜΕΤΡΗΣΕΙΣ ΑΣΦΑΛΕΙΑΣ
Computer security
Computer networks-- Security measures
Δίκτυα υπολογιστών -- Ασφάλειας, Μέτρα
Internet-- Security measures
Διαδίκτυο -- Ασφάλειας, Μέτρα
Computer networks
Securities-- Data processing
Cryptography
Ασφάλεια δικτύου
ΑΣΦΑΛΕΙΑ ΥΠΟΛΟΓΙΣΤΩΝ
Δίκτυα υπολογιστών -- Μέτρα ασφάλειας
Δίκτυα ηλεκτρονικών υπολογιστών -- Μέτρα ασφάλειας
Ασφάλεια ηλεκτρονικών υπολογιστών
Ηλεκτρονικοί υπολογιστές -- Δίκτυα -- Μέτρα ασφαλείας
ΔΙΚΤΥΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΔΙΚΤΥΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ -- ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ
Security
20
Σύνταξη επικεφαλίδας
Η λεκτική απόδοση εξειδικευμένων θεμάτων απαιτεί ένα συνδυασμό όρων. Το
παρακάτω βιβλίο είναι είναι ένα συνέδριο με θέμα το δίκαιο (νομοθεσία) του
διαδικτύου στις χώρες της Ευρώπης.
21
Κανόνες σύνταξης επικεφαλίδων
Οι θεματικές επικεφαλίδες μπορεί να εκφράζουν συγκεκριμένες έννοιες ή
αντικείμενα, ή αφηρημένες έννοιες.
Ουσιαστικά (απλές λέξεις), συνδυασμός ουσιαστικού – επιθέτου, συνδυασμός
δύο ουσιαστικών, ολόκληρες φράσεις, χωρίς χρήση άρθρων.
Ενικός αριθμός στις αφηρημένες έννοιες, μη μετρήσιμο ουσιαστικό (σίδηρος),
ενώ ο πληθυντικός αριθμός ουσιαστικά που μπορούν να μετρηθούν.
Στις σύνθετες θεματικές επικεφαλίδες με βαθμό εξειδίκευσης είναι σοβαρό:
1. Η λέξη, το σημείο εκείνο που εισάγει την επικεφαλίδα στο κατάλογο.
2. Τη σειρά με την οποία θα παρουσιαστούν τα επιμέρους συνθετικά της στη
σύνθετη επικεφαλίδα.
- φυσική ή αντεστραμένη μορφή (Ελληνική γλώσσα , αλλά Παραγωγή,
Προστασία της).
- η σειρά των συνθετικών μιας σύνθετης επικεφαλίδας (σύμφωνα με
Coates) : Αντικείμενο – Μέρος (του αντικειμένου) – Υλικό – Ενέργεια – Ιδιότητα .
- με βάση στίξη που χρησιμοποείται: παύλα (-), το κόμμα και τελεία (.)
έννοια χωρίς υποδιαίρεση/ εννοια με παύλα/ έννοια με κόμμα/ έννοια με
φράση
22
Ο χρονικός προσδιορισμός έπεται του θεματικου και του τοπικού κατά την
διαμόρφωση μιας επικεφαλίδας.
Υπάρχουν περίοδοι στην Ιστορία (όπως στα ταξινομικά συστήματα) που χρησιμοποιούνται.
23
Απλές και ανεπτυγμένες θεματικές επικεφαλίδες
Ανάπτυξη με
υποδιαιρέσεις
(φασετες) με
χώρο και χρόνο
κ.α.
Υποδιαιρείται
γεωγραφικά
Μη
προτιμώμενοι
όροι
Πλατύτεροι
όροι
24
25
Παραπομπές στις θεματικές επικεφαλίδες
Όπως και στους θησαυρούς οι κατάλογοι θεματικών επικεφαλίδων
χρησιμοποιούν παραπομπές με διαφορετική πολλές φορές
σημειογραφία:
BT (Broaden Term) : Παραπομπή προς τον ευρύτερο θεματικά όρο (σύμβολα <<, ΧΧ,
ΒΤ)
ΝΤ (Narrow Term) : Παραπομπή προς το στενότερο θεματικά όρο (σύμβολα >>, β.ε.,
ΝΤ)
RT (Related Term) : Παραπομπή προς επίσης χρησιμοποιούμενο όρο του ίδιου
θεματικά επιπέδου (σύμβολα >>, β.ε., RΤ).
USE : Παραπομπή από όρο που δεν χρησιμοποιείται στο προτιμώμενο (σύμβολα: >,
βλέπε, USE).
USE FOR: Αντίστροφη παραπομπή από όρο που δεν χρησιμοποιείται προς τον
χρησιμοποιούμενο (σύμβολα: <, Χ , UF).
Στις εγγραφές των καθιερωμένων στο UNIMARC οι παραπομπές
κωδικοποιούνται στο υποπεδίο $5 των πεδίων 4-- και 5– με το χαρακτήρα h
και g.
26
27
Επικεφαλίδα ονόματος σε UNIMARC
001 GR-AtPPVa10016842
003 GR-AtPPV
005 20080516163334.0
100 ## ‡a19980826agrey0105 ga
200 #1 ‡aGarcia Marquez‡bGabriel‡f1928-
400 #1 ‡aMarquez Garcia‡bGabriel‡f1928-
400 #1 ‡aΜάρκες‡bΓκαμπριέλ Γκαρσία‡f1928-
400 #1 ‡aΓκαρσία Μάρκες‡bΓκαμπριέλ‡f1928-
801 #0 ‡aGR‡bΠάντειο Πανεπιστήμιο
28
29
Βασικές δομές
Μια MADS εγγραφή περιλαμβάνει ένα ή περισσότερα στοιχεία
<authority>, <related> ή <variant>
Πρέπει να υπάρχει ακριβώς ένα <authority> και πιθανόν να υπάρχει
οποιοσδήποτε αριθμός των <related> και/ή <variant>
Authority (περιγραφέας θέματος)
Related (see also)
Variant heading(s) (see)
Υποστοιχεία βασικών στοιχείων:
<name>
<titleInfo>
<topic>
<temporal>
<genres>
<geographic>
<hierarahicalGeographic>
<occupation>
<name> <titleinfo>
Χρησιμοποιείται για πρόσωπα, γεγονότα ή γεωγραφικές
ονομασίες
Υποστοιχεία:
< name Part> Attribute: type (date, family, given, termsOfAddress)
<role>
<role Term> Attributes: type (code, text)
<description> Attributes: ID, xlink, lang, xml: lang, script, transliteration, type (personal,
corporate conference, geographic), authority
Χρησιμοποιείται για την ομοιόμορφη περιγραφή τίτλων
Υποστοιχεία:
<title>
<subTitle>
<partNumber>
<partName>
<nonSort>
Attributes: ID, xlink, lang, xml: lang, script, transliteration, displayLabel, authority
31
Άλλα στοιχεία
<topic>: Χρησιμοποιείται για θεματικούς καθιερωμένους όρους
Attributes: ID, xlink, lang, xml:lang, script, transliteration, authority
<temporal>: Χρησιμοποιείται για χρονικά/ χρονολογικά θέματα
Attributes: ID, xlink, lang, xml:lang, script, transliteration, authority
(sources: coming soon), encoding (w3cdtf, iso8601, marc), point (start,
end), keyDate (yes), qualifier (approximate, inferred, questionable)
<genre>: Χρησιμοποιείται για ειδικούς όρους
<geographic>: Χρησιμοποιείται για τα επίσημα καθιερωμένα ονόματα των
γεωγραφικών οντοτήτων
<hierarahicalGeographic>: Χρησιμοποιείται για να παρέχει μία επίσημα
καθιερωμένη μορφή για τις ιεραρχικά γεωγραφικές ονομασίες.
Υποστοιχεία: <continent>, <country>, <province>, <region>, <state>,
<territory>, <county>, <city>, <island>, <area>
<occupation>: Χρησιμοποιείται για να παρέχει μία επίσημα καθιερωμένη
ονομασία για τις ονομασίες των επαγγελμάτων
32
Άλλα στοιχεία
<notes>
<affiliation>
<fieldOfActivity>
<url>
<identifier>
<extension>
<recordInfo>
33
Αναφορές
Τα στοιχεία <related> ή <variant> αποτελούν παραπομπές
<related>: Παραπομπή σε άλλη καθιερωμένη εγγραφή,
ισοδυναμεί με τις παραπομπές "see also" (UF) στους
καταλόγους βιβλιοθηκών
Attributes: earlier, later, parentOrg, broader, narrower, equivalent,
other
<variant>: Παραπομπή σε μη καθιερωμένη εγγραφή,
παραλλαγή ενός όρου, ισοδυναμεί με τις παραπομπές
"see" (USE)στους καταλόγους βιβλιοθηκών
Attributes: acronym, abbreviation, translation, expansion, other
34
MADS Παραδείγματα
<authority>
<geographic>Scotland</geographic>
<topic>History</topic>
<temporal>18th century</temporal>
</authority>
<authority>
<genre authority=“gsafd”>Historical fiction</genre>
</authority>
<authority>
<name type=“personal”>Law, Felicia</name>
<titleInfo><title>Ways we move</title></titleInfo>
</authority>
35
Φυσικό πρόσωπο
<mads xsi:schemaLocation="http://www.loc.gov/mads/ mads.xsd">
−<authority>
−<name>
<namePart>Smith, John</namePart>
<namePart type="date">1995</namePart>
</name>
</authority>
−<variant type="other">
-<name>
<namePart>Smith, John J</namePart>
</name>
</variant>
-<note type="history">Biographical note about John Smith</note>
-<affiliation>
<organization>Lawrence Livermore Laboratory</organization>
<dateValid>1987</dateValid>
</affiliation>
</mads>
36
Θεματική επικεφαλίδα
<mads>
-<authority>
<topic authority=“lcsh">Computer programming
</topic>
</authority>
<related type="broader">
<topic>Computers</topic></related>
<related type="narrower">
<topic>Programming languages</topic>
</related>
<related type=“other"><topic>Systems analysis
</topic></related>
</mads>
37
Θησαυρός
Θησαυρός είναι το λεξιλόγιο όρων µιας ελεγχόµενης γλώσσας ευρετηρίασης,
δοµηµένης µε τρόπο ώστε να υποδηλώνονται σαφώς οι “a priori” σχέσεις
µεταξύ εννοιών (για παράδειγµα, οι “πλατύτερες” – “στενότερες”). (από ΕΛΟΤ
1321)
οι θησαυροί μπορούν να χρησιμοποιηθούν από τους επαγγελματίες σε
διαδικασίες όπως
Ευρετηρίαση υλικού (indexing thesaurus): Το ελεγχόμενο λεξιλόγιο που
παρέχει ο Θησαυρός χρησιμεύει στη διαδικασία της ευρετηρίασης, χωρίς
να περιγράφει την επιστημονικά πιο σωστή ταξινόμηση. Δεν είναι η ειδική
ορολογία ενός επιστήμονα αλλά κοινώς αποδεκτοί και
χρησιμοποιούμενοι όροι, δηλαδή η φυσική γλώσσα.
Οργάνωση δομής και περιεχομένου.
Ο βασικός σκοπός των Θησαυρών είναι η καθοδήγηση τόσο του
ευρετηριαστή όσο και του χρήστη να επιλέξουν τον ίδιο όρο για την ίδια
έννοια
38
Θησαυρός (2)
Αλλά και από τους τελικούς χρήστες στην
Αναζήτηση – ανάκτηση (search thesaurus)
Aναζήτηση με λέξεις κλειδιά Ο Θησαυρός παρέχει το λεξιλόγια με το
οποίο μπορεί να βελτιώσει την διαδικασία αναζήτησης με αυτόματο
τρόπο ή διαδραστικά με λέξεις κλειδιά, και επίσης προσφέρεται για
επέκταση ερωτήματος. Η αναζήτηση αυτή μπορεί να πραγματοποιηθεί
είτε σε δομημένο (ευρετηριασμένο) περιεχόμενο), είτε σε ερώτημα
ελεύθερου κειμένου (free text query)
Φυλλομέτρηση Ο χάρτης του Θεματικού πεδίου που παρέχει μπορεί να
χρησιμοποιηθεί για την εξερεύνηση του από τον χρήστη.
Οι Θησαυροί τυπικά χρησιμοποιούνται ως εργαλεία στη διαδικασία της
υστερο-συνδυασμένης αναζήτησης, όπου ο χρήστης έχει τη δυνατότητα να
επιλέξει ο ίδιος τον συνδυασμό των εννοιών που θα αναζητήσει
Στο παράδειγμα στις θεματικές επικεφαλίδες : Διαδίκτυο – Δίκαιο και
νομοθεσία – Ευρώπη, σε ένα θησαυρό θα είχαμε τις χωριστές έννοιες:
Διαδίκτυο
Δίκαιο και νομοθεσία (ή μια από τις δύο)
Ευρώπη
39
Οι όροι ενός θησαυρού
Συγκεκριμένες οντότητες
Πράγματα και τα μέρη αυτών: κεφάλι, τραπέζια, κτίρια, μολύβια
Υλικά: γύψος, αμίαντος, χρώματα
Αφηρημένες έννοιες
Ενέργειες και γεγονότα: ανάπτυξη, διατήρηση, πόλεμοι, εορτές
Αφηρημένες οντότητες, ιδιότητες: δίκαιο, αντοχή, κάμψη, απόδοση
Επιστημονικά πεδία: χημεία, βιβλιοθηκονομία, πληροφορική
Μονάδες μέτρησης: μέτρα, χιλιόγραμμα
Ατομικές οντότητες, κύρια ουσιαστικά: Ελλάδα, Ευρωπαϊκή Ενωση, Ιόνιο
Παν/μιο, Ποταμός Πηνειός
40
Ενικός - πληθυντικός
Συγκεκριμένες οντότητες
Μετρήσιμα ουσιαστικά (που απαντούν στο “πόσα πολλά;”), στον
πληθυντικό: πλανήτες, παιδιά, μέρη σώματος, (εάν όμως
απαντώνται μία φορά στο ίδιο σώμα, προτιμάται ο ενικός, π.χ
πόδια, αλλά στόμα, αναπνευστικό σύστημα)
μη μετρήσιμα ουσιαστικά (που απαντούν στο “πόσο πολύ;”), στον
ενικό: αλουμίνιο, χιόνι, ρύζι (εάν πρόκειται για ομάδα με πολλές
συνιστώσες, τότε χρησιμοποιείται πληθυντικός, π.χ φρούτα,
κράματα, κράματα αλουμινίου, χάλυβες)
Αφηρημένες έννοιες
Χρησιμοποιείται ο ενικός, εκτός εάν πρόκειται για ομάδα με
πολλές συνιστώσες: διαχωρισμός, καπιταλισμός, μωαμεθανισμός,
μεταλλουργία, συσκευασία, διοίκηση, τεχνική, αλλά φυσικές
διεργασίες, χημικές ιδιότητες,
Ατομικές οντότητες, κύρια ουσιαστικά χρησιμοποιείται ο ενικός: Big
Ben, British Library, Γαλλία, Παρθενώνας
41
Σύνθετοι όροι
Οι σύνθετοι όροι πρέπει να διατηρούνται σύνθετοι όταν:
είναι πολύ οικείοι στη σύνθετη μορφή τους και αν χωρίζονταν θα υπήρχε
πρόβλημα στην κατανόησή τους (ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ, ΑΝΤΟΧΗ
ΥΛΙΚΩΝ, ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ ΔΙΑΧΕΙΡΙΣΗ)
κύρια ονόματα και όροι που εμπεριέχουν κύρια ονόματα (ΗΝΩΜΕΝΑ ΕΘΝΗ,
ΟΙΔΙΠΟΔΕΙΟ ΣΥΜΠΛΕΓΜΑ, )
όροι που χωρίς αυτούς χάνει την σημασία του ΣΥΖΗΤΗΣΗ ΣΤΡΟΓΓΥΛΗΣ
ΤΡΑΠΕΖΑΣ, ΤΕΤΡΑΓΩΝΙΚΗ ΡΙΖΑ)
όροι που δεν μπορούν να εκφραστούν ή να ορισθούν χωρίς (ΣΚΑΛΕΣ
ΔΙΑΦΥΓΗΣ, δηλ. ΣΚΑΛΕΣ για τη ΔΙΑΦΥΓΗ ΑΤΟΜΩΝ, ΠΕΤΡΕΛΑΙΟΜΗΧΑΝΕΣ, δηλ.
ΜΗΧΑΝΕΣ που χρησιμοποιούν ΠΕΤΡΕΛΑΙΟ για ΚΑΥΣΙΜΟ)
όροι που περιέχουν συγκατηγορηματικά ονόματα (ΤΕΧΝΗΤΑ ΜΕΛΗ,
ΑΠΟΛΙΘΩΜΕΝΑ ΨΑΡΙΑ)
Οι σύνθετοι όροι εισάγονται στη φυσική γλώσσα, όχι με ανεστραμμένη
μορφή.
ΑΡΠΑΚΤΙΚΑ ΠΟΥΛΙΑ, ΗΛΕΚΤΡΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ, ΧΡΕΗ ΠΡΟΣ ΤΟ ΔΗΜΟΣΙΟ
42
Σύνθετοι όροι
Σύνθετοι όροι που αναλύονται στα συστατικά τους μέρη
Όταν αναφέρεται σε μία ιδιότητα ή τμήμα
ΜΗΧΑΝΕΣ ΑΕΡΟΣΚΑΦΩΝ ΧΡ ΑΕΡΟΣΚΑΦΗ + ΜΗΧΑΝΕΣ
Αντίθετα, ο σύνθετος όρος παραμένει ως έχει, π.χ. ΟΞΙΝΟ ΕΔΑΦΟΣ, ΕΙΔΙΚΕΥΜΕΝΟ
ΠΡΟΣΩΠΙΚΟ
Όταν μια μεταβατική ενέργεια δεν τροποποιείται από το αντικείμενο στο οποίο ασκείται
η ενέργεια, τότε διασπάται.
Εκπαίδευση πιλότου ΧΡ ΠΙΛΟΤΟΙ + ΕΚΠΑΙΔΕΥΣΗ.
Κέντημα υφάσματος ΧΡ ΥΦΑΣΜΑΤΑ + ΚΕΝΤΗΜΑ
Αντίθετα, όταν έχει τροποποιηθεί, παραμένει στη σύνθετη μορφή του, π.χ.
ΣΚΑΛΙΣΜΕΝΟ ΞΥΛΟ, ΚΕΝΤΗΜΕΝΑ ΥΦΑΣΜΑΤΑ
Όταν μια αμετάβατη ενέργεια δεν τροποποιείται από τον εκτελεστή της ενέργειας
διασπάται, π.χ.
Εκρηξη βραστήρα ΧΡ ΕΚΡΗΞΗ + ΒΡΑΣΤΗΡΕΣ.
Μετανάστευση πτηνών ΧΡ ΠΤΗΝΑ + ΜΕΤΑΝΑΣΤΕΥΣΗ
Αντίθετα, ΑΠΟΔΗΜΗΤΙΚΑ ΠΤΗΝΑ, ΚΥΛΙΟΜΕΝΗ ΚΛΙΜΑΚΑ.
43
Σχέσεις όρων σε ένα θησαυρό
Σχέση ισοδυναμίας
ΧΡ (χρησιμοποίησε) γραμμένο ως πρόθεμα στον περιγραφέα.
ΧΑ (χρησιμοποίησε αντί) γραμμένο ως πρόθεμα στο μη προτιμώμενο
όρο
ΠΤΗΝΑ ΧΑ Πουλιά, Πουλιά ΧΡ ΠΤΗΝΑ.
Σχέση ιεραρχίας
ΠΟ (πλατύτερος όρος) γραμμένος ως πρόθεμα στον ανώτερο
ιεραρχικά όρο
ΕΟ (ειδικότερος όρος) γραμμένος ως πρόθεμα στον υπαγόμενο όρο.
ΑΕΡΟΠΟΡΙΚΕΣ ΓΡΑΜΜΕΣ
ΠΟ ΥΠΗΡΕΣΙΕΣ ΜΕΤΑΦΟΡΩΝ
ΥΠΗΡΕΣΙΕΣ ΜΕΤΑΦΟΡΩΝ
ΕΟ ΑΕΡΟΠΟΡΙΚΕΣ ΓΡΑΜΜΕΣ
Σχέση συσχέτισης ΣΟ (σχετικός όρος)
ΠΤΗΝΑ ΣΟ ΟΡΝΙΘΟΛΟΓΙΑ
ΟΡΝΙΘΟΛΟΓΙΑ ΣΟ ΠΤΗΝΑ
44
Συντομογραφίες
σχέσεων θησαυρού
ΔΣ ιευκρινιστική σημείωση (SN - Scope Note)
ΧΡ χρησιμοποίησε (use)
ΧΑ χρησιμοποίησε αντί (UF – used for)
ΟΚ όρος κορυφής (TT – top term)
ΠΟ πλατύτερος όρος (BT – broad term)
ΠΟΓ πλατύτερος όρος γένους
ΠΟΜ πλατύτερος όρος μέρους
ΕΟ ειδικότερος όρος (NT – narrow term)
ΕΟΓ ειδικότερος όρος γένους
ΕΟΜ ειδικότερος όρος μέρους
ΣΟ σχετικός όρος (RT – Related term)
45
Παρουσίαση θησαυρού USE
reference
SN scope
note
N narrower
term
R related
terms
47
Παρουσίαση θησαυρού (3)
DISORDERS CLUSTERS
Antisocial Behavior & Behavior disorders
Diagnosis
Disorder characteristics
Learning disorders & mental Retardation
Physical & Psychosomatic disorders
….. 48
Πολυεδρικός Θησαυρός
Η χρήση της φασετικής ανάλυσης στην δημιουργία θησαυρών είναι
χρήσιμη καθώς προσδίδουν πρόσθετη εξειδίκευση και ρόλο.
49
Πολυεδρικός Θησαυρός (2)
50
Υποδιαρέσεις της
εδρας Styles and
Periods
Κάποιες είναι και
αυτές Ιεραρχίες (styles
and periods by region)
51
Δημιουργία Θησαυρού
52
53
Συνοπτικά
Θεματικές επικεφαλίδες Θησαυροί
Μία έννοια : Πολλές έννοιες:
Βία,
Βία στις φυλακές
Φυλακές
Θρησκεία
Θρησκεία και κουλτούρα Κουλτούρα
54
Θησαυροί
AAT (Art and Archtiecture Thesaurus)
http://www.getty.edu/research/conducting_research/vocabularies/aat
AGROVOC http://www.fao.org/agrovoc
ASFA (Aquatic Sciences and Fisheries Abstracts) http://www4.fao.org/asfa/asfa.htm
ASIS (Thesaurus of Information Science)
http://www.asis.org/Publications/bookstore/thes.html
ASTRONOMY http://www.mso.anu.edu.au/library/thesaurus/
British Museum collections http://www.mda.org.uk/bmmat/matintro.htm
CAB http://www.cabi.org/DatabaseSearchTools.asp?PID=277
CSA (Life Sciences Thesaurus)
http://www.csa.com/help/CSA_Illumina_Help.htm#Search_Tools/thesaurus.html
DEH (Environment and Heritage Thesaurus)
http://www.environment.gov.au/about/publications/dehthesaurus. html
(EET) European education thesaurus
http://www.eurydice.org/portal/page/portal/Eurydice/TEE
55
Θησαυροί
ERIC (Education Resources Information Center)
http://eric.ed.gov/ERICWebPortal/Home.portal?_nfpb=true&_pageLabel=Thesaurus&_nfls=f
alse
EUROVOC http://psp.cz/cgi-bin/eng/kps/knih/ee_geninfo.htm
HASSET (Social Science Information Gateway) >>> Intute
http://www.intute.ac.uk/socialsciences/thesaurus.html
ILO (International Labour Organization) http://www.ilo.org/public/libdoc/ILO-
Thesaurus/english/index.htm
INSPEC http://www.iee.org/publish/support/inspec/document/thes/
Library of Congress
(Graphic materials I) http://www.loc.gov/rr/print/tgm1/downloadtgm1.html
(Graphic materials II) http://www.loc.gov/rr/print/tgm2/downloadtgm2.html
MeSH http://www.nlm.nih.gov/mesh/MBrowser.html
NASA http://www.sti.nasa.gov/products.html
OΕCD (Organization for Economic Co-operation and Development)
http://info.uibk.ac.at/info/oecd-macroth/
56
Θησαυροί
TESE (Thesaurus for Education Systems in Europe)
http://www.eurydice.org/portal/page/portal/Eurydice/showPresentation?pubid=0
51EN
Thesaurus of psychological index terms
TNG (Thesaurus of Geographic Names)
http://www.getty.edu/research/conducting_research/vocabularies/tgn/
UNESCO http://www2.ulcc.ac.uk/unesco/thesaurus.htm
57
Resource Description Framework
Μανόλης Γεργατσούλης
Χρήστος Παπαθεοδώρου
Ομάδα Βάσεων Δεδομένων και Πληροφοριακών
Συστημάτων, Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας
Ιόνιο Πανεπιστήμιο
<course date=“...”>
<title>...</title>
course
<teacher>...</teacher>
<name>...</name>
<http>...</http>
= title teacher students
<students>...</students>
</course>
name http
Τι είναι η RDF ;
Η RDF (Resource Description Framework) είναι ένα
μοντέλο δεδομένων
ανεξάρτητο από το πεδίο εφαρμογής, και ανεξάρτητο
από συγκεκριμένη εφαρμογή,
μπορεί να ειδωθεί σαν ένας κατευθυνόμενος γράφος με
ετικέτες.
Το μοντέλο δεδομένων της RDF είναι ένα αφηρημένο,
εννοιολογικό επίπεδο ανεξάρτητο από την XML
επομένως, η XML μπορεί να παρέχει τη σύνταξη για την
RDF, αλλά δεν είναι συστατικό της RDF
τα RDF δεδομένα είναι πιθανόν να μην εμφανίζονται
ποτέ σε μορφή XML.
4
Αναπαραστάσεις της RDF
XML Encoding Graph
<rdf:RDF ……..>
<….>
<….>
</rdf:RDF> Μοντέλο
Δεδομένων
Κατάλληλη για Κατάλληλη
RDF
μηχανική για χρήση από
επεξεργασία ανθρώπους
Triples Η RDF είναι μια απλή
stmt(docInst, rdf_type, Document) γλώσσα για την
stmt(personInst, rdf_type, Person) δημιουργία
stmt(inroomInst, rdf_type, InRoom) αναπαραστάσεων που
stmt(personInst, holding, docInst) βασίζονται σε γράφους
stmt(inroomInst, person, personInst)
Κατάλληλη για
συμπερασματολογία
5
resource value
property
http://www.w3.org/TR/REC"rdf"syntax/
creator
: ιδιότητα
: πόρος “Ora Lassila”
: τιμή
6
Το μοντέλο της RDF (συνέχεια)
Οι δηλώσεις περιγράφουν ιδιότητες πόρων
(resources) του web
Ένας πόρος είναι κάθε αντικείμενο το οποίο μπορεί
να αντιστοιχηθεί σε ένα URI:
Ένα τεκμήριο, μια εικόνα, μια παράγραφος στο Web, …
Π.χ., http://www.ionio.gr/~manolis/index.html
Ένα βιβλίο στη βιβλιοθήκη, ένα υπαρκτό πρόσωπο (?)
isbn://5031-4444-3333
…
Οι ιδιότητες είναι επίσης πόροι (URIs)
7
Publisher
http://www.w3.org/TR/REC"rdf"syntax/
Creator
Date
“Ora Lassila”
“1999"02"22”
8
Αναπαράσταση τριάδων
Η RDF μπορεί να κωδικοποιηθεί σαν ένα
σύνολο τριάδων (triples): !
<subject> <predicate> <object>.
Κάθε τριάδα αντιστοιχεί σε ένα
βέλος στο γράφο.
Η αναπαράσταση τριάδων του
διπλανού γράφου είναι η
ακόλουθη: %&&& '( (( " #$
http://www.w3.org/TR/REC"rdf"syntax/
Creator
“Ora Lassila”
Name
EMail
“ora.lassila@nokia.com” 11
http://www.w3.org/TR/REC"rdf"syntax/
Creator
Name
“Ora Lassila”
EMail
“ora.lassila@nokia.com”
12
Περιβλήματα
Τα περιβλήματα (Containers) στην RDF χρησιμοποιούνται για
την αναπαράσταση συλλογών από πόρους
επιτρέπουν ομαδοποίηση των πόρων (ή των τιμών).
Έναι δυνατό να διατυπώσουμε δηλώσεις που αναφέρονται σε
ένα περίβλημα (σαν ολότητα) ή στα ξεχωριστά μέλη του.
Η RDF παρέχει τρεις διαφορετικούς τύπους περιβλημάτων:
bag – συλλογή χωρίς διάταξη
seq – διατεταγμένη συλλογή (= “sequence”)
alt – αναπαριστά εναλλακτικές τιμές.
Επιτρέπονται επαναλαμβανόμενες τιμές
δεν υπάρχει μηχανισμός που να επιβάλει περιορισμούς
μοναδικότητας των τιμών.
Είναι δυνατόν να δημιουργηθούν συλλογές με βάση URI
πρότυπα
για παράδειγμα, όλα τα αρχεία σε ένα συγκεκριμένο web site.
13
Περιβλήματα (συνέχεια)
“http://www.w3.org/TR/REC"rdf"syntax/ has
as creator(s) Ora Lassila and Ralph Swick”
http://www.w3.org/TR/REC"rdf"syntax/
Creator
rdf:Type
rdf:Seq
rdf:_1 rdf:_2
Courses/6.001
rdf:Bag
rdf:Type
students
rdf:_1
Students/John
rdf:_2
Students/Tim
rdf:_3
Students/Mary
15
Η RDF/XML σύνταξη
Το μοντέλο δεδομένων RDF παρέχει ένα αφηρημένο,
εννοιολογικό πλαίσιο για τον ορισμό και τη χρήση
μεταδεδομένων.
Μια συγκεκριμένη σύνταξη είναι όμως απαραίτητη για τη
δημιουργία και την ανταλλαγή των μεταδεδομένων.
Η XML μπορεί να χρησιμοποιηθεί σαν τέτοια σύνταξη.
Η RDF επίσης απαιτεί τη χρήση χώρων ονομάτων XML για να
συνδέει με ακρίβεια κάθε ιδιότητα (property) με το σχήμα που
ορίζει αυτήν την ιδιότητα.
Ορίζονται δύο τρόποι σύνταξης βασισμένοι στην XML για τη
κωδικοποίηση ενός στιγμιότυπου του RDF μοντέλου δεδομένων:
η σειριακή σύνταξη (serialization syntax): εκφράζει τις πλήρεις
δυνατότητες του μοντέλου με έναν συστηματικό τρόπο
η συντετμημένη σύνταξη (abbreviated syntax): παρέχει επιπλέον δομές
οι οποίες δίνουν τη δυνατότητα αναπαράστασης ενός υποσυνόλου του
μοντέλου με έναν πιο συμπαγή τρόπο
οι διερμηνείς RDF υποστηρίζουν και τους δύο τρόπους σύνταξης.
16
Βασική σειριακή σύνταξη
Η RDF XML σύνταξη έχει σχεδιαστεί κατά
τέτοιο τρόπο ώστε να ομαδοποιεί πολλαπλές
δηλώσεις για τον ίδιο πόρο σε ένα στοιχείο με
ετικέτα Description.
http://www.w3.org/TR/REC"rdf"syntax/
<?xml version=“1.0” encoding=“UTF-8”> creator
<rdf:RDF
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” “Ora Lassila”
xmlns:s=“http://description.org/schema”>
<rdf:Description about =
"http://www.w3.org/TR/REC-rdf-syntax/”> Υποκείμενο
<s:creator>Ora Lassila</s:creator>
</rdf:Description>
</rdf:RDF>
Αντικείμενο 17
Κατηγόρημα
Παράδειγμα “W3C”
dc:Publisher
http://www.w3.org/TR/REC"rdf"syntax/
dc:Creator
dc:Date
“Ora Lassila”
“1999"02"22”
<rdf:RDF
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:dc=“http://purl.org/dc/elements/1.1/”>
<rdf:Description about = "http://www.w3.org/TR/REC-rdf-syntax/”>
<dc:publisher>W3C</dc:publisher>
<dc:creator>Ora Lassila</dc:creator>
<dc:date>1999-02-22</dc:date>
</rdf:Description>
</rdf:RDF>
18
Βασική συντετμημένη σύνταξη
1η σύντμηση: αφορά ιδιότητες οι οποίες δεν
επαναλαμβάνονται εντός ενός στοιχείου Description
μπορούν να γραφούν σαν γνωρίσματα της XML
επισυναπτόμενα στο στοιχείο Description
<rdf:RDF xmlns:rdf=“...” xmlns:dc=“...”>
<rdf:Description about = "http://www.w3.org/TR/REC-rdf-syntax/”>
<dc:publisher>W3C</dc:publisher>
<dc:creator>Ora Lassila</dc:creator>
<dc:date>1999-02-22</dc:date>
</rdf:Description>
</rdf:RDF>
http://www.w3.org/TR/REC"rdf"syntax/
Creator
Παράδειγμα με
http://www.w3.org/staffId/85740
αναφορές
Email Name
Εναλλακτικά Creator
με rdf:ID 85740
Email Name
Συντετμημένη σύνταξη(συνέχεια)
2η σύντμηση: αφορά εμφωλευμένα στοιχεία Description
<rdf:RDF xmlns:rdf=“...” xmlns:s=“...”>
<rdf:Description about=“http://www.w3.org/TR/REC-rdf-syntax/”>
<s:Creator>
<rdf:Description about=“http://www.w3.org/staffId/85740”/>
<s:Name>Ora Lassila</s:name>
<s:Email>ora.lassila@nokia.com</s:Email>
</rdf:Description>
</s:Creator>
</rdf:Description>
</rdf:RDF>
σύνταξη dc:Creator
rdf:_1 rdf:_2
Courses/6.001
rdf:Bag
rdf:Type
students
RDF XML rdf:_1
Students/John
σύνταξη rdf:_2
Students/Mary
rdf:type rdf:type
Ένας πόρος μπορεί
JSPapersbyDate JSPapersbySubj
να είναι τιμή για
περισσότερες από rdf:_1 rdf:_2
rdf:_3 rdf:_1
μια ιδιότητες (να http://www.s1.com/Aug96.doc
δείχνεται από rdf:_2
περισσότερα του http://www.s2.net/Sept97.ps rdf:_3
ενός βέλη). http://www.s3.com/Jan97.pdf
<rdf:RDF xmlns=“...”>
<Seq ID=“JSpapersByDate”>
<li resource=“http://www.s1.com/Aug96.doc”/>
<li resource=“http://www.s3.net/Jan97.pdf”/>
<li resource=“http://www.s2.com/Sept97.ps”/>
</Seq>
<Seq ID=“JSpapersBySubj”>
<li resource=“http://www.s2.com/Sept97.ps”/>
<li resource=“http://www.a1.com/Aug96.doc”/>
<li resource=“http://www.s3.net/Jan97.pdf”/>
</Seq>
</rdf:RDF> 25
26
Δηλώσεις υψηλότερης τάξης
Είναι δυνατόν να διατυπώσουμε δηλώσεις RDF οι
οποίες αφορούν άλλες δηλώσεις RDF. Οι δηλώσεις
αυτές ονομάζονται δηλώσεις υψηλότερης τάξης (Higher-
order statements)
παράδειγμα: “Ralph Swick says that Ora Lassila is the creator of
the resource www.w3.org/TR/REC-rdf-syntax/”
Οι δηλώσεις υψηλότερης τάξης:
μας επιτρέπουν να εκφράσουμε πεποιθήσεις (beliefs) (και
άλλες «modalities»)
σημαντικές για trust models, digital signatures, κ.λ.π.
επίσης: μεταδεδομένα που αφορούν άλλα μεταδεδομένα
αναπαριστώνται μοντελοποιώντας RDF στην ίδια την RDF.
27
Υποστασιοποίηση
Για να διατυπώσουμε δηλώσεις σχετικά με άλλες δηλώσεις πρέπει να χτίσουμε
ένα μοντέλο της αρχικής δήλωσης εκφράζοντας τo σαν πόρο στον οποίο στη
συνέχεια μπορούμε να επισυνάψουμε ιδιότητες. Η διαδικασία αυτή
ονομάζεται υποστασιοποίηση (reification).
Η RDF παρέχει ένα ενσωματωμένο λεξιλόγιο ιδιοτήτων για αυτό:
rdf:subject, rdf:predicate, rdf:object and rdf:type
dc:Creator
http://www.w3.org/TR/REC"rdf"syntax “Ora Lassila”
a:attributedTo
“Ralph Swick”
Το περιεχόμενο του πλαισίου με τη στικτή γραμμή αντιστοιχεί στις παρακάτω
δηλώσεις:
<rdf:RDF xmlns:rdf=“...” xmlns:dc=“...”>
<rdf:Statement about = “StatementAboutREC-rdf-syntax”>
<rdf:subject resource=“http://www.w3.org/TR/REC-rdf-syntax”/>
<rdf:predicate resource=“dc:Creator”/>
<rdf:object>Ora Lassila</rdf:object>
</rdf:Statement> 28
</rdf:RDF>
Υποστασιοποίηση (συνέχεια)
Ένας νέος πόρος με τις παραπάνω τέσσερις
ιδιότητες αναπαριστά την αρχική δήλωση και
μπορεί να χρησιμοποιηθεί σαν αντικείμενο
άλλης ιδιότητας.
Ο πόρος με τις τέσσερις αυτές ιδιότητες δεν
αντικαθιστά την αρχική δήλωση αλλά είναι το
μοντέλο της δήλωσης αυτής, το οποίο
ονομάζεται υποστασιοποιημένη δήλωση
(reified statement).
29
Παράδειγμα
“Ralph Swick says that Ora Lassila is the creator of the
resource www.w3.org/TR/REC-rdf-syntax/”
http://www.w3.org/TR/REC"rdf"syntax/
rdf:subject
a:atributedTo rdf:Type
“Ralph Swick” rdf:statement
rdf:object rdf:predicate
claims Author-of
NYT pers05 ISBN...
<rdf:Description rdf:about=“NYT”>
<claims>
<rdf:Description rdf:about=“pers05”>
<authorOf>ISBN...</authorOf>
</rdf:Description>
</claims>
</rdf:Description>
31
Ενναλακτικά
Κάθε δήλωση μπορεί να είναι ένα αντικείμενο
οι γράφοι μπορεί να είναι εμφωλευμένοι
claims Author-of
NYT pers05 ISBN...
<rdf:Description rdf:about=“NYT”>
<claims resource= “#StatementAboutpers05”/>
</rdf:Description>
<rdf:Statement rdf:ID= “StatementAboutpers05”>
<rdf:subject resource=“pers05”/>
<rdf:predicate>Author-of</rdf:predicate>
<rdf:object>ISBN…</rdf:object>
</rdf:Statement>
32
Το λεξιλόγιο της RDF
Η RDF διαθέτει όρους για να περιγράφουμε λίστες
(lists), σύνολα (bags), ακολουθίες (sequences), κ.λ.π.
Η RDF επιτρέπει επίσης να περιγράφουμε τριάδες
μέσω της υποστασιοποίησης.
Επιτρέπει δηλώσεις που αφορούν άλλες δηλώσεις
john believes _:s.
_:s rdf:type rdf:Statement.
_:s rdf:subject “manolis”.
_:s rdf:predicate teaches.
_:s rdf:object “Knowledge Management” .
33
Μανόλης Γεργατσούλης
Χρήστος Παπαθεοδώρου
Ο Παγκόσμιος Ιστός
Ο παγκόσμιος ιστός είναι μια μεγάλη και επιτυχημένη
προσπάθεια αν αναλογιστεί κανείς
την ποσότητα της διαθέσιμης πληροφορίας, και
το ρυθμό αύξησης των ανθρώπων που τον χρησιμοποιούν.
Έχει αρχίσει να διαπερνά τις περισσότερες πλευρές της
καθημερινής μας ζωής αλλά και της ζωής των επιχειρήσεων
και οργανισμών.
Η επιτυχία του βασίζεται στην απλότητα του.
Η απλότητα του HTTP και της HTML που στοχεύουν στη
μεταφορά και προβολή υπερκειμένων, επέτρεψε στους
κατασκευαστές λογισμικού, στους φορείς παροχής
πληροφοριών και τους τελικούς χρήστες, την εύκολη
προσπέλαση στο νέο μέσο και συνέβαλε στο να
αναπτύξουν σε πολύ μικρό χρονικό διάστημα μια
σημαντική κρίσιμη μάζα.
2
3
Παγκόσμιος Ιστός: Πλούσια Πηγή Πληροφοριών για
Διαχείριση και Ερμηνεία από τον Άνθρωπο -
Υπερπληροφόρηση
Χρήστης
Χρήστης
5
Ο Μελλοντικός Παγκόσμιος Ιστός: Πλούσια Πηγή
Πληροφοριών για Διαχείριση και Ερμηνεία από
τον Η/Υ
Χρήστης
Πράκτορας
Πράκτορας
7
Η υλοποίηση του Σημασιολογικού Ιστού
Η υλοποίηση του Σημασιολογικού Παγκόσμιου Ιστού είναι ένα
εξαιρετικά φιλόδοξο εγχείρημα.
Ακόμη και η ‘μερική’ υλοποίηση του θα είναι σημαντικό επίτευγμα.
Απαιτείται η συμβολή πολλών επιστημόνων από διαφορετικά
επιστημονικά πεδία, όπως:
Τεχνολογίες βάσεων δεδομένων
Ευφυείς διαμεσολαβητές (agents)
Ψηφιακές βιβλιοθήκες
Μεταδεδομένα
Αναπαράσταση γνώσης και εξαγωγή συμπερασμάτων
Φυσικές γλώσσες
Οντολογίες
Πολυμέσα
Τεχνικές αναζήτησης και ερωταπαντήσεων
Οπτικοποίηση και μοντελοποίηση
....
9
Από τα μεταδεδομένα στη γνώση
Ανάγκη: οργάνωση και ανάκτηση της πληροφορίας με βάση
τη σημασία της, τις έννοιες και όχι τις λέξεις
Συμβατικές βιβλιοθήκες: Ταξινομικά συστήματα, θησαυροί
Ψηφιακή Τεχνολογία: Οντολογίες
Ορίζουν τις έννοιες που υπάρχουν στα μεταδεδομένα και τις μεταξύ
τους σχέσεις ΠΑΡΑΓΩΓΗ ΓΝΩΣΗΣ!!
Περιγράφουν ένα πεδίο γνώσης και διατυπώνουν μια κοινά
αποδεκτή ορολογία ΠΑΡΑΓΩΓΗ ΓΝΩΣΗΣ!!
Αναπαριστούν αυτή τη γνώση στον υπολογιστή
Επιτρέπουν τη σύνδεση του περιεχομένου (το οποίο είναι
μηχαναγνώσιμο και επεξεργάζεται μηχανικά) με τις έννοιες
Επιτρέπουν την ανάπτυξη μηχανισμών εξαγωγής συμπερασμάτων
10
11
Οντολογία (Ontology)
Μακρά ιστορία που προέρχεται από την
Φιλοσοφία - Αριστοτέλης
“Η μεταφυσική μελέτη της φύσης της ζωής και της
ύπαρξης”
Η έννοια της οντολογίας έχει υιοθετηθεί από την
Τεχνητή Νοημοσύνη και σημαίνει
“μια διαμοιρασμένη και κοινή κατανόηση κάποιου
τομέα, η οποία μπορεί να ανταλλαγεί μεταξύ
ανθρώπων και συστημάτων εφαρμογών” Gruber
12
Το πρόβλημα
Άνθρωποι, οργανισμοί και προγράμματα πρέπει να
επικοινωνούν μεταξύ τους.
Οι διαφορετικές ανάγκες και το διαφορετικό υπόβαθρο
οδηγούν σε αποκλίνουσες οπτικές γωνίες και παραδοχές για
πράγματα που στην ουσία είναι ίδια μεταξύ τους.
Η έλλειψη κοινής αντίληψης οδηγεί σε:
προβλήματα στην επικοινωνία μεταξύ ανθρώπων και οργανισμών.
δυσκολίες στον προσδιορισμό των απαιτήσεων και κατά συνέπεια στην
ανάπτυξη των προδιαγραφών των συστημάτων.
Οι ανομοιόμορφες μέθοδοι μοντελοποίησης, οι γλώσσες και
τα εργαλεία λογισμικού περιορίζουν σοβαρά:
τη δια-λειτουργικότητα
την επαναχρησιμοποίηση και το διαμοιρασμό εφαρμογών.
Τελικά όλα τα παραπάνω οδηγούν στο να
ξαναανακαλύπτουμε τον τροχό.
13
Η λύση
Η εξάλειψη ή η μείωση της σύγχυσης σχετικά με τις
έννοιες και τους όρους και τελικά η απόκτηση κοινής
αντίληψης.
Αυτή η κοινή αντίληψη μπορεί να αποτελέσει το
ενοποιητικό πλαίσιο ανάμεσα στις διαφορετικές
οπτικές γωνίες και να συμβάλει στην βελτίωση της
επικοινωνίας, και της δια-λειτουργικότητας. Μπορεί
να διευκολύνει την ανάπτυξη προδιαγραφών και τη
βελτίωση της αξιοπιστίας συστημάτων και να
παρέχει δυνατότητες επαναχρησιμοποίησης τους.
14
Τι είναι η Οντολογία;
Μια οντολογία είναι μια τυπική (formal),
κατηγορηματική (explicit) προδιαγραφή μιας
διαμοιρασμένης (shared) εννοιολογικής
αναπαράστασης (conceptualization) - Gruber
Ο όρος ‘εννοιολογική αναπαράσταση’ (conceptualization)
αναφέρεται σε ένα αφηρημένο μοντέλο φαινομένων του κόσμου
στο οποίο έχουν προσδιοριστεί οι έννοιες που σχετίζονται με τα
φαινόμενα αυτά.
Ο όρος ‘κατηγορηματική’ (explicit) σημαίνει ότι το είδος των
εννοιών που χρησιμοποιούνται, και οι περιορισμοί που αφορούν
την χρήση αυτών των εννοιών είναι προσδιορισμένα με σαφήνεια.
O όρος ‘αυστηρή’ (formal) αναφέρεται στο ότι η οντολογία πρέπει
να είναι μηχανικά αναγνώσιμη.
Ο όρος ‘διαμοιρασμένη’ (shared) αναφέρεται στο ότι η οντολογία
πρέπει να αποτυπώνει γνώση κοινής αποδοχής στα πλαίσια μιας
κοινότητας.
15
Η μορφή μιας οντολογίας
Μια οντολογία μπορεί να πάρει διάφορες μορφές
αλλά οπωσδήποτε θα περιλαμβάνει ένα λεξιλόγιο
όρων και κάποιας μορφής προδιαγραφές για τη
σημασία τους.
Σχετικά με το βαθμό της τυπικότητας της
αναπαράστασης μιας οντολογίας αυτή μπορεί να
είναι:
Άτυπη (informal), εκφρασμένη σε μια φυσική γλώσσα.
Ημι-άτυπη (semi-informal): για παράδειγμα διατυπωμένη σε ένα
περιορισμένο και δομημένο υποσύνολο κάποιας φυσικής
γλώσσας.
Ημι-τυπική (semi-formal): διατυπωμένη σε μια τεχνητή και
αυστηρά ορισμένη γλώσσα.
Αυστηρά τυπική (rigorously formal): ορισμοί όρων με αυστηρή
σημασιολογία, θεωρήματα και αποδείξεις ιδιοτήτων όπως η η
ορθότητα (soundness) και η πληρότητα (completeness).
16
18
19
Κατηγορίες Οντολογιών
Μερικές χαρακτηριστικές κατηγορίες οντολογιών είναι οι
ακόλουθες:
Οντολογίες πεδίου ορισμού (domain ontologies): αναπαριστούν γνώση
γύρω από ένα συγκεκριμένο πεδίο (π.χ. ιατρική, ηλεκτρονικά κ.λ.π.).
Οντολογίες μεταδεδομένων (metadata ontologies): παρέχουν ένα λεξιλόγιο
για την περιγραφή του περιεχομένου ηλεκτρονικά διαθέσιμης
πληροφορίας.
Γενικές ή κοινές οντολογίες (generic or common sense ontologies):
στοχεύουν στο να αποτυπώσουν γενική γνώση γύρω από τον κόσμο,
παρέχοντας βασικές έννοιες όπως ο χρόνος, ο χώρος, τα συμβάντα, κ.λ.π.
Οντολογίες αναπαράστασης (representational ontologies): παρέχουν
οντότητες αναπαράστασης χωρίς να προσδιορίζουν τι συγκεκριμένο
αναπαριστούν
π.χ. Frame Ontology (Gruber 1993): ορίζει έννοιες όπως frames, slots,
slot constraints κ.λ.π.
Οντολογίες μεθοδολογίας ή εργασιών (method or task ontologies):
παρέχουν όρους που αναφέρονται σε συγκεκριμένες εργασίες (π.χ.
διάγνωση κ.λ.π.)
20
21
Παράδειγμα: Ο όρος ‘procedure’ που χρησιμοποιείται από
ένα εργαλείο μεταφράζεται στον όρο ‘method’
Δια- που χρησιμοποιείται από το άλλο με τη
βοήθεια της οντολογίας, η οποία με τη σειρά
λειτουργικότητα της χρησιμοποιεί τον όρο ‘process’ για να
εκφράσει την ίδια έννοια.
give me the procedure for…
give me the
procedure = ???
here is the process for…
procedure for…
??? = process
give me the
procedure =
METHOD
process for…
METHOD =
here is
process here is the
the process for…
METHOD for…
25
Κατασκευή της οντολογίας
Σύλληψη
Προσδιορισμός των βασικών εννοιών και των μεταξύ τους σχέσεων.
Παραγωγή σαφών προδιαγραφών των εννοιών και των μεταξύ τους
σχέσεων σε μορφή κειμένου.
Συμφωνία για τους όρους με τους οποίους θα αναφερόμαστε στις έννοιες
και σχέσεις.
Κωδικοποίηση: ρητή αναπαράσταση της σύλληψης του προηγούμενου
σταδίου σε μια τυπική γλώσσα.
Ενοποίηση υπαρχουσών οντολογιών:
Θα πρέπει (και πως) να χρησιμοποιηθούν υπάρχουσες οντολογίες (ή
τμήματα αυτών); Γενικά δύσκολο πρόβλημα.
Αξιολόγηση: «έκφραση τεχνικών κρίσεων σχετικά με τις οντολογίες, το
σχετιζόμενο με αυτές περιβάλλον λογισμικού, και την τεκμηρίωση σε
σχέση με ένα πλαίσιο αναφοράς…» (Gomez-Perez, 1995).
Τεκμηρίωση: όλες οι σημαντικές παραδοχές τόσο αναφορικά με τις
βασικές έννοιες και με τα βασικά δομικά στοιχεία που χρησιμοποιήθηκαν
για την έκφραση αυτών των εννοιών, πρέπει να τεκμηριωθούν.
26
27
RDF Schema
Μανόλης Γεργατσούλης
4
Το λεξιλόγιο όρων της RDFS
Η RDFS εισάγει το παρακάτω λεξιλόγιο όρων στους οποίους
επισυνάπτει σημασία με βάση το μοντέλο δεδομένων της RDF
Όροι για κλάσεις Όροι για συλλογές
rdfs:Class
rdfs:member
rdfs:subClassOf
rdfs:Container
Όροι για ιδιότητες rdfs:ContainerMembershipProp
rdfs:domain erty
rdfs:range Ειδικές ιδιότητες
rdfs:subPropertyOf rdfs:comment
Ειδικές κλάσεις rdfs:seeAlso
rdfs:Resource rdfs:isDefinedBy
rdfs:Literal rdfs:label
rdfs:Datatype
5
Κλάσεις (συνέχεια)
Παράδειγμα δήλωσης κλάσης:
rdfs:Class
φοιτητής
Μαρία
Η συλλογή των πόρων οι οποίοι είναι κλάσεις της
RDF Schema είναι επίσης κλάση και ονομάζεται
rdfs:Class.
Ένας πόρος μπορεί να είναι στιγμιότυπο
περισσοτέρων της μιας κλάσεων.
8
Κλάσεις (συνέχεια)
Η ιδιότητα rdfs:subClassOf μπορεί να χρησιμοποιηθεί για να
δηλώσει ότι μια κλάση είναι υποκλάση μιας άλλης κλάσης.
Αν μια κλάση C είναι υποκλάση μιας κλάσης C', τότε όλα τα
στιγμιότυπα της C είναι επίσης και στιγμιότυπα της C'.
Ο όρος υπερκλάση (super-class) χρησιμοποιείται σαν ο
ανάστροφος του όρου υποκλάση. Αν μια κλάση C’ είναι
υπερκλάση μιας κλάσης C, τότε όλα τα στιγμιότυπα της C είναι
επίσης και στιγμιότυπα της C'.
Όλα τα αντικείμενα τα οποία περιγράφονται με RDF
ονομάζονται πόροι, και είναι στιγμιότυπα της κλάσης
rdfs:Resource. Αυτή η κλάση περιλαμβάνει τα πάντα. Όλες οι
άλλες κλάσεις είναι υποκλάσεις της κλάσης αυτής.
Η rdfs:Resource είναι ένα στιγμιότυπο της rdfs:Class
Κλάσεις (συνέχεια)
Η rdfs:Class είναι η κλάση των πόρων που είναι κλάσεις της
RDF.
Η rdfs:Class είναι στιγμιότυπο της rdfs:Class.
Η rdfs:Literal είναι η κλάση που περιλαμβάνει όλες τις τιμές με
χαρακτήρες (string).
Η rdfs:Literal είναι ένα στιγμιότυπο της rdfs:Class. Η rdfs:Literal είναι
υποκλάση της rdfs:Resource.
Η rdf:Property είναι η κλάση των ιδιοτήτων της RDF.
Η rdf:Property είναι στιγμιότυπο της rdfs:Class.
H rdfs:Datatype είναι η κλάση όλων των τύπων δεδομένων.
Η rdfs:Datatype είναι ταυτόχρονα και στιγμιότυπο και υποκλάση της
rdfs:Class.
Κάθε στιγμιότυπο της rdfs:Datatype είναι υποκλάση της rdfs:Literal.
10
Παράδειγμα ιεραρχίας κλάσεων
11
Παράδειγμα (συνέχεια)
MotorVehicle
Truck
PassegerVehicle
Van
MiniVan
12
Ιδιότητες στην RDFS
H Property είναι μια ειδική κλάση (rdf:Property)
επομένως οι ιδιότητες είναι επίσης πόροι
Οι ιδιότητες περιορίζονται από το πεδίο ορισμού
(domain) και το πεδίο τιμών (range) τους
δηλ., από το τι βρίσκεται “αριστερά” ή “δεξιά” τους
Π.χ., η parentOf είναι μια ιδιότητα με πεδίο ορισμού το
person και πεδίο τιμών το person.
Μια ιδιότητα μπορεί να είναι υπό-ιδιότητα (sub-
property) μιας άλλης ιδιότητας
Π.χ., η fatherOf είναι subProperty της ParentOf
13
Ιδιότητες (συνέχεια)
Η ιδιότητα rdfs:subPropertyOf μπορεί να
χρησιμοποιηθεί για να δηλώσει ότι μια ιδιότητα είναι
υπο-ιδιότητα (sub-property) μιας άλλης.
Αν μια ιδιότητα P είναι υπο-ιδιότητα μιας ιδιότητας P', τότε
όλα τα ζεύγη πόρων τα οποία συσχετίζονται με την P
συσχετίζονται επίσης με την P'.
Π.χ. Αν ο Νίκος είναι πατέρας (fatherOf) του Πέτρου, τότε ο Νίκος
είναι γονιός (parentOf) του Πέτρου.
Ο όρος υπερ-ιδιότητα (super-property) χρησιμοποιείται
συχνά σαν ο αντίστροφος του όρου υπο-ιδιότητα.
Αν μια ιδιότητα P’ είναι υπερ-ιδιότητα μιας ιδιότητας P,
τότε όλα τα ζεύγη πόρων τα οποία συσχετίζονται με την P
συσχετίζονται επίσης με την P'.
Δεν έχει οριστεί μια ιδιότητα η οποία είναι υπερ-ιδιότητα
όλων των ιδιοτήτων.
14
Ιδιότητες (συνέχεια)
Οι ιδιότητες είναι επίσης πόροι…
Έτσι, ιδιότητες ιδιοτήτων μπορούν να εκφραστούν σαν
... ιδιότητες της RDF
Π.χ.: το πεδίο τιμών της ιδιότητας parentOf είναι το Person
Η ιδιότητα rdfs:range είναι στιγμιότυπο της
rdf:Property και χρησιμοποιείται για να δηλώσει ότι οι
τιμές μιας ιδιότητας είναι στιγμιότυπα μιας ή
περισσοτέρων κλάσεων.
Η RDF δήλωση P rdfs:range C
έχει υποκείμενο=P, κατηγόρημα=rdf:range, και αντικείμενο=C
Σημαίνει: το P είναι στιγμιότυπο της κλάσης rdf:Property, η C
είναι στιγμιότυπο της rdfs:class, και οι πόροι που
αντιστοιχούν στα αντικείμενα των τριάδων με κατηγόρημα P,
πρέπει να είναι στιγμιότυπα της κλάσης C.
15
Ιδιότητες (συνέχεια)
Η ιδιότητα rdfs:domain είναι στιγμιότυπο της
rdf:Property και χρησιμοποιείται για να δηλώσει
ότι κάθε πόρος που έχει μια συγκεκριμένη
ιδιότητα είναι στιγμιότυπο μιας η περισσοτέρων
κλάσεων.
Η δήλωση: P rdfs:domain C
υποδηλώνει ότι το P είναι ένα στιγμιότυπο της
κλάσης rdf:Property, η C είναι ένα στιγμιότυπο της
rdfs:class και οι πόροι που αντιστοιχούν στα
υποκείμενα των τριάδων των οποίων το κατηγόρημα
είναι το P, είναι στιγμιότυπα της κλάσης C.
16
Ιδιότητες (συνέχεια)
Η ιδιότητα rdf:type είναι στιγμιότυπο της rdf:Property και
χρησιμοποιείται για να δηλώσει ότι ένας πόρος είναι
στιγμιότυπο μιας κλάσης.
Η δήλωση: R rdfs:type C
υποδηλώνει ότι το C είναι ένα στιγμιότυπο της rdfs:class και το R είναι
στιγμιότυπο της C.
Η ιδιότητα rdfs:subClassOf είναι στιγμιότυπο της rdf:Property
και χρησιμοποιείται για να δηλώσει ότι τα στιγμιότυπα μιας
κλάσης είναι και στιγμιότυπα της άλλης.
Η ιδιότητα rdfs:subClassOf είναι μεταβατική.
Η ιδιότητα rdfs:subPropertyOf είναι στιγμιότυπο της
rdf:Property και χρησιμοποιείται για να δηλώσει ότι όλοι οι
πόροι που σχετίζονται με μια ιδιότητα σχετίζονται επίσης και
με μια άλλη.
Η δήλωση: P1 rdfs:subPropertyOf P2
υποδηλώνει ότι τα P1 και P2 είναι στιγμιότυπα της rdf:Property, καθώς
και ότι το P1 είναι υπο-ιδιότητα της P2.
Η ιδιότητα rdfs:subPropertyOf είναι μεταβατική.
17
Ιδιότητες (συνέχεια)
Η ιδιότητα rdfs:label παρέχει μια εύκολα
αναγνώσιμη από τον άνθρωπο παραλλαγή του
ονόματος ενός πόρου.
Η δήλωση: R rdfs:label L
υποδηλώνει ότι το L μια εύκολα αναγνώσιμη από
τον άνθρωπο ετικέτα για τον πόρο R.
Η ιδιότητα rdfs:comment χρησιμοποιείται για
να παρέχει μια αναγνώσιμη από τον άνθρωπο
περιγραφή ενός πόρου.
Ένα σχόλιο σε μορφή κειμένου διευκολύνει στο
ξεκαθάρισμα της σημασίας των κλάσεων και των
ιδιοτήτων της RDF.
18
RDF classes
Class name comment
rdfs:Resource The class resource, everything.
The class of literal values, e.g. textual strings
rdfs:Literal
and integers.
rdf:XMLLiteral The class of XML literals values.
rdfs:Class The class of classes.
rdf:Property The class of RDF properties.
rdfs:Datatype The class of RDF datatypes.
rdf:Statement The class of RDF statements.
rdf:Bag The class of unordered containers.
rdf:Seq The class of ordered containers.
rdf:Alt The class of containers of alternatives.
rdfs:Container The class of RDF containers.
The class of container membership
rdfs:ContainerMembershipProperty properties, rdf:_1, rdf:_2, ..., all of which
are sub-properties of 'member'.
rdf:List The class of RDF Lists.
19
RDF properties
Property name comment domain range
The subject is an instance
rdf:type rdfs:Resource rdfs:Class
of a class.
The subject is a subclass of
rdfs:subClassOf rdfs:Class rdfs:Class
a class.
The subject is a
rdfs:subPropertyOf rdf:Property rdf:Property
subproperty of a property.
A domain of the subject
rdfs:domain rdf:Property rdfs:Class
property.
A range of the subject
rdfs:range rdf:Property rdfs:Class
property.
A human-readable name
rdfs:label rdfs:Resource rdfs:Literal
for the subject.
A description of the
rdfs:comment rdfs:Resource rdfs:Literal
subject resource.
A member of the subject
rdfs:member rdfs:Resource rdfs:Resource
resource.
20
RDF properties (συνέχεια)
Property name comment domain range
The first item in the subject
rdf:first rdf:List rdfs:Resource
RDF list.
The rest of the subject RDF list
rdf:rest rdf:List rdf:List
after the first item.
Further information about the
rdfs:seeAlso rdfs:Resource rdfs:Resource
subject resource.
The definition of the subject
rdfs:isDefinedBy rdfs:Resource rdfs:Resource
resource.
Idiomatic property used for
rdf:value rdfs:Resource rdfs:Resource
structured values
The subject of the subject RDF
rdf:subject rdf:Statement rdfs:Resource
statement.
The predicate of the subject
rdf:predicate rdf:Statement rdf:Property
RDF statement.
The object of the subject RDF
rdf:object rdf:Statement rdfs:Resource
statement.
21
Παράδειγμα
Person
subClassOf subClassOf
domain range
Student hasSuperVisor Researcher
type type
Frank hasSuperVisor Jeen
22
Σύνταξη της RDF Schema σε XML
<rdf:Description ID="MotorVehicle">
<rdf:type resource="http://www.w3.org/...#Class"/>
<rdfs:subClassOf rdf:resource="http://www.w3.org/...#Resource"/>
</rdf:Description>
<rdf:Description ID="Truck">
<rdf:type resource="http://www.w3.org/...#Class"/>
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdf:Description>
<rdf:Description ID="registeredTo">
<rdf:type resource="http://www.w3.org/...#Property"/>
<rdfs:domain rdf:resource="#MotorVehicle"/>
<rdfs:range rdf:resource="#Person"/>
</rdf:Description>
<rdf:Description ID=”ownedBy">
<rdf:type resource="http://www.w3.org/...#Property"/>
<rdfs:subPropertyOf rdf:resource="#registeredTo"/>
</rdf:Description>
23
<rdfs:Class rdf:ID="Person">
<rdfs:comment>Person Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Student">
<rdfs:comment>Student Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="#Person"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Teacher">
<rdfs:comment>Teacher Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="#Person"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Course">
<rdfs:comment>Course Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource"/>
</rdfs:Class>
24
RDF Schema (Παράδειγμα):Συνέχεια
<rdf:Property rdf:ID="teacherOf">
<rdfs:comment>Teacher of a course</rdfs:comment>
<rdfs:domain rdf:resource="#Course"/>
<rdfs:range rdf:resource="#Teacher"/>
</rdf:Property>
<rdf:Property rdf:ID="studentsOf">
<rdfs:comment>List of Students of a course in alphabetical order</rdfs:comment>
<rdfs:domain rdf:resource="#Course"/>
<rdfs:range rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Seq"/>
</rdf:Property>
<rdf:Property rdf:ID=“nameOf">
<rdfs:comment>Name of a Person or Course</rdfs:comment>
<rdfs:domain rdf:resource="#Person"/>
<rdfs:domain rdf:resource="#Course"/>
<rdfs:range rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Literal"/>
</rdf:Property>
</rdf:RDF>
25
range(parent,person) parent(eve,cain)
subproperty(mother,parent) person(eve)
range(mother,woman) person(cain)
στιγμιότυπο
mother(eve,cain) woman(eve)
Αυτό είναι τμήμα του μοντέλου δεδομένων και όχι
των προγραμμάτων προσπέλασης και επεξεργασίας.
26
Μειονεκτήματα της RDFS
RDFS είναι αρκετά αδύναμη να περιγράψει πόρους σε
ικανοποιητική λεπτομέρεια, π.χ.:
Δεν υποστηρίζει τοπικούς περιορισμούς πεδίου ορισμού και
πεδίου τιμών
Δεν μπορούμε να πούμε ότι το πεδίο τιμών της hasChild είναι το person
όταν η ιδιότητα εφαρμόζεται σε ανθρώπους, ενώ είναι το elephant όταν
εφαρμόζεται σε ελέφαντες
Δεν υποστηρίζει περιορισμούς ύπαρξης και πλήθους
Δεν μπορεί να δηλώσει ότι όλα τα στιγμιότυπα της person έχουν
(ακριβώς) μια mother η οποία είναι επίσης person, καθώς και ότι τα μέλη
της κλάσης persons έχουν ακριβώς 2 parents
Δεν υποστηρίζει μεταβατικές, ανάστροφες και συμμετρικές
ιδιότητες
Δεν μπορεί να δηλώσει ότι η isPartOf είναι μεταβατική, ότι η hasPart
είναι η ανάστροφη της isPartOf η ότι η touches είναι συμμετρική
Η OWL είναι ένα επίπεδο πάνω στην RDFS για την
παροχή των χαρακτηριστικών αυτών.
27
OWL
Μανόλης Γεργατσούλης
Χρήστος Παπαθεοδώρου
W3C’s Web Ontology Language (OWL)
Η DAML+OIL εξελίχθηκε στην
OWL.
OWL
OWL δόθηκε ως W3C
recommendation στις 2/10/04
Στην OWL ορίζονται τρία επίπεδα
με μειούμενο βαθμό
πολυπλοκότητας και
εκφραστικότητας
Η OWL Full αποτελεί την πλήρη
γλώσσα
OWL DL (Description Logic) εισάγει
περιορισμούς
OWL Lite αποτελεί ένα αρχικό
επίπεδο της γλώσσας που στοχεύει
στο να είναι εύκολα κατανοητό και
υλοποιήσιμο
2
3
Υπογλώσσες της OWL
Η OWL παρέχει τρεις υπο-γλώσσες σχεδιασμένες για να χρησιμοποιούνται από
εξειδικευμένες κοινότητες χρηστών. Οι υπογλώσσες αυτές (κατά σειρά
αυξανόμενης εκφραστικότητας και πολυπλοκότητας) είναι:
OWL Lite προσφέρει ταξινομικές ιεραρχίες και απλούς περιορισμούς.
Απλούστερα τα εργαλεία για υποστήριξη της OWL Lite από ότι των εκφραστικότερων
υπογλωσσών.
OWL DL υποστηρίζει τη μέγιστη δυνατή εκφραστικότητα σε συνδυασμό με την
υπολογιστική πληρότητα (completeness) και αποφασισιμότητα (decidability)
(υπολογισμό όλων των δυνατών λύσεων σε πεπερασμένο χρόνο). Περιλαμβάνει όλα
τα δομικά στοιχεία της OWL, αλλά επιβάλλει συγκεκριμένους περιορισμούς στη
χρήση τους. (π.χ. Μια κλάση μπορεί να είναι υποκλάση άλλων κλάσεων, όμως δεν
μπορεί να είναι στιγμιότυπο άλλης κλάσης).
Η ονομασία της οφείλεται στην αντιστοιχία με τις description logics.
OWL Full παρέχει τη μέγιστη εκφραστικότητα και τη συντακτική ελευθερία της RDF
χωρίς όμως τις εγγυήσεις όσον αφορά τους υπολογισμούς.
Κάθε υπογλώσσα επεκτείνει την προηγούμενη της από εκφραστική και από
υπολογιστική άποψη. Τα παρακάτω ισχύουν, όχι όμως και τα αντίστροφα:
Κάθε έγκυρη OWL Lite οντολογία είναι και έγκυρη OWL DL οντολογία.
Κάθε έγκυρη OWL DL οντολογία είναι και έγκυρη OWL οντολογία.
Κάθε έγκυρο OWL Lite συμπέρασμα είναι έγκυρο OWL DL συμπέρασμα.
Κάθε έγκυρο OWL DL συμπέρασμα είναι έγκυρο OWL Full συμπέρασμα.
5
Λίστα δομικών στοιχείων της OWL Lite
RDF Schema Features: Property Type Restrictions:
Class allValuesFrom
rdf:Property
someValuesFrom
rdfs:subClassOf
rdfs:subPropertyOf Restricted Cardinality:
rdfs:domain minCardinality (only 0 or 1)
rdfs:range maxCardinality (only 0 or 1)
Individual cardinality (only 0 or 1)
(In)Equality:
equivalentClass Annotation Properties:
equivalentProperty rdfs:label
sameAs rdfs:comment
differentFrom
rdfs:seeAlso
allDifferent
rdfs:isDefinedBy
Property Characteristics:
inverseOf Class Intersection:
TransitiveProperty
SymmetricProperty intersectionOf
FunctionalProperty
InverseFunctionalProperty
6
7
Λίστα δομικών στοιχείων της OWL DL και της
OWL Full
Η λίστα των δομικών στοιχείων των γλωσσών OWL DL και OWL Full τα οποία
προστίθεται σε αυτά της OWL Lite δίνονται παρακάτω:
10
12
13
Περιορισμοί τύπου ιδιοτήτων της OWL Lite
allValuesFrom: Ο περιορισμός αυτός αναφέρεται σε μια ιδιότητα ως προς
συγκεκριμένη κλάση και δηλώνει ότι η ιδιότητα αναφορικά με τη συγκεκριμένη
κλάση έχει ένα τοπικό περιορισμό του πεδίου τιμών της. Έτσι αν ένα
στιγμιότυπο της κλάσης σχετίζεται μέσω της ιδιότητας με ένα άλλο
στιγμιότυπο, τότε μπορούμε να συμπεράνουμε ότι το δεύτερο στιγμιότυπο
ανήκει στη κλάση που υποδηλώνεται από την allValuesFrom.
Παράδειγμα: η κλάση Person μπορεί να έχει την ιδιότητα hasDaughter με τον
περιορισμό allValuesFrom την κλάση Woman. Επομένως αν το άτομο Louise της
κλάσης Person σχετίζεται μέσω της ιδιότητας hasDaughter με το άτομο Deborah,
τότε μπορεί να εξαχθεί σαν συμπέρασμα ότι η Deborah είναι στιγμιότυπο της
κλάσης Woman. Αυτός ο περιορισμός επιτρέπει στην ιδιότητα hasDaughter να
χρησιμοποιηθεί με άλλες κλάσεις, όπως η κλάση Cat, και να συνδεθεί με αυτήν
ένας κατάλληλος περιορισμός τιμών όταν η ιδιότητα χρησιμοποιείται με τη
συγκεκριμένη κλάση. Έτσι μια ιδιότητα μπορεί να χρησιμοποιηθεί με διαφορετικές
κλάσεις και με διαφορετικούς κάθε φορά περιορισμούς τύπου.
someValuesFrom: Ο περιορισμός αυτός δηλώνει ότι μια ιδιότητα αναφορικά με
μια συγκεκριμένη κλάση έχει ένα τοπικό περιορισμό κατά τον οποίο
τουλάχιστον μια από τις τιμές της είναι συγκεκριμένου τύπου.
Παράδειγμα: Η κλάση SemanticWebPaper μπορεί να έχει έναν περιορισμό
someValuesFrom πάνω στην ιδιότητα hasKeyword ο οποίος δηλώνει ότι κάποια
τιμή της ιδιότητας hasKeyword πρέπει να είναι στιγμιότυπο της κλάσης
SemanticWebTopic. Αυτό επιτρέπει να έχουμε πολλαπλές λέξεις κλειδιά και εφόσον
ένα τουλάχιστον από αυτά είναι στιγμιότυπο της SemanticWebTopic, τότε το paper
είναι συνεπές με τον περιορισμό someValuesFrom.
14
κωδικοποιεί τις ίδιες τριάδες RDF, και επομένως έχει την ίδια
σημασία.
16
<owl:Class> Κλάση με
στοιχεία:
<owl:oneOf rdf:parseType="Collection">
{Eurasia,
<owl:Thing rdf:about="#Eurasia"/>
Africa,
<owl:Thing rdf:about="#Africa"/>
NorthAmerica,
<owl:Thing rdf:about="#NorthAmerica"/> SouthAmerica,
<owl:Thing rdf:about="#SouthAmerica"/> Australia,
<owl:Thing rdf:about="#Australia"/> Antarctica}
<owl:Thing rdf:about="#Antarctica"/>
</owl:oneOf>
</owl:Class>
18
22
Αξιώματα κλάσεων
Οι περιγραφές των κλάσεων αποτελούν τα δομικά
στοιχεία για τον ορισμό κλάσεων μέσω αξιωμάτων
κλάσεων.
Παράδειγμα: Το παρακάνω αξίωμα δηλώνει ότι η αναφορά
URI #Human αποτελεί το όνομα μιας κλάσης της OWL:
<owl:Class rdf:ID="Human"/>
Τα αξιώματα κλάσεων συνήθως περιλαμβάνουν
επιπλέον συστατικά τα οποία προσδιορίζουν
αναγκαία και/ή ικανά χαρακτηριστικά των κλάσεων.
Δομικά στοιχεία της OWL για το συνδυασμό των
περιγραφών κλάσεων και τη δημιουργία αξιωμάτων
κλάσεων είναι τα rdfs:subClassOf, owl:equivalentClass
και owl:disjointWith
23
Αξιώματα κλάσεων (συνέχεια)
Παράδειγμα 1:
<owl:Class rdf:ID="Opera">
<rdfs:subClassOf rdf:resource="#MusicalWork" />
</owl:Class>
Στην OWL Lite το υποκείμενο μιας δήλωσης rdfs:subClassOf
πρέπει να είναι όνομα κλάσης ενώ το αντικείμενο μπορεί να
είναι είτε όνομα κλάσης είτε περιορισμός ιδιότητας.
Παράδειγμα 2:
<owl:Class rdf:about="MusicDrama">
<owl:equivalentClass>
<owl:Class>
<owl:unionOf rdf:parseType="Collection">
<owl:Class rdf:about="#Opera"/>
<owl:Class rdf:about="#Operetta"/>
<owl:Class rdf:about="#Musical"/>
</owl:unionOf>
</owl:Class>
</owl:equivalentClass>
</owl:Class>
24
Σύνοψη
25
OWL Axioms
26
Ιδιότητες
Δύο τύποι ιδιοτήτων στην OWL:
Ιδιότητες αντικειμένων (Object properties): συνδέουν
στιγμιότυπα με άλλα στιγμιότυπα.
Ιδιότητες τύπου δεδομένων (Datatype properties):
συνδέουν στιγμιότυπα με τύπους δεδομένων.
Μια ιδιότητα αντικειμένων ορίζεται σαν στιγμιότυπο της
ενσωματωμένης κλάσης της OWL owl:ObjectProperty. Μια
ιδιότητα τύπου δεδομένων ορίζεται σαν στιγμιότυπο της
ενσωματωμένης κλάσης της OWL owl:DatatypeProperty.
Ένα αξίωμα ιδιότητας (Property axiom) προσδιορίζει
χαρακτηριστικά μιας ιδιότητας.
Παράδειγμα (ιδιότητας αντικειμένων): Το παρακάτω
αξίωμα δηλώνει της ύπαρξη μιας ιδιότητας με τον
περιορισμό ότι η τιμές της είναι απλά στιγμιότυπα.
<owl:ObjectProperty rdf:ID="hasParent"/>
27
XML Schema Datatypes
Η OWL υποστηρίζει τους βασικούς τύπους δεδομένων
της XML Schema
π.χ. integer, real, string, …
Αυστηρή διάκριση μεταξύ “object” classes και
datatypes
Για φιλοσοφικούς λόγους: οι datatypes δομούνται από build-
in predicates. Δεν είναι κατάλληλη η δημιουργία τύπων
δεδομένων από γλώσσες οντολογιών
Για πρακτικούς λόγους: η γλώσσα οντολογιών παραμένει
απλή και «συμπαγής». Διαφυλάσσεται η σημασιολογική
ακεραιότητα της γλώσσας
28
Στιγμιότυπα
Ορίζονται μέσω αξιωμάτων τα οποία συχνά ονομάζονται
γεγονότα (facts). Ενδιαφέρον έχουν δύο κατηγορίες
αξιωμάτων:
Γεγονότα σχετικά με μέλη μιας κλάσης και τιμές ιδιοτήτων
Γεγονότα σχετικά με ισότητα στιγμιότυπων
Αναφέρεται σε ένα
Παράδειγμα σύνολο γεγονότων που
<Opera rdf:ID="Tosca"> αφορούν το Tosca που
<hasComposer rdf:resource="#Giacomo_Puccini"/> είναι ένα στιγμιότυπο της
<hasLibrettist rdf:resource="#Victorien_Sardou"/> κλάσης Opera.
<hasLibrettist rdf:resource="#Giuseppe_Giacosa"/>
<hasLibrettist rdf:resource="#Luigi_Illica"/>
<premiereDate rdf:datatype="&xsd;date">1900-01-14</premiereDate>
<premierePlace rdf:resource="#Roma"/>
<numberOfActs rdf:datatype="&xsd;positiveInteger">3</numberOfActs>
</Opera>
29
Θησαυροί και RDF
Χαρά Μπρίντεζη
Βιβλιοθήκη Ιδρύ ατος Ευγενίδου
Τι είναι Θησαυρός
Κατάλογος συσχετιζό ενων, κοινά αποδεκτών όρων, που χρησι οποιείται
στην ανάκτηση πληροφοριών και στη θε ατική ευρετηρίαση
Όροι επιλεγ ένοι από τη φυσική γλώσσα
Οι όροι εκφράζουν έννοιες (εννοιολογικό σχή α)
Ελεγχό ενο λεξιλόγιο
Ένας όρος πορεί να έχει πολλές ση ασίες (πολυση ία ή ο οιογραφία).
Χρήση προσδιοριστών π.χ. γλώσσα (όργανο σώ ατος)
Μία έννοια πορεί να εκφραστεί από δύο ή περισσότερους
συνώνυ ους όρους
Περιγραφέας ή προτι ώ ενος
ό ηση ε τέτοιο τρόπο ώστε να υποδηλώνονται ε σαφήνεια οι
προϋπάρχουσες σχέσεις εταξύ των εννοιών
2
Θησαυροί ως ση ασιολογικοί
(νοη ατικοί) χάρτες
ζώα
σκύλοι
Σχέσεις ιεραρχίας
κατοικίδια ζώα
Σχέση
συσχέτισης
σκύλοι
Πρότυπα για τη δη ιουργία
θησαυρών
Πρότυπο ΕΛΟΤ 1321:
«Τεκ ηρίωση ' Κατευθυντήριες οδηγίες
για τη συγκρότηση και ανάπτυξη
ονόγλωσσων θησαυρών» (1993)
Μετάφραση του ISO 2788 (1986)
ANSI/NISO Z39.19-2003 (R 1993, 1998)
BS 5723:1987 (for monolingual thesauri)
ISO 5964: Documentation-guidelines for the
establishment and development of multilingual
thesauri (1985)
BS 6723:1985 (for multilingual thesauri)
5
6
7
8
Παρουσίαση ηλεκτρονικών θησαυρών
10
12
14
15
16
Κλάσεις
CollectableProperty
Collection
Concept
ConceptScheme
OrderedCollection
Ιδιότητες
altLabel
broader
changeNote
definition
editorialNote Ση άνσεις ή
hasTopConcept ετικέτες
hiddenLabel
historyNote
isSubjectOf
narrower
prefLabel prefSymbol
related scopeNote……………………..
17
Alt
18
SKOS Core schema
Κάθε προτι ώ ενος όρος γίνεται “προτι ώ ενη ετικέτα” για
ια “έννοια” (concept oriented view)
Οι η προτι ώ ενοι όροι γίνονται εναλλακτικές ετικέτες
(alternative labels) για τις έννοιες
Ετικέτα πορεί να είναι σειρά χαρακτήρων, σύ βολο ή εικόνα
Οι σχέσεις BT, NT, RT είναι σχέσεις εταξύ εννοιών
Οι έννοιες πορεί να συνοδεύονται από υπο νη ατισ ούς όπως
-ιευκρινιστικές Ση ειώσεις και ορισ ούς
Μια έννοια συνεπάγεται από την προτι ώ ενη και τις
εναλλακτικές ετικέτες της, από τους υπο νη ατισ ούς και τους
όρους του περιβάλλοντός της
19
Ένας πόρος
Μια άλλη
ιδιότητα Ένα RDF Literal
20
Η κλάση skos:concept (1/2)
Επιτρέπει να συ περάνει κάποιος ότι ο πόρος είναι ένας
εννοιολογικός πόρος (conceptual resource). -ηλαδή, ο πόρος
είναι ο ίδιος ια έννοια
αντικεί ενο
κατηγόρη α
υποκεί ενο
21
22
Ιδιότητες σή ανσης
(Labelling properties)
23
<skos:Concept rdf:about =
"http://www.example.com/concepts#animals">
<skos:prefLabel>animals</skos:
prefLabel>
<skos:altLabel>creatures</skos:a
ltLabel>
<skos:altLabel>fauna</skos:altL
abel>
</skos:Concept>
</rdf:RDF>
24
prefLabel και altLabel
(όχι όνο για συνώνυ α)
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#wetness">
<skos:prefLabel>wetness</skos:prefLabel>
<skos:altLabel>dryness</skos:altLabel> Οιονεί συνώνυ α
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#shrubs">
<skos:prefLabel>shrubs</skos:prefLabel>
<skos:altLabel>bushes</skos:altLabel>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#rocks">
<skos:prefLabel>rocks</skos:prefLabel>
<skos:altLabel>basalt</skos:altLabel>
<skos:altLabel>granite</skos:altLabel> Παραπο πή προς το γένος
</skos:Concept>
</rdf:RDF> 25
26
Κρυ ένες ση άνσεις
(Hidden lexical labels)
Η πιο συχνή χρήση τους είναι για τα λάθη στην ορθογραφία
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept
rdf:about="http://www.example.com/concepts#abattoirs">
<skos:prefLabel>abattoirs</skos:prefLabel>
<skos:hiddenLabel>abatoirs</skos:hiddenLabel>
<skos:hiddenLabel>abbatoirs</skos:hiddenLabel>
<skos:hiddenLabel>abbattoirs</skos:hiddenLabel>
</skos:Concept>
</rdf:RDF>
27
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#love">
<skos:prefSymbol rdf:resource="http://www.example.com/symbols/love1.jpg"/>
<skos:altSymbol rdf:resource="http://www.example.com/symbols/love2.jpg"/>
</skos:Concept>
</rdf:RDF>
28
SKOS και Ση ειώσεις
(ιδιότητες τεκ ηρίωσης - documentation properties)
skos:publicNote
skos:definition
skos:scopeNote
skos:example
skos:historyNote
skos:privateNote
skos:editorialNote
skos:changeNote
Τρεις τρόποι χρήσης
Τεκ ηρίωση ως κεί ενο (Documentation as an RDF Literal)
Τεκ ηρίωση ως περιγραφή σχετιζό ενου πόρου (Documentation
as a Related Resource Description)
Τεκ ηρίωση ως αναφορά σε τεκ ήριο (Documentation as a
Document Reference)
29
Η τι ή της ιδιότητας (το αντικεί ενο της τριάδας) είναι κεί ενο
30
Τεκ ηρίωση ως κεί ενο
(Documentation as an RDF Literal) (2/2)
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.org/concepts#bananarepublic">
<skos:prefLabel>banana republic</skos:prefLabel>
<skos:definition>A small country, especially in South and Central
America, that is poor and often badly and immorally ruled. </skos:
definition>
</skos:Concept>
</rdf:RDF>
31
32
Τεκ ηρίωση ως αναφορά σε τεκ ήριο
(Documentation as a Document Reference)
Αναφορά σε τεκ ήριο έσω του URI του
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#zoology">
<skos:prefLabel>zoology</skos:prefLabel>
<skos:scopeNote rdf:resource="http://www.example.com/notes/zoology.txt"/>
</skos:Concept>
</rdf:RDF> 33
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<skos:Concept rdf:about="http://www.example.com/concepts#botany">
<skos:prefLabel>botany</skos:prefLabel>
<skos:scopeNote>
<foaf:Document rdf:about="http://www.example.com/notes/botany.txt">
<dc:creator>
<foaf:Person>
<foaf:name>John Smith</foaf:name>
<foaf:mbox rdf:resource="mailto:jsmith@example.org"/>
Metaproperties </foaf:Person>
</dc:creator>
<dc:language>
<dcterms:RFC1766>
<rdf:value>EN</rdf:value>
<rdfs:label>English</rdfs:label>
</dcterms:RFC1766>
</dc:language>
</foaf:Document>
</skos:scopeNote>
</skos:Concept>
</rdf:RDF> 34
Ιδιότητες για ση ασιολογικές σχέσεις
skos:semanticRelation
skos:broader
skos:narrower
skos:related
Η χρήση της ιδιότητας semantic relation απαιτεί το
υποκεί ενο και το αντικεί ενο της τριάδας να είναι
πόροι του τύπου skos:concept
Οι ιδιότητες skos:broader και skos:narrower είναι
αντίστροφες η ια της άλλης και εταβατικές
Η ιδιότητα skos:related είναι συ ετρική
35
Σχέσεις ιεραρχίας
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#mammals">
<skos:prefLabel>mammals</skos:prefLabel>
<skos:broader rdf:resource="http://www.example.com/concepts#animals"/>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#animals">
<skos:prefLabel>animals</skos:prefLabel>
<skos:narrower rdf:resource="http://www.example.com/concepts#mammals"/>
</skos:Concept>
</rdf:RDF>
36
Σχέσεις συσχέτισης
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#birds">
<skos:prefLabel>birds</skos:prefLabel>
<skos:related rdf:resource="http://www.example.com/concepts#ornithology"/>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#ornithology">
<skos:prefLabel>ornithology</skos:prefLabel>
<skos:related rdf:resource="http://www.example.com/concepts#birds"/>
</skos:Concept>
</rdf:RDF>
37
38
BT
UF
SN
RT
NT
39
40
παράγοντες
industries
agricultural industries
(people)
farm managers
dairy personnel
shepherds
Ετικέτα δεσ ού (products)
cereal products
dairy products
butter
cheese
cream
ice cream
milk
(milk by fat content)
Ετικέτα δεσ ού whole milk
low fat milk
skim milk
(milk by form)
dried milk
liquid milk
(milk by source animal)
buffalo milk
cow milk
goat milk
sheep milk
(milk by treatment type)
condensed milk
evaporated milk
homogenized milk
pasteurized milk
sterilized milk
41
42
Περιγραφή παρατάξεων (2/2)
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">
<skos:Collection>
<rdfs:label>milk by source animal</rdfs:label>
<skos:member rdf:resource="http://www.example.com/concepts#buffalomilk"/>
<skos:member rdf:resource="http://www.example.com/concepts#cowmilk"/>
<skos:member rdf:resource="http://www.example.com/concepts#goatmilk"/>
<skos:member rdf:resource="http://www.example.com/concepts#sheepmilk"/>
</skos:Collection>
<skos:Concept rdf:about="http://www.example.com/concepts#buffalomilk">
<skos:prefLabel>buffalo milk</skos:prefLabel>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#cowmilk">
<skos:prefLabel>cow milk</skos:prefLabel>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#goatmilk"> ………
………………….
</rdf:RDF> 43
chairs
. <chairs by form>
.. armchairs
.. easy chairs
.. <chairs by form: back form>
... heart-back chairs
... oval-back chairs
44
Ε περιεχό ενες ή ε φωλευ ένες συλλογές όρων
(nested collections) (2/2)
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-
schema#"> <skos:Concept rdf:about="http://www.example.com/concepts#chairs">
<skos:prefLabel>chairs</skos:prefLabel>
<skos:narrower>
<skos:Collection>
<rdfs:label>chairs by form</rdfs:label>
<skos:member rdf:resource="http://www.example.com/concepts#armchairs"/>
<skos:member rdf:resource="http://www.example.com/concepts#easychairs"/>
<skos:member>
<skos:Collection>
<rdfs:label>chairs by form: back form</rdfs:label>
<skos:member rdf:resource="http://www.example.com/concepts#heartbackchairs"/>
<skos:member rdf:resource="http://www.example.com/concepts#ovalbackchairs"/>
</skos:Collection>
</skos:member>
</skos:Collection>
</skos:narrower> </skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#armchairs">
<skos:prefLabel>armchairs</skos:prefLabel> </skos:Concept> …………………… 45
NT
46
Περιγραφή διατεταγ ένων παρατάξεων
(skos:OrderedCollection) (2/2)
<rdf:RDF xmlns:rdf=“…..
<skos:Concept
rdf:about="http://www.example.com/concepts#people">
<skos:prefLabel>people</skos:prefLabel> People
<skos:narrower>
<skos:OrderedCollection> . <people by age>
<rdfs:label>people by age</rdfs:label>
<skos:memberList rdf:parseType="Collection"> .. infants
<skos:Concept
rdf:about="http://www.example.com/concepts#infants"/>
.. children
<skos:Concept
rdf:about="http://www.example.com/concepts#children"/> .. adults
<skos:Concept
rdf:about="http://www.example.com/concepts#adults"/>
</skos:memberList>
</skos:OrderedCollection>
</skos:narrower>
</skos:Concept>
</rdf:RDF>
47
48
Εννοιολογικά σχή ατα
skos:hasTopConcept
49
Θεοδώρα Τσώλη
Βιβλιοθηκονόμος, Πάντειο Πανεπιστήμιο. Βιβλιοθήκη-Υπηρεσία Πληροφόρησης
thtsoli@panteion.gr
Περιεχόμενα
Το μοντέλο των ΘΧ
Εφαρμογές
Βιβλιογραφία
Το περιβάλλον των
υπολογιστικών συστημάτων και
της διαχείρισης γνώσης σήμερα:
Έχει επίκεντρο εφαρμογές και
τεκμήρια.
Πώς όμως λειτουργεί η
ανθρώπινη σκέψη ?
Θέματα, όροι, έννοιες
Η πρόταση των δημιουργών των
ΘΧ είναι η θεματοκεντρική
προσέγγιση.
The amount of information is being “expanded at a prodigious rate”, but the means we
use to find it is “the same as was used in the days of square-rigged ships”
Hypertext
As We May Think AUGMENT
MEMEX
Nelson Xanadu
NLS
Κατάλογοι όρων :
Θησαυροί
Σημασιολογικά δίκτυα
Οντολογίες
Π.χ. το ευρετήριο
Το βασικό μοντέλο
information layer
(content)
(1) Το επίπεδο των πληροφοριακών πόρων
information layer
composed by
composed by
Tosca
Puccini Madame
Butterfly
born in
Το μοντέλο
Topic-Association-Occurrence
αντικατοπτρίζει τον ανθρώπινο
τρόπο σκέψης
! "# $
% &! '# (" ) % *+ * *
current topic (multiple) types
multiple names
multiple
occurrences
multiple
associations
Ολοκληρώθηκε το 1999
Εγκρίθηκε και δημοσιεύτηκε ως ISO/IEC 13250:2000
Συντακτικό SGML DTD (με βάση το πρότυπο ISO HyTime
10744:1997)
TopicMaps.Org 2001
Ένωση χρηστών (ιδρύθηκε το 2000)
Στόχος: Η προσαρμογή των ΘΧ στο Web
Ειδικότερα η ανάπτυξη ενός εναλλακτικού συντακτικού στηριγμένου στα
πρότυπα του Web (XML, Xlink)
XML Topic Maps (XTM) 1.0 specification
Εγκρίθηκε το Μάρτιο του 2001
XML-based syntax and Xlink-based linking model
Εισήγαγε τη διάκριση ανάμεσα σε άμεση και έμμεση ταυτοποίηση θεμάτων
Οτιδήποτε μπορεί να είναι ένα θέμα, συμπεριλαμβανομένων και των
πληροφοριακών πηγών
ISO 2003 – 2nd Edition
<topic>
<topic id="la-boheme">
<instanceOf><topicRef xlink:href="#opera"/></instanceOf>
<baseName>
<scope>
<topicRef xlink:href="#Normal form "/>
</scope>
<baseNameString>La Bohème</baseNameString></baseName>
<occurrence>
<instanceOf><topicRef xlink:href="#homepage"/></instanceOf>
<resourceRef
xlink:href="http://www.opera.it/Opere/La-Boheme/La-Boheme.html"/>
</occurrence>
<association>
<instanceOf><topicRef xlink:href="#composed-by"/></instanceOf>
<member>
<roleSpec><topicRef xlink:href="#composer"/></roleSpec>
<topicRef xlink:href="#puccini"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#work"/></roleSpec>
<topicRef xlink:href="#la-boheme"/>
</member>
</association>
</topic>
Association – XTM 1.0 Syntax
<association>
<instanceOf><topicRef xlink:href="#composed-by"/></instanceOf>
<member>
<roleSpec><topicRef xlink:href="#composer"/></roleSpec>
<topicRef xlink:href="#puccini"/>
</member>
<member> Μέλη
<roleSpec><topicRef xlink:href="#work"/></roleSpec> συσχέτισης και
<topicRef xlink:href="#la-boheme"/> ρόλοι
</member>
</association>
<occurrence> subelement:
external/internal resources: <resourceRef> or <resourceData>
<!ELEMENT occurrence
( instanceOf?, scope?, ( resourceRef | resourceData ) )
>
<!ATTLIST occurrence Τύπος
id ID #IMPLIED εμφάνισης
>
<topic>
<topic id="la-boheme">
<occurrence>
<instanceOf><topicRef xlink:href="#homepage"/></instanceOf>
<resourceRef
xlink:href="http://www.opera.it/Opere/La-Boheme/La-Boheme.html"/>
</occurrence>
<occurrence>
<instanceOf><topicRef xlink:href="#premiere-date"/></instanceOf>
<resourceData>1896 (1 Feb)</resourceData>
</occurrence>
</topic> Τύπος
εμφάνισης
Δημιουργώντας ένα Θεματικό
Χάρτη
Ορίζοντας το θέμα
<?xml version="1.0"?>
<topicMap id="aueb-uni"
xmlns = 'http://www.topicmaps.org/xtm/1.0/'
xmlns:xlink = 'http://www.w3.org/1999/xlink'>
<!-- The map contains basic information about AUEB.-->
</topicMap>
Ορίζοντας τα topics
<topic id="aueb">…</topic>
<topic id="it-school">…</topic>
:
<topic id="aueb">
<baseName><baseNameString>Athens University of Economics and
Business</baseNameString>
</baseName>…</topic>
:
<topic id="it-school">
<baseName><baseNameString>AUEB - Information Technology
School</baseNameString>
</baseName>
:
</topic>
<topic id="aueb">
<instanceOf><topicRef xlink:href="#university"/>
</instanceOf>
<baseName>
<baseNameString> Athens University of Economics and
Business
</baseNameString>
</baseName>
<occurrence>
<instanceOf>topicRef xlink:href=“#webpage”/>
</instanceOf>
<resourceRef xlink:href=http://www.aueb.gr//>
</occurrence>
</topic>
Ορίζοντας συσχετίσεις
<association>
<instanceOf>
<topicRef xlink:href=“#holds-position-in-organisation”
</instanceOf>
<member>
<roleSpec><topicRef xlink:href=“#holder”/></roleSpec>
<topicRef xlink:href=“#prastakos”/>
</member>
<member>
<roleSpec><topicRef xlink:href=“#position”/></roleSpec>
<topicRef xlink:href=“#dean”/>
</member>
<member>
<roleSpec><topicRef xlink:href=“#organisation”/></roleSpec>
<topicRef xlink:href=“#aueb”/>
</member>
</association>
“Η μεταφυσική μελέτη της φύσης της ζωής και της ύπαρξης (Αριστοτέλης)
Η έννοια της οντολογίας έχει υιοθετηθεί από την Τεχνητή Νοημοσύνη και σημαίνει
«Μια οντολογία είναι μια τυπική (formal), κατηγορηματική (explicit) προδιαγραφή μιας
διαμοιρασμένης (shared) εννοιολογικής αναπαράστασης (conceptualization) [ ] και κοινή
κατανόηση κάποιου τομέα, η οποία μπορεί να ανταλλαγεί μεταξύ ανθρώπων και
συστημάτων εφαρμογών” Gruber
Soprano
ορισμός: The highest category of female
Person (or artificial male) voice
Musician
Ευρύτερος singer
Conductor
όρος:
Player
Bassoonist
Στενότερος lyric soprano, dramatic soprano,
όρος: coloratura soprano
Cellist
Violinist
Singer
Σχετικός όρος: mezzo-soprano
Baritone
Bass
Βασικές έννοιες του ΘΧ:
Mezzo
Topics
Soprano
Associations=συσχετίσεις
Lyric
Dramatic
Occurrences=εμφανίσεις
Colaratura Άλλες έννοιες:
Tenor
Κατηγορίες topics Κατηγορίες
Writer Κατηγορίες εμφανίσεων συσχετίσεων
Artist
Μοντελοποίηση θησαυρού σε θεματικό χάρτη: εφαρμογή
Ε φάνιση
(π.χ. διευκρινιστική Ε φάνιση
Ση είωση, ορισ ός)
Ιεραρχική σχέση
Σχέση συσχέτισης
Πεδίο
εφαρ ογής
topic
Τα topics(θέ ατα)
του χάρτη για την
κατηγορία Education
and research
Συσχετίσεις
(ευρύτεροι και
στενότεροι
όροι-θέ ατα)
3. Διαχείριση μεταδεδομένων
Το πρώτο μεγάλης κλίμακας XML Topic Map site στη Νέα Ζηλανδία
topic
Occurrences =
Occurrences = Κατηγορίες
Κατηγορίες ε φανίσεων
ε φανίσεων
Συσχετίσεις
Συσχετίσεις
SPARQL
Χρήσεις
Εύρεση τιμών από μερικώς γνωστούς γράφους
Ανάκτηση πληροφορίας για ένα αντικείμενο με μη
γνωστές ιδιότητες (properties)
Εκτέλεση επερωτήσεων σε RDF γράφους
Εκτέλεση επερωτήσεων με περιορισμούς σύμφωνα με
τον τύπο των δεδομένων
Ερώτηση σε απομακρυσμένους RDF servers
Χρήση RDF query service σε Web Services
3
Παράδειγμα
Data:
<http://example.org/book/book1> <http://purl.org/dc/elements/1.1/title> "SPARQL Tutorial“
Query:
χρησιμοποιούμε μια μεταβλητή στη θέση του υποκειμένου,
κατηγορήματος, αντικειμένου
δύο μέρη SELECT clause, WHERE clause
SELECT ?title
WHERE
{
<http://example.org/book/book1> <http://purl.org/dc/elements/1.1/title> ?title
}
title
SPAQL Tutorial
Σύνταξη (1/2)
IRI: περικλείονται σε <>
τα IRI μπορεί να είναι URI, Qnames (ζεύγος "x:p” {URI, local-name}, π.χ. {"http://example.com/ns/foo",
"p"}.)
PREFIX:δεσμεύει ένα πρόθεμα σε ένα namespace IRI.
PREFIX foaf: http://xmlns.com/foaf/0.1/
BASE: δηλώνει ένα βασικό IRI, που χρησιμοποιείται για την ανάλυση – δήλωση σχετικών IRI
BASE <http://example.org/book/>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
SELECT ?title
WHERE { <book1> dc:title ?title }
Μεταβλητές: δηλώνονται με πρώτο χαρακτήρα τα «?» ή «$». Το $abc και το ?abc είναι
η ίδια μεταβλητή.
Απλοί όροι (literals): δηλώνονται με “” ή ‘’. Μπορούν να φέρουν ετικέτα της γλώσσας
που ανήκουν ("Literal"@language) ή τον τύπο δεδομένων που ανήκουν
("10"^^xsd:integer)
Υποδείγματα (patterns) RDF τριάδων: περικλείονται από {}. Οι τελείες «.» διαχωρίζουν
τα υποδείγματα τριάδων
Στα υποδείγματα τριάδων με κοινό υποκείμενο βάζουμε (;) έτσι ώστε το υποκείμενο στο ερώτημα να
γράφεται μόνο μία φορά. Π.χ
?x foaf:name ?name ; = ?x foaf:name ?name .
foaf:mbox ?mbox . ?x foaf:mbox ?mbox
Στα υποδείγματα τριάδων με κοινό υποκείμενο και κατηγόρημα, τα αντικείμενα διαχωρίζονται με (,)
?x foaf:nick “Alice”, “Alice_” = ?x foaf:nick “Alice” .
?x foaf:nick “Alice_”
5
Σύνταξη (2/2)
Κενοί κόμβοι
Το υπόδειγμα :a :b [ :c :d ] είναι ίσο με
:a :b _:x . _:x :c :d .
για τον κενό κόμβο _:x
RDF Collections
:a :b ( :c :d :e :f ) που αποτελούν σύντμηση
πολλών τριάδων
Αναζήτηση
Προσδιορισμός ενός συνόλου από αντικαταστάσεις μεταβλητών με τιμές έτσι ώστε να
δημιουργείται ένα υποσύνολο τριάδων ενός RDF γράφου
Data
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
_:a foaf:name "Alice" .
_:a foaf:mbox <mailto:alice@example.net> .
_:b foaf:name "Bob" .
Query 1
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE { ?x foaf:name ?name }
ORDER BY ASC[?name]
Query 2
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE {
?person foaf:mbox <mailto:alice@example.net> .
?person foaf:name ?name .
}
Results 1 name Results 2 name
Alice Alice
Bob
7
Περιορισμοί τιμών
Περιορίζουν τις τιμές στις λύσεις των επερωτήσεων
FILTER ?x < 3 .
Βασίζονται στα XQuery 1.0 and XPath 2.0 Function
and Operators
Εφαρμόζονται στους τύπους δεδομένων
XSD boolean, string, integer, decimal, float, double,
dateTime
BOUND, isURI, isBLANK, isLITERAL, REGEX, LANG,
DATATYPE, STR (lexical form)
Τελεστές σύγκρισης τιμών: <, >, =, <=, >= και !=
9
OPTIONAL
Η RDF αφορά σε ημιδομημένα δεδομένα (semi
structured)
Δεν προβλέπει περιορισμούς ακεραιότητας
δεδομένων (integrity constraints)
Με δεδομένο ότι η ποιότητα των πηγών
μεταδεδομένων μπορεί να ποικίλει, μια γλώσσα
επερωτήσεων πρέπει να προσθέτει πληροφορία,
προκειμένου να μην αποτύχουν οι επερωτήσεις
λόγω ελλειπούς πληροφορίας
Η έκφραση OPTIONAL{pattern} είναι ίση με
{pattern} OR { NOT(pattern)}
10
Παράδειγμα 1
Το κατηγόρημα nick δεν έχει τιμή όταν το κατηγόρημα name έχει τιμή
"Bob" γιατί δεν υπάρχει αντίστοιχη τριάδα _:b με κατηγόρημα nick
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
Alice A-online
Bob
11
Φωλιασμένα OPTIONAL
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix vcard: <http://www.w3.org/2001/vcard-rdf/3.0#> .
_:a foaf:name "Alice" .
_:a foaf:mbox <mailto:alice@work.example> .
_:a vcard:N _:x .
12
13
Φωλιασμένα OPTIONAL (results)
14
OPTIONAL με περιορισμούς
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix : <http://example.org/book/> .
@prefix ns: <http://example.org/ns#> .
! "#
"$ % &'
15
UNION
Η SPARQL παρέχει τη δυνατότητα συνδυασμού
των υποδειγμάτων RDF γράφων έτσι ώστε να
ανακτώνται περισσότερα από ένα εναλλακτικά
υποδείγματα σε ένα RDF γράφο
Η δυνατότητα αυτή παρέχεται από τη δήλωση
UNION
16
Παράδειγμα UNION
@prefix dc10: <http://purl.org/dc/elements/1.0/> .
@prefix dc11: <http://purl.org/dc/elements/1.1/> .
Query:
PREFIX dc10: <http://purl.org/dc/elements/1.0/>
PREFIX dc11: <http://purl.org/dc/elements/1.1/>
Ανακτά τους τίτλους των βιβλίων που έχουν περιγραφεί είτε με την έκδοση 1.0 είτε
με την έκδοση 1.1. του Dublin Core
Η SELECT DISTINCT εξασφαλίζει μοναδικές τιμές στους τίτλους
"SPARQL”
17
Εναλλακτικά
PREFIX dc10: <http://purl.org/dc/elements/1.0/>
PREFIX dc11: <http://purl.org/dc/elements/1.1/>
SELECT ?x ?y
WHERE { { ?book dc10:title ?x } UNION { ?book
dc11:title ?y } }
"SPARQL"
18
Ανακεφαλαίωση
Ένα υπόδειγμα (pattern) αναζητά RDF δεδομένα (δηλ. Εξετάζεται αν
ταιριάζει σε ένα μέρος ενός RDF γράφου)
Κάθε φορά που ένα υπόδειγμα ταιριάζει σε ένα RDF υπό-γράφο τότε
υπάρχει λύση
Η ακολουθία των λύσεων μπορεί να περιορισθεί από: Project, distinct,
order, limit/offset
Limit: ακέραιος που προσδιορίζει το πλήθος των απαντήσεων
Offset: ακέραιος που ορίζει από που να αρχίσει η παράθεση των
απαντήσεων
Μορφές αποτελεσμάτων:
SELECT: αποδίδει τιμές σε μεταβλητές (bindings)
CONSTRUCT: δημιουργεί ένα RDF υπό-γράφο με τις τιμές που
αποδίδονται στις μεταβλητές
DESCRIBE:δημιουργεί RDF γράφο που περιγράφει τους πόρους που
ανακτώνται
ASK: απαντά με μια true ή false τιμή
19
Εισαγωγή γράφων
Για καλύτερη διαχείριση των δεδομένων δίνεται δυνατότητα
εισαγωγής γράφων:
aliceFoaf.ttl:
_:a foaf:name "Alice" .
_:a foaf:mbox <mailto:alice@work.example.com> .
_:a foaf:mbox <mailto:alice@home.example.org> .
...
bobFoaf.ttl:
_:c foaf:mbox <mailto:bob@work.example.com> .
_:c foaf:name "Robert" .
_:c foaf:nick "bob" .
...
20
21
Αναζήτηση σε πολλούς γράφους
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?graph
WHERE GRAPH ?graph {
?x foaf:name "Alice" .
}
Επιστρέφει τα URIs των γράφων που
περιέχουν τριάδες για το όνομα της Alice
22
PREFIX foaf:
<http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE GRAPH ex:aliceFoaf.ttl {
?x foaf:name ?name
}
23
Παράδειγμα 1
BASE <http://www.w3.org/2004/Talks/17Dec-sparql/data/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
WHERE {
GRAPH ?g { ?person rdf:type foaf:Person;
foaf:name ?name; foaf:mbox ?mbox
} .
}
Ανάκτηση των name και των mbox όλων των ανθρώπων
24
Παράδειγμα 2
BASE <http://www.w3.org/2004/Talks/17Dec-sparql/data/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
WHERE {
GRAPH ?g { ?person rdf:type foaf:Person .
OPTIONAL { ?person foaf:name ?name } .
OPTIONAL { ?person foaf:mbox ?mbox }
} .
}
ORDER BY ASC[?name]
Ανάκτηση όλων των ανθρώπων, αν υπάρχουν τα ονόματά τους ή τα mboxes, χωρίς επαναλήψεις
και ταξινομημένα κατά αύξουσα τάξη
25
Συστήματα
Οργάνωσης
Γνώσης
Κοινωνικές
ταξονομίες
(folksonomies)
στο
web
2.0
Κωνσταντία Κακάλη, Βιβλιοθηκονόμος MSc‐Phd Candidate
Περιεχόμενα
Δημιουργοί
μεταδεδομένων
Web
2.0
και
κοινωνικά
δίκτυα
Ιστότοποι
κοινωνικής
δικτύωσης
Κοινωνικές
επισημειώσεις
(Tags)
Τυπολογία
συστημάτων
κοινωνικής
επισημείωσης
Γιατί
επισημειώνουν
οι
χρήστες;
Tag
cloud
Folksonomy
Πλεονεκτήματα
των
κοινωνικών
επισημειώσεων
Περιορισμοί
των
κοινωνικών
ταξονομιών
Εφαρμογές
σε
βιβλιοθήκες
Εφαρμογές
σε
μουσεία,
κ.α.
Κοινωνικές
ταξονομίες
και
σημασιολογικός
ιστός
Βιβλιογραφία
2
Δημιουργοί
μεταδεδομένων
Τα
μεταδεδομένα
δημιουργούνται
τόσο
στο
συμβατικό
όσο
στο
ψηφιακό
χώρο
κύρια
από
επιστήμονες
της
πληροφόρησης,
σε
βιβλιοθήκες
και
σε
άλλους
οργανισμούς
πληροφόρησης.
Η
παροχή
μεταδεδομένων
από
τους
διανοητικούς
δημιουργούς
της
πληροφορίας.
Το
πρότυπο
μεταδεδομένων
Dublin
Core
είχε
δημιουργηθεί
για
να
απαντήσει
σε
αυτή
την
ανάγκη.
Η
τρίτη
προσέγγιση,
είναι
η
δημιουργία
μεταδεδομένων
από
τους
χρήστες
Η
προσέγγιση
αυτή
δεν
είναι
καινούργια.
Η
τεχνική
του
Citason
analysis
χρησιμοποιείται
για
τις
σχέσεις
ανάμεσα
στις
ακαδημαϊκές
δημοσιεύσεις
με
τις
παραπομπές
τους.
Παρόμοια
ανάλυση
των
συνδέσμων
στον
παγκόσμιο
ιστό,
χρησιμοποιείται
από
τον
αλγόριθμο
PageRank,
η
θεωρητική
βάση
της
μηχανής
αναζήτησης
Google.
Τα
συστήματα
συστάσεων
(recommendason
systems)
και
άλλα
που
χρησιμοποιούν
το
συνεργατικό
φιλτράρισμα
(collaborasve
filtering),
είναι
μορφές
άρρητης
παραγωγής
μεταδεδομένων
από
χρήστες.
3
Web
2.0
και
κοινωνικά
δίκτυα
Το
"Web
2.0"
(Ιστός
[έκδοση]
2.0),
είναι
μια
φράση
που
εφευρέθηκε
από
την
O'Reilly
Media
το
2004,
και
αναφέρεται
σε
μια
δεύτερη
γενιά
υπηρεσιών
βασισμένων
στο
Διαδίκτυο
‐
όπως
οι
ιστότοποι
κοινωνικής
δικτύωσης
(social
networking
sites),
τα
wikis,
διάφορες
εφαρμογές
και
εργαλεία
επικοινωνίας
‐
που
δίνουν
έμφαση
στην
ηλεκτρονική
συνέργεια
και
ανταλλαγή
μεταξύ
των
χρηστών.
Η
O'Reilly
Media,
σε
συνεργασία
με
την
MediaLive
Internasonal,
χρησιμοποίησαν
τη
φράση
ως
τίτλο
σε
μια
σειρά
από
συνέδρια,
και
από
το
2004
πολλά
μέλη
τεχνικών
υπηρεσιών,
αλλά
και
μέλη
διαδικτυακών
κοινοτήτων
υιοθέτησαν
τον
όρο.
Τα
«κοινωνικά
δίκτυα»
δεν
είναι
νέος
όρος,
προέρχεται
από
τις
κοινωνικές
επιστήμες,
που
τα
ορίζει
ως
τα
νοητά
δίκτυα
που
σχηματίζονται
από
κοινωνικές
σχέσεις
(οικογενειακές,
πολιτικές,
φιλικές)
ανάμεσα
στα
άτομα
που
συνάπτονται,
διατηρούνται
και
δυναμώνουν
ή
το
αντίθετο,
με
βάση
την
ελεύθερη
βούληση
και
επιλογή
των.
Η
απεικόνιση
των
κοινωνικών
δικτύων
γίνεται
με
τα
κοινωνιογράμματα,
δηλαδή
γράφους
με
κόμβους
(nodes)
που
δείχνουν
τις
οντότητες
και
ακμές
που
δείχνουν
τις
σχέσεις.
4
Ιστότοποι
κοινωνικής
δικτύωσης
(1)
Οι
ιστότοποι
κοινωνικής
δικτύωσης
είναι
εφαρμογές
του
ιστού
που
επιτρέπουν
σε
άτομα
να
δημιουργήσουν
το
δημόσιο
προφίλ
τους
στο
πλαίσιο
ενός
συστήματος,
να
επικοινωνούν
και
να
μοιράζονται
πληροφορίες
με
μια
λίστα
από
άλλα
άτομα
που
αυτοί
επιλέγουν.
H
διαφορά
με
usenet
ή
forum
είναι
με
κέντρο
τα
άτομα
κι
όχι
το
θέμα.
Οι
βασικές
λειτουργίες
είναι
:
E‐mail
(μέσω
του
site)
Groups
(διαδικτυακές
ομάδες
που
άτομα
τα
οποία
μοιράζονται
κοινά
ενδιαφέροντα
μπορούν
να
συμμετέχουν)
Events
(ανακοινώσεις
για
τα
πάντα,
από
γενέθλια
έως
συναυλίες)
Forums
(τα
μέλη
επικοινωνούν
και
συζητούν
για
ποκιλία
θεμάτων)
Photo
and
video
sharing
(Σύμφωνα
με
το
MySpace
8
εκατομμύρια
εικόνες
και
60,000
νέα
βίντεο
ανεβάζονται
στους
server
του
σε
καθημερινή
βάση)
Classified/Marketplace
secson
(δωρεάν
διαφήμιση
για
οποιονδήποτε
και
οτιδήποτε)
Chat
rooms
Bullesn
boards
(τα
μέλη
δημιοσεύουν
πληροφορίες
και
τις
στέλνουν
σε
όλους
τους
φίλους
τους)
Blogs
Find
friends
(Με
διάφορους
τρόπους
και
κριτήρια
το
Facebook
και
το
Myspace
ψάχνουν
και
σου
προτείνουν
φίλους)
Personal
profile
pages
(Μπορούν
να
ειδωθούν
ως
por•olio,
βιογραφικό
ή
ημερολόγιο
5
Ιστότοποι
κοινωνικής
δικτύωσης
(2)
Σε
αντίθεση
με
τους
ιστότοπους
που
έχουν
σκοπό
την
ανάπτυξη
των
ανθρώπινων
σχέσεων,
υπάρχουν
ιστότοποι
με
σκοπό
την
οργάνωση
και
διαχυση
της
πληροφορίας.
del.icio.us
είναι
ιστότοπος
κοινωνικής
σελιδοσήμανσης
(social
bookmarking
site).
Εκτός
από
την
αποθήκευση
ενός
συνδέσμου
μιας
ιστοσελίδας
στα
«Αγαπημένα
μου»
ή
«Σελιδοδείκτες»
για
μελλοντική
χρήση,
η
αποθήκευση
στη
σελίδα
σου
στο
delicious
με
σκοπό
να
μπορείς
να
το
ανακτήσεις
από
οποιοδήποτε
υπολογιστή,
να
περιγράψεις
τον
ψηφιακό
σου
πόρο
με
λέξεις
(tags)
για
να
τον
ευρετηριάσεις.
Flickr
a
digital
image
storage.
Μπορείς
να
οργανώσεις
όλες
τις
φωτογραφίες
σου
σε
άλμπουμ,
να
τις
περιγράψεις
με
λέξεις
(tags)
και
δεις
άλλες
φωτογραφίες
χρηστών.
Technoras,
που
επιτρέπει
σε
χρήστες
να
αναζητούν
στο
περιεχόμενο
των
ιστολογίων
που
ανανεώνεται
πιο
γρήγορα
σε
σχέση
με
τις
υπόλοιπες
ιστοσελίδες.
Η
αναζήτηση
φέρνει
αποτελέσματα
που
έχουν
αναρτηθεί
πρόσφατα
σε
σχέση
με
άλλες
μηχανές
αναζήτησης.
Μια
σειρά
βέβαια
από
εφαρμογές
όπως
είναι
η
Connotea
ή
η
CiteUlike
απευθύνονται
στον
ακαδημαϊκό
χώρο,
σε
επιστήμονες
και
ερευνητές,
καθώς
συνδέονται
με
αξιόπιστες
βάσεις
δεδομένων
όπως
η
PubMed
αλλά
και
ελέγχοντας
την
χαμηλής
ποιότητα
πληροφορία
επιτρέποντας
τη
επισήμανση
σε
συνδέσμους
από
έγκυρα
μόνο
περιοδικά.
6
Κοινωνικές
επισημειώσεις
(Tags)
Οι
επισημειώσεις
(tags),
είναι
στην
ουσία,
λέξεις
–
κλειδιά,
θεματικοί
όροι,
που
επιλέγονται
από
τους
χρήστες
συχνά
μαζί
με
μια
σύντομη
περιγραφή
του
ιστοτόπου,
είναι
μια
μορφή
αδόμητης
αλλά
ρητής
δημιουργίας
μεταδεδομένων
από
τους
χρήστες
της
πληροφορίας.
Η
διαδικασία
αυτή
είναι
το
λεγόμενο
«social
tagging».
Το
«social
tagging»
ή
αλλιώς
το
«collaborasve
tagging»
είναι
ένα
σχετικά
νέο
φαινόμενο,
μια
μορφή
οργάνωσης
γνώσης
και
τρόπος
ανακάλυψης
πληροφοριακών
πόρων,
που
επιτρέπει
στον
καθένα
να
δημιουργεί
σελιδοδείκτες
(bookmarks)
ή
επισημειώσεις
(tags)
για
να
οργανώσει
και
να
αποθηκεύσει,
με
ένα
αυτόνομο
σύστημα
επισήμανσης,
την
πληροφορία
(Macgregor
and
McCulloch,
2006).
Στην
βιβλιογραφία
το
φαινόμενο
αναφέρεται
και
με
τους
όρους
«κοινωνική
ταξινόμηση»
(social
classificason),
ή
«κοινωνική
ευρετηρίαση»
(social
indexing).
7
Τυπολογία συστημάτων κοινωνικής επισημείωσης
Τα
συστήματα
κοινωνικών
επισημειώσεων
δεν
είναι
ομοιόμορφα.
Κάθε
ιστότοπος
αναπτύσει
ανάλογα
συστήματα
για
τους
δικούς
του
στόχους.
Οι
κύριες
διαφορές
είναι:
1. Δυνατότητα
του
συστήματος
σύστασης
επισημειώσεων
:
1. Αν
το
σύστημα
προτείνει
επισημειώσεις
στο
χρήστη
τις
πιο
δημοφιλείς
επισημειώσεις
2. Αν
το
σύστημα
προτείνει
τις
πιο
συχνά
χρησιμοποιημένες
επισημειώσεις
του
χρήστη.
2. Συστήματα
σε
συνδυασμό
εξατομικευμένων
υπηρεσιών.
1. Επισημειώσεις
βάζουν
μόνο
οι
εγγεγραμμένοι
χρήστες
2. Ελεύθερα
συστήματα
κοινωνικής
επισημείωσης
3. Δυνατότητα
ελέγχου
των
λέξεων
και
των
συνθέσεων
τους.
1. Αν
το
σύστημα
ελέγχει
την
ορθογραφία
των
λεξεων
2. Αν
το
σύστημα
δίνει
δυνατότητα
φράσεων
.
8
Γιατί
επισημειώνουν
οι
χρήστες;(1)
Οι
χρήστες
επισημειώνουν
(ιστοσελίδες,
ψηφιακά
αντικείμενα,
εγγραφές)
με
σκοπό
να
τα
επανακτήσουν.
Αν
και
ο
αρχικός
σκοπός
είναι
η
ανακάλυψη
των
ψηφιακών
αντικειμένων
και
ο
διαμοιρασμός
τους
με
άλλους,
ο
τελικός
σκοπός
είναι
να
ξαναβρεθεί
με
την
έννοια
που
ο
χρήστης
το
έχει
χαρακτηρίσει
και
ανταποκρίνεται
στις
αναζητήσεις
του.
Οι
χρήστες
επισημειώνουν
για
να
αναδείξουν
το
περιεχόμενο
με
σκοπό
να
ανακτηθεί
από
άλλους
χρήστες.
Κύρια
από
τους
δημιουργούς
περιεχομένου
ώστε
στην
φυλλομέτρηση
της
κοινωνικών
επισημειώσεων
θα
ανακτηθεί
το
περιεχόμενο
τους.
Ακόμα
για
να
ακουστεί
η
γνώμη
τους,
με
την
όποια
μορφή
κριτικής
περισσότερο,
παρά
περιγραφής
των
δεδομένων.
Digg
ή
Reddit
έχουν
εφαρμογές
ψηφοφορίας
και
βαθμού
προτίμησης
αλλά
σε
απλά
συστήματα
επισημειώσεων
τα
tags
χρησιμοποιούνται
ως
μέσο
κριτικής.
Είναι
αμφίβολο
το
αποτέλεσμα
της
κοινωνικής
ταξονομίας
που
αναπτύσσεται
από
τέτοιες
επισημιώσεις
Πρόβλημα
και
στην
ανάκτηση
πληροφορίας
9
Γιατί
επισημειώνουν
οι
χρήστες;(2)
Οι
χρήστες
επισημειώνουν
για
να
διορθώσουν
ή
να
εμπλουτίσουν
το
ήδη
υπάρχον
σύστημα
ανάκτησης
πληροφορίας.
Συναντάται
όταν
οι
χρήστες
είναι
πιο
εξειδικευμένοι
από
τους
ευρετηριαστές.
Οι
επισημειώσεις
αυτές
μπορεί
να
εμβαθύνουν
και
να
εμπλουτίζουν
το
υπάρχον
σύστημα
ευρετηρίασης.
Ακόμα
μπορεί
να
είναι
έμμεσος
τρόπος
διόρθωσης
των
όρων
που
ευρετηριάζονται.
Για
να
δημιουργήσουν
μια
«κοινωνική
ταξονομία».
Τόσο
οι
χρήστες
όσο
και
οι
δημιουργοί
περιεχομένου,
επισημειώνοντας
σελίδες
ή
αντικείμενα
συνδέονται
με
άλλα
σχετικά
(Technoras).
Διαφορα
λογισμικά
ιστολογίων
(π.χ.
WorldPress)
χρησιμοποιούν
tags
για
να
δημιουργούν
καταλόγους
σχετικών
άρθρων
από
και
μέσα
στο
site.
Ένας
τρόπος
δημιουργίας
μιας
πρότασης
βιβλιογραφίας.
Για
να
παίξουν
παιχνίδια
ESP
game
10
Tag
cloud
Το
«σύννεφο
επισημειώσεων»
ή
tag
cloud
είναι
το
«δημόσιο
πρόσωπο»,
η
δημόσια
εμφάνιση
μιας
κοινωνικής
ταξονομίας.
Η
δημοτικότητα
των
επισημειώσεων
καθορίζεται
από
τη
συχνότητα
χρήσης
τους
και
συχνά
απεικονίζονται
συνολικά
σε
«σύννεφα
από
επισημειώσεις»
(tag
clouds),
που
οι
πιο
δημοφιλείς
και
συχνά
χρησιμοποιημένοι
όροι
έχουν
υποδειχθεί
με
μεγαλύτερα
και
πιο
έντονα
γράμματα.
11
Folksonomy ή κοινωνική ταξονομία
Η
folksonomy,
δηλαδή
ταξονομία
με
«λαϊκούς»
(folks)
όρους,
όπως
αποδόθηκε
από
τον
Thomas
Vander
Wal
με
τη
συνένωση
των
παραπάνω
όρων
(Vander
Wal,
2004).
Κατά
κάποιο
τρόπο,
η
τεχνολογία
αυτή
κάνει
τους
χρήστες
να
δημιουργούν
τα
δικά
τους
ελεγχόμενα
λεξιλόγια
και
να
προσδιορίζουν
θεματικά
τους
ιστότοπους
που
επισκέπτονται
και
τους
ενδιαφέρουν.
Οι
κοινωνικές
ταξονομίες
συνηθίζουν
να
οργανώνουν
την
πληροφορία
και
να
υποστηρίζουν
την
ανάκτηση
της
πληροφορίας
(IR),
αλλά
το
σημαντικότερο
δημιουργούν
κοινότητες
χρηστών
με
κοινό
λεξιλόγιο.
Τυπολογία
κοινωνικών
ταξονομιών
:
Broad
folksonomies
(Del.icio.us)
Narrow
folksonomies
(Flickr)
Personomies
12
Πλεονεκτήματα
των
κοινωνικών
επισημειώσεων
(1)
Για
την
ατομική
διαχείριση
της
πληροφορίας
(personal
informason
management
–
PIM),
καθώς
τα
συστήματα
αυτά
(tagging
systems)
αποτελούν
εργαλεία
διαχείρισης
και
οργάνωσης
της
πληροφορίας.
Οι
κοινωνικές
ταξονομίες
περιλαμβανουν
και
απεικονίζουν
το
λεξιλόγιο
του
κάθε
χρήστη
χωρίς
αποκλεισμούς,
πολιτικές
κοινωνικές
και
πολιτιστικές
προκαταλήψεις.
Είναι
δημοκρατικές
εκφράσεις
χρηστών
που
αυτό‐προσδιορίζουν
τις
ανάγκες
τους.
Σε
ένα
παραδοσιακό
σύστημα
τις
ανάγκες
αυτές
προσπαθεί
να
τις
εκφράσει
ο
καταλογογράφος.
Οι
κοινωνικές
ταξονομίες
δημιουργούν
κοινότητες.
Παραπέρα
θα
μπορούσαμε
να
πούμε
ότι
δημιουργεί
κοινότητες
δρώσες,
κοινωνικά
δίκτυα
σε
εικονικό
και
πραγματικό
χώρο,
αφού
είναι
βασικές
υπηρεσίες
του
κοινωνικού
διαδικτύου
(social
web).
Οι
κοινωνικές
ταξονομίες
εκφράζοντας
τις
διαθέσεις
των
χρηστών,
δίνουν
τη
δυνατότητα
να
παρατηρήσουμε
πως
και
γιατί
οι
χρήστες
επισημειώνουν
τα
ψηφιακά
αντικείμενα.
Να
παρατηρήσουμε
τη
συμπεριφορά
των
χρηστών.
(επισημειώσεις
λειτουργικές
όπως:
to_read,
to_watch,
)
13
Πλεονεκτήματα
των
κοινωνικών
επισημειώσεων
(2)
Προσφέρουν
μια
εναλλακτική
λύση
χαμηλού
κόστους.
Η
πληθώρα
των
πληροφοριών
(μέσα
από
τα
νέα
μέσα
:
wiki’s,
blogs)
κάνει
μια
παραδοσιακή
ταξονομία
και
ένα
ελεγχόμενο
λεξιλόγιο
μια
αδύνατη
λύση
Χωρίς
αμφιβολία,
το
σύστημα
αυτό
είναι
χρήσιμο
για
τα
ψηφιακά
αντικείμενα
που
δεν
έχουν
καθόλου
μεταδεδομένα,
ιδιαίτερα
φωτογραφίες,
video,
χάρτες
κ.α.
(π.χ.
σε
μια
δημόσια
βιβλιοθήκη
θα
μπορούσε
να
βοηθήσει
στη
επισήμανση
τοπικών
ιστορικών
φωτογραφιών).
Είναι
σύγχρονες
και
προσφέρουν
επίκαιρους
και
νέους
όρους
που
δεν
είναι
εύκολο
σε
μια
ελεγχόμενη
ιεραρχική
ταξονομία.
σημαντική
μπορεί
να
αναδειχθεί
η
χρήση
τους
σε
μικρές
κοινότητες
χρηστών
με
εξειδικευμένα
θέματα,
ιδιαίτερα
σε
θεματικές
περιοχές
που
δεν
υπάρχουν
λεξιλόγια
Ενώ
οι
ιεραρχικές
ταξονομίες
σχεδιάζονται
για
την
εύρεση
συγκεκριμένων
πόρων,
οι
κοινωνικές
προορίζονται
και
στην
ανακάλυψη
άγνωστων
κι
απροσδόκτητων
πόρων.
14
Περιορισμοί
των
κοινωνικών
ταξονομιών
Η
παράλληλη
χρήση
και
του
ενικού
και
του
πληθυντικού
των
λέξεων
σε
μια
έννοια
(π.χ.
βιβλίο
–
βιβλία)
Η
έλλειψη
ιεραρχίας
και
κανόνων.
Είναι
επίπεδα
συστήματα.
Δεν
υπάρχουν
σχέσεις
γένους
–
είδους.
στο
πρόβλημα
αυτό
οι
υποστηρικτές
των
πιστεύουν
ότι
η
πολυιεραρχία
θα
μείωνε
την
ευχρηστία
των
συστημάτων
Η
έλλειψη
εξειδίκευσης
και
εξαντλητικότητα
της
θεματικής
επισημείωσης
Η
ανυπαρξία
ελεγχόμενων
καταλόγων
ονομάτων
(δεν
φανερώνει
το
επώνυμο,
το
όνομα
ή
το
ψευδώνυμο).
Η
κοινή
προσέγγιση
για
κάθε
τύπο
υλικού
(κείμενο,
ιστοσελίδα,
εικόνα
κ.α.),
Ακόμα,
οι
κοινωνικές
ταξονομίες
είναι
ευαίσθητες
στο
gaming,
καθώς
ένας
κακοήθης
χρήστης
μπορεί
να
προωθεί
επισημειώσεις
για
να
αλλοιωθεί
το
σύστημα.
15
Περιορισμοί
των
κοινωνικών
ταξονομιών
(2)
Η
έλλειψη
ελέγχου
συνωνύμων,
ομώνυμων,
η
χρήση
ακρώνυμων.
Η
έλλειψη
ενός
ελεγχόμενου
λεξιλογίου
που
θα
«ανακάλυπτε»
τους
σχετιζόμενους
όρους
(π.χ.
ένα
ερώτημα
για
τη
«γρίπη
των
πτηνών»,
στη
κοινωνική
υπηρεσία
βιβλιογραφικής
αναφοράς
(social
citason)
Connotea
(www.connotea.org/)
παραπέμπουν
σε
είκοσι
έξι
διαφορετικούς
όρους
που
περιγράφουν
την
ίδια
έννοια).
είναι
μια
σχεδιαστική
επιλογή
ή
μια
αδυναμία;
αλλά
μια
σειρά
από
συστήματα
παρέχουν
μια
λίστα
σχετικών
όρων
Το
πιο
σημαντικό
αποτέλεσμα
των
παραπάνω
η
έλλειψη
ακρίβειας,
για
πολλούς
είναι
ανευ
χρησιμότητας
για
την
αναζήτηση
της
πληροφορίας.
Η
απάντηση
από
τους
υποστηρικτές
των
συστημάτων
:
η
ακρίβεια
δεν
είναι
το
παν.
Μια
παραδοσιακή
ταξονομία
μπορεί
να
έχει
αποτελέσματα
ανάκλησης
των
πιο
σχετικών
πόρων
στα
ερωτήματα
μας,
αλλά
ο
χρήστης
θα
πρέπει
να
γνωρίζει
πώς
να
τα
διατυπώνει.
16
Κατανομές
συμπεριφοράς
των
επισημειώσεων
Δύο
διαφορετικές
κατανομές
Η
εκθετική
κατανομή
(infometrics
–
power
law)
Με
τη
γνωστή
μακρυά
ουρά
(long
tail)
Η
αντίστοφη
λογιστική
κατανομή
(inverse
logissc)
Σε
αυτή
την
κατανομή
υπάρχει
ο
και
ο
μακρύς
κορμός
(long
trunk)
και
μακρυά
ουρά
(long
tail)
17
Μοντέλα συστημάτων κοινωνικών επισημειώσεων
18
Εφαρμογές
σε
βιβλιοθήκες
Πολλές
βιβλιοθήκες
προβάλλουν
διεξόδους,
αναπτύσοντας
ή
εφαρμόζοντας
στα
υπάρχοντα
συστήματα
τους
(όπως
OPAC)
συστήματα
κοινωνικών
επισημειώσεων
και
δημιουργίας
κοινωνικών
ταξονομιών.
Η
Βιβλιοθήκη
του
Πανεπιστήμιου
της
Πενσυλβάνιας
ανέπτυξε
το
PennTags
(tags.library.upenn.edu/),
ένα
ιστότοπο
όπου
το
προσωπικό
και
οι
φοιτητές
του
πανεπιστήμιου
μπορούν
να
κάνουν
σελιδοσήμανση
σε
ποιοτικές
ιστοσελίδες
και
αρχεία
του
OPAC
και
να
τις
μοιραστούν
μεταξύ
τους.
H
Ann
Arbor
District
Library’s
catalog
επιτρέπει
στους
χρήστες
της
να
επισημειώνουν
τα
τεκμήριά
της.
Ένα
σύννεφο
επισημειώσεων
Edmonton
Public
Library’s
subject
guide
pages
εμφανίζεται
με
το
CiteULike.
Δημόσιες
βιβλιοθήκες
στη
Γαλλία
ανάπτυξαν
λογισμικό
ανοικτού
κώδικα,
όπως
είναι
το
AFI‐
OPAC
2.02
Στην
Ελλάδα
αναπτύχθηκε
ο
πρώτος
opac
2.0
(OPACIAL)
με
ελεύθερο
σύστημα
κοινωνικής
επισημείωσης
hžp://library.panteion.gr/opacial
με
πολυεδρική
(φασετική)
αναζήτηση
με
βάση
το
έτος
και
το
είδος
του
υλικού
και
των
θεματικών
επικεφαλίδων,
αλλά
και
με
παράλληλη
ενοποίηση
της
ψηφιακής
βιβλιοθήκης
με
βάση
τις
θεματικές
επικεφαλίδες
που
προβάλλονται
19
Εφαρμογές
σε
μουσεία,
αρχεία
κ.α.
Πολλά
μουσεία
(όπως
το
Powerhouse
Museum)
αναπτύσσουν
νέους
καταλόγους
εμπνευσμένους
από
τις
τεχνολογίες
του
Web
2.0.
Σημαντικό
πρόγραμμα
ανέπτυξε
το
Nasonal
Leadership
Grant
for
Research
από
το
U.S.
Insstute
of
Museum
and
Library
Sciences
(hžp://
www.steve.museum/)
όπου
με
έρευνες
απέδειξαν
ότι
η
χρήση
συστημάτων
κοινωνικής
επισημείωσης
αποδείχτηκαν
ιδιαίτερα
χρήσιμα
για
τα
μουσεία
και
τους
επισκέπτες
τους.
Εμπορικά
λογισμικά
όπως
το
AquaBrowser
και
το
PRIMO,
οι
νέας
γενιάς
κατάλογοι
όπως
αναφέρονται,
με
ενσωματωμένες
αρκετές
λειτουργίες
όπως
κοινωνικών
επισημειώσεων
και
κοινωνικού
σχολιασμού,
πολευδρική
φασετική
αναζήτηση.
LibraryThing
είναι
μια
εφαρμογή
στον
ιστό
για
την
αποθήκευση
κοινού
καταλόγου
βιβλίων
μια
εφαρμογή
συλλογικής
καταλογογράφησης
από
απομακρυσμένους
χρήστες.
20
Κοινωνικές
ταξονομίες
και
σημασιολογικός
ιστός
Ο
σημασιολογικός
ιστός
ενδιαφέρεται
για
τις
κοινωνικές
ταξονομίες
ως
ανερχόμενες
οντολογίες
και
βλέπει
τα
συστήματα
συνεργατικών
επισημειώσεων
ως
εναλλακτικούς
μηχανισμούς
για
την
δημιουργία
οντολογιών.
Αναπτύσσονται
μια
σειρά
από
μεθοδολογίες,
αλγόριθμοι
και
εφαρμογές
για
την
αξιοποίηση
των
κοινωνικών
ταξονομιών
υπέρ
του
σημασιολογικού
ιστού.
Παραδείγματα
:
FolkRank
(αλγόριθμος
αναζήτησης
κοινωνικών
ταξονομιών
με
βάση
τη
δομή
των,
βελτιώνοντας
τα
αποτελέσματα
αναζήτησης
και
αναπτύσσοντας
συστάσεις
μέσα
σε
ένα
σύστημα
κοινωνικής
ταξονομίας)
FolksAnnotason
είναι
μέθοδος
αυτόματης
αντιστοίχισης
επισημειώσεων
σε
αντίστοιχες
έννοιες
μιας
προκαθορισμένης
οντολογίας.
Semansc
Halo
algorithm
βελτιώνει
την
αναζήτηση
στο
σύστημα
επισημειώσεων
με
βάση
τη
συχνότητα
των,
υπολογίζει
ομάδες
χρήσιμων
επισημειώσεων
για
να
καθοδηγήσει
την
αναζήτηση
των
χρηστών.
TagOntology
(ένα
σύστημα
δημιουργίας
οντολογιών
από
κοινωνικές
ταξονομίες
(Gruber
2007)
21
Κοινωνικές
ταξονομίες
και
σημασιολογικός
ιστός
(2)
Εφαρμογές
και
μεθοδολογίες
σε
μηχανές
μετα‐αναζήτησης
(Vivisimo),
ή
Grokker,
και
Kartoo.
Ακόμα
στο
SemKey
system
αναπτύσσονται
εφαρμογές
όπως
TagPedia
hžp://
www.tagpedia.org
προσπαθώντας
να
εμπλουτίσουν
με
σημασιολογία
τις
επισημειώσεις
τις
συνδέουν
με
το
Worldnet
και
Wikipedia.
GroupMe!
:
μια
πλατφόρμα
που
διαχειρίζεται
μέσω
των
tags
τους
πόρους
από
το
Flickr
και
URLs
από
το
Google
σε
κοινό
χώρο
FAsTA
(FolksAnnotasons
Tool
Architecture)
ένα
εργαλείο
για
μετατροπή
των
επισημειώσεων
σε
σημασιολογικά
μεταδεδομένα.
Το
Revyu
ένας
ιστότοπος
αξιολόγησης
και
κριτικής
οτιδήποτε
πόρου
στο
διαδίκτυο.
Με
εφαμογή
αλγορίθμων
επιτρέπον
στο
χρήστη
να
αναζητούν
ανθρώπους
με
γνώση
και
εμπειρία
στο
συγκεκριμένο
θέμα.
Τέλος
ο
Mika
(2007)
παρουσιάζει
ένα
μοντέλο
οντολογίας
:
“Actor
–
Concept
–
Instance”
εξετάζοντας
το
στο
πλάισιο
ενός
κοινωνικού
δικτύου
τις
κοινωνικές
ταξονομίες.
Ο
στόχος
όμως
παραμένει
να
συνδυαστεί
η
δημοτικότητα
η
άνεση
και
η
ευκαμψία
των
κοινωνικών
ταξονομιών
με
την
σημασιολογία
και
την
ποιότητα
δομής
των
οντολογιών.
22