You are on page 1of 277

Συστήματα
Οργάνωσης
Γνώσης


Χρήστος
Παπαθεοδώρου
 

Αναπληρωτής
Καθηγητής

Ομάδα
Βάσεων
Δεδομένων
και
Πληροφοριακών
Συστημάτων,


Τμήμα
Αρχειονομίας
–
Βιβλιοθηκονομίας,
Ιόνιο
Πανεπιστήμιο


Εισαγωγικά

  Οργάνωση
Γνώσης:


  περικλείει
κάθε
τύπο
και
μέθοδο
ευρετηρίασης,
περιγραφής,

ταξινόμησης,
διαχείρισης
τεκμηρίων,
που
βοηθούν
στην
ανάκτηση
της

πληροφορίας.

  διανοητική
διαδικασία
που
ενισχύει
την
πρόσληψη
του
κόσμου
μέσω

της
ανάπτυξης
νοητικών
δομών


  οι
νοητικές
δομές
αυξάνουν
την
αξία
της
πληροφορίας
αφού

καθιστούν
ευχερέστερη
την
αναζήτηση
και
τη
διάχυσή
της
στις

κοινότητες
χρηστών


  παρέχει
μια
βαθύτερη
αντίληψη
για
το
θεματικό
περιεχόμενο
του

τομέα
ενδιαφέροντος
των
χρηστών
των
υπηρεσιών
πληροφόρησης

  Συστήματα
Οργάνωσης
Γνώσης
(ΣΟΓ)

  εξελιγμένα
εργαλεία
αναζήτησης
ψηφιακής
πληροφορίας


  ταξινομικά
συστήματα,
καταλόγους
θεματικών
επικεφαλίδων,
αρχεία

καθιερωμένων
ονομάτων,
σημασιολογικά
δίκτυα
και
οντολογίες

2
Προσεγγίσεις
για
την
Οργάνωση

Γνώσης
(1/3)

  Παραδοσιακή:
Τα
συστήματα
ταξινόμησης
που
χρησιμοποιούν
οι
Βιβλιοθήκες
(π.χ.
DDC,

LCC,
UDC)
για
να
οργανώσουν
την
επιστημονική
βιβλιογραφία.
Βασική
αρχή
οργάνωσης

από
τα
γενικότερα
στα
ειδικότερα,
ενώ
τα
αντικείμενα
ταξινομούνται
σε
μια
μοναδική

κατηγορία

  Αναλυτικο‐συνθετική
(πολυεδρική,
facet‐analymcal):
Θεσπίσθηκε
από
τον
Ranganathan,

και
βασίζεται
στην
εφαρμογή
λογικών
αρχών.
Η
θεματική
περιγραφή
ενός
αντικειμένου

μπορεί
να
αναφέρεται
σε
περισσότερες
από
μια
έννοιες.
Οι
έννοιες
αναλύονται
σε

επιμέρους
κατηγορίες
(ανάλυση
εννοιών)
οι
οποίες
συνθέτουν
την
περιγραφή
του

θέματος
(σύνθεση).
Έτσι
το
θέμα
δεν
ταξινομείται
σε
μια
μοναδική
κατηγορία.
Βασικές

κατηγορίες
για
την
ανάλυση
των
θεμάτων
είναι
οι:

  Προσωπικότητα
(Personality):
το
βασικό
διακριτικό
γνώρισμα
που
χαρακτηρίζει
ένα
θέμα
(π.χ.
όνομα)

  Υλικό
(Maver):
το
φυσικό
υλικό
από
το
οποίο
αποτελείται
μια
έννοια

  Ενέργεια
(Energy):
κάθε
ενέργεια
στην
οποία
ένα
θέμα
μπορεί
να
συμμετέχει
(π.χ.
το
ξύλο
στην
επίπλωση)

  Χώρος
(Space):
ο
γεωγραφικός
τόπος
που
μπορεί
αναφέρεται
το
θέμα

  Χρόνος
(Time):

is
the
period
associated
with
a
subject.


Προσεγγίσεις
για
την
Οργάνωση

Γνώσης
(2/3)

  Ανάκτηση
Πληροφοριών:
Προέρχονται
από
το
χώρο
του
full
text
retrieval
και

της
αυτόματης
κατηγοριοποίησης
κειμένων,
με
ικανοποιητικά
αποτελέσματα.

Οι
σημασιολογικές
σχέσεις
βασίζονται
σε
στατιστικές
συσχετίσεις
μεταξύ
των

αντικειμένων
με
βάση
τις
συχνότητες
εμφάνισης
των
λέξεών
τους.

Ακολουθείται
μια
μεθοδολογία
από
τα
ειδικότερα
προς
τα
γενικότερα

(bovom‐up)

  Χρηστοκεντρική:
Οι
σημασιολογικές
σχέσεις
βασίζονται
σε
εμπειρικές

έρευνες
χρηστών
και
όχι
στην
επιστημονική
βιβλιογραφία





  Βιβλιομετρική:
Δύο
αντικείμενα
(τεκμήρια)
συσχετίζονται
εννοιολογικά
όταν

το
ένα

αναφέρει
το
άλλο,
ή
όταν
κάποιο
τρίτο
αντικείμενο
αναφέρει
και
τα

δύο
(co‐citamon).
Είναι
μια
μορφή
κοινωνικής/συνεργατικής
οργάνωσης

γνώσης


4
Προσεγγίσεις
για
την
Οργάνωση

Γνώσης
(3/3)

  Ανάλυση
πεδίου:
Βασίζεται
στην
όσο
πιο
πλούσια
γνώση
του
πεδίου
που

επιτυγχάνεται
από
την
ευρετηρίαση,
την
ανάπτυξη
θησαυρών,
τις
μελέτες

χρηστών,
τις
βιβλιομετρικές
έρευνες
ενός
επιστημονικού
πεδίου


  Επιστημολογικές
προσεγγίσεις
που
βασίζονται
στην
ερμηνευτική
και

σημειωτική
ανάλυση
των
αντικειμένων


  Σύγχρονες
προσεγγίσεις
που
βασίζονται
στην
τεχνολογία
της
ηλεκτρονικής

δημοσίευσης,
όπως
στις
γλώσσες
σημειοθέτησης,
την
αρχιτεκτονική
των

δικτυακών
τόπων,
την
αναπαράσταση
των
αντικειμένων
και
την
τυπολογία

τους
κ.λπ.


Χαρακτηριστικά
Συστημάτων

Οργάνωσης
Γνώσης

  Χρησιμοποιούνται
για
την
οργάνωση
του
υλικού
μιας
συλλογής

τεκμηρίων
σε
θεματικές
κατηγορίες

  Θεωρούν
από
μια
συγκεκριμένη
οπτική
γωνία
μια
συλλογή
και
τα

αντικείμενά
της

  Μια
οντότητα
μπορεί
να
χαρακτηρισθεί
με
διαφορετικούς
τρόπους
ανάλογα

με
το
ΣΟΓ
που
χρησιμοποιείται

  Λειτουργούν
ως
γέφυρα
μεταξύ
του
υλικού
και
των
αναγκών
του
χρήστη

και
καθοδηγούν
/
διευκολύνουν
την
αναζήτηση
του
χρήστη

  Τα
ΣΟΓ
χρησιμοποιούνται
για
τη
συσχέτιση
εννοιών
με
αντικείμενα
μιας

συλλογής
από
εξειδικευμένα
πρόσωπα.
Μια
έννοια
αποδίδεται
σε
ένα

αντικείμενο

  Οι
χρήστες
που
αναζητούν
αντικείμενα
χρησιμοποιώντας
ΣΟΓ,
συνδέουν
τις

έννοιες
που
αντιλαμβάνονται
τον
κόσμο
με
τις
αναπαραστάσεις
τους
στο

ΣΟΓ


6
Συστήματα
Οργάνωσης
Γνώσης
(1/5)


  Κατάλογοι
όρων
:

  Καταλόγοι
καθιερωμένων
ονομάτων
(Authority
Files):
Ελεγχόμενα
λεξιλόγια
των

πολλαπλών
μορφών
ονομάτων
ή
οντοτήτων
ενός
τομέα
ή
πεδίου
(Library
of

Congress
Name
Authority
File,
Gevy
Geographic
Authority
File)

  Γλωσσάρια
(Glossaries):
Κατάλογοι
ονομάτων
συνήθως
ενός
συγκεκριμένου

γνωστικού
τομέα
ή
έργου
με
τους
ορισμούς
τους

  Λεξικά
(Dicmonaries):
Αλφαβητικοί
κατάλογοι
λέξεων,
των
ορισμών
τους,
της

προέλευσης
τους,
των
διαφορετικών
μορφών
τους,
των
συνωνύμων,
κ.λπ.

  Γεωγραφικά
λεξικά
(Gazzevers):
Κατάλογοι
ονομάτων
τοποθεσιών
που

συνοδεύονται
από
τις
γεωγραφικές
συντεταγμένες
τους


Συστήματα
Οργάνωσης
Γνώσης
(2/5)


  Ταξινομικά
συστήματα
και
κατηγορίες
:

  Καταλόγοι
θεματικών
επικεφαλίδων
(Subject
Headings):
Ελεγχόμενα
λεξιλόγια
που

αντιπροσωπεύουν
τα
θέματα
των
αντικειμένων
μιας
συλλογής
με
περιορισμένη

ιεραρχική
διάρθρωση
(LCSH,
MeSH)

  Ταξινομικά
συστήματα,
ταξονομίες
και
σχήματα
κατηγοριοποιήσεων
(Classificamon

Schemes,
Taxonomies,
Categorizamon
Schemes):
Κατατάσσουν
ή
ομαδοποιούν

θέματα
σε
μεγάλες
κατηγορίες
είτε
με
ιεραρχική
διάταξη
είτε
με
χρήση

αλφαριθμητικής
σημειογραφίας
χωρίς
ρητά
εκφρασμένες
τις
σχέσεις
ανάμεσα

στους
όρους
(DDC,
UDC)


8
Συστήματα
Οργάνωσης
Γνώσης
(3/5)


  Κατάλογοι
σχετιζόμενων
όρων
:


  Θησαυροί
(Thesauri):
Υποδεικνύουν
τις
σχέσεις
που
υπάρχουν
ανάμεσα
σε

όρους
και
κύρια
τις
σχέσεις
ιεραρχίας,
ισοδυναμίας
και
τις
σχέσεις

συσχέτισης
(AAT)


  Σημασιολογικά
δίκτυα
(Semanmc
networks):
Δομούν
τις
έννοιες
και
τους

όρους
όχι
σε
ιεραρχίες
αλλά
με
τη
μορφή
δικτύου
(με
κόμβους
τις
έννοιες

και
ακμές
τις
μεταξύ
τους
σχέσεις)
ενώ
οι
σχέσεις
ανάμεσα
στους
όρους

είναι
ευρύτερες
σε
σχέση
με
του
θησαυρού
(WorldNet)

  Οντολογίες
(Ontologies):
Είναι
από
τα
πιο
πρόσφατα
συστήματα
και

αναπτύσσονται
κυρίως
στο
πλαίσιο
του
Σημασιολογικού
Ιστού
ως
ειδικά

μοντέλα
εννοιών
(specific
concept
models).
Αναπαριστούν
πολύπλοκες

σχέσεις
ανάμεσα
σε
αντικείμενα
και
περιλαμβάνουν
κανόνες
και
αξιώματα

ενώ
περιγράφουν
τη
γνώση
ενός
συγκεκριμένου
τομέα
(SUMO)


Συστήματα
Οργάνωσης
Γνώσης
(4/5)

  Άλλοι
τύποι
συστημάτων
οργάνωσης
γνώσης
είναι:

  Θεματικοί
χάρτες
(Topic
maps):
Βασίζονται
στην
αρχή
ότι
τα
αντικείμενα
(occurrences)

περιστρέφονται
γύρω
από
δομές
γνώσης
που
είναι
τα
θέματα
(topics)
με
τις
μεταξύ
τους

συσχετίσεις.
Περιγράφουν
δομές
γνώσης
και
η
πλοήγηση
σε
αυτές
οδηγεί
στον
εντοπισμό

αντικειμένων

  Εννοιολογικοί
χάρτες
(Concept
maps):
Οπτική
αναπαράσταση
των
εννοιών
ενός
και
των

σχέσεών
τους.
Οι
έννοιες
αποτελούν
κόμβους
σε
ένα
γράφο
και
συνδέονται
με
ακμές
που

έχουν
ετικέτες
της
μορφής
«εγείρει
το»
,
«έχει
σαν
αποτέλεσμα»,
«απαιτείται
από»,

«συνεισφέρει
σε»



  Βιβλιομετρικοί
χάρτες
(Bibliometric
maps):
Με
βάση
τις
βιβλιογραφικές
αναφορές
που

συνυπάρχουν
σε
επιστημονικά
τεκμήρια
(co‐citamon
analysis)
μπορούν
να
κατασκευαστούν

χάρτες
που
αποτυπώνουν
την
τρέχουσα
γνώση
(Atlas
of
Science)

  Δακτύλιοι
συνωνύμων
(synonym
ring):
Συνώνυμοι
όροι
συνδέονται
μεταξύ
τους
και

σχηματίζουν
«κλάσεις
ισοδυναμίας».
Οι
κλάσεις
ισοδυναμίας
έχουν
προσδιορισθεί

αναλυτικά
(π.χ.
Syntacmc
variants,
Phrase
variants,
Quasi‐synonyms,
Synonyms,
Absolute

synonyms,
Cognimve
synonyms,
Contextual
synonyms)


10
Συστήματα
Οργάνωσης
Γνώσης
(5/5)


  Υπερκείμενο

  Τυπολογίες
(Typologies):
Το
υλικό
ταξινομείται
με
βάση
τον
τύπο
του
(π.χ.
οι
τύποι

των
ΣΟΓ)

  Βιβλιογραφικοί
κατάλογοι
(OPAC,
WebOPAC)

  Κοινωνικές
ταξονομίες
(folksonomies,
folk+taxonomy):
Επισημειώσεις

περιεχομένου
(αντικειμένων)
με
σκοπό
τη
θεματική
κατηγοριοποίησή
του
που

εισάγονται
από
κοινότητες
χρηστών
και
έχουν
τη
μορφή
ετικετών/λέξεων
κλειδιών

(tags,
tag
cloud)
χωρίς
μεταξύ
τους
συσχετίσεις
(Delicious)


  Βιβλιογραφίες,
εγκυκλοπαίδιες,
γλώσσες
και
συμβολικά
συστήματα

  Εννοιολογικά
συστήματα
και
θεωρίες
(για
συγκεκριμένα
επιστημονικά
πεδία)

  Κανόνες,
μοντέλα
δρώντων
και
διεργασιών,
τομείς
κοινωνικής
δραστηριότητας


11

Ορισμοί
(1/2)

  Εννοια
(concept)
είναι
η
νοητική
αντιπροσώπευση
ενός
ιδιαίτερου

αντικειµένου
ή
ενός
συνόλου
ιδιαίτερων
αντικειµένων
που
έχουν
ορισµένες

κοινές
ιδιότητες

  Ορος
(term)
είναι
µια
λέξη
ή
φράση
που
αντιπροσωπεύει
και
προσδιορίζει

µια
έννοια.

  Πλάτος
(έκταση)
µίας
έννοιας:
το
σύνολο
όλων
των
αντικειµένων
στα
οποία

αντιστοιχεί
µία
έννοια

  π.χ.
{ακαδηµαϊκές,
σχολικές,
ειδικές,
…}
βιβλιοθήκες

  Βάθος
(ένταση)
µίας
έννοιας:
το
σύνολο
των
ουσιωδών
χαρακτηριστικών

που
συνιστούν
την
έννοια

  π.χ.
στην
έννοια
{ξύλινο
τραπέζι}
το
χαρακτηριστικό
της
σύνθεσης

(ξύλινο)
αποτελεί
ουσιώδες
χαρακτηριστικό
και
διακρίνει
την
έννοια

τραπέζι

  Ατοµική
έννοια:
αντιστοιχεί
σε
ένα
µόνο
αντικείµενο
{νήσος
Κέρκυρα}

  Γενική
έννοια:
αντιστοιχεί
σε
δύο
ή
περισσότερα
αντικείµενα
που
αποτελούν

οµάδα
µε
κοινές
ιδιότητες
{νήσος}

12
Ορισμοί
(2/2)


  Χαρακτηριστικό
(avribute,
characterismc)
µιας
έννοιας
είναι

οποιαδήποτε
από
τις
ιδιότητες
ή
σχέσεις
που
συνιστούν
µία

έννοια


  (π.χ.
ένα
χαρακτηριστικό
της
έννοιας
δέντρο
είναι
ο
ξυλώδης
κορµός)

  Ενδογενή
χαρακτηριστικά
(σχήµα,
µέγεθος,
υλικό,
χρώµα)

  π.χ.
οδοντωτός
(τροχός),
κόκκινο
(φως),
ξύλινο
(τραπέζι)

  Εξωγενή
χαρακτηριστικά
(προέλευση,
προορισµός,
λειτουργία,

θέση,
εφευρέτης,
τοποθέτηση)

  π.χ.
πεντελικό
(µάρµαρο),
ευκλείδεια
(γεωµετρία),
δοκιµαστικός
(σωλήνας)


13

Ορισμοί
εννοιών

  Ορισµός
µιας
έννοιας
είναι
η
λεκτική
περιγραφή
της

έννοιας
για
διαφοροποίηση
από
συναφείς
έννοιες

  Εντατικός:
περιγράφει
το
βάθος
µιας
έννοιας

  π.χ
ισόπλευρο
τρίγωνο
είναι
το
τρίγωνο
που
έχει
και
τις
3

πλευρές
ίσες

  Εκτατικός:
απαρίθµηση
των
υποτασσόµενων
εννοιών,

πλάτος

  π.χ.
τρίγωνο:
ισόπλευρο,
ισοσκελές,
σκαληνό

  Εµµεσος:
ορισµός
µέσω
παραδείγµατος


14
Λεξιλόγιο


  Σύνολο
όρων

  Eλεγχόμενο
λεξιλόγιο
(controlled
vocabulary):
μόνο

συγκεκριμένοι
όροι
ή
είδη
όρων
επιτρέπεται
να
συμμετέχουν

στις
δηλώσεις
θεμάτων

  Ονομάζονται
περιγραφείς
(descriptors)
ή
προτιμώμενοι
όροι
(preferred

terms)


15

Πρότυπα

  ΕΛΟΤ
402.
Αρχές
και
µέθοδοι
ορολογίας

  ΕΛΟΤ
414.
Περιλήψεις
για
τις
δηµοσιεύσεις
και
την
τεκµηρίωση

  ΕΛΟΤ
561‐1.
Λεξιλόγιο
Ορολογίας

  ΕΛΟΤ
720
:1993.
Φύλλα
περιλήψεων
σε
περιοδικές
εκδόσεις.
(ISO
5122‐1979)

  ΕΛΟΤ
743.
Μετατροπή
του
ελληνικού
αλφαβήτου
µε
λατινικούς
χαρακτήρες

  ΕΛΟΤ
1213:1994.
Ευρετήριο
ενός
δηµοσιεύµατος.
(
ISO
999‐1996)

  ΕΛΟΤ
1312:1993
(ΣΕΠ).
Θεµατική
ανάλυση
τεκµηρίων
:
Μέθοδοι
εξέτασης

τεκµηρίων,προσδιορισμού
των
θεμάτων
τους
και
επιλογής
των
όρων
ευρετηρίασης

(ISO
5963‐1985)

  ΕΛΟΤ
1321:1993
(ΣΕΠ)
Κατευθυντήριες
οδηγίες
για
τη
συγκρότηση
και
ανάπτυξη

µονόγλωσσων
θησαυρών.
(ISO
2788‐1986)

  ΕΛΟΤ
1381‐1
(ΣΕΠ).
Λεξιλόγιο
‐
Μέρος
1
:
Βασικές
έννοιες.
(ISO
5127/1‐1983)

  ΕΛΟΤ
1381‐2‐1997(ΣΕΠ)
Λεξιλόγιο
‐
Μέρος
2
:
Παραδοσιακά
τεκµήρια.
(ISO

5127/2‐1983)


18
Βιβλιογραφία

  Gail
Hodge,
«Systems
of
Knowledge
Organizamon
for
Digital
Libraries:

Beyond
Tradimonal
Authority
Files»,
hvp://www.clir.org/pubs/reports/
pub91/contents.html

  Networked
Knowledge
Organizamon,
Systems/Services,
hvp://
nkos.slis.kent.edu/

  Knowledge
organizamon
systems

(KOS),
hvp://www.db.dk/bh/
lifeboat_ko/CONCEPTS/knowledge_organizamon_systems.htm

  Knowledge
Organizamon,

hvp://www.db.dk/bh/lifeboat_ko/concepts/
knowledge_organizamon.htm

  Birger
Hjørland,
“What
is
Knowledge
Organizamon
(KO)?”
,
Knowledge

Organiza6on.
Interna6onal
Journal
devoted
to
Concept
Theory,

Classifica6on,
Indexing
and
Knowledge
Representa6on
35(2/3):pp.
86‐101

(υπάρχει
στο
eclass)

  Birger
Hjørland,
“Semanmcs
and
Knowledge
Organizamon”,
Annual
Review

of
Informa6on
Science
and
Technology
41:367
‐405
(υπάρχει
στο
eclass)


19

Πρότυπα
Μεταδεδομένων

Περιεχόμενα


  Εισαγωγή
στα
μεταδεδομένα

  Dublin
Core

  MODS

  Αρχειακά
μεταδεδομένα
–
Encoding

archival
descripkon
(EAD)


 2

Ψηφιακά
τεκμήρια

  Οτιδήποτε
υπάρχει
σε
ψηφιακή
μορφή
και

προσπελαύνεται
με
τη
βοήθεια
υπολογιστή

 κείμενα

 εικόνες,
κινούμενες
εικόνες

 ήχος,
βίντεο

 ιστοσελίδες,
προγράμματα


3

Τύποι
δεδομένων
Ηλεκτρονικών
τεκμηρίων


Κείμενο
 Κινούμενες
εικόνες
 Βίντεο



.DOC
 .ANI
 .AVI

.TXT
 .FLI
 .MOV

.RTF
 .FLC
 .MPG

.PDF
 .GIF
 .QT


Εικόνες
 Ηχος
 Ιστοσελίδες

.BMP
 .WAV
 .HTM


.GIF
 .MID
 .HTML



.JPEG
 .SND
 .XML

.TIFF
 .AUD
 Προγράμματα

.EPS
 .COM

.EXE

 4


Πώς
εντοπίζουμε
και

ανακτούμε
τα
ψηφιακά

τεκμήρια;


5

Μεταδεδομένα

  Τα
μεταδεδομένα
είναι
δομημένη
πληροφορία
που

περιγράφει,
εξηγεί,
εντοπίζει
ή
διευκολύνει
την
ανάκτηση,
τη

χρήση
ή
την
διαχείριση
ενός
ψηφιακού
τεκμηρίου

  Συχνά
καλούνται
(«δομημένα»)
«δεδομένα
για
άλλα

δεδομένα»
ή
«πληροφορία
για
άλλη
πληροφορία»

  "Metadata
is
machine
understandable
informakon
about
web

resources
or
other
things."
(Tim
Berners‐Lee)

  Διάφορα
πρότυπα
μεταδεδομένων
ανάλογα
με
το
είδος
του

τεκμηρίου
και
τις
πληροφοριακές
ανάγκες

  ανακάλυψη:
περιγραφικά,
π.χ.
τίλος,
συγγραφέας

  διατήρηση:
τεχνικά,
π.χ.
τύπος
υλικού,
ψηφιακής
μορφή



6


Που
Βρίσκονται
τα
Μεταδεδομένα


  Στην
ετικέτα
ενός
CD
(ορατά)

  Στη
σελίδα
τίλου
ενός
τεκμηρίου
(ορατά)

  Στην
κορυφή
μιας
ιστοσελίδας
(ορατά)

  Σε
διαφορετική
εγγραφή,
π.χ.
στον
κατάλογο
μιας

βιβλιοθήκης
(ορατά)


  Στην
ηλεκτρονική
μορφή
μέσα
στον
πόρο
(ορατά)

  Ενσωματωμένα
στο
ηλεκτρονικό
δημοσίευμα

(μέρος
της
κωδικοποίησης,
μη
ορατά)


7

Παράδειγμα:
Ιστοσελίδα
σε
HTML

<HTML>
<BODY>
<p> Fiction:</p>
<UL><LI>Author: Milan Kundera</LI>
<LI>Title: Identity</LI>
<LI>Published: 1998</LI>
</UL>
<p> Science: </p>
<UL><LI>Author: Richard Feynman</LI>
<LI>Title: The Character of Physical Law</LI>
<LI>Hardcover</LI>
</UL>
</BODY>
</HTML>
8


Πώς
θα
κάνουμε
«ορατά»
τα

μεταδεδομένα
από
τους

υπολογιστές
(μηχαναγνώσιμη

πληροφορία);


9

XML:
κωδικοποίηση

μεταδεδομένων

  Η
HTML
ελέγχει
τον
τρόπο
εμφάνισης
των

ηλεκτρονικών
τεκμηρίων,
δεν
ασχολείται
με
τη

φύση
τους,
την
περιγραφή
τους,
τη
σημασία
τους

  eXtensible
Markup
Language
(XML)
αποτελεί
μια

εξαιρετικά
απλή
διάλεκτο
της
γλώσσας
Standard

Generalized
Markup
Language
(SGML),
η
οποία

αναπτύχθηκε
με
στόχο
να
διευκολύνει
το

χειρισμό,
επεξεργασία,
διακίνηση
και

αποθήκευση
τεκμηρίων
στον
Παγκόσμιο
Ιστό

(web)


10


Αναγκαιότητα
Προτύπων

Μεταδεδομένων

  Χρειάζονται
για
να
έχουμε
κοινή
αντίληψη
των

δεδομένων
που
περιγράφονται
με
αυτά

  Μας
προσφέρουν
μεγαλύτερη
δομή

  Μας
περιορίζουν
στην
ευελιξία

  Επεξεργάζονται
ευκολότερα
μηχανικά

  Είναι
αναγκαιότερα
σε
ψηφιακά
αντικείμενα

  Αφού
στα
συμβατικά
έχουμε
αισθητήρια
αντίληψη
για

αναγνώριση,
θέση,
θέματος,
…


11

Κόστος
και
Λειτουργικότητα

Αναζήτησης
και
Μεταδεδομένων


AACR2/MARC
Λειτουργικότητα
κατά
την
χρήση


Dublin Core Qualified

Dublin Core Simple

Μέτα-µηχανές αναζήτησης
Google (µε τεχνικές συνδέσµων)
Απλές µηχανές αναζήτησης

Κόστος
δημιουργίας
και
χρήσης

12


Πόσα
Πρότυπα
Μεταδεδομένων

  Δεν
υπάρχει
ένα
μοναδικό
διεθνές
πρότυπο
για

μεταδεδομένα,
γιατί:

  Χρειαζόμαστε
διαφορετικά
επίπεδα
πολυπλοκότητας,

από
πλούσιες
μέχρι
απλές
περιγραφές

  Υπάρχουν
κάμποσα
σχήματα
μεταδεδομένων,

για

διαφορετικά
επίπεδα
και
απαιτήσεις

  Επεκτείνουμε
τα
υπάρχοντα
πρότυπα


13

Πρότυπα
Μεταδεδομένων


  AACR2

  MARC

  Text
Encoding
Inikakve
‐
TEI
Header
(1990)

  Dublin
Core
‐
DC
(1995)

  Encoded
Archival
Descripkon
–
EAD
(1996)


  Open
Archives
Inikakve
‐
OAI

  Visual
Resources
Associakon
Core–
VRA
(1997)

  Federal
Geographic
Data
Commi–ee
for
Digital
Geospakal


Metadata
–
FGDC

  Data
Documentakon
Inikakve
–
DDI
(1997)

  Gateway
to
Educakonal
Materials
–
GEM
(1999)

  Government
(Global)
Informakon
Locator
Service
‐
GILS

  Metadata
Encoding
and
Transmission
Standard
–
METS

  Metadata
Object
Descripkon
Schema
–
MODS

  Computer
Interchange
of
Museum
Informakon
–
CIMI

  Interoperability
of
Data
in
E‐Commerce
Systems
–
INDECS

  Online
Informakon
Exchange
–
ONIX
(2000)

  Extended
Markup
Language
–
XML,
MARCXML

14

  Australian
Recordkeeping
Metadata
Schema
(RKMS)


Κατηγορίες
Μεταδεδομένων

  Διαχειριστικά
(administra]ve)


Με
πληροφορίες
για
τη
διαχείριση
και
διατήρηση
της
εγγραφής,
όπως

δημιουργία,
μετατροπή
και
σχέσεις
με
άλλες
εγγραφές,
π.χ.
κάτοχος,

ημερομηνίες
δημιουργίας
ή/και
μεταβολής,
γλώσσα
εγγραφής,

διαχείρισης
δικαιωμάτων
κλπ.


Δομικά
(structural)


Με
πληροφορίες
για
την
αποθήκευση
και
παρουσίαση


Περιγραφικά
(descrip]ve)


Με
πληροφορίες
που
περιγράφουν
ιδιότητες
και
περιεχόμενο
του

αντικειμένου
στο
οποίο
αναφέρεται
η
εγγραφή
και
συμβάλλουν
στην

ανάκτηση
(ανακάλυψη),
π.χ.
τίτλος,
συγγραφέας,
θεματικοί
όροι,

περίληψη


15

Κατηγορίες
Μεταδεδομένων


Σύμφωνα
με
την
IFLA:


  Administrakve

  Descripkve

  Analykcal
(subject)

  Rights
management

  Technical

  Other,
as
determined

16


Φακοί
και
Όψεις

  Όλες
οι
κατηγοριοποιήσεις
παρέχουν
και
πρέπει
να

παρέχουν
μια
μεροληπτική
όψη
της

πραγματικότητας

  Κάθε
όψη
τονίζει
συγκεκριμένα
χαρακτηριστικά
και

κρύβει
άλλα

Geospakal

Rights

Museum

 17
Επιλογή
μεταδεδομένων

Είναι
σημαντικό
να
καθοριστούν


  το
πεδίο
εφαρμογής

  τα
κριτήρια


  οι
μορφές
των
ψηφιακών
αντικειμένων
και

συλλογών

  ο
βαθμός
λεπτομέρειας
στην
περιγραφή
και

παρουσίαση

προκειμένου
να
αξιολογηθούν
τα
πρότυπα

μεταδεδομένων
και
επιλεγεί
το
κατάλληλο.

Ερώτηση:
Ποια
μπορεί
να
είναι
τα
βασικά
στοιχεία
που
θα

περιγράφουν
μια
δεδομένη
ψηφιακή
συλλογή;


18


Απάντηση
(παράδειγμα)

Υποχρεωτικά

  Τίτλος

  Συγγραφέας

  Θέμα

  Ηλεκτρονική
διεύθυνση

Επιθυμητά

  Εκδότης

  Ημερομηνία

  Κατηγορία

  Σχόλια

Αλλα
σχετικά
με
συλλογή

  Αναγνωριστικά

  Γλώσσα

  Έκδοση

  Πνευματικά
δικαιώματα

  ………………………….

19

Τα
Μεταδεδομένα
είναι
Γλώσσα

  Τα
σχήματα
μεταδεδομένων
είναι
γλώσσες
για
να

γίνονται
δηλώσεις
για
τους
πόρους:

  «Το
βιβλίο»
έχει
Title
"Gone
with
the
Wind"

  «Η
ιστοσελίδα»
έχει
Publisher
"Springer
Verlag"

  Οι
όροι
των
λεξιλογίων
(στοιχεία)
ορίζονται
με

πρότυπα
–
όπως
το
Dublin
Core

  Οι
γραμματικές
των
μεταδεδομένων
περιορίζουν
τις

δηλώσεις
και
τα
μοντέλα
δεδομένων
που
μπορεί
να

χρησιμοποιηθούν
–
κάνοντας
όμως
τη
σημασία
τους

πιο
έκδηλη
και
σαφή


20


Τα
Μεταδεδομένα
ως
Γλώσσα

  Διαφορετικές
κοινωνίες
(περιγραφής
πόρων)
μιλούν

διαφορετικές
γλώσσες

  Π.χ.
Τι
γλώσσες
περιγράφουν
Ιατρική
σε
Ελλάδα
και

Αγγλία;

Η
Ιατρική
ορολογία
είναι
κοινή.

  Και
οι
φυσικοί
ομιλητές
των
διαφορετικών
γλωσσών

πρέπει
να
επικοινωνήσουν
…

  Και
οι
τουρίστες
(και
οι
ομιλητές
των
διαφορετικών

γλωσσών)
μαθαίνουν
να
«μιλούν
πρωτόγονα»
για
να

επικοινωνήσουν


21

Κανόνες
Γραμματικής
DC

υπονοούµενο Τιµή ιδιότητας
µία από 15
ρήµα (κατάλληλη
ιδιότητες
περιγραφή)
υπονοούµενο DC:Creator
DC:Title
υποκείµενο DC:Subject
DC:Date...

Ο πόρος έχει ιδιότητα X

εξειδικευτές
(επίθετα)

Παραδείγματα
Γραμματικής
DC


Ο πόρος έχει Subject "Languages -- Grammar"

Ο πόρος έχει Date "2000-06-13"


Οι
Γλώσσες
Εξελίσσονται
με
τη
Χρήση

  Αναπόφευκτα,
οι
γλώσσες
αντιστέκονται
στην
σταθερότητα

  Οι
άνθρωποι
«επεκτείνουν»
τους
αυθεντικούς
ορισμούς

  Οι
υλοποιητές
παρεξηγούν
την
επιδιωκόμενη
σημασία
ή

χρήση
των
στοιχείων


  Οι
υλοποιητές
χρησιμοποιούν
τοπικούς
όρους
και
εκφράσεις

  Αν
η
εφαρμογή
δεν
ταιριάζει
με
το
πρότυπο,
το
πρότυπο

συχνά
«προσαρμόζεται»
να
ταιριάζει
στην
εφαρμογή



24


Dublin
Core

Το
Πρότυπο
«Dublin
Core»

  Προτυποποίηση

  ISO
15836‐2003

  US:
NISO
Z39.85‐2001

  Ευρώπη:
αναγνώριση
από

το
CEN/ISSS
Workshop

Agreement
13874‐2000

  Συστήνεται
ανταλλαγή
με

RDF/XML


26


Χαρακτηριστικά
του

«Dublin
Core»


  «Dublin
Core»
σημαίνει
«Dublin,
Ohio»
/
OCLC

  Πρωτοβουλία
για
να
βελτιώσει
την
ανακάλυψη

πόρων
στο
Διαδίκτυο

  Κοινός
παρονομαστής
για
επικοινωνία
/

διαλειτουργικότητα

  Έναυσμα
για
σύγκλιση
των
προτύπων

  Επεκτάσιμο,
για
να
καλύψει
τις
επιπρόσθετες

ανάγκες
ανακάλυψης
πόρων
των
διαφορετικών

εφαρμογών
/
περιοχών

27

Dublin
Core
–
Simple

  Το
Dublin
Core
έχει
15
στοιχεία.
Κάθε
ένα
από
αυτά

είναι
προαιρετικό
και
επαναλαμβανόμενο

  Τα
15
στοιχεία
χωρίζονται
σε
3
κατηγορίες:

  Περιεχόμενο:

 Περιγράφουν
το
αντικείμενο

  Πνευματική
Ιδιοκτησία:

 Περιγράφουν
το
copyright
και
τη
δημιουργία

  Στιγμιότυπο:

 Περιγράφουν
την
εισαγωγή
και
διαχείριση


28


DC
–
Περιεχόμενο

  Τίτλος
/
Title
–
(ονομασία
πηγής)

  
Θέμα
/
Subject,
π.χ.
λέξεις‐κλειδιά,
ταξινομικοί
κωδικοί

  
Περιγραφή
/
Descrip]on

  Π.χ.
περίληψη,
περιεχόμενα,
περιγραφή
εικόνας

  
Πηγή
(ή
«Προέλευση)
/
Source
–
(παραγωγής)

  
Γλώσσα
/
Language
–
(του
περιεχομένου)

  
Σχέση
/
Rela]on
–
(αναφορά
σε
σχετική
πηγή)

  Π.χ.
έκδοση
του
…

  
Κάλυψη
/
Coverage
–
(γεωγραφική
ή
χρονική)

29

DC
–
Πνευματική
Ιδιοκτησία


  Δημιουργός
/
Creator
–
(πρόσωπο,
οργανισμός,

υπηρεσία)

  Εκδότης
/
Publisher
–
(πρόσωπο,
οργανισμός,
υπηρεσία)

  Συντελεστής
(ή
«Συνεργάτης»
ή
«Υπεύθυνος

συμβολής»)
/
Contributor
–
(πρόσωπο,
οργανισμός,

υπηρεσία
που
συμβάλλει
στο
περιεχόμενο)

  Π.χ.
μεταφραστής,
εικονογράφος,
κριτής

  Δικαιώματα
/
Rights
–
(κείμενο
σχετικά
με
την

πνευματική
ιδιοκτησία)


30


DC
–
Στιγμιότυπο

  Ημερομηνία
/
Date

  Π.χ.
δημιουργίας,
έκδοσης,
μετάφρασης,
πρόσκτησης,

καταλογογράφησης,
…

  Τύπος
/
Type
–
(κατηγορία,
σχετικά
με
το
περιεχόμενο)

  Π.χ.
ποίημα,
λεξικό,
so¡ware,
home‐page

  Μορφότυπο
/
Format
–
(φυσική
ή
ψηφιακή
μορφή)

  Π.χ.
Macintosh‐so¡ware,
pdf,
html,
διαστάσεις,

διάρκεια

  Αναγνωριστικό

(ή
Προσδιοριστής
ή
Κωδικός

Ταύτισης)
/
Iden]fier

  Μοναδικό
προσδιοριστικό,
π.χ.
URL,
ISBN,
…

31

Στόχοι
του
Dublin
Core

  Απλότητα
δημιουργίας
και
διατήρησης

  Μη
ειδικοί
να
δημιουργούν
περιγραφικές
εγγραφές
για

αποτελεσματική
ανάκτηση
σε
δικτυωμένο
περιβάλλον

  Κοινά
κατανοητή
(διαθεματική)
σημασιολογία

  Σύγκλιση
κοινών,
περισσότερο
γενικών
στοιχείων

  Αυξημένη
ορατότητα
και
προσβασιμότητα

  Κατάλληλο
και
για
τον
μη
ειδικό
της
αναζητητής

  Τον
«ψηφιακό
τουρίστα»


32


Χρήση
του
Dublin
Core

  Είναι
βασικός
πυρήνας
στοιχείων

  Δεν
είναι
υποκατάστατο
σε
πλουσιότερα

περιγραφικά
πρότυπα


  Παρέχει
15
«παράθυρα»
ή
ευρύχωρα
«καλάθια»

από
πλουσιότερη
περιγραφή
πόρων


  Φανερώνει
πλούσιες
περιγραφές
σε
απλή
μορφή

  Σημασιολογικά
σταυροδρόμια,
αντιστοιχίσεις
σε

υπάρχοντα
δεδομένα


33

Τα
Στοιχεία
Μεταδεδομένων
του

Dublin
Core

  Διεπιστημονική
ομοφωνία
σε
απλά
σύνολα
στοιχείων
για

ανακάλυψη
πόρων

  15
στοιχεία
(πεδία
μεταδεδομένων)

  όλα
προαιρετικά

  όλα
επαναλαμβανόμενα

  Δεν
προορίζεται
για
περιγραφή
περίπλοκων
πόρων

  Η
αρχική
ιδέα
των
«απλών
αντικειμένων
–
σαν
τεκμήρια»

  Απλότητα
στη
σημασιολογία,
ευκολία
χρήσης

  Παρέχει
βασική
«σημασιολογική
διαλειτουργικότητα»

  Μεταξύ
επιστημονικών
περιοχών,
μεταξύ
γλωσσών

  Δεν
παρέχει
λεπτομερείς
κανόνες
καταλογογράφησης

  Επιτρέπει
επεκτασιμότητα
–
σε
άλλες
κατηγορίες
πόρων

34


Dublin
Core
Qualified

Dublin
Core
–
Qualified

Ως
επέκταση
του
απλού
(simple
ή
unqualified)

Dublin
Core
έχουμε
το
εξειδικευτικό
(qualified)

Dublin
Core,
που
προσφέρει:

Βελτίωση
της
σημασιολογικής
ακρίβειας
του
Dublin

Core
ορίζοντας
τους
εξειδικευτές
(qualifiers)

  Εξειδίκευση
του
στοιχείου
(element
refinement)

  Για
περισσότερη
λεπτομέρεια
στην
περιγραφή

  Σύστημα
κωδικοποίησης
(encoding
scheme)

  Σαν
χρήση
απλών
κανόνων
καταλογογράφησης


36


Ποικιλίες
Εξειδικευτών:


Εξειδίκευση
Στοιχείων


  Προσφέρει
μεγαλύτερη
λεπτομέρεια
σε
αυτόν

που
τη
χρειάζεται

  Κάνει
την
σημασία
ενός
στοιχείου
στενότερη
ή

πιο
ειδική

  «Date
Created»
και
«Date
Modified»

  «IsReplacedBy
Relakon»
και
«Replaces
Relakon»

  Δεν
την
τροποποιεί
ή
επεκτείνει,
σε
καμία
περίπτωση

  Αν
το
λογισμικό
δεν
καταλαβαίνει
κάποιο

εξειδικευτή,
μπορεί
με
ασφάλεια
να
τον

αγνοήσει!


37

Dublin
Core:
μη
Εξειδίκευση

Στοιχείων

  Creator

  Subject

  Publisher

  Contributor

  Type

  Idenkfier

  Source

  Language

  Rights


38


Dublin
Core:
Εξειδίκευση
Στοιχείων
(1/2)

Στοιχείο
 Εξειδίκευση

Title
 Alternakve

Descripkon
 Table
Of
Contents

Abstract

Date
 Created

Valid

Available

Issued

Modified

Format
 Extent

Medium

Coverage
 Spakal

Temporal

39

Dublin
Core:
Εξειδίκευση
Στοιχείων
(2/2)


Στοιχείο
 Εξειδίκευση

Relakon
 Is
Version
Of

Has
Version

Is
Replaced
By

Replaces

Is
Required
By

Requires

Is
Part
Of

Has
Part

Is
Referenced
By

References

Is
Format
Of

Has
Format

40



Κωδικοποίηση
Τιμών
(encoding
schemes)

  Δηλώνει
ότι
μια
τιμή
είναι

  Ένας
όρος
από
ελεγχόμενο
λεξικό
(π.χ.,
Library
of

Congress
Subject
Headings)

  Χαρακτήρες
μορφοποιημένοι
με
συγκεκριμένο
τρόπο

(π.χ.,
«2003‐05‐02»
σημαίνει
«2
Μαΐου»,
όχι
«5

Φεβρουαρίου»)

  Ακόμα
και
αν
ένα
σχήμα
δεν
είναι
γνωστό
από
τον

ερμηνευτή
(λογισμικό),
η
τιμή
πρέπει
να
είναι

«κατάλληλη»
και
χρησιμοποιήσιμη
για
ανακάλυψη

πόρων

41

Dublin
Core:
μη
Κωδικοποίηση
Τιμών


  Title

  Creator

  Descripkon

  Publisher

  Contributor

  Rights


42


Κωδικοποίηση
Τιμών
(1/2)

Στοιχείο
 Σχήμα
κωδικοποίησης


Date
 W3C‐DTF

DCMI

Type
 DCMI
Type
Vocabulary


Format
 IMT


Idenkfier
 URI


Source
 URI


Language
 ISO
639‐2

RFC
1766

Relakon
 URI


43

Κωδικοποίηση
Τιμών
(2/2)

Στοιχείο
 Σχήμα
κωδικοποίησης


Subject
 LCSH

MeSH

DDC

UDC

LCC

Coverage
 DCMI
Point

ISO
3166

DCMI
Box

DCMI
Period

W3C‐DTF


44


Κωδικοποίησης
Τιμών
του
«Type»

  Text
(βιβλία,
άρθρα,
email,
fax,
…)

  Image
(εικόνες,
κινούμενες
εικόνες,
διαγράμματα,
…)

  Sound
(μουσικό
CD,
αρχείο
μουσικής,
ομιλία,
…)

  Interackve
Resource
(υπηρεσίες
συζήτησης,
…)

  Service
(τραπεζικές
υπηρεσίες,
υπηρεσία
Z3950,
…)

  So¡ware
(λογισμικό
υπολογιστή)

  Dataset
(πίνακες,
βάσεις
δεδομένων,
…)

  Event
(συνάντηση,
έκθεση,
συνέδριο,
δίκη,
γιορτή,
…)

  Colleckon
(συλλογή
τεκμηρίων)

45

Παραδείγματα
Dublin
Core


Κωδικοποίηση
Dublin
Core
σε
HTML

  Οι
κανόνες
σύνταξης
των
μεταδεδομένων
υπαγορεύονται

από
τις
γλώσσες
κωδικοποίησης:
HTML,
XML,
…

  Το
πρόθεμα
DC
πριν
από
ένα
στοιχείο
δεδομένων

προσδιορίζει
ότι
αυτό
ορίζεται
με
το
πρότυπο
Dublin
Core

  Γενικά,
η
σύνταξη
είναι
ως
εξής:


<meta
name
=
“PREFIX.ELEMENT_NAME”
lang=“LANG”










scheme=“SCHEME”
content
=
“ELEMENT_VALUE”>

  Για
παράδειγμα:

<meta
name
=
“DC.Title”
content
=
“Το
λίγο
του
κόσμου”>

<meta
name
=
“DC.Creator”
content
=
“Δημουλά,
Κική”>


47

Παράδειγμα,
HTML
με
DC

<html>

<head>

<ktle>Το
λίγο
του
Κόσμου
</ktle>

<meta
name
=
“DC.Title”

content
=
“Το
λίγο
του
κόσμου”>

<meta
name
=
“DC.Creator”
content
=
“Δημουλά,
Κική”>

<meta
name
=
“DC.Publisher”
content
=
“Στιγμή”>

<meta
name
=
“DC.Date.Issued”
content
=
“1990”>

<meta
name
=
“DC.Language”
scheme
=
“ISO639‐2”
content
=
“gre”>

</head>

<body><pre>


 …Υπήρξα
περίεργη
και
μελετηρή.
…

</pre></body>

</html>


48


Dublin
Core
σε
XML

S.
Abiteboul,
P.
Buneman,
D.
Suciu
“Data
on
the
Web:
From
Relaeons
to

Semistructured
Data
and
XML”
Morgan
Kaufmann
Publishers,
2000.

‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐

<?xml
version="1.0"
encoding="UTF‐8"?>

<book






xmlns:dc="h–p://purl.org/dc/elements/1.1/"






xmlns:isbn
="h–p://www.isbn.org/def">



 <dc:ktle>
Data
on
the
Web:
From
Relakons
to
Semistructured
Data
and
XML</dc:ktle>


 <dc:creator>
S.
Abiteboul</dc:creator>



 <dc:creator>
P.
Buneman</dc:creator>


 <dc:creator>
D.
Suciu</dc:creator>


 <dc:publisher>Morgan
Kaufmann
Publishers
<dc:publisher>
 


 <dc:date>2000</dc:date>



 <dc:type>Text
</dc:type>




 <isbn:number>0‐201‐06673‐4</isbn:number>

</book>


49

Dublin
Core
–
Επεκτασιμότητα

  Η
αρχιτεκτονική
του
Dublin
Core
υποστηρίζει
πιο

εξελιγμένες
λύσεις
μεταδεδομένων

  Αλλά
προσοχή:
προτιμάμε
επέκταση
του
DC
ή
επιλογή

άλλων
πλουσιοτέρων
σχημάτων;

  Έχουμε
επεκτάσεις
του
Dublin
Core
σε

εξειδικευμένους
τομείς
(domain‐specific)

  Ομάδες
εργασίας
(του
DCMI)
αναπτύσσουν
Προφίλ

Εφαρμογών
(applicaeon
profiles)
για
ειδικούς
τομείς


50


Προσαρμογή
Μεταδεδομένων

  Τα
μεταδεδομένα
προσαρμόζονται
σε

πολλαπλές
παραλλαγές
/
ποικιλίες

  Αποτυπώνοντας
την
ανομοιομορφία
των
δημιουργών

και
διατηρητών
μεταδεδομένων

  Προσφέροντας
για
κάθε
κοινότητα
(συγκεκριμένο

χώρο)
εξειδικευμένη
λειτουργικότητα,
δημιουργία,

διαχείριση,
πρόσβαση,
…

  Τηρώντας
τα
αντίστοιχα
πρότυπα
…

  Μεγαλύτερη
εξειδίκευση
=
μεγαλύτερη

λειτουργικότητα
=
λιγότερη
διαλειτουργικότητα!


51

Τι
είναι
το
Προφίλ
Εφαρμογής

  Ένα
σχήμα
μεταδεδομένων
που

ενσωματώνει
ένα

σύνολο
στοιχείων
από
ένα
ή
περισσότερα
σύνολα

στοιχείων
μεταδεδομένων
(ή
λεξιλογίων
ή
χώρους

ονομάτων
–
namespaces)

  Ένα
σύνολο
από
πολιτικές
που
ορίζουν
πώς
τα

στοιχεία
πρέπει
να
εφαρμόζονται
στο
πεδίο
της

εφαρμογής

  Ένα
σύνολο
οδηγιών
που
ξεκαθαρίζουν
τις
πολιτικές

που
αφορούν
τα
στοιχεία


52



Λεξιλόγια
και
Προφίλ
Εφαρμογών

  Το
Λεξιλόγιο
δηλώνει
όρους
και
ορισμούς

  Λεξιλόγιο
Dublin
Core
=
Πρότυπο
Dublin
Core

  Το
Προφίλ
Εφαρμογής
επανα‐χρησιμοποιεί

όρους
από
ένα
ή
περισσότερα
λεξιλόγια

  Μπορεί
να
συνδυάζει
όρους
από
πολλαπλά
λεξιλόγια

  Μπορεί
να
προσαρμόζει
(εξειδικεύει)
ορισμούς
για

τοπικούς
σκοπούς
ή
εξειδικευμένους
τομείς
(domain‐
specific)

  Όλοι
οι
όροι
πρέπει
να
ορίζονται
στα
λεξιλόγια

  Μπορεί
να
περιλαμβάνει
τοπικά
ορισμένα
λεξιλόγια


53

Συμπεράσματα

  Χρήση
προτύπων
και
καθιερωμένων
κανόνων

  Όχι
αυτοσχεδιασμοί
στην
περιγραφή
των
δεδομένων

  Έστω
και
να
φαινομενικά
επαρκούν
για
την

εφαρμογή

  Δεν
φτάνει
να
δουλεύει
μια
εφαρμογή

  Πρέπει
να
μπορεί
να
δια‐λειτουργεί
στο
μέλλον


54


Metadata
Object
Descrip]on

Schema
(MODS)

Dublin
Core

  15
elements
+
qualifiers

  Metadata
container
&
exchange
medium

  Απλό,
με
μεγάλη
επιρροή
σε
έργα
ψηφιακών
βιβλιοθηκών

  Διπλή
προσέγγιση
του
σημασιολογικού
εύρους
(fields
,

qualifiers)

  Σημασιολογική
ευρύτητα
στοιχείων
(π.χ.
Creator:
authors,
editors,

κ.α.)

  Τα
qualifiers
εμποδίζουν
τη
διαλειτουργικότητα

  MODS:
ακρίβεια
και
διαλειτουργικότητα


58


MODS

  Metadata
Object
Descripkon
Schema

  Library
of
Congress
Network
Development
and
MARC

Standards
Office

  Περιγράφει
τη
μορφή
του
περιεχομένου

  19
elements,
64
sub‐elements

  Επεκτείνει
το
σύνολο
των
στοιχείων
ενσωματώνοντας
άλλα

XML
documents

  Υποσύνολο
του
MARC
αλλά
όχι
με
αριθμητικά
πεδία

  Όλα
τα
στοιχεία
και
τα
γνωρίσματα
αντιστοιχούν
σε
MARC
21
fields

  Crosswalk
MODS
‐
MARCXML


59

MODS
top
level
elements

ktleInfo
 
 
 note

name

 
 
 
 subject

typeOfresource
 
 Classificakon

 

genre
 
 
 
 relatedItem

 

originInfo
 
 
 locakon

language
 
 
 accessCondikon

 

physicalDescripkon
 
 extension
(δήλωση
χρήσης


 
 
 
 
 στοιχείων
άλλου
προτύπου

abstract

 
 
 recordInfo

 

tableOfContents

 
 idenkfier

targetAudience

60


A†ributes

  ID
δίνει
κωδικό
στο
element
για
αναφορές
σε
αυτό

  type

  <name
type="personal">Christos<name>

  lang,
xml:lang
κωδικοί
από
το
iso639‐2b,
δεν
υπάρχει
αντίστοιχο
στο
MARC
21

  <descrip]on
lang="eng">District
Commissioner</descrip]on>

  <]tleInfo
xml:lang="fr"
type="translated">

  translitera]on

  encoding
για
ημερομηνίες

  w3cd)
για
ISO
8601
YYYY‐MM‐DD.


  iso8601
YYYYMMDD.


  marc
εφαρμόζεται
μόνο
στο
στοιχείο
<dateIssued>


  Point:
για
ημερομηνίες
με
τιμές
start
και
end

  xlink:
<abstract
xlink:href=
"h–p://www.ojp.usdoj.gov/bjs/abstract/cchrie98.htm"/>


61

MODS
Lite
(1/2)

<ktleInfo>






<ktle>


<name>






<namePart>


<typeOfResource>
text,
cartographic,
mulkmedia

<genre>
εξειδίκευση
του
<typeOfResource>


<originInfo>
προέλευση
του
αντικειμένου

<dateIssued>,
<dateCreated>,
<dateCaptured>,
<dateOther>


<publisher>


<language>


<physicalDescripkon>

<internetMediaType>
sub‐element
του
<physicalDescripkon>,
MIME
type

<extent>
sub‐element
του
<physicalDescripkon>

<form>


<abstract>


<tableOfContents>
τα
περιεχόμενα
του
αντικειμένου

<note>

62


MODS
Lite
(2/2)

<subject>
όροι
από
taxonomy



<topic>
sub‐element
του
<subject>,
θεματικός
όρος



<temporal>
sub‐element
του
<subject>,
χρονικά
διαστήματα



<geographic>
sub‐element
του
<subject>,
γεωγραφικοί
όροι,
γεωγραφική
ιεραρχία



<cartographics>
sub‐element
του
<subject>,
χωρικά
δεδομένα,
κλίμακες
κλπ

<classificakon>
το
ταξινομικό
σύστημα

<relatedItem>
για
τα
μέρη
μιας
συλλογής

<idenkfier>


<locakon>






<url>


<accessCondikon>
περιορισμοί
πρόσβασης
(MARC21
506,
540)

<recordInfo>
τρόπος
δημιουργίας
του
MODS
record


63

]tleInfo:
υποχρεωτικό

  αντιστοιχεί
στα
DC
Creator,
Contributor
ή
MARC
21
1XX,
7XX

  A–ributes

  type
abbreviated
(MARC
21
field
210),
translated
(242,
246),
alternaeve

(246,
740),
uniform
(130,
240,
730)


  authority
ο
τίτλος
ελέγχεται
από
ένα
record
σε
ένα
authority
file
(e.g.

authority="naf").


  displayLabel
φαίνεται
πρόσθετο
κείμενο
(MARC
21
field
246
subfield
$i)


  Sub‐elements

  <ktle>
χωρίς
γνώρισμα
αντιστοιχεί
στο
245
MARC
21
field

  <subktle>
MARC
21
fields
242,
245,
246
subfield
$b

  <partNumber>
MARC
21
fields
130,
240,
242,
243,
245,
246,
247,
730,

740
subfield
$n.

  <partName>
MARC
21
fields
130,
240,
242,
243,
245,
246,
247,
730,
740

subfield
$p

  <nonSort>
το
κείμενο
που
βρίσκεται
σε
αυτές
τις
ετικέτες
δεν

λαμβάνεται
υπ’
όψη
στην
ταξινόμηση

64


Name

  A–ributes

  type
personal,
corporate,
conference

  authority,
ID,
lang,
xml:lang,
xlink,
script,
translitera]on

  Sub‐elements

  <namePart>
type:date,
family,
given,
termsOfAddress

  <affilia]on>,
<role>

<name
type="personal">



 <namePart
type="termsOfAddress">Dr.</namePart>



 <namePart>Brown,
B.
F.</namePart>



 <affiliakon>Chemistry
Dept.,
American
University</affiliakon>



 <role>




 
 <roleTerm
type="text">creator</roleTerm>



 
 <roleTerm
type="code">cre</roleTerm>



 </role>



 <role>




 
 <roleTerm
type="text">author</roleTerm>



 
 <roleTerm
type="code">aut</roleTerm>



 </role></name>

65

Παράδειγμα
–
βιβλίο
(1/3)

<?xml
version="1.0"
encoding="UTF‐8"
?>


<mods



 <ktleInfo>


 
 <ktle>Sound
and
fury
:</ktle>


 
 


<subTitle>the
making
of
the
punditocracy
/</subTitle>



 </ktleInfo>


 <name
type="personal">




 
 <namePart>Alterman,
Eric</namePart>



 
 <role>




 
 
 <roleTerm
type="text">creator</roleTerm>





 
 </role>




 </name>




 <typeOfResource>text</typeOfResource>





 <genre
authority="marc">bibliography</genre>



 <originInfo>


 
 <place>



 
 
 <code
authority="marc"
nyu</code>





 
 
 <text
>Ithaca,
N.Y</text>





 
 </place>



66


Παράδειγμα
–
βιβλίο
(2/3)


 
 <publisher>Cornell
University
Press</publisher>





 
 <dateIssued>c1999</dateIssued>





 
 <dateIssued
encoding="marc">1999</dateIssued>





 
 <issuance>monographic</issuance>





 </originInfo>


 
<language
authority="iso639‐2b"
type="code">eng</language>


 
<physicalDescripkon>




 
 <form
authority="marcform">print</form>





 
 <extent>vii,
322
p.
;
23
cm.</extent>





 </physicalDescripkon>




 <note
type="statement
of
responsibility">Eric
Alterman.</note>





 <note>Includes
bibliographical
references
(p.
291‐312)
and
index.</note>



 <subject
authority="lcsh">




 
 <geographic>United
States</geographic>





 
 <topic>Poli]cs
and
government</topic>





 
 <temporal>20th
century.</temporal>





 </subject>


67

Παράδειγμα
–
βιβλίο
(3/3)


 <classificakon
authority="lcc">PN4888.P6
A48
1999</classificakon>





 <classificakon
edikon="21"
authority="ddc">071/.3</classificakon>



 <recordInfo>




 
 <recordContentSource>DLC</recordContentSource>





 
 <recordCreakonDate
encoding="marc">990730</recordCreakonDate>





 <recordChangeDate
encoding="iso8601">20000406144503.0</recordChangeDate>





 <recordIdenkfier>11761548</recordIdenkfier>




 </recordInfo>



</mods>


68


Παράδειγμα
–
χάρτης
(1/3)

<?xml
version="1.0"
encoding="UTF‐8"
?>

<mods>




<ktleInfo>




 <ktle>Campbell
County,
Wyoming
/</ktle>







</ktleInfo>




<name
type="corporate">




 <namePart>Campbell
County
Chamber
of
Commerce</namePart>







</name>






<typeOfResource>cartographic</typeOfResource>







<genre
authority="marc">map</genre>





<originInfo>


 <place>




 
 <placeTerm
authority="marccountry"
type="code">wyu</placeTerm>





 </place>


 <place>




 
 <placeTerm
type="text">[Gille†e,
Wyo.]</placeTerm>





 </place>







 <publisher>Campbell
County
Chamber
of
Commerce</publisher>




 69

Παράδειγμα
–
χάρτης
(2/3)



 <dateIssued>[1982?]</dateIssued>







 <dateIssued
encoding="marc">1982</dateIssued>








 <issuance>monographic</issuance>







</originInfo>




<language>




 
 <languageTerm
authority="iso639‐2b"type="code">eng</languageTerm>







</language>‐





<physicalDescripkon>




 <extent>1
map
;
33
x
15
cm.</extent>







</physicalDescripkon>






<note
type="statement
of
responsibility">this
map
reproduced
by
Campbell
County
Chamber

of
Commerce.</note>







<note>In
lower
right
corner:
Kintzels‐Casper.</note>




<subject
authority="lcsh">




 <geographic>Campbell
County
(Wyo.)</geographic>





 <topic>Maps</topic>







</subject>






<classificakon
authority="lcc">G4263.C3
1982
.C3</classificakon>

70


Παράδειγμα
–
χάρτης
(2/3)




<recordInfo>




 <recordContentSource>DLC</recordContentSource>





 <recordCreakonDate
encoding="marc">830222</recordCreakonDate>





 <recordChangeDate
encoding="iso8601">19830426000000.0</recordChangeDate>





 <recordIdenkfier>5466714</recordIdenkfier>







</recordInfo>



</mods>


71

Encoded
Archival
Descrip]on

(EAD)


Αρχειακά
μεταδεδομένα


Αρχείο
 είναι
 το
 σύνολο
 των
 τεκμηρίων
 ανεξαρτήτως



χρονολογίας,
σχήματος
και
ύλης
που
έχει
δεχθεί
ή
παραγάγει

οποιοδήποτε
 φυσικό
 ή
 νομικό
 πρόσωπο,
 οποιοσδήποτε

οργανισμός,
 δημόσιος
 ή
 ιδιωτικός,
 στα
 πλαίσια
 των

δραστηριοτήτων
του.



73

Αρχείο

Υπό-αρχείο Υπό-αρχείο Φάκελος Σειρά

Σειρά Σειρά Φάκελος

Υπό-σειρά Τεκµήριο

Υπό-σειρά

Φάκελος

Τεκµήριο

74


Εργαλεία
έρευνας
(Finding
aids)


  Τελικό
προϊόν
της
αρχειακής
περιγραφής

  Πληροφοριακό
εργαλείο
το
οποίο
περιλαμβάνει

μεταδεδομένα
που
εξυπηρετούν
την
αναζήτηση,

διαχείριση
και
ερμηνεία
ενός
αρχείου
και
εξηγούν
το

περιβάλλον
δημιουργίας
του


75

Ξεκινώντας...

  Απαραίτητες
πληροφορίες

  Τίτλος

  Όνομα
δημιουργού
και
σκοπός
δημιουργίας


  Ημερομηνίες

  Μοναδικός
αριθμός
ταυτοποίησης

  Διαδικασία
πρόσκτησης

  Περιορισμοί
πρόσβασης
και
/
ή
αναπαραγωγής

  Υλικό
που
έχει
αποκοπεί
από
το
κύριο
μέρος



76


EAD

  Περιγραφικά
μεταδεδομένα

  Έμπνευση:
Text
Encoding
Inikakve
(TEI,
1987)

  Πρώτη
προσπάθεια:
Πανεπιστήμιο
Μπέρκλεϋ
της
Καλιφόρνια
(1993)

  SGML/XML
DTD

  EAD
version
1.0:
1998

  EAD
version
2002:
η
νέα
έκδοση

  Η
ανάπτυξη
του
EAD
ξεκίνησε
από
τις
ΗΠΑ

  Γρήγορα
υπήρξε
ενδιαφέρον
από
τη
παγκόσμια
αρχειακή
κοινότητα


  Society
of
American
Archivists
(h–p://www.archivists.org/)
και
Library
of

Congress
(h–p://www.loc.gov/ead/)


77

Περιλαμβάνει
επισκόπηση
του
αρχείου

(<did>),
διαχειριστικές
και

συμπληρωματικές
πληροφορίες
(π.χ.

<ead>
 <bioghist>,
<accessrestrict>
κτλ),

περιγραφή
συστατικών
μερών
(<dsc>)

<ead>
<eadheader> <frontmatter> <archdesc>
υποχρεωτικό προαιρετικό υποχρεωτικό

Πληροφορίες
για
το
εργαλείο
 Χρησιμοποιείται
για
την
παροχή

έρευνας
και
όχι
για
το
αρχείο.
 πληροφοριών
έκδοσης,
όπως
της

Μεταδεδομένα
ηλεκτρονικού
 σελίδας
τίτλου
του
έντυπου

εργαλείου
έρευνας
 εργαλείου
έρευνας
ή
άλλων

προκαταρτικών
πληροφοριών
 78


<eadheader>

  Υποχρεωτικό
στοιχείο

  Βασισμένο
στο
TEI
header

  Πληροφορίες
για
το
εργαλείο
έρευνας
και
όχι
για
το

αρχείο

  Μεταδεδομένα
ηλεκτρονικού
εργαλείου
έρευνας

  «Ηλεκτρονική
σελίδα
τίτλου»



79

<eadheader>


<ead>
<eadheader>
<eadid> <filedesc> <profiledesc> <revisiondesc>

80


<eadheader>

  <eadid>

  Υποχρεωτικό
στοιχείο

  Κωδικός
ταύτισης
του
εργαλείου
έρευνας

  <filedesc>

  Υποχρεωτικό
στοιχείο

  Βασικές
βιβλιογραφικές
πληροφορίες
για
το
εργαλείο
έρευνας

  <ktlestmt>,
<edikonstmt>,
<publicakonstmt>,
<seriesstmt>,

<notestmt>


81

<eadheader>

  <profiledesc>

  Πληροφορίες
για
την
κωδικοποίηση
του
εργαλείου
έρευνας

  <creakon>,
<langusage>,
<descrules>


  <revisiondesc>

  Πληροφορίες
για
αλλαγές
στο
εργαλείο
έρευνας

  <list>,
<change>


82


<archdesc>

  Υποχρεωτικό
στοιχείο

  Εργαλείο
έρευνας

  Περιλαμβάνει


  Επισκόπηση
του
αρχείου
(<did>)

  Διαχειριστικές
και
συμπληρωματικές
πληροφορίες
(π.χ.
<bioghist>,

<accessrestrict>
κτλ)

  Περιγραφή
συστατικών
μερών
(<dsc>)


83

 <archdesc>

 <accessrestrict>  <accruals>
 <acqinfo>  <altformavail>
 <appraisal>  <arrangement>
 <bibliography>  <bioghist>
 <controlaccess>  <custodhist>
 <dao>  <daogrp>
 <descgrp>  <did>
 <dsc>  <fileplan>
 <index>  <note>
 <odd>  <originalsloc>
 <otherfindaid>  <phystech>
 <prefercite>  <processinfo>
 <relatedmaterial>  <runner>
 <scopecontent>  <separatedmaterial>
 <userestrict>
84


<archdesc>

  <did>

  Υποχρεωτικό
στοιχείο

  Εμφανίζεται
και
μέσα
στην
περιγραφή
των
συστατικών
μερών

(<c>
και
<c01>
‐
<c12>)

  Βασικές
πληροφορίες
για
το
σύνολο
του
αρχείου
(υψηλότερο

επίπεδο)

  <uni¹tle>,
<originakon>,
<langmaterial>,
<physdesc>,

<unitdate>,
<unikd>,
<abstract>,
<physloc>,
<repository>
...


85

<archdesc>

  <accessrestrict>

  Διαθεσιμότητα
του
αρχείου

  <acqinfo>

  Πηγή
πρόσκτησης
και
συνθήκες
πρόσκτησης

  <bioghist>

  Βιογραφία
ή
διοικητική
ιστορία
δημιουργού


  <controlaccess>

  Σημεία
πρόσβασης

  <corpname>,
<famname>,
<geogname>,
<persname>,
<subject>,

<ktle>,
<genreform>
...

86


<archdesc>

  <scopecontent>

  Επισκόπηση
περιεχομένου
του
αρχείου
(σε
μορφή
κειμένου)

  <separatedmaterial>

  Υλικό
από
την
ίδια
πηγή
που
έχει
αποκοπεί
φυσικά
ή

εκκαθαριστεί
από
το
αρχείο

  <userestrict>


  Πληροφορίες
για
τις
συνθήκες
που
επηρεάζουν
τη
χρήση
του

αρχείου
εφόσον
έχει
επιτραπεί
η
πρόσβαση


87

<archdesc>

  <dsc>

  Προαιρετικό
στοιχείο

  Αναλυτική
περιγραφή
του
αρχείου

  Περιγραφή
από
το
γενικό
στο
ειδικό

  Συστατικά
μέρη:
<c>
ή
<c01>
‐
<c12>



88


<archdesc>

  Για
τη
σύνδεση
με
ένα
ή
περισσότερα
ψηφιακά
αντικείμενα

  <daogrp>
Digital
Archival
Object
Group


  <daodesc>
Digital
Archival
Object
Descripkon


  <daoloc>
Digital
Archival
Object
Locakon

<daogrp>




<daodesc>







<head>Image
Sampler</head>







<p>Explanatory
paragraph</p>




</daodesc>




<daoloc
href="//images/Baker109.jpeg">







<daodesc>










<p>Ella
Baker,
head‐and‐shoulders
portrait</p>







</daodesc>




</daoloc>

</daogrp>


89

EAD
–
Γνωρίσματα


  Πρόσθετες
πληροφορίες
για
τα
στοιχεία

  Μεταδεδομένα
για
τα
στοιχεία

  Επεξεργασία
από
λογισμικό


  «Κωδικοποιημένα
δεδομένα»

  Τιμές

  Σταθερές

  Προτεινόμενες

  Ανεξάρτητες



90


Γνωρίσματα

  level


  Ιεραρχικό
επίπεδο
του
τεκμηρίου
που
περιγράφεται

  <archdesc>
(Υποχρεωτικό),
<c>
και
<c01>
‐
<c12>

  Τιμές:
colleckon,
fonds,
class,
recordgrp,
series,

subfonds,
subgrp,
subseries,
file,
item,
otherlevel

  π.χ.
<archdesc
level=“fonds”>



 
 


<c
level=“item”>



 
 


<c02
level=“subseries”>


91

Γνωρίσματα


  type


  Διαθέσιμο
για
αρκετά
στοιχεία

  <unitdate>
(bulk,
inclusive,
other)

  <archdesc>
(inventory,
register,
other)

  <dsc>
(analykcover,
combined,
in‐depth,
othertype)


92


Γνωρίσματα

  audience
(external,
internal)


  countrycode
(π.χ.
GR)

  datechar
(π.χ.
creakon,
accumulakon,
ή
modificakon)

  findaidstatus
(π.χ.
“edited‐full‐dra¡”
)


  relatedencoding
(π.χ.
MARC
21)

  encodinganalog
(π.χ.
500)

  langcode
(π.χ.
gre)

  mainagencycode
(π.χ.
ELIA)

  normal
(π.χ.
1756/1868)


93

Παράδειγμα

<archdesc
level=“fonds”>


 <did>


 
 <uni¹tle>Αρχείο
Γραμματείας
/
Υπουργείου
επί
των
Οικονομικών
</uni¹tle>


 
 <unikd
countrycode=“GR”
repositorycode=“GAK”>256.12</unikd>


 
 <unitdate
normal=“1833/1862”>1833‐1862</unitdate>


 
 <langmaterial>


 
 
 <language
langcode=“fre”>Κυρίως
γαλλικά</language>


 
 
 <language
langcode=“gre”>και
δευτερευόντως

 
 
 
 
Ελληνικ

 
 </langmaterial>


 
 <originakon>


 
 
 <corpname>Ανάκτορα,
Γραμματεία
/
Υπουργείο
επί
των

 
 
 Οικονομικ

 
 </originakon>


 </did>


94


<accessrestrict><p>Δεν
υπάρχουν
περιορισμοί
πρόσβασης
</p>
</accessrestrict>

<acqinfo><p>Η
πρόσκτηση
από
τα
Γ.Α.Κ.
πολλών
αρχείων
του
δημόσιου
τομέα
του

19ου
αιώνα
ήταν
ιδιαίτερα
δυσχερής...
</p>
</acqinfo>


<bioghist><p>Στις
25
Ιανουαρίου
/
1
Φεβρουαρίου
1833
καθιερώθηκε,
με
διάταγμα

της
Αντιβασιλείας,
οι
διευθύνοντες
στα
Υπουργεία
να
φέρουν
τον
τίτλο
του

«Γραμματέως
της
Επικρατείας»...
</p>
</bioghist>

<controlaccess>


 <controlaccess>


 
 <subject>Ελληνική
Επανάσταση</subject>


 
 <subject>Οικονομικά</subject>


 </controlaccess>

</controlaccess>

<scopecontent><p>Το
αρχείο
της
Γραμματείας
διαρθρώνεται
ως
εξής:…</p>
</
scopecontent>

95

<dsc>


 <c01
level=“subfonds”>


 
 <did>


 
 
 <uni¹tle>Υπο‐αρχείο
Ανακτόρων</uni¹tle>


 
 
 <unitdate>1833‐1844</unitdate>
 
 


 
 
 <originakon>


 
 
 
 <corpname>Ανάκτορα</corpname>


 
 
 </originakon>


 
 </did>


 
 <c02
level=“series”>


 
 
 <did>


 
 
 
 <uni¹tle>Δάση</uni¹tle>


 
 
 
 <unitdate>1833‐1844</unitdate>


 
 
 </did>


 
 
 <c03
level=“file”>…</c03>


 
 </c02>


 </c01>

</dsc>

96


Εισαγωγή
στη
γλώσσα
XML

HTML

  Απλή
γλώσσα
σημειοθέτησης
(markup
language)

  Το
κείμενο
εμπλουτίζεται
με
“εντολές”
της

γλώσσας
οι
οποίες
ονομάζονται
ετικέτες
(tags),
οι

οποίες
συνήθως
αποτελούνται
από
μια
ετικέτα

αρχής
(start
tag)
και
μια
ετικέτα
τέλους
(end
tag).


  Με
την
HTML
περιγράφουμε
πως
θέλουμε
να

παρουσιάζεται
η
πληροφορία
ενός
κειμένου.



2


Παράδειγμα
HTML:
Λίστα
Βιβλίων

<HTML>
<BODY>
Fiction:
<UL><LI>Author: Milan Kundera</LI>
<LI>Title: Identity</LI>
<LI>Published: 1998</LI>
</UL>
Science:
<UL><LI>Author: Richard Feynman</LI>
<LI>Title: The Character of Physical Law</LI>
<LI>Hardcover</LI>
</UL>
</BODY>
</HTML>
3

Πέρα
από
την
HTML:
XML

  eXtensible
Markup
Language
(XML)
αποτελεί
μια

εξαιρετικά
απλή
διάλεκτο
της
γλώσσας
Standard

Generalized
Markup
Language
(SGML),
η
οποία

αναπτύχθηκε
με
στόχο
να
διευκολύνει
το
χειρισμό,

επεξεργασία,
διακίνηση
και
αποθήκευση
τεκμηρίων
στον

Παγκόσμιο
Ιστό
(web).


  Συνδυασμός
SGML
και
HTML:
Η
ισχύς
της
SGML
με
την

απλότητα
της
HTML.

  Επιτρέπει
τον
ορισμό
νέων
γλωσσών
σημειοθέτησης,
με

τη
βοήθεια

δηλώσεων
τύπων
εγγράφων
(Document
Type

DeclaraXons)
(DTDs).

  Τεχνικά
εγχειρίδια:

  «Extensible
Markup
Language
(XML)
1.0
(Second
Ediwon)»

βρίσκεται
στη
διεύθυνση:
hZp://www.w3.org/TR/REC‐xml


4


Πως
ξεκινά
ένα
XML
τεκμήριο


Ένα
απλό
XML
τεκμήριο:

Δήλωση
XML


<?xml version="1.0"?>
<greeting>Hello, world!</greeting>



Ένα
απλό
στοιχείο

της
XML


5

XML:Στοιχεία
και
γνωρίσματα


Όνομα
 Όνομα

στοιχείου
 γνωρίσματος
 Τιμή


γνωρίσματος


<ετικέτα όνοµα_γνωρ1 = “τιµή1” … όνοµα_γνωρ_n = “τιµή_n”>

Ετικέτα

 ..... περιεχόµενο στοιχείου .....


αρχής


</ετικέτα>

Ετικέτα
τέλους


6


Παράδειγμα
XML
τεκμηρίου

Βιβλιογραφία


  S.
Abiteboul,
P.
Buneman,
D.
Suciu
“Data
on
the
Web:
From
RelaXons
to
Semistructured
Data
and
XML”

Morgan
Kaufmann
Publishers,
2000.

  Norman
Walsh
“A
Guide
to
XML”
World
Wide
Web
Journal,
Vol.
2,
Issue
4,
1997,
pages
97‐107.

‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐

<bibliography>
<book>
<author>S. Abiteboul</author>
<author>P. Buneman</author>
<author>D. Suciu</author>
<title>Data on the Web: From Relations to Semistructured Data and XML</title>
<publisher>Morgan Kaufmann Publishers</publisher>
<year>2000</year>
</book>
<article>
<author>Norman Walsh</author>
<title>A Guide to XML</title>
<journal>World Wide Web Journal</journal>
<volume>2</volume>
<issue>4</issue>
<year>1997</year>
<pages>97-107</pages>
</article>
</bibliography>
7

XML:
Βασικά
Δομικά
Στοιχεία

  Στοιχεία
(elements).

  Οι
βασικές
δομικές
μονάδες
της
XML.

  Ετικέτα
αρχής,
ετικέτα
τέλους.

  Πρέπει
να
είναι
κατάλληλα
εμφωλευμένα.

  Τα
στοιχεία
μπορούν
να
διαθέτουν
γνωρίσματα
(aZributes)

τα
οποία
παρέχουν
επιπλέον
πληροφορία
αναφορικά
με
τα

στοιχεία.

  Οντότητες:
όπως
οι
μακροεντολές,
αναπαριστούν
ένα
συχνά

εμφανιζόμενο
κείμενο.

  Σχόλια.


  Οδηγίες
επεξεργασίας
(processing
instrucXons):

αναπαριστούν
οδηγίες
για
εφαρμογές.

  Δηλώσεις
τύπων
εγγράφων
(Document
type
declaraXons)

(DTDs).

8


Απλά
και
Σύνθετα
Στοιχεία


  Ένα
απλό
στοιχείο
(έχει
για
περιεχόμενο
απλό

κείμενο):

<φοιτητής> Νίκος Νικολάου </φοιτητής>

  Ένα
σύνθετο
στοιχείο
(περιλαμβάνει
άλλα

στοιχεία):
 Περιεχόμενο

στοιχείων

<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>

9

Σύνθετα
Στοιχεία
με
Ανάμικτο

Περιεχόμενο

  Στοιχείο
με
ανάμικτο
περιεχόμενο:

<φοιτητής>
Το όνοµα του φοιτητή είναι <όνοµα>Νίκος</όνοµα>
ενώ το επώνυµο του είναι <επώνυµο>Νικολάου</
επώνυµο>
</φοιτητής>

Ανάμικτο

περιεχόμενο


10


Καλά
Διαμορφωμένο
XML
Τεκμήριο

  Για
να
είναι
ένα
XML
τεκμήριο
καλά

διαμορφωμένο
(well‐formed)
πρέπει
να
υπακούει

στους
κανόνες
σύνταξης
της
XML:

  Οι
ετικέτες
του
τεκμηρίου
πρέπει
να
είναι

ισορροπημένες:

σε
κάθε
ετικέτα
αρχής
πρέπει
να

αντιστοιχεί
μια
ετικέτα
τέλους
η
οποία
να
βρίσκεται

μετά
την
ετικέτα
αρχής
μέσα
στο
τεκμήριο.

  Αν
μια
ετικέτα
αρχής
E1
εμφανίζεται
νωρίτερα
από
μια

ετικέτα
αρχής
E2,
τότε
η
ετικέτα
τέλους
που
αντιστοιχεί

στην
E1
εμφανίζεται
αργότερα
από
την
ετικέτα
τέλους

που
αντιστοιχεί
στην
E2.
Επομένως,
οι
ετικέτες
τέλους

πρέπει
να
εμφανίζονται
με
την
ανάστροφη
σειρά
από

αυτήν
που
εμφανίζονται
οι
αντίστοιχες
ετικέτες
αρχής.



11

Καλά
Διαμορφωμένο
XML
Τεκμήριο

  Καλά
Διαμορφωμένο
XML
Τεκμήριο:
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
  Σειρά
εμφάνισης
ετικετών:

<φοιτητής><όνοµα></όνοµα><επώνυµο></επώνυµο></φοιτητής>

  Λανθασμένη
σειρά
εμφάνισης
ετικετών:

<φοιτητής><όνοµα></όνοµα><επώνυµο></φοιτητής></επώνυµο>

12


Ένα
μεγαλύτερο
παράδειγμα
XML
τεκμηρίου

  Αναπαράσταση
λίστας
φοιτητών
του
ΤΑΒ
σε
μορφή
XML

τεκμηρίου:

<ΤΑΒ>
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
<φοιτητής>
<όνοµα> Πέτρος </όνοµα>
<επώνυµο> Πέτρου </επώνυµο>
</φοιτητής>
<φοιτητής>
<όνοµα> Μίνα </όνοµα>
<επώνυµο> Μίνου </επώνυµο>
</φοιτητής>
...
</ΤΑΒ> 13

Κενά
στοιχεία
στην
XML

  Η
σύνταξη
της
XML
επιτρέπει
κενά
στοιχεία

(empty
elements)
δηλαδή
στοιχεία
με
κενό

περιεχόμενο.


  Τα
κενά
στοιχεία
έχουν
τη
μορφή:

<ετικέτα></ετικέτα>
  Παρέχεται
και
η
ακόλουθη
συντομογραφία
για

τη
σύνταξη
κενών
στοιχείων:

<ετικέτα/>

14


Γνωρίσματα
στην
XML

  Ένα
στοιχείο
της
XML
είναι
δυνατό
να
διαθέτει
ένα
σύνολο
από


γνωρίσματα
(a“ributes).


  Τα
γνωρίσματα
ορίζονται
σαν
ζεύγη
ονομάτων
–
τιμών.

  Τα
γνωρίσματα
τοποθετούνται
στην
ετικέτα
αρχής
του
στοιχείο

στο
οποίο
αναφέρονται.

  Στο
παρακάτω
παράδειγμα
το
γνώρισμα
με
όνομα
ΑΜ

χρησιμοποιείται
για
να
αποτυπωθεί
ο
αριθμός
μητρώου
του

φοιτητή:

Γνώρισμα


<φοιτητής ΑΜ = "12345">
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
15

Γνωρίσματα
στην
XML
(συνέχεια)

  Οι
τιμές
των
γνωρισμάτων
περικλείονται

ανάμεσα
σε

απλά
ή
διπλά
εισαγωγικά.


  Ένα
στοιχείο
είναι
δυνατόν
να
διαθέτει
περισσότερα

του
ενός
γνωρίσματα.

<book isbn="1-55860-622-X" language="English">
<title> Data on the Web </title>
<price currency = "USD"> 100 </price>
</book>
  Ενώ
ένα
στοιχείο
μπορεί
να
διαθέτει
υποστοιχεία
με
το

ίδιο
όνομα,
δεν
επιτρέπεται
σε
περισσότερα
του
ενός

γνωρίσματα
του
να
έχουν
το
ίδιο
όνομα.

  Η
σειρά
με
εμφάνισης
των
γνωρισμάτων
ενός
στοιχείου

δεν
παίζει
κανένα
ρόλο
σε
αντίθεση
με
τη
σειρά

εμφάνισης
των
στοιχείων
που
είναι
σημαντική.


16


Σχόλια

  Τα
σχόλια
(comments)
επιτρέπονται

οπουδήποτε
εκτός
από
το
εσωτερικό
των

ετικετών.


  Ένα
σχόλιο
ξεκινά
με
το
<!--
και
τελειώνει
με

το
-->.


 Παράδειγμα:

<!-- Αυτό είναι ένα σχόλιο -->
  Τα
σχόλια
τοποθετούνται
για
να
κάνουν
το

τεκμήριο
ευανάγνωστο
από
τον
άνθρωπο.


17

Οδηγίες
Επεξεργασίας

  Οι
οδηγίες
επεξεργασίας
(Processing
Instrucwons)
PI

επιτρέπουν
σε
ένα
XML
τεκμήριο
να
περιέχει

οδηγίες
που
απευθύνονται
σε
προγράμματα

εφαρμογών.


  Μια
οδηγία
επεξεργασίας
περιλαμβάνει
το
όνομα

μιας
εφαρμογής
στην
οποία
απευθύνεται,

ακολουθούμενο
από
πληροφορίες
(οδηγίες

επεξεργασίες,
παραμέτρους
κ.λ.π.)
οι
οποίες

θέλουμε
να
περάσουν
στην
εφαρμογή.

  Παράδειγμα:
Η
παρακάτω
οδηγία
επεξεργασίας

απευθύνεται
στην
εφαρμογή
xml‐stylesheet:

<?xml-stylesheet href="book.css" type="text/css"?>
18


CDATA

  Ένα
τμήμα
CDATA
ξεκινά
με
<![CDATA[

και

τελειώνει
με
]]>.


  Το
περιβάλλον
CDATA
χρησιμοποιείται
όταν

θέλουμε
να
συμπεριλαμβάνουμε
ετικέτες
και
άλλα

ειδικά
σύμβολα
τα
οποία
θέλουμε
να
εκληφθούν

απλά
σαν
ακολουθίες
χαρακτήρων

(συμβολοσειρές).

  Παράδειγμα:
Το
ακόλουθο
είναι
ένα
συντακτικά

σωστό
τμήμα
XML
τεκμηρίου:

<![CDATA[ <αρχή> αυτό είναι ένα λανθασµένο στοιχείο </τέλος>]]>

19

Οντότητες
και
αναφορές
οντοτήτων

  Ορισμένοι
χαρακτήρες
έχουν
ειδική
σημασία
στην
XML.


  Ο
χαρακτήρας
<
υποδηλώνει
την
έναρξη
μιας
ετικέτας
ενώ
ο

χαρακτήρας
>
υποδηλώνει
το
τέλος
της
ετικέτας.

  Oι
χαρακτήρες
&,
‘ και
",
έχουν

ειδική
σημασία
στην
XML.


  Η
απευθείας
χρησιμοποίηση
τέτοιων
συμβόλων
στο
κείμενο
που

αποτελεί
το
περιεχόμενο
ενός
στοιχείου
οδηγεί
σε
συντακτικά

λανθασμένα
XML
τεκμήρια.

  Παράδειγμα
1:
Το
παρακάτω
στοιχείο
είναι
συντακτικά
λανθασμένο:

<στοιχείο> Το σύµβολο < δεν µπορεί να εµφανίζεται έτσι </στοιχείο>
αφού
το
< στο
περιεχόμενο
του
θα
εκληφθεί
ως
έναρξη
ετικέτας.


  Η
XML
παρέχει
ενσωματωμένες
οντότητες
οι
οποίες
ονομάζονται

εσωτερικές
οντότητες
(internal
enwwes)
για
την
αναπαράσταση

τέτοιων
συμβόλων
σε
ένα
XML
τεκμήριο
αποφεύγοντας
τα

προβλήματα
σύνταξης.


20


Οντότητες
και
αναφορές
οντοτήτων

(συνέχεια)

  Η
τοποθέτηση
τέτοιων
συμβόλων
σε
ένα
XML
τεκμήριο

γίνεται
μέσω
αναφορών
στις
αντίστοιχες
οντότητες.

Μια
αναφορά
οντότητας
(enwty
reference)
ξεκινά
με
το

σύμβολο
&,
ακολουθείται
από
το
όνομα
της
οντότητας,

και
τελειώνει
με
το
σύμβολο
;.


  Παράδειγμα
2:
το
&lt;
αποτελεί
αναφορά
στην
οντότητα
με

όνομα
lt
που
αναπαριστά
το
<,
ενώ
με
τα
&gt;,

&amp;,


&apos;,

&quot;,
αναφερόμαστε
στις
οντότητες
που

αντιστοιχούν
στα
>,
&,
‘ και
" αντίστοιχα.

  
Παράδειγμα
3:
Το
στοιχείο
στο
Παράδειγμα
1
πρέπει
να

γραφτεί
σαν:

<στοιχείο>Το σύµβολο &lt; δεν µπορεί να εµφανίζεται έτσι</στοιχείο>

21

Οντότητες
και
αναφορές
οντοτήτων

(συνέχεια)

  Οντότητες
XML
μπορούν
επίσης
να
χρησιμοποιηθούν
για
να

αναφερθούμε
σε
κείμενο
που
επαναλαμβάνεται
συχνά.
Στην

περίπτωση
αυτή
οι
οντότητες
παίζουν
το
ρόλο

συντομογραφιών.

  
Επίσης,
οντότητες
μπορούν
να
χρησιμοποιηθούν
για
να

ενσωματώσουμε
το
περιεχόμενο
εξωτερικών
αρχείων.


  Οι
οντότητες
της
κατηγορίας
αυτής
ονομάζονται
και

εξωτερικές
οντότητες
(external
enwwes),
και
θα
πρέπει
να

δηλωθούν
από
το
χρήστη
στο
DTD,
με
τον
τρόπο
που
θα

δούμε
στην
αντίστοιχη
ενότητα.


  Κάθε
οντότητα
θα
πρέπει
να
έχει
ένα
μοναδικό
όνομα.


  Οι
οντότητες
της
XML
μοιάζουν
με
τις
μακροεντολές
των

γλωσσών
προγραμματισμού.


22


Αναφορές
χαρακτήρων

  Οι
αναφορές
χαρακτήρων
(character
references)
έχουν
παρόμοια
μορφή
με

τις
αναφορές
οντότητας.


  Χρησιμοποιούνται
για
την
εισαγωγή
οποιουδήποτε
χαρακτήρα
του
συνόλου

ISO/IEC
10646
σε
ένα
XML
τεκμήριο.
Αυτό
γίνεται
περικλείοντας
το
κωδικό

του
χαρακτήρα
ανάμεσα
σε
&
και
;.


  Αν
η
αναφορά
χαρακτήρα
ξεκινά
με
&#x
τότε
τα
ψηφία
που
ακολουθούν

μέχρι
το
σύμβολο
τερματισμού
; παρέχουν
τη
δεκαεξαδική
αναπαράσταση

του
χαρακτήρα
στο
ISO/IEC
10646.


  Παράδειγμα:
&#x211E;


  Αν
όμως
ξεκινά
απλά
με
το
&#
τότε
τα
ψηφία
που
ακολουθούν
μέχρι
το

σύμβολο
τερματισμού
; παρέχουν
τη
δεκαδική
αναπαράσταση
του

χαρακτήρα
στο
ISO/IEC
10646.


  Παράδειγμα:
&#8478;

  Μέσω
των
αναφορών
χαρακτήρων
μπορούμε
να
εισάγουμε
χαρακτήρες
οι

οποίοι
δεν
είναι
προσπελάσιμοι
από
τις
διαθέσιμες
συσκευές
εισόδου.


23

XML:
Ταυτότητες
Αντικειμένων
(Oids)


και
Αναφορές

<person id=“o555”> <name> John </name>
<children idref=“o123”/>
</person>
<person id=“o456”> <name> Mary </name>
<children idref=“o123”/>
</person>
<person id=“o123” mother=“o456” father=“o555”
>
<name>Jim</name>
</person>
Τα
oids
και
οι
αναφορές
στην
XML
είναι
απλά
σύνταξη

24


Document
Type
Definifon
(DTD)

XML:
Document
Type
Definifons

(DTDs)

  Πλεονέκτημα
της
XML:
επιτρέπει
να
ορίσουμε
και
να
χρησιμοποιήσουμε


στοιχεία,
γνωρίσματα
και
οντότητες
της
αρεσκείας
μας.


  Ένα
έγγραφο
XML
είναι
καλά
διαμορφωμένο
(well‐formed)
αν:

  Το
έγγραφο
ξεκινά
με
ένα
δηλωτικό
XML.

  Διαθέτει
στοιχείο
ρίζα
που
περιέχει
όλα
τα
υπόλοιπα
στοιχεία.


  Όλα
τα
στοιχεία
του
είναι
κατάλληλα
εμφωλευμένα.

  Είναι
χρήσιμο
να
τίθενται
κοινά
αποδεκτοί
κανόνες
που
προδιαγράφουν

συγκεκριμένο
λεξιλόγιο
από
επιτρεπτά
ονόματα
στοιχείων
και
γνωρισμάτων,

και
θέτουν
περιορισμούς
ως
προς
την
πολλαπλότητα
εμφάνισης
των
στοιχείων,

την
μεταξύ
τους
σειρά
κ.λ.π.


  Κάθε
κοινότητα
χρηστών
μπορεί
να
προδιαγράψει
τη
δική
της
XML
διάλεκτο
με

βάση
τις
ανάγκες
των
μελών
της.


  Για
την
επιβολή
τέτοιων
περιορισμών
απαιτείται
ένας
τρόπος

να
περιγραφούν

αυτοί.
Αυτό
μπορεί
να
γίνει
με
τη
βοήθεια
Δηλώσεων
Τύπου
Τεκμηρίων

(Document
Type
Definiwons)
(DTD).


  Δηλώσεις
τύπου
τεκμηρίων:
σύνολα
κανόνων
που
ορίζουν
τα
στοιχεία,
τα

γνωρίσματα
και
τις
οντότητες
που
επιτρέπεται
να
εμφανίζονται
στα
XML

έγγραφα.

26


XML:
Document
Type
Definifons
(DTDs)

(συνέχεια)

  Το
περιεχόμενο
ενός
DTD
παρέχει
(μετα)πληροφορία
στα
προγράμματα

συντακτικής
ανάλυσης
(parsers)
των
XML
τεκμηρίων.
Η
πληροφορία
αφορά

τους
περιορισμούς
σύνταξης
που
πρέπει
να
πληρούν
τα
τεκμήρια
ώστε
να

θεωρούνται
έγκυρα
ως
προς
το
συγκεκριμένο
DTD.


  Έγκυρο
(valid)
XML
τεκμήριο:
αν
συνοδεύεται
από
ένα
DTD
και
είναι
δομημένο

σύμφωνα
με
τους
κανόνες
που
ορίζει
το
DTD.

  Ένα
DTD
λειτουργεί
ως
γραμματική
(grammar)
για
μια
κατηγορία
XML

τεκμηρίων,
αφού
παρέχει
ένα
λεξιλόγιο
(αποδεκτά
ονόματα
στοιχείων
και

γνωρισμάτων)
καθώς
και
σύνολο
από
κανόνες
που
διέπουν
τη
σειρά

εμφάνισης,
το
πλήθος
των
εμφανίσεων
κ.λ.π.
των
στοιχείων
σε
ένα
XML

τεκμήριο
προκειμένου
αυτό
να
θεωρείται
έγκυρο.


  Το
DTD
από
την
οπτική
γωνία
των
βάσεων
δεδομένων
μπορεί
να
εκληφθεί
σαν

σχήμα
(schema)
για
τα
δεδομένα
που
αναπαριστά
το
XML
τεκμήριο,
με
μια

σημασία
παρόμοια
με
αυτή
των
σχεσιακών
βάσεων
δεδομένων.


  Παρόλα
αυτά
ένα
XML
τεκμήριο
δεν
υποχρεούται
να
περιλαμβάνει
(ή
να

συνδέεται)
με
κάποιο
DTD.


27

Παράδειγμα
DTD

  Παράδειγμα
XML
τεκμηρίου
που
κωδικοποιεί
στοιχεία
φοιτητών
του
ΤΑΒ:

<ΤΑΒ>
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
<φοιτητής> ... </φοιτητής>
...
</ΤΑΒ>
  Ένα

DTD
για
το
πιο
πάνω
τεκμήριο:

<!DOCTYPE ΤΑΒ [ -Το
κεντρικό
στοιχείο
είναι
το ΤΑΒ...
<!ELEMENT ΤΑΒ (φοιτητής*)> -Αποτελείται
από
στοιχεία φοιτητής...
<!ELEMENT φοιτητής (όνοµα, επώνυµο)> -Το
στοιχείο φοιτητής περιλαμβάνει


 
 
 
 
 








τα
στοιχεία όνοµα και
επώνυµο...
<!ELEMENT όνοµα (#PCDATA)> -Το όνοµα περιλαμβάνει
χαρακτήρες

<!ELEMENT επώνυµο (#PCDATA)> -Το
επώνυµο περιλαμβάνει


 
 
 
 
 
 








χαρακτήρες....

]>
28


DTD:Δηλώσεις
Τύπου
Στοιχείων

Αυστηρή

Κωδική
λέξη
 περιγραφή
του

ELEMENT
που
 Όνομα
του

στοιχείου
 περιεχομένου

δηλώνει
 του
στοιχείου

έναρξη


δήλωσης

στοιχείου



<!ELEMENT όνοµα_ στοιχείου τύπος_στοιχείου>

29

Δηλώσεις
Τύπου
Στοιχείων

Δήλωση
 Σημασία

R?
 0
ή
1
στιγμιότυπο
του
R


R+
 1
ή
περισσότερα
στιγμιότυπα
του
R


R*
 0
ή
περισσότερα
στιγμιότυπα
του
R


R1,
R2,
…
,
Rn
 1
στιγμιότυπο
του
R1
ακολουθούμενο
από
1

στιγμ.
του
R2,....,ακολουθούμενο
από
1

στιγμ.
του

Rn

R1
|
R2
|
…
|
Rn
 1
στιγμιότυπο
του
R1
ή
του
R2
ή
...
ή
του
Rn


EMPTY
 Κενό
στοιχείο



ANY
 Οτιδήποτε


#PCDATA
 Χαρακτήρες
που
έχουν
υποστεί
συντακτική

ανάλυση

30


DTD:Δηλώσεις
Τύπου
Στοιχείων:

Παράδειγμα

  Με
την
έκφραση:


<!ELEMENT s (a, b?,c*)>

 δηλώνεται
ότι:
κάθε
στοιχείο
με
ετικέτα
s
που

εμφανίζεται
σε
ένα
έγκυρο
XML
τεκμήριο,

περιλαμβάνει
ένα
ακριβώς
στοιχείο
με
ετικέτα
a

ακολουθούμενο
προαιρετικά
από
ένα
το
πολύ

στοιχείο
με
ετικέτα
b,
και
στη
συνέχεια
από

οσοδήποτε
μεγάλο
πλήθος
(μπορεί
και
μηδέν)

στοιχείων
με
ετικέτα
c.



31

DTD:Δηλώσεις
Τύπου
Στοιχείων:

Παράδειγμα

  Με
την
έκφραση:


<!ELEMENT e ((c? , d)* | (d , c)*)>

 δηλώνεται
ότι
κάθε
στοιχείο
με
ετικέτα
e που

εμφανίζεται
σε
ένα
έγκυρο
XML
τεκμήριο,

περιλαμβάνει:


  μια
ακολουθία
από
(μηδέν
ή
περισσότερα)
ζεύγη

στοιχείων
c,
d
από
τα
οποία
το
c
είναι
προαιρετικό,
είτε


  μια
ακολουθία
από
(μηδέν
ή
περισσότερα)
ζεύγη

στοιχείων
d,
c.



32


DTD:Δηλώσεις
Τύπου
Στοιχείων:

Παράδειγμα
(συνέχεια)

Στα
XML
τεκμήρια
που
ακολουθούν
έχουμε
για
ευκολία
θεωρήσει
ότι

τα
στοιχεία
c
και
d
είναι
κενά.
Τα
τεκμήρια
εξετάζονται
ως
προς

την
εγκυρότητα
τους
με
βάση
το
προηγούμενο
DTD.


Έγκυρο
XML
τεκμήριο:

Μη
έγκυρο
XML
τεκμήριο:
<e>
<e>
<d/>
<d/>
<d/>
<c/>
<c/>
<c/>
<d/>
<d/>
<d/>
</e>
</e>
33

Δηλώσεις
Τύπου
Στοιχείων
(συνέχεια)

  Για
να
δηλώσουμε
ότι
το
περιεχόμενο
ενός
στοιχείου

είναι
ακολουθία
χαρακτήρων
χρησιμοποιούμε

δηλώσεις

της
μορφής:

<!ELEMENT όνοµα_στοιχείου (#PCDATA)>
  Η
παράσταση
τύπος_στοιχείου
είναι
επίσης
δυνατό
να

πάρει
μια
από
τις
τιμές
EMPTY
και
ANY
που
σημαίνουν

το
κενό
στοιχείο,
και
το
στοιχείο
με
οποιοδήποτε

περιεχόμενο
αντίστοιχα.


  Αποδεκτές
είναι
επίσης
τιμές
που
αποτελούν
ανάμιξη

#PCDATA
και
ονομάτων
στοιχείων.


  Προσοχή:
ένα
στοιχείο
δεν
επιτρέπεται
να
δηλώνεται

περισσότερο
από
μια
φορά
σε
ένα
DTD.


34


DTD:Δηλώσεις
Λίστας
Γνωρισμάτων

Κωδική
λέξη

Δηλώσεις

ΑTTLIST
που

δηλώνει
έναρξη

 γνωρισμάτων

Όνομα
του

δήλωσης
λίστας
 στοιχείου

γνωρισμάτων



<!ΑTTLIST όνοµα_στοιχείου λίστα_δηλώσεων_γνωρισµάτων>

Τριάδες
της
μορφής:


όνομα_γνωρίσματος
τύπος_γνωρίσματος
προκαθορισμός_τιμής


35

Δηλώσεις
Λίστας
Γνωρισμάτων:

Παράδειγμα

<!ATTLIST φοιτητής ΑΜ CDATA #REQUIRED
ΑΔΤ CDATA #IMPLIED >
  Το
στοιχείο
φοιτητής
έχει
δύο
γνωρίσματα
με
ονόματα

ΑΜ
και
ΑΔΤ.


  Και
τα
δύο
γνωρίσματα
είναι
του
τύπου
CDATA.


  Η
παρουσία
του
γνωρίσματος
ΑΜ
είναι
υποχρεωτική

σε
κάθε
εμφάνιση
του
στοιχείου
φοιτητής
(λόγω
του

#REQUIRED).


  Η
παρουσία
του
γνωρίσματος
ΑΔΤ
δεν
είναι

υποχρεωτική
(λόγω
του
#IMPLIED).

36


Δηλώσεις
Λίστας
Γνωρισμάτων

(συνέχεια)

  Ανάμεσα
στις
πιθανές
τιμές
που
μπορεί
να
πάρει
η
παράμετρος

τύπος_γνωρίσματος
περιλαμβάνονται
και
οι
ακόλουθες:
CDATA,
ID,

IDREF,
IDREFS,
ENTITY,
ENTITIES,
NMTOKEN,
NMTOKENS.


  Τα
γνωρίσματα
του
τύπου
CDATA
μπορούν
να
πάρουν
για
τιμή
οποιοδήποτε

κείμενο
(ακολουθία
χαρακτήρων).


  Τα
γνωρίσματα
του
τύπου
NMTOKEN
είναι
ειδική
περίπτωση
των

γνωρισμάτων
τύπου
CDATA και
μπορούν
να
πάρουν
για
τιμή
μια
απλή
λέξη.

  Τα
γνωρίσματα
του
τύπου
NMTOKENS
μπορούν
να
πάρουν
για
τιμή

πολλαπλές
τιμές
τύπου
NMTOKEN
που
χωρίζονται
μεταξύ
τους
με
κενά.


  Τα
γνωρίσματα
του
τύπου
ENTITY
μπορεί
να
πάρουν
για
τιμή
το
όνομα
μιας

απλής
οντότητας
ενώ
τα
γνωρίσματα
του
τύπου
ENTITIES
μπορούν
να

πάρουν
για
τιμή
πολλαπλές
τιμές
του
τύπου
ENTITY
οι
οποίες
χωρίζονται

μεταξύ
τους
με
κενά.

  Πέρα
από
τις
παραπάνω
τιμές,
η
παράμετρος
τύπος_γνωρίσματος
είναι

δυνατό
να
πάρει
σαν
τιμή
τη
λίστα
των
πιθανών
τιμών
του
γνωρίσματος.

Στην
περίπτωση
αυτή
μιλάμε
για
απαριθμήσιμους
τύπους
γνωρισμάτων

(enumerated
a“ribute
types).



37

Δηλώσεις
Λίστας
Γνωρισμάτων:

Παράδειγμα

  Στη
δήλωση
λίστας
γνωρισμάτων
που
ακολουθεί:

<!ATTLIST book color (red|green|blue) “blue”>

 ορίζεται
ότι:


  Το
στοιχείο
book
έχει
ένα
γνώρισμα
με
όνομα
color.


  Το
γνώρισμα
αυτό
μπορεί
να
πάρει
μια
από
τις
τιμές
red,

green,
blue.


  Σε
περίπτωση
που
το
γνώρισμα
απουσιάζει
από
ένα

στοιχείο
book
θεωρείται
ως
εάν
να
είναι
παρών
και
η
τιμή

του
να
είναι
η
blue
(προκαθορισμένη
τιμή).


38


Δηλώσεις
Λίστας
Γνωρισμάτων

(συνέχεια)

  Τιμές
της
παράμετρου
προκαθορισμός_τιμής:


  Μπορεί
να
πάρει
σαν
τιμή
μια
από
τις
πιθανές
τιμές
του

γνωρίσματος,
με
τη
σημασία
που
αναφέραμε
προηγούμενα.


  Η
τιμή
#REQUIRED
η
οποία
επιβάλει
την
υποχρεωτική

εμφάνιση
του
γνωρίσματος
στο
αντίστοιχο
στοιχείο.


  Η
τιμή
#IMPLIED
η
οποία
υποδηλώνει
ότι
δεν
παρέχεται

κάποια
προκαθορισμένη
τιμή
(και
δεν
είναι
υποχρεωτική
η

εμφάνιση
του
συγκεκριμένου
γνωρίσματος)

  Η
τιμή
#FIXED
ακολουθούμενη
από
μια
συγκεκριμένη

τιμή.
Στην
περίπτωση
αυτή
όλες
οι
εμφανίσεις
του

αντίστοιχου
γνωρίσματος
στο
XML
τεκμήριο
θα
πρέπει
να

έχουν
για
τιμή
τη
συγκεκριμένη
τιμή
που
έχει
δηλωθεί
μετά

από
το
#FIXED.


39

Δηλώσεις
Λίστας
Γνωρισμάτων:

Παράδειγμα


  Με
τη
δήλωση:

<!ATTLIST form method CDATA #FIXED "POST">
  ορίζεται
ότι:

 το
στοιχείο
form
διαθέτει
το
γνώρισμα
method
το

οποίο
είναι
τύπου
CDATA
και
έχει
πάντα
τη
τιμή

POST.



40


Οι
τύποι
γνωρίσματος
ID,
IDREF, και

IDREFS


  Ο
τύπος
ID
δηλώνει
ότι
το
γνώρισμα
παίζει
ρόλο
ταυτότητας
για
το
στοιχείο,

παίρνει
δηλαδή
μοναδική
τιμή
που
προσδιορίζει
μονοσήμαντα
το
κάθε

στοιχείο.


  Δεν
επιτρέπεται
να
υπάρχουν
περισσότερα
του
ενός
στοιχεία
σε
ένα
έγκυρο
XML

τεκμήριο
τα
οποία
να
διαθέτουν
γνώρισμα
τύπου ID
και
να
έχουν
την
ίδια
τιμή

στο
γνώρισμα
αυτό.


  Ο
τύπος
IDREF
δηλώνει
γνωρίσματα
που
παίρνουν
σαν
τιμή
τη
τιμή
του

γνωρίσματος
τύπου ID
κάποιου
άλλου
στοιχείου.


  Ένα
γνώρισμα
του
τύπου
ID
συμπεριφέρεται
όπως
ένα
“κλειδί”
σε
μια

σχεσιακή
βάση
δεδομένων,
ενώ
ένα
γνώρισμα
του
τύπου
IDREF
σαν
ένα

“ξένο
κλειδί”
σε
μια
σχεσιακή
βάση
δεδομένων.


  Ως
IDREFS
δηλώνονται
γνωρίσματα
τα
οποία
παίρνουν
σαν
τιμή
μια
λίστα

τιμών
του
τύπου IDREF οι
οποίες
χωρίζονται
μεταξύ
τους
με
κενά.


  Τα
γνωρίσματα
του
τύπου
ID
πρέπει
να
έχουν
ως
προκαθορισμό
τιμής
είτε

#REQUIRED
είτε
#IMPLIED.


  Κάθε
τιμή
που
παίρνει
ένα
γνώρισμα
τύπου
IDREF,
ή
IDREFS
πρέπει
να

υπάρχει
στο
τεκμήριο
ως
τιμή
ενός
γνωρίσματος
του
τύπου
ID.


41

Οι
τύποι
γνωρίσματος
ID,
IDREF,
και
IDREFS:
Παράδειγμα
DTD

  Ένα
DTD:

<!DOCTYPE
οικογένεια
[

<!ELEMENT
οικογένεια
(πρόσωπο)*>

<!ELEMENT
πρόσωπο
(όνομα,
επώνυμο)>

<!ATTLIST
πρόσωπο
ΑΔΤ

ID
#REQUIRED

































μητέρα


IDREF


#IMPLIED



 
 




















πατέρας
IDREF


#IMPLIED


 
 




















παιδιά



IDREFS
#IMPLIED>

<!ELEMENT
όνομα
(#PCDATA)>

<!ELEMENT
επώνυμο
(#PCDATA)>

]>
 42


Οι
τύποι
γνωρίσματος
ID,
IDREF, και

IDREFS:
Παράδειγμα
(συνέχεια)

  Ένα
XML
τεκμήριο:

<οικογένεια>


 <πρόσωπο
ΑΔΤ
=
"Κ123456"
παιδιά
=
"Μ345678

Ν456789">


 
 <όνομα>
Πέτρος
</όνομα>


 
 <επώνυμο>
Πέτρου
</επώνυμο>


 </πρόσωπο>


 <πρόσωπο
ΑΔΤ
=
"Λ234567"
παιδιά
=
"Μ345678

Ν456789">


 
 <όνομα>
Μαρία
</όνομα>


 
 <επώνυμο>
Πέτρου
</επώνυμο>


 </πρόσωπο>


 <πρόσωπο
ΑΔΤ
=
"Μ345678"
πατέρας
=
"Κ123456"
μητέρα=
"Λ234567"
>


 
 <όνομα>
Γιώργος
</όνομα>


 
 <επώνυμο>
Πέτρου
</επώνυμο>


 </πρόσωπο>


 <πρόσωπο
ΑΔΤ
=
“Ν456789”
πατέρας
=
"Κ123456"
μητέρα=
"Λ234567"
>


 
 <όνομα>
Άννα
</όνομα>


 
 <επώνυμο>
Πέτρου‐Ιωάννου
</επώνυμο>


 </πρόσωπο>


 ....
 ....

</οικογένεια>

43

Δηλώσεις
Οντοτήτων


  Βασική
ιδέα:
οι
οντότητες
αποτελούν
συντομογραφίες
σε
ένα

XML
τεκμήριο
και
επομένως
οι
δηλώσεις
των
οντοτήτων
στην

πραγματικότητα
αποτελούν
ορισμό
των
συντομογραφιών

αυτών.


  Διακρίνουμε
τρία
είδη
οντοτήτων.


  Οι
εσωτερικές
οντότητες
(internal
enwwes),


  Οι
εξωτερικές
οντότητες
(external
enwwes),

  Οι
οντότητες
παραμέτρων
(parameter
enwwes).


  Η
δήλωση
μιας
εσωτερικής
οντότητας
γίνεται
μέσω
μιας

έκφρασης
της
μορφής:

<!ENTITY
όνομα_οντότητας
τιμή_οντότητας>

  Στην
περίπτωση
αυτήν,
το
κείμενο
με
το
οποίο
αντικαθίσταται
η

εμφάνιση
της
οντότητας
αποθηκεύεται
μέσα
στη
δήλωση
της

οντότητας.


44


Δηλώσεις
Οντοτήτων

  Δηλώσεις
εξωτερικών
οντοτήτων:
μαζί
με
το
όνομα
της

οντότητας
δηλώνεται
και
ένα
URI
το
οποίο
θα
πρέπει
να

ακολουθηθεί
προκειμένου
να
βρεθεί
το
κείμενο
το

οποίο
θα
δοθεί
σαν
τιμή
στην
οντότητα.


  Παράδειγμα:
Με
τη
δήλωση:

<!ENTITY TABinfo
SYSTEM "/ionio/information/info.xml">

 ορίζεται
η
οντότητα
TABinfo.Κατά
την
επεξεργασία

του
τεκμηρίου
κάθε
εμφάνιση
του
&TABinfo;
θα

αντικαθίσταται
με
το
περιεχόμενο
του
αρχείου

"/
ionio/information/info.xml".


45

Οι
οντότητες
παραμέτρων

  Οι
οντότητες
παραμέτρων
εμφανίζονται
μόνο
στα

πλαίσια
ενός
DTD.


  Στη
δήλωση
μιας
οντότητας
παραμέτρου
πριν

από
το
όνομα
της
οντότητας
πρέπει
να

τοποθετείται
ο
χαρακτήρας
%.


  Το
ίδιο
σύμβολο
% εμφανίζεται
και
στις

αναφορές
σε
οντότητες
παραμέτρου
αντί
για
το

σύμβολο
&.


  Οι
αναφορές
σε
οντότητες
παραμέτρου

αντικαθίσταται
άμεσα
με
το
κείμενο
που

αποτελεί
την
τιμή
της
οντότητας
το
οποίο

αποτελεί
πλέον
κομμάτι
του
DTD.

46


Σύνδεση
XML
με
DTD


  Προκειμένου
να
εξεταστεί
η
εγκυρότητα

ενός
XML
τεκμηρίου
ως
προς
ένα
DTD,
θα

πρέπει
τα
δύο
αυτά
να
συσχετιστούν.


  Γενικά
έχουμε
δύο
επιλογές.


 Πρώτη
επιλογή:
να
συμπεριλάβουμε
το
DTD

στο
ίδιο
αρχείο
με
αυτό
που
βρίσκεται
το
XML

τεκμήριο.


 Δεύτερη
επιλογή:
να
τοποθετήσουμε
τις

δηλώσεις
του
DTD
σε
ξεχωριστό
αρχείο
και
στη

συνέχεια
να
συσχετίσουμε
κατάλληλα
τα
δύο

αρχεία.


47

Σύνδεση
XML
με
DTD:Παράδειγμα
1

  DTD
ενσωματωμένο
στο
XML
τεκμήριο:

DTD


<?xml version="1.0"?>
<!DOCTYPE greeting [
<!ELEMENT greeting (#PCDATA)>
]>
<greeting>Hello, world!</greeting>

48


Σύνδεση
XML
με
DTD:Παράδειγμα
2


  Σύνδεση
με
εξωτερικό
αρχείο
στο
οποίο

έχει
αποθηκευτεί
το
DTD:


Σύνδεση
με

DTD

<?xml version="1.0"?>
<!DOCTYPE greeting SYSTEM "hello.dtd">
<greeting>Hello, world!</greeting>

49

Υπό
συνθήκη
τμήματα


  Ένα
υπό
συνθήκη
τμήμα
(condiwonal
secwon)
είναι
τμήμα

ενός
εξωτερικού

DTD
το
οποίο
συμπεριλαμβάνεται
ή
δεν

συμπεριλαμβάνεται
στη
λογική
δομή
του
DTD

με
βάση

κάποια
λέξη
κλειδί
(keyword)
η
οποία
συνδέεται
με
αυτό.


  Aν
η
τιμή
της
λέξης
κλειδί
είναι
INCLUDE,

τότε
το

περιεχόμενο
του
υπό
συνθήκη
τμήματος
συμπεριλαμβάνεται

στο
DTD.


  Αν
η
τιμή
της
λέξης
κλειδί
είναι
IGNORE,
τότε
το

περιεχόμενο
του
υπό
συνθήκη
τμήματος
δεν

συμπεριλαμβάνεται
στο
DTD.


  Η
λέξη
κλειδί
σε
ένα
υπό
συνθήκη
τμήμα
μπορεί
να
είναι

αναφορά
σε
οντότητα
παραμέτρου.
Τότε
η
οντότητα

παραμέτρου
πρέπει
να
αντικατασταθεί
με
την
τιμή
της
για
να

μπορέσει
ο
επεξεργαστής
να
αποφασίσει
αν
θα
συμπεριλάβει

το
υπό
συνθήκη
τμήμα.



50


Υπό
συνθήκη
τμήματα:Παράδειγμα

  Παράδειγμα:

<!ENTITY
%
dra®
‘INCLUDE’
>

<!ENTITY
%
final
‘IGNORE’
>


<!
[%dra®;
[

<!ELEMENT
arwcle
(comments*,
wtle,
body,
supplements?)>


]]>

<!
[%final;
[

<!ELEMENT
arwcle
(wtle,
body,
supplements?)>


]]>

  Η
συμμετοχή
ή
όχι
των
υπό
συνθήκη
τμημάτων
καθορίζεται

από
την
τιμή
των
παραμέτρων
dra®
και
final.
Μεταβάλλοντας

τις
τιμές
των
παραμέτρων
αυτών
μπορούμε
εύκολα
να

εναλλάξουμε
τα
υπό
συνθήκη
τμήματα
τα
οποία
θα

συμπεριληφθούν
στο
DTD.


51

DTD
για
Εξειδικευμένα
Πεδία

  Η
ανάπτυξη
τυποποιημένων
DTD
για
εξειδικευμένα

πεδία
επιτρέπει
την
ανταλλαγή
δεδομένων
ανάμεσα

σε
ετερογενείς
πηγές.

  Παράδειγμα:
Μαθηματική
Γλώσσα
Σημειοθέτησης

(MathemaXcal
Markup
Language)
(MathML).

  Τεχνικό
εγχειρίδιο
«MathemaXcal
Markup
Language

(MathML)
Version
2.0»
από
τη
διεύθυνση
hZp://
www.w3.org/TR/MathML2

  Κωδικοποίηση
μαθηματικού
υλικού
στο
web.

  Η
παράσταση
(x+y)^2
κωδικοποιείται
στην
MathML
ως:


<apply>
<power/>






<apply>
<plus/>
<ci>x</ci>
<ci>y</ci>
</apply>





<cn>2</cn>


</apply>


52


XML
Namespaces

Χώροι
Ονομάτων
XML


  Οι
Χώροι
Ονομάτων
XML
(XML
Namespaces)
είναι

συλλογές
ονομάτων
που
προσδιορίζονται
από
μια

αναφορά
URI
(Uniform
Resource
Idenwfier)
και

χρησιμοποιούνται
για
την
ονομασία
στοιχείων
και

γνωρισμάτων
της
XML.


  Όταν
χρησιμοποιούνται
χώροι
ονομάτων,
τα
ονόματα

στοιχείων
και
γνωρισμάτων
εμφανίζονται
με
δύο

συνθετικά,
το
πρόθεμα
(χώρου
ονομάτων)
(prefix)
και

το
τοπικό
τμήμα
(local
part),
τα
οποία
χωρίζονται

μεταξύ
τους
με
:.


  Ο
μηχανισμός
αυτός
παράγει
ονόματα
τα
οποία
είναι

παγκοσμίως
μοναδικά.



54


Γιατί
χρησιμοποιούμε
χώρους

ονομάτων


  Οι
σχεδιαστές
της
XML
προσβλέπουν
σε
εφαρμογές
στις
οποίες
ένα
XML

τεκμήριο
μπορεί
να
περιλαμβάνει
στοιχεία
και
γνωρίσματα
που
έχουν
οριστεί

και
απευθύνονται
σε
διαφορετικές
εφαρμογές
λογισμικού.


  Στόχο
της
ύπαρξης
καλά
τεκμηριωμένων
και
κατανοητών
“λεξιλογίων
ετικετών”


για
το
οποίο
υπάρχει
διαθέσιμο
χρήσιμο
λογισμικό,
αποτελεί
η
επιθυμία
για

επαναχρησιμοποίηση
των
τεκμηρίων
από
πολλές
διαφορετικές
εφαρμογές.


  Τα
τεκμήρια
που
περιέχουν
πολλαπλά
“λεξιλόγια
ετικετών”
εμφανίζουν

προβλήματα
αναγνώρισης
(σε
ποια
εφαρμογή
απευθύνεται
η
κάθε
ετικέτα)
και

“σύγκρουσης”
(ίδιες
ετικέτες
που
απευθύνονται
σε
διαφορετικές
εφαρμογές).


  Οι
εφαρμογές
λογισμικού
πρέπει
να
μπορούν
να
αναγνωρίζουν
τα
στοιχεία
και

τα
γνωρίσματα
για
την
επεξεργασία
των
οποίων
έχουν
σχεδιαστεί,
ακόμη
και

στην
περίπτωση
που

εμφανίζεται
“σύγκρουση”
ονομάτων
στοιχείων
ή

γνωρισμάτων.
Τα
παραπάνω
απαιτούν
συντακτικές
δομές
που
επιτρέπουν

ονόματα
διαμορφωμένα
κατά
τρόπον
ώστε
να
αποφεύγεται
η
σύγκρουση

μεταξύ
ονομάτων
από
διαφορετικά
“λεξιλόγια
ετικετών”.


  Η
λύση
είναι
η
χρησιμοποίηση
του
μηχανισμού
που
ονομάζεται
χώρος

ονομάτων
XML,
ο
οποίος
πετυχαίνει
τον
στόχο
αυτόν
επιτρέποντας
επεκταμένα

ονόματα
στοιχείων
και
γνωρισμάτων.



55

Δηλώσεις
χώρων
ονομάτων


  Ένας
χώρος
ονομάτων
δηλώνεται
μέσω
μιας
οικογένειας
από

προκαθορισμένα
γνωρίσματα
όπως
το
γνώρισμα
xmlns
ή

οποιοδήποτε
γνώρισμα
έχει
το
xmlns:
σαν
πρόθεμα.
Η
τιμή

του
γνωρίσματος,
που
είναι
μια
αναφορά
URI,
είναι
το
όνομα

του
χώρου
ονομάτων
(namespace
name).


  Παράδειγμα:
Στο
παρακάτω
τμήμα
XML
τεκμηρίου

βλέπουμε

μια
δήλωση
χώρου
ονομάτων
η
οποία
συσχετίζει
το
πρόθεμα

bk με
το
όνομα
χώρου
ονομάτων

www.books.org/book:

<book xmlns:bk="www.books.org/book" >  Δήλωση


……… χώρου
ονοµάτων
</book>


56


Πολλαπλές
δηλώσεις
χώρων

ονομάτων

  Είναι
δυνατό
να
δηλωθούν
πολλοί
χώροι
ονομάτων
στο
ίδιο

στοιχείο.


  Παράδειγμα:
Στο
τμήμα
XML
τεκμηρίου
που
ακολουθεί:


<book xmlns:bk="www.books.org/book"
xmlns:isbn="www.isbn.org/def" >
………
</book>

 δηλώνονται
δύο
χώροι
ονομάτων:


  Ο
πρώτος

συνδέει
το
πρόθεμα
bk
με
το
χώρο
ονομάτων
με
όνομα

www.books.org/book.


  Ο
δεύτερος
συνδέει
το
πρόθεμα
isbn
με
το
όνομα
χώρου
ονομάτων

www.isbn.org/def.


57

Εμβέλεια
χώρων
ονομάτων

  Μια
δήλωση
χώρου
ονομάτων
εφαρμόζεται
στο

στοιχείο
που
γίνεται
καθώς
και
σε
όλα
τα
στοιχεία

που
περικλείονται
μέσα
σ’
αυτό,
εκτός
εάν

αντικατασταθεί
από
μια
νέα
δήλωση
που
συνδέει

το
ίδιο
πρόθεμα
με
άλλο
όνομα
χώρου
ονομάτων

(διαφορετικό
URI).

  Δεν
είναι
υποχρεωτικό
όλα
τα
στοιχεία
που

αποτελούν
το
περιεχόμενο
του
στοιχείου
στο
οποίο

έχει
οριστεί
ένας
χώρος
ονομάτων,

να

χρησιμοποιούν
το
συγκεκριμένο
χώρο
ονομάτων.



58


Η
χρήση
των
χώρων
ονομάτων


  Σε
ένα
XML
τεκμήριο
που
χρησιμοποιεί
χώρους
ονομάτων,

μερικά
(ή
και
όλα)
από
τα
ονόματα
των
στοιχείων
και
των

γνωρισμάτων
που
περιλαμβάνει
μπορεί
να
αποτελούνται
από

δύο
συνθετικά.
Το
πρώτο
ονομάζεται
πρόθεμα
χώρου
ονομάτων

(namespace
prefix)
ενώ
το
δεύτερο
ονομάζεται
τοπικό
τμήμα

(local
part).


  Τα
δύο
αυτά
συνθετικά
χωρίζονται
μεταξύ
τους
με
:.


  Το
πρόθεμα
πρέπει
να
έχει
δηλωθεί
σε
μια
δήλωση
χώρου

ονομάτων
και
να
έχει
συνδεθεί
με
ένα
όνομα
χώρου
ονομάτων

(μια
αναφορά
URI).


  Η
σύνταξη
των
ονομάτων
στοιχείων
και
γνωρισμάτων
τα
οποία

χρησιμοποιούν
χώρους
ονομάτων
έχουν
την
μορφή:

prefix:localpart
  Ο
συνδυασμός
των
δύο
συνθετικών
παράγει
ονόματα
τα
οποία

είναι
μοναδικά.
59

Η
χρήση
των
χώρων
ονομάτων

  Παράδειγμα:
Στο
το
παρακάτω
τμήμα
XML
τεκμηρίου:

<book xmlns:isbn="www.isbn.org/def">
<title> … </title>
Έχει
οριστεί
εδώ

<authors> … <authors>
<isbn:number> … </isbn:number>
</book>

 στο
στοιχείο
book
έχει
δηλωθεί
χώρος
ονομάτων
ο
οποίος

συνδέει
το
πρόθεμα
isbn
με
το
όνομα
χώρου
ονομάτων

www.isbn.org/def.
Στη
συνέχεια,
στο
περιεχόμενο
του

στοιχείου
book
συμπεριλαμβάνεται
και
το
στοιχείο

isbn:number το
όνομα
του
οποίου
περιλαμβάνει
το
πρόθεμα

isbn.



60


Η
χρήση
των
χώρων
ονομάτων

(συνέχεια)

  Παράδειγμα:
Στο
τεκμήριο
που
ακολουθεί
έχουμε

δήλωση
και
χρήση
δύο
χώρων
ονομάτων
που

συσχετίζονται
με
τα
προθέματα
bk
και
isbn:


<book xmlns:isbn="www.isbn.org/def"
xmlns:bk="www.books.org/book" >
<bk:title> … </bk:title>
<bk:authors> … </bk:authors>
<isbn:number> … </isbn:number>
</book>

61

Χρήση
χώρων
ονομάτων
σε

γνωρίσματα

  Οι
χώροι
ονομάτων
μπορούν
να
χρησιμοποιηθούν
και
για
τον

σχηματισμό
ονομάτων
γνωρισμάτων.


  Παράδειγμα:
Στο
παρακάτω
τμήμα
XML
τεκμηρίου:


<tab xmlns:sns="www.ionio.gr/sdef" >
<sns:student sns:scode = "12345">
<sns:name> … </sns:name>
</sns:student>
</tab>

 έχουμε
δήλωση
χώρου
ονομάτων,
ο
οποίος

χρησιμοποιείται
για
την
παράγωγή
ονομάτων
των
στοιχείων

sns:student και
sns:name
και
του
γνωρίσματος
sns:scode.


62


Χρήση
χώρων
ονομάτων

  Κάθε
πρόθεμα
που
χρησιμοποιείται
σε
ένα

όνομα
στοιχείου
ή
γνωρίσματος,
εκτός
από
τα

xmlns
και
xml,
πρέπει
να
έχει
δηλωθεί
σε
μια

δήλωση
χώρου
ονομάτων,
είτε
στην
ετικέτα

αρχής
του
στοιχείου
μέσα
στο
οποίο

χρησιμοποιείται,
είτε
σε
κάποιο
στοιχείο

“πρόγονο”
του
στοιχείου
αυτού.


  Τα
ονόματα
στοιχείων
και
γνωρισμάτων

συνοδεύονται
από
το
πρόθεμα
τους
όταν
αυτά

δηλώνονται
σε
ένα
DTD.



63

Χώροι
ονομάτων
χωρίς
προθέματα


  Συχνά
είναι
χρήσιμο
να
δηλωθεί
ένας
χώρος
ονομάτων
ο
οποίος
να

μην
διαθέτει
πρόθεμα.
Ένας
τέτοιος
χώρος
ονομάτων
ονομάζεται

προκαθορισμένος
χώρος
ονομάτων
(default
namespace).
Η

χρησιμότητα
του
έγκειται
στο
ότι
τα
ονόματα
στοιχείων
που

ανήκουν
στο
χώρο
αυτό
δεν
χρειάζεται
να
συνοδεύονται
από

συγκεκριμένο
πρόθεμα.

  Ο
χώρος
ονομάτων
χωρίς
πρόθεμα
εφαρμόζεται
στο
στοιχείο
στο

οποίο
δηλώνεται
(αν
αυτό
δεν
έχει
πρόθεμα
χώρου
ονομάτων)

καθώς
και
σε
όλα
τα
στοιχεία

χωρίς
πρόθεμα
που

περιλαμβάνονται
στο
περιεχόμενο
του
στοιχείου
αυτού.

  Η
αναφορά
URI
στη
δήλωση
του
χώρου
ονομάτων
χωρίς
πρόθεμα

μπορεί
να
είναι
κενή.
Τα
στοιχεία
χωρίς
πρόθεμα
και
βρίσκονται


στην
εμβέλεια
μιας
τέτοιας
δήλωσης
θεωρείται
ότι
δεν
ανήκουν
σε

κανένα
χώρο
ονομάτων.


  Ο
χώρος
ονομάτων
χωρίς
πρόθεμα
δεν
εφαρμόζεται
απευθείας
σε

γνωρίσματα.


64


Χώροι
ονομάτων
χωρίς
προθέματα:

Παράδειγμα
1

  Παράδειγμα:
Στο
παρακάτω
XML
τεκμήριο
φαίνεται
δήλωση
και
χρήση

του
χώρου
ονομάτων
χωρίς
πρόθεμα
(όλα
τα
στοιχεία
του
τεκμηρίου

ανήκουν
σε
αυτόν
τον
χώρο
ονομάτων):


<?xml version="1.0"?>
<!-- τα στοιχεία ανήκουν στον default χώρο ονοµάτων “HTML” -->
<html xmlns='http://www.w3.org/TR/REC-html40'>
<head>
<title>Frobnostication</title>
</head>
<body>
<p>Moved to <a href='http://frob.com'>here</a>.</p>
</body>
</html>

65

Χώροι
ονομάτων
χωρίς
προθέματα:

Παράδειγμα
2

  Παράδειγμα:
Στο
ακόλουθο
XML
τεκμήριο
έχουμε
δήλωση
και

χρήση
χώρου
ονομάτων
χωρίς
πρόθεμα
καθώς
και
ενός
χώρου

ονομάτων
που
συνδέεται
με
το
πρόθεμα
isbn:

<?xml version="1.0"?>
<!—τα στοιχεία χωρίς πρόθεµα ανήκουν στον "books" -->
<book xmlns='urn:loc.gov:books'
xmlns:isbn='urn:ISBN:0-395-36341-6'>
<title>Cheaper by the Dozen</title>
<isbn:number>1568491379</isbn:number>
</book>

 Έτσι,
εκτός
από
το
στοιχείο
isbn:number,
το
οποίο
ανήκει
στο

χώρο
ονομάτων
με
πρόθεμα
isbn,
όλα
τα
άλλα
ανήκουν
στον

χώρο
ονομάτων
'urn:loc.gov:books'.
66


Επαναορισμός
χώρου
ονομάτων
χωρίς

πρόθεμα

  Παράδειγμα:
Στο
ακόλουθο
XML
τεκμήριο
φαίνεται
η
αλλαγή
του

χώρου
ονομάτων
χωρίς
όνομα
λόγω
επαναορισμού
του
σε
ένα

εσωτερικό
στοιχείο:

<?xml version="1.0"?>
<!-- αρχικά, ο default χώρος ονοµάτων είναι ο "books" -->
<book xmlns='urn:loc.gov:books'
xmlns:isbn='urn:ISBN:0-395-36341-6'>
<title>Cheaper by the Dozen</title>
<isbn:number>1568491379</isbn:number>
<notes>
<!-- κάνει τον "HTML" default χώρο ονοµάτων  -->
<p xmlns='urn:w3-org-ns:HTML'>
This is a <i>funny</i> book!
</p>
</notes>
</book>
67

Μοναδικότητα
γνωρισμάτων


  Στα
XML
τεκμήρια
τα
οποία
υπακούουν
στις
προδιαγραφές

που
περιγράψαμε,
καμιά
ετικέτα
στοιχείου
δεν
μπορεί
να

περιέχει
δύο
γνωρίσματα
τα
οποία:


  έχουν
ταυτόσημα
ονόματα,
ή


  έχουν
ονόματα
με
το
ίδιο
τοπικό
τμήμα
και
τα
προθέματα
των
οποίων

έχουν
συνδεθεί
με
ταυτόσημα
ονόματα
χώρων
ονομάτων.

  Παράδειγμα:
Οι
ετικέτες
αρχής
bad
παρακάτω
δεν
είναι

έγκυρες
λόγω
της
ταύτισης
των
ονομάτων
των
γνωρισμάτων

τους:



 


<!-- http://www.w3.org is bound to n1 and n2 -->
<x xmlns:n1="http://www.w3.org" 
xmlns:n2="http://www.w3.org" >
<bad a="1"     a="2" />
<bad n1:a="1"  n2:a="2" />
</x>
68


Μοναδικότητα
γνωρισμάτων

(συνέχεια)

  Παράδειγμα:
Η
σύνταξη
των
στοιχείων
του
XML
τεκμηρίου

που
ακολουθεί
είναι
έγκυρη.
Το
δεύτερο
στοιχείο
good
είναι

έγκυρο
επειδή
ο
χώρος
ονομάτων
χωρίς
πρόθεμα
δεν

εφαρμόζεται
στα
ονόματα
γνωρισμάτων.


<!-- http://www.w3.org is bound to n1 and is the default -->
<x xmlns:n1="http://www.w3.org" 
xmlns="http://www.w3.org" >
<good a="1"  b="2" />
<good a="1"  n1:a="2" />
</x>

69

XML
Schema


Η
γλώσσα
XML
Schema


  Η
γλώσσα
XML
Schema
είναι
μια
γλώσσα

XML
κατάλληλη
για
την
περιγραφή
της

δομής
XML
τεκμηρίων.


  Η
XML
Schema
(όπως
και
τα
DTD)
είναι

γλώσσα
περιγραφής
σχήματος.

  Η
XML
Schema
προσφέρει
χαρακτηριστικά

και
δυνατότητες,
ισχυρότερα
αυτών
που

παρέχονται
από
τα
DTD.



71

XML
Schema:
Παράδειγμα


  Ζητάμε
περιγραφή
σε
XML
Schema
της
δομής
των

τεκμηρίων
της
μομφής:


<ΤΑΒ>
<φοιτητής>
<όνοµα> Νίκος </όνοµα>
<επώνυµο> Νικολάου </επώνυµο>
</φοιτητής>
<φοιτητής> ... </φοιτητής>
...
</ΤΑΒ>
72


XML
Schema:
Παράδειγμα
(συνέχεια)

<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="TAB">
<!ELEMENT
ΤΑΒ
(φοιτητής*)>

<xs:complexType>
<xs:element name="φοιτητής" minOccurs=0
maxOccurs="unbounded">
<xs:complexType> <!ELEMENT
φοιτητής
(όνομα,
επώνυμο)>


<!ELEMENT
όνομα
(#PCDATA)>

<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence> <!ELEMENT
επώνυμο

(#PCDATA)>

</xs:complexType>
</xs:element>
</xs:complexType>
</xs:element>
</xs:schema> 73

Χαρακτηριστικά
της
XML
Schema

  Ένα
τεκμήριο
σε
XML
Schema
είναι
ένα
XML
τεκμήριο.


  Τα
στοιχεία
στο
XML
Schema
του
παραδείγματος
έχουν
το

πρόθεμα
xs
το
οποίο
συνδέεται
με
το
χώρο
ονομάτων
της

XML
Schema
μέσω
της
δήλωσης:


  xmlns:xs=”http://www.w3.org/2001/XMLSchema”.


  H
XML
Schema
παρέχει
στοιχεία
(όπως
τα
element,

sequence,
complexType)
με
συγκεκριμένη
σημασία,
τα

οποία
μαζί
με
αντίστοιχα
γνωρίσματα
(όπως
τα
name,
type,

minOccurs,
maxOccurs)
επιτρέπουν
την
περιγραφή
της

δομής
XML
τεκμηρίων.


  Μια
περιγραφή
σχήματος
στην
XML
Schema
έχει
ως
ετικέτα

αρχής
του
πιο
εξωτερικού
στοιχείου
(της
ρίζας)
την
ετικέτα

xs:schema.

  Η
XML
Schema
παρέχει
αξιοσημείωτη
εκφραστικότητα
η

οποία
επιτρέπει
την
περιγραφή
της
δομής
XML
τεκμηρίων
με

πολλούς
διαφορετικούς
τρόπους.


74


Παράδειγμα
(μια
εναλλακτική

περιγραφή
του
προηγουμένου)

  Η
ακόλουθη
περιγραφή
σε
XML
Schema
περιγράφει
ακριβώς
την
ίδια

κατηγορία
τεκμηρίων
με
την
προηγούμενη
περιγραφή:



<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="TAB" type="TABtype"/>
<xs:complexType name="TABtype">
<xs:element name="φοιτητής" type="studentType"
minOccurs=0 maxOccurs="unbounded"/>
</xs:complexType>
<xs:complexType name="studentType">
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:schema>
75

Δηλώσεις
στοιχείων

  Στοιχεία
της
XML:

  Σύνθετου
τύπου:
περιέχουν
υποστοιχεία
ή
διαθέτουν
γνωρίσματα.

  Απλού
τύπου:
δεν
έχουν
υποστοιχεία,
ούτε
διαθέτουν
γνωρίσματα.

  Τα
γνωρίσματα
θεωρούνται
ότι
είναι
απλού
τύπου.

  Η
XML
Schema
παρέχει
το
στοιχείο
complexType
για
τη
δημιουργία
νέων

σύνθετων
τύπων.
Οι
σύνθετοι
τύποι
που
δημιουργούνται
αποκτούν
όνομα

μέσω
του
προαιρετικού
γνωρίσματος
name.



  Οι
τύποι
TABtype
και

studentType
είναι
σύνθετοι.


  Με
την
ακόλουθη
έκφραση
ορίζεται
ο
σύνθετος
τύπος
TABtype
:


<xs:complexType name="TABtype">
...
</xs:complexType>

 Το
TABtype
χρησιμοποιείται
σε
άλλο
σημείο
της
περιγραφής
σχήματος

για
να
δηλώσουμε
ότι
ένα
στοιχείο
είναι
τύπου
TABtype. 


  Παράδειγμα:
Στη
δήλωση:


 
 <xs:element name="TAB" type="TABtype"/>

 δηλώνεται
ότι
το
στοιχείο
TAB
είναι
τύπου
TABtype.


  Το
όνομα
ενός
σύνθετου
τύπου
μπορεί
χρησιμοποιηθεί
στη
δήλωση
πολλών

στοιχείων
μειώνοντας
έτσι
το
μέγεθος
των
περιγραφών.

76


Δηλώσεις
γνωρισμάτων

  Για
τη
δήλωση
γνωρισμάτων
χρησιμοποιείται
το
στοιχείο

attribute.

Ένα
γνώρισμα
δηλώνεται
ως
εξής:

<xs:attribute name=" ... " type="..." .... />
  Παράδειγμα:
Με
την
έκφραση

<xs:attribute name="ηλικία" type="xs:positiveInteger"
use="required"/>

 δηλώνεται
το
γνώρισμα
ηλικία
το
οποίο
παίρνει
τιμές
του
τύπου

positiveInteger.


  Ο
τύπος
positiveInteger,
είναι
απλός
τύπος
και

αντιπροσωπεύει
τους
θετικούς
ακέραιους
αριθμούς.


  Η
παράσταση
use="required",
δηλώνει
ότι
η
εμφάνιση
του

συγκεκριμένου
γνωρίσματος
είναι
υποχρεωτική.



  Ένα
στοιχείο
που
διαθέτει
γνωρίσματα
είναι
πάντα
σύνθετου

τύπου
και
επομένως
δηλώνεται
μέσω
του
complexType. 


  Οι
δηλώσεις
γνωρισμάτων
τοποθετούνται
στο
τέλος
της
δήλωσης

του
σύνθετου
τύπου
του
αντίστοιχου
στοιχείου,
ακριβώς
πριν

από
το
</xs:complexType>.


77

Δηλώσεις
γνωρισμάτων
(συνέχεια)

  Παράδειγμα:
Το
στοιχείο
φοιτητής
στην
παρακάτω
δήλωση

εμφανίζεται
να
διαθέτει
το
γνώρισμα
ηλικία:

<xs:element name="φοιτητής" minOccurs=0 maxOccurs="unbounded">
<xs:complexType>
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
<xs:attribute name="ηλικία" type="xs:positiveInteger"
use="required"/>
</xs:complexType>
</xs:element>

 Παρατηρήστε
ότι
το
στοιχείο
φοιτητής
περιλαμβάνει
τα

υποστοιχεία
όνοµα
και
επώνυµο,
καθώς
και
το
γνώρισμα
ηλικία,

το
οποίο
εμφανίζεται
υποχρεωτικά
σε
κάθε
στοιχείο
φοιτητής,
και

παίρνει
ως
τιμή
έναν
θετικό
ακέραιο.

78


Συχνότητα
εμφάνισης
στοιχείων

  Η
XML
Schema
επιτρέπει
να
προδιαγράψουμε
το
πλήθος
των

εμφανίσεων
των
στοιχείων
με
εξαιρετική
ακρίβεια.

Αυτό
γίνεται

μέσω
δύο
γνωρισμάτων
του
element:


  Του
minOccurs
μέσω
του
οποίου
δηλώνουμε
τον
ελάχιστο
αριθμό

εμφανίσεων
του
στοιχείου,


  Του
maxOccurs
μέσω
του
οποίου
δηλώνουμε
τον
μέγιστο
αριθμό

εμφανίσεων
του
στοιχείου.


  Οι
τιμές
των
γνωρισμάτων
αυτών
είναι
μη
αρνητικοί
ακέραιοι.

  Όταν
κάποιο
από
τα
minOccurs
ή
maxOccurs
παραλείπεται
(και
τα
δύο

ή
ένα
από
αυτά)
τότε
θεωρείται
ότι
έχει
σαν
τιμή
το
1.


  Παράδειγμα.
Στη
δήλωση:

<xs:element name="φοιτητής" type="studentType"
minOccurs=0 maxOccurs="unbounded"/>

 η
τιμή
unbounded
του
maxOccurs
υποδηλώνει
απεριόριστο
αριθμό

εμφανίσεων
του
φοιτητής,
(είναι
δυνατό
να
μην
έχουμε
καμιά
εμφάνιση

λόγω
της
τιμής
0
του
γνωρίσματος
minOccurs).


79

Περιορισμοί
συχνότητας
εμφάνισης

στοιχείων
και
γνωρισμάτων

  Ένα
γνώρισμα
μπορεί
να
εμφανίζεται
σε
ένα
στιγμιότυπο

στοιχείου
μία
φορά
ή
να
μην
εμφανίζεται
καθόλου.
Δεν

μπορεί
όμως
το
ίδιο
γνώρισμα
να
εμφανίζεται
στο
ίδιο

στοιχείο
περισσότερες
από
μια
φορές
(με
τη
ίδια
ή

διαφορετική
τιμή).


  Η
XML
Schema
επιτρέπει
να
προσδιορίσουμε
την

υποχρεωτικότητα
ή
μη
της
εμφάνισης
ενός
γνωρίσματος

μέσω
του
γνωρίσματος
use
του
στοιχείου
attribute (μέσω

του
οποίου
δηλώνουμε
το
γνώρισμα).


  Η
τιμή
required στο
γνώρισμα
use υποδηλώνει

υποχρεωτική
εμφάνιση
του
γνωρίσματος
ενώ
τιμή
optional

υποδηλώνει
προαιρετική
εμφάνιση
του
συγκεκριμένου

γνωρίσματος.


80


Απλοί
τύποι


  Η
XML
Schema
διαθέτη
πλούσια
συλλογή
ενσωματωμένων
απλών
τύπων

όπως
οι
byte, integer, positiveInteger, negativeInteger, int,
decimal, long, float, double, boolean, date, dateTime, ID, string,
IDREF, IDREFS, ENTITY, ENTITIES, NMTOKEN, NMTOKENS.
  Η
XML
Schema
επιτρέπει

να
ορίσουμε
νέους
απλούς
τύπους
μέσω
του

στοιχείου
simpleType. Οι
δηλώσεις
περιγράφουν
τον
τρόπο
που

παράγονται
οι
νέοι
τύποι
από
άλλους
απλούς
(ενσωματωμένους
ή

παραγόμενους)
τύπους.

  Παράδειγμα.
Με
τη
δήλωση:

<xs:simpleType name="myInteger">
<xs:restriction base="xs:integer">
<xs:minInclusive value="0"/>
<xs:maxInclusive value="100"/>
</xs:restriction>
</xs:simpleType>

 ορίζεται
ο
τύπος
myInteger,
μέσω
επιβολής
περιορισμών
στον
τύπο

integer.
Το
όνομα
του
τύπου
βάσης
δίνεται
ως
τιμή
στο
γνώρισμα
base
του

στοιχείου
restriction.
Οι
περιορισμοί
ορίζονται
μέσω
των
στοιχείων

minInclusive
και
maxInclusive και
ορίζουν
ως
ελάχιστη
επιτρεπτή
τιμή
το
0,

και
ως
μέγιστη
επιτρεπτή
τιμή
το
100.



81

Απλοί
τύποι
(συνέχεια)

  Η
XML
Schema
παρέχει
πλούσια
ποικιλία
«όψεων»
(facets)

(όπως
οι
minInclusive
και
maxInclusive)
για
την
επιβολή

περιορισμών
κατά
τον
ορισμό
νέων
τύπων.


  Μια
χρήσιμη
όψη
είναι
το
στοιχείο
enumeration
που

περιορίζει
έναν
απλό
τύπο
σε
ένα
σύνολο
διακριτών
τιμών:

  Παράδειγμα.
Στην
περιγραφή:

<xs:simpleType name="νόµισµα">
<xs:restriction base="xs:string">
<xs:enumeration value="GRD"/>
<xs:enumeration value="EURO"/>
<xs:enumeration value="USD"/>
<!-- κ.λ.π. ... -->
</xs:restriction>
</xs:simpleType>

 ορίζεται
ο
απλός
τύπος
νόµισµα,
με
τιμές
τα
(διεθνή)
σύμβολα
των

νομισμάτων
όπως
τα
GRD, EURO, USD,
κ.λ.π..

82


Ορισμός
γνωρισμάτων
σε
στοιχεία

απλού
τύπου


  Στοιχεία
απλού
τύπου
δηλώνονται
όπως
στο
παράδειγμα:

<xs:element name="ονοµατεπώνυµο" type="xs:string"/>
  Οι
απλοί
τύποι
(στοιχεία
απλού
τύπου)
δεν
επιτρέπεται
να
έχουν
γνωρίσματα.
Η

επισύναψη
γνωρισμάτων
σε
στοιχεία
απλού
τύπου
(π.χ.
το
γνώρισμα
ΑΔΤ‐αριθμός

δελτίου
ταυτότητας
στο
στοιχείο
ονοµατεπώνυµο)
γίνεται
με
τον
ορισμό
σύνθετου

τύπου
όπως
στο
επόμενο
παράδειγμα.
Το
περιεχόμενο
του
στοιχείου
παραμένει

απλού
τύπου
(του
τύπου
string
στην
περίπτωση
μας).


<xs:element name="ονοµατεπώνυµο">
<xs:complexType>
<xs:simpleContent>
<xs:extension base="xs:string">
<xs:attribute name="ΑΔΤ" type="xs:string"/>
</xs:extension>
</xs:simpleContent>
</xs:complexType>
</xs:element>

 Το
simpleContent υποδηλώνει
στοιχεία
με
απλό
περιεχόμενο
χωρίς
υπο‐
στοιχεία
(στο
παράδειγμα
ακολουθία
απλών
χαρακτήρων).
Για
τον
ορισμό
του
νέου

τύπου,
επεκτείνουμε
τύπο
string.
Η
επέκταση
συνίσταται
στην
προσθήκη
του

γνωρίσματος
ΑΔΤ
μέσω
μιας
συνήθους
δήλωσης
γνωρίσματος.


83

Ομαδοποίηση
στοιχείων



  Η
XML
Schema
παρέχει
τη
δυνατότητα
να

ορίζουμε
ομάδες
στοιχείων
(στις
οποίες

μπορούμε
να
δίνουμε
και
ονόματα).
Στόχος
η

χρήση
αυτών
των
ομάδων
για
τη
δόμηση
του

περιεχόμενου
των
συνθέτων
τύπων.


84


Ομαδοποίηση
στοιχείων
με
το
sequence


  Το
στοιχείο
sequence
χρησιμοποιείται
για
να
δηλώσει

(διατεταγμένη)
ακολουθία
(υπο)στοιχείων.


  Παράδειγμα.
Στο
παρακάτω:



 <xs:complexType name="studentType">
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string”/>
<xs:element name="πατρώνυµο" type="xs:string"/>
</xs:sequence>
</xs:complexType>

 δηλώνεται
ότι
κάθε
στοιχείο
τύπου
studentType
πρέπει
να

περιλαμβάνει
ένα
υποστοιχείο
όνοµα
ακολουθούμενο
από
ένα

υποστοιχείο
επώνυµο και
από
ένα
υποστοιχείο
πατρώνυµο.
Και

τα
τρία
(υπο)στοιχεία
είναι
τύπου
string.

85

Ομαδοποίηση
στοιχείων
με
το
choice


  Το
στοιχείο
choice
επιτρέπει
την
εμφάνιση
κάθε
φορά
ενός
μόνο
από
τα

(υπο)στοιχεία
που
περιλαμβάνει,
ως
περιεχόμενο
του
στοιχείου
που
ανήκει

στον
συγκεκριμένο
τύπο.


  Παράδειγμα.
Στο
παρακάτω
τμήμα
περιγραφής:



 <xs:complexType name="studentType">
<xs:choice>
<xs:element name="ονοµατεπώνυµο" type="xs:string"/>
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
</xs:choice>
</xs:complexType>

 δηλώνεται
ότι
κάθε
στοιχείο
του
τύπου
studentType
έχει
ως

περιεχόμενο
είτε
το
στοιχείο
ονοµατεπώνυµο
είτε
ένα
στοιχείο
όνοµα

ακολουθούμενο
από
ένα
στοιχείο
επώνυµο.


86


Ομαδοποίηση
στοιχείων
με
το
all


  Με
το
στοιχείο
all δηλώνεται
ότι
κάθε
στοιχείο
της
ομάδας

εμφανίζεται
υποχρεωτικά
(ή
προαιρετικά
αν
συνοδεύεται
με
το

γνώρισμα
minOccurs=0).
Η
σειρά
εμφάνισης
δεν
παίζει
ρόλο.

Επιτρεπτές
τιμές
των
minOccurs και
maxOccurs στις
δηλώσεις

των
στοιχείων
του
all
είναι
οι
0
και
1.


  Παράδειγμα.
Στο
παρακάτω
τμήμα
περιγραφής:


<xs:complexType name="studentType">
<xs:all>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
<xs:element name="πατρώνυµο" type="xs:string" minOccurs=0/>
</xs:all>
</xs:complexType>

 δηλώνεται
ότι
κάθε
στοιχείο
του
τύπου
studentType
περιλαμβάνει

από
μια
εμφάνιση
καθενός
από
τα
στοιχεία
όνοµα,
επώνυµο
και
μια
ή

καμία
εμφάνιση
του
στοιχείου
πατρώνυµο
αλλά
με
οποιαδήποτε
σειρά.


87

Ομαδοποίηση
στοιχείων
με
το
all
(συνέχεια)
  Το
all
πρέπει
να
εμφανίζεται
ως
το
μοναδικό
υποστοιχείο
του

complexType.


  Παράδειγμα.
Δεν
είναι
επιτρέπονται
δηλώσεις
της
μορφής:


 <xs:complexType name="studentType">
<xs:all>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
<xs:element name="πατρώνυµο" type="xs:string"/>
</xs:all>
<xs:sequence>
<xs:element name="ηλικία" type="xs:positiveInteger"/>
<xs:element name="διεύθυνση" type="xs:string"/>
</xs:sequence>
</xs:complexType>
  Το
περιεχόμενο
του
all
μπορεί
να
είναι
μόνο
δηλώσεις

ξεχωριστών
στοιχείων
και
όχι
ομάδων
στοιχείων.

88


Ομαδοποίηση
γνωρισμάτων


  Το
στοιχείο
attributeGroup
επιτρέπει
ομαδοποίηση
γνωρισμάτων.

  Παράδειγμα.
Εδώ
ορίζεται
ομάδα
γνωρισμάτων
με
όνομα

personAttributes.
Περιλαμβάνει
το
γνώρισμα
ΑΔΤ
που
είναι
τύπου

string,
το
ΑΦΜ που
είναι
τύπου
positiveInteger, και
το
φύλο για
το

οποίο
ορίζεται
ανώνυμος
τύπος
που
περιλαμβάνει
τις
τιμές
άνδρας
και

γυναίκα:

<xs:attributeGroup name="personAttributes">
<xs:attribute name="ΑΔΤ" type="xs:string" use="required"/>
<xs:attribute name="ΑΦΜ" type="xs:positiveInteger"/>
<xs:attribute name="φύλο">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:enumeration value="άνδρας"/>
<xs:enumeration value="γυναίκα"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:attributeGroup>
89

Ομαδοποίηση
γνωρισμάτων
(συνέχεια)

  Το
όνομα
ομάδας
γνωρισμάτων
μπορεί
να
χρησιμοποιηθεί
για
να
δηλωθεί
ότι

ένα
στοιχείο
διαθέτει
τα
γνωρίσματα
που
περιλαμβάνει
η
συγκεκριμένη

ομάδα.


  Παράδειγμα.
Στην
παρακάτω
περιγραφή
γίνεται
επίκληση
της
δήλωσης
του

συνόλου
γνωρισμάτων
personAttributes,
μέσω
του
γνωρίσματος
ref,

προκειμένου
να
δηλώσουμε
ότι
το
στοιχείο
φοιτητής
διαθέτει
τα
γνωρίσματα

του
συνόλου
personAttributes:



<xs:element name="φοιτητής" minOccurs=0 maxOccurs="unbounded" >
<xs:complexType>
<xs:sequence>
<xs:element name="όνοµα" type="xs:string"/>
<xs:element name="επώνυµο" type="xs:string"/>
</xs:sequence>
<xs:attributeGroup ref="personAttributes"/>
</xs:complexType>
</xs:element>
90


Ομαδοποίηση
γνωρισμάτων

(συνέχεια)

  Για
να
ορίσουμε
και
άλλα
στοιχεία
που

διαθέτουν
την
ίδια

ομάδα
γνωρισμάτων
(π.χ.
τα
στοιχεία
µέλοςΔεπ,
εργαζόµενος

κ.λ.π.),
χρησιμοποιούμε
δηλώσεις
ορισμού
στοιχείων
παρόμοιες

με
αυτήν
του
στοιχείου
φοιτητής,
στις
οποίες
θα
υπάρχει
απλή

αναφορά
στην
ίδια
ομάδα
γνωρισμάτων,
χωρίς
να
χρειάζεται
να

οριστεί
ξανά
αυτή.


  Χρησιμοποιώντας
ομάδες
γνωρισμάτων
διαμορφώνουμε
πιο

ευανάγνωστες
περιγραφές
σχήματος
και
διευκολύνουμε
τη

μελλοντική
ενημέρωση
του
σχήματος,
αφού
μια
ομάδα

γνωρισμάτων
μπορεί
να
οριστεί
(και
να
τροποποιείται)
σε
ένα

σημείο
και
να
χρησιμοποιείται
με
επίκληση
του
ονόματος
της
σε

πολλούς
ορισμούς
στοιχείων.


  Μια
ομάδα
γνωρισμάτων
μπορεί
να
περιλαμβάνει
με
τη
σειρά

της
άλλες
ομάδες
γνωρισμάτων.


  Οι
δηλώσεις
γνωρισμάτων
και
οι
αναφορές
σε
ομάδες

γνωρισμάτων
πρέπει
να
τοποθετούνται
στο
τέλος
των
ορισμών

συνθέτων
τύπων.


91

Περιληψη

  Το
XML
Σχήμα
(XML
Schema)
ενοποιεί

προηγούμενες
προτάσεις
για
περιγραφή

σχήματος.

  Γενικεύει
τα
DTDs.

  Χρησιμοποιεί
τη
σύνταξη
της
XML.

  Τεχνικά
εγχειρίδια:

  «XML
Schema
Part
0:
Primer»
βρίσκεται
στη

διεύθυνση:
hZp://www.w3.org/TR/xmlschema‐0
«XML

Schema
Part
1:
Structures»
βρίσκεται
στη
διεύθυνση:

hZp://www.w3.org/TR/xmlschema‐1

  «XML
Schema
Part
2:
Datatypes»
βρίσκεται
στη

διεύθυνση:hZp://www.w3.org/TR/xmlschema‐2

92


Συςτήματα Οργάνωςησ Γνώςησ


Ταξινόμηςη και ταξινομικά ςυςτήματα

Κωνςταντία Κακάλθ, Βιβλιοκθκονόμοσ MSc-Phd Candidate


Ομάδα Βάςεων Δεδομζνων και Πλθροφοριακϊν ΢υςτθμάτων,
Εργαςτιριο Ψθφιακϊν Βιβλιοκθκϊν και Θλεκτρονικισ Δθμοςίευςθσ
Σμιμα Αρχειονομίασ – Βιβλιοκθκονομίασ, Λόνιο Πανεπιςτιμιο
Περιεχόμενα
 Σαξινόμθςθ
 Διαχείριςθ τεκμθρίων
 Κεματικι περιγραφι
 Ενδεικτικζσ κατθγορίεσ κεματικϊν γλωςςϊν
 Σαξονομίεσ
 Κανόνεσ ταξινόμθςθσ
 Απαρικμθτικά ταξινομικά ςυςτιματα
 Φαςετικά ταξινομικά ςυςτιματα
 Δεκαδικι ταξινόμθςθ Dewey
 Σο ταξινομικό ςφςτθμα τθσ Βιβλιοκικθσ του Κονγκρζςου
 Διεκνισ Δεκαδικι Σαξινόμθςθ
 Colon Classification CC
 Άλλα ταξινομικά ςυςτιματα
 Εφαρμογζσ ταξινόμθςθσ ςτισ Βιβλιοκικεσ – Κατάλογοι
 Σαξικετικόσ αρικμόσ (call number)
 Σα παραδοςιακά ταξινομικά ςυςτιματα ςτθ περιγραφι θλεκτρονικϊν
πθγϊν

Ταξινόμηςη

 Θ ταξινόμθςθ είναι μια γνωςτικι ιδιότθτα τθσ ανκρϊπινθσ νόθςθσ, ζνα


γνωςτικό εργαλείο με το οποίο θ ανκρϊπινθ νόθςθ μπορεί να κατανοιςει
και να «γνωρίςει» τον εξαιρετικά πολφπλοκο και ποικίλο κόςμο.
 Είναι ακόμα μια πρακτικι δραςτθριότθτα για τθν ομαδοποίθςθ, κατάταξθ
και διαχωριςμό ποικίλων αντικειμζνων ι εννοιϊν με βάςθ κοινά
χαρακτθριςτικά τουσ γνωρίςματα και πολλαπλϊν τουσ ιδιοτιτων.
 Εφαρμοςμζνθ ςτθν κακθμερινι ηωι αποτελεί το φυςικό τρόπο
διαχείριςθσ τθσ πολυπλοκότθτασ από τθν ανκρϊπινθ νόθςθ.

3
Διαχείριςη τεκμηρίων
 Περιγραφι τεκμθρίων (bibliographic description)
◦ Σίτλοσ, πνευματικι υπευκυνότθτα, επιμζλεια (edition), ζκδοςθ
(publication), φυςικι περιγραφι (αρ. ςελίδων, μζγεκοσ), ςχετικόσ
εξοπλιςμόσ κλπ
 ΢θμεία πρόςβαςθσ καταλόγου
◦ Ευρετιρια με βάςθ τα οποία γίνεται θ αναηιτθςθ ςτον κατάλογο
◦ Δθμιουργία/χριςθ αρχείου κακιερωμζνων όρων (authority file)‫‏‬
◦ τίτλοι – εναλλακτικοί τίτλοι – τίτλοι ςειρϊν, ονόματα, ςυλλογικά όργανα
 Κεματικι ανάλυςθ - ταξινόμθςθ
◦ Προςδιοριςμόσ κεμάτων-εννοιϊν που καλφπτει ζνα τεκμιριο
◦ Ανάκεςθ κεματικϊν επικεφαλίδων
◦ Σαξινόμθςθ τεκμθρίου ςε κεματικζσ κατθγορίεσ με τθ χριςθ ταξινομικοφ
ςυςτιματοσ

Θεματική περιγραφή
 Θ κεματικι περιγραφι μπορεί να περιλαμβάνει τθν ταξινόμθςθ, ευρετθρίαςθ,
περίλθψθ.
 Παράγοντεσ που δυςκολεφουν το ζργο τθσ κεματικισ περιγραφισ:
 Σο είδοσ και τον τφπο του δθμοςιεφματοσ
 Σο επίπεδο παρουςίαςθσ του περιεχομζνου του
 Σον τρόπο που ο χριςτθσ αντιλαμβάνεται και κατανοεί τθν πλθροφορία
 Σθν υποκειμενικι δυνατότθτα του ευρετθριαςτι
 Θ διαδικαςία τθσ κεματικισ περιγραφισ
 Γνωριμία με το τεκμιριο
 Κεματικι ανάλυςθ
 Επιλογι κεμάτων
 Διατφπωςθ ςε όρουσ ι φράςεισ
 Επιβεβαίωςθ των όρων με άλλα
 Μετάφραςθ των όρων ςτθ γλϊςςα κεματικισ περιγραφισ που χρθςιμοποιείται
 Σαξινόμθςθ με βάςθ το κζμα μπορεί να γίνει:
 ΢ε μεγάλεσ κατθγορίεσ, ςε βαςικοφσ επιςτθμονικοφσ χϊρουσ
 ΢ε λεπτομερι κεματικι κατάταξθ (εξειδίκευςθ). ΢ε αυτι τθ περίπτωςθ είναι αναγκαία θ
χριςθ και υιοκζτθςθ ανεπτυγμζνα και εξειδικευμζνα εργαλεία όπωσ τα ταξινομικά
ςυςτιματα.
 .
5
Ενδεικτικζσ κατηγορίεσ θεματικών γλωςςών
 Σαξoνομίεσ
◦ Προ-ςυνδυαςμζνεσ γλϊςςεσ
◦ Περιγράφουν τισ ζννοιεσ ςε ζνα γνωςτικό πεδίο
◦ Οι περιγραφείσ τουσ είναι ςυςτθματικά διατεταγμζνοι ςε ιεραρχίεσ με
ςυγκεκριμζνα κριτιρια που βαςίηονται είτε ςτισ λογικζσ ςυςχετίςεισ τουσ,
είτε ςτισ ςυςχετίςεισ του υλικοφ
◦ Αντιςτοίχιςθ του περιγραφζα με ζνα αρικμό
 Σαξινομικά ςυςτιματα (DDC, UDC, LC)
◦ Καλφπτουν όλο το φάςμα τθσ γνϊςθσ με ιεραρχικό τρόπο
◦ ΢ε οριςμζνα πεδία γνϊςθσ θ κεματικι απόδοςθ γίνεται από πολφ μακριά
αρικμοδότθςθ
 Φαςετικι ταξινομθςθ (Colon classification, 1933)
◦ Πολυδιάςτατθ τακτοποίθςθ εννοιϊν και αντικειμζνων
◦ Οι φαςζτεσ μπορεί να προςαρμόηονται ςε κάκε κεματικι κατθγορία
6

Ταξονομίεσ
Θ ταξονομία είναι μια ιεραρχία όρων, ζνα είδοσ ελεγχόμενου λεξιλογίου, ζτςι ϊςτε οι κατϊτεροι και
ειδικότεροι όροι να είναι ςε διάταξθ κάτω από τουσ ανϊτερουσ και γενικότερουσ όρουσ.
Μια ταξινομία που περιλαμβάνει πολλαπλζσ μικρότερεσ ιεραρχικζσ δομζσ για κάκε τφπο όρου ι
χαρακτθριςτικοφ (ι φαςζτα) οι οποίοι μποροφν να αναηθτθκοφν ςε ςυνδυαςμό ονομάηεται
φαςετικι (πολυεδρικι) ταξονομία.
Παράδειγμα: Top-Level Categories for the ACM Taxonomy
 General Literature
 Hardware
 Computer Systems Organization
 Software/Software Engineering
 Data
 Theory of Computation
 Mathematics of Computing
 Information Technology and Systems
 Computing Methodologies
 Computer Applications
 Computing Milieux
 Haptics
 Services Computing
 Learning Technologies

7
Κανόνεσ ταξινόμηςησ
 Σαξινομοφμε με βάςθ το κζμα και μετά με τθ μορφι εκτόσ από τισ κλάςεισ Γενικά και
Λογοτεχνία
 598.2/03 Κζμα: πουλιά, μορφι: εγκυκλοπαίδεια
 811 Μορφι: Αμερικάνικι ποίθςθ
 Σαξινομοφμε ζνα τεκμιριο ςτθν κατθγορία που κα είναι πιο χριςιμθ
 Θ βιογραφία ενόσ ακλθτι, αλλιϊσ ταξινομείται ςε μια ςχολικι βιβλιοκικθ και
αλλιϊσ ςε μια ακλθτικι βιβλιοκικθ
 Σοποκετοφμε το τεκμιριο ςτθν πιο ειδικι κατθγορία που το περιλαμβάνει και όχι ςτθν
πιο γενικι
 Όταν ζνα βιβλίο διαπραγματεφεται δφο ι τρία κζματα, το τοποκετοφμε ςτθν τάξθ του
κυρίαρχου κζματοσ ι αν είναι ιςότιμα ςτο πρϊτο που πραγματεφεται το βιβλίο.
 Όταν ζχουμε δφο κζματα για ζνα τεκμιριο και το πρϊτο επθρεάηει το δεφτερο, τότε το
τεκμιριο ταξινομείται ςφμφωνα με το δεφτερο κζμα
 Κρθςκευτικζσ αντιλιψεισ για τθ φιλοςοφία => Φιλοςοφία
 Για πάνω από τρία κζματα τα τεκμιρια ταξινομοφνται ςτθ γενικι κατθγορία που τα
περιλαμβάνει όλα

Απαριθμητικά ταξινομικά ςυςτήματα

 Διαιροφν το ςφνολο τθσ γνϊςθσ ςε κφριεσ κατθγορίεσ, ςτθ ςυνζχεια


διαιροφν αυτζσ ςε υποκατθγορίεσ, οι οποίεσ διαδοχικά διαιροφνται ξανά
και ξανά μζχρι να κακοριςτεί το εξειδικευμζνο κζμα
 ΢ε κάκε ςτάδιο χρθςιμοποιείται κάποιο ςυγκεκριμζνο χαρακτθριςτικό
με βάςθ το οποίο γίνεται θ υποδιαίρεςθ.
 Αποτζλεςμα αυτισ τθσ διαδικαςίασ είναι το ταξινομικό ςφςτθμα να
καταγράφει τελικά όλα τα κζματα που κζλει να ςυμπεριλάβει, ςε μια
ακολουκία που προχωρά από το γενικό ςτο ειδικό με μια ςειρά
διαδοχικϊν βθμάτων, δίνοντασ ζτοιμα ςφμβολα για κακζνα από αυτά.
 Σα χωρίηουμε:
 ΢ε απόλυτα απαρικμθτικά, με ζνα πίνακα κφριο και μεγάλο που απαρικμεί
«όλα» τα κζματα, όπωσ είναι το ταξινομικό ςφςτθμα τθσ Βιβλιοκικθσ του
Κογκρζςου (LCC).
 ΢ε ςχεδόν απαρικμθτικά που αποτελείται από βαςικό πίνακα που απαρικμεί
τα κζματα αλλά με τθ βοικεια βοθκθτικϊν πινάκων μπορεί να ςυνδυάηει κι
άλλα κζματα. Σζτοια ταξινομικά ςυςτιματα είναι θ δεκαδικι ταξινόμθςθ
Dewey και θ ταξινόμθςθ του J.D. Brown.
9
Φαςετικά ταξινομικά ςυςτήματα
 Σο ταξινομικό ςχιμα να αναγνωρίηει τα βαςικά ςυςτατικά των κεμάτων
καταγράφοντασ κάτω από κάκε επιςτιμθ ι κφρια κατθγορία τισ βαςικζσ
ζννοιεσ που απομονϊνονται ςφμφωνα με ςυγκεκριμζνα χαρακτθριςτικά.
 Χρθςιμοποιεί τισ ςαφϊσ κακοριςμζνεσ, αποκλειςτικζσ και εξαντλθτικζσ
πτυχζσ, ιδιότθτεσ, ι χαρακτθριςτικά μιασ κατθγορίασ ι ενόσ ςυγκεκριμζνου
κζματοσ . Αυτζσ οι πτυχζσ, ιδιότθτεσ, ι χαρακτθριςτικά ονομάηονται φαςζτεσ
(facets) μιασ κατθγορίασ ι ενόσ κζματοσ.
 Σα ςυςτιματα αυτά τα χωρίηουμε:
 Αυςτθρι ταξινόμθςθ με φαςζτεσ, τα ςφμμεικτα κζματα ςχθματίηονται με
πίνακεσ μόνο βαςικϊν τάξεων και με τθ βοικεια κοινϊν και ειδικϊν
πινάκων. Σζτοια ταξινόμθςθ είναι θ Colon Classification.
 Σαξινόμθςθ ςχεδόν με φαςζτεσ, τα κζματα ςχθματίηονται από πίνακεσ
γενικϊν κεμάτων και πολλϊν ςφμμεικτων αλλά και από κοινοφσ
βοθκθτικοφσ και ειδικοφσ βοθκθτικοφσ πίνακεσ. Παραδείγματα τζτοιασ
ταξινόμθςθσ είναι θ UDC.

10

Φαςετικά ταξινομικά ςυςτήματα (2)


Κατά τθν πολυεδρικι ταξινόμθςθ τθσ ζνα κζμα υποδιαιρείται πολυ-ιεραρχικά,
με βάςθ ζνα ςφνολο ομότιμων και αμοιβαία ανεξάρτθτων μεταξφ τουσ
χαρακτθριςτικϊν
κινθματογράφοσ

Φαςζτα περιόδου φαςζτα είδουσ φαςζτα τόπου ι προζλευςθσ


(δεκαετία 1950, 1960, 1970) (δράμα, κωμωδία, κ.α.) (ελλθνικόσ, γαλλικόσ, κ.α.)
Από τθν πολυ-ιεραρχία προκφπτουν Σφμμεικτα θζματα:
Ελλθνικόσ κινθματογράφοσ του 1970.
Κινθματογράφοσ (κφριο κζμα)
ελλθνικόσ (φαςζτα χϊρασ)
1970 (φαςζτα χρόνου)
Σα απαρικμθτικά ςυςτιματα είναι μονο-ιεραρχικά: Θ ιεραρχία αναπτφςςεται ςφμφωνα με ζνα
χαρακτθριςτικό
Τπάρχουν δφο «προβλιματα» , θ ςειρά των φαςετϊν (citation order) και θ ςθμειογραφία.

11
Δεκαδική ταξινόμηςη Dewey (1)
 Ζργο του αμερικανοφ βιβλιοκθκονόμου Melvil Dewey το 1873.
 Είναι θ περιςςότερο διαδεδομζνθ ςφςτθματικι ταξινόμθςθ,
χρθςιμοποιείται από 135 χϊρεσ και μεταφράςτθκε ςε 30
γλϊςςεσ.
 ΢ιμερα υπάρχει θ 22θ ζκδοςθ του, από το 2003, και από το
2002 υπάρχει και θ θλεκτρονικι ζκδοςθ, θ οποία :
 Ενθμερϊνεται 4 φορζσ το χρόνο
 Αντιςτοιχεί ςτουσ ταξινομικοφσ αρικμοφσ ςε κεματικζσ επικεφαλίδεσ
(LCSH), ςτατιςτικά, εννοιολογικά,
 ΢υνδζει τισ επικεφαλίδεσ αυτζσ με τισ εγγραφζσ τουσ
 Περιλαμβάνει πολλοφσ περιςςότερουσ όρουσ ςτο ευρετιριο Relative
Index.

12

Δεκαδική ταξινόμηςη Dewey (2)

 Αναπτφςςεται και ςυντθρείται από μια ΢υντακτικι Επιτροπι


ςτισ ΘΠΑ, που ζχει τθν ευκφνθ τθσ ζκδοςθσ με τθν ςυμβολι
καταλογογράφων από όλο τον κόςμο.
 ΢τθν Ελλάδα χρθςιμοποιείται ςτισ περιςςότερεσ λαϊκζσ και ςε
αρκετζσ ακαδθμαϊκζσ βιβλιοκικεσ.
 Ζχει γίνει μετάφραςθ από το ΕΚΣ θ 13θ ςυνοπτικι ζκδοςθ και
μοιράςτθκε ςτισ βιβλιοκικεσ.
 Ακόμα οι κεματικζσ ενότθτεσ που αφοροφν ςτθν Ελλθνικι
Λογοτεχνία, Λςτορία και Γεωγραφία ζχουν αναπτυχκεί,
μεταφραςτεί και εκδοκεί από τθν ΕΒΕ το 1986.

13
Το Dewey αποτελείται :
 τόμ. 1. Manual. Tables Σο εγχειρίδιο αποτελεί ζνα οδθγό
ταξινόμθςθσ για τα δφςκολα ςθμεία και παρζχει
πλθροφορίεσ για τουσ νζουσ ταξινομικοφσ Πίνακεσ. Οι
Πίνακεσ ςθμειογραφίασ προςτίκενται ςτουσ
ταξινομικοφσ αρικμοφσ για να προςφζρουν παραπάνω
πλθροφορία
 τόμ. 2. Schedules 000-599 οργάνωςθ τθσ γνϊςθσ από το
000-599
 τόμ. 3. Schedules 600-999 οργάνωςθ τθσ γνϊςθσ από το
600-999
 τόμ. 4. Relative index ζνασ αλφαβθτικόσ κατάλογοσ
κεμάτων, κατατάςςοντασ αλφαβθτικά τουσ
επιςτθμονικοφσ κλάδουσ με τουσ οποίουσ ςχετίηονται .

14

Dewey Schendules (1)


(Ταξινομικοί Πίνακεσ)
Σο ςφςτθμα ςυγκροτείται αρχικά από δζκα τάξεισ:

 000 – Γενικά κζματα, Επιςτιμθ τθσ Πλθροφόρθςθσ και


Πλθροφορικισ
 100 – Φιλοςοφία και Ψυχολογία
 200 – Κρθςκεία
 300 – Κοινωνικζσ επιςτιμεσ
 400 – Γλϊςςα
 500 – Φυςικζσ επιςτιμεσ και Μακθματικά
 600 – Tεχνολογία (εφαρμοςμζνεσ επιςτιμεσ)
 700 – Σζχνεσ - Καλζσ τζχνεσ και διακοςμθτικζσ τζχνεσ
 800 – Λογοτεχνία και Ρθτορικι
 900 – Λςτορία και Γεωγραφία
15
Dewey Schendules (2)
(Ταξινομικοί Πίνακεσ)
 Κάκε τάξθ χωρίηεται ςε 10 διαιρζςεισ , π.χ. :
 500 – Φυςικζσ επιςτήμεσ και μαθηματικά
 510 – Μακθματικά
 520 – Αςτρονομία και ςυναφείσ επιςτιμεσ
 530 – Φυςικι
 540 – Χθμεία και ςυναφείσ επιςτιμεσ
 550 – Γεωεπιςτιμεσ
 560 – Παλαιοντολογία - Παλαιοηωολογία
 570 – Επιςτιμεσ τθσ ηωισ - Βιολογία
 580 – Φυτά
 590 – Ηϊα
16

Dewey Schendules (3)


(Ταξινομικοί Πίνακεσ)

 Κάκε κφρια τάξθ υποδιαιρείται ςε 10 κατθγορίεσ, π.χ.:


 530 – Φυςική
◦ 531 – Κλαςικι μθχανικι Μθχανικι ςτερεϊν
◦ 532 –Μθχανικι ρευςτϊν Μθχανικι υγρϊν
◦ 533 – Αεροδυναμικι (Μθχανικι αερίων)
◦ 534 – Ιχοσ και ςυναφείσ δονιςεισ
◦ 535 – Φωσ και παραφωτικά φαινόμενα
◦ 536 – Κερμότθτα
◦ 537 – Θλεκτριςμόσ και θλεκτρονικι
◦ 538 – Μαγνθτιςμόσ
◦ 539 – ΢φγχρονθ Φυςικι
17
Δημιουργία ταξινομικοφ αριθμοφ (Dewey)
 Οι ακζραιοι υποδιαιροφνται κι αυτοί δεκαδικά.
 Σο ςφςτθμα είναι παράλλθλα ιεραρχικό :
 Παραδειγμα:
 300 Κοινωνικζσ επιςτιμεσ
◦ 330 – Οικονομικι (Economics)
 331 – Οικονομικι τθσ εργαςίασ (Labor Economics)
 332.2 - ΢υνκικεσ των εργαηομζνων (Employment conditions)
 332.21 - Μιςκοί (Compensation)
 332.216 - Μζκοδοι μιςκοδοςίασ (Compensation
methods)
 332.2162 - Χρόνοσ πλθρωμισ (Time payments)

18

Δόμηςη του ταξινομικοφ αριθμοφ


 Ο ακριβισ και εξειδικευμζνοσ ταξινομικόσ αρικμόσ ενόσ
τεκμθρίου δεν αρκείται μόνο ςτουσ Κφριουσ Σαξινομικοφσ
Πίνακεσ (τόμοι 2 και 3).
 Βαςίηεται ςτο ςυνδυαςμό του αρικμοφ των κυρίων
πινάκων και των αρικμϊν από τουσ βοθκθτικοφσ πίνακεσ
(τόμοσ 1).
 Οι βοθκθτικοί πίνακεσ είναι :
 1. ΢τακερζσ υποδιαιρζςεισ
 2. Γεωγραφικζσ περιοχζσ και πρόςωπα
 3. Λογοτεχνίασ και λογοτεχνικϊν μορφϊν
 4. Τποδιαιρζςεισ για οικογζνειεσ Γλωςςϊν
 5. Εκνικζσ ομάδεσ
 6. Γλϊςςεσ

19
Βοηθητικόσ Πίνακασ 1

 01 Φιλοςοφία και Κεωρία


Παράδειγμα :
 02 Ποικίλα Λεξικό Ψυχολογίασ  150.3
Φιλοςοφία τθσ γλϊςςασ  401
 03 Λεξικά, εγκυκλοπαίδειεσ Περιοδικό Κοινωνιολογίασ 
 04 Ειδικά κζματα 301.05

 05 Περιοδικζσ εκδόςεισ
 06 Οργανιςμοί και Διοικθτικι
 07 Εκπαίδευςθ, ζρευνα και ςυναφι
 08 Λςτορία και περιγραφι ςε ςχζςθ με ομάδεσ ατόμων
 09 Λςτορικι, γεωγραφικι , προςωποκεντρικι
κεϊρθςθ

20

Γεωγραφικζσ περιοχζσ, ιςτορικζσ


περίοδοι, πρόςωπα
 Πίνακασ 2: Επιτρζπει τθν επζκταςθ των αρικμϊν γεωγραφικά:
◦ 01-05 Historical periods
◦ 1 Areas, regions, places in general (temperate zones, land forms, not limited by
continent, country and locality)‫‏‬
◦ 2 Persons regardless of area, region, place (subdivision by biography, diaries,
ειδικά για πρόςωπα που ςχετίηονται με ζνα κζμα που το πρότυπο επιβάλλει τθν
άμεςθ ζνδειξθ, αντί τθσ -092
◦ 3 Ο αρχαίοσ κόςμοσ, χϊρεσ μζχρι τθν πτϊςθ τθσ Ρϊμθσ
◦ 4 Europe Western Europe
◦ 5 Asia Orient Far East
◦ 6 Africa
◦ 7 North America
◦ 8 South America
◦ 9 Other parts of world and extraterrestrial worlds Pacific Ocean islands

21
Δόμηςη του ταξινομικοφ αριθμοφ
 Ο ακριβισ και εξειδικευμζνοσ ταξινομικόσ αρικμόσ ενόσ
τεκμθρίου δεν αρκείται μόνο ςτουσ Κφριουσ Σαξινομικοφσ
Πίνακεσ (τόμοι 2 και 3).
 Βαςίηεται ςτο ςυνδυαςμό του αρικμοφ των κυρίων
πινάκων και των αρικμϊν από τουσ βοθκθτικοφσ πίνακεσ
(τόμοσ 1).
 Οι βοθκθτικοί πίνακεσ είναι :
 1. ΢τακερζσ υποδιαιρζςεισ
 2. Γεωγραφικζσ περιοχζσ και πρόςωπα
 3. Λογοτεχνίασ και λογοτεχνικϊν μορφϊν
 4. Τποδιαιρζςεισ για οικογζνειεσ Γλωςςϊν
 5. Εκνικζσ ομάδεσ
 6. Γλϊςςεσ

22

Παράδειγμα: Ευρώπη
 41 British isles
 42 England and Wales
 43 Central Europe Germany
 44 France and Monaco
 45 Italian Peninsula and adjacent islands Italy
 46 Iberian Peninsula and adjacent islands Spain
 47 Soviet Union Russia
 48 Scandinavia
 49 Other parts of Europe

23
Ελλάδα: Γεωγραφία, Ιςτορία, Λογοτεχνία

 ΢το ςφςτθμα Dewey θ Ελλάδα ςτον 2ο βοθκθτικό Πίνακα ζχει αρικμό 495.
Δθλαδι θ ιςτορία τθσ Ελλάδασ είναι ςτον 949.5, ενϊ θ αρχαία ιςτορία ςτο 938.
 Από το 1977 εξαςφαλίςτθκαν τα πνευματικά δικαιϊματα για τθν αλλαγι τθν
ανάπτυξθ και επεξεργαςία των πινάκων που αφοροφςαν τα ελλθνικά κζματα.
(Από τθν Ζνωςθ Ελλινων Βιβλιοκθκονόμων).
 Θ ιςτορία τθσ Ελλάδασ ταξινομείται ςτο 938 και καταργείται το 949.5
 938. 1 Αρχαία Ελλάδα
 938. 2 Αρχαία Ελλάδα – Γεωγραφικι υποδιαίρεςθ
 938.3 Βυηαντινι Αυτοκρατορία
 938.4 Σουρκοκρατία
 938.5 Ελλθνικι Επανάςταςθ
 938.6 Ελλθνικό Κράτοσ, 1830
 938.7 1914-1974
 938.8 1974-
 938.9 Γεωγραφικι διαίρεςθ

24

Παραδείγματα δημιουργίασ ταξινομικών


αριθμών
 Internet
see Manual at 004.678 vs. 006.7, 025.042, 384.33
 Internet--Canada 004.6780971
 Internet--dictionaries 004.67803
 Internet--education 004.678071
 Internet--films 791.43
 Internet--information systems 025.042
 Internet--instructional use 371.3344678
 Internet--instructional use--higher education 378.17344678
 Internet--libraries 020.2854678
 Internet--publicity 659.02854678
 Internet--radio programs 791.44
 Internet--sociology 302.231
 Internet--television programs 791.45
 Internet
see also Computer communications
 Internet addiction--medicine 616.8584
 Internet advertising 659.144
 Internet and teenagers 004.6780835

25
Παραδείγματα δημιουργίασ
ταξινομικών αριθμών (2)
 Πολιτικζσ εκλογζσ ςτθν Γαλλία το 2006.
◦ 324 Πολιτικζσ διαδικαςίεσ (Πολιτικά κόμματα, Εκλογζσ)
 44 Γαλλία (Από τον Πίνακα 2 )
 084 2000- “
ο ταξινομικόσ αρκιμόσ = 324.94409084
 ΢υμπεριφορά ετεροκαλϊν αδελφϊν ςτθν οικογζνεια τθσ
καναδικισ κοινωνίασ
◦ Περιοριςμζνθ ταξινόμθςθ: 306.8750971 (πλιρθσ αρικμόσ
ςε μια ερευνθτικι βιβλιοκικθ με μια μεγάλθ ςυλλογι
πάνω ςε κζματα κοινωνιολογίασ.
◦ Ευρεία ταξινόμθςθ: 306.875 ι και 306.87 (για λιγότερο
ειδικζσ βιβλιοκικεσ).
26

Το ταξινομικό ςφςτημα τησ Βιβλιοθήκησ του


Κογκρζςου
 Κεφαλαίοι Λατινικοί χαρακτιρεσ για το ςυμβολιςμό των κφριων κλάςεων και
υποκλάςεων, αρικμοί για τισ υπόλοιπεσ υποδιαιρζςεισ
 ΢υνθκιςμζνθ μορφι: γράμμα-αρικμόσ-γράμμα αρικμόσ από τα γενικά κζματα ςτα
ειδικότερα
 Χρονολογικζσ αναφορζσ αντιςτοιχοφν ςε γεγονότα, θμερομθνίεσ ζκδοςθσ, κ.α.
 Γεωγραφικζσ αναφορζσ γίνονται αλφαβθτικά, ξεκινϊντασ από το Δυτικό θμιςφαίριο
 Θ Γεωγραφία (G) είναι διαφορετικι κλάςθ από τθν ιςτορία (D)‫‏‬
 Political Science (J): γίνεται γεωγραφικι υποδιαίρεςθ – ςτο DDC γίνεται κεματικι
(κζμα-υποκζμα) και μετά γεωγραφικι
 Λογοτεχνία (P): υποδιαιρζςεισ με εκνικότθτα, χρονολογία, ςυγγραφζασ – DDC
(800): εκνικότθτα, τφποσ, ςυγγραφζασ
 Φιλοςοφία (B): υποδιαιρζςεισ με βάςθ τθν εκνικότθτα, Μουςικι (Μ) με βάςθ τθ
μορφι (όπερα, μουςικι δωματίου), ςυνκζτθσ, δεν υπάρχει κατθγοριοποίθςθ
χρονικι, είδθ ζκφραςθσ κλπ.
 Θ κατθγορία “Generalia” διαιρείται ςε “Α-General works”, encyclopedias AE, general
indexes AI, “Z-Bibliographies, works on libraries, book industry”

27
Το ταξινομικό ςφςτημα τησ
Βιβλιοθήκησ του Κογκρζςου (2)
 ΢φμφωνα με το ςφςτθμα αυτό θ ανκρϊπινθ γνϊςθ ταξινομείται ςε 26
γενικζσ κατθγορίεσ (classes) με βάςθ τα γράμματα του λατινικοφ
αλφαβιτου. Mε τθ ςειρά τθσ κακεμιά από τισ γενικζσ αυτζσ τάξεισ
υποδιαιρείται ιεραρχικά ςε μικρότερεσ κατθγορίεσ.

 A Γενικζσ εργαςίεσ
 B-BD Φιλοςοφία
 BF Ψυχολογία
 BH-BJ Aιςκθτικι, Hκικι
 BL BX Κρθςκεία
 C Bοθκθτικζσ Eπιςτιμεσ τθσ Iςτορίασ (ιςτορία του
Πολιτιςμοφ, Aρχαιολογία ωσ επιςτιμθ,
διπλωματικι, αρχεία, ςφραγίδεσ, χρονολογία,
νομιςματικι,επιγραφικι, εραλδικι, γενεαλογία,
βιογραφία)
28

Το ταξινομικό ςφςτημα τησ Βιβλιοθήκησ του


Κογκρζςου (3)
 D Iςτορία (γενικι)
 DA Mεγάλθ Bρετανία
 DAW Kεντρικι Eυρϊπθ
 DC Γαλλία
 DD Γερμανία
 DE Mεςόγειοσ, Eλλθνορωμαϊκόσ κόςμοσ
 DF Eλλάδα
 DG Iταλία
 DH Benelux [,Be(lgium -Ne(therlands)-(Lux(enburg)]
 DJ Oλλανδία
 DJK Aνατολικι Eυρϊπθ
 DK Xϊρεσ τθσ Πρϊθν E΢΢Δ,Πολωνία
 DL Bόρεια Eυρϊπθ (Δανία, Iςλανδία, Nορβθγία, ΢ουθδία, Φιλανδία)
 DP Iςπανία,Πορτογαλία
 DQ Eλβετία
 DR Bαλκάνια (Bουλγαρία, Pουμανία, Tουρκία, Aλβανία, Γιουγκοςλαβία)
 DS Aςία
 DT Aφρικι
 DU Aυςτραλία
 E Aμερικι
 F H.Π.A.
29
Το ταξινομικό ςφςτημα τησ Βιβλιοθήκησ του
Κογκρζςου (4)
 G Γεωγραφία, Aνκρωπολογία, Ανκρωπογεωγραφία,
Λαογραφία- Φολκλόρ, Ακλθτιςμόσ, ψυχαγωγία
 H Kοινωνικζσ Eπιςτιμεσ
 HA-HJ Oικονομικζσ επιςτιμεσ
 HM-HV Kοινωνιολογία
 HX ΢οςιαλιςμόσ
 J Πολιτικζσ Eπιςτιμεσ
 K Δίκαιο
 L Eκπαίδευςθ
 M Mουςικι
 N Kαλζσ Tζχνεσ
 P Φιλολογία
 PA Γλωςςολογία
 PAA Nζα Eλλθνικι λογοτεχνία

30

Το ταξινομικό ςφςτημα τησ Βιβλιοθήκησ του


Κογκρζςου (5)
 Q Κετικζσ Eπιςτιμεσ
 QA-QB Mακθματικά, Aςτρονομία
 QC Φυςικι
 R Iατρικι
 RC Ψυχιατρικι
 S Γεωργία
 T Tεχνολογία
 U-V Πολεμικι και ναυτικι τεχνολογία και τεχνικι
 Z Παλαιογραφία, Bιβλιοκθκονομία, Kατάλογοι
Bιβλιοκθκϊν, Eκνικζσ βιβλιογραφίεσ,
κατάλογοι χειρογράφων, βιβλιογραφία
(Oι κεματικζσ βιβλιογραφίεσ βρίςκονται κατά το πλείςτον ςτισ επί μζρουσ
κεματικζσ τουσ ενότθτεσ).

31
Παράδειγμα ταξινομικοφ αριθμοφ
 S AGRICULTURE (GENERAL) S
 SB PLANT CULTURE SB

324.85 Care and preparation of vegetables for market


Including cold storage
Cf. TX612.V4 Home storage of vegetables or
types of vegetables
Culture of individual vegetables or types of
vegetables
325 Asparagus
327 Beans. Common bean
Beans in your garden
SB327
32

Διεθνήσ Δεκαδική Ταξινόμηςη


Universal Decimal Classification System, UDC
 Αρχικόσ ςκοπόσ των δθμιουργϊν του να αποτελζςει ζνα «παγκόςμιο
ευρετιριο».
 Βαςίηεται ςτο Dewey, δεν κράτθςε τθ τριψιφια ςθμειογραφία του και
ενοποίθςε το 400 (γλϊςςα) και 800 (λογοτεχνία – ρθτορικι).
 Διαιρείται ωσ προσ τθ δομι του :
◦ ΢τουσ πίνακεσ που διαιροφνται ςτουσ κφριουσ και ςτουσ κοινοφσ και
ειδικοφσ βοθκθτικοφσ.
◦ ΢το ευρετιριο.
 Θ θλεκτρονικι μορφι των πινάκων του UDC περιλαμβάνει 65.000
κφριεσ διαιρζςεισκαι υποδιαιρζςεισ (MRF).
 Ζνα τεκμιριο μπορεί να ταξινομείται ςε περιςςότερεσ κεματικζσ
κατθγορίεσ (δθλϊνονται με “:”)‫‏‬
◦ 362.1 : 658.3 : 681.31 (Hospital: Personnel management: Computers)‫‏‬
◦ οι δθλϊςεισ για τόπο είναι ςε παρζνκεςθ

33
Colon Classification (CC)
Φαςετικι ανάλυςθ θ πιο ξεχωριςτι προςζγγιςθ ςτθν ιςτορία των
ςυςτθμάτων οργάνωςθσ γνϊςθσ. Θ πιο μεκοδικι από τα άλλα
«παραδοςιακά» ςυςτιματα. Δθμιοφργθμα του ινδοφ μακθματικοφ
και βιβλιοκθκονόμου S.R. Ranganathan, το 1933.
Ονομάηεται και αναλυτικο-ςυνκετικι ταξινόμθςθ.

Ανάλυςθ κακϊσ αναλφει κάκε κζμα ςε φαςζτεσ - ζννοιεσ και ςφνκεςθ ο


ςυνδυαςμόσ τισ ςχετικζσ φαςζτεσ – εννοιϊν ςτθ περιγραφι των κεμάτων που
αφορά το τεκμιριο.
 ζκεςε πζντε βαςικζσ φαςζτεσ: (formula PMEST)‫‏‬
 τθν προςωπικότθτα (personality),
 το υλικό (matter),
 τθν ενζργεια (energy) (δθλαδι οποιαδιποτε δραςτθριότθτα, λειτουργία, ι διαδικαςία),
 τον χϊρο (space) και
 τον χρόνο (time)‫‏‬
 H Classification Research Group επζκτειναν τον αρικμό των
φαςετϊν : thing/entity , kind, part, property, material, process, operation,
patient, product, by-product, agent, space, time

34

Colon Classification (CC)


 Παράδειγματα:
 ςχεδιαςμόσ ξφλινων επίπλων τον 18ο αιϊνα ςτθν Αμερικι
 ΑΝΑΛΤ΢Θ: προςωπικότθτα → ζπιπλα, υλικό → ξφλο, ενζργεια → ςχζδιο, χϊροσ → Αμερικι και χρόνοσ
→ 18οσ αιϊνασ.
 ΢ΤΝΚΕ΢Θ: ζπιπλα : ξφλινα : ςχεδίαςθ : Αμερικι : 18οσ αιϊνασ
Ο ταξινομικόσ αρικμόσ ζργα λογοτεχνικισ κριτικισ που ςχετίηονται με τθν
Ποιητική του Αριστοτέλη είναι : 013 : 1 : 9 x1
0 είναι το μόνωμα Λογοτεχνία
13 αναπαριςτά τθ γλϊςςα (ελλθνικι)

1 από τθ Λογοτεχνία θ υποδιαίρεςθ Ποίθςθ

9 από τισ ειδικζσ κοινζσ υποδιαιρζςεισ που προςδιορίηει τθ Λογοτεχνία και δείχνει ότι

το ζργο περιζχει κριτικι


X είναι επίςθσ κοινι υποδιαίρεςθ και αναπαριςτά ςυλλογικζσ εργαςίεσ και ςυλλογζσ.

1 θ διάταξθ αυτι επιτρζπεται για υψθλά δθμοφιλι τθσ κατθγορίασ (ςτο παράδειγμα

τθσ ελλθνικι λογοτεχνίασ ο Αριςτοτζλθσ παίρνει αρικμό 1 εξαιτίασ του μεγάλου


αρικμοφ τεκμθρίων για το ζργο του).

35
Άλλα ταξινομικά ςυςτήματα
 Charles Ammi Cutter (Expansive Classification)
 Βιβλιογραφικι ταξινόμθςθ (Bibliographic Classification, BC).
 James Duff Brown subject classification.
 Tο ταξινομικό ςφςτθμα τθσ Βιβλιοκικθσ του Λζνιν ςτθ
Μόςχα (30 τόμοι) από το 1960-1968.
 Σο ταξινομικό ςφςτθμα τθσ Κίνασ από το 1953.

36

Εφαρμογζσ ταξινόμηςησ ςτισ


Βιβλιοθήκεσ - Κατάλογοι
 Για τθν αξία και τθ λειτουργία μιασ βιβλιοκικθσ πολφ
ςθμαντικό ρόλο ζχει ο κατάλογοσ τθσ, ι οι κατάλογοί τθσ, θ
ςωςτι εφαρμογι τθσ ταξινόμθςθσ φαίνεται ςτο κατάλογό
τθσ.
 είδθ των καταλόγων :
 Αλφαβθτικόσ
 Κεματικοί (αλφαβθτικόσ κεματικόσ και ςυςτθματικόσ)
 Σοπογραφικόσ
 ΢κοπόσ του ςυςτθματικοφ καταλόγου θ κατάταξθ των
τεκμθρίων που ςυγγενεφουν μεταξφ τουσ, περιζχει τισ κφριεσ
αναγραφζσ (όπωσ είναι ςτα ράφια) με τον ίδιο ταξινομικό
αρικμό αλλά και τισ πρόςκετεσ αναγραφζσ.
 Χρειάηεται για να είναι αποτελεςματικόσ να χρθςιμοποιεί τθ
ςθμειογραφία του ταξινομικοφ ςυςτιματοσ κι ακόμα:
 Οι αναγραφζσ των κφριων υποδιαιρζςεων των κφριων τάξεων
 Επεξθγιςεισ δίπλα ςτισ επικεφαλίδεσ
 Διαςταυροφμενεσ αναγραφζσ για ομόβακμα κζματα
37
Ταξιθετικόσ αριθμόσ (call number)
Σαξικετικόσ αρικμόσ = (Σαξινομικόσ κωδικόσ, Αναγνωριςτικό)‫‏‬. Δείχνει τθ
«κζςθ ςτο ράφι» ενόσ τεκμθρίου.
΢το Dewey αποτελείται από τον αρικμό και τα πρϊτα γράμματα από τθν
κφρια αναγραφι : 306.87 ΜΟΤ
΢το LCC είναι πιο ςφνκετο π.χ. καλλιζργεια φαςολιϊν ςτο κιπο

Cutter’ SB327 SB327 SB327 SB327


tables .A45 .Q53 .Q55 .S38
2003 2007 2006 2005 Publ. year

38

Τα παραδοςιακά ταξινομικά ςυςτήματα ςτη


περιγραφή ηλεκτρονικών πηγών

 Θ χριςθ των παραδοςιακϊν ταξινομικϊν ςυςτθμάτων ςτο


περιβάλλον του διαδικτφου φζρει μια ςειρά πλεονεκτιματα, κακϊσ:
◦ Μποροφν να καλφψουν όλεσ τισ κεματικζσ περιοχζσ.
◦ Τποςτθρίηονται ευρζωσ και ανανεϊνονται με νζεσ εκδόςεισ
◦ Είναι τα περιςςότερα γνωςτά ςε πολλοφσ χριςτεσ κι ιδιαίτερα
χριςτεσ βιβλιοκθκϊν
◦ Επιτρζπουν τθν πολυγλωςςικι πρόςβαςθ ςτθ ςυλλογι κακϊσ τα
περιςςότερα από αυτά είναι μεταφραςμζνα ςε πολλζσ γλϊςςεσ.
◦ Σο κφρια ταξινομικά ςυςτιματα (που αναφερκικαμε) είναι τϊρα
διακζςιμα ςε μορφι μθχαναγνϊςιμθ.
 Παραδείγματα :

39
40

Συστήματα Οργάνωσης Γνώσης


Θεματική ευρετηρίαση

Κωνσταντία Κακάλη, Βιβλιοθηκονόμος MSc-Phd Candidate


Ομάδα Βάσεων Δεδομένων και Πληροφοριακών Συστημάτων,
Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης
Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας, Ιόνιο Πανεπιστήμιο
Περιεχόμενα
Θεματικές γλώσσες - λεξιλόγιο – είδη όρων -
Αντιστοιχία όρου και έννοιας – Σημασιολογία - Σχέσεις μεταξύ των εννοιών
Θεματική ανάλυση - Αρχεία Καθιερωμένων όρων
Ευρετηρίαση – Ευρετήρια - Συστήματα ευρετηρίασης
Επικεφαλίδες
Κωδικοποίηση επικεφαλίδων : MARC και UNIMARC - UNIMARC Authorities
Εγγραφή μιας επικεφαλίδας -- Παρουσίαση της στο χρήστη
Library of Congress Subject Headings (LCSH)
Σύνταξη θεματικής επικεφαλίδας
Ο ρόλος των παραπομπών στις θεματικές επικεφαλίδες
Metadata Authority Description Schema (MADS) - MADS Παραδείγματα
Θησαυρός
Οι όροι ενός θησαυρού
Ενικός – πληθυντικός
Σύνθετοι όροι
Σχέσεις όρων σε ένα θησαυρό
Συντομογραφίες σχέσεων θησαυρού
Παρουσίαση θησαυρού
Δημιουργία θησαυρού
Κατάλογος σημαντικών θησαυρών
Θησαυροί – θεματικές επικεφαλίδες
Συνοψη - Βιβλιογραφία
2

Θεματικές γλώσσες (2)


Δηλώσεις θεμάτων: σύνολο ζευγών facet/concept
π.χ. <τύπος γεύματος, δείπνο>
Κάθε έννοια (concept) είναι μια τάξη (class), στην οποία ένα
σύνολο από τεκμήρια είναι μέλη
Κάθε έννοια αναπαρίσταται από ένα όρο (term) ή ετικέτα
(label)
π.χ. ο όρος «δείπνο» όταν χρησιμοποιείται σε μια δήλωση θέματος
είναι μια ετικέτα για την τάξη των τεκμηρίων που το περιεχόμενό
τους περιστρέφεται γύρω από δείπνα
Ένας όρος μπορεί να αποτελείται από μία ή περισσότερες
λέξεις
Κάθε φασέτα (οπτική γωνία) είναι μια κατηγορία (category)
εννοιών (concepts)
π.χ. ο «τύπος γεύματος» είναι μια ετικέτα (label) κατηγορίας και το
«δείπνο» μια έννοια της κατηγορίας «τύπος γεύματος»
3
Θεματικές γλώσσες (3)
Μια γλώσσα έχει τα ακόλουθα συστατικά:
Λεξιλόγιο (vocabulary)
Σημασιολογία (semantics)
Συντακτικό (syntax)

Λεξιλόγιο
Σύνολο όρων
Στις γλώσσες θεμάτων το λεξιλόγιο είναι ελεγχόμενο
(controlled vocabulary) δηλ. μόνο συγκεκριμένοι όροι ή είδη
όρων επιτρέπεται να συμμετέχουν στις δηλώσεις θεμάτων
Ονομάζονται περιγραφείς (descriptors) ή προτιμώμενοι όροι (preferred
terms)
Αναφορές (references, “see” or “use”) από μη προτιμώμενους
όρους σε προτιμώμενους
Κριτήρια επιλογής προτιμώμενων όρων
Από κάτω προς τα πάνω (bottom-up)
Συχνότητα χρήσης από τους συγγραφείς
Συχνότητα χρήσης στις αναζητήσεις των χρηστών
Από πάνω προς τα κάτω
με τη χρήση εργαλείων (Dewey, Ranganathan) 5
Είδη όρων
απλός όρος: όρος που περιλαµβάνει µόνο µία ρίζα
ήχος, φως
σύνθετος όρος: όρος που περιλαµβάνει δύο ή περισσότερες
ρίζες
ηχοαπορρόφηση, ταχύτητα του ήχου, φωτοβολία, υπέρυθρο φως
δάνειος όρος: όρος που έχει ληφθεί από άλλη γλώσσα ή από
άλλο θεµατικό πεδίο
νεολογισµός: µονολεκτικός όρος – απλός ή σύνθετος – που
σχηµατίζεται και χρησιµοποιείται για πρώτη φορά στη
γλώσσα για την απόδοση δεδοµένης έννοιας

Αντιστοιχία όρου και έννοιας


Οµωνυµία (homonyms), ίδια εξωτερική µορφή
Οµόφωνα (homophones), π.χ. λιµός – λοιµός, τοίχος -
τείχος
Οµόγραφα (homographs)
Ταυτώνυµα (polysemy), π.χ. λόγος (=αιτία, οµιλία)
Πολυσηµία, (polysemy),
π.χ. κλάδος (δέντρου) – κλάδος (επιστηµονικός)
Συνωνυµία (synonyms)
Ταυτόσηµα (full synonyms), π.χ ικεσία - παράκληση
Ηµισυνώνυµα (quasi-synonyms), π.χ. καφενείο -
κυλικείο.
7
Σημασιολογία
Σημασιολογία κατηγοριών
Η κατηγοριοποίηση των εννοιών σε κατηγορίες
Σημασιολογία αναφοράς
Η αντιστοίχηση των όρων σε έννοιες έτσι ώστε:
Να προσδιορίζονται τα συνώνυμα και να ομαδοποιούνται μαζί και
Να αποσαφηνίζονται τα ομώνυμα (homonyms, λέξεις με ίδια
προφορά αλλά διαφορετική ορθογραφία και σημασία, scene,
seen)
Αναφορές από προτιμώμενους σε μη προτιμώμενους όρους και
αντίστροφα με τις σχέσεις USE (βλέπε) και UF (use for, βλέπε
επίσης)
Σημασιολογία συσχέτισης
Ο προσδιορισμός των συσχετίσεων μεταξύ των εννοιών
(paradigmatic relationships)
Ευρύτεροι, στενότεροι όροι, ισοδύναμοι κλπ
8

Σχέσεις µεταξύ εννοιών


Ιεραρχία
Όροι που περιγράφουν ένα φαινόμενο από τα μέρη του (πλοίο,
αυτοκίνητο, τραίνο – μέσα μαζικής μεταφοράς)
Πολύ-ιεραρχία: μεταλλική καρέκλα έπιπλο και μεταλλική κατασκευή
Ισοδυναμία (συνώνυμα)
Πλοίο, καράβι
Σχετική ισοδυναμία (quasi-synonyms) κληρονομικότητα – γενετική,
journalist-reporter
Πολυσημεία π.χ. συγκέντρωση: κοινωνικό γεγονός, χημικό
φαινόμενο, ψυχολογικό φαινόμενο
Συνάφεια
Αθλήματα, εκπαίδευση

9
Θεματική ανάλυση
Η θεματική ανάλυση γίνεται με την ταξινόμηση και την
θεματική ευρετηρίαση με σκοπό την υποστήριξη της
θεματική προσέγγιση του χρήστη στα τεκμήρια μιας
συλλογής. Είναι τόσο αντικειμενική όσο και υποκειμενική
ταυτόχρονα.
Αντικειμενική μέθοδος, μέτρηση αναφορών σε αντικείμενα και
πρόσωπα, ακόμα και αυτών που δεν αναφέρονται ξεκάθαρα
ο προσδιορισμός των θεμάτων που αφορούν σε ένα τεκμήριο είναι
υποκειμενική διαδικασία, εξαρτάται από τον αναγνώστη και από
τον ευρετηριαστή .
Προσδιορισμός συνόλου ή κανόνων κριτηρίων επιλογής ή
απόρριψης θεμάτων.
Η θεματική ευρετηρίαση προηγείται συνήθως της
ταξινόμησης

10

Αρχεία Καθιερωμένων όρων


Καθιερωμένες εγγραφές (authorities)
Ονόματα, τίτλοι, θέματα που χρησιμοποιούνται στον κατάλογο
Άλλοι όροι και πηγές που χρησιμοποιούνται για τον προσδιορισμό των
θεμάτων των τεκμηρίων
Τα αρχεία καθιερωμένων όρων συσχετίζουν τις βιβλιογραφικές εγγραφές του
καταλόγου
Συγκεντρώνουν τις διαφορετικές εκφάνσεις (manifestations, μεταφράσεις,
εκδόσεις κα) των τεκμηρίων
Ομαδοποιούν εγγραφές με ίδια θέματα
Ανάγκη ενιαίας αναπαράστασης των θεμάτων των βιβλιογραφικών εγγραφών
– ενιαία γλώσσα
Ένα αρχείο καθιερωμένων εγγραφών λειτουργεί ως ευρετήριο γιατί από κάθε
εγγραφή του μπορούμε να έχουμε πρόσβαση στις εγγραφές ενός καταλόγου
που με τη σειρά τους αντιπροσωπεύουν και περιγράφουν φυσικούς ή
ψηφιακούς πόρους.

11
Ευρετηρίαση – Ευρετήρια
Ευρετήριο είναι ο κατάλογος αναγραφών με αλφαβητικό ή άλλο τρόπο, ο
οποίος συμβάλλει στον εντοπισμό πληροφοριών σε ένα τεκμήριο ή σε
συλλογή τεκμηρίων.
Σκοπός του ευρετηρίου είναι:
ο προσδιορισμός και εντοπισμός σχετικών πληροφοριών μέσα στο τεκμήριο που
ευρετηριάζεται
η ανάλυση των εννοιών που περικλείονται σε ένα τεκμήριο προκειμένου να
παραχθούν οι σχετικές επικεφαλίδες
η διασφάλιση ότι οι όροι ευρετηρίασης που χρησιμοποιούνται συμβάλλουν στη
γρήγορη ανάκτηση πληροφοριών και στον προσδιορισμό των κατάλληλων
τεκμηρίων μίας συλλογής
η καθιέρωση σχέσεων ανάμεσα στις έννοιες
η καθοδήγηση των χρηστών στη χρήση επιλεγμένων όρων αναζήτησης μέσω
παραπομπών
η κατάταξη των όρων με συστηματικό τρόπο
Κανόνες ευρετηρίασης
•Εξειδίκευση (υψηλή ακρίβεια) η χρησιμοποίηση στενών (ειδικών) εννοιών
•Εξαντλητικότητα (υψηλή ανάκληση) η χρησιμοποίηση όλων των εννοιών
•Συνέπεια (υψηλή ανάκληση και ακρίβεια)

12

Συστήματα ευρετηρίασης
Ανάλογα με το πώς χειρίζονται τα σύνθετα θέματα, τα συστήματα
ευρετηρίασης μπορούν να διακριθούν σε προσυνδυασμένα και
υστεροσυνδυασμένα.
Στα Προσυνδυασμένα συστήματα, οι όροι ευρετηρίασης συνδυάζονται κατά
την ευρετηρίαση και διαχειρίζονται τα σύνθετα θέματα με ολοκληρωμένες
θεματικές περιγραφές. Στα προσυνδυασμένα ευρετήρια, οι σχέσεις μεταξύ
των όρων δηλώνονται με σύμβολα, καθένα από τα οποία εκφράζει ειδική
σχέση, με τη θέση των όρων στην κάθε αναγραφή, την τυπογραφία και με τη
στίξη που τους συνδέει.
Στα Υστεροσυνδυασμένα συστήματα, οι όροι δεν συνδυάζονται κατά την
ευρετηρίαση, αλλά κατά την αναζήτηση. Οι όροι που αποδίδουν το
περιεχόμενο του τεκμηρίου καταχωρούνται ανεξάρτητοι. Ο συνδυασμός των
όρων γίνεται κατά τη διάρκεια της αναζήτησης των πληροφοριών με διάφορες
τεχνικές. Στα υστεροσυνδυασμένα συστήματα, το τεκμήριο ανακτάται, εάν
όλοι ή ένας από τους όρους αυτούς χρησιμοποιηθούν για την αναζήτησή του.
Στα προσυνδυασμένα συστήματα υπάγονται τα ταξινομικά συστήματα και οι
κατάλογοι θεματικών επικεφαλίδων ενώ στα υστεροσυνδυασμένα οι
θησαυροί.

13
Επικεφαλίδες
Επικεφαλίδα ονομάζουμε το κύριο στοιχείο μιας εγγραφής το οποίο χρησιμοποιείται σε μια
γλώσσα θεματικής ευρετηρίασης και αποτελεί μοναδική εγγραφή σε ένα αρχείο
καθιερωμένων εγγραφών.
Οι τύποι των επικεφαλίδων είναι ονόματα :
Personal names (X00)
Corporate names(X10)
Meeting names (X11)
Names of jurisdictions (X51)
Uniform titles (X30)
Name/title combinations
και θεμάτα:
Topical terms (X50)
Geographic names (X51)
Names with subject subdivisions
Terms and names used as subject subdivisions
Ακόμα η μορφή των επικεφαλίδων μπορεί να είναι :
Απλές, σύμμεικτες, σύνθετες και επικεφαλίδες φράσεις

14

Επικεφαλίδες (2)
Ακόμα οι επικεφαλίδες χωρίζονται με βάση τη λειτουργία τους :
Επικεφαλίδα καθιερωμένου τύπου
Παραπεμπτική επικεφαλίδα
Επεξηγηματική επικεφαλίδα

Με βάση τη σχέση τους με άλλες επικεφαλίδες :


Ομοιόμορφη επικεφαλίδα
Παράλληλη επικεφαλίδα
Σχετική επικεφαλίδα
Παραλλαγή επικεφαλίδας
Επικεφαλίδα εναλλακτικής γραφής.

15
Κωδικοποίηση επικεφαλίδων : MARC και UNIMARC
To MARC είναι σύστημα κωδικοποίησης, η διάταξη καταχώρισης
βιβλιογραφικών δεδομένων σε υπολογιστικό σύστημα με στόχο τη διακίνηση
και την ανταλλαγή τους.
MARC21
το MARC21 αποτελεί σημείο αναφοράς. Έτσι, η βιβλιογραφική περιγραφή των
συμβατικών τεκμηρίων επιτυγχάνεται με τη βοήθεια των εργαλείων όπως
είναι το MARC, ενώ για τα ψηφιακά τεκμήρια η βιβλιογραφική περιγραφή και
ανταλλαγή μπορεί να συντελείται με σχήματα όπως το MODS, το EAD ή το
METS.
Το καθιερωμένο MARC21 διεκδικεί δυναμικά ρόλο στο νέο περιβάλλον
υιοθετώντας την XML και δημιουργώντας το MARCXML schema
UNIMARC
Σκοπός ανάπτυξης του η ενιαία διάταξη για την ανταλλαγή δεδομένων (IFLA).

16

UNIMARC Authorities
Βασική δομή
Πεδία (tags) που δηλώνουν:
τον τύπο μιας σειράς χαρακτήρων
τη λειτουργία που επιτελεί μια σειρά χαρακτήρων π.χ. αναφορές
(tracing, ίχνευμα)
Δείκτες (indicators): αριθμοί ή χαρακτήρες που η σημασία τους εξαρτάται
από τα tags αλλά έχουν την ίδια σημασία και χρήση σε όλα τα πεδία.
Υποπεδία (subfield): με αλφαβητικό ή αριθμητικό συμβολισμό που η
σημασία τους εξαρτάται από τα tags αλλά ως επί το πλείστον κοινά
δεδομένα ταυτοποιούνται από τα ίδια υποπεδία. Δεν παίζει ρόλο η σειρά
δήλωσης των υποπεδίων.
Υποχρεωτικά πεδία
001 Ταυτότητα εγγραφής
100 Γενικά Δεδομένα επεξεργασίας
2– Επικεφαλίδα
801 Πεδίο προέλευσης

17
Εγγραφή μιας επικεφαλίδας
001 GR-AtPPVa10001582 Επικεφαλίδα
003 GR-AtPPV καθιερωμένου τύπου
005 20081017155905.0
100 ## ‡a19920107agrey0105 ga Σημειώσεις
250 ## ‡aΚεφαλαιαγορά
300 1# ‡aΥποδιαιρείται γεωγραφικά
450 ## ‡aCapital market‡0750 Επικεφαλίδα
450 ## ‡aΑγορά κεφαλαίου εναλλακτικής γραφής
450 ## ‡aMarket, Capital Εγγραφές που δεν
550 ## ‡aΧρηματοοικονομική‡5g χρησιμοποιούνται
550 ## ‡aΑγορά χρήματος‡5g
550 ## ‡aΔάνεια‡5g
Παραπεμπτική
550 ## ‡aΧρεόγραφα‡5g αναγραφή για
550 ## ‡aΧρηματοοικονομικά ιδρύματα‡5g στενότερο όρο
550 ## ‡aΑγορά ομόλογων‡5h
550 ## ‡aΧρηματιστήρια αξιών‡5h Παραπεμπτική
801 #0 ‡aGR‡bΠάντειο Πανεπιστήμιο αναγραφή για
ευρύτερο όρο

18

Παρουσίαση της θεματικής επικεφαλίδας στο χρήστη

19
Library of Congress Subject Headings (LCSH)
Από το 1910 η Βιβλιοθήκη του Κογκρέσου των ΗΠΑ δημοσιεύει : Library of Congress Subject
Headings (LCSH). Μαζί υπάρχουν σημερα και :
Subject Headings for Children
Medical Subject Headings (MESH)
Σήμερα υπάρχει η 30η έκδοση τους, μέσα στο 2009 η 31η , σε έντυπη και ηλεκτρονική.
Ανάλογο κατάλογο αναπτύσσει η ΕΒΕ και πολλές βιβλιοθήκες, με προβλήματα σήμερα στην
ομοιομορφία τους μέσα από το Συλλογικό κατάλογο, κύρια στην απόδοση των όρων
στην ελληνική γλώσσα. Παράδειγμα από κατάλογο :
ΗΛΕΚΤΡΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ -- ΔΙΚΤΥΑ -- ΜΕΤΡΗΣΕΙΣ ΑΣΦΑΛΕΙΑΣ
Computer security
Computer networks-- Security measures
Δίκτυα υπολογιστών -- Ασφάλειας, Μέτρα
Internet-- Security measures
Διαδίκτυο -- Ασφάλειας, Μέτρα
Computer networks
Securities-- Data processing
Cryptography
Ασφάλεια δικτύου
ΑΣΦΑΛΕΙΑ ΥΠΟΛΟΓΙΣΤΩΝ
Δίκτυα υπολογιστών -- Μέτρα ασφάλειας
Δίκτυα ηλεκτρονικών υπολογιστών -- Μέτρα ασφάλειας
Ασφάλεια ηλεκτρονικών υπολογιστών
Ηλεκτρονικοί υπολογιστές -- Δίκτυα -- Μέτρα ασφαλείας
ΔΙΚΤΥΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΔΙΚΤΥΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ -- ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ
Security

20

Σύνταξη επικεφαλίδας
Η λεκτική απόδοση εξειδικευμένων θεμάτων απαιτεί ένα συνδυασμό όρων. Το
παρακάτω βιβλίο είναι είναι ένα συνέδριο με θέμα το δίκαιο (νομοθεσία) του
διαδικτύου στις χώρες της Ευρώπης.

Οι θεματικές επικεφαλίδες μπορούν να είναι και 8 τουλάχιστον συνδυασμοί:


Δίκαιο (law) / Διαδίκτυο (internet) / Ευρώπη (Europe) /συνέδριο
Ευρώπη / διαδίκτυο/ δίκαιο/ συνεδριο
Διαδίκτυο / Ευρώπη/ συνέδριο/ δίκαιο …..
Το σημείο πρόσβασης σημαντικό για τις θεματικές επικεφαλίδες με στόχο τη
διαμόρφωση μιας σύνθετης με τρόπο που η πλειονότητα των χρηστών θα αναζητούσε

Στο συγκεκριμένο παράδειγμα η θεματική επικεφαλίδα είναι


Διαδίκτυο -- Δίκαιο και νομοθεσία -- Ευρώπη – Συνέδρια

21
Κανόνες σύνταξης επικεφαλίδων
Οι θεματικές επικεφαλίδες μπορεί να εκφράζουν συγκεκριμένες έννοιες ή
αντικείμενα, ή αφηρημένες έννοιες.
Ουσιαστικά (απλές λέξεις), συνδυασμός ουσιαστικού – επιθέτου, συνδυασμός
δύο ουσιαστικών, ολόκληρες φράσεις, χωρίς χρήση άρθρων.
Ενικός αριθμός στις αφηρημένες έννοιες, μη μετρήσιμο ουσιαστικό (σίδηρος),
ενώ ο πληθυντικός αριθμός ουσιαστικά που μπορούν να μετρηθούν.
Στις σύνθετες θεματικές επικεφαλίδες με βαθμό εξειδίκευσης είναι σοβαρό:
1. Η λέξη, το σημείο εκείνο που εισάγει την επικεφαλίδα στο κατάλογο.
2. Τη σειρά με την οποία θα παρουσιαστούν τα επιμέρους συνθετικά της στη
σύνθετη επικεφαλίδα.
- φυσική ή αντεστραμένη μορφή (Ελληνική γλώσσα , αλλά Παραγωγή,
Προστασία της).
- η σειρά των συνθετικών μιας σύνθετης επικεφαλίδας (σύμφωνα με
Coates) : Αντικείμενο – Μέρος (του αντικειμένου) – Υλικό – Ενέργεια – Ιδιότητα .
- με βάση στίξη που χρησιμοποείται: παύλα (-), το κόμμα και τελεία (.)
έννοια χωρίς υποδιαίρεση/ εννοια με παύλα/ έννοια με κόμμα/ έννοια με
φράση
22

Κανόνες σύνταξης επικεφαλίδων(2)


Η βασική σειρά των υποδιαιρέσεων είναι :
Θέμα – Τόπος – Χρόνος – Μορφή
Παράλληλη χρήση θεματικού και τοπικού προσδιορισμού
Στους τομείς Γεωγραφίας, Ιστορίας, Κοινωνικών Επιστημών, Γλώσσας και Λογοτεχνίας
αποτελουν υποδιαίρεση σε τόπο Ελλάς – Ιστορία
Στους τομείς Καλές τέχνες, Φιλοσοφία, Θρησκεία, Τεχνολογία, Φυσικές Επιστήμες
υποδιαιρούνται με τόπο
Αλλά και τοπικός προσδιορισμός με επιθετο : Γαλλική λογοτεχνία
Υπάρχουν στις περισσότερες επικεφαλίδες οδηγίες για ένα θέμα αν θα έχει
γεωγραφική υποδιαίρεση.

Ο χρονικός προσδιορισμός έπεται του θεματικου και του τοπικού κατά την
διαμόρφωση μιας επικεφαλίδας.
Υπάρχουν περίοδοι στην Ιστορία (όπως στα ταξινομικά συστήματα) που χρησιμοποιούνται.

Μαζί με τις κύριες θεματικές επικεφαλίδες υπάρχει και ο κατάλογος,


τυποποιημένων σε μεγάλο βαθμό υποδιαιρέσεων που συνδυάζονται με τις
επικεφαλίδες π.χ. βιογραφία (μετά από ονόματα).

23
Απλές και ανεπτυγμένες θεματικές επικεφαλίδες
Ανάπτυξη με
υποδιαιρέσεις
(φασετες) με
χώρο και χρόνο
κ.α.

Υποδιαιρείται
γεωγραφικά

Μη
προτιμώμενοι
όροι

Πλατύτεροι
όροι
24

Ο ρόλος των παραπομπών στις θεματικές


επικεφαλίδες
Οι παραπομπές ως τυποποιημένες υποδείξεις είναι ένας μηχανισμός
καθοδήγησης του χρήστη με στόχο:
Να ενοποιήσουν τα συγγενή θέματα που βρίσκονται σε διαφορετικό σημείο στον
αλφαβητικό κατάλογο, ή να υποδείξουν συναφή θέματα ως προς το ερώτημα των
χρηστών
Να παραπέμψουν σε όρους που χρησιμοποιεί το ευρετήριο σε σχέση με τις πιθανές
αναζητήσεις των χρηστών.
Διακρίνονται σε τρεις κύριες κατηγορίες:
1. Παραπομπές του τύπου «βλέπε επίσης»
2. Παραπομπές του τύπου «βλέπε».
3. Παραπομπές επεξηγηματικού χαρακτήρα

25
Παραπομπές στις θεματικές επικεφαλίδες
Όπως και στους θησαυρούς οι κατάλογοι θεματικών επικεφαλίδων
χρησιμοποιούν παραπομπές με διαφορετική πολλές φορές
σημειογραφία:
BT (Broaden Term) : Παραπομπή προς τον ευρύτερο θεματικά όρο (σύμβολα <<, ΧΧ,
ΒΤ)
ΝΤ (Narrow Term) : Παραπομπή προς το στενότερο θεματικά όρο (σύμβολα >>, β.ε.,
ΝΤ)
RT (Related Term) : Παραπομπή προς επίσης χρησιμοποιούμενο όρο του ίδιου
θεματικά επιπέδου (σύμβολα >>, β.ε., RΤ).
USE : Παραπομπή από όρο που δεν χρησιμοποιείται στο προτιμώμενο (σύμβολα: >,
βλέπε, USE).
USE FOR: Αντίστροφη παραπομπή από όρο που δεν χρησιμοποιείται προς τον
χρησιμοποιούμενο (σύμβολα: <, Χ , UF).
Στις εγγραφές των καθιερωμένων στο UNIMARC οι παραπομπές
κωδικοποιούνται στο υποπεδίο $5 των πεδίων 4-- και 5– με το χαρακτήρα h
και g.

26

Ευρετήριο θεματικών επικεφαλίδων


Διαδίκτυο -- (41)
[Βλέπε Επίσης > Παγκόσμιος Ιστός -- (23)
[Βλέπε Επίσης Ευρύτερος Όρος] Πληροφοριακά συστήματα -- (13)
Διαδίκτυο, Αναζήτηση στο--
[Βλέπε > Αναζήτηση στο Διαδίκτυο -- (5)
Διαδίκτυο, Απάτη στο--
[Βλέπε > Απάτη στο διαδίκτυο -- (6)
Διαδίκτυο -- Δίκαιο και νομοθεσία -- (7)
Διαδίκτυο -- Δίκαιο και νομοθεσία -- Ελλάδα -- (7)
Διαδίκτυο -- Δίκαιο και νομοθεσία -- Ευρώπη -- (1)
Διαδίκτυο -- Δίκαιο και νομοθεσία -- Συνέδρια -- (1)
Διαδίκτυο -- Εγχειρίδια -- (6)
Διαδίκτυο -- Ελλάδα -- (4)
Διαδίκτυο -- Ευρώπη -- Συνέδρια -- (1)
Διαδίκτυο -- Ηνωμένες Πολιτείες Αμερικής -- (2)
Διαδίκτυο -- Ηνωμένες Πολιτείες Αμερικής -- Εγχειρίδια -- (1)
Διαδίκτυο -- Ηνωμένες Πολιτείες Αμερικής -- Οδηγοί -- (1)
Διαδίκτυο -- Ιστορία -- (2)
Διαδίκτυο -- Κοινωνικές απόψεις -- (32)
Διαδίκτυο -- Μεγάλη Βρετανία -- Δίκαιο και νομοθεσία -- (1)

27
Επικεφαλίδα ονόματος σε UNIMARC
001 GR-AtPPVa10016842
003 GR-AtPPV
005 20080516163334.0
100 ## ‡a19980826agrey0105 ga
200 #1 ‡aGarcia Marquez‡bGabriel‡f1928-
400 #1 ‡aMarquez Garcia‡bGabriel‡f1928-
400 #1 ‡aΜάρκες‡bΓκαμπριέλ Γκαρσία‡f1928-
400 #1 ‡aΓκαρσία Μάρκες‡bΓκαμπριέλ‡f1928-
801 #0 ‡aGR‡bΠάντειο Πανεπιστήμιο

Οποιοδήποτε όνομα μπορεί να χρησιμοποιηθεί ως θεματική κεφαλίδα


Δεν εμφανίζονται όλα στο LCSH
Εμφανίζονται στο LC's Name Authority File (NAF) – άλλο ευρετήριο
Το όνομα καθιερώνεται σύμφωνα με την ερμηνεία του LC's για τους
AACR2R

28

Metadata Authority Description


Schema (MADS)
Σχήμα για τη δημιουργία εγγραφών καθιερωμένων
αρχείων (authority files)
Δημιουργήθηκε από την Library of Congress, πρώτη
έκδοση τον Απρίλιο 2005,
http://www.loc.gov/standards/mads/
Απόλυτα συμβατό με το πρότυπο περιγραφικών
μεταδεδομένων MODS
Βασικό στοιχείο (root element) που περικλείει (wrap) μια
καθιερωμένη εγγραφή: <mads>
Σε περίπτωση καθιερωμένου αρχείου ή ομάδας
καθιερωμένων εγγραφών βασικό στοιχείο είναι το
<madsCollection>

29
Βασικές δομές
Μια MADS εγγραφή περιλαμβάνει ένα ή περισσότερα στοιχεία
<authority>, <related> ή <variant>
Πρέπει να υπάρχει ακριβώς ένα <authority> και πιθανόν να υπάρχει
οποιοσδήποτε αριθμός των <related> και/ή <variant>
Authority (περιγραφέας θέματος)
Related (see also)
Variant heading(s) (see)
Υποστοιχεία βασικών στοιχείων:
<name>
<titleInfo>
<topic>
<temporal>
<genres>
<geographic>
<hierarahicalGeographic>
<occupation>

<name> <titleinfo>
Χρησιμοποιείται για πρόσωπα, γεγονότα ή γεωγραφικές
ονομασίες
Υποστοιχεία:
< name Part> Attribute: type (date, family, given, termsOfAddress)
<role>
<role Term> Attributes: type (code, text)
<description> Attributes: ID, xlink, lang, xml: lang, script, transliteration, type (personal,
corporate conference, geographic), authority
Χρησιμοποιείται για την ομοιόμορφη περιγραφή τίτλων
Υποστοιχεία:
<title>
<subTitle>
<partNumber>
<partName>
<nonSort>
Attributes: ID, xlink, lang, xml: lang, script, transliteration, displayLabel, authority

31
Άλλα στοιχεία
<topic>: Χρησιμοποιείται για θεματικούς καθιερωμένους όρους
Attributes: ID, xlink, lang, xml:lang, script, transliteration, authority
<temporal>: Χρησιμοποιείται για χρονικά/ χρονολογικά θέματα
Attributes: ID, xlink, lang, xml:lang, script, transliteration, authority
(sources: coming soon), encoding (w3cdtf, iso8601, marc), point (start,
end), keyDate (yes), qualifier (approximate, inferred, questionable)
<genre>: Χρησιμοποιείται για ειδικούς όρους
<geographic>: Χρησιμοποιείται για τα επίσημα καθιερωμένα ονόματα των
γεωγραφικών οντοτήτων
<hierarahicalGeographic>: Χρησιμοποιείται για να παρέχει μία επίσημα
καθιερωμένη μορφή για τις ιεραρχικά γεωγραφικές ονομασίες.
Υποστοιχεία: <continent>, <country>, <province>, <region>, <state>,
<territory>, <county>, <city>, <island>, <area>
<occupation>: Χρησιμοποιείται για να παρέχει μία επίσημα καθιερωμένη
ονομασία για τις ονομασίες των επαγγελμάτων

32

Άλλα στοιχεία
<notes>
<affiliation>
<fieldOfActivity>
<url>
<identifier>
<extension>
<recordInfo>

33
Αναφορές
Τα στοιχεία <related> ή <variant> αποτελούν παραπομπές
<related>: Παραπομπή σε άλλη καθιερωμένη εγγραφή,
ισοδυναμεί με τις παραπομπές "see also" (UF) στους
καταλόγους βιβλιοθηκών
Attributes: earlier, later, parentOrg, broader, narrower, equivalent,
other
<variant>: Παραπομπή σε μη καθιερωμένη εγγραφή,
παραλλαγή ενός όρου, ισοδυναμεί με τις παραπομπές
"see" (USE)στους καταλόγους βιβλιοθηκών
Attributes: acronym, abbreviation, translation, expansion, other

34

MADS Παραδείγματα
<authority>
<geographic>Scotland</geographic>
<topic>History</topic>
<temporal>18th century</temporal>
</authority>
<authority>
<genre authority=“gsafd”>Historical fiction</genre>
</authority>
<authority>
<name type=“personal”>Law, Felicia</name>
<titleInfo><title>Ways we move</title></titleInfo>
</authority>

35
Φυσικό πρόσωπο
<mads xsi:schemaLocation="http://www.loc.gov/mads/ mads.xsd">
−<authority>
−<name>
<namePart>Smith, John</namePart>
<namePart type="date">1995</namePart>
</name>
</authority>
−<variant type="other">
-<name>
<namePart>Smith, John J</namePart>
</name>
</variant>
-<note type="history">Biographical note about John Smith</note>
-<affiliation>
<organization>Lawrence Livermore Laboratory</organization>
<dateValid>1987</dateValid>
</affiliation>
</mads>

36

Θεματική επικεφαλίδα
<mads>
-<authority>
<topic authority=“lcsh">Computer programming
</topic>
</authority>
<related type="broader">
<topic>Computers</topic></related>
<related type="narrower">
<topic>Programming languages</topic>
</related>
<related type=“other"><topic>Systems analysis
</topic></related>
</mads>

37
Θησαυρός
Θησαυρός είναι το λεξιλόγιο όρων µιας ελεγχόµενης γλώσσας ευρετηρίασης,
δοµηµένης µε τρόπο ώστε να υποδηλώνονται σαφώς οι “a priori” σχέσεις
µεταξύ εννοιών (για παράδειγµα, οι “πλατύτερες” – “στενότερες”). (από ΕΛΟΤ
1321)
οι θησαυροί μπορούν να χρησιμοποιηθούν από τους επαγγελματίες σε
διαδικασίες όπως
Ευρετηρίαση υλικού (indexing thesaurus): Το ελεγχόμενο λεξιλόγιο που
παρέχει ο Θησαυρός χρησιμεύει στη διαδικασία της ευρετηρίασης, χωρίς
να περιγράφει την επιστημονικά πιο σωστή ταξινόμηση. Δεν είναι η ειδική
ορολογία ενός επιστήμονα αλλά κοινώς αποδεκτοί και
χρησιμοποιούμενοι όροι, δηλαδή η φυσική γλώσσα.
Οργάνωση δομής και περιεχομένου.
Ο βασικός σκοπός των Θησαυρών είναι η καθοδήγηση τόσο του
ευρετηριαστή όσο και του χρήστη να επιλέξουν τον ίδιο όρο για την ίδια
έννοια

38

Θησαυρός (2)
Αλλά και από τους τελικούς χρήστες στην
Αναζήτηση – ανάκτηση (search thesaurus)
Aναζήτηση με λέξεις κλειδιά Ο Θησαυρός παρέχει το λεξιλόγια με το
οποίο μπορεί να βελτιώσει την διαδικασία αναζήτησης με αυτόματο
τρόπο ή διαδραστικά με λέξεις κλειδιά, και επίσης προσφέρεται για
επέκταση ερωτήματος. Η αναζήτηση αυτή μπορεί να πραγματοποιηθεί
είτε σε δομημένο (ευρετηριασμένο) περιεχόμενο), είτε σε ερώτημα
ελεύθερου κειμένου (free text query)
Φυλλομέτρηση Ο χάρτης του Θεματικού πεδίου που παρέχει μπορεί να
χρησιμοποιηθεί για την εξερεύνηση του από τον χρήστη.
Οι Θησαυροί τυπικά χρησιμοποιούνται ως εργαλεία στη διαδικασία της
υστερο-συνδυασμένης αναζήτησης, όπου ο χρήστης έχει τη δυνατότητα να
επιλέξει ο ίδιος τον συνδυασμό των εννοιών που θα αναζητήσει
Στο παράδειγμα στις θεματικές επικεφαλίδες : Διαδίκτυο – Δίκαιο και
νομοθεσία – Ευρώπη, σε ένα θησαυρό θα είχαμε τις χωριστές έννοιες:
Διαδίκτυο
Δίκαιο και νομοθεσία (ή μια από τις δύο)
Ευρώπη

39
Οι όροι ενός θησαυρού
Συγκεκριμένες οντότητες
Πράγματα και τα μέρη αυτών: κεφάλι, τραπέζια, κτίρια, μολύβια
Υλικά: γύψος, αμίαντος, χρώματα
Αφηρημένες έννοιες
Ενέργειες και γεγονότα: ανάπτυξη, διατήρηση, πόλεμοι, εορτές
Αφηρημένες οντότητες, ιδιότητες: δίκαιο, αντοχή, κάμψη, απόδοση
Επιστημονικά πεδία: χημεία, βιβλιοθηκονομία, πληροφορική
Μονάδες μέτρησης: μέτρα, χιλιόγραμμα
Ατομικές οντότητες, κύρια ουσιαστικά: Ελλάδα, Ευρωπαϊκή Ενωση, Ιόνιο
Παν/μιο, Ποταμός Πηνειός

40

Ενικός - πληθυντικός
Συγκεκριμένες οντότητες
Μετρήσιμα ουσιαστικά (που απαντούν στο “πόσα πολλά;”), στον
πληθυντικό: πλανήτες, παιδιά, μέρη σώματος, (εάν όμως
απαντώνται μία φορά στο ίδιο σώμα, προτιμάται ο ενικός, π.χ
πόδια, αλλά στόμα, αναπνευστικό σύστημα)
μη μετρήσιμα ουσιαστικά (που απαντούν στο “πόσο πολύ;”), στον
ενικό: αλουμίνιο, χιόνι, ρύζι (εάν πρόκειται για ομάδα με πολλές
συνιστώσες, τότε χρησιμοποιείται πληθυντικός, π.χ φρούτα,
κράματα, κράματα αλουμινίου, χάλυβες)
Αφηρημένες έννοιες
Χρησιμοποιείται ο ενικός, εκτός εάν πρόκειται για ομάδα με
πολλές συνιστώσες: διαχωρισμός, καπιταλισμός, μωαμεθανισμός,
μεταλλουργία, συσκευασία, διοίκηση, τεχνική, αλλά φυσικές
διεργασίες, χημικές ιδιότητες,
Ατομικές οντότητες, κύρια ουσιαστικά χρησιμοποιείται ο ενικός: Big
Ben, British Library, Γαλλία, Παρθενώνας
41
Σύνθετοι όροι
Οι σύνθετοι όροι πρέπει να διατηρούνται σύνθετοι όταν:
είναι πολύ οικείοι στη σύνθετη μορφή τους και αν χωρίζονταν θα υπήρχε
πρόβλημα στην κατανόησή τους (ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ, ΑΝΤΟΧΗ
ΥΛΙΚΩΝ, ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ ΔΙΑΧΕΙΡΙΣΗ)
κύρια ονόματα και όροι που εμπεριέχουν κύρια ονόματα (ΗΝΩΜΕΝΑ ΕΘΝΗ,
ΟΙΔΙΠΟΔΕΙΟ ΣΥΜΠΛΕΓΜΑ, )
όροι που χωρίς αυτούς χάνει την σημασία του ΣΥΖΗΤΗΣΗ ΣΤΡΟΓΓΥΛΗΣ
ΤΡΑΠΕΖΑΣ, ΤΕΤΡΑΓΩΝΙΚΗ ΡΙΖΑ)
όροι που δεν μπορούν να εκφραστούν ή να ορισθούν χωρίς (ΣΚΑΛΕΣ
ΔΙΑΦΥΓΗΣ, δηλ. ΣΚΑΛΕΣ για τη ΔΙΑΦΥΓΗ ΑΤΟΜΩΝ, ΠΕΤΡΕΛΑΙΟΜΗΧΑΝΕΣ, δηλ.
ΜΗΧΑΝΕΣ που χρησιμοποιούν ΠΕΤΡΕΛΑΙΟ για ΚΑΥΣΙΜΟ)
όροι που περιέχουν συγκατηγορηματικά ονόματα (ΤΕΧΝΗΤΑ ΜΕΛΗ,
ΑΠΟΛΙΘΩΜΕΝΑ ΨΑΡΙΑ)
Οι σύνθετοι όροι εισάγονται στη φυσική γλώσσα, όχι με ανεστραμμένη
μορφή.
ΑΡΠΑΚΤΙΚΑ ΠΟΥΛΙΑ, ΗΛΕΚΤΡΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ, ΧΡΕΗ ΠΡΟΣ ΤΟ ΔΗΜΟΣΙΟ

42

Σύνθετοι όροι
Σύνθετοι όροι που αναλύονται στα συστατικά τους μέρη
Όταν αναφέρεται σε μία ιδιότητα ή τμήμα
ΜΗΧΑΝΕΣ ΑΕΡΟΣΚΑΦΩΝ ΧΡ ΑΕΡΟΣΚΑΦΗ + ΜΗΧΑΝΕΣ
Αντίθετα, ο σύνθετος όρος παραμένει ως έχει, π.χ. ΟΞΙΝΟ ΕΔΑΦΟΣ, ΕΙΔΙΚΕΥΜΕΝΟ
ΠΡΟΣΩΠΙΚΟ
Όταν μια μεταβατική ενέργεια δεν τροποποιείται από το αντικείμενο στο οποίο ασκείται
η ενέργεια, τότε διασπάται.
Εκπαίδευση πιλότου ΧΡ ΠΙΛΟΤΟΙ + ΕΚΠΑΙΔΕΥΣΗ.
Κέντημα υφάσματος ΧΡ ΥΦΑΣΜΑΤΑ + ΚΕΝΤΗΜΑ
Αντίθετα, όταν έχει τροποποιηθεί, παραμένει στη σύνθετη μορφή του, π.χ.
ΣΚΑΛΙΣΜΕΝΟ ΞΥΛΟ, ΚΕΝΤΗΜΕΝΑ ΥΦΑΣΜΑΤΑ
Όταν μια αμετάβατη ενέργεια δεν τροποποιείται από τον εκτελεστή της ενέργειας
διασπάται, π.χ.
Εκρηξη βραστήρα ΧΡ ΕΚΡΗΞΗ + ΒΡΑΣΤΗΡΕΣ.
Μετανάστευση πτηνών ΧΡ ΠΤΗΝΑ + ΜΕΤΑΝΑΣΤΕΥΣΗ
Αντίθετα, ΑΠΟΔΗΜΗΤΙΚΑ ΠΤΗΝΑ, ΚΥΛΙΟΜΕΝΗ ΚΛΙΜΑΚΑ.

43
Σχέσεις όρων σε ένα θησαυρό
Σχέση ισοδυναμίας
ΧΡ (χρησιμοποίησε) γραμμένο ως πρόθεμα στον περιγραφέα.
ΧΑ (χρησιμοποίησε αντί) γραμμένο ως πρόθεμα στο μη προτιμώμενο
όρο
ΠΤΗΝΑ ΧΑ Πουλιά, Πουλιά ΧΡ ΠΤΗΝΑ.
Σχέση ιεραρχίας
ΠΟ (πλατύτερος όρος) γραμμένος ως πρόθεμα στον ανώτερο
ιεραρχικά όρο
ΕΟ (ειδικότερος όρος) γραμμένος ως πρόθεμα στον υπαγόμενο όρο.
ΑΕΡΟΠΟΡΙΚΕΣ ΓΡΑΜΜΕΣ
ΠΟ ΥΠΗΡΕΣΙΕΣ ΜΕΤΑΦΟΡΩΝ
ΥΠΗΡΕΣΙΕΣ ΜΕΤΑΦΟΡΩΝ
ΕΟ ΑΕΡΟΠΟΡΙΚΕΣ ΓΡΑΜΜΕΣ
Σχέση συσχέτισης ΣΟ (σχετικός όρος)
ΠΤΗΝΑ ΣΟ ΟΡΝΙΘΟΛΟΓΙΑ
ΟΡΝΙΘΟΛΟΓΙΑ ΣΟ ΠΤΗΝΑ
44

Συντομογραφίες
σχέσεων θησαυρού
ΔΣ ιευκρινιστική σημείωση (SN - Scope Note)
ΧΡ χρησιμοποίησε (use)
ΧΑ χρησιμοποίησε αντί (UF – used for)
ΟΚ όρος κορυφής (TT – top term)
ΠΟ πλατύτερος όρος (BT – broad term)
ΠΟΓ πλατύτερος όρος γένους
ΠΟΜ πλατύτερος όρος μέρους
ΕΟ ειδικότερος όρος (NT – narrow term)
ΕΟΓ ειδικότερος όρος γένους
ΕΟΜ ειδικότερος όρος μέρους
ΣΟ σχετικός όρος (RT – Related term)

45
Παρουσίαση θησαυρού USE
reference

SN scope
note

N narrower
term

R related
terms

Thesaurus of Psychological Terms


46
Relationship Section

Παρουσίαση θησαυρού (2)

47
Παρουσίαση θησαυρού (3)

DISORDERS CLUSTERS
Antisocial Behavior & Behavior disorders
Diagnosis
Disorder characteristics
Learning disorders & mental Retardation
Physical & Psychosomatic disorders
….. 48

Πολυεδρικός Θησαυρός
Η χρήση της φασετικής ανάλυσης στην δημιουργία θησαυρών είναι
χρήσιμη καθώς προσδίδουν πρόσθετη εξειδίκευση και ρόλο.

Κάθε πολυεδρικός θησαυρός ορίζει ένα περιορισμένο αριθμό από


βασικές φασέτες – κατηγορίες ( ίσως και υποκατηγορίες).
Κάθε έδρα περιλαμβάνει μια ενιαία (ομογενή) κλάση εννοιών με κοινά
χαρακτηριστικά έτσι ώστε κάθε έννοια να ανήκει σε μια μόνο κλάση.
Π.χ. στον ΑΑΤ ο όρος μάρμαρο ανήκει στην έδρα (κλάση) των υλικών
και υποδηλώνει ένα υλικό που χρησιμοποιείται στις τέχνες και την
αρχιτεκτονική. Ακόμα οι ιμπρεσιονιστές μπορούν να ορίζονται από την
φασέτα του Style και Period .

Στον πολυεδρικό ή πολυιεραρχικό αυτό θησαυρό οι όροι μπορούν να


έχουν πολλούς «γονείς».

49
Πολυεδρικός Θησαυρός (2)

50

Πολυεδρικός Θησαυρός (3)

Υποδιαρέσεις της
εδρας Styles and
Periods
Κάποιες είναι και
αυτές Ιεραρχίες (styles
and periods by region)
51
Δημιουργία Θησαυρού

Απαγωγική: Επεξεργασία των όρων που υπάρχουν στα τεκμήρια από


υπάρχοντα ευρετήρια, λεξικά, ταξoνομίες και καταρτίζοντας λίστες
όρων από ειδικούς στο γνωστικό αντικείμενο
Επαγωγική: Εξαγωγή όρων από αντιπροσωπευτικές συλλογές
τεκμηρίων με τη σειρά εμφάνισής τους. Δημιουργία θησαυρού από
τους στενότερους προς τον ευρύτερους όρους
Συνήθως χρησιμοποιούμε και τις δύο προσεγγίσεις

52

Θησαυροί – θεματικές επικεφαλίδες


Οι περιγραφείς και οι σχέσεις που χρησιμοποιούνται σε θησαυρούς
και θεματικές επικεφαλίδες πολλές φορές δεν διαφέρουν.
Οι θεματικές επικεφαλίδες υιοθέτησαν και προσαρμόστηκαν στην
οργάνωση και στη παρουσίαση των θησαυρών.
Οι θησαυροί όμως διαφέρουν πέρα από όλα τα άλλα καθώς:
Παρέχουν πιο εξειδικευμένους όρους από αυτούς των θεματικών κεφαλίδων
Καλύπτουν πιο συγκεκριμένα γνωστικά πεδία, π.χ. (APA Thesaurus – Ψυχολογία).
Η ανάπτυξη των όρων είναι πιο πλούσια, αυστηρή και δομημένη.
Οι θησαυροί αποφεύγουν την αντιστροφή των όρων (Τέχνη, Ελληνική)

Είναι συχνά πολύγλωσσοι, σε αντίθεση με τις θεματικές επικεφαλίδες


που η απόδοση τους σε διαφορετικές γλώσσες ευθύνεται το κέντρο
πληροφόρησης (Εθνικές βιβλιοθήκες κ.α.)

53
Συνοπτικά
Θεματικές επικεφαλίδες Θησαυροί
Μία έννοια : Πολλές έννοιες:
Βία,
Βία στις φυλακές
Φυλακές
Θρησκεία
Θρησκεία και κουλτούρα Κουλτούρα

Έχει υποδιαιρέσεις Δεν έχει υποδιαιρέσεις


Ελλάδα -- Ιστορία -- Εμφύλιος Ελλάδα ,
Πόλεμος, 1944-1949 --
Ιστορία,
Εμφύλιος Πόλεμος
Προσυνδυασμένη 1944-1949
Υστεροσυνδυασμένη
Διαδίκτυο -- Ιστορία --
Ιστορία
Διαδίκτυο

54

Θησαυροί
AAT (Art and Archtiecture Thesaurus)
http://www.getty.edu/research/conducting_research/vocabularies/aat
AGROVOC http://www.fao.org/agrovoc
ASFA (Aquatic Sciences and Fisheries Abstracts) http://www4.fao.org/asfa/asfa.htm
ASIS (Thesaurus of Information Science)
http://www.asis.org/Publications/bookstore/thes.html
ASTRONOMY http://www.mso.anu.edu.au/library/thesaurus/
British Museum collections http://www.mda.org.uk/bmmat/matintro.htm
CAB http://www.cabi.org/DatabaseSearchTools.asp?PID=277
CSA (Life Sciences Thesaurus)
http://www.csa.com/help/CSA_Illumina_Help.htm#Search_Tools/thesaurus.html
DEH (Environment and Heritage Thesaurus)
http://www.environment.gov.au/about/publications/dehthesaurus. html
(EET) European education thesaurus
http://www.eurydice.org/portal/page/portal/Eurydice/TEE

55
Θησαυροί
ERIC (Education Resources Information Center)
http://eric.ed.gov/ERICWebPortal/Home.portal?_nfpb=true&_pageLabel=Thesaurus&_nfls=f
alse
EUROVOC http://psp.cz/cgi-bin/eng/kps/knih/ee_geninfo.htm
HASSET (Social Science Information Gateway) >>> Intute
http://www.intute.ac.uk/socialsciences/thesaurus.html
ILO (International Labour Organization) http://www.ilo.org/public/libdoc/ILO-
Thesaurus/english/index.htm
INSPEC http://www.iee.org/publish/support/inspec/document/thes/
Library of Congress
(Graphic materials I) http://www.loc.gov/rr/print/tgm1/downloadtgm1.html
(Graphic materials II) http://www.loc.gov/rr/print/tgm2/downloadtgm2.html
MeSH http://www.nlm.nih.gov/mesh/MBrowser.html
NASA http://www.sti.nasa.gov/products.html
OΕCD (Organization for Economic Co-operation and Development)
http://info.uibk.ac.at/info/oecd-macroth/

56

Θησαυροί
TESE (Thesaurus for Education Systems in Europe)
http://www.eurydice.org/portal/page/portal/Eurydice/showPresentation?pubid=0
51EN
Thesaurus of psychological index terms
TNG (Thesaurus of Geographic Names)
http://www.getty.edu/research/conducting_research/vocabularies/tgn/
UNESCO http://www2.ulcc.ac.uk/unesco/thesaurus.htm

57
Resource Description Framework

Μανόλης Γεργατσούλης
Χρήστος Παπαθεοδώρου
Ομάδα Βάσεων Δεδομένων και Πληροφοριακών
Συστημάτων, Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας
Ιόνιο Πανεπιστήμιο

XML: document = δέντρο με ετικέτες


κόμβος = ετικέτα + γνωρ./τιμές + περιεχόμενα

<course date=“...”>
<title>...</title>
course
<teacher>...</teacher>
<name>...</name>
<http>...</http>
= title teacher students
<students>...</students>
</course>
name http

XML Schema: γραμματικές για περιγραφή εγκύρων


δέντρων και τύπων δεδομένων
Ερώτημα: γιατί να μην χρησιμοποιήσουμε XML για να
αναπαραστήσουμε σημασιολογία;
2
Η σύνταξη σε αντίθεση με τη
σημασιολογία
Σύνταξη: η δομή των δεδομένων.
Σημασιολογία: η σημασία των δεδομένων.
Δύο συνθήκες απαραίτητες για διαλειτουργικότητα:
Υιοθέτηση κοινής σύνταξης: επιτρέπει στις διάφορες
εφαρμογές να αναλύουν συντακτικά (parse) τα δεδομένα.
Υιοθέτηση ενός μέσου κατανόησης της σημασιολογίας:
επιτρέπει στις διάφορες εφαρμογές να χρησιμοποιούν τα
δεδομένα.
Η XML δεν παρέχει τα απαραίτητα μέσα για την
περιγραφή της σημασιολογίας.

Τι είναι η RDF ;
Η RDF (Resource Description Framework) είναι ένα
μοντέλο δεδομένων
ανεξάρτητο από το πεδίο εφαρμογής, και ανεξάρτητο
από συγκεκριμένη εφαρμογή,
μπορεί να ειδωθεί σαν ένας κατευθυνόμενος γράφος με
ετικέτες.
Το μοντέλο δεδομένων της RDF είναι ένα αφηρημένο,
εννοιολογικό επίπεδο ανεξάρτητο από την XML
επομένως, η XML μπορεί να παρέχει τη σύνταξη για την
RDF, αλλά δεν είναι συστατικό της RDF
τα RDF δεδομένα είναι πιθανόν να μην εμφανίζονται
ποτέ σε μορφή XML.

4
Αναπαραστάσεις της RDF
XML Encoding Graph
<rdf:RDF ……..>
<….>
<….>
</rdf:RDF> Μοντέλο
Δεδομένων
Κατάλληλη για Κατάλληλη
RDF
μηχανική για χρήση από
επεξεργασία ανθρώπους
Triples Η RDF είναι μια απλή
stmt(docInst, rdf_type, Document) γλώσσα για την
stmt(personInst, rdf_type, Person) δημιουργία
stmt(inroomInst, rdf_type, InRoom) αναπαραστάσεων που
stmt(personInst, holding, docInst) βασίζονται σε γράφους
stmt(inroomInst, person, personInst)
Κατάλληλη για
συμπερασματολογία
5

Το μοντέλο της RDF


Αποτελείται από ένα σύνολο δηλώσεων (statements).
Μια δήλωση RDF (RDF statement) συνίσταται από
Πόρους (resources) (= κόμβοι) = υποκείμενο (subject)
οι οποίοι έχουν ιδιότητες (properties) = κατηγόρημα (predicate)
οι οποίες έχουν τιμές (values) (=κόμβοι,strings) = αντικείμενο (object)

resource value
property

Παράδειγ α: “http://www.w3.org/TR/REC"rdf"syntax/ has creator Ora Lassila”

http://www.w3.org/TR/REC"rdf"syntax/
creator
: ιδιότητα
: πόρος “Ora Lassila”
: τιμή
6
Το μοντέλο της RDF (συνέχεια)
Οι δηλώσεις περιγράφουν ιδιότητες πόρων
(resources) του web
Ένας πόρος είναι κάθε αντικείμενο το οποίο μπορεί
να αντιστοιχηθεί σε ένα URI:
Ένα τεκμήριο, μια εικόνα, μια παράγραφος στο Web, …
Π.χ., http://www.ionio.gr/~manolis/index.html
Ένα βιβλίο στη βιβλιοθήκη, ένα υπαρκτό πρόσωπο (?)
isbn://5031-4444-3333

Οι ιδιότητες είναι επίσης πόροι (URIs)
7

Παράδειγμα στο RDF μοντέλο


“http://www.w3.org/TR/REC"rdf"syntax/ was created at
1999"02"22, its creator is Ora Lassila and its publisher is
W3C”
“W3C”

Publisher

http://www.w3.org/TR/REC"rdf"syntax/
Creator

Date
“Ora Lassila”

“1999"02"22”

8
Αναπαράσταση τριάδων
Η RDF μπορεί να κωδικοποιηθεί σαν ένα
σύνολο τριάδων (triples): !
<subject> <predicate> <object>.
Κάθε τριάδα αντιστοιχεί σε ένα
βέλος στο γράφο.
Η αναπαράσταση τριάδων του
διπλανού γράφου είναι η
ακόλουθη: %&&& '( (( " #$

http://www.w3.org/TR/REC"rdf"syntax Publisher “W3C”.


http://www.w3.org/TR/REC"rdf"syntax Date “1999"02"22”.
http://www.w3.org/TR/REC"rdf"syntax Creator “Ora Lassila”.

Αναπαράσταση τριάδων (συνέχεια)


Οι τριάδες RDF έχουν μια από τις ακόλουθες μορφές:
<URI> <URI> <URI>
<URI> <URI> <συμβολοσειρά σε εισαγωγικά>
Οι τριάδες μπορούν εύκολα να αναπαρασταθούν με λογική
Όπου το <subject> <predicate> <object> γίνεται:
<predicate>(<subject>,<object>)
Ενώ ο τύπος (<S>,<O>) γίνεται <O>(<S>)
παράδειγμα:
subclass(man,person)
sex(man,male)
domain(sex,animal) ; Ση είωση: για α̟λότητα δεν
man(adam) ; ε φανίζου ε τα ̟ραγ ατικά
age(adam,100) ; URIs
Οι τριάδες μπορούν εύκολα να αποθηκευτούν και να
διαχειριστούν από ένα σχεσιακό DBMS
Η επίπεδη φύση των τριάδων ταιριάζει με φυσικό τρόπο με τις σχεσιακές
ΒΔ.
10
Δομημένες τιμές
Μέχρι τώρα, οι τιμές των ιδιοτήτων ήταν ακολουθίες χαρακτήρων
(strings).
Ένας κόμβος του γράφου (που αντιστοιχεί σε ένα πόρο) μπορεί
επίσης να είναι η τιμή μιας ιδιότητας
είναι πιθανές εξαιρετικά πολύπλοκες δομές δέντρων ή γράφων
συντακτικά, οι τιμές μπορεί να είναι εμφυτευμένες ή να
αναφέρονται.
Παράδειγμα:”The individual whose name is Ora Lassila and whose
email is ora.lassila@nokia.com is the creator of
http://www.w3.org/TR/REC-rdf-syntax/”

http://www.w3.org/TR/REC"rdf"syntax/

Creator

“Ora Lassila”
Name
EMail

“ora.lassila@nokia.com” 11

Δομημένες τιμές (συνέχεια)


Αντίστοιχες τριάδες:
http://www.w3.org/TR/REC-rdf-syntax/, Creator, _:X.
_:X, Name, “Ora Lassila”.
_:X, EMail, “ora.lassila@nokia.com”.

http://www.w3.org/TR/REC"rdf"syntax/

Creator

Name
“Ora Lassila”
EMail

“ora.lassila@nokia.com”
12
Περιβλήματα
Τα περιβλήματα (Containers) στην RDF χρησιμοποιούνται για
την αναπαράσταση συλλογών από πόρους
επιτρέπουν ομαδοποίηση των πόρων (ή των τιμών).
Έναι δυνατό να διατυπώσουμε δηλώσεις που αναφέρονται σε
ένα περίβλημα (σαν ολότητα) ή στα ξεχωριστά μέλη του.
Η RDF παρέχει τρεις διαφορετικούς τύπους περιβλημάτων:
bag – συλλογή χωρίς διάταξη
seq – διατεταγμένη συλλογή (= “sequence”)
alt – αναπαριστά εναλλακτικές τιμές.
Επιτρέπονται επαναλαμβανόμενες τιμές
δεν υπάρχει μηχανισμός που να επιβάλει περιορισμούς
μοναδικότητας των τιμών.
Είναι δυνατόν να δημιουργηθούν συλλογές με βάση URI
πρότυπα
για παράδειγμα, όλα τα αρχεία σε ένα συγκεκριμένο web site.

13

Περιβλήματα (συνέχεια)
“http://www.w3.org/TR/REC"rdf"syntax/ has
as creator(s) Ora Lassila and Ralph Swick”

http://www.w3.org/TR/REC"rdf"syntax/

Creator
rdf:Type
rdf:Seq

rdf:_1 rdf:_2

“Ora Lassila” “Ralph Swick”


14
Περιβλήματα (συνέχεια)
“The students in course 6.001 are John, Tim
and Mary”

Courses/6.001
rdf:Bag
rdf:Type
students

rdf:_1
Students/John
rdf:_2
Students/Tim
rdf:_3

Students/Mary

15

Η RDF/XML σύνταξη
Το μοντέλο δεδομένων RDF παρέχει ένα αφηρημένο,
εννοιολογικό πλαίσιο για τον ορισμό και τη χρήση
μεταδεδομένων.
Μια συγκεκριμένη σύνταξη είναι όμως απαραίτητη για τη
δημιουργία και την ανταλλαγή των μεταδεδομένων.
Η XML μπορεί να χρησιμοποιηθεί σαν τέτοια σύνταξη.
Η RDF επίσης απαιτεί τη χρήση χώρων ονομάτων XML για να
συνδέει με ακρίβεια κάθε ιδιότητα (property) με το σχήμα που
ορίζει αυτήν την ιδιότητα.
Ορίζονται δύο τρόποι σύνταξης βασισμένοι στην XML για τη
κωδικοποίηση ενός στιγμιότυπου του RDF μοντέλου δεδομένων:
η σειριακή σύνταξη (serialization syntax): εκφράζει τις πλήρεις
δυνατότητες του μοντέλου με έναν συστηματικό τρόπο
η συντετμημένη σύνταξη (abbreviated syntax): παρέχει επιπλέον δομές
οι οποίες δίνουν τη δυνατότητα αναπαράστασης ενός υποσυνόλου του
μοντέλου με έναν πιο συμπαγή τρόπο
οι διερμηνείς RDF υποστηρίζουν και τους δύο τρόπους σύνταξης.

16
Βασική σειριακή σύνταξη
Η RDF XML σύνταξη έχει σχεδιαστεί κατά
τέτοιο τρόπο ώστε να ομαδοποιεί πολλαπλές
δηλώσεις για τον ίδιο πόρο σε ένα στοιχείο με
ετικέτα Description.
http://www.w3.org/TR/REC"rdf"syntax/
<?xml version=“1.0” encoding=“UTF-8”> creator
<rdf:RDF
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” “Ora Lassila”
xmlns:s=“http://description.org/schema”>
<rdf:Description about =
"http://www.w3.org/TR/REC-rdf-syntax/”> Υποκείμενο
<s:creator>Ora Lassila</s:creator>
</rdf:Description>
</rdf:RDF>
Αντικείμενο 17
Κατηγόρημα

Παράδειγμα “W3C”
dc:Publisher

http://www.w3.org/TR/REC"rdf"syntax/
dc:Creator
dc:Date
“Ora Lassila”

“1999"02"22”
<rdf:RDF
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:dc=“http://purl.org/dc/elements/1.1/”>
<rdf:Description about = "http://www.w3.org/TR/REC-rdf-syntax/”>
<dc:publisher>W3C</dc:publisher>
<dc:creator>Ora Lassila</dc:creator>
<dc:date>1999-02-22</dc:date>
</rdf:Description>
</rdf:RDF>
18
Βασική συντετμημένη σύνταξη
1η σύντμηση: αφορά ιδιότητες οι οποίες δεν
επαναλαμβάνονται εντός ενός στοιχείου Description
μπορούν να γραφούν σαν γνωρίσματα της XML
επισυναπτόμενα στο στοιχείο Description
<rdf:RDF xmlns:rdf=“...” xmlns:dc=“...”>
<rdf:Description about = "http://www.w3.org/TR/REC-rdf-syntax/”>
<dc:publisher>W3C</dc:publisher>
<dc:creator>Ora Lassila</dc:creator>
<dc:date>1999-02-22</dc:date>
</rdf:Description>
</rdf:RDF>

<rdf:RDF xmlns:rdf=“...” xmlns:dc=“...”>


<rdf:Description about=“http://www.w3.org/TR/REC-rdf-syntax/”
dc:publisher=“W3C”
dc:creator=“Ora Lassila”
dc:date=“1999-02-22”/>
</rdf:RDF>
19

http://www.w3.org/TR/REC"rdf"syntax/

Creator
Παράδειγμα με
http://www.w3.org/staffId/85740
αναφορές
Email Name

“ora.lassila@nokia.com” “Ora Lassila”

<rdf:RDF xmlns:rdf=“...” xmlns:s=“...”>


<rdf:Description about = “http://www.w3.org/TR/REC-rdf-syntax/”>
<s:Creator rdf:resource=“http://www.w3.org/staffId/85740” />
</rdf:Description>

<rdf:Description about=“http://www.w3.org/staffId/85740” >


<s:Name>Ora Lassila</s:name>
<s:Email>ora.lassila@nokia.com</s:Email>
</rdf:Description>
</rdf:RDF>
20
http://www.w3.org/TR/REC"rdf"syntax/

Εναλλακτικά Creator

με rdf:ID 85740

Email Name

“ora.lassila@nokia.com” “Ora Lassila”

<rdf:RDF xmlns:rdf=“...” xmlns:s=“...”>


<rdf:Description about = “http://www.w3.org/TR/REC-rdf-syntax/”>
<s:Creator rdf:resource=“#85740” />
</rdf:Description>

<rdf:Description rdf:ID=“#85740” >


<s:Name>Ora Lassila</s:name>
<s:Email>ora.lassila@nokia.com</s:Email>
</rdf:Description>
</rdf:RDF>
21

Συντετμημένη σύνταξη(συνέχεια)
2η σύντμηση: αφορά εμφωλευμένα στοιχεία Description
<rdf:RDF xmlns:rdf=“...” xmlns:s=“...”>
<rdf:Description about=“http://www.w3.org/TR/REC-rdf-syntax/”>
<s:Creator>
<rdf:Description about=“http://www.w3.org/staffId/85740”/>
<s:Name>Ora Lassila</s:name>
<s:Email>ora.lassila@nokia.com</s:Email>
</rdf:Description>
</s:Creator>
</rdf:Description>
</rdf:RDF>

<rdf:RDF xmlns:rdf=“...” xmlns:s=“...”>


<rdf:Description about=“http://www.w3.org/TR/REC-rdf-syntax/”>
<s:Creator rdf:resource=“http://www.w3.org/staffId/85740”
s:Name=“Ora Lassila”
s:Email=“ora.lassila@nokia.com”/>
</rdf:Description>
</rdf:RDF>
22
RDF XML http://www.w3.org/TR/REC"rdf"syntax/

σύνταξη dc:Creator

για περιβλήματα rdf:Type


rdf:Seq

rdf:_1 rdf:_2

“Ora Lassila” “Ralph Swick”


<rdf:RDF xmlns:rdf=“...” xmlns:dc=“...”>
<rdf:Description about = "http://www.w3.org/TR/REC-rdf-syntax/”>
<dc:creator>
<rdf:Seq>
<rdf:li>Ora Lassila</rdf:li> Τιμές
<rdf:li>Ralph Swick</rdf:li>
</rdf:Seq>
</dc:creator>
</rdf:Description>
</rdf:RDF> 23

Courses/6.001
rdf:Bag
rdf:Type
students
RDF XML rdf:_1
Students/John
σύνταξη rdf:_2

για περιβλήματα rdf:_3


Students/Tim

Students/Mary

<rdf:RDF xmlns:rdf=“...” xmlns:s=“...”>


<rdf:Description about = "Courses/6.001/”>
<s:students>
<rdf:Bag>
<rdf:li resource=“Students/John” />
<rdf:li resource=“Students/Tim” />
<rdf:li resource=“Students/Mary” /> Αναφορές σε
</rdf:Bag> πόρους
</s:students>
</rdf:Description>
</rdf:RDF> 24
Παράδειγμα rdf:Seq

rdf:type rdf:type
Ένας πόρος μπορεί
JSPapersbyDate JSPapersbySubj
να είναι τιμή για
περισσότερες από rdf:_1 rdf:_2
rdf:_3 rdf:_1
μια ιδιότητες (να http://www.s1.com/Aug96.doc
δείχνεται από rdf:_2
περισσότερα του http://www.s2.net/Sept97.ps rdf:_3
ενός βέλη). http://www.s3.com/Jan97.pdf
<rdf:RDF xmlns=“...”>
<Seq ID=“JSpapersByDate”>
<li resource=“http://www.s1.com/Aug96.doc”/>
<li resource=“http://www.s3.net/Jan97.pdf”/>
<li resource=“http://www.s2.com/Sept97.ps”/>
</Seq>
<Seq ID=“JSpapersBySubj”>
<li resource=“http://www.s2.com/Sept97.ps”/>
<li resource=“http://www.a1.com/Aug96.doc”/>
<li resource=“http://www.s3.net/Jan97.pdf”/>
</Seq>
</rdf:RDF> 25

Περιβλήματα ορισμένα σαν URI


πρότυπα
Χρησιμοποιώντας την παρακάτω δήλωση
μπορούμε να πούμε ότι:
κάθε πόρος που το URI του ξεκινά με
“http://foo.org/doc” έχει μια συγκεκριμένη
ιδιότητα copyright:
<rdf:RDF xmlns:rdf=“...” xmlns:s=“...”>
<rdf:Description aboutEachPrefix = "http://foo.org/doc”>
<s:copyright>1998, The Foo Organization</s:copyright>
</rdf:Description>
</rdf:RDF>

26
Δηλώσεις υψηλότερης τάξης
Είναι δυνατόν να διατυπώσουμε δηλώσεις RDF οι
οποίες αφορούν άλλες δηλώσεις RDF. Οι δηλώσεις
αυτές ονομάζονται δηλώσεις υψηλότερης τάξης (Higher-
order statements)
παράδειγμα: “Ralph Swick says that Ora Lassila is the creator of
the resource www.w3.org/TR/REC-rdf-syntax/”
Οι δηλώσεις υψηλότερης τάξης:
μας επιτρέπουν να εκφράσουμε πεποιθήσεις (beliefs) (και
άλλες «modalities»)
σημαντικές για trust models, digital signatures, κ.λ.π.
επίσης: μεταδεδομένα που αφορούν άλλα μεταδεδομένα
αναπαριστώνται μοντελοποιώντας RDF στην ίδια την RDF.
27

Υποστασιοποίηση
Για να διατυπώσουμε δηλώσεις σχετικά με άλλες δηλώσεις πρέπει να χτίσουμε
ένα μοντέλο της αρχικής δήλωσης εκφράζοντας τo σαν πόρο στον οποίο στη
συνέχεια μπορούμε να επισυνάψουμε ιδιότητες. Η διαδικασία αυτή
ονομάζεται υποστασιοποίηση (reification).
Η RDF παρέχει ένα ενσωματωμένο λεξιλόγιο ιδιοτήτων για αυτό:
rdf:subject, rdf:predicate, rdf:object and rdf:type
dc:Creator
http://www.w3.org/TR/REC"rdf"syntax “Ora Lassila”

a:attributedTo

“Ralph Swick”
Το περιεχόμενο του πλαισίου με τη στικτή γραμμή αντιστοιχεί στις παρακάτω
δηλώσεις:
<rdf:RDF xmlns:rdf=“...” xmlns:dc=“...”>
<rdf:Statement about = “StatementAboutREC-rdf-syntax”>
<rdf:subject resource=“http://www.w3.org/TR/REC-rdf-syntax”/>
<rdf:predicate resource=“dc:Creator”/>
<rdf:object>Ora Lassila</rdf:object>
</rdf:Statement> 28
</rdf:RDF>
Υποστασιοποίηση (συνέχεια)
Ένας νέος πόρος με τις παραπάνω τέσσερις
ιδιότητες αναπαριστά την αρχική δήλωση και
μπορεί να χρησιμοποιηθεί σαν αντικείμενο
άλλης ιδιότητας.
Ο πόρος με τις τέσσερις αυτές ιδιότητες δεν
αντικαθιστά την αρχική δήλωση αλλά είναι το
μοντέλο της δήλωσης αυτής, το οποίο
ονομάζεται υποστασιοποιημένη δήλωση
(reified statement).
29

Παράδειγμα
“Ralph Swick says that Ora Lassila is the creator of the
resource www.w3.org/TR/REC-rdf-syntax/”

http://www.w3.org/TR/REC"rdf"syntax/

rdf:subject

a:atributedTo rdf:Type
“Ralph Swick” rdf:statement

rdf:object rdf:predicate

“Ora Lassila” dc:Creator


30
Υποστασιοποίηση
Κάθε δήλωση μπορεί να είναι ένα αντικείμενο
οι γράφοι μπορεί να είναι εμφωλευμένοι

claims Author-of
NYT pers05 ISBN...

<rdf:Description rdf:about=“NYT”>
<claims>
<rdf:Description rdf:about=“pers05”>
<authorOf>ISBN...</authorOf>
</rdf:Description>
</claims>
</rdf:Description>
31

Ενναλακτικά
Κάθε δήλωση μπορεί να είναι ένα αντικείμενο
οι γράφοι μπορεί να είναι εμφωλευμένοι

claims Author-of
NYT pers05 ISBN...

<rdf:Description rdf:about=“NYT”>
<claims resource= “#StatementAboutpers05”/>
</rdf:Description>
<rdf:Statement rdf:ID= “StatementAboutpers05”>
<rdf:subject resource=“pers05”/>
<rdf:predicate>Author-of</rdf:predicate>
<rdf:object>ISBN…</rdf:object>
</rdf:Statement>
32
Το λεξιλόγιο της RDF
Η RDF διαθέτει όρους για να περιγράφουμε λίστες
(lists), σύνολα (bags), ακολουθίες (sequences), κ.λ.π.
Η RDF επιτρέπει επίσης να περιγράφουμε τριάδες
μέσω της υποστασιοποίησης.
Επιτρέπει δηλώσεις που αφορούν άλλες δηλώσεις
john believes _:s.
_:s rdf:type rdf:Statement.
_:s rdf:subject “manolis”.
_:s rdf:predicate teaches.
_:s rdf:object “Knowledge Management” .

33

Εισαγωγή στις Οντολογίες και το


Σημασιολογικό Ιστό

Μανόλης Γεργατσούλης
Χρήστος Παπαθεοδώρου
Ο Παγκόσμιος Ιστός
Ο παγκόσμιος ιστός είναι μια μεγάλη και επιτυχημένη
προσπάθεια αν αναλογιστεί κανείς
την ποσότητα της διαθέσιμης πληροφορίας, και
το ρυθμό αύξησης των ανθρώπων που τον χρησιμοποιούν.
Έχει αρχίσει να διαπερνά τις περισσότερες πλευρές της
καθημερινής μας ζωής αλλά και της ζωής των επιχειρήσεων
και οργανισμών.
Η επιτυχία του βασίζεται στην απλότητα του.
Η απλότητα του HTTP και της HTML που στοχεύουν στη
μεταφορά και προβολή υπερκειμένων, επέτρεψε στους
κατασκευαστές λογισμικού, στους φορείς παροχής
πληροφοριών και τους τελικούς χρήστες, την εύκολη
προσπέλαση στο νέο μέσο και συνέβαλε στο να
αναπτύξουν σε πολύ μικρό χρονικό διάστημα μια
σημαντική κρίσιμη μάζα.
2

Ο Παγκόσμιος Ιστός (συνέχεια)

Αυτή η απλότητα όμως ενδέχεται να αποβεί


εμπόδιο στην παραπέρα ανάπτυξη του
παγκόσμιου ιστού.
Αυτό το οποίο έχουμε σήμερα αποτελεί την
πολύ αρχική έκδοση του παγκόσμιου ιστού. Η
επόμενη έκδοση θα είναι ακόμα μεγαλύτερη
και πολύ πιο ισχυρότερη από τη σημερινή.

3
Παγκόσμιος Ιστός: Πλούσια Πηγή Πληροφοριών για
Διαχείριση και Ερμηνεία από τον Άνθρωπο -
Υπερπληροφόρηση

Χρήστης

Χρήστης

Η τεχνολογία του Σημασιολογικού


Παγκόσμιου Ιστού
Το όραμα του Tim Berners-Lee για τον
Σημασιολογικό Παγκόσμιο Ιστό προβλέπει:
σημασιολογία της πληροφορίας η οποία είναι
εύκολο να γίνει κατανοητή μηχανικά, και
εκατομμύρια από μικρές εξειδικευμένες
υπηρεσίες συλλογισμού (reasoning services) οι
οποίες παρέχουν υποστήριξη στην επιτυχή
επίτευξη εργασιών βασιζόμενες στην
προσπελάσιμη πληροφορία.

5
Ο Μελλοντικός Παγκόσμιος Ιστός: Πλούσια Πηγή
Πληροφοριών για Διαχείριση και Ερμηνεία από
τον Η/Υ

Χρήστης
Πράκτορας

Πράκτορας

Σημασιολογικός Παγκόσμιος Ιστός


(Semantic Web)
Σοβαρά προβλήματα στην
ανεύρεση
εξαγωγή
αναπαράσταση
ερμηνεία
συντήρηση
της πληροφορίας

WWW Semantic Web


URI, HTML, HTTP RDF, RDF(S), OWL

7
Η υλοποίηση του Σημασιολογικού Ιστού
Η υλοποίηση του Σημασιολογικού Παγκόσμιου Ιστού είναι ένα
εξαιρετικά φιλόδοξο εγχείρημα.
Ακόμη και η ‘μερική’ υλοποίηση του θα είναι σημαντικό επίτευγμα.
Απαιτείται η συμβολή πολλών επιστημόνων από διαφορετικά
επιστημονικά πεδία, όπως:
Τεχνολογίες βάσεων δεδομένων
Ευφυείς διαμεσολαβητές (agents)
Ψηφιακές βιβλιοθήκες
Μεταδεδομένα
Αναπαράσταση γνώσης και εξαγωγή συμπερασμάτων
Φυσικές γλώσσες
Οντολογίες
Πολυμέσα
Τεχνικές αναζήτησης και ερωταπαντήσεων
Οπτικοποίηση και μοντελοποίηση
....

Οι μηχανές αναζήτησης στο


Σημασιολογικό Παγκόσμιο Ιστό
Τρέχουσα τεχνολογία μηχανών αναζήτησης = λέξεις κλειδιά:
υψηλός βαθμός επανάληψης ανάκτησης, μικρή ακρίβεια
ευαίσθητες στο λεξιλόγιο
δε λαμβάνουν υπ’ όψιν το υπονοούμενο περιεχόμενο

Μηχανές αναζήτησης στο Σημασιολογικό Παγκόσμιο Ιστό:


αναζήτηση με βάση έννοιες αντί λέξεις κλειδιά
σημασιολογική εστίαση/διεύρυνση των ερωτήσεων
ερωταπαντήσεις ως προς περισσότερα του ενός κείμενα
χρήση τελεστών μετασχηματισμού των κειμένων

9
Από τα μεταδεδομένα στη γνώση
Ανάγκη: οργάνωση και ανάκτηση της πληροφορίας με βάση
τη σημασία της, τις έννοιες και όχι τις λέξεις
Συμβατικές βιβλιοθήκες: Ταξινομικά συστήματα, θησαυροί
Ψηφιακή Τεχνολογία: Οντολογίες
Ορίζουν τις έννοιες που υπάρχουν στα μεταδεδομένα και τις μεταξύ
τους σχέσεις ΠΑΡΑΓΩΓΗ ΓΝΩΣΗΣ!!
Περιγράφουν ένα πεδίο γνώσης και διατυπώνουν μια κοινά
αποδεκτή ορολογία ΠΑΡΑΓΩΓΗ ΓΝΩΣΗΣ!!
Αναπαριστούν αυτή τη γνώση στον υπολογιστή
Επιτρέπουν τη σύνδεση του περιεχομένου (το οποίο είναι
μηχαναγνώσιμο και επεξεργάζεται μηχανικά) με τις έννοιες
Επιτρέπουν την ανάπτυξη μηχανισμών εξαγωγής συμπερασμάτων

10

Ο ρόλος των Οντολογιών


Οι Οντολογίες συνενώνουν δύο ουσιώδη
συστατικά τα οποία συμβάλουν στην πλήρη
ανάπτυξη του Παγκόσμιου Ιστού:
ορίζουν την τυπική σημασιολογία της
πληροφορίας διευκολύνοντας την επεξεργασία
της πληροφορίας από τον Η/Υ
ορίζουν σημασιολογία του πραγματικού κόσμου
επιτρέποντας τη σύνδεση του περιεχομένου το
οποίο επεξεργάζεται μηχανικά, με τη σημασία
που του δίνουν οι άνθρωποι βασιζόμενοι σε
κοινά αποδεκτή ορολογία.

11
Οντολογία (Ontology)
Μακρά ιστορία που προέρχεται από την
Φιλοσοφία - Αριστοτέλης
“Η μεταφυσική μελέτη της φύσης της ζωής και της
ύπαρξης”
Η έννοια της οντολογίας έχει υιοθετηθεί από την
Τεχνητή Νοημοσύνη και σημαίνει
“μια διαμοιρασμένη και κοινή κατανόηση κάποιου
τομέα, η οποία μπορεί να ανταλλαγεί μεταξύ
ανθρώπων και συστημάτων εφαρμογών” Gruber

12

Το πρόβλημα
Άνθρωποι, οργανισμοί και προγράμματα πρέπει να
επικοινωνούν μεταξύ τους.
Οι διαφορετικές ανάγκες και το διαφορετικό υπόβαθρο
οδηγούν σε αποκλίνουσες οπτικές γωνίες και παραδοχές για
πράγματα που στην ουσία είναι ίδια μεταξύ τους.
Η έλλειψη κοινής αντίληψης οδηγεί σε:
προβλήματα στην επικοινωνία μεταξύ ανθρώπων και οργανισμών.
δυσκολίες στον προσδιορισμό των απαιτήσεων και κατά συνέπεια στην
ανάπτυξη των προδιαγραφών των συστημάτων.
Οι ανομοιόμορφες μέθοδοι μοντελοποίησης, οι γλώσσες και
τα εργαλεία λογισμικού περιορίζουν σοβαρά:
τη δια-λειτουργικότητα
την επαναχρησιμοποίηση και το διαμοιρασμό εφαρμογών.
Τελικά όλα τα παραπάνω οδηγούν στο να
ξαναανακαλύπτουμε τον τροχό.
13
Η λύση
Η εξάλειψη ή η μείωση της σύγχυσης σχετικά με τις
έννοιες και τους όρους και τελικά η απόκτηση κοινής
αντίληψης.
Αυτή η κοινή αντίληψη μπορεί να αποτελέσει το
ενοποιητικό πλαίσιο ανάμεσα στις διαφορετικές
οπτικές γωνίες και να συμβάλει στην βελτίωση της
επικοινωνίας, και της δια-λειτουργικότητας. Μπορεί
να διευκολύνει την ανάπτυξη προδιαγραφών και τη
βελτίωση της αξιοπιστίας συστημάτων και να
παρέχει δυνατότητες επαναχρησιμοποίησης τους.

14

Τι είναι η Οντολογία;
Μια οντολογία είναι μια τυπική (formal),
κατηγορηματική (explicit) προδιαγραφή μιας
διαμοιρασμένης (shared) εννοιολογικής
αναπαράστασης (conceptualization) - Gruber
Ο όρος ‘εννοιολογική αναπαράσταση’ (conceptualization)
αναφέρεται σε ένα αφηρημένο μοντέλο φαινομένων του κόσμου
στο οποίο έχουν προσδιοριστεί οι έννοιες που σχετίζονται με τα
φαινόμενα αυτά.
Ο όρος ‘κατηγορηματική’ (explicit) σημαίνει ότι το είδος των
εννοιών που χρησιμοποιούνται, και οι περιορισμοί που αφορούν
την χρήση αυτών των εννοιών είναι προσδιορισμένα με σαφήνεια.
O όρος ‘αυστηρή’ (formal) αναφέρεται στο ότι η οντολογία πρέπει
να είναι μηχανικά αναγνώσιμη.
Ο όρος ‘διαμοιρασμένη’ (shared) αναφέρεται στο ότι η οντολογία
πρέπει να αποτυπώνει γνώση κοινής αποδοχής στα πλαίσια μιας
κοινότητας.

15
Η μορφή μιας οντολογίας
Μια οντολογία μπορεί να πάρει διάφορες μορφές
αλλά οπωσδήποτε θα περιλαμβάνει ένα λεξιλόγιο
όρων και κάποιας μορφής προδιαγραφές για τη
σημασία τους.
Σχετικά με το βαθμό της τυπικότητας της
αναπαράστασης μιας οντολογίας αυτή μπορεί να
είναι:
Άτυπη (informal), εκφρασμένη σε μια φυσική γλώσσα.
Ημι-άτυπη (semi-informal): για παράδειγμα διατυπωμένη σε ένα
περιορισμένο και δομημένο υποσύνολο κάποιας φυσικής
γλώσσας.
Ημι-τυπική (semi-formal): διατυπωμένη σε μια τεχνητή και
αυστηρά ορισμένη γλώσσα.
Αυστηρά τυπική (rigorously formal): ορισμοί όρων με αυστηρή
σημασιολογία, θεωρήματα και αποδείξεις ιδιοτήτων όπως η η
ορθότητα (soundness) και η πληρότητα (completeness).
16

Τα βασικά συστατικά μιας Οντολογίας


Πέντε κατηγορίες συστατικών:
Κλάσεις (classes):
Έννοιες που σχετίζονται με ένα πεδίο ή κάποιες
εργασίες, οι οποίες είναι συνήθως οργανωμένες σε
κάποιο ταξινομικό σύστημα.
Σε μια οντολογία που αφορά το πανεπιστήμιο: ο
‘φοιτητής’ και ο ‘καθηγητής’ αποτελούν δύο κλάσεις.
Σχέσεις (relations):
Ένας τύπος αλληλεπίδρασης μεταξύ εννοιών ενός
πεδίου.
όπως: ,
17
Τα βασικά συστατικά μιας Οντολογίας
(συνέχεια)
Συναρτήσεις (functions)
Μια ειδική περίπτωση σχέσης στην οποία το ν-οστό στοιχείο της σχέσης
προσδιορίζεται μοναδικά από τα ν-1 προηγούμενα στοιχεία.
Παράδειγμα: Η τιμή-μεταχειρισμένου-αυτοκινήτου μπορεί να προσδιορίζεται
σαν συνάρτηση της αρχικής τιμής του καινούριου αυτοκινήτου, του μοντέλου
του αυτοκινήτου, των χαρακτηριστικών του αυτοκινήτου και των χιλιομέτρων
που έχει διανύσει.
Αξιώματα (axioms)
Αναπαριστούν προτάσεις που είναι πάντα αληθείς
Παράδειγμα: αν ο Φ είναι δευτεροετής φοιτητής τότε μπορεί να εγγραφεί στο
επιλεγόμενο μάθημα Μ.
Στιγμιότυπα (instances)
Αναπαριστούν συγκεκριμένα στοιχεία
Παράδειγμα: ο φοιτητής με το όνομα ‘Νίκος’ είναι ένα στιγμιότυπο της κλάσης
‘φοιτητής’

18

Παράδειγμα Οντολογίας (σε OIL)


class-def animal
%plants are a class that is disjoint from animals
class-def plant subclass-of NOT animal
%it is necessary but not sufficient for a tree
% to be a plant:
class-def tree subclass-of plant
%branches are PART OF trees
class-def branch
slot-constraint is-part-of has-value tree
%it is necessary and sufficient for a carnivore
% to be an animal:
class-def defined carnivore subclass-of animal
slot-constraints eats value-type animal
%herbivores eat only plants OR part of plants
class-def defined herbivore subclass-of animal
slot-constraint eats value-type plant OR
(slot-constraint is-part-of has-value plant)

19
Κατηγορίες Οντολογιών
Μερικές χαρακτηριστικές κατηγορίες οντολογιών είναι οι
ακόλουθες:
Οντολογίες πεδίου ορισμού (domain ontologies): αναπαριστούν γνώση
γύρω από ένα συγκεκριμένο πεδίο (π.χ. ιατρική, ηλεκτρονικά κ.λ.π.).
Οντολογίες μεταδεδομένων (metadata ontologies): παρέχουν ένα λεξιλόγιο
για την περιγραφή του περιεχομένου ηλεκτρονικά διαθέσιμης
πληροφορίας.
Γενικές ή κοινές οντολογίες (generic or common sense ontologies):
στοχεύουν στο να αποτυπώσουν γενική γνώση γύρω από τον κόσμο,
παρέχοντας βασικές έννοιες όπως ο χρόνος, ο χώρος, τα συμβάντα, κ.λ.π.
Οντολογίες αναπαράστασης (representational ontologies): παρέχουν
οντότητες αναπαράστασης χωρίς να προσδιορίζουν τι συγκεκριμένο
αναπαριστούν
π.χ. Frame Ontology (Gruber 1993): ορίζει έννοιες όπως frames, slots,
slot constraints κ.λ.π.
Οντολογίες μεθοδολογίας ή εργασιών (method or task ontologies):
παρέχουν όρους που αναφέρονται σε συγκεκριμένες εργασίες (π.χ.
διάγνωση κ.λ.π.)

20

Μερικές Εφαρμογές των Οντολογιών


Επικοινωνία μεταξύ ανθρώπων και οργανισμών.
Παρέχουν ολοκληρωμένο πλαίσιο εννοιών και ορολογίας μεταξύ
ανθρώπων με διαφορετικές ανάγκες και οπτικές γωνίες στα πλαίσια
ενός οργανισμού. Διευκολύνουν την επικοινωνία των ανθρώπων στα
πλαίσια του οργανισμού.
Δια-λειτουργικότητα (inter-operability) μεταξύ συστημάτων
Διάφοροι χρήστες χρειάζεται να ανταλλάσσουν δεδομένα ή
χρησιμοποιούν διαφορετικά πακέτα λογισμικού.
Χρήση οντολογιών για την υποστήριξη μετάφρασης μεταξύ
διαφορετικών γλωσσών και αναπαραστάσεων.
Μηχανική Συστημάτων (systems engineering)
Προδιαγραφές.
Επαναχρησιμοποίηση τμημάτων.
Αξιοπιστία.

21
Παράδειγμα: Ο όρος ‘procedure’ που χρησιμοποιείται από
ένα εργαλείο μεταφράζεται στον όρο ‘method’
Δια- που χρησιμοποιείται από το άλλο με τη
βοήθεια της οντολογίας, η οποία με τη σειρά
λειτουργικότητα της χρησιμοποιεί τον όρο ‘process’ για να
εκφράσει την ίδια έννοια.
give me the procedure for…

give me the
procedure = ???
here is the process for…
procedure for…
??? = process
give me the
procedure =
METHOD
process for…
METHOD =
here is
process here is the
the process for…
METHOD for…

Οι Οντολογίες σαν Inter-Lingua


Για την υποβοήθηση της δια-λειτουργικότητας οι οντολογίες
μπορούν να χρησιμοποιηθούν για να υποστηρίξουν τη μετάφραση
μεταξύ διαφορετικών γλωσσών και αναπαραστάσεων.
Μια προσέγγιση είναι να Χρησιμοποιώντας οντολογίες σαν
σχεδιάσουμε μοναδικούς inter-lingua για την υποστήριξη της
μεταφραστές για κάθε ζευγάρι μετάφρασης, μπορούμε να μειώσουμε
γλωσσών. Αυτό όμως θα τον αριθμό των μεταφραστών σε O(n)
απαιτούσε O(n 2 ) μεταφραστές
για n διαφορετικές οντολογίες. για n διαφορετικές οντολογίες, αφού
θα απαιτούνται μόνο μεταφραστές από
την μητρική οντολογία στην οντολογία
ανταλλαγής
Μεθοδολογία Ανάπτυξης Οντολογιών
Δεν υπάρχουν τυποποιημένες μεθοδολογίες για τη
ανάπτυξη οντολογιών παρά μόνο εμπειρικοί
κανόνες.
Στην εργασία M. Uschold & M. Gruninger 1996)
προτείνονται οι ακόλουθες φάσεις για την ανάπτυξη
οντολογιών:
Προσδιορισμός σκοπιμότητας και πεδίου εφαρμογής.
Κατασκευή της οντολογίας:
Σύλληψη (capture).
Κωδικοποίηση (coding).
Ενοποίηση (integration) υπαρκτών οντολογιών.
Αξιολόγηση (evaluation).
Τεκμηρίωση (documentation).
24

Προσδιορισμός σκοπιμότητας και


πεδίου εφαρμογής
Σημαντικό να ξεκαθαριστεί το γιατί να
κατασκευαστεί η οντολογία και ποιες είναι οι
πιθανές χρήσεις της.
Χρήσιμο είναι επίσης να προσδιοριστεί ποιοι
πρόκειται να είναι οι πιθανοί χρήστες της
οντολογίας.

25
Κατασκευή της οντολογίας
Σύλληψη
Προσδιορισμός των βασικών εννοιών και των μεταξύ τους σχέσεων.
Παραγωγή σαφών προδιαγραφών των εννοιών και των μεταξύ τους
σχέσεων σε μορφή κειμένου.
Συμφωνία για τους όρους με τους οποίους θα αναφερόμαστε στις έννοιες
και σχέσεις.
Κωδικοποίηση: ρητή αναπαράσταση της σύλληψης του προηγούμενου
σταδίου σε μια τυπική γλώσσα.
Ενοποίηση υπαρχουσών οντολογιών:
Θα πρέπει (και πως) να χρησιμοποιηθούν υπάρχουσες οντολογίες (ή
τμήματα αυτών); Γενικά δύσκολο πρόβλημα.
Αξιολόγηση: «έκφραση τεχνικών κρίσεων σχετικά με τις οντολογίες, το
σχετιζόμενο με αυτές περιβάλλον λογισμικού, και την τεκμηρίωση σε
σχέση με ένα πλαίσιο αναφοράς…» (Gomez-Perez, 1995).
Τεκμηρίωση: όλες οι σημαντικές παραδοχές τόσο αναφορικά με τις
βασικές έννοιες και με τα βασικά δομικά στοιχεία που χρησιμοποιήθηκαν
για την έκφραση αυτών των εννοιών, πρέπει να τεκμηριωθούν.

26

Μερικές εφαρμογές των οντολογιών


στο Σημασιολογικό Ιστό
Διευκόλυνση της επικοινωνίας αγοραστών-
πωλητών στο ηλεκτρονικό εμπόριο.
Σημασιολογική αναζήτηση πληροφορίας
Παροχή πληρέστερων περιγραφών
υπηρεσιών οι οποίες θα ερμηνεύονται
ευκολότερα από ευφυείς διαμεσολαβητές.

27
RDF Schema

Μανόλης Γεργατσούλης

Λεξιλόγια RDF: RDF Schema


Η RDF παρέχει μέθοδο για να εκφράζουμε απλές δηλώσεις που
αφορούν πόρους, χρησιμοποιώντας ιδιότητες (με ονόματα) και
τιμές.
Οι κοινότητες χρηστών της RDF χρειάζονται ακόμη τη δυνατότητα
να ορίζουν λεξιλόγια όρων (vocabularies or terms) που μπορούν
να χρησιμοποιηθούν σε δηλώσεις. Δηλαδή να δηλώσουν κλάσεις
(classes) πόρων και ιδιότητες (properties) που θα
χρησιμοποιήσουν για να περιγράψουν αυτούς τους πόρους.
Παράδειγμα: όσοι ενδιαφέρονται για τη περιγραφή βιβλιογραφικών
πόρων χρειάζονται κλάσεις όπως Book ή MagazineArticle, και ιδιότητες
όπως author, title, κ.α., για να τους περιγράφουν.
Η RDF δεν παρέχει τα μέσα για ορισμό τέτοιων κλάσεων και
ιδιοτήτων που αφορούν συγκεκριμένες εφαρμογές.
Αντίθετα, τέτοιες κλάσεις και ιδιότητες περιγράφονται σαν ένα
λεξιλόγιο RDF, χρησιμοποιώντας επεκτάσεις της RDF που
παρέχονται από την γλώσσα περιγραφής λεξιλογίων RDF που
ονομάζεται RDF Schema.
2
Η RDF Schema (συνέχεια)
Η RDF Schema δεν παρέχει λεξιλόγιο για κλάσεις και ιδιότητες
που αφορούν εφαρμογές. Παρέχει όμως τα μέσα για να
περιγράφουμε τέτοιες κλάσεις και ιδιότητες. Με άλλα λόγια, η
RDF Schema παρέχει ένα σύστημα τύπων (type system) για την
RDF.
Το σύστημα τύπων της RDF Schema μοιάζει αρκετά με το
σύστημα τύπων που διαθέτουν αντικειμενοστραφείς γλώσσες
προγραμματισμού όπως η Java.
Η RDF Schema επιτρέπει να δηλώνεται ότι κάποιοι πόροι
αποτελούν στιγμιότυπα (instances) μιας ή περισσοτέρων
κλάσεων. Επιτρέπει επίσης την ιεραρχική οργάνωση των
κλάσεων.
Παράδειγμα: μπορούμε να δηλώσουμε ότι η κλάση Dog είναι
υποκλάση της κλάσης Mammal η οποία με τη σειρά της είναι
υποκλάση της κλάσης Animal. Κάθε πόρος επομένως που ανήκει
στην κλάση Dog υπονοείται ότι ανήκει επίσης και στις κλάσεις
Mammal και Animal.

Η RDF Schema (συνέχεια)


Οι δυνατότητες αυτές παρέχονται με τη μορφή λεξιλογίου της
RDF, δηλαδή σαν εξειδικευμένο σύνολο προκαθορισμένων
πόρων της RDF, καθένας με δική του ξεχωριστή σημασία.
Οι πόροι στο λεξιλόγιο της RDF Schema διαθέτουν τα δικά τους
URIs με πρόθεμα το http://www.w3.org/2000/01/rdf-schema#
(που συνήθως συσχετίζεται με το πρόθεμα rdfs:).
Οι περιγραφές λεξιλογίων (schemas) που γράφονται σε RDF
Schema είναι έγκυροι RDF γράφοι. Έτσι, το λογισμικό της RDF
(που δεν έχει γραφτεί για να επεξεργάζεται λεξιλόγια της RDF
Schema) αναγνωρίζει τέτοιους γράφους ως έγκυρους RDF
γράφους που περιλαμβάνουν πόρους και ιδιότητες όμως δεν
θα «κατανοεί» την ενσωματωμένη σημασία αυτών των όρων
της RDF Schema (για την κατανόηση των οποίων χρειαζόμαστε
επιπλέον λογισμικό).

4
Το λεξιλόγιο όρων της RDFS
Η RDFS εισάγει το παρακάτω λεξιλόγιο όρων στους οποίους
επισυνάπτει σημασία με βάση το μοντέλο δεδομένων της RDF
Όροι για κλάσεις Όροι για συλλογές
rdfs:Class
rdfs:member
rdfs:subClassOf
rdfs:Container
Όροι για ιδιότητες rdfs:ContainerMembershipProp
rdfs:domain erty
rdfs:range Ειδικές ιδιότητες
rdfs:subPropertyOf rdfs:comment
Ειδικές κλάσεις rdfs:seeAlso
rdfs:Resource rdfs:isDefinedBy
rdfs:Literal rdfs:label
rdfs:Datatype
5

Κλάσεις και πόροι στην RDFS


Η RDFS ορίζει λεξιλόγιο για πόρους και κλάσεις:
οτιδήποτε στην RDF είναι “πόρος”
οι “κλάσεις” είναι επίσης πόροι, αλλά …
είναι ταυτόχρονα συλλογές πιθανών πόρων
Ανάμεσα στους πόρους ορίζονται σχέσεις:
“typing”: ένας πόρος ανήκει σε μια συγκεκριμένη κλάση
“subclassing”: τα στιγμιότυπα της μίας είναι και στιγμιότυπα
της άλλης
Σημειώστε ότι ο ίδιος πόρος μπορεί να ανήκει σε
περισσότερες από μια κλάσεις
“Type”, “subclass” είναι απλές δηλώσεις πάνω σε
πόρους
Οι πόροι μπορούν να προσδιορίζονται μέσω των URIs
επομένως, αυτές οι δηλώσεις μπορούν να εκφραστούν σε
RDF.
6
Κλάσεις
Οι πόροι είναι δυνατό να χωριστούν σε ομάδες που
ονομάζονται κλάσεις (classes). Τα μέλη μια κλάσης ονομάζονται
στιγμιότυπα (instances) της κλάσης.
Οι κλάσεις είναι και οι ίδιες πόροι.
Στην RDF υπάρχει διάκριση μεταξύ μιας κλάσης και των
στιγμιότυπων της. Με κάθε κλάση συνδέεται ένα σύνολο το
οποίο ονομάζεται έκταση της κλάσης (class extension), το οποίο
είναι το σύνολο των στιγμιότυπων της κλάσης. Δύο κλάσεις
μπορεί να έχουν το ίδιο σύνολο στιγμιότυπων αλλά να είναι
διαφορετικές κλάσεις.
Μια κλάση μπορεί να είναι μέλος της επέκτασης της καθώς και
στιγμιότυπο του εαυτού της.
Οι κλάσεις περιγράφονται με τη βοήθεια των πόρων rdfs:Class
and rdfs:Resource και των ιδιοτήτων rdf:type and
rdfs:subClassOf της RDF Schema.
Στην RDF Schema, κλάση είναι κάθε πόρος που διαθέτει την
ιδιότητα rdf:type με τιμή τον πόρο rdfs:Class. Σημειώστε ότι η
ιδιότητα rdf:type χρησιμοποιείται για να δηλώσει ότι ένας
πόρος είναι στιγμιότυπο κάποιας κλάσης.
7

Κλάσεις (συνέχεια)
Παράδειγμα δήλωσης κλάσης:
rdfs:Class

φοιτητής

Μαρία
Η συλλογή των πόρων οι οποίοι είναι κλάσεις της
RDF Schema είναι επίσης κλάση και ονομάζεται
rdfs:Class.
Ένας πόρος μπορεί να είναι στιγμιότυπο
περισσοτέρων της μιας κλάσεων.
8
Κλάσεις (συνέχεια)
Η ιδιότητα rdfs:subClassOf μπορεί να χρησιμοποιηθεί για να
δηλώσει ότι μια κλάση είναι υποκλάση μιας άλλης κλάσης.
Αν μια κλάση C είναι υποκλάση μιας κλάσης C', τότε όλα τα
στιγμιότυπα της C είναι επίσης και στιγμιότυπα της C'.
Ο όρος υπερκλάση (super-class) χρησιμοποιείται σαν ο
ανάστροφος του όρου υποκλάση. Αν μια κλάση C’ είναι
υπερκλάση μιας κλάσης C, τότε όλα τα στιγμιότυπα της C είναι
επίσης και στιγμιότυπα της C'.
Όλα τα αντικείμενα τα οποία περιγράφονται με RDF
ονομάζονται πόροι, και είναι στιγμιότυπα της κλάσης
rdfs:Resource. Αυτή η κλάση περιλαμβάνει τα πάντα. Όλες οι
άλλες κλάσεις είναι υποκλάσεις της κλάσης αυτής.
Η rdfs:Resource είναι ένα στιγμιότυπο της rdfs:Class

Κλάσεις (συνέχεια)
Η rdfs:Class είναι η κλάση των πόρων που είναι κλάσεις της
RDF.
Η rdfs:Class είναι στιγμιότυπο της rdfs:Class.
Η rdfs:Literal είναι η κλάση που περιλαμβάνει όλες τις τιμές με
χαρακτήρες (string).
Η rdfs:Literal είναι ένα στιγμιότυπο της rdfs:Class. Η rdfs:Literal είναι
υποκλάση της rdfs:Resource.
Η rdf:Property είναι η κλάση των ιδιοτήτων της RDF.
Η rdf:Property είναι στιγμιότυπο της rdfs:Class.
H rdfs:Datatype είναι η κλάση όλων των τύπων δεδομένων.
Η rdfs:Datatype είναι ταυτόχρονα και στιγμιότυπο και υποκλάση της
rdfs:Class.
Κάθε στιγμιότυπο της rdfs:Datatype είναι υποκλάση της rdfs:Literal.

10
Παράδειγμα ιεραρχίας κλάσεων

11

Παράδειγμα (συνέχεια)
MotorVehicle

Truck

PassegerVehicle

Van

MiniVan
12
Ιδιότητες στην RDFS
H Property είναι μια ειδική κλάση (rdf:Property)
επομένως οι ιδιότητες είναι επίσης πόροι
Οι ιδιότητες περιορίζονται από το πεδίο ορισμού
(domain) και το πεδίο τιμών (range) τους
δηλ., από το τι βρίσκεται “αριστερά” ή “δεξιά” τους
Π.χ., η parentOf είναι μια ιδιότητα με πεδίο ορισμού το
person και πεδίο τιμών το person.
Μια ιδιότητα μπορεί να είναι υπό-ιδιότητα (sub-
property) μιας άλλης ιδιότητας
Π.χ., η fatherOf είναι subProperty της ParentOf

13

Ιδιότητες (συνέχεια)
Η ιδιότητα rdfs:subPropertyOf μπορεί να
χρησιμοποιηθεί για να δηλώσει ότι μια ιδιότητα είναι
υπο-ιδιότητα (sub-property) μιας άλλης.
Αν μια ιδιότητα P είναι υπο-ιδιότητα μιας ιδιότητας P', τότε
όλα τα ζεύγη πόρων τα οποία συσχετίζονται με την P
συσχετίζονται επίσης με την P'.
Π.χ. Αν ο Νίκος είναι πατέρας (fatherOf) του Πέτρου, τότε ο Νίκος
είναι γονιός (parentOf) του Πέτρου.
Ο όρος υπερ-ιδιότητα (super-property) χρησιμοποιείται
συχνά σαν ο αντίστροφος του όρου υπο-ιδιότητα.
Αν μια ιδιότητα P’ είναι υπερ-ιδιότητα μιας ιδιότητας P,
τότε όλα τα ζεύγη πόρων τα οποία συσχετίζονται με την P
συσχετίζονται επίσης με την P'.
Δεν έχει οριστεί μια ιδιότητα η οποία είναι υπερ-ιδιότητα
όλων των ιδιοτήτων.

14
Ιδιότητες (συνέχεια)
Οι ιδιότητες είναι επίσης πόροι…
Έτσι, ιδιότητες ιδιοτήτων μπορούν να εκφραστούν σαν
... ιδιότητες της RDF
Π.χ.: το πεδίο τιμών της ιδιότητας parentOf είναι το Person
Η ιδιότητα rdfs:range είναι στιγμιότυπο της
rdf:Property και χρησιμοποιείται για να δηλώσει ότι οι
τιμές μιας ιδιότητας είναι στιγμιότυπα μιας ή
περισσοτέρων κλάσεων.
Η RDF δήλωση P rdfs:range C
έχει υποκείμενο=P, κατηγόρημα=rdf:range, και αντικείμενο=C
Σημαίνει: το P είναι στιγμιότυπο της κλάσης rdf:Property, η C
είναι στιγμιότυπο της rdfs:class, και οι πόροι που
αντιστοιχούν στα αντικείμενα των τριάδων με κατηγόρημα P,
πρέπει να είναι στιγμιότυπα της κλάσης C.

15

Ιδιότητες (συνέχεια)
Η ιδιότητα rdfs:domain είναι στιγμιότυπο της
rdf:Property και χρησιμοποιείται για να δηλώσει
ότι κάθε πόρος που έχει μια συγκεκριμένη
ιδιότητα είναι στιγμιότυπο μιας η περισσοτέρων
κλάσεων.
Η δήλωση: P rdfs:domain C
υποδηλώνει ότι το P είναι ένα στιγμιότυπο της
κλάσης rdf:Property, η C είναι ένα στιγμιότυπο της
rdfs:class και οι πόροι που αντιστοιχούν στα
υποκείμενα των τριάδων των οποίων το κατηγόρημα
είναι το P, είναι στιγμιότυπα της κλάσης C.

16
Ιδιότητες (συνέχεια)
Η ιδιότητα rdf:type είναι στιγμιότυπο της rdf:Property και
χρησιμοποιείται για να δηλώσει ότι ένας πόρος είναι
στιγμιότυπο μιας κλάσης.
Η δήλωση: R rdfs:type C
υποδηλώνει ότι το C είναι ένα στιγμιότυπο της rdfs:class και το R είναι
στιγμιότυπο της C.
Η ιδιότητα rdfs:subClassOf είναι στιγμιότυπο της rdf:Property
και χρησιμοποιείται για να δηλώσει ότι τα στιγμιότυπα μιας
κλάσης είναι και στιγμιότυπα της άλλης.
Η ιδιότητα rdfs:subClassOf είναι μεταβατική.
Η ιδιότητα rdfs:subPropertyOf είναι στιγμιότυπο της
rdf:Property και χρησιμοποιείται για να δηλώσει ότι όλοι οι
πόροι που σχετίζονται με μια ιδιότητα σχετίζονται επίσης και
με μια άλλη.
Η δήλωση: P1 rdfs:subPropertyOf P2
υποδηλώνει ότι τα P1 και P2 είναι στιγμιότυπα της rdf:Property, καθώς
και ότι το P1 είναι υπο-ιδιότητα της P2.
Η ιδιότητα rdfs:subPropertyOf είναι μεταβατική.
17

Ιδιότητες (συνέχεια)
Η ιδιότητα rdfs:label παρέχει μια εύκολα
αναγνώσιμη από τον άνθρωπο παραλλαγή του
ονόματος ενός πόρου.
Η δήλωση: R rdfs:label L
υποδηλώνει ότι το L μια εύκολα αναγνώσιμη από
τον άνθρωπο ετικέτα για τον πόρο R.
Η ιδιότητα rdfs:comment χρησιμοποιείται για
να παρέχει μια αναγνώσιμη από τον άνθρωπο
περιγραφή ενός πόρου.
Ένα σχόλιο σε μορφή κειμένου διευκολύνει στο
ξεκαθάρισμα της σημασίας των κλάσεων και των
ιδιοτήτων της RDF.
18
RDF classes
Class name comment
rdfs:Resource The class resource, everything.
The class of literal values, e.g. textual strings
rdfs:Literal
and integers.
rdf:XMLLiteral The class of XML literals values.
rdfs:Class The class of classes.
rdf:Property The class of RDF properties.
rdfs:Datatype The class of RDF datatypes.
rdf:Statement The class of RDF statements.
rdf:Bag The class of unordered containers.
rdf:Seq The class of ordered containers.
rdf:Alt The class of containers of alternatives.
rdfs:Container The class of RDF containers.
The class of container membership
rdfs:ContainerMembershipProperty properties, rdf:_1, rdf:_2, ..., all of which
are sub-properties of 'member'.
rdf:List The class of RDF Lists.
19

RDF properties
Property name comment domain range
The subject is an instance
rdf:type rdfs:Resource rdfs:Class
of a class.
The subject is a subclass of
rdfs:subClassOf rdfs:Class rdfs:Class
a class.
The subject is a
rdfs:subPropertyOf rdf:Property rdf:Property
subproperty of a property.
A domain of the subject
rdfs:domain rdf:Property rdfs:Class
property.
A range of the subject
rdfs:range rdf:Property rdfs:Class
property.
A human-readable name
rdfs:label rdfs:Resource rdfs:Literal
for the subject.
A description of the
rdfs:comment rdfs:Resource rdfs:Literal
subject resource.
A member of the subject
rdfs:member rdfs:Resource rdfs:Resource
resource.
20
RDF properties (συνέχεια)
Property name comment domain range
The first item in the subject
rdf:first rdf:List rdfs:Resource
RDF list.
The rest of the subject RDF list
rdf:rest rdf:List rdf:List
after the first item.
Further information about the
rdfs:seeAlso rdfs:Resource rdfs:Resource
subject resource.
The definition of the subject
rdfs:isDefinedBy rdfs:Resource rdfs:Resource
resource.
Idiomatic property used for
rdf:value rdfs:Resource rdfs:Resource
structured values
The subject of the subject RDF
rdf:subject rdf:Statement rdfs:Resource
statement.
The predicate of the subject
rdf:predicate rdf:Statement rdf:Property
RDF statement.
The object of the subject RDF
rdf:object rdf:Statement rdfs:Resource
statement.
21

Παράδειγμα
Person
subClassOf subClassOf

domain range
Student hasSuperVisor Researcher

type type
Frank hasSuperVisor Jeen

22
Σύνταξη της RDF Schema σε XML
<rdf:Description ID="MotorVehicle">
<rdf:type resource="http://www.w3.org/...#Class"/>
<rdfs:subClassOf rdf:resource="http://www.w3.org/...#Resource"/>
</rdf:Description>

<rdf:Description ID="Truck">
<rdf:type resource="http://www.w3.org/...#Class"/>
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdf:Description>

<rdf:Description ID="registeredTo">
<rdf:type resource="http://www.w3.org/...#Property"/>
<rdfs:domain rdf:resource="#MotorVehicle"/>
<rdfs:range rdf:resource="#Person"/>
</rdf:Description>

<rdf:Description ID=”ownedBy">
<rdf:type resource="http://www.w3.org/...#Property"/>
<rdfs:subPropertyOf rdf:resource="#registeredTo"/>
</rdf:Description>
23

RDF Schema (Παράδειγμα)


<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">

<rdfs:Class rdf:ID="Person">
<rdfs:comment>Person Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource"/>
</rdfs:Class>

<rdfs:Class rdf:ID="Student">
<rdfs:comment>Student Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="#Person"/>
</rdfs:Class>

<rdfs:Class rdf:ID="Teacher">
<rdfs:comment>Teacher Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="#Person"/>
</rdfs:Class>

<rdfs:Class rdf:ID="Course">
<rdfs:comment>Course Class</rdfs:comment>
<rdfs:subClassOf rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Resource"/>
</rdfs:Class>

24
RDF Schema (Παράδειγμα):Συνέχεια
<rdf:Property rdf:ID="teacherOf">
<rdfs:comment>Teacher of a course</rdfs:comment>
<rdfs:domain rdf:resource="#Course"/>
<rdfs:range rdf:resource="#Teacher"/>
</rdf:Property>

<rdf:Property rdf:ID="studentsOf">
<rdfs:comment>List of Students of a course in alphabetical order</rdfs:comment>
<rdfs:domain rdf:resource="#Course"/>
<rdfs:range rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Seq"/>
</rdf:Property>

<rdf:Property rdf:ID=“nameOf">
<rdfs:comment>Name of a Person or Course</rdfs:comment>
<rdfs:domain rdf:resource="#Person"/>
<rdfs:domain rdf:resource="#Course"/>
<rdfs:range rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Literal"/>
</rdf:Property>
</rdf:RDF>

25

Η RDFS υποστηρίζει απλές συνεπαγωγές


Μια οντολογία RDFS μαζί με μερικές δηλώσεις RDFS
μπορεί να παράγουν ως συμπεράσματα επιπλέον
δηλώσεις RDFS.
Αυτό δεν συμβαίνει στην XML.
Παράδειγμα:
συνεπάγεται:
domain(parent,person) subclass(woman,person)
γία
οντολογία

range(parent,person) parent(eve,cain)
subproperty(mother,parent) person(eve)
range(mother,woman) person(cain)
στιγμιότυπο

mother(eve,cain) woman(eve)
Αυτό είναι τμήμα του μοντέλου δεδομένων και όχι
των προγραμμάτων προσπέλασης και επεξεργασίας.
26
Μειονεκτήματα της RDFS
RDFS είναι αρκετά αδύναμη να περιγράψει πόρους σε
ικανοποιητική λεπτομέρεια, π.χ.:
Δεν υποστηρίζει τοπικούς περιορισμούς πεδίου ορισμού και
πεδίου τιμών
Δεν μπορούμε να πούμε ότι το πεδίο τιμών της hasChild είναι το person
όταν η ιδιότητα εφαρμόζεται σε ανθρώπους, ενώ είναι το elephant όταν
εφαρμόζεται σε ελέφαντες
Δεν υποστηρίζει περιορισμούς ύπαρξης και πλήθους
Δεν μπορεί να δηλώσει ότι όλα τα στιγμιότυπα της person έχουν
(ακριβώς) μια mother η οποία είναι επίσης person, καθώς και ότι τα μέλη
της κλάσης persons έχουν ακριβώς 2 parents
Δεν υποστηρίζει μεταβατικές, ανάστροφες και συμμετρικές
ιδιότητες
Δεν μπορεί να δηλώσει ότι η isPartOf είναι μεταβατική, ότι η hasPart
είναι η ανάστροφη της isPartOf η ότι η touches είναι συμμετρική
Η OWL είναι ένα επίπεδο πάνω στην RDFS για την
παροχή των χαρακτηριστικών αυτών.
27

OWL

Μανόλης Γεργατσούλης
Χρήστος Παπαθεοδώρου
W3C’s Web Ontology Language (OWL)
Η DAML+OIL εξελίχθηκε στην
OWL.
OWL
OWL δόθηκε ως W3C
recommendation στις 2/10/04
Στην OWL ορίζονται τρία επίπεδα
με μειούμενο βαθμό
πολυπλοκότητας και
εκφραστικότητας
Η OWL Full αποτελεί την πλήρη
γλώσσα
OWL DL (Description Logic) εισάγει
περιορισμούς
OWL Lite αποτελεί ένα αρχικό
επίπεδο της γλώσσας που στοχεύει
στο να είναι εύκολα κατανοητό και
υλοποιήσιμο
2

Η OWL και τα πρότυπα της W3C


Η OWL έχει σχεδιαστεί για να ικανοποιεί της απαιτήσεις μιας γλώσσας
οντολογιών στον Παγκόσμιο Ιστό. Αποτελεί μέρος των προτύπων που έχουν
προταθεί από την W3C όσον αφορά τον Σημασιολογικό Παγκόσμιο Ιστό.
Η XML αποτελεί ένα πρότυπο για τη σύνταξη δομημένων τεκμηρίων αλλά δεν
παρέχει σημασιολογικούς περιορισμούς που αφορούν τη σημασία του
τεκμηρίου.
Η XML Schema είναι μια γλώσσα που περιγράφει περιορισμούς που
αφορούν τη δομή των XML τεκμηρίων.
Η RDF είναι ένα μοντέλο δεδομένων για αντικείμενα (“πόρους") και σχέσεις
ανάμεσα τους. Παρέχει απλή σημασιολογία για αυτό το μοντέλο δεδομένων,
το οποίο μπορεί να παρασταθεί με τη βοήθεια της σύνταξης της XML.
Η RDF Schema είναι ένα λεξιλόγιο για την περιγραφή ιδιοτήτων και κλάσεων
των πόρων της RDF, και παρέχει σημασιολογία για ιεραρχίες γενίκευσης των
ιδιοτήτων και των κλάσεων.
Η OWL προσθέτει επιπλέον λεξιλόγιο για την περιγραφή ιδιοτήτων και
κλάσεων: μεταξύ άλλων σχέσεων ανάμεσα σε κλάσεις (e.g. disjointness),
cardinality (e.g. "exactly one"), ισότητα, πλουσιότερους τύπους ιδιοτήτων,
χαρακτηριστικά ιδιοτήτων (e.g. symmetry), και απαριθμήσιμες κλάσεις.

3
Υπογλώσσες της OWL
Η OWL παρέχει τρεις υπο-γλώσσες σχεδιασμένες για να χρησιμοποιούνται από
εξειδικευμένες κοινότητες χρηστών. Οι υπογλώσσες αυτές (κατά σειρά
αυξανόμενης εκφραστικότητας και πολυπλοκότητας) είναι:
OWL Lite προσφέρει ταξινομικές ιεραρχίες και απλούς περιορισμούς.
Απλούστερα τα εργαλεία για υποστήριξη της OWL Lite από ότι των εκφραστικότερων
υπογλωσσών.
OWL DL υποστηρίζει τη μέγιστη δυνατή εκφραστικότητα σε συνδυασμό με την
υπολογιστική πληρότητα (completeness) και αποφασισιμότητα (decidability)
(υπολογισμό όλων των δυνατών λύσεων σε πεπερασμένο χρόνο). Περιλαμβάνει όλα
τα δομικά στοιχεία της OWL, αλλά επιβάλλει συγκεκριμένους περιορισμούς στη
χρήση τους. (π.χ. Μια κλάση μπορεί να είναι υποκλάση άλλων κλάσεων, όμως δεν
μπορεί να είναι στιγμιότυπο άλλης κλάσης).
Η ονομασία της οφείλεται στην αντιστοιχία με τις description logics.
OWL Full παρέχει τη μέγιστη εκφραστικότητα και τη συντακτική ελευθερία της RDF
χωρίς όμως τις εγγυήσεις όσον αφορά τους υπολογισμούς.
Κάθε υπογλώσσα επεκτείνει την προηγούμενη της από εκφραστική και από
υπολογιστική άποψη. Τα παρακάτω ισχύουν, όχι όμως και τα αντίστροφα:
Κάθε έγκυρη OWL Lite οντολογία είναι και έγκυρη OWL DL οντολογία.
Κάθε έγκυρη OWL DL οντολογία είναι και έγκυρη OWL οντολογία.
Κάθε έγκυρο OWL Lite συμπέρασμα είναι έγκυρο OWL DL συμπέρασμα.
Κάθε έγκυρο OWL DL συμπέρασμα είναι έγκυρο OWL Full συμπέρασμα.

Υπογλώσσες της OWL (συνέχεια)


Οι κατασκευαστές οντολογιών που χρησιμοποιούν OWL θα πρέπει να
εξετάσουν ποια υπογλώσσα ικανοποιεί καλύτερα τις ανάγκες τους.
Η επιλογή ανάμεσα στην OWL Lite και την OWL DL εξαρτάται από της
απαιτήσεις σε πιο εκφραστικά δομικά στοιχεία όπως αυτά που παρέχουν η
OWL DL και η OWL Full.
Η επιλογή ανάμεσα στην OWL DL και την OWL Full εξαρτάται κυρίως από
τις απαιτήσεις σε meta-modeling δυνατότητες όπως αυτές που παρέχει το
RDF Schema (π.χ. Ορισμός κλάσεις από άλλες κλάσεις, ή η επισύναψη
ιδιοτήτων σε κλάσεις).
Η χρήση της OWL Full αντί της OWL DL, μειονεκτεί στις δυνατότητες
συλλογισμού αφού δεν παρέχονται ακόμη πλήρεις υλοποιήσεις της OWL
Full.
Η OWL Full μπορεί να θεωρηθεί ως επέκταση της RDF, ενώ η OWL Lite και
η OWL DL μπορούν να θεωρηθούν ως επεκτάσεις περιορισμένων
τμημάτων της RDF.
Κάθε OWL (Lite, DL, Full) τεκμήριο είναι ένα RDF τεκμήριο, και κάθε RDF
τεκμήριο είναι ένα OWL Full τεκμήριο, όμως μόνο μερικά RDF τεκμήρια
είναι έγκυρα OWL Lite ή OWL DL τεκμήρια.

5
Λίστα δομικών στοιχείων της OWL Lite
RDF Schema Features: Property Type Restrictions:
Class allValuesFrom
rdf:Property
someValuesFrom
rdfs:subClassOf
rdfs:subPropertyOf Restricted Cardinality:
rdfs:domain minCardinality (only 0 or 1)
rdfs:range maxCardinality (only 0 or 1)
Individual cardinality (only 0 or 1)
(In)Equality:
equivalentClass Annotation Properties:
equivalentProperty rdfs:label
sameAs rdfs:comment
differentFrom
rdfs:seeAlso
allDifferent
rdfs:isDefinedBy
Property Characteristics:
inverseOf Class Intersection:
TransitiveProperty
SymmetricProperty intersectionOf
FunctionalProperty
InverseFunctionalProperty
6

Λίστα δομικών στοιχείων της OWL Lite (συνέχεια)

Datatypes Header Information:


DatatypeProperty ontology
imports
Class Intersection:
intersectionOf
Versioning:
Annotation Properties: versionInfo
rdfs:label priorVersion
rdfs:comment backwardCompatibleWith
rdfs:seeAlso incompatibleWith
rdfs:isDefinedBy DeprecatedClass
DeprecatedProperty

7
Λίστα δομικών στοιχείων της OWL DL και της
OWL Full
Η λίστα των δομικών στοιχείων των γλωσσών OWL DL και OWL Full τα οποία
προστίθεται σε αυτά της OWL Lite δίνονται παρακάτω:

Class Axioms: Arbitrary Cardinality:


oneOf, dataRange minCardinality
disjointWith maxCardinality
equivalentClass cardinality
(applied to class expressions)
rdfs:subClassOf Filler Information:
(applied to class expressions) hasValue

Boolean Combinations of Class


Expressions:
unionOf
intersectionOf
complementOf
8

Χαρακτηριστικά της OWL Lite που σχετίζονται με την RDF


Class: Μια κλάση ορίζει ένα σύνολο ατόμων που την απαρτίζουν από κοινού επειδή
μοιράζονται κάποιες ιδιότητες.
Οι κλάσεις μπορούν να οργανώνονται σε ιεραρχίες εξειδίκευσης με τη βοήθεια της
subClassOf. Υπάρχει μια ενσωματωμένη πιο γενική κλάση που ονομάζεται Thing και είναι
υπερκλάση όλων των κλάσεων της OWL, καθώς και μια ενσωματωμένη πιο ειδική κλάση που
ονομάζεται Nothing, δε διαθέτει στιγμιότυπα και είναι υποκλάση όλων των κλάσεων της
OWL.
Παράδειγμα: ο John και η Mary ανήκουν και οι δύο στην κλάση Person.
rdfs:subClassOf: Δηλώνοντας ότι μια κλάση είναι υποκλάση μιας άλλης μπορούμε να
δημιουργήσουμε ιεραρχίες κλάσεων.
Παράδειγμα: η κλάση Person μπορεί να δηλωθεί ότι αποτελεί υποκλάση της κλάσης
Mammal. Από αυτό ένα σύστημα συλλογισμού μπορεί να συμπεράνει ότι αν κάποιος είναι
Person, τότε είναι και Mammal.
rdfs:Property: Χρησιμοποιείται για να δηλώσει σχέσεις ανάμεσα σε άτομα
(στιγμιότυπα κλάσεων) η ανάμεσα σε άτομα και τιμές.
Παραδείγματα ιδιοτήτων: hasChild, hasRelative, hasSibling: συσχετίζουν στιγμιότυπα της
κλάσης Person, (and are thus ObjectProperties),
hasAge: συσχετίζει ένα στιγμιότυπο της κλάσης Person με ένα στιγμιότυπο του τύπου
δεδομένων Integer (and is thus a Datatype property).
rdfs:subPropertyOf: Δηλώνοντας ότι μια ιδιότητα είναι υποιδιότητα μιας άλλης
μπορούμε να δημιουργήσουμε ιεραρχίες ιδιοτήτων.
Παράδειγμα: η hasSibling μπορεί να δηλωθεί σαν subproperty της hasRelative. Από αυτό ένα
σύστημα συλλογισμού μπορεί να εξάγει το συμπέρασμα ότι αν ένα άτομο σχετίζεται με
κάποιο άλλο με την ιδιότητα hasSibling, τότε σχετίζεται και με την ιδιότητα hasRelative.
9
Χαρακτηριστικά της OWL Lite που σχετίζονται με την RDF
(συνέχεια)
rdfs:domain: Το πεδίο ορισμού (domain) μιας ιδιότητας περιορίζει τα στιγμιότυπα
στα οποία μπορεί να εφαρμοστεί η ιδιότητα.
Παράδειγμα: Η ιδιότητα hasChild μπορεί να έχει σαν πεδίο ορισμού το Mammal. Από αυτό
ένα σύστημα συλλογισμού μπορεί να εξάγει το συμπέρασμα ότι αν ισχύει το Frank hasChild
Anna, τότε ο Frank πρέπει να είναι Mammal.
Η rdfs:domain ονομάζεται καθολικός περιορισμός (global restriction) επειδή επιβάλλεται
στην ιδιότητα και όχι μόνο στην περίπτωση που η ιδιότητα σχετίζεται με συγκεκριμένες
κλάσεις.
rdfs:range: Το πεδίο τιμών (range) μιας ιδιότητας περιορίζει τις τιμές που μπορεί να
πάρει μια ιδιότητα. Αν μια ιδιότητα συσχετίζει ένα άτομο με ένα άλλο άτομο και η
ιδιότητα έχει σαν πεδίο τιμών μια κλάση, τότε το δεύτερο άτομο πρέπει να ανήκει
στην κλάση αυτή.
Παράδειγμα: σαν πεδίο τιμών της ιδιότητας hasChild μπορεί να δηλωθεί η κλάση Mammal.
Από αυτό ένα σύστημα συλλογισμού μπορεί να εξάγει το συμπέρασμα ότι αν η Louise
σχετίζεται με την Deborah με την ιδιότητα hasChild, δηλ., η Deborah είναι παιδί της Louise,
τότε η Deborah είναι Mammal.
Η rdfs:range είναι επίσης καθολικός περιορισμός.
Individual: τα άτομα (individuals) είναι στιγμιότυπα των κλάσεων, και οι ιδιότητες
μπορούν να χρησιμοποιηθούν για να συσχετιστεί ένα άτομο με ένα άλλο.
Παράδειγμα: ένα άτομο με την ονομασία Deborah μπορεί να περιγραφεί σαν ένα
στιγμιότυπο της κλάσης Person ενώ η ιδιότητα hasEmployer μπορεί να χρησιμοποιηθεί για
να συσχετιστεί το άτομο Deborah με το άτομο StanfordUniversity.

10

Ισότητα και ανισότητα στην OWL Lite


equivalentClass: Δυο κλάσεις μπορούν να δηλωθούν σαν ισοδύναμες
(equivalent) και επομένως να έχουν τα ίδια στιγμιότυπα. Η δυνατότητα αυτή
μπορεί να χρησιμοποιηθεί για να δημιουργηθούν συνώνυμες κλάσεις.
Παράδειγμα: Η Car μπορεί να δηλωθεί σαν equivalentClass της Automobile. Από
αυτό ένα σύστημα συλλογισμού μπορεί να εξάγει το συμπέρασμα ότι αν κάτι
είναι στιγμιότυπο της Car τότε είναι επίσης και στιγμιότυπο της Automobile και
αντίστροφα.
equivalentProperty: Δυο ιδιότητες μπορούν να δηλωθούν σαν ισοδύναμες. Οι
ισοδύναμες ιδιότητες συσχετίζουν ένα άτομο με το ίδιο σύνολο ατόμων. Η
δυνατότητα αυτή μπορεί να χρησιμοποιηθεί για να δημιουργηθούν
συνώνυμες ιδιότητες.
Παράδειγμα: hasLeader μπορεί να δηλωθεί σαν equivalentProperty με την
hasHead. Από αυτό ένα σύστημα συλλογισμού μπορεί να εξάγει το συμπέρασμα
ότι αν το X σχετίζεται με το Y μέσω της ιδιότητας hasLeader, το X επίσης σχετίζεται
με το Y μέσω της ιδιότητας hasHead και αντίστροφα. Επίσης μπορεί να εξαχθεί το
συμπέρασμα ότι η hasLeader είναι υπο-ιδιότητα (subProperty) της hasHead και η
hasHead είναι υπο-ιδιότητα της hasLeader.
sameAs: Δύο άτομα μπορούν να δηλωθούν ότι είναι ταυτόσημα. Αυτό δίνει τη
δυνατότητα να δημιουργηθεί ένα σύνολο από διαφορετικά ονόματα τα
αναφέρονται στο ίδιο άτομο.
Παράδειγμα: Το άτομο Deborah μπορεί να δηλωθεί ότι είναι το ίδιο με το
DeborahMcGuinness.
11
Ισότητα και ανισότητα στην OWL Lite (συνέχεια)
differentFrom: Ενα άτομο μπορεί να δηλωθεί ότι είναι διαφορετικό από
άλλα άτομα.
Παράδειγμα: Ο Frank μπορεί να δηλωθεί ότι είναι διαφορετικό άτομο από τα
άτομα Deborah και Jim. Επομένως, αν τα άτομα Frank και Deborah είναι και τα
δύο τιμές μιας ιδιότητας η οποία έχει δηλωθεί σαν συναρτησιακή (επομένως η
ιδιότητα αυτή οφείλει να έχει το πολύ μια τιμή), τότε υπάρχει αντίφαση. Η
άμεση δήλωση ότι κάποια άτομα είναι διαφορετικά μπορεί να είναι χρήσιμη σε
γλώσσες όπως η OWL (και η RDF) οι οποίες δεν στηρίζονται στην υπόθεση ότι
να άτομα έχουν ένα μοναδικό όνομα. Για παράδειγμα, χωρίς επιπλέον
πληροφορία, ένα σύστημα συλλογισμού δεν μπορεί να εξάγει το συμπέρασμα
ότι το Frank και το Deborah αναφέρονται σε διαφορετικά άτομα.
allDifferent: Ένας αριθμός ατόμων μπορεί να δηλωθεί (με μια μόνο
allDifferent δήλωση) ότι είναι διαφορετικά μεταξύ τους. Η allDifferent είναι
ιδιαίτερα χρήσιμη όταν υπάρχουν σύνολα διακριτών αντικειμένων και όταν
ενδιαφερόμαστε να επιβάλουμε την παραδοχή των μοναδικών ονομάτων
σε αυτά τα σύνολα αντικειμένων.

12

Χαρακτηριστικά ιδιοτήτων της OWL Lite


inverseOf: Μια ιδιότητα μπορεί να δηλωθεί ως η ανάστροφη μιας άλλης. Αν η P1
δηλωθεί σαν η ανάστροφη της P2, τότε αν το X σχετίζεται με το Y μέσω της P2, τότε το
Y σχετίζεται με το X μέσω της P1.
Παράδειγμα: αν η hasChild είναι ανάστροφη της hasParent τότε από το Deborah hasParent
Louise, μπορούμε να συμπεράνουμε ότι Louise hasChild Deborah.
TransitiveProperty: Μια ιδιότητα μπορεί να δηλωθεί ως μεταβατική (transitive). Τότε
αν το ζεύγος (x,y) είναι στιγμιότυπο της μεταβατικής ιδιότητας P, και το ζεύγος (y,z)
είναι επίσης στιγμιότυπο της P, τότε και το (x,z) είναι επίσης στιγμιότυπο της P.
Παράδειγμα: Αν η ancestor θεωρηθεί μεταβατική, και αν η Sara είναι ancestor της Louise
(δηλ., το (Sara,Louise) είναι στιγμιότυπο της ancestor) και η Louise είναι ancestor της
Deborah (δηλ., το (Louise,Deborah) είναι στιγμιότυπο της ancestor), τότε το σύστημα
συλλογισμού συμπεραίνει ότι η Sara είναι ancestor της Deborah (δηλ., το (Sara,Deborah)
είναι στιγμιότυπο της ancestor).
SymmetricProperty: Μια ιδιότητα μπορεί να δηλωθεί ως συμμετρική (symmetric). Τότε
αν το ζεύγος (x,y) είναι στιγμιότυπο της συμμετρικής ιδιότητας P, και το (y,x) είναι
επίσης στιγμιότυπο της P.
FunctionalProperty: Μια ιδιότητα μπορεί να δηλωθεί ότι έχει μοναδική τιμή. Στην
περίπτωση αυτή για κάθε άτομο έχει το πολύ μια τιμή.
InverseFunctionalProperty: Αν μια ιδιότητα δηλωθεί σαν inverse functional τότε η
ανάστροφη της είναι functional.
Παράδειγμα: η ιδιότητα hasUSSocialSecurityNumber (μοναδικός αριθμός για κάθε κάτοικο
των ΗΠΑ) μπορεί να δηλωθεί σαν inverse functional. Η ανάστροφη ιδιότητα (που μπορεί να
ονομαστεί isTheSocialSecurityNumberFor) έχει το πολύ μια τιμή για κάθε μέλος της κλάσης
που περιλαμβάνει τους αριθμούς ασφαλιστικού μητρώου.

13
Περιορισμοί τύπου ιδιοτήτων της OWL Lite
allValuesFrom: Ο περιορισμός αυτός αναφέρεται σε μια ιδιότητα ως προς
συγκεκριμένη κλάση και δηλώνει ότι η ιδιότητα αναφορικά με τη συγκεκριμένη
κλάση έχει ένα τοπικό περιορισμό του πεδίου τιμών της. Έτσι αν ένα
στιγμιότυπο της κλάσης σχετίζεται μέσω της ιδιότητας με ένα άλλο
στιγμιότυπο, τότε μπορούμε να συμπεράνουμε ότι το δεύτερο στιγμιότυπο
ανήκει στη κλάση που υποδηλώνεται από την allValuesFrom.
Παράδειγμα: η κλάση Person μπορεί να έχει την ιδιότητα hasDaughter με τον
περιορισμό allValuesFrom την κλάση Woman. Επομένως αν το άτομο Louise της
κλάσης Person σχετίζεται μέσω της ιδιότητας hasDaughter με το άτομο Deborah,
τότε μπορεί να εξαχθεί σαν συμπέρασμα ότι η Deborah είναι στιγμιότυπο της
κλάσης Woman. Αυτός ο περιορισμός επιτρέπει στην ιδιότητα hasDaughter να
χρησιμοποιηθεί με άλλες κλάσεις, όπως η κλάση Cat, και να συνδεθεί με αυτήν
ένας κατάλληλος περιορισμός τιμών όταν η ιδιότητα χρησιμοποιείται με τη
συγκεκριμένη κλάση. Έτσι μια ιδιότητα μπορεί να χρησιμοποιηθεί με διαφορετικές
κλάσεις και με διαφορετικούς κάθε φορά περιορισμούς τύπου.
someValuesFrom: Ο περιορισμός αυτός δηλώνει ότι μια ιδιότητα αναφορικά με
μια συγκεκριμένη κλάση έχει ένα τοπικό περιορισμό κατά τον οποίο
τουλάχιστον μια από τις τιμές της είναι συγκεκριμένου τύπου.
Παράδειγμα: Η κλάση SemanticWebPaper μπορεί να έχει έναν περιορισμό
someValuesFrom πάνω στην ιδιότητα hasKeyword ο οποίος δηλώνει ότι κάποια
τιμή της ιδιότητας hasKeyword πρέπει να είναι στιγμιότυπο της κλάσης
SemanticWebTopic. Αυτό επιτρέπει να έχουμε πολλαπλές λέξεις κλειδιά και εφόσον
ένα τουλάχιστον από αυτά είναι στιγμιότυπο της SemanticWebTopic, τότε το paper
είναι συνεπές με τον περιορισμό someValuesFrom.
14

OWL Lite Restricted Cardinality


minCardinality: Αν δηλωθεί σαν minCardinality μιας ιδιότητας ως προς μια κλάση
η 1, τότε κάθε στιγμιότυπο της κλάσης θα σχετίζεται με μια τουλάχιστο τιμή δια
μέσου της ιδιότητας. Αυτό είναι ένας άλλος τρόπος να πούμε ότι η ιδιότητα έχει
μια τιμή για όλα τα στιγμιότυπα της κλάσης.
Στην OWL Lite επιτρεπτές τιμές της minCardinality είναι μόνο οι 0 ή 1.
Παράδειγμα: η κλάση Person δεν μπορεί να έχει περιορισμό ελάχιστης cardinality ως
προς την ιδιότητα hasOffspring αφού δεν έχουν όλοι οι άνθρωποι απογόνους
(offsprings). Αντίθετα, η κλάση Parent μπορεί να έχει ελάχιστη cardinality 1 ως προς
την hasOffspring. Αν το σύστημα συλλογισμού γνωρίζει ότι η Louise ανήκει στην
Person, δεν μπορεί να συμπεράνει τίποτα σχετικά με την ελάχιστη cardinality της
ιδιότητας hasOffspring. Αν όμως ανακαλύψει ότι η Louise είναι (και) στιγμιότυπο της
Parent,τότε μπορεί να συμπεράνει ότι η Louise σχετίζεται με ένα τουλάχιστο άτομο
μέσω της hasOffspring.
maxCardinality: Αν δηλωθεί maxCardinality με τιμή 1 για μια ιδιότητα ως προς
μια κλάση, τότε κάθε στιγμιότυπο της κλάσης θα συσχετίζεται με το πολύ ένα
άτομο δια μέσου αυτής της ιδιότητας.
Παράδειγμα: η ιδιότητα hasRegisteredVotingState της κλάσης UnitedStatesCitizens
μπορεί να έχει μέγιστη cardinality 1 (οι πολίτες επιτρέπεται να ψηφίζουν μόνο σε μια
πολιτεία).
cardinality: Με την Cardinality μπορούμε να δηλώσουμε ότι μια ιδιότητα έχει
ταυτόχρονα και τις δύο minCardinality και maxCardinality 1 ή και τις δύο 0.
Παράδειγμα: η κλάση Person έχει ακριβώς μια τιμή για την ιδιότητα hasBirthMother.
15
Η σύνταξη της OWL
Μια OWL οντολογία είναι ένας RDF γράφος. Όπως κάθε RDF
γράφος, ο γράφος μιας OWL οντολογίας μπορεί να πάρει
πολλές διαφορετικές συντακτικές μορφές. Μια από αυτές τις
μορφές είναι η χρήση της RDF/XML για την αναπαράσταση των
τριάδων του γράφου.
Σαν παράδειγμα εναλλακτικής συντακτικής αναπαράστασης
που αντιστοιχεί στις ίδιες τριάδες RDF, μπορούμε να
θεωρήσουμε την ακόλουθη RDF/XML σύνταξη:
<owl:Class rdf:ID="Continent"/>
Η σύνταξη που ακολουθεί (επίσης σε RDF/XML μορφή):
<rdf:Description rdf:about="#Continent">
<rdf:type rdf:resource="http://www.w3.org/2002/07/owl#Class"/>
</rdf:Description>

κωδικοποιεί τις ίδιες τριάδες RDF, και επομένως έχει την ίδια
σημασία.
16

Περιγραφή κλάσεων στην OWL


Έξι τρόποι περιγραφής κλάσεων στην OWL:
Δίνοντας ένα συγκεκριμένο URI.
Το URI παίζει το ρόλο ονόματος της κλάσης.
Με εξαντλητική απαρίθμηση των στιγμιοτύπων
που την απαρτίζουν.
Μέσω περιορισμού ιδιότητας.
Σαν τομή δύο ή περισσοτέρων περιγραφών
κλάσεων.
Σαν ένωση δύο ή περισσοτέρων περιγραφών
κλάσεων.
Σαν συμπλήρωμα μιας περιγραφής κλάσεων.
17
Περιγραφή κλάσης με απαρίθμηση των
στοιχείων της: Παράδειγμα

<owl:Class> Κλάση με
στοιχεία:
<owl:oneOf rdf:parseType="Collection">
{Eurasia,
<owl:Thing rdf:about="#Eurasia"/>
Africa,
<owl:Thing rdf:about="#Africa"/>
NorthAmerica,
<owl:Thing rdf:about="#NorthAmerica"/> SouthAmerica,
<owl:Thing rdf:about="#SouthAmerica"/> Australia,
<owl:Thing rdf:about="#Australia"/> Antarctica}
<owl:Thing rdf:about="#Antarctica"/>
</owl:oneOf>
</owl:Class>

18

Περιγραφή κλάσης με τη βοήθεια περιορισμού:


Παράδειγμα Περιγράφει μια ανώνυμη OWL
κλάση που περιλαμβάνει όλα
Περιορισμοί τιμών: τα στοιχεία για τα οποία η
ιδιότητα hasParent παίρνει
Παράδειγμα 1: τιμές από την κλάση Human.
<owl:Restriction>
<owl:onProperty rdf:resource="#hasParent" />
<owl:allValuesFrom rdf:resource="#Human" />
</owl:Restriction>
Παράδειγμα 2:
<owl:Restriction>
<owl:onProperty rdf:resource="#hasParent" />
<owl:hasValue rdf:resource="#Zeus" />
</owl:Restriction>
Περιγράφει την κλάση που περιλαμβάνει τα στοιχεία που
έχουν τον Zeus για γονιό.
19
Περιγραφή κλάσης σαν τομή περιγραφών
κλάσεων: Παράδειγμα
<owl:Class>
<owl:intersectionOf rdf:parseType="Collection"> Κλάση με
στοιχεία:
<owl:Class> Κλάση με
στοιχεία: {Tosca}
<owl:oneOf rdf:parseType="Collection">
<owl:Thing rdf:about="#Tosca" /> {Tosca,
<owl:Thing rdf:about="#Salome" /> Salome}
</owl:oneOf>
</owl:Class>
<owl:Class>
<owl:oneOf rdf:parseType="Collection">
<owl:Thing rdf:about="#Turandot" /> Κλάση με
<owl:Thing rdf:about="#Tosca" /> στοιχεία:
</owl:oneOf> {Turandot,
</owl:Class> Tosca}
</owl:intersectionOf>
</owl:Class>
20

Περιγραφή κλάσης σαν ένωση περιγραφών


κλάσεων: Παράδειγμα
<owl:Class>
<owl:unionOf rdf:parseType="Collection"> Κλάση με
στοιχεία:
<owl:Class> Κλάση με
στοιχεία: {Tosca,
<owl:oneOf rdf:parseType="Collection">
{Tosca, Salome,
<owl:Thing rdf:about="#Tosca" />
Salome} Turandot}
<owl:Thing rdf:about="#Salome" />
</owl:oneOf>
</owl:Class>
<owl:Class>
<owl:oneOf rdf:parseType="Collection">
<owl:Thing rdf:about="#Turandot" /> Κλάση με
<owl:Thing rdf:about="#Tosca" /> στοιχεία:
</owl:oneOf> {Turandot,
</owl:Class> Tosca}
</owl:unionOf>
</owl:Class>
21
Περιγραφή κλάσης ως συμπλήρωμα:
Παράδειγμα
Περιλαμβάνει
<owl:Class> οτιδήποτε δεν
ανήκει στη κλάση
<owl:complementOf> Female
<owl:Class rdf:about="#Female"/>
</owl:complementOf>
</owl:Class>

22

Αξιώματα κλάσεων
Οι περιγραφές των κλάσεων αποτελούν τα δομικά
στοιχεία για τον ορισμό κλάσεων μέσω αξιωμάτων
κλάσεων.
Παράδειγμα: Το παρακάνω αξίωμα δηλώνει ότι η αναφορά
URI #Human αποτελεί το όνομα μιας κλάσης της OWL:
<owl:Class rdf:ID="Human"/>
Τα αξιώματα κλάσεων συνήθως περιλαμβάνουν
επιπλέον συστατικά τα οποία προσδιορίζουν
αναγκαία και/ή ικανά χαρακτηριστικά των κλάσεων.
Δομικά στοιχεία της OWL για το συνδυασμό των
περιγραφών κλάσεων και τη δημιουργία αξιωμάτων
κλάσεων είναι τα rdfs:subClassOf, owl:equivalentClass
και owl:disjointWith

23
Αξιώματα κλάσεων (συνέχεια)
Παράδειγμα 1:
<owl:Class rdf:ID="Opera">
<rdfs:subClassOf rdf:resource="#MusicalWork" />
</owl:Class>
Στην OWL Lite το υποκείμενο μιας δήλωσης rdfs:subClassOf
πρέπει να είναι όνομα κλάσης ενώ το αντικείμενο μπορεί να
είναι είτε όνομα κλάσης είτε περιορισμός ιδιότητας.
Παράδειγμα 2:
<owl:Class rdf:about="MusicDrama">
<owl:equivalentClass>
<owl:Class>
<owl:unionOf rdf:parseType="Collection">
<owl:Class rdf:about="#Opera"/>
<owl:Class rdf:about="#Operetta"/>
<owl:Class rdf:about="#Musical"/>
</owl:unionOf>
</owl:Class>
</owl:equivalentClass>
</owl:Class>
24

Σύνοψη

25
OWL Axioms

26

Ιδιότητες
Δύο τύποι ιδιοτήτων στην OWL:
Ιδιότητες αντικειμένων (Object properties): συνδέουν
στιγμιότυπα με άλλα στιγμιότυπα.
Ιδιότητες τύπου δεδομένων (Datatype properties):
συνδέουν στιγμιότυπα με τύπους δεδομένων.
Μια ιδιότητα αντικειμένων ορίζεται σαν στιγμιότυπο της
ενσωματωμένης κλάσης της OWL owl:ObjectProperty. Μια
ιδιότητα τύπου δεδομένων ορίζεται σαν στιγμιότυπο της
ενσωματωμένης κλάσης της OWL owl:DatatypeProperty.
Ένα αξίωμα ιδιότητας (Property axiom) προσδιορίζει
χαρακτηριστικά μιας ιδιότητας.
Παράδειγμα (ιδιότητας αντικειμένων): Το παρακάτω
αξίωμα δηλώνει της ύπαρξη μιας ιδιότητας με τον
περιορισμό ότι η τιμές της είναι απλά στιγμιότυπα.
<owl:ObjectProperty rdf:ID="hasParent"/>

27
XML Schema Datatypes
Η OWL υποστηρίζει τους βασικούς τύπους δεδομένων
της XML Schema
π.χ. integer, real, string, …
Αυστηρή διάκριση μεταξύ “object” classes και
datatypes
Για φιλοσοφικούς λόγους: οι datatypes δομούνται από build-
in predicates. Δεν είναι κατάλληλη η δημιουργία τύπων
δεδομένων από γλώσσες οντολογιών
Για πρακτικούς λόγους: η γλώσσα οντολογιών παραμένει
απλή και «συμπαγής». Διαφυλάσσεται η σημασιολογική
ακεραιότητα της γλώσσας

28

Στιγμιότυπα
Ορίζονται μέσω αξιωμάτων τα οποία συχνά ονομάζονται
γεγονότα (facts). Ενδιαφέρον έχουν δύο κατηγορίες
αξιωμάτων:
Γεγονότα σχετικά με μέλη μιας κλάσης και τιμές ιδιοτήτων
Γεγονότα σχετικά με ισότητα στιγμιότυπων
Αναφέρεται σε ένα
Παράδειγμα σύνολο γεγονότων που
<Opera rdf:ID="Tosca"> αφορούν το Tosca που
<hasComposer rdf:resource="#Giacomo_Puccini"/> είναι ένα στιγμιότυπο της
<hasLibrettist rdf:resource="#Victorien_Sardou"/> κλάσης Opera.
<hasLibrettist rdf:resource="#Giuseppe_Giacosa"/>
<hasLibrettist rdf:resource="#Luigi_Illica"/>
<premiereDate rdf:datatype="&xsd;date">1900-01-14</premiereDate>
<premierePlace rdf:resource="#Roma"/>
<numberOfActs rdf:datatype="&xsd;positiveInteger">3</numberOfActs>
</Opera>
29
Θησαυροί και RDF

Χαρά Μπρίντεζη
Βιβλιοθήκη Ιδρύ ατος Ευγενίδου

Τι είναι Θησαυρός
Κατάλογος συσχετιζό ενων, κοινά αποδεκτών όρων, που χρησι οποιείται
στην ανάκτηση πληροφοριών και στη θε ατική ευρετηρίαση
Όροι επιλεγ ένοι από τη φυσική γλώσσα
Οι όροι εκφράζουν έννοιες (εννοιολογικό σχή α)
Ελεγχό ενο λεξιλόγιο
Ένας όρος πορεί να έχει πολλές ση ασίες (πολυση ία ή ο οιογραφία).
Χρήση προσδιοριστών π.χ. γλώσσα (όργανο σώ ατος)
Μία έννοια πορεί να εκφραστεί από δύο ή περισσότερους
συνώνυ ους όρους
Περιγραφέας ή προτι ώ ενος
ό ηση ε τέτοιο τρόπο ώστε να υποδηλώνονται ε σαφήνεια οι
προϋπάρχουσες σχέσεις εταξύ των εννοιών

2
Θησαυροί ως ση ασιολογικοί
(νοη ατικοί) χάρτες

Όροι (λέξη ή φράση)


Προτι ώ ενοι Σχέση ισοδυνα ίας
(USE, UF)
Μη προτι ώ ενοι
Σχέσεις ( εταξύ προτι ώ ενων όρων)
Ιεραρχίας (BT, NT) (BTG, BTP, BTI)
Συσχέτισης (RT)
Ση ειώσεις (SN, DEF, HN…)

ζώα
σκύλοι

Σχέσεις ιεραρχίας

κατοικίδια ζώα
Σχέση
συσχέτισης

σκύλοι
Πρότυπα για τη δη ιουργία
θησαυρών
Πρότυπο ΕΛΟΤ 1321:
«Τεκ ηρίωση ' Κατευθυντήριες οδηγίες
για τη συγκρότηση και ανάπτυξη
ονόγλωσσων θησαυρών» (1993)
Μετάφραση του ISO 2788 (1986)
ANSI/NISO Z39.19-2003 (R 1993, 1998)
BS 5723:1987 (for monolingual thesauri)
ISO 5964: Documentation-guidelines for the
establishment and development of multilingual
thesauri (1985)
BS 6723:1985 (for multilingual thesauri)
5

Κλασική παρουσίαση όρων Θησαυρού

Term: Economic cooperation


Used For:
Economic co-operation
Broader terms:
Economic policy
Narrower terms:
Economic integration
European economic cooperation
European industrial cooperation
Industrial cooperation
Related terms:
Interdependence
Scope Note:
Includes cooperative measures in banking, trade, industry etc., between and
among countries

6
7

Θησαυροί και Ιστός


Χρήση θησαυρών στον Ιστό
Χρήση θησαυρών σε εφαρ ογές του Ση ασιολογικού Ιστού
Κωδικοποίηση θησαυρών σε XML ( ετατροπές σε RDF)
Η RDF παρέχει έναν απλό τρόπο για την περιγραφή των
πραγ άτων, των ιδιοτήτων τους, των εταξύ τους σχέσεων
και των κατηγοριών τους (κλάσεων)
Η χρήση RDF επιτρέπει την ενοποίηση των δεδο ένων των
θησαυρών ε άλλα δεδο ένα RDF σε εφαρ ογές του
Ση ασιολογικού Ιστού και προσφέρει
Ευέλικτη ανταλλαγή ορολογίας

8
Παρουσίαση ηλεκτρονικών θησαυρών

10
12
14
15

SKOS Core schema του W3C


Παρέχει ένα οντέλο για την έκφραση της βασικής
δο ής και του περιεχο ένου εννοιολογικών σχη άτων
(π.χ. θησαυροί)
Πρόκειται για ια εφαρ ογή της RDF που πορεί να
χρησι οποιηθεί για να εκφράσει ένα εννοιολογικό
σχή α ως ένα RDF γράφο.
RDFS κλάσεις (classes)
RDF ιδιότητες (properties)

16
Κλάσεις
CollectableProperty
Collection
Concept
ConceptScheme
OrderedCollection

Ιδιότητες
altLabel
broader
changeNote
definition
editorialNote Ση άνσεις ή
hasTopConcept ετικέτες
hiddenLabel
historyNote
isSubjectOf
narrower
prefLabel prefSymbol
related scopeNote……………………..
17

Alt

18
SKOS Core schema
Κάθε προτι ώ ενος όρος γίνεται “προτι ώ ενη ετικέτα” για
ια “έννοια” (concept oriented view)
Οι η προτι ώ ενοι όροι γίνονται εναλλακτικές ετικέτες
(alternative labels) για τις έννοιες
Ετικέτα πορεί να είναι σειρά χαρακτήρων, σύ βολο ή εικόνα
Οι σχέσεις BT, NT, RT είναι σχέσεις εταξύ εννοιών
Οι έννοιες πορεί να συνοδεύονται από υπο νη ατισ ούς όπως
-ιευκρινιστικές Ση ειώσεις και ορισ ούς
Μια έννοια συνεπάγεται από την προτι ώ ενη και τις
εναλλακτικές ετικέτες της, από τους υπο νη ατισ ούς και τους
όρους του περιβάλλοντός της

19

Παράδειγ α RDF γράφου


Μια δήλωση (statement) RDF

Υποκεί ενο - πόρος Αντικεί ενο - τι ή


(subject - resource) Κατηγόρη α - ιδιότητα (object – value)
(predicate -property)

Παραδείγ ατα δηλώσεων SKOS


Ιδιότητα Ένας άλλος πόρος

Ένας πόρος
Μια άλλη
ιδιότητα Ένα RDF Literal
20
Η κλάση skos:concept (1/2)
Επιτρέπει να συ περάνει κάποιος ότι ο πόρος είναι ένας
εννοιολογικός πόρος (conceptual resource). -ηλαδή, ο πόρος
είναι ο ίδιος ια έννοια
αντικεί ενο
κατηγόρη α
υποκεί ενο

21

Η κλάση skos:concept (2/2)


U
R
I
πόρου
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<rdf:Description rdf:about="http://www.example.com/concepts#love">
<rdf:type rdf:resource="http://www.w3.org/2004/02/skos/core#Concept"/>
</rdf:Description>
</rdf:RDF>

Συντετ η ένη ορφή


<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#love"/>
</rdf:RDF>

22
Ιδιότητες σή ανσης
(Labelling properties)

Οι βασικές ιδιότητες σή ανσης (που αποδίδουν ετικέτες)


prefLabel altLabel
hiddenLabel
prefSymbol altSymbol
Οι ετικέτες προσδίδουν ένα είδος ένδειξης σε έναν πόρο
Η ένδειξη χρησι οποιείται για να δηλώσει τον πόρο ε λέξεις
της φυσικής γλώσσας και/ή ε αναπαραστάσεις (σύ βολα)
κατανοητές από ανθρώπους

23

Σχέσεις ισοδυνα ίας (προτι ώ ενες και


εναλλακτικές ση άνσεις - ετικέτες)
prefLabel και altLabel
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/
22- rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/
skos/core#">

<skos:Concept rdf:about =
"http://www.example.com/concepts#animals">
<skos:prefLabel>animals</skos:
prefLabel>
<skos:altLabel>creatures</skos:a
ltLabel>
<skos:altLabel>fauna</skos:altL
abel>
</skos:Concept>
</rdf:RDF>
24
prefLabel και altLabel
(όχι όνο για συνώνυ α)
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">

<skos:Concept rdf:about="http://www.example.com/concepts#wetness">
<skos:prefLabel>wetness</skos:prefLabel>
<skos:altLabel>dryness</skos:altLabel> Οιονεί συνώνυ α
</skos:Concept>

<skos:Concept rdf:about="http://www.example.com/concepts#shrubs">
<skos:prefLabel>shrubs</skos:prefLabel>
<skos:altLabel>bushes</skos:altLabel>
</skos:Concept>

<skos:Concept rdf:about="http://www.example.com/concepts#rocks">
<skos:prefLabel>rocks</skos:prefLabel>
<skos:altLabel>basalt</skos:altLabel>
<skos:altLabel>granite</skos:altLabel> Παραπο πή προς το γένος
</skos:Concept>
</rdf:RDF> 25

Προτι ώ ενες και εναλλακτικές ση άνσεις


(για πολύγλωσσους θησαυρούς)
<rdf:RDF
xmlns:rdf="http………."
xmlns:skos="http………">
<skos:Concept rdf:about=
"http://www.example.com/concepts#shrubs">
<skos:prefLabel xml:lang= "en" >shrubs
</skos:prefLabel>
<skos:altLabel xml:lang="en">bushes
</skos:altLabel>
<skos:prefLabel xml:lang="fr">arbuste
</skos:prefLabel>
<skos:altLabel xml:lang="fr">buisson
</skos:altLabel>
</skos:Concept>
</rdf:RDF>

26
Κρυ ένες ση άνσεις
(Hidden lexical labels)
Η πιο συχνή χρήση τους είναι για τα λάθη στην ορθογραφία

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept
rdf:about="http://www.example.com/concepts#abattoirs">
<skos:prefLabel>abattoirs</skos:prefLabel>
<skos:hiddenLabel>abatoirs</skos:hiddenLabel>
<skos:hiddenLabel>abbatoirs</skos:hiddenLabel>
<skos:hiddenLabel>abbattoirs</skos:hiddenLabel>
</skos:Concept>
</rdf:RDF>
27

Σή ανση ε σύ βολα (Symbolic labelling)

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#love">
<skos:prefSymbol rdf:resource="http://www.example.com/symbols/love1.jpg"/>
<skos:altSymbol rdf:resource="http://www.example.com/symbols/love2.jpg"/>
</skos:Concept>
</rdf:RDF>
28
SKOS και Ση ειώσεις
(ιδιότητες τεκ ηρίωσης - documentation properties)
skos:publicNote
skos:definition
skos:scopeNote
skos:example
skos:historyNote
skos:privateNote
skos:editorialNote
skos:changeNote
Τρεις τρόποι χρήσης
Τεκ ηρίωση ως κεί ενο (Documentation as an RDF Literal)
Τεκ ηρίωση ως περιγραφή σχετιζό ενου πόρου (Documentation
as a Related Resource Description)
Τεκ ηρίωση ως αναφορά σε τεκ ήριο (Documentation as a
Document Reference)
29

Τεκ ηρίωση ως κεί ενο


(Documentation as an RDF Literal) (1/2)

Η τι ή της ιδιότητας (το αντικεί ενο της τριάδας) είναι κεί ενο

30
Τεκ ηρίωση ως κεί ενο
(Documentation as an RDF Literal) (2/2)

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.org/concepts#bananarepublic">
<skos:prefLabel>banana republic</skos:prefLabel>
<skos:definition>A small country, especially in South and Central
America, that is poor and often badly and immorally ruled. </skos:
definition>
</skos:Concept>
</rdf:RDF>

31

Τεκ ηρίωση ως περιγραφή σχετιζό ενου πόρου


(Documentation as a Related Resource Description)
ο η ένες τι ές

32
Τεκ ηρίωση ως αναφορά σε τεκ ήριο
(Documentation as a Document Reference)
Αναφορά σε τεκ ήριο έσω του URI του

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#zoology">
<skos:prefLabel>zoology</skos:prefLabel>
<skos:scopeNote rdf:resource="http://www.example.com/notes/zoology.txt"/>
</skos:Concept>
</rdf:RDF> 33

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<skos:Concept rdf:about="http://www.example.com/concepts#botany">
<skos:prefLabel>botany</skos:prefLabel>
<skos:scopeNote>
<foaf:Document rdf:about="http://www.example.com/notes/botany.txt">
<dc:creator>
<foaf:Person>
<foaf:name>John Smith</foaf:name>
<foaf:mbox rdf:resource="mailto:jsmith@example.org"/>
Metaproperties </foaf:Person>
</dc:creator>
<dc:language>
<dcterms:RFC1766>
<rdf:value>EN</rdf:value>
<rdfs:label>English</rdfs:label>
</dcterms:RFC1766>
</dc:language>
</foaf:Document>
</skos:scopeNote>
</skos:Concept>
</rdf:RDF> 34
Ιδιότητες για ση ασιολογικές σχέσεις
skos:semanticRelation
skos:broader
skos:narrower
skos:related
Η χρήση της ιδιότητας semantic relation απαιτεί το
υποκεί ενο και το αντικεί ενο της τριάδας να είναι
πόροι του τύπου skos:concept
Οι ιδιότητες skos:broader και skos:narrower είναι
αντίστροφες η ια της άλλης και εταβατικές
Η ιδιότητα skos:related είναι συ ετρική

35

Σχέσεις ιεραρχίας

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#mammals">
<skos:prefLabel>mammals</skos:prefLabel>
<skos:broader rdf:resource="http://www.example.com/concepts#animals"/>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#animals">
<skos:prefLabel>animals</skos:prefLabel>
<skos:narrower rdf:resource="http://www.example.com/concepts#mammals"/>
</skos:Concept>
</rdf:RDF>
36
Σχέσεις συσχέτισης

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.example.com/concepts#birds">
<skos:prefLabel>birds</skos:prefLabel>
<skos:related rdf:resource="http://www.example.com/concepts#ornithology"/>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#ornithology">
<skos:prefLabel>ornithology</skos:prefLabel>
<skos:related rdf:resource="http://www.example.com/concepts#birds"/>
</skos:Concept>
</rdf:RDF>
37

Κλασική παρουσίαση όρων Θησαυρού

Term: Economic cooperation


Used For:
Economic co-operation
Broader terms:
Economic policy
Narrower terms:
Economic integration
European economic cooperation
European industrial cooperation
Industrial cooperation
Related terms:
Interdependence
Scope Note:
Includes cooperative measures in banking, trade, industry etc., between and
among countries

38
BT

UF

SN

RT

NT

39

Φασέτες και παρατάξεις (arrays)


Φασετική ανάλυση = ανάλυση των
περίπλοκων (σύνθετων) θε άτων σε
ο άδες απλούστερων όρων εννοιών
Περιγραφή περίπλοκων θε άτων ε
συνδυασ ούς των απλών όρων εννοιών
Αναλυτικο'συνθετικά σχή ατα
Στους θησαυρούς = σωστότερη δήλωση
όλων των ση ασιολογικών σχέσεων

40
παράγοντες
industries
agricultural industries
(people)
farm managers
dairy personnel
shepherds
Ετικέτα δεσ ού (products)
cereal products
dairy products
butter
cheese
cream
ice cream
milk
(milk by fat content)
Ετικέτα δεσ ού whole milk
low fat milk
skim milk
(milk by form)
dried milk
liquid milk
(milk by source animal)
buffalo milk
cow milk
goat milk
sheep milk
(milk by treatment type)
condensed milk
evaporated milk
homogenized milk
pasteurized milk
sterilized milk

41

Περιγραφή παρατάξεων (1/2)


Collections ή Containers (Περιβλή ατα);
(skos:Collection)

42
Περιγραφή παρατάξεων (2/2)
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">
<skos:Collection>
<rdfs:label>milk by source animal</rdfs:label>
<skos:member rdf:resource="http://www.example.com/concepts#buffalomilk"/>
<skos:member rdf:resource="http://www.example.com/concepts#cowmilk"/>
<skos:member rdf:resource="http://www.example.com/concepts#goatmilk"/>
<skos:member rdf:resource="http://www.example.com/concepts#sheepmilk"/>
</skos:Collection>
<skos:Concept rdf:about="http://www.example.com/concepts#buffalomilk">
<skos:prefLabel>buffalo milk</skos:prefLabel>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#cowmilk">
<skos:prefLabel>cow milk</skos:prefLabel>
</skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#goatmilk"> ………
………………….
</rdf:RDF> 43

Ε περιεχό ενες ή ε φωλευ ένες συλλογές όρων


(nested collections) (1/2)

chairs
. <chairs by form>
.. armchairs
.. easy chairs
.. <chairs by form: back form>
... heart-back chairs
... oval-back chairs

44
Ε περιεχό ενες ή ε φωλευ ένες συλλογές όρων
(nested collections) (2/2)

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-
schema#"> <skos:Concept rdf:about="http://www.example.com/concepts#chairs">
<skos:prefLabel>chairs</skos:prefLabel>
<skos:narrower>
<skos:Collection>
<rdfs:label>chairs by form</rdfs:label>
<skos:member rdf:resource="http://www.example.com/concepts#armchairs"/>
<skos:member rdf:resource="http://www.example.com/concepts#easychairs"/>
<skos:member>
<skos:Collection>
<rdfs:label>chairs by form: back form</rdfs:label>
<skos:member rdf:resource="http://www.example.com/concepts#heartbackchairs"/>
<skos:member rdf:resource="http://www.example.com/concepts#ovalbackchairs"/>
</skos:Collection>
</skos:member>
</skos:Collection>
</skos:narrower> </skos:Concept>
<skos:Concept rdf:about="http://www.example.com/concepts#armchairs">
<skos:prefLabel>armchairs</skos:prefLabel> </skos:Concept> …………………… 45

Περιγραφή διατεταγ ένων παρατάξεων


(skos:OrderedCollection) (1/2)

NT

46
Περιγραφή διατεταγ ένων παρατάξεων
(skos:OrderedCollection) (2/2)
<rdf:RDF xmlns:rdf=“…..
<skos:Concept
rdf:about="http://www.example.com/concepts#people">
<skos:prefLabel>people</skos:prefLabel> People
<skos:narrower>
<skos:OrderedCollection> . <people by age>
<rdfs:label>people by age</rdfs:label>
<skos:memberList rdf:parseType="Collection"> .. infants
<skos:Concept
rdf:about="http://www.example.com/concepts#infants"/>
.. children
<skos:Concept
rdf:about="http://www.example.com/concepts#children"/> .. adults
<skos:Concept
rdf:about="http://www.example.com/concepts#adults"/>
</skos:memberList>
</skos:OrderedCollection>
</skos:narrower>
</skos:Concept>
</rdf:RDF>
47

Εννοιολογικά σχή ατα


skos:ConceptScheme skos:inScheme

48
Εννοιολογικά σχή ατα
skos:hasTopConcept

49

Οικονομικό Πανεπιστήμιο Αθηνών.


Τμήμα Πληροφορικής
MScIS – MSc in Information Systems

Μάθημα: Συστήματα Οργάνωσης Γνώσης

Θεματικοί Χάρτες (Topic Maps) και πρότυπο XTM

Θεοδώρα Τσώλη
Βιβλιοθηκονόμος, Πάντειο Πανεπιστήμιο. Βιβλιοθήκη-Υπηρεσία Πληροφόρησης
thtsoli@panteion.gr
Περιεχόμενα

Η προσέγγιση των ΘΧ και ο καθημερινός


τρόπος σκέψης

Το μοντέλο των ΘΧ

Πρότυπο Θεματικών Χαρτών :


ISO 13250:2002 - XML Topic Maps 1.0

Δημιουργώντας Θεματικούς Χάρτες

Εφαρμογές

Βιβλιογραφία

Η προσέγγιση των Θεματικών


Χαρτών
Η προσέγγιση των Θεματικών Χαρτών

Το περιβάλλον των
υπολογιστικών συστημάτων και
της διαχείρισης γνώσης σήμερα:
Έχει επίκεντρο εφαρμογές και
τεκμήρια.
Πώς όμως λειτουργεί η
ανθρώπινη σκέψη ?
Θέματα, όροι, έννοιες
Η πρόταση των δημιουργών των
ΘΧ είναι η θεματοκεντρική
προσέγγιση.

“As We May Think”

“The human mind … operates by association”


Vannevar Bush: As We May Think (1945)

Ερεύνησε το ζήτημα της ανακάλυψης της πληροφορίας

Η παρούσα τεχνολογία είναι ξεπερασμένη:

The amount of information is being “expanded at a prodigious rate”, but the means we
use to find it is “the same as was used in the days of square-rigged ships”

Η λύση είναι να απομακρυνθούμε από τα ιεραρχικά δομημένα συστήματα


οργάνωσης και να υιοθετήσουμε τεχνικές που αντικατοπτρίζουν τον τρόπο
οργάνωσης του ανθρώπινου εγκεφάλου.

Θεματο-κεντρική λύση έναντι της παραδοσιακής αντικειμενο-κεντρικής


(τεκμήρια).
Ο τρόπος σκέψης του ανθρώπου

Τεκμήρια που αναφέρονται σε


θέματα
Θέματα που υπάρχουν ως
έννοιες στο μυαλό μας
WWW
Έννοιες που συνδέονται με ένα
δίκτυο συσχετίσεων
Berners-Lee Engelbart
Bush

Hypertext
As We May Think AUGMENT
MEMEX

Nelson Xanadu

NLS

Αυτός είναι ο τρόπος αποθήκευσης


γνώσης
Τα τεκμήρια είναι απλές
αναπαραστάσεις τμημάτων αυτής
της γνώσης

Συστήματα Οργάνωσης Γνώσης

Κατάλογοι όρων :

Κατάλογοι καθιερωμένων ονομάτων, Γλωσσάρια, Λεξικά, Γεωγραφικά λεξικά,


Ευρετήρια

Ταξινομικά συστήματα και κατηγορίες :

Κατάλογοι θεματικών επικεφαλίδων


Ταξινομικά συστήματα, ταξονομίες και σχήματα κατηγοριοποιήσεων

Κατάλογοι σχετιζόμενων όρων :

Θησαυροί
Σημασιολογικά δίκτυα
Οντολογίες
Π.χ. το ευρετήριο

Cavalleria Rusticana, 71, 203-204 Ευρετήριο


Mascagni, Pietro (composer) ονομάτων
Cavalleria Rusticana, 71, 203-204 Ευρετήριο τόπων
Rustic Chivalry, see Cavalleria Rusticana Ευρετήριο θεμάτων
singers, 39-52
See also individual names Επιπρόσθετες έννοιες:
baritone, 46 Κατηγορίες topic (topic types)
bass, 46-47 Κατηγορίες εμφανίσεων
soprano, 41-42, 337n (occurrence types)
tenor, 44-45 topics ε πολλαπλά
ονό ατα
+ πολλαπλά ευρετήρια Συσχετίσεις (associations)
+ άλλες προσθήκες ανά εσα σε topics

Η ιδέα πίσω από το πρότυπο. Η πρόταση των Θεματικών


Χαρτών.

Κωδικοποιούν με τυπικό τρόπο μοντέλα δόμησης της γνώσης


Αναπτύσσουν μια αρχή οργάνωσης για την πλοήγηση στην πληροφορία,
τη δημιουργία και τη διαχείρισή της.
Οι ΘΧ :
ενσωματώνουν πληροφορία για το θεματικό πλαίσιο των εργαλείων
οργάνωσης της γνώσης,
παρέχουν ένα συντακτικό κωδικοποίησης μιας θεματικής δομής
ανεξάρτητο από τα μεταδεδομένα των πληροφοριακών πόρων,
επιτρέπουν την ανταλλαγή και συγχώνευσή τους.

Ελέγχουμε την υπερπληθώρα της πληροφορίας


Μοιραζόμαστε γνώση
Μέσω της διασύνδεσης :
Κάθε είδους πληροφορίας
Που προέρχεται από κάθε είδους πηγή
Το μοντέλο των Θεματικών Χαρτών

Το βασικό μοντέλο

Callas, Maria …………………… 42


Cavalleria Rusticana … 71, 203-204
Mascagni, Pietro
Cavalleria Rusticana . 71, 203-204
Pavarotti, Luciano ……………… 45
Οι έννοιες-κλειδιά προέρχονται από τη Puccini, Giacomo ………. 23, 26-31
λογική οργάνωσης των ευρετηρίων Tosca ………………. 65, 201-202
Rustic Chivalry, see Cavalleria
Επεκτάθηκαν και γενικεύτηκαν για να Rusticana
singers ………………………. 39-52
χρησιμοποιηθούν για την περιγραφή baritone ………………………. 46
ψηφιακής πληροφορίας και δεδομένων bass ……………………….. 46-47
soprano ……………… 41-42, 337
Στηρίζονται σε ένα μοντέλο δύο επιπέδων tenor ………………………. 44-45
see also Callas, Pavarotti
που αποτελείται από : Tosca ………………… 65, 201-202
Ένα πληροφοριακό επίπεδο ή χάρτη
(“knowledge map”)
Ένα σύνολο πληροφοριακών πόρων ή
πηγών (information layer)

Αντιστοιχεί στο περιεχόμενο ενός βιβλίου (index)


– κείμενο και ευρετήριο
knowledge layer

information layer

(content)
(1) Το επίπεδο των πληροφοριακών πόρων

Περιέχει το γνωστικό περιεχόμενο – τα δεδομένα / πληροφορίες


Συνήθως σε ψηφιακή μορφή
Σε οποιαδήποτε μορφή και οπουδήποτε
Κείμενο, γραφικά, video, ήχος, κ.λπ.

information layer

(2) Το γνωστικό επίπεδο

Αποτελείται από θέματα-topics και συσχετίσεις αναμεταξύ τους


Τα Topics αντιπροσωπεύουν τα θέματα στα οποία αναφέρεται η πληροφορία.
Είναι υποστασιοποιημένα θέματα.
Θέμα (subject): “a “subject” can be anything whatsoever…”
Οι συσχετίσεις (Associations) αντιπροσωπεύουν τις σχέσεις και ανάμεσα στα
θέματα

composed by

composed by

Tosca
Puccini Madame
Butterfly
born in

Lucca knowledge layer


Η διασύνδεση των δύο επιπέδων = εμφανίσεις (Occurrences)

Τα δύο επίπεδα συνδέονται μέσω composed by


των :
composed by
Εμφανίσεων (Occurrences) :
είναι πληροφοριακοί πόροι / Tosca
πηγές που σχετίζονται /
Puccini born in Madame
αφορούν ένα θέμα / topic
Butterfly
Lucca knowledge layer
information layer

Το μοντέλο
Topic-Association-Occurrence
αντικατοπτρίζει τον ανθρώπινο
τρόπο σκέψης

Το μοντέλο ενός topic

! "# $
% &! '# (" ) % *+ * *
current topic (multiple) types

multiple names

multiple
occurrences

multiple
associations

ISO 2000 – 1st Edition

Ολοκληρώθηκε το 1999
Εγκρίθηκε και δημοσιεύτηκε ως ISO/IEC 13250:2000
Συντακτικό SGML DTD (με βάση το πρότυπο ISO HyTime
10744:1997)

TopicMaps.Org 2001
Ένωση χρηστών (ιδρύθηκε το 2000)
Στόχος: Η προσαρμογή των ΘΧ στο Web
Ειδικότερα η ανάπτυξη ενός εναλλακτικού συντακτικού στηριγμένου στα
πρότυπα του Web (XML, Xlink)
XML Topic Maps (XTM) 1.0 specification
Εγκρίθηκε το Μάρτιο του 2001
XML-based syntax and Xlink-based linking model
Εισήγαγε τη διάκριση ανάμεσα σε άμεση και έμμεση ταυτοποίηση θεμάτων
Οτιδήποτε μπορεί να είναι ένα θέμα, συμπεριλαμβανομένων και των
πληροφοριακών πηγών
ISO 2003 – 2nd Edition

Περιλαμβάνει το συντακτικό XTM


ISO/IEC 13250:2003 – Topic Maps
(2nd ed.)
Η έρευνα συνεχίζεται με τη νέα
έκδοση να περιλαμβάνει
Data model (SAM)
Reference model
Canonicalization
Δύο νέα πρότυπα βρίσκονται υπό
επεξεργασία
Constraint Language (TMCL)
Query Language (TMQL)
From ISO/IEC JTC 1/SC34 N323
2002-06-23

Topic, Association, Occurence – “Complete” XTM 1.0 Syntax

<topic>
<topic id="la-boheme">
<instanceOf><topicRef xlink:href="#opera"/></instanceOf>
<baseName>
<scope>
<topicRef xlink:href="#Normal form "/>
</scope>
<baseNameString>La Bohème</baseNameString></baseName>
<occurrence>
<instanceOf><topicRef xlink:href="#homepage"/></instanceOf>
<resourceRef
xlink:href="http://www.opera.it/Opere/La-Boheme/La-Boheme.html"/>
</occurrence>
<association>
<instanceOf><topicRef xlink:href="#composed-by"/></instanceOf>
<member>
<roleSpec><topicRef xlink:href="#composer"/></roleSpec>
<topicRef xlink:href="#puccini"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#work"/></roleSpec>
<topicRef xlink:href="#la-boheme"/>
</member>
</association>
</topic>
Association – XTM 1.0 Syntax

<!ELEMENT association (instanceOf?, scope? , member+)>


<!ATTLIST association
id ID #REQUIRED>
<!ELEMENT member (roleSpec?, (topicRef | ...)+) > Τύπος
<!ATTLIST member συσχέτισης
id ID #IMPLIED>
<!ELEMENT roleSpec (topicRef | ...) >

<association>
<instanceOf><topicRef xlink:href="#composed-by"/></instanceOf>
<member>
<roleSpec><topicRef xlink:href="#composer"/></roleSpec>
<topicRef xlink:href="#puccini"/>
</member>
<member> Μέλη
<roleSpec><topicRef xlink:href="#work"/></roleSpec> συσχέτισης και
<topicRef xlink:href="#la-boheme"/> ρόλοι
</member>
</association>

Occurrence – XTM 1.0 Syntax

<occurrence> subelement:
external/internal resources: <resourceRef> or <resourceData>

<!ELEMENT occurrence
( instanceOf?, scope?, ( resourceRef | resourceData ) )
>
<!ATTLIST occurrence Τύπος
id ID #IMPLIED εμφάνισης
>
<topic>
<topic id="la-boheme">
<occurrence>
<instanceOf><topicRef xlink:href="#homepage"/></instanceOf>
<resourceRef
xlink:href="http://www.opera.it/Opere/La-Boheme/La-Boheme.html"/>
</occurrence>
<occurrence>
<instanceOf><topicRef xlink:href="#premiere-date"/></instanceOf>
<resourceData>1896 (1 Feb)</resourceData>
</occurrence>
</topic> Τύπος
εμφάνισης
Δημιουργώντας ένα Θεματικό
Χάρτη

Δημιουργώντας ένα θεματικό χάρτη [1]

Ορισμός του θέματος.


Καθορισμός των topics που αφορούν το θέμα. Καθορισμός των πληροφοριακών
πόρων που αφορούν στο θέμα (εμφανίσεις).
Καθορισμός των σχέσεων ανάμεσα στα topics (συσχετίσεις).

Ορίζοντας το θέμα

<?xml version="1.0"?>
<topicMap id="aueb-uni"
xmlns = 'http://www.topicmaps.org/xtm/1.0/'
xmlns:xlink = 'http://www.w3.org/1999/xlink'>
<!-- The map contains basic information about AUEB.-->
</topicMap>
Ορίζοντας τα topics

<topic id="aueb">…</topic>
<topic id="it-school">…</topic>
:
<topic id="aueb">
<baseName><baseNameString>Athens University of Economics and
Business</baseNameString>
</baseName>…</topic>
:
<topic id="it-school">
<baseName><baseNameString>AUEB - Information Technology
School</baseNameString>
</baseName>
:
</topic>

Ορίζοντας εμφανίσεις και τύπους/κατηγορίες

<topic id="aueb">
<instanceOf><topicRef xlink:href="#university"/>
</instanceOf>
<baseName>
<baseNameString> Athens University of Economics and
Business
</baseNameString>
</baseName>
<occurrence>
<instanceOf>topicRef xlink:href=“#webpage”/>
</instanceOf>
<resourceRef xlink:href=http://www.aueb.gr//>
</occurrence>
</topic>
Ορίζοντας συσχετίσεις

<association>
<instanceOf>
<topicRef xlink:href=“#holds-position-in-organisation”
</instanceOf>
<member>
<roleSpec><topicRef xlink:href=“#holder”/></roleSpec>
<topicRef xlink:href=“#prastakos”/>
</member>
<member>
<roleSpec><topicRef xlink:href=“#position”/></roleSpec>
<topicRef xlink:href=“#dean”/>
</member>
<member>
<roleSpec><topicRef xlink:href=“#organisation”/></roleSpec>
<topicRef xlink:href=“#aueb”/>
</member>
</association>

Δημιουργώντας ένα θεματικό χάρτη [2] : Οντολογίες

“Η μεταφυσική μελέτη της φύσης της ζωής και της ύπαρξης (Αριστοτέλης)

Η έννοια της οντολογίας έχει υιοθετηθεί από την Τεχνητή Νοημοσύνη και σημαίνει

«Μια οντολογία είναι μια τυπική (formal), κατηγορηματική (explicit) προδιαγραφή μιας
διαμοιρασμένης (shared) εννοιολογικής αναπαράστασης (conceptualization) [ ] και κοινή
κατανόηση κάποιου τομέα, η οποία μπορεί να ανταλλαγεί μεταξύ ανθρώπων και
συστημάτων εφαρμογών” Gruber

Μια οντολογία μπορεί να πάρει διάφορες μορφές αλλά οπωσδήποτε θα


περιλαμβάνει ένα λεξιλόγιο όρων και κάποιας μορφής προδιαγραφές για τη
σημασία τους.

Για τους ΘΧ σημαίνει :


“Μια οντολογία είναι ένα σύνολο από κατηγορίες-τύπους topics που
χρησιμοποιούνται σε ένα ΘΧ ή η έννοια που ορίζει μια κατηγορία θεματικών
χαρτών”.
Δημιουργώντας ένα θεματικό χάρτη [2] : Οντολογίες

Η χρήση μιας οντολογίας αποτελεί ένα απλό τρόπο σύνταξης ενός ΘΧ


Οι βασικές αρχές
Η οντολογία περιγράφει τα είδη των πραγμάτων / θέματα που περιλαμβάνει ο
ΘΧ
Μπορεί επίσης να περιέχει περιορισμούς
Για τα είδη των δηλώσεων που χρησιμοποιούνται ανά είδος / κατηγορία
topic
Για τον πληθυσμό τους
Με βάση την οντολογία δημιουργείται μια διεπαφή κατάλληλη για την
εισαγωγή δεδομένων (εμφανίσεων)
Πλεονεκτήματα
Φιλική προς το χρήστη διεπαφή – δεν απαιτείται η γνώση του συντακτικού
Περισσότερο συνεπείς ΘΧ

Δημιουργώντας ένα θεματικό χάρτη [2] : Θησαυρός

Soprano
ορισμός: The highest category of female
Person (or artificial male) voice
Musician
Ευρύτερος singer
Conductor
όρος:
Player

Bassoonist
Στενότερος lyric soprano, dramatic soprano,
όρος: coloratura soprano
Cellist

Violinist

Singer
Σχετικός όρος: mezzo-soprano
Baritone

Bass
Βασικές έννοιες του ΘΧ:
Mezzo
Topics
Soprano
Associations=συσχετίσεις
Lyric

Dramatic
Occurrences=εμφανίσεις
Colaratura Άλλες έννοιες:
Tenor
Κατηγορίες topics Κατηγορίες
Writer Κατηγορίες εμφανίσεων συσχετίσεων
Artist
Μοντελοποίηση θησαυρού σε θεματικό χάρτη: εφαρμογή

Ε φάνιση
(π.χ. διευκρινιστική Ε φάνιση
Ση είωση, ορισ ός)
Ιεραρχική σχέση

Έννοια / topic Έννοια / topic

Σχέση συσχέτισης
Πεδίο
εφαρ ογής

Όνο α topic (συνώνυ α)


Όνο α topic [σχέση ισοδυνα ίας] Όνο α topic
Εφαρμογές Θεματικών Χαρτών

1. Διαχείριση ταξινομιών (Taxonomy management)

Για τη διαχείριση αδόμητου περιεχομένου


Οργάνωση με βάση το θέμα – αυτός είναι ο τρόπος
αναζήτησης του χρήστη
Μια ταξινομία είναι μια απλή μορφή ΘΧ
Οι ΘΧ παρέχουν μια οργάνωση με βάση τα θέματα αλλά με
επιπλέον δυνατότητες (συγχώνευση, αναζήτηση,
παρουσίαση)
Πλεονεκτήματα:
Στηρίζονται σε πρότυπα άρα είναι ανεξάρτητοι παρόχων
και εξασφαλίζουν τη μακροβιότητα των δεδομένων
Το μοντέλο των συσχετίσεων επιτρέπει εξέλιξη πέρα από
απλές ιεαρχικές δομές
Η ταυτοποίηση επιτρέπει τη συγχώνευση και την
επαναχρησιμοποίηση χαρτών
2. Σημασιολογικά portals (Semantic portals)

Οι ΘΧ ως μοντέλο δημιουργίας μιας αρχιτεκτονικής των πληροφοριών


Για δημοσιεύσεις στον Ιστό (για web sites, portals, intranets, κ.ά.)
Η δομή ενός site ορίζεται ως ένας (και από ένα) ΘΧ
Κάθε σελίδα αναπαριστά ένα topic
Φιλική στο χρήστη πλοήγηση που ορίζεται από τις συσχετίσεις ανάμεσα σε
θέματα-topics
Τα topics χρησιμεύουν στην ταξινόμηση του περιεχομένου
Επιτρέπουν τη θεματοκεντρική διασύνδεση portal
Ε φανίσεις
Πεδίο εφαρ ογής
(γλώσσες)

topic

Τα topics(θέ ατα)
του χάρτη για την
κατηγορία Education
and research

Συσχετίσεις
(ευρύτεροι και
στενότεροι
όροι-θέ ατα)

Ε φανίσεις (κεί ενο και


εικόνα)

3. Διαχείριση μεταδεδομένων

NZETC = New Zealand Electronic Text Centre = μια ψηφιακή βιβλιοθήκη


ανοικτής πρόσβασης = 2.600 κείμενα (65.000 σελίδες), 10.000 επισκέψεις τη
μέρα.

XML, TEI mark-up standards

Το πρώτο μεγάλης κλίμακας XML Topic Map site στη Νέα Ζηλανδία

Βιβλία, κεφάλαια, φωτογραφίες, άνθρωποι, τοποθεσίες,… = Topics


Αναφορές, αποτυπώσεις, κριτικές,… = συσχετίσεις
Μορφότυπα, περιεχόμενο,…= Εμφανίσεις
Topics

topic

Occurrences =
Occurrences = Κατηγορίες
Κατηγορίες ε φανίσεων
ε φανίσεων

Συσχετίσεις
Συσχετίσεις

SPARQL

Χρήστος Παπαθεοδώρου (papatheodor@ionio.gr)


Εισαγωγή
RDF γράφοι: (υποκείμενο, κατηγόρημα, αντικείμενο)που
προέρχονται από RDF τεκμήρια, XML ή σχεσιακές βάσεις
δεδομένων
SPARQL: γλώσσα επερωτήσεων και πρωτόκολλο για την
ανάκτηση πληροφορίας από RDF γράφους
με μορφή URI, κενών κόμβων και τιμών (literals)
εξαγωγή RDF υπογράφων
δημιουργία νέων RDF γράφων που βασίζονται στην
πληροφορία των επερωτώμενων γράφων
Βασική τεχνική η δημιουργία υποδείγματος γράφου
(graph pattern) για το οποίο γίνεται
αναζήτηση/ταίριασμα σε ένα RDF γράφο

Χρήσεις
Εύρεση τιμών από μερικώς γνωστούς γράφους
Ανάκτηση πληροφορίας για ένα αντικείμενο με μη
γνωστές ιδιότητες (properties)
Εκτέλεση επερωτήσεων σε RDF γράφους
Εκτέλεση επερωτήσεων με περιορισμούς σύμφωνα με
τον τύπο των δεδομένων
Ερώτηση σε απομακρυσμένους RDF servers
Χρήση RDF query service σε Web Services

3
Παράδειγμα
Data:
<http://example.org/book/book1> <http://purl.org/dc/elements/1.1/title> "SPARQL Tutorial“

Query:
χρησιμοποιούμε μια μεταβλητή στη θέση του υποκειμένου,
κατηγορήματος, αντικειμένου
δύο μέρη SELECT clause, WHERE clause
SELECT ?title
WHERE
{
<http://example.org/book/book1> <http://purl.org/dc/elements/1.1/title> ?title
}

Query Result: ένας RDF γράφος ⇒ (που επαληθεύει το) γράφο


επερώτησης (query graph)

title
SPAQL Tutorial

Σύνταξη (1/2)
IRI: περικλείονται σε <>
τα IRI μπορεί να είναι URI, Qnames (ζεύγος "x:p” {URI, local-name}, π.χ. {"http://example.com/ns/foo",
"p"}.)
PREFIX:δεσμεύει ένα πρόθεμα σε ένα namespace IRI.
PREFIX foaf: http://xmlns.com/foaf/0.1/
BASE: δηλώνει ένα βασικό IRI, που χρησιμοποιείται για την ανάλυση – δήλωση σχετικών IRI
BASE <http://example.org/book/>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
SELECT ?title
WHERE { <book1> dc:title ?title }
Μεταβλητές: δηλώνονται με πρώτο χαρακτήρα τα «?» ή «$». Το $abc και το ?abc είναι
η ίδια μεταβλητή.
Απλοί όροι (literals): δηλώνονται με “” ή ‘’. Μπορούν να φέρουν ετικέτα της γλώσσας
που ανήκουν ("Literal"@language) ή τον τύπο δεδομένων που ανήκουν
("10"^^xsd:integer)
Υποδείγματα (patterns) RDF τριάδων: περικλείονται από {}. Οι τελείες «.» διαχωρίζουν
τα υποδείγματα τριάδων
Στα υποδείγματα τριάδων με κοινό υποκείμενο βάζουμε (;) έτσι ώστε το υποκείμενο στο ερώτημα να
γράφεται μόνο μία φορά. Π.χ
?x foaf:name ?name ; = ?x foaf:name ?name .
foaf:mbox ?mbox . ?x foaf:mbox ?mbox
Στα υποδείγματα τριάδων με κοινό υποκείμενο και κατηγόρημα, τα αντικείμενα διαχωρίζονται με (,)
?x foaf:nick “Alice”, “Alice_” = ?x foaf:nick “Alice” .
?x foaf:nick “Alice_”

5
Σύνταξη (2/2)

Κενοί κόμβοι
Το υπόδειγμα :a :b [ :c :d ] είναι ίσο με
:a :b _:x . _:x :c :d .
για τον κενό κόμβο _:x
RDF Collections
:a :b ( :c :d :e :f ) που αποτελούν σύντμηση
πολλών τριάδων

Αναζήτηση
Προσδιορισμός ενός συνόλου από αντικαταστάσεις μεταβλητών με τιμές έτσι ώστε να
δημιουργείται ένα υποσύνολο τριάδων ενός RDF γράφου
Data
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
_:a foaf:name "Alice" .
_:a foaf:mbox <mailto:alice@example.net> .
_:b foaf:name "Bob" .

Query 1
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE { ?x foaf:name ?name }
ORDER BY ASC[?name]

Query 2
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE {
?person foaf:mbox <mailto:alice@example.net> .
?person foaf:name ?name .
}
Results 1 name Results 2 name
Alice Alice

Bob

7
Περιορισμοί τιμών
Περιορίζουν τις τιμές στις λύσεις των επερωτήσεων
FILTER ?x < 3 .
Βασίζονται στα XQuery 1.0 and XPath 2.0 Function
and Operators
Εφαρμόζονται στους τύπους δεδομένων
XSD boolean, string, integer, decimal, float, double,
dateTime
BOUND, isURI, isBLANK, isLITERAL, REGEX, LANG,
DATATYPE, STR (lexical form)
Τελεστές σύγκρισης τιμών: <, >, =, <=, >= και !=

Παράδειγμα @prefix dc:


@prefix stock:
<http://purl.org/dc/elements/1.1/> .
<http://example.org/stock#> .
@prefix inv: <http://example.org/inventory#> .

stock:book1 dc:title "SPARQL Query Language Tutorial" .


stock:book1 inv:price 10 .
stock:book1 inv:quantity 3 .

stock:book2 dc:title "SPARQL Query Language (2nd ed)" .


stock:book2 inv:price 20 ; inv:quantity 5 .

stock:book3 dc:title "Moving from SQL to SPARQL" .


stock:book3 inv:price 5 ; inv:quantity 0 .
book title

stock:book1 “SPARQL Query stock:book4 dc:title "Applying XQuery" .


Language stock:book4 inv:price 20 ; inv:quantity 8 .
Tutorial"
PREFIX dc: <http://purl.org/dc/elements/1.1/>
PREFIX stock: <http://example.org/stock#>
PREFIX inv: <http://example.org/inventory#>

SELECT ?book ?title


WHERE {
?book dc:title ?title .
?book inv:price ?price . FILTER ?price < 15 .
?book inv:quantity ?num . FILTER ?num > 0 . }

9
OPTIONAL
Η RDF αφορά σε ημιδομημένα δεδομένα (semi
structured)
Δεν προβλέπει περιορισμούς ακεραιότητας
δεδομένων (integrity constraints)
Με δεδομένο ότι η ποιότητα των πηγών
μεταδεδομένων μπορεί να ποικίλει, μια γλώσσα
επερωτήσεων πρέπει να προσθέτει πληροφορία,
προκειμένου να μην αποτύχουν οι επερωτήσεις
λόγω ελλειπούς πληροφορίας
Η έκφραση OPTIONAL{pattern} είναι ίση με
{pattern} OR { NOT(pattern)}

10

Παράδειγμα 1
Το κατηγόρημα nick δεν έχει τιμή όταν το κατηγόρημα name έχει τιμή
"Bob" γιατί δεν υπάρχει αντίστοιχη τριάδα _:b με κατηγόρημα nick
@prefix foaf: <http://xmlns.com/foaf/0.1/> .

_:a foaf:name "Alice" .


_:a foaf:nick "A-online" .

_:b foaf:name "Bob" .

PREFIX foaf: <http://xmlns.com/foaf/0.1/>


SELECT ?name ?nick
WHERE { ?x foaf:name ?name .
OPTIONAL {?x foaf:nick ?nick }
}
name nick

Alice A-online
Bob

11
Φωλιασμένα OPTIONAL
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix vcard: <http://www.w3.org/2001/vcard-rdf/3.0#> .
_:a foaf:name "Alice" .
_:a foaf:mbox <mailto:alice@work.example> .
_:a vcard:N _:x .

_:x vcard:Family "Hacker" .


_:x vcard:Given "Alice" .

_:b foaf:name "Bob" .


_:b foaf:mbox <mailto:bob@work.example> .
_:b foaf:N _:z .

_:z vcard:Family "Hacker" .

_:e foaf:name "Ella" .


_:e vcard:N _:y .

_:y vcard:Given "Eleanor" .

12

Φωλιασμένα OPTIONAL (query)


PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX vcard: <http://www.w3.org/2001/vcard-rdf/3.0#>
SELECT ?foafName ?mbox ?gname ?fname
WHERE
{?x foaf:name ?foafName .
OPTIONAL {?x foaf:mbox ?mbox } .
OPTIONAL {?x vcard:N ?vc .
?vc vcard:Given ?gname .
OPTIONAL { ?vc vcard:Family ?fname }
}
}

13
Φωλιασμένα OPTIONAL (results)

Ανακτά το name και αν υπάρχουν τα mbox, το


vCard given name και το vCard Family name
Φωλιάζοντας το υπόδειγμα που περιέχει το
vcard:Family, η επερώτηση ανακτά δεδομένα
μόνο αν υπάρχει το κατηγόρημα vcard:N

14

OPTIONAL με περιορισμούς
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix : <http://example.org/book/> .
@prefix ns: <http://example.org/ns#> .

:book1 dc:title "SPARQL Tutorial" .


:book1 ns:price 42 .
:book2 dc:title "The Semantic Web" .
:book2 ns:price 23 .

PREFIX dc: <http://purl.org/dc/elements/1.1/>


PREFIX ns: <http://example.org/ns#>
SELECT ?title ?price
WHERE {?x dc:title ?title .
OPTIONAL { ?x ns:price ?price . FILTER (?price < 30) }

! "#
"$ % &'
15
UNION
Η SPARQL παρέχει τη δυνατότητα συνδυασμού
των υποδειγμάτων RDF γράφων έτσι ώστε να
ανακτώνται περισσότερα από ένα εναλλακτικά
υποδείγματα σε ένα RDF γράφο
Η δυνατότητα αυτή παρέχεται από τη δήλωση
UNION

16

Παράδειγμα UNION
@prefix dc10: <http://purl.org/dc/elements/1.0/> .
@prefix dc11: <http://purl.org/dc/elements/1.1/> .

_:a dc10:title "SPARQL Query Language Tutorial" .


_:b dc11:title "SPARQL Protocol Tutorial" .
_:c dc10:title "SPARQL" .
_:c dc11:title "SPARQL" .

Query:
PREFIX dc10: <http://purl.org/dc/elements/1.0/>
PREFIX dc11: <http://purl.org/dc/elements/1.1/>

SELECT DISTINCT ?title


WHERE { { ?book dc10:title ?title } UNION { ?book dc11:title ?title } }

Ανακτά τους τίτλους των βιβλίων που έχουν περιγραφεί είτε με την έκδοση 1.0 είτε
με την έκδοση 1.1. του Dublin Core
Η SELECT DISTINCT εξασφαλίζει μοναδικές τιμές στους τίτλους

"SPARQL Protocol Tutorial"


"SPARQL Query Language Tutorial"

"SPARQL”
17
Εναλλακτικά
PREFIX dc10: <http://purl.org/dc/elements/1.0/>
PREFIX dc11: <http://purl.org/dc/elements/1.1/>

SELECT ?x ?y
WHERE { { ?book dc10:title ?x } UNION { ?book
dc11:title ?y } }

"SPARQL"

"SPARQL Protocol Tutorial"


"SPARQL"
"SPARQL Query Language
Tutorial”

18

Ανακεφαλαίωση
Ένα υπόδειγμα (pattern) αναζητά RDF δεδομένα (δηλ. Εξετάζεται αν
ταιριάζει σε ένα μέρος ενός RDF γράφου)
Κάθε φορά που ένα υπόδειγμα ταιριάζει σε ένα RDF υπό-γράφο τότε
υπάρχει λύση
Η ακολουθία των λύσεων μπορεί να περιορισθεί από: Project, distinct,
order, limit/offset
Limit: ακέραιος που προσδιορίζει το πλήθος των απαντήσεων
Offset: ακέραιος που ορίζει από που να αρχίσει η παράθεση των
απαντήσεων
Μορφές αποτελεσμάτων:
SELECT: αποδίδει τιμές σε μεταβλητές (bindings)
CONSTRUCT: δημιουργεί ένα RDF υπό-γράφο με τις τιμές που
αποδίδονται στις μεταβλητές
DESCRIBE:δημιουργεί RDF γράφο που περιγράφει τους πόρους που
ανακτώνται
ASK: απαντά με μια true ή false τιμή

19
Εισαγωγή γράφων
Για καλύτερη διαχείριση των δεδομένων δίνεται δυνατότητα
εισαγωγής γράφων:
aliceFoaf.ttl:
_:a foaf:name "Alice" .
_:a foaf:mbox <mailto:alice@work.example.com> .
_:a foaf:mbox <mailto:alice@home.example.org> .
...

bobFoaf.ttl:
_:c foaf:mbox <mailto:bob@work.example.com> .
_:c foaf:name "Robert" .
_:c foaf:nick "bob" .
...

20

Τύποι RDF δεδομένων


Υπάρχουν δύο μορφές RDF datasets: η
προκαθορισμένη (default) και οι named graphs.
FROM <http://example.org/base.rdf>
FROM NAMED <http://example.org/data1.rdf>
FROM NAMED <http://example.org/data2.rdf>
...
Η λέξη GRAPH δίνει πρόσβαση σε named graphs

21
Αναζήτηση σε πολλούς γράφους
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?graph
WHERE GRAPH ?graph {
?x foaf:name "Alice" .
}
Επιστρέφει τα URIs των γράφων που
περιέχουν τριάδες για το όνομα της Alice

22

Αναζήτηση σε συγκεκριμένο γράφο

PREFIX foaf:
<http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE GRAPH ex:aliceFoaf.ttl {
?x foaf:name ?name
}

23
Παράδειγμα 1
BASE <http://www.w3.org/2004/Talks/17Dec-sparql/data/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT ?person ?name ?mbox

FROM NAMED <aliceFoaf.ttl>


FROM NAMED <bobFoaf.ttl>
FROM NAMED <celineFoaf.ttl>
FROM NAMED <danFoaf.ttl>
FROM NAMED <eveFoaf.ttl>

WHERE {
GRAPH ?g { ?person rdf:type foaf:Person;
foaf:name ?name; foaf:mbox ?mbox
} .
}
Ανάκτηση των name και των mbox όλων των ανθρώπων

24

Παράδειγμα 2
BASE <http://www.w3.org/2004/Talks/17Dec-sparql/data/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT DISTINCT ?name ?mbox

FROM NAMED <aliceFoaf.ttl>


FROM NAMED <bobFoaf.ttl>
FROM NAMED <celineFoaf.ttl>
FROM NAMED <danFoaf.ttl>
FROM NAMED <eveFoaf.ttl>

WHERE {
GRAPH ?g { ?person rdf:type foaf:Person .
OPTIONAL { ?person foaf:name ?name } .
OPTIONAL { ?person foaf:mbox ?mbox }
} .
}
ORDER BY ASC[?name]

Ανάκτηση όλων των ανθρώπων, αν υπάρχουν τα ονόματά τους ή τα mboxes, χωρίς επαναλήψεις
και ταξινομημένα κατά αύξουσα τάξη

25
Συστήματα
Οργάνωσης
Γνώσης

Κοινωνικές
ταξονομίες
(folksonomies)
στο

web
2.0


Κωνσταντία

Κακάλη,
Βιβλιοθηκονόμος
MSc‐Phd
Candidate


Περιεχόμενα


  Δημιουργοί
μεταδεδομένων

  Web
2.0
και
κοινωνικά
δίκτυα

  Ιστότοποι
κοινωνικής
δικτύωσης


  Κοινωνικές
επισημειώσεις
(Tags)

  Τυπολογία
συστημάτων
κοινωνικής
επισημείωσης

  Γιατί
επισημειώνουν
οι
χρήστες;

  Tag
cloud

  Folksonomy

  Πλεονεκτήματα
των
κοινωνικών
επισημειώσεων

  Περιορισμοί
των
κοινωνικών
ταξονομιών


  Εφαρμογές
σε
βιβλιοθήκες

  Εφαρμογές
σε
μουσεία,
κ.α.

  Κοινωνικές
ταξονομίες
και
σημασιολογικός
ιστός


  Βιβλιογραφία


2

Δημιουργοί
μεταδεδομένων

  Τα
μεταδεδομένα
δημιουργούνται
τόσο
στο
συμβατικό
όσο
στο
ψηφιακό

χώρο
κύρια
από
επιστήμονες
της
πληροφόρησης,
σε
βιβλιοθήκες
και
σε

άλλους
οργανισμούς
πληροφόρησης.

  Η
παροχή
μεταδεδομένων
από
τους
διανοητικούς
δημιουργούς
της
πληροφορίας.


  Το
πρότυπο
μεταδεδομένων
Dublin
Core
είχε
δημιουργηθεί
για
να
απαντήσει
σε
αυτή
την
ανάγκη.


  Η
τρίτη
προσέγγιση,
είναι
η
δημιουργία
μεταδεδομένων
από
τους
χρήστες

  
Η
προσέγγιση
αυτή
δεν
είναι
καινούργια.


  Η
τεχνική
του

Citason
analysis
χρησιμοποιείται
για
τις
σχέσεις
ανάμεσα
στις

ακαδημαϊκές
δημοσιεύσεις
με
τις
παραπομπές
τους.


  Παρόμοια
ανάλυση
των
συνδέσμων
στον
παγκόσμιο
ιστό,
χρησιμοποιείται

από
τον
αλγόριθμο
PageRank,
η
θεωρητική
βάση
της
μηχανής
αναζήτησης

Google.


  Τα
συστήματα
συστάσεων
(recommendason
systems)
και
άλλα
που

χρησιμοποιούν
το
συνεργατικό
φιλτράρισμα
(collaborasve
filtering),
είναι

μορφές
άρρητης
παραγωγής
μεταδεδομένων
από
χρήστες.


3


Web
2.0
και
κοινωνικά
δίκτυα

  Το
"Web
2.0"
(Ιστός
[έκδοση]
2.0),
είναι
μια
φράση
που
εφευρέθηκε
από
την

O'Reilly
Media
το
2004,
και
αναφέρεται
σε
μια
δεύτερη
γενιά
υπηρεσιών

βασισμένων
στο
Διαδίκτυο
‐
όπως
οι
ιστότοποι
κοινωνικής
δικτύωσης
(social

networking
sites),
τα
wikis,
διάφορες
εφαρμογές
και
εργαλεία
επικοινωνίας
‐
που

δίνουν
έμφαση
στην
ηλεκτρονική
συνέργεια
και
ανταλλαγή
μεταξύ
των
χρηστών.

  
Η
O'Reilly
Media,
σε
συνεργασία
με
την
MediaLive
Internasonal,
χρησιμοποίησαν

τη
φράση
ως
τίτλο
σε
μια
σειρά
από
συνέδρια,
και
από
το
2004
πολλά
μέλη

τεχνικών
υπηρεσιών,
αλλά
και
μέλη
διαδικτυακών
κοινοτήτων
υιοθέτησαν
τον

όρο.

  Τα
«κοινωνικά
δίκτυα»
δεν
είναι
νέος
όρος,
προέρχεται
από
τις
κοινωνικές

επιστήμες,
που
τα
ορίζει
ως
τα
νοητά
δίκτυα
που
σχηματίζονται
από
κοινωνικές

σχέσεις
(οικογενειακές,
πολιτικές,
φιλικές)
ανάμεσα
στα
άτομα
που
συνάπτονται,

διατηρούνται
και
δυναμώνουν
ή
το
αντίθετο,
με
βάση
την
ελεύθερη
βούληση
και

επιλογή
των.


  Η
απεικόνιση
των
κοινωνικών
δικτύων
γίνεται
με
τα
κοινωνιογράμματα,
δηλαδή

γράφους
με
κόμβους
(nodes)
που
δείχνουν
τις
οντότητες
και
ακμές
που
δείχνουν

τις
σχέσεις.


4

Ιστότοποι
κοινωνικής
δικτύωσης
(1)


  Οι
ιστότοποι
κοινωνικής
δικτύωσης
είναι
εφαρμογές
του
ιστού
που
επιτρέπουν
σε

άτομα
να
δημιουργήσουν
το
δημόσιο
προφίλ
τους
στο
πλαίσιο
ενός
συστήματος,
να

επικοινωνούν
και
να
μοιράζονται
πληροφορίες
με
μια
λίστα
από
άλλα
άτομα
που
αυτοί

επιλέγουν.
H
διαφορά
με
usenet
ή
forum
είναι
με
κέντρο
τα
άτομα
κι
όχι
το
θέμα.
Οι

βασικές
λειτουργίες
είναι
:

  E‐mail
(μέσω
του
site)

  Groups
(διαδικτυακές
ομάδες
που
άτομα
τα
οποία
μοιράζονται
κοινά
ενδιαφέροντα
μπορούν
να

συμμετέχουν)

  Events
(ανακοινώσεις
για
τα
πάντα,
από
γενέθλια
έως
συναυλίες)

  Forums
(τα
μέλη
επικοινωνούν
και
συζητούν
για
ποκιλία
θεμάτων)

  Photo
and
video
sharing
(Σύμφωνα
με
το
MySpace
8
εκατομμύρια
εικόνες
και
60,000
νέα
βίντεο

ανεβάζονται
στους
server
του
σε
καθημερινή
βάση)

  Classified/Marketplace
secson
(δωρεάν
διαφήμιση
για
οποιονδήποτε
και
οτιδήποτε)

  Chat
rooms

  Bullesn
boards
(τα
μέλη
δημιοσεύουν
πληροφορίες
και
τις
στέλνουν
σε
όλους
τους
φίλους
τους)

  Blogs

  Find
friends
(Με
διάφορους
τρόπους
και
κριτήρια
το
Facebook
και
το
Myspace
ψάχνουν
και
σου

προτείνουν
φίλους)

  Personal
profile
pages
(Μπορούν
να
ειδωθούν
ως
por•olio,
βιογραφικό
ή
ημερολόγιο



5


Ιστότοποι
κοινωνικής
δικτύωσης
(2)

Σε
αντίθεση
με
τους
ιστότοπους
που
έχουν
σκοπό
την
ανάπτυξη
των

ανθρώπινων
σχέσεων,
υπάρχουν
ιστότοποι
με
σκοπό
την
οργάνωση
και

διαχυση
της
πληροφορίας.

del.icio.us
είναι
ιστότοπος
κοινωνικής
σελιδοσήμανσης
(social
bookmarking
site).
Εκτός
από

την
αποθήκευση
ενός
συνδέσμου
μιας
ιστοσελίδας
στα
«Αγαπημένα
μου»
ή

«Σελιδοδείκτες»
για
μελλοντική
χρήση,
η
αποθήκευση
στη
σελίδα
σου
στο
delicious
με

σκοπό
να
μπορείς
να
το
ανακτήσεις
από
οποιοδήποτε
υπολογιστή,
να
περιγράψεις
τον

ψηφιακό
σου
πόρο
με
λέξεις
(tags)
για
να
τον
ευρετηριάσεις.

Flickr

a
digital
image
storage.
Μπορείς
να
οργανώσεις
όλες
τις
φωτογραφίες
σου
σε
άλμπουμ,

να
τις
περιγράψεις
με
λέξεις
(tags)
και
δεις
άλλες
φωτογραφίες
χρηστών.

Technoras,


που
επιτρέπει
σε
χρήστες
να
αναζητούν
στο
περιεχόμενο
των
ιστολογίων
που

ανανεώνεται
πιο
γρήγορα
σε
σχέση
με
τις
υπόλοιπες
ιστοσελίδες.
Η
αναζήτηση
φέρνει

αποτελέσματα
που
έχουν
αναρτηθεί
πρόσφατα
σε
σχέση
με
άλλες
μηχανές
αναζήτησης.

Μια
σειρά
βέβαια
από
εφαρμογές
όπως
είναι
η
Connotea
ή
η
CiteUlike
απευθύνονται
στον

ακαδημαϊκό
χώρο,
σε
επιστήμονες
και
ερευνητές,
καθώς
συνδέονται
με
αξιόπιστες
βάσεις

δεδομένων
όπως
η
PubMed
αλλά
και
ελέγχοντας
την
χαμηλής
ποιότητα
πληροφορία

επιτρέποντας
τη
επισήμανση
σε
συνδέσμους
από
έγκυρα
μόνο

περιοδικά.


6

Κοινωνικές
επισημειώσεις
(Tags)

Οι
επισημειώσεις
(tags),
είναι
στην
ουσία,

λέξεις
–
κλειδιά,
θεματικοί
όροι,

που
επιλέγονται
από
τους
χρήστες
συχνά
μαζί
με
μια
σύντομη
περιγραφή

του
ιστοτόπου,
είναι
μια
μορφή
αδόμητης
αλλά
ρητής
δημιουργίας

μεταδεδομένων
από
τους
χρήστες
της
πληροφορίας.
Η
διαδικασία
αυτή

είναι
το
λεγόμενο
«social
tagging».


Το
«social
tagging»
ή
αλλιώς
το
«collaborasve
tagging»
είναι
ένα
σχετικά
νέο

φαινόμενο,
μια
μορφή
οργάνωσης
γνώσης
και
τρόπος
ανακάλυψης


πληροφοριακών
πόρων,
που
επιτρέπει
στον
καθένα
να
δημιουργεί

σελιδοδείκτες
(bookmarks)
ή
επισημειώσεις
(tags)
για
να
οργανώσει
και
να

αποθηκεύσει,
με
ένα
αυτόνομο
σύστημα
επισήμανσης,
την
πληροφορία

(Macgregor
and
McCulloch,
2006).

Στην
βιβλιογραφία
το
φαινόμενο
αναφέρεται
και
με
τους
όρους
«κοινωνική

ταξινόμηση»
(social
classificason),
ή
«κοινωνική
ευρετηρίαση»
(social

indexing).



7


Τυπολογία
συστημάτων
κοινωνικής
επισημείωσης


Τα
συστήματα
κοινωνικών
επισημειώσεων
δεν
είναι
ομοιόμορφα.

Κάθε
ιστότοπος
αναπτύσει
ανάλογα
συστήματα
για
τους
δικούς
του
στόχους.

Οι
κύριες
διαφορές
είναι:

1.  Δυνατότητα
του
συστήματος
σύστασης
επισημειώσεων
:

1.  Αν
το
σύστημα
προτείνει
επισημειώσεις
στο
χρήστη
τις
πιο
δημοφιλείς
επισημειώσεις


2.  Αν
το
σύστημα
προτείνει
τις
πιο
συχνά
χρησιμοποιημένες
επισημειώσεις
του
χρήστη.

2.  Συστήματα
σε
συνδυασμό
εξατομικευμένων
υπηρεσιών.

1.  Επισημειώσεις
βάζουν
μόνο
οι
εγγεγραμμένοι
χρήστες


2.  Ελεύθερα
συστήματα
κοινωνικής
επισημείωσης

3.  Δυνατότητα
ελέγχου
των
λέξεων
και
των
συνθέσεων
τους.

1.  Αν
το
σύστημα
ελέγχει
την
ορθογραφία
των
λεξεων


2.  Αν
το
σύστημα
δίνει
δυνατότητα
φράσεων
.


8

Γιατί
επισημειώνουν
οι
χρήστες;(1)

  Οι
χρήστες
επισημειώνουν
(ιστοσελίδες,
ψηφιακά
αντικείμενα,
εγγραφές)
με
σκοπό

να
τα
επανακτήσουν.

  Αν
και
ο
αρχικός
σκοπός
είναι
η
ανακάλυψη
των
ψηφιακών
αντικειμένων
και
ο

διαμοιρασμός
τους
με
άλλους,
ο
τελικός
σκοπός
είναι
να
ξαναβρεθεί
με
την

έννοια
που
ο
χρήστης

το
έχει
χαρακτηρίσει
και
ανταποκρίνεται
στις
αναζητήσεις

του.

  Οι
χρήστες
επισημειώνουν
για
να
αναδείξουν
το
περιεχόμενο
με
σκοπό
να

ανακτηθεί
από
άλλους
χρήστες.

  Κύρια
από
τους
δημιουργούς

περιεχομένου
ώστε
στην
φυλλομέτρηση
της

κοινωνικών
επισημειώσεων
θα
ανακτηθεί
το
περιεχόμενο
τους.


  Ακόμα
για
να
ακουστεί
η
γνώμη
τους,
με
την
όποια
μορφή
κριτικής
περισσότερο,

παρά
περιγραφής
των
δεδομένων.

  Digg
ή
Reddit
έχουν
εφαρμογές
ψηφοφορίας
και
βαθμού
προτίμησης
αλλά
σε

απλά
συστήματα
επισημειώσεων
τα
tags
χρησιμοποιούνται
ως
μέσο
κριτικής.

  Είναι
αμφίβολο
το
αποτέλεσμα
της
κοινωνικής
ταξονομίας
που
αναπτύσσεται

από
τέτοιες
επισημιώσεις


  Πρόβλημα
και
στην
ανάκτηση
πληροφορίας

9


Γιατί
επισημειώνουν
οι
χρήστες;(2)

  Οι
χρήστες
επισημειώνουν
για
να
διορθώσουν
ή
να
εμπλουτίσουν
το
ήδη

υπάρχον
σύστημα
ανάκτησης
πληροφορίας.

  Συναντάται
όταν
οι
χρήστες
είναι
πιο
εξειδικευμένοι
από
τους
ευρετηριαστές.
Οι

επισημειώσεις
αυτές
μπορεί
να
εμβαθύνουν
και
να
εμπλουτίζουν
το
υπάρχον
σύστημα

ευρετηρίασης.

Ακόμα
μπορεί
να
είναι
έμμεσος
τρόπος
διόρθωσης
των
όρων
που

ευρετηριάζονται.

  Για
να
δημιουργήσουν
μια
«κοινωνική
ταξονομία».

  Τόσο
οι
χρήστες
όσο
και
οι
δημιουργοί
περιεχομένου,

επισημειώνοντας
σελίδες
ή

αντικείμενα
συνδέονται
με
άλλα
σχετικά
(Technoras).


  Διαφορα
λογισμικά
ιστολογίων
(π.χ.
WorldPress)
χρησιμοποιούν
tags
για
να

δημιουργούν
καταλόγους
σχετικών
άρθρων
από
και
μέσα
στο
site.

  Ένας
τρόπος
δημιουργίας
μιας
πρότασης
βιβλιογραφίας.

  Για
να
παίξουν
παιχνίδια


  ESP
game


10

Tag
cloud


Το
«σύννεφο
επισημειώσεων»
ή
tag
cloud
είναι
το
«δημόσιο
πρόσωπο»,
η
δημόσια

εμφάνιση
μιας
κοινωνικής
ταξονομίας.

Η
δημοτικότητα
των
επισημειώσεων
καθορίζεται
από
τη
συχνότητα
χρήσης
τους
και

συχνά
απεικονίζονται
συνολικά
σε
«σύννεφα
από
επισημειώσεις»
(tag
clouds),
που
οι

πιο
δημοφιλείς
και
συχνά
χρησιμοποιημένοι
όροι
έχουν
υποδειχθεί
με
μεγαλύτερα

και
πιο
έντονα
γράμματα.



Αυτό είναι και το ευρετήριο που


εµφανίζεται στους χρήστες, σε µια
επίπεδη συνέχεια, χωρίς ιεραρχία, δοµή
και πλαίσιο. Οι όροι αποτελούνται από
µια λέξη αλλά συχνά µε τη
χρησιµοποίηση συµβόλων στίξης
µπορούν να συνδυαστούν µεταξύ τους
(π.χ. διαχείριση+γνώση).
Εμφανίζονται
τις
περισσότερες
φορές

αλφαβητικά.

11


Folksonomy
ή
κοινωνική
ταξονομία


  Η
folksonomy,
δηλαδή
ταξονομία
με
«λαϊκούς»
(folks)
όρους,
όπως

αποδόθηκε
από
τον
Thomas
Vander
Wal
με
τη
συνένωση
των
παραπάνω

όρων
(Vander
Wal,
2004).
Κατά
κάποιο
τρόπο,
η
τεχνολογία
αυτή
κάνει

τους
χρήστες
να
δημιουργούν
τα
δικά
τους
ελεγχόμενα
λεξιλόγια
και
να

προσδιορίζουν
θεματικά
τους
ιστότοπους
που
επισκέπτονται
και
τους

ενδιαφέρουν.

  Οι

κοινωνικές
ταξονομίες
συνηθίζουν
να
οργανώνουν
την
πληροφορία

και
να
υποστηρίζουν
την
ανάκτηση
της
πληροφορίας
(IR),
αλλά
το

σημαντικότερο
δημιουργούν
κοινότητες
χρηστών
με
κοινό
λεξιλόγιο.

  Τυπολογία
κοινωνικών
ταξονομιών
:

  Broad
folksonomies
(Del.icio.us)

  Narrow
folksonomies

(Flickr)

  Personomies



12

Πλεονεκτήματα
των
κοινωνικών
επισημειώσεων
(1)

  Για
την
ατομική
διαχείριση
της
πληροφορίας
(personal
informason
management
–

PIM),
καθώς
τα
συστήματα
αυτά
(tagging
systems)
αποτελούν
εργαλεία
διαχείρισης

και
οργάνωσης
της
πληροφορίας.

  Οι

κοινωνικές
ταξονομίες
περιλαμβανουν
και
απεικονίζουν
το
λεξιλόγιο
του
κάθε

χρήστη
χωρίς
αποκλεισμούς,
πολιτικές
κοινωνικές
και
πολιτιστικές
προκαταλήψεις.


  Είναι
δημοκρατικές
εκφράσεις
χρηστών
που
αυτό‐προσδιορίζουν
τις
ανάγκες
τους.

Σε
ένα
παραδοσιακό
σύστημα
τις
ανάγκες
αυτές
προσπαθεί
να
τις
εκφράσει
ο

καταλογογράφος.

  Οι
κοινωνικές
ταξονομίες
δημιουργούν
κοινότητες.
Παραπέρα
θα
μπορούσαμε
να

πούμε
ότι
δημιουργεί
κοινότητες
δρώσες,
κοινωνικά
δίκτυα
σε
εικονικό
και

πραγματικό
χώρο,
αφού
είναι
βασικές
υπηρεσίες
του
κοινωνικού
διαδικτύου
(social

web).


  Οι
κοινωνικές
ταξονομίες
εκφράζοντας
τις
διαθέσεις
των
χρηστών,
δίνουν
τη

δυνατότητα
να
παρατηρήσουμε
πως
και
γιατί
οι
χρήστες
επισημειώνουν
τα

ψηφιακά
αντικείμενα.
Να
παρατηρήσουμε
τη
συμπεριφορά
των
χρηστών.

  
 (επισημειώσεις
λειτουργικές
όπως:
to_read,
to_watch,
)


13


Πλεονεκτήματα
των
κοινωνικών
επισημειώσεων
(2)

  Προσφέρουν
μια
εναλλακτική
λύση
χαμηλού
κόστους.
Η
πληθώρα
των

πληροφοριών
(μέσα
από
τα
νέα
μέσα
:
wiki’s,
blogs)
κάνει
μια
παραδοσιακή

ταξονομία
και
ένα
ελεγχόμενο
λεξιλόγιο
μια
αδύνατη
λύση

  Χωρίς
αμφιβολία,
το
σύστημα
αυτό
είναι
χρήσιμο
για
τα
ψηφιακά
αντικείμενα
που
δεν

έχουν
καθόλου
μεταδεδομένα,
ιδιαίτερα
φωτογραφίες,
video,
χάρτες
κ.α.
(π.χ.
σε
μια

δημόσια
βιβλιοθήκη
θα
μπορούσε
να
βοηθήσει
στη
επισήμανση
τοπικών
ιστορικών

φωτογραφιών).

  Είναι
σύγχρονες
και
προσφέρουν
επίκαιρους
και
νέους
όρους
που
δεν
είναι

εύκολο
σε
μια
ελεγχόμενη
ιεραρχική
ταξονομία.


  σημαντική
μπορεί
να
αναδειχθεί
η
χρήση
τους
σε
μικρές
κοινότητες
χρηστών
με

εξειδικευμένα
θέματα,
ιδιαίτερα
σε
θεματικές

περιοχές
που
δεν
υπάρχουν
λεξιλόγια

  Ενώ
οι
ιεραρχικές
ταξονομίες
σχεδιάζονται
για
την
εύρεση
συγκεκριμένων

πόρων,
οι
κοινωνικές

προορίζονται

και
στην
ανακάλυψη
άγνωστων
κι

απροσδόκτητων
πόρων.


14

Περιορισμοί
των
κοινωνικών
ταξονομιών


Η

παράλληλη
χρήση
και
του
ενικού
και
του
πληθυντικού
των
λέξεων
σε
μια


έννοια
(π.χ.
βιβλίο
–
βιβλία)

Η
έλλειψη
ιεραρχίας
και
κανόνων.
Είναι
επίπεδα
συστήματα.
Δεν
υπάρχουν

σχέσεις
γένους
–
είδους.


  στο
πρόβλημα
αυτό
οι
υποστηρικτές
των
πιστεύουν
ότι
η
πολυιεραρχία
θα
μείωνε
την

ευχρηστία
των
συστημάτων


Η
έλλειψη
εξειδίκευσης
και
εξαντλητικότητα
της
θεματικής
επισημείωσης



Η
ανυπαρξία
ελεγχόμενων
καταλόγων
ονομάτων
(δεν
φανερώνει
το
επώνυμο,

το
όνομα
ή
το
ψευδώνυμο).


Η
κοινή
προσέγγιση
για
κάθε
τύπο
υλικού
(κείμενο,
ιστοσελίδα,
εικόνα
κ.α.),

Ακόμα,
οι
κοινωνικές
ταξονομίες
είναι
ευαίσθητες
στο
gaming,
καθώς
ένας

κακοήθης
χρήστης
μπορεί
να
προωθεί
επισημειώσεις
για
να
αλλοιωθεί
το

σύστημα.


15


Περιορισμοί
των
κοινωνικών
ταξονομιών
(2)

Η
έλλειψη
ελέγχου
συνωνύμων,
ομώνυμων,
η
χρήση
ακρώνυμων.



 
Η
έλλειψη
ενός
ελεγχόμενου
λεξιλογίου
που
θα
«ανακάλυπτε»
τους

σχετιζόμενους
όρους
(π.χ.
ένα
ερώτημα
για
τη
«γρίπη
των
πτηνών»,
στη

κοινωνική
υπηρεσία
βιβλιογραφικής
αναφοράς
(social
citason)

Connotea

(www.connotea.org/)

παραπέμπουν
σε
είκοσι
έξι
διαφορετικούς
όρους

που
περιγράφουν
την
ίδια
έννοια).


 είναι
μια
σχεδιαστική
επιλογή
ή
μια
αδυναμία;


 αλλά
μια
σειρά
από
συστήματα
παρέχουν
μια
λίστα
σχετικών
όρων


Το
πιο
σημαντικό
αποτέλεσμα
των
παραπάνω
η
έλλειψη
ακρίβειας,
για

πολλούς
είναι
ανευ
χρησιμότητας
για
την
αναζήτηση
της
πληροφορίας.


 Η
απάντηση
από
τους
υποστηρικτές
των
συστημάτων
:
η
ακρίβεια
δεν

είναι
το
παν.
Μια
παραδοσιακή
ταξονομία
μπορεί
να
έχει
αποτελέσματα

ανάκλησης
των
πιο
σχετικών
πόρων
στα
ερωτήματα
μας,
αλλά
ο
χρήστης

θα
πρέπει
να
γνωρίζει
πώς
να
τα
διατυπώνει.


16

Κατανομές

συμπεριφοράς
των
επισημειώσεων


Δύο
διαφορετικές
κατανομές


Η
εκθετική
κατανομή

(infometrics
–
power
law)

Με
τη
γνωστή
μακρυά
ουρά

(long
tail)


Η
αντίστοφη
λογιστική

κατανομή


(inverse
logissc)

Σε
αυτή
την
κατανομή
υπάρχει
ο

και

ο
μακρύς
κορμός
(long
trunk)

και
μακρυά
ουρά
(long
tail)


17


Μοντέλα
συστημάτων
κοινωνικών
επισημειώσεων



18

Εφαρμογές
σε
βιβλιοθήκες

  Πολλές
βιβλιοθήκες
προβάλλουν
διεξόδους,
αναπτύσοντας
ή
εφαρμόζοντας
στα

υπάρχοντα
συστήματα
τους
(όπως
OPAC)
συστήματα
κοινωνικών
επισημειώσεων
και

δημιουργίας
κοινωνικών
ταξονομιών.

  Η
Βιβλιοθήκη
του
Πανεπιστήμιου
της
Πενσυλβάνιας
ανέπτυξε
το
PennTags

(tags.library.upenn.edu/),
ένα
ιστότοπο
όπου
το
προσωπικό
και
οι
φοιτητές
του

πανεπιστήμιου
μπορούν
να
κάνουν
σελιδοσήμανση
σε
ποιοτικές
ιστοσελίδες
και
αρχεία

του
OPAC
και
να
τις
μοιραστούν
μεταξύ
τους.

H
Ann
Arbor
District
Library’s
catalog
επιτρέπει
στους
χρήστες
της
να
επισημειώνουν
τα

τεκμήριά
της.


Ένα
σύννεφο
επισημειώσεων
Edmonton
Public
Library’s
subject
guide
pages
εμφανίζεται
με
το

CiteULike.


Δημόσιες
βιβλιοθήκες
στη
Γαλλία
ανάπτυξαν
λογισμικό
ανοικτού
κώδικα,
όπως
είναι
το
AFI‐
OPAC
2.02

  Στην
Ελλάδα
αναπτύχθηκε
ο
πρώτος
opac
2.0
(OPACIAL)
με
ελεύθερο
σύστημα
κοινωνικής

επισημείωσης
hžp://library.panteion.gr/opacial
με
πολυεδρική
(φασετική)
αναζήτηση
με
βάση

το
έτος
και
το
είδος
του
υλικού
και
των
θεματικών
επικεφαλίδων,
αλλά
και
με
παράλληλη

ενοποίηση
της
ψηφιακής
βιβλιοθήκης
με
βάση
τις
θεματικές
επικεφαλίδες
που
προβάλλονται


19


Εφαρμογές
σε
μουσεία,
αρχεία
κ.α.

Πολλά
μουσεία
(όπως
το
Powerhouse
Museum)
αναπτύσσουν
νέους

καταλόγους

εμπνευσμένους
από
τις
τεχνολογίες
του
Web
2.0.


Σημαντικό
πρόγραμμα
ανέπτυξε
το
Nasonal
Leadership
Grant
for
Research

από
το

U.S.
Insstute
of
Museum
and
Library
Sciences
(hžp://
www.steve.museum/)
όπου
με
έρευνες
απέδειξαν
ότι
η
χρήση


συστημάτων
κοινωνικής
επισημείωσης
αποδείχτηκαν
ιδιαίτερα
χρήσιμα

για
τα
μουσεία
και
τους
επισκέπτες
τους.


Εμπορικά
λογισμικά
όπως
το
AquaBrowser

και
το
PRIMO,
οι
νέας
γενιάς

κατάλογοι
όπως
αναφέρονται,
με
ενσωματωμένες
αρκετές
λειτουργίες

όπως
κοινωνικών
επισημειώσεων
και
κοινωνικού
σχολιασμού,
πολευδρική

φασετική
αναζήτηση.

  
LibraryThing
είναι
μια
εφαρμογή
στον
ιστό
για
την
αποθήκευση
κοινού

καταλόγου
βιβλίων
μια
εφαρμογή
συλλογικής
καταλογογράφησης
από

απομακρυσμένους
χρήστες.


20

Κοινωνικές
ταξονομίες
και
σημασιολογικός
ιστός


Ο
σημασιολογικός
ιστός
ενδιαφέρεται
για
τις
κοινωνικές
ταξονομίες
ως
ανερχόμενες

οντολογίες
και
βλέπει
τα
συστήματα
συνεργατικών
επισημειώσεων
ως

εναλλακτικούς
μηχανισμούς
για
την
δημιουργία
οντολογιών.


Αναπτύσσονται
μια
σειρά
από
μεθοδολογίες,
αλγόριθμοι

και
εφαρμογές
για
την

αξιοποίηση
των
κοινωνικών
ταξονομιών
υπέρ
του
σημασιολογικού
ιστού.

Παραδείγματα
:

  FolkRank
(αλγόριθμος
αναζήτησης
κοινωνικών
ταξονομιών
με
βάση
τη
δομή
των,

βελτιώνοντας
τα
αποτελέσματα
αναζήτησης
και
αναπτύσσοντας
συστάσεις
μέσα
σε

ένα
σύστημα
κοινωνικής
ταξονομίας)

  FolksAnnotason
είναι
μέθοδος
αυτόματης
αντιστοίχισης
επισημειώσεων
σε

αντίστοιχες
έννοιες
μιας
προκαθορισμένης
οντολογίας.

  Semansc
Halo
algorithm
βελτιώνει
την
αναζήτηση
στο
σύστημα
επισημειώσεων

με

βάση
τη
συχνότητα
των,
υπολογίζει
ομάδες

χρήσιμων
επισημειώσεων
για
να

καθοδηγήσει
την
αναζήτηση
των
χρηστών.

  TagOntology
(ένα
σύστημα
δημιουργίας
οντολογιών
από
κοινωνικές
ταξονομίες

(Gruber
2007)


21


Κοινωνικές
ταξονομίες
και
σημασιολογικός
ιστός
(2)


Εφαρμογές
και
μεθοδολογίες
σε
μηχανές
μετα‐αναζήτησης
(Vivisimo),
ή
Grokker,
και

Kartoo.

Ακόμα

στο
SemKey
system
αναπτύσσονται
εφαρμογές
όπως
TagPedia
hžp://
www.tagpedia.org
προσπαθώντας
να
εμπλουτίσουν
με

σημασιολογία
τις

επισημειώσεις
τις
συνδέουν
με
το
Worldnet
και
Wikipedia.

GroupMe!

:
μια
πλατφόρμα
που
διαχειρίζεται
μέσω
των
tags
τους
πόρους
από
το
Flickr

και
URLs
από
το
Google
σε
κοινό
χώρο



FAsTA
(FolksAnnotasons
Tool
Architecture)
ένα
εργαλείο
για
μετατροπή
των

επισημειώσεων
σε
σημασιολογικά
μεταδεδομένα.

Το
Revyu
ένας
ιστότοπος
αξιολόγησης
και
κριτικής
οτιδήποτε
πόρου
στο
διαδίκτυο.
Με

εφαμογή
αλγορίθμων
επιτρέπον
στο
χρήστη
να
αναζητούν
ανθρώπους
με
γνώση
και

εμπειρία
στο
συγκεκριμένο
θέμα.

Τέλος
ο
Mika
(2007)
παρουσιάζει
ένα
μοντέλο
οντολογίας
:
“Actor
–
Concept
–
Instance”

εξετάζοντας
το
στο
πλάισιο
ενός
κοινωνικού
δικτύου
τις
κοινωνικές
ταξονομίες.

Ο
στόχος
όμως
παραμένει
να
συνδυαστεί
η
δημοτικότητα

η
άνεση
και
η
ευκαμψία
των

κοινωνικών
ταξονομιών
με
την
σημασιολογία
και
την
ποιότητα
δομής
των
οντολογιών.


22


You might also like