You are on page 1of 64

ΤΟ ΨΗΦΙΑΚΟ ΤΑΞΙΔΙ ΤΩΝ ΔΕΔΟΜΕΝΩΝ

ΣΤΙΣ ΑΝΘΡΩΠΙΣΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ


ΚΑΙ ΣΤΙΣ ΤΕΧΝΕΣ

Αθανάσιος Καρασίμος
Δρ. Υπολογιστικής Γλωσσολογίας
akarasimos@academyofathens.gr | akarasimos@gmail.com

Απολλωνίς & DARIAH-GR / ΔΥΑΣ


Ακαδημία Αθηνών

ΔΗΜΙΟΥΡΓΙΚΑ ΑΡΧΕΙΑ
ΩΣ ΚΑΙΝΟΤΟΜΕΣ ΕΣΤΙΕΣ ΠΟΛΙΤΙΣΜΟΥ
Η φύση των (ψηφιακών) δεδομένων

Πολυθεματική και ποικιλομορφία


στις Ανθρωπιστικές Επιστήμες & Τέχνες

Δεδομένα από την ψηφιακή υποδομή του


ΔΟΜΗ DARIAH-GR/ ΔΥΑΣ και τις υπηρεσίες του
• Μητρώο Οργανισμών & Συλλογών ΔΥΑΣ
ΠΑΡΟΥΣΙΑΣΗΣ • HUMANITIES Thesaurus: μια οντολογία για τις
Ανθρωπιστικές Επιστήμες και τις Τέχνες
• Η δεκαετία του 1940: ένας μονοθεματικός ‘πόλεμος’
δεδομένων

Γλωσσικές Τεχνολογίες και Δεδομένα

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 2


ΕΙΣΑΓΩΓΗ

Τα δεδομένα Τυπικά λεξιλόγια και αυστηρές τυπολογίες (γλωσσολογία, αρχαιολογία)


από τις Τέχνες
και τις Ποικίλη ακρίβεια σε ιστορικά χωρο-χρονικά δεδομένα
Ανθρωπιστικές
Επιστήμες Καταστροφή φυσικών αντικειμένων στο παρελθόν (τέχνη, λογοτεχνία)
δείχνουν μια
μεγάλη Διαρκής κίνδυνος για τον «ψηφιακό» θάνατο
ποικιλία
τυποποίησης Περιορισμένη και στοχευμένη προσέγγιση των DH projects

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 3


ΠΟΛΥΘΕΜΑΤΙΚΗ ΚΑΙ ΠΟΙΚΙΛΟΜΟΡΦΙΑ
ΣΤΙΣ ΑΝΘΡΩΠΙΣΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΚΑΙ ΤΕΧΝΕΣ

Διαθεσιμότητα ποικίλων,
πολυθεματικών και σπάνιων
αντικειμένων/δεδομένων μέσω της Υπερπαραγωγή ψηφιακών Ανάγκη για κυρίαρχα και
ψηφιοποιήσης συλλογών και ψηφιοποιημένων συγκεκριμένα σχήματα
πολιτιστικής κληρονομιάς και δεδομένων μεταδεδομένων
ανθρωπιστικών δεδομένων.

80% των δεδομένων έχει μηδενικά ή


λανθασμένα μεταδεδομένα

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 4


ΠΟΛΥΘΕΜΑΤΙΚΗ ΚΑΙ ΠΟΙΚΙΛΟΜΟΡΦΙΑ
ΣΤΙΣ ΑΝΘΡΩΠΙΣΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ & ΣΤΙΣ ΤΕΧΝΕΣ

• Η ποικιλομορφία των Τεχνών και των Ανθρωπιστικών Επιστημών


επιτρέπει τη μελέτη της ανθρώπινης κατάστασης στο σύνολό της
• Αναδυόμενες τάσεις στα DH για σύλληψη, ανάλυση και επεξεργασία
δεδομένων μέσω του πρίσματος της πολυεπιστημονικότητας
Η οπτικοποίηση των παραπομπών σε δημοσιεύσεις του Arts and
Humanities δείχνει ένα σύνολο αλληλένδετων θεμάτων:
• διαφορετικές πτυχές της έρευνας που χτίζουν ένα σύνθετο, αλλά απλό
δίκτυο πολυεπιστημονικότητας (Richardson 2013)

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 5


ΔΕΔΟΜΕΝΑ VS. ΜΕΤΑΔΕΔΟΜΕΝΑ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 6


TI EINAI ΨΗΦΙΑΚΟ ΔΕΔΟΜΕΝΟ;

• Τα ψηφιακά δεδομένα, στη θεωρία πληροφοριών και στα συστήματα


πληροφοριών, είναι η διακριτή, ασυνεχής αναπαράσταση πληροφοριών ή
έργων. Οι αριθμοί και τα γράμματα είναι συνήθως παραστάσεις.
• Τα ψηφιακά δεδομένα μπορούν να αντιπαραβληθούν με αναλογικά σήματα που
συμπεριφέρονται με συνεχή τρόπο και με συνεχείς λειτουργίες όπως ήχους,
εικόνες και άλλες μετρήσεις.

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 7


ΨΗΦΙΑΚΟ VS. ΨΗΦΙΟΠΟΙΗΜΕΝΟ

Ψηφιακά δεδομένα: δημιουργήθηκαν εξ αρχής ψηφιακά (π.χ. ένα κείμενο


doc, μια ψηφιακή αναπαράσταση χώρου, ένα 3D έργο τέχνης, ένα
animation video κτλ) ή αποτελούν μετατροπή αναλογικού δεδομένου σε
ψηφιακό που είναι πλήρως και μηχανικώς αναγνώσιμο.
Ψηφιοποιημένα δεδομένα: δημιουργήθηκαν από την ψηφιοποίηση
αναλογικών δεδομένων χωρίς να έχει ολοκληρωθεί πλήρως όλη η
διαδικασία (π.χ. σκαναρισμένο έγγραφο και οπτικά αναγνωσμένο
(OCRed) έγγραφο).

Δεδομένα σε αδράνεια | Δεδομένα σε μεταφορά | Δεδομένα σε χρήση

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 8


ΔΕΙΓΜΑ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ Ι

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 9


ΔΕΙΓΜΑ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ ΙΙ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 10


ΔΕΙΓΜΑ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ ΙΙΙ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 11


ΜΕΤΑΔΕΔΟΜΕΝΑ

• Τα μεταδεδομένα είναι "δεδομένα που παρέχουν πληροφορίες


σχετικά με άλλα δεδομένα". Με άλλα λόγια, είναι "δεδομένα
σχετικά για δεδομένα". Υπάρχουν πολλοί διαφορετικοί τύποι
μεταδεδομένων (περιγραφικών, δομικών, διοικητικών, στατιστικών
και αναφοράς).
• H σημαντικότητα των σχημάτων μεταδεδομένων (Dublin Core,
SCOS, FOAF, DOI, OAI-PMH, etc.)
• O τεράστιος όγκος ψηφιακών δεδομένων και ο εφιάλτης της
επεξεργασίας τους
• Διαφορετικά ψηφιακά αντικείμενα, διαφορετικά μεταδεδομένα

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 12


ΨΗΦΙΑΚΑ ΔΕΔΟΜΕΝΑ ΚΑΙ ΨΗΦΙΑΚΕΣ
ΥΠΟΔΟΜΕΣ
ΣΤΗΝ ΕΛΛΑΔΑ: DARIAH-GR/ΔΥΑΣ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 13


Στο σύγχρονο περιβάλλον της αλματώδους ανάπτυξης
και της διασύνδεσης των Ανθρωπιστικών και Κοινωνικών
Επιστημών με τις Ψηφιακές Τεχνολογίες στο πλαίσιο των
Digital Humanities, η Ελλάδα συμμετέχει δυναμικά σε
μεγάλες ευρωπαϊκές ερευνητικές υποδομές, όπως είναι
• το DARIAH-EU (DARIAH-GR/ΔΥΑΣ, το ελληνικό
Ε Ι Σ Α ΓΩ Γ Η μέλος) για τις ανθρωπιστικές επιστήμες
• το CLARIN-ERIC (CLARIN_EL, το ελληνικό μέλος)
για τους γλωσσικούς πόρους και τη γλωσσική
τεχνολογία και
• το PARTHENOS-EU, μία υποδομή ομπρέλα που
ενσωματώνει πολλές επί μέρους ερευνητικές
υποδομές.

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 14


Η Εθνική Ψηφιακή Υποδομή για την Έρευνα στις Ανθρωπιστικές
Επιστήμες υλοποιείται από ένα δίκτυο ακαδημαϊκών ιδρυμάτων,
πανεπιστημίων και ερευνητικών κέντρων, το οποίο συγκροτήθηκε
προκειμένου να συμβάλλει στην ανάπτυξη της έρευνας στις
ανθρωπιστικές επιστήμες με χρήση τεχνολογιών της πληροφορίας. Η
εισαγωγή της διαχείρισης της πληροφορίας και των ψηφιακών μεθόδων
έρευνας στο πεδίο των ανθρωπιστικών επιστημών κατέστησε αναγκαία
την πρωτοβουλία αυτή, που διευκολύνει τη χρήση μεθοδολογικών και
τεχνολογικών προτύπων, βέλτιστων πρακτικών, καθώς και την
H ΥΠΟΔΟΜΗ ανταλλαγή τεχνογνωσίας και την πρόσβαση σε γνωσιακούς πόρους.
DARIAH-GR/ΔΥΑΣ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 15


Το Δίκτυο Υποδομών για την Έρευνα στις
Ανθρωπιστικές Επιστήμες ΔΥΑΣ απαρτίζεται από
τα ακόλουθα μέλη:
• Ακαδημία Αθηνών (Συντονιστής)
• Ερευνητικό Κέντρο «Αθηνά» – Μονάδα Ψηφιακής Επιμέλειας
H ΥΠΟΔΟΜΗ (ΜΟΨΕ)
D A R I A H - G R / ΔΥ • Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα
ΑΣ Ιστορίας και Αρχαιολογίας
• Ερευνητικό Πανεπιστημιακό Ινστιτούτο Συστημάτων
Επικοινωνιών και Υπολογιστών (ΕΠΙΣΕΥ) – Εθνικό Μετσόβιο
Πολυτεχνείο
• Ανωτάτη Σχολή Καλών Τεχνών
• Εργαστήριο Πληροφοριακών Συστημάτων (ΕΠΣ) – Ινστιτούτο
Πληροφορικής – Ίδρυμα Τεχνολογίας και Έρευνας

16
Εργαλεία και Μητρώα (τα εργαλεία όσο και τα μητρώα
διατίθενται σε ανοικτή πρόσβαση κι απευθύνονται σε
ερευνητές των Ανθρωπιστικών Επιστημών και των
Τεχνών καθώς και σε διαχειριστές πολιτιστικών
συλλογών (αρχειονόµους, επιµελητές µουσείων κ.ά.)

Παρατηρητήριο (παρακολούθηση των εξελίξεων στον


κλάδο των Ψηφιακών Ανθρωπιστικών Σπουδών και τη
διάχυση της γνώσης στις εντός Ελλάδος ενδιαφερόμενες H Υ Π ΟΔ Ο Μ Η
κοινότητες καθώς και για τη μεταφορά βέλτιστων D A R I A H - G R / ΔΥΑ Σ
πρακτικών)

Κοινότητα (ενίσχυση της κοινότητας των ερευνητών των


Ανθρωπιστικών Επιστημών και των Τεχνώνγύρω από
ζητήματα ψηφιακών εργαλείων και τεχνολογιών, καθώς
και γύρω από θεωρητικά και μεθοδολογικά ζητήματα
που προκύπτουν από τη χρήση τους στην έρευνα,
διδασκαλία και δημοσίευση)

17
ΔΕΔΟΜΕΝΑ ΑΠΟ ΤΗΝ ΥΠΟΔΟΜΗ DARIAH-GR:
ΕΡΓΑΛΕΙΑ ΚΑΙ ΥΠΗΡΕΣΙΕΣ

• Η πρόκληση της πολυεπιστημονικότητας και ποικιλότητας στο μητρώο


Συλλογών (Ανθρωπολογία, Εθνογραφία, Ιστορία, Αρχαιολογία, Γλωσσολογία,
Θεατρικές επιστήμες, Λογοτεχνία, Θεωρία των Επιστημών, Φιλοσογία, Τέχνες
μεταξύ άλλων)
DYAS Registries (http://registries.dyas-net.gr/en)

• Δημιουργώντας τον πρώτο διαθεματικό θησαυρό Humanities Thesaurus


DYAS HUMANITIES Thesaurus (
https://humanitiesthesaurus.academyofathens.gr/)

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 18


PA R T H E N O S - E U P R OJ E C T

Το όνομα PARTHENOS προέρχεται από τον τίτλο του έργου «Pooling


Activities, Resources and Tools for Heritage E-research Networking,
Optimization and Synergies». Το ακρωνύμιό του είναι
εμπνευσμένο από το όνομα της Αθηνάς Παρθένου, της ελληνικής
θεάς της σοφίας, της έμπνευσης και του πολιτισμού.

Το PARTHENOS στηρίζει το έργο των δύο ερευνητικών


υποδομών, του CLARIN (γλωσσικοί πόροι) και του DARIAH
(ψηφιακές ανθρωπιστικές επιστήμες), καθώς και άλλα έργα
υποδομών και ενσωμάτωσης στη σφαίρα του πολιτισμού.

19
Σκοπός της συνεργασίας των μελών του
PARTHENOS είναι:
● να δημιουργήσει κοινά πρότυπα για
διευκόλυνση της έρευνας
● να συντονίσει κοινές δράσεις μεταξύ
ερευνητικών έργων
● να εναρμονίσει τον προσδιορισμό
διαδικασιών και υλοποίησης
● να διαμοιράσει μεθόδους και υπηρεσίες PARTHENOS-
και
● να διαθέσει λύσεις σε κοινά προβλήματα
EU PROJECT

Έγγραφα, Εργαλεία και Υπηρεσίες (User


Requirements Report, Guidelines for
Common Policies Implementation,
Standardization Survival Kit, Common
Semantic Framework, Joint Resource
Registry, PARTHENOS Cloud Infrastructure,
Training Plan Toolkit, Communication,
dissemination and outreach)
20
Παρέχει ενότητες κατάρτισης
και πόρους για τις ψηφιακές
ανθρωπιστικές επιστήμες και
ερευνητικές υποδομές από το
PARTHENOS και από συναφή
έργα. H πλατφόρμα PA RT H E N O S - E U P R O J E C T:
εκπαίδευσης μπορεί να T R A I N I N G TO O L K I T
χρησιμοποιηθεί τόσο από
τους εκπαιδευόμενους όσο
και από τους εκπαιδευτές.

training.parthenos-project.eu

21
ΜΗΤΡΩΑ ΠΟΡΩΝ
Συλλογές και Οργανισμοί ΑΝΘΡΩΠΙΣΤΙΚΩΝ
ΣΠΟΥΔΩΝ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 22


Μ Η Τ Ρ Ω Α Π Ο Ρ Ω Ν Α Ν Θ Ρ Ω Π Ι Σ Τ Ι Κ Ω Ν Σ Π ΟΥΔ Ω Ν

•Το εργαλείο αυτό αναπτύχθηκε στο πλαίσιο του έργου


DARIAH-ΑΤΤΙΚΗ Ανάπτυξη της ελληνικής ερευνητικής
υποδομής για τις ανθρωπιστικές επιστήμες ΔΥΑΣ.
•Μέσω αυτού ο χρήστης ερευνητής ή μελετητής των
ανθρωπιστικών επιστημών και των τεχνών μπορεί να
αναζητήσει πληροφορίες τόσο για φορείς (οργανισμούς ή
ιδιώτες) της Ελλάδας, όσο και για τις συλλογές, φυσικές και
ψηφιακές, που κατέχουν ή διαχειρίζονται.
•Oι χρήστες του εργαλείου αξιοποιούν την προσφερόμενη
τεχνογνωσία και τους διαθέσιμους ψηφιακούς πόρους για την
αναβάθμιση της ποιότητας της έρευνάς τους ή και για
εκπαιδευτικούς σκοπούς.

23
•Οι διαχειριστές πολιτιστικών συλλογών (αρχειονόμοι,
βιβλιοθηκονόμοι, επιμελητές μουσείων) αξιοποιούν τη
συλλογική τεχνογνωσία για την ευρύτερη δυνατή κοινωνική
αξιοποίηση των ψηφιακών πόρων των ανθρωπιστικών
επιστημών και της πολιτιστικής κληρονομιάς.
ΜΗΤΡΩΑ ΠΟΡΩΝ
•Το περιεχόμενο του ψηφιακού εργαλείου εμπλουτίζεται και
ΑΝΘΡΩΠΙΣΤΙΚΩΝ επικαιροποιείται συνεχώς με στόχο τη διάδοση του ελληνικού
Σ Π ΟΥΔ Ω Ν αναλογικού και ψηφιακού περιεχομένου και την πρόσβαση σε
επιστημονικό περιεχόμενο. Γι’ αυτό και η συμβολή των
χρηστών είναι απαραίτητη.
•Το έργο κατέστη εφικτό χάρη και στην πολύτιμη συνδρομή
των υπευθύνων των φορέων στους οποίους απευθύνθηκε το
ΔΥΑΣ.

24
ΜΗΤΡΩΟ ΣΥΛΛΟΓΩΝ

•Behind-the-scenes προβολή
• Τίτλος,
• Φορέας,
• Περιγραφή,
• Γλώσσα,
• Τύπος Αντικειμένων,
• Είδος,
• Μεταδεδομένα,
• Γεωγραφική και Χρονική κάλυψη, κτλ.

25
ΜΗΤΡΩΟ ΣΥΛΛΟΓΩΝ

26
ΜΗΤΡΩΟ ΣΥΛΛΟΓΩΝ:
ΛΟΙΠΕΣ ΚΑΡΤΕΛΕΣ

27
ΑΝΑΠΤΥΞΗ ΘΗΣΑΥΡΩΝ
ΟΡΩΝ ΤΩΝ
ΑΝΘΡΩΠΙΣΤΙΚΩΝ
ΕΠΙΣΤΗΜΩΝ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 28


Επιστημολογική μέθοδος οργάνωσης της γνώσης σύμφωνα με τις αρχές που διέπουν την έρευνα:
Αντικειμενικότητα, διεπιστημονικότητα, διαφάνεια.

Στόχοι:

• Αναζήτηση όρων απαραίτητων για απαντήσεις σε ερευνητικά ερωτήματα

• Αποφυγή υποκειμενικής σημασιολογικής οργάνωσης των όρων

• Απρόσκοπτη πρόσβαση στην πληροφορία που είναι απαραίτητη για την έρευνα

• Οργάνωση των όρων σε ένα κοινό πλαίσιο και ένα κατανεμημένο, συνεργατικό

ΘΗΣΑΥΡΟΙ: •
περιβάλλον

Αποφυγή λογικών σφαλμάτων και ιδιοσυγκρασιακών αποφάσεων.

ΕΙΣΑΓΩΓΗ

29
Mεταθησαυρός (backbone thesaurus) -ένας
πρωταρχικός θησαυρός υπερκείμενων εννοιών και
ιεραρχιών.

Βασικοί στόχοι:
• Δημιουργία ενός διεπιστημονικού και
Θ Η Σ ΑΥ Ρ Ο Ι : πολύγλωσσου θησαυρού όρων για τις
BACKBONE ανθρωπιστικές επιστήμες.
THESAURUS • Διαλειτουργικότητα με ήδη υπάρχοντες
θησαυρούς και οντολογίες, καθώς ο BBT
παρέχει ένα σχήμα υπερκείμενων
θεμάτων (facets) και ιεραρχιών, κάτω
από τα οποία μπορούν να «υπαχθούν»
όλα τα λεξιλόγια και θησαυροί που
έχουν αναπτυχθεί σε επιμέρους
γνωστικά πεδία των ανθρωπιστικών
επιστημών.

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 30


ΘΗΣΑΥΡΟΙ: BACKBONE THESAURUS

Θεματική ταξινόμηση (facets)


Βασικές
μεθοδολογικές Κατηγορηματική σημασιολογία (Σχέση IsA για τη δόμηση μιας ιεραρχίας)
αρχές:
Μέθοδος από κάτω προς τα πάνω (bottom-up)

Μικρός αριθμός εννοιών

Υπερκείμενες έννοιες ορισμένες ανεξαρτήτως περιβάλλοντος χρήσης τους

Αρχή των intensional properties (των αναγκαίων και επαρκών συνθηκών για την υπαγωγή μιας έννοιας σε μία
κατηγορία).

31
Θ Ε Μ ΑΤΑ Κ Α Ι
Ι Ε ΡΑ Ρ Χ Ι Ε Σ

32
THESAURUS BACKBONE
33
Ένα διαδυκτιακό
σύστημα
ανοικτού κώδικα Την επεξεργασία και διαχείριση
που
δημιουργήθηκε σημασιολογικών σχέσεων των
από το ΙΤΕ για να
εξυπηρετήσει τη όρων των θησαυρών
διαχείριση
πολύγλωσσων
θησαυρών όρων
με κύρια Τη δυνατότητα εύκολης
χαρακτηριστικά:
πλοήγησης ανάμεσα σε
διασυνδεδεμένους όρους THESAURUS
MANAGEMENT
Τις εκτεταμένες δυνατότητες SYSTEM (THEMAS)
αναζήτησης

Τη δυνατότητα πολλαπλής
παρουσίασης των όρων και του
περιβάλλοντος τους

34
THEMAS:
ΠΑΡΑΔΕΙΓΜΑ

• Κατηγορία: Υλικά Αντικείμενα


• Ιεραρχία: Φορητά
αντικείμενα
• Όρος
• Ορισμός, Σημείωση
• Όρος Κορυφής
• Ευρύτερος Όρος
• Σχετιζόμενος Όρος
• Πηγή

35
ΘΗΣΑΥΡ ΟΙ : ΚΑΤΗ ΓΟΡ Ι Α ΥΛΙ ΚΩΝ Α Ν ΤΙ ΚΕΙ Μ ΕΝ ΩΝ

36
Θ Η Σ ΑΥ Ρ Ο Ι :
ΚΛΗΡΟΝΟΜΙΑ
Ι Δ Ι ΟΤ Η ΤΩ Ν

37
WHAT COMES NEXT?

ΑΠΟΛΛΩΝΙΣ Εθνική Υποδομή για τις Ψηφιακές


Ανθρωπιστικές Τέχνες και Επιστήμες και για τη
Γλωσσική Έρευνα και Καινοτομία
•Οι ερευνητικές υποδομές της γλωσσικής
τεχνολογίας και των ψηφιακών ανθρωπιστικών
σπουδών ενώνουν τους πόρους, τα εργαλεία και
την τεχνογνωσία τους.

38
ΔΕΔΟΜΕΝΑ ΚΑΙ
ΠΟΛΥΕΠΙΣΤΗΜΟΝΙΚΟΤΗΤΑ ΣΤΙΣ
ΑΝΘΡΩΠΙΣΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ & ΤΕΧΝΕΣ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 39


Κοινωνική χρήση ψηφιακών πόρων στις ανθρωπιστικές και
πολιτιστική κληρονομιά

Συνεχής εμπλουτισμός δεδομένων μητρώου για την ενίσχυση


της προβολής του ελληνικού φυσικού και ψηφιακού
περιεχομένου

D ATA F RO M D A RI A H -
GR Η συμβολή των κατόχων συλλογής είναι απαραίτητη
I N F RA S T RU CTU R E :
D YA S REG I S T RI E S I I
Η ποσότητα των δεδομένων, η ποικιλία των επιστημονικών
κλάδων και οι τύποι συλλογών απαιτούν ένα επεξεργασμένο
σχήμα μεταδεδομένων για την προσαρμογή της περιγραφής

Το σχήμα μεταδεδομένων επιτρέπει τη συλλογή και τη


συγκέντρωση των μεταδεδομένων σε άλλο σχήμα

Τετ 10/6/2020 CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος 40


ΔΕΔΟΜΕΝΑ ΑΠΟ
DARIAH-GR
INFRASTRUCTURE:
D YA S R E G I S T R I E S I I I

Το κυνήγι μεταδεδομένων οδήγησαν


συχνά τους οργανισμούς και τους
συλλέκτες να επανεκτιμήσουν τη μέθοδο
τεκμηρίωσής τους υπό το φως της
αλληλεπίδρασης με την υποδομή.
Οι ερευνητές έχουν πρόσβαση σε
πληροφορίες σχετικά με την έρευνά τους
σε πολλούς τύπους συλλογών, που
ποικίλλουν σχετικά με διαφορετικούς
κλάδους επιστημών (συλλογές μουσείων,
συλλογές κοστουμιών, ταχυδρομικές
κάρτες, χάρτες κ.λπ.) σε συλλογές
ψηφιοποιημένων κειμένων (συλλογές
βιβλίων, χειρογράφων, εγχειριδίων) ,
αλληλογραφία, γραπτά και προφορικά
δεδομένα κ.λπ.)
CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 41
• Φυσικές συλλογές χωρίς
μεταδεδομένα ή περιγραφικές
πληροφορίες
• Φυσικές συλλογές με ασυνεπή
μεταδεδομένα
• Ψηφιακές συλλογές χωρίς
μεταδεδομένα
• Ψηφιακές συλλογές με μη τυπικά / ΤΟ ΤΑ ΞΙ ΔΙ ΤΩ Ν
προσαρμοσμένα μεταδεδομένα ΔΕ ΔΟ ΜΕ Ν Ω Ν :
• Ψηφιακές συλλογές με ένα ευρέως
ΟΙ ΠΡΟΚΛΗΣΕΙΣ
αποδεκτό σχήμα μεταδεδομένων

• Ενσωμάτωση πληροφοριών σε μια


συνεκτική βάση γνώσεων για την
κάλυψη των αναγκών διαφορετικών
οργανισμών και την περιγραφή
διαφορετικών συλλογών.
Τετ 10/6/2020 CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος 42
ΤΟ ΤΑΞΙΔΙ ΤΩΝ ΔΕΔΟΜΕΝΩΝ:
ΟΙ ΠΡΟΚΛΗΣΕΙΣ

• Πρόκληση: να συμφωνήσουμε σε ένα κοινό, συνεκτικό «σκελετό»


Θησαυρού ανώτατου επιπέδου που περιέχει έναν περιορισμένο αριθμό
εννοιών από τις οποίες όλα τα θεματικά λεξιλόγια και ορολογίες θα
κληρονομήσουν τα χαρακτηριστικά τους
• Η μεθοδολογία αυτού του διεπιστημονικού Backbone Thesaurus ήταν μια
διαδικασία από τη κάτω-προς-τα-πάνω
• Έννοιες ανώτερου επιπέδου αναπτύχθηκαν με επαρκή αφαιρετική σκέψη από
υπάρχουσες ορολογίες, ικανοποιώντας τις απαιτήσεις για διαθεματική και
διεπιστημονική εγκυρότητα

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 43


ΤΟ ΤΑΞΙΔΙ ΤΩΝ ΔΕΔΟΜΕΝΩΝ:
ΟΙ ΠΡΟΚΛΗΣΕΙΣ

• Οι όροι που χρησιμοποιούνται στο μητρώο συλλογών


DYAS διαμορφώνονται με δομημένο τρόπο σύμφωνα με
τις έννοιες ανώτερου επιπέδου του Backbone Thesaurus.
• Σχετικοί όροι μεταξύ διαφορετικών επιστημονικών
κλάδων: η πρόκληση για την οικοδόμηση ενός θησαυρού
σε διάφορους κλάδους
• Από τις κλασικές σπουδές έως γλωσσικές σπουδές, από
αρχαιολογία έως τη μελέτη της ιστορίας, από θεατρικές
σπουδές και τις καλλιτεχνικές αναπαραστάσεις έως τις
μελέτες λαογραφίας και πολιτιστικής κληρονομιάς.

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 44


Ανάπτυξη ψηφιακής πλατφόρμας για την ενσωμάτωση
μεταδεδομένων που σχετίζονται με ψηφιοποιημένα
έγγραφα, φωτογραφίες, αντικείμενα και κινούμενες
εικόνες από τη δεκαετία του 1940 στην Ελλάδα.
H ΘΕΜΑΤΙΚΗ ΤΟΥ
‘40:
ΕΝΑΣ «ΠΟΛΕΜΟΣ»
ΔΕΔΟΜΕΝΩΝ Αυτή η διαλειτουργική πλατφόρμα θα επιτρέψει στο
κοινό, την εκπαιδευτική κοινότητα και τους ερευνητές
να βρουν, να αποκτήσουν πρόσβαση και να
επαναχρησιμοποιήσουν αποτελεσματικά τα σχετικά
δεδομένα, καθώς και να ανακαλύψουν τις υποκείμενες
συνδέσεις μεταξύ τους.

Τετ 10/6/2020 CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος 45


H ΘΕΜΑΤΙΚΗ ΤΟΥ ‘40:
ΕΝΑΣ «ΠΟΛΕΜΟΣ» ΔΕΔΟΜΕΝΩΝ
Συνεργαζόμενα ιδρύματα
Αρχείο Σύγχρονης Κοινωνικής Ιστορίας (ASKI)
Βιβλιοθήκη του Βουλής
Αρχείο Ελληνικής Ραδιοτηλεοπτικής Εταιρείας (ΕΡΤ)
Διεύθυνση Ιστορίας Στρατού
Ιστορικό Αρχείο Πανεπιστημίου Αθηνών
Σχολή Καλών Τεχνών Αθηνών
Εβραϊκό Μουσείο Ελλάδας
Ακαδημία Αθηνών

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 46


THE 1940S:
A MONOTHEMATIC
‘WAR OF DATA’

• Ο χειρισμός δεδομένων ανθρωπιστικών


επιστημών και τεχνών δεν είναι απλός στόχος,
ακόμη και στο πλαίσιο μιας επιστήμης.
• Σημαντικά ζητήματα προκύπτουν σχετικά με την
ποικιλομορφία των σχετικών πηγών, τα ιδρύματα
που τα ψηφιοποιούν και τα συντηρούν, καθώς
και τις απαιτήσεις των χρηστών.
• Η ενσωμάτωση δεδομένων σε μεγάλες ομάδες
δημιουργεί απαίτηση για διαλειτουργικότητα
• Στόχοι: επινόηση μιας «ομπρέλας μετα-
μεταδεδομένων» που μπορεί να γεφυρώσει τα
ποικίλα συγκεκριμένα μεταδεδομένα που
δημιουργήθηκαν από τον εκάστοτε οργανισμό.
CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 47
ΓΛΩΣΣΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
ΚΑΙ ΔΕΔΟΜΕΝΑ

Η Υπολογιστική Γλωσσολογία στην υπηρεσία των


Ανθρωπιστικών Επιστημών και Τεχνών

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 48


CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 49
CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 50
Η ‘ΒΑΡΚΑ’
ΤΗΣ ΥΠΟΛΟΓΙΣΤΙΚΗΣ ΓΛΩΣΣΟΛΟΓΙΑΣ

Περιοχές της Υπολογιστικής Γλωσσολογίας


• Αναγνώριση ομιλίας/ ομιλητή (Speech/ Speaker Analysis)
• Σύνθεση ομιλίας (Speech Synthesis)
• Μορφολογική/ Συντακτική/ Σημασιολογική αναγνώριση (taggers)
• Παραγωγή Φυσικής Γλώσσας (Natural Language Generation)
• Μηχανική Μετάφραση (Machine Translation)

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 51


ΑΠΟ ΤΑ ΔΕΔΟΜΕΝΑ ΣΤΗΝ ΑΝΑΛΥΣΗ

• Όλα τα δεδομένα και οι ψηφιοποιημένες πηγές για την (ελληνική) γλώσσα δεν
μπορούν να προσφέρουν σημαντικά στην ανάλυση αν δεν υπάρχουν και οι
κατάλληλες εφαρμογές.
• Χρειαζόμαστε ένα διεπιστημονικό τομέα που εξετάζει και αναλύει τη γλώσσα
χρησιμοποιώντας στατιστικά ή κανονο-κεντρικά μοντέλα φυσικής γλώσσας
από υπολογιστικής σκοπιάς.
• Οι εφαρμογές του;

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 52


ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΤΗΝ
ΚΑΘΗΜΕΡΙΝΟΤΗΤΑ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 53


ΓΛΩΣΣΙΚΗ
ΤΕΧΝΟΛΟΓΙΑ ΣΤΗΝ
ΚΑΘΗΜΕΡΙΝΟΤΗΤΑ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 54


ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ
ΣΤΗΝ
ΚΑΘΗΜΕΡΙΝΟΤΗΤΑ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 55


ΓΛ Ω Σ Σ Ι Κ Η
Τ Ε Χ Ν ΟΛΟ Γ Ι Α
ΣΤΗΝ
Κ ΑΘ Η Μ Ε Ρ Ι Ν Ο Τ
Η ΤΑ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 56


ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ
ΣΤΗΝ
ΚΑΘΗΜΕΡΙΝΟΤΗΤΑ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 57


ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΤΗΝ
ΚΑΘΗΜΕΡΙΝΟΤΗΤΑ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 58


ΥΠΟΛΟΓΙΣΤΙΚΗ ΥΦΟΛΟΓΙΑ

• Η υπολογιστική υφολογία είναι ένας διεπιστημονικός κλάδος που


διερευνά τον τρόπο γραφής των κειμένων και το πώς αυτός συνδέεται με
την ταυτότητα του συγγραφέα τους ή και άλλα χαρακτηριστικά του όπως
το φύλο, η ηλικία, τα ψυχολογικά χαρακτηριστικά.
• Η ποσοτική περιγραφή των γλωσσικών χαρακτηριστικών ενός κειμένου.
Ή αλλιώς η στατιστική ανάλυση του κειμενικού ύφους.
• Τα γλωσσικά χαρακτηριστικά ενός κειμένου διακρίνονται σε συνειδητές
επιλογές του συγγραφέα (λέξεις, σύνταξη κ.ά.) και μη συνειδητά
χαρακτηριστικά (μήκος λέξεων, συχνότητες γραμμάτων, συχνότητες
λέξεων κ.ά.)
• Για να αποδοθεί υφομετρικά ένα κομμάτι κειμένου σε έναν συγγραφέα
θα πρέπει να μελετηθεί το «πώς γράφει» και όχι το «τι γράφει».

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 59


ΑΝΆΛΥΣΗ ΚΕΙΜΈΝΩΝ: ΑΝΆΚΤΗΣΗ
ΠΛΗΡΟΦΟΡΊΑΣ

Σεισμική δόνηση, μεγέθους 3,7 βαθμών της κλίμακας • Τύπος καταστροφής: σεισμός
Ρίχτερ (σύμφωνα με την αυτόματη λύση του EMSC και • τοποθεσία: Κρήτη
του Γεωδυναμικού Ινστιτούτου Αθηνών),σημειώθηκε • ημερομηνία: 14/3/2015
χτες 14/3/2015. Το ακριβές επίκεντρο της δόνησης • μέγεθος: 3,7
εντοπίζεται 93χλμ. νοτιοανατολικά του Αγίου Νικολάου
• επίκεντρο: 93χλμ. νοτιοανατολικά του Αγίου Νικολάου Κρήτης και 128χλμ.
Κρήτης και 128χλμ. νοτιοδυτικά της Καρπάθου. Το νοτιοδυτικά της Καρπάθου.
εστιακό βάθος του σεισμού υπολογίζεται στα 5χλμ. Ο • Πηγή: EMSC και Γεωδυναμικό Ινστιτούτο Αθηνών
σεισμός, όπως τον κατέγραψε ο σεισμογράφος του
• ζημιές:
Σεισμολογικού Δικτύου του Γεωδυναμικού Ινστιτούτου
του Εθνικού Αστεροσκοπείου Αθηνών, που είναι • ανθρώπινες:
τοποθετημένος στην Ζάκρο του νομού Λασιθίου. • victim: -
Καταγράφηκαν μόνο μερικές καταστροφές σε παλιά • number: -
σπίτια σε χωριά του νομού Λασιθίου. • outcome: -
• υλικές:
• object: χωριά του νομού Λασιθίου
• outcome: ζημιές
CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 60
ΑΝΆΛΥΣΗ ΚΕΙΜΈΝΩΝ:
ΚΑΤΗΓΟΡΙΟΠΟΊΗΣΗ ΚΕΙΜΈΝΩΝ

υγεία • διατροφή
• ασθένειες

• Ανθρωπιστικές
επιστήμες
επιστήμες • Κοινωνικές
επιστήμες
• Τέχνες

• ποδόσφαιρο
αθλητισμός
• μπάσκετ
CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 61
ΑΝΆΛΥΣΗ ΚΕΙΜΈΝΩΝ:
ΚΑΤΗΓΟΡΙΟΠΟΊΗΣΗ ΚΕΙΜΈΝΩΝ

• Ροή νέων και ειδήσεων


• Κατηγοριοποίηση των εισερχόμενων ειδήσεων, νέων και ιστοριών
• Ερωτήματα στις μηχανές αναζήτησης
• Google: αναζήτηση «συγγραφέας των Μεταφυσικών»
• Εντοπισμός των spam emails
• http://www.paulgraham.com/spam.html
• Κατεύθυνση των emails στα κατάλληλα άτομα και ομάδες

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 62


REFERENCES

• Doerr, M., Daskalaki, M., Bekiari, Ch. (2014). Thesaurus Building. DYAS, FORTH. Retrieved from
https://www.backbonethesaurus.eu/sites/default/files/ppt_thesuarus%20building.pdf
• Doerr, M., Katsiadakis, H., Daskalaki, M., Goulis, H. (2015). Backbone thesaurus: Methodological outlines. DYAS, Academy of Athens &
FORTH. Retrieved from https://www.backbonethesaurus.eu/sites/default/files/ppt_methodoligical%20outlines.pdf
• Karasimos, Α., Goulis, H., Kalafata, P., Lipke, A., Papadakis, N., Mergoupi-Savaidou, E., Tzedopoulos, Y., Falierou, A., Chrysovitsanos, G.,
Vernardaki, E., Spiliotopoulou, M. & H. Katsiadakis (in press). From DARIAH-GR/DYAS to PARTHENOS-EU Project: the digital
infrastructures, the Collections Registries and the Thesauri in Humanities (in Greek). In Proceedings for Digital Humanities in Greece:
issues and challenges. Athens: Research for the Humanities (RCH).
• Richardson, M. (2013). Mapping the Multidisciplinarity of the Arts & Humanities. Research Trends 32.Elsevier Publications. Retrieved
from https://www.researchtrends.com/issue-32-march-2013/mapping-the-multidisciplinarity-of-the-arts-humanities-2/ .
• Wineburg, Samuel (1991). On the Reading of Historical Texts: Note on the Breach Between School and Academy. American Educational
Research Journal 28 (1991), pp. 495-519. Retrieved from
https://pdfs.semanticscholar.org/6499/13b351565c07d5d53f852b954eac09a1b0da.pdf?_ga=2.124481870.511527096.1552041570-1746336
02.1550749431

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 63


ΣΑΣ ΕΥΧΑΡΙΣΤΩ
ΓΙΑ ΤΗΝ ΠΡΟΣΟΧΗ ΣΑΣ

CREARCH | Δημιουργικά αρχεία ως καινοτόμες εστίες πολιτισμού | Α. Καρασίμος Τετ 10/6/2020 64

You might also like