PLan-V Presentation Imerida Patra 27 May

1
Γλωσσικές τεχνολογίες
για την υποστήριξη ατόμων
με διαταραχές επικοινωνίας
Πέπη Σταμούλη
Συνεργαζόμενη ερευνήτρια
Ινστιτούτο Επεξεργασίας του Λόγου - ΙΕΛ
2
Γλωσσικές τεχνολογίες
Οι γλωσσικές τεχνολογίες περιλαμβάνουν ένα ευρύ φάσμα

εφαρμογών και εργαλείων που έχουν σχεδιαστεί για να αναλύουν, να
κατανοούν, να παράγουν ή να επεξεργάζονται την ανθρώπινη γλώσσα.
Η επεξεργασία και ερμηνεία της προφορικής ή γραπτής γλώσσας
αποτελεί ένα διεπιστημονικό πεδίο, στο οποίο συμμετέχουν
επιστημονικές περιοχές, όπως η γλωσσολογία, η επιστήμη των
υπολογιστών και η τεχνητή νοημοσύνη.
3
Επεξεργασία Φυσικής Γλώσσας

(Natural Language Processing-NLP)
Η ΕΦΓ εστιάζει στην αλληλεπίδραση μεταξύ του

υπολογιστή και της γραπτής ανθρώπινης γλώσσας.
Περιλαμβάνει τη συντακτική και μορφολογική
ανάλυση κειμένου, την κατανόηση φυσικής γλώσσας,
την ανάλυση συναισθήματος κ.ά.
4
Αυτόματη Αναγνώριση Ομιλίας

(Automatic Speech Recognition - ASR)
Η τεχνολογία αυτόματης αναγνώρισης ομιλίας

επιτρέπει στους υπολογιστές να μετατρέπουν
προφορικές λέξεις σε γραπτό κείμενο.
5
Μετατροπή κειμένου σε ομιλία

(Text-to-Speech - TTS)
Tα συστήματα TTS μετατρέπουν το γραπτό κείμενο σε

προφορικές λέξεις, επιτρέποντας στους υπολογιστές
να παράγουν συνθετική ομιλία.
6
Βασικές εφαρμογές
Αυτόματη μετάφραση
Διαλογικά συστήματα και ψηφιακοί βοηθοί, ικανοί να κατανοήσουν και να
αποκριθούν σε ερωτήσεις, γραπτά ή προφορικά
Φωνητικοί βοηθοί, φωνητικός χειρισμός συσκευών
Ανάκτηση ακριβούς και σχετικής πληροφορίας (μηχανές αναζήτησης)
Αυτόματη ταξινόμηση κειμένων (π.χ. ανίχνευση ανεπιθύμητης αλληλογραφίας,
αναγνώριση συγγραφέα, ανίχνευση θετικής ή αρνητικής γνώμης για πρόσωπα
και διάφορα θέματα στα κοινωνικά δίκτυα κ.λπ.)
Παραγωγή φυσικής γλώσσας (natural language generation), π.χ. ChatGPT
7
Πεδία εφαρμογής
Οι γλωσσικές τεχνολογίες έχουν πολλές πρακτικές

εφαρμογές σε διάφορους τομείς, όπως η υγεία, η
εκπαίδευση, η υποστήριξη πελατών, η δημιουργική
βιομηχανία, το μάρκετινγκ και η επικοινωνία κ.λπ.
8
Γλωσσικές τεχνολογίες στη

λογοπαθολογία
Οι γλωσσικές τεχνολογίες, όπως οι τεχνολογίες φωνής και επεξεργασίας
φυσικής γλώσσας, αποτελούν πολύτιμα εργαλεία για την αξιολόγηση και
την αποκατάσταση ατόμων με διαταραχές επικοινωνίας.
Χρησιμοποιούνται για:
την πρώιμη ανίχνευση γλωσσικών ελλειμάτων,
την εξατομικευμένη παρέμβαση,
την παρακολούθηση της πορείας της παρέμβασης.
9
Εφαρμογές των γλωσσικών

τεχνολογιών στη λογοπαθολογία
Αυτόματη αξιολόγηση βαρύτητας και τύπου αφασίας

Αυτόματη ταξινόμηση τύπων πρωτοπαθούς προϊούσας αφασίας (Primary Progressive
Aphasia – PPA)
Πρώιμη διάγνωση νόσου Alzheimer
Πλεονεκτήματα:
Ασθενείς: Έγκαιρη ανίχνευση τύπου και βαρύτητας γλωσσικών ελλειμάτων
Λογοθεραπευτές: Εξοικονόμηση πολύτιμου χρόνου, καθώς η διαδικασία αρχικής αξιολόγησης
και επαναξιολόγησης με σταθμισμένα πρωτόκολλα είναι εξαιρετικά χρονοβόρα και επίπονη.
10
Ινστιτούτο Επεξεργασίας του

Λόγου (ΙΕΛ)
Ταυτότητα:
Το ΙΕΛ ιδρύθηκε το 1991, με έδρα την Αθήνα ως ανεξάρτητο Ινστιτούτο. Υπάγεται στο
Ερευνητικό Κέντρο «Αθηνά» και διατηρεί εγκαταστάσεις στην Αθήνα και στην Ξάνθη.
Αποστολή του ΙΕΛ είναι η ανάπτυξη και η προώθηση της έρευνας και της τεχνολογικής
καινοτομίας στο πεδίο της Γλωσσικής Τεχνολογίας.
Το ΙΕΛ δραστηριοποιείται στους εξής κύριους τομείς:
Επεξεργασία φυσικής γλώσσας
Επεξεργασία, σύνθεση και αναγνώριση φωνής
Επεξεργασία ενσώματης γλώσσας
Τεχνολογίες μάθησης
Γλωσσικοί πόροι και υποδομές
11
Οι γλωσσικές τεχνολογίες
στην πλατφόρμα PLan-V
Η συμβολή του ΙΕΛ:
Ανάπτυξη συστήματος για την αυτόματη αξιολόγηση της βαρύτητας του
γλωσσικού ελλείμματος
Έμφαση στην αφασία, ως έναν από τους πιο σύνθετους τύπους διαταραχών λόγου και ομιλίας,
καθώς επηρεάζει τόσο την κατανόηση όσο και την παραγωγή σε διαφορετικούς τομείς
Ανάπτυξη συστήματος αυτόματης αξιολόγησης της παραγωγής λόγου σε

ασκήσεις κατονομασίας
Ανάπτυξη συστήματος οπτικοακουστικής σύνθεσης για την αναπαραγωγή
ομιλούσας φιγούρας εικονικού βοηθού
12
Οι γλωσσικές τεχνολογίες
στην πλατφόρμα PLan-V: Οφέλη
Λογοθεραπευτής
Αρχική αυτόματη αξιολόγηση της βαρύτητας της διαταραχής και των επιμέρους χαρακτηριστικών
του αυθόρμητου λόγου - baseline για την παρακολούθηση της πορείας της παρέμβασης.
Δεν απαιτείται η συμμετοχή του στη βαθμολόγηση ασκήσεων παραγωγής, ωστόσο έχει τη
δυνατότητα να ελέγξει και να διορθώσει το αποτέλεσμα της αυτόματης βαθμολόγησης.
Ασθενής
Αυτόματη ανατροφοδότηση σε ασκήσεις όχι μόνο κατανόησης αλλά και παραγωγής λόγου
Φιλική, οικεία διεπαφή, ενισχύεται η εμπλοκή του στην εκτέλεση των ασκήσεων, καλύτερη
κατανόηση των οδηγιών, διευκολύνεται η προσβασιμότητα στο περιεχόμενο
13
Συλλογή και επεξεργασία δεδομένων για την ανάπτυξη

συστήματος αυτόματης αξιολόγησης βαρύτητας αφασίας
Επιλογή ασθενών Συλλογή δεδομένων

δια ζώσης ή εξ αποστάσεως μέσω
διαδικτυακής εφαρμογής
01 02 03 04
Αξιολόγηση ασθενών Μεταγραφή δεδομένων

για τύπο και βαρύτητα αφασίας
14
Επιλογή και αξιολόγηση

ασθενών
Animus & ΤΛΘ: Συλλογή δεδομένων προφορικού αφηγηματικού λόγου από άτομα με
αφασία διαφορετικών τύπων και βαθμών βαρύτητας και από τυπικούς ενήλικες
Αξιολόγηση με το πρωτόκολλο Boston Diagnostic Aphasia Examination (BDAE),
σταθμισμένο στα Ελληνικά
Ενσωμάτωση δοκιμασιών από το Western Aphasia Batery (WAB) και προσαρμογή
δοκιμασιών BDAE, ώστε να μπορεί να εξαχθεί ο δείκτης βαρύτητας αφασίας (Aquasia
Quotient-AQ score)
Σε κάθε συμμετέχοντα αποδίδεται μια «ετικέτα» βαρύτητας: ήπια, μέτρια, σοβαρή, πολύ
σοβαρή.
15
Συλλογή δεδομένων προφορικού

λόγου
Πρωτότυπη διαδικτυακή εφαρμογή για τη διευκόλυνση της
συλλογής δεδομένων σε συνθήκες τόσο δια ζώσης όσο και εξ
αποστάσεως.
Ενσωματώνει πρωτόκολλο 7 δοκιμασιών εκμαίευσης
αφηγηματικού λόγου (4/7 δοκιμασίες υιοθετήθηκαν από το
πρωτόκολλο AphasiaBank και 3/7 από το αφηγηματικό
πρωτόκολλο των Varlokosta et al., 2016).
Οι οδηγίες για την εκτέλεση των δοκιμασιών και η ηχογράφηση
πραγματοποιείται εντός του περιβάλλοντος της εφαρμογής.
16
Διαδικτυακή εφαρμογή:
Δοκιμασίες
Ιστορία του εγκεφαλικού (stroke story)
Η άρνηση της Ομπρέλας (“Refused umbrella”):
Παραγωγή ιστορίας με βάση σειρά 6 εικόνων
Η διάσωση της Γάτας (“Cat rescue”): Παραγωγή ιστορίας
με βάση μία εικόνα
Το Πάρτι: Παραγωγή ιστορίας με βάση σειρά 6 εικόνων
Το Δαχτυλίδι: Επαναφήγηση πρωτότυπης
ηχογραφημένης ιστορίας με υποστήριξη 5 εικόνων
Ο Λαγός και η Χελώνα: Επαναφήγηση γνωστής
ηχογραφημένης ιστορίας, χωρίς οπτική υποστήριξη
Σταχτοπούτα: Αφήγηση του γνωστού παραμυθιού
17
Διαδικτυακή εφαρμογή: Μέθοδοι

εκμαίευσης αφηγηματικού λόγου
Τέσσερις μέθοδοι εκμαίευσης:
Ελεύθερη παραγωγή προσωπικής αφήγησης
(personal narrative)
Παραγωγή ιστορίας με ερέθισμα μία εικόνα ή
σειρά εικόνων (picture-elicited narrative),
Αφήγηση παραμυθιού (storytelling)
Επαναφήγηση ιστορίας (story retelling)
18
Διαδικτυακή εφαρμογή:
Τεχνικά χαρακτηριστικά
Απαιτεί σύνδεση στο internet
Ενσωματώνει όλες τις οδηγίες σε γραπτή και
προφορική μορφή
Ενσωματωμένη δυνατότητα ηχογράφησης
Εξαιρετική ποιότητα ήχου, ανεξάρτητη από την
ταχύτητα του δικτύου
Αποθήκευση δεδομένων ανά ασθενή, δοκιμασία
και συνεδρία, σε ασφαλή βάση
Εύκολη πρόσβαση στα δεδομένα
19
Αξιολόγηση της μεθόδου

συλλογής δεδομένων
Πραγματοποιήθηκε συλλογή δεδομένων από 10 τυπικούς
συμμετέχοντες σε δύο συνθήκες, δια ζώσης και εξ αποστάσεως.
Οι προφορικές αφηγήσεις αναλύθηκαν ως προς δέκα γλωσσικά
χαρακτηριστικά, για να διαπιστωθεί αν η συνθήκη χορήγησης
επηρεάζει τη γλωσσική παραγωγή.
Δεν διαπιστώθηκαν σημαντικές διαφορές για 66/70 στατιστικά
τεστ που πραγματοποιήθηκαν.
Η μέθοδος συλλογής δεδομένων και τα αποτελέσματα της
αξιολόγησής της δημοσιεύτηκαν στο περιοδικό Frontiers in
Communication (https://doi.org/10.3389/fcomm.2023.919617).
20
Μεταγραφή και διάθεση

δεδομένων
Πραγματοποιήθηκε μεταγραφή και επισημείωση, που
ακολούθησαν τις συμβάσεις του προγράμματος CHAT του
AphasiaBank.
Στις μεταγραφές έχει γίνει κατάτμηση σε εκφωνήματα και
στοίχιση των εκφωνημάτων με το ηχητικό αρχείο.
Τα δεδομένα (μεταγεγραμμένο κείμενο και δείγματα
προφορικού λόγου) διατίθενται στο αποθετήριο
AphasiaBank (AphasiaBank Protocol Greek PLan-V).
21
Επεξεργασία και ανάλυση

δεδομένων
Στα μεταγεγραμμένα κείμενα πραγματοποιήθηκε
επεξεργασία με εργαλεία ΕΦΓ για τα Ελληνικά
(κατάτμηση σε λέξεις, λημματοποίηση, επισημείωση
μερών του λόγου, συντακτική ανάλυση) για τον
υπολογισμό γλωσσικών χαρακτηριστικών, που
αντιπροσωπεύουν τις γλωσσικές ικανότητες των
ασθενών.
Το συγκεκριμένο σύνολο δεδομένων αποτέλεσε το
dataset αξιολόγησης του συστήματος που αναπτύχθηκε
για την αυτόματη αξιολόγηση της βαρύτητας αφασίας.
22
Σύστημα αυτόματης αξιολόγησης

βαρύτητας αφασίας
Σύστημα μηχανικής μάθησης που έχει εκπαιδευτεί για να μπορεί να
προβλέπει την κατηγορία βαρύτητας στην οποία ανήκει ένα δείγμα
προφορικού λόγου.
Έχει εκπαιδευτεί σε δεδομένα προφορικού λόγου που ήδη φέρουν
μία από τις τέσσερις «ετικέτες» βαρύτητας (ήπια, μέτρια, σοβαρή,
πολύ σοβαρή) (δεδομένα εκπαίδευσης).
Αποτέλεσμα της εκπαίδευσης είναι ότι το μοντέλο έχει αντιστοιχίσει
κάθε ετικέτα με ένα σύνολο γλωσσικών χαρακτηριστικών που
διαφοροποιούν την κάθε κατηγορία από τις άλλες.
Βάσει της «γνώσης» που διαθέτει, ως αποτέλεσμα της εκπαίδευσης,
μπορεί να προβλέψει με έναν βαθμό ακρίβειας σε ποια κατηγορία
ανήκει ένα νέο δείγμα λόγου που δεν έχει ξανασυναντήσει.
23
Σύστημα αυτόματης αξιολόγησης

βαρύτητας αφασίας
Voice
Recording
24
Cross-lingual aphasia
classification
Μεγάλου όγκου δεδομένα προφορικού λόγου από άτομα με αφασία για την
εκπαίδευση μοντέλου ταξινόμησης είναι δύσκολο να αποκτηθούν για λιγότερο
ομιλούμενες γλώσσες, όπως τα Ελληνικά.
Για την εκπαίδευση του μοντέλου ταξινόμησης σε βαθμούς βαρύτητας
αξιοποιήσαμε δεδομένα από γλώσσες με πλούσιους γλωσσικούς πόρους, όπως
τα Αγγλικά.
Χρησιμοποιήσαμε τον περιορισμένο όγκο δεδομένων που συλλέχθηκαν στα
Ελληνικά για την προσαρμογή και την αξιολόγηση του μοντέλου.
25
Cross-lingual aphasia
detection
Η δουλειά μας παρουσιάστηκε στο συνέδριο INTERSPEECH
2022 με εφαρμογή στην αυτόματη ανίχνευση αφασίας
(aphasia vs. typical).
Αναπτύχθηκε μια End-to-End ροή εργασιών για την
ανίχνευση αφασίας, χρησιμοποιώντας διαγλωσσικά
(language-agnostic) χαρακτηριστικά.
Η εκπαίδευση του μοντέλου πραγματοποιήθηκε στα
Αγγλικά.
Επιτεύχθηκε ανίχνευση αφασίας στα Ελληνικά με 95%
ακρίβεια, όταν χρησιμοποιήθηκαν οι χειρωνακτικές
μεταγραφές και με 80% ακρίβεια χωρίς χειρωνακτικές
μεταγραφές, μόνο με αυτόματη αναγνώριση φωνής.
26
Εφαρμογή αξιολόγησης βαρύτητας

γλωσσικού ελλείμματος
Ενσωματώνεται στην πλατφόρμα λογοθεραπείας PLan-V.
Οι ασθενείς παράγουν προφορικό αφηγηματικό λόγο με
βάση το πρωτόκολλο των 7 δοκιμασιών εκμαίευσης που
παρουσιάστηκε.
Το σύστημα εξάγει αυτόματα τη βαρύτητα της αφασίας.
Το σύστημα παρέχει στον λογοθεραπευτή επιπλέον
μετρήσεις βασικών χαρακτηριστικών του συνεχούς λόγου,
όπως η ευχέρεια ομιλίας, η λεξιλογική ποικιλία, η
πυκνότητα πληροφορίας και η συντακτική
πολυπλοκότητα.
27
Εφαρμογή αξιολόγησης προφορικού

λόγου ατόμων με αφασία
Παρέχει την αυτόματη μεταγραφή της
ομιλίας του ασθενούς.
Υποστηρίζει διαφορετικές χορηγήσεις σε
διαφορετικές χρονικές στιγμές.
Οπτικοποιεί τα αποτελέσματα των
μετρήσεων σε διαφορετικές χορηγήσεις,
ώστε ο λογοθεραπευτής να παρακολουθεί
εξελικτικά και να αξιολογεί το αποτέλεσμα
και τη γενίκευση της παρέμβασης στον
συνεχή λόγο.
28
Αυτόματη αξιολόγηση παραγωγής

λέξης σε ασκήσεις κατονομασίας
Οι ασκήσεις λογοθεραπείας της πλατφόρμας περιλαμβάνουν και δοκιμασίες παραγωγής,

όπως ασκήσεις κατονομασίας, που απαιτούν από τον ασθενή να παραγάγει τη λέξη που
αντιστοιχεί στην εικόνα που βλέπει.
Για τις ανάγκες αξιολόγησης της επίδοσης των ασθενών στις δοκιμασίες αυτές αναπτύχθηκε
σύστημα, το οποίο επιτρέπει την αναγνώριση και αυτόματη αξιολόγηση της ομιλίας των
ασθενών, παρέχοντάς τους ανατροφοδότηση σε πραγματικό χρόνο ως προς τον βαθμό
επιτυχίας να παραγάγουν τη λέξη-στόχο.
Τα μοντέλα αναγνώρισης φωνής του ΙΕΛ για τα Ελληνικά χρησιμοποιήθηκαν για τη μετατροπή
της ομιλίας του ασθενούς σε κείμενο και στη συνέχεια υπολογίστηκε η απόσταση (Levenshtein
distance*) μεταξύ της παραχθείσας λέξης και της λέξης-στόχου.
*Η απόσταση Levenshtein είναι μια μετρική που χρησιμοποιείται για τον υπολογισμό της διαφοράς μεταξύ δύο συμβολοσειρών. Ποσοτικοποιεί τον
ελάχιστο αριθμό αλλαγών σε χαρακτήρες (εισαγωγή, αποκοπή ή υποκατάσταση) που απαιτούνται για τη μετατροπή της μιας συμβολοσειράς στην άλλη.
29
Αυτόματη αξιολόγηση παραγωγής

λέξης σε ασκήσεις κατονομασίας
Για την αξιολόγηση του συστήματος, παράχθηκε αυτόματα ένα σύνολο λέξεων-
παραλλαγών των λέξεων-στόχων (π.χ. άρχοντας/άχροντας), οι οποίες περιείχαν
φωνολογικά λάθη. Το σύνολο των λέξεων-παραλλαγών συγκροτήθηκε βάσει μιας
λίστας των πιο κοινών φωνολογικών λαθών που εμφανίζονται σε άτομα με
αφασία. Η λίστα αυτή καταρτίστηκε σε συνεργασία με λογοπαθολόγους του ΤΛΘ.
Οι διαφορετικές φωνολογικές παραλλαγές των λέξεων-στόχων εκφωνήθηκαν από
διαφορετικούς ομιλητές και τα δεδομένα που συλλέχθηκαν αποτέλεσαν τα
δεδομένα αξιολόγησης της ακρίβειας του συστήματος.
30
Παραγωγή ομιλούσας φιγούρας

εικονικού βοηθού
Η έρευνα υποστηρίζει τη χρήση ενσώματων εικονικών βοηθών σε εκπαιδευτικές ή κλινικές
εφαρμογές.
Η χρησιμότητά τους έγκειται στο γεγονός ότι προσθέτουν μια ανθρώπινη διάσταση στη
διεπαφή με τον υπολογιστή, η οποία:
βελτιώνει την εμπλοκή των χρηστών
ενθαρρύνει τη συμμετοχή τους
βελτιώνει την προσβασιμότητα
Σε αυτό το πλαίσιο, το σύνολο των ασκήσεων λογοθεραπείας της πλατφόρμας PLan-V
υποστηρίζεται από έναν εικονικό βοηθό, δηλαδή έναν ψηφιακό χαρακτήρα (Avatar), ο
οποίος καθιστά πιο φιλικό, εύχρηστο και προσβάσιμο το ψηφιακό περιβάλλον των
εικονικών συνεδριών.
31
Ομιλούσα φιγούρα εικονικού

βοηθού του PLan-V
Υλοποιήθηκε αντρική ομιλούσα φιγούρα εικονικού
βοηθού με σύστημα οπτικοακουστικής σύνθεσης.
Χρησιμοποιεί ως είσοδο φυσική
προηχογραφημένη αλλά και συνθετική αντρική
φωνή.
Παρέχει:
Οδηγίες πλοήγησης στις ασκήσεις της πλατφόρμας
Οδηγίες για την εκτέλεση των ασκήσεων
Προφορικά ερεθίσματα των ασκήσεων (π.χ. λέξεις που
πρέπει να αντιστοιχιστούν με εικόνα)
Ανατροφοδότηση για σωστές και λάθος απαντήσεις
32
Μεθοδολογία συστήματος
οπτικοακουστικής σύνθεσης
Υιοθετήθηκε η προσέγγιση
MakeItTalk *
Είσοδος: ένα ηχητικό αρχείο και
μια εικόνα προσώπου
(φωτογραφία ή σκίτσο)
Έξοδος: Συγχρονισμένη κινούμενη
εικόνα ομιλούσας φιγούρας
33
Μεθοδολογία συστήματος
οπτικοακουστικής σύνθεσης: μια πιο
προσεκτική ματιά
Εξαγωγή οροσήμων προσώπου
(περιοχή ματιών, μύτης, στόματος)
Εξαγωγή αναπαραστάσεων του
ηχητικού περιεχομένου
Πρόβλεψη μετατοπίσεων
ορόσημων προσώπου από το
ηχητικό περιεχόμενο
Απόδοση των προβλεφθέντων
ορόσημων πίσω στο avatar
34
API: Σύστημα οπτικοακουστικής

σύνθεσης φωνής
Δέχεται ως είσοδο κείμενο

(προς το παρόν στα Αγγλικά,
σε λίγο και στα Ελληνικά), το
οποίο μετατρέπεται σε
ομιλούσα φιγούρα που το
εκφωνεί με συνθετική φωνή.
Σύντομα θα δέχεται ως είσοδο
ηχογραφημένη φωνή.
35
Η ομάδα του ΙΕΛ
Βασίλης Κατσούρος, Ερευνητής Νάσος Κατσαμάνης, Ερευνητής Β΄ Σπυριδούλα Βαρλοκώστα, Καθηγήτρια ΕΚΠΑ
Α΄, Διευθυντής ΙΕΛ Συνεργαζόμενο μέλος ΔΕΠ
Νάσια Δήμου, PhD Παναγιώτης Καριώρης, MSc Χάρης Λεοντίδης, MSc

Ευθύμης Γεωργίου, Υπ. Διδάκτορας ΕΜΠ,
Συνεργαζόμενη ερευνήτρια Συνεργαζόμενος ερευνητής Συνεργαζόμενος ερευνητής
Συνεργαζόμενος ερευνητής,
Δημήτρης Μαστρογιαννόπουλος, MSc Κοσμάς Παληός, MSc Μάνος Πλίτσης, Υπ. Διδάκτορας ΕΚΠΑ, Συνεργαζόμενος Πέπη Σταμούλη, PhD
Συνεργαζόμενος ερευνητής Συνεργαζόμενος ερευνητής ερευνητής Συνεργαζόμενη ερευνήτρια
36
Η ομάδα του ΙΕΛ
Επιστημονικός Υπεύθυνος ΙΕΛ Αναπληρωτής ΕΥ ΙΕΛ- Τεχνικός Υπεύθυνος Προδιαγραφές επιλογής και αξιολόγησης ασθενών,
προδιαγραφές συλλογής δεδομένων
Ανάπτυξη ομιλούσας φιγούρας Ασκήσεις ομιλίας, συγκρότηση Ηχοληψία, επεξεργασία Εφαρμογή επισκόπησης αποτελεσμάτων
εικονικού βοηθού βάσης φωνολογικών λαθών ηχητικών καταγραφών αξιολόγησης βαρύτητας αφασίας
Εφαρμογή συλλογής δεδομένων προφορικού Εφαρμογή αυτόματης αξιολόγησης Ανάπτυξη μοντέλου ταξινόμησης Συντονισμός ομάδας, σχεδιασμός εφαρμογών,
λόγου παραγωγής λέξης βαρύτητας αφασίας προδιαγραφές συλλογής δεδομένων, συγκρότηση
dataset προφορικού λόγου, ποιοτικός έλεγχος
Σας ευχαριστούμε!
Πέπη Σταμούλη (pstam@athenarc.gr)

PLan-V Presentation Imerida Patra 27 May

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

PLan-V Presentation Imerida Patra 27 May

Uploaded by

Copyright:

Available Formats

1

Οι γλωσσικές τεχνολογίες περιλαμβάνουν ένα ευρύ φάσμα

Επεξεργασία Φυσικής Γλώσσας

Η ΕΦΓ εστιάζει στην αλληλεπίδραση μεταξύ του

Αυτόματη Αναγνώριση Ομιλίας

Η τεχνολογία αυτόματης αναγνώρισης ομιλίας

Μετατροπή κειμένου σε ομιλία

Tα συστήματα TTS μετατρέπουν το γραπτό κείμενο σε

Οι γλωσσικές τεχνολογίες έχουν πολλές πρακτικές

Γλωσσικές τεχνολογίες στη

Εφαρμογές των γλωσσικών

Αυτόματη αξιολόγηση βαρύτητας και τύπου αφασίας

Ινστιτούτο Επεξεργασίας του

Ανάπτυξη συστήματος αυτόματης αξιολόγησης της παραγωγής λόγου σε

Συλλογή και επεξεργασία δεδομένων για την ανάπτυξη

Επιλογή ασθενών Συλλογή δεδομένων

Αξιολόγηση ασθενών Μεταγραφή δεδομένων

Επιλογή και αξιολόγηση

Συλλογή δεδομένων προφορικού

Διαδικτυακή εφαρμογή: Μέθοδοι

Αξιολόγηση της μεθόδου

Μεταγραφή και διάθεση

Επεξεργασία και ανάλυση

Σύστημα αυτόματης αξιολόγησης

Σύστημα αυτόματης αξιολόγησης

Εφαρμογή αξιολόγησης βαρύτητας

Εφαρμογή αξιολόγησης προφορικού

Αυτόματη αξιολόγηση παραγωγής

Οι ασκήσεις λογοθεραπείας της πλατφόρμας περιλαμβάνουν και δοκιμασίες παραγωγής,

Αυτόματη αξιολόγηση παραγωγής

Παραγωγή ομιλούσας φιγούρας

Ομιλούσα φιγούρα εικονικού

API: Σύστημα οπτικοακουστικής

Δέχεται ως είσοδο κείμενο

Η ομάδα του ΙΕΛ

Νάσια Δήμου, PhD Παναγιώτης Καριώρης, MSc Χάρης Λεοντίδης, MSc

Η ομάδα του ΙΕΛ

Πέπη Σταμούλη (pstam@athenarc.gr)

You might also like