You are on page 1of 80

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Δ.Π.Μ.Σ Διοίκηση Επιχειρήσεων & Πληροφοριακά Συστήματα

Διπλωματική εργασία:
«ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑ
ΚΟΙΝΩΝΙΚΑ ΔΙΚΤΥΑ»

ΝΙΚΟΛΑΟΥ ΜΑΡΙΑ - AEM: 18

Επιβλέπων Καθηγητής: Τσαδήρας Αθανάσιος

Σεπτέμβριος 2020
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

ΕΥΧΑΡΙΣΤΙΕΣ
Θα ήθελα να ευχαριστήσω τον καθηγητή μου κ. Τσαδήρα Αθανάσιο, για την τιμή
που μου έκανε να επιβλέψει την προσπάθεια και μέσω της καθοδήγησης και
κρίσιμης συμβολής του να καταστεί εφικτή η ολοκλήρωση της παρούσας εργασίας.
Επίσης, θα ήθελα να ευχαριστήσω την οικογένειά μου για τη συνεχή στήριξη.

2
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

ΠΕΡΙΛΗΨΗ
Η χρήση των μέσων κοινωνικής δικτύωσης (social media) τα τελευταία χρόνια
συνιστά μία από τις πλέον δημοφιλείς δραστηριότητες σε παγκόσμιο επίπεδο,
καθώς ένας σημαντικά υψηλός και διαρκώς αυξανόμενος αριθμός χρηστών
μοιράζονται καθημερινά ενδιαφέροντα, γνώμες, απόψεις, ενημερώνονται και
ψυχαγωγούνται με τη βοήθεια πληθώρας εφαρμογών όπως newsgroups, virtual
chat rooms, instant messaging, weblogs, emails, video, voice data, forum discussion.
Η αλληλεπίδραση αυτή που εκδηλώνεται μεταξύ των χρηστών παράγει ένα
σημαντικό αριθμό δεδομένων και στοιχείων, η μελέτη των οποίων μέσω διαφόρων
εργαλείων ανάλυσης είναι ιδιαίτερα σημαντική, παρέχοντας πληροφόρηση επί
διαφόρων θεμάτων όπως οι προτιμήσεις των καταναλωτών, κυρίαρχες ή νέες
τάσεις κ.λπ.
Υπό το πρίσμα των ανωτέρω, αντικείμενο μελέτης της παρούσας εργασίας
αποτέλεσε η σύγκριση επιλεγμένων εργαλείων ανάλυσης κοινωνικών μέσων, με
σκοπό τον εντοπισμό κοινών, ισχυρών και αδύναμων σημείων καθώς και επιμέρους
διαφορών των προς σύγκριση εργαλείων.
Για το σκοπό αυτό αναπτύχθηκαν στον απαιτούμενο βαθμό οι θεματικές των
δικτύων και γράφων, των μέσων κοινωνικής δικτύωσης, της ανάλυσης κοινωνικών
δικτύων και της ανάλυσης συναισθήματος, προκειμένου να υποστηριχτεί και
πλαισιωθεί -σε θεωρητικό επίπεδο- η εν συνεχεία παρουσίαση και εφαρμογή
επιλεγμένων εργαλείων ανάλυσης κοινωνικών μέσων.

Λέξεις κλειδιά: γράφοι, δίκτυα, ανάλυση κοινωνικών δικτύων, κοινωνικά μέσα,


ανάλυση συναισθήματος, και εργαλεία ανάλυσης.

3
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

ABSTRACT
The use of social media in recent years is one of the most popular activities
worldwide, as a significantly high and ever-increasing number of users share daily
interests, opinions, views, information and entertainment with the help of a variety
of applications such as newsgroups, virtual chat rooms, instant messaging, weblogs,
emails, video, voice data, forum discussion.

This interaction that occurs between users produces a significant amount of data.
The study of these data through various analysis tools is particularly important,
providing information on various topics, such as consumer preferences, current or
new trends etc.

In the light of the above, the object of this study was the comparison of selected
tools for social media analysis, in order to identify common strengths and
weaknesses as well as differences of the tools to be compared.

For this purpose, the topics of networks and graphs, social media, social network
analysis and emotion analysis were developed to the required degree, in order to
support and frame - at a theoretical level - the subsequent presentation and
implementation of selected social media analysis tools.

Keywords: graphs, networks, social network analysis, social media, sentiment


analysis, and analysis tools.

4
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

1. ΕΙΣΑΓΩΓΗ ........................................................................................................................... 7
1.1. Υπόβαθρο μελέτης .................................................................................................... 7
1.2. Αντικείμενο εργασίας ................................................................................................ 7
2. ΘΕΩΡΗΤΙΚΟ ΜΕΡΟΣ ΔΙΚΤΥΩΝ .......................................................................................... 9
2.1. Ορισμός & δομικά στοιχεία δικτύων ........................................................................ 9
2.2. Κατηγορίες δικτύων ................................................................................................ 10
2.3. Ποσοστικά χαρακτηριστικά δικτύων....................................................................... 12
2.4. Μέτρα κεντρικότητας (centrality measurements) .................................................. 14
2.5. Εύρεση κοινοτήτων ................................................................................................. 16
2.6. Μοντέλα δικτύων .................................................................................................... 17
2.6.1. Τυχαία δίκτυα (Erdos – Renyi model, ER) .............................................................. 18
2.6.2. Small World Network (Watts-Strogatz Model, SW) .............................................. 18
2.6.3. Τα τυχαία scale-free Network (Barabasi-Albert, BA) ............................................ 20
2.6.4. Συγκριτική επισκόπηση κυρίαρχων μοντέλων δικτύων........................................ 20
3. ΑΝΑΛΥΣΗ ΚΟΙΝΩΝΙΚΩΝ ΔΙΚΤΥΩΝ .......................................................................... 22
3.1. Βασικές έννοιες ....................................................................................................... 22
3.2. Τα Κοινωνικά Μέσα (Social media) ......................................................................... 23
3.3. Τα δημοφιλέστερα είδη των ιστότοπων κοινωνικής δικτύωσης ............................ 24
3.3.1. Facebook ......................................................................................................... 25
3.3.2. Twitter ............................................................................................................. 26
3.3.3. YouTube ........................................................................................................... 26
3.3.4. Instagram ......................................................................................................... 26
3.3.5. LinkedIn ........................................................................................................... 27
3.4. Αντιδράσεις Χρηστών στα Κοινωνικά Δίκτυα: Likes, Comments & Shares ............. 27
4. ΑΝΑΛΥΣΗ ΣΥΝΑΙΣΘΗΜΑΤΟΣ (SENTIMENT ANALYSIS) .................................................. 29
4.1. Βασικές έννοιες & ορισμοί («Ανάλυση Συναισθήματος», Εξόρυξη Γνώμης» και
«Εξόρυξη κειμένου»)........................................................................................................... 29
4.2. Σύντομη Ιστορική Αναδρομή ................................................................................... 30
4.3. Διαδικασία Ανάλυσης Συναισθήματος ................................................................... 32
4.4. Αλγόριθμοι για την Ανάλυση Συναισθήματος ........................................................ 33
5. ΕΡΓΑΛΕΙΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ .............................................................................. 35
5.1. Mentionlytics ........................................................................................................... 35
5.2. Talkwalker................................................................................................................ 38

5
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

5.3. Synthesio ................................................................................................................. 41


5.4. Brandwatch ............................................................................................................. 43
5.5. Awario ..................................................................................................................... 44
5.6. Mention ................................................................................................................... 46
5.7. Sproutsocial ............................................................................................................. 48
5.8. Hootsuite ................................................................................................................. 50
5.9. Brand24 ................................................................................................................... 52
5.10. Digimind............................................................................................................... 54
6. ΕΦΑΡΜΟΓΗ ΕΡΓΑΛΕΙΩΝ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ ....................................................... 57
6.1. Mentionlytics ........................................................................................................... 57
6.2. Brand24 ................................................................................................................... 67
6.3. Συγκριτική Μελέτη Mentionlytics-Brand24 ............................................................ 71
7. ΣΥΜΠΕΡΑΣΜΑΤΑ ............................................................................................................ 75
8. ΒΙΒΛΙΟΓΡΑΦΙΑ ................................................................................................................ 77

6
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

1. ΕΙΣΑΓΩΓΗ
1.1. Υπόβαθρο μελέτης
Τα τελευταία χρόνια, τα μέσα κοινωνικής δικτύωσης (social media) έχουν
εισχωρήσει εις βάθος στους μηχανισμούς της καθημερινότητας, επηρεάζοντας τις
άτυπες αλληλεπιδράσεις των ανθρώπων, καθώς και τις θεσμικές δομές και τις
επαγγελματικές συνήθειες. Το κύριο αίτιο πίσω από την ταχύτατη ανάπτυξη και
δημοτικότητα αυτών των προγραμμάτων είναι η έμφυτη ανάγκη του ανθρώπου για
κοινωνικοποίηση, η οποία μέσω του διαδικτύου βρίσκει νέους τρόπους έκφρασης.
Εξάλλου, ιδιαίτερο χαρακτηριστικό στοιχείο των κοινωνικών δικτύων του web
αποτελεί το γεγονός ότι η ανάπτυξη τους ξεκίνησε από τους ίδιους τους χρήστες.
Δημιουργήθηκαν και αναπτύχθηκαν κατά τη μετάβαση από το λεγόμενο web 1.0,
όπου ο χρήστης απλά επισκεπτόταν σελίδες χωρίς μεγάλες δυνατότητες δικής του
συνεισφοράς, στο web 2.0. Η ιδέα του Web 2.0, δεύτερη γενιά του διαδικτύου,
οδήγησε στη δημιουργία νέων υπηρεσιών που τα περιεχόμενα τους
δημιουργούνται από τους χρήστες, προκαλώντας την αλλαγή του τρόπου
προσφοράς των υπηρεσιών.

1.2. Αντικείμενο εργασίας


Λαμβάνοντας υπόψη τη σπουδαιότητα της ανάπτυξης των μέσων κοινωνικής
δικτύωσης και την εκτεταμένη χρήσης τους, η παρούσα εργασία σκοπεί στην
συγκριτική εξέταση εργαλείων που έχουν αναπτυχθεί για την ανάλυση πληθώρας
δεδομένων που παράγονται καθημερινά μέσω της χρήσης των μέσων κοινωνικής
δικτύωσης.
Πέραν του εν λόγω εισαγωγικού κεφαλαίου, το περιεχόμενο των επόμενων έχει
περιληπτικά ως εξής:
 Στο κεφάλαιο 2 αναπτύσσεται το θεωρητικό υπόβαθρο των γράφων και
δικτύων. Συγκεκριμένα, περιγράφονται τα δομικά στοιχεία των δικτύων, τα
ποσοτικά χαρακτηριστικά και οι κατηγορίες αυτών, καθώς και τα κυριότερα
μοντέλα αυτών.
 Στο κεφάλαιο 3 αναπτύσσεται συνοπτικά η θεματική της ανάλυσης κοινωνικών
δικτύων, με περιγραφή, μεταξύ άλλων, των κοινωνικών μέσων και την εξέλιξη
αυτών (δημοφιλέστερα είδη, κ.λπ.).
 Στο κεφάλαιο 4 αναπτύσσεται συνοπτικά η έννοια της ανάλυσης συναισθήματος
(σύντομη ιστορική αναδρομή, διαδικασία και αλγόριθμοι λειτουργίας).
 Στο κεφάλαιο 5 εκτίθενται κάποια από τα πιο δημοφιλή εργαλεία ανάλυσης
δεδομένων, τα οποία επιτρέπουν την καλύτερη παρακολούθηση και ανάλυση
των κοινωνικών μέσων και την παροχή σημαντικών και χρήσιμων πληροφοριών.

7
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

 Στο κεφάλαιο 6 αποτυπώνονται τα αποτελέσματα από τη χρήση/εφαρμογή 2


επιλεγμένων (εκ των παραπάνω) εργαλείων ανάλυσης δεδομένων από κοινωνικά
μέσα και επιχειρείται μια συγκριτική μελέτη και προσπάθεια ερμηνείας των
αποτελεσμάτων.
 Στο κεφάλαιο 7 αναφέρονται συνοπτικά τα βασικότερα σημεία/συμπεράσματα
της παρούσας εργασίας.
Τέλος παρατίθεται η σχετική βιβλιογραφία.

8
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

2. ΘΕΩΡΗΤΙΚΟ ΜΕΡΟΣ ΔΙΚΤΥΩΝ


Στο κεφάλαιο αυτό παρατίθενται τα δομικά στοιχεία ενός δικτύου, πιθανές
κατηγοριοποιήσεις βάσει διαφόρων κριτηρίων, καθώς και τα ειδικότερα ποσοτικά
χαρακτηριστικά του (μετρικές κ.λπ.). Επιπρόσθετα περιγράφονται τα 3 κυριότερα
μοντέλα δικτύων με επιμέρους συγκρίσεις.

2.1. Ορισμός & δομικά στοιχεία δικτύων


Ένας απλός ορισμός των δικτύων θα μπορούσε να είναι ο εξής: «Μια θεωρητική
κατασκευή που περιγράφει τις σχέσεις μεταξύ ομοειδών ή ομάδων ομοειδών
στοιχείων αναπαριστώντας τις με σχηματικό τρόπο».
Βασική έννοια στα δίκτυα είναι αυτή των «σχέσεων». Απομονωμένα στοιχεία δεν
συνιστούν δίκτυο αλλά ένα απλό σύνολο. Αυτό που ορίζει ένα δίκτυο είναι το
πλέγμα των σχέσεων ή των «συνδέσεων» μεταξύ τους. Τα δίκτυα είναι στην ουσία
γραφικές αναπαραστάσεις πολύπλοκων συστημάτων που βοηθούν στη καλύτερη
κατανόηση τους. Από τις συγκοινωνίες, τις τηλεπικοινωνίες και τις κοινωνικές
σχέσεις, ως τις οικονομικές συναλλαγές και το διαδίκτυο (εξ ορισμού), δίκτυα
ενυπάρχουν παντού.
Από μαθηματική άποψη, τα δίκτυα είναι γράφοι (graphs) στους οποίους
αναπαρίστανται οι σχέσεις μεταξύ των στοιχείων ενός συνόλου.
Ειδικότερα, ως δίκτυο ορίζεται το σύστημα G που αποτελείται από ένα σύνολο Ν
κόμβων ni, i=1, ... N, που συνδέονται μεταξύ τους με συνδέσμους cij: G={ni, cij} i,j=1,
... N.
Τα βασικά χαρακτηριστικά στοιχεία του δικτύου είναι τα ακόλουθα:
 Κόμβοι (Nodes/vertices/points) i=1, … N : Βασικά δομικά στοιχεία του δικτύου.
 Σύνδεσμοι/ακμές (Edges/Links/lines) : εκφράζουν την σύνδεση μεταξύ 2 κόμβων
και ειδικότερα:
 cij =1 όταν οι κόμβοι i και j συνδέονται (μία φορά) και
 cij =0 όταν οι κόμβοι i και j δεν συνδέονται.
 Βαθμός/μέγεθος δικτύου Ν 1 : ορίζεται ως ο συνολικός αριθμός κόμβων που
απαρτίζουν το δίκτυο.
 Ισχύς Συνδέσμου, cij : Εκφράζει την ύπαρξη και σχετική ισχύ του συνδέσμου
ανάμεσα στους κόμβους i και j.

1
Ένα άλλο μέτρο του μεγέθους του δικτύου είναι η διάμετρος, η οποία λαμβάνει υπόψη όχι μόνο
τον αριθμό των κόμβων αλλά και το βαθμό διασύνδεσής τους (βλ. παρακάτω).

9
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Για την ανάλυση των ποσοτικών χαρακτηριστικών ενός δικτύου αυτό απαιτείται να
λάβει μία από τις δύο τυπικές του μορφές, που είναι πίνακας ή λίστα
συνδεσιμότητας/γειτνίασης. Ειδικότερα:
 Ως προς τον πίνακα συνδεσιμότητας ή γειτνίασης Cij, (adjacency matrix) : Είναι
ένας Ν x N πίνακας του οποίου τα στοιχεία είναι τα βάρη των συνδέσμων cij.

1 0 0 0 0 0 0 1
 
2 0 0 0 1 0 0 0
0 0 1 1 0 0 1
 
C = 0 1 0 0 1 0 0
7 3 0 0 0 1 0 1 1
5  
0 0 0 0 1 0 1
4
1
 0 1 0 1 1 0 
Εικόνα 1: Απεικόνιση ενός δικτύου και του πίνακα συνδεσιμότητάς του

 Ως προς την λίστα συνδεσιμότητας ή γειτνίασης (adjacency list): Σε αυτή την


περίπτωση, οι σχέσεις μεταξύ των κόμβων (τα βάρη των συνδέσμων, cij)
παρατίθενται με τη μορφή ζευγών κόμβων σε γειτονικές στήλες, το μήκος των
οποίων ισούται με το άθροισμα των συνδέσμων και των μη συνδεδεμένων
κόμβων. 2

2.2. Κατηγορίες δικτύων


Τα δίκτυα δύναται να κατηγοριοποιηθούν, βάσει διαφόρων κριτηρίων. Δύο εκ των
σημαντικότερων ταξινομήσεων είναι οι παρακάτω:
 Βάσει του χαρακτήρα των συνδέσμων (δυαδικός ή συνεχής) :
 Σταθμισμένα (weighted): Δίκτυα στα οποία οι σύνδεσμοι cij μπορούν να
πάρουν τιμές στο διάστημα [0,1] ανάλογα με το ποσοστό “φορτίου” που
μεταφέρει ο σύνδεσμος στο δίκτυο. Στα σταθμισμένα δίκτυα τα στοιχεία του
πίνακα συνδεσιμότητας παίρνουν μόνο πραγματικές τιμές στο διάστημα [0,1].
 Αστάθμιστα (non-weighted): Δίκτυα στα οποία οι τιμές των συνδέσμων είναι
δυαδικές, δηλαδή, είναι 1 εάν υπάρχει σύνδεσμος και μηδέν εάν δεν υπάρχει.
Στα αστάθμιστα δίκτυα τα στοιχεία του πίνακα συνδεσιμότητας παίρνουν
μόνο τις τιμές 0 ή 1.
 Βάσει της κατευθυντικότητας των συνδέσμων :
 Κατευθυνόμενα (directed): Δίκτυα στα οποία ισχύει cij≠cji. Στα
κατευθυνόμενα δίκτυα ο πίνακας συνδεσιμότητας είναι ασύμμετρος.

2
Οι λίστες γειτνίασης δεν χρησιμοποιούνται συνήθως για «πυκνά» δίκτυα όπου ο αριθμός των
συνδέσμων ξεπερνά το τετράγωνο του αριθμού των κόμβων. Στην περίπτωση αυτή προτιμώνται οι
πίνακες συνδεσιμότητας ή γειτνίασης.

10
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

 Μη κατευθυνόμενα (undirected): Δίκτυα στα οποία ισχύει cij=cji. Στα μη


κατευθυνόμενα δίκτυα ο πίνακας συνδεσιμότητας είναι συμμετρικός γύρω
από τη διαγώνιο.
Σημείωση: Μία πρόσθετη κατηγορία αφορά στα μεικτά (mixed) δίκτυα, όπου
ορισμένες σχέσεις των κόμβων είναι προσανατολισμένες (βλ. «κατευθυνόμενα»)
και άλλες όχι (βλ. «μη κατευθυνόμενα»).

(α) (β) (γ)

Εικόνα 2: Απεικόνιση 3 δικτύων, ως εξής: α) μη κατευθυνόμενο αστάθμιστο, β) κατευθυνόμενο αστάθμιστο και


γ) μη κατευθυνόμενο σταθμισμένο

Εικόνα 3: Οι 4 κύριοι τύποι δικτύων και οι μετασχηματισμοί τους (όλοι οι τύποι δικτύων μπορούν να εξαχθούν
από το σταθμισμένο διάγραμμα μέσω κατάλληλων μετασχηματισμών)

Περαιτέρω, τα δίκτυα δύναται να κατηγοριοποιηθούν βάσει του πλήθος των τύπων


των κόμβων του δικτύου (π.χ. δίκτυα με έναν-κοινό τύπο κόμβων – monopartite,
δίκτυα με δύο τύπους κόμβων – bipartite, δίκτυα με περισσότερους/πολλαπλούς
τύπους κόμβων – multilayer) ή βάσει του πλήθους των συνδέσμων των κόμβων (μία
ή περισσότερες συνδέσεις – multiplex).

11
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

2.3. Ποσοστικά χαρακτηριστικά δικτύων


Βαθμός Κόμβου, Degree: ki : Πρόκειται για το σύνολο των συνδέσμων/ακμών με τις
οποίες διασυνδέεται με άλλους κόμβους στο δίκτυο. Ανάλογα με το αν το δίκτυο
είναι κατευθυνόμενο ή όχι, ο βαθμός ενός δεδομένου κόμβου μπορεί να διακριθεί
σε βαθμό εισερχόμενων και εξερχόμενων συνδέσμων/ακμών. Το άθροισμα των δύο
ισούται σε αυτήν την περίπτωση με το συνολικό βαθμό του κόμβου.
Μέσος Βαθμός, Average Degree: Μετρά το μέσο όρο του βαθμού όλων των κόμβων
του δικτύου.
Μέσος Σταθμισμένος Βαθμός, Average Weighted Degree: Λαμβάνει υπόψη του τη
βαρύτητα κάθε σχέσης (edge) και όχι μόνο τον αριθμό των σχέσεων που έχει κάθε
κόμβος.
Κατανομή βάθμωσης, Degree distribution, P(k): Είναι μία ιδιότητα που
χαρακτηρίζει συνολικά το δίκτυο και εκφράζει την πιθανότητα να βρούμε έναν
κόμβο που να έχει βαθμό μεταξύ (k, k+δk).

P(k)
2
1

k
1 2 3 4

Εικόνα 4: Διαγραμματική απεικόνιση κατανομής βάθμωσης

Πυκνότητα δικτύου (Density): Πέρα από το συνολικό μέγεθος ενός δικτύου, όπως
αναφέρθηκε παραπάνω, ιδιαίτερη σημασία έχει και ο βαθμός στον οποίο τα
στοιχεία του δικτύου είναι διασυνδεδεμένα μεταξύ τους. Ένα δίκτυο μεγάλου
μεγέθους (μεγάλου αριθμού κόμβων) μπορεί να έχει ελάχιστες συνδέσεις, μεταξύ
των στοιχείων του, την ίδια στιγμή που ένα πολύ μικρότερο μπορεί να είναι πολύ
πυκνότερο.
Την έννοια αυτή της πυκνότητας του δικτύου την ορίζουμε ποσοτικά ως το πηλίκο
των πραγματικών συνδέσεων που υπάρχουν στο δίκτυο διά του αριθμού των
συνδέσεων που θα είχε ένα πλήρως διασυνδεδεμένο (fully-connected) δίκτυο ίσου
μεγέθους. Ένα πλήρως διασυνδεδεμένο δίκτυο είναι ένα δίκτυο στο οποίο κάθε
στοιχείο συνδέεται άμεσα με καθένα από τα υπόλοιπα.

12
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Το σύνολο τιμών που μπορεί να πάρει η πυκνότητα είναι από 0 μέχρι 1. Στην
περίπτωση που όλοι οι κόμβοι συνδέονται άμεσα μεταξύ τους, τότε η πυκνότητα θα
ισούται με τη μονάδα. Γενικά, όσο μεγαλύτερο είναι το δίκτυο, τόσο η πυκνότητα
θα μειώνεται, αφού οι εν δυνάμει δεσμοί θα αυξάνονται.
Απόσταση κόμβων, distance/shortest path length: Ορίζεται ως ο ελάχιστος
αριθμός συνδέσμων για να φτάσουμε από τον κόμβο i στον κόμβο j. Πρόκειται
δηλαδή για το συντομότερο μονοπάτι μεταξύ δύο κόμβων.
Σε μικρά δίκτυα η συντομότερη διαδρομή είναι εύκολο να υπολογιστεί εποπτικά. Σε
μεγαλύτερα, ωστόσο, δίκτυα χρειάζεται κανείς να καταφύγει σε πιο συστηματικές
μεθόδους για τον υπολογισμό της.
Μια αποτελεσματική τέτοια μέθοδος είναι η Αναζήτηση μέσω Πλάτους (Breadth-
first search) (Zhou & Hansen, 2006), η οποία υπολογίζει την απόσταση μεταξύ δύο
κόμβων Α και Β, ξεκινώντας από τον κόμβο Α και προχωρώντας μέσω διαδοχικών
ελέγχων των άμεσων γειτόνων ως το Β.
Το μήκος του διανύσματος της συντομότερης διαδρομής μας δίνει ένα βαθμό της
εγγύτητας μεταξύ των δύο στοιχείων στο δίκτυο. Μια μικρού μήκους συντομότερη
διαδρομή είναι ενδεικτική μιας στενότερης σχέσης μεταξύ των κόμβων.
Σημειώνεται ότι, εάν το δίκτυο είναι σταθμισμένο, λαμβάνεται υπ' όψιν και το
βάρος των συνδέσεων ανάμεσα στους κόμβους που συνδέουν τους i και j.
Διάμετρος, Diameter, d: Η διάμετρος είναι ένα ακόμα μέτρο του μεγέθους ενός
δικτύου, που σχετίζεται όμως όχι μόνο με το πλήθος των κόμβων, αλλά λαμβάνει
υπόψη του και τη διασυνδεσιμότητα.
Ορίζεται ως η μέγιστη απόσταση ανάμεσα στους κόμβους του δικτύου. Εάν το
δίκτυο αποτελείται από ασύνδετα υποδίκτυα, τότε ορίζεται ως η μέγιστη απόσταση
μεταξύ των κόμβων του μεγαλύτερου υποδικτύου. 3
Συντελεστής Συσσωμάτωσης, Clustering coefficient, Ci : Δείχνει πόσο ισχρυρή είναι
η συνδεσιμότητα γύρω από τον κόμβο i.
Σχετίζεται με το βαθμό στον οποίο οι κόμβοι του δικτύου τείνουν να σχηματίζουν
τοπικά υποδίκτυα. Σχηματικά μπορεί κανείς να συλλάβει την έννοια του συντελεστή
συσσωμάτωσης για τον κόμβο i ως τον αριθμό των τριγωνικών σχέσεων που
αναπτύσσονται μεταξύ του i και των κόμβων με τους οποίους ο i συνδέεται άμεσα.

3
Είναι έτσι το ανάλογο της διαμέτρου ενός γεωμετρικού σχήματος και αποτελεί μια καλή
προσέγγιση για το βαθμό «διασποράς» των κόμβων ενός δικτύου. H ερμηνεία της ωστόσο,
χρειάζεται προσοχή καθώς σε περιπτώσεις ακραίων, πολύ απομακρυσμένων κόμβων η τιμή της
μπορεί να μην είναι αντιπροσωπευτική.

13
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Επίσης, σχετίζεται άμεσα με την έννοια της κλίκας (clique), η οποία περιγράφει ένα
δίκτυο (ή ένα τμήμα δικτύου) του οποίου τα στοιχεία είναι πλήρως και άμεσα
διασυνδεδεμένα μεταξύ τους.
Ποσοτικά υπολογίζεται με πολλούς διαφορετικούς τρόπους, οι οποίοι δίνουν
αρκετά διαφορετικά αποτελέσματα μεταξύ τους, εκφράζοντας ωστόσο όλοι τους τις
τοπικές συσπειρώσεις στο δίκτυο. Η επιλογή του συντελεστή συσσωμάτωσης
εξαρτάται καθε φορά από την εφαρμογή.
Σημειώνεται ότι ο συντελεστής συσσωμάτωσης συγκεκριμένου κόμβου εξαρτάται
από το βαθμό του. Η σχέση με την οποία τα δύο μεγέθη συμμεταβάλλονται είναι
πολύ σημαντική για το είδος του δικτύου.
Μέσος Συντελεστής Συσσωμάτωσης, Average clustering coefficient: Πρόκειται για
μια γενικευμένη έκφραση του C (συντελεστής συσσωμάτωσης) που αναφέρθηκε
παραπάνω και αντιστοιχεί στη μέση τιμή των C για όλους τους κόμβους Ν ενός
δικτύου.
Συνιστά ένα μέτρο της συνδεσιμότητας (connectedness) ενός δικτύου. Ένα δίκτυο
στο οποίο ο μέσος συντελεστής συσσωμάτωσης είναι 0, αποτελεί ένα σύνολο
πλήρως ασύνδετων κόμβων. Από την άλλη εάν είναι 1, το δίκτυο είναι πλήρως
συνδεδεμένο με όλους τους κόμβους να συνδέονται μεταξύ τους με όλους τους
δυνατούς τρόπους, να συνθέτουν δηλαδή μια κλίκα.

2.4. Μέτρα κεντρικότητας (centrality measurements)


Η σημαντικότητα ενός κόμβου δεν καθορίζεται μονοσήμαντα, αλλά εξαρτάται από
την ερμηνεία που δίνεται στην έννοια κεντρικότητα (centrality). Τα μέτρα της
κεντρικότητας αναγνωρίζουν του προεξέχοντες κόμβους, δηλαδή αυτούς που
συσχετίζονται πιο ενεργά με τα υπόλοιπα μέλη του δικτύου.
Τα πιο σημαντικά μέτρα της κεντρικότητας είναι τα ακόλουθα:
 Βαθμική Κεντρικότητα, Degree Centrality
 Κεντρικότητα εγγυτήτας, Closeness Centrality
 Διαμεσότητα, Betweenness Centrality
 Ποιότητα συνδέσεων, Eigenvector centrality
Ακολουθεί η απαιτούμενη για τις ανάγκες της παρούσας εργασίας περιγραφή των 3
πρώτων μετρικών, οι οποίες θα αξιοποιηθούν σχετικώς στα δεδομένα της
παρούσας εργασίας.

14
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

α) Βαθμική Κεντρικότητα, Degree Centrality


Η βαθμική κεντρικότητα (degree centrality) ενός κόμβου v είναι ανάλογη με το
βαθμό του κόμβου αυτού. Ως εσωτερικός ή εξωτερικός βαθμός ορίζεται ο αριθμός των
εισερχόμενων ή εξερχόμενων ακμών αντίστοιχα. 4

β) Κεντρικότητα εγγύτητας, Closeness Centrality


Σε συνδεδεμένα γραφήματα υπάρχει μία μετρική φυσικής απόστασης ανάμεσα σε
όλα τα ζευγάρια κόμβων που ορίζεται από το μήκος των ελαχίστων μονοπατιών
του. Το πόσο μακριά βρίσκεται ένας κόμβος s ενός γράφου ορίζεται σαν το
άθροισμα των αποστάσεων από όλους τους άλλους κόμβους.
Ως εκ τούτου, υπάρχει η δυνατότητα να οριστεί το κατά πόσο κοντά είναι ένας
κόμβος σαν το αντίστροφο του προαναφερθέντος μέτρου. Επομένως, όσο πιο
κεντρικός είναι ένας κόμβος βάσει του δείκτη αυτού, τόσο μικρότερη είναι η
συνολική του απόσταση από όλους τους άλλους κόμβους.

Αν δεν υπάρχει μονοπάτι μεταξύ δύο κορυφών τότε αυθαίρετα τίθεται ως


απόσταση το πλήθος όλων των κορυφών. Η αντίστροφη ποσότητα Ci=1/li είναι η
κεντρικότητα εγγύτητας.

To εν λόγω μέτρο εγγύτητας είναι μεν δηλωτικό της θέσης του κόμβου στο δίκτυο
από άποψη αποστάσεων, αλλά δεν αποδίδει τις διαφορές που μπορεί να υπάρχουν
μεταξύ ενός κόμβου, που απλά βρίσκεται κοντά στο κέντρο του δικτύου από
γεωμετρική άποψη, και των κόμβων που είναι και κεντρικοί από πλευράς
διασυνδεσιμότητας. Ένα μέτρο που επιτρέπει να ποσοτικοποιηθεί αυτή τη έννοια
είναι η διακεντρικότητα (betweenness centrality).
γ) Διαμεσότητα, Betweenness Centrality
Το μέτρο Betweenness Centrality είναι ένας δείκτης που αναφέρεται σε έναν κόμβο
του γράφου και είναι αυτός που μετρά πόσες φορές ο κόμβος λειτουργεί σαν
«γέφυρα» του ελάχιστου μονοπατιού που ενώνει 2 κόμβους του γράφου. Κόμβοι
που έχουν μεγάλη πιθανότητα να βρεθούν ανάμεσα σε ένα ελαχίστου μήκους
μονοπάτι μεταξύ δύο τυχαίων επιλεγόμενων κόμβων έχουν υψηλό betweenness
centrality.
Τα αποτελέσματα εν λόγω μετρικής φανερώνουν ποιοι κόμβοι βρίσκονται σε
μονοπάτια επικοινωνίας καθώς και σε ποια σημεία θα μπορούσε ο γράφος να
χωριστεί.
Είναι αναγκαίο να επισημανθεί, ότι για τον υπολογισμό των closeness και
betweenness centrality είναι απαραίτητος ο υπολογισμός των ελάχιστων

4
Συνήθως, η μετρική χρησιμοποιείται για την μέτρηση της ικανότητας σύνδεσης του κόμβου
επηρεάζοντας έτσι την δημοτικότητά του. Οι κεντρικοί κόμβοι είναι ικανοί να μεταφέρουν
πληροφορία ή να επηρεάζουν αρκετούς κόμβους σε μια γειτονία.

15
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

μονοπατιών για κάθε ζεύγος κόμβων του γραφήματος. Αυτός ο υπολογισμός, όταν ο
γράφος έχει μεγάλο αριθμό κόμβων και ακμών, είναι αδύνατος λόγω
περιορισμένων υπολογιστικών πόρων.
δ) Ποιότητα συνδέσεων, Eigenvector centrality
Η μετρική είναι κατάλληλη προκειμένου να διαπιστωθεί κατά πόσο ένας κόμβος
επηρεάζει το δίκτυο. Η τιμή κάθε κόμβου είναι αναλογική του αθροίσματος της
τιμής των κόμβων που συνδέονται με αυτόν.
Κάθε κόμβος που έχει υψηλή τιμή συνδέεται με κόμβους που έχουν επίσης υψηλή
τιμή μετρικής.

2.5. Εύρεση κοινοτήτων


Ποικίλες μέθοδοι έχουν αναπτυχθεί στη θεωρία γράφων ως προς την εύρεση
κοινοτήτων. Πρόκειται κατ’ ουσία για την προσπάθεια διαχωρισμού/διαμέρισης
ενός δικτύου σε ομάδες/κοινότητες εντός των οποίων οι κόμβοι παρουσιάζουν
υψηλή πυκνότητα (ταυτόχρονα οι κόμβοι διαφορετικών κοινοτήτων παρουσιάζουν -
συγκριτικά- χαμηλή/χαμηλότερη διασύνδεση). Η εν λόγω προσπάθεια έχει
προσελκύσει ιδιαίτερο ενδιαφέρον τα τελευταία έτη, δεδομένου ότι έχει αυξηθεί η
διαθεσιμότητα μεγάλων συνόλων δεδομένων δικτύων που απαιτούν την διαμέριση
αυτών για την κατά περίπτωση μελέτη τους.
Οι μέθοδοι αυτοί βασίζονται συνήθως στην μεγιστοποίηση μίας μετρικής ή στην
τυχαία διάνυση του δικτύου ή ακόμη και στη διάσπασή του.
Ένα από τα μέτρα που έχουν αναπτυχθεί για την εύρεση κοινοτήτων είναι γνωστό
ως “modularity”. Πρόκειται για μετρική δομής του δικτύου, η οποία σχεδιάστηκε
ακριβώς για τον σκοπό αυτό, δηλαδή τον καθορισμό της δυνατότητας διαίρεσης
ενός δικτύου σε κοινότητες.
Ένα δίκτυο που έχει υψηλή τιμή modularity παρουσιάζει αυξημένη συνεκτικότητα
εντός των συστάδων και αραιή σύνδεση μεταξύ κόμβων διαφορετικών συστάδων.
Γενικά, αν για κάποια διαμέριση του γράφου η μετρική έχει αρνητική τιμή τότε το
δίκτυο δεν μπορεί να χωριστεί σε κοινότητες. Ωστόσο, παρά το γεγονός πως ο
ορισμός της modularity είναι διαισθητικά απλός, η υλοποίησή της παρουσιάζει
προβλήματα (π.χ. αποτυγχάνει να εντοπίσει μικρές κοινότητες σε μεγάλους
γράφους ακόμα κι αν αυτές είναι καλά ορισμένες).
Ενδεικτικά αναφέρεται ο αλγόριθμος (V. Blondel, 2008), ο οποίος φαίνεται να
βρίσκει σε γρήγορο χρόνο διαμερίσεις (επιτυγχάνοντας υψηλή τιμή modularity) και
να είναι αποδοτικός για δίκτυα με εκατομμύρια κόμβους.
Η διαδικασία που ακολουθείται χωρίζεται σε 2 επαναλαμβανόμενες φάσεις.
Αρχικά, για ένα δίκτυο N κόμβων κάθε κόμβος αποτελεί μία διαφορετική κοινότητα.
Κάθε κόμβος i μετακινείται ιδεατά σε κάθε κοινότητα των j γειτόνων του. Για κάθε

16
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

μετακίνηση υπολογίζεται η νέα τιμή modularity και ο κόμβος μετακινείται στην


κοινότητα που αποδίδει την μεγαλύτερη τιμή. Σε περίπτωση μη βελτίωσης ο κόμβος
παραμένει στην αρχική του κοινότητα. Η α’ φάση υλοποιείται αφού η διαδικασία
έχει επαναληφθεί για κάθε κόμβο και δεν παρατηρείται επιπλέον βελτίωση. Έτσι, ο
αλγόριθμος επιτυγχάνει ένα τοπικό μέγιστο της τιμής modularity.
Στη β’ φάση δημιουργείται ένα νέο δίκτυο οι κόμβοι του οποίου συνιστούν τις
κοινότητες που προέκυψαν κατά την α’ φάση. Οι νέες σύνδεσμοι δίνονται από το
άθροισμα των βαρών των συνδέσμων μεταξύ των κόμβων των κοινοτήτων. Στη
συνέχεια, επαναλαμβάνεται η α’ φάση.

Εικόνα 5: Οπτικοποίηση των βημάτων του αλγορίθμου. Η διαδικασία αποτελείται από 2 φάσεις:
Α’ φάση, όπου η modularity βελτιστοποιείται επιτρέποντας μόνο τοπικές αλλαγές των κοινοτήτων,
Β’ φάση, οι κοινότητες που βρέθηκαν συγκεντρώνονται προκειμένου να κατασκευαστεί ένα νέο δίκτυο κοινοτήτων.
Η διαδικασία επαναλαμβάνεται έως ότου μία περαιτέρω αύξηση της modularity να μην είναι δυνατή.

2.6. Μοντέλα δικτύων


Τα κυρίαρχα μοντέλα που συνιστούν ταυτόχρονα ορόσημα στην μελέτη της
ανάλυσης δικτύων είναι τα ακόλουθα:
 Τυχαία δίκτυα (Erdos-Renyi model, ER)
 Small World Network (Watts-Strogatz Model, WS)
 Τα τυχαία scale-free Network (Barabasi-Albert Model, BA).
Ακολουθεί η αναγκαία για την εργασία, περιγραφή αυτών.

17
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

2.6.1. Τυχαία δίκτυα (Erdos – Renyi model, ER)


Ένα τυχαίο γράφημα μπορεί να προκύψει με τον εξής τρόπο:
Ξεκινώντας με ένα σύνολο V={1,2,…,n} n κόμβων και προσθέτοντας τυχαία ακμές
που συνδέουν τους κόμβους αυτούς.
Ο μέγιστος αριθμός ακμών που μπορούν να προστεθούν είναι ίσος με
Διαφορετικά τυχαία γραφήματα παρουσιάζουν διαφορετικές κατανομές βαθμών
στους κόμβους. Τα τυχαία γραφήματα μελετώνται συνήθως βάσει του μοντέλου
των Erdos-Renyi G (n,M). 5
Σε ένα τυχαίο δίκτυο Erdos-Renyi, το μέγεθος του δικτύου θα είναι Ν και η
πυκνότητά του θα εξαρτάται από την τιμή της παραμέτρου p (όσο χαμηλότερη,
τόσο πυκνότερο το δίκτυο). Μια βασική στατιστική ιδιότητα που μας ενδιαφέρει
είναι η κατανομή των βαθμών των κόμβων του. Με βάση τον τρόπο που
σχηματίστηκε το δίκτυο, μπορούμε να υπολογίσουμε την πιθανότητα που έχει ο
κάθε κόμβος να έχει βαθμό d.
Η πιθανότητα αυτή προσεγγίζεται πολύ ικανοποιητικά από την κατανομή Poisson.
Ως εκ τούτου, τα τυχαία δίκτυα έχουν μια πολύ χαρακτηριστική κατανομή βαθμού
κόμβων σε σχέση με τη μέση τιμή (όπως διαμορφώνεται από την παράμετρο p). Η
κατανομή αυτή προβλέπει ότι ο μεγαλύτερος αριθμός των κόμβων θα έχει βαθμό d
κοντά στην μέση τιμή των βαθμών του δικτύου.
Περαιτέρω, ο μέσος συντελεστής συσπείρωσης φαίνεται να φθίνει αντιστρόφως
ανάλογα με τον αριθμό των κόμβων για μεγάλες τιμές του Ν, κάτι που δεν
συμβαίνει στα φυσικά δίκτυα, όπου παραμένει σταθερός και σχετικά μεγάλος.

Το μοντέλο ER απέχει πολύ από το να περιγράφει δίκτυα του πραγματικού


κόσμου, γιατί η κατανομή κόμβων δεν είναι είναι νόμος δύναμης, αλλά νόμος
Poisson, με εκθετικές ουρές που χαρακτηρίζουν τις κατανομές πεπερασμένης
εμβέλειας.

2.6.2. Small World Network (Watts-Strogatz Model, SW)


Μία σημαντική ιδιότητα που παρατηρείται σε πολλά πραγματικά δίκτυα είναι ο
συνδυασμός μικρού μέσου μήκους μονοπατιού και μεγάλου συντελεστή
συσσωμάτωσης. Αυτός ο συνδυασμός καλείται φαινόμενο του μικροκόσμου (small-
world) και για την προσομοίωσή του έχουν δημιουργηθεί διάφορα μοντέλα. Το πιο
γνωστό μοντέλο είναι αυτό των Watts-Strogatz (1998).
Για την παρεμβολή μεταξύ τυχαίων δικτύων και δικτύων που παρουσιάζουν το small
world φαινόμενο η παρακάτω διαδικασία επανασύνδεσης ακμών θεωρείται τυχαία.

5
Αλλά και του μοντέλο που προτάθηκε από τον Gilbert G (n,p).

18
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Ξεκινώντας από ένα κυκλικό γράφο με n κόμβους, όπου κάθε κόμβος έχει k ακμές
και συνδέεται με τους k/2 πλησιέστερους γείτονες αριστερά του και τους k/2
πλησιέστερους γείτονες δεξιά του, κάθε ακμή επανασυνδέεται τυχαία με
πιθανότητα p. Αυτή η κατασκευή δίνει τη δυνατότητα να συντονισμού του δίκτυο
μεταξύ της κανονικότητας (p~0) και της απόλυτης διαταραχής (p~1). Επιπροσθέτως,
παρουσιάζει ιδιαίτερο ενδιαφέρον η περίπτωση στην οποία 0≤p≤1.

p=0 p=1

Εικόνα 6: Απεικόνιση 3 δικτύων με χρήση της σταθεράς αποκοπής-επανασύνδεσης (p)

Ως εκ τούτου, το μοντέλο WS χρησιμοποιεί την σταθερά αποκοπής-επανασύνδεσης


p ως παράμετρο τάξης, καθώς:
 για p=0 έχουμε τον ντετερμινιστικό οργανωμένο δίκτυο με τους Ν ταλαντωτές
που συνδέονται ο καθένας με K γείτονες τοποθετημένους συμμετρικά γύρω του,
ενώ
 για p=1 έχουμε ένα πλήρως στοχαστικό δίκτυο, τύπου ER (βλ. παραπάνω).
Για μεγάλα μεγέθη συστήματος η μέση απόσταση δεν μεγαλώνει ανάλογα με το
μέγεθος του συστήματος αλλά με τον λογάριθμο του μεγέθους. Αυτή είναι και η
έννοια του δικτύου μικρού κόσμου.

Το μοντέλο WS προσομοιάζει τα φυσικά δίκτυα στο ότι και τα δύο :


 είναι δίκτυα «μικρού κόσμου», δηλαδή έχουν λογαριθμική σχέση ανάμεσα
στην ελάχιστη απόσταση κόμβων και στο μέγεθος του συστήματος και
 έχουν μεγάλο συντελεστή συσσωμάτωσης
Αντίθετα το μοντέλο WS διαφέρει από τα φυσικά δίκτυα στο ότι η κατανομή
κόμβων ακολουθεί νόμο πεπερασμένης εμβέλειας, καθώς για τιμές του p κοντά
στο 0 προσεγγίζεται από την κατανομή δ(k-<k>), η οποία πλαταίνει προς την
κατανομή Poisson όταν οι τιμές του p . 1. Οι κατανομές αυτές διαφέρουν μη-
τετριμμένα από τους νόμους δύναμης που παρατηρούνται στα φυσικά δίκτυα.

19
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

2.6.3. Τα τυχαία scale-free Network (Barabasi-Albert, BA)


Σε έναν μικρό αριθμό κόμβων, προσθέτουμε σε κάθε χρονικό βήμα έναν νέο κόμβο
με ακμές, που συνδέουν τον κόμβο αυτό με κάποιους από τους υπάρχοντες
κόμβους. Η πιθανότητα Π ένας νέος κόμβος να συνδεθεί με τον κόμβο i εξαρτάται
από τον βαθμό ki αυτού του κόμβου. Η μέθοδος αυτή ονομάσθηκε από τους
Barabasi-Albert ως «επιλεκτική συνδεσιμότητα» (preferential attachment).
Μετά από t χρονικά βήματα θα προκύψει ένα δίκτυο. Το εν λόγω δίκτυο
εξελίσσεται σε μία αμετάβλητης κλίμακας κατάσταση με την πιθανότητα ένας
κόμβος να έχει βαθμό k, να ακολουθεί εκθετική κατανομή με εκθέτη γ.
Η εκθετική κατανομή των περισσότερων πραγματικών δικτύων αφορά και στο
βαθμό των κόμβων, περιγράφει πολλά διαφορετικά μεγέθη και είδη δυναμικών
συστημάτων. Συνεπώς, αναμένεται ότι το καλύτερο μοντέλο προσομοίωσης ενός
δικτύου θα παρέχει κατανομή που τα κύρια χαρακτηριστικά της θα είναι η
ανεξαρτησία της ως προς το χρόνο. Η κατανομή P(k) είναι ανεξάρτητη του χρόνου
και του μεγέθους του συστήματος το οποίο αναδεικνύει πως παρά το γεγονός ότι το
δίκτυο αυξάνεται συνεχώς, φαίνεται να συγκλίνει σε μία scale-free στατική
κατάσταση.
Με την εκθετική κατανομή στο δίκτυο να κλιμακώνεται, εξάγεται ότι η ανάπτυξη και
η μέθοδος preferential attachment παίζουν εξέχοντα ρόλο στην εξέλιξη του δικτύου.
Ένεκα της «επιλεκτικής συνδεσιμότητας», ένας κόμβος που αποκτά περισσότερες
ακμές από έναν άλλο, θα αυξήσει στην πορεία την συνδεσιμότητά του με
υψηλότερο ρυθμό. Κατά αυτόν τον τρόπο, μία αρχική διαφορά της συνδεσιμότητας
μεταξύ 2 κόμβων θα αυξάνεται με την πάροδο των χρονικών βημάτων.
Παλιοί κόμβοι του δικτύου φαίνεται να αυξάνουν την συνδεσιμότητά τους «εις
βάρος» των νέων κόμβων του δικτύου. Αυτό έχει ως αποτέλεσμα μερικοί κόμβοι
μετά από μία μεγάλη περίοδο στο χρόνο να έχουν μεγάλο βαθμό. Κατά αυτόν τον
τρόπο εμφανίζεται και το φαινόμενο γνωστό ως “rich get richer” (ένας κόμβος
μεγάλου βαθμού αυξάνει περισσότερο το βαθμό του σε σχέση με άλλους κόμβους
που έχουν -συγκριτικα- μικρότερο βαθμό). Το φαινόμενο αυτό απαντάται συνήθως
στα δίκτυα του πραγματικού κόσμου.

2.6.4. Συγκριτική επισκόπηση κυρίαρχων μοντέλων δικτύων


Έχοντας παραθέσει τα βασικά χαρακτηριστικά του κάθε μοντέλου, κρίνεται σκόπιμη
μια επιμέρους σύγκριση μεταξύ αυτών, επί των κύριων χαρακτηριστικών τους.
 Στοχαστικό δίκτυο, ER: όλοι οι κόμβοι είναι περίπου ισοδύναμοι, με τις
συνδέσεις τυχαία κατανεμημένες.
 Δίκτυο πεπερασμένου – «μικρού» κόσμου, WS: Είναι οργανωμένο και
ντετερμινιστικό, αλλά φέρει έναν μικρό αριθμό τυχαίων συνδέσεων μακράς
εμβέλειας.

20
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

 Δίκτυο ελεύθερης κλίμακας, BA: Δημιουργείται ένας μικρός αριθμός κόμβων


που φέρουν μεγάλη συνδεσιμότητα.

(α) Smal-World Network (SWN) (β) Scale-Free Network (SFN) (γ) Random Network (RN)

Εικόνα 7: Απεικόνιση δικτύων των κυρίαρχων μοντέλων

21
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

3. ΑΝΑΛΥΣΗ ΚΟΙΝΩΝΙΚΩΝ ΔΙΚΤΥΩΝ


3.1. Βασικές έννοιες
Ένα κοινωνικό δίκτυο συνιστά μία κοινωνική δομή που αποτελείται από οντότητες
(κόμβους) όπως άτομα, επιχειρήσεις, κ.λπ. οι οποίοι συνδέονται μεταξύ τους με
έναν ή περισσότερους τύπους αλληλεξάρτησης (interdependence), όπως αξίες,
οράματα, ιδέες, οικονομικές συναλλαγές, φιλία, συγγένεια, αντιπάθεια,
συγκρούσεις, επιγραμμικές (web) επαφές (Wasserman & Faust, 1994) κ.λπ.
Η ανάλυση κοινωνικών δικτύων αποτελεί εις βάθος μελέτη των δικτύων αυτών όσον
αφορά στην εικονική αποτύπωση, στη δομή, στη μορφή των διασυνδέσεων, στα
χαρακτηριστικά και στη συμπεριφορά των συνδεδεμένων χρηστών (Knoke & Yang,
2008). Έτσι, δύναται να εξαχθεί γνώση για το εκάστοτε δίκτυο η οποία ακολούθως
μπορεί να οδηγήσει σε χρήσιμα συμπεράσματα και στη λήψη αποφάσεων, εφόσον
απαιτείται.
Είναι πρακτικά μία τεχνική-κλειδί για τη μέτρηση και απεικόνιση των σχέσεων και
των ροών ανάμεσα σε ανθρώπους, ομάδες, επιχειρήσεις, ηλεκτρονικούς
υπολογιστές ή οποιεσδήποτε άλλες «μονάδες» επεξεργασίας γνώσης και
πληροφορίας. Είναι εξαιρετικά σημαντική και αφορά πληθώρα επιστημών, όπως η
ανθρωπολογία, η ψυχολογία, η κοινωνιολογία, η στατιστική αλλά και η θεωρία των
γράφων (Πετροπούλου, 2015).
Σύμφωνα με τους Knoke and Yang (2008), η Ανάλυση Κοινωνικών Δικτύων βασίζεται
στις τρεις (3) επιμέρους παραδοχές, ως εξής:
• Πραγματεύεται τις διαρθρωτικές σχέσεις μεταξύ των υπό μελέτη
οντοτήτων/δρώντων (κόμβοι). Οι διαρθρωτικές αυτές σχέσεις εξυπηρετούν στην
βαθύτερη μελέτη και κατανόηση συμπεριφορών των οντοτήτων, σε αντίθεση με
άλλες τετριμμένες ιδιότητες (π.χ. δημογραφικά χαρακτηριστικά οντοτήτων).
• Επιδρά στη δημιουργία αντιλήψεων αλλά και στη λήψη αποφάσεων. Η μελέτη
ιδίως των κατευθυνόμενων συνδέσεων μπορεί να βοηθήσει στην αναγνώριση
των χρηστών ενός δικτύου που επιδρούν σε άλλους καθώς και τον τρόπο που
αυτό επιτυγχάνεται. Ωστόσο ακόμα και η μελέτη μη-κατευθυνόμενων
συνδέσεων παρέχει ενδείξεις ως προς τον τρόπο που λειτουργεί και εξελίσσεται
ένα δίκτυο μέσω της σύνθετης ροής των πληροφοριών. 6
• Συνιστά μία δυναμική διεργασία μελέτης των κοινωνικών δικτύων καθώς τα
δίκτυα δεν λαμβάνονται υπ’ όψιν ως στατικές δομές, αφού οι σχέσεις μεταξύ των
οντοτήτων συνεχώς αλλάζουν και εξελίσσονται. Έτσι, με την αξιοποίηση της

6
Δηλαδή, αξιοποιώντας την ανάλυση των κοινωνικών δικτύων μπορεί κανείς να αναγνωρίσει
πρότυπα/μοτίβα (patterns) μεταξύ των συνδέσεων ενός δικτύου και μέσω αυτών να γίνει αντιληπτή
η συμπεριφορά των χρηστών ή/και ο τρόπος μεταξύ τους αλληλεπίδρασης.

22
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

ανάλυσης των κοινωνικών δικτύων δύναται να μελετηθεί η εξέλιξη του δικτύου


συναρτήσει του χρόνου. 7
3.2. Τα Κοινωνικά Μέσα (Social media)
Στον ψηφιακό κόσμο, ο όρος «κοινωνικό δίκτυο» χρησιμοποιείται ευρέως για να
υποδείξει την παροχή υπηρεσιών με χρήση τεχνολογιών δικτύων από μία κοινότητα
ανθρώπων με κοινά ενδιαφέροντα.
Συναφώς, ως υπηρεσία κοινωνικής δικτύωσης θεωρείται μια πλατφόρμα στην
οποία «χτίζονται» κοινωνικά δίκτυα ή κοινωνικές σχέσεις μεταξύ ανθρώπων που
μοιράζονται ενδιαφέροντα, δραστηριότητες, υπόβαθρα ή έχουν σχέσεις στην
πραγματική ζωή (Πετροπούλου, 2015).
Τα μέσα κοινωνικής δικτύωσης (social media) έχουν πλέον εισχωρήσει σε βάθος
στην καθημερινότητα των χρηστών, επηρεάζοντας τις άτυπες αλληλεπιδράσεις των
ανθρώπων, τις θεσμικές δομές αλλά και τις επαγγελματικές συνήθειες. Οι όροι
«μέσα κοινωνικής δικτύωσης» (social media) και «κοινωνικά δίκτυα» (social
networking) χρησιμοποιούνται ευρέως και αναφέρονται με την έννοια της
«κοινωνικής δικτύωσης».
Τα social media αφορούν στα εργαλεία με τα οποία διαμοιράζεται η πληροφορία
και το περιεχόμενο, ενώ το social networking αφορά στη διαδικασία μέσω της
οποίας δημιουργούνται και αξιοποιούνται οι ομάδες/κοινότητες για την
διασύνδεση χρηστών με κοινά ενδιαφέροντα. Σύμφωνα με τη Wikipedia (2010), o
όρος «social media» αναφέρεται στα μέσα που χρησιμοποιούνται για την κοινωνική
αλληλεπίδραση, παρέχοντας υψηλή προσβασιμότητα και τεχνικές δυνατότητες
έκδοσης και δημοσίευσης.
Όπως είναι γνωστό, τα μέσα κοινωνικής δικτύωσης αξιοποιούν τεχνολογίες που
βασίζονται στο διαδίκτυο (web-based) με στόχο την επικοινωνία και την
ενεργοποίηση του ευρύτερου κοινωνικού διαλόγου. Ο κάθε χρήστης έχει τη
δυνατότητα να δημοσιεύει περιεχόμενο αλλά και να έχει διαδραστικότητα με το
ήδη δημοσιευμένο περιεχόμενο ή άλλους χρήστες. Άλλωστε, κοινό σημείο
αναφοράς τους αποτελεί η δυνατότητα που παρέχουν στους χρήστες να
αλληλεπιδρούν μεταξύ τους. Κατά αυτόν τον τρόπο, τα κοινωνικά μέσα δικτύωσης
φαίνεται να έχουν επιδράσει στους κανόνες της κοινωνικής αλληλεπίδρασης
Ο όρος «μέσα κοινωνικής δικτύωσης» σύμφωνα με τους Dabbagh και Reo (2011)
είναι ένας όρος του 21ου αιώνα που χρησιμοποιείται για να καθορίσει ευρύτατα μια
ποικιλία εργαλείων ή τεχνολογιών που τονίζουν τις κοινωνικές πτυχές του
διαδικτύου ως κανάλι επικοινωνίας, συνεργασίας και δημιουργικής έκφρασης. Τα
κοινωνικά μέσα δικτύωσης συνδέουν ομάδες ατόμων όχι μόνο κοινωνικά αλλά και
7
Πιο συγκεκριμένα, συμβάλει στη μελέτη της εξέλιξης ενός δικτύου συναρτήσει του χρόνου με
απώτερο στόχο την πρόβλεψη της πορείας του. Αυτό μπορεί να συνεισφέρει στην λήψη
προληπτικών αποφάσεων

23
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

γεωγραφικά. Μέσω αυτών, υπάρχει η δυνατότητα οι χρήστες να μοιραστούν ιδέες,


συμπάθειες/αντιπάθειες κ.λπ. με τον κόσμο γενικότερα ή με κάποια οικεία ομάδα
χρηστών, παρέχοντας στους χρήστες δυνατότητες που τα παραδοσιακά μέσα δεν
μπορούσαν να δώσουν.
Επιπροσθέτως, πρέπει να σημειωθεί ότι τα κοινωνικά μέσα εξαρτώνται, μεταξύ
άλλων, από τα κινητά και τις τεχνολογίες διαδικτύου που δημιούργησαν
διαδραστικές πλατφόρμες μεταξύ ατόμων αλλά και κοινοτήτων, με στόχο να
μοιράζονται, να συνδημιουργούν, να συζητούν και να τροποποιούν περιεχόμενο
που παράγεται από χρήστες. Η άμεση πρόσβαση της πληροφορίας στους χρήστες
των κοινωνικών δικτύων έχει ως αποτέλεσμα να μην επηρεάζονται οι καταναλωτές
πλέον τόσο από τα παραδοσιακά μέσα διαφήμισης, όπως η τηλεόραση, το
ραδιόφωνο και ο Τύπος, αλλά να στρέφονται περισσότερο σε αυτές που
εμφανίζονται στις πλατφόρμες κοινωνικών δικτύων. Τα κοινωνικά μέσα διαφέρουν
από τα παραδοσιακά ή βιομηχανικά σε αρκετούς τομείς, όπως στην ποιότητα, στην
απήχηση, στη συχνότητα, στη χρηστικότητα και στη μονιμότητα.
Η υψηλή διείσδυση, που πλέον ισχύει για τις περισσότερες ηλικιακές κατηγορίες
και όχι μόνο τους νέους, σε συνδυασμό με τη διαφορετικότητα κάθε τέτοιου
δικτύου (π.χ. Facebook, Twitter, YouTube, LinkedIn, Instagram κ.λπ.) προσφέρουν
ποικίλες δυνατότητες αξιοποίησής τους στους τομείς του μάρκετινγκ και των
πωλήσεων.
Για τα στελέχη, οι πλατφόρμες των κοινωνικών μέσων δύναται να διευκολύνουν το
μετασχηματισμό της επιχείρηση αναφορικά με τη διαχείριση των πελατειακών
σχέσεων, τα δικαιώματα του brand και τις επιχειρηματικές διαδικασίες. Τα στελέχη
των επιχειρήσεων μπορούν να παρακολουθούν τις μετρήσεις των κοινωνικών
μέσων ενημέρωσης με σκοπό να βελτιώσουν την απόδοση των επιχειρήσεων. Έχουν
αλλάξει σε τέτοιο βαθμό τους βασικούς κανόνες αλληλεπίδρασης που η oneway
επικοινωνία θεωρείται παλιομοδίτικη. Οι χρήστες είναι πλέον σε θέση να
επικοινωνούν με άλλους χρήστες σε 24/7 βάση στον ψηφιακό χώρο, όπου μια
πληθώρα νέων εργαλείων επιτρέπει η επικοινωνία μεταξύ των χρηστών να γίνεται
σε πραγματικό χρόνο. Ταυτόχρονα, τα κοινωνικά μέσα έχουν δημιουργήσει και νέα
κανάλια επικοινωνίας για τις εταιρίες και επιτρέποντας να προσεγγίζουν ήδη
υπάρχοντες ή δυνητικούς πελάτες, να διαμοιράζουν το περιεχόμενό τους, να
προωθούν τα προϊόντα και τις υπηρεσίες τους, να παρακολουθούν τα brands και τη
φήμη τους, καθώς και να βελτιώνουν τις πρακτικές διατήρησης και απόκτησης
πελατών (Nwokah & Aeene, 2017).

3.3. Τα δημοφιλέστερα είδη των ιστότοπων κοινωνικής δικτύωσης


Υπάρχουν πολλές μορφές κοινωνικών μέσων, όπως τα blogs, τα microblogs, τα
wikis, οι ιστότοποι κοινωνικής δικτύωσης, ιστότοποι κοινής χρήσης φωτογραφιών,
ανταλλαγή άμεσων μηνυμάτων, ιστότοποι κοινής χρήσης βίντεο και πολλά άλλα.

24
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Αναφορικά με την δημοτικότητα των κοινωνικών δικτύων, σημειώνεται ότι η


δημοτικότητα αυτών ποικίλλει και διαφοροποιείται ανά τακτά χρονικά διαστήματα,
σύμφωνα με τις τάσεις που κυριαρχούν, με κάποια από τα μέσα κοινωνικής
δικτύωσης να χάνονται και νέα να εμφανίζονται στο προσκήνιο. Ορισμένοι από τους
πιο δημοφιλείς ιστότοπους κοινωνικής δικτύωσης, οι οποίοι παρατίθενται
συνοπτικά στη συνέχεια, είναι το Facebook, το YouTube, το Instagram, το Twitter
και το LinkedIn

Εικόνα 8: Απεικόνιση δημοφιλών μέσων κοινωνικής δικτύωσης παγκοσμίως,


βάσει του αριθμού ενεργών χρηστών (Ιούλιος 2020, Statista)

3.3.1. Facebook
Η λειτουργία του ξεκίνησε τον Φεβρουάριο του 2004 από τον τότε
φοιτητή του Harvard, Mark Zuckerberg. Ο αρχικός προορισμός του
Facebook ήταν για να συνδέει «συμμαθητές/συμφοιτητές» από
σχολεία και πανεπιστήμια του πανεπιστημίου του Harvard.
Ακολούθως άρχισε να επεκτείνεται παρέχοντας σε όλους τους
χρήστες τη δυνατότητα δημιουργίας προφίλ με τα προσωπικά τους στοιχεία και
μετατράπηκε σε ένα εργαλείο μέσω του οποίου συνδέονται φίλοι, συνεργάτες και
άλλοι άνθρωποι για να επικοινωνήσουν και να συγκροτήσουν ομάδες κοινού
ενδιαφέροντος.
Οι δυνατότητες που παρέχονται μέσω του Facebook είναι πολλές: επικοινωνία με
άλλους χρήστες, δικτύωση, ελεύθερη πρόσβαση σε φωτογραφίες, βίντεο και γενικά
σε υλικό που αναρτούν άλλοι χρήστες, γνωριμίες, online παιχνίδια, ενημέρωση
μέσω του newsfeed για τις πρόσφατες κινήσεις των φίλων τους κ.λπ.

25
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Σύμφωνα με τα στατιστικά του 2ου τετραμήνου του 2020 (Statista) υπήρχαν πάνω
από 2.6 δισεκατομμύρια μέλη μηνιαίως στο Facebook. Στην Ευρώπη, σύμφωνα με
το Search Engine Journal, το Facebook χρησιμοποιείται από 406 εκατομμύρια
χρήστες. Τέλος, το 42% των επιχειρήσεων θεωρούν σημαντικό εργαλείο το
Facebook για την επιχείρησή του.
3.3.2. Twitter
Δημιουργήθηκε τον Μάρτιο το 2006 με κύριο χαρακτηριστικό
ότι δε δέχεται μηνύματα μεγαλύτερα των 140 χαρακτήρων,
γνωστά ως «tweets». Τα μέλη του μπορούν να ακολουθούν τα
μηνύματα άλλων χρηστών καθώς και να απαντούν σε αυτά.
Εμπίπτει στην κατηγορία των ιστοσελίδων δημιουργίας micro-
blogging. Από την έναρξη του έχει γίνει ένας από τους δέκα (10) κορυφαίους σε
επισκεψιμότητα ιστότοπους και περιγράφεται ως «το sms του διαδικτύου». Οι
χρήστες του ξεπερνούν τα 336 εκατομμύρια μηνιαίως σε παγκόσμιο επίπεδο
(statista.com, 2019). Αξίζει να σημειωθεί ότι, σύμφωνα με το eMarketer το 66% των
επιχειρήσεων που απασχολούν πάνω από 100 άτομα διαθέτουν έναν ενεργό
λογαριασμό στο Twitter.
3.3.3. YouTube
Δημιουργήθηκε τον Φεβρουάριο του 2005
και τον Νοέμβριο του 2006 εξαγοράστηκε από
την Google. Αποτελεί έναν ισχυρό ιστότοπο, ο
οποίος προσφέρει νέους τρόπους δημιουργίας και διαμοιρασμού βίντεο και
μουσικής.
Οι χρήστες εκτός από το να παρακολουθούν και να «ανεβάζουν» βίντεο στην σελίδα
έχουν την δυνατότητα να σχολιάσουν βίντεο και τραγούδια που ακούν και να
δείξουν αν τους αρέσουν ή όχι, απλά πατώντας ένα κουμπί. Το YouTube
εκμεταλλευόμενο την δημοτικότητά του (οι μηνιαίες προβολές ξεπερνούν τις 92
δισεκατομμύρια) έχει αναπτύξει δράσεις μάρκετινγκ προσφέροντας την δυνατότητα
στις επιχειρήσεις να δημιουργούν το δικό τους κανάλι και να διαφημίζονται μέσα
από αυτό 8.
3.3.4. Instagram
Δημιουργήθηκε από τους Kevin Systrom και Mike Krieger και
ξεκίνησε τον Οκτώβριο του 2010 ως δωρεάν εφαρμογή για
κινητά αποκλειστικά για το λειτουργικό σύστημα iOS. Είναι
ιδιοκτησία του Facebook (βλ. παραπάνω). Αποτελεί μια δωρεάν
εφαρμογή κοινωνικής δικτύωσης που δίνει την δυνατότητα

8
Το 94% των 100 κορυφαίων διαφημιστών, χρησιμοποιούν το YouTube για να προωθήσουν τις
καμπάνιες τους.

26
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

επεξεργασίας και κοινοποίησης φωτογραφιών και βίντεο στο διαδίκτυο. Οι χρήστες


μπορούν να μοιράζονται φωτογραφίες και βίντεο με τους ακολούθους τους ή με
επιλεγμένη ομάδα φίλων, να σχολιάζουν και να δηλώνουν εάν μια δημοσίευση τους
αρέσει.
Τα μέλη του ξεπερνούν τo 1 δισεκατομμύριο μηνιαίως, ενώ ημερήσια χρήση του
Instagram πραγματοποιούν περίπου 500 εκατομμύρια. Σύμφωνα με τα στατιστικά
στοιχεία του Instagram, το 80% των χρηστών προέρχεται από χώρες εκτός των
Ηνωμένων Πολιτειών. Αναφορικά με το φύλο των ενήλικων χρηστών του στις
Ηνωμένες Πολιτείες παρατηρείται ότι το 38% αποτελείται από γυναίκες και το 26%
από άνδρες.
Κάθε μέλος του Instagram έχει δικό του προφίλ, το οποίο μπορεί να είναι είτε
ιδιωτικό είτε δημόσιο. Στο προφίλ του μπορεί να ανεβάζει φωτογραφίες ή μικρής
διάρκειας βίντεο, τα οποία μπορεί και να επεξεργάζεται πριν την ανάρτησή τους. Το
περιεχόμενο αυτό μπορεί να κοινοποιείται και σε άλλους ιστοχώρους, όπως το
Facebook. Επίσης, μπορεί να γράψει ένα σύντομο βιογραφικό ή να προσθέσει
κάποιους συνδέσμους που οδηγούν σε άλλα sites.
3.3.5. LinkedIn
Αποτελεί μία σελίδα κοινωνικής δικτύωσης επαγγελματιών,
όπου ο κάθε χρήστης έχει τη δυνατότητα να ανεβάσει στοιχεία
για να συντάξει το βιογραφικό του και στην συνέχεια να
συνδεθεί με άλλους χρήστες, δημιουργώντας το δικό του
δίκτυο. Τα μέλη μπορούν να προσκαλέσουν γνωστούς, φίλους,
συγγενείς κ.λπ. για να αναπτύξουν το δίκτυό τους. Με τον τρόπο αυτό
αναπτύσσεται μία κοινότητα άμεσων και έμμεσων συναδέλφων, διευκολύνοντας τα
μέλη του να διατηρήσουν επαγγελματικές σχέσεις και να δικτυωθούν ακόμα και
στην εύρεση εργασίας.
Παρότι η βασική του εκδοχή είναι δωρεάν για όλους υπάρχουν και χρεώσεις για
επιπλέον δυνατότητες. Ο ιστότοπος είναι διαθέσιμος σε 24 γλώσσες. Σήμερα το
LinkedIn διαθέτει 675 εκατομμύρια μέλη, από τα οποία τα 167 εκατομμύρια
προέρχονται από τις Ηνωμένες Πολιτείες, γεγονός που δηλώνει ότι το 70% των
χρηστών βρίσκεται εκτός των Ηνωμένων Πολιτειών. Το 40% των χρηστών του
LinkedIn κάνει ημερήσια χρήση αυτού.

3.4. Αντιδράσεις Χρηστών στα Κοινωνικά Δίκτυα: Likes, Comments & Shares
Καθώς τα κοινωνικά μέσα έχουν γίνει μέρος της καθημερινότητας, τα brands
αναγνωρίζουν την επιταγή για πιο εκτεταμένη χρήση τους και επιδιώκουν την
οικοδόμηση στενότερων σχέσεων με τους πελάτες τους. H δημιουργία
περιεχομένου στα μέσα κοινωνικής δικτύωσης αποτελεί λοιπόν η προτεραιότητά
τους (EIU, 2007; Baird & Parasnis, 2011).

27
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Tο περιεχόμενο έχει τη δυνατότητα να προσελκύσει νέους πελάτες και να


υποστηρίξει τη θετική στάση τους απέναντι στην επωνυμία (Kumar, Bezawada,
Rishika, Janakiraman, & Kannan, 2016; Mosteller & Poddar 2017; Phua and Anh,
2016). Τα likes («μου αρέσει»), τα comments (σχόλια) και τα shares (κοινοποιήσεις)
θεωρούνται σημαντικά μέτρα για την αφοσίωση των πελατών στο brand (Stephen,
Sciandra, & Inman 2015).
Η έρευνα των Lee, Hosanagar και Nair (2018) δείχνει ότι συμπεριλαμβάνοντας
ευρέως χρησιμοποιούμενο περιεχόμενο σχετικό με τον χαρακτήρα μίας επωνυμίας,
όπως το χιούμορ και το συναίσθημα, σχετίζεται με υψηλότερα επίπεδα αφοσίωσης
των χρηστών, όπως εκδηλώνονται μέσω likes, comments και shares, σε ένα μήνυμα.
Από την άλλη, διαπιστώνεται ότι η χρήση άμεσα ενημερωτικού περιεχομένου σε
αναρτήσεις επωνυμιών, όπως αναφορές σε τιμές και προσφορές, σχετίζεται με
χαμηλότερα επίπεδα αφοσίωσης όταν περιλαμβάνονται σε μεμονωμένα μηνύματα
ενώ σχετίζεται με υψηλότερα επίπεδα όταν παρέχονται σε συνδυασμό με
χαρακτηριστικά σχετικά με τη προσωπικότητα της εκάστοτε επωνυμίας. Όσον
αφορά ορισμένο άμεσα ενημερωτικό περιεχόμενο ωστόσο, όπως προσφορές και
προωθήσεις, βρέθηκε ότι οδηγεί στην προσέλκυση νέων χρηστών (click-throughs)
(Lee, Hosanagar, & Nair, 2018).
Οι εταιρείες πρέπει να δίνουν ιδιαίτερη προσοχή στο περιεχόμενο το οποίο
λαμβάνει περισσότερα reactions «Μου αρέσει», καθώς κάνοντας σχετικό «κλικ»»,
οι χρήστες δηλώνουν ότι θα ήθελαν να δουν περισσότερα από τον συγκεκριμένο
τύπο περιεχομένου. Επιπλέον θα πρέπει να παρακολουθούν εξίσου προσεκτικά και
τα σχόλια. Οι χρήστες σχολιάζουν τις δημοσιεύσεις ενός brand για να λάβουν
περισσότερες πληροφορίες σχετικά με το προϊόν πριν κάνουν μια αγορά.
Κάθε πλατφόρµα κοινωνικής δικτύωσης παίζει σηµαντικό ρόλο στην διάχυση, στη
λήψη και στην ανταλλαγή πληροφοριών χωρίς περιορισμούς µε δεδομένο ότι η ροή
των πληροφοριών είναι αµφίδρομη. Τα µέσα κοινωνικής δικτύωσης έχουν
τοποθετήσει τους καταναλωτές στο επίκεντρο. Παράλληλα, τα κοινωνικά µέσα
µπορούν να χρησιµοποιηθούν αποτελεσµατικά από τις επιχειρήσεις για να
δηµιουργήσουν µια ισχυρή και διαρκή εντύπωση στο µυαλό των ανθρώπων για να
την κάνουν αξέχαστη.
Καµία επιχείρηση δεν µπορεί πλέον να αγνοήσει τα κοινωνικά µέσα. Η κοινωνική
επιρροή παίζει πάντα σηµαντικό ρόλο στις αποφάσεις αγοράς των πελατών. Αλλά
τώρα όλο και περισσότεροι άνθρωποι στηρίζονται στα κοινωνικά µέσα ενηµέρωσης
στο διαδίκτυο για να αναζητήσουν παραποµπές και συστάσεις από άλλους,
ζητώντας/απαντώντας σε ερωτήσεις και µοιράζοντας τις εµπειρίες τους.
Έτσι, η συμμετοχή των χρηστών στα μέσα κοινωνικής δικτύωσης καθώς και η
αλληλεπίδραση τους με τον σωστό τρόπο αποτελεί μια μεγάλη πρόκληση για τα
brands (Vivek, Beatty, & Morgan, 2012).

28
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

4. ΑΝΑΛΥΣΗ ΣΥΝΑΙΣΘΗΜΑΤΟΣ (SENTIMENT ANALYSIS)


H ανάγκη για γνωστοποίηση του τι σκέφτονται οι άλλοι έχει οδηγήσει στην
ανάπτυξη της μεθόδου «Ανάλυσης Συναισθήματος» (Sentiment Analysis). Η
μέθοδος αυτή εξάγει, αναλύει και αξιολογεί τις απόψεις που προέρχονται από
κείμενο, χρησιμοποιώντας ηλεκτρονικούς υπολογιστές και στατιστικούς
αλγόριθμους.
H ανάλυση συναισθήματος αποτελεί ουσιαστικά ένα είδος υπολογιστικής μελέτης
κειμένου φυσικής γλώσσας, με κύριο στόχο να αναγνωρίσει την πολικότητα του
συναισθήματος, τον βαθμό έντασης και τα ζητήματα που αυτό έχει εφαρμογή (Liu,
2011). Βασιζόμενοι στην μέθοδο αυτή, αναπτύσσεται επομένως η δυνατότητα να
εξαχθούν πληροφορίες οι οποίες αφορούν τη συναισθηματική κατάσταση των
χρηστών μέσα από τα διάφορα κείμενα που συγγράφουν για παράδειγμα
καθημερινά στα μέσα κοινωνικής δικτύωσης. Η ανάλυση αυτή έχει μεγάλο
αντίκτυπο στο χώρο της διοίκησης, στα οικονομικά, στο μάρκετινγκ, στην πολιτική,
και σε άλλα κοινωνικά ζητήματα, όπου δίνεται η δυνατότητα στους χρήστες να
εκφράσουν ελεύθερα τα αισθήματα, τις σκέψεις και την άποψή τους.
Στις επόμενες ενότητες θα ερευνηθούν ο ορισμοί και οι έννοιες που σχετίζονται με
την μέθοδο Ανάλυσης Συναισθήματος και θα ακολουθήσει μια σύντομη ιστορική
αναδρομή της μεθόδου. Στη συνέχεια, θα παρουσιαστούν οι διαδικασίες με τις
οποίες λαμβάνει χώρα η μέθοδος, καθώς και οι κυριότεροι αλγόριθμοι που
χρησιμοποιεί.

4.1. Βασικές έννοιες & ορισμοί («Ανάλυση Συναισθήματος», «Εξόρυξη


Γνώμης» και «Εξόρυξη κειμένου»)
Η παρουσίαση των ορισμών που σχετίζονται με τη μέθοδο της Ανάλυσης
Συναισθήματος είναι απαραίτητη προκειμένου να γίνει πλήρως κατανοητή αυτή η
τεχνική.
Οι λέξεις που χρησιμοποιούνται στην καθημερινή ζωή αντικατοπτρίζουν σκέψεις
και συναισθήματα. Η Ανάλυση Συναισθήματος ορίζεται ως μια μέθοδος ανάλυσης
κειμένου, η οποία μπορεί να εξάγει και να αναλύσει λέξεις/ φράσεις που
εμπεριέχουν κάποια άποψη (opinion), να ανιχνεύσει αρνητικές και θετικές απόψεις
και να μετρήσει πόσο θετικά ή αρνητικά εκλαμβάνεται ένα θέμα, προκειμένου να
διευκολύνει τη λήψη αποφάσεων (Khan, Atique & Thakare, 2015).
Οι όροι Ανάλυση Συναισθήματος και Εξόρυξη Γνώμης συχνά χρησιμοποιούνται
εναλλάξ τόσο στον ακαδημαϊκό όσο και στον βιομηχανικό κόσμο. Παρ’ όλα αυτά, θα
πρέπει να αποσαφηνιστούν οι λεπτές διαφορές ανάμεσα στους δύο αυτούς όρους.
Από τη μια πλευρά, ο όρος «συναίσθημα» αναφέρεται κυρίως σε υποκειμενικά
αισθήματα και όχι σε γεγονότα και μπορεί να περιλαμβάνει τόσο τη νοοτροπία όσο

29
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

και τα αισθήματα και τη γνώμη ενός ατόμου (Mullen, 2017). Από την άλλη πλευρά,
ο όρος «άποψη» αναφέρεται σε μια γνώμη ή μια κρίση που διαμορφώνεται στο
μυαλό ενός ατόμου σχετικά με ένα συγκεκριμένο θέμα. Οι διαφορές ανάμεσα στους
δύο όρους μπορεί να είναι ελάχιστες και κάθε όρος περιλαμβάνει ένα στοιχείο του
άλλου. Γι’ αυτό το λόγο, όταν ερμηνεύονται ευρέως, η Ανάλυση Συναισθήματος και
η Εξόρυξη Γνώμης αναφέρονται στο ίδιο πεδίο έρευνας (Pang & Lee, 2008).
Εντούτοις, ο όρος Ανάλυση Συναισθήματος φαίνεται να χρησιμοποιείται
περισσότερο από τον όρο Εξόρυξη Γνώμης απ’ τους ερευνητές (Pang , Lee, &
Vaithyanathan, 2002).
Η Ανάλυση Συναισθήματος είναι επίσης μια σημαντική συνιστώσα της «Εξόρυξης
Κειμένου (Text Mining)». Η Εξόρυξη Κειμένου είναι ένα διεπιστημονικό ερευνητικό
πεδίο, το οποίο συνδυάζει μηχανική μάθηση, στατιστική, γλωσσολογία
υπολογιστών, ανάκτηση πληροφοριών και εξόρυξη δεδομένων (Gupta & Lehal,
2009). Είναι μια αυτοματοποιημένη διαδικασία η οποία αποκαλύπτει νέες γνώσεις,
μοτίβα και σχέσεις που προκύπτουν από μη δομημένα δεδομένα κειμένου. Κατά
την διαδικασία «Εξόρυξης Κειμένου», τα έγγραφα κειμένου προ-επεξεργάζονται
προκειμένου να γίνουν δομημένες αναπαραστάσεις και κατόπιν εφαρμόζονται
τεχνικές εξόρυξης κειμένου για τον προσδιορισμό μοτίβων και σχέσεων. Τα
αποτελέσματα της ανάλυσης μπορούν ακόμη να απεικονιστούν ώστε να
επιτρέψουν καλύτερη κατανόηση και περαιτέρω ερμηνεία.
Η ομοιότητα ανάμεσα στην Ανάλυση Συναισθήματος και στην Εξόρυξη Κειμένου
έγκειται στο ότι η τεχνική Ανάλυσης Συναισθήματος ξεκινά επίσης με έγγραφα
κειμένου. Η διάφορά τους όμως συναντάται στο ότι η Ανάλυση Συναισθήματος
συχνά απαιτεί συγκεκριμένους τύπους κειμένων. Πιο συγκεκριμένα, τα κατάλληλα
κείμενα για την Ανάλυση Συναισθήματος πρέπει να εμπεριέχουν απόψεις, όπως
σχόλια στα κοινωνικά δίκτυα (π.χ. tweets), αξιολογήσεις και κριτικές πελατών,
κείμενα σε blogs κα.

4.2. Σύντομη Ιστορική Αναδρομή


Η μέθοδος της Ανάλυσης Συναισθήματος έχει γίνει δημοφιλής από τις αρχές του
2000, ενώ πρόσφατα έχουν γνωρίσει μεγάλη άνοδο οι έρευνες που εφαρμόζουν την
τεχνική αυτή (Liu, Law, Rong, Li, & Hall, 2013; Pekar & Ou, 2008; Medhat, Hassan, &
Korashy, 2014).
Εντούτοις, η ανάπτυξη της μεθόδου Ανάλυσης Συναισθήματος μπορεί να εντοπιστεί
στις αρχές της δεκαετίας του 1980, όταν ένας από τους πρωτοπόρους στον τομέα
της μηχανικής γλωσσολογίας και τεχνητής νοημοσύνης, ο καθηγητής Jaime
Carbonell, δημοσίευσε το βιβλίο του με τίτλο «Υποκειμενική κατανόηση:
Υπολογιστικά μοντέλα συστημάτων πεποιθήσεων» (1981). Στο βιβλίο αυτό ο
Carbonnell εισήγαγε μια θεωρία υποκειμενικής κατανόησης και ανέπτυξε ένα
διαδικαστικό μοντέλο με όνομα POLITICS, που βασιζόταν στην θεωρία αυτή και το

30
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

οποίο εφάρμοσε κατόπιν σε ένα υπολογιστικό σύστημα. Ουσιαστικά αυτό είναι ένα
από τα θεμελιώδη έργα αναφορικά με τη μέθοδο Ανάλυσης Συναισθήματος.
Λίγο αργότερα, το 1983, ο Wilks και ο Bien εισήγαγαν ένα μοντέλο πεποιθήσεων για
την κατανόηση των γλωσσών από τα υπολογιστικά συστήματα. Ακόμη περιέγραψαν
ένα σύστημα προκειμένου οι πεποιθήσεις να περιλαμβάνονται στον μηχανισμό του
υπολογιστικού περιβάλλοντος. Επίσης, ανακάλυψαν ότι η αντίληψη γύρω από ένα
συγκεκριμένο ζήτημα/ άτομο μπορεί να είναι μια παρενέργεια όταν οι πεποιθήσεις
εμπεριέχονται στον υπολογιστικό προγραμματισμό.
Ακόμη, όπως έχει αναφερθεί και στην προηγούμενη ενότητα, η Ανάλυση
Συναισθήματος έχει ισχυρή συσχέτιση με την μέθοδο Εξόρυξης Κειμένου. Ως εκ
τούτου, η Ανάλυση Συναισθήματος έχει συνδεθεί αρκετά με διάφορες έρευνες στο
πεδίο της Εξόρυξης Κειμένου που έλαβαν χώρα μετά το 1990. Για παράδειγμα, ο
Wiebe (1994) παρουσίασε έναν αλγόριθμο για να εντοπίζει την οπτική γωνία σε
αφηγηματικά διηγήματα τρίτων. Επιπλέον, ο Sack (1994) πρότεινε μια μέθοδο για
την εξόρυξη των απόψεων που εμπεριέχονται σε μεγαλύτερα σε έκταση κείμενα, η
οποία θεωρήθηκε χρήσιμη για εργασίες ανάκτησης πληροφοριών, καθώς και για
την εξαγωγή και διατύπωση απόψεων από ένα σύνολο κειμένων.
Μετέπειτα, στις αρχές της δεκαετίας του 2000, ερευνητές ξεκίνησαν να εξετάζουν
τα συναισθήματα που εμπεριέχονταν σε κείμενα. Πιο αναλυτικά, ο Kantrowitz
(2003) ανέπτυξε μια συσκευή για την ανάλυση εγγράφων κειμένου ανάλογα με το
συναίσθημα. Σύμφωνα με αυτήν τη μέθοδο, μια βαθμολογία εκχωρείται σε κάθε
όρο που εμπεριέχει συναίσθημα σε ένα έγγραφο και μια συνολική βαθμολογία
υπολογίζεται με βάση τις βαθμολογίες κάθε όρου. Το έγγραφο στη συνέχεια
ταξινομείται σύμφωνα με τη συνολική αυτή βαθμολογία. Την ίδια χρονιά
εμφανίστηκαν και οι πρώτοι ορισμοί των όρων Ανάλυση Συναισθήματος (Nasukawa
& Yi, 2003) και Εξόρυξη Γνώμης (Dave, Lawrence, & Pennock, 2003).
Ακόμη, οι Hu και Liu (2004) ήταν ανάμεσα στους πρώτους ερευνητές που
εφάρμοσαν την μέθοδο εξόρυξης κειμένου σε διαδικτυακές αξιολογήσεις
προϊόντων από πελάτες. Η μελέτη τους είχε ως αντικείμενο τη δημιουργία
περιλήψεων των διαδικτυακών αξιολογήσεων των πελατών, οι οποίες να βασίζονται
στα χαρακτηριστικά των προϊόντων. Πιο συγκεκριμένα, στα πλαίσια της έρευνας, το
επίπεδο θετικού ή αρνητικού συναισθήματος αξιολογούνταν και συνοψιζόταν για
κάθε χαρακτηριστικό του προϊόντος που περιλαμβάνονταν στην αξιολόγηση. Η
μελέτη αυτή είχε καθοριστική συνεισφορά καθώς εισήγαγε την μέθοδο Ανάλυσης
Συναισθήματος στον τομέα του μάρκετινγκ , χρησιμοποιώντας πραγματικές
διαδικτυακές αξιολογήσεις, ανοίγοντας παράλληλα το δρόμο για μεταγενέστερες
εφαρμογές της μεθόδου σε διάφορους τομείς, όπως η φιλοξενία και ο τουρισμός.

31
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

4.3. Διαδικασία Ανάλυσης Συναισθήματος


Παρά τις διαφοροποιήσεις που μπορεί να υπάρχουν στις διαδικασία εκτέλεσης της
μεθόδου Ανάλυσης Συναισθήματος, συνήθως περιλαμβάνει τέσσερα βήματα (
Εικόνα 9). Το πρώτο βήμα αφορά την προετοιμασία των δεδομένων, η οποία
περιλαμβάνει την αφαίρεση των μη σχετικών δεδομένων (π.χ. σημεία στίξης και
εικονίδια) και τον μετασχηματισμό των δεδομένων σε μια ομοειδή μορφή (Liu,
2012). Το δεύτερο βήμα περιλαμβάνει την εξαγωγή των χαρακτηριστικών των
δεδομένων και το τρίτο βήμα αφορά την κατηγοριοποίηση των εξαγόμενων
δεδομένων σε συγκεκριμένες κατηγορίες (π.χ. θετική ή αρνητική). Το τέταρτο βήμα
αφορά την απεικόνιση των ευρημάτων σε μια διαδραστική οπτική παρουσίαση.
Τα βήματα 2 και 3 αποτελούν τις πιο περίπλοκες διαδικασίες στην μέθοδο
Ανάλυσης Συναισθήματος, καθώς απαιτούν σημαντική γνώση σχετικά με την
επεξεργασία της φυσικής γλώσσας, τα μαθηματικά και την επιστήμη των
υπολογιστών. Οι τεχνική μηχανικής μάθησης (machine learning) και η τεχνική
βασισμένη σε λεξικό (lexicon-based) είναι οι δύο συνηθισμένες προσεγγίσεις για τη
εκτέλεση των βημάτων αυτών.
Από την σχετική λογοτεχνία προκύπτει ακόμη ότι υπάρχουν διάφορα εργαλεία
διαθέσιμα για την εκτέλεση της μεθόδου Ανάλυσης Συναισθήματος, όπως π.χ. τα
General Inquirer (GI), Linguistic Inquiry and Word Count (LIWC), Wordnet and
SentiWordNet, Natural Language Processing (NLP) and Leximancer (Mullen, 2017).
Με δεδομένο επίσης ότι καθένα από τα προαναφερθέντα εργαλεία έχει τον δικό
του αλγόριθμο, η επόμενη ενότητα θα εισάγει τους κυριότερους αλγόριθμους που
σχετίζονται με την μέθοδο Ανάλυσης Συναισθήματος.

Εικόνα 9: Διαδικασία εκτέλεσης της μεθόδου Ανάλυσης Συναισθήματος

32
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

4.4. Αλγόριθμοι για την Ανάλυση Συναισθήματος


Όπως αναφέρθηκε και στην προηγούμενη ενότητα (Εικόνα 9), η επιλογή
χαρακτηριστικών στην ταξινόμηση συναισθημάτων (Βήμα 2) και οι τεχνικές
ταξινόμησης συναισθημάτων (Βήμα 3) είναι τα πιο σημαντικά βήματα στη
διαδικασία ανάλυσης συναισθήματος και περιλαμβάνουν αρκετά περίπλοκους
αλγόριθμους. Ως εκ τούτου, αυτή η ενότητα παρουσιάζει τους πιο ευρέως
χρησιμοποιούμενους αλγόριθμους σε αυτά τα δύο βήματα για την καλύτερη
κατανόηση τους.
Αναφορικά με το Βήμα 2 της διαδικασίας, οι πιο συχνά χρησιμοποιούμενες τεχνικές
είναι αυτές της σημειακής αμοιβαίας πληροφόρησης (point-wise mutual
information) και της λανθάνουσας σημασιολογικής κατάταξης (latent semantic
indexing) (Medhat, Hassan, & Korashy, 2014). Η τεχνική της σημειακής αμοιβαίας
πληροφόρησης χρησιμοποιεί την ισχύ συνύπαρξης για να καθορίσει την
αλληλεπίδραση της εξαγωγής πληροφοριών μεταξύ των χαρακτηριστικών και των
κλάσεων. Η τεχνική της λανθάνουσας σημασιολογικής κατάταξης χρησιμοποιεί
μεθόδους όπως το μοντέλο Hidden Markov και την κατανομή Latent Dirichlet για να
μειώσει το μέγεθος των δεδομένων δημιουργώντας μια μικρή ποσότητα
χαρακτηριστικών τα οποία αντιπροσωπεύουν τα αρχικά χαρακτηριστικά στα
δεδομένα (Turney, 2002; Medhat, Hassan, & Korashy, 2014).
Όσον αφορά τις διαδικασίες ταξινόμησης συναισθήματος που συναντώνται στο
Βήμα 3, οι προσέγγιση της μηχανικής μάθησης (machine learning approach) καθώς
η μέθοδος βασισμένη σε λεξικό (lexicon-based approach) χρησιμοποιούνται ευρέως
λόγω της απλής και διευρυμένης εφαρμογής τους (Medhat, Hassan, & Korashy,
2014). Η προσέγγιση της μηχανικής μάθησης επικεντρώνεται στη χρήση τυπικών
αλγορίθμων μηχανικής μάθησης με γλωσσικά χαρακτηριστικά, ενώ η προσέγγιση με
βάση το λεξικό στηρίζεται σε ένα λεξικό συναισθημάτων, το οποίο βασίζεται σε
προκαθορισμένους όρους.
Η προσέγγιση της μηχανικής μάθησης (π.χ. Naïve Bayes) περιέχει δύο μεθόδους, τις
εποπτευόμενες (supervised) και μη εποπτευόμενες μεθόδους μηχανικής μάθησης
(unsupervised learning methods). Η εποπτευόμενη μέθοδος μάθησης βασίζεται σε
μεγάλο αριθμό επισημασμένων εγγράφων εκπαίδευσης, ενώ η μη εποπτευόμενη
μέθοδος μάθησης υιοθετήθηκε όταν υπήρχαν δυσκολίες στον εντοπισμό της
επισημασμένης εκπαίδευσης.
Αναφορικά με την προσεγγίσεις που βασίζονται στο λεξικό [π.χ. μέθοδος
Conditional Random Fields (CRF)], περιλαμβάνεται η προσέγγιση που βασίζεται σε
λεξικό (dictionary-based approach) και η προσέγγιση που βασίζεται σε ένα σύνολο
λέξεων (corpus-based approach), η οποία εφαρμόζει στατιστικούς ή
σημασιολογικούς αλγόριθμους για τον προσδιορισμό της πολικότητας των
συναισθημάτων. Οι προσεγγίσεις που βασίζονται σε σύνολα λέξεων συμβάλουν

33
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

στην άμβλυνση του προβλήματος της εύρεσης λέξεων γνώμης με συγκεκριμένους


προσανατολισμούς σε ένα συγκεκριμένο πλαίσιο. Οι μέθοδοι τους εξαρτώνται από
τα συντακτικά σχέδια ή τα μοτίβα που παρατηρούνται με μια λίστα ριζών λέξεων
γνώμης που χρησιμοποιούνται για τον εντοπισμό άλλων λέξεων γνώμης από μία
μεγάλη δεξαμενή. Μία από αυτές τις μεθόδους παρουσιάστηκε από τους
Hatzivassiloglou και McKeown.
Η μέθοδος τους ξεκινά με μια λίστα με ρίζες από επίθετα γνώμης που μαζί με ένα
σύνολο γλωσσικών περιορισμών προσδιορίσουν πρόσθετες λέξεις (κυρίως επίθετα
ή επιρρήματα) και τους προσανατολισμούς τους. Για παράδειγμα ένας κανόνας
αναφέρει ότι οι σύνδεσμοι «και» συνδέουν επίθετα με τον ίδιο προσανατολισμό.
Αυτή η ιδέα ονομάζεται συνεκτικότητα συναισθημάτων, η οποία δεν είναι πάντα
συνεπής πρακτικά. Υπάρχουν επίσης αντιφατικές εκφράσεις («αλλά», ωστόσο) που
υποδεικνύονται ως αλλαγές γνώμης. Προκειμένου να προσδιοριστεί εάν δύο
συνδυασμένα επίθετα έχουν τους ίδιους ή διαφορετικούς προσανατολισμούς, η
μάθηση εφαρμόζεται σε ένα μεγάλο σύνολο λέξεων. Στη συνέχεια, οι δεσμοί μεταξύ
των επίθετων σχηματίζουν ένα γράφημα και η ομαδοποίηση γίνεται με την βοήθεια
αυτού σε δύο ομάδες λέξεων: θετικών και αρνητικών.
Άλλες παρόμοιες τεχνικές βασίζονται σε ρίζες λέξεων και διαδίδουν το
συναισθηματικό τους σθένος των, αφού η πολικότητα τους είναι γνωστή, σε όρους
που συνυπάρχουν μαζί τους σε κείμενο, σε γλωσσικά λεξικά ή σε συνώνυμα και
λέξεις που συνυπάρχουν μαζί τους σε άλλες σχέσεις που ορίζονται από μεγάλα
γλωσσικά σύνολα (πχ WordNet).
Τέλος, όλο και περισσότερο, οι ερευνητές γνωρίζουν ότι ένας συνδυασμός και των
δύο προσεγγίσεων, που ονομάζονται υβριδικές μέθοδοι (hybrid methods), μπορεί
να αποφέρει καλύτερα και πιο ακριβή αποτελέσματα. Ο συνδυασμός των δύο
προσεγγίσεων μπορεί να γίνει παράλληλα ή να εκτελεστεί σε διαφορετικά στάδια
(Alaei, Becken, & Stantic, 2019). Τυπικά παραδείγματα υβριδικών μεθόδων
αποτελούν τα μοντέλα «Sentiment-aware Νearest Νeighbor» (Pappas & Popescu-
Belis, 2013). Ωστόσο, αυτή η υβριδική προσέγγιση δεν χρησιμοποιείται συχνά στην
τρέχουσα βιβλιογραφία εξαιτίας της υψηλής υπολογιστικής πολυπλοκότητάς της.

34
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

5. ΕΡΓΑΛΕΙΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ


Στο κεφάλαιο αυτό αναφέρονται κάποια από τα πιο δημοφιλή εργαλεία ανάλυσης
δεδομένων. Αυτά τα εργαλεία επιτρέπουν την καλύτερη παρακολούθηση και
ανάλυση των κοινωνικών μέσων, με την παροχή σημαντικών πληροφοριών. Η
ανάλυση αυτών των πληροφοριών οδηγεί στην αποτελεσματική διαδικτυακή
διαχείριση της φήμης (μέσω παρακολούθησης και εύρεσης θετικών-αρνητικών
αναφορών και συνομιλιών) καθώς και την παρακολούθηση των ανταγωνιστών των
εταιρειών που επιλέγουν να τα χρησιμοποιήσουν. Επιπλέον, πέρα από τη
συνεισφορά των εργαλείων αυτών σε θέματα παρακολούθησης των κοινωνικών
μέσων, εξάγουν νέα γνώση που μπορεί να οδηγήσει σε εξατομικευμένες συμβουλές
για τη βελτίωση της κοινωνικής παρουσίας μιας επωνυμίας.

5.1. Mentionlytics
Το Mentionlytics αποτελεί ένα σύστημα
Web & Social Media Monitoring. Αυτό
που το διαφοροποιεί από τα ήδη
υπάρχοντα συστήματα είναι ότι
καταφέρνει να αντλήσει χιλιάδες αναφορές, βοηθώντας ουσιαστικά τα brands να
χτίσουν μια αξιόπιστη εικόνα για τους χρήστες τους. Η παρακολούθηση ολόκληρου
του ιστού και όχι μόνο συγκεκριμένων ιστοχώρων, καθώς και η υποστήριξη σχεδόν
όλων των δημοφιλών Social Media, πιο συγκεκριμένα των Facebook, Twitter,
Youtube και Instagram, καθιστά το Μentionlytics την νέα καινοτόμα δύναμη στην
ανακάλυψη των mentions σε παγκόσμιο επίπεδο. O όγκος της πληροφορίας που
δημιουργείται καθημερινά τόσο από τους χρήστες του διαδικτύου, όσο και από τα
εκατομμύρια online media, δεν μπορεί να αγνοηθεί από τα brands που ολοένα και
εκφράζουν την ανάγκη για ανάλυση και εκμετάλλευσή τους.
Με τη χρήση του Mentionlytics ο καθένας μπορεί να δει με έναν εξαιρετικά
εύχρηστο τρόπο και σε πραγματικό χρόνο ό,τι αναφέρεται στο διαδίκτυο για την
εταιρεία, τα προϊόντα, την αγορά αλλά και τους ανταγωνιστές του. Αρχικά το
σύστημα υποστήριζε Ανάλυση Συναισθήματος (Sentiment Analysis) μόνο στα
Αγγλικά, όμως πρόσφατα ολοκληρώθηκε η επέκταση της υποστήριξης σε πολλές
νέες γλώσσες, συμπεριλαμβανόμενων και των Ελληνικών.
Σκοπός της δημιουργίας του Mentionlytics είναι να χρησιμοποιείται από πολλές
μικρές και μεγάλες επιχειρήσεις αλλά και δημόσια πρόσωπα σε όλο τον κόσμο,
ώστε να μπορούν χωρίς κόπο να παρακολουθούν την διαδικτυακή φήμη τους. Με
αυτό τον τρόπο μπορούν να βελτιώνουν τις υπηρεσίες τους και την εικόνα τους
συνεχώς, βασιζόμενοι σε πραγματικό feedback από τον κόσμο.

35
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 10: Απεικόνιση περιβάλλοντος Mentionlytics

Χαρακτηριστικά

• Εύκολη δημιουργία λογαριασμού, με την εισαγωγή του Brand Name της


επιχείρησης, το όνομα του προϊόντος, ή οτιδήποτε χρησιμοποιείτε για
branding. Με την ενεργοποίηση του λογαριασμού ξεκινάει άμεσα η εύρεση
των αναφορών.
• Παρακολούθηση των αναφορών καθώς και των ανταγωνιστών στα
κοινωνικά δίκτυα (Facebook, Twitter, YouTube, Instagram) και στο web.

Εικόνα 11: Απεικόνιση αναφορών στα κοινωνικά δίκτυα και στο Web.

36
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Συμμετοχή σε συζητήσεις σε forums, blogs, social media για το προϊόν ή την


επιχείρησή σας. Έγκαιρη ενημέρωση σε περιπτώσεις εξάπλωσης άσχημων
κριτικών στα Social Media και αντιμετώπιση τυχόν κρίσεων πριν πάρουν
μεγάλες διαστάσεις.
• Εύρεση και κατ’ επέκταση δυνατότητα συνεργασίας με άτομα με μεγάλη
επιρροή (Top Influencers) και Mentioners που είτε μιλάνε για το προϊόν της
επιχείρησης, τους ανταγωνιστές είτε την αγορά στόχο.
• Δυνατότητα χρήσης τεχνολογίας Τεχνητής Νοημοσύνης (Artificial
Intelligence) με το εργαλείο SIA (Social Intelligence Advisor) για εξυπνότερες
πληροφορίες και εξατομικευμένες συμβουλές που βοηθούν στη βελτίωση
του ιστού και την κοινωνικής παρουσίας. Μετά τη συγκέντρωση των
απαραίτητων δεδομένων, γίνεται ανάλυση ΑΙ (AI Analysis) , όπου καταλήγει
στην εξόρυξη στοχευμένης γνώσης. Έπειτα η γνώση αυτή παρουσιάζεται με
απλό και επεξηγηματικό τρόπο (Insights) και η ομάδα αναλαμβάνει τη
συμβουλευτική (Advice) σχετικά με τον τρόπο δράσης. Τέλος δίνεται η
δυνατότητα επαναξιολόγησης (Reassess) των διαδικτυακών ενεργειών της
εταιρείας με στόχο τη συνεχή βελτίωση της στρατηγικής.

Εικόνα 12: Τρόπος χρήσης τεχνολογίας ΑΙ με το εργαλείο SIA

Αγορά-Στόχος
Καθώς η ανάγκη των brands να παρακολουθούν την ηλεκτρονική τους φήμη
καθίσταται όλο και πιο απαιτητική, επεκτείνεται και στις μικρότερες επιχειρήσεις
αλλά και σε ιδιώτες (καλλιτέχνες, πολιτικούς, διασημότητες κ.λπ.) που θα
μπορούσαν να χρησιμοποιήσουν αυτόν τον πλούτο των online πληροφοριών για να
βελτιώσουν την εικόνα τους και να οικοδομήσουν μια ισχυρή διαδικτυακή
κοινότητα. Η αποστολή του Mentionlytics είναι να παρέχει αυτόματα αυτό το

37
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

τεράστιο όγκο πληροφοριών, χωρίς να χρειάζονται σύνθετα ερωτήματα στις


υπηρεσίες Google και τις υπηρεσίες Social Media.
Τιμή
Το εν λόγω εργαλείο παρέχει 4 προϊόντα, με τιμές από 39 έως 299 ευρώ, ανά μήνα
(εύρος τιμής). Προφανώς η τιμή αυτών σχετίζεται με τις παρεχόμενες δυνατότητες
και υπηρεσίες.

Εικόνα 13: Τιμολόγηση Mentionlytics

5.2. Talkwalker
Το Talkwalker είναι μια πλατφόρμα
ανάλυσης των κοινωνικών μέσων που
έχει σχεδιαστεί για να μπορεί μία
εταιρεία να βελτιστοποιήσει αλλά και
να ενισχύσει την επωνυμία της.
Παρέχει πληροφορίες σχετικά με τον τρόπο με τον οποίο οι άνθρωποι μιλούν για
μία επωνυμία στους ιστότοπους κοινωνικών μέσων όπως το Facebook, το Twitter
κ.λπ. Τα αναλυτικά στοιχεία και οι αναφορές σε πραγματικό χρόνο δίνουν μια
ολοκληρωμένη εικόνα για την απόδοση της επωνυμίας ή και των σχετικών
δημοσιεύσεών, με αποτέλεσμα να μπορούν να γίνονται καλύτερες ενέργειες για τις
καμπάνιες των κοινωνικών μέσων από τη πλευρά των εταιρειών που χρησιμοποιούν
το Talkwalker.
Με σχεδόν 185 διαφορετικές γλώσσες και κάλυψη σε περισσότερους από 150
εκατομμύρια ιστότοπους σε όλο τον κόσμο, το Talkwalker μπορεί να αντλήσει τις

38
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

μικρότερες δυνατές λεπτομέρειες για μια επωνυμία, διασφαλίζοντας ταυτόχρονα


την προσέγγιση ενός μέγιστου αριθμού πελατών. Η αυτόματη μετάφραση επίσης
επιτρέπει την παρακολούθηση των αποτελεσμάτων σε οποιαδήποτε γλώσσα.

Εικόνα 14: Απεικόνιση περιβάλλοντος Talkwalker

Xαρακτηριστικά:
• Κοινωνική Ακρόαση-Παρακολούθηση σε πραγματικό χρόνο τι λένε οι πελάτες
για τις επωνυμίες, τα προϊόντα ή τις καμπάνιες της εταιρείας.
• Έρευνα τάσεων σε πραγματικό χρόνο με τη λειτουργία Trending Score.
• Χαρτογράφηση των αναφορών σε έναν παγκόσμιο χάρτη. Ο χάρτης Virality,
όπως ονομάζεται παρέχει πλήρεις και διαδραστικές λεπτομέρειες σχετικά με
διαφορετικές τάσεις σε όλο τον κόσμο, ώστε να μπορεί μία εταιρεία να
σχεδιάσει τις καμπάνιες μάρκετινγκ της όσο το δυνατόν πιο αποτελεσματικά.
• Λήψη δημογραφικών πληροφοριών, όπως ηλικία, φύλο και επάγγελμα του
κοινού.
• Δυνατότητα ανάλυσης τόσο κειμένου όσο και εικόνων, εξοικονομώντας με
αυτόν τον τρόπο χρόνο και προσπάθεια. Υπάρχουν 30 χιλιάδες ή και
περισσότερες μάρκες στη βάση δεδομένων στο Talkwalker. Επομένως,
παρέχει πληροφορίες βάσει του επίσημου λογότυπου της κάθε εταιρείας
ανάλογα με το πού εμφανίζεται στα κοινωνικά μέσα.
• Η πλατφόρμα προσφέρει προϊόντα όπως το Command Center, AI Engine, Free
Tools, Configurable Alerts, Analytics, Image/ Video Recognition, Influencer
One, Quick Search και Sentiment Analysis.

39
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 15: Λειτουργίες Talkwalker

Υποστηριζόμενες Πλατφόρμες:
Facebook, Twitter, Instagram, YouTube, LinkedIn

Αγορά-Στόχος:
Το Talkwalker δίνει τη δυνατότητα σε εταιρείες όλων των μεγεθών να προσφέρουν
πραγματική αξία για τους πελάτες.

Τιμή:
Το Talkwalker λειτουργεί σε συνδρομή, χρεώνεται ετησίως, με τρία διαφορετικά
επίπεδα υπηρεσιών. Η κύρια διαφορά μεταξύ κάθε επιπέδου είναι πόσα
αποτελέσματα που εξάγει.

40
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 16: Τιμολόγηση Talkwalker

5.3. Synthesio
Η Synthesio, μια εταιρεία τεχνολογίας
Ipsos, είναι από τις σημαντικότερες
πλατφόρμες κοινωνικής ακρόασης και
δημοσιεύτηκε από μια ανεξάρτητη
ερευνητική εταιρεία. Το Synthesio
παρέχει σε brands και εταιρείες σε όλο τον κόσμο εργαλεία κοινωνικής ακρόασης
και πληροφορίες σχετικά με το κοινό, για τη μέτρηση του αντίκτυπου των
κοινωνικών συνομιλιών στα κοινωνικά μέσα.
Το Synthesio Social Media Intelligence Suite εμφανίζει ενεργές πληροφορίες - τόσο
ποιοτικές όσο και ποσοτικές - από την πιο εκτεταμένη συλλογή δεδομένων στην
αγορά. Οι επιχειρηματικές μονάδες μπορούν να αξιοποιήσουν τους πίνακες
ελέγχου (dashboards) Synthesio, τις προσαρμόσιμες αναφορές (customizable
reports) και τις οθόνες του κέντρου εντολών κοινωνικών μέσων ( social media
command center displays) - σε συνδυασμό με τις υπηρεσίες κοινωνικής ευφυΐας
Ipsos (Ipsos social intelligence services) - για τη λήψη στρατηγικών επιχειρηματικών
αποφάσεων.

41
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 17: Απεικόνιση περιβάλλοντος Synthesio

Xαρακτηριστικά:
• Tεχνολογία επεξεργασίας φυσικής γλώσσας - Natural Language Processing
(NLP) που εμφανίζει αυτόματα θέματα και τάσεις σε περισσότερα από 30
γραφικά στοιχεία οπτικοποίησης δεδομένων
• Tεχνολογία μηχανικής εκμάθησης Synthesio - Automated Sentiment Analysis
(ASA) σε περισσότερες από 20 γλώσσες. Επίσης παρέχει στους πελάτες την
ευελιξία να συγκεντρώνουν και να οπτικοποιούν όλα τα δεδομένα τους σε
μία τοποθεσία.
• Εξαγωγή πληροφοριών: Πρωταρχικός σκοπός του Synthesio είναι η εξαγωγή
ενεργών πληροφοριών που είναι διαθέσιμες στον ιστό. Πρόκειται για μια
υπερσύγχρονη λύση που βελτιώνει τα δεδομένα.
• Διαμορφώσιμα Dashboards (Configurable Dashboards) : Το σύστημα παρέχει
ένα προσαρμόσιμο ταμπλό που μπορεί να προσαρμοστεί ώστε να ικανοποιεί
τις ανάγκες συγκεκριμένων επιχειρήσεων. Κάθε dashboard εξαρτάται από
την εταιρεία που αξιολογεί τα δεδομένα για να προσδιορίσει εάν ταιριάζει
στις επιχειρηματικές τους απαιτήσεις.

Αγορά-Στόχος:
Το Synthesio απευθύνεται αποκλειστικά σε μεγάλες επιχειρήσεις.

Τιμή:
Το Synthesio παρέχει το λογισμικό του σύμφωνα με τις απαιτήσεις των χρηστών
του. Επομένως υπάρχει ευελιξία και ως προς την τιμή του που προσαρμόζεται

42
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

σύμφωνα με τις ανάγκες της εκάστοτε επιχείρησης. Οι πελάτες ξεκινούν με μια τιμή
εκκίνησης περίπου 1.200 $ ανά μήνα που παρέχει το μικρότερο αριθμό
διαμορφώσιμων dashboards. Tο Synthesio μετρά πολλές από τις μεγάλες
παγκόσμιες μάρκες ως πελάτες και δηλώνει ότι ορισμένοι πελάτες διατηρούν
περισσότερους από 50 πίνακες ελέγχου.

5.4. Brandwatch
Το Brandwatch είναι ένα από
τα πιο σημαντικά εργαλεία
παρακολούθησης κοινωνικών
μέσων. Προσφέρει μια ισχυρή
και αποτελεσματική πλατφόρμα παρακολούθησης και ανάλυσης κοινωνικών μέσων
που επιτρέπει στην επιχείρηση να συλλέγει, να αναλύει και να χρησιμοποιεί
σχετικές επιχειρηματικές πληροφορίες σχετικά με τα δεδομένα κοινωνικών μέσων.
Δίνει επίσης τη δυνατότητα κατανόησης των συζητήσεων των κοινωνικών μέσων για
την όποια επωνυμία. Ανιχνεύει στο διαδίκτυο ογκώδη δεδομένα κοινωνικών μέσων
από τουλάχιστον 90 εκατομμύρια πηγές και σε 27 γλώσσες.

Εικόνα 18: Απεικόνιση περιβάλλοντος Brandwatch

Xαρακτηριστικά:
• Ειδοποιήσεις σε πραγματικό χρόνο: Εντοπισμός ασυνήθιστης
δραστηριότητας ή αναδυόμενων κρίσεων και αποστολή αυτόματων
ειδοποιήσεων απευθείας σε σχετικούς εσωτερικούς και εξωτερικούς
ενδιαφερόμενους.
• Παροχή χρήσιμων πληροφοριών για τις επιχειρήσεις από τη συλλογή
στοιχείων, όπως μεταδεδομένα (metadata) και γεωγραφική τοποθεσία.

43
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Η τεχνολογία της Brandwatch συγκεντρώνει πληροφορίες από περισσότερες


από 70 εκατομμύρια πηγές, χωρίς χρήση δεδομένων από άλλους παρόχους.
• Οι ενημερώσεις στο Brandwatch πραγματοποιούνται κάθε δύο εβδομάδες
καθώς όλα τα εξωτερικά δεδομένα και η ανάπτυξή τους πραγματοποιούνται
εσωτερικά. Αυτό καθιστά την ευκολότερη προσαρμογή στις μεταβαλλόμενες
απαιτήσεις ώστε να ικανοποιούνται οι εκάστοτε ανάγκες.
• Αυτοματοποιημένη τμηματοποίηση και ανάλυση περίπλοκων αναζητήσεων
των χρηστών μέσα από τις συνομιλίες τους (Customer Journey Mapping)
ώστε να απλοποιηθούν οι ροές εργασιών και να ενεργοποιηθούν
στρατηγικές με βάση τα δεδομένα αυτά.

Υποστηριζόμενες Πλατφόρμες:
Twitter, Facebook, Instagram, LinkedIn, Google

Αγορά-Στόχος:
To Brandwatch παρέχει ένα σημείο εκκίνησης για τις μικρές επιχειρήσεις με βασικές
ανάγκες. Το Brandwatch έχει αναπτύξει μια πλατφόρμα κοινωνικής ευφυΐας για
μεγαλύτερους οργανισμούς, έχοντας κατά νου πιο εξελιγμένες χρήσεις. Επομένως
συνίσταται για επιχειρήσεις μεγάλου μεγέθους.

Τιμή:

H τιμολόγηση στο Brandwatch διαφοροποιείται σε σχέση με το μέγεθος της


επιχείρησης. Δεν διαθέτει δωρεάν έκδοση και δεν προσφέρει δωρεάν δοκιμή.

5.5. Awario
Το Awario είναι ένα εργαλείο για την
παρακολούθηση κοινωνικών μέσων και
ιστού για επιχειρήσεις οποιουδήποτε
μεγέθους. Η χρήση του Awario, πιο συγκεκριμένα, αφορά την παρακολούθηση των
αναφορών επωνυμιών , των ανταγωνιστών, της βιομηχανίας ή ακόμα δίνει και τη
δυνατότητα δημιουργίας σύνθετων ερωτημάτων για τις λιγότερο προφανείς
περιπτώσεις χρήσης. Για παράδειγμα, επιτρέπει τον εντοπισμό λογοτυπικών
αντιγράφων του περιεχομένου μίας επωνυμίας , την εύρεση αναφορών επωνυμίας
χωρίς σύνδεση με δυνατότητα μετατροπής σε συνδέσμους και την παρακολούθηση
νέων συνδέσμων προς τον ιστότοπo μιας εταιρείας.

44
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 19: Απεικόνιση περιβάλλοντος Awario

Xαρακτηριστικά:
• Λειτουργία σύνθετης αναζήτησης για τη ρύθμιση ευέλικτων ερωτημάτων και
τη βελτίωση της ακρίβειας των αποτελεσμάτων.
• Λειτουργία Influencer Tracking. Πρόκειται για τις αναφορές Influencers που
περιγράφει τους πιο σημαντικούς ανθρώπους που μιλούν για μια επωνυμία,
τους ανταγωνιστές ή τον κλάδο.
• Δωρεάν πρόσθετο εργαλείο κοινωνικής πώλησης, που ονομάζεται Leads,
για αναζητήσεις πωλήσεων στα μέσα κοινωνικής δικτύωσης. Το εργαλείο
χρησιμοποιεί προγνωστικά στοιχεία για να βρίσκει άτομα που ζητούν
προτάσεις σχετικά με ένα προϊόν ή αναζητούν μια εναλλακτική λύση για
τους ανταγωνιστές.
• Αναλυτικά στοιχεία εταιρικού επιπέδου, όπως ανάλυση συναισθήματος,
ανάλυση τοποθεσίας και γλώσσας και απεριόριστα ιστορικά δεδομένα.

Υποστηριζόμενες Πλατφόρμες:
Facebook, Twitter, Instagram, YouTube, Google+, Reddit, blogs, web.

Αγορά-Στόχος:
Tο Awario είναι ιδανικό για μικρές και μεσαίες επιχειρήσεις που επιθυμούν να
παρακολουθούν τις αναφορές των επωνυμιών τους, να παρακολουθούν τους
ανταγωνιστές και να βρίσκουν ευκαιρίες πώλησης. Το ίδιο συμβαίνει και με
agencies που θέλουν να κάνουν τις ίδιες ενέργειες για τους πελάτες τους.

45
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Τιμή:
Η τιμολόγηση του Awario ξεκινά από 29,00 $ ανά μήνα για το πρόγραμμα Starter
και μπορεί να φτάσει έως 299$ ανά μήνα για το πρόγραμμα Enterprise. Δεν
διαθέτει δωρεάν έκδοση αλλά προσφέρει δωρεάν δοκιμή.

Εικόνα 20: Τιμολόγηση Awario

5.6. Mention
Το Mention είναι ένα εργαλείο
παρακολούθησης κοινωνικών
μέσων και ιστού. Σαν εργαλείο
παρακολούθησης μέσων παρέχει
ειδοποιήσεις σε πραγματικό χρόνο για λέξεις-κλειδιά (keywords) και επιτρέπει
στους χρήστες να παρακολουθούν εκατομμύρια πηγές σε 42 γλώσσες. Βοηθά
επίσης στην οικοδόμηση σχέσεων, δημιουργεί δυνητικούς πελάτες και προστατεύει
τη φήμη των επιχειρήσεων που το επιλέγουν.

46
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 21: Απεικόνιση περιβάλλοντος Mention

Χαρακτηριστικά:
• Δυνατότητα άμεσης ορατότητας μέσω μίας από τις εφαρμογές της
επιχείρησης (Ιστός, Επιτραπέζιος υπολογιστής, iPhone ή Android) σε
περίπτωση που κάποιος χρήστης των social media μιλάει για την επιχείρηση
ή την επωνυμία της. Πιο συγκεκριμένα, παρέχει τη δυνατότητα λήψης
καθημερινών συνοπτικών ειδοποιήσεων που δείχνουν τις αναφορές για μια
συγκεκριμένη ημέρα. Αυτή η λειτουργεία του Mention καλύπτει μία
σημαντική ανάγκη των εταιρειών για γρήγορη ανταπόκριση στα αιτήματα,
ερωτήματα ή και παράπονα των πελατών τους αλλά και στη
παρακολούθηση των ανταγωνιστών τους.
• Δυνατότητα ρύθμισης των ειδοποιήσεων για το όνομα της επιχείρησης, τις
λέξεις-κλειδιά ή τους ανταγωνιστές και έπειτα μπορεί να γίνει λήψη αυτών
των ειδοποιήσεων μέσω e-mail ή διαφορετικά υπάρχει και η επιλογή
απευθείας ελέγχου τους στην εφαρμογή.
• Δυνατότητα επιλογής για εύρεση περισσότερων λεπτομερειών στις
«αναφορές». Για παράδειγμα, εάν στην εφαρμογή μία επιχείρηση δει ότι το
όνομά της αναφέρθηκε σε έναν ιστότοπο, μπορεί να κάνει κλικ σε αυτό και
να προβάλει τον ιστότοπο απευθείας στην εφαρμογή αναφοράς. Εάν μία
επιχείρηση βρεί ένα tweet, μπορεί να δει το βιογραφικό του ατόμου που
έστειλε το tweet πριν αποφασίσει να απαντήσει.

Υποστηριζόμενες πλατφόρμες:
Twitter, Facebook, Instagram, ιστολόγια, forums

47
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Τιμή:
To Mention δίνει την επιλογή σε κάθε επιχείρηση να επιλέξει το πακέτο που
ταιριάζει στους στόχους παρακολούθησης και δημοσίευσης των κοινωνικών μέσων
της στο διαδίκτυο. Το εύρος κυμαίνεται από 0-450$ ανά μήνα.

Εικόνα 22: Τιμολόγηση Mention

5.7. Sproutsocial
Το Sprout Social είναι μια
πλατφόρμα διαχείρισης και
βελτιστοποίησης κοινωνικών
μέσων για επωνυμίες και
εταιρείες όλων των μεγεθών. Αποτελεί μια ολοκληρωμένη πλατφόρμα διαχείρισης
για όλες τις ανάγκες μίας εταιρείας στα μέσα κοινωνικής δικτύωσης, καθώς της
επιτρέπει να χτίσει και να διατηρήσει την κοινότητά της, διευκολύνοντας την
έναρξη, τη συμμετοχή και την παρακολούθηση κοινωνικών συνομιλιών. Οι
δυνατότητες CRM 9 (Customer Relationship Management) μπορεί να το κάνουν
χρήσιμο και για τις μικρότερες επιχειρήσεις που αναζητούν έναν τρόπο καταγραφής
πληροφοριών σχετικά με τους δυνητικούς πελάτες τους.

9
Το CRM (Customer Relationship Management ή Διαχείριση Πελατειακών Σχέσεων) είναι μία λύση
λογισμικού, η οποία διευκολύνει μια εταιρεία κατά την αλληλεπίδρασή της με τους πελάτες της,
υφιστάμενους και δυνητικούς.

48
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 23: Απεικόνιση περιβάλλοντος Sprout Social

Χαρακτηριστικά:
• Δυνατότητα πιο συγκεκριμένων αναζητήσεων για τους χρήστες με σκοπό να
διασφαλίσουν ότι οι περισσότερες από τις αναφορές αφορούν πραγματικά
την εταιρεία τους.
• Διαθέτει λογισμικό SaaS 10 (Software as a Service)
που προωθεί την επικοινωνία μεταξύ επιχειρήσεων και ανθρώπων.
• Λειτουργία Smart Inbox όπου επιτρέπει τη δημιουργία μιας καλύτερης
σχέσης με τους πελάτες της εταιρείας με γρήγορες απαντήσεις σε τυχόν
ερωτήσεις ή προβλήματα που μπορεί να έχουν.
• Παροχή ποικίλων εργαλείων για τη βελτιστοποίησή των σχεδίων μάρκετινγκ
της επιχείρησης.
• Επιταχύνει τη συλλογή δεδομένων, με τρόπο που μία εταιρεία μπορεί
εύκολα να αποδείξει την απόδοση μίας επένδυσης της με αποτέλεσμα την
άμεση ενημέρωση της στρατηγικής της.

Αγορά-Στόχος:
Το Sprout Social απευθύνεται τόσο σε μικρές όσο και σε μεσαίες εταιρείες, αλλά και
σε Freelancers.

10
Το SaaS είναι μια λύση λογισμικού που επιτρέπει την πρόσβαση στα δεδομένα από οποιαδήποτε
συσκευή με σύνδεση στο Διαδίκτυο και πρόγραμμα περιήγησης στο Web

49
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Υποστηριζόμενες πλατφόρμες: Twitter, Facebook, Instagram, LinkedIn, Google+

Τιμή: Το εύρος της τιμής ξεκινάει από τα $99 το μήνα έως και $249 το μήνα. Επίσης,
προσφέρει και δωρεάν δοκιμή.

Εικόνα 24: Τιμολόγηση Sprout Social

5.8. Hootsuite
Το Hootsuite θεωρείται πολύ καλό για τη
διαχείρηση πολλών λογαριασμών
κοινωνικών μέσων με σύνδεση σε έναν μόνο πίνακα ελέγχου. Είναι σημαντικό να
σημειωθεί ότι η πρόσβαση στο Hootsuite γίνεται απευθείας από το πρόγραμμα
περιήγησης που χρησιμοποιεί η εταιρεία και ότι δεν χρειάζεται να γίνει
εγκατάσταση λογισμικού στο σύστημά της.
Το Hootsuite αναφέρεται ως η πιο διαδεδομένη πλατφόρμα διαχείρισης κοινωνικών
μέσων με περισσότερους από 16 εκατομμύρια χρήστες παγκοσμίως. Έχει σχεδιαστεί
για οργανισμούς που εκτελούν στρατηγικές σε πολλά δίκτυα κοινωνικών μέσων,
όπως το Facebook, το Instagram, το Twitter, το Linkedin, το Pinterest και το
YouTube.

50
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 25: Απεικόνιση περιβάλλοντος Hootsuite

Χαρακτηριστικά:
• Λειτουργία μαζικού χρονοδιαγράμματος που επιτρέπει να γίνονται
προγραμματισμένες αναρτήσεις.
• Λειτουργία Hootsuite Insights που παρέχει πρόσβαση σε δεδομένα από
περισσότερες από 100 εκατομμύρια πηγές σε πραγματικό χρόνο, σε
περισσότερες από 50 γλώσσες, σε 25+ κοινωνικά δίκτυα και άλλες
πλατφόρμες. Αυτό έχει σαν αποτέλεσμα, η εξαγωγή αποτελεσμάτων ανά
τοποθεσία, γλώσσα και φύλο να γίνεται πολύ πιο εύκολα.
• Ενημέρωση σε περιπτώσεις ασυνήθιστης αύξησης του όγκου πληροφοριών
ή άλλων μέτρων.
• Παροχή Hootlet extension για την άμεση δημοσίευση περιεχομένου από
οποιαδήποτε ιστοσελίδα, χωρίς την ανάγκη σύνδεσης σε διαφορετικούς
λογαριασμούς στα social media.
• Παροχή λογισμικού Proofpoint που παρέχει ασφάλεια υψηλού επιπέδου σε
λογαριασμούς επιπέδου Enterprise.
• Παροχή ReviewTrackers, ένα εργαλείο λογισμικού που ενσωματώνεται με το
Hootsuite για τη λήψη κριτικών από περισσότερους από 85 ιστότοπους με
σκοπό να προστατεύεται και να βελτιώνεται η φήμη της επωνυμίας.
• Hootsuite Ads, μια συνεργατική πλατφόρμα που απλοποιεί τη ροή εργασιών
διαφήμισης, καθιστώντας ευκολότερη τη δοκιμή και κατ’ επέκταση την
υλοποίηση δημιουργικότερων καμπανιών.

51
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Ενσωμάτωση με κορυφαία εργαλεία ακρόασης, όπως το Talkwalker και


Brandwatch για άντληση βασικών πληροφοριών συνδυάζοντας τες όλες σε
ένα μόνο πίνακα ελέγχου.
• Hootsuite Impact για τον υπολογισμό της πραγματικής απόδοσης της
επένδυσης μίας εταιρείας στα μέσα κοινωνικής δικτύωσης. Οι
προσαρμόσιμοι πίνακες εργαλείων διαθέτουν ευανάγνωστα γραφήματα,
πίνακες και περιλήψεις KPI (Key Performance Indicator), ιδανικά για
ενδιαφερόμενους.

Υποστηριζόμενες πλατφόρμες:
Facebook, Instagram, YouTube, LinkedIn, Twitter, Pinterest, Google+, blogs, forums
κ.α.
Τιμή:
Για το Hootsuite η τιμή κυμαίνεται από 25€ το μήνα έως και 599€ το μήνα για τις
μεγάλες επιχειρήσεις.

Εικόνα 26: Τιμολόγηση Hootsuite

5.9. Brand24
Το Brand24 είναι ένα ισχυρό αλλά προσιτό
εργαλείο για όσους θέλουν να
εμβαθύνουν στην παρακολούθηση των
κοινωνικών μέσων. Εκτός από τις μεγάλες
πλατφόρμες κοινωνικών μέσων, το
Brand24 παρακολουθεί επίσης ιστολόγια, φόρουμ και άλλους ιστότοπους για
αναφορές επωνυμίας. Εκτός από τη δυνατότητα που δίνει σε μία εταιρεία για
συλλογή των αναφορών της, αναλύει την προσέγγιση των μέσων κοινωνικής
δικτύωσης, τις αλληλεπιδράσεις, το συναίσθημα και πολλά άλλα. Πρόκειται επίσης
για ένα εργαλείο παρακολούθησης μέσων που βασίζεται σε τεχνολογία AI και

52
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

μπορεί να οδηγήσει τις προσπάθειες επωνυμίας και μάρκετινγκ στο επόμενο


στάδιο.

Εικόνα 27: Απεικόνιση περιβάλλοντος Brand24

Χαρακτηριστικά:
• Παρακολούθηση λέξεων-κλειδιών σε διάφορες πλατφόρμες κοινωνικών
μέσων, όπως το Facebook, το Instagram, το Twitter, το TikTok και το
YouTube. Με βάση τις αναφορές, υπολογίζει την προσέγγιση των μέσων
κοινωνικής δικτύωσης και παρακολουθεί την απόδοση των hashtags.
• Discussion Volume Chart που προσδιορίζει τις ξαφνικές αλλαγές στον όγκο
των συζητήσεων με σκοπό την προστασία της εταιρικής φήμης. Στο πλαίσιο
αυτής της λειτουργίας.
• Δυνατότητα προσαρμογής των ειδοποιήσεων (alerts) με βάση της ανάγκες
της κάθε επιχείρησης.

Εικόνα 28: Χαρακτηριστικά Brand24

53
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Υποστηριζόμενες πλατφόρμες:
Facebook, Instagram, Twitter, Tik Tok, Youtube, Pinterest, Blogs, Forums κ.α.

Αγορά-Στόχος:
Το Brand24 απευθύνεται τόσο σε μικρές, μεσαίες όσο και σε μεγάλες επιχειρήσεις.

Τιμή:
Η τιμολόγηση στο Brand24 ξεκινά από 49$ και φτάνει έως 199$ το μήνα.

Εικόνα 29: Τιμολόγηση Brand24

5.10. Digimind
Το Digimind Social είναι μια
διαδικτυακή πλατφόρμα που
εστιάζει στην ανάλυση κοινωνικών
μέσων για επιχειρήσεις. Ως εργαλείο
ανάλυσης κοινωνικών μέσων, το Digimind παρακολουθεί απεριόριστες πηγές
κοινωνικών μέσων και ιστού και ταξινομεί αναφορές κατά προσέγγιση. Επιτρέπει

54
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

στην εταιρεία που το χρησιμοποιεί να "ακούει" συνομιλίες που έχουν σημασία για
εκείνη σε πραγματικό χρόνο, παρέχοντας ενημερωμένες πληροφορίες και δεδομένα
που απαιτούνται για την προώθηση στρατηγικών μάρκετινγκ.

Εικόνα 30: Απεικόνιση περιβάλλοντος Digimind

Xαρακτηριστικά:
• Ευκολία πρόσβασης και ανάλυση μεγάλων ποσοτήτων πληροφοριών με
λεπτομερή εξατομίκευση που επιτρέπει στις εταιρείες να εστιάζουν στην
καλύτερη δυνατή αλληλεπίδραση με τους καταναλωτές.
• Παροχή λογισμικού ευφυΐας (Intelligence Software) σε πραγματικό χρόνο
που βοηθά την πλήρη κατανόηση των τάσεων της αγοράς, της γνώσης των
καταναλωτών και του ανταγωνιστικού περιβάλλοντος.
• Λειτουργία Digimind AI (Artificial Intelligence) Sense που αξιοποιεί την
υβριδική προσέγγιση της μηχανικής μάθησης και της Επεξεργασίας Φυσικής
Γλώσσας (NLP), καθώς και τις δυνατότητες αναγνώρισης εικόνας (Image
Recognition), επιτρέποντας μια εντελώς νέα εμπειρία χρήστη.
• Έξυπνη ταξινόμηση (Smart Classification) : Η έξυπνη ταξινόμηση είναι η
αυτοματοποιημένη επισήμανση των αναφορών με βάση τη λογική των
χρηστών για άμεση και σχετική οργάνωση δεδομένων.
• Ανάλυση συναισθήματος (Sentiment Analysis): Οι αλγόριθμοι μηχανικής
μάθησης και NLP για ανάλυση συναισθημάτων έχουν εκπαιδευτεί σε
χιλιάδες εξειδικευμένες αναφορές, παρέχοντας έτσι υψηλότερα επίπεδα
ακρίβειας.

55
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Παροχή προσαρμόσιμου πίνακα ελέγχου που επιτρέπει στην εταιρεία που το


χρησιμοποιεί να κατανοήσει καλύτερα τα δεδομένα της και να
αλληλεπιδράσει με το στοχευμένο κοινό της.
• Πρόβλεψη τάσεων και ευκαιριών για βελτίωση ποιότητας των
επιχειρηματικών αποφάσεων. Πιο συγκεκριμένα, η πλατφόρμα μπορεί να
βοηθήσει την εταιρεία να προβλέψει μια επιτυχία ή και να αποτρέψει
κάποια ενδεχόμενη πτώση, βάση των διαδικτυακών πληροφοριών που
συγκεντρώνει.

Υποστηριζόμενες πλατφόρμες:
Twitter, Facebook, Instagram, Blogs, forums

Αγορά-Στόχος:
To Digimind απευθύνεται κυρίως σε μεσαίες και μεγάλες επιχειρήσεις.

Τιμή:
Το Digimind παρέχει το λογισμικό του σύμφωνα με τις απαιτήσεις των χρηστών του.
Συνοδεύεται από ευέλικτη τιμολόγηση που προσαρμόζεται σύμφωνα με τις ανάγκες
της εκάστοτε επιχείρησης.

56
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

6. ΕΦΑΡΜΟΓΗ ΕΡΓΑΛΕΙΩΝ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ


Στο κεφάλαιο αυτό πραγματοποιείται εφαρμογή/χρήση δύο εκ των εργαλείων
ανάλυσης που αναφέρθηκαν στο προηγούμενο κεφάλαιο σχετικά με τη
δραστηριότητα που εκδηλώθηκε σε μέσα κοινωνικής δικτύωσης ως προς
συγκεκριμένη λέξη-κλειδί (“keyword”) και χρονική περίοδο.

Πιο συγκεκριμένα επιλέχθηκαν προς χρήση τα εργαλεία “Mentionlytics” και


“Brand24”, ως “keyword” η ιστοσελίδα καταχώρησης, εύρεσης και βραχυχρόνιας
ενοικίασης/μίσθωσης καταλυμάτων “Airbnb” και ως χρονική περίοδος το διάστημα
13 Αυγούστου έως και 11 Σεπτεμβρίου 2020 (30 ημέρες).

Η επιλογή των συγκεκριμένων εργαλείων σχετίζεται με την ευκολία πρόσβασης και


χρήσης αυτών, δεδομένου ότι απαιτούνταν απλώς η δημιουργία σχετικού
λογαριασμού, δίχως την καταβολή οποιουδήποτε αντιτίμου/συνδρομής ή την
χορήγηση εταιρικών στοιχείων κ.λπ..

6.1. Mentionlytics
Με την εισαγωγή της παραπάνω λέξης – κλειδί στην εν λόγω πλατφόρμα, αρχικά
εμφανίζεται ο πίνακας ελέγχου (dashboard) όπου απεικονίζει όλες τις λειτουργίες
του εργαλείου, δίνοντας τη δυνατότητα επιλογής των social media για το οποία ο
χρήστης επιθυμεί να πληροφορηθεί.

Περιλαμβάνει τις συνολικές αναφορές και πως αυτές επιμερίζονται μεταξύ


κοινωνικών και μη κοινωνικών δικτύων, το social reach, το engagement στα
κοινωνικά δίκτυα και τέλος την ανάλυση συναισθήματος. Τέλος εμφανίζει
γραφήματα και διαγράμματα με σχετικές πληροφορίες.

Dashboard Mentionlytics

Εικόνα 31: Dashboard Mentionlytics

57
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Ειδικότερα, εκτίθενται τα ακόλουθα:

• Διάγραμμα ανάλυσης «αναφορών» (mentions) ανά κοινωνικό δίκτυο και


ανά ημέρα.

Εικόνα 32: Total Mentions-Social Mentions-Web Mentions-Sentiment

Παρατηρείται ότι η πλειοψηφία των «αναφορών» (mentions), περίπου 90%, αφορά


σε social mentions (παρά σε web mentions). Επίσης ότι ως προς την ανάλυση
συναισθήματος, όσες «αναφορές» (mentions) αξιολογήθηκαν/κατατάχθηκαν ως
αρνητικές υπερτερούν έναντι των θετικών (73 έναντι 29). Προφανώς, οι υπόλοιπες
δεν ταξινομήθηκαν («ουδέτερες»).

Εικόνα 33: Διάγραμμα αναφορών Mentionlytics

Περαιτέρω, ως προς τη χρονική κατανομή των ευρημάτων,


παρατηρείται ότι κατά κανόνα κινούνται σε χαμηλά επίπεδα, με
εξαίρεση την 6 Σεπτεμβρίου, όπου σημειώνεται σημαντική αύξηση
των αναφορών (mentions). Από αυτές ξεχωρίζει το πλήθος στο
instagram, ενώ ακολουθούν με φθίνουσα σειρά οι «αναφορές» σε
web, twitter, youtube και facebook.

• Ανάλυση Συναισθήματος (Sentiment Analysis)


Θετική/Αρνητική αξιολόγηση, ανά ημέρα

Εικόνα 34: Διάγραμμα Ανάλυσης Συναισθήματος

58
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Ακολουθεί αντίστοιχη συμπεριφορά. Εστιάζοντας στην 6η Σεπτέμβρη (βλ.


παραπάνω) παρατηρείται ότι η πλειοψηφία των αναφορών ταξινομείται ως
ουδέτερη.

Το γεγονός ότι οι ουδέτερες αντιδράσεις υπερισχύουν στην προκειμένη περίπτωση


(Neutral:80), αλλά δεν απεικονίζονται, δίνει αυτή τη μορφή στο διάγραμμα (εικόνα
34).

• Σύνολο αναφορών ανά πηγή (Twitter, Facebook, Youtube, Web Mentions,


Instagram, Other Mentions)

Εικόνα 35: Απεικόνιση αναφορών ανά πηγή (Twitter-Facebook-Youtube)

Εικόνα 36: Απεικόνιση αναφορών ανά πηγή(Web Mentions-Instagram-Other Mentions)

59
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Αναφορές παγκοσμίως, ανά χώρα


Τα στοιχεία παρουσιάζονται σε χάρτη (με χρωματική -θεωρητικά- διαβάθμιση) -
γεωγραφική κατανομή και σε ποσοστιαία κατανομή. Σαφώς περιλαμβάνονται
και τα αριθμητικά στοιχεία.

Εικόνα 37: Αναφορές παγκοσμίως, ανά χώρα

Όπως προκύπτει από τα παραπάνω, η


πλειοψηφία των αναφορών προέρχεται από
τις ΗΠΑ, ακολούθως δε από Ελλάδα, Ηνωμένο
Βασίλειο, Αυστραλία κ.λπ.

Εικόνα 38: Αναφορές ανά χώρα, σε ποσοστά

60
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Κορυφαίοι Mentioners (σε κάθε ένα από τα μέσα κοινωνικής δικτύωσης)

Εικόνα 39: Κορυφαίοι Mentioners (Twitter-Facebook-Instagram-Youtube)

Εικόνα 40: Κορυφαίοι Mentioners (websites)

61
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Αναλυτικά οι αναφορές έγιναν στα εξής site:

Εικόνα 41: Αναφορές σε ιστοσελίδες

• Keyword/tag Cloud
Αποτελείται από λέξεις κλειδιά (keywords) ή ετικέτες (tags) τα οποία έχουν
χρησιμοποιηθεί κατά την αναζήτηση των χρηστών. Οι ετικέτες είναι συνήθως
μεμονωμένες λέξεις και η σημασία κάθε ετικέτας εμφανίζεται με διαφορετικό
μέγεθος ή χρώμα γραμματοσειράς, με το μεγαλύτερο μέγεθος να συνεπάγεται
μεγαλύτερη χρήση.

Εικόνα 42: Keyword Cloud

Όπως εμφαίνεται παραπάνω, πέραν του keyword/tag “airnbnb”,αναζητήθηκαν


επίσης με σχετικά υψηλή ένταση τα εξής: “host”, “refund”, “money”, “been”,
“customer”, “service”, “company”, κλπ.

Σημειώνεται ότι τα κορυφαία “Keywords” εμφανίζονται και με σχετική κατάταξη


(Εικόνα 43).

62
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 43: Εμφάνιση λέξεων-κλειδιών με κατάταξη

Περαιτέρω, αξίζει να σημειωθεί η δυνατότητα ανάλυσης της δραστηριότητας σε


κάθε ένα από τα μέσα κοινωνικής δικτύωσης (& web) καθώς και εμφάνισης, κατά
τον ίδιο τρόπο που παρατέθηκαν παραπάνω, των σχετικών
αποτελεσμάτων/ευρημάτων, ως ακολούθως:

• Web Mentions
Αφορά στην ανάλυση αποκλειστικά ως προς τη σχετική δραστηριότητα που
εμφανίζεται σε websites (web mentions).

Εικόνα 44: Web Mentions

63
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Αναφορές και άρθρα για το Airbnb στην Ελλάδα

Εικόνα 45: Αναφορές στην Ελλάδα

Παρατίθεται ενδεικτικά ένα παράδειγμα σχετικού άρθρου:

Εικόνα 46: Άρθρο για το Airbnb στην Ελλάδα

64
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Twitter Mentions

Αφορά στην ανάλυση αποκλειστικά ως προς τη σχετική δραστηριότητα που


εμφανίζεται στο twitter.

Εικόνα 47: Twitter Mentions

• Facebook Mentions
Αφορά στην ανάλυση αποκλειστικά ως προς τη σχετική δραστηριότητα που
εμφανίζεται στο Facebook.

Εικόνα 48: Facebook Mentions

65
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Youtube Mentions:
Αφορά στην ανάλυση αποκλειστικά ως προς τη σχετική δραστηριότητα που
εμφανίζεται στο Youtube.

Εικόνα 49: Youtube Mentions

• Instagram Mentions:
Αφορά στην ανάλυση αποκλειστικά ως προς τη σχετική δραστηριότητα που
εμφανίζεται στο Instagram.

Εικόνα 50: Instagram Mentions

66
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

6.2. Brand24
Εργαζόμενοι αντίστοιχα, με την εισαγωγή της επιλεγμένης λέξης – κλειδί στην εν
λόγω πλατφόρμα, αρχικά εμφανίζεται ο πίνακας ελέγχου του Brand24 με τα
διαγράμματα των αναφορών που σχετίζονται με το airbnb καθώς και της ανάλυσης
συναισθήματος.

Συγκεκριμένα στο διάγραμμα των αναφορών απεικονίζονται ο αριθμός αυτών που


έχουν πραγματοποιηθεί στα social media (Social Media Reach) και των αναφορών
που έχουν προκύψει από άλλες πλατφόρμες που δεν ανήκουν στα social media
(Non Social Reach).

Στη συνέχεια εμφανίζεται ο αριθμός των θετικών και αρνητικών αντιδράσεων των
χρηστών όσον αφορά το airbnb, όπως προκύπτει από την ανάλυση συναισθήματος.

Dashboard Brand24

Εικόνα 51: Dashboard Brand24

Σχετικά με τις αναφορές, η πλατφόρμα Brand24 όπως φαίνεται και στην εικόνα
παρέχει πληροφορίες για το πως αυτές επιμερίζονται στις διάφορες κατηγορίες
μέσων κοινωνικής δικτύωσης. Με το Web να συσσωρεύει τις περισσότερες
αναφορές για το Airbnb (48.5%) και με το Twitter να συγκεντρώνει τις λιγότερες
αναφορές (0.8%).

Αξίζει να σημειωθεί ότι τα Instagram και Facebook παρουσιάζονται με μηδενική


τιμή καθώς η πλατφόρμα απαιτούσε ενεργοποίηση μέσω εταιρικού λογαριασμού,
προκειμένου να εξάγει τα αποτελέσματα. Πρόκειται για μία σημαντική διαφορά εν
σχέσει με την πλατφόρμα που αναφέρθηκε στην προηγούμενη ενότητα
(Mentionlytics)

67
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

• Mentions ανά κατηγορία κοινωνικών μέσων

Εικόνα 52: Αναφορές ανά κατηγορία

• Context of a discussion:
Αναφέρεται στις περισσότερο χρησιμοποιούμενες λέξεις κατά τις συζητήσεις μεταξύ
των χρηστών ή κατά την αναζήτησή τους.

Εικόνα 53: Keyword Cloud

Στη συνέχεια, η πλατφόρμα παρέχει τη δυνατότητα εξαγωγής περίληψης,


εμφανίζοντας συγκεντρωτικά τα αποτελέσματα με νούμερα. Αναλυτικά, πέρα από
το πώς επιμερίζεται ο αριθμός των Mentions αλλά και Reach, μεταξύ Social και
Non-Social, όπως αναφέρθηκε και παραπάνω, γίνεται αναφορά στο σύνολο των
αντιδράσεων (Interactions), που περιλαμβάνει Likes και Shares. Τέλος, δείχνει τον
αριθμό και τα ποσοστά των θετικών και αρνητικών αναφορών καθώς και τις
αναφορές που έγιναν μέσω blogs και Tweeter. Κατά αντιστοιχία με την αριθμητική
περίληψη στην εικόνα_ γίνεται και γραφική απεικόνιση.

68
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Εικόνα 54: Αριθμητική Περίληψη Brand24

Εικόνα 55: Περίληψη των αναφορών

69
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Επιπλέον, το Brand24 παρέχει πληροφορίες σχετικά με τα sites που ασκούν τη


μεγαλύτερη επιρροή, όπως φαίνεται στην Eικόνα 56.

Εικόνα 56: Ιστοσελίδες με τη μεγαλύτερη επιρροή

Τέλος, παρουσιάζονται τα πιο δημοφιλή καθώς και τα πιο ενεργά προφίλ. Βάση των
αποτελεσμάτων, το Tweeter και το Youtube φαίνεται να είναι τα πιο δημοφιλή.

Εικόνα 57: Δημοφιλή προφίλ-Ενεργά προφίλ

70
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

6.3. Συγκριτική Μελέτη Mentionlytics-Brand24


Στην παρούσα ενότητα πραγματοποιείται συγκριτική εξέταση των δύο εργαλείων
που εφαρμόστηκαν παραπάνω, με σκοπό την αναγνώριση κοινών σημείων και
διαφορών. Ειδικότερα, εξετάστηκαν υπό μορφή ερωτημάτων επτά σημαντικά
χαρακτηριστικά των εργαλείων, όπως αναδείχθηκαν κατά την εφαρμογή τους.

1. Ποιο είναι το social reach για τα δύο εργαλεία σε ένα συγκεκριμένο


χρονικό διάστημα;
Το Mentionlytics δείχνει το Social Reach ανά ημέρα και ανά κανάλι, ενώ το
Βrand24 δείχνει τόσο το Social και Non Social Reach όσο και τον συνολικό
αριθμό χωρίς κάποια αναφορά σε συγκεκριμένα social media. Στην εικόνα
58 απεικονίζεται η καμπύλη του Social Reach με αναφορές από το Tweeter
και το Youtube, ενώ στην εικόνα 59 δεν γίνεται κάποια αναφορά στα
επιμέρους social media. Ωστόσο, ο συνολικός αριθμός των αναφορών στο
Brand24 διαχωρίζεται σε Social και Non Social Reach δίνοντας τη δυνατότητα
πληροφόρησης σε σχέση με την πηγή τους.

Εικόνα 58: Social Reach για το Mentionlytics

Εικόνα 59: Social Reach- Non Social Reach για το Brand24

71
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

2. Πώς γίνεται η σύγκριση με τους ανταγωνιστές;

Το Mentionlytics δεν παρέχει τη δυνατότητα σύγκρισης μεταξύ ανταγωνιστών


στην δοκιμαστική έκδοση (trial version). Tο Brand24, από την άλλη, επιτρέπει
την σύγκριση με πάνω από έναν ανταγωνιστή σε οποιαδήποτε έκδοση. Πιο
συγκεκριμένα, εισάγοντας ως ένα νέο «Project» τη λέξη-κλειδί, π.χ. «Booking»,
που πρόκειται για ανταγωνιστή της Airbnb, δίνει την επιλογή της ταυτόχρονης
σύγκρισης μεταξύ τους. Όπως φαίνεται παρακάτω, στην εικόνα 60 γίνεται
σύγκριση μεταξύ των συνολικών αναφορών των δύο keywords και στην εικόνα
61 συνεχίζεται η σύγκριση ανά πηγή ενώ απεικονίζεται και η ανάλυση
συναισθήματος (με τον αριθμό των θετικών και αρνητικών αντιδράσεων).

Εικόνα 60: Διάγραμμα αναφορών Booking-Αirbnb

Εικόνα 61: Σύγκριση Booking-Airbnb

3. Ποιο είναι το κοινωνικό δίκτυο με το μεγαλύτερο engagement με τους


χρήστες;

Η δυνατότητα απεικόνισης του engagement για κάθε μέσο κοινωνικής


δικτύωσης υφίσταται μόνο στο Mentionlytics, όπως φαίνεται και στο παρακάνω

72
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

διάγραμμα (εικόνα 62) όπου το μεγαλύτερο engagement με τους χρήστες


γίνεται μέσω του Twitter. Σε αντίθεση, το Brand24 δεν διαθέτει απεικόνιση του
social engagement ανά κανάλι.

Εικόνα 62: Engagement ανά κανάλι, Mentionlytics

4. Σε ποιο εργαλείο υπάρχει η δυνατότητα της συλλογής ιστορικών


δεδομένων (π.χ. τι αναφορές υπάρχουν για το ίδιο χρονικό διάστημα , το
2019);

Υπάρχει και στα δύο εργαλεία η δυνατότητα συλλογής στοιχείων μέχρι ενός έτους
πιο πριν. Ωστόσο, δεν υπάρχει η εμφάνιση των τάσεων σε μεγαλύτερο βάθος
χρόνου.

5. Υφίσταται η δυνατότητα αποτύπωσης της γεωγραφικής κατανομής των


χρηστών (π.χ. σε επίπεδο χώρας) ανά εργαλείο;

Η δυνατότητα αυτή υφίσταται μόνο στο Mentionlytics και αφορά στην κατανομή
των χρηστών ανά χώρα η οποία εμφανίζεται τόσο με σχετικό χάρτη (με των αριθμό
των αναφορών) όσο και με τη μορφή γραφημάτων (με τα αντίστοιχα ποσοστά).
Αντίθετα, στο Brand24 δεν εμφανίζει σχετικά αποτελέσματα.

6. Υπάρχει δυνατότητα εμφάνισης των κορυφαίων mentioners για κάθε


εργαλείο;

Και τα δύο εργαλεία υφίσταται η σχετική δυνατότητα. Τα αποτελέσματα όμως


διαφέρουν ως προς τον τρόπο που εμφανίζονται. Πιο συγκεκριμένα, στο
Mentionlytics υπάρχει ειδική κατηγορία στον πίνακα ελέγχου, με την ονομασία “Top
Mentioners” που δίνει τη δυνατότητα εύρεσης αυτών είτε ανά κανάλι είτε ανά
κατάταξη (rank), μέσω σχετικών φίλτρων. Αντίθετα, στο Brand24 δεν υπάρχει ειδική
κατηγορία, ενώ τα σχετικά αποτελέσματα εμφανίζονται σε λίστες (π.χ. Top public
profiles, most active sites, most influential sites, κ.λπ.).

73
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

7. Υποστηρίζεται η Ανάλυση Συναισθήματος για κάθε πλατφόρμα των


εργαλείων;

Και τα δύο εργαλεία καθιστούν εφικτή την ανάλυση συναισθήματος ανά


πλατφόρμα. Ωστόσο, τα αποτελέσματα που εξάγει το κάθε εργαλείο φαίνεται να
είναι διαφορετικά. Αυτό μπορεί να συμβαίνει λόγω συλλογής διαφορετικών
δεδομένων. Επίσης, στο Mentionlytics γίνεται απεικόνιση και των ουδέτερων
απαντήσεων (Neutral), σε αντίθεση με το Brand24. Aκολουθούν σχετικές εικόνες με
τα διαφοροποιημένα αποτελέσματα που προέκυψαν σε κάθε εργαλείο
(χρησιμοποιώντας το παράδειγμα του Web).

Εικόνα 63: Ανάλυση Συναισθήματος για το Web, Mentionlytics

Εικόνα 64: Ανάλυση Συναισθήματος για το Web, Brand24

74
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

7. ΣΥΜΠΕΡΑΣΜΑΤΑ
Στην παρούσα εργασία παρουσιάσθηκε το θεωρητικό πλαίσιο της ανάλυσης
δικτύων -στο βαθμό που κρίθηκε αναγκαίο- με περιγραφή των δομικών στοιχείων
αυτών, χρήσιμων δεικτών, καθώς επίσης των κυριότερων μοντέλων, ως έχουν
μελετηθεί από γνωστούς ερευνητές και προκύπτουν βάσει της διεθνούς
βιβλιογραφίας. Εν συνεχεία, παρατέθηκαν τα βασικά στοιχεία καθώς επίσης η
εξέλιξη των δημοφιλέστερων μέσων κοινωνικής δικτύωσης, ως εμφανίστηκαν στον
ψηφιακό κόσμο τα τελευταία χρόνια. Αναμφίβολα, δεν θα μπορούσε να
παραληφθεί η συνοπτική εξέταση της τεχνικής της ανάλυσης συναισθήματος και τα
κυριότερα σημεία αυτής, όπως εφαρμόζεται στα μέσα κοινωνικής δικτύωσης.
Περαιτέρω, δεδομένου ότι αντικείμενο της εργασίας αποτέλεσε η σύγκριση
εργαλείων ανάλυσης κοινωνικών μέσων, παρουσιάσθηκαν συνοπτικά δέκα σχετικά
εργαλεία/πλατφόρμες στην Ελλάδα και διεθνώς, τα οποία χρησιμοποιούν και
αξιοποιούν δεδομένα προερχόμενα από την αλληλεπίδραση μεταξύ των χρηστών
στα μέσα κοινωνικής δικτύωσης. Τα εργαλεία αυτά, παρουσιάζουν κοινά σημεία και
διαφορές που εν πολλοίς οφείλονται στον τύπο των δεδομένων/στοιχείων που
εισάγουν, στον τρόπο επεξεργασίας/ανάλυσης αυτών, καθώς και
εξαγωγής/εμφάνισης των αποτελεσμάτων, τα οποία προφανώς καλύπτουν
διαφορετικές ανάγκες και απευθύνονται σε διαφορετικό κοινό/καταναλωτές (π.χ.
ατομικό – επιχειρηματικό/εταιρικό επίπεδο, μέγεθος εταιρειών/επιχειρήσεων και
αντικείμενο αυτών κ.λπ.).
Εν προκειμένω, κατά την σύγκριση των εργαλείων ανάλυσης κοινωνικών μέσων που
επιλέχθηκαν στο πλαίσιο της παρούσας εργασίας, παρατηρήθηκαν ενδεικτικά τα
εξής:
• Για το κάθε εργαλείο που αναλύθηκε, η αγορά - στόχος ήταν κατά κύριο
λόγο επιχειρήσεις (είτε μικρού, είτε μεσαίου, είτε μεγάλου μεγέθους). Το
Mentionlytics είναι το μόνο που απευθύνεται και σε ιδιώτες ενώ αντίθετα το
Synthesio είναι το μόνο που απευθύνεται αποκλειστικά σε μεγάλες
επιχειρήσεις. To Brandwatch από την άλλη, παρότι προσανατολίζεται κυρίως
προς μεγάλες επιχειρήσεις, παρέχει σημείο εκκίνησης και για μικρές,
καλύπτοντας τις βασικές τους ανάγκες.
• Σε επίπεδο δοκιμής των εργαλείων, κάποια παρέχουν δωρεάν δοκιμή (Free
Trial) ενώ άλλα δίνουν τη δυνατότητα δημιουργίας εξατομικευμένου demo,
συνήθως με τη βοήθεια ομάδων υποστήριξης. Παρά το γεγονός ωστόσο της
δωρεάν δοκιμής, σε κάποια από αυτά, μερικά αποτελέσματα (π.χ.
διαγράμματα) δεν ήταν εμφανή.
• Υφίστανται διαφοροποιήσεις ως προς την άντληση των στοιχείων, όσον
αφορά τις υποστηριζόμενες πλατφόρμες που παρέχει το καθένα εργαλείο
(π.χ. δεν αντλούν όλες στοιχεία για το Youtube)

75
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Σε κάθε περίπτωση αξίζει να σημειωθεί ότι αμφότερα τα εργαλεία παρέχουν


ικανοποιητική πληροφόρηση, ιδίως σε ατομικό-ιδιωτικό επίπεδο. Προφανώς η
χρήση/αξιοποίηση αυτών από πλευράς εταιρειών/επιχειρήσεων σχετίζεται με πιο
απαιτητική πληροφόρηση. Το γεγονός αυτό συνάγεται τόσο από τα δικαιώματα
πρόσβασης σε πρόσθετες πληροφορίες όσο και από την απαίτηση καταβολής
σχετικού αντιτίμου/συνδρομής.
Τέλος σημειώνεται ότι με την εξέλιξη της τεχνολογίας και την πάροδο του χρόνου,
νέες πλατφόρμες και εργαλεία ανάλυσης δεδομένων προφανώς και θα
εμφανιστούν, βελτιώνοντας τις μεθόδους συλλογής, επεξεργασίας, ανάλυσης και εν
γένει διαχείρισης όλου αυτού του πλήθους των πληροφοριών που παράγεται
καθημερινά στα μέσα κοινωνικής δικτύωσης. Παράλληλα, ενδεχομένως τεθούν πιο
επιτακτικά, κρίσιμα νομικά και ηθικά ζητήματα που ήδη έχουν απασχολήσει την
κοινωνία και χρήζουν σχετικής απάντησης, όπως άλλωστε συμβαίνει με κάθε
τεχνολογία που δημιουργείται στην σύγχρονη εποχή και βασίζεται στην επιστήμη
των δεδομένων.

76
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

8. ΒΙΒΛΙΟΓΡΑΦΙΑ
Alaei, A. R., Becken, S., & Stantic, B. (2019). Sentiment analysis in tourism:
capitalizing on big data. Journal of Travel Research, 58(2), 175-191.
Baird, C. H., & Parasnis, G. (2011). From social media to social customer relationship
management. Strategy & leadership, 3(5), 30–37.
Blondel, V. D., Guillaume, J. L., Lambiotte, R., & Lefebvre, E. (2008). Fast unfolding of
communities in large networks. Journal of statistical mechanics: theory
and experiment, 2008(10), P10008.
Boccaletti, S., Latora, V., Moreno, Y., Chavez, M., & Hwang, D. U. (2006). Complex
networks: Structure and dynamics. Physics reports, 424(4-5), 175-308.
Carbonell, J.G. (1981). “Subjective Understanding: Computer Models of Belief
Systems”, retrieved from Ann Arbor, United States.
Costa, L. D. F., Rodrigues, F. A., Travieso, G., & Villas Boas, P. R. (2007).
Characterization of complex networks: A survey of
measurements. Advances in physics, 56(1), 167-242.
Dabbagh, N., & Reo, R. (2011). Back to the future: Tracing the roots and learning
affordances of social software. In Web 2.0-based e-learning: Applying
social informatics for tertiary teaching (pp. 1-20). IGI Global.
Dave, K., Lawrence, S., & Pennock, D. M. (2003, May). Mining the peanut gallery:
Opinion extraction and semantic classification of product reviews. In
Proceedings of the 12th international conference on World Wide Web
(pp. 519-528).
Economist Intelligence Unit (EIU) (2007). Beyond loyalty: Meeting the challenge of
customer engagement.
Gupta, V. & Lehal, G.S. (2009). “A survey of text mining techniques and applications”,
Journal of Emerging Technologies in Web Intelligence, 1(1), 60-76.
Hatzivassiloglou, V., & McKeown, K. (1997, July). Predicting the semantic orientation
of adjectives. In 35th annual meeting of the association for
computational linguistics and 8th conference of the european chapter of
the association for computational linguistics (pp. 174-181).
Hu, M. & Liu, B. (2004). “Mining and summarizing customer reviews”, ACM SIGKDD,
10th International Conference on Knowledge Discovery and Data Mining.
Kantrowitz, M. (2003). “Method and Apparatus for Analyzing Affect and Emotion in
Text”, Google Patents.

77
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Khan, A.Z.H., Atique, M. & Thakare, V.M. (2015). “Combing lexicon-based and
learning –based methods for twitter sentiment analysis”, Paper
presented at the Advanced Technologies in Computing and Networking.
Knoke, D., & Yang, S. (2008). Network fundamentals. Social network analysis, (154),
3-14.
Kumar, A., Bezawada, R., Rishika, R., Janakiraman, R., & Kannan, P. K. (2016). From
social to sale: The effects of firm-generated content in social media on
customer behavior. Journal of Marketing, 80(1), 7-25.
Lee, D., Hosanagar, K., & Nair, H. S. (2018). Advertising content and consumer
engagement on social media: evidence from Facebook. Management
Science, 64(11), 5105-5131.
Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human
language technologies, 5(1), 1-167.
Liu, S., Law, R., Rong, J., Li, G. & Hall, J. (2013). “Analyzing changes in hotel
customers’ expectations by trip mode”, International Journal of
Hospitality Management, 34, 359-371.
Ma, E., Cheng, M. & Hsiao, A. (2018). "Sentiment analysis – a review and agenda for
future research in hospitality contexts", International Journal of
Contemporary Hospitality Management.
Medhat, W., Hassan, A. & Korashy, H. (2014). “Sentiment analysis algorithms and
applications: a survey”, Ain Shams Engineering Journal, 5(4), 1093-1113.
Mosteller, J., & Poddar, A. (2017). To share and protect: Using regulatory focus
theory to examine the privacy paradox of consumers' social media
engagement and online privacy protection behaviors. Journal of
Interactive Marketing, 39, 27-38.
Mullen, T. (2017). “Introduction to sentiment analysis”, available at: https://lct-
master.org/files/MullenSentimentCourseSlides.pdf
Nasukawa, T., & Yi, J. (2003, October). Sentiment analysis: Capturing favorability
using natural language processing. In Proceedings of the 2nd
international conference on Knowledge capture (pp. 70-77).
Pang, B. & Lee, L. (2008). “Opinion mining and sentiment analysis”, Foundations and
Trends in Information Retrieval, 2(1-2), 1-135.
Pang, B., Lee, L. & Vaithyanathan, S. (2002). “Thumbs up? Sentiment classification
using machine learning techniques”, Empirical Methods in Natural
Language Processing (EMNLP) Conference in Philadelphia, pp. 79-86.

78
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Pappas, N. & Popescu-Belis, A. (2013). “Sentiment analysis of user comments for


one-class collaborative filtering over ted talks”, 36th international ACM
SIGIR conference on Research and Development in Information Retrieval.
Pekar, V. & Ou, S. (2008). “Discovery of subjective evaluations of product features in
hotel reviews”, Journal of Vacation Marketing, 14(2), 145-155.
Phua, J., & Ahn, S. J. (2016). Explicating the ‘like’on Facebook brand pages: The effect
of intensity of Facebook use, number of overall ‘likes’, and number of
friends'‘likes’ on consumers' brand outcomes. Journal of Marketing
Communications, 22(5), 544-559.
Sack, W. (1994, July). On the computation of point of view. In Association for the
Advancement of Artificial Intelligence (AAAI) (p. 1488).
Stephen, A. T., Sciandra, M., & Inman, J. (2015). Is it what you say or how you say it?
How content characteristics affect consumer engagement with brands on
Facebook. How Content Characteristics Affect Consumer Engagement
with Brands on Facebook (October 1, 2015). Saïd Business School WP, 19.
Turney, P.D. (2002), “Thumbs up or thumbs down? Semantic orientation applied to
unsupervised classification of reviews”, Proceedings of the 40th Annual
Meeting on Association for Computational Linguistics, Association for
Computational Linguistics, Philadelphia, pp. 417-424.
Vivek, S. D., Beatty, S. E., & Morgan, R. M. (2012). Customer engagement: Exploring
customer relationships beyond purchase. Journal of marketing theory
and practice, 20(2), 122-146.
Wasserman, S., & Faust, K. (1994). Social network analysis: Methods and
applications (Vol. 8). Cambridge university press.
Watts, D.J., & Strogatz, S.H. (1998). Collective dynamics of ‘small-world’
networks. Nature, 393(6684), 440-442.
Wiebe, J.M. (1994). “Tracking point of view in narrative”, Computational Linguistics,
20(2), 233-287.
Wilks, Y. & Bien, J. (1983). “Beliefs, points of view, and multiple environments”,
Cognitive Science, 7(2), 95-119.
Πετροπούλου, Μ. (2015). Μελέτη αλγορίθμων [sic] και μεθοδολογιών και
υλοποίηση πρότυπης τεχνικής ανάλυσης δεδομένων (data analytics) για
τη βελτιστοποίηση της προώθησης προϊόντων και υπηρεσιών μέσω των
κοινωνικών δικτύων (Doctoral dissertation).

79
Ανάλυση Δεδομένων στα Κοινωνικά Δίκτυα Μεταπτυχιακή Εργασία

Web Sites:
https://www.mentionlytics.com/
https://www.talkwalker.com/
https://www.synthesio.com/
https://www.brandwatch.com/
https://www.awario.com/
https://www.mention.com/
https://www.sproutsocial.com/
https://www.hootsuite.com/
https://www.brand24.com/
https://www.digimind.com/
https://www.g2.com/
https://www.capterra.com/
https://influencermarketinghub.com/
https://statista.com/

80

You might also like