«Σημασιολογικός προσδιορισμός απόψεων και. υποκειμενική ταξινόμηση μηνυμάτων κοινωνικών δικτύων» Case study Twitter. Φοιτήτρια: Αικατερίνη Τσαγκαλίδου

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "«Σημασιολογικός προσδιορισμός απόψεων και. υποκειμενική ταξινόμηση μηνυμάτων κοινωνικών δικτύων» Case study Twitter. Φοιτήτρια: Αικατερίνη Τσαγκαλίδου"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Σημασιολογικός προσδιορισμός απόψεων και υποκειμενική ταξινόμηση μηνυμάτων κοινωνικών δικτύων» Case study Twitter Φοιτήτρια: Αικατερίνη Τσαγκαλίδου Επιβλέπων: Αθηνά Βακάλη Αναπληρώτρια Καθηγήτρια τμήματος Πληροφορικής Θεσσαλονίκη, Φεβρουάριος 2011

2 ΠΡΟΛΟΓΟΣ Η παρούσα διπλωματική εργασία εκπονήθηκε στο πλαίσιο του Μεταπτυχιακού Προγράμματος Σπουδών της κατεύθυνσης «Πληροφοριακά Συστήματα» του τμήματος Πληροφορικής του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης. Το αντικείμενο της εργασίας είναι η μελέτη, ο σχεδιασμός και η υλοποίηση μιας σημασιολογικής μεθόδου προσδιορισμού απόψεων και υποκειμενικής ταξινόμησης μηνυμάτων που προέρχονται από κοινωνικά δίκτυα και micro blogging υπηρεσίες. Η μελέτη περίπτωσης (case study) αφορά στο Twitter. Στο σημείο αυτό θα ήθελα να εκφράσω τις ειλικρινείς ευχαριστίες μου στην Αναπληρώτρια Καθηγήτρια κα Αθηνά Βακάλη, επιβλέπουσα της παρούσας διπλωματικής, για την ανάθεση της εργασίας, την υποστήριξή της, τις συμβουλές και παραινέσεις της καθ όλη τη διάρκεια εκπόνησής της, όπως επίσης και την Διδάκτορα κα Βασιλική Κουτσονικόλα, μέλος της ερευνητικής ομάδας του τμήματος, για την πολύτιμη, ευχάριστη και εποικοδομητική συνεργασία μας. Επιπλέον θα ήθελα να ευχαριστήσω τον κο Κωνσταντίνο Καφέτσιο, Επίκουρο Καθηγητή του τμήματος Ψυχολογίας του πανεπιστημίου της Κρήτης για τις επισημάνσεις και υποδείξεις του σχετικά με τα συναισθήματα και την εξαγωγή συμπερασμάτων από αυτά. Θεσσαλονίκη, Φεβρουάριος 2011 Αικατερίνη Τσαγκαλίδου Σελίδα 2 από 66

3 ABSTRACT This thesis describes the implementation of a method for the semantic opinion orientation and subjectivity classification of short messages coming from the microblogging service Twitter. Tweet messages are assessed as positive and negative with respect to a query. The implementation was done with the object-oriented high level computer language Python and our datasets were taken via the Application Programming Interface API of Twitter. We have use three datasets that concerns queries about Lady Gaga, Christmas and Wikileaks. Primarily we have study the research domain of Opinion Mining and Sentiment Analysis and highlight the unsolved problems that researchers facing now days. We record the theoretical concepts of the field and highlight the usefulness of lexiconbased techniques. The semantic analysis of our method relies on an opinion lexicon which furthermore enriched with synonymous words from WordNet (synsets). Our lexicon contains words and small phrases which are scored with an arithmetic value that indicate the semantic orientation of them and is independent from text. Finally we evaluate the results of our experiment processes and propose furthermore improvements for our method. Σελίδα 3 από 66

4 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή Οριοθέτηση του ερευνητικού πεδίου Ανοικτά προβλήματα Συνεισφορά της εργασίας Η δομή της εργασίας Εξόρυξη Γνώμης - Σημασιολογική Ανάλυση Θεμελιώδεις έννοιες και Ορισμοί Προηγούμενες εργασίες Lexicon-Based Τεχνικές Τεχνικές Μηχανικής Μάθησης Λεξικό Απόψεων Μέθοδοι δημιουργίας λεξικών Πλεονεκτήματα - Μειονεκτήματα Κοινωνικό δίκτυο «Twitter» Ενδιαφέροντα στατιστικά στοιχεία Δυσκολίες ανάλυσης των tweets Παρουσίαση της μεθόδου Τα Σύνολα Δεδομένων Προετοιμασία δεδομένων Δημιουργία λεξικού...40 Σελίδα 4 από 66

5 5.2.1 Εμπλουτισμός λεξικού Υποκειμενική ταξινόμηση των tweets Συγκεντρωτική παρουσίαση των αποτελεσμάτων της πειραματικής διαδικασίας Σύνολο Δεδομένων «Χριστούγεννα» Σύνολο Δεδομένων «Lady Gaga» Σύνολο Δεδομένων «Wikileaks» Συμπεράσματα...61 ΒΙΒΛΙΟΓΡΑΦΙΑ...64 Σελίδα 5 από 66

6 1o ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ Πολύ πριν την καθολική εξάπλωση του παγκόσμιου ιστού υπήρχε η ανάγκη της κατανόησης της γνώμης και της άποψης των συνανθρώπων μας. Εδώ και αρκετά χρόνια η ανάγκη αυτή πραγματοποιείται, ως επί το πλείστον, μέσα από τη μεγαλύτερη πηγή αναζήτησης πληροφοριών που είναι ο παγκόσμιος ιστός. Οι τεχνολογίες του web 2.0 επέτρεψαν την δημιουργία διαδικτυακών κοινοτήτων (forums, blogs, social networks) οι οποίες έχουν καθιερωθεί πλέον στην συνείδηση των χρηστών γιατί τους δίνουν την δυνατότητα να γνωρίζουν τις απόψεις άλλων χρηστών, να ανταλλάσουν πληροφορίες, να συνομιλούν και γενικότερα να σχολιάζουν γεγονότα που τους απασχολούν. Αυτή η νέα νοοτροπία αποτυπώνεται σε έρευνα που αναφέρεται στην εργασία [17] και από την οποία προκύπτει ότι το 81% των χρηστών έχουν προβεί σε αναζήτηση γνώμης για κάποιο προϊόν, τουλάχιστον μια φορά και το 20% αυτών το κάνουν σε καθημερινή βάση. Ανάμεσα στους χρήστες των blogs ποσοστό που κυμαίνεται από 73% έως το 87% δηλώνουν ότι έχουν επηρεαστεί θετικά ή αρνητικά από τις γνώμες που διαβάζουν. Ποσοστό χρηστών της τάξεως του 32% έχει ψηφίσει online για κάποιο προϊόν ή υπηρεσία ενώ 30% των χρηστών του δείγματος δηλώνουν ότι έχουν γράψει κριτική για κάποια υπηρεσία ή προϊόν που χρησιμοποίησαν. Σε άλλη έρευνα, που διεξήχθη σε δείγμα αμερικανών ενηλίκων πολιτών, προκύπτει ότι στις πολιτικές εκλογές του 2006 οι πολίτες χρησιμοποίησαν το διαδίκτυο για την αναζήτηση της επικρατούσας πολιτικής τάσης. Αντίστοιχη έρευνα της MRB [40] για τα κοινωνικά δίκτυα (social media) στην Ελλάδα που διεξήχθη το 2009 παρουσιάζει ότι η μεγάλη πλειοψηφία των χρηστών του διαδικτύου θεωρεί ότι οι προσφερόμενες υπηρεσίες των δικτύων είναι πολύ θετικές. Τα σχετικά στατιστικά ποσοστά της έρευνας αφορούν στην ενημέρωση / πληροφόρηση (50,1%), την επικοινωνία (25,9%) και την διασκέδαση / ψυχαγωγία (23,0%). Σελίδα 6 από 66

7 1o ΚΕΦΑΛΑΙΟ 1.1 Οριοθέτηση του ερευνητικού πεδίου Τα δεδομένα που διοχετεύονται από τους χρήστες στο διαδίκτυο είναι κυρίως πληροφορία κειμένου (textual information), η οποία κατηγοριοποιείται σε γεγονότα (facts) και απόψεις (opinions) [1]. Τα γεγονότα είναι αντικειμενικές εκφράσεις σχετικές με οντότητες (entities), συμβάντα (events) και τις ιδιότητές τους (properties). Οι απόψεις είναι συνήθως υποκειμενικές εκφράσεις και περιγράφουν τη συναισθηματική κατάσταση των ανθρώπων, τις εκτιμήσεις ή τα αισθήματά τους σχετικά με μια οντότητα ή ένα συμβάν. Οι περισσότερες μελέτες που έχουν γίνει πάνω στον τομέα αυτό, επικεντρώνονται κυρίως στα γεγονότα και όχι στις απόψεις (π.χ. web search, text clustering text classification, information retrieval κ.α.). Οι εργασίες που μελετούν τις υποκειμενικές απόψεις των χρηστών, αναλύοντας το σημασιολογικό προσανατολισμό τους, είναι συγκριτικά λιγότερες, κυρίως γιατί η ανάγκη αυτή προέκυψε μετά την καθολική χρήση του web 2.0, το οποίο έχει αλλάξει δραματικά τον τρόπο που εκφράζονται οι χρήστες στο διαδίκτυο. Η συλλογή των υποκειμενικών απόψεων των χρηστών που καταγράφονται σε κοινωνικά δίκτυα (discussion groups, forums, blogs) ονομάζεται «User-Generated Content» (UGC) 1. Αυτή η συλλογή δημιουργεί μια νέα μετρήσιμη πηγή δεδομένων που έχει πρακτική εφαρμογή σε πολλά πεδία. Ωστόσο η ανεύρεση και η παρακολούθηση των απόψεων των χρηστών είναι δύσκολο έργο. Στις περισσότερες περιπτώσεις η πληροφορία είναι «κρυμμένη» μέσα σε κείμενα με αντιφατική, πολλές φορές, σημασιολογία. Γι αυτό το λόγο αναπτύχθηκε ο τομέας της Σημασιολογικής Ανάλυσης (Semantic Analysis - SA) ή αλλιώς Εξόρυξη Γνώμης (Opinion Mining - OM) που ασχολείται με την επεξεργασία της φυσικής γλώσσας και την εξόρυξη πληροφορίας από αυτήν. 1 Στη βιβλιογραφία αναφέρονται και άλλοι συνώνυμοι όροι όπως: Consumer Generated Media (CGM) και User-Created Content (UCC). Σελίδα 7 από 66

8 1o ΚΕΦΑΛΑΙΟ 1.2 Ανοικτά προβλήματα Πολλές εμπορικές εφαρμογές που έχουν αναπτυχθεί (e-shops,) χρησιμοποιούν ως πηγή πληροφοριών τις συλλογές UGC και υπόσχονται ότι ανακαλύπτουν την επικρατούσα άποψη των χρηστών χρησιμοποιώντας τεχνικές σημασιολογικής ανάλυσης. Όμως, όπως επισημαίνεται σε συζητήσεις καταγεγραμμένες σε διαδικτυακά blogs [38], τις περισσότερες φορές τα μηνύματα των χρηστών κατηγοριοποιούνται ως ουδέτερα, ήτοι σημαίνει ότι οι εφαρμογές αποτυγχάνουν να ανακαλύψουν κάποια θετική ή αρνητική άποψη (η συζήτηση είχε ως παράδειγμα το brand name Starbucks). Γι αυτό και μέχρι σήμερα η αυτοματοποιημένη σημασιολογική ανάλυση δεν είναι απόλυτα αποδεκτή, γιατί δεν εξυπηρετεί πλήρως ούτε τους χρήστες ούτε τις επιχειρήσεις, οι οποίοι αποσκοπούν σε πιο σαφή και αξιόπιστα αποτελέσματα. Οι απόψεις αυτές αντανακλούν τις ανησυχίες των ενημερωμένων χρηστών και καθιστούν σαφές ότι υπάρχει πλέον ισχυρή απαίτηση για ολοκληρωμένες λύσεις. Ο Bing Liu, καθηγητής του πανεπιστημίου του Illinois, που προσέφερε πολλά στην έρευνα της σημασιολογικής ανάλυσης, σε συνέντευξή του [39] επισημαίνει ότι η πρόοδος στο συγκεκριμένο τομέα είναι σχετικά αργή, γιατί οι ερευνητές συχνά δεν γνωρίζουν πια προβλήματα είναι πρακτικά κρίσιμα και αναλώνονται σε διάφορες μη συγκλειόμενες μελέτες. Αυτή η αργή εξέλιξη των ερευνών καθιστά ύποπτο το γεγονός ότι ορισμένες εφαρμογές, διαφημιστικών κυρίως εταιρειών, υποστηρίζουν ότι παρέχουν σημασιολογικές αναλύσεις και κατηγοριοποιούν δημοφιλή προϊόντα σύμφωνα με τις απόψεις των χρηστών. Σε πολλές από αυτές δε, παραθέτονται και ορισμένα παραδείγματα από τα μηνύματα, θέλοντας να ενισχύσουν την αξιοπιστία των αποτελεσμάτων που παρέχουν. Το ερώτημα που τίθεται είναι, γιατί εμφανίζονται μόνο λίγα μηνύματα και δεν παρουσιάζεται ένα ικανοποιητικό τυχαίο δείγμα, ώστε ο χρήστης να μπορεί να αξιολογήσει με διαφάνεια τα αποτελέσματα; Μήπως πίσω από την πρακτική αυτή κρύβονται επιχειρηματικές μέθοδοι προώθησης προϊόντων; Μήπως οι εφαρμογές αδυνατούν να παρουσιάσουν περισσότερα μηνύματα γιατί δεν μπορούν να επιτύχουν ικανοποιητική ακρίβεια στα αποτελέσματα; Σελίδα 8 από 66

9 1o ΚΕΦΑΛΑΙΟ Όμως πώς εκτιμάται η ακρίβεια των αποτελεσμάτων μιας αυτοματοποιημένης σημασιολογικής ανάλυσης; Μέχρι σήμερα δεν υπάρχει κάποια μετρική που να αξιολογεί την ορθότητα του σημασιολογικού προσδιορισμού ενός κειμένου. Κάποιοι θα υποστήριζαν ότι η καλύτερη μέθοδος αξιολόγησης είναι η πλήρη κατανόηση των γλωσσικών και συντακτικών κανόνων και η αποτύπωσή τους σε υπολογιστικές μεθόδους. Όμως κάθε γλώσσα έχει τις δικές της ιδιαιτερότητες, κατά συνέπεια απαιτούνται διαφορετικές προσεγγίσεις για κάθε μια ξεχωριστά. Επιπλέον πολλοί παράγοντες επηρεάζουν τον τρόπο με τον οποίο εκφράζονται οι χρήστες. Το μορφωτικό και κοινωνικό επίπεδο, ο πολιτισμός και η κουλτούρα, οι προσωπικές ιδιαιτερότητες καθενός είναι κάποιοι από τους παράγοντες που διαμορφώνουν τον γραπτό λόγο των χρηστών [25] και αυξάνουν σημαντικά τις παραμέτρους της ανάλυσης. Από τα παραπάνω συμπεραίνουμε ότι ο τομέας της σημασιολογικής ανάλυσης είναι ακόμα ένα ανοικτό πεδίο έρευνας. Οι προσεγγίσεις και οι μέθοδοι που παρουσιάζονται στην βιβλιογραφία δεν έχουν απορροφηθεί ακόμα από την βιομηχανία γι αυτό και δεν υπάρχουν εκτενείς συγκριτικές αναφορές, ενώ οι ερευνητικές εργασίες συνήθως εφαρμόζονται σε ένα περιορισμένο σύνολο δεδομένων. Γι αυτό οι ερευνητές [39] προτείνουν, κάθε καινοφανής ιδέα που παρουσιάζεται, να συνδυάζετε επιτυχημένα με υπάρχουσες προσεγγίσεις ώστε να εμπλουτίζεται η βάση γνώσης του ερευνητικού πεδίου και να αναδύονται οι ιδιαιτερότητές του. Σελίδα 9 από 66

10 1o ΚΕΦΑΛΑΙΟ 1.3 Συνεισφορά της εργασίας Καθημερινά, εκατομμύρια ανθρώπων καταθέτουν τις απόψεις και τις σκέψεις τους για διάφορα θέματα στα κοινωνικά δίκτυα. Η κατανόηση όμως του περιεχομένου των μηνυμάτων και αν αυτά εκφράζουν θετική ή αρνητική άποψη γίνεται αντιληπτή μόνο από τους ανθρώπους. Στην παρούσα εργασία παρουσιάζουμε μια μέθοδο που σχετίζεται με το σημασιολογικό προσδιορισμό των απόψεων και την υποκειμενική ταξινόμηση μηνυμάτων που προέρχονται από το κοινωνικό δίκτυo Twitter. Το Twitter είναι ένα παγκόσμιο δίκτυο επικοινωνίας που δεν έχει ακόμα πολλούς φανατικούς χρήστες στην Ελλάδα, αλλά έχει δισεκατομμύρια αφοσιωμένων χρηστών ανά τον κόσμο που το χρησιμοποιούν καθημερινά. Παρουσιάζει μια σημαντική διαφορά σε σχέση με άλλα, γνωστότερα δίκτυα όπως το Facebook, MSN κλπ. Ο χρήστης μπορεί να δημοσιεύσει ένα κείμενο περιορισμένης έκτασης (140 χαρακτήρες) το οποίο ονομάζεται «tweet». Γενικότερα τα tweets δεν είναι τόσο στοχαστικά, με την έννοια ότι δεν έχουν μια σαφώς εκφρασμένη άποψη σχετικά με ένα αντικείμενο όπως συνηθίζεται σε forums και blogs. Σχήμα 1: Απεικόνιση της μεθόδου Σελίδα 10 από 66

11 1o ΚΕΦΑΛΑΙΟ Η μέθοδος που προτείνεται είναι η πρώτη προσέγγιση στο πρόβλημα και περιλαμβάνει τη μελέτη, το σχεδιασμό και την υλοποίηση της διαδικασίας. Η μέθοδος χωρίζεται σε τρία διακριτά στάδια. Στο πρώτο στάδιο γίνεται η συλλογή των συνόλων δεδομένων χρησιμοποιώντας το Application Programming Interface (API) του Twitter. Τα δεδομένα προετοιμάζονται κατάλληλα για να συμμετέχουν στην περαιτέρω διαδικασία. Στο δεύτερο στάδιο, χρησιμοποιούμε μια λίστα λέξεων την οποία ονομάζουμε «Λεξικό απόψεων» που περιέχει λέξεις και φράσεις της αγγλικής γλώσσας οι οποίες είναι σημασιολογικά προσδιορισμένες σε θετικές και αρνητικές. Ο σημασιολογικός προσδιορισμός τους αποτυπώνεται από μια αριθμητική τιμή που κυμαίνεται μεταξύ του διαστήματος [-1, 1]. Περαιτέρω υλοποιούμε τεχνικές εμπλουτισμού του Λεξικού απόψεων αναζητώντας συνώνυμες λέξεις και φράσεις από το online λεξικό WordNet. Στο τελευταίο στάδιο της μεθόδου, υλοποιούμε lexicon-based τεχνικές για την υποκειμενική ταξινόμηση των μηνυμάτων χρησιμοποιώντας τα παραγόμενα δεδομένα των δύο προηγούμενων σταδίων. Το αποτέλεσμα της μεθόδου είναι η υποκειμενική ταξινόμηση των μηνυμάτων που προκύπτει από την επισήμανση των θετικών και αρνητικών απόψεων των χρηστών. Η υλοποίηση της μεθόδους έγινε με την αντικειμενοστραφή γλώσσα υψηλού επιπέδου Python η οποία επιλέχθηκε γιατί είναι open-source και παρέχει βιβλιοθήκες δυναμικής σημασιολογίας. Η πρακτική εφαρμογή μιας μεθόδου σημασιολογικού προσδιορισμού απόψεων και η χρήση της ως ένα εργαλείο, εξυπηρετεί την πλειοψηφία των χρηστών του διαδικτύου γιατί καλύπτει την καθημερινή απαίτησή τους για ενημέρωση παρέχοντας άμεσα αποτελέσματα. Αρκεί να αναλογιστούμε, πόσες φορές δεν έχουμε δαπανήσει χρόνο, ψάχνοντας πληροφορίες και απόψεις άλλων χρηστών για κάποιο προϊόν ή υπηρεσία ή πόσες φορές δεν έχουμε διαβάσει δημοσκοπήσεις σε διάφορες δημοσιογραφικές ιστοσελίδες, ψάχνοντας την επικρατούσα άποψη σχετικά με ένα πολιτικό ή κοινωνικό γεγονός. Πόσο ευκολότερο θα ήταν για όλους, αν κάθε κοινωνικό δίκτυο παρείχε μια μέθοδο αναζήτησης όπου εισάγοντας ο χρήστης μια λέξη-κλειδί εμφανίζονταν τα μηνύματα ταξινομημένα ως προς τη άποψη που εκφράζουν. Σελίδα 11 από 66

12 1o ΚΕΦΑΛΑΙΟ Τα οφέλη μιας τέτοιας μεθόδου είναι άμεσα ορατά και για τις επιχειρήσεις και για άλλους κοινωνικοπολιτικούς φορείς, οι οποίοι θα έχουν τη δυνατότητα, γρήγορα, άμεσα και κυρίως χωρίς ιδιαίτερο κόστος, να αντλούν χρήσιμες πληροφορίες για τις απόψεις των χρηστών σχετικά με προϊόντα ή υπηρεσίες, που θα τους βοηθήσουν να βελτιώσουν τις μελλοντικές τους στρατηγικές. Επί του παρόντος, μεγάλοι επιχειρηματικοί όμιλοι και πολιτικοί φορείς δαπανούν μεγάλο μέρος των προϋπολογισμών τους, αναζητώντας τις απόψεις των πολιτών κυρίως μέσω δημοσκοπήσεων. Η δημοσιοποίηση των αποτελεσμάτων των ερευνών δεν είναι πάντα γνωστοποιήσιμη στο ευρύτερο κοινό ενώ ορισμένες φορές η επεξεργασία των αποτελεσμάτων και η παρουσίασή τους δεν βοηθάει στον συμπερασμό μιας άμεσα θετικής ή αρνητικής άποψης. 1.4 Η δομή της εργασίας Στο δεύτερο κεφάλαιο γίνεται μια εισαγωγή στο γνωστικό αντικείμενο της Εξόρυξης Γνώμης (Opinion Mining - OM) και της Σημασιολογικής Ανάλυσης (Semantic Analysis SA), αναφέρονται οι βασικοί ορισμοί και οι θεωρητικές έννοιες που πλαισιώνουν το πεδίο και καταγράφονται οι επικρατέστερες μέθοδοι σημασιολογικής ανάλυσης που μελετήθηκαν σε σχετικές εργασίες. Στο τρίτο κεφάλαιο γίνεται αναφορά στην έννοια του Λεξικού Απόψεων (Opinion Dictionary OD) και περιγράφονται οι τεχνικές που χρησιμοποιήθηκαν σε ερευνητικές εργασίες για τον προσδιορισμό της σημασιολογίας των λέξεων ενώ στο τέλος του κεφαλαίου αναφέρουμε τα πλεονεκτήματα και τα μειονεκτήματα της χρήσης των λεξικών αυτών. Στο τέταρτο κεφάλαιο γίνεται μια σύντομη παρουσίαση του κοινωνικού δικτύου Twitter, αναφέρονται ενδιαφέροντα στατιστικά στοιχεία της υπηρεσίας και γίνεται μια καταγραφή των δυσκολιών ανάλυσης και επεξεργασίας των μηνυμάτων που προέρχονται από το συγκεκριμένο κοινωνικό δίκτυο. Σελίδα 12 από 66

13 1o ΚΕΦΑΛΑΙΟ Στο πέμπτο κεφάλαιο καταγράφονται τα στάδια υλοποίησης της μεθόδου, ξεκινώντας από τη διαδικασία συλλογής των συνόλων δεδομένων, το είδος τους και τις τεχνικές προετοιμασίας τους. Στη συνέχεια παρουσιάζεται η μέθοδος επεξεργασίας ενός λεξικού απόψεων που περιέχει σημασιολογικά βαθμολογημένες λέξεις και φράσεις της αγγλικής γλώσσας και οι διαδικασίες εμπλουτισμού του με συνώνυμους όρους. Στο τελευταίο στάδιο παρουσιάζεται η μέθοδος του σημασιολογικού προσδιορισμού των απόψεων και η υποκειμενική ταξινόμηση των μηνυμάτων που πραγματοποιείται συνδυάζοντας τα παραγόμενα αποτελέσματα των δύο προηγούμενων φάσεων. Στο έκτο κεφάλαιο αρχικώς παρουσιάζονται συγκεντρωτικά τα αποτελέσματα των πειραμάτων που έγιναν ενώ στη συνέχεια αναλύονται επιμέρους τα σύνολα δεδομένων και καταγράφονται οι προβληματισμοί και οι παρατηρήσεις μας για το καθένα ξεχωριστά. Στο έβδομο κεφάλαιο αναφέρονται τα συμπεράσματα που προέκυψαν από την ολοκλήρωση της διαδικασίας και παρουσιάζονται οι προτάσεις μας για την περαιτέρω βελτίωσή της. Τέλος αναφέρονται οι βιβλιογραφικές πηγές και οι ερευνητικές εργασίες που μελετήθηκαν και συνέβαλαν στην ολοκλήρωση της μεθόδου μας. Σελίδα 13 από 66

14 2 ο ΚΕΦΑΛΑΙΟ 2. ΕΞΟΡΥΞΗ ΓΝΩΜΗΣ - ΣΗΜΑΣΙΟΛΟΓΙΚΗ ΑΝΑΛΥΣΗ Η «Εξόρυξη Γνώμης» (Opinion Mining) είναι ένας όρος που πρωτοεμφανίζεται στα πλαίσια του συνεδρίου «International World Wide Web Conferences» το Ενδεχομένως ο τόπος δημοσίευσης, εν μέρει, να εξηγεί τη δημοτικότητα και την αποδοχή του στην ευρύτερη επιστημονική κοινότητα, όμως έως ένα μεγάλο βαθμό η ερμηνεία του συνδεόταν με την αναζήτηση πληροφοριών στο διαδίκτυο και την ανάκτηση πληροφορίας [16]. Το παρελθόν του όρου «Σημασιολογική Ανάλυση» (Sentiment Analysis) είναι παράλληλο με αυτό της εξόρυξης γνώμης [17]. Ο όρος «σημασιολογία» χρησιμοποιήθηκε αρχικά για την αυτόματη ανάλυση και αξιολόγηση ενός κειμένου για την παρακολούθηση της προβλέψιμης κρίσης, κυρίως σε εργασίες που αφορούσαν στην ανάλυση της συναισθηματικής αγοράς [21, 22]. Ωστόσο σήμερα έχει μια ευρύτερη έννοια που αφορά στην υπολογιστική αντιμετώπιση της γνώμης, του συναισθήματος και της υποκειμενικότητας ενός κειμένου. Η ερευνητική δραστηριότητα της Εξόρυξης γνώμης και της Συναισθηματικής ανάλυσης δεν έχει μεγάλο παρελθόν. Η επιστημονική κοινότητα έχει δείξει έντονο ενδιαφέρον από το 2000 και μετά, όπου υπάρχει ραγδαία αύξηση των βιβλιογραφικών αναφορών και μελετών για το συγκεκριμένο πεδίο [16]. Σχήμα 2: Διάγραμμα ερευνητικής δραστηριότητας Σελίδα 14 από 66

15 2 ο ΚΕΦΑΛΑΙΟ Οι παράγοντες που συνέβαλαν στην έξαρση της ερευνητικής δραστηριότητας στο τομέα αυτό είναι [17]: η αύξηση των μεθόδων στις διαδικασίες επεξεργασίας της φυσικής γλώσσας και της ανάκτησης πληροφορίας, η διαθεσιμότητα πληθώρας συνόλων δεδομένων λόγω της άνθησης του παγκόσμιου ιστού και των κοινωνικών δικτύων και η συνειδητοποίηση των διανοητικών προκλήσεων, της εμπορικότητας και των ευφυών εφαρμογών που μπορεί να προσφέρει το συγκεκριμένο ερευνητικό πεδίο. Γιατί όμως η εξόρυξη γνώμης είναι τόσο σημαντική και γιατί υπάρχει τόσο έντονο ενδιαφέρον; Οι επιχειρήσεις δαπανούν μεγάλα ποσά σε έρευνες αγοράς ώστε να ανακαλύψουν τη γνώμη των καταναλωτών σχετικά με κάποιο προϊόν ή υπηρεσία. Στο ίδιο μήκος κύματος κινούνται και πολιτικοκοινωνικοί φορείς, διεξάγοντας τακτικά έρευνες σχετικές με τη γνώμη των πολιτών και πως αυτοί αντιλαμβάνονται τις πολιτικές και κοινωνικές εξελίξεις. Και στις δύο προαναφερόμενες περιπτώσεις οι αναλυτές είναι επικεντρωμένοι σε ένα μοντέλο ανάλυσης που αποτελείται από ένα δείγμα ανθρώπων και ένα ερωτηματολόγιο. Η διαδικασία συλλογής και επεξεργασίας των απαντήσεων είναι αργή, δαπανηρή και συνήθως το αποτέλεσμα αντιπροσωπεύει ένα συγκεκριμένο δείγμα ανθρώπων με κάποια ιδιαίτερα κοινωνικοοικονομικά χαρακτηριστικά. Το κόστος της διαδικασίας είναι απαγορευτικό και αποτρεπτικό για τις μικρές επιχειρήσεις. Στο αντίποδα, μια μέθοδος σημασιολογικής ανάλυσης και εξόρυξης γνώμης, απαιτείται την ελάχιστη ανθρώπινη συμμετοχή, συνήθως την εισαγωγή μιας φράσης κλειδί, είναι γρήγορη και φτηνή με άμεσα αποτελέσματα, αντιπροσωπεύει συντριπτικά μεγαλύτερο δείγμα και μπορεί να χρησιμοποιηθεί άμεσα από όλους, είτε είναι απλοί χρήστες είτε επιχειρήσεις είτε άλλοι φορείς. Σελίδα 15 από 66

16 2 ο ΚΕΦΑΛΑΙΟ Υπάρχουν όμως σημαντικές δυσκολίες που πρέπει να ξεπεραστούν έως ότου φτάσουμε στο ιδανικό σημείο που περιγράφουμε παραπάνω. Οι δυσκολίες πάνω στις οποίες σκοντάφτει σήμερα η τεχνολογία είναι σχετικές με: α) το μεγάλο όγκο δεδομένων, τις περισσότερες φορές μη ταξινομημένο και κατηγοριοποιημένο (ελεύθερο κείμενο), γ) την εντοπισμό των απόψεων που προκύπτουν συνήθως έμμεσα μέσα από κείμενα (forums) και σύντομα μηνύματα των χρηστών (twitter, facebook, msn), δ) την δυσκολία επεκτασιμότητας των μεθόδων, συνήθως οι τεχνικές που αναπτύσσονται σε κάποιον πεδίο εφαρμογής (domain), δεν έχουν αξιόλογα αποτελέσματα αν εφαρμοσθούν σε άλλο πεδίο. Πέραν των ανωτέρων, οι ερευνητές και όσοι ασχολούνται με το συγκεκριμένο επιστημονικό πεδίο συχνά διαφωνούν για το κατά πόσο μια γραπτή δήλωση αποτελεί ξεκάθαρα γνώμη ή όχι. Σύμφωνα με την εργασία [16] οι απόψεις που είναι καταχωρημένες στο διαδίκτυο διακρίνονται σε δύο είδη: στις απόψεις - γνώμες, όπως οι φράσεις αλήθεια, ψέμα, είναι δυνατόν, είναι απίθανο και στις αποφάσεις κρίσεις, όπως οι λέξεις καλός, κακός, ουδέτερος, σοφός, ανόητος κ.α. Ωστόσο η μεταξύ τους διάκριση εξακολουθεί να είναι δύσκολη γιατί ενώ κάποιος μπορεί να αντιλαμβάνεται μια φράση ως άποψη, κάποιος άλλος να έχει διαφορετική υποκειμενική άποψη. Για παράδειγμα η πρόταση «πιστεύω ότι αυτός είναι έξυπνος» μπορεί να χαρακτηρισθεί και ως άποψη και ως απόφαση. Σελίδα 16 από 66

17 2 ο ΚΕΦΑΛΑΙΟ 2.1 Θεμελιώδεις έννοιες και Ορισμοί Είναι γνωστό το πρόβλημα των ερμηνειών και των ορισμών που προκύπτει σε κάθε τομέα. Στο παρόν κεφάλαιο θα αναφέρουμε τους βασικότερους από αυτούς, που εξυπηρετούν στην κατανόηση των αρχών του πεδίου της σημασιολογίας κειμένων. Η σημασιολογική ανάλυση ή εξόρυξη γνώμης είναι ο συνδυασμός μελέτης της άποψης, της σημασιολογίας και του συναισθήματος ενός κειμένου. Κύριος στόχος της είναι ο προσδιορισμός ή ο προσανατολισμός της άποψης που εκφράζει ένα κείμενο, μια διαδικασία που περικλείει ως επιμέρους στόχο και τη διάκριση μεταξύ υποκειμενικής και αντικειμενικής άποψης [1]. Σημασιολογική ανάλυση Εξόρυξη γνώμης Προσδιορισμός Σημασιολογίας Sentiment orientation Ταξινόμηση Classification Θετική Positive Αρνητική Υποκειμενική Subjective Negative Ουδέτερη Neutral Αντικειμενική Objective Σχήμα 3: Κατηγορίες σημασιολογικού προσδιορισμού και ταξινόμησης Σελίδα 17 από 66

18 2 ο ΚΕΦΑΛΑΙΟ Στη βιβλιογραφία συναντούμε συχνά τους συνώνυμους όρους «Συναισθηματική Κατηγοριοποίηση» (Sentiment Classification) και «Εξαγωγή Γνώμης» (Opinion Extraction) [16]. Ορισμός 1: Κάτοχος άποψης (opinion holder): Ο κάτοχος μιας άποψης είναι αυτός που την εκφράζει και μπορεί να είναι ένα υποκείμενο, ένας οργανισμός, μια ομάδα κ.α. Ορισμός 2: Προσδιορισμός Άποψης (Opinion orientation) 2 : Ο προσδιορισμός της άποψης, που αφορά σε ένα χαρακτηριστικό, υποδεικνύει εάν η άποψη είναι θετική, αρνητική ή ουδέτερη. Ορισμός 3: Συναισθήματα (emotions): Τα συναισθήματα είναι οι αισθήσεις και οι σκέψεις ενός υποκειμένου. Τα συναισθήματα είναι ένα ιδιαίτερο πεδίο έρευνας με το οποίο έχουν ασχοληθεί πολλοί επιστημονικοί τομείς, όπως η ψυχολογία, η φιλοσοφία, η κοινωνιολογία, η βιολογία κ.α. Παρόλα αυτά δεν υπάρχει ακόμα μια κοινά αποδεκτή βάση αναφοράς των συναισθηματικών κατηγοριών. Βασιζόμενοι στις εργασίες [3, 4, 25, 32] διακρίνουμε έξι κύριες κατηγορίες συναισθημάτων: αγάπη (love), χαρά (joy), έκπληξη (surprise), θυμό (anger), λύπη (fear) και φόβο (fear). Κάθε μια από τις κατηγορίες αυτές μπορεί να περιέχει πολλές ακόμα υποκατηγορίες κατηγοριοποιώντας περαιτέρω την ένταση των συναισθημάτων. Ορισμός 4: Πρόταση με άποψη (opinioned sentence) ονομάζεται μια πρόταση που εκφράζει άμεση ή έμμεση, θετική ή αρνητική άποψη. Η πρόταση αυτή μπορεί να είναι είτε υποκειμενική είτε αντικειμενική. Ορισμός 5: Αντικειμενική - Υποκειμενική πρόταση (sentence objectivity subjectivity): Μια αντικειμενική πρόταση εκφράζει κάποια πραγματική πληροφορία για τον κόσμο, ενώ μια υποκειμενική εκφράζει απόψεις και πεποιθήσεις. 2 Στη βιβλιογραφία αναφέρονται και άλλοι συνώνυμοι όροι όπως: polarity of opinion και semantic orientation. Σελίδα 18 από 66

19 2 ο ΚΕΦΑΛΑΙΟ Οι υποκειμενικές προτάσεις έχουν διάφορες μορφές όπως για παράδειγμα ισχυρισμούς, επιθυμίες, υποθέσεις, υποψίες, όμως υπάρχει και η περίπτωση να μην περιέχουν καμία άποψη. Το ίδιο παρατηρείται και σε ορισμένες αντικειμενικές προτάσεις. Με τους ορισμούς 4 & 5 γίνεται σαφής ο διαχωρισμός μεταξύ μιας υποκειμενικής πρότασης και μιας πρότασης με άποψη. Οι προτάσεις με άποψη αποτελούν υποσύνολο των υποκειμενικών προτάσεων. Η τεχνική αναγνώρισης και ταξινόμησης των προτάσεων με άποψη ονομάζεται «Υποκειμενική Ταξινόμηση» (Subjectivity Classification) [1]. Σύμφωνα με την εργασία [33] η υποκειμενική ταξινόμηση ενός κειμένου μπορεί να διαιρεθεί σε τρία αλληλοεξαρτώμενα πεδία: στον προσδιορισμό της υποκειμενικότητας (subjectivity) που ερευνά εάν σε ένα κείμενο, εκφράζεται ή όχι, θετική ή αρνητική άποψη σχετικά με ένα θέμα, στον προσδιορισμό του προσανατολισμού (orientation or polarity), που εξετάσει εάν σε ένα υποκειμενικό κείμενο εκφράζεται θετική ή αρνητική άποψη και στον προσδιορισμό του σθένους του προσανατολισμού (strength of orientation), που εξετάζει αν η θετική ή αρνητική άποψη που εκφράζεται σε ένα κείμενο είναι κλιμακωτή (ασθενής, μερική ή έντονη). 2.2 Προηγούμενες εργασίες Οι περισσότερες εργασίες μελετούν και προτείνουν μεθόδους για τον προσδιορισμός του προσανατολισμού ενός κειμένου δηλαδή την εύρεση των προτάσεων που περιέχουν άποψη για ένα θέμα είτε θετική είτε αρνητική [5, 7, 9, 10, 18, 19, 24, 26, 27, 30, 34]. Σε κάποιες εργασίες με χρήση στατιστικών μεθόδων, επεκτείνουν περαιτέρω την υποκειμενικότητα ενός κειμένου και ταξινομούν τις απόψεις με βάση κάποια συναισθήματα, όπως στην εργασία [4] η οποία αναγνωρίζει έξη συναισθήματα (anger, disgust, fear, joy, sadness, surprise) σε σύνολα δεδομένων που προέρχονται Σελίδα 19 από 66

20 2 ο ΚΕΦΑΛΑΙΟ από τίτλους ειδήσεων. Αντίστοιχα, στην εργασία [32] προσδιορίζουν την υποκειμενικότητα συζητήσεων από blogs, με βάση 8 συναισθηματικούς άξονες (acceptance, fear, anger, joy, anticipation, sadness, disgust, surprise). Από την μελέτη σχετικών ερευνητικών εργασιών προέκυψε το συμπέρασμα ότι για τον προσδιορισμό της υποκειμενικότητας ενός κειμένου χρησιμοποιούνται δύο βασικές προσεγγίσεις. Η πρώτη προσέγγιση βασίζεται σε λεξικά και χαρακτηρίζεται ως lexicon-based τεχνική ενώ η δεύτερη χρησιμοποιεί παραλλαγές αλγορίθμων Μηχανικής Μάθησης (machine learning) για τον προσδιορισμό της σημασιολογίας των απόψεων Lexicon-Based Τεχνικές Η κεντρική ιδέα των lexicon-based τεχνικών βασίζεται στο σημασιολογικό προσδιορισμό των λέξεων. Η μέθοδος που προτείνεται στην εργασία [9] υλοποιεί μια πολύ απλή και αποτελεσματική πρακτική. Εντοπίζονται και αθροίζονται οι θετικές και αρνητικές λέξεις που βρίσκονται κοντά σε ένα χαρακτηριστικό ενός προϊόντος. Εάν οι θετικές λέξεις υπερτερούν έναντι των αρνητικών τότε η άποψη που εκφράζεται για το χαρακτηριστικό θεωρείται θετική αλλιώς αρνητική. Η μέθοδος στηρίχθηκε σε ένα λεξικό, που δημιουργήθηκε από λέξεις-σπόρους του πεδίου και επεκτάθηκε με bootstrapping διαδικασίες χρησιμοποιώντας το online λεξικό WordNet. Στην εργασία [8], η οποία έχει το ίδιο πεδίο εφαρμογής, υιοθετείται η προηγούμενη τεχνική και επεκτείνεται, κάνοντας την παραδοχή ότι όσες λέξεις βρίσκονται κοντά σε ένα χαρακτηριστικό και αναφέρουν τον συντακτικό σύνδεσμο «και» τότε οι λέξεις ή οι φράσεις που συνδέονται έχουν τον ίδιο σημασιολογικό προσδιορισμό. Επιπλέον χρησιμοποιούνται τεχνικές part-of-speech (POS) και προσδιορίζεται χειροκίνητα η υποκειμενικότητα 1000 ιδιωματισμών που συχνά αναφέρονται σε κριτικές προϊόντων. Η τεχνική POS αφορά στην συντακτική ανάλυση ενός κειμένου, πραγματοποιείται μέσω part-of-speech parsers και χρησιμοποιείται αρκετά συχνά σε ερευνητικές εργασίες [2, 8, 9, 10, 12, 13, 18, 19]. Ένας POS parser λαμβάνει ως Σελίδα 20 από 66

21 2 ο ΚΕΦΑΛΑΙΟ είσοδο ένα κείμενο και επιστρέφει ως έξοδο ένα έγγραφο στο οποίο κάθε όρος έχει επισημανθεί με μια ετικέτα υποδεικνύοντας το μέρος του λόγου που ανήκει. Με αυτόν τον τρόπο εντοπίζεται η συντακτική χρήση μιας λέξης μέσα στο κείμενο και κατ επέκταση προσδιορίζεται η κατάλληλη ερμηνείας της. Οι κύριες κατηγορίες ετικετών της αγγλική γλώσσας είναι: ουσιαστικά (noun), ρήματα (verb), επίθετα (adjective), επιρρήματα (adverb), αντωνυμίες (pronoun) και προθέσεις (preposition). Το Twittratr [44] είναι ένα website που ισχυρίζεται ότι εκτελεί σημασιολογική ανάλυση στα μηνύματα του Twitter προσδιορίζοντας την άποψη των χρηστών σχετικά με ένα ερώτημα. Δεν μπορέσαμε να εντοπίσουμε την αντίστοιχη ερευνητική εργασία που να περιγράφει την ακριβή μέθοδο που εφαρμόσθηκε. Οι μόνες πληροφορίες που αναφέρονται στην ιστοσελίδα τους είναι ότι χρησιμοποιούν μια λίστα λέξεων που αποτελείται από 174 θετικά και 185 αρνητικά επίθετα τα οποία χρησιμοποιούνται για τον σημασιολογικό προσδιορισμό των tweets. Από τις δοκιμές που εκτελέσαμε διαπιστώσαμε ότι η πλειοψηφία των μηνυμάτων που επιστρέφονται, ταξινομούνται στην κατηγορία «Ουδέτερα» γεγονός που δείχνει ότι το λεξικό που χρησιμοποιείται δεν είναι ολοκληρωμένο Τεχνικές Μηχανικής Μάθησης Οι έρευνες που επικεντρώνονται σε αυτή την τεχνική πειραματίζονται στην επιλογή του καταλληλότερου αλγορίθμου Μ.Μ. και των πλέον αντιπροσωπευτικών χαρακτηριστικών ενός κειμένου. Αφού καταλήξουν σε ένα αξιόλογο σύνολο εκπαίδευσης, οι αλγόριθμοι Μ.Μ. εκπαιδεύεται έτσι ώστε να μπορούν, με σχετικά υψηλή ακρίβεια, να πραγματοποιούν υποκειμενική ταξινόμηση άγνωστων περιπτώσεων [5, 7, 10, 15, 21, 24, 27, 30]. Στην εργασία [10] μελετάται η υποκειμενική ταξινόμηση σύντομων μηνυμάτων από το Twitter, χρησιμοποιούνται κατηγοριοποιητές Μ.Μ. όπως ο Naïve Bayes, Maximun Entropy, Support Vector Machines ενώ η εξαγωγή των χαρακτηριστικών στηρίζεται σε unigrams, bigram και part-of-speech ετικέτες. Για την δημιουργία του συνόλου εκπαίδευσης χαρακτηρίζονται χειροκίνητα 177 αρνητικά και 184 θετικά μηνύματα. Ο αλγόριθμος που βρέθηκε να δίνει τα υψηλότερα ποσοστά Σελίδα 21 από 66

22 2 ο ΚΕΦΑΛΑΙΟ ταξινόμησης είναι ο MaxEnt με ποσοστά επιτυχίας 83%. Μια παρόμοια μέθοδο εφαρμόσθηκε και στην εργασία [27]. Το δικό τους σύνολο εκπαίδευσης αποτελείται από 370 θετικά και 370 αρνητικά μηνύματα που ομοίως χαρακτηρίσθηκαν χειροκίνητα ενώ ο κατηγοριοποιητής που είχε την μεγαλύτερη ακρίβεια ήταν ο Naïve Bayes με ποσοστά 64%. Ένα από τα συνήθη προβλήματα που αντιμετωπίζουν οι ερευνητές που εφαρμόζουν τεχνικές μηχανικής μάθησης είναι η μη αυτόματη προσθήκη ετικετών στα δεδομένα εκπαίδευσης. Στην εργασία [11] προτείνεται μια τέτοια μέθοδος χρησιμοποιώντας κατηγοριοποιητές υψηλής ακρίβειας (HP-Subj, HP-Obj) οι οποίοι αυτόματα αναγνωρίζουν κάποιες υποκειμενικές και αντικειμενικές προτάσεις. Οι κατηγοριοποιητές χρησιμοποιούν μια λίστα από λεξικογραφικούς όρους οι οποίοι αποτελούν μια πρώτη ένδειξη. Μια πρόταση θα ταξινομηθεί ως υποκειμενική εάν περιέχει δύο ή περισσότερους ενδεικτικούς όρους της λίστας και ως αντικειμενική στην αντίθετη περίπτωση. Οι κατηγοριοποιητές συνήθως δίνουν υψηλά ποσοστά ακρίβειας (high precision) αλλά χαμηλά ποσοστά ολοκλήρωσης (low recall). Μια ακόμα δυσκολία είναι σχετική με το γεγονός ότι τα συστήματα μάθησης πρέπει να εκπαιδεύονται σε ένα εξαιρετικά μεγάλο σύνολο δεδομένων για να αποκτήσουν ένα αξιόπιστο υποκειμενικό λεξιλόγιο που να έχει ευρεία και ολοκληρωμένη χρήση [17]. Σε κάθε έρευνα σημασιολογικού προσδιορισμού κειμένων, ανεξαρτήτου τεχνικής προσέγγισης, η ανάλυση εξαρτάται άμεσα από το πεδίο εφαρμογής των συνόλων [1]. Μια μέθοδος που έχει αξιόλογα αποτελέσματα σε ένα πεδίο μπορεί να μην είναι αξιόπιστη σε κάποιο άλλο. Το γεγονός αυτό οφείλεται στις ιδιαιτερότητες της φυσικής γλώσσας όπου η ερμηνεία πολλών λέξεων δεν είναι μονοσήμαντη. Όπως επισημαίνεται στην εργασία [5] το επίθετο «απρόβλεπτο» ερμηνεύεται αρνητικά όταν αφορά στη συμπεριφορά ενός αυτοκινήτου (απρόβλεπτη συμπεριφορά), ενώ θετικά όταν σχετίζεται με μια κινηματογραφική ταινία (απρόβλεπτη πλοκή). Σελίδα 22 από 66

23 3 ο ΚΕΦΑΛΑΙΟ 3. ΛΕΞΙΚΟ ΑΠΟΨΕΩΝ Η χρήση των λέξεων που εκφράζουν άποψη (opinion words) 3 εφαρμόζεται σε αρκετές εργασίες εξόρυξης γνώμης [9, 13, 15, 18, 24, 33, 34, 35, 36]. Συνήθως οι θετικές λέξεις (positive opinion words) εκφράσουν μια επιθυμητή κατάσταση ενώ οι αρνητικές (negative opinion words) μια ανεπιθύμητη κατάσταση. Παράδειγμα θετικών λέξεων: όμορφα (beautiful), υπέροχα (wonderful), καλά (good), φανταστικά (amazing) κ.α. Παράδειγμα αρνητικών λέξεων: άσχημα (bad), φτωχά (poor), απαίσια (terrible). Πέραν αυτών, υπάρχουν αντίστοιχα θετικές - αρνητικές φράσεις και ιδιωματισμοί. Συγκεντρωτικά, όλα τα παραπάνω, αποτελούν το λεξικό απόψεων (opinion lexicon) [1]. Οι λέξεις, θετικές και αρνητικές, μπορούν να χωριστούν σε δύο επιπλέον κατηγορίες: βασικού τύπου (base type) και συγκριτικού τύπου (comparative type). Στην κατηγορία συγκριτικού τύπου ανήκουν οι λέξεις, συνήθως επίθετα, που βρίσκονται στον υπερθετικό (comparative) και συγκριτικό (superlative) βαθμό. Παράδειγμα λέξεων συγκριτικού τύπου: καλύτερο (better), χειρότερο (worse), κάλλιστο (best), κάκιστο (worst) κ.α. Σε αντίθεση με τις λέξεις βασικού τύπου, οι συγκριτικού τύπου συνήθως δεν καταδεικνύουν άμεσα κάποια άποψη αλλά εκφράσουν μια σύγκριση για ένα ή περισσότερα αντικείμενα. Για παράδειγμα η πρόταση «Το αυτοκίνητό μου είναι καλύτερο από το δικό σου» δεν μπορεί να θεωρεί ότι εκφράζει μια άμεση άποψη (πιο αυτοκίνητο είναι καλύτερο). Η κατηγοριοποίηση των συγκριτικών λέξεων σε θετικές ή αρνητικές βασίζεται στο αν η λέξη αυτή αναπαριστά μια επιθυμητή ή ανεπιθύμητη κατάσταση του ουσιαστικού. Σε ορισμένες εργασίες [9, 13, 18, 24, 33] οι ερευνητές αντιμετωπίζουν την θετική ή αρνητική ιδιότητα των λέξεων ως κατηγορία, δηλαδή μια λέξη είναι είτε θετική είτε αρνητική. Άλλες εργασίες [15, 34, 35] αντιμετωπίζουν το σημασιολογικό προσδιορισμό μιας λέξης ως ένδειξη εκφρασμένη με μια αριθμητική τιμή. Όπως 3 Στη διεθνή βιβλιογραφία συναντούμε επίσης τους συνώνυμους όρους polar words, opinion-bearing words και sentiment words. Σελίδα 23 από 66

24 3 ο ΚΕΦΑΛΑΙΟ αναφέρεται στην εργασία [34] ο υπολογισμός του σημασιολογικού προσδιορισμού βασίζεται σε δύο παραδοχές: α) κάθε λέξη έχει μια αρχική πολικότητα (prior polarity) και είναι ανεξάρτητη του κειμένου και β) η ένδειξη του σημασιολογικού προσδιορισμού εκφράζεται ως μια αριθμητική τιμή. Στην εργασία [36] υιοθετούν τη θετική ή αρνητική ιδιότητα των λέξεων και την επεκτείνουν σε ομάδες συνώνυμων λέξεων (synsets) χρησιμοποιώντας το online λεξικό WordNet. Βασίζονται στην παραδοχή ότι κάθε sysnet περιέχει κυρίως όρους που έχουν τον ίδιο σημασιολογικό προσδιορισμό. Στη συνέχεια εφαρμόζετε ένα μοντέλο randomwalk για την ταξινόμηση των synsets του WordNet σε θετικά και αρνητικά. Ο όρος «synset» χρησιμοποιείται κυρίως στο ηλεκτρονικό λεξικό WordNet και εκφράζει την ομαδοποίηση των αγγλικών λέξεων σε ομάδες συνωνύμων όρων περιγράφοντας τη εννοιολογική τους σχέση. Υπάρχει μια δενδροειδή μορφή πίσω από τις ομάδες αυτές. Κάθε synset περιέχει όρους οι οποίοι ανήκουν και αυτοί σε άλλα synsets κοκ. Η σχέση αυτή συνδέει ειδικούς όρους (hyponym) με πιο αφαιρετικούς όρους (hypernym). Για παράδειγμα ο όρος «carrot» (hyponym) συνδέεται με τον όρο «plant root» ο οποίος με τη σειρά του συνδέεται με τον πιο αφαιρετικό όρο «plant organ». Με τον τρόπο αυτό χτίζεται ένα κατευθυνόμενο δέντρο που διαθέτει μονοπάτια μεταξύ κάθε όρου του λεξικού και παρέχει την δυνατότητα να υπολογισθεί η εννοιολογική ομοιότητα δύο ή περισσότερων λέξεων. Σχήμα 4: Σχηματική απεικόνιση των synsets Σελίδα 24 από 66

25 3 ο ΚΕΦΑΛΑΙΟ 3.1 Μέθοδοι δημιουργίας λεξικών Για τη δημιουργία ενός λεξικού απόψεων, δηλαδή μιας λίστας λέξεων σημασιολογικά προσδιορισμένες, χρησιμοποιούνται συνήθως τρεις προσεγγίσεις: η χειροκίνητη, η βασιζόμενη σε λεξικό και η βασιζόμενη σε γραμματική [1]. Στη πράξη χρησιμοποιούνται συνδυαστικά και οι τρεις τεχνικές. Αν και η χειροκίνητη δημιουργία λεξικών είναι αρκετά χρονοβόρα, κάποιοι ερευνητές [15, 34, 35] εξακολουθούν να τη χρησιμοποιούν γιατί αποτελεί την ασφαλέστερη μέθοδο, αφού ο σημασιολογικός προσδιορισμός των λέξεων προέρχεται από ειδικούς (domain experts). Στην εργασία [15] για να υπολογισθεί η θετική ή αρνητική άποψη κριτικών ταινιών, δημιουργήθηκαν 5 διαφορετικά λεξικά. Τα τέσσερα περιέχουν συντακτικούς όρους, επίθετα, ουσιαστικά, 903 ρήματα και 745 επιρρήματα ενώ το πέμπτο περιέχει 177 φράσεις και ιδιωματισμούς. Κάθε όρος των λεξικών βαθμολογήθηκε χειροκίνητα μεταξύ του διαστήματος [-5, 5]. Για παράδειγμα η λέξη «θαυμάσιος» βαθμολογήθηκε με 5, «ευχάριστος» με 2, «αηδιαστικός» με -3 και «τερατούργημα» με -5. Για να βρεθεί ο σημασιολογικός προσδιορισμός της φράσης «όχι κακός» προστίθενται τα σκορ των λέξεων -5+4=-1. Η βαθμολογία δόθηκε αρχικά από ένα domain expert με μητρική γλώσσα τα αγγλικά και έπειτα ελέγχθηκε από μια τριμελή επιτροπή ώστε να μειωθεί η υποκειμενικότητα της χειροκίνητης βαθμολογίας. Η προσέγγιση που βασίζεται σε λεξικό στηρίζεται στην υπόθεση ότι οι λέξεις μπορούν να θεωρηθούν ως μονάδες που περιέχουν άποψη. Στην εργασία [18] η δημιουργία του λεξικού ξεκινάει με την εξαγωγή των πλέον συχνά εμφανιζόμενων επιθέτων που αντλούνται από μια συλλογή σχετική με κριτικές προϊόντων. Αρχικά χρησιμοποιείται μια λίστα που περιέχει 30 επίθετα τα οποία έχουν επισημανθεί χειροκίνητα ως θετικά ή αρνητικά. Με τη βοήθεια του WordNet εντοπίζονται τα συνώνυμα επίθετα της λίστας. Εάν κάποιο συνώνυμο επίθετο βρεθεί στη συλλογή δεδομένων τότε προστίθεται στη λίστα και η διαδικασία επαναλαμβάνεται έως ότου προσδιορισθούν σημασιολογικά όλα τα επίθετα της συλλογής. Σελίδα 25 από 66

26 3 ο ΚΕΦΑΛΑΙΟ Μια γραμματική προσέγγιση που βασίζεται σε συντακτικά πρότυπα προτείνεται στην εργασία [13] και ονομάζεται μέθοδος σημασιολογικού εξαναγκασμού (sentiment consistency). Η μέθοδος ξεκινάει με λέξεις (επίθετα) που εκφράζουν άποψη. Το σύνολο αυτό χρησιμοποιείται για να αναγνωριστούν με γλωσσολογικό εξαναγκασμό άλλες συνώνυμες λέξεις (επίθετα με παρόμοιο σημασιολογικό προσανατολισμό). Ο εξαναγκασμός αυτός, τεχνικά πραγματοποιείται με τον συνδετικό όρο «και». Η παραδοχή της εργασίας έγκειται στο γεγονός ότι σε μία σύνθετη πρόταση, όταν υπάρχουν δύο επιμέρους προτάσεις που συνδέονται με τον γραμματικό όρο «και» συνήθως έχουν τον ίδιο προσανατολισμό (θετικό ή αρνητικό). Τέτοιου είδους εξαναγκασμοί χρησιμοποιούνται και για τους όρους, «ή», «αλλά», «ούτε», (or, bur, either-neither). Στην εργασία [14] προτάθηκε μια επέκταση του σημασιολογικού εξαναγκασμού σε γειτονικές προτάσεις (intersentential), θεωρώντας ότι γειτονικές προτάσεις μπορεί να έχουν παρόμοιο σημασιολογικό προσανατολισμό. Στην περίπτωση αυτή χρησιμοποιήθηκαν οι γραμματικοί όροι «αλλά» και «ωστόσο» ως δείκτες σημασιολογικού εξαναγκασμού. 3.2 Πλεονεκτήματα - Μειονεκτήματα Ένα σημαντικό πλεονέκτημα των τεχνικών που χρησιμοποιούν λεξικά απόψεων είναι ότι δεν απαιτούν σύνολα εκπαίδευσης που κάνουν προβλέψεις, αφού στηρίζονται σε λεξικά που περιέχουν ένα προκαθορισμένο σύνολο λέξεων με άποψη. Τέτοιες τεχνικές χαρακτηρίζονται ως μη επιβλεπόμενες τεχνικές μάθησης και συνήθως, αλλά όχι αποκλειστικά, χρησιμοποιούνται σε περιπτώσεις όπου δεν υπάρχουν διαθέσιμα σύνολα εκπαίδευσης [17]. Οι συλλογές (corpus) που χρησιμοποιούνται για το «χτίσιμο» ενός λεξικού παίζουν πολύ σημαντικό ρόλο στην ακρίβεια των αποτελεσμάτων της μεθόδου. Παρατηρείται όμως το φαινόμενο, λεξικά που έχουν στηριχθεί σε λέξεις ενός πεδίου να μην έχουν αξιόλογα αποτελέσματα όταν χρησιμοποιούνται σε διαφορετικό πεδίο εφαρμογής. Πέραν αυτού, για να μπορέσει ένα λεξικό να είναι ολοκληρωμένο και Σελίδα 26 από 66

27 3 ο ΚΕΦΑΛΑΙΟ να περιέχει την πλειονότητα των λέξεων, απαιτούνται πολύ μεγάλες συλλογές δεδομένων. Συχνά οι ερευνητές υποστηρίζουν ότι ο σημασιολογικός προσδιορισμός που προέρχεται από κάποιο λεξικό δεν μπορεί να είναι παρά μόνο μια ένδειξη [1]. Η σημασιολογία μιας πρότασης δεν εξαρτάται μόνο από την κατηγοριοποίηση των λέξεων ή/και των συνωνύμων τους σε θετικές ή αρνητικές. Η πρόταση «Ψάχνω για ένα καλό βιβλίο» δεν μπορεί να ταξινομηθεί ως θετική, μόνο και μόνο επειδή το επίθετο «καλό» έχει κατηγοριοποιηθεί στο λεξικό ως θετική λέξη. Σε κάθε περίπτωση τα λεξικά απόψεων αποτελούν το θεμέλιο λίθο πολλών μελετών και σχετικών εργασιών. Οι τεχνικές και οι μέθοδοι ποικίλουν και ενδεχομένως, να πρέπει να εμπλουτιστούν ακόμα περισσότερο αλλά εν κατακλείδι είναι μια τεχνική που ενισχύει σημαντικά τις διαδικασίες της σημασιολογική ανάλυσης. Σελίδα 27 από 66

28 4 ο ΚΕΦΑΛΑΙΟ 4. ΚΟΙΝΩΝΙΚΟ ΔΙΚΤΥΟ «TWITTER» Το Twitter είναι ένα online κοινωνικό δίκτυο και μια micro-blogging υπηρεσία, η οποία επιτρέπει στους χρήστες, αφού εγγραφούν, να συντάσσουν σύντομα μηνύματα και να διαβάζουν τα μηνύματα άλλων χρηστών της υπηρεσίας (τα γνωστά ως tweets). Είναι περισσότερο ένα ενημερωτικό δίκτυο και μια πηγή ειδήσεων. Το Twitter γράφτηκε πάνω σε μια πλατφόρμα ανοιχτού κώδικα τη Ruby on Rails με την γλώσσα Ruby και διαθέτει το δικό του API (Application programming interface). Εμπνευστής της υπηρεσίας είναι ο Jack Dorsey ο οποίος το 2005 σκέφτηκε ότι θα ήταν πολύ ενδιαφέρουν εάν μπορούσε να γνωρίζει τι κάνουν οι φίλοι του. Έτσι δημιουργήθηκε το Twitter, αρχικά, από την εταιρεία ανάπτυξης «Obvious» που εδρεύει στο San Francisco. Το πρωτότυπο υλοποιήθηκε (μόλις σε διάστημα δύο εβδομάδων) τον Μάρτιο 2006 ενώ η επίσημη πρώτη εμφάνισή του στο παγκόσμιο ιστό έγινε τον Αύγουστο Η υπηρεσία σύντομα έγινε αρκετά δημοφιλής με αποτέλεσμα τον Μάιο 2007 να ιδρυθεί η εταιρεία «Twitter Incorporated». Πλέον στην υπηρεσία είναι εγγεγραμμένοι περισσότεροι από 100 εκατομμύρια χρήστες ενώ καθημερινά ανταλλάσσονται πλέον των 55 εκατομμυρίων tweets. Τα tweets μπορούν να χαρακτηρισθούν ως ηλεκτρονικά μηνύματα παρόμοια των Short Message Service - SMS. Η μόνη διαφορά τους είναι η δημόσια κοινοποίησή τους. Η φιλοσοφία της υπηρεσίας είναι να μπορεί ο χρήστης να μεταδώσει στους άλλους μια κατάσταση, σκέψη, επιθυμία που συμβαίνει στην συγκεκριμένη στιγμή. Επιπλέον ο χρήστης μπορεί να παρακολουθεί τα μηνύματα των άλλων, να τα σχολιάζει και να ανατρέχει στο ιστορικό τους. Φυσικά για να λειτουργήσουν οι χρήστες ως δίκτυο ανθρώπων, θα πρέπει να δημιουργήσουν τον κύκλο τους. Στη γλώσσα του Twitter υπάρχουν οι followers, αυτοί που ακολουθούν ένα χρήστη και ειδοποιούνται για κάθε μήνυμα και οι following, αυτούς που ακολουθεί ο χρήστης και ενημερώνεται για τις αναρτήσεις τους. Σελίδα 28 από 66

29 4 ο ΚΕΦΑΛΑΙΟ 4.1 Ενδιαφέροντα στατιστικά στοιχεία Σύμφωνα με τα τελευταία στατιστικά στοιχεία του 2010 που δημοσιεύθηκαν από την ιστοσελίδα Web-Monitoring.com και αναρτήθηκαν σε σχετικό blog [43], ιδιαίτερο ενδιαφέρον παρουσιάζει το ακόλουθο σχήμα όπου εμφανίζει ότι το 25% της κίνησης της υπηρεσίας παράγεται εκ των έσω (χρήστες της υπηρεσίας) ενώ το 75% προέρχεται από εξωτερικούς παράγοντες, γεγονός που επισημαίνει το έντονο ενδιαφέρον των επιχειρήσεων (και όχι μόνο) για την προαγωγή και προώθηση των υπηρεσιών τους μέσω των κοινωνικών δικτύων. Σχήμα 5: Εσωτερικές και εξωτερικές συναλλαγές (traffic) της υπηρεσίας Το περιεχόμενο των tweets είναι ποικίλο με επικρατέστερο το κομμάτι που αφορά στα προσωπικά μηνύματα και τις συζητήσεις των χρηστών με ποσοστό 57% από το οποίο 27% αφορά σε προσωπικές συζητήσεις και 30% σε δηλώσεις σχετικά με την παρούσα κατάσταση των χρηστών. Ιδιαίτερα μεγάλο είναι το ποσοστό των διαφημιστικών μηνυμάτων που δημοσιεύονται στην υπηρεσία όπου τον μήνα Αύγουστο ανήλθε στο μέγιστο ποσοστό της τάξεων του 11% των δημοσιεύσεων. Έχουν αναπτυχθεί πάνω από εφαρμογές χρησιμοποιώντας το API του Twitter ενώ η επιχείρηση απασχολεί μόνο 175 εργαζόμενους. Σελίδα 29 από 66

30 4 ο ΚΕΦΑΛΑΙΟ Σχήμα 6: Το περιεχόμενο των tweets Σχήμα 7: Εφαρμογές Εργαζόμενοι Στην έρευνα αποτυπώνεται το προφίλ των χρηστών της Αμερικής (ΗΠΑ). Όπως φαίνεται στο σχήμα 8 οι γυναίκες είναι η πλειοψηφία (55%) των users, ενώ η μέση ηλικία χρηστών είναι μεταξύ των ετών. Οι περισσότεροι χρήστες (51%) είναι απόφοιτοι ανώτερων σχολών εκπαίδευσης ενώ το 58% αυτών δηλώνουν ότι έχουν ετήσια εισοδήματα άνω των δολαρίων. Σελίδα 30 από 66

31 4 ο ΚΕΦΑΛΑΙΟ Σχήμα 8: Δημογραφικά στοιχεία χρηστών ΗΠΑ Τέλος στην έρευνα παρουσιάζεται λίστα με τους 20 πιο ενεργούς χρήστες της υπηρεσίας με το μεγαλύτερο αριθμό ακολούθων (followers). Μεταξύ της λίστας εμφανίζονται ονόματα πολιτικών όπως ο Barack Obama (4 η θέση), καλλιτεχνών όπως Lady Gaga, Britney Spears (2 η και 5 η θέση αντίστοιχα) και έγκυρων μέσων ενημέρωσης όπως η εφημερίδα The New York Times (20 η θέση). Σελίδα 31 από 66

32 4 ο ΚΕΦΑΛΑΙΟ Σχήμα 9: Λίστα με τους πλέον συχνούς χρήστες της υπηρεσίας Σελίδα 32 από 66

33 4 ο ΚΕΦΑΛΑΙΟ 4.2 Δυσκολίες ανάλυσης των tweets Όλες οι μελέτες που σχετίζονται με σημασιολογική ανάλυση κειμένων εμφανίζουν ιδιαιτερότητες και δυσκολίες. Τα tweets, πέραν των γνωστών προβλημάτων, παρουσιάζουν και κάποιες ακόμα ιδιαιτερότητες. Αρχικά το μέγεθος του κάθε μηνύματος. Οι 140 χαρακτήρες δεν είναι αρκετά δεδομένα για να αναλυθεί σημασιολογικά το περιεχόμενο. Ουσιαστικά αυτή είναι η πρόκληση αλλά και η μεγαλύτερη δυσκολία για το σημασιολογικό προσδιορισμό των απόψεων των χρηστών. Τα μηνύματα συνήθως αφορούν σε προσωπικές συζητήσεις και κατ επέκταση δεν έχουν ιδιαίτερα ενδιαφέρον περιεχόμενο, δεν είναι στοχαστικά ενώ ως επί το πλείστον δεν ακολουθούν γνωστούς συντακτικούς και γραμματικούς κανόνες. Φυσικά το μείζον πρόβλημα και εδώ είναι η υποκειμενικότητα και η αντικειμενικότητα μιας άποψης που στο συγκεκριμένο ερευνητικό πεδίο είναι ακόμα δυσκολότερο να εντοπισθεί λόγο της περιορισμένης έκτασης του μηνύματος. Οι χρήστες συχνά εμφανίζουν πολλαπλά συναισθήματα μέσα σε ένα μήνυμα, χρησιμοποιούν σαρκασμό και εκφράζονται με ιδιαίτερους χαρακτηρισμούς που δεν χρησιμοποιούνται συχνά εκτός διαδικτύου. Αναφερόμαστε στην ιδιαίτερη διάλεκτο που χρησιμοποιούν οι χρήστες, συνήθως νεαρών ηλικιών και είναι έξω και πέρα από κάθε γνωστό συντακτικό κανόνα π.χ. η λέξη cu σημαίνει see you ή u2 σημαίνει you too. Το φαινόμενο αυτό κάνει αρκετά δύσκολη την ανάλυση γιατί οι τεχνικές δεν μπορούν να βασισθούν πάνω σε γνωστά μοντέλα αλλά απαιτείται πειραματισμός και μελέτη περιπτώσεων και υπο-περιπτώσεων. Επιπλέον είναι γνωστή η διαφορετική ερμηνεία που έχουν κάποιες λέξεις. Άλλη ερμηνεία έχουν όταν χρησιμοποιούνται ως ουσιαστικά, άλλη ως ρήματα ενώ σημαντικό ρόλο παίζει και η θέση τους μέσα στην πρόταση. Το πρόβλημα αυτό δεν παρουσιάζεται μόνο σε μια γλώσσα αλλά αφορά όλες τις γνωστές διαλέκτους. Στο συγκεκριμένο πεδίο έρευνας η δυσκολία ανεύρεσης της κατάλληλης ερμηνείας αυξάνεται λόγω του περιορισμένου μήκους του μηνύματος και της χαλαρής γραμματικής δομής του. Σελίδα 33 από 66

34 5 ο ΚΕΦΑΛΑΙΟ 5. ΠΑΡΟΥΣΙΑΣΗ ΤΗΣ ΜΕΘΟΔΟΥ Η υλοποίηση της μεθόδου χωρίζεται σε τρεις επιμέρους φάσεις, όπως φαίνεται στο σχήμα (9). Στην φάση Α γίνεται η συλλογή των συνόλων δεδομένων από την υπηρεσία Twitter και εφαρμόζονται τεχνικές προετοιμασίας και καθαρισμού τους. Στη φάση Β χρησιμοποιώντας το λεξικό WordNet, δημιουργείται ένα λεξικό απόψεων που περιέχει σημασιολογικά βαθμολογημένες λέξεις και φράσεις της αγγλικής γλώσσας. Στην Γ φάση πραγματοποιείται η υποκειμενική ταξινόμηση των μηνυμάτων εφαρμόζοντας lexicon-based τεχνικές που βασίζονται σε δύο λεξικά. Το πρώτο αφορά στο λεξικό απόψεων που δημιουργήθηκε στην Β φάση και το δεύτερο περιείχε σημασιολογικά βαθμολογημένα σύμβολα (emotions) που συνήθως εμφανίζονται σε σύντομα μηνύματα κοινωνικών δικτύων. Σχήμα 10: Σχηματική παράσταση της μεθόδου Σελίδα 34 από 66

35 5 ο ΚΕΦΑΛΑΙΟ 5.1 Τα Σύνολα Δεδομένων Για τη συλλογή των δεδομένων χρησιμοποιήσαμε το API του Twitter, τη γλώσσα προγραμματισμού Python2.7 κα τη βιβλιοθήκη tweepy. Χρησιμοποιώντας την κλάση StreamWatcherListener(tweepy.StreamListener) που περιέχει τη μέθοδο StreamListener ζητείται να επιστραφούν όσα δημόσια tweets δημοσιεύθηκαν και περιέχουν μια λέξη κλειδί (key search query). def on_status(self, status): fout = open('querybackfile_%s.txt'%suffix, 'a') fout.write('-'*40+"\n") fout.write(status.user.screen_name + "; " + status.text.encode('utf-8')+"\n") fout.close() return True def on_error(self, status_code): print 'An error has occured! Status code = %s' % status_code return True # keep stream alive def on_timeout(self): print 'Timeout' return True Πλαίσιο 1: Κλάση «StreamWatcherListener» Τα tweets που επιστρέφονται δεν έχουν χρονικό περιορισμό δηλαδή δεν αφορούν κάποια συγκεκριμένη χρονική περίοδο (από έως). Προτιμήθηκε η συλλογή των δεδομένων να γίνει με χρήση ερωτήματος γιατί με αυτό το τρόπο τα δεδομένα «έρχονται» πιο «καθαρά», δηλαδή αποφεύγουμε τα φλύαρα tweets που δεν έχουν κάποιο συγκεκριμένο νόημα. Επιπλέον τα μηνύματα δεν φιλτράρονται σε κάποια συγκεκριμένη γλώσσα. Η απόφασή μας βασίσθηκε στην παραδοχή ότι ακόμα και tweets που είναι γραμμένα σε άλλες γλώσσες μπορεί να περιέχουν συνήθεις αγγλικές λέξεις και φράσεις ή emotions, από τα οποία μπορεί, έστω στοιχειωδώς, να προσδιορισθεί σημασιολογικά κάποια θετική ή αρνητική άποψη. Τα δεδομένα γράφονται σε txt αρχείο με μορφή username; tweet. Σελίδα 35 από 66

36 5 ο ΚΕΦΑΛΑΙΟ Η συλλογή μας αποτελείται από 3 σύνολα δεδομένων. Το πρώτο αφορά στη δημοφιλή τραγουδίστρια «Lady Gaga» το όνομα της οποίας είναι αρκετά διαδεδομένο στο νεανικό, και όχι μόνο, κοινό. Τα δεδομένα συλλέχθηκαν τον Οκτώβριο 2010, και αντιπροσωπεύουν tweets. Screamo_Nation; Escape the fate wants to be bigger than eminem, lady gaga: ESCAPE THE FATE WANTS TO BE BIGGER THAN EMINEM, LADY GA jersoncutest; Check this video out -- Lady Gaga Telephone Parody (ft Beyonce): Key of Awesome # ZoeWiless; Right now, I m listening Lady Gaga! I love her she s amazing! love her music! and Teeth was the perfect song for #TVD new promo! CameraPilot; #unfollowmeif you like crap like lady gaga NerdofGaga; Put these artists in order of which you like the most; lady gaga Πλαίσιο 2: Απόσπασμα των tweets «Lady Gaga» Το δεύτερο σύνολο δεδομένων είναι σχετικό με μια συναισθηματική κατάσταση των χρηστών. Το συναίσθημα είναι μια πιο πολύπλοκη διαδικασία που προέρχεται από τις προσωπικές εμπειρίες του καθενός. Γι αυτό επιλέξαμε στις αρχές του Δεκεμβρίου 2010 να συλλέξαμε μηνύματα σχετικά με τα Χριστούγεννα. Αποθηκεύσαμε tweets. Sad I missed last 2 Looks like u did fabulous job, even w/out our entourage! :) Merry Christmas ninamurad; I'm going to convince my dads that we should celebrate Christmas this year. I love the idea of having a gold star Σελίδα 36 από 66

37 5 ο ΚΕΦΑΛΑΙΟ DanMerson1; Just tried to fly my sons Christmas helicopter. My house is too small, I need a warehouse KimRWilliams; Putting up the Christmas tree xd AStarrAMama; #Win 2 $50 #Walmart gift cards thx #giveaway #contest #free #Christmas 12/9 Πλαίσιο 3: Απόσπασμα των tweets «Christmas» Το τρίτο και τελευταίο σύνολο δεδομένων είναι σχετικό με ένα δημοσιογραφικό και κοινωνικό γεγονός που βρισκόταν στην επικαιρότητα στις αρχές του Ιανουαρίου 2011 και αφορούσε στο θέμα που δημιουργήθηκε γύρω από τις διαρροές απορρήτων εγγράφων μέσω της ιστοσελίδας Wikileaks. Τα δεδομένα που συλλέξαμε αντιπροσωπεύουν tweets. pepiamil; EE.UU. exige a #Twitter información sobre cuenta de #WikiLeaks yvanseth; Note that we can assume Google & Facebook also have secret US government subpeonas. They make no comment. Did they fold? iroelsanchez; Cuál fue el error de Julian #Assange? #Wikileaks #cablegate #Cuba #EEUU #USA HIAHEL; EE.UU. exige a #Twitter información sobre cuenta de #WikiLeaks lavidalinux; #WikiLeaks: #USA is demanding our #Twitter account info Πλαίσιο 4: Απόσπασμα των tweets «Wikileaks» Σελίδα 37 από 66

38 5 ο ΚΕΦΑΛΑΙΟ Προετοιµασία δεδοµένων Κάθε πρωτόγεννες σύνολο δεδομένων απαιτεί ένα σχετικό «καθάρισμα» ώστε να απομακρυνθούν στοιχεία που δεν εξυπηρετούν στην ανάλυση και επιβαρύνουν υπολογιστικά τις περαιτέρω διαδικασίες. Τέτοια στοιχεία είναι τα άρθρα, οι κοινές λέξεις (common words), τα σημεία στίξης (punctuations), οι μη γνωστές λέξεις (unknown words). Το συγκεκριμένο σύνολο δεδομένων έχει ορισμένες ιδιαιτερότητες. Η πρώτη αφορά στα emotions που συνηθίζουν να δημιουργούν οι χρήστες από τα σημεία στίξης. Επειδή η μέθοδός μας στηρίζεται στην αξιολόγηση τους, δεν θέλαμε να αλλοιώσουμε τα συγκεκριμένα σύμβολα που δημιουργούνται από τα σημεία στίξης ( :-),!-(; κ.α. Γι αυτό αφαιρέσαμε μόνο δύο σημεία στίξης (.,) που δεν συμμετέχουν συνήθως σε emotions, προσπαθώντας να περιορίσουμε τις περιπτώσεις αλλοίωσής τους. Μια άλλη ιδιαιτερότητα του συνόλου δεδομένων είναι το συντακτικό που χρησιμοποιείται και που συνήθως δεν ακολουθεί γραμματικούς κανόνες. Παρατηρήσαμε συχνά την αναγραφή μη συντακτικά σωστών λέξεων όπως π.χ. helloooo, loveeeee κλπ. Για να μπορέσουμε να διαχειριστούμε τέτοιες περιπτώσεις εγκαταστήσαμε τη βιβλιοθήκη Natural Language Toolkit (NLTK) και χρησιμοποιήσαμε τη συνάρτηση unusual_words. Η συνάρτηση αυτή εξετάζει αν κάθε λέξη ενός κειμένου περιλαμβάνεται στo corpus του WordNet (nltk.corpus.words). Αν η λέξη δεν βρεθεί επιστρέφεται ως «unusual» και αφαιρείται από τα δεδομένα. Ο έλεγχος γίνεται με βάση το αγγλικό λεξιλόγιο (English_vocab). def unusual_words(text): text_vocab=set(w.lower() for w in text if w.isalpha()) english_vocab=set(w.lower() for w in nltk.corpus.words.words()) unusual=text_vocab.difference(english_vocab) return (unusual) Πλαίσιο 5: Συνάρτηση «unusual words» Σελίδα 38 από 66

39 5 ο ΚΕΦΑΛΑΙΟ Επιπλέον αποφασίσαμε ότι δεν θα επεξεργαζόμασταν στοιχεία σχετικά με νούμερα ή υπερσυνδέσουμς (hyperlinks) γι αυτό και τα αφαιρέσαμε από τα δεδομένα. Το σύνολο των κοινών λέξεων (άρθρα, σύνδεσμοι, προθέσεις κλπ) προέκυψαν ύστερα από σχετική αναζήτηση στο διαδίκτυο [41]. Θεωρήσαμε σκόπιμο, πριν αφαιρέσουμε ένα συγκεκριμένο σύνολο κοινών λέξεων, να χρησιμοποιήσουμε μια συνάρτηση που να επιστρέφει τις πλέον συχνές λέξεις του συνόλου δεδομένων που εξετάζουμε και μετά να αφαιρούμε όσες από αυτές κρίνουμε ότι δεν έχουν κάποια ιδιαίτερη αξία στην ανάλυσή μας. Οι λέξεις αυτές εμφανίζονται στην οθόνη κατά την διάρκεια εκτέλεσης της μεθόδου και ακολούθως, εάν κριθεί σκόπιμο, προσαρμόζεται χειροκίνητα η αντίστοιχη λίστα. Όλες οι λέξεις των μηνυμάτων μετατρέπονται σε lower case. Τα «καθαρά δεδομένα» αποθηκεύονται σε νέο txt αρχείο. Ένα χαρακτηριστικό απόσπασμα από τα «καθαρά δεδομένα» παρουσιάζεται στη συνέχεια. Στην αρχή αναφέρουμε το αρχικό μήνυμα και ακολούθως τη μορφή που έχει πάρει μετά την διαδικασία καθαρισμού. Τα μηνύματα προέρχονται από το σύνοδο δεδομένων «Christmas». questionledes; Web Poll: Is Reno's Christmas Tree crooked? questionledes; web poll: reno's christmas tree crooked? yeaah me too :D hows your day been? christmas soon, whoop :L xxxxxx me too :d your day been? christmas soon whoop :l Steve_Ince; Kitty-leaks are more fun than Wiki-leaks! The Simon's Cat Christmas film is now on the Guardian website! kitty-leaks are more fun than wiki-leaks! simon's cat christmas film now guardian website! Πλαίσιο 6: Απόσπασμα των tweets μετά την διαδικασία καθαρισμού τους Σελίδα 39 από 66

40 5 ο ΚΕΦΑΛΑΙΟ Για την υλοποίηση της μεθόδου που περιγράψαμε χρησιμοποιήσαμε την Python ver.2.6 και τις βιβλιοθήκες του Natural Language Toolkit (NLTK). Οι βιβλιοθήκες NLTK δεν είναι συμβατές με μεταγενέστερες εκδόσεις της Python. 5.2 Δημιουργία λεξικού Ένα από τα πλέον σημαντικά στάδια στη ανάλυσή μας ήταν η δημιουργία του λεξικού απόψεων. Επειδή δεν μπορούσαμε στα πλαίσια της παρούσας εργασίας να δημιουργήσουμε εξ αρχής ένα λεξικό, αναζητήσαμε ένα κοινά αποδεκτό αγγλικό λεξικό που να εξυπηρετεί τους σκοπούς της εργασίας. Από τη σχετική έρευνα στο διαδίκτυο καταλήξαμε σε ένα λεξικό απόψεων από το πανεπιστήμιο «University of Maryland, Baltimore» [42]. Το λεξικό περιέχει λέξεις όπως επίθετα, ρήματα, αντωνυμίες, προθέσεις, επιρρήματα και μικρές φράσεις σημασιολογικά βαθμολογημένες μεταξύ του διαστήματος [-1, 1]. Όπως αναφέρεται στη σχετική ιστοσελίδα, το λεξικό προέρχεται από το Wordnet όμως δε διευκρινίζετε πώς προσδιορίσθηκε η βαθμολογία των λέξεων. Επιπλέον στην ίδια ηλεκτρονική διεύθυνση διατίθεντο και ένα αρχείο που περιείχε 55 σύμβολα (emotions) τα οποία έχουν αντίστοιχη σημασιολογική βαθμολογία στο ίδιο πεδίο τιμών. Στο ακόλουθο σχήμα παραστούμε σχηματικά το περιεχόμενο του λεξικού απόψεων στο οποίο αποτυπώνεται η διακύμανση της βαθμολογίας των λέξεων και γίνεται εμφανές ότι το λεξικό δεν περιέχει ουδέτερες λέξεις (neutral words). Αμέσως μετά, στους πίνακες 1&2, παρουσιάζουμε παραδείγματα των λέξεων και των emotions που περιέχουν τα λεξικά με την αντίστοιχη βαθμολογία τους. Σελίδα 40 από 66

41 5 ο ΚΕΦΑΛΑΙΟ Σχήμα 11: Σχηματική αναπαράσταση του περιεχομένου του λεξικού WORD SCORE Positive score upright 1.0 fortunate idealistic 0.75 wise upfront 0.5 up yap 0.25 Negative score white-tie torture -0.3 ad-lib will-o'-the-wisp useless -0.5 sad misfortunate -1.0 Πίνακας 1: Χαρακτηριστικά παραδείγματα λέξεων και φράσεων του λεξικού Emotion SCORE Positive score ;) 1.0 :-D 1.0 :o) 1.0 Negative score :-\ -1.0 : :O Πίνακας 2: Απόσπασμα του λεξικού με emotions Σελίδα 41 από 66

42 5 ο ΚΕΦΑΛΑΙΟ Εµπλουτισµός λεξικού Επειδή, όπως αναφέραμε και προηγουμένως, τα tweets εκφράζουν ιδιαίτερο λόγο, θεωρήσαμε σκόπιμο να εμπλουτίσουμε το υπάρχον λεξικό με συνώνυμες λέξεις και φράσεις, θέλοντας να αυξήσουμε τα ποσοστά της υποκειμενικής ταξινόμησης και να μειώσουμε τα ποσοστά των μηνυμάτων που δεν θα βαθμολογηθούν. Για τον εμπλουτισμό του λεξικού χρησιμοποιήσαμε τον online λεξικό WordNet και στηριχθήκαμε στην παραδοχή ότι κάθε συνώνυμη λέξη που βρίσκουμε θα έχει την ίδια σημασιολογική βαθμολογία με την λέξη του λεξικού. Σχήμα 12: Σχηματική παράσταση της διαδικασίας εμπλουτισμού του λεξικού Η διαδικασία που ακολουθήσαμε αποτυπώνεται στο σχήμα 12. Η κάθε λέξη του λεξικού αποτελεί την λέξη στόχο (target word) για την οποία, μέσω της συνάρτησης «def synonymous», αναζητούμε από το WordNet όλες τις συνώνυμες λέξεις ή φράσεις της. Η συνάρτηση επιστρέφει ένα σύνολο λέξεων (list of synsets). Για κάθε συνώνυμη λέξη και φράση, εξετάζουμε εάν αυτή περιέχεται ήδη στο λεξικό. Στην περίπτωση που βρεθεί απορρίπτεται αλλιώς προστίθεται στο λεξικό και τοποθετείται ακριβώς μετά τη λέξη στόχο. Με αυτόν τον τρόπο εμπλουτίσαμε το λεξικό το οποίο πλέον περιέχει λέξεις και φράσεις. Σελίδα 42 από 66

43 5 ο ΚΕΦΑΛΑΙΟ def synonimous(word): print 'The word cheking is: ', word synsets = wordnet.synsets(word) Lemma_names=[] for synset in synsets: lemma=synset.lemma_names for name in lemma: if name!=word and name not in Lemma_names: Lemma_names.append(name.lower()) return Lemma_names Πλαίσιο 7: Συνάρτηση «synonymous» Ο εξαντλητικός έλεγχος που γινόταν για να αποφύγουμε κάθε πιθανότητα διπλή εγγραφής και να προεξοφλήσουμε την μονοσήμαντη βαθμολογία κάθε όρου του λεξικού, έκανε την διαδικασία εκτέλεσης αρκετά χρονοβόρα. Γι αυτό αποφασίσαμε να χωρίσουμε το λεξικό σε πέντε μικρότερα αρχεία και να εκτελέσουμε τη διαδικασία εμπλουτισμού σε καθένα ξεχωριστά. Εφαρμόζοντας τη τεχνική διαμερισμού των αρχείων δεν μπορούσαμε να αποφύγουμε την περίπτωση των διπλών λέξεων και αυτό γιατί ο έλεγχος περιορίζονταν στα όρια του κάθε αρχείου. Για να διορθώσουμε το πρόβλημα που παρουσιάσθηκε αφού ολοκληρώσαμε τον εμπλουτισμό όλων των επιμέρους αρχείων, τα ενοποιήσαμε και εφαρμόσαμε μια μέθοδο καθαρισμού, κάνοντας την εξής παραδοχή: για κάθε διπλή εγγραφή λέξεων που εντοπίζαμε, κρατούσαμε την λέξη στόχο και όχι την συνώνυμή της που προήλθε από την διαδικασία εμπλουτισμού. Στη συνέχεια αναφέρουμε ενδεικτικά δύο παραδείγματα της διαδικασίας εμπλουτισμού του λεξικού απόψεων και σημειώνουμε ορισμένες παρατηρήσεις που προέκυψαν από τον έλεγχο που διενεργήσαμε. Στο αρχικό λεξικό υπήρχε η λέξη «upstairs» που μεταφράζετε ως «επάνω πάτωμα, παραπάνω» για την οποία η συνάρτηση επέστρεψε ως συνώνυμες, δύο λέξεις και μια φράση. Σελίδα 43 από 66

44 5 ο ΚΕΦΑΛΑΙΟ '0.625', 'upstairs', 'upstair', 'up_the_stairs', 'on_a_higher_floor' Το παράδειγμα αυτό μπορούμε να το χαρακτηρίσουμε ως απόλυτη επιτυχία εφαρμογής. Υπάρχουν όμως και περιπτώσεις λιγότερο επιτυχημένες όπως η επόμενη που αφορά στην λέξη «overcome». Η λέξη «overcome» έχει αρνητική βαθμολογία στο λεξικό και μεταφράζεται ως «καταβάλω, καταβεβλημένος». Όμως η συνάρτηση επέστρεψε τις φράσεις 'get_the_best', 'have_the_best' προφανώς λαμβάνοντας υπόψη την ερμηνεία της λέξης ως «κερδίζω, νικώ». ' ', 'overcome', 'get_the_best', 'have_the_best' Η μέθοδος εμπλουτισμού του λεξικού που εφαρμόσαμε είναι απολύτως αυτοματοποιημένη και εν μέρει δικαιολογεί την εμφάνιση ορισμένων περιπτώσεων που αποκλίνουν, όμως οι περιπτώσεις αυτές θα καταγραφούν μέσα από την πειραματική διαδικασία και θα διορθωθούν. Αξίζει να σημειωθεί ότι για την δημιουργία του λεξικού δεν χρησιμοποιήσαμε λέξεις που χαρακτηρίζουν το πεδίο εφαρμογής (domain words). Το γεγονός αυτό καθιστά το λεξικό ανεξάρτητο πεδίου (domain independent) και πρακτικά σημαίνει ότι η χρήση του μπορεί να επεκταθεί και σε άλλες κατηγορίες κειμένων. Σελίδα 44 από 66

45 5 ο ΚΕΦΑΛΑΙΟ 5.3 Υποκειμενική ταξινόμηση των tweets Η τελευταία φάση της μεθόδου αφορά στον σημασιολογικό προσδιορισμό των απόψεων και την υποκειμενική ταξινόμηση των μηνυμάτων σε δύο κατηγορίες, τη θετική και την αρνητική. Ο αλγόριθμος που αναπαριστά την υποκειμενική ταξινόμηση των μηνυμάτων παρατίθεται σε μορφή ψευδοκώδικα. 1 read wordlexicon 2 read emotionlexicon 3 read tweets 4 for each line remove any word begins 5 write the tweet to output 6 create a list of words 7 sumscor=0 8 total_found=0 9 for each word in the list 10 if word is in wordlexicon 11 write to output word, score 12 sumscor+=score 13 total_found+=1 14 else if word is in emotionlexicon 15 write to output emotion, scoreitem 16 sumscor+=scoreitem 17 total_found+=1 18 normalazation=sumscor/total_found 19 if total_found!=0 and sumscor!=0 20 if normalazation>0 21 write to outputfile ->positive 22 elif normalazation<0 23 write to outputfile ->negative Σελίδα 45 από 66

46 5 ο ΚΕΦΑΛΑΙΟ Αρχικά περνάμε ως εισόδους τρία αρχεία, το λεξικό που περιέχει τις λέξεις (wordlexicon), το λεξικό που περιέχει τα emotions (emotionlexicon) και το αρχείο που περιέχει τα tweets (1)(2)(3). Από κάθε tweet αφαιρούμε τις λέξεις που ξεκινούν με τα ή # (4) και το γράφουμε στο αρχείο εξόδου (5). Τα # χρησιμοποιούνται στην ορολογία των tweets για να εκφράσουν το «retweet» δηλαδή την απάντηση σε ένα tweet και την ετικέτα (tag) αντίστοιχα. Τα δεδομένα αυτά δεν αφαιρέθηκαν από το πρώτο στάδιο επειδή μέχρι τη στιγμή υλοποίησης του συγκεκριμένου σταδίου της μεθόδου δεν είχε αποφασισθεί εάν θα χρησιμοποιηθούν στην ανάλυση. Δημιουργούμε μια λίστα που περιλαμβάνει τις λέξεις του μηνύματος (6) και αρχικοποιούμε δύο μεταβλητές την sumscor, στην οποία κρατάμε τη συγκεντρωτική βαθμολογία του μηνύματος και την total_found, στην οποία κρατάμε τον αριθμό των λέξεων που βαθμολογήθηκαν (7, 8). Κάθε λέξη της λίστας την αναζητούμε στο λεξικό wordlexicon (9, 10). Για την αναζήτηση των λέξεων χρησιμοποιήσαμε την βιβλιοθήκη regular expression (re) της Python. Οι απλές εντολές αναζήτησης επέστρεφαν εκτός από τις σωστές λέξεις και όλες τις υπόλοιπες που περιείχαν τη λέξη είτε ως πρόθεμα είτε ως επιμέρους όρο μέσα σε μια φράση. Καταλήξαμε στην κανονική έκφραση (regular expression): pattern=re.compile(r"(?<![-_a-z])\b%s\b(?![-_/.a-z])" %word). Εάν η λέξη βρεθεί στο λεξικό γράφεται στο αρχείο εξόδου τόσο η λέξη όσο και η βαθμολογίας της (11). Για να έχουμε την συνολική βαθμολογία του tweet, προσθέτουμε την βαθμολογία της λέξης στη μεταβλητή sumscor (12), και αυξάνουμε κατά ένα τη μεταβλητή total_found, για να γνωρίζουμε πόσες λέξεις από το tweet βαθμολογήθηκαν (13). Αν η λέξη δε εντοπισθεί στο λεξικό, αναζητείται στο emotionlexicon (14) και αν βρεθεί αντίστοιχα γράφεται στο αρχείο εξόδου το emotion και η βαθμολογία του (15). Αθροίζουμε την βαθμολογία του emotion στη συνολική βαθμολογία του tweet (16) και αυξάνουμε κατά ένα τη μεταβλητή total_found (17). Σελίδα 46 από 66

47 5 ο ΚΕΦΑΛΑΙΟ Αφού εξεταστούν όλες οι λέξεις του tweet γίνεται κανονικοποίηση της μεταβλητής sumscor που περιέχει τη συνολική βαθμολογία του μηνύματος. Η κανονικοποίηση εκφράζετε ως ο λόγος του συνολικού αθροίσματος ενός μηνύματος προς τις λέξεις και τα σύμβολα που βαθμολογήθηκαν (18). Για την υποκειμενική ταξινόμηση των tweets κάναμε την εξής παραδοχή: επειδή η σημασιολογική βαθμολογία των όρων του λεξικού απόψεων είναι μεταξύ του διαστήματος [-1, 1] θεωρήσαμε ότι όσα tweets, μετά την κανονικοποίηση, έχουν συνολική βαθμολογία μεγαλύτερη του μηδενός (normalazation>0) εκφράζουν θετική άποψη ενώ όσα έχουν βαθμολογία μικρότερη του μηδενός (normalazation<0) αρνητική άποψη. Συνεπώς εάν ένα tweet βαθμολογήθηκε (19) και έχει βαθμολογία μεγαλύτερη του μηδενός ταξινομείτε ως θετικό (21), στην αντίθετη περίπτωση ως αρνητικό (23). Μετά την ολοκλήρωση του αλγορίθμου το αρχείο εξόδου περιέχει την υποκειμενική ταξινόμηση των μηνυμάτων ενός συνόλου δεδομένων. Στο ακόλουθο πλαίσιο παραθέτουνε ένα αντιπροσωπευτικό απόσπασμα του αρχείου εξόδου που περιέχει την υποκειμενική ταξινόμηση των tweets του συνόλου δεδομένων «Christmas». 1 tweet-> mcglamorous; sad last like u & did fabulous job even w/out our entourage! :) merry christmas found word sad with score found emotion :) with score 1.0 found word merry with score Found 3 items with total score Normalazation positive 2 tweet-> ninamurad; i'm going convince my that we should celebrate christmas this year love idea gold star found word going with score found word year with score 0.5 found word love with score Σελίδα 47 από 66

48 5 ο ΚΕΦΑΛΑΙΟ Found 3 items with total score 0.45 Normalazation 0.15 positive 3 tweet-> danmerson1; just tried fly my sons christmas helicopter my house too small need warehouse found word just with score found word tried with score found word fly with score found word helicopter with score -0.5 found word small with score Found 5 items with total score Normalazation negative 4 tweet-> kimrwilliams; up christmas tree found word up with score found word tree with score Found 2 items with total score 0.75 Normalazation positive 5 tweet-> astarramama; $50 gift 12/9 Found 0 items with total score 0 6 tweet-> missingpolaroid; christmas almost here found word almost with score found word here with score 0.25 Found 2 items with total score Normalazation positive 7 tweet-> gomezbieberfr; make change this christmas those less fortunate found word make with score found word less with score found word fortunate with score Found 3 items with total score Normalazation positive Πλαίσιο 8: Απόσπασμα αποτελεσμάτων tweets Christmas Σελίδα 48 από 66

49 6 ο ΚΕΦΑΛΑΙΟ 6. ΣΥΓΚΕΝΤΡΩΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΗΣ ΠΕΙΡΑΜΑΤΙΚΗΣ ΔΙΑΔΙΚΑΣΙΑΣ Τα συγκριτικά αποτελέσματα της υποκειμενικής ταξινόμησης των τριών συνόλων δεδομένων που επεξεργασθήκαμε παρουσιάζονται στον ακόλουθο πίνακα. Η κατηγορία «No Classification» αφορά στα μηνύματα που δεν ταξινομήθηκαν από την μέθοδό μας και δεν είναι σχετική με μηνύματα που περιέχουν ουδέτερη άποψη. Subjective Classification Christmas Lady Gaga Wikileaks Total tweets % tweets % tweets % Tweets % Positive % % % % Negative % % % % No Classification % % % % Total % % % % Πίνακας 3: Συγκεντρωτικά αποτελέσματα αξιολόγησης Wikileaks Lady Gaga No Classification Negative Positive Christmas Σχήμα 13: Συγκεντρωτικό διάγραμμα υποκειμενικής ταξινόμησης Σελίδα 49 από 66

50 6 ο ΚΕΦΑΛΑΙΟ Παρατηρούμε ότι η μέθοδος που ακολουθήσαμε επιτυγχάνει να προσδιορίζει σημασιολογικά και να ταξινομήσει ένα αρκετά μεγάλο σύνολο μηνυμάτων. Από τα μηνύματα που εξετάσαμε επιτεύχθηκε υποκειμενική ταξινόμηση σε , ήτοι ποσοστό της τάξεων 84% που κρίνεται αρκετά ικανοποιητικό. Σαφώς υπάρχουν ακόμα περιθώρια βελτίωσης, ειδικά στην κατεύθυνση της μείωσης των μη ταξινομημένων μηνυμάτων που ανέρχονται σε ποσοστό 16% επί του συνόλου και της διόρθωσης των αποκλίσεων του λεξικού απόψεων, όμως τα πρώτα αποτελέσματα της μεθόδου είναι ενθαρρυντικά. No classification; tweets 16% Subjective classification; tweets 84% Σχήμα 14: Υποκειμενική ταξινόμηση των tweets Σχετικά με την ακρίβεια (accuracy) των αποτελεσμάτων δεν μπορούμε να εκφράσουμε επί του παρόντος άποψη γιατί θα πρέπει τα σύνολα δεδομένων να αξιολογηθούν και με άλλες συναφείς μεθόδους για να προκύψουν συγκριτικά στοιχεία. Σε κάθε περίπτωση η υποκειμενικότητα που χαρακτηρίζει τέτοιου είδους μεθόδους είναι άμεσα εξαρτώμενη από την δυσκολία προσδιορισμού της υποκειμενικότητας στο ερευνητικό πεδίο της σημασιολογίας και της εξόρυξης γνώμης. Οι lexicon-based τεχνικές που υλοποιήσαμε έδειξαν ότι η χρήση ενός σημασιολογικά βαθμολογημένου λεξικού απόψεων ενισχύει σημαντικά τις Σελίδα 50 από 66

51 6 ο ΚΕΦΑΛΑΙΟ μεθόδους της υποκειμενικής ταξινόμησης. Αν και το λεξικό που χρησιμοποιήσαμε επιδέχεται βελτιώσεις, παρόλα αυτά συνέβαλε σημαντικά στο υψηλό ποσοστό των μηνυμάτων που ταξινομήθηκαν και επιπλέον είναι ανεξάρτητο του πεδίου εφαρμογής γεγονός που ενισχύει την χρηστικότητά του. Αξίζει να σημειωθεί ότι, από τη μελέτη της βιβλιογραφίας, δεν προέκυψε ότι προηγήθηκε κάποια παρόμοια εργασία. Οι εργασίες [10, 27] που ασχολήθηκαν με τον προσδιορισμό της σημασιολογικής άποψης των tweets χρησιμοποίησαν μεθόδους μηχανικής μάθησης για τον σημασιολογικό προσδιορισμό απόψεων και την ταξινόμηση των μηνυμάτων. Στη συνέχεια του κεφαλαίου εξετάζουμε επιμέρους τα τρία σύνολα δεδομένων που επεξεργασθήκαμε και σχολιάζουμε για κάθε ένα από αυτά τις ιδιαιτερότητες που εντοπίσαμε από την πειραματική διαδικασία. 6.1 Σύνολο Δεδομένων «Χριστούγεννα» Το σύνολο δεδομένων αποτελείται από μηνύματα. Από αυτά βρέθηκαν μηνύματα που περιέχουν άποψη εκ των οποίων τα ταξινομήθηκαν ως θετικά και ως αρνητικά. Σχήμα 15: Μηνύματα με άποψη Σελίδα 51 από 66

52 6 ο ΚΕΦΑΛΑΙΟ Από την μελέτη του συνόλου δεδομένων διαπιστώθηκε ότι το είδος των μηνυμάτων σχετίζονται κυρίως με: Προσωπικά μηνύματα που αντανακλούν ανησυχίες, προβληματισμούς και προσδοκίες. Διαφημίσεις (spams). Οι διαφημίσεις αποτελούν ένα μεγάλο μέρος του συνόλου και είναι σχετικές με τραγούδια, ταινίες, εμπορικά κέντρα κ.α. Οι διαφημίσεις δεν προσφέρουν κάποια ουσιαστική σημασιολογική πληροφορία και συνήθως αλλοιώνουν την ακρίβεια των αποτελεσμάτων. Ενδεχομένως η υπηρεσία Twitter θα έπρεπε να διαθέτει ένα μηχανισμό φιλτραρίσματος, όμως η διαφήμιση και κατ επέκταση τα οικονομικά οφέλη που αποφέρει στα κοινωνικά δίκτυα δεν επιτρέπουν την λειτουργία τέτοιων μηχανισμών. Μέσα από την πειραματική διαδικασία θελήσαμε να δούμε ποιες λέξεις και φράσεις από το σύνολο των θετικών tweets εμφανίζονται πιο συχνά. Στον παρακάτω πίνακα παρουσιάζουμε τις πιο αντιπροσωπευτικές από αυτές. Word Frequency Score all just so tree merry love happy year great good best really buy come please :-) 90 1 much people Σελίδα 52 από 66

53 6 ο ΚΕΦΑΛΑΙΟ very spirit family coming perfect well better Πίνακας 4: Συχνότητα εμφάνισης λέξεων των θετικών tweets Σχήμα 16: Word cloud θετικών tweets - Christmas Όπως διακρίνουμε υψήλη συχνότητα εμφάνισης, παρουσιάζουν λέξεις που παραδοσιακά προσδριορίζουν θετική άποψη όπως love, merry, best, better κλπ. Αντίστοιχα οι πλέον συχνές λέξεις που εμφανίζονται στα αρνητικά tweets παρουσιάζονται στον επόμενο πίνακα. Word Frequency Score have song do now not out by Σελίδα 53 από 66

54 6 ο ΚΕΦΑΛΑΙΟ going today other no off lot little down thanks night next present fun beginning top Πίνακας 5: Συχνότητα εμφάνισης λέξεων των αρνητικών tweets Παρατηρούμε ότι στον πίνακα 5 η λέξη «thanks» (ευχαριστίες, ευχαριστώ) έχει αρνητική βαθμολογία. Όπως διαπιστώσαμε η λέξη δεν αποτελεί συνώνυμο όρο που προέκυψε από την διαδικασία εμπλουτισμού του λεξικού αλλά είχε ορισθεί εξ αρχής ως αρνητική λέξη. Η συγκεκριμένη εγγραφή του λεξικού πρέπει να επαναξιολογηθεί. Το ίδιο παρατηρούμε και για τη λέξη «song». Στην περίπτωση αυτή όμως η λέξη καταχωρήθηκε ως συνώνυμη του όρου «strain» του λεξικού, ο οποίος έχει διαφορετικές ερμηνείες. Σαν ρήμα μεταφράζεται ως «τεντώνω, ζορίζω», ενώ σαν ουσιαστικό ερμηνεύεται ως «τάση, άσμα, σκοπός». Το λεξικό πριν τον εμπλουτισμό, δεν περιείχε τη λέξη. Άρα και σε αυτή τη περίπτωση διαπιστώνουμε μια σχετική ασάφεια ως προς την σημασιολογική βαθμολογία της συγκεκριμένης λέξης. Μια ακόμα εγγραφή που εμφανίζεται στον πίνακα συχνότητας των αρνητικών λέξεων προκάλεσε προβληματισμό και αφορά στη λέξη «fun», που μεταφράζεται ως «διασκέδαση». Διαπιστώσαμε ότι η λέξη έχει προστεθεί ως συνώνυμη της λέξης «sport». Η συγκεκριμένη περίπτωση θεωρείται ως σφάλμα της συνάρτηση του wordnet. Μπορεί εννοιολογικά η λέξη fun να είναι σχετική με τη λέξη sport, σε καμία περίπτωση όμως δεν μπορεί να χαρακτηρισθεί ως συνώνυμή της. ' ', 'sport', 'summercater', 'sportsman', 'sportswoman', 'fun' Σελίδα 54 από 66

55 6 ο ΚΕΦΑΛΑΙΟ Σύμφωνα με τα παραπάνω, προκύπτει η ανάγκη αναθεώρησης του λεξικού απόψεων και επανακαθορισμού της βαθμολογίας ορισμένων συνώνυμων λέξεων, με τεχνικές που περιγράφονται αναλυτικά στο επόμενο κεφάλαιο. Ένα ακόμα ενδιαφέρον συμπέρασμα που προέκυψε από τη μελέτη των αποτελεσμάτων είναι σχετικό με τα emotions που χρησιμοποιούν οι χρήστες. Αναμέναμε η συχνότητα εμφάνισής τους να είναι αρκετά υψηλή, όμως τελικώς οι πειραματικές διαδικασίες απέδειξαν το αντίθετο. Όπως φαίνεται στον πίνακα 4 εκτός του emotion :-) (90 φορές) που εμφανίζεται σχετικά συχνά, κανένα άλλο σύμβολο δεν συμπεριλήφθηκε στους πίνακες συχνοτήτων. Επειδή το συγκεκριμένο λεξικό περιέχει τα βασικότερα emotions και η φαντασία των χρηστών παράγει νέα με γρήγορους ρυθμούς απαιτείται η επικαιροποίηση και ο εμπλουτισμός του. 6.2 Σύνολο Δεδομένων «Lady Gaga» Το σύνολο των δεδομένων αποτελείται από μηνύματα από τα οποία περιέχουν άποψη, τα θετική και 934 αρνητική. Και σε αυτό το σύνολο τα διαφημιστικά μηνύματα ήταν πολύ συχνά. Καταμετρήθηκαν 95 μηνύματα που περιείχαν την ετικέτα «nowplaying» και αφορούσαν σε ανακοινώσεις από ραδιοφωνικούς σταθμούς. Σχήμα 17: Μηνύματα με άποψη Σελίδα 55 από 66

56 6 ο ΚΕΦΑΛΑΙΟ Εντοπίσαμε τις πλέον συχνές λέξεις που εμφανίζονται στο σύνολο των θετικών tweets και τις συγκρίναμε με το προηγούμενο σύνολο δεδομένων. Παρατηρήσαμε ότι υπάρχουν αρκετές κοινές λέξεις και είναι αυτές που συνήθως χρησιμοποιούνται για να εκφράσουν μια θετική άποψη. Με τον όρο «κοινές» αναφερόμαστε στις λέξεις που δεν χαρακτηρίζουν μονοσήμαντα μια έννοια αλλά χρησιμοποιούνται σε αρκετές εκφράσεις. Words Dataset Christmas Dataset Lady Gaga all but good history love make music really see so think up very will Πίνακας 6: Σύγκριση κοινών συχνά εμφανιζόμενων θετικών λέξεων Ένα τέτοιο σύνολο λέξεων μπορεί να έχει ένα ειδικό βάρος στις τεχνικές ανάλυσης, εισάγοντας μια διαφορετική παράμετρο αξιολόγησης. Η τεχνική της προσθήκης βάρους σε ομάδες λέξεων είναι μια τεχνική που εφαρμόζεται σε σημασιολογικές αναλύσεις κειμένου. Η δυσκολία εφαρμογής της όμως έγκειται στο γεγονός ότι δεν υπάρχει ένα κοινά αποδεκτό σύνολο τέτοιων λέξεων που να έχει εφαρμογή σε διαφορετικά είδη συνόλων. Συνεπώς απαιτείται πειραματισμός σε μεγάλο όγκο δεδομένων για να προκύψει ένα αξιόλογο και αξιόπιστο σύνολο λέξεων. Σελίδα 56 από 66

57 6 ο ΚΕΦΑΛΑΙΟ Σχήμα 18: Word cloud κοινών λέξεων - Christmas & Lady Gaga 6.3 Σύνολο Δεδομένων «Wikileaks» Το τελευταίο σύνολο δεδομένων που εξετάσαμε είναι σχετικό με την δημοσιογραφική είδηση διαρροής απορρήτων εγγράφων από διάφορα κράτη όπως η Αμερική, Γερμανία, Ισραήλ, Τουρκία, Ελλάδα κλπ. Ο ιδρυτής της ιστοσελίδας Julian Assange έχει απασχολήσει αρκετές φορές τον διεθνή τύπο για την δράση του, τόσο την προσωπική όσο και την επιχειρηματική. Επιλέξαμε το συγκεκριμένο θέμα γιατί θέλαμε να δούμε πώς εκφράζονται οι χρήστες της υπηρεσίας όταν σχολιάζουν τέτοιου είδους ειδήσεις και αν χρησιμοποιούν πιο ιδιαίτερες λέξεις ή εκφράσεις. Αξίζει να σημειωθεί ότι το συγκεκριμένο σύνολο δεδομένων περιέχει τα λιγότερα μηνύματα παρά το γεγονός ότι η χρονική διάρκεια του streaming των δεδομένων ήταν πιο μεγάλη από τις δύο προηγούμενες περιπτώσεις. Το σύνολο αποτελείται από μηνύματα από τα οποία περιέχουν άποψη, τα θετική και 933 αρνητική. Όπως διαπιστώνουμε η άποψη των χρηστών είναι μοιρασμένη, με ελαφρή προβάδισμα αυτών που εκφράζονται θετικά σχετικά με το θέμα. Και σε αυτό το σύνολο είχαμε πολλά διαφημιστικά μηνύματα που περιείχαν κυρίως υπερσυνδέσμους σε ειδησεογραφικά πρακτορεία. Σελίδα 57 από 66

58 6 ο ΚΕΦΑΛΑΙΟ Σχήμα 19: Σχηματική παράσταση των tweets Το σύνολο των συχνών λέξεων, διαφοροποιείται σημαντικά σε σχέση με τα δύο προηγούμενα σύνολα δεδομένων. Είναι πιο ιδιαίτερο και περιλαμβάνει λέξεις πιο τυπικές, όπως court (νομοθετικό σώμα), government (διακυβέρνηση, διοίκηση), probe (έρευνα, ανάκριση), christian (χριστιανός, ηθικός, ελεήμονας). Word Frequency Score over account news court government probe trawl release christian people dear ordered favor guardian personal please site after Πίνακας 7: Συχνότητα εμφάνισης λέξεων των θετικών tweets Σελίδα 58 από 66

59 6 ο ΚΕΦΑΛΑΙΟ Σχήμα 19: Word cloud tweets Wikileaks Εντύπωση προκάλεσε η συχνότητα εμφάνισης της λέξης «trawl» που στην ελληνική γλώσσα αντιστοιχεί στη φράση «ψαρεύω με δίχτυ», η οποία προφανώς χρησιμοποιείται μεταφορικά και αποτυπώνει το ψάρεμα των ειδήσεων. Η συγκεκριμένη περίπτωση ενισχύει τον ισχυρισμό που αναπτύχθηκε στην εργασία και αντιπροσωπεύει τις απόψεις των ερευνητών σχετικά με τη δυσκολία εντοπισμού του σημασιολογικού προσδιορισμού των απόψεων ενός κειμένου. Πώς θα μπορούσε μια σημασιολογική μέθοδος να ερμηνεύσει τη μεταφορική έννοια αυτής ή παρόμοιων λέξεων; Οι ιδιαιτερότητες της φυσικής γλώσσας είναι τόσες πολλές που καμία μέθοδος μέχρι στιγμής δεν μπορεί να τις προβλέψει. Στις περισσότερες των περιπτώσεων ο στόχος είναι αντίστοιχες περιπτώσεις να περιορισθούν στο ελάχιστο δυνατό και να μην αλλοιώνουν αξιόλογα τα αποτελέσματα. Όλα τα προηγούμενα αποτελέσματα που παρουσιάσθηκαν, αποδεικνύουν ότι υπάρχει πλεονάζουσα και χρήσιμη πληροφορία στα σύντομα μηνύματα του κοινωνικού δικτύου Twitter. Οι χρήστες κρυμμένοι πίσω από την ανωνυμία του διαδικτύου, εκφράζονται ελεύθερα, αξιολογούν και σχολιάζουν πλήθος καθημερινών, κοινωνικών και προσωπικών θεμάτων. Σελίδα 59 από 66

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εξαγωγή γεωγραφικής πληροφορίας από δεδομένα παρεχόμενα από χρήστες του

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Opinion Mining Opinion Mining Συνώνυμο: Sentiment Analysis Ορισμός: Ανάλυση κειμένων που αναφέρονται σε μια οντότητα/αντικείμενο Εντοπισμός

Διαβάστε περισσότερα

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ Τι είναι η ερευνητική εργασία Η ερευνητική εργασία στο σχολείο είναι μια δυναμική διαδικασία, ανοιχτή στην αναζήτηση για την κατανόηση του πραγματικού κόσμου.

Διαβάστε περισσότερα

Opinion Mining and Sentiment analysis

Opinion Mining and Sentiment analysis Opinion Mining and Sentiment analysis Τμήμα Μηχανικών Η/Υ και Πληροφορικής επιβλέπων καθηγητής: Μακρής Χρήστος Επισκόπηση και πειραματική αξιολόγηση τεχνικών για opinion mining και sentiment analysis Παναγόπουλος

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Social Media White. Chapter 1. Corporate Blogging

Social Media White. Chapter 1. Corporate Blogging Social Media White Papers u Τι είναι ένα blog Η λέξη blog προέρχεται από σύντμηση της έκφρασης web log. Τα blogs ξεκίνησαν σαν απλά προσωπικά ημερολόγια, έχουν όμως μετεξελιχθεί στην καταγραφή και δημοσίευση

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Τι είναι η γλωσσική τεχνολογία;

Διαβάστε περισσότερα

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής Εξόρυξη γνώσης από σχόλια σε τουριστικές ιστοσελίδες και παραγοντική ανάλυση του αισθήματος ικανοποίησης των πελατών για το ξενοδοχείο τους Γιώργος ταλίδης 1, Παναγιώτης ταλίδης 2, Κώστας Διαμαντάρας 2

Διαβάστε περισσότερα

10 Νέα χαρακτηριστικά του Facebook που (πιθανόν) δεν γνωρίζεις

10 Νέα χαρακτηριστικά του Facebook που (πιθανόν) δεν γνωρίζεις 10 Νέα χαρακτηριστικά του Facebook που (πιθανόν) δεν γνωρίζεις 6 Μαρτίου 2016 Παναγιώτης Σακαλάκης Αν υπάρχει κάτι που γνωρίζει ο περισσότερος κόσμος για το Facebook, αυτό είναι πως κατέχει την πρώτη θέση

Διαβάστε περισσότερα

ΜΕΣΑ ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ

ΜΕΣΑ ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ ΣΤΟΧΟΣ ΕΡΕΥΝΑΣ...είναι να διερευνηθεί κατά πόσο γίνεται χρήση των Social Media στο πολιτικό μάρκετινγκ στην Ελλάδα και ποια είναι η σχέση της χρήσης αυτών των μέσων με την πολιτική συμπεριφορά... Συγκεκριμένα,

Διαβάστε περισσότερα

«Καθοριστικοί παράγοντες της αποτελεσματικότητας της από στόμα-σε-στόμα επικοινωνίας στις ιστοσελίδες κοινωνικής δικτύωσης»

«Καθοριστικοί παράγοντες της αποτελεσματικότητας της από στόμα-σε-στόμα επικοινωνίας στις ιστοσελίδες κοινωνικής δικτύωσης» «Καθοριστικοί παράγοντες της αποτελεσματικότητας της από στόμα-σε-στόμα επικοινωνίας στις ιστοσελίδες κοινωνικής δικτύωσης» Ονοματεπώνυμο: Ταχταρά Κατερίνα Σειρά: 8 η Επιβλέπων Καθηγητής: Βρεχόπουλος Αδάμ

Διαβάστε περισσότερα

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης Twitter Τμήμα Ψηφιακών Μέσων και Επικοινωνίας Δομή Εργαστηρίου Εισαγωγή Facebook (Χ2) Twitter Pinterest YouTube Instagram Wordpress Google + LinkedIn Hootsuite Επανάληψη

Διαβάστε περισσότερα

ΕΚΘΕΣΗ ΑΚΑΔΗΜΑΪΚΩΝ ΕΝΔΙΑΦΕΡΟΝΤΩΝ

ΕΚΘΕΣΗ ΑΚΑΔΗΜΑΪΚΩΝ ΕΝΔΙΑΦΕΡΟΝΤΩΝ ΕΚΘΕΣΗ ΑΚΑΔΗΜΑΪΚΩΝ ΕΝΔΙΑΦΕΡΟΝΤΩΝ Η έκθεση ακαδημαϊκών ενδιαφερόντων συνοδεύει σχεδόν πάντα την αίτηση για την είσοδο σε οποιοδήποτε πρόγραμμα μεταπτυχιακών σπουδών. Την έκθεση ακαδημαϊκών ενδιαφερόντων

Διαβάστε περισσότερα

Φύση και Μαθηματικά. Η χρυσή τομή φ

Φύση και Μαθηματικά. Η χρυσή τομή φ Φύση και Μαθηματικά Η χρυσή τομή φ Ερευνητική Εργασία (Project) Α' Λυκείου 1ο ΓΕΛ Ξάνθης 2011 2012 Επιβλέποντες καθηγητές Επαμεινώνδας Διαμαντόπουλος Βασιλική Κώττη Φύση και Μαθηματικά 2 Τι είναι η χρυσή

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP Σχεδιαστικά Θέματα Natural Language Processing Επεξεργασία δεδομένων σε φυσική γλώσσα Κατανόηση φυσικής γλώσσας από τη μηχανή

Διαβάστε περισσότερα

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.

Διαβάστε περισσότερα

Στόχος της ψυχολογικής έρευνας:

Στόχος της ψυχολογικής έρευνας: Στόχος της ψυχολογικής έρευνας: Συστηματική περιγραφή και κατανόηση των ψυχολογικών φαινομένων. Η ψυχολογική έρευνα χρησιμοποιεί μεθόδους συστηματικής διερεύνησης για τη συλλογή, την ανάλυση και την ερμηνεία

Διαβάστε περισσότερα

Συγγραφή Τεχνικών Κειμένων

Συγγραφή Τεχνικών Κειμένων Συγγραφή Τεχνικών Κειμένων Η Ανάπτυξη του κειμένου Από τις διαλέξεις του μαθήματος του Α εξαμήνου σπουδών του Τμήματος Πολιτικών Μηχανικών και Μηχανικών Τοπογραφίας & Γεωπληροφορικής Κ. Παπαθεοδώρου, Αναπληρωτής

Διαβάστε περισσότερα

Η ΧΡΗΣΗ ΤΩΝ ΣΥΓΧΡΟΝΩΝ SOCIAL MEDIA

Η ΧΡΗΣΗ ΤΩΝ ΣΥΓΧΡΟΝΩΝ SOCIAL MEDIA Η ΧΡΗΣΗ ΤΩΝ ΣΥΓΧΡΟΝΩΝ SOCIAL MEDIA ΤΑΞΗ Α 2 ΛΥΚΕΙΟΥ ΕΡΓΑΣΙΑ ΜΑΘΗΤΡΙΩΝ: ΦΙΟΝΑ ΤΖΟΥΜΑΚΟΥ ΣΜΑΡΑΓΔΑ ΧΑΤΖΗΠΟΥΦΛΗ ΜΑΡΙΑΝΝΑ ΘΑΝΟΠΟΥΛΟΥ Η ΧΡΗΣΗ ΤΩΝ ΣΥΓΧΡΟΝΩΝ O όρος Κοινωνικά μέσα μαζικής ενημέρωσης αναφέρεται

Διαβάστε περισσότερα

Αξιολόγηση της εκστρατείας ενημέρωσης, ευαισθητοποίησης, εκπαίδευσης στο πλαίσιο του έργου LIFE+PURE

Αξιολόγηση της εκστρατείας ενημέρωσης, ευαισθητοποίησης, εκπαίδευσης στο πλαίσιο του έργου LIFE+PURE Αξιολόγηση της εκστρατείας ενημέρωσης, ευαισθητοποίησης, εκπαίδευσης στο πλαίσιο του έργου LIFE+PURE Περιεχόμενα Περιεχόμενα Διαγραμμάτων...2 Εισαγωγή...3 Το δείγμα της έρευνας...3 Τα εργαλεία ενημέρωσης...4

Διαβάστε περισσότερα

Ερευνητική Εργασία. γ) ενθουσιασμό (ως προς τον τρόπο παρουσίασης των ηθοποιών)

Ερευνητική Εργασία. γ) ενθουσιασμό (ως προς τον τρόπο παρουσίασης των ηθοποιών) 11 ο ΓΕΛ Πάτρας Σχ. Έτος 2013-2014 Τμήμα Α4 Ερευνητική Εργασία 1. Κριτήρια επιλογής θέματος α) ενδιαφέρον (ως προς το σενάριο) β) σκέψη (με τον τρόπο που σκέφτεται ο σκηνοθέτης) γ) ενθουσιασμό (ως προς

Διαβάστε περισσότερα

Ideas that take you places

Ideas that take you places Ideas that take you places Ρόλος και δυνατότητες των Social Media στην σύγχρονη εκπαιδευτική διαδικασία Δημητρακοπούλου Κατερίνα Ms. Ιούνιος 2018 Τι άλλαξε με τα Social Media; Αλλαγές Ο τρόπος που ο κόσμος

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Η Έρευνα Μάρκετινγκ ως εργαλείο ανάπτυξης νέων προϊόντων ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ.

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΠΛΑΤΦΟΡΜΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΜΑΘΗΣΗΣ ΕΝΗΛΙΚΩΝ

ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΠΛΑΤΦΟΡΜΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΜΑΘΗΣΗΣ ΕΝΗΛΙΚΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΠΛΑΤΦΟΡΜΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΜΑΘΗΣΗΣ ΕΝΗΛΙΚΩΝ ΑΙΚΑΤΕΡΙΝΗ ΜΙΛΚΟΥ Επιβλέπων καθηγητής:

Διαβάστε περισσότερα

Τίμος Κουλουμπής. Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων, Πανεπιστήμιο Αιγαίου

Τίμος Κουλουμπής. Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων, Πανεπιστήμιο Αιγαίου Τίμος Κουλουμπής Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων, Πανεπιστήμιο Αιγαίου Αντικείμενο Εργασίας Εισαγωγή στην Αυτόματη Κατηγοριοποίηση Κειμένου Μεθοδολογίες Συγκριτική Αποτίμηση Συμπεράσματα

Διαβάστε περισσότερα

Οικονόμου Παναγιώτης.

Οικονόμου Παναγιώτης. Οικονόμου Παναγιώτης panawths@gmail.com poikonomou@teilam.gr Οικονόμου Παναγιώτης 1 Παπαγεωργίου. 2 Αθήνα-Ελλάδα χρόνου 460 π.χ.? Ένας νεαρός άνδρας σκεπτόμενος το ενδεχόμενο γάμου, ζητά από τον Σωκράτη

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Εισαγωγικό Φροντιστήριο

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Εισαγωγικό Φροντιστήριο ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Εισαγωγικό Φροντιστήριο Project του μαθήματος Εργασία 2 ατόμων Προφορική εξέταση για: Project (80%) Θεωρία (20%) Στο φροντιστήριο: Ζητήματα

Διαβάστε περισσότερα

Πώς Διηγούμαστε ή Αφηγούμαστε ένα γεγονός που ζήσαμε

Πώς Διηγούμαστε ή Αφηγούμαστε ένα γεγονός που ζήσαμε ΔΙΑΘΕΣΙΜΟ ΣΤΗ: http //blgs.sch.gr/anianiuris ΥΠΕΥΘΥΝΟΣ: Νιανιούρης Αντώνης (email: anianiuris@sch.gr) Πώς Διηγούμαστε ή Αφηγούμαστε ένα γεγονός που ζήσαμε Διηγούμαστε ή αφηγούμαστε ένα γεγονότος, πραγματικό

Διαβάστε περισσότερα

Γεωργική Εκπαίδευση Ενότητα 12

Γεωργική Εκπαίδευση Ενότητα 12 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 12: Αξιολόγηση εκπαιδευτικών προγραμμάτων Αφροδίτη Παπαδάκη-Κλαυδιανού Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε

Διαβάστε περισσότερα

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης

Διαβάστε περισσότερα

Γενικός προγραμματισμός στην ολομέλεια του τμήματος (διαδικασία και τρόπος αξιολόγησης μαθητών) 2 ώρες Προγραμματισμός και προετοιμασία ερευνητικής

Γενικός προγραμματισμός στην ολομέλεια του τμήματος (διαδικασία και τρόπος αξιολόγησης μαθητών) 2 ώρες Προγραμματισμός και προετοιμασία ερευνητικής Γενικός προγραμματισμός στην ολομέλεια του τμήματος (διαδικασία και τρόπος αξιολόγησης μαθητών) 2 ώρες Προγραμματισμός και προετοιμασία ερευνητικής ομάδας 2 ώρες Υλοποίηση δράσεων από υπο-ομάδες για συλλογή

Διαβάστε περισσότερα

Fake News ΕΛΛΗΝΙΚΟ ΚΕΝΤΡΟ ΑΣΦΑΛΟΥΣ ΔΙΑΔΙΚΤΥΟΥ. Γραμμή βοηθείας Ενημέρωση-Επαγρύπνηση Γραμμή παράνομου περιεχομένου

Fake News ΕΛΛΗΝΙΚΟ ΚΕΝΤΡΟ ΑΣΦΑΛΟΥΣ ΔΙΑΔΙΚΤΥΟΥ. Γραμμή βοηθείας Ενημέρωση-Επαγρύπνηση Γραμμή παράνομου περιεχομένου Fake News ΕΛΛΗΝΙΚΟ ΚΕΝΤΡΟ ΑΣΦΑΛΟΥΣ ΔΙΑΔΙΚΤΥΟΥ 210 6007686 www.safeline.gr Γραμμή βοηθείας Ενημέρωση-Επαγρύπνηση Γραμμή παράνομου περιεχομένου Η διασπορά ψευδών ειδήσεων ήταν και συνεχίζει να είναι ένα

Διαβάστε περισσότερα

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια)

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια) Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018 Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια) ΠΕΡΙΟΧΗ Α: ΕΦΑΡΜΟΓΕΣ ΜΕ ΑΙΣΘΗΤΗΡΕΣ ΓΙΑ ΕΠΙΓΝΩΣΗ ΣΥΓΚΕΙΜΕΝΟΥ Οι αισθητήρες μας δίνουν τη δυνατότητα

Διαβάστε περισσότερα

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΙΑ 2 ΑNAΠΤΥΞΗ

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΙΑ 2 ΑNAΠΤΥΞΗ ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΙΑ 2 ΑNAΠΤΥΞΗ ΗΛΕΚΤΡΟΝΙΚΗΣ ΥΠΗΡΕΣΙΑΣ ΑΝΑΖΗΤΗΣΗΣ ΕΦΑΡΜΟΓΩΝ ΕΛ/ΛΑΚ ] ΓΙΑ ΤΟN ΧΡΗΣΤΗ [13/01/2014] έκδοση: 1.0 1 Περιεχόμενα 1. Έλεγχος εγγράφου...3 2. Εισαγωγή...4 3. Εισαγωγή

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

11/ Social Media. Η διείσδυση των Μέσων Κοινωνικής Δικτύωσης στην Ελλάδα.

11/ Social Media. Η διείσδυση των Μέσων Κοινωνικής Δικτύωσης στην Ελλάδα. 11/2012 12-2016 Social Media 2016 Η διείσδυση των Μέσων Κοινωνικής Δικτύωσης στην Ελλάδα Ημερομηνία δημοσίευσης 17/3/2016 www.publicissue.gr Η Public Issue ιδρύθηκε το 2001. Εξειδικεύεται στην πολιτική

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Πίνακας περιεχομένων Τίτλος της έρευνας (title)... 2 Περιγραφή του προβλήματος (Statement of the problem)... 2 Περιγραφή του σκοπού της έρευνας (statement

Διαβάστε περισσότερα

Διερεύνηση της αλληλεπίδρασης των συμμετεχόντων στα Εθνικά Θεματικά Δίκτυα Ερωτηματολόγιο Υπεύθυνων Συντονιστών

Διερεύνηση της αλληλεπίδρασης των συμμετεχόντων στα Εθνικά Θεματικά Δίκτυα Ερωτηματολόγιο Υπεύθυνων Συντονιστών Διερεύνηση της αλληλεπίδρασης των συμμετεχόντων στα Εθνικά Θεματικά Δίκτυα Ερωτηματολόγιο Υπεύθυνων Συντονιστών Αγαπητοί συνάδελφοι των ΚΠΕ της χώρας, Στο πλαίσιο εκπόνησης Διπλωματικής Εργασίας, στο Πρόγραμμα

Διαβάστε περισσότερα

ΕΠΙΔΡΑΣΗ ΤΗΣ ΟΙΚΟΝΟΜΙΚΗΣ ΚΡΙΣΗΣ ΣΤΙΣ ΑΓΟΡΑΣΤΙΚΕΣ ΤΑΣΕΙΣ ΤΩΝ ΕΛΛΗΝΩΝ ΚΑΤΑΝΑΛΩΤΩΝ ΑΠΟ ΤΟ ΔΙΑΔΙΚΤΥΟ

ΕΠΙΔΡΑΣΗ ΤΗΣ ΟΙΚΟΝΟΜΙΚΗΣ ΚΡΙΣΗΣ ΣΤΙΣ ΑΓΟΡΑΣΤΙΚΕΣ ΤΑΣΕΙΣ ΤΩΝ ΕΛΛΗΝΩΝ ΚΑΤΑΝΑΛΩΤΩΝ ΑΠΟ ΤΟ ΔΙΑΔΙΚΤΥΟ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ Πτυχιακή Εργασία ΕΠΙΔΡΑΣΗ ΤΗΣ ΟΙΚΟΝΟΜΙΚΗΣ ΚΡΙΣΗΣ ΣΤΙΣ ΑΓΟΡΑΣΤΙΚΕΣ ΤΑΣΕΙΣ ΤΩΝ ΕΛΛΗΝΩΝ ΚΑΤΑΝΑΛΩΤΩΝ ΑΠΟ ΤΟ ΔΙΑΔΙΚΤΥΟ Γκιπάλη Δώρα, A.M. 7795 Καρρά

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

1. Σκοπός της έρευνας

1. Σκοπός της έρευνας Στατιστική ανάλυση και ερμηνεία των αποτελεσμάτων των εξετάσεων πιστοποίησης ελληνομάθειας 1. Σκοπός της έρευνας Ο σκοπός αυτής της έρευνας είναι κυριότατα πρακτικός. Η εξέταση των δεκτικών/αντιληπτικών

Διαβάστε περισσότερα

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης Twitter Κουστουμπάρδη Ερατώ ΤΕΙ Ιονίων Νήσων Τμήμα Ψηφιακών Μέσων και Επικοινωνίας Twitter Το Twitter είναι μία micro-blogging υπηρεσία, η οποία επιτρέπει στους

Διαβάστε περισσότερα

Mobile Marketing: Οι Παράγοντες Αποδοχής του SMS των Ελλήνων Καταναλωτών

Mobile Marketing: Οι Παράγοντες Αποδοχής του SMS των Ελλήνων Καταναλωτών Mobile Marketing: Οι Παράγοντες Αποδοχής του SMS των Ελλήνων Καταναλωτών Ονοματεπώνυμο: Πατεράκη Σοφία Σειρά: 8 η Επιβλέπουσα Καθηγήτρια: κα. Άννα Ζαρκάδα Δεκέμβριος 2011 Περιεχόμενα Βιβλιογραφία Μοντέλο

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ WordNet Σημασιολογικά Δίκτυα Ένα δίκτυο που αναπαριστά συσχετίσεις μεταξύ εννοιών. Οι κορυφές παριστάνουν έννοιες και οι ακμές σημασιολογικές

Διαβάστε περισσότερα

Αναζητήσεις στο Διαδίκτυο

Αναζητήσεις στο Διαδίκτυο Αναζητήσεις στο Διαδίκτυο Πλεονεκτήματα από τη χρήση του Διαδικτύου για την αναζήτηση πληροφοριών Υπάρχει πληθώρα πληροφοριών (που περιλαμβάνουν μεγάλο εύρος από media). Οι μαθητές καθίστανται «ερευνητές

Διαβάστε περισσότερα

Χρήση δευτερογενών δεδομένων

Χρήση δευτερογενών δεδομένων Χρήση δευτερογενών δεδομένων Μαθησιακοί στόχοι κεφαλαίου Να αναγνωρίζετε όλα τα είδη δευτερογενών δεδομένων, Να εκτιμάτε τους τρόπους με τους οποίους τα δευτερογενή δεδομένα μπορούν να χρησιμοποιηθούν

Διαβάστε περισσότερα

Τεχνικές συλλογής δεδομένων στην ποιοτική έρευνα

Τεχνικές συλλογής δεδομένων στην ποιοτική έρευνα Το κείμενο αυτό είναι ένα απόσπασμα από το Κεφάλαιο 16: Ποιοτικές ερμηνευτικές μέθοδοι έρευνας στη φυσική αγωγή (σελ.341-364) του βιβλίου «Για μία καλύτερη φυσική αγωγή» (Παπαιωάννου, Α., Θεοδωράκης Ι.,

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Ανάλυση ποιοτικών δεδομένων

Ανάλυση ποιοτικών δεδομένων Ανάλυση ποιοτικών δεδομένων Σύνοψη κεφαλαίου Σύνδεση θεωρίας και ανάλυσης Επεξεργασία ποιοτικών δεδομένων Δεοντολογία και ανάλυση ποιοτικών δεδομένων Αξιολογώντας την ποιότητα των ποιοτικών ερευνών Εισαγωγή

Διαβάστε περισσότερα

Twitter και Εφαρμογές

Twitter και Εφαρμογές Twitter και Εφαρμογές Konstantinos Semertzidis ksemer@cs.uoi.gr Γενικά για το Twitter Το Twitter είναι μια δωρεάν social network και microblogging υπηρεσία. Δημιουργήθηκε το Μάρτιο του 2006 και λειτούργησε

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ Ενότητα 10: Κοινωνικά Μέσα Μάρκετινγκ (1) Βλαχοπούλου Μάρω Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό,

Διαβάστε περισσότερα

ΠΑΝΕΛΛΑΔΙΚΗ ΕΡΕΥΝΑ ΤΟΥ ΕΚΚΕ ΜΕ ΤΙΤΛΟ: «TO ΔΙΑΔΙΚΤΥΟ ΣΤΗΝ ΕΛΛΑΔΑ. WORLD INTERNET PROJECT GREECE»

ΠΑΝΕΛΛΑΔΙΚΗ ΕΡΕΥΝΑ ΤΟΥ ΕΚΚΕ ΜΕ ΤΙΤΛΟ: «TO ΔΙΑΔΙΚΤΥΟ ΣΤΗΝ ΕΛΛΑΔΑ. WORLD INTERNET PROJECT GREECE» ΠΑΝΕΛΛΑΔΙΚΗ ΕΡΕΥΝΑ ΤΟΥ ΕΚΚΕ ΜΕ ΤΙΤΛΟ: «TO ΔΙΑΔΙΚΤΥΟ ΣΤΗΝ ΕΛΛΑΔΑ. WORLD INTERNET PROJECT GREECE» Οι επιπτώσεις της χρήσης των online τεχνολογιών, σε σχέση με τη συμπεριφορά, τις στάσεις και τις αντιλήψεις

Διαβάστε περισσότερα

Εννοιολογική Ομοιογένεια

Εννοιολογική Ομοιογένεια Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας Βιβλιοθηκονομίας Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Εννοιολογική Ομοιογένεια Αξιοποίηση Ταξινομικών Συστημάτων Γεωργία Προκοπιάδου, Διονύσης

Διαβάστε περισσότερα

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 7 - ΥΠΗΡΕΣΊΑ

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 7 - ΥΠΗΡΕΣΊΑ ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 7 - ΥΠΗΡΕΣΊΑ ΑΝΑΠΑΡΑΓΩΓΉΣ ΚΑΤ ΑΠΑΊΤΗΣΗ (VIDEO ON DEMAND) ΜΕ ΠΑΡΆΛΛΗΛΗ ΑΡΧΕΙΟΘΈΤΗΣΗ ΤΟΥ ΟΠΤΙΚΟΑΚΟΥΣΤΙΚΟΎ ΥΛΙΚΟΎ] ΓΙΑ ΤΟN ΧΡΗΣΤΗ [13/01/2014] έκδοση: 1.0 1 Περιεχόμενα 1.

Διαβάστε περισσότερα

«ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ»

«ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ» Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗ: ΕΠΙΧΕΙΡΗΜΑΤΙΚΗ ΠΛΗΡΟΦΟΡΙΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΑΤΡΑΚΑΣ ΘΩΜΑΣ «ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ» ΕΠΙΒΛΕΠΩΝ

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

Μέσα κοινωνικής δικτύωσης και κοινοποίηση περιεχομένου

Μέσα κοινωνικής δικτύωσης και κοινοποίηση περιεχομένου Μέσα κοινωνικής δικτύωσης και κοινοποίηση περιεχομένου Οι συμμετέχοντες θα σκεφτούν για το απόρρητο όσον αφορά τον τρόπο με τον οποίο κοινοποιούν πληροφορίες και επικοινωνούν με τους άλλους στο διαδίκτυο,

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (ΤΕΙ) ΑΘΗΝΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΚΑΙ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΗΣΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (ΤΕΙ) ΑΘΗΝΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΚΑΙ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΗΣΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (ΤΕΙ) ΑΘΗΝΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΚΑΙ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΗΣΗΣ Η επίδραση της εκπαίδευσης πληροφοριακού γραμματισμού στο άγχος των υπολογιστών

Διαβάστε περισσότερα

Αναζητήσεις στο Διαδίκτυο

Αναζητήσεις στο Διαδίκτυο Αναζητήσεις στο Διαδίκτυο Διαδίκτυο ως πηγή πληροφοριών Το Διαδίκτυο στις μέρες μας αποτελεί την μεγαλύτερη πηγή πληροφοριών. Οι Δάσκαλοι πρέπει να εκπαιδεύσουν τους μαθητές να αναζητούν σωστά και να αξιοποιούν

Διαβάστε περισσότερα

Opinion Mining and Sentiment Analysis

Opinion Mining and Sentiment Analysis Τμήμα Μηχανικών Η/Υ και Πληροφορικής επιβλέπων: Μακρής Χρήστος, Επίκουρος Καθηγητής Opinion Mining and Sentiment Analysis Επισκόπηση και πειραματική αξιολόγηση τεχνικών για opinion mining και sentiment

Διαβάστε περισσότερα

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner 10. Text Mining Για να μπορέσουμε να χρησιμοποιήσουμε τις δυνατότητες text mining του Rapid Miner πρέπει να εγκαταστήσουμε το Text Mining Extension. Πηγαίνουμε Help Updates and Extensions (Marketplace)

Διαβάστε περισσότερα

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή 1 Πίνακας Περιεχομένων 1. Εισαγωγή... 4 1.1 Περιβάλλον Moodle...4 1.2 Χρήση ονόματος χρήστη και κωδικού...4 1.3 Δημιουργία νέου μαθήματος...4 1.3.1

Διαβάστε περισσότερα

Μεθοδολογία Έρευνας Διάλεξη 4 η : Κριτική Βιβλιογραφική Ανασκόπηση

Μεθοδολογία Έρευνας Διάλεξη 4 η : Κριτική Βιβλιογραφική Ανασκόπηση Μεθοδολογία Έρευνας Διάλεξη 4 η : Κριτική Βιβλιογραφική Ανασκόπηση Δρ. Αλέξανδρος Αποστολάκης Email: aapostolakis@staff.teicrete.gr Τηλ.: 2810379621 E-class μαθήματος: https://eclass.teicrete.gr/courses/pgrad_omm104/

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας. ΚΕΦΑΛΑΙΟ 1 Εισαγωγή Η Μεθοδολογία της Έρευνας (research methodology) είναι η επιστήμη που αφορά τη μεθοδολογία πραγματοποίησης μελετών με συστηματικό, επιστημονικό και λογικό τρόπο, με σκοπό την παραγωγή

Διαβάστε περισσότερα

Τα μέσα κοινωνικής δικτύωσης στη διαχείριση επικοινωνίας εταιρικών κρίσεων

Τα μέσα κοινωνικής δικτύωσης στη διαχείριση επικοινωνίας εταιρικών κρίσεων Τα μέσα κοινωνικής δικτύωσης στη διαχείριση επικοινωνίας εταιρικών κρίσεων Ονοματεπώνυμο: Αρετή Μαμφρέδα Σειρά: 12 Επιβλέπουσα Καθηγήτρια: Άννα Κ. Ζαρκάδα Δεκέμβριος 2015 Περιεχόμενα Σκοπός της έρευνας

Διαβάστε περισσότερα

Social Media και Επικοινωνία Φεβρουάριος 2009

Social Media και Επικοινωνία Φεβρουάριος 2009 Social Media και Επικοινωνία Φεβρουάριος 2009 Το Ινστιτούτο Επικοινωνίας είναι φορέας μη κερδοσκοπικός. Στους στόχους του περιλαμβάνεται η συμβολή στην ανάπτυξη της έρευνας και την ανάδειξη κοινωνικών

Διαβάστε περισσότερα

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΣΧΥΕΙ ΚΑΤΑ ΤΟ ΜΕΡΟΣ ΠΟΥ ΑΦΟΡΑ ΤΟ ΛΥΚΕΙΟ ΓΙΑ ΤΗΝ ΥΠΟΧΡΕΩΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ ΙΣΧΥΟΥΝ ΤΟ ΔΕΠΠΣ

Διαβάστε περισσότερα

Σύνθετα μέτρα στην ποσοτική έρευνα: Δείκτες, κλίμακες και διαστάσεις

Σύνθετα μέτρα στην ποσοτική έρευνα: Δείκτες, κλίμακες και διαστάσεις Σύνθετα μέτρα στην ποσοτική έρευνα: Δείκτες, κλίμακες και διαστάσεις Σύνοψη κεφαλαίου Δείκτες, κλίμακες και διαστάσεις Κατασκευή δεικτών Κατασκευή κλιμάκων 5-2 Εισαγωγή Γιατί χρησιμοποιούνται σύνθετα μέτρα

Διαβάστε περισσότερα

Τεχνικές Έρευνας. Εισήγηση 10 η Κατασκευή Ερωτηματολογίων

Τεχνικές Έρευνας. Εισήγηση 10 η Κατασκευή Ερωτηματολογίων Τεχνικές Έρευνας Ε. Ζέτου Ε εξάμηνο 2010-2011 Εισήγηση 10 η Κατασκευή Ερωτηματολογίων ΣΚΟΠΟΣ Η συγκεκριμένη εισήγηση έχει σαν σκοπό να δώσει τις απαραίτητες γνώσεις στο/στη φοιτητή/τρια για τον τρόπο διεξαγωγής

Διαβάστε περισσότερα

Σημαντικότητα της Έρευνας Μάρκετινγκ

Σημαντικότητα της Έρευνας Μάρκετινγκ Έρευνα Μάρκετινγκ 2 Σύνολο Τεχνικών και Αρχών που αποβλέπουν στη συστηματική Συλλογή Καταγραφή Ανάλυση Ερμηνεία Στοιχείων / Δεδομένων, με τέτοιο τρόπου που να βοηθούν τη διαδικασία λήψης αποφάσεων Μάρκετινγκ

Διαβάστε περισσότερα

1 η Δραστηριότητα Wiki

1 η Δραστηριότητα Wiki 1 η Δραστηριότητα Wiki Βασικό Στόχος Στόχος της δραστηριότητας είναι η δημιουργία ηλεκτρονικών βιβλίων που να διαπραγματεύονται τα παρακάτω θέματα 1 : 1. Ηλεκτρονικό Εμπόριο. Τι είναι, Τρόποι Πληρωμής,

Διαβάστε περισσότερα

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΣΥΝΘΕΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΚΑΙ ΣΥΝΟΔΕΥΤΙΚΟΥ ΥΛΙΚΟΥ ΣΤΟ MYPROJECT

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΣΥΝΘΕΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΚΑΙ ΣΥΝΟΔΕΥΤΙΚΟΥ ΥΛΙΚΟΥ ΣΤΟ MYPROJECT ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΣΥΝΘΕΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΚΑΙ ΣΥΝΟΔΕΥΤΙΚΟΥ ΥΛΙΚΟΥ ΣΤΟ MYPROJECT Σκοπός της αξιολόγησης είναι να αποτιμηθεί ο παιδαγωγικός σχεδιασμός και η ψηφιακή αναπαράσταση της προτεινόμενης συνθετικής

Διαβάστε περισσότερα

Δείγμα & Δειγματοληψία στην Έρευνα ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (#252) Θυμηθείτε. Γιατί δειγματοληψία; Δειγματοληψία

Δείγμα & Δειγματοληψία στην Έρευνα ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (#252) Θυμηθείτε. Γιατί δειγματοληψία; Δειγματοληψία Θυμηθείτε εισήγηση 7η Δείγμα & Δειγματοληψία στην Έρευνα ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (#252) Η Στατιστική είναι ένας μηχανισμός που από τα δεδομένα παράγει πληροφόρηση: Δεδομένα Στατιστική Πληροφορίες Αλλά από πού

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος. Γλωσσική Τεχνολογία Εισαγωγή 2015 16 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ Τι θα ακούσετε Εισαγωγή στη γλωσσική τεχνολογία. Ύλη και οργάνωση του μαθήματος. Προαπαιτούμενες γνώσεις και άλλα προτεινόμενα

Διαβάστε περισσότερα

ΙΣΤΟΛΟΓΙΑ BLOGS Ένα διδακτικό εργαλείο

ΙΣΤΟΛΟΓΙΑ BLOGS Ένα διδακτικό εργαλείο ΙΣΤΟΛΟΓΙΑ BLOGS Ένα διδακτικό εργαλείο ΟΙΚΟΝΟΜΟΠΟΥΛΟΥ ΑΓΓΕΛΙΚΗ Καθηγήτρια Πληροφορικής MSc Μηχανικός Πληροφορικών Συστημάτων TI EINAI TO ΙΣΤΟΛΟΓΙΟ -BLOG Πρόκειται για ένα διαδικτυακό ημερολόγιο - σημειωματάριο,

Διαβάστε περισσότερα

ΘΕΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΚΑΤΑΣΚΕΥΗ ΕΡΩΤΗΣΕΩΝ. Άννα Κουκά

ΘΕΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΚΑΤΑΣΚΕΥΗ ΕΡΩΤΗΣΕΩΝ. Άννα Κουκά ΘΕΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΚΑΤΑΣΚΕΥΗ ΕΡΩΤΗΣΕΩΝ Άννα Κουκά Αξιολόγηση της επίδοσης των μαθητών. Μετρήσεις. Σημαντικές παρατηρήσεις Γενικός ορισμός με πρακτικά κριτήρια Αξιολόγηση είναι η απόδοση μιας ορισμένης

Διαβάστε περισσότερα

Στην πράξη ουσιαστικά αντικαθιστά τον παραδοσιακό κατάλογο μιάς Βιβλιοθήκης με όλα τα παραπάνω πλεονεκτήματα.

Στην πράξη ουσιαστικά αντικαθιστά τον παραδοσιακό κατάλογο μιάς Βιβλιοθήκης με όλα τα παραπάνω πλεονεκτήματα. 1 Λειτουργία και χρήση του καταλόγου OPAC. Η Κεντρική Βιβλιοθήκη της Θεολογικής Σχολής μέσα στα πλαίσια που καθορίζει το Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών και προσπαθώντας να ανταποκριθεί στις

Διαβάστε περισσότερα

ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΞΕΝΟΔΟΧΕΙΑΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ (Hotel Questionnaire) Εγχειρίδιο χρήσης (Demo Manual)

ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΞΕΝΟΔΟΧΕΙΑΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ (Hotel Questionnaire) Εγχειρίδιο χρήσης (Demo Manual) ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΞΕΝΟΔΟΧΕΙΑΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ (Hotel Questionnaire) Εγχειρίδιο χρήσης (Demo Manual) «WeKnow» ΔΗΜΗΤΡΙΟΣ ΨΥΧΙΑΣ & ΣΙΑ Ε.Ε. Υποστήριξη Πληροφοριακών Συστημάτων και Επικοινωνιών Σελίδα 1 από 19

Διαβάστε περισσότερα

Ermis Media. Κατηγορία: Τηλεόραση. Τίτλος Συμμετοχής: Ο Φώτης και η Μαρία λαμβάνουν Lacta Messages. Προϊόν/Υπηρεσία ( Brand Name): Lacta

Ermis Media. Κατηγορία: Τηλεόραση. Τίτλος Συμμετοχής: Ο Φώτης και η Μαρία λαμβάνουν Lacta Messages. Προϊόν/Υπηρεσία ( Brand Name): Lacta Ermis Media Η έκθεση δεν θα πρέπει να ξεπερνάει συνολικά τις 10 σελίδες (μαζί με τις οδηγίες συμπλήρωσης των πεδίων). Για τις απαντήσεις θα πρέπει να χρησιμοποιηθεί μέγεθος γραμματοσειράς 10 ή και μεγαλύτερο.

Διαβάστε περισσότερα

15 τρόποι διαχείρισης αρνητικών σχολίων και κριτικής. Wake up to Booking.yeah

15 τρόποι διαχείρισης αρνητικών σχολίων και κριτικής. Wake up to Booking.yeah 15 τρόποι διαχείρισης αρνητικών σχολίων και κριτικής Wake up to Booking.yeah Ως γνωστόν δεν γίνεται να τους ικανοποιήσετε όλους κι αυτό ισχύει φυσικά και στον τομέα της φιλοξενίας. Όταν στο σπίτι σας μένουν

Διαβάστε περισσότερα

Παιδαγωγοί και παιδαγωγική σκέψη στον ελληνόφωνο χώρο (18ος αιώνας Μεσοπόλεμος)

Παιδαγωγοί και παιδαγωγική σκέψη στον ελληνόφωνο χώρο (18ος αιώνας Μεσοπόλεμος) ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Παιδαγωγοί και παιδαγωγική σκέψη στον ελληνόφωνο χώρο (18ος αιώνας Μεσοπόλεμος) Ενότητα 2: Ιστορική-ερμηνευτική μέθοδος Βασίλειος Φούκας

Διαβάστε περισσότερα

Πληροφορίες για το νέο HSK

Πληροφορίες για το νέο HSK Πληροφορίες για το νέο HSK Μετάφραση από την ιστοσελίδα http://www.chinesetesting.cn/gosign.do?id=1&lid=0# Το νέο HSK δημιουργήθηκε από το Χανπάν σε μια προσπάθεια καλύτερης εξυπηρέτησης των σπουδαστών

Διαβάστε περισσότερα

ΑΡΗΣ ΑΣΛΑΝΙΔΗΣ Φυσικός, M.Ed. Εκπαιδευτικός-Συγγραφέας

ΑΡΗΣ ΑΣΛΑΝΙΔΗΣ Φυσικός, M.Ed. Εκπαιδευτικός-Συγγραφέας ΑΡΗΣ ΑΣΛΑΝΙΔΗΣ Φυσικός, M.Ed. Εκπαιδευτικός-Συγγραφέας Ομιλία με θέμα: ΕΡΕΥΝΗΤΙΚΕΣ ΕΡΓΑΣΙΕΣ & ΦΥΣΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΕΝΩΣΗ ΕΛΛΗΝΩΝ ΦΥΣΙΚΩΝ Εκδήλωση αριστούχων μαθητών: Οι μαθητές συναντούν τη Φυσική και η Φυσική

Διαβάστε περισσότερα

An expert is a person who has made all the mistakes that can be made in a very narrow field. Niels Bohr Βραβείο Νόμπελ στη Φυσική, 1922

An expert is a person who has made all the mistakes that can be made in a very narrow field. Niels Bohr Βραβείο Νόμπελ στη Φυσική, 1922 An expert is a person who has made all the mistakes that can be made in a very narrow field. Niels Bohr Βραβείο Νόμπελ στη Φυσική, 1922 Experience is the name everyone gives to their mistakes. Oscar Wilde

Διαβάστε περισσότερα

Κοινωνικά Δίκτυα & Καλές Περιβαλλοντικές Πρακτικές

Κοινωνικά Δίκτυα & Καλές Περιβαλλοντικές Πρακτικές Κοινωνικά Δίκτυα & Καλές Περιβαλλοντικές Πρακτικές Αγγελική Καραματσούκη karamaag@gmail.com Πράσινες Ιδέες 22/10/2014 Γνωριμία 2 Αγγελική Καραματσούκη Πτυχίο Νοσηλευτικής, Πτυχίο Πληροφορικής Διδακτορικό

Διαβάστε περισσότερα

ΔΙΑΔΙΚΤΥΑΚΗ ΠΡΟΒΟΛΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ

ΔΙΑΔΙΚΤΥΑΚΗ ΠΡΟΒΟΛΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΙΔΡΥΜΑ ΝΕΟΛΑΙΑΣ ΚΑΙ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΓΕΝΙΚΗ ΔΙΕΥΘΥΝΣΗ ΔΡΑΣΤΗΡΙΟΤΗΤΩΝ ΚΑΙ ΤΕΧΝΙΚΩΝ ΕΡΓΩΝ ΤΜΗΜΑ ΤΕΧΝΙΚΗΣ ΣΤΗΡΙΞΗΣ ΕΥΡΩΠΑΙΚΩΝ ΠΡΟΓΡΑΜΜΑΤΩΝ ΚΕΝΤΡΑ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΑΠ 7/ΑΠ 8 ΔΙΑΔΙΚΤΥΑΚΗ ΠΡΟΒΟΛΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ

Διαβάστε περισσότερα

Γραφείο Επαγγελματικού Προσανατολισμού και Πληροφόρησης Νέων Δήμου Ρεθύμνης

Γραφείο Επαγγελματικού Προσανατολισμού και Πληροφόρησης Νέων Δήμου Ρεθύμνης Γραφείο Επαγγελματικού Προσανατολισμού και Πληροφόρησης Νέων Δήμου Ρεθύμνης ΕΙΣΑΓΩΓΗ Σκοπός του παρόντος είναι να παρουσιάσει τον τρόπο δημιουργία και λειτουργίας Γραφείου Επαγγελματικού Προσανατολισμού

Διαβάστε περισσότερα

Παιδαγωγικές Εφαρμογές Η/Υ (Θεωρία) 21/03/2017. Διδάσκουσα: Αδαμαντία Κ. Σπανακά

Παιδαγωγικές Εφαρμογές Η/Υ (Θεωρία) 21/03/2017. Διδάσκουσα: Αδαμαντία Κ. Σπανακά Παιδαγωγικές Εφαρμογές Η/Υ (Θεωρία) 21/03/2017 Διδάσκουσα: Αδαμαντία Κ. Σπανακά (madspa@otenet.gr) ΠΡΟΣΔΟΚΙΕΣ ΕΡΓΑΣΙΑ ΠΡΟΟΔΟΥ MOOC Μαζικό: παρέχεται η δυνατότητα εγγραφής μεγάλου αριθμού φοιτητών από

Διαβάστε περισσότερα

ΠΕΡΙΛΗΨΗ ΠΡΟΕΡΓΑΣΙΑ ΓΙΑ ΝΑ ΓΡΑΨΟΥΜΕ ΜΙΑ ΚΑΛΗ ΠΕΡΙΛΗΨΗ

ΠΕΡΙΛΗΨΗ ΠΡΟΕΡΓΑΣΙΑ ΓΙΑ ΝΑ ΓΡΑΨΟΥΜΕ ΜΙΑ ΚΑΛΗ ΠΕΡΙΛΗΨΗ ΠΕΡΙΛΗΨΗ Η Περίληψη είναι μικρής έκτασης κείμενο, με το οποίο αποδίδεται συμπυκνωμένο το περιεχόμενο ενός ευρύτερου κειμένου. Έχει σαν στόχο την πληροφόρηση των άλλων, με λιτό και περιεκτικό τρόπο, για

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση Οι συµφράσεις είναι ακολουθίες όρων οι οποίοι συνεµφανίζονται σε κείµενο µε µεγαλύτερη συχνότητα από εκείνη της εµφάνισης

Διαβάστε περισσότερα

Οδηγός LinkedIn. «10 συμβουλές επέκτασης της επιχείρησης σας, χρησιμοποιώντας το LinkedIn» Provided to you by

Οδηγός LinkedIn. «10 συμβουλές επέκτασης της επιχείρησης σας, χρησιμοποιώντας το LinkedIn» Provided to you by Οδηγός LinkedIn «10 συμβουλές επέκτασης της επιχείρησης σας, χρησιμοποιώντας το LinkedIn» Provided to you by 2 Οδηγός Linkedin, πώς να βοηθήσετε την επιχείρηση σας χρησιμοποιώντας το Ο ποιο κάτω οδηγός

Διαβάστε περισσότερα

ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ ΤΟΥ ΤΜΗΜΑΤΟΣ ΣΤΟΧΟΙ ΓΙΑ ΤΗΝ ΠΕΡΙΟΔΟ ΠΑΡΑΡΤΗΜΑ ΧΙ

ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ ΤΟΥ ΤΜΗΜΑΤΟΣ ΣΤΟΧΟΙ ΓΙΑ ΤΗΝ ΠΕΡΙΟΔΟ ΠΑΡΑΡΤΗΜΑ ΧΙ ΕΘΝΙΚΟΝ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟΝ ΠΑΝΕΠΙΣΤΗΜΙΟΝ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ ΤΟΥ ΤΜΗΜΑΤΟΣ ΣΤΟΧΟΙ ΓΙΑ ΤΗΝ ΠΕΡΙΟΔΟ 2008-2013 ΠΑΡΑΡΤΗΜΑ ΧΙ ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ

Διαβάστε περισσότερα

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 4 - ΑΝΆΠΤΥΞΗ

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 4 - ΑΝΆΠΤΥΞΗ ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 4 - ΑΝΆΠΤΥΞΗ ΗΛΕΚΤΡΟΝΙΚΉΣ ΥΠΗΡΕΣΊΑΣ ΑΝΑΖΉΤΗΣΗΣ ΕΘΕΛΟΝΤΏΝ ΚΑΙ ΕΠΑΓΓΕΛΜΑΤΙΏΝ] ΓΙΑ ΤΟN ΧΡΗΣΤΗ [13/01/2014] έκδοση: 1.0 1 Περιεχόμενα 1. Έλεγχος εγγράφου...3 2. Εισαγωγή...4

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΑΡΘΡΟΥ ΜΕ ΘΕΜΑ: ΟΙ ΙΔΕΕΣ ΤΩΝ ΠΑΙΔΙΩΝ ΣΧΕΤΙΚΑ ΜΕ ΤΟ

ΑΝΑΛΥΣΗ ΑΡΘΡΟΥ ΜΕ ΘΕΜΑ: ΟΙ ΙΔΕΕΣ ΤΩΝ ΠΑΙΔΙΩΝ ΣΧΕΤΙΚΑ ΜΕ ΤΟ ΑΝΑΛΥΣΗ ΑΡΘΡΟΥ ΜΕ ΘΕΜΑ: ΟΙ ΙΔΕΕΣ ΤΩΝ ΠΑΙΔΙΩΝ ΣΧΕΤΙΚΑ ΜΕ ΤΟ ΦΩΣ ΚΑΙ ΤΗΝ ΟΡΑΣΗ. Το άρθρο αυτό έχει ως σκοπό την παράθεση των αποτελεσμάτων πάνω σε μια έρευνα με τίτλο, οι ιδέες των παιδιών σχετικά με το

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ Επιβλέπων Καθηγητής: Δρ. Νίκος Μίτλεττον Η ΣΧΕΣΗ ΤΟΥ ΜΗΤΡΙΚΟΥ ΘΗΛΑΣΜΟΥ ΜΕ ΤΗΝ ΕΜΦΑΝΙΣΗ ΣΑΚΧΑΡΩΔΗ ΔΙΑΒΗΤΗ ΤΥΠΟΥ 2 ΣΤΗΝ ΠΑΙΔΙΚΗ ΗΛΙΚΙΑ Ονοματεπώνυμο: Ιωσηφίνα

Διαβάστε περισσότερα