ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining

Σχετικά έγγραφα
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Information Extraction

Opinion Mining and Sentiment analysis

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 10 ο : Αποσαφήνιση εννοιών λέξεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Εξόρυξη Γνώμης: Δημιουργία Ελληνικού Λεξικού Πόρου

Opinion Mining and Sentiment Analysis

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ. Διπλωματική Εργασία. μάθησης»

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Τίμος Κουλουμπής. Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων, Πανεπιστήμιο Αιγαίου

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Ανάλυση, Sentiment Analysis, Hybrid Method, SentiWordNet, Word Graphs, Deep Learning, Lexicon Based Approach

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Τμήμα Πληροφορικής και Τηλεματικής ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

«Μελέτη και αξιολόγηση τεχνικών Κατηγοριοποίησης Συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο»

ΟΙΚΟΛΟΓΙΑ ΤΟΠΙΟΥ. Χειμερινό εξάμηνο

LESSON 26 (ΜΑΘΗΜΑ ΕΙΚΟΣΙ ΕΞΙ) REF : 102/030/ November 2014

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION

Diploma Thesis by Konstantinos T. Karalas

FINAL TEST B TERM-JUNIOR B STARTING STEPS IN GRAMMAR UNITS 8-17

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΠΩΣ ΕΠΗΡΕΑΖΕΙ Η ΜΕΡΑ ΤΗΣ ΕΒΔΟΜΑΔΑΣ ΤΙΣ ΑΠΟΔΟΣΕΙΣ ΤΩΝ ΜΕΤΟΧΩΝ ΠΡΙΝ ΚΑΙ ΜΕΤΑ ΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΧΟΛΗ ΨΗΦΙΑΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΜΑΤΙΚΗΣ

ΑΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΗΜΟΣΙΩΝ ΣΧΕΣΕΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΡΓΟΣΤΟΛΙ ΚΕΦΑΛΗΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ. Γλωσσολογικές πηγές για τεχνικές εξόρυξης γνώμης (opinion mining) προσαρμοσμένες στις ιδιαιτερότητες της Νέας Ελληνικής

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Συντακτικές λειτουργίες

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ - ΔΗΜΟΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ - ΔΕΙΚΤΕΣ ΕΠΙΤΥΧΙΑΣ ΚΑΙ ΕΠΑΡΚΕΙΑΣ -

Εισαγωγή στα Πληροφοριακά Συστήματα. Ενότητα 4:

2. ΣΥΝΟΠΤΙΚΗ ΠΕΡΙΓΡΑΦΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΡΟΓΡΑΜΜΑΤΩΝ ΣΠΟΥΔΩΝ ΕΝΓ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Ανάκτηση Πληροφορίας

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

TOUCH LCD WALL CONTROLLER for Online Controller

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ. Πτυχιακή Διατριβή

LESSON 28 (ΜΑΘΗΜΑ ΕΙΚΟΣΙ ΟΚΤΩ) REF : 201/033/28. 2 December 2014

Τμήμα Μηχανικών Πληροφορικής ΤΕ Δυϊκότητα. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 1/12/2016

Μάθηση σε κίνηση (Mobile learning) Χαρίκλεια Τσαλαπάτα 16/11/2016

«Δοκιμασία Εκφραστικού Λεξιλογίου σε τυπικά αναπτυσσόμενα παιδιά ηλικίας 6 8 ετών»

Listening to the customers voice through social network analytics

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

PaloPro : Social Media Analysis Case Studies

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ

Ανάπτυξη αλγορίθμου κατηγοριοποίησης με αυξητικό τρόπο για ανάλυση συναισθήματος στο twitter

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία

Εξόρυξη γνώσης από Blogs: Εφαρμογές στο πεδίο της εξόρυξης ψυχικής διάθεσης

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΒΑΛΕΝΤΙΝΑ ΠΑΠΑΔΟΠΟΥΛΟΥ Α.Μ.: 09/061. Υπεύθυνος Καθηγητής: Σάββας Μακρίδης

@ BY AVENUES PRIVATE INSTITUTE JUNE 2014

Πληροφοριακά Συστήματα Διοίκησης

Επαναληπτικές Ασκήσεις. Κάτια Κερμανίδου

Ερευνητικό Πρόγραµµα BalkaNet

ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β )

ΥΛΗ ΕΞΕΤΑΣΕΩΝ 2007 ΥΠΟΨΗΦΙΩΝ ΥΠΟΤΡΟΦΩΝ ΚΑΘΙΔΡΥΜΑΤΟΣ ΑΘΑΝΑΣΙΟΥ ΜΑΤΑΛΑ Α ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ

Ανάπτυξη Μεθόδων Αυτόµατης Κατηγοριοποίησης Κειµένων Προσανατολισµένων στο Φύλο

HIV HIV HIV HIV AIDS 3 :.1 /-,**1 +332

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

«Σημασιολογικός προσδιορισμός απόψεων και. υποκειμενική ταξινόμηση μηνυμάτων κοινωνικών δικτύων» Case study Twitter. Φοιτήτρια: Αικατερίνη Τσαγκαλίδου

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία

EXTRA LEARNING COMPONENT. for Junior B pupils

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Ανάκτηση Πληροφορίας

Αναγνώριση Προτύπων - Νευρωνικά ίκτυα

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

Τίτλος Διδακτικού Σεναρίου: «[Το φαινόμενο Doppler]»

ΤΕΧΝΙΚΕΣ ΚΑΤΑΓΡΑΦΗΣ ΣΥΝΑΙΣΘΗΜΑΤΩΝ (EMOTIONS) ΑΠΟ ΤΗ ΧΡΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ. Ελένη Καλκοπούλου. στα πλαίσια του μαθήματος Πολυμέσα (ΓΤΠ61)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

The Impact of Stopping IPO in Shenzhen A Stock Market on Guiding Pattern of Information in China s Stock Markets

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE FACULTY OF INFORMATICS AND TELECOMMUNICATIONS

7 Present PERFECT Simple. 8 Present PERFECT Continuous. 9 Past PERFECT Simple. 10 Past PERFECT Continuous. 11 Future PERFECT Simple

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή Εργασία

ιανοητικό Κεφάλαιο σε Πόλεις και Περιφέρειες

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

ΑΝΑΜΟΡΦΩΜΕΝΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΕΛΛΗΝΙΚΗΣ ΝΟΗΜΑΤΙΚΗΣ ΓΛΩΣΣΑΣ Β ΤΑΞΗ (Σ. Καρύπη, Μ. Χατζοπούλου) Ι.Ε.Π. 2018

Μάθηση Λανθανόντων Μοντέλων με Μερικώς Επισημειωμένα Δεδομένα (Learning Aspect Models with Partially Labeled Data) Αναστασία Κριθαρά.

Βρει;τε το επα;γγελµα και γρα;χτε το κα;τϖ απο; κα;υε εικο;να στα ελληνικα;.

Τηλεπισκόπηση. Κ. Ποϊραζίδης ΨΗΦΙΑΚΗ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ 18/6/2016

«ΙΕΡΕΥΝΗΣΗ ΤΩΝ ΠΑΡΑΓΟΝΤΩΝ ΠΟΥ ΕΠΙ ΡΟΥΝ ΣΤΗΝ ΑΦΟΣΙΩΣΗ ΤΟΥ ΠΕΛΑΤΗ ΣΕ ΕΠΩΝΥΜΑ ΠΡΟΪΟΝΤΑ ΤΡΟΦΙΜΩΝ. Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ ΕΠΩΝΥΜΩΝ ΓΑΛΑΚΤΟΚΟΜΙΚΩΝ ΠΡΟΪΟΝΤΩΝ»

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

ヤ Διδασκαλία της Γλώσσας στις τάξεις Γ & Δ

ΤΕΧΝΙΚΕΣ ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΑΦΟΥΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ. Κλάσεις και Αντικείμενα

Τεχνογλωσσία 8 Β' Εξάμηνο. Λογικός Προγραμματισμός Prolog. Άσκηση: Διορθωτής Εκφράσεων

STARTING STEPS IN GRAMMAR, FINAL TEST C TERM 2012 UNITS 1-18

Su cient conditions for sound hashing using atruncatedpermutation

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Θέματα Υπολογισμού στον Πολιτισμό

LESSON 16 (ΜΑΘΗΜΑ ΔΕΚΑΕΞΙ) REF : 102/018/16-BEG. 4 March 2014

Για την εξέταση των Αρχαίων Ελληνικών ως μαθήματος Προσανατολισμού, ισχύουν τα εξής:

Transcript:

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Opinion Mining

Opinion Mining Συνώνυμο: Sentiment Analysis Ορισμός: Ανάλυση κειμένων που αναφέρονται σε μια οντότητα/αντικείμενο Εντοπισμός συναισθημάτων ή απόψεων για το αντικείμενο που εκφράζονται γραπτώς Εξαγωγή συμπεράσματος για το αν είναι αρνητικά, θετικά ή ουδέτερα. Στη διαδικασία εμπλέκεται μια πλειάδα NLP τεχνικών

Opinion Mining - Example Έστω το κείμενο: (1) I bought a phone a few days ago. (2) It was such a nice phone. (3) The touch screen was really cool. (4) The voice quality was clear too. (5) Although the battery life was not long, that is ok for me. (6) However, my mother was mad with me as I did not tell her before I bought it. (7)She also thought the phone was too expensive, and wanted me to return it to the shop. Τι έχουμε στόχο να εξάγουμε από τον παραπάνω σχολιασμό?

Opinion Mining - Example Θετικά/Αρνητικά/Ουδέτερα συναισθήματα: (1) I bought a phone a few days ago. (2) It was such a nice phone. Άποψη του συγγραφέα για το τηλέφωνο. (3) The touch screen was really cool. Άποψη του συγγραφέα για την οθόνη αφής (4) The voice quality was clear too. Άποψη του συγγραφέα για την ποιότητα ήχου (5) Although the battery life was not long, that is ok for me. Άποψη του συγγραφέα για τη διάρκεια της μπαταρίας (6) However, my mother was mad with me as I did not tell her before I bought it. Άποψη της μητέρας για τον συγγραφέα (7)She also thought the phone was too expensive, and wanted me to return it to the shop. Άποψη της μητέρας για το τηλέφωνο Για κάθε άποψη μας ενδιαφέρει: Σε ποιόν ανήκει Για ποιο πράγμα εκφράζεται Η πολικότητά της (αρνητική/θετική/ουδέτερη)

Βασικές Έννοιες - Αντικείμενο Ένα αντικείμενο o είναι μια οντότητα που μπορεί να αντιπροσωπεύει προϊόν, πρόσωπο, γεγονός, οργανισμό ή θέμα. Συνδέεται με ένα ζεύγος (T,A) όπου Τ είναι μια ιεραρχία(δέντρο) συστατικών ή μερών Δέντρο γιατί τα συστατικά ενός συστατικού ανήκουν επίσης στο αντικείμενο Α είναι ένα σύνολο γνωρισμάτων. Στο παράδειγμα: Αντικείμενο o: το κινητό T = {οθόνη αφής, μπαταρία,...} A= {ποιότητα ήχου, διάρκεια μπαταρίας, κόστος,...}

Βασικές Έννοιες - Features Μπορεί να εκφραστεί άποψη για: Το αντικείμενο It was a nice phone. Ένα συστατικό του The touch screen was cool. Γνωρίσματα του αντικειμένου The voice quality was good. Γνωρίσματα των συστατικών The battery life was not long. Στην πράξη χρησιμοποιούμε τον όρο features για να εκφράσουμε το σύνολο των συστατικών και των γνωρισμάτων. Στα features συμπεριλαμβάνεται και το ίδιο το αντικείμενο. Κάθε feature μπορεί να εκφράζεται με έναν μόνο τρόπο ή με περισσότερους από έναν (με συνώνυμα) Πχ για να αναφερθούμε στην τιμή του κινητού: {price, cost}

Βασικές Έννοιες Opinions Ένα opinion passage για ένα feature f είναι ένα κομμάτι κειμένου που εκφράζει θετική ή αρνητική άποψη για το f. Ο opinion holder είναι αυτός που εκφράζει την άποψη. Μια άποψη (opinion) είναι μια θετική ή αρνητική στάση, συναίσθημα ή εκτίμηση από έναν opinion holder. Η πολικότητα (polarity) μιας άποψης εκφράζει αν είναι θετική, αρνητική ή ουδέτερη.

Εκτίμηση πολικότητας Η πολικότητα κινείται σε δύο άξονες: Εκτίμηση του αν εκφράζεται κάποια άποψη ή όχι SO-Polarity: Υποκειμενικό-Αντικειμενικό/Subjective- Objective Εκτίμηση του τι άποψη εκφράζεται: PN-Polarity: Θετικό-Αρνητικό/Positive-Negative Ένταση της πολικότητας Πόσο θετική ή αρνητική είναι η άποψη που εκφράζεται

Εκτίμηση Πολικότητας - Λέξεις Για την εκτίμηση της πολικότητας μιας φράσης χρειάζεται: Αναγνώριση των λέξεων που έχουν πολικότητα (opinion words). Για παράδειγμα: Επίθετα: {καλός, όμορφος, υπέροχος,...} Επιρρήματα: {καλά, άσχημα,...} Ουσιασικά: {σκουπίδι, ερείπιο, παράδεισος,...} Ρήματα: {μισώ, λατρεύω,...} Φράσεις και ιδιώματα: {μου κόστισε ο κούκος αηδόνι, πουλάει φούμαρα,...} Αρχικές έρευνες απέδειξαν ότι σημαντικοί δείκτες είναι τα επίθετα και επιρρήματα. Τους δίνεται μεγάλη βαρύτητα στις περισσότερες προσεγγίσεις.

Εκτίμηση Πολικότητας - Σύνταξη Επίσης πρέπει να ληφθούν υπόψη: Σύνταξη Εξαρτήσεις λέξεων όταν η άποψη εκφράζεται από συνδυασμό Αναγνώριση της οντότητας στην οποία αναφέρεται μια λέξη που φέρει πολικότητα Άρνηση Αναγνώριση της αντιστροφής στην πολικότητα

Εκτίμηση πολικότητας - Εργαλεία Εργαλεία που εμπλέκονται στο opinion mining: Λεξικό με επισημειωμένες πολικότητες ανά λέξη Μορφοσυντακτικός αναλυτής (POS tagger) Συντακτικός Αναλυτής Εργαλείο για επίλυση αναφορών (anaphora resolution)

SentiWordNet Διαθέσιμο στο: http://sentiwordnet.isti.cnr.it/ Λεξικολογική πηγή που εμπλουτίζει το WordNet Σε κάθε synset (έννοια, σύνολο συνωνύμων) αναθέτει τρία σκορ: Θετικής πολικότητας Αρνητικής πολικότητας Ουδετερότητας Είναι διαθέσιμο σε txt μορφή. Κώδικας σε python: http://compprag.christopherpotts.net /wordnet.html

SentiWordNet Αναγνώριση λέξεων με πολικότητα: Επίλυση πολυσημίας (disambiguation) Αναγνώριση προσήμου και έντασης: Δίνεται από τα σκορ των synsets

Sentiment Classification Όρισμός του προβλήματος: Έστω ένα σύνολο κειμένων Κάθε κείμενο περιέχει σχόλια πάνω σε ένα αντικείμενο o Στόχος είναι η αναγνώριση της θετικής ή αρνητικής άποψης που εκφράζεται στο κείμενο.

Supervised Learning Μοντελοποίηση του προβλήματος: Έστω ένα σύνολο κειμένων Κάθε κείμενο περιέχει σχόλια πάνω σε ένα αντικείμενο o Στόχος είναι η ανάθεση κάθε κειμένου σε Δύο κλάσεις: θετική ή αρνητική ή: Πέντε κλάσεις: των 1-5 αστεριών Δεδομένα εκπαίδευσης (training set): Βρίσκονται εύκολα από reviews χρηστών Στην επισημείωση λαμβάνονται υπόψη τα αστεράκια 1-2: negative 4-5: positive

Supervised Learning Επιλογή χαρακτηριστικών του classification: Χρήση term frequencies και tf-idf weighting: Αποδεικνύονται χρήσιμα όπως στην παραδοσιακή θεματική κατηγοριοποίηση Part-of-Speech tags: Επιλογή των επιθέτων και επιρρημάτων Opinion words and phrases: Επιλογή συγκεκριμένων λέξεων και φράσεων Syntactic dependency: Συνυπολογισμός των συντακτικών εξαρτήσεων Negation: Αναγνώριση των αρνήσεων

Unsupervised Learning Αλγόριθμος μη-εποπτευόμενης μάθησης: Βήμα 1 Εξαγωγή των φράσεων που περιέχουν επίθετα ή επιρρήματα με βάση τα πρότυπα: Pattern Επίθετο + Ουσιαστικό Επίρρημα +Επίθετο Επίθετο + Επίθετο Ουσιαστικό + Επίθετο Επίρρημα + Ρηματικός τύπος Παράδειγμα It was such a nice phone. It was extremely expensive. It was a light small silver device. I considered the screen small. The phone was beautifully designed.

Unsupervised Learning Βήμα 2 Για κάθε φράση που εντοπίστηκε: Υπολογισμός του pointwise mutual information (PMI) P( word 1 word2) PMI ( word 1, word2) = log 2 P( word1) P( word2) Εκφράζει τη στατιστική εξάρτηση μεταξύ λέξεων Από corpus υπολογίζουμε: P(word) που είναι η πιθανότητα εμφάνισης μιας λέξης P( word 1 word2) είναι η πιθανότητα συνεμφάνισης δύο λέξεων Υπολογισμός της πολικότητας μιας φράσης σε σχέση με τις λέξεις excellent ως θετική αναφορά και poor ως αρνητική αναφορά. SO(phrase) = PMI(phrase, excellent ) PMI(phrase, poor )

Unsupervised Learning Βήμα 3 Με δεδομένο ένα κείμενο σχολιασμού (review) ο αλγόριθμος υπολογίζει τη μέση πολικότητα των φράσεων και Ταξινομεί το κείμενο ως θετικό ή αρνητικό