Opinion Mining. Χριστίνα Αραβαντινού aravantino@ceid.upatras.gr. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 1 / 26



Σχετικά έγγραφα
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining

Αποδεικτικές Διαδικασίες και Μαθηματική Επαγωγή.

Αναγνώριση Προτύπων. Σήμερα! Λόγος Πιθανοφάνειας Πιθανότητα Λάθους Κόστος Ρίσκο Bayes Ελάχιστη πιθανότητα λάθους για πολλές κλάσεις

{ i f i == 0 and p > 0

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Ας υποθέσουμε ότι ο παίκτης Ι διαλέγει πρώτος την τυχαιοποιημένη στρατηγική (x 1, x 2 ), x 1, x2 0,

ΤΑΞΙΝΟΜΗΣΗ ΟΡΓΑΝΙΣΜΩΝ

Εξαναγκασμένες ταλαντώσεις, Ιδιοτιμές με πολλαπλότητα, Εκθετικά πινάκων. 9 Απριλίου 2013, Βόλος

Αναγνώριση Προτύπων. Σημερινό Μάθημα

ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

Μονάδες α. Να γράψετε στο τετράδιό σας τον παρακάτω πίνακα σωστά συµπληρωµένο.

τους στην Κρυπτογραφία και τα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΡΩΤΗΣΕΙΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Εισαγωγικά. 1.1 Η σ-αλγεβρα ως πληροφορία

ΣΤΟ ΦΑΡΜΑΚΕΙΟ. Με την πιστοποίηση του έχει πρόσβαση στο περιβάλλον του φαρμακείου που παρέχει η εφαρμογή.

Κεφάλαιο 2.4: Τα βασικά στοιχεία ενός Επιχειρηματικού Σχεδίου (Business Plan) Μέσα από αυτό το κεφάλαιο φαίνεται ότι αφενός η σωστή δημιουργία και

HY 280. θεμελιακές έννοιες της επιστήμης του υπολογισμού ΑΣΚΗΣΕΙΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ. Γεώργιος Φρ.

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Συμπεριφοριακή Επιχειρηματικότητα

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

ΘΕΜΑ: Aποτελεσματικότητα της νομισματικής και δημοσιονομικής πολιτικής σε μια ανοικτή οικονομία

Pointers. Σημερινό Μάθημα! Χρήση pointer Τελεστής * Τελεστής & Γενικοί δείκτες Ανάκληση Δέσμευση μνήμης new / delete Pointer σε αντικείμενο 2

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

Δ Ι Α Κ Ρ Ι Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α. 1η σειρά ασκήσεων

Προτεινόμενα θέματα. στο μάθημα. Αρχές οργάνωσης και διοίκησης επιχειρήσεων. ΟΜΑΔΑ Α: Ερωτήσεις Σωστού Λάθους.

Ευρωπαϊκά παράγωγα Ευρωπαϊκά δικαιώματα

ΜΑΘΗΜΑ: ΠΟΛΙΤΙΚΗ ΟΙΚΟΝΟΜΙΑ-ΔΗΜΟΣΙΑ ΟΙΚΟΝΟΜΙΚΗ

1. Ας υποθέσουμε ότι η εισοδηματική ελαστικότητα ζήτησης για όσπρια είναι ίση με το μηδέν. Αυτό σημαίνει ότι:

ΘΕΜΑ: Διαφορές εσωτερικού εξωτερικού δανεισμού. Η διαχρονική κατανομή του βάρους από το δημόσιο δανεισμό.

Ανάλυση Συναισθήματος σε Κοινωνικά ίκτυα σχετικά με τα Οικονομικά Μέτρα στην Ελλάδα

Το υπόδειγμα IS-LM: Εισαγωγικά

Αναγνώριση Προτύπων 1

Εξόρυξη Γνώμης: Δημιουργία Ελληνικού Λεξικού Πόρου

21/11/2005 Διακριτά Μαθηματικά. Γραφήματα ΒΑΣΙΚΗ ΟΡΟΛΟΓΙΑ : ΜΟΝΟΠΑΤΙΑ ΚΑΙ ΚΥΚΛΟΙ Δ Ι. Γεώργιος Βούρος Πανεπιστήμιο Αιγαίου

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΤΗΣ Γ' ΛΥΚΕΙΟΥ ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ ΘΕΩΡΗΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ. Διδαγμένο κείμενο Αριστοτέλους Πολιτικά Θ 2.1 4

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ Γ ΛΥΚΕΙΟΥ

Ταξινόμηση των μοντέλων διασποράς ατμοσφαιρικών ρύπων βασισμένη σε μαθηματικά κριτήρια.

Οι γέφυρες του ποταμού... Pregel (Konigsberg)

ΣΧΟΛΙΚΟ ΕΤΟΣ ΕΥΘΥΓΡΑΜΜΗ ΟΜΑΛΗ ΚΙΝΗΣΗ ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΕΞΕΤΑΣΗ ΣΤΗ ΦΥΣΙΚΗ A ΛΥΚΕΙΟΥ. Ονοματεπώνυμο Τμήμα

ΜΑΘΗΜΑ: ΓΕΝΙΚΟ ΔΙΟΙΚΗΤΙΚΟ ΔΙΚΑΙΟ ΔΙΚΑΣΤΩΝ

Ο Ισχυρός Νόμος των Μεγάλων Αριθμών

Δήμος Σωτήριος Υ.Δ. Εργαστήριο Λογικής & Επιστήμης Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών Σ.Η.Μ.Μ.Υ. Ε.Μ.Π.

2. Κατάθεσε κάποιος στην Εθνική Τράπεζα 4800 με επιτόκιο 3%. Μετά από πόσο χρόνο θα πάρει τόκο 60 ; α) 90 ημέρες β) 1,5 έτη γ) 5 μήνες δ) 24 μήνες

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Κληρονομικότητα. Σήμερα! Κλάση Βάσης Παράγωγη κλάση Απλή κληρονομικότητα Protected δεδομένα Constructors & Destructors overloading

«Εξατομικεύοντας την επιλογή των πόρων των ψηφιακών βιβλιοθηκών για την υποστήριξη της σκόπιμης μάθησης» Άννα Μαρία Ολένογλου

Κεφάλαιο 2.3: Marketing Κοινωνικών Επιχειρήσεων. Στο παρόν κεφάλαιο παρουσιάζονται εν τάχει τα βασικά

Κεφάλαιο 2.5: Εντοπισμός Επιχειρηματικών Ευκαιριών. Δεδομένου ότι στο νέο παγκόσμιο οικονομικό περιβάλλον, η

- 1 - Ποιοι κερδίζουν από το εμπόριο αγαθών και υπηρεσιών; Γιατί η άμεση ανταλλαγή αγαθών, ορισμένες φορές, είναι δύσκολο να

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Μούλου Ευγενία

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Επίλυση ειδικών μορφών ΣΔΕ

17 Μαρτίου 2013, Βόλος

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

Συναρτήσεις. Σημερινό μάθημα

Η διαδικασία της ανάγνωσης

1. Ο εγγυημένος ρυθμός οικονομικής ανάπτυξης στο υπόδειγμα Harrod Domar εξαρτάται

ΤΑ ΜΑΘΗΜΑΤΙΚΑ ΑΠΟ ΤΗ ΣΚΟΠΙΑ ΤΩΝ ΜΑΘΗΤΩΝ ΤΟΥ ΛΥΚΕΙΟΥ Απόστολος Ι. Χατζηγεωργίου 1. ΕΙΣΑΓΩΓΗ Είναι ευρύτατα αποδεκτό, τόσο στον κόσμο αυτών που

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Martingales. 3.1 Ορισμός και παραδείγματα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Πρώτη Γραπτή Εργασία. Εισαγωγή στους υπολογιστές Μαθηματικά

ΣΤΟ ΙΑΤΡΕΙΟ. Με την πιστοποίηση του αποκτά πρόσβαση στο περιβάλλον του ιατρού που παρέχει η εφαρμογή.

ΠΡΟΤΕΙΝΟΜΕΝΟ ΘΕΜΑ. Μορφές δημόσιου δανεισμού. Σύνταξη: Παπαδόπουλος Θεοχάρης, Οικονομολόγος, MSc, PhD Candidate

ΦΥΛΛΑ ΕΡΓΑΣΙΑΣ. Διδακτική ενότητα

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

ΔΙΚΑΙΩΜΑΤΑ ΠΡΟΣΟΡΜΙΣΗΣ, ΠΑΡΑΒΟΛΗΣ, ΠΡΥΜΝΟΔΕΤΗΣΗΣ ΚΑΙ ΕΛΛΙΜΕΝΙΣΜΟΥ ΣΚΑΦΩΝ ΣΕ ΘΑΛΑΣΣΙΕΣ ΠΕΡΙΟΧΕΣ. (ΛΙΜΑΝΙΑ κ.λπ.) ΤΟΠΙΚΗΣ ΑΡΜΟΔΙΟΤΗΤΑΣ ΛΙΜΕΝΙΚΩΝ

ΜΑΘΗΜΑ: ΕΜΠΟΡΙΚΟ ΔΙΚΑΙΟ

5.1 Μετρήσιμες συναρτήσεις

Επίλυση δικτύων διανομής

Εστω X σύνολο και A μια σ-άλγεβρα στο X. Ονομάζουμε το ζεύγος (X, A) μετρήσιμο χώρο.

Προτεινόμενα θέματα. στο μάθημα. Αρχές οργάνωσης και διοίκησης επιχειρήσεων. ΟΜΑΔΑ Α: Ερωτήσεις Σωστού Λάθους.

Σχέσεις και ιδιότητές τους

Γενικό Λύκειο Μαραθοκάμπου Σάμου. Άλγεβρα Β λυκείου. 13 Οκτώβρη 2016

τεσσάρων βάσεων δεδομένων που θα αντιστοιχούν στους συνδρομητές

έγγραφο σε κάθε διάσταση αντιστοιχούν στο πλήθος εμφανίσεων της λέξης (που αντιστοιχεί στη συγκεκριμένη διάσταση) εντός του εγγράφου.

ΘΕΩΡΙΑ ΣΥΝTAΚΤΙΚΟΥ - ETΥΜΟΛΟΓΙΚΟ ΛΕΞΙΚΟ. 1 α. Η Πρόταση σχετικά με το Περιεχόμενό και το ποιόν της

Ημέρα 3 η. (α) Aπό την εργασιακή διαδικασία στη διαδικασία παραγωγής (β) Αξία του προϊόντος και αξία της εργασιακής δύναμης

Πολιτικά

2 Η ΠΑΓΚΥΠΡΙΑ ΟΛΥΜΠΙΑ Α ΦΥΣΙΚΗΣ Γ ΓΥΜΝΑΣΙΟΥ

ΤΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΣΥΣΤΗΜΑ

Ο Β ΤΟΜΕΑΣ ΤΟΥ ΤΜΗΜΑΤΟΣ: Υπολογιστικά Συστήματα και Εφαρμογές Πληροφορικής Pragmatic Computer Science

ΣΟΦΟΚΛΕΟΥΣ ΑΝΤΙΓΟΝΗ Κείµενο από το πρωτότυπο ( )

Ημέρα 4 η (α) Αγορά και πώληση της εργασιακής δύναμης. (β) Η απόλυτη υπεραξία. Αγορά και πώληση της εργασιακής δύναμης

Συναρτήσεις & Κλάσεις

Κείµενο διδαγµένο Κείµενο από το πρωτότυπο

Η Πληροφορική στο Δημοτικό Διδακτικές Προσεγγίσεις Αδάμ Κ. Αγγελής Παιδαγωγικό Ινστιτούτο

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

ΣΥΝΟΛΑ (προσέξτε τα κοινά χαρακτηριστικά των παρακάτω προτάσεων) Οι άνθρωποι που σπουδάζουν ΤΠ&ΕΣ και βρίσκονται στην αίθουσα

Προτεινόμενα θέματα στο μάθημα. Αρχές Οικονομικής Θεωρίας ΟΜΑΔΑ Α. Στις προτάσεις από Α.1. μέχρι και Α10 να γράψετε στο τετράδιό σας τον αριθμό της

Συγκέντρωση Κίνησης Εισαγωγή Στατική Συγκέντρωση Κίνησης

Παραδείγµατα ερωτήσεων ανοικτού τύπου και σύντοµης απάντησης. Εισαγωγή: Ο Σωκράτης διηγείται τη συζήτησή του µε τον Πρωταγόρα σε έναν φίλο του.

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

Δίκαιο και Οικονομικά: Οι Εξετάσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Σύνταξη: Αυλίδου Εύα, Ms Politikwissenschaft of Ludwig Maximilian Universitaet

Πανεπιστήμιο Πειραιώς. Πρόγραμμα Μεταπτυχιακών Σπουδών Αναλογιστική Επιστήμη και Διοικητική Κινδύνου

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΘΕΜΑΤΑ ΨΥΧΟΠΑΙΔΑΓΩΓΙΚΩΝ ΓΕΝ. ΔΙΔΑΚΤΙΚΗΣ

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑ Α ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚ3Ν ΕΠΙΣΤΗΜ3Ν Γ ΛΥΚΕΙΟΥ

3. Με βάση τη βραχυχρόνια καμπύλη Phillips η σχέση πληθωρισμού και ανεργίας είναι:

Transcript:

Opinion Mining Χριστίνα Αραβαντινού aravantino@ceid.upatras.gr Μάιος 2014 Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 1 / 26

Περιεχόμενα Εισαγωγή Εφαρμογές ομή μιας άποψης Είδη απόψεων Προσεγγίσεις Επίλυση της Αναφοράς Spam Detection Opinion Mining και Κοινωνικές Επιστήμες SentiWordNet SentiStrength Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 2 / 26

Εισαγωγή (1/2) ύο είδη κειμενικής πληροφορίας: Γεγονότα και Απόψεις. Η Εξόρυξη Γνώμης (Opinion Mining) είναι η μελέτη των απόψεων και των συναισθημάτων που εκφράζονται σ ένα κείμενο. Το Web παράγει μεγάλες ποσότητες κειμένων που περιέχουν άποψη ανάγκη για αποτελεσματικές τεχνικές Opinion Mining. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 3 / 26

Εισαγωγή (2/2) Οι απόψεις είναι σημαντικές γιατί όταν πρέπει να πάρουμε μια απόφαση για κάτι, θέλουμε να ακούσουμε και τις γνώμες των άλλων. User-generated content: κριτικές χρηστών, forums, blogs, Twitter, ομάδες συζητήσεων στο Web. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 4 / 26

Εφαρμογές Business Intelligence Προγραμματισμός αγορών ιαχείριση της γνώμης του κόσμου Web Advertising Πολιτική Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 5 / 26

ομή μιας άποψης (1/2) Ενα παράδειγμα: I bought an iphone a few days ago. It was such a nice phone. The touch screen was really cool. The voice quality was clear too. Although the battery life was not long, that is ok for me. However, my mother was mad with me as I did not tell her before I bought the phone. She also thought the phone was too expensive, and wanted me to return it to the shop. (Bing Liu, Opinion Mining and Sentiment Analysis: NLP Meets Social Sciences) Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 6 / 26

ομή μιας άποψης (2/2) Μια άποψη (opinion) εκφράζεται από κάποιον (opinion holder) για κάτι (target object). Η άποψη μπορεί να έχει θετική, αρνητική ή ουδέτερη πολικότητα (polarity). Mary thinks that her new phone is fantastic. Opinion: (her new phone) is fantastic Opinion holder: Mary Target object: phone Polarity: positive Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 7 / 26

Είδη απόψεων Άμεσες απόψεις: εκφράσεις άποψης/συναισθήματος για κάποια οντότητα (προϊόντα, γεγονότα, θέματα, ανθρώπους κλπ). That book was really amazing. Συγκριτικές απόψεις: Συγκρίσεις που περιγράφουν ομοιότητες ή διαφορές για περισσότερες από μία οντότητες. Galaxy S4 is better than Galaxy S3. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 8 / 26

Κατηγοριοποίηση συναισθήματος: επίπεδο κειμένου (1/3) Κατηγοριοποίηση ενός κειμένου με βάση το συνολικό συναίσθημα που εκφράζεται απ τον opinion holder. Υποθέτει ότι κάθε κείμενο αναφέρεται σ ένα συγκεκριμένο αντικείμενο/θέμα και περιέχει απόψεις μόνο από έναν opinion holder. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 9 / 26

Κατηγοριοποίηση συναισθήματος: επίπεδο κειμένου (2/3) Μη επιβλεπόμενη κατηγοριοποίηση (Turney, 2002): Κριτικές απ το epinions.com για ταινίες, τράπεζες, ταξιδιωτικούς προορισμούς κλπ. Part-of-speech tagging. Εξαγωγή δύο διαδοχικών λέξεων απ τις κριτικές, αν τα μέρη του λόγου τους αντιστοιχούν σε κάποια δοθέντα patterns: επίθετο+ουσιαστικό, επίρρημα+επίθετο κλπ. Εκτίμηση του συναισθηματικού προσανατολισμού (SO) των εξαχθέντων φράσεων και υπολογισμός του μέσου SO όλων των φράσεων. Το κείμενο κατηγοριοποιείται ως θετικό αν ο μέσος SO είναι θετικός, αλλιώς ως αρνητικό. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 10 / 26

Κατηγοριοποίηση συναισθήματος: επίπεδο κειμένου (3/3) Επιβλεπόμενη κατηγοριοποίηση (Pang et al., 2002) Εφαρμογή τεχνικών επιβλεπόμενης μάθησης για την κατηγοριοποίηση κριτικών ως θετικών ή αρνητικών. Naive Bayes, Maximum Entropy, Support Vector Machines. Features: λέξεις, διγράμματα, μέρη του λόγου, θέση κάθε λέξης κ.α. Σύνολο εκπαίδευσης κι ελέγχου: κριτικές για ταινίες (4-5 αστέρια θετικές, 1-2 αστέρια αρνητικές). Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 11 / 26

Κατηγοριοποίηση συναισθήματος: Επίπεδο πρότασης (1/2) Η κατηγοριοποίηση συναισθήματος σ επίπεδο κειμένου είναι πολύ γενική για τις περισσότερες εφαρμογές. Η ανάλυση στο επίπεδο της πρότασης στοχεύει στην κατηγοριοποίηση μιας πρότασης ως θετικής ή αρνητικής. ύο βήματα: Εντοπισμός υποκειμενικών προτάσεων. Κατάταξή τους σε μία απ τις δύο κλάσεις (θετική η αρνητική). Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 12 / 26

Κατηγοριοποίηση συναισθήματος: Επίπεδο πρότασης (2/2) Αναγνώριση υποκειμενικών προτάσεων με υπολογισμό ομοιότητας προτάσεων και Μπεϋζιανή κατηγοριοποίηση. Κατηγοριοποίηση συναισθήματος (θετικό, αρνητικό, ουδέτερο). (Yu and Hatzivassiloglou, 2003) Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 13 / 26

Επίπεδο οντοτήτων και χαρακτηριστικών (1/4) Η κατηγοριοποίηση στο επίπεδο κειμένου και πρότασης δεν εντοπίζει σε τι αναφέρεται η άποψη, δηλαδή τις οντότητες και τα χαρακτηριστικά τους. Το επόμενο βήμα είναι η αναγνώριση των οντοτήτων που συνδέονται με κάθε άποψη. Το μεγαλύτερο μέρος της έρευνας βασίζεται σε online reviews ο εντοπισμός της οντότητας (πχ όνομα προϊόντος) είναι ευκολότερος. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 14 / 26

Επίπεδο οντοτήτων και χαρακτηριστικών (2/4) Αφαίρεση συχνών ονοματικών φράσεων που μάλλον δεν είναι χαρακτηριστικά ενός προϊόντος. Αναγνώριση σχέσεων part-of: Σε κάθε ονοματική φράση ανατίθεται ένα σκορ Pointwise Mutual Information που συνδέει αυτή τη φράση με εκφράσεις που αναφέρονται σε μέρος κάποιου προϊόντος. PMI(a, b) = hits(a b) hits(a)hits(b) (Popescu and Etzioni, 2005) Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 15 / 26

Επίπεδο οντοτήτων και χαρακτηριστικών (3/4) Προσέγγιση Double Propagation: (Qiu et al.,2009) Εξετάζει τις σχέσεις εξάρτησης ανάμεσα στις απόψεις και στα χαρακτηριστικά για να εξάγει χαρακτηριστικά. Οι λέξεις που φέρουν άποψη τροποποιούν κάποια χαρακτηριστικά του προϊόντος, πχ This camera takes great pictures. Ο αλγόριθμος ξεκινά χρησιμοποιώντας ένα σύνολο με λέξεις που εκφράζουν άποψη (set of seed opinion words). Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 16 / 26

Επίπεδο οντοτήτων και χαρακτηριστικών (4/4) Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 17 / 26

Επίλυση της Αναφοράς I bought a Canon S500 camera yesterday. It looked beautiful. I took a few photos last night. They were amazing. Σημαντική για το διαχωρισμό αντικειμένων και χαρακτηριστικών. Πρώτα sentiment analysis, στη συνέχεια εντοπισμός των συσχετίσεων επιθέτων και ουσιαστικών και τέλος επιβλεπόμενη μάθηση. (Ding and Liu, 2010) Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 18 / 26

Spam Detection (1/3) Οι απόψεις που εκφράζονται στα social media είναι χρήσιμες σε διαφορετικούς φορείς. Οι θετικές απόψεις συχνά σημαίνουν κέρδη και καλή φήμη για συγκεκριμένες επιχειρήσεις. Αυτό οδηγεί συχνά στην ανάρτηση ψεύτικων απόψεων και κριτικών. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 19 / 26

Spam Detection (2/3) Οι ψεύτικες/αναληθείς κριτικές μπορεί να είναι: θετικές, με στόχο την προώθηση συγκεκριμένων προϊόντων. αρνητικές, με στόχο τη διαστρέβλωση της φήμης συγκεκριμένων προϊόντων. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 20 / 26

Spam Detection (3/3) Οι πολύ αρνητικές κριτικές τείνουν να είναι spam. Οι κριτικές που είναι οι μοναδικές κριτικές σε μερικά προϊόντα είναι πιθανό να είναι spam. Οι κορυφαίοι reviewers μάλλον είναι spammers. Οι κριτικές που είναι spam συνήθως παίρνουν πολύ θετικό feedback, ενώ αυτές που δεν είναι συνήθως παίρνουν αρνητικό feedback. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 21 / 26

Opinion Mining και Κοινωνικές Επιστήμες Εντοπισμός κι ανάλυση πολιτικών απόψεων. Σύγκριση των απόψεων που έχουν άνθρωποι από διαφορετικές χώρες για το ίδιο ζήτημα. Οι κοινωνικές, πολιτισμικές και οικονομικές επιδράσεις του spam. Ανάλυση συναισθήματος στον ψηφιακό κόσμο. Πώς οι απόψεις που εκφράζονται στο Web επηρεάζουν τον πραγματικό κόσμο. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 22 / 26

SentiWordNet http://sentiwordnet.isti.cnr.it/index.php Λεξιλογική πηγή για Opinion Mining. Αναθέτει σε κάθε σύνολο συνωνύμων του WordNet ένα σκορ θετικής (P), αρνητικής (N) και ουδέτερης (O) πολικότητας. good: P: 0.75 O: 0.25 N: 0 Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 23 / 26

SentiStrength (1/2) http://sentistrength.wlv.ac.uk/ Σύστημα σχεδιασμένο για κείμενα του Κοινωνικού Ιστού. Χρησιμοποιεί λεξιλογική προσέγγιση. Προβλέπει την ένταση θετικού και αρνητικού συναισθήματος σε κείμενα. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 24 / 26

SentiStrength (2/2) Αναθέτει σε ένα λεξικό 2608 λέξεων και θεμάτων λέξεων ένα ζεύγος θετικής και αρνητικής πολικότητας. Σε μη επιβλεπόμενη μορφή χρησιμοποιεί προκαθορισμένα σκορ για κάθε λέξη. Σε επιβλεπόμενη μορφή χρησιμοποιεί ένα σύνολο δεδομένων εκπαίδευσης για να προσαρμόσει τα σκορ των λέξεων πιο σωστά. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 25 / 26

Αναφορές Bing Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers. May 2012. Furu Wei. Sentiment Analysis and Opinion Mining. Χριστίνα Αραβαντινού Opinion Mining Μάιος 2014 26 / 26