Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Σχετικά έγγραφα
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Opinion Mining and Sentiment analysis

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Τεχνικές Εξόρυξης Δεδομένων

ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ. Διπλωματική Εργασία. μάθησης»

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Έρευνα Τουριστικού Προϊόντος Κρήτης, Αξιολόγηση ποιότητας τουριστικών υπηρεσιών

Η Σημασία και η Μεθοδολογία Διαχείρισης των Κριτικών στο TripAdvisor. Χρήστος Ντίτορας Πανεπιστήμιο Πειραιώς

Μηχανική Μάθηση Εργασία 2

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία

Η γλώσσα των μέσων κοινωνικής δικτύωσης: Υφομετρική ανάλυση με προεκτάσεις στην γλωσσική διδασκαλία

Opinion Mining and Sentiment Analysis

ΔΙΕΡΕΥΝΟΝΤΑΣ ΤΑ ΟΡΙΑ ΨΗΦΙΑΚΟΥ ΚΑΙ ΠΡΑΓΜΑΤΙΚΟΥ ΤΑ ΚΟΙΝΩΝΙΚΑ ΜΕΣΑ ΔΙΚΤΥΩΣΗΣ ΩΣ ΠΗΓΗ ΓΕΩ-ΧΑΡΤΟΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΠΟΛΕΟΔΟΜΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος

στη Συμπεριφορά του Οδηγού Αξιοποιώντας Λεπτομερή Δεδομένα

Οικονομικό Πανεπιστήμιο Αθηνών. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης. Άρης Κοσμόπουλος

Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα

ΠΡΑΚΤΙΚΕΣ ΜΕΤΡΗΣΗΣ ΠΙΣΤΩΤΙΚΟΥ ΚΙΝΔΥΝΟΥ ΣΤΟ ΠΛΑΙΣΙΟ ΕΦΑΡΜΟΓΗΣ ΤΗΣ ΠΡΟΣΕΓΓΙΣΗΣ ΤΩΝ ΕΣΩΤΕΡΙΚΩΝ ΔΙΑΒΑΘΜΙΣΕΩΝ

Εξόρυξη Γνώσης από Βιολογικά εδομένα

ΠΤΥΧΙΑΚΕΣ. Μελέτη καταναλωτικών προτιμήσεων αλλαντικών. Μελέτη καταναλωτικών προτιμήσεων νωπού γάλακτος.

ΚΑΤΗΓΟΡΙΕΣ ΤΑΞΙΝΟΜΗΣΗΣ

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

+ + Travel social Network Τουριστικό Μέσο Kοινωνικής Δικτύωσης. Travel Guide Ενημερωμένος Τουριστικός Οδηγός

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Ανάλυση Συναισθήματος από Κείμενο με Τεχνικές Μηχανικής Μάθησης και Χρήση Λεξικού ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

AΕΙ ΠΕΙΡΑΙΑ T.T. ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ

Αριθμ. Πρωτοκόλλου: EΛE_2019_5653 Μυτιλήνη, 24/04/2019

Διακριτικές Συναρτήσεις

ΤΟΥΡΙΣΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ ΣΤΟ ΗΡΑΚΛΕΙΟ ΚΡΗΤΗΣ ΚΑΙ ΔΥΝΑΤΟΤΗΤΕΣ ΒΕΛΤΙΩΣΗΣ

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

σας φύλλο τον αριθμό της ερώτησης ακολουθούμενη από το γράμμα Σ (Σωστή) ή το γράμμα Λ (Λάθος).

Περιεχόμενα. Σκοπός της έρευνας Εισαγωγή Βιβλιογραφική Επισκόπηση Μεθοδολογία Έρευνας Ανάλυση και ερμηνεία αποτελεσμάτων Συμπεράσματα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

Ανάπτυξη μεθοδολογίας μέτρησης της αποτελεσματικότητας των τουριστικών επιχειρήσεων

Διδάσκουσα: Χάλκου Χαρά,

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...

Ευφυείς Τεχνικές για Εφαρμογές Αποθετηρίων

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ. Επικαιροποίηση γνώσεων αποφοίτων ΑΕΙ στην οργάνωση, διοίκηση τουριστικών επιχειρήσεων και στην προώθηση τουριστικών προορισμών

Case Study. Η διαδικασία μέτρησης ικανοποίησης πελατών στο πρότυπο ISO 9001: Εφαρμογή σε εταιρεία Πληροφορικής II

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ

Πληροφοριακά Συστήματα & Περιβάλλον

«Μελέτη και αξιολόγηση τεχνικών Κατηγοριοποίησης Συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο»

Σχεδιασμός και κατασκευή εφαρμογής ταξινόμησης αντικειμένων σε γραμμή μεταφοράς προϊόντων με χρήση όρασης μηχανής

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση. Κορφιάτης Γιώργος ιπλωµατική Εργασία

Αριστομένης Μακρής. Συστήματα Επιχειρηματικής Ευφυΐας (BI/BA)

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

5 η Διδακτική Ενότητα Οι βασικές αρχές και η σημασία της Διοίκησης του Ανθρώπινου Δυναμικού στην περίπτωση των τουριστικών επιχειρήσεων

ΜΕ ΣΥΝΑΨΗ ΣΥΜΒΑΣΕΩΝ ΕΡΓΑΣΙΑΣ ΟΡΙΣΜΕΝΟΥ ΧΡΟΝΟΥ Ή ΜΙΣΘΩΣΗΣ ΕΡΓΟΥ ΣΤΟ ΠΛΑΙΣΙΟ ΥΛΟΠΟΙΗΣΗΣ ΤΟΥ ΕΡΓΟΥ

ΤΕΤΡΑ ΙΑ ΑΝΑΛΥΣΗΣ Ε ΟΜΕΝΩΝ, ΤΕΥΧΟΣ 15 (σσ ) DATA ANALYSIS BULLETIN, ISSUE 15 (pp ) Ιεραρχική Ανάλυση

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

«Ποιότητα και Κερδοφορία των Ξενοδοχειακών Επιχειρήσεων στην Ελλάδα»

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Αναγωγή _ Εξαγωγή & Έλεγχος. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

ΠΑΡΑΔΟΤΕΟ. ΥΛΟΠΟΙΗΣΗ Δράσης 3 (Δ3): Παραγωγή περιεχομένου για την ψηφιακή υπηρεσία στήριξης των τοπικών μικρομεσαίων Επιχειρήσεων

Αριθμ. Πρωτοκόλλου: EΛE_2018_8740 Μυτιλήνη, 13 Νοεμβρίου 2018

Ιστορικό του χρήστη (δηµιουργία διαδροµής) Κοινωνικά δίκτυα: Personal guide based on Fingerprint Positioning: a social network approach

Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων

Διαφάνεια. Γραφήματα. Έξοδα. Ανθρώπινοι Πόροι. Αριθμοδείκτες. Αναζήτηση ανά Εταιρεία. Επενδύσεις. Έσοδα. Επενδύσεις ανά κάτοικο

Ο ΡΟΛΟΣ ΤΩΝ SOCIAL MEDIA ΣΤΗ ΣΥΜΠΕΡΙΦΟΡΑ ΤΟΥ ΚΑΤΑΝΑΛΩΤΗ ΣΤΟ ΤΟΥΡΙΣΤΙΚΟ ΚΛΑΔΟ

Βραχυπρόθεσμη πρόβλεψη ενεργειακής ζήτησης Προσεγγίσεις βασισμένες στη Μηχανική Μάθηση

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Εφαρμογές Μηχανικής Μάθησης στο Μάρκετινγκ Κ ΩΝΣΤΑ ΝΤΙΝΟΣ Δ Ι Α ΜΑΝΤΑΡΑ Σ Τ ΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Π Λ ΗΡΟΦΟΡΙΚΗΣ Α.Τ.Ε.Ι. Θ Ε Σ Σ Α ΛΟ ΝΙΚΗΣ

Υλοποίηση Συστήματος Ανίχνευσης Εισβολών σε Περιβάλλον Android για Ασύρματα Δίκτυα Πρόσβασης

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

Αριθμ. Πρωτοκόλλου: EΛE_2018_9055 Μυτιλήνη, 21/11/2018

Εκδήλωση ενδιαφέροντος για τη χορήγηση υποτροφίας για την εκπόνηση διδακτορικής διατριβής

Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Αριθμ. Πρωτοκόλλου: EΛE_2018_2184 Μυτιλήνη, 26 Απριλίου 2018

Ανάκτηση Πληροφορίας

Πανελλαδική Έρευνα για το Επιχειρηματικό Περιβάλλον:

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Γιώργος Γιαννής, Καθηγητής Εθνικό Μετσόβιο Πολυτεχνείο Τομέας Μεταφορών και Συγκοινωνιακής Υποδομής

Υλοποίηση τεχνικών για την αποφυγή συμφόρησης σε τοπικά ασύρματα δίκτυα αισθητήρων

HMY 795: Αναγνώριση Προτύπων

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

710 -Μάθηση - Απόδοση

Η προβολή πολυτελών υπηρεσιών μέσω του διαδικτύου και των μέσων κοινωνικής δικτύωσης

HMY 795: Αναγνώριση Προτύπων

710 -Μάθηση - Απόδοση

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

Ανάλυση, Sentiment Analysis, Hybrid Method, SentiWordNet, Word Graphs, Deep Learning, Lexicon Based Approach

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ

HMY 795: Αναγνώριση Προτύπων

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

Σύστημα Πιστοποίησης Ποιότητας στον Αγροτουρισμό CerTour ΕΝΤΥΠΟ ΒΑΘΜΟΛΟΓΙΑΣ ΕΠΙΘΕΩΡΗΤΩΝ

«ΧΡΗΣΗ ΤΕΧΝΟΛΟΓΙΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ (ΤΠΕ) ΓΙΑ ΣΥΓΚΡΙΤΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΚΑΤΑΝΑΛΩΤΙΚΩΝ ΑΓΑΘΩΝ»

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ινστιτούτο Πληροφοριακών Συστημάτων

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Transcript:

Εξόρυξη γνώσης από σχόλια σε τουριστικές ιστοσελίδες και παραγοντική ανάλυση του αισθήματος ικανοποίησης των πελατών για το ξενοδοχείο τους Γιώργος ταλίδης 1, Παναγιώτης ταλίδης 2, Κώστας Διαμαντάρας 2 και Δημήτριος Καραπιστόλης 1 Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1 Σμήμα Διοίκησης Επιχειρήσεων 2 Σμήμα Μηχανικών Πληροφορικής Χρηματοδοτείται από την Ευρωπαϊκή Ένωση και Εθνικούς πόρους μέσω του προγράμματος ΑΡΧΙΜΗΔΗ ΙΙΙ

Κίνητρο και στόχοι της εργασίας Η δημοσιοποίηση της εμπειρίας και της γνώμης των τουριστών σε ιστοσελίδες κοινωνικής δικτύωσης επιδρά στις αποφάσεις νέων πελατών Σεράστιος όγκος δεδομένων μπορεί να αποτελέσει πηγή γνώσης σχετικά με το πώς διαμορφώνεται το αίσθημα ικανοποίησης των πελατών και από ποια στοιχεία επηρεάζεται τόχος τα σχόλια σε μορφή ελεύθερου κειμένου Εστίαση στην ανάλυση αισθήματος (sentiment analysis) Αδόμητα δεδομένα, μεγάλος όγκος -> text mining υσχέτιση του αισθήματος με άλλες μεταβλητές για την εύρεση παραγόντων και τάσεων που διαμορφώνουν τη γνώμη των επισκεπτών Παραγοντική ανάλυση αντιστοιχιών Εξαγωγή γνώσης σε μορφή κανόνων

Το συνολικό πλαίσιο Raw data Captured from social media Text mining / Sentiment analysis

Άντληση δεδομένων Προέλευση Tripadvisor άντληση με crawler σε python Ξενοδοχεία στην Κρήτη σχόλια στα Αγγλικά Ελεύθερα σχόλια, συνολική βαθμολογία, επιμέρους βαθμολογίες, Stars, Rating 60.000 reviews

Εξόρυξη αισθήματος από φυσικό κείμενο με μηχανική μάθηση

Επεξεργασία φυσικής γλώσσας Ιδιωματισμοί, ορθογραφικά λάθη, συντμήσεις, παρατεταμένοι χαρακτήρες, σύμβολα/στίξη. The ooonly good thing!!! Επαναλήψεις λέξεων, διπλή άρνηση, κλπ Κατακερματισμός (tokenizing), συχνές λέξεις

Εξαγωγή χαρακτηριστικών Δημιουργία προτύπων εκμάθησης Μοντέλα Bag of Words Χωρισμός σε κέρματα (tokens) Καταμέτρηση και κανονικοποίηση Διάνυσμα παρουσίας λέξεων στο κείμενο SentiWordNet Χαρακτηρισμός λέξεων με βάση λεξικό ύνοψη χαρακτηρισμού σε επίπεδο κειμένου Word2Vec Απεικόνιση λέξεων σε διανύσματα μεγάλης διάστασης (π.χ. 100) Προσέγγιση της «εγγύτητας» των εννοιών των λέξεων Doc2Vec Συνδυασμός των 3 μοντέλων

Αλγόριθμοι μηχανικής μάθησης Multinomial Naive Bayes Maximum Entropy (Logistic Regression) Support Vector Machines SVM with RBF Kernel Οι 4 αλγόριθμοι ML δοκιμάστηκαν σε 8 σετ χαρακτηριστικών από διαφορετικά μοντέλα εξαγωγής χαρακτηριστικών τόχος α) Κατάταξη σε κλίμακα 1-5 (συνολικό Rating του αξιολογητή) β) Δυαδική κατάταξη (+/-): 1,2,3 -> «-», 4,5-> «+»

Αποτελέσματα ανάλυσης αισθήματος

Αξιολόγηση αλγορίθμων Σο μοντέλο BoW είναι το πιο αποτελεσματικό από τα 3 απλά (82% ακρίβεια, έναντι 68% και 75% των SentiWordNet και Word2Vec, αντίστοιχα) Σο μοντέλο Doc2Vec βελτιώνει την απόδοση (87%) Οι τίτλοι που βάζουν οι χρήστες συνοψίζουν σε μεγάλο βαθμό τις συνολικές κριτικές Όλοι οι αλγόριθμοι ταξινόμησης δίνουν περίπου τα ίδια αποτελέσματα

Συσχέτιση επιμέρους στοιχείων αξιολόγησης με συνολικό αίσθημα υχνότερη δυσαρέσκεια από τον ύπνο και το δωμάτιο σε σχέση με την καθαριότητα

Διασταύρωση αξιολόγησης με χώρα

Διασταύρωση αισθήματος με αστέρια και χαρακτηριστικά ξενοδοχείου Αρνητικό αίσθημα συνδέεται με τις χαμηλότερες συνολικές βαθμολογίες του Tripadvisor, ξενοδοχεία 2 αστέρων, έλλειψη πάρκινγκ και πρωινού. Θετικό συναίσθημα για τα ξενοδοχεία με βαθμό 5 και ουδετερότητα για αυτά των 3 αστέρων.

Συμπεράσματα Η ανάλυση αισθήματος από σχόλια σε φυσικό κείμενο απεικονίζει αξιόπιστα την ικανοποίηση των επισκεπτών από το ξενοδοχείο τους. Η πρόβλεψη αισθήματος μπορεί να συσχετιστεί με χαρακτηριστικά των επισκεπτών και των ξενοδοχείων Τποσχόμενη μέθοδος αυτόματης εξαγωγής γνώσης από ανεξάντλητα και διαρκώς ανανεωνόμενα δεδομένα διαθέσιμα στο διαδίκτυο Περιορισμοί μελλοντική εργασία Πρόβλεψη αισθήματος για επιμέρους στοιχεία/κατηγορίες ενδιαφέροντος Εξαγωγή ολοκληρωμένων κανόνων για την τροφοδότηση της Βάσης Γνώσης