ΕΡΓΑΣΙΑ ΣΤΗΝ ΕΞΟΡΥΞΗ & ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΘΕΜΑ: Μελέτη βιβλιογραφίας σχετικά με NLP & Sentiment analysis για rating prediction

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΡΓΑΣΙΑ ΣΤΗΝ ΕΞΟΡΥΞΗ & ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΘΕΜΑ: Μελέτη βιβλιογραφίας σχετικά με NLP & Sentiment analysis για rating prediction"

Transcript

1 ΕΡΓΑΣΙΑ ΣΤΗΝ ΕΞΟΡΥΞΗ & ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΘΕΜΑ: Μελέτη βιβλιογραφίας σχετικά με NLP & Sentiment analysis για rating prediction ΔΗΜΗΤΡΙΑΔΗΣ ΔΗΜΗΤΡΗΣ ΧΡΙΣΤΕΛΗΣ ΕΥΑΓΓΕΛΟΣ 604 ΠΑΝΑΤΣΙΑΣ ΙΩΑΝΝΗΣ 581

2 I. Εισαγωγή Τα άρθρα, τα οποία μελετήσαμε είχαν ως βασικό άξονα την ανάλυση κειμένου αξιολόγησης χρηστών κοινωνικών δικτύων σχετικά με κάποιες επιχειρήσεις. Στόχος αυτής της στρατηγικής είναι η εξαγωγή συμπερασμάτων για τα προϊόντα ή τις υπηρεσίες, που παρέχονται από κάποια επιχείρηση, με πιο αντιληπτό τρόπο. Για να καταστεί αυτό δυνατό οι πολλοί ερευνητές προσέγγισαν το θέμα από την σκοπιά της επεξεργασίας φυσικής γλώσσας (Natural Language Processing). Συγκεκριμένα, οι περισσότεροι προσπάθησαν να βελτιώσουν τις ήδη υπάρχουσες βαθμολογίες χρηστών με βάση την γραπτή αξιολόγησή τους σχετικά με ένα προϊόν ή υπηρεσία. Δηλαδή σε κοινότητες ιστοσελίδες, όπως το Yelp, ο κάθε χρήστης μπορεί να δώσει μια κριτική σε μια κλίμακα 1-5 αστεριών (1 λιγότερο ευχαριστημένος, 5 πάρα πολύ ευχαριστημένος ) και μια γραπτή σύντομη αξιολόγηση της επιχείρησης με βάση την εμπειρία του. Ακόμη, το σκεπτικό αυτό μπορεί να χρησιμοποιηθεί και σε δημοσκοπήσεις για την έκβαση εκλογών και στην αποτύπωση του γενικού συναισθήματος μιας κοινωνίας για κάποιο φαινόμενο ή κατάσταση. Αυτό μπορεί να συμβεί με την εξαγωγή πληροφορίας από τις διαμοιραζόμενες πληροφορίες χρηστών ιστοσελίδων κοινωνικής δικτύωσης και γενικά Web 2.0 τεχνολογιών. Τα τελευταία έτη, η λογική αυτή της εξόρυξης πληροφοριών από τα δεδομένα κοινωνικών δικτύων έχει εκτοξευθεί, καθώς σε αυτές τις πλατφόρμες οι χρήστες μπορούν εκφράσουν την γνώμη τους για κάποιο πολιτικό πρόσωπο ή μια υπηρεσία οικειοθελώς και με βάση την εμπειρία τους. Παρόλα αυτά, η διαδικασία της εξόρυξης και η αποτελεσματικότητά της στην πρόβλεψη δεν έχει αξιοποιηθεί επαρκώς και γίνονται προσπάθειες για την εξαγωγή συναισθήματος από κριτικές και την μετατροπή αυτού σε χρήσιμη πληροφορία για τους άλλους χρήστες και στην δημιουργία ακριβέστερων προτάσεων προϊόντων. Τα προβλήματα που προάγουν την ανάπτυξη αυτού του κλάδου είναι αρχικά το κόστος διεξαγωγής δημοσκοπήσεων μέσω της κλασσικής μεθόδου των τηλεφωνημάτων. Ακόμη, η ύπαρξη κριτικών από πολλούς χρήστες για κάποιο προϊόν μπορεί να κουράσει κάποιον αναγνώστη καθώς αναζητά χρήσιμες πληροφορίες σε ένα τεράστιο πλήθων κριτικών. Συνεπώς, η εύρεση μια μεθόδου μετατροπής των κριτικών σε μια μετρική καλής κακής κριτικής είναι πιο προσιτή και στοχευμένη στην κατανόηση της ποιότητας κάποιας υπηρεσίας προϊόντος. Στην μελέτη μας θα προσπαθήσουμε να εκτελέσουμε πειράματα με το σκεπτικό να μετατρέψουμε το συναίσθημα μιας κριτικής σε μια μετρήσιμη ποσότητα για την διευκόλυνση των χρηστών. Αυτό θα το προσπαθήσουμε κατασκευάζοντας μοντέλα πρόβλεψης των βαθμολογιών των χρηστών του Yelp μέσω της αντίστοιχης κριτικής τους. Με αυτό τον τρόπο θα δείξουμε αν μπορεί να υποβοηθηθεί η βαθμολογία από την κριτική ή και να προβλεφθεί εξ ολοκλήρου χωρίς να χρειάζεται να την θέσει ο χρήστης χειροκίνητα.

3 I. Βασικές Αρχές Δύο πολύ σημαντικές μετρικές για τον υπολογισμό της ικανότητας της βαθμολογικής πρόβλεψης είναι η ακρίβεια (Precision) και η ανάκληση (Recall). Η ανάκληση μετρά το ποσοστό των σχετικών εγγράφων που το σύστημα μπορεί να ανακτήσει σε σχέση με όλα τα σχετικά έγγραφα που υπάρχουν στη συλλογή. Η ακρίβεια μετρά το ποσοστό των εγγράφων που είναι σχετικά μεταξύ αυτών που έχουν ανακτηθεί. Η ακρίβεια και η ανάκληση υπολογίζονται από τους παρακάτω τύπους αντίστοιχα: Precision = tp fp + tp, Recall = tp tp + fn όπου tp, fp, fn είναι ο αριθμός των σωστών θετικών, των λανθασμένων θετικών και των λανθασμένων αρνητικών ψήφων αντίστοιχα. Για να καθοριστεί η ορθότητα της πρόβλεψης, συγκρίνεται η πρόβλεψη της βαθμολογίας με τα μεταδεδομένα που παράγει το σύστημα της βαθμολόγησης. Μια ακόμη μετρική που χρησιμοποιήθηκε ήταν το μέσο τετραγωνικό σφάλμα (MSE), η οποία δίνει το συνολικό σφάλμα των μοντέλων πρόβλεψης σε κάποιο σύνολο δεδομένων. Ένα επιπρόσθετο μέτρο αξιολόγησης αποτελεί ο χρόνος εκτέλεσης της πρόβλεψης (runtime of the predictor), η οποία είναι ιδιαίτερα σημαντική σε περιπτώσεις όπου υπάρχει μεγάλος όγκος δεδομένων. II. Αλγόριθμοι & Τεχνικές Οι μεθοδολογίες, οι οποίες μελετήθηκαν, έχουν πολλά κοινά σημεία αλλά κάθε μία έχει κάτι το διαφορετικό να προσφέρει στην καλύτερη κατανόηση και προσέγγιση του θέματος. Η πρώτη προσέγγιση [1] ασχολείται με την βελτίωση της κριτικής σε εστιατόρια με βάση την κριτική των πελατών. Συγκεκριμένα, προτάθηκαν μέθοδοι χαρακτηρισμού ενός εστιατορίου ως καλού/κακού σχετικά με το φαγητό, το περιβάλλον, τις τιμές και της εξυπηρέτησης ξεχωριστά. Με αυτό τον τρόπο επιδιώκεται η βελτίωση της ακρίβειας στην πρόταση του καλύτερου εστιατορίου ανάλογα με τις προτιμήσεις του πελάτη. Το σύνολο δεδομένων, στο οποίο έγιναν τα πειράματα, προέρχεται από κριτικές εστιατορίων. Οι κριτικές αυτές προέρχονται από κριτικούς εστιατορίων και από πελάτες. Ένα μικρό ελάττωμα του συνόλου δεδομένων είναι πώς είναι αραιό, καθώς τα εστιατόρια έχουν λίγες κριτικές το καθένα και κάθε πελάτης/κριτικός έχει αξιολογήσει λίγα εστιατόρια. Η μεθοδολογία που ακολουθήθηκε ήταν: a) Ανάλυση των δεδομένων για την ανάδειξη κατηγοριών( Food, Service, Price, Ambience, Anecdotes και Miscellaneous) σχετικές με εστιατόρια στις οποίες θα ανατεθούν προτάσεις από τις κριτικές. Ακόμη δημιουργήθηκαν και οι κατηγορίες συναισθήματος της κάθε πρότασης (Positive, Negative, Neutral και Conflict).

4 b) Χειροκίνητη επισήμανση προτάσεων ως προς τις παραπάνω κατηγορίες. c) Εκπαίδευση και εκτέλεση πειραμάτων σε SVM (Support Vector Machines) ταξινομητές στα εν λόγω δεδομένα ( ταξινομητής ανάλογα με την κατηγορία και ταξινομητής ανάλογα με τις κατηγορίες συναισθήματος ). Τα χαρακτηριστικά κάθε ταξινομητή ήταν οι «ρίζες» των λέξεων (stemmed words) d) Για την εκτίμηση των αποτελεσμάτων χρησιμοποιήθηκε 7-fold cross validation και οι μετρικές accuracy, precision και recall. Τα παραπάνω είχαν καλά αποτελέσματα συνεπώς η δημιουργία μοντέλων πρόβλεψης με βάση το συναίσθημα είναι εφικτή και πιθανόν αποδοτική. Με σκοπό την εκμετάλλευση του εξαγόμενου συναισθήματος από τις κριτικές κατασκευάστηκε ένας τύπος για την μετατροπή της πληροφορίας αυτής σε βαθμολογία κριτικής, η οποία είναι εύκολα συγκρίσιμη με την βαθμολογία αστεριών. Ο τύπος αυτός είναι ο εξής : TextRating = [ P 4] + 1, (1) P+N όπου P ο αριθμός προτάσεων με θετικό συναίσθημα στην κριτική και N είναι ο αριθμός των προτάσεων με αρνητικό συναίσθημα, αντίστοιχα. Η βαθμολόγηση αυτή συγκεντρώνει το συνολικό συναίσθημα των προτάσεων και της όλης κριτικής. Με βάση αυτή την μετρική, δοκιμάστηκαν 3 μέθοδοι πρόβλεψης τις αξιολόγησης σε αστέρια. Η πρώτη μέθοδος, υπολογίζει την βαθμολογία ενός εστιατορίου ως τον μέσο όρο όλων των άλλων κριτικών για το εν λόγω εστιατόριο. Η επόμενη μέθοδος, χρησιμοποιεί κάποια μεταδεδομένα για τον υπολογισμό αυτό. Συγκεκριμένα, η βαθμολογία ενός εστιατορίου υπολογίζεται ως ο μέσος όρος όλων των εστιατορίων με την ίδια τιμή στο πεδίο Cuisine. Στην τρίτη μέθοδο, υπολογίζεται και πάλι ο μέσος όρος των βαθμολογιών ανάλογα με την επιλεγμένη κατηγορία (Food, Price, κτλ.). Κατόπιν, γίνονται πειράματα και σε μοντέλα παρεμβολής και συγκεκριμένα με την συνάρτηση mvregress του Matlab. Τα δεδομένα εισόδου είναι (category, sentiment) και ως εξαρτημένη μεταβλητή έχουμε την βαθμολογία αστεριών. Χρησιμοποιώντας τα βάρη που εξάγει η συνάρτηση υπολογίζουμε τις βαθμολογίες αστεριών αλλά μπορεί να βρεθούν εκτός ορίων. Μια άλλη τακτική που μελετήσαμε αφορούσε την εξαγωγή συναισθήματος σε δεδομένα με χρονικό χαρακτηρισμό και η πρόβλεψη με βάσει αυτών αποτελεσμάτων εκλογών ή της εκτίμησης του συναισθήματος των πολιτών σχετικά με το επίπεδο ζωής ή την εύρεση εργασίας [2]. Τα δεδομένα της συγκεκριμένης έρευνας προήλθαν από το Twitter μέσω της χρήσης του Twitter API και συλλέχθηκαν δεδομένα σε ημερήσια βάση για 3 χρόνια. Τα βήματα για την ανάλυση των κειμένων τα οποία απαρτίζουν το σύνολο δεδομένων μας είναι : 1. Ανάκτηση των μηνυμάτων τα οποία είναι συναφή με το θέμα της έρευνας. 2. Εκτίμηση της γνώμης του κοινού, δηλαδή ο καθορισμός αν τα μηνύματα εκφράζουν θετικές ή αρνητικές απόψεις σχετικά με το θέμα.

5 Κατά την εκτίμηση της γνώμης του κοινού, έγινε συλλογή κειμένων σε ημερήσια βάση και η βαθμολογία καθενός εξαρτήθηκε από τις λέξεις που περιέχει και το συναίσθημα αυτών,θετικό ή αρνητικό, Η βαθμολόγηση αυτή γίνεται με βάση κάποιο λεξικό με βαθμονομημένες λέξεις ανάλογα με το συναίσθημα που εκφράζουν. Υπάρχουν πολλά λεξικά τέτοιου είδους όπως το SentiWord και το OpinionFinder. Κάθε μήνυμα επισημαίνεται ως θετικό ή αρνητικό ένα περιέχει κάποια θετική λέξη και αρνητικό αν περιέχει κάποιο αρνητική. Συνεπώς, υπάρχουν μηνύματα τα οποία είναι και θετικά και αρνητικά ταυτόχρονα. Η βαθμολογία συναισθήματος της κάθε μέρας δίνεται από τον τύπο: x t = t(#θετικών λέξεων ανα θέμα) t(#αρνητικών λέξεων ανα θέμα) Ο τύπος αυτός εκφράζει αναλογία θετικών μηνυμάτων σε αντίθεση με τα αρνητικά σχετικά με κάποιο θέμα σε μια δεδομένη ημέρα. Η τεχνική αυτή παρατηρήθηκε πως παράγει ασταθή αποτελέσματα και για να εξαχθεί μια πιο ομαλή τάση χρησιμοποιήθηκε μια μέθοδος εξομάλυνσης, η οποία λαμβάνει υπόψιν της και τις k προηγούμενες ημέρες. Ο τύπος της μεθόδου είναι: MA t = 1 k (x t k+1 + x t k x t ) Με βάση τον παραπάνω τύπο μπορούμε να προβλέψουμε την βαθμολογία συναισθήματος μιας μέρας με βάση τις προηγούμενες k μέρες. Μια επόμενη προσέγγιση βασίστηκε στον αλγόριθμο μάθησης Perceptron. Στη μηχανική μάθηση, ο αλγόριθμος μάθησης perceptron χρησιμοποιείται για την εποπτευόμενη μάθηση (supervised learning) των δυαδικών κατηγοριοποιητών (binary classifiers), συναρτήσεων δηλαδή που μπορούν να αποφασίζουν αν μία είσοδος (διάνυσμα ή αριθμός) ανήκουν στην μία ή στην άλλη κατηγορία. Με άλλα λόγια, αποτελεί ένα είδος γραμμικού ταξινομητή, δηλαδή αλγόριθμος ταξινόμησης που κάνει προβλέψεις οι οποίες βασίζονται σε μια συνάρτηση γραμμικής πρόβλεψης, συνδυάζοντας ένα σύνολο βαρών με τα χαρακτηριστικά του διανύσματος. Στην περίπτωση εξόρυξης δεδομένων που έχουν να κάνουν με τα συναισθήματα, χρησιμοποιείται ο αλγόριθμος μάθησης perceptron για να προβλεφθεί το συναίσθημα του χρήστη που γράφει την κριτική. Κάθε κριτική δεν θεωρείται ένα κείμενο συνολικό αλλά ένα σύνολο από προτάσεις κάθε μία από τις οποίες έχει το δικό της συναισθηματικό επίπεδο. Με αυτή την προσέγγιση, μετατίθεται το πρόβλημα στην συναισθηματική ανάλυση σε μία πρόταση αντί για ολόκληρο το κείμενο. Η υπόθεση ορίζεται από την παρακάτω εξίσωση: και η g είναι η οριακή συνάρτηση: h θ (x)= g(θ Τ x)

6 1, x 0 g(z)= 0, x<0 Κάθε πρόταση προβλέπεται να είναι θετική αν η υπόθεση ισούται με 1 ή αρνητική αν η υπόθεση προκύψει ίση με 0. Έπειτα υπολογίζεται η βαθμολογία από τη συνολική κριτική, η οποία βασίζεται στον αριθμό των «θετικών» και «αρνητικών» προτάσεων του κειμένου και υπολογίζεται από τον τύπο (1). Ακόμη, δοκιμάστηκε και ο αλγόριθμος Naïve Bayes με την δημιουργία του λεξιλογίου με κατακερματισμό του συνόλου των δεδομένων με αφαίρεση άρθρων και συνδετικών λέξεων και αναγωγή όλων των λέξεων στις ρίζες τους. Χρησιμοποιείται επίσης εξομάλυνση Laplace για την αποφυγή υπερμοντελοποίησης στα δεδομένα εκπαίδευσης. Η αναπαράσταση κάθε κριτικής είναι ένα διάνυσμα με χαρακτηριστικά τις λέξεις του λεξιλογίου και τιμές αν υπάρχει ή όχι η κάθε λέξη στην εν λόγω κριτική. Η μετατροπή αυτή ονομάζεται Binarized Bayes. Ταξινόμηση κειμένου Καθώς οι κριτικές των χρηστών είναι σε ελεύθερο κείμενο, θα πρέπει να χρησιμοποιήσουμε πηγές που πηγάζουν από τον κλάδο της επεξεργασίας φυσικής γλώσσας. Πολυάριθμες πηγές στο διαδίκτυο (άρθρα, έρευνες κ.α) αναφέρουν συγκεκριμένα βήματα για το πως πρέπει να γίνει η επεξεργασία αυτή. Έτσι προκύπτει άρρητη ανάγκη να μελετηθούν συγκεκριμένες τεχνικές για την ανάλυση κριτικών των χρηστών. Μία τέτοια τεχνική είναι η ταξινόμηση κειμένου. Με τον όρο ταξινόμηση κειμένου αναφερόμαστε στην προσπάθεια που γίνεται από ειδικούς κάποιου τομέα αλλά και από αυτοματοποιημένα συστήματα να κατατάξουν τα κείμενα με βάση το περιεχόμενό τους. Συνήθως αυτή η τεχνική χρησιμοποιείται σε ολόκληρα έγγραφα όπου μέσω ενός μοντέλου πρόβλεψης δίνονται κάποιες ετικέτες αυτά ή σε επίπεδο πρότασης. Πολύ συχνά σε επίπεδο πρότασης συναντάμε την ταξινόμηση ερώτησης (question classification) όπου σχετίζεται άμεσα με την ταξινόμηση κειμένου πρότασης. Εφόσον οι κριτικές αποτελούν προτάσεις, η ανάλυσή μας θα συνεχιστεί με την παρουσίαση τεχνικών που έχουν χρησιμοποιηθεί περισσότερο στην ταξινόμηση ερωτήσεων. Οι Abraham Ittycheriach et αl [7] ταξινομούν τις ερωτήσεις με βάση τις κατηγορίες MUC (Chinchor 1997) καθώς καιδύο που εφάρμοσαν οι ίδιοι. Η κατηγορία PHRASE απαιτεί η ερώτηση να έχει μία φράση με βάση κάποιο ουσιαστικό καιη κατηγορία REASON συλλαμβάνει όλες τις ερωτήσεις που αναντούν στο γιατί. Στο δικό τους σύστημα συμπαίραναν ότι η εύρεση καλύτερης ταξινόμησης των ερωτήσεων δεν θα είχε κάποια βελτίωση στα τελικά αποτελέσματα.

7 Οι David Buscaldi et al [8] στο δικό τους σύστημα ερωταπαντήσεων, για να ταξινομήσουν τις ερωτήσεις δημιούργησαν ένα σύνολο κανόνων που ταύτιζαν την ερώτηση με ιεραρχική δομή και χρησιμοποιούσαν κανονικές εκφράσεις για να αποδείξουν αν η ερώτηση ικανοποιεί μία συγκεκριμένη δομή ή όχι. Έχοντας ορίσει κάποιες κατηγορίες γενικές όπως QUANTITY, OTHER κ.α καθώς και υποκατηγορίες αυτών κατάφεραν σε ισπανικό σύνολο κειμένων του CLEF να επιτύχουν ποσοστό 92,25%. Ένα σχετικά παλιό σύστημα με όνομα FASTUS [9] πήρε μέρος σε διαγωνισμό συστημάτων που κατανοούν κείμενα και αξιολογήθηκε από την MUC-4 αξιολόγηση. Η μέθοδος που ακολουθήθηκε ήταν να βαθμολογηθεί η ικανότητα ενός συστήματος να δομήσει τις περιλήψεις κειμένων που σχετίζονταν με την τρομοκρατία. Για τον λόγο αυτό χρησιμοποίησαν πεπερασμένα αυτόματα ώστε να αναγνωρίζουν συγκεκριμένα

8 μοτίβα στις προτάσεις των περιλήψεων. Συνοψίζοντας, όλες οι τεχνικές που αναφέρθηκαν παραπάνω χρησιμοποιούν στα συστήματά τους την ταξινόμηση ερωτήσεων. Με αυτόν τον τρόπο είναι εφικτή η οργάνωση και δόμηση της ερώτησης σε μορφή ημιδομημένη, η οποία είναι πιο κοντά στο χώρο της πληροφορικής. Ανάκτηση πληροφορίας Όπως προαναφέρθηκε οι κριτικές αποτελούν γνώμες ανθρώπων και είναι εκφρασμένες σε ελεύθερο κείμενο. Για να χειριστούμε τέτοιου είδους κείμενα ώστε να εξάγουμε σημαντική πληροφορία δεν μπορούμε να αρκεστούμε μόνο στο περιεχόμενό τους. Θα πρέπει να υπάρχει κάποια μέθοδος ανάκτησης πληροφορίας που θα εμπλουτίζει αυτές τις απλές κριτικές σε πλούσια κείμενα. Για παράδειγμα δεν μπορούμε να ισχυριστούμε ότι μία κριτική είναι θετική χωρίς να υπάρχει γνώση για το ποιες έννοιες είναι αυτές που έχουν θετική χροιά και ποιες όχι. Επίσης θα ήταν σημαντικό να ταυτοποιήσουμε δύο κριτικές που μοιάζουν αρκετά. Ποιες όμως είναι αυτές οι κριτικές; Στο ερώτημα αυτό απαντάει η ανάκτηση πληροφορίας καθώς αναζητάει κείμενα σχετικά με κάποιο ερώτημα. Μετατροπή ερώτησης-πρότασης σε ερώτημα Έχουν προταθεί αρκετές τεχνικές για το πως μπορεί να γίνει μετατροπή πρότασης σε ερώτημα ώστε να αναζητηθεί αυτό σε μία τοπική η απομακρυσμένη βάση δεδομένων. Κάποιες από αυτές είναι οι ακόλουθες. Οι Susn Dumais et al [10] για να προσεγγίσουν το θέμα της μετατροπής της ερώτησης σε ερώτημα δοσμένης μιας ερώτησης, το σύστημά τους παρήγαγε έναν αριθμό από συμβολοσειρές που είναι υπο-συμβολοσειρές της ερώτησης. Για παράδειγμα Where is the Louvre Museum located? The Louvre Museum + is located The Louvre Museum + is + in Με αυτόν τον τρόπο ρωτάει το σύστημα μία μηχανή αναζήτησης και επιστρέφονται σχετικές παράγραφοι. Οι Vankata Siva Rama Sastry k et al [11] μετέτρεψαν ερωτήσεις με συγκεκριμένη δομή, π.χ what VBP NP VP what VP NP VP

9 σε ερωτήματα στην προσπάθειά τους να χειριστούν ερώτησεις στην αγγλική γλώσσα. Οι Dirk Weissenborn et. Al [12] αλλά και οι Yannis Papanikolaou et al [13] χρησιμοποίησαν συγκεκριμένες εκφράσεις ( LAT και FOCUS) ώστε να μετατρέψουν τις ερωτήσεις σε ερωτήματα. Τέλος, είναι σημαντικό να κατανοηθεί ότι οι κριτικές που έχουμε στη διάθεσή μας από χρήστες θα πρέπει να μετατραπούν σε ερωτήματα ώστε να ανακτηθούν σχετικές κριτικές και πληροφορίες γι' αυτές. Αξιολόγηση επιστρεφόμενης πληροφορίας Λογικό επακόλουθο μετά την ανάκτηση όγκου πληροφορίας, είναι η αξιολόγηση για το ποια πληροφορία είναι πιο σχετική με τη δική μας κριτική-πρόταση-ερώτηση. Για την αξιολόγηση αυτή έχουν προταθεί μετρικές που βαθμολογούν την ανακτόμενη πληροφορία. Οι Susan Dumais et al [10] έπειτα από μελέτες παρατήρησαν ότι οι 100 πιο σχετικές παράγραφοι σχετίζονται περισσότερο με τις ερωτήσεις που έδιναν στο σύστημά τους. Για να αξιολογήσουν τις παραγράφους, το σύστημά τους μετέτρεπε την ερώτηση και τις παραγράφους σε n-grams και εφάρμοζαν κάποια μετρική ταύτισης των δύο ακολουθιών n-grams. Οι Dirk Weissenborn et al [12] χρησιμοποίησαν την μηχανή αναζήτησης GoPubMed και αξιολόγησαν τα ανακτούμενα αποτελέσματα με βάση την βαθμολόγηση που έκανα η μηχανή αναζήτησης. Τέλος, συστήματα που δρουν σε κλειστές περιοχές (close domain) εκμεταλλεύονται πληροφορία που βρίσκεται συσσωρευμένη σε οντολογίες [14]. Έτσι είναι σε θέση να συγκρίνουν δύο κείμενα μεταξύ τους με την ταυτοποίηση των όρων τους. Μία μετρική που χρησιμοποιείται είναι η εξής: ts(c1, c2) = 2*common(C1,C2) / (depth(c1) + depth(c2)) όπου η common(c1,c2) δηλώνει τον αριθμό των κοινών μονοπατιών μεταξύ των όρων C1,C2 και depth(ci) το βάθος από την ρίζα της οντολογίας μέχρι τον όρο Ci. Καταλήγοντας πρέπει να τονιστεί ότι η ύπαρξη ενός καλού μηχανισμού αξιολόγησης των επιστρεφόμενων αποτελεσμάτων έχει σημαντική επίδραση στο τελικό παραγόμενο σύστημα. III. Πειραματικά Αποτελέσματα Με βάση τα άρθρα που μελετήσαμε, συγκεντρώσαμε κάποια ενδεικτικά αποτελέσματά για τα τρία μοντέλα που εξετάσαμε: το μοντέλο της εξαγωγής λέξεωνκλειδιών, το μοντέλο της πρόβλεψης της βαθμολογίας και το μοντέλο της ανάλυσης του κειμένου Όσον αναφορά το μοντέλο εξαγωγής λέξεων κλειδιών, προκύπτει από έρευνες [4] ότι η μέθοδος ExpandRank δίνει καλύτερα αποτελέσματα συγκριτικά με την TF-IDF και οι φράσεις κλειδιά είναι πιο σχετικές στην πρώτη περίπτωση. Παρακάτω δίνεται ένα διάγραμμα που αποτυπώνει παραστατικά τα αποτελέσματα που προέκυψαν από την εφαρμογή των δύο μεθόδων στα δεδομένα μίας επιχείρησης.

10 Στα προβλήματα της πρόβλεψης της βαθμολογίας από την κριτική του χρήστη της βαθμολογίας, στο άρθρο [3] συγκρίνονται τα αποτελέσματα των αλγορίθμων που χρησιμοποιήθηκαν. Μια σύγκριση της ακρίβειας και της ανάκλησης για το ίδιο σύνολο δεδομένων εκπαίδευσης, χρησιμοποιώντας διαφορετικούς αλγόριθμους μάθησης φαίνεται στο παρακάτω σχήμα. Οι αλγόριθμοι Multi-class SVM και Nearest Neighbor έχουν και οι δύο χαμηλή ακρίβεια και ανάκληση. Ο Perceptron έχει την υψηλότερη ακρίβεια και ανάκληση για τις βαθμολογίες του 1 ου και 5 ου αστεριού, αλλά οι προβλέψεις δεν είναι ικανοποιητικές για τις βαθμολογίες του 2 ου, 3 ου και 4 ου αστεριού. Ο αλγόριθμος που έχει την καλύτερη συνολική απόδοση είναι ο Binarized Naive Bayes, αλλά η περαιτέρω ανάλυση των σφαλμάτων εκτελώντας τον αλγόριθμο σε διαφορετικά δείγματα δείχνει ότι διαθέτει το πρόβλημα της υψηλής διακύμανσης. Τέλος, στην περίπτωση της ανάλυσης κειμένου από την εφαρμογή της εκπαίδευσης και εκτέλεσης πειραμάτων σε SVM (Support Vector Machines) ταξινομητές [1] παρατηρείται ότι η ακρίβεια και η ανάκληση για τις κριτικές που είχαν θετική χροιά ήταν σχετικά υψηλές, ενώ ήταν χαμηλότερες σε ουδέτερες, αντιφατικές και ανάμικτες κριτικές. Αυτό το χαμηλό ποσοστό ενδεχομένως να προέρχεται από τη διφορούμενη

11 φύση των κατηγοριών αυτών ή από το μικρό ποσό των δεδομένων γι αυτές τις κατηγορίες. IV. Συμπεράσματα Επεκτάσεις Με βάση την παραπάνω έρευνά μας καταλήξαμε σε κάποια συμπεράσματα για τις τεχνικές που χρησιμοποιήθηκαν και αναπτύχθηκαν στα εν λόγω άρθρα. Εν πρώτης, μπορούμε να πούμε με ασφάλεια πως η αφαίρεση άρθρων και λέξεων, οι οποίες δεν έχουν συνεισφορά στο συναίσθημα του κειμένου μπορούν να παραλειφθούν. Κατόπιν, μπορούμε να ανάγουμε τις λέξεις στις αντίστοιχες ρίζες τους (μέσω stemming τεχνικών) μειώνοντας έτσι την πολυπλοκότητα του προβλήματος και δίνοντας βάρος στο νόημα των λέξεων και όχι στο πλήθος τους. Βασιζόμενοι στις 2 αυτές τροποποιήσεις του αρχικού συνόλου δεδομένων παρατηρούμε σημαντική αύξηση στην ακρίβεια και στην ανάκληση των δεδομένων. Ακόμη, σημαντική είναι η επιλογή του κατάλληλου λεξικού για την βαθμολόγηση των λέξεων με βάση το συναίσθημα που εκφράζουν. Υπάρχει πληθώρα από επιλογές λεξικών για τέτοιου είδους εφαρμογές αλλά οι καλύτερες πρακτικές είναι: επιλογή λεξικού με βάση την κατηγορία της εφαρμογής (κριτική εστιατορίων, διάθεση ψήφου κτλ.) ή κατασκευή ενός λεξικού από το σύνολο εκπαίδευσης που διατίθεται με σκοπό την καλύτερη απόδοση των μοντέλων πρόβλεψης Καμία από τις παραπάνω λύσεις δεν αποτελεί πανάκεια αλλά είναι οι τεχνικές που φαίνεται να αποδίδουν καλύτερα. Η πρώτη έχει τα πλεονεκτήματα της μη αναγκαίας σάρωσης του συνόλου εκπαίδευσης και της σύστασης από επίθετα με «συναισθηματική» βαθμονόμηση. Το μειονέκτημα είναι η πιθανότητα να συμπεριληφθούν άσχετα με το αντικείμενο χαρακτηριστικά. Αυτό το μειονέκτημα προσπαθεί να καταπολεμήσει η δεύτερη λύση αλλά με αυτή την τεχνική συμπεριλαμβάνονται λέξεις με ορθογραφικά λάθη ως σωστές και επηρεάζουν την απόδοση του μοντέλου. Μια πρόταση είναι η εύρεση/κατασκευή ενός λεξικού από δεδομένα κοινωνικών δικτύων για την συμπερίληψη νέων αρκτικόλεξων και emoticons στον υπολογισμό συναισθήματος. Από την πλευρά των μοντέλων πρόβλεψης καλύτερο φαίνεται να είναι τα Bayesian συστήματα με κάποιες βελτιώσεις (πχ χαρακτηριστικά με δυαδικές τιμές για ύπαρξη/απώλεια εμφάνισης μιας λέξης στην εν λόγω κριτική).αλλά και τα υπόλοιπα μοντέλα λειτουργούν καλά. Αλλά μια πιθανή βελτίωση είναι η συνεχής ενημέρωση του μοντέλου πρόβλεψης με κάποιο αλγόριθμο ενεργής μάθησης (Active Learning). Η δυσκολία όμως σε αυτές τις υλοποιήσεις έγκεινται στο γεγονός πως δεν είναι εύκολο να διαχωριστούν οι κριτικές 4 αστεριών και από αυτές των 5 αστεριών καθώς είναι πολύ κοντά σημασιολογικά. Συνεπώς, ορθό θα ήταν η δημιουργία 2 κλάσεων συναισθήματος, καλής και κακής κριτικής. Στην περίπτωση χρονικών δεδομένων και πρόβλεψης μέσω ανάλυσης συναισθήματος φαίνεται να μην υπάρχει η δυνατότητα αυτόνομης λειτουργίας κάποιου συστήματος βασιζόμενου εξ ολοκλήρου σε αυτή την τεχνική. Η πιο

12 αποδοτική λύση είναι ο συνδυασμός των παραδοσιακών δημοσκοπήσεων με αυτές τις τεχνικές για την αξιοποίηση των δεδομένων από τα κοινωνικά δίκτυα. V. ΥΛΟΠΟΙΗΣΗ Η υλοποίησή μας θα είναι ένα υβριδικό σύστημα το οποίο θα προβλέπει μέσω ενός μοντέλου πρόβλεψης την βαθμολόγηση μίας κριτικής και έπειτα θα υπάρχει ενίσχυση αυτού του μοντέλου με τεχνικές ανάλυσης κειμένου που αναφέρθηκαν παραπάνω. Με αυτόν τον τρόπο εκμεταλλευόμαστε την ισχυρή θέση της στατιστικής καθώς επίσης τις διάφορες τεχνικές που έχουν ανακαλύψει για την επεξεργασία φυσικής γλώσσας. VI. ΒΙΒΛΙΟΓΡΑΦΙΑ [1] Ganu, G.; Elhadad, N. & Marian, A. (2009), Beyond the Stars: Improving Rating Predictions using Review Text Content., in 'WebDB' [2] O Connor B., R. Balasubramanyan, B. R. Routledge, and N. A. Smith, From Tweets to Polls: Linking Text Sentiment to Public Opinion Time Series, In Proceedings of International Conference on Weblogs and Social Media (ICWSM 10), [3] Yun Xu, Xinhui Wu, Qinxia Wang, Sentiment Analysis of Yelp's Ratings Based on Text Reviews, 2014 [4] Bechon P.; Grimaldi L. and Merouchi Y., Improving on Yelp Reviews Using NLP and Bayesian Scoring. Report on a project done within Andrew Ng's CS229 Machine Learning class at Stanford [5] J. Jong, "Predicting Rating with Sentiment Analysis," pp. 1-5, [Online]. Available: [6] Basiri, Mohammad Ehsan, Nasser Ghasem-Aghaee, and Ahmad Reza Naghsh-Nilchi. "Exploiting reviewers comment histories for sentiment analysis." Journal of Information Science 40.3 (2014): [7] Abraham Ittycheriach, Martin Franz, Wei-Jing Zhu, Adwait Ratnaparkhi: IBM's Statistical Qustion Answering System (TREC 2000) [8] Davide Buscaldi, Paolo Rosso, Jose Manuel Gomez-Soriano, Emillio Sanchis: Answering question with an n-gram based passage retrieval engine (2009) [9] Douglas E. Appelt, Jerry R. Hobbs, John Bear, David Israel and Mabry Tyson: A Finite-state Processor for Information Extraction from Real-world Text (1993) [10] Susan Dumais, Michele Banko, Eric Brill, Jimmy Lin, Andew Ng: Web Question Answering: is More Always Better? (2002) [11] Vankata Siva Rama Sastry K, Salil Badodekar, and Pushpak Bhattacharyya: Question-to-Query Conversion in the Context of a Meaning-based, Multilingual Searh Engine [12] Dirk Weissenborn, George Tsatsaronis, and Michael Schroeder: Answering Factoid Questions in the Biomedical Domain [13] Yannis Papanikolaou, Dimitris Dimitriadis, Grigoris Tsoumakas, Manos Laliotis, Nikos Markantonatos, and Ioannis Vlahavas: Ensembe Approaches for Large-Scale Multi-Label Classification and Question Answering in Biomedicine (2014) [14] Irena Spasic, Sophia Ananiadou, Jogn McNaught and Anand Kumar: Text mining and ontologies in biomedicine: Making sense of raw text (2005)

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής Εξόρυξη γνώσης από σχόλια σε τουριστικές ιστοσελίδες και παραγοντική ανάλυση του αισθήματος ικανοποίησης των πελατών για το ξενοδοχείο τους Γιώργος ταλίδης 1, Παναγιώτης ταλίδης 2, Κώστας Διαμαντάρας 2

Διαβάστε περισσότερα

Opinion Mining and Sentiment analysis

Opinion Mining and Sentiment analysis Opinion Mining and Sentiment analysis Τμήμα Μηχανικών Η/Υ και Πληροφορικής επιβλέπων καθηγητής: Μακρής Χρήστος Επισκόπηση και πειραματική αξιολόγηση τεχνικών για opinion mining και sentiment analysis Παναγόπουλος

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP Σχεδιαστικά Θέματα Natural Language Processing Επεξεργασία δεδομένων σε φυσική γλώσσα Κατανόηση φυσικής γλώσσας από τη μηχανή

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 2 ο : Βασικές έννοιες Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Γλωσσική Τεχνολογία, Μάθημα 2 ο, Βασικές

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος Αναστασιάδης Αντώνιος Τα ιστολόγια σήμερα Διπλωματική Εργασία Η σημασία των πληροφοριών των ιστολόγιων Μέθοδοι κατάτμησης ιστολόγιων Αξιολόγηση κατάτμησης Ταξινόμηση καταχωρήσεων Αξιολόγηση ταξινόμησης

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση Ηλεκτρονικό εμπόριο HE 8 Εξατομίκευση Πληροφοριακός υπερφόρτος (information overload) Αδυναμία διαχείρισης μεγάλου όγκου πληροφοριών και εντοπισμού της χρήσιμης πληροφορίας Η εξατομίκευση στοχεύει στην

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

Opinion Mining and Sentiment Analysis

Opinion Mining and Sentiment Analysis Τμήμα Μηχανικών Η/Υ και Πληροφορικής επιβλέπων: Μακρής Χρήστος, Επίκουρος Καθηγητής Opinion Mining and Sentiment Analysis Επισκόπηση και πειραματική αξιολόγηση τεχνικών για opinion mining και sentiment

Διαβάστε περισσότερα

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον Κωνσταντίνος Σπυρόπουλος Διευθυντής Ινστιτούτου Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ Δημόκριτος Βελτίωση της Αποτελεσματικότητας Επιχειρήσεων/Οργανισμών,

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων Θεωρία Αποφάσεων ο Φροντιστήριο Λύσεις των Ασκήσεων Άσκηση Έστω ένα πρόβλημα ταξινόμησης μιας διάστασης με δύο κατηγορίες, όπου για κάθε κατηγορία έχουν συλλεχθεί τα παρακάτω δεδομένα: D = {, 2,,,,7 }

Διαβάστε περισσότερα

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner 10. Text Mining Για να μπορέσουμε να χρησιμοποιήσουμε τις δυνατότητες text mining του Rapid Miner πρέπει να εγκαταστήσουμε το Text Mining Extension. Πηγαίνουμε Help Updates and Extensions (Marketplace)

Διαβάστε περισσότερα

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Πίνακας περιεχομένων Τίτλος της έρευνας (title)... 2 Περιγραφή του προβλήματος (Statement of the problem)... 2 Περιγραφή του σκοπού της έρευνας (statement

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ AM: Δοµές Δεδοµένων Εξεταστική Ιανουαρίου 2014 Διδάσκων : Ευάγγελος Μαρκάκης 20.01.2014 ΥΠΟΓΡΑΦΗ ΕΠΟΠΤΗ: Διάρκεια εξέτασης : 2 ώρες και

Διαβάστε περισσότερα

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης

Διαβάστε περισσότερα

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας A. Montgomery Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας Καρολίνα Δουλουγέρη, ΜSc Υποψ. Διαδάκτωρ Σήμερα Αναζήτηση βιβλιογραφίας Επιλογή μεθοδολογίας Ερευνητικός σχεδιασμός Εγκυρότητα και αξιοπιστία

Διαβάστε περισσότερα

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 www.iatrolexi.cti.gr 1 Ερευνητικό Ακαδημαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών (ΕΑΙΤΥ) Σελίδα 1 Ημερομηνία:

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα. Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Εξαγωγή ζευγών ερώτησης απάντησης από forum και αυτόματη απάντηση νέων ερωτήσεων

Εξαγωγή ζευγών ερώτησης απάντησης από forum και αυτόματη απάντηση νέων ερωτήσεων Εξαγωγή ζευγών ερώτησης απάντησης από forum και αυτόματη απάντηση νέων ερωτήσεων Μιχαήλ Ν. Ζερβός std04079@di.uoa.gr Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής και Τηλεπικοινωνιών

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ Παπαδάκης Χαράλαμπος 1, Παναγιωτάκης Κώστας 2, Παρασκευή Φραγκοπούλου 1 1 Τμήμα Μηχ/κών Πληροφορικής, ΤΕΙ Κρήτης 2 Τμήμα

Διαβάστε περισσότερα

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου Γλωσσικη τεχνολογια Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε το πληροφοριακό περιεχόμενο Ποσοτικοποιήσουμε

Διαβάστε περισσότερα

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου

Διαβάστε περισσότερα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα «Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο

Διαβάστε περισσότερα

Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη

Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη Μαργαρίτα Χριστοφορίδου 25 Απριλίου 2015 ΕΚΠΑΙΔΕΥΤΙΚΗ ΗΜΕΡΙΔΑ «ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΜΑΘΗΤΗ- ΣΥΓΧΡΟΝΕΣ ΤΑΣΕΙΣ-ΠΡΑΚΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ»

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Τι είναι η γλωσσική τεχνολογία;

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας. ΚΕΦΑΛΑΙΟ 1 Εισαγωγή Η Μεθοδολογία της Έρευνας (research methodology) είναι η επιστήμη που αφορά τη μεθοδολογία πραγματοποίησης μελετών με συστηματικό, επιστημονικό και λογικό τρόπο, με σκοπό την παραγωγή

Διαβάστε περισσότερα

Ζητήματα μεθοδολογίας στη διαπολιτισμική έρευνα

Ζητήματα μεθοδολογίας στη διαπολιτισμική έρευνα Ζητήματα μεθοδολογίας στη διαπολιτισμική έρευνα Θεωρητικές μεθοδολογικές επιπτώσεις από την προσθήκη του πολιτισμού ως επιπέδου ανάλυσης Πολιτισμική προκατάληψη και ισοτιμία στη διαπολιτισμική σύγκριση

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Θεωρία Υπολογισμού Άρτιοι ΑΜ. Διδάσκων: Σταύρος Κολλιόπουλος. eclass.di.uoa.gr. Περιγραφή μαθήματος

Θεωρία Υπολογισμού Άρτιοι ΑΜ. Διδάσκων: Σταύρος Κολλιόπουλος. eclass.di.uoa.gr. Περιγραφή μαθήματος Περιγραφή μαθήματος Θεωρία Υπολογισμού Άρτιοι ΑΜ Σκοπός του μαθήματος είναι η εισαγωγή στη Θεωρία Υπολογισμού και στη Θεωρία Υπολογιστικής Πολυπλοκότητας (Θεωρία Αλγορίθμων). Διδάσκων: Σταύρος Κολλιόπουλος

Διαβάστε περισσότερα

Μελέτη Συνεργατικής Δραστηριότητας Μαθητών Αξιοποιώντας την Τεχνολογία Wiki

Μελέτη Συνεργατικής Δραστηριότητας Μαθητών Αξιοποιώντας την Τεχνολογία Wiki Μελέτη Συνεργατικής Δραστηριότητας Μαθητών Αξιοποιώντας την Τεχνολογία Wiki Δ. Κράββαρης Δευτεροβάθμια Εκπαίδευση, jkravv@gmail.com Περίληψη Η παρούσα έρευνα μελετά τη συνεργατική δραστηριότητα μαθητών

Διαβάστε περισσότερα

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Αντικείμενο Μελέτη και ανάπτυξη μεθόδων από τον χώρο της μηχανικής μάθησης για

Διαβάστε περισσότερα

Τεχνικές Προβλέψεων. Προβλέψεις

Τεχνικές Προβλέψεων. Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων Προβλέψεις http://www.fsu.gr - lesson@fsu.gr

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη.

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. 4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. Η μετατροπή μιας εντολής επανάληψης σε μία άλλη ή στις άλλες δύο εντολές επανάληψης, αποτελεί ένα θέμα που αρκετές φορές έχει εξεταστεί σε πανελλαδικό

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Opinion Mining Opinion Mining Συνώνυμο: Sentiment Analysis Ορισμός: Ανάλυση κειμένων που αναφέρονται σε μια οντότητα/αντικείμενο Εντοπισμός

Διαβάστε περισσότερα

ΤΕΧΝΙΚΕΣ ΚΑΤΑΓΡΑΦΗΣ ΣΥΝΑΙΣΘΗΜΑΤΩΝ (EMOTIONS) ΑΠΟ ΤΗ ΧΡΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ. Ελένη Καλκοπούλου. στα πλαίσια του μαθήματος Πολυμέσα (ΓΤΠ61)

ΤΕΧΝΙΚΕΣ ΚΑΤΑΓΡΑΦΗΣ ΣΥΝΑΙΣΘΗΜΑΤΩΝ (EMOTIONS) ΑΠΟ ΤΗ ΧΡΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ. Ελένη Καλκοπούλου. στα πλαίσια του μαθήματος Πολυμέσα (ΓΤΠ61) ΤΕΧΝΙΚΕΣ ΚΑΤΑΓΡΑΦΗΣ ΣΥΝΑΙΣΘΗΜΑΤΩΝ (EMOTIONS) ΑΠΟ ΤΗ ΧΡΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ στα πλαίσια του μαθήματος Πολυμέσα (ΓΤΠ61) ΔΙΑΡΘΡΩΣΗ ΠΑΡΟΥΣΙΑΣΗΣ Ορισμοί Συναίσθημα και Πολυμέσα Αναγνώριση Συναισθήματος

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΕΣ 3: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΑΙ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 7 8, Χειμερινό Εξάμηνο Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ Το παρόν

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Επερωτήσεις σύζευξης με κατάταξη

Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις κατάταξης Top-K queries Οι επερωτήσεις κατάταξης επιστρέφουν τις k απαντήσεις που ταιριάζουν καλύτερα με τις προτιμήσεις του χρήστη. Επερωτήσεις κατάταξης Top-K

Διαβάστε περισσότερα

Βάσεις Δεδομένων Ενότητα 1

Βάσεις Δεδομένων Ενότητα 1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 1: Εισαγωγή στις Ιωάννης Μανωλόπουλος, Καθηγητής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ. ΕΡΓΑΣΙΑ 4 «Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ. Στόχος Στόχος της Εργασίας 4 είναι να η εξοικείωση με την αντικειμενοστρέφεια (object oriented programming). Πιο συγκεκριμένα,

Διαβάστε περισσότερα

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών Διαδίκτυο και Επίπεδα ετερογένειας δεδομένων

Διαβάστε περισσότερα

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον Τμήμα Μηχανικών Πληροφορικής Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον Δρ. Δημήτρης Βαρσάμης Επίκουρος Καθηγητής Οκτώβριος 2014 Δρ. Δημήτρης Βαρσάμης Οκτώβριος 2014 1 / 42 Αριθμητικές Μέθοδοι

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

«ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ»

«ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ» Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗ: ΕΠΙΧΕΙΡΗΜΑΤΙΚΗ ΠΛΗΡΟΦΟΡΙΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΑΤΡΑΚΑΣ ΘΩΜΑΣ «ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ» ΕΠΙΒΛΕΠΩΝ

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ WordNet Σημασιολογικά Δίκτυα Ένα δίκτυο που αναπαριστά συσχετίσεις μεταξύ εννοιών. Οι κορυφές παριστάνουν έννοιες και οι ακμές σημασιολογικές

Διαβάστε περισσότερα

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ: ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: Υπολογιστικά Συστήµατα & Τεχνολογίες Πληροφορικής ΣΥΓΓΡΑΦΕΑΣ: Γιώργος Γιαννόπουλος, διδακτορικός φοιτητής

Διαβάστε περισσότερα

Θεωρία Υπολογισμού και Πολυπλοκότητα Κανονικές Γλώσσες (1)

Θεωρία Υπολογισμού και Πολυπλοκότητα Κανονικές Γλώσσες (1) Θεωρία Υπολογισμού και Πολυπλοκότητα Κανονικές Γλώσσες () Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Πεπερασμένα Αυτόματα (Κεφάλαιο., Sipser) Ορισμός πεπερασμένων αυτομάτων και ορισμός του

Διαβάστε περισσότερα

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση Οι συµφράσεις είναι ακολουθίες όρων οι οποίοι συνεµφανίζονται σε κείµενο µε µεγαλύτερη συχνότητα από εκείνη της εµφάνισης

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης 1 ΕΙΣΑΓΩΓΗ (1) Ταξινόμηση ΠΣ ανάλογα με τις λειτουργίες που υποστηρίζουν: Συστήματα Επεξεργασίας Συναλλαγών ΣΕΣ (Transaction

Διαβάστε περισσότερα

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου; 5.1 Επίδοση αλγορίθμων Μέχρι τώρα έχουμε γνωρίσει διάφορους αλγόριθμους (αναζήτησης, ταξινόμησης, κ.α.). Στο σημείο αυτό θα παρουσιάσουμε ένα τρόπο εκτίμησης της επίδοσης (performance) η της αποδοτικότητας

Διαβάστε περισσότερα

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ Αθανάσιος Γαγάτσης Τµήµα Επιστηµών της Αγωγής Πανεπιστήµιο Κύπρου Χρήστος Παντσίδης Παναγιώτης Σπύρου Πανεπιστήµιο

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΔΟΚΙΜΑΣΙΑ

ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΔΟΚΙΜΑΣΙΑ ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΔΟΚΙΜΑΣΙΑ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΘΕΜΑ 1 ο Α. Δίνεται η εντολή εκχώρησης: τ κ < λ Ποιες από τις παρακάτω προτάσεις είναι σωστές και ποιες λάθος. Να δικαιολογήσετε

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

Τεχνολογία Πολιτισμικού Λογισμικού

Τεχνολογία Πολιτισμικού Λογισμικού Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Τεχνολογία Πολιτισμικού Λογισμικού Ενότητα 3: Σύλληψη και ανάλυση απαιτήσεων Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και

Διαβάστε περισσότερα

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ. Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ. π.χ. Βαθμολογία διαγωνίσματος σε τμήματα: Α : 7, 11,16, 16,,. Β : 11, 13, 16, 16, 17, 17. Παρατήρηση : Για τέτοιους λόγους χρειάζεται και η εξέταση κάποιων μέτρων διασποράς

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΒΙΟΜΗΧΑΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ I ΟΙΚΟΝΟΜΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΔΙΟΙΚΗΣΗ ΒΙΟΜΗΧΑΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ I ΟΙΚΟΝΟΜΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΒΙΟΜΗΧΑΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ I ΟΙΚΟΝΟΜΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ Λέκτορας Ι. Γιαννατσής Καθηγητής Π. Φωτήλας ΟΙΚΟΝΟΜΙΚΗ ΕΠΙΣΤΗΜΗ Οικονομική Επιστήμη: Η κοινωνική επιστήμη που ερευνά την οικονομική δραστηριότητα

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος. Γλωσσική Τεχνολογία Εισαγωγή 2015 16 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ Τι θα ακούσετε Εισαγωγή στη γλωσσική τεχνολογία. Ύλη και οργάνωση του μαθήματος. Προαπαιτούμενες γνώσεις και άλλα προτεινόμενα

Διαβάστε περισσότερα

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX Θεμελιώδης αλγόριθμος επίλυσης προβλημάτων Γραμμικού Προγραμματισμού που κάνει χρήση της θεωρίας της Γραμμικής Άλγεβρας Προτάθηκε από το Dantzig (1947) και πλέον

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ. Βασικές Έννοιες Προγραμματισμού. Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD

Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ. Βασικές Έννοιες Προγραμματισμού. Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ Βασικές Έννοιες Προγραμματισμού Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD Αριθμητικά συστήματα Υπάρχουν 10 τύποι ανθρώπων: Αυτοί

Διαβάστε περισσότερα

Τρόποι εξάσκησης της μνήμης και μέθοδοι καλυτέρευσης

Τρόποι εξάσκησης της μνήμης και μέθοδοι καλυτέρευσης Η μνήμη είναι μια νοητική ικανότητα με την οποία αποθηκεύουμε, αναγνωρίζουμε και ανακαλούμε, αλλά και αναπλάθουμε πληροφορίες ή εμπειρίες. Με άλλα λόγια, με τη μνήμη αποθηκεύουμε και διατηρούμε δεδομένα

Διαβάστε περισσότερα

1ο ΣΤΑΔΙΟ ΓΕΝΕΣΗ ΜΕΤΑΚΙΝΗΣΕΩΝ

1ο ΣΤΑΔΙΟ ΓΕΝΕΣΗ ΜΕΤΑΚΙΝΗΣΕΩΝ ΠΡΟΒΛΗΜΑ 1ο ΣΤΑΔΙΟ ΓΕΝΕΣΗ ΜΕΤΑΚΙΝΗΣΕΩΝ πόσες μετακινήσεις δημιουργούνται σε και για κάθε κυκλοφοριακή ζώνη; ΟΡΙΣΜΟΙ μετακίνηση μετακίνηση με βάση την κατοικία μετακίνηση με βάση άλλη πέρα της κατοικίας

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

Φύση και Μαθηματικά. Η χρυσή τομή φ

Φύση και Μαθηματικά. Η χρυσή τομή φ Φύση και Μαθηματικά Η χρυσή τομή φ Ερευνητική Εργασία (Project) Α' Λυκείου 1ο ΓΕΛ Ξάνθης 2011 2012 Επιβλέποντες καθηγητές Επαμεινώνδας Διαμαντόπουλος Βασιλική Κώττη Φύση και Μαθηματικά 2 Τι είναι η χρυσή

Διαβάστε περισσότερα

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης Σφάλματα Μετρήσεων 4.45 Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης Διάστημα εμπιστοσύνης βρίσκονται εκτός του Διαστήματος Εμπιστοσύνης 0.500 X 0.674σ 1 στις 0.800 X 1.8σ 1 στις

Διαβάστε περισσότερα

Τελικός Κύκλος Διαγωνισμάτων Γ ΛΥΚΕΙΟΥ Κυριακή 17 Απριλίου 2016 Μάθημα: Α.Ε.Π.Π. KTIΡΙΟ ΤΜΗΜΑΤΑ ΚΑΛΟΚΑΙΡΙΝΑ ΑΡΓΥΡΟΥΠΟΛΗΣ - ΗΛΙΟΥΠΟΛΗΣ - ΓΛΥΦΑΔΑΣ

Τελικός Κύκλος Διαγωνισμάτων Γ ΛΥΚΕΙΟΥ Κυριακή 17 Απριλίου 2016 Μάθημα: Α.Ε.Π.Π. KTIΡΙΟ ΤΜΗΜΑΤΑ ΚΑΛΟΚΑΙΡΙΝΑ ΑΡΓΥΡΟΥΠΟΛΗΣ - ΗΛΙΟΥΠΟΛΗΣ - ΓΛΥΦΑΔΑΣ Τελικός Κύκλος Διαγωνισμάτων Γ ΛΥΚΕΙΟΥ Κυριακή 17 Απριλίου 2016 Μάθημα: Α.Ε.Π.Π. KTIΡΙΟ ΤΜΗΜΑΤΑ ΚΑΛΟΚΑΙΡΙΝΑ ΑΡΓΥΡΟΥΠΟΛΗΣ - ΗΛΙΟΥΠΟΛΗΣ - ΓΛΥΦΑΔΑΣ Ονοματεπώνυμο Τμήμα Καθηγητής Επιτηρητής Αίθουσα Διάρκεια:

Διαβάστε περισσότερα

Εξαμηνιαία Εργασία Β. Κανονική Κατανομή - Επαγωγική Στατιστική

Εξαμηνιαία Εργασία Β. Κανονική Κατανομή - Επαγωγική Στατιστική 1 ΕΞΑΜΗΝΙΑΙΑ Β ΤΟ ΦΩΤΟΒΟΛΤΑΙΚΟ ΠΑΡΚΟ ΑΣΠΑΙΤΕ Τμήμα Εκπαιδευτικών Ηλεκτρολογίας Εργαστήριο Συλλογής και Επεξεργασίας Δεδομένων Διδάσκοντες: Σπύρος Αδάμ, Λουκάς Μιχάλης, Παναγιώτης Καράμπελας Εξαμηνιαία

Διαβάστε περισσότερα