ΕΡΓΑΣΙΑ ΣΤΗΝ ΕΞΟΡΥΞΗ & ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΘΕΜΑ: Μελέτη βιβλιογραφίας σχετικά με NLP & Sentiment analysis για rating prediction

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΡΓΑΣΙΑ ΣΤΗΝ ΕΞΟΡΥΞΗ & ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΘΕΜΑ: Μελέτη βιβλιογραφίας σχετικά με NLP & Sentiment analysis για rating prediction"

Transcript

1 ΕΡΓΑΣΙΑ ΣΤΗΝ ΕΞΟΡΥΞΗ & ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΘΕΜΑ: Μελέτη βιβλιογραφίας σχετικά με NLP & Sentiment analysis για rating prediction ΔΗΜΗΤΡΙΑΔΗΣ ΔΗΜΗΤΡΗΣ ΧΡΙΣΤΕΛΗΣ ΕΥΑΓΓΕΛΟΣ 604 ΠΑΝΑΤΣΙΑΣ ΙΩΑΝΝΗΣ 581

2 I. Εισαγωγή Τα άρθρα, τα οποία μελετήσαμε είχαν ως βασικό άξονα την ανάλυση κειμένου αξιολόγησης χρηστών κοινωνικών δικτύων σχετικά με κάποιες επιχειρήσεις. Στόχος αυτής της στρατηγικής είναι η εξαγωγή συμπερασμάτων για τα προϊόντα ή τις υπηρεσίες, που παρέχονται από κάποια επιχείρηση, με πιο αντιληπτό τρόπο. Για να καταστεί αυτό δυνατό οι πολλοί ερευνητές προσέγγισαν το θέμα από την σκοπιά της επεξεργασίας φυσικής γλώσσας (Natural Language Processing). Συγκεκριμένα, οι περισσότεροι προσπάθησαν να βελτιώσουν τις ήδη υπάρχουσες βαθμολογίες χρηστών με βάση την γραπτή αξιολόγησή τους σχετικά με ένα προϊόν ή υπηρεσία. Δηλαδή σε κοινότητες ιστοσελίδες, όπως το Yelp, ο κάθε χρήστης μπορεί να δώσει μια κριτική σε μια κλίμακα 1-5 αστεριών (1 λιγότερο ευχαριστημένος, 5 πάρα πολύ ευχαριστημένος ) και μια γραπτή σύντομη αξιολόγηση της επιχείρησης με βάση την εμπειρία του. Ακόμη, το σκεπτικό αυτό μπορεί να χρησιμοποιηθεί και σε δημοσκοπήσεις για την έκβαση εκλογών και στην αποτύπωση του γενικού συναισθήματος μιας κοινωνίας για κάποιο φαινόμενο ή κατάσταση. Αυτό μπορεί να συμβεί με την εξαγωγή πληροφορίας από τις διαμοιραζόμενες πληροφορίες χρηστών ιστοσελίδων κοινωνικής δικτύωσης και γενικά Web 2.0 τεχνολογιών. Τα τελευταία έτη, η λογική αυτή της εξόρυξης πληροφοριών από τα δεδομένα κοινωνικών δικτύων έχει εκτοξευθεί, καθώς σε αυτές τις πλατφόρμες οι χρήστες μπορούν εκφράσουν την γνώμη τους για κάποιο πολιτικό πρόσωπο ή μια υπηρεσία οικειοθελώς και με βάση την εμπειρία τους. Παρόλα αυτά, η διαδικασία της εξόρυξης και η αποτελεσματικότητά της στην πρόβλεψη δεν έχει αξιοποιηθεί επαρκώς και γίνονται προσπάθειες για την εξαγωγή συναισθήματος από κριτικές και την μετατροπή αυτού σε χρήσιμη πληροφορία για τους άλλους χρήστες και στην δημιουργία ακριβέστερων προτάσεων προϊόντων. Τα προβλήματα που προάγουν την ανάπτυξη αυτού του κλάδου είναι αρχικά το κόστος διεξαγωγής δημοσκοπήσεων μέσω της κλασσικής μεθόδου των τηλεφωνημάτων. Ακόμη, η ύπαρξη κριτικών από πολλούς χρήστες για κάποιο προϊόν μπορεί να κουράσει κάποιον αναγνώστη καθώς αναζητά χρήσιμες πληροφορίες σε ένα τεράστιο πλήθων κριτικών. Συνεπώς, η εύρεση μια μεθόδου μετατροπής των κριτικών σε μια μετρική καλής κακής κριτικής είναι πιο προσιτή και στοχευμένη στην κατανόηση της ποιότητας κάποιας υπηρεσίας προϊόντος. Στην μελέτη μας θα προσπαθήσουμε να εκτελέσουμε πειράματα με το σκεπτικό να μετατρέψουμε το συναίσθημα μιας κριτικής σε μια μετρήσιμη ποσότητα για την διευκόλυνση των χρηστών. Αυτό θα το προσπαθήσουμε κατασκευάζοντας μοντέλα πρόβλεψης των βαθμολογιών των χρηστών του Yelp μέσω της αντίστοιχης κριτικής τους. Με αυτό τον τρόπο θα δείξουμε αν μπορεί να υποβοηθηθεί η βαθμολογία από την κριτική ή και να προβλεφθεί εξ ολοκλήρου χωρίς να χρειάζεται να την θέσει ο χρήστης χειροκίνητα.

3 I. Βασικές Αρχές Δύο πολύ σημαντικές μετρικές για τον υπολογισμό της ικανότητας της βαθμολογικής πρόβλεψης είναι η ακρίβεια (Precision) και η ανάκληση (Recall). Η ανάκληση μετρά το ποσοστό των σχετικών εγγράφων που το σύστημα μπορεί να ανακτήσει σε σχέση με όλα τα σχετικά έγγραφα που υπάρχουν στη συλλογή. Η ακρίβεια μετρά το ποσοστό των εγγράφων που είναι σχετικά μεταξύ αυτών που έχουν ανακτηθεί. Η ακρίβεια και η ανάκληση υπολογίζονται από τους παρακάτω τύπους αντίστοιχα: Precision = tp fp + tp, Recall = tp tp + fn όπου tp, fp, fn είναι ο αριθμός των σωστών θετικών, των λανθασμένων θετικών και των λανθασμένων αρνητικών ψήφων αντίστοιχα. Για να καθοριστεί η ορθότητα της πρόβλεψης, συγκρίνεται η πρόβλεψη της βαθμολογίας με τα μεταδεδομένα που παράγει το σύστημα της βαθμολόγησης. Μια ακόμη μετρική που χρησιμοποιήθηκε ήταν το μέσο τετραγωνικό σφάλμα (MSE), η οποία δίνει το συνολικό σφάλμα των μοντέλων πρόβλεψης σε κάποιο σύνολο δεδομένων. Ένα επιπρόσθετο μέτρο αξιολόγησης αποτελεί ο χρόνος εκτέλεσης της πρόβλεψης (runtime of the predictor), η οποία είναι ιδιαίτερα σημαντική σε περιπτώσεις όπου υπάρχει μεγάλος όγκος δεδομένων. II. Αλγόριθμοι & Τεχνικές Οι μεθοδολογίες, οι οποίες μελετήθηκαν, έχουν πολλά κοινά σημεία αλλά κάθε μία έχει κάτι το διαφορετικό να προσφέρει στην καλύτερη κατανόηση και προσέγγιση του θέματος. Η πρώτη προσέγγιση [1] ασχολείται με την βελτίωση της κριτικής σε εστιατόρια με βάση την κριτική των πελατών. Συγκεκριμένα, προτάθηκαν μέθοδοι χαρακτηρισμού ενός εστιατορίου ως καλού/κακού σχετικά με το φαγητό, το περιβάλλον, τις τιμές και της εξυπηρέτησης ξεχωριστά. Με αυτό τον τρόπο επιδιώκεται η βελτίωση της ακρίβειας στην πρόταση του καλύτερου εστιατορίου ανάλογα με τις προτιμήσεις του πελάτη. Το σύνολο δεδομένων, στο οποίο έγιναν τα πειράματα, προέρχεται από κριτικές εστιατορίων. Οι κριτικές αυτές προέρχονται από κριτικούς εστιατορίων και από πελάτες. Ένα μικρό ελάττωμα του συνόλου δεδομένων είναι πώς είναι αραιό, καθώς τα εστιατόρια έχουν λίγες κριτικές το καθένα και κάθε πελάτης/κριτικός έχει αξιολογήσει λίγα εστιατόρια. Η μεθοδολογία που ακολουθήθηκε ήταν: a) Ανάλυση των δεδομένων για την ανάδειξη κατηγοριών( Food, Service, Price, Ambience, Anecdotes και Miscellaneous) σχετικές με εστιατόρια στις οποίες θα ανατεθούν προτάσεις από τις κριτικές. Ακόμη δημιουργήθηκαν και οι κατηγορίες συναισθήματος της κάθε πρότασης (Positive, Negative, Neutral και Conflict).

4 b) Χειροκίνητη επισήμανση προτάσεων ως προς τις παραπάνω κατηγορίες. c) Εκπαίδευση και εκτέλεση πειραμάτων σε SVM (Support Vector Machines) ταξινομητές στα εν λόγω δεδομένα ( ταξινομητής ανάλογα με την κατηγορία και ταξινομητής ανάλογα με τις κατηγορίες συναισθήματος ). Τα χαρακτηριστικά κάθε ταξινομητή ήταν οι «ρίζες» των λέξεων (stemmed words) d) Για την εκτίμηση των αποτελεσμάτων χρησιμοποιήθηκε 7-fold cross validation και οι μετρικές accuracy, precision και recall. Τα παραπάνω είχαν καλά αποτελέσματα συνεπώς η δημιουργία μοντέλων πρόβλεψης με βάση το συναίσθημα είναι εφικτή και πιθανόν αποδοτική. Με σκοπό την εκμετάλλευση του εξαγόμενου συναισθήματος από τις κριτικές κατασκευάστηκε ένας τύπος για την μετατροπή της πληροφορίας αυτής σε βαθμολογία κριτικής, η οποία είναι εύκολα συγκρίσιμη με την βαθμολογία αστεριών. Ο τύπος αυτός είναι ο εξής : TextRating = [ P 4] + 1, (1) P+N όπου P ο αριθμός προτάσεων με θετικό συναίσθημα στην κριτική και N είναι ο αριθμός των προτάσεων με αρνητικό συναίσθημα, αντίστοιχα. Η βαθμολόγηση αυτή συγκεντρώνει το συνολικό συναίσθημα των προτάσεων και της όλης κριτικής. Με βάση αυτή την μετρική, δοκιμάστηκαν 3 μέθοδοι πρόβλεψης τις αξιολόγησης σε αστέρια. Η πρώτη μέθοδος, υπολογίζει την βαθμολογία ενός εστιατορίου ως τον μέσο όρο όλων των άλλων κριτικών για το εν λόγω εστιατόριο. Η επόμενη μέθοδος, χρησιμοποιεί κάποια μεταδεδομένα για τον υπολογισμό αυτό. Συγκεκριμένα, η βαθμολογία ενός εστιατορίου υπολογίζεται ως ο μέσος όρος όλων των εστιατορίων με την ίδια τιμή στο πεδίο Cuisine. Στην τρίτη μέθοδο, υπολογίζεται και πάλι ο μέσος όρος των βαθμολογιών ανάλογα με την επιλεγμένη κατηγορία (Food, Price, κτλ.). Κατόπιν, γίνονται πειράματα και σε μοντέλα παρεμβολής και συγκεκριμένα με την συνάρτηση mvregress του Matlab. Τα δεδομένα εισόδου είναι (category, sentiment) και ως εξαρτημένη μεταβλητή έχουμε την βαθμολογία αστεριών. Χρησιμοποιώντας τα βάρη που εξάγει η συνάρτηση υπολογίζουμε τις βαθμολογίες αστεριών αλλά μπορεί να βρεθούν εκτός ορίων. Μια άλλη τακτική που μελετήσαμε αφορούσε την εξαγωγή συναισθήματος σε δεδομένα με χρονικό χαρακτηρισμό και η πρόβλεψη με βάσει αυτών αποτελεσμάτων εκλογών ή της εκτίμησης του συναισθήματος των πολιτών σχετικά με το επίπεδο ζωής ή την εύρεση εργασίας [2]. Τα δεδομένα της συγκεκριμένης έρευνας προήλθαν από το Twitter μέσω της χρήσης του Twitter API και συλλέχθηκαν δεδομένα σε ημερήσια βάση για 3 χρόνια. Τα βήματα για την ανάλυση των κειμένων τα οποία απαρτίζουν το σύνολο δεδομένων μας είναι : 1. Ανάκτηση των μηνυμάτων τα οποία είναι συναφή με το θέμα της έρευνας. 2. Εκτίμηση της γνώμης του κοινού, δηλαδή ο καθορισμός αν τα μηνύματα εκφράζουν θετικές ή αρνητικές απόψεις σχετικά με το θέμα.

5 Κατά την εκτίμηση της γνώμης του κοινού, έγινε συλλογή κειμένων σε ημερήσια βάση και η βαθμολογία καθενός εξαρτήθηκε από τις λέξεις που περιέχει και το συναίσθημα αυτών,θετικό ή αρνητικό, Η βαθμολόγηση αυτή γίνεται με βάση κάποιο λεξικό με βαθμονομημένες λέξεις ανάλογα με το συναίσθημα που εκφράζουν. Υπάρχουν πολλά λεξικά τέτοιου είδους όπως το SentiWord και το OpinionFinder. Κάθε μήνυμα επισημαίνεται ως θετικό ή αρνητικό ένα περιέχει κάποια θετική λέξη και αρνητικό αν περιέχει κάποιο αρνητική. Συνεπώς, υπάρχουν μηνύματα τα οποία είναι και θετικά και αρνητικά ταυτόχρονα. Η βαθμολογία συναισθήματος της κάθε μέρας δίνεται από τον τύπο: x t = t(#θετικών λέξεων ανα θέμα) t(#αρνητικών λέξεων ανα θέμα) Ο τύπος αυτός εκφράζει αναλογία θετικών μηνυμάτων σε αντίθεση με τα αρνητικά σχετικά με κάποιο θέμα σε μια δεδομένη ημέρα. Η τεχνική αυτή παρατηρήθηκε πως παράγει ασταθή αποτελέσματα και για να εξαχθεί μια πιο ομαλή τάση χρησιμοποιήθηκε μια μέθοδος εξομάλυνσης, η οποία λαμβάνει υπόψιν της και τις k προηγούμενες ημέρες. Ο τύπος της μεθόδου είναι: MA t = 1 k (x t k+1 + x t k x t ) Με βάση τον παραπάνω τύπο μπορούμε να προβλέψουμε την βαθμολογία συναισθήματος μιας μέρας με βάση τις προηγούμενες k μέρες. Μια επόμενη προσέγγιση βασίστηκε στον αλγόριθμο μάθησης Perceptron. Στη μηχανική μάθηση, ο αλγόριθμος μάθησης perceptron χρησιμοποιείται για την εποπτευόμενη μάθηση (supervised learning) των δυαδικών κατηγοριοποιητών (binary classifiers), συναρτήσεων δηλαδή που μπορούν να αποφασίζουν αν μία είσοδος (διάνυσμα ή αριθμός) ανήκουν στην μία ή στην άλλη κατηγορία. Με άλλα λόγια, αποτελεί ένα είδος γραμμικού ταξινομητή, δηλαδή αλγόριθμος ταξινόμησης που κάνει προβλέψεις οι οποίες βασίζονται σε μια συνάρτηση γραμμικής πρόβλεψης, συνδυάζοντας ένα σύνολο βαρών με τα χαρακτηριστικά του διανύσματος. Στην περίπτωση εξόρυξης δεδομένων που έχουν να κάνουν με τα συναισθήματα, χρησιμοποιείται ο αλγόριθμος μάθησης perceptron για να προβλεφθεί το συναίσθημα του χρήστη που γράφει την κριτική. Κάθε κριτική δεν θεωρείται ένα κείμενο συνολικό αλλά ένα σύνολο από προτάσεις κάθε μία από τις οποίες έχει το δικό της συναισθηματικό επίπεδο. Με αυτή την προσέγγιση, μετατίθεται το πρόβλημα στην συναισθηματική ανάλυση σε μία πρόταση αντί για ολόκληρο το κείμενο. Η υπόθεση ορίζεται από την παρακάτω εξίσωση: και η g είναι η οριακή συνάρτηση: h θ (x)= g(θ Τ x)

6 1, x 0 g(z)= 0, x<0 Κάθε πρόταση προβλέπεται να είναι θετική αν η υπόθεση ισούται με 1 ή αρνητική αν η υπόθεση προκύψει ίση με 0. Έπειτα υπολογίζεται η βαθμολογία από τη συνολική κριτική, η οποία βασίζεται στον αριθμό των «θετικών» και «αρνητικών» προτάσεων του κειμένου και υπολογίζεται από τον τύπο (1). Ακόμη, δοκιμάστηκε και ο αλγόριθμος Naïve Bayes με την δημιουργία του λεξιλογίου με κατακερματισμό του συνόλου των δεδομένων με αφαίρεση άρθρων και συνδετικών λέξεων και αναγωγή όλων των λέξεων στις ρίζες τους. Χρησιμοποιείται επίσης εξομάλυνση Laplace για την αποφυγή υπερμοντελοποίησης στα δεδομένα εκπαίδευσης. Η αναπαράσταση κάθε κριτικής είναι ένα διάνυσμα με χαρακτηριστικά τις λέξεις του λεξιλογίου και τιμές αν υπάρχει ή όχι η κάθε λέξη στην εν λόγω κριτική. Η μετατροπή αυτή ονομάζεται Binarized Bayes. Ταξινόμηση κειμένου Καθώς οι κριτικές των χρηστών είναι σε ελεύθερο κείμενο, θα πρέπει να χρησιμοποιήσουμε πηγές που πηγάζουν από τον κλάδο της επεξεργασίας φυσικής γλώσσας. Πολυάριθμες πηγές στο διαδίκτυο (άρθρα, έρευνες κ.α) αναφέρουν συγκεκριμένα βήματα για το πως πρέπει να γίνει η επεξεργασία αυτή. Έτσι προκύπτει άρρητη ανάγκη να μελετηθούν συγκεκριμένες τεχνικές για την ανάλυση κριτικών των χρηστών. Μία τέτοια τεχνική είναι η ταξινόμηση κειμένου. Με τον όρο ταξινόμηση κειμένου αναφερόμαστε στην προσπάθεια που γίνεται από ειδικούς κάποιου τομέα αλλά και από αυτοματοποιημένα συστήματα να κατατάξουν τα κείμενα με βάση το περιεχόμενό τους. Συνήθως αυτή η τεχνική χρησιμοποιείται σε ολόκληρα έγγραφα όπου μέσω ενός μοντέλου πρόβλεψης δίνονται κάποιες ετικέτες αυτά ή σε επίπεδο πρότασης. Πολύ συχνά σε επίπεδο πρότασης συναντάμε την ταξινόμηση ερώτησης (question classification) όπου σχετίζεται άμεσα με την ταξινόμηση κειμένου πρότασης. Εφόσον οι κριτικές αποτελούν προτάσεις, η ανάλυσή μας θα συνεχιστεί με την παρουσίαση τεχνικών που έχουν χρησιμοποιηθεί περισσότερο στην ταξινόμηση ερωτήσεων. Οι Abraham Ittycheriach et αl [7] ταξινομούν τις ερωτήσεις με βάση τις κατηγορίες MUC (Chinchor 1997) καθώς καιδύο που εφάρμοσαν οι ίδιοι. Η κατηγορία PHRASE απαιτεί η ερώτηση να έχει μία φράση με βάση κάποιο ουσιαστικό καιη κατηγορία REASON συλλαμβάνει όλες τις ερωτήσεις που αναντούν στο γιατί. Στο δικό τους σύστημα συμπαίραναν ότι η εύρεση καλύτερης ταξινόμησης των ερωτήσεων δεν θα είχε κάποια βελτίωση στα τελικά αποτελέσματα.

7 Οι David Buscaldi et al [8] στο δικό τους σύστημα ερωταπαντήσεων, για να ταξινομήσουν τις ερωτήσεις δημιούργησαν ένα σύνολο κανόνων που ταύτιζαν την ερώτηση με ιεραρχική δομή και χρησιμοποιούσαν κανονικές εκφράσεις για να αποδείξουν αν η ερώτηση ικανοποιεί μία συγκεκριμένη δομή ή όχι. Έχοντας ορίσει κάποιες κατηγορίες γενικές όπως QUANTITY, OTHER κ.α καθώς και υποκατηγορίες αυτών κατάφεραν σε ισπανικό σύνολο κειμένων του CLEF να επιτύχουν ποσοστό 92,25%. Ένα σχετικά παλιό σύστημα με όνομα FASTUS [9] πήρε μέρος σε διαγωνισμό συστημάτων που κατανοούν κείμενα και αξιολογήθηκε από την MUC-4 αξιολόγηση. Η μέθοδος που ακολουθήθηκε ήταν να βαθμολογηθεί η ικανότητα ενός συστήματος να δομήσει τις περιλήψεις κειμένων που σχετίζονταν με την τρομοκρατία. Για τον λόγο αυτό χρησιμοποίησαν πεπερασμένα αυτόματα ώστε να αναγνωρίζουν συγκεκριμένα

8 μοτίβα στις προτάσεις των περιλήψεων. Συνοψίζοντας, όλες οι τεχνικές που αναφέρθηκαν παραπάνω χρησιμοποιούν στα συστήματά τους την ταξινόμηση ερωτήσεων. Με αυτόν τον τρόπο είναι εφικτή η οργάνωση και δόμηση της ερώτησης σε μορφή ημιδομημένη, η οποία είναι πιο κοντά στο χώρο της πληροφορικής. Ανάκτηση πληροφορίας Όπως προαναφέρθηκε οι κριτικές αποτελούν γνώμες ανθρώπων και είναι εκφρασμένες σε ελεύθερο κείμενο. Για να χειριστούμε τέτοιου είδους κείμενα ώστε να εξάγουμε σημαντική πληροφορία δεν μπορούμε να αρκεστούμε μόνο στο περιεχόμενό τους. Θα πρέπει να υπάρχει κάποια μέθοδος ανάκτησης πληροφορίας που θα εμπλουτίζει αυτές τις απλές κριτικές σε πλούσια κείμενα. Για παράδειγμα δεν μπορούμε να ισχυριστούμε ότι μία κριτική είναι θετική χωρίς να υπάρχει γνώση για το ποιες έννοιες είναι αυτές που έχουν θετική χροιά και ποιες όχι. Επίσης θα ήταν σημαντικό να ταυτοποιήσουμε δύο κριτικές που μοιάζουν αρκετά. Ποιες όμως είναι αυτές οι κριτικές; Στο ερώτημα αυτό απαντάει η ανάκτηση πληροφορίας καθώς αναζητάει κείμενα σχετικά με κάποιο ερώτημα. Μετατροπή ερώτησης-πρότασης σε ερώτημα Έχουν προταθεί αρκετές τεχνικές για το πως μπορεί να γίνει μετατροπή πρότασης σε ερώτημα ώστε να αναζητηθεί αυτό σε μία τοπική η απομακρυσμένη βάση δεδομένων. Κάποιες από αυτές είναι οι ακόλουθες. Οι Susn Dumais et al [10] για να προσεγγίσουν το θέμα της μετατροπής της ερώτησης σε ερώτημα δοσμένης μιας ερώτησης, το σύστημά τους παρήγαγε έναν αριθμό από συμβολοσειρές που είναι υπο-συμβολοσειρές της ερώτησης. Για παράδειγμα Where is the Louvre Museum located? The Louvre Museum + is located The Louvre Museum + is + in Με αυτόν τον τρόπο ρωτάει το σύστημα μία μηχανή αναζήτησης και επιστρέφονται σχετικές παράγραφοι. Οι Vankata Siva Rama Sastry k et al [11] μετέτρεψαν ερωτήσεις με συγκεκριμένη δομή, π.χ what VBP NP VP what VP NP VP

9 σε ερωτήματα στην προσπάθειά τους να χειριστούν ερώτησεις στην αγγλική γλώσσα. Οι Dirk Weissenborn et. Al [12] αλλά και οι Yannis Papanikolaou et al [13] χρησιμοποίησαν συγκεκριμένες εκφράσεις ( LAT και FOCUS) ώστε να μετατρέψουν τις ερωτήσεις σε ερωτήματα. Τέλος, είναι σημαντικό να κατανοηθεί ότι οι κριτικές που έχουμε στη διάθεσή μας από χρήστες θα πρέπει να μετατραπούν σε ερωτήματα ώστε να ανακτηθούν σχετικές κριτικές και πληροφορίες γι' αυτές. Αξιολόγηση επιστρεφόμενης πληροφορίας Λογικό επακόλουθο μετά την ανάκτηση όγκου πληροφορίας, είναι η αξιολόγηση για το ποια πληροφορία είναι πιο σχετική με τη δική μας κριτική-πρόταση-ερώτηση. Για την αξιολόγηση αυτή έχουν προταθεί μετρικές που βαθμολογούν την ανακτόμενη πληροφορία. Οι Susan Dumais et al [10] έπειτα από μελέτες παρατήρησαν ότι οι 100 πιο σχετικές παράγραφοι σχετίζονται περισσότερο με τις ερωτήσεις που έδιναν στο σύστημά τους. Για να αξιολογήσουν τις παραγράφους, το σύστημά τους μετέτρεπε την ερώτηση και τις παραγράφους σε n-grams και εφάρμοζαν κάποια μετρική ταύτισης των δύο ακολουθιών n-grams. Οι Dirk Weissenborn et al [12] χρησιμοποίησαν την μηχανή αναζήτησης GoPubMed και αξιολόγησαν τα ανακτούμενα αποτελέσματα με βάση την βαθμολόγηση που έκανα η μηχανή αναζήτησης. Τέλος, συστήματα που δρουν σε κλειστές περιοχές (close domain) εκμεταλλεύονται πληροφορία που βρίσκεται συσσωρευμένη σε οντολογίες [14]. Έτσι είναι σε θέση να συγκρίνουν δύο κείμενα μεταξύ τους με την ταυτοποίηση των όρων τους. Μία μετρική που χρησιμοποιείται είναι η εξής: ts(c1, c2) = 2*common(C1,C2) / (depth(c1) + depth(c2)) όπου η common(c1,c2) δηλώνει τον αριθμό των κοινών μονοπατιών μεταξύ των όρων C1,C2 και depth(ci) το βάθος από την ρίζα της οντολογίας μέχρι τον όρο Ci. Καταλήγοντας πρέπει να τονιστεί ότι η ύπαρξη ενός καλού μηχανισμού αξιολόγησης των επιστρεφόμενων αποτελεσμάτων έχει σημαντική επίδραση στο τελικό παραγόμενο σύστημα. III. Πειραματικά Αποτελέσματα Με βάση τα άρθρα που μελετήσαμε, συγκεντρώσαμε κάποια ενδεικτικά αποτελέσματά για τα τρία μοντέλα που εξετάσαμε: το μοντέλο της εξαγωγής λέξεωνκλειδιών, το μοντέλο της πρόβλεψης της βαθμολογίας και το μοντέλο της ανάλυσης του κειμένου Όσον αναφορά το μοντέλο εξαγωγής λέξεων κλειδιών, προκύπτει από έρευνες [4] ότι η μέθοδος ExpandRank δίνει καλύτερα αποτελέσματα συγκριτικά με την TF-IDF και οι φράσεις κλειδιά είναι πιο σχετικές στην πρώτη περίπτωση. Παρακάτω δίνεται ένα διάγραμμα που αποτυπώνει παραστατικά τα αποτελέσματα που προέκυψαν από την εφαρμογή των δύο μεθόδων στα δεδομένα μίας επιχείρησης.

10 Στα προβλήματα της πρόβλεψης της βαθμολογίας από την κριτική του χρήστη της βαθμολογίας, στο άρθρο [3] συγκρίνονται τα αποτελέσματα των αλγορίθμων που χρησιμοποιήθηκαν. Μια σύγκριση της ακρίβειας και της ανάκλησης για το ίδιο σύνολο δεδομένων εκπαίδευσης, χρησιμοποιώντας διαφορετικούς αλγόριθμους μάθησης φαίνεται στο παρακάτω σχήμα. Οι αλγόριθμοι Multi-class SVM και Nearest Neighbor έχουν και οι δύο χαμηλή ακρίβεια και ανάκληση. Ο Perceptron έχει την υψηλότερη ακρίβεια και ανάκληση για τις βαθμολογίες του 1 ου και 5 ου αστεριού, αλλά οι προβλέψεις δεν είναι ικανοποιητικές για τις βαθμολογίες του 2 ου, 3 ου και 4 ου αστεριού. Ο αλγόριθμος που έχει την καλύτερη συνολική απόδοση είναι ο Binarized Naive Bayes, αλλά η περαιτέρω ανάλυση των σφαλμάτων εκτελώντας τον αλγόριθμο σε διαφορετικά δείγματα δείχνει ότι διαθέτει το πρόβλημα της υψηλής διακύμανσης. Τέλος, στην περίπτωση της ανάλυσης κειμένου από την εφαρμογή της εκπαίδευσης και εκτέλεσης πειραμάτων σε SVM (Support Vector Machines) ταξινομητές [1] παρατηρείται ότι η ακρίβεια και η ανάκληση για τις κριτικές που είχαν θετική χροιά ήταν σχετικά υψηλές, ενώ ήταν χαμηλότερες σε ουδέτερες, αντιφατικές και ανάμικτες κριτικές. Αυτό το χαμηλό ποσοστό ενδεχομένως να προέρχεται από τη διφορούμενη

11 φύση των κατηγοριών αυτών ή από το μικρό ποσό των δεδομένων γι αυτές τις κατηγορίες. IV. Συμπεράσματα Επεκτάσεις Με βάση την παραπάνω έρευνά μας καταλήξαμε σε κάποια συμπεράσματα για τις τεχνικές που χρησιμοποιήθηκαν και αναπτύχθηκαν στα εν λόγω άρθρα. Εν πρώτης, μπορούμε να πούμε με ασφάλεια πως η αφαίρεση άρθρων και λέξεων, οι οποίες δεν έχουν συνεισφορά στο συναίσθημα του κειμένου μπορούν να παραλειφθούν. Κατόπιν, μπορούμε να ανάγουμε τις λέξεις στις αντίστοιχες ρίζες τους (μέσω stemming τεχνικών) μειώνοντας έτσι την πολυπλοκότητα του προβλήματος και δίνοντας βάρος στο νόημα των λέξεων και όχι στο πλήθος τους. Βασιζόμενοι στις 2 αυτές τροποποιήσεις του αρχικού συνόλου δεδομένων παρατηρούμε σημαντική αύξηση στην ακρίβεια και στην ανάκληση των δεδομένων. Ακόμη, σημαντική είναι η επιλογή του κατάλληλου λεξικού για την βαθμολόγηση των λέξεων με βάση το συναίσθημα που εκφράζουν. Υπάρχει πληθώρα από επιλογές λεξικών για τέτοιου είδους εφαρμογές αλλά οι καλύτερες πρακτικές είναι: επιλογή λεξικού με βάση την κατηγορία της εφαρμογής (κριτική εστιατορίων, διάθεση ψήφου κτλ.) ή κατασκευή ενός λεξικού από το σύνολο εκπαίδευσης που διατίθεται με σκοπό την καλύτερη απόδοση των μοντέλων πρόβλεψης Καμία από τις παραπάνω λύσεις δεν αποτελεί πανάκεια αλλά είναι οι τεχνικές που φαίνεται να αποδίδουν καλύτερα. Η πρώτη έχει τα πλεονεκτήματα της μη αναγκαίας σάρωσης του συνόλου εκπαίδευσης και της σύστασης από επίθετα με «συναισθηματική» βαθμονόμηση. Το μειονέκτημα είναι η πιθανότητα να συμπεριληφθούν άσχετα με το αντικείμενο χαρακτηριστικά. Αυτό το μειονέκτημα προσπαθεί να καταπολεμήσει η δεύτερη λύση αλλά με αυτή την τεχνική συμπεριλαμβάνονται λέξεις με ορθογραφικά λάθη ως σωστές και επηρεάζουν την απόδοση του μοντέλου. Μια πρόταση είναι η εύρεση/κατασκευή ενός λεξικού από δεδομένα κοινωνικών δικτύων για την συμπερίληψη νέων αρκτικόλεξων και emoticons στον υπολογισμό συναισθήματος. Από την πλευρά των μοντέλων πρόβλεψης καλύτερο φαίνεται να είναι τα Bayesian συστήματα με κάποιες βελτιώσεις (πχ χαρακτηριστικά με δυαδικές τιμές για ύπαρξη/απώλεια εμφάνισης μιας λέξης στην εν λόγω κριτική).αλλά και τα υπόλοιπα μοντέλα λειτουργούν καλά. Αλλά μια πιθανή βελτίωση είναι η συνεχής ενημέρωση του μοντέλου πρόβλεψης με κάποιο αλγόριθμο ενεργής μάθησης (Active Learning). Η δυσκολία όμως σε αυτές τις υλοποιήσεις έγκεινται στο γεγονός πως δεν είναι εύκολο να διαχωριστούν οι κριτικές 4 αστεριών και από αυτές των 5 αστεριών καθώς είναι πολύ κοντά σημασιολογικά. Συνεπώς, ορθό θα ήταν η δημιουργία 2 κλάσεων συναισθήματος, καλής και κακής κριτικής. Στην περίπτωση χρονικών δεδομένων και πρόβλεψης μέσω ανάλυσης συναισθήματος φαίνεται να μην υπάρχει η δυνατότητα αυτόνομης λειτουργίας κάποιου συστήματος βασιζόμενου εξ ολοκλήρου σε αυτή την τεχνική. Η πιο

12 αποδοτική λύση είναι ο συνδυασμός των παραδοσιακών δημοσκοπήσεων με αυτές τις τεχνικές για την αξιοποίηση των δεδομένων από τα κοινωνικά δίκτυα. V. ΥΛΟΠΟΙΗΣΗ Η υλοποίησή μας θα είναι ένα υβριδικό σύστημα το οποίο θα προβλέπει μέσω ενός μοντέλου πρόβλεψης την βαθμολόγηση μίας κριτικής και έπειτα θα υπάρχει ενίσχυση αυτού του μοντέλου με τεχνικές ανάλυσης κειμένου που αναφέρθηκαν παραπάνω. Με αυτόν τον τρόπο εκμεταλλευόμαστε την ισχυρή θέση της στατιστικής καθώς επίσης τις διάφορες τεχνικές που έχουν ανακαλύψει για την επεξεργασία φυσικής γλώσσας. VI. ΒΙΒΛΙΟΓΡΑΦΙΑ [1] Ganu, G.; Elhadad, N. & Marian, A. (2009), Beyond the Stars: Improving Rating Predictions using Review Text Content., in 'WebDB' [2] O Connor B., R. Balasubramanyan, B. R. Routledge, and N. A. Smith, From Tweets to Polls: Linking Text Sentiment to Public Opinion Time Series, In Proceedings of International Conference on Weblogs and Social Media (ICWSM 10), [3] Yun Xu, Xinhui Wu, Qinxia Wang, Sentiment Analysis of Yelp's Ratings Based on Text Reviews, 2014 [4] Bechon P.; Grimaldi L. and Merouchi Y., Improving on Yelp Reviews Using NLP and Bayesian Scoring. Report on a project done within Andrew Ng's CS229 Machine Learning class at Stanford [5] J. Jong, "Predicting Rating with Sentiment Analysis," pp. 1-5, [Online]. Available: [6] Basiri, Mohammad Ehsan, Nasser Ghasem-Aghaee, and Ahmad Reza Naghsh-Nilchi. "Exploiting reviewers comment histories for sentiment analysis." Journal of Information Science 40.3 (2014): [7] Abraham Ittycheriach, Martin Franz, Wei-Jing Zhu, Adwait Ratnaparkhi: IBM's Statistical Qustion Answering System (TREC 2000) [8] Davide Buscaldi, Paolo Rosso, Jose Manuel Gomez-Soriano, Emillio Sanchis: Answering question with an n-gram based passage retrieval engine (2009) [9] Douglas E. Appelt, Jerry R. Hobbs, John Bear, David Israel and Mabry Tyson: A Finite-state Processor for Information Extraction from Real-world Text (1993) [10] Susan Dumais, Michele Banko, Eric Brill, Jimmy Lin, Andew Ng: Web Question Answering: is More Always Better? (2002) [11] Vankata Siva Rama Sastry K, Salil Badodekar, and Pushpak Bhattacharyya: Question-to-Query Conversion in the Context of a Meaning-based, Multilingual Searh Engine [12] Dirk Weissenborn, George Tsatsaronis, and Michael Schroeder: Answering Factoid Questions in the Biomedical Domain [13] Yannis Papanikolaou, Dimitris Dimitriadis, Grigoris Tsoumakas, Manos Laliotis, Nikos Markantonatos, and Ioannis Vlahavas: Ensembe Approaches for Large-Scale Multi-Label Classification and Question Answering in Biomedicine (2014) [14] Irena Spasic, Sophia Ananiadou, Jogn McNaught and Anand Kumar: Text mining and ontologies in biomedicine: Making sense of raw text (2005)

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής Εξόρυξη γνώσης από σχόλια σε τουριστικές ιστοσελίδες και παραγοντική ανάλυση του αισθήματος ικανοποίησης των πελατών για το ξενοδοχείο τους Γιώργος ταλίδης 1, Παναγιώτης ταλίδης 2, Κώστας Διαμαντάρας 2

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Opinion Mining and Sentiment analysis

Opinion Mining and Sentiment analysis Opinion Mining and Sentiment analysis Τμήμα Μηχανικών Η/Υ και Πληροφορικής επιβλέπων καθηγητής: Μακρής Χρήστος Επισκόπηση και πειραματική αξιολόγηση τεχνικών για opinion mining και sentiment analysis Παναγόπουλος

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP Σχεδιαστικά Θέματα Natural Language Processing Επεξεργασία δεδομένων σε φυσική γλώσσα Κατανόηση φυσικής γλώσσας από τη μηχανή

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 2 ο : Βασικές έννοιες Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Γλωσσική Τεχνολογία, Μάθημα 2 ο, Βασικές

Διαβάστε περισσότερα

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων. ΠΕΡΙΛΗΨΗ Η τεχνική αυτή έκθεση περιλαµβάνει αναλυτική περιγραφή των εναλλακτικών µεθόδων πολυκριτηριακής ανάλυσης που εξετάσθηκαν µε στόχο να επιλεγεί η µέθοδος εκείνη η οποία είναι η πιο κατάλληλη για

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση Ηλεκτρονικό εμπόριο HE 8 Εξατομίκευση Πληροφοριακός υπερφόρτος (information overload) Αδυναμία διαχείρισης μεγάλου όγκου πληροφοριών και εντοπισμού της χρήσιμης πληροφορίας Η εξατομίκευση στοχεύει στην

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική ΕΕΟ 11 Η χρήση στατιστικών εργαλείων στην εκτιμητική 1. Εισαγωγή 2. Προϋποθέσεις χρήσης των Αυτοματοποιημένων Εκτιμητικών Μοντέλων (ΑΕΜ) 3. Περιορισμοί στη χρήση των ΑΕΜ εφόσον έχουν πληρωθεί οι προϋποθέσεις

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος Αναστασιάδης Αντώνιος Τα ιστολόγια σήμερα Διπλωματική Εργασία Η σημασία των πληροφοριών των ιστολόγιων Μέθοδοι κατάτμησης ιστολόγιων Αξιολόγηση κατάτμησης Ταξινόμηση καταχωρήσεων Αξιολόγηση ταξινόμησης

Διαβάστε περισσότερα

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον Κωνσταντίνος Σπυρόπουλος Διευθυντής Ινστιτούτου Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ Δημόκριτος Βελτίωση της Αποτελεσματικότητας Επιχειρήσεων/Οργανισμών,

Διαβάστε περισσότερα

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Πίνακας περιεχομένων Τίτλος της έρευνας (title)... 2 Περιγραφή του προβλήματος (Statement of the problem)... 2 Περιγραφή του σκοπού της έρευνας (statement

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 www.iatrolexi.cti.gr 1 Ερευνητικό Ακαδημαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών (ΕΑΙΤΥ) Σελίδα 1 Ημερομηνία:

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

Τίμος Κουλουμπής. Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων, Πανεπιστήμιο Αιγαίου

Τίμος Κουλουμπής. Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων, Πανεπιστήμιο Αιγαίου Τίμος Κουλουμπής Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων, Πανεπιστήμιο Αιγαίου Αντικείμενο Εργασίας Εισαγωγή στην Αυτόματη Κατηγοριοποίηση Κειμένου Μεθοδολογίες Συγκριτική Αποτίμηση Συμπεράσματα

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Opinion Mining and Sentiment Analysis

Opinion Mining and Sentiment Analysis Τμήμα Μηχανικών Η/Υ και Πληροφορικής επιβλέπων: Μακρής Χρήστος, Επίκουρος Καθηγητής Opinion Mining and Sentiment Analysis Επισκόπηση και πειραματική αξιολόγηση τεχνικών για opinion mining και sentiment

Διαβάστε περισσότερα

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα. Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Τι είναι η γλωσσική τεχνολογία;

Διαβάστε περισσότερα

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας A. Montgomery Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας Καρολίνα Δουλουγέρη, ΜSc Υποψ. Διαδάκτωρ Σήμερα Αναζήτηση βιβλιογραφίας Επιλογή μεθοδολογίας Ερευνητικός σχεδιασμός Εγκυρότητα και αξιοπιστία

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εξαγωγή γεωγραφικής πληροφορίας από δεδομένα παρεχόμενα από χρήστες του

Διαβάστε περισσότερα

Τεχνικές Προβλέψεων. Προβλέψεις

Τεχνικές Προβλέψεων. Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων Προβλέψεις http://www.fsu.gr - lesson@fsu.gr

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Τρεις αλγόριθμοι μηχανικής μάθησης ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου @ 2018 Μηχανική μάθηση αναγνώριση προτύπων Η αναγνώριση προτύπων

Διαβάστε περισσότερα

z = c 1 x 1 + c 2 x c n x n

z = c 1 x 1 + c 2 x c n x n Τεχνολογικό Εκπαιδευτικό Ιδρυμα Κεντρικής Μακεδονίας - Σέρρες Τμήμα Μηχανικών Πληροφορικής Γραμμικός Προγραμματισμός & Βελτιστοποίηση Δρ. Δημήτρης Βαρσάμης Καθηγητής Εφαρμογών Δρ. Δημήτρης Βαρσάμης Μάρτιος

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner 10. Text Mining Για να μπορέσουμε να χρησιμοποιήσουμε τις δυνατότητες text mining του Rapid Miner πρέπει να εγκαταστήσουμε το Text Mining Extension. Πηγαίνουμε Help Updates and Extensions (Marketplace)

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας. ΚΕΦΑΛΑΙΟ 1 Εισαγωγή Η Μεθοδολογία της Έρευνας (research methodology) είναι η επιστήμη που αφορά τη μεθοδολογία πραγματοποίησης μελετών με συστηματικό, επιστημονικό και λογικό τρόπο, με σκοπό την παραγωγή

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ AM: Δοµές Δεδοµένων Εξεταστική Ιανουαρίου 2014 Διδάσκων : Ευάγγελος Μαρκάκης 20.01.2014 ΥΠΟΓΡΑΦΗ ΕΠΟΠΤΗ: Διάρκεια εξέτασης : 2 ώρες και

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη.

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. 4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. Η μετατροπή μιας εντολής επανάληψης σε μία άλλη ή στις άλλες δύο εντολές επανάληψης, αποτελεί ένα θέμα που αρκετές φορές έχει εξεταστεί σε πανελλαδικό

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου Γλωσσικη τεχνολογια Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε το πληροφοριακό περιεχόμενο Ποσοτικοποιήσουμε

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΟΥ ΧΩΡΟΥ ΤΩΝ ΤΑΞΙΝΟΜΗΤΩΝ Ταξινομητές Ταξινομητές συναρτ. διάκρισης Ταξινομητές επιφανειών απόφ. Παραμετρικοί ταξινομητές Μη παραμετρικοί

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Ζητήματα μεθοδολογίας στη διαπολιτισμική έρευνα

Ζητήματα μεθοδολογίας στη διαπολιτισμική έρευνα Ζητήματα μεθοδολογίας στη διαπολιτισμική έρευνα Θεωρητικές μεθοδολογικές επιπτώσεις από την προσθήκη του πολιτισμού ως επιπέδου ανάλυσης Πολιτισμική προκατάληψη και ισοτιμία στη διαπολιτισμική σύγκριση

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος. Γλωσσική Τεχνολογία Εισαγωγή 2015 16 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ Τι θα ακούσετε Εισαγωγή στη γλωσσική τεχνολογία. Ύλη και οργάνωση του μαθήματος. Προαπαιτούμενες γνώσεις και άλλα προτεινόμενα

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα «Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ 19/2/213 1 ο ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ Αντικείμενο του Μαθήματος 2 Εφαρμογές και εργαλεία ΓλωσσικήςΤεχνολογίας με στόχο τη βελτίωση της πρωτογενούς

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ Παπαδάκης Χαράλαμπος 1, Παναγιωτάκης Κώστας 2, Παρασκευή Φραγκοπούλου 1 1 Τμήμα Μηχ/κών Πληροφορικής, ΤΕΙ Κρήτης 2 Τμήμα

Διαβάστε περισσότερα

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ. Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ. π.χ. Βαθμολογία διαγωνίσματος σε τμήματα: Α : 7, 11,16, 16,,. Β : 11, 13, 16, 16, 17, 17. Παρατήρηση : Για τέτοιους λόγους χρειάζεται και η εξέταση κάποιων μέτρων διασποράς

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Επερωτήσεις σύζευξης με κατάταξη

Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις κατάταξης Top-K queries Οι επερωτήσεις κατάταξης επιστρέφουν τις k απαντήσεις που ταιριάζουν καλύτερα με τις προτιμήσεις του χρήστη. Επερωτήσεις κατάταξης Top-K

Διαβάστε περισσότερα

15 τρόποι διαχείρισης αρνητικών σχολίων και κριτικής. Wake up to Booking.yeah

15 τρόποι διαχείρισης αρνητικών σχολίων και κριτικής. Wake up to Booking.yeah 15 τρόποι διαχείρισης αρνητικών σχολίων και κριτικής Wake up to Booking.yeah Ως γνωστόν δεν γίνεται να τους ικανοποιήσετε όλους κι αυτό ισχύει φυσικά και στον τομέα της φιλοξενίας. Όταν στο σπίτι σας μένουν

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων Θεωρία Αποφάσεων ο Φροντιστήριο Λύσεις των Ασκήσεων Άσκηση Έστω ένα πρόβλημα ταξινόμησης μιας διάστασης με δύο κατηγορίες, όπου για κάθε κατηγορία έχουν συλλεχθεί τα παρακάτω δεδομένα: D = {, 2,,,,7 }

Διαβάστε περισσότερα

Οδηγίες συγγραφής αναφοράς (ΒΙΟ 230) «12 βήματα προς την επιτυχία» Βασίλης Προμπονάς Λευκωσία, 2018

Οδηγίες συγγραφής αναφοράς (ΒΙΟ 230) «12 βήματα προς την επιτυχία» Βασίλης Προμπονάς Λευκωσία, 2018 Οδηγίες συγγραφής αναφοράς (ΒΙΟ 230) «12 βήματα προς την επιτυχία» Βασίλης Προμπονάς Λευκωσία, 2018 Βήμα 1: Κατανοώ καλά το ζητούμενο 1. Διατυπώστε ένα βιολογικό ερώτημα που σας απασχολεί εξηγώντας συνοπτικά

Διαβάστε περισσότερα

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών Διαδίκτυο και Επίπεδα ετερογένειας δεδομένων

Διαβάστε περισσότερα

Εξαγωγή ζευγών ερώτησης απάντησης από forum και αυτόματη απάντηση νέων ερωτήσεων

Εξαγωγή ζευγών ερώτησης απάντησης από forum και αυτόματη απάντηση νέων ερωτήσεων Εξαγωγή ζευγών ερώτησης απάντησης από forum και αυτόματη απάντηση νέων ερωτήσεων Μιχαήλ Ν. Ζερβός std04079@di.uoa.gr Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής και Τηλεπικοινωνιών

Διαβάστε περισσότερα

Βάσεις Δεδομένων Ενότητα 1

Βάσεις Δεδομένων Ενότητα 1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 1: Εισαγωγή στις Ιωάννης Μανωλόπουλος, Καθηγητής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Μεταγλωττιστές. Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Μεταγλωττιστές. Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ Μεταγλωττιστές Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Η αβεβαιότητα στη μέτρηση.

Η αβεβαιότητα στη μέτρηση. Η αβεβαιότητα στη μέτρηση. 1. Εισαγωγή. Κάθε μέτρηση, όσο προσεκτικά και αν έχει γίνει, περικλείει κάποια αβεβαιότητα. Η ανάλυση των σφαλμάτων είναι η μελέτη και ο υπολογισμός αυτής της αβεβαιότητας στη

Διαβάστε περισσότερα

ΟΙ ΕΡΩΤΗΣΕ1Σ III: ΟΙ ΚΛΙΜΑΚΕΣ]

ΟΙ ΕΡΩΤΗΣΕ1Σ III: ΟΙ ΚΛΙΜΑΚΕΣ] Κατερέλος - 2.3. ΟΙ ΕΡΩΤΗΣΕ1Σ III: ΟΙ ΚΛΙΜΑΚΕΣ] Η χρήση των κλιμάκων στην ψυχολογία είναι εξαιρετικά ευρεία: δοκιμασίες ικανοτήτων, μέτρηση απόψεων και στάσεων ή και κλινικές παρατηρήσεις. Ειδικότερα στην

Διαβάστε περισσότερα

Α2. Να γράψετε στο τετράδιο απαντήσεών σας το κατάλληλο τμήμα κώδικα, κάνοντας τις απαραίτητες αλλαγές σύμφωνα με την εκάστοτε εκφώνηση:

Α2. Να γράψετε στο τετράδιο απαντήσεών σας το κατάλληλο τμήμα κώδικα, κάνοντας τις απαραίτητες αλλαγές σύμφωνα με την εκάστοτε εκφώνηση: ΠΡΟΣΟΜΟΙΩΣΗ ΑΠΟΛΥΤΗΡΙΩΝ ΕΞΕΤΑΣΕΩΝ Γ' ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΥ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΗΡΕΣΙΩΝ) ΣΥΝΟΛΟ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη

Διαβάστε περισσότερα

Η γλώσσα των μέσων κοινωνικής δικτύωσης: Υφομετρική ανάλυση με προεκτάσεις στην γλωσσική διδασκαλία

Η γλώσσα των μέσων κοινωνικής δικτύωσης: Υφομετρική ανάλυση με προεκτάσεις στην γλωσσική διδασκαλία Η γλώσσα των μέσων κοινωνικής δικτύωσης: Υφομετρική ανάλυση με προεκτάσεις στην γλωσσική διδασκαλία Γιώργος Κ. Μικρός Τμήμα Ιταλικής Γλώσσας και Φιλολογίας - ΕΚΠΑ Περίγραμμα ομιλίας Κοινωνικά Μέσα Δικτύωσης

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Διαχείριση Πολιτισμικών Δεδομένων

Διαχείριση Πολιτισμικών Δεδομένων Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Διαχείριση Πολιτισμικών Δεδομένων Ενότητα 6: Εισαγωγή στις Βάσεις Δεδομένων Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΕΣ 3: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΑΙ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 7 8, Χειμερινό Εξάμηνο Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ Το παρόν

Διαβάστε περισσότερα

Μηχανουργική Τεχνολογία ΙΙ

Μηχανουργική Τεχνολογία ΙΙ Μηχανουργική Τεχνολογία ΙΙ Χαρακτηριστικά διεργασιών - Παραμετροποίηση-Μοντελοποίηση Associate Prof. John Kechagias Mechanical Engineer, Ph.D. Παραμετροποίηση - Μοντελοποίηση Στο κεφάλαιο αυτό γίνεται

Διαβάστε περισσότερα

Τελικό διαγώνισμα. Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον ΘΕΜΑ Α

Τελικό διαγώνισμα. Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον ΘΕΜΑ Α ΘΕΜΑ Α Τελικό διαγώνισμα Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον 2015 2016 Α. να χαρακτηρίσετε τις παρακάτω προτάσεις ως σωστές(σ) ή λάθος(λ). 1.ο αλγόριθμος δυαδικής αναζήτησης εφαρμόζεται μόνο

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη

Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη Μαργαρίτα Χριστοφορίδου 25 Απριλίου 2015 ΕΚΠΑΙΔΕΥΤΙΚΗ ΗΜΕΡΙΔΑ «ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΜΑΘΗΤΗ- ΣΥΓΧΡΟΝΕΣ ΤΑΣΕΙΣ-ΠΡΑΚΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ»

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Η Έρευνα Μάρκετινγκ ως εργαλείο ανάπτυξης νέων προϊόντων ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ.

Διαβάστε περισσότερα

Εισαγωγή στη Σχεδίαση Λογισμικού

Εισαγωγή στη Σχεδίαση Λογισμικού Εισαγωγή στη Σχεδίαση Λογισμικού περιεχόμενα παρουσίασης Τι είναι η σχεδίαση λογισμικού Έννοιες σχεδίασης Δραστηριότητες σχεδίασης Σχεδίαση και υποδείγματα ανάπτυξης λογισμικού σχεδίαση Η σχεδίαση του

Διαβάστε περισσότερα

«ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ»

«ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ» Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗ: ΕΠΙΧΕΙΡΗΜΑΤΙΚΗ ΠΛΗΡΟΦΟΡΙΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΑΤΡΑΚΑΣ ΘΩΜΑΣ «ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ» ΕΠΙΒΛΕΠΩΝ

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΑ Γ Γυμνασίου (Διευκρινιστικές σημειώσεις)

ΤΕΧΝΟΛΟΓΙΑ Γ Γυμνασίου (Διευκρινιστικές σημειώσεις) ΤΕΧΝΟΛΟΓΙΑ Γ Γυμνασίου (Διευκρινιστικές σημειώσεις) Εφαρμογή της μεθόδου έρευνας και πειραματισμού για εξοικείωση των μαθητών με τη διαδικασία της έρευνας στην παραγωγική διαδικασία. Μέσω της έρευνας στον

Διαβάστε περισσότερα