Information Retrieval

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Information Retrieval"

Transcript

1 Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 7: Αξιολόγηση στην Ανάκτηση Πληροφορίας. 1

2 Κεφ. 6 Τι είδαμε στο προηγούμενο μάθημα Βαθμολόγηση και κατάταξη εγγράφων Στάθμιση όρων (term weighting) Αναπαράσταση εγγράφων και ερωτημάτων ως διανύσματα Θέματα Υλοποίησης Περίληψη αποτελεσμάτων 2

3 Κεφ. 8 Τι θα δούμε σήμερα; Ποια τεχνική ή πιο σύστημα ανάκτησης πληροφορίας είναι καλύτερο; Πως μπορούμε να το αξιολογήσουμε; Αξιολόγηση συστημάτων ανάκτησης πληροφορίας και μηχανών αναζήτησης: μεθοδολογία και μέτρα 3

4 Κεφ. 8 Αξιολόγηση συστήματος Αποδοτικότητα (Performance) Πόσο γρήγορη είναι η κατασκευή του ευρετηρίου; Αριθμός εγγράφων την ώρα (throughput) Πόσο μεγάλο είναι το ευρετήριο (αποθήκευση); Πόσο γρήγορη είναι η αναζήτηση; π.χ., latency (χρόνος απόκρισης) ή throughput (ρύθμο-απόδοση) ως συνάρτηση των ερωτημάτων ανά δευτερόλεπτο ή του μεγέθους του ευρετηρίου Εκφραστικότητα της γλώσσας ερωτημάτων επιτρέπει τη διατύπωση περίπλοκων αναγκών πληροφόρησης; Ποιο είναι το κόστος ανά ερώτημα; Π.χ., σε δολάρια 4

5 Κεφ. 8 Μέτρα για μηχανές αναζήτησης Όλα αυτά τα κριτήρια είναι μετρήσιμα (measurable): μπορούμε να ποσοτικοποιήσουμε την ταχύτητα/μέγεθος/χρήματα και να κάνουμε την εκφραστικότητα συγκεκριμένη Ωστόσο μια βασική μέτρηση για μια μηχανή αναζήτησης είναι η ικανοποίηση των χρηστών (user happiness) 5

6 Κεφ. 8 Μέτρα για μηχανές αναζήτησης Τι κάνει ένα χρήστη χαρούμενο; Οι παράγοντες περιλαμβάνουν: Ταχύτητα απόκρισης (Speed of response) Μέγεθος/κάλυψη ευρετηρίου Εύχρηστη διεπαφή (Uncluttered UI) Χωρίς κόστος (free) Συνάφεια (relevance): Κανένα από αυτά δεν αρκεί: εξαιρετικά γρήγορες αλλά άχρηστες απαντήσεις δεν ικανοποιούν ένα χρήστη Θα επικεντρωθούμε στο πως «μετράμε» τη συνάφεια; Effectiveness (αποτελεσματικότητα) vs Efficiency (αποδοτικότητα) 6

7 Κεφ Ποιοι είναι οι χρήστες σε μια μηχανή αναζήτησης; Ποιος είναι ο χρήστης που προσπαθούμε να ικανοποιήσουμε; Εξαρτάται από την εφαρμογή Μηχανές αναζήτησης στο Web: Searcher. Επιτυχία: Ο χρήστης βρίσκει αυτό που ψάχνει. Μέτρο: ρυθμός επιστροφής στη συγκεκριμένη μηχανή αναζήτησης Μηχανές αναζήτησης στο Web: Διαφημιστής. Επιτυχία: Searcher «κλικάρει» στη διαφήμιση. Μέτρο: clickthrough rate Ecommerce: Αγοραστής. Επιτυχία: Ο αγοραστής αγοράζει κάτι. Μέτρο: χρόνος για την αγορά, ποσοστό των searchers που γίνονται αγοραστές Ecommerce: Πωλητής. Επιτυχία: Ο πωλητής πουλάει κάτι. Μέτρο: κέρδος ανά πώληση. Επιχείρηση: CEO. Επιτυχία: Οι εργαζόμενοι γίνονται πιο αποδοτικοί (λόγω αποτελεσματικής αναζήτησης). Μέτρο: κέρδος της εταιρείας. 7

8 Κεφ Βασικό κριτήριο: Συνάφεια Η ικανοποίηση του χρήστη συνήθως εξισώνεται με τη συνάφεια (relevance) των αποτελεσμάτων της αναζήτησης με το ερώτημα Μα πως θα μετρήσουμε τη συνάφεια; 8

9 Κεφ Benchmarks Η καθιερωμένη μεθοδολογία στην Ανάκτηση Πληροφορίας αποτελείται από τρία στοιχεία: 1. Μία πρότυπη συλλογή εγγράφων (benchmark document collection) 2. Μια πρότυπη ομάδα ερωτημάτων (benchmark suite of queries) 3. Μια αποτίμηση της συνάφειας για κάθε ζεύγος ερωτήματοςεγγράφου, συνήθως δυαδική: συναφής (R) - μη συναφής (Ν) (gold standard/ground truth) που μας λέει αν το έγγραφο είναι συναφές ως προς το ερώτημα 9

10 Κεφ. 8.2 Συνάφεια και Ανάγκη Πληροφόρησης Συνάφεια ως προς τι; Συνάφεια ως προς το ερώτημα ή ως προς την ανάγκη πληροφόρησης Ανάγκη Πληροφόρησης (Information need i) : «Ψάχνω για πληροφορία σχετικά με το αν το κόκκινο κρασί είναι πιο αποτελεσματικό από το λευκό κρασί για τη μείωση του ρίσκου για καρδιακή προσβολή» Μεταφράζεται στην ερώτημα: Ερώτημα q: [red wine white wine heart attack] Έστω το έγγραφο d : At heart of his speech was an attack on the wine industry lobby for downplaying the role of red and white wine in drunk driving. d άριστο ταίριασμα στο ερώτημα q d δεν είναι συναφές με την ανάγκη πληροφόρησης i 10

11 Κεφ. 8.2 Συνάφεια και Ανάγκη Πληροφόρησης Η ικανοποίηση του χρήστη μπορεί να μετρηθεί μόνο με τη συνάφεια ως προς την ανάγκη πληροφόρησης και όχι ως προς το ερώτημα Το ακριβές είναι συνάφεια έγγραφου-ανάγκης πληροφόρησης αν και χρησιμοποιούμε και συνάφεια εγγράφου-ερωτήματος. 11

12 Κεφ Μέτρα Συνάφειας Δεδομένης της αποτίμησης των αποτελεσμάτων ενός συστήματος (ground truth) πως εκτιμάμε τη συνάφεια του συστήματος; Θα ορίσουμε σχετικά μέτρα Το μέτρο υπολογίζεται για κάθε ερώτημα και παίρνουμε το μέσο όρο για το σύνολο των ερωτημάτων Αρχικά, θα θεωρήσουμε δυαδικές αξιολογήσεις: Συναφές/Μη Συναφές 12

13 Κεφ Μέτρα Συνάφειας Δυο κατηγορίες μέτρων: Μέτρα που αγνοούν τη διάταξη Μέτρα που λαμβάνουν υπ όψιν τη διάταξη Θα δούμε στην αρχή μέτρα που αγνοούν τη διάταξη 13

14 Κεφ. 8 Μέτρα Συνάφειας χωρίς Διάταξη Τα αποτελέσματα μιας ερώτησης θεωρούνται ως σύνολο, δηλαδή αξιολογούμε τη συνάφεια ενός συνόλου (δεν υπάρχει διάταξη) Παράδειγμα: Έστω μια συλλογή με 1,000,120 έγγραφα, και μια ερώτηση για την οποία υπάρχουν 80 συναφή έγγραφα. Η απάντηση που μας δίνει το ΣΑΠ έχει 60 έγγραφα από τα οποία τα 20 είναι συναφή και τα 40 μη συναφή. Πόσο «καλό» είναι; Πως θα μετρήσουμε τη συνάφεια του; 14

15 Κεφ. 8.3 Ακρίβεια και Ανάκληση Precision (P) Ακρίβεια είναι το ποσοστό των ανακτημένων εγγράφων που είναι συναφή Recall (R) Ανάκληση είναι το ποσοστό των συναφών εγγράφων που ανακτώνται 15

16 Κεφ. 8 Πίνακας Ενδεχομένων Πίνακας Ενδεχόμενων (Incidence Matrix) relevant not relevant retrieved 20 (TP) 40 (FP) 60 not retrieved 60 (FN) 1,000,000 (TN) 1,000, ,000,040 1,000,120 16

17 Κεφ. 8.3 Ακρίβεια και Ανάκληση Πίνακας Ενδεχόμενων (Incidence Matrix) πραγματικά αποτέλεσμα P = TP / ( TP + FP ) R = TP / ( TP + FN ) Entire document collection Relevant documents Retrieved documents 17

18 Κεφ. 8 Πίνακας Ενδεχομένων Πίνακας Ενδεχόμενων (Incidence Matrix) relevant not relevant retrieved 20 (TP) 40 (FP) 60 not retrieved 60 (FN) 1,000,000 (TN) 1,000, ,000,040 1,000,120 Precision = 20/60 = 1/3 Recall = 20/80 = 1/4 18

19 Κεφ. 8.3 Ακρίβεια vs Ανάκληση Η ανάκληση μπορεί να αυξηθεί με το να επιστρέψουμε περισσότερα έγγραφα Η ανάκληση είναι μια μη-φθίνουσα συνάρτηση των εγγράφων που ανακτώνται (Ένα σύστημα που επιστρέφει όλα τα έγγραφα έχει ποσοστό ανάκλησης 100%!) Το αντίστροφο ισχύει για την ακρίβεια (συνήθως): Είναι εύκολο να πετύχεις μεγάλη ακρίβεια με πολύ μικρή ανάκληση (Έστω ότι το έγγραφο με το μεγαλύτερο βαθμό είναι συναφές. Πως μπορούμε να μεγιστοποιήσουμε την ακρίβεια;) Σε ένα καλό σύστημα η ακρίβεια ελαττώνεται όσο περισσότερα έγγραφα ανακτούμε ή με την αύξηση της ανάκλησης Το τι από τα δύο μας ενδιαφέρει περισσότερα εξαρτάται και από την εφαρμογή (π.χ., web vs search) 19

20 Precision Ακρίβεια και Ανάκληση Επιστρέφει συναφή έγγραφα αλλά χάνει και πολλά συναφή 1 Το ιδανικό Επιθυμητή περιοχή 0 Recall 1 Επιστρέφει κυρίως συναφή έγγραφα αλλά και κάποια σκουπίδια

21 Κεφ. 8.3 Αρμονικό Μέσο Πως θα συνδυάσουμε το P και R; Π.χ., το αριθμητικό μέσο (arithmetic mean) Το απλό αριθμητικό μέσο μιας μηχανής αναζήτησης που επιστρέφει τα πάντα είναι 50%, που είναι πολύ υψηλό Θα θέλαμε με κάποιο τρόπο να τιμωρήσουμε την πολύ κακή συμπεριφορά σε οποιοδήποτε από τα δύο μέτρα. Αυτό επιτυγχάνεται παίρνοντας το ελάχιστο Αλλά το ελάχιστο είναι λιγότερο ομαλό (smooth) και είναι δύσκολο να σταθμιστεί Γεωμετρικό μέσο (geometric mean): γινόμενο Το F (αρμονικό μέσο) είναι ένα είδος ομαλού ελάχιστου 21

22 Κεφ. 8.3 Ένα συνδυαστικό μέτρο F Συνήθως ισορροπημένο (balanced) F 1 Aρμονικό μέσο των P και R F1 = 1/ [(1/2)1/P + (1/2)1/R] = 2PR/P+R Πιο κοντά στη μικρότερη από δύο τιμές 22

23 Κεφ. 8.3 Αρμονικό Μέσο Combined Measures Minimum Maximum Arithmetic Geometric Harmonic Precision (Recall fixed at 70%) Τιμές στο 0-1, αλλά συνήθως σε ποσοστά 23

24 Κεφ. 8.3 Ένα συνδυαστικό μέτρο F Το μέτρο F επιτρέπει μια αντιστάθμιση (trade off) της ακρίβεια και της ανάκλησης. όπου α ϵ [0, 1] and thus b 2 ϵ [0, ] Συνήθως ισορροπημένο (balanced) F 1 με α = 0.5 και b = 1 Αυτό είναι το αρμονικό μέσο των P και R Για ποια περιοχή τιμών του β η ανάκληση σταθμίζεται περισσότερο από την ακρίβεια; 24

25 Κεφ. 8.3 Παράδειγμα relevant not relevant retrieved not retrieved 60 1,000,000 1,000, ,000,040 1,000,120 P = 20/( ) = 1/3 R = 20/( ) = 1/4 25

26 Κεφ. 8.3 Ορθότητα (Accuracy) Γιατί να χρησιμοποιούμε περίπλοκα μέτρα όπως ακρίβεια, ανάκληση και F? Γιατί όχι κάτι πιο απλό; Ορθότητα (Accuracy) είναι το ποσοστό των αποφάσεων (συναφή/μη συναφή) που είναι σωστές (ως πρόβλημα ταξινόμησης σε δύο κλάσεις). Με βάση τον πίνακα ενδεχομένων: accuracy = (TP + TN)/(TP + FP + FN + TN). Γιατί αυτό δεν είναι χρήσιμο στην ΑΠ; 26

27 Κεφ. 8.3 Ορθότητα Παράδειγμα relevant not relevant retrieved 18 2 not retrieved 82 1,000,000,000 27

28 Κεφ. 8.3 Ορθότητα Η μηχανή αναζήτησης snoogle επιστρέφει πάντα 0 αποτελέσματα ( 0 matching results found ), ανεξάρτητα από το ερώτημα. Τι μας λέει όμως η ορθότητα (accuracy); 28

29 Κεφ. 8.3 Ορθότητα Απλό κόλπο για τη μεγιστοποίηση της ορθότητας στην ΑΠ: πες πάντα όχι και μην επιστρέφεις κανένα έγγραφο Αυτό έχει ως αποτέλεσμα 99.99% ορθότητα στα περισσότερα ερωτήματα Searchers στο web (και γενικά στην ΑΠ) θέλουν να βρουν κάτι και έχουν κάποια ανεκτικότητα στα «σκουπίδια» Καλύτερα να επιστρέφεις κάποια κακά hits αρκεί να επιστέφεις κάτι Για την αποτίμηση, χρησιμοποιούμε την ακρίβεια, ανάκληση και F 29

30 Κεφ. 8.3 Δυσκολίες στη χρήση P/R Πρέπει να υπολογιστούν μέσοι όροι για μεγάλες ομάδες συλλογών εγγράφων/ερωτημάτων Χρειάζονται εκτιμήσεις συνάφειας από ανθρώπους Οι χρήστες γενικά δεν είναι αξιόπιστοι αξιολογητές Οι εκτιμήσεις πρέπει να είναι δυαδικές Ενδιάμεσες αξιολογήσεις; Εξαρτώνται από τη συλλογή/συγγραφή Τα αποτελέσματα μπορεί να διαφέρουν από το ένα πεδίο στο άλλο Development test collection (tune το σύστημα για μια συλλογή και εκτίμησε την απόδοση του σε αυτήν) 30

31 Μη γνωστή ανάκληση Ο συνολικός αριθμός των συναφών εγγράφων δεν είναι πάντα γνωστός: Δειγματοληψία πάρε έγγραφα από τη συλλογή και αξιολόγησε τη συνάφεια τους. Εφάρμοσε διαφορετικούς αλγόριθμους για την ίδια συλλογή και την ίδια ερώτηση και χρησιμοποίησε το άθροισμα των συναφών εγγράφων

32 Κεφ Μέτρα Συνάφειας χωρίς Διάταξη (επανάληψη) Τα αποτελέσματα μιας ερώτησης θεωρούνται σύνολο, δηλαδή αξιολογούμε τη συνάφεια ενός συνόλου Πίνακας Ενδεχομένων relevant not relevant retrieved 20 TP 40 FP 60 not retrieved 60 FP 1,000,000 TN 1,000, ,000,040 1,000,120 Ακρίβεια (precision): P = TP / ( TP + FP ) Ανάκληση (recall): R = TP / ( TP + FN ) Μέτρηση F: F = 2PR/ P + R Ορθότητα (accuracy) A = (TP + TN)/(TP + FP + FN + TN). 32

33 Κεφ Μέτρα Συνάφειας χωρίς Διάταξη (επανάληψη) Άσκηση 8.1 Ένα ΣΑΠ επιστρέφει 8 συναφή και 10 μη συναφή έγγραφα. Συνολικά υπάρχουν 20 σχετικά έγγραφα. 33

34 Τι γίνεται όταν υπάρχει διάταξη των αποτελεσμάτων;

35 Κεφ. 8.4 Αξιολόγηση Καταταγμένης Ανάκτησης Ο χρήστης δε βλέπει όλη την απάντηση, αντίθετα αρχίζει από την κορυφή της λίστας των αποτελεσμάτων Θεωρείστε την περίπτωση που: Answer(System1,q) = <N N N N N N N R R R> Answer(System2,q) = <R R R N N N N N N N> Η ακρίβεια, ανάκληση και το F είναι μέτρα για μη καταταγμένα (unranked) σύνολα. Πως μπορούμε να τα τροποποιήσουμε τα μέτρα για λίστες με διάταξη; 35

36 Κεφ. 8.4 Καμπύλη Ακρίβειας/Ανάκλησης Πως μπορούμε να τα τροποποιήσουμε τα μέτρα για λίστες με διάταξη; Απλώς υπολόγισε το μέτρο συνόλου για κάθε πρόθεμα: το κορυφαίο 1, κορυφαία 2, κορυφαία 3, κορυφαία 4 κλπ αποτελέσματα Με αυτόν τον τρόπο παίρνουμε μια καμπύλη ακρίβειαςανάκλησης (precision-recall curve). 36

37 Κεφ. 8.4 Παράδειγμα Ι n x x x x x doc # relevant R=3/6=0.5; συνολικός # από συναφή έγγραφα = 6 Έλεγχος σε κάθε νέο σημείο recall: R=1/6=0.167; P=1/1=1 R=2/6=0.333; P=2/2=1 P=3/4=0.75 R=4/6=0.667; P=4/6=0.667 R=5/6=0.833; P=5/13=0.38 Missing one relevant document. Never reach 100% recall 37

38 Κεφ. 8.4 Παράδειγμα Ι (συνέχεια) Recall-Precision Graph 1 Precision 0,8 0,6 0,4 0, ,5 1 Recall Πριονωτή το precision ελαττώνεται για το ίδιο recall μέχρι να βρεθεί το επόμενο συναφές έγγραφο 38

39 Ακρίβεια εκ παρεμβολής (Interpolated precision) Sec. 8.4 Αν η ακρίβεια αλλάζει τοπικά με την αύξηση της ανάκλησης, το λαμβάνουμε υπ όψιν ο χρήστης θέλει να δει και άλλα έγγραφα αν αυξάνεται και η ακρίβεια και η ανάκληση Παίρνουμε τη μέγιστη τιμή της ακρίβειας στα δεξιά της τιμής P( r j ) r max r j r j 1 P( r) 39

40 Κεφ. 8.6 Καμπύλη Ακρίβειας/Ανάκλησης Precision Recall Κάθε σημείο αντιστοιχεί σε ένα αποτέλεσμα για τα κορυφαία k έγγραφα (k = 1, 2, 3, 4,...). Παρεμβολή (με κόκκινο): μέγιστο των μελλοντικών σημείων 40

41 Παράδειγμα ΙΙ Κεφ ,,,,,,,,, Relevant d d d d d d d d d d ,,,,,,,,,,,,,, Retrieved d d d d d d d d d d d d d d d

42 Παράδειγμα ΙΙ Relevant Precision d3, d5, d9, d25, d39, d44, d56, d71, d89, d Recall 123 Rank Doc Rel R ecall P recision 0 0 % 0 % 1 d % 100 % 2 d % 50 % 3 d % 67 % 4 d 6 20 % 50 % 5 d % 40 % 6 d 9 30 % 50 % 7 d % 43 % 8 d % 38 % 9 d % 33 % 10 d % 40 % 11 d % 36 % 12 d % 33 % 13 d % 31 % 14 d % 29 % 15 d 3 50 % 33 % 42

43 Sec. 8.4 Μέσοι όροι από πολλά ερωτήματα Το γράφημα για ένα ερώτημα δεν αρκεί Χρειαζόμαστε τη μέση απόδοση σε αρκετά ερωτήματα. Αλλά: Οι υπολογισμοί ακρίβειας-ανάκλησης τοποθετούν κάποια σημεία στο γράφημα Πως καθορίζουμε μια τιμή ανάμεσα στα σημεία; 43

44 Precision Κεφ. 8.4 Σύγκριση Συστημάτων Σύστημα 1 Σύστημα 2 Πώς να τα συγκρίνουμε; Recall 44

45 Κεφ. 8 Σύγκριση Συστημάτων Σκοπός: Δυνατότητα σύγκρισης διαφορετικών συστημάτων (ή απαντήσεων σε διαφορετικά ερωτήματα) Πως; Χρήση κανονικοποιημένων επιπέδων ανάκλησης (standard recall levels) Παράδειγμα καθιερωμένων επιπέδων ανάκλησης (πλήθος επιπέδων: 11): Standard Recall levels at 0%, 10%, 20%,, 100% r j {0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0} r 0 = 0.0, r 1 = 0.1,, r 10 =1.0 45

46 Κεφ. 8 Μέση ακρίβεια 11-σημείων με παρεμβολή (11-point interpolated average precision) Υπολόγισε την ακρίβεια με παρεμβολή στα επίπεδα ανάκτησης 0.0, 0.1, 0.2,... Επανέλαβε το για όλα τα ερωτήματα στο evaluation benchmark και πάρε το μέσο όρο Αυτό το μέτρο μετρά την απόδοση σε όλα τα επίπεδα ανάκλησης (at all recall levels). 46

47 Κεφ. 8 Μέση ακρίβεια 11-σημείων με παρεμβολή (11-point interpolated average precision) Recall Interpolated Precision Υπολόγισε την ακρίβεια με παρεμβολή στα επίπεδα ανάκτησης 0.0, 0.1, 0.2,. Επανέλαβε το για όλα τα ερωτήματα στο evaluation benchmark και πάρε το μέσο όρο Pr () N q i 1 Pr () i N N q πλήθος ερωτημάτων P i (r) - precision at recall level r for i th query q 47

48 Sec. 8.4 Τυπική (καλή;) ακρίβεια 11-σημείων SabIR/Cornell 8A1 11pt precision from TREC 8 (1999) Precision Recall 48

49 Σύγκριση Συστημάτων Η καμπύλη που είναι πιο κοντά στη πάνω δεξιά γωνία του γραφήματος υποδηλώνει και καλύτερη απόδοση 1 0,8 NoStem Stem Precision 0,6 0,4 0,2 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Recall

50 Κεφ Μέτρα Συνάφειας με Διάταξη Η καμπύλη ανάκλησης-ακρίβειας υποθέτει ότι έχουμε όλο το αποτέλεσμα Σε πολλές μηχανές αναζήτησης Το αποτέλεσμα είναι πολύ μεγάλο Ο χρήστης ενδιαφέρεται μόνο για τα πρώτα αποτελέσματα 50

51 Κεφ. 8.4 Ακρίβεια στα k (precision@k) Ακρίβεια-στα-k (Precision-at-k): H ακρίβεια των κορυφαίων k αποτελεσμάτων Πχ ακρίβεια-στα-10, αγνοεί τα έγγραφα μετά το 10 ο Πχ Prec@3 2/3 Prec@4 2/4 Prec@5 3/5 Πιθανόν κατάλληλο για τις περισσότερες αναζητήσεις στο web: οι χρήστες θέλουν καλά αποτελέσματα στις πρώτες μία ή δύο σελίδες Αντίστοιχα ανάκληση στα k 51

52 Κεφ. 8.4 ΜΑP Θεωρείστε τη θέση διάταξης (rank position) κάθε συναφούς εγγράφου K 1, K 2, K R Υπολογισμός του Precision@K για κάθε K 1, K 2, K R Μέση ακρίβεια = average of P@K Π.χ.,: έχει AvgPrec Mean Αverage Precision (MAP) Μέση αντιπροσωπευτική ακρίβεια: η μέση ακρίβεια για πολλαπλά ερωτήματα 52

53 ΜΑP

54 ΜΑP

55 Κεφ. 8.4 ΜΑP (περίληψη) Μέσος όρος της τιμής της ακρίβειας των κορυφαίων k εγγράφων, κάθε φορά που επιστρέφεται ένα σχετικό έγγραφο Αποφεύγει την παρεμβολή και τη χρήση προκαθορισμένων επιπέδων ανάκλησης MAP για μια συλλογή ερωτημάτων είναι το αριθμητικό μέσο. Macro-averaging: κάθε ερώτημα μετράει το ίδιο Q σύνολο ερωτημάτων, q j ένα από τα ερωτήματα, {d 1, d 2,, d mj } είναι τα συναφή έγγραφα και R jk είναι ο αριθμός των εγγράφων στο αποτέλεσμα μέχρι να φτάσουμε στο d jk (0 αν το d jk δεν ανήκει στο αποτέλεσμα) Συχνά οι τιμές της ΜΑΠ για το ίδιο ερώτημα σε διαφορετικά συστήματα διαφέρουν λιγότερο από τις τιμές τις ΜΑΠ για διαφορετικά ερωτήματα στο ίδιο σύστημα 55

56 Κεφ. 8.4 R-ακρίβεια R-ακρίβεια Αν έχουμε ένα γνωστό (πιθανών μη πλήρες) σύνολο από συναφή έγγραφα μεγέθους Rel, τότε υπολογίζουμε την ακρίβεια των κορυφαίων Rel εγγράφων που επιστρέφει το σύστημα Το τέλειο σύστημα μπορεί να πετύχει βαθμό 1.0 Αν υπάρχουν r, τότε r/rel 56

57 R-Ακρίβεια Ακρίβεια-στο-Rel, όπου Rel o αριθμός των συναφών εγγράφων της συλλογής n doc # relevant x x x x x R = # of relevant docs = 6 R-Precision = 4/6 = 0.67

58 Αν τα αποτελέσματα δεν είναι σε λίστα; Έστω ότι υπάρχει μόνο ένα συναφές έγγραφο Περιπτώσεις: Αναζήτηση γνωστού στοιχείου navigational queries Αναζήτηση γεγονότος (fact) πχ πληθυσμός μιας χώρας Διάρκεια αναζήτησης ~ θέση (rank) της απάντησης Μετρά την προσπάθεια του χρήστη

59 MRR: Mean Reciprocal Rate Θεωρούμε τη θέση K του πρώτου σχετικού εγγράφου Μπορεί να είναι το μόνο που έκανε click ο χρήστης Reciprocal Rank score = 1 K MRR το μέσο RR για πολλαπλές ερωτήσεις

60 ROC (Receiver Operating Characteristic Curve) Καμπύλη χαρακτηριστικής λειτουργίας δέκτη Αναπτύχθηκε στη δεκαετία 1950 για την ανάλυση θορύβου στα σήματα Χαρακτηρίζει το trade-off μεταξύ positive hits και false alarms Η καμπύλη ROC δείχνει τα TPR [TruePositiveRate] ή sensitivity (άλλο όνομα του recall) (στον άξονα των y) προς τα FPR [FalsePositiveRate] ή specificity (στον άξονα των x) Η απόδοση αναπαρίσταται ως ένα σημείο στην καμπύλη ROC True Positive Rate Πόσα από τα θετικά (συναφή) βρίσκει [πόσα από τα θετικά ταξινομεί σωστά] TP TPR TP FN False Positive Rate Πόσα από τα αρνητικά θεωρεί θετικά [πόσα από τα αρνητικά κατηγοριοποιεί λάθος] FP FPR TN FP

61 ROC (0,0): το μοντέλο προβλέπει τα πάντα ως αρνητική κατηγορία (1,1): το μοντέλο προβλέπει τα πάντα ως θετική κατηγορία (0,1): ιδανικό Το ιδανικό στην άνω αριστερή γωνία Διαγώνια γραμμή: Random guessing 61

62 ROC 62

63 Μη δυαδικές αποτιμήσεις Μέχρι στιγμής δυαδικές αποτιμήσεις συνάφειας (συναφές ή μη συναφές) Ας υποθέσουμε ότι τα έγραφα βαθμολογούνται για το «πόσο» συναφή είναι σε κάποια βαθμολογική κλίμακα [0, r], r>2 63

64 fair fair Good

65 Discounted Cumulative Gain Δημοφιλές μέτρο για αποτίμηση της αναζήτησης στο web και σε παρόμοιες εφαρμογές Δύο υποθέσεις: (βαθμός συνάφειας) Έγγραφα με μεγάλη συνάφεια είναι πιο χρήσιμα από οριακά συναφή έγγραφα (θέση στη διάταξη) Όσο πιο χαμηλά στη διάταξη εμφανίζεται ένα έγγραφο, τόσο λιγότερο χρήσιμο είναι για ένα χρήστη, αφού είναι λιγότερο πιθανό να το εξετάσει

66 Discounted Cumulative Gain Χρήση βαθμιδωτής (graded) συνάφειας ως μέτρου της χρησιμότητας ή του κέρδους (gain) από την εξέταση ενός εγγράφου Το κέρδος συγκεντρώνεται/αθροίζεται ξεκινώντας από την κορυφή της διάταξης και Mειώνεται ή γίνεται έκπτωση (discounted) στα χαμηλότερα επίπεδα Η σχετική μείωση είναι 1/log (rank) Για βάση 2, η μείωση του κέρδους στο επίπεδο 4 είναι 1/2 και στο επίπεδο 8 είναι 1/3

67 Discounted Cumulative Gain Έστω αξιολογήσεις συνάφειας στη κλίμακα [0, r], r>2 και ότι οι αξιολογήσεις των n πρώτων εγγράφων είναι r 1, r 2, r n (σε σειρά διάταξης) Cumulative Gain (CG) στη θέση διάταξης (rank) n CG = r 1 +r 2 + r n Discounted Cumulative Gain (DCG) στη θέση διάταξης n DCG = r 1 + r 2 /log r 3 /log r n /log 2 n Χρησιμοποιούνται και άλλες βάσεις εκτός του 2 για το λογάριθμο

68 Discounted Cumulative Gain DCG το ολικό κέρδος που συγκεντρώνεται σε μια συγκεκριμένη θέση διάταξης p: Εναλλακτική διατύπωση: Χρησιμοποιείται από κάποιες μηχανές Μεγαλύτερη έμφαση στην ανάκτηση πολύ σχετικών εγγράφων

69 Παράδειγμα 10 διατεταγμένα έγγραφα σε κλίμακα συνάφειας 0-3: 3, 2, 3, 0, 0, 1, 2, 2, 3, 0 discounted gain: 3, 2/1, 3/1.59, 0, 0, 1/2.59, 2/2.81, 2/3, 3/3.17, 0 = 3, 2, 1.89, 0, 0, 0.39, 0.71, 0.67, 0.95, 0 DCG: 3, 5, 6.89, 6.89, 6.89, 7.28, 7.99, 8.66, 9.61, 9.61

70 Κανονικοποίηση του DCG Normalized Discounted Cumulative Gain (NDCG) στη θέση διάταξης n Κανονικοποιούμε το DCG στη θέση διάταξης n με την DGG τιμή στη θέση διάταξης n για την ιδανική διάταξη Ιδανική διάταξη: επιστρέφει πρώτα τα έγγραφα που έχουν τον υψηλότερο βαθμό συνάφειας, μετά τα έγγραφα με τον αμέσως υψηλότερο βαθμό, κοκ Χρήσιμο για αντιπαράθεση ερωτημάτων με διαφορετικό αριθμό συναφών αποτελεσμάτων Ιδιαίτερα δημοφιλές μέτρο στην αναζήτηση στο web

71 Παράδειγμα i Ground Truth (optimal) Ranking Function 1 Ranking Function 2 Document Order 4 έγγραφα: d 1, d 2, d 3, d 4 r i Document Order r i Document Order 1 d4 2 d3 2 d3 2 2 d3 2 d4 2 d2 1 3 d2 1 d2 1 d4 2 4 d1 0 d1 0 d1 0 NDCG GT =1.00 NDCG RF1 =1.00 NDCG RF2 = DCG GT 2 DCG RF DCG RF 2 log log log log 2 2 log 2 3 log log 2 2 log 2 3 log r i MaxDCG DCGGT

72 Αξιολογήσεις από ανθρώπους Ακριβές Μη συνεπείς Ανάμεσα στους αξιολογητές, ή Και σε διαφορετικές χρονικές στιγμές Όχι πάντα αντιπροσωπευτικές των πραγματικών χρηστών Αξιολόγηση με βάση το ερώτημα και όχι την ανάγκη Εναλλακτικές; 72

73 Με χρήση clickthrough 73

74 Τι μας λένε οι αριθμοί; # of clicks received Έχει μεγάλη σημασία η θέση, απόλυτοι αριθμοί όχι ιδιαίτερα αξιόπιστοι 74

75 Σχετική και απόλυτη διάταξη User s click sequence Δύσκολο να αποφασίσουμε αν Result1 > Result3 Πιθανών να μπορούμε να πούμε ότι Result3 > Result2 75

76 Pairwise relative ratings Ζεύγη της μορφής: DocA καλύτερο του DocB για μια ερώτηση Δε σημαίνει (απαραίτητα) ότι το DocA είναι συναφές με το ερώτημα Αντί για αξιολογήσεις μιας διάταξης εγγράφων συγκεντρώνουμε ένα ιστορικό από ζεύγη προτιμήσεων με βάση τα clicks των χρηστών Αξιολόγηση με βάση το πόσο «συμφωνεί» το αποτέλεσμα με τα ζεύγη των διατάξεων Με βάση διαφορετικές μηχανές-αλγορίθμους διάταξης 76

77 Πως θα συγκρίνουμε ζεύγη προτιμήσεων; Δοθέντος δύο συνόλων P και Α από ζεύγη προτιμήσεων θέλουμε ένα μέτρο εγγύτητας (proximity measure) που να λέει πόσο μοιάζουν Το μέτρο πρέπει να ανταμείβει τις συμφωνίες και να τιμωρεί τις διαφωνίες 77

78 Απόσταση Kendall tau Έστω X ο αριθμός των συμφωνιών και Y o αριθμός των διαφωνιών η Kendall tau distance μεταξύ A και P είναι (X-Y)/(X+Y) Παράδειγμα P = {(1,2), (1,3), (1,4), (2,3), (2,4), (3,4)} A = (1, 3, 2, 4) X=5, Y=1 Ποια είναι η μέγιστη και ποια η ελάχιστη τιμή; 78

79 Sec. 8.4 Διασπορά (Variance) Για μια συλλογή ελέγχου, συχνά ένα σύστημα έχει κακή απόδοση σε κάποιες πληροφοριακές ανάγκες (π.χ., MAP = 0.1) και άριστη σε άλλες (π.χ., MAP = 0.7) Συχνά, η διασπορά στην απόδοση είναι πιο μεγάλη για διαφορετικά ερωτήματα του ίδιου συστήματος παρά η διασπορά στην απόδοση διαφορετικών συστημάτων στην ίδια ερώτηση Δηλαδή, υπάρχουν εύκολες ανάγκες πληροφόρηση και δύσκολες ανάγκες πληροφόρησης! 79

80 Μη γνωστή ανάκληση Ο συνολικός αριθμός των συναφών εγγράφων δεν είναι πάντα γνωστός: Δειγματοληψία πάρε έγγραφα από τη συλλογή και αξιολόγησε τη συνάφεια τους. Εφάρμοσε διαφορετικούς αλγόριθμους για την ίδια συλλογή και την ίδια ερώτηση και χρησιμοποίησε το άθροισμα των συναφών εγγράφων

81 Μεθοδολογία πρότυπες συλλογές (benchmarks) 81

82 Κεφ. 8.4 Απαιτήσεις από ένα πρότυπο (benchmark) 1. Ένα σύνολο από έγγραφα Τα έγγραφα πρέπει να είναι αντιπροσωπευτικά των πραγματικών εγγράφων 2. Μια συλλογή από ανάγκες πληροφόρησης (ή, καταχρηστικά ερωτημάτων) Να σχετίζονται με τα διαθέσιμα έγγραφα Οι ανάγκες πληροφόρησης πρέπει να είναι αντιπροσωπευτικές των πραγματικών - τυχαίοι όροι δεν είναι καλή ιδέα Συχνά από ειδικούς της περιοχής 3. Εκτιμήσεις συνάφειας από χρήστες (Human relevance assessments) Χρειάζεται να προσλάβουμε/πληρώσουμε κριτές ή αξιολογητές. Ακριβό χρονοβόρο Οι κριτές πρέπει να είναι αντιπροσωπευτικοί των πραγματικών χρηστών 82

83 Benchmarks Standard document collection Algorithm under test Retrieved result Evaluation Precision and recall Standard queries Standard result

84 Κεφ. 8.2 Standard benchmarks συνάφειας TREC - National Institute of Standards and Technology (NIST) τρέχει ένα μεγάλο IR test bed εδώ και πολλά χρόνια Χρησιμοποιεί το Reuters και άλλες πρότυπες συλλογές εγγράφων Καθορισμένα Retrieval tasks Μερικές φορές ως ερωτήματα Ειδικοί (Human experts) βαθμολογούν κάθε ζεύγος ερωτήματος, εγγράφου ως Συναφές Relevant ή μη Συναφές Nonrelevant Ή τουλάχιστον ένα υποσύνολο των εγγράφων που επιστρέφονται για κάθε ερώτημα 84

85 Κεφ. 8.2 Standard benchmarks συνάφειας Cranfield Πρωτοπόρο: το πρώτο testbed που επέτρεπε ακριβή ποσοτικοποιημένα μέτρα της αποτελεσματικότητας της ανάκτησης Στα τέλη του 1950, UK 1398 abstracts από άρθρα περιοδικών αεροδυναμικής, ένα σύνολο από 225 ερωτήματα, εξαντλητική κρίση συνάφειας όλων των ζευγών Πολύ μικρό, μη τυπικό για τα σημερινά δεδομένα της ΑΠ 85

86 Κεφ. 8.2 TREC TREC Ad Hoc task από τα πρώτα 8 TRECs είναι ένα standard task, μεταξύ του εκατομμύρια έγγραφα, κυρίως newswire άρθρα 50 λεπτομερείς ανάγκες πληροφόρησης το χρόνο (σύνολο 450) Επιστρέφετε η αξιολόγηση χρηστών σε pooled αποτελέσματα (δηλαδή όχι εξαντλητική αξιολόγηση όλων των ζευγών) Πρόσφατα και Web track A TREC query (TREC 5) <top> <num> Number: 225 <desc> Description: What is the main function of the Federal Emergency Management Agency (FEMA) and the funding level provided to meet emergencies? Also, what resources are available to FEMA such as people, equipment, facilities? </top> 86

87 Κεφ. 8.2 Άλλα benchmarks GOV2 Ακόμα μια TREC/NIST συλλογή 25 εκατομμύρια web σελίδες Αλλά ακόμα τουλάχιστον τάξης μεγέθους μικρότερη από το ευρετήριο της Google/Yahoo/MSN NTCIR Ανάκτηση πληροφορίας για τις γλώσσες της Ανατολικής Ασίας και cross-language ανάκτηση Cross Language Evaluation Forum (CLEF) Το ίδιο για Ευρωπαϊκές γλώσσες 87

88 Κεφ. 8.5 Συλλογές ελέγχου 88

89 Κεφ. 8.5 Αξιοπιστία των αξιολογήσεων των κριτών Οι αξιολογήσεις συνάφειας είναι χρήσιμες αν είναι συνεπής (consistent). Πως μπορούμε να μετρήσουμε τη συνέπεια ή τη συμφωνία ανάμεσα στους κριτές 89

90 Κεφ. 8.5 Μέτρο Kappa της διαφωνίας (συμφωνίας) (dis-agreement) μεταξύ των κριτών Μέτρο Kappa Συμφωνία μεταξύ των κριτών Αφορά κατηγορική κρίση Λαμβάνει υπό όψιν την συμφωνία από τύχη P(A): ποσοστό των περιπτώσεων που οι κριτές συμφωνούν P(E): τι συμφωνία θα είχαμε από τύχη κ = 1 Για πλήρη συμφωνία, 0 για τυχαία συμφωνία, αρνητική για μικρότερη της τυχαίας 90

91 Κεφ. 8.5 Kappa: παράδειγμα Number of docs ΚΡΙΤΗΣ 1 ΚΡΙΤΗΣ Relevant Relevant 70 Nonrelevant Nonrelevant 20 Relevant Nonrelevant 10 Nonrelevant Relevant P(A) = 370/400 = P(nonrelevant) = ( )/800 = P(relevant) = ( )/800 = P(E) = ^ ^2 = Kappa = ( )/( ) =

92 Κεφ. 8.5 Kappa Kappa > 0.8 = καλή συμφωνία 0.67 < Kappa < 0.8 -> tentative conclusions Εξαρτάται από το στόχο της μελέτης Για >2 κριτές: μέσοι όροι ανά-δύο κ 92

93 Κεφ. 8.5 Kappa: παράδειγμα Information need number of docs judged disagreements Συμφωνία κριτών στο TREC 93

94 Κεφ. 8.5 Επίπτωση της Διαφωνίας Επηρεάζει την απόλυτη (absolute) μέτρηση απόδοσης αλλά όχι τη σχετική απόδοση ανάμεσα σε συστήματα Μπορούμε να αποφύγουμε τις κρίσεις από χρήστες Όχι Αλλά μπορούμε να τα επαναχρησιμοποιήσουμε 94

95 Κεφ. 8.5 Crowdsourcing To Mechanical Truck της Amazon 95

96 Αξιολόγηση σε μεγάλες μηχανές Κεφ αναζήτησης Οι μηχανές αναζήτησης διαθέτουν συλλογές ελέγχου ερωτημάτων και αποτελέσματα καταταγμένα με το χέρι (hand-ranked) Στο web είναι δύσκολο να υπολογίσουμε την ανάκληση Συνήθως οι μηχανές αναζήτησης χρησιμοποιούν την ακρίβεια στα κορυφαία k π.χ., k = 10 Επίσης το MAP, NDCG 96

97 Αξιολόγηση σε μεγάλες μηχανές Κεφ αναζήτησης Οι μηχανές αναζήτησης χρησιμοποιούν επίσης και άλλα μέτρα εκτός της συνάφειας Clickthrough on first result Όχι πολύ αξιόπιστο όταν ένα clickthrough (μπορεί απλώς η περίληψη να φάνηκε χρήσιμη αλλά όχι το ίδιο το έγγραφο) αλλά αρκετά αξιόπιστα συναθροιστικά ή με χρήση ζευγών Μετρήσεις σε εργαστήριο Έλεγχος A/B 97

98 Κεφ A/B testing Στόχος: έλεγχος μιας νέας ιδέας (a single innovation) Προϋπόθεση: Υπάρχει μια μεγάλη μηχανή αναζήτησης σε λειτουργία Οι πιο πολλοί χρήστες χρησιμοποιούν τα παλιό σύστημα Παράκαμψε ένα μικρό ποσοστό της κυκλοφορίας (π.χ., 1%) στο νέο σύστημα που χρησιμοποιεί την καινούργια Αξιολόγησε με ένα αυτόματο μέτρο όπως το clickthrough στα πρώτα αποτελέσματα 98

99 Κεφ Κριτική της Συνάφειας Οριακή Συνάφεια (Marginal Relevance) «νέα» έγγραφα Και άλλα κριτήρια όπως Novelty Coverage 99

100 Κεφ Άσκηση 8.9 Συλλογή από έγγραφα Μια ερώτηση για την οποία υπάρχουν συνολικά 8 συναφή έγγραφα Τα πρώτα 20 αποτελέσματα: Υπολογίστε: R R N N N N N N R N R N N N R N N N N R Την ακρίβεια στα πρώτα 20 Το F1 στα πρώτα 20? Ποια είναι η ακρίβεια χωρίς παρεμβολή για 25% ανάκληση; Ποια είναι η ακρίβεια με παρεμβολή για 33% ανάκληση; Υπολογίστε το ΜΑΠ 100

101 Κεφ Άσκηση 8.9 Επιστρέφει όλα τα έγγραφα και αυτά (όπως πριν) είναι τα πρώτα 20 αποτελέσματα: R R N N N N N N R N R N N N R N N N N R Ποια είναι η μεγαλύτερη δυνατή MAP τιμή και ποια η μικρότερη δυνατή MAP τιμή Υποθέστε ότι σε κάποιο πείραμα αξιολογούμε μόνο τα 20 πρώτα αποτελέσματα. Φράξτε το λάθος στον υπολογισμό. 101

102 Κεφ Άσκηση 8.8 Έστω μια ανάγκη πληροφόρησης για την οποία υπάρχουν 4 συναφή έγγραφα. ΣΥΣΤΗΜΑ 1: R N R N N N N N R R ΣΥΣΤΗΜΑ 2: N R N N R R R N N N Υπολογίστε το MAP. Ποιο σύστημα είναι καλύτερο; Είναι διαισθητικά σωστό; Τι μας λέει για το τι είναι σημαντικό για ένα καλό MAP; Υπολογίστε την R-ακρίβεια. Ποιο σύστημα είναι καλύτερο; 102

103 Κεφ Άσκηση 8.8 (επέκταση) Έστω μια ανάγκη πληροφόρησης για την οποία υπάρχουν 2 συναφή έγγραφα. Έχετε την αρχή της απάντησης 2 συστημάτων ΣΥΣΤΗΜΑ 1: R ΣΥΣΤΗΜΑ 2: N R R... Για να είναι το Σύστημα 2 καλύτερο (ως αναφορά το MAP) πότε θα πρέπει να εμφανίζεται το επόμενο συναφές έγγραφο στο Σύστημα 1; Τι ισχύει για την R-ακρίβεια; 103

104 Κεφ Άσκηση Άσκηση 8.5 Υπάρχει ή όχι πάντα ένα σημείο στο οποίο η ακρίβεια είναι ή ίση με την ανάκληση (break-even point). Αν ναι, αποδείξτε το, αν όχι, δώστε αντιπαράδειγμα Άσκηση 8.6 Ποια είναι η σχέση της τιμής του F1 και του break-even point; 104

105 Κεφ Άσκηση 8.7 DICE COEFFICIENT Ο συντελεστής Dice δυο συνόλων είναι μια μέτρηση της τομής του σε σχέση με το μέγεθος τους Dice(X, Y) = 2 X Y / ( X + Y ) Δείξτε ότι το F ισούται με το συντελεστή Dice του συνόλου των ανακτημένων εγγράφων και του συνόλου των συναφών εγγράφων 105

106 ΤΕΛΟΣ 7 ου Μαθήματος Ερωτήσεις? Χρησιμοποιήθηκε κάποιο υλικό από: Pandu Nayak and Prabhakar Raghavan, CS276:Information Retrieval and Web Search (Stanford) Hinrich Schütze and Christina Lioma, Stuttgart IIR class διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης) 106

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 10: Αξιολόγηση στην Ανάκτηση Πληροφοριών II. 1 Κεφ. 8 Αξιολόγηση συστήματος Αποδοτικότητα (Performance)

Διαβάστε περισσότερα

ΜΥΕ03: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας.

ΜΥΕ03: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας. ΜΥΕ03: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας. 1 Κεφ. 8 Τι θα δούμε σήμερα; Ποια τεχνική ή ποιο σύστημα ανάκτησης πληροφορίας είναι καλύτερο;

Διαβάστε περισσότερα

ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη8α: Αξιολόγηση στην Ανάκτηση Πληροφοριών. Πως ξέρουμε αν τα αποτελέσματα είναι καλά

ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη8α: Αξιολόγηση στην Ανάκτηση Πληροφοριών. Πως ξέρουμε αν τα αποτελέσματα είναι καλά Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη8α: Αξιολόγηση στην Ανάκτηση Πληροφοριών. 1 Κεφ. 8 Τι θα δούμε σήμερα; Πως ξέρουμε αν τα αποτελέσματα

Διαβάστε περισσότερα

ΜΥΕ03: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας.

ΜΥΕ03: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας. ΜΥΕ03: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας. 1 Κεφ. 8 Τι θα δούμε σήμερα; Ποια τεχνική ή ποιο σύστημα ανάκτησης πληροφορίας είναι καλύτερο;

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 10η 1 Αποτίμηση επίδοσης Μηχανών Αναζήτησης 2 Sec. 8.6 Μέτρα επίδοσης μιας μηχανής αναζήτησης Πόσο γρήγορα εκτελεί την διαδικασία

Διαβάστε περισσότερα

8. Η Αξιολόγηση στην Ανάκτηση Πληροφοριών

8. Η Αξιολόγηση στην Ανάκτηση Πληροφοριών Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 8. Η Αξιολόγηση στην Ανάκτηση Πληροφοριών Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών

Διαβάστε περισσότερα

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών ΗΥ-6 Συστήµατα Ανάκτησης Πληροφοριών 7-8 Εαρινό Εξάµηνο Άσκηση Λύσεις ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Θεωρείστε µια

Διαβάστε περισσότερα

Ανάκτηση πληροφορίας

Ανάκτηση πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 2: Μέτρηση Αποτελεσματικότητας Συστημάτων Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)

Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης) Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 28-29 Εαρινό Εξάμηνο Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης &

Διαβάστε περισσότερα

Παλαιότερες ασκήσεις

Παλαιότερες ασκήσεις Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY6 - Συστήµατα Ανάκτησης Πληροφοριών Παλαιότερες ασκήσεις η Σειρά Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Άσκηση ( η σειρά ασκήσεων

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων

Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων ΜΑΘΗΜΑ Ανάκτηση Πληροφορίας Παππάς Χρήστος Ιωάννινα, Ιανουάριος 2010 Διάρθρωση Εισαγωγή Πρόβλημα Σημαντικότητα Ενδιαφέροντα θέματα Τεχνικό

Διαβάστε περισσότερα

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος

Διαβάστε περισσότερα

Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές:

Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές: Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2005-2006 Εαρινό Εξάµηνο 1 η Σειρά Ασκήσεων (Αξιολόγηση Αποτελεσµατικότητας Ανάκτησης) Άσκηση 1 (4 βαθµοί) Θεωρείστε

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι θα δούμε σήμερα; Βαθμολόγηση

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #13 Αξιολόγηση Συστηµάτων IR Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3. Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Τι (άλλο) θα δούμε σήμερα;

Τι (άλλο) θα δούμε σήμερα; Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη6: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι (άλλο) θα δούμε σήμερα;

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη

Διαβάστε περισσότερα

Πιθανοκρατικό μοντέλο

Πιθανοκρατικό μοντέλο Πιθανοκρατικό μοντέλο Το μοντέλο MAP Αλέξανδρος Γκιμπερίτης Βασίλης Μπούργος Δημήτρης Σουραβλιάς 1 Εισαγωγικές έννοιες Κάθε έγγραφο d της συλλογής παριστάνεται από το δυαδικό διάνυσμα x = (x 1, x 2,...,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΒΙΟ 230 - Εισαγωγή στην Υπολογιστική Βιολογία Φυλλάδιο Εργαστηριακών Ασκήσεων και Φροντιστηρίων Βασίλης Ι. Προμπονάς Λευκωσία 2015-2017 1η Εργαστηριακή Άσκηση

Διαβάστε περισσότερα

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 11: Πιθανοτική ανάκτηση πληροφορίας.

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 11: Πιθανοτική ανάκτηση πληροφορίας. ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο : Πιθανοτική ανάκτηση πληροφορίας. Κεφ. Πιθανοτική Ανάκτηση Πληροφορίας Βασική ιδέα: Διάταξη εγγράφων με βάση την πιθανότητα να είναι

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5: Μοντελοποίηση: Πιθανοκρατικό Μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Βιοστατιστική Ι. Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες

Βιοστατιστική Ι. Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες Βιοστατιστική Ι Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες Διαγνωστικές εξετάσεις Κλινικές ή εργαστηριακές Αναγνώριση ατόμου ως πάσχον από ένα νόσημα πολλές

Διαβάστε περισσότερα

Κατηγοριοποίηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μία ή περισσότερες προκαθορισμένες κατηγορίες (κλάσεις)

Κατηγοριοποίηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μία ή περισσότερες προκαθορισμένες κατηγορίες (κλάσεις) Κατηγοριοποίηση ΙΙ Εξόρυξη Δεδομένων: Ακ. Έτος 200-20 ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗ II Κατηγοριοποίηση Κατηγοριοποίηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μία ή περισσότερες προκαθορισμένες

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του 510 σελίδες 1η

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Ανάκτηση Πληροφορίας (Information Retrieval IR) Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

ΛΥΣΕΙΣ 2 ης ΣΕΙΡΑΣ ΑΣΚΗΣΕΩΝ

ΛΥΣΕΙΣ 2 ης ΣΕΙΡΑΣ ΑΣΚΗΣΕΩΝ ΛΥΣΕΙΣ 2 ης ΣΕΙΡΑΣ ΑΣΚΗΣΕΩΝ Άσκηση 1 Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα 5 έγγραφα: Έγγραφο 1: «Computer Games» Έγγραφο 2: «Computer Games Computer Games» Έγγραφο 3: «Games Theory and

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

1 + nx. 2 +nx n 1 + x n

1 + nx. 2 +nx n 1 + x n ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Εαρινό Εξάμηνο 2011-12 Τμήμα Μαθηματικών Διδάσκων: Χ.Κουρουνιώτης Μ2822 ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΥΣΗΣ Φυλλάδιο 2 Η Ανισότητα Bernoulli Ο χειρισμός εκφράσεων με δυνάμεις είναι συχνά δύσκολος.

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ Ιωάννα Τζουλάκη Κώστας Τσιλίδης Ιωαννίδης: κεφάλαιο 2 Guyatt: κεφάλαιο 18 ΕΠΙςΤΗΜΟΝΙΚΗ ΙΑΤΡΙΚΗ Επιστήμη (θεωρία) Πράξη (φροντίδα υγείας) Γνωστικό μέρος Αιτιό-γνωση Διά-γνωση Πρό-γνωση

Διαβάστε περισσότερα

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν

Διαβάστε περισσότερα

Κατανεμημένα Συστήματα Ι

Κατανεμημένα Συστήματα Ι Συναίνεση χωρίς την παρουσία σφαλμάτων Κατανεμημένα Συστήματα Ι 4η Διάλεξη 27 Οκτωβρίου 2016 Παναγιώτα Παναγοπούλου Κατανεμημένα Συστήματα Ι 4η Διάλεξη 1 Συναίνεση χωρίς την παρουσία σφαλμάτων Προηγούμενη

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university

Διαβάστε περισσότερα

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Συμπληρωματικές σημειώσεις για τον μηχανισμό VCG 1 Εισαγωγή στις Συνδυαστικές

Διαβάστε περισσότερα

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα 2 Βήματα Επεξεργασίας Τα βασικά βήματα στην επεξεργασία

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Σχεδίαση και Ανάλυση Αλγορίθμων

Σχεδίαση και Ανάλυση Αλγορίθμων Σχεδίαση και Ανάλυση Αλγορίθμων Ενότητα 4.0 Επιλογή Αλγόριθμοι Επιλογής Select και Quick-Select Σταύρος Δ. Νικολόπουλος 2016-17 Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιο Ιωαννίνων Webpage: www.cs.uoi.gr/~stavros

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2 HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)

Διαβάστε περισσότερα

Σχεδίαση Αλγορίθμων -Τμήμα Πληροφορικής ΑΠΘ - Εξάμηνο 4ο

Σχεδίαση Αλγορίθμων -Τμήμα Πληροφορικής ΑΠΘ - Εξάμηνο 4ο Πολλαπλασιασμός μεγάλων ακεραίων (1) Για να πολλαπλασιάσουμε δύο ακεραίους με n 1 και n 2 ψηφία με το χέρι, θα εκτελέσουμε n 1 n 2 πράξεις πολλαπλασιασμού Πρόβλημα ρβημ όταν έχουμε πολλά ψηφία: A = 12345678901357986429

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται

Διαβάστε περισσότερα

Ασυμπτωτικός Συμβολισμός

Ασυμπτωτικός Συμβολισμός Ασυμπτωτικός Συμβολισμός Επιμέλεια διαφανειών: Δημήτρης Φωτάκης (λίγες προσθήκες: Άρης Παγουρτζής) Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Υπολογιστική Πολυπλοκότητα

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

Case 10: Ανάλυση Νεκρού Σημείου (Break Even Analysis) με περιορισμούς ΣΕΝΑΡΙΟ

Case 10: Ανάλυση Νεκρού Σημείου (Break Even Analysis) με περιορισμούς ΣΕΝΑΡΙΟ Case 10: Ανάλυση Νεκρού Σημείου (Break Even Analysis) με περιορισμούς ΣΕΝΑΡΙΟ Η «OutBoard Motors Co» παράγει τέσσερα διαφορετικά είδη εξωλέμβιων (προϊόντα 1 4) Ο γενικός διευθυντής κ. Σχοινάς, ενδιαφέρεται

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Στατιστική ανάλυση του γεωχηµικού δείγµατος µας δίνει πληροφορίες για τον γεωχηµικό πληθυσµό που µελετάµε. Συνυπολογισµός σφαλµάτων Πειραµατικά

Διαβάστε περισσότερα

6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου

6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης

Διαβάστε περισσότερα

Γνωστό: P (M) = 2 M = τρόποι επιλογής υποσυνόλου του M. Π.χ. M = {A, B, C} π. 1. Π.χ.

Γνωστό: P (M) = 2 M = τρόποι επιλογής υποσυνόλου του M. Π.χ. M = {A, B, C} π. 1. Π.χ. Παραδείγματα Απαρίθμησης Γνωστό: P (M 2 M τρόποι επιλογής υποσυνόλου του M Τεχνικές Απαρίθμησης Πχ M {A, B, C} P (M 2 3 8 #(Υποσυνόλων με 2 στοιχεία ( 3 2 3 #(Διατεταγμένων υποσυνόλων με 2 στοιχεία 3 2

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 5. Απλή Ταξινόμηση 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 11/11/2016 Εισαγωγή Η

Διαβάστε περισσότερα

Αξιολόγηση Ανάκτησης Retrieval Evaluation

Αξιολόγηση Ανάκτησης Retrieval Evaluation CS 463: Information Systems Αξιολόγηση Ανάκτησης Evaluation Yannis Tzitzikas University of Crete CS-463,Spring 05 Lecture : 2 Date : 24-2- ιάρθρωση ιάλεξης Τι εξυπηρετεί η αξιολόγηση; αξιολόγηση αποτελεσµατικότητας

Διαβάστε περισσότερα

ΜΑΘΗΜΑ: ΜΑΡΚΕΤΙΝΓΚ ΠΡΟΙΌΝΤΩΝ ΞΥΛΟΥ ΚΑΙ ΕΠΙΠΛΟΥ ΜΑΡΚΕΤΙΝΓΚ

ΜΑΘΗΜΑ: ΜΑΡΚΕΤΙΝΓΚ ΠΡΟΙΌΝΤΩΝ ΞΥΛΟΥ ΚΑΙ ΕΠΙΠΛΟΥ ΜΑΡΚΕΤΙΝΓΚ ΕΡΓΑΣΤΗΡΙΟ ΕΦΑΡΜΟΣΜΕΝΟΥ ΜΑΡΚΕΤΙΝΓΚ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΜΑΘΗΜΑ: ΜΑΡΚΕΤΙΝΓΚ ΠΡΟΙΌΝΤΩΝ ΞΥΛΟΥ ΚΑΙ ΕΠΙΠΛΟΥ Έρευνα μάρκετινγκ Τιμολόγηση Ανάπτυξη νέων προϊόντων ΜΑΡΚΕΤΙΝΓΚ Τμηματοποίηση της αγοράς Κανάλια

Διαβάστε περισσότερα

Ταξινόμηση: Εισαγωγικά. Ταξινόμηση (Sor ng) Αλγόριθμοι Απλής Ταξινόμησης. Βασικά Βήματα των Αλγορίθμων

Ταξινόμηση: Εισαγωγικά. Ταξινόμηση (Sor ng) Αλγόριθμοι Απλής Ταξινόμησης. Βασικά Βήματα των Αλγορίθμων Ταξινόμηση: Εισαγωγικά Ταξινόμηση (Sor ng) Ορέστης Τελέλης Βασικό πρόβλημα για την Επιστήμη των Υπολογιστών. π.χ. αλφαβητική σειρά, πωλήσεις ανά τιμή, πόλεις με βάση πληθυσμό, Μπορεί να είναι ένα πρώτο

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ AM: Δοµές Δεδοµένων Εξεταστική Ιανουαρίου 2014 Διδάσκων : Ευάγγελος Μαρκάκης 20.01.2014 ΥΠΟΓΡΑΦΗ ΕΠΟΠΤΗ: Διάρκεια εξέτασης : 2 ώρες και

Διαβάστε περισσότερα

Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην Ταξινόμηση Καρκινικών Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην Ταξινόμηση Καρκινικών Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Πολυτεχνείο Κρήτης Τμήμα Ηλεκτρονικών Μηχανικών και Μηχανικών Ηλεκτρονικών Υπολογιστών Τομέας Τηλεπικοινωνιών Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην

Διαβάστε περισσότερα

Αξιολόγηση Ανάκτησης Retrieval Evaluation

Αξιολόγηση Ανάκτησης Retrieval Evaluation Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 Διάρθρωση Διάλεξης Γιάννης Τζίτζικας ιάλεξη : 2 Ημερομηνία : 23-2-2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Διαβάστε περισσότερα

Διάλεξη 04: Παραδείγματα Ανάλυσης

Διάλεξη 04: Παραδείγματα Ανάλυσης Διάλεξη 04: Παραδείγματα Ανάλυσης Πολυπλοκότητας/Ανάλυση Αναδρομικών Αλγόριθμων Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Παραδείγματα Ανάλυσης Πολυπλοκότητας : Μέθοδοι, παραδείγματα

Διαβάστε περισσότερα

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2) Κεφάλαιο 10 Συνεχείς τυχαίες μεταβλητές Σε αυτό το κεφάλαιο θα εξετάσουμε τις ιδιότητες που έχουν οι συνεχείς τυχαίες μεταβλητές. Εκείνες οι Τ.Μ. X, δηλαδή, των οποίων το σύνολο τιμών δεν είναι διακριτό,

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΕΣ 3: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΑΙ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 7 8, Χειμερινό Εξάμηνο Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ Το παρόν

Διαβάστε περισσότερα

Μάθημα 3 ο a. Τυχαία Μεταβλητή-Έννοιες και Ορισμοί

Μάθημα 3 ο a. Τυχαία Μεταβλητή-Έννοιες και Ορισμοί Μάθημα 3 ο a Τυχαία Μεταβλητή-Έννοιες και Ορισμοί Στο μάθημα αυτό θα ορίσουμε την έννοια της τυχαίας μεταβλητής και θα αναφερθούμε σε σχετικές βασικές έννοιες και συμβολισμούς. Ross, σσ 135-151 Μπερτσεκάς-Τσιτσικλής,

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες)

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2015-16 Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τµήµα Οικονοµικών Επιστηµών Ακαδηµαϊκό έτος (διαβάζουμε κεφ. 4 από Μ. Χλέτσο και σημειώσεις στο eclass)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τµήµα Οικονοµικών Επιστηµών Ακαδηµαϊκό έτος (διαβάζουμε κεφ. 4 από Μ. Χλέτσο και σημειώσεις στο eclass) ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τµήµα Οικονοµικών Επιστηµών Ακαδηµαϊκό έτος 2016-17 ΠΟΛΙΤΙΚΗ ΟΙΚΟΝΟΜΙΑ ΤΗΣ ΚΟΙΝΩΝΙΚΗΣ ΠΟΛΙΤΙΚΗΣ (διαβάζουμε κεφ. 4 από Μ. Χλέτσο και σημειώσεις στο eclass) 1 ιάλεξη2 Ανταγωνισμός, οικονομική

Διαβάστε περισσότερα

Τελικό Project Εργαστηρίου Ηλεκτρονικών Φίλτρων Χειµερινό Εξάµηνο

Τελικό Project Εργαστηρίου Ηλεκτρονικών Φίλτρων Χειµερινό Εξάµηνο Τελικό Project Εργαστηρίου Ηλεκτρονικών Φίλτρων Χειµερινό Εξάµηνο 2015-16 Ονοµατεπώνυµο: ΚΑΡΑΜΗΤΡΟΣ ΘΕΜΙΣΤΟΚΛΗΣ ώστε τον Αριθµό Μητρώου σας εδώ ==> AM := 99999 Το φύλλο εργασίας αυτό δέχεται προδιαγραφές

Διαβάστε περισσότερα

ΕΠΛ231 Δομές Δεδομένων και Αλγόριθμοι 4. Παραδείγματα Ανάλυσης Πολυπλοκότητας Ανάλυση Αναδρομικών Αλγόριθμων

ΕΠΛ231 Δομές Δεδομένων και Αλγόριθμοι 4. Παραδείγματα Ανάλυσης Πολυπλοκότητας Ανάλυση Αναδρομικών Αλγόριθμων ΕΠΛ31 Δομές Δεδομένων και Αλγόριθμοι 4. Παραδείγματα Ανάλυσης Πολυπλοκότητας Ανάλυση Αναδρομικών Αλγόριθμων Διάλεξη 04: Παραδείγματα Ανάλυσης Πολυπλοκότητας/Ανάλυση Αναδρομικών Αλγόριθμων Στην ενότητα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Λύσεις 2η σειράς ασκήσεων Προθεσμία παράδοσης: 18 Μαίου 2015 Πρόβλημα 1. (14

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

Αξιολόγηση Ανάκτησης Retrieval Evaluation

Αξιολόγηση Ανάκτησης Retrieval Evaluation Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Αξιολόγηση Ανάκτησης Retrieval Evaluation Γιάννης Τζίτζικας ιάλεξη

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Ενδεικτικές Λύσεις 1ου Σετ Ασκήσεων

Ενδεικτικές Λύσεις 1ου Σετ Ασκήσεων Κ Σ Ι Ενδεικτικές Λύσεις 1ου Σετ Ασκήσεων Παναγιώτα Παναγοπούλου Άσκηση 1. Υποθέστε ότι οι διεργασίες ενός σύγχρονου κατανεμημένου συστήματος έχουν μοναδικές ταυτότητες (UIDs), γνωρίζουν ότι είναι συνδεδεμένες

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ Ενότητα 2: Ασυμπτωτικός συμβολισμός Μαρία Σατρατζέμη Τμήμα Εφαρμοσμένης Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ Ενότητα 13: Αλγόριθμοι-Μεγάλων ακεραίων- Εκθετοποίηση- Πολλαπλασιασμός πινάκων -Strassen Μαρία Σατρατζέμη Τμήμα Εφαρμοσμένης Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2015-16 Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 9: Ανάδραση Σχετικότητας (Relevance Feedback ή RF) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Διάλεξη 04: Παραδείγματα Ανάλυσης Πολυπλοκότητας/Ανάλυση Αναδρομικών Αλγόριθμων

Διάλεξη 04: Παραδείγματα Ανάλυσης Πολυπλοκότητας/Ανάλυση Αναδρομικών Αλγόριθμων Διάλεξη 04: Παραδείγματα Ανάλυσης Πολυπλοκότητας/Ανάλυση Αναδρομικών Αλγόριθμων Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Παραδείγματα Ανάλυσης Πολυπλοκότητας : Μέθοδοι, παραδείγματα

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ Γ.Π. ΚΕΦ 1,2,3

ΑΣΚΗΣΕΙΣ Γ.Π. ΚΕΦ 1,2,3 Ασκηση 1 ΑΣΚΗΣΕΙΣ Γ.Π. ΚΕΦ 1,2,3 Δίνεται η συνάρτηση α. Να εξετάσετε την f ως προς τα ακρότατα. β. Να βρείτε την εξίσωση της εφαπτομένης της C f στο (1,f(1)). γ. Αν το α παίρνει τιμές που προκύπτουν από

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 2 ο : Βασικές έννοιες Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Γλωσσική Τεχνολογία, Μάθημα 2 ο, Βασικές

Διαβάστε περισσότερα

Πίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση

Πίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση Πίνακες Διασποράς Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση κλειδί k T 0 1 2 3 4 5 6 7 U : χώρος πιθανών κλειδιών Τ : πίνακας μεγέθους

Διαβάστε περισσότερα

ΕΡΓΑΣΙΕΣ 4 ου ΚΕΦΑΛΑΙΟΥ. 1 η Ομάδα: Ερωτήσεις πολλαπλής επιλογής

ΕΡΓΑΣΙΕΣ 4 ου ΚΕΦΑΛΑΙΟΥ. 1 η Ομάδα: Ερωτήσεις πολλαπλής επιλογής ΕΡΓΑΣΙΕΣ 4 ου ΚΕΦΑΛΑΙΟΥ 1 η Ομάδα: Ερωτήσεις πολλαπλής επιλογής 1. Σύμφωνα με το νόμο της προσφοράς: α) Η προσφερόμενη ποσότητα ενός αγαθού αυξάνεται όταν μειώνεται η τιμή του στην αγορά β) Η προσφερόμενη

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Πρόκειται για μια οικογένεια μη γραμμικών ταξινομητών Είναι συστήματα απόφασης πολλών σταδίων (multistage),

Διαβάστε περισσότερα

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής Θεωρία Πληροφορίας Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Ατζέντα Διακριτή πηγή πληροφορίας χωρίς μνήμη Ποσότητα πληροφορίας της πηγής Κωδικοποίηση

Διαβάστε περισσότερα