Information Retrieval

Σχετικά έγγραφα
8. Η Αξιολόγηση στην Ανάκτηση Πληροφοριών

Ανάκτηση Πληροφορίας

Information Retrieval

Ανάκτηση πληροφορίας

ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη8α: Αξιολόγηση στην Ανάκτηση Πληροφοριών. Πως ξέρουμε αν τα αποτελέσματα είναι καλά

ΜΥΕ03: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας.

Information Retrieval

Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές:

Ανάκτηση Πληροφορίας

Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)

ΜΥΕ03: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 8: Αξιολόγηση στην Ανάκτηση Πληροφορίας.

Information Retrieval

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκτηση Πληροφορίας

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Παλαιότερες ασκήσεις

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκτηση Δεδομένων (Information Retrieval)

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Ανάκτηση Πληροφορίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων

9. Ανάδραση Συνάφειας και Διεύρυνση Ερωτημάτων

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ-ΜΑΘΗΜΑ ΕΒ ΟΜΟ ΘΕΩΡΙΑ ΠΡΟΣΦΟΡΑΣ-ΕΝΝΟΙΑ ΚΟΣΤΟΥΣ

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

Social Web: lesson #4

Διαδικασιακός Προγραμματισμός

Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

Πιθανοκρατικό μοντέλο

Κοιλότητα. Διαφορικός Λογισμός μιας μεταβλητής Ι

Διαδανεισμός, Πρωτόκολλο z39.50 Στρατηγικές αναζήτησης

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Δυναμικά Σύνολα. Δυναμικό σύνολο. Tα στοιχεία του μεταβάλλονται μέσω εντολών εισαγωγής και διαγραφής. διαγραφή. εισαγωγή

Ανάκτηση Πληροφορίας

Κινητός και ιάχυτος Υπολογισµός (Mobile & Pervasive Computing) Ιστοσελίδα του µαθήµατος. Περιεχόµενα. ηµήτριος Κατσαρός, Ph.D.

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

Δομές Δεδομένων & Αλγόριθμοι

Φροντιστήριο 3o. όπου x = max{m N 0 : m x} και N 0 = {0, 1, 2,...} Λύση. Ιδιότητες αθροιστικής: lim F (x) = 0 αφού F (x) = 0 για x < 1.

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

Geographic Information System(GIS)

Ανάκτηση Πληροφορίας

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες)

ΕΚΤΙΜΗΣΗ ΑΒΕΒΑΙΟΤΗΤΑΣ ΓΕΩΧΗΜΙΚΩΝ ΜΕΤΡΗΣΕΩΝ

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)

ΒΙΟ003 - Εισαγωγή στη Βιοπληροφορική 1 η Εργαστηριακή Άσκηση. Διαδικτυακές βιβλιογραφικές πηγές (Μοριακής) Βιολογίας και Βιοπληροφορικής

Ανάκτηση Πληροφορίας Εισαγωγή

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Αλγόριθμοι και Πολυπλοκότητα

Διάλεξη 5: Τυχαία Μεταβλητή Κατανομές Πιθανότητας

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Στατιστική, Άσκηση 2. (Κανονική κατανομή)

Κεφάλαιο 2.5: Τύποι εδοµένων, Τελεστές και Αριθµητικές Εκφράσεις. ( ιαλέξεις 5-6) ιδάσκων: ηµήτρης Ζεϊναλιπούρ

Εφαρμογές παραγώγων. Διαφορικός Λογισμός μιας μεταβλητής Ι

1.4 Αριθμητική υπολογιστών και σφάλματα

Στατιστική. Βασικές έννοιες

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Αξιολόγηση Ανάκτησης Retrieval Evaluation

ΕΞΕΤΑΣΤΕΑ ΥΛΗ (SYLLABUS) Ενότητα Advanced Βάσεις Δεδομένων, Προχωρημένο Επίπεδο. Copyright 2013 ECDL Foundation Ref: SL_AM3_Syl2.

Μαθηματική Εισαγωγή Συναρτήσεις

1o Φροντιστήριο ΗΥ240

0 είναι η παράγωγος v ( t 0

Υπολογιστική Πολυπλοκότητα

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Ενότητα 1: Εισαγωγή Ασκήσεις και Λύσεις

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Διάλεξη 04: Παραδείγματα Ανάλυσης

Τμήμα Λογιστικής. Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. Μάθημα 8. 1 Στέργιος Παλαμάς

Χρήση εναλλακτικών μετρικών για την αποτίμηση της διάδοσης της έρευνας σε επιστημονικά συνέδρια

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

Transcript:

Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 10η 1

Αποτίμηση επίδοσης Μηχανών Αναζήτησης 2

Sec. 8.6 Μέτρα επίδοσης μιας μηχανής αναζήτησης Πόσο γρήγορα εκτελεί την διαδικασία indexing; Αριθμός εγγράφων/ώρα (Μέσο μέγεθος εγγράφου) Πόσο γρήγορα εκτελεί την αναζήτηση; Καθυστέρηση ως συνάρτηση του μεγέθους του index Εκφραστικότητα της γλώσσας υποβολής ερωτημάτων Ικανότητα να εκφραστούν σύνθετες πληροφοριακές ανάγκες Ταχύτητα σε σύνθετα ερωτήματα Είναι φορτωμένο το user interface; Είναι δωρεάν; 3

Sec. 8.6 Μέτρα επίδοσης μιας μηχανής αναζήτησης λες οι προηγούμενες μετρικές είναι μετρήσιμες: μπορούμε να ποσοτικοποιήσουμε την ταχύτητα/μέγεθος Μπορούμε να καταστήσουμε την εκφραστικότητα μετρίσιμη Η κρίσιμη μετρική: ευχαρίστηση του χρήστη Η ταχύτητα της απόκρισης/μεγέθους του index είναι παράγοντες Αλλά ακόμη και εάν αποκρίνεται με την ταχύτητα του φωτός, εάν παρέχει άχρηστες απαντήσεις, δεν συνδράμει στην ευχαρίστηση του χρήστη Χρειαζόμαστε έναν τρόπο για να ποσοτικοποιήσουμε την ευχαρίστηση του χρήστη 4

Sec. 8.6.2 Μετρώντας την ευχαρίστηση του χρήστη Ποιος είναι ο χρήστης τον οποίο προσπαθούμε να ευχαριστήσουμε; Εξαρτάται από το περιβάλλον της μελέτης Web engine: Ο χρήστης βρίσκει αυτό που αναζητά και επιστρέφει στην μηχανή αναζήτησης Μπορούμε να μετρήσουμε τον ρυθμό επιστροφής των χρηστών Οι χρήστες ολοκληρώνουν τις δραστηριότητές τους η αναζήτηση ως μέσο και όχι ως αυτοσκοπός Δείτε Russell http://dmrussell.googlepages.com/jcdl-talk-june-2007-short.pdf ecommerce site: Ο χρήστης βρίσκει αυτό που ψάχνει και κάνει κάποια αγορά Άρα, μετράμε την ευχαρίστηση του τελικού χρήστη ή του ecommerce site; Μετράμε τον χρόνο για να εκτελεστεί αγορά, ή το ποσοστό των αναζητήσεων που οδηγούν σε αγορά προϊόντος; Enterprise (company/govt/academic): Ενδιαφέρον για την παραγωγικότητα του χρήστη Πόσο χρόνο σώζουν οι χρήστες όταν αναζητούν πληροφορίες; Κι άλλα κριτήρια σχετιζόμενα με το εύρος προσπέλασης, ασφαλή προσπέλαση, κ.τ.λ. 5

Sec. 8.1 Ευχαρίστηση: Μετρήσιμη Πιο κοινή προσέγγιση: σχετικότητα (relevance) των αποτελεσμάτων αναζήτησης Αλλά, πώς μετράμε την relevance; Θα παρουσιάσουμε μια μεθοδολογία, και κατόπιν θα εξετάσουμε τα σχετιζόμενα ζητήματα Η μέτρηση της relevance απαιτεί 3 στοιχεία: 1. Μια benchmark συλλογή εγγράφων 2. Μια benchmark συλλογή ερωτημάτων 3. Μια συνήθη δυαδική αποτίμηση είτε Relevant είτε Nonrelevant για κάθε ερώτημα και κάθε έγγραφο 6

Sec. 8.1 Αποτίμηση ενός IR συστήματος Σημείωση: η πλnροφοριακή ανάγκη μεταφράζεται σε ένα ερώτημα Η relevance αποτιμάται ως προς την πλnροφοριακή ανάγκη και όχι ως προς το ερώτημα Πληροφοριακή ανάγκη: I'm looking for information on whether drinking red wine is more effective at reducing your risk of heart attacks than white wine Ερώτημα: wine red white heart attack effective Αποτιμάται κατά πόσο το έγγραφο που ανακτήθηκε απαντά στην πληροφοριακή ανάγκη, και όχι κατά πόσο περιέχει τις προαναφερθείσες λέξεις 7

Sec. 8.2 Τυπικά relevance benchmarks TREC Το National Institute of Standards and Technology (NIST) υποστηρίζει ένα μεγάλο IR test bed για πολλά χρόνια Reuters, και άλλες benchmark συλλογές εγγράφων Καθορίζονται Retrieval tasks Μερικές φορές ως ερωτήματα Άνθρωποι-experts σημειώνουν, για κάθε ερώτημα και κάθε έγγραφο, Relevant ή Nonrelevant Ή τουλάχιστον για ένα υποσύνολο των εγγράφων που κάποιο σύστημα επέστρεψε για το ερώτημα αυτό 8

Sec. 8.3 Αποτίμηση μη διαβαθμισμένης ανάκτησης: Precision και Recall Precision: ποσοστό ανακτηθέντων εγγράφων τα οποία είναι σχετικά = P(relevant retrieved) Recall: ποσοστό σχετικών εγγράφων που έχουν ανακτηθεί = P(retrieved relevant) Precision: P = tp/(tp + fp) Recall: Relevant R = tp/(tp + fn) Nonrelevant Retrieved tp fp Not Retrieved fn tn 9

Sec. 8.3 Μήπως θα έπρεπε να χρησιμοποιήσουμε ως μετρική αποτίμησης την accuracy; Δεδομένου ενός ερωτήματος, μια μηχανή κατηγοριοποιεί κάθε έγγραφο ως Relevant ή Nonrelevant Η accuracy μιας μηχανής: το ποσοστό των ορθών κατηγοριοποιήσεων (tp + tn) / ( tp + fp + fn + tn) Η accuracy χρησιμοποιείται συχνά ως μετρική αποτίμησης στις κατηγοριοποιήσεις με machine learning Γιατί λοιπόν δεν είναι χρήσιμη στην IR; 10

Sec. 8.3 Γιατί όχι την accuracy; Πώς να χτίσουμε μια φθηνή μηχανή αναζήτησης με 99.9999% accuracy... Search for: 0 matching results found Οι χρήστες που κάνουν IR επιθυμούν να βρούν κάτι, και έχουν μια συγκεκριμένη ανοχή στα σκουπίδια 11

Sec. 8.3 Precision/Recall Μπορούμε να έχουμε υψηλή recall (αλλά, χαμηλή precision) ανακτώντας όλα τα έγγραφα για όλα τα ερωτήματα! Η precision είναι μια φθίνουσα συνάρτηση του αριθμού των ανακτηθέντων εγγράφων Σε ένα καλό σύστημα, η precision ελαττώνεται καθώς αυξάνει ο αριθμός των ανακτηθέντων εγγράφων είτε καθώς αυξάνει η recall Δεν είναι θεώρημα, αλλά μια εμπειρική παρατήρηση 12

Sec. 8.3 Συνδυαστική μετρική: F Μια συνδυαστική μετρική που αποτιμά το precision/recall tradeoff είναι το F measure (weighted harmonic mean): F 2 1 ( 2 1 1 (1 ) P R 1) PR P R Συνήθως χρησιμοποιείται το balanced F 1 Δηλαδή, με = 1 ή = ½ Ο harmonic mean είναι συντηρητικός μέσος όρος Δείτε: C.J. van Rijsbergen, Information Retrieval 13

Sec. 8.3 F 1 και άλλες μετρικές Combined Measures 100 80 60 40 20 Minimum Maximum Arithmetic Geometric Harmonic 0 0 20 40 60 80 100 Precision (Recall fixed at 70%) 14

Αποτίμηση διαβαθμισμένων αποτελεσμάτων Sec. 8.4 Αποτίμηση διαβαθμισμένων αποτελεσμάτων: Το σύστημα μπορεί να επιστρέψει οποιοδήποτε αριθμό αποτελεσμάτων Εξετάζοντας διάφορους αριθμούς των top returned εγγράφων (δηλ., επίπεδα του recall), ο αποτιμητής μπορεί να φτιάξει την καμπύλη precision-recall 15

Precision Sec. 8.4 Καμπύλη precision-recall 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Recall 16

Sec. 8.4 Μέσος όρος από πολλά ερωτήματα Το γράφημα precision-recall για ένα μόνο ερώτημα δεν είναι πολύ αξιόπιστο Πρέπει να δούμε τους μέσους όρους για πολλά ερωτήματα Αλλά, εδώ κρύβεται ένα τεχνικό ζήτημα: Οι υπολογισμοί precision-recall τοποθετούν σημεία στο γράφημα Πώς προσδιορίζουμε μια τιμή (interpolate) μεταξύ σημείων; 17

Sec. 8.4 Interpolated precision Ιδέα: Εάν η τοπική precision αυξάνει καθώς αυξάνει η recall, τότε πρέπει να το λάβουμε υπόψην Έτσι, παίρνουμε το max των precisions στα δεξιά 18

Sec. 8.4 Αποτίμηση: Αθροιστικές μετρικές Precision σε fixed retrieval level Precision-at-k: Precision στα top k αποτελέσματα Ίσως καλή για τις περισσότερες Web αναζητήσεις: όλοι μας επιθυμούμε τα πιο σχετικά αποτελέσματα στις μιαδυο πρώτες σελίδες. Ακραίως: 100%-at-1, το I am feeling lucky κουμπί Αλλά: δεν είναι πολύ καλό και απαιτεί παράμετρο k 11-point interpolated average precision Παίρνουμε την precision στα 11 επίπεδα recall μεταβάλλοντας από 0 σε 1 ανά δεκάδα εγγράφων, με χρήση interpolation (η τιμή για το 0 είναι πάντα interpolated!), και υπολογίζουμε τον μέσο όρο τους Αποτιμά την επίδοση σε όλα τα επίπεδα recall 19

Precision Sec. 8.4 Τυπική (καλή) precision 11 σημείων 1 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 Recall 20

Sec. 8.4 Ακόμη περισσότερες μετρικές επίδοσης Mean average precision (MAP) Average της precision για τα top k έγγραφα, κάθε φορά που ανακτάται ένα σχετικό έγγραφο Αποφεύγει την interpolation, χρήση fixed recall επιπέδων Η MAP για συλλογές ερωτημάτων είναι ο αριθμητικός μέσος όρος: R-precision Έχοντας γνώση (ίσως μερική) ενός συνόλου σχετικών εγγράφων μεγέθους Rel, τότε υπολογίζουμε την precision των top Rel εγγράφων που επιστράφηκαν Έστω ότι βρέθηκαν r σχετικά έγγραφα Άρα: prec = rec = r/ Rel 21

Sec. 8.4 Διασπορά Για μια συλλογή ελέγχου, είναι σύνηθες ότι ένα σύστημα αποδίδει άσχημα για κάποιες πληροφοριακές ανάγκες (π.χ., MAP = 0.1) και εξαιρετικά για άλλες (π.χ., MAP = 0.7) Πράγματι, είναι συνήθης η περίπτωση ότι η διασπορά στην επίδοση του ίδιου συστήματος για διάφορα ερωτήματα είναι μεγαλύτερη από την διασπορά διαφορετικών συστημάτων για το ίδιο ερώτημα Δηλαδή, υπάρχουν εύκολες και δύσκολες πληροφοριακές ανάγκες 22