Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές:

Σχετικά έγγραφα
Παλαιότερες ασκήσεις

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)

Φροντιστήριο 5. Το πρώτο πράγµα λοιπόν που πρέπει να κάνουµε είναι να βρούµε τις πιθανότητες εµφάνισης των συµβόλων. Έτσι έχουµε:

2. Missing Data mechanisms

/ / 38

ΕΥΑΙΣΘΗΣΙΑ ΗΛΕΚΤΡΙΚΩΝ ΚΥΚΛΩΜΑΤΩΝ

Information Retrieval

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

ΙΑΓΩΝΙΣΜΑ ΣΤΗ ΦΥΣΙΚΗ Γ ΛΥΚΕΙΟΥ ΚΑΤΕΥΘΥΝΣΗΣ ΣΤΙΣ ΜΗΧΑΝΙΚΕΣ ΚΑΙ ΗΛΕΚΤΡΙΚΕΣ ΤΑΛΑΝΤΩΣΕΙΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-217: Πιθανότητες - Χειµερινό Εξάµηνο 2016 ιδάσκων : Π. Τσακαλίδης. Λύσεις Τρίτης Σειράς Ασκήσεων

400 = t2 (2) t = 15.1 s (3) 400 = (t + 1)2 (5) t = 15.3 s (6)

4 Συνέχεια συνάρτησης

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9

5 η δεκάδα θεµάτων επανάληψης

ΜΑΘΗΜΑΤΙΚΗ ΙΑΤΥΠΩΣΗ ΚΑΙ ΛΥΣΗ ΦΥΣΙΚΩΝ ΠΡΟΒΛΗΜΑΤΩΝ

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

(1) 98! 25! = 4 100! 23! = 4

Σηµειώσεις στις σειρές

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-217: Πιθανότητες - Χειµερινό Εξάµηνο 2012 ιδάσκων : Π. Τσακαλίδης. Λύσεις Τρίτης Σειράς Ασκήσεων

ΚΕΦΑΛΑΙΟ 3 ΜΕΛΕΤΗ ΑΠΟ ΟΣΗΣ ΚΑΙ ΕΠΙΤΥΧΙΑΣ ΗΜΕΡΗΣΙΩΝ ΗΜΟΣΙΩΝ ΚΑΙ Ι ΙΩΤΙΚΩΝ ΛΥΚΕΙΩΝ ΕΙΣΑΓΩΓΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-317: Εφαρµοσµένες Στοχαστικές ιαδικασίες - Εαρινό Εξάµηνο ιδάσκων : Π.

2.3. Ασκήσεις σχ. βιβλίου σελίδας Α ΟΜΑ ΑΣ

(365)(364)(363)...(365 n + 1) (365) k

Παρουσίαση 1 ΙΑΝΥΣΜΑΤΑ

Η εφαρµογή xsortlab. Οπτικός τρόπος ταξινόµησης

4.3 Παραδείγµατα στην συνέχεια συναρτήσεων

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών

Συνάρτηση f, λέγεται η διαδικασία µε βάση την. Παρατηρήσεις - Σχόλια f


τη µέθοδο της µαθηµατικής επαγωγής για να αποδείξουµε τη Ϲητούµενη ισότητα.

Η Ευκλείδεια διαίρεση

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Κύµα µε αρχική φάση. αυτή είναι και η µόνη περίπτωση που περιγράφει το σχολικό βιβλίο και συνεπώς η πλειοψηφία των περιπτώσεων που µελετάµε. max.

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

ροµολόγηση πακέτων σε δίκτυα υπολογιστών

ΑΠΑΝΤΗΣΕΙΣ - ΥΠΟ ΕΙΞΕΙΣ ΣΤΙΣ ΕΡΩΤΗΣΕΙΣ

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο

Δυναμική ενέργεια στο βαρυτικό πεδίο. Θετική ή αρνητική;

- Q T 2 T 1 + Q T 1 T T

Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών. ΗΥ-217: Πιθανότητες-Χειµερινό Εξάµηνο ιδάσκων : Π. Τσακαλίδης

Μάθηµα 5. Κεφάλαιο: ιαφορικός Λογισµός. Θεµατικές ενότητες: 1. Συνέχεια συνάρτησης

Ανάκτηση Πληροφορίας

Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού

Case 06: Το πρόβληµα τωνlorie και Savage Εισαγωγή (1)

Ορια Συναρτησεων - Ορισµοι

1 η δεκάδα θεµάτων επανάληψης

HY118- ιακριτά Μαθηµατικά. Μαθηµατική επαγωγή. 11 Επαγωγή

Ελεύθερη αρµονική ταλάντωση χωρίς απόσβεση

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοηµοσύνη Ι» 7ο Φροντιστήριο 15/1/2008

Θα λύσετε ένα από τα έξι πακέτα ασκήσεων που ακολουθούν, τα οποία είναι αριθµηµένα από 0 έως5. Ο κάθε φοιτητής βρίσκει το πακέτο που του αντιστοιχεί

[ ], σχηµατίζουµε το άθροισµα. Το άθροισµα αυτό είναι µια δυαδική πράξη η οποία αντιστοιχεί στις ακολουθίες f [ 1

xp X (x) = k 3 10 = k 3 10 = 8 3

3 Αναδροµή και Επαγωγή

(1) 98! 25! = 4 100! 23! = 4

ΠΟΛΥ ΙΑΣΤΑΤΗ ΠΑΡΕΜΒΟΛΗ ΜΕ ΠΕΠΕΡΑΣΜΕΝΑ ΣΤΟΙΧΕΙΑ

Ποια μπορεί να είναι η κίνηση μετά την κρούση;

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-217: Πιθανότητες - Χειµερινό Εξάµηνο 2015 ιδάσκων : Π. Τσακαλίδης

ΑΠΑΝΤΗΣΕΙΣ - ΥΠΟ ΕΙΞΕΙΣ ΣΤΙΣ ΕΡΩΤΗΣΕΙΣ

x(t) = sin 2 (5πt) cos(22πt) = x 2 (t)dt

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

Γραµµατικές για Κανονικές Γλώσσες

Βασικό Επίπεδο στο Modellus

( x) (( ) ( )) ( ) ( ) ψ = 0 (1)

3.1 εκαδικό και υαδικό

ιάθλαση. Ολική ανάκλαση. ιάδοση µέσα σε κυµατοδηγό.

1 Ορισµός ακολουθίας πραγµατικών αριθµών

Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος;

Περίληψη ιπλωµατικής Εργασίας

Α5. Όταν η ζήτηση για ένα αγαθό είναι ελαστική, τότε πιθανή αύξηση της τιµής του, θα οδηγήσει σε µείωση της καταναλωτικής δαπάνης για αυτό το αγαθό

Αριθµητική Παραγώγιση και Ολοκλήρωση

Ευρωπαϊκή Ολυµπιάδα Φυσικών Επιστηµών 2009 Πανελλήνιος προκαταρκτικός διαγωνισµός στη Φυσική. Σχολείο: Ονόµατα των µαθητών της οµάδας: 1) 2) 3)

Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ)

Γενική Ισορροπία-Ευηµερία. 2ο Θεµελιώδες Θεώρηµα των Οικονοµικών της ευηµερίας. Notes. Notes. Notes. Notes. Κώστας Ρουµανιάς.

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Thanasis Xenos ΕΛΛΗΝΙΚΗ ΜΑΘΗΜΑΤΙΚΗ ΕΤΑΙΡΕΙΑ ΠΑΡΑΡΤΗΜΑ ΗΜΑΘΙΑΣ

4 Συνέχεια συνάρτησης

Μεθοδολογίες παρεµβολής σε DTM.

Ορισµοί και εξισώσεις κίνησης

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

PROJECT ΣΤΟ ΜΑΘΗΜΑ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟ ΟΥΣ

2. ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.


5.1 Συναρτήσεις δύο ή περισσοτέρων µεταβλητών

ΑΠΑΝΤΗΣΕΙΣ - ΥΠΟ ΕΙΞΕΙΣ ΣΤΙΣ ΕΡΩΤΗΣΕΙΣ

ΚΕΦΑΛΑΙΟ ΕΥΤΕΡΟ ΘΕΡΜΟ ΥΝΑΜΙΚΗ

Ομόλογα (bonds) Μετοχές (stocks) Αμοιβαία κεφάλαια (mutual funds)

c(2x + y)dxdy = 1 c 10x )dx = 1 210c = 1 c = x + y 1 (2xy + y2 2x + y dx == yx = 1 (32 + 4y) (2x + y)dxdy = 23 28

1.1.3 t. t = t2 - t x2 - x1. x = x2 x

0 x < (x + 2) 2 x < 1 f X (x) = 1 x < ( x + 2) 1 x < 2 0 x 2

14 Εφαρµογές των ολοκληρωµάτων

2.1 (i) f(x)=x -3x+2 Η f(x) ορίζεται x R

HY118- ιακριτά Μαθηµατικά. Παράδειγµα. Από τα συµπεράσµατα στις υποθέσεις Αποδείξεις - Θεωρία συνόλων. Από τις υποθέσεις στα συµπεράσµατα...

P (Ηρ) = 0.4 P (Αρ) = 0.32 P (Απ) = 0.2

1. ** Αν F είναι µια παράγουσα της f στο R, τότε να αποδείξετε ότι και η

ΗΜΙΟΥΡΓΙΑ ΠΑΙΧΝΙ ΙΟΥ ΣΤΟ SCRATCH ΒΗΜΑ ΠΡΟΣ ΒΗΜΑ

Transcript:

Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2005-2006 Εαρινό Εξάµηνο 1 η Σειρά Ασκήσεων (Αξιολόγηση Αποτελεσµατικότητας Ανάκτησης) Άσκηση 1 (4 βαθµοί) Θεωρείστε µια συλλογή αξιολόγησης που αποτελείται από 40 έγγραφα βάσει της οποίας θέλουµε να αξιολογήσουµε την αποτελεσµατικότητα τριών συστηµάτων S1, S2 και S3. Για το λόγο αυτό υποβάλλουµε σε κάθε σύστηµα µια επερώτηση q και λαµβάνουµε τις εξής απαντήσεις: Ans(S1,q) = <R N N N R R N N N N R N> Ans(S2,q) = <N N N N R N N N N R R R> Ans(S3,q) = <R R R N N N > Το αριστερότερο στοιχείο της κάθε απάντησης παριστάνει το υψηλότερα διαβαθµισµένο έγγραφο, αυτό που το σύστηµα υπολόγισε ως το πιο συναφές µε την επερώτηση q. Συµβουλευόµενοι την συλλογή αξιολόγησης διακρίνουµε τα στοιχεία των απαντήσεων σε συναφή (R) και µη συναφή (Ν). Έστω ότι ξέρουµε ότι το σύνολο των εγγράφων της συλλογής που είναι συναφή µε την επερώτηση q είναι 5. Συγκρίνεται τα τρία αυτά συστήµατα ως προς τα εξής µέτρα: (α) Ακρίβεια (Precision) (β) Ανάκληση (Recall) (γ) F-Measure (δ) R-Ακρίβεια (R-Precision) (ε) Fallout Για κάθε µέτρο σχολιάστε το αποτέλεσµα της σύγκρισης. Λύση Η συλλογή αξιολόγησής µας αποτελείται από 40 έγγραφα. Επιπλέον γνωρίζουµε ότι το σύνολο των εγγράφων της συλλογής που είναι συναφή µε την επερώτηση q είναι 5. Άρα έχουµε ως προς: α) Ακρίβεια (Precision) Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές: S 1 Σύστηµα: Το σύνολο των ευρεθέντων εγγράφων είναι 12, από τα οποία 4 έγγραφα είναι συναφή. Άρα P(S 1 ) = 4/12 = 0.333 S 2 Σύστηµα: Το σύνολο των ευρεθέντων εγγράφων είναι 12, από τα οποία 4 έγγραφα είναι συναφή. Άρα P(S 2 ) = 4/12 = 0.333 S 3 Σύστηµα: Το σύνολο των ευρεθέντων εγγράφων είναι 6, από τα οποία 3 έγγραφα είναι συναφή. Άρα P(S 3 ) = 3/6 = 0.5 Από τα αποτελέσµατα βλέπουµε ότι τα S 1 και S 2 συστήµατα, αν και δίνουν διαφορετικές απαντήσεις για την επερώτηση q, έχουν την ίδια ακρίβεια. Αντίθετα το S 3 αν και έχει λιγότερα συναφή έγγραφα στα αποτελέσµατά του σε σχέση µε τα

δύο προηγούµενα συστήµατα, έχει µεγαλύτερη ακρίβεια αφού µας επιστρέφει στην απάντησή του λιγότερα µη συναφή έγγραφα. β) Ανάκληση (Retrieval) Η ανάκληση ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα συναφή έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές: S 1 Σύστηµα: Το σύνολο των ευρεθέντων συναφών εγγράφων είναι 4, ενώ όλα τα συναφή έγγραφα είναι 5. Άρα R(S 1 ) = 4/5 = 0.8 S 2 Σύστηµα: Το σύνολο των ευρεθέντων συναφών εγγράφων είναι 4, ενώ όλα τα συναφή έγγραφα είναι 5. Άρα R(S 2 ) = 4/5 = 0.8 S 3 Σύστηµα: Το σύνολο των ευρεθέντων συναφών εγγράφων είναι 4, ενώ όλα τα συναφή έγγραφα είναι 5. Άρα R(S 3 ) = 3/5 = 0.6 Από τα αποτελέσµατα βλέπουµε ότι τα S 1 και S 2 συστήµατα, αν και δίνουν διαφορετικές απαντήσεις για την επερώτηση q, έχουν την ίδια ανάκληση, η οποία είναι υψηλότερη του S 3. Ο λόγος είναι ότι τα δύο πρώτα συστήµατα επιστρέφουν περισσότερα συναφή έγγραφα από ότι το τελευταίο. γ) F-Measure Το F-Measure είναι ένα µέτρο που λαµβάνει υπόψη την ακρίβεια και την ανάκληση και ορίζεται σαν το αρµονικό µέσο (harmonic mean) της ανάκλησης και της ακρίβειας σύµφωνα µε τον τύπο 2*P*R/(P+R). Χρησιµοποιώντας τα αποτελέσµατα από τα α) και β) έχουµε: S 1 Σύστηµα: Έχουµε P(S 1 ) = 0.333 και R(S 1 ) = 0.8. Άρα F(S 1 ) = 2 * 0.333 * 0.8 / (0.333 + 0.8) = 0.470. S 2 Σύστηµα: Έχουµε P(S 2 ) = 0.333 και R(S 1 ) = 0.8. Άρα F(S 2 ) = 2 * 0.333 * 0.8 / (0.333 + 0.8) = 0.470. S 3 Σύστηµα: Έχουµε P(S 3 ) = 0.5 και R(S 3 ) = 0.6. Άρα F(S 3 ) = 2 * 0.5 * 0.6 / (0.5 + 0.6) = 0.545. Από τα αποτελέσµατα βλέπουµε ότι το τρίτο σύστηµα έχει µεγαλύτερο F-Measure, λόγω του ότι χρειαζόµαστε παράλληλα υψηλό P και υψηλό R για να πάρουµε µεγάλη τιµή. Άρα το S 3 είναι καλύτερο. δ) R-Precision Το R-Precision µέτρο είναι η ακρίβεια στην R θέση της διάταξης της απάντησης µιας επερώτησης όπου R ο αριθµός των συναφών εγγράφων της συλλογής µας. Άρα µε βάση τη διάταξη που έχουµε από την εκφώνηση και γνωρίζοντας ότι ο αριθµός των συναφών εγγράφων της συλλογής µας είναι 5 έχουµε:

S 1 Σύστηµα: Από τη διάταξη της απάντησης του συστήµατος S 1 βλέπουµε ότι µέχρι και την 5 η θέση έχουµε βρεί 2 συναφή έγγραφα. Άρα R-Precision(S 1 ) = 2/5 = 0.4 S 2 Σύστηµα: Από τη διάταξη της απάντησης του συστήµατος S 2 βλέπουµε ότι µέχρι και την 5 η θέση έχουµε βρεί 1 συναφές έγγραφο. Άρα R-Precision(S 2 ) = 1/5 = 0.2 S 1 Σύστηµα: Από τη διάταξη της απάντησης του συστήµατος S 3 βλέπουµε ότι µέχρι και την 5 η θέση έχουµε βρεί 3 συναφή έγγραφα. Άρα R-Precision(S 3 ) = 3/5 = 0.6 Από τα παραπάνω βγάζουµε το συµπέρασµα ότι το σύστηµα S 3 έχει υψηλότερο R- Precision, πράγµα που ουσιαστικά σηµαίνει ότι µας δίνει στις πρώτες θέσεις πολλά συναφή έγγραφα. Αντίθετα τα άλλα δύο συστήµατα δίνουν στην αρχή και πολλά µη συναφή έγγραφα. ε) Fallout Το Fallout µέτρο είναι ο αριθµός των µη συναφών εγγράφων τα οποία ανακλήθηκαν από ένα σύστηµα προς τον συνολικό αριθµό των µη συναφών εγγράφων της συλλογής µας. S 1 Σύστηµα: Από τη διάταξη της απάντησης του συστήµατος S 1 βλέπουµε ότι έχουµε βρεί 8 µη συναφή έγγραφα, από το 35 µη συναφή έγγραφα της συλλογής µας. Άρα Fallout(S 1 ) = 8/35 = 0.228 S 2 Σύστηµα: Από τη διάταξη της απάντησης του συστήµατος S 2 βλέπουµε ότι έχουµε βρεί 8 µη συναφή έγγραφα, από το 35 µη συναφή έγγραφα της συλλογής µας. Άρα Fallout(S 2 ) = 8/35 = 0.228 S 3 Σύστηµα: Από τη διάταξη της απάντησης του συστήµατος S 3 βλέπουµε ότι έχουµε βρεί 8 µη συναφή έγγραφα, από το 35 µη συναφή έγγραφα της συλλογής µας. Άρα Fallout(S 3 ) = 3/35 = 0.085 Από τα παραπάνω βγάζουµε το συµπέρασµα ότι το σύστηµα S 3 έχει το µικρότερο Fallout, πράγµα πολύ λογικό αφού µας δίνει το µικρότερο αριθµό µη συναφών εγγράφων. Άσκηση 2 (4 βαθµοί) Σχεδιάστε τις καµπύλες ακρίβειας/ανάκλησης (P/R curves) των συστηµάτων της προηγούµενης άσκησης. Για κάθε σύστηµα δώστε 2 γραφήµατα: ένα που να απεικονίζει τα P/R σηµεία όπως προκύπτουν από τις απαντήσεις, και ένα χρησιµοποιώντας κανονικοποιηµένα επίπεδα ανάκλησης (standard recall levels). Αν βλέπατε µόνο αυτά τα γραφήµατα (και όχι τις απαντήσεις) θα µπορούσατε να επιλέξετε το καλύτερο σύστηµα; Λύση

Σε αυτή την άσκηση µας ζητείται να σχεδιάσουµε τις καµπύλες ακρίβειας ανάκλησης (P/R curves) των συστηµάτων της προηγούµενης άσκησης. Συγκεκριµένα µας ζητούνται δύο γραφήµατα, ένα µε βάση τις απαντήσεις των συστηµάτων και ένα χρησιµοποιώντας κανονικοποιηµένα επίπεδα ανάκλησης (standard recall levels). Για το S 1 Σύστηµα έχουµε: 1 ο συναφές έγγραφο P(S 1 ) = 1/1 = 1 R(S 1 ) = 1/5 = 0.2 2 ο συναφές έγγραφο P(S 1 ) = 2/5 = 0.4 R(S 1 ) = 2/5 = 0.4 3 ο συναφές έγγραφο P(S 1 ) = 3/6 = 0.5 R(S 1 ) = 3/5 = 0.6 4 ο συναφές έγγραφο P(S 1 ) = 4/11 = 0.363 R(S 1 ) = 4/5 = 0.8 Για τις interpolated τιµές έχουµε: r 0 = 0.0, r 1 = 0.1, r 2 = 0.2, r 3 = 0.3, r 4 = 0.4, r 5 = 0.5, r 6 = 0.6, r 7 = 0.7, r 8 = 0.8, r 9 = 0.9, r 10 = 1.0 και P(r 0 ) = 1.0, P(r 1 ) = 1.0, P(r 2 ) = 1.0, P(r 3 ) = 0.5, P(r 4 ) = 0.5, P(r 5 ) = 0.5, P(r 6 ) = 0.5, P(r 7 ) = 0.363, P(r 8 ) = 0.363, P(r 9 ) = 0.0, P(r 10 ) = 0.0 Οι δύο καµπύλες ακρίβειας και ανάκλησης µε βάση τα στοιχεία της απάντησης του S 1 συστήµατος αλλά και οι interpolated τιµές δίνονται παρακάτω: Για το S 2 Σύστηµα έχουµε: 1 ο συναφές έγγραφο P(S 2 ) = 1/5 = 0.2 R(S 2 ) = 1/5 = 0.2 2 ο συναφές έγγραφο P(S 2 ) = 2/10 = 0.2 R(S 2 ) = 2/5 = 0.4 3 ο συναφές έγγραφο P(S 2 ) = 3/11 = 0.272 R(S 2 ) = 3/5 = 0.6 4 ο συναφές έγγραφο P(S 2 ) = 4/12 = 0.333 R(S 2 ) = 4/5 = 0.8

Για τις interpolated τιµές έχουµε: r 0 = 0.0, r 1 = 0.1, r 2 = 0.2, r 3 = 0.3, r 4 = 0.4, r 5 = 0.5, r 6 = 0.6, r 7 = 0.7, r 8 = 0.8, r 9 = 0.9, r 10 = 1.0 και P(r 0 ) = 0.333, P(r 1 ) = 0.333, P(r 2 ) = 0.333, P(r 3 ) = 0.333, P(r 4 ) = 0.333, P(r 5 ) = 0.333, P(r 6 ) = 0.5,P(r 7 ) = 0.333, P(r 8 ) = 0.333, P(r 9 ) = 0.0, P(r 10 ) = 0.0 Οι δύο καµπύλες ακρίβειας και ανάκλησης µε βάση τα στοιχεία της απάντησης του S 2 συστήµατος αλλά και οι interpolated τιµές δίνονται παρακάτω: Για το S 3 Σύστηµα έχουµε: 1 ο συναφές έγγραφο P(S 3 ) = 1/1 = 1 R(S 3 ) = 1/5 = 0.2 2 ο συναφές έγγραφο P(S 3 ) = 2/2 = 1 R(S 3 ) = 2/5 = 0.4 3 ο συναφές έγγραφο P(S 3 ) = 3/3 = 1 R(S 3 ) = 3/5 = 0.6 Για τις interpolated τιµές έχουµε: r 0 = 0.0, r 1 = 0.1, r 2 = 0.2, r 3 = 0.3, r 4 = 0.4, r 5 = 0.5, r 6 = 0.6, r 7 = 0.7, r 8 = 0.8, r 9 = 0.9, r 10 = 1.0 και P(r 0 ) = 1.0, P(r 1 ) = 1.0, P(r 2 ) = 1.0, P(r 3 ) = 1.0, P(r 4 ) = 1.0, P(r 5 ) = 1.0, P(r 6 ) = 1.0,P(r 7 ) = 0.0, P(r 8 ) = 0.0, P(r 9 ) = 0.0, P(r 10 ) = 0.0 Οι δύο καµπύλες ακρίβειας και ανάκλησης µε βάση τα στοιχεία της απάντησης του S 3 συστήµατος αλλά και οι interpolated τιµές δίνονται παρακάτω:

Από τις παραπάνω γραφικές παραστάσεις µπορούµε να βγάλουµε συµπεράσµατα για τα τρία συστήµατά µας δίχως να ξέρουµε τις απαντήσεις που µας έχει δώσει το καθένα. Χρησιµοποιώντας τις καµπύλες Precision/Recall, βλέπουµε ότι το σύστηµα S 3 είναι το καλύτερο από όλα για µικρές και µεσαίες τιµές ανάκλησης, µιας και βλέπουµε ότι η ακρίβειά του βρίσκεται συνεχώς στο 1, πράγµα που σηµαίνει ότι µας δίνει συναφής απαντήσεις, χωρίς να µας δώσει ούτε µία ασυναφή. Για µεγάλες τιµές ανάκλησης όµως βλέπουµε ότι η απόδοση του πέφτει,αφού αδυνατεί στη συνέχεια να µας δώσει κάποια συναφή απάντηση. εύτερο έρχεται το σύστηµα S 1 αφού βλέπουµε ότι µας δίνει ικανοποιητικές τιµές για χαµηλές τιµές ανάκλησεις και υπερτερεί του S 3 στο γεγονός ότι έχει καλύτερη απόδοση για µεγαλύτερες τιµές ανάκλησης. Τρίτο έρχεται το S 2 το οποίο έχει πολύ χειρότερη συµπεριφορά από το S 1, για µικρές τιµές ανάκλησης και παρόµοια συµπεριφορά µε αυτό για υψηλές τιµές ανάκλησης. Άλλωστε γενικά καλύτερο σύστηµα είναι αυτό που προσεγγίζει σε µεγαλύτερο βαθµό την πάνω δεξιά γωνία του γραφήµατος, η οποία ισχύει όµως µόνο σε ένα ιδανικό σύστηµα. Αντίστοιχα αποτελέσµατα βγάζουµε και από τις interpolated τιµές. Εδώ θα µπορούσαµε να χρησιµοποιήσουµε το γεγονός ότι καλύτερο σύστηµα είναι αυτό το οποίο έχει το µέγιστο εµβαδό στα συγκεκριµένα γραφήµατα το οποίο βρίσκεται όσο γίνεται πιο αριστερά στο γράφηµα, από την άποψη ότι δίνει συναφή έγγραφα στις πρώτες απαντήσεις του. Και πάλι η σειρά θα ήταν S 3, S 1, S 2. Άσκηση 3 (2 βαθµοί) Έστω ότι έχουµε µια συλλογή Ν εγγράφων και Κ συστήµατα ανάκτησης πληροφοριών. Θέλουµε να αξιολογήσουµε την αποτελεσµατικότητα των συστηµάτων αυτών, ώστε να επιλέξουµε το καλύτερο, αλλά δυστυχώς δεν υπάρχει καµία συλλογή αξιολόγησης. Επίσης δεν µπορούµε να κάνουµε οι ίδιοι µια άτυπη αξιολόγηση (ήτοι να υποβάλουµε σε κάθε σύστηµα ένα σύνολο επερωτήσεων και να κρίνουµε τις

αποκρίσεις τους ως προς την ακρίβεια τους) διότι είτε δεν έχουµε τον απαιτούµενο χρόνο για κάτι τέτοιο (π.χ. φανταστείτε την περίπτωση που Κ=1000), ή διότι δεν µπορούµε να το κάνουµε (π.χ. τα έγγραφα είναι γραµµένα στην κινεζική γλώσσα). (α) Προτείνετε τρόπους αντιµετώπισης αυτού του προβλήµατος και δικαιολογείστε τις απαντήσεις σας (συγκεκριµένα τις υποθέσεις υπό τις οποίες αυτό που προτείνετε θα είχε νόηµα). (β) Έστω ότι έχετε Χ Ευρώ στη διάθεση σας και ότι υπάρχει ένας κινέζος ο οποίος µε 1 Ευρώ µπορεί να σας απαντήσει αν ένα έγγραφο d είναι συναφές ή όχι µε µια επερώτηση q. Πως θα τον χρησιµοποιούσατε για την αξιολόγηση των συστηµάτων; Λύση α) Αντικειµενικά δεν υπάρχει τρόπος να αποφανθούµε για το ποιο σύστηµα είναι καλύτερο από τα υπόλοιπα. Μπορούµε όµως θεωρήσουµε ως καλύτερο εκείνο το σύστηµα του οποίου η λειτουργία είναι πιο κοντά στην λειτουργία όλων των συστηµάτων. Μια τέτοια υπόθεση δεν είναι αβάσιµη υπό την έννοια ότι σε πολλές περιπτώσεις της καθηµερινής µας ζωής, έτσι ορίσουµε το "αντικειµενικό" (δηλαδή πλειοψηφικά). Η µέθοδος που µπορούµε να ακολουθήσουµε για αυτό το σκοπό είναι η εξής: 1. Επιλέγω τυχαία ένα έγγραφο. 2. Το στέλνω ως επερώτηση σε κάθε σύστηµα. 3. Κατόπιν ενοποιώ τις διατάξεις που έλαβα από όλα τα συστήµατα και ορίζω την συνισταµένη διάταξη. O τρόπος µε τον οποίο θα ενοποιήσουµε τις διατάξεις είναι κρίσιµος για το αποτέλεσµα της αξιολόγησης των συστηµάτων. Μια µέθοδος ενοποίησης διατάξεων που λαµβάνει υπόψιν τη σειρά του κάθε εγγράφου σε κάθε διάταξη είναι η ενοποίηση διατάξεων κατά Borda ( ιάλεξη 15): Αν κάθε πηγή S i επιστρέφει ένα διατεταγµένο υποσύνολο O i του συνόλου όλων των εγγράφων, τότε - αν o j ανήκει στο O i, τότε r i (o j ) = θέση του o j στο O i - αλλιώς, r i (o j ) = F+1, όπου F = max{ O 1,, O k } 4. Κατόπιν βαθµολογώ κάθε σύστηµα ανάλογα µε την απόσταση της απάντησης του από την συνισταµένη. εδοµένης της χρήσης της µεθόδου του Borda, µπορούµε να ορίσουµε την απόσταση µεταξύ των δύο διατάξεων (δηλ. της απάντησης του συστήµατος από την ενοποιηµένη διάταξη) ως εξής: dist(i,j) = Σ o in Obj r i (o) r j (o) Μπορούµε επίσης να τροποποιήσουµε τον παραπάνω τύπο, ώστε να πάρουµε το άθροισµα των διαφορών των θέσεων των documents σε κάθε µια από τις δύο διατάξεις µόνο για τα documents που βρίσκονται στις πρώτες M (M<N) θέσεις της ενοποιηµένης διάταξης, αφού κυρίως µας ενδιαφέρει τι συµβαίνει στις κορυφαίες θέσεις της απάντησης ενός συστήµατος. Εναλλακτικά θα µπορούσαµε να θεωρήσουµε τα Μ πρώτα έγγραφα της ενοποιηµένης διάταξης ως το σύνολο (δηλ. να αγνοήσουµε τη διάταξή τους) των συναφών εγγράφων και κατόπιν να αξιολογήσουµε τα συστήµατα βάσει των µέτρων αξιολόγησης αποτελεσµατικότητας ( ιάλεξη 2).

5. Μπορώ να επαναλάβω τη διαδικασία αυτή για πολλά έγγραφα ή για όλα τα έγγραφα της συλλογής. β) Ο Κινέζος µπορεί να κρίνει το πολύ Χ έγγραφα (και συνήθως το Χ είναι µικρό). Το κρίσιµο ερώτηµα είναι ποια έγγραφα µας συµφέρει να του δώσουµε να κρίνει. Μια απάντηση σε αυτό το ερώτηµα θα µπορούσε να δώσει η λύση του (α) ερωτήµατος, δηλαδή του δίνουµε έγγραφα που εµφανίζονται ψηλά στην συνισταµένη διάταξη. Συγκεκριµένα, του δίνω τα Χ πρώτα στοιχεία της συνισταµένης διάταξης (που προέκυψε από τις απαντήσεις των συστηµάτων σε µια επερώτηση). Έστω Υ εκείνα τα οποία κατά τη γνώµη του είναι συναφή. Κρίνω τα συστήµατα βάσει του αν περιέχουν (και µάλιστα ψηλά στην απάντησή τους) τα Υ έγγραφα. Αν βέβαια το Χ είναι µεγαλύτερο από το Ν, τότε µπορούµε να κάνουµε παραπάνω από µία επερωτήσεις (στην ακραία περίπτωση για κάθε έγγραφο της συλλογής). Όµως ακόµα και αν τα χρήµατα δε φτάνουν (συνήθως το Ν είναι πολύ µεγάλο) µπορούµε να επιλέξουµε τα πρώτα Χ/Μ έγγραφα της ενοποιηµένης διάταξης και να ρωτήσουµε τον Κινέζο ποια από αυτά είναι συναφή µε κάθε µια από τις Μ επερωτήσεις.