Information Retrieval

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Information Retrieval"

Transcript

1 Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole

2 Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης Βάση Εγγράφων ερώτημα ΣΑΠ Απάντηση Information retrieval Ανάκτηση Πληροφορίας 2

3 Γιατί να μας ενδιαφέρει; Παλιότερα, Βιβλιοθηκονόμους, βοηθούς νομικών επαγγελμάτων κλπ; 3

4 Γιατί να μας ενδιαφέρει; Σήμερα - Μερικές εφαρμογές Web search 4

5 Γιατί να μας ενδιαφέρει; Σήμερα - Μερικές εφαρμογές Desktop search 5

6 Γιατί να μας ενδιαφέρει; Σήμερα - Μερικές εφαρμογές Social search Digital libraries Enterprise search Domain specific search: Legal information retrieval 6

7 Τι είναι η Ανάκτηση Πληροφορίας; Ανάκτηση Πληροφορίας (Information Retrieval) - (IR) είναι η εύρεση υλικού κυρίως εγγράφων (documents) αδόμητης φύσης(*) (unstructured) που συνήθως έχουν τη μορφή κειμένου (text) το οποίο ικανοποιεί μια ανάγκη πληροφόρησης (information need) από μεγάλες συλλογές (συνήθως αποθηκευμένες σε υπολογιστές) (*) όχι ακριβώς! 7

8 Αδόμητα δεδομένα Τυπικά αναφέρεται σε ελεύθερο κείμενο Επιτρέπει Ερωτήματα με λέξεις κλειδιά (keyword) με πιθανούς τελεστές Ποιο περίπλοκες ερωτήσεις για έννοιες: π.χ., Βρες όλες τις web σελίδες για την απελευθέρωση των Ιωαννίνων Κλασσικό μοντέλο για αναζήτηση σε έγγραφα κειμένου 8

9 Ανάκτηση Πληροφορίας vs Βάσεις Δεδομένων Δομημένα δεδομένα Ακολουθούν κάποιο σχήμα και είναι αποθηκευμένα με βάση κάποιο μοντέλο Ερώτημα SQL SELECT όνομα FROM πλανήτες WHERE δορυφόροι = 0 OR δορυφόροι = 1 OR δορυφόροι = 2 κωδικός όνομα διάμετρος δορυφόροι 1 Ερμής Αφροδίτη Γη Άρης Δίας Κρόνος Ουρανός Ποσειδώνας Πλούτωνας Το ερώτημα είναι σαφές, προσδιορίζει επακριβώς τη συνθήκη που πρέπει να ικανοποιεί κάθε αποτέλεσμα που εμφανίζεται στην έξοδο.

10 Ανάκτηση Πληροφορίας vs Βάσεις Δεδομένων Συλλογή εγγράφων d1 : Ο κομήτης του Χάλεϋ μας επισκέπτεται περίπου κάθε εβδομήντα έξι χρόνια. d2 : Ο κομήτης του Χάλεϋ πήρε το όνομά του από τον αστρονόμo Έντμοντ Χάλεϋ. d3 : Ένας κομήτης διαγράφει ελλειπτική τροχιά. d4 : Ο πλανήτης Άρης έχει δύο φυσικούς δορυφόρους, το Δείμο και το Φόβο. d5 : Ο πλανήτης Δίας έχει 63 γνωστούς φυσικούς δορυφόρους. d6 : Ένας κομήτης έχει μικρότερη διάμετρο από ότι ένας πλανήτης. d7 : Ο Άρης είναι ένας πλανήτης του ηλιακού μας συστήματος. Πληροφοριακή ανάγκη: πληροφορίες για τον κομήτη του Χάλεϋ Ερώτημα: Χάλεϋ Διαισθητικά αντιλαμβανόμαστε ότι τα έγγραφα d1 και d2 σχετίζονται περισσότερο με το ερώτημα από ότι τα υπόλοιπα έγγραφα.

11 Ανάκτηση Πληροφορίας vs Βάσεις Δεδομένων Χαρακτηριστικό ΣΔΒΔ ΣΑΠ είδος δεδομένων δομημένα αδόμητα, ημι-δομημένα τύπος δεδομένων αριθμητικά, αλφαριθμητικά έγγραφα (κειμένου) γλώσσα ερωτημάτων SQL φυσική γλώσσα, λέξεις κλειδιά (keywords) ερώτημα σαφές ασαφές αποτελέσματα χωρίς βαθμολόγηση βαθμολογημένα

12 Ημιδομημένα δεδομένα Στην πραγματικότητα, δεν υπάρχουν αμιγώς μη δομημένα δεδομένα π.χ., αυτή η διαφάνεια έχει διακριτές ζώνες όπως Title και Bullets Web pages? s? «Ημιδομημένη» αναζήτηση όπως: Title contains ημιδομημένα AND Bullets contain ζώνες και βέβαια υπάρχει πάντα η γλωσσική δομή 12

13 Αδόμητα (κείμενο) vs. Δομημένα (βάσεις δεδομένων) δεδομένα το

14 Αδόμητα (κείμενο) vs. Δομημένα (βάσεις δεδομένων) δεδομένα το

15 Αδόμητα (κείμενο) vs. Δομημένα (βάσεις δεδομένων) δεδομένα σήμερα? Web 2.0 User generated content (social networks, blogs, etc) Example: Facebook search 15

16 Όχι μόνο ανάκτηση! Κατηγοριοποίηση (classification) Τοποθέτηση εγγράφων στη σωστή κατηγορία (Παράδειγμα: spam) Συσταδοποίηση (clustering) Ομαδοποίηση σχετικών εγγράφων και περίληψη «Φιλτράρισμα» Με βάση κριτήρια σχετικότητας Συστάσεις (recommendations) 16

17 Σε διαφορετική κλίμακα! Στο web/διαδίκτυο Δισεκατομμύρια έγγραφα σε εκατομμύρια υπολογιστές. Θέματα? Προσωπική ανάκτηση πληροφορίας (στον προσωπικό υπολογιστή, , κλπ) Θέματα? Σε επίπεδο επιχείρησης, οργανισμού, τομέα 17

18 Τι άλλο θα δούμε σήμερα; 1. Μια μικρή εισαγωγή στο απλούστερο μοντέλο αναζήτησης (Boolean) (Κεφάλαιο 1 του Βιβλίου) Ένα απλό σύστημα ΑΠ (βασικές δομές δεδομένων και παραδείγματα ερωτημάτων) 2. Λίγα διαδικαστικά 18

19 Κεφ. 1.1 Αδόμητα δεδομένα το

20 Κεφ. 1.1 Αδόμητα δεδομένα το 1680 Ποια θεατρικά έργα του Shakespeare περιέχουν τις λέξεις Brutus και Caesar αλλά όχι τη λέξη Calpurnia (Brutus AND Caesar AND NOT Calpurnia)? Να διαβάσουμε όλα τα έργα σειριακά από την αρχή σημειώνοντας Θα μπορούσαμε να κάνουμε grep σε όλα τα έργα για Brutus και Caesar, και να σβήσουμε τις γραμμές που περιέχουν τη λέξη Calpurnia 20

21 Κεφ. 1.1 Αδόμητα δεδομένα το 1680 Γιατί όχι? Αργό (για μεγάλες συλλογές) Grep line-oriented, ανάκτηση πληροφορίας documentoriented NOT Calpurnia δεν είναι εύκολο Επιπρόσθετες λειτουργικότητα (π.χ., βρες τη λέξη Romans κοντά στο countrymen) Διάταξη! Ranked retrieval (τα «καλύτερα» έγγραφα ανάμεσα σε αυτά που ικανοποιούν την ερώτηση) Σε επόμενα μαθήματα. 21

22 Κεφ. 1.1 Για να δούμε τα βασικά To Boolean μοντέλο Δυαδική μήτρα (πίνακας) σύμπτωσης Μ Γραμμές: Term (όροι, λέξεις) Στήλες: Document (έγγραφα, έργα) M[i, j] = 1, αν ο όρος i εμφανίζεται στο έγγραφο j 0, αλλιώς 22

23 Κεφ. 1.1 Term-document incidence (μήτρα σύμπτωσης) Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser Brutus AND Caesar BUT NOT Calpurnia 1 αν το έργο περιέχει τη λέξη, 0 αλλιώς

24 Κεφ. 1.1 Οι όροι ως διανύσματα Έχουμε ένα δυαδικό διάνυσμα για κάθε όρο και κάθε έγγραφο Για να απαντήσουμε στην ερώτηση: παίρνουμε τα διανύσματα για το Brutus, Caesar και το συμπλήρωμα του διανύσματος για το Calpurnia bitwise AND AND AND =

25 Sec. 1.1 Οι απαντήσεις: Antony and Cleopatra, Act III, Scene ii Agrippa [Aside to DOMITIUS ENOBARBUS]: Why, Enobarbus, When Antony found Julius Caesar dead, He cried almost to roaring; and he wept When at Philippi he found Brutus slain. Hamlet, Act III, Scene ii Lord Polonius: I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. 25

26 Κεφ. 1.1 Βασικές Έννοιες Συλλογή (Collection - corpus): Σταθερό σύνολο από έγγραφα Στόχος: Ανάκτηση των εγγράφων που περιέχουν πληροφορία που είναι σχετική/συναφής (relevant) με την ανάγκη πληροφόρησης (information need) του χρήστη και τον βοηθά να ολοκληρώσει κάποιο έργο (task) Διαφορά μεταξύ: information need και ερωτήματος (query) 26

27 Κεφ. 1.1 Αποτελεσματικότητα Αποτελεσματικότητα (effectiveness): Πόσο καλά είναι τα έγγραφα που ανακτήθηκαν; Ακρίβεια (Precision): Το ποσοστό των εγγράφων που ανακτήθηκαν που είναι συναφή με την ανάγκη πληροφόρησης του χρήστη Ανάκληση (Recall) : Το ποσοστό των συναφών με την ανάγκη πληροφόρησης του χρήστη εγγράφων της συλλογής που ανακτήθηκαν από το σύστημα Περισσότερα στο μέλλον Διαφορά μεταξύ: αποτελεσματικότητας (effectiveness) και απόδοσης (efficiency) 27

28 Κεφ. 1.1 Βασικές Έννοιες 28

29 Το κλασικό μοντέλο αναζήτησης (search model) TASK Info Need Verbal form Query Misconception? Mistranslation? Misformulation? Get rid of mice in a politically correct way Info about removing mice without killing them How do I trap mice alive? mouse trap SEARCH ENGINE Query Refinement Results Corpus

30 Κεφ. 1.1 Μεγαλύτερες συλλογές Ας θεωρήσουμε N = 1 εκατομμύρια έγγραφα, το καθένα με περίπου 1000 λέξεις (~2-3 σελίδες βιβλίου). Κατά μέσο όρο 6 bytes/λέξη συμπεριλαμβανομένων κενών/συμβόλων στίξης 6GB δεδομένων. Έστω ότι ανάμεσα τους υπάρχουν M = 500K διακριτοί (distinct) όροι. 30

31 Κεφ. 1.1 Πόσο είναι το μέγεθος του πίνακα; Ο 500K x 1M πίνακας έχει μισό τρισεκατομμύριο 0 s και 1. Αλλά δεν έχει περισσότερα από ένα δισεκατομμύριο 1. Ο πίνακας είναι εξαιρετικά αραιός (sparse) τουλάχιστον το 99.8% είναι 0. Ποια είναι μια καλύτερη αναπαράσταση; Καταγράφουμε μόνο τις θέσεις του 1. Γιατί? 31

32 Κεφ. 1.2 Αντεστραμμένο ευρετήριο (Inverted index) Αντεστραμμένο ευρετήριο ή αρχείο (Inverted index/file) Για κάθε όρο (term) t, διατηρούμε μια λίστα με όλα τα έγγραφα που περιέχουν το t. Κάθε έγγραφο χαρακτηρίζεται από ένα αναγνωριστικό εγγράφου (docid), πχ αριθμό που ανατίθεται σειριακά στα έγγραφα κατά τη δημιουργία τους 32

33 Κεφ. 1.2 Αντεστραμμένο ευρετήριο Μπορούμε να χρησιμοποιήσουμε σταθερού μεγέθους arrays για αυτό? Brutus Caesar Calpurnia Τι γίνεται αν η λέξη Caesar προστεθεί στο έγγραφο 14? 33

34 Κεφ. 1.2 Αντεστραμμένο ευρετήριο Χρειαζόμαστε μεταβλητού μεγέθους λίστες καταχωρήσεων (postings lists) Ποια δομή δεδομένων είναι κατάλληλη; Στη μνήμη, απλά-διασυνδεδεμένες λίστες (skip lists) ή πίνακες μεταβλητού μήκους Στο δίσκο, ως (συμπιεσμένες) συνεχόμενες ακολουθίες καταχωρήσεων χωρίς δείκτες Brutus Calpurnia Καταχώρηση (Posting) Caesar Λεξικό (Dictionary) Καταχωρήσεις (Postings) Σε διάταξη με βάση το docid (θα δούμε σε λίγο γιατί!). 34

35 Κεφ. 1.2 Βασική Ορολογία Αντεστραμμένο ευρετήριο Λίστες καταχωρήσεων μία για κάθε όρο Καταχώρηση ένα στοιχείο της λίστας Κάθε λίστα είναι διατεταγμένη με το DocID Λεξιλόγιο (Vocabulary): το σύνολο των όρων Λεξικό (Dictionary) δομή δεδομένων για τους όρους Αρχικά ας θεωρήσουμε αλφαβητική διάταξη Το δημιουργούμε από πριν, θα δούμε πως 35

36 Κεφ. 1.2 Κατασκευή του αντεστραμμένου ευρετηρίου Έγγραφα προς ευρετηριοποίηση Friends, Romans, countrymen. Token stream Θα τα δούμε σε επόμενα μαθήματα. Modified tokens Inverted index Tokenizer Linguistic modules Indexer Friends Romans Countrymen friend roman countryman friend roman countryman

37 Κεφ. 1.2 Βήματα του Indexer: Ακολουθία Token Ακολουθία από ζεύγη (Modified token, Document ID). Doc 1 I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. Doc 2 So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious

38 Κεφ. 1.2 Βήματα του Indexer: Ταξινόμηση (sort) Ταξινόμηση με βάση τους όρους Και μετά το docid Βασικό βήμα της ευρετηριοποίησης

39 Κεφ. 1.2 Βήματα του Indexer: Λεξικό & Καταχωρήσεις Πολλαπλές εμφανίσεις του όρου σε ένα έγγραφο συγχωνεύονται (merged). Διαχωρισμός σε λεξικό και καταχωρήσεις Προσθέτουμε και πληροφορία για τη συχνότητα εγγράφων (doc. frequency). Γιατί τη συχνότητα; Επίσης, συχνότητα όρου (term frequency)

40 Κεφ. 1.2 Πόσο χώρο χρειαζόμαστε? Lists of docids Terms and counts Συνήθως στο δίσκο Συνήθως στη μνήμη Pointers Αργότερα στο μάθημα: Αποδοτικά ευρετήρια Πραγματική αποθήκευση 40

41 Κεφ. 1.3 Φτιάξαμε το ευρετήριο, τώρα; Πως επεξεργαζόμαστε μια ερώτηση; Αργότερα τι άλλου είδους ερωτήσεις 41

42 Κεφ. 1.3 Επεξεργασία ερωτήσεων: AND Έστω η ερώτηση: Brutus AND Caesar Βρες το Brutus στο Λεξικό Ανέκτησε τις καταχωρήσεις. Βρες το Caesar στο Λεξικό Ανέκτησε τις καταχωρήσεις. Merge τις δυο καταχωρήσεις (για τον υπολογισμό της τομής): Brutus Caesar 42

43 Κεφ. 1.3 Η συγχώνευση (merge) Διέσχισε τις δύο λίστες ταυτόχρονα, σε χρόνο γραμμικό (linear) στο συνολικό αριθμό των καταχωρήσεων Brutus Caesar Αν τα μήκη των λιστών είναι x και y, η συγχώνευση παίρνει O(x+y) λειτουργίες. Σημαντικό: οι καταχωρήσεις πρέπει να είναι διατεταγμένες με βάση το docid. 43

44 Ο αλγόριθμος συγχώνευσης 44

45 Κεφ. 1.3 Βελτιστοποίηση ερωτήματος Ποια είναι βέλτιστη σειρά για την επεξεργασία ενός ερωτήματος; Έστω μια ερώτηση που είναι το AND n όρων. Για καθέναν από τους n όρους, βρες τις καταχωρήσεις του και εκτέλεσε το AND σε όλες. Brutus Caesar Calpurnia Query: Brutus AND Calpurnia AND Caesar 45

46 Κεφ. 1.3 Βελτιστοποίηση ερωτήματος Επεξεργασία με αύξουσα συχνότητα: Ξεκίνησε με το μικρότερο σύνολο και συνέχισε μειώνοντας και άλλο το αποτέλεσμα Χρήση της συχνότητας εγγράφου στο λεξικό Brutus Caesar Calpurnia Εκτέλεση του ερωτήματος ως (Calpurnia AND Brutus) AND Caesar. 46

47 Sec. 1.3 Βελτιστοποίηση ερωτήματος Π.χ., (madding OR crowd) AND (ignoble OR strife) Βρες τη συχνότητας εγγράφου για όλους τους όρους. Εκτίμησε το μέγεθος κάθε OR (συντηρητικά: ως το άθροισμα των συχνοτήτων εγγράφου). Επεξεργασία του ερωτήματος κατά αύξουσα σειρά κάθε όρου. 47

48 Βελτιστοποίηση ερωτήματος: παράδειγμα ((paris AND NOT france) OR lear) 48

49 Παρατήρηση Δοκιμάστε το 49

50 Κεφ. 1.3 Boolean ερωτήματα: Ακριβές ταίριασμα (Exact match) Το Boolean μοντέλο ανάκτησης απαντά ερωτήματα που είναι Boolean εκφράσεις: Χρήση AND, OR και NOT για το συνδυασμό όρων Θεωρούν κάθε έγγραφο ως ένα σύνολο όρων Είναι ακριβές (precise): ένα έγγραφο είτε ικανοποιεί τη συνθήκη είτε όχι. Ίσως, το απλούστερο μοντέλο Το βασικό μοντέλο σε εμπορικά συστήματα για 3 δεκαετίες (πριν τον web). Πολλά συστήματα ακόμα Boolean: , library catalog, Mac OS X Spotlight Η Google χρησιμοποιεί το Boolean μοντέλο? 50

51 Κεφ. 1.4 Παράδειγμα: WestLaw Μεγάλο εμπορικό (συνδρομές επί πληρωμή) σύστημα Αναζήτηση σε νομικά κείμενα (άρχισε το1975, η διάταξη προστέθηκε το 1992) Δεκάδες terabytes δεδομένων; 700,000 χρήστες Η πλειοψηφία των χρηστών ακόμα χρησιμοποιεί Boolean ερωτήματα 51

52 Κεφ. 1.4 Παράδειγμα: WestLaw Παράδειγμα: Ανάγκη πληροφόρησης: What is the statute of limitations in cases involving the federal tort claims act? Ερώτημα: LIMIT! /3 STATUTE ACTION /S FEDERAL /2 TORT /3 CLAIM /3 = within 3 words, /S = in same sentence Παράδειγμα: Ανάγκη πληροφόρησης: Information on the legal theories involved in preventing the disclosure of trade secrets by employees formerly employed by a competing company Ερώτημα: trade secret /s disclos! /s prevent /s employe! 52

53 Κεφ. 1.4 Example: WestLaw Ακόμα ένα παράδειγμα: Requirements for disabled people to be able to access a workplace disabl! /p access! /s work-site work-place (employment /3 place) SPACE σημαίνει διάζευξη (disjunction) Μακροσκελή, επακριβή ερωτήματα, τελεστές εγγύτητας (proximity operators), διατυπωμένα σταδιακά (διαφορά από web search) Boolean αναζήτηση χρησιμοποιείται ακόμα από πολλούς επαγγελματίες Ξέρεις ακριβώς τι παίρνεις ως απάντηση Αυτό δε σημαίνει ότι δουλεύει καλύτερα

54 Evidence accumulation 1 vs. 0 εμφάνιση ενός όρου αναζήτησης 2 vs. 1 εμφανίσεις 3 vs. 2 εμφανίσεις, κλπ. Συχνά φαίνεται καλύτερο Χρειαζόμαστε και τη συχνότητα εμφάνισης του όρου στο έγγραφο 54

55 Τι άλλο πέρα της αναζήτησης όρων «Λάθη», wildcards, κλπ Φράσεις Stanford University, Πανεπιστήμιο Ιωαννίνων Γειτονικότητα (Proximity): Find Gates NEAR Microsoft. Χρειαζόμαστε ευρετήρια που να διατηρούν πληροφορία για τη θέση των όρων σε ένα έγγραφο Ζώνες σε έγγραφα: Find documents with (author = Ullman) AND (text contains automata). 55

56 Καταταγμένη (Ranked) αναζήτηση Συχνά θέλουμε να κατατάξουμε/ομαδοποιήσουμε τα αποτελέσματα Την ομοιότητα (γειτονικότητα) ενός ερωτήματος με ένα έγγραφο Χρειάζεται να αποφασίσουμε αν τα έγγραφα που παρουσιάζουμε στους χρήστες είναι μονοσύνολα ή αν ένα σύνολο από έγγραφα καλύπτει διαφορετικές απόψεις ενός ερωτήματος. 56

57 Ποιο περίπλοκη ημιδομημένη αναζήτηση Title is about Object Oriented Programming AND Author something like stro*rup όπου * είναι ο wild-card τελεστής Θέματα: Πως αντιμετωπίζουμε το about? Πως γίνεται η κατάταξη? 57

58 web Πέρα από τους όρους συνδέσεις Διαφορετικοί χρήστες, ανάγκες, ερωτήματα, κείμενα Ιδέες από κοινωνικά δίκτυα Ανάλυση συνδέσμων, clickstreams... Πως δουλεύουν οι μηχανές αναζήτησης; Μπορούμε να τις βελτιώσουμε; 58

59 Ακόμα Διαφορετικές γλώσσες (πολύγλωσσα κείμενα) Απαντήσεις ερωτήσεων (Question answering) Περιλήψεις Εξόρυξη κειμένου 59

60 Διαδικαστικά Ιστοσελίδα Βιβλίο Cristopher D. Manning, Prabhakar Raghavan and Hinrich Schutze. Εισαγωγή στην Ανάκτηση Πληροφοριών, Εκδόσεις Κλειδάριθμος Η αγγλική έκδοση διαθέσιμη δωρεάν 60

61 Διαδικαστικά Βαθμολογία (μπορεί να αλλάξει): Ασκήσεις ή/και project: 50%-80% Τελικό Διαγώνισμα: 50%-20% 61

62 ΤΕΛΟΣ 1 ου Μαθήματος Ερωτήσεις? Χρησιμοποιήθηκε κάποιο υλικό των: Pandu Nayak and Prabhakar Raghavan, CS276:Information Retrieval and Web Search (Stanford) Απόστολου Ν. Παπαδόπουλου, Ανάκτηση Πληροφορίας (Τμήμα Πληροφορικής, Αριστοτέλειο Πανεπιστήμιο) 62

Information Retrieval

Information Retrieval Introduction to Information Retrieval MYE003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης

Διαβάστε περισσότερα

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η Ανάκτηση Πληροφορίας (Information Retrieval); Ανάγκη πληροφόρησης Συλλογή Εγγράφων Eρώτημα

Διαβάστε περισσότερα

Introduction to Information Retrieval

Introduction to Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης Βάση

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Ανάκτηση Πληροφοριών

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Ανάκτηση Πληροφοριών Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 1. Ανάκτηση Boole Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων Γνωριμία ιδάσκων: Χρήστος

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 1η: 20/02/2017 1 Ειζαγωγή ζηο μάθημα & Ειζαγωγή ζηην Ανάκηηζη Πληροθορίας 2 Διδακτικό βοήθημα 1 Καλύπηει ηο ανηικείμενο ηοσ

Διαβάστε περισσότερα

Ανάκληση Πληπουοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληπουοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληπουοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Γιάλεξη 2η: 23/02/2016 1 Μεγάλες συλλογές (corpora) Έστωσαν N = 1M έγγραφα, το κάθε ένα με περίπου 1K όρους Avg 6 bytes/term, συμπεριλαμβανόμενων

Διαβάστε περισσότερα

Βάσεις Δεδομένων. Database Management Systems (DBMS) Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ)

Βάσεις Δεδομένων. Database Management Systems (DBMS) Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ) Βάσεις Δεδομένων Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ) Database Management Systems (DBMS) Αυγερινός Αραμπατζής avi@ee.duth.gr www.aviarampatzis.com Περιεχόμενα 1. Παραδοσιακές και νέες εφαρμογές

Διαβάστε περισσότερα

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)

Διαβάστε περισσότερα

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)

Διαβάστε περισσότερα

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας Εισαγωγή

Ανάκτηση Πληροφορίας Εισαγωγή Ανάκτηση Πληροφορίας Εισαγωγή Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής Ακαδημαϊκό Έτος 2007-2008 Αντικείμενο IR Η Ανάκτηση Πληροφορίας (ΑΠ)

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 7η: 21/03/2016 1 Ch. 4 Κατασκευή του ευρετηρίου Πώς κατασκευάζουμε το ευρετήριο; Ποιες στρατηγικές μπορούμε ν ακολουθήσουμε

Διαβάστε περισσότερα

Περιεχόμενα. Πίνακας συμβόλων σελίδα 10 Πρόλογος 13

Περιεχόμενα. Πίνακας συμβόλων σελίδα 10 Πρόλογος 13 Περιεχόμενα Πίνακας συμβόλων σελίδα 10 Πρόλογος 13 1 Ανάκτηση Boole 21 1.1 Παράδειγμα προβλήματος ανάκτησης πληροφοριών 23 1.2 Μια πρώτη ματιά στη δημιουργία αντεστραμμένων ευρετηρίων 27 1.3 Επεξεργασία

Διαβάστε περισσότερα

Introduction and Boolean Retrieval. Slides by Manning, Raghavan, Schutze

Introduction and Boolean Retrieval. Slides by Manning, Raghavan, Schutze ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ης Introduction and Boolean Retrieval Slides by Manning, Raghavan, Schutze Τα Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι θα δούμε σήμερα; Βαθμολόγηση

Διαβάστε περισσότερα

Ανάκτηση πληροφορίας

Ανάκτηση πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 6: Ο Αντεστραμμένος Κατάλογος Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Τι (άλλο) θα δούμε σήμερα;

Τι (άλλο) θα δούμε σήμερα; Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη6: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι (άλλο) θα δούμε σήμερα;

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6: Συμπίεση Ευρετηρίου 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Κατασκευή ευρετηρίου Στατιστικά

Διαβάστε περισσότερα

6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου

6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης

Διαβάστε περισσότερα

Ανάκτηση πληροφορίας

Ανάκτηση πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 1: Εισαγωγή στην Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Φροντιστήριο 3

Ανάκτηση Πληροφορίας. Φροντιστήριο 3 Ανάκτηση Πληροφορίας Φροντιστήριο 3 Τσιράκης Νίκος Νοέμβριος 2007 2 Περιεχόμενα Ανεστραμμένα Αρχεία Εισαγωγή Δημιουργία Συμπίεση Πιθανοτικά Μοντέλα 3 Ανεστραμμένα Αρχεία 4 Εισαγωγή Με ποιους τρόπους μπορούμε

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 4: Μοντελοποίηση: Διανυσματικό μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανάκτηση Δεδομένων (Information Retrieval)

Ανάκτηση Δεδομένων (Information Retrieval) Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας

Διαβάστε περισσότερα

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης IntroducCon and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Ανάκτηση Πληροφορίας (Information Retrieval IR) Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #03 Βασικές έννοιες Ανάκτησης Πληροφορίας Δομή ενός συστήματος IR Αναζήτηση με keywords ευφυής

Διαβάστε περισσότερα

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ. ΕΡΓΑΣΙΑ 4 «Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ. Στόχος Στόχος της Εργασίας 4 είναι να η εξοικείωση με την αντικειμενοστρέφεια (object oriented programming). Πιο συγκεκριμένα,

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ 5//013 ο ΓΛΩΣΣΑ ΚΑΙ ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ Ενότητες Εισαγωγή Συστήματα Aνάκτησης πληροφορίας Κατασκευή ερωτημάτων Δεικτοδότηση Αναζήτηση στο

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 3: Δομές για Λεξικά. Ανάκτηση Ανεκτική στα Σφάλματα (υποστήριξη *) 1 Ch. 2 Επανάληψη προηγούμενης

Διαβάστε περισσότερα

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 5(α): Συμπίεση Ευρετηρίου 1 ΣΤΑΤΙΣΤΙΚΑ ΣΥΛΛΟΓΗΣ 2 Κεφ. 5 Στατιστικά στοιχεία Πόσο μεγάλο είναι το

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 1η: 14/02/2007 1 Εισαγωγή στο µάθηµα & Εισαγωγή

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Εισαγωγή στο µάθηµα. Εισαγωγή στην Ανάκτηση Πληροφορίας. Απαιτήσεις του µαθήµατος

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Εισαγωγή στο µάθηµα. Εισαγωγή στην Ανάκτηση Πληροφορίας. Απαιτήσεις του µαθήµατος Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 1η: 14/02/2007 1 Εισαγωγή στο µάθηµα & Εισαγωγή

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 5η: 06/03/2017 1 WILD-CARD Ερωτήματα 2 Sec. 3.2 Ερωτήματα με χαρακτήρες wild-card: * mon*: να βρεθούν όλα τα έγγραφα που περιέχουν

Διαβάστε περισσότερα

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα Βάσεις

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Ανάκτηση

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 8: Θέματα Υλοποίησης. Περίληψη Αποτελεσμάτων. 1 Κεφ. 6 Τι είδαμε στο προηγούμενο μάθημα Βαθμολόγηση

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Επεξεργασία Ερωτήσεων Σ Β Βάση εδομένων Η ομή ενός ΣΒ Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 2 Εισαγωγή Εισαγωγή ΜΕΡΟΣ 1 (Χρήση Σ Β ) Γενική

Διαβάστε περισσότερα

4. Κατασκευή Ευρετηρίου

4. Κατασκευή Ευρετηρίου Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 4. Κατασκευή Ευρετηρίου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων Πλάνο Προηγούμενο

Διαβάστε περισσότερα

Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια Ευαγγελία Πιτουρά 1 τιμή γνωρίσματος Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #10 εικτοδότηση και Αναζήτηση Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια

Διαβάστε περισσότερα

Ευρετηρίαση ΜΕΡΟΣ ΙΙ

Ευρετηρίαση ΜΕΡΟΣ ΙΙ Ευρετηρίαση ΜΕΡΟΣ ΙΙ Ανάκτηση Πληροφορίας 2009-2010 1 Content Processing Boolean Queries Faster posting lists with skip pointers Phrase and Proximity Queries Biwords Positional Indexes Dictionary Wild-Card

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΜΥΕ003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6-7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι θα δούμε σήμερα;

Διαβάστε περισσότερα

Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση:

Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση: Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 2009-2010 Φθινοπωρινό Εξάμηνο Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση: Σκοπός αυτής της

Διαβάστε περισσότερα

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δυναμικός Κατακερματισμός Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Κατακερματισμός Τι αποθηκεύουμε στους κάδους; Στα παραδείγματα δείχνουμε μόνο την τιμή του πεδίου κατακερματισμού Την ίδια την εγγραφή

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4: Ανάκτηση Ανεκτική στα Σφάλματα 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Δομές δεδομένων για Λεξικά

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Ανάκτηση

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΜΥΕ003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4-5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή

Διαβάστε περισσότερα

Πληροφορική 2. Δομές δεδομένων και αρχείων

Πληροφορική 2. Δομές δεδομένων και αρχείων Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες

Διαβάστε περισσότερα

Social Web: lesson #4

Social Web: lesson #4 Social Web: lesson #4 looking for relevant information browsing searching monitoring recommendations Information Retrieval the inverted index Google.com the pagerank algorithm the value of words the price

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται

Διαβάστε περισσότερα

Εισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων

Εισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων Βάσεις εδοµένων 2003-2004 Ευαγγελία Πιτουρά 1 ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Επεξεργασία Ερωτήσεων Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL)

Διαβάστε περισσότερα

Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)

Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης) Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 28-29 Εαρινό Εξάμηνο Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης &

Διαβάστε περισσότερα

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ Ε ΟΜΕΝΩΝ Αρχεία δεδομένων συστήματος Σύστημα Βάσεων εδομένων (ΣΒ ) 2 :

Διαβάστε περισσότερα

Introduction to Information Retrieval

Introduction to Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 5: Κατασκευή και Συμπίεση Ευρετηρίου 1 Η βασική δομή: Το αντεστραμμένο ευρετήριο (inverted index)

Διαβάστε περισσότερα

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc. IEEE Xplore, Institute of Electrical and Electronics Engineers Inc. Μέσω της υπηρεσίας IEEE Xplore παρέχεται πρόσβαση στα περιεχόμενα, στις περιλήψεις και στα πλήρη κείμενα (full text) άρθρων από επιστημονικά

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια Ευαγγελία Πιτουρά 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές αναζήτησης και ρ δείκτες

Διαβάστε περισσότερα

Το εσωτερικό ενός Σ Β

Το εσωτερικό ενός Σ Β Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL) ηµιουργία/κατασκευή Εισαγωγή εδοµένων

Διαβάστε περισσότερα

Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ 2013-2014 2 Σκοπός του 2 ου εργαστηρίου Σκοπός αυτού του εργαστηρίου είναι: Η μελέτη ερωτημάτων σε μία μόνο σχέση. Εξετάζουμε τους τελεστές επιλογής

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6: Θέματα Υλοποίησης. Περίληψη Αποτελεσμάτων. 1 Κεφ. 6 Τι είδαμε στο προηγούμενο μάθημα Βαθμολόγηση

Διαβάστε περισσότερα

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος

Διαβάστε περισσότερα

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν

Διαβάστε περισσότερα

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους από τους

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές

Διαβάστε περισσότερα

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων

Διαβάστε περισσότερα

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιο λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2: Τύποι δεδομένων και εμφάνιση στοιχείων...33

ΚΕΦΑΛΑΙΟ 2: Τύποι δεδομένων και εμφάνιση στοιχείων...33 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος του συγγραφέα... 13 Πρόλογος του καθηγητή Τιμολέοντα Σελλή... 15 ΚΕΦΑΛΑΙΟ 1: Εργαλεία γλωσσών προγραμματισμού...17 1.1 Γλώσσες προγραμματισμού τρίτης γεννεάς... 18 τι είναι η γλώσσα

Διαβάστε περισσότερα

DISTINCT, LIKE, NULL, AND, OR, BETWEEN

DISTINCT, LIKE, NULL, AND, OR, BETWEEN Περισσότερα για τα απλά ερωτήματα SQL DISTINCT, LIKE, NULL, AND, OR, BETWEEN Αθανάσιος Σταυρακούδης http://stavrakoudis.econ.uoi.gr Άνοιξη 2014 1 / 66 Σκοπός του μαθήματος Αποκλείσετε διπλοεγγραφές από

Διαβάστε περισσότερα

SilverPlatter WebSPIRS 4.1.

SilverPlatter WebSPIRS 4.1. WebSPIRS 4.1. Η υπηρεσία WebSPIRS από τη SilverPlatter αποτελεί ένα φιλικό εργαλείο πρόσβασης και αναζήτησης σε περιεχόμενα βάσεων δεδομένων. Η Βιβλιοθήκη και Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές αναζήτησης και ρ δείκτες ως εξής P 1 K 1 P

Διαβάστε περισσότερα

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον ΚΕΦΑΛΑΙΑ 3 και 9 ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΕΣ Δεδομένα αφαιρετική αναπαράσταση της πραγματικότητας και συνεπώς μία απλοποιημένη όψη της δηλαδή.

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΣΔΒΔ Σύνολο από προγράµµατα για τη διαχείριση της ΒΔ Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ Αρχεία δεδοµένων συστήµατος Σύστηµα Βάσεων Δεδοµένων (ΣΒΔ)

Διαβάστε περισσότερα

ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Retrieval Systems

ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Retrieval Systems ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Systems Πανεπιστήμιο Κρήτης, Άνοιξη Γιάννης Τζίτζικας Lecture : 1 Date : 22-2- Title : Administration εδοµένα Το Αντικείµενο του Μαθήµατος Μια συλλογή

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 10: Αξιολόγηση στην Ανάκτηση Πληροφοριών II. 1 Κεφ. 8 Αξιολόγηση συστήματος Αποδοτικότητα (Performance)

Διαβάστε περισσότερα

Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη

Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη Ευρετήρια 1 Αρχεία Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη µνήµη. Η µεταφορά δεδοµένων από το δίσκο στη µνήµη και από τη

Διαβάστε περισσότερα

Βάσεις δεδομένων. (10 ο μάθημα) Ηρακλής Βαρλάμης varlamis@hua.gr

Βάσεις δεδομένων. (10 ο μάθημα) Ηρακλής Βαρλάμης varlamis@hua.gr Βάσεις δεδομένων (10 ο μάθημα) Ηρακλής Βαρλάμης varlamis@hua.gr Περιεχόμενα Ευρετήρια Σκανδάλες PL/SQL Δείκτες/Δρομείς 2 Αποθήκευση δεδομένων Πρωτεύουσα αποθήκευση Κύρια μνήμη (main memory) ή κρυφή μνήμη

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

Σύβακας Σταύρος ΠΕ19,MSc. IT ΣΥΒΑΚΑΣ ΣΤΑΥΡΟΣ ΕΡΩΤΗΜΑΤΑ

Σύβακας Σταύρος ΠΕ19,MSc. IT ΣΥΒΑΚΑΣ ΣΤΑΥΡΟΣ ΕΡΩΤΗΜΑΤΑ Σύβακας Σταύρος ΠΕ19,MSc. IT Εισαγωγή Τα ερωτήματα (queries) είναι μία από τις πιο σημαντικές δυνατότητες που προφέρει ένα Σ%Β% αφού επιτρέπουν: Ανάκτηση και ανάλυση των δεδομένων στην επιθυμητή μορφή

Διαβάστε περισσότερα

7. Υπολογισμός Βαθμολογιών σε ένα Πλήρες Σύστημα Αναζήτησης

7. Υπολογισμός Βαθμολογιών σε ένα Πλήρες Σύστημα Αναζήτησης Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 7. Υπολογισμός Βαθμολογιών σε ένα Πλήρες Σύστημα Αναζήτησης Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα

Διαβάστε περισσότερα

interactivecommunication Search Marketing White Paper Φεβρουάριος 2007 2007, Cybertechnics Ltd. All rights reserved.

interactivecommunication Search Marketing White Paper Φεβρουάριος 2007 2007, Cybertechnics Ltd. All rights reserved. interactivecommunication White Paper Φεβρουάριος 2007 2007, Cybertechnics Ltd. All rights reserved. ToSearchenginemarketing, ή SEM, αποτελείται απόμια σειρά marketing μεθόδων για την αύξηση τηςεμφάνισηςτου

Διαβάστε περισσότερα

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2007-2008 Εαρινό Εξάµηνο Άσκηση 1 Φροντιστήριο 4 Θεωρείστε ένα έγγραφο με περιεχόμενο «αυτό είναι ένα κείμενο και

Διαβάστε περισσότερα

Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας 1. Ποια είναι τα βασικά πλεονεκτήματα ενός παραδοσιακού σχεσιακού συστήματος βάσεων δεδομένων και

Διαβάστε περισσότερα

Κεφάλαιο 14. Δομές Ευρετηρίων για Αρχεία. Copyright 2007 Ramez Elmasri and Shamkant B. Navathe Ελληνική Έκδοση,

Κεφάλαιο 14. Δομές Ευρετηρίων για Αρχεία. Copyright 2007 Ramez Elmasri and Shamkant B. Navathe Ελληνική Έκδοση, Δίαβλος, Επιμέλεια Μ.Χατζόπουλος Διαφάνεια 14-1 Κεφάλαιο 14 Δομές Ευρετηρίων για Αρχεία Copyright 2007 Ramez Elmasri and Shamkant B. Navathe Ελληνική Έκδοση, Διαβλος, Επιμέλεια Μ.Χατζόπουλος 1 Θα μιλήσουμε

Διαβάστε περισσότερα

Model) Retrieval Model)... 18

Model) Retrieval Model)... 18 Πανεπιστήμιο Πατρών Πολυτεχνική Σχολή Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Αποδοτική Ιεραρχημένη Ανάκτηση Κοινωνικού Περιεχομένου με Χρήση Ταξονομιών Ετικετών Κοντοτάσιου Ιωάννα ΑΜ:

Διαβάστε περισσότερα

Ανάκτηση πληροφορίας

Ανάκτηση πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 3: Μοντελοποίηση: Boolean μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων 2009-2010: Ευρετήρια 1

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων 2009-2010: Ευρετήρια 1 Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3. Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα

Διαβάστε περισσότερα

METALIB Σύστημα μετα-αναζήτησης για ηλεκτρονικές πηγές πληροφόρησης

METALIB Σύστημα μετα-αναζήτησης για ηλεκτρονικές πηγές πληροφόρησης METALIB Σύστημα μετα-αναζήτησης για ηλεκτρονικές πηγές πληροφόρησης Βιβλιοθήκη & Κέντρο Πληροφόρησης, Πανεπιστημίου Λευκωσίας E-mail: libithelp@unic.ac.cy Τηλ: 22444772 Έκδοση: Μάρτιος 2013 (ES, GC, KP)

Διαβάστε περισσότερα

Στρατηγική έρευνας. Στρατηγική έρευνας. Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται

Στρατηγική έρευνας. Στρατηγική έρευνας. Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται Στρατηγική έρευνας κάποιος να λύσει ένα πρόβλημα, να κάνει μια εργασία για την εκπλήρωση κάποιου μαθήματος, να συγγράψει ένα

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 6η: 08/03/2016 1 Διόρθωση πληκτρολόγησης 2 Sec. 3.3 Διόρθωση πληκτρολόγησης Δυο κύριες χρήσεις Διόρθωση εγγράφων που θα εισαχθούν

Διαβάστε περισσότερα

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΗΥ463 Συστήµατα Ανάκτησης Πληροφοριών Εργασία: Ανεστραµµένο Ευρετήριο Εισαγωγή Σκοπός της εργασίας είναι η δηµιουργία ενός ανεστραµµένου ευρετηρίου για τη µηχανή αναζήτησης Μίτος, το

Διαβάστε περισσότερα