Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Ανάκτηση Πληροφοριών
|
|
- Αθανας Δημητρίου
- 7 χρόνια πριν
- Προβολές:
Transcript
1 Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 1. Ανάκτηση Boole Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων
2 Γνωριμία ιδάσκων: Χρήστος ουλκερίδης Ώρες γραφείου (102, Γρ.Λαμπράκη 126): Τετάρτη 09:15 11:00 Και κατόπιν συνεννόησης Ώρες μαθήματος: Τρίτη 08:15 08:30 11:00, Αίθ.335 March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 2
3 Επικοινωνία Ιστοσελίδα μαθήματος: Θέματα και υλικό σχετικά με το μάθημα ΙΑΛΕΞΕΙΣ ΑΝΑΚΟΙΝΩΣΕΙΣ ΕΚΦΩΝΗΣΕΙΣ ΕΡΓΑΣΙΩΝ ΠΑΡΑ ΟΣΗ ΕΡΓΑΣΙΩΝ ΒΟΗΘΗΤΙΚΟ ΥΛΙΚΟ... Άρα γραφτείτε στο μάθημα! March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 3
4 Βιβλία Μαθήματος Εισαγωγή στην Ανάκτηση Πληροφοριών C.Manning, P.Raghavan, H.Schuetze Εκδόσεις Κλειδάριθμος Ανάκτηση Πληροφορίας Ricardo Baeza-Yates and Berthier Ribeiro- Nero Εκδόσεις Τζιόλα ιαβάστε το βιβλίο, οι διαφάνειες δεν αρκούν! March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 4
5 Βαθμολογία Ασκήσεις (Α) Εξέταση (Ε) Τελικός Βαθμός = 0.7*Ε + 0.3*Α Παραδείγματα : Φοιτητής που έγραψε 6 στην τελική εξέταση αλλά δεν παρέδωσε ασκήσεις Τελικός Βαθμός = 0.7* *0 = Φοιτητής που έγραψε 5 στην τελική εξέταση και παρέδωσε ασκήσεις που βαθμολογήθηκαν με 10/10 Τελικός Βαθμός = 0.7* *10 = Φοιτητής που έγραψε 4 στην τελική εξέταση και παρέδωσε ασκήσεις που βαθμολογήθηκαν με 8/10 Τελικός Βαθμός = 0.7* *8 = March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 5
6 Σχετικά Μαθήματα στο Πρόγραμμα Σπουδών ομές εδομένων (3 ο εξάμηνο) Αλγόριθμοι & Πολυπλοκότητα (4 ο εξάμηνο) Σχεδιασμός Βάσεων εδομένων (4 ο εξάμηνο) Βάσεις εδομένων (5 ο εξάμηνο) Αποθήκες και Εξόρυξη εδομένων (6 ο εξάμηνο) Ανάκτηση Πληροφοριών (6 ο εξάμηνο) ιαχείριση εδομένων στον Π.Ι. (7 ο εξάμηνο) Εργαστήριο Ανάπτυξης Εφαρμογών Β (7 ο εξάμηνο) Εργαστήριο Συστημάτων Επεξεργασίας Πληροφοριών Π.Ι. (8 ο εξάμηνο) March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 6
7 Ανάκτηση Πληροφοριών Ανάκτηση Πληροφοριών (ΑΠ) είναι η εύρεση υλικού (συνήθως εγγράφων) αδόμητης φύσης (συνήθως κειμένων) μέσα σε μεγάλες συλλογές (που βρίσκονται συνήθως αποθηκευμένες σε υπολογιστές), το οποίο ικανοποιεί μια ανάγκη πληροφόρησης March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 7
8 Αδόμητα (Κείμενα) vs. Δομημένα (Βάσεις) Δεδομένα το 1996 March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 8
9 Αδόμητα (Κείμενα) vs. Δομημένα (Βάσεις) Δεδομένα το 2009 March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 9
10 Αδόμητα Δεδομένα το 1680 Κεφάλαιο 1.1 Ποια έργα του Shakespeare περιέχουν τις λέξεις Brutus και Caesar αλλά όχι Calpurnia; (Brutus AND Caesar AND NOT Calpurnia) Μια λύση θα ήταν (?) η γραμμική σάρωση (grep) όλων των έργων αναζητώντας λέξεις Brutus και Caesar, και έπειτα αφαίρεση των γραμμών που περιέχουν το Calpurnia Γιατί δεν είναι κατάλληλη λύση; Είναι αργή (ειδικά για μεγάλες συλλογές) Το NOT Calpurnia δεν είναι εύκολο Άλλες πράξεις, όπως εύρεση των λέξεων Romans κοντά στο countrymen, δεν είναι εφικτές Ανάκτηση με κατάταξη (ranked retrieval) εύρεση των καλύτερων εγγράφων Επόμενα μαθήματα March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 10
11 Κεφάλαιο 1.1 Μήτρα/Πίνακας Σύμπτωσης (Incidence Matrix) March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 11
12 Κεφάλαιο 1.1 Διανύσματα Σύμπτωσης (Incidence Vectors) Για κάθε όρο, έχουμε ένα διάνυσμα με 0/1 Για να απαντήσουμε το ερώτημα Βρίσκουμε τα διανύσματα για τους όρους Brutus, Caesar και Calpurnia Υπολογίζουμε το συμπλήρωμα του διανύσματος Calpurnia ( ) Εκτελούμε την πράξη AND στα δυαδικά ψηφία των διανυσμάτων AND AND = March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 12
13 Απαντήσεις στο Ερώτημα Κεφάλαιο 1.1 Antony and Cleopatra, Act III, Scene ii Agrippa [Aside to DOMITIUS ENOBARBUS]: Why, Enobarbus, When Antony found Julius Caesar dead, He cried almost to roaring; and he wept When at Philippi he found Brutus slain. Hamlet, Act III, Scene ii Lord Polonius: I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 13
14 Κεφάλαιο 1.1 Βασικές Υποθέσεις της Ανάκτησης Πληροφοριών Συλλογή (collection) ή σώμα εγγράφων (corpus) Ένα σταθερό σύνολο εγγράφων Στόχος Ανάκτηση εγγράφων που περιέχουν πληροφορία σχετική με την πληροφοριακή ανάγκη του χρήστη και υποβοηθά το χρήστη να ολοκληρώσει κάποια εργασία March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 14
15 Το Κλασικό Μοντέλο Αναζήτησης TASK Info Need Verbal form Query Misconception? Mistranslation? Misformulation? Get rid of mice in a politically correct way Info about removing mice without killing them How do I trap mice alive? mouse trap SEARCH ENGINE Query Refinement Results Corpus March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 15
16 Κεφάλαιο 1.1 Πόσο Καλά είναι τα Έγγραφα-Αποτελέσματα; Ακρίβεια (Precision) Ποιο ποσοστό επιστρεφόμενων αποτελεσμάτων είναι συναφές προς την ανάγκη πληροφόρησης; Ανάκληση (Recall) Ποιο ποσοστό των συναφών εγγράφων της συλλογής επιστρέφονται από το σύστημα; Σε επόμενα μαθήματα θα δούμε πιο λεπτομερείς ορισμούς και μέτρα March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 16
17 Μεγαλύτερες Συλλογές Κεφάλαιο 1.1 Έστω Ν = έγγραφα, που το καθένα περιλαμβάνει περίπου λέξεις Αν θεωρήσουμε ότι κάθε λέξη έχει μέγεθος 6 byte κατά μέσο όρο (συμπεριλαμβανομένων των κενών διαστημάτων και της στίξης) 6 GB δεδομένα μέσα στα έγγραφα Ας υποθέσουμε ότι υπάρχουν Μ = διακριτοί όροι σε αυτά τα έγγραφα March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 17
18 Δεν είναι Εφικτή η Κατασκευή του Πίνακα Κεφάλαιο Κ x 1M σημαίνει μισό τρισεκατομμύριο ψηφία 0 και 1 Όμως δεν περιέχει πάνω από ένα δισεκατομμύριο 1 Ο πίνακας είναι εξαιρετικά αραιός Ποια θα ήταν μια καλύτερη αναπαράσταση; Γιατί; Να καταγράφουμε μόνο ότι πραγματικά υπάρχει, δηλαδή τις τιμές 1 March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 18
19 Κεφάλαιο 1.2 Αντεστραμμένο Ευρετήριο (Inverted Index) Για κάθε όρο t, αποθηκεύουμε μια λίστα όλων των εγγράφων που περιέχουν τον όρο t Κάθε έγγραφο διαθέτει ένα μοναδικό αναγνωριστικό (docid) Μπορούμε να χρησιμοποιήσουμε πίνακες σταθερού μεγέθους για αυτό το σκοπό; Brutus Caesar Calpurnia Τι θα συμβεί εάν η λέξη Caesar προστεθεί στο έγγραφο 14? March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 19
20 Αντεστραμμένο Ευρετήριο (Inverted Index) Χρειαζόμαστε λίστες καταχωρήσεων (postings lists) μεταβλητού μεγέθους Στο δίσκο, αποθηκεύονται ως (πιθανώς συμπιεσμένες) συνεχόμενες ακολουθίες καταχωρήσεων Στη μνήμη, μπορούν να χρησιμοποιηθούν συνδεδεμένες λίστες ή πίνακες μεταβλητού μεγέθους Posting Brutus Υπάρχουν tradeoffs μεγέθους/ευκολίας εισαγωγής νέων όρων Κεφάλαιο Caesar Calpurnia Dictionary Postings Ταξινόμηση κατά docid (εξήγηση ακολουθεί). March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 20
21 Κεφάλαιο 1.2 Δημιουργία Αντεστραμμένων Ευρετηρίων Documents to be indexed Friends, Romans, countrymen. Tokenizer Token stream Friends Romans Countrymen More on these later. Linguistic modules Modified tokens Inverted index Indexer friend roman countryman friend roman countryman March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 21
22 Κεφάλαιο 1.2 Βήματα Ευρετηρίασης: Ακολουθία Συμβόλων Ακολουθία ζευγών (τροποποιημένο σύμβολο, document ID) Σύμβολο (token) Doc 1 Doc 2 I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 22
23 Κεφάλαιο 1.2 Βήματα Ευρετηρίασης: Ταξινόμηση Ταξινόμηση πρώτα κατά όρο Μετά κατά docid Core indexing step March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 23
24 Βήματα Ευρετηρίασης: Λεξικό & Καταχωρήσεις Κεφάλαιο 1.2 Πολλαπλές εμφανίσεις όρων στο ίδιο έγγραφο συγχωνεύονται σε ένα ιαχωρισμός σε λεξικό και καταχωρήσεις Προστίθεται και πληροφορία για τη συχνότητα εμφάνισης κάθε όρου Γιατί συχνότητα; Θα το δούμε αργότερα March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 24
25 Κόστος Αποθήκευσης Κεφάλαιο 1.2 Lists of docids Terms and counts Pointers Σε επόμενα μαθήματα: Πώς φτιάχνουμε αποδοτικά ευρετήρια? Πόσο χώρο αποθήκευσης χρειαζόμαστε? March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 25
26 Κεφάλαιο 1.3 Σχετικά με το Ευρετήριο που Δημιουργήσαμε Πώς θα επεξεργαστούμε ένα ερώτημα; Αργότερα: τι είδους ερωτήματα μπορούμε να υποστηρίξουμε; Σημερινή διάλεξη March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 26
27 Επεξεργασία Ερωτημάτων AND Κεφάλαιο 1.3 Ας θεωρήσουμε το συζευκτικό ερώτημα Brutus AND Caesar Βήματα Εύρεση Brutus στο λεξικό Ανάκτηση των καταχωρήσεών του Εύρεση Caesar στο λεξικό Ανάκτηση των καταχωρήσεών του «Συγχώνευση» των καταχωρήσεων (= τομή των δύο λιστών) Brutus Caesar March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 27
28 Συγχώνευση Κεφάλαιο 1.3 ιατρέχουμε τις δύο λίστες καταχωρήσεων ταυτόχρονα σε χρόνο γραμμικό ως προς τα μήκη των δύο λιστών Brutus Caesar Εάν τα μήκη των λιστών είναι x και y, η συγχώνευση απαιτεί O(x+y) πράξεις. Σημαντικό: οι καταχωρήσεις ταξινομημένες κατά docid. March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 28
29 Αλγόριθμος Εύρεσης Τομής δύο Λιστών March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 29
30 Κεφάλαιο 1.3 Ερωτήματα Boole: Ακριβές Ταίριασμα Το μοντέλο ανάκτησης Boole επιτρέπει τη διατύπωση ερωτημάτων που αποτελούν μια λογική έκφραση Boole Τα ερωτήματα Boole χρησιμοποιούν AND, OR και NOT για να συνδέσουν όρους μεταξύ τους Θεωρούν το κάθε έγγραφο σαν ένα σύνολο λέξεων (bag of words) Κάνουν επακριβές ταίριασμα: το έγγραφο είτε ταιριάζει με τη συνθήκη ή όχι Ήταν το βασικό εμπορικό εργαλείο ανάκτησης για 3 δεκαετίες Πολλά συστήματα που χρησιμοποιούμε ακόμη υιοθετούν το ίδιο μοντέλο ανάκτησης , κατάλογοι βιβλιοθηκών, Mac OS X Spotlight March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 30
31 Παράδειγμα: WestLaw ( Κεφάλαιο 1.4 Ο μεγαλύτερος εμπορικός πάροχος υπηρεσιών αναζήτησης σε νομικά κείμενα (ξεκίνησε το 1975, από το 1992 υποστήριζε καταταγμένη αναζήτηση) εκάδες TB δεδομένων και 700Κ χρήστες Η πλειοψηφία των χρηστών ακόμη χρησιμοποιούν ερωτήματα Boole Παράδειγμα Απαιτήσεις που πρέπει να ικανοποιούνται ώστε άτομα με αναπηρία (disabled) να έχουν πρόσβαση (access) στο χώρο εργασίας τους (work site, work place) disab! /p access! /s work-site work place (employment /3 place) /3 εντός 3 λέξεων, /s στην ίδια πρόταση, /p στην ίδια παράγραφο March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 31
32 Παράδειγμα: WestLaw ( Κεφάλαιο 1.4 Το κενό διάστημα μεταξύ λέξεων υποδηλώνει διάζευξη, όχι σύζευξη Μακροσκελή ερωτήματα, επακριβή ερωτήματα, χρήση τελεστών εγγύτητας ιαφορετικά από την αναζήτηση στον Παγκόσμιο Ιστό (web search) Πολλοί χρήστες (ιδιαίτερα επαγγελματίες) προτιμούν τα μοντέλα ερωτημάτων Boole Ξέρουν ακριβώς τι είναι αυτό που ανακτούν Αυτό βέβαια δε σημαίνει ότι δουλεύει καλύτερα πραγματικά... March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 32
33 Ερωτήματα Boole: Πιο Σύνθετη Συγχώνευση Κεφάλαιο 1.3 Άσκηση: Προσαρμόστε τη συγχώνευση για τα ερωτήματα Brutus AND NOT Caesar Brutus OR NOT Caesar Μπορούμε ακόμη να κάνουμε τη συγχώνευση σε χρόνο Ο(x+y); Τι μπορούμε να καταφέρουμε; March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 33
34 Συγχώνευση Κεφάλαιο 1.3 Πώς επεξεργαζόμαστε μια οποιαδήποτε αυθαίρετη παράσταση ερωτήματος Boole; (Brutus OR Caesar) AND NOT (Antony OR Cleopatra) Μπορούμε πάντα να κάνουμε συγχώνευση σε «γραμμικό» χρόνο; Γραμμικός ως προς τι; Μπορούμε να κάνουμε κάτι καλύτερο; March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 34
35 Βελτιστοποίηση Ερωτήματος Κεφάλαιο 1.3 Ποια είναι η καλύτερη σειρά προσπέλασης των λιστών καταχωρήσεων; Ας θεωρήσουμε ένα ερώτημα n όρων που συνδυάζονται με τον τελεστή AND Για καθένα από τους n όρους, παίρνουμε τις καταχωρήσεις, και τις συνδυάζουμε με την πράξη AND Brutus Caesar Calpurnia Query: Brutus AND Calpurnia AND Caesar March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 35
36 Βελτιστοποίηση Ερωτήματος: Παράδειγμα Κεφάλαιο 1.3 Επεξεργασία όρων κατά αύξουσα σειρά συχνότητας εγγράφων Ξεκινούμε με την τομή των δύο μικρότερων λιστών καταχωρήσεων, άρα όλα τα ενδιάμεσα αποτελέσματα δε θα είναι μεγαλύτερα από τη μικρότερη λίστα Να γιατί διατηρούμε τη συχνότητα εγγράφων στο λεξικό Brutus Caesar Calpurnia Το ερώτημα εκτελείται ως: (Calpurnia AND Brutus) AND Caesar. March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 36
37 Πιο Γενική Βελτιστοποίηση Κεφάλαιο 1.3 Π.χ. (madding OR crowd) AND (ignoble OR strife) Βρες τις συχνότητες εγγράφων για όλους τους όρους Εκτίμησε το μέγεθος του κάθε αποτελέσματος OR ως το άθροισμα των συχνοτήτων εγγράφων (συντηρητική προσέγγιση) Επεξεργασία σε αύξουσα σειρά των μεγεθών των OR αποτελεσμάτων March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 37
38 Άσκηση Προτείνετε σειρά εκτέλεσης για το ερώτημα: (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes) Term Freq eyes kaleidoscope marmalade skies tangerine trees March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 38
39 Ασκήσεις Επεξεργασίας Ερωτημάτων Άσκηση: εάν το ερώτημα είναι friends AND romans AND (NOT countrymen), πώς μπορούμε να χρησιμοποιήσουμε τη συχνότητα του countrymen; Άσκηση: επεκτείνετε τη συγχώνευση ώστε να υποστηρίζει αυθαίρετα ερωτήματα Boole. Μπορούμε πάντα να εγγυηθούμε εκτέλεση σε χρόνο γραμμικό ως προς το συνολικό μήκος των καταχωρήσεων; Υπόδειξη: Ξεκινήστε με την περίπτωση ενός ερωτήματος Boole φόρμουλας όπου κάθε όρος εμφανίζεται μία μόνο φορά στο ερώτημα March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 39
40 Άσκηση οκιμάστε την αναζήτηση στο Σημειώστε 5 πράγματα που θεωρείτε ότι θα μπορούσε να κάνει καλύτερα March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 40
41 Πέρα από την Αναζήτηση Όρων Αναζήτηση φράσεων Stanford University Εγγύτητα: εύρεση Gates NEAR Microsoft Χρειαζόμαστε ευρετήριο που διατηρεί πληροφορία για τη θέση εμφάνισης όρων σε έγγραφα Ζώνες σε έγγραφα: εύρεση εγγράφων με (author = Ullman) AND (text contains automata) March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 41
42 Συσσώρευση Πειστηρίων Το μοντέλο Boole καταγράφει μόνο την παρουσία/απουσία όρων (1 vs. 0) 2 vs. 1 3 vs. 2 Συνήθως περισσότερες εμφανίσεις όρων φαίνεται να δίνουν μεγαλύτερη βαρύτητα στα έγγραφα Χρειαζόμαστε πληροφορίες συχνότητας όρων στις λίστες καταχωρήσεων (= πόσες φορές εμφανίζεται ένας όρος σε ένα κείμενο) March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 42
43 Κατάταξη Αποτελεσμάτων Αναζήτησης Τα ερωτήματα Boole απλώς ανακτούν το σύνολο των εγγράφων που ταιριάζουν με το ερώτημα Συχνά όμως θέλουμε μια αποτελεσματική μέθοδο διάταξης (ή κατάταξης) και ομαδοποίησης των αποτελεσμάτων Χρειάζεται μηχανισμός μέτρησης της εγγύτητας του ερωτήματος από κάθε έγγραφο Πρέπει να μπορούμε να αποφασίζουμε εάν τα έγγραφα που παρουσιάζονται στο χρήστη είναι ατομικές μονάδες ή μια ομάδα εγγράφων που πιάνουν διαφορετικές οπτικές του ερωτήματος March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 43
44 Ανάκτηση Πληροφορίας vs. Βάσεις Δεδομένων Δομημένα vs. Αδόμητα Δεδομένα ομημένα δεδομένα αναφέρονται σε πληροφορία που αποθηκεύεται σε πίνακες Employee Manager Salary Smith Jones Chang Smith Ivy Smith Επιτρέπουν ερωτήσεις εύρους και ακριβές ταίριασμα (για κείμενο), π.χ., Salary < AND Manager = Smith. March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 44
45 Αδόμητα Δεδομένα Αναφερόμαστε σε ελεύθερο κείμενο Επιτρέπουν Ερωτήματα λέξεων-κλειδιών με τελεστές Πιο περίπλοκα ερωτήματα «εννοιών», όπως Εύρεση όλων των ιστοσελίδων για drug abuse Είναι το κλασικό μοντέλο αναζήτησης σε έγγραφα κειμένου March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 45
46 Ημιδομημένα Δεδομένα Στην πραγματικότητα δεν υπάρχουν αδόμητα δεδομένα Π.χ. Αυτή η διαφάνεια έχει διακριτές ζώνες, όπως ο τίτλος και η λίστα (bullets) Επιτρέπουν «ημιδομημένη» αναζήτηση, όπως Ο Τίτλος περιέχει δεδομένα AND η λίστα αναζήτηση Και φυσικά υπάρχει και γλωσσολογική δομή...(αλλά δεν ασχολούμαστε με αυτό) March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 46
47 Πιο Προχωρημένη Ημιδομημένη Αναζήτηση Ο τίτλος είναι σχετικός με Object Oriented Programming AND ο συγγραφέας μοιάζει με stro*rup Όπου * είναι ο χαρακτήρας μπαλαντέρ Θέματα Πώς επεξεργαζόμαστε το «είναι σχετικός με»; Πώς κατατάσσουμε τα αποτελέσματα; Θα το δούμε στην «Ανάκτηση XML», κεφ.10 March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 47
48 Συσταδοποίηση, Κατηγοριοποίηση και Κατάταξη Συσταδοποίηση (clustering) οθέντος ενός συνόλου εγγράφων, ομαδοποίησέ τα σε συστάδες με βάση το περιεχόμενό τους Κατηγοριοποίηση (classification) οθέντος ενός συνόλου κατηγοριών, και ενός νέου εγγράφου D, αποφάσισε σε ποια (ποιες) κατηγορία (κατηγορίες) ανήκει το D Κατάταξη (ranking) Μπορούμε να ανακαλύψουμε τον βέλτιστο τρόπο κατάταξης ενός συνόλου εγγράφων, π.χ. αποτελεσμάτων αναζήτησης March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 48
49 Ο Παγκόσμιος Ιστός και οι Προκλήσεις που κρύβει Ασυνήθιστα και ποικίλα έγγραφα Ασυνήθιστοι και ποικίλοι χρήστες, ερωτήματα, πληροφοριακές ανάγκες Πέρα από όρους, εκμετάλλευση ιδεών από κοινωνικά δίκτυα Ανάλυση υπερσυνδέσμων, clickstreams Πώς λειτουργούν οι μηχανές αναζήτησης; Πώς μπορούμε να τις βελτιώσουμε; March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 49
50 Πιο Προηγμένη Ανάκτηση Πληροφοριών ιαγλωσσική ανάκτηση πληροφοριών (Cross-language information retrieval) Συστήματα ερωταπαντήσεων (Question answering) ημιουργία περιλήψεων ή συνόψεων (Summarization) Εξόρυξη γνώσης από κείμενα (Text mining)... March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 50
51 Πηγές Αναφοράς Εισαγωγή στην Ανάκτηση Πληροφοριών, κεφάλαιο 1 Shakespeare: Managing Gigabytes, chapter 3.2 Modern Information Retrieval, chapter 8.2 March 15, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 51
Information Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης Βάση
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval MYE003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης
Διαβάστε περισσότεραΑνάκληση Πληπουοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληπουοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Γιάλεξη 2η: 23/02/2016 1 Μεγάλες συλλογές (corpora) Έστωσαν N = 1M έγγραφα, το κάθε ένα με περίπου 1K όρους Avg 6 bytes/term, συμπεριλαμβανόμενων
Διαβάστε περισσότεραMYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole
MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η Ανάκτηση Πληροφορίας (Information Retrieval); Ανάγκη πληροφόρησης Συλλογή Εγγράφων Eρώτημα
Διαβάστε περισσότεραMYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole
MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η Ανάκτηση Πληροφορίας (Information Retrieval); Ανάγκη πληροφόρησης Συλλογή Εγγράφων Eρώτημα
Διαβάστε περισσότεραMYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole
MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η Ανάκτηση Πληροφορίας (Information Retrieval); Ανάγκη πληροφόρησης Συλλογή Εγγράφων Eρώτημα
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 1η: 20/02/2017 1 Ειζαγωγή ζηο μάθημα & Ειζαγωγή ζηην Ανάκηηζη Πληροθορίας 2 Διδακτικό βοήθημα 1 Καλύπηει ηο ανηικείμενο ηοσ
Διαβάστε περισσότεραIntroduction to Information Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης Βάση
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university
Διαβάστε περισσότεραΠεριεχόμενα. Πίνακας συμβόλων σελίδα 10 Πρόλογος 13
Περιεχόμενα Πίνακας συμβόλων σελίδα 10 Πρόλογος 13 1 Ανάκτηση Boole 21 1.1 Παράδειγμα προβλήματος ανάκτησης πληροφοριών 23 1.2 Μια πρώτη ματιά στη δημιουργία αντεστραμμένων ευρετηρίων 27 1.3 Επεξεργασία
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 7η: 21/03/2016 1 Ch. 4 Κατασκευή του ευρετηρίου Πώς κατασκευάζουμε το ευρετήριο; Ποιες στρατηγικές μπορούμε ν ακολουθήσουμε
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΜεταπτυχιακή Διπλωματική Εργασία. «Τεχνικές Δεικτοδότησης Συστημάτων Ανάκτησης Πληροφορίας με τη χρήση Wavelet Trees» Κατσίπη Δήμητρα ΑΜ: 741
Μεταπτυχιακό Πρόγραμμα: «Επιστήμη και Τεχνολογία Υπολογιστών» Μεταπτυχιακή Διπλωματική Εργασία «Τεχνικές Δεικτοδότησης Συστημάτων Ανάκτησης Πληροφορίας με τη χρήση Wavelet Trees» Κατσίπη Δήμητρα ΑΜ: 741
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση
ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή ευρετηρίου Στατιστικά για τη συλλογή
Διαβάστε περισσότερα6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης
Διαβάστε περισσότεραΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση
ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή ευρετηρίου Στατιστικά για τη συλλογή
Διαβάστε περισσότεραΕισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα 2 Βήματα Επεξεργασίας Τα βασικά βήματα στην επεξεργασία
Διαβάστε περισσότεραΕυρετήρια. Ευρετήρια. Βάσεις Δεδομένων 2009-2010: Ευρετήρια 1
Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου
Διαβάστε περισσότεραIntroduction and Boolean Retrieval. Slides by Manning, Raghavan, Schutze
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ης Introduction and Boolean Retrieval Slides by Manning, Raghavan, Schutze Τα Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας. Φροντιστήριο 3
Ανάκτηση Πληροφορίας Φροντιστήριο 3 Τσιράκης Νίκος Νοέμβριος 2007 2 Περιεχόμενα Ανεστραμμένα Αρχεία Εισαγωγή Δημιουργία Συμπίεση Πιθανοτικά Μοντέλα 3 Ανεστραμμένα Αρχεία 4 Εισαγωγή Με ποιους τρόπους μπορούμε
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων
Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του 510 σελίδες 1η
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6: Συμπίεση Ευρετηρίου 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Κατασκευή ευρετηρίου Στατιστικά
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας (Information Retrieval IR)
Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου
Διαβάστε περισσότεραΕυρετήρια. Ευρετήρια. Βάσεις Δεδομένων : Ευρετήρια 1
Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου
Διαβάστε περισσότεραΠληροφορική 2. Δομές δεδομένων και αρχείων
Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότερα4. Κατασκευή Ευρετηρίου
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 4. Κατασκευή Ευρετηρίου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων Πλάνο Προηγούμενο
Διαβάστε περισσότεραΕυρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Ευρετήρια Ευαγγελία Πιτουρά 1 τιμή γνωρίσματος Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων Σ Β Βάση εδομένων Η ομή ενός ΣΒ Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 2 Εισαγωγή Εισαγωγή ΜΕΡΟΣ 1 (Χρήση Σ Β ) Γενική
Διαβάστε περισσότεραΕισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ Ε ΟΜΕΝΩΝ Αρχεία δεδομένων συστήματος Σύστημα Βάσεων εδομένων (ΣΒ ) 2 :
Διαβάστε περισσότεραΕπεξεργασία & Οργάνωση Δεδομένων Κειμένου
Επεξεργασία & Οργάνωση Δεδομένων Εφαρμογές Γλωσσικής Τεχνολογίας Σοφία Στάμου Γλώσσα και Επικοινωνία Κάθε γλωσσικό σύστημα διέπεται από κανόνες για τη χρήση, τη σύνταξη και την ερμηνεία των λέξεων Γιατί
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότερα«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.
ΕΡΓΑΣΙΑ 4 «Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ. Στόχος Στόχος της Εργασίας 4 είναι να η εξοικείωση με την αντικειμενοστρέφεια (object oriented programming). Πιο συγκεκριμένα,
Διαβάστε περισσότεραΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 5: Στατιστικά Συλλογής. Συμπίεση.
ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 5: Στατιστικά Συλλογής. Συμπίεση. 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή ευρετηρίου Στατιστικά για τη συλλογή Συμπίεση 2 ΣΤΑΤΙΣΤΙΚΑ
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΤα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη
Ευρετήρια 1 Αρχεία Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη µνήµη. Η µεταφορά δεδοµένων από το δίσκο στη µνήµη και από τη
Διαβάστε περισσότεραΕισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Εισαγωγή στην Επεξεργασία Ερωτήσεων Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα Βάσεις
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική
Διαβάστε περισσότεραΒάσεις Δεδομένων. Database Management Systems (DBMS) Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ)
Βάσεις Δεδομένων Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ) Database Management Systems (DBMS) Αυγερινός Αραμπατζής avi@ee.duth.gr www.aviarampatzis.com Περιεχόμενα 1. Παραδοσιακές και νέες εφαρμογές
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #03 Βασικές έννοιες Ανάκτησης Πληροφορίας Δομή ενός συστήματος IR Αναζήτηση με keywords ευφυής
Διαβάστε περισσότεραΔυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1
Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ.Χατζόπουλος 2 Δένδρο αναζήτησης είναι ένας ειδικός τύπος δένδρου που χρησιμοποιείται για να καθοδηγήσει την αναζήτηση μιας
Διαβάστε περισσότεραΕύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 1η: 14/02/2007 1 Εισαγωγή στο µάθηµα & Εισαγωγή
Διαβάστε περισσότεραΔομές Δεδομένων. Ενότητα 1 - Εισαγωγή. Χρήστος Γκουμόπουλος. Πανεπιστήμιο Αιγαίου Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων
Δομές Δεδομένων Ενότητα 1 - Εισαγωγή Χρήστος Γκουμόπουλος Πανεπιστήμιο Αιγαίου Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων Αντικείμενο μαθήματος Δομές Δεδομένων (ΔΔ): Στην επιστήμη υπολογιστών
Διαβάστε περισσότεραΤο εσωτερικό ενός Σ Β
Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL) ηµιουργία/κατασκευή Εισαγωγή εδοµένων
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #10 εικτοδότηση και Αναζήτηση Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια
Διαβάστε περισσότερα7. Υπολογισμός Βαθμολογιών σε ένα Πλήρες Σύστημα Αναζήτησης
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 7. Υπολογισμός Βαθμολογιών σε ένα Πλήρες Σύστημα Αναζήτησης Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα
Διαβάστε περισσότεραΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ 5//013 ο ΓΛΩΣΣΑ ΚΑΙ ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ Ενότητες Εισαγωγή Συστήματα Aνάκτησης πληροφορίας Κατασκευή ερωτημάτων Δεικτοδότηση Αναζήτηση στο
Διαβάστε περισσότεραΒάσεις Δεδομένων ΙΙ Ενότητα 5
Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Βάσεις Δεδομένων ΙΙ Ενότητα 5: Δομές Ευρετηρίων - ISAM Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και αν αναφέρεται διαφορετικά
Διαβάστε περισσότεραΕύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Εισαγωγή στο µάθηµα. Εισαγωγή στην Ανάκτηση Πληροφορίας. Απαιτήσεις του µαθήµατος
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 1η: 14/02/2007 1 Εισαγωγή στο µάθηµα & Εισαγωγή
Διαβάστε περισσότεραΑνάκτηση Δεδομένων (Information Retrieval)
Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας
Διαβάστε περισσότεραΑνάκτηση πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 6: Ο Αντεστραμμένος Κατάλογος Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται
Διαβάστε περισσότεραΤα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο
Κατακερματισμός 1 Αποθήκευση εδομένων (σύνοψη) Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο Παραδοσιακά, μία σχέση (πίνακας/στιγμιότυπο) αποθηκεύεται σε ένα αρχείο Αρχείο δεδομένων
Διαβάστε περισσότεραΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Retrieval Systems
ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Systems Πανεπιστήμιο Κρήτης, Άνοιξη Γιάννης Τζίτζικας Lecture : 1 Date : 22-2- Title : Administration εδοµένα Το Αντικείµενο του Μαθήµατος Μια συλλογή
Διαβάστε περισσότεραΗ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ
Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης IntroducCon and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PASCAL
8.1. Εισαγωγή ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PACAL Πως προέκυψε η γλώσσα προγραμματισμού Pascal και ποια είναι τα γενικά της χαρακτηριστικά; Σχεδιάστηκε από τον Ελβετό επιστήμονα της Πληροφορικής Nicklaus Wirth to
Διαβάστε περισσότεραΓενικά Στοιχεία Ηλεκτρονικού Υπολογιστή
Γενικά Στοιχεία Ηλεκτρονικού Υπολογιστή 1. Ηλεκτρονικός Υπολογιστής Ο Ηλεκτρονικός Υπολογιστής είναι μια συσκευή, μεγάλη ή μικρή, που επεξεργάζεται δεδομένα και εκτελεί την εργασία του σύμφωνα με τα παρακάτω
Διαβάστε περισσότεραΚεφ.11: Ευρετήρια και Κατακερματισμός
Κεφ.11: Ευρετήρια και Κατακερματισμός Database System Concepts, 6 th Ed. See www.db-book.com for conditions on re-use Κεφ. 11: Ευρετήρια-Βασική θεωρία Μηχανισμοί ευρετηρίου χρησιμοποιούνται για την επιτάχυνση
Διαβάστε περισσότεραΓλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου
Γλωσσικη τεχνολογια Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε το πληροφοριακό περιεχόμενο Ποσοτικοποιήσουμε
Διαβάστε περισσότεραέντρα ομές εδομένων 3ο εξάμηνο ιδάσκων: Χρήστος ουλκερίδης ιαφάνειες προσαρμοσμένες από το υλικό της Μαρίας Χαλκίδη
έντρα 2-3-4 ομές εδομένων 3ο εξάμηνο ιδάσκων: Χρήστος ουλκερίδης ιαφάνειες προσαρμοσμένες από το υλικό της Μαρίας Χαλκίδη Σημερινό Μάθημα 2-3-4 έντρα Ισοζυγισμένα δέντρα αναζήτησης έντρα αναζήτησης πολλαπλών
Διαβάστε περισσότεραΠανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 12/10/2017
Διαβάστε περισσότεραΆσκηση 1 (ανακοινώθηκε στις 20 Μαρτίου 2017, προθεσμία παράδοσης: 24 Απριλίου 2017, 12 τα μεσάνυχτα).
Κ08 Δομές Δεδομένων και Τεχνικές Προγραμματισμού Διδάσκων: Μανόλης Κουμπαράκης Εαρινό Εξάμηνο 2016-2017. Άσκηση 1 (ανακοινώθηκε στις 20 Μαρτίου 2017, προθεσμία παράδοσης: 24 Απριλίου 2017, 12 τα μεσάνυχτα).
Διαβάστε περισσότεραΕργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση:
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 2009-2010 Φθινοπωρινό Εξάμηνο Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση: Σκοπός αυτής της
Διαβάστε περισσότεραΠανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 21/10/2016
Διαβάστε περισσότερα1 Συστήματα Αυτοματισμού Βιβλιοθηκών
1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία
Διαβάστε περισσότεραΕισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων
Βάσεις εδοµένων 2003-2004 Ευαγγελία Πιτουρά 1 ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Επεξεργασία Ερωτήσεων Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL)
Διαβάστε περισσότεραΔυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Δυναμικός Κατακερματισμός 1 Κατακερματισμός Τι αποθηκεύουμε στους κάδους; Στα παραδείγματα δείχνουμε μόνο την τιμή του πεδίου κατακερματισμού Την ίδια την εγγραφή (ως τρόπος οργάνωσης αρχείου) μέγεθος
Διαβάστε περισσότεραΠροτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 28-29 Εαρινό Εξάμηνο Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης &
Διαβάστε περισσότεραΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης
ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους από τους
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 5η: 06/03/2017 1 WILD-CARD Ερωτήματα 2 Sec. 3.2 Ερωτήματα με χαρακτήρες wild-card: * mon*: να βρεθούν όλα τα έγγραφα που περιέχουν
Διαβάστε περισσότεραΑΣΚΗΣΗ Α. Δεικτοδότηση Συλλογής Κειμένων σε Ανεστραμμένο Ευρετήριο
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2009-2010 ΑΣΚΗΣΗ Α Δεικτοδότηση Συλλογής Κειμένων σε Ανεστραμμένο Ευρετήριο Τα ανεστραμμένα αρχεία αποτελούν μια βασική μορφή ευρετηρίου και μας επιτρέπουν να εντοπίσουμε
Διαβάστε περισσότεραΔυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Δυναμικός Κατακερματισμός Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Κατακερματισμός Τι αποθηκεύουμε στους κάδους; Στα παραδείγματα δείχνουμε μόνο την τιμή του πεδίου κατακερματισμού Την ίδια την εγγραφή
Διαβάστε περισσότεραΕργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων
Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Βάσεις Δεδομένων - Γενικά Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα. Τα περιεχόμενα
Διαβάστε περισσότεραΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε
Διαβάστε περισσότεραSilverPlatter WebSPIRS 4.1.
WebSPIRS 4.1. Η υπηρεσία WebSPIRS από τη SilverPlatter αποτελεί ένα φιλικό εργαλείο πρόσβασης και αναζήτησης σε περιεχόμενα βάσεων δεδομένων. Η Βιβλιοθήκη και Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας
Διαβάστε περισσότερα5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 5. Απλή Ταξινόμηση 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 11/11/2016 Εισαγωγή Η
Διαβάστε περισσότεραΔυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Δυναμικός Κατακερματισμός Βάσεις Δεδομένων 2017-2018 1 Κατακερματισμός Πρόβλημα στατικού κατακερματισμού: Έστω Μ κάδους και r εγγραφές ανά κάδο - το πολύ Μ * r εγγραφές (αλλιώς μεγάλες αλυσίδες υπερχείλισης)
Διαβάστε περισσότεραCopyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, Δίαβλος, Επιμέλεια Μ.Χατζόπουλος Διαφάνεια 14-1
Δίαβλος, Επιμέλεια Μ.Χατζόπουλος Διαφάνεια 14-1 Κεφάλαιο 14 Δομές Ευρετηρίων για Αρχεία Copyright 2007 Ramez Elmasri and Shamkant B. Navathe Ελληνική Έκδοση, Διαβλος, Επιμέλεια Μ.Χατζόπουλος Θα μιλήσουμε
Διαβάστε περισσότεραΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης
ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιο λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους
Διαβάστε περισσότεραΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2010-2011 ΑΣΚΗΣΗ Συγκομιδή και δεικτοδότηση ιστοσελίδων Σκοπός της άσκησης είναι η υλοποίηση ενός ολοκληρωμένου συστήματος συγκομιδής και δεικτοδότησης ιστοσελίδων.
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing
Διαβάστε περισσότεραΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:
Διαβάστε περισσότεραΛίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26
Περιεχόμενα Λίγα λόγια από το συγγραφέα... 7 Κεφάλαιο 1: Microsoft Excel 2002... 9 Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26 Κεφάλαιο 3: Δημιουργία νέου βιβλίου εργασίας και καταχώριση δεδομένων...
Διαβάστε περισσότεραΣύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης
Σύνοψη Προηγούμενου Πίνακες (Arrays Ορέστης Τελέλης telelis@unipi.gr Τμήμα Ψηφιακών Συστημάτων, Πανεπιστήμιο Πειραιώς Διαδικαστικά θέματα. Aντικείμενο Μαθήματος. Aντικείμενα, Κλάσεις, Μέθοδοι, Μεταβλητές.
Διαβάστε περισσότεραΕισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων
..?????? Εργαστήριο ΒΑΣΕΙΣ????????? ΔΕΔΟΜΕΝΩΝ Βάσεων Δεδομένων?? ΙΙ Εισαγωγικό Μάθημα Βασικές Έννοιες - . Γενικά Τρόπος Διεξαγωγής Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα
Διαβάστε περισσότεραεπιφάνεια πυριτίου Αναφορά στο Εκπαιδευτικό Υλικό : 5. Αναφορά στο Εργαστήριο :
2. Α/Α Διάλεξης : 1 1. Τίτλος : Εισαγωγή στην Ψηφιακή Τεχνολογία 2. Μαθησιακοί Στόχοι : Λογικές Πύλες και η υλοποίησή τους με τρανζίστορ. Κατασκευή ολοκληρωμένων κυκλωμάτων. 3. Θέματα που καλύπτει : Λογικές
Διαβάστε περισσότεραΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας
ΜΑΘΗΜΑ 6 195 Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων Το RDF Το Warwick Framework 196 1 Resource Data Framework RDF Τα πολλαπλά και πολλαπλής προέλευσης σχήµατα παραγωγής δηµιουργούν την ανάγκη δηµιουργίας
Διαβάστε περισσότεραΑποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)
Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Εξόρυξη Γνώσης από Χωρικά εδοµένα (spatial data mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Ανάκτηση
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΣΔΒΔ Σύνολο από προγράµµατα για τη διαχείριση της ΒΔ Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ Αρχεία δεδοµένων συστήµατος Σύστηµα Βάσεων Δεδοµένων (ΣΒΔ)
Διαβάστε περισσότεραΤο µάθηµα Ηλεκτρονική ηµοσίευση
Τµήµα Αρχειονοµίας Βιβλιοθηκονοµίας Ιόνιο Πανεπιστήµιο Το µάθηµα Ηλεκτρονική ηµοσίευση Σαράντος Καπιδάκης Επικοινωνία Σαράντος Καπιδάκης Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής ηµοσίευσης sarantos@ionio.gr
Διαβάστε περισσότεραΛύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος
Διαβάστε περισσότερα