7. Υπολογισμός Βαθμολογιών σε ένα Πλήρες Σύστημα Αναζήτησης
|
|
- Ἀνδρομάχη Παπαστεφάνου
- 7 χρόνια πριν
- Προβολές:
Transcript
1 Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 7. Υπολογισμός Βαθμολογιών σε ένα Πλήρες Σύστημα Αναζήτησης Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων
2 Επανάληψη: Στάθμιση tf-idf Κεφάλαιο 6 Το tf-idf βάρος ενός όρου είναι το γινόμενο του tf βάρους και του idf βάρους w (1 log tf ) log 10 t, d 10 ( N / df t, d t ) Είναι ο καλύτερος γνωστός τρόπος στάθμισης στην ΑΠ Αυξάνεται με το πλήθος εμφανίσεων όρου σε ένα έγγραφο Αυξάνεται με τη σπανιότητα του όρου στη συλλογή May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 2
3 Κεφάλαιο 6 Επανάληψη: Ερωτήματα ως Διανύσματα Βασική Ιδέα 1: Αναπαριστούμε τα ερωτήματα σαν διανύσματα στο χώρο (όπως ακριβώς και τα έγγραφα) Βασική Ιδέα 2: Κατατάσουμε τα έγγραφα με βάση την εγγύτητά τους με το ερώτημα σε αυτό το χώρο Εγγύτητα = ομοιότητα διανυσμάτων May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 3
4 Επανάληψη: cosine(query, document) May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 4 V i i V i i V i i i d q q d d d q q d q d q d q ), cos( Dot product Unit vectors q i είναι το tf-idf βάρος του όρου i στο ερώτημα d i είναι το tf-idf βάρος του όρου i στο έγγραφο cos(q,d) είναι η συνημιτονοειδής ομοιότητα (cosine similarity) του q και του d ή, ισοδύναμα, το συνημίτονο της γωνίας μεταξύ q και d Κεφάλαιο 6
5 Σε αυτό το Μάθημα Κεφάλαιο 7 Επιτάχυνση της κατάταξης στο διανυσματικό μοντέλο Σύσταση ενός ολοκληρωμένου συστήματος αναζήτησης Απαιτεί την εκμάθηση ενός πλήθους ποικίλων θεμάτων και ευριστικών May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 5
6 Υπολογισμός Βαθμολογιών Κεφάλαιο May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 6
7 Αποδοτική Κατάταξη με Συνημίτονο Κεφάλαιο 7.1 Εύρεση των K εγγράφων στη συλλογή που είναι κοντινότερα στο ερώτημα K μεγαλύτερα συνημίτονα ερωτήματος-εγγράφου Αποδοτική κατάταξη: Αποδοτικός υπολογισμός μιας τιμής συνημιτόνου Αποδοτική επιλογή των K μεγαλύτερων τιμών συνημιτόνου Μπορούμε να το κάνουμε χωρίς να υπολογίσουμε όλα τα N συνημίτονα; May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 7
8 Αποδοτική Κατάταξη με Συνημίτονο Κεφάλαιο 7.1 Στην πράξη αυτό που κάνουμε: επιλύουμε το πρόβλημα εύρεσης K-κοντινότερων γειτόνων (Knearest neighbor problem) για ένα διάνυσμα ερωτήματος Γενικά, δεν υπάρχουν αποδοτικοί αλγόριθμοι που να δουλεύουν καλά σε χώρους υψηλής διάστασης (high-dimensional spaces) Όμως υπάρχουν λύσεις για ερωτήματα μικρού μήκους, και τα παραδοσιακά ευρετήρια τις υποστηρίζουν καλά May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 8
9 Ειδική Περίπτωση: Ερωτήματα χωρίς Βάρη ε χρησιμοποιούμε βάρη στους όρους του ερωτήματος Υποθέτουμε ότι κάθε όρος ερωτήματος εμφανίζεται μόνο μια φορά Για την κατάταξη δε χρειάζεται να κανονικοποιήσουμε το διάνυσμα ερωτήματος Μικρή απλοποίηση του αλγόριθμου του 6 ου μαθήματος Κεφάλαιο 7.1 May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 9
10 Υπολογισμός των Κ Μεγαλύτερων Συνημιτόνων: Επιλογή vs. Ταξινόμηση Κεφάλαιο 7.1 Ουσιαστικά θέλουμε να ανακτήσουμε τα top K έγγραφα (στην κατάταξη συνημιτόνου για το δοθέν ερώτημα) Όχι να βρούμε μια πλήρη ταξινόμηση όλων των εγγράφων της συλλογής με βάση το συνημίτονο με το διάνυσμα ερωτήματος Μπορούμε να επιλέξουμε τα έγγραφα με τις K μεγαλύτερες τιμές συνημιτόνου; Έστω J = πλήθος εγγράφων με μη μηδενικό συνημίτονο Αναζητούμε τα K καλύτερα από αυτά τα J May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 10
11 Χρήση Σωρού για την Επιλογή των Top K Κεφάλαιο 7.1 Σωρός: δυαδικό δέντρο όπου η τιμή κάθε κόμβου είναι > από τις τιμές των παιδιών του Απαιτεί 2J βήματα σύγκρισης για την κατασκευή, και έπειτα κάθε ένας από τους K νικητές εντοπίζεται σε 2log J βήματα Για J=1M, K=100, αυτό καταλήγει να είναι το 10% του κόστους ταξινόμησης May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 11.1
12 Σημεία Συμφόρησης (Bottlenecks) Κεφάλαιο Κύριο υπολογιστικό σημείο συμφόρησης στη βαθμολόγηση: υπολογισμός συνημιτόνου Μπορούμε να αποφύγουμε αυτό τον υπολογισμό; Ναι, όμως μερικές φορές μπορεί να κάνουμε λάθος Ένα έγγραφο που δεν ανήκει στα top K μπορεί να εμφανιστεί στη λίστα με τα K έγγραφα εξόδου Είναι αυτό τόσο κακό; May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 12
13 Η Συνημιτονοειδής Ομοιότητα είναι απλά κάτι Προσεγγιστικό Κεφάλαιο Ο χρήστης έχει μια εργασία που θέλει να εκτελέσει και διαμορφώνει γι αυτό ένα ερώτημα Το συνημίτονο βρίσκει ταιριάσματα εγγράφων με το ερώτημα Έτσι το συνημίτονο είναι απλά ένα μέσο προσέγγισης της πραγματικής συνάφειας για το χρήστη Εάν πάρουμε μια λίστα από K έγγραφα κοντά στην top K λίστα που προκύπτει από το συνημίτονο, θα πρέπει να μας αρκεί May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 13
14 Γενική Προσέγγιση Κεφάλαιο Εύρεση ενός συνόλου A από υποψήφια έγγραφα (contenders), με K < A << N Το A δεν περιέχει απαραιτήτως τα top K, όμως περιέχει αρκετά έγγραφα που ανήκουν στα top K Επιστρέφουμε το top K έγγραφα στο A Μπορούμε να σκεφτόμαστε το A σαν έναν τρόπο να απορρίπτουμε με υποψήφια έγγραφα (pruning noncontenders) Η ίδια προσέγγιση ακολουθείται και για άλλες (μη συνημιτονοειδείς) συναρτήσεις βαθμολόγησης Θα εξετάσουμε διάφορους τρόπους που ακολουθούν αυτή την προσέγγιση May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 14
15 Κεφάλαιο Απαλοιφή Καταχωρήσεων Ευρετηρίου Ο βασικός αλγόριθμος υπολογισμού του συνημιτόνου λαμβάνει υπόψιν μόνο τα έγγραφα που περιέχουν τουλάχιστον έναν όρο του ερωτήματος Μπορούμε να προχωρήσουμε λίγο αυτή τη διαπίστωση: Εξετάζουμε μόνο τα έγγραφα που περιέχουν όρους ερωτήματος με υψηλό idf Εξετάζουμε μόνο τα έγγραφα που περιέχουν πολλούς όρους του ερωτήματος May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 15
16 Μόνο Όροι με Υψηλό idf Κεφάλαιο Για ένα ερώτημα όπως: catcher in the rye ιατρέχουμε μόνο τις καταχωρήσεις των catcher και rye ιαισθητικά: οι λέξεις in και the συνεισφέρουν λίγο στη βαθμολογία και δεν επηρεάζουν σημαντικά την κατάταξη Πλεονέκτημα: Λίστες καταχώρησης όρων με χαμηλό idf περιέχουν πολλά έγγραφα αυτά τα (πολλά) έγγραφα απορρίπτονται από το σύνολο A των υποψηφίων May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 16
17 Μόνο Έγγραφα με Πολλούς Όρους Ερωτήματος Κεφάλαιο Οποιοδήποτε έγγραφο που περιέχει τολάχιστον έναν όρο ερωτήματος είναι υποψήφιο για την top K λίστα Για ερωτήματα πολλών όρων (multi-term queries), υπολογίζουμε τη βαθμολογία μόνο για έγγραφα που περιέχουν πολλούς όρους ερωτήματος Π.χ., τουλάχιστον 3 από τους 4 Επιβάλλεί μια χαλαρή σύζευξη ( soft conjunction ) σε ερωτήματα που υποβάλονται σε μηχανές αναζήτησης (Google στις αρχές) Εύκολο να υλοποιηθεί κατά τη διάσχιση των λιστών καταχώρησης May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 17
18 3 από 4 Όρους Ερωτήματος Κεφάλαιο Antony Brutus Caesar Calpurnia Οι βαθμολογίες υπολογίζονται μόνο για τα έγγραφα 8, 16 και 32 May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 18
19 Κεφάλαιο Λίστες Πρωταθλητών (Champion Lists) Προϋπολογίζουμε για κάθε όρο του λεξικού t, τα r έγγραφα με το υψηλότερο βάρος στις λίστες καταχώρησης του t Αυτά τα έγγραφα αποτελούν τη λίστα πρωταθλητών (champion list) για τον όρο t (γνωστή και ως fancy list ή top docs για τον όρο t) Σημειώστε ότι το r πρέπει να επιλεγεί κατά το χρόνο κατασκευής του ευρετηρίου Έτσι, είναι πιθανό ότι r < K Στο χρόνο ερώτησης, υπολογίζουμε μόνο τις βαθμολογίες για τα έγγραφα στη λίστα πρωταθλητών κάποιου όρου ερωτήματος Επιλέγονται τα K έγγραφα με την υψηλότερη βαθμολογία ανάμεσα σε αυτά May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 19
20 Ασκήσεις Κεφάλαιο Πώς σχετίζονται οι λίστες πρωταθλητών με το Index Elimination; Μπορούν να χρησιμοποιηθούν μαζί; Πώς μπορούν να υλοποιηθούν οι λίστες πρωταθλητών σε ένα αντεστραμμένο ευρετήριο; Σημειώστε ότι η λίστα πρωταθλητών δεν έχει καμία σχέση με μικρά docids May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 20
21 Στατικές Βαθμολογίες Ποιότητας (Static Quality Scores) Επιθυμούμε τα κορυφαία έγγραφα στην κατάταξη να είναι τόσο σχετικά όσο και authoritative Η σχετικότητα μοντελοποιείται από τις βαθμολογίες συνημιτόνου Η Authority είναι μια ιδιότητα ενός εγγράφου που είναι ανεξάρτητη ερωτήματος Παραδείγματα authority Η Wikipedia ανάμεσα σε άλλους ιστότοπους Άρθρα σε συγκεκριμένες εφημερίδες Ένα άρθρο με πολλές ετεροαναφορές Πολλές εμφανίσεις σε bitly s, diggs ή del.icio.us (Pagerank) Κεφάλαιο Quantitative May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 21
22 Μοντελοποίηση του Authority Κεφάλαιο Ανάθεση σε κάθε έγγραφο d μιας βαθμολογίας ποιότητας ανεξάρτητης από το ερώτημα (query-independent quality score) στο διάστημα [0,1] Το συμβολίζουμε αυτό με g(d) Έτσι, μια ποσότητα όπως το πλήθος των ετεροαναφορών κανονικοποιείται στο [0,1] Άσκηση: προτείνετε μια φόρμουλα/εξίσωση γι αυτό May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 22
23 Καθαρή Βαθμολογία (Net Score) Κεφάλαιο Ας θεωρήσουμε μια απλή συνολική βαθμολογία που συνδυάζει συνάφεια κατά συνημίτονο και authority net-score(q,d) = g(d) + cosine(q,d) Μπορεί να χρησιμοποιηθεί κάποιος άλλος γραμμικός συνδυασμός Πράγματι, μπορεί να χρησιμοποιηθεί οποιαδήποτε συνάρτηση των δυο σημάτων ικανοποίησης του χρήστη περισσότερα αργότερα Τώρα αναζητούμε τα top K έγγραφα κατά net score May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 23
24 Top K κατά net score Γρήγορες Μέθοδοι Πρώτη ιδέα: κατάταξη όλων των καταχωρήσεων κατά g(d) Βασικό: αυτή η κατάταξη είναι κοινή για όλες τις λίστες καταχώρησης Έτσι, μπορούμε ταυτόχρονα να διασχίσουμε τις λίστες καταχωρήσεων όρων για Τομή καταχωρήσεων λιστών Υπολογισμό συνημιτόνου Άσκηση: γράψτε ψευδοκώδικα για υπολογισμό συνημιτόνου εάν οι λίστες καταχώρησης είναι ταξινομημένες κατά g(d) Κεφάλαιο May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 24
25 Κεφάλαιο Γιατί Ταξινομούμε τις Λίστες κατά g(d)? Με την ταξινόμηση κατά g(d), τα έγγραφα με υψηλή βαθμολογία (top-scoring docs) είναι πιθανό να εμφανιστούν νωρίς κατά τη διάσχιση των λιστών Σε εφαρμογές που ο χρόνος είναι κρίσιμος (π.χ., όταν πρέπει να επιστρέψουμε οσαδήποτε αποτελέσματα μπορούμε σε 50 ms), αυτό επιτρέπει να σταματήσουμε νωρίς τη διάσχιση των λιστών Χωρίς να υπολογίσουμε βαθμολογίες για όλα τα έγγραφα στις λίστες καταχώρησης May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 25
26 Λίστες Πρωταθλητών με Κατάταξη κατά g(d) Μπορούμε να συνδυάσουμε τις λίστες πρωταθλητών (champion lists) με την κατάταξη κατά g(d) ιατηρούμε για κάθε όρο μια λίστα πρωταθλητών των r εγγράφων με την υψηλότερη βαθμολογία g(d) + tf-idf td Αναζητούμε τα top-k αποτελέσματα μόνο από τα έγγραφα σε αυτές τις λίστες πρωταθλητών Κεφάλαιο May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 26
27 Υψηλές και Χαμηλές Λίστες (High and Low Lists) Για κάθε όρο, διατηρούμε δύο λίστες καταχώρησης που ονομάζονται high και low Μπορείτε να θεωρείτε τη high σαν τη λίστα πρωταθλητών Καθώς διασχίζουμε λίστες καταχώρησης για ένα ερώτημα, αρχικά διασχίζουμε μόνο τις high λίστες Εάν βρούμε πάνω από K έγγραφα, επιλέγουμε τα top K και τέλος Κεφάλαιο Αλλιώς συνεχίζουμε προσπαθώντας να βρούμε έγγραφα από τις low λίστες Μπορεί να χρησιμοποιηθεί ακόμα και για απλές βαθμολογίες συνημιτόνου, δίχως καθολική βαθμολογία ποιότητας g(d) Είναι ένας τρόπος για for τμηματοποίηση ευρετηρίων (segmenting index) σε δύο επίπεδα (tiers) May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 27
28 Κατάταξη κατά Επίπτωση (Impactordered postings) Θέλουμε να υπολογίσουμε βαθμολογίες μόνο για έγγραφα για τα οποία η τιμή wf t,d είναι αρκετά υψηλή Ταξινομούμε κάθε λίστα καταχώρησης κατά wf t,d Τώρα: δεν έχουν όλες οι λίστες καταχώρησης κοινή κατάταξη! Πώς υπολογίζουμε βαθμολογίες ώστε να επιλέξουμε τα top K έγγραφα? Ακολουθούν δύο ιδέες για αυτό Κεφάλαιο May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 28
29 Κεφάλαιο Έγκαιρος Τερματισμός (Early termination) Καθώς διασχίζουμε τίς καταχωρήσεις του όρου t, μπορούμε να σταματήσουμε μετά από ένα από τα ακόλουθα Μετά από ένα συγκεκριμένο αριθμό r εγγράφων Αφού η τιμή wf t,d πέσει κάτω από ένα κατώφλι (threshold) Παίρνουμε την ένωση των συνόλων εγγράφων που προκύπτουν Ένα σύνολο για τις καταχωρήσεις κάθε όρου ερωτήματος Υπολογίζουμε μόνο τις βαθμολογίες για τα έγγραφα σε αυτή την ένωση May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 29
30 2. Κατάταξη Όρων κατά idf (idf-ordered terms) Όταν εξετάζουμε τις καταχωρήσεις που αντιστοιχούν σε όρους ερωτήματος Τις εξετάζουμε κατά φθίνουσα σειρά τιμών idf Όροι με υψηλό idf είναι πιο πιθανό να συνεισφέρουν πολύ στη βαθμολογία Καθώς ενημερώνουμε τη συνεισφορά βαθμολογίας για κάθε όρο ερωτήματος Κεφάλαιο Σταματάμε όταν παρατηρήσουμε ότι οι βαθμολογίες εγγράφων παραμένουν σχετικά οι ίδιες Εφαρμόσιμο σε συνημίτονο ή σε άλλο net score May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 30
31 Κλάδεμα Συστάδων (Cluster pruning): Προεπεξεργασία Επιλέγουμε N έγγραφα με τυχαίο τρόπο: ανομάζονται αρχηγοί (leaders) Για κάθε άλλο έγγραφο, υπολογίζουμε σε μια φάση προεπεξεργασίας τον κοντινότερο αρχηγό Έτσι τα έγγραφα ανατίθενται σε ένα αρχηγό: ονομάζονται followers Πολύ πιθανώς: κάθε αρχηγός έχει ~ N followers Κεφάλαιο May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 31
32 Κλάδεμα Συστάδων: Επεξεργασία Επερωτήσεων Κεφάλαιο Ένα ερώτημα το επεξεργαζόμαστε ως εξής: οθέντος του ερωτήματος Q, βρίσκουμε τον κοντινότερο αρχηγό L Αναζητούμε τα K κοντινότερα έγγραφα ανάμεσα στους followers του L May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 32
33 Οπτικοποίηση Κεφάλαιο Query Leader Follower May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 33
34 Γιατί Χρησιμοποιείται Τυχαία Κεφάλαιο Δειγματοληψία Είναι γρήγορη Οι επιλεγμένοι αρχηγοί (leaders) αντανακλούν την κατανομή των δεδομένων May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 34
35 Γενικές Παραλλαγές Κεφάλαιο Κάθε follower ανατίθεται σε b1=3 (έστω) κοντινότερους αρχηγούς Για το ερώτημα, βρίσκουμε b2=4 (έστω) κοντινότερους αρχηγούς και τους followers αυτών Μπορούμε αναδρομικά να κατασκευάζουμε leader/follower συσχετίσεις May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 35
36 Ασκήσεις Κεφάλαιο To find the nearest leader in step 1, how many cosine computations do we do? Why did we have N in the first place? What is the effect of the constants b1, b2 on the previous slide? Devise an example where this is likely to fail i.e., we miss one of the K nearest docs. Likely under random sampling. May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 36
37 Παραμετρικά Ευρετήρια και Κεφάλαιο 6.1 Ευρετήρια Ζωνών Μέχρι τώρα, θεωρούσαμε ότι ένα έγγραφο είναι μια ακολουθία όρων Στην πραγματικότητα, τα έγγραφα έχουν πολλαπλά μέρη, ορισμένα εκ των οποίων έχουν ιδιαίτερη σημασιολογία: Author Title Date of publication Language Format κτλ. Αυτά είναι τα μεταδεδομένα (metadata) ενός εγγράφου May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 37
38 Πεδία Κεφάλαιο 6.1 Ορισμένες φορές επιθυμούμε να κάνουμε αναζήτηση με βάση τα μεταδεδομένα Π.χ., εύρεση εγγράφων με συγγραφέα τον William Shakespeare το έτος 1601, και περιέχουν alas poor Yorick Έτος = 1601 είναι ένα παράδειγμα πεδίου (field) Επίσης, επώνυμο συγγραφέα = shakespeare, κτλ. Ευρετήριο πεδίου ή παραμετρικό (field or parametric index): καταχωρήσεις για κάθε τιμή πεδίου Μερικές φορές χτίζουμε range trees (π.χ., για ημερομηνίες) Το ερώτημα πεδίου (field query) το χειριζόμαστε σαν σύζευξη (το έγγραφο πρέπει να έχει συγγραφέα τον shakespeare) May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 38
39 Ζώνη Κεφάλαιο 6.1 Μια ζώνη (zone) είναι μια περιοχή του εγγράφου η οποία μπορεί να περιέχει ένα αυθαίρετο μέγεθος κειμένου, π.χ., Title Abstract References Χτίζουμε αντεστραμμένα ευρετήρια και για ζώνες, ώστε να επιτρέπεται η επεξεργασία επερωτήσεων Π.χ., εύρεση εγγράφων με τη λέξη merchant στη ζώνη τίτλου και να ταιριάζει με το ερώτημα gentle rain May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 39
40 Παράδειγμα Ευρετήριου Ζώνης Κεφάλαιο 6.1 Κωδικοποίηση ζωνών στο λεξικό vs. στις λίστες May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 40
41 Διαστρωματωμένα Ευρετήρια (Tiered Indexes) ιασπώνται οι καταχωρήσεις σε μια ιεραρχία λιστών Πιο σημαντικές Λιγότερο σημαντικές Μπορεί να γίνει κατά g(d) ή άλλο μέτρο Το αντεστραμμένο ευρετήριο διασπάται σε επίπεδα (tiers) φθίνουσας σημασίας Στο χρόνο ερώτησης χρησιμοποιούνται τα υψηλότερα επίπεδα, εκτός κι αν αποτύχουν να μας δώσουν K έγγραφα Εάν συμβεί αυτό, πηγαίνουμε στα χαμηλότερα επίπεδα Κεφάλαιο May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 41
42 Παράδειγμα Διαστρωματωμένου Κεφάλαιο Ευρετηρίου May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 42
43 Εγγύτητα Όρων Ερωτήματος Κεφάλαιο Ερωτήματα ελεύθερου κειμενου (free text queries): απλά ένα σύνολο όρων που έχουν γραφεία στο κουτί αναζήτησης κοινό σενάριο στον Παγκόσμιο Ιστό Οι χρήστες προτιμούν έγγραφα στα οποία οι όροι του ερωτήματος εμφανίζονται σε κοντινές μεταξύ τους θέσεις Έστω w το μικρότερο παράθυρο (window) σε ένα έγγραφο που περιέχει όλους τους όρους, π.χ., Για το ερώτημα strained mercy το μικρότερο παράθυρο στο έγγραφο The quality of mercy is not strained είναι 4 (λέξεις) Θα θέλαμε να λαμβάνεται υπόψιν στη βαθμολόγηση πώς; May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 43
44 Query Parsers Κεφάλαιο Ένα ερώτημα ελεύθερου κειμένου από κάποιο χρήστη μπορεί να εμπεριέχει ένα ή πολλαπλά ερωτήματα προς τα ευρετήρια, π.χ., ερώτημα rising interest rates Εκτελείται το ερώτημα σαν ερώτημα φράσης (phrase query) Εάν <K έγγραφα περιέχουν τη φράση rising interest rates, εκτελούμε τα δύο ερωτήματα φράσης rising interest και interest rates Εάν εξακολουθούμε να έχουμε <K έγγραφα, εκτελούμε το ερώτημα διανυσματικού χώρου rising interest rates Κατατάσσουμε τα έγγραφα που ταιριάζουν με το ερώτημα κατά βαθμολόγηση διανυσματικού χώρου Αυτή η ακολουθία βημάτων γίνεται από έναν query parser May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 44
45 Συναθροιστική Βαθμολόγηση Κεφάλαιο Ειδαμε ότι συναρτήσεις βαθμολόγησης μπορεί να συνδυάζουν συνημίτονο, στατική ποιότητα, εγγύτητα, κτλ. Πώς ξέρουμε ποιος είναι ο βέλτιστος συδυασμός; Για μερικές εφαρμογές καθορίζεται από κάποιον ειδικό (expert-tuned) Ολοένα και συχνότερα: χρησιμοποιείται μηχανική μάθηση (machine-learned) May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 45
46 Βάζοντάς τα Όλα Μαζί Κεφάλαιο May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 46
47 Πηγές Αναφοράς Εισαγωγή στην Ανάκτηση Πληροφοριών, κεφάλαια 7, 6.1 May 17, 2016 Ανάκτηση Πληροφοριών,6ο Εξάμηνο 47
6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης
Διαβάστε περισσότεραΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 6, 7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου.
ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαια 6, 7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι θα δούμε σήμερα; Βαθμολόγηση και κατάταξη εγγράφων Στάθμιση
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 8: Θέματα Υλοποίησης. Περίληψη Αποτελεσμάτων. 1 Κεφ. 6 Τι είδαμε στο προηγούμενο μάθημα Βαθμολόγηση
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing
Διαβάστε περισσότεραΜΥΕ003: Ανάκτηση Πληροφορίας
ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαια 6, 7, 8.7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. Περιλήψεις. 1 Κεφ. 6 Τι θα δούμε σήμερα; Βαθμολόγηση και κατάταξη
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6: Θέματα Υλοποίησης. Περίληψη Αποτελεσμάτων. 1 Κεφ. 6 Τι είδαμε στο προηγούμενο μάθημα Βαθμολόγηση
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΜΥΕ003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6-7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι θα δούμε σήμερα;
Διαβάστε περισσότεραΕυρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Ευρετήρια Ευαγγελία Πιτουρά 1 τιμή γνωρίσματος Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται
Διαβάστε περισσότεραΠανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι θα δούμε σήμερα; Βαθμολόγηση
Διαβάστε περισσότεραΤι (άλλο) θα δούμε σήμερα;
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη6: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. 1 Κεφ. 6 Τι (άλλο) θα δούμε σήμερα;
Διαβάστε περισσότεραΕυρετήρια. Ευρετήρια. Βάσεις Δεδομένων 2009-2010: Ευρετήρια 1
Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου
Διαβάστε περισσότεραΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 4: Μοντελοποίηση: Διανυσματικό μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότεραΕυρετήρια. Ευρετήρια. Βάσεις Δεδομένων : Ευρετήρια 1
Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου
Διαβάστε περισσότεραΕισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Εισαγωγή στην Επεξεργασία Ερωτήσεων Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα Βάσεις
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΛΥΣΕΙΣ 2 ης ΣΕΙΡΑΣ ΑΣΚΗΣΕΩΝ
ΛΥΣΕΙΣ 2 ης ΣΕΙΡΑΣ ΑΣΚΗΣΕΩΝ Άσκηση 1 Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα 5 έγγραφα: Έγγραφο 1: «Computer Games» Έγγραφο 2: «Computer Games Computer Games» Έγγραφο 3: «Games Theory and
Διαβάστε περισσότεραΕισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα 2 Βήματα Επεξεργασίας Τα βασικά βήματα στην επεξεργασία
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων
Διαβάστε περισσότερα0 The quick brown fox leaped over the lazy lazy dog 1 Quick brown foxes leaped over lazy dogs for fun
Κ24: Προγραμματισμός Συστήματος - 1η Εργασία, Εαρινό Εξάμηνο 2018 Προθεσμία Υποβολής: Κυριακή 18 Μαρτίου, 23:59 Εισαγωγή Στην εργασία αυτή θα υλοποιήσετε μία μίνι μηχανή αναζήτησης (search engine). Οι
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων Σ Β Βάση εδομένων Η ομή ενός ΣΒ Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 2 Εισαγωγή Εισαγωγή ΜΕΡΟΣ 1 (Χρήση Σ Β ) Γενική
Διαβάστε περισσότεραΛύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική
Διαβάστε περισσότεραΕισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ Ε ΟΜΕΝΩΝ Αρχεία δεδομένων συστήματος Σύστημα Βάσεων εδομένων (ΣΒ ) 2 :
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008
Διαβάστε περισσότεραΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται
Διαβάστε περισσότεραΔημιουργία Ευρετηρίων Συλλογής Κειμένων
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 - Project Σεπτεμβρίου Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος Εξέταση: Προφορική, στο τέλος της εξεταστικής. Θα βγει ανακοίνωση στο forum. Ομάδες
Διαβάστε περισσότεραΕύρεση & Διαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Διδάσκων Δημήτριος Κατσαρός
Εύρεση & Διαχείριση Πληροφορίας στον Παγκόσµιο Ιστό Διδάσκων Δημήτριος Κατσαρός Διάλεξη 10η: 31/03/2014 1 Problem with Boolean search: feast or famine Ch. 6 Boolean queries often result in either too few
Διαβάστε περισσότερα5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 5. Απλή Ταξινόμηση 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 11/11/2016 Εισαγωγή Η
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΤα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη
Ευρετήρια 1 Αρχεία Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη µνήµη. Η µεταφορά δεδοµένων από το δίσκο στη µνήµη και από τη
Διαβάστε περισσότεραΚεφ.11: Ευρετήρια και Κατακερματισμός
Κεφ.11: Ευρετήρια και Κατακερματισμός Database System Concepts, 6 th Ed. See www.db-book.com for conditions on re-use Κεφ. 11: Ευρετήρια-Βασική θεωρία Μηχανισμοί ευρετηρίου χρησιμοποιούνται για την επιτάχυνση
Διαβάστε περισσότεραΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων
ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ AM: Δοµές Δεδοµένων Εξεταστική Ιανουαρίου 2014 Διδάσκων : Ευάγγελος Μαρκάκης 20.01.2014 ΥΠΟΓΡΑΦΗ ΕΠΟΠΤΗ: Διάρκεια εξέτασης : 2 ώρες και
Διαβάστε περισσότεραΤα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο
Κατακερματισμός 1 Αποθήκευση εδομένων (σύνοψη) Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο Παραδοσιακά, μία σχέση (πίνακας/στιγμιότυπο) αποθηκεύεται σε ένα αρχείο Αρχείο δεδομένων
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university
Διαβάστε περισσότεραΕιδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων
Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις
Διαβάστε περισσότεραΣχεδίαση και Ανάλυση Αλγορίθμων
Σχεδίαση και Ανάλυση Αλγορίθμων Ενότητα 4.0 Επιλογή Αλγόριθμοι Επιλογής Select και Quick-Select Σταύρος Δ. Νικολόπουλος 2016-17 Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιο Ιωαννίνων Webpage: www.cs.uoi.gr/~stavros
Διαβάστε περισσότεραΓενικά Στοιχεία Ηλεκτρονικού Υπολογιστή
Γενικά Στοιχεία Ηλεκτρονικού Υπολογιστή 1. Ηλεκτρονικός Υπολογιστής Ο Ηλεκτρονικός Υπολογιστής είναι μια συσκευή, μεγάλη ή μικρή, που επεξεργάζεται δεδομένα και εκτελεί την εργασία του σύμφωνα με τα παρακάτω
Διαβάστε περισσότεραHY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems
HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη
Διαβάστε περισσότεραΔομές Δεδομένων. Δημήτρης Μιχαήλ. Ουρές Προτεραιότητας. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο
Δομές Δεδομένων Ουρές Προτεραιότητας Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρά Προτεραιότητας Το πρόβλημα Έχουμε αντικείμενα με κλειδιά και θέλουμε ανά πάσα στιγμή
Διαβάστε περισσότεραΚεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων
Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι
Διαβάστε περισσότεραΜία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων
Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων ΜΑΘΗΜΑ Ανάκτηση Πληροφορίας Παππάς Χρήστος Ιωάννινα, Ιανουάριος 2010 Διάρθρωση Εισαγωγή Πρόβλημα Σημαντικότητα Ενδιαφέροντα θέματα Τεχνικό
Διαβάστε περισσότεραΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ
ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότεραΠανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 12/10/2017
Διαβάστε περισσότεραΤο εσωτερικό ενός Σ Β
Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL) ηµιουργία/κατασκευή Εισαγωγή εδοµένων
Διαβάστε περισσότεραΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ
ΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΘΕΜΑ 1 (Α) Σημειώστε δίπλα σε κάθε πρόταση «Σ» ή «Λ» εφόσον είναι σωστή ή λανθασμένη αντίστοιχα. 1. Τα συντακτικά λάθη ενός προγράμματος
Διαβάστε περισσότεραΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ
ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ Δρ. Κουζαπάς Δημήτριος Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής Μηχανές Αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες
Διαβάστε περισσότεραΑνάκτηση Δεδομένων (Information Retrieval)
Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας
Διαβάστε περισσότερα9. Κόκκινα-Μαύρα Δέντρα
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 9. Κόκκινα-Μαύρα Δέντρα 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 9/12/2016 Δέντρα,
Διαβάστε περισσότερα1. Financial New Times Year MAXk {FREQij} D D D D
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY46 - Συστήματα Ανάκτησης Πληροφοριών 2004-2005 Εαρινό Εξάμηνο 2 η Σειρά ασκήσεων (Μοντέλα Ανάκτησης Πληροφοριών και Ευρετήρια) Ανάθεση: 6 Μαρτίου Παράδοση:
Διαβάστε περισσότεραΠανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 21/10/2016
Διαβάστε περισσότεραΠιθανοκρατικό μοντέλο
Πιθανοκρατικό μοντέλο Το μοντέλο MAP Αλέξανδρος Γκιμπερίτης Βασίλης Μπούργος Δημήτρης Σουραβλιάς 1 Εισαγωγικές έννοιες Κάθε έγγραφο d της συλλογής παριστάνεται από το δυαδικό διάνυσμα x = (x 1, x 2,...,
Διαβάστε περισσότερα1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Συμπληρωματικές σημειώσεις για τον μηχανισμό VCG 1 Εισαγωγή στις Συνδυαστικές
Διαβάστε περισσότεραΚατακερµατισµός. Οργάνωση Αρχείων (σύνοψη) Οργάνωση αρχείων: πως είναι τοποθετημένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο
Κατακερµατισµός 1 Οργάνωση Αρχείων (σύνοψη) Οργάνωση αρχείων: πως είναι τοποθετημένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο 1. Αρχεία Σωρού 2. Ταξινομημένα Αρχεία Φυσική διάταξη των εγγραφών
Διαβάστε περισσότεραΕισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων
Βάσεις εδοµένων 2003-2004 Ευαγγελία Πιτουρά 1 ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Επεξεργασία Ερωτήσεων Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL)
Διαβάστε περισσότεραΑξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας
Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Σε ένα σύστημα φιλτραρίσματος πληροφορίας, ή αλλιώς σύστημα έκδοσης/συνδρομής, οι χρήστες εγγράφονται
Διαβάστε περισσότεραΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2015-2016 Θέμα Α Α1. Να γράψετε στο τετράδιό σας τον αριθμό καθεμιάς από τις προτάσεις 1-4 και δίπλα τη λέξη ΣΩΣΤΟ,
Διαβάστε περισσότεραDISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS
DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS Paper By: Gleb Skobeltsyn, Karl Aberer Presented by: Βασίλης Φωτόπουλος Agenda 1. Ορισμός του προβλήματος
Διαβάστε περισσότεραK15 Ψηφιακή Λογική Σχεδίαση 7-8: Ανάλυση και σύνθεση συνδυαστικών λογικών κυκλωμάτων
K15 Ψηφιακή Λογική Σχεδίαση 7-8: Ανάλυση και σύνθεση συνδυαστικών λογικών κυκλωμάτων Γιάννης Λιαπέρδος TEI Πελοποννήσου Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ Η έννοια του συνδυαστικού
Διαβάστε περισσότεραEFFICIENT TOP-K QUERYING OVER SOCIAL-TAGGING NETWORKS
EFFICIENT TOP-K QUERYING OVER SOCIAL-TAGGING NETWORKS Ralf Schenkel, Tom Crecelious, Mouna Kacimi, Sebastian Michel, Thomas Neumann, Josiane Xavier Parreira, Gerhard Weikum ΠΡΟΒΛΗΜΑ Εύρεση ενός αποτελεσματικού
Διαβάστε περισσότεραΑνάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων
Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2
Διαβάστε περισσότεραΔιαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη
Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου
Διαβάστε περισσότεραΈστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η
Μονοδιάστατοι Πίνακες Τι είναι ο πίνακας γενικά : Πίνακας είναι μια Στατική Δομή Δεδομένων. Δηλαδή συνεχόμενες θέσεις μνήμης, όπου το πλήθος των θέσεων είναι συγκεκριμένο. Στις θέσεις αυτές καταχωρούμε
Διαβάστε περισσότεραΑΡΧΗ 2ΗΣ ΣΕΛΙΔΑΣ Γ Α... Β
ΘΕΜΑ Α ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ ΠΡΟΣΟΜΟΙΩΣΗ ΑΠΟΛΥΤΗΡΙΩΝ ΕΞΕΤΑΣΕΩΝ Γ' ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΔΕΥΤΕΡΑ 11 ΑΠΡΙΛΙΟΥ 2011 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΕΧΝΟΛΟΓΙΚΗΣ
Διαβάστε περισσότεραΣέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2
Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Πρόκειται για μια οικογένεια μη γραμμικών ταξινομητών Είναι συστήματα απόφασης πολλών σταδίων (multistage),
Διαβάστε περισσότεραΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012
ΔΕ. ΙΟΥΝΙΟΥ Δίνονται τα εξής πρότυπα: [ ] [ ] [ ] [ ] Άσκηση η ( μονάδες) Χρησιμοποιώντας το κριτήριο της ομοιότητας να απορριφθεί ένα χαρακτηριστικό με βάσει το συντελεστή συσχέτισης. (γράψτε ποιο χαρακτηριστικό
Διαβάστε περισσότεραΠροτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 28-29 Εαρινό Εξάμηνο Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης &
Διαβάστε περισσότεραΔυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Δυναμικός Κατακερματισμός Βάσεις Δεδομένων 2017-2018 1 Κατακερματισμός Πρόβλημα στατικού κατακερματισμού: Έστω Μ κάδους και r εγγραφές ανά κάδο - το πολύ Μ * r εγγραφές (αλλιώς μεγάλες αλυσίδες υπερχείλισης)
Διαβάστε περισσότεραΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2010-2011 ΑΣΚΗΣΗ Συγκομιδή και δεικτοδότηση ιστοσελίδων Σκοπός της άσκησης είναι η υλοποίηση ενός ολοκληρωμένου συστήματος συγκομιδής και δεικτοδότησης ιστοσελίδων.
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1
Διαβάστε περισσότεραΘέμα: Ανάπτυξη Βασικής Πλατφόρμας για Υπηρεσίες με Βάση το Προφίλ και τη Θέση (Profile & Location Based Services)
Θέμα: Ανάπτυξη Βασικής Πλατφόρμας για Υπηρεσίες με Βάση το Προφίλ και τη Θέση (Profile & Location Based Services) Επιβλέπων καθηγητής: Ι. Βασιλείου Συγγραφείς: Ιωάννης Κολτσίδας, Παναγιώτης Παπαδημητρίου
Διαβάστε περισσότεραΚΕΦΑΛΑΙΟ 2: Τύποι δεδομένων και εμφάνιση στοιχείων...33
ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος του συγγραφέα... 13 Πρόλογος του καθηγητή Τιμολέοντα Σελλή... 15 ΚΕΦΑΛΑΙΟ 1: Εργαλεία γλωσσών προγραμματισμού...17 1.1 Γλώσσες προγραμματισμού τρίτης γεννεάς... 18 τι είναι η γλώσσα
Διαβάστε περισσότεραΣύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης
Σύνοψη Προηγούμενου Πίνακες (Arrays Ορέστης Τελέλης telelis@unipi.gr Τμήμα Ψηφιακών Συστημάτων, Πανεπιστήμιο Πειραιώς Διαδικαστικά θέματα. Aντικείμενο Μαθήματος. Aντικείμενα, Κλάσεις, Μέθοδοι, Μεταβλητές.
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 9: Ανάδραση Σχετικότητας (Relevance Feedback ή RF) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται
Διαβάστε περισσότεραHY Λογική Διδάσκων: Δ. Πλεξουσάκης Εαρινό Εξάμηνο. Φροντιστήριο 6
HY-180 - Λογική Διδάσκων: Δ. Πλεξουσάκης Εαρινό Εξάμηνο 2015-2016 Φροντιστήριο 6 Α) ΘΕΩΡΙΑ Μέθοδος Επίλυσης (Resolution) Στη μέθοδο της επίλυσης αποδεικνύουμε την ικανοποιησιμότητα ενός συνόλου προτάσεων,
Διαβάστε περισσότεραΔυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Δυναμικός Κατακερματισμός 1 Κατακερματισμός Τι αποθηκεύουμε στους κάδους; Στα παραδείγματα δείχνουμε μόνο την τιμή του πεδίου κατακερματισμού Την ίδια την εγγραφή (ως τρόπος οργάνωσης αρχείου) μέγεθος
Διαβάστε περισσότεραΕργαστήριο 6 ο 7 ο / Ερωτήματα Ι
Εργαστήριο 6 ο 7 ο / Ερωτήματα Ι Απλά ερωτήματα Επιλογής Ερωτήματα με Ενώσεις πινάκων Ερωτήματα με Παραμετρικά Κριτήρια Ερωτήματα με Υπολογιζόμενα πεδία Απλά ερωτήματα Επιλογής Τα Ερωτήματα μας επιτρέπουν
Διαβάστε περισσότεραΘεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων
Θεωρία Αποφάσεων ο Φροντιστήριο Λύσεις των Ασκήσεων Άσκηση Έστω ένα πρόβλημα ταξινόμησης μιας διάστασης με δύο κατηγορίες, όπου για κάθε κατηγορία έχουν συλλεχθεί τα παρακάτω δεδομένα: D = {, 2,,,,7 }
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #11 Suffix Arrays Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης Το παρόν
Διαβάστε περισσότεραΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:
Διαβάστε περισσότεραΔυναμικός Κατακερματισμός
Δυναμικός Κατακερματισμός Καλό για βάση δεδομένων που μεγαλώνει και συρρικνώνεται σε μέγεθος Επιτρέπει τη δυναμική τροποποίηση της συνάρτησης κατακερματισμού Επεκτάσιμος κατακερματισμός μια μορφή δυναμικού
Διαβάστε περισσότεραΠίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση
Πίνακες Διασποράς Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση κλειδί k T 0 1 2 3 4 5 6 7 U : χώρος πιθανών κλειδιών Τ : πίνακας μεγέθους
Διαβάστε περισσότεραΟυρές Προτεραιότητας: Υπενθύμιση. Σωροί / Αναδρομή / Ταξινόμηση. Υλοποίηση Σωρού. Σωρός (Εισαγωγή) Ορέστης Τελέλης
Ουρές Προτεραιότητας: Υπενθύμιση Σωροί / Αναδρομή / Ταξινόμηση Ορέστης Τελέλης telelis@unipi.gr Τμήμα Ψηφιακών Συστημάτων, Πανεπιστήμιο Πειραιώς (Abstract Data Type) με μεθόδους: Μπορεί να υλοποιηθεί με
Διαβάστε περισσότεραΠροβλήματα, αλγόριθμοι, ψευδοκώδικας
Προβλήματα, αλγόριθμοι, ψευδοκώδικας October 11, 2011 Στο μάθημα Αλγοριθμική και Δομές Δεδομένων θα ασχοληθούμε με ένα μέρος της διαδικασίας επίλυσης υπολογιστικών προβλημάτων. Συγκεκριμένα θα δούμε τι
Διαβάστε περισσότεραΣχεδίαση & Ανάλυση Αλγορίθμων
Σχεδίαση & Ανάλυση Αλγορίθμων Ενότητα 3 Αλγόριθμοι Επιλογής Σταύρος Δ. Νικολόπουλος Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιο Ιωαννίνων Webpage: www.cs.uoi.gr/~stavros Αλγόριθμοι Επιλογής Γνωρίζουμε
Διαβάστε περισσότεραModel) Retrieval Model)... 18
Πανεπιστήμιο Πατρών Πολυτεχνική Σχολή Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Αποδοτική Ιεραρχημένη Ανάκτηση Κοινωνικού Περιεχομένου με Χρήση Ταξονομιών Ετικετών Κοντοτάσιου Ιωάννα ΑΜ:
Διαβάστε περισσότεραΑ2. Να γράψετε στο τετράδιο σας τον αριθμό 1-4 κάθε πρότασης και δίπλα το γράμμα που δίνει τη σωστή επιλογή.
ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β ) ΚΥΡΙΑΚΗ 23/04/2017 - ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΕΠΠ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ: ΕΠΤΑ ( 7) ΘΕΜΑ Α Α1. Να χαρακτηρίσετε τις προτάσεις που ακολουθούν γράφοντας στο
Διαβάστε περισσότεραΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ενότητα: 11Η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ Δρ. ΠΑΝΤΕΛΗΣ ΑΓΓΕΛΙΔΗΣ Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative
Διαβάστε περισσότεραQuery-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer
Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων
Διαβάστε περισσότεραLALING/PLALING :
1. Άρθρα- δημοσιεύσεις Scopus DBLP Pubmed Google Scholar 2. Αναζήτηση νουκλεοτιδίου- πρωτεΐνης Entrez : http://www.ncbi.nlm.nih.gov/nuccore/ Uniprot (πρωτεΐνης): http://www.uniprot.org/ Blast : http://blast.ncbi.nlm.nih.gov/blast.cgi
Διαβάστε περισσότεραΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ Τελικό επαναληπτικό διαγώνισμα Επιμέλεια: Δρεμούσης Παντελής
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ Τελικό επαναληπτικό διαγώνισμα Επιμέλεια: Δρεμούσης Παντελής ΘΕΜΑ 1 ο Α. Να χαρακτηρίσετε τις παρακάτω προτάσεις ως σωστές ή λανθασμένες. 1. Μια διαδικασία
Διαβάστε περισσότεραΠληροφορική 2. Δομές δεδομένων και αρχείων
Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΣΔΒΔ Σύνολο από προγράµµατα για τη διαχείριση της ΒΔ Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ Αρχεία δεδοµένων συστήµατος Σύστηµα Βάσεων Δεδοµένων (ΣΒΔ)
Διαβάστε περισσότεραΑκαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS
Ακαδημαϊκό Έτος 2016-2017, Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS A. Εισαγωγή στις βάσεις δεδομένων - Γνωριμία με την ACCESS B. Δημιουργία Πινάκων 1. Εξήγηση των
Διαβάστε περισσότεραΟι δυναμικές δομές δεδομένων στην ΑΕΠΠ
Καθηγητής Πληροφορικής Απαγορεύεται η αναπαραγωγή των σημειώσεων χωρίς αναφορά στην πηγή Οι σημειώσεις, αν και βασίζονται στο διδακτικό πακέτο, αποτελούν προσωπική θεώρηση της σχετικής ύλης και όχι επίσημο
Διαβάστε περισσότεραΕφαρμόζονται σε προβλήματα στα οποία δεν υπάρχει πληροφορία που να επιτρέπει την αξιολόγηση των καταστάσεων του χώρου αναζήτησης.
Ανάλογα με το αν ένας αλγόριθμος αναζήτησης χρησιμοποιεί πληροφορία σχετική με το πρόβλημα για να επιλέξει την επόμενη κατάσταση στην οποία θα μεταβεί, οι αλγόριθμοι αναζήτησης χωρίζονται σε μεγάλες κατηγορίες,
Διαβάστε περισσότεραΑσκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1
Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n
Διαβάστε περισσότεραΔυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Δυναμικός Κατακερματισμός Βάσεις Δεδομένων 2018-2019 1 Κατακερματισμός Πρόβλημα στατικού κατακερματισμού: Έστω Μ κάδους και r εγγραφές ανά κάδο - το πολύ Μ * r εγγραφές (αλλιώς μεγάλες αλυσίδες υπερχείλισης)
Διαβάστε περισσότερα