ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΙI. Β. Μεγαλοοικονόµου. Βάσεις εδοµένων Κειµένου
|
|
- Ἁνανίας Βυζάντιος
- 9 χρόνια πριν
- Προβολές:
Transcript
1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΙI Β. Μεγαλοοικονόµου Βάσεις εδοµένων Κειµένου (παρουσίαση βασισµένη εν µέρη σε σηµειώσεις των Silberchatz, Korth και Sudarshan και του C. Faloutsos)
2 Κείµενο οµή διάλεξης Κείµενο Πρόβληµα Σάρωση πλήρους κειµένου Αναστροφή Αρχεία υπογραφής Οµαδοποίηση Φιλτράρισµα πληροφορίας και LSI
3 Πρόβληµα- Κίνητρο Π.χ., να βρεθούν έγγραφα τα οποία περιέχουν τις λέξεις data και retrieval Εφαρµογές: Ιστός ικηγορικά γραφεία και γραφεία ευρεσιτεχνειών Ψηφιακές βιβλιοθήκες Φιλτράρισµα πληροφορίας
4 Πρόβληµα- Κίνητρο Τύποι ερωτηµάτων: Λογικοί ( data AND retrieval AND NOT...)
5 Πρόβληµα- Κίνητρο Τύποι ερωτηµάτων: Λογικοί ( data AND retrieval AND NOT...) Επιπλέον χαρακτηριστικά ( data ADJACENT retrieval ) Ερωτήµατα λέξεων κλειδιών ( data, retrieval ) Πώς γίνεται η αναζήτηση σε µία µεγάλη συλλογή κειµένων;
6 Σάρωση πλήρους κειµένου Κατασκευή ενός FSA, Σάρρωση c a t
7 Σάρωση πλήρους κειµένου Για έναν όρο: (απλά: O(N*M)) ABRACADABRA CAB κείµενο πρότυπο
8 Σάρωση πλήρους κειµένου Για έναν όρο: (απλά: O(N*M)) Knuth Morris & Pratt ( 77) Κατασκευή µικρού FSA, επίσκεψη κάθε γράµµατος του κειµένου µόνο µία φορά, µε προσεκτική ολίσθηση περισσοτέρων από ένα βηµάτων ABRACADABRA CAB κείµενο πρότυπο
9 Σάρωση πλήρους κειµένου ABRACADABRA CAB κείµενο πρότυπο CAB... CAB CAB
10 Σάρωση πλήρους κειµένου Για έναν όρο : (απλός τρόπος: O(N*M)) Knuth Morris & Pratt ( 77) Boyer & Moore ( 77) Προεπεξεργασία προτύπου, ξεκινά από δεξιά προς τα αριστερά και προσπερνά! ABRACADABRA CAB κείµενο πρότυπο
11 Σάρωση πλήρους κειµένου ABRACADABRA CAB κείµενο πρότυπο CAB CAB CAB
12 Σάρωση πλήρους κειµένου ABRACADABRA OMINOUS OMINOUS κείµενο πρότυπο Boyer+Moore: γρηγορότερος, στην πράξη Sunday ( 90): κάποιες βελτιώσεις
13 Σάρωση πλήρους κειµένου Για πολλαπλούς όρους (w/o don t care characters): Aho+Corasic ( 75) πάλι, κατασκεύασε ένα απλό FSA σε O(M) χρόνο Πιθανοτικοί αλγόριθµοι: fingerprints (Karp + Rabin 87) Προσεγγιστικό ταίριασµα: agrep [Wu+Manber, Baeza-Yates+, 92]
14 Σάρωση πλήρους κειµένου Προσεγγιστικό ταίριασµα- Απόσταση µετασχηµατισµού συµβολοσειράς (string editing distance): d( survey, surgery ) = 2 = ελάχιστος # ενθέσεων, διαγραφών, αντικαταστάσεων για τον µετασχηµατισµό της πρώτης συµβολοσειράς στην δεύτερη SURVEY SURGERY
15 Σάρωση πλήρους κειµένου string editing distance Πως υπολογίζεται; A:
16 Σάρωση πλήρους κειµένου string editing distance Πως υπολογίζεται; A: υναµικός προγραµµατισµός cost( i, j ) = το κόστος ταιριάσµατος του προθέµατος µήκους i της πρώτης συµβολοσειράς s µε το πρόθεµα µήκους j της δεύτερης συµβολοσειράς t
17 Σάρωση πλήρους κειµένου if s[i] = t[j] then cost( i, j ) = cost(i-1, j-1) else cost(i, j ) = min ( 1 + cost(i, j-1) // deletion 1 + cost(i-1, j-1) // substitution 1 + cost(i-1, j) // insertion )
18 Σάρωση πλήρους κειµένου Πολυπλοκότητα: O(M*N) (όταν χρησιµοποιείται πίνακας για την αποµνηµόνευση των επιµέρους αποτελεσµάτων)
19 Σάρωση πλήρους κειµένου Συµπεράσµατα: Η σάρωση πλήρους κειµένου δεν χρειάζεται επιπλέον χώρο, αλλά είναι αργή για µεγάλα σύνολα δεδοµένων
20 Κείµενο οµή διάλεξης Κείµενο Πρόβληµα Σάρωση πλήρους κειµένου Αναστροφή Αρχεία υπογραφών Οµαδοποίηση Φιλτράρισµα πληροφορίας και LSI
21 Κείµενο- Αναστροφή
22 Κείµενο- Αναστροφή Q: επιπλέον χρήση χώρου;
23 Κείµενο- Αναστροφή A: κυρίως, λίστες εναπόθεσης
24 Κείµενο- Αναστροφή Πώς γίνεται η οργάνωση λεξικού; stemming Ν/Ο; Είσοδοι;
25 Κείµενο- Αναστροφή Πώς γίνεται η οργάνωση λεξικού; B-tree, hashing, TRIEs, PATRICIA trees,... stemming Ν/Ο; Είσοδοι
26 Κείµενο- Αναστροφή Νέα θέµατα: Παραλληλισµός[Tomasic+,93] Είσοδοι [Tomasic+94], [Brown+] zipf διανοµές Προσεγγιστική αναζήτηση ( glimpse [Wu+])
27 Κείµενο- Αναστροφή postings list more Zipf distr.: eg., rank-frequency plot of Bible log(freq) freq ~ 1 / (rank * ln(1.78v)) log(rank)
28 Κείµενο- Αναστροφή postings lists Cutting+Pedersen (κράτησε τα πρώτα 4 in B-tree leaves) Πως γίνεται η δέσµευση χώρου: [Faloutsos+92] Γεωµετρική πρόοδος Συµπίεση (Elias codes) [Zobel+] µόλις 2% επιπλέον!
29 Συµπεράσµατα Συµπεράσµατα: χρειάζεται επιπλέον χώρος (2%-300%), αλλά έχουµε καλύτερη ταχύτητα
30 Κείµενο οµή διάλεξης Κείµενο Πρόβληµα Σάρωση πλήρους κειµένου Αναστροφή Αρχεία υπογραφής Οµαδοποίηση Φιλτράρισµα πληροφορίας και LSI
31 Αρχεία υπογραφής Ιδέα: quick & dirty filter
32 Αρχεία υπογραφής Ιδέα: «γρήγορο και βρώµικο» φιλτράρισµα Έπειτα, σάρωσε ακολουθιακά το αρχείο υπογραφής και εντόπισε τις «ενδείξεις σφάλµατος» Πλεονέκτηµα: εύκολες ενθέσεις Μειονέκτηµα: αναζήτηση σε Ο(Ν) (µε µικρή σταθερά) Q: Πώς γίνεται η εξαγωγή υπογραφών;
33 Αρχεία υπογραφής A: κωδικοποίηση υπέρθεσης!! [Mooers49],... m (=4 bits/word) ~ (=4 bits παίρνουν την τιµή 1 Και τα υπόλοιπα παραµένουν 0 ) F (=12 bits sign. size) Τα πρότυπα των bits σχηµατίζουν την υπογραφή του κειµένου
34 Αρχεία υπογραφής A: κωδικοποίηση υπέρθεσης!! [Mooers49],... data Ταίριασµα
35 Αρχεία υπογραφής A: κωδικοποίηση υπέρθεσης!! [Mooers49],... Αποτυχία retrieval
36 Αρχεία υπογραφής A: κωδικοποίηση υπέρθεσης!! [Mooers49],... nucleotic Ένδειξη σφάλµατος ( false drop )
37 Αρχεία υπογραφής A: Κωδικοποίηση υπέρθεσης!! [Mooers49],... ΝΑΙ είναι ΙΣΩΣ ΟΧΙ είναι ΟΧΙ
38 Αρχεία υπογραφής Q1: Πώς επιλέγονται τα F και m; Q2: Για ποιο λόγο καλείται false drop ; Q3: Άλλες εφαρµογές των αρχείων υπογραφής;
39 Αρχεία υπογραφής Q1: Πώς επιλέγονται τα F και m; m (=4 bits/word) F (=12 bits sign. size)
40 Αρχεία υπογραφής Q1: Πώς επιλέγονται τα F και m; A: Έτσι ώστε η υπογραφή κειµένου να είναι 50% πλήρης m (=4 bits/word) F (=12 bits sign. size)
41 Αρχεία υπογραφής Q1: Πώς επιλέγονται τα F και m; Q2: Για ποιο λόγο καλείται false drop ; Q3: Άλλες εφαρµογές των αρχείων υπογραφής;
42 Αρχεία υπογραφής Q2: Για ποιο λόγο καλείται false drop ; Παλιά, αλλά ενδιαφέρουσα ιστορία [1949] Πώς γίνεται η αναζήτηση βιβλίων (µε την λέξη τίτλου, και/ή τον συγγραφέα, και/ή την λέξη κλειδί) Σε χρόνο O(1); Χωρίς υπολογιστές
43 Αρχεία υπογραφής Λύση: Edge-notched cards Κάθε λέξη τίτλου αντιστοιχίζεται σεm αριθµούς (πώς;) Και οι αντίστοιχες τρύπες αποκόπτονται:
44 Αρχεία υπογραφής Λύση: Edge-notched cards data data -> #1, #39
45 Αρχεία υπογραφής Ψάξε, π.χ., για data : ενεργοποίησε την βελόνα #1, #39 και ανακάτεψε τον σωρό των καρτών! data data -> #1, #39
46 Αρχεία υπογραφής Γνωστή επίσης ως zatocoding, Zator
47 Αρχεία υπογραφής Q1: Πώς επιλέγονται τα F και m; Q2: Για ποιο λόγο καλείται false drop ; Q3: Άλλες εφαρµογές των αρχείων υπογραφής;
48 Αρχεία υπογραφής Q3: Άλλες εφαρµογές των αρχείων υπογραφής; A: Ο,τιδήποτε έχει να κάνει µε membership testing : Ανήκει η λέξη data στο σύνολο λέξεων του κειµένου;
49 Αρχεία υπογραφής UNIX s early spell system [McIlroy] Bloom-joins in System R* [Mackert+] & active disks [Riedel99] ιαφορετικά αρχεία [Severance+Lohman]
50 Αρχεία υπογραφής- Συµπερασµατα Εύκολες ενθέσεις, πιο αργά από αναστροφή Εξαιρετική η ιδέα του quick and dirty φίλτρου: αποµακρύνεται γρήγορα η πλειοψηφία των άσχετων στοιχείων και γίνεται εστίαση στα υπόλοιπα
51 Αναφορές Aho, A. V. and M. J. Corasick (June 1975). "Fast Pattern Matching: An Aid to Bibliographic Search." CACM 18(6): Boyer, R. S. and J. S. Moore (Oct. 1977). "A Fast String Searching Algorithm." CACM 20(10): Brown, E. W., J. P. Callan, et al. (March 1994). Supporting Full-Text Information Retrieval with a Persistent Object Store. Proc. of EDBT conference, Cambridge, U.K., Springer Verlag.
52 Αναφορές Faloutsos, C. and H. V. Jagadish (Aug , 1992). On B-tree Indices for Skewed Distributions. 18th VLDB Conference, Vancouver, British Columbia. Karp, R. M. and M. O. Rabin (March 1987). "Efficient Randomized Pattern-Matching Algorithms." IBM Journal of Research and Development 31(2): Knuth, D. E., J. H. Morris, et al. (June 1977). "Fast Pattern Matching in Strings." SIAM J. Comput 6(2):
53 Αναφορές Mackert, L. M. and G. M. Lohman (August 1986). R* Optimizer Validation and Performance Evaluation for Distributed Queries. Proc. of 12th Int. Conf. on Very Large Data Bases (VLDB), Kyoto, Japan. Manber, U. and S. Wu (1994). GLIMPSE: A Tool to Search Through Entire File Systems. Proc. of USENIX Techn. Conf. McIlroy, M. D. (Jan. 1982). "Development of a Spelling List." IEEE Trans. on Communications COM- 30(1):
54 Αναφορές Mooers, C. (1949). Application of Random Codes to the Gathering of Statistical Information Bulletin 31. Cambridge, Mass, Zator Co. Pedersen, D. C. a. J. (1990). Optimizations for dynamic inverted index maintenance. ACM SIGIR. Riedel, E. (1999). Active Disks: Remote Execution for Network Attached Storage. ECE, CMU. Pittsburgh, PA.
55 Αναφορές Severance, D. G. and G. M. Lohman (Sept. 1976). "Differential Files: Their Application to the Maintenance of Large Databases." ACM TODS 1(3): Tomasic, A. and H. Garcia-Molina (1993). Performance of Inverted Indices in Distributed Text Document Retrieval Systems. PDIS. Tomasic, A., H. Garcia-Molina, et al. (May 24-27, 1994). Incremental Updates of Inverted Lists for Text Document Retrieval. ACM SIGMOD, Minneapolis, MN.
56 Αναφορές Wu, S. and U. Manber (1992). "AGREP- A Fast Approximate Pattern-Matching Tool.". Zobel, J., A. Moffat, et al. (Aug , 1992). An Efficient Indexing Technique for Full-Text Database Systems. VLDB, Vancouver, B.C., Canada.
57 Κείµενο οµή διάλεξης Κείµενο Πρόβληµα Σάρωση πλήρους κειµένου Αναστροφή Αρχεία υπογραφής Οµαδοποίηση Φιλτράρισµα πληροφορίας και LSI
58 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Ερωτήµατα λέξεων κλειδιών (vs Boolean) Κάθε κείµενο: -> διάνυσµα (ΠΩΣ;) Κάθε ερώτηµα: -> διάνυσµα Αναζήτηση όµοιων διανυσµάτων
59 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Κεντρική Ιδέα: κείµενο...δεδοµένα... aaron δεικτοδότηση data zoo V (= µέγεθος λεξικού)
60 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Έπειτα, οµαδοποίησε τα πλησιεστερα διανύσµατα Q1: Αναζήτηση οµάδας; Q2: Παραγωγή οµάδας; Σηµαντική συνεισφορά: Ταξινοµηµένη έξοδος Ανατροφοδότηση συνάφειας
61 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Αναζήτηση οµάδας: επισκέψου τις (k) πλησιέστερες υπεροµάδες, συνέχισε επαναληπτικά TU TRs CS TRs
62 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Ταξινοµηµένη έξοδος: εύκολο! TU TRs CS TRs
63 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Ανατροφοδότηση συνάφειας (εξαιρετική ιδέα) [Roccio 73] TU TRs CS TRs
64 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Ανατροφοδότηση συνάφειας (εξαιρετική ιδέα) [Roccio 73] Πώς; TU TRs CS TRs
65 Μοντέλο διανυσµατικού χώρου και οµαδοποίηση Πώς; A: Προσθέτοντας καλά διανύσµατα και αφαιρώντας τα κακά TU TRs CS TRs
66 Σχεδιάγραµµα-Λεπτοµερές Βασική ιδέα Αναζήτηση οµάδας Παραγωγή οµάδας Αξιολόγηση
67 Παραγωγή οµάδας Πρόβληµα: εδοµένων N σηµείων σε V διαστάσεις, οµαδοποίησέ τα
68 Παραγωγή οµάδας Πρόβληµα: εδοµένων N σηµείων σε V διαστάσεις, οµαδοποίησέ τα
69 Παραγωγή οµάδας Χρειαζόµαστε Q1: οµοιότητα κειµένου µε κείµενο Q2: οµοιότητα κειµένου µε οµάδα
70 Παραγωγή οµάδας Q1: Οµοιότητα κειµένου µε κείµενο (βλέπε: αναπαράσταση σάκου µε λέξεις ) D1: { data, retrieval, system } D2: { lung, pulmonary, system } Συναρτήσεις απόστασης/οµοιότητας;
71 Παραγωγή οµάδας A1: # κοινών λέξεων A2:... κανονικοποίηση µε βάση τα µεγέθη του λεξικού A3:... κτλ
72 Παραγωγή οµάδας Οµοιότητα συνηµιτόνου: similarity(d1, D2) = cos(θ) = sum(v 1,i * v 2,i ) / len(v 1 )/ len(v 2 ) D1 θ D2
73 Παραγωγή οµάδας Οµοιότητα συνηµιτόνου- Παρατηρήσεις: Σχετίζεται µε την Ευκλείδια απόσταση Ζυγίζει το v i,j : σύµφωνα µε την σχέση tf/idf D1 θ D2
74 Παραγωγή οµάδας tf ( συχνότητα όρου ) Υψηλή, στην περίπτωση που ο όρος παρουσιάζεται πολύ συχνά µέσα στο κείµενο idf ( αντίστροφη συχνότητα κειµένου ) ίνει λιγότερη σηµασία στις κοινές λέξεις, που εµφανίζονται σχεδόν σε κάθε κείµενο
75 Παραγωγή οµάδας Χρειαζόµαστε Q1: οµοιότητα κειµένου µε κείµενο Q2: οµοιότητα κειµένου µε οµάδα?
76 Παραγωγή οµάδας A1: ελάχιστη απόσταση ( single-link ) A2: µέγιστη απόσταση ( all-link ) A3: µέση απόσταση A4: απόσταση από το κεντροϊδές?
77 Παραγωγή οµάδας A1: ελάχιστη απόσταση ( single-link ) Οδηγεί σε µεγαλύτερες οµάδες A2: µέγιστη απόσταση ( all-link ) Πολλές, µικρές, αυστηρές οµάδες A3: µέση απόσταση Μεταξύ των δύο ανωτέρω περιπτώσεων A4: απόσταση από το κεντροϊδές Γρήγορο στον υπολογισµό
78 Παραγωγή οµάδας Έχουµε Οµοιότητα κειµένου µε κείµενο Οµοιότητα κειµένου µε οµάδα Q: Πώς γίνεται η οµαδοποίηση κειµένων σε φυσικές οµάδες
79 Παραγωγή οµάδας A: *many-many* αλγόριθµοι σε δύο σύνολα [VanRijsbergen]: Τheoretically sound (O(N^2)) Ανεξάρτητα από την σειρά εισαγωγής Επαναληπτικός (O(N), O(N log(n))
80 Παραγωγή οµάδων- sound methods Προσέγγιση #1: δενδρογράµµαταδηµιούργησε µία ιεραρχία (από κάτω προς τα πάνω ή το αντίστροφο) επέλεξε ένα όριο(πώς;) και περιόρισε γάτα τίγρης άλογο αγελάδα 0.1
81 Παραγωγή οµάδας- sound methods Προσέγγιση#2: ελαχιστοποίησε κάποιο στατιστικό κριτήριο (πχ., το άθροισµα τετραγώνων από τα κέντρα των οµάδων) Όπως k-means Όµως πώς επιλέγεται το k ;
82 Παραγωγή οµάδας- sound methods Προσέγγιση#3: Θεωρητικός γράφος[zahn]: Κατασκεύασε MST, ιέγραψε τις ακµές µε µήκος µεγαλύτερο του 2.5* std του τοπικού µέσου όρου
83 Παραγωγή οµάδας- sound methods Αποτέλεσµα: Παραλλαγές Πολυπλοκότητα;
84 Παραγωγή οµάδας- επαναληπτικές µέθοδοι Γενικό σχεδιάγραµµα: Επέλεξε φύτρα (Πώς;) Αντιστοίχισε κάθε διάνυσµα στην πλησιέστερη φύτρα (πιθανόν προσαρµόζοντας το κεντροϊδές της οµάδας) Πιθανόν, να ανατεθούν ξανά κάποια διανύσµατα για να βελτιωθούν οι οµάδες Γρήγορο και πρακτικό, αλλά απρόβλεπτο
85 Παραγωγή οµάδας Ένας τρόπος να εκτιµηθεί το πλήθος των οµάδων k: cover coefficient [Can+] ~ SVD
86 Σχεδιάγραµµα-Λεπτοµερές Βασική ιδέα Αναζήτηση οµάδας Παραγωγή οµάδας Αξιολόγηση
87 Αξιολόγηση Q: πώς µετριέται η υπεροχή µίας συνάρτησης απόστασης σε σχέση µε κάποια άλλη; A: σε πρώτη φάση από τους ανθρώπους και ακρίβεια & επανάκληση
88 Αξιολόγηση Ακρίβεια= (ανακτηθείσα & σχετική) / ανακτηθείσα 100% ακρίβεια-> χωρίς ενδείξεις σφάλµατος Επανάκληση= (ανακτηθείσα & σχετική)/ανακτηθείσα 100% επανάκληση-> χωρίς απώλεια σφάλµατος
89 Αναφορές Can, F. and E. A. Ozkarahan (Dec. 1990). "Concepts and Effectiveness of the Cover-Coefficient-Based Clustering Methodology for Text Databases." ACM TODS 15(4): Noreault, T., M. McGill, et al. (1983). A Performance Evaluation of Similarity Measures, Document Term Weighting Schemes and Representation in a Boolean Environment. Information Retrieval Research, Butterworths. Rocchio, J. J. (1971). Relevance Feedback in Information Retrieval. The SMART Retrieval System - Experiments in Automatic Document Processing. G. Salton. Englewood Cliffs, New Jersey, Prentice-Hall Inc.
90 Αναφορές Salton, G. (1971). The SMART Retrieval System - Experiments in Automatic Document Processing. Englewood Cliffs, New Jersey, Prentice-Hall Inc. Salton, G. and M. J. McGill (1983). Introduction to Modern Information Retrieval, McGraw-Hill. Van-Rijsbergen, C. J. (1979). Information Retrieval. London, England, Butterworths. Zahn, C. T. (Jan. 1971). "Graph-Theoretical Methods for Detecting and Describing Gestalt Clusters." IEEE Trans. on Computers C-20(1):
91 Κείµενο οµή διάλεξης Κείµενο Πρόβληµα Σάρωση πλήρους κειµένου Αναστροφή Αρχεία υπογραφής Οµαδοποίηση Φιλτράρισµα πληροφορίας και LSI
92 LSI Λέπτοµερές σχεδιάγραµµα LSI Ορισµός προβλήµατος Βασική ιδέα Πειράµατα
93 Φιλτράρισµα πληροφορίας+ LSI [Foltz+, 92] Στόχος: οι χρήστες προσδιορίζουν τα ενδιαφέροντά τους (= λέξεις κλειδιά) Το σύστηµα τα εντοπίζει, σε κατάλληλα νέα κείµενα Μέγιστη συνεισφορά: LSI = Latent Semantic Indexing Κρυµµένες ( hidden ) ιδέες
94 Φιλτράρισµα πληροφορίας+ LSI Βασική ιδέα Αντιστοίχισε κάθε κείµενο σε κάποιες ιδέες Αντιστοίχισε κάθε όρο σε κάποιες ιδέες Ιδέα ( concept ):~ ένα σύνολο όρων, µε βάρη, π.χ. data (0.8), system (0.5), retrieval (0.6) -> DBMS_concept
95 Φιλτράρισµα πληροφορίας+ LSI Απεικόνιση: πίνακας όρων-κειµένου (BEFORE) 'data' 'system' 'retrieval' 'lung' 'ear' TR TR TR3 1 1 TR4 1 1
96 Information Filtering + LSI Απεικόνιση: πίνακας ιδέας-κειµένου και... TR2 1 TR3 1 TR4 1 'DBMSconcept' TR1 1 'medicalconcept'
97 Φιλτράρισµα πληροφορίας+ LSI... και πίνακας όρου-κειµένου system 1 retrieval 1 lung 1 ear 1 'DBMSconcept' data 1 'medicalconcept'
98 Φιλτράρισµα πληροφορίας+ LSI Q: Πώς γίνεται η αναζήτηση, πχ., για το system ;
99 Φιλτράρισµα πληροφορίας+ LSI A: βρες την αντίστοιχη ιδέα(ες) και τα αντίστοιχα κείµενα system 1 retrieval 1 lung 1 ear 1 TR2 1 TR3 1 TR4 1 'DBMSconcept' data 1 'medicalconcept' 'DBMSconcept' TR1 1 'medicalconcept'
100 Φιλτράρισµα πληροφορίας+ LSI A: βρες την αντίστοιχη ιδέα(ες) και τα αντίστοιχα κείµενα system 1 retrieval 1 lung 1 ear 1 TR2 1 TR3 1 TR4 1 'DBMSconcept' data 1 'medicalconcept' 'DBMSconcept' TR1 1 'medicalconcept'
101 Φιλτράρισµα πληροφορίας+ LSI Με τον τρόπο αυτό λειτουργεί σαν (αυτόµατη κατασκευή) θησαυρός: Μπορεί να ανακτήσουµε κείµενα τα οποία ΕΝ έχουν τον όρο system, αλλά περιέχουν σχεδόν όλους τους άλλους ( data, retrieval )
102 LSI Λεπτοµερές σχεδιάγραµµα LSI Ορισµός προβλήµατος Βασική ιδέα Πειράµατα
103 LSI - Πειράµατα 150 Tech Memos (TM) / µήνα 34 προφίλ χρηστών (6-66 λέξεις ανά προφίλ) ιδέες
104 LSI - Πειράµατα Τέσσερεις µέθοδοι, προϊόν των ακολούθων: Vector-space / LSI, για την µέτρηση οµοιότητας Λέξεις κλειδιά ή δείγµα κειµένου, για τον προσδιορισµό του προφίλ Μετρηµένη : ακρίβεια/ανάκληση
105 LSI - Πειράµατα LSI, µε προφίλ βάσει κειµένων, καλύτερη ακρίβεια (0.25,0.65) (0.50,0.45) (0.75,0.30) ανάκληση
106 LSI - Συζήτηση- Συµπεράσµατα Σηµαντική ιδέα, Η παραγωγή ιδεών από τα κείµενα Η αυτόµατη παραγωγή στατιστικού θησαυρού Η µείωση των διαστάσεων Συχνά οδηγεί σε καλύτερη σχέση ακρίβειας/ανάκλησης Αλλά: Χρειάζεται ένα σύνολο κειµένων προετοιµασίας ( training set) Τα διανύσµατα ιδεών είναι πλέον πλήρη
107 LSI Συζήτηση- Συµπεράσµατα Παρατηρήσεις Bellcore (-> Telcordia): έχει µία πατέντα Χρησιµοποιείται για πολύγλωσση ανάκτηση SVD: Πώς λειτουργεί ακριβώς;
108 εικτοδότηση- Λεπτοµερές σχεδιάγραµµα εικτοδότηση πρωτεύοντος κλειδιού εικτοδότηση δευτερεύοντος κλειδιού/multikey Μέθοδοι χωρικής προσπέλασης fractals Κείµενο SVD: ένα εργαλείο µε µεγάλες δυνατότητες πολυµέσα...
109 Αναφορές Foltz, P. W. and S. T. Dumais (Dec. 1992). "Personalized Information Delivery: An Analysis of Information Filtering Methods." Comm. of ACM (CACM) 35(12):
Βάσεις Δεδομένων ΙΙ Ενότητα 8
Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Βάσεις Δεδομένων ΙΙ Ενότητα 8: Βάσεις δεδομένων κειμένου Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και αν αναφέρεται διαφορετικά
Βάσεις Δεδομένων ΙΙ Ενότητα 9
Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Βάσεις Δεδομένων ΙΙ Ενότητα 9: Βάσεις δεδομένων κειμένου- Δομή διάλεξης Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και αν αναφέρεται
Gemini, FastMap, Applications. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών
Gemini,, Applications Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών Εαρινό Εξάμηνο 2011-2012 Table of contents 1 Table of contents 1 2 Table of contents 1 2 3 Table of contents
Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #03 Βασικές έννοιες Ανάκτησης Πληροφορίας Δομή ενός συστήματος IR Αναζήτηση με keywords ευφυής
Αλγόριθμοι Συμβολοσειρών
12 Αλγόριθμοι Συμβολοσειρών Περιεχόμενα Κεφαλαίου 12.1 Ορισμός Προβλήματος και Αλγόριθμος Ωμής Βίας... 348 12.2 Αλγόριθμος Rabin-Karp................... 350 12.3 Αλγόριθμος Boyer-Moore-Horspool.............
Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων
Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του 510 σελίδες 1η
Ανάκτηση Πληροφορίας (Information Retrieval IR)
Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου
Ανάκτηση Πληροφορίας Εισαγωγή
Ανάκτηση Πληροφορίας Εισαγωγή Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής Ακαδημαϊκό Έτος 2007-2008 Αντικείμενο IR Η Ανάκτηση Πληροφορίας (ΑΠ)
Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής. Ακαδηµαϊκό Έτος
Ανάκτηση Πληροφορίας Εισαγωγή Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής Ακαδηµαϊκό Έτος 2015-2016 Αντικείµενο IR Η Ανάκτηση Πληροφορίας (ΑΠ)
Ανάκτηση πολυμεσικού περιεχομένου
Ανάκτηση πολυμεσικού περιεχομένου Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση
Ανάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #11 Suffix Arrays Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης Το παρόν
substructure similarity search using features in graph databases
substructure similarity search using features in graph databases Aleksandros Gkogkas Distributed Management of Data Laboratory intro Θα ενασχοληθούμε με το πρόβλημα των ερωτήσεων σε βάσεις γραφημάτων.
Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο
Δομές Δεδομένων Συμβολοσειρές Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Συμβολοσειρές Συμβολοσειρές και προβλήματα που αφορούν συμβολοσειρές εμφανίζονται τόσο συχνά που
Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1
ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ
ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ (Οι ερωτήσεις µε κίτρινη υπογράµµιση είναι εκτός ύλης για φέτος) ΕΙΣΑΓΩΓΗ Q1. Οι Πρωταρχικοί τύποι (primitive types) στη Java 1. Είναι όλοι οι ακέραιοι και όλοι οι πραγµατικοί
Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)
Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589) Μεγαλοοικονόμου Βασίλειος Τμήμα Μηχ. Η/ΥκαιΠληροφορικής Επιστημονικός Υπεύθυνος Στόχος Προτεινόμενου Έργου Ανάπτυξη μεθόδων
Ανάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI Β. Μεγαλοοικονόμου Μέθοδοι Προσπέλασης Χωρικών Δεδομένων ΙΙ Spatial Access Methods (SAMs) II (παρουσίαση βασισμένη εν μέρη σε σημειώσεις των Silberchatz,
Ανάκτηση πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 1: Εισαγωγή στην Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ -4ο εξάμηνο 1
Αλγόριθμοι Χωρικοί-χρονικοί συμβιβασμοί http://delab.csd.auth.gr/courses/algorithms/ Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ -4ο εξάμηνο 1 Χωρικοί-χρονικοί συμβιβασμοί Σε πολλά προβλήματα, ο επιπλέον χώρος
ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Retrieval Systems
ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Systems Πανεπιστήμιο Κρήτης, Άνοιξη Γιάννης Τζίτζικας Lecture : 1 Date : 22-2- Title : Administration εδοµένα Το Αντικείµενο του Μαθήµατος Μια συλλογή
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται
Ανάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #10 εικτοδότηση και Αναζήτηση Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια
εικτοδότηση και Αναζήτηση (Indexing & Searching) Ανάκτηση Πληροφορίας
εικτοδότηση και Αναζήτηση (Indexing & Searching) 1 Εισαγωγή Με ποιους τρόπους µπορούµενααναζητήσουµε πληροφορία από µία συλλογή κειµένων; Ο πιο απλός και εύκολα υλοποιήσιµος τρόπος είναι να ψάξουµεσειριακάόλατακείµενα
Ανάκτηση Πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό
Ανάκτηση Πληροφορίας
Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing
ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)
ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test) Θεοχαράτος Χρήστος Εργαστήριο Ηλεκτρονικής (ELLAB), Τµήµα Φυσικής, Πανεπιστήµιο Πατρών email: htheohar@upatras.gr http://www.ellab.physics.upatras.gr/users/theoharatos/default.htm
ΑΛΓΟΡΙΘΜΟΙ. Ενότητα 7: Χωρικοί Χρονικοί Συμβιβασμοί. Ιωάννης Μανωλόπουλος, Καθηγητής Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Τμήμα Πληροφορικής ΑΠΘ
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΛΓΟΡΙΘΜΟΙ Ενότητα 7: Χωρικοί Χρονικοί Συμβιβασμοί Ιωάννης Μανωλόπουλος, Καθηγητής Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης
Indexing Methods for Encrypted Vector Databases
Computer Security Symposium 2013 21-23 October 2013 305-0006 1-1-1 junpei.kawamoto@acm.org LSH LSH LSH Indexing Methods for Encrypted Vector Databases Junpei Kawamoto Faculty of Engineering, Information
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη
Ανάκτηση πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 7: Κατάλογοι Υπογραφών Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ
Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν
Ανάκτηση Πληροφορίας
Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI Δομές Ευρετηρίων και Κατακερματισμός Αρχείων II Β. Μεγαλοοικονόμου Δ. Χριστοδουλάκης (παρουσίαση βασισμένη εν μέρη σε σημειώσεις των Silberchatz, Korth και
An Effective and Efficient Algorithm for Text Categorization
,2 2 2. 300074 2. 30007 shi.zw@mail.nankai.edu.cn k k k k TP8 A An Effective and Efficient Algorithm for Text Categorization Shi Zhi-wei,2, Liu Tao 2, Wu Gong-yi 2 (.College of Computer and Information
6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης
Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1
Αρχές κωδικοποίησης Απαιτήσεις κωδικοποίησης Είδη κωδικοποίησης Βασικές τεχνικές κωδικοποίησης Κωδικοποίηση Huffman Κωδικοποίηση µετασχηµατισµών Κβαντοποίηση διανυσµάτων ιαφορική κωδικοποίηση Τεχνολογία
Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων
Clustering Αλγόριθµοι Οµαδοποίησης Αντικειµένων Εισαγωγή Οµαδοποίηση (clustering): οργάνωση µιας συλλογής από αντικείµενα-στοιχεία (objects) σε οµάδες (clusters) µε βάση κάποιο µέτρο οµοιότητας. Στοιχεία
Διάλεξη 16: Σωροί. Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Ουρές Προτεραιότητας - Ο ΑΤΔ Σωρός, Υλοποίηση και πράξεις
ΕΠΛ231 Δομές Δεδομένων και Αλγόριθμοι 1 Διάλεξη 16: Σωροί Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Ουρές Προτεραιότητας - Ο ΑΤΔ Σωρός, Υλοποίηση και πράξεις Ουρά Προτεραιότητας Η δομή
Λειτουργίες επί των Κειµένων. Προεπεξεργασία Clustering Συµπίεση
Λειτουργίες επί των Κειµένων Προεπεξεργασία Clustering Συµπίεση Προεπεξεργασία Κειµένων Πριν από τη δεικτοδότηση των κειµένων προηγούνται µερικές βασικές διαδικασίες οι οποίες χρησιµοποιούνται για την
Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463
ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ COMPUTER SCIENCE DEPARTMENT UNIVERSITY OF CRETE Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 4 η Σειρά Ασκήσεων Ψαράκη Μαρία-Γεωργία ΜΕΤ 556 psaraki@csd.uoc.gr Εαρινό Εξάμηνο 2008-2009
Επερωτήσεις σύζευξης με κατάταξη
Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις κατάταξης Top-K queries Οι επερωτήσεις κατάταξης επιστρέφουν τις k απαντήσεις που ταιριάζουν καλύτερα με τις προτιμήσεις του χρήστη. Επερωτήσεις κατάταξης Top-K
Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη
Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου
Δυναμικός Κατακερματισμός
Δυναμικός Κατακερματισμός Καλό για βάση δεδομένων που μεγαλώνει και συρρικνώνεται σε μέγεθος Επιτρέπει τη δυναμική τροποποίηση της συνάρτησης κατακερματισμού Επεκτάσιμος κατακερματισμός μια μορφή δυναμικού
Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων
Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι
Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2016-17 Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) http://mixstef.github.io/courses/csintro/ Μ.Στεφανιδάκης Αφηρημένες
Ερώτημα 1. Μας δίνεται μια συλλογή από k ακολοθίες, k >=2 και αναζητούμε το πρότυπο Ρ, μεγέθους n.
Πρώτο Σύνολο Ασκήσεων 2014-2015 Κατερίνα Ποντζόλκοβα, 5405 Αθανασία Ζαχαριά, 5295 Ερώτημα 1 Μας δίνεται μια συλλογή από k ακολοθίες, k >=2 και αναζητούμε το πρότυπο Ρ, μεγέθους n. Ο αλγόριθμος εύρεσης
Κεφ.11: Ευρετήρια και Κατακερματισμός
Κεφ.11: Ευρετήρια και Κατακερματισμός Database System Concepts, 6 th Ed. See www.db-book.com for conditions on re-use Κεφ. 11: Ευρετήρια-Βασική θεωρία Μηχανισμοί ευρετηρίου χρησιμοποιούνται για την επιτάχυνση
Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 5η: 06/03/2017 1 WILD-CARD Ερωτήματα 2 Sec. 3.2 Ερωτήματα με χαρακτήρες wild-card: * mon*: να βρεθούν όλα τα έγγραφα που περιέχουν
Εισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων
Βάσεις εδοµένων 2003-2004 Ευαγγελία Πιτουρά 1 ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Επεξεργασία Ερωτήσεων Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL)
A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks
P2P 1,a) 1 1 1 P2P P2P P2P P2P A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks NARISHIGE Yuki 1,a) ABE Kota 1 ISHIBASHI Hayato 1 MATSUURA Toshio 1
DEIM Forum 2 D3-6 819 39 744 66 8 E-mail: kawamoto@inf.kyushu-u.ac.jp, tawara@db.soc.i.kyoto-u.ac.jp, {asano,yoshikawa}@i.kyoto-u.ac.jp 1.,, Amazon.com The Internet Movie Database (IMDb) 1 Social spammers
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα
HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μοντέλα Ανάκτησης Ι
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Μοντέλα Ανάκτησης Ι (Retrieval Models) Γιάννης Τζίτζικας άλ ιάλεξη
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI Δομές Ευρετηρίων και Κατακερματισμός Αρχείων I Β. Μεγαλοοικονόμου Δ. Χριστοδουλάκης (παρουσίαση βασισμένη εν μέρη σε σημειώσεις των Silberchatz, Korth και
Τεχνικές Προσπέλασης σε Πολυδιάστατες Βάσεις εδοµένων µε χρήση ένδρων (R-trees,
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Τεχνικές Προσπέλασης σε Πολυδιάστατες Βάσεις εδοµένων µε χρήση ένδρων (R-trees, GiST) Κ. Πατρούµπας 28 Μαΐου 2004 28/5/2004
Θέμα : Retrieval Models. Ημερομηνία : 9 Μαρτίου 2006
ΗΥ-464: Συστήματα Ανάκτησης Πληροφορίας Informaton Retreval Systems Πανεπιστήμιο Κρήτης Άνοιξη 2006 Φροντιστήριο 2 Θέμα : Retreval Models Ημερομηνία : 9 Μαρτίου 2006 Outlne Prevous Semester Exercses Set
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΕΠΛ 035 - ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΓΙΑ ΗΛΕΚΤΡΟΛΟΓΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΚΑΙ ΜΗΧΑΝΙΚΟΥΣ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδηµαϊκό έτος 2017-2018 Υπεύθυνος εργαστηρίου: Γεώργιος
ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ
Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας
Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας Μακεδόνας Ανδρέας Μεταδιδακτορικός Ερευνητής Τμ. Φυσικής, Εργαστήριο Ηλεκτρονικής Ένα απλό ερώτημα Στον κόσμο την πληροφορίας υπάρχει
Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου
Γλωσσικη τεχνολογια Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε το πληροφοριακό περιεχόμενο Ποσοτικοποιήσουμε
Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 28-29 Εαρινό Εξάμηνο Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης &
Ανάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Δομές Δεδομένων Εργαστηριακή Άσκηση 2012-2013. Γκόγκος Νίκος Α.Μ.: 4973 Έτος: 3 ο Email: gkogkos@ceid.upatras.gr. Εισαγωγικά:
Δομές Δεδομένων Εργαστηριακή Άσκηση 2012-2013 Γκόγκος Νίκος Α.Μ.: 4973 Έτος: 3 ο Email: gkogkos@ceid.upatras.gr Εισαγωγικά: Η υλοποίηση του project έχει γίνει σε python [2.7]. Τα python modules είναι αυτόνομα
ER-Tree (Extended R*-Tree)
1-9825/22/13(4)768-6 22 Journal of Software Vol13, No4 1, 1, 2, 1 1, 1 (, 2327) 2 (, 3127) E-mail xhzhou@ustceducn,,,,,,, 1, TP311 A,,,, Elias s Rivest,Cleary Arya Mount [1] O(2 d ) Arya Mount [1] Friedman,Bentley
ιασπορά πληροφορίας βασισµένη σε σηµασιολογικές συσχετίσεις
ιασπορά πληροφορίας βασισµένη σε σηµασιολογικές συσχετίσεις Κατζαγιαννάκη Γ. Ειρήνη Ηλέκτρα Μεταπτυχιακή Εργασία Τµήµα Επιστήµης Υπολογιστών Πανεπιστήµιο Κρήτης Περίληψη Σε ένα σύστηµα επιλεκτικής διασποράς
Βάσεις Δεδομένων ΙΙ Ενότητα 5
Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Βάσεις Δεδομένων ΙΙ Ενότητα 5: Δομές Ευρετηρίων - ISAM Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και αν αναφέρεται διαφορετικά
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε
User Behavior Analysis for a Large2scale Search Engine
25 2 2006 4 Vol. 25 2 April 2006 1) 1 2 1 (1. 100871 ; 2. 730000) : URL Heaps URL Zipf URL URL User Behavior Analysis for a Large2scale Search Engine Wang Jimin 1 2 and Peng Bo 1 (1. School of Electronics
Κατηγορίες Συμπίεσης. Συμπίεση με απώλειες δεδομένων (lossy compression) π.χ. συμπίεση εικόνας και ήχου
Συμπίεση Η συμπίεση δεδομένων ελαττώνει το μέγεθος ενός αρχείου : Εξοικονόμηση αποθηκευτικού χώρου Εξοικονόμηση χρόνου μετάδοσης Τα περισσότερα αρχεία έχουν πλεονασμό στα δεδομένα τους Είναι σημαντική
Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university
Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα
Εισαγωγή 1 Ζήτω οι Βάσεις εδοµένων!! Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα Μοντελοποίηση Αποθήκευση Επεξεργασία (εύρεση πληροφορίας σχετικής µε µια συγκεκριµένη ερώτηση) Σωστή Λειτουργία
Το εσωτερικό ενός Σ Β
Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL) ηµιουργία/κατασκευή Εισαγωγή εδοµένων
Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος
Επίλυση Προβληµάτων µε Greedy Αλγόριθµους
Επίλυση Προβληµάτων µε Greedy Αλγόριθµους Περίληψη Επίλυση προβληµάτων χρησιµοποιώντας Greedy Αλγόριθµους Ελάχιστα Δέντρα Επικάλυψης Αλγόριθµος του Prim Αλγόριθµος του Kruskal Πρόβληµα Ελάχιστης Απόστασης
Αριθµητική Ανάλυση 1 εκεµβρίου / 43
Αριθµητική Ανάλυση 1 εκεµβρίου 2014 Αριθµητική Ανάλυση 1 εκεµβρίου 2014 1 / 43 Κεφ.5. Αριθµητικός Υπολογισµός Ιδιοτιµών και Ιδιοδιανυσµάτων ίνεται ένας πίνακας A C n n και Ϲητούνται να προσδιορισθούν οι
Υπολογιστικό Πρόβληµα
Υπολογιστικό Πρόβληµα Μετασχηµατισµός δεδοµένων εισόδου σε δεδοµένα εξόδου. Δοµή δεδοµένων εισόδου (έγκυρο στιγµιότυπο). Δοµή και ιδιότητες δεδοµένων εξόδου (απάντηση ή λύση). Τυπικά: διµελής σχέση στις
Τεράστιες ανάγκες σε αποθηκευτικό χώρο
ΣΥΜΠΙΕΣΗ Τεράστιες ανάγκες σε αποθηκευτικό χώρο Παράδειγμα: CD-ROM έχει χωρητικότητα 650MB, χωρά 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου, αλλά 30 sec ασυμπίεστου βίντεο. Μαγνητικοί δίσκοι χωρητικότητας
#2 Αλγόριθµοι, οµές εδοµένων και Πολυπλοκότητα
#2 Αλγόριθµοι, οµές εδοµένων και Πολυπλοκότητα ηµήτρης Ν. Σερπάνος Εργαστήριο Συστηµάτων Υπολογιστών Τµήµα Ηλεκτρολόγων Μηχ. & Τεχνολογίας Υπολογιστών Αλγόριθµοι, οµές εδοµένων και Πολυπλοκότητα Αλγόριθµοι:
Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση
Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 5 η Παρουσίαση : Ψηφιακή Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας Σύνθεση Χρωμάτων Αφαιρετική Παραγωγή Χρώματος Χρωματικά
Ανάκτηση Δεδομένων (Information Retrieval)
Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας
Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer
Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων
Μεταπτυχιακή Διπλωματική Εργασία. «Τεχνικές Δεικτοδότησης Συστημάτων Ανάκτησης Πληροφορίας με τη χρήση Wavelet Trees» Κατσίπη Δήμητρα ΑΜ: 741
Μεταπτυχιακό Πρόγραμμα: «Επιστήμη και Τεχνολογία Υπολογιστών» Μεταπτυχιακή Διπλωματική Εργασία «Τεχνικές Δεικτοδότησης Συστημάτων Ανάκτησης Πληροφορίας με τη χρήση Wavelet Trees» Κατσίπη Δήμητρα ΑΜ: 741
Εξατοµίκευση Ερωτήσεων σε Βάσεις εδοµένων
Εξατοµίκευση Ερωτήσεων σε Βάσεις εδοµένων, Γ. Ιωαννίδης Πανεπιστήµιο Αθηνών Προσπέλαση Πληροφοριών: Λίγη Ιστορία Query-Based Approaches Ερώτηση Πρόσβαση εδοµένων εδοµένα Ίδια απάντηση σε όλους τους χρήστες
Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας
Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας 1. Ποια είναι τα βασικά πλεονεκτήματα ενός παραδοσιακού σχεσιακού συστήματος βάσεων δεδομένων και
Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων 2009-2010: Ευρετήρια 1
Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου
Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής
Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Σύνθεση Πανοράµατος Εµµανουήλ Ζ. Ψαράκης Πολυτεχνική Σχολή
Δομές Ευρετηρίου: Διάρθρωση Διάλεξης
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and
Εισαγωγή στην Ανάλυση Αλγορίθμων (1) Διαφάνειες του Γ. Χ. Στεφανίδη
Εισαγωγή στην Ανάλυση Αλγορίθμων (1) Διαφάνειες του Γ. Χ. Στεφανίδη 0. Εισαγωγή Αντικείμενο μαθήματος: Η θεωρητική μελέτη ανάλυσης των αλγορίθμων. Στόχος: επιδόσεις των επαναληπτικών και αναδρομικών αλγορίθμων.
Δομές Δεδομένων και Αλγόριθμοι
Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 18 Dijkstra s Shortest Path Algorithm 1 / 12 Ο αλγόριθμος εύρεσης της συντομότερης διαδρομής του Dijkstra
Αλγόριθμοι Ταξινόμησης Μέρος 1
Αλγόριθμοι Ταξινόμησης Μέρος 1 Μανόλης Κουμπαράκης 1 Το Πρόβλημα της Ταξινόμησης Το πρόβλημα της ταξινόμησης (sorting) μιας ακολουθίας στοιχείων με κλειδιά ενός γνωστού τύπου (π.χ., τους ακέραιους ή τις
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΛΕΤΗ ΚΙ ΥΛΟΠΟΙΗΣΗ ΑΛΓΟΡΙΘΜΩΝ ΑΝΑΖΗΤΗΣΗΣ ΠΡΟΤΥΠΟΥ ΣΕ ΚΕΙΜΕΝΟ Διπλωματική Εργασία του Πέτρου Δούνου ΑΜ: 0714 Θεσσαλονίκη,
Επεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων Σ Β Βάση εδομένων Η ομή ενός ΣΒ Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 2 Εισαγωγή Εισαγωγή ΜΕΡΟΣ 1 (Χρήση Σ Β ) Γενική
Πίνακες (Μια παλιά άσκηση) Πίνακες Κατακερματισμού (Hash Tables) Πίνακες (Μια παλιά άσκηση) Εισαγωγή. A n
Πίνακες (Μια παλιά άσκηση) Πίνακες Κατακερματισμού (Hash Tables) Ορέστης Τελέλης telelis@unipi.gr Τμήμα Ψηφιακών Συστημάτων, Πανεπιστήμιο Πειραιώς A n O(1) (στην πρώτη ελέυθερη θέση στο τέλος του πίνακα).
Δομές Δεδομένων & Αλγόριθμοι
Σωροί 1 Ορισμοί Ένα δέντρο μεγίστων (δένδρο ελαχίστων) είναι ένα δένδρο, όπου η τιμή κάθε κόμβου είναι μεγαλύτερη (μικρότερη) ή ίση με των τιμών των παιδιών του Ένας σωρός μεγίστων (σωρός ελαχίστων) είναι
MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)
1,a) 1,b) 1,c) 1. MIDI [1], [2] U/D/S 3 [3], [4] 1 [5] Song [6] 1 Sony, Minato, Tokyo 108 0075, Japan a) Emiru.Tsunoo@jp.sony.com b) AkiraB.Inoue@jp.sony.com c) Masayuki.Nishiguchi@jp.sony.com MIDI [7]
Δοµές Δεδοµένων. 2η Διάλεξη Αλγόριθµοι Ένωσης-Εύρεσης (Union-Find) Ε. Μαρκάκης. Βασίζεται στις διαφάνειες των R. Sedgewick K.
Δοµές Δεδοµένων 2η Διάλεξη Αλγόριθµοι Ένωσης-Εύρεσης (Union-Find) Ε. Μαρκάκης Βασίζεται στις διαφάνειες των R. Sedgewick K. Wayne Περίληψη Συνδετικότητα δικτύου Αφαιρέσεις Συνδεδεµένα συστατικά Αφηρηµένη
Ειδικές Επιστηµονικές Εργασίες
Ειδικές Επιστηµονικές Εργασίες 2005-2006 1. Ανίχνευση προσώπων από ακολουθίες video και παρακολούθηση (face detection & tracking) Η ανίχνευση προσώπου (face detection) αποτελεί το 1 ο βήµα σε ένα αυτόµατο
Newman Modularity Newman [4], [5] Newman Q Q Q greedy algorithm[6] Newman Newman Q 1 Tabu Search[7] Newman Newman Newman Q Newman 1 2 Newman 3
DEWS2007 D3-6 y yy y y y y yy / DC 7313194 341 E-mail: yfktamura,mori,kuroki,kitakamig@its.hiroshima-cu.ac.jp, yymakoto@db.its.hiroshima-cu.ac.jp Newman Newman Newman Newman Newman A Clustering Algorithm
ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ
Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιστικής (2005) σελ.247-256 ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ