Αλγόριθμοι Ευρετηρίασης Προφίλ Χρηστών σε Συστήματα Διάχυσης Πληροφορίας

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Αλγόριθμοι Ευρετηρίασης Προφίλ Χρηστών σε Συστήματα Διάχυσης Πληροφορίας"

Transcript

1 Αλγόριθμοι Ευρετηρίασης Προφίλ Χρηστών σε Συστήματα Διάχυσης Πληροφορίας

2 Αλγόριθμοι Ευρετηρίασης Προφίλ Χρηστών σε Συστήματα Διάχυσης Πληροφορίας Ζερβάκης Ελευθέριος Πανεπιστήμιο Πελοποννήσου 2011

3 Περίληψη Σε ένα σύστημα διάχυσης πληροφορίας, οι χρήστες μπορούν να εγγράφονται σε ένα διακομιστή και να εκφράζουν τις ανάγκες τους είτε με ερωτήσεις είτε με προφίλ. Οι ίδιοι πάλι μπορούν να δημοσιεύσουν κείμενα στους διακομιστές. Οταν ένα νέο κείμενο δημοσιεύεται, οι ερωτήσεις και τα προφίλ που το ικανοποιούν εντοπίζονται και ενημερώσεις στέλνονται στους χρήστες που τους αντιστοιχούν τα προφίλ. Σκοπός αυτής της εργασίας είναι η μελέτη του προβλήματος του φιλτραρίσματος, το οποίο πρέπει να γίνεται αποδοτικά σε κάθε διακομιστή: Δοσμένης μιας βάσης δεδομένων db από προφίλ καιενόςκειμένου d,εντόπισεόλαταπροφίλ q dbταοποίαταιριάζουνμετο d.θα παρουσιάσουμε δομές δεδομένων και αλγόριθμους ευρετηρίασης προφίλ χρηστών με σκοπό να λύσουμε αποτελεσματικά το φιλτράρισμα για μεγάλες βάσεις με ερωτήσεις χρηστώνστομοντέλο AWP.Τομοντέλοδεδομένων AWPβασίζεταισεγνωρίσματα που περιέχουν κείμενο και η γλώσσα των ερωτήσεων περιλαμβάνει λογικούς τελεστές καθώς και τελεστές εγγύτητας. - ii -

4 Abstract In the information filtering paradigm, clients subscribe to a server with continuous queries or profiles that express their information needs. Clients can also publish documents to servers. Whenever a document is published, the continuous queries satisfying this document are found and notifications are sent to appropriate clients. This paper deals with the filtering problem that needs to be solved efficiently by each server: Given a database of continuous queries db and a document d, find all queries q db that match d. We present data structures and indexing algorithms that enable us to solve the filtering problem efficiently for large databases of queries expressed in the model AWP. The AWP data model is based on named attributes with values of type text, and its query language includes Boolean and word proximity operators. - iii-

5 Ευχαριστίες Με την παρούσα εργασία κλείνει ο κύκλος των προπτυχιακών σπουδών μου αλλά πολύ περισσότερο σηματοδοτείται η ολοκλήρωση της έρευνας μου πάνω σε ένα μέρος του πεδίου της Διάχυσης Πληροφορίας. Η έρευνα αυτή δεν θα ήταν δυνατόν να ολοκληρωθεί χωρίς την υποστήριξη του καθηγητή μου κ. Χρήστου Τρυφωνόπουλου, ο οποίος με καθοδήγησε σε αυτή την προσπάθειά. Οι γνώσεις και η βοήθεια που μου παρείχε πάνω στη Διάχυση Πληροφορίας έπαιξαν καθοριστικό ρόλο στην ολοκλήρωση του εγχειρήματοςμου. Εναακόμαάτομοστοοποίοθαήθελαναεκφράσωτιςευχαριστίεςμου είναι η κα. Παρασκευή Ραφτοπούλου για την βοήθεια που μου πρόσφερε, μαζί με τον επιβλέποντα καθηγητή μου, στην σύνταξη της αναφοράς και τις πολύτιμες διορθώσεις για να επιτύχω αυτό το ολοκληρωμένο αποτέλεσμα. Επίσης θα ήθελα να ευχαριστήσω το Εργαστήριο Συστημάτων Λογισμικού και Βάσεων Δεδομένων του Πανεπιστημίου Πελοποννήσου για τους υλικούς πόρους που μου διέθεσε για την εκπόνηση της έρευνάς μου, χωρίς αυτούς θα ήταν κάτι το ακατόρθωτο. Τέλος θέλω να ευχαριστήσω την Επιτροπή Εξέτασης της εργασίας για τις πολύτιμες συμβουλές και παρατηρήσεις τους, που οδήγησαν στην βελτίωση αυτής της δουλειάς. - iv-

6 Περιεχόμενα Κατάλογος Πινάκων Κατάλογος Εικόνων Λεξικό Αγγλικών-Ελληνικών Ορων iii iv vi 1 Εισαγωγή 1 2 Σχετικές Εργασίες Δέντρα ΔιάχυσηΠληροφορίας 5 3 ΤοΜοντέλο AWP Ο Ορισμός των Κειμένων Ο ορισμός των Ερωτήσεων Απάντηση των Ερωτήσεων Η εκφραστική δυνατότητα των τελεστών εγγύτητας στο μοντέλο AWP 14 4 Αλγόριθμοι Ο Αλγόριθμος BestF itt rie Οι Δομές Δεδομένων για τα Κείμενα Οι Δομές Δεδομένων για τις Ερωτήσεις Η Διαδικασία Εισαγωγής των Ερωτήσεων Φιλτράρισμα Εισερχόμενων Κειμένων Οαλγόριθμος PrefixTrieκαι BruteForce 22 5 Η Αναδιοργάνωση των Ερωτήσεων 27 - i-

7 ΠΕΡΙΕΧ ΟΜΕΝΑ 5.1 Η Σειρά Εισαγωγής Αναδιοργάνωση με τον ReT rie Αναδιοργάνωση με τον Buf f er 31 6 Αξιολόγηση ΣυλλογέςΚειμένων Η Συλλογή DBpedia Η Συλλογή των Νευρωνικών Δικτύων Δημιουργία Συλλογών Ερωτήσεων Κύρια Συλλογή Ερωτήσεων Δευτερεύοντες Συλλογές Ερωτήσεων ΚριτήριαΑξιολόγησης ΕπιλογήΠαραμέτρων Επιλογή Παραμέτρων για τον ReT rie Επιλογή Παραμέτρων για τον Buf f er ΣύγκρισηΑποτελεσμάτων Αριθμός Κόμβων Βαθμός Διακλάδωσης Αριθμός Βημάτων Χρόνος Φιλτραρίσματος Μετρήσεις για Μνήμη Αποτελέσματα για τις Δευτερεύουσες Συλλογές Ερωτήσεων Αποτελέσματα για τη Δεύτερη Συλλογή Ερωτήσεων Αποτελέσματα για την Τρίτη Συλλογή Ερωτήσεων 64 7 Συμπεράσματα 66 - ii-

8 Κατάλογος Πινάκων 4.1 Παραδείγματα με αναγνωριστικά υποσύνολα Μερικά χαρακτηριστικά της συλλογής DBpedia Μερικά χαρακτηριστικά της συλλογής N N Μνήμη που χρειάζεται ένα σύστημα για να ευρετηριάσει 3 εκατομμύρια ερωτήσεις στο τελικό δάσος iii-

9 Κατάλογος Εικόνων 4.1 Δομές Δεδομένων για κάθε Κείμενο Δομές Δεδομένων για τα προφίλ των χρηστών. Ευρετήριο ερωτήσεων μετονπίνακακαταχωρήσεων WD(B i ) ΤαδέντραπουδημιουργούνοBestFitTrieκαιοPrefixTrieγιατης ερωτήσεις του Πίνακα Ψευδοκώδικας της εισαγωγής ερωτήσεων με τον αλγόριθμο BestF itt rie Ψευδοκώδικας για το φιλτράρισμα των εισερχόμενων κειμένων Διαφορετική σειρά εισαγωγής των ερωτήσεων Εισαγωγή και αναδιοργάνωση των ερωτήσεων με χρήση τον ReT rie Ψευδοκώδικας για τον ReT rie Ψευδοκώδικας για τον Buf f er Κατανομή συχνοτήτων εμφάνισης των λέξεων της συλλογής DBpedia σε λογαριθμική κλίμακα Κατανομή συχνοτήτων εμφάνισης των λέξεων της συλλογής NN σε λογαριθμική κλίμακα Αναδιοργάνωση των ερωτήσεων με τον αλγόριθμο ReT rie για τρία διαφορετικά Qκαισταθερό c = Αριθμός βημάτων που χρειάζεται ένα κείμενο για να ταιριάξει σε ένα σύστημα με 3 εκατομμύρια ερωτήσεις με διάφορα μήκη. Αλγόριθμος ReT rie Αναδιοργάνωση των ερωτήσεων με τον αλγόριθμο ReT rie για τέσσερα διαφορετικά κατώτερα όρια ομαδοποίησης c και σταθερή συχνότητα αναδιοργάνωσης Q = νέες ερωτήσεις iv-

10 ΚΑΤ ΑΛΟΓΟΣΕΙΚ ΟΝΩΝ 6.6 Ποσοστά των ερωτήσεων που βρίσκονται κάτω από 4 διαφορετικά όρια ομαδοποίσης c Αύξηση των κόμβων στο τελικό δάσος, κάθε 500 χιλιάδες νέες ερωτήσεις,μεμέσομήκος5όρους Μέσος αριθμός βημάτων που χρειάζεται για να ταιριάξει ένα κείμενο σε ένα σύστημα που ευρετηριάζει, στο τελικό δάσος, 3 εκατομμύρια ερωτήσεις Αριθμός κόμβων που δημιουργεί ο κάθε αλγόριθμος Διαφορά του αριθμού κόμβων. Ο δεξιά άξονας y αφορά τους επιπλέονκόμβουςπουδημιουργείοbuffer Freq σεσχέσημετον PrefixTrie. Ενώοαριστεράάξονας yαφοράτουςεπιπλέονκόμβους που δημιουργεί ο P ref ixt rie από τους εναπομείναντες αλγορίθμους Αύξηση κόμβων, για κάθε προσθήκη 500Κ, ερωτήσεων με μέσο μήκος 5όρους Βαθμός διακλάδωσης στο τελικό δάσος, για διάφορα μέσα μήκη ερωτήσεων Μέσος αριθμός βημάτων που χρειάζεται ένα κείμενο για να ταιριάξει με τις ευρετηριασμένες ερωτήσεις του συστήματος Μέσος χρόνος που χρειάζεται ένα κείμενο για να ταιριάξει με τις ευρετηριασμένες ερωτήσεις του συστήματος Αποτελέσματα για την δεύτερη συλλογή ερωτήσεων Αποτελέσματα για την τρίτη συλλογή ερωτήσεων Χρόνοι φιλτραρίσματος για τις δευτερεύουσες συλλογές v-

11 Λεξικό Αγγλικών-Ελληνικών Ορων Attribute Attribute Directory Attribute Universe Branching Factor Clustering Ratio Distinct Word List Field-Programmable Gate Array (FPGA) Greedy Hashtable Main Memory Database System Namespaces Occurrence Table Proximity Formula Proximity Operator Publish/Subscribe System Γνώρισμα Πίνακας Γνωρισμάτων Σύμπαν Γνωρισμάτων Ποσοστό Διακλάδωσης Ποσοστό Ομαδοποίησης Λίστα Μοναδικών Λέξεων Ηλεκτρονική Αλληλογραφία Προγραμματίσιμο Ενσωματωμένο Κύκλωμα Άπληστη Πίνακας Κατακερματισμού Συστήματα Βάσεων Κυρίας Μνήμης Συλλογή Τιμών Πίνακας Εμφανίσεων Τύπος Εγγύτητας Τελεστής Εγγύτητας Σύστημα Διάχυσης Πληροφορίας - vi-

12 ΛΕΞΙΚ ΟΑΓΓΛΙΚ ΩΝ-ΕΛΛΗΝΙΚ ΩΝ ΟΡΩΝ Query RAM Retrieval Semantic Overlay Network Server Super-peer System Trie Trigram Word Patterns Ερώτηση Κύρια Μνήμη Ανάκτηση Σημασιολογικό Δίκτυο Επικάλυψης Διακομιστής Σύστημα Ομότιμων Κόμβων Δέντρο Τρί-γραμμα Μοτίβο Ορων - vii-

13 Κεφάλαιο 1 Εισαγωγή Η αύξηση του όγκου της προσφερόμενης πληροφορίας και κατ επέκταση η ανάγκη για συνεχή αναζήτηση, ώστε οι χρήστες να εντοπίσουν αυτό που πραγματικά τους ενδιαφέρει, δημιουργεί την ανάγκη για την ύπαρξη ενός συστήματος που να τους ενημερώνει όταν γίνει διαθέσιμο κάτι που τους ενδιαφέρει. Ενα τέτοιο σύστημα θα φιλτράρει την εισερχόμενη ροή πληροφορίας και θα παρέχει εξατομικευμένα αποτελέσματα σε κάθε χρήστη. Σε αυτό το σύστημα φιλτραρίσματος πληροφορίας οι χρήστες θα μπορούν να εγγράφονται σε ένα διακομιστή(server) εκφράζοντας τα ενδιαφέροντα τους με την μορφή ερωτημάτων(query) αλλά και με την δημιουργία προφίλ, κάνοντας χρήση μιας καλά ορισμένης γλώσσας κατάλληλης για να εκφράσει τις ανάγκες και επιθυμίες τους. Ταυτόχρονα θα τους δίνεται η δυνατότητα να δημοσιεύουν οι ίδιοι κείμενα στον διακομιστή,ενώότανσυμβείαυτό,ταπροφίλήταερωτήματαπουταιριάζουνμετονέο κείμενο θα εντοπίζονται και το σύστημα θα ειδοποιεί τους χρήστες που τους αντιστοιχούν. Αυτή η εργασία στοχεύει στη μελέτη δομών δεδομένων και αλγορίθμων που χρησιμοποιούνται για την ευρετηρίαση προφίλ χρηστών σε τέτοια συστήματα με σκοπό να επιταχύνει το φιλτράρισμα σε αυτά. Σκοπός μας είναι να λύσουμε αποτελεσματικά το πρόβλημα του φιλτραρίσματος σε κάθε διακομιστή μεμονωμένα: Δοσμένης μιας βάσης δεδομένων db από ερωτήματα και ενόςκειμένου d,εντόπισεόλαταερωτήματα q dbταοποίαταιριάζουνμετο d. Η λειτουργία του φιλτραρίσματος προκαλεί τον μεγαλύτερο φόρτο εργασίας στον διακομιστή, για αυτό πρέπει να είναι αποδοτική ώστε να χειρίζεται σε πραγματικό χρόνο εκατομμύρια ερωτήματα χρηστών. Επικεντρωνόμαστε στο φιλτράρισμα πληροφορίας, που είναι σε μορφή κειμένου, χρησιμοποιώντας ένα μοντέλο δεδομένων που είναι αρκετά διαδεδομένο στην Ανάκτηση Πληροφορίας και ονομάζεται AWP (Attributes -1-

14 Κεφάλαιο 1 with Word Patterns) [KKTR02]. Το συγκεκριμένο μοντέλο βασίζεται σε γνωρίσματα (attributes) που περιέχουν κείμενο και η γλώσσα των ερωτήσεων υποστηρίζει γνωρίσματα, μαζί με τους τελεστές σύγκρισης ισούται και περιέχει καθώς και τελεστές εγγύτητας βασισμένους στο Boolean μοντέλο Ανάκτησης Πληροφορίας [CGMP99]. Στηνεποχήμαςτοκόστοςαγοράςτηςκύριαςμνήμης (RAM)έχειφτάσεισεχαμηλά επίπεδα και το να εξοπλίσουμε έναν μέσο υπολογιστή με μερικά gigabyte μνήμης είναι πλέον συνηθισμένο. Η εξέλιξη αυτή έχει επηρεάσει την ανάπτυξη των εφαρμογών καθώς τείνουν να δίνουν λύσεις βασισμένες στην κύρια μνήμη. Αυτή η επιλογή προσφέρει μεγαλύτερες ταχύτητες και απόδοση στην εκάστοτε εφαρμογή συγκριτικά με αυτές που βασίζονται στην δευτερεύουσα μνήμη. Ενα τέτοιο παράδειγμα είναι τα Συστήματα Βάσεων Κυρίας Μνήμης (MMDBS Main Memory Database System) [GMS92, SP90, DKO + 84],όπουπεριγράφεταιμιαβάσηδεδομένωνπουδιατηρείται στην κύρια μνήμη, ενώ υπάρχουν αντίγραφα ασφαλείας στην δευτερεύουσα(σκληρός δίσκος), για αποφευχθεί απώλεια δεδομένων. Προφανώς και όλες οι εφαρμογές δεν είναι κατάλληλες για MMDBS, αφού αυτό εξαρτάται από την φύση τους. Σε πολλές εφαρμογές που απαιτούν απόκριση πραγματικού χρόνου, όπως η τηλεφωνία, η βάση δεδομένων πρέπει να βρίσκεται εξ ολοκλήρου στην κεντρική μνήμη ενώ σε τραπεζικές εφαρμογές τα δεδομένα μπορεί να μην χωρούν σε αυτή. Ακόμα και σε περιπτώσεις όπου η βάση δεν μπορεί να χωρέσει στην μνήμη, κατανεμημένα συστήματα μπορούν να διαχωρίσουν την βάση σε κομμάτια να την αποθηκεύσουν σε μικρότερες μνήμες και με τεχνικές παράλληλων υπολογισμών να λύσουν το πρόβλημα. Αυτές οι λύσεις καθιστούν τους αλγόριθμους που βασίζονται στην κύρια μνήμη ελκυστικούς σε προβλήματα μεσαίας και μεγάλης κλίμακας διαχείρισης πληροφορίας, που στοχεύουν σε απόκριση πραγματικού χρόνου. Σε αυτή την εργασία αναπτύσσουμε και αξιολογούμε δομές δεδομένων για την κύρια μνήμη με σκοπό να ευρετηριάσουμε εκατομμύρια ερωτημάτων καθώς και αλγόριθμους για να φιλτράρουν τα εισερχόμενα κείμενα. Οι αλγόριθμοι μας βασίζονται στην πρότερη εργασία των C. Tryfonopoulos et al. [TKD04, TKD09] και αποτελούν μια μελέτη των αλγορίθμων που προτάθηκαν καθώς και κάποιων βελτιστοποιήσεων τους. Η βασική ιδέα πίσω από τους αλγόριθμους που θα παραθέσουμε είναι η δυνατότητα ευρετηριασμού των ερωτήσεων με την χρήση δομών δέντρων(tries) ούτως ώστε να επιτύχουμε όσο το δυνατόν καλύτερη ομαδοποίηση. Η ομαδοποίηση αυτή θα βοηθήσει ώστε κατά την διάρκεια του φιλτραρίσματος να χρειαστούν όσο το δυνατόν λιγότερες επισκέψεις στο δάσος των κόμβων, επιτυγχάνοντας έτσι καλύτερο χρόνο φιλτραρίσματος των εισερχόμενων κειμένων. Οι αλγόριθμοι που αναπτύξαμε και εξετάζουμε βασίζονται στην εργασία [YGM94b] καθώς και σε επεκτά- -2-

15 Κεφάλαιο 1 σεις της [TKD04, TKD09]. Πιο συγκεκριμένα θα παρουσιάσουμε τον αλγόριθμο P ref ixt rie που αποτελεί μια επέκταση του T ree των T.W Yan και H.Garcia-Molina [YGM94b] για γνωρίσματα. Επίσης,θαμελετήσουμετοναλγόριθμο BestFitTrieκαιτον ReTrieόπωςαυτοίπαρουσιάζονται στους C. Tryfonopoulos et al. [TKD09], που αποτελούν μια προσέγγιση για καλύτερη οργάνωση και αναδιοργάνωση του δάσους αντίστοιχα, στοχεύοντας και οι δύο στην καλύτερη ομαδοποίηση των προφίλ. Τέλος, θα παραθέσουμε έναν νέοαλγόριθμοονόματι Buffer,πουβασίζεταιστον BestFitTrieμαζίμετηνχρήση στατιστικών λέξεων και την αναδιάταξη της σειράς εισαγωγής των ερωτήσεων. Τέλος, θα παρουσιάσουμε μετρήσεις που αφορούν στην ποιότητα του δάσους των δέντρων που δημιουργεί ο κάθε αλγόριθμος, στην ομαδοποίηση που κάνει και στο πως αυτή επηρεάζει το φιλτράρισμα των κειμένων για διάφορες συλλογές κειμένων. Θα χρησιμοποιήσουμε διαφορετικές παραμέτρους σε διαφορετικά σύνολα από ερωτήσεις ώστε να αντιληφθούμε καλύτερα πως εξελίσσεται ένα σύστημα που καλείται να λύσει το πρόβλημα του ευρετηριασμού των προφίλ και του φιλτραρίσματος των κειμένων καθώς αυτό έχει πολλές πτυχές και επηρεάζεται από διάφορες συνθήκες και παραμέτρους. -3-

16 Κεφάλαιο 2 Σχετικές Εργασίες Το πρόβλημα της διάχυσης πληροφορίας παρουσιάζει μεγάλο ενδιαφέρον καθώς είναι σύνθετο και με αρκετές διαφορές από την ανάκτηση πληροφορίας. Σε αυτό το κεφάλαιο θα παραθέσουμε εργασίες οι οποίες σχετίζονται με το πρόβλημα της διάχυσης. Αρχικά,θαδώσουμετουπόβαθρογιαταδέντρακαθώςκαιτιςπαραλλαγέςτουςενώ στη συνέχεια, θα περιγράψουμε μερικές από τις πιο ενδιαφέρουσες έρευνες πάνω στη διάχυση πληροφορίας, στις περιοχές της ανάκτησης και των βάσεων δεδομένων. 2.1 Δέντρα Ηέννοιατωνδέντρωναρχικάαναπτύχθηκεστηνεργασίατου R. de la Briandais [dlb59], αλλά ο πραγματικός όρος δέντρα(tries) επινοήθηκε από τον E. Frednik [Fre60] και προήλθε από τον αγγλικό όρο για την ανάκτηση retrieval. Τα δέντρα χρησιμοποιούνται σε μια ευρεία γκάμα εφαρμογών που περιλαμβάνουν, διαχείριση λεξικών [AHU83, AMS92, Knu73a], συμπίεση κειμένων [BCW90], επεξεργασία φυσικών γλωσσών [BYG96, Pet80], αναγνώριση μοτίβων [FP86, Riv76], δρομολόγηση IP [NK99], ακόμα και για αναζήτηση δεσμευμένων λέξεων σε ένα μεταγλωττιστή [ASU86]. Το εύρος εφαρμογών που βρίσκουν τα κατατάσσουν στις δομές δεδομένων γενικού σκοπού με ιδιότητες που μας έχουν γίνει γνωστές μέσω πληθώρας ερευνών [Dev92, Fla83, JS91, Knu73a, RJ89, Riv76]. Υπάρχουν διαθέσιμοι αρκετοί τρόποι για το πώς θα υλοποιηθούν οι κόμβοι του δέντρου και η επιλογή εξαρτάται από το είδος της εφαρμογή που θα χρησιμοποιηθεί αυτό. Δύο όμως είναι οι πιο κοινοί τρόποι υλοποίησής των δέντρων, ο πρώτος αφορά στην χρήση πινάκων στο μέγεθος του αλφάβητου [Fre60] και ο δεύτερος την χρήση συνδεδεμένων λιστών με μη κενά στοιχεία για ρίζες των υποδέντρων [dlb59, Knu73b]. -4-

17 Κεφάλαιο 2 Τα δέντρα βασισμένα σε πίνακες είναι κατάλληλα όταν πρόκειται να χρησιμοποιηθούν για σχετικά μικρό μέγεθος αλφαβήτου, ενώ η υλοποίηση με λίστες αφορά περισσότερο περιπτώσεις με μεγάλο αλφάβητο ή κόμβους που έχουν μικρό αριθμό παιδιών, καθώς σε μια τέτοια περίπτωση τα δέντρα βασισμένα σε πίνακες θα αποτελούνταν από πολλά κενά στοιχεία. Δύο είναι οι κύριοι τρόποι για να μειωθεί το μέγεθος ενός δέντρου, είτε μειώνοντας το μέγεθος των κόμβων είτε μειώνοντας τον αριθμό τους, που χρειάζεται για να αναπαρασταθούν τα σύνολα των λέξεων. Τα συμπαγή δέντρα [Sus63] είναι σχηματισμοί που στοχεύουν στην μείωση του συνόλου των κόμβων που χρησιμοποιούνται για να αναπαραστήσουν ένα σύνολο όρων. Αυτό επιτυγχάνεται με την συμπίεση ακολουθιών κόμβων που οδηγούν σε ένα φύλλο, μειώνοντας έτσι τον βαθμό διακλάδωσης σε ένα μόνοκόμβο. Άλλημιαιδέαγιατηνμείωσητουμεγέθουςτουδέντρουείναιηαντιμετώπιση του ευρετηριασμού των λέξεων ως ενιαίο σύνολο και όχι σαν μια ακολουθία. Μεαυτότοντρόπομπορείναεπηρεαστείτομέγεθοςτωνκόμβωνοδηγώνταςσεένα μικρότεροδάσος. Παρόλααυτά,οι D. Comerκαι R. Sethiέδειξανότιτοπρόβλημα της εύρεσης του μικρότερου δυνατού δέντρου είναι NP-complete [CS77] ως εκ τούτου, έχουν προταθεί αρκετές ευριστικές μέθοδοι για την μείωση του μεγέθους ενός στατικού δέντρου όπως για παράδειγμα στην εργασία [Com81]. Στην δική μας προσέγγιση, χρησιμοποιούμε την ιδέα των δέντρων βασισμένα σε συνδεδεμένες λίστες για να υλοποιήσουμε τις δομές δεδομένων που θα αποθηκεύσουν ταερωτήματατωνχρηστών. Οαλγόριθμος BestFitTrieκαιοιπαραλλαγέςπουπαρουσιάζουμε χρησιμοποιούν δέντρα βασισμένα σε λίστες και τεχνικές από την συμπίεση αυτών ώστε να καταφέρουν να εντοπίσουν τα κοινά στοιχεία των ερωτημάτων, με α- ποτέλεσμα να πραγματοποιήσουν καλύτερη ομαδοποίηση κόμβων. 2.2 Διάχυση Πληροφορίας Η ανάκτηση πληροφορίας και η διάχυση πληροφορίας συχνά χαρακτηρίζονται ως οι δύο όψεις του ίδιου νομίσματος [BC92]. Αν και έχουν αρκετά κοινά σημεία, αφού και οι δύο στοχεύουν στην παροχή πληροφόρησης σε αυτούς που την αναζητούν, παρουσιάζουν αρκετές διαφορές. Μερικές από αυτές είναι η επικαιρότητα των πληροφοριών που παρέχουν, η αναγνώριση των αναγκών του χρήστη, η σωστή αναπαράσταση τους καθώς και σε θέματα τεχνικών και αλγορίθμων που επιλέγονται για να ικανοποιήσουν αυτές τις ανάγκες. Από τις πρώτες εργασίες που έγιναν πάνω στο πεδίο της επιλεκτικής διάδοσης πληροφορίας είναι η εργασία του H.P. Luhn [Luh58], όπου περιγράφεται ένα Ευφυές -5-

18 Κεφάλαιο 2 Σύστημα Επιχειρήσεων. Σε αυτό το σύστημα οι χρήστες περιγράφουν τα ενδιαφέροντα τους δημιουργώντας ένα προφίλ, ενώ στη συνέχεια ένα σύστημα επιλογής κειμένων τουςπροτείνειμιαλίσταμενέακείμενα.απόαυτήτηλίσταέχουντηνδυνατότητανα επιλέξουν και να παραγγείλουν τα κείμενα που τους ενδιαφέρουν. Εκείνη την εποχή, αυτή η διαδικασία της επιλογής κειμένων παρουσιάστηκε με τους όρους επιλεκτική διάδοση νέας πληροφορίας. Ο όρος διάχυση πληροφορίας επινοήθηκε αργότερα από τον P.J. Denning [Den82], όπου περιγράφηκε η ανάγκη για την ύπαρξη ενός συστήματος που θα φιλτράρει την εισερχόμενη ηλεκτρονική αλληλογραφία( ) κατά σειρά σημαντικότητας. Στις αρχικές τους προσεγγίσεις οι επιστήμονες της ανάκτησης πληροφορίας επικεντρώθηκαν στη σωστή αναπαράσταση των ενδιαφερόντων του χρήστη [MS94] και στην βελτιστοποίηση της διαδικασίας του φιλτραρίσματος [HPS96]. Η εργασία [MS94] επικεντρώθηκε στην χρήση τεχνικών παρατήρησης της συμπεριφοράς των χρηστών και την ευρετηρίασης υποσυνόλων λέξεων ώστε να προσδιοριστεί ποια κείμενα ενδιαφέρουν ένα χρήστη πραγματικά. Η εργασία [HPS96] μελέτησε το φιλτράρισμα χρησιμοποιώντας μεθόδους βασισμένες σε τεχνικές μηχανικής μάθησης, όπου ένας συνδυασμός διάφορων τεχνικών χρησιμοποιήθηκε για να αυξηθεί η ακρίβεια του φιλτραρίσματος. Άλλες τεχνικές περιλαμβάνουν την χρήση στατιστικών στοιχείων για το φιλτράρισμα των εισερχόμενων κειμένων όπως το LSI-SDI [FD92], που κάνει χρήση της μεθόδου LSI για να φιλτράρει τα εισερχόμενα κείμενα. Μιααπότιςπρώτεςεργασίεςπουμελέτησαντοθέματηςαπόδοσηςσετέτοιασυστήματα είναι η [BM96], όπου περιγράφεται ένα σύστημα διάχυσης πληροφορίας ικανό να αντεπεξέλθει σε μεγάλο όγκο δεδομένων. Οι ερευνητές ανέπτυξαν ένα διακομιστή που δέχεται εισερχόμενα κείμενα με μεγάλο ρυθμό, και πρότειναν αλγόριθμους που υποστηρίζουν το διανυσματικό μοντέλο της ανάκτησης πληροφορίας(vector Space Model) βελτιώνοντας τον αλγόριθμο SQI των T.W. Yang και H. Garcia-Molina [YGM94a]. Ακόμα ένα σύστημα με μεγάλη επιρροή είναι το InRoute [Cal96] βασισμένο σε δίκτυα με κύριο στόχο την αποτελεσματικότητα στο φιλτράρισμα. Το σύστημα InRoute δημιουργούσε δίκτυα κειμένων και ερωτήσεων, ενώ χρησιμοποιούσε τεχνικές βασισμένες στην αβεβαιότητα για να παρέχει αποτελέσματα στο φιλτράρισμα. Άλλες εργασίες επικεντρώθηκαν στην προσαρμοστικότητα που πρέπει να έχει το φιλτράρισμα [Cal98, ZC01] και στο πώς ερωτήσεις που αναπαρίστανται στο διανυσματικό μοντέλο προσαρμόζονται ανάλογα με τα κείμενα που έχουν φιλτραριστεί στο παρελθόν. Εκτός από τις στατιστικές προσεγγίσεις που περιγράψαμε, έχουν αναπτυχθεί και συστήματα που βασίζονται στο Boolean μοντέλο της ανάκτησης πληροφορίας. Ενα -6-

19 Κεφάλαιο 2 αντιπροσωπευτικό παράδειγμα είναι το LMDS [Yoc85], που χρησιμοποιεί τα λιγότερα συχνά κοινά τρι-γράμματα(trigrams) για να προσφέρει γρηγορότερη επεξεργασία των εισερχόμενων κειμένων. Το LMDS ευρετηριάζει τα προφίλ των χρηστών κάτω από το τρί-γραμμα με τον μικρότερο αριθμό εμφανίσεων, ενώ και τα κείμενα αναπαρίστανται ως τρι-γράμματα. Κατά την διαδικασία του φιλτραρίσματος ένας πίνακας καθορίζει ποια προφίλ ταιριάζουν με το εισερχόμενο κείμενο, ενώ επειδή μπορεί να προκύψουν λανθασμένα θετικά αποτελέσματα, απαιτείται και ένα δεύτερο στάδιο για να καθοριστούν ποια ταιριάζουν πραγματικά. Η πλειοψηφία της δουλειάς της διάχυσης πληροφορίας στον τομέα των βάσεων δεδομένων βασίζεται στην εργασία των M. Franklin και S. Zdonik [FZ98] όπου α- ναφέρεται και εκεί ο όρος επιλεκτική διάδοση πληροφορίας. Η πρότερη δουλειά τους εμφανίζεταιστοσύστημα DBIS [AAB + 99]. Οόροςσυστήματαδιάχυσηςπληροφορίας(publish/subscribe systems) που προέρχεται από την περιοχή των κατανεμημένων συστημάτων, χρησιμοποιείται από τους ερευνητές των βάσεων δεδομένων. Ακόμα ένα σύστημα με μεγάλη επιρροή είναι το SIFT [YGM94b, YGM99], όπου οι δημοσιεύσεις είναι απλά κείμενα και οι ερωτήσεις σύνολα λέξεων. Το σύστημα SIFT ήταν το πρώτο σύστημα που έδωσε έμφαση στην ευρετηρίαση των προφίλ με στόχο να αντεπεξέλθει σε μεγάλο όγκο πληροφορίας [YGM94b]. Αργότερα, σχετικές δουλειές επικεντρώθηκαν σε συστήματα διάχυσης πληροφορίας που υποστηρίζουν μοντέλα δεδομένων με γνωρίσματα και γλώσσες ερωτήσεων που υλοποιούν αλφαριθμητικούς τελεστές σύγκρισης(π.χ. τοσύστημα Le Subscribe [FJL + 01],τουποσύστημακαταγραφήςτου Xyleme [NAGP01] και άλλα). Άξιο λόγου είναι και το σύστημα που παρουσιάζουν οι A. Campailla et al. [CCC + 01],καθώςκάνειχρήσηερωτημάτωνβασισμένασεγνωρίσματα, αλλά ξεφεύγει από την υποστήριξη απλής συζευκτικής μορφής των ερωτημάτων πουκάνειηπλειοψηφίατωνσυστημάτωνπουυπάρχουν [FJL + 01].Πιοπρόσφατεςεργασίες επικεντρώνονται στην υποστήριξη κειμένων και ερωτήσεων σε μορφή XML και αποτελούνυποσύνολατου XQueryήXPath(π.χ. XFilter [AF00], YFilter [DAF + 03], Xtrie [CFGR02] και xmltk [GMOS03]). Ενα από τα κυριότερα ζητήματα στη διάχυση πληροφορίας είναι ο καθορισμός των ενδιαφερόντων του χρήστη και ο καλύτερος δυνατός τρόπος αναπαράστασής τους. Ετσι συναντάμε προσεγγίσεις όπως των S. Nilsson και G. Karlsson [NKV10] για την δημιουργία προφίλ που αντιπροσωπεύουν τον χρήστη, όπου κάνοντας χρήση γενετικών αλγορίθμων και εκπαιδεύοντας το σύστημα προσπάθησαν να δημιουργήσουν προφίλ κοντά στα ενδιαφέροντα του. Παράλληλα ο χρήστης βαθμολογώντας την τελική πληροφορία που του παρέχεται από αυτό υποδεικνύει εμμέσως ποια ερωτήματα θα -7-

20 Κεφάλαιο 2 χρησιμοποιηθούν για την επόμενη γενιά. Οι Y.-I. Chang et al. [CSC08] στηριζόμενοι στην λογική ότι τα ενδιαφέροντα ενός χρήστη μεταβάλλονται με τον καιρό ανέπτυξαν ένα σύστημα προσωποποιημένου φιλτραρίσματος επικεντρώνοντας το ενδιαφέρον τους στην δυνατότητα να αντικατοπτριστούν εύκολα αυτές οι αλλαγές στο προφίλ του. Με χρήση ενός συστήματος εξόρυξης γνώσης προσπάθησαν να αναγνωρίσουν τόσο τα μακροπρόθεσμα όσο και τα βραχυπρόθεσμα ενδιαφέροντα του κάθε χρήστη. Η κατηγοριοποίηση των ενδιαφερόντων αποσκοπεί στην σωστότερη αποθήκευση των προφίλ και στην ευκολότερη αναδιοργάνωση του συστήματος όταν προκύπτουν τακτικές αλλαγές. Άλλες προσεγγίσεις πάλι ξεφεύγουν από το μοντέλο της κλασσικής αναπαράστασης των προφίλ ως ακολουθίας απλών όρων και επικεντρώνονται στις σχέσεις που έχουν μεταξύ τους οι λέξεις [NVR10]. Σε αυτές τις προσεγγίσεις, δημιουργείται ένα δίκτυο κόμβωνλέξεωνμεβάρηπουσκοπόέχεινααναπαραστήσειόσοπιοσωστάγίνεταιτα ενδιαφέροντα του κάθε χρήστη αλλά και να αυξήσει την ακρίβεια στα αποτελέσματα που επιστρέφει σε αυτόν. Στα πλαίσια αυτής της προσπάθειας για καλύτερη και πιο περιεκτική αναπαράσταση πληροφορίας, αναπτύσσονται μέθοδοι περιγραφής των ενδιαφερόντωντουχρήστηβασισμένεςσεοντολογίες [ZPH + 08]. Ενώκαιοι M.-J. Park kai C.-W. Chung [PC09] ανέπτυξαν έναν μεσίτη που δέχεται προφίλ σε SPARQL, μια γλώσσα για να εκφράζει ερωτήματα σε μορφή κατάλληλη ώστε να φιλτραριστούν από κείμενα που αναπαρίστανται από οντολογίες. Άλλεςδουλειές [LZB + 08, ZLB + 10, ZLB + 11]επικεντρώνονταιπερισσότεροστο πρόβλημα του φιλτραρίσματος των κειμένων και το χωρίζουν σε δύο στάδια με σκοπό να επιταχύνουν την διαδικασία και να προσφέρουν περισσότερη ακρίβεια στα αποτελέσματα που φέρνουν στους χρήστες. Στο πρώτο στάδιο επικεντρώνονται στο να αποκλείσουν τα μη σχετικά κείμενα που εισέρχονται στο σύστημα ενώ στο δεύτερο εφαρμόζουν στα εναπομείναντα κείμενα, που είναι σχετικά μικρότερου αριθμού, μια τεχνική εντοπισμού μοτίβων λέξεων. Σκοπός τους είναι να επιτύχουν μεγαλύτερη α- κρίβεια στον εντοπισμό αυτών που ταιριάζουν με τα προφίλ και να μειώσουν τον αριθμό των μη σχετικών κειμένων που φτάνουν στον τελικό χρήστη. Ακολουθώντας τη λογική ότι τα μοτίβα λέξεων προσφέρουν περισσότερη πληροφορία από ότι το μοντέλο του συνόλου(ή σάκου) λέξεων [MRS08], και στην τεχνική του παραθύρου λέξεων οι N. Nanas και M. Vavalis [NV08] προσπάθησαν να εντοπίσουν σημασιολογικές ομοιότητες μέσα στα κείμενα και στα προφίλ των χρηστών. Στο ίδιο πλαίσιο κινήθηκαν και άλλες ερευνητικές εργασίες [ALXL09, LAWX09, LAX11] που λαμβάνουν περισσότερο υπ όψιν τους την αρνητική ανταπόκριση των χρηστών σε κείμενα και την συνδυάζουν με τον εντοπισμό μοτίβων όρων σε αυτά με σκοπό να μειωθεί αποτελεσματικότερα ο θόρυβος που φτάνει στους χρήστες. -8-

21 Κεφάλαιο 2 Μια ενδιαφέρουσα προσέγγιση στο θέμα του φιλτραρίσματος κειμένων δίνουν οι W. Vanderbauwhede et al. [VAM09] καθώς υλοποιούν την διαδικασία του φιλτραρίσματος κάνοντας χρήση προγραμματίσιμων ενσωματωμένων κυκλωμάτων FPGA (Field- Programmable Gate Array) με σκοπό να επιταχύνουν τις πιο απαιτητικές ρουτίνες. Παράλληλα άλλες εργασίες [FFTJ09, QYD11] προσπαθούν να αξιοποιήσουν τους σύγχρονους επεξεργαστές με νήματα και να επιταχύνουν την διαδικασία του φιλτραρίσματος παραλληλοποιώντας τους αλγόριθμους που είναι υπεύθυνοι για αυτό. Επιπλέον με την τάση που λαμβάνει η αναπαράσταση πληροφορίας σε XML, αναπτύσσονται αλγόριθμοι για να την υποστήριξη κειμένων και ερωτήσεων σε αυτή τη μορφή ([CW09, Gru11, LML11]), με τον E. Grummt [Gru11] να δίνει έμφαση στην παράλληλη επεξεργασία των προφίλ και κειμένων. Τέλος, θα αναφέρουμε μερικά από τα πιο αντιπροσωπευτικά συστήματα διάχυσης πληροφορίας που αναπτύχθηκαν τα τελευταία χρόνια. Οδηγούμενοι από την έλλειψη συστημάτων ευρείας κλίμακας οι A. Carzaniga et al. [CRW01] ανέπτυξαν το SIENA, ένα κατανεμημένο σύστημα που προσφέρει υπηρεσίες ειδοποίησης χρηστών βασιζόμενο σε γεγονότα. Το σύστημα SIENA κάνει χρήση ενός μοντέλου δεδομένων που βασίζεται σε γνωρίσματα, και προσφέρει δυνατότητες για εγγραφές και ειδοποιήσεις χρηστών καθώς και για δημοσιεύσεις γεγονότων. Πρόκειται για το πρώτο κατανεμημένο σύστημα που επικεντρώνεται τόσο στο να παρέχει εκφραστικότητα στο τρόπο που ζητούν οι χρήστες πληροφορία όσο και στο να προσφέρει λύσεις που αφορούν σε μεγάλο εύρος χρηστών και σε ένα ευρύ χώρο όπως το διαδίκτυο. Στηριζόμενο στις ιδέες του SIENA, οι M. Koubarakis et al. [KKTR02] ανέπτυξαν το σύστημα DIAS αλλά και το σύστημα P2P-DIET [KTID03, IKT04] ενώ χρησιμοποίησαν τα μοντέλα δεδομένων AWPκαι AWPSπουηδημιουργίατουςβασίζεταισειδέεςτηςανάκτησης πληροφορίας. Τα δύο αυτά συστήματα προσπαθούν να συνδυάσουν ιδέες από την ανάκτηση πληροφορίας και τις βάσεις δεδομένων με σκοπό να τις προσφέρουν σε ένα ενιαίο πλαίσιο, ενώ ταυτόχρονα διατηρούν τα χαρακτηριστικά του SIENA που αφορούν στην πλευρά της διάχυσης πληροφορίας. Άλλη μια σημαντική προσφορά του P2P-DIET είναι η παρουσίαση που κάνει για το πώς πρέπει να υποστηρίζονται ερωτήσεις που γίνονται μόνο μια φορά, και στηρίζει δύο παρόμοια πρωτόκολλα, αυτό των συστημάτων ομότιμων κόμβων (super-peer) [YGM03] και αυτό των συστημάτων διάχυσης πληροφορίας (Siena) [CRW01]. Από την άλλη πλευρά, το σύστημα iclusterdl [RPTW08] παρουσιάζει τον τρόπο να χρησιμοποιήσουμε ένα μη δομημένο δίκτυο, που καλείται Σημασιολογικό Δίκτυο Επικάλυψης (Semantic Overlay Networks) [CGM02], για να υποστηριχτούν λειτουργίες τόσο της ανάκτησης όσο και της διάχυσης πληροφορίας σε μια ηλεκτρονική βιβλιοθήκη. -9-

22 Κεφάλαιο 3 ΤοΜοντέλο AWP Σκοπός αυτού του κεφαλαίου είναι η παρουσίαση του μοντέλου δεδομένων AW P πουχρησιμοποιήσαμεγιαναορίσουμετόσοταπροφίλτωνχρηστώνόσοκαιτακείμενα στο σύστημα που αναπτύξαμε. Αντίστοιχη περιγραφή γίνεται στις εργασίες [KKTR02, TKD09] πάνω στις οποίες βασίστηκε η συγκεκριμένη πτυχιακή εργασία. Οι αλγόριθμοι ευρετηρίασης που θα παρουσιάσουμε αργότερα κάνουν χρήση του μοντέλου δεδομένων και ερωτήσεων AW P καθώς έχει μεγάλη περιγραφική δύναμη. Η γλώσσα ερωτήσεων που χρησιμοποιεί το AWP υποστηρίζει τελεστές Boolean καθώς και εγγύτητας (proximity operators) όπως ακριβώς κάνει το μοντέλο των C.-C.K. Chang et al. [CGMP99]. 3.1 Ο Ορισμός των Κειμένων Τα κείμενα στο AW P αποτελούνται από γνωρίσματα (attributes) που παίρνουν τιμές απλού κειμένου. Ορίζουμε το πεπερασμένο αλφάβητο Σ και μια λέξη που ανήκει σεαυτόωςμιασυνεχήμηκενήακολουθίααπόγράμματαπουανήκουνστο Σ. Ως λεξικό ορίζουμε ένα σύνολο από λέξεις πεπερασμένου αριθμού και το συμβολίζουμε με V. Στα παραδείγματα αυτής της εργασία το λεξικό V θα αντιπροσωπεύει το λεξικό της Ελληνικής γλώσσας. Ορισμός3.1.1.Μιατιμή sπουανήκειστολεξικό Vείναιμιαπλήρηςσυνάρτηση τέτοιαπου s : {1,2,...,n} V. Ουσιαστικά η s αποτελείται από μια πεπερασμένη ακολουθία λέξεων που ανήκουν στο V καιηέκφραση s(i)μαςπαρέχειτο i-στοστοιχείοτου s. Ητιμή sμπορεί να χρησιμοποιηθεί για να αναπαραστήσει μη άπειρου μήκους ακολουθίες λέξεων που -10-

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα Βάσεις

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008

Διαβάστε περισσότερα

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ. Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων Δρ. Κωνσταντίνος Χ. Γιωτόπουλος Βασικά θέματα Βάσεων Δεδομένων Ένα Σύστημα Βάσης Δεδομένων

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 4. Τεχνική Ανίχνευσης του. Πτυχιακή Εργασία Σελίδα 95

ΚΕΦΑΛΑΙΟ 4. Τεχνική Ανίχνευσης του. Πτυχιακή Εργασία Σελίδα 95 ΚΕΦΑΛΑΙΟ 4 Τεχνική Ανίχνευσης του ICMP Echo Spoofing Πτυχιακή Εργασία Σελίδα 95 Περιεχόμενα ΕΙΣΑΓΩΓΗ 98 ΜΕΡΟΣ Α: Έλεγχος του Icmp Echo Reply Πακέτου 103 A.1. Ανίχνευση του spoofed Icmp Echo Request Πακέτου.

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Βάση δεδομένων είναι συσχετισμένα μεταξύ τους δεδομένα, οργανωμένα σε μορφή πίνακα. Οι γραμμές του πίνακα αποτελούν τις εγγραφές και περιλαμβάνουν τις πληροφορίες για μια οντότητα. Οι

Διαβάστε περισσότερα

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ 1 Βάση Δεδομένων: Με το όρο Βάση Δεδομένων εννοούμε ένα σύνολο δεδομένων που είναι οργανωμένο

Διαβάστε περισσότερα

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Δομές Δεδομένων Συμβολοσειρές Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Συμβολοσειρές Συμβολοσειρές και προβλήματα που αφορούν συμβολοσειρές εμφανίζονται τόσο συχνά που

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 21/10/2016

Διαβάστε περισσότερα

METALIB Σύστημα μετα-αναζήτησης για ηλεκτρονικές πηγές πληροφόρησης

METALIB Σύστημα μετα-αναζήτησης για ηλεκτρονικές πηγές πληροφόρησης METALIB Σύστημα μετα-αναζήτησης για ηλεκτρονικές πηγές πληροφόρησης Βιβλιοθήκη & Κέντρο Πληροφόρησης, Πανεπιστημίου Λευκωσίας E-mail: libithelp@unic.ac.cy Τηλ: 22444772 Έκδοση: Μάρτιος 2013 (ES, GC, KP)

Διαβάστε περισσότερα

Λίγα λόγια από το συγγραφέα... 7. 91 Βάσεις δεδομένων και Microsoft Access... 9. 92 Microsoft Access... 22

Λίγα λόγια από το συγγραφέα... 7. 91 Βάσεις δεδομένων και Microsoft Access... 9. 92 Microsoft Access... 22 ΕΝΟΤΗΤΑ 5 Περιεχόμενα Λίγα λόγια από το συγγραφέα... 7 91 Βάσεις δεδομένων και Microsoft Access... 9 92 Microsoft Access... 22 93 Το σύστημα Βοήθειας του Microsoft Office... 32 94 Σχεδιασμός βάσης δεδομένων

Διαβάστε περισσότερα

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι:

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι: Χωρική Ανάλυση Ο σκοπός χρήσης των ΣΓΠ δεν είναι μόνο η δημιουργία μίας Β.Δ. για ψηφιακές αναπαραστάσεις των φαινομένων του χώρου, αλλά κυρίως, η βοήθειά του προς την κατεύθυνση της υπόδειξης τρόπων διαχείρισής

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια Ευαγγελία Πιτουρά 1 τιμή γνωρίσματος Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται

Διαβάστε περισσότερα

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη 19ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών, 3-5 Νοεμβρίου 2010, Αθήνα Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη Άννα Μάστορα (1) Μαρία Μονόπωλη (2) Σαράντος Καπιδάκης

Διαβάστε περισσότερα

Δομές Δεδομένων. Ενότητα 11: Τεχνικές Κατακερματισμού. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής.

Δομές Δεδομένων. Ενότητα 11: Τεχνικές Κατακερματισμού. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής. Ενότητα 11: Τεχνικές Κατακερματισμού Καθηγήτρια Μαρία Σατρατζέμη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

Detecting Duplicates over Distributed Data Sources. Δημήτρης Σουραβλιάς

Detecting Duplicates over Distributed Data Sources. Δημήτρης Σουραβλιάς Detecting Duplicates over Distributed Data Sources Δημήτρης Σουραβλιάς Δομή παρουσίασης Εισαγωγή Ορισμός του προβλήματος Παράδειγμα Αρχιτεκτονικές ανίχνευσης διπλότυπων Γενικές παρατηρήσεις Αναφορές DMOD

Διαβάστε περισσότερα

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής Εισαγωγή στις Βάσεις Δεδομένων Εισαγωγή στις Βάσεις Δεδομένων Ορισμός Βάσης Δεδομένων Σύστημα Διαχείρισης Βάσης Δεδομένων ΣΔΒΔ (DBMS) Χαρακτηριστικά προσέγγισης συστημάτων αρχειοθέτησης Χαρακτηριστικά

Διαβάστε περισσότερα

Ερώτημα 1. Μας δίνεται μια συλλογή από k ακολοθίες, k >=2 και αναζητούμε το πρότυπο Ρ, μεγέθους n.

Ερώτημα 1. Μας δίνεται μια συλλογή από k ακολοθίες, k >=2 και αναζητούμε το πρότυπο Ρ, μεγέθους n. Πρώτο Σύνολο Ασκήσεων 2014-2015 Κατερίνα Ποντζόλκοβα, 5405 Αθανασία Ζαχαριά, 5295 Ερώτημα 1 Μας δίνεται μια συλλογή από k ακολοθίες, k >=2 και αναζητούμε το πρότυπο Ρ, μεγέθους n. Ο αλγόριθμος εύρεσης

Διαβάστε περισσότερα

EBSCOhost Research Databases

EBSCOhost Research Databases Η EBSCOhost είναι ένα online σύστημα αναζήτησης σε έναν αριθμό βάσεων δεδομένων, στις οποίες είναι συμβεβλημένο κάθε φορά το ίδρυμα. Διαθέτει πολύγλωσσο περιβάλλον αλληλεπίδρασης (interface) με προεπιλεγμένη

Διαβάστε περισσότερα

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων Ενότητα 4 Επεξεργασία πινάκων 36 37 4.1 Προσθήκη πεδίων Για να εισάγετε ένα πεδίο σε ένα πίνακα που υπάρχει ήδη στη βάση δεδομένων σας, βάζετε τον κέρσορα του ποντικιού στο πεδίο πάνω από το οποίο θέλετε

Διαβάστε περισσότερα

Εγχειρίδιο Χρήσης Slide Recorder

Εγχειρίδιο Χρήσης Slide Recorder Εγχειρίδιο Χρήσης Slide Recorder Αναπτύχθηκε στο Κέντρο Λειτουργίας Διαχείρισης Δικτύου, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Προγραμματιστής: Γιώργος Φράγκος Περιεχόμενα Εγχειρίδιο Χρήσης Slide

Διαβάστε περισσότερα

ΟΜΑΔΑ Λ. Αναστασίου Κωνσταντίνος Δεληγιάννη Ισαβέλλα Ζωγοπούλου Άννα Κουκάκης Γιώργος Σταθάκη Αρετιάννα

ΟΜΑΔΑ Λ. Αναστασίου Κωνσταντίνος Δεληγιάννη Ισαβέλλα Ζωγοπούλου Άννα Κουκάκης Γιώργος Σταθάκη Αρετιάννα ΟΜΑΔΑ Λ Αναστασίου Κωνσταντίνος Δεληγιάννη Ισαβέλλα Ζωγοπούλου Άννα Κουκάκης Γιώργος Σταθάκη Αρετιάννα ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Τι είναι η βιοπληροφορική; Αποκαλείται ο επιστημονικός κλάδος ο οποίος προέκυψε από

Διαβάστε περισσότερα

ΚΑΡΤΕΛΑ ΕΡΕΥΝΗΤΗ ΕΠΙΤΡΟΠΗ ΕΡΕΥΝΩΝ ΑΠΘ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ

ΚΑΡΤΕΛΑ ΕΡΕΥΝΗΤΗ ΕΠΙΤΡΟΠΗ ΕΡΕΥΝΩΝ ΑΠΘ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ 2011 ΕΠΙΤΡΟΠΗ ΕΡΕΥΝΩΝ ΑΠΘ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΚΑΡΤΕΛΑ ΕΡΕΥΝΗΤΗ Στο παρόν έγγραφο μπορείτε να βρείτε αναλυτικές πληροφορίες για τις υπηρεσίες που παρέχονται στην Καρτέλα Ερευνητή

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων 2009-2010: Ευρετήρια 1

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων 2009-2010: Ευρετήρια 1 Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου

Διαβάστε περισσότερα

Πληροφορική 2. Δομές δεδομένων και αρχείων

Πληροφορική 2. Δομές δεδομένων και αρχείων Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες

Διαβάστε περισσότερα

Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας

Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Σε ένα σύστημα φιλτραρίσματος πληροφορίας, ή αλλιώς σύστημα έκδοσης/συνδρομής, οι χρήστες εγγράφονται

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές

Διαβάστε περισσότερα

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι Λειτουργικά Συστήματα 1 Λογισμικό του Υπολογιστή Για να λειτουργήσει ένας Η/Υ εκτός από το υλικό του, είναι απαραίτητο και το λογισμικό Το σύνολο των προγραμμάτων που συντονίζουν τις λειτουργίες του υλικού

Διαβάστε περισσότερα

Κεφάλαιο 4: Λογισμικό Συστήματος

Κεφάλαιο 4: Λογισμικό Συστήματος Κεφάλαιο 4: Λογισμικό Συστήματος Ερωτήσεις 1. Να αναφέρετε συνοπτικά τις κατηγορίες στις οποίες διακρίνεται το λογισμικό συστήματος. Σε ποια ευρύτερη κατηγορία εντάσσεται αυτό; Το λογισμικό συστήματος

Διαβάστε περισσότερα

Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με στόχο τη διαδικασία υποστήριξης λήψης αποφάσεων -

Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με στόχο τη διαδικασία υποστήριξης λήψης αποφάσεων - Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) Ορισμοί Data Warehouse 1. 2. Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο

Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο Κατακερματισμός 1 Αποθήκευση εδομένων (σύνοψη) Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο Παραδοσιακά, μία σχέση (πίνακας/στιγμιότυπο) αποθηκεύεται σε ένα αρχείο Αρχείο δεδομένων

Διαβάστε περισσότερα

PROXY SERVER. Άριστη πύλη διαχωρισμού μεταξύ του εσωτερικού δικτύου και του Internet.

PROXY SERVER. Άριστη πύλη διαχωρισμού μεταξύ του εσωτερικού δικτύου και του Internet. PROXY SERVER Άριστη πύλη διαχωρισμού μεταξύ του εσωτερικού δικτύου και του Internet. Αποτελεσματικό εργαλείο για την απόκρυψη των εσωτερικών λεπτομερειών και διευθύνσεων IP του δικτύου. Αυξάνει τη συνολική

Διαβάστε περισσότερα

Αριστομένης Μακρής. Συστήματα Επιχειρηματικής Ευφυΐας (BI/BA)

Αριστομένης Μακρής. Συστήματα Επιχειρηματικής Ευφυΐας (BI/BA) Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) Ορισμοί Data Warehouse 1. 2. Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με

Διαβάστε περισσότερα

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Βάσεις Δεδομένων Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Στέργιος Παλαμάς, Υλικό Μαθήματος «Βάσεις Δεδομένων», 2015-2016 Κεφάλαιο 2: Περιβάλλον Βάσεων Δεδομένων Μοντέλα Δεδομένων 2.1

Διαβάστε περισσότερα

Πρόταση θέµατος πτυχιακής εργασίας

Πρόταση θέµατος πτυχιακής εργασίας Σχεδιασµό και υλοποίηση παιχνιδιού για τη συλλογή δεδοµένων µε σκοπό την προστασία της ιδιωτικότητας Τα παιχνίδια µε σκοπό (games with a purpose) είναι µια νέα ιδέα που εκµεταλλεύεται την ανθρώπινη αντίληψη

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑ: ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ ΜΟΝΤΕΛΑ ΣΥΣΤΗΜΑΤΟΣ Διδάσκων: Γ. Χαραλαμπίδης, Επ. Καθηγητής

Διαβάστε περισσότερα

Σχεδίαση Βάσεων Δεδομένων

Σχεδίαση Βάσεων Δεδομένων Οδηγίες Μέρος 1: Απαντήστε κάθε ερώτηση. 1. Ποια είναι τα πλεονεκτήματα που παρέχει το Περιβάλλον Βάσεων Δεδομένων της Oracle για τις επιχειρήσεις; Το σύστημα διαχείρισης βάσεων δεδομένων της Oracle δίνει

Διαβάστε περισσότερα

Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη

Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη Ευρετήρια 1 Αρχεία Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη µνήµη. Η µεταφορά δεδοµένων από το δίσκο στη µνήµη και από τη

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Ανάπτυξη μιας προσαρμοστικής πολιτικής αντικατάστασης αρχείων, με χρήση

Διαβάστε περισσότερα

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Βασισμένο σε μια εργασία των Καζαρλή, Καλόμοιρου, Μαστοροκώστα, Μπαλουκτσή, Καλαϊτζή, Βαλαή, Πετρίδη Εισαγωγή Η Εξελικτική Υπολογιστική

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΛΥΣΗ ΣΤΗΝ ΕΥΤΕΡΗ ΑΣΚΗΣΗ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΛΥΣΗ ΣΤΗΝ ΕΥΤΕΡΗ ΑΣΚΗΣΗ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΛΥΣΗ ΣΤΗΝ ΕΥΤΕΡΗ ΑΣΚΗΣΗ ΜΑΘΗΜΑ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΑ. ΕΤΟΣ 2012-13 Ι ΑΣΚΟΝΤΕΣ Ιωάννης Βασιλείου Καθηγητής, Τοµέας Τεχνολογίας

Διαβάστε περισσότερα

Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub

Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub Σύνοψη Σ αυτό το κεφάλαιο θα περιγράψουμε τη δημιουργία φορμών, προκειμένου να εισάγουμε δεδομένα και να εμφανίζουμε στοιχεία από τους πίνακες

Διαβάστε περισσότερα

Εισαγωγή στην εφαρμογή Βασική Σελίδα (Activity) Αναζήτηση Πελάτη... 6 Προβολή Πελάτη... 7 Επεξεργασία Πελάτη... 10

Εισαγωγή στην εφαρμογή Βασική Σελίδα (Activity) Αναζήτηση Πελάτη... 6 Προβολή Πελάτη... 7 Επεξεργασία Πελάτη... 10 Περιεχόμενα Εισαγωγή στην εφαρμογή... 2 Βασική Σελίδα (Activity)... 3 Ρυθμίσεις... 3 Πελάτες... 6 Αναζήτηση Πελάτη... 6 Προβολή Πελάτη... 7 Επεξεργασία Πελάτη... 10 Αποθήκη... 11 Αναζήτηση προϊόντος...

Διαβάστε περισσότερα

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε.

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε. Ψηφιακά Δένδρα Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών τα οποία είναι ακολουθίες συμβάλλων από ένα πεπερασμένο αλφάβητο Ένα στοιχείο γράφεται ως, όπου κάθε. Μπορούμε να

Διαβάστε περισσότερα

Εργαστείτε εξυπνότερα με την Canon

Εργαστείτε εξυπνότερα με την Canon Λογισμικό iw360 Εργαστείτε εξυπνότερα με την Canon > > > > > > > > > > > > Παραγωγικότητα σε κάθε σημείο του γραφείου > > > > > > > > > > >>>>>>> Οι έρευνες αγοράς προσφέρουν πολύτιμη βοήθεια στον καθορισμό

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Πληροφορική 2. Αλγόριθμοι

Πληροφορική 2. Αλγόριθμοι Πληροφορική 2 Αλγόριθμοι 1 2 Τι είναι αλγόριθμος; Αλγόριθμος είναι ένα διατεταγμένο σύνολο από σαφή βήματα το οποίο παράγει κάποιο αποτέλεσμα και τερματίζεται σε πεπερασμένο χρόνο. Ο αλγόριθμος δέχεται

Διαβάστε περισσότερα

Στρατηγική έρευνας. Στρατηγική έρευνας. Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται

Στρατηγική έρευνας. Στρατηγική έρευνας. Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται Στρατηγική έρευνας κάποιος να λύσει ένα πρόβλημα, να κάνει μια εργασία για την εκπλήρωση κάποιου μαθήματος, να συγγράψει ένα

Διαβάστε περισσότερα

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων : Ευρετήρια 1

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων : Ευρετήρια 1 Ευρετήρια 1 Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται (συνήθως) σε ένα γνώρισμα του αρχείου

Διαβάστε περισσότερα

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων .. Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Μάθημα Βασικές Έννοιες - . Ύλη Εργαστηρίου ΒΔ Ύλη - 4 Ενότητες.1 - Σχεδιασμός Βάσης Δεδομένων.2 Δημιουργία Βάσης Δεδομένων Δημιουργία Πινάκων Εισαγωγή/Ανανέωση/Διαγραφή

Διαβάστε περισσότερα

Οδηγός Εγκατάστασης και Χρήσης του Arebas Easy

Οδηγός Εγκατάστασης και Χρήσης του Arebas Easy Σ ε λ ί δ α 1 Οδηγός Εγκατάστασης και Χρήσης του Arebas Easy Περιεχόμενα 1. Download Arebas Easy... 2 2. Εγκατάσταση Arebas Easy... 3 3. Εγγραφή στον Arebas Server... 7 4. Παραμετροποίηση Arebas Easy...

Διαβάστε περισσότερα

Σύβακας Σταύρος ΠΕ19,MSc. IT ΣΥΒΑΚΑΣ ΣΤΑΥΡΟΣ ΕΡΩΤΗΜΑΤΑ

Σύβακας Σταύρος ΠΕ19,MSc. IT ΣΥΒΑΚΑΣ ΣΤΑΥΡΟΣ ΕΡΩΤΗΜΑΤΑ Σύβακας Σταύρος ΠΕ19,MSc. IT Εισαγωγή Τα ερωτήματα (queries) είναι μία από τις πιο σημαντικές δυνατότητες που προφέρει ένα Σ%Β% αφού επιτρέπουν: Ανάκτηση και ανάλυση των δεδομένων στην επιθυμητή μορφή

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/ Τεχνητή Νοημοσύνη 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία: Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας

Διαβάστε περισσότερα

Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1

Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1 Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ.Χατζόπουλος 2 Δένδρο αναζήτησης είναι ένας ειδικός τύπος δένδρου που χρησιμοποιείται για να καθοδηγήσει την αναζήτηση μιας

Διαβάστε περισσότερα

Ανάκτηση πληροφορίας

Ανάκτηση πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 6: Ο Αντεστραμμένος Κατάλογος Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δρ. Κόννης Γιώργος Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής Προγραμματισμός Στόχοι 1 Να περιγράψουμε τις έννοιες του Υπολογιστικού Προβλήματος και του Προγράμματος/Αλγορίθμου

Διαβάστε περισσότερα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων ..?????? Εργαστήριο ΒΑΣΕΙΣ????????? ΔΕΔΟΜΕΝΩΝ Βάσεων Δεδομένων?? ΙΙ Εισαγωγικό Μάθημα Βασικές Έννοιες - . Γενικά Τρόπος Διεξαγωγής Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα

Διαβάστε περισσότερα

ΛΥΣΗ ΤΗΣ ΔΕΥΤΕΡΗΣ ΑΣΚΗΣΗΣ Όλγα Γκουντούνα

ΛΥΣΗ ΤΗΣ ΔΕΥΤΕΡΗΣ ΑΣΚΗΣΗΣ Όλγα Γκουντούνα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΜΑΘΗΜΑ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΑΔ. ΕΤΟΣ 2011-12 ΔΙΔΑΣΚΟΝΤΕΣ Ιωάννης Βασιλείου Καθηγητής Τιμολέων Σελλής Καθηγητής Άσκηση 1

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ. Επιλέγει όλες τις πλειάδες, από μια σχέση R, που ικανοποιούν τη συνθήκη επιλογής.

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ. Επιλέγει όλες τις πλειάδες, από μια σχέση R, που ικανοποιούν τη συνθήκη επιλογής. ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Χειμερινό Εξάμηνο 2012 SQL Structured Query Language Δρ. Βαγγελιώ Καβακλή ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ, ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ 1 Πράξεις της σχεσιακής άλγεβρας ΠΡΑΞΗ ΣΚΟΠΟΣ

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι

Δομές Δεδομένων και Αλγόριθμοι Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 19 Hashing - Κατακερματισμός 1 / 23 Πίνακες απευθείας πρόσβασης (Direct Access Tables) Οι πίνακες απευθείας

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Βάσεις Δεδομένων - Γενικά Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα. Τα περιεχόμενα

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

Διαχείριση Πολιτισμικών Δεδομένων

Διαχείριση Πολιτισμικών Δεδομένων Διαχείριση Πολιτισμικών Δεδομένων Μάθημα 9 Μεταδεδομένα Τζανέτος Πομόνης ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Συντήρησης Πολιτισμικής Κληρονομιάς Τι είναι τα Μεταδεδομένα; Ο όρος

Διαβάστε περισσότερα

Κεφάλαιο 7. ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης

Κεφάλαιο 7. ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης Κεφάλαιο 7 1. Σε τι διαφέρει ο Η/Υ από τις υπόλοιπες ηλεκτρικές και ηλεκτρονικές συσκευές; Που οφείλεται η δυνατότητά του να κάνει τόσο διαφορετικές

Διαβάστε περισσότερα

Υλοποίηση των Σχεσιακών Τελεστών. 6/16/2009 Μ.Χατζόπουλος 1

Υλοποίηση των Σχεσιακών Τελεστών. 6/16/2009 Μ.Χατζόπουλος 1 Υλοποίηση των Σχεσιακών Τελεστών 6/16/2009 Μ.Χατζόπουλος 1 Ένα σχεσιακό ΣΔBΔ πρέπει να συμπεριλαμβάνει αλγόριθμους για υλοποίηση των διαφορετικών τύπων των σχεσιακών πράξεων (καθώς και άλλων πράξεων) που

Διαβάστε περισσότερα

Πληροφορική 2. Τεχνητή νοημοσύνη

Πληροφορική 2. Τεχνητή νοημοσύνη Πληροφορική 2 Τεχνητή νοημοσύνη 1 2 Τι είναι τεχνητή νοημοσύνη; Τεχνητή νοημοσύνη (AI=Artificial Intelligence) είναι η μελέτη προγραμματισμένων συστημάτων τα οποία μπορούν να προσομοιώνουν μέχρι κάποιο

Διαβάστε περισσότερα

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων

Διαβάστε περισσότερα

SilverPlatter WebSPIRS 4.1.

SilverPlatter WebSPIRS 4.1. WebSPIRS 4.1. Η υπηρεσία WebSPIRS από τη SilverPlatter αποτελεί ένα φιλικό εργαλείο πρόσβασης και αναζήτησης σε περιεχόμενα βάσεων δεδομένων. Η Βιβλιοθήκη και Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας

Διαβάστε περισσότερα

Άνοιγμα (και κλείσιμο) της εφαρμογής Εγγράφου Κειμένου

Άνοιγμα (και κλείσιμο) της εφαρμογής Εγγράφου Κειμένου 3.1.1.1 Άνοιγμα (και κλείσιμο) της εφαρμογής Εγγράφου Κειμένου Ως επί το πλείστον δεν υπάρχουν διαφορές στη χρήση του Εγγράφου Κειμένου στα λειτουργικά Windows ή Linux. Η σημαντικότερη διαφορά παρουσιάζεται

Διαβάστε περισσότερα

Ανάκτηση Δεδομένων (Information Retrieval)

Ανάκτηση Δεδομένων (Information Retrieval) Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 8: Εισαγωγή στη SPARQL Βασική Χρήση Μ.Στεφανιδάκης 3-5-2015. Η γλώσσα ερωτημάτων SPARQL Ερωτήσεις (και ενημερώσεις) σε σετ δεδομένων RDF Και σε δεδομένα άλλης μορφής

Διαβάστε περισσότερα

Orchid: Integrating Schema Mapping and ETL ICDE 2008

Orchid: Integrating Schema Mapping and ETL ICDE 2008 Orchid: Integrating Schema Mapping and ETL ICDE 2008 Δομουχτσίδης Παναγιώτης Γενικά Data warehouse (DW): Είναι μία αποθήκη πληροφοριών οργανωμένη από ένα ενοποιημένο μοντέλο. Τα δεδομένα συλλέγονται από

Διαβάστε περισσότερα

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΗΥ463 Συστήµατα Ανάκτησης Πληροφοριών Εργασία: Ανεστραµµένο Ευρετήριο Εισαγωγή Σκοπός της εργασίας είναι η δηµιουργία ενός ανεστραµµένου ευρετηρίου για τη µηχανή αναζήτησης Μίτος, το

Διαβάστε περισσότερα

Κωνσταντίνος Παπαβλασόπουλος ΑΜ:475

Κωνσταντίνος Παπαβλασόπουλος ΑΜ:475 «ΧΡΗΣΗ ΥΒΡΙΔΙΚΩΝ ΕΥΦΥΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΠΡΟΣΑΡΜΟΣΤΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΜΑΘΗΤΩΝ ΣΕ ΕΥΦΥΕΣ ΣΥΣΤΗΜΑ ΔΙΔΑΣΚΑΛΙΑΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ» Κωνσταντίνος Παπαβλασόπουλος ΑΜ:475 Τριμελής Εξεταστική Επιτροπή: Καθηγητής:Λυκοθανάσης

Διαβάστε περισσότερα

Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e

Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e Άσκηση 1 Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e Υπάρχουν τρία μαύρα τετραγωνάκια (b), τρία άσπρα (w) και ένα κενό (e). Η σπαζοκεφαλιά έχει τις ακόλουθες

Διαβάστε περισσότερα

7.9 ροµολόγηση. Ερωτήσεις

7.9 ροµολόγηση. Ερωτήσεις 7.9 ροµολόγηση Ερωτήσεις 1. Να δώσετε τον ορισµό της δροµολόγησης; 2. Από τι εξαρτάται η χρονική στιγµή στην οποία λαµβάνονται οι αποφάσεις δροµολόγησης; Να αναφέρετε ποια είναι αυτή στην περίπτωση των

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ

ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ 2013 ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ Περιήγηση στις δυνατότητες του λογισμικού και στον τρόπο χρήσης του ΟΜΑΔΑ ΕΡΓΟΥ ΔΙΕΥΘΥΝΣΗΣ

Διαβάστε περισσότερα

SGA Διαχείριση Πρωτόκολλου

SGA Διαχείριση Πρωτόκολλου SGA Διαχείριση Πρωτόκολλου SGA Διαχείριση Πρωτόκολλου 1. SGA Διαχείριση Πρωτοκόλλου... 2 1.1. Καινοτομία του προσφερόμενου προϊόντος... 2 1.2. Γενικές αρχές του προσφερόμενου συστήματος... 2 1.3. Ευκολία

Διαβάστε περισσότερα

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Πίνακας περιεχομένων Τίτλος της έρευνας (title)... 2 Περιγραφή του προβλήματος (Statement of the problem)... 2 Περιγραφή του σκοπού της έρευνας (statement

Διαβάστε περισσότερα

Τα µπιτ και η σηµασία τους. Σχήµα bit. ΚΕΦΑΛΑΙΟ 1: Αποθήκευση εδοµένων (1/2) 1.7 Αποθήκευση κλασµάτων 1.8 Συµπίεση δεδοµένων 1.9 Σφάλµατα επικοινωνίας

Τα µπιτ και η σηµασία τους. Σχήµα bit. ΚΕΦΑΛΑΙΟ 1: Αποθήκευση εδοµένων (1/2) 1.7 Αποθήκευση κλασµάτων 1.8 Συµπίεση δεδοµένων 1.9 Σφάλµατα επικοινωνίας ΚΕΦΑΛΑΙΟ 1: Αποθήκευση εδοµένων (1/2) ΚΕΦΑΛΑΙΟ 1: Αποθήκευση εδοµένων (2/2) 1.1 Τα bits και ο τρόπος που αποθηκεύονται 1.2 Κύρια µνήµη 1.3 Αποθηκευτικά µέσα 1.4 Αναπαράσταση πληροφοριών ως σχηµάτων bits

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #11 Suffix Arrays Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης Το παρόν

Διαβάστε περισσότερα

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους από τους

Διαβάστε περισσότερα

13/5/2015 ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ. Δομές Δεδομένων. Ουρές Προτεραιότητας

13/5/2015 ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ. Δομές Δεδομένων. Ουρές Προτεραιότητας ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ Δομές Δεδομένων Τι θα δούμε Ουρές προτεραιότητας Πράξεις Διωνυμικές Ουρές Διωνυμικά Δέντρα Διωνυμικοί Σωροί Ουρές Fibonacci Αναπαράσταση Πράξεις Ανάλυση Συγκρίσεις Ουρές προτεραιότητας

Διαβάστε περισσότερα

Εγχειρίδιο χρήσης της εφαρμογής NewSum v1.0

Εγχειρίδιο χρήσης της εφαρμογής NewSum v1.0 Εγχειρίδιο χρήσης της εφαρμογής NewSum v1.0 Περιεχόμενα 1. Τι είναι το NewSum... 2 2. Εγκατάσταση του NewSum... 2 3. Χρήση της εφαρμογής NewSum... 3 3α. Εκκίνηση της εφαρμογής...3 3β. Περιήγηση στις ειδήσεις...3

Διαβάστε περισσότερα

Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών

Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών ΕΠΛ362: Τεχνολογία Λογισμικού ΙΙ (μετάφραση στα ελληνικά των διαφανειών του βιβλίου Software Engineering, 9/E, Ian Sommerville, 2011) Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών Οι διαφάνειες αυτές

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΕΠΑΛ Α Έκδοση 1.0, Ιούνιος 2014 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

Διαβάστε περισσότερα

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον Δανάη Κούτρα Eργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων Εθνικό Μετσόβιο Πολυτεχνείο Θέματα Σκοπός της διπλωματικής

Διαβάστε περισσότερα

Περιεχόμενα. Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών Μέρος 2: Χρήση υπολογιστή και διαχείριση αρχείων Πρόλογος...

Περιεχόμενα. Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών Μέρος 2: Χρήση υπολογιστή και διαχείριση αρχείων Πρόλογος... Περιεχόμενα Πρόλογος...11 Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών... 13 1.1 Εισαγωγή στους υπολογιστές... 15 1.2 Μονάδες μέτρησης... 27 1.3 Οι βασικές λειτουργίες ενός ηλεκτρονικού υπολογιστή...

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΥΠΟΒΟΛΗΣ ΜΗΧΑΝΟΓΡΑΦΙΚΟΥ ΔΕΛΤΙΟΥ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΥΠΟΨΗΦΙΟΥ ΕΠΑΛ A Έκδοση 1.0, Ιούνιος 2015 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΟΛΙΤΙΣΜΟΥ, ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ ΠΙΝΑΚΑΣ

Διαβάστε περισσότερα

Δομές Δεδομένων. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής. Δομές Δεδομένων. Τμήμα Εφαρμοσμένης Πληροφορικής

Δομές Δεδομένων. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής. Δομές Δεδομένων. Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 8: Γραμμική Αναζήτηση και Δυαδική Αναζήτηση-Εισαγωγή στα Δέντρα και Δυαδικά Δέντρα-Δυαδικά Δέντρα Αναζήτησης & Υλοποίηση ΔΔΑ με δείκτες Καθηγήτρια Μαρία Σατρατζέμη Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Δομές Δεδομένων Εργαστηριακή Άσκηση 2012-2013. Γκόγκος Νίκος Α.Μ.: 4973 Έτος: 3 ο Email: gkogkos@ceid.upatras.gr. Εισαγωγικά:

Δομές Δεδομένων Εργαστηριακή Άσκηση 2012-2013. Γκόγκος Νίκος Α.Μ.: 4973 Έτος: 3 ο Email: gkogkos@ceid.upatras.gr. Εισαγωγικά: Δομές Δεδομένων Εργαστηριακή Άσκηση 2012-2013 Γκόγκος Νίκος Α.Μ.: 4973 Έτος: 3 ο Email: gkogkos@ceid.upatras.gr Εισαγωγικά: Η υλοποίηση του project έχει γίνει σε python [2.7]. Τα python modules είναι αυτόνομα

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης

Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης Δομές Δεδομένων και Αλγόριθμοι Λουκάς Γεωργιάδης loukas@cs.uoi.gr www.cs.uoi.gr/~loukas Στόχοι Μαθήματος Η σχεδίαση και ανάλυση αλγορίθμων και δομών δεδομένων αποτελεί σημαντικό τμήμα της πληροφορικής.

Διαβάστε περισσότερα

ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace

ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace ΒΙΒΛΙΟΘΗΚΗ ΚΑΙ ΚΕΝΤΡΟ ΠΛΗΡΟΦΟΡΙΣΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΕΛΟΠΟΝΝΗΣΟΥ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace Οδηγός Χρήσης ΤΡΙΠΟΛΗ 2015 Μ ε τ η σ υ γ χ ρ η μ α τ ο δ ό τ η σ η τ η ς Ε λ λ ά δ α ς κ α ι τ η ς Ε υ ρ ω π α

Διαβάστε περισσότερα

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη Στο πλαίσιο της πράξης «Αναβάθμιση και Εμπλουτισμός των Ψηφιακών Υπηρεσιών της Βιβλιοθήκης του Παντείου Πανεπιστημίου». Η Πράξη συγχρηματοδοτείται από το Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης (ΕΤΠΑ).

Διαβάστε περισσότερα

Εγχειρίδιο Επιμελητή Δράσεων. (Υπηρεσία Ενημέρωσης για Εκπαιδευτικές και Πολιτισμικές Δράσεις)

Εγχειρίδιο Επιμελητή Δράσεων. (Υπηρεσία Ενημέρωσης για Εκπαιδευτικές και Πολιτισμικές Δράσεις) (Υπηρεσία Ενημέρωσης για Εκπαιδευτικές και Πολιτισμικές Δράσεις) Για το Έργο ΠΕΡΙΕΧΟΜΕΝΑ 1 Εισαγωγή... 3 2 Τεχνικά Χαρακτηριστικά... 4 3 Περιβάλλον Εργασίας... 5 4 Σύνδεση / Αποσύνδεση Επιμελητή Δράσεων...

Διαβάστε περισσότερα