ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Ακ. έτος , 9ο Εξάμηνο ΗΜ&ΜΥ Ν. Κοζύρης Εξαμηνιαία Εργασία. Εισαγωγή στο MapReduce και στις βάσεις NoSQL

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Ακ. έτος , 9ο Εξάμηνο ΗΜ&ΜΥ Ν. Κοζύρης Εξαμηνιαία Εργασία. Εισαγωγή στο MapReduce και στις βάσεις NoSQL"

Transcript

1 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Ε Ρ Γ Α Σ ΤΗΡΙΟ ΥΠΟΛ Ο Γ Ι Σ ΤΙ Κ Ω Ν Σ Υ Σ ΤΗ ΜΑ ΤΩΝ w w w. c s l a b. ec e. n tu a. g r ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Ακ. έτος , 9ο Εξάμηνο ΗΜ&ΜΥ Ν. Κοζύρης Εξαμηνιαία Εργασία Εισαγωγή στο MapReduce και στις βάσεις NoSQL 1 Εισαγωγή Σε αυτή την άσκηση θα χρησιμοποιήσουμε αλγόριθμους MapReduce για να κάνουμε αποθήκευση και ανάλυση σε έναν αριθμό από σετ δεδομένων. Στο πρώτο μέρος (Ενότητα 2) θα χρησιμοποιήσουμε το Hadoop Distributed File System για την αποθήκευση των δεδομένων και το μοντέλο MapReduce για την επεξεργασία των 2 αυτών σετ δεδομένων. Στο δεύτερο μέρος (Ενότητα 3) της άσκησης θα χρησιμοποιήσουμε την HBase., μια κατανεμημένη βάση NoSQL για να κάνουμε μαζική εισαγωγή και επεξεργασία των προηγούμενων δεδομένων στην βάση με σκοπό την δυνατότητα εκτέλεσης ερωτημάτων. Στο τρίτο μέρος (Ενότητα ) της άσκησης θα μελετήσουμε τις δυνατότητες κλιμάκωσης που προσφέρει το κατανεμημένο μοντέλο επεξεργασίας MapReduce. Θα εκτελέσουμε ένα υποσύνολο των προηγούμενων ερωτημάτων χρησιμοποιώντας μεγαλύτερα σετ δεδομένων σε συστοιχίες Hadoop διαφορετικών μεγεθών στον okeanos. 1.1 Σετ Δεδομένων (Datasets) που θα χρησιμοποιηθούν Θα χρησιμοποιήσουμε ένα σετ από πραγματικά ερωτήματα χρηστών μηχανών αναζήτησης και ένα σετ με τους τίτλους όλων των άρθρων της Wikipedia. Για ερωτήματα χρηστών θα χρησιμοποιήσουμε το dataset της America on Line 1 (AOL) που αποτελείται από 20 εκατομμύρια ερωτήματα που έγιναν από 650,000 χρήστες σε διάστημα 3 μηνών. Το αρχείο περιέχει tab-delimited γραμμές της μορφής 1038 max bretos :37: Όπου το πρώτο πεδίο αποτελεί το userid του χρήστη, το δεύτερο πεδίο τα keywords του ερωτήματος διαχωρισμένα με κενά, το τρίτο πεδίο την ημερομηνία του ερωτήματος, το τέταρτο πεδίο την θέση του result και το τελευταίο πεδίο το result που έκανε κλικ ο 1

2 χρήστης. Σε περίπτωση που ο χρήστης δεν επέλεξε κάποιο result ο χρήστης, το τέταρτο και πέμπτο πεδίο είναι κενά. Το AOL dataset της εργασίας μπορείτε να το κατεβάσετε από εδώ: Όσον αφορά το dataset των τίτλων της Wikipedia, κάθε γραμμή του αρχείου περιέχει και από έναν τίτλο. Οι λέξεις του τίτλου είναι διαχωρισμένες με το σύμβολο _. Το αρχείο που περιέχει όλους τους τίτλους των άρθρων της Wikipedia μπορείτε να το κατεβάσετε από εδώ: Κάθε γραμμή του αρχείου περιέχει και από έναν τίτλο. Οι λέξεις του τίτλου είναι διαχωρισμένες με το σύμβολο _ Τα παραπάνω datasets πρέπει να ανέβουν στο hdfs. Κατά την φάση της ανάλυσης, για να μειώσουμε τον θόρυβο των αποτελεσμάτων θα χρειαστεί να χρησιμοποιήσουμε την παρακάτω stop-list με keywords: Η λίστα αυτή περιέχει πολύ συχνές λέξεις που υπάρχουν στην αγγλική γλώσσα. Κατά την ανάγνωση των dataset/queryset θα πρέπει να αποκλείουμε λέξεις που υπάρχουν στην παραπάνω stoplist. Επίσης, κατά την εγκατάσταση του hadoop χρειάζεται να αλλάξουμε το default block size του hdfs. Αυτό γίνεται βάζοντας το παρακάτω entry στο αρχείο hdfs-site.xml <property> <name>dfs.block.size</name> <value> </value> </property> Ο λόγος που το κάνουμε αυτό είναι επειδή το hadoop εκτελεί έναν mapper ανά hdfs block. Επειδή τα dataset είναι σχετικά μικρά (περίπου 200MB το καθένα) το default block size θα τα σπάσει σε λίγα κομμάτια, και δεν θα εκτελεστούν αρκετοί mappers για να δούμε τον παραλληλισμό των εργασιών. Βασικό είναι να βλέπουμε το Hadoop API που περιέχει όλες τις μεθόδους/κλάσεις του hadoop. Αυτό βρίσκεται σε αυτή την διεύθυνση: και στον κατάλογο docs/api/index.html του hadoop tar.gz που έχουμε κατεβάσει. Δεν χρειάζεται να κατεβάσουμε/αποσυμπιέσουμε τα datasets τοπικά στο δικό μας μηχάνημα. Μπορούμε να τα κατεβάσουμε/αποσυμπιέσουμε/ανεβάσουμε κατευθείαν στο

3 hdfs με linux piping 2 από τον server του okeanos. Οι εντολές για να το κάνουμε αυτό είναι οι wget, tar και hadoop fs Δημιουργούμε υποσύνολα των datasets για την ανάπτυξη, για να τελειώνουν πιο γρήγορα τα map/reduce jobs. Πχ, μπορούμε να δημιουργήσουμε ένα enwiki_titles_small.txt με 1000 τίτλους και ένα aol_queries.txt με 1000 queries, έτσι ώστε να δοκιμάζουμε τα προγράμματά μας πριν τους δώσουμε τα μεγάλα datasets. 2 Εισαγωγή στο MapReduce Το AOL dataset αυτού του μέρους της εργασίας μπορείτε να το κατεβάσετε από εδώ: Το αρχείο που περιέχει όλους τους τίτλους των άρθρων της Wikipedia μπορείτε να το κατεβάσετε από εδώ: Υπολογισμός αριθμού αναζητήσεων ανά ημέρα. Σε αυτή την φάση, ζητείται ένα MapReduce πρόγραμμα που θα υπολογίζει τις τιμές για την εξαγωγή ενός γραφήματος που δείχνει για κάθε διαφορετική μέρα της συνολικής χρονικής περιόδου, τον αριθμό των αναζητήσεων που έγιναν για την μέρα αυτή. Το γράφημα αυτό θα έχει στον άξονα Χ ταξινομημένες τις ημερομηνίες (πχ , , κλπ) και στον άξονα Υ τον αριθμό των queries που έγιναν για κάθε μέρα. 2.2 Υπολογισμός ποσοστού «επιτυχών» και «ανεπιτυχών» αναζητήσεων. Ως επιτυχείς αναζητήσεις θεωρούμε τις αναζητήσεις όπου οι χρήστες επέλεξαν να επισκεφτούν μια σελίδα από τα αποτελέσματα. Αντίστοιχα, ανεπιτυχείς είναι οι αναζητήσεις όπου οι χρήστες δεν επέλεξαν να επισκεφτούν κάποιο αποτέλεσμα. Ζητείται ένα πρόγραμμα mapreduce που θα εξάγει τα ποσοστά των επιτυχών και των ανεπιτυχών αναζητήσεων. 2.3 Λίστα ιστοσελίδων που επισκέφτηκαν παραπάνω από 10 διαφορετικοί χρήστες. Εδώ ζητείται η εξαγωγή μιας λίστας που θα περιέχει δύο στήλες: Η πρώτη στήλη θα περιέχει το url των ιστοσελίδων που επισκέφτηκαν πάνω από 10 διαφορετικοί χρήστες, και η δεύτερη στήλη τον αριθμό των χρηστών που επισκέφτηκαν την κάθε ιστοσελίδα. 2.4 Εύρεση δημοφιλών λέξεων κλειδιών των ερωτημάτων της AOL. Σε αυτή την φάση θα υπολογίσουμε την συχνότητα εμφάνισης των λέξεων κλειδιών στα ερωτήματα του America On Line Dataset. Ζητούμενο είναι η κατασκευή ενός map/reduce 2

4 προγράμματος που θα παίρνει σαν input το αρχείο των aol queries και θα παράγει ένα αρχείο της παρακάτω μορφής: VeryPopularKeyword PopularKeyword LessPopularKeyword 2345 UnpopularKeyword 35 Το αρχείο θα περιέχει όλα τα διαφορετικά unique keywords που υπάρχουν στο dataset μαζί με τον αριθμό εμφανίσεων του καθενός. Η ταξινόμηση θα είναι όπως στον παραπάνω πίνακα: το πιο δημοφιλές keyword στην αρχή του αρχείου. Στην αναφορά ζητείται η λίστα με τα 50 πιο δημοφιλή keywords (με την αφαίρεση άσεμνων λέξεων) καθώς και ο συνολικός αριθμός των unique keywords που μετρήσατε. Το αρχείο με την κατανομή των ερωτημάτων θα χρησιμοποιηθεί στην άσκηση 2 σαν γεννήτρια για την παραγωγή συνθετικής κίνησης. Hint3: Μπορείτε να το κάνετε σε 2 map/reduce jobs: το πρώτο θα βγάλει τα keywords με την σειρά εμφανίσεως του καθενός και το δεύτερο map/reduce θα τα ταξινομήσει με σειρά εμφάνισης. Σημαντική εντολή για να κάνετε την αντίστροφη ταξινόμηση είναι η setoutputkeycomparatorclass(longwritable.decreasingcomparator.class); έτσι ώστε να εξαχθούν οι λέξεις με τις περισσότερες εμφανίσεις στην αρχή. Το δεύτερο map/reduce μπορείτε να βάλετε έναν reducer για να βγει ένα ενιαίο τελικό αρχείο. Μετά την εξαγωγή της ταξινομημένης λίστας, ζητείται η σχεδίαση ενός διαγράμματος τιμών <x,y> όπου στον άξονα των x θα υπάρχουν τα keywords ταξινομημένα σύμφωνα με την παραπάνω λίστα και στον άξονα των y ο αριθμός εμφανίσεων του κάθε keyword. Τι παρατηρείτε? Hint4: Δείτε το άρθρο της Wikipedia για το zipf s law Υπολογισμός ιστογράμματος της λεξικογραφικής κατανομής των λέξεων κλειδιών των άρθρων των τίτλων της wikipedia. Όπως είδαμε στο προηγούμενο ερώτημα, η κατανομή των δεδομένων δεν είναι πάντα ομοιόμορφη και γνωστή εκ των προτέρων. Αυτό συμβαίνει αρκετά συχνά και σε δεδομένα κειμένου. Οι ανομοιόμορφες κατανομές δημιουργούν προβλήματα σε εφαρμογές που πρέπει να επεξεργαστούν τέτοιου είδους δεδομένα αφού πρώτα τα σπάσουν σε κομμάτια, όπως πχ κάνει το MapReduce: υπάρχει περίπτωση ένα κομμάτι να δημιουργήσει περισσότερη εργασία από ότι τα άλλα κομμάτια, καθυστερώντας το task που έχει αναλάβει την επεξεργασία του και κατά συνέπεια όλο τον υπολογισμό. Πάρτε για παράδειγμα το πρόγραμμα WordCount του hadoop που μετράει τον αριθμό εμφανίσεων των λέξεων σε ένα σύνολο κειμένων: Η μέτρηση γίνεται με την αποστολή λέξεων σε έναν αριθμό από reducers οι οποίοι μετράνε τον αριθμό εμφανίσεων των λέξεων. Με ποιον τρόπο όμως αποφασίζεται ποιος reducer θα πάρει ποιες συγκεκριμένες λέξεις? Ένας τρόπος θα ήταν να χωρίζαμε τον λεξικογραφικό χώρο [Α Z] σε ίσια κομμάτια, όπου ο πρώτος reducer θα έπαιρνε πχ τις λέξεις που ξεκινάνε από [Α..C], ο 3

5 δεύτερος τις λέξεις από [D F], κλπ. Σε περιπτώσεις όμως άνισης κατανομής, αυτό δεν είναι δίκαιο, καθώς ένας reducer μπορεί να πάρει λιγότερες λέξεις από τους άλλους. Πχ ο τελευταίος reducer που θα έπαιρνε τις λέξεις [X Z] θα είχε λιγότερα αντικείμενα σε σχέση με τους άλλους, καθώς δεν υπάρχουν πολλές λέξεις που ξεκινούν από X,Y,Z. Για τον ισομερή καταμερισμό δεδομένων σε περιπτώσεις που δεν είναι γνωστή εκ των προτέρων η κατανομή που ακολουθούν μπορούμε να χρησιμοποιήσουμε τα ιστογράμματα 4. Τα ιστογράμματα χρησιμοποιούνται από τις βάσεις δεδομένων όπως SQL server, MySQL, κλπ. Ένα ιστόγραμμα προσεγγίζει την ακριβή κατανομή των τιμών των δεδομένων στον χώρο. Ένα ιστόγραμμα πάνω σε ένα σύνολο δεδομένων κατασκευάζεται διαχωρίζοντας την κατανομή δεδομένων σε β >=1 ξένα μεταξύ τους υποσύνολα (τα ονομάζουμε κάδους/bins) και προσεγγίζοντας τις συχνότητες και τις τιμές μέσα σε κάθε κάδο με κάποιο κοινό τρόπο Πρώτο μέρος Ζητείται η κατασκευή ενός MapReduce προγράμματος που θα υπολογίζει την λεξικογραφική κατανομή που ακολουθούν οι λέξεις κλειδιά των τίτλων άρθρων της wikipedia με διαφορετικό βαθμό ακρίβειας. Για το ιστόγραμμα θεωρούμε 28 υποσύνολα (buckets): ένα για κάθε γράμμα της αγγλικής αλφαβήτου, ένα υποσύνολο για τους αριθμούς [0 9] και έναν για τα σύμβολα : <>?[]\;,./. Το πρώτο MapReduce πρόγραμμα που θα κατασκευάσετε θα υπολογίσει την ακριβή κατανομή των λέξεων κλειδιών των τίτλων (histogram_full). Ζητείται ένας πίνακας της μορφής: Εύρος τιμών : <>?[]\;,./ Χ 1 % [0 9] Χ 2 % Α* Χ 3 % Β* Χ 4 %.. Y* X 27 % Z* X 28 % Ποσοστό εμφανίσεων Το δεύτερο mapreduce θα υπολογίζει με προσέγγιση την κατανομή των λέξεων κλειδιών των τίτλων (ιστόγραμμα). Η προσέγγιση γίνεται κατά την φάση map: αντί να αφήσουμε τους mappers να επεξεργαστούν όλα τα δεδομένα, τους τερματίζουμε μόλις έχουν επεξεργαστεί ένα x αριθμό από εγγραφές. Όσο το x μεγαλώνει, τόσο μεγαλύτερη προσέγγιση έχουμε. Θα χρησιμοποιήσετε 2 βαθμούς προσέγγισης: Την πρώτη φορά θα τερματίζετε τους mappers μετά από 50 επαναλήψεις (histogram_50) και την δεύτερη μετά από %BC%CE%B1

6 επαναλήψεις (histogram_1000). Ζητείται επίσης η σχεδίαση των ιστογραμμάτων histogram_full, histogram_50 και histogram_1000 στους ίδιους άξονες Δεύτερο μέρος Το επόμενο βήμα της άσκησης είναι να δημιουργήσετε ένα πρόγραμμα MapReduce το οποίο θα εκτελεί λεξικογραφική ταξινόμηση στις λέξεις κλειδιά των τίτλων των άρθρων της wikipedia. Το τελικό hdfs output του προγράμματος θα είναι αρχεία της μορφής: File1 aaaaa aaaab aacaa baaahhg... ffasaf File2 ffasi jsdfgs... lasdf FileN yasadfg... zxcxzcza όπου Ν ο αριθμός των reducers που θα επιλέξετε. Για την άσκηση επιλέξτε 10 reducers. Τα αρχεία θα περιέχουν ταξινομημένα τα keywords, τόσο μέσα σε κάθε αρχείο (η επόμενη γραμμή θα περιέχει το επόμενο λεξικογραφικά keyword) όσο και μεταξύ διαφορετικών αρχείων (το αρχείο File2 θα περιέχει επόμενα λεξικογραφικά keywords από το File1). Για να το κάνετε αυτό θα χρησιμοποιήσετε έναν διαφορετικό partitioner. Οι partitioners 5 χωρίζουν τον χώρο των κλειδιών έτσι ώστε ο κάθε reducer θα πάρει ένα κομμάτι του dataset. Αρκετά δίκαιος και λιγότερο πολύπλοκος partitioner είναι ο HashPartitioner, αλλά δεν μπορεί να εφαρμοστεί στην περίπτωσή μας, καθώς δεν διατηρεί την σειρά των αντικειμένων. Επομένως θα χρησιμοποιήσουμε range partitioning ο οποίος διατηρεί την σειρά των αντικειμένων. Range partitioning κάνει ο TotalOrderPartitioner του πακέτου org.apache.hadoop.mapreduce.lib.partition (οδηγίες εδώ: artition/totalorderpartitioner.html). Ο TotalOrderPartitioner μέσω της μεθόδου setpartitionfile ορίζει τα διαφορετικά κομμάτια στα οποία θα σπάσει το id space. Το partition file περιέχει εύρη τιμών στα οποία θα αντιστοιχηθεί και από ένας reducer. Το partition file θα πρέπει να δημιουργηθεί εκ των προτέρων με την μέθοδο της δειγματοληψίας. Με την μέθοδο αυτή τρέχουμε μια μικρή mapreduce δουλειά σε ένα δείγμα των δεδομένων και από αυτό κατασκευάζουμε το partition file (στην ουσία πρόκειται για μια προσέγγιση του ιστογράμματος). Πληροφορίες για να το κάνουμε αυτό 5

7 βλέπουμε εδώ: Στην ουσία θα χρησιμοποιηθεί ο κώδικας της προηγούμενης ενότητας με μόνο έναν reducer ο οποίος θα δημιουργήσει το partition file. Ζητείται η κατασκευή δυο partition files: στο πρώτο οι mapers θα διαβάζουν 50 samples ο καθένας, ενώ στο δεύτερο Εκτελέστε το πρόγραμμα που φτιάχνει τα ordered files χρησιμοποιώντας τον TotalOrderPartitioner με δυο διαφορετικά samplefiles. Έστω οι εκτελέσεις ordered_sample_50 και ordered_sample_1000. Τυπώστε το μέγεθος των αντικειμένων που υπάρχουν σε κάθε αρχείο για κάθε εκτέλεση Ερωτήσεις Πόσο χρόνο έκαναν να εκτελεστούν τα προγράμματα histogram_full, histogram_50 και histogram_1000? Πιο ιστόγραμμα προσεγγίζει καλύτερα το histogram_full? Με τι κόστος έγινε αυτή η προσέγγιση? Ποιο γράμμα έχει τα περισσότερα αποτελέσματα? Για ποιο λόγο συμβαίνει αυτό? Σε ποια εκτέλεση από τις ordered_sample_50 και ordered_sample_1000 τα αρχεία File1..File10 που προέκυψαν περιέχουν πιο ισοκατανεμημένο αριθμό κλειδιών? Ποια εκτέλεση από τις ordered_sample_50 και ordered_sample_1000 εκτελέστηκε πιο γρήγορα? Hint5: Στο πρώτο μέρος χρησιμοποιείστε το wordcount χρησιμοποιώντας 27 reducers. Η ρύθμιση αυτή γίνεται με την εντολή jobconf.setnumreducetasks(27) στην main συνάρτηση του hadoop job. 2.6 Υπολογισμός ποσοστού ερωτημάτων που μπορούν να απαντηθούν από την wikipedia Μια πρόσφατη μελέτη 6 έδειξε κάτι που όλοι μας παρατηρούμε κατά την αναζήτηση άρθρων στο google: στο 99% των αναζητήσεων υπάρχει τουλάχιστον ένα άρθρο της Wikipedia στα πρώτα 10 αποτελέσματα. Σε αυτή την εργασία θα χρησιμοποιήσουμε το MapReduce framework για να κάνουμε μια παρόμοια ανάλυση. Πιο συγκεκριμένα, ο τελικός στόχος είναι να δούμε ποιες λέξεις-κλειδιά των ερωτημάτων των χρηστών υπάρχουν σαν λέξεις και στους τίτλους των άρθρων της wikipedia. Στις περιπτώσεις που ισχύει αυτή η συνθήκη, μπορούμε να κάνουμε την απλοποιημένη θεώρηση ότι στα πρώτα results του χρήστη θα εμφανιστεί το αντίστοιχο άρθρο της Wikipedia σε μια μηχανή αναζήτησης. Ένα ερώτημα αποτελείται από μια ή περισσότερες λέξεις-κλειδιά, καθώς και ένας τίτλος ενός άρθρου της Wikipedia μπορεί να έχει περισσότερες από μια λέξεις Παράδειγμα Έστω το ερώτημα q1: Who is Einstein?. Επίσης, έστω το άρθρο της Wikipedia με τίτλο t1: Albert_Einstein. Εφόσον το keyword Einstein υπάρχει και στο ερώτημα q1 και στο άρθρο με τίτλο t1 θεωρούμε ότι το άρθρο Albert_Einstein της Wikipedia θα είναι στα 6

8 πρώτα results της αναζήτησης Who is Einstein?. Σε αντίθετη περίπτωση, θεωρούμε ότι το ερώτημα δεν θα επιστρέψει αποτελέσματα από κανένα άρθρο της Wikipedia. Για την εκτέλεση της εργασίας μπορείτε να χρησιμοποιήσετε όσα map/reduce βήματα θέλετε. Το τελικό ζητούμενο της ενότητας είναι ένας πίνακας της μορφής: Ερωτήματα που περιέχουν στα αποτελέσματά τους άρθρα της wikipedia Ερωτήματα που δεν περιέχουν στα αποτελέσματά τους άρθρα της wikipedia Συνολικός αριθμός Ποσοστό % Qexist Q exist 100 Q Q exist not_ exist Qnot_ exist Q not_exist 100 Q Q exist not_ exist 3 Εισαγωγή στις βάσεις NoSQL (HBase) Σε αυτό το ερώτημα θα χρησιμοποιήσουμε τα σετ δεδομένων του ερωτήματος 2 με σκοπό να γεμίσουμε μια βάση NoSQL (συγκεκριμένα την HBase) με δεδομένα και να εκτελέσουμε ερωτήματα επάνω σε αυτά τα δεδομένα. Στην βάση θα εισάγουμε όλους τους τίτλους της wikipedia, και τα ερωτήματα που θα κάνουμε θα προέρχονται από το μικρό dataset της aol. Στο πρώτο μέρος της άσκησης θα εισάγουμε τα δεδομένα στην βάση χρησιμοποιώντας το MapReduce framework. Στο δεύτερο μέρος της άσκησης θα χρησιμοποιήσουμε το API της hbase για να εκτελέσουμε απλά ερωτήματα στην βάση. Ο τελικός στόχος είναι να μπορούμε να κάνουμε αναζητήσεις λέξεων κλειδιών στους τίτλους των άρθρων της wikipedia χρησιμοποιώντας την Hbase. Οι αναζητήσεις θα είναι της μορφής: ποια άρθρα της wikipedia έχουν στον τίτλο τους το keyword X? Για την απάντηση τέτοιου είδους ερωτημάτων θα δημιουργήσουμε ένα βοηθητικό ευρετήριο (index) που λέγεται ανεστραμμένο ευρετήριο (inverted index) Εισαγωγή των τίτλων της wikipedia στην Hbase. Στην προηγούμενη άσκηση απλά μεταφέραμε το xml αρχείο με τους τίτλους της wikipedia στο hadoop. Παρόλο που η μεταφορά έγινε γρήγορα, δεν έχουμε την δυνατότητα να επεξεργαζόμαστε το αρχείο, κάτι που γενικά ισχύει για αρχεία κειμένου. Σε αυτή την περίπτωση, βολεύει η μεταφορά των δεδομένων σε μια βάση, έτσι ώστε να μπορούμε να έχουμε γρήγορη τυχαία πρόσβαση ή δυνατότητα ενημερώσεων των εγγραφών. Σε αυτό το ερώτημα θα μεταφέρουμε τους τίτλους των άρθρων της wikipedia στην Hbase. Για τον σκοπό αυτό θα δημιουργήσουμε έναν πίνακα με το όνομα content. Σύμφωνα με το μοντέλο δεδομένων της hbase, κάθε άρθρο μπορεί να αποθηκευτεί σε μια διαφορετική γραμμή (row), σε ένα ξεχωριστό κελί στον πίνακα content. Έτσι, για κάθε άρθρο θα δημιουργηθεί ένα κελί, το οποίο θα έχει ένα αναγνωριστικό γραμμής (row key) και μια τιμή (value). Η τιμή του κελιού θα είναι ο τίτλος του άρθρου. Το αναγνωριστικό του κελιού θα είναι ένα μοναδικό (unique) id με το οποίο θα μπορούμε να το ανακτήσουμε. Στην άσκηση 7

9 θα χρησιμοποιήσουμε σαν αναγνωριστικό το md5hash του τίτλου. Έτσι, πχ ο τίτλος Bill_gates θα αποθηκευτεί στον πίνακα content σαν ένα κελί με την τιμή Bill_Gates και αναγνωριστικό md5( Bill_Gates )= b3ef87cdc2a251a3f14717ec0. Με αυτόν τον τρόπο, μπορούμε να ανακτήσουμε την τιμή του κελιού εάν γνωρίζουμε το αναγνωριστικό της γραμμής με την get(key) εντολή της hbase. Το αναγνωριστικό δεν έχει κάποια ιδιαίτερη σημασία, απλά χρειάζεται να είναι μοναδικό για κάθε άρθρο. Για την δημιουργία του πίνακα θα χρησιμοποιήσετε τον μηχανισμό bulk loading 8 της hbase, ο οποίος είναι πιο γρήγορος από την απλή εκτέλεση διαδοχικών Put commands. Ο μηχανισμός bulk loading πρόκειται στην ουσία για μια εργασία mapreduce η οποία παίρνει σαν input ένα set αρχείων από το hdfs και σαν output δημιουργεί regions της HBase, οι οποίες κατόπιν εισάγονται στην βάση. Τα regions της hbase στην ουσία αποτελούνται από αρχεία στο hdfs. Ο αριθμός των αρχείων που θα αποτελέσουν τα regions ορίζονται από τον αριθμό των reducers που θα βάλετε. Επίσης, σαν output του job θα πρέπει να ορίσετε την κλάση HFileOutputFormat. Στο παρακάτω link περιγράφεται η διαδικασία εισαγωγής των δεδομένων από το hdfs σε έναν πίνακα στην HBase. Ο πίνακας και τα column families θα πρέπει να προϋπάρχουν στην HBase. Επομένως θα δημιουργήσετε έναν κενό πίνακα μαζί με τα column families που θέλετε με το hbase shell, όπως είδαμε στο φροντιστήριο. 9 Χρήσιμο link είναι και αυτό το οποίο τρέχει από command line την εντολή LoadIncrementalHFiles που έχουν δημιουργηθεί. Για να τρέξετε την εντολή μέσα από κώδικα, μπορείτε να τρέξετε αυτό: ToolRunner.run(new LoadIncrementalHFiles(HBaseConfiguration.create()) Ερώτηση: Γιατί ο μηχανισμός bulk import είναι πιο γρήγορος από διαδοχικά Put για κάθε αντικείμενο? Πως εξηγείται αυτό λαμβάνοντας υπόψη την αρχιτεκτονική της HBase κατά την εισαγωγή νέων αντικειμένων? 3.2 Εξαγωγή ανεστραμένου ευρετηρίου inverted index των λέξεων κλειδιών. Αφού έχουμε δημιουργήσει τον πίνακα content, τώρα μπορούμε να δημιουργήσουμε το ανεστραμμένο ευρετήριο (έστω πίνακας index). Σύμφωνα με τον ορισμό του ανεστραμμένου ευρετηρίου, η δομή αυτή περιέχει την αντιστοίχηση περιεχομένου (πχ λέξεις κλειδιά) στην τοποθεσία που αυτό έχει εντοπιστεί (πχ συγκεκριμένα έγγραφα). Τα ανεστραμμένα ευρετήρια χρησιμοποιούνται στην αναζήτηση κειμένου (full text search) και ίσως το μεγαλύτερο ανεστραμμένο ευρετήριο είναι αυτό που διατηρεί το google για την εκτέλεση των αναζητήσεων. Για να καταλάβουμε καλύτερα τα ανεστραμμένα ευρετήρια, ας θεωρήσουμε το αντίστοιχο παράδειγμα. Έστω ότι έχουμε τα παρακάτω κείμενα: T 0 = it is what it is T 1 = what is it T 2 = it is a banana

10 Tο ανεστραμμένο ευρετήριο με τις εμφανίσεις των λέξεων σε κείμενα μπορεί να είναι της μορφής: "a": {2} "banana": {2} "is": {0, 1, 2} "it": {0, 1, 2} "what": {0, 1} Χρησιμοποιώντας το ευρετήριο μπορούμε να βρούμε γρήγορα σε ποια κείμενα βρίσκεται μια συγκεκριμένη λέξη: πχ η λέξη banana υπάρχει μόνο στο κείμενο 2, ενώ η λέξη it υπάρχει στα κείμενα 0,.1, 2. Για την δημιουργία του ανεστραμμένου ευρετηρίου θα χρησιμοποιήσουμε πάλι την δυνατότητα bulk loading. H mapreduce εργασία που θα δημιουργήσει τον πίνακα index θα πάρει σαν input τον πίνακα content. Στην ουσία, η mapreduce εργασία θα είναι το παράδειγμα wordcount που χρησιμοποιήσαμε και στα προηγούμενα ερωτήματα, με την διαφορά ότι οι mapers θα κάνουν emmit μαζί με την λέξη και το id του κειμένου στο οποίο βρέθηκε (αντί για 1 που κάνει emit το wordcount). Κατόπιν, οι reducers θα συλλέγουν για κάθε μοναδική λέξη τα ids των κειμένων που την περιέχουν, και θα δημιουργούν την γραμμή με τις αντιστοιχήσεις. Μετά την εκτέλεση αυτού του ερωτήματος θα υπάρχουν 2 πίνακες στην hbase: ο πίνακας content που θα περιέχει τους τίτλους των άρθρων στην wikipedia και ο πίνακας index που θα περιέχει το ανεστραμμένο ευρετήριο για την εκτέλεση ερωτημάτων. 3.3 Εκτέλεση ερωτημάτων Σε αυτό το ερώτημα θα χρησιμοποιήσουμε τον client της hbase για να εκτελέσουμε ερωτήματα στους τίτλους της wikipedia. Οδηγίες χρήσης του client μπορούμε να βρούμε εδώ 10 Σε γενικές γραμμές, δημιουργούμε ένα αντικείμενο τύπου HTable, και τα ερωτήματα γίνονται με την χρήση της κλάσης Get: Get g = new Get(Bytes.toBytes("keyword")); Result r = table.get(g); και ψάχνουμε το αποτέλεσμα result ως εξής: byte [] value = r.getvalue(bytes.tobytes("mylittlefamily"), Bytes.toBytes("someQualifier")); String valuestr = Bytes.toString(value); System.out.println("GET: " + valuestr); Για την δημιουργία των ερωτημάτων θα χρησιμοποιήσουμε το αρχείο με τα δημοφιλή keywords των προηγούμενων ερωτημάτων. Για να το κάνουμε αυτό, θα αποθηκεύσουμε την λίστα με τα 1000 ποιο δημοφιλή keywords, και θα διαλέγουμε με τυχαίο τρόπο ένα κάθε φορά. Κάντε συνολικά ερωτήματα στον πίνακα index. Πόσα ερωτήματα επιστρέφουν αποτελέσματα? 10

11 4 Κλιμακωσιμότητα Hadoop MapReduce και HBase Σε αυτή την ενότητα θα μελετήσουμε πως επηρεάζεται ο χρόνος εκτέλεσης της επεξεργασίας μεγάλου όγκου δεδομένων σε διαφορετικά μεγέθη συστοιχιών Hadoop και HBase. Για τον σκοπό αυτό θα χρησιμοποιήσουμε μια προ-εγκατεστημένη συστοιχία Hadoop και HBase στον okeano που θα αποτελείται από έναν μεγάλο αριθμό υπολογιστικών κόμβων. Τα δεδομένα που θα χρησιμοποιήσουμε είναι του ίδιου τύπου με τα δεδομένα της ενότητας 1.1 και θα είναι ανεβασμένα στο HDFS εκ των προτέρων. 4.1 Υπολογισμός ποσοστού ερωτημάτων που μπορούν να απαντηθούν από την wikipedia Σε αυτή την ενότητα θα εκτελέσουμε τον κώδικα του ερωτήματος 2.6. Θα χρησιμοποιήσουμε 3 διαφορετικά μεγέθη συστοιχιών για να εκτελέσουμε τον κώδικα MapReduce στο ίδιο dataset. Στην αναφορά φτιάξτε έναν πίνακα και ένα διάγραμμα που να δείχνει πως επηρεάζεται ο χρόνος εκτέλεσης από το μέγεθος του cluster. Τι παρατηρείτε? 4.2 Εξαγωγή ανεστραμένου ευρετηρίου inverted index των λέξεων κλειδιών των άρθρων της wikipedia Σε αυτή την ενότητα θα εκτελέσουμε τον κώδικα του ερωτήματος 3.2. Ο πίνακας στην HBase με τα άρθρα της Wikipedia θα είναι ήδη έτοιμος. Καλείστε να εκτελέσετε τον κώδικα που εξάγει το ανεστραμμένο ευρετήριο με 3 διαφορετικά μεγέθη συστοιχιών. Στην αναφορά φτιάξτε έναν πίνακα και ένα διάγραμμα που να δείχνει πως επηρεάζεται ο χρόνος εκτέλεσης από το μέγεθος του cluster. Τι παρατηρείτε? 5 Διαδικαστικά Η άσκηση θα υλοποιηθεί είτε ατομικά, είτε σε ομάδες 2 ατόμων. Η παράδοση θα γίνει στο mail atds@cslab.ntua.gr. Το θέμα του mail θα είναι Εξαμηνιαία Εργασία Προχωρημένα Θέματα Βάσεων Δεδομένων. Η προθεσμία παράδοσης είναι την Παρασκευή 2 Μαΐου Θα ακολουθήσουν οδηγίες για την εκτέλεση των ερωτημάτων της ενότητας 4. Η παράδοση θα αποτελείται από: o Μια σύντομη αναφορά όπου θα περιγράφετε την μεθοδολογία που ακολουθήσατε (όχι κώδικας εδώ). o Ψευδοκώδικας για τα προγράμματα Map/Reduce που χρησιμοποιήσατε για κάθε κομμάτι της άσκησης. Ο ψευδοκώδικας θα δείχνει εποπτικά τα key/values που παίρνει η συνάρτηση map, την επεξεργασία που τους κάνει, τα key/values που κάνει emit στην συνάρτηση reduce, και την επεξεργασία που κάνει η reduce (σαν τον ψευδοκώδικα του wordcount). o Links στο hdfs site όπου έχετε βάλει τα datasets καθώς και τα ενδιάμεσα/τελικά αποτελέσματα. o Ένα zip file με τον κώδικα. o Ένα zip file με τα log-files των εργασιών MapReduce από τις οποίες βγήκαν τα αποτελέσματα.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής ΕΠΛ 451 Εξόρυξη Δεδομένων στον Παγκόσμιο Ιστό I. Στόχος ΑΣΚΗΣΗ 1 Ανάλυση συσχετίσεων ανάμεσα σε προϊόντα Διδάσκων: Γιώργος Πάλλης Υπεύθυνος Εργασίας: Παύλος Αντωνίου

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ Εαρινό Εξάμηνο

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ Εαρινό Εξάμηνο ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ Εαρινό Εξάμηνο 2016-2017 Υποχρεωτική εργασία Τα τελευταία χρόνια, λόγω της τεράστιας αύξησης της ποσότητας της πληροφορίας που έχουμε

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2010-2011 ΑΣΚΗΣΗ Συγκομιδή και δεικτοδότηση ιστοσελίδων Σκοπός της άσκησης είναι η υλοποίηση ενός ολοκληρωμένου συστήματος συγκομιδής και δεικτοδότησης ιστοσελίδων.

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

ΜΕΛΕΤΗ ΣΧΕΔΙΑΣΗ ΕΦΑΡΜΟΓΗΣ ΣΕ ΥΠΟΛΟΓΙΣΤΙΚΟ ΝΕΦΟΣ (CLOUD COMPUTING) ΜΕ ΕΜΦΑΣΗ ΣΤΗΝ ΚΑΤΑΣΚΕΥΗ ΔΕΝΤΡΩΝ.

ΜΕΛΕΤΗ ΣΧΕΔΙΑΣΗ ΕΦΑΡΜΟΓΗΣ ΣΕ ΥΠΟΛΟΓΙΣΤΙΚΟ ΝΕΦΟΣ (CLOUD COMPUTING) ΜΕ ΕΜΦΑΣΗ ΣΤΗΝ ΚΑΤΑΣΚΕΥΗ ΔΕΝΤΡΩΝ. ΤΕΙ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΗΥΣ Θέμα: ΜΕΛΕΤΗ ΣΧΕΔΙΑΣΗ ΕΦΑΡΜΟΓΗΣ ΣΕ ΥΠΟΛΟΓΙΣΤΙΚΟ ΝΕΦΟΣ (CLOUD COMPUTING) ΜΕ ΕΜΦΑΣΗ ΣΤΗΝ ΚΑΤΑΣΚΕΥΗ ΔΕΝΤΡΩΝ. Εισηγητής: Δ. Ν. Καλλέργης, MSc. Φοιτήτρια: Κοντζοπούλου Παναγιώτα Εισαγωγή

Διαβάστε περισσότερα

Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 - Project Σεπτεμβρίου Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος Εξέταση: Προφορική, στο τέλος της εξεταστικής. Θα βγει ανακοίνωση στο forum. Ομάδες

Διαβάστε περισσότερα

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων...

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων... Μέρος 2 Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων... 211 Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων... 241 Kεφάλαιο 13 Ανάλυση δεδομένων... 257 Kεφάλαιο 14 Συναρτήσεις Μέρος Β... 285 Kεφάλαιο 15 Ευρετήριο

Διαβάστε περισσότερα

MapReduce Εισαγωγή. MapReduce. ηµήτρης Λεβεντέας

MapReduce Εισαγωγή. MapReduce. ηµήτρης Λεβεντέας Εισαγωγή MapReduce ηµήτρης Λεβεντέας 6 Μαΐου 2010 Εισαγωγή Ορισµός Τι είναι Ορισµός Το MapReduce είναι ένα framework λογισµικού που είσηχθηκε από την Google για να υποστηρίξει κατανεµηµένο υπολογισµό σε

Διαβάστε περισσότερα

Βάσεις δεδομένων (Access)

Βάσεις δεδομένων (Access) Βάσεις δεδομένων (Access) Όταν εκκινούμε την Access εμφανίζεται το παρακάτω παράθυρο: Κουμπί Κενή βάση δεδομένων Κουμπί του Office Για να φτιάξουμε μια νέα ΒΔ κάνουμε κλικ στο κουμπί «Κενή βάση δεδομένων»

Διαβάστε περισσότερα

Επερωτήσεις σύζευξης με κατάταξη

Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις κατάταξης Top-K queries Οι επερωτήσεις κατάταξης επιστρέφουν τις k απαντήσεις που ταιριάζουν καλύτερα με τις προτιμήσεις του χρήστη. Επερωτήσεις κατάταξης Top-K

Διαβάστε περισσότερα

Οδηγίες Χρήσης της MySQL

Οδηγίες Χρήσης της MySQL ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΗΜΕΙΩΣΕΙΣ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Οδηγίες Χρήσης της MySQL Διδάσκων: Γιάννης Θεοδωρίδης Συντάκτης Κειμένου: Βαγγέλης Κατσικάρος Απρίλιος 2007 1 Περιεχόμενα Εισαγωγή...2

Διαβάστε περισσότερα

Βάσεις δεδομένων (Access)

Βάσεις δεδομένων (Access) Βάσεις δεδομένων (Access) Όταν εκκινούμε την Access εμφανίζεται το παρακάτω παράθυρο: Για να φτιάξουμε μια νέα ΒΔ κάνουμε κλικ στην επιλογή «Κενή βάση δεδομένων» στο Παράθυρο Εργασιών. Θα εμφανιστεί το

Διαβάστε περισσότερα

Οδηγίες Χρήσης της MySQL

Οδηγίες Χρήσης της MySQL ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΗΜΕΙΩΣΕΙΣ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Οδηγίες Χρήσης της MySQL Διδάσκων: Γιάννης Θεοδωρίδης Συντάκτης Κειμένου: Βαγγέλης Κατσικάρος Νοέμβριος 2007 1 Περιεχόμενα Εισαγωγή...2

Διαβάστε περισσότερα

Υλοποίηση κατασκευής δέντρου επιθεμάτων σε Hadoop MapReduce

Υλοποίηση κατασκευής δέντρου επιθεμάτων σε Hadoop MapReduce κατασκευής δέντρου επιθεμάτων σε Hadoop MapReduce Αλέξανδρος Κωνσταντινάκης - Κάρμης Εργαστήριο Βάσεων Δεδομένων - Εθνικό Μετσόβιο Πολυτεχνείο 12 Ιουλίου 2010 Βιολογικό Υλικό Εισαγωγή Βιολογικό Υλικό Δέντρα

Διαβάστε περισσότερα

Εισαγωγή στην Αριθμητική Ανάλυση

Εισαγωγή στην Αριθμητική Ανάλυση Εισαγωγή στην Αριθμητική Ανάλυση Εισαγωγή στη MATLAB ΔΙΔΑΣΚΩΝ: ΓΕΩΡΓΙΟΣ ΑΚΡΙΒΗΣ ΒΟΗΘΟΙ: ΔΗΜΗΤΡΙΑΔΗΣ ΣΩΚΡΑΤΗΣ, ΣΚΟΡΔΑ ΕΛΕΝΗ E-MAIL: SDIMITRIADIS@CS.UOI.GR, ESKORDA@CS.UOI.GR Τι είναι Matlab Είναι ένα περιβάλλον

Διαβάστε περισσότερα

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων Ενότητα 4 Επεξεργασία πινάκων 36 37 4.1 Προσθήκη πεδίων Για να εισάγετε ένα πεδίο σε ένα πίνακα που υπάρχει ήδη στη βάση δεδομένων σας, βάζετε τον κέρσορα του ποντικιού στο πεδίο πάνω από το οποίο θέλετε

Διαβάστε περισσότερα

11/28/2016 Απόδοση Συστημάτων, Remote Jmeter και Dacappo

11/28/2016 Απόδοση Συστημάτων, Remote Jmeter και Dacappo Remote Jmeter και Dacappo Distributed Jmeter Έχουμε πει στη θεωρία ότι ένα βασικό πρόβλημα είναι client Bottlenecks Δεν μπορείτε να υπερφορτώσετε τον πελάτη σε ένα μηχάνημα ώστε να φτάσει τον απαιτούμενο

Διαβάστε περισσότερα

ΑΣΚΗΣΗ Α. Δεικτοδότηση Συλλογής Κειμένων σε Ανεστραμμένο Ευρετήριο

ΑΣΚΗΣΗ Α. Δεικτοδότηση Συλλογής Κειμένων σε Ανεστραμμένο Ευρετήριο Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2009-2010 ΑΣΚΗΣΗ Α Δεικτοδότηση Συλλογής Κειμένων σε Ανεστραμμένο Ευρετήριο Τα ανεστραμμένα αρχεία αποτελούν μια βασική μορφή ευρετηρίου και μας επιτρέπουν να εντοπίσουμε

Διαβάστε περισσότερα

EPL660: Information Retrieval and Search Engines Lab 5

EPL660: Information Retrieval and Search Engines Lab 5 EPL660: Information Retrieval and Search Engines Lab 5 Παύλος Αντωνίου Γραφείο: B109, ΘΕΕ01 University of Cyprus Department of Computer Science Classes in Hadoop: InputFormat Fundamental class in Hadoop

Διαβάστε περισσότερα

Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη

Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη 01 Εισαγωγή Μια απλή και γρήγορη εισαγωγή Το Splunk > είναι ένα πρόγραμμα το οποίο πρωτοεμφανίστηκε στην αγορά το 2003 και αποτελεί ένα πρόγραμμα εξόρυξης

Διαβάστε περισσότερα

0 The quick brown fox leaped over the lazy lazy dog 1 Quick brown foxes leaped over lazy dogs for fun

0 The quick brown fox leaped over the lazy lazy dog 1 Quick brown foxes leaped over lazy dogs for fun Κ24: Προγραμματισμός Συστήματος - 1η Εργασία, Εαρινό Εξάμηνο 2018 Προθεσμία Υποβολής: Κυριακή 18 Μαρτίου, 23:59 Εισαγωγή Στην εργασία αυτή θα υλοποιήσετε μία μίνι μηχανή αναζήτησης (search engine). Οι

Διαβάστε περισσότερα

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26 Περιεχόμενα Λίγα λόγια από το συγγραφέα... 7 Κεφάλαιο 1: Microsoft Excel 2002... 9 Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26 Κεφάλαιο 3: Δημιουργία νέου βιβλίου εργασίας και καταχώριση δεδομένων...

Διαβάστε περισσότερα

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ. ΕΡΓΑΣΙΑ 4 «Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ. Στόχος Στόχος της Εργασίας 4 είναι να η εξοικείωση με την αντικειμενοστρέφεια (object oriented programming). Πιο συγκεκριμένα,

Διαβάστε περισσότερα

Συστήματα Αναμονής (Queuing Systems)

Συστήματα Αναμονής (Queuing Systems) ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ - ΕΜΠ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧ. ΥΠΟΛΟΓΙΣΤΩΝ Τομέας Επικοινωνιών, Ηλεκτρονικής & Συστημάτων Πληροφορικής Εργαστήριο Διαχείρισης & Βέλτιστου Σχεδιασμού Δικτύων Τηλεματικής

Διαβάστε περισσότερα

Μαζικός Παραλληλισμός λ με Map - Reduce. Μοντέλο Θέματα υλοποίησης Παραδείγματα διαχείρισης δεδομένων

Μαζικός Παραλληλισμός λ με Map - Reduce. Μοντέλο Θέματα υλοποίησης Παραδείγματα διαχείρισης δεδομένων Μαζικός Παραλληλισμός λ με Map - Reduce Μοντέλο Θέματα υλοποίησης Παραδείγματα διαχείρισης δεδομένων Ευχαριστίες Οι διαφάνειες στηρίζονται σε μεγάλο βαθμό στο υλικό που είναι διαθέσιμο από το εργαστήριο

Διαβάστε περισσότερα

Διαχείριση Βάσης Δεδομένων (dbadmin)

Διαχείριση Βάσης Δεδομένων (dbadmin) Published on PRISMA Win Help - Megasoft (http://docs.megasoft.gr) Home > Εμπορική Διαχείριση > Διαχείριση Βάσης Δεδομένων (dbadmin) Διαχείριση Βάσης Δεδομένων (dbadmin) Μέσα από τη διαχείριση βάσης δεδομένων

Διαβάστε περισσότερα

Εφαρμογή Διαχείρισης Ψηφιακής Πληροφορίας ΟΔΗΓΟΣ ΧΡΗΣΗΣ System Συμβουλευτική Α.Ε

Εφαρμογή Διαχείρισης Ψηφιακής Πληροφορίας ΟΔΗΓΟΣ ΧΡΗΣΗΣ System Συμβουλευτική Α.Ε σχετικά με τον έλεγχο της καπνιστικής συνήθειας 1 25 Λογισμικές εφαρμογές καταγραφής και αξιοποίησης πληροφοριών σχετικά με τον έλεγχο της καπνιστικής συνήθειας Λογισμική Εφαρμογή Διαχείρισης Ψηφιακής

Διαβάστε περισσότερα

Μπορείτε τα δείτε βιντεάκι με τη διαδικασία εδώ: http://www.greektuts.net/greek-in-joomla/

Μπορείτε τα δείτε βιντεάκι με τη διαδικασία εδώ: http://www.greektuts.net/greek-in-joomla/ 1) Εμφάνιση ιστοσελίδας Ανοίγουμε το πρόγραμμα πλοήγησης (Firefox, Chrome, Internet Explorer κτλ) και στη γραμμή διευθύνσεων πληκτρολογούμε τη διεύθυνση http://localhost ή http://127.0.0.1. Αν δεν βλέπουμε

Διαβάστε περισσότερα

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ Διάλεξη 25: Τεχνικές Κατακερματισμού II Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Διαχείριση Συγκρούσεων με Ανοικτή Διεύθυνση a) Linear Probing, b) Quadratic Probing c) Double Hashing Διατεταγμένος

Διαβάστε περισσότερα

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων

Διαβάστε περισσότερα

Διαχείριση Έργων Πληροφορικής Εργαστήριο

Διαχείριση Έργων Πληροφορικής Εργαστήριο Διαχείριση Έργων Πληροφορικής Εργαστήριο «Εισαγωγή στο MS Project- Διάγραμμα Gantt» Μ.Τσικνάκης, Ρ.Χατζάκη Ε. Μανιαδή, Ά. Μαριδάκη 1. Εισαγωγή στο Microsoft Project To λογισμικό διαχείρισης έργων MS Project

Διαβάστε περισσότερα

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2007-2008 Εαρινό Εξάµηνο Άσκηση 1 Φροντιστήριο 4 Θεωρείστε ένα έγγραφο με περιεχόμενο «αυτό είναι ένα κείμενο και

Διαβάστε περισσότερα

Προβλήματα, αλγόριθμοι, ψευδοκώδικας

Προβλήματα, αλγόριθμοι, ψευδοκώδικας Προβλήματα, αλγόριθμοι, ψευδοκώδικας October 11, 2011 Στο μάθημα Αλγοριθμική και Δομές Δεδομένων θα ασχοληθούμε με ένα μέρος της διαδικασίας επίλυσης υπολογιστικών προβλημάτων. Συγκεκριμένα θα δούμε τι

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ AM: Δοµές Δεδοµένων Εξεταστική Ιανουαρίου 2014 Διδάσκων : Ευάγγελος Μαρκάκης 20.01.2014 ΥΠΟΓΡΑΦΗ ΕΠΟΠΤΗ: Διάρκεια εξέτασης : 2 ώρες και

Διαβάστε περισσότερα

Συλλογή & Επεξεργασία Δεδομένων Εργαστήριο 9 Ανάλυση Fourier: Από τη Θεωρία στην Πρακτική Εφαρμογή των Μαθηματικών

Συλλογή & Επεξεργασία Δεδομένων Εργαστήριο 9 Ανάλυση Fourier: Από τη Θεωρία στην Πρακτική Εφαρμογή των Μαθηματικών Συλλογή & Επεξεργασία Δεδομένων Εργαστήριο 9 Ανάλυση Fourier: Από τη Θεωρία στην Πρακτική Εφαρμογή των Μαθηματικών Τύπων. Σύστημα Συλλογής & Επεξεργασίας Μετρήσεων Σκοπός Βασική δομή ενός προγράμματος

Διαβάστε περισσότερα

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ 8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ Στόχος του εργαστηρίου αυτού είναι να δείξει πώς τα εργαστήρια με τα δεδομένα της ICAP μπορούν να υλοποιηθούν χωρίς τη χρήση SQL Server, χρησιμοποιώντας μόνον Excel και Rapid

Διαβάστε περισσότερα

Διαδικασιακός Προγραμματισμός

Διαδικασιακός Προγραμματισμός Τμήμα ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ Διαδικασιακός Προγραμματισμός Διάλεξη 12 η Αναζήτηση/Ταξινόμηση Πίνακα Οι διαλέξεις βασίζονται στο βιβλίο των Τσελίκη και Τσελίκα C: Από τη Θεωρία στην

Διαβάστε περισσότερα

Vodafone Business Connect

Vodafone Business Connect Vodafone Business Connect Vodafone Business WebHosting Αναλυτικός Οδηγός Χρήσης MySQL Manager Αναλυτικός οδηγός χρήσης: MySQL Manager Vodafone Business Connect - Υπηρεσίες φιλοξενίας εταιρικού e-mail &

Διαβάστε περισσότερα

Άσκηση 3 (ανακοινώθηκε στις 24 Απριλίου 2017, προθεσμία παράδοσης: 2 Ιουνίου 2017, 12 τα μεσάνυχτα).

Άσκηση 3 (ανακοινώθηκε στις 24 Απριλίου 2017, προθεσμία παράδοσης: 2 Ιουνίου 2017, 12 τα μεσάνυχτα). Κ08 Δομές Δεδομένων και Τεχνικές Προγραμματισμού Διδάσκων: Μανόλης Κουμπαράκης Εαρινό Εξάμηνο 2016-2017. Άσκηση 3 (ανακοινώθηκε στις 24 Απριλίου 2017, προθεσμία παράδοσης: 2 Ιουνίου 2017, 12 τα μεσάνυχτα).

Διαβάστε περισσότερα

EPL 660: Lab 4 Introduction to Hadoop

EPL 660: Lab 4 Introduction to Hadoop EPL 660: Lab 4 Introduction to Hadoop Andreas Kamilaris Department of Computer Science MapReduce Πρόβλημα: Ανάγκη για επεξεργασία μεγάλου όγκου δεδομένων στα συστήματα ανάκτησης πληροφορίας. Λύση: κατανομή

Διαβάστε περισσότερα

Κεφ.11: Ευρετήρια και Κατακερματισμός

Κεφ.11: Ευρετήρια και Κατακερματισμός Κεφ.11: Ευρετήρια και Κατακερματισμός Database System Concepts, 6 th Ed. See www.db-book.com for conditions on re-use Κεφ. 11: Ευρετήρια-Βασική θεωρία Μηχανισμοί ευρετηρίου χρησιμοποιούνται για την επιτάχυνση

Διαβάστε περισσότερα

Από τα Δεδομένα στις Πληροφορίες - Μέρος Ι (Ταξινόμηση, Επιλογή, Μερικά Αθροίσματα)

Από τα Δεδομένα στις Πληροφορίες - Μέρος Ι (Ταξινόμηση, Επιλογή, Μερικά Αθροίσματα) Άσκηση 4 Από τα Δεδομένα στις Πληροφορίες - Μέρος Ι (Ταξινόμηση, Επιλογή, Μερικά Αθροίσματα) Σκοπός Η ανάλυση μη αριθμητικών μεθόδων επεξεργασίας δεδομένων. Η συστηματική οργάνωση και ανάλυση δεδομένων

Διαβάστε περισσότερα

$./jms console -w <jms in> -r <jms out> -o <operations file> namedpipe. (standard input).

$./jms console -w <jms in> -r <jms out> -o <operations file> namedpipe. (standard input). Κ24: Προγραμματισμός Συστήματος 2η Εργασία Εαρινό Εξάμηνο 2017 Προθεσμία Υποβολής: Κυριακή 30 Απριλίου 2017 Ωρα 23:59 Εισαγωγή στην Εργασία: Ο στόχος της εργασίας αυτής είναι να εξοικειωθείτε με την δημιουργία

Διαβάστε περισσότερα

EPL660: Information Retrieval and Search Engines Lab 5

EPL660: Information Retrieval and Search Engines Lab 5 EPL660: Information Retrieval and Search Engines Lab 5 Παύλος Αντωνίου Γραφείο: B109, ΘΕΕ01 University of Cyprus Department of Computer Science Εισαγωγή - Map Reduce MapReduce προγραμματιστικό μοντέλο

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια Βάσεις Δεδομένων 2017-2018 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές αναζήτησης και ρ

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11 Πίνακας περιεχομένων Πρόλογος... 11 Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων...13 1.1 Εισαγωγή... 13 1.2 Δημιουργία βάσης δεδομένων... 14 1.3 Ταξινόμηση βάσης δεδομένων... 16 1.4 Μερικά αθροίσματα... 20

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΚΗ Ι Εργαστήριο 1 MATLAB ΠΛΗΡΟΦΟΡΙΚΗ Ι ΕΡΓΑΣΤΗΡΙΟ 1. Θέμα εργαστηρίου: Εισαγωγή στο MATLAB και στο Octave

ΠΛΗΡΟΦΟΡΙΚΗ Ι Εργαστήριο 1 MATLAB ΠΛΗΡΟΦΟΡΙΚΗ Ι ΕΡΓΑΣΤΗΡΙΟ 1. Θέμα εργαστηρίου: Εισαγωγή στο MATLAB και στο Octave ΠΛΗΡΟΦΟΡΙΚΗ Ι ΕΡΓΑΣΤΗΡΙΟ 1 Θέμα εργαστηρίου: Εισαγωγή στο MATLAB και στο Octave Περιεχόμενο εργαστηρίου: - Το περιβάλλον ανάπτυξης προγραμμάτων Octave - Διαδικασία ανάπτυξης προγραμμάτων MATLAB - Απλά

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές αναζήτησης και ρ δείκτες ως εξής P 1 K 1 P

Διαβάστε περισσότερα

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ COMPUTER SCIENCE DEPARTMENT UNIVERSITY OF CRETE Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 4 η Σειρά Ασκήσεων Ψαράκη Μαρία-Γεωργία ΜΕΤ 556 psaraki@csd.uoc.gr Εαρινό Εξάμηνο 2008-2009

Διαβάστε περισσότερα

Διαχείριση Δικτύων (ΕΠ 17) Εαρινό Εξάµηνο 2014-2015. Εργασία Εξαµήνου, Ηµεροµηνία Παράδοσης: Ηµέρα Εξέτασης Μαθήµατος (25/6/2015)

Διαχείριση Δικτύων (ΕΠ 17) Εαρινό Εξάµηνο 2014-2015. Εργασία Εξαµήνου, Ηµεροµηνία Παράδοσης: Ηµέρα Εξέτασης Μαθήµατος (25/6/2015) Διαχείριση Δικτύων (ΕΠ 17) Εαρινό Εξάµηνο 2014-2015 Εργασία Εξαµήνου, Ηµεροµηνία Παράδοσης: Ηµέρα Εξέτασης Μαθήµατος (25/6/2015) Οµαδική εργασία (2 ατόµων) Σε αυτή την εργασία καλείστε να υλοποιήσετε ένα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ «ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ «ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ «ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ» ΗΜΕΡ.ΑΝΑΘΕΣΗΣ: Δευτέρα 21 Δεκεμβρίου 2015 ΗΜΕΡ.ΠΑΡΑΔΟΣΗΣ: Δευτέρα 25 Ιανουαρίου 2016 Διδάσκοντες:

Διαβάστε περισσότερα

Εισαγωγή στην Access 2007

Εισαγωγή στην Access 2007 Βάσεις Δεδομένων Ι 3 Εισαγωγή στην Access 2007 Τμήμα Διοίκησης Επιχειρήσεων (Μεσολόγγι) ΤΕΙ Δυτικής Ελλάδας ΝΙΚΟΣ ΚΑΡΟΥΣΟΣ - ΔΙΟΝΥΣΗΣ ΚΑΡΟΥΣΟΣ XE 2015-2016 Βάση Δεδομένων και Access Ένα οργανωμένο σύνολο

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια Ευαγγελία Πιτουρά 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές αναζήτησης και ρ δείκτες

Διαβάστε περισσότερα

ΗΥ240: οµές εδοµένων Χειµερινό Εξάµηνο Ακαδηµαϊκό Έτος Παναγιώτα Φατούρου. Προγραµµατιστική Εργασία 3 ο Μέρος

ΗΥ240: οµές εδοµένων Χειµερινό Εξάµηνο Ακαδηµαϊκό Έτος Παναγιώτα Φατούρου. Προγραµµατιστική Εργασία 3 ο Μέρος Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών 6 εκεµβρίου 2008 ΗΥ240: οµές εδοµένων Χειµερινό Εξάµηνο Ακαδηµαϊκό Έτος 2008-09 Παναγιώτα Φατούρου Προγραµµατιστική Εργασία 3 ο Μέρος Ηµεροµηνία Παράδοσης:

Διαβάστε περισσότερα

Εργαστήριο 4. Εαρινό Εξάμηνο ΠΡΟΣΟΧΗ: Αρχίστε νωρίς το Εργαστήριο 4. Οι ασκήσεις είναι πιο απαιτητικές από τα προηγούμενα εργαστήρια.

Εργαστήριο 4. Εαρινό Εξάμηνο ΠΡΟΣΟΧΗ: Αρχίστε νωρίς το Εργαστήριο 4. Οι ασκήσεις είναι πιο απαιτητικές από τα προηγούμενα εργαστήρια. Τομέας Υλικού και Αρχιτεκτονικής Υπολογιστών ΗΥ134 - Εισαγωγή στην Οργάνωση και Σχεδίαση Η/Υ 1 Εργαστήριο 4 Εαρινό Εξάμηνο 2012-2013 Στόχοι του εργαστηρίου Χρήση στοίβας Συναρτήσεις ΠΡΟΣΟΧΗ: Αρχίστε νωρίς

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 12/10/2017

Διαβάστε περισσότερα

ΔΗΜΙΟΥΡΓΙΑ ΚΑΤΑΛΟΓΟΥ ΕΤΕΡΟΑΝΑΦΟΡΩΝ

ΔΗΜΙΟΥΡΓΙΑ ΚΑΤΑΛΟΓΟΥ ΕΤΕΡΟΑΝΑΦΟΡΩΝ ΔΗΜΙΟΥΡΓΙΑ ΚΑΤΑΛΟΓΟΥ ΕΤΕΡΟΑΝΑΦΟΡΩΝ 1. Αρχικά, θα πρέπει να έχουμε συλλέξει τα scopus ID των ερευνητών του εργαστηρίου. Και μάλιστα όλα τα scopus ID των ερευνητών, καθώς κάποιος ερευνητής μπορεί να έχει

Διαβάστε περισσότερα

Διαγραφή Επιλέγετε Διαγραφή για να διαγράψετε μία ήδη υπάρχουσα διαδικασία εισαγωγής ASCII

Διαγραφή Επιλέγετε Διαγραφή για να διαγράψετε μία ήδη υπάρχουσα διαδικασία εισαγωγής ASCII Published on PRISMA Win Help - Megasoft (http://docs.megasoft.gr) Home > Διαχείριση Βάσης Δεδομένων (dbadmin) > Αρχεία Αρχεία Εισαγωγή από αρχείο ASCII Με την εργασία αυτή έχετε την δυνατότητα να εισάγετε

Διαβάστε περισσότερα

Σύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης

Σύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης Σύνοψη Προηγούμενου Πίνακες (Arrays Ορέστης Τελέλης telelis@unipi.gr Τμήμα Ψηφιακών Συστημάτων, Πανεπιστήμιο Πειραιώς Διαδικαστικά θέματα. Aντικείμενο Μαθήματος. Aντικείμενα, Κλάσεις, Μέθοδοι, Μεταβλητές.

Διαβάστε περισσότερα

Πληροφορική 2. Δομές δεδομένων και αρχείων

Πληροφορική 2. Δομές δεδομένων και αρχείων Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΠΤΥΞΗ ΚΑΙ ΣΧΕΔΙΑΣΗ ΛΟΓΙΣΜΙΚΟΥ Η γλώσσα προγραμματισμού C ΕΡΓΑΣΤΗΡΙΟ 2: Εκφράσεις, πίνακες και βρόχοι 14 Απριλίου 2016 Το σημερινό εργαστήριο

Διαβάστε περισσότερα

Άσκηση 1 (ανακοινώθηκε στις 20 Μαρτίου 2017, προθεσμία παράδοσης: 24 Απριλίου 2017, 12 τα μεσάνυχτα).

Άσκηση 1 (ανακοινώθηκε στις 20 Μαρτίου 2017, προθεσμία παράδοσης: 24 Απριλίου 2017, 12 τα μεσάνυχτα). Κ08 Δομές Δεδομένων και Τεχνικές Προγραμματισμού Διδάσκων: Μανόλης Κουμπαράκης Εαρινό Εξάμηνο 2016-2017. Άσκηση 1 (ανακοινώθηκε στις 20 Μαρτίου 2017, προθεσμία παράδοσης: 24 Απριλίου 2017, 12 τα μεσάνυχτα).

Διαβάστε περισσότερα

Αύξηση πελατών. Λίγα λόγια για Επιτυχημένες προωθήσεις

Αύξηση πελατών. Λίγα λόγια για Επιτυχημένες προωθήσεις Αύξηση πελατών Λίγα λόγια για Επιτυχημένες προωθήσεις Βελτίωση των προωθήσεων σας Εισαγωγή Συγκρίνετε τι σας συμφέρει Αποτέλεσμα και επανάληψη Υπάρχουν δυνατότητες για όλες τις επιχειρήσεις Εισαγωγή πληροφορίες

Διαβάστε περισσότερα

1. Δεν μπορεί να γίνει κλήση μίας διαδικασίας μέσα από μία συνάρτηση.

1. Δεν μπορεί να γίνει κλήση μίας διαδικασίας μέσα από μία συνάρτηση. ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β ) ΚΥΡΙΑΚΗ 24/04/2016 - ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΕΠΠ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ: ΕΞΙ (6) ΘΕΜΑ Α Α1. Να γράψετε στο τετράδιο σας τον αριθμό για καθεμία από τις παρακάτω

Διαβάστε περισσότερα

APP INVENTOR ΟΔΗΓΟΣ 8 Οκτωβρίου 2018

APP INVENTOR ΟΔΗΓΟΣ 8 Οκτωβρίου 2018 Πώς φτιάχνω Εφαρμογές για Android με το App Inventor Έχετε μια ιδέα για μια mobile εφαρμογή, αλλά δεν ξέρετε πώς να την υλοποιήσετε; Το App Inventor είναι ένα χρήσιμο εργαλείο για κάθε αρχάριο προγραμματιστή

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 21/10/2016

Διαβάστε περισσότερα

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης

Διαβάστε περισσότερα

ARTius με PostgreSQL

ARTius με PostgreSQL ARTius με PostgreSQL 9.3.5.1 Features: Δεν υπάρχει License και κόστος αγοράς / αναβάθμισης του PostgreSQL. Εύκολη και γρήγορη εγκατάσταση. Ταχύτερη παραλληλία (row locking) σε σχέση με άλλα dbms (SQLite,

Διαβάστε περισσότερα

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος

Διαβάστε περισσότερα

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ ΘΕΜΑ 1 ο Τα δεδομένα της στήλης Grade (Αρχείο Excel, Φύλλο Ask1) αναφέρονται στη βαθμολογία 63 φοιτητών που έλαβαν μέρος σε

Διαβάστε περισσότερα

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL

ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL Με το οικονομετρικό λογισμικό GRETL μπορούμε να κάνουμε Ανάλυση Χρονοσειρών σε δεδομένα (χρονοσειρές) με διάφορες μεθόδους και μοντέλα. Επειδή είναι εύκολο να βρούμε

Διαβάστε περισσότερα

Πληροφορική 2. Αλγόριθμοι

Πληροφορική 2. Αλγόριθμοι Πληροφορική 2 Αλγόριθμοι 1 2 Τι είναι αλγόριθμος; Αλγόριθμος είναι ένα διατεταγμένο σύνολο από σαφή βήματα το οποίο παράγει κάποιο αποτέλεσμα και τερματίζεται σε πεπερασμένο χρόνο. Ο αλγόριθμος δέχεται

Διαβάστε περισσότερα

Εργαστήριο #10 (Ε10) 1

Εργαστήριο #10 (Ε10) 1 Εργαστήριο #10 Από τα προηγούμενα εργαστήρια......θα χρειαστείτε ορισμένες από τις οδηγίες μορφοποίησης CSS (ανατρέξτε στις εκφωνήσεις του 8 ου και 9 ου εργαστηρίου).! Οδηγίες Στη δυναμική δημιουργία ιστοσελίδων

Διαβάστε περισσότερα

Θεματογράφος (ή ο βοηθός του Καθηγητή)

Θεματογράφος (ή ο βοηθός του Καθηγητή) Θεματογράφος (ή ο βοηθός του Καθηγητή) Τι είναι ο Θεματογράφος; Σύντομη Περιγραφή Ο Θεματογράφος είναι μία εφαρμογή με την οποία ο χρήστης μπορεί εύκολα να δημιουργήσει, να ταξινομήσει και να αποθηκεύσει

Διαβάστε περισσότερα

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ 1 Βάση Δεδομένων: Με το όρο Βάση Δεδομένων εννοούμε ένα σύνολο δεδομένων που είναι οργανωμένο

Διαβάστε περισσότερα

ΗY335: Δίκτυα Υπολογιστών Χειμερινό Εξάμηνο Τμήμα Επιστήμης Υπολογιστών Πανεπιστήμιο Κρήτης Διδάσκουσα: Μαρία Παπαδοπούλη

ΗY335: Δίκτυα Υπολογιστών Χειμερινό Εξάμηνο Τμήμα Επιστήμης Υπολογιστών Πανεπιστήμιο Κρήτης Διδάσκουσα: Μαρία Παπαδοπούλη ΗY335: Δίκτυα Υπολογιστών Χειμερινό Εξάμηνο 2012-2013 Τμήμα Επιστήμης Υπολογιστών Πανεπιστήμιο Κρήτης Διδάσκουσα: Μαρία Παπαδοπούλη Project 2012-2013 Υλοποίηση ενός chat server-client Παράδοση: 7/2/2013

Διαβάστε περισσότερα

ΣΕΤ ΑΣΚΗΣΕΩΝ 4. Προθεσµία: 8/1/12, 22:00

ΣΕΤ ΑΣΚΗΣΕΩΝ 4. Προθεσµία: 8/1/12, 22:00 ΣΕΤ ΑΣΚΗΣΕΩΝ 4 ΕΡΓΑΣΤΗΡΙΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ I, ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2011-2012 Προθεσµία: 8/1/12, 22:00 Περιεχόµενα Διαβάστε πριν ξεκινήσετε Εκφώνηση άσκησης Οδηγίες αποστολής άσκησης Πριν ξεκινήσετε (ΔΙΑΒΑΣΤΕ

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας σε Νέφη Υπολογιστών

Ανάκτηση Πληροφορίας σε Νέφη Υπολογιστών Πανεπιστήμιο Πατρών Τμήμα Μηχανικών Η/Υ & Πληροφορικής Διπλωματική Εργασία Ανάκτηση Πληροφορίας σε Νέφη Υπολογιστών Ζώης Βασίλειος 4183 Επιβλέπων: Γαροφαλάκης Ιωάννης Εξεταστές: Γαροφολάκης Ιωάννης, Χρήστος

Διαβάστε περισσότερα

Οικονοµικό Πανεπιστήµιο Αθηνών. Τµήµα Πληροφορικής. Φθινοπωρινό Εξάµηνο 2015. Δοµές Δεδοµένων - Εργασία 2. Διδάσκων: E. Μαρκάκης

Οικονοµικό Πανεπιστήµιο Αθηνών. Τµήµα Πληροφορικής. Φθινοπωρινό Εξάµηνο 2015. Δοµές Δεδοµένων - Εργασία 2. Διδάσκων: E. Μαρκάκης Οικονοµικό Πανεπιστήµιο Αθηνών Τµήµα Πληροφορικής Φθινοπωρινό Εξάµηνο 2015 Δοµές Δεδοµένων - Εργασία 2 Διδάσκων: E. Μαρκάκης Ταξινόµηση και Ουρές Προτεραιότητας Σκοπός της 2 ης εργασίας είναι η εξοικείωση

Διαβάστε περισσότερα

ΕΡΓΑΣΙΑ. (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών)

ΕΡΓΑΣΙΑ. (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών) ΕΡΓΑΣΙΑ (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών) Τίτλος: Εφαρμογή Διαδικτύου Υλοποίησης Storage Cloud Ζητούμενο: Να αναπτυχθεί web εφαρμογή

Διαβάστε περισσότερα

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α) Τμήμα Διοίκησης Επιχειρήσεων (Α. Ν.), Τ.Ε.Ι. Κρήτης Εργαστήριο Στατιστική-Ασκ2, Εαρ. 2018 Σελίδα 1 από 11 2η Εργαστηριακή Άσκηση Σκοπός: Η παρούσα εργαστηριακή άσκηση, χρησιμοποιώντας ως δεδομένα, μεγέθη

Διαβάστε περισσότερα

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ Δρ. Κουζαπάς Δημήτριος Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής Μηχανές Αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες

Διαβάστε περισσότερα

Μεταπτυχιακή Διπλωματική Εργασία Υπολογισμός ανάστροφων ερωτημάτων κατάταξης σε κατανεμημένο περιβάλλον

Μεταπτυχιακή Διπλωματική Εργασία Υπολογισμός ανάστροφων ερωτημάτων κατάταξης σε κατανεμημένο περιβάλλον Μεταπτυχιακή Διπλωματική Εργασία Υπολογισμός ανάστροφων ερωτημάτων κατάταξης σε κατανεμημένο περιβάλλον Γεώργιος Σφυρής - ΜΕ14032 Επιβλέπων καθηγητής: Χρήστος Δουλκερίδης Πειραιάς 2016 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ

Διαβάστε περισσότερα

Βήμα 1ο. Συνδεθείτε στο σύστημα διαχείρισης του Joomla ιστοχώρου σας. Η διεύθυνση θα είναι:

Βήμα 1ο. Συνδεθείτε στο σύστημα διαχείρισης του Joomla ιστοχώρου σας. Η διεύθυνση θα είναι: Βήμα 1ο Συνδεθείτε στο σύστημα διαχείρισης του Joomla ιστοχώρου σας. Η διεύθυνση θα είναι: http://www.onoma_site.gr/administrator και δώστε το όνομα χρήστη και τον κωδικό σας για τη διαχείριση. Βήμα 2ο

Διαβάστε περισσότερα

Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη. χρήση συναρτήσεων ομαδοποίησης κατά την εκτέλεση ενός ερωτήματος προβολής

Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη. χρήση συναρτήσεων ομαδοποίησης κατά την εκτέλεση ενός ερωτήματος προβολής Εργαστήριο 8 ο Συγκεντρωτικά ερωτήματα Ερωτήματα διασταύρωσης Ερωτήματα Ενεργειών Συγκεντρωτικά ερωτήματα Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη χρήση συναρτήσεων ομαδοποίησης

Διαβάστε περισσότερα

Survey 123 User Manual

Survey 123 User Manual Survey 123 User Manual 1. Γενικά για το πρόγραμμα 2. Έναρξη προγράμματος 3. Ορισμός χρηστών εφαρμογής 4. Επιλογή - Άνοιγμα έρευνας 5. Δημιουργία νέας έρευνας 6. Δημιουργία έρευνας με βάση το ερωτηματολόγιο

Διαβάστε περισσότερα

2. Για να δημιουργήσουμε το πρώτο ή κάθε νέο Backup set πατάμε στο εικονίδιο και εμφανίζεται ο Wizard του Backup set

2. Για να δημιουργήσουμε το πρώτο ή κάθε νέο Backup set πατάμε στο εικονίδιο και εμφανίζεται ο Wizard του Backup set Δημιουργία Backup Set για ( file Backup ) 1. Τρέχουμε την εφαρμογή BACKUP365. Όταν συνδεθεί με τα κεντρικό σύστημα της Digital SIMA εμφανίζεται η παρακάτω εικόνα : 2. Για να δημιουργήσουμε το πρώτο ή κάθε

Διαβάστε περισσότερα

Περιεχόμενα. 1 Κόμβοι 2. 2 Εργασίες 2. 3 Γραφήματα 4. 4 Αιτήσεις 7. 5 Αδρανείς Λογαριασμοί Στατιστικά 11

Περιεχόμενα. 1 Κόμβοι 2. 2 Εργασίες 2. 3 Γραφήματα 4. 4 Αιτήσεις 7. 5 Αδρανείς Λογαριασμοί Στατιστικά 11 Vima Admin Guide Περιεχόμενα 1 Κόμβοι 2 2 Εργασίες 2 3 Γραφήματα 4 4 Αιτήσεις 7 5 Αδρανείς Λογαριασμοί 10 6 Στατιστικά 11 1 1 Κόμβοι Στην καρτέλα αυτή ο διαχειριστής μπορεί να δει μια λίστα με όλους τους

Διαβάστε περισσότερα

Πώς λειτουργεί το Google?

Πώς λειτουργεί το Google? Πώς λειτουργεί το Google? Στα άδυτα του Γίγαντα της Αναζήτησης! Το να ψάξουμε κάτι στο Google είναι κάτι τόσο καθημερινό για τους περισσότερους από εμάς, που το θεωρούμε δεδομένο. Αυτό που ίσως ξεχνάμε

Διαβάστε περισσότερα

Εισαγωγή στον Αντικειμενοστρεφή Προγραμματισμό Διάλεξη #15

Εισαγωγή στον Αντικειμενοστρεφή Προγραμματισμό Διάλεξη #15 Οι βασικές έννοιες που θα καλύψουμε Ομαδοποίηση αντικειμένων Εισαγωγή στις συλλογές Γενικές κλάσεις Iterators Συλλογές (ειδικά την ArrayList) Συνεχίζουμε την αναφορά στο θέμα της αφαίρεσης (abstraction)

Διαβάστε περισσότερα

Εγχειρίδιο Φοιτητή. Course Management Platform. Εισαγωγή. for Universities Ομάδα Ασύγχρονης Τηλεκπαίδευσης Παν. Μακεδονίας Σεπτέμβριος 2004

Εγχειρίδιο Φοιτητή. Course Management Platform. Εισαγωγή. for Universities Ομάδα Ασύγχρονης Τηλεκπαίδευσης Παν. Μακεδονίας Σεπτέμβριος 2004 Εγχειρίδιο Φοιτητή Εισαγωγή Η ηλεκτρονική πλατφόρμα, αποτελεί ένα ολοκληρωμένο σύστημα Ασύγχρονης Τηλεκπαίδευσης. Στόχος της είναι η παροχή υποδομών εκπαίδευσης και κατάρτισης ανεξάρτητα από τους περιοριστικούς

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2011-2012 Επιμέλεια: Ομάδα Διαγωνισμάτων από το Στέκι των Πληροφορικών Θέμα Α Α1. Να γράψετε στο τετράδιό σας τον

Διαβάστε περισσότερα

Αλγόριθμοι και Πολυπλοκότητα Φώτης Ε. Ψωμόπουλος, Περικλής Α. Μήτκας

Αλγόριθμοι και Πολυπλοκότητα Φώτης Ε. Ψωμόπουλος, Περικλής Α. Μήτκας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Τομέας Ηλεκτρονικής και Υπολογιστών Εργαστήριο Επεξεργασίας Πληροφορίας και Υπολογισμών Καθηγητής: Περικλής

Διαβάστε περισσότερα

SMPcache. Ένα εργαλείο για προσομοίωση-οπτικοποίηση κρυφής μνήμης (Cache)

SMPcache. Ένα εργαλείο για προσομοίωση-οπτικοποίηση κρυφής μνήμης (Cache) SMPcache Ένα εργαλείο για προσομοίωση-οπτικοποίηση κρυφής μνήμης (Cache) 1. Βασικές ρυθμίσεις του συστήματος: δημιουργία μια δικής μας σύνθεσης συστήματος. Το SMPcache είναι ένα εργαλείο με το οποίο μπορούμε

Διαβάστε περισσότερα

ΔΗ Μ Ι Ο ΥΡ Γ Ι Α W I K I με τ η χρήση τ η ς υπ ηρεσίας h t t p : /www.wik id ot.com /

ΔΗ Μ Ι Ο ΥΡ Γ Ι Α W I K I με τ η χρήση τ η ς υπ ηρεσίας h t t p : /www.wik id ot.com / ΔΗ Μ Ι Ο ΥΡ Γ Ι Α W I K I με τ η χρήση τ η ς υπ ηρεσίας h t t p : /www.wik id ot.com / 1. Τι είναι το wikidot Το wikidot είναι ένας δικτυακός τόπος στον οποίο κάθε χρήστης έχει το δικαίωμα να δημιουργήσει

Διαβάστε περισσότερα

Φύλλο Εργασίας Μαθητή Τίτλος: Γίνομαι Ερευνητής/Ερευνήτρια

Φύλλο Εργασίας Μαθητή Τίτλος: Γίνομαι Ερευνητής/Ερευνήτρια Φύλλο Εργασίας Μαθητή Τίτλος: Γίνομαι Ερευνητής/Ερευνήτρια Τάξη: Γ Γυμνασίου Ενότητα: Επικοινωνώ και Συνεργάζομαι σε Διαδικτυακά Περιβάλλοντα Λύνω Προβλήματα με Υπολογιστικά Φύλλα Μάθημα: Επεξεργασία Ηλεκτρονικού

Διαβάστε περισσότερα

ΛΟΓΙΣΜΙΚΟ ΠΡΟΣΟΜΟΙΩΣΗΣ ANYLOGIC

ΛΟΓΙΣΜΙΚΟ ΠΡΟΣΟΜΟΙΩΣΗΣ ANYLOGIC ΛΟΓΙΣΜΙΚΟ ΠΡΟΣΟΜΟΙΩΣΗΣ ANYLOGIC Χρησιμοποιούμε την δωρεάν έκδοση του λογισμικού προσομοίωσης Anylogic. Για εκπαιδευτική χρήση μπορείτε να «κατεβάσετε» και να εγκαταστήσετε στον υπολογιστή σας την Personal

Διαβάστε περισσότερα