ΣΤΟΙΧΕΙΑ ΠΡΟΓΡΑΜΜΑΤΟΣ ΘΑΛΗΣ ΚΩΔΙΚΟΣ ΕΡΓΟΥ: 1272 ΥΔΡΟΠΟΛΗ Τίτλος ερευνητικού προγράμματος: Διερεύνηση της αλληλεπίδρασης μεταξύ της Αστικής Ανάπτυξης και των Υποδομών Νερού στην πόλη με έμφαση σε καινοτόμες παρεμβάσεις κατανεμημένης διαχείρισης Παραδοτέο 2.1.1 - Βάση εδοµένων Εγχειρίδιο λειτουργίας Έκδοση 0.1 Ημερομηνία υποβολής Παραδοτέου: 31.12.2014
Το παρόν κείμενο αποτελεί Παραδοτέο του έργου που υλοποιείται στο πλαίσιο της Πράξης «ΘΑΛΗΣ ΕΜΠ Υδρόπολις: Διερεύνηση της αλληλεπίδρασης μεταξύ της Αστικής Ανάπτυξης και των Υποδομών Νερού στην πόλη με έμφαση σε καινοτόμες παρεμβάσεις κατανεμημένης διαχείρισης».
Ταυτότητα εγγράφου Τίτλος Σχετική Ε.Ε. Σχετική Δράση Συντάχθηκε από Βάση εδοµένων Εγχειρίδιο λειτουργίας 2 Τεχνολογίες αποκεντρωμένης διαχείρισης (ΑΠ ) 2.1: Σχεδιασµός βάσης δεδοµένων Ευάγγελο Ρόζο και Χρήστο Μακρόπουλο Ελέγχθηκε από Είδος Επίπεδο Σύντομη περιγραφή Τεχνική Έκθεση Δημόσιο Η δράση αυτή αποσκοπεί στο σχεδιασμό βάσης δεδομένων για την καταχώρηση των τύπων πληροφοριών που θα συλλέγονται στα υπο-πακέτα 2.2.1 και 3.2.1 και προγραμματίζεται από την αρχή ώστε να διευκολύνεται η συλλογή και αξιοποίηση των δεδομένων. Η δομή της βάση δεδομένων μπορεί να εξελίσσεται δυναμικά κατά τη διάρκεια της χρήσης της, με γνώμονα τις εξελίξεις των εννοιολογικών μοντέλων και των όποιων νέων αναγκών. Έκδοση Ημερομηνία Αναθεωρήθηκε από Παρατηρήσεις 0.1 4 Απριλίου 2014 0.2 10 Δεκεμβρίου 2014 Ευάγγελο Ρόζο
Περιεχόμενα Περίληψη... 1 Extended abstract... 2 1 Εισαγωγή... 3 2 Μη σχεσιακές βάσεις δεδομένων... 4 3 Η υλοποίηση της βάσης... 5 4 Οδηγίες χρήσης συστήματος... 6 5 Συμπεράσματα... 8 Κατάλογος Πινάκων No table of figures entries found. Κατάλογος Σχημάτων Σχήμα 1-1. Διάγραμμα σχεσιακής βάσης δεδομένων.... 3 Σχήμα 2-1. Κατηγορίες μη σχεσιακών βάσεων δεδομένων.... 4 Σχήμα 3-1. Υλοποίηση βάσης δεδομένων στο UWOT.... 6 Σχήμα 4-1. Επικέντρωση αναζήτησης σε συγκεκριμένες τεχνολογίες.... 6 Σχήμα 4-2. Αναζήτηση συνδυασμού όρων σε συγκεκριμένο τύπο τεχνολογίας.... 7 Σχήμα 4-3. Καρτέλα με τεχνικά χαρακτηριστικά μιας τεχνολογίας.... 8 Παραδοτέο 2.1.1 Σελίδα i
Περίληψη Στη δράση αυτή αναπτύχθηκε η βάση δεδομένων που αποτελεί και το τελικό παραδοτέο του ΠΕ2 και επιτελεί διπλό ρόλο. Μπορεί να προσπελαστεί απευθείας από τον χρήστη που ενδιαφέρεται να εγκαταστήσει μια τεχνολογία ανακύκλωσης και χρησιμοποιείται και από το εργαλείο υποστήριξης επιλογής τεχνολογιών που περιγράφεται στο ΠΕ3. Η απευθείας προσπέλαση από το χρήστη γίνεται μέσω διαδικτυακής εφαρμογής που επιτρέπει την προβολή, αναζήτηση και επεξεργασία των δεδομένων στη βάση. Οι αποθηκευμένοι τύποι δεδομένων ορίζονται από τις βιβλιογραφικές και τις πειραματικές μεθόδους που εφαρμόστηκαν στα υπο-πακέτα του ερευνητικού. Η δομή της βάση δεδομένων μπορεί να εξελίσσεται δυναμικά κατά τη διάρκεια της χρήσης της, με γνώμονα τις εξελίξεις των εννοιολογικών μοντέλων και των όποιων νέων αναγκών. Ο σχεδιασμός και η υλοποίηση της βάσης έγινε σε κατάλληλο λογισμικό ανοικτού κώδικα. Παραδοτέο 2.1.1 Σελίδα 1
Extended abstract During this action, the database, the final deliverable of the WP2, was developed. This database can be accessed either directly by the user interested to install a water recycling technology or by the optioneering tool, which is described in WP3. Direct access by the user is done via a web interface that allows to view, search and edit the data. The stored data types are obtained from the literature and the experiments performed during this research project. The structure of the database can evolve dynamically during its lifecycle, following the needs of conceptual models used or any new requirements. The design and implementation of the database was done using appropriate open source software. Παραδοτέο 2.1.1 Σελίδα 2
1 Εισαγωγή Η πιο διαδεδομένη μέθοδος αποθήκευσης δεδομένων είναι χρήση σχεσιακών μοντέλων. Σε αυτό το μοντέλο τα δεδομένα οργανώνονται σε έναν ή περισσότερους πίνακες (ή «σχέσεις») πολλαπλών γραμμών και στηλών, με ένα μοναδικό κλειδί για κάθε γραμμή. Γενικά, κάθε οντότητα που περιγράφεται σε μια βάση δεδομένων έχει το δικό της πίνακα, οι γραμμές αντιπροσωπεύουν διάφορες πραγματώσεις αυτού του τύπου οντότητας και οι στήλες αντιπροσωπεύουν τις ιδιότητες που αποδίδονται σε κάθε πραγμάτωση. Επειδή κάθε γραμμή σε έναν πίνακα έχει το δικό της μοναδικό κλειδί, γραμμές σε ένα πίνακα μπορούν να συνδεθούν με γραμμές σε άλλους πίνακες αποθηκεύοντας το μοναδικό κλειδί της γραμμής με την οποία θα πρέπει να συνδέεται. Έχει αποδειχθεί ότι σχέσεις δεδομένων οποιασδήποτε πολυπλοκότητας μπορούν να αναπαρασταθούν χρησιμοποιώντας αυτόν τον απλό τρόπο απεικόνισης εννοιών. Σχήμα 1-1. Διάγραμμα σχεσιακής βάσης δεδομένων. Στο παραπάνω σχήμα φαίνεται η σχεσιακή βάση δεδομένων που χρησιμοποιήθηκε αρχικά για να την αποθήκευση της πληροφορίας που συλλέγεται από τα διάφορα υπο-πακέτα του προγράμματος. Οι οντότητες στις οποίες αντιστοιχούν οι πέντε εικονιζόμενοι πίνακες είναι οι ακόλουθες. Η οντότητα Τεχνολογία αναφέρεται στους διάφορους τύπους τεχνολογιών νερού (π.χ. πλυντήριο ρούχων ή πιάτων, νιπτήρας, τουαλέτα, ντους, κλπ) και αποδίδεται με τον πίνακα Technology. Η οντότητα Μάρκα αναφέρεται στις διάφορες μάρκες (π.χ. πλυντήριο Bosch WAB28161GB) και αποδίδεται με τον πίνακα Brand. Η οντότητα Τύπος Τεχνικού Χαρακτηριστικού αναφέρεται στα τεχνικά χαρακτηριστικά των τεχνολογιών (π.χ. καταναλισκόμενη ενέργεια, λειτουργικό κόστος, κλπ) και αποδίδεται με τον πίνακα SpecificationCategory. Η οντότητα Τιμή Τεχνικού Χαρακτηριστικού αναφέρεται στις τιμές των τεχνικών χαρακτηριστικών των τεχνολογιών (π.χ. 2 kwh/πλύση, 2 ευρώ/έτος, κλπ) και αποδίδεται με τον πίνακα Specification. Τέλος η οντότητα Μονάδες αναφέρεται στις μονάδες των τιμών των τεχνικών χαρακτηριστικών των τεχνολογιών (kwh/πλύση, ευρώ/έτος, κλπ) και αποδίδεται με τον πίνακα Unit. Παραδοτέο 2.1.1 Σελίδα 3
Αυτή ήταν η πρώτη προσέγγιση που επιλέχθηκε για την υλοποίηση της βάσης δεδομένων. Κατά την εξέλιξη του ερευνητικού όμως διαπιστώθηκε ότι αυτή η μορφή, αν και εξασφαλίζει τη συνέπεια της βάσης, περιορίζει σημαντικά την ευελιξία όσον αφορά στην μορφή που πρέπει να έχουν τα εισαγόμενα δεδομένα. Γι αυτό τον λόγο σε δεύτερη φάση επιλέχθηκε η υλοποίηση να γίνει σε μια μη σχεσιακή βάση δεδομένων. 2 Μη σχεσιακές βάσεις δεδομένων Οι σχεσιακές βάσεις δεδομένων προσφέρουν έναν αποδοτικό μηχανισμό αποθήκευσης αναζήτησης βασισμένο σε προκαθορισμένες συσχετίσεις μεταξύ πινάκων (σχήμα της βάσης). Όμως η αναζήτηση είναι αυστηρή, βασισμένη σε αριθμούς (π.χ. 100 L/d < δυναμικότητα < 300 L/d) και επιστρέφει αποτελέσματα βάσει δυαδικής λογικής. Επιπλέον είναι άκαμπτη και απαιτεί σωστά διατυπωμένο ερώτημα για να επιστρέψει χρήσιμα αποτελέσματα. Τέλος δεν μπορούν να χειριστούν πληροφορία πέρα από αυτήν που προβλέφθηκε στον αρχικό σχεδιασμό της βάσης. Μια μη σχεσιακή βάση δεδομένων παρέχει ένα μηχανισμό για την αποθήκευση και την ανάκτηση των δεδομένων που διαμορφώνεται σε άλλα μέσα εκτός των συσχετισμένων πινάκων που χρησιμοποιούνται σε σχεσιακές βάσεις. Τα κίνητρα για την προσέγγιση αυτή περιλαμβάνουν την απλότητα του σχεδιασμού, τη δυνατότητα οριζόντιας κλιμάκωσης, και το καλύτερο έλεγχο των διαθέσιμων πόρων. Οι δομές δεδομένων που χρησιμοποιούνται από τις μη σχεσιακές βάσεις δεδομένων (π.χ. κλειδιού-τιμής, γράφος, ή έγγραφο) διαφέρουν από εκείνες που χρησιμοποιούνται στις σχεσιακές βάσεις, επιτρέποντας σε κάποιες εργασίες να εκτελούνται πιο γρήγορα. Γνωστές μη-σχεσιακές βάσεις είναι το Google BigTable και το DynamoDB της Amazon. Στο πιο κάτω σχήμα φαίνονται οι κατηγορίες των μη σχεσιακών βάσεων δεδομένων και οι αντίστοιχες πιο διαδεδομένες μηχανές. Σχήμα 2-1. Κατηγορίες μη σχεσιακών βάσεων δεδομένων. Παραδοτέο 2.1.1 Σελίδα 4
Οι βάσεις δεδομένων των οποίων ο θεμέλιος λίθος της δομής δεδομένων είναι το έγγραφο διαφέρουν ως προς τον τρόπο που τα δεδομένα υπόκεινται σε επεξεργασία. Σε μία αποθήκευση τύπου κλειδί-τιμή, τα δεδομένα θεωρούνται ότι είναι αδιαφανή στο μηχανισμό της βάσης, ενώ ένα σύστημα που η δομή δεδομένων είναι το έγγραφο στηρίζεται στην εσωτερική δομή του εγγράφου για την εξαγωγή μεταδεδομένων που χρησιμοποιεί ο μηχανισμός της βάσης για περαιτέρω βελτιστοποίηση. Παρά το γεγονός ότι οι διαφορές είναι συχνά δυσδιάκριτες, η αποθήκευση με βάση το έγγραφο, σε συνδυασμό με τις σύγχρονες τεχνικές προγραμματισμού, έχει σχεδιαστεί εννοιολογικά για να προσφέρει μεγαλύτερη ευελιξία. Οι βάσεις δεδομένων με βάση το έγγραφο διαφέρουν σημαντικά από την παραδοσιακή σχεσιακή βάση δεδομένων (RDB). Οι Σχεσιακές βάσεις δεδομένων είναι πολύ αυστηρές ως προς τον τύπο των δεδομένων κατά τη δημιουργία της βάσης, και αποθηκεύουν τα επαναλαμβανόμενα δεδομένα σε ξεχωριστούς πίνακες που ορίζονται από τον προγραμματιστή. Σε μια RDB, οποιαδήποτε πραγμάτωση των δεδομένων έχει την ίδια μορφή, και η αλλαγή αυτής της μορφής είναι γενικά δύσκολο να επιτευχθεί. Οι βάσεις δεδομένων βασισμένες στο έγγραφο συμπεραίνουν τον τύπο της πληροφορίας από τα ίδια τα δεδομένα, συνήθως αποθηκεύουν όλες τις σχετικές πληροφορίες μαζί, και επιτρέπουν ευρεία ποικιλία μορφών στην πραγμάτωση των δεδομένων. Αυτό τις καθιστά πιο ευέλικτες όσον αφορά την προσαρμογή και την προσθήκη προαιρετικών τιμών, αντιστοιχίζονται πιο εύκολα σε προγραμματιστικά αντικείμενα, και συχνά έχουν μικρότερο μέγεθος. Αυτά τα χαρακτηριστικά τις καθιστούν ελκυστικές για τον προγραμματισμό σύγχρονων διαδικτυακών εφαρμογών, οι οποίες υπόκεινται σε συνεχείς αλλαγές των προδιαγραφών τους, και ως εκ τούτου η ταχύτητα της ανάπτυξης είναι σημαντικός παράγοντας. 3 Η υλοποίηση της βάσης Η βάση δεδομένων που αναπτύχθηκε στο ερευνητικό Υδρόπολη είναι προσπελάσιμη μέσω φυλλομετρητή (web browser). Ο χρήστης πηγαίνει στη σελίδα της βάσης, παρέχει λέξεις κλειδιά για τις οποίες ενδιαφέρεται να αναζητήσει τεχνολογίες και η βάση επιστρέφει αποτελέσματα ταξινομημένα ανάλογα με τη εγγύτητα στους όρους αναζήτησης. Ο μηχανισμός της μη σχεσιακής βάσης που αναπτύχθηκε στο Υδρόπολη φαίνεται στο επόμενο σχήμα. Το γραφικό περιβάλλον έχει υλοποιηθεί με χρήση του web-recoll, η ανάλυση όρων γίνεται με το λογισμικό recoll ενώ για τη βάση δεδομένων χρησιμοποιείται το λογισμικό xapian. Παραδοτέο 2.1.1 Σελίδα 5
Σχήμα 3-1. Υλοποίηση βάσης δεδομένων στο UWOT. 4 Οδηγίες χρήσης συστήματος Στη παρακάτω εικόνα φαίνεται η αρχική σελίδα της βάσης. Στη διάθεση του χρήστη δίνεται ένα στοιχείο ελέγχου της αναζήτησης (drop-down menu) έτσι ώστε να μπορεί να επικεντρώνει σε συγκεκριμένες τεχνολογίες μόνο. Σχήμα 4-1. Επικέντρωση αναζήτησης σε συγκεκριμένες τεχνολογίες. Ο χρήστης μπορεί να απαιτήσει να μην υπάρχει ένας όρος στα αποτελέσματα της αναζήτησης βάζοντας ένα - μπροστά από τον όρο (π.χ. mbr). Οι ελληνικοί όροι Παραδοτέο 2.1.1 Σελίδα 6
αναζήτησης πρέπει να δίνονται χωρίς τόνους και με σ στης θέση του τελικού σίγμα ς. Στη επόμενη εικόνα φαίνονται τα αποτελέσματα της αναζήτησης συνδυασμού όρων (mbr δυναμικότητα kwh) στις τεχνολογίες επεξεργασίας γκρι νερού Σχήμα 4-2. Αναζήτηση συνδυασμού όρων σε συγκεκριμένο τύπο τεχνολογίας. Εντοπίζοντας την τεχνολογία που είναι κοντινή στις απαιτήσεις του (μετά από επιθεώρηση των φράσεων που επιστρέφει η βάση και περιέχουν τους όρους κλειδιά), o χρήστης μπορεί να εξετάσει τα λεπτομερή χαρακτηριστικά της τεχνολογίας πατώντας πάνω στον αντίστοιχο αριθμό της καρτέλας της (π.χ. το F014 για την εικόνα που ακολουθεί). Παραδοτέο 2.1.1 Σελίδα 7
Σχήμα 4-3. Καρτέλα με τεχνικά χαρακτηριστικά μιας τεχνολογίας. 5 Συμπεράσματα Το σχήμα μιας βάσης είναι η δομή της (αποδίδεται με τη γλώσσα που υποστηρίζεται από την εκάστοτε βάση δεδομένων) και συνήθως περιγράφεται από ένα σχεδιάγραμμα με τους πίνακες (ορίζονται με περιορισμούς όσον αφορά το όνομα των πεδίων, καθώς και το είδος των δεδομένων που μπορούν να αποθηκευτούν σε κάθε πεδίο) και τις σχέσεις μεταξύ τους. Σε αντίθεση με μια συμβατική βάση, μια βάση δεδομένων με βάση το έγγραφο περιέχει έγγραφα, τα οποία είναι τα αρχεία που περιγράφουν τα δεδομένα (δηλαδή τη δομή και τον τύπο), καθώς και τα πραγματικά δεδομένα. Κάθε έγγραφο μπορεί να είναι όσο περίπλοκο χρειαστεί. Επίσης, ένθετα δεδομένα μπορεί να χρησιμοποιηθούν για την παροχή πρόσθετων υποκατηγοριών πληροφορίας σχετικά με το αντικείμενο μελέτης. Επιπλέον, είναι δυνατόν να χρησιμοποιηθούν περισσότερα από ένα έγγραφα για να περιγράψουν το ίδιο αντικείμενο του πραγματικού κόσμου. Έτσι, υιοθετώντας τη χρήση μιας μη σχεσιακής βάσης δεδομένων με βάση το έγγραφο αποφεύχθηκε η ανάγκη να καθοριστεί ένα συγκεκριμένο σχήμα πριν από την προσθήκη εγγραφών στη βάση. Αυτά τα χαρακτηριστικά πρώτον επέτρεψαν να αποσυνδεθούν και να γίνουν παράλληλα οι εργασίες της συλλογής δεδομένων και του σχεδιασμού της βάσης και δεύτερον απάλλαξαν Παραδοτέο 2.1.1 Σελίδα 8
τη διεργασία σύνταξης των καρτελών με τα τεχνικά χαρακτηριστικά από περιορισμούς, επιτρέποντας να ληφθούν υπόψη οι παράγοντες συνεκτικότητα και αισθητική. Συνοπτικά τα πλεονεκτήματα των μη σχεσιακών βάσεων είναι: ο εύκολος χειρισμός μεγάλου όγκου δεδομένων και η πολύ γρήγορη απόκριση σε μεγάλη ποικιλία ερωτημάτων, η αποδέσμευση του μηχανισμού εισαγωγής δεδομένων από την μορφή που είχαν τα δεδομένα προηγούμενων εισαγωγών, η συνεκτική αποθήκευση δεδομένων (απευθείας αναγνώσιμα ακόμα και στη μορφή που είναι αποθηκευμένα χωρίς να χρειάζεται ειδική εφαρμογή), η εννοιολογική αναζήτηση βάσει όρων και λέξεων κλειδί, και ο μη δυαδικός τρόπος απάντησης στα ερωτήματα του χρήστη (οι απαντήσεις δεν είναι της μορφή δεν βρέθηκε/βρέθηκαν αλλά είναι αποτελέσματα ταξινομημένα σύμφωνα με τον βαθμό που ταιριάζουν στα κριτήρια τις αναζήτησης). Παραδοτέο 2.1.1 Σελίδα 9