Σχεδίαση και Ανάπτυξη Απ ποθηκών Δεδομένωνν

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Σχεδίαση και Ανάπτυξη Απ ποθηκών Δεδομένωνν"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Σχεδίαση και Ανάπτυξη Αποθηκών Δεδομένων Διπλωματική Εργασία του Ζαγκαρέτου Λεωνίδα (ΑΕΜ: 139) Επιβλέπων Καθηγητής: Νανόπουλος Αλέξανδρος Θεσσαλονίκη 2007

2 Περιεχόμενα 1 Εισαγωγή Αποθήκες Δεδομένων και OLAP Αποθήκες Δεδομένων Κίνητρα για την ανάπτυξη Αποθηκών Δεδομένων Ορισμός Αποθήκης Δεδομένων Αρχιτεκτονική Αποθήκης Δεδομένων On Line Analytical Processing (OLAP) Κύβος Δεδομένων Σχήμα Αστέρα OLAP Πράξεις Τύποι Συστημάτων OLAP Συστήματα MOLAP Συστήματα ROLAP Συστήματα HOLAP Σχεδιασμός Αποθήκης Δεδομένων Μοντελοποίηση διαστάσεων Τα 4 Σχεδιαστικά Βήματα Ιδιότητες Πινάκων Διαστάσεων Οι Τρεις Τύποι Πινάκων Γεγονότων Υλοποίηση Το πρόβλημα Προετοιμασία των δεδομένων Εξαγωγή των δεδομένων από την επιχειρησιακή βάση δεδομένων Εισαγωγή των δεδομένων στην ενδιάμεση βάση δεδομένων Φόρτωση των δεδομένων στην αποθήκη δεδομένων Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής Μοντελοποίηση διαστάσεων Υλοποίηση μοντελοποίησης Φόρτωση των δεδομένων Αποτελέσματα

3 4.4.1 Ερωτήματα Πίνακες και Γραφικές παραστάσεις Δημιουργία ιστοσελίδας για την παρουσίαση των αποτελεσμάτων Ανανέωση της αποθήκης δεδομένων Αρχιτεκτονική Διάταξη λογισμικού Πολυμερής διάταξη λογισμικού Υλοποιημένη διάταξη λογισμικού

4 Εικόνες Εικόνα 2.1 Αποτύπωση βασικών λειτουργιών μίας αποθήκης δεδομένων Εικόνα 2.2 Βασική αρχιτεκτονική μίας αποθήκης δεδομένων Εικόνα 2.3 Παράδειγμα κύβου δεδομένων Εικόνα 2.4 Παράδειγμα ιεραρχιών Εικόνα 2.5 Παράδειγμα σχήματος αστέρα Εικόνα 2.6 Πράξεις OLAP Εικόνα 2.7 OLAP πράξεις με εφαρμογή συναθροιστικής συνάρτησης Εικόνα 3.1 Το αρχικό σχήμα αστέρα για την εφαρμογή βιβλιοπωλείου Εικόνα 3.2 Παράδειγμα στιγμιότυπου του πίνακα Πελάτης Εικόνα 3.3 Παράδειγμα στιγμιότυπου του πίνακα Ημερομηνία Εικόνα 3.4 Το σχήμα χιονονιφάδας Εικόνα 3.5 Παράδειγμα μοντέλου με πίνακα γεγονότων συναλλαγών Εικόνα 3.6 Παράδειγμα μοντέλου με πίνακα γεγονότων περιοδικής φωτογράφησης. 30 Εικόνα 3.7 Παράδειγμα μοντέλου με πίνακα γεγονότων συσσωρευτικής φωτογράφησης Εικόνα 4.1 Φύλλο εργασίας ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ Εικόνα 4.2 Φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ Εικόνα 4.3 Φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ Εικόνα 4.4 Φύλλο εργασίας ΜΑΘΗΜΑ Εικόνα 4.5 Φύλλο εργασίας ΒΑΘΜΟΣ Εικόνα 4.6 Φύλλο εργασίας ΦΟΙΤΗΤΗΣ Εικόνα 4.7 Σχήμα του πίνακα ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ Εικόνα 4.8 Σχήμα του πίνακα ΚΑΤΕΥΘΥΝΣΗ Εικόνα 4.9 Σχήμα του πίνακα ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ Εικόνα 4.10 Σχήμα του πίνακα ΒΑΘΜΟΣ Εικόνα 4.11 Σχήμα του πίνακα ΜΑΘΗΜΑ Εικόνα 4.12 Σχήμα του πίνακα ΦΟΙΤΗΤΗΣ Εικόνα 4.13 Σχέσεις μεταξύ των πινάκων της βάσης csd_db Εικόνα 4.14 Δημιουργία project τύπου Integration Services Project Εικόνα 4.15 Δημιουργία Sequence Container Εικόνα 4.16 Ακολουθία ενεργειών του Import_data_into_csd_db

5 Εικόνα 4.17 Ακολουθία ενεργειών του data flow task Import ΦΟΙΤΗΤΗΣ Εικόνα 4.18 Μετασχηματισμοί στα δεδομένα του φύλλου εργασίας ΦΟΙΤΗΤΗΣ Εικόνα 4.19 Καθορισμός της διαδρομής του αρχείου Excel Εικόνα 4.20 Εκτέλεση του Import_data_into_csd_db project Εικόνα 4.21 Αποτέλεσμα ορθής εκτέλεσης του Import_data_into_csd_db project Εικόνα 4.22 Σχήμα αστέρα για τη διαδικασία των βαθμολογιών Εικόνα 4.23 Ιδιότητες του πίνακα διάστασης Φοιτητής Εικόνα 4.24 Ιδιότητες του πίνακα διάστασης Μάθημα Εικόνα 4.25 Ιδιότητες του πίνακα διάστασης Χρόνος Βαθμολογίας Εικόνα 4.26 Σχήμα αστέρα για τη διαδικασία των αποφοιτήσεων Εικόνα 4.27 Ιδιότητες του πίνακα διάστασης Απόφοιτος Εικόνα 4.28 Ιδιότητες του πίνακα διάστασης Χρόνος Ορκωμοσίας Εικόνα 4.29 Δημιουργία project τύπου Analysis Services Project Εικόνα 4.30 Πηγή δεδομένων Csd_Data_Source Εικόνα 4.31 Σύνδεση με την ενδιάμεση βάση δεδομένων csd_db Εικόνα 4.32 Σχήμα των όψεων των δεδομένων Csd_Students_Data_View και Csd_Graduates_Data_View Εικόνα 4.33 Δομή του πίνακα διάστασης ΦΟΙΤΗΤΗΣ Εικόνα 4.34 Δομή του πίνακα διάστασης ΜΑΘΗΜΑ Εικόνα 4.35 Δομή του πίνακα διάστασης ΧΡΟΝΟΣ ΒΑΘΜΟΛΟΓΙΑΣ Εικόνα 4.36 Δομή του πίνακα διάστασης ΑΠΟΦΟΙΤΟΣ Εικόνα 4.37 Δομή του πίνακα διάστασης ΧΡΟΝΟΣ ΟΡΚΩΜΟΣΙΑΣ Εικόνα 4.38 Αριθμητικά γεγονότα του κύβου Csd_Students_Cube Εικόνα 4.39 Χρήση των διαστάσεων στον κύβο Csd_Students_Cube Εικόνα 4.40 Προεπισκόπηση των δεδομένων του κύβου Csd_Students_Cube Εικόνα 4.41 Αριθμητικά γεγονότα του κύβου Csd_Graduates_Cube Εικόνα 4.42 Χρήση των διαστάσεων στον κύβο Csd_Graduates_Cube Εικόνα 4.43 Προεπισκόπηση των δεδομένων του κύβου Csd_Graduates_Cube Εικόνα 4.44 Επιλογή του συνόλου των διαστάσεων Εικόνα 4.45 Επιλογή Process για τις διαστάσεις Εικόνα 4.46 Ένδειξη για το αν το project είναι ενημερωμένο ή όχι Εικόνα 4.47 Παράθυρο επιλογών για τον τρόπο επεξεργασίας των διαστάσεων Εικόνα 4.48 Επιτυχής ολοκλήρωση επεξεργασίας των διαστάσεων Εικόνα 4.49 Επιλογή του συνόλου των κύβων

6 Εικόνα 4.50 Επιλογή Process για τους κύβους Εικόνα 4.51 Παράθυρο επιλογών για τον τρόπο επεξεργασίας των κύβων Εικόνα 4.52 Επιτυχής ολοκλήρωση επεξεργασίας των κύβων Εικόνα 4.53 Επιλογή Reconnect για ενημέρωση των δεδομένων της προεπισκόπησης. 64 Εικόνα 4.54 Πίνακας βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας Εικόνα 4.55 Γράφημα βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας Εικόνα 4.56 Πίνακας βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας Εικόνα 4.57 Γράφημα βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας Εικόνα 4.58 Αυθεντικοποίηση χρήστη Εικόνα 4.59 Αρχική οθόνη ιστοσελίδας της αποθήκης δεδομένων Εικόνα 4.60 Πίνακας βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας Εικόνα 4.61 Γράφημα βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας Εικόνα 4.62 Πίνακας βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας Εικόνα 4.63 Γράφημα βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας Εικόνα 4.64 Άνοιγμα του Import_data_into_csd_db project Εικόνα 4.65 Άνοιγμα του πακέτου Package.dtsx Εικόνα 4.66 Παράθυρο εύρεσης του αρχείου Excel Εικόνα 4.67 Εύρεση του αρχείου Excel Εικόνα 4.68 Εκτέλεση του Import_data_into_csd_db project Εικόνα 4.69 Τερματισμός του Import_data_into_csd_db project Εικόνα 4.70 Άνοιγμα του Csd Analysis Project project Εικόνα 5.1 Μια διάκριση των εργασιών που κάνει µία εφαρμογή λογισμικού Εικόνα 5.2 Μια πολυμερής διάταξη λογισμικού Πίνακες Πίνακας 2.1 Διαφορές μεταξύ Σχεσιακών ΣΔΒΔ και αποθηκών δεδομένων Πίνακας 3.1 Χαρακτηριστικά των 3 τύπων πινάκων γεγονότων Πίνακας 4.1 Στήλες του φύλλου εργασίας ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ Πίνακας 4.2 Στήλες του φύλλου εργασίας ΚΑΤΕΥΘΥΝΣΗ Πίνακας 4.3 Στήλες του φύλλου εργασίας ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ Πίνακας 4.4 Στήλες του φύλλου εργασίας ΜΑΘΗΜΑ Πίνακας 4.5 Στήλες του φύλλου εργασίας ΒΑΘΜΟΣ Πίνακας 4.6 Στήλες του φύλλου εργασίας ΦΟΙΤΗΤΗΣ

7 Εισαγωγή 1 Εισαγωγή Η γραμματεία του Τμήματος Πληροφορικής της Σχολής Θετικών Επιστημών του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης διατηρεί μία επιχειρησιακή βάση δεδομένων στην οποία καταγράφονται τα στοιχεία που αφορούν το τμήμα. Σε αυτή τη βάση δεδομένων περιέχονται όλα τα αναγκαία δεδομένα για την ορθή λειτουργία της γραμματείας, όπως για παράδειγμα τα ονόματα των φοιτητών, οι αριθμοί μητρώου (ΑΜ) τους, τα ονόματα των καθηγητών, τα ονόματα των μαθημάτων, οι βαθμολογίες των φοιτητών στα μαθήματα κ.ο.κ. Στην παρούσα εργασία θα παρουσιαστεί ένας τρόπος με τον οποίο μπορούν να χρησιμοποιηθούν αυτά τα δεδομένα για περαιτέρω ανάλυση τους εξαγωγή χρήσιμων συμπερασμάτων. Στο κεφάλαιο 2 θα πραγματοποιηθεί μία εισαγωγή στην έννοια της αποθήκης δεδομένων (data warehouse) αναφέροντας τους λόγους που οδήγησαν στην ανάπτυξή των αποθηκών δεδομένων, και κατόπιν παραθέτοντας το βασικό ορισμό μίας αποθήκης δεδομένων και παρουσιάζοντας την αρχιτεκτονική της. Στη συνέχεια θα παρουσιαστούν οι κυριότεροι τύποι διάφορων πολυδιάστατων ερωτημάτων καθώς και ο τρόπος με τον οποίο μπορεί να γίνει η αποδοτική επεξεργασία τους (OLAP, On line Analytical Processing). Τέλος θα γίνει και μία αναφορά στους διάφορους τύπους συστημάτων OLAP (MOLAP, ROLAP, HOLAP). Στο κεφάλαιο 3 θα παρουσιαστεί ο τρόπος σχεδιασμού μίας αποθήκης δεδομένων με τη μεθοδολογίας της μοντελοποίησης διαστάσεων (dimensional modeling) που χρησιμοποιείται για την ανάπτυξη λογικών μοντέλων για κύβους δεδομένων. Η μοντελοποίηση διαστάσεων βασίζεται στο σχεδιασμό σχημάτων αστέρα καθορίζοντας τους πίνακες γεγονότων (πίνακας γεγονότων συναλλαγών, πίνακας περιοδικής φωτογράφησης, πίνακας συναθροιστικής φωτογράφησης) και τους πίνακες διαστάσεων (ιδιότητες, ιεραρχίες ιδιοτήτων). Στο κεφάλαιο 4 αρχικά θα παρουσιαστεί το συγκεκριμένο πρόβλημα με το οποίο θα ασχοληθούμε στην πορεία. Στη συνέχεια θα καταγραφούν αναλυτικά οι διαδικασίες της προετοιμασίας των αρχικών δεδομένων, του σχεδιασμού της αποθήκης δεδομένων του τμήματος Πληροφορικής, της παρουσίασης των αποτελεσμάτων (ερωτήματα, πίνακες, γραφήματα) και της ανανέωσης της αποθήκης δεδομένων. Στο κεφάλαιο 5 τέλος, θα γίνει μία σύντομη παρουσίαση της αρχιτεκτονικής του υλοποιημένου συστήματος παρουσιάζοντας τα διάφορα επίπεδα που χρησιμοποιούνται σε μία πολυμερή διάταξη λογισμικού (εξυπηρετητής δεδομένων, εξυπηρετητής εφαρμογών, εξυπηρετητής παρουσίασης, πελάτης). 7

8 Αποθήκες Δεδομένων 2 Αποθήκες Δεδομένων και OLAP 2.1 Αποθήκες Δεδομένων Μία αποθήκη δεδομένων αποτελεί το βασικό χώρο φύλαξης των ιστορικών δεδομένων μίας επιχείρησης ή ενός οργανισμού. Περιέχει ανεπεξέργαστες πληροφορίες για τη διαχείριση συστημάτων υποστήριξης αποφάσεων (decision support systems). Ο κυριότερος παράγοντας που οδηγεί στη χρήση μίας αποθήκης δεδομένων είναι η δυνατότητα του αναλυτή των δεδομένων να πραγματοποιεί σύνθετα ερωτήματα επάνω στα δεδομένα που περιέχονται σε αυτήν χωρίς να επιβραδύνονται τα υπόλοιπα συστήματα. Αρχικά θα αναφερθούν οι λόγοι που οδήγησαν στην ανάπτυξη των αποθηκών δεδομένων. Στη συνέχεια θα παρατεθεί ο βασικός ορισμός μίας αποθήκης δεδομένων. Τέλος, θα παρουσιαστεί η αρχιτεκτονική μίας αποθήκης δεδομένων Κίνητρα για την ανάπτυξη Αποθηκών Δεδομένων Τα Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ) αναπτύχθηκαν στη δεκαετία του 1970 και άκμασαν τη δεκαετία του Επικρατέστερος τύπος είναι τα Σχεσιακά ΣΔΒΔ, τα οποία έχουν ως βασικό στόχο την επεξεργασία συναλλαγών. Ο όρος On Line Transaction Processing (OLTP) αποδίδει τον βασικό τρόπο λειτουργίας των Σχεσιακών ΣΔΒΔ. Παραδείγματα OLTP διαδικασιών είναι η καταγραφή αεροπορικών κρατήσεων μέσω του Παγκόσμιου Ιστού, πωλήσεων αγαθών στα ταμεία με σάρωση ραυδοκωδικών, τραπεζικών αναλήψεων/καταθέσεων στα ATM, πληροφοριών τηλεφωνημάτων (τηλεφωνικοί αριθμοί, διάρκεια) από τηλεπικοινωνιακές εταιρίες, κ.λπ. Στόχοι των OLTP διαδικασιών είναι η αξιοπιστία των συναλλαγών (δεν χάνονται δεδομένα) και η αποτελεσματικότητα (χειρισμός χιλιάδων συναλλαγών ανά δευτερόλεπτο). Επομένως, τα Σχεσιακά ΣΔΒΔ διαχειρίζονται τις καθημερινές λειτουργίες ενός οργανισμού με σκοπό την διεκπεραίωση συναλλαγών. Για αυτό το λόγο, στα πλαίσια ενός οργανισμού, τα Σχεσιακά ΣΔΒΔ ονομάζονται και Επιχειρισιακές Βάσεις Δεδομένων (Operational Databases). Η μεγάλη αποδοχή που γνώρισαν τα Σχεσιακά ΣΔΒΔ οδήγησε στην δημιουργία μεγάλων Επιχειρησιακών Βάσεων Δεδομένων, οι οποίες, όμως, κατέληξαν να περιέχουν αναξιοποίητους όγκους δεδομένων. Για αυτό το λόγο οι Επιχειρησιακές Βάσεις Δεδομένων παρομοιαζόταν ως "τάφοι των δεδομένων". Στα μέσα της δεκαετίας του 1990 έγινε αντιληπτό ότι το περιεχόμενο των Επιχειρησιακών Βάσεων Δεδομένων αποτελεί πολύτιμο υλικό για ανάλυση, με σκοπό την υποστήριξη αποφάσεων. Για παράδειγμα, σε μία επιχείρηση η ανάλυση των πωλήσεων της προηγουμένης διετίας μπορεί να αναδείξει ποια προϊόντα είναι επιτυχημένα και ποια όχι, ή ακόμα, ποιες αγοραστικές ομάδες ανταποκρίθηκαν στα νέα προϊόντα, ώστε να ληφθούν αποφάσεις για ανάπτυξη νέων στρατηγικών προώθησης πωλήσεων, με διαφημιστικά και εκπτώσεις. Γίνεται αμέσως αντιληπτό το πλεονέκτημα που προσφέρει η αξιοποίηση των Επιχειρησιακών Βάσεων Δεδομένων, η οποία έχει ως αποτέλεσμα την ανάπτυξη Επιχειρησιακής Νοημοσύνης (Business Intelligence). Δυστυχώς, όμως, η τεχνολογία των Σχεσιακών ΣΔΒΔ, και τα εργαλεία που αυτά παρέχουν (π.χ., SQL, βελτιστοποιητές ερωτημάτων), δεν επαρκούν για τους 8

9 Αποθήκες Δεδομένων και OLAP σκοπούς της ανάλυσης των περιεχομένων των Επιχειρησιακών Βάσεων Δεδομένων. Αυτό συμβαίνει για διάφορους λόγους, οι οποίοι συνοψίζονται ως εξής: Τα δεδομένα στις Επιχειρησιακές Βάσεις, τις περισσότερες φορές, δεν έχουν καλή ποιότητα, δηλαδή υπάρχουν ελλιπή στοιχεία, θόρυβος, και ασυνέπειες. Επομένως, τα δεδομένα δεν προσφέρονται προς άμεση αξιοποίηση, αφού απαιτούν καθαρισμό. Στα πλαίσια ενός οργανισμού, οι Επιχειρησιακές Βάσεις Δεδομένων είναι συνήθως ανεξάρτητες. Για παράδειγμα, σε μία επιχείρηση υπάρχουν τμήματα με ανεξάρτητες Επιχειρησιακές Βάσεις, όπως το τμήμα πωλήσεων, μάρκετινγκ, προσωπικού, και προμηθειών. Επειδή αυτές οι Επιχειρησιακές Βάσεις δεν έχουν σχεδιασθεί για να συνεργάζονται, δεν αλληλοενημερώνονται, με αποτέλεσμα τα δεδομένα τους να είναι ετερογενή και να προκύπτουν συνωνυμίες ή αμφισημίες. Π.χ., ένας πελάτης μπορεί να είναι καταχωρισμένος με διαφορετικά στοιχεία στη βάσης του τμήματος πωλήσεων από ότι στη βάση του τμήματος μάρκετινγκ. Επομένως, τα δεδομένα, πριν αναλυθούν, πρέπει να ολοκληρωθούν και να ομογενοποιηθούν. Οι Επιχειρησιακές Βάσεις, μέσω διαδικασιών ενημέρωσης (εισαγωγές/διαγραφές), διατηρούν δεδομένα μόνο για την τρέχουσα κατάσταση. Για παράδειγμα, στη βάση του τμήματος προμηθειών μίας επιχείρησης διατηρούνται μόνο όσοι προμηθευτές συνεργάζονται μαζί της αυτή τη στιγμή. Για τους σκοπούς της ανάλυσης, όμως, μπορεί να χρειασθούν δεδομένα και για προμηθευτές που συνεργαζόταν στο παρελθόν, ώστε, π.χ., να συγκριθούν οι τιμές των προμηθευόμενων προϊόντων και να φανεί αν αύξηση τιμών οδήγησε σε μείωση πωλήσεων. Αυτό που χρειάζεται είναι να διατηρούνται ιστορικά δεδομένα, όχι μόνο αυτά που αποτυπώνουν την τρέχουσα κατάσταση. Η ανάλυση των δεδομένων δεν είναι εύκολο να επιτευχθεί με εργαλεία όπως η γλώσσα SQL. 0 λόγος είναι ότι προκύπτουν περίπλοκα ερωτήματα τα οποία δεν είναι εύκολο να συνταχθούν. Επιπλέον, τα Σχεσιακά ΣΔΒΔ στο φυσικό επίπεδο δεν είναι σχεδιασμένα για να ανταποκρίνονται στις απαιτήσεις τέτοιων περίπλοκων ερωτημάτων. Χρειάζονται, επομένως, εργαλεία με τα οποία η ανάλυση των δεδομένων θα γίνεται εύκολα και αποδοτικά από πλευράς χρόνου εκτέλεσης. Τέλος, στα Σχεσιακά ΣΔΒΔ, τα δεδομένα οργανώνονται βάσει τεχνικών όπως το Διάγραμμα Οντοτήτων Συσχετίσεων (ΔΟΣ) και αρχών όπως η κανονικοποίηση. Το ΔΟΣ και η κανονικοποίηση εκπληρώνουν τις απαιτήσεις της αποδοτικής OLTP, αλλά παράγουν βάσεις δεδομένων που στο νοητικό επίπεδο (conceptual level) είναι περίπλοκες. Για τους σκοπούς της ανάλυσης των δεδομένων, απαιτούνται διαφορετικές τεχνικές σχεδιασμού και οργάνωσης των δεδομένων στο νοητικό επίπεδο. Η ανάγκη για την ικανοποίηση των προαναφερθέντων απαιτήσεων οδήγησε στην ανάπτυξη των αποθηκών δεδομένων (data warehouses). Με τρόπους που θα αναλυθούν στη συνέχεια, η τεχνολογία των αποθηκών δεδομένων προσφέρει (α) ολοκλήρωση ετερογενών πηγών δεδομένων και (β) πλατφόρμα για αποδοτική ανάλυση ιστορικών δεδομένων. 9

10 Αποθήκες Δεδομένων Επομένως, μία αποθήκη δεδομένων αποτελεί μία συλλογή δεδομένων που επιλέγονται από τις Επιχειρησιακές Βάσεις, ολοκληρώνονται, ενώ στη συνέχεια τα συλλεγμένα δεδομένα αναλύονται με διαδικασίες όπως η On line Analytical Processing (OLAP) ή η εξόρυξη δεδομένων. Λόγω των διαφορετικών απαιτήσεων, η αποθήκη δεδομένων διατηρείται σε ξεχωριστό υπολογιστικό σύστημα από τις επιχειρησιακές βάσεις, από τις οποίες αντιγράφονται και ολοκληρώνονται τα δεδομένα. Αυτό σημαίνει ότι, αναλόγως του πόσο συχνά ενημερώνουμε την αποθήκη ως προς τις μεταβολές που συμβαίνουν στα δεδομένα των επιχειρησιακών βάσεων, η αποθήκη μπορεί να μην περιέχει τα πλέον ενημερωμένα δεδομένα. Στις περισσότερες, όμως, εφαρμογές αυτό δεν αποτελεί πρόβλημα, καθώς η ανάλυση των δεδομένων δεν επηρεάζεται από λίγες, πρόσφατες μεταβολές. Οι προαναφερθείσες έννοιες συνοψίζονται στην Εικόνα 2.1 Εικόνα 2.1 Αποτύπωση βασικών λειτουργιών μίας αποθήκης δεδομένων Λόγω των πλεονεκτημάτων που προσφέρει η τεχνολογία των αποθηκών δεδομένων, προσέλκυσε γρήγορα το επιχειρηματικό ενδιαφέρον. Οι πρώτες προσπάθειες ανάπτυξης αποθηκών δεδομένων ξεκίνησαν εντατικά στα μέσα της δεκαετίας του 1990, οπότε οι αποθήκες δεδομένων εξελίχθηκαν σε αγορά με οικονομικό κύκλο της τάξης των 2 δις δολαρίων. Οι πρώτες αυτές προσπάθειες, όμως, είχαν ποσοστό επιτυχίας μόλις 20%, επειδή αρχικά δεν αναγνωρίσθηκαν οι παράγοντες που προαναφέρθηκαν. Πολύ σύντομα όμως η κατάσταση άλλαξε. Στα τέλη της δεκαετίας του 1990, το 95% των 1000 επιχειρήσεων του Fortune ανέπτυσσαν αποθήκες δεδομένων, οπότε η αγορά των αποθηκών δεδομένων ανήρθε οικονομικά στο ύφος των 7 δις δολαρίων. Εκτιμήθηκε ότι σε 3 χρόνια από την ανάπτυξη μίας αποθήκης δεδομένων, η απόσβεση γίνεται σε ποσοστό 400%. Αυτό επιβεβαιώνεται από επιτυχημένες περιπτώσεις εφαρμογής, όπως στην αλυσίδα υπεραγορών Walmart, με 2000 υποκαταστήματα. Η ανάπτυξη αποθήκης δεδομένων βοήθησε την Walmart να βελτιστοποιήσει τις διαδικασίες προμήθειας προϊόντων και να μειώσει το κόστος αγοράς τους κατά 20%. Για να γίνει κατανοητή η κλίμακα μίας τέτοιας εφαρμογής, αναφέρεται ενδεικτικά ότι ο όγκος των δεδομένων στην αποθήκη δεδομένων της Walmart ανέρχεται στα 24 ΤΒ, σε ένα σύστημα 96 κόμβων με 900 επεξεργαστές και 2700 δίσκους. 10

11 Αποθήκες Δεδομένων και OLAP Ορισμός Αποθήκης Δεδομένων Ως αποθήκη δεδομένων, συμφωνά με τον Inmon (1996) ορίζουμε μία προσανατολισμένη προς το θέμα (subject oriented), ολοκληρωμένη (integrated), χρονικά μεταβαλλόμενη (time variant), και μη πτητική συλλογή δεδομένων με σκοπό την υποστήριξη λήψης αποφάσεων. Ο όρος "προσανατολισμένη προς το θέμα" σημαίνει ότι η αποθήκη δεδομένων οργανώνεται γύρω από βασικές επιχειρηματικές έννοιες. Ως παράδειγμα, σε μία επιχείρηση, βασικές έννοιες είναι οι πωλήσεις, τα προϊόντα, οι πελάτες, κ.λπ. Αυτές οι έννοιες ορίζονται από όσους εμπλέκονται στην ανάλυση των δεδομένων, και μπορεί να μην διακρίνονται εντός των OLTP διαδικασιών στις επιχειρησιακές βάσεις δεδομένων. Για παράδειγμα, τα δεδομένα ενός πελάτη μπορεί να βρίσκονται διεσπαρμένα σε πολλούς πίνακες και σε διαφορετικές βάσεις μεταξύ των τμημάτων. Για την ανάλυση των δεδομένων, επιθυμούμε την συνολική ανάδειξη της έννοιας του πελάτη, ασχέτως από το πως αυτή αναπαριστάται διεσπαρμένα στις επιχειρισιακές βάσεις. Επιπλέον, οι έννοιες διατηρούνται απλές και κατανοητές επιλέγοντας μόνο τα δεδομένα που σχετίζονται με τη λήψη αποφάσεων. Ο όρος "ολοκληρωμένη" σημαίνει ότι τα δεδομένα που αφορούν στην ίδια έννοια (θέμα) ορίζονται με ίδιο τρόπο. Αυτό γίνεται μέσω της ολοκλήρωσης των ετερογενών επιχειρησιακών βάσεων δεδομένων. Η ολοκλήρωση εφαρμόζεται μέσω μετασχηματισμών κατά την φόρτωση των δεδομένων, όπου φροντίζουμε να υπάρχει συνέπεια στην ονομασία ιδιοτήτων, τιμών, και μετρήσεων. Για παράδειγμα, έστω ότι η ημερομηνίες στο τμήμα προμηθειών αναπαριστώνται ως Ημέρα/Μήνας/ΕΕΕΕ, ενώ στο τμήμα αγορών ως ΗΗ/ΜΜ/ΕΕ. Μετά την ολοκλήρωση, επιλέγουμε τη μορφή Ημέρα/Μήνας/ΕΕΕΕ. Επίσης, έστω ότι στο τμήμα πωλήσεων μετράμε το βάρος των προϊόντων σε γραμμάρια, ενώ στο τμήμα μάρκετινγκ σε κιλά. Μετά την ολοκλήρωση, επιλέγουμε να μετράμε το βάρος μόνο σε κιλά. Ο όρος "χρονικά μεταβαλλόμενη" σημαίνει ότι όταν με το πέρας του χρόνου, αλλάζουν τα δεδομένα που σχετίζονται με μία έννοια, τότε διατηρούμε ιστορικά δεδομένα σε βάθος χρόνου ακόμα και ετών. Αυτό σημαίνει ότι κάθε δεδομένο συνοδεύεται από στοιχεία που αφορούν στο χρόνο. Για παράδειγμα, αν ένας πελάτης αλλάξει διεύθυνση, διατηρούμε την παλαιά διεύθυνση και το χρονικό διάστημα για το οποίο ίσχυε. Ο όρος "μη πτητική" σημαίνει ότι δεν συμβαίνουν διαγραφές στην αποθήκη δεδομένων. Όπως αναφέρθηκε, όταν συμβαίνουν μεταβολές, οι παλαιές τιμές διατηρούνται ως ιστορικά δεδομένα. Η καλύτερη κατανόηση του τι είναι μία αποθήκη δεδομένων, γίνεται σε αντιδιαστολή των χαρακτηριστικών της ως προς αυτά ενός Σχεσιακού ΣΔΒΔ (επιχειρησιακή βάση δεδομένων). Οι διαφορές παρουσιάζονται στον Πίνακα 2.1. Συνοπτικά, όμως, μπορούμε να πούμε ότι οι επιχειρησιακές βάσεις δεδομένων "τρέχουν" μία επιχείρηση, ενώ η αποθήκη δεδομένων την βελτιστοποιεί. Χαρακτηριστικό Σχεσιακό ΣΔΒΔ Αποθήκη Δεδομένων Σκοπός "τρέξιμο" καθημερινών υποστήριξη αποφάσεων 11

12 Αποθήκες Δεδομένων διεργασιών Λειτουργία διεκπεραίωση συναλλαγών εξαγωγή πληροφορίας Χρήστες κατώτεροι εργαζόμενοι (π.χ., ταμίες), DBAs υψηλόβαθμα στελέχη, αναλυτές γνώσης Αριθμός χρηστών (μέχρι) χιλιάδες (μέχρι) εκατοντάδες Δεδομένα τρέχοντα, απομονωμένα ιστορικά, ολοκληρωμένα Μέγεθος 100 ΜΒ 100 GB 100 GB 10 ΤΒ Σχεδιασμός ΔΟΣ, κανονικοποίηση Μοντελοποίηση Διαστάσεων, αποκανονικοποίηση Χρήση επαναληπτική ad hoc Προσπέλαση ανάγνωση/εγγραφή (κυρίως) ανάγνωση Ενημέρωση συνεχής περιοδική Μονάδα εργασίας σύντομες, απλές συναλλαγές περίπλοκα ερωτήματα Χρόνοι διεκπερέωσης millisec sec λεπτά ώρες Αριθμός προσπελασμένων εγγραφών δεκάδες εκατομμύρια Μονάδα απόδοσης συναλλαγές ανά δευτερόλεπτο χρόνος απόκρισης ερωτημάτων ACID ναι οχι Κατάλογοι Β δένδρα Bitmap κατάλογοι Πίνακας 2.1 Διαφορές μεταξύ Σχεσιακών ΣΔΒΔ και αποθηκών δεδομένων Αρχιτεκτονική Αποθήκης Δεδομένων Μία αποθήκη δεδομένων αποτελείται από 4 συνιστώσες: (α) τις επιχειρησιακές βάσεις δεδομένων, (β) την περιοχή προετοιμασίας δεδομένων, (γ) την περιοχή παρουσίασης δεδομένων, και (δ) τα εργαλεία προσπέλασης δεδομένων. Οι 4 συνιστώσες και οι μεταξύ τους σχέσεις, ορίζουν την αρχιτεκτονική μίας αποθήκης δεδομένων, η οποία απεικονίζεται στην Εικόνα Επιχειρησιακές βάσεις δεδομένων Στις επιχειρησιακές βάσεις δεδομένων αναφερθήκαμε προηγουμένως. Σε αυτό το σημείο απλώς αναφέρουμε, ξανά, ότι οι επιχειρησιακές βάσεις είναι ανεξάρτητες και ετερογενής. Αυτό οδηγεί στην ανάγκη για ολοκλήρωση τους. Φυσικά, αν προϋπάρχει μέριμνα για μείωση της ετερογένειας μεταξύ των επιχειρησιακών βάσεων, τότε διευκολύνεται η ολοκλήρωση. 12

13 Αποθήκες Δεδομένων και OLAP Περιοχή προετοιμασίας των δεδομένων Η περιοχή προετοιμασίας των δεδομένων περιλαμβάνει τις διαδικασίες εξαγωγής, μετασχηματισμού, και φόρτωσης των δεδομένων στην αποθήκη δεδομένων. Οι διαδικασίες αυτές καλούνται ETL, από την ακροστιχίδα των λέξεων Extract Transform Load, και λειτουργούν ως εξής: Εικόνα 2.2 Βασική αρχιτεκτονική μίας αποθήκης δεδομένων Εξαγωγή: Οι επιχειρησιακές βάσεις είναι συνήθως σχεσιακά ΣΔΒΔ. Μπορεί όμως να αντλούμε δεδομένα και από άλλες πηγές, όπως ιστότοποι (π.χ., έγγραφα html, xml), απλά αρχεία κειμένου, ή άλλες εφαρμογές (π.χ., Cobol). Επομένως, η εξαγωγή των δεδομένων από τις επιχειρησιακές βάσεις γίνεται, κυρίως, με χρήση τεχνολογιών διασύνδεσης τόσο με σχεσιακές βάσεις, όπως τα πρωτόκολλα ODBC, OLE DB, JDBC. Για διασύνδεση με άλλες πηγές χρησιμοποιούνται εργαλεία όπως οι wrappers, οι οποίοι μετατρέπουν αδόμητα δεδομένα σε ένα επιθυμητό σχεσιακό σχήμα. Μετασχηματισμός: Η ολοκλήρωση των δεδομένων γίνεται με μετασχηματισμούς που επιτελούν καθαρισμό και ομογενοποίηση δεδομένων από τις ετερογενείς επιχειρησιακές βάσεις. Μετασχηματισμοί γίνονται με διάφορες κατηγορίες εργαλείων. Τα λεγόμενα εργαλεία migration επιτρέπουν απλούς μετασχηματισμούς, όπως η μετατροπή μονάδας δεδομένων πωλήσεων από δολλάρια σε ευρώ. Τα εργαλεία scrubbing χρησιμοποιούν εξωτερικές πηγές γνώσης, όπως καταλόγους ταχυδρομικών διευθύνσεων, τηλεφωνικούς καταλόγου, ή άλλα δημογραφικά δεδομένα, για τον εντοπισμό διπλοεγγραφών ή γενικότερα συνωνύμων. Αντίστοιχη λειτουργία επιτελούν και τα εργαλεία fusion, τα οποία συνδυάζουν διαφορετικές πηγές δεδομένων (π.χ., δεδομένα από το τμήμα πωλήσεων με ερωτηματολόγια από το τμήμα μάρκετινγκ). Τέλος, τα εργαλεία auditing είναι εξειδικευμένα εργαλεία εξόρυξης δεδομένων, που ανακαλύπτουν κανόνες ή αντικανονικότητες (π.χ., πελάτες ηλικίας 130 ετών). Φόρτωση: Επειδή μία αποθήκη συγκεντρώνει δεδομένα από πολλές επιχειρησιακές βάσεις, ο όγκος των δεδομένων που πρέπει να φορτωθεί στην αποθήκη, είναι συνήθως μεγάλος. Επομένως, η διαδικασία της φόρτωσης είναι χρονοβόρα, π.χ., για φόρτωση μερικών ΤΒ δεδομένων μπορεί να απαιτηθούν εβδομάδες. Τα διαθέσιμα χρονικά "παράθυρα" είναι περιορισμένα, κυρίως κάποιες 13

14 Αποθήκες Δεδομένων λίγες ώρες τα βράδια. Για αυτό το λόγο έχουν αναπτυχθεί εργαλεία φόρτωσης, τα οποία διαχειρίζονται τη διαδικασία της φόρτωσης, επιτρέποντας τη διακοπή και επανεκκίνηση της, ή την ομαλή ανάκαμψη από βλάβες (π.χ., πτώση ρεύματος). Εξαιτίας των ETL διαδικασιών που επιτελούνται στην περιοχή προετοιμασίας των δεδομένων, αυτά δεν πρέπει να είναι προσπελάσιμα από τους αναλυτές. Η περιοχή προετοιμασίας των δεδομένων βρίσκεται στην αποκλειστική ευθύνη των διαχειριστών της αποθήκης δεδομένων. Μετά την εξαγωγή των δεδομένων από τις επιχειρησιακές βάσεις, αρχικώς μπορούν να διατηρούνται στην αποθήκη στη μορφή σχεσιακών πινάκων. Αυτό που δεν είναι απαραίτητο είναι η κανονικοποίησή τους συμφωνά με την τρίτη κανονική μορφή (3 NF) καθώς στην περιοχή παρουσίασης τα δεδομένα δεν ακολουθούν την τρίτη κανονική μορφή Ενημέρωση της αποθήκης δεδομένων Επιπλέον των διαδικασιών ETL, στην περιοχή προετοιμασίας των δεδομένων συντελείται και η διαδικασία της ενημέρωσης της αποθήκης σε σχέση με τις μεταβολές που συμβαίνουν στις επιχειρησιακές βάσεις. Σχετικά με την ενημέρωση, πρέπει να αποφασισθεί (α) το πότε και (β) το πως θα γίνει. Για το ζήτημα του πότε (α), η ενημέρωση γίνεται είτε περιοδικά, π.χ., κάθε μήνα, είτε όταν έχει συμβεί ένα ποσοστό μεταβολών, π.χ., 10%. Μπορούμε, μάλιστα, να ορίσουμε διαφορετική πολιτική ενημέρωσης (χρονική περίοδο ή ποσοστό αλλαγών) για κάθε επιχειρησιακή βάση, αναλόγως του ρυθμού μεταβολών που συμβαίνουν σε αυτήν. Σε κάθε περίπτωση, προκύπτει ότι η αποθήκη δεδομένων δεν περιλαμβάνει τις τελευταίες ενημερώσεις που συμβαίνουν στις επιχειρησιακές βάσεις. Εφόσον, όμως, η ανάλυση βασίζεται σε δεδομένα πολλών ετών, τα οποία περιέχονται στην αποθήκη, η επιρροή κάποιων λίγων μεταβολών δεν είναι σημαντική. Για το ζήτημα του πως (β), στην απλή περίπτωση, η ενημέρωση μπορεί να γίνει με αντιγραφή όλων των περιεχομένων των επιχειρησιακών βάσεων, είτε αυτά έχουν μεταβληθεί είτε όχι. Αυτός ο τρόπος είναι στην ουσία η επανάληψη της διαδικασίας φορτώσεως, με πλεονέκτημα ότι δεν χρειάζεται να βρούμε ποιες είναι οι μεταβολές. Το μειονέκτημα είναι ότι η διαδικασία της φόρτωσης είναι χρονοβόρα και για αυτό πρέπει να γίνεται μόνο μία φορά. Επομένως, είναι προτιμότερο να έχουμε τρόπους εύρεσης των αλλαγών και να ενημερώνουμε την αποθήκη μόνο σχετικά με αυτές. Υπάρχουν διάφοροι μηχανισμοί ανίχνευσης των αλλαγών, αναλόγως των δυνατοτήτων της κάθε επιχειρησιακής βάσης. Τα κυριότερα παραδείγματα μηχανισμών σε σχεσιακά ΣΔΒΔ είναι: (1) Η χρήση σκανδαλιστών (triggers) που ενημερώνουν την αποθήκη όταν μεταβάλλονται (εισάγονται, διαγράφονται, τροποποιούνται) γραμμές σε κάποιους πίνακες. Οι σκανδαλιστές είναι αποτελεσματικός μηχανισμός, αλλά μπορεί να μην είναι δυνατή η τροποποίηση του σχήματος μίας επιχειρισιακής βάσης για την προσθήκη σκανδαλιστούν. (2) Η ανίχνευση του αρχείου καταγραφής συναλλαγών (transaction log file) και η εύρεση εκείνων των συναλλαγών που αφορούν σε τροποποίηση δεδομένων. Ένα πρόβλημα είναι ότι δεν υπάρχει κάποιο πρότυπο σχετικά με τα αρχεία καταγραφής συναλλαγών, και οι διάφοροι κατασκευαστές σχεσιακών ΣΔΒΔ ακολουθούν διαφορετική μορφή. 14

15 Αποθήκες Δεδομένων και OLAP Περιοχή παρουσίασης των δεδομένων Όταν τα δεδομένα έχουν περάσει από την περιοχή της προετοιμασίας τους, είναι έτοιμα προς ανάλυση. Το σύνολο αυτών των δεδομένων συνθέτει την περιοχή παρουσίασης. Η ονομασία της περιοχής αυτής οφείλεται στο γεγονός ότι οι αναλυτές βλέπουν μόνο αυτά τα δεδομένα (θυμηθείτε ότι οι αναλυτές αποκλείονται από την περιοχή προετοιμασίας). Τα δεδομένα στην περιοχή παρουσίασης επιμερίζονται σε αγορές δεδομένων (data marts). Κάθε αγορά δεδομένων αποτελεί ένα υποσύνολο της αποθήκης, και είναι προσανατολισμένη μόνο σε μία επιχειρηματική διεργασία. Για παράδειγμα, για τη διεργασία προμηθειών, η αντίστοιχη αγορά θα περιέχει το υποσύνολο της αποθήκης που σχετίζεται με τα προϊόντα και τους προμηθευτές, και όχι τους αγοραστές. Η ανάπτυξη της αποθήκης δεδομένων μπορεί να γίνει με δυο τρόπους. Με τον τρόπο "από πάνω προς τα κάτω", πρώτα δημιουργείται η κεντρική αποθήκη δεδομένων και στη συνέχεια δημιουργούνται οι αγορές δεδομένων, οι οποίες τροφοδοτούνται από την κεντρική αποθήκη. Με τον τρόπο "από κάτω προς τα πάνω", πρώτα δημιουργούνται οι αγορές δεδομένων, ξεχωριστά η κάθε μία. Καθώς αυτές ολοκληρώνονται, αποτελούν την περιοχή παρουσίασης των δεδομένων Εργαλεία προσπέλασης δεδομένων Η ανάλυση των δεδομένων γίνεται με διάφορα εργαλεία. O πιο άμεσος αλλά δυσκολότερος τρόπος είναι με τη σύνταξη ερωτημάτων στη γλώσσα SQL. Για αυτό το λόγο, η τεχνολογία OLAP παρέχει περισσότερο εύκολους και αποδοτικούς τρόπους για την ανάλυση των δεδομένων. Περισσότερα για την OLAP θα εξηγηθούν στη συνέχεια αυτού του κεφαλαίου. Περισσότερο φιλική προς το χρήστη είναι η διασύνδεση της τεχνολογίας OLAP με δημοφιλή εργαλεία όπως τα φύλλα δεδομένων (spreadsheets). Τέλος, και η εξόρυξη δεδομένων παρέχει εργαλεία τα οποία μπορούν να χρησιμοποιηθούν επί μίας αποθήκης δεδομένων. 2.2 On Line Analytical Processing (OLAP) Ο όρος OLAP αναφέρεται στην εύκολη και αποδοτική επεξεργασία αναλυτικών ερωτημάτων τα οποία είναι εκ φύσεως πολυδιάστατα. Τυπικές εφαρμογές OLAP σε μία επιχείρηση αποτελούν διάφορες αναφορές σχετικά με τις πωλήσεις, το marketing, την πρόβλεψη, τον προϋπολογισμό κ.ο.κ. Ο όρος OLAP δημιουργήθηκε από μία μικρή τροποποίηση του παραδοσιακού όρου των βάσεων δεδομένων OLTP (On line Transaction Processing). Στη συνέχεια, θα παρουσιαστεί η πολύ βασική δομή του κύβου δεδομένων. Έπειτα θα αναφερθεί ο τρόπος σχεδιασμού ενός κύβου δεδομένων. Τέλος, θα παρατεθούν οι βασικές πράξεις OLAP που μπορούν να εκτελεστούν επάνω στα δεδομένα που περιέχει ένας κύβος δεδομένων Κύβος Δεδομένων Κάθε αγορά δεδομένων, όπως αναφέρθηκε, είναι προσανατολισμένη σε μία μόνο διεργασία. Κατά τη διενέργεια μίας διεργασίας συμβαίνουν διάφορα γεγονότα (facts) που την αφορούν. Για παράδειγμα, σε μία αγορά δεδομένων που αφορά στις πωλήσεις, γεγονός αποτελεί η πώληση ενός συγκεκριμένου προϊόντος σε κάποιο υποκατάστημα, μία δεδομένη χρονική στιγμή. Μία αριθμητική ποσότητα που αφορά σε ένα γεγονός, ονομάζεται (αριθμητικό) μέτρο (measure). Στο γεγονός του προηγουμένου παραδείγματος, ένα μέτρο 15

16 On Line Analytical Processing (OLAP) είναι ο αριθμός των τεμαχίων του προϊόντος, που πωλήθηκαν στον πελάτη. Ένα γεγονός μπορεί να έχει περισσότερα μέτρα. Ένα άλλο παράδειγμα μέτρου είναι το συνολικό χρηματικό ποσό πώλησης όλων των τεμαχίων του προϊόντος. Οι πληροφορίες που περιγράφουν το γεγονός, ονομάζονται διαστάσεις (dimensions). Για ένα γεγονός πώλησης, διαστάσεις είναι, π.χ., το προϊόν, το υποκατάστημα που έγινε η πώληση, η ημερομηνία που έγινε η πώληση, κ.λπ. Κάθε διάσταση έχει ορισμένες ιδιότητες. Σε εννοιολογικό επίπεδο, τα γεγονότα αναπαριστώνται ως πολυδιάστατοι κύβοι δεδομένων. Η Εικόνα 2.3 απεικονίζει παράδειγμα ενός κύβου δεδομένων, όπου τα γεγονότα αφορούν στις πωλήσεις ενός βιβλιοπωλείου. Κάθε άξονας του κύβου αντιστοιχεί σε μία διάσταση. Από το σύνολο των ιδιοτήτων της, κάθε διάσταση αναπαρίσταται ως μία από αυτές. Για παράδειγμα, για τη διάσταση υποκατάστημα, ορισμένες ιδιότητες είναι η διεύθυνση, η πόλη, ο νομός, και το γεωγραφικό διαμέρισμα. Στην Εικόνα 2.3, η διάσταση Υποκατάστημα απεικονίζεται ως προς την ιδιότητα πόλη. Οι τιμές των ιδιοτήτων όλων των διαστάσεων διαμερίζουν τον κύβο σε κελιά. Κάθε κελί του κύβου περιέχει την αντίστοιχη τιμή του μέτρου, π.χ., τον αριθμό πουλημένων τεμαχίων. Έτσι, την 1/10/07, στο υποκατάστημα της Θεσσαλονίκης, πωλήθηκαν συνολικά 7 βιβλία. Η αναπαράσταση με κύβο δεδομένων διευκολύνει πολύ την ανάλυση, επειδή η χρήση ενός κύβου μοιάζει με τη χρήση ενός φύλλου δεδομένων. Σε μία διάσταση, κάποιες από τις ιδιότητες της μπορεί να απαρτίζουν ιεραρχία. Μία ιεραρχία αναπαριστά επίπεδα μεταξύ των ιδιοτήτων, από το ειδικότερο στο γενικότερο, ως προς κάποια έννοια. Για παράδειγμα, για τη διάσταση υποκατάστημα, οι ιδιότητες διεύθυνση, η πόλη, ο νομός, και γεωγραφικό διαμέρισμα απαρτίζουν μία ιεραρχία ως προς τη γεωγραφική θέση του υποκαταστήματος. Έτσι, η διεύθυνση είναι ειδικότερη από την πόλη, ενώ η πόλη είναι ειδικότερη από το νομό, κ.ο.κ. Εικόνα 2.3 Παράδειγμα κύβου δεδομένων Μία ιεραρχία απεικονίζεται με ένα πλέγμα, όπου κάθε κόμβος αντιστοιχεί σε μία ιδιότητα. Συνηθέστερη μορφή είναι ένα εκφυλισμένο πλέγμα, δηλαδή, μία γραμμική λίστα. Για τις διαστάσεις προϊόν, υποκατάστημα, και ημερομηνία, παραδείγματα ιεραρχιών απεικονίζονται στην Εικόνα 2.4. Για να διευκολύνουμε την ανάλυση, μπορούμε να αλλάζουμε το επίπεδο της ιεραρχίας σε κάθε ιδιότητα, προκύπτοντας έτσι διαφορετική όψη 16

17 Αποθήκες Δεδομένων και OLAP του κύβου δεδομένων. Για παράδειγμα, μπορούμε να δούμε τις πωλήσεις, αντί ανά ημέρα, ανά μήνα και να διακρίνουμε, π.χ., ότι τους μήνες Αύγουστο και Νοέμβριο είχαμε μειωμένες πωλήσεις σε σχέση με άλλους μήνες. Αυτές οι ενέργειες εκτελούνται με τις OLAP πράξεις, οι οποίες θα αναλυθούν στη συνέχεια. Εικόνα 2.4 Παράδειγμα ιεραρχιών Σχήμα Αστέρα Ο σχεδιασμός ενός κύβου δεδομένων γίνεται με σχήμα αστέρα (star schema). Σε ένα σχήμα αστέρα, τα γεγονότα αναπαριστώνται στον πίνακα γεγονότων (fact table), ενώ κάθε διάσταση αναπαριστάται με ξεχωριστό πίνακα διαστάσεων (dimension table). Η Εικόνα 2.5 απεικονίζει το σχήμα αστέρα που αντιστοιχεί στον κύβο της Εικόνας 2.3. Οι στήλες σε έναν πίνακα διάστασης αντιστοιχούν στο κύριο κλειδί (στην Εικόνα 2.5 κλειδιά είναι οι κωδικοί) και στις υπόλοιπες ιδιότητες της διάστασης. Στον πίνακα γεγονότων, οι στήλες αντιστοιχούν σε ξένα κλειδιά, ένα προς κάθε πίνακα διάστασης. Επίσης, για κάθε αριθμητικό μέτρο, υπάρχει και μία ξεχωριστή στήλη (στην Εικόνα 2.5 τα αριθμητικά μέτρα είναι τα Τεμάχια και το Χρηματικό ποσό). Εικόνα 2.5 Παράδειγμα σχήματος αστέρα Το σχήμα αστέρα παίρνει την ονομασία του από τη δομή που προκύπτει, με τον πίνακα γεγονότων στο κέντρο και τις διαστάσεις τοποθετημένες ακτινωτά γύρω του. Σε αντίθεση με ένα διάγραμμα οντοτήτων συσχετίσεων (ΔΟΣ), το διάγραμμα ενός σχήματος αστέρα γίνεται πολύ ευκολότερα αντιληπτό. Η απλότητα του πηγάζει από το γεγονός ότι ο σχεδιασμός λαμβάνει υπ'όψη μόνο την ανάγκη σχεδιασμού ενός κύβου και όχι μίας σχεσιακής βάσης δεδομένων. Επειδή σε έναν κύβο δεν υπάρχει η ανάγκη εξυπηρέτησης 17

18 On Line Analytical Processing (OLAP) συναλλαγών, δεν χρειάζονται οι σχεδιαστικές αρχές ενός ΔΟΣ. Το σημαντικότερο μειονέκτημα ενός σχήματος αστέρα είναι ότι δεν παρέχουν υποστήριξη για ρητή αναπαράσταση των ιεραρχιών που σχηματίζουν οι ιδιότητες των διαστάσεων OLAP Πράξεις Η τεχνολογία OLAP βοηθάει στην εύκολη διατύπωση αναλυτικών ερωτήσεων επί κύβων δεδομένων, καθώς και στη γρήγορη εκτέλεση τους. Αντίθετα, η διατύπωση αντίστοιχων αναλυτικών ερωτημάτων σε σχεσιακά ΣΔΒΔ απαιτεί τη σύνταξη περίπλοκων ερωτημάτων στη γλώσσα SQL, τα οποία εκτελούνται στη συνέχεια με μεγάλο υπολογιστικό κόστος. Όλες οι OLAP πράξεις μπορούν να διατυπωθούν εύκολα, με γραφικό τρόπο, αν και έχει αναπτυχθεί η γλώσσα MDX (Multidimensional Expression language), η οποία χρησιμοποιείται ως πρότυπο για την ανάπτυξη εργαλείων OLAP. Οι συνηθέστερα χρησιμοποιούμενες OLAP πράξεις παρουσιάζονται στην Εικόνα 2.6 και αναλύονται ως ακολούθως: Εικόνα 2.6 Πράξεις OLAP Roll up: Παράγει κύβο δεδομένων με μειωμένο επίπεδο λεπτομέρειας. Η πράξη roll up γίνεται όταν: (α) σε κάποιες διαστάσεις επιλέγουμε ανώτερο επίπεδο στην ιεραρχία τους ή (β) αφαιρούμε κάποιες διαστάσεις. Στην Εικόνα 2.6, από τον κεντρικό κύβο παράγουμε τον πάνω αριστερά ανεβαίνοντας στην ιεραρχία της διάστασης Ημερομηνία (από το επίπεδο τρίμηνο στο επίπεδο έτος). 0 κάτωαριστερά κύβος παράγεται αφαιρώντας τη διάσταση Υποκατάστημα. Drill down: Παράγει κύβο δεδομένων με αυξημένο επίπεδο λεπτομέρειας. Η πράξη drill down γίνεται όταν: (α) σε κάποιες διαστάσεις επιλέγουμε κατώτερο επίπεδο στην ιεραρχία τους ή (β) προσθέτουμε κάποιες διαστάσεις. Στην Εικόνα 2.6, από 18

19 Αποθήκες Δεδομένων και OLAP τους δυο αριστερούς κύβου, παράγουμε με αντίστροφες πράξεις από ότι στην περίπτωση του roll up, τον κεντρικό κύβο. Slice: Παράγει κύβο εφαρμόζοντας επιλογή σε μία μόνο διάσταση (αντιστοιχεί στις σχεσιακές πράξεις επιλογής και προβολής). Στην Εικόνα 2.6, από τον κεντρικό κύβο παράγουμε το σκιασμένο τμήμα του πάνω δεξιά κύβου, θέτοντας κριτήρια επιλογής στη διάσταση Ημερομηνία. Dice: Παράγει κύβο εφαρμόζοντας επιλογή σε μία περισσότερες διαστάσεις. Στην Εικόνα 2.6, από τον κεντρικό κύβο παράγουμε το σκιασμένο τμήμα του κάτω δεξιά κύβου, θέτοντας κριτίρια επιλογή σε όλες τις διαστάσεις. Pivot: Παράγει κύβο με άλλη διάταξη των διαστάσεων. Στην Εικόνα 2.6, από τον κεντρικό κύβο παράγουμε τον κάτω κύβο, αντιμεταθέτοντας τις διαστάσεις Προϊόν και Ημερομηνία. Εικόνα 2.7 OLAP πράξεις με εφαρμογή συναθροιστικής συνάρτησης Με τις OLAP πράξεις είναι εύκολη η ανάλυση με διαισθητικό τρόπο. Για την εφαρμογή τους, όμως, απαιτείται ο ορισμός του τρόπου παραγωγής των κύβων αποτελεσμάτων, μέσω μίας συναθροιστικής συνάρτησης (aggregation function) επί των τιμών των αριθμητικών μέτρων. Οι βασικές συναθροιστικές συναρτήσεις είναι αυτές του αθροίσματος (sum), πλήθους (count), μέσου όρου (avg), μεγίστου (max), και ελαχίστου (min). Για παράδειγμα, στην Εικόνα 2.7 ορίζουμε τη συναθροιστική συνάρτηση του αθροίσματος. Με εφαρμογή πράξης roll up στον κάτω αριστερά κύβο πωλήσεων, παίρνουμε τον πάνω κύβο. Η πράξη roll up έγινε αλλάζοντας επίπεδο ιεραρχίας στη διάσταση υποκατάστημα, από το επίπεδο του νομού σε αυτό του γεωγραφικού διαμερίσματος. Επομένως, για τους νομούς που ανήκουν στο ίδιο διαμέρισμα, παίρνουμε το άθροισμα των πωλήσεων. Στην αντίθετη πράξη του drill 19

20 Τύποι Συστημάτων OLAP down, παίρνουμε τον κάτω δεξιά κύβο, όπου αναλύουμε το τέταρτο τρίμηνο (Τ4) στους αντίστοιχους μήνες, οπότε το άθροισμα των πωλήσεων του τριμήνου επιμερίζεται ανά μήνα. 2.3 Τύποι Συστημάτων OLAP Έχουν αναπτυχθεί 3 διαφορετικοί τύποι συστημάτων OLAP όσον αφορά το φυσικό επίπεδο. Ο πρώτος τύπος ονομάζεται Multidimensional OLAP (MOLAP), ο δεύτερος Relational OLAP (ROLAP), και ο τρίτος Hybrid OLAP (HOLAP). Οι 3 τύποι αναλύονται ακολούθως Συστήματα MOLAP Στα συστήματα MOLAP ο πίνακας γεγονότων αποθηκεύεται σε πολυδιάστατους πίνακες (multi dimensional arrays), όπου ο πίνακας έχει την ίδια έννοια με αυτήν σε μία γλώσσα προγραμματισμού (π.χ., C) και όχι σε ένα σχεσιακό ΣΔΒΔ. Επομένως, αν θεωρήσουμε έναν κύβο πωλήσεων με διαστάσεις την ημερομηνίας, το προϊόν, και υποκατάστημα. Ως μέτρο θεωρούμε τον (ακέραιο) αριθμό τεμαχίων σε κάθε πώληση. Στη γλώσσα C, μία δήλωση ενός πίνακα Π με 3 διαστάσεις, γίνεται με τπ ορφή: int Π[][][]. Ο Π αντιστοιχεί στον πίνακα γεγονότων. Το στοιχείο [i][j][k] δηλώνει τον αριθμό των τεμαχίων που πωλήθηκαν την ημερομηνία με κωδικό i, για το προϊόν με κωδικό j, στο υποκατάστημα με κωδικό k. Στα συστήματα MOLAP, τέτοιοι πίνακες είναι αραιοί, συνήθως σε ποσοστό 80%. Ο λόγος είναι ότι κάθε συνδυασμός διαστάσεων δεν αντιστοιχεί απαραίτητα σε ένα γεγονός. Για παράδειγμα, στον πίνακα Π, μπορεί την ημερομηνία ι, για το προϊόν j, στο υποκατάστημα k να μην πωλήθηκε κανένα τεμάχιο. Εφόσον στον Π καταγράφουμε μόνο τις πωλήσεις, τότε η τιμή Π[i][j][k] είναι κενή. Επίσης, ενώ σε μία γλώσσα προγραμματισμού οι πίνακες αποθηκεύονται στην κυρία μνήμη, σε ένα σύστημα MOLAP αυτό μπορεί να μην είναι δυνατό εξ αιτίας του μεγέθους των πινάκων. Για αυτούς τους λόγους, χρησιμοποιούνται βελτιστοποιημένες δομές πινάκων, οι οποίες κάνουν συμπίεση (εκμεταλλευόμενες την αραιότητα) και αποθήκευση στο δίσκο (βασισμένες στον κατακερματισμό). Το κυριότερο εμπορικό σύστημα MOLAP αποτελεί το Essbase της Arbor. Τα πλεονεκτήματα των συστημάτων MOLAP είναι: Πολύ γρήγορη εκτέλεση OLAP πράξεων, επειδή είναι άμεση η προσπέλαση στις τιμές των κελιών του κύβου. Μειωμένος αποθηκευτικός χώρος, λόγω της συμπίεσης. Ειδικά για λίγες διαστάσεις, η μείωση είναι δραστική. Τα μειονεκτήματα των συστημάτων MOLAP είναι: Αργή δημιουργία του κύβου, λόγω και της ανάγκης συμπίεσης. Ειδικά για μεγάλους κύβους, ο χρόνος δημιουργίας είναι σχεδόν αποτρεπτικός. Δεν υπάρχουν πρότυπα για την ανάπτυξη MOLAP συστημάτων. Επίσης, δεν έχουν αναπτυχθεί κοινά αποδεκτές γλώσσες και μοντέλα για τη διατύπωση OLAP πράξεων σε συστήματα MOLAP Συστήματα ROLAP Στα συστήματα ROLAP χρησιμοποιείται ένα σχεσιακό ΣΔΒΔ ως μέσο αποθήκευσης του κύβου δεδομένων. Επομένως ένας πίνακας, με την έννοια των σχεσιακών ΣΔΒΔ, 20

21 Αποθήκες Δεδομένων και OLAP αποθηκεύει τον πίνακα γεγονότων, ενώ ξεχωριστοί πίνακες αποθηκεύουν τις διαστάσεις. Ας θεωρήσουμε πάλι το παράδειγμα ενός κύβου πωλήσεων με διαστάσεις την ημερομηνία, το προϊόν, και το υποκατάστημα, ενώ ως μέτρο θεωρούμε τον (ακέραιο) αριθμό τεμαχίων σε κάθε πώληση. 0 πίνακας γεγονότων Π δηλώνεται ως εξής: CREATE TABLE Π( Κωδ_Ημερομηνίας int, Κωδ_Προϊόντος int, Κωδ_Υποκαταστήματος int, Τεμάχια int, PRIMARY ΚΕΥ(Κωδ_Ημερομηνίας, Κωδ_Προϊόντος, Κωδ_Υποκαταστήματος), FOREIGN ΚΕΥ(Κωδ_Ημερομηνίας) REFERENCES ΗΜΕΡΟΜΗΝΙΑ, FOREIGN ΚΕΥ(Κωδ_Προϊόντος) REFERENCES ΠΡΟΪΟΝ, FOREIGN ΚΕΥ(Κωδ_Υποκαταστήματος) REFERENCES ΥΠΟΚΑΤΑΣΤΗΜΑ ); Επομένως, οι πράξεις OLAP πραγματοποιούνται μέσω ερωτημάτων SQL. Επειδή, όπως έχει αναφερθεί, οι απαιτήσεις των πράξεων OLAP δεν συμβαδίζουν με τις προδιαγραφές των σχεσιακών ΣΔΒΔ, στα συστήματα ROLAP προστίθεται μία ενδιάμεση συνιστώσα (middleware), η οποία διεκπεραιώνει τις OLAP πράξεις. Τα περισσότερο γνωστά εμπορικά συστήματα ROLAP είναι αυτά της RedBrick και της Sybase. Τα πλεονεκτήματα των συστημάτων ROLAP είναι: Δεν απαιτείται η δημιουργία του κύβου. Επομένως, τα συστήματα ROLAP κλιμακώνονται σε μεγάλους κύβους και σε μεγάλο αριθμό διαστάσεων. Βασίζονται στην εγκαθιδρυμένη σχεσιακή τεχνολογία, για την οποία υπάρχουν πρότυπα. Επίσης, είναι ευκολότερη η διάχυση τους σε όσους έχουν εξοικείωση με τα σχεσιακά ΣΔΒΔ, δηλαδή με αρκετό κόσμο. Τα μειονεκτήματα των συστημάτων ROLAP είναι: Μειωμένη ταχύτητα, συγκριτικά με τα συστήματα MOLAP, κατά την εκτέλεση των OLAP πράξεων. Το κενό μεταξύ τους, όμως, τείνει να μειώνεται, καθώς αναπτύσσονται εξειδικευμένες ενδιάμεσες συνιστώσες. Δεν παρέχεται υποστήριξη για ETL διαδικασίες, γεγονός που δυσχεραίνει την ανάπτυξη αγορών δεδομένων με συστήματα ROLAP Συστήματα HOLAP Επειδή τα συστήματα MOLAP και ROLAP παρουσιάζουν τόσο πλεονεκτήματα όσο και αλληλοσυμπληρώμενα μειονεκτήματα, έχουν αναπτυχθεί τα σύστημα HOLAP. Για έναν κύβο σε ένα σύστημα HOLAP, είναι δυνατό να αποθηκεύσουμε ένα τμήμα του συμφωνά όπως στην περίπτωση του MOLAP, ενώ ο υπόλοιπος κύβος αποθηκεύεται όπως στην περίπτωση του ROLAP. Στην πρώτη κατηγορία αποθηκεύουμε το τμήμα του κύβου που αναλύεται συχνότερα, επιταχύνοντας έτσι τους χρόνους εκτέλεσης των OLAP πράξεων. Εφόσον ο υπόλοιπος κύβος βρίσκεται αποθηκευμένος σε ένα σχεσιακό ΣΔΒΔ, επιτυγχάνουμε κλιμάκωση σε μεγάλους όγκους δεδομένων. Αρα, τα συστήματα HOLAP συνδυάζουν τα πλεονεκτήματα των MOLAP και ROLAP, αποφεύγοντας τα μειονεκτήματα τους. Αυτός είναι ο λόγος που σήμερα τα περισσότερα εμπορικά συστήματα είναι HOLAP, όπως ο Analysis Services της Microsoft και ο Express Server της Oracle. 21

22 Μοντελοποίηση διαστάσεων 3 Σχεδιασμός Αποθήκης Δεδομένων 3.1 Μοντελοποίηση διαστάσεων Η μοντελοποίηση διαστάσεων (dimensional modeling) είναι πιο διαδεδομένη μεθοδολογία για την ανάπτυξη λογικών μοντέλων για κύβους δεδομένων. Η μοντελοποίηση διαστάσεων (ΜΔ) βασίζεται στο σχεδιασμό σχημάτων αστέρα καθορίζοντας τους πίνακες γεγονότων και τους πίνακες διαστάσεων. Το βασικότερο πλεονέκτημα της ΜΔ είναι ότι παράγει απλά και κατανοητά λογικά μοντέλα Τα 4 Σχεδιαστικά Βήματα Η ΜΔ πραγματοποιείται μέσω σχεδίασης, που αποτελείται από τα ακόλουθα 4 βήματα: 1. Επιλογή της διαδικασίας που θα μοντελοποιηθεί. Ένας οργανισμός, π.χ., μία επιχείρηση ή μία δημόσια υπηρεσία, περιλαμβάνει διάφορες διαδικασίες, όπως οι παραγγελίες πρώτων υλών, οι πωλήσεις, η απογραφή, κ.λπ. Η επιλογή γίνεται βάσει προτεραιοτήτων, οι οποίες διασαφηνίζονται κατά τη διαδικασία αποτύπωσης των προδιαγραφών. Έμφαση δίνεται στις επιχειρηματικές διαδικασίες και όχι στην υφιστάμενη διαμέριση της επιχείρησης σε τμήματα. Για παράδειγμα, η διαδικασία των πωλήσεων μπορεί να αφορά τόσο στο τμήμα πωλήσεων όσο και στο τμήμα μάρκετινγκ. Λόγω της ολοκλήρωσης που επιβάλλεται να επιφέρουν οι αποθήκες δεδομένων, αναπτύσσουμε ένα μόνο μοντέλο, που αφορά στη διαδικασία πωλήσεων, αντί ξεχωριστών μοντέλων για κάθε τμήμα. 2. Επιλογή επιπέδου λεπτομέρειας. Το επίπεδο λεπτομέρειας καθορίζει το τι αναπαριστά κάθε γραμμή του πίνακα γεγονότων (κάθε κελί του κύβου). Για παράδειγμα, όταν το μοντέλο αφορά σε πωλήσεις, τότε μία γραμμή μπορεί να αναπαριστά την πώληση ενός αντικειμένου σε έναν πελάτη σε κάποια συναλλαγή. 3. Επιλογή των πινάκων διαστάσεων. Έχοντας διασαφηνίσει το επίπεδο λεπτομέρειας, οι βασικοί πίνακες διαστάσεων του μοντέλου, καθώς και οι ιδιότητες που περιλαμβάνουν, προκύπτουν από το ερώτημα: "με ποιες πληροφορίες περιγράφουμε κάθε γραμμή του πίνακα γεγονότων". Για παράδειγμα, όταν μία γραμμή μπορεί να αναπαριστά την πώληση ενός αντικειμένου σε έναν πελάτη σε κάποια συναλλαγή, τότε οι βασικοί πίνακες διαστάσεων είναι ο πίνακας πελατών, ο πίνακας προϊόντων, και ο πίνακας του χρόνου. 4. Επιλογή των αριθμητικών γεγονότων. Τα αριθμητικά γεγονότα συμπληρώνουν τον πίνακα γεγονότων. Προκύπτουν από το ερώτημα: "τι μετράμε σε κάθε γραμμή του πίνακα γεγονότων". Για παράδειγμα, όταν μοντελοποιούμε τη διαδικασία πωλήσεων, συνήθη αριθμητικά γεγονότα είναι η τιμή πώλησης ενός προϊόντος σε μία συναλλαγή, ο αριθμός των τεμαχίων του προϊόντος, που πωλήθηκαν στη συναλλαγή, κ.λπ. Γίνεται αμέσως κατανοητό ότι, όλα τα αριθμητικά γεγονότα πρέπει να αναφέρονται στο ίδιο επίπεδο λεπτομέρειας; π.χ., δεν μπορούμε να καταγράφουμε στον ίδιο πίνακα γεγονότων τις τιμές πωλήσεων 22

23 Σχεδιασμός Αποθήκης Δεδομένων προϊόντων ανά ξεχωριστή συναλλαγή και τον αριθμό τεμαχίων προϊόντων ανά εβδομάδα. Για την καλύτερη κατανόηση των 4 σχεδιαστικών βημάτων, θα αναφερθούμε, ως παράδειγμα, στην εφαρμογή τους για τη μοντελοποίηση της διαδικασίας πωλήσεων σε ένα βιβλιοπωλείο. Υποθέτουμε ότι εργαζόμαστε στο τμήμα ανάλυσης δεδομένων της επιχείρησης, και για το σχεδιασμό λαμβάνουμε εξετάζουμε τους εξής παράγοντες: Παράδειγμα 3.1 (Βιβλιοπωλείο) Το βιβλιοπωλείο του παραδείγματος μας έχει 20 υποκαταστήματα και στα πέντε γεωγραφικά διαμερίσματα της Ελλάδας. Σε κάθε υποκατάστημα υπάρχουν 3 ξεχωριστά τμήματα: των βιβλίων, των ηλεκτρονικών μέσων (π.χ., πολυμεσικοί τίτλοι), και των ειδών γραφείου (π.χ., στυλό, χαρτί). Κάθε υποκατάστημα έχει περίπου διακριτά προϊόντα προς πώληση. Κάθε προϊόν αναγνωρίζεται από τον ραβδο κωδικό του (bar code). Οι επιχειρηματικές διαδικασίες του βιβλιοπωλείου περιλαμβάνουν τις πωλήσεις, τις προμήθειες και την αποθήκευση προϊόντων. Μία από τις σημαντικότερες αποφάσεις στην επιχείρηση, αποτελεί η τιμολόγηση των προϊόντων. Η απόφαση αυτή μπορεί να υποβοηθηθεί από την ανάλυση των δεδομένων που προκύπτουν από τη διαδικασία πωλήσεων. Δεδομένα πωλήσεων λαμβάνονται εύκολα στα σημεία πώλησης. Για παράδειγμα, τα πωλούμενα προϊόντα αναγνωρίζονται με χρήση σαρωτών ραβδο κωδικών στα ταμεία, ενώ είναι δυνατή και η αναγνώριση των πελατών που έχουν προμηθευτεί μία κάρτα (η προμήθεια της κάρτας δεν είναι υποχρεωτική για τους πελάτες). Επιπλέον, την τιμολόγηση επηρεάζουν και οι διαδικασίες προμήθειας και αποθήκευσης. Δεδομένα για τις διαδικασίες αυτές λαμβάνονται κατά την παράδοση προϊόντων από τους προμηθευτές και κατά τη διαδικασία της απογραφής στις αποθήκες. Για το βιβλιοπωλείο του Παραδείγματος 3.1, έστω ότι αρχικά δίνουμε προτεραιότητα στην μοντελοποίηση της διαδικασίας των πωλήσεων. Τα 4 σχεδιαστικά βήματα συγκεκριμενοποιούνται ως ακολούθως. 1. Επιλογή της διαδικασίας που θα μοντελοποιηθεί. Δίνεται προτεραιότητα στη μοντελοποίηση της διαδικασίας πωλήσεων, γιατί είναι η πλέον κρίσιμη διαδικασία, αφού σχετίζεται άμεσα με την κερδοφορία της επιχείρησης. Μέσα από την ανάλυση των δεδομένων πωλήσεων μπορούν να προκύψουν χρήσιμα συμπεράσματα, π.χ., για την αγοραστική συμπεριφορά των πελατών, για υστερήσεις απόδοσης σε γεωγραφικές περιοχές, για τον εντοπισμό ευκαιριών εκπτώσεων, κ.λ.π. 2. Επιλογή επιπέδου λεπτομέρειας. Εφόσον μπορεί να υποστηριχθεί από το υλικό και λογισμικό, επιλέγουμε όσο το δυνατόν μεγαλύτερο επίπεδο λεπτομέρειας. Επομένως, στην εφαρμογή του βιβλιοπωλείου καταγράφουμε ξεχωριστά κάθε ατομική συναλλαγή ενός πελάτη. Η επιλογή αυτή δίνει ευχέρεια κατά την ανάλυση των δεδομένων πωλήσεων. Για παράδειγμα, μπορούμε να συγκρίνουμε τις πωλήσεις πριν και μετά τα Χριστούγεννα. Επιπλέον μπορούμε να βρούμε συσχετίσεις μεταξύ των αγορών κάθε πελάτη, για τη δημιουργία προσφορών (π.χ., με αγορά ενός προϊόντος παρέχεται έκπτωση σε ένα άλλο), ή να δούμε για πελάτες ποιών ηλικιών δεν έχουμε τις αναμενόμενες πωλήσεις. Αν επιλέγαμε μικρότερο 23

24 Μοντελοποίηση διαστάσεων επίπεδο λεπτομέρειας, π.χ., καταγράφαμε συνολικά τις ημερήσιες πωλήσεις ανά προϊόν και υποκατάστημα, τότε θα μπορούσαμε να εφαρμόσουμε μόνο την πρώτη προαναφερθείσα ανάλυση (σύγκριση πωλήσεων) αλλά όχι τις υπόλοιπες. Άρα, το μικρότερο επίπεδο λεπτομέρειας μπορεί να μειώνει τις απαιτήσεις αποθήκευσης και επεξεργασίας του μοντέλου, μειώνει όμως και τις δυνατότητες ανάλυσης. Αντίθετα, επιλέγοντας ως επίπεδο λεπτομέρειας τις ατομικές συναλλαγές, χωρίς από μόνες τους να αποτελούν αυτοσκοπό για την ανάλυση (σπάνια θα ανακτήσουμε δεδομένα για ατομικές συναλλαγές), δίνουν ευελιξία για ποικιλότροπη ανάλυση στη συνέχεια. 3. Επιλογή των πινάκων διαστάσεων. Βάσει του επιλεγμένου επιπέδου λεπτομέρειας, κάθε γραμμή στον πίνακα γεγονότων καταγράφει ένα προϊόν που πωλήθηκε σε κάποιον πελάτη σε μία συναλλαγή. Από το ερώτημα: "με ποιες πληροφορίες περιγράφουμε κάθε γραμμή του πίνακα γεγονότων", προκύπτει ότι την κάθε γραμμή μπορούμε να την περιγράψουμε με τον πελάτη που έκανε τη συναλλαγή, το κάθε προϊόν που αγόρασε κατά τη συναλλαγή του, την ημερομηνία συναλλαγής, και το υποκατάστημα στο οποίο έγινε η συναλλαγή. Επιπλέον, ως διάσταση μπορεί να θεωρηθεί και ίδια η συναλλαγή. Η συναλλαγή έχει ιδιότητες όπως η ημερομηνία και το υποκατάστημα που έγινε η συναλλαγή, ο πελάτης που την πραγματοποίησε και τα προϊόντα που αγοράστηκαν. Όμως αυτές οι ιδιότητες ήδη αντιπροσωπεύονται από πίνακες διαστάσεων. Οπότε, στο μοντέλο διαστάσεων η συναλλαγή προκύπτει να είναι εκφυλισμένος πίνακας διάστασης, δηλαδή, στον πίνακα γεγονότων διατηρούμε ένα ξένο κλειδί που αντιστοιχεί στον αριθμό συναλλαγής, αλλά δεν διατηρούμε αντίστοιχο πίνακα διάστασης για τη συναλλαγή. Ο ρόλος του αριθμού διάστασης στον πίνακα γεγονότων, είναι η ανάκτηση των προϊόντων σε κάθε ξεχωριστή συναλλαγή. 4. Επιλογή των αριθμητικών γεγονότων. Από το ερώτημα: "τι μετράμε σε κάθε γραμμή του πίνακα γεγονότων", για το παράδειγμα μας προκύπτει ότι κατάλληλα αριθμητικά γεγονότα είναι ο αριθμός των πουλημένων τεμαχίων για το προϊόν που αντιστοιχεί στη γραμμή, καθώς και το κόστος πώλησης. Εφόσον έχουμε στη διάθεση μας την τιμή πώλησης ρ κάθε προϊόντος και καταγράφουμε επίσης τον αριθμό η των τεμαχίων που πωλήθηκαν στη συναλλαγή, τότε το κόστος πώλησης σε κάθε συναλλαγή είναι παραγόμενο μέγεθος, αφού ισούται με ρ x η. Επιλέγουμε όμως το κόστος πώλησης, αν και παραγόμενο, γιατί η τιμή πώλησης δεν είναι αθροίσιμο γεγονός. Το αρχικό σχήμα αστέρα, που προκύπτει σε πρώτη φάση, μετά τα 4 σχεδιαστικά βήματα, εμφανίζεται στην Εικόνα 3.1. Στον πίνακα γεγονότων, τα ξένα κλειδιά εμφανίζονται με την ένδειξη ΞΚ, ενώ ο αριθμός συναλλαγής εμφανίζεται με την ένδειξη ΕΔ, δηλώνοντας ότι ο αντίστοιχος πίνακας διάστασης είναι εκφυλισμένος. Ως (σύνθετο) κύριο κλειδί του πίνακα γεγονότων, επιλέγουμε το συνδυασμό του αριθμού συναλλαγής και του κωδικού προϊόντος, γιατί μαζί προσδιορίζουν μονοσήμαντα κάθε γραμμή στον πίνακα γεγονότων. Το σχήμα αστέρα που προκύπτει από τη πρώτη σχεδιαστική φάση, είναι βασικό, γιατί φανερώνει ποιοι είναι οι πίνακες διαστάσεων και ο πίνακας γεγονότων, καθώς και τα αριθμητικά γεγονότα. Η ολοκλήρωση του σχήματος γίνεται κατόπιν του ορισμού των 24

25 Σχεδιασμός Αποθήκης Δεδομένων ιδιοτήτων των πινάκων διαστάσεων, ο οποίος γίνεται σε επόμενη φάση, που αναλύεται στην επόμενη ενότητα Ιδιότητες Πινάκων Διαστάσεων Ονόματα ιδιοτήτων και επιλογή κλειδιών Ξεκινάμε τον ορισμό των ιδιοτήτων στους πίνακες διαστάσεων, από τον πίνακα που αντιστοιχεί στον πελάτη. Η πρώτη ιδιότητα του πίνακα Πελάτης είναι ο κωδικός πελάτη, που είναι το κύριο κλειδί και αντιστοιχεί στον αριθμό της κάρτας του. Άλλες ιδιότητες είναι η ονομασία του, η διεύθυνση κατοικίας του, η πόλη, ο νομός, και το γεωγραφικό διαμέρισμα στα οποία εντάσσεται η κατοικία του. Επιπλέον, (εφόσον δεν παραβιάζονται προσωπικά δεδομένα), μπορούμε να έχουμε ιδιότητες όπως το φύλλο ή το έτος γεννήσεως ή το επάγγελμα κ.τ.λ. Ένα παράδειγμα στιγμιότυπου του πίνακα Πελάτης, απεικονίζεται στην Εικόνα 3.2. Εικόνα 3.1 Το αρχικό σχήμα αστέρα για την εφαρμογή βιβλιοπωλείου Εικόνα 3.2 Παράδειγμα στιγμιότυπου του πίνακα Πελάτης Βασική αρχή στη μοντελοποίηση διαστάσεων είναι, τα ονόματα των ιδιοτήτων να είναι πλήρη και περιγραφικά. Αποφεύγουμε συντμήσεις, π.χ., Κωδ_Π., ον/ία, διευθ., γιατί δυσχεραίνουν την κατανόηση του μοντέλου. Επίσης, και οι τιμές που παίρνουν οι ιδιότητες, πρέπει να είναι ευνόητες. Αποφεύγουμε κωδικοποιήσεις και συντμήσεις, όπως Α αντί Αρρεν και θ αντί θήλυ, ή ακόμα χειρότερα, 0 αντί Αρρεν και 1 αντί θήλυ. Ο λόγος είναι ότι στα αποτελέσματα OLAP πράξεων, τα οποία συνήθως συμπληρώνουν αναφορές (reports), δεν είναι επιθυμητό να εμφανίζονται τέτοιες δυσνόητες κωδικοποιήσεις. Σε έναν πίνακα διάστασης, εκτός των γραμμών με κανονικές τιμές, σε αρκετές περιπτώσεις υπάρχει ανάγκη για εισαγωγή γραμμών με ειδικές τιμές. Για παράδειγμα, όπως αναφέρεται στο Παράδειγμα 3.1, δεν είναι υποχρεωτικό κάθε πελάτης να έχει κάρτα, και επομένως να είναι καταχωρημένος σε κάποια γραμμή του πίνακα Πελάτης. Επομένως, αν ένας τέτοιος πελάτης κάνει μία συναλλαγή, στον πίνακα γεγονότων (Εικόνα 3.2) δεν είμαστε σε θέση να 25

26 Μοντελοποίηση διαστάσεων δώσουμε μία τιμή στο ξένο κλειδί Κωδικός Πελάτη. Η επιλογή να δώσουμε την τιμή NULL δεν είναι σωστή, γιατί παραβιάζεται η αναφορική ακεραιότητα. Ως λύση, εκτός όλων των υπαρχόντων πελατών, καταχωρίζουμε μία επιπλέον γραμμή, η οποία παίρνει έναν κανονικό κωδικό, αλλά σε όλες τις άλλες ιδιότητες παίρνει μία τιμή όπως "Πελάτης χωρίς κάρτα". Όταν ένας πελάτης χωρίς κάρτα κάνει μία συναλλαγή, στον πίνακα γεγονότων εισάγουμε τον κωδικό αυτής της γραμμής. Σχετικά με τον αριθμό των ιδιοτήτων, επειδή οι ιδιότητες είναι χρήσιμες πηγές πληροφορίας κατά την ανάλυση, προσθέτουμε όσο περισσότερο δυνατόν μεγάλο αριθμό ιδιοτήτων, αλλά με την προϋπόθεση ότι είναι σχετικές με την εφαρμογή. Η δημιουργία ενός αρχικού μοντέλου με λίγες ιδιότητες, και η σταδιακή επαύξηση του με επιπλέον ιδιότητες, είναι λανθασμένη πρακτική, γιατί όλες οι εγγραφές που προϋπάρχουν μίας προστιθέμενης εκ των υστέρων ιδιότητας, δεν θα έχουν τιμή για αυτήν. Ένα καλό παράδειγμα ενός "πλουσίου" πίνακα διάστασης, είναι ο πίνακας Ημερομηνία, ένα στιγμιότυπο του οποίου απεικονίζεται στην Εικόνα 3.3. Οι πλεονάζουσες ιδιότητες ημέρα, μήνας, έτος, μας δίνουν τη δυνατότητα καλύτερης ανάλυσης, π.χ., να συγκρίνουμε πωλήσεις μεταξύ Σαββάτου και Δευτέρας. Ακόμη, ιδιότητες όπως το οικονομικό έτος και η καταναλωτική περίοδος, εμπλουτίζουν το μοντέλο. Για παράδειγμα, μπορούμε να εξετάσουμε αν οι πωλήσεις κατά το διάστημα των αργιών Χριστουγέννων και Νέου Έτους είχαν σημαντική αύξηση. Επομένως, συγκριτικά με τη σχεδίαση σχεσιακών βάσεων δεδομένων, όπου οι ημερομηνίες συνήθως αναπαριστώνται με τον ενσωματωμένο τύπο DATE της SQL, στη μοντελοποίηση διαστάσεων χρησιμοποιούμε όσο το δυνατόν περισσότερες και περιγραφικές ιδιότητες. Εικόνα 3.3 Παράδειγμα στιγμιότυπου του πίνακα Ημερομηνία Ο καθορισμός ενός πίνακα διαστάσεων ολοκληρώνεται με την επιλογή της ιδιότητας που θα αποτελεί το κύριο κλειδί. Είναι προτιμότερο να επιλέγεται τεχνητό κλειδί (surrogate key), το οποίο συνήθως αντιστοιχεί σε μία ιδιότητα που επιτελεί σειριακή αρίθμηση. Για παράδειγμα, στον πίνακα Πελάτης, τεχνητό κλειδί μπορεί να αποτελεί η ιδιότητα Κωδικός Πελάτη, όπου ο πρώτος πελάτης έχει τον κωδικό 1, ο δεύτερος τον κωδικό 2, κ.ο.κ. Για αυτό το λόγο φροντίζουμε κάθε πίνακας διάστασης να έχει ένα τεχνητό κλειδί, ακόμα και αν υπάρχει ιδιότητα που αποτελεί φυσικό κλειδί (natural key). Αυτό πράξαμε και με την εισαγωγή της ιδιότητας Κωδικός Ημερομηνίας στον πίνακα Ημερομηνία, αν και η ιδιότητα Ημερομηνία χαρακτηρίζει μονοσήμαντα κάθε γραμμή αυτού του πίνακα. Το ίδιο πρέπει να πράξουμε και με τον πίνακα διάστασης Προϊόν, όπου φυσικά κλειδιά θα μπορούσε να είναι ο ραβδο κωδικός (ή ο αριθμός ISBN για τα προϊόντα που είναι βιβλία), δηλαδή, να αγνοήσουμε το φυσικό κλειδί και να χρησιμοποιήσουμε ένα τεχνητό. Οι λόγοι είναι εξής: Στα φυσικά κλειδιά αρκετές φορές ενυπάρχει κάποια "λογική". Για παράδειγμα, στον ραβδο κωδικό ενός προϊόντος, τα πρώτα ψηφία προσδιορίζουν τη χώρα προέλευσης, τα δευτέρα το είδος, κ.λπ. Επειδή στο βάθος χρόνου μίας αποθήκης δεδομένων είναι πιθανό να επέλθουν αλλαγές στη "λογική" των φυσικών κλειδιών, 26

27 Σχεδιασμός Αποθήκης Δεδομένων με τη χρήση τεχνητών αποφεύγουμε το πρόβλημα του επαναπροσδιορισμού των κλειδιών. Τα φυσικά κλειδιά απαιτούν, συνήθως, μεγαλύτερο χώρο αποθήκευσης. Για παράδειγμα, ένας ραβδο κωδικός αποτελείται από αρκετά ψηφία, τα οποία απαιτούν περισσότερα από 4 bytes για την αποθήκευση τους. Αντίθετα, ένα τεχνητό κλειδί είναι ένας ακέραιος των 4 bytes, το οποίο μπορεί να δεικτοδοτήσει περισσότερες από 4 δισεκατομμύρια γραμμές. Με τη χρήση τεχνητών κλειδιών είμαστε σε θέση να εισάγουμε σε έναν πίνακα διάστασης γραμμές με τεχνητές τιμές, όπως η περίπτωση "Πελάτης χωρίς κάρτα" που προαναφέρθηκε. Με την υιοθέτηση φυσικών κλειδιών, δεν θα είμαστε σε θέση να κάνουμε κάτι τέτοιο, γιατί δεν υπάρχει τιμή φυσικού κλειδιού που να αντιστοιχεί σε τέτοιες τεχνητές περιπτώσεις Ιεραρχίες και αποκανικοποίηση Σε έναν πίνακα διάστασης, είναι απαραίτητο να αναγνωρίζουμε αν υπάρχει τέτοια συσχέτιση μεταξύ ιδιοτήτων ώστε αυτές να αποτελούν ιεραρχία. Για παράδειγμα, ο πίνακας διάστασης Πελάτης περιέχει μία γεωγραφική ιεραρχία, η οποία αποτελείται από τις εξής ιδιότητες (από το ειδικότερο στο γενικότερο): διεύθυνση κατοικίας, πόλη, νομός, διαμέρισμα. Μπορούμε να εφαρμόσουμε τις OLAP πράξεις roll up/drill down για να αναλύσουμε τις πωλήσεις ως προς διάφορα επίπεδα αυτής της γεωγραφικής ιεραρχίας, π.χ., να κάνουμε roll up από το επίπεδο πόλης στο επίπεδο νομού. Εκτός των ιδιοτήτων που ανήκουν στην ιεραρχία, υπάρχουν και άλλες, όπως το φύλο, οι οποίες δεν είναι μέρος κάποιας ιεραρχίας. Δηλαδή, δεν είναι υποχρεωτικό όλες οι ιδιότητες να ανήκουν σε μία ιεραρχία. Επίσης, σε έναν πίνακα διάστασης είναι επιτρεπτό, εφόσον έχει νόημα, να ορίζουμε περισσότερες της μίας ιεραρχίες. Η ύπαρξη ιεραρχίας μπορεί να δηλώνει συναρτησιακές εξαρτήσεις. Για παράδειγμα, στον πίνακα Πελάτης παρατηρούμε ότι επαναλαμβάνεται το όνομα νομού για μία πόλη, ενώ θα μπορούσαμε να δημιουργήσουμε ένα ξεχωριστό πίνακα για τους νομούς, και στον πίνακα Πελάτης, αντί του ονόματος νομού να έχουμε το ξένο κλειδί προς τον πίνακα με τους νομούς. Για τα δεδομένα της χώρας μας, ένας αριθμός ενός byte αρκεί για να αποτελέσει το κλειδί του πίνακα νομός, οπότε θα έχουμε εξοικονόμηση χώρου, αφού αντί για το πλήρες όνομα του νομού, αποθηκεύουμε έναν αριθμό ενός byte. To ίδιο μπορούμε να επαναλάβουμε και για τη σχέση μεταξύ νομού και διαμερίσματος αλλά και για τη σχέση μεταξύ διεύθυνσης και πόλης. Σε αυτήν την περίπτωση, ο πίνακας έρχεται στην τρίτη κανονική μορφή και θα μοιάζει όπως στην Εικόνα 3.4. Ένας πίνακας διάστασης που έρχεται σε τρίτη κανονική μορφή λέμε όχι έχει το σχήμα χιονονιφάδας (snowflake). Εικόνα 3.4 Το σχήμα χιονονιφάδας 27

28 Μοντελοποίηση διαστάσεων Θα πρέπει να αποφεύγεται η επιβολή τρίτης κανονικής μορφής σε πίνακες διαστάσεων και η δημιουργία χιονονιφάδων. Οι λόγοι είναι οι εξής: Η απλότητα του σχήματος αστέρα καταργείται όταν δημιουργούνται χιονονιφάδες. Η απλότητα εγγυάται την κατανόηση και την ευκολία χρήσης του μοντέλου. Επομένως, η κατάργηση της απλότητας δυσχεραίνει την χρήση του μοντέλου από ανθρώπους που δεν κατανοούν την ανάγκη της τρίτης κανονικής μορφής. Ο χρόνος εκτέλεσης OLAP πράξεων αυξάνεται σημαντικά, καθώς μεγαλώνει ο αριθμός των πράξεων σύνδεσης (joins) μεταξύ των πινάκων της χιονονιφάδας. Αντίθετα, όταν δεν εφαρμόζουμε την τρίτη κανονική μορφή, με τη χρήση τεχνικών δεικτοδότησης όπως οι κατάλογοι bitmap μπορούμε να πετύχουμε μείωση του χρόνου εκτέλεσης OLAP πράξεων. Ένας βασικός λόγος εφαρμογής της τρίτης κανονικής μορφής, είναι η εξοικονόμηση χώρου. Στην περίπτωση της μοντελοποίησης διαστάσεων, αυτό το πλεονέκτημα είναι ισχνό. Στο παράδειγμα της χιονονιφάδας στην Εικόνα 3.4, αν έχουμε μερικούς χιλιάδες πελάτες, τότε με την αποθήκευση κωδικών λίγων byte αντί αλφαριθμητικών των, π.χ, 100 bytes, μπορούμε να εξοικονομήσουμε, μερικά MB χώρου. Σε μεγάλες αποθήκες δεδομένων, όμως, ο πίνακας γεγονότων είναι της τάξης των GB. Επομένως, η εξοικονόμηση χώρου μέσω της τρίτης κανονικής μορφής είναι ασήμαντη. Ένας άλλος λόγος εφαρμογής της τρίτης κανονικής μορφής, είναι η ευκολία κατά τη μεταβολή στοιχείων. Στις αποθήκες δεδομένων, όπως έχει αναφερθεί, οι μεταβολές στοιχείων δεν συμβαίνουν με το ρυθμό που συμβαίνουν σε μία σχεσιακή βάση. Επομένως, η τρίτη κανονική μορφή δεν επιφέρει κάποιο πλεονέκτημα σε αυτήν την περίπτωση. Συνοψίζοντας, στους πίνακες διαστάσεων δεν πρέπει να επιβάλουμε την τρίτη κανονική μορφή. Όπως συνηθίζεται να λέγεται, τους αφήνουμε απο κανονικοποιημένους (denormalized). Ο λόγος είναι ότι διαφορετικά, βλάπτουμε την απλότητα του μοντέλου χωρίς να επιφέρουμε κάποιο πλεονέκτημα. Φυσικά, υπάρχουν κάποιες εξαιρέσεις σε αυτόν τον κανόνα. Επομένως, πρέπει να αντιστεκόμαστε στην επιβολή της τρίτης κανονικής μορφής, εκτός αν είναι απολύτως αναγκαία Οι Τρεις Τύποι Πινάκων Γεγονότων Υπάρχουν τρεις βασικοί τύποι πινάκων γεγονότων. Στο Κεφάλαιο 3.1 έχουμε συναντήσει πίνακα γεγονότων συναλλαγών (transaction fact table). Στη συνέχεια θα παρουσιάσουμε άλλους δυο τύπους πινάκων γεγονότων, οι οποίοι ονομάζονται περιοδικής φωτογράφησης (periodic snapshot fact table) και συναθροιστικής φωτογράφησης (accumulating snapshot fact table). Στη συνέχεια αυτής της ενότητας, πρώτα αναλύουμε τους τρεις αυτούς τύπους και μετά τους συγκρίνουμε. Για την παρουσίαση των τριών τύπων, βασιζόμαστε στο ακόλουθο παράδειγμα εφαρμογής. Παράδειγμα 3.2 (Απογραφή Βιβλιοπωλείου) Για το βιβλιοπωλείο του Παραδείγματος 3.1, θέλουμε να σχεδιάσουμε ένα μοντέλο διαστάσεων για τη διαδικασία της απογραφής. Μέσω της απογραφής, θέλουμε να γνωρίζουμε τη διαθέσιμη ποσότητα (σε τεμάχια) κάθε προϊόντος στην αποθήκη κάθε υποκαταστήματος. Η γνώση αυτή βοηθά στην αποφυγή 28

29 Σχεδιασμός Αποθήκης Δεδομένων περιπτώσεων όπου η αγορά προϊόντων δεν είναι δυνατή επειδή δεν υπάρχει ικανός διαθέσιμος αριθμός τους (out of stocks) Πίνακες γεγονότων συναλλαγών Ένας πίνακας γεγονότων συναλλαγών αναπαριστά γεγονότα που συμβαίνουν σε κάποιες χρονικές στιγμές. Για παράδειγμα, στο Κεφάλαιο 3.1 σχεδιάσαμε έναν πίνακα γεγονότων συναλλαγών για την καταγραφή πωλήσεων αντικειμένων. Ας εξετάσουμε τη χρήση ενός πίνακα γεγονότων συναλλαγών για το Παράδειγμα Πιο συγκεκριμένα, ο αριθμός διαθέσιμων τεμαχίων ενός προϊόντος στην αποθήκη ενός υποκαταστήματος, μπορεί να επηρεαστεί από συναλλαγές διαφόρων τύπων, όπως η προμήθεια νέων τεμαχίων (αύξηση αριθμού), η επιστροφή ελαττωματικών τεμαχίων στον προμηθευτή (μείωση αριθμού), η προώθηση τεμαχίων προς πώληση, από την αποθήκη στο υποκατάστημα (μείωση αριθμού), επιστροφή τεμαχίων από πελάτη (αύξηση αριθμού), κ.α. Ακολουθούμε τα 4 βήματα για το σχεδιασμό του μοντέλου: (1) Η διαδικασία που θα μοντελοποιηθεί είναι η απογραφή. (2) Ως επίπεδο λεπτομέρειας, επιλέγουμε την καταγραφή κάθε συναλλαγής που επιφέρει μεταβολή στον αριθμό τεμαχίων ενός προϊόντος στην αποθήκη ενός υποκαταστήματος. (3) Οι πίνακες διαστάσεων που περιγράφουν κάθε γραμμή στον πίνακα γεγονότων είναι: ο τύπος της συναλλαγής, το προϊόν που σχετίζεται με τη συναλλαγή, η ημερομηνία συναλλαγής, και η αποθήκη του υποκαταστήματος που γίνεται η συναλλαγή. (4) Βασικό αριθμητικό μέτρο είναι η μεταβολή στον αριθμό τεμαχίων που επιφέρει η συναλλαγή (η μεταβολή μπορεί να είναι θετικός ή αρνητικός αριθμός). Το προκύπτον μοντέλο απεικονίζεται στην Εικόνα 3.5. Οι πίνακες Ημερομηνία και Προϊόν είναι οι ίδιοι με τους εμφανιζόμενους στην Εικόνα 3.1. Ο πίνακας Αποθήκη Υποκαταστήματος είναι παρόμοιος με τον πίνακα Υποκατάστημα του ιδίου κεφαλαίου, με τη διαφορά ότι περιλαμβάνει επιπλέον ιδιότητες, όπως το εμβαδόν της αποθήκης, κ.λπ. Ο πίνακας διάστασης Τύπος Συναλλαγής, που δεν έχει αναφερθεί μέχρι στιγμής, περιέχει ιδιότητες που περιγράφουν τη συναλλαγή, όπως τον κωδικό της και τη λεκτική περιγραφή της. Εικόνα 3.5 Παράδειγμα μοντέλου με πίνακα γεγονότων συναλλαγών Το μοντέλο της Εικόνας 3.5 είναι χρήσιμο για την απάντηση ερωτήσεων που σχετίζονται με τον αριθμό, τη συχνότητα, ή τη χρονική περίοδο που συμβαίνουν διάφοροι τύποι συναλλαγών. Για παράδειγμα, η εύρεση του αριθμού των επιστροφών ελαττωματικών προϊόντων, της συχνότητας προμήθειας συγκεκριμένου προϊόντος, ή των χρονικών περιόδων που σημειώθηκαν οι περισσότερες επιστροφές από πελάτες. 29

30 Μοντελοποίηση διαστάσεων Παρά ταύτα, η πιο βασική λειτουργία στη διαδικασία της απογραφής, είναι η εύρεση σε μία δεδομένη στιγμή του αριθμού των διαθέσιμων τεμαχίων για κάθε προϊόν, σε κάθε αποθήκη υποκαταστήματος. Μέσω του μοντέλου της Εικόνας 3.5 είναι θεωρητικά δυνατή η εύρεση του διαθέσιμου αριθμού τεμαχίων για ένα προϊόν σε μία χρονική στιγμή, με κατάλληλη προσθαφαίρεση όλων των μεταβολών του διαθέσιμου αριθμού τεμαχίων του προϊόντος, από την αρχή μέχρι τη δεδομένη χρονική στιγμή. Ο τρόπος αυτός, όμως, δεν είναι καθόλου πρακτικός, γιατί απαιτεί μεγάλο πλήθος υπολογισμών. Για την εξυπηρέτηση αυτής της βασικής λειτουργίας, στη συνέχεια εξετάζουμε τον επόμενο τύπο πίνακα γεγονότων Πίνακες γεγονότων περιοδικής φωτογράφισης Ένας πίνακας γεγονότων περιοδικής φωτογράφησης αναπαριστά τη μέτρηση ενός μεγέθους κατά περιοδικά χρονικά διαστήματα. Ενώ στους πίνακες γεγονότων συναλλαγών καταγράφουμε ένα γεγονός όταν αυτό συμβαίνει, στους πίνακες γεγονότων περιοδικής φωτογράφησης καταγράφουμε, στο τέλος της δεδομένης χρονικής περιόδου το αποτέλεσμα της αντίστοιχης μέτρησης. Αυτή η διαδικασία μοιάζει με την περιοδική λήψη φωτογραφίας, από όπου και το όνομα του τύπου αυτών των πινάκων. Ας εξετάσουμε τη χρήση ενός πίνακα γεγονότων περιοδικής φωτογράφησης για το Παράδειγμα 3.2. Ακολουθούμε τα 4 βήματα για το σχεδιασμό του μοντέλου: (1) Η διαδικασία που θα μοντελοποιηθεί είναι η απογραφή. (2) Ως επίπεδο λεπτομέρειας, επιλέγουμε την ημερήσια καταγραφή του διαθέσιμου αριθμού τεμαχίων για κάθε προϊόν στην αποθήκη καθενός υποκαταστήματος. (3) Οι πίνακες διαστάσεων που περιγράφουν κάθε γραμμή στον πίνακα γεγονότων είναι: το προϊόν για το οποίο μετράμε τα διαθέσιμα τεμάχια, η ημερομηνία λήψης της μέτρησης ("φωτογραφίας"), και η αποθήκη του αντίστοιχου υποκαταστήματος. (4) Βασικό αριθμητικό μέτρο είναι ο αριθμός διαθέσιμων τεμαχίων του αντίστοιχου προϊόντος τη στιγμή της μέτρησης. Προκύπτει το μοντέλο που απεικονίζεται στην Εικόνα 3.6. Εικόνα 3.6 Παράδειγμα μοντέλου με πίνακα γεγονότων περιοδικής φωτογράφησης Σε αντίθεση με τον πίνακα γεγονότων συναλλαγών, με τον πίνακα γεγονότων περιοδικής φωτογράφησης μπορούμε να βρίσκουμε εύκολα κάθε ημέρα, τον αριθμό των διαθέσιμων τεμαχίων για κάθε προϊόν, σε κάθε αποθήκη υποκαταστήματος. Αυτό, όμως, συνεπάγεται πολύ μεγαλύτερες απαιτήσεις σε αποθηκευτικό χώρο. Ενώ σε έναν πίνακα συναλλαγών έχουμε καταγραφές μόνο για τα προϊόντα που μεταβάλλεται ο αριθμός των τεμαχίων τους, σε έναν πίνακα περιοδικής φωτογράφησης καταγράφουμε κάθε μέρα τον αριθμό τεμαχίων όλων των προϊόντων ανά υποκατάστημα, ασχέτως του αν ο αριθμός αυτός έχει μεταβληθεί σε σχέση με την προηγουμένη καταγραφή. Για το βιβλιοπωλείο του Παραδείγματος 3.1, 30

31 Σχεδιασμός Αποθήκης Δεδομένων καταγράφουμε κάθε ημέρα τον αριθμό τεμαχίων προϊόντων σε 20 υποκαταστήματα. Αν υποθέσουμε ότι κάθε ιδιότητα στον πίνακα γεγονότων στην Εικόνα 3.6 είναι ένας ακέραιος των 4 bytes, τότε καθημερινά χρειαζόμαστε 6.1 MB. Η καταγραφή μετρήσεων για τα προϊόντα που δεν έχει μεταβληθεί ο αριθμός τεμαχίων τους, εκτός από περισσότερο αποθηκευτικό χώρο απαιτεί και ειδικό χειρισμό για τη συνάρτηση συνάθροισης που θα χρησιμοποιηθεί σε αυτόν τον τύπο πίνακα γεγονότων. Ο λόγος είναι ότι ενώ έχει νόημα η άθροιση των μετρήσιμων ημερήσιων τεμαχίων ανά προϊόν και ανά υποκατάστημα, δεν έχει νόημα η άθροιση τους ως προς το χρόνο. Για παράδειγμα, έστω ένα προϊόν που τη Δευτέρα σε ένα υποκατάστημα έχει διαθέσιμο αριθμό τεμαχίων ίσο με 15. Την Τρίτη δεν έχουμε κάποια μεταβολή, ενώ την Τετάρτη έχουμε μείωση του αριθμού κατά 10, άρα την Πέμπτη έχουμε 5 διαθέσιμα τεμάχια. Για το διάστημα από Δευτέρα έως Τετάρτη, δεν είναι σωστό να πούμε ότι έχουμε συνολικά = 35 τεμάχια του προϊόντος. Επομένως, για της Ημερομηνία, δεν έχει νόημα η άθροιση του αριθμητικού γεγονότος στον πίνακα περιοδικής φωτογράφησης. Τα αριθμητικά γεγονότα που δεν είναι αθροίσιμα ως προς όλους τους πίνακες διαστάσεων ενός μοντέλου, τα ονομάζουμε ημιαθροίσιμα αριθμητικά γεγονότα. Για τα ημιαθροίσιμα αριθμητικά γεγονότα χρησιμοποιούμε το μέσο όρο ως προς τον πίνακα διάστασης που δεν είναι συμβατός με την άθροιση Πίνακες γεγονότων συσσωρευτικής φωτογράφησης Ένας πίνακας γεγονότων συσσωρευτικής φωτογράφησης αναπαριστά τον πλήρη κύκλο ζωής ενός αντικειμένου ή μίας συναλλαγής. Ο κύκλος ζωής καθορίζεται από βασικές φάσεις. Σε ένα πίνακα γεγονότων συσσωρευτικής φωτογράφησης καταγράφουμε τις ημερομηνίες που συμβαίνουν οι βασικές φάσεις. Ειδικότερες φάσεις, οι οποίες δεν συμβαίνουν συχνά, είναι προτιμότερο να μην αναπαριστώνται με πίνακα γεγονότων συσσωρευτικής φωτογράφησης, αλλά να τις συναντούμε σε έναν πίνακα γεγονότων συναλλαγών. Στο Παράδειγμα 3.2, οι βασικές φάσεις που καθορίζουμε για ένα προϊόν εντός της αποθήκης ενός υποκαταστήματος, είναι οι εξής: παραλαβή από προμηθευτή, έλεγχος, τοποθέτηση στην αποθήκη, έγκριση για πώληση, και, τέλος, προώθηση προς πώληση στο υποκατάστημα. Για τη χρήση πίνακα γεγονότων συσσωρευτικής φωτογράφησης, ακολουθούμε τα 4 βήματα για το σχεδιασμό του μοντέλου: (1) Η διαδικασία που θα μοντελοποιηθεί είναι η απογραφή. (2) Ως επίπεδο λεπτομέρειας, επιλέγουμε την η καταγραφή των φάσεων που διέρχεται κάθε προϊόν στην αποθήκη κάθε υποκαταστήματος. (3) Οι πίνακες διαστάσεων που περιγράφουν κάθε γραμμή στον πίνακα γεγονότων είναι: οι ημερομηνίες που συμβαίνει κάθε φάση, το προϊόν για το οποίο μετράμε τα διαθέσιμα τεμάχια, και η αποθήκη του αντίστοιχου υποκαταστήματος. (4) Τα αριθμητικά γεγονότα είναι ο αριθμός των τεμαχίων που εμπλέκονται σε κάθε φάση. Προκύπτει το μοντέλο που απεικονίζεται στην Εικόνα

32 Μοντελοποίηση διαστάσεων Εικόνα 3.7 Παράδειγμα μοντέλου με πίνακα γεγονότων συσσωρευτικής φωτογράφησης Εφόσον για ένα προϊόν σε ένα υποκατάστημα, δεν είναι εξ αρχής γνωστές όλες οι ημερομηνίες που θα συμβούν οι διάφορες φάσεις, κάθε πίνακας διάστασης ημερομηνίας έχει και μία γραμμή που δηλώνει ότι "Η ημερομηνία θα καθοριστεί". Αυτό σημαίνει ότι κάθε γραμμή του πίνακα γεγονότων την τροποποιούμε καθώς συμβαίνουν οι διάφορες φάσεις, κάτι που δεν συνέβαινε σε κανέναν από τους άλλους τύπους πινάκων γεγονότων που εξετάσαμε έως τώρα. Ένας πίνακας γεγονότων συσσωρευτικής φωτογράφησης είναι ιδιαίτερα χρήσιμος για τη μέτρηση του ρυθμού μετάβασης των αντικειμένων στις διάφορες φάσεις. Μπορούμε να μετρήσουμε την αριθμητική διαφορά μεταξύ των ημερομηνιών των διαδοχικών φάσεων και να εντοπίσουμε, π.χ., για ποια προϊόντα υπάρχουν καθυστερήσεις κατά τον έλεγχο, ή αν η έγκριση καθυστερεί σε κάποια υποκαταστήματα. Η αριθμητική διαφορά μεταξύ των ημερομηνιών είναι αθροίσιμο μέγεθος ως προς όλες τις διαστάσεις, κάτι που βοηθά στην ανάλυση Σύγκριση των τριών τύπων πινάκων γεγονότων Οι τρεις τύποι πινάκων γεγονότων παρουσιάζουν διαφορετικά χαρακτηριστικά, τα οποία συνοψίζονται στον Πίνακα 3.1. Οι πίνακες γεγονότων συναλλαγών είναι οι περισσότερο αναλυτικοί, αφού καταγράφουν οποιαδήποτε πραγματοποιηθείσα συναλλαγή. Οι πίνακες γεγονότων συσσωρευτικής φωτογράφησης έχουν μεσαίο επίπεδο καταγραφής, επειδή καταγράφουν τις βασικές φάσεις από τις οποίες διέρχονται οι συναλλαγές (οι φάσεις που εμφανίζονται σπάνια αποθηκεύονται μόνο σε πίνακες γεγονότων συναλλαγών). Τη χαμηλότερη ανάλυση καταγραφής έχουν οι πίνακες περιοδικής φωτογράφησης, στους οποίους καταγράφονται μόνο μετρήσεις ανά περιοδικά χρονικά διαστήματα, χωρίς να γνωρίζουμε τις συναλλαγές που οδήγησαν στα αποτελέσματα των μετρήσεων. Η φύση του κάθε τύπου οδηγεί σε διαφορετικούς αριθμούς πινάκων διαστάσεων και γεγονότων, καθώς και στην ύπαρξη ιδιαιτεροτήτων όπως η ύπαρξη ημιαθροίσιμων γεγονότων ή η ανάγκη για ενημέρωση του πίνακα γεγονότων. Παρά τις διαφορές μεταξύ των 3 τύπων πινάκων γεγονότων, κανένας τους δεν μπορεί να αντικαταστήσει τους υπολοίπους. Αντιθέτως, οι 3 τύποι δρουν συμπληρωματικά. Επομένως, σε πολλές εφαρμογές είναι χρήσιμο να έχουμε 2 από τους τύπους ή ακόμη και τους 3. Για παράδειγμα, σε μία εφαρμογή απογραφής μπορούμε να έχουμε έναν πίνακα γεγονότων περιοδικής φωτογράφησης, όπου κάθε μήνα στο παρελθόν έχουμε καταγράψει αριθμούς τεμαχίων, ενώ για το τρέχοντα μήνα καταγράφουμε σε έναν πίνακα γεγονότων 32

33 Σχεδιασμός Αποθήκης Δεδομένων συσσωρευτικής φωτογράφησης τις φάσεις στις οποίες διέρχονται οι συναλλαγές αυτόν το μήνα. Στο τέλος του τρέχοντος μηνός, οι υπάρχοντες αριθμοί τεμαχίων που προκύπτουν από το συσσωρευτικό πίνακα θα αποτελέσουν την επόμενη καταγραφή (σε μία γραμμή) του περιοδικού πίνακα, και θα ξεκινήσουμε ένα νέο συσσωρευτικό πίνακα για το νέο μήνα. Ως άλλο παράδειγμα, ένας πίνακας γεγονότων συναλλαγών δρα συμπληρωματικά με έναν πίνακα γεγονότων περιοδικής φωτογράφησης, επειδή ο πρώτος καταγράφει λεπτομέρειες σχετικές με κάθε ατομική συναλλαγή, ενώ ο δεύτερος καθιστά εύκολη την ανάκτηση μετρήσιμων μεγεθών ανά τακτά χρονικά διαστήματα. Αρα, αν και θεωρητικά υπάρχει πλεονασμός όταν διατηρούμε ταυτόχρονα περισσότερους από έναν τύπους πινάκων γεγονότων, κάθε ένας τους επιτελεί διαφορετικές λειτουργίες και στο σύνολο τους παρέχουν πληρέστερη πληροφορία. Χαρακτηριστικό Τύπος πίνακα γεγονότων Συναλλαγών Περιοδικής Φωτογράφησης Συσσωρευτικής Φωτογράφησης Αντικείμενο καταγραφής Συναλλαγές σε χρονικές στιγμές Μέτρηση κατά περιοδικά διαστήματα Κύκλος ζωής αντικειμένων Ανάλυση καταγραφής Υψηλή Χαμηλή Μεσαία Επίπεδο λεπτομέρειας 1 γραμμή ανά συναλλαγή 1 γραμμή ανά περίοδο 1 γραμμή ανά κύκλο ζωής Αριθμός πινάκων διαστάσεων Μεσαίος Χαμηλός Υψηλός Αριθμός γεγονότων Χαμηλός Μεσαίος Υψηλός Ημιαθροίσιμα γεγονότα Όχι Ναί Όχι Ανάγκη ενημέρωσης Όχι Όχι Ναι Πίνακας 3.1 Χαρακτηριστικά των 3 τύπων πινάκων γεγονότων 33

34 Το πρόβλημα 4 Υλοποίηση 4.1 Το πρόβλημα Η γραμματεία του Τμήματος Πληροφορικής της Σχολής Θετικών Επιστημών του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης διατηρεί (όπως και οι γραμματείες όλων των τμημάτων) μία επιχειρησιακή βάση δεδομένων στην οποία καταγράφονται τα στοιχεία που αφορούν τους φοιτητές του τμήματος, τους καθηγητές, τα μαθήματα κ.ο.κ. Σε αυτή τη βάση δεδομένων περιέχονται όλα τα αναγκαία δεδομένα για την ορθή λειτουργία της γραμματείας, όπως για παράδειγμα τα ονόματα των φοιτητών, οι αριθμοί μητρώου (ΑΜ) τους, τα ονόματα των καθηγητών, τα ονόματα των μαθημάτων, οι βαθμολογίες των φοιτητών στα μαθήματα κ.ο.κ. Ένα βασικό μειονέκτημα που παρουσιάζει αυτή η επιχειρησιακή βάση δεδομένων είναι το γεγονός της απουσίας καταγραφής ιστορικών δεδομένων. Κάθε χρονική στιγμή δηλαδή η βάση δεδομένων περιγράφει την τρέχουσα κατάσταση των στοιχείων του τμήματος. Αυτό σημαίνει πως κατά την εκτέλεση μίας λειτουργίας ενημέρωσης ή διαγραφής, η προηγούμενη πληροφορία χάνεται ολοκληρωτικά, δεν υπάρχει κανένας τρόπος να γίνει επανάκτησή της. Η λειτουργικότητα αυτής της βάσης δεδομένων μπορεί να παρομοιαστεί με τη λειτουργικότητα μίας βάσης δεδομένων μίας τράπεζας όπου καταγράφεται η τρέχουσα κατάσταση των πελατών της ή μίας βάσης δεδομένων ενός ηλεκτρονικού συστήματος κράτησης θέσεων όπου καταγράφεται ο τρέχον αριθμός ελεύθερων θέσεων για μία πτήση κ.ο.κ. Λαμβάνοντας υπόψη τα παραπάνω στοιχεία σε συνδυασμό με το γεγονός πως επιθυμητή είναι η καταγραφή όσο το δυνατόν περισσότερης πληροφορίας (το ολοένα και μικρότερο κόστος αποθήκευσης συμβάλλει σε αυτό) έτσι ώστε να είναι καλύτερη και πληρέστερη η ανάλυση των δεδομένων του τμήματος, γίνεται σαφής η ανάγκη ανάπτυξης μίας αποθήκης δεδομένων (data warehouse), η οποία θα αποτελεί μία ολοκληρωμένη πλατφόρμα για αποδοτική ανάλυση των ιστορικών δεδομένων του τμήματος. Η ανάλυση αυτή επιτυγχάνεται με τη διαδικασία της ανάλυσης OLAP (On line Analytical Processing), περιγραφή της οποίας έχει πραγματοποιηθεί σε προηγούμενο κεφάλαιο. Η ανάλυση αυτή μπορεί να οδηγήσει σε πολύ χρήσιμα και ενδιαφέροντα συμπεράσματα τα οποία να χρησιμοποιηθούν στη συνέχεια για την υποστήριξη κατά τη λήψη αποφάσεων, με παρόμοιο τρόπο με τον οποίο μπορεί να χρησιμοποιηθεί η γνώση σχετικά με τις πωλήσεις ενός καταστήματος για αύξηση του συνολικού κέρδους. 4.2 Προετοιμασία των δεδομένων Κατά το στάδιο της προετοιμασίας των δεδομένων, αρχικά εξάγονται τα δεδομένα από την επιχειρησιακή βάση δεδομένων, στη συνέχεια και αφού γίνουν κάποιοι απαραίτητοι μετασχηματισμοί εισάγονται σε μία ενδιάμεση βάση δεδομένων η οποία και αποτελεί την περιοχή προετοιμασίας των δεδομένων που οδηγεί στην ανάπτυξη της αποθήκης δεδομένων, και τελικά φορτώνονται στην αποθήκη δεδομένων. Μπορεί εύκολα να 34

35 Υλοποίηση παρατηρηθεί ότι το σχήμα που ακολουθούν αυτές οι διαδικασίες ακολουθεί το σχήμα ETL (Εξαγωγή Μετασχηματισμός Φόρτωση, Extract Transform Load) για το οποίο έγινε λόγος σε προηγούμενο κεφάλαιο Εξαγωγή των δεδομένων από την επιχειρησιακή βάση δεδομένων Τα δεδομένα εξάγονται από την επιχειρησιακή βάση δεδομένων της γραμματείας σε ένα αρχείο MS Excel, το οποίο και χρησιμοποιείται στη συνέχεια για την εισαγωγή των δεδομένων στην ενδιάμεση βάση δεδομένων. Ακολουθεί αναλυτική περιγραφή του σχήματος που θα πρέπει να ακολουθείται στο αρχείο Excel, έτσι ώστε να είναι δυνατή η ορθή εισαγωγή των δεδομένων. Το αρχείο Excel πρέπει να περιέχει έξι (6) φύλλα εργασίας με τα ακόλουθα ονόματα: ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ: περιέχονται δεδομένα που αφορούν τα προγράμματα σπουδών. ΚΑΤΕΥΘΥΝΣΗ: περιέχονται δεδομένα που αφορούν τις κατευθύνσεις. ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ: περιέχονται δεδομένα που αφορούν τις σχέσεις μεταξύ των κατευθύνσεων και των μαθημάτων. ΜΑΘΗΜΑ: περιέχονται δεδομένα που αφορούν τα μαθήματα. ΒΑΘΜΟΣ: περιέχονται δεδομένα που αφορούν τις βαθμολογίες των φοιτητών στα μαθήματα. ΦΟΙΤΗΤΗΣ: περιέχονται δεδομένα που αφορούν του φοιτητές. Στην πρώτη γραμμή κάθε φύλλου εργασίας πρέπει να αναγράφονται τα ονόματα των ιδιοτήτων των στηλών. Ακολουθεί αναλυτική περιγραφή αυτών των ιδιοτήτων για κάθε φύλλο εργασίας Πρόγραμμα σπουδών Στην Εικόνα 4.1 εμφανίζεται η μορφή που πρέπει να ακολουθεί το φύλλο εργασίας ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ. Συνιστάται η αποφυγή εισαγωγής κενών τιμών σε κελιά στο τέλος των δεδομένων του φύλλου εργασίας. Να σημειωθεί πως στο φύλλο εργασίας πρέπει να περιέχεται το σύνολο των προγραμμάτων σπουδών. Εικόνα 4.1 Φύλλο εργασίας ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ Στον Πίνακα 4.1 παρουσιάζονται αναλυτικά οι ιδιότητες ενός προγράμματος σπουδών. Στήλη Περιγραφή Κωδικός_Σπουδών Ο κωδικός του προγράμματος σπουδών Όνομα Το όνομα του προγράμματος σπουδών Πίνακας 4.1 Στήλες του φύλλου εργασίας ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ 35

36 Προετοιμασία των δεδομένων Κατεύθυνση Στην Εικόνα 4.2 εμφανίζεται η μορφή που πρέπει να ακολουθεί το φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ. Συνιστάται η αποφυγή εισαγωγής κενών τιμών σε κελιά στο τέλος των δεδομένων του φύλλου εργασίας. Να σημειωθεί πως στο φύλλο εργασίας πρέπει να περιέχεται το σύνολο των κατευθύνσεων. Εικόνα 4.2 Φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ Στον Πίνακα 4.2 παρουσιάζονται αναλυτικά οι ιδιότητες μίας κατεύθυνσης. Στήλη Περιγραφή Κωδικός_Κατεύθυνση Ο κωδικός της κατεύθυνσης Όνομα Το όνομα της κατεύθυνσης Κωδικός_Σπουδών Ο κωδικός του προγράμματος σπουδών στο οποίο ανήκει η κατεύθυνση Πίνακας 4.2 Στήλες του φύλλου εργασίας ΚΑΤΕΥΘΥΝΣΗ Κατεύθυνση Μάθημα Στην Εικόνα 4.3 εμφανίζεται η μορφή που πρέπει να ακολουθεί το φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ. Συνιστάται η αποφυγή εισαγωγής κενών τιμών σε κελιά στο τέλος των δεδομένων του φύλλου εργασίας. Τα κελιά της στήλης Κωδικός_Μάθημα πρέπει απαραίτητα να είναι τύπου κειμένου (text), να έχουν δηλαδή στην αρχή μία απόστροφο, π.χ. αντί ένα κελί να έχει την τιμή «56 1» πρέπει να έχει την τιμή «56 1». Να σημειωθεί πως στο φύλλο εργασίας πρέπει να περιέχεται το σύνολο των σχέσεων μεταξύ των κατευθύνσεων και των μαθημάτων. 36

37 Υλοποίηση Εικόνα 4.3 Φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ Στον Πίνακα 4.3 παρουσιάζονται αναλυτικά οι ιδιότητες μίας σχέσης κατεύθυνσης μαθήματος. Στήλη Περιγραφή Κωδικός_Κατεύθυνση Ο κωδικός της κατεύθυνσης Κωδικός_Μάθημα Ο κωδικός του μαθήματος Εξάμηνο Το εξάμηνο του μαθήματος Τύπος Ο τύπος του μαθήματος Πίνακας 4.3 Στήλες του φύλλου εργασίας ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ Μάθημα Στην Εικόνα 4.4 εμφανίζεται η μορφή που πρέπει να ακολουθεί το φύλλο εργασίας ΜΑΘΗΜΑ. Συνιστάται η αποφυγή εισαγωγής κενών τιμών σε κελιά στο τέλος των δεδομένων του φύλλου εργασίας. Να σημειωθεί πως στο φύλλο εργασίας πρέπει να περιέχεται το σύνολο των μαθημάτων. Εικόνα 4.4 Φύλλο εργασίας ΜΑΘΗΜΑ 37

38 Προετοιμασία των δεδομένων Στον Πίνακα 4.4 παρουσιάζονται αναλυτικά οι ιδιότητες ενός μαθήματος. Στήλη Περιγραφή ΔΜ Οι διδακτικές μονάδες του μαθήματος ECTS Οι μονάδες ECTS του μαθήματος Συντελεστής Ο συντελεστής του μαθήματος στον υπολογισμό της βαθμολογίας Τύπος Ο τύπος του μαθήματος Κωδικός_Μάθημα Ο κωδικός του μαθήματος Όνομα Το όνομα του μαθήματος Ενεργό Ένδειξη του αν το μάθημα είναι ενεργό ή όχι Πίνακας 4.4 Στήλες του φύλλου εργασίας ΜΑΘΗΜΑ Βαθμός Στην Εικόνα 4.5 εμφανίζεται ένα μέρος της μορφής που πρέπει να ακολουθεί το φύλλο εργασίας ΒΑΘΜΟΣ. Συνιστάται η αποφυγή εισαγωγής κενών τιμών σε κελιά στο τέλος των δεδομένων του φύλλου εργασίας. Στα κενά κελιά των στηλών Ακαδημαϊκό_Έτος_Βαθμολογίας και Περίοδος_Βαθμολογίας πρέπει να τοποθετηθεί το κείμενο «Δεν υπάρχει». Αυτό μπορεί να γίνει εύκολα με την επιλογή Edit > Replace αφού πρώτα επιλεχθούν οι δύο αυτές στήλες. Να σημειωθεί πως στο φύλλο εργασίας δεν είναι απαραίτητο να περιέχεται το σύνολο των βαθμολογιών, αρκούν οι νέες βαθμολογίες. Εικόνα 4.5 Φύλλο εργασίας ΒΑΘΜΟΣ Στον Πίνακα 4.5 παρουσιάζονται αναλυτικά οι ιδιότητες μίας βαθμολογίας. Στήλη Περιγραφή ΑΜ Ο αριθμός μητρώου (ΑΜ) του φοιτητή Κατάσταση Η κατάσταση του φοιτητή Απαλλαγή Ένδειξη του αν ο φοιτητής έχει απαλλαγή ή όχι Βαθμός_τοις_εκατο Ο βαθμός του φοιτητή στο μάθημα διαιρεμένος με το 10 Βαθμός Ο βαθμός του φοιτητή στο μάθημα Ακαδημαϊκό_Έτος_Βαθμολογίας Το ακαδημαϊκό έτος βαθμολογίας Περίοδος_Βαθμολογίας Η περίοδος βαθμολογίας (Εαρινή, Χειμερινή) Εξάμηνο_χρέωσης Το εξάμηνο χρέωσης του μαθήματος για το φοιτητή Ακαδημαϊκό_Έτος_Πρώτης_Δήλωσης Το ακαδημαϊκό έτος πρώτης δήλωσης του μαθήματος από το φοιτητή 38

39 Υλοποίηση Περίοδος_Πρώτης_Δήλωσης Η περίοδος πρώτης δήλωσης του μαθήματος από το φοιτητή (Εαρινή, Χειμερινή) ΔΜ Οι διδακτικές μονάδες του μαθήματος ECTS Οι μονάδες ECTS του μαθήματος Συντελεστής Ο συντελεστής του μαθήματος Ώρες Οι ώρες παράδοσης του μαθήματος ανά εβδομάδα Κατεύθυνση Η κατεύθυνση του μαθήματος Τύπος Ο τύπος του μαθήματος Ακαδημαϊκό_Έτος_Εγγραφής Το ακαδημαϊκό έτος εγγραφής του φοιτητή Το τρέχον εξάμηνο του φοιτητή (όταν ο φοιτητής Εξάμηνο αποφοιτήσει έχει τιμή το εξάμηνο στο οποίο βρισκόταν προτού αποφοιτήσει) Κατηγορία_Φοιτητή Η κατηγορία του φοιτητή (Ενεργός, Πτυχιούχος, Επί πτυχίω, Ανενεργός, Λιμνάζων) Πρόγραμμα_Σπουδών Το πρόγραμμα σπουδών του φοιτητή Υπ_στη_Λήψη Ένδειξη του αν το μάθημα είναι υποχρεωτικό στη λήψη ή όχι Υπ_στο_Βαθμό Ένδειξη του αν ο φοιτητής το μάθημα συμμετέχει υποχρεωτικά στον υπολογισμό του βαθμού ή όχι Κωδικός_Μάθημα Ο κωδικός του μαθήματος Κωδικός_Κατεύθυνση Ο κωδικός της κατεύθυνσης Πίνακας 4.5 Στήλες του φύλλου εργασίας ΒΑΘΜΟΣ Φοιτητής Στην Εικόνα 4.6 εμφανίζεται η μορφή που πρέπει να ακολουθεί το φύλλο εργασίας ΦΟΙΤΗΤΗΣ. Συνιστάται η αποφυγή εισαγωγής κενών τιμών σε κελιά στο τέλος των δεδομένων του φύλλου εργασίας. Να σημειωθεί πως στο φύλλο εργασίας πρέπει να περιέχεται το σύνολο των φοιτητών. Εικόνα 4.6 Φύλλο εργασίας ΦΟΙΤΗΤΗΣ Στον Πίνακα 4.6 παρουσιάζονται αναλυτικά οι ιδιότητες ενός φοιτητή. Στήλη ΑΜ Φύλο Ημερομηνία_Ορκωμοσίας Περιγραφή Ο αριθμός μητρώου (ΑΜ) του φοιτητή Το φύλο του φοιτητή ( Αρρεν, Θήλυ) Η ημερομηνία ορκωμοσίας του φοιτητή 39

40 Προετοιμασία των δεδομένων Βαθμός_Πτυχίου_τοις_εκατό Ο βαθμός πτυχίου του φοιτητή διαιρεμένος με το 10 Τόπος_Δημοτολογίου Ο τόπος δημοτολογίου του φοιτητή Κατηγορία_Φοιτητή Η κατηγορία του φοιτητή (Ενεργός, Πτυχιούχος, Επί πτυχίω, Ανενεργός, Λιμνάζων) Περίοδος_Ορκωμοσίας Η περίοδος ορκωμοσίας του φοιτητή Ακαδημαϊκό_Έτος_Ορκωμοσίας Το ακαδημαϊκό έτος ορκωμοσίας του φοιτητή Ημερομηνία_Τελευταίας_Υποχρέωσης Η ημερομηνία τελευταίας υποχρέωσης του φοιτητή Κατεύθυνση Η κατεύθυνση του φοιτητή Πρόγραμμα_Σπουδών Το πρόγραμμα σπουδών που ακολουθεί ο φοιτητής Έτος_Γέννησης Το έτος γέννησης του φοιτητή Τόπος_Γέννησης Ο τόπος γέννησης του φοιτητή Νομός Γέννησης ή Χώρα Γέννησης Ο νομός γέννησης ή η χώρα γέννησης του φοιτητή Τρόπος_Εγγραφής Ο τρόπος εγγραφής του φοιτητή Ακαδημαικό_Έτος_Εγγραφής Το ακαδημαϊκό έτος εγγραφής του φοιτητή Ημερομηνία_Εγγραφής Η ημερομηνία εγγραφής του φοιτητή Εξάμηνο Το εξάμηνο στο οποίο βρίσκεται ο φοιτητής (φοιτητές που έχουν αποφοιτήσει έχουν ως εξάμηνο την τιμή 1) Κωδικός_Κατεύθυνση Ο κωδικός της κατεύθυνσης του φοιτητή Πίνακας 4.6 Στήλες του φύλλου εργασίας ΦΟΙΤΗΤΗΣ Εισαγωγή των δεδομένων στην ενδιάμεση βάση δεδομένων Όπως αναφέρθηκε και προηγουμένως, αφού τα δεδομένα εξαχθούν από την επιχειρησιακή βάση δεδομένων της γραμματείας σε ένα αρχείο Excel σύμφωνα με την ανωτέρω περιγραφή, εισάγονται σε μία ενδιάμεση βάση δεδομένων η οποία και αποτελεί την περιοχή προετοιμασίας των δεδομένων, από την οποία οδηγούμαστε στη συνέχεια στην αποθήκη δεδομένων Ενδιάμεση βάση δεδομένων Πριν από την αναφορά του τρόπου με τον οποίο εισάγονται τα δεδομένα από το αρχείο Excel στην ενδιάμεση βάση δεδομένων, θα γίνει μία παρουσίαση του σχήματος της ενδιάμεσης βάσης δεδομένων. Η ενδιάμεση βάση δεδομένων έχει αναπτυχθεί με το εργαλείο Microsoft SQL Server 2005 και καλείται csd_db. Η βάση δεδομένων csd_db περιέχει 6 πίνακες σε αντιστοιχία με τα 6 φύλλα εργασίας του αρχείου Excel. Στις παρακάτω εικόνες (Εικόνα 4.7, Εικόνα 4.8, Εικόνα 4.9, Εικόνα 4.10, Εικόνα 4.11, Εικόνα 4.12) μπορεί κανείς να παρατηρήσει το σχήμα των πινάκων αυτών. Εικόνα 4.7 Σχήμα του πίνακα ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ 40

41 Υλοποίηση Εικόνα 4.8 Σχήμα του πίνακα ΚΑΤΕΥΘΥΝΣΗ Εικόνα 4.9 Σχήμα του πίνακα ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ Εικόνα 4.10 Σχήμα του πίνακα ΒΑΘΜΟΣ 41

42 Προετοιμασία των δεδομένων Εικόνα 4.11 Σχήμα του πίνακα ΜΑΘΗΜΑ Εικόνα 4.12 Σχήμα του πίνακα ΦΟΙΤΗΤΗΣ Στη συνέχεια ακολουθεί μία περιγραφή των σχέσεων ξένων κλειδιών (foreign key relationships) που υφίστανται μεταξύ των ανωτέρω πινάκων. Οι σχέσεις αυτές φαίνονται στην Εικόνα 4.13 και είναι οι εξής: Σχέση μεταξύ των πινάκων ΦΟΙΤΗΤΗΣ και ΒΑΘΜΟΣ (σχέση ένα προς πολλά): ένας φοιτητής μπορεί να έχει πολλές βαθμολογίες, μία βαθμολογία μπορεί να αντιστοιχεί σε ένα φοιτητή. Σχέση μεταξύ των πινάκων ΜΑΘΗΜΑ και ΒΑΘΜΟΣ (σχέση ένα προς πολλά): σε ένα μάθημα μπορούν να αντιστοιχούν πολλές βαθμολογίες, μία βαθμολογία μπορεί να αντιστοιχεί σε ένα μάθημα. Σχέση μεταξύ των πινάκων ΦΟΙΤΗΤΗΣ και ΚΑΤΕΥΘΥΝΣΗ (σχέση ένα προς πολλά): ένας φοιτητής μπορεί να ανήκει σε μία κατεύθυνση, μία κατεύθυνση μπορεί να επιλεχθεί από πολλούς φοιτητές. 42

43 Υλοποίηση Σχέση μεταξύ των πινάκων ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ και ΚΑΤΕΥΘΥΝΣΗ (σχέση ένα προς πολλά): μία κατεύθυνση ανήκει σε ένα πρόγραμμα σπουδών, ένα πρόγραμμα σπουδών μπορεί να περιέχει πολλές κατεύθυνσεις. Σχέσεις μεταξύ των πινάκων ΚΑΤΕΥΘΥΝΣΗ, ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ και ΜΑΘΗΜΑ (σχέση πολλά προς πολλά): μία κατεύθυνση μπορεί να περιέχει πολλά μαθήματα, ένα μάθημα μπορεί να αντιστοιχεί σε πολλές κατευθύνσεις. Εικόνα 4.13 Σχέσεις μεταξύ των πινάκων της βάσης csd_db Εισαγωγή των δεδομένων στην ενδιάμεση βάση δεδομένων Για την εισαγωγή των δεδομένων από το αρχείο Excel στην ενδιάμεση βάση δεδομένων που παρουσιάστηκε παραπάνω, επιλέχθηκε η χρήση του εργαλείου Microsoft Visual Studio Δημιουργήθηκε ένα project τύπου Business Intelligence Projects > Integration Services Project (Εικόνα 4.14) το οποίο ονομάστηκε Import_data_into_csd_db. Στη συνέχεια δημιουργήθηκε ένα Sequence Container (Εικόνα 4.15) μέσα από το οποίο μπορούμε να εκτελέσουμε σειριακά έναν αριθμό από ενέργειες. Στη συγκεκριμένη περίπτωση μία τέτοια ενέργεια αντιστοιχεί στην εισαγωγή δεδομένων από ένα φύλλο εργασίας του αρχείου Excel σε έναν πίνακα της ενδιάμεσης βάσης δεδομένων. Στη συγκεκριμένη περίπτωση το τελικό πακέτο ενεργειών περιέχει τις εξής ενέργειες (Εικόνα 4.16): 43

44 Προετοιμασία των δεδομένων Εικόνα 4.14 Δημιουργία project τύπου Integration Services Project Εικόνα 4.15 Δημιουργία Sequence Container 1. Προεπεξεργασία: περιλαμβάνει sql εντολές οι οποίες είναι απαραίτητες για την ορθή εισαγωγή των δεδομένων στη βάσης. Οι εντολές αυτές περιλαμβάνουν κυρίως την διαγραφή των δεδομένων από κάποιους πίνακες έτσι ώστε να γίνεται σωστά η ενημέρωση τους. 2. Import Φοιτητής: περιλαμβάνει την εισαγωγή των στοιχείων των φοιτητών από το φύλλο εργασίας ΦΟΙΤΗΤΗΣ του αρχείου Excel στον πίνακα ΦΟΙΤΗΤΗΣ της βάσης δεδομένων csd_db. Αποτελεί μία λειτουργία ροής δεδομένων Data flow task με πηγή των δεδομένων ένα αρχείο Excel (Excel source) και προορισμό των δεδομένων μία βάση δεδομένων SQL Server (SQL Server Destination) αφού προηγηθούν οι απαραίτητοι μετασχηματισμοί στα δεδομένα (Εικόνα 4.17). Στην Εικόνα 4.18 φαίνονται οι απαραίτητοι μετασχηματισμοί πριν από την εισαγωγή των δεδομένων στον πίνακα της βάσης csd_db (το παράθυρο ανοίγει με διπλό κλικ στο κουτί Data Conversion). Οι μετασχηματισμοί περιλαμβάνουν τα χρονικά δεδομένα, δεδομένα που αναπαριστούν ημερομηνίες. Έτσι τα περιεχόμενα των στηλών «Ημερομηνία 44

45 Υλοποίηση Ορκωμοσίας», «Ημερομηνία Τελευταίας Υποχρέωσης» και «Ημερομηνία Εγγραφής» μετασχηματίζονται σε τύπο database timestamp [DT_DBTIMESTAMP] από date [DT_DATE] που ήταν αρχικά. Εικόνα 4.16 Ακολουθία ενεργειών του Import_data_into_csd_db Εικόνα 4.17 Ακολουθία ενεργειών του data flow task Import ΦΟΙΤΗΤΗΣ 3. Import Μάθημα: περιλαμβάνει την εισαγωγή των στοιχείων των φοιτητών από το φύλλο εργασίας ΜΑΘΗΜΑ του αρχείου Excel στον πίνακα ΜΑΘΗΜΑ της βάσης δεδομένων csd_db. Η λειτουργία ροής δεδομένων που αντιστοιχεί στο Μάθημα, βρίσκεται σε πλήρη αντιστοιχία με τη λειτουργία ροής δεδομένων που παρουσιάστηκε ανωτέρω (βλ. Import Φοιτητής). 45

46 Προετοιμασία των δεδομένων Εικόνα 4.18 Μετασχηματισμοί στα δεδομένα του φύλλου εργασίας ΦΟΙΤΗΤΗΣ 4. Import Πρόγραμμα Σπουδών: περιλαμβάνει την εισαγωγή των στοιχείων των φοιτητών από το φύλλο εργασίας ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ του αρχείου Excel στον πίνακα ΠΡΟΓΡΑΜΜΑ_ΣΠΟΥΔΩΝ της βάσης δεδομένων csd_db. Η λειτουργία ροής δεδομένων που αντιστοιχεί στο Πρόγραμμα σπουδών, βρίσκεται σε πλήρη αντιστοιχία με τη λειτουργία ροής δεδομένων που παρουσιάστηκε ανωτέρω (βλ. Import Φοιτητής). 5. Import Κατεύθυνση: περιλαμβάνει την εισαγωγή των στοιχείων των φοιτητών από το φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ του αρχείου Excel στον πίνακα ΚΑΤΕΥΘΥΝΣΗ της βάσης δεδομένων csd_db. Η λειτουργία ροής δεδομένων που αντιστοιχεί στην Κατεύθυνση, βρίσκεται σε πλήρη αντιστοιχία με τη λειτουργία ροής δεδομένων που παρουσιάστηκε ανωτέρω (βλ. Import Φοιτητής). 6. Import Κατεύθυνση Μάθημα: περιλαμβάνει την εισαγωγή των στοιχείων των φοιτητών από το φύλλο εργασίας ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ του αρχείου Excel στον πίνακα ΚΑΤΕΥΘΥΝΣΗ_ΜΑΘΗΜΑ της βάσης δεδομένων csd_db. Η λειτουργία ροής δεδομένων που αντιστοιχεί στη σχέση Κατεύθυνση Μάθημα, βρίσκεται σε πλήρη αντιστοιχία με τη λειτουργία ροής δεδομένων που παρουσιάστηκε ανωτέρω (βλ. Import Φοιτητής). 7. Import Βαθμός: περιλαμβάνει την εισαγωγή των στοιχείων των φοιτητών από το φύλλο εργασίας ΒΑΘΜΟΣ του αρχείου Excel στον πίνακα ΒΑΘΜΟΣ της βάσης δεδομένων csd_db. Η λειτουργία ροής δεδομένων που αντιστοιχεί στις Βαθμολογίες, βρίσκεται σε πλήρη αντιστοιχία με τη λειτουργία ροής δεδομένων που παρουσιάστηκε ανωτέρω (βλ. Import Φοιτητής). 46

47 Υλοποίηση Μετά την περιγραφή του τρόπου δημιουργίας του Import_data_into_csd_db project, θα ακολουθήσει η ανάλυση του τρόπου με τον οποίο το project αυτό μπορεί να χρησιμοποιηθεί για την εισαγωγή των δεδομένων από το αρχείο Excel στη βάση δεδομένων csd_db. Τα βήματα που πρέπει να πραγματοποιηθούν είναι δύο. Αρχικά πρέπει να καθοριστεί το αρχείο Excel που περιέχει τα ενημερωμένα δεδομένα. Αυτό γίνεται επιλέγοντας από το tool pane Connection Managers που βρίσκεται στο κάτω μέρος της οθόνης (Εικόνα 4.19) τη σύνδεση Excel Connection Manager 1 (πρόκειται για τη σύνδεση η οποία και χρησιμοποιείται), στη συνέχεια εισάγοντας στο tool pane Properties που βρίσκεται στο κάτω δεξιά μέρος της οθόνης, στην ιδιότητα ExcelFilePath την πλήρη διαδρομή του αρχείου Excel, και τελικά πατώντας ένα Enter για να καταχωρηθεί η νέα τιμή. Σε περίπτωση που το tool pane Properties δεν εμφανίζεται στην οθόνη, μπορεί να εμφανιστεί μέσα από το μενού View > Properties Window. Εικόνα 4.19 Καθορισμός της διαδρομής του αρχείου Excel Το μόνο που απομένει στη συνέχεια είναι να γίνει η εκτέλεση του project η οποία γίνεται πατώντας το πράσινο βελάκι που βρίσκεται στο πάνω μέρος της οθόνης δίπλα στο μενού Development (Εικόνα 4.20). Εικόνα 4.20 Εκτέλεση του Import_data_into_csd_db project 47

48 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής Η ορθή εκτέλεση του Import_data_into_csd_db project καταλήγει στο αποτέλεσμα που φαίνεται στην Εικόνα 4.21 (όλες οι λειτουργίες ροής δεδομένων έχουν εκτελεστεί επιτυχώς και χρωματίζονται με πράσινο χρώμα). Ο τερματισμός της εκτέλεσης γίνεται πατώντας το μπλε τετραγωνάκι που βρίσκεται στο επάνω μέρος της οθόνης (Εικόνα 4.21). Εικόνα 4.21 Αποτέλεσμα ορθής εκτέλεσης του Import_data_into_csd_db project Να σημειωθεί πως η ανωτέρω λειτουργία πρέπει να εκτελούνται κάθε φορά που πρόκειται να γίνει ενημέρωση της αποθήκης δεδομένων, όπου στο αρχείο Excel θα βρίσκονται τα ενημερωμένα δεδομένα σύμφωνα με όσα αναφέρονται σε προηγούμενη παράγραφο (Παράγραφος 4.2.1) Φόρτωση των δεδομένων στην αποθήκη δεδομένων Η περιγραφή του τρόπου με τον οποίο πραγματοποιείται η φόρτωση των δεδομένων στην αποθήκη δεδομένων θα γίνει αφού προηγηθεί η περιγραφή του σχεδιασμού της αποθήκης δεδομένων. Κάτι τέτοιο είναι αναγκαίο διότι για την κατανόηση του τρόπου φόρτωσης των δεδομένων στην αποθήκη δεδομένων, είναι απαραίτητη η κατανόηση του σχήματος της. 4.3 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής Στο στάδιο του σχεδιασμού της αποθήκης δεδομένων πραγματοποιείται η επιλογή των διάφορων διαδικασιών τις οποίες θέλουμε να μοντελοποιήσουμε. Η μοντελοποίηση των διαδικασιών θα καταλήξει στη δημιουργία ενός αριθμού κύβων. Αρχικά θα γίνει μία περιγραφή του τρόπου μοντελοποίησης με βάση τη μέθοδο των τεσσάρων (4) βημάτων που παρουσιάστηκε σε προηγούμενη παράγραφο (Παράγραφος 3.1.1). Στη συνέχεια θα παρουσιαστεί ο τρόπος με τον οποίο η προηγούμενη ανάλυση υλοποιείται με το εργαλείο Microsoft Analysis Services. Τέλος, και αφού γίνει κατανοητός ο σχεδιασμός της αποθήκης δεδομένων θα αναφερθεί και ο τρόπος με τον οποίο φορτώνονται τα δεδομένα από την ενδιάμεση βάση δεδομένων στην αποθήκη δεδομένων. 48

49 Υλοποίηση Μοντελοποίηση διαστάσεων Οι διαδικασίες του οργανισμού που θα μοντελοποιηθούν είναι δύο (2) και θα εξεταστούν με τη σειρά. Όπως έχει ήδη αναφερθεί, η μοντελοποίηση διαστάσεων βασίζεται στο σχεδιασμό σχημάτων αστέρα καθορίζοντας τους πίνακες γεγονότων και τους πίνακες διαστάσεων. Στη συγκεκριμένη περίπτωση ο οργανισμός είναι το τμήμα Πληροφορικής του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης. Ακολουθεί η μοντελοποίηση διαστάσεων για την πρώτη διαδικασία. 1. Επιλογή της διαδικασίας που θα μοντελοποιηθεί. Ίσως η σημαντικότερη διαδικασία η οποία να λαμβάνει χώρα στα πλαίσια της λειτουργίας ενός πανεπιστημιακού τμήματος είναι η διαδικασία της βαθμολογίας των φοιτητών στις διάφορες εξεταστικές περιόδους. Από την ανάλυση των δεδομένων των βαθμολογιών μπορούν να προκύψουν συμπεράσματα για τη συμπεριφορά των φοιτητών, για τη δυσκολία των μαθημάτων κ.τ.λ. 2. Επιλογή επιπέδου λεπτομέρειας. Το επίπεδο λεπτομέρειας επιλέγεται να είναι το μεγαλύτερο δυνατό. Έτσι, καταγράφεται κάθε ατομική βαθμολογία ενός φοιτητή σε ένα μάθημα. Η επιλογή αυτή της καταγραφής κάθε ατομικής βαθμολογίας, αν και σπάνια χρησιμοποιείται μεμονωμένα, δίνει μεγαλύτερη ευελιξία για ανάλυση των δεδομένων από το αν π.χ. καταγραφόταν η συνολική βαθμολογία ενός φοιτητή σε όλα τα μαθήματα, καθώς έτσι θα χανόταν η ευκαιρία ανάλυσης των βαθμολογιών σε σχέση με τα μαθήματα. 3. Επιλογή των πινάκων διαστάσεων. Βάσει του επιλεγμένου επιπέδου λεπτομέρειας, κάθε γραμμή του πίνακα γεγονότων καταγράφει μία βαθμολογία ενός φοιτητή σε ένα μάθημα. Από το ερώτημα: «με ποιες πληροφορίες περιγράφουμε κάθε γραμμή του πίνακα γεγονότων», προκύπτει ότι την κάθε γραμμή μπορούμε να την περιγράψουμε από τον εξεταζόμενο φοιτητή, από το μάθημα στο οποίο εξετάστηκε ο φοιτητής καθώς επίσης και από το χρόνο βαθμολογίας. 4. Επιλογή των αριθμητικών γεγονότων. Από το ερώτημα: «τι μετράμε σε κάθε γραμμή του πίνακα γεγονότων», για τη συγκεκριμένη περίπτωση προκύπτει ότι κατάλληλα αριθμητικά γεγονότα είναι ο μέσος όρος των βαθμολογιών, και ίσως ο αριθμός του πόσες φορές εξετάζεται ένας φοιτητής σε ένα μάθημα. Το αρχικό σχήμα αστέρα που προκύπτει μετά τα τέσσερα σχεδιαστικά βήματα, εμφανίζεται στην Error! Reference source not found.. Εικόνα 4.22 Σχήμα αστέρα για τη διαδικασία των βαθμολογιών 49

50 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής Το σχήμα αστέρα που εμφανίζεται παραπάνω είναι πολύ βασικό διότι φανερώνει ποιοι είναι οι πίνακες διαστάσεων και ποιος είναι ο πίνακας γεγονότων με το σύνολο των αριθμητικών γεγονότων. Για να ολοκληρωθεί το ανωτέρω σχήμα πρέπει να οριστούν οι διάφορες ιδιότητες των πινάκων διαστάσεων. Επειδή οι ιδιότητες είναι πολύ χρήσιμες πηγές πληροφορίας κατά την ανάλυση προσθέτουμε στο σχήμα όσες περισσότερες είναι δυνατόν, καθώς η επαύξηση ενός αρχικά μικρού σχήματος οδηγεί σε διάφορα προβλήματα. Οι ιδιότητες του πίνακα διάστασης «Φοιτητής» φαίνονται στην Εικόνα 4.23, οι ιδιότητες του πίνακα διάστασης «Μάθημα» φαίνονται στην Εικόνα 4.24 και οι ιδιότητες του πίνακα διάστασης «Χρόνος Βαθμολογίας» φαίνονται στην Εικόνα Εικόνα 4.23 Ιδιότητες του πίνακα διάστασης Φοιτητής Εικόνα 4.24 Ιδιότητες του πίνακα διάστασης Μάθημα 50

51 Υλοποίηση Εικόνα 4.25 Ιδιότητες του πίνακα διάστασης Χρόνος Βαθμολογίας Ύστερα από τον καθορισμό του συνόλου των ιδιοτήτων για τους πίνακες διαστάσεων, οι ιδιότητες αυτές εξετάστηκαν για την εύρεση συσχετίσεων μεταξύ τους ώστε να αποτελούν ιεραρχία. Μία ιεραρχία αποτελεί σημαντικό στοιχείο της ανάλυσης καθώς στη συνέχεια επιτρέπει την εφαρμογή OLAP πράξεων (roll up, drill down) για καλύτερη ανάλυση των δεδομένων. Για τον πίνακα διάστασης «Φοιτητής» προέκυψαν οι ιεραρχίες «Πενταετία εγγραφής > Ακαδημαϊκό έτος εγγραφής > Ηλικία > ΑΜ» και «Όνομα προγράμματος σπουδών > Όνομα κατεύθυνσης > ΑΜ». Για τον πίνακα διάστασης «Μάθημα» προέκυψε η ιεραρχία «Όνομα προγράμματος σπουδών > Όνομα κατεύθυνσης > Εξάμηνο > Τύπος > Όνομα μαθήματος > Κωδικός μαθήματος». Τέλος, για τον πίνακα διάστασης «Χρόνος βαθμολογίας» προέκυψε η χρονική ιεραρχία «Πενταετία βαθμολογίας > Ακαδημαϊκός έτος βαθμολογίας > Περίοδος βαθμολογίας». Ακολουθεί η μοντελοποίηση διαστάσεων για τη δεύτερη διαδικασία. 1. Επιλογή της διαδικασίας που θα μοντελοποιηθεί. Μία ακόμα σημαντική διαδικασία η οποία να λαμβάνει χώρα στα πλαίσια της λειτουργίας ενός πανεπιστημιακού τμήματος είναι η διαδικασία της αποφοίτησης των φοιτητών. Από την ανάλυση των δεδομένων των βαθμολογιών αποφοίτησης μπορούν να προκύψουν συμπεράσματα για τη συμπεριφορά των αποφοίτων, για τη δυσκολία κτήσης πτυχίου κ.τ.λ. 2. Επιλογή επιπέδου λεπτομέρειας. Το επίπεδο λεπτομέρειας επιλέγεται να είναι το μεγαλύτερο δυνατό. Έτσι, καταγράφεται ο βαθμός πτυχίου κάθε φοιτητή. Η επιλογή αυτή της καταγραφής κάθε ατομικής βαθμολογίας, αν και σπάνια χρησιμοποιείται μεμονωμένα, δίνει μεγαλύτερη ευελιξία για ανάλυση των δεδομένων από το αν π.χ. καταγραφόταν η συνολική βαθμολογία των φοιτητών που αποφοίτησαν μία χρονιά, καθώς έτσι θα χανόταν η ευκαιρία ανάλυσης των βαθμολογιών σε σχέση με τις περιόδους ορκωμοσίας. 3. Επιλογή των πινάκων διαστάσεων. Βάσει του επιλεγμένου επιπέδου λεπτομέρειας, κάθε γραμμή του πίνακα γεγονότων καταγράφει τον βαθμό πτυχίου ενός φοιτητή. Από το ερώτημα: «με ποιες πληροφορίες περιγράφουμε κάθε γραμμή του πίνακα γεγονότων», προκύπτει ότι την κάθε γραμμή μπορούμε να την περιγράψουμε από τον απόφοιτο και από το χρόνο ορκωμοσίας. 4. Επιλογή των αριθμητικών γεγονότων. Από το ερώτημα: «τι μετράμε σε κάθε γραμμή του πίνακα γεγονότων», για τη συγκεκριμένη περίπτωση προκύπτει ότι κατάλληλα αριθμητικά γεγονότα είναι ο μέσος όρος των βαθμών πτυχίου και ο αριθμός των απόφοιτων σε μία συγκεκριμένη περίοδο ορκωμοσίας. Το αρχικό σχήμα αστέρα που προκύπτει μετά τα τέσσερα σχεδιαστικά βήματα, εμφανίζεται στην Error! Reference source not found.. 51

52 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής Εικόνα 4.26 Σχήμα αστέρα για τη διαδικασία των αποφοιτήσεων Για την ολοκλήρωση του ανωτέρω σχήματος, όπως έχει ήδη αναφερθεί, είναι απαραίτητο να καθοριστεί και το σύνολο των ιδιοτήτων για κάθε πίνακα διάστασης, καθώς επίσης και το σύνολο των ιεραρχιών σε αυτές. Οι ιδιότητες του πίνακα διάστασης «Απόφοιτος» φαίνονται στην Εικόνα 4.27 και οι ιδιότητες του πίνακα διάστασης «Χρόνος Ορκωμοσίας» φαίνονται στην Εικόνα Όσον αφορά τις ιεραρχίες, για τον πίνακα διάστασης «Απόφοιτος» προέκυψαν οι ιεραρχίες «Πενταετία εγγραφής > Ακαδημαϊκό έτος εγγραφής > Ηλικία > ΑΜ» και «Όνομα προγράμματος σπουδών > Όνομα κατεύθυνσης > ΑΜ» και για τον πίνακα διάστασης «Χρόνος Ορκωμοσίας» προέκυψε η χρονική ιεραρχία «Πενταετία ορκωμοσίας > Ακαδημαϊκός έτος ορκωμοσίας > Περίοδος ορκωμοσίας». Εικόνα 4.27 Ιδιότητες του πίνακα διάστασης Απόφοιτος 52

53 Υλοποίηση Εικόνα 4.28 Ιδιότητες του πίνακα διάστασης Χρόνος Ορκωμοσίας Υλοποίηση μοντελοποίησης Η υλοποίηση της ανωτέρω μοντελοποίησης της αποθήκης δεδομένων πραγματοποιήθηκε με τη χρήση του εργαλείου Microsoft Visual Studio 2005, από όπου δημιουργήθηκε ένα project τύπου Business Intelligence Projects > Analysis Services Project (Εικόνα 4.29) το οποίο ονομάστηκε Csd Analysis Project. Εικόνα 4.29 Δημιουργία project τύπου Analysis Services Project Μέσα από αυτό το project δημιουργήθηκε μία πηγή δεδομένων (data source) που ονομάστηκε Csd_Data_Source (Εικόνα 4.30) η οποία και είναι υπεύθυνη για τη σύνδεση με την ενδιάμεση βάση δεδομένων csd_db (Εικόνα 4.31), λόγος για την οποία έχει γίνει σε προηγούμενη παράγραφο. Μετά από τη δημιουργία της σύνδεσης μεταξύ του project και της βάσης δεδομένων, δημιουργήθηκαν δύο (2) όψεις δεδομένων (data source views), μία για τους φοιτητές (Csd_Students_Data_View) και μία για τους απόφοιτους (Csd_Graduates_Data_View) οι οποίες περιέχουν το σύνολο των πινάκων της ενδιάμεσης βάσης δεδομένων csd_db (Εικόνα 4.32). Στο σημείο αυτό θα πρέπει να αναφερθεί η σημασία των δύο αυτών διαφορετικών όψεων καθώς και οι λειτουργίες που πραγματοποιούνται κατά τη δημιουργία τους. Κατά τη δημιουργία της όψης που αφορά τους φοιτητές προστίθενται κάποιες ιδιότητες οι οποίες δεν υπάρχουν στους πίνακες της βάσης csd_db, μπορούν όμως να υπολογιστούν χρησιμοποιώντας κάποιες από αυτές. Οι ιδιότητες που προστίθενται είναι η «Πενταετία Βαθμολογίας» στον πίνακα «ΒΑΘΜΟΣ», η «Πενταετία Εγγραφής» και η «Ηλικία» στον 53

54 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής πίνακα «ΦΟΙΤΗΤΗΣ». Κατά τη δημιουργία της όψης που αφορά τους απόφοιτους, αρχικά επιλέγεται από το σύνολο των φοιτητών, το υποσύνολο που αντιστοιχεί στους πτυχιούχους, εκείνους δηλαδή που έχουν ήδη αποκτήσει πτυχίο. Στη συνέχεια και με παρόμοιο τρόπο με προηγουμένως υπολογίζονται οι ιδιότητες «Πενταετία Εγγραφής», «Πενταετία Ορκωμοσίας», «Ηλικία» και «Διάρκεια Σπουδών» στον πίνακα «ΦΟΙΤΗΤΗΣ». Οι δύο αυτές όψεις χρησιμοποιούνται στη συνέχεια για τη δημιουργία των αντίστοιχων κύβων δεδομένων. Εικόνα 4.30 Πηγή δεδομένων Csd_Data_Source Εικόνα 4.31 Σύνδεση με την ενδιάμεση βάση δεδομένων csd_db 54

55 Υλοποίηση Εικόνα 4.32 Σχήμα των όψεων των δεδομένων Csd_Students_Data_View και Csd_Graduates_Data_View Στη συνέχεια πραγματοποιήθηκε η υλοποίηση των πινάκων διαστάσεων που παρουσιάστηκαν αναλυτικά στην παράγραφο του σχεδιασμού της αποθήκης δεδομένων. Όπως έχει ήδη ειπωθεί στο σύνολο των διαστάσεων περιέχονται πέντε (5) διαστάσεις, τρεις (3) που σχετίζονται με τον πίνακα γεγονότων των βαθμολογιών και δύο (2) που σχετίζονται με τον πίνακα γεγονότων των αποφοιτήσεων. Για τη δημιουργία, την επεξεργασία και τη φόρτωση των δεδομένων στους πίνακες διαστάσεων που αφορούν τις βαθμολογίες χρησιμοποιείται η όψη Csd_Students_Data_View ενώ για τις αντίστοιχες λειτουργίες στους πίνακες διαστάσεων που αφορούν τις αποφοιτήσεις χρησιμοποιείται η όψη Csd_Graduates_Data_View. Στην Εικόνα 4.33 παρουσιάζεται η δομή του πίνακα διάστασης «ΦΟΙΤΗΤΗΣ», στην Εικόνα 4.34 η δομή του πίνακα διάστασης «ΜΑΘΗΜΑ», στην Εικόνα 4.35 η δομή του πίνακα διάστασης «ΧΡΟΝΟΣ_ΒΑΘΜΟΛΟΓΙΑΣ», στην Εικόνα 4.36 η δομή του πίνακα διάστασης «ΑΠΟΦΟΙΤΟΣ» και τέλος στην Εικόνα 4.37 στην η δομή του πίνακα διάστασης «ΧΡΟΝΟΣ_ΟΡΚΩΜΟΣΙΑΣ». Αξίζει να αναφερθεί το γεγονός πως οι διαστάσεις 55

56 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής «ΧΡΟΝΟΣ_ΒΑΘΜΟΛΟΓΙΑΣ» και «ΧΡΟΝΟΣ_ΟΡΚΩΜΟΣΙΑΣ» είναι χρονικού τύπου (time dimensions) ενώ οι υπόλοιπες είναι κανονικές τυπικές διαστάσεις (regular dimensions). Εικόνα 4.33 Δομή του πίνακα διάστασης ΦΟΙΤΗΤΗΣ Εικόνα 4.34 Δομή του πίνακα διάστασης ΜΑΘΗΜΑ Εικόνα 4.35 Δομή του πίνακα διάστασης ΧΡΟΝΟΣ ΒΑΘΜΟΛΟΓΙΑΣ 56

57 Υλοποίηση Εικόνα 4.36 Δομή του πίνακα διάστασης ΑΠΟΦΟΙΤΟΣ Εικόνα 4.37 Δομή του πίνακα διάστασης ΧΡΟΝΟΣ ΟΡΚΩΜΟΣΙΑΣ Το βήμα που ακολουθεί τη δημιουργία των πινάκων διαστάσεων ή απλά των διαστάσεων είναι αυτό της δημιουργίας των κύβων δεδομένων που αντιστοιχούν στα σχήματα αστέρα που έχουν ήδη παρουσιαστεί. Έτσι δημιουργήθηκαν δύο (2) κύβοι δεδομένων, ένας που αφορά τους φοιτητές (Csd_Students_Cube) και ένας που αφορά τους απόφοιτους (Csd_Graduates_Cube). Οι διαστάσεις του πρώτου είναι οι «ΦΟΙΤΗΤΗΣ», «ΜΑΘΗΜΑ» και «ΧΡΟΝΟΣ ΒΑΘΜΟΛΟΓΙΑΣ» και οι διαστάσεις του δεύτερου είναι οι «ΑΠΟΦΟΙΤΟΣ» και «ΧΡΟΝΟΣ ΟΡΚΩΜΟΣΙΑΣ». Στη συνέχεια ορίστηκαν τα αριθμητικά γεγονότα (Measures) των πινάκων γεγονότων, τα μετρήσιμα δηλαδή στοιχεία τους. Τα αριθμητικά γεγονότα του πρώτου κύβου είναι ο μέσος όρος των βαθμολογιών (Μέσος Όρος Βαθμού) και ο αριθμός των φορών που ένας φοιτητής εξετάζεται σε ένα μάθημα (ΑΜ Distinct Count), και κάποια βοηθητικά αριθμητικά γεγονότα που δε χρησιμοποιούνται απευθείας και είναι το άθροισμα των βαθμολογιών (Βαθμός Sum) και το άθροισμα των φορών που ένας φοιτητής έχει εξεταστεί σε όλα τα μαθήματα (Βαθμός Count). Τα αριθμητικά γεγονότα του δεύτερου κύβου είναι ο μέσος όρος των βαθμών πτυχίου (Μέσος Όρος Πτυχίου), ο αριθμός των απόφοιτων (ΑΠΟΦΟΙΤΟΣ Count), η μέση διάρκεια σπουδών (Μέση Διάρκεια Σπουδών) και κάποια βοηθητικά αριθμητικά γεγονότα που δε χρησιμοποιούνται απευθείας και είναι ο μέσος όρος πτυχίου με άριστα το 1 (Μέσος Όρος Πτυχίου Τοις Εκατό), το άθροισμα των 57

58 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής μέσων όρων πτυχίου με άριστα το 1 (Βαθμός Πτυχίου Τοις Εκατό) και το άθροισμα των διαρκειών σπουδών (Διάρκεια Σπουδών). Μέσα από το γραφικό περιβάλλον του Microsoft Visual Studio 2005 εμφανίζονται και επεξεργάζονται τα σημαντικότερα στοιχεία των κύβων δεδομένων. Στη συνέχεια θα παρουσιαστούν συνοπτικά τα πιο ουσιώδη στοιχεία αυτού του γραφικού περιβάλλοντος. Μέσα από την καρτέλα Cube Structure μπορεί κανείς να δει τη δομή του κύβου, τα αριθμητικά γεγονότα (Measures) και τις διαστάσεις που σχετίζονται με τον κύβο (τόσο τις ιδιότητες όσο και τις υπάρχουσες ιεραρχίες). Μέσα από την καρτέλα Dimension Usage μπορεί κανείς να δει και να επεξεργαστεί τον τρόπο με τον οποίο συνδέονται οι διαστάσεις με τα αριθμητικά γεγονότα. Τέλος, μία σημαντική λειτουργία είναι η εύκολη προεπισκόπηση των δεδομένων του κύβου και η οποία είναι προσβάσιμη μέσα από την καρτέλα Browser. Η προεπισκόπηση περιλαμβάνει όλες τις πράξεις OLAP που έχουν παρουσιαστεί (roll up, drill down, slice, dice, pivot). Στην Εικόνα 4.38 φαίνονται τα αριθμητικά γεγονότα του πρώτου κύβου, στην Εικόνα 4.39 η χρήση των διαστάσεων σε σχέση με τα αριθμητικά γεγονότα του πρώτου κύβου και στην Εικόνα 4.40 μία προεπισκόπηση των δεδομένων του πρώτου κύβου. Στις Εικόνες 4.41, 4.42 και 4.43 φαίνονται τα αντίστοιχα στοιχεία του δεύτερου κύβου. Εικόνα 4.38 Αριθμητικά γεγονότα του κύβου Csd_Students_Cube Εικόνα 4.39 Χρήση των διαστάσεων στον κύβο Csd_Students_Cube 58

59 Υλοποίηση Εικόνα 4.40 Προεπισκόπηση των δεδομένων του κύβου Csd_Students_Cube Εικόνα 4.41 Αριθμητικά γεγονότα του κύβου Csd_Graduates_Cube Εικόνα 4.42 Χρήση των διαστάσεων στον κύβο Csd_Graduates_Cube Εικόνα 4.43 Προεπισκόπηση των δεδομένων του κύβου Csd_Graduates_Cube 59

60 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής Φόρτωση των δεδομένων Η φόρτωση των δεδομένων από την ενδιάμεση βάση δεδομένων csd_db στην αποθήκη δεδομένων αποτελείται από δύο (2) βασικές ενέργειες. Αρχικά πραγματοποιείται η φόρτωση των δεδομένων του συνόλου των διαστάσεων και στη συνέχεια ο υπολογισμός των κύβων δεδομένων. Μέσα από το γραφικό περιβάλλον του Microsoft Visual Studio 2005, η λειτουργία της φόρτωσης των δεδομένων για το σύνολο των διαστάσεων γίνεται ως ακολούθως. Στο tool pane Solution Explorer περιέχονται όλα τα στοιχεία που αποτελούν το project. Σε περίπτωση που το tool pane Solution Explorer δεν εμφανίζεται, μπορεί να εμφανιστεί μέσα από το μενού View > Solution Explorer. Μέσα στο φάκελο Dimensions περιέχονται οι πέντε διαστάσεις της συγκεκριμένης αποθήκης δεδομένων («ΧΡΟΝΟΣ_ΒΑΘΜΟΛΟΓΙΑΣ», «ΦΟΙΤΗΤΗΣ», «ΜΑΘΗΜΑ», «ΧΡΟΝΟΣ_ΟΡΚΩΜΟΣΙΑΣ» και «ΑΠΟΦΟΙΤΟΣ»). Αρχικά επιλέγονται και οι πέντε (5) διαστάσεις (Εικόνα 4.44) με τη χρήση των πλήκτρων Ctrl, Shift και του αριστερού πλήκτρου του ποντικιού, στη συνέχεια πραγματοποιώντας δεξί κλικ επάνω τους και τελικά επιλέγοντας τη λειτουργία Process (Εικόνα 4.45). Σε περίπτωση που εμφανιστεί το παρακάτω μήνυμα (Εικόνα 4.46) που ενημερώνει για το αν το project είναι ενημερωμένο ή όχι, επιλέγεται η επιλογή Yes. Στη συνέχεια εμφανίζεται το παρακάτω παράθυρο (Εικόνα 4.47), το οποία παρέχει διάφορες επιλογές και ρυθμίσεις όσον αφορά την επεξεργασία των διαστάσεων. Στη στήλη Process Options επιλέγεται για κάθε διάσταση από το αναδυόμενο μενού η επιλογή Process Full, με την οποία πραγματοποιείται πλήρης επεξεργασία των διαστάσεων. Με το πάτημα του κουμπιού Run αρχίζει η επεξεργασία των διαστάσεων, η φόρτωση δεδομένων σε αυτές και η δημιουργία των ιεραρχιών. Αφού η παραπάνω διαδικασία ολοκληρωθεί επιτυχώς (Εικόνα 4.48), με το πάτημα του κουμπιού Close στα δύο παράθυρα επανέρχεται η αρχική οθόνη του project. Εικόνα 4.44 Επιλογή του συνόλου των διαστάσεων 60

61 Υλοποίηση Εικόνα 4.45 Επιλογή Process για τις διαστάσεις Εικόνα 4.46 Ένδειξη για το αν το project είναι ενημερωμένο ή όχι Εικόνα 4.47 Παράθυρο επιλογών για τον τρόπο επεξεργασίας των διαστάσεων 61

62 Σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής Εικόνα 4.48 Επιτυχής ολοκλήρωση επεξεργασίας των διαστάσεων Ανάλογη είναι και η διαδικασία της επεξεργασίας των δύο (2) κύβων δεδομένων. Αρχικά επιλέγονται οι δύο κύβοι (Εικόνα 4.49) και στη συνέχεια πραγματοποιείται δεξί κλικ και επιλέγεται από το μενού η λειτουργία Process (Εικόνα 4.50). Σε περίπτωση που εμφανιστεί το μήνυμα της Εικόνας 4.46 που ενημερώνει για το αν το project είναι ενημερωμένο ή όχι, επιλέγεται η επιλογή Yes. Στη συνέχεια εμφανίζεται το παράθυρο της Εικόνας 4.51 όπου και καθορίζονται διάφορες επιλογές σχετικά με τον τρόπο επεξεργασίας των κύβων. Από το αναδυόμενο μενού στη στήλη Process Options επιλέγεται η επιλογή Process Full και έπειτα με το κουμπί Run αρχίζει η επεξεργασία των κύβων. Αφού η επεξεργασία των κύβων ολοκληρωθεί επιτυχώς (Εικόνα 4.52) με το πάτημα του κουμπιού Close στα δύο παράθυρα επανέρχεται το project στην αρχική του εμφάνιση. Όταν ολοκληρωθεί η ανωτέρω διαδικασία, στην καρτέλα Browser των κύβων είναι διαθέσιμα τα ενημερωμένα δεδομένα των κύβων με το πάτημα του κουμπιού Reconnect (τρίτο κουμπί επάνω αριστερά, βλ. Εικόνα 4.53). Εικόνα 4.49 Επιλογή του συνόλου των κύβων 62

63 Υλοποίηση Εικόνα 4.50 Επιλογή Process για τους κύβους Εικόνα 4.51 Παράθυρο επιλογών για τον τρόπο επεξεργασίας των κύβων 63

64 Αποτελέσματα Εικόνα 4.52 Επιτυχής ολοκλήρωση επεξεργασίας των κύβων Εικόνα 4.53 Επιλογή Reconnect για ενημέρωση των δεδομένων της προεπισκόπησης Να σημειωθεί στο τέλος αυτής της παραγράφου πως κάθε διάσταση και κάθε κύβος μπορεί να υποστεί επεξεργασία και μεμονωμένα. Ο τρόπος που παρουσιάστηκε ανωτέρω με την ταυτόχρονη επιλογή όλων των διαστάσεων (5) και όλων των κύβων (2) απλά απλουστεύει και συντομεύει την όλη διαδικασία και για το λόγο αυτό συνιστάται. 4.4 Αποτελέσματα Ο σχεδιασμός της αποθήκης δεδομένων του τμήματος Πληροφορικής που παρουσιάστηκε σε προηγούμενη παράγραφο, οδήγησε στη δημιουργία ενός αριθμού από αναφορές (reports), μέσα από τις οποίες παρουσιάζονται κάποια ενδιαφέροντα στοιχεία που σχετίζονται με το τμήμα. Στη συνέχεια, ακολουθεί μία παράθεση κάποιων ερωτημάτων μαζί με τις γραφικές παραστάσεις που παρουσιάζουν τα αποτελέσματα των αναφορών. Τέλος, παρουσιάζεται και ένας ιστοχώρος (site) που δημιουργήθηκε για την παρουσίαση των αναφορών αυτών μέσα από ένα φυλλομετρητή (browser). 64

65 Υλοποίηση Ερωτήματα Στην αποθήκη δεδομένων του τμήματος που υλοποιήθηκε περιλαμβάνονται οι ακόλουθες αναφορές. Να σημειωθεί πως η δημιουργία και η προσθήκη νέων αναφορών αποτελεί μία απλή διαδικασία και μπορεί να πραγματοποιηθεί μέσα από το Microsoft Excel. Στη συγκεκριμένη περίπτωση χρησιμοποιήθηκε η έκδοση Microsoft Excel Οι αναφορές που σχετίζονται με το σύνολο των φοιτητών του τμήματος είναι οι εξής: Μέσος όρος βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας. Τα στοιχεία των φοιτητών ακολουθούν την ιεραρχία Πρόγραμμα σπουδών > Κατεύθυνση > ΑΜ. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας. Τα στοιχεία των φοιτητών ακολουθούν την ιεραρχία Πενταετία εγγραφής > Ακαδημαϊκό έτος εγγραφής > Ηλικία > ΑΜ. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας. Τα στοιχεία των φοιτητών αναφέρονται στην κατηγορία των φοιτητών. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας. Τα στοιχεία των φοιτητών αναφέρονται στον τόπο γέννησης των φοιτητών. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας. Τα στοιχεία των φοιτητών αναφέρονται στον τρόπο εγγραφής των φοιτητών. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας. Τα στοιχεία των φοιτητών αναφέρονται στο φύλο των φοιτητών. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά μάθημα και χρόνο βαθμολογίας. Τα στοιχεία των μαθημάτων ακολουθούν την ιεραρχία Πρόγραμμα σπουδών > Κατεύθυνση > Εξάμηνο > Τύπος > Όνομα. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά μάθημα και χρόνο βαθμολογίας. Τα στοιχεία των μαθημάτων αναφέρονται στο εξάμηνο των μαθημάτων. Τα στοιχεία του χρόνου βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά μάθημα και χρόνο βαθμολογίας. Τα στοιχεία των μαθημάτων αναφέρονται στον τύπο των μαθημάτων. Τα στοιχεία του χρόνου 65

66 Αποτελέσματα βαθμολογίας ακολουθούν την ιεραρχία Πενταετία βαθμολογίας > Ακαδημαϊκό έτος βαθμολογίας > Περίοδος βαθμολογίας. Μέσος όρος βαθμολογιών ανά μάθημα και φοιτητή. Τα στοιχεία των μαθημάτων ακολουθούν την ιεραρχία Πρόγραμμα σπουδών > Κατεύθυνση > Εξάμηνο > Τύπος > Όνομα. Τα στοιχεία των φοιτητών ακολουθούν την ιεραρχία Πενταετία εγγραφής > Ακαδημαϊκό έτος εγγραφής > Ηλικία > ΑΜ. Μέσος όρος βαθμολογιών ανά μάθημα και φοιτητή. Τα στοιχεία των μαθημάτων ακολουθούν την ιεραρχία Πρόγραμμα σπουδών > Κατεύθυνση > Εξάμηνο > Τύπος > Όνομα. Τα στοιχεία των φοιτητών αναφέρονται στο φύλο των φοιτητών. Οι αναφορές που σχετίζονται με το σύνολο των αποφοίτων του τμήματος είναι οι εξής: Μέσος όρος πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων ακολουθούν την ιεραρχία Πενταετία εγγραφής > Ακαδημαϊκό έτος εγγραφής > Ηλικία > ΑΜ. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Αριθμός αποφοίτων ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων ακολουθούν την ιεραρχία Πενταετία εγγραφής > Ακαδημαϊκό έτος εγγραφής > Ηλικία > ΑΜ. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Μέσος όρος πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων ακολουθούν την ιεραρχία Πρόγραμμα σπουδών > Κατεύθυνση > ΑΜ. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Αριθμός αποφοίτων ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων ακολουθούν την ιεραρχία Πρόγραμμα σπουδών > Κατεύθυνση > ΑΜ. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Μέσος όρος πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων αναφέρονται στον τρόπο εγγραφής των αποφοίτων. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Αριθμός αποφοίτων ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων αναφέρονται στον τρόπο εγγραφής των αποφοίτων. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Μέσος όρος πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων αναφέρονται στο φύλο των αποφοίτων. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Αριθμός αποφοίτων ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων αναφέρονται στο φύλο των αποφοίτων. Τα στοιχεία του χρόνου 66

67 Υλοποίηση ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Μέση διάρκεια σπουδών ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων ακολουθούν την ιεραρχία Πενταετία εγγραφής > Ακαδημαϊκό έτος εγγραφής > Ηλικία > ΑΜ. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Μέση διάρκεια σπουδών ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων ακολουθούν την ιεραρχία Πρόγραμμα σπουδών > Κατεύθυνση > ΑΜ. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Μέση διάρκεια σπουδών ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων αναφέρονται στον τρόπο εγγραφής των αποφοίτων. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας. Μέση διάρκεια σπουδών ανά απόφοιτο και χρόνο ορκωμοσίας. Τα στοιχεία των αποφοίτων αναφέρονται στο φύλο των αποφοίτων. Τα στοιχεία του χρόνου ορκωμοσίας ακολουθούν την ιεραρχία Πενταετία ορκωμοσίας > Ακαδημαϊκό έτος ορκωμοσίας > Περίοδος ορκωμοσίας Πίνακες και Γραφικές παραστάσεις Οι διάφορες αναφορές που παρατέθηκαν στην προηγούμενη παράγραφο εμφανίζονται στους χρήστες είτε με τη μορφή πινάκων είτε με τη μορφή γραφικών παραστάσεων. Σε αυτή την παράγραφο θα παρουσιαστούν ορισμένες ενδεικτικές αναφορές που δημιουργήθηκαν με τη χρήση του Microsoft Excel Το συγκεκριμένο εργαλείο παρέχει πολλά βοηθήματα για την σύνδεση με την αποθήκη δεδομένων καθώς και την ανάλυση των δεδομένων της και για το λόγο αυτό προτιμήθηκε. Στη συνέχεια ακολουθεί μία αναφορά η οποία παρουσιάζει τον τρόπο με τον οποίο κυμαίνονται οι βαθμολογίες του συνόλου των φοιτητών ανά κατεύθυνση των φοιτητών και ανά πενταετία βαθμολογίας. Να σημειωθεί πως οι βαθμολογίες του συγκεκριμένου παραδείγματος δεν περιλαμβάνουν τις βαθμολογίες σε μαθήματα που δεν έχουν εξεταστεί. Στην Εικόνα 4.54 παρουσιάζεται το report με τη μορφή ενός πίνακα και στην Εικόνα 4.55 παρουσιάζεται το report με τη μορφή ενός γραφήματος. Μέσος Όρος Βαθμού Column Labels Row Labels Grand Total ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ,41 7,22 6,35 7,22 ΓΕΝΙΚΗ ΚΑΤΕΥΘΥΝΣΗ 7,41 7,22 6,35 7,22 ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ,50 6,23 6,28 ΓΕΝΙΚΗ ΚΑΤΕΥΘΥΝΣΗ 3,65 4,94 4,91 ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΕΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ 6,29 6,20 6,21 ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ 6,85 6,71 6,75 ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΑΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ 6,04 6,13 6,12 ΨΗΦΙΑΚΑ ΜΕΣΑ 6,87 6,78 6,79 Grand Total 7,41 7,01 6,24 6,67 Εικόνα 4.54 Πίνακας βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας 67

68 Αποτελέσματα ΓΕΝΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΓΕΝΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΕΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ ΠΛΗΡΟΦΟΡΙΑΚ Α ΣΥΣΤΗΜΑΤΑ ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΑΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΣΤΗΝ ΨΗΦΙΑΚΑ ΜΕΣΑ Εικόνα 4.55 Γράφημα βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας Ακολουθεί μία αναφορά η οποία παρουσιάζει τον τρόπο με τον οποίο κυμαίνονται οι βαθμοί πτυχίου του συνόλου των αποφοίτων ανά φύλο των φοιτητών και ανά πενταετία ορκωμοσίας. Στην Εικόνα 4.56 παρουσιάζεται το report με τη μορφή ενός πίνακα και στην Εικόνα 4.57 παρουσιάζεται το report με τη μορφή ενός γραφήματος. Μέσος Όρος Πτυχίου Column Labels Row Labels Grand Total Άρρεν 8,11 7,49 7,33 7,45 Θήλυ 7,93 7,66 7,36 7,51 Grand Total 8,05 7,57 7,34 7,47 Εικόνα 4.56 Πίνακας βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας 8,20 8,00 7,80 7,60 7,40 7,20 7,00 6,80 Άρρεν Θήλυ Εικόνα 4.57 Γράφημα βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας 68

69 Υλοποίηση Δημιουργία ιστοσελίδας για την παρουσίαση των αποτελεσμάτων Εκτός από τις αναφορές που μπορούν να δημιουργηθούν και να παρουσιαστούν στους χρήστες μέσα από το Microsoft Excel, για την ευκολότερη και πιο εύχρηστη παρουσίαση των αναφορών στους χρήστες υλοποιήθηκε ένα web site μέσα από το οποίο μπορεί κάποιος να τις δει μέσα από ένα φυλλομετρητή (browser). Μέσα από το web site μπορεί κανείς να επιλέξει τον τρόπο εμφάνισης των δεδομένων του κύβου σε κάθε χρονική στιγμή. Για την εμφάνιση των δεδομένα σε μορφή πίνακα υπάρχει η επιλογή PivotTable από τη λίστα View. Για την εμφάνιση των δεδομένα σε μορφή γραφήματος υπάρχει η επιλογή Chart από τη λίστα View. Προεπιλεγμένη επιλογή είναι η PivotTable. Για την πραγματοποίηση λειτουργιών (OLAP πράξεων) roll up, drill down, slice, dice υπάρχουν τα διαθέσιμα κουμπιά επάνω στον πίνακα των δεδομένων. Συνιστάται η εμφάνιση της ιστοσελίδας με χρήση του Internet Explorer (έκδοση 6 ή νεότερη) για την ορθή εμφάνιση και εκτέλεση όλων των ανωτέρω λειτουργιών. Στους υπόλοιπους web browsers (Mozilla Firefox κ.τ.λ.) δεν είναι δυνατή η πραγματοποίηση slice και dice, δηλαδή η δυνατότητα φιλτραρίσματος. Οι υπόλοιπες λειτουργίες (roll up, drilldown) λειτουργούν κανονικά. Αφού επιβεβαιωθεί η ταυτότητα του χρήστη (Εικόνα 4.58), εμφανίζεται η αρχική οθόνη του web site η οποία καλοσωρίζει το χρήστη και του παρουσιάζει το σύνολο των διαθέσιμων αναφορών τις οποίες μπορεί αυτός να επιλέξει να δει (Εικόνα 4.59). Εικόνα 4.58 Αυθεντικοποίηση χρήστη Στις επόμενες εικόνες (Εικόνα 4.60, Εικόνα 4.61, Εικόνα 4.62, Εικόνα 4.63) φαίνεται ο τρόπος με τον οποίο παρουσιάζονται οι διάφοροι κύβοι δεδομένων (παραδείγματα ανάλογα της παραγράφου 4.4.2) είτε με τη μορφή πίνακα είτε με τη μορφή γραφήματος. Το σύνολο των ιστοσελίδων δημιουργήθηκε με τη χρήση του Microsoft SharePoint Server

70 Αποτελέσματα Εικόνα 4.59 Αρχική οθόνη ιστοσελίδας της αποθήκης δεδομένων Εικόνα 4.60 Πίνακας βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας 70

71 Υλοποίηση Εικόνα 4.61 Γράφημα βαθμολογιών ανά φοιτητή και χρόνο βαθμολογίας Εικόνα 4.62 Πίνακας βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας 71

72 Ανανέωση της αποθήκης δεδομένων Εικόνα 4.63 Γράφημα βαθμών πτυχίου ανά απόφοιτο και χρόνο ορκωμοσίας 4.5 Ανανέωση της αποθήκης δεδομένων Σε αυτή την παράγραφο θα πραγματοποιηθεί μία βήμα προς βήμα αναφορά του τρόπου ενημέρωσης των δεδομένων που περιέχονται στην αποθήκη δεδομένων. Η διαδικασία ανανέωσης περιλαμβάνει στοιχεία που αναφέρθηκαν σε προηγούμενες παραγράφους (Παράγραφοι 4.2.1, και 4.3.3). 1. Εύρεση της διαδρομής του αρχείου Excel στο οποίο περιέχονται τα ενημερωμένα δεδομένα. Η μορφή του αρχείου θα πρέπει να είναι σύμφωνη με όσα αναφέρθηκαν στην Παράγραφο Άνοιγμα του Import_data_into_csd_db project. Πραγματοποιείται με διπλό κλικ στο αρχείο Import_data_into_csd_db.sln (Εικόνα 4.64). Εικόνα 4.64 Άνοιγμα του Import_data_into_csd_db project 72

73 Υλοποίηση 3. Άνοιγμα του πακέτου Package.dtsx από το Solution Explorer που βρίσκεται στο δεξί μέρος της οθόνης. Πραγματοποιείται με διπλό κλικ στο Package.dtsx που βρίσκεται στο φάκελο SSIS Packages. Η μορφή του project φαίνεται στην Εικόνα Επεξεργασία της σύνδεσης με το αρχείο Excel. Πραγματοποιείται με διπλό κλικ στο Excel Connection Manager 1 που βρίσκεται στο tool pane Connection Managers. Ανοίγει το παράθυρο της Εικόνας Εύρεση του αρχείου Excel (Εικόνα 4.67) με το πάτημα του κουμπιού Browse. 6. Καταχώρηση της επιλογής με το πάτημα των κουμπιών Άνοιγμα και ΟΚ στα δύο παράθυρα. 7. Εκτέλεση των λειτουργιών του project με το πάτημα του πράσινου κουμπιού που βρίσκεται στο επάνω μέρος της οθόνης (Εικόνα 4.68) ή με το πάτημα του κουμπιού F5. 8. Αφού ολοκληρωθεί επιτυχώς η εκτέλεση του project (Εικόνα 4.69) πάτημα του τετράγωνου κουμπιού που βρίσκεται στο επάνω μέρος της οθόνης ή πάτημα των κουμπιών Shift + F5. Κλείσιμο του project. Εικόνα 4.65 Άνοιγμα του πακέτου Package.dtsx 73

74 Ανανέωση της αποθήκης δεδομένων Εικόνα 4.66 Παράθυρο εύρεσης του αρχείου Excel 9. Άνοιγμα του Csd Analysis Project. Πραγματοποιείται με διπλό κλικ στο αρχείο Csd Analysis Project.sln (Εικόνα 4.70). 10. Ταυτόχρονη επιλογή και των πέντε (5) διαστάσεων («ΧΡΟΝΟΣ_ΒΑΘΜΟΛΟΓΙΑΣ», «ΦΟΙΤΗΤΗΣ», «ΜΑΘΗΜΑ», «ΧΡΟΝΟΣ_ΟΡΚΩΜΟΣΙΑΣ» και «ΑΠΟΦΟΙΤΟΣ»), (Εικόνα 4.44). 11. Εκκίνηση επεξεργασίας των διαστάσεων με δεξί κλικ και επιλογή Process (Εικόνα 4.45). Εικόνα 4.67 Εύρεση του αρχείου Excel Εικόνα 4.68 Εκτέλεση του Import_data_into_csd_db project 74

75 Υλοποίηση Εικόνα 4.69 Τερματισμός του Import_data_into_csd_db project Εικόνα 4.70 Άνοιγμα του Csd Analysis Project project 12. Επιλογή Yes στην περίπτωση που το project δεν είναι ενημερωμένο (Εικόνα 4.46). 13. Επιλογή Process Full στη στήλη Process Options για όλες τις διαστάσεις (Εικόνα 4.47). 14. Επεξεργασία των διαστάσεων με το πάτημα του κουμπιού Run (Εικόνα 4.47). 15. Αφού ολοκληρωθεί επιτυχώς η επεξεργασία των διαστάσεων (Εικόνα 4.48), κλείσιμο των δύο ανοιχτών παραθύρων με το πάτημα του κουμπιού Close. 16. Ταυτόχρονη επιλογή και των δύο (2) κύβων ( Csd_Students_Cube.cube, Csd_Graduates_Cube.cube ), (Εικόνα 4.49). 17. Εκκίνηση επεξεργασίας των κύβων με δεξί κλικ και επιλογή Process (Εικόνα 4.50). 18. Επιλογή Yes στην περίπτωση που το project δεν είναι ενημερωμένο (Εικόνα 4.46). 19. Επιλογή Process Full στη στήλη Process Options για όλους τους κύβους (Εικόνα 4.51). 75

ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ. Παρουσίαση 2 ο μέρος:

ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ. Παρουσίαση 2 ο μέρος: ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ Παρουσίαση 2 ο μέρος: Λήψη αποφάσεων Η λήψη αποφάσεων αποτελεί κεντρική δραστηριότητα σε όλα τα επίπεδα λειτουργίας μιας επιχείρησης, από τον σχεδιασμό δράσεων,

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 3: Αποθήκες Δεδομένων Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης

Διαβάστε περισσότερα

4. ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΠΟΛΥΔΙΑΣΤΑΤΗΣ ΑΝΑΛΥΣΗΣ

4. ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΠΟΛΥΔΙΑΣΤΑΤΗΣ ΑΝΑΛΥΣΗΣ 4. ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΠΟΛΥΔΙΑΣΤΑΤΗΣ ΑΝΑΛΥΣΗΣ Στο προηγούμενο εργαστήριο είδαμε πώς μπορούμε να αντλήσουμε πληροφορίες από μια σχεσιακή βάση δεδομένων με τη βοήθεια των ερωτημάτων (queries). Το μειονέκτημα

Διαβάστε περισσότερα

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Τεχνολογίες Υποστήριξης Λήψης Διοικητικών Αποφάσεων OLTP (On Line Transaction Processing) Επιχειρηματικές Εφαρμογές (Σχεσιακές

Διαβάστε περισσότερα

Διαχείριση Πολιτισμικών Δεδομένων

Διαχείριση Πολιτισμικών Δεδομένων Διαχείριση Πολιτισμικών Δεδομένων Μάθημα 1 Εισαγωγή στις Βάσεις Δεδομένων Τζανέτος Πομόνης ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Συντήρησης Πολιτισμικής Κληρονομιάς Τι είναι οι Βάσεις

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΑΛΕΞΑΝΔΡΕΙΟ Τ.Ε.Ι ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΑΛΕΞΑΝΔΡΕΙΟ Τ.Ε.Ι ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΛΕΞΑΝΔΡΕΙΟ Τ.Ε.Ι ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Πτυχιακή Εργασία Οι τεχνολογίες OLAP και Data warehousing Του φοιτητή: Δαραβίγκα Δημήτριου Αρ. Μητρώου: 05/2933 Επιβλέπων

Διαβάστε περισσότερα

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Βάσεις Δεδομένων Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Στέργιος Παλαμάς, Υλικό Μαθήματος «Βάσεις Δεδομένων», 2015-2016 Κεφάλαιο 2: Περιβάλλον Βάσεων Δεδομένων Μοντέλα Δεδομένων 2.1

Διαβάστε περισσότερα

Συστήματα OLAP. Πασχάλης Θρήσκος, PhD Λάρισα

Συστήματα OLAP. Πασχάλης Θρήσκος, PhD Λάρισα Συστήματα OLAP Πασχάλης Θρήσκος, PhD Λάρισα 2016-2017 «Τα συστήματα άμεσης αναλυτικής επεξεργασίας (OLTP) χρησιμοποιούνται για να απαντηθούν ερωτήματα πάνω σε πολυδιάστατα δεδομένα πολύ γρήγορα» Wikipedia

Διαβάστε περισσότερα

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ ΕΝΟΤΗΤΑ 1.1 ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ ΔΙΔΑΚΤΙΚΟI ΣΤOΧΟΙ Στο τέλος της ενότητας αυτής πρέπει να μπορείτε: να επεξηγείτε τις έννοιες «βάση δεδομένων» και «σύστημα διαχείρισης βάσεων δεδομένων» να αναλύετε

Διαβάστε περισσότερα

Βάσεις δεδομένων και Microsoft Access

Βάσεις δεδομένων και Microsoft Access Περιεχόμενα Κεφάλαιο 1 Βάσεις δεδομένων και Microsoft Access... 7 Κεφάλαιο 2 Microsoft Access 2010... 16 Κεφάλαιο 3 Σχεδιασμός βάσης δεδομένων και δημιουργία πίνακα... 27 Κεφάλαιο 4 Προβολές πινάκων και

Διαβάστε περισσότερα

Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη. χρήση συναρτήσεων ομαδοποίησης κατά την εκτέλεση ενός ερωτήματος προβολής

Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη. χρήση συναρτήσεων ομαδοποίησης κατά την εκτέλεση ενός ερωτήματος προβολής Εργαστήριο 8 ο Συγκεντρωτικά ερωτήματα Ερωτήματα διασταύρωσης Ερωτήματα Ενεργειών Συγκεντρωτικά ερωτήματα Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη χρήση συναρτήσεων ομαδοποίησης

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Εξόρυξη Γνώσης από εδοµένα (Data Mining) ΠΜΣ Πληροφορικής Πανεπιστηµίου Πειραιά Εξόρυξη Γνώσης από εδοµένα (Data Mining) Αποθήκες εδοµένων Γιάννης Θεοδωρίδης Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιά http://isl.cs.unipi.gr/db/courses/dm "Πυραµίδα"

Διαβάστε περισσότερα

ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: Λήψη απόφασης, Συστήματα Υποστήριξης Αποφάσεων, OLAP Ανάλυση, Περιβαλλοντική Εκπαίδευση ΕΙΣΑΓΩΓΗ

ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: Λήψη απόφασης, Συστήματα Υποστήριξης Αποφάσεων, OLAP Ανάλυση, Περιβαλλοντική Εκπαίδευση ΕΙΣΑΓΩΓΗ Η Αναλυτική Επεξεργασία Δεδομένων (On Line Analytical Processing) στην Υποστήριξη Αποφάσεων των Υπευθύνων Περιβαλλοντικής Εκπαίδευσης των Διευθύνσεων Εκπαίδευσης Γιώργος Ραβασόπουλος 1, Ιωάννα Παπαιωάννου

Διαβάστε περισσότερα

Κεφάλαιο 4: Λογισμικό Συστήματος

Κεφάλαιο 4: Λογισμικό Συστήματος Κεφάλαιο 4: Λογισμικό Συστήματος Ερωτήσεις 1. Να αναφέρετε συνοπτικά τις κατηγορίες στις οποίες διακρίνεται το λογισμικό συστήματος. Σε ποια ευρύτερη κατηγορία εντάσσεται αυτό; Το λογισμικό συστήματος

Διαβάστε περισσότερα

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, ίαυλος ιαφάνεια 29-1

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, ίαυλος ιαφάνεια 29-1 ιαφάνεια 29-1 Εφαρµογές Βάσεων εδοµένων ΠΜΣ 510 ευτέρα 6-9 Αίθουσα Α Ώρες Γραφείου ευτέρα 5-6 (και οποιαδήποτε άλλη ώρα είµαι στο γραφείο ικτυακός τόπος www.di.uoa.gr/~pms510 Ύλη Αποθήκες δεδοµένων Εξόρυξη

Διαβάστε περισσότερα

Βάσεις Δεδομένων Ενότητα 1

Βάσεις Δεδομένων Ενότητα 1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 1: Εισαγωγή στις Ιωάννης Μανωλόπουλος, Καθηγητής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Κεφάλαιο 2 ο. Συστήματα Πληροφοριών στην επιχείρηση

Κεφάλαιο 2 ο. Συστήματα Πληροφοριών στην επιχείρηση Κεφάλαιο 2 ο Συστήματα Πληροφοριών στην επιχείρηση Διδακτικοί στόχοι Να αναλυθούν οι ρόλοι των 6 τύπων των συστημάτων πληροφοριών Να περιγραφούν οι τύποι των πληροφοριακών συστημάτων Να αναλυθούν οι σχέσεις

Διαβάστε περισσότερα

Άμεση Αναλυτική Επεξεργασία (OLAP)

Άμεση Αναλυτική Επεξεργασία (OLAP) Άμεση Αναλυτική Επεξεργασία (OLAP) Άμεση Αναλυτική Επεξεργασία (OLAP) Άμεση Αναλυτική Επεξεργασία (Online Analytical Processing - OLAP) Ανάλυση βασισμένη σε ένα κύβο OLAP Κύβος OLAP (OLAP Cube) Μια πολυδιάστατη

Διαβάστε περισσότερα

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων YouTube Ιδρύθηκε το 2005 Στόχος του ήταν να δημιουργήσει μία παγκόσμια κοινότητα Βάση δεδομένων βίντεο Μέσα σε ένα χρόνο από τη δημιουργία

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Τρόπος Διεξαγωγής #1 Ύλη (4 Ενότητες) 1. Ανάλυση Απαιτήσεων - Σχεδιασμός Βάσης Δεδομένων 2. Δημιουργία βάσης a)

Διαβάστε περισσότερα

Προηγμένα Πληροφοριακά Συστήματα. Ακαδημαϊκό Έτος

Προηγμένα Πληροφοριακά Συστήματα. Ακαδημαϊκό Έτος Προηγμένα Πληροφοριακά Συστήματα Ακαδημαϊκό Έτος 2016-2017 Ομάδα: 1. Κανούτος Κωνσταντίνος ΑΜ: 5775 2. Καραχάλιος Αθανάσιος ΑΜ: 5784 3. Κυριακού Ανδρόνικος ΑΜ: 5806 4. Ντενέζος Παναγιώτης ΑΜ: 5853 5. Παρασκευόπουλος

Διαβάστε περισσότερα

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access...9. Κεφάλαιο 2 Χειρισμός πινάκων... 25

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access...9. Κεφάλαιο 2 Χειρισμός πινάκων... 25 Περιεχόμενα Κεφάλαιο 1 Εισαγωγή στην Access...9 Γνωριμία με την Access... 12 Δημιουργία βάσης δεδομένων... 18 Άνοιγμα και κλείσιμο βάσης δεδομένων... 21 Ερωτήσεις ανακεφαλαίωσης... 22 Πρακτική εξάσκηση...

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Τρόπος Διεξαγωγής #1 Ύλη (4 Ενότητες) 1. Ανάλυση Απαιτήσεων -Σχεδιασμός Βάσης Δεδομένων 2. Δημιουργία βάσης a) Create

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Διαχείρισης Βάσεων Δεδομένων

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Διαχείρισης Βάσεων Δεδομένων ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Συστήματα Διαχείρισης Βάσεων Δεδομένων 1 ΕΙΣΑΓΩΓΗ Η τεχνολογία των Βάσεων Δεδομένων (ΒΔ) (Databases - DB) και των Συστημάτων Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ)

Διαβάστε περισσότερα

Τίτλος Ειδικού Θεματικού Προγράμματος: «Διοίκηση, Οργάνωση και Πληροφορική για Μικρομεσαίες Επιχειρήσεις»

Τίτλος Ειδικού Θεματικού Προγράμματος: «Διοίκηση, Οργάνωση και Πληροφορική για Μικρομεσαίες Επιχειρήσεις» ΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ, ΒΑΣΙΚΟΣ ΠΑΡΑΓΟΝΤΑΣ ΓΙΑ ΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΚΑΙ ΚΟΙΝΩΝΙΚΗ ΑΝΑΠΤΥΞΗ ΤΟΥ ΑΙΓΑΙΟΠΕΛΑΓΙΤΙΚΟΥ ΧΩΡΟΥ Τίτλος Ειδικού Θεματικού Προγράμματος: «Διοίκηση, Οργάνωση και Πληροφορική για Μικρομεσαίες

Διαβάστε περισσότερα

Πληροφορική 2. Βάσεις Δεδομένων (Databases)

Πληροφορική 2. Βάσεις Δεδομένων (Databases) Πληροφορική 2 Βάσεις Δεδομένων (Databases) 1 2 Επίπεδα αρχεία (flat files) Επίπεδο αρχείο είναι ένα αρχείο που αποτελείται από ένα σταθερό, μικρό αριθμό πεδίων. Οι εγγραφές του αρχείου μπορεί να μην ακολουθούν

Διαβάστε περισσότερα

Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας

Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας e.nfo Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας Εξασφάλιση της εξειδικευµένης λύσης business intelligence για κάθε επιχείρηση πελάτης Τράπεζα Πειραιώς

Διαβάστε περισσότερα

Προγράμματα Η /Υ / Εφαρμογές σε συστ ήματα Π ό οι τητας Αριστομένης Μακρής

Προγράμματα Η /Υ / Εφαρμογές σε συστ ήματα Π ό οι τητας Αριστομένης Μακρής Προγράμματα Η/Υ Εφαρμογές σε συστήματα Ποιότητας Οι οκτώ αρχές της ποιότητας Εστίαση στον πελάτη: οι επιχειρήσεις, δδ δεδομένου ότι στηρίζονται και εξαρτώνται απ τους πελάτες, οφείλουν να αναγνωρίζουν

Διαβάστε περισσότερα

Στρατηγική Επιλογή Capital B.O.S. Capital B.O.S.

Στρατηγική Επιλογή Capital B.O.S. Capital B.O.S. Στρατηγική Επιλογή Το ταχύτατα μεταβαλλόμενο περιβάλλον στο οποίο δραστηριοποιούνται οι επιχειρήσεις σήμερα, καθιστά επιτακτική -όσο ποτέ άλλοτε- την ανάπτυξη ολοκληρωμένων λύσεων που θα διασφαλίζουν,

Διαβάστε περισσότερα

Διαχείριση Δεδομένων

Διαχείριση Δεδομένων Διαχείριση Δεδομένων Βαγγελιώ Καβακλή Τμήμα Πολιτισμικής Τεχνολογίας και Επικοινωνίας Πανεπιστήμιο Αιγαίου 1 Εαρινό Εξάμηνο 2012-13 Περιεχόμενο σημερινής διάλεξης Βάσεις Δεδομένων Ορισμοί Παραδείγματα

Διαβάστε περισσότερα

Information Technology for Business

Information Technology for Business Information Technology for Business! Lecturer: N. Kyritsis, MBA, Ph.D. Candidate!! e-mail: kyritsis@ist.edu.gr Διαχείριση Επιχειρηματικών Δεδομένων - Databases Ορισμός Βάσης Δεδομένων Συλλογή συναφών αρχείων

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Μαρίνος Θεμιστοκλέους Email: mthemist@unipi.gr Ανδρούτσου 150 Γραφείο 206 Τηλ. 210 414 2723 Ώρες Γραφείου: Δευτέρα 11-12 AM Πληροφοριακά Συστήματα (ΠΣ) Information Systems (IS) Ορισμός

Διαβάστε περισσότερα

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ. Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων Δρ. Κωνσταντίνος Χ. Γιωτόπουλος Βασικά θέματα Βάσεων Δεδομένων Ένα Σύστημα Βάσης Δεδομένων

Διαβάστε περισσότερα

Οι βασικές αλλαγές που επιδρούν στο επιχειρηματικό περιβάλλον

Οι βασικές αλλαγές που επιδρούν στο επιχειρηματικό περιβάλλον Οι βασικές αλλαγές που επιδρούν στο επιχειρηματικό περιβάλλον Παγκοσμιοποίηση Οικονομία της πληροφορίας Μετασχηματισμός της επιχείρησης Εμφάνιση της ψηφιακής επιχείρησης Παγκοσμιοποίηση Διοίκηση και έλεγχος

Διαβάστε περισσότερα

Πληροφορική 2. Δομές δεδομένων και αρχείων

Πληροφορική 2. Δομές δεδομένων και αρχείων Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες

Διαβάστε περισσότερα

1. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

1. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ 1. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ Τα δεδομένα που θα επεξεργασθούμε στη διάρκεια του εργαστηρίου παραχωρήθηκαν από την εταιρεία ICAP ειδικά για τις ανάγκες του μαθήματος. Τα δεδομένα αυτά αντλήθηκαν από την

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Βάσεις Δεδομένων - Γενικά Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα. Τα περιεχόμενα

Διαβάστε περισσότερα

Εργαλεία CASE. Computer Assisted Systems Engineering. Δρ Βαγγελιώ Καβακλή. Τμήμα Πολιτισμικής Τεχνολογίας και Επικοινωνίας Πανεπιστήμιο Αιγαίου

Εργαλεία CASE. Computer Assisted Systems Engineering. Δρ Βαγγελιώ Καβακλή. Τμήμα Πολιτισμικής Τεχνολογίας και Επικοινωνίας Πανεπιστήμιο Αιγαίου ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Εργαλεία CASE Computer Assisted Systems Engineering Δρ Βαγγελιώ Καβακλή Τμήμα Πολιτισμικής Τεχνολογίας και Επικοινωνίας Πανεπιστήμιο Αιγαίου Εαρινό Εξάμηνο 2011-2012 1 Εργαλεία CASE

Διαβάστε περισσότερα

Άμεση Αναλυτική Επεξεργασία (OLAP)

Άμεση Αναλυτική Επεξεργασία (OLAP) 1 Άμεση Αναλυτική Επεξεργασία (OLAP) 2 Περιεχόμενα Εφαρμογές στις Αποθήκες Δεδομένων Άμεση Αναλυτική Επεξεργασία (OLAP) Γεγονότα και Διαστάσεις Κύβοι και Ιεραρχίες διαστάσεων Πράξεις OLAP Αρχιτεκτονικές

Διαβάστε περισσότερα

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ 1 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΑΝΑΛΥΣΗ ΜΕΝΟΥ ΕΦΑΡΜΟΓΗΣ... 4 2. ΕΠΕΞΗΓΗΣΗ ΚΕΝΤΡΙΚΟΥ ΜΕΝΟΥ ΚΑΡΤΕΛΑΣ... 5 3. ΔΗΜΙΟΥΡΓΙΑ ΠΕΛΑΤΗ... 6 4. ΑΝΑΖΗΤΗΣΗ ΠΕΛΑΤΗ... 6 5. ΕΠΕΞΕΡΓΑΣΙΑ/ΔΙΑΓΡΑΦΗ

Διαβάστε περισσότερα

Εισαγωγή στην πληροφορική

Εισαγωγή στην πληροφορική Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Εισαγωγή στην πληροφορική Ενότητα 6: Εισαγωγή στις βάσεις δεδομένων (Μέρος Α) Αγγελίδης Παντελής Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών Άδειες Χρήσης

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης. Διοικητική Επιστήμη και Λήψη Αποφάσεων

Πληροφοριακά Συστήματα Διοίκησης. Διοικητική Επιστήμη και Λήψη Αποφάσεων Πληροφοριακά Συστήματα Διοίκησης Διοικητική Επιστήμη και Λήψη Αποφάσεων Η πολυπλοκότητα των αποφάσεων Αυξανόμενη πολυπλοκότητα λόγω: Ταχύτητας αλλαγών στο εξωτερικό περιβάλλον της επιχείρησης. Έντασης

Διαβάστε περισσότερα

Κεφάλαιο 4 ο. Η ψηφιακή επιχείρηση: Ηλεκτρονικό εμπόριο και ηλεκτρονικό επιχειρείν

Κεφάλαιο 4 ο. Η ψηφιακή επιχείρηση: Ηλεκτρονικό εμπόριο και ηλεκτρονικό επιχειρείν Κεφάλαιο 4 ο Η ψηφιακή επιχείρηση: Ηλεκτρονικό εμπόριο και ηλεκτρονικό επιχειρείν Διδακτικοί στόχοι Να εξηγηθεί πώς το διαδίκτυο μετασχηματίζει τις επιχειρήσεις Να συγκριθούν οι κατηγορίες του ηλεκτρονικού

Διαβάστε περισσότερα

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων .. Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Μάθημα Βασικές Έννοιες - . Ύλη Εργαστηρίου ΒΔ Ύλη - 4 Ενότητες.1 - Σχεδιασμός Βάσης Δεδομένων.2 Δημιουργία Βάσης Δεδομένων Δημιουργία Πινάκων Εισαγωγή/Ανανέωση/Διαγραφή

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ ΔΕΔΟΜΕΝΑ ΔΕΔΟΜΕΝΑ ΠΛΗΡΟΦΟΡΙΑ ΑΡΙΘΜΟΙ ΣΥΜΒΟΛΑ - ΛΕΞΕΙΣ ΟΠΟΙΑΔΗΠΟΤΕ ΔΡΑΣΤΗΡΙΟΤΗΤΑ ΣΥΜΒΑΙΝΕΙ ΣΕ ΜΙΑ ΟΙΚΟΝΟΜΙΚΗ ΜΟΝΑΔΑ ΠΡΕΠΕΙ ΝΑ ΜΕΤΡΕΙΤΑΙ ΚΑΙ ΝΑ ΚΑΤΑΓΡΑΦΕΤΑΙ ΟΡΓΑΝΩΣΗ ΚΑΤΑΓΡΑΦΗΣ

Διαβάστε περισσότερα

Ηλεκτρονικό Εμπόριο. Ενότητα 6: Διαχείριση Σχέσεων με Πελάτες Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Ηλεκτρονικό Εμπόριο. Ενότητα 6: Διαχείριση Σχέσεων με Πελάτες Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Ηλεκτρονικό Εμπόριο Ενότητα 6: Διαχείριση Σχέσεων με Πελάτες Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Συστήματα Πληροφοριών Διοίκησης

Συστήματα Πληροφοριών Διοίκησης ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Συστήματα Πληροφοριών Διοίκησης Ενότητα 2: Γενική θεώρηση και κατάταξη συστημάτων πληροφοριών διοίκησης Διονύσιος Γιαννακόπουλος, Καθηγητής Τμήμα

Διαβάστε περισσότερα

Λίγα λόγια από το συγγραφέα... 7. 91 Βάσεις δεδομένων και Microsoft Access... 9. 92 Microsoft Access... 22

Λίγα λόγια από το συγγραφέα... 7. 91 Βάσεις δεδομένων και Microsoft Access... 9. 92 Microsoft Access... 22 ΕΝΟΤΗΤΑ 5 Περιεχόμενα Λίγα λόγια από το συγγραφέα... 7 91 Βάσεις δεδομένων και Microsoft Access... 9 92 Microsoft Access... 22 93 Το σύστημα Βοήθειας του Microsoft Office... 32 94 Σχεδιασμός βάσης δεδομένων

Διαβάστε περισσότερα

ίκτυα και Internet στο Επιχειρηματικό Περιβάλλον

ίκτυα και Internet στο Επιχειρηματικό Περιβάλλον ίκτυα και Internet στο Επιχειρηματικό Περιβάλλον 4 ο Εξάμηνο Τμήμα ιοικητικής Επιστήμης & Τεχνολογίας Οικονομικό Πανεπιστήμιο Αθηνών Αγγελική Πουλυμενάκου Μάρτιος 2012 Ευχαριστούµε τουςγ. ιακονικολάου,

Διαβάστε περισσότερα

ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΧΡΗΣΤΗ. Ηλεκτρονική Υποβολή Α.Π.Δ.

ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΧΡΗΣΤΗ. Ηλεκτρονική Υποβολή Α.Π.Δ. ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΧΡΗΣΤΗ Ηλεκτρονική Υποβολή Α.Π.Δ. ΠΕΡΙΕΧΟΜΕΝΑ 1) Είσοδος στην εφαρμογή 2) Δημιουργία Περιόδου Υποβολής 2.α) Ακύρωση Περιόδου Υποβολής 3) Μέθοδος Υποβολής: Συμπλήρωση Φόρμας 3.α) Συμπλήρωση

Διαβάστε περισσότερα

Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub

Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub Σύνοψη Σ αυτό το κεφάλαιο θα περιγράψουμε τη δημιουργία φορμών, προκειμένου να εισάγουμε δεδομένα και να εμφανίζουμε στοιχεία από τους πίνακες

Διαβάστε περισσότερα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων ..?????? Εργαστήριο ΒΑΣΕΙΣ????????? ΔΕΔΟΜΕΝΩΝ Βάσεων Δεδομένων?? ΙΙ Εισαγωγικό Μάθημα Βασικές Έννοιες - . Γενικά Τρόπος Διεξαγωγής Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα

Διαβάστε περισσότερα

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο Βάσεις Δεδομένων Εισαγωγή Ανάλυση Απαιτήσεων Φροντιστήριο 1 ο 16-10-2008 Εισαγωγή - Ορισμοί Βάση Δεδομένων είναι μία συλλογή από σχετιζόμενα αντικείμενα Ένα σύστημα διαχείρισης βάσεων δεδομένων (ΣΔΒΔ)

Διαβάστε περισσότερα

Ομαδοποίηση των απαιτήσεων του προτύπου ISO Σύστημα ποιότητας Ευθύνη της διοίκησης Διαχείριση πόρων Υλοποίηση του προϊόντος

Ομαδοποίηση των απαιτήσεων του προτύπου ISO Σύστημα ποιότητας Ευθύνη της διοίκησης Διαχείριση πόρων Υλοποίηση του προϊόντος Ομαδοποίηση των απαιτήσεων του προτύπου ISO 9001:2000 Σύστημα ποιότητας Ευθύνη της διοίκησης Διαχείριση πόρων Υλοποίηση του προϊόντος / Παροχή της υπηρεσίας Μέτρηση ανάλυση και βελτίωση Εισαγωγή στα Συστήματα

Διαβάστε περισσότερα

Μεθοδική Ανάπτυξη Δικτυακής Υποδομής. Παρουσίαση στην ημερίδα για Σύγχρονες τάσεις στις Τηλεπικοινωνίες και Τεχνολογίες Αιχμής

Μεθοδική Ανάπτυξη Δικτυακής Υποδομής. Παρουσίαση στην ημερίδα για Σύγχρονες τάσεις στις Τηλεπικοινωνίες και Τεχνολογίες Αιχμής Μεθοδική Ανάπτυξη Δικτυακής Υποδομής Παρουσίαση στην ημερίδα για Σύγχρονες τάσεις στις Τηλεπικοινωνίες και Τεχνολογίες Αιχμής 14-01-2006 1 Περιεχόμενα Η ανάγκη για μεθοδικό σχεδιασμό δικτύων Μία δομημένη

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑ: ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ ΜΟΝΤΕΛΑ ΣΥΣΤΗΜΑΤΟΣ Διδάσκων: Γ. Χαραλαμπίδης, Επ. Καθηγητής

Διαβάστε περισσότερα

PROJECT ΕΡΓΑΣΤΗΡΙΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Ι. Τμήμα Μηχανικών Πληροφορικής Τ.Ε.

PROJECT ΕΡΓΑΣΤΗΡΙΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Ι. Τμήμα Μηχανικών Πληροφορικής Τ.Ε. Παραδοτέα 1. Το αρχείο.mdb της βάσης δεδομένων σας σε ACCESS 2. Ένα CD που θα αναγράφει το ονοματεπώνυμο του σπουδαστή και το ΑΕΜ και θα περιέχει το αρχείο.mdb της βάσης δεδομένων καθώς και το εγχειρίδιο

Διαβάστε περισσότερα

Πληροφοριακού Συστήματος Ενημέρωσης Καιρικών Συνθηκών

Πληροφοριακού Συστήματος Ενημέρωσης Καιρικών Συνθηκών Τι είναι Πληροφοριακό Σύστημα και Βάση Δεδομένων Πληροφοριακό σύστημα Είναι το σύστημα, που επεξεργάζεται εισόδους, συντηρεί αρχεία και παράγει πληροφορίες κάθε μορφής. Είναι ο συνεκτικός κρίκος των υποσυστημάτων

Διαβάστε περισσότερα

Εισαγωγή στην Πληροφορική

Εισαγωγή στην Πληροφορική Εισαγωγή στην Πληροφορική Βάσεις Δεδομένων ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Συντήρησης Πολιτισμικής Κληρονομιάς Τι είναι οι Βάσεις Δεδομένων; Σύστημα για αποθήκευση, μετάδοση

Διαβάστε περισσότερα

Διαχείριση Πολιτισμικών Δεδομένων

Διαχείριση Πολιτισμικών Δεδομένων Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Διαχείριση Πολιτισμικών Δεδομένων Ενότητα 6: Εισαγωγή στις Βάσεις Δεδομένων Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και

Διαβάστε περισσότερα

Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων. Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ

Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων. Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ Χρήστες ΣΔΒΔ Απλοί Χρήστες: συγκεκριμένες λειτουργίες σε

Διαβάστε περισσότερα

Διαχείριση έργων. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση

Διαχείριση έργων. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση Διαχείριση έργων Στόχοι Ερμηνεία των κύριων εργασιών ενός διευθυντή έργου λογισμικού Παρουσίαση της διαχείρισης έργων λογισμικού και περιγραφή των χαρακτηριστικών που τη διακρίνουν Εξέταση του σχεδιασμού

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΣΧΕΔΙΑΣΗ ΚΑΙ ΧΡΗΣΗ ΕΚΤΥΠΩΣΕΩΝ-ΑΝΑΦΟΡΩΝ ΣΤΑ ΣΥΣΤΗΜΑΤΑ ERP ΜΕ ΣΚΟΠΟ ΤΗΝ ΣΤΗΡΙΞΗ ΑΠΟΦΑΣΕΩΝ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Διαβάστε περισσότερα

Μάθημα 3. Θεμέλια Επιχειρηματικής Ευφυΐας: Διαχείριση Βάσεων Δεδομένων και πληροφοριών

Μάθημα 3. Θεμέλια Επιχειρηματικής Ευφυΐας: Διαχείριση Βάσεων Δεδομένων και πληροφοριών Μάθημα 3. Θεμέλια Επιχειρηματικής Ευφυΐας: Διαχείριση Βάσεων Δεδομένων και πληροφοριών Περιεχόμενα μαθήματος Πώς οργανώνει τα δεδομένα μια σχεσιακή βάση δεδομένων και σε τι διαφέρει από μια αντικειμενοστρεφή

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Χειμερινό Εξάμηνο 2013 - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ Δρ. Βαγγελιώ Καβακλή ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ, ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ 1 Αρχιτεκτονική

Διαβάστε περισσότερα

Κεφάλαιο 1 ο. Διοίκηση και διαχείριση της ψηφιακής επιχείρησης

Κεφάλαιο 1 ο. Διοίκηση και διαχείριση της ψηφιακής επιχείρησης Κεφάλαιο 1 ο Διοίκηση και διαχείριση της ψηφιακής επιχείρησης Διδακτικοί στόχοι Να αναλυθεί ο ρόλος των πληροφοριακών συστημάτων στο επιχειρηματικό περιβάλλον Ναοριστείτοπληροφοριακόσύστημα, η ορολογία

Διαβάστε περισσότερα

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται:

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται: Μάθημα 10 Συστήματα Διάχυσης και Διαχείρισης Γνώσης Chapter 10 Knowledge Transfer In The E-world Chapter 13 Knowledge Management Tools and Knowledge Portals Συστήματα Διάχυσης και Διαχείρισης Γνώσης Λογισμικό

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση. Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική

ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση. Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική Θεσσαλονίκη, Σεπτέμβριος 2013 Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση

Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση Γιάννης Θεοδωρίδης InfoLab, Τμήμα Πληροφορικής, Πανεπιστήμιο Πειραιά http://infolab.cs.unipi.gr version: Nov.2009 Πηγές Το κύριο μέρος των διαφανειών προέρχεται

Διαβάστε περισσότερα

Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών

Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών ΕΠΛ362: Τεχνολογία Λογισμικού ΙΙ (μετάφραση στα ελληνικά των διαφανειών του βιβλίου Software Engineering, 9/E, Ian Sommerville, 2011) Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών Οι διαφάνειες αυτές

Διαβάστε περισσότερα

Μάθημα 6 ο : Πληροφοριακά Συστήματα Επιχειρήσεων (1/2)

Μάθημα 6 ο : Πληροφοριακά Συστήματα Επιχειρήσεων (1/2) Μάθημα 6 ο : Πληροφοριακά Συστήματα Επιχειρήσεων (1/2) ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ 1/47 ΗΛΙΑΣ ΓΟΥΝΟΠΟΥΛΟΣ Σκοπός 6 ου Μαθήματος Να γνωρίσετε: Τις επιχειρηματικές λειτουργίες και οντότητες Την επιχειρηματική

Διαβάστε περισσότερα

Singular Report Generator. Σχ 1 ηµιουργία Καταστάσεων SRG

Singular Report Generator. Σχ 1 ηµιουργία Καταστάσεων SRG Μια από τις πιο σηµαντικές ανάγκες που αντιµετωπίζει µια επιχείρηση κατά την εγκατάσταση ενός λογισµικού «πακέτου» (Οικονοµικής & Εµπορικής ιαχείρισης), είναι ο τρόπος µε τον οποίο πρέπει να ανταποκριθεί

Διαβάστε περισσότερα

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ 1 Βάση Δεδομένων: Με το όρο Βάση Δεδομένων εννοούμε ένα σύνολο δεδομένων που είναι οργανωμένο

Διαβάστε περισσότερα

Κατανόηση των παραγόντων που συνδέονται με την εξέλιξη των συστημάτων ERP

Κατανόηση των παραγόντων που συνδέονται με την εξέλιξη των συστημάτων ERP Συστήματα ERP και βελτίωση επιχειρησιακών διαδικασιών Κατανόηση των παραγόντων που συνδέονται με την εξέλιξη των συστημάτων ERP Βελτίωση επιχειρησιακών διαδικασιών (BPR, CPI) Κατανομή μοντέλου επεξεργασίας

Διαβάστε περισσότερα

5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Το μοντέλο που δημιουργήσαμε στο προηγούμενο εργαστήριο έχει βελτιωθεί εν μέρει ώστε να συμπεριλάβει και κάποιες δυνατότητες οι οποίες απαιτούν σχετικά εξειδικευμένες

Διαβάστε περισσότερα

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel...9

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel...9 Περιεχόμενα Κεφάλαιο 1 Γνωριμία με το Excel...9 Τα στοιχεία του παραθύρου του Excel... 10 Κελιά και διευθύνσεις... 13 Σε ποιο κελί θα τοποθετηθούν τα δεδομένα;... 14 Καταχώριση δεδομένων... 15 Τι καταλαβαίνει

Διαβάστε περισσότερα

Έννοιες Διαχείρισης Βάσεων Δεδομένων και Αρχιτεκτονική

Έννοιες Διαχείρισης Βάσεων Δεδομένων και Αρχιτεκτονική Έννοιες Διαχείρισης Βάσεων Δεδομένων και Αρχιτεκτονική Αρχιτεκτονική ANSI-SPARC, Επίπεδα Αρχιτεκτονικής (Εξωτερικό, Εννοιολογικό, Εσωτερικό), Παραδοσιακή Προσέγγιση (Μειονεκτήματα, Παράδειγμα), Προσέγγιση

Διαβάστε περισσότερα

Μάθημα 4ο. Προγράμματα

Μάθημα 4ο. Προγράμματα Μάθημα 4ο Προγράμματα Σελίδα 47 από 106 4.1 Εγκατάσταση προγραμμάτων Όπως έχουμε πει στο πρώτο μάθημα (Σημειώσεις 1ου Μαθήματος 1.3.3.Β σελ. 12) τα προγράμματα ή αλλιώς εφαρμογές αποτελούν μέρος του λογισμικού

Διαβάστε περισσότερα

ΔΗΜΙΟΥΡΓΙΑ ΚΑΙ ΠΑΡΑΓΩΓΗ ΔΙΑΦΗΜΙΣΗΣ

ΔΗΜΙΟΥΡΓΙΑ ΚΑΙ ΠΑΡΑΓΩΓΗ ΔΙΑΦΗΜΙΣΗΣ ΔΗΜΙΟΥΡΓΙΑ ΚΑΙ ΠΑΡΑΓΩΓΗ ΔΙΑΦΗΜΙΣΗΣ Η διαφήμιση με μία μόνο λέξη χαρακτηρίζεται και ως «υπόσχεση», καθώς δίνει μια υπόσχεση στον υποψήφιο αγοραστή, για το προϊόν που διαφημίζει και αναφέρεται στην επίδραση

Διαβάστε περισσότερα

Εισαγωγή στην Access 2007

Εισαγωγή στην Access 2007 Βάσεις Δεδομένων Ι 3 Εισαγωγή στην Access 2007 Τμήμα Διοίκησης Επιχειρήσεων (Μεσολόγγι) ΤΕΙ Δυτικής Ελλάδας ΝΙΚΟΣ ΚΑΡΟΥΣΟΣ - ΔΙΟΝΥΣΗΣ ΚΑΡΟΥΣΟΣ XE 2015-2016 Βάση Δεδομένων και Access Ένα οργανωμένο σύνολο

Διαβάστε περισσότερα

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel... 9

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel... 9 Περιεχόμενα Κεφάλαιο 1 Γνωριμία με το Excel... 9 Τα στοιχεία του παραθύρου του Excel... 10 Κελιά και διευθύνσεις... 13 Σε ποιο κελί θα τοποθετηθούν τα δεδομένα;... 14 Καταχώριση δεδομένων... 15 Τι καταλαβαίνει

Διαβάστε περισσότερα

Σχεδιασμός Βάσεων Δεδομένων

Σχεδιασμός Βάσεων Δεδομένων Πανεπιστήμιο Πειραιώς Τμήμα Ψηφιακών Συστημάτων Σχεδιασμός Βάσεων Δεδομένων Εργαστήριο 4 Δρ. Βασιλική Κούφη Περιεχόμενα Υλοποίηση Βάσεως Δεδομένων Εκτέλεση ερωτημάτων SQL στην Βάση Δεδομένων BHMA 1. Σχεδιασμός

Διαβάστε περισσότερα

4/2014 ΣΥΝΟΠΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΥΔΡΟΛΗΨΙΕΣ ΑΤΤΙΚΗΣ ΑΠΟΚΕΝΤΡΩΜΕΝΗ ΔΙΟΙΚΗΣΗ ΑΤΤΙΚΗΣ ΔΙΕΥΘΥΝΣΗ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ

4/2014 ΣΥΝΟΠΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΥΔΡΟΛΗΨΙΕΣ ΑΤΤΙΚΗΣ ΑΠΟΚΕΝΤΡΩΜΕΝΗ ΔΙΟΙΚΗΣΗ ΑΤΤΙΚΗΣ ΔΙΕΥΘΥΝΣΗ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ 4/2014 ΣΥΝΟΠΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΥΔΡΟΛΗΨΙΕΣ ΑΤΤΙΚΗΣ ΑΠΟΚΕΝΤΡΩΜΕΝΗ ΔΙΟΙΚΗΣΗ ΑΤΤΙΚΗΣ ΔΙΕΥΘΥΝΣΗ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΥΔΡΟΛΗΨΙΕΣ ΑΤΤΙΚΗΣ Η εφαρμογή "Υδροληψίες Αττικής" είναι ένα πληροφοριακό σύστημα (αρχιτεκτονικής

Διαβάστε περισσότερα

Μάθημα 3: Αρχιτεκτονική Υπολογιστών

Μάθημα 3: Αρχιτεκτονική Υπολογιστών Μάθημα 3: Αρχιτεκτονική Υπολογιστών 3.1 Περιφερειακές μονάδες και τμήμα επεξεργασίας Στην καθημερινή μας ζωή ερχόμαστε συνέχεια σε επαφή με υπολογιστές. Ο υπολογιστής είναι μια συσκευή που επεξεργάζεται

Διαβάστε περισσότερα

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access Κεφάλαιο 2 Χειρισμός πινάκων... 27

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access Κεφάλαιο 2 Χειρισμός πινάκων... 27 Περιεχόμενα Κεφάλαιο 1 Εισαγωγή στην Access... 9 Γνωριμία με την Access... 12 Δημιουργία βάσης δεδομένων... 22 Άνοιγμα και κλείσιμο βάσης δεδομένων... 24 Ερωτήσεις ανακεφαλαίωσης... 25 Πρακτική εξάσκηση...

Διαβάστε περισσότερα

Πρόλογος... 7 ΕΙΔΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ

Πρόλογος... 7 ΕΙΔΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 7 ΕΙΔΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Α Δομή και λειτουργία προσωπικού υπολογιστή...11 ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Β Δομή και χρήση λειτουργικών συστημάτων DOS, UNIX και λειτουργικού

Διαβάστε περισσότερα

Είσοδος στην εφαρμογή Δημιουργία Εταιρίας Καρτέλα Στοιχεία εταιρίας: Καρτέλα Πρόσθετα στοιχεία: Καρτέλα Τράπεζα:...

Είσοδος στην εφαρμογή Δημιουργία Εταιρίας Καρτέλα Στοιχεία εταιρίας: Καρτέλα Πρόσθετα στοιχεία: Καρτέλα Τράπεζα:... Περιεχόμενα Είσοδος στην εφαρμογή... 3 Δημιουργία Εταιρίας... 5 Καρτέλα Στοιχεία εταιρίας:... 6 Καρτέλα Πρόσθετα στοιχεία:... 6 Καρτέλα Τράπεζα:... 7 Καρτέλα λογιστική:... 9 Καρτέλα e-mail info... 9 Δημιουργία

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ασκήσεις και ερωτήσεις

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ασκήσεις και ερωτήσεις ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ασκήσεις και ερωτήσεις 1) Ερωτήσεις Σωστού/Λάθους (ΣΛ) Το πακέτο λογισμικού Excel της Microsoft είναι λογισμικό διαχείρισης ΒΔ (ΣΛ) Το πακέτο λογισμικού Access της Microsoft είναι λογισμικό

Διαβάστε περισσότερα

Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων

Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων Κεφάλαιο 11 Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων 11.1 Λήψη αποφάσεων και πληροφοριακά συστήματα Η επιχειρηματική αξία της βελτιωμένης λήψης αποφάσεων Είναι εφικτό να αποτιμηθεί σε κάποιον

Διαβάστε περισσότερα

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση Διαδικασίες παραγωγής λογισμικού Περιεχόμενα Παρουσίαση μοντέλων διεργασίας ανάπτυξης λογισμικού Περιγραφή τριών γενικών μοντέλων διεργασίας ανάπτυξης λογισμικού Γενική περιγραφή των διαδικασιών που περιλαμβάνονται

Διαβάστε περισσότερα

CYPDIS BI Platform. ών Υπηρεσιών

CYPDIS BI Platform. ών Υπηρεσιών CYPDIS BI Platform Η επιχειρηματική νοημοσύνη (BI) του συστήματος βασίζεται στην πλατφόρμα Pentaho. Πρόκειται για μια πλατφόρμα λογισμικού που αποτελείται από το πλαίσιο (framework), τα εργαλεία (ΒΙ Components),

Διαβάστε περισσότερα

1.1. Βάσεις δεδομένων

1.1. Βάσεις δεδομένων 1.1 Βάσεις δεδομένων Οι στόχοι μας σε αυτό το κεφάλαιο: Να διατυπώσουμε τον ορισμό για τη βάση δεδομένων και για το σύστημα διαχείρισης βάσεων δεδομένων (ΣΔΒΔ), καθώς και να περιγράψουμε τα συστατικά στοιχεία

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Η Έρευνα Μάρκετινγκ ως εργαλείο ανάπτυξης νέων προϊόντων ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ.

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ & ΟΡΓΑΝΙΣΜΩΝ ΔΕΟ 11-ΕΙΣΑΓΩΓΗ ΣΤΗ ΔΙΟΙΚΗΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ & ΟΡΓΑΝΙΣΜΩΝ 3 Η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ ΦΟΙΤΗΤΗ ΑΜ.

ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ & ΟΡΓΑΝΙΣΜΩΝ ΔΕΟ 11-ΕΙΣΑΓΩΓΗ ΣΤΗ ΔΙΟΙΚΗΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ & ΟΡΓΑΝΙΣΜΩΝ 3 Η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ ΦΟΙΤΗΤΗ ΑΜ. ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ & ΟΡΓΑΝΙΣΜΩΝ ΔΕΟ 11-ΕΙΣΑΓΩΓΗ ΣΤΗ ΔΙΟΙΚΗΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ & ΟΡΓΑΝΙΣΜΩΝ 3 Η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ ΦΟΙΤΗΤΗ ΑΜ. ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή..σελ. 2 Μέτρηση εργασίας σελ. 2 Συστήματα διαχείρισης

Διαβάστε περισσότερα

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής Εισαγωγή στις Βάσεις Δεδομένων Εισαγωγή στις Βάσεις Δεδομένων Ορισμός Βάσης Δεδομένων Σύστημα Διαχείρισης Βάσης Δεδομένων ΣΔΒΔ (DBMS) Χαρακτηριστικά προσέγγισης συστημάτων αρχειοθέτησης Χαρακτηριστικά

Διαβάστε περισσότερα

Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με στόχο τη διαδικασία υποστήριξης λήψης αποφάσεων -

Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με στόχο τη διαδικασία υποστήριξης λήψης αποφάσεων - Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) Ορισμοί Data Warehouse 1. 2. Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με

Διαβάστε περισσότερα

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Β ΓΥΜΝΑΣΙΟΥ ΟΜΑΔΑ ΕΡΓΑΣΙΑΣ Ανδρέας Σ. Ανδρέου (Αναπλ. Καθηγητής ΤΕΠΑΚ - Συντονιστής) Μάριος Μιλτιάδου,

Διαβάστε περισσότερα

Επιχειρησιακά Πληροφοριακά Συστήματα. Site: www.aggelopoulos.tk e-mail: ioannis.aggelopoulos@gmail.com. Στόχος Σκοπός μαθήματος

Επιχειρησιακά Πληροφοριακά Συστήματα. Site: www.aggelopoulos.tk e-mail: ioannis.aggelopoulos@gmail.com. Στόχος Σκοπός μαθήματος Επιχειρησιακά Πληροφοριακά Συστήματα Διδάσκων: Αγγελόπουλος Γιάννης Δευτέρα 3-5 Τρίτη 4-6 Εργαστήριο Α Site: www.aggelopoulos.tk e-mail: ioannis.aggelopoulos@gmail.com 1 Στόχος Σκοπός μαθήματος Σκοπός:

Διαβάστε περισσότερα