ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚ. ΜΗΧ. ΚΑΙ ΜΗΧ. ΥΠΟΛΟΓΙΣΤΩΝ ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ ΑΠΟΘΗΚΕΣ Ε ΟΜΕΝΩΝ ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -1 ΕΙΣΑΓΩΓΗ ΑΠΟΘΗΚΕΣ Ε ΟΜΕΝΩΝ ΚΑΙ ΑΝΑΛΥΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ (Data Warehousing - OLAP ) ιαφορές OLTP - OLAP Αρχιτεκτονικές Αποθηκών εδοµένων, Σχεδιασµός Αποθηκών εδοµένων, Ειδικά Θέµατα, Μοντέλα Συστηµάτων Αναλυτικής Επεξεργασίας. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -2
ΣΥΣΤΗΜΑΤΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΟΣΟΛΗΨΙΩΝ (OLTP) Ενα πλήρες σύστηµα που περιέχει εργαλεία για προγραµµατισµό εφαρµογών, εκτέλεση και διαχείριση των δοσοληψιών Μια τέτοια εφαρµογή πρέπει να δουλεύει συνεχώς (Fault Tolerant), εξελίσσεται συνεχώς, είναι συνήθως κατανεµηµένη (Client Server) και περιλαµβάνει:» Βάση εδοµένων» ίκτυο» Προγράµµατα για την εφαρµογή Εξαιρετικά κρίσηµη για τη λειτουργία κάθε οργανισµού ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -3 ΣΥΣΤΗΜΑΤΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΟΣΟΛΗΨΙΩΝ (OLTP) οσοληψία(transaction) Εκτέλεση µιας σειράς πράξεων όπου ισχύουν οι ACID ιδιότητες. On-line Transaction Ελάχιστος χρόνος εκτέλεσης κάθε δοσοληψίας. Λιγότερες από 10 προσβάσεις δίσκου. Περιορισµένος αριθµός υπολογισµών. ΧΑΜΗΛΟ ΟΡΙΟ:»100 on-line transactions per second (TPS) σε µια Β µικρότερη του 1 GB YΨΗΛΟ ΟΡΙΟ:»50000 TPS σε µια Β µεγαλύτερη του 1 ΤB. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -4
ΑΝΑΛΥΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ (OLAP) Συστήµατα Στήριξης Αποφάσεων (DSS) υποβοήθηση λήψης αποφάσεων µε πληροφορίες και αναφορές που είναι κατάλληλες (business data) OLAP ευέλικτη, υψηλής απόδοσης πρόσβαση και ανάλυση µεγάλου όγκου σύνθετων δεδοµένων από διαφορετικές εφαρµογές Visualization of business data (πολυδιάστατα) data mining, query & reporting, στατιστική ανάλυση, πολυδιάστατη ανάλυση Data Mining εξεύρεση patterns σε τεράστιες βάσεις δεδοµένων OLAP + Data Mining ===> On-line Analytical Mining ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -5 Παραδείγµατα ερωτήσεων OLAP εφαρµογών Ποιός ήταν ο όγκος πωλήσεων ανά περιοχή και κατηγορία προϊόντος την περασµένη χρονιά; Πόσο σχετίζονται οι αυξήσεις τιµών των υπολογιστών µε τα κερδών των πωλήσεων τα 10 τελευταία χρόνια; Ποια ήταν τα δέκα πρώτα καταστήµατα σε πωλήσεις CD; Πόσους δίσκους πουλήσαµε στην υτική Περιφέρεια το τελευταίο τέταρτο της περσινής χρονιάς σε καταστήµατα µε κατανάλωση µεγαλύτερη από 100 δίσκους µηνιαίως, και ποιό το κέρδος µας από αυτές τις πωλήσεις; Πόσο ποσοστό από του πελάτες που αγοράζουν αναψυκτικά και πατατάκια; ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -6
OLAP Queries Πρόσβαση σε ΠΟΛΥ µεγάλο όγκο δεδοµένων Ανάλυση των συσχετίσεων µεταξύ πολλών τύπων επιχειρισιακών στοιχείων Συµµετοχή αθροιστικών και ιστορικών δεδοµένων σε πολύπλοκες ερωτήσεις Παρουσίαση δεδοµένων από διαφορετικές οπτικές γωνίες (π.χ. πωλήσεις ανά περιοχή, πωλήσεις ανά τµήµα κλπ.) Συµµετοχή πολύπλοκων υπολογισµών (π.χ. στατιστικές συναρτήσεις) Γρήγορη απάντηση σε πολύπλοκες απαιτήσεις. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -7 OLAP - OLTP Οµοιότητες / ιαφορές OLTP OLAP οµή RDBMS RDBMS Πρόσβαση SQL SQL + business Analysis Exntensions Ανάγκες που Αυτοµατισµός Άντληση και Καλύπτουν καθηµερινών επεξεργασία πληροφ. εργασιών για χάραξη στρατηγικής Τύπος εδοµένων Λεπτοµερή Συνοπτικά - Επιχειρ. Λειτουργικά Πληροφορίες Όγκος εδοµένων > 100 GB > 1 TB Φύση εδοµένων υναµικά, Τρέχοντα Στατικά, Ιστορικά ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -8
OLAP - OLTP Οµοιότητες / ιαφορές OLTP OLAP I/O Τύποι Πειριοριµένο I/Os Εκτεταµένο I/Os Συχνό disk seeks disk scans Τροποποιήσεις Συνεχείς Απλές Ενηµερώσεις (Modifications) (Transactions) (Batch Refresh) Μέτρηση Απόδοσης Throughput Χρόνος Απόκρισης Φόρτος οσοληψίες µε Ερωτήσεις που πρόσβαση λίγων σαρώνουν εγγραφών εκατοµµύρια εγγραφών Τυπικοί Χρήστες Χαµηλόβαθµοι Υπ. Υψηλόβαθµοι Υπ. Interaction Προγεγραµµένη Ad-hoc ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -9 OLAP - OLTP Οµοιότητες / ιαφορές OLTP OLAP Αριθµός Χρηστών Χιλλιάδες εκάδες Εστίαση Εισαγωγή Εξαγωγή εδοµένων Πληροφοριών Σχεδίαση Β Κατευθυνόµενη Κατευθυνόµενη από Εφαρµογή από Περιεχόµενο Υπάρχει ένα συνεχώς διευρυνόµενο τεχνολογικό χάσµα µεταξύ OLAP και OLTP που οφείλεται σε σηµαντικές διαφορετικές απαιτήσεις για επίτευξη των αναγκών των δυο τεχνολογιών πληροφορίας Ουσιαστικά, έχει να κάνει µε PERFORMANCE ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -10
ΣΥΝΟΨΗ ΣΤΟΧΩΝ και ΜΕΘΟ ΟΛΟΓΙΑΣ DATA WAREHOUSES: Μια στρατηγική για: ολοκλήρωση ετερογενών πηγών πληροφοριών πλάγια αντιµετώπιση των γνωστών LEGACY SYSTEMS αποφυγή του γνωστού προβλήµατος σύγκρουσης µεταξύ OLTP και OLAP (DSS). Εποµένως, δυνατότητα να υπάρξει αυτόνοµα το OLAP. Παρατηρήσεις σε DW: τεράστια ποικιλία προϊόντων / στρατηγικής των προµηθευτών τεράστια ποικιλία εφαρµογών και των απαιτήσεών τους (ακόµη και οι προµηθευτές παραδέχονται ότι κάθε DW χρειάζεται ειδική κατασκευή και βελιστοποίηση - customization) έλλειψη σαφούς / τυπικής κατανόησης απαιτήσεων ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -11 Από την Επεξεργασία οσοληψιών στην Αναλυτική Επεξεργασία OLTP Systems Data Warehouse OLAP Applications Operational Schema Operational Data Data Warehouse Schema Reconciled Data User Schema Derived Schema ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -12
Αρχιτεκτονική Αποθήκης εδοµένων Εφαρµογές Ανάλυσης GIS OLAP DSS Συλλογή εδοµένων Συλλογή εδοµένων ιαχειριστής Βάση Μέτα- εδοµένων Αποθήκη εδοµένων Μεταφορείς Πηγές Αρχείο Κειµένου Βάση εδοµένων Εξωτερικά εδοµένα ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -13 Αρχιτεκτονική Αποθήκης εδοµένων οµικά Στοιχεία Αποθήκης εδοµένων Πηγές : Κάθε πηγή από την οποία η Αποθήκη εδοµένων αντλεί δεδοµένα. Μεταφορείς - Μετατροπείς : Εφαρµογές που εκτελούν τις διαδικασίες µεταφοράς των δεδοµένων από τις πηγές στην Αποθήκη εδοµένων. Αποθήκη εδοµένων, Συλλογές εδοµένων : Τα συστήµατα που αποθηκεύονται τα δεδοµένα που παρέχονται προς τους χρήστες. Εφαρµογές Ανάλυσης : Εφαρµογές που έχουν πρόσβαση στην Αποθήκη εδοµένων. (συστήµατα στήριξης αποφάσεων) ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -14
Αρχιτεκτονική Αποθήκης εδοµένων οµικά Στοιχεία Αποθήκης εδοµένων Βάση Μετα- εδοµένων : Σύστηµα αποθήκευσης πληροφορίας σχετικά µε τη δοµή και λειτουργία του συστήµατος. ιαχειριστής : Εφαρµογή που παρέχει δυνατότητα διαχείρισης του συστήµατος ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -15 Αρχιτεκτονική Αποθήκης εδοµένων Πηγές εδοµένων Βάσεις εδοµένων των συστηµάτων του οργανισµού. Εξωτερικές πηγές πληροφοριών όπως πληροφορίες που παρέχονται από πληροφοριακά συστήµατα στα οποία υπάρχει πρόσβαση από τον οργανισµό. Αρχεία Εφαρµογών και αρχεία κειµένου. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -16
Αρχιτεκτονική Αποθήκης εδοµένων Μεταφορείς - Μετατροπείς Εξαγωγή δεδοµένων από τις πηγές. Καθαρισµό των δεδοµένων µε την διάγνωση πιθανών ασυνεπειών και τη µεταφορά µόνο των πραγµατικά χρήσιµων δεδοµένων. Μετάδοση δεδοµένων σε υψηλές ταχύτητες. Μετατροπή των δεδοµένων µεταξύ διαφορετικών µοντέλων και προτύπων. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -17 Αρχιτεκτονική Αποθήκης εδοµένων Μεταφορείς - Μετατροπείς ιάγνωση αλλαγών στα δεδοµένα των πηγών και µεταφορά των νέων δεδοµένων Εισαγωγή των δεδοµένων στην Αποθήκη εδοµένων. ηµιουργία αντιγράφων τµηµάτων των πηγών στην Αποθήκη εδοµένων. Ανάλυση των µεταφερόµενων δεδοµένων για τη διάγνωση µη ορθής πληροφορίας. Έλεγχος πληρότητας εδοµένων. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -18
Αρχιτεκτονική Αποθήκης εδοµένων Αποθήκες εδοµένων (Data Warehouses) Συλλογές εδοµένων (Data Marts) Data Mart Data Mart ύο εναλακτικά µοντέλα Data Warehouse Σχεσιακά Συστήµατα Αναλυτικής Επεξεργασίας (ROLAP) Πολυδιάστατα Συστήµατα Αναλυτικής Επεξεργασίας (MOLAP) ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -19 ROLAP Αρχιτεκτονική ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -20
ΜOLAP Αρχιτεκτονική ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -21 Αρχιτεκτονική Αποθήκης εδοµένων Βάση Μετα- εδοµένων (Περιεχόµενο) Λεξικό εδοµένων (ορισµός και περιγραφή των δεδοµένων που αποθηκεύονται στην Αποθήκη εδοµένων και τις µεταξύ τους συσχετίσεις). Ροή δεδοµένων µέσα στο σύστηµα. Κανόνες µετατροπής των δεδοµένων κατά τη µεταφορά τους. εδοµένα ελέγχου των διαφόρων εκδοχών (versions) των δεδοµένων. Στατιστικά χρήσης των δεδοµένων. Πληροφορία σχετικά µε τους κανόνες ελέγχου πρόσβασης στην Αποθήκη εδοµένων. ιάφορα ψευδώνυµα (aliases). ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -22
Σχεδίαση και Ανάπτυξη Αρχιτεκτονικής Αποθήκης εδοµένων Ορισµός της αρχιτεκτονικής και των απαιτούµενων στοιχείων του συστήµατος. Επιλογή του κατάλληλου εξοπλισµού σε µηχανήµατα, συστήµατα Βάσεων εδοµένων και εργαλείων λογισµικού. Εγκατάσταση επικοινωνίας µεταξύ των servers και των εργαλείων ανάλυσης Σχεδίαση του σχήµατος της Αποθήκης εδοµένων ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -23 Σχεδίαση και Ανάπτυξη Αρχιτεκτονικής Αποθήκης εδοµένων ηµιουργία της φυσικής οργάνωσης της Αποθήκης εδοµένων, υλοποίηση των σχετικών δοµών και των µεθόδων πρόσβασης στην Αποθήκη. Εγκατάσταση των µεταφορέων και σύνδεση µε τις πηγές δεδοµένων. Σχεδίαση και ανάπτυξη των προγραµµάτων µεταφοράς δεδοµένων. ηµιουργία της Βάσης των Μετα-δεδοµένων. Ολοκλήρωση των εφαρµογών ανάλυσης. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -24
Μεταφορά εδοµένων από τις πηγές στην Αποθήκη εδοµένων Στάδια µεταφοράς επεξεργασίας δεδοµένων από τις πηγές στην Αποθήκη εδοµένων Πηγή Αποθήκη εδοµένων Εξαγωγή Εισαγωγή Μετατροπή Ολοκλήρωση ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -25 Εξαγωγή και Μετατροπή εδοµένων Οι µετατροπές που γίνονται στα δεδοµένα αφορούν τόσο τη δοµή όσο και την τιµή τους: Παραδείγµατα: Το πεδίο ιεύθυνση µετασχηµατίζεται σε Χρόνος, Μήνας και Ηµέρα, Οι τιµές του πεδίου Χαρακτηρισµός µετατρέπονται από Α, Β κλπ σε 1, 2 κλπ αντίστοιχα. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -26
Ενηµέρωση Αποθηκών εδοµένων Ηενηµέρωση της Αποθήκης εδοµένων µεταφέρει τις αλλαγές που συµβαίνουν στα δεδοµένα των πηγών εκτελώντας αντίστοιχες αλλαγές στα δεδοµένα της Αποθήκης. Ηδιαδικασία αυτή ακολουθεί όλα τα βήµατα (εξαγωγή, µετατροπή, ολοκλήρωση, εισαγωγή). Η πολιτική ενηµέρωσης καθορίζεται από το διαχειριστή της Αποθήκης εδοµένων µε βάση τις ανάγκες των εφαρµογών ανάλυσης, τη διαθεσιµότητα των πηγών και τη κατάσταση του δικτύου που συνδέει την Αποθήκη µε τις πηγές. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -27 Ενηµέρωση Αποθηκών εδοµένων Πολιτικές Ενηµέρωσης Πλήρης Επαναϋπολογισµός των περιεχοµένων της Αποθήκης (Total refresh) ιαφορικός (αυξητικός) υπολογισµός των τροποποιήσεων που έχουν λάβει χώρα (Incremental Maintenance): Με χρήση Στιγµιοτύπων Με χρήση του µηχανισµού καταγραφής (log) Με χρήση triggers ( ο µηχανισµός εξαρτάται από τα χαρακτηριστικά κάθε πηγής) ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -28
Σχεδίαση Αποθηκών εδοµένων Τα ER διαγράµµατα Οντοτήτων - Συσχετίσεων των OLTP συστηµάτων αποδεικνύονται ακατάλληλα για τη σχεδίαση των Αποθηκών εδοµένων Οι πιο κατάλληλες τεχνικές για τη σχεδίαση των βάσεων των Αποθηκών εδοµένων είναι τα αστεροειδή σχήµατα (star schema) και τα σχήµατα χιονονιφάδας (snowflakes). ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -29 Σχεδίαση Αποθηκών εδοµένων Παράδειγµα Χρήσης ιαγράµµατος ER ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -30
Σχεδίαση Αποθηκών εδοµένων Παράδειγµα Πολυδιάστατου Μοντέλου ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -31 Σχεδίαση Αποθηκών εδοµένων FACT TABLES: Ο πίνακας που το πρωτεύον κλειδί του είναι ησύνθεση των κλειδιών των υπόλοιπων πινάκων. Κάθε ένας από τους υπόλοιπους πίνακες λειτουργεί ως διάσταση του fact table(time, period, product, etc) DIMENSION TABLE: Ο πίνακας που περιέχει πληροφορία σχετική µε τις διαστάσεις των δεδοµένων. (χρονική περίοδος, αγορά, προϊόντα. οργανισµός, κλπ.) και περιέχει όλα τα απαραίτητα δεδοµένα κάθε διάστασης. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -32
Σχεδίαση Αποθηκών εδοµένων Star Schema Time Time Code Quarter Code Quarter Name Month Code Month Name Date Account Account Code KeyAccount Code KeyAccountName Account Name Account Type Account Market SALES Geography Code Time Code Account Code Product Code Dollar Amount Units Geography Geography Code Region Code Region Manager State Code City Code... Product Product Code Product Name Brand Code Brand Name Prod. Line Code Prod. Line Name ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -33 Σχεδίαση Αποθηκών εδοµένων Snowflake Schema Account attributes Account Code AccountName KeyAccount KeyAcc Code KeyAcc Name Account Account Code KeyAccount Code Region Region Code Region Mgr State State Code State Name Geography Postal Code Region Code State Code City Code SALES Postal Code Time Code Account Code Product Code Dollar Amount Time Time Code Quarter Code Month Code Quarter Quarter Code QuarterName Month City Units Month Code Month Name City Code City Name Product Product Code Prod Line Code Brand Code Product Brand ProdLine Product Code Brand Code ProdLineCode ProductName Brand Name ProdLineName ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -34
Πολυδιάστατα Μοντέλα εδοµένων PRODUCT REGION W N S Juice 10 Cola 13 Soap Jan MONTH Μετρήσεις (ήμεταβλητές ήμετρηκές) π.χ. Πωλήσεις αντιστοιχούν σε Στήλες σε µία Σχεσιακή Β Τιµές για τις Μετήσεις π.χ. Cola αντιστοιχούν σε Τιµές σε µία Σχεσιακή Β ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -35 Πολυδιάστατα Μοντέλα εδοµένων Τα πολυδιάστατα επίπεδα αθροιστικών δεδοµένων είναι: χρονικά (πχ. χρόνια - µήνες), γεωγραφικά (πχ. Ρώµη - Ιταλία), οργανωτικά (προέρχονται ιεραρχική οργανωτική δοµή, πχ. Ίνστιτούτο - Τµήµα), and φυσικά (πχ. Αυτοκίνητο - Μηχανή). Industry Category Product Food non-food Country Region City Office Year Quarter Month Week Day ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -36
Πολυδιάστατα Μοντέλα εδοµένων OLAP: Η έννοια του ΚΥΒΟΥ Sales Volumes M O D E L Mini Van Coupe Sedan Carr Gleason Clyde DEALERSHIP Blue Red White COLOR ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -37 ηµιουργώντας τον Υπερκύβο Πρόσθεση ιασάσεων Sales Volumes M O D E L Mini Van Coupe Sedan 6 5 4 3 5 5 4 3 2 Blue Red COLOR White ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -38
ηµιουργώντας τον Υπερκύβο Πρόσθεση ιασάσεων Sales Volumes M O D E L Mini Van Coupe Sedan Carr Gleason Clyde DEALERSHIP Blue Red White COLOR ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -39 ηµιουργώντας τον Υπερκύβο Πρόσθεση ιασάσεων Sales Volumes M O D E L Mini Van Coupe Sedan Blue Red White Carr Gleason Clyde Mini Van Coupe Sedan Blue Red White Carr Gleason Clyde Mini Van Coupe Sedan Blue Red White Carr Gleason Clyde DEALERSHIP COLOR COLOR COLOR JANUARY FEBRUARY MARCH ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -40
Πράξεις στους Υπερκύβους Aggregation (or Consolidate, or Roll-up) Αθροίζοντας εδοµένα Η άθροιση περιλαµβάνει τον υπολογισµό µίας συνολικής τιµής για µία θέση στην ιεραρχία µίας διάστασης δεδοµένων. Για παράδειγµα οι πωλήσεις των τοπικών γραφείων µε τη roll-up παράγουν τις συνολικές πωλήσεις ανά πόλη και αυτές µε τη σειρά τους µε ένα ακόµα roll-up παράγουν τις πωλήσεις ανά περιοχή. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -41 Πράξεις στους Υπερκύβους Roll down (or Drill down, or Drill through) ROLL-DOWN: Οχρήστης περνά από ενά ανώτερο επίπεδο µίας διάστασης που έχει συγκεντρωτικά δεδοµένα σε ένα χαµηλώτερο που έχει πιο λεπτοµερή. Πρόκειται για την αντίστροφη πράξη του roll-up Για παράδειγµα κατά το drill down ξεκινάµε από τις πωλήσεις ανά περιοχή και πέρνουµε τις πωλήσεις ανά πόλη και µετά τις πωλήσεις ανά γραφείο. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -42
Πράξεις στους Υπερκύβους Sales ( million $ ) per year Products Q1 Q2 Electronics $ 5,2 1000 Clothing $ 1,9 250 Toys $2,4 500 Drill Down Sales ( million $ ) per year Roll Up Electronics Q1 Q2 VCR $ 1,4 400 Camcorder $ 0,6 150 CD Player $ 2,0 400 TV $ 1,2 50 ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -43 Πράξεις στους Υπερκύβους Παράδειγµα Roll Up COLOR Sales Volumes M O D E L Clyde Gleason Carr Levi Lucas Bolton Gary St. Louis Chicago Midwest REGION DISTRICT DEALERSHIP ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -44
Πράξεις στους Υπερκύβους Slicing and Dicing SLICING: Για την επιλογή δεδοµένων που ικανοποιούν µία συνθήκη ορισµένη σε µία συγκεκριµένη διάσταση. Το αποτέλεσµα είναι ένας υπερκύβος µε τις ίδιες διαστάσεις. Για παράδειγµα, διαλέγοντας την κατηγορία Ηλεκτρονικά από την διάσταση πωλήσεις, το αποτέλεσµα είναι να πάρουµε ένα επιµέρους υπερκύβο µε τις ίδιες διαστάσεις που περιέχει δεδοµένα µόνο για τα Ηλεκτρονικά. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -45 Πράξεις στους Υπερκύβους Παράδειγµα Slice and Dice Sales Volumes M O D E L Mini Van Coupe Clyde Carr Mini Van Coupe Normal Blue Metal Blue Carr Clyde Normal Blue Metal Blue DEALERSHIP COLOR ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -46
Πράξεις στους Υπερκύβους Pivot (or Rotate) PIVOT: Η αλλαγή της διάταξης των διαστάσεων του υπερκύβου. Για παράδειγµα µε το pivot εναλλάσονται οι γραµµές και οι στήλες του πίνακα στηµ περίπτωση του υπερκύβου 2 διαστάσεων. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -47 Πράξεις στους Υπερκύβους Παράδειγµα Pivoting Store 1 Store 2 Sales Year to date ($ millions) Products Time Q1 Q2 Electronics $5.2 Toys $1.9 Clothing $2.3 Cosmetics $1.1 Electronics $8.9 Toys $.75 Clothing $4.6 Cosmetics $1.5 Store 1 Store 2 Sales Year to date ($ millions) Products Q1 Electronics Toys Clothing Cosmetics Electronics Toys Clothing Cosmetics Store 1 $5.2 $1.9 $2.3 $1.1 $8.9 $.75 $4.6 $1.5 Store 2 $8.9 $.75 $4.6 $1.5 ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -48
Πράξεις στους Υπερκύβους Παραδείγµατα Pivoting Sales Volumes M O D E L Mini Van Coupe Sedan Blue Red White Carr Gleason Clyde C O L O R Blue Red Carr White Gleason Clyde Sedan Coupe Mini Van C O L O R Blue Red White Carr Gleason Clyde Mini Van Coupe Sedan COLOR MODEL DEALERSHIP ( ROTATE 90 o ) ( ROTATE 90 o ) ( ROTATE 90 o ) DEALERSHIP DEALERSHIP View #1 View #2 View #3 MODEL D E A L E R S H I P Carr Gleason Clyde White Red Blue Mini Van Coupe Sedan D E A L E R S H I P Carr Gleason Blue Clyde Red White Mini Van Coupe Sedan M O D E L Mini Van Coupe Sedan Clyde Gleason Carr Blue Red White COLOR MODEL ( ROTATE 90 o ) ( ROTATE 90 o ) DEALERSHIP MODEL COLOR COLOR View #4 View #5 View #6 ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -49 ΕΠΙΛΟΓΟΣ Τρέχοντα θέµατα ενδιαφέροντος Αρχιτεκτονική OLAP servers Σχεδίαση Αποθηκών εδοµένων OLAP Εφαρµογές Επεκτασιµότητα Απόθηκών εδοµένων Πολυδιάστατες οµές εδοµένων για άµεση πρόσβαση στα πολυδιάστατα Εργαλεία µεταφοράς δεδοµένων από τις πηγές Μελλοντικά θέµατα ενδιαφέροντος / έρευνας οµές εδοµένων για OLAP servers Άλγεβρα OLAP εφαρµογών ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -50