Εξόπυξη Δεδομένων. ΑΠΟΘΗΚΔΣ ΓΔΓΟΜΔΝΩΝ Data Warehouses. Απνζήθεο Γεδνκέλσλ 1

Σχετικά έγγραφα
Εισαγωγή στις Αποθήκες εδοµένων

Εισαγωγή στις Αποθήκες εδομένων

Αποθήκες Δεδομένων. Αποθήκες και εξόρυξη δεδομένων 6 ο εξάμηνο

Αποθήκες Δεδομένων. Αρχιτεκτονική, Μοντέλο Δεδομένων και Σχεδίαση

Εισαγωγή στις Αποθήκες εδομένων

Data Warehouse Refreshment via ETL tools. Panos Vassiliadis

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Βάσεις Δεδομέμωμ. Εξγαζηήξην V. Τκήκα Πιεξνθνξηθήο ΑΠΘ

Απνζήθεο Γεδνκέλσλ θαη Δμόξπμε Γεδνκέλσλ:

Κευάλαιο 8 Μονοπωλιακή Συμπεριφορά- Πολλαπλή Τιμολόγηση

Ενδεικτικά Θέματα Στατιστικής ΙΙ

Απνηειέζκαηα Εξσηεκαηνινγίνπ 2o ηεηξάκελν

Άμεση Αναλυτική Επεξεργασία (OLAP)

ΑΝΑΣΚΟΠΗΣΗ. Αποθήκες και Εξόρυξη Δεδομένων

Έλαο πίνακας σσμβόλων ππνζηεξίδεη δύν βαζηθέο ιεηηνπξγίεο:

Άμεση Αναλυτική Επεξεργασία (OLAP)

B-Δέλδξα. Τα B-δέλδξα ρξεζηκνπνηνύληαη γηα ηε αλαπαξάζηαζε πνιύ κεγάισλ ιεμηθώλ πνπ είλαη απνζεθεπκέλα ζην δίζθν.

H ΜΑΓΕΙΑ ΤΩΝ ΑΡΙΘΜΩΝ

Αζκήζεις ζτ.βιβλίοσ ζελίδας 13 14

ΔΕΟ 13. Ποσοτικές Μέθοδοι. θαη λα ππνινγίζεηε ην θόζηνο γηα παξαγόκελα πξντόληα. Να ζρεδηαζηεί γηα εύξνο πξντόλησλ έσο

Δξγαζηεξηαθή άζθεζε 03. Σηεξενγξαθηθή πξνβνιή ζην δίθηπν Wulf

iii. iv. γηα ηελ νπνία ηζρύνπλ: f (1) 2 θαη

Α. Εηζαγσγή ηεο έλλνηαο ηεο ηξηγσλνκεηξηθήο εμίζσζεο κε αξρηθό παξάδεηγκα ηελ εκx = 2

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

Βάσεις Δεδομένων ΙΙ. Διάλεξη 7 η Aποθήκες Δεδομένων και OLAP (On-line Analytical Processing)

ΓΗΑΓΩΝΗΣΜΑ ΣΤΑ ΜΑΘΖΜΑΤΗΚΑ. Ύλη: Μιγαδικοί-Σσναρηήζεις-Παράγωγοι Θεη.-Τετν. Καη Εήηημα 1 ο :

Σήκαηα Β Α Γ Γ Δ Λ Η Σ Ο Ι Κ Ο Ν Ο Μ Ο Υ Γ Ι Α Λ Δ Ξ Η - ( 2 ) ΕΙΣΑΓΨΓΗ ΣΤΙΣ ΤΗΛΕΠΙΚΟΙΝΨΝΙΕΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΘΕΩΡΙΑ ΣΗΜΑΤΩΝ & ΣΥΣΤΗΜΑΤΩΝ. ΜΕΤΑΣΦΗΜΑΤΙΣΜΟΣ Laplace

Αιγόξηζκνη Γνκή επηινγήο. Πνιιαπιή Δπηινγή Δκθωιεπκέλεο Δπηινγέο. Δηζαγωγή ζηηο Αξρέο ηεο Δπηζηήκεο ηωλ Η/Υ. introcsprinciples.wordpress.

Κεθάλαιο 7. Πξνζθνξά ηνπ θιάδνπ Μ. ΨΥΛΛΑΚΗ

ΔΦΑΡΜΟΜΔΝΑ ΜΑΘΗΜΑΣΙΚΑ ΣΗ ΧΗΜΔΙΑ Ι ΘΔΜΑΣΑ Α επηέκβξηνο Να ππνινγηζηνύλ νη κεξηθέο παξάγσγνη πξώηεο ηάμεο ηεο ζπλάξηεζεο f(x,y) =

ΑΛΛΑΓΗ ΟΝΟΜΑΣΟ ΚΑΙ ΟΜΑΔΑ ΕΡΓΑΙΑ, ΚΟΙΝΟΥΡΗΣΟΙ ΦΑΚΕΛΟΙ ΚΑΙ ΕΚΣΤΠΩΣΕ ΣΑ WINDOWS XP

Απαντήσεις θέματος 2. Παξαθάησ αθνινπζεί αλαιπηηθή επίιπζε ησλ εξσηεκάησλ.

x-1 x (x-1) x 5x 2. Να απινπνηεζνύλ ηα θιάζκαηα, έηζη ώζηε λα κελ ππάξρνπλ ξηδηθά ζηνπο 22, 55, 15, 42, 93, 10 5, 12

ΑΠΛΟΠΟΙΗΗ ΛΟΓΙΚΩΝ ΤΝΑΡΣΗΕΩΝ ΜΕ ΠΙΝΑΚΕ KARNAUGH

ΡΤΘΜΙΕΙ ΔΙΚΣΤΟΤ ΣΑ WINDOWS

Α Ο Κ Η Α Μ Α Ζ Η Η Ρ Η ( S E A R C H )

ΦΥΣΙΚΗ ΤΩΝ ΡΕΥΣΤΩΝ. G. Mitsou

Σημεία Ασύπματηρ Ππόσβασηρ (Hot-Spots)

ΔΙΑΓΩΝΙΣΜΑ ΣΤΗ ΦΥΣΙΚΗ. Ύλη: Εσθύγραμμη Κίνηζη

ΚΕΦ. 2.3 ΑΠΟΛΤΣΗ ΣΘΜΗ ΠΡΑΓΜΑΣΘΚΟΤ ΑΡΘΘΜΟΤ

ΚΔΦ. 2.4 ΡΗΕΔ ΠΡΑΓΜΑΣΗΚΩΝ ΑΡΗΘΜΩΝ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

(γ) Να βξεζεί ε ρξνλνεμαξηώκελε πηζαλόηεηα κέηξεζεο ηεο ζεηηθήο ηδηνηηκήο ηνπ ηειεζηή W.

Δξγαιεία Καηαζθεπέο 1 Σάμε Σ Δ.Κ.Φ.Δ. ΥΑΝΙΧΝ ΠΡΧΣΟΒΑΘΜΙΑ ΔΚΠΑΙΓΔΤΗ. ΔΝΟΣΗΣΑ 11 ε : ΦΧ ΔΡΓΑΛΔΙΑ ΚΑΣΑΚΔΤΔ. Καηαζθεπή 1: Φαθόο κε ζσιήλα.

Μονοψϊνιο. Αγνξά κε ιίγνπο αγνξαζηέο. Δύναμη μονοψωνίος Η ηθαλόηεηα πνπ έρεη ν αγνξαζηήο λα επεξεάζεη ηελ ηηκή ηνπ αγαζνύ.

ΕΓΧΕΙΡΙΔΙΟ ΕΚΔΟΗ 8.0.0

Κβαντικοί Υπολογισμοί. Πέκπηε Γηάιεμε

Αντισταθμιστική ανάλυση

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ. Οξηδόληηα θαη θαηαθόξπθε κεηαηόπηζε παξαβνιήο

Παιχνίδι γλωζζικής καηανόηζης με ζχήμαηα!

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΔΣΑΙΡΔΙΑ ΠΑΓΚΤΠΡΙΟ ΓΙΑΓΩΝΙ ΜΟ

ΜΗΧΑΝΟΛΟΓΙΚΟ ΣΧΔΓΙΟ ΙΙ

ΘΔΚΑ ΡΖΠ ΑΛΑΓΛΩΟΗΠΖΠ

Άμεσοι Αλγόριθμοι: Προσπέλαση Λίστας (list access)

Η/Υ A ΤΑΞΕΩΣ ΑΕ Συστήματα Αρίθμησης. Υποπλοίαρχος Ν. Πετράκος ΠΝ

Εςθςή ζςζηήμαηα επισειπήζεων και αξιολόγηζη

Να ζρεδηάζεηο ηξόπνπο ζύλδεζεο κηαο κπαηαξίαο θαη ελόο ιακπηήξα ώζηε ν ιακπηήξαο λα θσηνβνιεί.

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΤΙΚΗ ΣΚΥΤΑΛΟΓΡΟΜΙΑ 2015 ΓΙΑ ΤΟ ΓΥΜΝΑΣΙΟ Τεηάπηη 28 Ιανουαπίου 2015 ΛΔΥΚΩΣΙΑ Τάξη: Α Γυμναζίου

ΥΡΙΣΟΤΓΔΝΝΙΑΣΙΚΔ ΚΑΣΑΚΔΤΔ

Δπηιέγνληαο ην «Πξνεπηινγή» θάζε θνξά πνπ ζα ζπλδέεζηε ζηελ εθαξκνγή ζα βξίζθεζηε ζηε λέα ρξήζε.

Διατείριση Φσσικών Καταστρουών: ACTIVE LANDSLIDE INVENTORY MAPPING AND SUSCEPTIBILITY ZONING

Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο κόζηος ανά μονάδα παραγωγής. Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο ζηαθερό κόζηος ανά μονάδα παραγωγής

ΙNCOFRUIT - (HELLAS).

Παλαιοσλαβική Γλώσσα. Ενότητα 9: Το σύστημα των συμφώνων. Αλεξάνδρα Ιωαννίδου. Τμήμα Σλαβικών Σπουδών

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΔΣΑΙΡΔΙΑ ΠΑΓΚΤΠΡΙΟ ΓΙΑΓΩΝΙΜΟ Α ΛΤΚΔΙΟΤ. Ημεπομηνία: 10/12/11 Ώπα εξέτασηρ: 09:30-12:30 ΠΡΟΣΔΙΝΟΜΔΝΔ ΛΤΔΙ

T A E K W O N D O. Δ. ΠπθαξΨο. ΔπΫθνπξνο ΘαζεγεηΪο ΑζιεηηθΪο ΦπζηθνζεξαπεΫαο ΡΔΦΑΑ - ΑΞΘ

Επαναληπτική Άσκηση - Δέντρα

ΜΑΘΗΜΑ / ΤΑΞΗ : ΗΛΕΚΤΡΟΛΟΓΙΑ/Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: 08/09/2014

ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ. Αθροίσματα, Γινόμενα και Ασσμπτωτικές Εκτιμήσεις

Άζκηζη ζτέζης κόζηοσς-τρόνοσ (Cost Time trade off) Καηαζκεσαζηική ΑΔ

ΟΠΤΙΚΗ Α. ΑΝΑΚΛΑΣΖ - ΓΗΑΘΛΑΣΖ

Διαηιμήζεις για Αιολικά Πάρκα. Κώδικες 28, 78 και 84

f '(x)g(x)h(x) g'(x)f (x)h(x) h'(x) f (x)g(x)

α) ηε κεηαηόπηζε x όηαλ ην ζώκα έρεη κέγηζην ξπζκό κεηαβνιήο ζέζεο δ) ην κέγηζην ξπζκό κεηαβνιήο ηεο ηαρύηεηαο

Κεθάιαην 20. Ελαχιστοποίηση του κόστους

EL Eνωμένη στην πολυμορυία EL A8-0046/319. Τροπολογία

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

ΑΠΑΝΤΗΣΔΙΣ ΓΙΚΤΥΑ ΥΠΟΛΟΓΙΣΤΩΝ II ΔΠΑΛ

Μνλνδηάζηαηνη Πίλαθεο Λπκέλεο Αζθήζεηο. Άζθεζε 1. Πνηά ζα είλαη ηα πεξηερόκελα ηνπ πίλαθα Α κεηά ηελ εθηέιεζε ηνπ παξαθάησ αιγνξίζκνπ;

Γοκή επαλάιευες Δληοιές Όζο & Μέτρης_όηοσ

Οργάνωση και Δομή Παρουσιάσεων

ΠΑΡΑΡΣΗΜΑ Δ. ΔΤΡΔΗ ΣΟΤ ΜΔΣΑΥΗΜΑΣΙΜΟΤ FOURIER ΓΙΑΦΟΡΩΝ ΗΜΑΣΩΝ

(Ενδεικηικές Απανηήζεις) ΘΔΜΑ Α. Α1. Βιέπε απόδεημε Σει. 262, ζρνιηθνύ βηβιίνπ. Α2. Βιέπε νξηζκό Σει. 141, ζρνιηθνύ βηβιίνπ

Μηα ζπλάξηεζε κε πεδίν νξηζκνύ ην Α, ζα ιέκε όηη παξνπζηάδεη ηοπικό μέγιζηο ζην, αλ ππάξρεη δ>0, ηέηνην ώζηε:

Πολυεπίπεδα/Διασυμδεδεμέμα Δίκτυα

ΠΑΝΕΛΛΑΔΙΚΕ ΕΞΕΣΑΕΙ Γ ΣΑΞΗ ΗΜΕΡΗΙΟΤ ΓΕΝΙΚΟΤ ΛΤΚΕΙΟΤ & ΠΑΝΕΛΛΗΝΙΕ ΕΞΕΣΑΕΙ Γ ΣΑΞΗ ΗΜΕΡΗΙΟΤ ΕΠΑΛ (ΟΜΑΔΑ Β )

Βάσεις Δεδομέμωμ. Δξγαζηήξην Ι. Τκήκα Πιεξνθνξηθήο ΑΠΘ

ΠΑΝΔΛΛΑΓΗΚΔ ΔΞΔΣΑΔΗ Γ ΣΑΞΖ ΖΜΔΡΖΗΟΤ ΓΔΝΗΚΟΤ ΛΤΚΔΗΟΤ ΚΑΗ ΔΠΑΛ ΣΔΣΑΡΣΖ 25 ΜΑΨΟΤ 2016 ΔΞΔΣΑΕΟΜΔΝΟ ΜΑΘΖΜΑ: ΑΡΥΔ ΟΗΚΟΝΟΜΗΚΖ ΘΔΧΡΗΑ ΠΡΟΑΝΑΣΟΛΗΜΟΤ - ΔΠΗΛΟΓΖ

γηα ηνλ Άξε Κσλζηαληηλίδε

ΠΑΝΔΛΛΑΓΗΚΔ ΔΞΔΣΑΔΗ Γ ΣΑΞΖ ΖΜΔΡΖΗΟΤ ΓΔΝΗΚΟΤ ΛΤΚΔΗΟΤ Γευηέρα 11 Ηουνίου 2018 ΔΞΔΣΑΕΟΜΔΝΟ ΜΑΘΖΜΑ: ΜΑΘΖΜΑΣΗΚΑ ΠΡΟΑΝΑΣΟΛΗΜΟΤ. (Ενδεικηικές Απανηήζεις)

Σπληήξεζε ηξνθίκσλ ρσξίο ρεκηθά πξόζζεηα PROJECT B ΛΥΚΕΙΟΥ

ΣΕΙ Δυτικήσ Μακεδονίασ, Παράρτημα Καςτοριάσ Τμήμα Πληροφορικήσ και Τεχνολογίασ Υπολογιςτών

ΛΙΜΝΗ ΤΣΑΝΤ. Σρήκα 1. Σρήκα 2

ΑΠΟΛΤΣΗΡΙΔ ΔΞΔΣΑΔΙ Γ ΣΑΞΗ ΔΠΔΡΙΝΟΤ ΓΔΝΙΚΟΤ ΛΤΚΔΙΟΤ ΑΒΒΑΣΟ 23 MAΪΟΤ ΑΔΠΠ

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -2

ΑΡΥΔ ΟΙΚΟΝΟΜΙΚΗ ΘΔΩΡΙΑ ΛΤΔΙ ΓΙΑΓΩΝΙΜΑΣΟ ΚΔΦΑΛΑΙΟΤ 2

Σρήκα Α. Γξάθνπκε ηα ζηνηρεία ηνπ Πξνκεζεπηή θαη παηάκε Δηζαγσγή. Σρήκα Β1

ΘΔΜΑ 1 ο Μονάδες 5,10,10

Δξγαιεία Καηαζθεπέο 1 Σάμε Δ Δ.Κ.Φ.Δ. ΥΑΝΗΩΝ ΠΡΩΣΟΒΑΘΜΗΑ ΔΚΠΑΗΓΔΤΖ. ΔΝΟΣΖΣΑ 2 ε : ΤΛΗΚΑ ΩΜΑΣΑ ΔΡΓΑΛΔΗΑ ΚΑΣΑΚΔΤΔ. Καηαζθεπή 1: Ογθνκεηξηθό δνρείν

Transcript:

Εξόπυξη Δεδομένων ΑΠΟΘΗΚΔΣ ΓΔΓΟΜΔΝΩΝ Data Warehouses Απνζήθεο Γεδνκέλσλ 1

On-Line Transaction Processing (OLTP) On-Line Transaction Processing (OLTP) Σν ύζηεκα Δπεμεξγαζίαο Γνζνιεςηώλ είλαη έλα πιήξεο ζύζηεκα πνπ πεξηέρεη εξγαιεία γηα ηνλ πξνγξακκαηηζκό εθαξκνγώλ, ηελ εθηέιεζε θαη ηε δηαρείξηζε δνζνιεςηώλ. Μηα ηέηνηα εθαξκνγή πξέπεη λα δνπιεύεη ζπλερώο, λα αληεπεμέξρεηαη απνηπρηώλ, λα εμειίζζεηαη ζπλερώο. Δίλαη ζπλήζσο θαηαλεκεκέλε θαη πεξηιακβάλεη: ρεζηαθή Βάζε Γεδνκέλσλ Γίθηπν Πξνγξάκκαηα εθαξκνγήο Δίλαη εμαηξεηηθά θξίζηκε γηα ηε ιεηηνπξγία θάζε νξγαληζκνύ. Απνζήθεο Γεδνκέλσλ 2

Παξαδείγκαηα On-Line Transaction Processing OLTP Αεξνπνξηθή Δηαηξεία DB Κπάηηζε για ηον κ. Χ ηην θέζη 13Α για Αθήνα! Πόζοι ηαξιδεύουν για Θεζζαλονίκη? Κπάηηζε για ηον κ. Y ηην θέζη 1C για Κέπκυπα! 1... 100 Απνζήθεο Γεδνκέλσλ 3

Παξαδείγκαηα On-Line Transaction Processing OLTP Σξάπεδα Γάλεηα Τακείν ΑΤΜ DB Πηζηωηηθέο θάξηεο Απνζήθεο Γεδνκέλσλ 4

Τα βαζηθά ραξαθηεξηζηηθά ελόο OLTP Διάρηζηνο ρξόλνο δηαζέζηκνο γηα ηελ εθηέιεζε κηαο δνζνιεςίαο. Πεξηνξηζκέλνο αξηζκόο πξνζβάζεσλ ζηνλ δίζθν (ή δίζθνπο). Πεξηνξηζκέλνο αξηζκόο ππνινγηζκώλ. Κάησ όξην ιεηηνπξγηθώλ απαηηήζεσλ: ηνπιάρηζηνλ 100 TPS ζε κηα ΒΓ ηεο ηάμεο ηνπ 1 GB Άλσ όξην ιεηηνπξγηθώλ απαηηήζεσλ: κέρξη 50000 TPS ζε κία ΒΓ κεγαιύηεξε ηνπ 1 ΣB. Απνζήθεο Γεδνκέλσλ 5

Πξνβιήκαηα ελόο OLTP Αξθεηά δεδνκέλα κπνξεί λα είλαη ειιηπή (missing data) ΠΡΟΣΔΙΝΟΜΔΝΔ ΛΤΔΙ Απόξξηςε εγγξαθώλ ησλ νπνίσλ θάπνηεο ηηκέο ιείπνπλ Αληηθαηάζηαζε ησλ ηηκώλ πνπ ιείπνπλ κε ηελ κέζε ηηκή ηεο θαηεγνξίαο Αληηθαηάζηαζε ησλ ηηκώλ πνπ ιείπνπλ από θάπνηα ραξαθηεξηζηηθά κε ηηο αληίζηνηρεο ηηκέο παξόκνησλ ραξαθηεξηζηηθώλ Απνζήθεο Γεδνκέλσλ 6

Πξνβιήκαηα ελόο OLTP Αξθεηά δεδνκέλα κπνξεί λα έρνπλ ζόξπβν θαη αζπλέπεηεο (noisy and inconsistent data) ΣΡΑΣΗΓΙΚΔ Δληνπηζκόο δηπιόηππσλ εγγξαθώλ π.ρ. Ισάλλεο & Γηάλλεο Δληνπηζκόο ιαλζαζκέλσλ ηηκώλ π.ρ. Μεδεληθή ηηκή ζε έλα ραξαθηεξηζηηθό πνπ αθνξά ην βάξνο ελόο πξντόληνο Δμνκάιπλζε δεδνκέλσλ (θβαληηζκόο) π.ρ. πεξηνξηζκόο ηνπ αξηζκνύ ησλ ηηκώλ ελόο αξηζκεηηθνύ ραξαθηεξηζηηθνύ ζε ζπγθεθξηκέλεο ηηκέο (ή ζηάζκεο) Απνζήθεο Γεδνκέλσλ 7

Σα δεδνκέλα κπνξεί λα είλαη εηεξνγελή θαη λα παξνπζηάδνπλ ζπλσλπκίεο ή ακθηζεκίεο π.ρ. έλαο πειάηεο είλαη θαηαρσξεκέλνο κε δηαθνξεηηθά ζηνηρεία ζηε βάζε ηνπ ηκήκαηνο πσιήζεσλ από όηη ζηε βάζε ηνπ ηκήκαηνο κάξθεηηλγθ. ΣΡΑΣΗΓΙΚΔ Πξνβιήκαηα ελόο OLTP Απνζήθεο Γεδνκέλσλ 8

Δλλνηνινγηθή ελαξκόληζε ηωλ δεδνκέλωλ Source 1: Personnel (Cobol) EMP ID Name Birth Salary Total Income 110 Kostas 1/1/72 1500 1200 132 DeptID Source 2: Accounting (DB2) EMP ID IL_ID Amount 110 10 1500 110 30 300 EMP INCOME EMP ID Name Age 110 Kostas 30 120 Vasilis 48 EMP IL_ID Descr 10 Μιζθόρ 20 Επίδομα Τέκνυν 30 Φόπορ Income Lookup 130 Roula 29...... Απνζήθεο Γεδνκέλσλ 9

Απνθαλνληθνπνίεζε - Denormalization EMP ID IL_ID Amount 110 10 1500 110 30 300 EMP ID Name Age 110 Kostas 30 120 Vasilis 48 130 Roula 29 EMP EMP INCOME IL_ID Descr 10 Μιζθόρ 20 Επίδομα Τέκνυν 30 Φόπορ...... DW.EMP? Income Lookup DW Απνζήθεο Γεδνκέλσλ 10

Καζαξηζκόο ηωλ δεδνκέλωλ Οκνγελνπνίεζε θιεηδηώλ ID Descr ID Descr 10 Coca 20 Pepsi R1 + DW.R 100 Coca 110 Pepsi 120 Epsa ID Descr 10 Pepsi 20 Epsa R2 + Lookup Source ID Sour ce 10 R1 100 20 R1 110 10 R2 110 20 R2 11120 Surrogate Key Απνζήθεο Γεδνκέλσλ 11

Μεηαζρεκαηηζκόο Γεδνκέλωλ Καλνληθνπνίεζε Γεδνκέλσλ Γεθαδηθή θιηκάθσζε Καλνληθνπνίεζε Διαρίζηνπ-Μεγίζηνπ newvalue originalvalue oldmin oldmax oldmin Καλνληθνπνίεζε κε ρξήζε ηηκώλ Z-scores newvalue originalvalue Μεηαηξνπή ηύπσλ δεδνκέλσλ Δπηινγή ραξαθηεξηζηηθώλ θαη ζηηγκηνηύπσλ Απνζήθεο Γεδνκέλσλ 12

Πξνβιήκαηα ελόο OLTP Λόγσ δηαδηθαζηώλ ελεκέξσζεο, εηζαγσγήο, δηαγξαθήο δηαηεξνύλ δεδνκέλα κόλν γηα ηελ ηξέρνπζα θαηάζηαζε. π.ρ., ζηε βάζε ηνπ ηκήκαηνο πξνκεζεηώλ δηαηεξνύληαη κόλν όζνη πξνκεζεπηέο ζπλεξγάδνληαη απηή ηε ζηηγκή ελώ κπνξεί λα ρξεηαζζνύλ δεδνκέλα θαη γηα πξνκεζεπηέο πνπ ζπλεξγαδόηαλ ζην παξειζόλ πξνθεηκέλνπ λα ζπγθξηζνύλ νη ηηκέο ηνπο Η αλάιπζε ησλ δεδνκέλσλ δελ είλαη εύθνιν λα επηηεπρζεί κε εξγαιεία όπσο ε γιώζζα SQL. Πξνθύπηνπλ πεξίπινθα εξσηήκαηα SQL ηα νπνία δελ είλαη εύθνιν λα ζπληαρζνύλ. Απνζήθεο Γεδνκέλσλ 13

Πξνβιήκαηα ελόο OLTP ε θπζηθό επίπεδν νξγάλσζεο (π.ρ. δελδξηθέο κέζνδνη πξνζπέιαζεο) δελ είλαη ζρεδηαζκέλα γηα λα αληαπνθξίλνληαη ζηηο απαηηήζεηο πεξίπινθσλ εξσηεκάησλ. Σα δεδνκέλα νξγαλώλνληαη κε δηάγξακκα Οληνηήησλ- πζρεηίζεσλ (ER) θαη αξρώλ όπσο ε θαλνληθνπνίεζε, πνπ παξάγνπλ πεξίπινθεο βάζεηο ζην λνεηηθό επίπεδν. Απνζήθεο Γεδνκέλσλ 14

On-Line Αnalytical Processing (OLAP & OLAM) Aλάιπζε κεγάινπ όγθνπ ζύλζεησλ δεδνκέλσλ από δηαθνξεηηθέο εθαξκνγέο Δηδηθνύ ηύπνπ εξσηήκαηα ζπλάζξνηζεο Οπηηθνπνίεζε / ζηαηηζηηθή αλάιπζε / πνιπδηάζηαηε αλάιπζε Δμόξπμε Γλώζεο (Knowledge Discovery / Data Mining) Δμεύξεζε πξνηύπσλ ζε ηεξάζηηεο βάζεηο δεδνκέλσλ OLAP + Data Mining = On-Line Analytical Mining Απνζήθεο Γεδνκέλσλ 15

Παξαδείγκαηα εξωηεκάηωλ ζην OLAP Πνηνο ήηαλ ν όγθνο πσιήζεσλ αλά πεξηνρή θαη θαηεγνξία πξντόληνο ηελ πεξαζκέλε ρξνληά; Πόζν ζρεηίδνληαη νη απμήζεηο ηηκώλ ησλ ππνινγηζηώλ κε ηα θέξδε ησλ πσιήζεσλ ηα 10 ηειεπηαία ρξόληα; Πνηα ήηαλ ηα δέθα πξώηα θαηαζηήκαηα ζε πσιήζεηο CD; Ση πνζνζηό από ηνπο πειάηεο πνπ αγνξάδνπλ αλαςπθηηθά αγνξάδνπλ θαη παηαηάθηα; Απνζήθεο Γεδνκέλσλ 16

Λεηηνπξγηθά Χαξαθηεξηζηηθά Απαηηήζεωλ OLAP Πξόζβαζε ζε κεγάιν όγθν δεδνκέλσλ πκκεηνρή αζξνηζηηθώλ θαη ηζηνξηθώλ δεδνκέλσλ ζε πνιύπινθεο εξσηήζεηο Μεηαβνιή ηεο νπηηθήο γσλίαο ηεο παξνπζίαζεο ησλ δεδνκέλσλ (π.ρ. από ηηο πσιήζεηο αλά πεξηνρή ζηηο πσιήζεηο αλά ηκήκα θιπ.) πκκεηνρή πνιύπινθσλ ππνινγηζκώλ (π.ρ. ζηαηηζηηθέο ζπλαξηήζεηο) Γξήγνξε απάληεζε ζε νπνηαδήπνηε ρξνληθή ζηηγκή ηεζεί έλα εξώηεκα (On-Line-AP). Απνζήθεο Γεδνκέλσλ 17

OLTP vs. OLAP OLTP OLAP Λεηηνπξγίεο Απηνκαηηζκόο Υάξαμε θαζεκεξηλώλ ζηξαηεγηθήο εξγαζηώλ Σύπνο Γεδνκέλσλ Λεπηνκεξή Αζξνηζηηθά Όγθνο Γεδνκέλσλ ~ 100 GB ~ 1 TB θαη πάλσ Φύζε Γεδνκέλσλ Γπλακηθά ηαηηθά, Ιζηνξηθά Απνζήθεο Γεδνκέλσλ 18

OLTP vs. OLAP OLTP OLAP I/O Σύπνη Πεξηνξηζκέλν I/O Δθηεηακέλν I/O Σξνπνπνηήζεηο πλερείο Δλεκεξ. Πεξηνδηθέο Δλεκεξ. Φόξηνο Γνζνιεςίεο κε Δξσηήζεηο πνπ πξόζβαζε ιίγσλ ζαξώλνπλ εγγξαθώλ εθαηνκκύξηα εγγξαθέο ρεδίαζε ΒΓ Καηεπζπλόκελε Καηεπζπλόκελε από ηελ Δθαξκνγή από ην Πεξηερόκελν Απνζήθεο Γεδνκέλσλ 19

OLTP vs. OLAP Σππηθνί Υξήζηεο OLTP OLAP Υακειόβαζκνη Τπ. Τςειόβαζκνη Τπ. Υξήζε Μέζσ Ad-hoc πξνθαηαζθεπαζκέλσλ θνξκώλ Αξηζκόο Υξεζηώλ Υηιηάδεο Γεθάδεο Δζηίαζε Δηζαγσγή Δμαγσγή Γεδνκέλσλ Πιεξνθνξηώλ Απνζήθεο Γεδνκέλσλ 20

Απνζήθεο δεδνκέλωλ Η ηερλνινγία ησλ απνζεθώλ δεδνκέλσλ πξνζθέξεη νινθιήξσζε εηεξνγελώλ πεγώλ δεδνκέλσλ θαη πιαηθόξκα γηα απνδνηηθή αλάιπζε ηζηνξηθώλ δεδνκέλσλ Μία απνζήθε δεδνκέλσλ απνηειεί κία ζπιινγή δεδνκέλσλ πνπ επηιέγνληαη από ηηο Δπηρεηξεζηαθέο Βάζεηο Γεδνκέλσλ, Οινθιεξώλνληαη (integrated), ηα δεδνκέλα αλαιύνληαη κε δηαδηθαζίεο όπσο ε On-line Analytical Processing (OLAP) ή ε εμόξπμε δεδνκέλσλ. Απνζήθεο Γεδνκέλσλ 21

Απνζήθεο δεδνκέλωλ Δίλαη κηα θεληξηθνπνηεκέλε ΒΓ κε ζθνπό: ηελ νινθιήξσζε (integration) εηεξνγελώλ πεγώλ πιεξνθνξηώλ (data sources) πνπ ζεκαίλεη ηελ ζπλάζξνηζε όιεο ηεο ελδηαθέξνπζαο πιεξνθνξίαο ζε κία ηνπνζεζία ηελ απνθπγή ηεο ζύγθξνπζεο κεηαμύ OLTP θαη OLAP (DSS) ζπζηεκάησλ κε απνδνηηθέο εθαξκνγέο θαη δηαρείξηζε ηεο δηαζεζηκόηεηα ηνπ ζπζηήκαηνο Μπνξεί λα ζπκπιεξώλεηαη θαη από εμεηδηθεπκέλα ζεκαηηθά ππνζύλνια (Data Marts) γηα πεξαηηέξσ απόδνζε ησλ OLAP εθαξκνγώλ Απνζήθεο Γεδνκέλσλ 22

Απνζήθεο δεδνκέλωλ Λεηηνπξγηθά Χαξαθηεξηζηηθά Ιζηνξηθά Γεδνκέλα Ο ρξνληθόο νξίδνληαο κηαο απνζήθεο δεδνκέλσλ είλαη πνιύ κεγαιύηεξνο από όηη ελόο ζπζηήκαηνο ζε ζπλερή ιεηηνπξγία Η ΒΓ έρεη ηα ησξηλά δεδνκέλα ελώ νη απνζήθεο δηαηεξνύλ θαη παιηά δεδνκέλα (π.ρ. ησλ πξνεγνύκελσλ 5-10 ρξόλσλ) Σξνπνπνηήζεηο Οη ηξνπνπνηήζεηο ζηηο πεγέο δεδνκέλσλ δελ θαίλνληαη άκεζα ζηηο απνζήθεο δεδνκέλσλ θαζώο εθηεινύληαη ζπλήζσο πεξηνδηθά Έρνπλ δύν βαζηθέο ιεηηνπξγίεο: ην αξρηθό θόξησκα ησλ δεδνκέλσλ (loading) θαη ηελ πξνζπέιαζε δεδνκέλσλ (access) Απνζήθεο Γεδνκέλσλ 23

Ιζηνξηθά Σηνηρεία γηα Απνζήθεο Γεδνκέλωλ Πξώηεο πξνζπάζεηεο ζηα κέζα ηεο δεθαεηίαο ηνπ 1990 πνπ νη απνζήθεο δεδνκέλσλ εμειίρζεθαλ ζε αγνξά ηεο ηάμεο ησλ 2 δηο $. Μέρξη ηα ηέιε ηεο δεθαεηίαο ηνπ 1990, ην 95% ησλ 1000 επηρεηξήζεσλ ηνπ Fortune αλέπηπζζαλ απνζήθεο δεδνκέλσλ, νπόηε ε αγνξά ησλ απνζεθώλ δεδνκέλσλ αλήξζε νηθνλνκηθά ζηελ ηάμε ησλ 7 δηο $. Δθηηκήζεθε όηη ζε 3 ρξόληα από ηελ αλάπηπμε κίαο απνζήθεο δεδνκέλσλ, ε απόζβεζε γίλεηαη ζε πνζνζηό 400%. Απνζήθεο Γεδνκέλσλ 24

Ιζηνξηθά Σηνηρεία γηα Απνζήθεο Γεδνκέλωλ Δπηηπρεκέλε πεξίπησζε εθαξκνγήο ηελ αιπζίδα ππεξαγνξώλ Walmart, ε νπνία δξαζηεξηνπνηήζεθε κε 2000 ππνθαηαζηήκαηα, βνήζεζε ηελ Walmart λα βειηηζηνπνηήζεη ηηο δηαδηθαζίεο πξνκήζεηαο πξντόλησλ θαη λα κεηώζεη ην θόζηνο αγνξάο ηνπο θαηά 20%. Ο όγθνο ησλ δεδνκέλσλ ζηελ απνζήθε δεδνκέλσλ ηεο Walmart αλέξρεηαη ζηα 24 ΣΒ, ζε έλα ζύζηεκα 96 θόκβσλ κε 900 επεμεξγαζηέο θαη 2700 δίζθνπο. Απνζήθεο Γεδνκέλσλ 25

Απνζήθεο δεδνκέλωλ Βαζηθέο Λεηηνπξγίεο Απνζήθεο Γεδνκέλσλ 26

Αξρηηεθηνληθή Απνζεθώλ Γεδνκέλωλ Απνζήθεο Γεδνκέλσλ 27

Κύβνο Γεδνκέλωλ Οξηζκόο Μηα απνζήθε δεδνκέλσλ βαζίδεηαη ζε έλα πνιπδηάζηαην κνληέιν δεδνκέλσλ (multidimensional data model) πνπ αλαπαξηζηά ηα δεδνκέλα κε ηε κνξθή ελόο θύβνπ δεδνκέλσλ (data cube) Έλαο θύβνο δεδνκέλσλ (data cube) επηηξέπεη ηελ κνληεινπνίεζε θαη ηελ ζεώξεζε ησλ δεδνκέλσλ από πνιιέο νπηηθέο γσλίεο: ηηο δηαζηάζεηο (dimensions) ηνπ Γηα ζπγθεθξηκέλεο ηηκέο ζηηο δηαζηάζεηο ηνπ θύβνπ κπνξνύκε λα θάλνπκε κία κέηξεζε (measure) ηνπ ζηνηρείνπ πνπ καο ελδηαθέξεη Απνζήθεο Γεδνκέλσλ 28

Item Παξάδεηγκα Κύβνπ Γεδνκέλωλ Μέηξεζε: Πσιήζεηο γηα θάζε ζπγθεθξηκέλν ζπλδπαζκό ησλ ηηκώλ ησλ δηαζηάζεσλ (Location, Item, Time) Γηαζηάζεηο Time Κύβνο ΠΩΛΗΔΩΝ Απνζήθεο Γεδνκέλσλ 29

Ιεξαξρίεο Γηαζηάζεωλ Κάζε δηάζηαζε παίξλεη ηηκέο από δηαθνξεηηθά επίπεδα θαη κπνξεί λα εθθξαζηεί ζε δηαθνξεηηθά επίπεδα ιεπηνκέξεηαο (ηεξαξρίεο) Γηα παξάδεηγκα γηα ηηο δηαζηάζεηο: Product, Region, Date, νη ηεξαξρίεο ζα κπνξνύζαλ λα είλαη: Industry Country Year Category Region Quarter Product City Month Week Store Day Απνζήθεο Γεδνκέλσλ 30

Δλλνηνινγηθή ηεξαξρία (Concept Hierarchy) Παξάδεηγκα γηα Location all all region Europe... North_America country Germany... Spain Canada... Mexico city Frankfurt... Vancouver... Toronto office L. Chan... M. Wind Απνζήθεο Γεδνκέλσλ 31

Αλαπαξάζηαζε ηνπ Κύβνπ Μνληέιν Γεδνκέλωλ Σρήκαηνο Αζηέξα ρήκα Αζηέξα (Star schema) Έλαο Πίλαθαο Γεγνλόησλ βξίζθεηαη ζην θέληξν θαη ζπλδέεηαη κε έλα ζύλνιν από πίλαθεο δηαζηάζεσλ Ο Πίλαθαο Γεγνλόησλ (Fact Table) έρεη: ηηο κεηξήζεηο πνπ καο ελδηαθέξνπλ ζην ζπλδπαζκό ησλ δηαζηάζεσλ (π.ρ. αξηζκόο πσιήζεσλ, ηηκή ζε δνιάξηα, θιπ.) ην πξσηεύνλ θιεηδί θάζε ζρεηηθνύ πίλαθα δηαζηάζεσλ Πίλαθεο Γηαζηάζεσλ Πίλαθεο κε πιεξνθνξίεο ζρεηηθά κε ηηο ηηκέο θαη ηηο ηεξαξρίεο ηεο θάζε δηάζηαζεο π.ρ. Ιtem (item_name, brand, type), π.ρ. Σime (day, week, month, quarter, year) Απνζήθεο Γεδνκέλσλ 32

Παξάδεηγκα Σρήκαηνο Αζηέξα time time_key day day_of_the_week month quarter year branch branch_key branch_name branch_type Μεηξήζεηο 4 Γηαζηάζεηο (time, item, location, branch) time_key item_key branch_key location_key units_sold dollars_sold avg_sales item item_key item_name brand type supplier_type location location_key street city state_or_province country Πίλαθαο Γεγνλόησλ (ΠΩΛΗΔΙ) Απνζήθεο Γεδνκέλσλ 33

Μνληέιν Γεδνκέλωλ Σρήκαηνο Χηνλνληθάδαο (Snowflake schema) Δίλαη κηα βειηίσζε ηνπ ζρήκαηνο αζηέξα ζύκθσλα κε ηελ νπνία ε ηεξαξρία δηαζηάζεσλ ησλ πηλάθσλ δηάζηαζεο θαλνληθνπνηείηαη ζε έλα ζύλνιν από κηθξόηεξνπο πίλαθεο δηαζηάζεσλ Απνζήθεο Γεδνκέλσλ 34

Παξάδεηγκα Σρήκαηνο Χηνλνληθάδαο time time_key day day_of_the_week month quarter year branch branch_key branch_name branch_type Μεηπήζειρ time_key item_key branch_key location_key units_sold dollars_sold avg_sales Πίλαθαο Γεγνλόησλ ΠΩΛΗΔΙ item item_key item_name brand type supplier_key location location_key street city_key city supplier supplier_key supplier_type city_key city state_or_province country Απνζήθεο Γεδνκέλσλ 35

Μνληέιν Γεδνκέλωλ - Αζηεξηζκνί Γεγνλόηωλ (Fact constellations) Βαζίδεηαη ζε Πνιιαπινύο Πίλαθεο Γεγνλόησλ πνπ κνηξάδνληαη ηνπο Πίλαθεο Γηαζηάζεσλ. Μπνξνύκε λα ηνπο παξνκνηάζνπκε σο κία ζπιινγή από αζηέξηα ή γαιαμίεο Απνζήθεο Γεδνκέλσλ 36

time time_key day day_of_the_week month quarter year branch branch_key branch_name branch_type Μεηπήζειρ Παξάδεηγκα Σρήκαηνο Αζηεξηζκώλ Γεγνλόηωλ time_key item_key branch_key location_key units_sold dollars_sold avg_sales Πίλαθαο Γεγνλόησλ ΠΩΛΗΔΙ item item_key item_name brand type supplier_type location location_key street city province_or_state country Πίλαθαο Γεγνλόησλ ΑΠΟΣΟΛΗ time_key item_key shipper_key from_location to_location dollars_cost units_shipped shipper shipper_key shipper_name location_key shipper_type Απνζήθεο Γεδνκέλσλ 37

Κύβνο Γεδνκέλωλ πρλά ν n-d θύβνο ιέγεηαη βαζηθόο θπβνεηδήο (base cuboid). Πεξηέρεη ηνλ κεγαιύηεξν βαζκό ιεπηνκέξεηαο. π.ρ. Γηα θύβν κε ηέζζεξεηο δηαζηάζεηο (Item, Time, Branch, Location) έρνπκε 4-D βαζηθό θπβνεηδή O θπβνεηδήο κεδεληθήο δηάζηαζεο (0-D cuboid) πεξηέρεη ην κεγαιύηεξν δπλαηό επίπεδν πεξίιεςεο (apex cuboid). Σν πιέγκα όισλ ησλ θπβνεηδώλ θάζε δηάζηαζεο από 0 έσο θαη n νλνκάδεηαη θύβνο δεδνκέλσλ. Απνζήθεο Γεδνκέλσλ 38

Παξάδεηγκα πιέγκαηνο θπβνεηδώλ (0-4D) all 0-D(apex) cuboid time item location supplier 1-D cuboids time, item time, location time, supplier item, location item, supplier location, supplier 2-D cuboids time, item, location time, item, supplier time, location, supplier item, location, supplier 3-D cuboids time, item, location, supplier 4-D (base) cuboid Απνζήθεο Γεδνκέλσλ 39

OLAP θαη Σπλάζξνηζε Γηα ηελ εθηέιεζε πξάμεσλ ζε έλα ζύζηεκα OLAP απαηηείηαη ν νξηζκόο ηνπ ηξόπνπ παξαγσγήο ησλ θύβσλ-απνηειεζκάησλ, κέζσ κίαο ζπλαζξνηζηηθήο ζπλάξηεζεο (aggregate function) Οη βαζηθέο ζπλαζξνηζηηθέο ζπλαξηήζεηο είλαη: αζξνίζκαηνο (sum), πιήζνπο (count), κέζνπ όξνπ (avg), κεγίζηνπ (max), θαη ειαρίζηνπ (min). Απνζήθεο Γεδνκέλσλ 40

Μεηξήζεηο - Σπλαζξνίζεηο Δθηόο από ηηο ιεπηνκεξείο πιεξνθνξίεο πνπ νξίζηεθαλ σο κεηξήζεηο ζηα fact tables, κπνξνύλ λα ππνινγηζηνύλ θαη ζπλαζξνίζεηο ησλ δεδνκέλσλ γηα θαιύηεξνπο ρξόλνπο απόθξηζεο. Γηα παξάδεηγκα, αλ ν fact table είλαη: SALES(GeographyCode, ProductCode, TimeCode, BrandCode, Amount, Unit) Σόηε κπνξνύλ επηπξόζζεηα λα ππνινγηζηνύλ π.ρ.: AVG(Amount) αλά Region, Product, Quarter SUM(Amount) αλά City MAX(Unit) αλά Brand, Month, κε Region = Europe Απνζήθεο Γεδνκέλσλ 41

Country Παξάδεηγκα Σπλαζξνίζεωλ TV PC VCR sum Date 1Qtr 2Qtr 3Qtr 4Qtr sum Total annual sales of TV in U.S.A. U.S.A Canada Mexico Total annual sales of TV in All countries Total annual sales of all Devises in All countries Απνζήθεο Γεδνκέλσλ 42

Sales table RID City Amount 1 Athens $100 2 N.Y. $300 3 Rome $120 4 Athens $250 5 Rome $180 6 Rome $65 7 N.Y. $450 City-dimension sum table City Amount Athens $350 N.Y. $750 Rome $365 Παξάδεηγκα Σπλαζξνίζεωλ ζε Πίλαθα Γεγνλόηωλ δημιοςπγείηαι ξεσυπιζηόρ πίνακαρ/ότη για ηα αθποίζμαηα Δθηεηακέλνο πίλαθαο πσιήζεσλ: Δλζσκάησζε ησλ αζξνηζηηθώλ εγγξαθώλ ζηνλ βαζηθό fact table κε κία επηπιένλ ζηήιε πνπ εμεγεί ην επίπεδν ηεο ζπλάζξνηζεο Extended Sales table sum RID City Amount Level 1 Athens $100 NULL 2 N.Y. $300 NULL 3 Rome $120 NULL 4 Athens $250 NULL 5 Rome $180 NULL 6 Rome $65 NULL 7 N.Y. $450 NULL 8 Athens $350 City 9 N.Y. $750 City 10 Rome $365 City Απνζήθεο Γεδνκέλσλ 43

Βαζηθέο Αιγεβξηθέο Πξάμεηο πλαζξνηζηηθή Άλνδνο (Roll-up): ζπλάζξνηζε ηεο πιεξνθνξίαο κε κεηάβαζε από ρακειόηεξν ζε πςειόηεξν επίπεδν ηεξαξρίαο (π.ρ. από day ζε month) Αλαιπηηθή Κάζνδνο (Drill-down): ην αληίζηξνθν ηνπ Roll up (π.ρ month ζε day) Οξηδόληηνο Σεκαρηζκόο (Slice): επηινγή εγγξαθώλ από κία δηάζηαζε. Κάζεηνο Σεκαρηζκόο (Dice): επηινγή εγγξαθώλ από πεξηζζόηεξεο δηαζηάζεηο. Πεξηζηξνθή (Pivot): αλαδηάηαμε ηεο πξνβνιήο ηνπ πνιπδηάζηαηνπ θύβνπ (ηεο απεηθόληζήο ηνπ) Απνζήθεο Γεδνκέλσλ 44

Πξάμε Σπλαζξνηζηηθήο Αλόδνπ (Roll-up) Η ζπλαζξνηζηηθή άλνδνο πεξηιακβάλεη ηνλ ππνινγηζκό κίαο ζπλνιηθήο ηηκήο γηα κία ζέζε ζηελ ηεξαξρία κίαο δηάζηαζεο δεδνκέλσλ. Γηα παξάδεηγκα, κε έλα roll-up, νη πσιήζεηο ζε επίπεδν ηνπηθώλ καγαδηώλ (Store) παξάγνπλ ηηο ζπλνιηθέο πσιήζεηο ζε επίπεδν πόιεο (City) θαη απηέο κε ηε ζεηξά ηνπο κε έλα αθόκα roll-up παξάγνπλ ηηο πσιήζεηο ζε επίπεδν πεξηνρήο (Region). Industry Category Product Country Region City Store Year Quarter Month Week Day Απνζήθεο Γεδνκέλσλ 45

Q2 Year 1996 Q1 Παξάδεηγκα Πξάμεο Roll-up Industry Category Country Region Year Quarter Sales volume Products Store1 Store2 Product City Store Month Week Day Electronics Toys Clothing Cosmetics Electronics Toys Clothing Cosmetics $5,2 $1,9 $2,3 $1,1 $8,9 $0,75 $4,6 $1,5 $5,6 $1,4 $2,6 $1,1 $7,2 $0,4 $4,6 $0,5 Υξόλνο: Επίπεδο Quarter Sales volume Products Electronics Toys Clothing Cosmetics Store1 Store2 $14,1 $2,65 $6,9 $2,6 $12,8 $1,8 $7,2 $1,6 Υξόλνο: Επίπεδο Year SUM(Sales volumes in dollars) Απνζήθεο Γεδνκέλσλ 46

Πξάμε Αλαιπηηθήο Καζόδνπ (Drill-down) Ο ρξήζηεο πεξλά από έλα αλώηεξν επίπεδν κίαο δηάζηαζεο πνπ έρεη ζπγθεληξσηηθά δεδνκέλα ζε έλα ρακειόηεξν επίπεδν κε πην ιεπηνκεξή δεδνκέλα. Πξόθεηηαη γηα ηελ αληίζηξνθε πξάμε ηνπ roll-up. Γηα παξάδεηγκα, θαηά ην drill-down, μεθηλάκε από ηηο πσιήζεηο αλά πεξηνρή (Region) θαη παίξλνπκε ηηο αλαιπηηθέο πσιήζεηο αλά πόιε (City) θαη κεηά ηηο πσιήζεηο αλά θαηάζηεκα (Store). Industry Category Product Country Region City Store Year Quarter Month Week Day Απνζήθεο Γεδνκέλσλ 47

Q2 Q2 Q1 Q1 Παξάδεηγκα Πξάμεο Drill-down Sales volume Products Industry Category Product Store1 Store2 Country Year Region Quarter City Month Week Store Day Sales volume Electronics Store1 Store2 Electronics Toys Clothing Cosmetics $5,2 $1,9 $2,3 $1,1 $5,6 $1,4 $2,6 $1,1 VCR Camcorder TV CD player $1,4 $0,6 $2,0 $1,2 $1,4 $0,6 $2,4 $1,2 Electronics Toys Clothing Cosmetics $8,9 $0,75 $4,6 $1,5 $7,2 $0,4 $4,6 $0,5 VCR Camcorder TV CD player $2,4 $3,3 $2,2 $1,0 $2,4 $1,3 $2,5 $1,0 Item: Επίπεδο Industry Item: Επίπεδο Category Απνζήθεο Γεδνκέλσλ 48

Πξάμε Πεξηζηξνθήο (Pivot) Με ηελ πξάμε απηή γίλεηαη ελαιιαγή ησλ γξακκώλ θαη ησλ ζηειώλ ηνπ θύβνπ, όπσο απηόο απεηθνλίδεηαη. Γελ απαηηείηαη θαλέλαο λένο ππνινγηζκόο. Απνζήθεο Γεδνκέλσλ 49

Q2 Store 2 Q1 Store 1 Παξάδεηγκα Πξάμεο Pivot Sales volume Sales volume Products Store1 Store2 Products Q1 Q2 Electronics Toys Clothing Cosmetics $5,2 $1,9 $2,3 $1,1 $5,6 $1,4 $2,6 $1,1 Electronics Toys Clothing Cosmetics $5,2 $1,9 $2,3 $1,1 $8,9 $0,75 $4,6 $1,5 Electronics Toys Clothing Cosmetics $8,9 $0,75 $4,6 $1,5 $7,2 $0,4 $4,6 $0,5 Electronics Toys Clothing Cosmetics $5,6 $1,4 $2,6 $1,1 $7,2 $0,4 $4,6 $0,5 Εναλλαγή γπαμμών και ζηηλών Απνζήθεο Γεδνκέλσλ 50

Οξηδόληηνο Τεκαρηζκόο (Slice) Γίλεηαη επηινγή ζπγθεθξηκέλσλ ηηκώλ από κία δηάζηαζε (where ηεο SQL), π.ρ. επέιεμε ην 1o ηξίκελν από ηελ δηάζηαζε εκεξνκελία Απνζήθεο Γεδνκέλσλ 51

Κάζεηνο Τεκαρηζκόο (Dice) Γίλεηαη επηινγή ζπγθεθξηκέλσλ ηηκώλ από πεξηζζόηεξεο δηαζηάζεηο (εμάγεη έλαλ ππνθύβν) Απνζήθεο Γεδνκέλσλ 52