Big Data Πνιγόμαστε σε έναν ωκεανό δεδομένων
Παράδειγμα οι Ολυμπιακοί του Λονδίνου
Τα σύμβολα Power Name Symbol 10^3 kilo k 10^6 mega M 10^9 giga G 10^12 tera T 10^15 peta P 10^18 exa E 10^21 zetta Z 10^24 yotta Y 10^27 xona X 10^30 weka W 10^33 vunda V 10^36 uda U 10^39 treda TD 10^42 sorta S 10^45 rinta R 10^48 quexa Q 10^51 pepta PP 10^54 ocha O 10^57 nena N 10^60 minga MI 10^63` luma L
Τα προβλήματα στο κλασσικό μοντέλο Data Warehouse-based BI Οι περισσότερες εργασίες ενημέρωσης δεν γίνονται On-Line Οι χρόνοι ενημέρωσης είναι μεγάλοι Η διαδικασία ενημέρωσης δεν μπορεί να διακοπεί ή να διαφοροποιηθεί εύκολα Η αλλαγή δομής του DW δεν είναι εύκολη διαδικασία Τα δεδομένα επαναλαμβάνονται μέσα από ενοποιήσεις και ομαδοποιήσεις σε πολλά σημεία (π.χ. λειτουργικά δεδομένα σχεσιακά DW πολυδιάστατα DW) Χάνεται χρόνος και χρήμα
Τo μοντέλο Big Data BI Create-Read- Update-Destroy
Φιλοσοφία Big Data
Τo μοντέλο Big Data BI με απλά λόγια
Big Data Χαρακτηριστικά - Πλεονεκτήματα Χαρακτηριστικά Ταχύτητα, επεκτασιμότητα, κινητικότητα, ασφάλεια, ευελιξία, σταθερότητα Δομημένα και αδόμητα δεδομένα Ταχύτητα απόκρισης από πολλαπλές πηγές (π.χ. κινητά, RFID, Web, αυτόματους αισθητήρες κ.λπ.) Πλεονεκτήματα Ακρίβεια Ευρύτερη προσέγγιση στις πηγές των δεδομένων Ευελιξία στη λήψη αποφάσεων Καλύτερη στόχευση Βελτίωση αποτελεσματικότητας
Τι σημαίνει αυτό;
HDFS (Hadoop Distributed File System) Σπάσιμο μεγάλων αρχείων Τα μέρη μοιράζονται σε πολλαπλούς χώρους Οι επαναλήψεις εξασφαλίζουν διαθεσιμότητα Κάθε κόμβος έχει μέρος των δεδομένων και εκτελεί επεξεργασία στα δεδομένα αυτά
NoSQL Δεν λύνονται όλα τα προβλήματα BI/BA αποκλειστικά με κλασσικές βάσεις δεδομένων Απαιτούνται μηχανισμοί αποθήκευσης και ανάκτησης δεδομένων εκτός του κλασσικού μοντέλου των πινάκων και των σχέσεων Βάσεις εγγράφων Βάσεις δικτύων (όπως σχέσεις μελών κοινωνικής δικτύωσης) Βάσεις κλειδιών (κάθε πληροφορία αποτελείται από κλειδιά και περιεχόμενο) Βάσεις πεδίων (βελτιστοποιημένες για ερωτήματα σε πολύ μεγάλες βάσεις, κατανέμοντας τα πεδίαστήλες)
NoSQL Χαρακτηριστικά Ευελιξία στην ανάπτυξη (μέσα από νέους κόμβους) Συνδυασμός δομημένων και αδόμητων δεδομένων Αντιμετώπιση σφαλμάτων σε κόμβους Εύκολη αναδόμηση
Χαρακτηριστικά Big Data 1. Όγκος 2. Ταχύτητα (η ταχύτητα εισαγωγής και εξαγωγής δεδομένων) 3. Ποικιλία (η ποικιλία τύπων δεδομένων και πηγών) 4. Μεταβλητότητα (εναλλακτικές προσεγγίσεις ή ερμηνείες)
Επένδυση στην τεχνολογία Big Data
Μείωση κόστους
Ταχύτερη απόκριση
Υποστήριξη λήψης αποφάσεων
Η εξέλιξη
Οι τεχνολογίες στον κύκλο της υπερβολής
Οι μύθοι των Big Data 1. Όλοι πρέπει να επενδύσουν. Εξαρτάται από μέγεθος και απαιτήσεις. Οι επενδύσεις είναι μεγάλες 2. Είναι άλλο ένα έργο ΠΣ. Δεν είναι. Είναι διερευνητικό, δίνει νέες δυνατότητες, ακούγεται απλό αλλά δεν είναι εύκολο. 3. Είναι κάτι νέο. Υπάρχει από το 1990. 4. Είναι καινοτομικό. Η τεχνολογία είναι. 5. Έχει όλες τις απαντήσεις. Μόνο η σωστή προσέγγιση στο πρόβλημα μπορεί να δώσει απαντήσεις. 6. Χρειάζεται για εμβάθυνση στα δεδομένα. 7. Όσο περισσότερα δεδομένα τόσο καλύτερα. Η ποιότητα υπερτερεί της ποσότητας.
Ιστορικό παράδειγμα εφαρμογής
Χαρακτηριστικά εφαρμογής Όγκος (τα σημεία συλλογής) Ταχύτητα (η ταχύτητα ενημέρωσης με νέα στοιχεία) Ποικιλία (ποιος συλλέγει, πώς και πού;) Μεταβλητότητα (διαφορετικές μέθοδοι καταγραφής και χρήσης. Αν και δεν υπήρχαν κοινωνικά δίκτυα, υπήρχαν διαδόσεις)
Αποτελέσματα εφαρμογής
Το μέλλον θα δείξει