Πληροφοριακά Συστήματα Διοίκησης

Σχετικά έγγραφα
Πληροφοριακά Συστήματα Διοίκησης

Cloud Computing & Data Management (Υπολογιστικά Νέφη & Διαχείριση Δεδομένων)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ ΕΠΙΣΤΗΜΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ Η/Υ

Ιστορία ACID CAP Theorem Eventual consistency και BASE Enter NoSQL Χαρακτηριστικά NoSQL βάσεων NoSQL taxonomy Ρολόγια Lamport

ΜΕΛΕΤΗ ΣΧΕΔΙΑΣΗ ΕΦΑΡΜΟΓΗΣ ΣΕ ΥΠΟΛΟΓΙΣΤΙΚΟ ΝΕΦΟΣ (CLOUD COMPUTING) ΜΕ ΕΜΦΑΣΗ ΣΤΗΝ ΚΑΤΑΣΚΕΥΗ ΔΕΝΤΡΩΝ.

Big Data Πνιγόμαστε σε έναν ωκεανό δεδομένων

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

EPL 660: Lab 4 Introduction to Hadoop

Σύγκριση MySQL με MongoDB στο μετροπρόγραμμα TPC-H

Διδάσκων: Νεκτάριος Κοζύρης, καθηγητής

Γεω-χωρικές υπηρεσίες και τεχνολογίες WEB. Βασίλειος Βεσκούκης Μηχανικός ΗΥ, Επ.Καθ. ΕΜΠ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ

Βάσεις δεδομένων. Π. Φιτσιλής

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Μελέτη και Ανάπτυξη ενός Εργαλείου Υποβοήθησης στη Σχεδίαση µίας Βάσης εδοµένων Τύπου Graph από Τελικούς Χρήστες

Μελέτη και Σύγκριση Επιδόσεων Κατανεμημένων Βάσεων Δεδομένων Σε Υπολογιστικές Υπηρεσίες Νέφους ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διδάσκων: Νεκτάριος Κοζύρης, καθηγητής

NoSQL databases : Ποιοτική και Ποσοτική Σύγκριση μεταξύ των Cassandra, BaseX και Mongodb

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Αναπαράσταση Δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ - Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

Μαζικός Παραλληλισμός λ με Map - Reduce. Μοντέλο Θέματα υλοποίησης Παραδείγματα διαχείρισης δεδομένων

ΑΝΑΛΥΤΙΚΗ ΜΕΓΑΛΩΝ ΔΕΔΟΜΕΜΩΝ ΜΕ ΧΡΗΣΗ HADOOP

Big Data. CERN/LHC: 40TB/μέρα (15PB/έτος) Πολλά, πολλά ακόμα Web logs, αρχεία ομιλιών, ιατρικοί φάκελοι, κλπ. για όλους...

Ανάλυση εδοµένων, Big Data και Ευκαιρίες στη Σύγχρονη Εποχή

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ Εαρινό Εξάμηνο

Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου.

ΠΡΑΚΤΙΚΟ ΑΞΙΟΛΟΓΗΣΗΣ ΚΑΙ ΕΠΙΛΟΓΗΣ ΥΠΟΨΗΦΙΩΝ

Δ Ε Λ Τ Ι Ο Τ Υ Π Ο Υ

Στην Εποχή των Μεγάλων Δεδοµένων (Big Data)

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Διαχείρισης Βάσεων Δεδομένων

Ερωτήµατα διαστηµάτων σε περιβάλλοντα νεφών υπολογιστών

Υλοποίηση Αρχιτεκτονικής Ανάλυσης Ροών Δεδομένων σε πραγματικό χρόνο με υποστήριξη μεθόδων Αποθήκευσης Στοιχείων και Εξόρυξης Πληροφορίας

Εργαστήριο Σημασιολογικού Ιστού

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία. AtYourService CY : Create a REST API. Δημήτρης Χριστοδούλου

ΔΕΛΤΙΟ ΤΥΠΟΥ ΕΡΕΥΝΑ ΧΡΗΣΗΣ ΤΕΧΝΟΛΟΓΙΩΝ ΠΛΗΡΟΦΟΡΗΣΗΣ, ΕΠΙΚΟΙΝΩΝΙΑΣ ΚΑΙ ΗΛΕΚΤΡΟΝΙΚΟΥ ΕΜΠΟΡΙΟΥ ΣΤΙΣ ΕΠΙΧΕΙΡΗΣΕΙΣ 2018

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Γ ΓΥΜΝΑΣΙΟΥ

Εργαστήριο Σημασιολογικού Ιστού

Εισαγωγή στην Πληροφορική

Ανοικτά Δεδομένα Ρούτσης Φώτιος

Υλοποίηση κατασκευής δέντρου επιθεμάτων σε Hadoop MapReduce

Εργαστήριο Προγραμματισμού και τεχνολογίας Ευφυών συστημάτων (intelligence)

ΠΛΗΡΟΦΟΡΙΚΗ ΣΤΟ ΕΝΙΑΙΟ ΛΥΚΕΙΟ

Εισαγωγή στον Προγραμματισμό

Διαχείριση Πολιτισμικών Δεδομένων

Η χρήση των Big Data Analytics για τη βελτίωση των ψηφιακών υπηρεσιών υγείας

ΚΕΝΤΡΟ ΔΙΑΧΕΙΡΙΣΗΣ ΚΥΚΛΟΦΟΡΙΑΣ

Ηλεκτρονικό εμπόριο. Ψηφιακή οικονομία επιχειρηματικά μοντέλα ηλεκτρονικού εμπορίου

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Επερωτήσεις σύζευξης με κατάταξη

Efficient Big Data Storage and Retrieval in Multimedia Cloud Computing Systems ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Άσκηση 1. Δίδονται: Ποσότητα Πληροφορίας. D4: 300 bit ΔΜ: 2 Kbit E: 10 Mbit. Διαφημιστικά Μηνύματα (ΔΜ) + Εικόνες (Ε)

Όλες οι υπηρεσίες είναι διαθέσιμες μέσω διαδικτύου.

L. M. Vaquero, L. Rodero Merino, J. Caceres, M. Lindner


Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ανάπτυξη πρότυπης εφαρμογής διαδικτύου με τη χρήση σύγχρονων τεχνολογιών εφαρμογών διαδικτύου και ανάλυσης δεδομένων μεγάλου όγκου

Υπηρεσίες Ιστού (Web Services) ΜΙΧΑΛΗΣ ΜΑΛΙΑΠΠΗΣ

Προγραμματισμός Υπολογιστών

ΜΕΓΑΛΑ ΔΕΔΟΜΕΝΑ Η ΕΞΟΡΥΞΗ ΤΟΥΣ ΚΑΙ Η ΣΥΜΒΟΛΗ ΤΟΥΣ ΣΤΗΝ ΕΠΙΧΕΙΡΗΜΑΤΙΚΗ ΕΥΦΥΙΑ

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

Προγραμματισμός Η/Υ. Χειρισμός Αρχείων. ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος

ΠΛΗΡΟΦΟΡΙΚΉ. Μάθημα 7

Χαρτογραφώντας με VGI Δεδομένα: Βύρων Αντωνίου, Ανδριανή Σκοπελίτη, Λύσανδρος Τσούλος

Π Τ Υ Χ Ι Α Κ Η /ΔΙ Π Λ Ω Μ ΑΤ Ι Κ Η Ε Ρ ΓΑ Σ Ι Α

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ

ΠΡΟΥΠΟΛΟΓΙΣΜΟΙ ΔΕΣΜΕΥΣΕΙΣ - ΔΙΑΧΕΙΡΙΣΗ Περιφερειακών Ταμείων Ανάπτυξης

Κεφάλαιο 1. Βασικές Έννοιες Πληροφοριακών Συστημάτων. Βασικές Έννοιες

Τεχνικές εξαγωγής και ανάλυσης συναισθημάτων σε μηνύματα του Twitter και υλοποίηση της ανάλυσης σε περιβάλλον cloud

Σχεδιασμός Επεξεργασίας και Τηλεπεξεργασίας

Αυτοματοποιημένη χαρτογραφία

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Η καταναλωτική συμπεριφορά και οι σύγχρονοι τρόποι μελέτης της

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

Π Τ Υ Χ Ι Α Κ Η Ε Ρ Γ Α Σ Ι Α

Προηγμένα Θέματα Δικτύων Υπολογιστών

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ

Τ.Ε.Ι. ΠΕΛΟΠΟΝΝΗΣΟΥ. Τυήυα Μηγανικών Πληοοωοοικής Τ.Ε. Σγολή Τεννολονικών Εωαουονών. Πτυνιακή εργασία ΜΕΛΕΤΗ ΜΗ ΣΧΕΣΙΑΚΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Εισαγωγή στην Επιστήμη των Υπολογιστών

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Βάσεις Περιβαλλοντικών Δεδομένων

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

Το Μέλλον για τα Συστήματα Διαχείρισης Ακτινολογικής Εικόνας (PACS)

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

A J A X AJAX Γιάννης Αρβανιτάκης

Παράρτημα Α. Πρότυπα Διάθεσης Ψηφιακών Δεδομένων

Κεφάλαιο 8: Υπολογιστικές Μέθοδοι για Ανάλυση Μεγάλων Δεδομένων (Hadoop και MapReduce)

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Β1.1 Αναπαράσταση Δεδομένων και Χωρητικότητα Μονάδων Αποθήκευσης

ΠΕΡΙΕΧΟΜΕΝΑ 1. ΕΙΣΑΓΩΓΗ ΑΡΙΘΜΗΤΙΚΗ ΤΟΥ ΥΠΟΑΟΓΙΣΤΗ ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ...3-1

Τακοινωνικάδίκτυαστηνπροώθηση τηςεπιστημονικήςέρευνας.

Εισαγωγή στην Επιστήμη των Υπολογιστών

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Transcript:

Πληροφοριακά Συστήματα Διοίκησης Μεγάλα Δεδομένα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου

Bytes 1KB = 2 10 1MB = 2 20 1GB = 2 30 1TB = 2 40 1PB = 2 50 1EB = 2 60 1ZB = 2 70 1YB = 2 80 bytes bytes bytes bytes bytes bytes bytes bytes 1YottaByte 2

Μορφές δεδομένων Δομημένα Σχεσιακές βάσεις δεδομένων XML JSON Ημι-δομημένα CSV (Comma Separated Values) Emails Tweets Facebook statuses Σχόλια σε Blogs Κείμενο Εικόνα Ήχος Βίντεο Αδόμητα 3

XML (extensible Markup Language) XML είναι μια γλώσσα σήμανσης (markup language) που ορίζει κανόνες για την κωδικοποίηση εγγράφων έτσι ώστε να είναι αναγνώσιμα από ανθρώπους και ταυτόχρονα κατάλληλα για επεξεργασία από προγράμματα υπολογιστών 4

JSON (JavaScript Object Notation) JSON είναι μια μορφή αρχείων που χρησιμοποιείται για ανταλλαγή δεδομένων μεταξύ εφαρμογών Μπορεί να διαβαστεί σχετικά εύκολα από ανθρώπους και καταλαμβάνει λιγότερο χώρο σε σχέση με τα XML αρχεία 5

CSV (Comma Separated Values) CSV : τιμές χωρισμένες με κόμματα ή με άλλα σύμβολα όπως το ερωτηματικό Χρησιμοποιείται για ανταλλαγή δεδομένων μεταξύ εφαρμογών Πολλά προγράμματα υποστηρίζουν την εισαγωγή ή την εξαγωγή δεδομένων σε CSV μορφή (π.χ. Excel, OpenOffice Calc, R, Weka, ) 6

Αλλαγές τελευταίων ετών Μείωση κόστους για αποθήκευση επεξεργασία Μείωση τιμών αισθητήρων Αλλαγή συμπεριφοράς χρηστών αποδοχή διάθεσης προσωπικών πληροφοριών Σημαντική πρόοδος σε αλγορίθμους μηχανικής μάθησης 7

Σημείο καμπής Το κόστος της υπολογιστικής επεξεργασίας και αποθήκευσης έφτασε σε κομβικό σημείο κάποια στιγμή ανάμεσα στο 2008 και το 2010 Περισσότερες επιχειρήσεις έχουν πλέον την δυνατότητα να διαχειρίζονται Big Data 8

Τι είναι τα Big Data; Τα Big Data είναι τεράστιες ποσότητες δομημένων, ημι-δομημένων και αδόμητων δεδομένων Τα Big Data είναι ο συνδυασμός εξελίξεων στην τεχνολογία που συνέβησαν τα τελευταία 50 έτη 9

Τα τρία V των Big Data Volume (όγκος ποσότητα δεδομένων) Terabytes έως Petabytes δεδομένων Η ποσότητα των δεδομένων που συλλέγονται αυξάνεται συνεχώς Ότι θεωρείται σήμερα ως μεγάλα δεδομένα στο μέλλον θα είναι ακόμα μεγαλύτερο Variety (ποικιλομορφία) Συγκέντρωση δεδομένων από διάφορες πηγές εντός και εκτός της επιχείρησης Δεδομένα από αισθητήρες Δεδομένα από έξυπνες συσκευές Velocity (ταχύτητα) Η ταχύτητα με την οποία δημιουργούνται τα δεδομένα συνεχώς αυξάνεται Ορισμένες εφαρμογές απαιτούν λήψη αποφάσεων σε real time 10

Big Data και επιχειρήσεις Το σύστημα Big Data που θα προταθεί θα πρέπει: να παρέχει προστιθέμενη αξία για την επιχείρηση να είναι οικονομικό να λειτουργεί με αποδεκτή ταχύτητα Δεν είναι πάντα τα δεδομένα Big Data 11

Map Reduce και Apache Hadoop To MapReduce (Google 2003) είναι ένα υπολογιστικό μοντέλο που χρησιμοποιείται ευρύτατα για αποδοτική κατανεμημένη επεξεργασία πάνω σε μεγάλα σύνολα δεδομένων Εκτελείται σε συστάδες υπολογιστών και επωφελείται από την ύπαρξη πολλών κόμβων στους οποίους μπορεί να ανατεθεί εργασία Το Apache Hadoop είναι λογισμικό ανοικτού κώδικα που παρέχει την υποδομή για προγραμματισμό εργασιών Map Reduce Η βασική ιδέα είναι η μετακίνηση των υπολογισμών στα δεδομένα Έχει πολύ μεγάλη αποδοχή (Yahoo!, Twitter, Amazon, Facebook κ.α.) 12

Παράδειγμα καταμέτρησης λέξεων http://xiaochongzhang.me/blog/?p=338 13

NoSQL Βάσεις Δεδομένων Οι NoSQL ΒΔ χρησιμοποιούνται συχνά για την αποθήκευση Big Data Τα δεδομένα αποθηκεύονται σε πολλούς υπολογιστές (sharding=θρυματισμός) Αν ένας υπολογιστής παρουσιάσει βλάβη τότε χρησιμοποιούνται αντίγραφα των δεδομένων που διατηρούσε από άλλους υπολογιστές Πλεονεκτήματα Ευκολότερη κλιμάκωση (high scalability) Υψηλές επιδόσεις Αποθήκευση μη δομημένων δεδομένων Μειονεκτήματα (features) Weak (eventual) consistency No schema No transactions No SQL 14

NoSQL landscape Υπάρχουν πολλές τεχνολογίες NoSQL ΒΔ Key value stores: Redis, Riak Column Family Stores: Cassandra, HBase Document databases: MongoDB, CouchDB Graph databases: Neo4J, Infogrid, HyperGraphDB 15

Κριτική στα Big Data 16