Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων
YouTube Ιδρύθηκε το 2005 Στόχος του ήταν να δημιουργήσει μία παγκόσμια κοινότητα Βάση δεδομένων βίντεο Μέσα σε ένα χρόνο από τη δημιουργία του το 2005, οι επισκέπτες της αποκτούσαν πρόσβαση σε περισσότερα από 100 εκατομμύρια βίντεο την ημέρα
Φύση πληροφοριακών πόρων Οι πηγές δεδομένων, όπως του YouTube, είναι κεφαλαιώδους σημασίας για την επιτυχία ενός οργανισμού. Τα αποθηκευμένα σε ψηφιακή μορφή δεδομένα πολλαπλασιάζονται παντού, σε μια τεράστια συλλογή από φυσικά μέσα αποθήκευσης. Ορισμένα δεδομένα είναι πολύτιμα. Πολλά όμως είναι άχρηστα σκουπίδια τα οποία θα πρέπει να πεταχτούν. Για το λόγο αυτόν χρειάζεται να υπάρχει μια στρατηγική διαχείρισης των πηγών πληροφόρησης, ούτως ώστε οτιδήποτε είναι σημαντικό να είναι ασφαλές, οργανωμένο και εύκολα ανακτήσιμο από τους μάνατζερ, τους εργαζομένους, τους πελάτες, τους προμηθευτές και τα υπόλοιπα ενδιαφερόμενα μέρη.
Τύποι Δεδομένων Δομημένα δεδομένα: «τακτοποιημένα», με την έννοια ότι μπορούν να διαχωριστούν σε επιμέρους στοιχεία και να οργανωθούν σε ιεραρχικές δομές με ευκολία στη μεταξύ τους σύνδεση (π.χ. τα δεδομένα πελατών και συναλλαγών μιας επιχείρησης έκδοσης πιστωτικών καρτών) Αδόμητα δεδομένα: δεν διαθέτουν εγγενή δομή ή σειρά, ενώ τα επιμέρους στοιχεία τους δεν είναι εύκολο να συνδεθούν μεταξύ τους και είναι πιο δύσκολο να να κατηγοριοποιηθούν, να οργανωθούν και να αναζητηθούν (π.χ. τα δεδομένα μιας δικαστικής διαμάχης μπορεί να περιλαμβάνουν νομικά έγγραφα, τηλεφωνικές κλήσεις, μηνύματα φωνητικού ταχυδρομείου, βίντεο, περιλήψεις και φωτογραφίες τοποθετημένες σε αρχειοθήκες)
Τύποι Δεδομένων Ημι-δομημένα δεδομένα: διαθέτουν κάποιου τύπου δομή και βρίσκονται ανάμεσα στα δομημένα και αδόμητα δεδομένα (π.χ. ιστοσελίδες, πίνακες σε υπολογιστικά φύλλα) Μεταδεδομένα: δεδομένα που περιγράφουν δομημένα, αδόμητα ή ημιδομημένα δεδομένα (π.χ. ονόματα πινάκων και πεδίων βάσεων δεδομένων, ημερομηνία λήψης και μεταφόρτωσης φωτογραφίας ή βίντεο)
Ποιότητα δεδομένων Ορθότητα Ακρίβεια Πληρότητα Συνέπεια Επικαιρότητα Μεροληψία Αλληλοεπικάλυψη
Διαχείριση πληροφοριών Εγγραφή: τρόπος αναπαράστασης μιας οντότητας, η οποία μπορεί να είναι ένα άτομο, ένα προϊόν, μια παραγγελία, ένα γεγονός, ένας πωλητής, ένα βιβλίο, ένα βίντεο ή κάτι άλλο που έχει σημασία για τους ανθρώπους Πεδίο: ιδιότητες εγγραφής που κατά κανόνα περιέχουν αριθμητικά δεδομένα, δεδομένα κειμένου ή συνδυασμό τους (π.χ. όνομα, η ημερομηνία έναρξης ή λήξης) Πίνακας: σύνολο εγγραφών για την ίδια οντότητα (π.χ. πελάτες, υπάλληλοι, βιβλία)
Διαχείριση πληροφοριών
Συστήματα διαχείρισης και επεξεργασίας αρχείων Αρχικά, οι ηλεκτρονικές εγγραφές δημιουργούνταν και αποθηκεύονταν ως αρχεία υπολογιστή και οι προγραμματιστές έγραφαν προγράμματα για την προσθήκη, τη διαγραφή και την επεξεργασία των εγγραφών. Κάθε τμήμα μιας επιχείρησης διατηρούσε τις δικές του εγγραφές στα δικά του αρχεία υπολογιστή, καθένα εκ των οποίων περιλάμβανε τις απαιτούμενες για τη λειτουργία του πληροφορίες. Παρ όλα αυτά, τα προβλήματα δεν άργησαν να κάνουν την εμφάνισή τους, καθώς και άλλα τμήματα άρχισαν να αναπτύσσουν τα δικά τους συστήματα επεξεργασίας αρχείων.
Συστήματα διαχείρισης και επεξεργασίας αρχείων Πλεονασμός και ασυνέπεια δεδομένων
Συστήματα διαχείρισης και επεξεργασίας αρχείων Έλλειψη ολοκλήρωσης δεδομένων
Συστήματα διαχείρισης και επεξεργασίας αρχείων Ασυνέπεια ορισμών δεδομένων
Συστήματα διαχείρισης και επεξεργασίας αρχείων Εξάρτηση από τα δεδομένα: Τα πρώτα συστήματα κατέληξαν να είναι γίνουν εφιάλτης όσον αφορά τη συντήρησή τους, διότι τα προγράμματα και τα αρχεία τους ήταν αλληλένδετα και εξαρτημένα το ένα από το άλλο σε εξαιρετικά μεγάλο βαθμό. Τα μειονεκτήματα της επεξεργασίας αρχείων ως προσέγγιση για τη διαχείριση των πληροφοριών οδήγησαν σε έναν βελτιωμένο τρόπο οργάνωσης των δομημένων δεδομένων, η οποία βασίζεται στις βάσεις δεδομένων.
Βάσεις δεδομένων Τα θεμέλια της διαχείρισης πληροφοριών με τη σημερινή τους μορφή βασίζονται στις βάσεις δεδομένων και το λογισμικό διαχείρισής τους (συστήματα διαχείρισης βάσεων δεδομένων). Η βάση δεδομένων (database) είναι μια ενοποιημένη συλλογή πληροφοριών, οι οποίες είναι λογικά συσχετισμένες και αποθηκευμένες με τέτοιον τρόπο ώστε να ελαχιστοποιείται η αλληλοεπικάλυψη και να διευκολύνεται η γρήγορη ανάκλησή τους.
Βάσεις δεδομένων Πλεονεκτήματα βάσεων δεδομένων: Μείωση πλεονασμού Ακεραιότητα και ακρίβεια Δυνατότητα προσαρμογής στις αλλαγές Απόδοση και επεκτασιμότητα Ασφάλεια
Σχεσιακές βάσεις δεδομένων Ο βρετανός μαθηματικός E. F. Codd, ο οποίος εργαζόταν στην IBM, εφεύρε στις αρχές της δεκαετίας του 1970 τη σχεσιακή βάση δεδομένων (relational database), η οποία οργανώνει τις πληροφορίες σε πίνακες εγγραφών που συσχετίζονται μεταξύ τους, συνδέοντας ένα πεδίο ενός πίνακα με ένα πεδίο σε έναν άλλον πίνακα με τα αντίστοιχα δεδομένα. Τα συστήματα διαχείρισης βάσεων δεδομένων που υποστηρίζουν το σχεσιακό μοντέλο κυριαρχούν στην αγορά.
Σχεσιακές βάσεις δεδομένων
Προσπέλαση και ανάκληση πληροφοριών Οι περισσότεροι χρήστες συστημάτων βάσεων δεδομένων έχουν πρόσβαση στη βάση δεδομένων μέσω μιας εφαρμογής διεπαφής με διαδικτυακού τύπου φόρμες φιλικές προς το χρήστη. Παρότι τα λογισμικά εφαρμογών μπορούν να αναπτυχθούν σε διάφορες γλώσσες προγραμματισμού, ο βασικός τρόπος αλληλεπίδρασής τους με τη σχεσιακή βάση είναι μέσω μιας γλώσσας ερωτημάτων, εκ των οποίων η SQL είναι η δημοφιλέστερη.
Προσπέλαση και ανάκληση πληροφοριών Ανάμεσα σε άλλες εφαρμογές λογισμικού πρόσβασης σε συστήματα βάσεων δεδομένων είναι και η φωνητική αλληλεπιδραστική απόκριση (Interactive voice response IVR), η οποία χρησιμοποιεί τα σήματα που μεταδίδονται μέσω τηλεφώνου για να προσπελαστεί η βάση δεδομένων, να ανακληθούν πληροφορίες και να εισαχθούν δεδομένα. Επίσης υπάρχουν συστήματα υποβολής ερωτημάτων φυσικής γλώσσας, τα οποία απαντούν ορθά σε ερωτήματα φυσικής γλώσσας, είτε μέσω ομιλίας είτε μέσω πληκτρολόγησης. Έχουν αρκετά καλή απόδοση όταν τα ερωτήματα είναι περιορισμένου λεξιλογίου.
Ρύθμιση της Διαχείριση της βάσης δεδομένων απόδοσης και επεκτασιμότητα Ακεραιότητα, ασφάλεια και ανάκτηση Τεκμηρίωση
Πολλαπλές βάσεις δεδομένων Καθώς οι οργανισμοί αναπτύσσονται, ορισμένα παρόμοια μειονεκτήματα εμφανίζονται εκ νέου στο προσκήνιο, εφόσον πολλαπλασιάζεται ο αριθμός των βάσεων δεδομένων που χρησιμοποιούνται για την υποστήριξη των λειτουργιών, ιδιαίτερα όταν οι επιχειρήσεις συγχωνεύονται. Η ολοκλήρωση αποτελεί μεγάλη πρόκληση όταν υπάρχουν πολλαπλές βάσεις δεδομένων, λογισμικά εφαρμογών και ασυνέπειες στους ορισμούς των δεδομένων για παρόμοιες οντότητες.
Πολλαπλές βάσεις δεδομένων Μια προσέγγιση ολοκλήρωσης πουη οποία αντιμετωπίζει αποτελεσματικά τα προβλήματα ονομάζεται διαχείριση κύριων δεδομένων (master data management). Η διαδικασία αυτή επιχειρεί να επιτύχει συνεπείς και ομοιόμορφους ορισμούς για τα δεδομένα σε όλες τις μονάδες της επιχείρησης. Ομάδες από διαφορετικές μονάδες της επιχείρησης συμμετέχουν στη διαχείριση των κύριων δεδομένων για να διαπραγματευτούν και να επιλύσουν τις διαφορές τους. Μπορεί επίσης να οριστούν και επιτηρητές δεδομένων (data stewards) ώστε να διασφαλιστεί ότι καθένα τμήμα τηρεί όντως τους ορισμούς των κύριων δεδομένων που συμφωνήθηκαν.
Αποθήκες δεδομένων Μία διαφορετική στρατηγική ολοκλήρωσης περιλαμβάνει βασίζεται στην αποθήκη δεδομένων(data warehouse): ένα κεντρικό αποθετήριο δεδομένων που περιλαμβάνει πληροφορίες, αντλούμενες από πολλαπλές πηγές, οι οποίες μπορούν να χρησιμοποιηθούν για ανάλυση, συγκέντρωση επιχειρηματικής ευφυΐας και στρατηγικό σχεδιασμό.
Αποθήκες δεδομένων Εξαγωγή, μετασχηματισμός και φόρτωση (ETL)
Αποθήκες δεδομένων Η αποθήκη δεδομένων διευκολύνει την εύκολη πρόσβαση σε δεδομένα απαραίτητα για τον στρατηγικό σχεδιασμό. Συχνά αποτελούν την κύρια πηγή επιχειρηματικής ευφυΐας, την οποία οι μάνατζερ χρησιμοποιούν για να κατανοήσουν τους πελάτες και τις αγορές, καθώς και για να καταστρώσουν τα στρατηγικά τους σχέδια. Η εξόρυξη δεδομένων είναι μια μορφή συγκέντρωσης επιχειρηματικής ευφυΐας, η οποία χρησιμοποιεί στατιστικές τεχνικές για τη διερεύνηση των εγγραφών μιας αποθήκης δεδομένων, αναζητώντας κρυμμένα πρότυπα και σχέσεις μη ανιχνεύσιμες στις εκθέσεις ρουτίνας.
Απαγορεύεται η αναδημοσίευση ή αναπαραγωγή του παρόντος έργου με οποιονδήποτε τρόπο χωρίς γραπτή άδεια του εκδότη, σύμφωνα με το Ν. 2121/1993 και τη Διεθνή Σύμβαση της Βέρνης (που έχει κυρωθεί με τον Ν. 100/1975)