Εξόρυξη εδοµένων & Γεωγραφικά Συστήµατα Πληροφοριών

Σχετικά έγγραφα
Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ - ΕΝΟΤΗΤΑ 1 7/4/2013 ΕΝΟΤΗΤΕΣ ΜΑΘΗΜΑΤΟΣ. Ορισμός

Κεφάλαιο 4 ο. Η ψηφιακή επιχείρηση: Ηλεκτρονικό εμπόριο και ηλεκτρονικό επιχειρείν

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Πληροφοριακό Σύστημα Επιχειρηματικής Ευφυίας για την Oμαδοποίηση Πελατών Λιανικής

Αναλυτικές λειτουργίες ΣΓΠ

Εφαρµογές γεωγραφικών επεξεργασιών

Επώνυµη ονοµασία. Ενότητα 13 η Σχεδίαση,Επιλογή, ιανοµή Προϊόντων 1

Κεφάλαιο 2 ο. Συστήματα Πληροφοριών στην επιχείρηση

ΠΕΡΙ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΩΝ. Πανοραμική εικόνα του Ηφαιστείου της Νισύρου

Δεδομένα ενός ΓΣΠ: Οντότητες, αντικείμενα και περιγραφικά χαρακτηριστικά

Ηλεκτρονικό Εμπόριο. Ενότητα 3: Ηλεκτρονικό Επιχειρηματικό Σχέδιο Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

ΜΕΡΟΣ Ι: ΓΕΩΓΡΑΦΙΚΑ Ε ΟΜΕΝΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Η ΦΥΣΗ ΤΩΝ ΓΕΩΓΡΑΦΙΚΩΝ Ε ΟΜΕΝΩΝ...

Ο ΚΑΤΑΝΑΛΩΤΗΣ ΣΤΟ INTERNET

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι:

GIS: Εισαγωγή στα Γεωγραφικά Συστήµατα Πληροφοριών

Εισαγωγή στη χρήση των Συστηµάτων Γεωγραφικής Πληροφορίας

Ηλεκτρονικό Εμπόριο. Ενότητα 6: Διαχείριση Σχέσεων με Πελάτες Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Ολοκληρωµένα συστήµατα διαχείρισης κρίσεων δασικών πυρκαγιών: το σύστηµα firementor

ΔΙΑΚΗΡΥΞΗ ΔΗΜΟΠΡΑΣΙΑΣ ΜΕ ΑΡΙΘΜΟ ΔΔ-...

Εισαγωγή στο Μάρκετινγκ

Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών. (Geographical Information Systems GIS)

Περιεχόµενα. Πληροφοριακά Συστήµατα: Κατηγορίες και Κύκλος Ζωής. Π.Σ. ιαχείρισης Πράξεων. Π.Σ. ιοίκησης. Κατηγορίες Π.Σ. Ο κύκλος ζωής Π.Σ.

ΜΕΡΟΣ ΠΡΩΤΟ. Εισαγωγή

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Οργάνωση Γεωγραφικών. πληροφοριών

ΕΠΙΔΡΩΝΤΕΣ ΠΑΡΑΓΟΝΤΕΣ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ ΜΑΡΚΕΤΙΝΓΚ

Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων

ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΟΥΣΑ: ΑΡΙΣΤΕΑ ΓΚΑΓΚΑ, Ι ΑΚΤΩΡ ΟΙΚΟΝΟΜΙΚΩΝ

6 ο Πακέτο Εργασίας «Ψηφιακή Βάση ιαχείρισης Γεωγνώσης (e-repository of Geoscience Content)»

Ανάλυση Απαιτήσεων Απαιτήσεις Λογισµικού

Κατανοώντας την επιχειρηματική ευκαιρία

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Κεφάλαιο 12 Προγραµµατισµός και έλεγχος αποθεµάτων

Created by : Market Research Team. Market Research Team

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα

Ηλεκτρονικά Καταστήματα E Shops

Κανόνες για ανάπτυξη διαγραµµάτων κλάσεων

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Εισαγωγή στο Γραμμικό Προγραμματισμό. Χειμερινό Εξάμηνο

Μορφές των χωρικών δεδομένων

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής

Επεξεργασία Μεταποίηση. ΝτουµήΠ. Α.

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ ΚΑΙ ΚΑΙΝΟΤΟΜΙΑ

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

Τι είναι πληροφοριακό σύστημα

Τα µπιτ και η σηµασία τους. Σχήµα bit. ΚΕΦΑΛΑΙΟ 1: Αποθήκευση εδοµένων (1/2) 1.7 Αποθήκευση κλασµάτων 1.8 Συµπίεση δεδοµένων 1.9 Σφάλµατα επικοινωνίας

Οι Β2Β Ηλεκτρονικές Αγορές µε απλά λόγια

Εισαγωγή στο Marketing (βασικές έννοιες) ΑΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ Τμήμα Δημοσίων Σχέσεων & Επικοινωνίας Α. Κουμπαρέλης Καθηγητής Εφαρμογών

Εισαγωγή στα Πληροφοριακά Συστήματα

Οπτική αντίληψη. Μετά?..

Μαθηµατική. Μοντελοποίηση

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Μεθοδολογίες παρεµβολής σε DTM.

Απόδοση θεματικών δεδομένων

Διοίκηση Επιχειρήσεων

Αγροτικά Προϊόντα Μικρών Παραγωγών

Τεχνικές Εξόρυξης Δεδομένων

Βάσεις εδοµένων. Βασίλειος Βεσκούκης, Εµµ. Στεφανάκης ΜΟΝΤΕΛΟΠΟΙΗΣΗ Ε ΟΜΕΝΩΝ, ΚΛΑΣΙΚΑ ΜΟΝΤΕΛΑ Ε ΟΜΕΝΩΝ

ΜΑΘΗΜΑ: ΜΑΡΚΕΤΙΝΓΚ ΠΡΟΙΌΝΤΩΝ ΜΑΡΚΕΤΙΝΓΚ ΞΥΛΟΥ ΚΑΙ ΕΠΙΠΛΟΥ

Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud

Στρατηγική Επιλογή Capital B.O.S. Capital B.O.S.

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΡΟΔΙΑΓΡΑΦΕΣ ΕΝΟΣ ΗΛΕΚΤΡΟΝΙΚΟΥ ΚΑΤΑΣΤΗΜΑΤΟΣ

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

2.5.1 Χρήση δεξιοτήτων αρχειοθέτησης για τη διατήρηση ενός καθιερωμένου συστήματος

Επιχειρηµατικές ιαδικασίες: Εισαγωγικές Έννοιες & Αρχικά στάδια µοντελοποίησης

Κεφάλαιο 1 ο. Διοίκηση και διαχείριση της ψηφιακής επιχείρησης

µια λειτουργική προσέγγιση στην απεικόνιση του χάρτη σηµασιολογία και και σύνταξη των των χαρτογραφικών σηµάτων

Έρευνα και Ανάλυση ΕΡΕΥΝΑ ΤΟΥ ΣΕΒ ΓΙΑ ΤΙΣ ΑΝΑΓΚΕΣ ΤΩΝ ΒΙΟΜΗΧΑΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ ΣΕ ΕΙ ΙΚΟΤΗΤΕΣ ΑΙΧΜΗΣ

Η θεωρία Weber Προσέγγιση του ελάχιστου κόστους

ρ. ιονύσης Σκαρµέας ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΑΡΚΕΤΙΝΓΚ ΜΑΡΚΕΤΙΝΓΚ & ΠΕΡΙΒΑΛΛΟΝ ΕΡΕΥΝΑ ΜΑΡΚΕΤΙΝΓΚ ΣΥΜΠΕΡΙΦΟΡΑ ΑΓΟΡΑΣΤΗ ΣΤΡΑΤΗΓΙΚΗ ΜΑΡΚΕΤΙΝΓΚ ΠΡΟΙΟΝ ΙΑΝΟΜΗ ΠΡΟΒΟΛΗ

7

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

Κεφάλαιο 1. Βασικές Έννοιες Πληροφοριακών Συστημάτων. Βασικές Έννοιες

Μάθηµα: ιαχείριση Ενέργειας και Περιβαλλοντική Πολιτική. Καθηγητής Ιωάννης Ψαρράς. Εργαστήριο Συστηµάτων Αποφάσεων & ιοίκησης

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

ΙΝΤΡΑΚΟΜ Ανώνυμη Εταιρεία Τηλεπικοινωνιακών Λύσεων 19,7 χλμ. Λεωφ. Μαρκοπούλου, Παιανία Αττικής τ: f:

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2007

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΙΑΧΕΙΡΙΣΗ ΠΕΡΙΓΡΑΦΙΚΩΝ ΣΤΟΙΧΕΙΩΝ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΓΙΑ ΜΑΡΚΕΤΙΝΓΚ ( ιδάσκ. Καθηγητής: Α.Α. Οικονοµίδης) ΑΞΙΟΛΟΓΗΣΗ ΠΑΚΕΤΟΥ ΗΛΕΚΤΡΟΝΙΚΟΥ ΕΜΠΟΡΙΟΥ Product Scope 32 Bookmarks

Οι λειτουργίες του Μάρκετινγκ, η διανομή& οι μεσάζοντες

Περιβαλλοντική πληροφορική - Ευφυείς εφαρµογές

Οικονομία - Επιχειρήσεις Μάρκετινγκ 1

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

Κωδικοποίηση βίντεο (H.261 / DVI)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΤΕΡΕΑΣ ΕΛΛΑΔΑΣ- ΤΜΗΜΑ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΟΙΚΟΝΟΜΙΚΗΣ ΑΝΑΠΤΥΞΗΣ, ΜΑΘΗΜΑ: ΔΙΑΧΕΙΡΙΣΗ ΑΝΘΡΩΠΙΝΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΠΟΡΩΝ- ΧΡΙΣΤΟΣ ΑΠ.

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΧΑΡΤΟΓΡΑΦΗΣΗ ΦΥΣΙΚΩΝ ΠΟΡΩΝ

Εισαγωγή στην Επιστήµη των Η/Υ

Ανταγωνιστικότητα, Δίκτυα Διανομής και Εμπορία Βιολογικής Αιγοπροβατοτροφίας Δρ. Ηλίας Βλάχος Λέκτορας Διοίκηση Επιχειρήσεων

Μάθημα 3. Θεμέλια Επιχειρηματικής Ευφυΐας: Διαχείριση Βάσεων Δεδομένων και πληροφοριών

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ

Ανάπτυξη και δηµιουργία µοντέλων προσοµοίωσης ροής και µεταφοράς µάζας υπογείων υδάτων σε καρστικούς υδροφορείς µε χρήση θεωρίας νευρωνικών δικτύων

ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ

ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ «Επιχειρηματικό Σχέδιο ΙΙ»

Transcript:

Εξόρυξη εδοµένων & Γεωγραφικά Συστήµατα Πληροφοριών Νικόλαος Β. Καραδήµας Τι είναι? Ηεξόρυξηδεδοµένων (Data Mining) είναι η διαδικασία που χρησιµοποιεί ακατέργαστα στοιχεία για να συµπεράνει σηµαντικές επιχειρησιακές συσχετίσεις. Παρά µια οµοφωνία για την αξία της εξόρυξης δεδοµένων, πολλή σύγχυση υπάρχει για το τι είναι. Είναι µια συλλογή ισχυρών τεχνικών προοριζόµενων για ανάλυση µεγάλων συνόλων από δεδοµένα. εν υπάρχει µια προσέγγιση για την εξόρυξη δεδοµένων, αλλά µάλλον ένα σύνολο τεχνικών που µπορεί να χρησιµοποιηθεί σε συνδυασµό ηµία µε την άλλη. 2

Εξόρυξη εδοµένων Ηεξόρυξη δεδοµένων είναι το σύνολο δραστηριοτήτων που χρησιµοποιούνται για να βρεθούν νέα, κρυµµένα, ή απροσδόκητα πρότυπα µέσα σε δεδοµένα. Οι τεχνικές αυτές καλούνται «Ανακάλυψη Στοιχείων Γνώσης», και περιλαµβάνουν τη στατιστική ανάλυση, τα νευρωνικά δίκτυα, την ασαφή λογική, τους γενετικούς αλγόριθµους, τους ευφυείς πράκτορες ή την απεικόνιση των δεδοµένων. Οι τεχνικές αυτές όχι µόνο ανακαλύπτουν χρήσιµα πρότυπα µέσα στα δεδοµένα, αλλά µπορούν και να χρησιµοποιηθούν για να αναπτύξουν µοντέλα πρόβλεψης. 3 Εναλλακτικοί Ορισµοί Η αναζήτηση συσχετίσεων και γενικών πρωτοτύπων που υπάρχουν σε µεγάλες βάσεις δεδοµένων, αλλά είναι κρυµµένες µεταξύ του απέραντου ποσού δεδοµένων (Holsheimer και Kersyen 994) Ένα σύνολο τεχνικών που χρησιµοποιούνται σε µια αυτοµατοποιηµένη προσέγγιση, για να ερευνήσει εξαντλητικά και να φέρει στην επιφάνεια σύνθετες συσχετίσεις σε πολύ µεγάλα σύνολα δεδοµένων (Moxon 996) Η διαδικασία εύρεσης προηγούµενων αγνώστων και ενδεχοµένως ενδιαφερόντων πρωτοτύπων και συσχετίσεων σε µεγάλες βάσεις δεδοµένων (Fayyad και λοιποί. 996) 4 2

Οι Ρίζες της Εξόρυξης εδοµένων Έχει ρίζες που χρονολογούνται, πρακτικά, πάνω από 30 έτη. Στις αρχές της δεκαετίας του '60, η εξόρυξη δεδοµένων ονοµαζόταν στατιστική ανάλυση, και οι πρωτοπόροι ήταν στατιστικές επιχειρήσεις λογισµικού όπως η SAS και SPSS. Μέχρι τη δεκαετία του '80, οι παραδοσιακές τεχνικές ενισχύθηκαν µε νέες µεθόδους όπως η ασαφής λογική, οι γενετικοί αλγόριθµοι, τα ευριστικά συστήµατα και τα νευρωνικά δίκτυα. 5 Αύξηση της δηµοτικότητας της εξόρυξης δεδοµένων Ολοένα και περισσότερο δεχόµαστε δεδοµένα και χρειαζόµαστε εργαλεία για να τα κατανοήσουµε. Γνωρίζουµε επίσης ότι ο ανθρώπινος εγκέφαλος δυσκολεύεται να επεξεργαστεί πολυδιάστατα δεδοµένα. Από την άλλη µεριά, οι τεχνικές εκµάθησης µηχανών γίνονται πιο προσιτές και συγχρόνως πιο καθορισµένες. 6 3

Επιχειρησιακή Νοηµοσύνη (ΕΝ) Γενικός όρος για όλες τις διαδικασίες, τεχνικές, και τα εργαλεία που υποστηρίζουν τη λήψη επιχειρησιακής απόφασης βασισµένης στις τεχνολογίες πληροφοριών Οι προσεγγίσεις µπορούν να κυµανθούν από έναν απλό υπολογισµό σε ένα λογιστικό φύλλο (spreadsheet) ως ένα προηγµένο σύστηµα υποστήριξης απόφασης 7 Η εξόρυξη εδοµένων ως εξάρτηµα στην Επιχειρησιακή Νοηµοσύνη ΕΝ Εξόρυξη εδοµένων Στατιστικές εξερεύνησης στοιχείων Αναφορές Ερωτηµάτων Αποθήκες εδοµένων Λήψη Απόφασης Επιχειρηµατικοί Αναλυτές ιευθυντές Αρχιτέκτονας εδοµένων Βάσεις εδοµένων ιαχειριστής Βάσεων εδοµένων 8 4

Μία γενική προσέγγιση Αν και όλες οι προσπάθειες εξόρυξης δεδοµένων είναι µοναδικές, κατέχουν ένα κοινό σύνολο βηµάτων διαδικασίας: Προετοιµασία υποδοµής - επιλογή της πλατφόρµας υλικού, το σύστηµα της βάσεως δεδοµένων και ένα ή περισσότερα εργαλεία εξόρυξης Εξερεύνηση - εξετάζει τα συνοπτικά στοιχεία, επιλέγοντας και εφαρµόζοντας την διαίσθηση Ανάλυση κάθε πρότυπο, το οποίο έχει ανακαλυφθεί, αναλύεται για τη σπουδαιότητα του και τις τάσεις του. Ερµηνεία - Μόλις ανακαλυφθούν και αναλυθούν τα πρότυπα, το επόµενο βήµα είναι να ερµηνευθούν. Οι εκτιµήσεις περιλαµβάνουν επιχειρηµατικούς κύκλους, εποχικότητα και τον πληθυσµό, για τον οποίο ισχύει το πρότυπο. Εκµετάλλευση - Αυτό είναι µια επιχειρηµατική και µια τεχνική δραστηριότητα. Ένας τρόπος να εκµεταλλευτεί ένα πρότυπο είναι να χρησιµοποιηθεί για την πρόβλεψη. Άλλοι τρόποι είναι να συσκευάσουν, να τιµολογήσουν ή να διαφηµίσουν το προϊόν µε έναν διαφορετικό τρόπο. 9 Η Αποθήκη εδοµένων & η Εξόρυξη εδοµένων Ηεξόρυξη δεδοµένων δεν απαιτεί τη χρήση µιας αποθήκης δεδοµένων (Data Warehouse), αλλά είναι καλύτερα για τη εξόρυξη. Εάν οι πολλαπλάσιες αναλύσεις οργανώνονται στη σειρά, τα στοιχεία πρέπει να φυλαχτούν σταθερά (όπως σε µία DW). Σε µια λειτουργική βάση δεδοµένων, τα δεδοµένα αλλάζουν συχνά. Επίσης σηµαντικό είναι ότι τα δεδοµένα σε µία DW είναι ενσωµατωµένα και σταθερά. 0 5

Ακριβείς Προβλέψεις µε την Εξόρυξη εδοµένων Αν και η λογοτεχνία περιέχει δηλώσεις όπως "η εξόρυξη δεδοµένων θα µας επιτρέψει να προβλέψουµε ποιος θα αγοράσει ένα συγκεκριµένο προϊόν," αυτό είναι ενάντια στην ανθρώπινη φύση. Σε περιπτώσεις που η εξόρυξη δεδοµένων χρησιµοποιείται για να προβλέψει την απάντηση σε µια εκστρατεία µάρκετινγκ, µόνο το 5% περίπου των ανθρώπων που επιλέγονται ως "πιθανοί ανταποκρινόµενοι" πραγµατικά ανταποκρίνονται. Αν και η ακρίβεια της πρόβλεψης µιας µεµονωµένης συµπεριφοράς δεν είναι τόσο καλή, είναι καλύτερο από ότι φαίνεται, δεδοµένου ότι οι άµεσες προσπάθειες µάρκετινγκ έχουν συχνά "ποσοστά επιτυχίας" µόνο % περίπου χωρίς την εξόρυξη δεδοµένων. Τεχνικές για την Εξόρυξη εδοµένων Παραλληλίζοντας τη δηµοτικότητα της εξόρυξης δεδοµένων, εκρήγνυται επίσης και η ανάπτυξη των νέων τεχνικών. Πολλές καινοτοµίες είναι συγκεκριµένες ανά προµηθευτή, οι οποίες δίνουν µερικές φορές αυτό το λίγο, για να προωθήσουν το λεγόµενο «State of the Art». Οι τεχνικές εξόρυξης δεδοµένων τείνουν στις παρακάτω τέσσερις σηµαντικές κατηγορίες: Ταξινόµηση, Συσχέτιση, ιαδοχική τοποθέτηση, Οµαδοποίηση 2 6

Μέθοδος Ταξινόµησης Οστόχος είναι να ανακαλυφθούν κανόνες που καθορίζουν εάν ένα στοιχείο ανήκει σε ένα συγκεκριµένο υποσύνολο ή σε µία κλάση στοιχείων. Παραδείγµατος χάριν, εάν προσπαθούµε να καθορίσουµε ποιες οικογένειες θα ανταποκριθούν σε µια άµεση εκστρατεία µέσω ταχυδροµείου, θα θελήσουµε κανόνες, οι οποίοι ξεχωρίζουν τους «πιθανούς» από τους «µη πιθανούς». Αυτοί οι if-then κανόνες συχνά απεικονίζονται σε µια δοµή δέντρου. 3 Μέθοδος Συσχέτισης Αυτές οι τεχνικές ψάχνουν όλες τις συναλλαγές από ένα σύστηµα για πρότυπα του συµβάντος. Μια κοινή µέθοδος είναι η ανάλυση των καλαθιών της αγοράς, στην οποία εξετάζεται το σύνολο των προϊόντων που αγοράζονται από χιλιάδες καταναλωτές. Τα αποτελέσµατα έπειτα απεικονίζονται ως ποσοστά, για παράδειγµα: «το 30% των ανθρώπων που αγοράζουν µπριζόλες αγοράζουν επίσης και κάρβουνα». 4 7

Μέθοδος ιαδοχικής Τοποθέτησης Αυτές οι µέθοδοι εφαρµόζονται σε δεδοµένα χρονικής σειράς σε µία προσπάθεια να βρεθούν κρυµµένες τάσεις. Εάν βρεθούν, αυτά µπορούν να είναι χρήσιµοι προάγγελοι µελλοντικών γεγονότων. Για παράδειγµα, οι οµάδες πελατών που τείνουν να αγοράζουν προϊόντα σχετικά µε ταινίες κινηµατογράφου θα είναι στόχοι για µελλοντικές εκστρατείες προώθησης σχετικών προϊόντων στο χρονικό όριο που βγαίνει το συγκεκριµένο προϊόν στην αγορά. 5 Μέθοδος Οµαδοποίησης Οι τεχνικές οµαδοποίησης προσπαθούν να δηµιουργήσουν χωρίσµατα στα δεδοµένα σύµφωνα µε κάποια µετρική απόσταση. Οι συστοιχίες που διαµορφώνονται είναι δεδοµένα που απλά συγκεντρώνονται λόγω της οµοιότητά τους µε τους γείτονές τους. Με την εξέταση των χαρακτηριστικών κάθε συστοιχίας, είναι δυνατό να θεσπιστούν κανόνες για ταξινόµηση. 6 8

Τεχνολογίες Εξόρυξης εδοµένων Στατιστική οι ωριµότερες τεχνολογίες εξόρυξης δεδοµένων, αλλά δεν ισχύουν συχνά επειδή χρειάζονται καθαρά δεδοµένα. Επιπλέον, πολλές στατιστικές διαδικασίες υποθέτουν γραµµικές σχέσεις, το οποίο περιορίζει τη χρήση τους. Νευρωνικά ίκτυα, Γενετικοί Αλγόριθµοι, Ασαφή Λογική οι τεχνολογίες αυτές είναι σε θέση να λειτουργήσουν µε τα τυχόν περίπλοκα και ανακριβή δεδοµένα. Η ευρεία δυνατότητα της εφαρµογής τους, τις έχει καταστήσει δηµοφιλείς στον τοµέα αυτό. έντρα απόφασης αυτές οι τεχνολογίες είναι εννοιολογικά απλές και έχουν κερδίσει στο τοµέα της δηµοτικότητας. Λόγωτουτρόπουπου χρησιµοποιούνται, ίσως είναι καλύτερα να καλούνται δέντρα "ταξινόµησης". 7 Νέες Εφαρµογές Εξόρυξης εδοµένων εδοµένου ότι η τεχνολογία ωριµάζει, νέες εφαρµογές προκύπτουν, ειδικά σε δύο νέες κατηγορίες, εξόρυξη κειµένων και εξόρυξη στο Web. Παραδείγµατα εξόρυξης κειµένων είναι: Εύρεση της κεντρικής ιδέας σ ένα κείµενο Ακριβής περίληψης ενός κειµένου Εξήγηση της δοµής του κειµένου Συστοιχία/Οµαδοποίηση κειµένων 8 9

Εξόρυξη σε Ιστοχώρο Ηεξόρυξη στο Web είναι µια ειδική περίπτωση της εξόρυξης κειµένων όπου η εξόρυξη εµφανίζεται σ ένα WebSite. Ενισχύει τον ιστοχώρο µε ευφυή συµπεριφορά, όπως η υποβολή σχετικών συνδέσεων ή η υπόδειξη νέων προϊόντων. Μπορεί να µάθει τα ενδιαφέροντα των επισκεπτών και να τροποποιήσει τα προφίλ των χρηστών του σε πραγµατικό χρόνο. Επιτρέπει επίσης να ταιριάξει διάφορες πηγές σύµφωνα µε τα ενδιαφέροντα του επισκέπτη. 9 Market Basket Ανάλυση Αυτός είναι ο πιο ευρύ χρησιµοποιηµένος και, από πολλές απόψεις, επιτυχέστερος αλγόριθµος εξόρυξης δεδοµένων. Ουσιαστικά καθορίζει ποια προϊόντα αγοράζουν σε συνδυασµό οι άνθρωποι. Τα καταστήµατα µπορούν να χρησιµοποιήσουν αυτή την πληροφορία για να τοποθετήσουν τα προϊόντα αυτά στην ίδια περιοχή. Οι άµεσοι έµποροι µπορούν να χρησιµοποιήσουν αυτή την πληροφορία για να αποφασίσουν ποια νέα προϊόντα να προσφέρουν στους τρέχοντες πελάτες τους. Οι πολιτικές απογραφής µπορούν να βελτιωθούν εάν τα σηµεία για την νέα παραγγελία αντικατοπτρίζουν τη ζήτηση για τα συµπληρωµατικά προϊόντα. 20 0

Κανόνες Συσχέτισης για την Market Basket Ανάλυση Οι κανόνες γράφονται στη µορφή: «η αριστερή πλευρά συνεπάγεται τη δεξιά πλευρά» Παράδειγµα: Οι Κίτρινες Πιπεριές ΣΥΝΕΠΑΓΟΝΤΑΙ Κόκκινες Πιπεριές, Μπανάνες, Αρτοποιείο Για να είναι αποτελεσµατική η χρήση ενός κανόνα, τρία αριθµητικά µέτρα πρέπει να εξεταστούν για εκείνο τον κανόνα: Υποστήριξη, Εµπιστοσύνη και Ενθάρρυνση 2 Κριτήρια της υνατότητας Πρόβλεψης Υποστήριξη - αναφέρεται στο ποσοστό των καλαθιών όπου ο κανόνας ήταν αληθινός (τα αριστερά και τα δεξιά προϊόντα ήταν παρόντα). Εµπιστοσύνη -µετρά ποιο ποσοστό των καλαθιών που περιείχε το αριστερό προϊόν περιείχε επίσης και το δεξί. Ενθάρρυνση -µετρά πόσο συχνότερα το αριστερό στοιχείο βρίσκεται µε το δεξί στοιχείο απ' ότι χωρίς αυτό. 22

Μεθοδολογία της Market Basket Ανάλυσης Χρειαζόµαστε αρχικά έναν κατάλογο συναλλαγών µε το τι αγοράστηκε. Αυτό είναι αρκετά εύκολο να ληφθεί αυτές τις µέρες µέσω των αποδείξεων στα ταµεία. Έπειτα, επιλέγουµε έναν κατάλογο προϊόντων που θα αναλυθεί, και συνοψίζοντας σε µορφή πίνακα, εµφανίζονται πόσες φορές κάθε ένα προϊόν αγοράστηκε µε κάποιο άλλο. Οι διαγώνιοι του πίνακα παρουσιάζουν πόσο συχνά ένα προϊόν αγοράζεται σε οποιοδήποτε συνδυασµό, και στα υπόλοιπα κελιά παρουσιάζονται ποιοι συνδυασµοί αγοράστηκαν. 23 Παράδειγµα Καταγράφηκαν έξι συναλλαγές σε ένα ψιλικατζίδικο: Συναλλαγή : Πίτσα, Κόλα, Γάλα Συναλλαγή 2: Γάλα, Πατατάκια, ηµητριακά Συναλλαγή 3: Κόλα, Πίτσα Συναλλαγή 4: Γάλα, ηµητριακά Συναλλαγή 5: Κόλα, ηµητριακά, Γάλα Συναλλαγή 6: Κόλα, Πατατάκια Αυτές οι συναλλαγές πρέπει να απεικονιστούν διαγώνια, ταξινοµηµένες σε έναν πίνακα. 24 2

Αγορασµένο Προϊόν Πίτσα Γάλα Κόλα Πατατάκια ηµητριακά Πίτσα και 2 2 0 Παράδειγµα Γάλα και 4 2 3 Κόλα και 2 2 4 2 Πατατάκια και 2 3 ηµητριακά και Το γάλα και τα δηµητριακά πωλούνται µαζί συχνότερα από οποιοδήποτε άλλο συνδυασµό Αποτελεί µία ευκαιρία για µάρκετινγκ; Το γάλα και η Κόλα πουλάει καλά µε όλα τα προϊόντα - οι άνθρωποι πιθανώς έρχονται στο µαγαζί για να αγοράσουν το συγκεκριµένο προϊόν. 0 3 3 25 Χρήση Αποτελεσµάτων Οι ταξινοµήσεις σε πίνακα µπορούν αµέσως να µεταφραστούν σε κανόνες συσχέτισης και οι αριθµητικοί παράγοντες µπορούν να υπολογιστούν. Η σύγκριση του πίνακα αυτής της εβδοµάδας µε τον πίνακα της προηγούµενης εβδοµάδας, µπορεί αµέσως να παρουσιάσει την επίδραση των προωθητικών δραστηριοτήτων αυτής της εβδοµάδας. Μερικοί κανόνες µπορεί να είναι τετριµµένοι (τα σουβλάκια και οι πίτες πωλούνται µαζί) ή και κάποιοι άλλοι να είναι ανεξήγητοι. 26 3

Περιορισµοί της Market Basket Ανάλυσης Ένας µεγάλος αριθµός πραγµατικών συναλλαγών απαιτείται για να γίνει µια αποτελεσµατική ανάλυση στα καλάθια αγορών, αλλά η ακρίβεια των δεδοµένων συµβιβάζεται εάν όλα τα προϊόντα δεν εµφανίζονται µε παρόµοια συχνότητα. Η ανάλυση µπορεί µερικές φορές να συλλάβει τα αποτελέσµατα που οφείλονται στην επιτυχία προηγούµενων εκστρατειών µάρκετινγκ (και όχι στη φυσική τάση των πελατών). 27 Ταξινόµηση Ηπαρουσία των στοιχείων που δεν αγοράζονται πολύ συχνά είναι ένα εµπόδιο για µια καλή ανάλυση στα καλάθια αγορών. Ένας τρόπος για να εξεταστεί αυτό είναι να ελαχιστοποιηθούν τα προϊόντα που εµφανίζονται µε µια συχνότητα λιγότερη από κάποιο κατώτατο όριο. Μια καλύτερη ιδέα θα ήταν να προσπαθήσει να διαµορφώσει τις οµάδες των προϊόντων που βρίσκονται κάτω από ένα κατώτατο όριο. Παράδειγµα: Όλες οι γεύσεις του ζελέ µπορεί να εµφανίζονται 9% όλες µαζί, αλλά λιγότερο από 3% η κάθε µία χωριστά. 28 4

Πολυδιαστατική Market Basket Ανάλυση Οι κανόνες µπορούν να περιλαµβάνουν περισσότερα από δύο στοιχεία, για παράδειγµα: «Φυτό και Γλάστρα συνεπάγεται Χώµα» Οι κανόνες αυτοί χτίζονται επαναληπτικά. Αρχικά, βρίσκονται τα ζευγάρια, και κατόπιν, σχετικά σύνολα τριών ή τεσσάρων. Αυτοί ελαχιστοποιούνται µε την αφαίρεση εκείνων που εµφανίζονται σπάνια. Σε ένα περιβάλλον όπως ένα µπακάλικο, όπου οι πελάτες αγοράζουν συνήθως πάνω από 00 στοιχεία, οι κανόνες θα µπορούσαν να περιλάβουν τουλάχιστον 0 στοιχεία. 29 Περιορισµοί και Προκλήσεις για την Εξόρυξη εδοµένων Παρά την ενδεχόµενη δύναµη και την αξία, η εξόρυξη δεδοµένων είναι ακόµα ένας νέος τοµέας. Μερικά πράγµατα που έχουν περιορίσει την πρόοδο είναι: Προσδιορισµός χαµένων πληροφοριών εν αποθηκεύεται όλη η γνώση µέσα στη βάση δεδοµένων Θόρυβος στα στοιχεία και ελλιπές τιµές Μελλοντικά συστήµατα χρειάζονται καλύτερους τρόπους για να αντιµετωπίσουν αυτά Μεγάλες βάσεις δεδοµένων και υψηλή διαστατικότητα Μελλοντικές εφαρµογές χρειάζονται τρόπους να χωρίσουν τα δεδοµένα σε πιο εύχρηστα κοµµάτια 30 5

Γεωγραφικό Σύστηµα Πληροφοριών (ΓΣΠ) «Αντιπροσωπεύουν ένα ισχυρό σύνολο εργαλείων για τη συλλογή, αποθήκευση, ανάληψη ανά πάσα στιγµή, µετασχηµατισµό και απεικόνιση χωρικών στοιχείων του πραγµατικού κόσµου» (Burrough 983) 3 Ιδιότητες ενός ΓΣΠ Ένα ΓΣΠ, έχει τις εξής ιδιότητες (Κουτσόπουλος, 2002): Αποθηκεύει, διαχειρίζεται και ενσωµατώνει µεγάλο όγκο χωρικών στοιχείων, Αποτελεί κατάλληλο εργαλείο χωρικής ανάλυσης, εστιαζόµενο ειδικά στη χωρική διάσταση των δεδοµένων, Αποτελεί ένα αποτελεσµατικό µηχανισµό για την επίλυση χωρικών προβληµάτων µέσα από την οργάνωση, διαχείριση και µετασχηµατισµό µεγάλου όγκου στοιχείων µε τέτοιο τρόπο που η πληροφορία να είναι προσιτή σε όλους. 32 6

Βασικές Έννοιες Τα διάφορα γεωγραφικά αντικείµενα σ ένα ΓΣΠ µπορούν να αναπαρασταθούν µε ένα ατελείωτο αριθµό σχηµάτων. Στην πραγµατικότητα όµως αναπαριστώνται σε µία από τις παρακάτω τρεις γεωµετρικές µορφές: Πολύγωνο, Γραµµή, Σηµείο 33 Βασικές Έννοιες Πολύγωνα αναπαριστώνται όλες οι οντότητες που έχουν όρια, όπως οι νοµοί της Ελλάδας, λίµνες, οικοδοµικά τετράγωνα, οικόπεδα, γεωλογικοί σχηµατισµοί κλπ. Γραµµές αναπαριστώνται οντότητες πιο λεπτές από πολύγωνα όπως ποτάµια, δρόµοι, κοινωφελή δίκτυα, ρήγµατα κλπ. Σηµεία αναπαριστώνται οντότητες που είναι πολύ µικρές να αναπαρασταθούν σαν πολύγωνα όπως πόλεις, υψοµετρικά σηµεία, θέσεις δειγµατοληψίας, θέσεις πυροσβεστικών κρουνών, θέσεις εστιών ρύπανσης, κλπ 34 7

ιανυσµατικά εδοµένα & Επιφάνειες Όλα τα χαρακτηριστικά που αναπαριστώνται σαν σηµεία, γραµµές ή πολύγωνα καλούνται διανυσµατικά δεδοµένα (vector data). Φαινόµενα που µεταβάλλονται συνεχώς στον χώρο όπως θερµοκρασία, βροχόπτωση, κλίσεις, υψόµετρα δεν έχουν κάποιο σχήµα όπωςοιδρόµοι και τα ποτάµια, αλλά έχουν µετρήσιµες τιµές για κάθε τοποθεσία στην επιφάνεια της γης. Τέτοια γεωγραφικά φαινόµενα είναι πιο εύκολο να αναπαρασταθούν σαν επιφάνειες (raster) παρά σαν χαρακτηριστικά (features). Η επιφάνεια είναι ένας πίνακας (raster) από τετραγωνικά κελιά ίσου µεγέθους, µε κάθεκελίνα αναπαριστά µία µονάδα επιφανείας, για παράδειγµα τετραγωνικό µέτρο. 35 Αλγόριθµοι Αλγόριθµοι υπάρχουν πολλοί και ποικίλοι σε ένα ΓΣΠ, µπορούν να κατηγοριοποιηθούν όµως σε έξι βασικές οµάδες (Burrough and McDonnell, 998): Λογισµικό Εισαγωγής και Επαλήθευσης Στοιχείων, Λογισµικό Αποθήκευσης και ιαχείρισης Στοιχείων, Λογισµικό Μετασχηµατισµού Στοιχείων, Λογισµικό Παρουσίασης, Λογισµικό Αναζητήσεων, Λογισµικό Ανάλυσης Χώρου 36 8

Εφαρµογές Ενδεικτικά αναφέρονται µερικά επιστηµονικά πεδία στα οποία τα Γεωγραφικά Συστήµατα Πληροφοριών µπορούν να συµβάλλουν ως ολοκληρωµένα εργαλεία χωρικής ανάλυσης και σχεδιασµού: Περιφερειακός Προγ/σµός-Σχεδιασµός, Αστικός Προγραµµατισµός-Σχεδιασµός, Συγκοινωνίες-Μεταφορές, Τεχνική υποδοµή, Περιβάλλον, Φορολογία, Εκπαίδευση και Υγεία-Πρόνοια, Πυροσβεστική, ασική Υπηρεσία, Αστυνοµία, Ανάλυση Αγοράς, Αγορά Εργασίας, ίκτυα διανοµών, πωλήσεων και χωροθετήσεις κατανοµών 37 Ευχαριστώ! 38 9