Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου.

Σχετικά έγγραφα
Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Τεχνικές Εξόρυξης Δεδομένων

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

Το αντικείμενο της διπλωματικής εργασίας

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Πληροφοριακά Συστήματα Διοίκησης

Ανακάλυψη Γνώσης από εδοµένα και Εξόρυξη Γνώσης στο εργαλείο WEKA

ΜΕΛΕΤΗ ΤΩΝ ΜΕΘΟΔΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΨΗΦΟΦΟΡΙΑΣ ΚΑΙ ΔΥΝΑΤΟΤΗΤΑ ΕΦΑΡΜΟΓΗΣ ΤΟΥΣ ΣΕ ΜΑΖΙΚΕΣ ΕΚΛΟΓΕΣ ΣΤΗΝ ΕΛΛΑΔΑ

Διπλωματική Εργασία. Ανάλυση Μεγάλων Δεδομένων - Μελέτη Περίπτωσης στη Διαδικτυακή Εφαρμογή "Help Me Vote"

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Κρήτη Εθνικές Εκλογές 25 Ιανουαρίου 2015

Πληροφοριακά Συστήματα Διοίκησης

Big Data/Business Intelligence

Έρευνα της Pulse RC για "Το Ποντίκι" (23 Ιανουαρίου 2014)

Κρήτη. Αντιλήψεις και τάσεις των Κρητικών μετά τις πρόσφατες Ευρωεκλογές

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΠΑΝΕΛΛΑΔΙΚΗ ΠΟΛΙΤΙΚΗ ΕΡΕΥΝΑ ΓΙΑ ΤΟ TVXS.GR

ΣΥΓΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΣΥΜΠΕΡΙΦΟΡΑΣ ΝΕΩΝ ΟΔΗΓΩΝ ΣΕ ΣΥΝΘΗΚΕΣ ΚΑΝΟΝΙΚΕΣ ΚΑΙ ΠΡΟΣΟΜΟΙΩΣΗΣ ΣΕ ΑΣΤΙΚΗ ΟΔΟ. Δανάη Βουτσινά

ΠΑΝΕΛΛΑΔΙΚΗ ΠΟΛΙΤΙΚΗ ΕΡΕΥΝΑ ΓΙΑ ΤΟ TVXS.GR

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας

Eκτίμηση πολιτικών τάσεων Σεπτεμβρίου 2015

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services

Ανάλυση της επιρροής των αυτόνομων οχημάτων στη συμπεριφορά μετακίνησης

Η ΑΚΤΙΝΟΓΡΑΦΙΑ ΤΟΥ ΕΚΛΟΓΙΚΟΥ ΣΩΜΑΤΟΣ ΤΗΣ ΘΕΣΣΑΛΟΝΙΚΗΣ, ΜΠΡΟΣΤΑ ΣΤΙΣ ΕΚΛΟΓΕΣ ΤΗΣ 26ΗΣ ΜΑΙΟΥ

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business.

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Η στάση των Ελλήνων οδηγών απέναντι στην επιθετική οδήγηση ΣΤΕΦΑΤΟΥ ΑΓΓΕΛΙΚΗ Επιβλέπων: Γεώργιος Γιαννής, Καθηγητής EMΠ

ΕΚΛΟΓΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ. (ΣΥΛΛΟΓΗ ΣΤΟΙΧΕΙΩΝ: Ιουνίου 2017)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΠΛΑΤΦΟΡΜΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΜΑΘΗΣΗΣ ΕΝΗΛΙΚΩΝ

Ταυτότητα της έρευνας

Διδάκτορας Οικονομικού Πανεπιστημίου Αθηνών

ΕΡΕΥΝΑ ΠΑΝΕΛΛΑΔΙΚΗ. 17 και Ιανουαρίου 2014

ΠΑΝΕΛΛΑΔΙΚΗ ΕΡΕΥΝΑ. Κεντρικό Δελτίο Ειδήσεων - MEGA TV 18 ΣΕΠΤΕΜΒΡΙΟΥ 2015

ΠΑΝΕΛΛΑΔΙΚΗ ΔΗΜΟΣΚΟΠΗΣΗ

Έρευνα αποτύπωσης των απόψεων των πολιτών για προτεινόμενες αλλαγές και μεταρρυθμίσεις Ιανουαρίου 2017

Εξόρυξη Γνώσης από Δεδομένα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΕΡΕΥΝΑ ΔΗΜΟΤΙΚΩΝ ΕΚΛΟΓΩΝ

ΕΜΠΙΣΤΕΥΤΙΚΟ - ΟΧΙ ΓΙΑ ΔΗΜΟΣΙΟΠΟΙΗΣΗ

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

ΝΟΟΖ.GR Political Map. Lesvosnews.net

Αξιοποίηση αλγόριθμων εξόρυξης πληροφορίας στην ανάλυση κοινωνιοψυχολογικών ερευνητικών δεδομένων

Η ΕΝΕΡΓΟΣ ΣΥΜΜΕΤΟΧΗ ΤΩΝ ΝΕΩΝ ΣΤΑ ΚΟΙΝΑ ΚΑΙ ΣΤΗ ΔΗΜΟΚΡΑΤΙΚΗ ΖΩΗ ΤΟΥ ΤΟΠΟΥ ΝΟΕΜΒΡΙΟΣ 2016

Ερωτηματολόγιο. Τρόποι χορήγησης: α) Με αλληλογραφία β) Με απευθείας χορήγηση γ) Τηλεφωνικά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Mobile Marketing: Οι Παράγοντες Αποδοχής του SMS των Ελλήνων Καταναλωτών

Έρευνα Πολιτικής Συγκυρίας. Ιανουάριος 2015

ΔΗΜΟΣ GREEK ΘΕΣΣΑΛΟΝΙΚΗΣ

ΠΑΝΕΛΛΑΔΙΚΗ ΕΡΕΥΝΑ ΣΕΠΤΕΜΒΡΙΟΣ 2016

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Η επιστήμη της αστυνομίας σε ψηφιακά περιβάλλοντα. Η περίπτωση του SMF/QlikView

ΣΥΓΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΣΥΜΠΕΡΙΦΟΡΑΣ ΝΕΩΝ ΟΔΗΓΩΝ ΣΕ ΣΥΝΘΗΚΕΣ ΚΑΝΟΝΙΚΕΣ ΚΑΙ ΠΡΟΣΟΜΟΙΩΣΗΣ ΣΕ ΥΠΕΡΑΣΤΙΚΗ ΟΔΟ ΝΙΚΑΣ ΜΑΡΙΟΣ

«Καθοριστικοί παράγοντες της αποτελεσματικότητας της από στόμα-σε-στόμα επικοινωνίας στις ιστοσελίδες κοινωνικής δικτύωσης»

Εισαγωγή στα Πληροφοριακά Συστήματα

Δείγμα & Δειγματοληψία στην Έρευνα ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (#252) Θυμηθείτε. Γιατί δειγματοληψία; Δειγματοληψία

ΤΟ ΒΗΜΑ ΤΗΣ ΚΥΡΙΑΚΗΣ άτομα στις 13 περιφέρειες της χώρας Οκτωβρίου 2014

Έρευνα ανίχνευσης πολιτικών στάσεων και προτιμήσεων για πρόσωπα στην εκλογική περιφέρεια Α Θεσσαλονίκης 5-7 Σεπτεμβρίου 2018

Έρευνα Μάρκετινγκ Ενότητα 5

Ι. Preprocessing (Επεξεργασία train.arff):

για λογαριασμό του pelop.gr

σφυγμός Έρευνα ανίχνευσης πολιτικών στάσεων και εκτίμησης δυνητικής εκλογικής επιρροής Ιουνίου 2017 Παλαιολόγου Μπενιζέλου 7 Αθήνα 10556

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Θέματα επικαιρότητας

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

Έρευνα επισκόπησης (Survey research) «H διάσταση του φύλου στην Ευρωπαϊκή Κοινωνική Έρευνα (European Social Survey)»

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία

Εξόρυξη Γνώσης - το εργαλείο WEKA

Η ΧΡΗΣΗ ΤΩΝ ΨΥΧΟΜΕΤΡΙΚΩΝ ΕΡΓΑΛΕΙΩΝ ΣΤΟΝ ΕΠΑΓΓΕΛΜΑΤΙΚΟ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟ

Στόχος αυτής της δημόσιας παρέμβασης είναι να αποτυπωθούν όλες οι αλήθειες. ΨΕΜΑ

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ ME TH ΧΡΗΣΗ ΚΑΝΟΝΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΣΕ ΕΠΙΧΕΙΡΗΣΕΙΣ ΛΙΑΝΙΚΗΣ ΠΩΛΗΣΗΣ

Προσανατολισμός των Millennials απέναντι στην καριέρα σε περίοδο οικονομικής κρίσης

Στόχος της ψυχολογικής έρευνας:

Εφαρμογή Τεχνολογιών Ανοιχτού Λογισμικού στην Ηλεκτρονική Συμμετοχή

ΕΡΕΥΝΑ ΠΑΝΕΛΛΑΔΙΚΗ Μαΐου 2012

ΤΟ ΒΗΜΑ ΤΗΣ ΚΥΡΙΑΚΗΣ

Πανελλαδική πολιτική Πανελλαδική έρευνα γνώμης Έρευνα 9-12/3 Μάρτιος 2009 Μάρτιος

Έρευνα Πολιτικής Συγκυρίας. Μάιος 2014

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΟΙΚΟΝΟΜΙΑΣ, ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑΣ ΚΑΙ ΝΑΥΤΙΛΙΑΣ

Πανελλαδική Έρευνα Εκλογικής Συμπεριφοράς, Ευρωεκλογές 2009

Οι στάσεις των Ελλήνων απέναντι στις πρόωρες εκλογές

ΣΥΣΧΕΤΙΣΗ ΟΔΗΓΙΚΗΣ ΣΥΜΠΕΡΙΦΟΡΑΣ ΚΑΙ ΚΑΤΑΝΑΛΩΣΗΣ ΚΑΥΣΙΜΩΝ ΜΕ ΔΕΔΟΜΕΝΑ ΑΠΟ ΕΞΥΠΝΑ ΚΙΝΗΤΑ ΤΗΛΕΦΩΝΑ

Εθνικός Κήρυκας 4 ΣΕΠΤΕΜΒΡΙΟΥ 2015 ΠΑΝΕΛΛΑΔΙΚΗ ΕΡΕΥΝΑ

Ανάκτηση Πληροφορίας

ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΠΡΟΤΙΜΗΣΕΩΝ ΤΩΝ ΟΔΗΓΩΝ ΑΠΕΝΑΝΤΙ ΣΕ ΝΕΑ ΚΑΙΝΟΤΟΜΑ ΣΧΗΜΑΤΑ ΑΣΦΑΛΙΣΗΣ ΤΟΥ ΟΧΗΜΑΤΟΣ

Αποτελέσματα έρευνας πολιτικών απόψεων. Σεπτέμβριος 2017

ΕΡΕΥΝΑ ΠΑΝΕΛΛΑΔΙΚΗ ενήλικοι με δικαίωμα ψήφου 30 Ιανουαρίου 1 Φεβρουαρίου 2012

ΣΚΑΪ/ΚΑΘΗΜΕΡΙΝΗ. Κυλιόμενο Προεκλογικό Βαρόμετρο. 3 ο Κύμα. Πανελλαδική τηλεφωνική έρευνα, άτομα, 18-20/05/2009

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

Transcript:

Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου. Big data analysis using data mining techniques. The case of a voting decision support application. Επιβλέπων: Ιωάννης Μανωλόπουλος Εξεταστές: Αγγελής Ελευθέριος, Μαργαρίτης Κωνσταντίνος Μάρτιος 2018

Δομή παρουσίασης Big data Data mining Data mining σε big data Η εφαρμογή helpmevote.gr Το εργαλείο Weka Εφαρμογή αλγορίθμων επιβλεπόμενης μηχανικής μάθησης στο dataset Οπτικοποίηση αποτελεσμάτων Συμπεράσματα 2

The 3 Vs or maybe more of big data Volume (μεγάλος όγκος) Variety (ποικιλία) Velocity (ταχύτητα) Veracity (εγκυρότητα) Value (αξία) Variability (μεταβλητότητα) / Valence (σθένος) 3

Big Data Τύποι δεδομένων Δομημένα Αδόμητα Map Reduce (Google) Hadoop (Apache) 4

Data mining Καθάρισμα Μετατροπή Ενοποίηση Κατηγοριοποίηση Αναγνώριση υποδειγμάτων Οπτική αναπαράσταση ευρημάτων Εξαγωγή γνώσης 5

Data mining εργαλεία και επιστήμες Association rules mining (εξόρυξη κανόνων συσχέτισης) Classification (κατηγοριοποίηση) Cluster analysis (ανάλυση συστάδων) Outliers analysis (ανάλυση ακροτάτων) Data visualization (οπτικοποίηση δεδομένων) Επιστήμες που συνεργάζονται Στατιστική Μηχανική μάθηση (machine learning) Supervised, Unsupervised, Semi-supervised and Reinforcement machine learning 6

Εφαρμογή της εξόρυξης δεδομένων Επιχειρηματική ευφυΐα (Business Intelligence) Χρήση ιστορικών δεδομένων Προβλέψεις επιχειρηματικού ενδιαφέροντος (π.χ. ανάλυση αγορών, καταναλωτική συμπεριφορά) Μηχανές αναζήτησης Χρήση μεγάλων αποθετηρίων δεδομένων Εύρεση επιθυμητών απαντήσεων Προβληματισμοί Αυξημένη πολυπλοκότητα στα δεδομένα Αβεβαιότητα, θόρυβος και ελλιπή δεδομένα Εμπιστευτικότητα και ασφάλεια προσωπικών δεδομένων 7

Big Data Analytics Κατανόηση των δεδομένων Καθαρισμός Μορφοποίηση Επιλογή κατάλληλης τεχνολογίας και εξέταση περιορισμών Επιλογή κατάλληλων τεχνικών και αλγορίθμων 8

helpmevote.gr Ηλεκτρονικός Σύμβουλος Ψήφου από επιστήμονες Πολιτικών Επιστημών Συστατικά μέρη 31 ερωτήσεις σχετικά με τις θέσεις των κομμάτων 9 ερωτήσεις δημογραφικού χαρακτήρα Εκλογική προτίμηση στις 2 προηγούμενες εκλογές (Ανδρεάδης Ι., Χατζηπαντελής Θ) Κατάταξη σε δύο άξονες Οριζόντιος: Φιλελευθερισμός Αυταρχισμός Κάθετος: Ευρωπαϊσμός Αντιευρωπαϊσμός 9

Dataset value Εκλογές Σεπτεμβρίου 2015: 6.330.786 ψηφοφόροι Dataset: 543.870 εγγραφές Θεωρείται αξιόπιστο Κανονική κατανομή Πληθυσμός 10 εκατομμυρίων Ποσοστό λάθους 1% Βεβαιότητα 99% Απαιτείται δείγμα 16.560 (Matwin S, Mielniczuk J, 2016) 10

Μορφή ερωτήσεων εφαρμογής Θέσεις των κομμάτων όπως έχουν καταγραφεί σε επίσημες δηλώσεις τους. 5-βάθμια κλίμακα Likert 1 επιλογή για μη απάντηση 11

Κατάταξη ψηφοφόρων Ερωτήσεις: σαφείς, αντικειμενικές, αμερόληπτες Υπολογισμός σκορ Ισχυρή ίδια θέση +1 βαθμός Ισχυρή διαφορετική θέση -1 βαθμός Μη ισχυρή διαφορετική θέση -0,5 βαθμός Σχετικά παρόμοια θέση +0,375 βαθμός Παρονομαστής κλάσματος ο αριθμός των απαντημένων ερωτήσεων Συντελεστής ομοιότητας / ανομοιότητας μεταξύ -1 και +1 12

Weka Waikato Environment for Knowledge Analysis Λογισμικό μηχανικής μάθησης Αναπτύχθηκε: Waikato University, Νέα Ζηλανδία Ελεύθερο & ανοιχτό λογισμικό (GNU General Public License) Χρήσεις Επεξεργασία δεδομένων Ομαδοποίηση Ταξινόμηση Παλινδρόμηση Απεικόνιση δεδομένων 13

Weka interface Explorer Experimenter Knowledge Flow Simple command line interface Εισαγωγή δεδομένων ARFF & CSV 14

Λειτουργίες του Explorer Προ-επεξεργασία (preprocessing) Κατηγοριοποίηση (classification) π.χ. Bayesian networks, Support vector machines, Decision trees, κλπ. Ανάλυση συστάδων (clustering) Κανόνες συσχέτισης (association rules) π.χ. Apriori, κλπ. Επιλογή χαρακτηριστικών (select attributes) Οπτικοποίηση (visualization) 15

Δημιουργία μοντέλου κατηγοριοποίησης με χρήση αλγορίθμων επιβλεπόμενης μηχανικής μάθησης με χρήση του Weka 16

Κανόνες συσχέτισης 1 Apriori Min Support 0,3 Confidence 90% Δεν βρέθηκαν κανόνες Apriori Support 0,2 Confidence 50% Βρέθηκαν 34 κανόνες 17

Κανόνες συσχέτισης 2 1. q30=strongly agree 187651 ==> q81=strongly agree 133049 <conf:(0.71)> lift:(1.7) lev:(0.1) [54893] conv:(2.01) 2. interest=quite 193882 ==> sex=male 126316 <conf:(0.65)> lift:(1.18) lev:(0.04) [19293] conv:(1.29) 3. q83=strongly agree 212968 ==> q81=strongly agree 135774 <conf:(0.64)> lift:(1.53) lev:(0.09) [47074] conv:(1.61) 4. ep=rest of Greece 231141 ==> sex=male 146159 <conf:(0.63)> lift:(1.15) lev:(0.03) [18569] conv:(1.22) 5. q87=strongly agree 215150 ==> q19=strongly agree 133382 <conf:(0.62)> lift:(1.54) lev:(0.09) [46787] conv:(1.57) 6. edu=tertiary 224811 ==> sex=male 138259 <conf:(0.62)> lift:(1.11) lev:(0.03) [14163] conv:(1.16) 7. q19=strongly agree 218898 ==> q87=strongly agree 133382 <conf:(0.61)> lift:(1.54) lev:(0.09) [46787] conv:(1.55) 8. q30=strongly agree 187651 ==> q83=strongly agree 113069 <conf:(0.6)> lift:(1.54) lev:(0.07) [39588] conv:(1.53) 9. q81=strongly agree 226518 ==> q83=strongly agree 135774 <conf:(0.6)> lift:(1.53) lev:(0.09) [47074] conv:(1.52) 10. q81=strongly agree 226518 ==> q30=strongly agree 133049 <conf:(0.59)> lift:(1.7) lev:(0.1) [54893] conv:(1.59) 11. q20=strongly agree 190378 ==> sex=male 111206 <conf:(0.58)> lift:(1.06) lev:(0.01) [6117] conv:(1.08) 12. q81=agree 211775 ==> q83=agree 121475 <conf:(0.57)> lift:(1.29) lev:(0.05) [27128] conv:(1.3) 13. q19=strongly agree 218898 ==> sex=male 124682 <conf:(0.57)> lift:(1.03) lev:(0.01) [3850] conv:(1.04) 14. q87=agree 216845 ==> sex=male 123005 <conf:(0.57)> lift:(1.03) lev:(0.01) [3306] conv:(1.04) 15. q83=strongly agree 212968 ==> sex=male 117966 <conf:(0.55)> lift:(1) lev:(0) [407] conv:(1) 16. q83=agree 242296 ==> sex=male 133996 <conf:(0.55)> lift:(1) lev:(0) [248] conv:(1) 17. q82=agree 204081 ==> sex=male 111420 <conf:(0.55)> lift:(0.99) lev:(-0) [-1232] conv:(0.99) 18. q81=strongly agree 226518 ==> sex=male 123544 <conf:(0.55)> lift:(0.99) lev:(-0) [-1493] conv:(0.99) 19. q8=agree 230707 ==> sex=male 125227 <conf:(0.54)> lift:(0.98) lev:(-0) [-2123] conv:(0.98) 20. q15=agree 225732 ==> sex=male 122314 <conf:(0.54)> lift:(0.98) lev:(-0) [-2289] conv:(0.98) 21. q87=agree 216845 ==> q83=agree 117186 <conf:(0.54)> lift:(1.21) lev:(0.04) [20580] conv:(1.21) 22. q29=agree 208844 ==> sex=male 112222 <conf:(0.54)> lift:(0.97) lev:(-0.01) [-3059] conv:(0.97) 23. q81=agree 211775 ==> sex=male 113470 <conf:(0.54)> lift:(0.97) lev:(-0.01) [-3429] conv:(0.97) 24. q83=strongly agree 212968 ==> q30=strongly agree 113069 <conf:(0.53)> lift:(1.54) lev:(0.07) [39588] conv:(1.4) 25. q8=agree 230707 ==> q83=agree 121642 <conf:(0.53)> lift:(1.18) lev:(0.03) [18861] conv:(1.17) 26. q19=strongly agree 218898 ==> q81=strongly agree 114559 <conf:(0.52)> lift:(1.26) lev:(0.04) [23389] conv:(1.22) 27. q29=agree 208844 ==> q15=agree 109211 <conf:(0.52)> lift:(1.26) lev:(0.04) [22530] conv:(1.23) 28. q15=agree 225732 ==> q83=agree 117020 <conf:(0.52)> lift:(1.16) lev:(0.03) [16455] conv:(1.15) 29. q83=strongly agree 212968 ==> q19=strongly agree 109992 <conf:(0.52)> lift:(1.28) lev:(0.04) [24276] conv:(1.24) 30. q81=strongly agree 226518 ==> q19=strongly agree 114559 <conf:(0.51)> lift:(1.26) lev:(0.04) [23389] conv:(1.21) 31. q19=strongly agree 218898 ==> q83=strongly agree 109992 <conf:(0.5)> lift:(1.28) lev:(0.04) [24276] conv:(1.22) 32. q83=agree 242296 ==> q8=agree 121642 <conf:(0.5)> lift:(1.18) lev:(0.03) [18861] conv:(1.16) 33. q83=agree 242296 ==> q81=agree 121475 <conf:(0.5)> lift:(1.29) lev:(0.05) [27128] conv:(1.22) 34. q15=agree 225732 ==> q8=agree 113009 <conf:(0.5)> lift:(1.18) lev:(0.03) [17254] conv:(1.15) 18

Κανόνες συσχέτισης 3 Min Support 0,1 Min Confidence 75% 1. q83=strongly agree q30=strongly agree q28=strongly disagree 66971 ==> q81=strongly agree 57578 <conf:(0.86)> lift:(2.06) lev:(0.05) [29685] conv:(4.16) 2. q83=strongly agree q30=strongly agree q77=strongly agree 65222 ==> q81=strongly agree 56010 <conf:(0.86)> lift:(2.06) lev:(0.05) [28845] conv:(4.13) 3. q81=strongly agree q83=strongly agree q28=strongly disagree 67220 ==> q30=strongly agree 57578 <conf:(0.86)> lift:(2.48) lev:(0.06) [34385] conv:(4.57) 4. q30=strongly agree q16=strongly disagree 68398 ==> q81=strongly agree 57008 <conf:(0.83)> lift:(2) lev:(0.05) [28520] conv:(3.5) 5. q83=strongly agree q28=strongly disagree 80907 ==> q81=strongly agree 67220 <conf:(0.83)> lift:(1.99) lev:(0.06) [33522] conv:(3.45) 6. q83=strongly agree q28=strongly disagree 80907 ==> q30=strongly agree 66971 <conf:(0.83)> lift:(2.4) lev:(0.07) [39055] conv:(3.8) 7. q83=strongly agree q40=strongly agree 67102 ==> q81=strongly agree 55232 <conf:(0.82)> lift:(1.98) lev:(0.05) [27284] conv:(3.3) 8. q21=strongly disagree 98145 ==> q20=strongly agree 80709 <conf:(0.82)> lift:(2.35) lev:(0.09) [46354] conv:(3.66) 9. q30=strongly agree q40=strongly agree 73054 ==> q81=strongly agree 59971 <conf:(0.82)> lift:(1.97) lev:(0.05) [29544] conv:(3.26) 10. q39=strongly disagree 77136 ==> q20=strongly agree 63259 <conf:(0.82)> lift:(2.34) lev:(0.07) [36258] conv:(3.61) 19

Σχολιασμός κανόνων συσχέτισης Κανόνας Σχόλιο 1 Στον πρώτο κανόνα παρατηρούμε ότι ένα περίπου 10% του συνόλου των ψηφοφόρων πού πιστεύει ότι τα λαϊκά αιτήματα Αγνοούνται σήμερα προς όφελος των συμφερόντων διότι η κυβέρνηση πρέπει να λάβει μέτρα για τη μείωση της ανισότητας των εισοδημάτων και ότι τα μνημόνια συσσωρεύουν χρέη χωρίς όλα τα οφέλη και διαφωνεί ότι τα μνημόνια και η τρόικα ήταν απαραίτητα. 2 3 4 Στο δεύτερο κανόνα που μας έβγαλε το πρόγραμμα όπου πάλι το 10% του πληθυσμού πιστεύει ότι τα λαϊκά αιτήματα αγνοούνται σήμερα προς όφελος των συμφερόντων, θα ήθελε τις σοβαρότερα πολιτικές αποφάσεις να τις παίρνουν οι πολίτες. Δηλαδή πιο άμεση δημοκρατία και ότι η κυβέρνηση πρέπει να λάβει μέτρα για την καταπολέμηση της μείωσης των εισοδημάτων. Στον τρίτο κανόνα το 10% των ερωτηθέντων συμφωνούμε ότι τα μνημόνια δεν έχουν ορατά οφέλη άρα υπάρχει συνάφεια με την απάντηση το μνημόνιο και η τρόικα δεν ήταν απαραίτητη και ότι γενικά τα λαϊκά αιτήματα αγνοούνται σήμερα προς όφελος συμφερόντων. Επίσης σε ποσοστό 10% και σε απόλυτη συνάφεια με τις προηγούμενες σχέσεις ίδια μερίδα του πληθυσμού πιστεύει πως το εθνικό σύστημα υγείας μπορεί να γίνει πιο αποτελεσματικό μέσω της μερικής ιδιωτικοποίησης του δηλαδή παρόλο που υπάρχει μία άρνηση στα μνημόνια, το εθνικό σύστημα υγείας θα μπορούσε να γίνει πιο αποτελεσματικό αλλά με ίδια μέσα και τρόπους. 5 Συναφές με τα σχόλια 1, 2 και 3. 6 Συναφές με τα σχόλια 1, 2 και 3. 7 Επίσης το συγκεκριμένο προφίλ πιστεύει έντονα ότι τράπεζες και μεγάλες επιχειρήσεις κοινής ωφέλειας πρέπει να περάσουν στον έλεγχο του δημοσίου. 8 9 10 Το 14% από τα συνολικά άτομα θεωρεί πως είναι προτιμότερο για την Ελλάδα να είναι εκτός Ευρωπαϊκής Ένωσης και ότι η οικονομία μας θα είχε καλύτερη πορεία με το δικό της νόμισμα. Το 11% συμφωνεί ότι οι επιχειρήσεις κοινής ωφέλειας πρέπει να περάσουν στον έλεγχο του δημοσίου και ότι τα μνημόνια συσσωρεύουν χρέη και θεωρεί ότι τα λαϊκά αιτήματα αγνοούνται. Ένα 11% του κόσμου επίσης πιστεύει ότι η έξοδος της χώρας από το ευρώ δεν πρέπει να αντιμετωπίζεται ως καταστροφή και ότι θα είναι προτιμότερο να βγούμε από την ευρωπαϊκή ένωση. 20

Μοντέλο κατηγοριοποίησης Dataset: 66% training & 34% validation J48: Χρόνος 3,12sec, Correctly Classified instances 43,68% Random Forest: Time 42,29sec, Correctly Classified instances 43,71% ZeroR: Time 0,08sec, Correctly Classified instances 43,24% Δοκιμές με άλλους classifiers χωρίς μεγάλα ποσοστά 21

Συσταδοποίηση kmeans algorithm Dataset: 543.870 instances 13,73 δευτερόλεπτα για την ολοκλήρωση του μοντέλου Εντοπίστηκαν 2 συστάδες 1. 248.054 (46%) 2. 295.816 (54%) Πολλά κοινά χαρακτηριστικά με κυριότερή παρατήρηση ότι και οι δύο υποστήριξαν τον Σύριζα στις εκλογές του 2012 και τις ευρωεκλογές του 2014. 22

Οπτικοποίηση δεδομένων με τη χρήση του Tableau Αναπαράσταση σχέσης φύλου και επιπέδου εκπαίδευσης. Διαπιστώνεται ότι η πλειοψηφία των συμμετεχόντων είναι άντρες με τριτοβάθμια εκπαίδευση. 23

Οπτικοποίηση σχέσης πρόθεσης ψήφου απέναντι στην αυστηρότητα μέτρων καταστολής Θέση «Η αστυνομία θα πρέπει να χρησιμοποιεί πιο αυστηρά μέτρα καταστολής για την προστασία της περιουσίας των πολιτών» Συσχέτιση με την πρόθεση ψήφου στις εκλογές Ιανουαρίου 2015 Πλειοψηφία ψηφοφόρων Νέας Δημοκρατίας συμφωνεί ή συμφωνεί έντονα. 24

Οπτικοποίηση θέσης απέναντι στους μετανάστες σε σχέση με τις περιφέρειες Θέση «Οι μετανάστες που έρχονται στην Ελλάδα οφείλουν να υιοθετούν τα ήθη και τα έθιμα της Ελλάδας» Συσχέτιση με εκλογικές περιφέρειες Περιφέρεια Β Αθηνών με μεγαλύτερο ποσοστό διαφωνίας, μετά από την περιφέρεια 25

Ηθική της έρευνας Συμμετοχή ενήλικων ατόμων/μελών εκλογικού σώματος της χώρας Εθελοντική συμμετοχή χωρίς επιβράβευση ή αποζημίωση Δεν χρησιμοποιήθηκαν ευαίσθητα προσωπικά δεδομένα Αδύνατο να συνδεθούν οι απαντήσεις με φυσικά πρόσωπα Δεδομένα κωδικοποιημένα Απουσία κινδύνου για τους συμμετέχοντες 26

Γενικά συμπεράσματα Συμμετέχοντες στην έρευνα 63% άντρες και 37% γυναίκες Υπόθεση 1 η : Οι άντρες ενδιαφέρονται περισσότερο για την πολιτική Υπόθεση 2 η : Οι άντρες είναι περισσότερο αναποφάσιστοι από τις γυναίκες Ψηφοφόροι Νέας Δημοκρατίας και ΣΥΡΙΖΑ στις ευρωεκλογές 2014 εξακολουθούν κατά πλειοψηφία να υποστηρίζουν το ίδιο κόμμα για τις εκλογές Ιανουαρίου 2015 Αποτελέσματα έρευνας Εύκολα κατανοητά Σχετικά καλός βαθμός βεβαιότητας Εν δυνάμει χρήσιμο για τους ερευνητές Καινοτόμο, προσθέτει γνώση 27

Σχέση ηλικίας φύλου - εκπαίδευσης 28

Άποψη σχετικά με την έξοδο από το Ευρώ 29

Άποψη σχετικά με το θέμα της έκτρωσης Παράδοξο: ισχυρή συμφωνία από άντρες απέναντι στην ελευθερία στην έκτρωση Η επαρχία δεν είναι συντηρητική 30

Περιορισμοί και προβλήματα Τεχνικά Κωδικοποίηση ερωτήσεων Κωδικοποίηση κλίμακας Likert Μεθοδολογίας Αδυναμία εξαγωγής ισχυρών κανόνων συσχέτισης Αυξημένο support, μείωση confidence και αριθμού κανόνων 31

Προτάσεις για μελλοντική έρευνα Ανάλυση ανοιχτών θεμάτων που είναι πέρα από το σκοπό της παρούσας έρευνας σχετικά με πτυχές την κοινωνίας Έρευνα με συνολικά δεδομένα από 2010 μέχρι σήμερα για εξέταση των αλλαγών των απόψεων των Ελλήνων Χρήση στοιχείων ημέρας και ώρας που απαντήθηκε το ερωτηματολόγιο για σύνδεση διαφορετικών απόψεων με την ύπαρξη κοντινών χρονικά εκλογών 32

Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα Ευχαριστώ για την παρακολούθηση! Ερωτήσεις? Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου. Big data analysis using data mining techniques. The case of a voting decision support application. Μάρτιος 2018