Ποιότητα και αξιοπιστία (και ετοιμότητα) μεγάλων δεδομένων Σύγχρονες τάσεις και προοπτικές Αθανάσιος Κων. Θανόπουλος Πρόεδρος ΕΛΣΤΑΤ Πανεπιστήμιο Πατρών Πάτρα 16 Απριλίου 2019
Περιεχόμενα Παρουσίαση ΕΛΣΤΑΤ «Επίσημες» Στατιστικές «Επίσημες» Στατιστικές και Μεγάλα Δεδομένα Ο Ενάρετος Κύκλος των «Επίσημων Στατιστικών» Προώθηση Στατιστικής Παιδείας 2 of 37
1. Παρουσίαση ΕΛΣΤΑΤ Αποστολή της Ελληνικής Στατιστικής Αρχής (ΕΛΣΤΑΤ) είναι η διασφάλιση και η διαρκής βελτίωση της ποιότητας των στατιστικών της Χώρας. Η ΕΛΣΤΑΤ έχει σκοπό τη συστηματική παραγωγή επίσημων στατιστικών, καθώς και τη διενέργεια ερευνών και την κατάρτιση μελετών, οι οποίες: αφορούν όλους τους τομείς της δραστηριότητας του δημοσίου και του ιδιωτικού τομέα, υποστηρίζουν τη διαδικασία λήψης αποφάσεων, χάραξης και αξιολόγησης πολιτικών της Κυβέρνησης και των φορέων του Δημοσίου, υποβάλλονται σε διεθνείς φορείς σύμφωνα με τις υποχρεώσεις της χώρας και αφορούν στο γενικό κοινό ή κατηγορίες χρηστών στατιστικών στοιχείων στο εσωτερικό ή στο εξωτερικό. 3 of 37
1.1 Προσωπικό 704 άτομα 4 of 37
1.1 Προσωπικό 378 Απόφοιτοι Πανεπιστημίου ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ 3% 2%1% 1%1% 4% 23% ΜΑΘΗΜΑΤΙΚΩΝ ΣΤΑΤΙΣΤΙΚΗΣ 12% ΠΟΛΙΤΙΚΩΝ - ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΟΔΕ 17% 18% ΦΥΣΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΟΜΙΚΗΣ ΓΕΩΠΟΝΙΚΗΣ 18% ΦΙΛΟΛΟΓΙΑΣ ΓΕΩΛΟΓΙΑΣ 5 of 37
1.2 Ελληνικό Στατιστικό Σύστημα Το Ελληνικό Στατιστικό Σύστημα (ΕΛ.Σ.Σ.) είναι το σύνολο των κανόνων, των εργασιών και των φορέων που είναι αρμόδιοι για την εκτέλεση στατιστικών εργασιών, με σκοπό την ανάπτυξη, την παραγωγή και τη διάδοση και επικοινωνία των επίσημων στατιστικών της χώρας. 6 of 37
1.2 Ελληνικό Στατιστικό Σύστημα Το ΕΛΣΣ παράγει ευρωπαϊκές στατιστικές, οι οποίες καθορίζονται στο Ευρωπαϊκό Στατιστικό Πρόγραμμα και ανήκει στο Ευρωπαϊκό Στατιστικό Σύστημα με γνώμονα τον Κώδικά Ορθής Πρακτικής. 7 of 37
1.3 Πλαίσιο λειτουργίας Ελληνικός Στατιστικός Νόμος (3732/2010) Ευρωπαϊκοί Στατιστικοί Κανονισμοί Κώδικας Ορθής Πρακτικής για τις Ευρωπαϊκές Στατιστικές 8 of 37
1.3 Κώδικας Ορθής Πρακτικής 1. Επαγγελματική Ανεξαρτησία 2. Σαφής Νομική Εντολή για Συλλογή Δεδομένων 3. Επάρκεια Πόρων 4. Δέσμευση για την Ποιότητα 5. Στατιστικό Απόρρητο 6. Αμεροληψία Αντικειμενικότητα 7. Ορθή Μεθοδολογία 8. Εφαρμογή Κατάλληλων Στατιστικών Διαδικασιών 9. Μη υπερβολικός Φόρτος Ερευνώμενων 10. Σχέση Κόστους Αποτελέσματος 11. Χρησιμότητα 12. Ακρίβεια Αξιοπιστία 13. Χρονική Συνέπεια 14. Συνοχή Συγκρισιμότητα 15. Προσβασιμότητα Σαφήνεια 9 of 37
2. «Επίσημες» Στατιστικές Οι επίσημες στατιστικές είναι στατιστικές που δημοσιεύονται από κρατικούς ή άλλους οργανισμούς (πχ. διεθνείς οργανισμοί) ως δημόσιο αγαθό. Παρέχουν ποσοτικές ή ποιοτικές πληροφορίες για όλους τους σημαντικούς τομείς της ζωής των πολιτών, όπως η οικονομική και κοινωνική ανάπτυξη, οι συνθήκες διαβίωσης, η υγεία, η εκπαίδευση και το περιβάλλον. 10 of 37
2. «Επίσημες» Στατιστικές Επίσημες στατιστικές προϋπήρχαν της στατιστικής επιστήμης. 11 of 37
2. «Επίσημες» Στατιστικές και προκλήσεις Στις επίσημες στατιστικές υπάρχουν κάποια σημαντικά tradeoffs λόγω: - Φύσης της εργασίας μας (core values) - Πλήθους και φύσης (νέων) πηγών δεδομένων οι οποίες χαρακτηρίζονται από: - Volume (όγκος) - Variety (ανομοιογένεια) - Velocity (ταχύτητα) - Veracity (εγκυρότητα) Πηγές δεδομένων για ΕΛΣΤΑΤ: - Ελεγχόμενα Πειράματα (έρευνες) - Διοικητικά δεδομένα (φορολογικά, υγεία, απασχόληση, εκπαίδευση, κλπ) - Web Scrapping (job vacancies) - Sensors (αισθητήρες) 12 of 37
2. «Επίσημες» Στατιστικές Εξαντλητική και λεπτομερειακή ανάλυση Έγκαιρη δημοσίευση tradeoff 13 of 37
2. «Επίσημες» Στατιστικές Λεπτομέρεια (granularity) και Ακρίβεια Περιεκτική Πληροφορία (Conciseness Succinctness) για ορθή επικοινώνηση στους χρήστες tradeoff 14 of 37
2. «Επίσημες» Στατιστικές Κάλυψη (Πλήθος και φύση Πηγών) Εγκυρότητα / Επαληθευσιμότητα (veracity) tradeoff 15 of 37
2. «Επίσημες» Στατιστικές Άρτια στατιστική μεθοδολογία Κοινά πρότυπα ανάλυσης (standards) tradeoff 16 of 37
2. «Επίσημες» Στατιστικές Εξαντλητικότητα/ λεπτομέρεια στην καταγραφή πρωτογενών χαρακτηριστικών του ερευνώμενων Ποιότητα των απαντήσεων (πρωτογενών δεδομένων) tradeoff 17 of 37
2. «Επίσημες» Στατιστικές Ακρίβεια στην εκτίμηση μέσω «μεγάλων» δειγμάτων Μεγάλο κόστος παραγωγής tradeoff 18 of 37
2. «Επίσημες» Στατιστικές Ακρίβεια στην εκτίμηση μέσω «μεγάλων» δειγμάτων Έγκαιρη Δημοσίευση tradeoff 19 of 37
2. «Επίσημες» Στατιστικές Εξαντλητικότητα στο πλήθος των μεταβλητών Συντονισμός - Συγκρισιμότητα tradeoff 20 of 37
2. «Επίσημες» Στατιστικές Φιλοδοξία Ρεαλισμός tradeoff 21 of 37
2. «Επίσημες» Στατιστικές Από τα παραπάνω, προκύπτει ο βασικός προβληματισμός της σημερινής συζήτησής μας: Οι επίσημες στατιστικές εκ της φύσεώς τους και λόγω των ανωτέρω περιορισμών, πρέπει να εξελίσσονται με αργά, σταθερά και σίγουρα βήματα προς τα εμπρός. 22 of 37
3. «Επίσημες» Στατιστικές vs Οικονομικό Περιβάλλον Από την άλλη, τα οικονομικά γεγονότα: Εξελίσσονται γρήγορα. Επικοινωνούνται/ διαδίδονται γρηγορότερα. Επιταχύνουν την εξέλιξη. Αυξάνουν (εκθετικά) τις απαιτήσεις των χρηστών σε έγκαιρη πληροφορία. Δημιουργούν χώρο για ανταγωνισμό σε παροχή πληροφορίας. (όχι πάντα υγιή ανταγωνισμό, χωρίς πρότυπα ποιότητας και δεοντολογίας) 23 of 37
3. «Επίσημες» Στατιστικές vs Οικονομικό Περιβάλλον ανταγωνισμός στην παροχή πληροφορίας Οικονομία χωρίς πρότυπα ποιότητας και δεοντολογίας Επίσημες Στατιστικές Κώδικας Ορθής Πρακτικής Κοινά Πρότυπα και Ορισμοί Διαδικασίες Πιστοποίησης 24 of 37
3. «Επίσημες» Στατιστικές vs Οικονομικό Περιβάλλον Το παράδοξο της Επανάστασης των Δεδομένων (Data Revolution) Τεράστιος όγκος δεδομένων που δημιουργούνται με πολλαπλούς τρόπους και σε πολλά επίπεδα (Volume, Variety, Velocity, Veracity) Αύξηση της ανάγκης για ταχεία αξιοποίηση και ανάλυση Ποτέ άλλοτε στην ιστορία της ανθρωπότητας δεν υπήρξε τόσο μεγάλος όγκος διαθέσιμων δεδομένων αλλά και ταυτόχρονα, συγκριτικά τόσο μικρή ικανότητα αξιοποίησης των διαθέσιμων δεδομένων για τη λήψη αποφάσεων σε καίρια ζητήματα που απασχολούν την ανθρωπότητα. 25 of 37
3. «Επίσημες» Στατιστικές vs Οικονομικό Περιβάλλον Βασικός προβληματισμός: Ταχεία ικανοποίηση των αιτημάτων των χρηστών Ποιότητα, διαχρονική και cross sectional συγκρισιμότητα 26 of 37
3. «Επίσημες» Στατιστικές vs Οικονομικό Περιβάλλον Τα προβλήματα που έχουμε είναι κατά βάση «οικονομικής» φύσης. Όχι με την λογιστική έννοια: Χρειαζόμαστε κατάλληλους επαγγελματίες που να αντιλαμβάνονται και να μπορούν να προωθούν τους στόχους της ΕΛΣΤΑΤ εξισορροπώντας μέσα σε αυτούς τους περιορισμούς και πλαίσια. 27 of 37
4.1 Ο Ενάρετος Κύκλος των «Επίσημων Στατιστικών» Πολίτες (ως ερευνώμενοι) πρόθυμοι να παράσχουν πραγματικά δεδομένα. Εμπέδωση κοινής πεποίθησης ότι οι πολίτες εμπιστεύονται την ΕΛΣΤΑΤ Βελτίωση του στατιστικού προϊόντος / πληροφορίας Διεύρυνση της χρήσης του βελτιωμένου στατιστικού προϊόντος από πολίτες (ως χρήστες) 28 of 37
4.2 Ο Φαύλος Κύκλος των «Επίσημων Στατιστικών» Εμπέδωση κοινής πεποίθησης ότι κανείς δεν παράσχει πραγματικά δεδομένα ή ότι δεν ακολουθείται ορθή στατιστική πρακτική. Ενίσχυση πεποίθησης ότι δεν ακολουθείται ορθή στατιστική πρακτική. Πολίτες (ως ερευνώμενοι) αρνούμενοι να παράσχουν πραγματικά δεδομένα Διάβρωση της ποιότητας του στατιστικού προϊόντος 29 of 37
4.3 Ο Ενάρετος Κύκλος των «Επίσημων Στατιστικών» Ο ενάρετος κύκλος είναι ένα πολύ ευαίσθητο πλάσμα. Οποιαδήποτε (αντίληψη) διατάραξη(ς) στην ορθή στατιστική πρακτική μπορεί να κλονίσει την εμπιστοσύνη και να αντιστρέψει την φορά του ενάρετου κύκλου σε φαύλο. Γι αυτό έχουμε κάποιες θεμελιώδεις αρχές ο απόλυτος σεβασμός των οποίων είναι αναγκαία συνθήκη για την διατήρηση ενός ενάρετου κύκλου στις επίσημες στατιστικές. 30 of 37
5. Στατιστική Παιδεία Δράσεις σε Σχολεία Στρατηγική Προώθησης Στατιστικής Παιδείας Δράσεις προς τους Χρήστες των στοιχείων Δράσεις σε Πανεπιστήμια Δράσεις για το Ευρύ Κοινό 31 of 37
5. Στατιστική Παιδεία Στατιστική Παιδεία: Εκπαίδευση των χρηστών ώστε να είναι πιο απαιτητικοί από εμάς. 32 of 37
5.1 Οπτικοποίηση Πληροφορίας 33 of 37
5.2 Ιστοσελίδα ΕΛΣΤΑΤ www.statistics.gr 34 of 37
5.3 Social Media 35 of 37
EMOS 5.4 Δράσεις ΕΛΣΤΑΤ για Στατιστική Παιδεία Σεμινάρια σε μαθητές/φοιτητές Μαθητικοί / Φοιτητικοί Διαγωνισμοί 36 of 37
Σας Ευχαριστώ πολύ 37 of 37