ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 2: ΔΙΕΡΕΥΝΗΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ - ΜΕΡΟΣ (Α)

Σχετικά έγγραφα
ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 3: ΔΙΕΡΕΥΝΗΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΙΑ ΕΠΙΣΚΟΠΗΣΗ

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 4: ΠΑΡΑΓΩΓΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΙΚΤΩΝ

Εισαγωγή στην Ανάλυση Δεδομένων

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 2: ΠΟΣΟΤΙΚΕΣ VERSUS ΠΟΙΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΕΡΕΥΝΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΑ» και «ΝΕΚΑ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 1: ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΜΕΘΟΔΟΥΣ ΕΡΕΥΝΑΣ - ΠΕΡΙΓΡΑΜΜΑ

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχόλη Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Εθνικό Κέντρο Τεκμηρίωσης / Εθνικό Ίδρυμα Ερευνών: Δρ Εύη Σαχίνη, Διευθύντρια

ΣΥΝΤΟΜΗ ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΕΡΕΥΝΩΝ ΕΚΤ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική

ΜΑΘΗΜΑ 2 ο. ΗχρήσητουπακέτουEviews (Using Eviews econometric package)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Εθνικό Κέντρο Τεκμηρίωσης / Εθνικό Ίδρυμα Ερευνών: Δρ Εύη Σαχίνη, Διευθύντρια

Εθνικό Κέντρο Τεκμηρίωσης / Εθνικό Ίδρυμα Ερευνών: Δρ Εύη Σαχίνη, Διευθύντρια

EKT I Εθνικό Κέντρο Τεκμηρίωσης

Εθνικό Κέντρο Τεκμηρίωσης / Εθνικό Ίδρυμα Ερευνών: Δρ Εύη Σαχίνη, Διευθύντρια

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

18/11/2014 ΔΕΛΤΙΟ ΤΥΠΟΥ

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχόλη Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1)

SPSS Statistical Package for the Social Sciences

EKT I Εθνικό Κέντρο Τεκμηρίωσης

EKT I Εθνικό Κέντρο Τεκμηρίωσης

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Αρχίζοντας με το ΜΙΝΙΤΑΒ 15

EKT I Εθνικό Κέντρο Τεκμηρίωσης

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΤΕΚΜΗΡΙΩΣΗΣ ΕΙΕ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

EKT I Εθνικό Κέντρο Τεκμηρίωσης

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Διάλεξη 1 Βασικές έννοιες

UNIVERSITY OF THESSALY FACULTY OF ENGINEERING DEPARTMENT OF PLANNINGAND REGIONAL DEVELOPMENT MASTER «EUROPEAN REGIONAL DEVELOPMENT STUDIES»

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Βιοστατιστική ΒΙΟ-309

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

I2. Αριθμητικά περιγραφικά μέτρα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Καθορισμός μεταβλητών και εισαγωγή δεδομένων

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 4: ΔΙΑΛΕΞΗ 04

Σκοπός του μαθήματος

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Βιοστατιστική ΒΙΟ-309

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

Περιεχόμενα. Πρόλογος... 15

1991 US Social Survey.sav

Οικονομικοί και συγκοινωνιακοί δείκτες επιρροής της οδικής ασφάλειας πριν και μετά την περίοδο της κρίσης στην Ευρωπαϊκή Ένωση

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΕΝΔΥΣΕΙΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗ ΑΝΑΠΤΥΞΗ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 2: ΔΙΕΡΕΥΝΗΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ - ΜΕΡΟΣ (Α) Δρ. Μαρί-Νοέλ Ντυκέν, Καθηγήτρια, mdyken@prd.uth.gr Τηλ. 24210-74438 Γραφείο Γ.6

1. Προετοιμασία των μεταβλητών δεικτών. από τα αδρά δεδομένα στους δείκτες. 2

ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΠΑΡΑΔΕΙΓΜΑ ΕΦΑΡΜΟΓΗΣ Υπό μελέτη φαινόμενο Υποθέσεις εργασίας Συλλογή Δεδομένων Επιλογή Μεταβλητών Εξεταζόμενος Πληθυσμός (Παρατηρήσεις) Μονάδα(ες) μέτρησης Περίοδος ανάλυσης Πηγή δεδομένων Επιλογή Στατιστικών Μεθόδων Οδικές υποδομές (Οδικό δίκτυο) στην Ε.Ε.-28 κατά τη τελευταία δεκαετία 2005 & 2014 Διαχρονική εξέλιξη στις χώρες της Ε.Ε. Ποια Δεδομένα; Μεταβλητές: Οδικά Δίκτυα : (α) αυτοκινητόδρομοι και (β) άλλοι δρόμοι Εξεταζόμενος Πληθυσμός: οι 28 Χώρες της Ε.Ε. Μονάδα μέτρησης: χιλιόμετρα Περίοδος ανάλυσης: 2005 & 2014 διαχρονική εξέλιξη Πηγή Δεδομένων: EUROSTAT, regional Database Περιγραφική Επαγωγική Οικονομετρική Εφαρμογή και ερμηνεία αποτελεσμάτων Σημαντικότητα των μεταδεδομένων (metadata) 3

ΤΑ ΑΔΡΑ ΔΕΔΟΜΕΝΑ Περιορισμένη χρησιμότητα των αδρών δεδομένων Ρίσκο στατιστικού τεχνήματος (statistical artefact) Πηγή: EUROSTAT Βλέπε: Αρχείο = DATA_ΜΕΘΟΔΟΙ_ΕΡΕΥΝΑΣ_02.xlsx, Φύλλο εργασίας: ROAD_NETWORK 4

ΤΑ ΑΔΡΑ ΔΕΔΟΜΕΝΑ και το Στατιστικό Τέχνημα (artefact) Παράδειγμα στατιστικού τεχνήματος (statistical artefact) «Η συμμετοχή της Ελλάδας, το 2005, στο δίκτυο αυτοκινητοδρόμων της Ε.Ε. είναι τρεισήμισι φόρες μεγαλύτερη από την Κύπρο και την Ιρλανδία!!» (όταν η έκταση της Ελλάδας είναι 1,9 φόρες μεγαλύτερη σε σχέση με την Ιρλανδία και 14 φόρες σε σχέση με την Κύπρο!) Αντιθέτως, η σύγκριση των ποσοστών μεταβολής 2005-2014 δεν προκαλεί στατιστικό τέχνημα. Πηγή: EUROSTAT, τελευταία ενημέρωση: 20/09/2016 Π.χ.: η αύξηση του δικτύου στην Ιρλανδία είναι περίπου δύο φόρες μεγαλύτερη σε σχετικούς όρους, από την αντίστοιχη στην Ελλάδα. 5

ΤΑ ΑΔΡΑ ΔΕΔΟΜΕΝΑ και το Στατιστικό Τέχνημα (artefact) «Η συμμετοχή της Ελλάδας, το 2005, στο δίκτυο αυτοκινητοδρόμων της Ε.Ε. είναι τρεισήμισι φόρες μεγαλύτερη από την Κύπρο και την Ιρλανδία!!» Για να αποφύγουμε το σχετικό λάθος, μπορούμε να χρησιμοποιούμε το ΣΥΝΤΕΛΕΣΤΗ ΣΥΜΜΕΤΟΧΗΣ (Ql ir ) QL ir Air Ar Ain An s ir s in ΤΩΡΑ ΜΠΟΡΟΥΜΕ ΝΑ ΠΟΥΜΕ ΌΤΙ Η ΣΥΜΜΕΤΟΧΗ ΤΟΥ ΔΙΚΤΥΟΥ ΑΥΤΟΚΙΝΗΤΟΔΡΟΜΩΝ ΣΤΗΝ ΕΛΛΑΔΑ ΕΊΝΑΙ 2,7 ΦΟΡΕΣ ΜΕΓΑΛΥΤΕΡΗ ΑΠΌ ΤΗΝ ΑΝΤΙΣΤΟΙΧΗ ΣΥΜΜΕΤΟΧΗ ΣΤΗΝ ΙΡΛΑΝΔΙΑ 6

ΔΕΙΚΤΗΣ ΣΥΜΜΕΤΟΧΗΣ (Qlir): η ερμηνεία Από τον ορισμό του, ο δείκτης μας επιτρέπει να εξετάζουμε σε ποιο βαθμό κάθε χώρα της Ε.Ε. απέχει από τη μέση κατάσταση της Ε.Ε. στο σύνολό της. Το δίκτυο αυτοκινητοδρόμων σε επίπεδο Ε.Ε. αντιστοιχεί σε 1,54% του συνολικού οδικού δικτύου της Ε.Ε.: 62824 / 4.072.269 ενώ για την Ελλάδα το αντίστοιχο ποσοστό ανέρχεται σε 0,75%, σαφές μικρότερο. Με το δείκτη LQ, η ανάλυση και η ερμηνεία διευκολύνονται: όταν ο δείκτης για μια χώρα είναι κοντά στο 1, η Χωρά πλησιάζει τη μέση κατάσταση της Ε.Ε. ενώ όσο πιο κοντά στο 0 είναι ο δείκτης, τόσο περισσότερο η χώρα απέχει από τη μέση κατάσταση (στο συγκεκριμένο παράδειγμα, αυτό αναδεικνύει μια υστέρηση). Όταν ο δείκτης είναι σαφές μεγαλύτερο από το 1, τόσο πιο καλή είναι η κατάσταση της χώρας. Ελλάδα (2005): QL ir Air Ar Ain s An ir s in 0,75 1,54 0,49 Η διαχρονική ανάλυση του δείκτη αποτελεί χρήσιμο εργαλείο για την ανάλυση της αναπτυξιακής πορείας μιας χώρας (υπό το πρίσμα των υποδομών). Air Ain Ελλάδα (2014): QL 1,69 ir sir sin 0,98 Ar An 1,73 7

Πρώτο Δίδαγμα Σπανίως, η στατιστική ανάλυση βασίζεται στα αδρά δεδομένα τα οποία θέτουν πρόβλημα σύγκρισης μεταξύ τους, ειδικά όταν αναφερόμαστε σε χωρικές / διοικητικές μονάδες (Χώρες, Περιφέρειες, Δήμοι, Πολεοδομικά Συγκροτήματα κ.ά.) Βασική φάση του σχεδιασμού και της εφαρμογής της εμπειρικής έρευνας είναι η επιλογή κατάλληλων δεικτών. Η καταλληλόλητα αφορά: (α) τη δυνατότητα «εννοιολογικής προσέγγισης» και «μέτρησης» του φαινομένου που εξετάζεται, (β) την εξασφάλιση ότι, η ερμηνεία του επιλεγμένου δείκτη είναι άμεση και μη περιπλοκή προκειμένου να παράγουμε κατανοητή πληροφόρηση για τον εύρη κοινό και όχι μόνο για μια «δήθεν ελίτ» Δείκτης μεταβολής της μεταβλητής X: Όπου t = τελικός χρόνος & ο = αρχικός χρόνος ΔΧ = 100 (Χ t X 0 ) X o = 100 ( X t X o 1) 8

2. Διερευνητική στατιστική ανάλυση. Μια εφαρμογή για την εξέλιξη των Δαπανών Έρευνας και Ανάπτυξης στην Ε.Ε. 9

Αντικείμενο της ανάλυσης Θέμα: Οι ανισότητες στο χώρο της ΕΕ-28 ως προς την Έρευνα & Ανάπτυξη (Ε&Α): 2004-2013. Παραδοχές: Οι οικονομικές ανισότητες μεταξύ των χώρων της Ε.Ε.-28 έχουν πολλαπλές διαστάσεις. Αν γενικότερα εκφράζονται μέσω του δείκτη ΑΕΠ κατά κεφαλήν, μπορούν επίσης να εξεταστούν με την χρήση διαφορετικών δεικτών οι όποιοι επικεντρώνονται σε συγκεκριμένες πτυχές της αναπτυξιακής διαδικασίας όπως είναι η περίπτωση των εθνικών δαπανών σε Έρευνα & Ανάπτυξη (Ε&Α). Ερωτήματα: (α) πως εξελίσσεται η Έρευνα & Ανάπτυξη στην Ε.Ε.-28; (β) σε ποιο βαθμό οι χώρες της Ε.Ε. παρουσιάζουν σημαντικές ανισότητες ως προς την Ε&Α; (γ) σε ποιο βαθμό υπάρχει τάση μείωσης των ανισοτήτων; 10

Αντικείμενο της ανάλυσης Τα δεδομένα: Τα στατιστικά στοιχεία Ε&Α προέρχονται από την Βάση της Eurostat και αφορούν τις δαπάνες που εκτελούνται στο εσωτερικό κάθε χώρας (intramural R&D expenditures). Εκφράζονται σε εκατομμύρια ΜΑΔ (PPS) (*). Όπως αναφέρει η Eurostat, «οι συνολικές δαπάνες Ε&Α αναλύονται σε 4 τομείς στους οποίους κατηγοριοποιούνται οι φορείς που εκτελούν δραστηριότητες Ε&Α». Σύμφωνα με τους συμβολισμούς που υιοθετεί η Eurostat, οι 4 τομείς είναι οι ακόλουθοι: BES (Business Sector): Τομέας επιχειρήσεων GOV(Government Sector): Κρατικός τομέας HES (Higher Education Sector): Τομέας τριτοβάθμιας και μεταδευτεροβάθμιας εκπαίδευσης PNP (Private Non Profit Organisations): Τομέας ιδιωτικών μη κερδοσκοπικών ιδρυμάτων (*) Μονάδα Αγοραστικής Δύναμης (ΜΑΔ) : γίνεται μετατροπή των δαπανών σε της κάθε χώρας σε τεχνητό κοινό νόμισμα, εξαλείφοντας την επίδραση των διαφορετικών επίπεδων τιμών μεταξύ των χωρών. Η μετατροπή σε ΜΑΔ αναφέρεται σε συγκρίσιμο μέγεθος. 11

Αντικείμενο της ανάλυσης Βασικοί ορισμοί της Eurostat (metadata): Main concepts and definitions used for the production of R&D statistics are given by the Frascati Manual: "Proposed standard practice for surveys of research and experimental development", OECD 2002, which is internationally recognized standard methodology for collecting R&D statistics. "Research and experimental development (R&D) comprise creative work undertaken on a systematic basis in order to increase the stock of knowledge, including knowledge of man, culture and society and the use of this stock of knowledge to devise new applications." ( 63, Frascati Manual, OECD 2002). "Intramural R&D expenditures are all expenditures for R&D performed within a statistical unit or sector of the economy during a specific period, whatever the source of funds." ( 358, Frascati Manual, OECD 2002). 12

Δεδομένα / Μεταβλητές Βλέπε: Αρχείο = DATA_ΜΕΘΟΔΟΙ_ΕΡΕΥΝΑΣ_03.xlsx, Φύλλο εργασίας: METADATA 13

Δεδομένα / Μεταβλητές Περιορισμένη χρησιμότητα των αδρών δεδομένων Ρίσκο στατιστικού τεχνήματος (statistical artefact) Βλέπε: Αρχείο = DATA_ΜΕΘΟΔΟΙ_ΕΡΕΥΝΑΣ_03.xlsx, Φύλλο εργασίας: SPSS1 Απαραίτητη η επιλογή «συγκρίσιμων δεικτών» 14

Ορισμός κατάλληλου δείκτη Ο δείκτης: «Ένταση Δαπανών Ε&Α» WRD t = 100 RD t GDP t (α) αποτελεί συγκρίσιμο δείκτη εφόσον λαμβάνει υπόψη το «οικονομικό μέγεθος» της κάθε χώρας, (β) αποτυπώνει επίσης τον στόχο της στρατηγικής ΕU2020 σύμφωνα με την οποία οι δαπάνες σε Ε&Α θα πρέπει να φτάσουν το 3% του ΑΕΠ της Ε.Ε.. To 2013, οι δαπάνες της Ισπανίας είναι 8 φόρες υψηλότερες από τις αντίστοιχες της Ελλάδας όταν το ΑΕΠ είναι 5 φορές μεγαλύτερο. Έτσι η ένταση των δαπανών είναι μόνο 1,5 φόρα μεγαλύτερη! 15

Μια πρώτη «ανάγνωση» Ταξινόμηση των χώρων με βάση το 2013 Σχετική βελτίωση σε επίπεδο Ε.Ε.-28 Υπάρχει ακόμα σημαντική απόκλιση σε σχέση με το στόχο των 3% Το 2013, τρεις χώρες έχουν ξεπεράσει το 3% από τις οποίες οι δύο το είχαν ήδη ξεπεράσει το 2004 (Φινλανδία και Σουηδία). Ορισμένες χώρες είναι πολύ κοντά στο στόχο (Αυστρία, Γερμανία και σε λιγότερο βαθμό η Σλοβενία). Δέκα χώρες δεν έχουν φτάσει τον 1/3 του στόχου!!! 16

3. Ξεκίνημα της ανάλυσης με το SPSS Τα δεδομένα βρίσκονται: στο αρχείο DATA_ΜΕΘΟΔΟΙ_ΑΝΑΛΥΣΗΣ_03 (Excel) Στο φύλλο εργασίας με όνομα SPSS1 17

Φάση 1: Άνοιγμα των δεδομένων (Excel) μέσω SPSS ΑΣ ΥΣ ΤΗΣ ΈΡΕΥΝ ΤΟΥΣ ΣΤΌΧΟ ΜΕ ΆΤΩΝ Ν ΖΗΤΗΜ ΤΩΝ ΕΡΕΥΝ ΗΤΙΚΏ ΣΗ 1. File, Open, Data ΣΎΝΔΕ ΦΆΣΗ 1: Τρεις χρήσιμες μορφές αρχείων: Data (δεδομένα).sav Output (αποτελέσματα) Syntax (προγραμματισμός εντολών) 2. Επιλογή του τύπου αρχείου (Excel) Μετά την επιλογή του τύπου αρχείου, εμφανίζεται το αρχείο Excel (αρκεί να έχουμε επιλέξει το φάκελο όπου έχουμε αποθηκεύσει το αρχείο με τα δεδομένα), το επιλέγουμε και 3. Open 18

Φάση 1: Άνοιγμα των δεδομένων (Excel) μέσω SPSS ΑΣ ΥΣ ΤΗΣ ΈΡΕΥΝ ΤΟΥΣ ΣΤΌΧΟ ΜΕ ΆΤΩΝ Ν ΖΗΤΗΜ ΤΩΝ ΕΡΕΥΝ ΗΤΙΚΏ ΣΗ ΣΎΝΔΕ ΦΆΣΗ 1: 4. Επιλογή του Φύλλου Εργασίας Τα δεδομένα βρίσκονται στο φύλλο εργασίας : SPSS1 του αρχείου DATA_ΜΕΘΟΔΟΙ_ΕΡΕΥΝΑΣ_03.xlxs Σε αυτό το φύλλο, υπάρχουν δεδομένα από το κελί Α1 έως και το κελί F30, δηλαδή έχουμε 29 παρατηρήσεις (28 χώρες της Ε.Ε. + την ΕΕ-28) και μια γραμμή (αναγκαστικά, η πρώτη στο αρχείο Excel) με τα ονόματα των μεταβλητών. 5. Άνοιγμα του αρχείου: OK Σε αυτή τη συγκεκριμένη περίπτωση, δεν έχουμε ανάγκη να προσδιορίσουμε στο πλαίσιο Range, την περιοχή με τα δεδομένα. Αν θέλαμε να εισάγουμε τα δεδομένα μόνο για τις 28 χώρες (χωρίς τη τελευταία γραμμή με το σύνολο Ε-Ε28), τότε στο πλαίσιο Range, θα προσδιορίσαμε τη σωστή περιοχή= A1:Q29 19

Φάση 2: Τα δεδομένα A B Γ 20

Φάση 2: Τα δεδομένα A Είναι το πρώτο σετ δεδομένων που ανοίξαμε [DataSet1] και όσο δεν έχουμε αποθηκεύσει τα δεδομένα σε μορφή SPSS (.sav), εμφανίζεται η ένδειξη Untitled. Με την εντολή File, Save + νέο όνομα, θα γίνει αυτόματα αλλαγή με αντικατάσταση του Untitled με τον όνομα που δώσαμε σε αυτό το αρχείο (π.χ. DATA_03.sav) B Τα ονόματα των μεταβλητών εμφανίζονται στη μπλε γραμμή χωρίς αριθμό, έτσι ώστε τα δεδομένα της 1 ης παρατηρήσεις (Βέλγιο) να βρίσκονται στην 1 η γραμμή (Case 1) ενώ η Ε-Ε28 αποτελεί τη τελευταία παρατήρηση (Case 29). Γ Τα δεδομένα εμφανίζονται στο φύλλο εργασίας (Data View) ενώ υπάρχει δεύτερο φύλλο εργασίας (Variable View) όπου μπορούμε να εισάγουμε πληροφορίες σχετικά με κάθε μεταβλητή όπως περιγραφή της μεταβλητής (Label), τύπος μεταβλητής (Type) κ.ά. Το φύλλο Variable View είναι πολύ χρήσιμο όταν έχουμε πολλές και διαφορετικές μεταβλητές και ειδικότερα όταν έχουμε κωδικοποιημένες μεταβλητές. 21

Φάση 2: Τα δεδομένα / βασικά χαρακτηριστικά Οι δύο πρώτες μεταβλητές είναι μεταβλητές αναγνώρισης των παρατηρήσεων (οι χώρες) Η μεταβλητή RD04 εμφανίζεται με 3 δεκαδικά ενώ η RD13 με 11! Μπορούμε να τα αλλάξουμε για να εμφανιστούν χωρίς δεκαδικό (δεν σημαίνει ότι, χάνουμε πληροφορία. Πρόκειται μόνο για παρουσίαση των δεδομένων). Τα δεδομένα είναι έτοιμα για επεξεργασία και ανάλυση 22

3. Επεξεργασία - Ανάλυση 23

Υπολογισμός των Δεικτών Έντασης των Δαπανών Εντολή: Transform, Compute Variable Νέα μεταβλητή Φόρμουλα WRD t = 100 RD t GDP t Με τον ίδιο τρόπο, υπολογίζουμε τον 2 ο δείκτη (2013). Η νέα μεταβλητή = WRD13 και η φόρμουλα = 100*RD13/GDP13 Οι δύο νέες μεταβλητές εμφανίζονται στο τέλος του φύλλου με τα δεδομένα. 24

Υπολογισμός των Δεικτών Έντασης των Δαπανών Προσοχή: Όπως ήδη αναφέρθηκε, έχουμε 29 παρατηρήσεις. Όμως η τελευταία αφορά το σύνολο των χώρων και ως εκ τούτου δεν μπορεί να περιλαμβάνεται στην ανάλυση. Θα πρέπει να την ουδετεροποιήσουμε με τη χρήση φίλτρου. 25

Εφαρμογή Φίλτρου Εντολή: Data, Select Cases Για την επιλογή των ενεργών παρατηρήσεων, παίρνουμε ως προϋπόθεση: ID > 0, έτσι ώστε η τελευταία παρατήρηση να είναι απενεργοποιημένη (ΕΕ-28). Η ενεργοποίηση φίλτρου εμφανίζεται ως εξής: 26

Υπολογισμός των παραμέτρων κεντρικής τάσης και διασποράς για τους δύο δείκτες «Έντασης των Δαπανών» Εντολή: Analyze, Descriptive Statistics, Explore(*) Statistics: Επιλέγουμε τις παραμέτρους που θέλουμε να εξετάσουμε. Plots: Επιλέγουμε τα διαγράμματα που είναι χρήσιμα για την ανάλυση, όπως το ιστόγραμμα και τα διαγράμματα που αναδεικνύουν σε ποιο βαθμό οι δείκτες μας ακολουθούν την κανονική κατανομή. 27

Αποτελέσματα. Output Σύνοψη των αποτελεσμάτων WRD04 WRD13 E.E.28(*) 1,67 1,93 Ελάχιστη τιμή 0,338 0,387 Μέγιστη τιμή 3,391 3,306 Εύρος 3,054 2,919 Μέση τιμή 1,298 1,618 Διάμεσος 1,046 1,362 Τυπική απόκλιση 0,861 0,903 CV = Τυπική απόκλιση / Μέση τιμή WRD04 0,663 (66,3%) WRD13 0,558 (55,8%) 28

Συμπεράσματα. Σύνοψη των αποτελεσμάτων WRD04 WRD13 E.E.28(*) 1,67 1,93 Ελάχιστη τιμή 0,338 0,387 Μέγιστη τιμή 3,391 3,306 Εύρος 3,054 2,919 Μέση τιμή 1,298 1,618 Διάμεσος 1,046 1,362 Τυπική απόκλιση 0,861 0,903 CV = Τυπική απόκλιση / Μέση τιμή WRD04 0,663 (66,3%) WRD13 0,558 (55,8%) Σε επίπεδο Ε.Ε., οι παράμετροι κεντρικής τάσης (μέση τιμή και διάμεσος) αυξήθηκαν. Όμως η διάμεσος παραμένει σε επίπεδο πολύ κατώτερο από τη μέση τιμή και το μέσο επίπεδο της Ε.Ε. 28, αναδεικνύοντας ότι οι χώρες με μικρή ένταση των δαπανών επηρεάζουν σημαντικά (και αρνητικά) την επίτευξη του στόχου των 3%. Αυτό επιβεβαιώνεται από το γεγονός ότι, η μέση τιμή των δεικτών έντασης είναι διαφορετική και μικρότερη από το μέσο επίπεδο της Ε.Ε. στο σύνολο της. Το μεγάλο εύρος τιμών εξηγεί επίσης αυτή τη διαφορά 29

Συμπεράσματα. Υπολογισμός των δεικτών σε επίπεδο Ε.Ε.28 : Σύνοψη των αποτελεσμάτων WRD04 EE = i=1 28 RD04 i 28 = 184071 = 0,0167 (1,67%) GDP04 i 11024412 i=1 WRD04 WRD13 E.E.28(*) 1,67 1,93 Ελάχιστη τιμή 0,338 0,387 Μέγιστη τιμή 3,391 3,306 Εύρος 3,054 2,919 Μέση τιμή 1,298 1,618 Διάμεσος 1,046 1,362 Τυπική απόκλιση 0,861 0,903 WRD04 = Υπολογισμός της μέσης τιμής: i=1 28 WRD04i 28 = 0,1298 (1,30%) Πρέπει εδώ να αναφέρουμε ότι το 95% Διάστημα Εμπιστοσύνης της μέσης τιμής για το 2004 είναι αρκετά μεγάλο: (0,964 1,632). Με σφάλμα 5%, η μέση τιμή κυμαίνεται μεταξύ περίπου 1% και 1,6%. Για το 2013, το 95% Δ.Ε. = (1,268 1,968) δηλαδή η μέση ένταση κυμαίνεται μεταξύ περίπου 1,3% και 2,0%. 30

Συμπεράσματα. Σύνοψη των αποτελεσμάτων WRD04 WRD13 E.E.28(*) 1,67 1,93 Ελάχιστη τιμή 0,338 0,387 Μέγιστη τιμή 3,391 3,306 Εύρος 3,054 2,919 Μέση τιμή 1,298 1,618 Διάμεσος 1,046 1,362 Τυπική απόκλιση 0,861 0,903 Η διάμεσος αποτελεί χρήσιμο δείκτη διότι σε αντίθεση με τη μέση τιμή δεν επηρεάζεται από τις ακραίες τιμές. Πάρα μια γενική βελτίωση της έντασης των δαπανών Ε&Α, το 2013, το 50% των χώρων της ΕΕ (14 στις 28) παρουσιάζουν ακόμα δείκτη έντασης ιδιαίτερα χαμηλό: ούτε το μισό του στόχου (< 1,4). Υπάρχει όντως γενική βελτίωση : Αύξηση της ελάχιστης τιμής Διατήρηση της μέγιστης τιμής Μείωση του εύρους τιμών 31

Συμπεράσματα. Η αξιοπιστία των συμπερασμάτων μας : (α) γενική βελτίωση της έντασης (β) σημαντική διαφορά μεταξύ της μέσης τιμής του δείκτη και το μέσο επίπεδο της Ε.Ε.28 στο σύνολο της πρέπει να ελεγχθεί με στατιστικούς όρους. (Test) Αυτός είναι ο ρόλος της διαδικασίας ελέγχου υποθέσεων. Για το (α), ο έλεγχος διατυπώνεται ως έξης: Ηο: μέση τιμή του WRD13 = μέση τιμή του WRD04 Η1: μέση τιμή του WRD13 μέση τιμή του WRD04 paired sample T Test Για το (b), ο έλεγχος για κάθε μεταβλητή διατυπώνεται ως έξης: Ηο: μέση τιμή του WRD04 = 1,67 (επίπεδο Ε.Ε.28) Η1: μέση τιμή του WRD04 1,67 Ηο: μέση τιμή του WRD13 = 1,93 (επίπεδο Ε.Ε.28) Η1: μέση τιμή του WRD04 1,93 Η απόφαση (ποια από τις δύο εναλλακτικές υποθέσεις ισχύει) βασίζεται στην σημαντικότητα του ελέγχου (ισχύ) δηλαδή στην p-value. 32

Έλεγχοι υποθέσεων σχετικά με τη μέση τιμή 1 η περίπτωση: Σύγκριση της διαφοράς μεταξύ δύο μέσων τιμών (δύο μεταβλητών) Εντολή: Analyze, Compare means, Paired-Sample T Test Επιλέγουμε τις 2 μεταβλητές (WRD13 & WRD04) και ΟΚ Επιλέγοντας πρώτα WRD13 και έπειτα WRD04, η διαφορά θα είναι θετική. Η διαφορά είναι θετική (=0,32), η τιμή του t-student = 4,937 (πολύ μεγαλύτερη από την κριτική τιμή 2), Η ισχύ του ελέγχου (p-value) = 0,000 < 1% Η υπόθεση μηδέν απορρίπτεται, ισχύει η υπόθεση Η1, δηλαδή οι μέσες διαφέρουν σημαντικά και έχουμε τάση βελτίωσης. 33

Έλεγχοι υποθέσεων σχετικά με τη μέση τιμή 2 η περίπτωση: Σύγκριση της μέσης τιμής μιας μεταβλητής με μια δεδομένη τιμή Εντολή: Analyze, Compare means, One-sample T test Επιλέγουμε την μεταβλητή WRD04 καθώς και τη τιμή για ελέγχου = 1,67 (Ε.Ε.28) Επιλέγοντας πρώτα WRD13 και έπειτα WRD04, η διαφορά θα είναι θετική. Η διαφορά είναι αρνητική (= - 0,372), η τιμή του t-student = 2,288, Η ισχύ του ελέγχου (p-value) = 0,030 (3%) < 5% Με 3% σφάλμα (97% βεβαιότητας) η υπόθεση μηδέν απορρίπτεται, ισχύει η υπόθεση Η1, δηλαδή η μέση τιμή του δείκτη έντασης διαφέρει σημαντικά από το μέσο επίπεδο της Ε.Ε.28 στο σύνολο της. 34

Εκτίμηση του βαθμού ανισοτήτων : τάση για μείωση; Σύνοψη των αποτελεσμάτων WRD04 WRD13 Ελάχιστα περιορίζεται το εύρος τιμών. E.E.28(*) 1,67 1,93 Εύρος 3,054 2,919 Μέση τιμή 1,298 1,618 Τυπική απόκλιση 0,861 0,903 Ο συντελεστής μεταβλητότητας παραμένει υψηλός όμως μειώθηκε. Εξετάζοντας τα εκατοστημόρια (Percentiles), επιβεβαιώνεται ότι, οι ανισότητες τείνουν να μειωθούν. CV = Τυπική απόκλιση / Μέση τιμή WRD04 0,663 (66,3%) WRD13 0,558 (55,8%) Τεταρτημόρια : Q1 (πρώτο 25% των παρατηρήσεων με τις μικρότερες τιμές) Q3 (τελευταίο 25% των παρατηρήσεων με τις μεγαλύτερες τιμές) 35

Εκτίμηση του βαθμού ανισοτήτων : τάση για μείωση; Το 1 ο, 2 ο και 3 ο τεταρτημόριο είναι 3 δείκτες που χωρίζουν την κατανομή (σειρά δεδομένων) σε τέσσερα ίση μέρη. Το 2 ο τεταρτημόριο δεν είναι τίποτα άλλο από τη Διάμεσο. Η θέση των τεταρτημόριων δίνεται από: Q p p : ( n 1). 100 p = 25 για το 1 ο Τεταρτημόριο : Q 25 p = 75 για το 3 ο Τεταρτημόριο: Q 75 Η έννοια των Τεταρτημόριων μπορεί να γενικευθεί. Σε αρκετές περιπτώσεις, είναι χρήσιμο να υπολογίσουμε ορισμένα δεκατημόρια (10%, 90%) ή ακόμα εκατοστημόρια (5%, 95%). 36