Συλλογή,, αποθήκευση, ανανέωση και παρουσίαση στατιστικών δεδοµένων 1. Αναζήτηση των κατάλληλων δεδοµένων. 2. Έλεγχος µεταβλητών και κωδικών για συµβατότητα. 3. Αποθήκευση σε ηλεκτρονική µορφή (αρχεία Excel και κειµένου). 4. Έλεγχος για τιµές που λείπουν (γιατί λείπουν; πρόβληµα διαθεσιµότητας ή καταγραφής;) 5. ηµιουργία «εγχειριδίου χρήσης» των δεδοµένων στο οποίο καταγράφεται: i. η πηγή των δεδοµένων, ii. η ηµεροµηνία της τελευταίας τους ανανέωσης, iii. το είδος των µεταβλητών, iv. οι µονάδες µέτρησης τους, v. πιθανά προβλήµατα που µπορεί να έχουν. 1
είγµατα εδοµένων είγµα πολυµεταβλητού panel από τον ιεθνή Οργανισµό Εµπορίου για τις ετήσιες εισαγωγές και εξαγωγές διαφόρων χωρών. είγµα διαστρωµατικών ποιοτικών δεδοµένων επιχειρήσεων από την πολιτεία της Νέας Υόρκης στις ΗΠΑ. είγµα µονοµεταβλητού panel για τις τιµές αγοράς πρώτης κατοικίας στο ΗΒ. 2
εδοµένα έχουµε. Πρόβληµα όµως έχουµε; Η συστηµατική καταγραφή αποθήκευση δεδοµένων είναι απαραίτητη για την διενέργεια εµπειρικής ανάλυσης και διαρθρωτικής λήψης αποφάσεων. Από µόνα τους όµως τα δεδοµένα δεν µπορούν να λύσουν κανένα πρόβληµα. Είναι, εποµένως, απαραίτητο να έχουµε ήδη σκεφθεί πιο είναι το πρόβληµα π που θέλουµε να αντιµετωπίσουµε και τα βήµατα που θα ακολουθήσουµε κατά την επίλυσή του. Παράδειγµα #1. Σύγκριση του µέσου ετήσιου ρυθµού µεταβολής των εισαγωγών, ανά κλάδο παραγωγής, της Ελλάδας, της Κύπρου, της Βουλγαρίας, της FYROM, της Ισπανίας και της Πορτογαλίας. Παράδειγµα #2. Ανάλυση της εξάρτησης µεταξύ του είδους της επιχείρησης και της τοποθεσίας της για τις επιχειρήσεις της πολιτείας της Νέας Υόρκης. Παράδειγµα #3. Εκτίµηση της ιστορικής, και πρόβλεψη της µελλοντικής, τάσης µεταβολής των τιµών αγοράς πρώτης κατοικίας ανά γεωγραφικό διαµέρισµα στο ΗΒ. 3
Είδη ανάλυσης Με βάση το πρόβληµα που θέλουµε να εξετάσουµε/αναλύσουµε, επιλέγουµε τον κατάλληλο τύπο ανάλυσης. Περιγραφική ανάλυση: Χρησιµοποιείται κατά το αρχικό στάδιο της έρευνας Μας βοηθά να γνωρίσουµε τα στατιστικά χαρακτηριστικά των δεδοµένων µας. Επαγωγική Ανάλυση: Συστηµατική, διαρθρωτική προσέγγιση για την εξαγωγή γενικών συµπερασµάτων (που δεν περιορίζονται στο δείγµα που χρησιµοποιούµε). Εκτίµηση παραµέτρων (που ορίζονται από το πρόβληµα που έχουµε). Έλεγχοι στατιστικών υποθέσεων. Στατιστική υποδειγµατοποίηση. ηµιουργία προβλέψεων. 4
Παραδείγµατα ειδών ανάλυσης Παράδειγµα #1. Σύγκριση του µέσου ετήσιου ρυθµού µεταβολής των εισαγωγών, ανά κλάδο παραγωγής, της Ελλάδας, της Κύπρου, της Βουλγαρίας, της FYROM, της Ισπανίας και της Πορτογαλίας. έλεγχος ισότητας µεταξύ των µέσων, ανάλυσης διακύµανσης και συνδιακύµανσης. Παράδειγµα #2. Ανάλυση της εξάρτησης µεταξύ του είδους της επιχείρησης και της τοποθεσίας της για τις επιχειρήσεις της πολιτείας της Νέας Υόρκης. πίνακας συνάφειας και έλεγχος ανεξαρτησίας. Παράδειγµα #3. Εκτίµηση της ιστορικής, και πρόβλεψη της µελλοντικής, τάσης µεταβολής των τιµών αγοράς πρώτης κατοικίας ανά γεωγραφικό διαµέρισµα στο ΗΒ. εκτίµηση γραµµικής τάσης και εποχικότητας µέσω παλινδρόµησης. 5
Υποθέσεις και περιορισµοί στην ανάλυση Μετά την διαρθρωτική παρουσίαση του προβλήµατος και την πρώτη πρόταση για την επίλυσή του πρέπει να αναρωτηθούµε για τους πιθανούς περιορισµούς σχετικά µε την συµβατότητα των δεδοµένων µας µε το είδος της ανάλυσης που θέλουµε να κάνουµε. Παράδειγµα #1: έλεγχος ισότητας µεταξύ των µέσων, ανάλυσης διακύµανσης και συνδιακύµανσης. Πιθανοί περιορισµοί: ισχυρή αυτοσυσχέτιση στις χρονολογικές σειρές των ρυθµών µεταβολής, συσχέτιση µεταξύ των χωρών του δείγµατος. Παράδειγµα #2: πίνακας συνάφειας και έλεγχος ανεξαρτησίας. Πιθανοί περιορισµοί: µη αντιπροσωπευτικό δείγµα, «επιλογή δείγµατος». Παράδειγµα #3: εκτίµηση γραµµικής τάσης και εποχικότητας µέσω παλινδρόµησης. Πιθανοί περιορισµοί: ακατάλληλο υπόδειγµα για ανάλυση χρονοσειρών (δες αυτοπαλίνδροµο υπόδειγµα), προβλήµατα στασιµότητας. 6