qwφιertyuiopasdfghjklzxερυυξnmηq σwωψerβνtyuςiopasdρfghjklzxcvbn mqwertyuiopasdfghjklzxcvbnφγιmλι qπςπζαwωeτrtνyuτioρνμpκaλsdfghςj klzxcvλοπbnαmqwertyuiopasdfghjklz ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕ ΙΑΣΜΟΥ & xcvbnmσγqwφertyuioσδφpγρaηsόρ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ωυdfghjργklαzxcvbnβφδγωmζqwert ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ λκοθξyuiύασφdfghjklzxcvbnmqwerty ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ENATO uiopaβsdfghjklzxcεrυtγyεuνiιoαpasdf ΘΕΩΡΙΑΣ-ΕΤΕΡΟΣΚΕ ΑΣΤΙΚΟΤΗΤΑ (HETEROSCEDASTICITY) ghjklzxcηvbnασφδmqwertασδyuiopa sdfασδφγθμκxcvυξσφbnmσφγqwθeξ Θεοδωρόπουλος Χρήστος τσδφrtyuφγςοιopaασδφsdfghjklzxcv Σολοβιώβ Γκέρµαν ασδφbnγμ,mqwertyuiopasdfgασργκο ϊτbnmqwertyσδφγuiopasσδφγdfghjk lzxσδδγσφγcvbnmqwertyuioβκσλπp asdfghjklzxcvbnmqwertyuiopasdγαε ορlzxcvbnmqwertyuiopasdfghjkαεργ
Συµπεράσµατα και διαδικασία λύσης της άσκησης lesson11salary Άσκηση lesson11salary 1) Μέσω Graphs - Scatter Simple φτιάξαµε το γράφηµα για να δούµε αν έχει ετεροσκεδαστικότητα. Στο Y (εξαρτηµένη) βάλαµε Average Salary και στο x (ανεξάρτητη) Average hourly wage euro τυχαία. Έχουµε το ακόλουθο σχήµα: Συµπέρασµα: παρατηρούµε ότι οι µεταβλητές ακολουθούν ένα συγκεκριµένο πρότυπο, δηλ. υπάρχει ετεροσκεδαστικότητα. Επειδή δεν µπορούµε να ξέρουµε ποια µεταβλητή δηµιουργεί την ετεροσκεδαστικότητα, βάλαµε τυχαία µια ανεξάρτητη µεταβλητή την Average hourly wage euro. 2) Για να τρέξουµε το υπόδειγµα ακολουθούµε τα ακόλουθα βήµατα: Analyze- Regression- Linear. Στο Y (εξαρτηµένη) βάλαµε Average Salary και στο x (ανεξάρτητη) 2
βάζουµε όλες τις άλλες. 3
Απ το πίνακα Correlations βρίσκουµε τον συντελεστή συσχέτισης µεταξύ των µεταβλητών. Παρατηρούµε ότι οι µεγαλύτερες συσχετίσεις υπάρχουν ανάµεσα στα: α) Average starting yearly earnings(ανεξαρτητη) και Average Salary (εξαρτηµένη) που είναι 0,815. β) Average highest grade of school completed (ανεξαρτητη) και Average hourly wage euro (ανεξαρτητη) που είναι 0,873. 4
Επειδή από τον πίνακα Coefficients o συντελεστής διόγκωσης (VIF) είναι ίσος µε 14,103 για την µεταβλητή Average hourly wage euro, έχουµε πρόβληµα πολυσυγγραµικότητας (υπερβαίνει το 10). ιαπίστωση της ετεροσκεδαστικότητας µε τον έλεγχο Goldfeld-Quandt Για να διαπιστώσουµε την ετεροσκεδαστικότητα, θα κάνουµε τον έλεγχο Goldfeld-Quandt, ο οποίος ισχύει για µικρά δείγµατα. Ακολουθούµε τα 4 βήµατα: 1. Κατατάσσουµε τις παρατηρήσεις σύµφωνα µε την τάξη µεγέθους των τιµών µιας µεταβλητή που εµφανίζει το πρόβληµα. ηλ. έχουµε: Για την µεταβλητή Average hourly wage euro (salaryperh) µέσω του Data- Sort Cases και στο Sort order Επιλέγουµε το Ascending (για αύξουσα ταξινόµηση).- ok 2. Επιλεγούµε αυθαίρετα C=Ν/4 κεντρικές τιµές που παραλείπουµε. ηλαδή έχουµε 78/4 18 και διαγράφουµε 18 αριθµούς στο διάστηµα από 30 έως και 47 (όλες τις µεταβλητές). 3. ηµιουργούνται 2 οµάδες στις οποίες εκτιµούµε τα αντίστοιχα υποδείγµατα OLS ηλ. ηµιουργούµε 2 νέα φύλλα SPSS, όπου σε ένα φύλλο θα περάσουµε την 1 η οµάδα, που θα περιέχει παρατηρήσεις 1έως 30 για όλες τις µεταβλητές µέσω copy-paste. Στο άλλο φύλλο θα 5
περάσουµε την 2 η οµάδα, που θα περιέχει παρατηρήσεις 31έως 60 για όλες τις µεταβλητές µέσω copy-paste. Για να τρέξουµε όµως το υπόδειγµα για κάθε οµάδα, πρέπει πρώτα να βγάλουµε τις µεταβλητές που είναι Σ.Μ.Σ.( αυτές µε το µεγαλύτερο p-value >10%) που φαίνονται από τον πίνακα Coefficients. Βγάζοντας ανά µια τις Σ.Μ.Σ. µεταβλητές τελικά καταλήγουµε σε ένα υπόδειγµα µε 5 ανεξάρτητες µεταβλητές. Average Salary= F (Average hour wage, Average Starting yearly earning, Average yearly nonincome, Average age of dependent, Average highest grades of school) Τρέχουµε το υπόδειγµα (µέσω Analyze- Regression- Linear) για κάθε οµάδα και παίρνουµε από τον πίνακα ANOVA το συνολικό άθροισµα τετραγώνων των υπολοίπων. 4. Εκτελούµε τον παρακάτω έλεγχο ηλ. η διακύµανση της 2 ης οµάδας / την διακύµανση της 1 ης οµάδας. Πίνακας ANOVA για την 1 η οµάδα: Σε i 2 =6788083,998 N 1 =30 Κ=5 Πίνακας ANOVA για την 2 η οµάδα: 6
2 Σε i =2970744,744 N 2 =30 Κ=5 Αντικαθιστούµε στον τύπο F και βγάζει το αποτέλεσµα 0,437. Το συγκρίνουµε µε την F κατανοµή. F 0,05, 24, 24 =1,98. Ηο: σ 2 1= σ 2 2 Vs H 1 : σ 2 1 σ 2 2 Το F=0,437 < 1,98 οπότε έχουµε αποδοχή της H 0 δηλαδή οι διακυµάνσεις είναι ίσες, οπότε δεν υπάρχει ετεροσκεδαστικότητα. Παρατήρηση: σε περίπτωση που είχαµε ετεροσκεδαστικότητα, θα έπρεπε µε την µέθοδο Weighted least Squares (WLS) να περάσουµε την µεταβλητή αυτή που παρουσιάζει την ετεροσκεδαστικότητα στο αντίστοιχο κελί WLS weight από την εντολή Analyze- Regression- 7
Linear όπως φαίνεται παρακάτω: 8