Όταν ένα μέγεθος είναι αδύνατο να ποσοτικοποιηθεί αλλά πρέπει οπωσδήποτε να χρησιμοποιηθεί σε ένα υπόδειγμα προσεγγίζεται συνήθως με μια μεταβλητή η οποία ονομάζεται ποιοτική μεταβλητή ή ψευδομεταβλητή. Π.χ. Το φύλο ενός ατόμου, το επάγγελμά του, η εθνικότητα μιας οικογένειας κ.λ.π. Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές
Ποιοτικές μεταβλητές που επιδρούν στην σταθερά της συνάρτησης Παράδειγμα: Θέλουμε να διερευνήσουμε αν το ύψος των μισθών σε ένα κλάδο διαφέρει ανάμεσα σε άντρες και γυναίκες. Σύμφωνα με την θεωρία ένας από τους βασικότερους προσδιοριστικούς παράγοντες είναι ο χρόνος προϋπηρεσίας Τα στατιστικά στοιχεία αναφέρονται σε ένα αριθμό εργαζομένων όπου για κάθε εργαζόμενο έχουμε πληροφορίες για τον τον μισθό του, το χρόνο προϋπηρεσίας και το φύλο. Το πρόβλημα είναι η δημιουργία μιας μεταβλητής που θα εκφράζει το φύλο WAGE = β β1exper β GENDER μισθοί προϋπηρεσία φύλο
1 GENDER = Αν είναι άντρας Αν είναι γυναίκα Όταν Όταν GENDER GENDER ( β ) EXPER β = 1 WAGE = β1 = WAGE = β β EXPER 1 ΗμεταβλητήGENDER επηρεάζει μόνο τη σταθερά της εξίσωσης και εκφράζει την διαφορά στον μισθό μεταξύ ενός άνδρα και μιας γυναίκας που όμως έχουν τον ίδιο χρόνο προϋπηρεσίας.
Y D u = β1x β Στην γενική περίπτωση του απλού υποδείγματος παλινδρόμησης ( ) β Όταν Όταν = 1 Y = β β β X D 1 = Y = β β X D 1 Ŷ ( β β ) β X Y = 1 Y = β β1x β β X Ένας συνηθισμένος έλεγχος είναι H β = H : β : 1
Στο παράδειγμα: WAGE Αν η υπόθεση = β β β 1EXPER GENDER H : β = δεν απορριφθεί Δεν υπάρχει (στατιστικά σημαντική) διαφορά στους μισθούς ανδρών και γυναικών Στην συνάρτηση WAGE 1GENDER = γ γ Ποια είναι η ερμηνεία των γ?
Παράδειγμα: WAGE = 1366, 7 19,81EXPER 55,63GENDER ( 3, ) ( 18,7 ) ( 1, 4) R R =,34 =,8 n = 46 F.5,,43 = 3. p-value =.1 Ποιος είναι ο μέσος μισθός γυναίκας χωρίς προυπηρεσία; Ποιος είναι ο μέσος μισθός άντρα με προυπηρεσία κοντά στο μέσο όρο του δείγματος (6 χρόνια); Ποια είναι η διαφορά στους μισθούς ανδρών-γυναικών με τον ίδιο χρόνο προυπηρεσίας;
Παράδειγμα: Ψευδομεταβλητές με περισσότερες από δύο κατηγορίες Θέλουμε να εξετάσουμε αν, αντί για το φύλο, το επίπεδο εκπαίδευσης του εργαζομένου επηρεάζει το ύψος του μισθού. Σύμφωνα με τα διαθέσιμα στοιχεία η εκπαίδευση του κάθε εργαζόμενου κατατάσσεται σε μια από τις τρείς κατηγορίες: (α) μέχρι και δημοτικό, (β) μέχρι και λύκειο, (γ) μέχρι και πτυχίο ΑΕΙ ή ΤΕΙ. Η βασική συνάρτηση WAGE = β β 1EXPER Αφού έχουμε 3 βαθμίδες εκπαίδευσης δημιουργούμε 3 ψευδομεταβλητές [,1]
1 μέχρι και Δημοτικό ED1 = άλλο 1 μέχρι και Λύκειο ED = άλλο 1 μέχρι και ΑΕΙ/ΤΕΙ ED = άλλο Αν εισάγουμε όλες τις ψευδομεταβλητές στην συνάρτηση θα έχουμε πρόβλημα τέλειας πολυσυγγραμικότητας. Γιατι; ΗμεταβλητήΧ που αντιστοιχεί τον σταθερό όρο μπορεί να γραφεί: X = 1 = ED ED ED 1 3 Άρα η μήτρα Χ Χ είναι ιδιάζουσα δηλαδή Χ Χ =, άρα δεν έχει αντίστροφη και επομένως το σύστημα X Xβ = XY δεν έχει λύση. Το πρόβλημα αυτό είναι γνωστό ως παγίδα των ψευδομεταβλητών.
Η λύση είναι να παραλείψουμε μία από αυτές. Η επιλογήδεν έχει επίδραση στα αποτελέσματα. Στο συγκεκριμένο παράδειγμα αποκλείουμε την ED1 Έτσι WAGE = β β β1exper βed 3ED3 ED ED ED 1 = 1 ED = ED3 = WAGE = β β1exper = ED = ED = WAGE = β ( β ) EXPER β ( β ) EXPER β3 1 1 1 = ED = ED = WAGE = β 3 1 1 1
β β 3 Η διαφορά στο ύψος του μισθού ενός εργαζόμενου με εκπαίδευση μέχρι και επίπεδο λυκείου σε σχέση με ένα εργαζόμενο, κατά τ άλλα όμοιο, αλλά με επίπεδο εκπαίδευσης μέχρι και δημοτικό (βάση) Η διαφορά στο ύψος του μισθού ενός εργαζόμενου με εκπαίδευση μέχρι και ΑΕΙ ή ΤΕΙ σε σχέση με ένα εργαζόμενο, κατά τ άλλα όμοιο, αλλά με επίπεδο εκπαίδευσης μέχρι και δημοτικό (βάση)
WAGE = β β β1exper βed 3ED3 Παραδείγματα υποθέσεων H β = H : β : 1 εν υπάρχει διαφορά στο ύψος του μισθού μεταξύ δύο εργαζομένων, που είναι κατά τ άλλα όμοιοι, αλλά το επίπεδο εκπαίδευσης του πρώτου είναι το ημοτικό και του άλλου το Λύκειο. H : β3 = H1 : β3 H H β = β3 H1 : εν υπάρχει διαφορά στο ύψος του μισθού μεταξύ δύο εργαζομένων, που είναι κατά τ άλλα όμοιοι, αλλά το επίπεδο εκπαίδευσης του πρώτου είναι το ημοτικό και του άλλου ΑΕΙ ή ΤΕΙ. : β β : β = β = H : β ή β 3 1 3 3 εν υπάρχει διαφορά στο ύψος του μισθού μεταξύ δύο εργαζομένων, που είναι κατά τ άλλα όμοιοι, αλλά το επίπεδο εκπαίδευσης του πρώτου είναι το Λύκειο και του άλλου ΑΕΙ ή ΤΕΙ. Το επίπεδο εκπαίδευσης του εργαζόμενου δεν επηρεάζει το ύψος του μισθού.
Παράδειγμα: WAGE = 114, 88, EXPER 3,1ED 99, ED3 ( 347,1 ) ( 31,1 ) ( 1,1 ) ( 5, ) R =.5,3,4,37 R =,9 n = 46 F =,8 p-value =,14 Ποιος είναι ο μέσος μισθός ατόμου με το χαμηλότερο εκπαιδευτικό επίπεδο και χωρίς προυπηρεσία; Ποιος είναι ο μέσος μισθός αποφοίτου ΑΕΙ/ΤΕΙ με προυπηρεσία κοντά στο μέσο όρο του δείγματος (6 χρόνια); Ποια είναι η διαφορά στους μισθούς ατόμων με εκπαίδευση λυκείου και δημοτικού αντίστοιχα; Ποιος είναι ο μέσος μισθός ατόμου με το εκπαιδευτικό επίπεδο ΑΕΙ/ΤΕΙ και χωρίς προυπηρεσία;
Η εποχικότητα εκφρασμένη ως ψευδομεταβλητές Παράδειγμα: Θέλουμε να εξετάσουμε αν η δαπάνη για τρόφιμα εξαρτάται από την εποχή του χρόνου (άνοιξη, καλοκαίρι, φθινόπωρο, χειμώνας). Αφού έχουμε 4 εποχές δημιουργούμε 4 ψευδομεταβλητές [,1]. S S S 3 1 = 1 Άνοιξη Άλλη εποχή 1 Καλοκαίρι = Άλλη εποχή 1 Φθινόπωρο Άλλη εποχή = S 4 = 1 Χειμώνας Άλλη εποχή
Εισάγουμε τις τρεις ψευδομεταβλητές στην εξίσωση: Food = b b S b S b S b Income u 1 1 3 3 4 Και παίρνουμε την εκτίμηση: Food = 15,3 5,4S 7,8S 4,3S,Income 1 3 ( 5,5 ) ( 7,8 ) ( 6,4 ) ( 4,1 ) (,5) Το εκτιμημένο υπόδειγμα για κάθε μία εποχή θα είναι: Χειμώνας: Άνοιξη: Καλοκαίρι: Φθινόπωρο: Food Food Food Food = 15,3, Income = 15,3 5,4,Income = 15,3 7,8,Income = 15,3 4,3,Income
Τι θα σήμαινε εάν αντί για ψευδομεταβλητές χρησιμοποιούσαμε μια μόνο μεταβλητή για την εποχικότητα ως: Άνοιξη: S Food = b b S b Income Καλοκαίρι: Φθινόπωρο: Χειμώνας: 1 = 3 4 Άνοιξη Καλοκαίρι Φθινόπωρο Χειμώνας 1 Food = b b b Income Food = b b b Income 1 Food 3 = b b b Income 1 1 Food 4 = b b b Income 1 Η υπόθεση είναι αρκετά περιοριστική: Η διαφορά μεταξύ των εποχών είναι σταθερή. Σφάλμα εξειδίκευσης;
Παράδειγμα: Περισσότερες ψευδομεταβλητές στην ίδια συνάρτηση Θέλουμε να εξετάσουμε την επίδραση του φύλου και της εκπαίδευσης WAGE = β β β1exper βed β3ed3 4GENDER Ως βάση θεωρείται ο εργαζόμενος ο οποίος αντιπροσωπεύεται με την τιμή σε όλες τις ψευδομεταβλητές. Στην συγκεκριμένη περίπτωση: Γυναίκα με εκπαίδευση Δημοτικό WAGE = β β 1EXPER
Άλλες περιπτώσεις Γυναίκα, Δημοτικό < εκπαίδευση Λύκειο WAGE ( β ) EXPER β 1 = β Άντρας, Δημοτικό < εκπαίδευση Λύκειο WAGE ( β ) EXPER β β4 1 = β
Ποιοτικές μεταβλητές που επιδρούν στην κλίση της ευθείας παλινδρόμησης Στην συνάρτηση WAGE = β β β1exper GENDER Το β επηρεάζει μόνο τον σταθερό όρο β 1 = ( WAGE) ( EXPER) β σταθερό (δεν εξαρτάται από το β ) Η διαφορά στους μισθούς αντρών και γυναικών είναι σταθερή. Δηλαδή ανεξάρτητη από τον χρόνο προϋπηρεσίας. Ποια θα είναι η μορφή της συνάρτησης αν η διαφορά αυτή εξαρτάται και από τον χρόνο προϋπηρεσίας;
WAGE = β β β1exper EXPER GENDER Όταν Όταν ( β ) EXPER GENDER = β GENDER = WAGE = β β EXPER 1 WAGE = β 1 1
Στην γενική περίπτωση της απλής γραμμικής παλινδρόμησης Y β = β β1x ( D X ) Y ( β ) 1 β X Y = β Y = β β1x β X
Όταν η ψευδομεταβλητή επηρεάζει την σταθερά και την κλίση της εξίσωσης Y β β β β = 1X D 3 ( D X ) Y ( β ) ( ) β β1 β X Y = 3 Y = β β1x β β X Μπορούμε να ελέγξουμε τις υποθέσεις β = ή β 3 = ή β =β 3 =.
Παλινδρόμηση κατά τμήματα Η σχέση που συνδέει δύο οικονομικές μεταβλητές μπορεί να είναι γραμμική αλλά να αλλάζει κλίση μετά από μια συγκεκριμένη τιμή της μεταβλητής. π.χ. Οι αμοιβές ενός καρδιοχειρουργού (Υ) αυξάνονται με ένα ρυθμό μέχρι ένα δεδομένο αριθμό επεμβάσεων και μετά αυξάνονται με υψηλότερο ρυθμό. ( * Y ) = b bx 1 b X X D u Όπου X * ητιμήστηνοποίαεπέρχεταιημεταβολή, D = 1 εάν X > X * D = εάν X X * D = 1 D = ( *) ( 1 ) Y = b b X b b X u Y = b bx u 1
D = 1 D = Παλινδρόμηση κατά τμήματα ( *) ( ) 1 Y = b b X b b X Y = b bx 1 Y b X * X
Παράδειγμα Χ Υ 5 1, 6 1,3 7 1,7 8, 9,7 1 3,6 11 4,9 1 6, 13 7,6 14 8,9 = 4,49,893 X R =,938 Y (,81 ) (,81 ) Επέρχεται μεταβολή όταν Χ*=9; D = 1 D = ( ) (,59 ) (,35 ) (,55) =,911,373,9 9 D R =,998 Y X X ( ) Y =,911,373 X,9 X 9 = 9,9 1,75X Y =,911,373X Y 9 X
Έλεγχος Chow Έλεγχος μεταβολής στη δομή του υποδείγματος Οι συντελεστές του υποδείγματος είναι διαφορετικοί σε διαφορετικές περιόδους. Το υπόδειγμα εκτιμάται ξεχωριστά για την κάθε περίοδο Το υπόδειγμα εκτιμάται για ολόκληρη την περίοδο ( ESSR ESSU) k F = ESS n k U ESS U = ESS 1 ESS ESS R Εάν F > Fakn,, k απορρίπτουμε την H ότι δεν υπάρχει μεταβολή στην δομή του υποδείγματος.
Παράδειγμα: Έστω τα στοιχεία κατανάλωσης και εισοδήματος. D = D =1 D = ή 1 ESS U = ESS R F = 879,65,711 I R,99 C= = ( ) ( ) 3745,3,17 ESS =65167148 ( ) ( ) D= 1768,6,741 I R,98 C= = ( ) ESS ESS k R ESS n k U 1117,86,3 ESS =116963786 ( ) ( ) D= 1 3958,,734 I R,997 C= = U 99,1,7 ESS =498876 ESS ESS = 3813934 D= D= 1 = 498876 F = 1,373 < F = 3,44,5,, ( ) 3813934 ( 6 ) 498876 3813934 = = 1,373 R Έτος C I D 196 1788 1179 1961 115147 158 196 15 1347 1963 16115 1435 1964 13719 155657 1965 14777 171643 1966 157687 18685 1967 16758 193 1968 1795 4331 1969 1989 1966 197 6813 484 1971 1839 65555 197 33551 93181 1973 51369 37993 1974 5351 39644 1975 66884 39598 1 1976 8166 3547 1 1977 9398 36673 1 1978 3164 39188 1 1979 318817 46857 1 198 319341 41477 1 1981 35851 415887 1 198 33857 41897 1 1983 33945 41838 1 1984 345194 43494 1 1985 358671 4579 1 δεχόμαστε την H ότι δεν υπάρχει μεταβολή στην δομή του υποδείγματος
Έλεγχος με χρήση ψευδομεταβλητών Αρχικό υπόδειγμα Y = β β β1x1 X Θέλουμε να εξετάσουμε την περίπτωση δομικής μεταβολής στο υπόδειγμα μετά από μια συγκεκριμένη χρονική στιγμή. Δημιουργείται μια ψευδομεταβλητή D η οποία παίρνει την τιμή για το διάστημα πριν από τη συγκεκριμένη χρονική στιγμή και την τιμή 1 για την υπόλοιπη χρονική περίοδο. Αν υποθέσουμε ότι όλοι οι συντελεστές μεταβάλλονται Y u = β b D β1x1 b1 DX1 β X bdx Το πλεονέκτημα της μεθόδου αυτής σε σχέση με τη προηγούμενη είναι ότι μας δίνει τη δυνατότητα να ελέγξουμε την μεταβολή μέρους των συντελεστών.
Έλεγχος με χρήση ψευδομεταβλητών Το εκτιμημένο υπόδειγμα για την περίοδο D= θα είναι: Y = β β X β X 1 1 Το εκτιμημένο υπόδειγμα για την περίοδο D=1 θα είναι: Y = β b β X bx β X b X 1 1 1 1 ( β ) ( β ) ( β ) Y = b b X b X 1 1 1 Αν ελέγξουμε την υπόθεση Η : b = b = b = 1 και δεν απορρίψουμε την Η, ισοδυναμεί με απόρριψη της υπόθεσης ότι υπάρχει μεταβολή στην δομή του υποδείγματος.
Παράδειγμα: Έστω τα στοιχεία κατανάλωσης και εισοδήματος. C= b bd b I bd I v 1 3 C = 879,65 6511,D,711I.31 D I ( 3455,9 ) ( 1449,3 ) (,16 ) (,38 ) R =,997 ESS =3813935 U = 3958,,734 I R =,997 C ( ) ( ) 99,1,7 ESS =498876 ESSR ESSU 498876-3813935 F = k m = 4 = 1,373 ESSU 3813935 n k 6 4 F = 1,373 < F = 3,44,5,, R Έτος C I D 196 1788 1179 1961 115147 158 196 15 1347 1963 16115 1435 1964 13719 155657 1965 14777 171643 1966 157687 18685 1967 16758 193 1968 1795 4331 1969 1989 1966 197 6813 484 1971 1839 65555 197 33551 93181 1973 51369 37993 1974 5351 39644 1975 66884 39598 1 1976 8166 3547 1 1977 9398 36673 1 1978 3164 39188 1 1979 318817 46857 1 198 319341 41477 1 1981 35851 415887 1 198 33857 41897 1 1983 33945 41838 1 1984 345194 43494 1 1985 358671 4579 1 δεχόμαστε την H ότι δεν υπάρχει μεταβολή στην δομή του υποδείγματος