Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια Αθήνα, 6-4-7 Γραμμικά Μοντέλα Λύσεις Ασκήσεων η Άσκηση: (α) Eίναι η σχέση μεταξύ των δύο μεταβλητών γραμμική; Διάγραμμα Διασποράς Για το Υψόμετρο & τις Αρνητικές Τιμές Θερμοκρασίας σε Ένα Έτος Lnear Regresson rnt Thermok = -47,6 +,7 * X R-Square =,97 75 rnt Thermok 5 5 5 5 75 Ypsometro UΕντολές για Uτο SPSS: Graphs-Interactve-Scatterplot: (a) ssgn Varables: rnt Themok (b)ft-regresson-include constant, (c) Chart Ttle... Ypsometro Κάνοντας χρήση του Διαγράμματος Διασποράς, διαπιστώνουμε την ορθότητα της υπόθεσης που έχουμε κάνει, ότι, δηλαδή, η σχέση των δύο μεταβλητών είναι γραμμική και μάλιστα θετική, καθώς όσο αυξάνεται η X (Υpsometro) τόσο αυξάνεται και η Υ (rnt. Thermok). Μάλιστα φαίνεται ότι τα σημεία (X, Y ) βρίσκονται «κοντά» σε μία ευθεία, π.χ. την Y = β + βx, οι τιμές της Χ και της Υ αυξάνονται πρός την ίδια κατεύθυνση. (β) Σημειακές εκτιμήσεις των παραμέτρων β, β :
U X Y (X X X U UΥπολογισμός αθροισμάτων U Y U 3 3 5 9 345 5 36 3996 3 38 4636 4884 3 43 5676 744 38 53 734 944 4 5 7384 64 56 63 988 4336 67 73 9 7889 U95 U U95 U385 ΣΧ =368 ΣY =59 ΣΧ Y =7677 ΣΧ = 95 Χ μέσος = 368/ = 368 Y μέσος = 59/ = 5,9 U U(X -368) -368) -368 3544-38 4-58 66564-48 94-48 34 44 5 74 9 36864 3 94 58 U33874 79696 όπου 79696=Σ(X-368) =S XX και S XX =89,76 Αντικατάσταση των αθροισμάτων στους επόμενους δύο τύπους υπολογισμού των εκτιμητριών β και β. n YX Y X nx ( ( X )) (7677) (368)(59),7 (95) (368) 59 368 Y X, 7( ) 47,57 Άρα, έχουμε: Y 47,57,7X Ερμηνεία των εκτιμητών: Ο, 7 δίνει την κλίση της γραμμής παλινδρόμησης και δηλώνει ότι: αν αυξηθεί το υψόμετρο κατά μέτρα, ο αριθμός των ημερών με αρνητική θερμοκρασία θα αυξηθεί κατά επτά ημέρες!
Ο 47,57. Αν το υψόμετρο είναι μηδέν (βρισκόμαστε, δηλαδή, στο επίπεδο της θάλασσας), τότε δεν υπάρχουν μέρες με θερμοκρασία κάτω του μηδενός. UΕντολές για Uτο SPSS: nalyze Regresson Lnear: Dependant: rnt Themok Independent: Ypsometro Statstcs: Estmates, Confdence Intervals, Model Ft, R-Squared Change Contnue Plots: Y: XIY, X: ZRESID x Hstogram x Normal probablty plot Contnue Save: Predcted Values Resduals Unstandardzed Unstandardzed Standardzed Standardzed Contnue (γ) Το 95% Δ.Ε. της κλίσης της ευθείας δίνεται παρακάτω: t ( ) n, a/ όπου το τυπικό σφάλμα του δίνεται παρακάτω, δεδομένου ότι: SSE 5,546 Se 8,78 4,33 : n 8 S S 8,78 4,33 S 89,73 89,73 e ( X X ),5 Y Y Y ( 47,57, 7 X ) ( Y Y) e Y Y e 3 5,536 6,74694 45,5 9 8,87357,643,5985 36 33,88,788 7,73853 38 4,833-3,833,334 43 48,443-5,443 9,434 53 5,7689,38,53398 5 55,66533-3,66533 3,43464 63 65,875 -,875 7,85548 73 73,76787 -,76787,58964 94,47 5,9579 35,4893 59 5,536 6,74694 SSE=5,546 Αθροίσματα 95% Δ.Ε.: t ( ),7,36*,5 [, 6...,8] n, a/ S 3
Το σχόλιο που μπορούμε να κάνουμε για τον αντίστοιχο στατιστικό έλεγχο είναι: Η : β = Η : β > Δεδομένου ότι το μηδέν δεν περιλαμβάνεται στο 95% διάστημα εμπιστοσύνης, μπορούμε να συμπεράνουμε ότι η μηδενική υπόθεση απορρίπτεται, ή εναλλακτικά ότι η εκτίμηση της κλίσης της ευθείας θα είναι πάντα θετική! (δ) Ο παρακάνω πίνακας μας πληροφορεί ότι η παλινδρόμησή μας υποδηλώνει την έντονη γραμμική σχέση που υπάρχει μεταξύ «υψομέτρου» και «αριθμού ημερών με αρνητικές θερμοκρασίες, στη διάρκεια ενός έτους», η οποία είναι και στατικά σημαντικά (α=5%). Μάλιστα, η τιμή του Sg. μας πληροφορεί ότι η έντονη γραμμική σχέση που περιγράφεται από το υπόδειγμά μας, ισχύει για κάθε επίπεδο στατιστικής σημαντικότητας! NOV Υπόδειγμα Αθρ. Τετραγ β ε Μέσα Τετραγ F Sg. Παλινδρόμη SSR = 478,645 k-= SSR/(k-) = ση 478,645,484, Κατάλοιπα SSE = 5,55 n-=8 SSE/(n-) = 8,78 Σύνολο SST = 438,9 n-=9 (δ) Τα 9% διάστηματα μέσης πρόβλεψης του Υ για Ε(Υ)=β + β Χ, όπου: ) Χ =5 ( X X) (β + βχ ) tn, a/* S n S (5 368) ( 47,57,7*5),86*4,33 89,73 (57,843) 35, 67 (,7.... 93, 55) SSR ό... S 4,33 n XX ) Χ =: Για υψόμετρο μέτρα δεν μπορούμε να κάνουμε πρόβλεψη γιατί η τιμή αυτή δεν είναι μέσα στο εύρος γνωστών υψομέτρων (-95) για τα οποία ισχύει το γραμμικό υπόδειγμα. 4
η Άσκηση: (α) UΠίνακες Megetho s Συσχέτιση Megethos Kostos Pearson Correlaton,995(**) Sg. (-tal.), N Kostos Pearson Correlaton,995(**) Sg. (δικατλ. κριτήρ.), N ** Correlaton s sgnfcant at the. level (-taled). UΕρμηνείαU:Ο συντελεστής συσχέτισης μετρά το βαθμό της γραμμικής συσχέτισης των μεταβλητών Χ & Υ. Υπάρχουν ενδείξεις έντονης γραμμικής σχέσης (r=,995) μεταξύ των δύο μεταβλητών. Όταν αυξάνει το Megethos αυξάνει και το Kostos. Ο συντελεστής συσχέτισης είναι στατιστικά σημαντικός ακόμη και σε α=%, εφ όσον το Sg.=,. NOV Υπόδειγμα Άθρ. Τετραγ=SS β.ε Μέσα Τετράγ=ΜS F Sg. Regresson SSR=9,5 ΜSR ν =k-= =9,5 F = 76,633, Resdual SSE=3,73 ν =n-k=8 ΜSE=,384 Total SST=99, 5 n-=9 n SSR ( Y Y ) SSR / n Σχόλια SSE ( Y Y) SSR F k k =αριθ. MSR= SSE / k- n ανεξαρ. nk SST ( Y Y ) SSE μεταβ. MSE SSR n k ~F,n- F, SSE nk UΕρμηνείαU: Αν Sg. F ν, ν, α <.5, τότε η Ηο απορρίπτεται, δηλ. οι μεταβλητές Χ και Υ είναι γραμμικά συσχετισμένες. Άρα, μπορούμε να κατασκευάσουμε έναν έλεγχο για την υπόθεση Η :β =. Η Η θα απορρίπτεται όταν η παραπάνω στατιστική συνάρτηση λαμβάνει μεγάλες τιμές, δηλαδή, όταν: με αντίστοιχο p-value: F SSR / F ν,, SSE / 5
( SSR p value F ) F, n SSE /( n ) Πληροφορίες Υποδείγματος Change Statstcs Mode l Διορθ ωμένο Τυπ. Σφάλ. Durbn- R R R Εκτιμ. F df df Sg. Watson,995,99,988,6975 76,633 8,,377 R =( R) ( R ) /( n ) Radj [ ] n k Εκτιμήσεις Παραμέτρων Τυποποι ημένοι Εκτιμητέ Εκτιμητές ς Τυπικό Mode Σφάλμ B α Beta t Sg. (Constant), Megethos 95% Confdence Interval for B Lower Bound Upper Bound,43,598,3,4,76,88,7,995 7,58,,7,4 beta ( / ) SX SY 6
BROS (β) Να σχολιάσετε τα παρακάτω διαγράμματα Frequency 3 Hstogram Dependent Varable: Kostos Τα διάγραμμα παραπλεύρως είναι ένα ιστόγραμμα των τυποποιημένων καταλοίπων με την υπέρθεση μιας διαγώνια κανονικής. καμπύλης. UΣχόλιοU:Η κατανομή δεν φαίνεται να ακολουθεί πιστά την κανονική κατανομή. Θα πρέπει να αυξήσουμε τα δεδομένα μας. - - Mean =,6E-5 Std. Dev. =,943 N = Regresson Standardzed Resdual 3 η Άσκηση: (α) Να διερευνήσετε διαγραμματικά και να σχολιάσετε αν και πως συμμεταβάλλονται οι δυο μεταβλητές. Το παρακάτω διάγραμμα ελέγχει κατά πόσο ισχύει η ορθότητα της υπόθεσης, ότι η σχέση των δύο μεταβλητών μας είναι γραμμική. Καθώς αυξάνεται η X (Ypsos), αυξάνεται και η Υ (Baros). Διγάγραμμα Διασποράς Για το Μέγεθος & την Αξία ενός Αντικειμένου Τα σημεία (X, Y ) βρίσκονται «κοντά» σε μία ευθεία. 9, Lnear Regresson 85, BROS = 44,34 +,47 * YPSOS R-Square =,6 8, 75, 7, 6, 7, 8, YPSOS (β) Αναζητούμε το β που ελαχιστοποιεί το σφάλμα και συγκεκριμένα ελαχιστοποιεί το άθροισμα των τετραγώνων της Q, που δίνεται παρακάτω: 7
Y X ί... ό Y X έ... ί... ό e Y Y ά e Y Y Y X Q n n n ( ) ( ( )) MET mn Q ά...... e Q / n n n n n Y X YX Y X YX Y X X X X ( ( )) ή YX Y X 34799-7,89*(78,56),9 X X X 57494-78,56*(34) (γ) Ο συντελεστής (-R ) εκφράζει: Το ποσοστό (39,8%) της μεταβλητότητας της εξαρτημένης μεταβλητής Υ που δεν ερμηνεύεται από την ερμηνευτική μεταβλητή Χ. R SSR = R, 6,398 SST X Y UX UY UX*Y U(X-78,56) U(X-78,56) 7 58 89 3364 986-8,56 73,736 7 6 9584 36 3-6,56 43,336 73 67 999 4489 59-5,56 3,936 75 7 365 584 6-3,56,6736 76 65 3976 45 44 -,56 6,5536 77 8 339 656 4337 -,56,4336 78 73 3684 539 994 -,56,336 78 74 3684 5476 37 -,56,336 78 73 3684 539 994 -,56,336 78 68 3684 464 4 -,56,336 79 76 34 5776 364,44,936 8 68 34 464 4,44,736 8 8 34 64 44,44,736 8 7 34 49 6,44,736 8 85 34 75 53,44,736 8 7 334 54 9 3,44,8336 87 85 34969 75 5895 8,44 7,336 9 86 3648 7396 646,44 54,7536 34 3 57494 96768 34799 -,8 46,4448 78,556 7,8889 =Μέσοι 8
(δ) Να εκτιμήσετε τη Διακύμανση του σφάλματος. H εκτίμηση του σ ε δίνεται από το S e : n ( Y Y) SSE Se = [SSE/(8-)] = 8,97 = MSE n n e Ue -3,9596 5,334747-4,486,798987,3639,58663 3,679 3,478376-4,66,637879,69,35763,8364,6783885,8364 3,356685,8364,6783885-4,7636 7,449885,549 6,45738388-6,7446 45,447893 5,5854 7,65493-4,7446,484493,5854 5,37649-6,3656 39,776993,868,6446 -,8495 8,97643 45,75333=Σ e =SSE (ε) Να ελέγξετε τη στστιστική σημαντικότητα του συντελεστή παλινδρόμησης, σε α=%. T Η :β = Η :β >, 83 4,9 t,9 6,.5 S, 6 Άρα, η μδενική υπόθεση απορρίπτεται. Δηλαδή, το β δεν είναι μηδέν. Αντίθετα, το β παίρνει θετικές τιμές. Σχόλια για το αντίστοιχο Δ.Ε.: Δεδομένου ότι δεν γίνεται δεκτή η μηδενική υπόθεση, δηλ. απορρίπτεται, συμπεραίνουμε ότι το 99% Δ.Ε. δεν περιλαμβάνει το μηδέν. Επιπλέον, δεν θα υπάρχει αρνητική τιμή στο διαστημα αυτό! 9