Πρόβλημα ΚΕΦΑΛΑΙΟ Πολλαπλή Γραμμική Παλινδρόμηση Μωυσιάδης Χρόνης 6 o Εξάμηνο Μαθηματικών Για αγορά οθόνης για υπολογιστή ψάξαμε στην αγορά και πήραμε τα στοιχεία του πίνακα Ερωτήματα Έχει σχέση η τιμή με το μέγεθος ; με το ρυθμό εστίασης ; Κωδικοποιούμε Ζ= μεγάλη Ζ= κανονική Τύπος - Κατασκευή Υπάρχει συνάρτηση ; f X, Z ή f X, Z Ρυθμός Εστίασης Χ Μέγεθος Z Τιμή δρχ Υ Soy CPD-7 5.5 Κανονική 6 Nec 5FGe 9.5 Κανονική 6 SuperMac Plus Μεγάλη 7 Ikeg CT-D 55 Μεγάλη 77 Mtsubsh 7 Κανονική 6 E-Mashes E 5 Μεγάλη 5 Soy GDM 57.5 Μεγάλη Nao F55 5.5 Κανονική 96 SuperMac 7T 7.5 Κανονική 75 Radus v 7 Μεγάλη Ειδικότερα υπάρχουν σταθερές ; b + b X + b Z Γενικό Γραμμικό Μοντέλο Μετασχηματισμοί μοντέλων ΔΕΔΟΜΕΝΑ Προβλέπουσες μεταβλητές predctor ή ανεξάρτητες ΜΟΝΤΕΛΟ X Άγνωστες παράμετροι που ζητείται να εκτιμηθούν X X X k k y k y k y... k k Εξαρτημένη μεταβλητή ή απόκριση respose X X X το σφάλμα ε που απαιτείται να είναι «μικρό» Πολυωνυμικά z z Εκθετικά y y k... k y Θέτουμε X l, X l, l y, l,,, l Θέτουμε =X, =X, log y= B y Ae e Θέτουμε =X, =X,, k =X k Θέτουμε =X, =X, z=x, z =X γραμμικό ; ΔΕΝ ΑΝΑΓΟΝΤΑΙ ΣΕ ΓΡΑΜΜΙΚΑ Παράδειγμα 5 Απάντηση 6 Για τη μελέτη της τάσης δοκών που σχηματίζουν γωνία θ με το έδαφος ισχύει ο τύπος του akso ff f f c c c f c όπου fc, f c άγνωστες αλλά σταθερές τάσεις που πρέπει να προσδιορισθούν. Ένας ερευνητής έκανε μετρήσεις της που αντιστοιχούν στις γωνίες,,,...,. Μετασχηματίστε τον τύπο του akso και τα δεδομένα έτσι ώστε ο προσδιορισμός των σταθερών που ζητούνται να πετυχαίνεται με γραμμικό μοντέλο. f f Ο τύπος του akso γράφεται fc f c f c f fcf c f c fc fc άρα θέτοντας y f f πετυχαίνεται το γραμμικό μοντέλο. y Τα Δεδομένα γίνονται θ.. θ f f f. f y y. y. f c c c όπου y f
Σύστημα εξισώσεων 7 Μέθοδος Ελαχίστων Τετραγώνων Εφαρμόζοντας το ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ X X... k X k στα δεδομένα παίρνουμε το σύστημα Εύρεση των β ώστε το άθροισμα να είναι ελάχιστο Συμβολίζουμε τις λύσεις διαβάζουμε β εκτιμώμενο y... k k y... k k...... y... k k ΖΗΤΟΥΜΕΝΟ: ΚΑΛΥΤΕΡΗ ΔΥΝΑΤΗ ΠΡΟΣΑΡΜΟΓΗ Δηλαδή εύρεση των συντελεστών β με τρόπο ώστε οι ισότητες να προσεγγίζονται περισσότερο ΥΠΑΡΧΟΥΝ ΚΑΙ ΑΛΛΕΣ ΜΕΘΟΔΟΙ ΕΥΡΕΣΗΣ ΒΕΛΤΙΣΤΩΝ β ΜΟΝΤΕΛΟ ΠΡΟΒΛΕΨΗΣ... X X X k k Παρατηρήσεις: ΕΔΩ ΔΕΝ ΕΧΟΥΜΕ TO ΣΦΑΛΜΑ ε. ΤΟ Ŷ ΛΕΓΕΤΑΙ ΕΚΤΙΜΩΜΕΝΟ Η ΔΙΑΦΟΡΑ y ΕΙΝΑΙ ΤΟ ΣΦΑΛΜΑ ΜΕΤΑ ΤΗΝ ΠΡΟΣΑΡΜΟΓΗ ΤΟΥ ΣΥΓΚΕΚΡΙΜΕΝΟΥ ΜΟΝΤΕΛΟΥ Προβλέψεις - Σφάλματα 9 Με μορφή Πινάκων Πρόβλεψη στα δοθέντα σημεία ΘΕΤΟΝΤΑΣ y... k k y... k k...... y... k k Σύμφωνα με τη μέθοδο ελαχίστων τετραγώνων, πρέπει να ισχύει: y y να είναι ελάχιστο yy y y... y y ΥΠΟΛΟΙΠΑ resduals Για τον υπολογισμό ΑΛΓΕΒΡΑ ή ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ; y k y k X y k k προκύπτει το μοντέλο X Προϋποθέσεις Υπολογισμοί E E E E Τα σφάλματα έχουν μέση τιμή V E E E I Τα σφάλματα είναι ασυσχέτιστα δηλαδή όλες οι συνδιασπορές είναι Τα σφάλματα έχουν την ίδια σταθερή διασπορά σ ΖΗΤΟΥΜΕΝΟ S...,, X X X XX Ισχύει Να είναι ελάχιστο? S X XX X X X S X X XX XX Δηλαδή Χ Χ συμμετρ.
Παραγώγιση διανυσματικής συνάρτησης Δεύτερη παράγωγος διανυσμ. συνάρτ. Διανυσματική συνάρτηση f f, συμμετρικός πίνακας f c A,,..., A......, A A A,..., A Παράγωγος τετραγωνικής μορφής f f f f f Ακρότατα διανυσμ. συνάρτ. f κρίσιμο σημείο Αν f Εσσιανός πίνακας της πραγμ.συνάρτησης διανυσμ.μεταβλητής essa matr προφανώς A A αρνητ. ορισμ. πίνακας σχετικό μέγιστο θετ. ορισμ. πίνακας σχετικό ελάχιστο 5 Κανονικές εξισώσεις-εκτίμηση παραμ. Είναι και ΟΛΙΚΟ ΕΛΑΧΙΣΤΟ 6 Από τη σχέση το κρίσιμο σημείο ικανοποιεί την X X X δηλαδή Αν X Χ, τότε X X X Είναι ΣΧΕΤΙΚΟ ΕΛΑΧΙΣΤΟ Διότι ο εσσιανός πίνακας είναι ο Χ Χ που είναι θετικά ορισμένος θ.ο., διότι: X X X κανονικές εξισώσεις Αν X Χ =, τότε ισχύει XX X X X X άθροισμα τετραγώνων X X X γενικευμένος αντίστροφος S X X X X X X X X X X X X X X XX X X όμοια S X X X XX καν. εξισώσεις S Μοντέλο πρόβλεψης πίνακας «χατ» 7 Ιδιότητες εκτιμητού παραμέτρων Το μοντέλο γράφεται ή X X X... k k X X XX X X XX X Ο πίνακας λειτουργεί ως τελεστής μετατροπής του διανύσματος σε Για το λόγο αυτό λέγεται πίνακας χατ. Ŷ X XX XX XX XX XX X Ισχύει: μοναδιαίος Ο Η είναι ΤΑΥΤΟΔΥΝΑΜΟΣ. E XX XE X XX X X E XX XX E E X X X X X X E. V X X V E E E E EXX XXX X XX X EXX XXXX XX X X XX XE X XX XX XX XX X I X XX XX X XX XX XX XX XX X
Διασπορά εκτιμήσεων παραμέτρων 9 Εφαρμογή για k= Παράδειγμα κεφ. ΘΕΤΟΥΜΕ c c c ck c c c c k C X X c c c c k ck ck ck c kk ΤΟΤΕ Var c k,,,...,, j j, Cov c j k Var c,,,..., k α/α y y y ε=y-.5.5.5.5.5..79.5..5..5..579.5.5.65.65.65.67 -.7.5.5.65.5.75.67 -.7 5.5.75.5.565.75.765 -.5 6.5.5.5.75.5.765.6 7.5.95.5.95.759.765.6.5..565.6.775.9657 -.557 9.5.75.565.65.75.9657 -.57.5..565..75.9657 -.57.5.95.565.5.75.9657 -.57.5.5.565 6.5.65.9657...5. 9.5 6.5.5 -.75..9..76 6.699.5 -.5 5..5..565 6.5.5 -.75 6....769 7..5.6 7..5..5 7.5.5.76..9. 5.9.5.5.66 9.5.75 6.5.65 9.75.96979 -.979.5.9 6.5 5.9 9.5.96979 -.9.5.99 6.5 5.9 9.975.96979..5.7 6.5 6.569.75.96979. ŷ ŷ.95.7 6.55 5.76 95.55.7 -. Υπολογισμοί Χ Χ - και Χ Υ Το μοντέλο πρόβλεψης Είναι X y y όπου: X y.95 X X.95 6.55 y y y.7 X X X 95.55.6597 -.695 y y -.695.699 XX X.6597 -.695.7.7 -.695.699 95.55.6 Μοντέλο Πρόβλεψης.7.6X Var c.6597 Var c.699 Η γενική περίπτωση με k= Επαλήθευση με γνωστούς τύπους X X y X - - X X S - - y y y XX X S S y S S y y y y S y y y y y ys S S c S S S Var Var c S S y
Παρεμβολή -Πρόβλεψη y... k k,,, k Το δοσμένο Η πρόβλεψη σημείο ŷ στο σημείο αυτό k Για το παράδειγμα: Παρεμβολή στο =. Πρόβλεψη στο =..7 y,,.6 Όμοια y,.6.7755 5 Ιδιότητες της πρόβλεψης. E y E y E y E E E y Var y X X. διότι y... k k Var y E y E y E E E E V Var y X X 6 Η διασπορά στη γενική περίπτωση 7 Σφάλμα μετά την προσαρμογή -, - S - -, - S S Var y S S Για το παράδειγμα και για = Var y.6597 -.695 9.6667 Όμοια για = Var y.95, -.695.69 y y y y...... y y SSE X X X X XX X SSE = - βx X XX XX XX X X X Το σφάλμα SSE ως τετραγωνική μορφή 9 Τετραγωνικές μορφές XX X X X SSE X X X X X A I X XX X SSE = A ή AI ΩΣΤΕ: SSE είναι Τετραγωνική Μορφή με πίνακα Α διότι Α είναι συμμετρικός πίνακας. ΕΡΩΤΗΜΑ: Η SSE είναι Τυχαία Μεταβλητή Πολυδιάστατη. αφού είναι τ.μ.. Με τι κατανομή ; πίνακας χατ I τυχαίο διάνυσμα με E και V I E A A Tr A IΙ τυχαία πολυ-κανονική μεταβλητή N, I ms A c m μή κεντρική με s A Αν X N m, s τότε ο συντελεστής μη-κεντρικ. λ, της Z= X + X + + X c IΙΙ... m m είναι... m τυχαία πολυ-κανονική μεταβλητή με Αν είναι A και B ανεξάρτητες, τότε AB N m, I
Μη-κεντρική χ κατανομή Θεώρημα Cochra α. χ 5 κατανομή με 5 β.ε. β. χ 5 κατανομή μη-κεντρική με 5 β.ε. και λ=6.75 α. πυκνότητα τ.δείγματος Χ =Χ /σ +...+Χ 5 /σ Χ ~N,σ, σ =,, 5,, β. πυκνότητα τ.δείγματος Χ =Χ /σ +...+Χ 5 /σ Χ ~Nμ,σ, σ =,, 5,, μ =,,.5,.5,.5 λ=6.75..5..5..5..5 5 5 5...... 5 N, I ms και Α, =,,,k A A... Ak IV συμμετρικοί πίνακες βαθμού k και ΤΟΤΕ ΟΙ ΠΑΡΑΚΑΤΩ ΣΥΝΘΗΚΕΣ ΕΙΝΑΙ ΙΣΟΔΥΝΑΜΕΣ + + + k = A είναι ταυτοδύναμοι για όλα τα A =A A A j = για όλα τα j με A για όλα τα c A A και A ανεξάρτητες για όλα τα j j Τυπικό Σφάλμα Εκτίμηση διασποράς σφαλμάτων ΕΙΔΑΜΕ ΟΤΙ SSE A με A I Είναι X Άρα E X και E V I V I με και Δηλαδή ικανοποιούνται οι προϋποθέσεις της ιδιότητας Ι E SSE E A X A X Tr A X I X Tr A Tr I X X X X XXXX Tr I Tr X X X X X X XX Tr XX XX Tr Ik k Ώστε: ESSE k ή SSE E k Αμερόληπτος SSE s εκτιμητής της SSE s = τυπικό k διασποράς σφάλμα -k- σφαλμάτων ΤΟΤΕ Var s c,,,..., k s Var s c,,,..., k Var y s C όπου C XX c ck ck ckk Εφαρμογή στο παράδειγμα 5 6 Παράδειγμα η άσκηση.α του βιβλίου Βρίσκουμε:.7.7 SSE X 5.76.96.6 95.55 Από τον πίνακα = άθροισμα τετραγώνων των y SSE....9 SSE.96 s.697 άρα s.7 Οι διασπορές των, Οι διασπορές των προβλέψεων Var.6597 s. Var y Var.699s.7 Var y.6667 s..95 s. Χ Χ Χ Χ Υ Χ Χ Υ Χ Χ Υ Υ 9 5 7 6 66 - - 6-6 - - - - 6 5 - - 5-7 - - - - - -6 6 9 6 5 9 6 56 6 6 6 6 6 6 6 9 5 - - 5 6 - - 6-6 6 5 9 6 9 5 9 5-5 - - - - - - - 9 6 6 6
Υπολογισμοί 7 Το διάνυσμα παραμέτρων X Το Μοντέλο όπου: y,, y,, X y,,,,,, XX,,,,,,,,.,,,,,, 66 XX 66 56 6 6 æ ö ç çè-.6.. ø.75 -.95 -.6 XX - = -.95.69. æ ö æ y ö æ y ö y å X =,,, =, y å ç è øç ç y æ ö X = 5 ç çè ø å,,, çèy è, ø ø.996.5.997 XX X Το μοντέλο πρόβλεψης 9 Παράδειγμα Συστολ. πίεση αίματος προσεγγιστικά y X.5 X æ.997 ö æ ö SSE = - β X = 9-.996 5 - = 69 ç è-.5ø çèø Με την εκτίμηση των παραμέτρων απευθείας SSE 69 s.65 k SSE 6 s.97 Σε άτομα μετρήθηκε συστολική πίεση του αίματός τους y, το βάρος τους σε kgr και η ηλικία τους. Να βρεθεί γραμμικό μοντέλο που να εκφράζει τη συστολική πίεση συναρτήσει του βάρους και της ηλικίας. Να εκτιμηθεί η συστολική πίεση ατόμου 5 ετών που ζυγίζει 7 κιλά. Να βρεθεί η διασπορά των εκτιμήσεων των συντελεστών του μοντέλου και της πρόβλεψης. Οι μετρήσεις y ŷ ε 76. 9.5 5.5.5 79..5 7.5 79. 5. 75.5. 95. 9.5 5 5 6 5 55 6 7 9 5 55 7 9.5.9 7.567 5.55 7.6 9.57.7 6.6.99.56.5 56.5.65.6.59 -.567.65 -.6 -.57.7 -.6 -.99 -.56.7 -.5.55 S = 79.5 S = 959.75 S = 55 S = 95 S y = 69 S y = S y= 6.5 S y= 655 S = 67.5. 79.5 55. XX 79.5 959.75 67.5 55. 67.5 95. Το μοντέλο πρόβλεψης Τα σφάλματα μετά την προσαρμογή æ 5.956.6655.7697ö - - XX - = - ç ç- è.7697.57667.5 ø.6655.77567.57667 æ 65.9967ö æ 65.ö - - β XX X.59 -.5 = ç =ç ç è.5 ø çè.5 ø ΑΡΑ ΜΟΝΤΕΛΟ ΠΡΟΒΛΕΨΗΣ προσεγγιστικά y 65..5.5 æ 69. ö X ç 6.5 =ç ç çè655. ø SSE X 6.96 Αν χρησιμοποιήσουμε την προσέγγιση βρίσκουμε SSE=9. ενώ πραγματικό SSE=ε =6.95 SSE 6.9 s 6.9 Διαγώνιος X X 5.956,.776,.5 Άρα Var.5 s.9 Var. s.5 και s 6.9.59 Var.5 s.7
Πρόβλεψη Το άθροισμα τετραγώνων SST 7, 5 Αν 65.9967 y, 7, 5.59.5 τότε: y 9.65, 7, 5 Var y s XX 6.9, 7, 5 XX 7.59 5 s y.5 Συνολικό Άθροισμα τετραγώνων SST y y y y Επειδή J Οπότε: SST J όπου J ή SST I J Τετραγωνική μορφή Το άθροισμα τετραγώνων SSR 5 6 Κατανομή των Αθροισμάτων SSR, SSE, SST Η σχέση SSE X SSE X X X X SSR Το μέρος της συνολικής διασποράς που εξηγείται ερμηνεύεται από την παλινδρόμηση δίνει ή SSE Συνδυάζοντας: SST J SSE SST SSE J SST SSE SSR SST A SSR A SSE A ΟΠΟΤΕ: A A J X XX X J J A I I X XX X A A A ΕΡΩΤΗΜΑ: Ισχύουν οι προϋποθέσεις του Θεωρήματος Cochra; α Οι πίνακες Α, Α, Α είναι συμμετρικοί. Οι πίνακες Α, Α, Α είναι ταυτοδύναμοι 7 Οι βαθμοί των πινάκων Α, Α, Α A J J J J J J A A διότι J J J J J J J X XX X X λύνεται, διότι X X X J X X X X J X X X X XJ A J J A Η εξίσωση: A I I I A Tr A Tr J Tr J Tr A Tr - Tr J k -k Tr A Tr I Tr k όπου χρησιμοποιήθηκε Tr Tr X XX X και ισχύει β k rak A rak A rak A Tr AB Tr BA Tr XX XX Tr I k
Ισχύει το θεώρημα Cochra 9 Ο πίνακας ANOVA 5 γ Ισχύουν οι προϋποθέσεις κανονικότητας ε N, σ I Από έπεται N Xβ, σ I = Xβ+ ε ΑΡΑ ΕΧΟΥΜΕ SSR χ σ k A X I J X SSE χ σ -- k με A SST χ σ - I A X I J X όπου Πηγή Αθρoίσματα Τετραγώνων Παλινδρόμηση SSR k Υπόλοιπα Σφάλματα SSE β.ε. Μέσα Τετράγωνα Λόγος F -k- Σύνολο SST - SST SSR X SSE X ή αλγεβρικά SSR MSR k SSE MSE k - - MSR F MSE SST y y SSR y y SSE y y Διορθωτικός Παράγοντας 5 5 Εφαρμογή στο παράδειγμα της συστ. πίεσης y Αν k=, ΜΟΝΤΕΛΟ =,,, Τότε: y αφού X SSR X y y y Άρα SST=SSE Ώστε: SSR στο ΠΛΗΡΕΣ μοντέλο οφείλεται στους άλλους συντ/στές,,..., ο δεύτερος όρος στον τύπο SSR X λέγεται διορθωτικός παράγοντας 65. y 69 69 SST 6.79 SSR 65. 69. SSE SST SSR 6.79. 6.95 Πηγή Αθρoίσματα Τετραγώνων β.ε. Μέσα Τετράγωνα Λόγος F Παλινδρόμηση. 7.95.9*** Υπόλοιπα σφάλμ. 6.95 6.95=s Σύνολο 6.79 ΠΙΝΑΚΑΣ ΑΝΑΛΥΣΗΣ ΔΙΑΣΠΟΡΑΣ Το συμπέρασμα 5 Συντελεστής Προσδιορισμού 5 Η : β =β = Η : β β....6.. Σε στάθμη σημ. α Αν F>F k,-k-;α ΑΠΟΡΡΙΠΤΕΤΑΙ Αν F<F k,-k-;α ΔΕΝ ΑΠΟΡΡΙΠΤΕΤΑΙ Εδώ F>., άρα η ΑΠΟΡΡΙΠΤΕΤΑΙ F=.9 F, F,;.9,..,.5 5.6,.5 7.56,. 9.,.5. 5 6.5 SSR SST SSE R εκφράζει το ποσοστό της SSR SSE R = συνολικής διασποράς που SST = - SST ερμηνεύει το μοντέλο Σχέση των F και R SSR / k F... - k - = = = R SSE/ -k - k -R kf / -k - R = + kf / - k -
Διορθωμένος συντελεστής προσδιορισμού 55 Έλεγχοι Υποθέσεων 56 SSE / -k - s R = - = - SST / - Var Σχέση των R και R -k- - R = - -R Για το παράδειγμα της πίεσης. R = =.95 6.79 διορθωμένος συντελεστής προσδιορισμού 6.95/ R = =.99 6.79/ Το μοντέλο ερμηνεύει το 95.% της συνολικής διασποράς ΘΕΩΡΗΜΑ Gauß-Markov Αν θ=λβ όπου λ = λ είναι, λ,..., λ k γραμμικός συνδυασμός των συντελεστών παλινδρόμησης, τότε η καλύτερη γραμμική εκτίμηση του θ που είναι μοναδική είναι η θ=λβ Απαραίτητη προϋπόθεση για να εκτιμάται το θ είναι ΝΑ ΕΧΕΙ ΛΥΣΗ Η ΕΞΙΣΩΣΗ Xc=λ Αυτό συμβαίνει με βεβαιότητα αν ο Χ Χ είναι αντιστρέψιμος Θεώρημα 57 Ισχύουν 5 Αν N X β, s I θ-θ ΤΟΤΕ - s λ X X λ ΑΠΟΔΕΙΞΗ και t - k - θ=λβ θ=λβ όπου SSE s= -k- - Η τ.μ. θ=λ β = λ X X X έχει κατανομή Nμ, σ θ θ - - μ =Εθ=λ XX X E = λ XX X Cβ θ = λ β = θ s = Varθ = Eθ- θ = E θ λ β- β β- β λ = - = λv β λ=σλ CC λ θ-θ Z = N, - s λxx λ άρα από γνωστό θεώρημα της Θ.Πιθ. αν Z, W είναι ανεξάρτητες θ-θ και SSE ανεξάρτητες θ και SSE ανεξάρτητες W= χ σ SSE Z W / -k- -k- t - k - και οι δύο τ.μ. είναι τετραγωνικές μορφές της ανεξαρτησία των δύο τετραγ. μορφών 59 Έλεγχος παραμέτρων 6 SSE = I - = A θ = θθ= λ β λ β= λ β λ β= β λλ β= = X X X λλ X X X = B AB= I - X XX X X XX XX X = θ-θ - Z s λxx λ θ-θ = = t - - k - W SSE s λxx λ -k- s -k- - - - λλ ΠΟΡΙΣΜΑ Αν N X β, s I β - β t s β -k- s β æö Αρκεί λ= +-στή γραμμή ç çè ø οπότε λ β = β και τότε =s c όπου - λxx λ=c
Έλεγχος μέσης πρόβλεψης 6 Έλεγχος ατομικής πρόβλεψης 6 ΠΟΡΙΣΜΑ Αν N X β, s I τότε -μ t - -k- s s XX όπου y = Var y = - = s X X Αρκεί λ= θ= β =Ey = m διότι y = β + β +... + β + ε k k ΠΟΡΙΣΜΑ Αν N X β, s I -μ t - -k- s + X s β X διότι E - = τότε =s c όπου Var - = Var β - β+varε= - = σ + X X Μονόπλευρο ή δίπλευρο t-τεστ 6 Μονόπλευρο ή δίπλευρο F-τεστ 6 T = s ΔΙΠΛΕΥΡΟ :θ=θ :θ¹ θ -α t -k- θ-θ - λxx λ ΜΟΝΟΠΛΕΥΡΟ :θ=θ :θ>θ -α t -k- ΘΕΩΡΗΜΑ T t F = T F ΔΙΠΛΕΥΡΟ ΜΟΝΟΠΛΕΥΡΟ : β = : β ¹ F,-k- F,-k- -α -α -k-, -k- : β = : β > α/ α/ - t - t -k-;-α/ -k-;α/ - - t -k-;α α α F,-k-;α α F,-k-;α Εφαρμογή με το ο παράδειγμα 65 Έλεγχοι συντελεστών 66 β β β y =- 65.+.5 X+.5 X SSR=. SSE=6.96.9.5.7 s β s β s β =, 7, 5, = 9.5, Var =.59, s =.5 s + Var = 6.95 +.59 =..,.5 * s.769,. = s + Var =.967 t;.,.5.69,.5.57,.5 : β = : β ¹ : β = : β >.5 T = = 5..7 Η ΑΠΟΡΡΙΠΤΕΤΑΙ σε α=.5, διότι t ;α =.57<5. : β =-5 : β ¹-5.5 T = =.975.5 Η ΑΠΟΡΡΙΠΤΕΤΑΙ σε α=., διότι t ;α/ =.57<.97-65.--5 T = =..9 Η ΔΕΝ ΑΠΟΡΡΙΠΤΕΤΑΙ σε α=., διότι t ;α/ =.>.
Έλεγχοι πρόβλεψης 67 95% Διαστήματα εμπιστοσύνης 6 Για τη μέση πρόβλεψη : E =5 : E ¹ 5 : = 5 : ¹ 5 Η ΑΠΟΡΡΙΠΤΕΤΑΙ σε α=., διότι t ;α/ =.69<.7 Για την ατομική πρόβλεψη 9.5-5 T = =.7.5 9.5-5 T = =.9.967 Η ΔΕΝ ΑΠΟΡΡΙΠΤΕΤΑΙ σε α=.5, διότι t ;α/ =.>.9 β β β ΕΥ Υ β t s β ;.5 β t s β ;.5 β t s β ;.5 t Var ;.5 t s + Var ;.5 ή ή ή ή ή -9.96, -..,.9.6,.5 5.6,.679.59, 5.76 Έλεγχος της διασποράς 69 Θέμα από εξετάσεις 7 : s =5 : s ¹ 5 s SSE SSE X = = =.59 s 5 G ια α =.5, χ =.5, και χ =.5.5 < SSE <.5 s SSE SSE < s <.5.5 < s <. 9.6 ;.975 ;.5.5 χ χ ;.5 ;.975 5., 9.6 ΔΕΝ ΑΠΟΡΡΙΠΤΕΤΑΙ η Η.9 χ.5 Η στήλη y στον παρακάτω πίνακα παριστάνει τις αποκρίσεις σε ένα πείραμα, ενώ οι στήλες,, τις προβλέπουσες μεταβλητές. α/α y α/α y. 77.. 7. 79 9.6 9. 9.6 6. 6. 9 7. 6. 5.7 7. 5.5 9...5 5.9.9..5 97.9 5.9 56. 5 6. 9.5.9 9. 77 5.66 5. 6 9. 7 7. 7.6.6.7 6.5 7. 6. 7. 9..9 6. Θεωρώντας ως πίνακα D τον πίνακα που σχηματίζεται με τις στήλες y,, και,βρήκαμεότι: æ y ö æ 99. ö 9.9 5.7 67.7 6576.7.5 5.7 66777 695 76597 και = 67.7 695.56 65.6.7 6576.7 76597 65.6 69.5 ç ç9. è ø è ø α Χρησιμοποιώντας τα προηγούμενα υπολογίστε τον πίνακα για την προσαρμογή του μοντέλου στα δεδομένα, καθώς και τον πίνακα Χ Υ. 7 7 5.57.. 9. β Χρησιμοποιώντας το γεγονός ότι.9 με.775..9 σχηματίστε τον πίνακα ανάλυσης της διασποράς για τον συνολικό έλεγχο του μοντέλου και διατυπώστε τα συμπεράσματα που προκύπτουν σε στάθμη.5 και.. Να σημειωθεί πως υπολογίζονται οι κρίσιμες τιμές. Αν δεν έχετε βρει σωστά αποτελέσματα από το α πάρτε ως SSR τη μη ακριβή τιμή SSR= γ Εξετάστε σε στάθμη.5 αν ο συντελεστής της μεταβλητής είναι ή μήπως ίσος με. Απαντήστε το ίδιο ερώτημα με τη βοήθεια κατάλληλου διαστήματος εμπιστοσύνης. δ Αγνοώντας τις άλλες δύο μεταβλητές και διαιρώντας δια την και στρογγυλεύοντας σε ακέραιες τιμές παίρνουμε τον διπλανό πίνακα. Κάντε την παλινδρόμηση της y στην και ελέγξτε το μοντέλο υπολογίζοντας τις επαναλήψεις της = z. y z /. 77 9.6 6 7..9 6. 9. 7. 6 7. 79 7. 6. 97.9 5 9. 77.6 9.
7 7 75 76 Σφάλματα προσαρμογής-επαν/νες μετρήσεις Έστω ότι υπάρχουν παρατηρήσεις στο ίδιο,,,..., r με τιμές y, j,,..., όπου Με την υπόθεση της κανονικότητας θα έχουμε j j j SSE y y ~,,,... r Άρα j j r SSe SSE ~ e Επομένως SSE SSe ~ r και όπου SSE SSe / r F ~ F SS / r e... r r r e r, r j καθαρά σφάλματα σφάλματα προσαρμογής έλεγχος ισότητας καθαρών σφαλμ. με σφ. προσαρμ. 77 7 y z / s meay vary s-* vars. 77 9.6 6 7. 9. 6.9 9.767 97.9 6. 9. 7. 6 7. 79 9.5 7. 6 9.5.75. 97.9 5 9. 77 9.5.6 5.6667 6.5 9. 96.95
79 Θέματα Στον παρακάτω πίνακα δίνονται στοιχεία από οικογένειες. Στη στήλη y δίνεται η επιφάνεια της κατοικίας της οικογένειας σε τετρ. μέτρα, στη στήλη το ετήσιο εισόδημα σε χιλιάδες ευρώ, στη στήλη τo πλήθος των με λών της και στη στήλη τo συνολικό πλήθος ετών μετά το λύκειο που σπούδασαν τα μέλη της οικογένειας που συνεισφέρουν στο εισόδημα. y y Αθρ. β.ε. Μέσα τετρ F Παλινδρόμηση 7.7 7,7.5 Υπόλοιπα 76..9 Σφάλματα προσαρμογής 6,6 6,6 5,7 Καθαρά σφάλματα 96.95, Σύνολο.5 6 5 9 6 7 6 56 6 5 7 9 7 9 5 6 5 5 6 α Χρησιμοποιώντας πίνακες να βρεθεί η ευθεία που εκτιμά την επιφάνεια της κατοικίας από το εισόδημα. Οι φοιτητές που το ΑΕΜ τους είναι περιττός αριθμός να χρησιμοποιήσουν τα δεδομένα από τις πρώτες 5 οικογένειες, ενώ αυτοί που έχουν άρτιο τα υπόλοιπα. Να σημειωθούν όλοι οι πίνακες που θα χρησιμοποιήσετε και να φαίνονται οι πράξεις με τα ενδιάμεσα αποτελέσματα. Να γίνει και γραφική παράσταση, όπου να εξηγήσετε τι ελαχιστοποιεί η μέθοδος υπολογισμού του μοντέλου παλινδρόμησης. β Κάντε τον πίνακα ανάλυσης της διασποράς και διατυπώστε τα συμπεράσματά σας. γ Βρέστε το 95% δ.ε. για το συντελεστή του στο μοντέλο. Προσαρμόστε το πλήρες μοντέλο και δώστε τα συμπεράσματά σας. Θέματα Θέματα Στο διπλανό πίνακα δίνονται οι ώρες που έτρεξε μία δρομέας σε κάθε μία από διαδοχικές εβδομάδες και ο μέσος χρόνος σε λεπτά που έκανε η δρομέας για κάθε μίλι εκείνη την εβδομάδα. Να βρεθεί με χρήση πινάκων α Αν ο χρόνος ανά μίλι σε μία εβδομάδα προπόνησης, μπορεί να προβλεφθεί από τις ώρες προπόνησης την εβδομάδα αυτή; Ποια η πρόβλεψη για μία εβδομάδα που έτρεξε ώρες και ποια αν έτρεξε ώρες; β Με ποια τυπική απόκλιση εκτιμώνται οι διάφοροι παράμετροι και μία από τις προβλέψεις; hours tme 5. 5 5..9.6 9.7 7..6 6.9 Σε ένα πείραμα για να μελετηθεί η οξείδωση ενός μετάλλου έγιναν παρατηρήσεις όπου μετρήθηκαν σε κατάλληλες μονάδες το ρεύμα του αέρα, η θερμοκρασία του νερού, η ποσοστιαία συγκέντρωση του οξέως καιτοβάρος που έχασε το μέταλλο εξαιτίας της σκουριάς y. Το μέταλλο βυθιζόταν σε οξύ που εψύχετο με νερό και μετά εκτίθονταν σε ρεύμα αέρος. Τα αποτελέσματα δίνονται στον πίνακα. Επίσης, σε κάθε κελί του δεύτερου πίνακα δίνεται το άθροισμα γινομένων των μεταβλητών που το καθορίζουν. Π.χ. στο κελί που ορίζεται από τις, είναι 57=,. = α Υπολογίστε, χρησιμοποιώντας πίνακες, τους συντελεστές παλινδρόμησης του μοντέλου y. β Σχηματίστε τον πίνακα ανάλυσης της διασποράς και διατυπώστε τα συμπεράσματά σας. γ Δώστε την πρόβλεψη για θερμοκρασία. Δείξτε ότι η τυπική απόκλιση της πρόβλεψης είναι. και βρέστε το 95% διάστημα εμπιστοσύνης για την ίδια την πρόβλεψη. δ Μετά κάναμε παλινδρόμηση με τη μεταβλητή και βρήκαμε SSR=75., με τις μεταβλητές και και βρήκαμε SSR=., καθώς και παλινδρόμηση με όλες τις μεταβλητές και βρήκαμε SSR=9.. Συγκρίνετε μεταξύ τους τα τέσσερα μοντέλα μαζί με αυτό του α. Για το καλύτερο από αυτά υπολογίστε πόσο μέρος της συνολικής διασποράς ερμηνεύει. Αν δεν έχετε βρει το SST, χρησιμοποιείστε την προσέγγιση SST= ε Για τη μεταβλητή παρατηρήστε ότι υπάρχουν επαναλαμβανόμενες παρατηρήσεις. Αγνοώντας τις άλλες μεταβλητές σχηματίστε τον πίνακα ανάλυσης διασποράς και συμπληρώστε τον με τα καθαρά σφάλματα. Τι συμπεραίνετε για το μοντέλο με τη μεταβλητή ; y 765 7 99 95 7 955 57 6 99 57 569 9 y 95 6 9 5 α/α y 7 9 7 7 75 5 9 7 6 7 5 6 7 6 6 7 7 6 9 9 6 9 9 5 7 5 5 5 9 5 7 5 5 9 9 5 5 9 6 5 6 7 7 5 9 7 5 9 79 9 5 9 56 5 7 9 5 Σύν 69 6