Άσκηση 3. Τα παρακάτω δεδομένα δίνουν το πλήθος y των φυτών που διατήρησαν μια ιδιότητα όταν n φυτά βρέθηκαν κάτω από διαφορετικές συνθήκες. Ένας ποιοτικός παράγοντας (αγωγή) ήταν η αποθήκευση σε θερμοκρασία 3 0 C για 48 ώρες ή η αποθήκευση σε κανονικές συνθήκες. Μία άλλη συμμεταβλητή ήταν η χρησιμοποίηση φυγόκεντρης δύναμης σε τρεις διαφορετικές τιμές 40, 50, 350. Συνθήκη Φυγόκεντρος αποθήκευσης Κανονική y k n k 40 50 350 55 5 57 0 99 08 Αγωγή y k n k 55 50 50 76 8 90 Πάρε ως συμμεταβλητές τις log40 3.689, log50 5.0 και 3 log350 5.858 α) Κάνε γραφική παράσταση των αναλογιών p y / n ως προς k. β) Εξέτασε τα τρία μοντέλα (εκτίμησε παραμέτρους, αποκλίσεις, εκτιμημένες αναλογίες): ) logt π α j + β j k, j κανονικές συνθήκες, j αγωγή. ) logt π α j + β k, ) logt π α + β k, γ) Κάνε στο μοντέλο () τον έλεγχο β β σε στάθμη 0.05. Επίσης κάνε τον έλεγχο α α στο μοντέλο () σε στάθμη 0.05. Απαντήσεις Άσκησης 3. Θεωρούμε ότι οι μεταβλητές απόκρισης Υ,Υ,Υ 3,Υ,Υ,Υ 3 (πλήθος φυτών που διατήρησαν την ιδιότητα σε κάθε μία από τις 6 περιπτώσεις) προέρχονται από διωνυμική κατανομή με παραμέτρους (m, π ). Τα π μάλιστα εξαρτώνται από τις συνθήκες ως εξής (έχουμε τρία μοντέλα): ) π a j + β j k a j + β j k, ) π a j + βk a j + βk Αρχικά εισάγονται τα δεδομένα στο SPSS ως εξής (p y/n):, ) y n tr p 55 0 3.689 0,539 5 99 5.0 0,553 57 08 5.858 0,578 55 76 3.689 0,737 50 8 5.0 0,673 50 90 5.858 0,5556 α) Η γραφική παράσταση των αναλογιών p y / n ως προς k γίνεται χρησιμοποιώντας τη διαδικασία Graphs/Scattr/Smpl, Yas:p, as:, St Markrs by : tr π a+ βk a+ βk
,8,7,6 TR P,5 3,5 4,0 4,5 5,0 5,5 6,0 Παρατηρούμε ότι στην περίπτωση που η αποθήκευση γίνεται σε θερμοκρασία 3 0 C (αγωγή, tr ) η αύξηση της φυγόκεντρης δύναμης οδηγεί σε μείωση του ποσοστού των φυτών που διατήρησαν την ιδιότητα που εξετάζουμε. Αντίθετα, στην άλλη περίπτωση (αποθήκευση σε κανονικές συνθήκες, tr ) παρατηρούμε ότι η αύξηση της φυγόκεντρης δύναμης δεν φαίνεται να οδηγεί σε αύξηση ή σε μείωση του ίδιου ποσοστού. Αυτό αποτελεί μία πρώτη ένδειξη για το ότι δεν πρέπει το μοντέλο logt π α + β k να είναι το καλύτερο (διότι στο μοντέλο αυτό δεν περιλαμβάνεται η επίδραση της θερμοκρασίας αποθήκευσης). β) ) Το πρώτο μοντέλο logt π α j + β j k γράφεται αναλυτικά για τις 6 παρατηρήσεις ως εξής: logt π α + β logt π α + β logt π 3 α + β 3 logt π α + β logt π α + β logt π 3 α + β 3 Επειδή η διαδικασία του SPSS που θα χρησιμοποιήσουμε προυποθέτει μοντέλο με σταθερά, θα το μετασχηματίσουμε έτσι ώστε να έχει σταθερά. Το παραπάνω μοντέλο γράφεται ισοδύναμα: logt π α + β logt π α + β logt π 3 α + β 3 logt π α + β + γ + δ logt π α + β + γ + δ logt π 3 α + β 3 + γ + δ 3 όπου γ α α, δ β β ή με μορφή πινάκων: π π π logt π π π 3 3 Άρα προσθέτουμε δύο ακόμη στήλες (z, z ) στα δεδομένα: 3 3 0 0 0 0 0 a 0 β γ δ 3
y n z z tr p 55 0 3.689 0 0 0,539 5 99 5.0 0 0 0,553 57 08 5.858 0 0 0,578 55 76 3.689 3.689 0,737 50 8 5.0 5.0 0,673 50 90 5.858 5.858 0,5556 και το πρώτο μοντέλο γράφεται: logt π α + β + γz + δz. Χρησιμοποιούμε τη διαδικασία Analyz / rgrsson / probt με Rspons: y, Total: m, Covarats:, z, z, Modl logt από ό- που προκύπτει ο εξής πίνακας: DATA Informaton 6 unwghtd cass accptd. 0 cass rjctd bcaus of mssng data. 6 cass ar n th control group. MODEL Informaton ONLY Logstc Modl s rqustd. Paramtr stmats convrgd aftr tratons. Optmal soluton found. Paramtr Estmats (LOGIT modl: (LOG(p/(-p))) Intrcpt + B): Rgrsson Coff. Standard Error Coff./S.E. -,075,685 -,7937 Z,97708,99808,98089 Z -,3860,9888 -,6099 Intrcpt Standard Error Intrcpt/S.E.,3397,684,373 Parson Goodnss-of-Ft Ch Squar,08 DF P,986 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Covaranc(blow) and Corrlaton(abov) Matrcs of Paramtr Estmats Z Z,0609,698 -,6378 Z,07839,9966 -,9844 Z -,0609 -,9540,03955 Σύμφωνα με τα αποτελέσματα της παραπάνω διαδικασίας, οι εκτιμήσεις των παραμέτρων μετά από βήματα της επαναληπτικής διαδικασίας είναι και άρα 0.3397, β 0.075, γ.97708, δ a, 0.3860 a + γ 0.3397 +.97708.05, β β + δ 0.075 0.3860 a 0.3435 ενώ το χι-τετράγωνο του Parson είναι ίσο με 0.08 (με n p 6 4 β.ε.). Το p-valu που αφορά τον έλεγχο της υπόθεσης H 0 : g(μ) Χβ είναι ίσο με p valu P( > 0.08 ~ χ ) 0.986. Σύμφωνα λοιπόν με το χι-τετράγωνο του Parson, δεν έχουμε αρκετά στοιχεία ώστε να απορρίψουμε ότι το μοντέλο είναι σωστό (δηλ. το μοντέλο γίνεται αποδεκτό). Obsrvd and Epctd Frquncs Numbr of Obsrvd Epctd Subjcts Rsponss Rsponss Rsdual Prob 3,69 0,0 55,0 54,89,8,53744 5,0 99,0 5,0 5,465 -,465,5995 5,86 08,0 57,0 56,76,84,555 3,69 76,0 55,0 54,83,68,747 5,0 8,0 50,0 50,49 -,49,658 5,86 90,0 50,0 49,738,6,5565
Οι τρεις πρώτες στήλες του παραπάνω πίνακα είναι οι, m, y αντίστοιχα. Η 4 η στήλη (pctd rsponss) περιέχει τις εκτιμημένες (fttd) τιμές µ y m π (πρόκειται για τον εκτιμημένο αναμενόμενο αριθμό φυτών που διατήρησαν την ιδιότητα σε κάθε μία από τις 3 τιμές τις φυγόκεντρης δύναμης k και για j (κανονικές συνθήκες), (αγωγή)). Η στήλη με τα κατάλοιπα περιέχει τις διαφορές y y. Τέλος, η στήλη Prob αποτελείται από τα π (εκτιμημένες αναλογίες) a βk ( a γ) + ( β δ) k π k ( ), tr π ( tr ), k k,,3. a βk ( a γ ) + ( β + δ) k Επίσης η απόκλιση (dvanc) μπορεί να υπολογιστεί μέσω των καταλοίπων απόκλισης όπως και στις Ασκήσεις,. Υπενθυμίζεται ότι D y m y r sgn( y m π ) y ln + ( m y )ln m π m m π και επομένως κατασκευάζουμε (comput) μία νέα στήλη με τα κατάλοιπα απόκρισης r_d (y-n*p)/abs(y-n*p)*(**0.5)*abs(y*ln(y/(n*p)) +(n-y)*ln((n-y)/(n-n*p)))**0.5 n D όπου p είναι οι εκτιμημένες αναλογίες. Επειδή ως γνωστό, D c, f ( r ), κατασκευάζουμε τη στήλη r_d r_d** και τέλος (Analyz/Dscrptv Statstcs/Dscrptvs/r_d, optons: sum) προκύπτει ότι η απόκλιση είναι ίση με D 0.0764. Όπως και σε παραπάνω ασκήσεις, η γραφική παράσταση π ( ) μαζί με τα (, y /m ) θα είναι (έχουμε δύο καμπύλες, μία για tr (κανονικές συνθήκες) και μία για tr (αγωγή) με διαφορετικό ntrcpt και slop):,8 D r,7,6 P G P G δηλαδή, P,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 a β ( a γ) + ( β + δ π ( ) ( ), tr π ( ) ( tr ). a β ( a ) γ + ( β + δ) ) ) Το δεύτερο μοντέλο logt π α j + β k γράφεται αναλυτικά για τις 6 παρατηρήσεις: logt π α + β logt π α + β logt π 3 α + β 3 logt π β + α logt π β + α logt π 3 β 3 + α ή ισοδύναμα:
logt π α + β logt π α + β logt π 3 α + β 3 logt π α + β + γ logt π α + β + γ logt π 3 α + β 3 + γ όπου γ α α και άρα το συγκεκριμένο μοντέλο γράφεται: logt π α + β + γ z. Στη συνέχεια χρησιμοποιούμε τη διαδικασία Analyz / rgrsson / probt με Rspons: y, Total: m, Covarats:, z, Modl logt από όπου προκύπτει ο εξής πίνακας: DATA Informaton 6 unwghtd cass accptd. 0 cass rjctd bcaus of mssng data. 3 cass ar n th control group. MODEL Informaton ONLY Logstc Modl s rqustd. Paramtr stmats convrgd aftr 9 tratons. Optmal soluton found. Paramtr Estmats (LOGIT modl: (LOG(p/(-p))) Intrcpt + B): Rgrsson Coff. Standard Error Coff./S.E. -,5460,09703 -,59335 Z,40684,746,398 Intrcpt Standard Error Intrcpt/S.E.,87677,48704,800 Parson Goodnss-of-Ft Ch Squar,598 DF 3 P,458 Snc Goodnss-of-Ft Ch squar s NOT sgnfcant, no htrognty factor s usd n th calculaton of confdnc lmts. - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Covaranc(blow) and Corrlaton(abov) Matrcs of Paramtr Estmats Z,0094 -,03647 Z -,0006,03049 Οι εκτιμήσεις των παραμέτρων μετά από 9 βήματα της επαναληπτικής διαδικασίας είναι και άρα a 0.87677, β 0.546, γ a a + γ 0.87677 + 0.40684 0.40684.836 ενώ επίσης το χι-τετράγωνο του Parson είναι ίσο με,598 (με n p 6 3 3 β.ε.). Το p-valu που αφορά τον έλεγχο της υπόθεσης H 0 : g(μ) Χβ είναι ίσο με 0.458 και άρα δεν έχουμε αρκετά στοιχεία ώστε να απορρίψουμε ότι το μοντέλο είναι σωστό (δηλ. το μοντέλο γίνεται αποδεκτό). Obsrvd and Epctd Frquncs Numbr of Obsrvd Epctd Subjcts Rsponss Rsponss Rsdual Prob 3,69 0,0 55,0 58,754-3,754,5760 5,0 99,0 5,0 5,05 -,05,5550 5,86 08,0 57,0 53, 3,779,4979 3,69 76,0 55,0 5,006 3,994,673 5,0 8,0 50,0 50,589 -,589,6456 5,86 90,0 50,0 53,405-3,405,59339
Η στήλη Prob αποτελείται από τις εκτιμημένες αναλογίες π. Η απόκλιση (dvanc) υπολογίζεται όπως και παραπάνω και βρίσκεται ότι είναι ίση με D.69. Η γραφική παράσταση π ( ) μαζί με τα (, y /m ) είναι (και εδώ έχουμε δύο καμπύλες, μία για tr (κανονικές συνθήκες) και μία για tr (αγωγή) με διαφορετικό ntrcpt και ίδιο slop).,8,7,6,5 PII G PII G δηλαδή, P,4 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 a β ( a ) γ + β π ( ) ( ), tr π ( ) ( tr ). a β ( a ) γ + β β) ) Το τρίτο μοντέλο logt π α + β k γράφεται αναλυτικά για τις 6 παρατηρήσεις: logt π α + β logt π α + β logt π 3 α + β 3 logt π α + β logt π α + β logt π 3 α + β 3 και άρα το συγκεκριμένο μοντέλο γράφεται απλά: logt π α + β. Χρησιμοποιούμε τη διαδικασία Analyz / rgrsson / probt με Rspons: y, Total: m, Covarats:, Modl logt από όπου προκύπτει ο πίνακας: DATA Informaton 6 unwghtd cass accptd. 0 cass rjctd bcaus of mssng data. 0 cass ar n th control group. MODEL Informaton ONLY Logstc Modl s rqustd. Paramtr stmats convrgd aftr 7 tratons. Optmal soluton found. Paramtr Estmats (LOGIT modl: (LOG(p/(-p))) Intrcpt + B): Rgrsson Coff. Standard Error Coff./S.E. -,4785,09650 -,533 Intrcpt Standard Error Intrcpt/S.E.,036,4834,89 Parson Goodnss-of-Ft Ch Squar 7,97 DF 4 P,093 Οι εκτιμήσεις των παραμέτρων μετά από 7 βήματα της επαναληπτικής διαδικασίας είναι
a.03, β 0.4785 ενώ επίσης το χι-τετράγωνο του Parson είναι ίσο με 7,97 (με n p 6 4 β.ε.). Το p-valu που αφορά τον έλεγχο της υπόθεσης H 0 : g(μ) Χβ είναι ίσο με 0.093 και άρα δεν έχουμε αρκετά στοιχεία ώστε να απορρίψουμε ότι το μοντέλο είναι σωστό (δηλ. το μοντέλο γίνεται αποδεκτό). Obsrvd and Epctd Frquncs Numbr of Obsrvd Epctd Subjcts Rsponss Rsponss Rsdual Prob 3,69 0,0 55,0 6,93-7,93,6679 5,0 99,0 5,0 56,397-4,397,56967 5,86 08,0 57,0 58,84 -,84,53874 3,69 76,0 55,0 46,876 8,4,6679 5,0 8,0 50,0 46,43 3,857,56967 5,86 90,0 50,0 48,487,53,53874 Η στήλη Prob αποτελείται από τις εκτιμημένες αναλογίες π. Η απόκλιση (dvanc) υπολογίζεται όπως και παραπάνω και βρίσκεται ότι είναι ίση με D 8.09. Η γραφική παράσταση π ( ) μαζί με τα (, y /m ) είναι (εδώ έχουμε μία καμπύλη και για tr (κανονικές συνθήκες) και για tr (αγωγή)).,8,7,6 PIII G P,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 δηλαδή, a + β π j ( ) j,. a + β γ) ) Ο έλεγχος της υπόθεσης Η 0 : β β στο μοντέλο logt π α j + β j k είναι ισοδύναμος: A) με τον έλεγχο Η 0 : δ 0. Εδώ απορρίπτουμε την Η 0 αν δ / s( δ),6099 > Z a / άρα δεχόμαστε ότι δ 0 β β (ισοδύναμα μπορούμε να ελέγξουμε αν το 0 ανήκει στο δ.ε. 95% για το δ: ( 0.708, 0.07)). B) με τον έλεγχο Η 0 : logt π α j +β k έναντι του μεγαλύτερου μοντέλου Η : logt π α j +β j k. Εδώ απορρίπτουμε την Η 0 (ότι δηλαδή το μικρότερο μοντέλο είναι σωστό) όταν Parson ' Parson.598 0.08.57 > χ.96 p p; a χ3 ; a χ;0.05 3.84 άρα δεχόμαστε ότι το μικρότερο μοντέλο είναι σωστό, δηλαδή ότι δ 0 β β (ο έλεγχος αυτός μπορεί να γίνει και μέσω των διαφορών των αποκλισεων)
) Ο έλεγχος της υπόθεσης Η 0 : α α στο μοντέλο logt π α j + β k είναι ισοδύναμος: A) με τον έλεγχο Η 0 : γ 0. Εδώ απορρίπτουμε την Η 0 αν γ / s( γ),398 > Z a / άρα απορρίπτουμε ότι γ 0 α α. (ισοδύναμα μπορούμε να ελέγξουμε αν το 0 ανήκει στο δ.ε. 95% για το γ: (0.064, 0.750)). B) με τον έλεγχο Η 0 : logt π α + β k έναντι του μεγαλύτερου μοντέλου Η : logt π α j + β k. Εδώ απορρίπτουμε την Η 0 (ότι δηλαδή το μικρότερο μοντέλο είναι σωστό) όταν Parson ' Parson 7.97.598 5.373 > χ.96 p p; a χ3 ; a χ;0.05 3.84 άρα απορρίπτουμε ότι το μικρότερο μοντέλο είναι σωστό, δηλαδή ότι γ 0 α α. (ο έλεγχος αυτός μπορεί να γίνει και μέσω των διαφορών των αποκλισεων)