ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ, 3-6- Άσκηση Δίτιμα δεδομένα. Έντομα εκτέθηκαν για 5 ώρες σε 7 διαφορετικές συγκεντρώσεις ενός εντομοκτόνου gaou carbon dulphn και μετρήθηκε το αρχικό λήθος των εντόμων και το λήθος των νεκρών εντόμων στο τέλος του ειράματος. Τα αοτελέσματα του ειράματος ήταν Δόση log CS mgl -.697.74.755.784.83.8369.86.8839 Πλήθος εντόμων m 59 6 6 56 63 59 6 6 Πλήθος νεκρών εντόμων y 6 3 8 8 5 53 6 6 Η γραμμική συνάρτηση ρόλεψης είναι η +. Να γίνει η γραφική αράσταση, y / m. Να εκτιμηθούν σημειακά και με δ.ε. 95% οι αράμετροι, και να δοθούν οι εκτιμημένες τιμές των y όταν το μοντέλο ου χρησιμοοιείται είναι Logtc, Probt. 3 Δώστε την αόκλιση dvanc και το Χ του Paron σε κάθε μοντέλο. 4 Είναι αυτά τα μοντέλα ικανοοιητικά; α.5. Ποιο είναι το καλύτερο μοντέλο; 5 Να γίνει ο έλεγχος της υόθεσης H :, με εναλλακτική, δηλαδή ότι το αοτέλεσμα δεν εξαρτάται αό την δόση. 6 Να κάνετε τη γραφική αράσταση ˆ,.6,.9 σε κάθε μοντέλο. 7 Να υολογιστούν τα κατάλοια Paron και dvanc. 8 Βελτιώνεται σημαντικά η ροσαρμογή του κάθε μοντέλου αν άρουμε συνάρτηση ρόλεψης η + +. Να κάνετε τη γραφική αράσταση ˆ,.5, σε κάθε μοντέλο. Τι αρατηρείτε για τη συνάρτηση ρόλεψης ριν το <.6; 9 Να εκτιμηθούν οι αράμετροι, και οι διασορές τους με την εαναλητική μέθοδο στη logtc αλινδρόμηση χρησιμοοιήστε το ολύ 4 εαναλήψεις. Άσκηση. Να ααντήσετε στα ερωτήματα -7 της άσκησης χρησιμοοιώντας c-log-log lnk χρησιμοοιήστε το ολύ 4 εαναλήψεις της εαναλητικής μεθόδου. Ποιο είναι το καλύτερο μοντέλο αό τα 3 logt, probt, c-log-log; Άσκηση 3. Τα αρακάτω δεδομένα δίνουν το λήθος y jk των φυτών ου διατήρησαν μια ιδιότητα όταν n jk φυτά ρέθηκαν κάτω αό διαφορετικές συνθήκες. Ένας οιοτικός αράγοντας αγωγή ήταν η αοθήκευση σε θερμοκρασία 3 C για 48 ώρες ή η αοθήκευση σε κανονικές συνθήκες. Μία άλλη συμμεταλητή ήταν η χρησιμοοίηση φυγόκεντρης δύναμης σε τρεις διαφορετικές τιμές 4, 5, 35. Συνθήκη αοθήκευσης Κανονική y k n k Φυγόκεντρος 4 5 35 55 5 57 99 8 Αγωγή y k n k 55 5 5 76 8 9 Πάρε ως συμμεταλητές τις log4 3.689, log5 5. και 3 log35 5.858 α Κάνε γραφική αράσταση των αναλογιών p jk y jk / n jk ως ρος k. Εξέτασε τα τρία μοντέλα εκτίμησε αραμέτρους, αοκλίσεις, εκτιμημένες αναλογίες: logt jk α j + j k, j κανονικές συνθήκες, j αγωγή. logt jk α j + k, logt jk α + k, γ Κάνε στο μοντέλο τον έλεγχο σε στάθμη.5. Είσης κάνε τον έλεγχο α α στο μοντέλο σε στάθμη.5.
Ααντήσεις Άσκηση Θεωρούμε ότι οι μεταλητές αόκρισης Υ, Υ,...,Υ n λήθος νεκρών εντόμων στα ειράματα,,...,n αντίστοιχα ροέρχονται αό διωνυμική κατανομή με αραμέτρους m, p,,,..., n. Συγκεκριμένα, m y m y m f y; p y ln + m ln + ln y y όου υοθέτουμε ότι τα,,..., n εξαρτώνται αό τη συγκέντρωση εντομοκτόνου ως εξής: η + στο Logt μοντέλο η η + g ln, + + Φ η Φ +, στο Probt μοντέλο, η g Φ η + p{ } p{ } στο c-log-log μοντέλο η g ln ln για κάοιες αραμέτρους,. Σκοός μας είναι η εκτίμηση των, και η εξέταση της καταλληλότητας του κάθε μοντέλου. Αρχικά εισάγουμε τα δεδομένα στο SPSS ως εξής: m y.697 59 6.74 6 3.755 6 8.784 56 8.83 63 5.8369 59 53.86 6 6.8839 6 6 Να γίνει η γραφική αράσταση συγκέντρωση εντομοκτόνου, y /m οσοστό νεκρών ε- ντόμων. Ως συνήθως κατασκευάζουμε την νέα στήλη p y/m Tranform/Comput και στη συνέχεια χρησιμοοιούμε τη διαδικασία Graph/cattr/Smpl, A:, Y A: p.,,,8,6,4, PI,,6,7,8,9 Παρατηρούμε ότι όσο αυξάνεται η συγκέντρωση του εντομοκτόνου, τόσο αυξάνεται και το οσοστό των νεκρών εντόμων. Αν εκτιμήσουμε τα, και το μοντέλο ου χρησιμοοιούμε είναι σωστό τότε θα έχουμε και την καμύλη ου δίνει την σχέση μεταξύ της ιθανότητας ε- ξουδετέρωσης ενός εντόμου και της συγκέντρωσης εντομοκτόνου ου χρησιμοοιούμε. Για αράδειγμα αν δεχτούμε το logt μοντέλο ως εαρκές, θα είναι
+ ˆ. + + Να εκτιμηθούν σημειακά και με δ.ε. 95% οι αράμετροι, και να δοθούν οι εκτιμημένες τιμές των y όταν το μοντέλο ου χρησιμοοιείται είναι Logtc, Probt. Αρχικά μελετάμε το μοντέλο με το Logt lnk. Ειλέγουμε τη διαδικασία Analyz / rgron / probt opton: no fducal c.. με Rpon: y, Total: m, Covarat:, Modl logt αό όου ροκύτει ο εξής ίνακας: * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * DATA Informaton 8 unwghtd ca accptd. ca rjctd bcau of mng data. ca ar n th control group. MODEL Informaton ONLY Logtc Modl rqutd. * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * Paramtr tmat convrgd aftr 6 traton. Optmal oluton found. Paramtr Etmat LOGIT modl: LOGp/-p Intrcpt + B: Rgron Coff. Standard Error Coff./S.E. 34,733,94,7689 Intrcpt Standard Error Intrcpt/S.E. -6,7747 5,87 -,799 Paron Goodn-of-Ft Ch Squar,7 DF 6 P,4 Snc Goodn-of-Ft Ch quar gnfcant, a htrognty factor ud n th calculaton of confdnc lmt. Σύμφωνα με τα αοτελέσματα της αραάνω διαδικασίας, οι εκτιμήσεις των μετά αό 6 ήματα της εαναλητικής διαδικασίας Fhr corng mthod είναι ˆ 6.7, 34.7, Vˆ 5.8, Vˆ. 9 ενώ είσης το χι-τετράγωνο του Paron είναι ίσο με.7 με n p 6.ε.. Το p-valu ου δίνεται αφορά τον έλεγχο της υόθεσης H : gμ Χ το μοντέλο είναι σωστό και είναι ίσο με p valu P >.7 ~ χ.4. Σύμφωνα λοιόν με το χι-τετράγωνο του Paron, δεν έχουμε αρκετά στοιχεία ώστε να αορρίψουμε.4 >.5,. ότι το μοντέλο είναι σωστό δηλ. το μοντέλο γίνεται αοδεκτό. * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * Obrvd and Epctd Frqunc Numbr of Obrvd Epctd Subjct Rpon Rpon Rdual Prob,69 59, 6, 3,457,543,586,7 6, 3, 9,84 3,58,643,76 6, 8,,45-4,45,36,78 56, 8, 33,898-5,898,653,8 63, 5, 5,96,94,7957,84 59, 53, 53,9 -,9,934,86 6, 6, 59,,778,955,88 6, 6, 58,743,57,9795 6
Οι τρεις ρώτες στήλες του αραάνω ίνακα είναι οι, m, y αντίστοιχα. Η 4 η στήλη pctd y ηˆ yˆ m ˆ, ˆ ηˆ rpon εριέχει τις εκτιμημένες fttd τιμές µ οι οοίες λόγω του logt lnk θα είναι: + ˆ µ + + + ρόκειται για τον εκτιμημένο αναμενόμενο αριθμό νεκρών εντόμων σε κάθε μία αό τις n 8 συγκεντρώσεις εντομοκτόνου. Η στήλη με τα κατάλοια rdual εριέχει τις διαφορές y ˆ η διαφορά μεταξύ του αρατηρούμενου και του εκτιμημένου αναμενόμενου αριθμού νε- y κρών εντόμων. Τέλος, η στήλη Prob αοτελείται αό τα εκτιμημένες ιθανότητες εξουδετέρωσης στις n 8 συγκεντρώσεις εντομοκτόνου. Είσης το SPSS αρέχει και το ακόλουθο γράφημα 5 Logt Tranformd Rpon 4 3 - - Logt -3,6,7,8,9 το οοίο αοτελείται αό τα σημεία y / m,ln y / m Το γράφημα αυτό χρησιμοοιείται για έναν ρόχειρο έλεγχο καταλληλότητας της συνάρτησης σύνδεσης. Συγκεκριμένα, όσο ιο «κοντά» ρίσκονται τα σημεία σε μία ευθεία, τόσο καλύτερα ερμηνεύονται τα δεδομένα αό το μοντέλο με τη συγκεκριμένη συνάρτηση σύνδεσης. Αυτό συμαίνει διότι, σύμφωνα με τα αραάνω, αν το logt lnk είναι σωστό θα ρέει για κάοια, να είναι + g ln ή με άλλα λόγια θα ρέει να υάρχει γραμμική σχέση μεταξύ των και των ln /. Μία αλή εκτίμηση των η οοία δεν ασίζεται στην υόθεση ότι όντως υάρχει μία τέτοια σχέση δίνεται αό τα y /m. Yενθυμίζεται ότι η εκτίμηση των μέσω των ˆ ˆ, γίνεται με την υόθεση ότι το lnk είναι σωστό και άρα δεν είναι λογικό να χρησιμοοιηθεί για τον έλεγχο του lnk.. Όμοια για το Probt μοντέλο: * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * DATA Informaton 8 unwghtd ca accptd. ca rjctd bcau of mng data. ca ar n th control group. MODEL Informaton ONLY Normal Sgmod rqutd.
* * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * Paramtr tmat convrgd aftr 3 traton. Optmal oluton found. Paramtr Etmat PROBIT modl: PROBITp Intrcpt + B: Rgron Coff. Standard Error Coff./S.E. 9,7798,4846 3,934 Intrcpt Standard Error Intrcpt/S.E. -34,93535,6395-3,3555 Paron Goodn-of-Ft Ch Squar 9,53 DF 6 P,47 Snc Goodn-of-Ft Ch quar gnfcant, a htrognty factor ud n th calculaton of confdnc lmt. Σε αυτό το μοντέλο μετά αό 3 εαναλήψεις ροκύτει ότι, ˆ 34.93, 9.73, Vˆ.63, Vˆ. 48 ενώ το χι-τετράγωνο του Paron είναι ίσο με 9.53 με n p 6.ε.. Και εδώ δεν έχουμε αρκετά στοιχεία ώστε να αορρίψουμε p-valu.47 >.5,. την H : gμ Χ δηλ. ότι το μοντέλο είναι σωστό. * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * Obrvd and Epctd Frqunc Numbr of Obrvd Epctd Subjct Rpon Rpon Rdual Prob,69 59, 6, 3,358,64,569,7 6, 3,,7,78,7869,76 6, 8, 3,48-5,48,37874,78 56, 8, 33,86-5,86,6385,8 63, 5, 49,66,384,78755,84 59, 53, 53,39 -,39,937,86 6, 6, 59,665,335,9633,88 6, 6, 59,8,77,9873 Ο αραάνω ίνακας είναι αντίστοιχος με την ερίτωση ου είχαμε logt lnk. Η διαφορά εδώ y είναι στο ότι η 4 η στήλη pctd rpon εριέχει τις εκτιμημένες fttd τιμές µ οι οοίες λόγω του probt lnk είναι : y m mφ η mφ + Αντίστοιχα, η στήλη με τα κατάλοια εριέχει τις διαφορές y yˆ ενώ η στήλη Prob αοτελείται αό τα ˆ ˆ ˆ Φ +. Τέλος, το αρακάτω γράφημα,5 Probt Tranformd Rpon,,5,,5, -,5 Probt -, -,5,6,7,8,9
αοτελείται αό τα σημεία Probt lnk, Φ y / m όου Φ είναι η συνάρτηση κατανομής της Ν, Όμοια με το Logt μοντέλο, το γράφημα αυτό χρησιμοοιείται για έναν ρόχειρο έλεγχο καταλληλότητας της συνάρτησης σύνδεσης. Όσο ιο «κοντά» ρίσκονται τα σημεία σε μία ευθεία, τόσο καλύτερα ερμηνεύονται τα δεδομένα μέσω του Probt lnk Aν το Probt lnk είναι σωστό θα ρέει για κάοια, να είναι + g Φ. Tα διαστήματα εμιστοσύνης συντελεστού 95% υολογίζονται κάτω αό την αραδοχή ότι τα ακολουθούν κανονική κατανομή με μέση τιμή και διασορά ˆ κάτι ου ισχύει ροσεγγιστικά για μεγάλο δείγμα. Π.χ. για την ερίτωση όου έχουμε logt lnk, ένα ροσεγγιστικό δ.ε. συντ. 95% για το θα είναι το ˆ ± Z 6.7 ± 5.73.96 7.87, 5.57..5 Όμοια ρίσκουμε ένα ροσεγγιστικό δ.ε. συντ. 95% για το : ˆ ± Z 8.57,39.97.5 Για το Probt μοντέλο αντίστοιχα λαμάνουμε τα δ.ε. 95% : ˆ ± Z 4., 9.74, ˆ ± Z 6.8,.64.5.5 3 Δώστε την αόκλιση dvanc και το Χ του Paron σε κάθε μοντέλο. Το Χ του Paron δίνεται αευθείας αό το ακέτο: n m y µ µ m µ.7, 9.53 Logt, Probt lnk Η αόκλιση δεν δίνεται αό το SPSS και θα ρέει να υολογιστεί μέσω των ˆ ο υολογισμός της ζητείται για λόγους εκαιδευτικούς. Το Χ του Paron αρκεί για τους ελέγχους καταλληλότητας του μοντέλου. Συγκεκριμένα γνωρίζουμε ότι n y m y D + c, f y, μˆ y ln m y ln, ˆ ˆ ˆ g + m ˆ m m ˆ. Ο υολογισμός του μορεί.χ. να γίνει χρησιμοοιώντας το αοτέλεσμα αρακάτω ερωτήματος στο οοίο υολογίζονται τα κατάλοια αόκλισης. Βρίσκουμε ότι D.3 και. για το Logt και Probt μοντέλο αντίστοιχα. λ. αάντηση ερωτήματος 7 για λετομέρειες. 4 Είναι αυτά τα μοντέλα ικανοοιητικά; α.5. Ποιο είναι το καλύτερο μοντέλο; Είναι γνωστό ότι αορρίτουμε την H : gμ Χ όταν Dc y μˆ > χ ή, f, n p; a Paron Παρατηρούμε ότι και τα δύο μοντέλα θεωρούνται ικανοοιητικά για την εριγραφή των δεδομένων. Ειδικότερα, δεν είμαστε σε θέση να αορρίψουμε την υόθεση ότι το εκάστοτε μοντέλο είναι σωστό σε είεδο σημαντικότητας.5 εειδή D.3 και. < χ 6,.5. 59 αντίστοιχα, ή ισοδύναμα εειδή το p-valu του κάθε μοντέλου p-valulogt modl P >.3 ~ χ 6. 85, p-valuprobt modl P >. ~ χ. 97, 6 > χ n p; a
είναι μεγαλύτερο του.5. Ελάχιστα καλύτερο μοντέλο όμως μορεί να θεωρηθεί το probt εφ όσον αρουσιάζει το μικρότερο Dvanc ή ισοδύναμα το μεγαλύτερο p-valu Οι αοκλίσεις μορούν να συγκριθούν άμεσα γιατί έχουν τους ίδιους αθμούς ελευθερίας. Είσης, σύμφωνα και με το Χ του Paron., 9.53 αντίστοιχα τα δύο μοντέλα είναι αοδεκτά < χ. 59 και μάλιστα το καλύτερο είναι και άλι το probt. Paron 6,.5 5 Να γίνει ο έλεγχος της υόθεσης H :, με εναλλακτική H :, δηλαδή ότι το αοτέλεσμα δεν εξαρτάται αό την δόση. Θα χρησιμοοιήσουμε το δ.ε. 95% του ου υολογίστηκε αραάνω: 8.57,39.97 logt modl, 6.8,.64 probt modl Εειδή το δεν ανήκει στα δ.ε. 95% αορρίτουμε την υόθεση H : με εναλλακτική την H :, και στα δύο μοντέλα σε ε.σ. 5%. 6 Να κάνετε τη γραφική αράσταση ˆ,.6,.9 σε κάθε μοντέλο μαζί με τα, y /m Εδώ ζητείται η γραφική αράσταση της καμύλης ου εκφράζει την σχέση μεταξύ της ε- κτιμημένης ιθανότητας ˆ εξουδετέρωσης ενός εντόμου και της συγκέντρωσης εντομοκτόνου ου χρησιμοοιούμε. Στο logt και probt μοντέλο αντίστοιχα ισχύει ότι + ˆ, ˆ Φ ˆ + + + τα ˆ ˆ, ροφανώς είναι διαφορετικά στα δύο μοντέλα. Εφόσον τα ˆ ˆ, είναι γνωστά σε κάθε μοντέλο, οι αραάνω γραφικές αραστάσεις άξονας :, άξονας y: ˆ είναι εύκολο να γίνουν χρησιμοοιώντας κατάλληλο λογισμικό Η/Υ. Ας δούμε ως γίνεται δυνατή η κατασκευή ε- νός τέτοιου γραφήματος με το SPSS: Αρχικά σχηματίζουμε μία νέα στήλη με.χ. 3 αριθμούς αό το έως το 3.,,,..., 3. Στη συνέχεια σχηματίζουμε comput τη νέα μεταλητή g /3*.3+.6 ή οοία θα αίρνει 3 τιμές αό το.6 έως το.9. Στη συνέχεια σχηματίζουμε comput τις νέες μεταλητές plogt Ep-6.7+34.7*g/+Ep-6.7+34.7*g pprobt CDF.NORMAL-34.93+9.73*g,, οι οοίες μας δίνουν τις τιμές της ˆ στα 3 σημεία g για το logt και probt μοντέλο αντίστοιχα. Το γράφημα της ˆ και για τα δύο μοντέλα άνω στα 3 αυτά σημεία μαζί με τα 8 σημεία, y /m δίνεται αό την διαδικασία Scattrplot/ovrlay με Υ-Χ par: py/m --, pprobt -- g, plogt -- g. Θα χρειαστεί να ροσθέσουμε στις μεταλητές, p άλλες 3 8 γραμμές.χ. εαναλαμάνοντας την 8 η αρατήρηση 3 ακόμη φορές για να μην θεωρεί το ακέτο τις γραμμές 9 έως 3 στα g, plogt, pprobt ως mng valu. Στη συνέχεια ανοίγουμε τον SPSS Chart Edtor κάνοντας διλό κλικ στο σχήμα ου ροέκυψε αό την αραάνω διαδικασία και ειλέγουμε τα 3 σημεία ου αφορούν το plogt και τα ενώνουμε με Format / ntrpolaton / traght ln αράλληλα μικραίνουμε τα 3 σημεία με Format / Markr. Εαναλαμάνουμε το ίδιο και για τα 3 σημεία ου αφορούν το pprobt ειλέον, με το Format/ln tyl μορούμε να κάνουμε διακεκομμένες τις συγκεκριμένες γραμμές. Ως αοτέλεσμα λαμάνουμε το εόμενο γράφημα το οοίο μας δίνει τις καμύλες ου αριστούν την σχέση μεταξύ της εκτιμημένης ιθανότητας ˆ εξουδετέρωσης ενός εντόμου και της συγκέντρωσης εντομοκτόνου στα μοντέλα logt και probt μαζί με τα 8 αρατηρούμενα σημεία οσοστό των νεκρών εντόμων σε σχέση με τη συγκέντρωση του εντομοκτόνου.
,,,8,6,4,, PLOGIT G PPROBIT G -,,5,6,7 Παρατηρούμε ότι για τιμές συγκέντρωσης του εντομοκτόνου μικρότερες του.7 η ιθανότητα εξουδετέρωσης αυξάνεται ολύ αργά κάτω αό.6 η αοτελεσματικότητα του εντομοκτόνου είναι μηδενική. Για τιμές μεταξύ του.7 και.85 η αύξηση της αοτελεσματικότητας του εντομοκτόνου δηλ. ιθανότητας εξουδετέρωσης γίνεται ραγδαία. Τέλος για τιμές του εντομοκτόνου μεγαλύτερες του.9 η ιθανότητα εξουδετέρωσης είναι σχεδόν. Αν.χ. τώρα ένα εργοστάσιο αραγωγής εντομοκτόνων ειθυμεί να ρεί τη έλτιστη συγκέντρωση του εντομοκτόνου ου ρέει να εριέχει ένα σκεύασμα σταθμίζοντας μεταξύ κόστους και αοτελεσματικότητας θα ρέει να ασιστεί στην αραάνω καμύλη.,8,9, PI 7 Υενθυμίζεται ότι τα κατάλοια Paron είναι τα r P y m m ενώ τα κατάλοια αόκλισης δίνονται αό τον τύο D y r gn y m y ln m m y + m y ln m m Για το Logt lnk: Αρχικά υολογίζουμε με comput τα ˆ : p Ep-6.7+34.7*/+ Ep-6.7+34.7* ή μορούμε να τα αντιγράψουμε αό τον ίνακα ου δίνει το ακέτο. Στη συνέχεια σχηματίζουμε τα κατάλοια Paron r : P r_p y-m*p/m*p*-p**.5 και τα κατάλοια Dvanc r D : r_d y-m*p/absy-m*p***.5*absy*lny/m*p +m-y*lnm-y/m-m*p**.5 Αό τα αραάνω ροκύτει ο ακόλουθος ίνακας στον SPSS Data Edtor: m y p p r_p r_d,697 59 6,7,584,468,898,74 6 3,67,636,,689
,755 6 8,93,364 -,65 -,845,784 56 8,5,646 -,64 -,586,83 63 5,854,7947,639,66,8369 59 53,8983,93 -,8 -,,86 6 6,9839,955,95,556,8839 6 6,,979,349,5965 Η στήλη r_p εριέχει τα κατάλοια Paron, ενώ η στήλη r_d εριέχει τα κατάλοια αόκλισης. logt lnk. Με άση τα αραάνω αοτελέσματα μορούμε να υολογίσουμε και τα Χ του Paron και το Dvanc ως εξής: Υολογίζουμε τα r_p r_p**, r_d r_d** και εκτελούμε τη διαδικασία Analyz/Dcrptv Stattc/Dcrptv/ r_p, r_d opton: um αό όου um ροκύτει ότι,6867595 και D,38967 διότι n n D P D c, f r, Paron r Ανάλογα εργαζόμαστε και στο μοντέλο Probt. 8 Αρχικά κατασκευάζουμε τη νέα μεταλητή. y m 6 59.697,8585 3 6.74,979 8 6.755 3,87 8 56.784 3,834 5 63.83 3,88 53 59.8369 3,374 6 6.86 3,4633 6 6.8839 3,549 Εκτελώντας τη διαδικασία Analyz/rgron/probt/Rpon Frquncy:y, Total Obrvd:m, Covarat:, ροκύτει ο αρακάτω ίνακας ο οοίος μας ληροφορεί ότι το SPSS δεν μορεί να υολογίσει τον ίνακα συνδιασορών λόγω υψηλής συσχέτισης μεταξύ των συμμεταλητών, ίσως χρειάζεται να αυξήσουμε τον αριθμό των mamum traton στα opton * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * Paramtr tmat convrgd aftr 7 traton. >Warnng # 353 >Covaranc matr of paramtr tmat cannot b computd, pobly du >to lnar dpndnc among covarat. Stattc wll not b rportd. Πράγματι, τα σημεία, έχουν υψηλή γραμμική συσχέτιση όως αυτό φαίνεται στο αρακάτω γράφημα συντελεστής συσχέτισης ίσος με.
3,6 3,5 3,4 3,3 Corrlaton 3, 3, 3,,9,8,6,7,8,9 Paron Corrlaton Sg. -tald N Paron Corrlaton Sg. -tald N,,**,, 8 8,**,,, 8 8 **. Corrlaton gnfcant at th. lvl l d Το γεγονός αυτό συμαίνει διότι η αίρνει τιμές σε μία μικρή εριοχή.69,.89 στην οοία η συνάρτηση f είναι σχεδόν γραμμική. Για να αοφύγουμε το φαινόμενο αυτό θα ρέει να μετασχηματίσουμε τα δεδομένα αλλαγή κλίμακας ώστε να αίρνουν τιμές σε ένα καταλληλότερο διάστημα,.χ. στο 3,3. Θέτουμε λοιόν z / θα μορούσαμε.χ. να είχαμε θεωρήσει και τον μετασχηματισμό z / ma j{ j } ώστε z [,]. Εκτελούμε λοιόν τη διαδικασία Analyz/Dcrptv Stattc/Dcrptv av tandardzd valu a varabl αό όου λαμάνουμε την τυοοιημένη z / όου, όως φαίνεται και αό τον αρακάτω ίνακα,.79345,. 674563. Dcrptv Stattc Vald N ltw N Man Std. Dvaton 8,79345 6,74563E- 8 Στη συνέχεια κατασκευάζουμε την z z και εκτελούμε τη διαδικασία Analyz / rgron / probt / Rpon Frquncy:y, Total Obrvd:m, Covarat: z, z. Αό τη διαδικασία αυτή εκτιμώνται οι αράμετροι γ, γ, γ για τις οοίες ισχύει ότι η z z δηλαδή, γ + + γ γ + +,,, Εομένως, οι εκτιμήσεις των,, υολογίζονται μέσω των αραάνω σχέσεων αό τις εκτιμήσεις των γ, γ, γ ου δίνει το SPSS. Συγκεκριμένα λαμάνουμε τους ίνακες Logt lnk * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * DATA Informaton 8 unwghtd ca accptd. ca rjctd bcau of mng data. ca ar n th control group. MODEL Informaton ONLY Logtc Modl rqutd.
* * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * Paramtr tmat convrgd aftr 8 traton. Optmal oluton found. Paramtr Etmat LOGIT modl: LOGp/-p Intrcpt + B: Rgron Coff. Standard Error Coff./S.E. Z,7588,879 9,46744 Z,773,633,734 Intrcpt Standard Error Intrcpt/S.E.,49936,659 3,974 Paron Goodn-of-Ft Ch Squar 3,4 DF 5 P,699 Snc Goodn-of-Ft Ch quar NOT gnfcant, no htrognty factor ud n th calculaton of confdnc lmt. - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Covarancblow and Corrlatonabov Matrc of Paramtr Etmat Z Z Z,89,7348 Z,549,6933 Άρα, γ.49936, γˆ.7588, γˆ.773, γˆ.659, γˆ.879, γˆ. 633 ˆ και εομένως, ˆ.79345.79345 ˆ ˆ ˆ.49936.7588 +.773.674563.674563 ˆ.7588.79345 ˆ ˆ.773 5.6.674563.674563.773 ˆ ˆ 56.4.674563 με ˆ 4 V ˆ ˆ ˆ, ˆ V γ + V γ Cov γ γ 4 3 43. ˆ 4.79345.79345.89 +.6933.549 4464.35 4 3.674563.674563.674563 και ˆ ˆ.6933 V ˆ V γ 3348.3 4 4.674563 Οι τιμές του Χ Paron και των fttd valu ου δίνει το ακέτο αό την αραάνω διαδικασία y, m, z, z είναι οι σωστές διότι g ˆ ηˆ + + ˆ ˆ z z. ˆ * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * Obrvd and Epctd Frqunc Numbr of Obrvd Epctd Z Subjct Rpon Rpon Rdual Prob -,5 59, 6, 7,6 -,6,98 -,3 6, 3,,59,48,753 -,57 6, 8, 9, -,,3645 -,4 56, 8, 9,955 -,955,5349,6 63, 5, 49,5,795,783,64 59, 53, 54,734 -,734,9769, 6, 6, 6,8,78,98,34 6, 6, 59,74,6,99566 Όμοια, για Probt lnk ροκύτει ότι:
* * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * DATA Informaton 8 unwghtd ca accptd. ca rjctd bcau of mng data. ca ar n th control group. MODEL Informaton ONLY Normal Sgmod rqutd. * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * Paramtr tmat convrgd aftr 7 traton. Optmal oluton found. Paramtr Etmat PROBIT modl: PROBITp Intrcpt + B: Rgron Coff. Standard Error Coff./S.E. Z,5996,4433,64 Z,3564,3979,5544 Intrcpt Standard Error Intrcpt/S.E.,94,98,9735 Paron Goodn-of-Ft Ch Squar,978 DF 5 P,73 Snc Goodn-of-Ft Ch quar NOT gnfcant, no htrognty factor ud n th calculaton of confdnc lmt. - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Covarancblow and Corrlatonabov Matrc of Paramtr Etmat Z Z Z,83,67889 Z,37,954 Άρα, γ.94, γˆ.5996, γˆ.3564, γˆ.98, γˆ.4433, γˆ. 3979 ˆ και εομένως, ˆ.79345.79345 ˆ ˆ ˆ.94.5996 +.3564 8.7.674563.674563 ˆ.5996.79345 ˆ ˆ.3564 54.5.674563.674563.3564 ˆ ˆ 77.7.674563 με ˆ 4.79345.79345.83 +.954.37 985.7 4 3.674563.674563.674563 και.954 943.7 4.674563 * * * * * * * * * * * * P R O B I T A N A L Y S I S * * * * * * * * * * * * Obrvd and Epctd Frqunc Numbr of Obrvd Epctd Z Subjct Rpon Rpon Rdual Prob -,5 59, 6, 6,59 -,59,66 -,3 6, 3,,9,89,885 -,57 6, 8, 9,95 -,95,38 -,4 56, 8, 9,98 -,98,53536,6 63, 5, 48,76 3,84,7647,64 59, 53, 54,44 -,44,97, 6, 6, 6,86 -,86,9856,34 6, 6, 59,9,88,99854
Παρατηρούμε και εδώ ότι τα δύο μοντέλα θεωρούνται ικανοοιητικά για την εριγραφή των δεδομένων σε είεδο σημαντικότητας.5 logt 3.4, probt.978 < χ 5,.5.7. Ελάχιστα καλύτερο θεωρείται το Probt μοντέλο με το μικρότερο του Paron. Για να εξετάσουμε αν ελτιώνεται σημαντικά η ροσαρμογή του κάθε μοντέλου θα ελέγξουμε την υόθεση H : η + H : η + + Θέλουμε δηλαδή να ελέγξουμε αν ισχύει η Η : gμ Χ έναντι του μεγαλύτερου μοντέλου Η : gμχ. Ως γνωστό, για έλεγχο αυτής της μορφής αορρίτουμε την Η όταν Paron ' Paron > χ χ χ p p; a 3 ; a Αν α.5 ισχύει ότι, 5. 384. και άρα για τα αραάνω μοντέλα είναι.7 3.4 7. > 3.84 logt : ελτιώνεται η ροσαρμ. του μοντ. Paron ' Paron 9.53.978 6.53 > 3.84 Probt, : ελτιώνεται η ροσαρμ. του μοντ. Ισοδύναμος έλεγχος μορεί να γίνει χρησιμοοιώντας και το Dvanc. Εναλλακτικά, θα μορούσαμε να ελέγξουμε την υόθεση Η : έναντι της Η : εξετάζοντας αν το ανήκει στο δ.ε. του σε κάθε μοντέλο όμοια με αραάνω ερώτημα. Συγκεκριμένα τα ροσεγγιστικά δ.ε. συντελεστού 95% θα είναι ˆ ± Z 43., 69.8 logt, 7.3, 37.3 probt.5 και εομένως αορρίτουμε ότι για το Logt και Probt μοντέλο. Τέλος, και άλι ζητείται η γραφική αράσταση της καμύλης ου εκφράζει την σχέση μεταξύ της εκτιμημένης ιθανότητας ˆ εξουδετέρωσης ενός εντόμου και της συγκέντρωσης ε- ντομοκτόνου ου χρησιμοοιούμε [.5, ]. Στο logt και probt μοντέλο αντίστοιχα ισχύει τώρα ότι ˆ ˆ + + ˆ ˆ ˆ ˆ, ˆ ˆ ˆ ˆ Φ + + + + + τα ˆ ˆ,, είναι διαφορετικά στα δύο μοντέλα. Εργαζόμαστε αρόμοια με αραάνω ερώτημα: - Σχηματίζουμε τη στήλη με 5 αριθμούς αό το έως το 5, και σχηματίζουμε τη νέα μεταλητή g /5*.5+.5 η οοία θα αίρνει 5 τιμές αό το.5 έως το. - Σχηματίζουμε τις νέες μεταλητές plogt Ep43.-5.6*g+56.4*g**/+Ep43.-5.6*g+56.4*g** pprobt CDF.NORMAL8.-54.5*g+77.3*g**,, οι τιμές της ˆ στα 5 σημεία g για το logt και probt μοντέλο αντίστοιχα. - Εκτελούμε τη διαδικασία Scattrplot/ovrlay με Υ-Χ par: py/m --, pprobt -- g, plogt -- g θα χρειαστεί και άλι να ροσθέσουμε στις μεταλητές, p άλλες 5 8 τιμές. - Ανοίγουμε τον SPSS Chart Edtor και ενώνουμε τα 5 σημεία ου αφορούν το plogt με Format/ntrpolaton/traght ln αράλληλα τα μικραίνουμε με Format/Markr/Tny και εαναλαμάνουμε το ίδιο και για τα σημεία ου αφορούν το pprobt κάνοντας διακεκομμένες τις συγκεκριμένες γραμμές. Αό τα αραάνω ροκύτει το εόμενο γράφημα το οοίο μας δίνει τις καμύλες ου αριστούν την σχέση μεταξύ της εκτιμημένης ιθανότητας ˆ εξουδετέρωσης ενός εντόμου, a
και της συγκέντρωσης εντομοκτόνου [.5, ] στα μεγαλύτερα logt και probt μοντέλα μαζί με τα 8 αρατηρούμενα σημεία.,,,8,6,4, PPROBIT G PLOGIT G,,4,5,6,7,8 Βλέουμε ότι οι εκτιμημένες καμύλες του είναι αρκετά κοντά στις αρατηρούμενες τιμές, y /m και στα δύο μοντέλα έχουμε ήδη δει ότι έχουν ερίου ίδιο Χ του Paron. Παρατηρούμε όμως ότι οι εκτιμημένες καμύλες αρουσιάζουν μία μη αοδεκτή συμεριφορά για <.69 διότι δεν είναι λογικό να δεχτούμε ότι η μείωση της συγκεντρώσεως του εντομοκτόνου αυξάνει την ιθανότητα εξουδετέρωσης ενός εντόμου. Εομένως οι καμύλες είναι αοδεκτές μόνο στην εριοχή των αρατηρήσεων >.69.,9,, PI 9 Υενθυμίζεται ότι η εκτίμηση των γίνεται χρησιμοοιώντας την εαναλητική διαδικασία m T W m όου στη διωνυμική κατανομή, m m y m m m m m z g + η, W dag m m m m g Αν χρησιμοοιήσουμε logt lnk, τότε g log g και αντικαθιστώντας στον αραάνω αναγωγικό τύο τελικά θα έχουμε ότι m m y m m m m m z + η, dag[ m ] m m W m και m m T m m m p η η, g η. m + p η Ως αρχικό σημείο ειλέγουμε: y / m, y, m.5 / m, y, η g..5 / m, y m T T ή θα μορούσαμε να είχαμε ξεκινήσει ειλέγοντας p, p y / m. Θα ραγματοοιήσουμε 4 ήματα της αραάνω εαναλητικής διαδικασίας. Εειδή m T W m T T W W m m z z m m
m m τα υολογίζονται χρησιμοοιώντας WLS στη Lnar Rgron με dpndnt: z, m ndpndnt:, wght: W. Υενθυμίζεται ότι αν έχουμε το μοντέλο Y +, ~ N, σ V σ dag[ v ] δηλαδή, οι διασορές των σφαλμάτων V σ v είναι σταθμισμένες με άρη V dag [/ ], τότε! T T V V Υ με V σ T V v ο ήμα: py/m εκτός της 8 ης αρατήρησης ου αντι άζουμε.99 pr_lnp/-p z pr_+y-m*p/m*p*-p wm*p*-p pr_untandardzd prdctd valu Lnar Rgron: Dp->z, Indp->, WLS wght->w Modl Contant a. Dpndnt Varabl: Z Untandardzd Coffcnt Coffcnt a,b Standard zd Coffcn t B Std. Error Bta t Sg. -58,4 6,737-8,65, 3,795 3,85,96 8,6, b. Wghtd Lat Squar Rgron - Wghtd by W MSE.684, ο ήμα: peppr_/+eppr_ zpr_+y-m*p/m*p*-p wm*p*-p pr_untandardzd prdctd valu Lnar Rgron: Dp->z, Indp->, wght->w Modl Contant a. Dpndnt Varabl: Z Untandardzd Coffcnt Coffcnt a,b Standard zd Coffcn t B Std. Error Bta t Sg. -6,68 6,9-9,745, 34,9 3,495,97 9,788, b. Wghtd Lat Squar Rgron - Wghtd by W MSE.567, 3 ο ήμα: peppr_/+eppr_ z pr_+y-m*p/m*p*-p wm*p*-p pr_3untandardzd prdctd valu Lnar Rgron: Dp->z, Indp->, wght->w Coffcnt a,b Modl Contant a. Dpndnt Varabl: Z Untandardzd Coffcnt Standard zd Coffcn t B Std. Error Bta t Sg. -6,77 6,676-9,94, 34,7 3,753,966 9,3, b. Wghtd Lat Squar Rgron - Wghtd by W MSE.667, 4 ο ήμα: p3eppr_3/+eppr_3 z3 pr_3+y-m*p3/m*p3*-p3 w3m*p3*-p3 pr_4untandardzd prdctd valu Lnar Rgron: Dp->z3, Indp->, wght->w3
Modl Contant a. Dpndnt Varabl: Z3 Untandardzd Coffcnt Coffcnt a,b Standard zd Coffcn t B Std. Error Bta t Sg. -6,77 6,697-9,66, 34,7 3,765,966 9,3, b. Wghtd Lat Squar Rgron - Wghtd by W3 MSE.67, Ο ίνακας των δεδομένων εριέχει τις μεταλητές: m y p pr_ z w pr_ p z w pr_,697 59 6,7 -,8 -,8 5,39 -,65736,7 -,7 3,6 -,7774,74 6 3,67 -,9 -,9,8 -,55873,7 -,6 8,6 -,6575,755 6 8,93 -,89 -,89,77 -,549,37 -,87 4,4 -,5659,784 56 8,5,, 4,,4896,6 -, 3,43,4676,83 63 5,854,55,55 9,8,977,79,53,6,3538,8369 59 53,8983,8,8 5,39,375,89,8 5,57,955,86 6 6,9839 4, 4,,98,976,95 3,65,99 3,5397,8839 6 6,99 4,6 5,6,59 3,6786,98 4,7,44 3,83735 p z w pr_3 p3 z3 w3 pr_4,6 -, 3,7 -,7766,6 -, 3,5 -,7766,6 -,5 8,4 -,6855,6 -,4 8,3 -,6856,36 -,88 4,3 -,5668,36 -,88 4,3 -,5668,6 -, 3,38,4766,6 -, 3,38,4766,79,54,8,35638,8,54,6,35639,9,8 5,7,337,9,8 5,6,337,95 3,73,67 3,596,96 3,73,65 3,596,98 4,86,4 3,8444,98 4,87,3 3,8444 Συγκεντρωτικά θα είναι m ˆ m ˆ m ˆ m MSE m ˆ m 58.4 3.795 6.737 3.85.684 6.68 34.9 6.9 3.495.567 3 6.77 34.7 6.676 3.753.667 4 6.77 34.7 6.697 3.765.67 Υενθυμίζεται ότι χρησιμοοιώντας τη διαδικασία Analyz/Rgron/Probt για Logt lnk το SPSS μας είχε αυτόματα δώσει: ˆ 6.7, 34.7, 5.8,. 9 Παρατηρούμε ότι οι αραάνω τιμές ταιριάζουν αόλυτα με τις τιμές ου ήραμε αό την εαναλητική διαδικασία με μόλις 4 ήματα. Οι εκτιμήσεις των, ˆ ροκύτουν αό τις ˆ m, ˆ m αρατηρώντας ότι: Οι εκτιμήσεις των διασορών των ˆ ˆ, στα GLM ως γνωστό δίνονται αό τα διαγώνια στοιχεία του ίνακα ˆ Χ T m W, όου Ŵ είναι ο τελευταίος ίνακας W ου χρησιμοοιήθηκε στην εαναλητική διαδικασία ˆ T ~ N, Χ W. Είσης, όως αναφέρθηκε και αραάνω, στα σταθμισμένα ελάχιστα τετράγωνα ο ίνακας διασορών των αραμέτρων είναι ο V σ T V και συνεώς η Lnar Rgron με WLS στο τελευταίο ήμα της εαναλητικής διαδικασίας δίνει ως εκτιμήσεις των τυικών αοκλίσεων των αραμέτρων στον ίνακα
με τα coffcnt tandard rror of coffcnt τις ρίζες των διαγωνίων στοιχείων του ίνακα ˆ W W T m T όου MSE m. Άρα τελικά, 5.8.67 6.697 ˆ ˆ m m MSE, 9..67 3.765 ˆ ˆ m m MSE