ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ Άσκηση. Να απαντήσετε στα ερωτήματα -7 της άσκησης χρησιμοποιώντας c-log-log lnk (χρησιμοποιήστε το πολύ 4 επαναλήψεις της επαναληπτικής μεθόδου. Ποιο είναι το καλύτερο μοντέλο από τα 3 (logt, probt, c-log-log; Λύσεις Άσκησης. Να εκτιμηθούν (σημειακά και με δ.ε. 95% οι παράμετροι β, β και να δοθούν οι εκτιμημένες τιμές των y όταν το μοντέλο που χρησιμοποιείται είναι c-log-log Η εκτίμηση των β γίνεται χρησιμοποιώντας την επαναληπτική διαδικασία ( m T T β = ( W W z όπου στη διωνυμική κατανομή, y m π m z = g (π + η, W = dag m π ( π g (π Αν χρησιμοποιήσουμε c-log-log, τότε g ( π = ln( ln( π g ( π = και α- ( π ln( π ντικαθιστώντας στον παραπάνω αναγωγικό τύπο τελικά θα έχουμε ότι y m π m ( π (ln( π z = + η m m, W = dag ( ( m ( π ln( π π και Ως αρχικό σημείο επιλέγουμε T η = x β, π = g ( η = exp( exp( η. y / m, y, m ( ( ( π =.5 / m, y =, η = g( π..5 / m, y = m Θα πραγματοποιήσουμε 4 βήματα της παραπάνω επαναληπτικής διαδικασίας. ο βήμα p=y/m (εκτός της 8 ης παρατήρησης που αντι βάζουμε.99 pre_=ln(-ln(-p z= pre_-(y-m*p/(m*(-p*ln(-p w=m*(-p*(ln(-p**/p pre_=unstandard predcted values (Lnear Regresson Dep->z, Indep->x, WLS wegh->w a. Dependent Varable Z Unstandard Coeffcen Coeffcen a,b Standard Coeffcen B Std. Error Beta t Sg. -38,343,75-6,85,,354,59,99 6,956, b. Weghted Least Squares Regresson - Weghted by W MSE =,683, ο βήμα p=-exp(-exp(pre_ z=pre_-(y-m*p/(m*(-p*ln(-p w= m*(-p*(ln(-p**/p pre_=unstandard predcted values (Lnear Regresson Dep->z, Indep->x, wegh->w
a. Dependent Varable Z Unstandard Coeffcen Coeffcen a,b Standard Coeffcen B Std. Error Beta t Sg. -39,56,9-7,4,,5,7,99 7,3, b. Weghted Least Squares Regresson - Weghted by W MSE =,536, 3 ο βήμα p=-exp(-exp(pre_ z= pre_-(y-m*p/(m*(-p*ln(-p w= m*(-p*(ln(-p**/p pre_3=unstandard predcted values (Lnear Regresson Dep->z, Indep->x, wegh->w Coeffcen a,b a. Dependent Varable Z Unstandard Coeffcen Standard Coeffcen B Std. Error Beta t Sg. -39,573,396-6,53,,4,33,989 6,564, b. Weghted Least Squares Regresson - Weghted by W MSE =,5484, 4 ο βήμα p3=-exp(-exp(pre_3 z3= pre_3-(y-m*p3/(m*(-p3*ln(-p3 w3= m*(-p3*(ln(-p3**/p3 pre_4=unstandard predcted values (Lnear Regresson Dep->z3, Indep->x, wegh->w3 Coeffcen a,b a. Dependent Varable Z3 Unstandard Coeffcen Standard Coeffcen B Std. Error Beta t Sg. -39,57,4-6,48,,4,333,989 6,53, b. Weghted Least Squares Regresson - Weghted by W3 Ο πίνακας των δεδομένων περιέχει τις μεταβλητές MSE =,549, x m y p pre_ z w pre_ p z w pre_,697 59 6,7 -,3 -,3 5,99 -,395, -,3 5,96 -,356,74 6 3,67 -,4 -,4,94 -,5388, -,4,7 -,56756,755 6 8,93 -,7 -,7 7,8 -,869,34 -,6,4 -,8859,784 56 8,5 -,37 -,37 6,9 -,46,54 -,36 8,93 -,4665,83 63 5,854,56,56 4,59,3368,75,54 4,4,34996,8369 59 53,8983,83,83 34,9,8875,9,8 33,75,9355,86 6 6,9839,4,4 7,3,39739,98,4 8,8,444,8839 6 6,99,53,74,85,8864,,4 3,57,9486
p z w pre_3 p3 z3 w3 pre_4,9 -,3 5,6 -,373,9 -,3 5,58 -,373,9 -,4,5 -,56894,9 -,4,4 -,56893,34 -,6,67 -,88566,34 -,6,66 -,88565,54 -,36 8,87 -,4646,54 -,36 8,87 -,4646,76,55 4,49,3586,76,55 4,49,3586,9,8 33,4,95,9,8 33,,95,99,4 6,3,4463,99,4 6,3,4463,,9,65,956,,9,6,955 Συγκεντρωτικά θα είναι m ˆ ( m β β ˆ ( m β ˆ ( m β ˆ ( m s = MSE (m -38.343.354.75.59.683-39.56.5.9.7.536 3-39.573.4.396.33. 5484 4-39.57.4.4.333. 549 = ( ˆ ( s β m.4 ( m MSE.549 ˆ ( m (.333 3.4, ˆ s β β =. 799 ( m MSE.549 Και εδώ, τα διαστήματα εμπιστοσύνης υπολογίζονται κάτω από την παραδοχή ότι τα β α- κολουθούν κανονική κατανομή με μέση τιμή β και διασπορά s ( β ˆ (κάτι που ισχύει προσεγγιστικά για μεγάλο δείγμα. Ένα (προσεγγιστικό δ.ε. συντ. 95% για το β θα είναι το ( ˆ ˆ ± β Z.5 = ( 39.57 ± 3.4.96 = ( 45.9, 33. β. Όμοια βρίσκουμε ένα (προσεγγιστικό δ.ε. συντ. 95% για το β ( ˆ ± β Z.5 = (.4±.799.96 = (8.55, 5.567 οι εκτιμημένες τιμές των y υπολογίζονται μέσω του τύπου y_est =m*(- Exp(-Exp(-39.57+.4*x και είναι 5.59,.8,.95, 3.37, 47.78, 54.4, 6., 59.95. 7 Να υπολογιστούν τα κατάλοιπα Pearson και devance. 3 Δώστε την απόκλιση (devance και το Χ του Pearson. Υπενθυμίζεται ότι τα κατάλοιπα Pearson είναι τα P y m πˆ r = m πˆ ( πˆ ενώ τα κατάλοιπα απόκλισης δίνονται από τον τύπο r D = sgn( y m πˆ y y ln m πˆ Για το c-log-log lnk Αρχικά υπολογίζουμε (με compute τα πˆ ep = -Exp(-Exp(pre_4 Στη συνέχεια σχηματίζουμε τα κατάλοιπα Pearson r_p = (y-m*ep/(m*ep*(-ep**.5 P r m y + ( m y ln m m πˆ
και τα κατάλοιπα Devance r D r_d = (y-m*ep/abs(y-m*ep*(**.5*abs(y*ln(y/(m*ep +(m-y*ln((m-y/(m-m*ep**.5 Από τα παραπάνω προκύπτει ο ακόλουθος πίνακας στον SPSS Data Edtor x m y p ep r_d r_p,697 59 6,7,947,86,85,74 6 3,67,88,5577,568,755 6 8,93,338 -,833 -,793,784 56 8,5,543 -,6344 -,6355,83 63 5,854,7584,888,43,8369 59 53,8983,977 -,537 -,543,86 6 6,9839,9857 -,88 -,,8839 6 6,,999,35,98 Η στήλη r_p περιέχει τα κατάλοιπα Pearson, ενώ η στήλη r_d περιέχει τα κατάλοιπα απόκλισης. (c-log-log lnk. Με βάση τα παραπάνω αποτελέσματα μπορούμε να υπολογίσουμε και τα Χ του Pearson και το Devance ως εξής Υπολογίζουμε τα r_p = r_p**, r_d = r_d** και εκτελούμε τη διαδικασία Analyze/Descrptve Statcs/Descrptves/ r_p, r_d (optons sum από όπου (sums προκύπτει ότι = 3,946937373 και D =3,4464387335 n D διότι D c, f = ( r, Pearson = r = n = P (. 4 Είναι τo μοντέλo ικανοποιητικό; (α=.5. Είναι γνωστό ότι απορρίπτουμε την H g(μ = Χβ όταν y, μˆ > χ ή > χ Dc, f ( n p; a Παρατηρούμε το μοντέλο θεωρείται ικανοποιητικό για την περιγραφή των δεδομένων διότι = 3,9 και D =3,44 < χ. 59 αντίστοιχα. 6,.5 5 Να γίνει ο έλεγχος της υπόθεσης H β =, με εναλλακτική β, δηλαδή ότι το αποτέλεσμα δεν εξαρτάται από την δόση. Θα χρησιμοποιήσουμε το δ.ε. 95% του β που υπολογίστηκε παραπάνω ( 8.55, 5.567. Επειδή το δεν ανήκει στο δ.ε. 95% απορρίπτουμε την υπόθεση H β = με εναλλακτική την H β, σε ε.σ. 5%. Pearson n p; a 6 Να κάνετε τη γραφική παράσταση πˆ ( x, x (.6,.9 σε κάθε μοντέλο μαζί με τα (x, y /m Στο logt, probt και c-log-log μοντέλο αντίστοιχα ισχύει ότι + x e π ˆ( x =, ˆ ˆ + x π ˆ( x = Φ( β + x + βx, πˆ ( x = exp{ e } + e (τα β ˆ ˆ, β προφανώς είναι διαφορετικά στα τρία μοντέλα. Με το SPSS Αρχικά σχηματίζουμε μία νέα στήλη με π.χ. 3 αριθμούς από το έως το 3. (,,,..., 3. Στη συνέχεια σχηματίζουμε (compute τη νέα μεταβλητή xg = /3*.3+.6
ή οποία θα παίρνει 3 τιμές από το.6 έως το.9. Στη συνέχεια σχηματίζουμε (compute τις νέες μεταβλητές plogt = Exp(-6.7+34.7*xg/(+Exp(-6.7+34.7*xg pprobt = CDF.NORMAL(-34.93+9.73*xg,, pcloglog = - Exp(-Exp(-39.57+.4*xg οι οποίες μας δίνουν τις τιμές της πˆ ( x στα 3 σημεία x = xg για τα τρία μοντέλα. Το γράφημα της πˆ ( x (και για τα τρία μοντέλα πάνω στα 3 αυτά σημεία μαζί με τα 8 σημεία (x, y /m δίνεται από την διαδικασία Scatterplot/overlay με Υ-Χ pars p(=y/m -- x, pprobt -- xg, plogt -- xg. (Θα χρειαστεί και πάλι να προσθέσουμε στις μεταβλητές x, p άλλες 3 8 γραμμές (π.χ. επαναλαμβάνοντας την 8 η παρατήρηση 3 ακόμη φορές για να μην θεωρεί το πακέτο τις γραμμές 9 έως 3 στα xg, plogt, pprobt ως mssng values. Μετά από κατάλληλη επεξεργασία λαμβάνουμε το επόμενο γράφημα το οποίο μας δίνει τις καμπύλες που παριστούν την σχέση μεταξύ της εκτιμημένης πιθανότητας πˆ ( x εξουδετέρωσης ενός εντόμου και της συγκέντρωσης εντομοκτόνου x στα τρία μοντέλα μαζί με τα 8 παρατηρούμενα σημεία (ποσοστό των νεκρών εντόμων σε σχέση με τη συγκέντρωση του εντομοκτόνου.,,,8,6 PCLOGLOG,4 G PPROBIT, G PLOGIT, G P -,,5,6,7,8,9, 8 Ποιο είναι το καλύτερο μοντέλο από τα 3 (logt, probt, c-log-log; Καλύτερο μοντέλο όμως μπορεί να θεωρηθεί το c-log-log εφ όσον παρουσιάζει το μικρότερο Devance και Χ του Pearson.