Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 0 ου Πανελληνίου Συνεδρίου Στατιστικής (007), σελ 09-6 ΒΕΛΤΙΣΤΟΙ ΣΧΕΔΙΑΣΜΟΙ ΣΕ ΑΝΟΜΟΙΟΓΕΝΕΙΣ ΠΛΗΘΥΣΜΟΥΣ Στρατής Κουνιάς Ομότιμος Καθηγητής, Πανεπιστήμιο Αθηνών sounas@math.uoa.gr ΠΕΡΙΛΗΨΗ Δίνονται αρχικά οι βέλτιστοι πειραματικοί σχεδιασμοί, όταν υπάρχουν n ομοιογενείς πειραματικές μονάδες και δύο ή περισσότερες αγωγές, δίνονται επίσης οι βέλτιστοι σχεδιασμοί, όταν οι μονάδες είναι ανομοιογενείς κατά ένα χαρακτηριστικό (column desgns). Τέλος δίνονται οι βέλτιστοι σχεδιασμοί σε πληθυσμούς που είναι ανομοιογενείς σε δύο χαρακτηριστικά (row-column desgns), όταν υπάρχουν δύο αγωγές και μια παρατήρηση ανά κυψέλη. Γίνεται εφαρμογή της θεωρίας με παραδείγματα.. ΕΙΣΑΓΩΓΗ. Σε ένα γραμμικό μοντέλο, όταν μας δίνονται n πειραματικές μονάδες, τις οποίες καλούμε μονάδες (unts), μας ενδιαφέρει η εκτίμηση μερικών από τις παραμέτρους. Σε πρώτο στάδιο θεωρούμε τις παρατηρήσεις ασυσχέτιστες με σταθερή διασπορά και εξετάζουμε διάφορα μοντέλα. Στην εργασία αυτή δίνεται μια σύντομη επισκόπηση της περιοχής.. ΟΜΟΙΟΓΕΝΕΙΣ ΠΛΗΘΥΣΜΟΙ. Ομοιογενής πληθυσμός, δύο αγωγές Y + = μ Α e = μ Β e Y +, όταν εφαρμόζεται η αγωγή Α, όταν εφαρμόζεται η αγωγή Β Η μέθοδος ελαχίστων τετραγώνων δίνει, μα ΥΑ Y A / s 0 = με πίνακα διασποράς V = σ, όπου s μβ ΥΒ YB 0 /( n s) είναι το πλήθος των μονάδων που εφαρμόζεται η αγωγή Α και n-s είναι το πλήθος των μονάδων που εφαρμόζεται η αγωγή Β. Μας ενδιαφέρει η εκτίμηση της διαφοράς τους, με την ελάχιστη δυνατή διασπορά. n s = n s = n / n = 0mod var( μ α μ ) = σ Β s( n s) s = ( n ) / ; ή s = ( n + ) / n = mod Με ελάχιστη διασπορά - 09 -
4 / n n = 0mod var( μ α μ ) = σ Β 4 /( n (/ n)) n = mod. Ομοιογενής πληθυσμός, αγωγές: Οι αγωγές είναι A,..., A και το πλήθος των μονάδων, στις οποίες εφαρμόζονται αυτές οι αγωγές, είναι αντίστοιχα n,, n, n + + n = n, τότε Y μ + e, =,,, =,..., n = Α Η μέθοδος ελαχίστων τετραγώνων δίνει, μ Υ / n 0 0 [ ] μ Υ = = 0 / n μ = V ( μ) σ 0 μκ Υ 0 0 / n Μας ενδιαφέρει να βρούμε το σχεδιασμό που ελαχιστοποιεί μια συνάρτηση φ n,, n ) των διασπορών τους, όπως το άθροισμα των διασπορών (Α-βέλτιστος), ( ή το γινόμενο των διασπορών (D-βέλτιστος), κ.λπ.. Παρατηρούμε ότι ο n γράφεται n n = m + s, m = [ ], 0 s < Ορίζουμε το σχεδιασμό d που δίνει σε s αγωγές από (m+) μονάδες και στις υπόλοιπες (-s) αγωγές από m μονάδες, χρησιμοποιούνται έτσι και οι n μονάδες. Ο συμβολισμός δ b σημαίνει ότι το διάνυσμα b = ( n,, n ) υπερέχει του διανύσματος δ = ( m +,..., m +, m,, m) (δ s maorzed by b), επομένως για κάθε αυστηρά κυρτή συνάρτηση g : (0; ) R ισχύει (Puelshem pp44-46), g(δ ) g( b = = Οι συναρτήσεις ( ) g( x) = / x, x > 0, ( ) g( x) = log( x), x > 0, ( ) ( λmn ( V )) είναι αυστηρά κυρτές, επομένως ο σχεδιασμός δ είναι καθολικά βέλτιστος, που σημαίνει ότι είναι και A,D,E, βέλτιστος..3 Ομοιογενής πληθυσμός, - αγωγές και ένας μάρτυρας, >. Το μοντέλο για τις κ αγωγές, που σε κάθε παρατήρηση εφαρμόζεται μια από τις κ αγωγές, είναι: Ε( Y) = μα + μα + + μα, Y : nx, : nx όπου, =,..., έχει στις θέσεις που εφαρμόζεται η -στή αγωγή και 0 αλλού, τότε + + =. Επομένως το μοντέλο γράφεται, Ε Y) = μ + ( μ μ ) + + ( μ μ (.) ( Α Α Α Α ) - 0 - )
Μας ενδιαφέρει η εκτίμηση των μ μ ),,( μ μ ), ο πίνακας ( Α Α Α διασποράς τους, που δίνει η μέθοδος ελαχίστων τετραγώνων, είναι: μα μα 0 0 n n μα μα V = σ Q, Q = 0 0 [ n ] (.) n 0 0 μ μα όπου n =,..., είναι το πλήθος των παρατηρήσεων της -στης αγωγής, με, n + + + = n, n > 0 =,...,, Αν για κάποιο είναι n = 0, τότε δεν θα ήταν εκτιμήσιμη η διαφορά μ μ ), αν n = 0 δεν θα ήταν ( Α Α εκτιμήσιμες οι διαφορές μ μ ),,( μ μ ). ( Α Α Α Στην περίπτωση αυτή δεν είναι γνωστό αν υπάρχει καθολικά βέλτιστος σχεδιασμός, όμως εξετάζουμε Α και D βέλτιστους σχεδιασμούς, όταν η τιμή των παρατηρήσεων για το μάρτυρα είναι: () Προσδιορισμένη, (ιι) Χωρίς περιορισμό. Θεώρημα. Αν: (ι) Η τιμή είναι δοσμένη και n n = ( ) m + c, 0 c < (.3) τότε ο Α και D βέλτιστος σχεδιασμός, για την εκτίμηση των διαφορών μ μ ),,( μ μ ), είναι να πάρουμε (m+) παρατηρήσεις σε c από ( Α Α Α τις αγωγές A,..., A () Η τιμή n και m παρατηρήσεις στις υπόλοιπες (--c) αγωγές.. δεν είναι δοσμένη και n = r + d, 0 d < (.4) τότε ο D βέλτιστος σχεδιασμός, για την εκτίμηση των διαφορών μ μ ),,( μ μ ), είναι να πάρουμε (r+) παρατηρήσεις σε d από ( Α Α Α τις αγωγές A A,..., και r παρατηρήσεις στις υπόλοιπες (-d) αγωγές. Για τον Α βέλτιστο σχεδιασμό επιλέγουμε το ώστε να ελαχιστοποιείται η παράσταση: n ( ) m( ) n +, m( ) = [ ], m( ) + ( m( ) + ) m( ) Απόδειξη. Ο αντίστροφος του πίνακα Q που δίνεται στη (.) είναι: Q / n n 0 = 0 0 + J n 0 0 / n 0 n (.5) Από τη (.5) βρίσκουμε: trace ( Q ) = ( + ), det ( Q ) = n( n ) από τις = n = οποίες προκύπτει ότι το ελάχιστο πετυχαίνεται αν n n,, =,..., - -
στην περίπτωση () και n n,, =,..., στην περίπτωση (). Από την παρατήρηση αυτή προκύπτουν και οι βέλτιστοι σχεδιασμοί που δίνονται στο θεώρημα. Δεν υπάρχει επομένως καθολικά βέλτιστος σχεδιασμός αφού οι Α και D βέλτιστοι δεν είναι ίδιοι Η περίπτωση της A βελτιστοποίησης έxει δοθεί από τους Hedayat, Jacroux, Maumdar (988). 3. ΑΝΟΜΟΙΟΓΕΝΕΙΣ ΠΛΗΘΥΣΜΟΊ ΔΥΟ ΑΓΩΓΕΣ 3. Ανομοιογένεια με ένα χαρακτηριστικό (column effects model) Έχουμε αγωγές και p παρατηρήσεις σε στήλες (blocs) των p μονάδων. Το μοντέλο στην περίπτωση αυτή, σε απλή και σε διανυσματική μορφή, είναι: Y = c + τ d (, ) + e =,..., p, =,..., (3.) Y c x + + ~ x + ( τ + e (3.) = ~ c Α τ Β ) Α Τα διανύσματα x =,..., είναι (p)x και έχουν p στοιχεία, που αντιστοιχούν στη στήλη, ίσα με και τα υπόλοιπα p(-) στοιχεία ίσα με 0, τ d { τ Α, τ } είναι η επίδραση της αγωγής που εφαρμόζεται στη μονάδα της (, ) Β στήλης σύμφωνα με το σχεδιασμό d, A είναι η επίδραση της στήλης. Το διάνυσμα είναι (p)x και έχει στα κελιά που εφαρμόζεται η αγωγή Α και 0 αλλού, c ~ = + τ. Μας ενδιαφέρει που θα εφαρμοστούν οι αγωγές Α και Β για να c Β ελαχιστοποιηθεί η διασπορά της διαφοράς ( τ Α τ Β ). Η μέθοδος ελαχίστων τετραγώνων μας δίνει, b ( p b )( τ τ ) = Y ( b Y ) (3.3) c Α Β A p = = var( τ Α τ ) = σ ( b Β = ( p b Y A είναι το άθροισμα των παρατηρήσεων της αγωγής παρατηρήσεων στη στήλη, )) / p (3.4) Y είναι η μέση τιμή των b =,..., είναι το πλήθος των παρατηρήσεων της αγωγής Α στη στήλη Επομένως ο βέλτιστος σχεδιασμός είναι: Αν ο p είναι άρτιος παίρνουμε σε κάθε στήλη p/ παρατηρήσεις από κάθε αγωγή, αν ο p είναι περιττός, παίρνουμε σε κάθε στήλη (p+)/ παρατηρήσεις από τη μία αγωγή και (p-)/ παρατηρήσεις από την άλλη αγωγή, με διασπορά, 4 /( p) αν p άρτιος var( τ Α τ Β ) = σ 4 /( p ( / p)) αν p περιττ ός - -
3. Ανομοιογένεια με δύο χαρακτηριστικά (row-column effects model) Όταν κάθε μονάδα έχει δύο χαρακτηριστικά, π.χ. άτομα με διαφορετικά επίπεδα χοληστερίνης και ζάχαρου και έχουμε n = p άτομα (μονάδες), τότε μας ενδιαφέρει σε ποια άτομα θα εφαρμοστεί η αγωγή Α και σε ποια η αγωγή Β. Το μοντέλο στην περίπτωση αυτή είναι: Y = r + c + τ d (, ) + e =,..., p, =,..., (3.5) όπου r, c, τ d (, ) είναι οι επιδράσεις της -στης γραμμής, της -στης στήλης και της αγωγής που εφαρμόζεται στο κελί (,) σύμφωνα με το σχεδιασμό d. Τα παρακάτω είναι ένα παράδειγμα με p=4,=5 Α Β Α Β Α Β Β Α Α Β Α Β Β Α Β Α Β Α Β Α O Wald(943) απέδειξε ότι τα Λατινικά τετράγωνα p=, με πλήθος w=p αγωγών είναι D-βέλτιστος σχεδιασμός, ο Kefer(958, 975) έλυσε την περίπτωση p=0modw, =0modw, όρισε την καθολική βελτιστοποίηση (unversal optmalty) και έδωσε κριτήρια για να είναι ένα σχεδιασμός καθολικά βέλτιστος. Ο Sonnemann(98, 985) εξέτασε την περίπτωση με w= αγωγές.. Επίσης οι Gafe (977), Kraft (977, 978), μελέτησαν την περίπτωση p==w. Με w= αγωγές ασχολήθηκαν και οι Morgan and Uddn (003), ο Uddn (005) μελέτησε την περίπτωση που είναι μερικά κελιά άδεια. O Agrawal (966) ασχολήθηκε με την κατασκευή τέτοιων σχεδιασμών και ο Martn (996) κάνει μια ανασκόπηση της βιβλιογραφίας. Το μοντέλο (3.5), σε διανυσματική μορφή γράφεται, Y = r φ + + rpφ p + cx + + c x + τ Α Α + τ ΒΒ + e (3.6) Το (p)x διάνυσμα φ ( x ) έχει στις p() θέσεις της γραμμής ( στήλης) και 0 αλλού, το διάνυσμα A ( B ) έχει όταν στο συγκεκριμένο κελί εφαρμόζεται η αγωγή Α (Β) και 0 αλλού. Εδώ ενδιαφερόμαστε για την εκτίμηση της διαφοράς τ = ( τ Α τ Β ), εξάλλου σύμφωνα με τα μοντέλα (3.5) και (3.6), οι παράμετροι τ Α, τ Β δεν είναι εκτιμήσιμες, ενώ η διαφορά τους τ = ( τ Α τ Β ) είναι εκτιμήσιμη. Επειδή A + B = και φ + + φ p = x + + x =, το (3.6) γράφεται, Y r φ + + r φ + c x + + c~ x + ( τ + e (3.7)) = ~ p p Α τ Β ) Α Η μέθοδος ελαχίστων τετραγώνων μας δίνει για την εκτίμηση της παραμέτρου τ, T T X I P( X )) X τ = X ( I ( X )) Υ (3.8) ( p p P var( ) τ = σ Q, Q = X T ( I p P( X )) X (3.9) - 3 -
όπου X = X = ( Z W), Z = ( φ,..., φ ), W = ( x,..., x ) και ο (p)x(p) πίνακας A, p T T P( X ) = X( X X) X X είναι ο πίνακας ορθής προβολής στο χώρο των στηλών του. Μετά από μια περίπλοκη διαδικασία για τον υπολογισμό του Q βρίσκουμε: p Q = a ( a ) ( b na ) ( ( b na )) (3.0) = p = = όπου a =,..., p το συνολικό πλήθος των εμφανίσεων του Α στην -στη γραμμή και b =,..., το συνολικό πλήθος των εμφανίσεων του Α στην -στη στήλη, με a + + + b = n + a p = b Μια ισοδύναμη μορφή της σχέσης (3.0) είναι p p Q = b ( p b ) ( pa na) ( ( pa na)) (3.) p = p p = p = Η ελαχιστοποίηση της διασποράς δηλαδή η μεγιστοποίηση του Q ως προς τα a, γίνεται μόνο όταν a a, b b και μας δίνει τα παρακάτω b s αποτελέσματα () p άρτιος, άρτιος: Από την (3.0) ή (3.) παίρνουμε, a = a = = a p = /, b = b = = b = p /, n A = ( p) /, Q = ( p) / 4 var( τ Α τ Β ) = σ 4 /( p) () p άρτιος, περιττός: b = b = = b = ( p / ) c, a ( + ) / για s γραμμές = ) / για p s γραμμές τότε n p p p p = ( c) = s( + ) / + ( p s)( ) / s = c + c A p p Q 4 4 p p c, c, τότε var( τ Α τ Β ) = σ 4 /( p (/ )) () p περιττός, άρτιος. Όπως προηγουμένως παίρνουμε, a = a = = a p = ( / ) r, b ( p + ) / για t στήλες = p ) / για t στήλες τότε n = p( r) = t( p + ) / + ( t)( p ) / t = pr + r A p p t A - 4 -
p Q = 4 4 p για όλες τις τιμές του r, r p p, τότε var( τ Α τ Β ) = σ 4 /( p (/ p)) (v) p περιττός, περιττός. Θα είναι, a ( + ) / για s τιμές =, ) / για p s τιμές b ( p + ) / για t στήλες = p ) / για t στήλες p p p n A = a + + a p = + s = b + b + t 0 s = t + p Αν p ( p) / t ( p + ) / και 0 s p Αν p 0 t και ( p ) / s ( p + ) / Τότε p s( p s) p p t( t) ( p) / 4 /(4 p) αν p Q = = 4 4 p p 4 4 p p) / 4 p /(4) αν p Αν p το μέγιστο πετυχαίνεται αν a = a = = a = ( ) / και p + b ( p + ) / για ( p + ) / στήλες = ή p ) / για ( p) / στήλες a = a = = a p = ( ) / και b ( p + ) / για ( p) / = p ) / για ( + p) / Αν p το μέγιστο πετυχαίνεται αν b = b = = b = ( p ) / και + a ( + ) / για ( p + ) / γραμμές = ή ) / για ( p ) / γραμμές b = b = = b = ( p ) / και a ( + ) / για ( p ) / γραμμές = ) / για ( p + ) / γραμμές 4 /( p ( / p)) αν var( τ Α τ Β ) = σ 4 /( p ( p / )) αν.3 Εφαρμογές p p στήλες στήλες Ας πάρουμε τις περιπτώσεις: () p=4, =6, () p=5, =6, () p=4, =7, (v) p=5, =7, τότε () Κάθε γραμμή θα έχει 6/=3 Α και κάθε στήλη θα έχει 4/= Α () Κάθε γραμμή έχει 6/-r=3-r A, με 6 /0 r 6 /0 r = 0 και t = 6 / = στήλες έχουν από ( p + ) / = 3 ενώ 3 στήλες έχουν από ( p ) / = Α. - 5-3
() Κάθε στήλη έχει από (4/)-c=-c A, με 4 /4 c 4 /4 c = 0, s = 4 / = γραμμές έχουν από (7+)=4 ενώ γραμμές έχουν από 3 Α. (v) Κάθε γραμμή θα έχει από (8/)=4 6 στήλες θα έχουν από 3 ενώ στήλη θα έχει από ή κάθε γραμμή θα έχει από (6/)=3 στήλη θα έχει από 3 ενώ 6 στήλες θα έχουν από Α. Πίνακες που δίνουν τους βέλτιστους σχεδιασμούς στις περιπτώσεις ()-() () () Α Β Α Β Α Β Α Α Α Β Β Β Α Β Α Β Α Β Α Α Α Β Β Β Β Α Β Α Β Α Α Β Β Α Α Β Β Α Β Α Β Α Β Α Β Α Β Α Β Β Α Β Α Α ABSTRACT A short revew s presented for optmal desgns n homogeneous and non homogeneous populatons. Unversally optmal desgns are gven for estmatng populatons and A, D optmal desgns for testng - populatons wth a control. In non homogeneous populatons wth one characterstc (column desgns) and two characterstcs (row-column desgns) and two treatments the optmal desgns are gven for estmatng the dfference of treatment effects. Examples are presented to clarfy the theory. ΑΝΑΦΟΡΕΣ Agrawal, H. (966)Some methods of constructon of desgns for two-way elmnaton of heterogenety. J. Amer. Statst. Assoc. 6, 53-7. Gaffe, N. and Kraft, O. (97). Optmum propertes of Latn suare desgns and a matrx neualty. Math. Operatonsforsch. Stat. 8, 345-350. Hedayat A.S., Jacroux. M., Maundar D., (988). Optmal desgns for comparng test treatments wth controls. Statstcal Scence Vol. 3, No 4, 46-49. Kefer, J., (958).On the nonrandomzed optmalty and randomzed nonoptmalty of symmetrcal desgns. Annals of Math. Statst., 9, 675-699. Kefer, J., (975). Constructon and optmalty of generalzed Youden desgns. In: Srvastava, J.N. (Ed.), A surveyof Statstcal Desgn and Lnear Models. North-Holland, Amsterdam, pp.333-353. Kraft, O.Lneare statstsche Modelle und optmale Versuchspläne. Gottngen 978. Martn, R.J. (996). Spacal expermental desgn. Ghosh, S,, Rao, C. R. (Eds), Handboo of Statstcs, Vol. 3, North-Holland, Amsterdam, pp. 477-54. Morgan J.P. and Uddn, N. (003). Optmal row-column desgn for two treatments. Journal of Statstcal Plannng and Inference, 5, 603-6 Puelshhaem, F. (993). Optmal desgns of Experments. John Wley and Sons, Inc. Sonnemann, E.(98) D-optmalty of complete Latn suares. Math.Operatonsforsch. Stat.Ser.Stat.3, 387-394. Sonnemann, E.(985). U-optmum Row-Columns Desgns for the comparson of Two Treatments. Metra, Vol.3, 57-63. Uddn, N. (005). Unversally optmalstructurally balanced row-column desgns wth some empty nodes. Journal of Statstcal Plannng and Inference, 33,509-5. Wald A.(943). On effcent desgn of statstcal nvestgatons. Annals of Math. Statst, 4, 34-40 - 6 -