ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05
Πολλαπλές συγκρίσεις Στην ανάλυση διακύμανσης ελέγχουμε την ισότητα των μέσων. Αν δεν ισχύει (απορρίπτεται) τότε υπάρχει ένα τουλάχιστον μ που διαφέρει από τα υπόλοιπα. Δεν διαθέτουμε όμως καμία πληροφορία σχετικά με ποιο ή ποια από τα μ είναι διαφορετικά. Επομένως πρέπει να κάνουμε πολλαπλές συγκρίσεις μεταξύ των ομάδων για να διαπιστώσουμε τις διαφοροποιήσεις καθώς και τα επίπεδα σημαντικότητάς τους.
Πολλαπλές συγκρίσεις Ίσες διακυμάνσεις Άνισες διακυμάνσεις
Κριτήριο ελαχίστης σημαντικής διαφοράς (LSD) -Fsher Εφαρμόζεται για συγκρίσεις ανά δύο Η αρχική υπόθεση H 0 απορρίπτεται ααν: 0 : 0 : 0 H H v a n n s t : μέση τιμή δείγματος δείγματος : μέγεθος n διασπορά μέσα στα δείγματα : s v k, a n t
Κριτήριο ελαχίστης σημαντικής διαφοράς (LSD) -Fsher Το 00(-α)% δ.ε. για την διαφορά είναι v a k n n n s t,
Παράδειγμα Για την παραγωγή χρωμάτων χρησιμοποιήθηκαν 6 διαφορετικά διαλύματα υδροχλωρικού οξέως (HCL) Για κάθε διάλυμα έγιναν 5 μετρήσεις και τα αποτελέσματα σε gr παρουσιάζονται στον παρακάτω πίνακα Διάλυμα 3 4 5 6 Δειγματικοί μέσοι 505 58 564 498 600 470
Παράδειγμα Επίσης δίνεται και ο πίνακας ανάλυσης διακύμανσης Πηγή μεταβλητότητας Άθροισμα τετραγώνων Βαθμοί ελευθερίας Μέσο άθροισμα τετραγώνων F Απόκλιση από την Η 0 (μεταξύ δειγμάτων) Κατάλοιπα (εντός δειγμάτων) 56360 5 7 4.6 5884 4 45 Σύνολο 584 9 Παρατηρούμε ότι F=4.6>.6=F 5,4,0.05 άρα η Η 0 απορρίπτεται.
Παράδειγμα Έλεγχος διαφορών με την LSD μέθοδο Υπολογίζω την ποσότητα LSD 0 : 0 : 0 H H v a n n s t LSD.064 4,0.05, t t a k n 64.63 5 45.064 LSD
Παράδειγμα Σχηματίζουμε τις διαφορές διατάσσοντας τους δειγματικούς μέσους από τον μικρότερο σστο μεγαλύτερο Διάλυμα 6 4 3 5 Δειγματικοί μέσοι 470 498 505 58 564 600 6 5 470 600 30 64.63 6 3 470 564 94 64.63 6 470 58 58 64.63 σταματάμε
Παράδειγμα σταματάμε 64.63 30 58 498 64.63 66 564 498 64.63 0 600 498 4 3 4 5 4 Διάλυμα 6 4 3 5 Δειγματικοί μέσοι 470 498 505 58 564 600 σταματάμε 64.63 36 600 564 σταματάμε 64.63 36 564 58 64.63 7 600 58 σταματάμε 64.63 59 564 505 64.63 95 600 505 5 3 3 5 3 5
Επομένως Παράδειγμα LSD σημαίνει ότι δεν εντοπίζεται στατιστικά σημαντική διαφορά Διάλυμα 6 4 3 5 Δειγματικοί μέσοι 6-5 6-3 4-5 4-3 - 5-5 470 498 505 58 564 600 6,4,, σημαντική διαφορά από 5 6,4 σημαντική διαφορά από 3
Ομάδα χοιριδίων Παραδείγματα Αύξηση βάρους.4.8.37.37.4.33.4.4 3.7.39.4.37
Μέθοδος Τ (Tukey) H πιθανότητα να κάνουμε λάθος σε τουλάχιστον ένα ζευγάρι είναι σημαντική με την χρήση της μεθόδου LSD. Η μέθοδος Τ εφαρμόσθηκε αρχικά για ισομεγέθη δείγματα και για διαφορές μέσων ανά δύο αλλά επεκτάθηκε σε ανισομεγέθη δείγματα και γραμμικές αντιπαρεμβολές
Μέθοδος Τ (Tukey) Αν Χ, Χ,, Χ r είναι ανεξάρτητες τ.μ. με κατανομή Ν(μ,σ ), =,,,r και. W=maxX mnx. Έχουμε εκτιμητή s του σ με u-βαθμούς ελευθερίας ανεξάρτητο του W, ώστε τότε ο λόγος q r, u W s us ~ x u λέγεται τυποποιημένο εύρος
Μέθοδος Τ (Tukey) Ανάλυση διασποράς για ισομεγέθη δείγματα Έχουμε τ.μ.,,..., k Ανεξάρτητες με κατανομή Ν(μ,σ /n) και s είναι ένας εκτιμητής του σ ανεξάρτητος από τα με και n= n = n = = n k Από τον ορισμό του q(r,u) προκύπτει ότι: n k s ~ x n k
Μέθοδος Τ (Tukey) Ανάλυση διασποράς για ισομεγέθη δείγματα Πρόταση Η πιθανότητα είναι -α να ισχύουν συγχρόνως οι k(k-)/ σχέσεις: Ts Ts όπου T q k, n k; n a
Μέθοδος Τ (Tukey) Με την μέθοδο Τ για ισομεγέθη δείγματα κατατάσσουμε τους εκτιμώμενους μέσους κατά αύξουσα σειρά και εξετάζουμε αν W k q k, n Όσες διαφορές ικανοποιούν την σχέση αυτή τότε οι αντίστοιχοι μέσοι είναι ίσοι (ανήκουν στην ίδια ομάδα) αλλιώς είναι άνισοι. n k, a
Παράδειγμα Δίσκοι από μείγμα χαλκού με άλλο μέταλλο τοποθετήθηκαν σε θειικό οξύ για να μελετηθεί το χάσιμο βάρους κατά την διάβρωση. Το μείγμα είναι χαλκός με άργυρο ή χαλκός με πυρίτιο. Έγιναν 0 μετρήσεις για κάθε μείγμα με αποτελέσματα 3 4 5 Καθαρό Άργυρος 35% Πυρίτιο 5% Άργυρος 87% Πυρίτιο 50% Υ. 3.8 30.3 30.0 3.58 3.83 s.8.085 5.008.70.64 n 0 0 0 0 0
Η κατάταξη των μέσων δίνει Παράδειγμα 3 30., 30.3, 3.8, 5 3.83, 4 3.58 3 4 5 Καθαρό Άργυρος 35% Πυρίτιο 5% Άργυρος 87% Πυρίτιο 50% Υ. 3.8 30.3 30.0 3.58 3.83 s.8.085 5.008.70.64 n 0 0 0 0 0 s s SSE 45 s s SSE... s 5 SSE... 45.084 5 5 SSE 5.6
Παράδειγμα Από τους πίνακες της q παίρνουμε και.68 W5 4.0.89 0 q 5,45,0.95 4. 0 3.58-30.0=.48>.89, όλοι οι μέσοι δεν είναι ίσοι 3.58-30.3=.45>.89, οι τέσσερεις μεγαλύτεροι όχι ίσοι 3.58-3.8= 0.78<.89, οι τρείς μεγαλύτεροι ανήκουν στην ίδια ομάδα (θεωρούνται ίσοι) 3.83-3.80=0.03<.89, οι τρείς μικρότεροι στην ίδια ομάδα
Μέθοδος Τ (Tukey) Ανάλυση διασποράς για ανισομεγέθη δείγματα Όταν όλα τα δείγματα δεν έχουν το ίδιο μέγεθος και συγκρίνουμε όλους τους μέσους μεταξύ τους τότε εφαρμόζεται πάλι η μέθοδος Τ και ονομάζεται μέθοδος Tukey-Kramer. Διαστήματα εμπιστοσύνης: D Ts D όπου: D s D T s n n q k, n k;
Παράδειγμα Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται σε παιδιά ηλικίας ενός έτους. Το βάρος σε γραμμάρια δινεται από τον παρακάτω πίνακα Δί αι τα Βάρος σε γραμμάρια Α 8 4.8 7.9 4.7 8.7 34.8 30.9 7 8.54 99.8 Β 4.7 30.7 30.5 6.7 8.6 8.8.6 34.8 9 7.7 49.4 Γ 30.5 4.8 30.9.5 37.6 8.6 8.7 8.8 33.6 4 0 9 90 Δ 30.4 8.9 7.8 30.7 3.7 30.8 30.5 34.5 3.8 3.7 8.6 38.8 3.5 378. Ε 8.5 0.8.9 7.8 3.6 8.9 4.7 6.3 5.4 0.9 5..6 44.9 n.. n.. n n
Παράδειγμα Πίνακας Ανάλυσης Διακύμανσης Πηγή μεταβλητότητας Άθροισμα τετραγώνων Βαθμοί ελευθερίας Μέσο άθροισμα τετραγώνων F Απόκλιση από την Η 0 (μεταξύ δειγμάτων) Κατάλοιπα (εντός δειγμάτων) 5.6 4 30.35 9.080 (p<0.000) 63.508 44 4.35 Σύνολο 55.763 48 Επομένως απορρίπτουμε ότι όλοι οι μέσοι είναι ίσοι. Η εκτίμηση για την διασπορά των σφαλμάτων είναι: σ =4.35
s Παράδειγμα 4.35, T q 5,44;0.95 A A A A.546.546.546.546.546.546.546.546.546 4.3 4.3 4.3 4.3 4.3 4.3 4.3 4.3 4.3 0 0.5 4.3.546 4.3 9.5 4. B 7 7 7 7 9 9 9 9 0 0 0.83 4.86 0.46 4.75.98 4.58 6.8 4.66.9 4.43 3.8 4.5 5.44 4.35 6.74 4. Όταν το διάστημα περιέχει το 0, οι αντίστοιχοι μέσοι είναι ίσοι Οι μέσοι χωρίζονται σε ομάδες, η δίαιτα Ε έχει το μικρότερο βάρος και οι υπόλοιπες θεωρούνται ισοδύναμες Μέσοι άνισοι Ε δίαιτα κοινή
Ομάδα χοιριδίων Παραδείγματα Αύξηση βάρους.4.8.37.37.4.33.4.4 3.7.39.4.37
Μέθοδος Duncan Για να εφαρμόσουμε το τεστ του Duncan σε δείγματα σε ίδιο μέγεθος m, διατάσουμε τους δειγματικούς μέσους σε αύξουσα σειρά και υπολογίζουμε το τυπικό σφάλμα κάθε μέσου MSE sv s. m m Για δείγματα με διαφορετικό μέγεθος αντικαθιστούμε το μέγεθος n με τον αρμονικό μέσο m h των {n } με m h k k n
Αν τότε m h = m n Μέθοδος Duncan n... Από τους πίνακες του Duncan βρίσκουμε τις τιμές r a p,, p,,..., όπου α επίπεδο σημαντικότητας, και ν οι βαθμοί ελευθερίας για το σφάλμα ν=n-k Υπολογίζουμε τις ποσότητες n k m k p, s, p,3 k Rp ra,...,.
Μέθοδος Duncan Ελέγχουμε τις παρατηρούμενες διαφορές μεταξύ των μέσων ξεκινώντας από την μεγαλύτερη ενάντια στην μικρότερη, η οποία ελέγχεται με το ελάχιστο σημαντικό εύρος R k Στην συνέχεια υπολογίζουμε την διαφορά της μεγαλύτερης από την δεύτερη μικρότερη, η οποία συγκρίνεται με το ελάχιστο σημαντικό εύρος R k- Οι συγκρίσεις συνεχίζονται μέχρι να υπολογιστούν όλες οι διαφορές των μέσων με τον μεγαλύτερο μέσο.
Μέθοδος Duncan Στην συνέχεια υπολογίζεται η διαφορά του δευτέρου μεγαλύτερου μέσου και του μικρότερου και συγκρίνεται με την τιμή R k-. H διαδικασία συνεχίζεται μέχρις ότου εξαντληθούν οι διαφορές των δυνατών ζευγών των μέσων kk Αν μια παρατηρούμενη διαφορά είναι μεγαλύτερη από το αντίστοιχο ελάχιστο σημαντικό εύρος R τότε το ζεύγος των μέσων διαφέρει σημαντικά
Παράδειγμα Για την παραγωγή συνθετικών ενδυμάτων χρησιμοποιούνται διάφορα ποσοστά βαμβακιού. Πέντε διαφορετικά ποσοστά χρησιμοποιήθηκαν και για κάθε ποσοστό έγιναν 5 μετρήσεις.. Βάρος σε γραμμάρια Α - 5% 7 7 5 9 Β 0% 7 8 8 Γ 5% 4 8 8 9 9 Δ - 35% 9 5 9 3 Ε 35% 7 0 5
Παράδειγμα Από τα δεδομένα παρατηρούμε ότι: 49 9.8.. 376 04.. 5... 77 5.4 88 7.6 08.6 54 0.8 Πηγή μεταβλητότητας Άθροισμα τετραγώνων Βαθμοί ελευθερίας Μέσο άθροισμα τετραγώνων F Απόκλιση από την Η 0 (μεταξύ δειγμάτων) Κατάλοιπα (εντός δειγμάτων) 457.76 4 8.94 4.76 6.0 0 8.06 Σύνολο 636.96 4
Παράδειγμα Έτσι η υπόθεση Η 0 : μ = μ = μ 3 = μ 4 = μ 5 έναντι της εναλλακτικής Η : τουλάχιστον ένα από τα μ διαφέρει απορρίπτεται αφού F=4.76>F 4,0,0.05 =.87 Αποδέχομαι Η 0 Απορρίπτω Η 0 Θα εφαρμόσουμε την μέθοδο Duncan για να κάνουμε τον έλεγχο Η 0 : μ - μ = 0 Η 0 : μ - μ 0 F.87 F 4. 76 4,0,0.05
Επομένως έχουμε: MSE Παράδειγμα s 8.06 n 5 m 5 k 5 v n k 0 Διατάσουμε τους δειγματικούς μέσους σε αύξουσα σειρά: v. 5.. 3. 4. 9.8 0.8 5.4 7.6.6 Τυπική απόκλιση μέσου: s. 8.06 5.7
Παράδειγμα Από τον πίνακα του Duncan για 0 β.ε. και α=0.05 έχουμε: r,0.95 0.05 0.05 0.05 0.05 Υπολογίζουμε τις τιμές: r r r 3,0 4,0 3.0 3.8 5,0 3. 5 R R R R 3 4 5 r r r r 0.05 0.05 0.05 0.05,0 3,0 4,0, s, s, s....95*.7 3.75 3.0*.7 3.94 3.8*.7 4.04 5,0, s 3.5*.7 4. 3.
Παράδειγμα Οι συγκρίσεις δίνουν: Μη στατιστικά σημαντική διαφορά 4 vs:.6-9.8.8 4.3 4 vs 5:.6-0.8 0.8 4.04 4 vs :.6-5.4 6. 4 vs 3:.6-7.6 4 3 vs:7.6-9.8 7.8 3.94 3.75 4.04 3 vs 5:7.6-0.8 6.8 3.95 3 vs :7.6-5.4. 3.75* vs:5.4-9.8 5.6 3.94 vs 5:5.4-0.8 4.6 3.75 5 vs:0.8-9.8 3.75*
Μέθοδος Sheffe Η μέθοδος αυτή εφαρμόζεται και στις περιπτώσεις όπου το πλήθος των παρατηρήσεων δεν είναι ίδιο σε όλες τις ομάδες. Όταν έχουμε ίδιο μέγεθος παρατηρήσεων σε όλες τις ομάδες τότε είναι προτιμότερη η μέθοδος Τα, διότι δίνει μικρότερα διαστήματα εμπιστοσύνης
Μέθοδος Sheffe Πρόταση Η πιθανότητα είναι -α να ισχύουν συγχρόνως οι σχέσεις: όπου: L Ss L L L Ss L 0.........,, k k k k k k a k n k c c c c c c L c c c L n c s L s F k S
Μέθοδος Sheffe Η διαδικασία που χρησιμοποιούμε για να κατατάξουμε σε ομάδες τους μέσους με την S- μέθοδο είναι:. Τοποθετούμε τα. κατά αύξουσα (ή φθίνουσα) σειρά μεγέθους.}, {.} { k.} {,...,. Υπολογίζουμε την ποσότητα n n, s k Fk, nk a D, 3. Αν.. D, δεχόμαστε ότι οι μέσοι είναι ίσοι (ανήκουν στην ίδια ομάδα) διαφορετικά είναι άνισοι.
Έχουμε : s =4.35, k=5, n=49 Παράδειγμα Διατάσουμε τους δειγματικούς μέσους της δίαιτας σε αύξουσα σειρά: E. B. A....64 7.7 9 8.543 7 9 0 3.57
D D D D D E, 4.35 4.6 9, 4.35 4.6 E, 4.35 4.6 E, 4.35 4.6 Παράδειγμα 0 7 9 5.099 3.57.64 9.53 5.099 5.387 3.57 7.7 3.806 5.099 5.338 9.64 7.736 5.338 5.907 8.543.64 6.79 5.907 E, 4.35 4.6 5.49 7.7.64 5.447 5. 49 E vs Δ Ε vs Γ Ε vs Α Η δίαιτα Ε διαφέρει σημαντικά
Παράδειγμα D E, 4.35 4.6 διάστημα εμπιστοσύν ης D 9 διάστημα εμπιστοσύν ης, 4.35 4.6 5.099 3.57.64 9.53 5.099 9.53 5.099 4.54,4.35 δεν περιέχεται το 0 5.387 3.57 7.7 3.806 5.099 3.806 5.387.58,9.93 περιέχεται το 0
Ομάδα χοιριδίων Παραδείγματα Αύξηση βάρους.4.8.37.37.4.33.4.4 3.7.39.4.37