ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Ανάλυση διακύμανσης Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creatve Commos. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.
Ανάλυση διασποράς (ANOVA) Ερώτημα: Πως μπορούμε να συγκρίνουμε > πληθυσμούς ως προς τις μέσες τιμές τους μ 1, μ,, μ. Πιθανή λύση: κάνοντας Δυσκολίες: c Μεγάλη πολυπλοκότητα ( 1) t-tests (ελέγχους) ανά δύο. Υπάρχει ο κίνδυνος να οδηγηθούμε σε λάθος συμπεράσματα καθώς η πιθανότητα του σφάλματος τύπου Ι αυξάνεται δραματικά. Γιατί; αν κάθε έλεγχος έχει πιθανότητα σφάλματος a και άρα πιθανότητα να μην κάνουμε σφάλμα 1-a, τότε η πιθανότητα να μην κάνουμε σφάλμα σε c ελέγχους είναι (1-a) c και άρα πιθανότητα να κάνουμε σφάλμα τύπου Ι είναι 1- (1-a) c. Εφαρμοσμένη Στατιστική Μέρος 4 ο - 3 Κ. Μπλέκας (1)
Ανάλυση διασποράς (ANOVA) (συν.) Λύση: Μέθοδος ANOVA (Fsher 1918) η οποία βασίζεται στην ιδέα ότι όλες οι διαφορές στους δειγματικούς μέσους κρίνονται στατιστικά σημαντικές ή όχι με βάση το μέτρο της μεταβλητότητας (διασποράς) εντός των δειγμάτων. Έστω ομάδες δειγμάτων X () = { 1,,, } μεγέθους. Oρίζουμε ως: TSS SSW SSB 1 j 1 1 j 1 1 j j Συνολικό άθροισμα τετραγώνων (total sum of squares) Άθροισμα τετραγώνων στο εσωτερικό ομάδων (sum of squares wth groups) Άθροισμα τετραγώνων μεταξύ των ομάδων (sum of squares betwee groups) Εφαρμοσμένη Στατιστική Μέρος 4 ο - 3 Κ. Μπλέκας ()
Ανάλυση διασποράς (ANOVA) (συν.) Ισχύει ότι: TSS = SSB + SSW Η μέθοδος ANOVA ορίζει τον στατιστικό έλεγχο: Η 0 : μ 1 = μ = = μ Η 1 : τουλάχιστον από τα κέντρα διαφέρουν στατιστικά Χρησιμοποιώντας το γνωστό αποτέλεσμα για την κατανομή Χ παίρνουμε: Y W 1 j 1 j ~ X N Y B 1 ~ X 1 όπου N 1 Εφαρμοσμένη Στατιστική Μέρος 4 ο - 3 Κ. Μπλέκας (3)
Ανάλυση διασποράς (ANOVA) (συν.) Έτσι χρησιμοποιούμε τη μεταβλητή: Y B SSB 1 F ~ F 1, N YW SSW N 1 N Και έτσι ο έλεγχος γίνεται πάνω στον παραπάνω λόγο, δηλ. If F SSB 1 SSW N f 1, N ( a) the H0 s rejected, δηλ. υπάρχει στατιστικά σημαντική μεταβλητότητα. Εφαρμοσμένη Στατιστική Μέρος 4 ο - 3 Κ. Μπλέκας (4)
Ανάλυση διασποράς (ANOVA) (συν.) Συνοψίζοντας, τα διάφορα βήματα περιγράφονται στον λεγόμενο πίνακα ανάλυσης διασποράς (ANOVA table) Πηγή μεταβλητότητας Αθροισμα τετραγώνων β.ε. Μεταξύ ομάδων SSB (B) -1 Εσωτερικό ομάδων (W) Ολικό (T) SSW TSS 1 1 j 1 1 j 1 j j N- N-1 Μέσο άθροισμα τετραγώνων S B S W SSB 1 SSW N Κριτήριο F F S S B W Εφαρμοσμένη Στατιστική Μέρος 4 ο - 3 Κ. Μπλέκας (5)
Ανάλυση διασποράς (ANOVA) (συν.) Η προηγούμενη περίπτωση αφορούσε ανάλυση ANOVA με 1 παράγοντα. Για ανάλυση ANOVA με παράγοντες, τότε κάνουμε τα παρακάτω: SST SSA SSB SSAB SSE 1 j 1 h 1 m j m m 1 m 1. j m. 1 j 1 1 j 1 h 1 jh j jh j. Συνολική μεταβολή των παρατηρήσεων από τη μέση τιμή. j μεταβολή που οφείλεται στο παράγοντα Α (β.ε. -1) μεταβολή που οφείλεται στο παράγοντα B (β.ε. m-1) μεταβολή που οφείλεται στην αλληλεπίδραση των Α, B (β.ε. (-1)(m-1) ) μεταβολή εξαιτίας σφαλμάτων (β.ε. m(-1) ) ισχύει ότι SST=SSA+SSB+SSAB+SSE Εφαρμοσμένη Στατιστική Μέρος 4 ο - 3 Κ. Μπλέκας (6)
Ανάλυση διασποράς (ANOVA) (συν.) Στην ανάλυση ANOVA με παράγοντες διακρίνουμε τους ελέγχους: Επίδραση παράγοντα Α Επίδραση παράγοντα Β Αλληλεπίδραση Α, Β F A F B F A, B SSA 1 SSE m( 1) SSB m 1 SSE m( 1) SSAB ( 1)( m 1) SSE m( 1) Εφαρμοσμένη Στατιστική Μέρος 4 ο - 3 Κ. Μπλέκας (7)
Τέλος Ενότητας
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Ιωαννίνων» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.
Σημειώματα
Σημείωμα Ιστορικού Εκδόσεων Έργου Το παρόν έργο αποτελεί την έκδοση 1.0. Έχουν προηγηθεί οι κάτωθι εκδόσεις: Έκδοση 1.0 διαθέσιμη εδώ. http://ecourse.uo.gr/course/vew.php?d=105.
Σημείωμα Αναφοράς Copyrght Πανεπιστήμιο Ιωαννίνων, Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας. «Εφαρμοσμένη Στατιστική. Ανάλυση διακύμανσης». Έκδοση: 1.0. Ιωάννινα 014. Διαθέσιμο από τη δικτυακή διεύθυνση: http://ecourse.uo.gr/course/vew.php?d=105.
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creatve Commos Αναφορά Δημιουργού - Παρόμοια Διανομή, Διεθνής Έκδοση 4.0 [1] ή μεταγενέστερη. [1] https://creatvecommos.org/lceses/by-sa/4.0/.