ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05
Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται σε παιδιά ηλικίας ενός έτους Το βάρος σε γραμμάρια δινεται από τον παρακάτω πίνακα Δί αι τα Βάρος σε γραμμάρια 8 48 79 47 87 348 309 7 854 998 47 307 305 67 86 88 6 348 9 77 494 3 305 48 309 5 376 86 87 88 336 4 0 9 90 4 304 89 78 307 37 308 305 345 38 37 86 388 35 378 5 85 08 9 78 36 89 47 63 54 09 5 6 449
Μοντελοποίηση Μας ενδιαφέρει να εντοπίσουμε αν υπάρχουν διαφορές μεταξύ των μέσων Η 0 : μ = μ =μ 3 =μ 4 = μ 5 H0 : 3 4 5 Θα έχουμε ότι για την παρατήρηση που γράφεται ως,,,,;,,, όπου οι τμ ε είναι ανεξάρτητες και ε ~ Ν(0,σ ) με σ >0 = + + +
Μοντελοποίηση Η επίδραση της μ, =,,, δίαιτας ανάλογα με το πώς γίνεται είναι: Σταθερά (μοντέλο τύπου Ι μοντέλο σταθερών επιδράσεων) (όπως στο παράδειγμά μας) Τυχαία μεταβλητή (μοντέλο τύπου ΙΙ μοντέλο τυχαίων επιδράσεων)
Το μοντέλο Μοντέλο σταθερών επιδράσεων μπορεί να γραφεί με μορφή με Πράγματι αν a,,,,;,,,,,,,;,,, a 0 0 όπου a και a 0 Γενικός μέσος
Μοντέλο σταθερών επιδράσεων Αν αγνοήσουμε το μέγεθος των δειγμάτων τότε το μοντέλο απλοποιείται σε με όπου a a a 0,,,,;,,, Μοντέλο χωρίς βάρη και
Μοντέλο σταθερών επιδράσεων Με την μέθοδο ελαχίστων τετραγώνων εκτιμάμε τους μέσους μ και την διασπορά σ m Η ελαχιστοποίηση γίνεται ως προς τους μέσους μ και παίρνουμε τις εκτιμήτριες Οι εκτιμημένες τιμές των Υ είναι:
Μοντέλο σταθερών επιδράσεων Άρα SSE R 0 SST total R SST tr R R 0
Μοντέλο σταθερών επιδράσεων Αν το αρχικό μοντέλο μας είναι σωστό τότε ισχύει: a E a E E
Μοντέλο σταθερών επιδράσεων Η εκτίμηση του σ δίνεται από την σχέση s και τα SST tr και SSE είναι ανεξάρτητα Αν ισχύει η Η 0 τότε SSE E E MSE SSE SST tr MST tr F * MST MSE tr ~ F,
Μοντέλο σταθερών επιδράσεων Τα SST tr και SSE είναι ανεξάρτητα Cov, Cov Cov Cov Cov 0 Aφού τα σ είναι άγνωστα έχουμε: E MSE E SSE Αμερόληπτος εκτιμητής της σ
Μοντέλο σταθερών επιδράσεων Πρόταση Απόδειξη Έχουμε Αλλά E E tr a E MST E E Var E
Μοντέλο σταθερών επιδράσεων Έχουμε Άρα Cov Var Var Var a a E, tr a a a a MST E
Μοντέλο σταθερών επιδράσεων Κάτω από την μηδενική υπόθεση Η 0 : α = α = = α = 0 ισχύει E MST tr E MST tr Αμερόληπτος εκτιμητής της σ κάτω από την Η 0 Πηγή μεταβλητότητας Άθροισμα τετραγώνων Βαθμοί ελευθερία ς Μέσο άθροισμα τετραγώνων Αν δεν ισχύει η Η 0 F Απόκλιση από την Η 0 (μεταξύ δειγμάτων) Κατάλοιπα (εντός δειγμάτων) SST tr - MST tr SSE - MSE = s F * MST MSE tr Σύνολο SST - * F Μεγάλες τιμές αν δεν ισχύει η Η 0
Παράδειγμα Πίνακας Ανάλυσης Διακύμανσης Πηγή μεταβλητότητας Άθροισμα τετραγώνων Βαθμοί ελευθερίας Μέσο άθροισμα τετραγώνων F Απόκλιση από την Η 0 (μεταξύ δειγμάτων) Κατάλοιπα (εντός δειγμάτων) 56 4 3035 9080 (p<0000) 63508 44 435 Σύνολο 55763 48 Επομένως απορρίπτουμε ότι όλοι οι μέσοι είναι ίσοι Η εκτίμηση για την διασπορά των σφαλμάτων είναι: σ =435
Έλεγχος διακύμανσης Η σωστή διαδικασία είναι πρώτα ελέγχουμε αν το μοντέλο Υ είναι σωστό δηλ: αν τα σφάλματα είναι ανεξάρτητα με σταθερή διασπορά αν ακολουθούν κανονική κατανομή αν δεν υπάρχουν άλλοι παράγοντες που επηρεάζουν το αποτέλεσμα
Έλεγχος διακύμανσης Έλεγχος σφαλμάτων αν έχουν τις ίδιες διακυμάνσεις σε όλες τις ομάδες, θεωρώντας ότι μέσα σε κάθε ομάδα η διασπορά είναι σταθερή Κριτήριο Cochra, Barlett, Hartley H εκτίμηση της διασποράς σ κάθε ομάδας διαίτης είναι: SSE, με SSE Το SSE αναλύεται σε αθροίσματα τετραγώνων SSE SSE SSE SSE, SSE ~ x
Έλεγχος διακύμανσης Τα διαστήματα εμπιστοσύνης 00(-α)% μπορούμε να τα υπολογίσουμε με δύο τρόπους: Χρησιμοποιώντας την εκτίμηση της διασποράς μέσα σε κάθε ομάδα t a, Χρησιμοποιώντας την εκτίμηση της διασποράς από όλες τις παρατηρήσεις t,a Η διαφορά δίνεται από την σχέση t, a
Έλεγχος διακύμανσης Διάιτα 95% δε των μ 7 854 39 643 5 385 9 77 383 449 479 3063 3 0 9 438 374 63 377 4 35 086 094 995 3307 5 64 4 063 389 Σύνολο 49 78 054 054 703 857
Έλεγχος οµοσκεδαστικότητας των παρατηρήσεων Για να είναι αξιόπιστα όλα τα παραπάνω θα πρέπει τα σφάλµατα να έχουν την ίδια διασπορά σ Μπορούµε και πάλι να χρησιµοποιήσουµε το Levee s Τεστ οµοσκεδαστικότητας Το τεστ αυτό βασίζεται στην ανάλυση διασποράς Βασίζεται στις τυχαίες µεταβλητές Αν τα Υ έχουν την ίδια διασπορά σε όλες τις στάθµες, τότε τα W θα έχουν την ίδια µέση τιµή σε όλες τις στάθµες του παράγοντα Χ Εποµένως αρκεί να ελέγξουµε αν οι τµ W έχουν την ίδια µέση τιµή σε όλες τις στάθµες του παράγοντα Χ
Έλεγχος οµοσκεδαστικότητας των παρατηρήσεων Το Levee τεστ ουσιαστικά είναι το F-rato τεστ του πίνακα ANOVA που αντιστοιχεί στο µοντέλο ανάλυσης διασποράς της W ως προς τον παράγοντα X Αν, µε βάση αυτό το F-rato τεστ, απορρίπτεται ότι ο µέσος της W είναι σταθερός σε όλες τις στάθµες της Χ τότε απορρίπτεται ότι και η διασπορά της είναι σταθερή σε όλες τις στάθµες της Χ
Έλεγχος οµοσκεδαστικότητας Σε περίπτωση των παρατηρήσεων Μη κανονικότητας των παρατηρήσεων Οι διακυμάνσεις διαφέρουν (τεστ Levee) Ο αριθμός των παρατηρήσεων δεν είναι ίδιος σε κάθε δείγμα τότε χρησιμοποιούμε το τεστ των Brow Forsythe και το τεστ του Welch
Έλεγχος οµοσκεδαστικότητας των παρατηρήσεων Tεστ των Brow Forsythe O έλεγχος των Brow-Forsythe βασίζεται στο κριτήριο: FBF,,,, s N όπου κάτω από την Η 0 ακολουθεί την F κατανομή με, f βαθμούς ελευθερίας
Έλεγχος οµοσκεδαστικότητας των παρατηρήσεων Tεστ των Brow Forsythe όπου s N s N c c f και
Έλεγχος οµοσκεδαστικότητας των παρατηρήσεων Tεστ των Brow Forsythe Εναλλακτικά ισχύει όπου Z Z Z N F BF Z Z Z Z Z Z F ~ BF F,