ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5
Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από το δείγμα με ι=,,, δείγμα,,,, δείγμα,,,, ά δείγμα,,,, Πειραματικό σχέδιο Η : μ = μ = = μ
Δηλ: οι μέσες τιμές των πληθυσμών από τους οποίους λαμβάνονται τα εν λόγω δείγματα είναι ίσες μεταξύ τους Θεωρούμε ότι = + + + όπου : είναι το μέγεθος του δείγματος Θα έχουμε ότι για την παρατήρηση που γράφεται ως,,,,;,,, όπου οι τμ ε είναι ανεξάρτητες και ε ~ Ν(,σ ) με σ >
Αν θέσουμε: X,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
Αν θέσουμε για τα διανύσματα όλων των παρατηρήσεων,,,,,,,,,,,, Για κάθε =,,, έστω μ η κοινή μέση τιμή των Υ =,,, τα οποία είναι ισόνομα Έτσι μπορούμε να γράψουμε το μοντέλο μας ως: E E ε ε X x
Η τάξη του πίνακα Χ είναι ανεξάρτητοι γραμμικοί συνδυασμοί E X x Επομένως μπορούμε να παρατηρήσουμε μέσω του Ε(Υ) τα Υ ως: Xb ε X b,,, X,, a
Επειδή ο πίνακας Χ είναι ελλιπούς τάξης (+ στήλες είναι γραμμικά εξαρτημένες), οι παράμετροι μ, α, =,,, δεν καθορίζονται μονοσήμαντα από την σχέση Ε(Υ) Για τον λόγο αυτό θα πρέπει να υπάρχουν περιορισμοί όπως Άρα ισχύει: a Το μ έχει την ερμηνεία του συνολικού μέσου όρου, ενώ τα α δείχνουν πόσο κάθε μ διαφέρει από το συνολικό μέσο όρο Τα α ονομάζονται επίδραση του δείγματος
Τότε το παραπάνω μοντέλο μπορεί να πάρει την μορφή X () όπου η μήτρα Χ είναι τάξεως, αφού καμία στήλη τη; Δεν μπορεί να είναι γραμμικός συνδυασμός άλλων στηλών τ(χ)= Για τα ε παρατηρούμε ότι ε ~ Ν (,σ I ) Μήτρα διακυμάνσεων-συνδιακυμάνσεων Από τα παραπάνω έχουμε το κανονικό κλασσικό γραμμικό υπόδειγμα με τ(χ)= όπου Υ ~ Ν (Χβ,σ I )
H υπόθεση Η μπορεί να γραφεί: 3,,,
Γραμμικοί συνδυασμοί: 3 3 3 l l l l l l
Τα διανύσματα Άρα τα διανύσματα Μοντελοποίηση είναι ανεξάρτητα είναι ανεξάρτητες εκτιμήσιμες συναρτήσεις Γραμμικές εκτιμήσιμες συναρτήσεις Πρόταση: Δίνεται το υπόδειγμα, l l,, προτάσεις είναι ισοδύναμες: l Τότε οι παρακάτω Η γραμμική συνάρτηση είναι εκτιμήσιμη Το διάνυσμα l x είναι γραμμικός συνδυασμός των στηλών της Χ Ο γραμμικός συνδυασμός δίνεται από: l, l,, l X l l X x x,
Αν θέσουμε x l l l C l l l Cμ
Έλεγχος υποθέσεων Cμ= Επιλέγουμε επίπεδο σημαντικότητας α Επιλύουμε ως προς x την εξίσωση P F x a όπου F ~F -, - Υπολογίζουμε την ποσότητα F F MSTr MSE s s b w ~ F( ),( ) F μέσο άθροισμα των τετραγώνων των επεμβάσεων (MST r) Μέσοάθροισμα τετραγώνων σφάλματος (MSE )
Η ποσότητα Μοντελοποίηση F m X X m X X C Αν F >x τότε απορρίπτουμε την υπόθεση Η Αν F <x τότε δεν απορρίπτουμε την υπόθεση Η όπου Cμ= ερμηνεύεται ως β= άρα οι παράμετροι β μέσα στο γραμμικό μοντέλο εξηγούνται από γραμμικούς συνδυασμούς των μέσων κάθε δείγματος
y y y y SSE SST MSE MST F r r F y y y y
Έχουμε την ποσότητα όπου είναι η λύση του συστήματος των κανονικών εξισώσεων ( ) Αν θέσουμε X X,,, X X S S
Σύστημα κανονικών εξισώσεων: S S S
Εκτιμήσεις
Επομένως η Μοντελοποίηση παίρνει την μορφή Άθροισμα τετραγώνων των αποκλίσεων Άθροισμα τετραγώνων μέσα στα δείγματα
Ας θέσουμε μ την κοινή τιμή των μ, =,,, κάτω από την Η, δηλ: μ = μ = = μ = μ ή β = β = = β = β Έχουμε την ποσότητα όπου είναι η ελάχιστων τετραγώνων εκτιμήτρια της παραμέτρου β κάτω από τους περιορισμούς Cμ= (Cβ=) Αν θέσουμε m X X C C X X S S
Σύστημα κανονικών εξισώσεων: S S S
Εκτιμήσεις,,, Εκτιμήτριες ελαχίστων τετραγώνων
Επομένως η Μοντελοποίηση παίρνει την μορφή Ολικό άθροισμα τετραγώνων Άθροισμα τετραγώνων εκτός δειγμάτων
Ως προς τις μορφές των μέσων έχουμε Μεγάλος μέσος Μικρός μέσος
Μπορούμε να γράψουμε:
Μπορούμε να γράψουμε:
Πίνακας Ανάλυσης Διακύμανσης Πηγή μεταβλητότητας Άθροισμα τετραγώνων Βαθμοί ελευθερία ς Μέσο άθροισμα τετραγώνων F Απόκλιση από την Η (μεταξύ δειγμάτων) Κατάλοιπα (εντός δειγμάτων) - - Σύνολο - F
Απλοποιήσεις Απόδειξη
Απλοποιήσεις Απόδειξη
Απλοποιήσεις
Πίνακας Υπολογισμού Διακύμανσης # Δείγμα Δείγμα παρατη ρήσεις Υ, Υ,, Υ Υ, Υ,, Υ Άθροισμα παρατηρ ήσεων Μέσο τετραγωνικό άθροισμα Άθροισμα τετραγώνων Μέση τιμή Υ, Υ,, Υ Σύνολο
Παραδείγματα Διαθέτουμε 3 είδη χοιριδίων Μελετάμε αν το είδος της τροφής επιδρά στην αύξηση του βάρους Ένα σύνολο χοιριδίων χωριστήκαν τυχαία σε 3 ισοπληθείς ομάδες και σε κάθε μια ομάδα δόθηκε ένα είδος τροφής για ένα χρονικό διάστημα στο τέλος του οποίου μετρήθηκε η αύξηση του βάρους καθενός από τα χοιρίδια
Ομάδα χοιριδίων Παραδείγματα Αύξηση βάρους 4 8 37 37 4 33 4 4 3 7 39 4 37 Υποθέτουμε ότι οι παρατηρήσεις είναι κανονικές, ανεξάρτητες και προέρχονται από κανονικό πληθυσμό Θέλουμε να ελέγξουμε την υπόθεση της ισότητας των μέσων έναντι της εναλλακτικής
Ομάδα χοιριδί ων Παραδείγματα 4 8 37 37 4 544 7398 748 36 4 33 4 4 4 566 778 7733 39 3 7 39 4 37 4 533 7 737 33 Σύνολο 633 9 779 36
Παραδείγματα 79 79 9 633 574 59 574 59 659
Παραδείγματα Πίνακας Ανάλυσης Διακύμανσης Πηγή μεταβλητότητας Άθροισμα τετραγώνων Βαθμοί ελευθερία ς Μέσο άθροισμα τετραγώνων F Απόκλιση από την Η (μεταξύ δειγμάτων) Κατάλοιπα (εντός δειγμάτων) 659 39 583 59 9 565 Σύνολο 574 Με επίπεδο σημαντικότητας α=5,παρατηρούμε ότι η τιμή της συνάρτησης F,9,5 =46 46>583 άρα αποδέχομαι την αρχική υπόθεση Η
Παραδείγματα ομάδες Μεταβλητή Βάρος χοιριδίων
Παραδείγματα
p>5, άρα δεν υπάρχει στατιστικά σημαντική διαφορά Αποδέχομαι την Η κανονική κατανομή Παραδείγματα
Παραδείγματα
Παραδείγματα Ανάλυση διακύμανσης έλεγχος μέσων Περιγραφικά στοιχεία των ομάδων
Παραδείγματα έλεγχος υποθέσεων Η p=577>5 Αποδέχομαι την Η Δεν διαφέρουν σημαντικά οι μέσοι