Έλεγχος υποθέσεων ΙI ANOVA Μοντέλα στην Επιστήμη Τροφίμων 532Ε Τομέας Επιστήμης & Τεχνολογίας Τροφίμων Έλεγχος υποθέσεων Συνεχή δεδομένα z-test Student s test (t-test) Ανάλυση παραλλακτικότητας ή ανάλυση διασποράς (ANOVA) 1
Γενικά για τον έλεγχο υποθέσεων Για μεγάλο αριθμό παρατηρήσεων (n>30) χρησιμοποιούμε το z-test για να ελέγξουμε αν: ο μέσος όρος ενός δείγματος είναι ίσος με μια ορισμένη τιμή οι μέσοι όροι δυο δειγμάτων είναι ίσοι Για μικρό αριθμό παρατηρήσεων (n<30) χρησιμοποιούμε το t-test για να ελέγξουμε αν: ο μέσος όρος ενός δείγματος είναι ίσος με μια ορισμένη τιμή οι μέσοι όροι δυο δειγμάτων είναι ίσοι έχοντας την ίδια παραλλακτικότητα έχοντας διαφορετική παραλλακτικότητα F-test Χρησιμοποιούμε ανάλυση παραλλακτικότητας (ANOVA) για να ελέγξουμε αν: οι μέσοι όροι πολλών (>2) δειγμάτων είναι ίσοι ή όχι Έλεγχος υπόθεσης για το λόγο των διασπορών δύο πληθυσμών F-test 2
Για περισσότερα από 2 δείγματα Όταν έχουμε να συγκρίνουμε μ.ο. για k > 2 δείγματα εφαρμόζουμε την Ανάλυση παραλλακτικότητας ή ανάλυση διασποράς ή ανάλυση διακύμανσης ή ANOVA (analysis of variance) Ανάλυση παραλλακτικότητας ή διακύμανσης (ANOVA) Αντί να συγκρίνουμε τους μέσους όρους των δειγμάτων (μ 1, μ 2, μ k ), συγκρίνουμε τις διακυμάνσεις των δειγμάτων (s 2 1, s 2 2, s 2 k ). Θεωρούμε ότι εάν τα δείγματα προέρχονται από τον ίδιο πληθυσμό θα πρέπει να έχουν και ίδια διακύμανση ηλ: εάν s 2 1=s 2 2= =s 2 k = s 2, τότε και μ 1 = μ 2 = =μ k = μ 3
Η μηδενική υπόθεση (Η ο ) και η εναλλακτική υπόθεση (Η α ) Στην ANOVA η Η ο είναι : μ 1 = μ 2 = =μ k και η Η α είναι πάντα: μ i μ j Αρκεί μια ανισότητα για να απορρίψει την Η ο (π.χ. μ 2 μ 4 ) εν έχουμε πληροφόρηση για το ποιες ισότητες ισχύουν και ποιες όχι. Απαιτούνται έλεγχοι εκ των υστέρων (post hoc) για να αναγνωριστούν συγκεκριμένες διαφορές. Ανάλυση διακύμανσης ενός παράγοντα (one-way ANOVA) Έστω ότι έχουμε k δείγματα με n παρατηρήσεις 1 2 k x 11 x 21 x k1 x 12 x 22 x k2 x ij x 1n x 2n x kn 4
Μονοπαραγοντική ανάλυση Το μοντέλο της ανάλυσης είναι: x ij = μ + α i + ε ij όπου i =1,2 n k & j =1,2 k όπου μ: ο γενικός μέσος όρος α i : η επίδραση του παράγοντα στο δείγμα i (α i = μ μ i ) και ε ij : τυχαία σφάλματα με κανονική κατανομή (0,σ 2 ) Η ο : α 1 =α 2 = α k =0 και Η α : α i 0 Μονοπαραγοντική ανάλυση Εξετάζουμε εάν η διακύμανση μεταξύ των δειγμάτων (1,2 k) είναι μεγαλύτερη από τη γενική διακύμανση μέσα σε όλα τα δείγματα (σφάλμα μετρήσεων). Γι αυτό και η ANOVA είναι πάντα μονόπλευρη δοκιμή 5
Πίνακας one-way ANOVA Για k δείγματα με n παρατηρήσεις σε κάθε δείγμα Ως πηγή του σφάλματος θεωρείται η διακύμανση μέσα σε όλα τα δείγματα (MSW) Πηγή SS df MS F P-value F crit Μεταξύ δειγμάτων SSΒ k-1 MSΒ MSΒ/MSW Μέσα στα δείγματα SSW nk-k MSW Σύνολο SST nk-1 Ανάλυση διακύμανσης δύο παραγόντων (two-way ANOVA) Πολλές φορές εξετάζουμε την ταυτόχρονη επίδραση δύο παραγόντων. Μπορούμε να έχουμε 1 ή περισσότερες παρατηρήσεις (επαναλήψεις) για κάθε συνδυασμό παραγόντων. Έτσι μπορούμε να έχουμε: Ανάλυση παραλλακτικότητας 2 παραγόντων με επανάληψη (2-way ANOVA with replication) Ανάλυση παραλλακτικότητας 2 παραγόντων χωρίς επανάληψη (2-way ANOVA without replication) 6
ιπαραγοντική ανάλυση Έστω ότι έχουμε 2 παράγοντες (Α & Β) με κ και λ στάθμες (επίπεδα) αντίστοιχα Β 1 Β 2 Β λ Α 1 Χ 111 Χ 112 Χ 121 Χ 122 Χ 1λ1 Χ 1λ2 Α 2 Χ 211 Χ 212 Χ 221 Χ 222 Χ 2λ1 Χ 2λ2 Α κ Χ κ11 Χ κ12 Χ κ21 Χ κλ1 Χ κ22 Χ κλ2 ιπαραγοντική ανάλυση Το μοντέλο της ανάλυσης είναι: x ijl = μ + α i + β j + γ ij + ε ijl όπου i =1,2 κ j =1,2 λ l=1,2 n μ: ο γενικός μέσος όρος α i : η επίδραση του παράγοντα A στην i στάθμη (γραμμή) β j : η επίδραση του παράγοντα Β στην j στάθμη (στήλη) γ ij : η αλληλεπίδραση των παρόντων A & Β ε ij : τυχαία σφάλματα με κανονική κατανομή (0,σ 2 ) 7
Οι υποθέσεις που ελέγχονται Η οαβ : γ 11 =γ 12 = γ κλ =0 και Η ααβ : γ ij 0 δεν υπάρχουν σημαντικές αλληλεπιδράσεις Η οa : α 1 =α 2 = α κ =0 και Η αα : α i 0 ο παράγοντας Α δεν επιδρά σημαντικά Η οβ : β 1 =β 2 = β λ =0 και Η αβ : β j 0 ο παράγοντας Β δεν επιδρά σημαντικά Πίνακας ANOVA (μοντέλο Ι) Υποθέτοντας ότι τα επίπεδα των παραγόντων Α & Β επιλέχθηκαν από τον ερευνητή και όχι τυχαία. 8
Πίνακας ANOVA (Excel) ANOVA Source of Variation SS df MS F P-value F crit Sample 0,936 1 0,936 1,268 0,271 4,260 Columns 1,862 2 0,931 1,261 0,301 3,403 Interaction 2,329 2 1,164 1,577 0,227 3,403 Within 17,716 24 0,738 Total 22,843 29 ιπαραγοντική ανάλυση Όταν δεν υπάρχει επανάληψη (n=1) δεν μπορούμε να βγάλουμε συμπεράσματα για την αλληλεπίδραση των δυο παραγόντων. Η τιμή της αλληλεπίδρασης χρησιμοποιείται ως μέτρο του σφάλματος. 9