Έλεγχος υποθέσεων Ι z-test & t-test Μοντέλα στην Επιστήμη Τροφίμων 53Ε Τομέας Επιστήμης & Τεχνολογίας Τροφίμων Έλεγχος υποθέσεων Συνεχή δεδομένα z-test Student s test (t-test) Ανάλυση παραλλακτικότητας ή ανάλυση διασποράς (ANOVA) 1
Γενικά για τον έλεγχο υποθέσεων Για μεγάλο αριθμό παρατηρήσεων (n>30) χρησιμοποιούμε το z-test για να ελέγξουμε αν: ο μέσος όρος ενός δείγματος είναι ίσος με μια ορισμένη τιμή οι μέσοι όροι δυο δειγμάτων είναι ίσοι Για μικρό αριθμό παρατηρήσεων (n<30) χρησιμοποιούμε το t-test για να ελέγξουμε αν: ο μέσος όρος ενός δείγματος είναι ίσος με μια Καμπύλες πυκνότητας καμπύλη πυκνότητας για πληθυσμούς με κανονική κατανομή μ=10 & s=3 μ=50 & s=1 Θεωρούμε ότι το εμβαδόν κάτω από την καμπύλη ισούται με τη μονάδα (1).
Ητυπική κατανομή Εκφράζει τη σχέση σ και κατανομής τιμών. Δηλ. πόσες τιμές (%) περιέχονται ανάμεσα σε τιμές στον άξονα x Η κατανομή z Εφαρμόζοντας τη μετατροπή z=(x-μ)/σ δεν χρειάζεται να κατασκευάζουμε καμπύλες για κάθε συνδυασμό μέσου όρου και τυπικής απόκλισης επειδή κάθε τιμή x δίνεται από τον τύπο: x = μ ± zσ. Standard.xls 3
Το 5% των τιμών βρίσκεται μακρύτερα από ±σ (αμφίπλευρα) 0,05 ή,5% των τιμών του πληθυσμού 0,05 ή,5% των τιμών του πληθυσμού Το 5% των τιμών δεν βρίσκεται μακρύτερα από +σ (μονόπλευρα) 0,05 ή 5% των τιμών του πληθυσμού 4
Κατανομή t Κατανομή f 5
Ημηδενική υπόθεση (Η ο ) και η εναλλακτική υπόθεση (Η α ) Η Η Η Η ο α α α : χ = μ : χ μ : χ > μ : χ < μ Ημηδενική υπόθεση χ - μ = 0 Η εναλλακτική υπόθεση μπορεί να έχει διάφορες μορφές: χ - μ 0 (αμφίπλευρη) χ - μ > 0 (μονόπλευρη) χ - μ < 0 (μονόπλευρη) 6
Αποφάσεις κατά τον έλεγχο υποθέσεων Απόφαση Πραγματικότητα Η ο ορθή Η α εσφαλμένη Η ο εσφαλμένη Αποδοχή Η ο Απόρριψη Η α Ορθή απόφαση P=1-α Λάθος απόφαση Απόρριψη Η ο Αποδοχή Η α Λάθος απόφαση P=α Σφάλμα Τύπου Ι Ορθή απόφαση Η α ορθή P=β Σφάλμα Τύπου ΙΙ P=1-β Σφάλμα Τύπου Ι και ΙΙ Σφάλμα τύπου Ι (α, πιθανότητα να απορρίψουμε την Η ο ενώ είναι σωστή) Σφάλμα τύπου ΙΙ (β, πιθανότητα να δεχθούμε την Η ο ενώ είναι λάθος) 7
Έλεγχος υπόθεσης ότι ο μέσος όρος έχει μια ορισμένη τιμή (μ ο ) Μηδενική υπόθεση: H o : μ = μ ο Εναλλακτική υπόθεση Μονόπλευρη δοκιμή Δίπλευρη δοκιμή Η 1 : μ > μ ο Η 1 : μ μ ο Η 1 : μ < μ ο Μεγάλο δείγμα (n>30) z x μ = ο σ / n ή z = x μ ο s / n Προϋπόθεση: ο πληθυσμός από τον οποίο προέρχεται το δείγμα πρέπει να είναι κανονικά κατανεμημένος Έλεγχος υπόθεσης ότι ο μέσος όρος έχει μια ορισμένη τιμή (μ ο ) Μηδενική υπόθεση: H o : μ = μ ο Εναλλακτική υπόθεση Μονόπλευρη δοκιμή Δίπλευρη δοκιμή Η 1 : μ > μ ο Η 1 : μ μ ο Η 1 : μ < μ ο Μικρό δείγμα (n<30) t = x μ ο s / n Προϋπόθεση: ο πληθυσμός από τον οποίο προέρχεται το δείγμα πρέπει να είναι κανονικά κατανεμημένος 8
Student s test (t-test) t = x μο s / n χ = μέσος όρος δείγματος μ ο = τιμή στόχος ή ελέγχου s = τυπική απόκλιση n = αριθμός παρατηρήσεων s = s = s ( x i x) ( n 1) s / n = τυπικό σφάλμα Εφαρμογές στο MS Excel Από το μενού εντολών επιλέγουμε Εργαλεία (Tools) και μετά Ανάλυση δεδομένων (Data Analysis). Αν δεν είναι εγκατεστημένο (δεν φαίνεται σαν διαθέσιμη επιλογή), επιλέγουμε Εργαλεία (Tools), μετά Πρόσθετα (Add-ins) και επιλέγουμε το Ανάλυση δεδομένων 9
t Έλεγχος υπόθεσης ότι ο μέσος όρος έχει μια ορισμένη τιμή χ χ = x s / μο n 10,1 10, 9,9 10,3 10,1 10, Η ο : =10 H 1 : 10 χ = 10,1 μ ο = 10 s = 0,1 n =15 9,8 9,9 10,3 10,1 10,3 10, 9,6 10, 10,3 Αποδεχόμαστε την Η ο? Παράδειγμα στο Excel (t_test1.xls) Σύγκριση μέσων όρων δύο δειγμάτων Δύο ανεξάρτητα δείγματα με ίδια παραλλακτικότητα (s 1 = s ) Δύο ανεξάρτητα δείγματα με διαφορετική παραλλακτικότητα (s 1 s ) Δύο εξαρτημένα δείγματα με τιμές κατά ζεύγη (s D ) 10
Έλεγχος υπόθεσης για τη διαφορά των μέσων τιμών δύο πληθυσμών (z) Έλεγχος υπόθεσης για τη διαφορά των μέσων τιμών δύο πληθυσμών Ανεξάρτητα δείγματα Μηδενική υπόθεση Η 0 : μ 1 -μ = δ Εναλλακτική υπόθεση: Μονόπλευρο test Η 1 : μ 1 - μ > δ ή Η 1 : μ 1 - μ < δ Δίπλευρο test Η 1 : μ 1 - μ δ (ορίζοντας δ=0, εξετάζουμε εάν μ 1 =μ ) Προϋπόθεση: ο πληθυσμός από τον οποίο προέρχεται το δείγμα πρέπει να είναι κανονικά κατανεμημένος 11
Δύο ανεξάρτητα δείγματα με ίδια παραλλακτικότητα Έλεγχος υπόθεσης για τη διαφορά των μέσων τιμών δύο πληθυσμών (t) t_test.xls 1
Δύο ανεξάρτητα δείγματα με διαφορετική παραλλακτικότητα Εάν s 1 s 1 t = Για τον έλεγχο της σημαντικότητας s1 s χρησιμοποιούμε το t crit + με vˆ βαθμούς ελευθερίας n1 n vˆ = [( s 1 / n ) 1 ( s /( n 1 1 / n + s 1 1)] + [( s / n ) / n ) /( n x 1)] x Δύο ανεξάρτητα δείγματα με διαφορετική παραλλακτικότητα t_test3.xls 13
Έλεγχος υπόθεσης για τη διασπορά ενός πληθυσμού Έλεγχος υπόθεσης για το λόγο των διασπορών δύο πληθυσμών F-test 14
Δύο εξαρτημένα δείγματα με τιμές κατά ζεύγη Δεδομένα από 16 άτομα που εφάρμοσαν συγκεκριμένη δίαιτα. Αρχείο Excel: Paired_t_test.xls Ερώτηση 1: ελαττώθηκαν τα τριγλυκερίδια; Ερώτηση : έχασαν βάρος με τη δίαιτα; Ερώτηση 3: έχασαν 3 Kg; Ερώτηση 4: έχασαν 4Kg; 15