Οικονοµικό Πανεπιστήµιο Αθηνών Τµήµα Στατιστικής Σηµειώσεις για το µάθηµα : Ανάλυση ιακύµανσης και Σχεδιασµός Πειραµάτων



Σχετικά έγγραφα
) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Παράγοντας Β. Περιθώριοι µέσοι παράγοντα Β

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

2. Στοιχεία Πολυδιάστατων Κατανοµών

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Παρεµβολή και Προσέγγιση Συναρτήσεων

Κεφάλαιο 13. Εισαγωγή στην. Η Ανάλυση ιακύµανσης

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ONE WAY ANOVA. .Π.Μ.Σ. Μαθηµατικά των Υπολογιστών & των αποφάσεων. Πάτρα, 11 Ιανουαρίου 2011

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Τυχαιοποιηµένοι Πλήρως Σχεδιασµοί κατά Μπλοκ (Randomized Complete Block Design)

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

x y max(x))

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

9. Παλινδρόμηση και Συσχέτιση

Σηµειώσεις στις σειρές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

Γ. Πειραματισμός Βιομετρία

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Το θεώρηµα πεπλεγµένων συναρτήσεων

Κεφάλαιο 7. Έλεγχος Υποθέσεων. Ένα παράδειγµα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ 12) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ 3

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Διάστημα εμπιστοσύνης της μέσης τιμής

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Πρακτική µε στοιχεία στατιστικής ανάλυσης

< 1 για κάθε k N, τότε η σειρά a k συγκλίνει. +, τότε η η σειρά a k αποκλίνει.

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Αριθµητική Παραγώγιση και Ολοκλήρωση

Προσοχή: Για κάθε λανθασµένη απάντηση δεν θα λαµβάνεται υπόψη µία σωστή

Κεφάλαιο 6 Παράγωγος

Γ. Πειραματισμός - Βιομετρία

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Αριθµητική Ανάλυση. Ενότητα 5 Προσέγγιση Συναρτήσεων. Ν. Μ. Μισυρλής. Τµήµα Πληροφορικής και Τηλεπικοινωνιών,

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Κεφάλαιο 7 Βάσεις και ιάσταση

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

µηδενικό πολυώνυµο; Τι ονοµάζουµε βαθµό του πολυωνύµου; Πότε δύο πολυώνυµα είναι ίσα;

Είδη Μεταβλητών. κλίµακα µέτρησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

τη µέθοδο της µαθηµατικής επαγωγής για να αποδείξουµε τη Ϲητούµενη ισότητα.

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

5.1 Ιδιοτιµές και Ιδιοδιανύσµατα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 5 ΤΟ ΠΛΕΟΝΕΚΤΗΜΑ ΤΩΝ ΥΠΟΨΗΦΙΩΝ ΠΑΛΑΙΟΤΕΡΩΝ ΕΤΩΝ

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους.

ΠΟΛΥΩΝΥΜΙΚΕΣ - ΡΗΤΕΣ ΑΝΙΣΩΣΕΙΣ P x = x+ 2 4 x x 3x x x x 3x

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΚΡΥΠΤΟΛΟΓΙΑ ΣΗΜΕΙΩΣΕΙΣ #6 ΘΕΟ ΟΥΛΟΣ ΓΑΡΕΦΑΛΑΚΗΣ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κανόνες παραγώγισης ( )

Εισόδημα Κατανάλωση

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ.

f x = f a + Df a x a + R1 x, a, x U και από τον ορισµό της 1 h f a h f a h a h h a R h a i i j

5 Γενική µορφή εξίσωσης ευθείας

[ ], σχηµατίζουµε το άθροισµα. Το άθροισµα αυτό είναι µια δυαδική πράξη η οποία αντιστοιχεί στις ακολουθίες f [ 1

Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ)

ΘΕΩΡΙΑ: Έστω η οµογενής γραµµική διαφορική εξίσωση τάξης , (1)

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαχείριση Υδατικών Πόρων

7. Ανάλυση Διασποράς-ANOVA

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Συνήθεις ιαφορικές Εξισώσεις, Απαντήσεις-Παρατηρήσεις στην Εξέταση Περιόδου Σεπτεµβρίου.

Transcript:

Οικονοµικό Πανεπιστήµιο Αθηνών Τµήµα Στατιστικής Σηµειώσεις για το µάθηµα : Ανάλυση ιακύµανσης και Σχεδιασµός Πειραµάτων Βασίλης Βασδέκης - Στέλιος Ψαράκης Αθήνα 005

Πείραµα Είναι µια δοκιµή ή ένα σύνολο δοκιµών στις οποίες σκόπιµες αλλαγές γίνονται στις ανεξάρτητες µεταβλητές µιας διαδικασίας. Οι αλλαγές αυτές µπορούν να βοηθήσουν στην παρατήρηση και αξιολόγηση των αλλαγών στην απαντητική µεταβλητή. Παρακάτω δίνονται οι ορισµοί ορισµένων βασικών εννοιών που θα χρησιµοποιήσουµε στον πειραµατικό σχεδιασµό Εξαρτηµένη µεταβλητή: Είναι µια στατιστική µεταβλητή που εκφράζει το αποτέλεσµα του πειράµατος για κάποια πειραµατική µονάδα. Παράγοντας: Είναι µια µεταβλητή την οποία εκ προθέσεως ελέγχουµε ώστε να παρατηρήσουµε την επίδραση της στην απαντητική µεταβλητή. Επίπεδα: Είναι οι τιµές οι οποίες προκαθορίζονται για κάποιον παράγοντα Ελεγχόµενοι Παράγοντες Cotrollble Fctors X X K Xp Iput Process Output K Z Z Μη Ελεγχόµενοι Παράγοντες Ucotrollble (ose) Fctors Z q

Βασικές Αρχές Πειραµατικού Σχεδιασµού ) Επανάληψη (Replcto) : ηλαδή η χρήση δειγµάτων για την αντιµετώπιση της µεταβλητότητας. ) Λήψη Πλήρως Τυχαιοποιηµένων εδοµένων (Rdomzto): Για την αποφυγή συστηµατικοποίησης του προβλήµατος. 3) Χρήση µπλοκάδων (Blockg): ηµιουργία οµάδων µε οµοειδή δεδοµένα. Ανάλυση ιακύµανσης κατά Ένα Παράγοντα Στην ουσία, εµείς θέλουµε να ελέγξουµε την παρακάτω µηδενική υπόθεση ως προς την εναλλακτική. H H 0 : µ µ : µ µ j... µ () Αν χρησιµοποιήσουµε έλεγχο υποθέσεων ανά δύο, δηλαδή µ µ j τότε ξέρουµε ότι κάθε έλεγχος υπόθεσης έχει επίπεδο σηµαντικότητας α. Άρα επειδή αυτοί οι έλεγχοι θα πρέπει να ισχύουν ταυτόχρονα τότε το επίπεδο σηµαντικότητας αυξάνεται. ( Είναι δηλαδή (-α)(-α) (-α)). Για αυτό το λόγο χρησιµοποιείται η ανάλυση διακύµανσης. Έχουµε τον παρακάτω πίνακα: Tretmet (Level) Observtos Totls Averge K K M M M K M M M K όπου Συνοψίζοντας: j j, j j, N Ν: Συνολικός αριθµός παρατηρήσεων : Αριθµός παρατηρήσεων σε κάθε επίπεδο << και <j< 3

Ένα µοντέλο το οποίο θα περιγράφει καλύτερα τα δεδοµένα µας είναι: j µ + τ + ε j όπου: τ το πόσο επιδρά το επίπεδο στο µοντέλο, τ µ σταθερό, 0 ε j τα σφάλµατα τα οποία είναι ανεξάρτητα και ακολουθούν Ν (0, σ ) Έτσι προχωράµε στον έλέγχο υπόθεσης: H H 0 : τ τ... τ α : τ 0 για τουλάχιστον ένα SS T ( j ) [ ( ) + (j )] ( ) + ( j ) j j j SS SS + SS T tretmet E Επίσης ισχύουν οι τύποι, οι οποίοι χρησιµοποιούνται συνήθως στις ασκήσεις διότι είναι πιο ακριβής: Οι βαθµοί ελευθερίας είναι: SS T j και SS Tr j ιασπορά ανάµεσα (betwee) στα επίπεδα: N Οι συνολικοί βαθµοί ελευθερίας είναι: Ισχύει επίσης ότι: ιασπορά µέσα (wth) στα επίπεδα: ( ) N N 4

SSE N ( ) S + ( ) S + L + ( ) ( ) + ( ) + L + ( ) S, όπου S j ( j ) Ορίζουµε: MS Tr SSTr MS E SSE N Αποδεικνύεται ότι: E ( MS ) Tr τ σ E( ) σ + MS E Επίσης ισχύει ότι: SS σ Tr ~ X α, και SS σ E ~ X α,n οπότε F MS Tr 0 ~ Fα,,N MSE Αν το F 0 είναι µεγάλος αριθµός, τότε τα µεταξύ τους τ διαφέρουν στατιστικά σηµαντικά Αν το F 0 είναι µικρός αριθµός, τότε τα µεταξύ τους τ δε διαφέρουν στατιστικά σηµαντικά Παρατήρηση: Για να ακολουθεί ο λόγος δύο ανεξάρτητες Cochr Θεώρηµα Cochr s MS MS Tr E F κατανοµή, θα πρέπει τα SS Tr σ και SS E σ να είναι X κατανοµές. Το τελευταίο ισχύει λόγω του Θεωρήµατος του 5

Έστω ~ N( 0,) r Z και ισχύει: Z Q + Q + K + Qs, όπου τα Q έχουν βαθµούς ελευθερίας,,, K, s ν Τα Q είναι ανεξάρτητες και µόνο εάν X κατανοµές µε ν, K ν βαθµούς ελευθερίας, εάν ν,, r ν ν + ν + K + νs, όπου ν οι συνολικοί βαθµοί ελευθερίας, δηλαδή s Z ~ X ν Εκτίµηση των Παραµέτρων του Μοντέλου Η εκτίµηση των παραµέτρων γίνεται µε τη µέθοδο των ελαχίστων τετραγώνων j µ + τ + ε j,, K, µ ˆ τˆ, Έλεγχος Καταλληλότητας του Μοντέλου Σύµφωνα µε όσα έχουµε πει µέχρι τώρα, ξέρουµε ότι οι παρατηρήσεις µας περιγράφονται επαρκώς από το µοντέλο: j µ + τ + ε j µε τις προϋποθέσεις ότι τα ε j είναι ανεξάρτητα µεταξύ τους και κατανέµονται κανονικά µε µέσο 0 και διακύµανση άγνωστη αλλά σταθερή σ. Η παραβίαση αυτών των προϋποθέσεων, καθώς και η καταλληλότητα του µοντέλου, µπορούν εύκολα να ανιχνευθούν από την µελέτη των καταλοίπων. e j j ˆ j ˆ ˆ όπου ŷ j µ + τ + ( ) ) Για τον έλεγχο της κανονικότητας των καταλοίπων j e µπορουν να γίνουν διάφοροι έλεγχοι ( π.χ. P P plot ή ιστόγραµµα). Εάν υπάρχουν ακραίες τιµές (outlers) οι οποίες επηρεάζουν την κανονικότητα των καταλοίπων, τότε κάνουµε έλεγχο για να διαπιστώσουµε εάν όντως είναι πραγµατικές ή προήλθαν από κάποιο άλλο σφάλµα ( π.χ. λάθος στην µέτρηση). Αν είναι απόρροια κάποιου σφάλµατος 6

τότε τις αφαιρούµαι, αν είναι πραγµατικές τιµές τότε κάνουµε δύο αναλύσεις των δεδοµένων µας, µία λαµβάνοντας υπόψη µας τις τιµές αυτές και µία αφαιρώντας αυτές τις τιµές. ) Για τον έλεγχο της ανεξαρτησίας των e j χρησιµοποιούµε το Plot of Resduls Tme Sequece. Αν µελετώντας το διάγραµµα αυτό παρατηρήσουµε µια σχέση ανάµεσα στα κατάλοιπα, τότε υπάρχει πρόβληµα συσχέτισης. Για να µην υπάρχει πρόβληµα θα πρέπει τα κατάλοιπα να εµφανίζονται πάνω στο διάγραµµα τυχαιοποιηµένα. 3) Για τον έλεγχο της σταθερότητας της διακύµανσης σ των e j χρησιµοποιούµε το Plot of Resduls Versus Ftted Vlues. Στο διάγραµµα αυτό σε κάθε ftted vlue τοποθετούµε τις διακυµάνσεις των καταλοίπων του αντίστοιχου επιπέδου. Αν οι διακυµάνσεις αυτές από επίπεδο παραµένουν σταθερές τότε δεν έχουµε πρόβληµα, αν µεταβάλλονται τότε προσπαθούµε να λύσουµε αυτό το πρόβληµα µετασχηµατίζοντας τα δεδοµένα µας. Για να ελέγξουµε την ισότητα υπάρχουν διάφορα test. Ένα από αυτά είναι το Brlett s Test. H 0 : σ σ L σ H : σ σ, j j Απορρίπτουµε την H 0 εάν ισχύει: όπου q X 0,306 c X 0 > X α, ( N α) log0 Sp ( ) log 0 S q α διακύµανση κάθε επιπέδου Η διαφορά της S p από τη c + ( ) και 3 ( ) ( N ) S p ( ) N S Αν η τυπική απόκλιση σ είναι ανάλογη του µέσου µ ( σ µ παρακάτω µετασχηµατισµό: λ * ), τότε κάνουµε τον 7

Αποδεικνύεται ότι θα ισχύει: σ µ λ+ και εφόσον θέλουµε η διακύµανση να βγει σταθερή, θα πρέπει να είναι ανάλογη του. Άρα θα πρέπει ο εκθέτης του µ να είναι 0 Παρατήρηση: λ + 0 λ Στα µετασχηµατισµένα δεδοµένα θα έχω ένα βαθµό ελευθερίας λιγότερο µέσα (wth) στα επίπεδα, δηλαδή N και συνολικά θα έχουµε N βαθµούς ελευθερίας. Αυτό συµβαίνει διότι θα πρέπει να υπολογίσω και τη µεταβλητή που λ+ υπάρχει στον µετασχηµατισµό ( σ µ ). Παραθέτουµε ακόµη και ένα πίνακα µε τις διάφορες τιµές του και του λ και τους αντίστοιχους µετασχηµατισµούς που προκύπτουν: Σχέση µεταξύ σ και µ λ - Μετασχηµατισµός σ σταθερό 0 Κανένας σ µ / / / Τετραγωνική ρίζα (Posso) σ µ 0 Λογαριθµική σ µ 3/ 3/ -/ Αντίστροφη τετραγωνική ρίζα σ µ - Αντίστροφη Εµπειρική επιλογή του. Σε πολλές περιπτώσεις πειραµατικού σχεδιασµού µπορούµε να εκτιµήσουµε το α εµπειρικά από τα δεδοµένα. Όπως αναφέραµε, ισχύει σ µ θµ, όπου θ είναι ένας σταθερός αριθµός που εκφράζει την αναλογία. Εποµένως λογαριθµίζοντας έχουµε: log σ log θ + logµ Έτσι, αντικαθιστώντας τα άγνωστα σ και µ µε τις εκτιµήσεις τους σχεδιάζουµε την ευθεία που παρουσιάζει η παραπάνω εξίσωση και µε βάση την κλίση της υπολογίζουµε εµπειρικά το. Συγκρίσεις των µέσων µεταξύ των επιπέδων 8

Αυτή η παράγραφος έχει νόηµα να εξεταστεί και να σχολιαστεί από τη στιγµή που η αρχική υπόθεση H 0 : τ 0 απορρίπτεται. Έτσι, κάποιοι µέσοι διαφέρουν µεταξύ τους. Ποιοι όµως; Και µε τι ποσοστό στατιστικής σηµαντικότητας; Η απάντηση σε αυτά τα ερωτήµατα δίνεται µε την χρησιµοποίηση διάφορων τεστ µε τα οποία συγκρίνουµε κάποιους µέσους µεταξύ τους ή ακόµη και γραµµικούς συνδυασµούς των µέσων µεταξύ τους. Παρακάτω περιγράφονται κάποια σηµαντικά τεστ καθώς επίσης δίνονται και κάποια παραδείγµατα για την κάθε περίπτωση. Το τεστ των «ιαφορών» (Cotrsts) Έστω ότι έχουµε την περιεκτικότητα βαµβακιού και εξετάζουµε την ανθεκτικότητα του στα πέντε διαφορετικά επίπεδα των 5%, 0%, 5%, 30% και 35% περιεκτικότητα σε βαµβάκι σε lb/. Όπως παρατηρούµε, η αρχική υπόθεση H 0 : τ 0 απορρίφθηκε εποµένως ξέρουµε πως κάποιοι µέσοι από τους µ, µ, µ 3, µ 4, µ 5 διαφέρουν. Ποιοι όµως; Αν υποψιαζόµαστε εµείς πως διαφέρουν οι µέσοι του 4 ου και 5 ου επιπέδου δηλαδή των 30% και 35% περιεκτικότητας αντιστοίχως τότε απλώς θα θέλαµε να ελέγξουµε την αρχική υπόθεση H 0 : µ 4 µ 5 ως προς την εναλλακτική H : µ 4 µ 5. Αυτή η υπόθεση βέβαια θα µπορούσε να ελεγχθεί µελετώντας ένα κατάλληλο γραµµικό συνδυασµό των µέσων των επιπέδων 4 και 5 όπως για παράδειγµα 4 5 Αντιστοίχως ίσως να θέλαµε να ελέγξουµε την υπόθεση 0 : : 0 H µ + µ 3 µ 4 + µ H µ + µ µ + µ 3 4 5 5 η οποία υπονοεί το γραµµικό συνδυασµό + 3 4 5 Γενικά, το τεστ αυτό µπορεί να εφαρµοστεί για ένα οποιοδήποτε γραµµικό συνδυασµό επιπέδων της µορφής δηλαδή C c µε τον περιορισµό ότι c 0. Οι παραπάνω γραµµικοί συνδυασµοί ονοµάζονται διαφορές (cotrsts). Μια διαφορά όπως η παραπάνω εκτιµάται αν στη θέση των µέσων αντικαταστήσουµε τις αντίστοιχες εκτιµήσεις των µέσων από τα δεδοµένα. Σε κάθε τέτοια διαφορά αντιστοιχεί και ένα άθροισµα τετραγώνων. Το άθροισµα των τετραγώνων για τη διαφορά C είναι µ 0 9

SS C c. c όπου. είναι ο µέσος όρος των παρατηρήσεων του επιπέδου του παράγοντα. Αν εναλλακτικά θελήσουµε να δουλέψουµε µε τα αθροίσµατα των παρατηρήσεων του επιπέδου του παράγοντα τότε το άθροισµα τετραγώνων παίρνει τη µορφή SS C c. c Το άθροισµα τετραγώνων που προκύπτει µε αυτόν τον τρόπο έχει ένα βαθµό ελευθερίας. Η τιµή SS C αφού διαιρεθεί µε το άθροισµα τετραγώνων των σφαλµάτων SS E συγκρίνεται µε τη κρίσιµη τιµή (p-vlue ) της κατανοµής F µε και N βαθµούς ελευθερίας. Ορθογώνιες διαφορές Μια ειδική περίπτωση του τεστ των διαφορών είναι το τεστ των ορθογώνιων διαφορών. Σαν ορθογώνιες διαφορές ορίζουµε τις διαφορές D d µ όπου ισχύει c d 0 C c ή αν έχουµε ασύµµετρο σχέδιο (δηλαδή όχι µε τις ίδιες παρατηρήσεις σε όλα τα επίπεδα) θα ισχύει c d 0 Λέµε εποµένως τότε πως οι διαφορές C και D είναι ορθογώνιες µεταξύ τους. Το τεστ των ορθογωνίων διαφορών έχει µια προϋπόθεση για να µπορεί να εφαρµοστεί. Αν έχουµε α επίπεδα θα πρέπει να έχουµε α- διαφορές προς εξέταση. Αν αυτές οι διαφορές είναι ορθογώνιες τότε µπορεί να δειχτεί ότι το άθροισµα των αθροισµάτων τετραγώνων που αντιστοιχεί σε κάθε διαφορά είναι ίσο µε το άθροισµα τετραγώνων που οφείλεται στον παράγοντα. Αν δηλαδή έχουµε όπως στο παράδειγµα µας πέντε επίπεδα το τεστ αυτό θα εφαρµοστεί σε 5-4 γραµµικούς συνδυασµούς. Αυτόµατα δηµιουργείται και το ερώτηµα όµως, «ποιοι θα είναι αυτοί οι α- γραµµικοί συνδυασµοί και µε ποια κριτήρια θα τους επιλέξω;». Με άλλα λόγια, για µ, Υπενθυµίζεται πως αν p-vlue < α τότε απορρίπτεται η 0 H (α: επίπεδο στατιστικής σηµαντικότητας) 0

ποιο λόγο να επιλέξω µια (α-)-άδα από γραµµικούς συνδυασµούς τους οποίους θα εξετάσω και να µην επιλέξω µια άλλη η οποία προφανώς να περιέχει απλούστερους γραµµικούς συνδυασµούς. Η απάντηση σ αυτό το ερώτηµα δυστυχώς δεν είναι πάντοτε εύκολη. Εξαρτάται από τα επίπεδα που έχουµε αλλά και από τις εκάστοτε συνθήκες κάτω από τις οποίες λάβαµε τις παρατηρήσεις για τα εν λόγω επίπεδα. Επίσης εξαρτάται από τις υποψίες και την πείρα του εκάστοτε ειδικού που εκτελεί το τεστ για το ποιοι µέσοι µπορεί να διαφέρουν. Παραθέτουµε το παρακάτω παράδειγµα για την καλύτερη κατανόηση του σκοπού του τεστ των ορθογώνιων διαφορών: Παράδειγµα Θεωρήστε το προηγούµενο παράδειγµα µε την περιεκτικότητα του νήµατος σε βαµβάκι. Υπάρχουν µέσοι για τα πέντε επίπεδα και τέσσερις βαθµοί ελευθερίας µεταξύ αυτών των επιπέδων. Ένα αυθαίρετο σετ από τέσσερις διαφορές (C ) είναι το παρακάτω Υποθέσεις ιαφορές Η 0 : µ 4 µ 5 C - 4. + 5. Η 0 : µ + µ 3 µ 4 + µ 5 C + 3. - 4. - 5. Η 0 : µ µ 3 C 3-3. Η 0 : 4µ µ + µ 3 + µ 4 + µ 5 C 4 + 4. - 3. - 4. - 5. Παρατηρούµε ότι οι διαφορές είναι ορθογώνιες διότι όπως είπαµε αν πολλαπλασιάσουµε τους αντιστοίχους συντελεστές καθενός και τους προσθέσουµε έχουµε άθροισµα µηδέν. Χρησιµοποιώντας τώρα τις τιµές των όπως αυτές έχουν βρεθεί, έχουµε τις τιµές των C. Έτσι, ιαφορές C - (08) + (54) - 54 C + (49) + (88) - (08) - (54) - 5 C 3 + (49) - (88) - 39 C 4 - (49) + 4(77) - (88) - (08) - (54) 9 Επίσης υπολογίζουµε το άθροισµα των διαφορών, ( 54) ( 5) SSC 9.60, SSC 3.5, 5() 5(4) ( 39) C 3 ( 9) C 4 SS 5.0, SS 0.8 5() 5(0) Όπως φαίνεται και στον τελευταίο πίνακα µε βάση τις κριτικές τιµές (p-vlue) της F κατανοµής κρίνουµε αν δεχόµαστε ή απορρίπτουµε τις αρχικές υποθέσεις H 0 που προτείνουν οι διαφορές C.

Πηγή Περιεκτικότητα σε βαµβάκι στις ορθογώνιες διαφορές Πίνακας Ανάλυσης ιακύµανσης Άθροισµα Τετραγώνων Βαθµοί Ελευθερίας Μέσο άθροισµα τετραγώνων F 0 P-Vlue 475.76 4 8.94 4.76 <0.00 C : µ 4 µ 5 (9.60) 9.60 36.8 <0.00 C : µ + µ 3 µ 4 + µ 5 (3.5) 3.5 3.88 0.06 C 3 : µ µ 3 (5.0) 5.0 8.87 <0.00 C 4 : 4µ µ + µ 3 + µ 4 + µ 5 (0.8) 0.8 0.0 0.76 Σφάλµα 6.0 0 8.06 Σύνολο 636.96 4 Παρατηρήστε ότι το άθροισµα των επιµέρους αθροισµάτων τετραγώνων που αντιστοιχεί σε κάθε διαφορά είναι το άθροισµα τετραγώνων του παράγοντα περιεκτικότητα σε βαµβάκι. Οι διαφορές C και C 3 αποδεικνύεται ότι είναι στατιστικά µη σηµαντικές δηλαδή οι µέσοι µ 4 και µ 5 και αντιστοίχως οι µέσοι µ και µ 3 διαφέρουν στατιστικά σηµαντικά. Ορθογώνια πολυώνυµα Οταν τα επίπεδα του παράγοντα είναι τακτικές τιµές, τότε µια ιδιαίτερη µορφή ορθογωνίων διαφορών είναι αυτή των ορθογωνίων πολυωνύµων. Με αυτές τις διαφορές µπορούµε να ελέγξουµε αν οι µέσοι όροι σε κάθε επίπεδο του παράγοντα µπορούν αν δοµηθούν χρησιµοποιώντας ένα πολυώνυµο - βαθµού, όπου είναι ο αριθµός επιπέδων του παράγοντα. Απαραίτητη προυπόθεση είναι τα επίπεδα του παράγοντα να είναι ισαπέχοντα. Τους συντελεστές των διαφορών των ορθογωνίων πολυωνύµων µπορούµε να τους βρούµε από κατάλληλους πίνακες. Εστω, ότι διαθέτουµε έναν παράγοντα µε τρία επίπεδα των οποίων οι τιµές είναι τακτικές τιµές. Τότε µπορούµε να χρησιµοποιήσουµε έως και ένα δευτέρου βαθµού πολυώνυµο για να δοµήσουµε τους τρείς µέσους της εξαρτηµένης µεταβλητής στα τρία επίπεδα του παράγοντα. Οι συντελεστές αυτοί είναι Συντελεστές διαφορών ου βαθµού πολυωνύµου - 0-3 Επίπεδα του παράγοντα Συντελεστές διαφορών ου βαθµού πολυωνύµου Τότε, αν υποθέσουµε ότι οι τρεις µέσοι των επιπέδων του παράγοντα γράφονται µ + bx µ + b( x + d) µ 3 + b( x + d) όπου, b είναι οι συντελεστές ενός πολυωνύµου ου βαθµού και d είναι η απόσταση µεταξύ των επιπέδων του παράγοντα, θα δούµε ότι C L bd και C Q 0. Με παρόµοιο τρόπο αν µ + bx + cx µ + b( x + d) + c( x + d )

µ 3 + b( x + d) + c( x + d) τότε C L bd+4cd +4cxd και C Q -cd. Οι παραπάνω ισότητες δείχνουν ότι αν οι µέσοι δοµούνται από ένα πολυώνυµο ου βαθµού τότε ο έλεγχος για τη στατιστική σηµαντικότητα του C Q συµπίπτει µε τον έλεγχο στατιστικής σηµαντικότητας του δευτεροβάθµιου όρου. Αν η διαφορά αυτή είναι στατιστικώς ασήµαντη τότε η στατιστική σηµαντικότητα του C L συµπίπτει µε τη στατιστική σηµαντικότητα του πρωτοβάθµιου όρου. Αν στην πραγµατικότητα οι µέσοι δοµούνται από ένα πρωτοβάθµιο πολυώνυµο, τότε το C Q θα έχει τιµή 0 και η στατιστική σηµαντικότητα του C L θα συµπίπτει µε τη στατιστική σηµαντικότητα του πρωτοβάθµιου όρου. Παράδειγµα Σε ένα πείραµα για τον έλεγχο της αντοχής ενός υλικού µετρήθηκε η αντοχή του ανάλογα µε τη θερµοκρασία στην οποία το υλικό έχει υποστεί επεξεργασία. Ο παρακάτω συγκεντρωτικός πίνακας δίνει τα βασικά αποτελέσµατα x. s 4 7 333. 36.59 6 7 368. 8.57 8 7 375. 0.83 0 7 407.4 44.5 7 437. 6.00 Ο πίνακας ανάλυσης διασποράς υποδεικνύει διαφορές µεταξύ των θερµοκρασιών. SS df MS F Θερµοκρασίες 43993 4 0998 0.48 Σφάλµα 3475 30 049 Ολικό 75468 34 Θα θέλαµε να δοµήσουµε λίγο περισσότερο αυτή τη διαφορά µεταξύ των µέσων τιµών στην κάθε θερµοκρασία και ένας καλός τρόπος είναι να χρησιµοποιήσουµε µια πολυωνυµική σχέση πάνω στη θερµοκρασία. Ο πίνακας των συντελεστών των ορθογωνίων πολυωνύµων µέχρι 4 ου βαθµού (θυµηθείτε ότι υπάρχουν 5 θερµοκρασίες) είναι x ου βαθµού ου βαθµού 3 ου βαθµού 4 ου βαθµού 4 - - 6 - - -4 8 0-0 6 0 - - -4 Το cotrst που αντιστοιχεί στον πρώτο βαθµό πολυωνύµου είναι ( 333. 368.+ 0 375.+ 407.4 + 437.) SS L 4780 ( ) + ( ) + 0 + + 7 Με όµοιο τρόπο λαµβάνουµε τον παρακάτω πίνακα ανάλυσης διασποράς 3

SS df MS F Θερµοκρασίες 43993 4 0998 0.48 ου βαθµού 4780 4780 40.78 ου βαθµού 4 4 0. 3 ου βαθµού 450 450 0.43 4 ου βαθµού 648 648 0.6 Σφάλµα 3475 30 049 Ολικό 75468 34 Από την παραπάνω ανάλυση γίνεται φανερό ότι οι µέση αντοχή του υλικού δε διαφέρει απλά στα διάφορα επίπεδα της θερµοκρασίας αλλά καθώς αυξάνεται η θερµοκρασία η αντοχή αυτή αλλάζει µε γραµµικό τρόπο. Μέθοδος Scheffe για σύγκριση όλων των διαφορών Στην περίπτωση που δεν ξέρουµε εκ των προτέρων ποιες διαφορές θέλουµε να συγκρίνουµε, ή ενδιαφερόµαστε για περισσότερες από α- διαφορές χρησιµοποιούµε το τεστ του Scheffe. Σε αυτό το τεστ το λάθος τύπου Ι είναι το πολύ α για όλους τους δυνατούς συνδυασµούς διαφορών. ιαδικασία Έστω Γu c uµ + c uµ + L + cuµ u,,,m ένα σετ από m διαφορές που µας ενδιαφέρουν. Η απαντητική µας διαφορά δίνεται από την σχέση Cu cu + cu + L + cu u,,,m και το τυπικό της σφάλµα από την σχέση S c MSE ( cu / ) Εµείς, θα συγκρίνουµε την C u µε την τιµή Sα, u S ( ) Fα,,N u cu και Αν C u > S, u τότε υπόθεση ότι η διαφορά είναι ίση µε το 0 απορρίπτεται. Αν C u S, u τότε δεν υπάρχει στατιστικά σηµαντική διαφορά (στο α επίπεδο σηµαντικότητας) ώστε να απορρίψουµε την παραπάνω υπόθεση. Παράδειγµα Στο παράδειγµα της περιεκτικότητας του νήµατος σε βαµβάκι έστω ότι οι διαφορές που µας ενδιαφέρουν είναι οι Γ µ +µ 3 -µ 4 -µ 5 και Γ µ -µ 4. Οι αριθµητικές τιµές των διαφορών αυτών είναι C + 3 4 9.80 + 7.60.6 0.8 5.00 και C 4 S 9.80.60.80, και τα τυπικά τους λάθη MS E ( c / ) 8.06( + + + ) / 5. 54 c 4

c E και S MS ( c / ) 8.06( + ) / 5. 80 Τέλος, υπολογίζουµε και τις τιµές S0.0, S ( ) F0.0,,N.54 4( 4.43) 0. 69 και c ( ) F.80 4(4.43) 7. 58 S0.0, Sc 0.0,,N µε τις οποίες θα συγκρίνουµε τα C και C αντίστοιχα. Συµπεράσµατα: Επειδή C < S 0.0, συµπεραίνουµε ότι οι µέσοι των επιπέδων και 3, σαν γκρουπ, δεν διαφέρουν στατιστικά σηµαντικά από τους µέσους των επιπέδων και 4, σαν γκρουπ. Αντίθετα, επειδή C > S 0.0, συµπεραίνουµε ότι οι µέσοι των επιπέδων και 4 διαφέρουν στατιστικά σηµαντικά. Η διαδικασία του Scheffe µπορεί να χρησιµοποιηθεί και για τον σχηµατισµό διαστηµάτων εµπιστοσύνης για όλες τις δυνατές διαφορές σύµφωνα µε τον τύπο C u S,u Γu Cu + S,u Θα πρέπει να σηµειώσουµε ότι τα παραπάνω διαστήµατα εµπιστοσύνης είναι ταυτόχρονα διαστήµατα εµπιστοσύνης µε την έννοια ότι η πιθανότητα ότι όλα αυτά αληθεύουν ταυτόχρονα είναι τουλάχιστον -α. Τέλος το τεστ του Scheffe µπορεί να χρησιµοποιηθεί, όπως είναι φανερό, και για ελέγχους διαφορών της µορφής Γ µ µ j για όλα τα j. Παρά του ότι πρόκειται για µία εύκολη διαδικασία δεν χρησιµοποιείται συχνά διότι δεν είναι η περισσότερο ευαίσθητη διαδικασία για τέτοιου είδους συγκρίσεις. Σύγκριση ζευγαριών µέσων των διαφόρων επιπέδων Με τα παρακάτω τεστ ενδιαφερόµαστε για τον έλεγχο όλων των µηδενικών υποθέσεων της µορφής H 0 : µ µ j για όλα τα j.. Μέθοδος LSD (Lest Sgfct Dfferece) j Στην µέθοδο αυτή χρησιµοποιείται το t στατιστικό t 0 και MS E + j απορρίπτουµε τις µηδενικές υποθέσεις των ζευγαριών των µέσων για τα οποία ισχύει j j > LSD όπου. α η ποσότητα LSD προφανώς γράφεται LSD t α /,N MSE +. Στην περίπτωση που j MSE LSD t α /,N. 5

Παράδειγµα Στο παράδειγµά µας,για α0.05, βρίσκουµε MSE ( 8.06) LSD t 0.05,0.086 3.75 5 9.8 5.4 3 6.6 4.6 5 0.8 και οι διαφορές στους µέσους είναι * 9.8 5.4 5. 6 * 3 9.8 7.6 7. 8 * 4 9.8.6. 8 5 9.8 0.8.0 3 5.4 7.6. 4 5.4.6 6.* 5 5.4 0.8 4.6* 4 3 7.6.6 4.0* 5 3 7.6 0.8 6.8* 4 5.6 0.8 0.8*. Οι τιµές µε αστεράκι σηµαίνουν ότι οι αντίστοιχοι µέσοι διαφέρουν στατιστικά σηµαντικά. Αυτό µπορεί να δειχθεί και µε το παρακάτω σχήµα όπου υπογραµµίζονται τα ζευγάρια των µέσων που δεν διαφέρουν στατιστικά σηµαντικά. 5 3 4 Παρατηρήσεις Όσο ο αριθµός των επιπέδων α αυξάνεται, το λάθος τύπου Ι του πειράµατος (δηλαδή ο λόγος του αριθµού των πειραµάτων στα οποία ένα τουλάχιστον λάθος τύπου Ι συµβαίνει προς τον συνολικό αριθµό των πειραµάτων) επίσης αυξάνεται. Ενώ το στατιστικό F της ANOVA µπορεί να συµπεράνει ότι κάποιοι µέσοι διαφέρουν, η µέθοδος LSD µπορεί να αποτύχει να ανιχνεύσει την παραπάνω διαφορά επειδή συγκρίνει µόνο ζευγάρια µέσων και όχι γραµµικούς συνδυασµούς µε περισσότερους από δύο µέσους.. Duc s Multple Rge Test Σε αυτό το τεστ οι µέσοι των α επιπέδων διατάσσονται κατά αύξουσα σειρά και υπολογίζεται οι τυπική τους απόκλιση από τον τύπο S MS E, όπου το, στην 6

περίπτωση άνισων δειγµάτων µεγέθους µέσο h /, αντικαθίσταται από τον αρµονικό τους. Στη συνέχεια υπολογίζονται οι ποσότητες p rα ( p,f ) ( ) R S για p,3,,α, όπου α το επίπεδο σηµαντικότητας και f ο αριθµός των βαθµών ελευθερίας του SS. E ιαδικασία Ελέγχουµε τις παρατηρούµενες διαφορές j, ξεκινώντας από την διαφορά mx m, την οποία συγκρίνουµε µε το µεγαλύτερο R p. Στη συνέχεια συγκρίνουµε την mx m j, όπου m j το δεύτερο µικρότερο, µε το R α- κ.ο.κ. Αν κάποια από τις διαφορές j είναι µεγαλύτερη του αντίστοιχου R p, συµπεραίνουµε ότι το ζευγάρι αυτό των µέσων διαφέρει στατιστικά σηµαντικά. Παράδειγµα j Στο παράδειγµα της περιεκτικότητας του νήµατος σε βαµβάκι έχουµε : MSE 8.06 N 5 5 S 8.06 / 5.7 9.8 5.4 3 6.6 4.6 5 και 0.8 Για fn-α0 και α0.05 υπολογίζεται από πίνακες ότι r 0.05 (,0).95, r 0.05 (3,0)3.0, r 0.05 (4,0)3.8, r 0.05 (5,0)3.5 Εποµένως, και (,0) S (.95)(.7) 3. 75 ( 3,0) S (3.0)(.7) 3. 94 ( 4,0) S (3.8)(.7) 4. 04 ( 5,0) S (3.5)(.7) 4. 3 R r0.05 R 3 r0.05 R 4 r0.05 R 5 r0.05 Οι διάφορες συγκρίσεις θα έχουν ως εξής : 4 vs.. :.6-9.8.8>4.3 (R 5 ) 4 vs.. 5 :.6-0.80.8>4.04 (R 4 ) 4 vs.. :.6-5.46.>3.94 (R 3 ) 4 vs.. 3 :.6-7.64.0>3.75 (R ) 7

3 vs.. : 7.6-9.87.8>4.04 (R 4 ) 3 vs.. 5 : 7.6-0.86.8>3.95 (R 3 ) 3 vs.. : 7.6-5.4.<3.75 (R ) vs.. : 5.4-9.85.6>3.94 (R 3 ) vs.. 5 : 5.4-0.84.6>3.75 (R ) 5 vs. : 0.8-9.8.0<3.75 (R ) Εποµένως, εκτός από τα ζευγάρια 3- και 5-,όλα τα άλλα ζευγάρια των µέσων διαφέρουν στατιστικά σηµαντικά. Σηµείωση Επειδή η διαδικασία του Duc είναι πολύ αποτελεσµατική στο να ανιχνεύει διαφορές µεταξύ των µέσων όταν πραγµατικά υπάρχουν, το τεστ του Duc είναι από τα πιο δηµοφιλή τεστ. 3. Τεστ Newm-Keuls H διαδικασία είναι ακριβώς η ίδια µε του Duc µόνο που εδώ η σταθερά R αντικαθίσταται µε την σταθερά Κ, µε τύπο K q α ( p,f ) S p,3,...,.τέλος, επειδή για p> είναι πάντοτε q ( p,f ) r ( p,f ) p > συµπεραίνουµε ότι το τεστ των Newm-Keuls είναι περισσότερο συντηρητικό από του Duc. 4. Τεστ Tuke H διαδικασία και αυτού του τεστ µοιάζει µε τις δύο προηγούµενες, µόνο που εδώ όλες οι διαφορές συγκρίνονται µε την τιµή T q (,f ) S.Στην περίπτωση που κάποια διαφορά (κατά απόλυτη τιµή) υπερβαίνει την τιµή Τ α, λέµε ότι το παραπάνω ζευγάρι των µέσων διαφέρει στατιστικά σηµαντικά. Τέλος, το τεστ του Tuke είναι περισσότερο συντηρητικό (και εποµένως έχει µικρότερη ισχύ) τόσο από το τεστ του Duc όσο και από το τεστ των Newm-Keuls. Επιλογή Μεγέθους είγµατος. Μέσω χαρακτηριστικής συνάρτησης Φ Ένα εξίσου σηµαντικό στοιχείο είναι το µέγεθος του δείγµατος που θα επιλέξουµε. ηλαδή το µέγεθος του δείγµατος που αφορά την επανάληψη του πειράµατος. Όπως είναι φυσικό αν κάποιος ενδιαφέρεται να µετρήσει µικρές µεταβολές θα πρέπει να επιλέξει και µεγάλο αριθµό δείγµατος (επαναλήψεων). 8

Για να βρούµε όµως τον κατάλληλο αριθµό δείγµατος µπορούµε να χρησιµοποιήσουµε χαρακτηριστικές καµπύλες µε την βοήθεια του β σφάλµα τύπου ΙΙ. Υπολογίζουµε τώρα το σφάλµα τύπου ΙΙ: β P{ Re ject H H είναι λάθος} P{ F F H είναι λάθος} 0 0 ο > α,, Ν 0 Για να υπολογίσουµε το β θα πρέπει να ξέρουµε ποια κατανοµή ακολουθεί το F. 0 Αποδεικνύεται ότι αν η αρχική υπόθεση H0 είναι λάθος τότε το F0 ακολουθεί µια µη κεντρική Fα,,N µε µια παράµετρο δ. Έτσι µέσω του σφάλµατος τύπου ΙΙ τότε βρίσκουµε µια παράµετρο Φ και µέσω αυτής προσδιορίζουµε το µέγεθος του δείγµατος. Φ τ ασ Βέβαια όπως βλέπουµε στο τύπο δεν γνωρίζουµε το σ. Για αυτό το λόγο θέτουµε το σ βασιζόµενοι σε στοιχεία που έχουµε. Ακόµη το τ µ µ µε µ µ όπου τις τιµές των µέσων µ τις παίρνουµε συνήθως από εµπειρικές τιµές.. Μέσω του διαστήµατος εµπιστοσύνης Σύµφωνα µε αυτήν την µέθοδο ο ερευνητής θέλει να εκφράσει τα τελικά του αποτελέσµατα του µέσω διαστηµάτων εµπιστοσύνης και να πει πόσο «ανοικτά» θέλει να είναι αυτά τα διαστήµατα εµπιστοσύνης. Έτσι χρησιµοποιώντας τον παρακάτω τύπο: ± t α /, Ν MS Ε και να υπενθυµίσουµε ότι το MSE είναι µια εκτίµηση του σ. Έτσι ανάλογα το διάστηµα εµπιστοσύνης που θέλουµε να έχουµε π.χ. στο παράδειγµα µε το ποσοστό βαµβακιού, αν υποθέσουµε ότι θέλουµε ένα 95% δ.ε. για την διαφορά των µέσων των επιπέδων και θέσουµε εµείς το σ τότε εύκολα υπολογίζουµε το µέγεθος του δείγµατος. 9

Μη παραµετρικές µέθοδοι στην ANOVA Ενα σηµαντικό ερώτηµα που προκύπτει είναι τι µπορούµε να κάνουµε στην περίπτωση που δεν µπορούµε να υποθέσουµε κανονικότητα. Μια λύση προς αυτή την κατεύθυνση είναι η χρήση µη παραµετρικών ελέγχων. Ενας πολύ γνωστός έλεγχος είναι των Kruskl-Wlls. Καταρχάς τις παρατηρήσεις που έχουµε, rk. Έτσι η στατιστική συνάρτηση είναι R +. N(N ) H S 4 j τις βάζουµε σε αύξουσα σειρά δηλαδή όπου είναι ο αριθµός των παρατηρήσεων στο επίπεδο και Ν ο συνολικός αριθµός των παρατηρήσεων. Επίσης: Να σηµειώσουµε ότι το S N(N + ) R j N j 4 δεν υπάρχουν όµοιες (ίδιες) τιµές τότε το συνάρτηση είναι S είναι η διακύµανση των rks. Αν τώρα ανάµεσα στα j N(N ) S + και η στατιστική Έτσι αν α, H N(N + ) R 3(N + ) o H > X απορρίπτουµε την µηδενική υπόθεση H : σ 0 0