ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Σχετικά έγγραφα
ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Ανάλυση διακύμανσης (Μέρος 3 ο ) 7/4/2017

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Ανάλυση διακύμανσης (Μονοδιάστατη) One-Way ANOVA

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

7. Ανάλυση Διασποράς-ANOVA

9. Παλινδρόμηση και Συσχέτιση

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

Επαναληπτικές Ασκήσεις 26/5/2017

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ONE WAY ANOVA. .Π.Μ.Σ. Μαθηµατικά των Υπολογιστών & των αποφάσεων. Πάτρα, 11 Ιανουαρίου 2011

και τυπική απόκλιση σ = 40mg ανά μπανάνα. α) Ποια είναι η πιθανότητα μια μπανάνα να περιέχει i)

Επίπεδο Τιμές 12

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Y Y ... y nx1. nx1

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

8. Ανάλυση Διασποράς ως προς. δύο παράγοντες

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

8. Ανάλυση Διασποράς ως προς. δύο παράγοντες

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Γ. Πειραματισμός - Βιομετρία

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Γ. Πειραματισμός Βιομετρία

Έλεγχος υποθέσεων ΙI ANOVA

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Μάθημα: Στατιστική ανάλυση δεδομένων με χρήση Η/Υ (του 8 ου Εξαμήνου Σπουδών του Τμήματος Βιοτεχνολογίας) Διδάσκων: Γιώργος Κ.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Απλή Παλινδρόμηση και Συσχέτιση

ΟΡΘΟΓΩΝΙΟΙ ΣΧΕΔΙΑΣΜΟΙ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ & ΕΦΑΡΜΟΓΕΣ ΑΥΤΗΣ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή


Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Ανάλυση Διακύμανσης με ένα Παράγοντα (One Way ANOVA)

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Γ. Πειραματισμός Βιομετρία

Στατιστική Επιχειρήσεων ΙΙ

Στατιστικός έλεγχος υποθέσεων (Μέρος 3 ο ) 10/3/2017

Εξαρτημένα δείγματα (εξαρτημένες μετρήσεις)

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

Είδη Μεταβλητών. κλίµακα µέτρησης

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Εφαρμοσμένη Στατιστική

Σχεδιασμός και Διεξαγωγή Πειραμάτων

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Στατιστική Συμπερασματολογία

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Transcript:

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ (Analyss of Varance for two factor Experments) (Two-Way Analyss of Varance) Ο πειραματικός σχεδιασμός για τον οποίο θα μιλήσουμε είναι μια επέκταση της μεθοδολογίας σύγκρισης των μέσων δύο πληθυσμών όταν τα δείγματα που χρησιμοποιούμε έχουν επιλεγεί κατά ζεύγη Και στις δύο περιπτώσεις οι μέθοδοι που χρησιμοποιούνται αποσκοπούν στο να ελεγχθεί η ανεπιθύμητη διακύμανση των πειραματικών αποτελεσμάτων Με τον πειραματικό αυτό σχεδιασμό αποβλέπουμε στο να συγκρίνουμε διαφορετικές επιδράσεις χωρίζοντας τις μονάδες στις οποίες εφαρμόζονται οι επιδράσεις σε ομάδες που έχουν κοινά χαρακτηριστικά 1 Σχεδιασμός τυχαιοποιημένων πλήρων σχημάτων (Randomzed Complete block Desgn) (RCB) Σύμφωνα με αυτό τον πειραματικό σχεδιασμό έχουμε παρατηρήσεις για κάθε μία από k επιδράσεις (treatments) σε κάθε ένα από b ομογενή στρώματα (μπλοκ) Η ανάλυση στην περίπτωση αυτή παίρνει υπόψη της την παρουσία των μπλοκ και την συνεισφορά τους στη συνολική διασπορά οπότε η διασπορά που θεωρείται ότι προέρχεται από τις επιδράσεις καθορίζεται καλύτερα Πρόβλημα: Η Γραμματεία ενός Τμήματος Στατιστικής ενδιαφέρεται να προμηθευτεί ένα νέο επεξεργαστή κειμένου (word processor) Προκειμένου να επιτευχθεί μια επιτυχής επιλογή σχεδιάζεται ένα τεστ με το οποίο μετριέται ο ρυθμός "εισαγωγής" λέξεων στον υπολογιστή (λέξεις ανά λεπτό) Για τον λόγο αυτό επιλέγονται έξι δακτυλογράφοι και η απόδοση τους (λέξεις ανά λεπτό) καταγράφεται για τους τρεις διαφορετικούς επεξεργαστές Τα αποτελέσματα εμφανίζονται στον πίνακα που ακολουθεί

Ρυθμός Εισαγωγής Στοιχείων Μάρκα Επεξεργαστή Δακτ/φος 1 3 1 3 4 5 6 4 37 53 68 48 36 Αν υποτεθεί ότι ο σχεδιασμός που είχε χρησιμοποιηθεί ήταν ένας πλήρως τυχαιοποιημένος σχεδιασμός (completely randomzed desgn) και υποθέταμε ότι τα στοιχεία του πίνακα προήλθαν από 18 διαφορετικές δακτυλογράφους (αν αγνοούσαμε δηλαδή το γεγονός ότι είχαν χρησιμοποιηθεί έξι δακτυλογράφοι) και υποθέταμε ότι είχαμε έξι παρατηρήσεις για κάθε επεξεργαστή θα καταλήγαμε στο συμπέρασμα ότι δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των επεξεργαστών Ο πίνακας ανάλυσης διακύμανσης του προβλήματος αυτού για τον πλήρως τυχαιοποιημένο σχεδιασμό δίνει τα αποτελέσματα που δίνονται στη συνέχεια Επειδή FF, 15, 095 =368, με τον πλήρως τυχαιοποιημένο σχεδιασμό δεν θα απορρίπταμε την μηδενική υπόθεση ότι υπάρχει ουσιαστική διαφορά μεταξύ των τριών επεξεργαστών Η ανάλυση όμως αυτή δεν μπορεί με κανένα τρόπο να θεωρηθεί σωστή αφού γνωρίζουμε ότι οι δακτυλογράφοι που μετείχαν στο τεστ είναι φυσικό να ενεργούν ως ανομοιογενείς μονάδες Θα πρέπει δηλαδή να λάβουμε υπόψη μας ότι ο ρυθμός εισαγωγής στοιχείων, εκτός από τους τρείς επεξεργαστές, επηρεάζεται και από το συγκεκριμένο άτομο που χρησιμοποιεί τους επεξεργαστές αυτούς Επομένως αρκετή από την συνολική διακύμανση οφείλεται στην παρουσία των "μπλοκ" στον σχεδιασμό 45 36 56 73 45 39 45 40 55 75 47 40

Αιτία Διασποράς Μεταξύ Επιδράσεων Μέσα στις Επιδράσεις (Λάθος) Πίνακας ANOVA SS DF MS F SSTr=711 SSE=5367 k - 1 = N - k = 15 Σύνολο SST=55978 N - 1 = 17 S 0 = 1356 S p = 16884 SSTr k 1 SSE N-k S S 0 008 Σημείωση: Μια απλή μέθοδος για να εξαλείψουμε αυτής της μορφής την διακύμανση είναι αυτή που χρησιμοποιεί τα τυποποιημένα αποτελέσματα του πειράματος (Τα αποτελέσματα αυτά προκύπτουν αν από κάθε παρατήρηση αφαιρέσουμε τον μέσο κάθε "μπλοκ" και διαιρέσουμε με την τυπική απόκλιση στο συγκεκριμένο μπλοκ) Για το πρόβλημά μας πχ έχουμε: Ζ 1 = (4-44)/173 = -116, Ζ =(45-44)/173 =058 Ο αντίστοιχος πίνακας των τυποποιημένων τιμών θα είναι ο πίνακας που ακολουθεί: Τυποποιημένες τιμές για τους τρεις επεξεργαστές κειμένου 1 3 1 3 4 5 6-116 -03-109 -111 087-11 058-080 087 08-109 03 058 11 0 083 0 080 Αν παρατηρήσουμε τον πίνακα των τυποποιημένων τιμών βλέπουμε αμέσως ένδειξη διαφοράς στην απόδοση τους Είναι προφανές ότι ο επεξεργαστής 3, για παράδειγμα, έχει σταθερά καλύτερη απόδοση από τον επεξεργαστή 1 p

Το παράδειγμα αυτό οδηγεί στο συμπέρασμα ότι στην ανάλυση μας θα πρέπει να πάρουμε υπόψη μας και το γεγονός ότι έχουμε χρησιμοποιήσει μπλοκ και να διαμορφώσουμε μια άλλη συμπερασματολογία Ανάλυση Διακύμανσης για το Σχεδιασμό Τυχαιοποιημένων Πλήρων Στρωμάτων (Two-way analyss of varance) (The Analyss of Varance for the Randomzed Complete Block Desgn) Στην ανάλυση μας αυτή ένας παράγοντας (κριτήριο) (factor) είναι η "επίδραση" (treatment) που αντιστοιχεί στις στήλες του σχεδιασμού ενώ ο άλλος παράγοντας (κριτήριο) είναι τα μπλοκ που αντιστοιχούν στις γραμμές του σχεδιασμού Η υπόθεση που θέλουμε να ελέγξουμε είναι η: Η 0 : μ 1 = μ = = μ k Η 1 : Δύο, τουλάχιστον, από τους μέσους διαφέρουν Γενικά, μπορούμε να παρατηρήσουμε ότι ο σχεδιασμός αυτός του πειράματος χρησιμοποιείται όταν οι μονάδες του πειράματος που πρόκειται να υποβληθούν σε κάποια "επίδραση" είναι ανομοιογενείς και θεωρούμε χρήσιμο να τις ομαδοποιήσουμε σε μπλοκ που έχουν παρόμοια χαρακτηριστικά Τέτοιες ομαδοποιήσεις γίνονται συνήθως σε ιατρικά πειράματα όπου ομαδοποιούμε ασθενείς με παρόμοιες ασθένειες, ηλικίες, φύλλο, κλπ ώστε να υποστούν την ίδια θεραπεία και να μελετηθούν Το ίδιο συμβαίνει σε πειράματα όπου ομαδοποιούμε αδέλφια κλπ Η ανάλυση διακύμανσης κατά δύο κριτήρια που θα αναπτύξουμε στη συνέχεια είναι κατάλληλη όταν για το πρόβλημα που εξετάζουμε είναι δυνατόν να υποθέσουμε ότι δεν υφίσταται αλληλεπίδραση (nteracton) μεταξύ των "μπλοκ" και των "επιδράσεων" που χρησιμοποιούνται στο πείραμα

Το μοντέλο Αν Y j είναι η τιμή της εξαρτημένης μεταβλητής όταν η "επίδραση" εφαρμοσθεί στο j "μπλοκ" θα έχουμε Y j = μ + β j + ε j Υποθέτοντας ότι μ = μ + α όπου μ είναι ο μέσος στον πληθυσμό που αντιστοιχεί στην επίδραση και μ ο συνολικός μέσος θα έχουμε Y j = μ + α + β j + ε j μ όπου μ, α είναι το αποτέλεσμα της "επίδρασης" και β j είναι k το αποτέλεσμα της χρησιμοποίησης του j "μπλοκ" (ε j είναι το τυχαίο λάθος) Για τα ε j υποθέτουμε ότι είναι ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν την κατανομή Ν(0,σ ) Σύμφωνα με τις υποθέσεις αυτές η αρχική μας υπόθεση είναι ισοδύναμη με την υπόθεση Η 0 : α 1 = α = = α k = 0 (ότι δηλαδή οι επιδράσεις δεν διαφέρουν) Η 1 : τουλάχιστον δύο από τα α διαφέρουν Επίσης, σε μερικές περιπτώσεις μας ενδιαφέρει να ελέγξουμε την υπόθεση ότι τα μπλοκ που χρησιμοποιήθηκαν δεν διαφέρουν στατιστικά σημαντικά μεταξύ τους Στην περίπτωση αυτή η ισοδύναμη υπόθεση που θα πρέπει να ελέγξουμε είναι η Η 0 : β 1 = β = = β b = 0 Η 1 : τουλάχιστον δύο από τα β διαφέρουν μεταξύ τους Η διαφορά στην ανάλυση που θα ακολουθήσουμε εδώ από εκείνη της ανάλυσης κατά ένα κριτήριο (one-way analyss) είναι ότι ενώ εκεί το SST είχε αναλυθεί σε δύο συνιστώσες (SSE και SSTr) εδώ το SSE χωρίζεται και σε ένα τρίτο παράγοντα ώστε να ληφθεί υπόψη η

διαφορά της διακύμανσης που οφείλεται στη χρησιμοποίηση διαφορετικών μπλοκ Έτσι έχουμε CR desgn: SST = SSTr + SSE CR RCB desgn: SST = SSTr + SSB + SSE RCB Στην περίπτωση αυτή οι αντίστοιχες στατιστικές συναρτήσεις θα δίνονται από τους εξής τύπους: (Y ) (Y) SSTr b (Y Y ) b kb SSB k j (Y ) (Yj Y ) k j j (Y) kb (Y) SST (Y j Y ) Yj kb j SSE = SST - SSTr - SSB Ο αντίστοιχος πίνακας διακύμανσης θα είναι ο εξής j

Αιτία Διασποράς Μεταξύ Επιδράσεων (between treatments) Μπλοκ (block) Πίνακας -WAY-ANOVA Ανάλυση διακύμανσης κατά δύο κριτήρια SS BE MS EMS F (κάτω από την Η 0) SST SSB k - 1 b - 1 SSTr MSTr k 1 SSB b 1 MSB σ σ b α k 1 k β b 1 MST r MSE MSB MSE F F b Tr Μέσα στις Επιδράσεις (Λάθος) (wthn treatments) SSE kb-(k+b-1) =(b-1)(k-1) Σύνολο SST kb-1 SSE (b - 1)(k 1) MSE σ Σημείωση 1: Η ανάλυση αυτή στηρίζεται στο γεγονός ότι SSTr b Ε(MSTr) = E α σ k 1 k 1 SSB k E(MSB) = E β σ b 1 b 1 και Ε (ΜΣΕ) = SSE E = σ (k 1)(b -1) Επομένως, κάτω από τη μηδενική υπόθεση, όχι μόνο το MSE είναι αμερόληπτη εκτιμήτρια του σ αλλά και το MST και MSB

(Y ) Σημείωση : Πολλές φορές το ονομάζεται συντελεστής kb διόρθωσης (correcton factor) (Y) CF kb Σημείωση 3: Και για την ανάλυση αυτή, προκειμένου να είμαστε σε θέση να χρησιμοποιήσουμε την κατανομή F, είναι απαραίτητο να κάνουμε τις ίδιες υποθέσεις που είχαμε κάνει στον πλήρως τυχαιοποιημένο σχεδιασμό Οι υποθέσεις αυτές είναι ότι οι πληθυσμοί από τους οποίους προέρχονται τα δείγματα έχουν κοινή διασπορά σ όπως επίσης και ότι οι αποκλίσεις των παρατηρήσεων είναι ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν την κανονική κατανομή με μέση τιμή 0 και διασπορά σ Επανερχόμενοι στο πρόβλημά μας με τους τρείς επεξεργαστές κειμένου μπορούμε να υπολογίσουμε τις τιμές των στατιστικών συναρτήσεων και τα συγκεκριμένα δεδομένα Έτσι έχουμε y 1 = 84, y = 94, y 3 = 30 y 1 = 4733, y = 49, y 3 = 5033 y 1 = 13, y = 113, y 3 = 164 y 4 = 16, y 5 = 140, y 6 = 115 y j = 4558 k = 3, b = 6 j T y = 880 CF (880) 430 18 SST = 4558-430 = 55978

SSTr = 1 6 (84 + 94 + 30 ) - 430 = 711 SSB = 1 3 (13 +113 +164 +16 +140 +115 )-430 = 50111 SSE = 55978-711 - 50111 = 3156 MSTr = SST 3-1 = 711 MSE = SSE (6-1)(3-1) F tr = 1356 316 MSTr MSE = 1356 3156 = 316 10 = 430 Για α = 005 F, 10, 095 = 4103 Επομένως, απορρίπτουμε την Η 0 Δηλαδή, καταλήγουμε στο συμπέρασμα ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ της αποτελεσματικότητας των τριών επεξεργαστών κειμένου Επίσης έχουμε: MSB = 50111 6-1 = 500 F b = 500 316 = 15830 F 5, 10, 095 = 36 Βλέπουμε, επομένως, ότι υπάρχει και πολύ σημαντική στατιστικά διαφορά στην απόδοση των 6 δακτυλογράφων Ο πίνακας ανάλυσης διασποράς είναι ο εξής

Πίνακας -WAY-ANOVA Ανάλυση διακύμανσης κατά δύο κριτήρια Αιτία Διασποράς SS BE MS F (κάτω από την Η 0) Μεταξύ Επιδράσεων 711 1356 430 Μπλοκ (block) 50111 5 500 15830 Μέσα στις Επιδράσεις 3156 10 (Λάθος) Σύνολο 55978 17 316 Σημείωση: Είναι ενδιαφέρον να παρατηρήσουμε ότι τα συμπεράσματα που καταλήξαμε με την ανάλυση αυτή είναι τελείως διαφορετικά από εκείνα στα οποία θα καταλήγαμε αν είχαμε χρησιμοποιήσει την ανάλυση διακύμανσης κατά ένα παράγοντα (oneway analyss of varance) Μια σύγκριση των δύο αναλύσεων μας δείχνει ότι οι τιμές των SST και SSTr είναι οι ίδιες και στις δύο αναλύσεις Εδώ όμως η τιμή του SSE έχει μειωθεί από 5367 που ήταν στην προηγούμενη ανάλυση σε 3156 και η αντίστοιχη τιμή του MSE έχει ελαττωθεί από 16884 σε 316 Δεδομένου ότι η τελευταία αυτή τιμή είναι ο διαιρέτης στο λόγο F που χρησιμοποιούμε για τον έλεγχο υποθέσεως και δεδομένου ότι ο αριθμητής είναι σταθερός με τιμή 1356 είναι φυσικό ότι ο έλεγχος που εφαρμόζουμε τώρα είναι περισσότερο ευαίσθητος σε διαφορές μεταξύ των επιδράσεων Αυτό φαίνεται και στην τιμή που αντιστοιχεί στη διακύμανση των δεδομένων που οφείλεται στις διαφορές μεταξύ των μπλοκ 3 Αλληλεπιδράσεις σε Πειράματα Δύο Παραγόντων (Interacton n Two-Factor Experment) Ας υποθέσουμε ότι στο πρόβλημα των τριών επεξεργαστών κειμένου αποφασίζουμε να σχεδιάσουμε το πείραμα με τέτοιο τρόπο ώστε για κάθε μια από τις έξη δακτυλογράφους που χρησιμοποιούμε και για κάθε ένα από τους τρείς υπό εξέταση επεξεργαστές κειμένου να έχουμε τρία ανεξάρτητα σύνολα μετρήσεων για τον αριθμό λέξεων ανά λεπτό που επιτυγχάνουν οι δακτυλογράφοι Έστω ότι από τον

σχεδιασμό αυτό του πειράματος πήραμε τα αποτελέσματα που δίνονται στη συνέχεια Ρυθμός Εισαγωγής Στοιχείων Είδος Επεξεργαστή Δακτυλογράφος 1 3 1 4 43 39 45 43 45 45 44 47 3 4 5 6 37 36 36 53 56 54 68 70 65 48 44 47 36 34 37 36 37 34 56 55 58 73 71 76 45 46 45 39 39 37 40 41 4 55 57 55 75 78 75 47 49 47 40 4 38 Τίθεται το ερώτημα αν οι επαναλαμβανόμενες μετρήσεις επηρεάζουν το αποτέλεσμα του πειράματος Είναι προφανές ότι οι επαναληπτικές μετρήσεις δημιουργούν μια πρόσθετη διακύμανση στα δεδομένα Αυτό γιατί οι τρείς διαφορετικές μετρήσεις που παίρνουμε από την κάθε δακτυλογράφο για τον κάθε επεξεργαστή είναι φυσικό να διαφέρουν αφού η κάθε δακτυλογράφος δεν έχει πάντα την ίδια απόδοση

Τυποποιημένες τιμές των Ρυθμών Εισαγωγής Στοιχείων Είδος Επεξεργαστή Δακτυλογράφος 1 3 1-073 -09-04 058-09 058 058 015 145 3 4 5 6-05 -06-06 -16 037-096 -104-056 -175 098-154 035-085 -171 043-06 -05-136 037-09 169 016-03 088-091 -08-091 043 043-043 085 14 161-09 103-09 064 135 064 035 161 035 085 171 000 Μια πρώτη εκτίμηση της επίδρασης που έχει η εισαγωγή των επαναλαμβανομένων μετρήσεων επιτυγχάνεται με την γραφική παράσταση της αθροιστικής εμπειρικής συνάρτησης κατανομής του δείγματος Για να κατασκευάσουμε την αθροιστική εμπειρική συνάρτηση κατανομής του δείγματος τυποποιούμε τις παρατηρήσεις σε κάθε μπλοκ Τα αποτελέσματα δίνονται στον παρακάτω πίνακα Η γραφική παράσταση των αθροιστικών συναρτήσεων καταλοίπων για καθένα από τους επεξεργαστές δίνεται στο σχήμα που ακολουθεί

Γραφική παράσταση των αθροιστικών συναρτήσεων καταλοίπων για καθένα από τους επεξεργαστές Η γραφική παράσταση δίνει μια ένδειξη προφανούς διαφοράς των τριών εμπειρικών συναρτήσεων κατανομών Παρέχει επίσης μιά ένδειξη ότι η διάταξη των μέσων των τριών πληθυσμών είναι μ 1 μ μ 3 Στη συνέχεια θα προσπαθήσουμε να αντιμετωπίσουμε το πρόβλημα με την μέθοδο της ανάλυσης διασποράς 4 Σχεδιασμός Τυχαιοποιημένων Πλήρων Σχημάτων με Αλληλεπιδράσεις (Randomzed Complete Block Desgn wth Interacton) Όπως παρατηρήσαμε ήδη οι επαναληπτικές μετρήσεις δημιουργούν πρόσθετη διακύμανση στα δεδομένα Ο σχεδιασμός όμως με τον τρόπο αυτό είναι καλύτερος Αυτό γιατί δεν χρειάζεται πια να υποθέσουμε ότι η επιρροή των μπλοκ (block effect) είναι η ίδια από επίδραση σε επίδραση (υπόθεση που χρησιμοποιήσαμε στην προηγούμενη ενότητα) Συγκεκριμένα, στην προηγούμενη ενότητα υποθέταμε ότι ο μέσος του Υ j άλλαζε κατά μια ποσότητα α γιατί το Υ j προερχόταν από το μπλοκ j ανεξάρτητα από το ποιά "επίδραση" χρησιμοποιούταν Η μη προσθετικότητα των επιρροών από την χρησιμοποίηση των μπλοκ (nonaddtvty of block effects) εκφράζεται από τον όρο γ j που αναφέρεται στην αλληλεπίδραση (nteracton) (ή,

στην μη προσθετικότητα (non addtvty) μεταξύ της "επίδρασης" και του μπλοκ j), δηλαδή μ Y jm = μ + β j + γ j + ε jm ή, αν μ = k Y jm = μ + α + β j + γ j + ε jm Υποθέτουμε ότι, α) ε jm είναι ανεξάρτητα Ν(0, σ ) β) α 0 β j 0 γ j 0 γ j 0 Με τις επαναληπτικές μετρήσεις είναι δυνατόν να υπολογίσουμε ένα μέσο για κάθε κυψέλη (δηλαδή για κάθε συνδυασμό δακτυλογράφου και επεξεργαστή) Y jm είναι η m παρατήρηση της "επίδρασης" στο j "μπλοκ" (Η m παρατήρηση (m=1,,3) όταν η j δακτυλογράφος (j=1,,,6) χρησιμοποιεί τον (= 1,,3 επεξεργαστή)) Έτσι, γενικά, θα έχουμε j

Επίδραση (Treatment) Μπλοκ 1 K 1 Y 111 Y 11 Y 11 Y 1 Y k11 Y k1 b Y 11n Y 11 Y 1 Y 1n Y 1b1 Y 1b Y 1bn Y 1n Y 1 Y Y n Y b1 Y b Y bn Y k1n Y k1 Y k Y kn Y kb1 Y kb Y kbn Οι σημειακές εκτιμήτριες των παραμέτρων μ, α, β j, γ j είναι, αντίστοιχα μy ˆ αˆ =Y Y βˆ j j =Y Y γ ˆ jj =Yj Y -Yj -Y Οι υποθέσεις που πρέπει να ελεγχθούν είναι οι Η 0 : Όλες οι επιδράσεις είναι ίδιες Η 1 : τουλάχιστον δύο επιδράσεις διαφέρουν Με δεδομένες τις υποθέσεις

α 0 β j 0 γ j 0 γ j 0 η μηδενική υπόθεση είναι ισοδύναμη με το σύνολο των υποθέσεων Η 0(1) : α 1 = α = = α k = 0 H 0() : β 1 = β = = β b = 0 H 0(3) : γ 11 = γ 1 = γ 1 = = γ kb = 0 Τα αντίστοιχα αθροίσματα των τετραγώνων θα είναι: SST Y Y Y (Y ) jm jm kbn jm (Y ) (Y) SSTr nby Y nb kbn jm (Yj) j (Y) SSB nky j Y nk kbn j 1 1 1 SSI n Y - Y Y - Y Y Y Y (Y ) j j j j n nk nb kbn j SSE Y Y Y jm jm Εδώ CF (Y ) kbn j jm jm j j (Y ) Ο αντίστοιχος πίνακας διασποράς δίνεται παρακάτω n j j j

ANOVA (RCB με αλληλεπιδράσεις) Αίτια DF SS MS EMS F Επίδραση (Παράγων Α) k-1 SSTr MSTr Μπλοκ (Παράγων Β) b-1 SSB MSB SSB b 1 MSI Αλληλ/ση (k-1)(b-1) SSI (Interacton) (k 1)(b - 1) MSE Λάθος kb(n-1) SSE SSE (Error) kb(n 1) Σύνολο kbn-1 SST SSTr k 1 nb a MSTr MSE k1 nk b MSB j MSE b 1 n ( ) MSI j j MSE (k 1)(b - 1) Χρησιμοποιώντας τον πίνακα αυτό θα απορρίψουμε των Η 0(1) αν F 1 = MSTr MSE F k-1, kb(n-1), 1-α Eπίσης, θα απορρίψουμε την Η 0() αν F = MSB MSE F b-1, kb(n-1), 1-α και την H 0(3) αν F 3 = MSI MSE F (k-1)(b-1), kb(n-1), 1-α Στο παράδειγμά μας Υ = 64 Y jm = 137418, k=3, b=6, n=3 jm CF = (64) = 19696 6(3)(3) Y 1 = Y 11 + Y 1 + Y 31 = 14 + 133 + 136 = 393 σ

Y = 339, Y 3 = 499, Y 4 = 651, Y 5 = 418, Y 6 = 34 Y 1 = 845, Y = 880, Y 3 = 917 Y 11 = 14, Y 1 = 133, Y 31 = 136 Y 1 = 109, Y = 107, Y 3 = 13 Y 13 = 163, Y 3 = 169, Y 33 = 167 Y 14 = 03, Y 4 = 0, Y 34 = 8 Y 15 = 139, Y 5 = 136, Y 35 = 143 Y 16 = 107, Y 6 = 115, Y 36 = 10 SST = 137418-19630 = 8155704 1 SSTr = 3(6) {845 + 880 + 917 } - CF = 19406333-19696 = 144037 1 SSB = 3(3) {393 + 339 + 499 + 651 + 418 + 34 } - CF = 137095556-19696 = 783359 SSI = 1 3 {14 + 133 + + 10 }-19406333-137095556+ CF = 13734-19406333 - 137095556 + 19696 = 84,407 SSE = 8155704-144037 - 783359-84407 = 94,000 MSTr = 144037 / = 7,019

MSE = 94000 / (6)(3)(3-1) = 611 F = MSTr MSE = 73019 611 = 758 Από τους πίνακες έχουμε F, 36, 095 = 3316 Επομένως η Η 0(1) απορρίπτεται στο α = 005 επίπεδο σημαντικότητας