Ανάλυση Διακύμανσης. Ι. Κ. Δημητρίου

Σχετικά έγγραφα
ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εφαρμοσμένη Στατιστική

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Γ. Πειραματισμός - Βιομετρία

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

7. Ανάλυση Διασποράς-ANOVA

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Ανάλυση διακύμανσης (Μέρος 3 ο ) 7/4/2017

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Χ. Εμμανουηλίδης, 1

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Πολλαπλή παλινδρόμηση (Multivariate regression)

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Εισόδημα Κατανάλωση

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Δοκιμές προτίμησης και αποδοχής

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

Γ. Πειραματισμός Βιομετρία

Έλεγχος υποθέσεων Ι z-test & t-test

ONE WAY ANOVA. .Π.Μ.Σ. Μαθηµατικά των Υπολογιστών & των αποφάσεων. Πάτρα, 11 Ιανουαρίου 2011

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Έλεγχος υποθέσεων ΙI ANOVA

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Ανάλυση διακύμανσης (Μονοδιάστατη) One-Way ANOVA

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Κεφάλαιο 13. Εισαγωγή στην. Η Ανάλυση ιακύµανσης

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ και ΣΥΣΧΕΤΙΣΗ. Μέρος 2

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΠΑΛΑΙΑ ΘΕΜΑΤΑ ******************************************************

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Γ. Πειραματισμός Βιομετρία

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι)

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Απλή Γραμμική Παλινδρόμηση II

Γ. Πειραματισμός Βιομετρία

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Πιθανότητες - Κατανομές ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Εφαρμοσμένη Στατιστική

Περιεχόμενα. Πρόλογος... 15

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Ζήτηµα 2. Κατεύθυνση µεταβολής γονιµότητας. Πειραµατικός Αγρός. Επεµβάσεις: Α1Β1:1, Α1Β2:2, Α1Β3:3, Α2Β1:4, Α2Β2:5 και Α2Β3:6

9. Παλινδρόμηση και Συσχέτιση

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΠΑΛΙΝΔΡΟΜΗΣΗ. Απλή Παλινδρόμηση. (Όγκος πωλήσεων = α +b έξοδα διαφήμησης +e ) Εκτίμηση Απλής Παλινδρόμησης. α= εκτίμηση της τεταγμένης για χ=0

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

Ανάλυση Διακύμανσης με ένα Παράγοντα (One Way ANOVA)

Αναλυτική Στατιστική

Δειγματοληπτικές κατανομές

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

Προσοχή: Για κάθε λανθασµένη απάντηση δεν θα λαµβάνεται υπόψη µία σωστή

8. Ανάλυση Διασποράς ως προς. δύο παράγοντες

χ 2 test ανεξαρτησίας

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Χαρακτηριστικά της ανάλυσης διασποράς. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (One-way analysis of variance)

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ Ή ΔΙΑΚΥΜΑΝΣΗΣ (ANALYSIS OF VARIANCE VARIANCE ANALYSIS ANOVA ANOVA

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Αν έχουμε δύο μεταβλητές Χ και Υ και σύμφωνα με την οικονομική θεωρία η μεταβλητή Χ προσδιορίζει τη συμπεριφορά της Υ το ερώτημα που τίθεται είναι αν

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

Ενδεικτικές ασκήσεις ΔΙΠ 50

Προσαρμογή καμπύλης με τη μέθοδο των ελαχίστων τετραγώνων

Transcript:

Ανάλυση Διακύμανσης Ι. Κ. Δημητρίου

Να κάνετε πολλά παραδείγματα και για να κατανοήσετε την Ανάλυση Διακύμανσης (ΑΝΑΔΙΑ) ή Analysis of Variance (ANOVA). Ακόμη, να κοιτάξετε περιπτώσεις εφαρμογής. 3

Εισαγωγή Η σημαντικότητα της διαφοράς των μέσων δύο διαφορετικών δειγμάτων μπορεί να ελεγχθεί με t- test ή z-test. Τι γίνεται όταν υπάρχουν τέσσερεις ομάδες; Πχ 4 φάρμακα, 4 διαφημιστικά video, 4 δίαιτες, 4 μάρκες αυτοκινήτων κλπ. Η Ανάλυση Διακύμανσης (ΑΝΑΔΙΑ, ANOVA) παρέχει ένα έλεγχο αποδοχής ή απόρριψης της υπόθεσης ότι οι μέσοι των ομάδων είναι ίσοι. 4

Γιατί Όχι t-tests; Αν συγκρίνομε ανά δύο (πχ με ένα t test), έχομε άδικο πλεονέκτημα ως προς τις πιθανότητες. Πχ αν θέσομε 0.05 προ διαδικασίας t για την απόρριψη της αληθούς Η 0 το λάθος θα μπορούσε να περάσει διότι οι δειγματικοί μέσοι μπορεί να είναι απίθανα μακριά, αλλά στην πράξη προέρχονται από το ίδιο πληθυσμό και επομένως έχουν την ίδια μτ. 5

Η συνιστώμενη μέθοδος προσέγγισης όταν εμπλέκονται περισσότερες από δύο ομάδες είναι να χρησιμοποιούμε ΑΝΑΔΙΑ. Αυτή η προσέγγιση ελέγχει αν όλοι οι μέσοι είναι ίσοι ταυτόχρονα, λαμβάνοντας υπόψη την Εντός Ομάδων (Within Groups) μεταβλητικότητα και σε ειδοποιεί αν υπάρχει αξιόπιστη διαφορά οπουδήποτε στο σύνολο των μέσων. (περικλείοντας και πολύπλοκες συγκρίσεις όπως ο μέσος δύο ομάδων συγκρινόμενος με το μέσο δύο άλλων ομάδων). 6

Η λογική της ΑΝΑΔΙΑ Κάθε παρατήρηση σε κάθε ομάδα εκφράζεται μέσω τριών συνιστωσών: Τον μεγάλο μέσο όλων των παρατηρήσεων Το μέσο κάθε ομάδας και πόσο κάθε τέτοιος μέσος διαφέρει από τον μεγάλο μέσο Κάθε παρατήρηση σε κάθε ομάδα και πόσο κάθε παρατήρηση διαφέρει από τον μέσο της ομάδας. 7

Η ΑΝΑΔΙΑ χρησιμοποιεί αυτές τις συνιστώσες για να βρει δύο εκτιμητές της διακύμανσης του πληθυσμού. Έναν που βασίζεται καθ ολοκληρία στη μεταβλητικότητα των παρατηρήσεων εντός κάθε ομάδας. Έναν που βασίζεται καθ ολοκληρία στη μεταβλητικότητα των μέσων ομάδας πέριξ του μεγάλου μέσου 8

Αν αυτοί οι εκτιμητές διαφέρουν κατά πολύ μεταξύ τους, τότε υπάρχει μαρτυρία ότι οι ομάδες προέρχονται από διαφορετικούς πληθυσμούς δηλ. πληθυσμούς με διαφορετικούς μέσους. 9

Έστωσαν k ομάδες Υπόδειγμα: y = μ i + error, error ~ N(0,σ 2 ) όπου μ i είναι η μέση τιμή της i-ομάδας, i=1,2,,k Η 0 : μ 1 = μ 2 = = μ k Η 1 : Όχι όλες οι μ i ίσες 10

Παράδειγμα: Σύγκριση Τιμών Ξενοδοχείων Είναι οι τιμές των ξενοδοχείων της Ν. Υόρκης ακριβότερες από ξενοδοχεία άλλων πόλεων; 11

City Hotel Stars Price LA NEW OTANI 3 119 LA HILTON 3 150 LA BEVERLY PLZA 3 110 LA HOL INN CONV 2 79 LA LE DUFY 2 145 LA BILTMORE 4 140 LA LE PARC 2 165 LA SHERATON GRD 3 175 SF HOL INN FIN 2 99 SF STOUFFER 5 185 SF MANDARIN 4 265 SF DIVA 2 109 SF GRAND HYATT 4 169 SF HOL INN GATE 2 99 SF NOB HILL LAM 2 175 SF INN AT OPERA 3 110 DC LOMBARDY 2 115 DC SHERATON 2 185 DC HILTON 3 166 DC GRAND HYATT 3 189 DC ONE WASH CIR 3 125 DC COMFORT INN 1 64 DC CAPITOL HILL 1 120 DC RAD PRK TERR 3 119 NY EASTGATE 1 170 NY HELMSLEY MID 2 135 NY HOL INN CRWN 2 185 NY THE MARK 3 250 NY PENINSULA 4 250 NY WARWICK 2 170 NY GRAND HYATT 3 210 NY THE REGENCY 4 215 City Hotel Stars Price (1992 Mobil Travel Guide) n = 32 k = 4 12

Υποθέσεις Η 0 : Η 1 : οι μέσες τιμές ίσες για κάθε πόλη όχι ίσες 13

Καθ ομάδες διαχωρισμός τιμών LA SF DC NY 119 99 115 170 150 185 185 135 110 265 166 185 79 109 189 250 145 169 125 250 140 99 64 170 165 175 120 210 175 110 119 215 Φαίνεται ότι η ΝΥ είναι ακριβότερη, αλλά υπάρχει επικάλυψη τιμών. Είναι η ΝΥ σημαντικά ακριβότερη; Απάντηση: Χρήση ANOVA 14

Βήματα στο Excel Tools (ή Δεδομένα) Data analysis Anova: Single factor (Ανάλυση Διακύμανσης κατά ένα παράγοντα) Ok A1:D9 input range, grouped by columns Labels in first row New worksheet Ply Γράψε: Price ANOVA 15

16

Αποτελέσματα 17

Ανάλυση διακύμανσης κατά ένα παράγοντα ΣΥΜΠΕΡΑΣΜΑ Ομάδες Πλήθος Άθροισμα Μέσος όρος Διακύμανση LA 8 1083 135.38 980.84 SF 8 1211 151.38 3414.84 DC 8 1083 135.38 1771.13 NY 8 1585 198.13 1649.55 ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Προέλευση διακύμανσης SS Bαθμοί ελευθερίας MS F τιμή-p κριτήριο F Μεταξύ ομάδων 21145.4 3 7048.5 3.6 0.0255 2.947 Μέσα στις ομάδες 54714.5 28 1954.1 Σύνολο 75859.9 31

Διερμήνευση ΑΝΑΔΙΑ Δηλ. ποιο μέρος της διακύμανσης οφείλεται στην τυχαιότητα και ποιο σε άλλους παράγοντες. Η ΑΝΑΔΙΑ το κάνει διαχωρίζοντας το Total SS (ss αποκλίσεων από το μέσο y) σε δύο μέρη: ένα στις διαφορές μεταξύ των ομάδων (SST, ss απόκλιση από μέσο ομάδας) και ένα στο τυχαίο σφάλμα (SSE). 20

Ανάλυση διακύμανσης κατά ένα παράγοντα ΣΥΜΠΕΡΑΣΜΑ Ομάδες Πλήθος Άθροισμα Μέσος όρος Διακύμανση LA 8 1083 135.38 980.84 SF 8 1211 151.38 3414.84 DC 8 1083 135.38 1771.13 NY 8 1585 198.13 1649.55 ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Προέλευση διακύμανσης SS βαθμοί ελευθερίας MS F τιμή-p κριτήριο F Μεταξύ ομάδων 21145.4 3 7048.5 3.6 0.0255 2.947 Μέσα στις ομάδες 54714.5 28 1954.1 Σύνολο 75859.9 31 4 8 4 2 SSE 2 ( yij yi ) i( i ) i 1 j 1 22 i 1 SSΤ n y y

Total SS = SST + SSE Πως σχετίζεται αυτό με την τιμή διαμονής; Αν οι μτ διαμονής στις διάφορες πόλεις είναι πολύ διαφορετικές, το μεταξύ των ομάδων sst 4 θα είναι μεγάλο. 2 SSΤ n ( y y) Αν οι μτ είναι κοντινές, το μεταξύ των ομάδων sst θα είναι περίπου μηδέν. Πώς εξάγεται αυτό από τον πίνακα; i 1 i i 23

βαθμοί ελευθερίας n = 32 βε: αριθμός ομάδων (πόλεων) = 4 μείον 1 = 3 αριθμός παρατηρήσεων = 32 μείον 1 = 31 υπόλοιποι βε = 31-3 = 28 (αποδίδονται στο σφάλμα) 3 28 31 MS 7048.46 1954.09 = Sum of Squares / df = SST/3 = 21145.4/3 = var (Hotels) = SSE/28 = 54714.5 /28 = var (εντός πόλεων) 24

Οι όροι ως διακυμάνσεις: MS 7048.46 1954.09 7048,46 μετρά τη διακύμανση κόστους ξενοδοχείου μεταξύ των πόλεων 1954,09 μετρά τη διακύμανση κόστους ξενοδοχείου εντός των πόλεων 25

Αν η μεταβλητότητα στις τιμές ξενοδοχείων μεταξύ πόλεων είναι μεγάλη ως προς εντός πόλεων, θα μπορούσαμε να συμπεράνομε ότι η μτ ξενοδοχείων δεν είναι η ίδια για κάθε πόλη. Αυτό ελέγχεται με το F-test 26

Ανάλυση διακύμανσης κατά ένα παράγοντα ΣΥΜΠΕΡΑΣΜΑ Ομάδες Πλήθος ΆθροισμαΜέσος όροςδιακύμανση LA 8 1083 135.375 980.8393 SF 8 1211 151.375 3414.839 DC 8 1083 135.375 1771.125 NY 8 1585 198.125 1649.554 ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ υση διακύμ SS μοί ελευθερ MS F τιμή-p κριτήριο F Μεταξύ ομ 21145.38 3 7048.458 3.60703 0.02549 2.946685 Μέσα στις 54714.5 28 1954.089 Σύνολο 75859.88 31 3,61 ~ F(3,28), p-value = 0,025 < 0,05, απορρίπτομε Η 0, αποδεχόμενοι την Η 1 ότι υπάρχει διαφορά στη μτ ξενοδοχείου. 27

Από τον πίνακα ANOVA μπορούμε να εξάγομε στατιστικά όπως στην παλινδρόμηση: 28

Ανάλυση διακύμανσης κατ ά ένα παράγοντ α ΣΥΜΠΕΡΑΣΜΑ Ομάδες Πλήθος ΆθροισμαΜέσος όροςδιακύμανση LA 8 1083 135,375 980,8393 SF 8 1211 151,375 3414,839 DC 8 1083 135,375 1771,125 NY 8 1585 198,125 1649,554 ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ υση διακύμ SS μοί ελευθερ MS F τ ιμή-p κριτ ήριο F Μετ αξ ύ ομ 21145,38 3 7048,458 3,60703 0,02549 2,946685 Μέσα στ ις 54714,5 28 1954,089 Σύνολο 75859,88 31 Συντελεστής προσδιορισμού: R 2 = 21145 / 75859 = 0,2787 ή 28% της μεταβλητότητας τιμών εξηγείται από την πόλη. 29

Σύγκριση μέσων Μέσων τιμών ξενοδοχείων ανά πόλη Μέσου τετραγωνικού σφάλματος Χρήση boxplot ΠΡΟΣΟΧΗ Οι μέσες τιμές επηρεάζονται από τα έκτοπα σημεία Οι διάμεσες τιμές δεν επηρεάζονται από τα έκτοπα σημεία Αν τα δεδομένα είναι «λοξά, skew», η μτ επηρεάζεται από τις έκτοπες, αλλά όχι η διάμεση κλπ // 30