ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ & ΕΦΑΡΜΟΓΕΣ ΑΥΤΗΣ
|
|
- Κάρμη Λούλης
- 8 χρόνια πριν
- Προβολές:
Transcript
1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ & ΕΦΑΡΜΟΓΕΣ ΑΥΤΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΒΑΣΙΛΙΚΗΣ ΡΗΓΑ ΕΠΙΒΛΕΠΩΝ:Φ. ΑΛΕΒΙΖΟΣ
2 ΠΕΡΙΕΧΟΜΕΝΑ. Εισαγωγή-Βασικές έννοιες σελ. 3. Ανάλυση διασποράς με μία ανεξάρτητη μεταβλητή σελ. 9. Μοντέλα ανάλυσης διασποράς σελ. 9.Περιγραφή του μοντέλου Ι σελ. 0.3 Εκτιμητές παραμέτρων σελ. 3.4 Ανάλυση Διασποράς σελ. 5.5 F-έλεγχος για την ισότητα των μέσων των σελ. 4 διαφορετικών επιπέδων του παράγοντα.6 Ισχύς του F-ελέγχου σελ Ανάλυση των επιδράσεων του παράγοντα σελ Ανάλυση του SSTR στην ANOVA με ένα παράγοντα σελ Εκτιμητές των επιδράσεων του παράγοντα σελ Μέθοδος TUKEY πολλαπλών συγκρίσεων σελ Μέθοδος Scheffe πολλαπλών συγκρίσεων σελ Μέθοδος Bonfeoni πολλαπλών συγκρίσεων σελ Υλοποίηση του μοντέλου ANOVA σελ Σχεδιασμός δειγματικών μεγεθών βάσει της ισχύος σελ Σχεδιασμός δειγματικών μεγεθών βάσει εκτίμησης σελ Σχεδιασμός δειγματικών μεγεθών για εύρεση σελ. 48 του καλύτερου επιπέδου 4.4 Ανάλυση υπολοίπων σελ Μετασχηματισμοί σελ Έλεγχοι για τη σταθεροποίηση των διασπορών σελ Επίδραση λόγω αποκλίσεων από το μοντέλο σελ Θέματα στην ανάλυση διασποράς με μια ανεξάρτητη μεταβλητή σελ Κάποιες εναλλακτικές του F-ελέγχου σελ Μοντέλο ΙΙ ANOVA τυχαίες επιδράσεις σελ Προσέγγιση της ανάλυσης παλινδρόμησης σελ. 70 στην ANOVA με ένα παράγοντα 6. Ανάλυση διασποράς με περισσότερες ανεξάρτητες μεταβλητές σελ Πολυπαραγοντικές μελέτες σελ Ερμηνεία των στοιχείων του μοντέλου σελ Μοντέλο Ι (σταθερών επιδράσεων) για διπαραγοντικές έρευνες σελ Ανάλυση Διασποράς σελ F-έλεγχοι σελ Υλοποίηση της ανάλυσης διασποράς σελ Μηδενική υπόθεση σελ Χρήση του SPSS για τον F-έλεγχο σελ Πολλαπλές συγκρίσεις σελ Μη παραμετρικοί έλεγχοι σελ Παράρτημα σελ Πηγές σελ. 0
3 .ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ Η ανάλυση διασποράς (ANOVA) είναι ένα στατιστικό εργαλείο που έχει ως στόχο την εξαγωγή συμπερασμάτων σχετικά με κάποια χαρακτηριστικά ενός πληθυσμού. Από την ανάλυση των παρατηρήσεων του πληθυσμού ελέγχουμε διάφορες υποθέσεις για ένα ή περισσότερα χαρακτηριστικά ενός πληθυσμού και παίρνουμε αποφάσεις σχετικά με αυτά στηριζόμενοι σε πληροφορίες (δεδομένα) που προέρχονται από ένα ή περισσότερα δείγματα αυτού. Είναι μια αξιόπιστη μέθοδος για τον έλεγχο της σημαντικότητας των διαφορών τριών ή περισσότερων μέσων τιμών από αντίστοιχό αριθμό δειγμάτων, δηλαδή εάν υπάρχουν τελικά διαφορές ανάμεσα στα δείγματα ή εάν όλα τα δείγματα είναι υποσύνολα του ιδίου πληθυσμού..ορολογία Η ανάλυση διασποράς έχει τη δική της ορολογία. Παρουσιάζεται πρώτα διότι είναι απαραίτητο εφόδιο για την καλύτερη αφομοίωση των τεχνικών παραμέτρων που αφορούν στη στατιστική. Οι παρακάτω όροι επεξηγόνται με απλά παραδείγματα της στατιστικής ανάλυσης. Εξαρτημένη μεταβλητή (μεταβλητή απόκρισης) (Υ) Περιγράφει τις μετρήσεις, συνήθως σε συνεχή κλίμακα, της μεταβλητής που μας ενδιαφέρει να μελετήσουμε (π.χ. βάρος: τι προκαλεί διακυμάνσεις στο βάρος;). Εάν αυτές οι μετρήσεις μεταβάλλονται συναρτήσει των ανεξάρτητων μεταβλητών, η στατιστική ανάλυση χρησιμοποιείται για την εξαγωγή κάποιας τυποποιημένης σχέσης μεταξύ τους, μιας συνάρτησης δηλαδή που συνδέει την Υ με τους παράγοντες, ούτως ώστε όταν μας δοθεί μία νέα τιμή της Χ να μπορούμε να βρούμε την αντίστοιχή τιμή της Υ. Ανεξάρτητη μεταβλητή (παράγοντας)(χ) Είναι ο παράγοντας που επιδρά πάνω στην εξαρτημένη μεταβλητή και τα επίπεδα του είναι τα χαρακτηριστικά που ελέγχουμε για να εξάγουμε συμπεράσματα για την Υ. Η υπόθεση του κατά πόσο επιδρά ή όχι η Χ στην Υ ελέγχεται μέσω υπολογισμού αθροίσματος τετράγωνων και εξετάζοντας τη διακύμανση της Υ ανάμεσα στα επίπεδα της Χ. Μια ανεξάρτητη μεταβλητή μπορεί να είναι κατηγορηματική (διακριτή), ή συνεχής. Καλείται ανεξάρτητη με την έννοια ότι μεταβάλλεται ανεξάρτητα από τη μεταβλητή απόκρισης. Συνήθως οι τιμές της Χ είναι ακριβείς, χωρίς σφάλματα, επιτρέποντας μια ακριβή εκτίμηση της επιρροής τους στην Υ. Παρατηρήσεις (μεταβλητές στατιστικού πειράματος, δεδομένα) Είναι οι παρατηρήσεις της μεταβλητής απόκρισης (Υ,Υ,,Υ i,,υ Ν ) μετρημένες σε κάθε επίπεδο της Χ. Αυτά είναι τα δεδομένα, τα 3
4 οποία λαμβάνονται κατά τυχαίο τρόπο έτσι ώστε το μέγεθος του δείγματος να περιλαμβάνει Ν ανεξάρτητες παρατηρήσεις. Δείγμα Η συλλογή των παρατηρήσεων μετρημένες για ένα επίπεδο της Χ (π.χ. το βάρος σώματος μετρήθηκε από ένα δείγμα ανδρών και από ένα άλλο γυναικών για να ελεγχθεί η επίδραση του φύλου στο βάρος). Εάν η Χ είναι συνεχής το δείγμα περιλαμβάνει όλες τις μετρήσεις της Υ στη Χ (π.χ. βάρος πάνω στο ύψος). Άθροισμα τετραγώνων Το τετράγωνο της απόστασης μεταξύ κάθε τιμής Υ i και του δειγματικού μέσου, αθροισμένο για όλα τα Ν δεδομένα. Οι τετραγωνικές αποκλίσεις μετρούν διασπορά σε μια μορφή που μπορεί να διαιρεθεί σε διαφορετικές συνιστώσες που αθροίζονται για να δώσουν τη συνολική απόκλιση (π.χ. η συνιστώσα της απόκλισης ανάμεσα στα δείγματα και αυτή της απόκλισης εντός των δειγμάτων). Διακύμανση (σ ) Η διακύμανση σε ένα πληθυσμό κανονικής κατανομής περιγράφεται από το μέσο των Ν τετραγωνικών αποκλίσεων από τον αριθμητικό μέσο. Η διακύμανση συνήθως αναφέρεται σε ένα δείγμα, ωστόσο, σε αυτή την περίπτωση υπολογίζεται ως το άθροισμα των τετραγώνων διαιρεμένο από Ν- αντί για Ν. Η θετική της ρίζα είναι η τυπική απόκλιση, σ, που περιγράφει τη διασπορά σε μεταβλητές κανονικών κατανομών (π.χ. το 95% κυμαίνεται εντός του,96 της τυπικής απόκλισης του αριθμητικού μέσου όταν το Ν είναι μεγάλο). Στατιστικό μοντέλο ( Υ = Χ + ε) Μια δήλωση της σχέσης μεταξύ της μεταβλητής απόκρισης και της ανεξάρτητης μεταβλητής. Ένα απλό μοντέλο θα μπορούσε να είναι: Βάρος= Φύλο +ε. Το = σημαίνει μια στατιστική εξάρτηση. Η ανάλυση διασποράς θα εξετάσει κατά πόσο πιο σημαντικός είναι ο παράγοντας φύλο στη διακύμανση του βάρους ή ο όρος σφάλματος ε (δηλαδή εάν το φύλλο επιδρά στη μεταβολή του βάρους ή όχι). Ο όρος σφάλματος συνήθως παραλείπεται από τη περιγραφή του μοντέλου. Βρίσκεται όμως στη δομή του μοντέλου, ως η τυχαία διακύμανση ως προς την οποία συγκρίνεται η διακύμανση ανάμεσα στα επίπεδα της Χ στον έλεγχο (η F-αναλογία/ F-atio) που εφαρμόζουμε για την αποδοχή ή όχι της μηδενικής απόφασης. Μηδενική υπόθεση, Η 0 Ενώ ένα στατιστικό μοντέλο μπορεί να προτείνει μια υπόθεση, ότι η Υ εξαρτάται από τη Χ, η στατιστική ανάλυση επιχειρεί να απορρίψει τη 4
5 μηδενική υπόθεση: ότι η Υ δεν αλλάζει με τη Χ. Αυτό συμβαίνει διότι είναι ευκολότερο να ανακαλύπτει κανείς πόσο διαφορετικά είναι τα πράγματα παρά να ξέρει πόσο πολύ μοιάζουν, οπότε ο ευκολότερος αντικειμενικός στόχος των στατιστικών είναι να καθορίσουν την πιθανότητα απόκλισης εκτός της τυχαίας πρόβλεψης παρά ανάμεσα σε οποιαδήποτε άλλη εναλλακτική. Συνεπώς η επιστήμη γενικά προχωρεί προσεκτικά με μια διαδικασία απόρριψης. Εάν η ανάλυση καταλήξει σε μια ικανοποιητικά μικρή πιθανότητα να είναι σωστή η μηδενική υπόθεση, τότε μπορεί να απορριφθεί και να δηλώσουμε ότι η Υ προφανώς εξαρτάται από τη Χ σε κάποιο βαθμό. Σφάλμα, υπόλοιπο Το ποσό, με το οποίο μια παρατηρήσιμη μεταβλητή διαφέρει από την προβλεπόμενη τιμή του μοντέλου. Τα σφάλματα ή υπόλοιπα είναι τα τμήματα των υπολογισμών που δεν λογαριάζονται από την ανάλυση. Στην ανάλυση διασποράς, τα υπόλοιπα συνήθως υποθέτουμε ότι είναι ανεξάρτητα το ένα από το άλλο, και κανονικά κατανεμημένα γύρω από τους δειγματικούς μέσους. Επίσης υποθέτονται ότι είναι πανομοιότυπα κατανεμημένα για κάθε δείγμα (αφού η ανάλυση αναζητά μόνο μια σημαντική αλλαγή ανάμεσα στους δειγματικούς μέσους ) που είναι γνωστή ως η υπόθεση ομοιογένειας των διακυμάνσεων. Κανονική κατανομή Η κανονική κατανομή είναι κατανομή συχνότητας πιθανότητας μιας συνεχούς μεταβλητής σχήματος καμπάνα. Ο τύπος της κανονικής κατανομής περιέχει δύο παραμέτρους: το μέσο μ, ως μέτρο θέσης, και τη τυπική απόκλιση σ. Η συνάρτηση πυκνότητας πιθανότητας για την κανονική μεταβλητή Y είναι: Y μ σ f ( Y) = e - < Y <+ (.) πσ Η ανάλυση διασποράς ή εν συντομία ANOVA (analysis of vaiance=ανάλυση διασποράς) έχει ως προϋπόθεση οι παράμετροι που παρεμβάλλονται στο μοντέλο της να ακολουθούν την κανονική κατανομή. Όταν κάνουμε δειγματοληψία σε ένα κανονικό πληθυσμό ισχύει το παρακάτω για τη δειγματική διασπορά s : n ( ) Yi Y i= s = n (.) 5
6 ( n ) s η (.3) σ ακολουθεί την κατανομή χ με n- βαθμούς ελευθερίας όταν το τυχαίο δείγμα είναι από ένα κανονικό πληθυσμό. Το διάστημα εμπιστοσύνης για τη πληθυσμιακή διασπορά σ με συντελεστή εμπιστοσύνης -α προκύπτει μέσω την (.3): ( n ) s ( n ) s σ (.4) χ a/ ; n χ a/ ; n ( ) ( ) Τυπική κανονική κατανομή Μια μεταβλητή z ακολουθεί τυπική κανονική κατανομή εάν Y μ z = (.5) σ όπου η Υ ακολουθεί κανονική κατανομή. Συμβολίζουμε η z~n(0, ). Συναρτήσεις των ανεξάρτητων κανονικών τυχαίων μεταβλητών Έστω ότι οι Y, K, Yn είναι ανεξάρτητες μεταβλητές που ακολουθούν κανονική κατανομή. Τότε ισχύει το εξής : (.6) Όταν οι Y, K, Yn είναι ανεξάρτητες κανονικές τυχαίες μεταβλητές, ο γραμμικός συνδυασμός τους ay + ay + K + ay n nακολουθεί n κανονική κατανομή με μέσο ae i ( Yi) και διακύμανση n aiσ ( Yi). i= Κατανομή Χ Έστω z, z,, z v ν ανεξάρτητες τυπικές κανονικές μεταβλητές. Τότε ορίζουμε ως : χ ( v) = z + z + K + zv (.7) η κατανομή Χ έχει μια παράμετρο την ν, που είναι οι βαθμοί ελευθερίας της. Ο μέσος της Χ με ν βαθμούς ελευθερίας είναι : E χ ( v) = v (.8) χ α ;v ως εξής: Ορίζουμε τη ( ) i= { χ ( ) χ ( α )} P v ; v = a (.9) Κατανομή t Έστω z και χ (ν) ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν την τυπική κανονική και την χ κατανομή αντίστοιχα. Τότε ορίζουμε : 6
7 z t( v) = (.0) χ ( v) v Η κατανομή t έχει μια παράμετρο, τους βαθμούς ελευθερίας ν. Ο μέσος της κατανομής t με ν βαθμούς ελευθερίας είναι: E t( v ) = 0 (.) t α; v ως εξής: Ορίζουμε τη ( ) { ( ) ( α )} Ptv t ; v = a (.) Βαθμοί ελευθερίας Βαθμοί ελευθερίας αναφέρονται σε ένα πλήθος ν γενικά μεταβλητών. Αν είναι ανεξάρτητες μεταξύ τους, δηλαδή αν δεν υπάρχει κάποια σχέση που να τις συνδέει (δεσμεύει) τότε έχουν ν βαθμούς ελευθερίας. Στην περίπτωση όμως που υπόκεινται σε ρ περιορισμούς (ρ<ν) τότε οι βαθμοί ελευθερίας των μεταβλητών είναι ν-ρ. Ο F-έλεγχος στην ανάλυση διασποράς έχει δυο βαθμούς ελευθερίας, ο πρώτος αντιστοιχεί σε έναν λιγότερο από τα α επίπεδα της ανεξάρτητης μεταβλητής Χ (α-), και ο δεύτερος αντιστοιχεί στους βαθμούς ελευθερίας των σφαλμάτων (Ν-α). F-έλεγχος Η στατιστική εκτίμηση υπολογιζόμενη από την ανάλυση διασποράς, η οποία δείχνει την σημαντικότητα της υπόθεσης ότι η Υ MS[ X] εξαρτάται από την Χ. Είναι το πηλίκο δύο μέσων τετραγώνων : MS [ ε ]. Ο μέσος τετραγώνων MS είναι ο μέσος όρος του αθροίσματος τετραγώνων, δηλαδή το άθροισμά των τετραγωνικών αποκλίσεων από το μέσο Χ ή σφάλμα ε διαιρεμένο από τον αντίστοιχο βαθμό ελευθερίας. Γι αυτό ο F-έλεγχος έχει δύο βαθμούς ελευθερίας, ο ένας αντιστοιχεί στον αριθμητή MS[X], και ο άλλος στον παρανομαστή MS[ε]. Ο F-έλεγχος μας πληροφορεί κατά πόσο η διακύμανση στη Υ εξηγείται από τη Χ (MS[X]). Μια μεγάλη αναλογία υποδεικνύει μια σημαντική επίδραση μέσω της Χ. Ο παρατηρούμενος F-έλεγχος συνδέεται με μια πολύ περίπλοκη εξίσωση για την ακριβή πιθανότητα της αληθούς μηδενικής υπόθεσης (όταν ο λόγος ισούται με μονάδα), αλλά μπορεί κανείς να χρησιμοποιεί τους πίνακες Α. στο παράρτημα για να βρει κατά πόσο ο παρατηρούμενος F-έλεγχος υποδεικνύει μια σημαντική συνάφεια. Επίπεδο Σημαντικότητας Είναι η μέγιστη πιθανότητα λανθασμένης απόρριψης μιας μηδενικής υπόθεσης που είναι πράγματι σωστή. Γενικά μια κρίσιμη 7
8 σταθερά Ρ=0,05 λαμβάνεται ως σημείο ενός ικανοποιητικού επιπέδου σημαντικότητας. Μια μεγάλη τιμή του F-ελέγχου υποδεικνύει μια μικρή πιθανότητα η μηδενική υπόθεση να είναι αληθής. Εάν π.χ. πάρουμε για ένα έλεγχο επίπεδο σημαντικότητας ίσο με 0.05 ή 5% και απορρίψουμε την υπόθεση, τότε σε 00 όμοιες περιπτώσεις μόνο σε 5 είναι δυνατόν να σφάλουμε δηλαδή να είναι αληθής η υπόθεση, ενώ την απορρίψαμε, (είμαστε 95% βέβαιοι ότι πήραμε τη σωστή απόφαση). 8
9 .Ανάλυση διασποράς με μια ανεξάρτητη μεταβλητή Η ANOVA ης τάξης είναι μια μέθοδος στατιστικής ανάλυσης που εκτελεί μια σύγκριση των μέσων στα διαφορετικά επίπεδα των πειραματικών δεδομένων μιας αρχικά δοσμένης μεταβλητής. Το αντικείμενο αυτής της σύγκρισης είναι ο καθορισμός της αναλογίας της διακύμανσης των δεδομένων που οφείλονται στα διαφορετικά επίπεδα της Χ σε αντίθεση με τη διακύμανση λόγω τυχαίου σφάλματος, δηλαδή κατά πόσο πιο μεγάλος είναι ο λόγος της διακύμανσης λόγω διαφορετικών επιπέδων προς τη διακύμανση λόγω σφάλματος. Το μοντέλο διαπραγματεύεται συγκεκριμένες τιμές της Χ και περικλείει έλεγχο της μηδενικής υπόθεσης Η 0 :μ =μ = =μ όπου τα μ i αντιπροσωπεύουν τα μέσα του κάθε επιπέδου της Χ. Βασικά, η απόρριψη της μηδενικής υπόθεσης δείχνει ότι η διακύμανση στο αποτέλεσμα οφείλεται στη διακύμανση μεταξύ των επιπέδων και όχι στο τυχαίο σφάλμα. Εάν απορριφθεί η μηδενική υπόθεση, υπάρχει μια διαφορά στο αποτέλεσμα των διαφόρων επιπέδων με σημαντικότητα α και απομένει να καθοριστεί μεταξύ ποιών επιπέδων βρίσκονται οι πραγματικές διαφορές.. Μοντέλα ανάλυσης διασποράς Θα μελετήσουμε δύο εναλλακτικά μοντέλα ανάλυσης διασποράς. Το μοντέλο που θα ασχοληθούμε σε αυτό το κεφάλαιο,το μοντέλο σταθερών επιδράσεων, εφαρμόζεται σε περιπτώσεις όπου τα αποτελέσματα αναφέρονται μόνο σε εκείνες τις ανεξάρτητες μεταβλητές που συμπεριλήφθηκάν στην έρευνα και ονομάζεται μοντέλο Ι. Το δεύτερο μοντέλο που θα ασχοληθούμε στο 5 ο κεφάλαιο, το μοντέλο τυχαίων επιδράσεων, εφαρμόζεται σε περιπτώσεις όπου τα αποτελέσματα από τα δεδομένα στην έρευνα επεκτείνονται σε ένα πληθυσμό ανεξάρτητων μεταβλητών υπερσύνολο του δείγματος δηλαδή γίνεται γενίκευση των αποτελεσμάτων της έρευνας και το μοντέλο καλείται μοντέλο ΙΙ. Βασικές Ιδέες Τα βασικά στοιχεία του μοντέλου Ι της ανάλυσης διασποράς για τη μελέτη μιας ανεξάρτητης μεταβλητής είναι σχετικά απλές. Αντίστοιχα σε κάθε επίπεδο της Χ, υπάρχει μια κατανομή πιθανοτήτων των απαντήσεων. Το μοντέλο Ι ανάλυσης διασποράς υποθέτει ότι :. κάθε μια εκ των κατανομών πιθανοτήτων είναι κανονική. κάθε κατανομή πιθανοτήτων έχει την ίδια διακύμανση 3. οι παρατηρήσεις κάθε τιμής που παίρνει η Χ είναι τυχαίες παρατηρήσεις και είναι ανεξάρτητες των παρατηρήσεων των υπολοίπων 9
10 Οι κατανομές πιθανοτήτων διαφέρουν μόνο ως προς τους μέσους τους. Οι διαφορές στους μέσους δείχνουν την ουσιαστική επίδραση των επιπέδων της Χ, και γι αυτό το λόγο η ανάλυση διασποράς επικεντρώνεται στις αποκλίσεις των μέσων για τα διάφορα επίπεδα της Χ. Η ανάλυση των δεδομένων καθεμίας από τις κατανομές πιθανοτήτων καθενός εκ των επιπέδων της Χ συνήθως προχωρά σε δύο βήματα :. καθορισμός εάν ή όχι τα μέσα των επιπέδων της Χ είναι ίδια. εάν τα μέσα των επιπέδων της Χ δεν είναι ίδια, εξετάστε πόσο διαφέρουν καθώς και τη σημασία των διαφορών τους..περιγραφή του μοντέλου Ι Υπάρχουν επίπεδα της μεταβλητής υπό μελέτη (Χ) και θα δηλώνουμε κάθε ένα από αυτά με το δείκτη ( =,, ). Ο αριθμός των παρατηρήσεων για το -ιοστό επίπεδο της Χ θα δηλώνεται με n και το σύνολο των παρατηρήσεων στην έρευνα δηλώνεται με n T, όπου : n T = n (.) Θα χρησιμοποιούμε το δείκτη i για να αναπαριστούμε οποιαδήποτε παρατήρηση του -ιοστού επιπέδου της Χ. Δηλαδή i=,,n. Η i παρατήρηση για το επίπεδο της μεταβλητής αναπαρίσταται με Υ i. Το μοντέλο δηλώνεται ως εξής : Yi = μ + ε i (.) όπου : Υ i είναι η τιμή της μεταβλητής απόκρισης της i-οστης δοκιμής για το -ιοστό επίπεδο του παράγοντα μ είναι οι παράμετροι ε i είναι τα σφάλματα, ανεξάρτητες μεταβλητές ~Ν(0,σ ) i=,,n ; =,, Σημαντικά χαρακτηριστικά του μοντέλου. Η παρατηρούμενη τιμή της Υ της i-οστης δοκιμής για το -ιοστό επίπεδο του παράγοντα είναι το άθροισμα από δύο συνιστωσών : ()ο σταθερός όρος μ και () ο όρος τυχαίου σφάλματος ε i. Αφού Ε(ε i )=0 προκύπτει ότι: EY ( i ) = = μ (.3) Επομένως όλες οι παρατηρήσεις για το -ιοστό επίπεδο του παράγοντα έχουν την ίδια μαθηματική ελπίδα μ 3. Αφού ο όρος μ είναι σταθερός προκύπτει ότι: σ ( Y i ) = σ ( ε i ) = σ (.4) Επομένως όλες οι παρατηρήσεις έχουν την ίδια διακύμανση, ανεξαρτήτως παράγοντα. 0
11 4. Αφού κάθε ε i είναι κανονικά κατανεμημένο, έτσι είναι και κάθε Υ i ως μια γραμμική συνάρτηση της ε i. 5. Οι όροι σφάλματος θεωρούνται ανεξάρτητοι. Αφού τα ε i είναι ανεξάρτητα, είναι και οι παρατηρήσεις Υ i. Οι Υ i είναι ανεξάρτητες με κατανομή Ν(μ i,σ ) (.5) 6. Εν όψει αυτών των χαρακτηριστικών, το μοντέλο (.) μπορεί να ξαναδιατυπωθεί ως εξής : Εναλλακτική διατύπωση του μοντέλου Ι Σε έρευνες με ένα παράγοντα, η παραμετροποίηση του μοντέλου Ι (.) είναι κατάλληλη. Σε πειράματα με πολλούς παράγοντες, ωστόσο, μια διαφορετική μορφή παραμετροποίησης είναι πιο χρήσιμη. Η εναλλακτική μορφή του μοντέλου Ι είναι : Yi = μ. + τ + εi (.6) όπου: μ.:είναι μια σταθερή συνιστώσα κοινή σε όλες τις παρατηρήσεις τ :είναι η επίδραση του -ιοστού επίπεδου του παράγοντα (σταθερά για κάθε επίπεδο του παράγοντα) ε i είναι ανεξάρτητες Ν(0,σ ) i=,,n ; =,, Συγκρίνοντας τις (.) και (.6) η μόνη διαφορά τους βρίσκεται στο ότι στην (.6) η απόκριση του μέσου μ της (.) έχει διασπαστεί σε δύο μέρη : μ = μ. + τ (.7) Επομένως ο τ ορίζεται ως εξής : τ = μ μ. (.8) Καθορισμός του μ. Η διάσπαση του μέσου μ σε δύο μέρη, τον ολικό μέσο μ. και την ειδική επίδραση της στάθμης του παράγοντα, τ, μπορεί να γίνει με πολλούς τρόπους. Για παράδειγμα, η μ. συχνά ορίζεταί ως ο μη σταθμισμένος μέσος όλων των μέσων μ : μ = μ. = (.9) Αυτός ο ορισμός υποδηλώνει ότι : τ = 0 (.0) επειδή λόγω της (.8) : = τ = ( μ μ.) = μ μ. = = =
12 και από την (.9) : = μ = μ. Συνεπώς, ο ορισμός του γενικής σταθεράς μ. στη (.9) υποδηλώνει ένα περιορισμό στα τ, που σε αυτή την περίπτωση πρέπει το άθροισμα τους να ισούται με μηδέν. Εναλλακτικός ορισμός του μ. Η σταθερά μ. μπορεί να οριστεί ως ο σταθμισμένος μέσος των μέσων μ : μ. = w μ (.) = όπου τα w είναι βάρη έτσι ώστε w =. Ο περιορισμός για τα τ τότε είναι : wτ = 0 (.) = n Συχνά, τα χρησιμοποιούμενα βάρη είναι τα σχετικά μεγέθη nt του δείγματος αφού με αυτά τα βάρη προκύπτουν απλοποιήσεις στους υπολογισμούς. Σε αυτή την περίπτωση, η γενική σταθερά μ. είναι : n μ = μ. = (.3) nt και ο περιορισμός για τα τ είναι : n τ = 0 (.4) = Όταν τα δειγματικά μεγέθη για όλα τα επίπεδα είναι ίδια δεν έχει σημασία αν ο γενικός μέσος μ. είναι σταθμισμένος ή μη καθώς το αποτέλεσμα είναι το ίδιο. Η επιλογή του ορισμού του μ. εξαρτάται από τη σημαντικότητα των μέτρων των τ. Ωστόσο θα χρησιμοποιούμε, εκτός και αν σημειώνεται αλλιώς, τον ορισμό του μ. όπως δίνεται στην (.3). Σημείωση Όπως διατυπώθηκε παραπάνω, συνήθως ενδιαφερόμαστε αρχικά για το εάν οι μέσοι μ είναι ίσοι. Με την πρώτη παραμετροποίηση του μοντέλου (.) οι δύο υποθέσεις είναι : Η 0 :μ =μ = =μ Η : όχι όλα τα μ ίσα (.5) Στην περίπτωση δε του μοντέλου (.6) οι αντίστοιχες υποθέσεις είναι : Η 0 :τ =τ = =τ =0 Η : όχι όλα τα τ ίσα με μηδέν (.6)
13 .3 Εκτιμητές παραμέτρων Οι παράμετροι του μοντέλου της ανάλυσης διασποράς είναι συνήθως άγνωστες και πρέπει να εκτιμηθούν από τα δειγματικά δεδομένα. Χρησιμοποιούμε τη μέθοδο ελαχίστων τετραγώνων για να ορίσουμε τους εκτιμητές για τις παραμέτρους του μοντέλου. Όροι αθροίσματος του μοντέλου Η Υ i όπως εξηγήθηκε παραπάνω, αναπαριστά τη παρατήρηση της i-οστης μονάδας για το -ιοστό επίπεδο του παράγοντα. Το σύνολο των παρατηρήσεων για το επίπεδο του παράγοντα δηλώνεται Υ. : Y. n = Y (.7) i= i Έτσι, η τελεία στο Υ. υποδεικνύει ένα άθροισμα πάνω στο δείκτη i. Ο δειγματικός μέσος για το επίπεδο του παράγοντα δηλώνεται Y. : n T Yi Y i=. Y. = = (.8) n n Επομένως η τελεία στο δείκτη υποδεικνύει ότι ο μέσος όρος έγινε πάνω στο i. Το σύνολο όλων των παρατηρήσεων στην έρευνα δηλώνεται Y.. : Y.. n T = Y (.9) = i= όπου οι δύο τελείες δηλώνουν άθροισμα και ως προς τους δύο δείκτες i και. Τέλος, ο μέσος για όλες τις παρατηρήσεις δηλώνεται Y..: n T Yi = i= Y.. Y.. = = (.0) nt nt Οι τελείες υποδηλώνουν ότι ο μέσος όρος έγινε και στους δύο δείκτες i και. Εκτιμητές Ελαχίστων Τετραγώνων Μοντέλο(.). Σύμφωνα με το κριτήριο ελαχίστων τετραγώνων, το άθροισμα των τετραγωνικών αποκλίσεων των παρατηρήσεων γύρω από τις αναμενόμενες τιμές πρέπει να ελαχιστοποιηθεί ως προς τις παραμέτρους. Για το μοντέλο (.) έχουμε από την (.3) ότι: EY ( i ) = μ Επομένως, η ποσότητα που πρέπει να ελαχιστοποιηθεί είναι: i 3
14 n T ( i ) (.) = i= Q= Y μ Τώρα η (.) μπορεί να γραφεί ως εξής: nt nt nt ( i μ) ( i μ) ( i μ) i= i= i= Q= Y + Y + + Y L (. α ) Σημειώνουμε ότι κάθε μια από τις παραμέτρους μ =, K, εμφανίζεται σε μόνο μια συνιστώσα του αθροίσματος στη (. α ). Γι αυτό το λόγο το Q μπορεί να ελαχιστοποιηθεί, ελαχιστοποιώντας κάθε μια από τις συνιστώσες αυτές. Είναι γνωστό ότι ο δειγματικός μέσος ελαχιστοποιεί ένα άθροισμα τετραγωνικών αποκλίσεων. Οπότε ο εκτιμητής ελαχίστων τετραγώνων του μ που δηλώνεται μ είναι: μ = Y. (.) Μοντέλο (.6). Με το μοντέλο εναλλακτικής παραμετροποίησης (.6) η ποσότητα Q που πρέπει να ελαχιστοποιηθεί ως προς τις παραμέτρους είναι : n T Q= ( Yi μ. τ ) (.3) Εάν κοινός μέσος μ. οριστεί ως : = i= n μ = μ. = (.4) nt έτσι ώστε ο περιορισμός για τα τ να είναι : n τ = 0 (.5) = ο εκτιμητής ελαχίστων τετραγώνων για το μ. που δηλώνεται με μ. είναι : μ. = Y.. (.6) και ο εκτιμητής ελαχίστων τετραγώνων για το τ που δηλώνεται με $ τ είναι : $ τ = Y. Y.. (.7) Σχόλια. Οι δοσμένοι εκτιμητές ελαχίστων τετραγώνων είναι επίσης εκτιμητές μέγιστης πιθανοφάνειας για τα μοντέλα κανονικών σφαλμάτων (.) και (.6) αντίστοιχα. Γι αυτό το λόγο έχουν όλες τις επιθυμητές ιδιότητες σχετικά με τους εκτιμητές παλινδρόμησης. Για παράδειγμα είναι αμερόληπτοι εκτιμητές ελάχιστης διασποράς. 4
15 . Για να εξάγουμε τον εκτιμητή ελαχίστων τετραγώνων του μ, χρειάζεται να ελαχιστοποιήσουμε, ως προς μ την συνιστώσα του αθροίσματος τετραγώνων της (. α ) : n = ( i ) (.8) i= Q Y μ Παραγωγίζοντας ως προς μ,λαμβάνουμε : n dq = ( Yi μ ) (.9) dμ i= Θέτοντας την (.9) ίση με μηδέν βρίσκουμε το αποτέλεσμα στην (.): n i= ( Yi μ ) = 0 n i= Y i μ = Y = n μ Υπόλοιπα Τα υπόλοιπα είναι πολύ χρήσιμα όσον αφορά στην εξέταση της ικανότητας ενός μοντέλου ανάλυσης διασποράς σε μια δοσμένη εφαρμογή. Το υπόλοιπο e i ορίζεται ως εξής :. e Y Y Y i = i μ = i. (.30) Συνεπώς, ένα υπόλοιπο αντιπροσωπεύει την διακύμανση μιας παρατήρησης από τον αντίστοιχο δειγματικό μέσο του επιπέδου του παράγοντα. Αυτός ο ορισμός του υπολοίπου ισχύει επίσης και στη περίπτωση του μοντέλου (.6) αφού : μ + $ τ = Y.. + ( Y. Y.. ) = Y. (.3) Τα υπόλοιπα του μοντέλου ανάλυσης διασποράς (.6) υπόκεινται στους ακόλουθους περιορισμούς : n ei = 0 για =,, (.3) i= Η χρήση των υπολοίπων στην εξέταση της ικανότητας ενός μοντέλου ανάλυσης διασποράς αναλύεται στο 4 ο κεφάλαιο..4 Ανάλυση Διασποράς Όπως η ανάλυση διασποράς για ένα μοντέλο παλινδρόμησης αναλύει το συνολικό άθροισμα τετραγώνων στο άθροισμα τετραγώνων της παλινδρόμησης και στο άθροισμα τετραγώνων των υπολοίπων, έτσι και στο μοντέλο (.) της ανάλυσης διασποράς υπάρχει ένας ανάλογος διαχωρισμός. 5
16 Διαχωρισμός του SSTO Η συνολική διακύμανση των Υ, χωρίς να χρησιμοποιείται καμία πληροφορία για τα επίπεδα του παράγοντα, μετράται σε σχέση με τις αποκλίσεις των παρατηρήσεων Υ i γύρω από τον γενικό μέσο Y..: Yi Y.. (.33) Το τυπικό μέτρο της ολικής μεταβλητότητας είναι το άθροισμα τετραγώνων αυτών των αποκλίσεων, που δηλώνεται ως SSTO ( Total Sum of Squaes=συνολικό άθροισμα τετραγώνων ) : n J= i= ( ) i.. SSTO = Y Y (.34) Όταν χρησιμοποιούνται πληροφορίες για τα επίπεδα του παράγοντα, οι αποκλίσεις που απεικονίζουν την εναπομένουσα αβεβαιότητα στα δεδομένα είναι εκείνες κάθε παρατήρησης Υ i γύρω από τον αντίστοιχο μέσο Y. : Yi Y. (.35) Οι διαφορές μεταξύ των αποκλίσεων (.33) και (.35) αντανακλούν την διαφορά ανάμεσα στον μέσο του επιπέδου του παράγοντα και του γενικού μέσου: ( Y Y.. ) ( Y Y. ) = Y. Y.. (.36) i Τώρα μπορούμε να αναλύσουμε την ολική απόκλιση Yi Y.. σε δυο συνιστώσες: Y Y.. = ( Y Y.. ) + ( Y Y. ) (.37) i n n ( Yi Y.. ) = n ( Y. Y.. ) + ( Yi Y. ) = i= = = i=. ολική Απόκλιση του μέσου Απόκλιση γύρω απόκλιση του επιπέδου του από το μέσο ενός παράγοντα γύρω από επιπέδου του τον γενικό μέσο παράγοντα Επομένως, η ολική απόκλιση Yi Y.. μπορεί να θεωρηθεί το άθροισμα δυο συνιστωσών :. Η απόκλιση του μέσου του επιπέδου του παράγοντα γύρω από το γενικό μέσο.. Η απόκλιση του Υ i γύρω από το μέσο του επιπέδου του παράγοντα. Όταν υψώσουμε στο τετράγωνο την (.37) και μετά αθροίσουμε, προκύπτει : (.38) Ο όρος στο αριστερό μέλος είναι το SSTO όπως ορίζεται στη (.34). Ο ος όρος του δεξιού μέλους που δηλώνεται SSTR και συμβολίζει το i i 6
17 άθροισμα τετραγώνων των επιπέδων του παράγοντα = teatment sum of squaes είναι: SSTR = n ( Y. Y..) (.39α) = Ο ος όρος δηλώνεται SSE και συμβολίζει το άθροισμα τετράγωνων των σφαλμάτων : n ( i. ) (.39β) = i= SSE = Y Y Συνεπώς η (.38) μέσω των (.39) μπορεί να γραφεί ισοδύναμα : SSTO= SSTR + SSE (.40) Το συνολικό άθροισμα τετραγώνων για το μοντέλο ανάλυσης διασποράς άρα, σχηματίζεται από δύο συνιστώσες :. SSE : Ένα μέτρο τυχαίας διασποράς των παρατηρήσεων γύρω από τους αντίστοιχους μέσους του επιπέδου του παράγοντα. Όσο μικρότερη η διασπορά ανάμεσα στις παρατηρήσεις για κάθε επίπεδο, τόσο μικρότερο είναι το SSE. Εάν το SSE=0, όλες οι παρατηρήσεις για ένα επίπεδο του παράγοντα είναι ίδιες, και αυτό ισχύει για όλα τα επίπεδα του παράγοντα. Όσο περισσότερο διαφέρουν οι παρατηρήσεις ενός επιπέδου μεταξύ τους, τόσο το SSE είναι μεγαλύτερο.. SSTR : Ένα μέτρο του βαθμού των διαφορών ανάμεσα στους μέσους των επιπέδων του παράγοντα, βασισμένο στις αποκλίσεις δειγματικών μέσων των επιπέδων, Y., γύρω από το γενικό μέσο Y... Εάν όλοι οι δειγματικοί μέσοι Y. είναι ίσοι, τότε SSTR=0. Όσο διαφέρουν οι μέσοι επιπέδων του παράγοντα, τόσο μεγαλύτερο θα είναι το SSTR. Σχόλια. Για να αποδείξουμε την (.38), στην αρχή θεωρούμε την (.37) : Y Y.. = ( Y Y.. ) + ( Y Y. ) i Υψώνοντας στο τετράγωνο και τα δύο μέλη προκύπτει :. ( Yi Y ) ( ) ( ) ( )( ).. = Y. Y.. + Yi Y. + Y. Y.. Yi Y. Εάν αθροίσουμε ως προς όλες τις δειγματικές παρατηρήσεις της έρευνας (δηλαδή ως προς i και ) προκύπτει : n n n ( Yi Y.. ) = ( Y. Y.. ) + ( Yi Y. ) + = i= = i= = i= n + ( Y. Y.. )( Yi Y. ) = i= Ο ος όρος του δεξιού μέλους ισούται με : i (.4) 7
18 n ( Y. Y.. ) = n ( Y. Y.. ) = i= = (.4) αφού το ( Y. Y.. ) είναι σταθερό όταν αθροίζεται ως προς i και λαμβάνονται n τέτοιοι όροι για την άθροιση ως προς i. Ο 3 ος όρος στο δεξιό μέλος ισούται με μηδέν: n (.43) ( Y Y )( Y Y ) = ( Y Y ) ( Y Y ) = 0... i.... i. = i= = i= Αυτό συμβαίνει διότι το ( Y. Y.. ) είναι σταθερό όταν αθροίζεται ως προς i οπότε μπορεί να πάει μπροστά από το σύμβολο άθροισης ως προς i. n Επιπλέον, ( Yi Y. ) = 0 αφού το άθροισμα των αποκλίσεων γύρω από i= τον αριθμητικό μέσο είναι μηδέν. Άρα, η (.4) ανάγεται στην (.38).. Οι τετραγωνικές αποκλίσεις των μέσων κάθε επιπέδου του παράγοντα, ( Y. Y.. ) στο SSTR στην (3.39 α ) είναι πολλαπλασιασμένες με τον αριθμό των παρατηρήσεων n στο επίπεδο του παράγοντα διότι για κάθε μια από τις παρατηρήσεις στο επίπεδο του παράγοντα, η συνιστώσα απόκλισης Y Y.. είναι η ίδια.. Υπολογιστικοί τύποι. Για υπολογισμό στο χέρι, οι τύποι των SSTO, SSTR και SSE που δόθηκαν παραπάνω δεν είναι βολικοί. Χρήσιμοι τύποι υπολογισμού, που είναι αλγεβρικά ταυτόσημοι με τους ήδη ορισμένους είναι: n Y.. SSTO= Yi (.44 α ) n SSTR = SSE = = i= T Y. Y.. n n = T Y n. Yi = i= = n Ανάλυση των βαθμών ελευθερίας Αντίστοιχα με την ανάλυση του συνολικού αθροίσματος τετραγώνων, μπορούμε να πετύχουμε μια ανάλυση των βαθμών ελευθερίας. Το SSTO έχει n T - βαθμούς ελευθερίας που συνδέονται με αυτό. Υπάρχουν συνολικά n T παρατηρήσεις αλλά υπάρχει ένας περιορισμός για τις αποκλίσεις Y Y.., δηλαδή πρέπει ( Y Y.. ) = 0 i n n = i= i (.44 β ) (.44 γ ) 8
19 Το SSTR έχει - βαθμούς ελευθερίας που συνδέονται με αυτό. Υπάρχουν μέσοι των επιπέδων του παράγοντα αλλά υπάρχει ένας περιορισμός στις αποκλίσεις Y Y.., δηλαδή πρέπει n ( Y. Y.. ) = 0. Το SSE έχει n T - βαθμούς ελευθερίας που συνδέονται με αυτό. Αυτό φαίνεται αμέσως αν θεωρήσουμε τη -συνιστώσα του SSE: n = ( Yi Y. ) (.45) i= Η έκφραση στην (.45) είναι ισοδύναμη με το συνολικό άθροισμα τετραγώνων λαμβάνοντας υπ όψιν μόνο το -επίπεδο του παράγοντα. Γι αυτό το λόγο υπάρχουν n - βαθμοί ελευθερίας που συνδέονται με αυτό το άθροισμα τετραγώνων. Αφού όμως το SSE είναι ένα άθροισμα τετραγώνων αποτελούμενο από συνιστώσες αθροίσματα τετραγώνων όπως το (.45), οι βαθμοί ελευθερίας που συνδέονται με το SSE είναι το άθροισμα των συνιστωσών αθροισμάτων τετραγώνων : ( ) ( )... ( ) n + n + + n = n (.46) Μέσα αθροίσματα τετραγώνων Τα μέσα αθροίσματα τετραγώνων λαμβάνονται διαιρώντας κάθε άθροισμα τετραγώνων με τους βαθμούς ελευθερίας τους. Συνεπώς έχουμε : SSTR MSTR = (.47 α ) MSE SSE = (.47 β ) n T Εδώ, το MSTR συμβολίζει το μέσο άθροισμα τετράγωνων μεταξύ των διαφορετικών επιπέδων και το ΜSE όπως πριν, συμβολίζει το μέσο άθροισμα τετραγώνων των σφαλμάτων. Πίνακας Ανάλυσης Διασποράς Η ανάλυση του συνολικού αθροίσματος τετραγώνων και των βαθμών ελευθερίας, παρουσιάζεται σε ένα πίνακα ANOVA όπως ο πίνακας. Πίνακας. Πίνακας ANOVA με ένα παράγοντα Πηγή Βαθμοί SS MS E(MS) απόκλισης ελευθερίας Μεταξύ SSTR SSTR = n ( Y. Y..) - MSTR = σ + επιπέδων n μ μ. = Υπόλοιπο στο εσωτερικό των επιπέδων n ( i. ) = i= SSE = Y Y nt T T SSE MSE = n σ ( ) 9
20 n Συνολική ( ) SSTO = Y Y.. n i T J= i= Μαθηματικές ελπίδες των μέσων αθροίσματος τετραγώνων Οι μαθηματικές ελπίδες των MSE και MSTR είναι οι εξής: E( MSE) = σ (.48 α ) ( ) E MSTR ή E( MSTR) = σ + = + σ = = n n τ ( μ.) μ (.48 β ) (.48 γ ) όπου μ. είναι ορισμένο από τον (.3). Αυτές οι αναμενόμενες τιμές φαίνονται στη στήλη E(MS) του πίνακα.. Δύο σημαντικά χαρακτηριστικά των αποτελεσμάτων τις (.48) χρήζουν προσοχής :. Ο MSE είναι αμερόληπτος εκτιμητής της διασποράς του σφάλματος ε i, ανεξαρτήτως εάν οι μέσοι των επιπέδων του παράγοντα μ είναι ίσοι ή όχι. Αυτό είναι διαισθητικά λογικό αφού η διακύμανση των παρατηρήσεων εντός κάθε επιπέδου δεν επηρεάζεται από το μέγεθος των μέσων μ.. Εάν όλοι οι μέσοι μ είναι ίσοι και επομένως ίσοι με μ. ( ή ισοδύναμα εάν όλές οι επιδράσεις τ των επιπέδων του παράγοντα είναι μηδέν ), τότε Ε(MSTR)=σ αφού ο δεύτερος όρος του δεξιού μέλους της (.48β) είναι μηδέν. Γι αυτό οι MSTR και MSE αμφότεροι εκτιμούν τη διασπορά σφάλματος σ εάν όλοι οι μέσοι μ είναι ίσοι. Εάν ωστόσο οι μέσοι δεν είναι ίσοι, ο MSTR τείνει να είναι μεγαλύτερός από τον MSE αφού ο ος όρος του δεξιού μέλους της (.48β) θα είναι θετικός. Εάν όλοι οι μ είναι ίσοι, τότε όλοι οι Y. ακολουθούν την ίδια δειγματοληπτική σ κατανομή, με μέσο μ. και διασπορά. Αυτό απεικονίζεται στο σχήμα n (. α ). Εάν οι μ δεν είναι ίσοι, οι Y. ακολουθούν διαφορετική σ δειγματοληπτική κατανομή, καθεμία με την ίδια διασπορά αλλά με n κέντρο διαφορετικά μ. Μια τέτοια περίπτωση απεικονίζεται στο σχήμα (. β ). Γι αυτό, οι Y. θα τείνουν να διαφέρουν περισσότερο μεταξύ τους εάν οι μ διαφέρουν, και συνεπώς ο MSTR θα τείνει να είναι μεγαλύτερος όταν οι μέσοι των επιπέδων του παράγοντα δεν είναι ίσοι. Η ιδιότητα του MSTR χρησιμεύει στην κατασκευή του στατιστικού ελέγχου που αναλύεται στην επόμενη παράγραφο για το έλεγχο εάν οι μέσοι μ των επιπέδων του παράγοντα είναι ίσοι ή όχι. Εάν οι MSE και MSTR είναι της ίδιας τάξης μεγέθους, υποθέτουμε ότι οι μέσοι μ είναι 0
21 ίσοι. Εάν ο MSTR είναι κατά πολύ μεγαλύτερος του MSE, υποθέτουμε ότι οι μέσοι μ δεν είναι ίσοι. Σχήμα. Δειγματοληπτικές κατανομές του Y. (α) μ μ. (β)οι μ δεν είναι ίσοι υπολογισμός του του Ε(MSE). Για να βρούμε την αναμενόμενη τιμή του MSE, πρώτα σημειώνουμε ότι ο MSE μπορεί να εκφραστεί ως εξής: n MSE = ( Yi Y. ) n T = i= n (. ) Yi Y (.49) i= = ( n ) nt = n Η δειγματική διακύμανση των παρατηρήσεων για το -επίπεδο του παράγοντα είναι : s n ( Yi Y. ) i= = n Τότε, η (.49) εκφράζεται ως εξής: (.50)
22 MSE = ( n ) s (.5) nt = Επειδή είναι γνωστό ότι η δειγματική διακύμανση(.50) είναι ένας αμερόληπτος εκτιμητής της πληθυσμιακής διασποράς, που στη συγκεκριμένη περίπτωση είναι σ για όλα τα επίπεδα του παράγοντα, προκύπτει: EMSE ( ) = ( n ) E( s) nt = = ( n ) σ n T ή EMSE ( ) = σ = Υπολογισμός του Ε(MSTR). Για να απλοποιήσουμε την απόδειξη θα υποθέσουμε ότι όλα τα δειγματικά μεγέθη n είναι ίσα, δηλαδή n n. Το γενικό αποτέλεσμα της (.48β) γίνεται γι αυτήν την περίπτωση : ( ) E MSTR = σ + n ( μ.) μ =, όταν n n =, K, (.5) Επιπλέον, όταν όλα τα δειγματικά μεγέθη των επιπέδων του παράγοντα είναι n, ο MSTR όπως έχει οριστεί στην (.39 α ) και (.47 α ) γίνεται : (...) = n Y Y MSTR =,όταν n n (.53) Για να παράγουμε την (.5) θεωρούμε τη διατύπωση του μοντέλου (.) : Παίρνοντας το μέσο όρο του i Yi = μ + ε i Y για το -επίπεδο έχουμε:.. Y i του Y = μ + ε (.54) όπου ο ε. είναι ο μέσος όρος του εi για το -επίπεδο του παράγοντα: Παίρνοντας το μέσο όρο του έχουμε: n εi = n (.55) Y για όλα τα επίπεδα του παράγοντα i= ε. i Y = μ + ε (.56).....
23 όπου ο μ. είναι ορισμένος από τον (.9) και το ε.. είναι ο μέσος όρος για όλα τα ε : i ε.. = n = i= n T Αφού τα δειγματικά μεγέθη είναι ίσα, έχουμε επίσης : Y. = Y.. = ε. = ε.. = Χρησιμοποιώντας τις (.54) και (.56) έχουμε: (. ) (.) ( ) ε i (.57) (.58 α ) (.58 β ) Y Y = ( μ + ε ) μ + ε = μ μ + ε ε (.59) Εάν υψώσουμε στο τετράγωνο την ( Y. Y.. ) και αθροίσουμε ως προς όλα τα επίπεδα, τελικά προκύπτει: ( Y ) ( ) ( ). Y.. μ μ. ε. ε.. = + + = = = Y Y = τιμή του δεξιού μέλους της (.60): Για να βρούμε την Ε ( ).... Αφού το ( μ ) μ. = = ( μ μ. )( ε. ε.. ) + (.60), πρέπει να βρούμε την αναμενόμενη είναι σταθερό η μαθηματική ελπίδα του είναι: E ( μ μ. ) = ( μ μ. ) (.6) = =. Προτού βρούμε τη μαθηματική ελπίδα του ου όρου του δεξιού μέλους, θεωρούμε την έκφραση : = ( ε ). ε.. Αυτή είναι μια κανονικά δειγματική διασπορά, αφού ο ε.. είναι ο δειγματικός μέσος των όρων ε. στην (.58 β ). Επιπλέον γνωρίζουμε ότι η δειγματική διασπορά είναι αμερόληπτος εκτιμητής της διασποράς της 3
24 μεταβλητής, σε αυτή την περίπτωση του ε.. Αλλά ο ε. είναι απλά ο μέσος των n ανεξάρτητων όρων σφάλματος εi της (.55). Γι αυτό : σ ( ε i ) σ σ ( ε. ) = = n n Συνεπώς: ( )... ε ε = σ E = n έτσι ώστε: ( ) σ E ( ε. ε.. ) = (.6) = n 3. Αφού αμφότεροι οι ε. και ε.. είναι μέσοι των όρων ε i, όλοι εκ των οποίων έχουν μαθηματική ελπίδα 0, προκύπτει ότι: E ( ε. ) = 0 ( ) E ε.. = 0 οπότε: E ( μ μ. )( ε. ε.. ) = ( μ μ. )( ε. ε.. ) = 0 = = έχουμε επομένως δείξει από τις (.6), (.6) και (.63) ότι: ( ) σ Ε ( Y. Y.. ) = ( μ μ. ) + = = n Αλλά τότε η (.53) προκύπτει αμέσως: (... n Y Y ) = n ( ) σ EMSTR ( ) = E = ( μ μ. ) + = n (.63) = + σ n ( μ μ. ) =.5 F-έλεγχος για την ισότητα των μέσων των διαφορετικών επιπέδων του παράγοντα Είναι συνηθισμένο να ξεκινά η έρευνα της ανάλυσης με ένα παράγοντα καθορίζοντας εάν οι μέσοι των επιπέδων του είναι ίσοι ή όχι. Επομένως, οι εναλλακτικές υποθέσεις που θεωρούμε είναι : 4
25 Η 0 :μ =μ = =μ Η : όχι όλα τα μ ίσα (.64) Αλλιώς, μπορούμε να εκφράσουμε τις υποθέσεις ως εξής : Η 0 :τ =τ = =τ =0 Η : όχι όλα τα τ ίσα με μηδέν (.64 α ) Στατιστικός έλεγχος Ο στατιστικός έλεγχος που χρησιμοποιείται για την επιλογή ανάμεσα στις εναλλακτικές υποθέσεις της (.64) είναι ο : * MSTR F = (.65) MSE Οι μεγάλες τιμές του F * υποστηρίζουν την Η, αφού ο MSTR τείνει να ξεπερνά τον MSE όταν η Η ισχύει, όπως φαίνεται στην (.48). Τιμές του F * κοντά στη μονάδα υποστηρίζουν την Η 0, αφού αμφότεροι οι MSTR και MSE έχουν τις ίδιες αναμενόμενες τιμές όταν η Η 0 ισχύει. Θεώρημα Cochan Εάν όλες οι n παρατηρήσεις Υ i προέρχονται από κανονική κατανομή με μέσο μ και διασπορά σ, και το SSTO χωριστεί σε κ αθροίσματα τετραγώνων SS, καθένα με βαθμούς ελευθερίας df, τότε οι SS όροι είναι ανεξάρτητες Χ μεταβλητές με df βαθμούς ελευθερίας σ εάν : k = df = n Κατανομή του F * Όταν όλοι οι μέσοι μ είναι ίσοι, κάθε παρατήρηση Υ i έχει την ίδια αναμενόμενη τιμή, δηλαδή Ε(Υ i ) μ.. Λαμβανομένου υπ όψιν της προσθετικότητας των αθροισμάτων τετραγώνων και των βαθμών ελευθερίας, από το θεώρημα Cochan συνεπάγεται ότι: SSE Όταν ισχύει η Η 0, οι σ και SSTR είναι ανεξάρτητες Χ σ μεταβλητές. Τότε ο F * έλεγχος γράφεται ως εξής : SSTR SSE * MSTR F = σ σ = nt MSE Όμως λόγω του θεωρήματος Cochan προκύπτει, όταν ισχύει η Η 0 : * X ( ) X ( nt ) F = nt όπου οι Χ μεταβλητές είναι ανεξάρτητες. Επομένως, όταν ισχύει η Η 0, ο F * είναι ο λόγος δύο ανεξάρτητων Χ μεταβλητών, καθεμία 5
26 διαιρούμενη με τους βαθμούς ελευθερίας της. Όμως αυτός είναι ο ορισμός μιας τυχαίας μεταβλητής που ακολουθεί την F κατανομή. Άρα όταν ισχύει η Η 0, ο F * ακολουθεί την F(, nt ). Όταν ισχύει η Η δηλαδή εάν δεν είναι όλοι οι μ ίσοι, ο F * δεν ακολουθεί την F κατανομή. Αντιθέτως, ακολουθεί μια πολύπλοκή κατανομή ονομαζόμενη μη κεντροποιημένη F κατανομή. Θα τη χρησιμοποιήσουμε όταν αναφερθούμε στην ισχύ του F ελέγχου. Σημείωση Τα SSTR και SSE είναι ανεξάρτητα ακόμα και αν όλα τα μ είναι άνισα μεταξύ τους. Διαισθητικά, αυτό συμβαίνει διότι το SSE είναι η διακύμανση ανάμεσα στα δειγματικά επίπεδα του παράγοντα, και αυτή η δειγματική διακύμανση δεν επηρεάζεται από τα μεγέθη των μέσων των επιπέδων του παράγοντα. Το SSTR βασίζεται, απ την άλλη, μόνο από τους μέσους των επιπέδων του παράγοντα Y.. Κατασκευή του κανόνα απόφασης Συνήθως, ο κίνδυνος να κάνουμε ένα σφάλμα τύπου Ι ρυθμίζεται από την κατασκευή του κανόνα απόφασης. Το σφάλμα τύπου ΙΙ μπορεί επίσης να ρυθμιστεί, όπως αναφέρεται παρακάτω, μέσω καθορισμού του δειγματικού μεγέθους. Αφού γνωρίζουμε ότι ο F * ακολουθεί την κατανομή F(, nt ) εάν ισχύει η Η 0, και ότι μεγάλες τιμές του F * οδηγούν στην απόφαση Η, ο κατάλληλος κανόνας απόφασης για τον έλεγχο του επιπέδου σημαντικότητας α είναι : * Εάν F F( a;, nt ), ισχύει η Η 0 * (.66) Εάν F > F( a;, nt ), ισχύει η Η όπου F( a;, nt ) είναι το (-α)00 ποσοστιαίο σημείο της F κατανομής. Γενική προσέγγιση Γραμμικού Ελέγχου Ο F έλεγχος που μόλις αναλύθηκέ είναι ένας έλεγχος ενός γραμμικού στατιστικού μοντέλου. Προκύπτει ότι :. Το πλήρες μοντέλο είναι το μοντέλο (.) : Y = μ + ε (.67) i i Η προσαρμογή του πλήρους μοντέλου οδηγεί στους εκτιμητές ελαχίστων τετραγώνων ˆ μ = Y. για την (.) και το άθροισμα τετραγώνων των υπολοίπων : n ( ) = (. ) SSE F Y Y = i= F: Full= πλήρες. Το περιορισμένο μοντέλο κάτω από την Η 0 είναι : i 6
27 Y = μ + ε (.68) i. όπου μ. είναι ο κοινός μέσος για όλα τα επίπεδα του παράγοντα. Η προσαρμογή το περιορισμένου μοντέλου οδηγεί στον εκτιμητή ελαχίστων τετραγώνων ˆ μ. = Y.. και το άθροισμα τετραγώνων των υπολοίπων : i n ( ) = (..) SSE R Y Y = i= R: Resticted=περιορισμένο 3. Τώρα αρκεί να συνδέσουμε τα SSE ( F ) και SSE ( R ). Μπορεί να δειχθεί ότι το SSE ( F ) δεν είναι ποτέ μεγαλύτερο του SSE ( R ). Ο λόγος είναι ότι όσο περισσότερες παραμέτρους υπάρχουν σε ένα μοντέλο τόσο καλύτερα προσαρμόζονται τα δεδομένα και τόσο μικρότερες είναι οι αποκλίσεις γύρω από τη προσαρμοσμένη γραμμή παλινδρόμησης. Εάν το SSE ( F ) δεν είναι πολύ μικρότερο του SSE ( R ), η χρήση του πλήρους μοντέλου δεν ερμηνεύει πολύ καλύτερα τη διακύμανση των Υ από ότι το περιορισμένο μοντέλο που σημαίνει ότι τα δεδομένα συνιστούν ότι ισχύει η Η 0. Με άλλα λόγια, εάν το SSE ( F ) συγκλίνει στο SSE ( R ), η απόκλιση των παρατηρήσεων γύρω από τη γραμμή παλινδρόμησης του πλήρους μοντέλου είναι σχεδόν τόσο μεγάλη όσο είναι αυτή γύρω από τη γραμμή παλινδρόμησης του περιορισμένου μοντέλου, δηλαδή οι επιπλέον παράμετροι δε βοηθούν στη μείωση της διακύμανσης των Υ. Επομένως, εάν η διαφορά SSE ( R) SSE ( F ) είναι μικρή, σύμφωνα με τις πληροφορίες, ισχύει η Η 0. Διαφορετικά, εάν η διαφορά SSE ( R) SSE ( F ) είναι μεγάλη, ισχύει η Η διότι οι επιπρόσθετες παράμετροι (διαφορετικά μέσα μ ) βοηθούν στην ουσιώδη μείωση της απόκλισης των παρατηρήσεων Υ i γύρω από τη γραμμή παλινδρόμησης. Ο γενικός στατιστικός έλεγχός τότε γίνεται : * SSE( R) SSE( F) SSE( F) F = ( nt ) ( nt ) nt Σημειώνουμε ότι το SSE ( R) έχει nt βαθμούς ελευθερίας που συνδέονται με αυτό επειδή μία παράμετρος ( μ. ) πρέπει να εκτιμηθεί, και το SSE ( F ) έχει nt βαθμούς ελευθερίας διότι παράμετροι ( τα μ ) πρέπει να εκτιμηθούν. Έχουμε σύμφωνα με τη (.34) και (.39β) αντίστοιχα : SSE R = SSTO ( ) ( ) SSE F = SSE και αφού από την (.40) SSTO SSE = SSTR, λαμβάνουμε το στατιστικό έλεγχο (.65) : i 7
28 F * = SSTR SSE MSTR n = MSE T.6 Ισχύς του F-ελέγχου Η ισχύς του F-ελέγχου είναι σημαντική για την αποτίμηση της διακριτικής ικανότητας του κανόνα απόφασης που χρησιμοποιήθηκε, όπως και για τον καθορισμό του αναγκαίου δειγματικού μεγέθους. Με την ισχύ του F-ελέγχου, αναφερόμαστε στη πιθανότητα ο κανόνας απόφασης να καταλήξει ότι ισχύει η Η, όταν πραγματικά η Η ισχύει. Συγκεκριμένα, η ισχύς δίνεται από την ακόλουθη σχέση : * Ισχύς= P{ F > F( a;, nt ) φ} (.69) όπου φ είναι η μη κεντροποιημένη παράμετρος, δηλαδή, ένα μέτρο του πόσο άνισα είναι τα μ : ( ) μ μ. nτ n = = φ = = (.70) σ σ όπου τα μ. είναι ορισμένα στην (.3). Όταν όλα τα δειγματοληπτικά επίπεδα του παράγοντα έχουν ίδιο μέγεθος n, η παράμετρος φ γίνεται : φ n n = μ σ μ = σ τ ( ). όταν n = = n (.70 α ) Για τον καθορισμό των πιθανοτήτων της ισχύος, χρειάζεται να αξιοποιήσουμε τη μη κεντροποιημένη F-κατανομή αφού είναι η δειγματοληπτική κατανομή της F * όταν ισχύει η Η. Οι προκύπτοντες υπολογισμοί είναι αρκετά πολύπλοκοι. Ευτυχώς, έχουν κατασκευαστεί διαγράμματα που κάνουν το καθορισμό των πιθανοτήτων ισχύος σχετικά απλό. Ο πίνακας Α- περιέχει τα διαγράμματα Peason- Hatley της ισχύος του F-ελέγχου. Η καμπύλη των διαγραμμάτων αυτών που θα χρησιμοποιήσουμε εξαρτάται από τον αριθμό των επίπεδών του παράγοντα, τα δειγματικά μεγέθη, και το επίπεδο σημαντικότητας που χρησιμοποιήθηκε από το κανόνα απόφασης. Τα διαγράμματα Peason- Hatley χρησιμοποιούνται ως εξής:. Κάθε σελίδα αναφέρεται σε διαφορετικό ν, τον αριθμό των βαθμών ελευθερίας του αριθμητή του F *. Για τη περίπτωση μας, ν =-, ή τον αριθμό των επιπέδων του παράγοντα ελαττωμένο κατά.. Δύο επίπεδα σημαντικότητας, δηλωμένα με α, χρησιμοποιούνται στα διαγράμματα, δηλαδή α=0.05 και α=0.0. Υπάρχουν Χ κλίμακες, ανάλογα με το ποιο επίπεδο σημαντικότητας χρησιμοποιείται. Επιπλέον, το αριστερό σύνολο καμπυλών κάθε διαγράμματος αναφέρεται στο α=0.05, το δεξιό σύνολο στο α= Υπάρχουν ξεχωριστές καμπύλες για διαφορετικές τιμές του ν ( βαθμοί ελευθερίας του παρανομαστή του F * ). Στη περίπτωση μας 8
29 ν =n T -. Οι καμπύλες καταχωρούνται σύμφωνα με την τιμή του ν στο πάνω μέρος του διαγράμματος. Αφού μόνο επιλεγόμενες τιμές του ν χρησιμοποιούνται στα διαγράμματα, χρειάζεται παρεμβολή για ενδιάμεσες τιμές του ν. 4. Η Χ κλίμακα αναπαριστά τη φ, τη μη κεντροποιημένη παράμετρο που ορίζεται στην (.70). 5. Τέλος, η Υ κλίμακα δίνει την ισχύ -β, όπου β είναι ο κίνδυνος να προβούμε σε ένα σφάλμα τύπου ΙΙ. Σχόλια. Όσο μικρότερο είναι το καθορισμένο ρίσκο α, τόσο μικρότερη είναι η ισχύς κάθε δοσμένης φ, και συνεπώς τόσο μεγαλύτερο το ρίσκο ενός σφάλματος τύπου ΙΙ.. Κάθε δοσμένη τιμή της φ περικλείει πολλούς διαφορετικούς συνδυασμούς μέσων μ ή επιδράσεων τ. 3. Η επίδραση του λανθασμένου καθορισμού της σ στο καθορισμό της ισχύος μπορεί να είναι μεγάλη. 4. Όσο μεγαλύτερη είναι η φ, δηλαδή όσο μεγαλύτερες είναι οι διαφορές μεταξύ των μέσων των επιπέδων του παράγοντα, τόσο μεγαλύτερη είναι η ισχύς και επομένως τόσο μικρότερη η πιθανότητα να προβούμε σε ένα σφάλμα τύπου ΙΙ, για ένα δοσμένο ρίσκο να προβούμε σε ένα σφάλμα τύπου Ι. 5. Αφού πολλές έρευνες με ένα παράγοντα αναλαμβάνονται εξαιτίας της προσδοκίας ότι οι μέσοι των επιπέδων του παράγοντα διαφέρουν και ζητείται η εξέταση αυτών των διαφορών, το ρίσκο α που χρησιμοποιείται στην κατασκευή του κανόνα απόφασης για τον καθορισμό εάν ή όχι οι μέσοι των επιπέδων του παράγοντα είναι ίσοι τίθεται σχετικά ψηλά (0.05 ή 0.0 αντί για 0.0)έτσι ώστε να αυξηθεί η ισχύς του ελέγχου. 6. Τα διάγραμμα Peason- Hatley για ν = δεν αναπαριστώνται στο πίνακα Α-8 αφού αυτή η περίπτωση αντιστοιχεί στη σύγκριση δύο πληθυσμιακών μέσων. Ο F-έλεγχος είναι ισοδύναμος με τον διπλό t- έλεγχο και τα διαγράμματα ισχύος που παρουσιάζονται στο πίνακα Α-3 μπορούν να χρησιμοποιηθούν, με μη κεντροποιημένη παράμετρο: μ μ δ = (.7) σ + n n και βαθμούς ελευθερίας n +n -. 9
30 3.Ανάλυση των επιδράσεων του παράγοντα Ο F-έλεγχος για να εξετάσουμε εάν οι μέσοι μ των επιπέδων του παράγοντα διαφέρουν ή όχι, που αναφέρθηκε στο προηγούμενο κεφάλαιο, είναι ένας εισαγωγικός έλεγχος για την περαιτέρω λεπτομερή ανάλυση των επιδράσεων των επιπέδων του παράγοντα ή όχι. Στην περίπτωση που οι μέσοι μ είναι ίσοι, κατά τον F-έλεγχο, το επαγωγικό συμπέρασμα είναι ότι δεν υπάρχει σχέση μεταξύ του παράγοντα και της εξαρτημένης μεταβλητής. Απ την άλλη, εάν οι μέσοι μ διαφέρουν, το συμπέρασμα είναι ότι υπάρχει μια σχέση μεταξύ του παράγοντα και της εξαρτημένης μεταβλητής. Σε αυτή την περίπτωση, γίνεται μια λεπτομερής ανάλυση της φύσεως των επιδράσεων των επιπέδων του παράγοντα. Αυτό γίνεται με δυο κύριους τρόπους :. Ανάλυση του SSTR, και έλεγχος των υποθέσεων που μας ενδιαφέρουν.. Μια άμεση σύγκριση των επιδράσεων των επιπέδων του παράγοντα, χρησιμοποιώντας τεχνικές εκτίμησης. Θα επεξηγήσουμε και τις δύο προσεγγίσεις διαδοχικά, αλλά θα επικεντρωθούμε στην προσέγγιση της εκτίμησης λαμβανομένου υπ όψη της μεγαλύτερης χρησιμότητας της. Σε κάθε σημείο του κεφαλαίου, θεωρούμε το μοντέλο ανάλυσης διασποράς (.) : Yi = μ + εi (3. α ) όπου: μ είναι οι παράμετροι ε i είναι ανεξάρτητες Ν(0,σ ) ή το εναλλακτικό μοντέλο (.6): Yi = μ. + τ + εi (3. β ) όπου: μ.:είναι μια γενική σταθερά τ :είναι παράμετροι που υπόκεινται στον περιορισμό n τ = 0 ε i είναι ανεξάρτητες Ν(0,σ ) 3. Ανάλυση του SSTR στην ANOVA με ένα παράγοντα Η ανάλυση του SSTR ξεκινά με τη βασική σχέση : Πηγή Διασποράς SS παράγοντας SSTR σφάλμα SSE σύνολο SSTO Όταν επιθυμούμε να ερευνήσουμε μια διαφορετική μορφή μεταχείρισης έναντι της τρέχουσας γίνεται διάσπαση του SSTR σε επί μέρους = 30
31 συνιστώσες που ενδιαφέρουν τον αναλυτή. Παρακάτω θα επεξηγήσουμε ένα τύπο που είναι αρκετά χρήσιμος. Επίδραση της διάσπασης των ομάδων Μια τέτοια διάσπαση είναι κατάλληλη όταν τα επίπεδα ή μεταχειρίσεις μπορούν να κατηγοριοποιηθούν σε σχετικές ομάδες και το ενδιαφέρον έγκειται στο : ()εάν ή όχι οι μέσοι των διαφορετικών ομάδων είναι ίσοι ()εάν ή όχι οι διάφοροι μέσοι των επιπέδων του παράγοντα μέσα σε κάθε ομάδα είναι ίσοι. Θα εισαγάγουμε ένα επιπλέον σύστημα συμβόλων για την μοντελοποίηση της διάσπασης ομάδων. Ο αριθμός των κλάσεων ή ομάδων δηλώνεται με το c, και ο αριθμός των επιπέδων του παράγοντα στην g ομάδα (g=,,c) θα δηλώνεται με g. Επομένως προκύπτει : c = (3.) g= g όπου είναι το πλήθος όλων των επιπέδων της έρευνας. Συμβολίζουμε με Yg το άθροισμά των παρατηρήσεων για την g ομάδα: Y g c = Y (3.3) g=. όπου Y. είναι το άθροισμα των παρατηρήσεων του επιπέδου του παράγοντα όπως ορίζεται στην (.7). Προκύπτει ότι : Y.. c = Y (3.4) g= g όπου Y.. είναι το άθροισμα όλων των παρατηρήσεων όπως ορίζεται στην (.9). Τέλος, το συνολικό πλήθος των παρατηρήσεων για την g ομάδα θα δηλώνεται με N : g N g c = n (3.5) g= όπου n είναι το πλήθος των παρατηρήσεων για το επίπεδο. Προκύπτει ότι : N T c = N (3.6) g= g όπου n T είναι το συνολικό πλήθος των παρατηρήσεων στην έρευνα, όπως ορίζεται στην (.). Η ανάλυση του SSTR μπορεί να οριστεί ως εξής : SSTR = SSB + SSW + +SSW c (3.7) 3
32 όπου : c Yg Y.. SSB(sum of squaes between goups)= (3.8 α ) N n SSW g (sum of squaes within g goup)= g= g T c Y. Yg (3.8 β ) n N g= g Υπάρχουν c- βαθμοί ελευθερίας που σχετίζονται με το SSB και g βαθμοί ελευθερίας με το SSW g. Τα προκύπτοντα μέσα αθροίσματα τετραγώνων είναι : SSB ΜSB= c (3.9α) SSWg ΜSW g = g (3.9β) Η ανάλυση αυτή φαίνεται στο Πίνακα 3.. Πίνακας 3. Πηγή Διακύμανσης SS Βαθμοί ελευθερίας MS Μεταχείριση SSTR - MSTR Ανάμεσα στις ομάδες SSB c- MSB Εντός της ης ομάδας SSW - MSW Εντός της c ομάδας SSW c c - MSW c Σφάλμα SSE n T - MSE Σύνολο SSTO n T - Ο στατιστικός έλεγχος για να εξετάσουμε εάν οι μέσοι των ομάδων διαφέρουν ή όχι είναι ο : * MSB F = MSE (3.0 α ) και ο στατιστικός έλεγχος για τον προσδιορισμό εάν οι μέσοι των επιπέδων εντός της g ομάδας διαφέρουν ή όχι είναι ο : * MSWg F = MSE (3.0 β ) Εν όψει της αθροιστικής ιδιότητας των αθροισμάτων τετραγώνων και βαθμών ελευθερίας, το θεώρημα Cochan (.5) εφαρμόζεται όταν όλοι οι μέσοι των επιπέδων του παράγοντα είναι ίσοι, έτσι ώστε οι F * έλεγχοι στις (3.0 α ) και (3.0 β ) να ακολουθούν την κατανομή F εάν οι μέσοι είναι ίσοι. Επομένως, οι κανόνες απόφασης για τον έλεγχο του κινδύνου να κάνουμε ένα σφάλμα τύπου είναι οι ίδιοι. 3
33 Σχόλια. Η διάσπαση του SSTR στον πίνακα 3. καλείται ορθογώνια διάσπαση. Μια ορθογώνια διάσπαση είναι αυτή όπου οι συνιστώσες αθροισμάτων τετραγώνων προσθέτονται στο συνολικό άθροισμα τετραγώνων (στη περίπτωση μας SSTR) και ομοίως και οι βαθμοί ελευθερίας. Μια ιδιότητα της ορθογώνιας διάσπασης είναι ότι οι συνιστώσες αθροισμάτων τετραγώνων είναι ανεξάρτητα κατανεμημένες για το μοντέλο ανάλυσης διασποράς (3.).. Συχνά, δεν είναι δυνατόν να ερευνήσουμε όλα τα ζητήματα που μας ενδιαφέρουν με μια μόνο ορθογώνια διάσπαση αλλά να χρειάζονται περαιτέρω έλεγχοι τους οποίους τα SSW g να μην είναι ανεξάρτητα μεταξύ τους. 3. Μια διάσπαση του SSTR δεν είναι από μόνη της επαρκής ανάλυση και πρέπει να ακολουθείται από την εκτίμηση του μεγέθους των επιδράσεων που υπάρχουν (εκτιμητική προσέγγιση που αναφέρεται αμέσως παρακάτω). 4. Μια δυσκολία σχετικά με τη διάσπαση του SSTR και επακόλουθων ξεχωριστών ελέγχων των συνιστωσών είναι ότι το επίπεδο σημαντικότητας και ισχύος, στο βαθμό που αφορά το σύνολο των ενδιαφερόμενων για μας ελέγχων, επηρεάζονται. Το επίπεδο σημαντικότητας και ισχύος για ένα σύνολο ή μια οικογένεια ελέγχων δεν είναι ίδιο με εκείνο ενός ξεχωριστού ελέγχου. Πράγματι, οι F * στατιστικοί έλεγχοι είναι εξαρτημένοι αφού έχουν κοινό παρονομαστή τον MSE. Γι αυτό είναι δύσκολος ο ακριβής καθορισμός του επιπέδου σημαντικότητας και ισχύος για μια οικογένεια ελέγχων που προκύπτουν από μια διάσπαση του SSTR και θα ήταν πιο δύσκολος ο καθορισμός τους εάν οι έλεγχοι προέκυπταν από ένα πλήθος διασπάσεων. Οι πολλαπλές συγκρίσεις με ένα οικογενειακό συντελεστή εμπιστοσύνης, από την άλλη μπορούν να χρησιμοποιηθούν για εξαγωγή συμπερασμάτων με συγκεκριμένη ασφάλεια για όλη την οικογένεια εκτιμητών. Αυτές αναφέρονται στην επόμενη παράγραφο. 3. Εκτιμητές των επιδράσεων του παράγοντα Εάν ο F * έλεγχος υποδεικνύει ότι οι μέσοι μ διαφέρουν, ενδέχεται να προβούμε απευθείας στην εκτίμηση της επίδρασης των παραγόντων που μας ενδιαφέρουν. Επίσης οδηγείται κανείς στο ίδιο σημείο έπειτα από μια ή περισσότερες διασπάσεις του SSTR. Οι εκτιμητές που συνήθως χρησιμοποιούνται για την επίδραση των παραγόντων περιλαμβάνουν τα εξής :. εκτίμηση του μέσου των επιπέδων του παράγοντα μ. εκτίμηση των διαφορών ανάμεσα στους μέσους των επιπέδων 3. εκτίμηση της αντίθεσης μεταξύ των μέσων των επιπέδων 33
34 Εκτίμηση του μέσου του επιπέδου του παράγοντα Ένας αμερόληπτος εκτιμητής του μέσου μ προέκυψε στην (.): μ = Y. (3.) Ο εκτιμητής έχει μέσο και διακύμανση : EY = μ (3. α ) ( ). σ σ ( Y. ) = (3. β ) n Το τελευταίο αποτέλεσμα προκύπτει επειδή η (.54) υποδεικνύει ότι Y. = μ + ε., το άθροισμα μιας σταθεράς και ενός μέσου από n ανεξάρτητους εi όρους, καθένας εκ των οποίων έχει διακύμανση σ. Επιπλέον, ο Y. ακολουθεί κανονική κατανομή επειδή οι όροι σφάλματος ε ακολουθούν κανονική κατανομή. i Η εκτιμώμενη διακύμανση του. s Y. και λαμβάνεται αντικαθιστώντας το σ της (3. β ) με τον αμερόληπτο εκτιμητή MSE : MSE s ( Y. ) = (3.3) n Y σημειώνεται με ( ) Η εκτιμώμενη τυπική απόκλιση sy (. ) είναι η θετική τετραγωνική ρίζα της (3.3). Αποδεικνύεται ότι : Y. μ Η (3.4) ακολουθεί την κατανομή t( nt ) για το μοντέλο (3.) sy (. ) όπου οι βαθμοί ελευθερίας είναι εκείνοι που αφορούν στο MSE. Η (3.4) προκύπτει από τον ορισμό της t στην (.6) αφού : () ο Y. ακολουθεί κανονική κατανομή, και () το MSE/σ ακολουθεί την ανεξάρτητη από το Y. κατανομή x ( nt ) nt σύμφωνα με το ακόλουθο θεώρημα: (3.5) Για το μοντέλο (3.) το SSE/σ ακολουθεί την χ, με βαθμούς ελευθερίας και είναι ανεξάρτητο των Y., Y., K, Y.. nt Προκύπτεί άμεσα από την (3.4) ότι το διάστημα εμπιστοσύνης για τους μέσους μ με συντελεστή εμπιστοσύνης -α είναι: ( /; T ) ( ) μ ( /; T ) ( ) Y. t a n s Y. Y. + t a n s Y. (3.6) 34
9. Παλινδρόμηση και Συσχέτιση
9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε
Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017
Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης
Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017
Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα
Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης
1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από
Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα
Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 015 Ανάλυση Διακύμανσης Η Ανάλυση Διακύμανσης είναι μία τεχνική που
ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ
ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε
Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς
Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο
Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης
Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ
Γ. Πειραματισμός - Βιομετρία
Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της
ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία
ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση
ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική
ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης
Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες
Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού
Χ. Εμμανουηλίδης, 1
Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,
ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική
ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana
ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)
ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA). Εισαγωγή Η ανάλυση της διακύμανσης (ANalysis Of VAriance ANOVA) είναι μια στατιστική μεθόδος με την οποία η μεταβλητότητα που υπάρχει σ ένα σύνολο δεδομένων διασπάται στις
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος
Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση
Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ
Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών
Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για
Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21
ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις
Κεφάλαιο 9. Έλεγχοι υποθέσεων
Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ (Analyss of Varance for two factor Experments) (Two-Way Analyss of Varance) Ο πειραματικός σχεδιασμός για τον οποίο θα μιλήσουμε είναι μια επέκταση της μεθοδολογίας
Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς
Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με
Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA
ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 3: One-Way ANOVA
Στατιστική Συμπερασματολογία
4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε
Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας
Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]
Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης
Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης
Σφάλματα Μετρήσεων 4.45 Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης Διάστημα εμπιστοσύνης βρίσκονται εκτός του Διαστήματος Εμπιστοσύνης 0.500 X 0.674σ 1 στις 0.800 X 1.8σ 1 στις
Γ. Πειραματισμός Βιομετρία
Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.
5. Έλεγχοι Υποθέσεων
5. Έλεγχοι Υποθέσεων Υποθέσεις Η μηδενική υπόθεση Η (ή ΗΑ) εναλλακτική υπόθεση Δεχόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγχος
Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011
Εργαστήριο Μαθηματικών & Στατιστικής Γραπτή Εξέταση Περιόδου Φεβρουαρίου για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 5//. [] Η ποσότητα, έστω Χ, ενός συντηρητικού που περιέχεται σε φιάλες αναψυκτικού
ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ
ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ Το ενδιαφέρον επικεντρώνεται πάντα στον πληθυσμό Το δείγμα χρησιμεύει για εξαγωγή συμπερασμάτων για τον πληθυσμό π.χ. το ετήσιο εισόδημα των κατοίκων μιας περιοχής Τα στατιστικά
Περιγραφική Ανάλυση ποσοτικών μεταβλητών
Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο
Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς
Διαστήματα εμπιστοσύνης Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Το διάστημα εμπιστοσύνης είναι ένα διάστημα αριθμών
Κεφάλαιο 9. Έλεγχοι υποθέσεων
Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές
Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)
Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY
Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017
Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017 2 Σχέδιο τυχαιοποιημένων πλήρων ομάδων (1) Αποτελεί ευθεία γενίκευση του σχεδίου που γνωρίσαμε όταν μιλήσαμε για τη σύγκριση κατά ζεύγη δύο μέσων μ 1 και μ 2
Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x
Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας
ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ
ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική
Αναλυτική Στατιστική
Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων
Στατιστική Συμπερασματολογία
Στατιστική Συμπερασματολογία Διαφάνειες 5 ου κεφαλαίου Ελεγχοσυναρτήσεις για τις Παραμέτρους της Κανονικής Κατανομής Σταύρος Χατζόπουλος 08/05/207, 5/05/207 Εισαγωγή Στις παραγράφους που ακολουθούν παρουσιάζονται
Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)
Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.
Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται
Συσχέτιση μεταξύ δύο συνόλων δεδομένων
Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,
Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17
Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα
Τμήμα Διοίκησης Επιχειρήσεων Γρεβενά Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Ιδιότητες εκτιμώμενης ευθείας παλινδρόμησης με τη μέθοδο των ελαχίστων
Στατιστική Ι. Ανάλυση Παλινδρόμησης
Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι
ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ
3. Κατανομές πιθανότητας
3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.
Στατιστική Επιχειρήσεων ΙΙ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν
Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)
Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει
Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο
Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%
Ανάλυση διακύμανσης (Μονοδιάστατη) One-Way ANOVA
Ανάλυση διακύμανσης (Μονοδιάστατη) One-Way ANOVA Ανάλυση διακύμανσης Η μονοδιάστατη ανάλυση διακύμανσης εξετάζει εάν δύο ή περισσότεροι ανεξάρτητοι πληθυσμοί έχουν τον ίδιο ή διαφορετικό μέσο όρο. Στην
Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ
ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό
Ενδεικτικές ασκήσεις ΔΙΠ 50
Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν
και τυπική απόκλιση σ = 40mg ανά μπανάνα. α) Ποια είναι η πιθανότητα μια μπανάνα να περιέχει i)
Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ Γραπτή Εξέταση Περιόδου Ιανουαρίου 8 στο Μάθημα Στατιστική 7..8. [] Ο ανθρώπινος οργανισμός χρειάζεται καθημερινά από έως 6 mg (mllgrams) καλίου. Η ποσότητα καλίου που περιέχεται στα τρόφιμα
ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ
ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται
ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...
ΚΕΦΑΛΑΙΟ 0 Ένα Πρόβλημα Δεδομένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Απλή Γραμμική Παλινδρόμηση Μωυσιάδης Χρόνης 6 o Εξάμηνο Μαθηματικών Έχει σχέση το με το ; Ειδικότερα
ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική
ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr
Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων
Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε
3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)
3 ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratfed Radom Samplg) Είναι προφανές από τα τυπικά σφάλματα των εκτιμητριών των προηγούμενων παραγράφων, ότι ένας τρόπος να αυξηθεί η ακρίβεια τους είναι να αυξηθεί
ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική
ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος
Είδη Μεταβλητών. κλίµακα µέτρησης
ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό
iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος
iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών
X = = 81 9 = 9
Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές
Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές
Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ
ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Πολλαπλές συγκρίσεις Στην ανάλυση διακύμανσης ελέγχουμε την ισότητα
Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία
ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ
ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ
ΚΕΦΑΛΑΙΟ ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ Ως γνωστό δείγμα είναι ένα σύνολο παρατηρήσεων από ένα πληθυσμό. Αν ο πληθυσμός αυτός θεωρηθεί μονοδιάστατος τότε μπορεί να εκφρασθεί με τη συνάρτηση
ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ
ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης
ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης
ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση
Μέθοδος μέγιστης πιθανοφάνειας
Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα
συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;
Γραπτή Εξέταση Περιόδου Ιουνίου 008 στο Μάθημα Στατιστική /07/08. Η πιθανότητα να υπάρχει στο υπέδαφος μιας συγκεκριμένης περιοχής εκμεταλλεύσιμο κοίτασμα πετρελαίου είναι 50%. Μια εταιρεία, που πρόκειται
5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο
5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε
Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες
Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω
x y max(x))
ΚΕΦΑΛΑΙΟ 0 Απλή Γραµµική Παλινδρόµηση Μωυσιάδης Χρόνης 6 o Εξάµηνο Μαθηµατικών Ένα Πρόβληµα εδοµένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 y 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Έχει σχέση το yµε το ; Ειδικότερα
7. Ανάλυση Διασποράς-ANOVA
7. Ανάλυση Διασποράς-ANOVA Παράδειγμα Μετρήσεις της συγκέντρωσης του strodum (mg/ml) σε πέντε υδάτινες περιοχές (Α,Β,C,D,Ε). Α Β C D Ε 8, 39,6 46,3 4,0 56,3 33, 40,8 4, 44, 54, 36,4 37,9 43,5 46,4 59,4
Ανάλυση διακύμανσης (Μέρος 3 ο ) 7/4/2017
Ανάλυση διακύμανσης (Μέρος 3 ο ) 7/4/2017 2 α x b Παραγοντικό Πείραμα (1) Όταν θέλουμε να μελετήσουμε την επίδραση (στη μεταβλητή απόφασης) δύο παραγόντων, έστω Α και Β, με α στάθμες ο Α και b στάθμες
Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής
Οικονομετρία Ι Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative