ΕΛΕΓΧΟΙ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙΟ 4

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΛΕΓΧΟΙ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙΟ 4"

Transcript

1 ΚΕΦΑΛΑΙΟ 4 ΕΛΕΓΧΟΙ ΚΑΤΑΝΟΜΩΝ Οι πληθυσμοί, ανεξάρτητα από το αν έχουν ίδιες θέσεις (ίσες μέσες τιμές) ή ίσες διασπορές, ενδέχεται να διαφέρουν πάρα πολύ ως προς άλλα χαρακτηριστικά τους. Έτσι, οι έλεγχοι υποθέσεων για τις παραμέτρους θέσης ή μεταβλητότητας ενός πληθυσμού (μέση τιμή, διάμεσος, ποσοστιαία σημεία, διασπορά) δεν αποκαλύπτουν διαφορές σε άλλα χαρακτηριστικά του πληθυσμού. Για να είμαστε, επομένως, σε θέση να ελέγξουμε υποθέσεις για την άγνωστη κατανομή πιθανότητας μιας τυχαίας μεταβλητής πάνω στην οποία έχουμε παρατηρήσεις (δείγμα), χρειαζόμαστε μιας άλλης μορφής υπόθεση. Αυτή θα είναι περιεκτικότερη, με την έννοια ότι θα πρέπει να αναφέρεται σε όλα τα ποσοστιαία σημεία ταυτόχρονα και όχι μόνο στην διάμεσο. Θα πρέπει, επίσης, να αναφέρεται σε όλες τις πιθανότητες ταυτόχρονα και όχι σε μία ή σε κάποιες μόνο από τις πιθανότητες. Με άλλά λόγια, χρειαζόμαστε υποθέσεις των οποίων ο έλεγχος θα απαντά στο ερώτημα: αποτελούν οι παρατηρήσεις μας ένα δείγμα από κάποια συγκεκριμένη κατανομή; Υποθέσεις αυτής της μορφής μπορούν να ελεγχθούν με ελέγχους καλής προσαρμογής (goodness-of-fit tests), δηλαδή, με ελέγχους σχεδιασμένους να συγκρίνουν το δείγμα με τον τύπο του δείγματος που θα περιμέναμε να έχουμε από την κατανομή που υποθέτουμε, ώστε να μπορούμε να δούμε αν η υποτεθείσα συνάρτηση κατανομής προσαρμόζεται στα δεδομένα του δείγματος. Ο αρχαιότερος και γνωστότερος τέτοιος έλεγχος καλής προσαρμογής είναι ο έλεγχος χ ο οποίος προτάθηκε από τον Pearson το

2 Αργότερα, ο Kolmogorov (1933, 1941) επενόησε έναν εναλλακτικό έλεγχο για τον ίδιο σκοπό και ο Smirnov (1939, 1948) τον επέκτεινε για την περίπτωση του ελέγχου της υπόθεσης ότι δύο ανεξάρτητα δείγματα μπορούν να υποτεθούν ότι προέρχονται από την ίδια κατανομή. Στα επόμενα, θα εξετάσουμε τους δύο αυτούς ελέγχους. Εστω ότι Χ 1, Χ,..., Χ n είναι ένα τυχαίο δείγμα παρατηρήσεων πάνω σε μια τυχαία μεταβλητή Χ. Θα μπορούσαμε να ενδιαφερόμαστε να ελέγξουμε το ερώτημα κατά πόσον οι τιμές αυτές αποτελούν ένδειξη ότι η τυχαία μεταβλητή Χ ακολουθεί μία συγκεκριμένη κατανομή, π.χ. μία ομοιόμορφη κατανομή στο διάστημα μεταξύ 0 και 1 ή μεταξύ 0 και 10, ή μία κανονική κατανομή με μέση τιμή 0 και τυπική απόκλιση.7. Εναλλακτικά, θα μπορούσαμε να ενδιαφερόμαστε να εξετάσουμε ένα πολύ γενικότερο ερώτημα όπως: «είναι εύλογο να υποθέσουμε ότι τα δεδομένα αυτά έχουν προέλθει από μια κανονική κατανομή με άγνωστη μέση τιμή και διασπορά;» Ο έλεγχος χ, όπως θα δούμε, είναι ευέλικτος και επιτρέπει την εκτίμηση των αγνώστων παραμέτρων από τα δεδομένα. Ο έλεγχος του Kolmogorov, αντίθετα, απαιτεί κάποιες μεταβολές για να απαντήσει στο τελευταίο ερώτημα. 4.1 Ο χ ΕΛΕΓΧΟΣ ΚΑΛΗΣ ΠΡΟΣΑΡΜΟΓΗΣ (The χ Goodness of Fit Test) Ο αρχαιότερος και περισσότερο γνωστός έλεγχος καλής προσαρμογής είναι ο έλεγχος χ, ο οποίος προτάθηκε από τον Karl Pearson το Ο έλεγχος αυτός χρησιμοποιείται σε περιπτώσεις προβλημάτων στα οποία ενδιαφερόμεστε να εξετάσουμε αν τα 390

3 δεδομένα προέρχονται από μια ορισμένη κατανομή, δηλαδή, για τον έλεγχο υποθέσεων της μορφής Η 0 : F Χ (x) = F 0 (x) Η 1 : F Χ (x) F 0 (x), όπου F Χ (x) = P(Xx) είναι η συνάρτηση κατανομής της τυχαίας μεταβλητής X.. Τα δεδομένα είναι ένα τυχαίο δείγμα παρατηρήσεων μεγέθους n, οι οποίες είναι ταξινομημένες σε n κατηγορίες (κλάσεις) σύμφωνα με τον πίνακα που ακολουθεί: Εδώ, Ο i συμβολίζει τον αριθμό των παρατηρήσεων στην i κατηγορία. Έστω, για παράδειγμα, ότι έχουμε τις εξής παρατηρήσεις πάνω σε μια τυχαία μεταβλητή Χ: Ενας τρόπος κατάταξης των διακριτών αυτών δεδομένων είναι ο εξής: Κλάση (i) Συχνότητα (Ο i ) Ενας άλλος τρόπος κατάταξης των δεδομένων αυτών θα μπορούσε να εναι ο εξής: 391

4 Κλάση (i) 1 3 X j 1 X j 5 X j 6 Συχνότητα (Ο i ) 5 7 Στον παραπάνω πίνακα, Χ j συμβολίζει την τυχούσα παρατήρηση πάνω στην τυχαία μεταβλητή Χ. Η επιλογή του αριθμού και του εύρους των κλάσεων είναι στην κρίση του ερευνητή. Eστω 0 p i η πιθανότητα μιας τυχαίας παρατήρησης πάνω στην μεταβλητή Χ να ανήκει στην κατηγορία i, κάτω από μηδενική υπόθεση ότι F 0 (x) είναι η συνάρτηση κατανομής της Χ. Δηλαδή, 0 p i = P(η παρατήρηση Χ j ανήκει στην κατηγορία i H 0 ) για κάθε i, j. Τότε, ο αναμενόμενος αριθμός των παρατηρήσεων στην κατηγορία i, όταν η μηδενική υπόθεση είναι αληθής, ορίζεται από την σχέση Ε i = n 0 p i. Η κατάλληλη στατιστική συνάρτηση για τον έλεγχο της υπόθεσης Η 0 έναντι της Η 1 είναι η n (O i E i ) T, E i 1 όπου n συμβολίζει τον αριθμό των κλάσεων στις οποίες είναι ταξινομημένες οι παρατηρήσεις. Η κατανομή της στατιστικής συνάρτησης Τ προσεγγίζεται, στις περισσότερες περιπτώσεις, i την 39

5 ικανοποιητικά από την κατανομή χ με n-1 βαθμούς ελευθερίας. (Συμβολικά, T χ n-1 ). Από τον ορισμό της στατιστικής συνάρτησης Τ, είναι φανερό ότι οι μεγάλες τιμές της συνάρτησης αυτής αποτελούν ένδειξη εναντίον της μηδενικής υπόθεσης, αφού αντανακλούν μεγάλες αποκλίσεις μεταξύ των τιμών που παρατηρούνται στις διάφορες κατηγορίες και των τιμών που θα έπρεπε να παρατηρούνται στις αντίστοιχες κατηγορίες, αν η μηδενική υπόθεση ήταν αληθής. Επομένως, η κρίσιμη περιοχή του ελέγχου ορίζεται από την ανισότητα T χ n 1,1 α, όπου χ n συμβολίζει το (1 α)-ποσοστιαίο σημείο της κατανομής 1,1 α χ. n 1 Παρατήρηση: Η F 0 (x) ενδέχεται να έχει γνωστή παράμετρο, όπως, για παράδειγμα, στις υποθέσεις Η 0 : F Χ (x) = F Poisson(3) (x) Η 0 : F Χ (x) = F N(3,5) (x). (Δηλαδή, η F 0 (x) καθορίζει μια συγκεκριμένη κατανομή). Ενδέχεται, όμως, η F 0 (x) να περιέχει άγνωστες παραμέτρους, όπως στις επόμενες δύο περιπτώσεις: Η 0 : F Χ (x) = F Poisson(λ) (x) Η 0 : F Χ (x) = F N(μ, σ ) (x). (Η F 0 (x), δηλαδή, καθορίζει μια οικογένεια κατανομών). Σε αυτές τις περιπτώσεις, οι άγνωστες παράμετροι εκτιμώνται και το γεγονός αυτό αντανακλάται στους βαθμούς ελευθερίας της κατανομής της 393

6 στατιστικής συνάρτησης Τ. Συγκεκριμένα, η κατανομή της Τ δεν θα είναι η χ αλλά η n 1 χ n 1 - {αριθμός των εκτιμώμενων παραμέτρων}. Δηλαδή, T n i1 (O i E E i i ) χ n k 1, όπου k συμβολίζει τον αριθμό των εκτιμώμενων παραμέτρων. Παρατήρηση: Αν κάποιες από τις αναμενόμενες συχνότητες E i είναι μικρές, η προσέγγιση της κατανομής της στατιστικής συνάρτησης Τ από την κατανομή μικρές μπορούν να είναι οι τιμές των Cochran (195), καμία από τις τιμές χ ενδέχεται να μην είναι ικανοποιητική. Πόσο E i δεν είναι σαφές. Κατά τον E i δεν πρέπει να είναι μικρότερη της μονάδας και, πάντως, το ποσοστό των τιμών E i που δεν υπερβαίνουν το 5 δεν πρέπει να είναι μεγαλύτερο του 0%. Μεταγενέστερες μελέτες δείχνουν ότι αρκούν λιγότερο αυστηρές προϋποθέσεις. Για παράδειγμα, κατά τον Yarnold (1970), αν έχουμε περισσότερες από δύο κλάσεις, το ποσοστό των αναμενόμενων συχνοτήτων E i που μπορούν να είναι μικρότερες του 5 μπορεί να είναι πολύ μεγαλύτερο. Συγκεκριμένα, αν ο αριθμός n των κλάσεων υπερβαίνει το, τότε από τις αναμενόμενες συχνότητες E i μπορούν να είναι μικρότερες του 5, αρκεί να μην είναι μικρότερες του 5 /n. Επομένως, 100q% από τις αναμενόμενες συχνότητες μπορούν να έχουν τιμή στο διάστημα [5q, 5), όπου q = /n. Από το άλλο μέρος, κατά τον Slakter (1973), ο αριθμός m των θεωρούμενων κλάσεων μπορεί να υπερβαίνει τον αριθμό n των παρατηρήσεων και, κατά συνέπεια, η μέση τιμή των E i μπορεί να είναι μικρότερη από την μονάδα. Στην πράξη, όταν υπάρχουν πολλές κλάσεις με αναμενόμενες συχνότητες 394

7 μικρότερες του 5, ορισμένοι ερευνητές επανακαθορίζουν τις κλάσεις με την συνένωση κάποιων από τις αρχικές κλάσεις, προκειμένου να οδηγηθούν σε κλάσεις με αναμενόμενες συχνότητες μεγαλύτερες ή ίσες του 5. Η επιλογή των συνενούμενων κλάσεων, όμως, είναι, εν γένει, αυθαίρετη και, συχνά, χωρίς νόημα. Παράδειγμα 4.1.1: Ας θεωρήσουμε τυχαίο δείγμα 5 παρατηρήσεων πάνω στην ζήτηση Χ για ένα προϊόν (σε αριθμό μονάδων που παραγγέλλονται) ταξινομημένων ως εξής: Κλάση i Συχνότητα O i Για τον έλεγχο των υποθέσεων Η 0 : F Χ (x) = F Poisson(λ) (x) Η 1 : F Χ (x) F Poisson(λ) (x), για κάθε x = 0, 1,,... σε επίπεδο σημαντικότητας α=5%, κατασκευάζουμε τον πίνακα που ακολουθεί: 0 Κλάση i X j O i p i E n' 0 i p i

8 8 n O i1 i 5. Οι 8 κλάσεις που θεωρήθηκαν στον παραπάνω πίνακα επελέγησαν αυθαίρετα. Οι τιμές των πιθανοτήτων 0 p i, οι οποίες απαιτούνται για τον υπολογισμό των τιμών της τελευταίας στήλης του πίνακα, προκύπτουν από τις σχέσεις: 0 p1 j 0 P(X 1H ) = P(X Poisson(λ) 1) pi j 0 P(X i H ) = P(X Poisson(λ) = i), i =, 3,..., 7 0 P(X j 8 H ) = P(X Poisson(λ) 7) = 1 p i, 0 p8 0 7 i1 όπου X j συμβολίζει την τυχούσα παρατήρηση του δείγματος. Είναι γνωστό ότι η παράμετρος λ είναι η μέση τιμή της κατανομής Poisson. Επομένως, η εκτιμήτρια της παραμέτρου λ είναι λˆ X, όπου n' X i i1 X, n' αν οι n παρατηρήσεις είναι αταξινόμητες, ή 396

9 λˆ X g, όπου X g n mioi mioi i1 i1, n n' O αν οι n παρατηρήσεις είναι ταξινομημένες σε n κατηγορίες με i1 αντίστοιχα κεντρικά σημεία m i, i = 1,,..., n. Για τα δεδομένα του παραδείγματός μας, η εκτίμηση της τιμής i n της παραμέτρου λ προκύπτει ίση με x=4. Επομένως, 4 P(X ˆ x 4 Poisson(4) x) e x!. Επίσης, δεδομένου ότι n=8 και k=1, ισχύει ότι T (O - E ) 8 i i χ χ. 6 i 1 E i Η κρίσιμη περιοχή, επομένως, του ελέγχου μεγέθους 0.05 ορίζεται από την ανισότητα Τ χ ,0.95 Η παρατηρούμενη τιμή, όμως, της στατιστικής συνάρτησης Τ είναι τ=5.56, η οποία δεν βρίσκεται μέσα στην κρίσιμη περιοχή. Επομένως, σε επίπεδο σημαντικότητας 5%, τα δεδομένα δεν παρέχουν ενδείξεις ότι η κατανομή της ζήτησης διαφέρει από την κατανομή Poisson. Το κρίσιμο επίπεδο του ελέγχου είναι αˆ P(T 5.56 H ) 1 P(T 5.56 H ) 1 P(χ ) Παρατηρούμε ότι από τις 8 θεωρηθείσες κλάσεις (ποσοστό ίσο με 5%) έχουν αναμενόμενες συχνότητες μικρότερες από 5. Αυτό είναι μέσα στα κατά Yarnold αποδεκτά όρια, αφού και οι δύο αυτές συχνότητες δεν είναι μικρότερες από 5./8=1.5. Στην περίπτωση, όμως, που υιοθετήσουμε την άποψη του Cochran, θα μπορούσαμε να

10 επανακαθορίσουμε τα όρια των κλάσεων, συνενώνοντας, για παράδειγμα, τις δύο τελευταίες κλάσεις, οι οποίες είναι και αυτές που μας «προβληματίζουν». Αυτό θα μας οδηγήσει σε 7 κλάσεις, με την τελευταία να αναφέρεται σε τιμές 7 και με παρατηρούμενη συχνότητα ίση με 1+3=4 και αντίστοιχη αναμενόμενη συχνότητα ίση με = Η ελεγχοσυνάρτησή μας τώρα, θα είναι η T 7 i1 (Oi E i ) E i ~ χ 711 χ και η κρίσιμη περιοχή του ελέγχου θα ορίζεται από την ανισότητα T χ 5, Η τιμή τ της ελεγχοσυνάρτησης Τ προκύπτει ίση με Η προσέγγιση της τιμής του κρίσιμου επιπέδου του ελέγχου δεν διαφέρει πολύ από αυτή που είχαμε πριν από τον επανακαθορισμό των κλάσεων. Συγκεκριμένα, αˆ P(T 4.38 H ) 1 P(χ 4.38) Λύση με το ΜΙΝΙΤΑΒ: Ο έλεγχος χ δεν παρέχεται απ ευθείας από το MINITAB. Ο χρήστης πρέπει να διεξαγάγει την απαιτούμενη διαδικασία «χειροκίνητα» με το πρόγραμμα να τον βοηθάει μόνο στους υπολογισμούς. Καταρχήν, υπολογίζονται οι πιθανότητες των κλάσεων κάτω από την Η 0. Σε μία στήλη (π.χ. C), καταχωρίζουμε τα άνω όρια όλων των κλάσεων εκτός από την τελευταία. Στην μεταβλητή αυτή δίνουμε το όνομα d. Αν υπολογίσουμε τις τιμές της συνάρτησης κατανομής της Poisson με λ=4 (εκτίμηση από το δείγμα) στα σημεία αυτά, η πιθανότητα της πρώτης κλάσης θα είναι η τιμή συνάρτησης κατανομής στο πρώτο άνω όριο, η πιθανότητα της δεύτερης κλάσης θα είναι η διαφορά της τιμής στο πρώτο όριο από αυτή του δευτέρου ορίου, κ.ο.κ. 398

11 Η πιθανότητα της τελευταίας κλάσης θα προκύψει με αφαίρεση του αθροίσματος των πιθανοτήτων όλων των προηγουμένων κλάσεων από την μονάδα. Για να υπολογίσουμε την τιμή της συνάρτησης κατανομής στα σημεία της d, επιλέγουμε Calc, Probability Distributions, Poisson και οδηγούμεθα στο εξής πλαίσιο διαλόγου: Για τον υπολογισμό της αθροιστικής συνάρτησης κατανομής, επιλέγουμε Cumulative probability. Στο πεδίο Mean, δηλώνουμε 4. Στο πεδίο Input column, δίνουμε το όνομα της στήλης που περιέχει τις τιμές στις οποίες θα υπολογισθεί η συνάρτηση κατανομής και, στο πεδίο Optional storage, δηλώνουμε την στήλη στην οποία θα καταχωρισθούν τα αποτελέσματα των υπολογισμών. Μετά τον υπολογισμό, το παράθυρο δεδομένων δείχνει ως εξής: 399

12 Σημείωση: Για να εκτιμήσουμε την παράμετρο λ, καταχωρίζουμε το δείγμα σε μία στήλη (έστω C1) με όνομα x και επιλέγουμε Stat, Basic Statistics, Display Descriptive Statistics. Στην στήλη C4, με το όνομα p, καταχωρίζουμε τις πιθανότητες των κλάσεων και, σε μία στήλη (έστω C5), με όνομα o, καταχωρίζουμε τις παρατηρούμενες συχνότητες O i των κλάσεων. Επίσης, δημιουργούμε μία στήλη (έστω C6), με όνομα e, η οποία θα περιέχει τις αναμενόμενες συχνότητες E i. Αυτό γίνεται από το πλαίσιο διαλόγου Calc, Calculator (βλέπε προηγούμενο παράδειγμα) πληκτρολογώντας c4*5 στο πεδίο Numeric Expression. Για τον υπολογισμό της τιμής της ελεγχοσυνάρτησης Τ επιλέγουμε Calc, Calculator και αποθηκεύουμε στην στήλη C7 το αποτέλεσμα της εντολής sum((o-e)**/e) του πεδίου Numeric Expression. Η τιμή που προκύπτει για την Τ είναι τ==5.58. Για τον υπολογισμό του κρίσιμου επιπέδου, υπολογίζουμε την τιμή της αθροιστικής συνάρτησης κατανομής της χ με 6 βαθμούς ελευθερίας στο σημείο 5.58 και την αφαιρούμε από την μονάδα. Η προκύπτουσα 400

13 τιμή για το κρίσιμο επίπεδο (0.51) αποτελεί ένδειξη ότι η Η 0 μπορεί να θεωρηθεί εύλογη. Λύση με το SPSS: Ο έλεγχος χ δεν εκτελείται από το πακέτο SPSS αυτόματα και χωρίς κάποια προεργασία από την πλευρά του χρήστη. Για την διεξαγωγή του ελέγχου, απαιτείται ο ορισμός μιας μεταβλητής με τιμές τις παρατηρήσεις του δείγματος σε κωδικοποιημένη μορφή. Η κάθε τιμή της μεταβλητής αυτής θα δηλώνει σε ποια κλάση ανήκει η αντίστοιχη παρατήρηση του δείγματος. Τα δεδομένα του παραδείγματός μας είναι ήδη ταξινομημένα σε κλάσεις και κατά συνέπεια η εισαγωγή τους στο SPSS δεν χρειάζεται καμία προκαταρκτική επεξεργασία. Στην κάθε κλάση, αντιστοιχίζουμε μία κωδική τιμή. Στην πρώτη κλάση δίνουμε την τιμή 1, στη δεύτερη την τιμή, κ.ο.κ. Δημιουργούμε την μεταβλητή c και καταχωρίζουμε τις παρατηρήσεις του δείγματος κωδικοποιημένες. Δίνουμε, δηλαδή, 4 φορές την τιμή 1 (αφού στην πρώτη κλάση υπάρχουν τέσσερις παρατηρήσεις), 9 φορές την τιμή και συνεχίζουμε με όμοιο τρόπο για όλες τις κλάσεις. Το SPSS, εξετάζοντας την μεταβλητή c, θα υπολογίσει μόνο του τις παρατηρούμενες συχνότητες O i. Χρειάζεται, όμως, να δηλώσουμε τις αναμενόμενες συχνότητες E i τις οποίες θα πρέπει να υπολογίσουμε. Ο τρόπος υπολογισμού είναι ο ίδιος είτε η παρατηρούμενη μεταβλητή είναι διακριτή (όπως εδώ), είτε είναι συνεχής. Δημιουργούμε μία μεταβλητή (έστω y) η οποία περιέχει ώς τιμές τα άνω όρια όλων των κλάσεων εκτός από την τελευταία. Στο δικό μας παράδειγμα, όλες οι κλάσεις, εκτός από την πρώτη και την τελευταία, αποτελούνται από μία μόνο τιμή η οποία είναι και το άνω τους όριο ταυτόχρονα. Στην συνέχεια, υπολογίζουμε την τιμή της αθροιστικής συνάρτησης 401

14 κατανομής F 0 (.) στα σημεία της y. Η τιμή που αντιστοιχεί στο πρώτο άνω όριο είναι η πιθανότητα, κάτω από την Η 0, να «πάρουμε» μια παρατήρηση μέσα στην πρώτη κλάση. Για να βρούμε την αντίστοιχη πιθανότητα για κάθε άλλη κλάση, αφαιρούμε από την τιμή της F 0 (.) που αντιστοιχεί στο άνω όριό της την αντίστοιχη τιμή της στο άνω όριο της προηγούμενης κλάσης. Για να υπολογίσουμε τις τιμές της F 0 (.), επιλέγουμε Transform, Compute και οδηγούμεθα στο εξής πλαίσιο διαλόγου: Στο πεδίο Target Variable, δίνουμε το όνομα μιας μεταβλητής που θα περιέχει τις τιμές της F 0 (x). Στο πεδίο Numeric Expression έχουμε δώσει μία έκφραση μέσω της οποία δίνεται η εντολή για τον υπολογισμό της συνάρτησης κατανομής της Poisson με λ=4 για κάθε σημείο y. Τα αποτελέσματα του υπολογισμού φαίνονται στον επόμενο πίνακα: 40

15 Στον παραπάνω πίνακα, η στήλη p, περιέχει τις τιμές της αθροιστικής συνάρτησης κατανομής της Poisson(λ=4) για κάθε τιμή της y. Η τελευταία περιέχει τα άνω όρια των κλάσεων εκτός από την τελευταία που εχει άνω όριο το άπειρο. Στην στήλη p1 έχουμε καταχωρίσει τις πιθανότητες όλων των κλάσεων. Σημείωση: Η τιμή λ=4 είναι η εκτίμηση του λ που προκύπτει από το δείγμα, δηλαδή από τον αριθμητικό μέσο του δείγματος που είναι εύκολο να υπολογισθεί από την επιλογή Analyze, Descriptive Statistics, Descriptives. Για την διεξαγωγή του ελέγχου χ, επιλέγουμε Analyze, Nonparametric Tests, Chi-Square και οδηγούμεθα στο εξής πλαίσιο διαλόγου: 403

16 Στο πεδίο Test Variable List, δίνουμε c. Στο πλαίσιο Expected Range, επιλέγουμε Get from data. Έτσι, το πρόγραμμα θεωρεί ότι οι κωδικοί των κλάσεων μπορούν να πάρουν οποιαδήποτε ακέραιη τιμή μεταξύ της μικρότερης και της μεγαλύτερης από τις τιμές της c. Αν υπήρχαν και άλλες κλάσεις που δεν φαίνονταν στην c (επειδή καμμία τιμή του δείγματος δεν ανήκε σε αυτές), θα επιλέγαμε Use specified range και θα δίναμε το εύρος τιμών των κωδικών. Τότε, το πρόγραμμα θα γνώριζε ότι υπάρχουν κι άλλες κλάσεις με παρατηρούμενη συχνότητα μηδέν. Στο πλαίσιο Expected Values, δηλώνουμε την θεωρητική πιθανότητα κάθε κλάσης, κάτω από την Η 0. Επειδή οι κλάσεις δεν είναι ισοπίθανες, κάνουμε το εξής: Εκφράζουμε τις πιθανότητές τους ως κλάσματα ακεραίων με τον ίδιο παρονομαστή, τα οποία αθροίζουν στη μονάδα (π.χ. 3/10,4/10,1/10,1/10,1/10). Πρέπει να έχουμε τόσα κλάσματα όσες και οι κλάσεις. Μετά δηλώνουμε μόνο τους αριθμητές. Στο δικό μας παράδειγμα δίνουμε 916, 1465, 1954, 1953, 1563, 104, 596, 511 (δηλαδή, τις τιμές της p1 πολλαπλασιασμένες επί για 404

17 να γίνουν ακέραιοι). Η κάθε τιμή δίνεται με επιλογή Values, πληκτρολόγηση στο ενεργοποιούμενο πεδίο και πίεση του Add. Όταν τελειώσουμε, πιέζουμε ΟΚ. Αν εισαγάγουμε λάθος τιμή, μπορούμε να την διορθώσουμε (με επιλογή της, πληκτρολόγηση νέας τιμής και Change) ή να την διαγράψουμε (με επιλογή της και remove). Τα αποτελέσματα του ελέγχου για το παράδειγμά μας έχουν την μορφή: C Observed Expected Residual N N Total 5 Test Statistics C Chi-Square a 5.58 df 7 Asymp. Sig..68 a 3 cells (37.5%) have expected frequencies less than 5. The minimum expected cell frequency is.7. Στον πίνακα συχνοτήτων, βλέπουμε ότι το SPSS έχει υπολογίσει τα O i και E i για κάθε κλάση. Η τιμή της ελεγχοσυνάρτησης Τ είναι 5.58 (γραμμή Chi-Square του πίνακα Test Statistics), αλλά οι βαθμοί ελευθερίας (df) και το κρίσιμο επίπεδο (Asymp. Sig.) αναφέρονται στην περίπτωση που όλες οι παράμετροι της F 0 είναι γνωστές (το SPSS δεν γνωρίζει ότι εμείς εκτιμήσαμε μία παράμετρο από τα δεδομένα του δείγματος). Το κρίσιμο επίπεδο θα το υπολογίσουμε με την βοήθεια του SPSS από το μενού Transform, Compute και την συνάρτηση 405

18 CDF.CHISQ. Ο σωστός αριθμός των βαθμών ελευθερίας είναι 6 και η τιμή του κρίσιμου επιπέδου είναι Συνεπώς, η υπόθεση ότι τα δεδομένα προέρχονται από μια κατανομή Poisson μπορεί να θεωρηθεί εύλογη. Παρατηρούμε ότι το πρόγραμμα προειδοποιεί, σε υποσημείωση που ακολουθεί τον πίνακα συχνοτήτων, ότι τουλάχιστον 0% των κλάσεων έχουν αναμενόμενη συχνότητα μικρότερη του 5. Αν θέλουμε να προχωρήσουμε σε επανακαθορισμό των κλάσεων συνενώνοντας την έβδομη με την όγδοη κλάση, εργαζόμαστε ως εξής: Στην μεταβλητή c, αντικαθιστούμε τον κωδικό 8 με τον κωδικό 7, αφού τώρα έχουμε 7 κλάσεις και η νέα έβδομη θα περιλαμβάνει την αρχική έβδομη και αρχική όγδοη κλάση. Στο πλαίσιο διαλόγου του ελέγχου, θα πρέπει να διαγράψουμε από το πεδίο Expected Values την τιμή 511 (πιθανότητα της αρχικής όγδοης κλάσης) και να αντικαταστήσουμε την τιμή 596 με την τιμή 1107 (άθροισμα των τιμών 596 και 511, δηλαδή την πιθανότητα της νέας έβδομης κλάσης). Λύση με το SΑS: Το παράδειγμα δεν επιλύεται αυτόματα με το SAS. Μπορεί όμως να επιλυθεί χρησιμοποιώντας τις εντολές που ακολουθούν. data poisson; input x n=_n_; prob=pdf('poisson',x,4); F=CDF('Poisson',x,4); if n=1 then prob=f; if n=8 then prob=1-cdf('poisson',7,4); expected=prob*5; deviat=((freq-expected)**)/expected; cards; ; run; proc print; run; proc means sum; var deviat; run; 406

19 Στα παραπάνω, η εντολή prob=pdf('poisson',x,4); δημιουργεί την μεταβλητή prob η οποία περιέχει τις τιμές p 0 i =P(X Poisson(λ) =i), i=,3,,7. Για τις τιμές p 0 1 και p 0 8, χρησιμοποιούνται αντίστοιχα οι σχέσεις P(X Poisson(λ) 1) και P(X Poisson(λ) 7), πράγμα το οποίο επιτυγχάνεται με τις εντολές F=CDF('Poisson',x,4); if n=1 then prob=f; if n=8 then prob=1-cdf('poisson',7,4); Στην συνέχεια, υπολογίζονται οι αναμενόμενες συχνότητες, κάτω από την μηδενική υπόθεση με την εντολή expected=prob*5;, καθώς και οι ποσότητες (Ο i -E i ) /E i, οι οποίες αποθηκεύονται στην μεταβλητή deviat με την εντολή deviat=((freq-expected)**)/expected;. Τέλος, το άθροισμα των τιμών αυτών, που είναι και η τιμή της ελεγχοσυνάρτησης, προκύπτει με τις εντολές proc means sum; var deviat; run; Το αποτέλεσμα της διαδικασίας αυτής δίδεται στον πίνακα που ακολουθεί. OBS X FREQ N PROB F EXPECTED DEVIAT Analysis Variable : DEVIAT Sum Η τιμή είναι η τιμή της ελεγχοσυνάρτησης. 407

20 Παράδειγμα 4.1.: Ας υποθέσουμε ότι η ημερήσια παραγωγή γάλακτος ενός αγελαδοτρόφου (σε λίτρα) για ένα τυχαίο δείγμα 40 ημερών συνοψίζεται στον πίνακα που ακολουθεί: Αν Χ συμβολίζει την ημερήσια παραγωγή γάλακτος, να ελεγχθεί η υπόθεση Η 0 : F N(μ,σ ) σε επίπεδο σημαντικότητας α=1%. είναι η εξής: F X (x) = (x), για κάθε x + Η γενική μεθοδολογία που προτιμάται στην συνεχή περίπτωση Εστω ότι έχουμε n παρατηρήσεις. Χωρίζουμε το διάστημα τιμών της τυχαίας μεταβλητής Χ σε n υποδιαστήματα (συνήθως όχι λιγότερα από 5), έτσι ώστε: 0 p i = P(η Χ να ανήκει στο i υποδιάστημα) = 1/n. Eστω x i το i-ποσοστιαίο σημείο της Ν(μ,σ ). Τότε, επειδή P(Xx i ) = i, και κατά συνέπεια, P(X x i/n ) = i/n, ισχύει ότι 408

21 x i/n μ P Z i/n, i = 1,,..., n-1, σ όπου Ζ συμβολίζει μια τυποποιημένη κανονική μεταβλητή. Τότε, (x i/n - μ)/σ = z i/n, όπου z i/n είναι το (i/n)-ποσοστιαίο σημείο της τυποποιημένης κανονικής κατανομής και, επομένως, x i/n = μ + σ z i/n. Αν οι παράμετροι μ και σ είναι άγνωστες, η τιμή x i/n εκτιμάται από την στατιστική συνάρτηση X * i/n * X s z * X s z 1/n 1/n,, αν αν i/n 0.5 i/n 0.5, * όπου X και s είναι οι αμερόληπτες εκτιμήσεις των παραμέτρων μ και σ. Επομένως, μπορούμε να θεωρήσουμε κλάσεις της μορφής * * [X (i 1) / n, X i / n ), i 1,,..., n +1, όπου * X 0 και * X (n 1) / n και + αντίστοιχα. Τότε, προκύπτει ο εξής πίνακας: ορίζονται ίσα με 0 Κλάση i Ο i p i E n' 0 i p i (, * x 1/n ) Ο 1 1/n n /n [ * * x 1/n, x /n ) Ο 1/n n /n [ * * x /n, x 3/n )... * [ x, +) (n 1)/n Ο 3... Ο n 1/n... 1/n n /n... n /n 409

22 Εστω τώρα ότι στο συγκεκριμένο παράδειγμα αποφασίζουμε να ταξινομήσουμε τις παρατηρήσεις σε n = 8 κλάσεις, δηλαδή σε 8 υποδιαστήματα τέτοια ώστε 0 p i = P( Χ στο i υποδιάστημα H 0 ) = 1/ Από τα δεδομένα, προκύπτει ότι x =15.96, s * =.144. Επομένως, έχουμε για το πάνω άκρο της πρώτης κλάσης ότι * x 1/8 = * x 0.15 = z = Με όμοιο τρόπο υπολογίζουμε τα άκρα των υπόλοιπων κλάσεων: * x / * * * * * x X s z 14.5, x X s z 15.7, * x 4/ x 3/ * * * * * x X s z 15.96, x X s z 16.65, * x 6/ x 5/ * * * * * x X s z 17.40, x X s z 18.43, x 7/ Καταλήγουμε, επομένως, στον πίνακα που δίνεται στην συνέχεια. Οπως φαίνεται στον πίνακα αυτό, Ε i =5, i = 1,,..., 8. Άρα T (O 5) 8 i ~ χ 81. i1 5 Η κρίσιμη περιοχή του ελέγχου μεγέθους 1% ορίζεται, επομένως, από την ανισότητα Τ χ 5,0.99 = Η παρατηρούμενη τιμή της Τ είναι 8.4. Άρα η μηδενική υπόθεση δεν απορρίπτεται σε επίπεδο σημαντικότητας 1%, δηλαδή, η κατανομή της ημερήσιας παραγωγής γάλακτος του συγκεκριμένου αγελαδοτρόφου δεν φαίνεται να διαφέρει στατιστικά σημαντικά από την κανονική κατανομή σε επίπεδο σημαντικότητας 1%. 410

23 0 Κλάση i Ο i p i (, 13.49) [13.49, 14.5) [14.5, 15.7) [15.7, 15.96) [15.96, 16.65) [16.65, 17.40) [17.40, 18.43) [18.43, +) E i = 40 p 0 i Λύση με το ΜΙΝΙΤΑΒ: Η διαδικασία διεξαγωγής του ελέγχου χ είναι, όπως και στο προηγούμενο παράδειγμα, χρονοβόρα. Καταρχήν, καταχωρίζουμε το δείγμα στην στήλη C1 με όνομα x. Από το πλαίσιο Stat, Basic Statistics, Display Descriptive Statistics παίρνουμε τα εξής αποτελέσματα: Descriptive Statistics Variable N Mean Median TrMean StDev SE Mean x Variable Minimum Maximum Q1 Q3 x Στην συνέχεια, θα χρειασθούμε τις τιμές του μέσου και της τυπικής απόκλισης καθώς και την μικρότερη και μεγαλύτερη τιμή του δείγματος. 411

24 Στην στήλη C, καταχωρίζουμε τις τιμές 0.15, 0.5,..., για να υπολογίσουμε τα αντίστοιχα ποσοστιαία σημεία της κανονικής κατανομής με μέση τιμή τον μέσο του δείγματος και τυπική απόκλιση την τυπική απόκλιση του δείγματος. Ο υπολογισμός γίνεται από το πλαίσιο Calc, Probability Distributions, Normal (αφήνεται στον αναγνώστη ως άσκηση). Τα αποτελέσματα καταχωρίζονται σε μία στήλη (έστω C3) με όνομα d και αποτελούν τα άνω όρια των κλάσεων στις οποίες θα ταξινομηθούν τα δεδομένα. Λείπουν μόνο το κάτω όριο της πρώτης κλάσης και το άνω της τελευταίας. Για τον λόγο αυτό, στην κορυφή της στήλης, δηλώνουμε μία τιμή μικρότερη από την μικρότερη τιμή του δείγματος και, στο τέλος της στήλης, να δηλώσουμε μία τιμή μεγαλύτερη από την μεγαλύτερη τιμή του δείγματος. Το παράθυρο των δεδομένων θα δείχνει ως εξής: Για να υπολογίσουμε τις παρατηρούμενες συχνότητες, κωδικοποιούμε τις παρατηρήσεις του δείγματος. Ο κωδικός κάθε παρατήρησης δείχνει σε ποια κλάση ανήκει η παρατήρηση. Για την κωδικοποίηση, επιλέγουμε Manip, Code, Numeric to Numeric και οδηγούμεθα στο εξής πλαίσιο διαλόγου: 41

25 Στο πεδίο Code data from columns, δηλώνουμε την στήλη που περιέχει τα αταξινόμητα δεδομένα. Στο πεδίο Into columns, δηλώνουμε την στήλη στην οποία θα καταχωρισθούν οι κωδικοποιημένες παρατηρήσεις του δείγματος. Στα πεδία Original values και New, δηλώνουμε τα όρια των κλάσεων και τους κωδικούς που αντιστοιχούν σε κάθε μία. Μόλις δημιουργηθεί η κωδικοποιημένη μεταβλητή, επιλέγουμε Stat, Tables, Tally οπότε προκύπτει το ακόλουθο πλαίσιο διαλόγου: 413

26 Στο πεδίο Variables, δηλώνουμε την μεταβλητή με τους κωδικούς και, στο πεδίο Display, επιλέγουμε Counts ώστε να υπολογισθεί ο αριθμός των εμφανίσεων κάθε κωδικού, δηλαδή η συχνότητα κάθε κλάσης. Τα αποτελέσματα που παίρνουμε έχουν την μορφή: Summary Statistics for Discrete Variables c Count N= 40 Ακολουθεί η καταχώριση αυτών των παρατηρούμενων συχνοτήτων, σε μία στήλη και των αναμενόμενων συχνοτήτων (που είναι όλες ίσες με 5) σε μία άλλη στήλη και, ο υπολογισμός της τιμής της 414

27 ελεγχοσυνάρτησης Τ. Αυτή προκύπτει ίση με 8.4. Η τιμή του κρίσιμου επιπέδου είναι Κατά συνέπεια, η μηδενική υπόθεση μπορεί να θεωρηθεί εύλογη σε όλα τα συνήθη επίπεδα σημαντικότητας. Λύση με το SPSS: Επειδή οι παρατηρήσεις του δείγματος δεν είναι ταξινομημένες, η διαδικασία θα πρέπει να ξεκινήσει με τον ορισμό κατάλληλων κλάσεων και των κωδικών τιμών τους. Για την αποφυγή σύγχυσης, καλό είναι η αύξουσα σειρά των κωδικών να αντιστοιχεί στην διάταξη των κλάσεων, δηλαδή ο μικρότερος κωδικός στην πρώτη κλάση, ο αμέσως μεγαλύτερος στη δεύτερη κ.ο.κ. Όπως έχει αποφασισθεί, ο αριθμός των κλάσεων στις οποίες θα ταξινομηθούν τα δεδομένα του παραδείγματος είναι 8 ισοπίθανα διαστήματα τιμών κάτω από την κανονική κατανομή, με μέση τιμή και διακύμανση τις αντίστοιχες εκτιμήσεις από το δείγμα. Για τον υπολογισμό των ορίων των κλάσεων, πρέπει να γίνουν τα εξής: Να υπολογισθεί ο μέσος x και η τυπική απόκλιση s του δείγματος Να υπολογισθούν τα 0.15,0.5,0.375,...,0.875 ποσοστιαία σημεία της Ν( x, s ) κατανομής. Ας υποθέσουμε ότι το δείγμα έχει εισαχθεί στην μεταβλητή x. Με Analyze, Descriptive Statistics, Descriptives, υπολογίζουμε τις τιμές x και s οι οποίες προκύπτουν ίσες με και.1376, αντίστοιχα. Κατόπιν, σε μία μεταβλητή (έστω p) καταχωρίζουμε τις τιμές 0.15, 0.5, 0.375, 0.5, 0.65, 0.75, που δηλώνουν τα ποσοστιαία σημεία τα οποία θέλουμε να υπολογίσουμε. Προκειμένου να ζητήσουμε από το SPSS να αποθηκεύσει σε μια άλλη μεταβλητή (έστω y) τα εν λόγω ποσοστιαία σημεία, επιλέγουμε Transform, Compute και οδηγούμεθα στο εξής πλαίσιο διαλόγου 415

28 Στο πεδίο Target Variable, δίνουμε το όνομα της μεταβλητής στην οποία θα αποθηκευθούν τα ποσοστιαία σημεία. Στο πεδίο Numeric Expression, «δίνουμε» στο SPSS την εντολή να υπολογίσει τα ποσοστιαία σημεία της κανονικής κατανομής με μέση τιμή και τυπική απόκλιση.1376, για τις πιθανότητες που βρίσκονται στην μεταβλητή p και να τις αποθηκεύσει στην μεταβλητή y. Μετά από αυτή την διαδικασία το φύλλο δεδομένων δείχνει ως εξής: Το επόμενο βήμα είναι να δημιουργήσουμε την κωδική μεταβλητή που θα δηλώνει σε ποια κλάση ανήκει κάθε παρατήρηση της x. 416

29 Επιλέγοντας Transform, Recode, Into Different Variables, εμφανίζεται το εξής πλαίσιο διαλόγου: Επιλέγουμε την x και την στέλνουμε στο πεδίο Numeric Variable Output Variable. Αμέσως ενεργοποιείται το πλαίσιο Output Variable, στο πεδίο Name του οποίου δίνουμε το όνομα που θέλουμε να έχει η κωδική μεταβλητή (έστω z). Τότε, ενεργοποιείται το πλήκτρο Change, το οποίο πιέζουμε. Στην συνέχεια, πρέπει να δηλώσουμε στο SPSS ποιες είναι οι κωδικές τιμές και πώς θα γίνει η κωδικοποίηση. Πιέζοντας Old and New Values, προκύπτει το εξής πλαίσιο διαλόγου 417

30 Εδώ δηλώνονται οι τιμές της αρχικής μεταβλητής στο πλαίσιο Old Value και οι αντίστοιχοι κωδικοί στο πλαίσιο New Value. Για το δικό μας παράδειγμα, στο Old Value πρέπει να δίνουμε το εύρος τιμών του δείγματος στο οποίο αντιστοιχεί κάθε κωδικός. Για την πρώτη κλάση (που περιέχει τις τιμές που είναι μικρότερες του 13.5), επιλέγουμε Range (με την υποσημείωση Lowest through) και, στο πλαίσιο που ενεργοποιείται, δίνουμε Στο πλαίσιο New Value, επιλέγουμε Value και δίνουμε 1. Μετά, πιέζουμε το πλήκτρο Add που έχει στο μεταξύ ενεργοποιηθεί και το ζεύγος εύρους τιμών και κωδικού εμφανίζεται στο πεδίο Old New. Εργαζόμενοι με όμοιο τρόπο, εισάγουμε τις υπόλοιπες κλάσεις [13.5,14.51), [14.51,15.7), [15.7,15.96), [15.96,16.64), [16.64,17.4), [17.4,18.41), [τιμές μεγαλύτερες του 18.41) κωδικούς από το έως το 8 και, εργαζόμενοι με όμοιο τρόπο, τις εισάγουμε στο πεδίο Old New. Εν συνεχεία, επιλέγουμε Analyze, Nonparametric Tests, Chi-Square και οδηγούμεθα στο εξής πλαίσιο διαλόγου: 418

31 Στο πεδίο Test Variable List, δίνουμε z. Στο πλαίσιο Expected Range, επιλέγουμε Get from data. Στο πλαίσιο Expected Values, επιλέγουμε All categories equal (αφού οι κλάσεις είναι ισοπίθανες κάτω από την Η 0 ) και πιέζουμε ΟΚ. Τα αποτελέσματα δίνονται με την εξής μορφή: Z Observed N Expected N Residual Total 40 Test Statistics Z Chi-Square a df 7 Asymp. Sig..99 a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is

32 Κι εδώ πρέπει να υπολογίσουμε μόνοι μας την τιμή του κρίσιμου επιπέδου δεδομένου ότι οι βαθμοί ελευθερίας που χρησιμοποιεί το SPSS αντιστοιχούν σε πλήρως καθορισμένη κατανομή. Ο σωστός αριθμός των βαθμών ελευθερίας είναι 5 και το κρίσιμο επίπεδο που αντιστοιχεί στην τιμή τ=8.4 της Τ είναι Κατά συνέπεια, η υπόθεση ότι τα δεδομένα προέρχονται από μία κανονική κατανομή μπορεί να θεωρηθεί εύλογη σε όλα τα συνήθη επίπεδα σημαντικότητας. Λύση με το SΑS: Για την διεξαγωγή του ελέγχου απαιτείται υπολογισμός των ορίων των 8 κλάσεων στις οποίες θα ταξινομήσουμε τις παρατηρήσεις. Εύκολα διαπιστώνεται ότι ο μέσος της υπό εξέταση μεταβλητής είναι και η τυπική απόκλιση Χρησιμοποιώντας τις εντολές data milkpre; input x=(probit(percen)*.1376) ; cards; ; run; proc print; run; παίρνουμε τα όρια των κλάσεων, αποθηκευμένα στην μεταβλητή x. Η εντολή probit δίδει τα σημεία z i, της τυποποιημένης κανονικής κατανομής, όπου i=0.15, 0.5, Το αποτέλεσμα αυτής της διαδικασίας έχει την μορφή: OBS PERCEN X Στην συνέχεια, μπορούμε να ταξινομήσουμε τις παρατηρήσεις μας στις 8 κλάσεις και να διεξαγάγουμε τον έλεγχο χ με τις εξής εντολές. 40

33 data milk; input if x<13.5 then code=1; if x>13.5 and x<=14.51 then code=; if x>14.51 and x<=15.7 then code=3; if x>15.7 and x<=15.96 then code=4; if x>15.96 and x<=16.64 then code=5; if x>16.64 and x<=17.4 then code=6; if x>17.4 and x<=18.41 then code=7; if x>18.41 then code=8; cards; ; run; proc print; run; proc freq; tables code / chisq; run; Το αποτέλεσμα του ελέγχου έχει την μορφή: Cumulative Cumulative CODE Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square Test for Equal Proportions Statistic = DF = 7 Prob = 0.99 Η τιμή της ελεγχοσυνάρτησης είναι 8.4. Οπως και στην λύση του SPSS, πρέπει να υπολογίσουμε μόνοι μας την τιμή του κρίσιμου επιπέδου δεδομένου ότι οι βαθμοί ελευθερίας που χρησιμοποιεί το SAS αντιστοιχούν σε πλήρως καθορισμένη κατανομή. Ο σωστός αριθμός των βαθμών ελευθερίας είναι 5 και το κρίσιμο επίπεδο που αντιστοιχεί στην τιμή τ=8.4 της Τ είναι

34 4. Ο ΕΛΕΓΧΟΣ ΚΟLMOGOROV (Kolmogorov Test) Ο έλεγχος αυτός είναι ίσως ο πιο χρήσιμος από τους ελέγχους καλής προσαρμογής, εν μέρει λόγω του ότι μας εφοδιάζει με μία εναλλακτική μέθοδο η οποία είναι σχεδιασμένη για διατεταγμένα δεδομένα (σε αντίθεση με τον έλεγχο χ ο οποίος είναι σχεδιασμένος για δεδομένα σε ονομαστική κλίμακα) και, εν μέρει επειδή ο έλεγχος Kolmogorov στηρίζεται σε μια στατιστική συνάρτηση που δίνει την δυνατότητα ορισμού μιας ζώνης εμπιστοσύνης (confidence band) για την άγνωστη κατανομή, όπως θα δούμε αργότερα σε αυτό το κεφάλαιο. Ας θεωρήσουμε το εξής πρόβλημα: Εστω ότι έχουμε είκοσι τεμάχια νήματος μήκους ακριβώς έξι εκατοστών το καθένα. Το ένα από το δύο άκρα των νημάτων αυτών είναι στερεωμένο, ενώ στο άλλο άκρο εφαρμόζεται μία δύναμη μέχρι τα νήματα αυτά να κοπούν. Εάν το τεμάχιο του νήματος πάντοτε κόβεται στο ασθενέστερο σημείο του και το σημείο αυτό είναι εξίσου πιθανό να βρίσκεται οπουδήποτε κατά μήκος του τεμαχίου, τότε το σημείο θραύσης θα κατανέμεται ομοιόμορφα στο διάστημα (0,6), όπου η απόσταση μέχρι το σημείο θραύσης μετριέται σε εκατοστόμετρα από το στερεωμένο άκρο του νήματος. Τότε, η συνάρτηση πυκνότητας πιθανότητας της απόστασης Χ του σημείου θραύσης των νημάτων από το στερεωμένο άκρο τους, έχει την μορφή f x 0, x 0 1 6, 0 x 6 0, x 6 4

35 Το σχήμα 4..1 απεικονίζει την παραπάνω συνάρτηση πυκνότητας πιθανότητας Σχήμα 4..1 Συνάρτηση πυκνότητας πιθανότητας της ομοιόμορφης κατανομής στο διάστημα (0,6) Ο έλεγχος Kolmogorov δεν χρησιμοποιεί την συνάρτηση πυκνότητας πιθανότητας, αλλά την αντίστοιχη αθροιστική συνάρτηση κατανομής F(x) = P(X x), για κάθε x στο διάστημα (0,6). Η συνάρτηση αυτή απεικονίζεται στο σχήμα

36 Σχήμα 4.. Αθροιστική συνάρτηση κατανομής της ομοιόμορφης κατανομής στο διάστημα (0,6) Για να ελεγχθεί η υπόθεση ότι οι 0 παρατηρήσεις που έχουμε αποτελούν ένα δείγμα από την ομοιόμορφη κατανομή στο διάστημα (0,6), θα πρέπει οι παρατηρήσεις αυτές να συγκριθούν, με κάποια έννοια, με την F(x). Ενας λογικός τρόπος σύγκρισης του τυχαίου δείγματος που έχουμε με την F(x) είναι μέσω της εμπειρικής συνάρτησης κατανομής S(x), η οποία, από τον ορισμό της, είναι το ποσοστό των παρατηρήσεων του δείγματος οι οποίες είναι το πολύ ίσες με την τιμή x, για κάθε x στο διάστημα (, + ). Γενικότερα, δηλαδή, ο έλεγχος Kolmogorov συγκρίνει μία αθροιστική συνάρτηση κατανομής F(x) με την αντίστοιχη εμπειρική συνάρτηση κατανομής S(x) βασισμένη σε ένα δείγμα n παρατηρήσεων, όπου βέβαια 44

37 S(x) = αριθμός τιμών του δειγματος που n ειναι το πολύ ίσες με x. Εάν οι δύο αυτές συναρτήσεις δεν συμφωνούν σε ικανοποιητικό βαθμό, τότε θα μπορούσαμε να απορρίψουμε την μηδενική υπόθεση και να συμπεράνουμε ότι η πραγματική, αλλά άγνωστη συνάρτηση κατανομής F(x) δεν ορίζεται από την μηδενική υπόθεση. Αλλά ποιά ελεγχοσυνάρτηση θα μπορούσαμε να χρησιμοποιήσουμε ως ένα μέτρο της εγγύτητας μεταξύ της S(x) και της F(x); Ένα από τα απλούστερα μέτρα που θα μπορούσε να θεωρήσει κανείς είναι η μέγιστη κατακόρυφη απόσταση μεταξύ του γραφήματος της S(x) και αυτού της F(x). Αυτή πράγματι ήταν και η στατιστική συνάρτηση που προτάθηκε από τον Kolmogorov το Η μεθοδολογία που ο Kolmogorov εισήγαγε μπορεί ευκολότερα να κατανοηθεί γραφικά στο πλαίσιο του προηγούμενου προβλήματος: Παράδειγμα 4..1: Ας υποθέσουμε ότι οι αποστάσεις του σημείου θραύσης των 0 νημάτων είναι οι εξής: (Για ευκολία οι αποστάσεις έχουν διαταχθεί κατά αύξουσα σειρά μεγέθους). Για τον έλεγχο της υπόθεσης ότι η απόσταση του σημείου θραύσης από το στερεωμένο σημείο κατανέμεται ομοιόμορφα στο 45

38 διάστημα (0,6), θα πρέπει να προσδιορισθεί η κλιμακωτή συνάρτηση S(x): Οταν x 0.6 τότε S(x)=0. Στην τιμή 0.6 η συνάρτηση αυτή παρουσιάζει άλμα, οπότε παίρνει την τιμή 1/0=0.05, την οποία διατηρεί μέχρις ότου το x πάρει την τιμή 0.8, οπότε πηδά στην τιμή Παρουσιάζει, δηλαδή, άλματα μεγέθους 0.05 σε κάθε σημείο θραύσης των νημάτων μέχρις ότου το x πάρει τη τιμή 3.4, οπότε η S(x) αυξάνει κατά 0.10, επειδή δύο θραύσεις παρατηρούνται στην τιμή x=3.4. Ο πίνακας που ακολουθεί παρουσιάζει την S(x) για κάθε x στο διάστημα (, + ). S(x) για κάθε x στο διάστημα S(x) για κάθε x στο διάστημα 0.00 x x x x x x x x x x x x x x x x x x x x + Η γραφική παράσταση της εμπειρικής συνάρτησης κατανομής δίνεται στο σχήμα

39 Σχήμα 4..3 Εμπειρική συνάρτηση κατανομής των σημείων θραύσης των νημάτων Η θεμελιώδης ιδέα του ελέγχου Kolmogorov είναι ότι η εμπειρική συνάρτηση κατανομής, ως εκτιμήτρια της αθροιστικής συνάρτησης κατανομής, δεν θα πρέπει να αποκλίνει σημαντικά από την τελευταία. Αναζητά, λοιπόν, ο έλεγχος αυτός την μέγιστη κατακόρυφη απόσταση μεταξύ των γραφημάτων της F(x) και της S(x). Αυτά απεικονίζονται στο σχήμα

40 Σχήμα 4..4 Γραφική παράσταση των F(x) και S(x) των σημείων θραύσης των νημάτων Από το σχήμα 4..4, είναι προφανές ότι η μέγιστη απόκλιση της S(x) από την F(x) παρατηρείται στο σημείο x=3.4. Ο γραφικός προσδιορισμός του σημείου στο οποίο παρατηρείται η μέγιστη απόκλιση της S(x) από την F(x) γίνεται με βάση τον πίνακα που ακολουθεί, o οποίος περιέχει τις τιμές της διαφοράς F(x) S(x). Ας σημειωθεί ότι, επειδή για το παράδειγμά μας, f x 0, x 6, 1, - x 0 0 x 6 0 x + και δοθέντος ότι η S(x) είναι σταθερή σε κάθε υποδιάστημα του (, + ), η μέγιστη κατακόρυφη απόκλιση της S(x) από την F(x) σε κάθε υποδιάστημα παρατηρείται στο σημείο του διαστήματος 48

41 που αντιστοιχεί στο σημείο θραύσης, αφού στο σημείο αυτό η S(x) παρουσιάζει άλμα. Πίνακας 4..1 Σύγκριση της F(x) με την S(x) των σημείων θραύσης των νημάτων x i F(x i ) S(x i ) F(x i ) S(x i ) F(x i ) S(x i-1 )

42 Από τον πίνακα 4..1, είναι προφανές ότι η μέγιστη κατ απόλυτη τιμή απόκλιση της S(x) από την F(x) είναι 0.18 και παρατηρείται στο σημείο x=3.4. Το επόμενο βήμα είναι να καθορισθεί η περιοχή απόρριψης της μηδενικής υπόθεσης ότι οι αποστάσεις των σημείων θραύσης από το στερεωμένο άκρο των νημάτων είναι ομοιόμορφα κατανεμημένες. Τότε, θα είμαστε σε θέση να συμπεράνουμε κατά πόσο μια μέγιστη απόκλιση μεγέθους 0.18 μπορεί να θεωρηθεί επαρκής ένδειξη υπέρ της απόρριψης της μηδενικής υπόθεσης σε κάποιο επίπεδο σημαντικότητας. Η μορφή της περιοχής απόρριψης εξαρτάται, βέβαια, από την μορφή της εναλλακτικής υπόθεσης. Ένας αμφίπλευρος έλεγχος θα ήταν κατάλληλος, αν η εναλλακτική μας υπόθεση ήταν ότι οι παρατηρήσεις μας έχουν προέλθει από κάποια άλλη κατανομή. Ομως, στην πράξη, θα μπορούσαμε να ενδιαφερόμαστε για μία εναλλακτική, η οποία θα υπαινισσόταν ότι το ποσοστό των φορών που το νήμα κόβεται σε απόσταση x από το στερεωμένο άκρο του νήματος είναι μεγαλύτερο (ή μικρότερο) από το αντίστοιχο ποσοστό της μηδενικής (ομοιόμορφης) κατανομής. Για παράδειγμα, εάν η δύναμη δεν ασκείται ομοιόμορφα σε όλο το μήκος του νήματος, αλλά είναι μεγαλύτερη προς το στερεωμένο άκρο του νήματος και μειώνεται σταθερά καθώς προχωράμε προς το άλλο άκρο του, τότε αυξάνεται η τάση να κόβεται το νήμα πιο κοντά στο στερεωμένο άκρο του. Με υψηλή την τιμή της πιθανότητας να κόβεται το νήμα προς το στερεωμένο άκρο του, είναι προφανές ότι η εμπειρική συνάρτηση κατανομής θα βρίσκεται παντού στο διάστημα (, + ), υπεράνω της αθροιστικής συνάρτησης κατανομής F(x) της ομοιόμορφης κατανομής. Επομένως, μία μέγιστη απόκλιση με την S(x) μεγαλύτερη 430

43 από την F(x), εάν είναι στατιστικά σημαντική, θα συνηγορεί υπέρ της εναλλακτικής υπόθεσης. Λύση με το ΜINITAB: Οπως έχουμε δει, το MINITAB υπολογίζει τις τάξεις μεγέθους των παρατηρήσεων μιας μεταβλητής, αλλά, σε αντίθεση με το SPSS, δίνει σε ισοβαθμούσες τιμές υποχρεωτικά τη μέση τιμή των τάξεων μεγέθους που θα είχαν αν δεν ταυτίζονταν. Αυτό όμως δεν προσφέρεται για περιπτώσεις όπως αυτές του παραδείγματός μας, όπου ζητάμε την εμπειρική συνάρτηση κατανομής, και, ως εκ τούτου, επιθυμούμε να αποδίδουμε στις ισοβαθμούσες τιμές την τάξη που θα είχε η μεγαλύτερη αν δεν ταυτίζονταν. (Ετσι, η τάξη μεγέθους κάθε παρατήρησης δείχνει πόσες παρατηρήσεις είναι μικρότερες ή ίσες από αυτήν). Άρα, θα πρέπει όλη η εργασία υπολογισμού της εμπειρικής συνάρτησης κατανομής να γίνει με το χέρι. Ετσι, δεν έχει νόημα να λυθεί το παράδειγμα με το MINITAB. Λύση με το SPSS: Σε μία μεταβλητή (στην οποία έστω ότι δίνουμε το όνομα x και την ετικέτα Απόσταση σημείου θραύσης), καταχωρίζουμε το δείγμα. Οπως είναι ήδη γνωστό, το SPSS υπολογίζει, με την βοήθεια της εντολής Transform, Rank Cases, την εμπειρική συνάρτηση κατανομής ενός δείγματος. Αρκεί, στο πεδίο Rank Types, να επιλέξουμε Fractional Ranks για την τάξη μεγέθους και, στο πεδίο Ties, να επιλέξουμε Rank assigned to Ties, High. Το πρόγραμμα δίνει τη μεταβλητή rx (αφού x είναι το όνομα της μεταβλητής που περιέχει το δείγμα). Το φύλλο δεδομένων είναι: 431

44 Για να διεξαγάγουμε τον έλεγχο Kolmogorov-Smirnov θα πρέπει, όπως είναι ήδη γνωστό να καταφύγουμε στο παράθυρο εντολών (syntax window), αφού μόνο έτσι μπορούμε να δηλώσουμε τις τιμές που θεωρούμε ότι έχουν οι παράμετροι της κατανομής κάτω από την μηδενική υπόθεση. Στο παράθυρο εντολών, δίνουμε την εντολή npar tests k-s (uniform,0,6)=x. Τα αποτελέσματα του ελέγχου είναι τα εξής: One-Sample Kolmogorov-Smirnov Test Απόσταση σημείου θραύσης N 0 Uniform Parameters a,b Minimum 0 43

45 Maximum 6 Most Extreme Differences Absolute.183 Positive.183 Negative Kolmogorov-Smirnov Z.80 Asymp. Sig. (-tailed).51 a Test distribution is Uniform. b User-Specified Η τιμή της στατιστικής συνάρτησης Τ (πεδίο Most Extreme Difference: Absolute) είναι Οπως μπορεί εύκολα να διαπιστωθεί από τους πίνακες ποσοστιαίων σημείων της Τ, το κρίσιμο επίπεδο που αντιστοιχεί στην τιμή τ=0.183 είναι μεγαλύτερο από 0.. Κατά συνέπεια, η μηδενική υπόθεση μπορεί να θεωρηθεί εύλογη σε όλα τα συνήθη επίπεδα σημαντικότητας. Η τιμή του κρίσιμου επιπέδου που δίνει το SPSS στην τελευταία γραμμή του πίνακα είναι ασυμπτωτική και επειδή το δείγμα μας είναι μικρό, δεν έχει έννοια να χρησιμοποιηθεί. Στα επόμενα, διατυπώνεται με γενικότερο τρόπο η μορφή των προβλημάτων που αντιμετωπίζονται με τον έλεγχο Kolmogorov, η επιχειρηματολογία που αναπτύχθηκε για το είδος της στατιστικής συνάρτησης που απαιτείται για να μετρηθεί ο βαθμός της εγγύτητας των τιμών των συναρτήσεων F(x) και S(x) καθώς και η διεξαγωγή του ελέγχου. Εστω λοιπόν Χ 1, Χ,..., Χ n ένα τυχαίο δείγμα μεγέθους n από κάποια άγνωστη κατανομή με αθροιστική συνάρτηση κατανομής F(x). Εστω, επίσης, F 0 (x) μία σαφώς καθορισμένη συνάρτηση κατανομής. Οι υποθέσεις που ενδιαφέρει να ελεγχθούν διακρίνονται στις εξής τρεις κατηγορίες: Α. (Αμφίπλευρη εναλλακτική υπόθεση) 433

46 Η 0 : F(x) = F 0 (x), για κάθε x στο (, + ) Η 1 : F(x) F 0 (x), για τουλάχιστον μια τιμή του x. Β. (Μονόπλευρη εναλλακτική υπόθεση) Η 0 : F(x) F 0 (x), για κάθε x στο (, + ) Η 1 : F(x) F 0 (x), για τουλάχιστον μια τιμή του x. Γ. (Μονόπλευρη εναλλακτική υπόθεση) Η 0 : F(x) F 0 (x), για κάθε x στο (, + ) Η 1 : F(x) F 0 (x), για τουλάχιστον μια τιμή του x. τυχαίο δείγμα Εστω S(x) η εμπειρική συνάρτηση κατανομής με βάση το Χ 1, Χ,..., Χ n. Η στατιστική συνάρτηση ελέγχου ορίζεται διαφορετικά για τα τρία διαφορετικά σύνολα υποθέσεων Α, Β, και Γ. A. (Αμφίπλευρος έλεγχος): Η κατάλληλη στατιστική συνάρτηση ελέγχου για την περίπτωση αυτή είναι η μέγιστη κατακόρυφη απόσταση μεταξύ των συναρτήσεων S(x) και F 0 (x). Συμβολικά, γράφουμε Τ = sup F 0 (x) S(x), x και διαβάζουμε "η T είναι ίση με το supremum, για όλα τα x της απόλυτης τιμής της διαφοράς F 0 (x) S(x)". Β. (Μονόπλευρος έλεγχος): Είναι προφανές ότι, στην περίπτωση αυτή, η κατάλληλη στατιστική συνάρτηση ελέγχου είναι η μέγιστη κατακόρυφη απόσταση που έχει η F 0 (x) υπεράνω της S(x). Δηλαδή, T sup F0 x : F0 x S x x S x. 434

47 Η στατιστική αυτή συνάρτηση είναι παρόμοια με την Τ, με την διαφορά ότι, τώρα, θεωρούμε μόνο την μέγιστη διαφορά όταν η συνάρτηση F 0 (x) είναι υπεράνω της συνάρτησης S(x). Γ. (Μονόπλευρος έλεγχος): Με ανάλογο τρόπο, στην περίπτωση αυτή, η κατάλληλη στατιστική συνάρτηση ελέγχου ορίζεται ως η μέγιστη κατακόρυφη απόσταση που έχει η S(x) υπεράνω της F 0 (x). Συμβολικά, γράφουμε T sup S x F x. 0 : F x Sx x 0 και διαβάζουμε " T είναι το supremum της διαφοράς S(x) F 0 (x), για όλα τα x για τα οποία η συνάρτηση S(x) είναι υπεράνω της συνάρτησης F 0 (x)". Σχήμα 4..5 Η υποτεθείσα (μηδενική) συνάρτηση κατανομής F 0 (x), η εμπειρική συνάρτηση κατανομής S(x) και η στατιστική συνάρτηση του Kolmogorov, Τ. Είναι προφανές ότι, και στις τρεις περιπτώσεις, οι μεγάλες τιμές της στατιστικής συνάρτησης είναι αυτές που συνηγορούν υπέρ της απόρριψης της μηδενικής υπόθεσης αφού αντανακλούν χαμηλό βαθμό 435

48 εγγύτητας των τιμών των συναρτήσεων S(x) και F 0 (x). Η ακριβής κατανομή των στατιστικών συναρτήσεων, και έχει μελετηθεί από τον Kolmogorov. Τα (1 α)-ποσοστιαία σημεία των κατανομών αυτών που θα συμβολίζουμε με w 1-α περιέχονται στον πίνακα 10 του παραρτήματος, τόσο για τους μονόπλευρους ελέγχους όσο και για τον αμφίπλευρο έλεγχο. Ο πίνακας αυτός είναι ακριβής μόνο εάν η F 0 (x) είναι συνεχής κατανομή. Διαφορετικά, αυτά τα ποσοστιαία σημεία οδηγούν σε ένα συντηρητικό έλεγχο. Ο πίνακας 10 περιέχει ποσοστιαία σημεία για τους αμφίπλευρους ελέγχους σε επίπεδο σημαντικότητας α=0.0, 0.10, 0.05, 0.0 και 0.01, και για μονόπλευρους ελέγχους σε επίπεδο σημαντικότητας α=0.10, 0.05, 0.05, 0.01 και Ο πίνακας είναι ακριβής για n 0 στους αμφίπλευρους ελέγχους. Για τις περιπτώσεις που το μέγεθος του δείγματος n υπερβαίνει το 0 (n 0), όπως και στην περίπτωση των μονόπλευρων ελέγχων, οι πίνακες δίνουν ικανοποιητικές προσεγγίσεις, οι οποίες, στις περισσότερες περιπτώσεις, συμπίπτουν με τις ακριβείς τιμές. Η προσέγγιση για n 40 εξαρτάται από την ασυμπτωτική κατανομή της στατιστικής συνάρτησης και δεν είναι πολύ ακριβής παρά μόνο στις περιπτώσεις που το n είναι πολύ μεγάλο. Παρατήρηση: Είναι προφανές ότι Τ=max(, ). Επιστρέφοντας στο παράδειγμα με τα σημεία θραύσης των νημάτων και υποθέτοντας ότι ενδιαφερόμαστε για μία αμφίπλευρη εναλλακτική υπόθεση (περίπτωση Α), θα έχουμε ότι η παρατηρούμενη τιμή της Τ είναι τ=0.18. Η τιμή αυτή δεν υπερβαίνει το ποσοστιαίο σημείο της κατανομής της Τ που αντιστοιχεί στον αμφίπλευρο έλεγχο για n=0, αφού w 0.95 =0.94. Επομένως, σε επίπεδο 436

49 σημαντικότητας 5%, η μηδενική υπόθεση δεν απορρίπτεται. Εάν, από την άλλη μεριά, ενδιαφερόμαστε να ελέγξουμε τις υποθέσεις της περίπτωσης Γ σε επίπεδο σημαντικότητας α=0.05, θα είχαμε ότι η τιμή 0.18 της στατιστικής συνάρτησης δεν υπερβαίνει και πάλι την τιμή του αντίστοιχου ποσοστιαίου σημείου, όπως αυτό προκύπτει από τον πίνακα 10 για τον μονόπλευρο έλεγχο σε επίπεδο σημαντικότητας 5% (w 0.95 =0.65). Επομένως, και στις δύο περιπτώσεις οι ενδείξεις που έχουμε από το δείγμα δεν είναι επαρκείς για να οδηγήσουν σε απόρριψη της μηδενικής υπόθεσης. Το παρατηρούμενο επίπεδο σημαντικότητας είναι, από τον πίνακα 10 του παραρτήματος για την περίπτωση του αμφίπλευρου ελέγχου, ίση με P(T 0.18H 0 ) = 1 P(T 0.18) 1 P(T 0.3) = =0.0. Αντίστοιχα, το παρατηρούμενο επίπεδο σημαντικότητας για την περίπτωση του μονόπλευρου ελέγχου είναι αˆ = P( 0.18H 0 ) = 1 P( 0.18) 1 P( 0.3) = = Ο έλεγχος Kolmogorov συχνά προτιμάται από τον έλεγχο χ ως έλεγχος καλής προσαρμογής, όταν το μέγεθος του δείγματος είναι μικρό. Ο έλεγχος Kolmogorov είναι ακριβής ακόμη και για μικρά δείγματα, ενώ ο έλεγχος χ υποθέτει ότι ο αριθμός των παρατηρήσεων είναι αρκετά μεγάλος, ώστε η κατανομή χ να παρέχει μία ικανοποιητική προσέγγιση της κατανομής της στατιστικής συνάρτησης. Υπάρχουν πολλές αντιφάσεις όσο αφορά το ποιός έλεγχος είναι περισσότερο ισχυρός, αλλά η γενική εντύπωση φαίνεται να είναι ότι ο έλεγχος Kolmogorov είναι ενδεχομένως περισσότερο ισχυρός από τον έλεγχο χ στις περισσότερες περιπτώσεις. Ενας προβληματισμός για τον έλεγχο Kolmogorov 437

50 αναφέρεται στο κατά πόσο αυτός αγνοεί πληροφορίες με το να χρησιμοποιεί μόνο την διαφορά με το μεγαλύτερο μέγεθος σε αντίθεση με τους ελέγχους οι οποίοι λαβαίνουν υπόψη τους όλες τις διαφορές. Τα πλεονεκτήματα των τελευταίων δεν είναι τόσα πολλά γιατί η τιμή της συνάρτησης S(x) εξαρτάται σε κάθε στάδιο από το πόσες παρατηρήσεις είναι μικρότερες από την συγκεκριμένη τιμή x. Επομένως, οι συγκρίσεις γίνονται με βάση τις συσσωρευμένες ενδείξεις μέχρι το συγκεκριμένο στάδιο. Παράδειγμα 4..: Εστω ότι από μία κατανομή με συνάρτηση κατανομής F(x) παίρνουμε το εξής τυχαίο δείγμα: Να ελεγχθεί η μηδενική υπόθεση ότι το δείγμα έχει προέλθει από την ομοιόμορφη κατανομή στο διάστημα (0,1) έναντι της εναλλακτικής ότι τα δείγμα έχει προέλθει από μία κατανομή της οποίας η αθροιστική συνάρτηση κατανομής, για μία τουλάχιστον τιμή του x, είναι μικρότερη από την αντίστοιχη τιμή της αθροιστικής συνάρτησης κατανομής της ομοιόμορφης κατανομής στο διάστημα (0,1). Λύση: Είναι προφανές ότι η κατάλληλη στατιστική συνάρτηση για τον έλεγχο αυτών των υποθέσεων είναι η Εδώ, Τ sup F0 (x) S(x). x:f 0 (x) S(x) (x) F 0 0, x, 1, x 0 0 x 1 x

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙO 5 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ Στο προηγούμενο κεφάλαιο εξετάσαμε διάφορες μορφές ελέγχου της υπόθεσης ότι ένα δείγμα παρατηρήσεων προέρχεται από κάποια συγκεκριμένη κατανομή. Στην

Διαβάστε περισσότερα

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV 5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΚΑΤΑΝΟΜΩΝ ΒΑΣΙΖΟΜΕΝΟΙ ΣΕ ΠΕΡΙΣΣΟΤΕΡΑ ΑΠΟ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΚΑΤΑΝΟΜΩΝ ΒΑΣΙΖΟΜΕΝΟΙ ΣΕ ΠΕΡΙΣΣΟΤΕΡΑ ΑΠΟ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ ΚΕΦΑΛΑΙΟ 6 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΚΑΤΑΝΟΜΩΝ ΒΑΣΙΖΟΜΕΝΟΙ ΣΕ ΠΕΡΙΣΣΟΤΕΡΑ ΑΠΟ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Οι έλεγχοι που εξετάζονται στο κεφάλαιο αυτό αποτελούν επεκτάσεις για την περίπτωση περισσοτέρων

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Ο έλεγχος της ενότητας αυτής αποτελεί μία επέκταση του μονόπλευρου ελέγχου Smirnov στην περίπτωση περισσοτέρων από δύο δειγμάτων. Ο έλεγχος αυτός

Διαβάστε περισσότερα

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) .5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) Ο διωνυμικός έλεγχος μπορεί να χρησιμοποιηθεί για τον έλεγχο υποθέσεων αναφερομένων στα ποσοστιαία σημεία μίας τυχαίας μεταβλητής. Στην

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Σε ορισμένες περιπτώσεις απαιτείται ο έλεγχος της ύπαρξης στατιστικά

Διαβάστε περισσότερα

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,...,Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ ) S σ Τ ( Χ,Y)

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι Εργαστήριο 9 1. Να χρησιμοποιηθεί το αρχείο data_kids. Τα δεδομένα του προέρχονται από την έρευνα των Chase και Dummer (1992), μελέτησαν τον ρόλο των

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο ανεξάρτητα δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,..., Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ )

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square)

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square) Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square) Το Chi Square τεστ αποτελεί ένα μη παραμετρικό τεστ και εφαρμόζεται σε ονομαστικές μεταβλητές, βάσει των οποίων τα

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή 4.3.3 Ο Έλεγχος των Shapro-Wlk για την Κανονική Κατανομή Ένας άλλος πολύ γνωστός έλεγχος καλής προσαρμογής για την κανονική κατανομή, ο οποίος μπορεί να χρησιμοποιηθεί στην θέση του ελέγχου Lllefors, είναι

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 4ο Κατανομές Στατιστικών Συναρτήσεων Δείγμα από κανονική κατανομή Έστω Χ= Χ Χ Χ τ.δ. από Ν µσ τότε ( 1,,..., n) (, ) Τ Χ Χ Ν Τ Χ σ σ Χ Τ Χ n Χ S µ S µ 1( ) = (0,1), ( ) = ( n 1)

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΕΦΑΛΑΙΟ 19 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΑΝΟΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Όταν ενδιαφερόμαστε να συγκρίνουμε δύο πληθυσμούς, η φυσιολογική προσέγγιση είναι να προσπαθήσουμε να συγκρίνουμε

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 5 Οι τιμές ενός τεστ κατανέμονται κανονικά με μέση τιμή 100 και τυπική απόκλιση 15. Διαθέτουμε τις τιμές επτά μαθητών για το παραπάνω τεστ

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο Εαρινό εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr

Διαβάστε περισσότερα

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests) Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests) Σε αρκετές περιπτώσεις απαιτείται να ελεγχθεί αν η συχνότητα εμφάνισης κάποιων συγκεκριμένων τιμών (κατηγοριών) μιας

Διαβάστε περισσότερα

3.4.1 Ο Συντελεστής ρ του Spearman

3.4.1 Ο Συντελεστής ρ του Spearman 3.4. Ο Συντελεστής ρ του Spearma Έστω (, ), (, ),..., (, ) ένα δείγμα παρατηρήσεων πάνω στο τυχαίο διάνυσμα (, ). Έστω ( ) ο βαθμός ή η τάξη μεγέθους της μεταβλητής όταν αυτή συγκρίνεται με τις άλλες Χ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : 1. Να χρησιμοποιηθεί το αρχείο gssft.sav για να γίνει έλεγχος της υπόθεσης ότι στους εργαζόμενους με πλήρη απασχόληση η τιμή του μέσου

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων Ασκήσεις Εξετάσεων Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων ΑΣΚΗΣΗ 1: Έλεγχος για τη μέση τιμή ενός πληθυσμού Η αντικαπνιστική νομοθεσία υποχρεώνει τους καπνιστές που εργάζονται σε

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ) Σε ορισμένες περιπτώσεις απαιτείται ο έλεγχος της ύπαρξης

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

if code='1' then type='fixed'; else if code='2' then type='variable'; else type='unknown'; ΚΕΦΑΛΑΙΟ 2

if code='1' then type='fixed'; else if code='2' then type='variable'; else type='unknown'; ΚΕΦΑΛΑΙΟ 2 Πολλές φορές, αντί να χρησιμοποιούμε μια σειρά από IF-THEN εντολές, μπορούμε να χρησιμοποιήσουμε την εντολή ELSE, για να δηλώσουμε μια εναλλακτική ενέργεια όταν η συνθήκη στην IF-THEN εντολή δεν ικανοποιείται.

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ ΚΑΤΑΝΟΜΈΣ ΚΕΦΑΛΑΙΟ 8 81 Εισαγωγή Οι κατανομές διακρίνονται σε κατανομές συχνοτήτων, κατανομές πιθανοτήτων και σε δειγματοληπτικές κατανομές Στη συνέχεια θα γίνει αναλυτική περιγραφή αυτών 82 Κατανομές

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΟ 13 ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Στις προηγούμενες ενότητες ασχοληθήκαμε με μεθόδους που οδηγούν σε εκτιμήτριες των τιμών μιας ή και περισσοτέρων αγνώστων παραμέτρων. Αυτό έγινε με την κατασκευή

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α εξάμηνο 2011-2012 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Ποιοτικές και Ποσοτικές Μέθοδοι και Προσεγγίσεις για την Επιστημονική Έρευνα ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μη παραμετρικοί στατιστικοί έλεγχοι Καθηγητής ΔΠΘ Κων/νος Τσαγκαράκης Δευτέρα 6 Μαρτίου 13:00-16:00 Ώρα για εξ αποστάσεως συνεργασία Τρίτη 7 Μαρτίου 12:00-14:00

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Άσκηση 1 η Ένας παραγωγός σταφυλιών ισχυρίζεται ότι τα κιβώτια σταφυλιών που συσκευάζει

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Στόχοι του κεφαλαίου Εξοικείωση με το περιβάλλον του SPSS Εξοικείωση με τις διαδικασίες περιγραφικής ανάλυσης μιας μεταβλητής Εξοικείωση με τη

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Δεδομένων

Εισαγωγή στην Ανάλυση Δεδομένων ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 09-10-2015 Εισαγωγή στην Ανάλυση Δεδομένων Βασικές έννοιες Αν. Καθ. Μαρί-Νοέλ Ντυκέν ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 30-10-2015 1. Στατιστικοί παράμετροι - Διάστημα εμπιστοσύνης Υπολογισμός

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

Π Α Ρ Α Ρ Τ Η Μ Α. Πίνακας 9. p ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon

Π Α Ρ Α Ρ Τ Η Μ Α. Πίνακας 9. p ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon ΠΙΝΑΚΕΣ Π Α Ρ Α Ρ Τ Η Μ Α Πίνακας 1. Διωνυμική Κατανομή Πίνακας 2. Τυποποιημένη Κανονική Κατανομή Πίνακας 3. Oρια Εμπιστοσύνης για την Πιθανότητα p της Διωνυμικής Κατανομής Πίνακας 4. Ποσοστιαία Σημεία

Διαβάστε περισσότερα

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ Να δοθούν οι βασικές αρχές των µη παραµετρικών ελέγχων (non-parametric tests). Να παρουσιασθούν και να αναλυθούν οι γνωστότεροι µη παραµετρικοί έλεγχοι Να αναπτυχθεί η µεθοδολογία των

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2 Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2. Μη Παραμετρικοί Έλεγχοι Παραμετρικοί είναι οι κλασικοί έλεγχοι υποθέσεων της Στατιστικής οι οποίοι διεξάγονται κάτω από κάποιες προϋποθέσεις για τις παραμέτρους

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής Κεφάλαιο 3: Ανάλυση μιας μεταβλητής Γενικά Στο Κεφάλαιο αυτό θα παρουσιάσουμε κάποιες μεθόδους της Περιγραφικής Στατιστικής και της Στατιστικής Συμπερασματολογίας που αφορούν στην ανάλυση μιας μεταβλητής.

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα ΚΕΦΑΛΑΙΟ ΕΚΤΟ Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Στο κεφάλαιο αυτό θα ασχοληθούμε με τον έλεγχο της υπόθεσης της ισότητα δύο μέσων τιμών με εξαρτημένα δείγματα. Εξαρτημένα

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Κλωνάρης Στάθης ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Μέχρι τώρα ασχοληθήκαμε με τις τεχνικές εκτίμησης παραμέτρων για ένα πληθυσμό όπως: τον Μέσο µ και το ποσοστό p Θα συνεχίσουμε

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20, ΜΕΜ64: Εφαρμοσμένη Στατιστική 1 ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=0, X = 7.5, σ = 16, α = 5%. Πως αλλάζει το διάστημα αν

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

1 x-μ - 2 σ. e σ 2π. f(x) =

1 x-μ - 2 σ. e σ 2π. f(x) = Κανονική κατανομή Η πιο σημαντική κατανομή πιθανοτήτων της στατιστικής είναι η κανονική κατανομή. Η κανονική κατανομή είναι συνεχής κατανομή, σε αντίθεση με την διωνυμική που είναι διακριτή κατανομή. Τα

Διαβάστε περισσότερα

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ. ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ. Κανονική Κατανομή Τυπική Απόκλιση Διακύμανση z τιμές Περιεχόμενα 6 ου μαθήματος Έλεγχος κανονικής

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ,

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, -- Άσκηση. Δίνονται τα παρακάτω δεδομένα 5 7 8 9 5 X 8 5 5 5 9 7 Y. 5.. 7..7.7.9.. 5.... 8.. α) Να γίνει το διάγραμμα διασποράς β) εξετάστε τα μοντέλα Υ = β + β Χ + ε, (linear),

Διαβάστε περισσότερα

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ ΒΑΣΙΣΜΕΝΕΣ ΣΤΙΣ ΤΑΞΕΙΣ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ ΕΝΟΣ Ή ΔΥΟ ΔΕΙΓΜΑΤΩΝ (Methods Based on Ranks)

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ ΒΑΣΙΣΜΕΝΕΣ ΣΤΙΣ ΤΑΞΕΙΣ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ ΕΝΟΣ Ή ΔΥΟ ΔΕΙΓΜΑΤΩΝ (Methods Based on Ranks) ΚΕΦΑΛΑΙΟ 3 ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ ΒΑΣΙΣΜΕΝΕΣ ΣΤΙΣ ΤΑΞΕΙΣ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ ΕΝΟΣ Ή ΔΥΟ ΔΕΙΓΜΑΤΩΝ (Methods Based on Ranks) Στο κεφάλαιο αυτό, εξετάζονται ορισμένες τεχικές ανάλυσης δεδομένων, οι

Διαβάστε περισσότερα

1991 US Social Survey.sav

1991 US Social Survey.sav Παραδείγµατα στατιστικής συµπερασµατολογίας µε ένα δείγµα Στα παραδείγµατα χρησιµοποιείται απλό τυχαίο δείγµα µεγέθους 1 από το αρχείο δεδοµένων 1991 US Social Survey.sav Το δείγµα λαµβάνεται µε την διαδικασία

Διαβάστε περισσότερα

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F Άσκηση 0, σελ. 9 από το βιβλίο «Μοντέλα Αξιοπιστίας και Επιβίωσης» της Χ. Καρώνη (i) Αρχικά, εισάγουμε τα δεδομένα στο minitab δημιουργώντας δύο μεταβλητές: τη x για τον άτυπο όγκο και την y για τον τυπικό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Media Monitoring. Ενότητα 7: Εισαγωγή & Ανάλυση δεδομένων με το SPSS. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

Media Monitoring. Ενότητα 7: Εισαγωγή & Ανάλυση δεδομένων με το SPSS. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ Media Monitoring Ενότητα 7: Εισαγωγή & Ανάλυση δεδομένων με το SPSS Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ Output Είναι ο όρος που χρησιμοποιείται για να περιγράψει τα αποτελέσματα από αναλύσεις που

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Ενότητα 3 Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Εκτός από τις μέσες τιμές, τυπικές αποκλίσεις κλπ, θέλουμε να βρούμε κατά πόσον αυτές οι παρατηρούμενες τάσεις εξαρτώνται από συγκεκριμένες συνθήκες ή προϋποθέσεις.

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα) Όταν απαιτείται ο έλεγχος της ύπαρξης στατιστικά σημαντικών

Διαβάστε περισσότερα

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς Απαραμετρική Στατιστική Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς Πολλά από τα κριτήρια της στατιστικής συμπερασματολογίας βασίζονται σε περιοριστικές υποθέσεις για την κατανομή των πληθυσμών από τους οποίους

Διαβάστε περισσότερα

Κεφάλαιο 5. Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας

Κεφάλαιο 5. Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας Κεφάλαιο 5 Σύνοψη Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας Βασικές έννοιες και ορισμοί του ελέγχου υποθέσεων, γραφικοί έλεγχοι κανονικότητας μέσω των ιστογραμμάτων (διαδρομές Analyze

Διαβάστε περισσότερα

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ ΚΕΦΑΛΑΙΟ ΤΕΤΑΡΤΟ Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή Έστω ένα τυχαίο δείγμα X,, 1 X n μεγέθους n από έναν πληθυσμό με μέση τιμή μ 2 και διακύμανση σ, άγνωστη.

Διαβάστε περισσότερα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων 1 Μονοπαραγοντική Ανάλυση Διακύμανσης Παραμετρικό στατιστικό κριτήριο για τη μελέτη της επίδρασης μιας ανεξάρτητης μεταβλητής στην εξαρτημένη Λογική

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα