Κεϕάλαιο 3. Στοιχεία Στατιστικής. ˆp = n i /n. (3.1)

Save this PDF as:
 WORD  PNG  TXT  JPG

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Κεϕάλαιο 3. Στοιχεία Στατιστικής. ˆp = n i /n. (3.1)"

Transcript

1 Κεϕάλαιο 3 Στοιχεία Στατιστικής Η στατιστική ασχολείται µε τις εϕαρµογές της ϑεωρίας των πιθανοτήτων τυχαίων µεταβλητών σε πραγµατικά προβλήµατα και συνίσταται στην εξαγωγή συµπερασµάτων που ϐασίζονται στις παρατηρήσεις. Εύκολα µπορεί να καταλάβει κάποιος τη σύνδεση πιθανολογικών εννοιών µε την πραγµατικότητα από την προσέγγιση της πιθανότητας που δώσαµε στην (2.1). Στην πραγµατικότητα έχουµε n παρατηρήσεις που αποτελούν το δείγµα και αν η τιµή x i µιας διακριτής τ.µ. X εµϕανίζεται n i φορές στο δείγµα, µπορούµε να προσεγγίσουµε την πιθανότητα εµϕάνισης της x i, p = P(X = x i ), ως ˆp = n i /n. (3.1) Η τιµή ˆp αποτελεί την εκτίµηση της p µε ϐάση το δείγµα. Σηµειώνεται ότι το p µπορούµε να το ονοµάσουµε και αναλογία εµϕάνισης της τιµής x i στο σύνολο των δυνατών τιµών της X. Η εκτίµηση αυτή είναι σηµειακή (point estimation) και δίνει την καλύτερη προσέγγιση µε µια τιµή που µπορούµε να δώσουµε στην πραγµατική αλλά άγνωστη αναλογία p µε ϐάση το δείγµα. Σε πολλές περιπτώσεις ϑα ϑέλαµε να εκτιµήσουµε ένα διάστηµα εµπιστοσύνης (confidence interval) σε κάποιο επίπεδο σηµαντικότητας α (ή αντίστοιχα επίπεδο εµπιστοσύνης 1 α) που να περιέχει την πραγµατική αλλά άγνωστη αναλογία p. Σε άλλες περιπτώσεις µας ενδιαϕέρει µόνο να ελέγξουµε αν η αναλογία µπορεί να πάρει ή να υπερβεί κάποια τιµή και για αυτό κάνουµε έλεγχο υπόθεσης (hypothesis test). Σε πολλές µελέτες τα δεδοµένα είναι αριθµητικά και το ενδιαϕέρον είναι στον προσδιορισµό του κέντρου (που ορίζεται µε τη µέση τιµή ή διάµεσο) της κατανοµής της παρατηρούµενης τ.µ. ή της διασποράς της. Γενικά για να εκτιµήσουµε µε σηµειακή εκτίµηση ή διάστηµα εµπιστοσύνης κάποια ά- γνωστη παράµετρο θ (π.χ. µέση τιµή ή διασπορά) ή να ελέγξουµε αν αυτή µπορεί να πάρει κάποια τιµή υπάρχουν τρεις προσεγγίσεις. Η παραµετρική 25

2 26 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ προσέγγιση (parametric approach) υποθέτει ότι τα δεδοµένα του προβλή- µατος προέρχονται από κάποια γνωστή κατανοµή. Αυτή η προσέγγιση είναι απλή στην πραγµατοποίηση της. Από τη γνωστή κατανοµή υπολογίζεται η κατανοµή του εκτιµητή και στη συνέχεια το διάστηµα εµπιστοσύνης ή σχη- µατίζεται η πιθανότητα της ορθότητας της µηδενικής υπόθεσης του ελέγχου. Η προσέγγιση αυτή είναι η πιο ακριβής αν η υπόθεση για την κατανοµή είναι σωστή. Αντίθετα η µη-παραµετρική (nonparametric) προσέγγιση δεν υποθέτει κάποια γνωστή κατανοµή για τα δεδοµένα. Είναι λιγότερη ακριβής για γνωστές κατανοµές αλλά είναι πιο κατάλληλη από την παραµετρική ό- ταν τα δεδοµένα δεν προσαρµόζονται καλά σε κάποια γνωστή κατανοµή. Η τρίτη προσέγγιση επίσης δε ϑεωρεί γνωστή κατανοµή για τα δεδοµένα και χρησιµοποιεί επαναδειγµατοληψία (resampling) για να δηµιουργήσει νέα δείγµατα. Από αυτά τα δείγµατα υπολογίζεται ένα πλήθος τιµών του εκτιµητή, ένα για κάθε δείγµα, σχηµατίζεται η κατανοµή του και υπολογίζεται έτσι το διάστηµα εµπιστοσύνης ή γίνεται ο έλεγχος υπόθεσης. Αυτή είναι η πιο ακριβής προσέγγιση για πραγµατικά προβλήµατα, όπου συνήθως τα δεδο- µένα δεν προσαρµόζονται πιστά σε γνωστές κατανοµές, αλλά η ακρίβεια της απαιτεί πολλούς περισσότερους υπολογισµούς. Για αυτό και αυτή η προσέγγιση άρχισε να χρησιµοποιείται ευρέως τα τελευταία χρόνια µε την ανάπτυξη ισχυρής υπολογιστικής τεχνολογίας. Στο κεϕάλαιο αυτό ϑα επικεντρωθούµε στην πρώτη προσέγγιση για τον υ- πολογισµό διαστηµάτων εµπιστοσύνης παραµέτρου και την πραγµατοποίηση ελέγχου υπόθεσης παραµέτρου. Ειδικότερα ϑα µελετήσουµε τις παραµέτρους της µέσης τιµής και της διασποράς. Τέλος ϑα γενικεύσουµε τη χρήση του ελέγχου υπόθεσης και σε άλλα προβλήµατα, όπως στην προσαρµογή της κατανοµής των δεδοµένων σε κάποια γνωστή κατανοµή. 3.1 Σηµειακή εκτίµηση Η σηµειακή εκτίµηση µιας παραµέτρου θ είναι το στατιστικό (ή η στατιστική) ˆθ που υπολογίζουµε από το δείγµα για να προσδιορίσουµε την άγνωστη θ, δηλαδή είναι µια τιµή, που υπολογίζεται µε ϐάση τα δεδοµένα του δείγ- µατος και αντιπροσωπεύει την πραγµατική τιµή της αντίστοιχης παράµετρου του πληθυσµού. Εστω X µια τ.µ. µε αθροιστική συνάρτηση κατανοµής F X (x; θ) που εξαρτάται από την παράµετρο θ την οποία ϑέλουµε να εκτιµήσουµε (το ; στον παραπάνω συµβολισµό ξεχωρίζει µεταβλητές από παραµέτρους). Εστω ακόµα ότι έχουµε παρατηρήσεις {x 1,..., x n } της X από ένα δείγµα µεγέθους n. Τότε η σηµειακή εκτίµηση της θ δίνεται από µια εκτιµήτρια συνάρτηση των τιµών του δείγµατος, ˆθ = g(x1,..., x n ) και το ˆθ ονοµάζεται εκτιµητής (estimator)

3 3.1. ΣΗΜΕΙΑΚΗ ΕΚΤΙΜΗΣΗ 27 της θ. Το ϐασικό (και λεπτό σηµείο) στην εκτίµηση παραµέτρων είναι να καταλά- ϐουµε ότι η ˆθ είναι τυχαία µεταβλητή. Οι παρατηρήσεις {x1,..., x n } παίρνουν τυχαίες τιµές σε κάθε δείγµα µεγέθους n και πάντα µε την ίδια κατανοµή F X (x; θ). Άρα µπορούµε να ϑεωρήσουµε τις {x 1,..., x n } ως τ.µ. και τότε και η ˆθ είναι τ.µ. ως συνάρτηση n τ.µ.. Βέβαια για ένα συγκεκριµένο δείγµα οι {x 1,..., x n } παίρνουν πραγµατικές τιµές που δίνουν την τιµή της ˆθ για αυτό το δείγµα. Ως τ.µ. η ˆθ ακολουθεί κάποια κατανοµή µε µέση τιµή µˆθ E[ˆθ] και διασπορά σ 2ˆθ Var[ˆθ] Μέση τιµή και διασπορά ύο σηµαντικές παράµετροι µιας τ.µ. X που ϑέλουµε να εκτιµήσουµε είναι η µέση τιµή της µ και η διασπορά της σ 2. Ο εκτιµητής της µ δίνεται από το γνωστό µέσο όρο των {x 1,..., x n } και ονοµάζεται δειγµατική µέση τιµή ή απλά µέσος όρος x x = 1 n x i. (3.2) n Ο εκτιµητής της διασποράς σ 2 είναι η δειγµατική διασπορά s 2 s 2 = 1 n 1 n (x i x) 2 = 1 n 1 Ενας άλλος εκτιµητής της σ 2 δίνεται ως n x 2 i n x 2. (3.3) s 2 = 1 n n (x i x) 2. (3.4) Οι εκτιµητές s 2 και s 2 διαϕέρουν µόνο ως προς το συντελεστή του αθροίσµατος ( 1 και 1 αντίστοιχα). Για µεγάλο n οι δύο εκτιµητές συγκλίνουν στην n 1 n ίδια τιµή Βαθµοί ελευθερίας Η χρήση του n 1 στον τύπο της διασποράς στην (3.3) είναι σε συµϕωνία µε τους ϐαθµούς ελευθερίας (degrees of freedom) του προβλήµατος εκτίµησης της διασποράς. Οι ϐαθµοί ελευθερίας δηλώνουν τις ελεύθερες (τυχαίες) τιµές που υπάρχουν στο πρόβληµα που µελετάµε. Εδώ αρχικά οι ϐαθµοί ελευθερίας είναι n, όσες και οι παρατηρήσεις στο δείγµα, αλλά επειδή στον

4 28 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ορισµό της δειγµατικής διασποράς περιλαµβάνεται η δειγµατική µέση τιµή δεσµεύονται οι n ελεύθερες τιµές µε την συνθήκη να ικανοποιούν την εξίσωση (3.2), δηλαδή να δίνουν την x. Ετσι χάνεται ένας ϐαθµός ελευθερίας και οι ϐαθµοί έλευθερίας είναι n Κριτήρια καλών εκτιµητών Παραπάνω ορίσαµε κάπως αυθαίρετα τους εκτιµητές της µέσης τιµής µ και της διασποράς σ 2 χωρίς να γνωρίζουµε αν είναι καλοί εκτιµητές ή όχι. Γενικά για τον ορισµό ϐέλτιστου εκτιµητή ˆθ κάποιας παραµέτρου θ ϑέτουµε κάποια ϐασικά κριτήρια που αποτελούν και ιδιότητες του εκτιµητή ˆθ. Επικεντρώνουµε την προσοχή µας σε δύο ϐασικές ιδιότητες ενός εκτιµητή, όπου η πρώτη έχει να κάνει µε τη µέση τιµή του µˆθ και η δεύτερη µε τη διασπορά του σ 2ˆθ. Ο εκτιµητής ˆθ είναι αµερόληπτος (unbiased) αν η µέση τιµή του είναι ίση µε την παράµετρο θ, δηλαδή αν ισχύει E[ˆθ] = θ. Αλλιώς λέγεται µεροληπτικός µε µεροληψία b(ˆθ) = E[ˆθ] θ. Ενα δεύτερο σηµαντικό κριτήριο καλού εκτιµητή είναι η αποτελεσµατικότητα (efficiency) αναϕέρεται στη διασπορά του εκτιµητή και δίνεται συγκριτικά. Ενας εκτιµητής ˆθ1 της θ είναι πιο αποτελεσµατικός (effective) α- πό έναν άλλο εκτιµητή ˆθ2 αν έχει µικρότερη διασπορά, αν δηλαδή ισχύει σ 2ˆθ1 < σ 2ˆθ2. Οι εκτιµητές x για την παραµέτρο µ και s 2 για την παράµετρο σ 2, που ορίσαµε αυθαίρετα, είναι και οι δύο αµερόληπτοι και οι πιο αποτελεσµατικοί (δες επίσης 3.2.1). Ο εκτιµητής s 2 είναι µεροληπτικός εκτιµητής της σ 2 µε µεροληψία b( s 2 ) = σ 2 /n. Είναι κατανοητό ότι καθώς το µέγεθος του δείγµατος αυξάνει η µεροληψία τείνει προς το µηδέν και για αυτό ϑεωρούµε πως ο εκτιµητής s 2 είναι ασυµπτωτικά (asymptotic) αµερόληπτος. Σε κάποια προβλήµατα είναι δύσκολο ή αδύνατο να ϐρούµε εκτιµητή που είναι και αµερόληπτος και ο πιο αποτελεσµατικός. Για αυτό συνθέτουµε το κριτήριο του µέσου τετραγωνικού σϕάλµατος (mean square error) της εκτίµησης ως το άθροισµα της διασποράς του εκτιµητή και του τετραγώνου της µεροληψίας MSE[ˆθ] = b(ˆθ) 2 + σ 2ˆθ = (E[ˆθ] θ) 2 + E[ˆθ2 ] (E[ˆθ]) 2 = E[(ˆθ θ) 2 ]. (3.5)

5 3.1. ΣΗΜΕΙΑΚΗ ΕΚΤΙΜΗΣΗ 29 Στον ορισµό των εκτιµητών x και s 2 δεν κάναµε κάποια υπόθεση για την κατανοµή της τ.µ. X και άρα µπορούµε να τους χρησιµοποιήσουµε για οποιαδήποτε τ.µ. X που παρατηρούµε Μέθοδος της µέγιστης πιθανοϕάνειας Η σηµαντικότερη µέθοδος της στατιστικής για την εκτίµηση παραµέτρων είναι η µέθοδος της µέγιστης πιθανοϕάνειας (maximum likelihood). Η µέθοδος αυτή δίνει την εκτίµηση που έχει τη µέγιστη πιθανοϕάνεια, δηλαδή δίνει την τιµή της παραµέτρου η οποία, µεταξύ όλων των δυνατών τιµών της παραµέτρου, είναι η πιο πιθανή µε ϐάση το δείγµα. Υποθέτουµε ότι η τ.µ. X έχει κάποια γνωστή κατανοµή, δηλαδή γνωρί- Ϲουµε τη γενική µορϕή της ασκ F X (x; θ) και της σππ f X (x; θ). Η παράµετρος θ της κατανοµής είναι άγνωστη και ϑέλουµε να την εκτιµήσουµε από ένα δείγµα ανεξάρτητων παρατηρήσεων {x 1,..., x n }. Επειδή {x 1,..., x n } είναι ανεξάρτητες τ.µ., η πιθανότητα να τις παρατηρήσουµε σε ένα τυχαίο δείγµα µεγέθους n δίνεται από τη συνάρτηση πιθανόφανειας (likelihood function) ως προς θ L(x 1,..., x n ; θ) = f (x 1 ; θ) f (x n ; θ). Αν λοιπόν L(x 1,..., x n ; θ 1 ) > L(x 1,..., x n ; θ 2 ) για δύο τιµές θ 1 και θ 2 της θ, τότε η τιµή θ 1 είναι πιο αληθοϕανής από τη θ 2 γιατί δίνει µεγαλύτερη πιθανότητα να παρατηρήσουµε το συγκεκριµένο δείγµα των {x 1,..., x n }. Θέλουµε λοιπόν να ϐρούµε την πιο αληθοϕανή τιµή της θ, δηλαδή την τιµή ˆθ που µεγιστοποιεί τη L(x 1,..., x n ; θ) ή καλύτερα (για ευκολότερους υπολογισµούς) τη log L(x 1,..., x n ; θ). Άρα ο εκτιµητής µέγιστης πιθανοϕάνειας (maximum likelihood estimator) ˆθ ϐρίσκεται από τη σχέση log L(x 1,..., x n ; θ) θ = 0. (3.6) Αν ϑέλουµε να εκτιµήσουµε δύο ή περισσότερες παραµέτρους θ 1,..., θ m, η συνάρτηση πιθανόϕανειας είναι L(x 1,..., x n ; θ 1,..., θ m ) και οι εκτιµητές ˆθ 1,..., ˆθm ϐρίσκονται λύνοντας το σύστηµα των m εξισώσεων log L(x 1,..., x n ; θ 1,..., θ m ) θ j = 0 για j = 1,..., m. (3.7) Παράδειγµα 3.1. Εχουµε ένα τυχαίο δείγµα {x 1,..., x n } από κανονική κατανοµή N(µ, σ 2 ) και ϑέλουµε να εκτιµήσουµε τη µέση τιµή µ ϑεωρώντας τη σ 2 γνωστή. Η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανοµής

6 30 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ δίνεται από την (2.23). Η συνάρτηση πιθανόϕανειας (για την οποία µόνο η παράµετρος µ είναι άγνωστη) είναι ( ) 1 n/2 L(x 1,..., x n ; µ) = exp 2πσ 1 n (x 2 2σ 2 i µ) 2, όπου exp(x) e x. Ο λογάριθµος της συνάρτησης πιθανόϕανειας είναι log L(x 1,..., x n ; µ) = n 2 log 2π n 2 log(σ2 ) 1 2σ 2 n (x i µ) 2. Ο εκτιµητής µέγιστης πιθανοϕάνειας ˆµ ϐρίσκεται µηδενίζοντας την παράγωγο της log L log L = 0 1 n (x µ σ 2 i µ) = 0 (3.8) που δίνει τη λύση ˆµ = 1 n n x i = x, δηλαδή είναι ίδιος µε τον εκτιµητή x της µέσης τιµής µ που ορίσαµε για οποιαδήποτε κατανοµή της τ.µ. X. Παράδειγµα 3.2. Ας υποθέσουµε στο προηγούµενο παράδειγµα πως και η διασπορά σ 2 είναι άγνωστη. Τότε στην παραπάνω εξίσωση (3.8) προστίθεται και η εξίσωση log L σ 2 = 0 n 2σ σ 4 n (x i µ) 2 = 0. (3.9) Η επίλυση του συσήµατος των εξισώσεων (3.8) και (3.9) δίνει την ίδια λύση για τη µ και για τη σ 2 έχουµε ˆ σ 2 = 1 n n (x i ˆµ) 2 = 1 n n (x i x) 2. Οι εκτιµητές µέγιστης πιθανοϕάνειας λοιπόν για τη µέση τιµή µ και τη διασπορά σ 2 µιας τ.µ. που ακολουθεί κανονική κατανοµή είναι απλά η δειγµατική µέση τιµή και η δειγµατική διασπορά αντίστοιχα, αλλά για τη διασπορά έχουµε τον ασυµπτωτικά αµερόληπτο εκτιµητή s 2 (σχέση (3.4) ). Η µέθοδος µέγιστης πιθανοϕάνειας είναι η καλύτερη µέθοδος εκτίµησης αν γνωρίζουµε την κατανοµή της τ.µ. X και µπορεί να εϕαρµοσθεί σε οποιοδήποτε πρόβληµα εκτίµησης παραµέτρων από δείγµα ανεξάρτητων πα- ϱατηρήσεων.

7 3.2. ΕΚΤΙΜΗΣΗ ΙΑΣΤΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣΥΝΗΣ Εκτίµηση διαστήµατος εµπιστοσύνης Η σηµειακή εκτίµηση ˆθ από κάποιο δείγµα δεν περιέχει καµιά πληροϕο- ϱία για την ακρίβεια της εκτίµησης της θ. Η εκτίµηση ˆθ που παίρνουµε από ένα δείγµα είναι µια τιµή που δε γνωρίζουµε πόσο κοντά είναι στην πραγµατική τιµή της θ και επίσης η τιµή αυτή αλλάζει µε το δείγµα. Για παράδειγµα, υπολογίζουµε τη δειγµατική µέση τιµή x από ένα τυχαίο δείγµα µεγέθους n. Αν πάρουµε ένα άλλο τυχαίο δείγµα ίδιου µεγέθους, η τιµή της x ϑα είναι διαϕορετική. Μπορεί να είναι πιο κοντά ή πιο µακριά στην πραγµατική τιµή της µ απ ότι αυτή από το προηγούµενο δείγµα. Γι αυτό στην εκτίµηση της θ είναι σηµαντικό εκτός από τη σηµειακή εκτίµηση ˆθ να υπολογίσουµε και διάστηµα [θ 1, θ 2 ] που να µπορούµε να πούµε µε κάποια πιθανότητα 1 α ότι ϑα περιέχει την πραγµατική τιµή της παραµέτρου θ (δηλαδή η πιθανότητα σϕάλµατος είναι α). Στη συνέχεια ϑα παρουσιάσουµε την παραµετρική διαδικασία υπολογισµού διαστηµάτων εµπιστοσύνης χρησιµοποιώντας ως παράµετρο θ τη µέση τιµή µ και τη διασπορά σ 2. Θεωρούµε και πάλι πως οι παρατηρήσεις x 1,..., x n είναι ανεξάρτητες. Για τον υπολογισµό του διαστήµατος εµπιστοσύνης ϑα πρέπει να γνωρίζουµε την κατανοµή του εκτιµητή (π.χ. x ή s 2 ) και µε ϐάση αυτήν την κατανοµή ορίζεται το διάστηµα εµπιστοσύνης για την παράµετρο ιάστηµα εµπιστοσύνης της µέσης τιµής µ Το διάστηµα εµπιστοσύνης της µ υπολογίζεται µε ϐάση την κατανοµή της τ.µ. x, που είναι ο καλύτερος εκτιµητής της µ. Πράγµατι στην παράγραϕο αναϕέρθηκε ότι η x είναι αµερόληπτος εκτιµητής της µ, δηλαδή ισχύει µ x E[ x] = µ (3.10) και άρα η µέση τιµή της x είναι το ίδιο το µ. Η διασπορά της x είναι σ 2 x Var[ x] = Var 1 n x i n = 1 n Var[x n 2 i ] = 1 n 2 (nσ2 ) = σ2 n. (3.11) και άρα η τυπική απόκλιση της είναι σ x = σ/ n και ονοµάζεται σταθερό σϕάλµα (standard error) του εκτιµητή x. Η µορϕή της κατανοµής της x εξαρτάται από το µέγεθος του δείγµατος n, από το αν η κατανοµή της X είναι κανονική και επίσης από το αν γνωρίζουµε τη διασπορά της. Αν η κατανοµή της τ.µ. X είναι κανονική, X N(µ, σ 2 ), τότε οι παρατη- ϱήσεις x 1,..., x n ακολουθούν την ίδια κατανοµή και άρα ο µέσος όρος τους x ακολουθεί επίσης κανονική κατανοµή και ισχύει x N(µ, σ 2 /n). Από το

8 32 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΟΘ στην παράγραϕο το ίδιο ισχύει ακόµα και όταν δε γνωρίζουµε την κατανοµή της τ.µ. X αλλά το δείγµα είναι µεγάλο (n > 30). Στην πράξη όµως δε γνωρίζουµε τη διασπορά σ 2 της τ.µ. X. Αν ϑεωρήσουµε αντί για σ 2 τη δειγµατική διασπορά s 2, η υπόθεση x N(µ, s 2 /n) δεν είναι πλέον ακριβής αλλά η x ακολουθεί µια άλλη κατανοµή, επίσης συµµετρική και µε κωνοειδές σχήµα, αλλά µε πιο παχιές ουρές από την κανονική. Ειδικότερα η κανονικοποίηση της x, ( x µ)/(s/ n), ακολουθεί την κατανοµή Student ή t-κατανοµή µε n 1 ϐαθµούς ελευθερίας t = x µ s/ n t n 1. (3.12) Οι ϐαθµοί ελευθερίας είναι n 1 γιατί υπάρχουν n ελεύθερες παρατηρήσεις στο δείγµα που δεσµεύονται µε µια συνθήκη, να δίνουν την s 2. Στο Σχήµα 3.1α δίνεται το γράϕηµα της σππ της κατανοµής Student για διαϕο- ϱετικούς ϐαθµούς ελευθερίας. Για ένα ϐαθµό ελευθερίας (δείγµα δύο µόνο (α) N(0,1) t (β) 0.3 t 10 t f X (x) f X (x) t 24,0.025 = t 24,0.975 = X X Σχήµα 3.1: (α) Η σππ της τυπικής κανονικής κατανοµής και της Student για ϐαθµούς ελευθερίας όπως δίνονται στο ένθετο. (ϐ) Η σππ της Student για 24 ϐαθµούς ελευθερίας και οι κρίσιµες τιµές για α = παρατηρήσεων) η κατανοµή Student διαϕέρει φανερά από την τυπική κανονική κατανοµή και έχει πολύ παχιές ουρές. Αυτή η κατανοµή είναι γνωστή µε πολλά ονόµατα (Cauchy, Lorentzian, Breit-Wigner) και χρησιµοποιείται συχνά στη φυσική, όπως στη φυσική υψηλής ενέργειας ως µοντέλο σππ για την ενέργεια που εµϕανίζεται συντονισµός. Καθώς οι ϐαθµοί ελευθερίας πληθαίνουν η κατανοµή Student συγκλίνει στην τυπική κανονική κατανοµή. Πρακτικά για µεγάλα δείγµατα δεν υπάρχει διαϕορά µεταξύ της κατανοµής Student και της τυπικής κανονικής κατανοµής. Στην Παράγραϕο είχε δειχθεί ότι για την τυπική κανονική κατανο- µή σε κάθε πιθανότητα, έστω 1 α, αντιστοιχεί ένα διάστηµα τιµών της z

9 3.2. ΕΚΤΙΜΗΣΗ ΙΑΣΤΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣΥΝΗΣ 33 συµµετρικό ως προς το 0, [ z 1 α/2, z 1 α/2 ], έτσι ώστε P( z 1 α/2 < z z 1 α/2 ) = Φ(z 1 α/2 ) Φ( z 1 α/2 ) = 1 α, όπου Φ(z) είναι η ασκ της τυπικής κανονικής κατανοµής. Αντίστοιχα για την κατανοµή Student µε n 1 ϐαθµούς ελευθερίας σε κάθε πιθανότητα 1 α αντιστοιχεί ένα διάστηµα τιµών της t, [ t n 1,1 α/2, t n 1,1 α/2 ], έτσι ώστε ίσχύει P( t n 1,1 α/2 < t t n 1,1 α/2 ) = 1 α, (3.13) Για παράδειγµα για α = 0.05 και 24 ϐαθµούς ελευθερίας το διάστηµα [ 2.064, 2.064] περιέχει την τ.µ. t µε πιθανότητα 0.95, όπου t 24,0.975 = 2.064, όπως φαίνεται στο Σχήµα 3.1ϐ. Η τιµή που ορίζει την ουρά της κατανοµής λέγεται και κρίσιµη τιµή (critical value) και παραδοσιακά δίνεται από κατάλληλο στατιστικό πίνακα, αλλά µπορεί να υπολογισθεί εύκολα (π.χ. στο matlab η κρίσιµη τιµή για την κατανοµή Student δίνεται από τη συνάρτηση tinv). Για να ϐρούµε το διάστηµα που µε πιθανότητα 1 α περιέχει την παραµέτρο µ αντικαθιστούµε το t = x µ s/ στη σχέση (3.13) και λύνουµε τις ανισότητες n ως προς µ P( x t n 1,1 α/2 s n < µ x t n 1,1 α/2 s n ) = 1 α. (3.14) Η παραπάνω σχέση ορίζει πως το διάστηµα ] s s [ x t n 1,1 α/2 n, x + t n 1,1 α/2 n x ± t n 1,1 α/2 s n ή (3.15) περιέχει την πραγµατική µέση τιµή µ για κάποια δοθείσα πιθανότητα 1 α που είναι το προκαθορισµένο επίπεδο (ή στάθµη) εµπιστοσύνης (confidence level) και λέγεται διάστηµα εµπιστοσύνης (confidence interval) της µ σε ε- πίπεδο εµπιστοσύνης 1 α. Οταν το δείγµα είναι µεγάλο η κατανοµή Student συγκλίνει στην τυπική κανονική κατανοµή και άρα στο διάστηµα εµπιστοσύνης η κρίσιµη τιµή από την κατανοµή Student t n 1,1 α/2 µπορεί να αντικατασταθεί από αυτήν της τυπικής κανονικής z 1 α/2. Αν το δείγµα είναι µικρό και δε µπορούµε να υποθέσουµε πως η κατανοµή της τ.µ. X είναι κανονική, π.χ. γιατί φαίνεται από ένα ιστόγραµµα να είναι ισχυρά ασύµµετρη (λοξή), τότε δε µπορούµε να χρησιµοποιήσουµε το παραµετρικό διάστηµα εµπιστοσύνης στην (3.15) για τη µέση τιµή µ. Σε αυτήν την περίπτωση ϑα πρέπει να καταϕύγουµε στη µη-παραµετρική προσέγγιση. Η πιο συχνή µη-παραµετρική µέθοδος χρησιµοποιεί τις τάξεις (ranks) των δεδοµένων, δηλαδή τη σειρά τους όταν αυτά κατατάσσονται σε αύξουσα σειρά.

10 34 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Παράδειγµα 3.3. Θέλουµε να µελετήσουµε κατά πόσο ασϕάλειες ενός τύπου καίγονται σε ένταση ϱεύµατος 40 αµπέρ όπως είναι η ένδειξη τους. Στον Πίνακα 3.1 δίνονται οι µετρήσεις έντασης του ηλεκτρικού ϱεύµατος στις ο- ποίες κάηκαν 25 ασϕάλειες που δοκιµάσαµε. Η τ.µ. X που µας ενδιαϕέρει Πίνακας 3.1: εδοµένα ορίου έντασης ηλεκτρικού ϱεύµατος που κάηκαν 25 ασϕάλειες των 40 αµπέρ. είναι το όριο έντασης ηλεκτρικού ϱεύµατος που καίγονται ασϕάλειας των 40 αµπέρ. Η δειγµατική µέση τιµή της είναι x = και η δειγµατική διασπορά της είναι s 2 = x i = = x 2 i 25 x 2 = 1 24 ( ) = Με ϐάση αυτό το δείγµα η εκτίµηση της µέση τιµής µ είναι x = αµπέρ και της διασποράς σ 2 είναι s 2 = (αµπέρ) 2. Εστω τώρα ότι ϑέλουµε να εκτιµήσουµε διάστηµα εµπιστοσύνης σε επίπεδο 95% για το µέσο όριο έντασης ηλεκτρικού ϱεύµατος για ασϕάλειες των 40 αµπέρ. Το δείγµα είναι µικρό (n = 25 < 30). Εξετάζουµε τη δειγµατική κατανοµή του ορίου έντασης ηλεκτρικού ϱεύµατος από τα δεδοµένα µας. Για αυτό σχεδιάζουµε το ιστόγραµµα και το ϑηκόγραµµα των δεδοµένων του Πίνακα 3.1, τα οποία παρουσιάζονται στο Σχήµα 3.2. Το ϑηκόγραµµα (boxplot) είναι η απεικόνιση των τεταρτοµορίων των δεδοµένων, και δίνεται από τους παρακάτω 5 αριθµούς : τη µικρότερη παρατήρηση, την παρατήρηση µε τάξη στο 25% των παρατηρήσεων (πρώτο τεταρτοµόριο), τη διάµεσο, την παρατή- ϱηση µε τάξη στο 75% των παρατηρήσεων (τρίτο τεταρτοµόριο) και τη µεγαλύτερη τιµή. Στο ϑηκόγραµµα, η ϑήκη (κουτί) διαγράϕεται µεταξύ του πρώτου και τρίτου τεταρτοµορίου και οι µύστακες ενώνουν τα τεταρτοµόρια µε τα άκρα (ή διακόπτεται η γραµµή και οι ακραίες τιµές δηλώνονται µε κάποιο σύµβολο όταν είναι απόµακρες). Τέλος σχηµατίζεται µια γράµµη στη ϑήκη στη ϑέση της διαµέσου. Από το ϑηκόγραµµα µπορούµε να κρίνουµε τη συµµετρία της κατανοµής που αναϕέρονται τα δεδοµένα (αν η γραµµή της διαµέσου ϐρίσκεται προς το κέντρο της ϑήκης και

11 3.2. ΕΚΤΙΜΗΣΗ ΙΑΣΤΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣΥΝΗΣ 35 6 (α) 41.5 (β) counts X X Column Number Σχήµα 3.2: Ιστόγραµµα στο (α) και ϑηκόγραµµα στο (ϐ) των δεδοµένων του ορίου έντασης ηλεκτρικού ϱεύµατος για ασϕάλειες των 40 αµπέρ του Πίνακα 3.1. οι µύστακες έχουν περίπου στο ίδιο µήκος) και κατ επέκταση αν η κατανοµή είναι κανονική. Από το ιστόγραµµα και το ϑηκόγραµµα ϐλέπουµε ότι η κατανοµή του ορίου έντασης ηλεκτρικού ϱεύµατος φαίνεται να είναι κανονική (είναι συµ- µετρική και δεν έχει µακριές ουρές). Άρα µπορούµε να υποθέσουµε ότι το όριο έντασης ηλεκτρικού ϱεύµατος X ακολουθεί κανονική κατανοµή και µπο- ϱούµε να χρησιµοποιήσουµε το διάστηµα εµπιστοσύνης από την κατανοµή Student που δίνεται στην (3.15). Βρίσκουµε την κρίσιµη τιµή t n 1,1 α/2 για 1 α/2 = και n 1 = 24, t 24,0.975 = (από το στατιστικό πίνακα για την κατανοµή Student ή υπολογίζοντας απευθείας την αντίστροϕη ασκ σε κάποιο πρόγραµµα όπως το matlab, δες επίσης Σχήµα 3.1ϐ). Το διάστηµα εµπιστοσύνης για τη µ είναι ± [39.42, 40.18]. 5 Με ϐάση το παραπάνω 95% διάστηµα εµπιστοσύνης µπορούµε να πούµε ότι η σηµειακή εκτίµηση x = είναι αρκετά ακριβής αϕού το αντίστοιχο 95% διάστηµα εµπιστοσύνης είναι αρκετά µικρό. Επίσης παρατηρούµε ότι το 95% διάστηµα εµπιστοσύνης περιέχει το 40, δηλαδή µε 95% εµπιστοσύνη µπορούµε να συµπεράνουµε ότι κατά µέσο όρο οι ασϕάλειες διασϕαλίζουν την ένδειξη τους και καίγονται πράγµατι σε ένταση ηλεκτρικού ϱεύµατος 40 αµπέρ.

12 36 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ιάστηµα εµπιστοσύνης της διασποράς σ 2 Για να ορίσουµε διάστηµα εµπιστοσύνης για τη µέση τιµή µ κανονικοποιήσαµε τον εκτιµητή x ως t = x µ s/ ώστε να ακολουθεί κατανοµή Student. n Το ίδιο ϑα κάνουµε και εδώ για τον εκτιµητή s 2 της διασποράς σ 2. Η κανονικοποίηση είναι (n 1)s 2 /σ 2 που ακολουθεί την κατανοµή X 2 µε n 1 ϐαθµούς ελευθερίας. Για να δείξουµε αυτό το αποτέλεσµα ας δούµε πρώτα πως προκύπτει η κατανοµή αυτή. Η κατανοµή X 2 χρησιµοποιείται σε πολλά προβλήµατα στατιστικής συµπερασµατολογίας. Εστω ότι η τ.µ. χ 2 είναι το άθροισµα τετραγώνων των διαϕορών µεταξύ παρατηρούµενων και προσδοκώµενων ή µέσων τιµών διαι- ϱούµενο µε τη διασπορά τους. Είναι φανερό από τον ορισµό της ότι η χ 2 εξαρτάται από το πλήθος των παρατηρήσεων n. Ειδικότερα όταν οι παρατη- ϱήσεις προέρχονται από την ίδια κατανοµή η χ 2 ορίζεται ως n χ 2 (x i x) 2 = (3.16) σ 2 και ακολουθεί κατανοµή X 2 µε n 1 ϐαθµούς ελευθερίας (ένας ϐαθµός ελευ- ϑερίας χάνεται λόγω της συνθήκης της δειγµατικής µέσης τιµής x). Συνδυά- Ϲοντας της σχέση (3.16) µε τη σχέση (3.3) που ορίζει τη δειγµατική διασπορά s 2 έχουµε το Ϲητούµενο αποτέλεσµα χ 2 = (n 1)s2 σ 2 X 2 n 1. (3.17) Στο Σχήµα 3.3α δίνεται το γράϕηµα της σππ της κατανοµής X 2 για διαϕο- ϱετικούς ϐαθµούς ελευθερίας. Για λίγους ϐαθµούς ελευθερίας η κατανοµή X 2 είναι φανερά ασύµµετρη αλλά καθώς οι ϐαθµοί ελευθερίας πληθαίνουν γίνεται πιο συµµετρική και κωνοειδής. Για πολλούς ϐαθµούς ελευθερίας προσεγγίζει την κανονική κατανοµή. Γενικά επειδή η κατανοµή X 2 δεν είναι συµµετρική γύρω από το 0, οι ουρές της ορίζονται µε δύο κρίσιµες τιµές, την αριστερή κρίσιµη τιµή χ 2 και τη δεξιά κρίσιµη τιµή n 1,α/2 χ2 για κάποιο n 1,1 α/2 επίπεδο σηµαντικότητας α. Στο Σχήµα 3.3ϐ φαίνονται οι ουρές για n = 25 και α = Η πιθανότητα 1 α η τ.µ. χ 2 να ϐρίσκεται µεταξύ των ορίων που δίνονται από την αριστερή και δεξιά κρίσιµη τιµή είναι P(χ 2 n 1,α/2 < χ2 < χ 2 n 1,1 α/2 ) = 1 α. (3.18) Αντικαθιστώντας χ 2 = (n 1)s 2 /σ 2 και λύνοντας τις δύο ανισότητες ως προς σ 2 στη σχέση (3.18) ϐρίσκουµε το (1 α)% διάστηµα εµπιστοσύνης για τη σ 2 (n 1)s2 (n 1)s2,. (3.19) χ 2 n 1,1 α/2 χ 2 n 1,α/2

13 3.2. ΕΚΤΙΜΗΣΗ ΙΑΣΤΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣΥΝΗΣ (α) 0.06 (β) X X f X (x) X 2 24 X f X (x) X 2 24,0.025 = 12.4 X 2 24,0.975 = X X Σχήµα 3.3: (α) Η σππ της κατανοµής X 2 για ϐαθµούς ελευθερίας όπως δίνονται στο σχήµα. (ϐ) Η σππ της κατανοµής X 2 για 24 ϐαθµούς ελευθερίας και οι κρίσιµες τιµές για α = Το 95% δ.ε. για την τυπική απόκλιση σ έχει ως άκρα τις τετραγωνικές ϱίζες των αντίστοιχων άκρων του 95% δ.ε. για τη διασπορά σ 2. Παράδειγµα 3.4. Από τα δεδοµένα για το όριο έντασης ηλεκτρικού ϱεύµατος ασϕάλειας που χρησιµοποιήθηκαν στο Παράδειγµα 3.3 ϑέλουµε να εκτιµήσουµε τη διασπορά σ 2 του ορίου έντασης. Η σηµειακή εκτίµηση ϐρέθηκε να είναι s 2 = (αµπέρ) 2. Για n 1 = 24 και α = 0.05 από τον στατιστικό πίνακα για τη X 2 (ή µε απευθείας υπολογισµό στο matlab µε τη συνάρτηση chi2inv) ϐρίσκουµε χ 2 = 24, και χ2 24, = 39.4 (δες επίσης Σχήµα 3.3ϐ). Το 95% δ.ε. για τη διασπορά σ 2 είναι [ ] 0.854, = [0.52, 1.65] Το 95% δ.ε. για την τυπική απόκλιση σ του ορίου ηλεκτρικού ϱεύµατος είναι [ 0.52, 1.65] = [0.72, 1.28], που δείχνει ότι οι ασϕάλειες δεν καίγονται µε µεγάλη ακρίβεια γύρω από το όριο των 40 αµπέρ αλλά µε µια τυπική απόκλιση που περιµένουµε να κυµαίνεται µεταξύ 0.7 και 1.3 αµπέρ. Αυτό το συµπέρασµα φαίνεται να είναι σε αντίθεση µε το συµπέρασµα για την καλή ακρίβεια εκτίµησης του µέσου ορίου ηλεκτρικού ϱεύµατος µ που ϐρήκαµε στο Παράδειγµα 3.3. Εδώ ϑα πρέπει να τονισθεί ότι η κατανοµή του εκτιµητή x της µέσης τιµής είναι πολύ πιο στενή από την κατανοµή της ίδιας της τ.µ. X και µάλιστα η διασπορά της όπως εκτιµάται από το δείγµα είναι s 2 /n δηλαδή η τυπική της απόκλιση (το τυπικό σϕάλµα) είναι n φορές µικρότερη από την τυπική απόκλιση

14 38 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ της X. Μια τυπική µέτρηση του ορίου έντασης ηλεκτρικού ϱεύµατος που καίγεται η ασϕάλεια των 40 αµπέρ µε ϐάση το δείγµα των 25 παρατηρήσεων, ϑα περιµέναµε να κυµαίνεται στο διάστηµα x ±s = 39.80± = 39.80± Επίσης το 95 % των µετρήσεων του ορίου ηλεκτρικού ϱεύµατος ϑα περιµέναµε να ϐρίσκεται στο διάστηµα x ± t n 1,1 α/2 s. (3.20) δηλαδή ± = ± 1.763, που δηλώνει ότι ϑα εµϕανίζονται ασϕάλειες µε σοβαρές αποκλίσεις από την ονοµαστική ένδειξη της ασϕάλειας. 3.3 Ελεγχος υπόθεσης Σε πολλά προβλήµατα δεν ενδιαϕερόµαστε να εκτιµήσουµε µε κάποια α- κρίβεια την τιµή της παραµέτρου αλλά να διαπιστώσουµε αν η παραµέτρος είναι µικρότερη ή µεγαλύτερη από µια δεδοµένη τιµή που έχει φυσική ση- µασία για το πρόβληµα µας. Στο προηγούµενο παράδειγµα µπορεί να µας ενδιαϕέρει να ελέγξουµε αν το µέσο όριο έντασης ηλεκτρικού ϱεύµατος που καίγονται οι ασϕάλειες των 40 αµπέρ διαϕέρει σηµαντικά από 40 αµπέρ. Σε όργανα µέτρησης µας ενδιαϕέρει να ελέγξουµε αν η µέτρηση είναι σωστή και δεν υπάρχει συστηµατικό λάθος στο όργανο µέτρησης. Βέβαια την απάντηση σε τέτοια ερωτήµατα µπορεί να τη δώσει η εκτίµηση κατάλληλου διαστήµατος εµπιστοσύνης ελέγχοντας αν η δεδοµένη τιµή ανήκει σ αυτό το διάστηµα ή όχι, αλλά εδώ ϑα δούµε µια διαϕορετική προσέγγιση, ϑέτοντας κατάλληλη στατιστική υπόθεση και ελέγχοντας αν είναι αποδεκτή ή όχι. Ο έλεγχος υπόθεσης (hypothesis testing) επεξεργάζεται στατιστικά εγαλεία (τον εκτιµητή και την κατανοµή του) σε µια διαδικασία λήψης απόϕασης. Για τη διαδικασία ελέγχου µιας στατιστικής υπόθεσης πρώτα ορίζουµε τη στατιστική υπόθεση, µετά υπολογίζουµε το στατιστικό ελέγχου και την περιοχή απόρριψης και τέλος αποϕασίζουµε για την υπόθεση µε ϐάση την ένδειξη που έχουµε από το δείγµα. Η στατιστική υπόθεση (statistical hypothesis) µπορεί να είναι µια οποιαδήποτε στατιστική δήλωση ή πρόταση που ϑέτουµε υπό έλεγχο µε ϐάση τις παρατηρήσεις. Στην αρχή ϑα µελετήσουµε υποθέσεις για την τιµή µιας παραµέτρου και στη συνέχεια για την κατανοµή µιας τ.µ.. Η µηδενική υ- πόθεση (null hypothesis) την οποία ϑέτουµε υπό έλεγχο συµβολίζεται Η 0 ενώ η εναλλακτική υπόθεση (alternative hypothesis) την οποία δεχόµαστε αν απορρίψουµε τη Η 0 συµβολίζεται Η 1. Οι δυνατές αποϕάσεις του ελέγχου είναι :

15 3.3. ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΗΣ Σωστή απόϕαση: Αποδεχόµαστε την Η 0 όταν η Η 0 είναι σωστή. Η πιθανότητα αυτής της απόϕασης είναι P(αποδοχή της Η 0 Η 0 σωστή) = 1 α. 2. Σϕάλµα τύπου ΙΙ (type II error): Αποδεχόµαστε την Η 0 όταν η Η 0 είναι λανθασµένη. Η πιθανότητα αυτού του σϕάλµατος είναι P(αποδοχή της Η 0 Η 0 λανθασµένη) = ϐ. 3. Σϕάλµα τύπου Ι (type I error): Απορρίπτουµε την Η 0 όταν η Η 0 είναι σωστή. Η πιθανότητα αυτού του σϕάλµατος είναι το επίπεδο σηµαντικότητας P(απόρριψη της Η 0 Η 0 σωστή) = α. 4. Σωστή απόϕαση: Απορρίπτουµε την Η 0 και η Η 0 είναι λανθασµένη. Η πιθανότητα αυτής της απόϕασης είναι P(απόρριψη της Η 0 Η 0 λανθασµένη) = 1 ϐ και δηλώνει την ισχύ του ελέγχου (power of the test). Οι 4 δυνατές περιπτώσεις στην αποϕάση του ελέγχου δίνονται στον Πίνακα 3.2. Για να είναι ένας έλεγχος ακριβής ϑα πρέπει το πραγµατικό σϕάλµα Αποδοχή της Η 0 Απόρριψη της Η 0 Η 0 σωστή ορθή απόϕαση (1 α) σϕάλµα τύπου Ι (α) Η 0 λανθασµένη σϕάλµα τύπου ΙΙ (ϐ) ορθή απόϕαση (1 ϐ) Πίνακας 3.2: Οι 4 περιπτώσεις στην απόϕαση ελέγχου µε την αντίστοιχη πιθανότητα σε παρένθεση. τύπου Ι να είναι στο επίπεδο σηµαντικότητας α στο οποίο γίνεται ο έλεγχος. Στην πράξη αυτό δεν είναι ϐέβαια εϕικτό αλλά µπορούµε να το διαπιστώσουµε αν έχουµε τη δυνατότητα να κάνουµε προσοµοιώσεις. Για να υπολογίσουµε το πραγµατικό σϕάλµα τύπου Ι ϑα πρέπει να γνωρίζουµε ότι η Η 0 είναι σωστή και να επαναλάβουµε τον έλεγχο σε M διαϕορετικά δείγµατα ίδιου τύπου και στο ίδιο επίπεδο σηµαντικότητας α. Αν η Η 0 απορρίπτεται m φορές σε επίπεδο σηµαντικότητας α ϑα πρέπει για να είναι ο έλεγχος ακριβής (να έχει σωστή σηµαντικότητα) η αναλογία m/m να είναι κοντά στο α. Επίσης µας ενδιαϕέρει ο έλεγχος να έχει µεγάλη ισχύ. Την ισχύ του ελέγχου µπορούµε υπολογιστικά να τη µετρήσουµε και πάλι µε προσοµοιώσεις

16 40 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ όπου τώρα ϑα πρέπει να γνωρίζουµε ότι η Η 0 δεν είναι σωστή και επιπλέον ότι ο έλεγχος έχει σωστή σηµαντικότητα (σύµϕωνα µε τα παραπάνω). Οι παραπάνω προσοµοιώσεις συνήθως ακολουθούνται για να αξιολογήσουµε το στατιστικό που χρησιµοποιείται στον έλεγχο. Στη συνέχεια ϑα πα- ϱουσιάσουµε τη διαδικασία του παραµετρικού ελέγχου για τη µέση τιµή Ελεγχος µέσης τιµής Θέλουµε να ελέγξουµε µε ϐάση ένα δείγµα παρατηρήσεων {x 1,..., x n } µιας τ.µ. X αν η µέση τιµή µ της X µπορεί να πάρει κάποια τιµή µ 0, δηλαδή η µηδενική υπόθεση είναι Η 0 : µ = µ 0. Φυσικά όταν υποθέτουµε µ = µ 0 δεν εννοούµε αυστηρά την ισότητα και ϑα ϑέλαµε ο έλεγχος να αποϕασίζει ότι η Η 0 είναι ορθή όταν η µ ϐρίσκεται κοντά στην τιµή µ 0 και λανθασµένη αλλιώς. Ετσι η τυχόν απόρριψη της Η 0 δεν ερµηνεύεται ως αποδοχή της πρότασης µ = µ 0 αλλά µη-απόρριψη της, πάντα µε ϐάση το δείγµα. Ο κατάλληλος εκτιµητής της µ είναι η δειγµατική µέση τιµή x που υπολογίζεται από το δείγµα. Σύµϕωνα και µε τα παραπάνω, τιµές της x κοντά στη µ 0 υποστηρίζουν την ορθότητα της Η 0 και σχηµατίζουν την περιοχής α- ποδοχής της Η 0, ενώ τιµές της x µακριά από τη µ 0 δεν την υποστηρίζουν και σχηµατίζουν την περιοχή απόρριψης (rejection region) που συµβολίζουµε R. Η απόϕαση για την αποδοχή ή απόρριψη της Η 0 γίνεται µε ϐάση τις πιθανότητες και όπως για τα διαστήµατα εµπιστοσύνης έτσι και εδώ ορίζουµε επίπεδο σηµαντικότητας α (η επίπεδο εµπιστοσύνης 1 α) για την απόϕαση ελέγχου. Το α καθορίζει το κοντά και µακριά που αναϕέραµε παραπάνω. Στην παραµετρική προσέγγιση που ακολουθούµε εδώ το α ορίζει το εύρος των ουρών της κατανοµής του εκτιµητή x. Είχαµε δείξει πως η κανονικοποίηση του εκτιµητή x, t = x µ s/, ακολουθεί n κατανοµή Student ϑεωρώντας ότι η τ.µ. X ακολουθεί κανονική κατανοµή ή ότι το δείγµα είναι µεγάλο. Θεωρώντας ότι ισχύει η Η 0, έχουµε t = x µ 0 s/ n t n 1, όπου t είναι το στατιστικό ελέγχου (test statistic). Οι κρίσιµες τιµές του t για δεδοµένο α δίνουν τα όρια του R. Τιµές του t που είναι στις ουρές της κατανοµής t n 1 ανήκουν στο R, δηλαδή δεν είναι πιθανές όταν ισχύει η Η 0 και άρα η εµϕάνιση τους συνιστά απόρριψη της Η 0. Υπολογίζουµε την τιµή του στατιστικού t από το δείγµα, έστω t. Αν το t ανήκει στην περιοχή απόρριψης R που ορίσαµε για κάποιο επίπεδο σηµαντικότητας α απορρίπτουµε την Η 0. Σηµειώνεται ότι αυτή η απόρριψη ισχύει για το α που επιλέχτηκε και µπορεί η απόϕαση του ελέγχου να αλλάξει για µικρότερο α. Αντίστροϕα αν δεν απορρίπτουµε την Η 0 για κάποιο α, µπορεί να την απορρίψουµε για µεγαλύτερο α. Η µικρότερη τιµή του α που δίνει απόρριψη της Η 0 λέγεται p-τιµή (p-value) και είναι η πιθανότητα να παρατηρήσουµε για το t µια τιµή τόσο ακραία όσο το t όταν ισχύει η Η 0. Άρα

17 3.3. ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΗΣ 41 p-τιµή είναι η πιθανότητα το t να είναι στο R που ορίζεται µε κρίσιµη τιµή το t, δηλαδή p = 2 P(t > t ) = 2 (1 P(t < t )). (3.21) Οσο πιο κοντά στο 0 είναι η p-τιµή τόσο πιο σίγουρη είναι η απόρριψη της Η 0. Τιµές p > 0.05 δηλώνουν πως η Η 0 δε µπορεί να απορριϕθεί. Η p-τιµή υπολογίζεται εύκολα από την ασκ της κατανοµής t n 1 (στο matlab δίνεται από τη συνάρτηση tcdf), αλλά παλιότερα που τέτοιοι υπολογισµοί δεν ήταν εύκολα εϕικτοί δε χρησιµοποιούταν η p-τιµή και ο έλεγχος γινόταν σε κάποιο επίπεδο σηµαντικότητας α (µε απάντηση τύπου ναι / όχι). Σε κάποιες περιπτώσεις ο έλεγχος µπορεί να είναι µονόπλευρος (onesided), δηλαδή η απορριπτική περιοχή που ενισχύει την Η 1 σχηµατίζεται µόνο από τη µια ουρά της κατανοµής γιατί ϑεωρούµε πως είναι αδύνατον για το πρόβληµα µας η µ να παίρνει τιµές στην άλλη ουρά της κατανοµής του x. Η επιλογή µονόπλευρου ή δίπλευρου ελέγχου εξαρτάται από την έρευνα που ϑέλουµε να κάνουµε και από το κατά πόσο µπορούµε να προβλέψουµε το αποτέλεσµα της έρευνας. Για παράδειγµα, έστω ότι ϑέλουµε να ελέγξουµε αν η µέση απόδοση µ ενός µηχανήµατος που σχεδιάσαµε µπορεί να φθάσει την απόδοση αναϕοράς µ 0 του άριστου µηχανήµατος (µηχάνηµα αναϕοράς). Σε αυτήν την περίπτωση ο έλεγχος πρέπει να είναι µονόπλευρος (Η 0 : µ = µ 0 ή ισοδύναµα Η 0 : µ µ 0 και Η 1 : µ < µ 0 ) γιατί γνωρίζουµε πως δε µπορεί µ > µ 0 αϕού η απόδοση του νέου µηχανήµατος δε µπορεί να ξεπεράσει αυτή του µηχανήµατος αναϕοράς. Παράδειγµα 3.5. Με αναϕορά στο Παράδειγµα 3.3 έστω ότι ϑέλουµε να ελέγξουµε αν το µέσο όριο του ηλεκτρικού ϱεύµατος που καίγονται οι α- σϕάλειες των 40 αµπέρ είναι πράγµατι 40. Οι υποθέσεις του ελέγχου είναι Η 0 : µ = 40 και Η 1 : µ 40. Είχαµε δεχθεί πως µε ϐάση το δείγµα των 25 ασϕαλειών η κατανοµή του οριού του ηλεκτρικού ϱεύµατος που καίγονται οι ασϕάλειες των 40 αµπέρ µπορεί να είναι κανονική. Χρησιµοποιούµε λοιπόν ως στατιστικό ελέγχου το t = x 40 s/ που ακολουθεί την t n n 1 σύµϕωνα µε την Η 0. Για επίπεδο ση- µαντικότητας α = 0.05 η απορριπτική περιοχή ορίζεται από την κρίσιµη τιµή t n 1,1 α/2 για 1 α/2 = και n 1 = 24, t 24,0.975 = Η απορριπτική περιοχή είναι R = {t t < t > 2.064} = {t t > 2.064}. Η τιµή του στατιστικού από το δείγµα είναι ( x = 39.8, s = 0.925) t = /5 = 1.081

18 42 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ που προϕανώς δεν ανήκει στην απορριπτική περιοχή και άρα δε µπορούµε να απορρίψουµε την Η 0, ότι οι ασϕάλειες καίγονται στο όριο των 40 αµπέρ. Από την ασκ της t 24 -κατανοµής για t = ϐρίσκουµε την p-τιµή p = 2(1 P(t t )) = 2(1 P(t 1.081)) = 2( ) = 0.29 που δηλώνει ποσοστό εµπιστοσύνης της απόρριψης της Η 0 σε επίπεδο περίπου 70%. Πρακτικά αυτό σηµαίνει πως δε µπορούµε να απορρίψουµε την Η 0. Αν για κάποιο λόγο αποκλείουµε ότι οι ασϕάλειες µπορούν να καίγονται σε υψηλότερο όριο από 40 αµπέρ, τότε ο έλεγχος γίνεται µονόπλευρος, Η 0 : µ 40 και Η 1 : µ < 40. Η απορριπτική περιοχή για α = 0.05 τότε είναι R = {t t < t n 1,α/2 } = {t t < t 24,0.05 } = {t t < 1.71}. Και πάλι όµως η Η 0 δεν απορρίπτεται αϕού t R. Η p-τιµή για το µονόπλευρο έλεγχο είναι p = P(t t) = που και πάλι είναι αρκετά υψηλό και δηλώνει πως η Η 0 δε µπορεί να απορ- ϱιϕθεί Ελεγχος διασποράς Η στατιστική υπόθεση για τη διασπορά σ 2 είναι όπως και για τη µέση τιµή, δηλαδή Η 0 : σ 2 = σ 2 0 µε κατάλληλη εναλλακτική υπόθεση Η 1 ανάλογα αν ο έ- λεγχος είναι δίπλευρος ή µονόπλευρος. Το στατιστικό ελέγχου είναι το χ 2 που χρησιµοποιήθηκε στο διάστηµα εµπιστοσύνης της σ 2 (δες Παράγραϕο 3.2.2) χ 2 (n 1)s2 σ 2 0 X 2 n 1, (3.22) όπου s 2 είναι ο εκτιµητής της διασποράς. Από την κατανοµή X 2 µε n 1 ϐαθ- µούς ελευθερίας και για επίπεδο σηµαντικότητας α ϐρίσκουµε τις κρίσιµες τιµές και η περιοχή απόρριψης R δίνεται για τον κάθε τύπο ελέγχου ως 1. Η 1 : σ 2 σ 2 0, R = {χ2 χ 2 < χ 2 n 1,α/2 χ2 > χ 2 n 1,1 α/2 }. 2. Η 1 : σ 2 < σ 2 0, R = {χ2 χ 2 < χ 2 n 1,α }. 3. Η 1 : σ 2 > σ 2 0, R = {χ2 χ 2 > χ 2 n 1,1 α }. Το στατιστικό ελέγχου από το δείγµα χ 2 υπολογίζεται ϑέτοντας στη σχέση (3.22) την εκτίµηση s 2 από το δείγµα. Αν χ 2 R η Η 0 απορρίπτεται. Η p-τιµή για τα τρία είδη ελέγχου είναι

19 3.3. ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΗΣ Η 1 : σ 2 σ 2 0, p = P(χ2 < χ 2 χ 2 > χ 2 }. 2. Η 1 : σ 2 < σ 2 0, p = P(χ2 < χ 2 }. 3. Η 1 : σ 2 > σ 2 0, p = P(χ2 > χ 2 }. Παράδειγµα 3.6. Θέλουµε να ελέγξουµε σε επίπεδο εµπιστοσύνης 99% αν η τυπική απόκλιση σ του όριου έντασης ηλεκτρικού ϱεύµατος των ασϕαλειών 40 αµπέρ µπορεί να είναι 0.7 αµπέρ. Χρησιµοποιούµε τα 25 δεδοµένα για το όριο έντασης ηλεκτρικού ϱεύµατος που χρησιµοποιήθηκαν στο Παράδειγ- µα 3.3. Εϕαρµόζουµε δίπλευρο έλεγχο για τη διασπορά : Η 0 : σ 2 = 0.49, Η 1 : σ Το µέγεθος του δείγµατος είναι n = 25 και η δειγµατική διασπορά είναι s 2 = (αµπέρ) 2. Η κρίσιµη τιµή του στατιστικού ελέγχου χ 2 για α = 0.01 είναι χ 2 = 24, και χ2 24,0.995 = Η περιοχή απόρριψης είναι R = {χ 2 χ 2 < χ 2 > }. Η στατιστική ελέγχου που παίρνουµε από το δείγµα είναι χ 2 = (n 1)s2 σ 2 0 = = Η χ 2 δεν ανήκει στην περιοχή απόρριψης και άρα δε µπορούµε να απορ- ϱίψουµε την Η 0 στο επίπεδο σηµαντικότητας α = Φαίνεται όµως να µπορούµε να απορρίψουµε την Η 0 για λίγο υψηλότερο α. Η τιµή αυτή είναι p = P(χ 2 < χ 2 χ 2 > χ 2 } = P(χ 2 > } = 1 P(χ 2 < } = = και άρα µπορούµε να απορρίψουµε την Η 0 σε επίπεδο σηµαντικότητας ως και (αλλά όχι 0.01). Στην παραπάνω σχέση της πιθανότητας επιλέγουµε µια από τις δύο ανισότητες (για την αριστερή ή δεξιά κρίσιµη τιµή που δίνεται από το χ 2 ) για να υπολογίσουµε την p-τιµή. Γενικά όταν ϑέλουµε να κάνουµε στατιστικό έλεγχο για την τυπική α- πόκλιση σ υψώνουµε στο τετράγωνο την τιµή της τυπικής απόκλισης που ϑέλουµε να ελέγξουµε και κάνουµε έλεγχο διασποράς γι αυτήν την τιµή Ελεγχος καταλληλότητας X 2 Μια άλλη περίπτωση που χρησιµοποιείται η κατανοµή X 2 είναι ο έλεγχος καλής προσαρµογής (goodness-of-fit test) γνωστής κατανοµής στα δεδοµένα, δηλαδή για να ελέγξουµε αν το δείγµα προέρχεται από πληθυσµό µε κάποια γνωστή κατανοµή.

20 44 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Για τον έλεγχο X 2 η τ.µ. X πρέπει να είναι διακριτή, ή αν είναι συνεχής να µετατραπεί σε διακριτή (δες Παράγραϕο 2.1.1). Πρακτικά αυτό σηµαίνει πως αν τα δεδοµένα είναι αριθµητικά ϑα πρέπει να ορισθεί πρώτα διαµέριση των τιµών και να οµαδοποιηθούν. Εστω οι K παρατηρούµενες διακριτές τιµές O j, j = 1,..., K, και οι αντίστοιχες αναµενόµενες τιµές E j από τη γνωστή κατανο- µή. Στην περίπτωση της διακριτικοποίησης, O j είναι η συχνότητα εµϕάνισης παρατηρήσεων σε κάθε οµάδα (διάστηµα) j από τις K οµάδες της διαµέρισης και E j η αντίστοιχη αναµενόµενη συχνότητα. Το στατιστικό ελέγχου είναι χ 2 = K (O j E j ) 2 j=1 E j. (3.23) Οταν η παρατηρούµενη τ.µ. X είναι διακριτή τότε οι αναµένοµενες τιµές E j δίνονται από το γινόµενο του πλήθους των δεδοµένων n µε την αντίστοιχη πιθανότητα της διακριτής κατανοµής f X (x j ) = P(X = x j ). Οταν η X είναι συνεχής οι αναµένοµενες τιµές E j υπολογίζονται ως E j = n(f X (x u j ) F X (x l j )), (3.24) όπου F X (x) είναι η ασκ της X για την τιµή x και x l j και x u j είναι το κάτω και πάνω άκρο του διαστήµατος j, αντίστοιχα. Οι ϐαθµοί ελευθερίας της κατανοµής X 2 είναι K c, όπου για διακριτή κατανοµή c = 1 επειδή οι αναµενόµενες συχνότητες E j δεν είναι όλες ανεξάρτητες αϕού το άθροισµα τους πρέπει να είναι n. Για συνεχή κατανοµή, οι παράµετροι της εκτιµούνται από τα δεδοµένα και άρα χάνονται τόσοι ϐαθµοί ελευθερίας επιπλέον όσες και οι παράµετροι της κατανοµής. Για παράδειγµα για να ελέγξουµε αν τα δεδοµένα προσαρµόζονται σε κανονική κατανοµή, υπολογίζονται πρώτα οι εκτιµήσεις της µέσης τιµής x και διασποράς s 2 από τα δεδοµένα για να ορίσουµε την ασκ της κανονικής κατανοµής και να υπολογίσουµε στη συνέχεια τις αναµενόµενες τιµές E j από την σχέση (3.24). Άρα σε αυτήν την περίπτωση οι ϐαθµοί ελευθερίας της X 2 κατανοµής είναι K 3. Εχοντας ότι κάτω από την Η 0 είναι χ 2 X 2 K c, εξετάζουµε αν το στατιστικό χ 2 από το δείγµα που δίνεται από την σχέση (3.23) ανήκει στην απορριπτική περιοχή R = {χ 2 χ 2 > χ 2 }. Εναλλακτικά µπορούµε να χρησιµοποιήσουµε την p-τιµή που ορίζεται ως p = P(χ 2 > χ 2 }. K c,1 α/2 Ο έλεγχος X 2 µπορεί να εϕαρµοσθεί για οποιαδήποτε µονοµεταβλητή κατανοµή, διακριτή ή συνεχή, για την οποία η ασκ µπορεί να υπολογισθεί. Εχει όµως και κάποια µειονεκτήµατα : εξαρτάται από τη διαµέριση για τη διακριτικοποίηση των δεδοµένων (όταν είναι αριθµητικά) και απαιτεί αρκετά µεγάλο δείγµα. Υπάρχουν και άλλοι έλεγχοι καλής προσαρµογής κατανοµής, όπως ο έλεγχος Kolmogorov-Smirnov που εϕαρµόζεται όµως µόνο για συνεχή κατανοµή.

21 3.3. ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΗΣ 45 Παράδειγµα 3.7. Εστω ένα παιχνίδι Ϲαριών, όπου ο παίχτης πετάει το Ϲάρι τρεις φορές και κερδίζει ανάλογα µε το πλήθος των εξαριών που φέρνει. Ας υποθέσουµε ότι ένας παίχτης παίζει 100 φορές και οι παρατηρούµενες εµφανίσεις εξαριών δίνονται στον Πίνακα 3.3. Αν το παιχνίδι είναι δίκαιο ϑα πλήθος εξαριών παρατηρούµενο πλήθος αναµενόµενο πλήθος Πίνακας 3.3: Οι εµϕανίσεις εξαριών σε 3 ϱίψεις Ϲαριών για 100 επαναλήψεις. Στη δεύτερη στήλη είναι οι παρατηρούµενες συχνότητες και στην τρίτη οι αναµενόµενες από τη διωνυµική κατανοµή B(3, 1/6). πρέπει να εµϕανίζεται εξάρι σε κάθε Ϲαριά µε πιθανότητα 1/6 (πιθανότητα επιτυχίας ). Στις 3 Ϲαριές η πιθανότητα να έρθουν 0,1,2, ή 3 εξάρια δίνεται από τη διωνυµική κατανοµή B(m, p) για πλήθος επαναλήψεων m = 3, πιθανότητα επιτυχίας p = 1/6 και δυνατές τιµές της τ.µ. X εµϕάνισης εξαριών 0,1,2,και 3. Θέλουµε να ελέγξουµε αν πράγµατι µπορούµε να δεχτούµε ότι X B(3, 1/6) µε ϐάση αυτό το δείγµα. Οι πιθανότητες εµϕάνισης 0,1,2, και 3 εξαριών από την B(3, 1/6) είναι (δες Παράγραϕο 2.3.1): P(X = 0) = 0.579, P(X = 1) = 0.347, P(X = 2) = 0.069, P(X = 3) = Οι αντίστοιχες αναµενόµενες συχνότητες είναι (n P(X = x)) και δίνονται στην τρίτη στήλη του Πίνακα 3.3. Συγκρίνοντας τις παρατηρούµενες και τις αναµενόµενες τιµές φαίνεται να υπάρχουν σοβαρές διαϕορές για τις πετυχηµένες Ϲαριές µε 2 και 3 εξάρια. Εϕαρµόζοντας τη σχέση (3.23) ϐρίσκουµε χ 2 = Η τιµή αυτή είναι πολύ µεγαλύτερη από την κρίσιµη τιµή της X 2 3 (ϐαθµοί ελευθερίας K c = 4 1) για α = 0.05 που είναι χ 2 3,0.95 = Η p-τιµή του ελέγχου είναι p = , δηλαδή είναι πάρα πολύ απίθανο το δείγµα αυτό να προέρχεται από τη διωνυµική κατανοµή B(3, 1/6). Μάλλον λοιπόν ο παίχτης δεν ϱίχνει σωστά τα Ϲάρια αλλά κάτι κάνει και φέρνει πιο συχνά εξάρες!

22 46 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Ασκήσεις Κεϕαλαίου 3 1. Η κατανοµή Poisson χρησιµοποιείται αντί της διωνυµικής όταν ο αριθ- µός m των επαναλήψεων των δοκιµών είναι µεγάλος και η πιθανότητα επιτυχίας p σε κάθε δοκιµή είναι µικρή. Το γινόµενο λ = mp είναι η παράµετρος της κατανοµής Poisson για την τ.µ. της εµϕάνισης x επιτυχιών και δίνεται ως λ λx f X (x; λ) = e x! (3.25) όπου x! = 1 2 x είναι το παραγοντικό του x. (α ) Εστω τυχαίο δείγµα ανεξάρτητων παρατηρήσεων {x 1,..., x n } από κατανοµή Poisson µε άγνωστη παράµετρο λ. είξετε ότι ο εκτιµητής µέγιστης πιθανοϕάνειας του λ είναι η δειγµατική µέση τιµή. (ϐ ) Φτιάξτε µια συνάρτηση στο matlab που ϑα δηµιουργεί M δείγ- µατα µεγέθους n από κατανοµή Poisson µε δεδοµένη παράµετρο λ και ϑα υπολογίζει τη δειγµατική µέση τιµή για κάθε ένα από τα M δείγµατα. Στη συνέχεια ϑα κάνει κατάλληλο ιστόγραµµα των M δειγµατικών µέσων τιµών και ϑα δίνει ως έξοδο το µέσο όρο από τις M δειγµατικές µέσες τιµές. Καλέστε τη συνάρτηση για διαϕορετικούς συνδυασµούς των M, n και λ. Είναι πάντα (και σύµϕωνα µε το αποτέλεσµα στο υποερώτηµα 1α ) το κέντρο της κατανοµής της δειγµατικής µέσης τιµής (που περιγράϕεται από το ιστόγραµµα) στην τιµή του λ; Βοήθεια ( matlab): Για τη δηµιουργία των τυχαίων αριθµών χρησιµοποίησε τη συνάρτηση poissrnd. 2. Ενα ασταθές στοιχείο (unstable particle) µετά από κάποιο χρόνο αποσυντίθεται (decays) σε άλλα σωµατίδια. Ο χρόνος Ϲωής ενός ασταθούς σωµατιδίου (µέχρι την αποσύνθεση του) είναι τ.µ. που πιστεύεται ότι ακολουθεί εκθετική (exponential) κατανοµή µε σππ f X (x; τ) = 1 τ e x/τ, (3.26) όπου τ η παράµετρος της κατανοµής. Επαναλάβετε τα ερωτήµατα 1α και 1β για την εκθετική κατανοµή. Βοήθεια ( matlab): Για τη δηµιουργία των τυχαίων αριθµών χρησιµοποίησε τη συνάρτηση exprnd.

23 3.3. ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΗΣ Σε συνέχεια της προηγούµενης άσκησης, προσοµοιώστε το χρόνο Ϲωής n σωµατιδίων (νετρονίων) δηµιουργώντας n τιµές από εκθετική κατανοµή µε µέσο χρόνο Ϲωής τ = 15min. Με ϐάση αυτό το δείγµα υπολογίστε το 95% παραµετρικό διάστηµα εµπιστοσύνης για το µέσο χρόνο Ϲωής και εξετάστε αν περιέχεται σε αυτό η τιµή τ = 15. (α ) Υπολογίστε M = 1000 δείγµατα µεγέθους n = 5. Σε τι ποσοστό ϐρίσκεται ο πραγµατικός µέσος χρόνος Ϲωής µέσα στο 95% διάστηµα εµπιστοσύνης ; (ϐ ) Κάνετε το ίδιο για M = 1000 αλλά n = 100. ιαϕέρει το ποσοστό αυτό από το παραπάνω ; Βοήθεια ( matlab): Για τον υπολογισµό διαστήµατος εµπιστοσύνης και ελέγχου για τη µέση τιµή µε χρήση της κατανοµής Student κάλεσε τη συνάρτηση ttest. 4. Η τάση διακοπής εναλλασσόµενου ϱεύµατος ενός µονωτικού υγρού δηλώνει τη διηλεκτρική ανθεκτικότητα του. Πήραµε τις παρακάτω πα- ϱατηρήσεις της τάσης διακοπής (kv) σε κάποιο κύκλωµα κάτω από ορισµένες συνθήκες (α ) (ϐ ) (γ ) (δ ) (ε ) Βρείτε 95% διάστηµα εµπιστοσύνης για τη διασπορά της τάσης διακοπής του κυκλώµατος. Από παλιότερες µετρήσεις είχαµε ϐρει πως η τυπική απόκλιση της τάσης διακοπής παρόµοιου κυκλώµατος ήταν περίπου 5 kv. Με ϐάση το δείγµα κάνετε έλεγχο για την υπόθεση πως αυτή είναι η τυπική απόκλιση της τάσης διακοπής. Βρείτε 95% διάστηµα εµπιστοσύνης για τη µέση τάση διακοπής του κυκλώµατος. Μπορούµε να αποκλείσουµε ότι η µέση τάση διακοπής είναι 52 kv; Κάνετε έλεγχο X 2 καλής προσαρµογής σε κανονική κατανοµή και ϐρείτε την p-τιµή του ελέγχου. Βοήθεια ( matlab): Για τον υπολογισµό διαστήµατος εµπιστοσύνης και ελέγχου για τη διασπορά µε χρήση της κατανοµής X 2 κάλεσε τη συνάρτηση vartest. Για τον έλεγχο X 2 καλής προσαρµογής κάλεσε τη συνάρτηση chi2gof.

24 48 ΚΕΦΑΛΑΙΟ 3. ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ 5. Ο ϑερµοπίδακας Old Faithful στην Αµερική είναι από τους πιο γνωστούς ϑερµοπίδακες για το µέγεθος αλλά και την κανονικότητα των εξάρσεων του (eruptions) (δες Στο αρχείο δεδοµένων eruption.dat στην ιστοσελίδα του µαθήµατος δίνονται στην πρώτη και δεύτερη στήλη 298 µετρήσεις (σε λεπτά) του διαστήµατος αναµονής (waiting time) και της διάρκειας του ξεσπάσµατος (duration) για το 1989 και στην τρίτη στήλη 298 µετρήσεις του διαστήµατος αναµονής έξαρσης για το Για κάθε ένα από τα τρία µετρούµενα µεγέθη κάνετε τα παρακάτω. (α ) (ϐ ) (γ ) Βρείτε 95% διάστηµα εµπιστοσύνης για την τυπική απόκλιση του µεγέθους και ελέγξτε αν είναι 10 για την αναµονή και 1 για τη διάρκεια. Βρείτε 95% διάστηµα εµπιστοσύνης για τη µέση τιµή του µεγέθους και ελέγξτε αν είναι 75 για την αναµονή και 2.5 για τη διάρκεια. Κάνετε έλεγχο X 2 καλής προσαρµογής σε κανονική κατανοµή και ϐρείτε την p-τιµή του ελέγχου. Με ϐάση τις 298 µετρήσεις για το χρόνο αναµονής και διάρκειας έξαρσης το 1989, εξετάστε αν µπορείτε να δεχθείτε τον παρακάτω ισχυρισµό (αντιγραϕή από τη διεύθυνση της Wikipedia): With an error of 10 minutes, Old Faithful will erupt 65 minutes after an eruption lasting less than 2.5 minutes or 91 minutes after an eruption lasting more than 2.5 minutes.

Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. ˆθ παίρνει διαφορετικές τιµές, δηλαδή η ˆθ είναι η ίδια τ.µ. µε κάποια κατανοµή κι έχει µέση

Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. ˆθ παίρνει διαφορετικές τιµές, δηλαδή η ˆθ είναι η ίδια τ.µ. µε κάποια κατανοµή κι έχει µέση Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Οι στατιστικές δείγµατος, όπως η δειγµατική µέση τιµή x και η δειγµατική διασπορά s 2, που ϑα δούµε παρακάτω, υπολογίζονται από τα στατιστικά δεδοµένα που έχουµε συλλέξει

Διαβάστε περισσότερα

Κεϕάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. {x 1,..., x n } της X από ένα δείγµα µεγέθους n. Τότε η σηµειακή εκτίµηση της θ δίνεται

Κεϕάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. {x 1,..., x n } της X από ένα δείγµα µεγέθους n. Τότε η σηµειακή εκτίµηση της θ δίνεται Κεϕάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Οι στατιστικές δείγµατος που υπολογίζονται από τα δεδοµένα που έχουν συλλεχθεί, όπως η δειγµατική µέση τιµή x και η δειγµατική διασπορά s 2, χρησιµοποιούνται για την εκτίµηση

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Κεφάλαιο 3 ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Σε πολλά προβλήµατα της µηχανικής δεν ενδιαφερόµαστε να εκτιµήσουµε την τιµή της παραµέτρου αλλά να διαπιστώσουµε αν η παραµέτρος είναι µικρότερη ή µεγαλύτερη από

Διαβάστε περισσότερα

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 4 Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ Μετά από την εκτίµηση των παραµέτρων ενός προσοµοιώµατος, πρέπει να ελέγχουµε την αλήθεια της υποθέσεως που κάναµε. Είναι ορθή η υπόθεση που κάναµε? Βεβαίως συνήθως υπάρχουν

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών Εισαγωγή Στα προβλήµατα που έχουµε ασχοληθεί µέχρι τώρα, υποστηρίζουµε ότι έχουµε ένα δείγµα X = (X 1, X 2,...,X n ) F(,θ). π.χ. X 1, X 2,...,X n τ.δ. N(µ,σ 2 ),

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Στατιστική ΜΕΡΟΣ Β. για Ηλεκτρολόγους Μηχανικούς. ηµήτρης Κουγιουµτζής http://www.users.auth.gr/dkugiu/teach/electricengineer/

Στατιστική ΜΕΡΟΣ Β. για Ηλεκτρολόγους Μηχανικούς. ηµήτρης Κουγιουµτζής http://www.users.auth.gr/dkugiu/teach/electricengineer/ Στατιστική για Ηλεκτρολόγους Μηχανικούς ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://www.users.auth.gr/dkugiu/teach/electricengineer/ E mail: dkugiu@gen.auth.gr Απρίλιος 2010 2 Στο Μέρος Α ασχοληθήκαµε µε την τυχαία

Διαβάστε περισσότερα

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Περιγραφική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων. της σ 2 είναι επίσης αµερόληπτη. n 1 +n 2

Περιγραφική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων. της σ 2 είναι επίσης αµερόληπτη. n 1 +n 2 4.2. ΑΠΛ Η ΓΡΑΜΜΙΚ Η ΠΑΛΙΝ Ρ ΟΜΗΣΗ 79 ΑΣΚΗΣΕΙΣ Περιγραφική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων 1. είξτε ότι η εκτιµήτρια s 2 της διασποράς σ 2 είναι αµερόληπτη. 2. ύο τυχαίες µεταβλητές X 1 και

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Στα πλαίσια της ΣΤΑΤΙΣΤΙΚΗΣ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑΣ προσπαθούµε να προσεγγίσουµε τα χαρακτηριστικά ενός συνόλου (πληθυσµός) δια της µελέτης των χαρακτηριστικών αυτών επί ενός µικρού

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ορεστιάδα 7 ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο ο : Παράγωγες κατανοµές

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ.

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ. Άσκηση : Έστω Χ,,Χ τυχαίο δείγµα µεγέους από την κατανοµή µε σππ 3 p (,, >, > 0 α είξτε ότι η στατιστική συνάρτηση Τ( Χ : Χ ( m είναι επαρκής για την παράµετρο και πλήρης κ β Βρείτε ΑΕΕ του α Το στήριγµα

Διαβάστε περισσότερα

A(θ) = n log θ B(x ) = 0. T (x ) = x i. Γ(n)θ n =

A(θ) = n log θ B(x ) = 0. T (x ) = x i. Γ(n)θ n = ΕΞΕΤΑΣΗ ΤΟΥ ΜΑΘΗΜΑΤΟΣ «ΣΤΑΤΙΣΤΙΚΗ Ι : ΕΚΤΙΜΗΤΙΚΗ» Πέµπτη 24 Ιουνίου 24 Εξεταστική περίοδος Ιουνίου 24 ΘΕΜΑΤΑ. Θεωρώντας ως κριτήριο το µέσο τετραγωνικό σφάλµα : (α ( µονάδες Εστω, 2 δύο εκτιµητές τού g(θ.

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.outras@e.aegea.gr Τηλ: 7035468 Μέθοδος Υπολογισμού

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Κεϕάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεϕάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής: ΣΕΙΡΕΣ TAYLOR Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων Πολυώνυµο είναι κάθε συνάρτηση της µορφής: p( ) = a + a + a + a + + a, όπου οι συντελεστές α i θα θεωρούνται

Διαβάστε περισσότερα

5. Έλεγχοι Υποθέσεων

5. Έλεγχοι Υποθέσεων 5. Έλεγχοι Υποθέσεων Υποθέσεις Η μηδενική υπόθεση Η (ή ΗΑ) εναλλακτική υπόθεση Δεχόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγχος

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) Α. Ερωτήσεις πολλαπλών επιλογών.(11 βαθµοί) (1:3 βαθµοί, 2-9:8 βαθµοί) 1. ίνεται ο πίνακας: Χ

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) .5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) Ο διωνυμικός έλεγχος μπορεί να χρησιμοποιηθεί για τον έλεγχο υποθέσεων αναφερομένων στα ποσοστιαία σημεία μίας τυχαίας μεταβλητής. Στην

Διαβάστε περισσότερα

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ] Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών ΗΥ-317: Εφαρµοσµένες Στοχαστικές ιαδικασίες-εαρινό Εξάµηνο 2016 ιδάσκων : Π. Τσακαλίδης Συνδιασπορά - Συσχέτιση Τυχαίων Μεταβλητών Επιµέλεια : Κωνσταντίνα

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ Να κατανοηθεί η έννοια της εκτίµησης σηµείου και της εκτίµησης διαστήµατος. Επίσης να κατανοηθεί η έννοια της δειγµατικής κατανοµής παραµέτρου και να υπολογισθούν µε χρήση της Κεντρικού

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς Παιδαγωγικό Τµήµα ηµοτικής Εκπαίδευσης ηµοκρίτειο Πανεπιστήµιο Θράκης Αλεξανδρούπολη, 2014-2015 Εµπειρικές Στατιστικές

Διαβάστε περισσότερα

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ 10ο Μάθημα Πιθανότητες Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2016-2017 Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής 10ο Μάθημα

Διαβάστε περισσότερα

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: Κατανοµές ειγµατοληψίας 1.Εισαγωγή Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: 1. Στατιστικής και 2. Κατανοµής ειγµατοληψίας

Διαβάστε περισσότερα

1 Ορισµός ακολουθίας πραγµατικών αριθµών

1 Ορισµός ακολουθίας πραγµατικών αριθµών ΜΑΣ 02. Απειροστικός Λογισµός Ι Ορισµός ακολουθίας πραγµατικών αριθµών Ορισµός.. Ονοµάζουµε ακολουθία πραγµατικών αριθµών κάθε απεικόνιση του συνόλου N των ϕυσικών αριθµών, στο σύνολο R των πραγµατικών

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

< 1 για κάθε k N, τότε η σειρά a k συγκλίνει. +, τότε η η σειρά a k αποκλίνει.

< 1 για κάθε k N, τότε η σειρά a k συγκλίνει. +, τότε η η σειρά a k αποκλίνει. Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» Κεφάλαιο 3: Σειρές πραγµατικών αριθµών Α Οµάδα. Εστω ( ) µια ακολουθία πραγµατικών αριθµών. Εξετάστε αν οι παρακάτω προτάσεις είναι αληθείς ή ψευδείς (αιτιολογήστε

Διαβάστε περισσότερα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία

Διαβάστε περισσότερα

Περιγραϕική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων

Περιγραϕική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων 78 ΚΕΦΑΛΑΙΟ 4. ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ ΑΣΚΗΣΕΙΣ Περιγραϕική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων 1. είξτε ότι η εκτιµήτρια s 2 της διασποράς σ 2 είναι αµερόληπτη. 2. ύο τυχαίες µεταβλητές X 1

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών HY-1: Πιθανότητες - Χειµερινό Εξάµηνο 011 ιδάσκων : Π. Τσακαλίδης Λύσεις εύτερης Σειράς Ασκήσεων Ηµεροµηνία Ανάθεσης : /11/011 Ηµεροµηνία Παράδοσης : 1/11/011

Διαβάστε περισσότερα

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.) 3 Οριακά θεωρήµατα Κεντρικό Οριακό Θεώρηµα (ΚΟΘ) Ένα από τα πιο συνηθισµένα προβλήµατα που ανακύπτουν στη στατιστική είναι ο προσδιορισµός της κατανοµής ενός µεγάλου αθροίσµατος ανεξάρτητων τµ Έστω Χ Χ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΙΚΟ - ΠΡΟΠΑΡΑΣΚΕΥΑΣΤΙΚΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ II. Μία περίληψη του εξαµηνιαίου µαθήµατος ΣΤΑΤΙΣΤΙΚΗ II - ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

ΕΙΣΑΓΩΓΙΚΟ - ΠΡΟΠΑΡΑΣΚΕΥΑΣΤΙΚΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ II. Μία περίληψη του εξαµηνιαίου µαθήµατος ΣΤΑΤΙΣΤΙΚΗ II - ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΕΙΣΑΓΩΓΙΚΟ - ΠΡΟΠΑΡΑΣΚΕΥΑΣΤΙΚΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ II Μία περίληψη του εξαµηνιαίου µαθήµατος ΣΤΑΤΙΣΤΙΚΗ II - ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Γιώργος Ηλιόπουλος (Αλλά όλοι τα ίδια ϑα σας έλεγαν) Η Στατιστική χρησιµοποιείται

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός. ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr Καθ η γη

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Σημειώσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Σημειώσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Σημειώσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 2014 Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή Ανάλυση Συνδιακύµανσης Alsis of Covrice Η ανάλυση συνδιακύµανσης είναι µία άλλη τεχνική για να βελτιώσουµε την ακρίβεια της προσέγγισης του µοντέλου µας στο πείραµα. Ας υποθέσουµε ότι σ ένα πείραµα εκτός

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής. 2.6 ΟΡΙΑ ΑΝΟΧΗΣ Το διάστηµα εµπιστοσύνης παρέχει µία εκτίµηση µιας άγνωστης παραµέτρου µε την µορφή διαστήµατος και ένα συγκεκριµένο βαθµό εµπιστοσύνης ότι το διάστηµα αυτό, µε τον τρόπο που κατασκευάσθηκε,

Διαβάστε περισσότερα

p(x, y) = 1 (x + y) = 3x + 6, x = 1, 2 (x + y) = 3 + 2y, y = 1, 2, 3 p(1, 1) = = 2 21 p X (1) p Y (1) = = 5 49

p(x, y) = 1 (x + y) = 3x + 6, x = 1, 2 (x + y) = 3 + 2y, y = 1, 2, 3 p(1, 1) = = 2 21 p X (1) p Y (1) = = 5 49 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών HY-27: Πιθανότητες - Χειµερινό Εξάµηνο 206-207 ιδάσκων : Π. Τσακαλίδης Φροντιστήριο 8 Από κοινού συναρτήσεις Τυχαίων Μεταβλητών Επιµέλεια : Κατερίνα Καραγιαννάκη

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές»

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» Κεφάλαιο : Το σύνολο των πραγµατικών αριθµών Α Οµάδα Εξετάστε αν οι παρακάτω προτάσεις είναι αληθείς ή ψευδείς αιτιολογήστε πλήρως την απάντησή σας) α)

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

n i P(x i ) P(X = x i ) = lim

n i P(x i ) P(X = x i ) = lim Κεϕάλαιο 2 Πιθανότητες και Τυχαίες Μεταβλητές Μπορούµε να καταλάβουµε την έννοια της πιθανότητας από τη σχετική συχνότητα εµϕάνισης n i κάποιας τιµής x i µιας διακριτής τ.µ. X. Αν είχαµε τη δυνατότητα

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

n + 1 X(1 + X). ) = X i i=1 i=1

n + 1 X(1 + X). ) = X i i=1 i=1 ΕΞΕΤΑΣΗ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΣΤΑΤΙΣΤΙΚΗ I: ΕΚΤΙΜΗΤΙΚΗ 6 Σεπτεµβρίου 005 Εξεταστική περίοδος Σεπτεµβρίου 005 ΘΕΜΑΤΑ 1 1. Εστω X (X 1,..., X ) τυχαίο δείγµα από γεωµετρική κατανοµή Ge(), Θ (0, 1). (α) (10 µονάδες)

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Παραμέτρων

Διαβάστε περισσότερα

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΙΕΘΝΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΣΧΕΣΕΩΝ ΚΑΙ ΑΝΑΠΤΥΞΗΣ ΜΑΘΗΜΑ: ΣΤΑΤΙΣΤΙΚΗ IΙ ΕΙΣΗΓΗΤΡΙΑ: ΣΑΒΒΑΣ ΠΑΠΑ ΟΠΟΥΛΟΣ ΠΑΛΑΙΑ ΘΕΜΑΤΑ ********************************************************************

Διαβάστε περισσότερα

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j όπου x j x i για j i. P i =

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j όπου x j x i για j i. P i = Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Σ αυτό το κεφάλαιο ϑα δούµε πρώτα τρόπους να παρουσιάσουµε τα δεδοµένα µε στατιστικούς πίνακες και διαγράµµατα και µετά να συνοψίσουµε τα δεδοµένα υπολογίζοντας συνοπτικά

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ Ι (ΠΕΡΙΤΤΟΙ) Λυσεις Ασκησεων - Φυλλαδιο 3

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ Ι (ΠΕΡΙΤΤΟΙ) Λυσεις Ασκησεων - Φυλλαδιο 3 ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ Ι Τµηµα Β (ΠΕΡΙΤΤΟΙ) Λυσεις Ασκησεων - Φυλλαδιο ιδασκων: Α Μπεληγιάννης Ιστοσελιδα Μαθηµατος : http://usersuoigr/aeligia/linearalgerai/lai07/lai07html Παρασκευή Νοεµβρίου 07 Ασκηση Αν

Διαβάστε περισσότερα

Κεϕάλαιο 4. Αβεβαιότητα και σϕάλµα µέτρησης

Κεϕάλαιο 4. Αβεβαιότητα και σϕάλµα µέτρησης Κεϕάλαιο 4 Αβεβαιότητα και σϕάλµα µέτρησης Από την κλασσική αρχαία εποχή που ο Αριστοτέλης ϑεώρησε τη ϐεβαιότητα (και αβεβαιότητα) ενός αποτελέσµατος ως σήµερα ο χαρακτηρισµός της αβεβαιότητας της µέτρησης

Διαβάστε περισσότερα

11 Το ολοκλήρωµα Riemann

11 Το ολοκλήρωµα Riemann Το ολοκλήρωµα Riem Το πρόβληµα υπολογισµού του εµβαδού οποιασδήποτε επιφάνειας ( όπως κυκλικοί τοµείς, δακτύλιοι και δίσκοι, ελλειπτικοί δίσκοι, παραβολικά και υπερβολικά χωρία κτλ) είναι γνωστό από την

Διαβάστε περισσότερα

Κεφάλαιο 6 Παράγωγος

Κεφάλαιο 6 Παράγωγος Σελίδα από 5 Κεφάλαιο 6 Παράγωγος Στο κεφάλαιο αυτό στόχος µας είναι να συνδέσουµε µία συγκεκριµένη συνάρτηση f ( ) µε µία δεύτερη συνάρτηση f ( ), την οποία και θα ονοµάζουµε παράγωγο της f. Η τιµή της

Διαβάστε περισσότερα

Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου 8

Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου 8 Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου 8 ιδασκοντες: Ν. Μαρµαρίδης - Α. Μπεληγιάννης Βοηθος Ασκησεων: Χ. Ψαρουδάκης Ιστοσελιδα Μαθηµατος : http://www.math.uoi.gr/ abeligia/linearalgebrai/lai.html

Διαβάστε περισσότερα

στατιστική θεωρεία της δειγµατοληψίας

στατιστική θεωρεία της δειγµατοληψίας στατιστική θεωρεία της δειγµατοληψίας ΕΙΓΜΑΤΟΛΗΨΙΑ : Εισαγωγή δειγµατοληψία Τα στοιχεία που απαιτούνται τόσο για την ανάλυση των µεταφορικών συστηµάτων και όσο και για την ανάπτυξη των συγκοινωνιακών µοντέλων

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής Κεφάλαιο 1. Εισαγωγή: Βασικά και Εκτιμητικής Ορισμός 1.1. Όλα τα δυνατά αποτελέσματα ενός πειράματος αποτελούν το δειγματοχώρο (sample space) που συμβολίζεται με. Κάθε δυνατό αποτέλεσμα του πειράματος,

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Πολύγωνο αθροιστικών σχετικών συχνοτήτων και διάµεσος µιας τυχαίας µεταβλητής ρ. Παναγιώτης Λ. Θεοδωρόπουλος πρώην Σχολικός Σύµβουλος ΠΕ03 e-mail@p-theodoropoulos.gr Πρόλογος Στην εργασία αυτή αναλύονται

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό. Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» Κεφάλαιο : Ακολουθίες πραγµατικών αριθµών Α Οµάδα Εξετάστε αν οι παρακάτω προτάσεις είναι αληθείς ή ψευδείς αιτιολογήστε πλήρως την απάντησή σας α Κάθε

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Α. 1. Μετρήσεις και Σφάλµατα

Α. 1. Μετρήσεις και Σφάλµατα Α. 1. Μετρήσεις και Σφάλµατα Κάθε πειραµατική µέτρηση υπόκειται σε πειραµατικά σφάλµατα. Με τον όρο αυτό δεν εννοούµε λάθη τα οποία γίνονται κατά την εκτέλεση του πειράµατος ή τη λήψη των µετρήσεων, τα

Διαβάστε περισσότερα

Γραµµική Αλγεβρα Ι. Ενότητα: Εισαγωγικές Εννοιες. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

Γραµµική Αλγεβρα Ι. Ενότητα: Εισαγωγικές Εννοιες. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών Ενότητα: Εισαγωγικές Εννοιες Ευάγγελος Ράπτης Τµήµα Μαθηµατικών Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης Ν161_(262)_Στατιστική στη Φυσική Αγωγή 06_01_Έλεγχος_Υποθέσεων Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ. 1 Υπόθεση: "μπορεί ο αριθμητικός μέσος του δείγματος να είναι ίδιος με τον αριθμητικό

Διαβάστε περισσότερα

ιαστήµατα Εµπιστοσύνης

ιαστήµατα Εµπιστοσύνης ιαστήµατα Εµπιστοσύνης Ορισµοί: ιάστηµα Εµπιστοσύνης (Cofidece Iterval): Είναι ένα διάστηµα που βασίζεται σε παρατηρήσεις ενός δείγµατος και είναι καθορισµένο µε τέτοιο τρόπο ώστε να υπάρχει µια συγκεκριµένη

Διαβάστε περισσότερα