Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Σχετικά έγγραφα
6. Βασικές Διακριτές Κατανομές

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα

07/11/2016. Στατιστική Ι. 6 η Διάλεξη (Βασικές διακριτές κατανομές)

Στατιστική Επιχειρήσεων Ι. Βασικές διακριτές κατανομές

Διωνυμική Κατανομή. x Αποδεικνύεται ότι για την διωνυμική κατανομή ισχύει: Ε(Χ)=np και V(X)=np(1-p).

Ασκήσεις στις κατανομές και ειδικά στην διωνυμική κατανομή και κανονική κατανομή

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Ασκήσεις στην διωνυμική κατανομή

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Στατιστική Ι. Ενότητα 5: Θεωρητικές Κατανομές Πιθανότητας. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες)

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Π

Κατανομές Τυχαίων Μεταβλητών Προβλήματα και Ασκήσεις

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

, µπορεί να είναι η συνάρτηση. αλλού. πλησιάζουν προς την τιµή 1, η διασπορά της αυξάνεται ή ελαττώνεται; (Εξηγείστε γιατί).

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Π

& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Θέμα: ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΙΣ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΚΕΦΑΛΑΙΟ 7 ΒΙΒΛΙΟ KELLER

Τυχαίες Μεταβλητές. Ορισμός

Στατιστική Συμπερασματολογία

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

Υπολογιστικά & Διακριτά Μαθηματικά

ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος

ΗΥ-217-ΠΙΘΑΝΟΤΗΤΕΣ-ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 2016 ΔΙΔΑΣΚΩΝ: ΠΑΝΑΓΙΩΤΗΣ ΤΣΑΚΑΛΙΔΗΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Στατιστική Συμπερασματολογία

Η Κανονική Κατανομή κανονική κατανομή (normal distribution) Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) συνδέει οποιαδήποτε άλλη κατανομή

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Οι παραγγελίες ακολουθούν την κατανομή Poisson. Σύμφωνα με τα δεδομένα ο

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

, όπου x = 0,1,..., Έτσι, για την πιθανότητα σε ένα έτος να μην υπάρξουν θάνατοι ζώων από τον εμβολιασμό έχουμε, 2! !

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

3. Κατανομές πιθανότητας

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΕΞEΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ ΠΙΘΑΝΟΤΗΤΕΣ-ΣΤΑΤΙΣΤΙΚΗ ΜΑΡΤΙΟΣ 2003 Λ Υ Σ Ε Ι Σ Τ Ω Ν Α Σ Κ Η Σ Ε Ω Ν ΜΕΡΟΣ Α

Θέμα: ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΚΕΦΑΛΑΙΟ 7 KELLER

ρ. Ευστρατία Μούρτου

Π.χ. πρωτεύουσες, Εκ περιτροπής από δευτερεύουσες σε τριτεύουσες

ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ Ι Φεβρουάριος 2018 Σειρά Α Θέματα 3 ως 7 και αναλυτικές (ή σύντομες) απαντήσεις

ΕΠΑΝΑΛΗΨΗ ΕΦΑΡΜΟΣΜΕΝΑ ΜΑΘΗΜΑΤΙΚΑ 11/01/2018

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

P (A B) = P (AB) P (B) P (A B) = P (A) P (A B) = P (A) P (B)

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Στατιστική. Εκτιμητική

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

Θεωρία Πιθανοτήτων, εαρινό εξάμηνο Λύσεις του πέμπτου φυλλαδίου ασκήσεων.. Δηλαδή:

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Η Κανονική Κατανομή. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος ( 81

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Εισαγωγικές Έννοιες ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών Πόρων

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Στατιστική Συμπερασματολογία

ΠΙΘΑΝΟΤΗΤΕΣ, ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΣΤΟΙΧΕΙΑ ΑΡΙΘΜΗΤΙΚΗΣ ΑΝΑΛΥΣΗΣ ΘΕΜΑΤΑ ΠΙΘΑΝΟΤΗΤΩΝ ΓΕΩΛΟΓΙΚΟΥ

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

Θεωρία Πιθανοτήτων & Στατιστική

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 6 η Ημερομηνία Αποστολής στο Φοιτητή: 23 Απριλίου 2012

Στατιστική Επιχειρήσεων ΙΙ

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

Τυχαία μεταβλητή (τ.μ.)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

P (X = x) = (0.001) x (0.999) 1000 x

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Στατιστική Συμπερασματολογία

Σημειακή εκτίμηση και εκτίμηση με διάστημα Παραδείγματα. 12 η Διάλεξη

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

Θεωρητικές Κατανομές Πιθανότητας

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Δειγματοληψία στην Ερευνα. Ετος

Η Κανονική Κατανομή. Κανονικές Κατανομές με την ίδια διασπορά και διαφορετικές μέσες τιμές.

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Transcript:

Η Διωνυμική Κατανομή Η Διωνυμική κατανομή συνδέεται με ένα πολύ απλό πείραμα τύχης. Ίσως το απλούστερο! Πρόκειται για τη δοκιμή Bernoulli, ένα πείραμα τύχης με μόνο δύο, αμοιβαίως αποκλειόμενα, δυνατά αποτελέσματα. Το ένα αποτέλεσμα έχει επικρατήσει να ονομάζεται επιτυχία και το άλλο αποτυχία. Το πιο «δημοφιλές» στη βιβλιογραφία παράδειγμα δοκιμής Bernoulli είναι η ρίψη ενός νομίσματος μία φορά. Τα δυνατά αποτελέσματα είναι προφανώς μόνο δύο: «κεφαλή» ή «γράμματα». Αν μας ενδιαφέρει η ένδειξη «κεφαλή» χαρακτηρίζουμε επιτυχία το αποτέλεσμα «κεφαλή» και αποτυχία το αποτέλεσμα «γράμματα» ενώ αν μας ενδιαφέρει η ένδειξη «γράμματα» χαρακτηρίζουμε επιτυχία το αποτέλεσμα «γράμματα» και αποτυχία το αποτέλεσμα «κεφαλή». Ας δούμε μερικά ακόμη παραδείγματα: Μας ενδιαφέρει να διατυπώσουμε πιθανοθεωρητικά συμπεράσματα α) για τον αριθμό των ζώων μιας κτηνοτροφικής μονάδας που έχουν προσβληθεί από μια συγκεκριμένη ασθένεια. Η εξέταση ενός ζώου για το αν έχει προσβληθεί ή όχι από την ασθένεια είναι δοκιμή Bernoulli γιατί τα δυνατά αποτελέσματα είναι μόνο δύο: το ζώο είτε έχει προσβληθεί (επιτυχία) είτε δεν έχει προσβληθεί (αποτυχία) β) για τον αριθμό αλλοιωμένων προϊόντων που είναι αποθηκευμένα στις εγκαταστάσεις μιας βιομηχανικής μονάδας επεξεργασίας αγροτικών προϊόντων. Ο έλεγχος ενός προϊόντος για το αν είναι αλλοιωμένο ή όχι είναι δοκιμή Bernoulli γιατί το προϊόν είτε έχει αλλοιωθεί (επιτυχία) είτε δεν έχει αλλοιωθεί (αποτυχία) γ) για τον αριθμό των φυτών μιας καλλιέργειας που η ξηρή φυτική μάζα τους ξεπερνάει τα 5gr. Ο έλεγχος ενός φυτού για το αν η ξηρή μάζα του ξεπερνάει ή όχι τα 5gr είναι δοκιμή Bernoulli γιατί το φυτό έχει ξηρή μάζα είτε μεγαλύτερη από 5gr (επιτυχία) είτε το πολύ 5gr (αποτυχία) δ) για τον αριθμό των φυτών μιας καλλιέργειας που έχουν λιγότερα από 6 φύλλα. Ο έλεγχος ενός φυτού για το αν έχει λιγότερα από 6 φύλλα είναι δοκιμή Bernoulli γιατί το φυτό έχει είτε λιγότερα από 6 (επιτυχία) είτε τουλάχιστον 6 φύλλα (αποτυχία). Σημείωση: Παρατηρείστε ότι οι δυνατές τιμές της ξηρής μάζας ενός φυτού στο παράδειγμα (γ) προφανώς δεν είναι μόνο δύο. Το ίδιο ισχύει και για τον αριθμό των φύλλων ενός φυτού στο παράδειγμα (δ). Όμως, με βάση το τι ενδιαφέρει στην αντίστοιχη έρευνα, ταξινομήσαμε τις δυνατές τιμές σε δύο κατηγορίες-αποτελέσματα και οδηγηθήκαμε έτσι σε δοκιμές Bernoulli. Δοκιμή Bernoulli έχουμε επίσης σε περιπτώσεις όπου, ενώ τα δυνατά εξαγόμενα είναι περισσότερα από δύο (όπως και στα παραδείγματα (γ) και (δ)), μας ενδιαφέρει εάν συμβαίνει ή όχι, μόνο ένα συγκεκριμένο. Για παράδειγμα, ένα παιδί που επιλέγεται τυχαία από τα n παιδιά μιας οικογένειας μπορεί να έχει το γονότυπο ΑΑ ή όχι. Επίσης, από μία τράπουλα επιλέγουμε τυχαία ένα παιγνιόχαρτο το οποίο μπορεί να είναι ή να μην είναι «άσσος». Σε μια δοκιμή Bernoulli είναι φανερό ότι ο αριθμός των επιτυχιών είναι ή ή. Αν η πιθανότητα επιτυχίας είναι προφανώς η πιθανότητα αποτυχίας είναι την οποία συμβολίζουμε με q. Ας συμβολίσουμε επίσης τον αριθμό των επιτυχιών σε μια δοκιμή Bernoulli με Χ. Η κατανομή της τυχαίας μεταβλητής Χ ονομάζεται κατανομή Bernoulli με παράμετρο, συμβολίζεται με b( και έχει συνάρτηση πιθανότητας,, f ( ) (,,. ή f ( ),. Φέρει το όνομα του Ελβετού μαθηματικού J. Bernoulli (654-75), της οικογένειας διακεκριμένων μαθηματικών. Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος (www.aua.gr/gaadooulos) 59

Η μέση τιμή μ της Χ είναι σ E( X ) μ E ( X ) f () + f () και η διασπορά της [ E( X )] f () + f () ( q Παρότι, όπως αναφέραμε αλλά και διαπιστώσαμε, η δοκιμή Bernoulli είναι ένα πολύ απλό πείραμα, εντούτοις (ή μήπως γι αυτό) βρίσκεται στον πυρήνα πολλών πραγματικών προβλημάτων με ευρύτατο φάσμα εφαρμογών που παρουσιάζουν μάλιστα ιδιαίτερο ενδιαφέρον και σε αρκετές περιπτώσεις ιδιαίτερες δυσκολίες στην αντιμετώπισή τους. Πιο συγκεκριμένα, πολλά πραγματικά προβλήματα αναλύονται σε μια σειρά ακολουθία δοκιμών Bernoulli και τα τελικά ερωτήματα που απορρέουν από αυτά σχετίζονται με τον αριθμό των επιτυχιών που συμβαίνουν. Για παράδειγμα, το τελικό ερώτημα μετά την ανάλυση ενός τέτοιου προβλήματος μπορεί να είναι: «πόσες επιτυχίες συμβαίνουν σε n επαναλήψεις μιας δοκιμής Bernoulli» ή «πόσες επαναλήψεις μιας δοκιμής Bernoulli απαιτούνται μέχρι την πρώτη επιτυχία» ή «πόσες επαναλήψεις μιας δοκιμής Bernoulli απαιτούνται μέχρι την r επιτυχία» ή «πόσες επαναλήψεις μιας δοκιμής Bernoulli απαιτούνται μέχρι να συμβεί μια ροή k συνεχόμενων επιτυχιών». Στη συνέχεια θα ασχοληθούμε με προβλήματα που αναλύονται σε μια ακολουθία n ανεξάρτητων επαναλήψεων μιας δοκιμής Bernoulli και που τα πιθανοθεωρητικά συμπεράσματα που μας ενδιαφέρουν συνδέονται με το ερώτημα: «πόσες επιτυχίες συμβαίνουν σε n επαναλήψεις μιας δοκιμής Bernoulli». Ας δούμε ένα τέτοιο πρόβλημα. Πρόβλημα-: Ο γεωπόνος ενός φυτώριου ισχυρίζεται ότι ποσοστό 9% ενός είδους φυτών που παράγει δίνει περισσότερους από 5 καρπούς/φυτό. Ένας αγρότης που είχε προμηθευθεί από το συγκεκριμένο φυτώριο μεγάλο αριθμό φυτών αυτού του είδους, θέλησε να ελέγξει τον ισχυρισμό του γεωπόνου. Για το σκοπό αυτό, κατά τη συγκομιδή, επέλεξε τυχαία 5 φυτά και μέτρησε τους καρπούς κάθε φυτού. Από τα 5 φυτά που εξέτασε, περισσότερους από 5 καρπούς είχαν μόνο τα 38, γεγονός που δημιούργησε αμφιβολίες στον αγρότη για τον ισχυρισμό του γεωπόνου. Είναι, άραγε, δικαιολογημένες οι αμφιβολίες του αγρότη; Απάντηση Είναι προφανές ότι η τυχαία επιλογή και εξέταση ενός φυτού, για το αν έχει ή όχι περισσότερους από 5 καρπούς, είναι μια δοκιμή Bernoulli: το φυτό είτε έχει περισσότερους από 5 καρπούς είτε δεν έχει περισσότερους από 5 καρπούς. Η επιλογή επομένως και η εξέταση 5 φυτών είναι μια σειρά-ακολουθία 5 δοκιμών Bernoulli. Επειδή ο αγρότης ενδιαφέρεται για τα φυτά που έχουν περισσότερους από πέντε καρπούς είναι λογικό να ονομάσουμε επιτυχία το αποτέλεσμα «το φυτό έχει περισσότερους από πέντε καρπούς» και αποτυχία το αποτέλεσμα «το φυτό δεν έχει περισσότερους από πέντε καρπούς». Το ερώτημα που, λογικά, προκύπτει είναι: αν αποδεχθούμε τον ισχυρισμό του γεωπόνου, πόσο λογικό-πιθανό είναι το αποτέλεσμα του ελέγχου που έκανε ο αγρότης; Δηλαδή, με δεδομένο ότι το ποσοστό των φυτών που παράγουν περισσότερους από 5 καρπούς είναι 9%, πόσο πιθανό είναι από τα 5 τυχαία επιλεγμένα φυτά να βρεθούν 38 τα οποία να έχουν περισσότερους από 5 καρπούς; Ή αλλιώς, ποια είναι η πιθανότητα, σε 5 επαναλήψεις μιας δοκιμής Bernoulli να συμβούν 38 επιτυχίες, με δεδομένο ότι σε κάθε επανάληψη η πιθανότητα επιτυχίας είναι ίση με.9. Πρέπει να σημειώσουμε ότι σωστά θεωρήσαμε ότι σε κάθε επανάληψη της δοκιμής Bernoulli η πιθανότητα επιτυχίας παραμένει σταθερή και ίση με.9 γιατί ο αριθμός των φυτών που εξετάζονται είναι πολύ μικρός σε σχέση με τον αριθμό των φυτών της καλλιέργειας και επομένως, παρότι, η δειγματοληψία γίνεται χωρίς επανάθεση η Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος (www.aua.gr/gaadooulos) 6.

πιθανότητα αυτή πρακτικά δεν αλλάζει. Είναι επίσης λογικό να θεωρήσουμε ότι το αποτέλεσμα οποιασδήποτε δοκιμής δεν επηρεάζεται-εξαρτάται από το αποτέλεσμα των προηγούμενων δοκιμών. Το γενικότερο επομένως ερώτημα που τίθεται είναι: Αν Χ ο αριθμός των επιτυχιών σε μια ακολουθία n ανεξάρτητων δοκιμών Bernoulli με σταθερή πιθανότητα επιτυχίας σε όλες τις δοκιμές, πώς μπορούμε να υπολογίσουμε τις πιθανότητες: P (,,,,..., n. Εύκολα μπορεί να αποδειχθεί 3 ότι οι πιθανότητες αυτές δίνονται από τον τύπο: (,,,,..., n. Έτσι, αν συμβολίσουμε με Χ τον αριθμό των φυτών (από τα 5 που επελέγησαν τυχαία) καθένα από τα οποία έχει περισσότερους από 5 καρπούς, τότε: 5 38 4 P ( X 38).9 (.9).3. 38 Δηλαδή, με την υπόθεση ότι αληθεύει ο ισχυρισμός του γεωπόνου, η πιθανότητα να συμβεί αυτό που συνέβη στον έλεγχο που έκανε ο αγρότης είναι πολύ μικρή (σχεδόν μηδενική). Άρα οι αμφιβολίες του αγρότη έχουν βάση 4. (Φυσικά, ο αγρότης δεν υπολόγισε την πιθανότητα P ( X 38), απλώς υπολόγισε το 9% του 5 που είναι 46.8 και περίμενε να βρει περίπου 47 φυτά με περισσότερους από 5 καρπούς). Ας δώσουμε τώρα τον ορισμό της Διωνυμικής Κατανομής 5 : Ορισμός: Αν Χ ο αριθμός των επιτυχιών σε μια ακολουθία n ανεξάρτητων δοκιμών Bernoulli με σταθερή πιθανότητα επιτυχίας σε όλες τις δοκιμές, τότε η κατανομή της τυχαίας μεταβλητής Χ καλείται διωνυμική κατανομή με παραμέτρους n και και συμβολίζεται με B ( n,. Όπως ήδη αναφέραμε, η συνάρτηση πιθανότητας της διωνυμικής κατανομής με παραμέτρους n και δίδεται από τον τύπο: f ( ) (,,,,..., n. Παρατηρείστε ότι η τυχαία μεταβλητή Χ ορίσθηκε ως άθροισμα n ανεξάρτητων τυχαίων μεταβλητών που ακολουθούν την κατανομή Bernoulli. Δηλαδή, αν X i, i,,..., n, είναι n ανεξάρτητες τυχαίες μεταβλητές με X i ~ b(, i,,..., n, τότε X X + X +... + X ~ B( n, ). n Παρατηρείστε, επίσης, ότι οι πιθανότητες των τιμών,,,..., n, της Χ είναι οι όροι του διωνυμικού αναπτύγματος [ + ( ] n (τύπος του διωνύμου του Νεύτωνα 6 ). Έτσι εξηγείται και το όνομα της διωνυμικής κατανομής. Αποδεικνύεται ότι η μέση τιμή και η διασπορά της διωνυμικής τυχαίας μεταβλητής δίνονται από τους τύπους: μ E ( X ) n και σ V ( X ) n( nq αντίστοιχα. Έτσι, στο Πρόβλημα-, η μέση τιμή και η διασπορά του αριθμού Χ των φυτών που έχουν περισσότερους από 5 καρπούς είναι μ 5.9 46. 8 φυτά και 3 Δείτε το ως άσκηση. 4 Περισσότερα και ασφαλέστερα συμπεράσματα στη Στατιστική Συμπερασματολογία. 5 Οι πρώτοι που μελέτησαν την διωνυμική κατανομή είναι ο De Moivre (667-754) και ο J. Bernoulli (654-75). 6 n Για οποιουσδήποτε πραγματικούς αριθμούς α, β ισχύει: n ( α + β ) α β, n,,... Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος (www.aua.gr/gaadooulos) 6

σ n( 5.9. 4.68 (ή τυπική απόκλιση σ 4.68. 6φυτά) αντίστοιχα. Σχόλιο: Αν δούμε τη διασπορά, σ n(, της διωνυμικής τυχαίας μεταβλητής ως συνάρτηση του, g( n(, παρατηρούμε ότι αν, η g είναι αύξουσα συνάρτηση του ενώ αν είναι φθίνουσα συνάρτηση του και παρουσιάζει μέγιστο για. Δηλαδή, η διασπορά ελαττώνεται όσο το πλησιάζει το ή το και μεγιστοποιείται για. Αυτό, είναι, άραγε λογικό; Πριν απαντήσετε δείτε τα παρακάτω σχήματα όπου φαίνεται η συνάρτηση πιθανότητας της διωνυμικής κατανομής για n 5 και.,.5,. 75. Ας δούμε ένα ακόμη παράδειγμα υπολογισμού πιθανοτήτων μιας διωνυμικής τυχαίας μεταβλητής. Πρόβλημα-: Μια βιομηχανία κατασκευάζει μεταλλικά ελάσματα για να αντέχουν σε συγκεκριμένη καταπόνηση. Σύμφωνα με τις προδιαγραφές παραγωγής, κάθε τέτοιο έλασμα αντέχει στη συγκεκριμένη καταπόνηση με πιθανότητα.8. Επιλέγουμε τυχαία 9 τέτοια ελάσματα και τα υποβάλλουμε στη συγκεκριμένη καταπόνηση. Ποια είναι η πιθανότητα να αντέξουν α) το πολύ ελάσματα, β) περισσότερα από 7 ελάσματα, γ) τουλάχιστον ελάσματα και δ) λιγότερα από 6 και τουλάχιστον 4 ελάσματα. Απάντηση Έστω Χ ο αριθμός των ελασμάτων που θα αντέξουν την καταπόνηση (από τα 9 που θα ελεγχθούν). Προφανώς 7, X ~ B(9,.7) και επομένως για τις ζητούμενες πιθανότητες έχουμε: α) P ( X ) X ) + X ) + X ) 7 Τι υποθέσεις πρέπει να κάνουμε; Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος (www.aua.gr/gaadooulos) 6

9 9 9 8 9 7.8. +.8. +.8..3 9 8 9 8 β) P ( X > 7) X 8) + X 9).8. +.8.. 4367 8 8 γ) P ( X ) X < ) X ) X )....9. 99998 9 4 5 9 5 4 δ) P (4 X < 6) X 4) + X 5).8. +.8.. 85754 4 5 Παρατηρήσεις. Είναι προφανές, ότι όταν το n είναι μεγάλο και το όχι πολύ κοντά στο ή το n, οι διωνυμικοί συντελεστές που εμφανίζονται στον τύπο n (,,,,..., n παίρνουν μεγάλες τιμές με συνέπεια να γίνεται προβληματικός ο υπολογισμός των πιθανοτήτων. Ένας τρόπος αντιμετώπισης του προβλήματος είναι ο υπολογισμός των πιθανοτήτων μέσω αναδρομικού τύπου. Πράγματι, αποδεικνύεται 8 ότι: Για τις πιθανότητες P (,,,..., n, της τυχαίας μεταβλητής X ~ B( n, n + ισχύει, P ( X ) n με αρχική συνθήκη: P ( X ) (. n Έτσι, αν υπολογίσουμε μόνο την πιθανότητα P ( X ) (, μπορούμε μέσω αυτού του αναδρομικού τύπου να υπολογίσουμε όλες τις πιθανότητες P ( X ), X ),..., X n) χωρίς να χρειασθεί να υπολογίσουμε τους αντίστοιχους διωνυμικούς συντελεστές. Ας δούμε ένα παράδειγμα. Έστω X ~ B(5,.3). Η πιθανότητα X 3) μέσω του αναδρομικού τύπου υπολογίζεται ως εξής: P ( X ).7 5.68 5 +.3 P ( X ).68.36.3 5 +.3 P ( X ).36.39.3 5 3 +.3 P ( X 3).39.3 3.3 Είναι όμως φανερό ότι αυτή η μέθοδος υπολογισμού των πιθανοτήτων έχει το εξής μειονέκτημα. Για να υπολογίσουμε μια συγκεκριμένη πιθανότητα P ( που μας ενδιαφέρει, πρέπει να προηγηθεί ο υπολογισμός των πιθανοτήτων P ( X ), X ),..., X ). Έτσι, όσο αυξάνει το, αυξάνει ( δυστυχώς) και ο αριθμός των πιθανοτήτων που πρέπει να υπολογισθούν. Στη συνέχεια, όταν θα μιλήσουμε για την κατανομή Poisson και την κανονική κατανομή, θα δούμε και άλλο τρόπο αντιμετώπισης των δυσκολιών υπολογισμού 8 Η απόδειξη του αναδρομικού τύπου είναι πολύ απλή: n! ( ( n )!! n +. X ) n! n + ( ( n + )!( )! Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος (www.aua.gr/gaadooulos) 63

(στις περιπτώσεις που υπάρχουν) των πιθανοτήτων της διωνυμικής τυχαίας μεταβλητής 9.. Αν X ~ B( n,, άραγε από τις τιμές,,,...,n που μπορεί να πάρει η Χ, ποια είναι η πιο πιθανή. Παρατηρείστε στα σχήματα της σελίδας 6 ότι όσο οι τιμές της Χ αυξάνουν από το στο n, οι αντίστοιχες πιθανότητες P (,,,,..., n, μέχρι ένα σημείο (ας το συμβολίσουμε ) αυξάνουν και στη συνέχεια φθίνουν. Πράγματι έτσι είναι. Ας το αποδείξουμε και ας προσδιορίσουμε αυτή την τιμή της Χ. Από τον αναδρομικό τύπο που αποδείξαμε προηγουμένως προκύπτει ότι: n +. X ) Δηλαδή, P ( > X ) αν και μόνο αν ( n + ) > ( ή < ( n +). Αυτό σημαίνει ότι: α) Όταν το γινόμενο ( n + ) δεν είναι ακέραιος αριθμός, η πιο πιθανή τιμή της Χ είναι το ακέραιο μέρος του, δηλαδή, [( n + ) ] διότι οι πιθανότητες P ( αυξάνουν γνησίως για [( n + ) ] και φθίνουν γνησίως για [( n + ) ] +. β) Όταν το γινόμενο ( n + ) είναι ακέραιος αριθμός, οι πιθανότητες P ( αυξάνουν γνησίως για ( n + ) και φθίνουν γνησίως για ( n + ) +. Και επειδή P [ X ( n + ) ] P[ X ( n + ) ], στην περίπτωση αυτή, οι τιμές της Χ με τη μεγαλύτερη πιθανότητα είναι δύο: η ( n ) και η ( n + ). + Έτσι, στο Πρόβλημα-, επειδή το γινόμενο ( n + ) 53.9 47. 7 δεν είναι ακέραιος, η πιο πιθανή τιμή του αριθμού Χ των φυτών που έχουν περισσότερους από 5 καρπούς είναι η [47.7] 47. Στο Πρόβλημα-, επειδή το γινόμενο ( n + ).8 8 είναι ακέραιος, οι τιμές με τη μεγαλύτερη πιθανότητα είναι δύο: η ( n + ) 8 και η ( n + ) 7. Δείτε την παρακάτω άσκηση και θυμηθείτε τη σχέση Θεωρίας Πιθανοτήτων και Στατιστικής που συζητήσαμε στο εισαγωγικό μάθημα. Ξανασκεφθείτε, επίσης, το Πρόβλημα-. Άσκηση-: Ρίχνουμε ένα νόμισμα φορές. Αν η ένδειξη «γράμματα» έρθει από 3 έως το πολύ 7 φορές, δεχόμαστε ότι το νόμισμα είναι αμερόληπτο, ενώ σε κάθε άλλη περίπτωση θεωρούμε το νόμισμα μεροληπτικό. α) Να υπολογισθεί η πιθανότητα (σφάλμα τύπου Ι) να θεωρήσουμε ότι το νόμισμα είναι μεροληπτικό, ενώ στην πραγματικότητα είναι αμερόληπτο. β) Να υπολογισθεί η πιθανότητα (σφάλμα τύπου ΙΙ) να θεωρήσουμε ότι το νόμισμα είναι αμερόληπτο όταν είναι μεροληπτικό με πιθανότητα εμφάνισης της ένδειξης «γράμματα» ίση με.7. Απάντηση 7 7 α).. β).7.3. 65. 3 3 9 Οι δυσκολίες υπολογισμών, δεν λύθηκαν με τη χρήση Η/Υ. Και στους υπολογιστές τίθενται σχετικά ζητήματα όπως, απαιτούμενου υπολογιστικού χρόνου, μνήμης κ.τλ. Δηλαδή ο αγρότης σωστά ανέμενε αυτή την τιμή ως την πιο πιθανή!!! Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος (www.aua.gr/gaadooulos) 64