Ειδικές κατανοµές πιθανότητας



Σχετικά έγγραφα
Έλεγχοι υποθέσεων ΚΕΦΑΛΑΙΟ 6. Εισαγωγή

Ανάλυση χρονοσειρών ΚΕΦΑΛΑΙΟ 8. Εισαγωγή

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

ρ. Ευστρατία Μούρτου

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

3. Κατανομές πιθανότητας

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Η Κανονική Κατανομή. Κανονικές Κατανομές με την ίδια διασπορά και διαφορετικές μέσες τιμές.

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

1.4 Λύσεις αντιστρόφων προβλημάτων.

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

, µπορεί να είναι η συνάρτηση. αλλού. πλησιάζουν προς την τιµή 1, η διασπορά της αυξάνεται ή ελαττώνεται; (Εξηγείστε γιατί).

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

1 x-μ - 2 σ. e σ 2π. f(x) =

Στοχαστικές Στρατηγικές

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Περίπου ίση µε την ελάχιστη τιµή του δείγµατος.

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες

Τυχαία μεταβλητή (τ.μ.)

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

2. Στοιχεία Πολυδιάστατων Κατανοµών

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Τεχνικές αριστοποίησης

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Κατανοµές. Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται από το σχήµα του ιστογράµµατος (histogram).

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Ορισμός και Ιδιότητες

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΤΡΙΤΗ 25 ΜΑΪΟΥ 2004 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ. (40 µονάδες) ΘΕΜΑ 1 ο : xi Α Β C D 1 Μήνες xi xi/σ(xi) xi/σ(xi) - µ

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Γιατί μετράμε την διασπορά;

Τυχαίες Μεταβλητές. Ορισμός

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Πανεπιστήμιο Πελοποννήσου

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

Το Κεντρικό Οριακό Θεώρημα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

Το Κεντρικό Οριακό Θεώρημα

Εισαγωγή στην κανονική κατανομή και την χρήση της στην Υδρολογία Σ.Η.Καραλής

Εισόδημα Κατανάλωση

P(200 X 232) = =

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Θεωρητικές Κατανομές Πιθανότητας

Μέθοδος μέγιστης πιθανοφάνειας

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ

ΗΥ-217-ΠΙΘΑΝΟΤΗΤΕΣ-ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 2016 ΔΙΔΑΣΚΩΝ: ΠΑΝΑΓΙΩΤΗΣ ΤΣΑΚΑΛΙΔΗΣ

3.1 ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ

F x h F x f x h f x g x h g x h h h. lim lim lim f x

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

( ) ΘΕΜΑ 1 κανονική κατανομή


& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Παράδειγµα (Risky Business 1)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

14/11/2016. Στατιστική Ι. 7 η Διάλεξη (Βασικές συνεχείς κατανομές)

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

ΕΡΓΑΣΤΗΡΙΟ ΠΙΘΑΝΟΤΗΤΩΝ

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Η Κανονική Κατανομή κανονική κατανομή (normal distribution) Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) συνδέει οποιαδήποτε άλλη κατανομή

Transcript:

ΚΕΦΑΛΑΙΟ 4 Ειδικές κατανοµές πιθανότητας Εισαγωγή Οι κατανοµές πιθανότητας που εξετάστηκαν στο προηγούµενο κεφάλαιο έχουν γενική µορφή και δεν εµφανίζουν κάποια τυποποιηµένη συµπεριφορά. Στο κεφάλαιο αυτό εξετάζονται δύο ειδικές, τυποποιηµένες κατανοµές πιθανότητας, οι οποίες επιτρέπουν το χειρισµό πολλών σηµαντικών προβληµάτων λήψης αποφάσεων. Η πρώτη από αυτές, η διωνυµική κατανοµή, είναι µια διακριτή κατανοµή πιθανότητας. Εφαρµόζεται σε περιπτώσεις δειγµατοληψίας από πληθυσµό µε δύο είδη µελών ή σε περιπτώσεις επανάληψης τυχαίων πειραµάτων µε δύο πιθανά ενδεχόµενα. Η δεύτερη κατανοµή που εξετάζεται, η κανονική κατανοµή, είναι µια συνεχής κατανοµή πιθανότητας. Πρόκειται για µία από τις σπουδαιότερες κατανοµές της θεωρίας πιθανοτήτων και της στατιστικής µε πολλές πρακτικές εφαρµογές. Σκοπός του κεφαλαίου είναι η παρουσίαση των ιδιοτήτων των δύο αυτών κατανοµών και η εφαρµογή τους στην επίλυση πρακτικών προβληµάτων λήψης αποφάσεων. Οι υπολογισµοί που σχετίζονται µε τις κατανοµές αυτές κάτι που συµβατικά απαιτεί τη χρήση ειδικών πινάκων απλοποιούνται µε τη βοήθεια των συναρτήσεων που προσφέρει το Excel. Για το λόγο αυτό δίνεται ιδιαίτερη προσοχή στην παρουσίαση της σωστής χρήσης των συναρτήσεων αυτών.

74 Κεφάλαιο 4 ιωνυµική κατανοµή πιθανότητας Η διωνυµική κατανοµή (binomial distribution) είναι η πιο διαδεδοµένη διακριτή κατανοµή πιθανότητας. Οι περιπτώσεις στις οποίες µπορεί να εφαρµοστεί είναι δύο: 1. Κατά την εξέταση ενός δείγµατος από πληθυσµό µε δύο µόνο είδη µελών (π.χ. άνδρες και γυναίκες). 2. Κατά την πραγµατοποίηση µιας σειράς τυχαίων πειραµάτων κάτω από τις ίδιες συνθήκες, όπου το κάθε πείραµα παρουσιάζει δύο µόνο πιθανά ενδεχόµενα. Έστω ένα πείραµα το οποίο µπορεί να επαναληφθεί πολλές φορές κάτω από τις ίδιες συνθήκες. Κάθε επανάληψη του πειράµατος ονοµάζεται δοκιµή. Το αποτέλεσµα κάθε δοκιµής είναι ανεξάρτητο από τα προηγούµενα και µπορεί να πάρει µία από δύο πιθανές τιµές (ενδεχόµενα). Τα ενδεχόµενα αυτά µπορούν αυθαίρετα ή όχι να ονοµαστούν ως επιτυχία και αποτυχία. Επειδή τα πειράµατα είναι ανεξάρτητα, η πιθανότητα επιτυχίας σε κάθε δοκιµή είναι η ίδια και συµβολίζεται µε p. Η πιθανότητα αποτυχίας είναι προφανώς ίση µε 1 p. Αν ο αριθµός των δοκιµών είναι ίσος µε n, η διωνυµική κατανοµή περιγράφει την πιθανότητα εµφάνισης k επιτυχιών, όπου το k κυµαίνεται µεταξύ 0 και n. Μαθηµατικά, αν µε X συµβολιστεί η τυχαία µεταβλητή µε ενδεχόµενα τις τιµές k (k = 0 n) που αντιπροσωπεύουν τον αριθµό επιτυχιών σε n ανεξάρτητες δοκιµές µε πιθανότητα επιτυχίας καθεµιάς ίση µε p, η µεταβλητή αυτή ακολουθεί διωνυµική κατανοµή µε παραµέτρους n και p. Μια κλασική περίπτωση εφαρµογής της διωνυµικής κατανοµής είναι το πείραµα ρίψης ενός νοµίσµατος. Τα πιθανά ενδεχόµενα είναι δύο (κορώνα ή γράµµατα), ένα από τα οποία µπορεί αυθαίρετα να ονοµαστεί ως επιτυχία. Η πιθανότητα επιτυχίας σε κάθε ρίψη του νοµίσµατος (δοκιµή) είναι ίση µε 0,5. Αν η δοκιµή επαναληφθεί ένα συγκεκριµένο αριθµό, έστω 30, ποια είναι η πιθανότητα να υπάρξουν συνολικά 10, 15, 20 (ή οποιοσδήποτε αριθµός µεταξύ 0 και 30) επιτυχίες; Πρόκειται για µια περίπτωση εφαρµογής της διωνυµικής κατανοµής µε n = 30 και p = 0,5. Η σχέση υπολογισµού των πιθανοτήτων αυτών είναι αρκετά πολύπλοκη και δεν πρόκειται να παρουσιαστεί. Οι υπολογισµοί που ακολουθούν στηρίζονται αποκλειστικά στις συναρτήσεις που παρέχει το Excel. Πριν εξετασθούν οι σχέσεις υπολογισµού που αφορούν στη διωνυµική κατανοµή, σκόπιµο είναι να παρουσιαστεί η µορφή της. Στο αρχείο BDF.XLS (σχήµα 4.1) παρουσιάζεται, µε τη µορφή ραβδογράµµατος, η κατανοµή πιθανότητας που αντιστοιχεί στο παράδειγµα ρίψης νοµίσµατος που αναφέρθηκε παραπάνω. Η γραµµή, στο ίδιο διάγραµµα, αντιπροσωπεύει

Ειδικές κατανοµές πιθανότητας 75 Σχήµα 4.1 Η διωνυµική κατανοµή πιθανότητας. την αντίστοιχη αθροιστική κατανοµή πιθανότητας. Στο φύλλο αυτό δίνεται επίσης η δυνατότητα πειραµατισµού µε τις παραµέτρους της κατανοµής. Μεταβάλλοντας τα κελιά που περιέχουν τις τιµές των παραµέτρων p και n εισάγοντας άµεσα τις νέες τιµές ή χρησιµοποιώντας τα κουµπιά που βρίσκονται στα αριστερά των κελιών ενηµερώνεται αυτόµατα το διάγραµµα της κατανοµής. Ένα ενδιαφέρον συµπέρασµα που προκύπτει είναι ότι για σχετικά µεγάλες τιµές του n και για τιµές της p όχι πολύ κοντά στα άκρα 0 και 1, η διωνυµική κατανοµή είναι συµµετρική και έχει τη µορφή «καµπάνας». Με τη βοήθεια του ίδιου αρχείου µπορεί να υπολογιστεί και η πιθανότητα εµφάνισης συγκεκριµένου αριθµού επιτυχιών. Για παράδειγµα, στην περίπτωση που οι παράµετροι p και n έχουν τιµές 0,5 και 30 αντίστοιχα, οι πιθανότητες εµφάνισης 10, 15 και 20 επιτυχιών είναι 0,028, 0,144 και 0,028 αντίστοιχα. Οι αντίστοιχες αθροιστικές πιθανότητες (οι πιθανότητες δηλαδή εµφάνισης τουλάχιστον 10, 15 και 20 επιτυχιών) είναι 0,049, 0,572 και 0,979. Όπως κάθε κατανοµή πιθανότητας, έτσι και η διωνυµική κατανοµή χαρακτηρίζεται από µία µέση (αναµενόµενη) τιµή και µία τυπική απόκλιση. Οι δύο αυτές ποσότητες εξαρτώνται αποκλειστικά από τα

76 Κεφάλαιο 4 χαρακτηριστικά µεγέθη της κατανοµής (n, p) και υπολογίζονται από τις σχέσεις: ( ) µ= E X = n p (4.1) σ = Stdev( X) = n p ( 1 p) (4.2) Υπολογισµοί µε τη διωνυµική κατανοµή Για τον υπολογισµό πιθανοτήτων µε τη διωνυµική κατανοµή το Excel διαθέτει τη συνάρτηση BINOMDIST. Η σύνταξή της είναι η ακόλουθη: BINOMDIST(k;n;p;cum) Το δεύτερο και τρίτο όρισµα (n και p) είναι οι παράµετροι της διωνυµικής κατανοµής (αριθµός δοκιµών και πιθανότητα επιτυχίας σε κάθε δοκιµή αντίστοιχα). Το πρώτο όρισµα (k) είναι ο αριθµός των επιτυχιών, η πιθανότητα εµφάνισης των οποίων υπολογίζεται. Το τελευταίο όρισµα (cum) είναι µια λογική παράµετρος. Όταν έχει τιµή FALSE (ή την αριθµητική τιµή 0) τότε η συνάρτηση επιστρέφει την πιθανότητα εµφάνισης ακριβώς k επιτυχιών [ P( X= k) ]. Όταν έχει τιµή TRUE (ή αριθµητική τιµή διαφορετική από 0) τότε η συνάρτηση επιστρέφει την αθροιστική πιθανότητα, δηλαδή την πιθανότητα ο αριθµός των επιτυχιών να είναι P X k ]. µικρότερος ή ίσος από k [ ( ) Ο υπολογισµός ποσοστιαίων σηµείων, δηλαδή του αριθµού επιτυχιών για τις οποίες η αθροιστική πιθανότητα έχει συγκεκριµένη τιµή, πραγµατοποιείται µε τη συνάρτηση CRITBINOM. Η σύνταξή της είναι η ακόλουθη: CRITBINOM(n;p;a) Όπως και πριν, τα ορίσµατα n και p αντιπροσωπεύουν τον αριθµό των δοκιµών και την πιθανότητα επιτυχίας σε κάθε δοκιµή. Το όρισµα a είναι η αθροιστική πιθανότητα. Η συνάρτηση επιστρέφει τη µικρότερη τιµή (αριθµό επιτυχιών) για την οποία η αθροιστική πιθανότητα είναι µεγαλύτερη ή ίση µε a. Στο παράδειγµα που ακολουθεί διευκρινίζεται ο τρόπος χρήσης των δύο αυτών συναρτήσεων. Παράδειγµα υπολογισµών µε τη διωνυµική κατανοµή Το επίπεδο νέφους σε µια µεγάλη πόλη θεωρείται µη αποδεκτό περίπου το 15% των ηµερών. Αν επιλεγούν τυχαία 100 ηµέρες, ποιες είναι οι πιθανότητες να εµφανιστούν:

Ειδικές κατανοµές πιθανότητας 77 (α) Ακριβώς 15 ηµέρες µε µη αποδεκτό επίπεδο νέφους. (β) Όχι περισσότερες από 15 ηµέρες µε µη αποδεκτό επίπεδο νέφους. Σχήµα 4.2 Υπολογισµοί µε τη διωνυµική κατανοµή. (γ) Λιγότερες από 15 ηµέρες µε µη αποδεκτό επίπεδο νέφους. (δ) Περισσότερες από 15 ηµέρες µε µη αποδεκτό επίπεδο νέφους. (ε) Μεταξύ 12 και 18 ηµέρες µε µη αποδεκτό επίπεδο νέφους. (στ) Ακριβώς 88 ηµέρες µε αποδεκτό επίπεδο νέφους. (ζ) Τουλάχιστον 82 ηµέρες µε αποδεκτό επίπεδο νέφους.. Ζητείται επίσης η τιµή εκείνη για την οποία υπάρχει 95% πιθανότητα να µην την ξεπερνά ο αριθµός των ηµερών (στο δείγµα των 100 ηµερών) µε µη αποδεκτό επίπεδο νέφους.

78 Κεφάλαιο 4 Λύση Η λύση βρίσκεται στο αρχείο SMOG.XLS και παρουσιάζεται στο σχήµα 4.2. Για τα ερωτήµατα (α) έως (ε), ως επιτυχία ορίζεται η εµφάνιση ηµέρας µε µη αποδεκτό επίπεδο νέφους, της οποίας η πιθανότητα είναι ίση µε 0,15. Η τυχαία µεταβλητή X αντιπροσωπεύει τον αριθµό εµφάνισης ηµερών µε µη αποδεκτό επίπεδο νέφους στο δείγµα των 100 ηµερών. Εποµένως οι ζητούµενες πιθανότητες είναι οι ακόλουθες: (α) P( X= 15) (β) P( X 15) (γ) P( X< 15) = P( X 14) (δ) P( X> 15) = 1 P( X 15) (ε) P( 12 X 18) = P( X 18) P( X < 12) = P( X 18) P( X 11) Κάθε περίπτωση έχει µετατραπεί σε όρους πιθανοτήτων της µορφής P( X= k) ή P( X k) και αυτό επειδή αυτές τις πιθανότητες είναι σε θέση να υπολογίσει η συνάρτηση BINOMDIST. Οι παραπάνω πιθανότητες υπολογίζονται στα κελιά Β8 έως Β12 µε του τύπους: =BINOMDIST(15;TRIALS;PROB;0) =BINOMDIST(15;TRIALS;PROB;1) =BINOMDIST(14;TRIALS;PROB;1) =1-BINOMDIST(15;TRIALS;PROB;1) =BINOMDIST(18;TRIALS;PROB;1)- BINOMDIST(11;TRIALS;PROB;1) Στα ερωτήµατα (στ) και (ζ), ως επιτυχία ορίζεται η εµφάνιση ηµέρας µε αποδεκτό επίπεδο νέφους, της οποίας η πιθανότητα είναι ίση µε 1 0,15 = 0,85. Οι ζητούµενες πιθανότητες είναι οι ακόλουθες: (στ) P( X= 88) (ζ) P( X 82) Οι πιθανότητες αυτές υπολογίζονται στα κελιά B13 και B14 µε τους τύπους: =BINOMDIST(88;TRIALS;1-PROB;0) =BINOMDIST(82;TRIALS;1-PROB;1) Το τελευταίο ερώτηµα αφορά στον υπολογισµό του 95 ου ποσοστιαίου σηµεί- P X k 0,95. ου, δηλαδή, της τιµής k για την οποία ( )

Ειδικές κατανοµές πιθανότητας 79 Αρχικά η τιµή αυτή υπολογίζεται µε δοκιµή και σφάλµα. Στην περιοχή Α18:Α24 εισάγονται διάφορες δοκιµαστικές τιµές για το ζητούµενο αριθµό ηµερών. Στο κελί Β18 εισάγεται ο τύπος: =BINOMDIST(A18;TRIALS;PROB;1) και αντιγράφεται προς τα κάτω µέχρι το κελί Β22. Είναι φανερό ότι δεν υπάρχει k τέτοιο ώστε η αθροιστική πιθανότητα να είναι ακριβώς ίση µε 0,95. Σύµφωνα µε το ερώτηµα όµως, η τιµή εκείνη που ικανοποιεί το κριτήριο είναι η k = 21 της οποίας η αθροιστική πιθανότητα είναι ίση µε 0,9607 (η αθροιστική πιθανότητα της τιµής k = 20 είναι 0,9337, δηλαδή µικρότερη της 0,95). Την τιµή αυτή ακριβώς υπολογίζει και η συνάρτηση CRITBINOM η οποία εφαρµόζεται στο κελί Α28: =CRITBINOM(TRIALS;PROB;B28) Θέσπιση κριτηρίων ποιότητας ατµόσφαιρας Το παράδειγµα που ακολουθεί αποτελεί µια χαρακτηριστική περίπτωση εφαρµογής της διωνυµικής κατανοµής για τη θέσπιση κριτηρίων ποιότητας της ατµόσφαιρας. Η οδηγία NAAQS (National Ambient Air Quality Standards), που τέθηκε σε ισχύ το 1971 στις ΗΠΑ, όριζε µία ανώτατη τιµή για τη συγκέντρωση κάθε ρύπου. Για να θεωρηθεί µία περιοχή σύµφωνη µε τα θεσπισµένα κριτήρια δεν έπρεπε να υπερβαίνει την ανώτατη τιµή περισσότερο από µια ηµέρα το έτος. Για το λόγο αυτό, η δεύτερη µέγιστη ηµερήσια τιµή της συγκέντρωσης κατά τη διάρκεια ενός έτους υιοθετήθηκε ως δείκτης ποιότητας της ατµόσφαιρας. Αν ο δείκτης αυτός υπερέβαινε το θεσπισµένο όριο, η περιοχή κρινόταν ως µη-σύµφωνη µε την οδηγία. Ένα σηµαντικό µειονέκτηµα της οδηγίας αυτής είναι ότι δε λαµβάνει υπόψη την πιθανότητα εµφάνισης ακραίων καταστάσεων. Για παράδειγµα, ασυνήθιστες µετεωρολογικές συνθήκες σε µια περιοχή κατά τη διάρκεια ενός έτους µπορούν να οδηγήσουν στην εµφάνιση υψηλών τιµών συγκέντρωσης ενός ρύπου, αν και η περιοχή είναι σύµφωνη µε την οδηγία όλα τα υπόλοιπα έτη. Για το λόγο αυτό η EPA (Environmental Protection Agency), το 1979, αναθεώρησε την παραπάνω οδηγία µε µια στοχαστική διατύπωση, η οποία στηρίζεται στην αναµενόµενη τιµή των υπερβάσεων. Συγκεκριµένα, για να θεωρηθεί µια περιοχή σύµφωνη µε την οδηγία, έπρεπε η αναµενόµενη τιµή των ηµερήσιων υπερβάσεων στη διάρκεια ενός έτους να µην ξεπερνά την τιµή 1. Το πρόβληµα µε τη νέα διατύπωση ήταν η αδυναµία µέτρησης της αναµενόµενης τιµής λόγω των ασυµπτωτικών ιδιοτήτων της (για τον ακριβή

80 Κεφάλαιο 4 προσδιορισµό της πραγµατικής αναµενόµενης τιµής απαιτείται άπειρος αριθµός µετρήσεων). Προκειµένου να ξεπεραστεί το πρακτικό αυτό πρόβληµα, η EPA καθόρισε ένα τρόπο προσέγγισης της αναµενόµενης τιµής, στηριζόµενη σε µετρήσεις τριών ετών. Έτσι, για να θεωρηθεί µια περιοχή σύµφωνη µε την οδηγία, ο αριθµός των ηµερήσιων υπερβάσεων στη διάρκεια τριών συνεχόµενων ετών δεν έπρεπε να ξεπερνάει την τιµή 3 (δηλαδή η µέση ετήσια τιµή είναι ίση µε 1). Είναι φανερό ότι η νέα οδηγία εισήγαγε δύο κριτήρια. Ένα στοχαστικό, το οποίο στηρίζεται στην αναµενόµενη τιµή των υπερβάσεων ανά έτος και ένα ντετερµινιστικό, το οποίο στηρίζεται στον αριθµό των υπερβάσεων στη διάρκεια τριών ετών. Έχει ενδιαφέρον να εξετασθεί κατά πόσο το ντετερµινιστικό κριτήριο βρίσκεται σε συµφωνία µε το αντίστοιχο στοχαστικό. Λύση Στην ανάλυση που ακολουθεί θεωρείται µια περιοχή που ικανοποιεί οριακά το στοχαστικό κριτήριο. Για την περιοχή αυτή δηλαδή, η αναµενόµενη τιµή των υπερβάσεων ανά έτος είναι ίση µε 1 και εξετάζεται η πιθανότητα εµφάνισης ενός συγκεκριµένου αριθµού ηµερήσιων υπερβάσεων στη διάρκεια ενός ή τριών ετών. Η µεταβλητή αυτή (αριθµός υπερβάσεων) ακολουθεί διωνυµική κατανοµή µε παραµέτρους n και p. Με n συµβολίζεται ο συνολικός αριθµός των ηµερών (ανάλογος των ετών που εξετάζονται) και µε p η πιθανότητα εµφάνισης υπέρβασης του ορίου κατά τη διάρκεια µιας ηµέρας. Καθώς η αναµενόµενη τιµή των υπερβάσεων είναι ίση µε 1, η πιθανότητα αυτή υπολογίζεται εύκολα ως 1/365 (εφαρµογή της σχέσης 4.1). Η ανάλυση βρίσκεται στο αρχείο NAAQS.XLS και για την περίπτωση ενός έτους (πριν την αναθεώρηση του ντετερµινιστικού κριτηρίου) παρουσιάζεται στο σχήµα 4.3. Στα κελιά B4 έως B7 εισάγονται τα δεδοµένα εισόδου. Συγκεκριµένα, εισάγεται ο αριθµός των ετών που εξετάζονται, ο µέγιστος επιτρεπτός αριθµός ηµερήσιων υπερβάσεων στη διάρκεια των ετών αυτών, η αναµενόµενη τιµή των υπερβάσεων που παρουσιάζει η περιοχή και ένα επίπεδο εµπιστοσύνης, η σηµασία του οποίου θα φανεί στη συνέχεια. Στα κελιά B9 και B10, υπολογίζονται οι παράµετροι της διωνυµικής κατανοµής, σύµφωνα µε αυτά που αναφέρθηκαν παραπάνω. Έτσι στα κελιά αυτά εισάγονται οι τύποι: =MEANLIMIT/365 =YEARS*365

Ειδικές κατανοµές πιθανότητας 81 Στα κελιά B13, B14 και B15 υπολογίζονται οι πιθανότητες ο αριθµός των υπερβάσεων (α) να είναι ακριβώς ίσος µε το µέγιστο επιτρεπτό όριο, (β) να είναι µικρότερος ή ίσος από το µέγιστο επιτρεπτό όριο και (γ) να είναι µεγαλύτερος από το µέγιστο επιτρεπτό όριο. Οι υπολογισµοί αυτοί πραγµατοποιούνται µε τη βοήθεια των τύπων: Σχήµα 4.3 Μοντέλο υπολογισµού πιθανοτήτων και ποσοστιαίων σηµείων (περίπτωση ενός έτους). =BINOMDIST(LIMIT;DAYS;PROB;0) =BINOMDIST(LIMIT;DAYS;PROB;1) =1-B14 Τέλος, στο κελί Β18 υπολογίζεται το ποσοστιαίο σηµείο, δηλαδή ο αριθµός των υπερβάσεων για τον οποίο η αθροιστική πιθανότητα είναι ίση µε το επίπεδο εµπιστοσύνης που ορίζεται στο κελί Β7: =CRITBINOM(DAYS;PROB;CONFIDENCE) Όπως φαίνεται από το σχήµα 4.3, σε µια περιοχή που ικανοποιεί οριακά το στοχαστικό κριτήριο, η πιθανότητα εµφάνισης µιας υπέρβασης στη διάρκεια ενός έτους, είναι περίπου 36,8%. Η πιθανότητα εµφάνισης τουλάχιστον µιας υπέρβασης είναι 73,6% και η πιθανότητα εµφάνισης περισσότερων της µιας υπέρβασης είναι 26,4%. Είναι φανερό ότι η τελευταία πιθανότητα είναι πολύ υψηλή. Αν και η περιοχή ικανοποιεί (έστω και οριακά) το στοχαστικό

82 Κεφάλαιο 4 Σχήµα 4.4 Υπολογισµοί πιθανοτήτων και ποσοστιαίων σηµείων (περίπτωση τριών ετών). κριτήριο, σε ένα τυχαίο έτος υπάρχει πιθανότητα µεγαλύτερη από 1 προς 3 να µην ικανοποιεί το ντετερµινιστικό κριτήριο. Το ποσοστιαίο σηµείο που υπολογίστηκε αντιπροσωπεύει την τιµή στην οποία πρέπει να τεθεί το ντετερµινιστικό όριο, ώστε µε βεβαιότητα 95% η ικανοποίηση του ντετερµινιστικού κριτηρίου να σηµαίνει και ικανοποίηση του στοχαστικού κριτηρίου. Στη συγκεκριµένη περίπτωση η τιµή αυτή είναι ίση µε 3. Αυτό σηµαίνει ότι µια περιοχή που ικανοποιεί οριακά το στοχαστικό κριτήριο έχει πιθανότητα τουλάχιστον 95% να εµφανίσει από 0 έως 3 υπερβάσεις σε ένα έτος. Ισοδύναµα, έχει πιθανότητα µόλις 5% να εµφανίσει πάνω από τρεις υπερβάσεις. Αν, εποµένως, ο αριθµός των υπερβάσεων σε µια περιοχή ξεπερνά την τιµή 3, τότε µε βεβαιότητα 95%, η περιοχή αυτή δεν έχει αναµενόµενη τιµή ίση µε 1 και κατά συνέπεια δεν ικανοποιεί το στοχαστικό κριτήριο. ίνοντας στα κελιά Β4 και Β5 την τιµή 3, προκύπτουν τα αντίστοιχα µεγέθη για την αναθεώρηση του ντετερµινιστικού κριτηρίου. Τα αποτελέσµατα παρουσιάζονται στο σχήµα 4.4. Η πιθανότητα εµφάνισης περισσότερων των τριών υπερβάσεων στη διάρκεια τριών ετών είναι περίπου 35,3%, ενώ το 95% ποσοστιαίο σηµείο είναι 6 υπερβάσεις. Στην περιοχή Α20:D39 καταστρώνεται ένας πίνακας δεδοµένων υπολογισµού των παραπάνω πιθανοτήτων για διάφορες τιµές του αριθµού

Ειδικές κατανοµές πιθανότητας 83 των υπερβάσεων και ένα διάγραµµα των κατανοµών τους (σχήµα 4.5). Για την κατάστρωση του πίνακα ακολουθούνται τα παρακάτω βήµατα: Στα κελιά Α24:Α39 εισάγονται διάφορες δοκιµαστικές τιµές του αριθµού των υπερβάσεων. Στα κελιά Β23, C23 και D23 εισάγονται αναφορές στα κελιά όπου υπολογίζονται τα αντίστοιχα µεγέθη (=Β13, =Β14, =Β15). Σχήµα 4.5 Κατανοµή των πιθανοτήτων για διάφορες τιµές του αριθµού υπερβάσεων (περίπτωση τριών ετών). Επιλέγεται η περιοχή Α23:D39 και από το µενού Data δίνεται η εντολή Table. Στο πλαίσιο διαλόγου που ακολουθεί ως Column input cell ορίζεται το κελί Β5. Είναι φανερό ότι σε µια περιοχή που ικανοποιεί οριακά το στοχαστικό κριτήριο, όσο αυξάνεται ο µέγιστος επιτρεπτός αριθµός υπερβάσεων τόσο µειώνεται η πιθανότητα µη ικανοποίησης του ντετερµινιστικού κριτηρίου. Εύκολα προκύπτει και το συµπέρασµα ότι για επίπεδο εµπιστοσύνης 95%, ο µέγιστος αριθµός επιτρεπτών υπερβάσεων είναι 6 (η πιθανότητα εµφάνισης 0 έως 5 υπερβάσεων είναι µόλις 91,6%). Αν µάλιστα το επίπεδο εµπιστοσύνης γίνει 99%, τότε ο µέγιστος αριθµός επιτρεπτών υπερβάσεων πρέπει να πάρει την τιµή 8. Η επίδραση του επιπέδου εµπιστοσύνης εξετάζεται στην περιοχή Α41:Β58 και πάλι µε τη βοήθεια ενός πίνακα δεδοµένων (σχήµα 4.6). Στα κελιά Α44:Α58 εισάγονται διάφορες δοκιµαστικές τιµές του επιπέδου εµπιστοσύνης. Στο κελί Β43 εισάγεται αναφορά στο κελί όπου υπολογίζεται ο µέγιστος επιτρεπτός αριθµός υπερβάσεων (=Β18).

84 Κεφάλαιο 4 Επιλέγεται η περιοχή Α43:Β58 και από το µενού Data δίνεται η εντολή Table. Στο πλαίσιο διαλόγου που ακολουθεί ως Column input cell ορίζεται το κελί Β7. Όπως είναι αναµενόµενο, αύξηση του επιπέδου εµπιστοσύνης οδηγεί σε αύξηση του µέγιστου επιτρεπτού αριθµού υπερβάσεων. Παρατηρείται ότι ακόµη και για τη µικρότερη τιµή του πίνακα (επίπεδο εµπιστοσύνης 85%) ο µέγιστος αριθµός υπερβάσεων είναι ίσος µε 5, αρκετά µεγαλύτερος από την τιµή του ντετερµινιστικού κριτηρίου (ίσο µε 3). Σχήµα 4.6 Επίδραση του επιπέδου εµπιστοσύνης στο µέγιστο επιτρεπτό αριθµό υπερβάσεων (περίπτωση τριών ετών). Έχει ενδιαφέρον να υπολογιστεί για ποιο επίπεδο εµπιστοσύνης το ντετερµινιστικό κριτήριο είναι σύµφωνο µε το στοχαστικό. ηλαδή, να υπολογιστεί το επίπεδο εµπιστοσύνης για το οποίο ο µέγιστος επιτρεπτός αριθµός υπερβάσεων είναι ίσος µε 3. Αυτό µπορεί να γίνει µε τη βοήθεια του ίδιου πίνακα δεδοµένων, µεταβάλλοντας τις δοκιµαστικές τιµές. Η ανάλυση παρουσιάζεται στο σχήµα 4.7, απ όπου προκύπτει ότι το ζητούµενο επίπεδο εµπιστοσύνης είναι ίσο µε 64%. Στην περιοχή Α60:Β82 (σχήµα 4.8) καταστρώνεται ένας πίνακας δεδοµένων υπολογισµού της µεταβολής του µέγιστου επιτρεπτού αριθµού υπερβάσεων (µε επίπεδο εµπιστοσύνης 95%) συναρτήσει του αριθµού ετών. Στα κελιά Α61:Α82 εισάγονται διάφορες δοκιµαστικές τιµές του αριθµού ετών.

Ειδικές κατανοµές πιθανότητας 85 Σχήµα 4.7 Εύρεση πραγµατικού επιπέδου εµπιστοσύνης (περίπτωση τριών ετών). Σχήµα 4.8 Επίδραση του αριθµού των ετών στο µέγιστο επιτρεπτό αριθµό υπερβάσεων (περίπτωση τριών ετών). Στο κελί Β62 εισάγεται αναφορά στο κελί όπου υπολογίζεται ο µέγιστος επιτρεπτός αριθµός υπερβάσεων (=Β18). Επιλέγεται η περιοχή Α62:Β82 και από το µενού Data δίνεται η εντολή Table. Στο πλαίσιο διαλόγου που εµφανίζεται ως Column input cell ορίζεται το κελί Β4. Όπως είναι φυσικό, ο µέγιστος επιτρεπτός αριθµός υπερβάσεων αυξάνεται καθώς αυξάνονται τα έτη των µετρήσεων. Όµως, η ποσοστιαία µεταβολή του δεν είναι αναλογική. Για παράδειγµα, στην περίπτωση ενός έτους ο µέγιστος αριθµός υπερβάσεων είναι 3, στην περίπτωση τριών ετών γίνεται 6 (και όχι 9 αν ακολουθούσε αναλογική αύξηση), ενώ στην περίπτωση είκοσι ετών είναι µόνο 28.

86 Κεφάλαιο 4 Τέλος, στην περιοχή Α84:Β106 καταστρώνεται ένας πίνακας δεδοµένων της µεταβολής του µέγιστου επιτρεπτού αριθµού υπερβάσεων (µε επίπεδο εµπιστοσύνης 95%) συναρτήσει της ετήσιας αναµενόµενης τιµής (σχήµα 4.9). Στα κελιά Α87:Α106 εισάγονται διάφορες δοκιµαστικές τιµές της αναµενόµενης ετήσιας τιµής των υπερβάσεων. Στο κελί Β86 εισάγεται αναφορά στο κελί όπου υπολογίζεται ο µέγιστος επιτρεπτός αριθµός υπερβάσεων (=Β18). Επιλέγεται η περιοχή Α86:Β106 και από το µενού Data δίνεται η εντολή Table. Στο πλαίσιο διαλόγου που ακολουθεί ως Column input cell ορίζεται το κελί Β4. Σχήµα 4.9 Επίδραση της αναµενόµενης ετήσιας τιµής στο µέγιστο επιτρεπτό αριθµό υπερβάσεων (περίπτωση τριών ετών). Ο αριθµός αυτός, από την τιµή 3 που έχει όταν η αναµενόµενη ετήσια τιµή είναι 1, γίνεται 10 όταν η αναµενόµενη ετήσια τιµή γίνει 2. Όπως φαίνεται από το σχήµα, η µέγιστη αναµενόµενη τιµή στην οποία αντιστοιχούν 3 επιτρεπτές υπερβάσεις είναι η 0,4. Εποµένως, το στοχαστικό κριτήριο για να είναι συµβατό (µε επίπεδο εµπιστοσύνης 95%) µε την αναθεωρηµένη µορφή του ντετερµινιστικού κριτηρίου, έπρεπε να ορίζει ως ανώτατη ετήσια αναµενόµενη τιµή των ηµερήσιων υπερβάσεων την 0,4. Υπερκράτηση αεροπορικών θέσεων Στο πρόβληµα αυτό παρουσιάζεται µια απλοποιηµένη εκδοχή των υπολογισµών που γίνονται από τις αεροπορικές εταιρείες κατά την έκδοση

Ειδικές κατανοµές πιθανότητας 87 εισιτηρίων. Είναι γνωστό ότι ένας αριθµός επιβατών ακυρώνουν το ταξίδι τους την τελευταία στιγµή. Προκειµένου να µην υπάρχουν κενές θέσεις, οι αεροπορικές εταιρείες εκδίδουν µεγαλύτερο αριθµό εισιτηρίων από όσες είναι οι θέσεις της πτήσης, ελπίζοντας ότι στο τέλος θα εµφανιστεί ο σωστός αριθµός επιβατών. Έστω ότι ο συνολικός αριθµός των θέσεων είναι 100 και η πιθανότητα µη-εµφάνισης ενός επιβάτη είναι ίση µε 0,15. Η τιµή του εισιτηρίου είναι 50. Το ποσό αυτό επιστρέφεται πίσω σε κάθε επιβάτη που αποφασίζει να µην ταξιδέψει. Στην περίπτωση που ο αριθµός των επιβατών που επιθυµούν να ταξιδέψουν είναι µεγαλύτερος από τον αριθµό των θέσεων, οι επιβάτες που δεν θα πραγµατοποιήσουν την πτήση αποζηµιώνονται µε 25 επιπλέον. Σχήµα 4.10 Μοντέλο υπερκράτησης αεροπορικών θέσεων. Αν η εταιρία αποφασίσει να εκδώσει 115 εισιτήρια ποιος είναι ο αναµενόµενος αριθµός των εµφανιζόµενων επιβατών; Πόσα είναι τα αναµενόµενα έσοδα; Ποιες οι πιθανότητες να εµφανιστούν (α) περισσότεροι από 100 επιβάτες, (β) περισσότεροι από 105 επιβάτες, (γ) τουλάχιστον 95 επιβάτες και (δ) τουλάχιστον 90 επιβάτες; Σε ποιο βαθµό επηρεάζονται τα παραπάνω µεγέθη από τον αριθµό των εκδιδόµενων εισιτηρίων; Ποια είναι η βέλτιστη τιµή των εκδιδόµενων εισιτηρίων;

88 Κεφάλαιο 4 Λύση Η λύση του προβλήµατος βρίσκεται στο αρχείο OVERBOOK.XLS. Η τυχαία µεταβλητή X αντιπροσωπεύει τον αριθµό των επιβατών που εµφανίζονται για να ταξιδέψουν. Ως επιτυχία σε κάθε δοκιµή ορίζεται η εµφάνιση ενός επιβάτη µε πιθανότητα ίση µε 1 0,15 = 0,85. Στο σχήµα 4.10 παρουσιάζονται τα αποτελέσµατα των υπολογισµών που αφορούν στον αναµενόµενο αριθµό εµφανίσεων, στα αναµενόµενα έσοδα και στις ζητούµενες πιθανότητες. Η αναµενόµενη τιµή των εµφανιζόµενων επιβατών υπολογίζεται στο κελί Β11 µε τον τύπο: =TICKETS*(1-PROB) Ο τύπος αυτός αποτελεί άµεση εφαρµογή της σχέσης (4.1). Ο τρόπος υπολογισµού των αναµενόµενων εσόδων διαφέρει στις περιπτώσεις που ο αριθµός των εµφανιζόµενων επιβατών είναι µικρότερος ή µεγαλύτερος από τον αριθµό των θέσεων. Στην πρώτη περίπτωση, τα έσοδα είναι ίσα µε τον αριθµό των επιβατών επί την τιµή του κάθε εισιτηρίου. Στη δεύτερη περίπτωση πρέπει να ληφθούν υπόψη και οι αποζηµιώσεις. Έτσι, τα έσοδα υπολογίζονται ως η τιµή του εισιτηρίου επί τον συνολικό αριθµό θέσεων (100) µείον την τιµή αποζηµίωσης επί τον αριθµό των επιβατών που δεν µπορούν να ταξιδέψουν. Το µέγεθος αυτό υπολογίζεται στο κελί Β12 µε τον τύπο: =IF(B11<=SEATS;PRICE*B11; PRICE*SEATS-FINE*(B11-SEATS)) Ο υπολογισµός των πιθανοτήτων αποτελεί απλή εφαρµογή της συνάρτησης BINOMDIST, όπως παρουσιάστηκε στο προηγούµενο παράδειγµα. Έτσι στα κελιά Β15 έως Β18 εισάγονται οι τύποι: =1-BINOMDIST(100;TICKETS;1-PROB;1) =1-BINOMDIST(105;TICKETS;1-PROB;1) =1-BINOMDIST(94;TICKETS;1-PROB;1) =1-BINOMDIST(89;TICKETS;1-PROB;1) Όπως φαίνεται από το σχήµα 4.10, ο αναµενόµενος αριθµός των εµφανιζόµενων επιβατών είναι 97,75 και οι αναµενόµενες εισπράξεις ίσες µε 4.888. Στο σχήµα 4.11 εξετάζεται η επίδραση του αριθµού των εκδιδόµενων εισιτηρίων στις ποσότητες που υπολογίστηκαν παραπάνω. Αυτό πραγµατοποιείται µε τη βοήθεια ενός πίνακα δεδοµένων µιας εισόδου. Για τη δηµιουργία του πίνακα ακολουθούνται τα παρακάτω βήµατα:

Ειδικές κατανοµές πιθανότητας 89 Σχήµα 4.11 Επίδραση του αριθµού των εκδιδόµενων εισιτηρίων στα διάφορα µεγέθη. Στα κελιά Α23:Α43 εισάγονται διάφορες δοκιµαστικές τιµές για τον αριθµό των εκδιδόµενων εισιτηρίων. Στα κελιά Β22:G22 εισάγονται αναφορές στα κελιά όπου υπολογίζονται τα αντίστοιχα µεγέθη (στο κελί Β22 εισάγεται ο τύπος =Β11 και στο κελί C22 ο τύπος =Β12 κτλ.). Επιλέγεται η περιοχή Α22:G43 και από το µενού Data δίνεται η εντολή Table. Στο πλαίσιο διαλόγου που ακολουθεί ως Column input cell ορίζεται το κελί Β6. Ποιοτικά, τα αποτελέσµατα είναι αναµενόµενα. Με αύξηση του αριθµού των εκδιδόµενων εισιτηρίων παρατηρείται αύξηση και στον αναµενόµενο αριθµό εµφανιζόµενων επιβατών. Αύξηση παρατηρείται και στις τιµές των διαφόρων πιθανοτήτων. Αυτό σηµαίνει ότι αυξάνεται η πιθανότητα οι θέσεις του αεροπλάνου να πληρωθούν, αλλά ταυτόχρονα αυξάνεται και η πιθανότητα να εµφανιστούν περισσότεροι επιβάτες από τις διαθέσιµες θέσεις.

90 Κεφάλαιο 4 Σχήµα 4.12 Εξάρτηση του αριθµού των εµφανιζόµενων επιβατών και των εσόδων από τον αριθµό των εκδιδόµενων εισιτηρίων. Η επιλογή του βέλτιστου αριθµού εισιτηρίων πρέπει να γίνει µε βάση τη µεγιστοποίηση των αναµενόµενων εσόδων. Όπως φαίνεται στο σχήµα 4.11, µε την έκδοση µεγαλύτερου αριθµού εισιτηρίων τα έσοδα αρχικά αυξάνονται αλλά από ένα σηµείο και µετά αρχίζουν να µειώνονται. Τα καθαρά έσοδα µεγιστοποιούνται για αριθµό θέσεων ίσο µε 118 (συνολικά έσοδα 4.993 ). Είναι ενδιαφέρον το γεγονός ότι για την τιµή αυτή ο αναµενόµενος αριθµός εµφανιζόµενων επιβατών είναι περίπου 100, δηλαδή όση είναι και η χωρητικότητα του αεροπλάνου. Στο σχήµα 4.12 παρουσιάζεται υπό τη µορφή διαγράµµατος η εξάρτηση του αριθµού των εµφανιζόµενων επιβατών και των εσόδων από τον αριθµό των εκδιδόµενων εισιτηρίων. Συνεχείς κατανοµές πιθανότητας Στην περίπτωση συνεχών τυχαίων µεταβλητών τα πιθανά ενδεχόµενα καλύπτουν µια περιοχή. Αντί να αντιστοιχίζονται πιθανότητες σε διακριτά ενδεχόµενα, η συνολική πιθανότητα (που είναι ίση µε 1) κατανέµεται στη συνεχή περιοχή των ενδεχοµένων. Αυτό επιτυγχάνεται µε τη συνάρτηση πυκνότητας πιθανότητας (σ.π.π.). Η συνάρτηση αυτή παίρνει θετικές τιµές σε όλο το διάστηµα ορισµού. Μεγάλες τιµές της σ.π.π. εκφράζουν µεγάλη πιθανότητα η τυχαία µεταβλητή να βρεθεί στην συγκεκριµένη περιοχή. Το συνολικό εµβαδόν κάτω από καµπύλη της σ.π.π. εκφράζει τη συνολική πιθανότητα και πρέπει να είναι ίσο µε 1.

Ειδικές κατανοµές πιθανότητας 91 Αν µε ( ) καλύπτει την περιοχή (, ) f x συµβολιστεί η σ.π.π. της τυχαίας µεταβλητής X, η οποία + αυτή πρέπει να έχει τις ακόλουθες ιδιότητες: f( x) 0 (4.3) ( ) f x dx = 1 (4.4) Ο υπολογισµός πιθανοτήτων µε τη βοήθεια της σ.π.π. ανάγεται σε υπολογισµό εµβαδών (ολοκληρωµάτων). Έτσι, η πιθανότητα η τυχαία µεταβλητή X να πάρει τιµές στο διάστηµα [x 1, x 2] είναι ίση µε το εµβαδόν κάτω από την καµπύλη της σ.π.π. που οριοθετείται από τα άκρα του διαστήµατος: x2 ( ) ( P x X x f x dx = ) 1 2 x1 (4.5) Αντίστοιχα, η πιθανότητα η τυχαία µεταβλητή να είναι µικρότερη από δίνεται από τη σχέση: x, 1 x 1 ( ) ( ) P X x1 = f x dx (4.6) Κανονική κατανοµή πιθανότητας Η κανονική κατανοµή (normal distribution) είναι η πιο σηµαντική συνεχής κατανοµή πιθανότητας. Η σ.π.π. της κανονικής κατανοµής έχει πεδίο ορισµού όλη την ευθεία των πραγµατικών αριθµών. Είναι όµως συγκεντρωµένη σε µια στενή περιοχή, η οποία αντιπροσωπεύει την περιοχή των πιο πιθανών ενδεχοµένων. Η αναλυτική της έκφραση έχει τη µορφή: 1 ( x µ ) ( ) 2 2σ f x = e 2, < x< + (4.7) 2πσ και είναι συνάρτηση δύο παραµέτρων. Της µέσης τιµής µ και της τυπικής απόκλισης σ. Στο αρχείο NPDF.XLS παρουσιάζεται σχηµατικά η σ.π.π. της κανονικής κατανοµής (βλ. σχήµα 4.13), ενώ ταυτόχρονα δίνεται η δυνατότητα πειραµατισµού µε τις παραµέτρους αυτής. Μεταβάλλοντας τα κελιά που περιέχουν τις τιµές των παραµέτρων µ και σ, ενηµερώνεται αυτόµατα η

92 Κεφάλαιο 4 Σχήµα 4.13 Η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανοµής. µορφή της κατανοµής (πιθανώς να χρειαστούν τροποποίηση και τα όρια του άξονα x). Με το κουµπί «Τυπική», οι παράµετροι µ, σ παίρνουν τις τιµές 0 και 1 αντίστοιχα. Η ειδική αυτή περίπτωση της κανονικής κατανοµής ονοµάζεται τυπική κανονική κατανοµή (standard normal distribution). Η σ.π.π. της κανονικής κατανοµή είναι εντελώς συµµετρική. Η υψηλότερη τιµή παρουσιάζεται στη θέση x = µ, στην περιοχή της οποίας αντιστοιχεί και η µεγαλύτερη πιθανότητα. Η παράµετρος σ καθορίζει τη διασπορά της κατανοµής γύρω από τη µέση τιµή µ. Το εµβαδόν της γραµµοσκιασµένης περιοχής στο διάγραµµα της κατανοµής, αντιπροσωπεύει την πιθανότητα η τυχαία µεταβλητή να βρίσκεται στο διάστηµα µεταξύ των δύο άκρων της περιοχής. Τα άκρα αυτά µπορούν να µεταβληθούν µέσω των αντίστοιχων κελιών (εισάγοντας άµεσα τις τιµές ή χρησιµοποιώντας τα κουµπιά που βρίσκονται στα δεξιά των κελιών). Με κατάλληλους πειραµατισµούς µπορούν να αποδειχθούν οι ακόλουθοι πρακτικοί κανόνες: Η πιθανότητα η τυχαία µεταβλητή να βρίσκεται σε απόσταση µιας τυπικής απόκλισης από τη µέση τιµή (µ σ, µ + σ) είναι ίση µε 68,27%.

Ειδικές κατανοµές πιθανότητας 93 Η πιθανότητα η τυχαία µεταβλητή να βρίσκεται σε απόσταση δύο τυπικών αποκλίσεων από τη µέση τιµή είναι ίση µε 95,45%. Η πιθανότητα η τυχαία µεταβλητή να βρίσκεται σε απόσταση τριών τυπικών αποκλίσεων από τη µέση τιµή είναι ίση µε 99,73%. Συµπεραίνεται εποµένως ότι αν και η κανονική κατανοµή καλύπτει όλη την περιοχή των πραγµατικών αριθµών, σχεδόν στο σύνολό της είναι συγκεντρωµένη στη περιοχή από µ 3σ έως µ + 3σ. Υπολογισµοί µε την κανονική κατανοµή Οι υπολογισµοί που γίνονται µε την κανονική κατανοµή είναι δύο ειδών: (α) υπολογισµοί πιθανοτήτων και (β) υπολογισµοί ποσοστιαίων σηµείων. Τυπικό παράδειγµα της πρώτης περίπτωσης είναι ο υπολογισµός της πιθανότητας P η τυχαία µεταβλητή X να έχει τιµή µικρότερη από x. Αντίστοιχα, χαρακτηριστικό παράδειγµα της δεύτερης περίπτωσης είναι ο υπολογισµός της τιµής x, για την οποία η τυχαία µεταβλητή X είναι µε πιθανότητα P µικρότερη από αυτήν. Το Excel παρέχει επιπλέον τη δυνατότητα υπολογισµού των τιµών της σ.π.π. της κανονικής κατανοµής (σχέση 4.7). Η συνάρτηση µε την οποία υπολογίζονται πιθανότητες από µια κανονική κατανοµή είναι η NORMDIST. Η σύνταξή της είναι η ακόλουθη: NORMDIST(x;µ;σ;cum) Το δεύτερο και τρίτο όρισµα (µ και σ) είναι οι παράµετροι της κανονικής κατανοµής (µέση τιµή και τυπική απόκλιση). Το πρώτο όρισµα (x) είναι η τιµή της τυχαίας µεταβλητής η πιθανότητα της οποίας υπολογίζεται. Το τελευταίο όρισµα (cum) είναι µια λογική παράµετρος. Όταν έχει τιµή TRUE (ή αριθµητική τιµή διάφορη από 0), η παραπάνω συνάρτηση επιστρέφει την πιθανότητα η τυχαία µεταβλητή να είναι µικρότερη από x [ P( X x) ]. Στην περίπτωση που η παράµετρος cum έχει τιµή FALSE (ή αριθµητική τιµή ίση µε 0) επιστρέφεται η τιµή της σ.π.π. στη θέση x. Αντίστοιχα, η συνάρτηση µε την οποία υπολογίζονται ποσοστιαία σηµεία από µια κανονική κατανοµή είναι η NORMINV. Η σύνταξή της είναι η ακόλουθη: NORMINV(P;µ;σ) Όπως και πριν, τα ορίσµατα µ και σ αντιπροσωπεύουν τις παραµέτρους της κανονικής κατανοµής. Το όρισµα P είναι η αθροιστική πιθανότητα. Η συνάρτηση επιστρέφει την τιµή x για την οποία η τυχαία µεταβλητή έχει πιθανότητα P να είναι µικρότερή της, όταν αυτή ακολουθεί την κανονική κατανοµή µε µέση τιµή µ και τυπική απόκλιση σ.

94 Κεφάλαιο 4 Συµπληρωµατικά, το Excel παρέχει τις ακόλουθες συναρτήσεις υπολογισµού για την τυπική κανονική κατανοµή (µ = 0 και σ = 1): NORMSDIST(x) NORMSINV(P) Από τη συνάρτηση NORMSDIST, εκτός των παραµέτρων µ και σ, απουσιάζει και το όρισµα cum που εµφανίζεται στη γενικευµένη συνάρτηση NORMDIST. Το όρισµα αυτό θεωρείται ότι έχει την τιµή TRUE και η συνάρτηση χρησιµοποιείται µόνο για τον υπολογισµό αθροιστικών πιθανοτήτων. Στο παράδειγµα που ακολουθεί διευκρινίζεται ο τρόπος χρήσης των συναρτήσεων NORMDIST και NORMINV. Παράδειγµα υπολογισµών µε την κανονική κατανοµή Το τµήµα προσωπικού µιας µεγάλης εταιρείας, το οποίο είναι υπεύθυνο για τις προσλήψεις υπαλλήλων, πραγµατοποίησε διαγωνισµό στον οποίο οι υποψήφιοι υποβλήθηκαν σε µια γραπτή εξέταση. Μετά την εξέταση οι υπεύθυνοι του τµήµατος διαπίστωσαν ότι οι βαθµοί των εξετασθέντων ακολουθούν σχεδόν κανονική κατανοµή µε µέση τιµή 525 και τυπική απόκλιση 55. Σύµφωνα µε την πολιτική της εταιρείας, οι υποψήφιοι µε βαθµό 600 και πάνω προσλαµβάνονται αυτοµάτως, οι υποψήφιοι µε βαθµό 425 και κάτω απορρίπτονται, ενώ οι υπόλοιποι περνούν από µια προσωπική συνέντευξη, όπου και αποφασίζεται αν θα προσληφθούν ή όχι. Ο διευθυντής του τµήµατος θέλει να υπολογίσει το ποσοστό των υποψηφίων που (α) απορρίπτονται, (β) προσλαµβάνονται και (γ) προκρίνονται για συνέντευξη. Επίσης, θέλει να ξέρει σε ποιες τιµές πρέπει να θέσει τα όρια ώστε να απορριφθεί το 10% των υποψηφίων και να προσληφθεί το 15%. Λύση Τα δεδοµένα του προβλήµατος και η λύση βρίσκονται στο αρχείο EXAMS.XLS και παρουσιάζονται στο σχήµα 4.14. Για τον υπολογισµό των αποτελεσµάτων ακολουθούνται τα παρακάτω βήµατα: Ποσοστό των υποψηφίων που απορρίπτονται. Είναι ίσο µε το εµβαδόν της κατανοµής από τη θέση 425 και αριστερά [ P( X 425) ]. Ο τύπος στο κελί Β10: =NORMDIST(B8;MEAN;STDEV;1) αποτελεί άµεση εφαρµογή της συνάρτησης NORMDIST.

Ειδικές κατανοµές πιθανότητας 95 Σχήµα 4.14 Υπολογισµοί µε την κανονική κατανοµή. Ποσοστό των υποψηφίων που προσλαµβάνονται αυτόµατα. Είναι ίσο µε το εµβαδόν της κατανοµής από τη θέση 600 και δεξιά [ P( X 600) ]. Καθώς η NORMDIST υπολογίζει πιθανότητες «προς τα αριστερά», υπολογίζεται αρχικά το εµβαδόν από τη θέση 600 και αριστερά και στη συνέχεια αφαιρείται από το συνολικό εµβαδόν (ίσο µε 1). Έτσι, στο κελί B11 εισάγεται ο τύπος: =1-NORMDIST(B7;MEAN;STDEV;1) Ποσοστό των υποψηφίων που προκρίνονται. Είναι ίσο µε το εµβαδόν της κατανοµής των βαθµών µεταξύ των θέσεων 425 και 600 [ P( 425 X 600) ]. Για τον υπολογισµό του αφαιρείται από το εµβαδόν που αντιστοιχεί σε τιµές µικρότερες του 600, το εµβαδόν που αντιστοιχεί σε τιµές µικρότερες του 425. Έτσι, στο κελί Β12 εισάγεται ο τύπος: =NORMDIST(B7;MEAN;STDEV;1)- NORMDIST(B8;MEAN;STDEV;1)

96 Κεφάλαιο 4 Νέο όριο απόρριψης. Είναι η τιµή εκείνη για την οποία το εµβαδόν στα αριστερά είναι ίσο µε 0,1. Ο τύπος στο κελί Β18: =NORMINV(B15;MEAN;STDEV) αποτελεί άµεση εφαρµογή της συνάρτησης NORMINV. Νέο όριο αυτόµατης πρόσληψης. Είναι η τιµή εκείνη για την οποία το εµβαδόν στα δεξιά είναι ίσο µε 0,15, ή ισοδύναµα το εµβαδόν στα αριστερά είναι ίσο µε 1 0,15. Υπολογίζεται στο κελί Β19 µε τον τύπο: =NORMINV(1-B16;MEAN;STDEV) Πρόβληµα εµφιάλωσης Το παράδειγµα αυτό αποτελεί µια τυπική εφαρµογή της κανονικής κατανοµής για την επίλυση ενός προβλήµατος λήψης αποφάσεων. Μια βιοµηχανία καλλυντικών παράγει 10.000 φιάλες σαµπουάν των 330 ml κάθε µήνα. Η ποσότητα σαµπουάν που περιέχεται σε κάθε φιάλη ακολουθεί κανονική κατανοµή. Η µέση ποσότητα µπορεί να καθοριστεί ρυθµίζοντας κατάλληλα τη µηχανή εµφιάλωσης. Ανεξάρτητα από τη µέση τιµή, η τυπική απόκλιση της ποσότητας σαµπουάν ανά φιάλη είναι πάντα 1,5 ml. Το κόστος παραγωγής του σαµπουάν είναι ίσο µε 0,3 ανά 100 ml. Κάθε φιάλη που περιέχει λιγότερο από 330 ml επιστρέφεται και η βιοµηχανία είναι υποχρεωµένη να πληρώσει επιπλέον αποζηµίωση 2. Ζητείται να δηµιουργηθεί το κατάλληλο µοντέλο υπολογισµού του αναµενόµενου κόστους παραγωγής, του αναµενόµενου ποσού αποζηµίωσης και του αναµενόµενου συνολικού κόστους. Με βάση το µοντέλο αυτό να υπολογιστούν τα παραπάνω µεγέθη στις περιπτώσεις όπου η µηχανή εµφιάλωσης ρυθµίζεται στα 330 και 335 ml. Τέλος, ζητείται να υπολογιστεί η βέλτιστη µέση ποσότητα σαµπουάν, στην οποία πρέπει να ρυθµιστεί η µηχανή εµφιάλωσης, ώστε να ελαχιστοποιείται το αναµενόµενο συνολικό κόστος. Η απάντηση να δοθεί µε ακρίβεια 0,1 ml (όση είναι και η ακρίβεια της µηχανής εµφιάλωσης). Επηρεάζεται η απάντηση από τον αριθµό των φιαλών που παράγονται ανά µήνα; Λύση Το ζητούµενο µοντέλο βρίσκεται στο αρχείο BOTTLING.XLS και παρουσιάζεται στο σχήµα 4.15. Τα δεδοµένα εισόδου βρίσκονται στα κελιά D5, D6, D8, D9, D11 και D12. Τα αποτελέσµατα βρίσκονται στα κελιά D16:D20 και υπολογίζονται µε τα παρακάτω βήµατα:

Ειδικές κατανοµές πιθανότητας 97 Αναµενόµενο κόστος παραγωγής. Είναι ανάλογο της συνολικής αναµενόµενης ποσότητας σαµπουάν που παράγεται µηνιαία και εξαρτάται από την τιµή στην οποία ρυθµίζεται η µηχανή εµφιάλωσης. Υπολογίζεται στο κελί D16 µε τον τύπο: =VOLUME*MEAN*COST Πιθανότητα αστοχίας. Είναι η πιθανότητα µία τυχαία φιάλη να περιέχει λιγότερο από 330 ml υπολογίζεται στο κελί D17. Καθώς η ποσότητα σαµπουάν που περιέχεται σε κάθε φιάλη ακολουθεί κανονική κατανοµή, η ζητούµενη πιθανότητα αντιστοιχεί στο εµβαδόν της κατανοµής από τη θέση 330 και αριστερά. Υπολογίζεται άµεσα µε τη συνάρτηση NORMDIST: =NORMDIST(MINQNT;MEAN;STDEV;1) Αναµενόµενος αριθµός φιαλών που επιστρέφονται. Είναι ίσος µε το συνολικό αριθµό που παράγονται επί την πιθανότητα αστοχίας. Υπολογίζεται στο κελί D18 µε τον τύπο: =D17*VOLUME Σχήµα 4.15 Το µοντέλο εµφιάλωσης.

98 Κεφάλαιο 4 Αναµενόµενο ποσό αποζηµίωσης. Είναι ίσο µε τον αναµενόµενο αριθµό φιαλών που επιστρέφονται επί το ποσό αποζηµίωσης ανά φιάλη. Υπολογίζεται στο κελί D19 µε τον τύπο: =D18*FINE Συνολικό αναµενόµενο κόστος. Είναι ίσο µε το άθροισµα του αναµενόµενου κόστους παραγωγής και του αναµενόµενου ποσού αποζηµίωσης. Υπολογίζεται στο κελί D20 µε τον τύπο: =D16+D19 Όπως φαίνεται από το σχήµα 4.15, το συνολικό αναµενόµενο κόστος, στην περίπτωση που η µηχανή εµφιάλωσης ρυθµιστεί στα 330 ml, ανέρχεται σε 19.900 (9.900 κόστος παραγωγής και 10.000 αποζηµίωση). Στην περίπτωση αυτή η πιθανότητα αστοχίας είναι 0,5 (δηλαδή οι µισές φιάλες που παράγονται περιέχουν λιγότερο από 330 ml). Εύκολα διαπιστώνεται (µεταβάλλοντας το περιεχόµενο του κελιού D11) ότι στην περίπτωση που η µηχανή ρυθµιστεί στα 335 ml, το συνολικό κόστος γίνεται µόλις 10.058,6 (10.050 κόστος παραγωγής και 8,6 αποζηµίωση). Η µείωση του συνολικού κόστους οφείλεται στη µείωση της πιθανότητας αστοχίας, η οποία γίνεται µόλις 0,0004. Είναι φανερό ότι όταν η µηχανή ρυθµίζεται σε χαµηλές τιµές, η πιθανότητα αστοχίας και το ποσό αποζηµίωσης παρουσιάζουν υψηλές τιµές. Αντίθετα, όταν η µηχανή ρυθµίζεται σε υψηλές τιµές, το ποσό αποζηµίωσης ελαττώνεται αλλά ταυτόχρονα αυξάνεται το κόστος παραγωγής. Η επιλογή της βέλτιστης ποσότητας σαµπουάν, στην οποία πρέπει να ρυθµιστεί η µηχανή εµφιάλωσης ώστε να ελαχιστοποιείται το συνολικό κόστος πραγµατοποιείται µε τη βοήθεια ενός πίνακα δεδοµένων µιας εισόδου. Η ανάλυση παρουσιάζεται στο σχήµα 4.16 και επιτυγχάνεται µε τα παρακάτω βήµατα: Στα κελιά A27:A47 εισάγονται οι δοκιµαστικές τιµές για τη µέση ποσότητα σαµπουάν. Στα κελιά B26, C26 και D26 εισάγονται αναφορές στα κελιά όπου υπολογίζονται το συνολικό κόστος, το κόστος παραγωγής και το ποσό αποζηµίωσης αντίστοιχα: =D20 =D16 =D19

Ειδικές κατανοµές πιθανότητας 99 Επιλέγεται η περιοχή Α26:D47 και από το µενού Data δίνεται η εντολή Table. Στο πλαίσιο διαλόγου που εµφανίζεται, δίνεται ως column input cell το κελί D11. Στο κελί B49 υπολογίζεται το ελάχιστο συνολικό κόστος παραγωγής µε τον τύπο: =MIN(B27:B47) Τέλος, στο κελί B50 υπολογίζεται η βέλτιστη µέση ποσότητα σαµπουάν εισάγοντας τον τύπο: =INDEX(A27:A47;MATCH(B49;B27:B47;0)) Οι συναρτήσεις MATCH και INDEX εξηγούνται στη συνέχεια. Όπως φαίνεται από το σχήµα 4.16 η βέλτιστη ποσότητα είναι ίση µε 334,8 ml, στην οποία αντιστοιχεί συνολικό κόστος ίσο µε 10.057,7. Στο σχήµα 4.17 παρουσιάζεται το διάγραµµα µεταβολής του συνολικού κόστους συναρτήσει της µέσης ποσότητας σαµπουάν σε κάθε φιάλη.

100 Κεφάλαιο 4 Σχήµα 4.16 Επιλογή βέλτιστης µέσης ποσότητας σαµπουάν. Με τη βοήθεια του µοντέλου που αναπτύχθηκε, διαπιστώνεται εύκολα ότι ο αριθµός των φιαλών που παράγονται µηνιαία δεν επηρεάζει τη βέλτιστη τιµή της µέσης ποσότητας σαµπουάν αλλά µόνο το συνολικό κόστος που αντιστοιχεί σ αυτήν. Για παράδειγµα, µεταβάλλοντας την τιµή του κελιού D5 σε 5.000 φιάλες, η βέλτιστη ποσότητα παραµένει ίση µε 334,8 ml αλλά το βέλτιστο συνολικό κόστος γίνεται ίσο µε 5.028,9.

Ειδικές κατανοµές πιθανότητας 101 Σχήµα 4.17 Επίδραση της µέσης ποσότητας στο συνολικό κόστος. ΣΥΝΑΡΤΗΣΗ MATCH Η συνάρτηση MATCH επιστρέφει τη σχετική θέση µιας συγκεκριµένης τιµής σε µια περιοχή κελιών. Η σύνταξή της είναι η ακόλουθη: MATCH(value;range;type) Το όρισµα value είναι η τιµή που αναζητείται στην περιοχή κελιών range. Το όρισµα type καθορίζει τον τρόπο µε τον οποίο γίνεται η αναζήτηση στην περιοχή range και µπορεί να πάρει µία από τις τιµές 1, 0 και 1. Όταν έχει την τιµή 1, η συνάρτηση αναζητεί τη µεγαλύτερη τιµή που είναι µικρότερη ή ίση µε τη value (οι τιµές της περιοχής range πρέπει να είναι ταξινοµηµένες σε αύξουσα σειρά). Όταν έχει την τιµή 0, η συνάρτηση αναζητεί την πρώτη τιµή που είναι ακριβώς ίση µε value (οι τιµές της περιοχής range δε χρειάζεται να είναι ταξινοµηµένες). Τέλος, όταν έχει την τιµή 1, η συνάρτηση αναζητεί τη µικρότερη τιµή που είναι µεγαλύτερη ή ίση µε τη value (οι τιµές της περιοχής range πρέπει να είναι ταξινοµηµένες σε φθίνουσα σειρά).

102 Κεφάλαιο 4 ΣΥΝΑΡΤΗΣΗ INDEX Η συνάρτηση INDEX επιστρέφει την τιµή ενός συγκεκριµένου κελιού σε µια περιοχή κελιών µε βάση τις σχετικές θέσεις της γραµµής και της στήλης του. Η σύνταξή της είναι η ακόλουθη: INDEX(range;row;column) Το όρισµα range αντιπροσωπεύει την περιοχή κελιών στην οποία γίνεται η αναζήτηση και row, column είναι οι σχετικές θέσεις (µέσα στην περιοχή range) γραµµής και στήλης του κελιού που αναζητείται. Αν η περιοχή range περιέχει µία µόνο στήλη ή γραµµή, η αντίστοιχη παράµετρος column ή row είναι προαιρετική. Βιβλιογραφία Albright, S.C., Winston, W.L, and Zappe, C. (1999) Data Analysis & Decision Making with Microsoft Excel, Duxbury Press, USA. Barlow, F.G. (1999) Excel Models for Business and Operations Management, John Wiley & Sons, Chichester, Sussex. Berk, K.N., and Carey, P. (1998) Data Analysis with Microsoft Excel, Duxbury Press, USA. Hamburg, M. (1983) Statistical Analysis for Decision Making, Harcourt Brace Jovanovitch, USA. Levine, D.M., Berenson, M.L., and Stephan, D. (1999) Statistics for Managers Using Microsoft Excel, Prentice-Hall, NJ. Wayne, R.O. (1995) Environmental Statistics and Data Analysis, Lewis Publisher, USA.