Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα
Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση που μας επιτρέπει να απεικονίσουμε όλα τα δυνατά αποτελέσματα ενός πειράματος τύχης στο σύνολο των πραγματικών αριθμών. Τις τυχαίες μεταβλητές τις συμβολίζουμε με κεφαλαία γράμματα Χ, Υ και με μικρά γράμματα συμβολίζουμε τις τιμές που μπορούν να πάρουν αυτές 1, 2,, y 1,y 2,. 2
Υπενθύμιση-Συναρτήσεις Συναρτήσεις. Τι είναι; Ποια είναι τα βασικά στοιχεία για να είναι πλήρως ορισμένη μία συνάρτηση; Παραδείγματα. 3
Παραδείγματα τυχαίων μεταβλητών 1 ο : Αν στρίψουμε ένα νόμισμα τέσσερις φορές η μεταβλητή Ζ = «πόσες φορές φέρνουμε γράμματα» τι τιμές μπορεί να πάρει; 2 ο : Η μεταβλητή Χ = «το βάρος των νεογέννητων σε ζυγαριά υψίστης ακριβείας» τι τιμές μπορεί να πάρει; 4
Διάκριση Μεταβλητών Μετρήσιμες τιμές ακέραιες Τυχαία Μεταβλητή Διακριτές Απείρως αριθμήσιμο σύνολο τιμών ακέραιες Συνεχείς Άπειρες τιμές 5
Παράδειγμα 3 ο Ένας αγρότης προσδοκά στα επόμενα τρία χρόνια να έχει ετήσια δαπάνη σε σταθερές τιμές το πολύ 300 για την αγορά λιπασμάτων. Συμβολίζουμε με: Α: το ενδεχόμενο να έχει ετήσια δαπάνη 300 Β: το ενδεχόμενο να έχει ετήσια δαπάνη>300. Ποιος είναι ο δειγματικός χώρος για τις επόμενες τρείς χρονιές; 6
Συνάρτηση πιθανότητας ή κατανομή πιθανότητας διακριτής τ.μ. Θεωρούμε μία διακριτή τ.μ. Χ η οποία παίρνει τιμές αύξουσες με: 1 2 3... Έστω ότι οι πιθανότητες να πάρει η τ.μ. Χ τις τιμές αυτές είναι: X f P i P i i με i=1,2,.. 7
Συνάρτηση πιθανότητας ή κατανομή πιθανότητας διακριτής τ.μ. Τότε ορίζουμε ως συνάρτηση πιθανότητας σ.π. ή κατανομή πιθανότητας της τ.μ. Χ την εξής: f P P X έτσι ώστε για Χ= 1, 2, να έχουμε και για τις υπόλοιπες τιμές του η f=0. Η συνάρτηση αυτή ορίζεται στην περίπτωση που έχουμε διακριτή τ.μ. Τι πρέπει να ισχύει για την f;; f i P X i 8
Συνάρτηση πιθανότητας ή κατανομή πιθανότητας διακριτής τ.μ Η f για να είναι συνάρτηση πιθανότητας μίας διακριτής τ.μ. Χ πρέπει να ικανοποιεί δύο βασικές προϋποθέσεις: 1. f 0 2. i f i 1, ό έ έ i. 9
Αθροιστική συνάρτηση κατανομής διακριτής τυχαίας μεταβλητής Ως αθροιστική συνάρτηση κατανομής α.σ.κ. για μία διακριτή τ.μ. Χ ορίζουμε την πιθανότητα η τυχαία μεταβλητή να πάρει τιμές μικρότερες ή ίσες από μία συγκεκριμένη τιμή. Ειδικότερα ισχύει: i i i i X P P X P F X P F 10
Παράδειγμα 4 ο Ποιά είναι η πιθανότητα να ρίξουμε ένα ζάρι και να πάρουμε αποτέλεσμα μικρότερο ή ίσο του 5. Ποιος είναι ο συμβολισμός; Πώς ορίζεται η αθροιστική συνάρτηση κατανομής; 11
Συνάρτηση πυκνότητας πιθανότητας συνεχούς τυχαίας μεταβλητής Θεωρούμε μία συνεχή τυχαία μεταβλητή Χ. Η f ονομάζεται συνάρτηση πυκνότητας πιθανότητας σ.π.π. της συνεχούς τ.μ. Χ εάν ισχύουν αξιωματικά ότι: 1. f 0 ά R 2. f d 1 12
Συνάρτηση πυκνότητας πιθανότητας συνεχούς τυχαίας μεταβλητής Η πιθανότητα η συνεχής τ.μ. Χ να παίρνει τιμές μεταξύ των α, β ορίζεται ως εξής: Για αυτή την συνάρτηση ισχύουν οι σχέσεις: a f X a P X a P X a P X a P 1 3. 2. 1. a X P a X P d f a X P a X P X P X a P a 13
Αθροιστική συνάρτηση κατανομής συνεχούς τυχαίας μεταβλητής Η αθροιστική συνάρτηση κατανομής δίνεται από τον τύπο: F P Εφόσον υπάρχει: X f d df d f 14
Στατιστικά μέτρα τυχαίων μεταβλητών: Μέση τιμή Διακριτή τυχαία μεταβλητή Στην περίπτωση διακριτής τ.μ. Χ η μέση τιμή συμβολίζεται με ΕΧ=μ και υπολογίζεται: E X i1 P όπου P i η συνάρτηση πιθανότητας της Χ. Ο όρος που χρησιμοποιείται είναι αναμενομένη τιμή ή προσδοκώμενη τιμή Epected value. i i 15
Παράδειγμα 5 ο Στην ρίψη ενός ζαριού να υπολογιστεί η αναμενομένη τιμή μ του αποτελέσματος. Παρατήρηση: Η μέση τιμή-αναμενομένη τιμή είναι ένας αριθμός που δεν ανήκει απαραίτητα στον δειγματικό χώρο της μεταβλητής. 16
Παράδειγμα 6 ο Με τη βοήθεια μίας συσκευής μετρήσαμε 2 φορές το επίπεδο του όζοντος στον αέρα. Την πρώτη φορά βρέθηκε να είναι 30 μονάδες πάνω από τα κανονικά επίπεδα ενώ τη δεύτερη φορά 8 μονάδες κάτω από τα κανονικά επίπεδα. Αν Χ η τ.μ. που παίρνει ως τιμές τα αποτελέσματα των μετρήσεων, 1 =30, 2 =-8 με αντίστοιχες πιθανότητες P 1 1 P30, P P 8 2 2 1 2 να βρεθεί η μέση τιμή της Χ. 17
Στατιστικά μέτρα τυχαίων μεταβλητών: Μέση τιμή Συνεχής τυχαία μεταβλητή Στην περίπτωση συνεχούς τ.μ. Χ η μέση τιμή συμβολίζεται επίσης με ΕΧ=μ και δίνεται από την σχέση: E X f d Όπου f συνάρτηση πυκνότητας πιθανότητας 18
Παράδειγμα 7 ο Μετά από μετρήσεις βρέθηκε ότι η ημερήσια συγκέντρωση διαλυμένου οξυγόνου σε έναν σταθμό μέτρησης ενός ποταμού είναι μία συνεχής τ.μ. Χ με συνάρτηση πυκνότητας πιθανότητας 2 f ό 0 17 17 και f=0 για τις υπόλοιπες τιμές του Χ. Να βρεθεί η μέση τιμή της τ.μ. Χ. 19
Στατιστικά μέτρα τυχαίων μεταβλητών: Διακύμανση-Τυπική απόκλιση Διακριτή τυχαία μεταβλητή Χ Η διακύμανση της τ.μ. συμβολίζεται με VarX ή σ 2 και δίνεται από τη σχέση: 2 Var E 2 2 X E X X Η τυπική απόκλιση VarX είναι η θετική τετραγωνική ρίζα της διακύμανσης. 20
Στατιστικά μέτρα τυχαίων μεταβλητών: Διακύμανση-Τυπική απόκλιση Διακριτή τυχαία μεταβλητή Χ Η ποσότητα ΕΧ 2 λέγεται ροπή δεύτερης τάξης και δίνεται από τον τύπο: E X 2 i1 2 i P i 21
Στατιστικά μέτρα τυχαίων μεταβλητών: Διακύμανση-Τυπική απόκλιση Συνεχής τυχαία μεταβλητή Χ Η διακύμανση της συνεχούς τ.μ. Χ συμβολίζεται με τον ίδιο τρόπο και ισούται με: 2 Var X E X 2 E X 2 E X 2 f d 2 f d. 22
Στατιστικά μέτρα τυχαίων μεταβλητών: Διακύμανση-Τυπική απόκλιση Συνεχής τυχαία μεταβλητή Χ Η ποσότητα ΕΧ 2 λέγεται επίσης ροπή δεύτερης τάξης και δίνεται από τον τύπο: 2 2 E X f d 23
Παράδειγμα 8 ο Έστω ότι σε ένα κατάστημα πώλησης υπολογιστών εμφανίζονται ανά ώρα 3 έως 6 πελάτες με την κατανομή πιθανοτήτων που εμφανίζεται στον πίνακα: Αριθμός Πελατών 3 0,15 4 0,45 5 0,25 6 0,15 Πιθανότητα Να υπολογιστεί η μέση τιμή, η διακύμανση και η τυπική απόκλιση για την κατανομή αυτή. 24
Συνδιακύμανση δύο τ.μ. Χ και Υ Σε πολλές περιπτώσεις μας ενδιαφέρει να εξετάσουμε περισσότερα από ένα χαρακτηριστικά του πληθυσμού τα οποία είναι πιθανό να αλληλοεξαρτώνται. Για παράδειγμα η τιμή και η ποιότητα ενός αγροτικού προϊόντος. Στις περιπτώσεις αυτές μας ενδιαφέρει να ορίσουμε την συνδυασμένη συμπεριφορά δύο ή περισσοτέρων τ.μ. 25
Συνδιακύμανση δύο τ.μ. Χ και Υ Η συνδιακύμανση των Χ,Υ στον πληθυσμό δίνεται από τον τύπο: Cov X, Y E[ X Y Y ] Όταν αναφερόμαστε σε δείγμα μεγέθους ν η δειγματική διακύμανση ισούται με: y y 1 Cov X, Y yvy v 1 v 1 26
Αν Συνδιακύμανση δύο τ.μ. Χ και Υ τότε έχουμε θετική συσχέτιση μεταξύ των Χ, Υ, δηλαδή όταν αυξάνεται μειώνεται η τιμή της Χ αυξάνεταιμειώνεται και η τιμή της Υ. Αν Cov X, Y Cov X, Y τότε έχουμε αρνητική συσχέτιση μεταξύ των Χ, Υ, δηλαδή όταν αυξάνεται η τιμή της Χ μειώνεται η τιμή της Υ. Αν Cov X, Y ανεξάρτητες. 0 0 0 τότε οι μεταβλητές Χ,Υ είναι 27
Παράδειγμα 9 ο Δίνονται οι μεταβλητές Χ,Υ οι οποίες εκφράζουν τα ύψη φυτών Υ και τα αντίστοιχα επίπεδα βροχής Χ για τις οποίες έχουμε συλλέξει τα ακόλουθα δεδομένα: Χ 3 6 9 Υ 7 3 2 ΧΥ Σύνολο Να βρεθεί η δειγματική συνδιακύμανση των Χ και Υ. 28
Συσχέτιση δύο μεταβλητών Θεωρούμε δύο τυχαίες μεταβλητές X, Y και ν ζεύγη παρατηρήσεων, y1,..., v, y 1 v από τυχαίο δείγμα μεγέθους ν. Αναφερόμαστε, δηλαδή, σε μη πειραματικά δεδομένα ο ερευνητής δεν προκαθορίζει-ελέγχει τις τιμές καμιάς από τις δύο μεταβλητές όπως, Χ το ύψος των φοιτητών ενός πανεπιστημιακού τμήματος και Υ το βάρος τους Χ οι ώρες μελέτης των φοιτητών ενός πανεπιστημιακού τμήματος και Υ η απόδοση τους σε ένα τεστ Χ οι εβδομάδες εμπειρίας ενός εργάτη σε μια επιχείρηση και Υ ο αριθμός των ελαττωματικών προϊόντων που παράγει 29
Συσχέτιση δύο μεταβλητών Στις περιπτώσεις όπου από τον πληθυσμό επιλέγουμε ένα τυχαίο δείγμα και σε κάθε μονάδα του δείγματος μελετάμε δύο ή περισσότερα χαρακτηριστικά, είναι λογικό, να αναζητήσουμε μέτρα τα οποία να μπορούν να εκφράσουν και να ποσοτικοποιήσουν την πιθανή συσχέτιση των χαρακτηριστικών. Για παράδειγμα, συσχετίζονται συμμεταβάλλονται ο μισθός και τα έτη σπουδών των εργαζομένων; Πώς συμμεταβάλλονται; Δηλαδή, όταν αυξάνουν τα έτη σπουδών, αυξάνει ο μισθός του εργαζομένου; μειώνεται μήπως;!. Ποσό ισχυρή είναι η συμμεταβολή των μεταβλητών έτη σπουδών και μισθός; 30
Συσχέτιση δύο μεταβλητών Ένας απλός τρόπος για να αποκτήσουμε μια πρώτη ιδέα για το αν και πώς δυο μεταβλητές συσχετίζονται, είναι να κατασκευάσουμε το διάγραμμα διασποράς Scatter diagram ή Scatter plot. Να αναπαραστήσουμε δηλαδή τα ζεύγη των παρατηρήσεων σε ένα διάγραμμα. 31
Παράδειγμα 10 ο Scatter Plot Στον πίνακα που ακολουθεί φαίνονται οι παρατηρήσεις που πήραμε για το ύψος και το βάρος 16 εργατών μιας βιομηχανίας. Από το διάγραμμα διασποράς ποια είναι η σχέση μεταξύ του ύψους και του βάρους των εργατών; 32
Συντελεστής Συσχέτισης Pearson Καταλληλότερο μέτρο του βαθμού εξάρτησης δύο μεταβλητών είναι ο πληθυσμιακός συντελεστής συσχέτισης ο οποίος ορίζεται ως εξής: X, Y Cov X, Y Y Εάν ρχ,υ=0 οι τ.μ. Χ, Υ ονομάζονται ασυσχέτιστες. Ισχύει -1 ρχ,υ 1, δηλαδή ο συντελεστής συσχέτισης παίρνει τιμές μεταξύ του -1 και του 1. 33
Συντελεστής Συσχέτισης Ο δειγματικός συντελεστής συσχέτισης Όταν αναφερόμαστε σε δείγμα μεγέθους ν ο δειγματικός συντελεστής συσχέτισης r δίνεται από την σχέση: r i i s s y y i y 34
Συντελεστής Συσχέτισης Ο προηγούμενος τύπος έχει ως εξής: 35 v i i v i i v i i i y y y y Y X r 1 2 2 1 1,
Συντελεστής Συσχέτισης-Ερμηνεία Ιδιότητες του r: 1. Εάν 0 < r < 1 τότε οι Χ και Υ είναι θετικά γραμμικά συσχετισμένες. 2. Εάν -1 < r < 0 τότε οι Χ και Υ είναι αρνητικά γραμμικά συσχετισμένες. 3. Εάν r = 1 τότε έχουμε τέλεια θετική γραμμική συσχέτιση και όλα τα σημεία βρίσκονται πάνω στην ευθεία y = α + β. y και β > 0. Αντίστοιχα αν r = -1 τότε έχουμε τέλεια αρνητική γραμμική συσχέτιση. 4. Εάν r = 0 τότε δεν υπάρχει γραμμική συσχέτιση μεταξύ των μεταβλητών Χ και Υ. Οπότε λέμε ότι είναι γραμμικά ασυσχέτιστες. 36
Συντελεστής Συσχέτισης-Σχηματικά 37
Παράδειγμα 11 ο Για τα δεδομένα του επόμενου πίνακα να υπολογίσετε τον δειγματικό συντελεστή συσχέτισης. 38
Παράδειγμα 12 ο Έστω η τ.μ. Χ με τιμές 0, 1, 2, 3, 4, 5, 6 και η τ.μ. Υ με τιμές -1, 2, 3, 7, 11, 15. Να βρεθεί η συνδιακύμανση και ο συντελεστής συσχέτισης των Χ και Υ. 39
Παράδειγμα 13 ο Εξετάσθηκαν οι τιμές δύο αγαθών Χ,Υ για έξι ημέρες και τα αποτελέσματα δίνονται στον επόμενο πίνακα. Να βρεθεί η δειγματική συνδιακύμανση CovX,Y και ο δειγματικός συντελεστής συσχέτισης r. Ημέρες Τιμή αγαθού Χ Τιμή αγαθού Υ 1 2 7 2 2,7 7,8 3 3,1 6,5 4 2,9 7,1 5 2,5 6,2 6 3,3 5,9 40
Παράδειγμα 14 ο Έστω Χ η διακριτή τ.μ. η οποία εκφράζει τον αριθμό των γεωργικών ατυχημάτων =1,2,3,4 σε μία αγροτική περιοχή, με αντίστοιχες πιθανότητες ρ=2p,p,4p, 3p όπου p σταθερά. α Να υπολογισθούν οι πιθανότητες: i. Να έχουμε μεταξύ 0 και 3 ατυχημάτων. ii. Να έχουμε πάνω από 2 ατυχήματα. β Να βρεθεί ο μέσος όρος των γεωργικών ατυχημάτων στην περιοχή. 41
Παράδειγμα 15 ο Η διακριτή τ.μ. Χ εκφράζει τον αριθμό των ελαττωματικών προϊόντων =0,1,2 σε κάθε παρτίδα η οποία ελέγχεται σε εργοστάσιο τυποποίησης και συσκευασίας αγροτικών προϊόντων και έχει κατανομή πιθανότητας η οποία δίνεται από τον πίνακα, όπου c>0: 0 1 2 p c 2 3c-5c 2 1-c α Να υπολογισθεί η σταθερά c. β Να βρεθούν οι πιθανότητες: PX<1, PX<2 και P-2<X<2. γ Να υπολογισθούν τα EX, VarX. 42
Βιβλιογραφία 1. Σαριαννίδης, Ν., Κοντέος, Γ., Λαζαρίδης, Θ. 2013. Στατιστική και Οικονομετρία, Εκδόσεις Αλέξανδρος. Ι.Κ.Ε. 2. Κουτρουμανίδης, Θ., Ζαφειρίου, Ε., Μαλέσιος, Χ. 2015. Στατιστική Ι: Θεωρία και Εφαρμογές στην Αγροτική Οικονομία, Εκδόσεις Τζιόλλα. 43