ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Άσκηση 1: Μια τράπεζα ενδιαφέρεται να μελετήσει την αποταμιευτική συμπεριφορά των πελατών της. Θεωρείται ως δεδομένο ότι η ετήσια αποταμίευση των πελατών της (έστω η εξαρτημένη μεταβλητή Υ, σε χιλιάδες ευρώ) εξαρτάται από το ετήσιο εισόδημά τους (έστω η ανεξάρτητη μεταβλητή Χ, σε χιλιάδες ευρώ). Σε τυχαίο δείγμα 10 πελατών η ανάλυση παλινδρόμησης στο excel έδωσε τα εξής αποτελέσματα Στατιστικά παλινδρόμησης Multiple R (Συντελεστής συσχέτισης) 0.610 R quare (Συντελεστής προσδιορισμού) 0.372 Adjusted R quare 0.294 tandader Error 1.858 Observations 10 ANOVA df M F ignif.f Regression 1 16.384 16.384 47.462 0.061 Residual 8 27.616 3.452 Total 9 44 Coeficients tandard Error t tat P-value Lower 95% Σταθερός όρος (α) -1.120 2.422-0.462 0.656-6.706 Ετήσια εισοδήματα σε χιλ. (β) 0.128 0.059 2.179 0.061-0.007 (α) Να γράψετε την εξίσωση του γραμμικού υποδείγματος Υ = α + β Χ (5%) (β) Να ερμηνεύσετε την εκτίμηση του α (5%) (γ) Να ερμηνεύσετε την εκτίμηση του β (5%) (δ) Ποια είναι η τιμή του συντελεστή R 2 και ποια η ερμηνεία του. (5%) (ε) Με δεδομένο ότι κάποιος έχει εισόδημα 30 χιλιάδες να προβλέψετε το ύψος της αποταμίευσής του (5%) (α) Η εξίσωση παλινδρόμησης είναι : Y 1,120 0,128X (β) Ο συντελεστής α, δηλαδή ο σταθερός όρος, δείχνει ότι όταν το εισόδημα (μεταβλητή Χ) είναι μηδενικό η αποταμίευση (μεταβλητή Υ) είναι 1,12 χιλιάδες ευρώ.
(γ) Ο συντελεστής β, δηλαδή η κλίση της ευθείας, δείχνει ότι όταν το εισόδημα (μεταβλητή Χ) αυξάνεται κατά μία μονάδα η αποταμίευση (μεταβλητή Υ) μεταβάλλεται κατά 0,128 χιλιάδες ευρώ. (δ) Ο συντελεστής προσδιορισμού R 2 (R square) δείχνει το ποσοστό το οποίο η μεταβολή της αποταμίευσης (Υ) ερμηνεύεται από μία μεταβολή του εισοδήματος (Χ). Δηλαδή η παρατηρούμενη μεταβολή στην αποταμίευση οφείλεται κατά 37,2% σε μεταβολή του εισοδήματος. (ε) Αντικαθιστούμε στον τύποy 1,120 0,128X και έχουμε : Y 1,120 0,128 30 2, 72 χιλιάδες ευρώ. ΚΑΤΑΝΟΜΕΣ Άσκηση 2: Μια εταιρεία παράγει αγροτικά φάρμακα και τα προωθεί στην αγορά σε κουτιά συγκεκριμένου βάρους. Η εταιρεία ανησυχεί για την αποτελεσματικότητα των φαρμάκων της εξ αιτίας της παρουσίας ξένων ουσιών σ αυτά. Σύμφωνα δε με τον επίσημο κανονισμό λειτουργίας της, αν γίνει έλεγχος από την αρμόδια κρατική υπηρεσία και η εταιρεία κριθεί αρνητικά, τότε υποχρεούται να αναθεωρήσει την παραγωγική της διαδικασία και ενδεχομένως να αναβαθμίσει τα μηχανήματά της και το προσωπικό της. Ο έλεγχος συνίσταται στη λήψη ενός τυχαίου δείγματος 10 κουτιών και το αποτέλεσμα είναι αρνητικό για την εταιρεία αν από τα 10 κουτιά του δείγματος τουλάχιστον δύο βρεθούν να περιέχουν περισσότερα από 12,75 γραμμάρια ξένων ουσιών. Από έρευνες που έγιναν στο παρελθόν, έχει βρεθεί ότι το βάρος των ξένων ουσιών σε κάθε κουτί είναι μία τυχαία μεταβλητή που έχει κανονική κατανομή με μέσο 10 γραμμάρια και τυπική απόκλιση 1 γραμμάριο. 1. Να υπολογισθεί η πιθανότητα σ ένα συγκεκριμένο κουτί που επιλέγεται τυχαία να περιέχονται περισσότερα από 12,75 γραμμάρια ξένων ουσιών. (5%) 2. Να υπολογισθεί η πιθανότητα σ ένα συγκεκριμένο κουτί που επιλέγεται τυχαία να περιέχονται λιγότερα από 7,75 γραμμάρια ξένων ουσιών. (5%) 3. Αν γίνει έλεγχος από την αρμόδια κρατική υπηρεσία, πόσα από τα 10 κουτιά του δείγματος, το οποίο λαμβάνεται προκειμένου να γίνει ο έλεγχος, αναμένεται να περιέχουν περισσότερα από 12,75 γραμμάρια ξένων ουσιών; (5%)
Ορίζουμε Χ το βάρος (σε γραμμάρια) των ξένων ουσιών σε ένα κουτί. X 12, 75 10 1. Συνεπώς z 2,75 και από τον πίνακα της κανονικής 1 κατανομής έχουμε ότι το z αντιστοιχεί σε πιθανότητα 0,9970 (99,70%). Επομένως η ζητούμενη πιθανότητα (περισσότερα από 12,75 γραμμάρια ξένων ουσιών) είναι 0,3%. 10 12,75 X 7, 75 10 2. z 2,25 και από τον πίνακα της κανονικής κατανομής 1 έχουμε ότι το z αντιστοιχεί σε πιθανότητα 0,0122 (1,22%). Επομένως η ζητούμενη πιθανότητα (λιγότερα από 7,75 γραμμάρια ξένων ουσιών) είναι 1,22%. 7,75 10 3. Ορίζουμε Υ τον αριθμό των κουτιών που περιέχουν περισσότερα από 12,75 γραμμάρια ξένων ουσιών σε ένα τυχαίο δείγμα n κουτιών. Στην προκειμένη περίπτωση, σύμφωνα με την απάντηση στο πρώτο ερώτημα, έχουμε ότι η αναμενόμενη τιμή του Υ είναι E Y np 10 0,003 0,03 κουτιά.
Άσκηση 3: Η βαθμολογία (σε μόρια) των επιτυχόντων σε μία σχολή ακολουθεί την κανονική κατανομή Ν (565, 72). i. Να προσδιοριστεί το ποσοστό των επιτυχόντων με βαθμολογία μεταξύ 475 και 640 (20%) ii. Να προσδιορισθεί η ελάχιστη βαθμολογία που πρέπει να συγκεντρώσει ένας επιτυχών ώστε να ανήκει στο 10% εκείνων με τη μεγαλύτερη βαθμολογία.. (30%) X 475 565 i. Για Χ = 475 έχουμε z 1,25 και για Χ = 640 έχουμε ότι 1 72 X 640 565 z 1,04. Από τον πίνακα της κανονικής κατανομής έχουμε 2 72 ότι η τιμή z 1 αντιστοιχεί σε πιθανότητα 0,1056 και η z 2 σε πιθανότητα 0,8508. Επομένως η ζητούμενη πιθανότητα είναι 0,8508 0,1056 = 0,7452 ή 74,52%. 475 565 640 ii. Από τον πίνακα της κανονικής κατανομής εντοπίζουμε την τιμή της μεταβλητής z η οποία αντιστοιχεί σε πιθανότητα 90%. ( z = 1,28 που αντιστοιχεί σε πιθανότητα 0,8997 που είναι το κοντινότερο στο 0,90). Επομένως έχουμε X 565 1, 28 1, 28 72 X 565 92,16 X 565 X 657,16 72 Άρα, ο επιτυχών πρέπει να συγκεντρώσει τουλάχιστον 657,16 μόρια για να ανήκει στο 10% των υποψηφίων με τη μεγαλύτερη βαθμολογία. 10% Πιθανότητα 565 Χ
Άσκηση 4: Ένας καθηγητής του ΕΑΠ επικοινωνεί κάθε εβδομάδα με τους φοιτητές του μέσω τηλεφώνου σε προκαθορισμένα χρονικά διαστήματα συνολικής διάρκειας 3 ωρών (ώρες γραφείου). Σε αυτές τις ώρες, ο καθηγητής λαμβάνει κατά μέσο όρο μία κλήση ανά 45 λεπτά. Με βάση τα στοιχεία αυτά να υπολογιστεί η πιθανότητα ο καθηγητής να λάβει τουλάχιστον δύο κλήσεις στις ώρες γραφείου μιας εβδομάδας. Από τη στιγμή που δεν υπάρχει περιορισμός στο δείγμα πρόκειται για κατανομή Poisson. Ο καθηγητής σε διάστημα 3 ωρών λαμβάνει : 1 κλήση ανά 45 λεπτά 180 4ανά εβδομάδα. λ κλήσεις σε 180 λεπτά 45 Έστω Χ οι κλήσεις που λαμβάνει στις ώρες γραφείου κάθε εβδομάδα, δηλαδή εδώ Χ = τουλάχιστον δύο κλήσεις. Χ=2, Χ= 3, Χ=+ Επομένως θα υπολογίσουμε τις πιθανότητες για Χ = 0 και για Χ = 1 από τον τύπο P x P x 4 e x! e x, δηλαδή 4 0 0 0, 0183 4 0 0, 0183 και Px 0! 1 4 1 e 0, 0183 4 1 0, 0732 1! 1 P x 2 1 0, 0183 0, 0732 0,9085 Άρα η ζητούμενη πιθανότητα είναι
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Άσκηση 5: Σε μια έρευνα για την απασχόληση, σε 500 εργαζόμενους που βρέθηκαν στην ανεργία προέκυψαν τα παρακάτω στοιχεία: Χρόνος ανεργίας (σε μήνες) Σχετική Συχνότητα (%) [0, 6) 19,0 [6, 12) 38,6 [12, 18) 24,4 [18, 24) 11,2 [24, 30) 4,4 [30, 36) 2,6 100 (i) Ποιος είναι ο αριθμός των εργαζομένων στους οποίους ο χρόνος ανεργίας είναι μικρότερος από 6 μήνες; Σε πόσους εργαζόμενους ο χρόνος ανεργίας είναι τουλάχιστον 18 αλλά και μικρότερος από 30 μήνες; (ii) Να υπολογισθούν ο αριθμητικός μέσος, και ο διάμεσος χρόνος ανεργίας στην εν λόγω έρευνα και να ερμηνευτούν τα αποτελέσματα.. Επίσης, να υπολογισθεί η επικρατούσα τιμή και να χαρακτηρίσετε την κατανομή των δεδομένων από την άποψη της ασυμμετρίας. (iii) Αν το επίδομα ανεργίας ανέρχεται σε 300 ευρώ ανά μήνα και δίνεται στους δικαιούχους σε όλη την διάρκεια του χρόνου που παραμένουν άνεργοι, πόσο επιβαρύνει κατά μέσο όρο ο κάθε άνεργος τον ΟΑΕΔ; Αρχικά υπολογίζουμε τον πίνακα συχνοτήτων Χρόνος ανεργίας (σε μήνες) Σχετική συχνότητα Συχνότητα f i Αθροιστική συχνότητα F i Κεντρική τιμή m i i i [0,6) 19% 500 * 19% = 95 95 3 95*3=285 [6,12) 38,6% 500 * 38,6% = 193 95+193=288 9 193*9=1.737 [12,18) 24,4% 500 * 24,4% = 122 288+122=410 15 122*15=1.830 [18,24) 11,2% 500 * 11,2% = 56 410+56=466 21 56*21=1.176 [24,30) 4,4% 500 * 4,4% = 22 466+22=488 27 22*27=594 [30,36) 2,6% 500 * 2,6% = 12 488+12=500 33 12*33=396 Σύνολο 100% 500 6.018 f m
(i) www.onlineclassroom.gr Ο αριθμός των εργαζόμενων με διάστημα ανεργίας μέχρι 6 μήνες είναι 95 και είναι το πλήθος της πρώτης τάξης. Και οι εργαζόμενοι με διάστημα ανεργίας τουλάχιστον 18 μήνες και μέχρι 30 είναι 56 + 22 = 78 και είναι οι συχνότητες των τάξεων [18-24) και [24-30). (ii) Αριθμητικός Μέσος : X k fi i1 k i1 m f i i 6.018 12, 036 μήνες 500 n 500 Διάμεσος : η θέση της διαμέσου είναι 250 και η τάξη της η 2 η [6,12) διότι η 2 2 αθροιστική της συχνότητα υπερβαίνει το 250 ( Fi = 288 > 250 ). n 6 500 M LM FM 1 6 95 10,819 μήνες fm 2 193 2 Σχολιασμός: Ο αριθμητικός μέσος δείχνει το μέσο όρο ανεργίας και επηρεάζεται από ακραίες τιμές ενώ η διάμεσος δείχνει τους μήνες ανεργίας του ατόμου που είναι στη μέση της κατανομής ως προς το διάστημα που έχει μείνει άνεργος και δεν επηρεάζεται από ακραίες τιμές. Επικρατούσα τιμή : η τάξη της επικρατούσας τιμής είναι αυτή με τη μεγαλύτερη συχνότητα f i, δηλαδή η 2 η [6,12). 1 19395 T0 LT 6 6 9, 47 19395 193122 0 1 2 Η ασυμμετρία της κατανομής X T 0 p είναι σίγουρα θετική γιατί X 12,036 T 9,47 και θετικό εξ ορισμού. 0 Άρα X T0 12, 036 9, 47 2,566 0 και έτσι ισχύει ότι p X T 0 0 (iii) Ο κάθε άνεργος επιβαρύνει τον ΟΑΕΔ κατά μέσο όρο με το γινόμενο 300 * το μέσο όρο του διαστήματος που μένει άνεργος δηλαδή: 300 X 300 12,036 3.610,8. E-mail: info@onlineclassroom.gr