ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ-13 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 2017-2018 Τρίτη Γραπτή Εργασία στη Στατιστική Γενικές οδηγίες για την εργασία Οι απαντήσεις στις ερωτήσεις της εργασίας πρέπει να δίνονται σε δύο αρχεία σύμφωνα με τις αναλυτικές οδηγίες που ακολουθούν. Τα δύο αρχεία θα πρέπει να αναρτηθούν στο http://study.eap.gr Καταληκτική ημερομηνία παραλαβής της γραπτής εργασίας: Τρίτη 20 Μαρτίου 2018.
ΑΣΚΗΣΗ 1 (ΜΟΝΑΔΕΣ 30) Οι μετρήσεις της μέγιστης ημερήσιας τιμής ενός συγκεκριμένου αέριου ρύπου (σε μικρογραμμάρια ανά κυβικό εκατοστό αέρα) σε 57 πόλεις μιας χώρας δίνονται στον Πίνακα Ι. Τα δεδομένα υπάρχουν επίσης στο αρχείο Excel, φύλλο Asks-1. 17 17 17 84 79 74 73 70 68 62 21 29 26 27 33 33 32 54 28 30 28 29 56 51 49 48 47 43 47 37 28 33 55 50 48 43 41 36 35 36 27 32 32 32 56 48 47 41 37 35 24 30 30 33 54 54 52 Πίνακας Ι a. Υπολογίστε τον αριθμητικό μέσο, τη διάμεσο και το ενδοτεταρτημοριακό εύρος των παρατηρήσεων κάνοντας χρήση των τύπων του τυπολογίου. Η απάντηση να δοθεί στο αρχείο Word. Οι ίδιοι υπολογισμοί να γίνουν χρησιμοποιώντας και τις αντίστοιχες συναρτήσεις του Excel. Οι υπολογισμοί να γίνουν διατηρώντας τρία (3) δεκαδικά ψηφία. (Σημείωση: Ενδέχεται σε ορισμένες περιπτώσεις οι αντίστοιχες συναρτήσεις του Excel να χρησιμοποιούν διαφορετικούς τύπους από αυτούς του Τυπολογίου). (ΜΟΝΑΔΕΣ 5) b. Υπολογίστε την τυπική απόκλιση, τη διάμεσο και τον συντελεστή ασυμμετρίας των παρατηρήσεων κάνοντας χρήση κατάλληλων συναρτήσεων του Excel. Η απάντηση να δοθεί στο αρχείο Excel. (ΜΟΝΑΔΕΣ 3) c. Για την ομαδοποίηση ή ταξινόμηση των δεδομένων σε ομάδες (τάξεις), το πλάτος των ομάδων υπολογίζεται από τον τύπο =/, όπου το εύρος των δεδομένων και το πλήθος των ομάδων. Για τον υπολογισμό του πλήθους των ομάδων q συχνά χρησιμοποιείται ο τύπος του Sturges: = 1+3,32 log (), (όπου log ο δεκαδικός λογάριθμος και το πλήθος των δεδομένων). Για τα δεδομένα της άσκησης και στρογγυλοποιώντας προς τα πάνω προκύπτει =7 και =10. Σε αυτή τη βάση και λαμβάνοντας ως κάτω όριο της πρώτης ομάδας το 14,5, ομαδοποιήστε τα δεδομένα του Πίνακα Ι και υπολογίστε τις συχνότητες των ομάδων, τις σχετικές συχνότητες, τις αθροιστικές συχνότητες και τις αθροιστικές σχετικές συχνότητες. Η απάντηση να δοθεί στο αρχείο Excel. (ΜΟΝΑΔΕΣ 7) Σελίδα - 2 - από 22
d. Να υπολογιστεί ο αριθμητικός μέσος, η δειγματική διακύμανση και ο συντελεστής μεταβλητότητας των ομαδοποιημένων δεδομένων με χρήση του Excel. Η απάντηση να δοθεί στο αρχείο Excel. (ΜΟΝΑΔΕΣ 6) e. Να κατασκευαστεί στο Excel μια στήλη με τις κεντρικές τιμές των ομάδων του ερωτήματος (c). Στη συνέχεια να κατασκευαστεί το πολύγωνο σχετικών συχνοτήτων των ομαδοποιημένων δεδομένων. Υπόδειξη: στον οριζόντιο άξονα να παριστάνονται οι κεντρικές τιμές των ομάδων. (ΜΟΝΑΔΕΣ 5) f. Έστω ότι μία άλλη ημέρα είχε παρατηρηθεί μια αύξηση κατά 25% σε όλες, μία προς μία, τις μετρήσεις του συγκεκριμένου αέριου ρύπου για τις 57 πόλεις του πίνακα Ι. Υπολογίστε τον αριθμητικό μέσο, τη διακύμανση, τον συντελεστή μεταβλητότητας και το ενδοτεταρτημοριακό εύρος για τα νέα δεδομένα. Τα ζητούμενα στατιστικά μέτρα να υπολογιστούν με τη βοήθεια αυτών που έχουν ήδη υπολογιστεί για τις αρχικές τιμές του πίνακα Ι. (ΜΟΝΑΔΕΣ 4) ΑΠΑΝΤΗΣΕΙΣ 1/a 17 17 17 84 79 74 73 70 68 62 21 29 26 27 33 33 32 54 28 30 28 29 56 51 49 48 47 43 47 37 28 33 55 50 48 43 41 36 35 36 27 32 32 32 56 48 47 41 37 35 24 30 30 33 54 54 52 ΔΕΔΟΜΕΝΑ ΣΕ ΤΑΞΙΝΟΜΙΣΗ ΤΑΞΙΝ/ΕΝΑ ΔΕΔΟΜΕΝΑ ΣΕΙΡΑ ΔΕΔ/ΕΝΑ ΧΙ-ΤΕΤΡΑΓΩΝΟ 17 1 17 289 21 2 17 441 28 3 17 784 28 4 21 784 27 5 24 729 24 6 26 576 17 7 27 289 29 8 27 841 29 9 28 841 33 10 28 1089 32 11 28 1024 Σελίδα - 3 - από 22
30 12 29 900 17 13 29 289 26 14 30 676 56 15 30 3136 55 16 30 3025 32 17 32 1024 30 18 32 900 84 19 32 7056 27 20 32 729 51 21 33 2601 50 22 33 2500 32 23 33 1024 33 24 33 1089 79 25 35 6241 33 26 35 1089 49 27 36 2401 48 28 36 2304 56 29 37 3136 54 30 37 2916 74 31 41 5476 33 32 41 1089 48 33 43 2304 43 34 43 1849 48 35 47 2304 54 36 47 2916 73 37 47 5329 32 38 48 1024 47 39 48 2209 41 40 48 1681 47 41 49 2209 52 42 50 2704 70 43 51 4900 54 44 52 2916 43 45 54 1849 36 46 54 1296 41 47 54 1681 68 48 55 4624 28 49 56 784 47 50 56 2209 35 51 62 1225 37 52 68 1369 62 53 70 3844 Σελίδα - 4 - από 22
30 54 73 900 37 55 74 1369 36 56 79 1296 35 57 84 1225 2.378 113.304 Αριθμητικός Μέσος 57 1 1717...+54+52 41,719 n 57 Διάμεσος Πλήθος Δεδομένων n = 57, περιττός αριθμός Άρα η διάμεσος δίνεται από τον τύπο M 571 (29) 37 Ενδοτεταρτημοριακό εύρος IR Q3 Q1 Θα πρέπει να υπολογιστούν Q 1, Q 3 Για 1 και n 57 έχουμε ( ) 2. n1 1 571 14,5. Άρα AQ 14 και Q 0,5. 4 4 Επομένως το πρώτο τεταρτημόριο είναι το σημείο. Q 1 ( AQ ) Q ( AQ 1) ( AQ ) (14) (15) (14) 30 0,5 (30 30) 30 Q Για 3 και n 57 έχουμε. n1 3 571 43,5. Άρα AQ 43 Q 0,5, επομένως, 4 4 Q ) 3 ( AQ ) Q ( AQ 1 ( AQ ) 51 0,5(52 51) 51,5 (43) Q (431) (43) Άρα IR Q 3Q1 51,50 30,00 21,50 Σελίδα - 5 - από 22
Τιμές από Excel 41,719, M=37, Q1 30, Q3 51,5, IR Q 3Q1 51,50 30,00 21,50 1/b Ταξινομημένες παρατηρήσεις 17 17 17 84 79 74 73 70 68 62 21 29 26 27 33 33 32 54 28 30 28 29 56 51 49 48 47 43 47 37 28 33 55 50 48 43 41 36 35 36 27 32 32 32 56 48 47 41 37 35 24 30 30 33 54 54 52 Τυπική απόκλιση 15,865 Διάμεσος 37,000 1.c Συντελεστής Ασσυμετρίας 0,761 Για τον υπολογισμό της μέσης τιμής, της διακύμανσης και των άλλων μέτρων από τα ομαδοποιημένα δεδομένα χρειαζόμαστε τα στοιχεία του παρακάτω πίνακα και ιδίως τι δυο τελευταίες στήλες. Τάξη ή κλάση Κεντρική τιμή m Συχ/τα f Σχετική Συχ/τα p f / 57 Αθροιστική Συχ/τα F f F 1 Σχετική Αθροιστική Συχ/τα C F / 57 2 f m f m [14.5-24.5] 19,5 5 0,088 5 0,088 97,500 1.901,250 [24.5-34.5] 29,5 19 0,333 24 0,421 560,500 16.534,750 [34.5-44.5] 39,5 10 0,175 34 0,596 395,000 15.602,500 [44.5-54.5] 49,5 13 0,228 47 0,825 643,500 31.853,250 [54.5-64.5] 59,5 4 0,070 51 0,895 238,000 14.161,000 [64.5-74.5] 69,5 4 0,070 55 0,965 278,000 19.321,000 [74.5-84.5] 79,5 2 0,035 57 1,000 159,000 12.640,500 57 2.371,500 112.014,250 1/d Σελίδα - 6 - από 22
Υπολογισμοί Αριθμητικός Μέσος 41,605 Δειγματική διακύμανση 233,164 Συντελεστής Μεταβλητότητας 0,367 1/e Πολύγωνο Σχετικών Συχνοτήτων Σχετικές Συχνοτητες 0,350 0,300 0,250 0,200 0,150 0,100 0,050 0,000 0,333 0,175 0,088 0,070 0,070 0,035 0,018 19,5 29,5 39,5 49,5 59,5 69,5 79,5 Κεντρικές Τιμές 0,350 0,300 0,250 0,200 0,150 0,100 0,050 Τίτλος γραφήματος 0,000 19,5 29,5 39,5 49,5 59,5 69,5 79,5 1/f Σελίδα - 7 - από 22
S Έχουμε βρει ότι 41,719,, CV 0,367, IR 21,50 Αφού οι τιμές αυξήθηκαν κατά 25% οι νέες τιμές θα είναι ( 0,25 ) Έτσι αν Y είναι οι νέες τιμές, αυτές θα συνδέονται με τις παλαιές με την σχέση Y 1,25 Y a με a 1,25 Από την θεωρία είναι γνωστό ότι. Αν Y τότε Y οπότε Y 1,25 Y 1,25 41,719 52,149 S S και SY S οπότε 2 2 2 Y S 1, 25 251, 731 393,278 2 2 Y Ο συντελεστής μεταβλητότητας των Yείναι CV S a S a S a Y CV Y Y CV (Διότι IR IR 1,25 21,50 26,875 Y S ), οπότε CVY 0,38 Σελίδα - 8 - από 22
ΑΣΚΗΣΗ 2 (ΜΟΝΑΔΕΣ 20) Α. Η εταιρεία ΑΒΓ κατέγραψε το μισθό των εργαζομένων της χρησιμοποιώντας τις ενδείξεις «Χαμηλός» (Χ) και «Υψηλός» (Υ), ανά επίπεδο εκπαίδευσής τους. Η καταγραφή παρατίθεται στον ακόλουθο πίνακα: Επίπεδο εκπαίδευσης Μισθός Χαμηλός (Χ) Υψηλός (Υ) Απολυτήριο Δημοτικού (ΑΔ) 40 5 Απολυτήριο Μέσης Εκπαίδευσης (ΑΜ) 25 60 Πτυχίο Ανώτερης/Ανώτατης Σχολής (Π) 5 25 () Ποια η πιθανότητα ένας εργαζόμενος να έχει απολυτήριο μέσης εκπαίδευσης και να είναι υψηλόμισθος; (ΜΟΝΑΔΕΣ 2) () Ποια η πιθανότητα ένας εργαζόμενος να έχει πτυχίο ανώτερης/ανώτατης σχολής ή να είναι χαμηλόμισθος; (ΜΟΝΑΔΕΣ 2) () Αν ένας από τους εργαζόμενους έχει πτυχίο ανώτερης/ανώτατης σχολής, ποια η πιθανότητα να είναι υψηλόμισθος; (ΜΟΝΑΔΕΣ 3) (v) Είναι το γεγονός ενός εργαζόμενου με απολυτήριο μέσης εκπαίδευσης ανεξάρτητο του γεγονότος ότι είναι υψηλόμισθος; (ΜΟΝΑΔΕΣ 3) (v) Η εταιρεία αποφασίζει να κάνει κλήρωση τριών δωροεπιταγών στους χαμηλόμισθους εργαζόμενους. Ποια η πιθανότητα του ενδεχομένου να επιλεγούν τρεις εργαζόμενοι με απολυτήριο δημοτικού; (ΜΟΝΑΔΕΣ 3) Β. Η εταιρεία ΧΥΖ παράγει φορητούς ηλεκτρονικούς υπολογιστές. Το τμήμα ποιοτικού ελέγχου της εταιρείας διαπίστωσε ότι η πιθανότητα κάποιος φορητός υπολογιστής να είναι ελαττωματικός είναι 1%. Το τμήμα ποιοτικού ελέγχου εγκατέστησε στη γραμμή παραγωγής ένα διαγνωστικό μηχάνημα που: Σελίδα - 9 - από 22
αποφαίνεται ότι ο φορητός ηλεκτρονικός υπολογιστής είναι ελαττωματικός με πιθανότητα 95%, αν ο υπό διάγνωση φορητός ηλεκτρονικός υπολογιστής είναι όντως ελαττωματικός (δηλαδή αποφαίνεται σωστά). αποφαίνεται ότι ο φορητός ηλεκτρονικός υπολογιστής είναι ελαττωματικός με πιθανότητα 0,1%, αν ο υπό διάγνωση φορητός ηλεκτρονικός υπολογιστής δεν είναι ελαττωματικός (δηλαδή αποφαίνεται λανθασμένα). () Αν επιλέξουμε έναν φορητό ηλεκτρονικό υπολογιστή τυχαία, ποια η πιθανότητα το διαγνωστικό μηχάνημα να αποφανθεί ότι δεν είναι ελαττωματικός; (ΜΟΝΑΔΕΣ 3) () Ποια η πιθανότητα ένας φορητός ηλεκτρονικός υπολογιστής να μην είναι ελαττωματικός αν το διαγνωστικό μηχάνημα αποφανθεί ότι ο υπό εξέταση φορητός ηλεκτρονικός υπολογιστής είναι ελαττωματικός; (ΜΟΝΑΔΕΣ 4) ΑΠΑΝΤΗΣΕΙΣ Στον δοθέντα πίνακα προσθέτουμε από μια γραμμή και μια στήλη ακόμη Επίπεδο εκπαίδευσης Μισθός Χαμηλός (Χ) Υψηλός (Υ) Σύνολα Απολυτήριο Δημοτικού (ΑΔ) 40 5 45 Απολυτήριο Μέσης Εκπαίδευσης (ΑΜ) 25 60 85 Πτυχίο Ανώτερης/Ανώτατης Σχολής (Π) 5 25 30 Σύνολα 70 90 160 Ας συμβολίσουμε τα παρακάτω ενδεχόμενα ΑΜ= Το ενδεχόμενο ο εργαζόμενος να έχει απολυτήριο μέσης εκπαίδευσης ΑΔ= Το ενδεχόμενο ο εργαζόμενος να έχει απολυτήριο δημοτικού Π = Το ενδεχόμενο ο εργαζόμενος να έχει πτυχίο ανώτερης/ανώτατης εκπαίδευσης Υ = Το ενδεχόμενο ο εργαζόμενος να είναι υψηλόμισθος Χ = Το ενδεχόμενο ο εργαζόμενος να είναι χαμηλόμισθος 2/Α/() 60 6 3 Με βάση τον ορισμό της πιθανότητας έχουμε P( ΑΜ Υ) 160 16 8 Σελίδα - 10 - από 22
Με βάση τον πολλαπλασιαστικό κανόνα έχουμε 60 90 6 3 P( ΑΜ Υ) P( ΑΜ Υ) P( Υ) 90 160 16 8 2/Α/() Ζητείται η πιθανότητα ένας εργαζόμενος να έχει πτυχίο ανώτερης/ανώτατης σχολής ή να είναι χαμηλόμισθος. Το ενδεχόμενο αυτό είναι η ένωση ( ) των, Υκαι η πιθανότητα υπολογίζεται από τον τύπο P( A B) P( A) P( B) P( A B). 30 70 5 95 19 P( Υ) P( ) P(Υ) P( ) 160 160 160 160 32 2/Α/() Ζητείται η πιθανότητα ( ) του δεσμευμένου ενδεχόμενου ( ). Αυτή μπορεί να υπολογισθεί με δύο τρόπους. Mε βάση τον ορισμό της πιθανότητας ή με χρήση του τύπου της δεσμευμένης πιθανότητας. Χρησιμοποιώντας τον ορισμό. Αφού δίδεται ότι ο εργαζόμενος έχει Πτυχίο Ανώτερης/Ανώτατης Σχολής περιοριζόμαστε στο σύνολο των εργαζομένων που έχουν Πτυχίο Ανώτερης/Ανώτατης Σχολής που είναι μόνο 30. Από αυτούς οι 25 είναι υψηλόμισθοι. Επομένως, η ζητούμενη πιθανότητα είναι: 25 5 P( Y ) 30 6 Mε χρήση του τύπου της δεσμευμένης πιθανότητας. 25 90 P( Y ) P( Y ) P( Y) 90 160 25 5 P( Y ) P( ) P( ) 30 30 6 160 2/Α/(v) Τα ενδεχόμενα AM και Y θα είναι ανεξάρτητα αν ικανοποιείται ένα από τα κριτήρια ανεξαρτησίας P( AM Y ) P( AM ) P( Y ) P( AM Y) P( AM ). P( Y AM ) P( Y ) 60 12 90 9 Ας δούμε το τελευταίο P( Y AM ) και P( Y).Άρα τα ενδεχόμενα δεν είναι 85 17 160 16 ανεξάρτητα. Αυτό άλλωστε είναι φανερό και από την φύση των ενδεχομένων. Σελίδα - 11 - από 22
2/Α/(v) Το ενδεχόμενο αυτό σημαίνει επιλογή με τυχαίο τρόπο τριών από τους χαμηλόμισθους. Αν δεν μας ενδιαφέρει η σειρά επιλογής η ζητούμενη πιθανότητα είναι. 40 40! 3 3!37! 40 39 38 P( ή τριών με απολυτήριο δημοτικού ) 0,18 70 70! 70 69 68 3 3!67! Αυτό διότι οι τρείς χαμηλόμισθοι εργαζόμενοι μπορούν να επιλεγούν κατά και οι τρείς με απολυτήριο δημοτικού μπορούν να επιλεγούν κατά χαμηλόμισθους που κατέχουν απολυτήριο δημοτικού. Αν μας ενδιαφέρει ης σειρά επιλογής η ζητούμενη πιθανότητα θα είναι 70 τρόπους από τους 70 3 40 τρόπους από τους 40 3 P( ή τριών με απολυτήριο δημοτικού ) P( ή 1ου με απολυτήριο δημοτικού και ή 2ου με απολυτήριο δημοτικού και ή 3ου με απολυτήριο δημοτικού ) 40 39 38 0,18 70 69 68 Βλέπουμε ότι η πιθανότητα είναι ίδια με την προηγούμενη, όπως και αναμενόταν διότι οι εργαζόμενοι δεν είναι διακεκριμένοι.. 2/Β/() Ορίζουμε τα ενδεχόμενα: Ε= ο φορητός ηλεκτρονικός υπολογιστής είναι πράγματι ελαττωματικός, Δ=το διαγνωστικό μηχάνημα δείχνει ότι ο ελεγχόμενος υπολογιστής είναι είναι ελαττωματικός, ανεξάρτητα από το αν είναι ή δεν είναι. Με αυτά τα ενδεχόμενα θα έχουμε και τα παρακάτω. = το διαγνωστικό μηχάνημα δείχνει ότι ο ελεγχόμενος υπολογιστής δεν είναι ελαττωματικός, ανεξάρτητα με το αν είναι ή δεν είναι. Σελίδα - 12 - από 22
(είναι το συμπληρωματικό του ενδεχόμενου Δ). Με αυτά τα ενδεχόμενα οι πιθανότητες που μας δίνονται είναι οι παρακάτω P( E) 0,01 Η πιθανότητα ο υπολογιστής να είναι ελλαττωματικός P( E) 1 P( ) 1 0,01 0,99. Η πιθανότητα να μην είναι ελλαττωματικός. P( E) 0,95 Η πιθανότητα το διαγνωστικό να δείξει ότι είναι ελλαττωματικός όταν πράγματι είναι P( E ) 0,001. Η πιθανότητα το διαγνωστικό να δείξει ότι είναι ελλαττωματικός όταν πράγματι δεν είναι Σύμφωνα με το Θεώρημα Ολικής Πιθανότητας, η πιθανότητα το διαγνωστικό μηχάνημα να δείξει ότι ένας φορητός ηλεκτρονικός υπολογιστής είναι ελαττωματικός είναι: P( ) P( E) P( E) P( E) P( E ) =0,95 0,01+0,001 0,99=0,0105 Οπότε η πιθανότητα το διαγνωστικό μηχάνημα να δείξει ότι ένας ηλεκτρονικός υπολογιστής δεν είναι ελαττωματικός είναι P( ) 1 0,0105 0,0895 2/Α() Σύμφωνα με τον παραπάνω συμβολισμό ζητάμε την P( E ) Η οποία από τον νόμο του Bayes, είναι: P( E) P( E) P( E) 0,001 0,99 P( E ) 0,0943 P( ) P( ) 0,0105 Αυτό σημαίνει ότι από τους φορητούς ηλεκτρονικούς υπολογιστές που το διαγνωστικό μηχάνημα δείχνει ότι είναι ελλαττωματικοί το 9,43 % δεν είναι ελαττωματικοί. Σελίδα - 13 - από 22
ΑΣΚΗΣΗ 3 (ΜΟΝΑΔΕΣ 25) Α. Μια εταιρεία κινητής τηλεφωνίας έχει παρατηρήσει ότι ο χρόνος ομιλίας (σε λεπτά της ώρας) των συνδρομητών της ανά μήνα, ακολουθεί την κανονική κατανομή με μέση τιμή =20 μηνύματα και τυπική απόκλιση =2 μηνύματα. () Ποια είναι η πιθανότητα ένας από τους συνδρομητές της εταιρείας κατά τη διάρκεια ενός μήνα να χρησιμοποιήσει χρόνο ομιλίας (ΜΟΝΑΔΕΣ 4) a. τουλάχιστον 14 λεπτά b. από 15 έως 30 λεπτά () Η εταιρεία δίνει δωρεάν χρόνο ομιλίας στο 10% των συνδρομητών της που πραγματοποίησαν το μεγαλύτερο χρόνο ομιλίας τον περασμένο μήνα. Ποια είναι τα ελάχιστα λεπτά που πρέπει να μιλήσει κάποιος ώστε να του δοθούν τα δωρεάν λεπτά ομιλίας? (ΜΟΝΑΔΕΣ 5). () Προκειμένου η εταιρεία να υπολογίσει εκ νέου την διασπορά της κατανομής του χρόνου ομιλίας, έχει υπολογίσει ότι το 5% των συνδρομητών της εταιρείας ομιλεί τουλάχιστον 25 λεπτά το μήνα. Εάν η μέση τιμή της κατανομής παραμένει στα 20 λεπτά, το μήνα υπολογίστε τη διασπορά της κατανομής κάτω από τα νέα δεδομένα. (ΜΟΝΑΔΕΣ 3) Β. Ταξιδιώτες φτάνουν τυχαία και ανεξάρτητα στον σταθμό ελέγχου αποβιβάσεων ενός αεροδρομίου. Ο μέσος αριθμός αφίξεων είναι 10 ταξιδιώτες ανά λεπτό. () Ποια η πιθανότητα στη διάρκεια ενός λεπτού να μη φτάσει κανένας ταξιδιώτης; (ΜΟΝΑΔΕΣ 2,5) () Ποια η πιθανότητα να φτάσουν το πολύ 3 ταξιδιώτες στη διάρκεια ενός λεπτού; (ΜΟΝΑΔΕΣ 2,5) () Ποια η πιθανότητα στη διάρκεια 15 δευτερολέπτων να φτάσει τουλάχιστον 1 ταξιδιώτης (ΜΟΝΑΔΕΣ 4) Γ. Μια έρευνα έδειξε ότι μόνο το 2% των επενδυτών θεωρεί το χρηματιστήριο σίγουρη επένδυση. Σε ένα δείγμα 100 επενδυτών ποια η πιθανότητα τουλάχιστον 2 επενδυτές να θεωρούν ότι το χρηματιστήριο είναι σίγουρη επένδυση; (ΜΟΝΑΔΕΣ 4) ΑΠΑΝΤΗΣΕΙΣ Σελίδα - 14 - από 22
3/Α/().a Αν η τυχαία μεταβλητή που μετρά τον χρόνο ομιλίας από τους συνδρομητές της εταιρείας ανά μήνα, δίνεται ότι είναι ~!(20,4). Η ζητούμενη πιθανότητα είναι 14 20 P( 14) P( ) P( 3) 1 P( 3) 1 ( 3) 1 0,0013 0,9987 2 Οι τιμές της συνάρτησης $ δίνονται στο τυπολόγιο της Στατιστικής 3/Α/().b 15 20 30 20 P(15 30) P( ) P( 2,5 5) 2 2 = (5) ( 2,5) 1 0, 0062 0,9938 3/Α/() Αν x 0 είναι ο ελάχιστος χρόνος που απαιτεί η εταιρεία για να δώσει δωρεάν χρόνο ομιλίας τότε κάποιος που μιλάει λεπτά θα είναι μέσα στο 10 % αυτών που θα πάρουν τον έξτρα χρόνο P( x ) 0,10 0. Η λύση αυτής της εξίσωσης θα μας δώσει το 0 αν x. Η λύση της εξίσωσης γίνεται με την βοήθεια των πινάκων της τυπικής κανονικής κατανομής ως εξής. x0 P( x0) 0,10 P( ) 0,1 P( z0) 0,1 1 P( z0) 0,1 P( z ) 0,90 ( z ) 0,90 z 1, 28 0 0 0 Επειδή z x x 20 1,28 2 0 0 0 z x x 0 20 21,28 22,56 0 0 1,28 Άρα, ο ελάχιστος χρόνος που πρέπει να μιλήσει κάποιος για να του δοθούν τα δωρεάν λεπτά είναι 22,56 λεπτά. 3/Α/() Έστω ότι η ζητούμενη διακύμανση είναι 2 1. Μας δίδεται ότι 25 20 P( 25) 0,05 P( ) 0,05 P( z ) 0,05 0 με z0 1 1 25 20 1 Σελίδα - 15 - από 22
P( z ) 0,05 1 P( z ) 0,05 P( z ) 0,95 ( z ) 0,95 z 1,65 0 0 0 0 0 25 20 Οπότε z 0 1,65 1 3,030 1 Άρα, η διασπορά του χρόνου ομιλίας είναι 9,18 3/B/() Είναι γνωστό ότι η αν η τυχαία μεταβλητή που μετρά τον αριθμό των ταξιδιωτών που φτάνουν στον σταθμό ελέγχου αποβιβάσεων με τυχαίο τρόπο, ανεξάρτητα ο ένας από τον άλλο, και με ρυθμό λ ταξιδιώτες ανά μονάδα χρόνου % ακολουθεί κατανομή Posson, P( ) και η συνάρτηση x e πιθανότητας του x είναι p( x), x 0,1,2,3,... x! Εδώ η μονάδα χρόνου είναι το λεπτό και με λ=10 ταξιδιώτες/λεπτό, ζητάμε την πιθανότητα p( 0). Με αντικατάσταση παίρνουμε 10 0 e 10 p( 0) 0,0000454. 0! Αν κάποιος επιχειρήσει να βρει αυτή την πιθανότητα από τους πίνακες της Posson θα βρει μηδέν, λόγω των προσεγγίσεων. 3/B/() p( 3) p( 0) p( 1) p( 2) p( 3) Ζητάμε την 10 0 10 1 10 2 10 3 e 10 e 10 e 10 e 10 0,0010340 0! 1! 2! 3! Αυτή την πιθανότητα μπορούμε να την βρούμε και από το τυπολόγιο της αθροιστικής συνάρτησης κατανομής της Posson με λ=10. Αυτή είναι ( 3)=$(3)=0,010 και διαφέρει λόγω προσεγγίσεων. 3/B/() Τώρα αλλάζει το χρονικό διάστημα από ένα λεπτό σε 15 δευτερόλεπτα. Αν πάρουμε ως μονάδα μέτρησης του χρόνου τα 15 δευτερόλεπτα τότε η τυχαία μεταβλητή Χ που μετρά τον αριθμό των ταξιδιωτών που φτάνουν στον σταθμό ελέγχου αποβιβάσεων με τυχαίο τρόπο, ανεξάρτητα ο ένας από Σελίδα - 16 - από 22
τον άλλο, και με ρυθμό λ 1 ταξιδιώτες ανά 15 δευτερόλεπτα, έχει κατανομή P( 1 ). Έτσι πρέπει να βρούμε το λ 1 που αντιστοιχεί στα 15 δευτερόλεπτα. Αφού στα 60 δευτερόλεπτα φθάνουν 10 15 ταξιδιώτες στα 15 θα φθάνουν 1 10 2,5 ταξιδιώτες/ 15 δευτερόλεπτα. Η κατανομή του Χ 60 είναι Posson, P(2,5) και η συνάρτηση πιθανότητας του x είναι 2,5 1 x e 2,5 p( x), x 0,1,2,3,... x! Ζητάμε την πιθανότητα p( 1). 2,5 0 e 2,5 p( 1) 1 p( 0) 1 p( 0) 1 1 0,082 0,918 0! Η πιθανότητα αυτή μπορεί να βρεθεί και από τους πίνακες της Posson με λ 1=2,5 και είναι ( 1)= 1 )0*=1 +(0)=1 0,082=0,918. 3/Γ Αν η τυχαία μεταβλητή που μετρά τον αριθμό των επενδυτών που θεωρούν το χρηματιστήριο ως ασφαλή επένδυση, % ακολουθεί την Διωνυμική κατανομή με παραμέτρους n=100 p=0,02, B( n, p) και η συνάρτηση πιθανότητας της Χ είναι n p( x) p (1 p) x x n x, x 0,1,2,3,..., n Ζητάμε την P( 2) από την κατανομή B( n100, p 0,02) P( 2) 1 P( 1) 1 P( 0) P( 1) 100 100 1 0,02 (1 0,02) 0,02 (1 0,02) 0 1 0,5967 0 1000 1 1001 Η παραπάνω πιθανότητα μπορεί να υπολογισθεί και με χρήση του Κεντρικού Οριακού Θεωρήματος Σελίδα - 17 - από 22
ΘΕΜΑ 4 ο (ΜΟΝΑΔΕΣ 25) Στον Πίνακα ΙΙ δίνονται στοιχεία που αφορούν τη συνολική δαπάνη για επενδύσεις της Ελλάδας σε δισ. ευρώ (Χ) και την αξία του συνολικού προϊόντος της Ελλάδας σε δισ. ευρώ (Υ) για την περίοδο 2005-2017 (πηγή: Πρόκειται για πραγματικά δεδομένα που προέρχονται από την Ελληνική Στατιστική Αρχή ΕΛΣΤΑΤ). Οι τιμές για το 2017 είναι αρχικές εκτιμήσεις, ενώ οι επενδύσεις και το προϊόν (Ακαθάριστο Εγχώριο Προϊόν) εκφράζονται σε πραγματικές τιμές του έτους 2000. Πίνακας ΙΙ ΕΤΟΣ Επενδύσεις σε δισ. ευρώ (Χ) Προϊόν σε δισ. Ευρώ (Υ) 2005 32,2 166,5 2006 38,4 175,9 2007 44,5 181,6 2008 41,3 181,0 2009 35,5 173,2 2010 28,7 163,7 2011 22,8 148,8 2012 17,4 140,1 2013 16,5 130,3 2014 15,4 140,0 2015 15,7 134,1 2016 16,8 133,1 2017 18,0 136,7 Πηγή: Δεδομένα της ΕΛ.ΣΤΑΤ. Στόχος μας είναι η ποσοτική διερεύνηση της σχέσης μεταξύ των επενδύσεων και του προϊόντος. Πιο συγκεκριμένα, θέλουμε να διερευνήσουμε αν οι επενδύσεις (Χ) επηρεάζουν το μέγεθος του παραγόμενου προϊόντος (Υ) με δεδομένα της ελληνικής οικονομίας για τα τελευταία 13 χρόνια τα οποία είναι διαθέσιμα και στο αρχείο Excel, φύλλο Asks-4. a. Να κατασκευαστεί το διάγραμμα διασποράς των δεδομένων που αφορούν τις επενδύσεις (Χ) και το συνολικό προϊόν (Υ) στο Excel και να μεταφερθεί στο αρχείο Word. Πιστεύετε ότι υπάρχει γραμμική σχέση μεταξύ των δυο αυτών βασικών μακροοικονομικών μεγεθών; Υπολογίστε το βαθμό συσχέτισής τους υπολογίζοντας το κατάλληλο στατιστικό μέτρο με χρήση των κατάλληλων τύπων του τυπολογίου. Δώστε στη συνέχεια την ερμηνεία του αποτελέσματος. (ΜΟΝΑΔΕΣ 5) b. Υποθέτοντας ότι η σχέση μεταξύ των μεταβλητών Χ και Υ είναι γραμμική, να εκτιμηθούν και να ερμηνευθούν οι συντελεστές a 0 και a 1 του γραμμικού υποδείγματος Y a0 a1 u με την Σελίδα - 18 - από 22
μέθοδο των Ελαχίστων Τετραγώνων, κάνοντας χρήση των κατάλληλων τύπων από το τυπολόγιο. Η μεταβλητή u είναι ο διαταρακτικός όρος ή όρος σφάλματος της εκτίμησης. Οι υπολογισμοί θα πρέπει να γραφούν αναλυτικά και να γίνουν με έναν από τους δύο τρόπους: είτε με τη χρήση των τύπων με τις μεταβλητές σε αποκλίσεις από τους μέσους όρους τους, είτε με τη χρήση των τύπων που δεν απαιτούν οι μεταβλητές να εκφράζονται σε αποκλίσεις από τους μέσους τους. Για τον σκοπό αυτό να δημιουργηθεί στο Excel κατάλληλος πίνακας στον οποίο να γίνουν οι απαιτούμενοι υπολογισμοί. Στα αριθμητικά αποτελέσματα να διατηρήσετε δύο (2) δεκαδικά ψηφία. (ΜΟΝΑΔΕΣ 8) c. Δώστε τον συντελεστή προσδιορισμού 2 R του γραμμικού υποδείγματος που εκτιμήσατε στο προηγούμενο ερώτημα αιτιολογώντας την απάντησή σας. Να ερμηνευθεί η αριθμητική τιμή του. (ΜΟΝΑΔΕΣ 2) d. Να επανεκτιμηθεί το γραμμικό υπόδειγμα Y a0 a1 u χρησιμοποιώντας την κατάλληλη εντολή/ανάλυση του Excel, να εξαχθούν και να συγκριθούν όλα τα αποτελέσματα των ερωτημάτων b και c. (ΜΟΝΑΔΕΣ 6) e. Yποθέτοντας ότι οι επενδύσεις για το 2018 θα αυξηθούν κατά 3% σε σχέση με τις αντίστοιχες του 2017, πόσο εκτιμάτε ότι θα είναι ο ρυθμός ανάπτυξης της χώρας βάσει του παραπάνω μοντέλου; (ΜΟΝΑΔΕΣ 4) ΑΠΑΝΤΗΣΕΙΣ 4/a Διάγραμμα Διασποράς Υ=Προϊόν 200 190 180 170 160 150 140 130 120 110 100 0 10 20 30 40 50 Χ=Επενδύσεις Σελίδα - 19 - από 22
Για τον συντελεστή συσχέτισης έχουμε τους δυο τύπους r 1 ( )( Y Y ) 2 2 ( ) ( Y Y ) 1 1 r 1 ( ) ( Y ) 1 1 Y 2 2 ( ) ( ) Y 2 1 2 1 Y 1 1 ( ) ( ) Αυτός βασίζεται στις αποκλίσεις από τους μέσους χωρίς τις αποκλίσεις από τους μέσους Ο δεύτερος τύπος είναι υπολογιστικά πιο εύκολος; (απαιτεί λιγότερη δουλειά) Επε/σεις Προϊόν ΕΤΟΣ Χ Υ 2005 32,2 166,5 5.361,30 1.036,84 27.722,25 2006 38,4 175,9 6.754,56 1.474,56 30.940,81 2007 44,5 181,6 8.081,20 1.980,25 32.978,56 2008 41,3 181,0 7.475,30 1.705,69 32.761,00 2009 35,5 173,2 6.148,60 1.260,25 29.998,24 2010 28,7 163,7 4.698,19 823,69 26.797,69 2011 22,8 148,8 3.392,64 519,84 22.141,44 2012 17,4 140,1 2.437,74 302,76 19.628,01 2013 16,5 130,3 2.149,95 272,25 16.978,09 2014 15,4 140,0 2.156,00 237,16 19.600,00 2015 15,7 134,1 2.105,37 246,49 17.982,81 2016 16,8 133,1 2.236,08 282,24 17.715,61 2017 18,0 136,7 2.460,60 324,00 18.686,89 Άθροισμα 343,2 2005,0 55.457,53 10.466,02 313.931,40 Πίνακας Από τα δεδομένα του παραπάνω πίνακα που δημιουργήσαμε στο Excel προκύπτει με αντικατάσταση ότι: Σελίδα - 20 - από 22
r 343, 2 2005,0 55.457,53 13 2 2 343, 2 2005,0 { 10.466,02 } { 313.931, 40 } 13 13 0,983 Η τιμή αυτή είναι πολύ κοντά στη μονάδα και δηλώνει μια ισχυρή γραμμική θετική συσχέτιση μεταξύ των επενδύσεων και του προϊόντος. 4/b Οι εκτιμητές των συντελεστών του γραμμικού μοντέλου Y a0 a1 u είναι ( ) Y ) 1 1 343, 2 2005,0 Y 55.457,53 1 aˆ 13 1 1, 2 2 (343, 2) ( ) 10.466,02 2 1 13 1 797 2005,00 343, 20 Οπότε aˆ ˆ 0 Y a1 1,797 154,231,797 26, 40 106,79 13 13 Yˆ 106,79 1,797 Ερμηνεία των εκτιμήσεων των παραμέτρων του μοντέλου: Η εκτίμηση a ˆ0 106, 79 δείχνει ότι με μηδενικό επίπεδο επενδύσεων το αναμενόμενο επίπεδο του προϊόντος ανέρχεται σε 106,79 δισεκατομμύρια ευρώ. Η εκτίμηση a ˆ 1,797 1 εκφράζει την επίδραση, αύξηση ή μείωση, στην αναμενόμενη τιμή του προϊόντος (Υ) που θα προκληθεί απο μεταβολή, αύξηση ή μείωση, του ύψους των επενδύσεων (Χ) κατά μια μονάδα. Έτσι αν αυξηθούν οι επενδύσεις κατά 1 δις ευρώ, το προϊόν αναμένεται να αυξηθεί κατά 1,797 δις ευρώ. 4/c Ο συντελεστή προσδιορισμού είναι R r 0,983 0,966 2 2 2 Η τιμή αυτή υποδεικνύει ότι το 96,6% της μεταβλητότητας των τιμών του προϊόντος (Y ) ερμηνεύεται από τις μεταβολές των τιμών των επενδύσεων ( ). Η τιμή αυτή είναι πολύ υψηλή (κοντά στη μονάδα) και δείχνει ότι οι επενδύσεις ερμηνεύουν μεγάλο ποσοστό, σχεδόν το σύνολο, της συνολικής μεταβλητότητας του προϊόντος Y. Σελίδα - 21 - από 22
4/d Όπως φαίνεται και στο παρακάτω σχήμα, αν επανεκτιμήσουμε το γραμμικό μοντέλο αυτόματα μέσα από το Excel βρίσκουμε 200,0 180,0 160,0 140,0 120,0 100,0 80,0 60,0 40,0 20,0 Γραμμική Παλινδρόμηση y = 1,7968x + 106,79 R² = 0,9658 0,0 0,0 10,0 20,0 30,0 40,0 50,0 y 1,7968 106,79 και R r 0,9658 2 2 Συνεπώς έχουμε ˆ 0 106,79 ˆ 1 1,7968, r 0,98275. Οι τιμές είναι σχεδόν ίδιες με τις προηγούμενες. Οι μικρές διαφορές όπου υπάρχουν οφείλονται σε στρογγυλεύσεις. 4/e Αν οι επενδύσεις Χ το 2018 αυξηθούν κατά 3% θα γίνουν 0,03 1,03 181,03 18,54 n Με βάσει το παραπάνω μοντέλο το προϊόν θα είναι Y ˆ 106,79 1,797 18,54 140,106 Άρα η αύξηση του ρυθμού ανάπτυξης για το 2018 αναμένεται να είναι και σε ποσοστό 2,49%. 140,106136,7 0,0249 136,7 Σελίδα - 22 - από 22