ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ ΘΕΜΑ 1 ο Τα δεδομένα της στήλης Grade (Αρχείο Excel, Φύλλο Ask1) αναφέρονται στη βαθμολογία 63 φοιτητών που έλαβαν μέρος σε μια γραπτή εξέταση. α. Να ταξινομηθούν τα δεδομένα σε Κατανομή Συχνοτήτων. Η ταξινόμηση των δεδομένων να γίνει σε τάξεις εύρους 5 μονάδων η καθεμία και με κεντρική τιμή της πρώτης τάξης τη μικρότερη παρατήρηση. β. Χρησιμοποιώντας τα ταξινομημένα δεδομένα: i. Να υπολογισθούν ο αριθμητικός μέσος, η διάμεσος, η επικρατούσα τιμή, η τυπική απόκλιση και το ενδοτεταρτημοριακό εύρος των βαθμολογιών καθώς και ο συντελεστής ασυμμετρίας Pearson (που ορίζεται από τα X, M και s ), ο οποίος και να ερμηνευτεί. ii. Να κατασκευασθεί το Θηκόγραμμα των βαθμολογιών και με βάση αυτό να εξαχθούν συμπεράσματα για τη μορφή της κατανομής τους. γ. Χρησιμοποιώντας την αντίστοιχη συνάρτηση του Excel να κατασκευαστεί το ιστόγραμμα των ταξινομημένων δεδομένων και να συγκριθούν τα αποτελέσματα με αυτά του ερωτήματος α.. Ερώτημα α: 4,0 μονάδες Ερώτημα β-i: 18,0 μονάδες (3 μονάδες για κάθε ένα από τα 6 μέτρα) Ερώτημα β-ii: 4,0 μονάδες (2 μονάδες για την κατασκευή και 2 μονάδες για την ερμηνεία του θηκογράμματος) Ερώτημα γ: 2,0 μονάδες Σύνολο: 28,0 μονάδες
ΘΕΜΑ 2 ο Ο Διευθυντής Ανθρώπινων Πόρων μιας βιομηχανίας θέλει να διερευνήσει τη σχέση που υπάρχει μεταξύ του ποσοστού λαθών των εργαζομένων στην εταιρία και του χρόνου εκπαίδευσης τους (σε μήνες). Τα στοιχεία που συνέλεξε από 10 εργαζόμενους στη βιομηχανία συνοψίζονται στο Αρχείο Excel, Φύλλο Ask2, όπου η μεταβλητή Y εκφράζει το ποσοστό λαθών των εργαζομένων ενώ η μεταβλητή Χ το χρόνο εκπαίδευσης τους στην εταιρία. α. Να κατασκευαστεί το Διάγραμμα Διασποράς των 10 διαθέσιμων ζευγών τιμών (Χ, Y) και με βάση αυτό να εξεταστεί αν το ποσοστό λαθών συσχετίζεται γραμμικά με το χρόνο εκπαίδευσης. β. Σε περίπτωση που διαπιστωθεί ότι υπάρχει γραμμική συσχέτιση: i. Να εκτιμηθεί η ευθεία γραμμικής παλινδρόμησης της Y πάνω στη Χ και να ερμηνευτούν οι συντελεστές της. ii. Να υπολογιστεί ο συντελεστής συσχέτισης και να ερμηνευτεί. iii. Να εκτιμηθεί το ποσοστό λαθών ενός υπαλλήλου της εταιρίας με χρόνο προϋπηρεσίας 26 μήνες. γ. Χρησιμοποιώντας την αντίστοιχη συνάρτηση του Excel, να εκτιμηθεί η ευθεία γραμμικής παλινδρόμησης της Y πάνω στη Χ και να συγκριθούν τα αποτελέσματα με αυτά του ερωτήματος βi. Ερώτημα α: 4,0 μονάδες Ερώτημα β-i: 6,0 μονάδες Ερώτημα β-ii: 3,0 μονάδες Ερώτημα β-iii: 3,0 μονάδες Ερώτημα γ: 2,0 μονάδες
ΘΕΜΑ 3 ο Ο τόρνος ενός εργοστασίου παράγει δακτυλίους μετάλλου («παξιμάδια»), των οποίων η εσωτερική διάμετρος ακολουθεί κανονική κατανομή με μέσο 0,373 εκ. και τυπική απόκλιση 0,002 εκ. Οι δακτύλιοι αυτοί προορίζονται, μεταξύ των άλλων χρήσεών τους και για τη συναρμολόγηση ορισμένων μερών, ενός συγκεκριμένου τύπου μοτοποδηλάτου, όπου σύμφωνα με τις τεχνικές προδιαγραφές απαιτούνται δακτύλιοι εσωτερικής διαμέτρου (0,375 ± 0,003) εκ. α. Αν ο τόρνος παράγει 180 παξιμάδια την ώρα, να υπολογισθεί πόσα από αυτά μπορούν να χρησιμοποιηθούν για τη συναρμολόγηση των μερών του συγκεκριμένου τύπου μοτοποδηλάτου. β. Αν επιλέξουμε τυχαία 5 παξιμάδια, να υπολογισθεί η πιθανότητα να υπάρχουν ανάμεσά τους τουλάχιστον 2 παξιμάδια που δεν μπορούν να χρησιμοποιηθούν για τη συναρμολόγηση των μερών του μοτοποδηλάτου, λόγω απόκλισης από τις προδιαγραφές. Ερώτημα α: 12,0 μονάδες Ερώτημα β: 6,0 μονάδες
ΘΕΜΑ 4 ο α. Έρευνα σχετικά με τα αίτια των τροχαίων ατυχημάτων αποκάλυψε ότι: - 60% του συνόλου των ατυχημάτων γίνονται τη νύκτα. - Από τα νυκτερινά ατυχήματα 65% οφείλονται στο αλκοόλ ενώ από τα ατυχήματα που γίνονται κατά τη διάρκεια της ημέρας μόνο το 35% οφείλεται στο αλκοόλ. Να υπολογισθούν: i. Το ποσοστό του συνόλου των ατυχημάτων που οφείλονται στο αλκοόλ. ii. Από τα ατυχήματα που οφείλονται στο αλκοόλ το ποσοστό εκείνων που γίνονται νύκτα. β. Από σχετική εμπειρική έρευνα σε μια αστική περιοχή προέκυψε η ακόλουθη κατανομή πιθανοτήτων του αριθμού Χ των παιδιών ανά οικογένεια: Χ i 0 1 2 3 4 P(Χ i ) 0,431 0,173 0,174 0,113 0,109 i. Αν είναι γνωστό ότι μία οικογένεια έχει το πολύ τρία παιδιά, να υπολογιστεί η πιθανότητα η οικογένεια να έχει τουλάχιστον 2 παιδιά. ii. Αν είναι γνωστό ότι μία οικογένεια έχει παιδιά να υπολογιστεί η πιθανότητα να έχει το πολύ ένα παιδί. Ερώτημα α-i: 5,0 μονάδες Ερώτημα α-ii: 5,0 μονάδες Ερώτημα β-i: 4,0 μονάδες Ερώτημα β-ii: 4,0 μονάδες
ΘΕΜΑ 5 ο α. Η Γενική Συνέλευση των εργαζομένων σε μία βιομηχανία πρόκειται να επιλέξει, μεταξύ 12 υποψηφίων, τετραμελή επιτροπή η οποία θα διαπραγματευθεί με την διοίκηση της εταιρίας τη νέα συλλογική σύμβαση εργασίας. Με πόσους τρόπους μπορεί να συγκροτηθεί η επιτροπή αν: i. Δύο συγκεκριμένοι υποψήφιοι, έστω Α και Β, δεν μπορούν να εκλεγούν μαζί στην επιτροπή. ii. Δύο συγκεκριμένοι υποψήφιοι, έστω Γ και Δ, μόνο μαζί μπορούν να εκλεγούν στην επιτροπή. β. Τα μέλη της κριτικής επιτροπής ενός φεστιβάλ κινηματογράφου αφού είδαν όλες τις διαγωνιζόμενες ταινίες διάλεξαν σε πρώτη φάση τις πέντε επικρατέστερες. Το έργο της επιτροπής στη δεύτερη φάση είναι: i. Να κατατάξει τις πέντε επικρατέστερες ταινίες κατά σειρά επιτυχίας με βάση το σενάριό τους. ii. Να επιλέξει, χωρίς να κατατάξει, τις δύο καλύτερες ταινίες ανάμεσα στις πέντε επικρατέστερες με βάση τη σκηνοθεσία τους. iii. Να επιλέξει από τις πέντε επικρατέστερες ταινίες εκείνες στις οποίες θα δοθούν το 1 ο και 2 ο βραβείο καλύτερης ταινίας αντίστοιχα. Να υπολογισθούν οι δυνατοί τρόποι κατάταξης/επιλογής για κάθε μία από τις περιπτώσεις αυτές. Ερώτημα α-i: 5,0 μονάδες Ερώτημα α-ii: 5,0 μονάδες Ερώτημα β-i: 2,0 μονάδες Ερώτημα β-ii: 3,0 μονάδες Ερώτημα β-iii: 3,0 μονάδες
ΣΗΜΕΙΩΣΕΙΣ ΠΡΟΣ ΤΟΥΣ ΦΟΙΤΗΤΕΣ: ΘΕΜΑ 1 ο Οι υπολογισμοί των βοηθητικών στοιχείων (αθροίσματα κ.λ.π.) που απαιτούνται για τον υπολογισμό των ζητουμένων ποσοτήτων στο ερώτημα βi να γίνουν με τη βοήθεια του Excel. Μαζί με τις λύσεις θα παραδοθεί και το σχετικό αρχείο του Excel που θα περιέχει τους υπολογισμούς των στοιχείων αυτών και το Ιστόγραμμα (ερώτημα γ). Για την κατασκευή του Θηκογράμματος (ερώτημα βii) προτείνεται να χρησιμοποιηθούν τα εργαλεία σχεδίασης του Word. Είναι ο ευκολότερος τρόπος. Για την κατασκευή του Ιστογράμματος προτείνεται να ακολουθηθούν τα εξής βήματα: α. Αρχικά καταγράψτε σε μία στήλη δίπλα στα δεδομένα όλα τα άνω άκρα των τάξεων β. Από το μενού Εργαλεία (Tools) επιλέξτε Ανάλυση Δεδομένων (Data Analysis). (Αν δεν υπάρχει, τότε από το μενού Εργαλεία επιλέγουμε Επιπρόσθετα (Add-ins), επιλέγουμε το Analysis Toolpak και Analysis Toolpak-VBA και μετά ΟΚ. Μετά από αυτό θα πρέπει να μας εμφανισθεί η επιλογή Ανάλυση Δεδομένων). γ. Στο επόμενο βήμα επιλέγουμε Ιστόγραμα (Histogram). Στο Input range βάζουμε την περιοχή των δεδομένων των οποίων θέλουμε να κάνουμε το ιστόγραμμα, πχ αν τα δεδομένα είναι στη στήλη Α, θέσεις 2-64 βάζω $Α$2:$Α$64 δ. Στο bin range βάζουμε τη στήλη με τα άνω άκρα που καταγράψαμε αρχικά, έστω $D$3:$D$13 ε. Επιλέγουμε, New Workbook και Chart Output και πατάμε ΟΚ ΘΕΜΑ 2 ο Οι υπολογισμοί των βοηθητικών στοιχείων (αθροίσματα κ.λ.π.) που απαιτούνται για τον υπολογισμό των ζητουμένων ποσοτήτων στα ερωτήματα βi και βii να γίνουν με τη βοήθεια του Excel. Μαζί με τις λύσεις θα παραδοθεί και το σχετικό αρχείο του Excel που θα περιέχει τους υπολογισμούς των στοιχείων αυτών και το Διάγραμμα Διασποράς (ερώτημα α).
Για την εκτίμηση της ευθείας γραμμικής παλινδρόμησης της Υ πάνω στη Χ με τη χρήση της Συνάρτησης Παλινδρόμησης του Excel προτείνεται να ακολουθηθούν τα παρακάτω βήματα. α. Από το μενού Εργαλεία (Tools) επιλέγουμε την Ανάλυση Δεδομένων (Data Analysis). Αν δεν υπάρχει, τότε από το μενού Εργαλεία επιλέγουμε Επιπρόσθετα (Add-ins), κάνουμε κλικ στις επιλογές Analysis Toolpak και Analysis Toolpak-VBA και μετά ΟΚ. Μετά από αυτό θα πρέπει να μας εμφανισθεί η επιλογή Ανάλυση Δεδομένων. β. Από εκεί επιλέγουμε Regression γ. Στο Input Y range βάζουμε την περιοχή των δεδομένων του Υ, πχ αν τα δεδομένα είναι στη στήλη C, θέσεις 2-11 βάζω $C$2:$C$11. Κάνω το ίδιο και για Input Χ range. δ. Στα output options επιλέγουμε New Workbook και πατάμε ΟΚ. Θα πρέπει να εμφανισθεί το output της παλινδρόμησης σε ξεχωριστό αρχείο. Αν χρειασθείτε βοήθεια, το Help του Regression είναι πολύ καλό. Το τελικό αρχείο του Excel θα πρέπει να περιέχει τα εξής φύλλα: Τα δεδομένα σε δύο φύλλα (Ask1 Ask2) Το φύλλο solutions που θα περιέχει τους υπολογισμούς για τα Θέματα 1α, 1βi και 2β. Το φύλλο chart1 που θα περιέχει το διάγραμμα διασποράς για το Θέμα 2α Το φύλλο regression που θα περιέχει το output της παλινδρόμησης για το Θέμα 2γ Το φύλλο histogram που θα περιέχει το ιστόγραμμα και τον πίνακα που βγάζει η αντίστοιχη συνάρτηση του Excel για το Θέμα 1γ