ΜΕΜ64: Εφαρμοσμένη Στατιστική 1 ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=0, X = 7.5, σ = 16, α = 5%. Πως αλλάζει το διάστημα αν α = 1%; Άσκηση. Μας δίνεται ότι X ~ Ν (400, 65 ). Να βρεθεί ένα δ/μα εμπιστοσύνης για τη μέση τιμή μ του πληθυσμού για α = 5%. 5 Άσκηση 3. Μας δίνεται ότι X = 500, n = 400, s = 0 (δηλ. η διασπορά είναι άγνωστη). Να βρεθεί ένα δ/μα εμπιστοσύνης για τη μέση τιμή μ του πληθυσμού για α = 1%. Ποιο είναι το δ/μα όταν για α = 5%; Άσκηση 4. Μας δίνεται ότι X = 00, n = 0, σ =.5 (δηλ. η διασπορά είναι γνωστή). Να βρεθεί ένα δ/μα εμπιστοσύνης για τη μέση τιμή μ του πληθυσμού για α = 1%. Ποιο είναι το δ/μα όταν για n = 40; Άσκηση 5. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=15, X = 150, σ = 36, α = 1%. Πως αλλάζει το διάστημα αν n = 31; Άσκηση 6. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=16, με X = 8, s = 1.5, α = 1%. Πως αλλάζει το δ/μα αν n=40; Άσκηση 7. Τα δεδομένα του προβλήματος έχουν ως εξής: Μέγεθος δείγματος μικρό n=16, Πως θα άλλαζε το δ/μα αν ξέραμε ότι σ=5; X = 44., s = 5, α = 1%. ΑΣΚΗΣΕΙΣ ΕΛΕΓΧΟΥ ΥΠΟΘΕΣΕΩΝ Άσκηση 1. Με μια νέα μέθοδο προσδιορισμού του σημείου τήξης (σ.τ.) μετάλλων προέκυψαν οι παρακάτω μετρήσεις για το μαγγάνιο: 167, 16, 167, 163, 158, 163, 168. Να εξεταστεί αν η νέα μέθοδος σφάλει με ε.σ. 0.05, δεδομένου ότι το σ.τ. του μαγγανίου είναι 160 C. Άσκηση. Τα παρακάτω δεδομένα αφορούν τα φορτία θραύσης (σε tn/cm) συνθετικών νημάτων δύο τύπων: Τύπος Ι 1. 0.3 0.8 0.5 0.4 0.9 1.0 Τύπος ΙΙ 1.4 1.5 1.1 1.0 0.8 1.7 0.9 0.7 0.6
ΜΕΜ64: Εφαρμοσμένη Στατιστική Υποθέτοντας ισότητα διασπορών να εξεταστεί αν οι δύο τύποι νημάτων έχουν την ίδια μέση αντοχή σε ε.σ. 0.05. Άσκηση 3. Έξι συνθετικά νήματα κόπηκαν στη μέση. Στο ένα τμήμα από κάθε ζεύγος εφαρμόστηκε μία ειδική χημική επεξεργασία για την αύξηση της αντοχής του, ενώ το άλλο αφέθηκε όπως είχε. Με βάση τα παρακάτω δεδομένα, όπου x 1 εκφράζει το δείκτη αντοχής του τμήματος με χημική επεξεργασία και x το δείκτη αντοχής του τμήματος χωρίς χημική επεξεργασία, να εξεταστεί αν αυξάνει κατά.0 τουλάχιστον μονάδες ο δείκτης αντοχής των τμημάτων με χημική επεξεργασία (α=0.10). x 1 15. 13.4 14.6 15.1 13.1 15.3 x 1.7 10.8 1.8 1.9 11.0 13.0 Άσκηση 4. Σε προβλήματα ελέγχου ποιότητας εκτός από τη διατήρηση ενός σταθερού μέσου μας ενδιαφέρει και η διατήρηση της διασποράς σε χαμηλά επίπεδα, διότι διαφορετικά αυξάνει ο κίνδυνος απόρριψης του προϊόντος. Από την παραγωγή τυχαίο δείγμα μεγέθους n=16 έδωσε δειγματική απόκλιση S = 5.5. Αν η μεγαλύτερη επιτρεπόμενη τυπική απόκλιση είναι σ 0 = 4 να εξεταστεί αν η παραπάνω υπέρβαση είναι στατιστικά σημαντική ή όχι (α=0.05). Άσκηση 5. Από τυχαίο δείγμα 150 εμπορικών καταστημάτων της πόλεως Α προέκυψε ότι το μέσο ετήσιο ενοίκιο τους είναι 1363 ευρώ, ενώ από απογραφή που έγινε στην πόλη Β προέκυψε ότι το μέσο ετήσιο ενοίκιο όλων των εμπορικών καταστημάτων της είναι 1345 ευρώ με τυπική απόκλιση 1864 ευρώ. (α) Να εξεταστεί αν μπορούμε να δεχθούμε, σε επίπεδο σημαντικότητας 0.10 ότι τα ενοίκια των εμπορικών καταστημάτων της πόλεως Α δε διαφέρουν από εκείνα της πόλεως Β, όταν είναι γνωστό ότι οι δύο κατανομές έχουν την ίδια διακύμανση. (β) Υπό τις ίδιες παραδοχές και δεδομένα, να εξεταστεί αν τα ενοίκια των εμπορικών καταστημάτων της Α είναι υψηλότερα από εκείνα της Β, σε ε.σ. 0.10. Άσκηση 6. Να κάνετε και πάλι τα ερωτήματα (α), (β) της Άσκησης 1, αυτή τη φορά θεωρώντας ότι το σ δεν είναι γνωστό. Άσκηση 7. Ο δειγματικός μέσος και η δειγματική διασπορά από δείγμα μεγέθους n = 0 που προέρχεται από την κανονική κατανομή βρέθηκαν ίσα με 1 και.8 αντίστοιχα. Να ελέγξετε αν ισχύει η Η 0 : μ = 10 έναντι της Η 0 : μ 10 σε ε.σ. α = 5%: (α) μέσω της κρίσιμης περιοχής K, (β) μέσω κατάλληλου δ.ε. για το μ, και (γ) μέσω του p-value. Άσκηση 8. Έστω ότι ο αριθμός μηνιαίων πωλήσεων ενός προϊόντος από τους αντιπροσώπους μιας εταιρείας αυτοκινήτων ακολουθεί την Ν(40, 100). Το προσωπικό των αντιπροσώπων της εταιρείας παρακολουθεί κάποια σεμινάρια και έστω Χ1, Χ,, Χn οι πωλήσεις των αντιπροσώπων τον επόμενο μήνα. Πως θα ελέγχατε σε ε.σ. α αν μεταβλήθηκαν οι μέσες πωλήσεις ή όχι. Ποια θα ήταν η απάντησή σας στο παραπάνω ερώτημα αν για n = 5 αντιπροσώπους είχαμε Xi= 35, 45, 38, 40, 43. (α = 5%). Να δώσετε το αντίστοιχο p-value.
ΜΕΜ64: Εφαρμοσμένη Στατιστική 3 Άσκηση 9. Κατά το έτος 008 η μέση μηνιαία καταναλωτική δαπάνη των οικογενειών μιας πόλης ήταν μ 0 = 14.4 εκατοντάδες ευρώ. Κατά το επόμενο έτος συγκεντρώθηκαν στοιχεία μέσης μηνιαίας καταναλωτικής δαπάνης (Χ, σε εκατοντάδες ευρώ) από τυχαίο δείγμα 10 οικογενειών της πόλεως αυτής, τα οποία έδωσαν τα ακόλουθα αθροίσματα: n x i = 153., x i = 448.6 i=1 n i =1 Θεωρώντας ότι μηνιαία καταναλωτική δαπάνη των οικογενειών μια πόλης ακολουθεί N(μ,σ ), μπορούμε να δεχθούμε, σε επίπεδο σημαντικότητας 0.05, ότι κατά το έτος 009 η μέση μηνιαία καταναλωτική δαπάνη μ όλων των οικογενειών της πόλεως έμεινε, στην πραγματικότητα, αμετάβλητη σε σχέση με το προηγούμενο έτος; Να θεωρήσετε ως εναλλακτική υπόθεση (α) την μ μ 0, (β) την μ < μ 0, και (γ) την μ > μ 0. Άσκηση 10. Θεωρώντας ότι η τιμή πώλησης ενός προϊόντος σε μια περιοχή ακολουθεί N(μ,σ ), και προκειμένου να ελεγχθεί η Η 0 : μ = 1000 ευρώ έναντι της Η 1 : μ 1000 ευρώ, καταγράφηκε η τιμή πώλησης του προϊόντος αυτού σε ένα τ.δ. n καταστημάτων. Από αυτό το τ.δ. βρέθηκε μέση τιμή πώλησης 1030 ευρώ με p-value = 8%. Αν αντί της εναλλακτικής Η 1 : μ 1000 θέλαμε να ελέγξουμε την Η 1 : μ > 1000 ποιο θα ήταν το αντίστοιχο p-value; Ποιο θα ήταν το αντίστοιχο pvalue όταν Η 1 : μ < 1000; Άσκηση 11. Σε n = 0 καπνιστές που αποφάσισαν να διακόψουν το κάπνισμα μετρήθηκε το σωματικό τους βάρος λίγο πριν και τρείς μήνες μετά τη διακοπή του καπνίσματος. Βρέθηκε ότι x = 1.8 και s x = 0.8 όπου xi είναι η διαφορά του σωματικού βάρους (σε κιλά) του i ατόμου μετά πρίν τη διακοπή του καπνίσματος. Να ελέγξετε αν, με βάση το δείγμα αυτό, μπορούμε να πούμε ότι η διακοπή του καπνίσματος συνδέεται με την μεταβολή του σωματικού βάρους. Να κάνετε τον αμφίπλευρο και τους δύο μονόπλευρους ελέγχους μέσω των p-values. Άσκηση 1. Έστω ότι ο χρόνος ζωής ενός τύπου μπαταριών ακολουθεί κανονική κατανομή N(μ,σ ). Ο κατασκευαστής ισχυρίζεται ότι σ = 100. Μπορούμε να απορρίψουμε τον ισχυρισμό αυτό έναντι της Η 1 : σ > 100 σε επίπεδο σημαντικότητας 5% αν έχουμε την πληροφορία ότι η δειγματική διασπορά s των χρόνων ζωής ενός τυχαίου δείγματος 0 μπαταριών βρέθηκε ίση με 130. Να βρεθεί το p-value του ελέγχου. Άσκηση 13. Oι χρόνοι συναρμολόγησης ενός προϊόντος από δύο συγκεκριμένους εργάτες, ακολουθούν κανονική κατανομή με μέση τιμή μ 1 και μ αντίστοιχα. Αν 34, 99, 34, 174, 188, 107, 173, 17 και 105, 194, 77, 33, 159, 150, 167, 17, 169, 166 είναι δειγματοληπτικά κάποιοι χρόνοι (σε min) συναρμολόγησης των δύο αυτών εργατών αντίστοιχα, μπορούμε σε επίπεδο σημαντικότητας α=0.05 να πούμε ότι α) οι δύο εργάτες έχουν διαφορετική απόδοση; β) ο πρώτος εργάτης έχει χειρότερη απόδοση από το δεύτερο; γ) ο πρώτος εργάτης συναρμολογεί το προϊόν 10 λεπτά αργότερα από το δεύτερο;
ΜΕΜ64: Εφαρμοσμένη Στατιστική 4 Θεωρείστε ότι οι τυπικές αποκλίσεις σ 1, σ των χρόνων συναρμολόγησης του προϊόντος από τους εργάτες είναι γνωστές και ίσες με σ 1 = σ = 50. Άσκηση 14. Από τυχαίο δείγμα 50 οικογενειών της πόλεως Α προέκυψε ότι το μέσο ετήσιο εισόδημά τους ήταν 1556 ευρώ. Επίσης από τυχαίο δείγμα 100 οικογενειών της πόλεως Β προέκυψε ότι το μέσο ετήσιο εισόδημά τους ήταν 1516 ευρώ. Μπορούμε να δεχθούμε, σε επίπεδο σημαντικότητας 0.01, ότι οι οικογένειες των δύο πόλεων από τις οποίες προέρχονται τα δείγματα έχουν το ίδιο μέσο εισόδημα, αν είναι γνωστό ότι στους δύο αυτούς πληθυσμούς η τυπική απόκλιση είναι ίση με 830; Άσκηση 15. Μια εταιρεία κατασκευής σκελετών σκαφών βρίσκει ότι τα δένδρα τύπου Α που προμηθεύεται από ένα δάσος αποδίδουν κατά μέσο όρο 64 kgr ξύλα περισσότερο από τα δένδρα τύπου Β. Η διακύμανση της απόδοσης ξύλου βρέθηκε ίση με 115 kgr. Ένα άλλο δάσος περιέχει και τους δύο τύπους ξύλων. Παίρνοντας δείγμα 100 δένδρων για κάθε τύπο (από το δεύτερο δάσος) οι αποδόσεις σε ξύλο βρέθηκαν 1390 kgr και 133 kgr αντίστοιχα ενώ οι διακυμάνσεις έμεναν αμετάβλητες. Μπορούμε να δεχθούμε σε ε.σ. 1% ότι η διαφορά των μέσων αποδόσεων ξύλου παραμένει στο ίδιο επίπεδο δηλ. 64 kgr; Άσκηση 16. Έστω μ1 η μέση τιμή πώλησης ενός προϊόντος σε μία περιοχή Α και μ η μέση τιμή πώλησης του ίδιου προϊόντος σε μία περιοχή Β. Επιλέγουμε τυχαία 4 τιμές από την περιοχή Α και 4 τιμές από την περιοχή Β. Αν οι τιμές αυτές είναι 1.1, 1.06, 1.1, 1.1 (περιοχή Α) και 1.07, 0.93, 0.97, 0.99 (περιοχή Β), μπορούμε, σε επίπεδο σημαντικότητας 5%, να πούμε ότι η μέση τιμή πώλησης στην περιοχή Α είναι υψηλότερη από την αντίστοιχη στην περιοχή Β; (Η0: μ1 = μ, H1: μ1 > μ) (υποθέτουμε ότι οι τιμές κατανέμονται κανονικά και με ίση διασπορά στις δύο περιοχές). Άσκηση 17. Από τυχαίο δείγμα 1 εμπορικών καταστημάτων ειδών ενδυμασίας προέκυψε ότι η μέση ημερήσια δαπάνη τους για διαφήμιση είναι 51 ευρώ με δειγματική τυπική απόκλιση 3.6 ευρώ. Επίσης από τυχαίο δείγμα 1 εμπορικών καταστημάτων ειδών υποδήσεως προέκυψε ότι η μέση ημερήσια δαπάνη τους για διαφήμιση είναι 48 ευρώ με δειγματική τυπική απόκλιση 4 ευρώ. Μπορούμε να δεχθούμε, σε ε.σ. 1%, ότι οι δύο κατηγορίες καταστημάτων δαπανούν, κατά μέσο όρο το ίδιο ποσόν για διαφήμιση; Υποθέτουμε ότι οι δαπάνες για κάθε κατάστημα κατανέμονται κανονικά και με ίση διασπορά. Άσκηση 18. (α) Έστω μ 1 η μέση τιμή πώλησης ενός προϊόντος σε μία περιοχή Α και μ η μέση τιμή πώλησης του ίδιου προϊόντος σε μία περιοχή Β. Η μέση τιμή και η διασπορά ενός τ.δ. 10 τιμών πώλησης από την περιοχή Α βρέθηκε 100.9 και 8.76667 αντίστοιχα. Επίσης, η μέση τιμή και η διασπορά ενός τ.δ. 0 τιμών πώλησης από την περιοχή Β βρέθηκε 104.45 και 1.9974 αντίστοιχα. Αν υποθέσουμε ότι οι τιμές κατανέμονται
ΜΕΜ64: Εφαρμοσμένη Στατιστική 5 κανονικά και με ίση (αλλά άγνωστη) διασπορά και στις δύο περιοχές, να ελέγξετε σε επίπεδο σημαντικότητας 5% i) Αν η μέση τιμή πώλησης στην Α είναι διαφορετική από την αντίστοιχη στην Β. ii) Αν η μέση τιμή πώλησης στην Α είναι χαμηλότερη από την αντίστοιχη στην Β. (β) Στο (α) υποθέσαμε ότι οι διασπορές σ 1 = σ των τιμών στις περιοχές αυτές είναι ίσες. Να ελέγξετε σε επίπεδο σημαντικότητας 5% αν όντως οι δύο αυτές διασπορές μπορούν να θεωρηθούν ίσες. ΣΥΝΔΥΑΣΤΙΚΈΣ ΑΣΚΗΣΕΙΣ (ΕΛΕΓΧΟΥ ΥΠΟΘΕΣΕΩΝ / ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ) Άσκηση 1. Από την παραγωγή ενός μηχανήματος εμφιάλωσης αναψυκτικών επιλέχθηκε τυχαία ένα δείγμα 100 φιαλών ίδιου μεγέθους και μετρήθηκε με ακρίβεια η περιεχόμενη ποσότητα αναψυκτικού Χ. Από τις μετρήσεις προέκυψε ότι 100 100 X i 4985 ml και X i X 891 ml. i1 i1 α) Να υπολογιστεί η αμερόληπτη εκτιμήτρια της μέσης τιμής και της μεταβλητότητας της ποσότητας αναψυκτικού που τοποθετεί το συγκεκριμένο μηχάνημα εμφιάλωσης σε κάθε φιάλη. β) Να κατασκευαστεί το 95% διάστημα εμπιστοσύνης της μέσης τιμής της ποσότητας αναψυκτικού που τοποθετεί το συγκεκριμένο μηχάνημα εμφιάλωσης σε κάθε φιάλη. γ) Να ελεγχθεί σε επίπεδο σημαντικότητας 1% εάν η μέση τιμή του περιεχομένου που τοποθετεί το συγκεκριμένο μηχάνημα είναι μικρότερη των 499 ml. δ) Θα μπορούσε κανείς με βάση τις μετρήσεις του συγκεκριμένου δείγματος να ισχυριστεί ότι η μέση τιμή του περιεχομένου που τοποθετεί το συγκεκριμένο μηχάνημα είναι μικρότερη των 498 ml; Σχολιάστε την απάντησή σας. Άσκηση. Από την παραγωγή ενός μηχανήματος κοπής μεταλλικών αξόνων επιλέχθηκε τυχαία ένα δείγμα 100 αξόνων και μετρήθηκε με ακρίβεια το μήκος τους Χ. Από τις i μετρήσεις προέκυψε ότι 100 i1 100 X 755 cm και X i X 1584 cm. α) Να υπολογιστεί η αμερόληπτη εκτιμήτρια της μέσης τιμής και της μεταβλητότητας του μήκους των μεταλλικών αξόνων που παράγονται από το συγκεκριμένο μηχάνημα κοπής. β) Να υπολογιστεί το 90% αμφίπλευρο διάστημα εμπιστοσύνης της μέσης τιμής του μήκους των μεταλλικών αξόνων που παράγονται από το συγκεκριμένο μηχάνημα κοπής. γ) Να υπολογιστεί το 95% άνω όριο της μέσης τιμής του μήκους των μεταλλικών αξόνων που παράγονται από το συγκεκριμένο μηχάνημα κοπής. i1
ΜΕΜ64: Εφαρμοσμένη Στατιστική 6 δ) Να ελεγχθεί σε επίπεδο σημαντικότητας 1% εάν η μέση τιμή του μήκους των μεταλλικών αξόνων που παράγονται από το συγκεκριμένο μηχάνημα κοπής είναι μικρότερη των 76 cm. Άσκηση 3. Βασικό χαρακτηριστικό ποιότητας ενός εδράνου είναι η εσωτερική διάμετρος Χ, η κατανομή της οποίας έχει διαπιστωθεί ότι είναι κανονική. Οι προδιαγραφές της Χ είναι 9,8 mm < X < 10, mm. Για την εκτίμηση της μέσης τιμής και της μεταβλητότητας της Χ έχει ληφθεί τυχαίο δείγμα μεγέθους n=8, μετρήθηκαν οι τιμές της εσωτερικής διαμέτρου x1, x,., x8 και υπολογίστηκαν τα αθροίσματα: 8 i i1 8 i i1 x 80, 8 mm και x x 0, 07 mm. α) Να υπολογιστεί η αμερόληπτη εκτιμήτρια της μέσης τιμής και της μεταβλητότητας της εσωτερικής διαμέτρου των εδράνων. β) Να υπολογιστεί το 90% αμφίπλευρο διάστημα εμπιστοσύνης της μέσης τιμής της εσωτερικής διαμέτρου των εδράνων. γ) Να υπολογιστεί το 95% κάτω όριο της μέσης τιμής της εσωτερικής διαμέτρου των εδράνων. δ) Να ελεγχθεί σε επίπεδο σημαντικότητας 5% εάν η μέση τιμή της εσωτερικής διαμέτρου των εδράνων είναι μικρότερη των 10,3 mm. ε) Αν η μέση τιμή και η μεταβλητότητα της εσωτερικής διαμέτρου Χ είναι στην πραγματικότητα ακριβώς ίσες με τις αντίστοιχες αμερόληπτες εκτιμήτριες που υπολογίστηκαν από το δείγμα των 8 εδράνων στο ερώτημα (α), να υπολογιστεί το ποσοστό των εδράνων με εσωτερική διάμετρο εκτός προδιαγραφών. Άσκηση 4. Από δύο πληθυσμούς που ακολουθούν την κανονική κατανομή με τυπικές αποκλίσεις σ1=4 και σ=5 επιλέχθηκαν τυχαία δύο δείγματα (ένα από τον κάθε πληθυσμό) μεγέθους n1=4 και n=4 και υπολογίστηκαν οι μέσες τιμές τους, οι οποίες ήταν x1 6 και x 30, αντίστοιχα. Να γίνει ο έλεγχος ισότητας των μέσων τιμών των δύο πληθυσμών (Η0: μ1=μ και Η1: 1 ) για τα εξής 3 επίπεδα σημαντικότητας: a1 0,1, a 0,05 και a3 0,01. Ποιο από τα παρακάτω ισχύει; (α) Η μηδενική υπόθεση δεν απορρίπτεται για κανένα από τα 3 επίπεδα σημαντικότητας (β) Η μηδενική υπόθεση απορρίπτεται για το α3 αλλά δεν απορρίπτεται για τα α1 και α. (γ) Η μηδενική υπόθεση απορρίπτεται για τα α3 και α αλλά δεν απορρίπτεται για το α1. (δ) Η μηδενική υπόθεση απορρίπτεται για το α1 αλλά δεν απορρίπτεται για τα α και α3. (ε) Η μηδενική υπόθεση απορρίπτεται για τα α1 και α αλλά δεν απορρίπτεται για το α3.
ΜΕΜ64: Εφαρμοσμένη Στατιστική 7 (στ) Η μηδενική υπόθεση απορρίπτεται και για τα 3 επίπεδα σημαντικότητας. Άσκηση 5. Βασικό χαρακτηριστικό ποιότητας ενός εδράνου είναι η εσωτερική διάμετρος Χ, με επιθυμητή τιμή 10 mm. Η κατανομή της X έχει διαπιστωθεί ότι είναι κανονική. Για την εκτίμηση της μεταβλητότητας σ της Χ έχει ληφθεί τυχαίο δείγμα μεγέθους n=0 από μια παρτίδα εδράνων και μετρήθηκαν οι τιμές της εσωτερικής διαμέτρου x1, x,,x0 και η μέση τιμή των 0 αυτών τιμών x = 10,03 mm. Επίσης υπολογίστηκε το άθροισμα 0 i 1 ( x i x) 0, 0304 α) Να υπολογισθεί η τιμή της αμερόληπτης σημειακής εκτιμήτριας της μεταβλητότητας της εσωτερικής διαμέτρου των εδράνων. β) Να υπολογισθεί το αμφίπλευρο 90% διάστημα εμπιστοσύνης της μεταβλητότητας της εσωτερικής διαμέτρου των εδράνων. Άσκηση 6. Το όριο θραύσης κάποιων μεταλλικών εξαρτημάτων ακολουθεί κανονική κατανομή με μέση τιμή μ = 550 Ν/mm και τυπική απόκλιση σ = 40 Ν/mm. α) Να υπολογιστεί το ποσοστό των εξαρτημάτων που έχουν όριο θραύσης μεταξύ 50 και 600 Ν/mm. β) Λαμβάνεται τυχαίο δείγμα 4 εξαρτημάτων. Ποια είναι η πιθανότητα η μέση τιμή του δείγματος αυτού να είναι μικρότερη από 580 N/mm ; γ) Ο υπεύθυνος μηχανικός δοκίμασε μια νέα μέθοδο παραγωγής, προκειμένου να αυξήσει τη μέση τιμή του ορίου θραύσης. Οι μετρήσεις του ορίου θραύσης σε 6 εξαρτήματα που παρήχθησαν με τη νέα μέθοδο ήταν (σε N/mm ): 589, 546, 67, 545, 584, 565. Να κατασκευαστούν τα 97% όρια εμπιστοσύνης της μέσης τιμής, θεωρώντας ότι η κατανομή του ορίου θραύσης παραμένει κανονική και ότι η τυπική απόκλιση παραμένει σταθερή και ίση με 40 Ν/mm. ΑΣΚΗΣΕΙΣ ΠΑΛΙΝΔΡΌΜΗΣΗΣ Άσκηση 1. Δίνονται οι 30 παρατηρήσεις (Exercise1.csv) με βάση τις οποίες θέλουμε να δημιουργήσουμε ένα γραμμικό μοντέλο για την πρόβλεψη της Y μέσω των ανεξάρτητων μεταβλητών Χ1, Χ. 1. Θεωρώντας ότι μοντέλο είναι Υ = β0 + β1χ1 + βχ + ε, ε~n(0, σ Ιn ) i. Εκτιμήστε τα β0, β1, β, σ και υπολογίστε τους συντελεστές προσδιορισμού R και R adjusted ii. Βρείτε 95% διάστημα εμπιστοσύνης για κάθε ένα από τα β0, β1, β iii. Να κάνετε τους ελέγχους Η0:β1=0 με H1:β1 0, Η0:β=0 με H1:β 0 και Η0:β1=β=0 με H1:β1 0 ή β 0 σε ε.σ. 1%. iv. Βρείτε 95% δ.ε. για τη μέση και ατομική πρόβλεψη του Υ όταν Χ1=50, Χ=60. v. Να γίνει έλεγχος κανονικότητας των παρατηρήσεων (KS για τα υπόλοιπα).
ΜΕΜ64: Εφαρμοσμένη Στατιστική 8 vi. Το μοντέλο Υ = β0 + β1χ1 + βχ + β3 Χ1Χ + ε βελτιώνει ουσιαστικά το προηγούμενο;. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα: i. Υ = β0 + β1χ1 + βχ + ε ii. Υ = β0 + βχ + ε iii. Υ = β0 + β1χ1 + ε είναι το καλύτερο, με βάση το R και R adjusted Άσκηση. Δίνονται οι παρακάτω 54 παρατηρήσεις (Exercise.csv) με βάση τις οποίες θέλουμε να δημιουργήσουμε ένα γραμμικό μοντέλο για την πρόβλεψη της Y μέσω κάποιας ή κάποιων από τις ανεξάρτητες μεταβλητές Χ1, Χ, Χ3, Χ4. i. Να βρεθεί ο πίνακας συσχέτισης μεταξύ των Χ1, Χ, Χ3, Χ4, Y = log10 Y. Υπόδειξη: χρησιμοποιήστε τη συνάρτηση cor της R για να βρείτε όλους του συντελεστές συσχέτισης ταυτόχρονα (help(cor)). ii. Να εξεταστούν όλα τα δυνατά γραμμικά μοντέλα που περιέχουν τις Χ1, Χ, Χ3, Χ4 και την Y = log10 Y. iii. Να βρεθεί το καλύτερο με βάση: a) το R b) R adjusted. Άσκηση 3. Δίνονται οι ετήσιοι μισθοί Y, σε χιλιάδες ευρώ 15 υπαλλήλων που επιλέχτηκαν τυχαία (Exercise3.csv). Επίσης δίνονται τα χρόνια υπηρεσίας Χ1, η ηλικία Χ και το φύλο τους Φ. Το μοντέλο για τους άνδρες και τις γυναίκες είναι Υ = β01 + β1χ1 + βχ + ε και Υ = β0 + β1χ1 + βχ + ε αντίστοιχα. Να προσαρμόσετε και να μελετήσετε τα μοντέλα. Τι συμπεράσματα προκύπτουν για τους μισθούς ανδρών και γυναικών; Άσκηση 4. Δίνονται οι παρατηρήσεις του αρχείου Exercise4.csv. i. Να βρεθεί ο πίνακας συσχέτισης μεταξύ των Χ1, Χ, Χ3, Χ4. Ποια ζεύγη μεταβλητών παρουσιάζουν υψηλή συσχέτιση; ii. Να εξεταστούν όλα τα δυνατά γραμμικά μοντέλα που περιέχουν τις Χ1, Χ, Χ3, Χ4 και την Y. Να βρεθεί το καλύτερο με βάση: a) το R b) R adjusted iii. Στο πλήρες μοντέλο: a. εκτιμήστε τα βi, σ και υπολογίστε τους συντελεστές προσδιορισμού R και R adjusted b. Βρείτε 95% διάστημα εμπιστοσύνης για κάθε ένα από τα βi c. Να κάνετε τους ελέγχους Η0:βi=0 με H1:βi 0, και Η0:β1=β=β3=β4=0 με H1:β1 0 ή β 0 ή β3 0 ή β4 0 σε ε.σ. 1%. iv. Βρείτε 95% δ.ε. για τη μέση και ατομική πρόβλεψη του Υ όταν Χ1 = Χ = Χ3 = Χ4 = 30.