ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ)



Σχετικά έγγραφα
SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) E04 R SQUARE (i) PARAMETER

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

9. Παλινδρόμηση και Συσχέτιση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

7.2 ΜΕΘΟΔΟΙ ΜΟΝΟΤΟΝΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (Monotone Regression)

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Στατιστική Επιχειρήσεων Ι


ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Y Y ... y nx1. nx1

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Απλή Γραμμική Παλινδρόμηση II

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Γ. Πειραματισμός Βιομετρία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΑΣΚΗΣΕΙΣ ΜΕΡΟΣ ΙΙ - ΟΙΚΟΝΟΜΕΤΡΙΑ Ι Ι ΑΣΚΩΝ : ΤΣΕΡΚΕΖΟΣ ΙΚΑΙΟΣ ΑΣΚΗΣΗ 1. Ν'αποδειχθεί η σχέση : σ 2 =Ε(Χ 2 )-µ 2 ΑΣΚΗΣΗ 2

cv = κατάλληλη κριτική (κρίσιμη) τιμή από τους πίνακες της Ζ ή t κατανομής

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Απλή Παλινδρόμηση και Συσχέτιση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Εισόδημα Κατανάλωση

Θέμα: Ενδεικτικό Θέμα εξετάσεων: Μέτρα θέσης Παλινδρόμηση

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

7.2.1 Εκτίμηση της Καμπύλης Παλινδρόμησης της Μεταβλητής Υ πάνω στην Μεταβλητή Χ

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

Διάστημα εμπιστοσύνης της μέσης τιμής

f , Σύνολο 40 4) Να συμπληρώστε τον παρακάτω πίνακα f , , Σύνολο 5) Να συμπληρώστε τον παρακάτω πίνακα

ΑΣΚΗΣΕΙΣ. Μέθοδος 1 Μέθοδος 2 Μέθοδος 3 Μέθοδος

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Στατιστική Συμπερασματολογία

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

Εφαρμοσμένη Στατιστική

ΕΞΕΤΑΣΕΙΣ ΣΤΟ ΜΑΘΗΜΑ ΠΙΘΑΝΟΤΗΤΕΣ ΣΤΑΤΙΣΤΙΚΗ ΤΜΗΜΑΤΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΙΟΥΝΙΟΥ ( ) ΟΜΑΔΑ Α ( 40% )

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Ενδεικτικές ασκήσεις ΔΙΠ 50

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Χ. Εμμανουηλίδης, 1

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Ποσοτική & Ποιοτική Ανάλυση εδομένων Συσχέτιση. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη,

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Διαχείριση Υδατικών Πόρων

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

x y max(x))

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΑΤΑΝΟΜΕΣ Ι ΙΑΣΤΑΤΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΜΕΘΟΔΟΙ ΕΛΕΓΧΟΥ ΑΚΡΙΒΕΙΑΣ (ACCURACY)

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Transcript:

ΑΣΚΗΣΕΙΣ. Ο διευθυντής προσωπικού μιας μεγάλης εταιρείας πιστεύει ότι ίσως υφίσταται κάποια σχέση μεταξύ των ημερών απουσίας και της ηλικίας των εργαζομένων. Με βάση την υπόθεση αυτή ενδιαφέρεται να κατασκευάσει ένα μοντέλο το οποίο θα χρησιμοποιεί για να προβλέπει τον αριθμό των ημερών απουσίας των εργαζομένων στην εταιρεία κατά τη διάρκεια του έτους. Ένα τυχαίο δείγμα 0 εργαζομένων έδωσε τα εξής στοιχεία που αναφέρονται σε ηλικία και σε αριθμό ημερών απουσίας: Πρόβλημα απουσιών Εργαζόμενος Ηλικία (σε έτη) Ημέρες απουσίας Υ 27 5 2 6 6 3 37 0 4 23 8 5 46 9 6 58 7 7 29 4 8 36 9 64 5 0 40 8 α) Να κατασκευασθεί το διάγραμμα σημείων του προβλήματος αυτού. β) Υποθέτοντας ότι υφίσταται μια γραμμική σχέση μεταξύ των δύο αυτών ποσοτήτων, να χρησιμοποιηθεί η μέθοδος των ελαχίστων τετραγώνων για να καθορισθούν οι συντελεστές παλινδρόμησης a και b. γ) Να ερμηνευθεί η έννοια της κλίσης b στο πρόβλημα αυτό. δ) Για ένα εργαζόμενο ηλικίας 40 ετών, ποιός θα ήταν ο μέσος αριθμός ημερών απουσίας ανά έτος που προβλέπεται με τη χρήση του μοντέλου; ε) Να υπολογισθεί ο συντελεστής προσδιορισμού r 2, όπως επίσης και ο 2 προσαρμοσμένος συντελεστής προσδιορισμού r adj και να ερμηνευθούν. στ) Να καθορισθεί αν από τα δεδομένα του προβλήματος προκύπτουν ενδείξεις γραμμικής σχέσης μεταξύ της ηλικίας και των ημερών απουσίας στο α=0.0 επίπεδο σημαντικότητας. ζ) Με τη χρήση της ανάλυσης των καταλοίπων να εξετασθεί η καταλληλότητα του μοντέλου.

2. Μια εταιρεία που κατασκευάζει ανταλλακτικά ενδιαφέρεται να διαμορφώσει ένα μοντέλο ώστε να εκτιμά τον αριθμό των εργατοωρών που απαιτούνται για την κατασκευή παρτίδων ανταλλακτικών (συσκευασιών) διαφορετικού μεγέθους. (Ως μέγεθος συσκευασίας θεωρείται ο αριθμός των ανταλλακτικών που περιέχει η συγκεκριμένη συσκευασία). Ένα τυχαίο δείγμα από 4 ακολουθίες κατασκευών ανταλλακτικών έδωσε τα αποτελέσματα που φαίνονται στον πίνακα που ακολουθεί: (Για κάθε μια από τις συσκευασίες μεγέθους 20, 30, 40, 50, 60, 70 και 80 ανταλλακτικών επελέγησαν δύο τυχαία δείγματα). α) Να κατασκευασθεί το διάγραμμα σημείων. β) Με την υπόθεση ότι υφίσταται μια γραμμική σχέση μεταξύ των δύο αυτών μεγεθών, να προσδιορισθούν οι συντελεστές παλινδρόμησης a και b με τη μέθοδο των ελαχίστων τετραγώνων. γ) Να δοθεί η ερμηνεία των συντελεστών αυτών. Πρόβλημα εργατοωρών Μέγεθος συσκευασίας Εργατοώρες 20 50 20 55 30 73 30 67 40 87 40 95 50 08 50 2 60 28 60 35 70 48 70 60 80 70 80 62 δ) Να προβλεφθεί ο μέσος αριθμός εργατοωρών που απαιτείται για να παραχθεί μια συσκευασία με 45 αντικείμενα. ε) Να δικαιολογηθεί γιατί είναι ακατάλληλο να προβλεφθεί ο μέσος αριθμός εργατοωρών που απαιτούνται για να συμπληρωθεί μια συσκευασία μεγέθους 00 ανταλλακτικών.

στ) Να κατασκευασθεί ένα 95% διάστημα εμπιστοσύνης για τον μέσο αριθμό εργατοωρών που απαιτούνται για να συμπληρωθεί μια συσκευασία μεγέθους 45 ανταλλακτικών. ζ) Να κατασκευασθεί ένα 95% διάστημα πρόβλεψης για τις ώρες που χρειάζεται ένας συγκεκριμένος εργαζόμενος να ολοκληρώσει μια συσκευασία 45 ανταλλακτικών. η) Να υπολογισθεί ο συντελεστής προσδιορισμού r 2 και να ερμηνευθεί. θ) Να καθορισθεί αν, με βάση τα συγκεκριμένα δεδομένα, υπάρχουν ενδείξεις γραμμικής σχέσης μεταξύ του μεγέθους της συσκευασίας και των εργατοωρών που απαιτούνται για να γίνει η συσκευασία αυτή σε επίπεδο σημαντικότητας α=0.0. 3. Ένας παραγωγός ενδιαφέρεται να καθορίσει την επίδραση ενός φυσικού οργανικού λιπάσματος στην παραγωγή τομάτας. Για το σκοπό αυτό χρησιμοποιεί πέντε διαφορετικές ποσότητες του λιπάσματος αυτού 0, 0, 20, 30 και 40 κιλών σε ισοδύναμα κομμάτια γης έκτασης 00 τ.μ. το καθένα. Οι ποσότητες του λιπάσματος τοποθετούνται τυχαία στα κομμάτια γης. Τα αποτελέσματα δίνονται στον πίνακα που ακολουθεί. Πρόβλημα παραγωγής τομάτας Πλαίσιο γης Ποσότητα λιπάσματος Χ Παραγωγή Υ 0 6 2 0 8 3 0 4 0 4 5 20 8 6 20 23 7 30 25 8 30 28 9 40 30 0 40 34 α) Να κατασκευαστεί το διάγραμμα σημείων. β) Να προσδιορισθεί η ευθεία παλινδρόμησης με τη μέθοδο των ελαχίστων τετραγώνων για τα δεδομένα αυτά. γ) Να κατασκευασθούν 95% διαστήματα εμπιστοσύνης για τις παραμέτρους α και β.

δ) Να ερμηνευθεί η τιμή b της εκτιμήτριας της παραμέτρου β που προέκυψε με τη μέθοδο των ελαχίστων τετραγώνων. ε) Να προβλεφθεί η μέση παραγωγή τομάτος για ένα πλαίσιο αγρού 00τ.μ. στο οποίο χρησιμοποιήθηκαν 5 κιλά του οργανικού αυτού λιπάσματος. στ) Να κατασκευαστεί το 95% διάστημα εμπιστοσύνης για την μέση παραγωγή τομάτας που προβλέπεται να προκύψει από τη χρησιμοποίηση 5 κιλών λιπάσματος σε ένα πλαίσιο γης 5τ.μ. ζ) Να κατασκευαστεί το 95% διάστημα πρόβλεψης για την παραγωγή τομάτας που θα προκύψει από ένα συγκεκριμένο πλαίσιο αγρού έκτασης 00τ.μ. στο οποίο χρησιμοποιήθηκαν 20 κιλά οργανικού λιπάσματος. η) Να προσδιορισθούν οι συντελεστές r 2 2 και r adj για το πρόβλημα αυτό και να ερμηνευθούν. θ) Να προσδιορισθεί αν, με βάση τα στοιχεία αυτά, υπάρχουν επαρκείς ενδείξεις γραμμικής συσχέτισης μεταξύ της ποσότητας του λιπάσματος και την παραγωγή τομάτας σε επίπεδο σημαντικότητας α=0.0. ι) Με τη βοήθεια της ανάλυσης των καταλοίπων, να εξετασθεί η καταλληλότητα εφαρμογής του μοντέλου αυτού. 4. Ο διευθυντής μιας εταιρείας υπολογιστών ενδιαφέρεται να κατασκευάσει ένα μοντέλο για να προβλέπει τον αριθμό των φορών που καλείται ανά έτος για επισκευές ενός συγκεκριμένου τύπου υπολογιστή που η εταιρεία του προωθεί. Την πρόβλεψη αυτή θέλει να την στηρίξει στην παλαιότητα των υπολογιστών (σε έτη). Ένα τυχαίο δείγμα δέκα τέτοιων υπολογιστών έδωσε τα αποτελέσματα που ακολουθούν στη συνέχεια. α) Να κατασκευαστεί το διάγραμμα σημείων του προβλήματος. β) Να κατασκευαστεί η ευθεία παλινδρόμησης με τη μέθοδο των ελαχίστων τετραγώνων. γ) Να ερμηνευθεί η τιμή των παραμέτρων a και b του προβλήματος. δ) Χρησιμοποιώντας το μοντέλο παλινδρόμησης της ερώτησης (β), να προβλεφθεί ο μέσος αριθμός κλήσεων για επισκευή για ένα υπολογιστή της κατηγορίας αυτής παλαιότητας 4 ετών.

Πρόβλημα επισκευής υπολογιστών Υπολογιστής Αριθμός κλήσεων Ηλικία (έτη) 3 2 4 3 3 2 4 5 2 5 5 3 6 7 3 7 8 4 8 0 4 9 0 5 0 2 5 ε) Να υπολογισθούν οι τιμές του r 2 2 και r adj και να ερμηνευθούν. στ) Να κατασκευαστούν το 95% διαστήματα εμπιστοσύνης για το μ Υ Χ=4 και το 95% διάστημα πρόβλεψης για τον αριθμό κλήσεων για ένα έτος υπολογιστή ηλικίας 4 ετών. Να συγκριθούν τα διαστήματα αυτά. ζ) Να εξετασθεί, στο 0.05 επίπεδο σημαντικότητας αν υπάρχουν ενδείξεις, από τα δεδομένα, γραμμικής συσχέτισης μεταξύ της ηλικίας των υπολογιστών αυτών και του αριθμού των κλήσεων για επισκευή. η) Να χρησιμοποιηθεί η ανάλυση καταλοίπων για να εξετασθεί η καταλληλότητα του μοντέλου που χρησιμοποιήθηκε. 5. Ο διευθυντής μιας εταιρείας έρευνας αγοράς ενδιαφέρεται να κατασκευάσει ένα μοντέλο για να προβλέπει τον αριθμό των ερωτηματολογίων που συμπληρώνουν οι ερευνητές του ανά ημέρα. Ο διευθυντής θεωρεί ότι η εμπειρία των συνεντευκτών (μετρούμενη σε εβδομάδες εμπειρίας) είναι το κύριο στοιχείο που καθορίζει τον αριθμό των ερωτηματολογίων που ο κάθε ερευνητής είναι δυνατόν να συμπληρώσει. Χρησιμοποιώντας ένα τυχαίο δείγμα 0 συνεντευκτών, ο διευθυντής κατέγραψε τον αριθμό των ερωτηματολογίων που συμπλήρωσαν οι συνεντευκτές αυτοί, όπως επίσης και την εμπειρία τους (σε εβδομάδες) με τα αποτελέσματα που δίνονται στη συνέχεια. Για το πρόβλημα αυτό να απαντηθούν οι ερωτήσεις α-ζ της προηγούμενης άσκησης.

Πρόβλημα απόδοσης συνεντευκτών Εβδομάδες Εμπειρίας Αριθμός ερωτηματολογίων 5 4 4 9 58 2 8 6 37 8 52 0 28 6 24 5 45 0 33 7 6. Μια εταιρεία ραδιοταξί ενδιαφέρεται να καθορίσει το χρόνο που απαιτείται για να μεταφερθούν επιβάτες από συγκεκριμένα σημεία της πόλης στο αεροδρόμιο. Ένα τυχαίο δείγμα 2 τέτοιων διαδρομών σε μια συγκεκριμένη μέρα έδωσε τα εξής αποτελέσματα: Να απαντηθούν τα ερωτήματα α-ζ της άσκησης 5 για τα δεδομένα αυτά. Πρόβλημα με ταξί Απόσταση (χιλιόμετρα) Χρόνος (λεπτά) 0.3 9.7.6 8.5 2. 2.88 4.3 24.2 5.7 27.08 6. 22.96 8.4 29.38 20.2 37.24 2.8 36.84 24.3 40.59 25.4 4.2 26.7 38.9

7. Για τα δεδομένα των προβλημάτων -6, να εξετάσετε αν υπάρχουν ακραίες τιμές. Στις περιπτώσεις που υπάρχουν τέτοιες ακραίες τιμές θεωρείτε ότι αυτές θα πρέπει να απομακρυνθούν και γιατί; Στις περιπτώσεις εκείνες στις οποίες θα απομακρύνετε κάποια ακραία τιμή να προχωρήσετε σε νέα ανάλυση παλινδρόμησης με τα υπόλοιπα δεδομένα και να συγκρίνετε τα αποτελέσματα που θα προκύψουν με αυτά που προέκυψαν με την χρήση όλων των δεδομένων. 8. Οι ηλικίες (σε χρόνια) ανδρών και γυναικών έξι παντρεμένων ζευγαριών δίνονται στον πίνακα που ακολουθεί: Ζευγάρι 2 3 4 5 6 Ηλικίας της συζύγου Χ 35 25 5 25 53 42 Ηλικίας του συζύγου Υ 38 25 49 3 55 44 Να εξετάσετε τη σχέση που υπάρχει μεταξύ των ηλικιών του συζύγου και την συζύγου σε παντρεμένα ζευγάρια, όπως αυτή προκύπτει από τα δεδομένα του προβλήματος αυτού. 9. Ένας αναλυτής, στην προσπάθειά του να κατασκευάσει ένα μοντέλο παλινδρόμησης της ετήσιας συμμετοχής Y σε ένα συνταξιοδοτικό πρόγραμμα των υπαλλήλων μιας εταιρείας, με χρήση ως ανεξάρτητης μεταβλητής Χ του αριθμού των χρόνων υπηρεσίας στην εταιρεία, κατέληξε σε μια εκτύπωση του υπολογιστή που έδινε το 95% διάστημα εμπιστοσύνης του Ε(Υ ) για κάθε υπάλληλο. Ο αναλυτής περίμενε να βρει ότι στις 95% των περιπτώσεων, η συμμετοχή του υπαλλήλου στο συνταξιοδοτικό πρόγραμμα θα βρισκόταν στο σχετικό διάστημα εμπιστοσύνης Ε(Υ ). Αντί όμως για αυτό, ο αναλυτής παρατήρησε ότι κάτι τέτοιο συνέβαινε σε πολύ μικρότερο ποσοστό των περιπτώσεων. Να εξηγηθεί το λάθος στον τρόπο σκέψης του αναλυτή αυτού. 0. Για κάθε μια από τις ερωτήσεις που ακολουθούν, να εξηγηθεί αν ένα διάστημα εμπιστοσύνης για το Ε(Y x) ή ένα διάστημα πρόβλεψης για το Υ είναι περισσότερο κατάλληλα:

α) Ποιο θα είναι το ποσοστό ανεργίας το επόμενο τετράμηνο, δοθέντος ότι ο δείκτης επιχειρηματικής δραστηριότητας θα είναι 78.6; β) Πόσες ώρες ανακούφισης από τον πόνο θα έχει ένας ασθενής με τη χρήση κάποιου συγκεκριμένου φαρμάκου όταν η δόση που θα πάρει είναι 0% παραπάνω από το συνηθισμένο επίπεδο;. Να αποδειχθεί ότι οι τυχαίες μεταβλητές Y και βˆ του γραμμικού μοντέλου είναι ασυσχέτιστες. Λύση: cov( Y, βˆ ) = cov( Y βˆ ) = n = cov(y,β) ˆ n ccov(y, Yj) = n n σ n 2 j c cov(y, Y ) c 0. 2. Να βρεθεί η συνδιακύμανση των εκτιμητριών αˆ και βˆ των συντελεστών του γραμμικού μοντέλου μ Υ x = α + βx. Είναι οι εκτιμήτριες αυτές ασυσχέτιστες; Λύση: Cov( α,β) ˆ ˆ Cov(Y βx,β ˆ ˆ) Cov( Y,β) ˆ - xcov(β, ˆ βˆ ) -xv(βˆ ) (λόγω του αποτελέσματος της άσκησης ) 2 σ x. S xx

* 3. Να αποδειχθεί ότι οι εκτιμήτριες αˆ και βˆ των συντελεστών του γραμμικού μοντέλου παλινδρόμησης αποκλίσεων από το δειγματικό μέσο είναι ασυσχέτιστες. Λύση: cov( αˆ *,β) ˆ cov(y, βˆ ) 0.