ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE DEPARTMENT: BUSINESS ADMINISTRATION (PATRAS) Address: M. Alexandrou 1, 263 34 PATRA Greece Tel.:+2610 369213,Fax:+2610 396184, email: mitro@teipat.gr Καθηγητής Ι. Μητρόπουλος Professor J. Mitropoulos Θέμα: Ενδεικτικό Θέμα εξετάσεων: Μέτρα θέσης Παλινδρόμηση Επιμέλεια: Χρυσάνθη Παπαθανασοπούλου Ημερομηνία: 25/05/2017 1
Άσκηση: Μια συνηθισμένη κριτική κατά της τηλεόρασης είναι ότι: η έκθεση στην τηλεόραση μειώνει τις ώρες φυσικής άσκησης και οδηγεί σε αύξηση βάρους. Μία έρευνα επέλεξε ένα τυχαίο δείγμα 5 παιδιών ηλικίας 10 ετών και κατέγραψε τις εβδομαδιαίες ώρες τηλεθέασης και το πλεονάζον βάρος των παιδιών (σε κιλά): Χ: Τηλεθέαση 2 4 6 8 6 Υ: Υπέρβαρο 1 3 3 3 4 1. Να υπολογιστούν: X Y Αριθμητικός μέσος Διάμεσος Επικρατούσα τιμή Εύρος Διακύμανση Τυπική απόκλιση Συντελεστής μεταβλητότητας 2. Να εξετάσετε γραφικά διαγραμματικά την δυνατότητα εφαρμογής της ανάλυσης παλινδρόμησης. 3. Να υπολογίσετε την ευθεία (y = b 0 + b 1 x) της παλινδρόμησης με την μέθοδο των ελαχίστων τετραγώνων και να δοθούν ερμηνείες για τους συντελεστές του μοντέλου. 2
Συντελεστές Ερμηνεία b 0 = b 1 = 4. Να υπολογίσετε και ερμηνεύσετε τον συντελεστή συσχέτισης r και το δείκτη προσδιορισμού R 2 Συντελεστές Ερμηνεία r = R 2 = 5. Να επιχειρήσετε πρόβλεψη στα παρακάτω εναλλακτικά σενάρια ωρών τηλεθέασης (Χ) και πλεονάζοντος βάρους (Υ=Υπέρβαρο). Υ ( Υπέρβαρο) 2 Χ ( Τηλεθέαση) 3 5 15 Επίλυση: 1. Να υπολογιστούν: 1. Ο μέσος αριθμητικός του δείγματος δίνεται από τον παρακάτω τύπο: Χ = x n = x + x + + x 5 = 2 + 4 + 6 + 8 + 6 5 Ομοίως: = 26 5 = 5,2 Y = y n = 14 5 = 2,8 3
2. Η Διάμεσος: Αρχικά, τοποθετούμε τις παρατηρήσεις κατά αύξουσα τάξης μεγέθους: Χ: 2, 4, 6, 6, 8 Η θέση της Διαμέσου Μ είναι: Άρα η διάμεσος είναι: Μ= 6 Ομοίως για την μεταβλητή Υ: Υ: 1, 3, 3, 3, 4, η διάμεσος είναι Μ=3 3. Το εύρος τιμών Εύρος = Μέγιστη τιμή Ελάχιστη τιμή. Για την μεταβλητή Χ: Εύρος = 8 2=6 Για την μεταβλητή Υ: Εύρος = 4 1=3 4. Η επικρατούσα τιμή = = = 3 Να θυμηθούμε ότι η επικρατούσα τιμή ενός συνόλου δεδομένων είναι η τιμή που εμφανίζεται με τη μεγαλύτερη συχνότητα. Ένα σύνολο δεδομένων μπορεί να έχει μία επικρατούσα τιμή (ή επικρατούσα κλάση), ή δύο, ή περισσότερες ακόμα και καμία. Για την μεταβλητή Χ: Επικρατούσα τιμή = 6 Για την μεταβλητή Υ: Εύρος =3 5. Διασπορά S = X ή S = ( ) 4
Για το υπολογισμό της διασποράς δημιουργούμε τον παρακάτω πίνακα με τους υπολογισμούς που συμπεριλαμβάνονται στους τύπους: X i X X i - X (X i - X) 2 X i 2 2 5.2-3.2 10.24 4 4 5.2-1.2 1.44 16 6 5.2 0.8 0.64 36 8 5.2 2.8 7.84 64 6 5.2 0.8 0.64 36 ΣΎΝΟΛΟ 26 20.8 156 Επισήμανση: Στον πίνακα τοποθετούμε της τιμές της μεταβλητής Χ i όπως δόθηκαν αρχικά στην εκφώνηση της άσκησης και όχι κατά αύξουσα τάξης μεγέθους. Η τοποθέτηση κατά αύξουσα σειρά γίνεται μόνο για τον υπολογισμό της διαμέσου και των τεταρτημορίων. S = X = 156 " = 156 " = 156 " = 156 135,2 = 20,8 = 5,2 ή με τη χρήση του δεύτερου τύπου: S = ( ) = ", = 5,2 Ομοίως και για την μεταβλητή Υ: Υ i Y Y i - Y (Y i - Y) 2 Y i 2 1 2.8-1.8 3.24 1 3 2.8 0.2 0.04 9 3 2.8 0.2 0.04 9 3 2.8 0.2 0.04 9 4 2.8 1.2 1.44 16 ΣΎΝΟΛΟ 14 4.8 44 5
S = Y = 44 " = 44 " = 44 "# = 156 39,2 = 4,8 = 1,2 ή με τη χρήση του δεύτερου τύπου: S = ( ) =, = 1,2 6. Η τυπική απόκλιση Για την μεταβλητή Χ: s = s = 5,2 = 2,28 Για την μεταβλητή Υ: s = s = 1,2 = 1,09 7. Ο συντελεστής μεταβλητότητας Για την μεταβλητή Χ: CV= =,", = 0,438 0,44 Για την μεταβλητή Υ: CV= =,", = 0,389 0,39 6
ΆΡΑ: X Y Αριθμητικός μέσος 5,2 2,8 Διάμεσος 6 3 Επικρατούσα τιμή 6 3 Εύρος 6 3 Διακύμανση 5,2 1,2 Τυπική απόκλιση 2,28 1,09 Συντελεστής μεταβλητότητας 0,44 0,39 2. Να εξετάσετε γραφικά διαγραμματικά την δυνατότητα εφαρμογής της ανάλυσης παλινδρόμησης. 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 7
3. Να υπολογίσετε την ευθεία (y = b0 + b1x) της παλινδρόμησης με την μέθοδο των ελαχίστων τετραγώνων και να δοθούν ερμηνείες για τους συντελεστές του μοντέλου. 8
Οι συντελεστές της ευθείας των ελάχιστων τετραγώνων δίνονται από τους τύπους: b = και b = y b x Όπου: s" Από τα παραπάνω ερωτήματα έχουν υπολογιστεί: S = 5,2 X = 5,2 Y = 2,8 Σύμφωνα με τους παραπάνω τύπους, για τον υπολογισμό των συντελεστών b o και b 1 της ευθείας των ελάχιστων τετραγώνων απαιτούνται τα αθροίσματα των ποσοτήτων Χ, Υ, Χ Υ,Χ 2 και Υ 2. Το μόνο άθροισμα που χρειάζεται να υπολογιστεί είναι το Χ Υ, καθώς τα υπόλοιπα υπάρχουν στους παραπάνω πίνακες. Χ i Υ i 2 12 18 24 24 ΣΎΝΟΛΟ 80 s" "" "," " "#," "",, 9
Οι συντελεστές της ευθείας των ελάχιστων τετραγώνων δίνονται από τους τύπους: b = s " s = 1,8 5,2 = 0,346 και: b = y b x = 2,8 0,346 5,2 = 2,8 1,8 1 Συνεπώς η εξίσωση της ευθείας των ελάχιστων τετραγώνων είναι: y = 1+ 0,346 x Ερμηνεία των συντελεστών b 0 και b 1 : Συντελεστές b 0 = 1 b 1 = 0,346 Ερμηνεία Ο συντελεστής b = 1 αντιπροσωπεύει το σημείο τομής (intercept) της ευθείας με τον άξονα Υ. Για τα συγκεκριμένα δεδομένα ερμηνεύεται ως: το πλεονάζον βάρος του παιδιού αν δεν παρακολουθεί καθόλου τηλεόραση αναμένεται να είναι 1 κιλό. Ο συντελεστής διεύθυνσης b = 0,346 είναι η κλίση (slope) της ευθείας. Με απλά λόγια, η κλίση της ευθείας αντιπροσωπεύει την οριακή αύξηση της μεταβλητής Υ ανά μονάδα της μεταβλητής X, που για τα συγκεκριμένα δεδομένα ερμηνεύεται ως: για κάθε μία επιπλέον εβδομαδιαία ώρα τηλεθέασης το πλεονάζον βάρος του παιδιού αναμένεται να αυξάνει κατά 0,346 κιλά. 4. Να υπολογίσετε και ερμηνεύσετε τον συντελεστή συσχέτισης r και το δείκτη προσδιορισμού R 2. Για τον υπολογισμό του συντελεστή συσχέτισης απαιτούνται η συμμεταβλητότητα και οι τυπικές αποκλίσεις των δυο μεταβλητών. r = S " S S Παραπάνω υπολογίσαμε ότι: S " = 1,8 10
S 2,28 S 1,09 Άρα ο συντελεστής συσχέτισης των δύο μεταβλητών είναι: r = S " S S = 1,8 2,28 1,09 = 0,724 Συντελεστής προσδιορισμού: R = r = 0,724 = 0,524 Συντελεστές Ερμηνεία r = 0,724 Ο συντελεστής συσχέτισης r=0,724 δείχνει μια σημαντική θετική γραμμική συσχέτιση μεταξύ των ωρών τηλεθέασης και του πλεονάζοντος βάρους των παιδιών. Αυτό σημαίνει ότι η ευθεία των ελάχιστων τετραγώνων ταιριάζει αρκετά καλά στα δεδομένα, συνεπώς η παραπάνω ανάλυση είναι αρκετά αξιόπιστη. R 2 =0,524 Αυτό σημαίνει ότι το 52,4% του υπέρβαρου των παιδιών εξηγείται από τις ώρες τηλεθέασης. Το υπόλοιπο 47,6% οφείλεται σε άλλες μεταβλητές, που προς το παρόν δεν έχουμε ερευνήσει. 5. Να επιχειρήσετε πρόβλεψη στα παρακάτω εναλλακτικά σενάρια ωρών τηλεθέασης (Χ) και πλεονάζοντος βάρους (Υ=Υπέρβαρο). Υ ( Υπέρβαρο) 2 Χ ( Τηλεθέαση) 3 5 15 Η πρόβλεψη θα γίνει με τη χρήση της ευθείας παλινδρόμησης y = 1+ 0,346 x. Χ: 3 Υ=1+ 0,346 3= 1+1,038= 2,038 11
Χ: 5 Υ=1+ 0,346 5= 1+1,73= 2,73 Χ: 15 Η πρόβλεψη δεν είναι ασφαλής καθώς η τιμή Χ=15 δεν βρίσκεται στην δειγματική περιοχή. Υ: 2 2=1+ 0,346 Χ 0,346 Χ = 2-1 0,346 Χ=1 Χ=1/0,346=2,89 Άρα: Υ ( Υπέρβαρο) 2,038 2,73-2 Χ ( Τηλεθέαση) 3 5 15 2,89 12