8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι

Σχετικά έγγραφα
10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

11. ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ ΔΕΔΟΜΕΝΑ ΧΡΟΝΟΣΕΙΡΩΝ

7. ΧΡΟΝΟΣΕΙΡΕΣ ΚΑΙ ΟΙ ΣΥΝΙΣΤΩΣΕΣ ΤΟΥΣ

4. ΕΠΙΛΟΓΗ ΤΗΣ ΜΕΘΟΔΟΥ ΠΡΟΒΛΕΨΗΣ

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 50], ΕΡΓΑΣΙΑ 4. Ενδεικτική Λύση

5. ΠΡΟΒΛΕΨΕΙΣ ΜΕ ΚΙΝΗΤΟΥΣ ΜΕΣΟΥΣ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισόδημα Κατανάλωση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Άσκηση 10, σελ Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

9. Παλινδρόμηση και Συσχέτιση

Μην ξεχάσετε να προσθέσετε μόνοι σας τα Session του Minitab! Δηλαδή την ημερομηνία και ώρα που κάνατε κάθε άσκηση!

3. ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΔΥΟ Η ΤΡΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Διμεταβλητές κατανομές πιθανοτήτων

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

3η Ενότητα Προβλέψεις

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΠΡΟΒΛΕΨΗΣ

2. ΕΠΙΛΟΓΗ ΤΟΥ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Αρχίζοντας με το ΜΙΝΙΤΑΒ 15

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Άσκηση 1. Πληθυσμός (Χ i1 )

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

Απλή Ευθύγραµµη Συµµεταβολή

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ

Μοντέλα Πολλαπλής Παλινδρόμησης

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Γ. Πειραματισμός Βιομετρία

Kruskal-Wallis H

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Περιεχόμενα. Πρόλογος... v

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 3ο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Απλή Γραμμική Παλινδρόμηση I

Ενδεικτικές ασκήσεις ΔΙΠ 50

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΜΑΘΗΜΑ 2 ο. ΗχρήσητουπακέτουEviews (Using Eviews econometric package)

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32

Απλή Γραμμική Παλινδρόμηση II

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Συσχέτιση και Παλινδρόμηση Correlation and Regression. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Βιοστατιστικής

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Transcript:

8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι Απλή γραμμική παλινδρόμηση είναι μία στατιστική μέθοδος που χρησιμοποιείται για τη μελέτη της σχέσης μεταξύ δύο ποσοτικών μεταβλητών εκ των οποίων μία είναι η ανεξάρτητη μεταβλητή X και η άλλη είναι η εξαρτημένη μεταβλητή Y η απόκριση (response). Στόχος είναι η ανάπτυξη ενός γραμμικού μοντέλου που να συνδέει τα X και Y και να μπορεί να προβλέψει τις τιμές της Y. Η απλούστερη μορφή γραμμικής εξάρτησης είναι Y X 0 1 όπου 0 είναι η τιμή Y (intercept) όταν X 0 και 1 είναι η μέση μεταβολή στο Y όταν το X μεταβάλλεται κατά μία μονάδα. Το τυχαίο σφάλμα παριστάνει την μεταβλητότητα στο Y η οποία δεν μπορεί να περιγραφεί από την ανεξάρτητη μεταβλητή X και η οποία μπορεί να ωφείλεται είτε σε άλλες ανεξάρτητες μεταβλητές είτε σε τυχαίες διακυμάνσεις. Το μοντέλο λειτουργεί κάτω από την υπόθεση ότι τα σφάλματα είναι ανεξάρτητα και ότι ακολουθούν την κανονική 2 κατανομή με μέση τιμή 0 και διακύμανση για όλες τις τιμές της X. 8.1 ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ Παράδειγμα 8.1 Στο αρχείο C:\Forecasting Lab Data\Milk Sales.MTW υπάρχουν οι εβδομαδιαίες πωλήσεις γάλακτος Y σε τόνους, με τις αντίστοιχες τιμές πώλησης X σε για 10 εβδομάδες. Για να πάρουμε το διάγραμμα διασποράς των X και Y. 1. Από τη γραμμή μενού επιλέγουμε Graph Scatterplot. 2. Στο πλαίσιο διαλόγου Scatterplots που εμφανίζεται επιλέγουμε Simple και πατάμε ΟΚ. 3. Στο πλαίσιο διαλόγου Scatterplot Simple που εμφανίζεται: (α) Διπλοπατάμε στην αριστερή πλευρά στη μεταβλητή C1 Sales για να εμφανιστεί στο 1 ο πλαίσιο Y variables. (β) Διπλοπατάμε στην αριστερή πλευρά στη μεταβλητή C2 Price για να εμφανιστεί στο 1 ο πλαίσιο X variables. Ιωάννης Ι.Γεροντίδης, Καθηγητής 109

(γ) Πατάμε στο κουμπί Labels. Σην καρτέλα Titles/Footnotes και στο πλαίσιο Title πληκτρολογούμε Διάγραμμα διασποράς Πωλήσεων με Τιμή και μετά δύο φορές ΟΚ. 4. Πατάμε δύο φορές ΟΚ και στο Graph Window εμφανίζεται το διάγραμμα διασποράς. Αυτό δείχνει την ύπαρξη αρνητικής γραμμικής σχέσης μεταξύ των πωλήσεων και της τιμής. Όπως είναι αναμενόμενο οι πωλήσεις μειώνονται με την αύξηση της τιμής πώλησης. Κατά συνέπεια και η κλίση της ευθείας παλινδρόμησης είναι αρνητική. Για να υπολογίσουμε τον συντελεστή συσσχέτισης των X και Y. 1. Από τη γραμμή μενού επιλέγουμε Stat Basic Statistics Correlation. Ιωάννης Ι.Γεροντίδης, Καθηγητής 110

2. Στο πλαίσιο διαλόγου Correlation που εμφανίζεται: (α) Στην αριστερή πλευρά διπλοπατάμε στις μεταβλητές C1 Sales και C2 Price για να εμφανιστούν στο πλαίσιο Variables. (β) Aποεπιλέγουμε το Display p-values και μετά ΟΚ. Εμφανίζεται το Session Window με τις παρακάτω πληροφορίες: Η τιμή -0.863 για τον συντελεστή συσχέτισης r επαληθεύει την ύπαρξη της αρνητικής γραμικής σχέσης που εντοπίστηκε στο διάγραμμα διασποράς. 8.2 ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ Για να κάνουμε ανάλυση παλινδρόμησης στα δεδομένα του παραδείγματος 8.1. 1 Από τη γραμμή μενού επιλέγουμε Stat Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται: (α) Διπλοπατάμε στην αριστερή πλευρά στη μεταβλητή C1 Sales για να εμφανιστεί στο πλαίσιο Response:. (β) Διπλοπατάμε στην αριστερή πλευρά στη μεταβλητή C2 Price για να εμφανιστεί στο πλαίσιο Predictors: (γ) Πατάμε στο κουμπί Results και στο πλαίσιο διαλόγου Regression Results που εμφανίζεται επιλέγουμε Regression equation, table of contents, s, R-squared, and basic analysis of variance. Ιωάννης Ι.Γεροντίδης, Καθηγητής 111

(δ) Πατάμε δύο φορές ΟΚ και στο Session Window εμφανίζονται τα παρακάτω αποτελέσματα: Αρχικά δίνεται η προσαρμοσμένη εξίσωση παλινδρόμησης Yˆ 32.1 14.5X. Η τιμή ˆ 0 32.1 προσδιορίζει το ύψος των πωλήσεων Yˆ 32.1 όταν X 0. Η πρόβλεψη αυτή έχει πρακτική σημασία μόνο όταν η τιμή 0 περιέχεται στις δειγματικές τιμές της μεταβλητής X. Στο παράδειγμά μας οι δειγματικές τιμές της X είναι από 1 έως 2 και επομένως η τιμή Y ˆ 32.1 δεν έχει πρακτική σημασία. Η κλίση ˆ 1 14.5 της προσαρμοσμένης ευθείας προσδιορίζει την εκτιμούμενη μέση μεταβολή στο Y που αντιστοιχεί σε μοναδιαία μεταβολή του X. Στο παράδειγμα έχουμε ότι κάθε αύξηση της τιμής πώλησης κατά μία μονάδα προκαλεί μείωση των πωλήσεων κατά 14.5 τόνους. Η τιμή sy x = 2.72545 είναι το εκτιμούμενο τυπικό σφάλμα της παλινδρόμησης και αποτελεί εκτιμητή του. Το sy x εκτιμάει τη μεταβλητότητα των πωλήσεων γύρω από την προσαρμοσένη ευθεία παλινδρόμησης. Αν τα σφάλματα ακολουθούν την κανονική κατανομή, τότε το 67% των διαφορών Y Yˆ βρίσκονται στο διάστημα ( s, s ) ενώ ενώ το 95% αυτών βρίσκονται στο διάστημα ( 2 s, 2 s ). y x y x y x y x H τιμή R-Sq = 74.6% είναι το τετράγωνο του συντελεστή συσχέτισης 0.863 r και εκφράζεται %. Περίπου το 75% του συνολικού αθροίσματος των τετραγώνων των πωλήσεων γύρω από τη μέση τιμή Y ερμηνεύεται από την ευθεία παλινδρόμησης η διαφορετικά η ευθεία παλινδρόμησης μειώνει το σφάλμα της πρόβλεψης κατά 75% Ιωάννης Ι.Γεροντίδης, Καθηγητής 112

σε σχέση με εκείνο που προκύπτει αν χρησιμοποιήσουμε το Y για την πρόβλεψη των πωλήσεων. Το R-Sq(adj) = 71.4% λαμβάνει υπ όψη τους βαθμούς ελευθερίας. Στον πίνακα ANOVA η γραμμή Residual Error περιλαμβάνει την τιμή 59.42 τους βαθμούς ελευθερίας d.f. = 8 και το λόγο SSunexplained 59.42 MS 7.43 d.f. 8 2 που είναι ένας εκτιμητής του. SS unexplained = 8.3 ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΚΛΙΣΗ Προκειμένου να διαπιστώσουμε αν η προσαρμοσμένη ευθεία παλινδρόμησης είναι χρήσιμη για προβλέψεις κάνουμε τη δοκιμασία των υποθέσεων H0 : 1 0 με H1 : 1 0. Στα αποτελέσματα του Session Window δίνονται σχετικές πληροφορίες στον πίνακα που βρίσκεται κάτω από την εξίσωση της προσαρμοσμένης ευθείας. Για παράδειγμα η τιμή -4.84 που αντιστοιχεί στη διασταύρωση της γραμμής Price και της στήλης Τ είναι η τιμή του στατιστικού ˆ 1 ( 1) 0 14.5 0 t 4.84 SE( ) 3.002 1 με αντίστοιχη τιμή για το p value 0. Το p value είναι η πιθανότητα, όταν η H 0 ισχύει, να πάρουμε μία τιμή t 4.84 η t 4.84. Συνεπώς η τιμή p value 0 αποτελεί ισχυρή ένδειξη για να μην αποδεχθούμε την H 0, έτσι ώστε 0 0 και το μοντέλο είναι χρήσιμο. 8.4 ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΤΗΝ ΚΛΙΣΗ Για να πάρουμε ένα (1 )100% διάστημα εμπιστοσύνης για το 1 σύμφωνα με τον τύπο ˆ 1 t ˆ ( / 2), d. f. SE( 1), επειδή δεν υπάρχει εντολή στο Minitab που να το υπολογίζει αυτόματα, θα το υπολογίσουμε με το χέρι και την εντολή Calculator. 1 Από τη γραμμή μενού επιλέγουμε Calc Probability distributions t. 2. Στο πλαίσιο διαλόγου t Distribution που εμφανίζεται: (α) Επιλέγουμε Inverse cumulative probability. (β) Στο πλαίσιο Degrees of freedom δίνουμε 8. (γ) Επιλέγουμε το πλαίσιο Input constant όπου δίνουμε 0.975. (δ) Στο πλαίσιο Optional storage δίνουμε t και μετά ΟΚ. Ιωάννης Ι.Γεροντίδης, Καθηγητής 113

3 Από τη γραμμή μενού επιλέγουμε Calc Calculator. 4. Στο πλαίσιο διαλόγου Calculator που εμφανίζεται: (α) Στο πλαίσιο Store result in variable: δίνουμε Lower. (β) Στo πλαίσιο Expression: πληκτρολογούμε -14.5- t *3.002 και μετά ΟΚ. 5. Από τη γραμμή μενού επιλέγουμε Calc Calculator. 6. Στο πλαίσιο διαλόγου Calculator που εμφανίζεται: (α) Στο πλαίσιο Store result in variable: δίνουμε Upper. (β) Στo πλαίσιο Expression: πληκτρολογούμε -14.5+ t *3.002 και μετά ΟΚ. 7. Από τη γραμμή μενού επιλέγουμε Data Display Data. 8. Στο πλαίσιο διαλόγου Display Data που εμφανίζεται, από τον αριστερό κατάλογο διπλοπατάμε στα Lower, Upper και t για να εμφανιστούν στο πλαίσιο Columns, constants, and matrices to display:. 9. Πατάμε ΟΚ, οπότε στο Session Window εμφανίζονται οι παρακάτω πληροφορίες: Η τιμή της κατανομής t για 8 βαθμούς ελευθερίας και 97.5% επίπεδο εμπιστοσύνης είναι 2.306. Το 95% διάστημα εμπιστοσύνης είναι (-21.461,-7.616). Ιωάννης Ι.Γεροντίδης, Καθηγητής 114

8.5 ΔΙΑΓΡΑΜΜΑ ΠΡΟΣΑΡΜΟΣΜΕΝΗΣ ΕΥΘΕΙΑΣ Για να συμπεριλάβουμε το διάγραμμα της προσαρμοσμένης ευθείας πάνω σε εκείνο της διασποράς. 1. Από τη γραμμή μενού επιλέγουμε Stat Regression Fitted Line Plot. 2. Στο πλαίσιο διαλόγου Fitted Line Plot που εμφανίζεται και από τον αριστερό κατάλογο: (α) Διπλοπατάμε στο C1 Sales για να εμφανιστεί στο πλαίσιο Response(Y): (β) Διπλοπατάμε στο C2 Price για να εμφανιστεί στο πλαίσιο Predictor(X): (γ) Πατάμε στο κουμπί Options και στο πλαίσιο διαλόγου Fitted Line Plot Options που εμφανίζεται και στο πλαίσιο Title: πληκτρολογούμε Διάγραμμα διασποράς προσαρμοσμένης ευθείας Πωλήσεων με Τιμή. (δ) Πατάμε δύο φορές ΟΚ και στο Graph Window παίρνουμε την γραφική παράσταση Ιωάννης Ι.Γεροντίδης, Καθηγητής 115

8.6 ΑΣΚΗΣΕΙΣ 1. Στο αρχείο C:\Forecasting Lab Data\Book Sales.MTW υπάρχουν δεδομένα σχετικά με τις πωλήσεις των βιβλίων σε ένα βιβλιοπωλείο σε σχέση με τον διαθέσιμο χώρο στα ράφια της βιτρίνας σε μέτρα. (α) Να κάνετε το διάγραμμα διασποράς (β) Τι είδους σχέση υπάρχει μεταξύ των μεταβλητών; (γ) Να υπολογίσετε τον συντελεστή συσχέτισης (δ) (ε) Να προσδιορίσετε την ευθεία των ελαχίστων τετραγώνων. Να δοκιμάσετε την υπόθεση σημαντικότητας για την κλίση σε επίπεδο σημαντικότητας 5% και να την ερμηνεύσετε. 2. Στο αρχείο C:\Forecasting Lab Data\Mail Order Sales.MTW υπάρχουν δεδομένα για τις πωλήσεις που έγινα ταχυδρομικά από 12 περιοχές σε σχέση με το πλήθος των καταλόγων που διανεμήθηκαν εκεί. (α) Να προσδιορίσετε αν υπάρχει μία στατιστικά σημαντική γραμμική σχέση μεταξύ των δύο μετάβλητών σε επίπεδο σημαντικότητας 5%. (β) Να προσδιορίσετε την προσαρμοσμένη ευθεία παλινδρόμησης. (γ) Να υπολογίσετε το τυπικό σφάλμα του εκτιμητή. (δ) Να κατασκευάσετε τον πίνακα ANOVA. (ε) Τι ποσοστό της μεταβλητότητας των πωλήσεων ερμηνεύεται από το πλήθος των καταλόγων που διανεμήθηκαν; (ζ) Να δοκιμάσετε την υπόθεση ότι η κλίση της ευθείας παλινδρόμησης δεν είναι 0 σε επίπεδο σημαντικότητας 5%. 3. Στο αρχείο C:\Forecasting Lab Data\Number of Defects.MTW υπάρχουν δεδομένα για το πλήθος των ελαττωματικών ανταλλακτικών της γραμμής παραγωγής μιάς βιομηχανίας σε σχέση με το μέγεθος της παρτίδας που ελέγχεται. (α) Να κάνετε το διάγραμμα διασποράς των δεδομένων. (β) Να προσαρμόσετε το απλό γραμμικό μοντέλο παλινδρόμησης. (γ) Να δοκιμάσετε την σημαντικότητα του συντελεστή κλίσης σε επίπεδο 5% και να κατασκευάσετε ένα 95% διάστημα εμπιστοσύνης. (δ) (ε) Να κατασκευάσετε τον πίνακα ANOVA. Τι ποσοστό της μεταβλητότητας των ελαττωματικών ανταλλακτικών ερμηνεύεται από το μέγεθος της αντίστοιχης παρτίδας; 4. Στο αρχείο C:\Forecasting Lab Data\Operating Expenses.MTW υπάρχουν δεδομένα για τα λειτουργικά έξοδα σε 26 ποδοσφαιρικές ομάδες σε σχέση με τα κόστη αμοιβής των αθλητών τους σε εκατοντάδες χιλιάδες. (α) Υποθέτοντας ότι υπάρχει μία γραμμική σχέση μεταξύ των δύο μεταβλητών να προσδιορίσετε την προσαρμοσμένη ευθεία. 2 (β) Να προσδιορίσετε το r και να σχολιάσετε τον βαθμό της γραμμικής σχέσης. (γ) Να δοκιμάσετε την σημαντικότητα της ευθείας παλινδρόμησης σε επίπεδο σημαντικότητας 5% και να κατασκευάσετε ένα 95% διάστημα εμπιστοσύνης για την κλίση. (δ) Μπορούμε να συμπεράνουμε, σαν γενικό κανόνα, ότι τα λειτουργικά έξοδα είναι διπλάσια από τις αμοιβές των αθλητών; Σχολιάστε. Ιωάννης Ι.Γεροντίδης, Καθηγητής 116

9. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΙΙ 9.1 ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΕΚΤΙΜΗΣΗΣ ΚΑΙ ΠΡΟΒΛΕΨΗΣ Αν το μοντέλο της γραμμικής παλινδρόμησης είναι κατάλληλο για την περιγραφή της σχέσης μεταξύ των δύο μεταβλητών Y και X, τότε η προσαρμοσμένη ευθεία μπορεί να χρησιμοποιηθεί για εκτίμηση και πρόβλεψη. Στην πρώτη περίπτωση μπορούμε να εκτιμήσουμε την μέση τιμή του Y για συγκεκριμένη τιμή του X X 0 με ένα (1 )100% διάστημα εμπιστοσύνης της μορφής Yˆ t SE( Yˆ ) όπου SE( Yˆ ) s ( / 2), d. f. 1 n 2 0 y x n ( X X ) i 1 2 ( X X ) Στην δεύτερη περίπτωση μπορούμε να προβλέψουμε την τιμή του Y για συγκεκριμένη τιμή του X X 0 με ένα (1 )100% διάστημα πρόβλεψης της μορφής Yˆ t s SE( Yˆ ). 2 2 ( / 2), d. f. y x Για να κατασκευάσουμε ένα 95% διάστημα εμπιστοσύνης για τον μέσο όγκο των πωλήσεων όταν η τιμή πώλησης είναι X 0 0.9 και ένα διάστημα πρόβλεψης για τον όγκο των πωλήσεων όταν η τιμή πώλησης είναι X 0 0.9 ανοίγουμε το αρχείο C:\Forecasting Lab Data\Milk Sales.MTW με τα δεδομένα του παραδείγματος 8.1. 1. Από τη γραμμή μενού επιλέγουμε Stat Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται και από τον αριστερό κατάλογο διπλοπατάμε στα C1 Sales και C2 Price για να εμφανιστούν στα πλαίσια Response και Predictors αντίστοιχα. 3. Πατάμε στο κουμπί Options. Στο πλαίσιο διαλόγου Regression Options που εμφανίζεται και στο πλαίσιο Prediction intervals for new observations: δίνουμε 0.9 και μετά ΟΚ. i 2 4. Επιστρέφουμε στο πλαίσιο διαλόγου Regression, όπου πατάμε στο κουμπί Results και στο πλαίσιο διαλόγου Regression Results που εμφανίζεται επιλέγουμε Regression equation, table of coefficients, s, R-squared, ans basic analysis of variance. Ιωάννης Ι.Γεροντίδης, Καθηγητής 117

4. Πατάμε δύο φορές ΟΚ και στο Session Window έχουμε τα αποτελέσματα: ΠΙΝΑΚΑΣ 9.1 Η τιμή Fit = 19.051 είναι οι εκτιμούμενες εβδομαδιαίες πωλήσεις για την τιμή πώλησης X 0 = 0.9. Ενα 95% διάστημα εμπιστοσύνης για το μέσο όγκο των πωλήσεων είναι το 95% CI = (14.817, 23.285), ενώ ένα 95% διάστημα πρόβλεψης για τον όγκο των πωλήσεων είναι το 95% PI = (11.473, 26.629). Για να πάρουμε τις λωρίδες εμπιστοσύνης και πρόβλεψης πάνω στο διάγραμμα της προσαρμοσμένης ευθείας: 1. Από τη γραμμή μενού επιλέγουμε Stat Regression Fitted Line Plot. 2. Στο πλαίσιο διαλόγου Fitted Line Plot που εμφανίζεται και από τον αριστερό κατάλογο διπλοπατάμε στα C1 Sales και C2 Price για να εμφανιστούν στα πλαίσια Response (Y): και Predictor (X): αντίστοιχα. Ιωάννης Ι.Γεροντίδης, Καθηγητής 118

3. Πατάμε στο κουμπί Options και στο πλαίσιο διαλόγου Fitted Line Plots Options που εμφανίζεται, στο πλαίσιο Display Options επιλέγουμε Display confidence interval και Display prediction interval. 4. Στο πλαίσιο Title πληκτρολογούμε Διάγραμμα προσαρμοσμένης ευθείας Πωλήσεις με Τιμή. 5. Πατάμε δύο φορές ΟΚ και στο Graph Window εμφανίζεται το διάγραμμα ΔΙΑΓΡΑΜΜΑ 9.1 Παρατηρούμε ότι οι λωρίδες εμπιστοσύνης και πρόβλεψης είναι και οι δύο στενότερες κοντά στη μέση τιμή των πωλήσεων, ενώ η λωρίδα εμπιστοσύνης είναι πιό κοντά στην προσαρμοσμένη ευθεία παλινδρόμησης απ ότι η λωρίδα πρόβλεψης. 9.2 ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΟΛΟΙΠΩΝ Η ανάλυση των υπολοίπων μας βοηθά να εντοπίσουμε πιθανές αποκλίσεις από τις υποθέσεις που διέπουν το μοντέλο της γραμμικής παλινδρόμησης. Οι υποθέσεις αυτές αφορούν αφ ενός μεν την κατανομή των σφαλμάτων (και συνεπώς των παρατηρήσεων Y ) και είναι: (α) κανονικότητα της κατανομής Ιωάννης Ι.Γεροντίδης, Καθηγητής 119

(β) σταθερή διακύμανση (γ) ανεξαρτησία αφ ετέρου δε ότι: (δ) η σχέση των X και Y είναι γραμμική Για να υπολογίσουμε τις τιμές των υπολοίπων και των προσαρμοσμένων τιμών: 1. Από τη γραμμή μενού επιλέγουμε Stat Regression Regression. 2. Στο πλαίσιο διαλόγου Regression που εμφανίζεται και από τον αριστερό κατάλογο διπλοπατάμε στα C1 Sales και C2 Price για να εμφανιστούν στα πλαίσια Response και Predictors αντίστοιχα. 3. Πατάμε στο κουμπί Storage. Στο πλαίσιο διαλόγου Regression Storage που εμφανίζεται: (α) (β) κάτω από τη στήλη Diagnostic Measures επιλέγουμε Residuals. κάτω από τη στήλη Characteristics of Estimated Equation επιλέγουμε Fits. (γ) (δ) Πατάμε ΟΚ για να επιστρέψουμε στο πλαίσιο διαλόγου Regression όπου πατάμε στο κουμπί Graphs. Στο πλαίσιο διαλόγου Regression Graphs που εμφανίζεται και κάτω από την επικεφαλίδα Residual Plots, επιλέγουμε Four in one. (ε) Πατάμε δύο φορές ΟΚ, οπότε στο Session Window έχουμε τα αποτελέσματα της ανάλυσης παλινδρόμησης. Στο Worksheet και στη στήλη C3 RESI1 εμφανίζονται οι τιμές των υπολοίπων ενώ στη στήλη C4 FITS1 εμφανίζονται οι προσαρμοσμένες τιμές Y. Τέλος στο Graph Window παίρνουμε το διάγραμμα Ιωάννης Ι.Γεροντίδης, Καθηγητής 120

ΔΙΑΓΡΑΜΜΑ 9.2 Στο διάγραμμα 9.2 η γραφική παράσταση με τίτλο Normal Probability Plot of the Residuals, έχει τα υπόλοιπα ως προς την αθροιστική κατανομή. Η προσαρμοσμένη ευθεία ανάμεσα στα υπόλοιπα εκφράζει τη γραφική παράσταση που αντιστοιχεί στην κανονική κατανομή. Κατά συνέπεια αφού τα υπόλοιπα βρίσκονται πολύ κοντά σ αυτήν την ευθεία, έχουμε την ένδειξη ότι και αυτά ακολουθούν την κανονική κατανομή. Η γραφική παράσταση με τίτλο Histogram of the Residuals δίνει πληροφορίες για την κανονικότητα των υπολοίπων εφ όσον το σχήμα του είναι σαν καμπάνα. Στην περίπτωση του παραδείγματος το ιστόγραμμα είναι συμμετρικό χωρίς να είναι καμπάνα, γεγονός που ωφείλεται στο μικρό μέγεθος του δείγματος (μόνο 10 παρατηρήσεις). Η γραφική παράσταση με τίτλο Residuals Versus the Fitted Values, έχει τα υπόλοιπα ως προς τις προσαρμοσμένες τιμές. Στην περίπτωση του παραδείγματος τα υπόλοιπα είναι ομοιόμορφα διασκορπισμένα σε μία οριζόνται λωρίδα γύρω από το 0 έτσι ώστε ότι οι τιμές τους δεν μεταβάλλονται μαζί με εκείνες των προσαρμοσμένων τιμών. Το γεγονός αυτό μας οδηγεί στα παρακάτω δύο συμπεράσματα: (α) (β) η σχέση μεταξύ των Y και X είναι γραμμική η διακύμανση των σφαλμάτων είναι σταθερή Τέλος η γραφική παράσταση με τίτλο Residuals Versus the Order of the Data; έχει τα υπόλοιπα ως προς το χρόνο και είναι χρήσιμη στην περίπτωση που οι παρατηρήσεις Y αποτελούν χρονοσειρά. Στο παράδειγμα μας το διάγραμμα αυτό δεν έχει κάποια ιδιαίτερη σημασία. 9.3 ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ Όταν το διάγραμμα διασποράς δείχνει μη γραμμική σχέση μεταξύ των Y και X, υπάρχουν δύο τρόποι αντιμετώπισης της κατάστασης. Ο πρώτος είναι να προσαρμόσουμε στα δεδομένα μία καμπυλόγραμμη συνάρτηση παλινδρόμησης. Ο δεύτερος είναι να μετασχηματίσουμε τη μεταβλητή X σε μία άλλη έτσι ώστε η Ιωάννης Ι.Γεροντίδης, Καθηγητής 121

σχέση της νέας ανεξάρτητης μεταβλητής με την Y να είναι γραμμική. Υπάρχουν τέσσερεις βασικοί μετασχηματισμοί που χρησιμοποιούνται και είναι: (α) λογάριθμος log( X ) (β) τετραγωνική ρίζα X (γ) 2 τετραγωνισμός X (δ) αντιστροφή 1 X Γενικότερα μπορούμε να μετασχηματίσουμε είτε την μεταβλητή X, είτε την Y η είτε και τις δύο μαζί, ανάλογα με την περίπτωση προκειμένου να επιτύχουμε μία γραμμική σχέση. Ένας εμπειρικός κανόνας επιλογής δίνεται παρακάτω. Αν η καμπυλόγραμμη σχέση είναι της μορφής όπως στο διάγραμμα 9.3 ΔΙΑΓΡΑΜΜΑ 9.3 τότε προκειμένου η καμπύλη να γίνει ευθεία θα πρέπει να σηκώσουμε το δεξιό της άκρο προς τα πάνω (κίνηση πάνω στο άξονα X ) που σημαίνει ότι θα μετασχηματίσουμε την μεταβλητή X. Αν η καμπυλόγραμμη σχέση είναι της μορφής όπως στο διάγραμμα 9.4 ΔΙΑΓΡΑΜΜΑ 9.4 τότε προκειμένου η καμπύλη να γίνει ευθεία θα πρέπει να χαμηλώσουμε το δεξιό της άκρο προς τα κάνω (κίνηση πάνω στο άξονα Y ) που σημαίνει ότι θα μετασχηματίσουμε την μεταβλητή Y. Ιωάννης Ι.Γεροντίδης, Καθηγητής 122

Αν η καμπυλόγραμμη σχέση είναι της μορφής όπως στο διάγραμμα 9.5 ΔΙΑΓΡΑΜΜΑ 9.5 τότε προκειμένου η καμπύλη να γίνει ευθεία θα πρέπει να χαμηλώσουμε και τα δύο άκρα της προς τα κάνω (κίνηση πάνω στους άξονες X και Y ) που σημαίνει ότι θα μετασχηματίσουμε και τις δύο μεταβλητές. Παράδειγμα 9.1 Στο αρχείο C:\Forecasting Lab Data\Hardware Sales.MTW υπάρχουν 14 παρατηρήσεις για τις μηνιαίες πωλήσεις Y (C1 Sales) σε υπολογιστές μιάς αλυσίδας καταστημάτων υψηλής τεχνολογίας, σε σχέση με τις μηνιαίες δαπάνες X (C2 Expenditures) για διαφήμιση. Επίσης στις στήλες C3-C6 υπάρχουν οι μετασχηματισμένες τιμές της X σύμφωνα με τους μετασχηματισμούς (α)-(δ). Από το διάγραμμα διασποράς (διάγραμμα 9.6) έχουμε μία πρώτη ένδειξη ότι η σχέση μεταξύ των Y και X δεν είναι γραμμική. ΔΙΑΓΡΑΜΜΑ 9.6 Από την ανάλυση της παλινδρόμησης στο διάγραμμα 9.6 διαπιστώνουμε ότι η προσαρμοσμένη ευθεία ερμηνεύει περίπου το 78% της ολικής μεταβλητότητας ενώ από τη γραφική παράσταση των υπολοίπων ως προς τις προσαρμοσμένες τιμές (διάγραμμα 9.7) προκύπτει ότι αυτά δεν είναι ομοιόμορφα κατανεμημένα γύρω από το 0 και επομένως η γραμμική σχέση μεταξύ των Y και X είναι ανεπαρκής. Ιωάννης Ι.Γεροντίδης, Καθηγητής 123

ΔΙΑΓΡΑΜΜΑ 9.7 Στη συνέχεια και με βάση τον εμπειρικό κανόνα εφαρμόζουμε τον λογαριθμικό μετασχηματισμό στην X και από το διάγραμμα διασποράς (διάγραμμα 9.8) βλέπουμε ότι η σχέση εξακολουθεί να παραμένει καμπυλόγραμμη ΔΙΑΓΡΑΜΜΑ 9.8 Κατόπιν εφαρμόζουμε τον μετασχηματισμό X και από το διάγραμμα διασποράς (διάγραμμα 9.9) βλέπουμε ότι η σχέση εξακολουθεί να παραμένει καμπυλόγραμμη. ΔΙΑΓΡΑΜΜΑ 9.9 Ιωάννης Ι.Γεροντίδης, Καθηγητής 124

2 Κατόπιν εφαρμόζουμε τον μετασχηματισμό X και από το διάγραμμα διασποράς (διάγραμμα 9.10) βλέπουμε ότι η σχέση εξακολουθεί να παραμένει καμπυλόγραμμη. ΔΙΑΓΡΑΜΜΑ 9.10 Τέλος εφαρμόζουμε τον μετασχηματισμό 1/ X και από το διάγραμμα διασποράς 2 (διάγραμμα 9.11) βλέπουμε ότι η σχέση είναι τώρα γραμμική με r 98.1. ΔΙΑΓΡΑΜΜΑ 9.11 Τέλος από τη γραφική παράσταση των υπολοίπων (διάγραμμα 9.12) προκύπτει ότι το γραμμικό μοντέλο περιγράφει ικανοποιητικά τις μεταβλητές Y και 1/ X. ΔΙΑΓΡΑΜΜΑ 9.12 Ιωάννης Ι.Γεροντίδης, Καθηγητής 125

9.4 ΑΣΚΗΣΕΙΣ 1. Στο αρχείο C:\Forecasting Lab Data\Book Sales.MTW υπάρχουν δεδομένα σχετικά με τις εβδομαδιαίες πωλήσεις των βιβλίων σε ένα βιβλιοπωλείο σε σχέση με τον διαθέσιμο χώρο στα ράφια της βιτρίνας σε μέτρα. (α) (β) (γ) Να προσαρμόσετε το απλό γραμμικό μοντέλο παλινδρόμησης. Να πάρετε το διάγραμμα των υπολοίπων ως προς τις προσαρμοσμένες τιμές και να διατυπώσετε το συμπέρασμά σας ως προς την καταλληλότητα του γραμμικού μοντέλου για τα δεδομένα αυτά. Να προβλέψετε τις πωλήσεις των βιβλίων κατά την εβδομάδα που θα διατεθεί χώρος 4 μέτρων στη βιτρίνα με ένα 95% διάστημα πρόβλεψης. 2. Στο αρχείο C:\Forecasting Lab Data\Mail Order Sales.MTW υπάρχουν δεδομένα για τις πωλήσεις που έγινα ταχυδρομικά από 12 περιοχές σε σχέση με το πλήθος των καταλόγων που διανεμήθηκαν εκεί. (α) Να προσδιορίσετε την προσαρμοσμένη ευθεία παλινδρόμησης. (β) (γ) Να διερευνήσετε την κανονικότητα της κατανομής των σφαλμάτων. Να προβλέψετε τις πωλήσεις που θα γίνουν σε περίπτωση που διανεμηθούν 10000 κατάλογοι με ένα 95% διάστημα πρόβλεψης. 3. Στο αρχείο C:\Forecasting Lab Data\Number of Defects.MTW υπάρχουν δεδομένα για το πλήθος των ελαττωματικών ανταλλακτικών της γραμμής παραγωγής μιάς βιομηχανίας σε σχέση με το μέγεθος της παρτίδας που ελέγχεται. (α) Να προσαρμόσετε το απλό γραμμικό μοντέλο παλινδρόμησης. (β) (γ) (δ) (ε) Να εξετάστε τα υπόλοιπα ως προς τις προσαρμοσμένες τιμές. Αφού προσδιορίσετε ότι ένα καπυλόγραμμο μοντέλο είναι κατάλληλο για τα δεδομένα, να προσαρμόσετε την ευθεία παλινδρόμησης σε κάποιο μετασχηματισμό της ανεξάρτητης μεταβλητής. Να δοκιμάσετε την υπόθεση ότι η κλίση της ευθείας παλινδρόμησης για τη μετασχηματισμένη μεταβλητή δεν είναι 0 σε επίπεδο σημαντικότητας 5%. Να πάρετε και να σχολιάσετε το διάγραμμα των υπολοίπων ως προς την ανεξάρτητα μεταβλητή. 4. Στο αρχείο C:\Forecasting Lab Data\Operating Expenses.MTW υπάρχουν δεδομένα για τα λειτουργικά έξοδα σε 26 ποδοσφαιρικές ομάδες σε σχέση με τα κόστη αμοιβής των αθλητών τους σε εκατοντάδες χιλιάδες. (α) (β) (γ) (γ) Να προσαρμόσετε το απλό γραμμικό μοντέλο παλινδρόμησης. Να υπολογίσετε μία εκτίμηση για τη μέση τιμή των λειτουργικών εξόδων στην περίπτωση που τα κόστη αμοιβής των αθλητών είναι 30.5 και να κατασκευάσετε ένα 95% διάστημα εμπιστοσύνης. Να ζωγραφίσετε τις λωρίδες εκτίμησης και πρόβλεψης πάνω στο διάγραμμα της προσαρμοσμένης ευθείας στην περίπτωση που τα κόστη αμοιβής των αθλητών είναι 30.5 Να διερευνήσετε την σταθερότητα της διακύμανσης των σφαλμάτων. Ιωάννης Ι.Γεροντίδης, Καθηγητής 126