Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση



Σχετικά έγγραφα
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Εισόδημα Κατανάλωση

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Χ. Εμμανουηλίδης, 1

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

9. Παλινδρόμηση και Συσχέτιση

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Απλή Γραμμική Παλινδρόμηση II

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Στατιστική Ι. Ανάλυση Παλινδρόμησης

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Γ. Πειραματισμός Βιομετρία

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Κεφάλαιο 11 Εισαγωγή στον Έλεγχο Υποθέσεων

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Πολλαπλή παλινδρόμηση (Multivariate regression)

x y max(x))

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Εφαρμοσμένη Στατιστική

Στατιστική Συμπερασματολογία

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Θέμα: Ενδεικτικό Θέμα εξετάσεων: Μέτρα θέσης Παλινδρόμηση

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

Ενδεικτικές ασκήσεις ΔΙΠ 50

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) E04 R SQUARE (i) PARAMETER

Απλή Παλινδρόμηση και Συσχέτιση

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Γ. Πειραματισμός - Βιομετρία

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΠΑΛΙΝΔΡΟΜΗΣΗ. Απλή Παλινδρόμηση. (Όγκος πωλήσεων = α +b έξοδα διαφήμησης +e ) Εκτίμηση Απλής Παλινδρόμησης. α= εκτίμηση της τεταγμένης για χ=0

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Αναλυτική Στατιστική

Εισαγωγή στην Εκτιμητική

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Άσκηση 1. Πληθυσμός (Χ i1 )

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Κεφάλαιο 9. Έλεγχοι υποθέσεων

3η Ενότητα Προβλέψεις

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Kruskal-Wallis H

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Transcript:

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1

Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης είναι το πρώτο εργαλείο που θα μελετήσουμε. Η ανάλυση παλινδρόμησης χρησιμοποιείται στην πρόβλεψη της τιμής μιας μεταβλητής (εξαρτημένη μεταβλητή) με βάση άλλες μεταβλητές (ανεξάρτητες μεταβλητές). Εξαρτημένη μεταβλητή: συμβολίζεται με Y Ανεξάρτητες μεταβλητές: συμβολίζονται με X 1, X 2,, X k Copyright 2009 Cengage Learning 16.2

Ανάλυση Συσχέτισης Εάν ενδιαφερόμαστε να καθορίσουμε μόνο εάν υπάρχει σχέση μεταξύ των μεταβλητών, χρησιμοποιούμε την ανάλυση συσχέτισης, μια μέθοδος που εισήχθηκε ενωρίτερα. Το κεφάλαιο αυτό θα εξετάσει τη σχέση μεταξύ δύο μεταβλητών, που μερικές φορές ονομάζεται απλή γραμμική παλινδρόμηση. Οι μαθηματικές εξισώσεις που περιγράφουν αυτές τις σχέσεις ονομάζονται μοντέλα, και είναι δύο ειδών: αιτιοκρατικά/ντετερμινιστικά ή πιθανοθεωρητικά. Copyright 2009 Cengage Learning 16.3

Είδη Μοντέλων Αιτιοκρατικό/Ντετερμινιστικό Μοντέλο: μια εξίσωση ή ομάδα εξισώσεων που μας επιτρέπουν να καθορίσουμε πλήρως την τιμή της εξαρτημένης μεταβλητής από τις τιμές των ανεξάρτητων μεταβλητών. Πιθανοθεωρητικό Μοντέλο: μια μέθοδος που χρησιμοποιείται στον εντοπισμό της τυχαιότητας που αποτελεί μέρος της διαδικασίας της πραγματικής ζωής. Π.χ. όλες οι κατοικίες του ιδίου μεγέθους (μετρούμενες σε τετραγωνικά μέτρα) πωλούνται ακριβώς στην ίδια τιμή; Copyright 2009 Cengage Learning 16.4

Ένα Μοντέλο Για να δημιουργήσουμε ένα πιθανοθεωρητικό μοντέλο ξεκινάμε από ένα αιτιοκρατικό μοντέλο που προσεγγίζει τη σχέση που θέλουμε να «μοντελοποιήσουμε» και προσθέτει ένα τυχαίο όρο που μετρά το σφάλμα της αιτιοκρατικής συνιστώσας Αιτιοκρατικό Μοντέλο: Το κόστος οικοδόμησης μιας νέας κατοικίας είναι περίπου 100 ευρώ ανά τετραγωνικό μέτρο και τα περισσότερα οικόπεδα πωλούνται γύρω στα 100,000 ευρώ. Επομένως η κατά προσέγγιση τιμή πώλησης (y) είναι: y = 100,000 + 100x (όπου x είναι το μέγεθος της κατοικίας σε τετραγωνικά μέτρα). Copyright 2009 Cengage Learning 16.5

Ένα Μοντέλο Ένα μοντέλο της σχέσης μεταξύ του μεγέθους κατοικίας (ανεξάρτητη μεταβλητή) και της τιμής της κατοικίας (εξαρτημένη μεταβλητή) θα ήταν: Τιμή κατοικίας Τα περισσότερα οικόπεδα πωλούνται έναντι 100,000 ευρώ Μέγεθος κατοικίας Στο μοντέλο αυτό, η τιμή της κατοικίας καθορίζεται πλήρως από το μέγεθος. Copyright 2009 Cengage Learning 16.6

Ένα Μοντέλο Στην πραγματική ζωή, όμως, το κόστος κατοικίας ποικίλει ακόμη και ανάμεσα σε κατοικίες ιδίου μεγέθους: Τιμή κατοικίας Κατώτερη έναντι ανώτερης μεταβλητότητας Τιμή κατοικίας = 100,000 + 100(εμβ.) + Μέγεθος κατοικίας Ίδια επιφάνεια, αλλά διαφορετικά σημεία τιμής (π.χ. επιλογές διακόσμησης, αναβαθμισμένοι χώροι, θέση οικοπέδου ) x Copyright 2009 Cengage Learning 16.7

Τυχαίος Όρος Παρουσιάζουμε τώρα την τιμή μιας κατοικίας ως συνάρτηση του μεγέθους της σε αυτό το Πιθανοθεωρητικό Μοντέλο: y = 100,000 + 100x + Όπου (ελληνικό γράμμα έψιλον) είναι ο τυχαίος όρος (επίσης γνωστός και ως μεταβλητή σφάλματος). Είναι η διαφορά μεταξύ της πραγματικής τιμής πώλησης και της εκτιμώμενης τιμής με βάση το μέγεθος της κατοικίας. Η τιμής μπορεί να ποικίλει από πώληση σε πώληση, ακόμη κι αν η επιφάνεια (δηλαδή, x) παραμένει η ίδια. Copyright 2009 Cengage Learning 16.8

Μοντέλο Απλής Γραμμικής Παλινδρόμησης Ένα μοντέλο ευθείας γραμμής με μια μόνο ανεξάρτητη μεταβλητή ονομάζεται γραμμικό μοντέλο πρώτης τάξης ή μοντέλο απλής γραμμικής παλινδρόμησης. Δίδεται από την εξίσωση: εξαρτημένη μεταβλητή ανεξάρτητη μεταβλητή ίχνος στο άξονα y κλίση της ευθείας μεταβλητή σφάλματος Copyright 2009 Cengage Learning 16.9

Μοντέλο Απλής Γραμμικής Παλινδρόμησης Σημειώστε ότι τόσο το όσο και το είναι παράμετροι του πληθυσμού που συνήθως είναι άγνωστοι και άρα εκτιμώμενοι από τα δεδομένα. y ύψος μήκος =κλίση (=ύψος/μήκος) = ίχνος στον άξονα y x Copyright 2009 Cengage Learning 16.10

Εκτίμηση των Συντελεστών Με σχεδόν τον ίδιο τρόπου που βασίζουμε εκτιμήσεις του µ στο x, εκτιμούμε το β 0 χρησιμοποιώντας το b 0 και το β 1 χρησιμοποιώντας το b 1, το ίχνος στον άξονα y και η κλίση (αντιστοίχως) της ευθείας ελάχιστων τετραγώνων ή της ευθείας παλινδρόμησης δίδεται από τον τύπο: (Θυμηθείτε: αυτή είναι μια εφαρμογή της μεθόδου ελάχιστων τετραγώνων και παράγει μια ευθεία γραμμή που ελαχιστοποιεί το άθροισμα των τετραγώνων των διαφορών μεταξύ των σημείων και της ευθείας) Copyright 2009 Cengage Learning 16.11

Παράδειγμα 16.1 Τα ετήσια πριμ απόδοσης (σε χιλιάδες ευρώ) έξι υπαλλήλων με διαφορετικά χρόνια υπηρεσίας καταγράφονται παρακάτω. Θέλουμε να καθορίσουμε την σχέση ευθείας γραμμής μεταξύ των ετήσιων πριν και των ετών υπηρεσίας. Έτη υπηρεσίας x 1 2 3 4 5 6 Ετήσιο πριμ y 6 1 9 5 17 12 Copyright 2009 Cengage Learning 16.12

Ευθεία Ελάχιστων Τετραγώνων Παράδειγμα 16.1 Οι διαφορές αυτές ονομάζονται υπόλοιπα Copyright 2009 Cengage Learning 16.13

Παράδειγμα 16.2 Οι έμποροι αυτοκινήτων στη Βόρεια Αμερική χρησιμοποιούν το «Κόκκινο Βιβλίο» για να καθορίσουν την αξία των μεταχειρισμένων αυτοκινήτων που παίρνουν με ανταλλαγή από τους πελάτες τους όταν αυτοί αγοράζουν ένα καινούργιο αυτοκίνητο. Το βιβλίο αυτό, που εκδίδεται κάθε μήνα, καταγράφει τις εμπορικές τιμές όλων των βασικών μοντέλων αυτοκινήτων. Παρέχει εναλλακτικές τιμές για κάθε μοντέλο σύμφωνα με την κατάστασή του και τα προαιρετικά χαρακτηριστικά του. Οι τιμές καθορίζονται με βάση τον μέσο όρο τιμής σε πρόσφατες δημοπρασίες μεταχειρισμένων αυτοκινήτων, που αποτελούν την πηγή προσφοράς για πολλούς εμπόρους μεταχειρισμένων αυτοκινήτων. Copyright 2009 Cengage Learning 16.14

Παράδειγμα 16.2 Ωστόσο, το Κόκκινο Βιβλίο δεν δείχνει την τιμή που καθορίζεται από την ένδειξη του χιλιομετρητή, παρά το γεγονός ότι ένας κρίσιμος παράγοντας για τους αγοραστές μεταχειρισμένων αυτοκινήτων είναι πόσα χιλιόμετρα έχει διανύσει το αυτοκίνητο. Για να διερευνήσει αυτό το ζήτηση, ένας έμπορος μεταχειρισμένων αυτοκινήτων επέλεξε ένα τυχαίο δείγμα 100 αυτοκινήτων Toyota Camrys ηλικίας τριών ετών, τα οποία πωλήθηκαν σε δημοπρασία κατά τη διάρκεια του περασμένου μήνα. Ο έμπορος κατέγραψε την τιμή (σε χιλιάδες δολάρια) και τον αριθμό των μιλίων (σε χιλιάδες) του χιλιομετρητή. (Αρχείο Xm16-02). Ο έμπορος θέλει να βρει τη γραμμή παλινδρόμησης. Copyright 2009 Cengage Learning 16.15

Παράδειγμα 16.2 Κλικ Data, Data Analysis, Regression Copyright 2009 Cengage Learning 16.16

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Παράδειγμα 16.2 A B C D E F SUMMARY OUTPUT Regression Statistics Multiple R 0.8052 R Square 0.6483 Adjusted R Square 0.6447 Standard Error 0.3265 Observations 100 ANOVA df SS MS F Significance F Regression 1 19.26 19.26 180.64 5.75E-24 Residual 98 10.45 0.11 Total 99 29.70 Coefficients Standard Error t Stat P-value Intercept 17.25 0.182 94.73 3.57E-98 Odometer -0.0669 0.0050-13.44 5.75E-24 Copyright 2009 Cengage Learning 16.17

Παράδειγμα 16.2 ΕΡΜΗΝΕΙΑ Όπως ίσως θα αναμένατε με τα μεταχειρισμένα αυτοκίνητα Ο συντελεστής κλίσης, b 1, είναι 0.0669, δηλαδή, κάθε επιπλέον μίλι στην ένδειξη του χιλιομετρητή μειώνει την τιμή κατά $0.0669 Το ίχνος στον άξονα y, b 0, είναι 17,250. Η ερμηνεία μας θα ήταν ότι όταν x = 0 (το αυτοκίνητο δεν διένυσε κανένα μίλι) η τιμή πώλησης είναι $17,250. Ωστόσο, δεν έχουμε δεδομένα για αυτοκίνητα με λιγότερα από 19,100 διανυθέντα μίλια, επομένως δεν είναι μια σωστή αξιολόγηση. Copyright 2009 Cengage Learning 16.18

Παράδειγμα 16.2 ΕΡΜΗΝΕΙΑ Επιλέγοντας «line fit plots» [διαγράμμα γραμμής προσαρμογής] στο Regression dialog box [πλαίσιο διαλόγου παλινδρόμησης], δημιουργούμε ένα διάγραμμα διασποράς των δεδομένων και την γραμμή παλινδρόμησης Copyright 2009 Cengage Learning 16.19

Απαιτούμενες Προϋποθέσεις/Συνθήκες Για να ισχύουν αυτοί οι μέθοδοι παλινδρόμησης πρέπει να ικανοποιούνται οι εξής τέσσερις συνθήκες μεταβλητής σφάλματος ( ): Η κατανομή πιθανοτήτων της είναι κανονική Ο μέσος της κατανομής είναι μηδέν, δηλαδή Ε ( ) = 0 Η τυπική απόκλιση της πρέπει να είναι σταθερή για κάθε τιμή του x Η τιμή του σφάλματος για κάθε συγκεκριμένη τιμή του y είναι ανεξάρτητη από την τιμή του σφάλματος για κάθε άλλη τιμή του y. Copyright 2009 Cengage Learning 16.20

Αξιολόγηση Μοντέλου Η μέθοδος των ελάχιστων τετραγώνων θα παράγει πάντα μια ευθεία γραμμή, ακόμη κι αν δεν υπάρχει σχέση μεταξύ των μεταβλητών, ή αν η σχέση είναι κάτι άλλο παρά γραμμική. Επομένως, εκτός από τον καθορισμό των συντελεστών της γραμμής ελάχιστων τετραγώνων, θα πρέπει να το αξιολογήσουμε για να δούμε πόσο καλά «ταιριάζει» στα δεδομένα. Θα εξετάσουμε αυτές τις μεθόδους αξιολόγησης τώρα. Βασίζονται στο άθροισμα των τετραγώνων σφάλματος (SSE). Copyright 2009 Cengage Learning 16.21

Άθροισμα Τετραγώνων Σφάλματος (SSE) Το άθροισμα των τετραγώνων σφάλματος υπολογίζεται ως εξής: n 2 SSE (y ŷ i 1 i i) Και χρησιμοποιείται στον υπολογισμό του τυπικού σφάλματος εκτίμησης: Αν είναι μηδέν, τότε όλα τα σημεία είναι πάνω στη γραμμή παλινδρόμησης. Copyright 2009 Cengage Learning 16.22

Τυπικό Σφάλμα Εκτίμησης Εάν το s ε είναι μικρό, η αντιστοιχία είναι εξαιρετική και το γραμμικό μοντέλο θα πρέπει να χρησιμοποιείται στη πρόβλεψη. Εάν το s ε είναι μεγάλο, το μοντέλο είναι ανεπαρκές Τι είναι όμως μικρό και τι είναι μεγάλο; Copyright 2009 Cengage Learning 16.23

Τυπικό Σφάλμα Εκτίμησης Κρίνετε την τιμή του συγκρίνοντάς την με τον δειγματικό μέσο της εξαρτημένης μεταβλητής ( ). Στο παράδειγμα αυτό, s ε = 0.3265 και = 14.841 έτσι (μιλώντας σχετικά) φαίνεται να είναι «μικρή», επομένως το μοντέλο γραμμικής παλινδρόμησης της τιμής του αυτοκινήτου ως συνάρτηση της ένδειξης του χιλιομετρητή είναι «καλό». Copyright 2009 Cengage Learning 16.24

Έλεγχος της Κλίσης Εάν δεν υπάρχει γραμμική σχέση μεταξύ δύο μεταβλητών, θα αναμέναμε η γραμμή παλινδρόμησης να είναι οριζόντια, δηλαδή να έχει μηδενική κλίση. Θέλουμε να δούμε εάν υπάρχει γραμμική σχέση, δηλαδή θέλουμε να δούμε εάν η κλίση (β 1 ) είναι κάτι άλλο πλην μηδενικής. Η υπόθεση έρευνας γίνεται: H 1 : β 1 0 Επομένως η μηδενική υπόθεση γίνεται: H 0 : β 1 = 0 Copyright 2009 Cengage Learning 16.25

Έλεγχος της Κλίσης Μπορούμε να εφαρμόσουμε αυτόν τον έλεγχο για να δοκιμάσουμε τις υποθέσεις μας: όπου είναι η τυπική απόκλιση του b 1, οριζόμενη ως: Αν η μεταβλητή σφάλματος ( ) έχει κανονική κατανομή, ο έλεγχος έχει μια κατανομή Student t με n 2 βαθμούς ελευθερίας. Η περιοχή απόρριψης εξαρτάται από το εάν διενεργούμε έναν έλεγχο ενός ή δύο άκρων (ο έλεγχος δύο άκρων είναι ο πιο συνήθης). Copyright 2009 Cengage Learning 16.26

Παράδειγμα 16.4 Δοκιμάστε να καθορίσετε εάν υπάρχει γραμμική σχέση μεταξύ της τιμής και των ενδείξεων του χιλιομετρητή (με 5% στάθμη εμπιστοσύνης) Θέλουμε να ελέγξουμε: H 1 : β 1 0 H 0 : β 1 = 0 (εάν η μηδενική υπόθεση είναι αληθής, δεν υπάρχει γραμμική σχέση) Η περιοχή απόρριψης είναι : Copyright 2009 Cengage Learning 16.27

Παράδειγμα 16.4 ΥΠΟΛΟΓΙΣΜΟΣ Υπολογίζουμε το t με το χέρι ή παραπέμπουμε στο αποτέλεσμα του Excel. τιμή-p Βλέπουμε ότι ο έλεγχος t για «χιλιομετρητή» Σύγκριση (δηλαδή, η κλίση b 1 ) είναι 13.49, που είναι μεγαλύτερη από το t κρίσιμο = 1.984. Σημειώνουμε επίσης ότι η τιμή-p είναι 0,000. Υπάρχουν συντριπτικά στοιχεία για να συμπεράνουμε ότι υπάρχει γραμμική σχέση μεταξύ ένδειξης χιλιομετρητή και τιμής. Copyright 2009 Cengage Learning 16.28

Έλεγχος της Κλίσης Εάν θέλουμε να ελέγξουμε την ύπαρξη θετικών ή αρνητικών γραμμικών σχέσεων διενεργούμε ελέγχους ενός άκρου, δηλαδή η υπόθεση έρευνας γίνεται: ή H 1 : β 1 < 0 (έλεγχος αρνητικής κλίσης) H 1 : β 1 >0 (έλεγχος θετικής κλίσης) Φυσικά, η μηδενική υπόθεση παραμένει: H 0 : β 1 = 0. Copyright 2009 Cengage Learning 16.29

Συντελεστής Προσδιορισμού Οι μέχρι τώρα έλεγχοι έχουν δείξει εάν υπάρχει μια γραμμική σχέση. Είναι επίσης χρήσιμο να μετρήσουμε την ισχύ της σχέσης. Αυτό γίνεται με τον υπολογισμό του συντελεστή προσδιορισμού R 2. Ο συντελεστής προσδιορισμού είναι το τετράγωνο του συντελεστή συσχέτισης (r), επομένως R 2 = (r) 2 Copyright 2009 Cengage Learning 16.30

Συντελεστής Προσδιορισμού Μπορούμε να χωρίσουμε την απόκλιση y σε δύο μέρη: Απόκλιση y = SSE + SSR Το SSE Sum of Squares Error [Άθροισμα Τετραγώνων Σφάλματος] μετρά το μέγεθος της μεταβλητότητας στον y που παραμένει ανεξήγητο (π.χ. λόγω του σφάλματος) Το SSR Sum of Squares Regression [Άθροισμα Τετραγώνων Παλινδρόμησης] μετρά το μέγεθος της μεταβλητότητας στον y που εξηγείται από την μεταβλητότητα στην ανεξάρτητη μεταβλητή x. Copyright 2009 Cengage Learning 16.31

Συντελεστής Προσδιορισμού ΥΠΟΛΟΓΙΣΜΟΣ Μπορούμε να τον υπολογίσουμε με το χέρι ή με Excel Copyright 2009 Cengage Learning 16.32

Συντελεστής Προσδιορισμού ΕΡΜΗΝΕΙΑ Ο R 2 έχει μια τιμή 0,6483. Αυτό σημαίνει ότι το 64,83% της μεταβλητότητας των τιμών πώλησης σε δημοπρασία (y) εξηγείται από την μεταβλητότητα στις ενδείξεις χιλιομετρητών (x). Το εναπομένον 35,17% είναι ανεξήγητο, π.χ. λόγω σφάλματος. Γενικώς, όσο υψηλότερη είναι η τιμή του R 2, τόσο καλύτερα ταιριάζει το μοντέλο στα δεδομένα. R 2 = 1: Τέλεια αντιστοιχία μεταξύ της γραμμής και των σημείων δεδομένων. R 2 = 0: Δεν υπάρχει γραμμική σχέση μεταξύ x και y. Copyright 2009 Cengage Learning 16.33

Περισσότερα για το Αποτέλεσμα του Excel Ένας πίνακας (ANOVA) ανάλυσης διασποράς για το μοντέλο απλής γραμμικής παλινδρόμησης μπορεί να έχει την εξής μορφή: Πηγή Βαθμοί ελευθερίας Άθροισμα τετραγώνων Μέσα τετράγωνα Έλεγχος F Παλινδρόμηση 1 SSR MSR = SSR/1 F=MSR/M SE Σφάλμα n 2 SSE MSE = SSE/(n 2) Σύνολο n 1 Μεταβλητότητα y Copyright 2009 Cengage Learning 16.34

Συντελεστής Προσδιορισμού Μπορούμε να χρησιμοποιήσουμε τον συντελεστή συσχέτισης (που είδαμε ενωρίτερα) για να ελέγξουμε την ύπαρξη γραμμικής σχέσης μεταξύ δύο μεταβλητών. Θυμηθείτε: Το εύρος του συντελεστή συσχέτισης είναι μεταξύ 1 και +1. Εάν r = 1 (αρνητική συσχέτιση) ή r = +1 (θετική συσχέτιση) όλα τα σημεία βρίσκονται πάνω στην γραμμή παλινδρόμησης. Εάν r = 0 δεν υπάρχει γραμμικό μοτίβο Copyright 2009 Cengage Learning 16.35

Συντελεστής Προσδιορισμού Ο συντελεστής συσχέτισης πληθυσμού συμβολίζεται με (rho) Υπολογίζουμε την τιμή του από τα δεδομένα του δείγματος με τον συντελεστή συσχέτισης δείγματος: Ο έλεγχος για το εάν = 0 είναι: όπου η κατανομή δειγματοληψίας είναι η κατανομή Student t με n 2 βαθμούς ελευθερίας. Copyright 2009 Cengage Learning 16.36

Παράδειγμα 16.6 Μπορούμε να διενεργήσουμε τον έλεγχο t του συντελεστή συσχέτισης ως ένα εναλλακτικό μέσο προσδιορισμού του εάν μεταξύ της ένδειξης χιλιομετρητή και της τιμής πώλησης στη δημοπρασία υπάρχει γραμμική σύνδεση. Η υπόθεση έρευνας είναι: H 1 : ρ 0 (δηλαδή, υπάρχει γραμμική σχέση) και η μηδενική υπόθεση είναι: H 0 : ρ = 0 (δηλαδή, δεν υπάρχει γραμμική σχέση όταν ρ = 0) Copyright 2009 Cengage Learning 16.37

Παράδειγμα 16.6 ΥΠΟΛΟΓΙΣΜΟΣ Ήδη δείξαμε ότι: Άρα υπολογίζουμε τον συντελεστή συσχέτισης ως εξής: και η τιμή του ελέγχου μας γίνεται: Copyright 2009 Cengage Learning 16.38

Παράδειγμα 16.6 ΥΠΟΛΟΓΙΣΜΟΣ Μπορούμε επίσης να χρησιμοποιήσουμε Excel > Add-Ins > Data Analysis Plus και το εργαλείο Correlation (Pearson) για να έχουμε: Μπορούμε επίσης να διενεργήσουμε έναν έλεγχο ενός άκρου για θετικές ή αρνητικές γραμμικές σχέσεις τιμή-p σύγκριση Και πάλι, απορρίπτουμε τη μηδενική υπόθεση (ότι δεν υπάρχει γραμμικής συσχέτιση) υπέρ της εναλλακτικής υπόθεσης (ότι οι δύο μεταβλητές μας συνδέονται όντως με ένα γραμμικό τρόπο). Copyright 2009 Cengage Learning 16.39

Χρήση της Εξίσωσης Παλινδρόμησης Θα μπορούσαμε να χρησιμοποιήσουμε την εξίσωση παλινδρόμησης: y = 17.250 0.0669x Για να προβλέψουμε την τιμή πώλησης ενός αυτοκινήτου με ένδειξη χιλιομετρητή 40 (.000) μίλια: y = 17.250 0.0669x = 17.250 0.0669(40) = 14,574 Αυτή την τιμή ($14,574) την ονομάζουμε σημειακή πρόβλεψη. Οι πιθανότητες όμως είναι η πραγματική τιμή να είναι διαφορετική, επομένως μπορούμε να υπολογίσουμε την τιμή πώλησης με όρους ενός διαστήματος. Copyright 2009 Cengage Learning 16.40

Διάστημα Πρόβλεψης Το διάστημα πρόβλεψης χρησιμοποιείται όταν θέλουμε να προβλέψουμε μια συγκεκριμένη τιμή της εξαρτημένης μεταβλητής, με δεδομένη μια συγκεκριμένη τιμή της ανεξάρτητης μεταβλητής: (x g είναι η δεδομένη τιμή της ανεξάρτητης μεταβλητής x) Copyright 2009 Cengage Learning 16.41

Διάστημα Πρόβλεψης Πρόβλεψη τιμής πώλησης ενός Camry ηλικίας 3 ετών με 40,000 μίλια στον χιλιομετρητή (x g = 40) Προβλέπουμε μια τιμή πώλησης μεταξύ $13,925 και $15,226. Copyright 2009 Cengage Learning 16.42

Εκτιμητής Διαστήματος Εμπιστοσύνης της αναμενόμενης τιμής της y. Στην περίπτωση αυτή εκτιμούμε τον μέσο της y με δεδομένη μια τιμή της x: (Από τεχνικής άποψης, ο τύπος αυτός χρησιμοποιείται για απείρως μεγάλους πληθυσμούς. Ωστόσο, μπορούμε να ερμηνεύσουμε το πρόβλημά μας ως μια προσπάθεια προσδιορισμού της μέσης τιμής πώλησης όλων των Toyota Camrys, όλων με 40,000 μίλια στον χιλιομετρητή) Copyright 2009 Cengage Learning 16.43

Εκτιμητής Διαστήματος Εμπιστοσύνης Εκτίμηση της μέσης τιμής ενός μεγάλου αριθμού αυτοκινήτων (x g = 40): Το κατώτερο και ανώτερο όριο της εκτίμησης διαστήματος εμπιστοσύνης της αναμενόμενης τιμής είναι $14,498 και $14,650 Copyright 2009 Cengage Learning 16.44

Ποια είναι η Διαφορά; Διάστημα Πρόβλεψης Διάστημα Εμπιστοσύνης 1 no 1 Χρησιμοποιείται στην εκτίμηση της τιμής μιας τιμής της y (με δεδομένη τιμή της x) Χρησιμοποιείται στην εκτίμηση μέσης τιμής της y (με δεδομένη τιμή της x) Η εκτίμηση διαστήματος εμπιστοσύνης της αναμενόμενης τιμής της y θα είναι στενότερη από το διάστημα πρόβλεψης για την ίδια δεδομένη τιμή της x και τη στάθμη εμπιστοσύνης. Και τούτο επειδή υπάρχει μικρότερο σφάλμα στην εκτίμηση μιας μέσης τιμής σε σύγκριση με την πρόβλεψη μια μεμονωμένης τιμής. Copyright 2009 Cengage Learning 16.45

Διαστήματα με Excel ΥΠΟΛΟΓΙΣΜΟΣ Add-Ins > Data Analysis Plus > Prediction Interval Σημειακή Πρόβλεψη Διάστημα Πρόβλεψης Εκτιμητής Διαστήματος Εμπιστοσύνης της μέσης τιμής Copyright 2009 Cengage Learning 16.46

Διάγνωση Παλινδρόμησης Υπάρχουν τρεις προϋποθέσεις που απαιτούνται για την εκτέλεση της ανάλυσης παλινδρόμησης. Αυτές είναι: Η μεταβλητή σφάλματος πρέπει να έχει κανονική κατανομή, Η μεταβλητή σφάλματος πρέπει να έχει σταθερή διασπορά & Τα σφάλματα πρέπει να είναι ανεξάρτητα μεταξύ τους. Πώς μπορούμε να διαγνώσουμε παραβιάσεις αυτών των προϋποθέσεων/συνθηκών; Ανάλυση Υπολοίπων, δηλαδή, εξέταση των διαφορών μεταξύ των πραγματικών σημείων δεδομένων και εκείνων που προβλέπονται από την γραμμική εξίσωση. Copyright 2009 Cengage Learning 16.47

Ανάλυση Υπολοίπων Θυμηθείτε ότι οι αποκλίσεις μεταξύ των πραγματικών σημείων δεδομένων και της γραμμής παλινδρόμησης ονομάστηκαν υπόλοιπα ή κατάλοιπα. Το Excel υπολογίζει τα υπόλοιπα ως μέρος της ανάλυσης παλινδρόμησης: Μπορούμε να χρησιμοποιήσουμε αυτά τα υπόλοιπα για να προσδιορίσουμε εάν η μεταβλητή σφάλματος είναι μη κανονική, εάν η μεταβλητότητα σφάλματος είναι σταθερή, και εάν τα σφάλματα είναι ανεξάρτητα. Copyright 2009 Cengage Learning 16.48

Μη-Κανονικότητα Μπορούμε να πάρουμε τα υπόλοιπα και να τα βάλουμε σε ένα ιστόγραμμα για να ελέγξουμε οπτικά την κανονικότητα αναζητώντας ένα ιστόγραμμα με μορφή «καμπάνας», με τον μέσο πλησίον του μηδενός. Copyright 2009 Cengage Learning 16.49

Ετεροσκεδαστικότητα Όταν παραβιάζεται η προϋπόθεση της σταθερής μεταβλητότητας, έχουμε μια συνθήκη ετεροσκεδαστικότητας. Μπορούμε να διαγνώσουμε ετεροσκεδαστικότητα σχεδιάζοντας τα υπόλοιπα έναντι των προβλεπόμενων τιμών της y. Copyright 2009 Cengage Learning 16.50

Ετεροσκεδαστικότητα Αν η διασπορά μεταβλητής σφάλματος ( ) δεν είναι σταθερή, τότε έχουμε «ετεροσκεδαστικότητα». Εδώ έχουμε ένα διάγραμμα των υπολοίπων έναντι της αναμενόμενης τιμής της y: δεν φαίνεται να υπάρχει μια μεταβολή στο εύρος των σημείων, επομένως δεν υπάρχει ετεροσκεδαστικότητα Copyright 2009 Cengage Learning 16.51

Μη-Ανεξαρτησία της Μεταβλητής Σφάλματος Εάν θα έπρεπε να παρατηρήσουμε τις τιμές αυτοκινήτων σε δημοπρασίες κάθε εβδομάδα για, ας πούμε, ένα έτος, αυτό θα συνιστούσε μια χρονολογική σειρά. Όταν τα δεδομένα είναι χρονολογικές σειρές, τα σφάλματα συχνά εμφανίζουν συσχέτιση. Σφάλματα που σχετίζονται στην πάροδο του χρόνου λέμε ότι εμφανίζουν αυτοσυσχέτιση ή σειριακή συσχέτιση. Συχνά μπορούμε να διαπιστώσουμε αυτοσυσχέτιση όταν κάνουμε μια γραφική αναπαράσταση των υπολοίπων έναντι των χρονικών περιόδων. Εάν εμφανιστεί ένα μοτίβο, είναι πιθανό να παραβιάζεται η προϋπόθεση της ανεξαρτησίας. Copyright 2009 Cengage Learning 16.52

Μη-Ανεξαρτησία της Μεταβλητής Σφάλματος Τα μοτίβα στην εμφάνιση των υπολοίπων έναντι του χρόνου δείχνουν ότι υπάρχει αυτοσυσχέτιση: Σημειώστε τα μήκη των θετικών υπολοίπων που αντικαταστάθηκαν από μήκη αρνητικών υπολοίπων Σημειώστε την συμπεριφορά ταλάντευσης των υπολοίπων γύρω από το μηδέν. Copyright 2009 Cengage Learning 16.53

Ακραίες Τιμές Ακραία τιμή είναι μια παρατήρηση που είναι ασυνήθιστα μικρή ή ασυνήθιστα μεγάλη. Π.χ. το παράδειγμα των μεταχειρισμένων αυτοκινήτων είχε ενδείξεις χιλιομετρητή από 19.1 έως 49.2 χιλιάδες μίλια. Έστω ότι έχουμε μια τιμή μόνο 5,000 μιλίων (δηλαδή, ένα αυτοκίνητο οδηγείται από ένα ηλικιωμένο άτομο μόνο τις Κυριακές ) το σημείο αυτό είναι μια ακραία τιμή. Copyright 2009 Cengage Learning 16.54

Ακραίες Τιμές Πιθανοί λόγοι για την ύπαρξη ακραίων τιμών είναι μεταξύ άλλων: Σφάλμα στην καταγραφή της τιμής Η τιμή δεν θα έπρεπε να περιλαμβάνεται στο δείγμα Ίσως η παρατήρηση είναι όντως αληθής. Οι ακραίες τιμές μπορούν εύκολα να εντοπίζονται από ένα διάγραμμα διασποράς. Εάν η απόλυτη τιμή του τυπικού υπολοίπου είναι > 2, υποψιαζόμαστε ότι το σημείο μπορεί να είναι μια ακραία τιμή και ερευνούμε περαιτέρω. Πρέπει να αντιμετωπίζονται, αφού μπορούν εύκολα να επηρεάσουν την γραμμή ελάχιστων τετραγώνων. Copyright 2009 Cengage Learning 16.55

Διαδικασία Ανάλυσης Παλινδρόμησης 1. Θεωρητική σύλληψη ενός μοντέλου. 2. Συλλογή δεδομένων για τις δύο μεταβλητές στο μοντέλο. 3. Σχεδίαση του διαγράμματος διασποράς για να καθοριστεί εάν ένα γραμμικό μοντέλο είναι κατάλληλο. Αναγνώριση πιθανών ακραίων τιμών. 4. Προσδιορισμός της εξίσωσης παλινδρόμησης. 5. Υπολογισμός των υπολοίπων και έλεγχος των απαιτούμενων προϋποθέσεων/συνθηκών 6. Αξιολόγηση του μοντέλου. 7. Εάν το μοντέλο ταιριάζει στα δεδομένα, χρήση της εξίσωσης παλινδρόμησης για την πρόβλεψη μιας συγκεκριμένης τιμής της εξαρτημένης μεταβλητής ή/και εκτίμηση του μέσου της. Copyright 2009 Cengage Learning 16.56