ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ



Σχετικά έγγραφα
Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Διαχείριση Υδατικών Πόρων

Εισόδημα Κατανάλωση

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

Απλή Παλινδρόμηση και Συσχέτιση

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Ιδιότητες της ευθείας παλινδρόµησης

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Γ. Πειραματισμός Βιομετρία

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Περιεχόμενα. Πρόλογος... 15

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Χ. Εμμανουηλίδης, 1


ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

Περίπου ίση µε την ελάχιστη τιµή του δείγµατος.

Στατιστική Ι. Ανάλυση Παλινδρόμησης

στατιστική θεωρεία της δειγµατοληψίας

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Σηµειώσεις Οικονοµετρίας Ι.. ικαίος Τσερκέζος

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Διάστημα εμπιστοσύνης της μέσης τιμής

Αναλυτική Στατιστική

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

γένεση των µετακινήσεων

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Kruskal-Wallis H

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΑΣΚΗΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Κεφάλαιο 13. Εισαγωγή στην. Η Ανάλυση ιακύµανσης

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εισαγωγή στην Γραμμική Παλινδρόμηση

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

3η Ενότητα Προβλέψεις

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Είδη Μεταβλητών. κλίµακα µέτρησης

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 4: ΔΙΑΛΕΞΗ 04

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

γένεση των µετακινήσεων

Συνοπτικά περιεχόμενα

ÖÑÏÍÔÉÓÔÇÑÉÏ ÈÅÌÅËÉÏ ÇÑÁÊËÅÉÏ ÊÑÇÔÇÓ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

x y max(x))

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εφαρμοσμένη Στατιστική

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Αν έχουμε δύο μεταβλητές Χ και Υ και σύμφωνα με την οικονομική θεωρία η μεταβλητή Χ προσδιορίζει τη συμπεριφορά της Υ το ερώτημα που τίθεται είναι αν

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2014

Γ. Πειραματισμός - Βιομετρία

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

Απλή Γραμμική Παλινδρόμηση II

Πρακτική µε στοιχεία στατιστικής ανάλυσης

Στατιστική Συμπερασματολογία

ΠΑΛΙΝ ΡΟΜΗΣΗ..Π.Μ.Σ. Μαθηµατικά των Υπολογιστών και των Αποφάσεων. Πάτρα, 27 Ιανουαρίου 2011

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

9. Παλινδρόμηση και Συσχέτιση

Transcript:

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1

Γραµµική παλινδρόµηση Είναι µία τεχνική προσδιορισµού µίας ποσοτικής (µαθηµατικής) έκφρασης, για την περιγραφή του τρόπου αλληλοσυσχέτισης (ή συµµεταβολής) δύο ή περισσοτέρων µεταβλητών. y=a + bx Στην ανωτέρω σχέση ("γραµµικό πρότυπο" ή "µοντέλο") θεωρούµε ότι µεταξύ των x και y υπάρχει σχέση αιτίου - αποτελέσµατος, η οποία προσδιορίζεται µε τον υπολογισµό των τιµών των σταθερών ποσοτήτων a και b. Η µεταβλητή x λέγεται "ανεξάρτητη" (αίτιο) και η y "εξαρτηµένη" (αποτέλεσµα), διότιπροσδιορίζεται έµµεσαβάσειτωντιµώντης x, απότησχέση: y=a + bx 3 Χρησιµότητα Η γραµµική παλινδρόµηση είναι εξαιρετικά χρήσιµη στη ιοίκηση Επιχειρήσεων, γιατί υπάρχει πληθώρα καταστάσεων συµµεταβαλλοµένωνφαινοµένων, που µπορούνναµελετηθούν. (Π.χ. Οι Πωλήσεις σχετίζονται - άρα και συµµεταβάλλονται - µε τα πάγια και τα µεταβλητά έξοδα παραγωγής, µε τα έξοδα διαφήµισης, τον αριθµό των πωλητών κτλ) 4 2

Μελέτη Η µελέτη της γραµµικής παλινδρόµησης µπορεί να περιλάβει τις ακόλουθες ενότητες. ιάγραµµα Σκεδασµού Συσχέτιση Συνάρτηση Γραµµικής Παλινδρόµησης Αξιοπιστία Γραµµικής Παλινδρόµησης Αξιοπιστία Συντελεστού b Τυπική Απόκλιση Παλινδρόµησης 5 ιάγραµµα σκεδασµού Είναιηγραφικήαπεικόνιση, υπόµορφή "νέφους" σηµείων, των ζευγών (x, y). ίνει µια εικόνα, του αν υπάρχει εµφανής συσχέτιση µεταξύ x και y και εάν αυτή είναι γραµµικής µορφής, οπότε έχει νόηµα να προχωρήσουµε στον υπολογισµό της παρατηρούµενης (οπτικά) αλληλοεξάρτησης των x και y. 6 3

Συνάρτηση γραµµικής παλινδρόµησης Υπάρχουν άπειροι, θεωρητικά, τρόποι να σύρουµε µία ευθεία γραµµή, πουναδιέρχεταιαπόένα "νέφος" nσηµείων (x i, y i ) και η οποία να το "περιγράφει". Η ευθεία που δίνει την "καλύτερη" περιγραφή προσδιορίζεται µε τη µέθοδο των ελαχίστων τετραγώνων, η οποία και απαιτεί την ελαχιστοποίηση των κατάλοιπων (ανερµήνευτων): Αυτό συµβαίνει όταν: 7 Παράδειγµα πωλήσεων 8 4

Εκτίµηση των y Εάν δεν υπάρχει αλληλοεξάρτηση µεταξύ x και y, τότε το καλύτερο "µοντέλο" για την εκτίµηση της πιθανότερης τιµής που µπορεί να πάρειητυχαίαµεταβλητή yθαήτανοµέσος όροςτης, δηλ. Εάνόµωςοιτιµέςτου yεξαρτώνταιαπότις τιµές του x (κατά τρόπο γραµµικό), τότε η καλύτερηεκτίµησηγιατηντιµήτου y i θα είναι: 9 Αξιοπιστία της Γ.Π. Το ερώτηµα είναι πόση αξιοπιστία δίνουµε στις τιµές εκτίµησηςτου yπουυπολογίζονταικατ' αυτότοντρόπο; ηλ. πόσο απέχουν από τις "πραγµατικές" y; Η απάντηση δίνεται: απότηντιµήτου "ΣυντελεστήΠροσδιορισµού" r 2 και, απότηντιµήτουκριτηρίου F Οσυντελεστήςπροσδιορισµού (r 2 ) µετράτοβαθµό "αξιοπιστίας" της γραµµικής παλινδρόµησης. ίνεται από τη σχέση: Είναιτοπηλίκοτηςλεγοµένης "ερµηνευόµενης" µεταβλητότητας (διασποράς) διάτης "ολικής" µεταβλητότητας. 10 5

Αποκλίσεις Οιέννοιες "ερµηνευόµενη", "ανερµήνευτη" και "ολική" απόκλιση ή µεταβλητότητα βασίζονται στα εξής: Εάνδενγνωρίζαµετηναλληλοσυσχέτισητων x i και y i, τότεη αντιπροσωπευτικότερητιµήτων y i θαήτανοµέσοςόροςτους Ηαπόκλισηµιαςτιµής y i απότονµέσοόροτουςείναιη "ολική απόκλιση" και είναι Ηαπόκλισητης, υπολογιζόµενηςαπότηνπαλινδρόµηση, τιµής y από τον µέσο όρο τους λέγεται "ερµηνευόµενη" (από την παλινδρόµηση) απόκλιση και είναι Η "ανερµήνευτη" (από την παλινδρόµηση) απόκλιση (ή και "κατάλοιπο") ("OΛΙΚΗ" ΑΠΟΚΛΙΣΗ) = ("ΑΜΕΡΜΗΝΕΥΤΗ" ΑΠΟΚΛΙΣΗ) + ("ΕΡΜΗΜΕΥΟΜΕΝΗ" ΑΠΟΚΛΙΣΗ) 11 Αποκλίσεις 12 6

r και r 2 Το r 2 µεταβάλλεταιαπό 0 µέχρι 1. Η ποσότητα r λέγεται "συντελεστής συσχέτισης" (Pearson) και µεταβάλλεται από -1 έως +1. είχνει τον βαθµό της συσχέτισης. Το r 2 δείχνειτιποσοστότηςενυπάρχουσας ολικήςµεταβλητότητας, (διασποράς, των y i, από το µέσο όρο τους) εξηγείται από τη γραµµική παλινδρόµηση. ηλαδήτοποσοστότηςµεταβολήςτης y που οφείλεται στην µεταβολή της x. 13 ΗχρήσητουΚριτηρίου F Γιαναπροσδιορίσουµετη "σηµαντικότητα" τηςτιµήςτου r 2 (δηλ. ανείναι "σηµαντικά" διάφορητουµηδενός) υπολογίζουµε την τιµή του δείκτη F για ένα επίπεδο σηµαντικότητας που επιθυµούµε (π.χ. 95%). Εάν έχουµε µικρό αριθµό δεδοµένων (ή χαλαρή συσχέτιση) ή τιµήτου r 2 µπορείναείναι "πλασµατικά" µεγάλη. Γι αυτό, ο υπολογισµός του δείκτη F είναι απαραίτητος, και υπάρχει σ όλα τα λογισµικά γραµµικής παλινδρόµησης. ίνεταιαπότησχέση: Όπου: n = Τοπλήθοςπαρατηρήσεων (x i, y i ) m = Οαριθµόςτωνπαραµέτρων (είναιδύογιατηναπλή παλινδρόµηση: aκαι b) Εδώ οι "βαθµοί ελευθερίας" είναι: m-1 για τον αριθµητή n-1 για τον παρανοµαστή 14 7

F Εάν το υπολογιζόµενο κατ αυτόν τον τρόπο F είναι µεγαλύτερο από το "κρίσιµο F" (για ένα προκαθορισµένο επίπεδο εµπιστοσύνης) των σχετικών πινάκων της κατανοµής F τότε σηµαίνει ότι υπάρχει συσχέτιση της ανεξάρτητης µεταβλητής x (ή του συνόλου των ανεξαρτήτων µεταβλητών, σε µία πολλαπλή παλινδρόµηση) και της εξαρτηµένης y. Ένας εµπειρικός κανόνας σηµαντικότητας για το F είναι: Nα απορρίπτουµε τη µηδενική υπόθεση σε επίπεδο εµπιστοσύνης 95%, όταν το F είναι µεγαλύτερο του 6, γιαδείγµαταµεταξύ 6 και 10 παρατηρήσεων, και µεγαλύτερο του 5 για µεγαλύτερα δείγµατα. 15 Αξιοπιστία του συντελεστή b Ακόµηκαιανείχαµεχρησιµοποιήσειτελείωςάσχεταµεταξύτους xκαι y, τυχαίοι παράγοντες µπορεί να δώσουν b 0. Έτσι, είναι σκόπιµο να ελέγξουµε την εξής Μηδενική Υπόθεση: Ηο: Η πραγµατική τιµή του b είναι µηδέν. (Άρα, δεν υπάρχει σχέση αιτίας - αποτελέσµατος µεταξύ x και y). Οέλεγχοςγίνεταιµετοκριτήριο t 0 υπολογισµός του t έχει ιδιαίτερη σηµασία στην πολλαπλή γραµµική παλινδρόµηση, όπουυπολογίζουµετο tγιακάθεένανσυντελεστή b i, των ανεξαρτήτωνµεταβλητών x i (Στηναπλήπαλινδρόµηση, επειδήέχουµε µόνο µία ανεξάρτητη µεταβλητή, ο έλεγχος του t και του F δίνουν ισοδύναµα αποτελέσµατα). Οι κρίσιµες τιµές του t δίνονται από σχετικούς πίνακες. Ένας εµπειρικός κανόνας σηµαντικότητας για το t είναι: Nααπορρίπτουµετηµηδενικήυπόθεση, σεεπίπεδοεµπιστοσύνης 95%, όταν το t είναι µεγαλύτερο του 3 για δείγµατα 5-15 παρατηρήσεων και µεγαλύτερο του 2 για µεγαλύτερα δείγµατα. 16 8

Τυπική απόκλιση Γ.Π. Λέγεται και Τυπικό Σφάλµα. ίνεται (για µεγάλα δείγµατα) από τη σχέση: Χρησιµεύει για τον προσδιορισµό (σε µεγάλα δείγµατα) διαστηµάτων εµπιστοσύνης του y για τιµές του xκοντάστοµέσοόροτους 17 Παράδειγµα πωλήσεων Για τα στοιχεία πωλήσεων του βρίσκεται ότι: Για x κοντά στην 3.51, το εκατέρωθεν του, διάστηµα σηµαντικότητας, σε επίπεδο εµπιστοσύνης 95%, θα είναι: Έστω, τώραητιµή x = 5. Άρα µπορούµε να ισχυρισθούµε, µε πιθανότητα 95% ο ισχυρισµός µας να είναι ορθός, ότι το ν θα βρίσκεται στο διάστηµα: 73.3 ± 15.3 δηλαδή µεταξύ 58 και 88.6 18 9

Προϋποθέσεις Γ.Π. Υπάρχουν αρκετά αυστηρές προϋποθέσεις για να χρησιµοποιηθεί γραµµική παλινδρόµηση. Γραµµικότητα Η εξαρτηµένη µεταβλητή y πρέπει να συσχετίζεται κατά τρόπο γραµµικό µε την ανεξάρτητη x (ή µε κάθε µία από τις ανεξάρτητες µεταβλητές, σε πολλαπλή παλινδρόµηση). Αυτήήαπαίτηση, πουεµφανίζεταιπολύπεριοριστική, πολλές φορές µπορεί να παρακαµφθεί σε περιπτώσεις που µη γραµµικές συσχετίσεις µπορούν να µετασχηµατισθούν σε γραµµικές. (Π.χ. ή σχέση y=3+6x 2 µετασχηµατίζεταισεγραµµικήανθέσουµε x 2 = z). Τοδιάγραµµασκεδασµού, είναιιδιαίτεραβοηθητικό, στην (οπτική) αναγνώριση της συσχέτισης των y και x. 19 Οµοσκεδασµός Προϋποθέσεις Γ.Π. Ονοµάζεται η απαίτηση να υπάρχει σταθερή διακύµανση (variance) µεταξύ των πραγµατικών τιµών (y i ) καιαυτώνπουυπολογίζονταιαπότην παλινδρόµηση. (Η έλλειψη Οµοσκεδασµού λέγεται Ετεροσκεδασµός). 20 10

Προϋποθέσεις Γ.Π. Ανεξαρτησία Σφαλµάτων Τα κατάλοιπα, ή ανερµήνευτα σφάλµατα, της γραµµικής παλινδρόµησης (δηλ. τα,) πρέπει να είναι ανεξάρτητα µεταξύ τους. Σε αντίθετη περίπτωση λέµε ότι υπάρχει "αυτοσυσχέτιση" µεταξύ διαδοχικών τιµών καταλοίπων. Η ύπαρξη αυτοσυσχέτισης σηµαίνει ότι έχει παραληφθεί κάποια σηµαντική ανεξάρτητη µεταβλητή από τη συνάρτηση παλινδρόµησης (και έτσι τα σφάλµατα δεν έχουν τυχαία διακύµανση). 21 Προϋποθέσεις Γ.Π. Κανονική Κατανοµή Σφαλµάτων Η µη ύπαρξη συσχέτισης στα σφάλµατα δηµιουργεί συνθήκες Κανονικής Κατανοµής. Συνήθως, ότανέχουµεπάνωαπό 30 παρατηρήσεις υπάρχει µεγάλη πιθανότητα τα σφάλµατα να ακολουθούν την κανονική κατανοµή. ( ιαφορετικά τα τεστ σηµαντικότητας F και t δεν ισχύουν!). 22 11

Προϋποθέσεις Γ.Π. Ανυπαρξία Πολυσυγγραµµικότητας Η πολυσυγγραµµικότητα (multicolinearity) είναι ένα φαινόµενο, που συµβαίνει στην πολλαπλή γραµµική παλινδρόµηση, όταν δύο ή περισσότερες ανεξάρτητες µεταβλητές έχουν µεταξύ τους υψηλό βαθµό συσχέτισης, µε αποτέλεσµα να αλληλεπικαλύπτεται η επίδραση τους στη διαµόρφωση των τιµών της εξαρτηµένης µεταβλητής. Έτσι, µπορεί να υπάρχει υψηλός συντελεστής προσδιορισµού R 2 αλλάασήµαντα bγιατις αλληλοσυσχετιζόµενες ανεξάρτητες µεταβλητές. (Σ αυτές τις περιπτώσεις παραλείπουµε από το γραµµικό µοντέλοόλεςεκτόςαπόµίααπότις αλληλοσχετιζόµενες "ανεξάρτητες" µεταβλητές). 23 12