ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σχετικά έγγραφα
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Παλινδρόμηση και Συσχέτιση

Στατιστική Επιχειρήσεων Ι

9. Παλινδρόμηση και Συσχέτιση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Εισόδημα Κατανάλωση

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Στατιστική Συμπερασματολογία

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Διάστημα εμπιστοσύνης της μέσης τιμής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ

Χ. Εμμανουηλίδης, 1

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Διαστήματα Εμπιστοσύνης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Απλή Γραμμική Παλινδρόμηση II

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Γ. Πειραματισμός Βιομετρία

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Ιδιότητες της ευθείας παλινδρόµησης


ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΕΠΑΝΑΛΗΨΗ ΒΑΣΙΚΩΝ ΕΝΝΟΙΩΝ ΣΤΑΤΙΣΤΙΚΗΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στην Εκτιμητική

X = = 81 9 = 9

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

Οικονομετρία. Απλή Παλινδρόμηση. Υποθέσεις του γραμμικού υποδείγματος και ιδιότητες των εκτιμητών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Απλή Γραμμική Παλινδρόμηση I

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Διαχείριση Υδατικών Πόρων

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Αναλυτική Στατιστική

Στατιστική για Χημικούς Μηχανικούς Συσχέτιση και Γραμμική Παλινδρόμηση. Κουγιουμτζής Δημήτριος Τμήμα Χημικών Μηχανικών

Εισαγωγή στην Γραμμική Παλινδρόμηση

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Y Y ... y nx1. nx1

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Στατιστική Ι. Ενότητα 4: Στατιστική Ι (4/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468

Θα μελετήσουμε πως μια τ.μ. μεταβάλλεται όταν αλλάζει μια άλλη μεταβλητή (τυχαία ή μη) Πρώτα ϑα μελετήσουμε τη σχέση δύο τ.μ. και Συχνά στη μελέτη ενός συστήματος ενδιαφερόμαστε να προσδιορίσουμε τη σχέση μεταξύ δύο μεταβλητών του Θα προσδιορίσουμε και ϑα εκτιμήσουμε το συντελεστή συσχέτισης που μετράει τη γραμμική συσχέτιση δύο τ.μ. Στη συνέχεια ϑα μελετήσουμε τη συναρτησιακή σχέση εξάρτησης μιας τ.μ. ως προς μια άλλη μεταβλητή. Η σχέση αυτή είναι πιθανοκρατική κι ορίζεται με την κατανομή της για κάθε τιμή της.

Συνήθως η μεταβολή αφορά μόνο τη μέση τιμή (κι ορισμένες ϕορές και τη διασπορά), γι αυτό κι η περιγραφή της κατανομής της ως προς τη περιορίζεται στη δεσμευμένη μέση τιμή E( ) και γίνεται με τη λεγόμενη ανάλυση παλινδρόμησης Θα μελετήσουμε την απλή γραμμική παλινδρόμηση, δηλαδή ϑα περιοριστούμε να εκτιμήσουμε τη γραμμική σχέση για τη μέση τιμή E( ) ως προς μια τ.μ..

Συσχέτιση Δύο τ.μ. και μπορεί να συσχετίζονται με κάποιο τρόπο. Αυτό συμβαίνει όταν επηρεάζει η μία την άλλη, ή αν δεν αλληλοεπηρεάζονται όταν επηρεάζονται και οι δύο από μια άλλη μεταβλητή Στη συνέχεια ϑα ϑεωρήσουμε ότι οι δύο τ.μ. και είναι συνεχείς Ο συντελεστής συσχέτισης ρ Ας ϑεωρήσουμε δύο τ.μ. και με διασπορά σ και σ αντίστοιχα και συνδιασπορά σ Cov(, ) = E( ) E()E( ). Η συνδιασπορά εκφράζει τη γραμμική συσχέτιση δύο τ.μ., δηλαδή την αναλογική μεταβολή (αύξηση ή μείωση) της μιας τ.μ. που αντιστοιχεί σε μεταβολή της άλλης μεταβλητής.

Συσχέτιση Η συνδιασπορά είναι ένα ποσοτικό μέγεθος κι η μονάδα μέτρησης της εξαρτάται από τις μονάδες μέτρησης των δύο τ.μ. και. Γι αυτό για να μετρήσουμε καλύτερα τον βαθμό της γραμμικής συσχέτισης δύο τ.μ. χρησιμοποιούμε τον συντελεστή συσχέτισης (correlato coeffcet) ρ που ορίζεται ως Ο συντελεστής συσχέτισης ρ παίρνει τιμές στο διάστημα [, ]: ρ = : υπάρχει τέλεια ϑετική σχέση μεταξύ των και, ρ = 0: δεν υπάρχει καμιά (γραμμική) σχέση μεταξύ των και, ρ = : υπάρχει τέλεια αρνητική σχέση μεταξύ των και

Συσχέτιση Έχουμε παρατηρήσεις δύο τ.μ. και κατά ζεύγη {(, ), (, ),..., (, )}, Αναφερόμαστε, δηλαδή, σε μη πειραματικά δεδομένα (ο ερευνητής δεν προκαθορίζει-ελέγχει τις τιμές καμιάς από τις δύο μεταβλητές) όπως: Χ το ύψος των φοιτητών του ΤΜΟΔ και Υ το βάρος τους Χ οι ώρες μελέτης των φοιτητών του ΤΜΟΔ και Υ η απόδοση τους σε ένα τεστ Χ οι εβδομάδες εμπειρίας ενός εργάτη σε μια επιχείρηση και Υ ο αριθμός των ελαττωματικών προϊόντων που παράγει Χ η κατάταξη δέκα προϊόντων από ένα κριτή και Υ η κατάταξη των ιδίων προϊόντων από έναν άλλο κριτή Χ ο αριθμός των πωλήσεων μουσικών CD σε μια περιοχή και Υ ο αριθμός των νέων στην ίδια περιοχή.

Συσχέτιση Δεν αναφερόμαστε όμως σε περιπτώσεις όπως Χ ο αριθμός των ανοιχτών ταμείων ενός υποκαταστήματος τραπέζης (που καθορίζει ο διευθυντής) και Υ ο χρόνος αναμονής των πελατών Χ η ποσότητα λιπάσματος (που καθορίζει ο ερευνητής) και Υ η απόδοση του αγρού Χ το ύψος της διαφημιστικής δαπάνης ενός προϊόντος (που καθορίζει μια επιχείρηση) και Υ το ύψος των πωλήσεων του προϊόντος

Συσχέτιση Οταν έχουμε παρατηρήσεις των δύο τ.μ. και κατά ζεύγη {(, ), (, ),..., (, )}, μπορούμε να εκτιμήσουμε τη συσχέτιση τους ποιοτικά από το διάγραμμα διασποράς (catter dagram), που είναι η απεικόνιση των σημείων (, ), =,...,, σε καρτεσιανό σύστημα συντεταγμένων. Στο σχήμα παρουσιάζονται τυπικά διαγράμματα διασποράς για ισχυρές κι ασθενείς συσχετίσεις δύο τ.μ. και Υ

Συσχέτιση Η σημειακή εκτίμηση του συντελεστή συσχέτισης ρ του πληθυσμού από το δείγμα των ζευγαρωτών παρατηρήσεων των και δίνεται από την σχέση: με Προκύπτει η έκφραση της εκτιμήτρια r (r συντελεστής προσδιορισμού) r ˆ r

Απλή Γραμμική Παλινδρόμηση Στη συσχέτιση που μελετήσαμε παραπάνω μετρήσαμε με το συντελεστή συσχέτισης τη γραμμική σχέση δύο τ.μ. και Στην παλινδρόμηση που θα μελετήσουμε τώρα σχεδιάζουμε την εξάρτηση μιας τ.μ., που την ονομάζουμε εξαρτημένη μεταβλητή (depedet varable) από κάποια άλλη μεταβλητή που την ονομάζουμε ανεξάρτητη μεταβλητή (depedet varable) Ενώ λοιπόν η συσχέτιση είναι συμμετρική ως προς τα και, στην παλινδρόμηση η εξαρτημένη μεταβλητή «καθοδηγείται» από την ανεξάρτητη μεταβλητή. Γι αυτό και στην ανάλυση που κάνουμε παίζει ρόλο ποιόν από τους δύο παράγοντες που μετράμε ορίζουμε σαν ανεξάρτητη μεταβλητή και ποιόν σαν εξαρτημένη

Το πρόβλημα της Απλής Γραμμικής Παλινδρόμησης Η εξαρτημένη τ.μ. ακολουθεί κάποια κατανομή. Επειδή μας ενδιαφέρει η συμπεριφορά της για κάθε δυνατή τιμή της ανεξάρτητης μεταβλητής θέλουμε να μελετήσουμε τη δεσμευμένη κατανομή της για κάθε τιμή της Με αναφορά στη δεσμευμένη αθροιστική συνάρτηση κατανομής θέλουμε να προσδιορίσουμε την F ( = ) για κάθε τιμή της Αυτό είναι αρκετά περίπλοκο πρόβλημα που στην πράξη συχνά δε χρειάζεται να λύσουμε. Περιορίζουμε λοιπόν τη μελέτη του προβλήματος της παλινδρόμησης στη δεσμευμένη μέση τιμή E( = ). Υποθέτοντας ότι η εξάρτηση εκφράζεται από γραμμική σχέση έχουμε E a και η σχέση αυτή λέγεται απλή γραμμική παλινδρόμηση της στη (lear regreo)

Το πρόβλημα της Απλής Γραμμικής Παλινδρόμησης Το πρόβλημα της παλινδρόμησης είναι η εύρεση των παραμέτρων α και β που εκφράζουν καλύτερα τη γραμμική εξάρτηση της από τη. Κάθε ζεύγος τιμών (α, β) καθορίζει μια διαφορετική γραμμική σχέση που εκφράζεται γεωμετρικά από ευθεία γραμμή Ο σταθερός όρος α είναι η τιμή του για = 0 και λέγεται διαφορά ύψους (tercept) κι ο συντελεστής του, β, είναι η κλίση (lope) της ευθείας ή αλλιώς ο συντελεστής παλινδρόμησης (regreo coeffcet) Αν θεωρήσουμε τις παρατηρήσεις {(, ),..., (, )} και το διάγραμμα διασποράς που τις απεικονίζει σαν σημεία, μπορούμε να σχηματίσουμε πολλές τέτοιες ευθείες που προσεγγίζουν την υποτιθέμενη γραμμική εξάρτηση της E( = ) ως προς

Το πρόβλημα της Απλής Γραμμικής Παλινδρόμησης

Το πρόβλημα της Απλής Γραμμικής Παλινδρόμησης Για κάποια τιμή της αντιστοιχούν διαφορετικές τιμές της, σύμφωνα με κάποια κατανομή πιθανότητας F ( = ), δηλαδή μπορούμε να θεωρήσουμε την σαν τ.μ. Η τ.μ. για κάποια τιμή της θα δίνεται κάτω από την υπόθεση της γραμμικής παλινδρόμησης ως a όπου e είναι κι αυτή τ.μ., λέγεται σφάλμα παλινδρόμησης (regreo error) κι ορίζεται ως η διαφορά της από τη δεσμευμένη μέση τιμή της e e E

Το πρόβλημα της Απλής Γραμμικής Παλινδρόμησης Για την ανάλυση της γραμμικής παλινδρόμησης κάνουμε τις παρακάτω υποθέσεις : I. Η μεταβλητή είναι ελεγχόμενη για το πρόβλημα που μελετάμε, δηλαδή γνωρίζουμε τις τιμές της χωρίς καμιά αμφιβολία II. Η σχέση ισχύει, δηλαδή η εξάρτηση της από τη είναι γραμμική III. E(e ) = 0 και Var(e ) = σ e για κάθε τιμή της, δηλαδή το σφάλμα παλινδρόμησης έχει μέση τιμή μηδέν για κάθε τιμή της και η διασπορά του είναι σταθερή και δεν εξαρτάται από τη Η τελευταία συνθήκη είναι ισοδύναμη με τη συνθήκη δηλαδή η διασπορά της εξαρτημένης μεταβλητής είναι η ίδια για κάθε τιμή της και μάλιστα είναι E a e Var. Η ιδιότητα αυτή λέγεται ομοσκεδαστικότητα και αντίθετα έχουμε ετεροσκεδαστικότητα όταν η διασπορά της (ή του σφάλματος e) μεταβάλλεται με τη

Το πρόβλημα της Απλής Γραμμικής Παλινδρόμησης Γενικά για να εκτιμήσουμε τις παραμέτρους της γραμμικής παλινδρόμησης με τη μέθοδο των ελαχίστων τετραγώνων, όπως θα δούμε παρακάτω, δεν είναι απαραίτητο να υποθέσουμε κάποια συγκεκριμένη δεσμευμένη κατανομή της ως προς τη : F Αν θέλουμε όμως να υπολογίσουμε διαστήματα εμπιστοσύνης για τις παραμέτρους θα χρειαστούμε να υποθέσουμε κανονική δεσμευμένη κατανομή για τη Επίσης οι παραπάνω υποθέσεις για γραμμική σχέση και σταθερή διασπορά αποτελούν χαρακτηριστικά πληθυσμών με κανονική κατανομή. Συνήθως λοιπόν σε προβλήματα γραμμικής παλινδρόμησης υποθέτουμε ότι η δεσμευμένη κατανομή της είναι κανονική ~ N a,

Εκτίμηση παραμέτρων της απλής γραμμικής παλινδρόμησης Το πρόβλημα της απλής γραμμικής παλινδρόμησης με τις υποθέσεις που ορίστηκαν παραπάνω συνίσταται στην εκτίμηση των τριών παραμέτρων της παλινδρόμησης :. της διαφοράς ύψους της ευθείας παλινδρόμησης α,. της κλίσης της ευθείας παλινδρόμησης β, 3. της διασποράς σφάλματος της παλινδρόμησης σ Τα α και β προσδιορίζουν την ευθεία παλινδρόμησης κι άρα καθορίζουν τη γραμμική σχέση εξάρτησης της τ.μ. από τη μεταβλητή. Η παράμετρος σ προσδιορίζει το βαθμό μεταβλητότητας γύρω από την ευθεία παλινδρόμησης κι εκφράζει την αβεβαιότητα της γραμμικής σχέσης

Εκτίμηση παραμέτρων της ευθείας παλινδρόμησης Η εκτίμηση των παραμέτρων α και β γίνεται με τη μέθοδο των ελαχίστων τετραγώνων (method of leat quare) Η μέθοδος λέγεται έτσι γιατί βρίσκει την ευθεία παλινδρόμησης με παραμέτρους a και b έτσι ώστε το άθροισμα των τετραγώνων των κατακόρυφων αποστάσεων των σημείων από την ευθεία να είναι το ελάχιστο Οι εκτιμήσεις των α και β δίνονται από την ελαχιστοποίηση του αθροίσματος των τετραγώνων των σφαλμάτων m a, ε ή m a,

Εκτίμηση παραμέτρων της ευθείας παλινδρόμησης Για να λύσουμε αυτό το πρόβλημα θέτουμε τις μερικές παραγώγους ως προς τα α και β ίσες με το μηδέν και καταλήγουμε στο σύστημα δύο εξισώσεων με δύο αγνώστους από το οποίο παίρνουμε τις εκτιμήσεις των α και β τα οποία ορίζουν την ευθεία που λέγεται ευθεία ελαχίστων τετραγώνων 0 0 b, b a ŷ b a

Εκτίμηση παραμέτρων της ευθείας παλινδρόμησης Για να λύσουμε αυτό το πρόβλημα θέτουμε τις μερικές παραγώγους ως προς τα α και β ίσες με το μηδέν και καταλήγουμε στο σύστημα δύο εξισώσεων με δύο αγνώστους από το οποίο παίρνουμε τις εκτιμήσεις των α και β τα οποία ορίζουν την ευθεία που λέγεται ευθεία ελαχίστων τετραγώνων 0 0 b, b a ŷ b a ˆ ˆ S S ˆ b a S S S S S

Εκτίμηση της διασποράς των σφαλμάτων παλινδρόμησης Για κάθε δοθείσα τιμή με τη βοήθεια της ευθείας ελαχίστων τετραγώνων εκτιμούμε την τιμή που γενικά είναι διαφορετική από την πραγματική τιμή. Η διαφορά e ŷ ŷ a b είναι η κατακόρυφη απόσταση της πραγματικής τιμής από την ευθεία ελαχίστων τετραγώνων και λέγεται σφάλμα ελαχίστων τετραγώνων ή απλά υπόλοιπο (redual) Το υπόλοιπο e είναι η εκτίμηση του σφάλματος παλινδρόμησης ε αντικαθιστώντας απλά τις παραμέτρους παλινδρόμησης με τις εκτιμήσεις ελαχίστων τετραγώνων στον ορισμό του σφάλματος a b

Εκτίμηση της διασποράς των σφαλμάτων παλινδρόμησης Για κάθε δοθείσα τιμή με τη βοήθεια της ευθείας ελαχίστων τετραγώνων εκτιμούμε την τιμή που γενικά είναι διαφορετική από την πραγματική τιμή. Η διαφορά e ŷ ŷ a b είναι η κατακόρυφη απόσταση της πραγματικής τιμής από την ευθεία ελαχίστων τετραγώνων και λέγεται σφάλμα ελαχίστων τετραγώνων ή απλά υπόλοιπο (redual) Το υπόλοιπο e είναι η εκτίμηση του σφάλματος παλινδρόμησης ε αντικαθιστώντας απλά τις παραμέτρους παλινδρόμησης με τις εκτιμήσεις ελαχίστων τετραγώνων στον ορισμό του σφάλματος a b

Εκτίμηση της διασποράς των σφαλμάτων παλινδρόμησης Άρα η εκτίμηση της διασποράς σ του σφάλματος (που είναι κι η δεσμευμένη διασπορά της ως προς ) δίνεται από τη δειγματική διασπορά των υπολοίπων e όπου διαιρούμε με γιατί από τους βαθμούς ελευθερίας του μεγέθους του δείγματος αφαιρούμε δύο για τις δύο παραμέτρους που έχουν ήδη εκτιμηθεί Αν χρησιμοποιήσουμε την σχέση και αντικαταστήσουμε τα a και b, η δειγματική διασπορά των υπολοίπων δίνεται από την σχέση: e ŷ ŷ b a b

Παράδειγμα : Η Ελληνική Βιομηχανία Όπλων (ΕΒΟ) απασχολεί μέρος του εργατικού δυναμικού της κατασκευάζοντας κάνες ενός τύπου όπλων. Η απασχόληση σε ώρες εργασίες ανά μήνα, ανάλογα με τον αριθμό των παραγγελιών που πρέπει να εκτελεστούν κάθε μήνα. Στο πίνακα φαίνονται οι παραγγελίες των τελευταίων 0 μηνών και οι αντίστοιχες ώρες εργασίας που απατήθηκαν για την εκτέλεση τους. () Να εκτιμηθεί η ευθεία της παλινδρόμησης που συνδέει τις παραγγελίες με τις ώρες εργασίας () Να εκτιμηθεί η διασπορά γύρω από την ευθεία της παλινδρόμησης () Να ερμηνευτούν τα αποτελέσματα (v) Να εκτιμηθούν οι ώρες εργασίας αν η ΕΒΟ δεχτεί 53 παραγγελίες

Μήνας Παραγωγής Μέγεθος Παραγγελίας Ώρες Εργασίας 30 73 0 50 3 60 8 4 80 70 5 40 87 6 50 08 7 60 35 8 30 69 9 70 48 0 60 3

Σχέση συντελεστή συσχέτισης και παλινδρόμησης Η παλινδρόμηση ορίζεται θεωρώντας την ανεξάρτητη μεταβλητή σταθερή και την εξαρτημένη μεταβλητή τυχαία, ενώ για τη συσχέτιση θεωρούμε και τις δύο μεταβλητές και τυχαίες. Για τις μεταβλητές και της παλινδρόμησης, μπορούμε να αγνοήσουμε ότι η δεν είναι τ.μ. και να ορίσουμε το συντελεστή συσχέτισης ρ όπως και πριν Η σχέση μεταξύ του r (της εκτιμήτριας του ρ από το δείγμα) και του συντελεστή της παλινδρόμησης b δίνεται ως εξής: r b ή b r

Σχέση συντελεστή συσχέτισης και παλινδρόμησης Και τα δύο μεγέθη, r και b, εκφράζουν ποσοτικά τη γραμμική συσχέτιση των μεταβλητών και, αλλά το b εξαρτάται από τη μονάδα μέτρησης των και ενώ το r, επειδή προκύπτει από το λόγο της συνδιασποράς προς τις τυπικές αποκλίσεις των και, δεν εξαρτάται από τη μονάδα μέτρησης και δίνει τιμές στο διάστημα [, ] Η σχέση των r και b περιγράφεται ως εξής : Αν η συσχέτιση είναι θετική (r > 0) τότε η κλίση της ευθείας παλινδρόμησης b είναι επίσης θετική. Αν η συσχέτιση είναι αρνητική (r < 0) τότε η κλίση της ευθείας παλινδρόμησης b είναι επίσης αρνητική Αν οι μεταβλητές και δε συσχετίζονται (r = 0) τότε η ευθεία παλινδρόμησης είναι οριζόντια (b = 0).

Σχέση συντελεστή συσχέτισης και παλινδρόμησης Επίσης μπορούμε να εκφράσουμε το r ως προς τη δειγματική διασπορά του σφάλματος και αντίστροφα r ή r Η παραπάνω σχέση δηλώνει πως όσο μεγαλύτερο είναι το r (ή το r ) τόσο μειώνεται η διασπορά του σφάλματος της παλινδρόμησης, δηλαδή τόσο ακριβέστερη είναι η πρόβλεψη που βασίζεται στην ευθεία παλινδρόμησης Δηλαδή ο συντελεστής προσδιορισμού εκφράζει το ποσοστό της διακύμανσης της Υ που εξηγείται από την ευθεία της παλινδρόμησης

Σχέση συντελεστή συσχέτισης και παλινδρόμησης r 00% Ή αλλιώς το της μεταβλητότητας του Υ ερμηνεύεται από την Χ r S S S Στο προηγούμενο παράδειγμα βρείτε το r και ερμηνεύστε το αποτέλεσμα

Σχέση συντελεστή συσχέτισης και παλινδρόμησης Για τους συντελεστές α και b της ευθείας της παλινδρόμησης: Για αύξηση του Χ κατά μια μονάδα το Υ αυξάνεται κατά b Όταν το Χ = 0 το Υ = a