Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ ΛΟΡΕΝΤΖΙΑΔΗΣ 2 Ο ΕΞΑΜΗΝΟ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ 2016-2017 ΤΜΗΜΑΤΑ: (Α - Λ) ΚΑΙ (Μ - Ω) ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σημειώσεις Εισαγωγή στη Γραμμική Παλινδρόμηση
Σελίδα 2 I) Μοντέλο: Θεωρητικό επίπεδο (δεν παρατηρείται) Μια μεταβλητή Y σχετίζεται με μια άλλη μεταβλητή X μέσω της σχέσης Y = a + bx + σφάλμα όπου το σφάλμα προέρχεται από Μεταβλητές που έχουν παραληφθεί ή άλλους παράγοντες Περιορισμένη ακρίβεια στη μέτρηση των μεταβλητών Μη ελεγχόμενα τυχαία στοιχεία με ακανόνιστη δομή Υποθέτουμε ότι E(σφάλμα) = 0 Κατά μέσο όρο το σφάλμα είναι 0 Κατά μέσο όρο το Y αποδίδεται ως a +bx Επομένως E(Y) = a + bx Μια άλλη υπόθεση είναι ότι VAR(σφάλμα) = σ 2 ανεξάρτητα της τιμής της μεταβλητής X Ώστε VAR(Y) = σ 2 Εμπειρικό επίπεδο (παρατηρήσεις) Έχουμε n ζεύγη παρατηρήσεων X 1, και το αντίστοιχο Y 1, X 2, και το αντίστοιχο Y 2,., X n, και το αντίστοιχο Y n
Σελίδα 3 II) Εκτίμηση των παραμέτρων του μοντέλου Εκτιμήτριες Ελαχίστων Τετραγώνων: Εκτιμούμε τα a και b ΣΤΟΧΟΣ: Ελαχιστοποιούμε το (άθροισμα) των τετραγώνων των (κατακόρυφων) αποστάσεων των παρατηρούμενων Y i από το a+bx i Minimum Σ (Υ i - (a+bx i )) 2 Οι εκτιμήσεις που λαμβάνουμε για τα a και b είναι b = Σ (Χ i - X - ) (Y i - Ȳ) a = Ȳ - b X- Σημειώσεις: 1) Η εκτιμώμενη γραμμική σχέση ανάμεσα στο X και Y ονομάζεται ευθεία παλινδρόμησης Y = a + b X Τα εκτιμώμενα σφάλματα που προκύπτουν (γνωστά ως κατάλοιπα residuals) είναι τα σφάλματα των παρατηρήσεων ως προς την εκτιμώμενη σχέση. Εκτιμώμενα σφάλματα (κατάλοιπα) = Y i - ( a + b X i ) 2) Ισχύει ότι (και μπορεί να επαληθευτεί και αλγεβρικά) ότι Το άθροισμα των καταλοίπων είναι πάντα 0 (δηλ. κατά μέσο όρο τα κατάλοιπα είναι 0) Ένα σημείο της εκτιμώμενης γραμμικής σχέσης ανάμεσα στο Χ και Υ είναι Ȳ = a + b X - Η ευθεία παλινδρόμησης διέρχεται πάντα από το σημείο (X -,Ȳ )
Σελίδα 4 Εκτιμούμε την διακύμανση σ 2 των σφαλμάτων χρησιμοποιώντας τη διακύμανση των καταλοίπων από την ευθεία παλινδρόμησης: σ 2 Σ καταλοιπα 2 = n-2 = Σ( Y i - (a+bx i )) 2 n-2 = SSE n-2 όπου SSE = sum of square errors Για τη συνέχεια χρειαζόμαστε μια ακόμα υπόθεση Υπόθεση: Το κάθε (θεωρητικό) σφάλμα ακολουθεί την Κανονική Κατανομή. III) Κατανομή των Εκτιμητριών Ελαχίστων Τετραγώνων Υπό την παραπάνω υπόθεση a ακολουθεί κανονική κατανομή με μέσο a και διακύμανση σ 2 n Σ Χ i 2 b ακολουθεί κανονική κατανομή με μέσο b και διακύμανση σ 2 Εκτίμηση της τυπικής απόκλισης του a σ Σ Χ 2 i n Εκτίμηση της τυπικής απόκλισης του b σ ***** δηλαδή χρησιμοποιούμε το σ αντί για το σ.
Σελίδα 5 IV) Διαστήματα Εμπιστοσύνης Επίπεδο Εμπιστοσύνης είναι 1-α Διάστημα Εμπιστοσύνης για την παράμετρο a σ Σ Χ 2 i a ± tn-2, α/2 n Διάστημα Εμπιστοσύνης για την παράμετρο b σ b ± t n-2, α/2 Υπολογισμός του t n-2,α/2
Σελίδα 6 V) Έλεγχος Υποθέσεων Επίπεδο σημαντικότητας είναι α Υπόθεση: H 0 : a = a ο Vs. H 1 : a a ο H 0 : a a ο vs. H 1 : a > a ο H 0 : a a ο Vs. H 1 : a < a ο - a ao Στατιστική ελέγχου: t = Εκτίμηση της τυπικής απόκλισης του a Απορρίπτουμε εάν Απορρίπτουμε εάν t > t n-2, α/2 t > t n-2, α Απορρίπτουμε εάν P value < α Απορρίπτουμε εάν t < - t n-2, α Pr( a παρατηρούμενο a ) Pr( a παρατηρούμενο a ) Pr( a παρατηρούμενο a ) Υπόθεση: H 0 : b = b ο Vs. H 1 : b b ο H 0 : b b ο vs. H 1 : b > b ο H 0 : b b ο Vs. H 1 : b < b ο b- b o Στατιστική ελέγχου: t = Εκτίμηση της τυπικής απόκλισης του b Απορρίπτουμε εάν t > t n-2, α/2 Απορρίπτουμε εάν t > t n-2, α Απορρίπτουμε εάν t < - t n-2, α Απορρίπτουμε εάν P value < α Pr( b παρατηρούμενο b ) Pr( b παρατηρούμενο b ) Pr( b παρατηρούμενο b ) Σημείωση: Εάν η υπόθεση H 0 : b = 0 vs. H 1 : b 0 απορριφθεί τότε η Y εξαρτάται από τη X
Σελίδα 7 VI) Προβλέψεις Έστω ότι X = x o Για να προβλεφθεί η τιμή του Y που θα παρατηρήσουμε όταν X = x o, χρησιμοποιούμε την ευθεία παλινδρόμησης Y = a + b X Πρόβλεψη Y o = a + b xo Η εκτιμώμενη διακύμανση πρόβλεψης είναι: S 2 σ 2 p = σ 2 + n + (X - -x o ) 2 Σ (Χ i - X - σ 2 ) 2 Διάστημα εμπιστοσύνης πρόβλεψης Επίπεδο εμπιστοσύνης είναι 1-α Y o ± tn-2, α/2 S p
Σελίδα 8 VII) Αξιολόγηση της καταλληλότητας προσαρμογής στο γραμμικό μοντέλο Ονομάζουμε το Y i = a + b Xi Ισχύει ότι η τιμή Y πάνω στην ευθεία παλινδρόμησης Σ (Y i -Ȳ ) 2 = Σ (Y i Y i )2 + Σ (Ȳ - Y i )2 Παρατηρούμε ότι Σ ( Y i - Ȳ ) 2 Σ (Y i - Y i )2 είναι η Συνολική Μεταβλητότητα του Y (SST ήτοι Sum of Squares Total) είναι η μεταβλητότητα του Υ ως προς την ευθεία παλινδρόμησης (SSE ήτοι Sum of Squared Errors) o Μη Ερμηνευμένη Μεταβλητότητα (από την ευθεία παλινδρόμησης) Σ (Ȳ - Y i )2 είναι η Ερμηνευμένη Μεταβλητότητα (από την ευθεία παλινδρόμησης) (SSR ήτοι Sum of Squared Regression ) Επομένως Συνολική Μεταβλητότητα = Μη Ερμηνευμένη Μεταβλητότητα + Ερμηνευμένη Μεταβλητότητα Εάν η γραμμική σχέση περιγράφει με ακρίβεια τη σχέση ανάμεσα στις μεταβλητές Χ και Υ, η Μη Ερμηνευμένη Μεταβλητότητα (από την ευθεία παλινδρόμησης) θα πρέπει να είναι μικρή σε σχέση με τη Συνολική Μεταβλητότητα.
Σελίδα 9 Ορίζουμε τον συντελεστή προσδιορισμού R 2 = Ερμηνευμένη Μεταβλητότητα Συνολική Μεταβλητότητα = SSR SST Εάν R 2 = 0, τότε δεν υπάρχει γραμμική σχέση Εάν R 2 = 1, τότε υπάρχει τέλεια γραμμική σχέση R 2 είναι μεταξύ του 0 και 1 R 2 είναι ένα μέτρο της γραμμικής σχέσης