Στατιστική Ι Ανάλυση Παλινδρόμησης
Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι από τις ευρέως χρησιμοποιούμενες μεθόδους ανάλυσης στην επαγωγική στατιστική. Η Ανάλυση Παλινδρόμησης αναφέρεται στις μεθόδους με τις οποίες γίνονται εκτιμήσεις των τιμών μιας μεταβλητής από την γνώση των τιμών μιας ή περισσοτέρων άλλων μεταβλητών καθώς και στη μέτρηση των σφαλμάτων που συνεπάγεται η διαδικασία αυτή. Η Ανάλυση Συσχετίσεως αναφέρεται στις μεθόδους για την μέτρηση του βαθμού αλληλεξαρτήσεως μεταξύ των μεταβλητών αυτών.
Ανάλυση παλινδρόμησης ΙΙ Θα ορίσουμε την ανάλυση παλινδρόμησης και ανάλυση συσχέτισης μέσω της ευθύγραμμης σχέσης δύο μεταβλητών. Ο όρος «ευθύγραμμη» σημαίνει ότι μια εξίσωση ευθείας γραμμής της μορφής YA+BX όπου Α και Β είναι σταθεροί αριθμοί, χρησιμοποιείται για να περιγράψουμε τη μέση σχέση μεταξύ των μεταβλητών και να προχωρήσουμε στη διαδικασία της εκτίμησης. Ο παράγοντας του οποίου θέλουμε να εκτιμήσουμε τις τιμές ονομάζεται «εξαρτημένη» μεταβλητή και συμβολίζεται με Υ. Ο παράγοντας με βάση τον οποίο θα γίνουν αυτές οι εκτιμήσεις ονομάζεται «ανεξάρτητη» μεταβλητή και συμβολίζεται με Χ. Π.χ. οι δαπάνες κατανάλωσης μπορούν να εκτιμηθούν με βάση το εισόδημα, οι προσωπικές καθαρές αποταμιεύσεις με βάση το διαθέσιμο εισόδημα.
Ανάλυση παλινδρόμησης ΙΙΙ Ο πληθυσμός αποτελείται από όλα τα ζευγάρια των παρατηρήσεων εξαρτημένης και ανεξάρτητης μεταβλητής. Γενικά, εκτιμήσεις ή προβλέψεις γίνονται με βάση ένα δείγμα του πληθυσμού αυτού. Παράδειγμα: Ετήσια δαπάνη διατροφής και ετήσιο καθαρό εισόδημα ενός δείγματος 0 οικογενειών μιας συγκεκριμένης περιοχής, το 1990.
Ανάλυση παλινδρόμησης IV Οικογένεια Ετήσια Δαπάνη Διατροφής (Υ) Ετήσιο Καθαρό Εισόδημα (Χ) 1 5, 8 5,1 6 3 5,6 3 4 4,6 4 5 11,3 54 6 8,1 59 7 7,8 44 8 5,8 30 9 5,1 40 10 18 8 11 4,9 4 1 11,8 58 13 5, 8 14 4,8 0 15 7,9 4 16 6,4 47 17 0 11 18 13,7 85 19 5,1 31 0,9 6
Ανάλυση παλινδρόμησης V Κατασκευάζουμε το στικτό διάγραμμα (κουκκίδες), με τον άξονα των y να αντιπροσωπεύει την μεταβλητή Υ και τον άξονα των x, να αντιπροσωπεύει την μεταβλητή Χ. Το ζεύγος των παρατηρήσεων για κάθε οικογένεια ορίζει ένα σημείο στο στικτό διάγραμμα. Εάν οι τιμές του Υ τείνουν να αυξηθούν ή να μειωθούν καθώς οι τιμές της Χ αυξάνουν τότε υπάρχει μια ανάλογη ή αντιστρόφως ανάλογη σχέση μεταξύ των μεταβλητών. Στο συγκεκριμένο παράδειγμα καθώς το ετήσιο καθαρό εισόδημα αυξάνει, τείνουν να αυξηθούν και οι ετήσιες δαπάνες διατροφής.
Στοχοι Ανάλυσης Παλινδρόμησης 1) Ο πρώτος στόχος της ανάλυσης παλινδρόμησης είναι να δώσουμε εκτιμήσεις των τιμών της εξαρτημένης μεταβλητής από τιμές της ανεξάρτητης μεταβλητής. Η διαδικασία της εκτίμησης στηρίζεται στη δειγματική γραμμή παλινδρόμησης η οποία περιγράφει την κατά μέσο όρο υφιστάμενη σχέση ανάμεσα στις μεταβλητές Χ και Υ στα δειγματικά δεδομένα. ) Ο δεύτερος στόχος της ανάλυσης παλινδρόμησης είναι να δώσουμε μέτρα του σφάλματος που συνεπάγεται η χρησιμοποίηση της γραμμής παλινδρόμησης ως μέσο εκτιμήσεως. 3) Ο τρίτος στόχος που επιτυγχάνεται μέσω της ανάλυσης συσχέτισης είναι να πάρουμε ένα μέτρο του βαθμού αλληλεξαρτήσεως ή συσχετίσεως μεταξύ των μεταβλητών. Ο συντελεστής συσχέτισης και ο συντελεστής υπολογισμού μετρούν την ένταση της σχέσης μεταξύ των μεταβλητών.
Μέθοδος ελαχίστων τετραγώνων Η δειγματική ευθεία παλινδρόμησης είναι η καλύτερη προσαρμοζόμενη γραμμή στα Ŷ α+ δειγματικά βx δεδομένα. Για να ορίσουμε σε ένα σύνολο δεδομένων την δειγματική ευθεία παλινδρόμησης θα πρέπει να εκτιμήσουμε τα α, β. Η μέθοδος των ελαχίστων τετραγώνων (η γραμμή των ελαχίστων τετραγώνων) θέτει ως προϋπόθεση ότι το άθροισμα των τετραγώνων των αποκλίσεων των τιμών της εξαρτημένης μεταβλητής από τις αντίστοιχα υπολογιζόμενες τιμές από την γραμμή παλινδρόμησης πρέπει να είναι ελάχιστο, δηλαδή το να είναι ελάχιστο. (Y Ŷ )
Μέθοδος ελαχίστων τετραγώνων II Η γραμμή των ελαχίστων τετραγώνων έχει την ιδιότητα ότι περνά από το σημείο των μέσων ( X, Y ) γεγονός το οποίο μεταφράζεται στο ότι το άθροισμα των θετικών και αρνητικών αποκλίσεων ισούται με το 0, δηλαδή: Κάνοντας κατάλληλους μαθηματικούς υπολογισμούς καταλήγουμε στα εξής α και β: (Y Ȳ )0 α β β Y β X, ( X X Y X i ( X i i i X )( Y i nxy nx X i ) Y ),
Μέθοδος ελαχίστων τετραγώνων III Οικογένεια Ετήσια Δαπάνη Διατροφής (Υ) Ετήσιο Καθαρό Εισόδημα (Χ) ΧΥ Χ Υ 1 5, 8 145,6 784 7,04 5,1 6 13,6 676 6,01 3 5,6 3 179, 104 31,36 4 4,6 4 110,4 576 1,16 5 11,3 54 610, 916 17,69 6 8,1 59 477,9 3418 65,61 7 7,8 44 343, 1936 60,84 8 5,8 30 174 900 33,64 9 5,1 40 04 1600 6,01 10 18 8 1476 674 34 11 4,9 4 05,8 1764 4,01 1 11,8 58 684,4 3364 139,4 13 5, 8 145,6 784 7,04 14 4,8 0 96 400 3,04 15 7,9 4 331,8 1764 6,41 16 6,4 47 300,8 09 40,96 17 0 11 40 1544 400 18 13,7 85 1164,5 75 187,69 19 5,1 31 158,1 961 6,01 0,9 6 75,4 676 8,41 Σύνολα: 159,3 910 955,5 5308 168,17
Μέθοδος ελαχίστων τετραγώνων IV X Y β α Y X i n Yi n X Y X i i i β X 910 0 159,3 0 nxy nx 7,965 45,5 7,965 955,5 0* 45,5*7,965 5308 0* 45,5 0,18411* 45,5 0,41 0,18411 Άρα η ευθεία παλινδρόμησης των ελαχίστων τετραγώνων θα είναι η Ŷ 0,41+0,18411 X Μπορεί να χρησιμοποιηθεί για να προβλέψουμε μια μελλοντική τιμή της Υ ή να εκτιμήσουμε μια μέση τιμή της Υ για δεδομένη τιμή της Χ.
Μέθοδος ελαχίστων τετραγώνων V Το β αναφέρεται και ως δειγματικός συντελεστής παλινδρόμησης ή δειγματικός συντελεστής κλίσης. Η τιμή β0,18411 είναι θετική άρα δείχνει ότι όσο αυξάνει το εισόδημα αυξάνονται και οι εκτιμώμενες δαπάνες διατροφής. Για δύο οικογένειες των οποίων τα ετήσια καθαρά εισοδήματα διαφέρουν κατά 1000 ευρώ, η εκτιμούμενη διαφορά στις ετήσιες δαπάνες διατροφής τους θα ισούται με 184,11 ευρώ.
Τυπικό σφάλμα της εκτιμήσεως Όπως η τυπική απόκλιση χρησιμοποιείται ως ένα μέτρο διασποράς ενός συνόλου παρατηρήσεων γύρω από τη μέση τιμή, έτσι ορίζουμε και τη διασπορά των τιμών της μεταβλητής Υ γύρω από την ευθεία παλινδρόμησης και ονομάζεται τυπικό σφάλμα της εκτιμήσεως. s Y, X (Y Ŷ ) n
Τυπικό σφάλμα της εκτιμήσεως II Στο προηγούμενο παράδειγμα το τυπικό σφάλμα της εκτιμήσεως ισούται με: s Y, X Y a Y β 168,17 168,17 ( + n 0,41)*159,3 0 65,6316 18 XY 0,18411*955,5 1704,030105 1,56