Κεφάλαιο 7. Γραμμική και λογιστική παλινδρόμηση. Σύνοψη. Προαπαιτούμενη γνώση. 7.1 Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Linear Regression)

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Κεφάλαιο 7. Γραμμική και λογιστική παλινδρόμηση. Σύνοψη. Προαπαιτούμενη γνώση. 7.1 Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Linear Regression)"

Transcript

1 Κεφάλαιο 7 Σύνοψη Γραμμική και λογιστική παλινδρόμηση Στο κεφάλαιο αυτό γίνεται ανάλυση της μεθοδολογίας της απλής και πολλαπλής γραμμικής παλινδρόμησης, και αναφορά στη μεθοδολογία της λογιστικής παλινδρόμησης. Γίνεται αρκετά λεπτομερής θεωρητική αναφορά σε κάθε μεθοδολογία καθώς και επεξήγηση των επιλογών και των παραμέτρων που παρέχονται από το πρόγραμμα. Σε κάθε περίπτωση υπάρχουν εφαρμογές σε δειγματικά αρχεία δεδομένων και επεξήγηση των αποτελεσμάτων. Σημειώνεται ότι χρησιμοποιήθηκαν δύο αρχεία δεδομένων (solar.sav και carcrash.sav) τα οποία χρησιμοποιούνται στο μάθημα Στατιστικά Πρότυπα του ΔΠΜΣ, Μαθηματική προτυποποίηση σε σύγχρονες τεχνολογίες και στην οικονομία του ΕΜΠ (υπεύθυνη μαθήματος Χ. Καρώνη). Προαπαιτούμενη γνώση Για την καλύτερη κατανόηση του κεφαλαίου αυτού οι αναγνώστες θα πρέπει να έχουν παρακολουθήσει το μάθημα των γενικευμένων γραμμικών μοντέλων σε προχωρημένο επίπεδο, καθώς μέσω των επιλογών του προγράμματος γίνεται εκτενής αναφορά σε πληθώρα κριτηρίων και ελέγχων. Ακόμα ως προαπαιτούμενη είναι η βασική γνώση των στατιστικών ελέγχων, της εκτιμητικής (κυρίως η έννοια των διαστημάτων εμπιστοσύνης), των κατανομών Student, X και κανονικής, των πράξεων μεταξύ πινάκων καθώς και η γνώση της έννοιας των αντίστροφων πινάκων. Από τα εγχειρίδια που παρουσιάζουν με πληρότητα την ύλη του συγκεκριμένου κεφαλαίου αναφέρονται ενδεικτικά τα βιβλία των Carver και Nash, Καρώνη, Οικονόμου και Καρώνη, Coakes και Steed, Feld, Noruss, Howt Cramer και Montgomery and Peck κ.ά. (βλ. βιβλιογραφικές αναφορές). Ακόμα για το συγκεκριμένο κεφάλαιο όπως για τα Κεφάλαια 3-6 σημαντική πηγή πληροφοριών αποτελεί ο ιστότοπος του SPSS. 7. Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Lnear Regresson) Στην απλή παλινδρόμηση ο στόχος είναι να βρεθεί η μαθηματική σχέση που συνδέει τις παρατηρήσεις δύο μεταβλητών. Έχουμε ήδη δει ότι ο συντελεστής συσχέτισης μας δείχνει το αν και κατά πόσο δύο μεταβλητές σχετίζονται, χωρίς όμως να μας παρέχει τον τρόπο με τον οποίο μεταβάλλονται οι τιμές της μιας σε σχέση με τις τιμές της άλλης. Αρχικά, γίνεται η γραφική παράσταση των δεδομένων (scatter lot) ώστε να προσεγγιστεί η μορφή της καμπύλης που τα συνδέει. Οι παρατηρήσεις των μεταβλητών απεικονίζονται σε ένα σύστημα ορθογωνίων συντεταγμένων. Παρατηρώντας στη συνέχεια το διάγραμμα διασποράς προκύπτει το συμπέρασμα ότι δεν υπάρχει καμπύλη που να ενώνει όλα τα σημεία και για τον λόγο αυτό αναζητάμε εκείνη την καμπύλη που προσαρμόζεται όσο το δυνατό καλύτερα στα δεδομένα που υπάρχουν. Η απλούστερη μορφή συσχέτισης δύο μεταβλητών είναι η γραμμική, δηλ. θα μελετηθεί η απλή γραμμική παλινδρόμηση και στη συνέχεια θα γίνει μια γενίκευση για περισσότερες από δύο μεταβλητές (πολλαπλή γραμμική παλινδρόμηση). Η γραμμική συσχέτιση εκφράζεται μαθηματικά από τη σχέση: Όπου: Y = β + β x + ε 0 Εξίσωση 7.

2 Υ η εξαρτημένη μεταβλητή, x η ανεξάρτητη μεταβλητή, β 0 η τεταγμένη, δηλ. η τιμή της εξαρτημένης για x = 0, β η κλίση της ευθείας, και ε το τυχαίο σφάλμα με Ε(ε ) = 0, που είναι η απόκλιση της Υ από την ευθεία γραμμικής παλινδρόμησης E(Y ) = β 0 + β x. Η ευθεία γραμμικής παλινδρόμησης δεν περνάει απαραίτητα από όλα τα σημεία των παρατηρήσεων Y. Αυτό έχει ως αποτέλεσμα στις περισσότερες περιπτώσεις για κάθε x να παράγεται μια προβλεπόμενη τιμή για τη μεταβλητή: Y = ˆ β + ˆ β x ˆ 0 Εξίσωση 7. Όπου: Y = Yˆ + ε Εξίσωση 7.3 Εικόνα 7.: Γραφική απεικόνιση των δεδομένων της ευθείας παλινδρόμησης και των σφαλμάτων Όπως βλέπουμε και από το παραπάνω σχήμα, σκοπός μας είναι να πετύχουμε μια καλή προσαρμογή της ευθείας στα δεδομένα, δηλαδή να ελαχιστοποιηθούν όσο το δυνατόν οι αποκλίσεις (σφάλματα ε ) των δεδομένων από τις εκτιμώμενες τιμές. Συνεπώς, για την εκτίμηση των παραμέτρων β 0 και β χρησιμοποιείται η μέθοδος των ελάχιστων τετραγώνων. Με τη μέθοδο αυτή η ευθεία που προσαρμόζεται καλύτερα στα δεδομένα που έχουν δοθεί είναι αυτή που ελαχιστοποιεί το άθροισμα των τετραγώνων των σφαλμάτων (καταλοίπων-resduals). n n n e = ( Y Y ) = [ Y ( β 0+ βx)] = = = Εξίσωση 7.4 Από τη σχέση αυτή λαμβάνουμε τις πρώτες μερικές παραγώγους, τις οποίες θέτουμε ίσες με το μηδέν και από το x γραμμικό σύστημα εκτιμάμε τις παραμέτρους, όπου: ˆ = n = β ( X X)( Y Y) n = ( X X) Εξίσωση 7.5 Και

3 ˆ β = Y ˆ β X 0 Εξίσωση 7.6 Αυτό που εξετάζουμε στα γραμμικά μοντέλα (Y = Β 0 + β x ), είναι η ύπαρξη ή μη γραμμικής σχέσης μεταξύ της εξαρτημένης (deendent) μεταβλητής Υ και της ανεξάρτητης (ndeendent) μεταβλητής X. Οπότε ορίζουμε ως μηδενική υπόθεση: «Δεν υπάρχει γραμμική σχέση μεταξύ Y και X», δηλαδή: H : ˆ β = 0 Εξίσωση 7.7 Έναντι της εναλλακτικής υπόθεσης: «Υπάρχει γραμμική σχέση μεταξύ Y και X», δηλαδή: Εξίσωση 7.8: Δίπλευρος έλεγχος Ο έλεγχος γίνεται σε (-α)% επίπεδο σημαντικότητας και η στατιστική συνάρτηση υπό την H 0 είναι: 0 H : ˆ β 0 Εξίσωση 7.9 Ακολουθεί την t-κατανομή με n- βαθμούς ελευθερίας (T-test). Περιοχή απόρριψης: απορρίπτουμε την H 0 αν: ˆ β T = se..( ˆ β ) T > tn ; a/ Εξίσωση 7.0: Δίπλευρος έλεγχος Αντίστοιχος έλεγχος για τη διατομή (ntercet) β 0 δεν έχει νόημα. Στο σύνολο των παρατηρήσεων η ολική διακύμανση, δηλαδή η ολική μεταβλητότητα των παρατηρήσεων (SST), δίδεται από τη σχέση: n = ( Y Y) Εξίσωση 7. Η οποία αναλύεται σε δύο μέρη: n n n n ˆ ˆ ˆ ˆ ( Y Y) = [( Y Y) + ( Y Y)] = ( Y Y) + ( Y Y) = = = = Εξίσωση 7. Αποδεικνύεται ότι: n ( Yˆ Y)( Y Yˆ) = 0 = Εξίσωση 7.3

4 Ένα μέρος εξηγείται από την ευθεία παλινδρόμησης (regresson sum of squares): n SSR = ( Yˆ Y ) = Εξίσωση 7.4 Ένα άλλο παραμένει ανερμήνευτο (error sum of squares): n SSE = ( Y Yˆ ) = Εξίσωση 7.5 Οπότε: SST = SSR + SSE Εξίσωση 7.6 Η ανάλυση γίνεται για να ερμηνευτεί η μεταβλητότητα των παρατηρήσεων που μελετώνται. Βέβαια ο αρχικός στόχος είναι να ελαττωθεί το μέρος της συνολικής μεταβλητότητας που παραμένει ανερμήνευτο. Συνεπώς, ένα μέτρο για να κρίνουμε αν η ευθεία παλινδρόμησης προσαρμόζεται ικανοποιητικά στα δεδομένα είναι ο συντελεστής προσδιορισμού (coeffcent of determnaton) που δίνεται από τη σχέση: R SSR SST SSE SSE = = = SST SST SST Εξίσωση 7.7 Πρέπει να είναι όσο το δυνατό μεγαλύτερος. Αν R = 0,78 σημαίνει ότι 78% της μεταβλητότητας των αποδόσεων της επένδυσης σχετίζεται με τις αποδόσεις δείκτη αναφοράς και το % δεν συνδέεται. Μ άλλα λόγια ο συντελεστής προσδιορισμού R εκφράζει το ποσοστό της συνολικής μεταβλητότητας που εξηγείται από το μοντέλο παλινδρόμησης. Μια παραλλαγή του συντελεστή προσδιορισμού είναι ο τροποποιημένος συντελεστής προσδιορισμού (adjusted coeffcent of the termnaton) που δίνεται από τη σχέση: R SSE n adj = = ( R ) SST n Εξίσωση 7.8 n n

5 Χρησιμοποιείται για τη σύγκριση nested μοντέλων. Όλα τα παραπάνω συνοψίζονται στον πίνακα Ανάλυσης Διασποράς της Παλινδρόμησης (ANOVA-Τable). ANOVA-Τable στην απλή γραμμική παλινδρόμηση Source (Πηγή διακύμανσης) Regresson (Μοντέλο) Resduals (Σφάλματα) SS (Άθροισμα τετραγώνων) n Df (β.ε.) MS (Μέσα τετραγώνων) SSR = ( Yˆ ) Y MSR = SSR = n SSE = ( Y Yˆ ) = n- SSE MSE = n F F Prob > F MSR MSE ( ) = PF> F, n ; a Total (Ολικό) n SST = ( Y Y ) = n- Πίνακας 7.: F-test για το γραμμικό μοντέλο Είδαμε ότι η ολική διακύμανση των δεδομένων χωρίζεται σε δύο μέρη, ένα εξαιτίας της παλινδρόμησης και ένα που παραμένει ανερμήνευτο. Από τη θεωρία πιθανοτήτων ξέρουμε ότι: SSR ( n ) MSE = Χ σ σ Εξίσωση 7.9 ~ n Από την άλλη αν β 0 = 0 έχουμε ότι: Ο λόγος αυτών των δύο θα μας δώσει: SSR ~ σ Χ Εξίσωση 7.0 MSR F = MSE F ~, n ; a Εξίσωση 7. Ο F-έλεγχος για το αν υπάρχει γραμμική σχέση μεταξύ των X και Y (δηλαδή για το αν μια ευθεία είναι χρήσιμη για την ερμηνεία μέρους της μεταβλητότητας των δεδομένων) βασίζεται στην παρατήρηση ότι: n β = E( MSR) = σ + ( x x) Εξίσωση 7.

6 Και: EMSE ( ) = ES ( ) = σ Εξίσωση 7.3 Όταν το μοντέλο παλινδρόμησης είναι σωστά καθορισμένο. Εάν η β 0 (sloe), δηλαδή η παλινδρόμηση δεν προσθέτει τίποτα επιπλέον για την ερμηνεία της μεταβλητότητας των παρατηρήσεων τα δύο μέσα αθροίσματα τετραγώνων MSR και MSE και έχουν την ίδια μέση τιμή σ. Επομένως έχουμε το λόγο: MSR MSE < Εξίσωση 7.4 Αν η υπόθεση της γραμμικής σχέσης των X και Y δεν ευσταθεί τότε έχουμε το λόγο: MSR MSE > Εξίσωση 7.5 Αν ευσταθεί η γραμμική σχέση (β 0). Ο F-έλεγχος για την ύπαρξη ή όχι γραμμικής σχέσης των X και Y ορίζεται ως εξής: H 0: δεν υπάρχει γραμμική σχέση μεταξύ των Χ και Υ Εξίσωση 7.6 H : υπάρχει γραμμική σχέση μεταξύ των Χ και Υ Εξίσωση 7.7 MSR F = MSE F ~, n ; a Εξίσωση 7.8 Απορρίπτουμε την H 0 αν: F > F, n ; a Εξίσωση 7.9 Στην απλή γραμμική παλινδρόμηση το F-test είναι ισοδύναμο με το T-test για μηδενική κλίση. Αυτό συμβαίνει επειδή T = F όπου T~t n-;α και F F,n-;α. Πολλαπλή γραμμική παλινδρόμηση Η πολλαπλή γραμμική παλινδρόμηση (Multle Lnear Regresson) είναι επέκταση της απλής γραμμικής παλινδρόμησης από το μοντέλο. Y = β + β x 0 Εξίσωση 7.30

7 Μεταφερόμαστε στο πολλαπλό γραμμικό μοντέλο: Y = β + β X β X + ε =,..., n 0, Εξίσωση 7.3 Ο όρος γραμμικό μοντέλο αναφέρεται στις παραμέτρους β j, j =,, - (και όχι στις ανεξάρτητες μεταβλητές x j) και κατ επέκταση τα μοντέλα: Y = β + β X + β X + ε = n 0,..., Εξίσωση 7.3: Πολυωνυμικό μοντέλο Y X X X n = β0 + β + β + β3 3 + ε =,..., Εξίσωση 7.33: Μοντέλο με αλληλεπίδραση Θεωρούνται ως πολλαπλά γραμμικά μοντέλα. Απεικόνιση της πολλαπλής παλινδρόμησης με χρήση πινάκων. Για n ανεξάρτητες παρατηρήσεις έχουμε: Y = β X + β X β X + ε 0 0, Y = β X + β X β X + ε 0 0,... Y = β X + β X β X + ε n 0 n0 n n, n Εξισώσεις 7.34 Ισοδύναμα: Y β0 ε Y β ε... = X + Y = Xβ + ε Y β n ε n Εξίσωση 7.35 Όπου: X0 X... X, X0 X... X, X = Xn 0 Xn... Xn, Εξίσωση 7.36: Πίνακας σχεδιασμού (Desgn Matrx)

8 Ομοίως, με την απλή παλινδρόμηση για την εκτίμηση των συντελεστών: ββ jj, jj =,,, εφαρμόζουμε τη μέθοδο των ελαχίστων τετραγώνων Εξίσωση 7.37 n n ( β) = ˆ ˆ ˆ ˆ ˆ ε = ( β0 + β + β + β3 3 + ε... + β, = = SSE Y X X x X ˆ T = ( Y Xβ) ( Y X ˆ β) Εξίσωση 7.38 Παίρνοντας τις πρώτες μερικές παραγώγους προκύπτει ένα σύστημα με εξισώσεις και αγνώστους. Ισοδύναμα: ˆ ˆ ( ) T T T T Xβ = Y X Xβ = X Y β = X X X Y Εξίσωση 7.39 Οι εκτιμήτριες β μπορούν να υπολογιστούν είτε λύνοντας το x σύστημα είτε πολλαπλασιάζοντας τους πίνακες: ANOVA-Τable στο πολλαπλό γραμμικό μοντέλο Source (Πηγή μεταβλητότητας) SS (Άθροισμα τετραγώνων) Df (β.ε.) MS (Μέσα τετραγώνων) F Prob > F Regresson (Μοντέλο) ˆT T SSR X Y ny = β - MSR = SSR F MSR MSE PF ( > F ) =, n a ; Resduals (Σφάλματα) T ˆT T SSE = Y Y β X Y n- SSE MSE = n Total (Ολικό) T SST = Y Y ny n- Πίνακας 7.: F- έλεγχοι στην πολλαπλή γραμμική παλινδρόμηση F-έλεγχος για τη σημαντικότητα όλου του μοντέλου (overall F-test) Όπως και στην απλή παλινδρόμηση, έτσι και εδώ, έχουμε έναν F- έλεγχο για όλο το μοντέλο. Οπότε: H : β = β =... = β = Εξίσωση 7.40 Έναντι της: HH : ττττττττάχχχχχχχχχχχχ ένννν ββjj 0, jj =,, Εξίσωση 7.4

9 Συνεπώς: MSR SSR / ( ) F = = ~ F MSE SSE /( n ) Εξίσωση 7.4, n a ; Απορρίπτεται η Η 0 για: Εξίσωση 7.43 Το SSR λαμβάνει τη συνεισφορά όλων των ανεξάρτητων μεταβλητών. Ωστόσο δεν συνεισφέρουν όλες το ίδιο σημαντικά στην ερμηνεία της μεταβλητότητας των Y και επίσης κάποιες από αυτές σχετίζονται μεταξύ τους, άρα δεν είναι αναγκαίες μέσα στο μοντέλο. Partal F-tests (varables-added-n-order ή Tye I F-tests) Ένας τρόπος για να ελεγχθεί η μεμονωμένη συνεισφορά κάθε ανεξάρτητης μεταβλητής στο τετραγωνικό άθροισμα της παλινδρόμησης (SSR) είναι η χρήση των artal F-tests. To SSR μπορεί να αναλυθεί στο άθροισμα: SSR = SS( β ) + SS( β β ) SS( β β,..., β ) Εξίσωση 7.44 Όπου, SS (β β ) το επιπλέον άθροισμα τετραγώνων από την προσθήκη της X στο μοντέλο παλινδρόμησης, δηλαδή η επιπλέον μεταβλητότητα της Y που ερμηνεύεται από την προσθήκη της X στο μοντέλο αφού έχει ήδη συμπεριληφθεί η X. Παρατηρούμε ότι η σειρά της προσθήκης των ανεξάρτητων μεταβλητών είναι τρομερά σημαντική για τον υπολογισμό αυτών των artal F-tests. Εάν θέλουμε απλά να εξετάσουμε το κατά πόσο για παράδειγμα μια X. είναι σημαντική για την πρόβλεψη της Y τότε θα κάνουμε μια μονοπαραγοντική ανάλυση (απλή γραμμική παλινδρόμηση). Για να απαντήσουμε όμως στο ερώτημα το κατά πόσο η προσθήκη της X συνεισφέρει στατιστικά σημαντικά στην πρόβλεψη της Y αφού έχουμε ήδη λογαριάσει τη συνεισφορά της X, χρησιμοποιούμε ένα artal F-test. Όπου: SSR( β, β) SSR( β)/ F = SSR( β, β )/( n ) Εξίσωση 7.45 Πιο γενικά: [ SSR( β, β,..., β, β,..., β ) SSR( β,..., β )] / k * * * * * * k = * * * SSR β β β k β β n k F( X, X,..., X / X, X,..., X ) Εξίσωση 7.46 (,,...,,,..., ) / ( ) Ένας άλλος τρόπος για να ελέγχουμε αν η προσθήκη μιας νέας μεταβλητής, αφού έχουμε ήδη μεταβλητές στο μοντέλο, συμβάλλει στατιστικά σημαντικά στην πρόβλεψη της Y είναι η χρήση ενός T-test.

10 Ορίζουμε: H : 0 0 β = Εξίσωση 7.47 Έναντι της: H : 0 β Εξίσωση 7.48 T ˆ β = ~ t se..( ˆ β ) n Εξίσωση 7.49 Απορρίπτουμε την H 0 για: T > tn ; a Εξίσωση 7.50 Παρατήρηση: * T = artalf X X X (,..., ) Εξίσωση 7.5 Varables-added-last ή Tye III F-tests Ένας τελευταίος F-έλεγχος είναι ο Tye III F-test που βασίζεται στο άθροισμα τετραγώνων κάθε μεταβλητής αν είναι γνωστές όλες οι υπόλοιπες μεταβλητές του μοντέλου. Εάν έχουμε -μεταβλητές τότε υπολογίζουμε τα: SSR( X X, X,..., X ) 3 SSR( X X, X,..., X ) 3... SSR( X X, X,..., X ) Εξισώσεις 7.5 Όπου η υπό εξέταση μεταβλητή προστίθεται κάθε φορά τελευταία στο μοντέλο. Υποθέσεις του πολλαπλού γραμμικού μοντέλου. Ανεξαρτησία: Οι παρατηρήσεις Y πρέπει να είναι στατιστικά ανεξάρτητες μεταξύ τους (όταν λαμβάνονται πολλαπλές μετρήσεις από το ίδιο υποκείμενο τότε θα πρέπει να χρησιμοποιηθούν άλλες τεχνικές αναλύσεις).. Γραμμικότητα: Ο μέσος των παρατηρήσεων Y για κάθε συνδυασμό των X, X.., X - είναι ένας γραμμικός συνδυασμός αυτών: µ = β + β X β YX /, X,..., X 0, X

11 Εξίσωση Ομοσκεδαστικότητα: Η διασπορά των Y είναι ίδια για κάθε συνδυασμούς X, X.., X - με: σ YY/XX,XX, XX σσ ή ααααααααώςς σσ YY/XX,XX, XX Εξίσωση 7.54 σσ 4. Κανονικότητα: Για κάθε συνδυασμό X, X.., X - η μεταβλητή Y κατανέμεται κανονικά: Υ N µ σ ε N σ ~ ( ΥΧ,..., Χ, ) ή αλλιώς ~ (0, ) π Εξίσωση 7.55 Κατ επέκταση των παραπάνω οι προϋποθέσεις για την εφαρμογή της μεθόδου είναι:. Τα σφάλματα: ε = Y Yˆ Εξίσωση 7.56 Έχουν μηδενική μέση τιμή και άγνωστη διακύμανση σ.. Τα ε,., ε n είναι ασυσχέτιστα δηλαδή: j έχουμε: Cov( ε, ε ) = 0 Εξίσωση 7.57 j 3. Άμεση συνέπεια των παραπάνω υποθέσεων είναι ότι κάθε παρατήρηση Y έχει: EY ( ) = β + β x= µ 0 Y / X Εξίσωση 7.58 Με κοινή διακύμανση σ και ότι οι παρατηρήσεις Y και Y j όπου I j είναι ασυσχέτιστες. 4. Τα σφάλματα ε ακολουθούν N(0, σ ), το οποίο συνεπάγεται ότι τα ε εκτός από ασυσχέτιστα είναι και ανεξάρτητα μεταξύ τους. Ο έλεγχος της εγκυρότητας του μοντέλου γίνεται με τη χρήση των σφαλμάτων (καταλοίπων). Τα σφάλματα χρησιμοποιούνται επίσης, για την ανίχνευση παρατηρήσεων που συμπεριφέρονται αντιφατικά με όλο το μοντέλο. Πολύ υψηλά σφάλματα μπορεί να υποδεικνύουν μια ασυνήθιστα υψηλή παρατήρηση ή απλά μια κοινή εφαρμογή. Από την άλλη, μια παρατήρηση μπορεί να αξίζει να ληφθεί υπόψη ακόμα και αν το σφάλμα της είναι μικρό, επειδή καθορίζει σε μεγάλο βαθμό την ευθεία παλινδρόμησης. Αναλυτικότερα τα διαγνωστικά ελέγχου των υποθέσεων του πολλαπλού μοντέλου παλινδρόμησης θα παρουσιαστούν ακολούθως μέσα από τις δυνατές επιλογές του προγράμματος.

12 Βήματα για την επιλογή του «βέλτιστου» μοντέλου παλινδρόμησης Ορίζουμε το μέγιστο δυνατό μοντέλο (πλήρες) δηλαδή το μοντέλο που θα έχει: όλους τους redctors X, =,, k, όλους τους μεγαλύτερου βαθμού όρους (που επιθυμούμε), τις μεταξύ τους αλληλεπιδράσεις. Εάν το πλήθος των μεταβλητών- redctors και της διατομής είναι k + = n (όπου n το πλήθος των παρατηρήσεων), τότε οι βαθμοί ελευθερίας του σφάλματος θα είναι μηδέν. Έτσι δεν θα έχει νόημα πόσους redctors θα επιλέξουμε γιατί: Εξίσωση 7.59 αδιαφορώντας αν το μοντέλο παλινδρόμησης είναι λογικό ή όχι. R SSE = =, SST Ελάχιστοι απαιτούμενοι βαθμοί ελευθερίας για το σφάλμα n-k- > 0. Μια άλλη πρόταση είναι η επιλογή n > 5k ή ακόμα n 0k. Έτσι, αν έχουμε 50 παρατηρήσεις το μεγαλύτερο μοντέλο θα έχει redctors μεταξύ k = 5 και k-0. Ορίζουμε το κριτήριο με το οποίο θα γίνει η επιλογή των redctors X. Υποθέτουμε ότι το πλήρες μοντέλο είναι το: Y = β0 + βx βx βkxk + ε Εξίσωση 7.60 Το μειωμένο μοντέλο είναι το: Y = β0 + βx βx ε όπου: k Εξίσωση 7.6 Υποψήφια κριτήρια για την επιλογή μοντέλου είναι: α) Ο συντελεστής προσδιορισμού R: Εξίσωση 7.6α Μεγιστοποιεί το πλήρες μοντέλο. Η εναλλακτική του μορφή είναι: Εξίσωση 7.6β Προσαρμόζει το R για το μέγεθος του κάθε μοντέλου. β) Η F-στατιστική συνάρτηση με την οποία συγκρίνουμε το πλήρες με το περιορισμένο μοντέλο: F R R ( YX,..., X ) [ SSE SSE ]/( k ) SSE = SST SSE / ( n ) n = = ( R )( ) SST / ( n ) n adj ( ) ( k) = όπου MSE( k ) MSE ( k ) = SSE( k ) n k

13 Εξίσωση 7.63 Η F μετράει σχετικές αλλαγές στο σφάλμα, έπειτα από την προσθήκη ενός πλήθους από k- redctors και συγκρίνεται με την F (k-)(,n-k-) κατανομή. γ) Η διασπορά στο περιορισμένο μοντέλο: Θέλουμε να ελαχιστοποιηθεί. δ) Η C Mallow s στατιστική συνάρτηση: MSE ( ) = SSE( ) n Εξίσωση 7.64 SSE C = n + ˆ σ ( ) [ ( )] Εξίσωση 7.65 Όππππππ σσ : η καλύτερη εκτίμηση της διασποράς των Y και συνήθως: ˆ σ = MSE( k ) Εξίσωση 7.66 Σημειώνουμε ότι αν θεωρήσουμε ως καλύτερη εκτίμηση της διασποράς την MSE (k), τότε C = k+ για το πλήρες μοντέλο. Έτσι αν ένα περιορισμένο - μεταβλητών μοντέλο έχει διασπορά κοντά στο MSE (k) τότε C +. Όλα τα προαναφερθέντα κριτήρια εμπεριέχουν την ίδια πληροφορία. Έτσι, ισχύουν οι σχέσεις: F = ( R k R )/( k ) ( R k ) / ( n k ) Εξίσωση 7.67 Και: C = ( k F ) + ( k+ ) Εξίσωση 7.68 Ελέγχουμε την αξιοπιστία (relablty) του γραμμικού μοντέλου (slt-samle προσέγγιση): Για να ελέγξουμε την αξιοπιστία του μοντέλου, δηλαδή το κατά πόσο το μοντέλο κάνει καλή πρόβλεψη, ακολουθούμε την εξής διαδικασία: α) Χωρίζουμε τα δεδομένα μας σε δύο μέρη, ένα δοκιμαστικό δείγμα (tranng samle) και ένα κύριο δείγμα (valdaton samle). β) Προσαρμόζουμε το «βέλτιστο» μοντέλο στο δοκιμαστικό δείγμα Y ˆ = ˆ β ˆ... ˆ 0 + βx+ + β X Εξίσωση 7.69

14 Συγκεκριμένα θέτουμε: n { } Y = Εξίσωση 7.70 Το διάνυσμα των n προσαρμοσμένων τιμών Y από το δοκιμαστικό δείγμα με: R R ( Y / X, X,..., X ) r ( Y, Y) () = = ˆ Εξίσωση 7.7 γ) Χρησιμοποιούμε τα: ˆ β, ˆ β,..., ˆ β 0 Εξίσωση 7.7 Για να υπολογίσουμε το διάνυσμα των προσαρμοσμένων Y από το κύριο δείγμα βασιζόμενο στους συντελεστές παλινδρόμησης που υπολογίστηκαν για το δοκιμαστικό μοντέλο με: R = r ( Y, Y ˆ ) () Εξίσωση 7.73 Η ποσότητα R ()-R *() καλείται shrnkage on cross-valdaton. Τιμές της shrnkage μικρότερες από 0,0 υποδεικνύουν ένα αξιόπιστο μοντέλο και τιμές κοντά στο 0,9 χαρακτηρίζουν ένα μοντέλο ως προβληματικό. Σημείωση Για να πραγματοποιηθεί η slt-samle προσέγγιση θα πρέπει να έχουμε ένα αρκετά μεγάλο δείγμα ώστε να είμαστε σε θέση να το χωρίσουμε. Ο διαχωρισμός των δύο ομάδων γίνεται με μεθόδους δειγματοληψίας, όπως απλή τυχαία δειγματοληψία, στρωματοποιημένη και άλλα. Για την εκτέλεση της μεθόδου στο SPSS, η δυνατότητα προσφέρεται από την επιλογή Analyze > Regresson > Lnear Regresson. Εικόνα 7.: Το menu Lnear Regresson

15 Στο πλαίσιο Deendent ορίζουμε την εξαρτημένη συνεχή μεταβλητή, και στο πλαίσιο Indeendent(s) εισάγουμε τις ανεξάρτητες προς εξέταση μεταβλητές. Στη συνέχεια στο πεδίο Method επιλέγουμε τη μέθοδο επιλογής του βέλτιστου μοντέλου. Οι δυνατές επιλογές είναι: Enter: Με αυτή τη μέθοδο εισάγονται στο μοντέλο όλες οι μεταβλητές ανεξάρτητα από το αν είναι στατιστικά σημαντικές σε σχέση με την εξαρτημένη μεταβλητή. Stewse: Είναι μια παραλλαγή της διαδικασίας forward, που μας επιτρέπει να επανεξετάσουμε αν κάποια από τις μεταβλητές (εκτός από αυτήν που έχει μόλις εισαχθεί στο μοντέλο), μπορεί να αφαιρεθεί χρησιμοποιώντας τη διαδικασία backward. Βήμα, αρχικά ορίζεται ένα μέγιστο -value για την αφαίρεση κάποιας μεταβλητής και ένα ελάχιστο για την είσοδο κάποιας μεταβλητής. Έτσι ώστε -value OUT < < -value IN για να είμαστε σίγουροι ότι καμιά μεταβλητή που θα αφαιρεθεί από το μοντέλο δεν θα μπορεί να ξαναμπεί στο ίδιο βήμα της διαδικασίας. Βήμα, στη συνέχεια, υπολογίζονται όλα τα Τύπου III artal F-tests για κάθε υποψήφια μεταβλητή που δεν είναι ακόμα προσαρμοσμένη στο μοντέλο (adjusted) με όσες είναι ήδη μέσα στο μοντέλο. Εάν το χαμηλότερο -value είναι χαμηλότερο από το - value IN η μεταβλητή εισέρχεται. Βήμα 3, έπειτα, υπολογίζονται όλα τα artal F-tests για όλες τις μεταβλητές. Εάν το υψηλότερο -value είναι υψηλότερο από το -value OUT τότε η μεταβλητή απομακρύνεται. Το μοντέλο ξαναπροσαρμόζεται και το Bήμα 3 επαναλαμβάνεται μέχρις ότου καμιά μεταβλητή να μη μπορεί να μπει στο μοντέλο. Η διαδικασία πηγαίνει στο Bήμα και συνεχίζεται μέχρις ότου καμιά μεταβλητή να μην μπορεί ούτε να μπει ούτε να αφαιρεθεί από το μοντέλο. Remove: Σ αυτή τη μέθοδο όλες οι μεταβλητές (σε ένα μπλοκ) απομακρύνονται σε ένα μόνο βήμα. Backward: Είναι μια διαδικασία επιλογής στην οποία αρχικά εισάγονται στο μοντέλο όλες οι μεταβλητές και στη συνέχεια απομακρύνονται μία προς μία διαδοχικά. Βήμα προσαρμόζεται ένα πλήρες μοντέλο και ορίζεται ένα μέγιστο -value για την απομάκρυνση κάθε παράγοντα (για παράδειγμα 0%). Βήμα, πραγματοποιούνται όλα τα artal F-tests. Βήμα 3, αν το υψηλότερο -value είναι μεγαλύτερο από το -value που ορίσαμε στο Βήμα τότε η αντίστοιχη μεταβλητή απομακρύνεται. Βήμα 4, αν καμιά μεταβλητή δεν απομακρυνθεί, η διαδικασία σταματάει και οι εναπομείνασες μεταβλητές ορίζουν το «βέλτιστο» μοντέλο. Εάν όμως, κάποια μεταβλητή απομακρυνθεί, τότε το νέο μοντέλο προσαρμόζεται (θεωρείται ως πλήρες) και η διαδικασία επαναλαμβάνεται από το Βήμα μέχρις ότου καμία μεταβλητή να μην μπορεί να απομακρυνθεί. Forward: Είναι μια διαδικασία στην οποία οι μεταβλητές εισέρχονται σταδιακά στο μοντέλο. Βήμα, προσδιορίζεται ένα μέγιστο -value για την είσοδο κάθε μεταβλητής στο μοντέλο. Βήμα, εκτελούνται όλες οι μονοπαραγοντικές αναλύσεις, δηλαδή προσαρμόζονται όλες οι μεταβλητές κάθε μια μόνη της. Βήμα 3, υπολογίζονται όλες οι F στατιστικές για τα απλά μοντέλα παλινδρόμησης του Βήματος. Βήμα 4, αν το χαμηλότερο -value του Τύπου ΙΙΙ F- test είναι μεγαλύτερο από το -value που ορίσαμε στο Βήμα τότε σταματάμε, αλλιώς ενσωματώνουμε αυτή τη μεταβλητή στο μοντέλο. Βήμα 5, για τις εναπομείνασες μεταβλητές που δεν είναι ακόμα στο μοντέλο, υπολογίζουμε τα Τύπου ΙΙΙ artal F-tests ελέγχοντάς τα (controllng) για όλες τις μεταβλητές του μοντέλου. Έπειτα, επανερχόμαστε στο Βήμα 4 και επαναλαμβάνουμε τη διαδικασία έως ότου καμιά μεταβλητή να μην μπορεί να μπει στο μοντέλο. Ανεξάρτητα από τη μέθοδο που θα επιλέξει ο κάθε ερευνητής για την επιλογή του «βέλτιστου» (otmum) μοντέλου παλινδρόμησης, θα πρέπει να έχει υπόψη του ότι το μοντέλο θα πρέπει να πληροί δύο βασικές αρχές. Αξιοπιστία (Relablty): Εάν στόχος μας είναι να προβλέψουμε το Y τότε το μοντέλο που προβλέπει καλύτερα το Y λέγεται ότι είναι «ακριβές» (be relable). Στην περίπτωση αυτή ο βασικός στόχος είναι η ακριβής (accurate) εκτίμηση της Y και όχι τόσο οι ιδιαιτερότητες του ίδιου του μοντέλου.

16 Εγκυρότητα (Valdty): Όταν δίνουμε έμφαση στη σχέση της Y με τις X τότε εμβαθύνουμε στην πρόβλεψη των συντελεστών της παλινδρόμησης, αναζητώντας ένα έγκυρο (vald) γραμμικό μοντέλο παλινδρόμησης. Στο πλαίσιο Selecton Varable μπορούμε να ορίσουμε μια μεταβλητή καθώς και τη συνθήκη Rule μέσω της οποίας θα απομονώσουμε το υποσύνολο των δεδομένων στο οποίο επιθυμούμε να εφαρμόσουμε την παλινδρόμηση. Από το πλήκτρο Statstcs μπορούμε να επιλέξουμε την εμφάνιση των αποτελεσμάτων της παλινδρόμησης και κυρίως διαγνωστικών μέτρων ελέγχου αυτής. Αναλυτικότερα έχουμε: Estmates: Εμφανίζει τον πίνακα με τους συντελεστές παλινδρόμησης Β, τα τυπικά σφάλματα αυτών, τους τυποποιημένους συντελεστές παλινδρόμησης, την τιμή του T-test και το αποτέλεσμα του δίπλευρου ελέγχου. Εικόνα 7.3: Το menu Lnear Regresson > Statstcs Confdence ntervals: Εμφανίζει τα διαστήματα εμπιστοσύνης των συντελεστών παλινδρόμησης και του πίνακα συνδιακυμάνσεων, σύμφωνα με το οριζόμενο επίπεδο στο πεδίο Level. Covarance matrx: Εμφανίζει έναν πίνακα διακυμάνσεων-συνδιακυμάνσεων των συντελεστών παλινδρόμησης. Υπενθυμίζουμε ότι τα στοιχεία της διαγωνίου του πίνακα είναι οι διακυμάνσεις, ενώ τα στοιχεία εκτός διαγωνίου είναι οι συνδιακυμάνσεις. Model ft: Εμφανίζει κατάσταση των μεταβλητών που εισήχθησαν ή/και αφαιρέθηκαν από το μοντέλο, καθώς και τις τιμές διαγνωστικών μέτρων καταλληλότητας του μοντέλου, όπως τον συντελεστή προσδιορισμού R, τον προσαρμοσμένο συντελεστή προσδιορισμού R, το τυπικό σφάλμα της εκτίμησης και τον πίνακα ανάλυσης διασποράς ANOVA. R squared change: Εμφανίζει τις ενδιάμεσες μεταβολές του συντελεστή προσδιορισμού R οι οποίες λαμβάνουν χώρα κατά την προσθήκη ή αφαίρεση των ανεξάρτητων μεταβλητών στο μοντέλο. Εάν η είσοδος μιας μεταβλητής οδηγεί σε σημαντική αύξηση της τιμής του συντελεστή προσδιορισμού, τότε αυτό συνεπάγεται ότι η μεταβλητή είναι σημαντική για το μοντέλο. Descrtves: Εμφανίζει πίνακα συνήθων περιγραφικών μέτρων των μεταβλητών του μοντέλου, όπως το πλήθος έγκυρων παρατηρήσεων, τη μέση τιμή και την τυπική απόκλιση. Επιπρόσθετα, εμφανίζεται και ο πίνακας των συσχετίσεων μεταξύ των μεταβλητών. Part and Partal Correlatons: Εμφανίζει τις μερικές συσχετίσεις, δηλ. τη συσχέτιση η οποία απομένει μεταξύ δύο μεταβλητών μετά από την αφαίρεση της συσχέτισης που οφείλεται στην αμοιβαία ένωσή τους με τις υπόλοιπες μεταβλητές. Η συσχέτιση μεταξύ της εξαρτημένης

17 μεταβλητής και μιας ανεξάρτητης μεταβλητής, όταν οι γραμμικές επιδράσεις των άλλων ανεξάρτητων μεταβλητών στο μοντέλο έχουν αφαιρεθεί από αυτές. Collnearty dagnostcs: Για την πραγματοποίηση του ελέγχου πολυσυγραμμικότητας στο μοντέλο. Συγγραμμικότητα (Collnearty) ή πολυσυγραμμικότητα (multcollnearty) εμφανίζεται όταν μια ανεξάρτητη μεταβλητή είναι μια γραμμική συνάρτηση μιας άλλης ανεξάρτητης μεταβλητής. Σε περίπτωση που υπάρχουν υψηλές συσχετίσεις μεταξύ των ανεξάρτητων μεταβλητών, αυτό αποτελεί ισχυρή ένδειξη πολυσυγραμμικότητας. Η πολυσυγραμμικότητα δημιουργεί προβλήματα, όχι στην προσαρμογή του υποδείγματος, αλλά στο να διαπιστωθούν πραγματικά οι στατιστικά σημαντικοί παράγοντες στην επίδραση της εξαρτημένης μεταβλητής, και αυτό γιατί η παρουσία της πολυσυγραμμικότητας οδηγεί σε αυξημένα τυπικά σφάλματα. Στην ακραία περίπτωση που μια ανεξάρτητη μεταβλητή είναι γραμμικός συνδυασμός μερικών ή όλων των υπόλοιπων ανεξάρτητων μεταβλητών, τότε προκύπτει ότι η ορίζουσα του πίνακα X X ισούται με μηδέν, το οποίο καθιστά τον πίνακα X X η αντιστρέψιμο, και κατ επέκταση δεν μπορεί να γίνει ο υπολογισμός των συντελεστών παλινδρόμησης: ˆ ( ' ) ' β = ΧΧ ΧΥ Εξίσωση 7.74: Συντελεστές παλινδρόμησης Μέτρα για τον έλεγχο της πολυσυγραμμικότητας είναι ο παράγοντας μεγέθυνσης διασποράς (Varance nflaton factor-vif), ο οποίος παρέχεται σε κάθε μεταβλητή και μας δείχνει πόσο αυξάνεται η διασπορά ενός εκτιμημένου συντελεστή παλινδρόμησης. Όταν υπάρχουν συσχετίσεις μεταξύ των επεξηγηματικών μεταβλητών. Τιμές του VIF > 5 θεωρούνται ως ένδειξη πολυσυγραμμικότητας. Για να μειωθεί το φαινόμενο της πολυσυγραμμικότητας αφαιρούμε από το μοντέλο τους μη σημαντικούς παράγοντες. Durbn-Watson: Για την πραγματοποίηση του ελέγχου Durbn-Watson προκειμένου να διαπιστωθεί η σειριακή συσχέτιση των σφαλμάτων (αυτοσυσχέτιση). Αυτοσυσχέτιση έχουμε όταν σε μια μεταβλητή οι μετρήσεις λαμβάνονται σειριακά κατά τον χρόνο και υπάρχει συσχέτιση μεταξύ των Y t και Y t-, η μέτρηση στον χρόνο t σε σχέση με την προηγούμενη παρατήρηση. Η ύπαρξη αυτοσυσχέτισης ή seral correlaton μεταξύ των παρατηρήσεων εξετάζεται με το Durbn-Watson test. Αν d < d L ή d > 4-d L υπάρχει αυτοσυσχέτιση. Αν d < d u ή d > 4-d u δεν υπάρχει αυτοσυσχέτιση. Αλλιώς δεν μπορούμε να αποφανθούμε. Casewse Dagnostcs: Για την πραγματοποίηση διαγνωστικών ελέγχων με βάση το κριτήριο επιλογής, όπως των ακραίων τιμών (τιμών μεγαλύτερων από προκαθορισμένο μέγεθος που προκύπτει από την προσθαφαίρεση των τυπικών αποκλίσεων). Στόχος είναι να εξεταστούν πιθανές ακραίες τιμές (outlers) και παρατηρήσεις υψηλής επίδρασης (nfluental-onts). Μια ακραία τιμή (outlers) είναι μια ασυνήθιστη τιμή που δεν συμφωνεί με το attern των υπόλοιπων δεδομένων. Μια παρατήρηση υψηλής επίδρασης μπορεί να είναι μια ακραία τιμή, αλλά, επίσης, μπορεί να είναι μια τιμή των δεδομένων που να έχει μεγάλη συνεισφορά στο σχηματισμό της ευθείας παλινδρόμησης. Το μέτρο που χρησιμοποιείται για την εύρεση της επιρροής μιας παρατήρησης στο μοντέλο είναι η Cook s dstance. Περισσότερα για την Cook s dstance βλ. στην ανάλυση των επιλογών του πλήκτρου Save. Από το πλήκτρο Plots μπορούμε πολύ αποτελεσματικά να εξετάσουμε αν ισχύουν οι υποθέσεις του μοντέλου, καθώς και να εξεταστεί η προσαρμογή του. Έτσι χρησιμοποιούμε γραφήματα των σφαλμάτων έναντι των προσαρμοσμένων τιμών (Y ) και μελετάμε τα atterns που εμφανίζουν. Ο λόγος που χρησιμοποιούμε γραφήματα των σφαλμάτων έναντι των προσαρμοσμένων τιμών (Y ) και όχι των παρατηρούμενων (Y ), είναι γιατί τα σφάλματα συσχετίζονται με τις παρατηρούμενες τιμές, ενώ με τις προσαρμοσμένες όχι.

18 Εικόνα 7.4: Το menu Lnear Regresson > Plots Ο χρήστης μπορεί να δηλώσει τη δημιουργία γραφημάτων διαφόρων συνδυασμών, αλλάζοντας τα στοιχεία των τεταγμένων Υ και Χ μέσω των πλήκτρων Next και Prevous. Εικόνα 7.5: Μοντέλα υπολοίπων (πρότυπη γραφική παράσταση) Τα προβλήματα που μπορούν να ανιχνευθούν από τα γραφήματα των σφαλμάτων είναι: Η διασπορά να μην είναι σταθερή, δηλαδή να μην υπάρχει ομοσκεδαστικότητα. Στην περίπτωση αυτή το γράφημα συνήθως θα «ανοίγει σαν χωνί» (wll funnelng) καθώς τα Y θα αυξάνονται. Εικόνα 7.6: Μοντέλα σφαλμάτων με μη σταθερή διακύμανση Οι παρατηρήσεις να αποκλίνουν από το γραμμικό μοντέλο. Τότε θα υπάρχει ένα συστηματικό attern των σφαλμάτων που θα υποδεικνύει τη χρήση επιπλέον όρων (τετραγωνικών ή πολυωνυμικών, curvlnear) στο μοντέλο παλινδρόμησης.

19 Εικόνα 7.7: Μοντέλα σφαλμάτων με μη γραμμικό μοντέλο Η ύπαρξη τάσης με την πάροδο του χρόνου. Τα σφάλματα τότε θα είναι «roughly» ανεξάρτητα. Όταν υπάρχει χρονική τάση ή άλλου είδους εξάρτηση στα δεδομένα, το μοντέλο δεν είναι ανεξάρτητο. Εικόνα 7.8: Μοντέλα υπολοίπων με εξάρτηση μεταξύ των ε Η υπόθεση της κανονικότητας εξετάζεται με έλεγχο της κανονικότητας των σφαλμάτων μέσω των ελέγχων Kolmogorov-Smrnov και Sharo-Wlks, και γραφικά από τα διαγράμματα Q-Q και P-P lots (βλέπε ομώνυμες ενότητες). Η εφαρμογή έχει τη δυνατότητα να δημιουργήσει ιστόγραμμα, Q-Q και P-P lots των τυποποιημένων σφαλμάτων, από τις επιλογές Hstogram και Normal Probablty Plots, αντίστοιχα. Από το πλήκτρο Save μπορούμε να αποθηκεύσουμε τις εκτιμώμενες παρατηρήσεις, τα σφάλματα, και άλλα χρήσιμα στατιστικά για τους διαγνωστικούς ελέγχους του μοντέλου. Μέσω αυτών αντλούμε τα στοιχεία εκείνα που θα μας οδηγήσουν στην επιλογή του «βέλτιστου» μοντέλου. Σχετικά με τις εκτιμώμενες παρατηρήσεις Predcted Values έχουμε: Unstandardzed: Η μη τυποποιημένη εκτιμώμενη παρατήρηση, δηλ. η τιμή που προβλέπει το μοντέλο για τις παρατηρήσεις των ανεξάρτητων μεταβλητών. Standardzed: Οι τυποποιημένες εκτιμώμενες παρατηρήσεις, οι οποίες προκύπτουν μέσω μετασχηματισμού, όπου η μέση προβλεπόμενη τιμή αφαιρείται από την προβλεπόμενη τιμή, και η διαφορά διαιρείται με την τυπική απόκλιση των προβλεπόμενων τιμών. Οι τυποποιημένες προβλεπόμενες τιμές έχουν μέση τιμή μηδέν και τυπική απόκλιση ίση με τη μονάδα. Adjusted: Η προβλεπόμενη τιμή για μια παρατήρηση, κατά την οποία η παρατήρηση αυτή εξαιρείται από τον υπολογισμό των συντελεστών παλινδρόμησης. S.E. of mean redctons: Τα τυπικά σφάλματα των προβλεπόμενων τιμών (τα οποία αποτελούν και την τυπική απόκλιση της μέσης τιμής).

20 Εικόνα 7.9: Το menu Lnear Regresson > Save Σχετικά με τα σφάλματα (Resduals) έχουμε: Unstandardzed: Η διαφορά μεταξύ μιας παρατήρησης και της εκτιμώμενης τιμής που προβλέπεται από το μοντέλο. ε = Y Yˆ Εξίσωση 7.75 Standardzed: Τα τυποποιημένα σφάλματα είναι τα σφάλματα διαιρεμένα με την τυπική του απόκλιση αφού η μέση τιμή αυτών ισούται με μηδέν. ε z = με E( ε) = 0 και Var( ε) = s Εξίσωση 7.76 Studentzed: Το σφάλμα διαιρείται από μια εκτίμηση της τυπικής του απόκλισης, η οποία ποικίλλει από παρατήρηση σε παρατήρηση, αναλόγως της απόστασης μεταξύ της κάθε παρατήρησης της εξαρτημένης από τις μέσες τιμές των ανεξάρτητων μεταβλητών. r = s ε h Εξίσωση 7.77 Όπου h είναι το -οστό διαγώνιο στοιχείο (leverage) του πίνακα H = X(X T X) - X T (hat matrx) r ~ t n- - (για -μεταβλητές).

21 Deleted: Είναι μια τροποποίηση των τυποποιημένων σφαλμάτων σύμφωνα με την οποία χρησιμοποιείται μια εναλλακτική εκτιμήτρια της σ, η οποία προκύπτει με την προσαρμογή του μοντέλου με όλες τις παρατηρήσεις εξαιρώντας την -οστή παρατήρηση. r ' = S ε h () Εξίσωση 7.78 Όπου S () είναι η εκτιμήτρια της διασποράς σ που προκύπτει από την προσαρμογή του μοντέλου στις n- παρατηρήσεις, έχοντας δηλ. εξαιρέσει την -οστή παρατήρηση. Studentzed deleted: Τα deleted σφάλματα διαιρεμένα με το τυπικό τους σφάλμα. Η διαφορά μεταξύ των Studentzed deleted και των Studentzed σφαλμάτων υποδεικνύει πόση διαφορά εξαλείφει η παρατήρηση στην πρόβλεψή της. Οι επιλογές της ενότητας Dstances έχουν ως σκοπό τον εντοπισμό περιπτώσεων με ασυνήθιστους συνδυασμούς παρατηρήσεων στις ανεξάρτητες μεταβλητές, όπου ενδέχεται να έχουν μεγάλο αντίκτυπο στο μοντέλο παλινδρόμησης. Αναλυτικά: Mahalanobs: Ένα μέτρο για την εξέταση του κατά πόσο οι τιμές μιας υπόθεσης σχετικά με τις ανεξάρτητες μεταβλητές διαφέρουν από το μέσο όρο του συνόλου των τιμών. Μεγάλες τιμές απόστασης Mahalanobs προσδιορίζουν ότι το αντικείμενο έχει ακραίες τιμές σε μία ή περισσότερες από τις ανεξάρτητες μεταβλητές. Cook s: Όπως προαναφέραμε είναι το μέτρο που χρησιμοποιείται για την εύρεση της επιρροής μιας παρατήρησης στο μοντέλο. Αυτή η στατιστική συνάρτηση μετράει την αλλαγή στους συντελεστές παλινδρόμησης β όταν η -οστή παρατήρηση αφαιρείται από τα δεδομένα. Η στατιστική είναι ανάλογη ενός σταθμισμένου μέσου των τετραγωνικών διαφορών των β j και β j(-) και εκφράζεται με όρους των studentzed σφαλμάτων (r ) και των leverages (h ) από τον τύπο: h ε h d = r = + h ( + ) s ( h) Εξίσωση 7.79 Με άλλα λόγια, αν μια παρατήρηση είναι σημείο επιρροής τότε θα υπάρχει μια σημαντική διαφορά μεταξύ των τιμών των εκτιμώμενων συντελεστών παλινδρόμησης, αν αυτή η παρατήρηση απουσιάζει. Πρακτικά αν d > προτείνεται περαιτέρω μελέτη της συγκεκριμένης παρατήρησης. Leverage values: Είναι οι τιμές της διαγώνιου (στοιχεία h ) του πίνακα προβολής H = X(X X) - X που ονομάζεται μόχλευση (leverage). Αν ένα σημείο έχει πολύ μεγάλη μόχλευση, τότε το σημείο αυτό επιδρά στην προσαρμογή της παλινδρόμησης ώστε η ευθεία παλινδρόμησης να περνά πολύ κοντά από το σημείο αυτό. Σημεία με μόχλευση h j > /n θεωρούνται υποψήφια σημεία επιρροής και χρίζουν περαιτέρω εξέτασης. Στα διαστήματα εμπιστοσύνης Predcton Intervals παρέχονται τα άνω και κάτω όρια για τη μέση ή μεμονωμένη τιμή πρόβλεψης. Το ποσοστό του διαστήματος εμπιστοσύνης καθορίζεται στο πεδίο Confdence Interval. Mean: Χρησιμοποιείται για την εμφάνιση διαστήματος εμπιστοσύνης για τη μέση προβλεπόμενη τιμή. Indvdual: Χρησιμοποιείται για την εμφάνιση διαστήματος εμπιστοσύνης για την εξαρτημένη μεταβλητή σε μια και μοναδική περίπτωση.

22 Influence Statstcs εκφράζουν την αλλαγή των συντελεστών παλινδρόμησης DfBeta (s) και των προβλεπόμενων τιμών (DfFt) που προκύπτουν από τον αποκλεισμό μιας συγκεκριμένης περίπτωσης. Αναλυτικά: DfBeta(s): Είναι η διαφορά στην τιμή του συντελεστή παλινδρόμησης B που προκύπτει από τον αποκλεισμό μιας συγκεκριμένης περίπτωσης από την ανάλυση παλινδρόμησης. Οι τιμές αυτές υπολογίζονται για όλους τους συντελεστές παλινδρόμησης του μοντέλου, συμπεριλαμβανομένου και του σταθερού όρου. Standardzed DfBeta(s): Είναι η τυποποιημένη διαφορά στο συντελεστή παλινδρόμησης. Υπό εξέταση περιπτώσεις είναι αυτές με απόλυτη τιμή μεγαλύτερη του / Ν όπου Ν είναι ο αριθμός των περιπτώσεων. DfFt: Είναι η μεταβολή στην προβλεπόμενη τιμή που προκύπτει από τον αποκλεισμό μιας συγκεκριμένης περίπτωσης. Standardzed DfFt: Είναι οι τυποποιημένες τιμές των παραπάνω διαφορών. Υπό εξέταση περιπτώσεις είναι αυτές με απόλυτη τιμή μεγαλύτερη του ρ/ν όπου ρ είναι ο αριθμός των παραμέτρων στο μοντέλο και Ν είναι ο αριθμός των περιπτώσεων. Covarance Rato: Είναι η αναλογία της ορίζουσας του πίνακα συνδιασποράς, όταν μια συγκεκριμένη περίπτωση εξαιρείται από τον υπολογισμό των συντελεστών παλινδρόμησης, με την ορίζουσα του πίνακα συνδιασποράς και όλες τις περιπτώσεις να περιλαμβάνονται στην ανάλυση. Αν η αναλογία είναι κοντά στο, συνεπάγεται ότι η περίπτωση αυτή δε μεταβάλλει σημαντικά τη μήτρα συνδιακύμανσης. Από το πλήκτρο Otons παρέχονται οι επιλογές: Steng Method Crtera: Στο σημείο αυτό ορίζεται ο τρόπος επιλογής για το αν μια μεταβλητή θα εισαχθεί ή θα αφαιρεθεί από το μοντέλο, όταν εκτελούνται οι αυτόματες διαδικασίες επιλογής μοντέλου (forward, backward ή stewse). Ο χρήστης μπορεί είτε να ορίσει επίπεδα στατιστικής σημαντικότητας Use Probablty of F είτε να δηλώσει απευθείας την τιμή του κριτηρίου F-test Use F Value. Έτσι, μια μεταβλητή θα εισαχθεί στο μοντέλο αν το επίπεδο σημαντικότητάς της είναι μικρότερο από την τιμή εισαγωγής (Entry) και θα αφαιρεθεί αν είναι μεγαλύτερο από την τιμή αποκλεισμού (Removal). Αντίστοιχα, θα εισαχθεί αν η τιμή του F-test είναι μεγαλύτερη από την τιμή του F-test κριτηρίου εισαγωγής, και θα αφαιρεθεί αν είναι μικρότερη από την τιμή αποκλεισμού. Εικόνα 7.0: Το menu Lnear Regresson > Otons Include constant n equaton: Η παράμετρος είναι προεπιλεγμένη, έτσι ώστε στο μοντέλο παλινδρόμησης να συμπεριλαμβάνεται ο σταθερός όρος. Επιλέγοντας την παράμετρο αυτή θα

23 πρέπει να έχουμε υπόψη ότι τα μοντέλα που θα προκύψουν δεν είναι συγκρίσιμα με ένα μοντέλο στο οποίο περιέχεται η σταθερά, καθώς για παράδειγμα ο συντελεστής προσδιορισμού R δεν μπορεί να ερμηνευτεί με τον συνήθη τρόπο. Τέλος, σε αυτή την ενότητα γίνεται και η διαχείριση των ελλειπουσών τιμών. Εφαρμογή παραδείγματος στο SPSS Χρησιμοποιήθηκε το αρχείο δεδομένων solar.sav (βλ. σύνοψη) όπου περιέχονται δεδομένα ηλιακής ενέργειας Ν = 9 συλλεκτών. Στόχος είναι να μελετηθούν οι παράγοντες που επηρεάζουν το ύψος της συνολικής θερμικής ροής ανά τετραγωνικό μέτρο (Υ = kwatts/m ). Οι παράγοντες που μετρήθηκαν είναι: X «Ηλιοφάνεια (watts/m )», X - «Ανατολική θέση ακτίνας (nches)», X 3 - «Νότια θέση ακτίνας (nches)», X 4 - «Βόρεια θέση ακτίνας (nches)», X 5 - «H ώρα της ημέρας (σε δεκαδική κλίμακα)». Η εισαγωγή των μεταβλητών εμφανίζεται στην Εικόνα 7.. Στη συνέχεια γίνεται επιλογή των κατάλληλων μέτρων όπως αυτά περιγράφηκαν παραπάνω. Τέλος, η διαδικασία ολοκληρώνεται με το πλήκτρο ΟΚ όπου και λαμβάνουμε: Εικόνα 7.: Περιγραφικά μέτρα των μεταβλητών του μοντέλου Εικόνα 7.: Πίνακας Συσχετίσεων μεταξύ των παραγόντων

24 Κάτω από τον συντελεστή συσχέτισης εμφανίζεται το -value του ελέγχου σημαντικότητας της τιμής του συντελεστή, δηλ. η υπόθεση που εξετάζεται είναι αν οι δύο μεταβλητές είναι ασυσχέτιστες, ή όχι. Ho : = 0 H : 0 Εξίσωση 7.80 Από τον πίνακα των συσχετίσεων διαπιστώνουμε στατιστικά σημαντική συσχέτιση σε επίπεδο % μεταξύ των παραγόντων: Χ - Χ 4: «Ηλιοφάνεια (watts/m )» και «Βόρεια θέση ακτίνας (nches)», Χ - Χ 5: «Ηλιοφάνεια (watts/m )» και «Ώρα της ημέρας (σε δεκαδική κλίμακα)», Χ 3 - Χ 5: «Νότια θέση ακτίνας (nches)» και «Ώρα της ημέρας (σε δεκαδική κλίμακα)», Χ 4 - Χ 5: «Βόρεια θέση ακτίνας (nches)» και «Ώρα της ημέρας (σε δεκαδική κλίμακα)». Ειδικότερα ο παράγοντας «Ώρα της ημέρας» πιθανόν να πρέπει να αφαιρεθεί από το μοντέλο, καθώς όχι μόνο δεν είναι στατιστικά σημαντικός στο μοντέλο (T-test -value = 0,99), αλλά επίσης έχει στατιστικά σημαντικές συσχετίσεις με 3 από τους υπόλοιπους 4 παράγοντες. Τα αποτελέσματα μπορούν να θεωρηθούν αναμενόμενα δεδομένου ότι ανάλογα με την πορεία του ήλιου εντός της ημέρας, άρα και μεταβολή της ώρας εντός της ημέρας, αλλάζει η θέση της ακτίνας του ήλιου και η έκταση/ένταση της ηλιοφάνειας. Εικόνα 7.3: Πίνακας συντελεστών του μοντέλου Regresson Equaton Το μοντέλο που προσαρμόσαμε είναι το εξής: Συνολική Θερμική Ροή (kwatts/m ) = 34,6 + 0,067 Ηλιοφάνεια(watts/m ) +,56 Ανατολική (nches) + 3,8 Νότια (nches) -,93 Βόρεια (nches) +,39 Ώρα (σε δεκαδική κλίμακα). Για Δυτική θέση ακτίνας, χωρίς ηλιοφάνεια στις 00:00 (τα μεσάνυχτα), η συνολική θερμική ροή ανά τετραγωνικό μέτρο εκτιμάται κατά μέσο όρο κατά 34.6 kwatts/m. Σε περίπτωση που η ακτίνα τοποθετηθεί Ανατολικά ο μέσος όρος της συνολικής θερμικής ροής αυξάνεται κατά,56 kwatts/m σε σχέση με το αν η ακτίνα παραμείνει σε Δυτική θέση. Εάν η ακτίνα τοποθετηθεί Νότια ή Βόρεια, η μεταβολή που εκτιμάται να προκύψει κατά μέσο όρο ανέρχεται σε αύξηση κατά 3,8 kwatts/m και μείωση κατά,93 kwatts/m, αντίστοιχα. Επίσης για αύξηση της ηλιοφάνειας κατά 0 watts η συνολική θερμική ροή αναμένεται να αυξηθεί κατά 6,73 kwatts/m. Τέλος, ομοίως η μεταβολή της ώρας της ημέρας κατά ώρα αναμένεται να οδηγήσει κατά μέσο όρο σε αύξηση της συνολικής θερμικής ροής. Από τους ελέγχους T-test της ισότητας των συντελεστών του υποδείγματος με το μηδέν, προκύπτει ότι ο παράγοντας «Ώρα της ημέρας» δεν είναι στατιστικά σημαντικός στην ερμηνεία της συνολικής θερμικής ροής (-value = 0,99 > 0,05) σε επίπεδο σημαντικότητας 5%, και οριακά ο παράγοντας «Ανατολική θέση της ακτίνας» (-value = 0,05 >,05) σε επίπεδο σημαντικότητας 5%.

25 Εικόνα 7.4: ANOVA Table Εικόνα 7.5: Περιγραφικά μέτρα των μεταβλητών του μοντέλου Το συγκεκριμένο υπόδειγμα έχει καλή προσαρμογή (F-test value = 40.77, -value <0.000) και εξηγεί το 78,84% (R adj = 78,84%) της μεταβλητότητας της συνολικής θερμικής ροής. Εικόνα 7.6: Πίνακας διαγνωστικών πολυσυγραμμικότητας Τα μέτρα ελέγχου της πολυσυγραμμικότητας Ανοχή (tolerance) και VIF έχουν υπολογιστεί και παρουσιάζονται στον πίνακα των συντελεστών παλινδρόμησης. Τιμές του VIF > 5 θεωρούνται ως ένδειξη πολυσυγραμμικότητας. Από τα αποτελέσματα επιβεβαιώνουμε την προηγούμενη διαπίστωση ότι ο παράγοντας «Ώρα της ημέρας» δύναται να εξαιρεθεί από το μοντέλο της παλινδρόμησης. Εικόνα 7.7: Πίνακας περιγραφικών μέτρων των προβλεπόμενων τιμών και των διαφόρων ειδών σφαλμάτων Έλεγχος Υπολοίπων

26 Εικόνα 7.8: Ιστόγραμμα για τον έλεγχο κανονικότητας των τυποποιημένων υπολοίπων Εικόνα 7.9: P-P lot για τον έλεγχο κανονικότητας των τυποποιημένων υπολοίπων

27 Εικόνα 7.0: Έλεγχος ομοσκεδαστικότητας των τυποποιημένων υπολοίπων σε σχέση με τις εκτιμώμενες τιμές της εξαρτημένης μεταβλητής Διαπιστώνουμε ότι τα σφάλματα κατανέμονται με τυχαίο τρόπο, συνεπώς ισχύει και η υπόθεση της ομοσκεδαστικότητας.για να κατασκευάζουμε την ευθεία παλινδρόμησης σε ένα διάγραμμα διασποράς μεταξύ των δύο μεταβλητών, π.χ. «Συνολική θερμική ροή» και «Ηλιοφάνεια», με διπλό κλικ πάνω στο γράφημα επιλέγουμε Chart edtor > Elements > Ft lne at Total. Εικόνα 7.: Προσαρμογή μοντέλου παλινδρόμησης μεταξύ της εξαρτημένης «Συνολική θερμική ροή» και της ανεξάρτητης «Ηλιοφάνεια» Στη συνέχεια έχοντας ορίσει την αποθήκευση τον αποστάσεων Cook, κατασκευάζουμε ένα διάγραμμα για τον έλεγχο ύπαρξης σημείων επιρροής. Από το διάγραμμα προκύπτει ότι η 4 η παρατήρηση αποτελεί σημείο επιρροής. Εικόνα 7.: Αποστάσεις Cook για τον έλεγχο ύπαρξης σημείων επιρροής

28 Γραφικές Παραστάσεις Πρόσθετων Μεταβλητών και Μερικών Υπολοίπων Για να εξετάσουμε αν υπάρχει η ανάγκη στο μοντέλο μας να εισαχθεί η μεταβλητή «Ώρα της Ημέρας» θα χρησιμοποιούμε το διάγραμμα πρόσθετων μεταβλητών (added varable lot) και μερικών υπολοίπων (artal resdual lot). Υπενθυμίζουμε ότι οι παράγοντες που μετρήθηκαν είναι: X «Ηλιοφάνεια (watts/m )», X - «Ανατολική θέση ακτίνας (nches)», X 3 - «Νότια θέση ακτίνας (nches)», X 4 - «Βόρεια θέση ακτίνας (nches)», X 5 - «H ώρα της ημέρας (σε δεκαδική κλίμακα)». Διάγραμμα Πρόσθετων Μεταβλητών Σ αυτή την τεχνική, στο πρώτο βήμα εφαρμόζουμε ένα μοντέλο πολλαπλής παλινδρόμησης της εξαρτημένης μεταβλητής σε σχέση με τις ανεξάρτητες Χ -Χ 4, και αποθηκεύουμε τα υπόλοιπα (RESI). Στη συνέχεια εφαρμόζουμε πάλι ένα μοντέλο πολλαπλής παλινδρόμησης, όμως πλέον ως εξαρτημένη μεταβλητή θα δηλώσουμε τη μεταβλητή Χ 5 και ως ανεξάρτητες τις υπόλοιπες Χ -Χ 4. Ομοίως από το μοντέλο αυτό αποθηκεύουμε τα υπόλοιπα (RESI). Στη συνέχεια δημιουργούμε το διάγραμμα διασποράς των υπολοίπων των δύο παλινδρομήσεων. Από το διάγραμμα δεν παρατηρούμε ότι υπάρχει μια κάποια μορφή συσχέτισης. Συνεπώς η μεταβλητή Χ 5 θα μπορούσε να αφαιρεθεί από το μοντέλο. Εικόνα 7.3: Διάγραμμα πρόσθετων μεταβλητών για την ανεξάρτητη μεταβλητή «Ώρα της Ημέρας» (Χ 5) Διάγραμμα Μερικών Υπολοίπων Σ αυτή την τεχνική, στο πρώτο βήμα εφαρμόζουμε ένα μοντέλο πολλαπλής παλινδρόμησης της εξαρτημένης μεταβλητής σε σχέση με όλες τις ανεξάρτητες Χ -Χ 5, και αποθηκεύουμε τα υπόλοιπα (RESI3). Από την προσαρμογή του μοντέλου κρατάμε τον συντελεστή παλινδρόμησης της μεταβλητής που εξετάζουμε: ˆ β =,39 χ 5 Εξίσωση 7.8

29 Στη συνέχεια δημιουργούμε τα μερικά υπόλοιπα (RESI4) από τη σχέση: RESI4 = RESI3 + (,39 * Χ 5). Στη συνέχεια δημιουργούμε το διάγραμμα διασποράς των μερικών υπολοίπων σε σχέση με τις παρατηρήσεις της υπό εξέταση μεταβλητής (Χ 5). Εικόνα 7.4: Διάγραμμα μερικών υπολοίπων για την ανεξάρτητη μεταβλητή «Ώρα της Ημέρας» (Χ5) 7. Λογιστική Παλινδρόμηση (Logstc Regresson) Στη λογιστική παλινδρόμηση η εξαρτημένη μεταβλητή είναι κατηγορική και δίτιμη. Για αυτήν εξετάζουμε την πιθανότητα (τα ποσοστά) εμφάνισης των δύο κατηγοριών σε σχέση με τις ανεξάρτητες μεταβλητές - παράγοντες. Επειδή σκοπός είναι να εκτιμηθεί η πιθανότητα εμφάνισης ενός συμβάντος, συνεπάγεται ότι οι τιμές που θα πρέπει να προκύπτουν από το γραμμικό υπόδειγμα περιέχονται στο διάστημα [0,]. Για τον λόγο αυτό υποθέτουμε ότι η μεταβλητή ακολουθεί διωνυμική κατανομή και ότι η σύνδεση της πιθανότητας εμφάνισης του γεγονότος συνδέεται με το γραμμικό υπόδειγμα μέσω της lnk functon: log( ) = β0 + βχ + βχ βkχ Εξίσωση 7.8 k Όπου: log( ) Εξίσωση 7.83 Ο λογάριθμος του λόγου σχετικής πιθανότητας. Απολογαριθμίζοντας προκύπτει ότι η πιθανότητα της κατηγορίας της εξαρτημένης μεταβλητής θα είναι: e = + e β β β β 0+ Χ+ Χ kχk β β β β 0+ Χ+ Χ kχk Εξίσωση 7.84 Στο μοντέλο της λογιστικής παλινδρόμησης η εκτίμηση των συντελεστών πραγματοποιείται με τη μέθοδο μέγιστης πιθανοφάνειας (maxmum lkelhood method) αντί της μεθόδου ελαχίστων τετραγώνων. Η ερμηνεία τους, όμως, δεν προκύπτει με τον ίδιο τρόπο όπως στη γραμμική παλινδρόμησης, και θα πρέπει να γίνει τροποποίηση, ώστε να εκφραστούν με την κατάλληλη μορφή, δηλ. e β. Τα περισσότερα προγράμματα στον πίνακα των συντελεστών εμφανίζουν και την σχέση e β. Κάθε συντελεστής εκφράζει τη μεταβολή του λογαρίθμου της σχετικής πιθανότητας (Εξίσωση 7.83) για μια μονάδα αύξησης της ανεξάρτητης μεταβλητής.

30 Έστω ότι έχουμε ένα μοντέλο με μια ανεξάρτητη δίτιμη μεταβλητή (π.χ. το φύλο όπου 0 = γυναίκες και = άνδρες). Οπότε έχουμε: A A log( ) = β0 + β = e Εξίσωση 7.85 Είναι η σχετική πιθανότητα πραγματοποίησης του συμβάντος στους άνδρες, και: A Γ Γ log( ) = β0 = e Γ Εξίσωση 7.86 Είναι η σχετική πιθανότητα πραγματοποίησης του συμβάντος στις γυναίκες. Διαιρώντας τα δύο μέλη λαμβάνουμε τον λόγο συμπληρωματικών πιθανοτήτων (odds rato) πραγματοποίησης του συμβάντος των ανδρών προς την πραγματοποίηση του συμβάντος των γυναικών, δηλ.: A Γ A Γ β0+ β e = = e β0 e Εξίσωση 7.87 Όπως και στη γραμμική παλινδρόμηση, ομοίως οι συντελεστές του μοντέλου, οι οποίοι αποτελούν σημειακές εκτιμήσεις, υπόκεινται σε έλεγχο για τη σημαντικότητά τους στο μοντέλο. Δηλαδή η υπόθεση που εξετάζεται είναι η: H : ˆ o βι = 0 Η : ˆ β 0 Εξίσωση 7.88 Ο έλεγχος γίνεται σε (-α)% επίπεδο σημαντικότητας και η στατιστική συνάρτηση υπό την H 0 είναι η: Εξίσωση 7.89 Η οποία καλείται Wald, ακολουθεί ασυμπτωτικά την κανονική κατανομή, ενώ το τετράγωνο αυτής ακολουθεί την X -κατανομή με βαθμό ελευθερίας. Η υπόθεση απορρίπτεται αν η τιμή του ελέγχου είναι μεγαλύτερη από X ;α/. Η σύγκριση μοντέλων με σκοπό την επιλογή βέλτιστου μοντέλου, πραγματοποιείται με τη βοήθεια της ελεγχοσυνάρτησης Devance (που στην ουσία είναι ένα lkelhood rato test) η οποία ορίζεται ως: D= { lˆ lˆ) ι ˆ β se..( ˆ β ) Εξίσωση 7.90 Γ β A β β 0 0+ β

31 Όπου: ˆl Η λογαριθμοποιημένη συνάρτηση πιθανοφάνειας του μοντέλου. ˆl H λογαριθμοποιημένη συνάρτηση πιθανοφάνειας του μοντέλου. Επίσης το μοντέλο είναι υποσύνολο (nested) του μοντέλου, και ακολουθεί την X κατανομή με k-- βαθμούς ελευθερίας. Έστω ότι θέλουμε να εξετάσουμε την πιθανότητα επιβίωσης του οδηγού σε ένα τροχαίο ατύχημα, σε σχέση με τους παράγοντες «Ηλικία Οδηγού», «Ταχύτητα Οχήματος» και «Επιτάχυνση Οχήματος». Η δυνατότητα προσφέρεται από την επιλογή Analyze > Regresson > Bnary Logstc. Εικόνα 7.5: Το menu Logstc Regresson Στο πλαίσιο Deendent ορίζουμε την εξαρτημένη δίτιμη μεταβλητή, και στο πλαίσιο Covarates εισάγουμε τους προς εξέταση παράγοντες. Στη συνέχεια στο πεδίο Method επιλέγουμε τη μέθοδο επιλογής του βέλτιστου μοντέλου. Οι δυνατές επιλογές είναι: Enter: Μ αυτή την μέθοδο εισάγονται στο μοντέλο όλες οι μεταβλητές ανεξάρτητα από το αν είναι στατιστικά σημαντικές σε σχέση με την εξαρτημένη μεταβλητή. Forward Selecton (Condtonal): Είναι μια διαδικασία στην οποία οι μεταβλητές εισέρχονται σταδιακά στο μοντέλο. Ο έλεγχος για την εισαγωγή μιας μεταβλητής βασίζεται στη στατιστική σημαντικότητα της μεταβλητής, και ο έλεγχος για την αφαίρεση μιας μεταβλητής βασίζεται στην πιθανότητα του λόγου πιθανοφάνειας βασιζόμενου στην υπό συνθήκη εκτίμηση των παραμέτρων. Forward Selecton (Lkelhood Rato): Είναι μια διαδικασία στην οποία οι μεταβλητές εισέρχονται σταδιακά στο μοντέλο. Ο έλεγχος για την εισαγωγή μιας μεταβλητής βασίζεται στη στατιστική σημαντικότητα της μεταβλητής, και ο έλεγχος για την αφαίρεση μιας μεταβλητής βασίζεται στην πιθανότητα του λόγου πιθανοφάνειας βασιζόμενου στην εκτίμηση της μέγιστης μερικής πιθανοφάνειας. Forward Selecton (Wald): Είναι μια διαδικασία στην οποία οι μεταβλητές εισέρχονται σταδιακά στο μοντέλο. Ο έλεγχος για την εισαγωγή μιας μεταβλητής βασίζεται στη στατιστική σημαντικότητα της μεταβλητής, και ο έλεγχος για την αφαίρεση μιας μεταβλητής βασίζεται στην πιθανότητα της στατιστικής Wald. Backward Elmnaton (Condtonal): Είναι μια διαδικασία στην οποία οι μεταβλητές αφαιρούνται σταδιακά από το μοντέλο. Ο έλεγχος για την αφαίρεση μιας μεταβλητής βασίζεται στην πιθανότητα του λόγου πιθανοφανειών υπολογισμένου με βάση την υπό συνθήκη εκτίμηση των παραμέτρων.

32 Backward Elmnaton (Lkelhood Rato): Είναι μια διαδικασία στην οποία οι μεταβλητές αφαιρούνται σταδιακά από το μοντέλο. Ο έλεγχος για την αφαίρεση μιας μεταβλητής βασίζεται στην πιθανότητα του λόγου πιθανοφανειών υπολογισμένου με βάση την εκτίμηση της μέγιστης μερικής πιθανοφάνειας. Backward Elmnaton (Wald): Είναι μια διαδικασία στην οποία οι μεταβλητές αφαιρούνται σταδιακά από το μοντέλο. Ο έλεγχος για την αφαίρεση μιας μεταβλητής είναι βασισμένος στην πιθανότητα της στατιστικής Wald. Στο πλαίσιο Selecton Varable μπορούμε να ορίσουμε μια μεταβλητή καθώς και τη συνθήκη μέσω της οποίας θα απομονώσουμε το υποσύνολο των δεδομένων στο οποίο επιθυμούμε να εφαρμόσουμε την παλινδρόμηση. Από το πλήκτρο Categorcal ορίζουμε τις κατηγορικές μεταβλητές του μοντέλου με σκοπό τη δημιουργία ψευδομεταβλητών. Όμως, και οι τρεις ανεξάρτητες μεταβλητές είναι συνεχείς, συνεπώς δεν απαιτείται ούτε η δημιουργία ψευδομεταβλητών ούτε κάποια αλλαγή στην κωδικοποίηση των δεδομένων. Ωστόσο, να αναφέρουμε ότι αν για παράδειγμα η μεταβλητή «Ταχύτητα» (velocty) είχε μετατραπεί σε κατηγορική με περισσότερες από δύο κατηγορίες, τότε θα έπρεπε για την εισαγωγή της στο μοντέλο να οριστούν οι αντίστοιχες δείκτριες κατηγορικές, μεταφέροντας τη μεταβλητή στο πλαίσιο Categorcal Covarates και επιλέγοντας Contrast = Indcator. Εικόνα 7.6: Το menu Logstc Regresson > Defne Categorcal Varables Αναλυτικότερα οι δυνατές επιλογές που προσφέρονται από την εφαρμογή είναι: Indcator: Με την επιλογή αυτή γίνεται επανακωδικοποίηση της κατηγορικής, δημιουργώντας ψευδομεταβλητές-δείκτες, όπου θα δηλώνει την παρουσία με την τιμή και την απουσία της κατηγορίας με την τιμή 0. Προφανώς για την εισαγωγή μιας κατηγορικής με k κατηγορίες, απαιτούνται k- δείκτες. Έτσι η σχετική πιθανότητα της παρουσίας της κάθε κατηγορίας θα συγκρίνεται με τη σχετική πιθανότητα της κατηγορίας αναφοράς. Smle: Μ αυτή την επιλογή ομοίως δημιουργούνται ψευδομεταβλητές-δείκτες, όμως αλλάζει ο τρόπος κωδικοποίησης της κατηγορίας αναφοράς. Ομοίως κάθε κατηγορία της ανεξάρτητης μεταβλητής (εκτός από την κατηγορία αναφοράς) θα συγκρίνεται με την κατηγορία αναφοράς. Dfference: Μ αυτή την επιλογή, κάθε κατηγορία της ανεξάρτητης μεταβλητής εκτός από την πρώτη κατηγορία, θα συγκρίνεται με τη μέση σχετική πιθανότητα των προηγούμενων κατηγοριών. Η μέθοδος είναι επίσης γνωστή με την ονομασία αντίστροφη Helmert. Helmert: Μ αυτή την επιλογή, κάθε κατηγορία της ανεξάρτητης μεταβλητής εκτός από την τελευταία κατηγορία, θα συγκρίνεται με τη μέση σχετική πιθανότητα των μεταγενέστερων κατηγοριών.

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια Αθήνα, 6-4-7 Γραμμικά Μοντέλα Λύσεις Ασκήσεων η Άσκηση: (α) Eίναι η σχέση μεταξύ των δύο μεταβλητών γραμμική; Διάγραμμα Διασποράς Για το Υψόμετρο & τις Αρνητικές Τιμές

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΠΟΤΕ ΚΑΙ ΓΙΑΤΙ ΧΡΗΣΙΜΟΠΟΙΕΙΤΑΙ ΜΟΝΤΕΛΟ ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ ΕΡΜΗΝΕΙΑ ΤΩΝ ΕΚΤΙΜΗΤΩΝ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΤΩΝ ΣΥΝΤΕΛΕΣΤΩΝ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΥΠΟΘΕΣΕΙΣ ΠΙΝΑΚΑΣ ΑΝΑ ΙΑ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΓΙΑ ΤΙΣ ΠΑΡΑΜΕΤΡΟΥΣ

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι)

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι) ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΕΝΔΥΣΕΙΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗ ΑΝΑΠΤΥΞΗ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ

Διαβάστε περισσότερα

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα: ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, 6-5-0 Άσκηση 8. Δίνονται οι παρακάτω 0 παρατηρήσεις (πίνακας Α) με βάση τις οποίες θέλουμε να δημιουργήσουμε ένα γραμμικό μοντέλο για την πρόβλεψη της Υ μέσω των ανεξάρτητων μεταβλητών

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

x y max(x))

x y max(x)) ΚΕΦΑΛΑΙΟ 0 Απλή Γραµµική Παλινδρόµηση Μωυσιάδης Χρόνης 6 o Εξάµηνο Μαθηµατικών Ένα Πρόβληµα εδοµένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 y 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Έχει σχέση το yµε το ; Ειδικότερα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) 1. Έχοντας στη διάθεσή μας ένα δείγμα, προκύπτει ότι το 95% διάστημα εμπιστοσύνης για το μέσο μ ενός κανονικού

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ Ονοματεπώνυμο: Όνομα Πατρός:... Σ ΑΜ:. Ημερομηνία: Παρακαλώ μη γράφετε στα παρακάτω

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο Πολλαπλή παλινδρόµηση Μάθηµα 3 ο Πολλαπλή παλινδρόµηση (Multivariate regression ) Η συµπεριφορά των περισσότερων οικονοµικών µεταβλητών είναι συνάρτηση όχι µιας αλλά πολλών µεταβλητών Y = f ( X, X 2, X

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι Πανεπιστημίου Πειραιώς) Τηλ.: 4..97,,, Fax : 4..634 URL : www.vtal.gr emal: f@vtal.gr Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 5: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (1 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: ageliki.papaa@gmail.com, agpapaa@auth.gr Webpage: http://users.auth.gr/agpapaa

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 6.1 Ετεροσκεδαστικότητα: Εισαγωγή Συχνά, η υπόθεση της σταθερής διακύμανσης των όρων σφάλματος,

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ... ΚΕΦΑΛΑΙΟ 0 Ένα Πρόβλημα Δεδομένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Απλή Γραμμική Παλινδρόμηση Μωυσιάδης Χρόνης 6 o Εξάμηνο Μαθηματικών Έχει σχέση το με το ; Ειδικότερα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων Γρεβενά Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Ιδιότητες εκτιμώμενης ευθείας παλινδρόμησης με τη μέθοδο των ελαχίστων

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Οικονομετρία Ι Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης

Διαβάστε περισσότερα

και y και κατά συνέπεια SST=SSE. Μονάδες 2.5 (i) Δείξτε ότι το άθροισμα τετραγώνων λόγω παλινδρόμησης είναι SSR=y'(H- J

και y και κατά συνέπεια SST=SSE. Μονάδες 2.5 (i) Δείξτε ότι το άθροισμα τετραγώνων λόγω παλινδρόμησης είναι SSR=y'(H- J ΣΕΜΦΕ- ΕΜΠ- Ανάλυση Παλινδρόμησης- Εξετάσεις Χειμερινού Εξαμήνου 015-016 1!! Επιλέξτε 4 θέματα από τα 7!! Διάρκεια εξέτασης : 1/ ώρες Καλή Επιτυχία! ΘΕΜΑ 1 ο (α) Στο γενικό γραμμικό μοντέλο y=xβ+ε, ε ~

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ. Απλή Παλινδρόμηση. (Όγκος πωλήσεων = α +b έξοδα διαφήμησης +e ) Εκτίμηση Απλής Παλινδρόμησης. α= εκτίμηση της τεταγμένης για χ=0

ΠΑΛΙΝΔΡΟΜΗΣΗ. Απλή Παλινδρόμηση. (Όγκος πωλήσεων = α +b έξοδα διαφήμησης +e ) Εκτίμηση Απλής Παλινδρόμησης. α= εκτίμηση της τεταγμένης για χ=0 ΠΑΛΙΝΔΡΟΜΗΣΗ ΓΡΑΜΜΙΚΟ ΜΗ ΓΡΑΜΜΙΚΟ ΔΕΝ ΥΠΑΡΧΕΙ ΣΧΕΣΗ Απλή Παλινδρόμηση Y = a + bx + e (Όγκος πωλήσεων = α +b έξοδα διαφήμισης +e ) Εκτίμηση Απλής Παλινδρόμησης Y = a + bx (Όγκος πωλήσεων = α +b έξοδα διαφήμησης

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 7.1 Πολυσυγγραμμικότητα: Εισαγωγή Παραβίαση υπόθεσης Οι ανεξάρτητες μεταβλητές δεν πρέπει

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Εισαγωγή Οικονοµετρία (Econometrics) είναι ο τοµέας της Οικονοµικής επιστήµης που περιγράφει και αναλύει

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

Μάθημα Αστικής Γεωγραφίας

Μάθημα Αστικής Γεωγραφίας Μάθημα Αστικής Γεωγραφίας Διδακτικό Έτος 2015-2016 Παραδόσεις Διδακτικής Ενότητας: Πληθυσμιακή πρόβλεψη Δούκισσας Λεωνίδας, Στατιστικός, Υποψ. Διδάκτορας, Τμήμα Γεωγραφίας, Χαροκόπειο Πανεπιστήμιο Σελίδα

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 3: One-Way ANOVA

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις: Άσκηση. Δίνονται οι παρακάτω παρατηρήσεις: X X X X Y 7 50 6 7 6 6 96 7 0 5 55 9 5 59 6 8 8 5 0 59 7 7 8 8 5 5 0 7 69 9 6 6 7 6 9 5 7 6 8 5 6 69 8 0 50 66 0 0 50 8 59 76 8 7 60 7 87 6 5 7 88 9 8 50 0 5

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ 4ο Διαδικασία των συντελεστών αυτοσυσχέτισης Ονομάζουμε συνάρτηση αυτοσυσχέτισης (autocorrelation function) και συμβολίζεται με τα γράμματα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Α μέρος: Πολυσυγγραμμικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Α μέρος: Πολυσυγγραμμικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 9: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Α μέρος: Πολυσυγγραμμικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Εισαγωγή στην Γραμμική Παλινδρόμηση

Εισαγωγή στην Γραμμική Παλινδρόμηση ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 13-11-015 Εισαγωγή στην Γραμμική Παλινδρόμηση Γραμμική σχέση μεταξύ μεταβλητών Αν. Καθ. Μαρί-Νοέλ Ντυκέν Στόχος Πολύ συχνά, η Τ.Μ. που εξετάζουμε π.χ. η κατανάλωση των νοικοκυριών

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 11: Αυτοσυσχέτιση Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Περιεχόμενο ενότητας

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Πολλαπλή Παλινδρόμηση Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα