ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ανδρομάχη Σκουφά Επιβλέπουσα: Φ. Κολυβά-Μαχαίρα Επικ.Καθηγήτρια Α.Π.Θ Θεσσαλονίκη Νοέμβριος 2008

2 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ανδρομάχη Σκουφά Επιβλέπουσα: Φ. Κολυβά-Μαχαίρα Επικ.Καθηγήτρια Α.Π.Θ Θεσσαλονίκη Νοέμβριος 2008

3 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ανδρομάχη Σκουφά Επιβλέπουσα: Φ. Κολυβά-Μαχαίρα Επικ.Καθηγήτρια Α.Π.Θ Εγκρίθηκε από την τριμελή επιτροπή τον Νοέμβριο Φ. Κολυβά-Μαχαίρα Μωυσιάδης Πολυχρόνης Μπόρα-Σέντα Ευθυμία Επικ.Καθηγήτρια Α.Π.Θ Καθηγητής Α.Π.Θ Επικ.Καθηγήτρια Α.Π.Θ Θεσσαλονίκη Νοέμβριος

4 «Σε εκείνους που οφείλω τα πάντα, στους γονείς μου και στον Γιώργο»

5 5

6 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή Εκτιμητές μέγιστης πιθανοφάνειας Η log-likelihood συνάρτηση Το διάνυσμα των score Πίνακας Πληροφορίας(Information Matrix) Newton-Raphson και Fisher Scoring Η κατανομή της τυχαίας μεταβλητής -2logλ n Έλεγχοι Υποθέσεων Wald test Score tests Το Μοντέλο της Λογιστικής παλινδρόμησης Εκτίμηση της Καλής Προσαρμογής του Μοντέλου Ταξινόμηση των παρατηρήσεων Ιστόγραμμα Εκτιμώμενων Πιθανοτήτων Διερεύνηση της πιθανοφάνειας των αποτελεσμάτων Το μοντέλο X Έλεγχος βελτίωσης της τιμής X Στατιστικό Z 2 της καλής προσαρμογής Έλεγχος των Hosmer και Lemeshow Ο συντελεστής προσδιορισμού R 2 των Cox και Snell...

7 5. Έλεγχος και Ερμηνεία των Συντελεστών Παλινδρόμησης Ερμηνεία των Συντελεστών Παλινδρόμησης Έλεγχοι για τους συντελεστές του λογιστικού μοντέλου Διαστήματα εμπιστοσύνης για τους συντελεστές του λογαριθμικού μοντέλου Μερική Συσχέτιση Προσθήκη στο Μοντέλο Όρων Αλληλεπίδρασης Επιλογή των Ανεξάρτητων Μεταβλητών Κριτήρια επιλογής Μεταβλητών Μέθοδοι Επιλογής των ανεξάρτητων μεταβλητών ενός μοντέλου Διαγνωστικά Καταλληλότητας του Μοντέλου Διαγνωστικές μέθοδοι Διαγνωστικά Διαγράμματα Εφαρμογή Λογιστικής παλινδρόμησης Συντελεστές Παραμέτρων Εκτίμηση της καλής Προσαρμογής του Μοντέλου Επιλογή των ανεξάρτητων μεταβλητών Διαγνωστικά Διαγράμματα του Μοντέλου... ΒΙΒΛΙΟΓΡΑΦΙΑ... 7

8

9 1. Εισαγωγή Η Λογιστική παλινδρόμηση είναι μία μέθοδος πολυπαραγοντικής στατιστικής ανάλυσης που χρησιμοποιεί ένα σύνολο ανεξαρτήτων μεταβλητών για την διερεύνηση της κίνησης μιας κατηγορικής εξαρτημένης μεταβλητής. Η Λογιστική παλινδρόμηση είναι χρήσιμη σε καταστάσεις στις οποίες επιθυμούμε την πρόβλεψη ύπαρξης ή της απουσίας ενός χαρακτηριστικού ή ενός συμβάντος. Η πρόβλεψη αυτή βασίζεται στην κατασκευή ενός γραμμικού μοντέλου και συγκεκριμένα στον προσδιορισμό των τιμών που παίρνουν οι συντελεστές ενός συνόλου ανεξαρτήτων μεταβλητών που χρησιμοποιούνται ως μεταβλητές πρόβλεψης. Η πρόβλεψη κατα πόσο θα συμβεί η όχι κάποιο γεγονός και η αναγνώριση των μεταβλητών των αναγκαιών για την πρόβλεψη είναι θέμα συχνού προβληματισμού. Για την αντιμετώπιση τέτοιων προβλημάτων το υπόδειγμα της γραμμικής παλινδρόμησης δεν είναι κατάλληλο για την εκτίμηση των τιμών της εξαρτημένης μεταβλητής από τις τιμές των ανεξάρτητων. Σε μια τέτοια περίπτωση χρησιμοποιώντας την τιμή 1 για το ενδεχόμενο της επιτυχίας ( την πραγματοποίηση,δηλαδή,του γεγονότος) και την τιμή 0 για το ενδεχόμενο της αποτυχίας, ο υπολογισμός της μέσης τιμής της εξαρτημένης δίτιμης μεταβλητής, ουσιαστικά ορίζει την αναλογία p, των επιτυχιών στο σύνολο των δυνατών τιμών της. Όπως με την βοήθεια του μοντέλου της γραμμικής παλινδρόμησης, εκτιμάται η μέση τιμή της συνεχούς μεταβλητής Y, για ένα συγκεκριμένο σύνολο τιμών των ανεξάρτητων μεταβλητών, έτσι μπορεί να εκτιμηθεί και η πιθανότητα p της επιτυχίας μιας δίτιμης μεταβλητής (η μέση τιμή της δηλαδή) για ένα σύνολο τιμών μιας ή περισσότερων ανεξάρτητων μεταβλητών. Η τεχνική που χρησιμοποιείται σε αυτές τις περιπτώσεις ονομάζεται λογιστική παλινδρόμηση(logistic regression). Εκτός από την πρόβλεψη ένα μοντέλο λογιστικής παλινδρόμησης δίνει την δυνατότητα να εκτιμήσουμε την επίδραση κάθε ανεξάρτητης μεταβλητής στην διαμόρφωση των τιμών της εξαρτημένης μεταβλητής. Στην λογιστική παλινδρόμηση, σε αντίθεση με την πολλαπλή γραμμική παλινδρόμηση είναι δυνατόν να χρησιμοποιήθουν ως εξαρτημένες μεταβλητές εκτός από αναλογικές αριθμητικές μεταβλητές(ratio scales) και κατηγορικές μεταβλητές(nominal scale). Η πιο διαδεδομένη βιβλιογραφικά έκφραση της λογιστικής παλινδρόμησης είναι: Ln(odds)=a+b 1 x 1 +b 2 x b k x k Το δεξί μέλος της εξίσωσης δημιουργείται από ένα γραμμικό συνδυασμό των ανεξάρτητών μεταβλητών που συμμετέχουν στο μοντέλο παλινδρόμησης. Το αριστερό μέλος περιέχει τις τιμές της εξαρτημένης μεταβλητής με την μορφή του λογαρίθμου των odds(απόδοση), δηλαδή του λογαρίθμου της σχέσης: odds= Τα odds εναλλακτικά ονομάζονται logit και ο όρος prob εκφράζει την πιθανότητα του συμβάντος του γεγονότος. Οι συντελεστές των ανεξαρτήτων μεταβλητών στην εξίσωση λογιστικής παλινδρόμησης εκτιμούνται με βάση της μεθόδου Μέγιστης Πιθανοφάνειας. Σύμφωνα με την μέθοδο αυτή η τιμή των συντελεστών των ανεξαρτήτων μεταβλητών είναι αυτή που κάνει τις παρατηρηθείσες τιμές της εξαρτημένης μεταβλητής πιο πιθανές, βάσει του συνόλου των ανεξαρτήτων μεταβλητών. 9

10 2. Εκτιμητές μέγιστής πιθανοφάνειας Ας είναι y=(υ 1,...,Υ n ) ένα τυχαίο ανεξάρτητο διάνυσμα με συνάρτηση πυκνότητας πιθανότητας f i ( y i ;θ), θ Ω R r και ω Ω. 2.1 Η log-likelihood συνάρτηση Σαν συνάρτηση πιθανοφάνειας (Likelihood function) ορίζουμε την από κοινού κατανομή των τυχαίων μεταβλητών Υ 1,...,Υ n όταν η κατανομή θεωρείται συνάρτηση της παραμέτρου θ, δηλαδή: f(y;θ)= Συχνά χρησιμοποιούμε τον λογάριθμο της συνάρτησης πιθανοφάνειας και την ονομάζουμε log-likelihood συνάρτηση η οποία είναι: Log= Ένας απλός τρόπος για να εκτιμήσουμε την παραμέτρο θ είναι να μεγιστοποιήσουμε την συνάρτηση πιθανοφάνειας (maximize) επιλέγοντας τις πιο πιθανοφανείς τιμές των παραμέτρων προκειμένου να οδηγήσουν στα παρατηρούμενα αποτελέσματα. Τελικά ορίζουμε ως εκτιμητή μέγιστης πιθανοφάνειας της παραμέτρου θ την: Log Log για κάθε θ Το διάνυσμα των score

11 Η πρώτη παράγωγος της log-likelihood συνάρτησης ονομάζεται Fisher s score συνάρτηση και συμβολίζεται ως: u(θ)= Αν η log-likelihood συνάρτηση είναι κοίλη μπορούμε να βρούμε τους εκτιμητές μέγιστης πιθανοφάνειας μηδενίζοντας το διάνυσμα των score, λύνοντας δηλαδή τις εξισώσεις: u( )= Πίνακας Πληροφορίας(Information Matrix) Το διάνυσμα των score έχει κάποιες ενδιαφέρουσες στατιστικές ιδιότητες. Η μέση τιμή του είναι ίση με μηδέν, δηλαδή: Ε[u(θ)]=0 και ο πίνακάς διακυμάνσεων-συνδιακυμάνσεων δίνεται από τον Information Matrix: var[u(θ)]= Ε[u(θ)u (θ)]=i(θ) Κάτω από συνθήκες ομαλότητας ο πίνακας πληροφορίας(information matrix) ορίζεται και ως η αρνητκή μέση τιμή της δεύτερης παραγώγου της log- likehood συνάρτησης, δηλαδή ως: I(θ)=-Ε[ ] Newton-Raphson και Fisher Scoring Ο υπολογισμός των εκτιμητών μέγιστής πιθανοφάνειας συχνά απαιτεί επαναληπτικές διαδικασίες. Ας θεωρήσουμε ότι θέλουμε να εκτιμήσουμε με το διάνυσμα των score τους εκτιμητές μέγιστης πιθανοφάνειας γύρω από μία αρχική τιμή θ 0 χρησιμοποιώντας σειρά taylor πρώτης τάξης, δηλαδή: u( )] u(θ 0 )+ (θ-θ 0 ) Ας είναι H ο εσσιανός πίνακας ή αλλιώς ο πίνακας των δεύτερων παραγώγων της loglikelihood συνάρτησης: H(θ)= = Θέτωντας u( )=0 και λύνοντας ως προς έχουμε: 11

12 =θ 0 -H -1 (θ 0 ) u(θ 0 ) (1) αυτό το αποτέλεσμα αποτελεί την βάση μιας επαναληπτικής διαδικασίας προσσεγγιστικής λύσης για τους εκτιμητές μέγιστης πιθανοφάνειας γνωστή ως τεχνική Newton-Raphson. Δοσμένης μιας αρχικής τιμής χρησιμοποιούμε την (1) εξίσωση για να λάβουμε μια βελτιωμένη εκτίμηση και επαναλαμβάνουμε μέχρις ώτου οι διαφορές ανάμεσα στις διαδοχικές εκτιμήσεις να τείνουν στο μηδεν. Μία εναλλακτική διαδικασία που προτάθηκε από τον Fisher είναι να αντικαταστήσουμε τον εσσιανό πίνακα με την μέση τίμή του δηλαδή με τον information matrix I: γνωστό ως Fisher Scoring. =θ 0 -I -1 (θ 0 ) u(θ 0 ) Θεώρημα 2.2 Η κατανομή της τυχαίας μεταβλητής -2logλ n Υποθέτουμε ότι ισχύουν οι συνθήκες ομαλότητας, ότι το μέγεθος n του δείγματος είναι αρκετά μεγάλο και ότι υπάρχει μονοσήμαντα ορισμένος εκτιμητής μέγιστης πιθανοφάνειας n του θ. Τότε για τον έλεγχο της υπόθεσης Η 0 : θєω={θ 0 }, η ασυμπτωτική κατανομή της στατιστικής συνάρτησης -2logλ n είναι η, όταν η Η 0 είναι αληθής, δηλαδή P 2logλ n x P x Επειδή κατά την απόδειξη θα χρησιμοποιήσουμε τις συνθήκες ομαλότητας τις αναφέρουμε παρακάτω: Συνθήκες ομαλότητας 1) Για όλα τα x Є R-N, όπου P θ (χ Є Ν)=0 και για κάθε θ Є Ω υπάρχουν οι παράγωγοι

13 logf(x;θ), logf(x;θ), logf(x;θ), θ Є Ω 2) Υπάρχει μετρήσιμη συνάρτηση Η:R R + α) logf(x;θ) <Η(x) για κάθε θ Є Ω και β) Ε θ Η(x)<Μ< και το Μ είναι ανεξάρτητο του θ 3) Ε θ [ logf(x;θ)]=0 για κάθε θ Є Ω 4) Για κάθε θ Є Ω ισχύει: α) Ε θ [ logf(x;θ)] 2 =- Ε θ [ logf(x;θ)]=ι(θ) και β) 0< Ι(θ)< όπου Ι(θ) ο πίνακας οληροφορίας. Απόδειξη Θεωρήματος Αν θέσουμε ψ(x;θ)= logf(x;θ), Ψ (x;θ)= ψ(x;θ)=φ(x;θ), Ψ (x;θ)=φ ( x;θ) και ψ (x;θ)=φ (x;θ). Αναπτύσσουμε σε σειρά Taylor τη συνάρτηση ψ(x;θ) στην περιοχή του θ, με όρους μέχρι τρίτης τάξης. Έτσι έχουμε: 13

14 ψ(x;θ 0 )= ψ(x;θ)+(θ 0 -θ) ψ (x;θ)+ (θ 0 -θ) 2 ψ (x;θ)+ (θ 0 -θ) 3 ψ (x;θ * )= = ψ(x;θ)+(θ 0 -θ) φ(x;θ) )+ (θ 0 -θ) 2 φ ( x;θ) )+ (θ 0 -θ) 3 φ (x;θ * ) Όπου θ * κατάλληλη τιμή του θ μεταξύ θ και θ 0. Αν αθροίσουμε τις n παραπάνω σχέσεις για τις δάφορες τιμές του x i, i=1,2,.,n, θα έχουμε: = (θ 0 θ)+ (θ 0 θ) (θ 0 θ) 3 (σχέση 1) Αλλά από τη συνθήκη ομαλότητας (2) είναι: <Η(x i ), άρα υπάρχει κατάλληλος : 1 ώστε Σ = Σ Η(x i ), και η σχέση 1 γίνεται: = (θ 0 θ)+ (θ 0 θ) (θ 0 θ) 3 Σ Η(x i ) (σχέση2)

15 Αν είναι n ο εκτιμητής μέγιστης πιθανοφάνειας για το θ, τότε n θ. Άρα για κάθε ε>0 υπάρχει Ν=Ν(ε) ώστε για κάθε n N P( θ n -θ <ε)>1-ε. 15

16 Αν στη σχέση2 αντικαταστήσουμε το θ με το n έχουμε: = + (θ 0 ) 2 + (θ 0 ) 3 Διότι =0, αφού είναι εκτιμητής μέγιστης πιθανοφάνειας του θ και η αντίστοιχη τιμή του όταν θ=. Επειδή =logf(x i ;θ) προκύπτει ότι -2logλ n =-2[logL(X/θ 0 )-logl(x/ )]=-2[ - =-[ ( -θ 0 )] + [ ( - θ 0 )] 2 ( - θ 0 )](σχέση3) Επειδή όμως ( - θ 0 ) ( - θ 0 ) όπου X~N(0,1). Τότε όμως [ ( - θ 0 )] 2 όπου η X 2 ~, άρα [ ( - θ 0 )] 2 (σχέση4) Αν δεχτούμε ότι ) (σχέση5) Τότε από τα θεωρήματα σύγκλισης προκύπτει ότι -[ ( - θ 0 )] 2 (σχέση6)

17 Επειδή ακόμη - θ 0 0, Η(x) και <1 η σχέση4 συνεπάγεται ότι [ ( - θ 0 )] 2 ( - θ 0 )] 0, άρα [ ( - θ 0 )] 2 ( - θ 0 )] 0 (σχέση7) Από τις σχέσεις 3,6,7 προκύπτει ότι (-2logλ n x P,XЄR Για να ολοκληρωθεί η απόδειξη πρέπει να αποδείξουμε ότι ο ισχυρισμός της σχέσης 5 είναι αληθής. Αν αναπτύξουμε σε σειρά taylor τη συνάρτηση έχουμε +( - θ 0 ) Όπου κατάλληλη τιμή μεταξύ θ 0 και. 17

18 Αθροίζοντας έχουμε - =(θ n- θ 0 ) Όπου κατάλληλη τιμή 0< <1 Επειδή όμως όπως προαναφέρθηκε θ 0 θα είναι -Ι(θ 0 ) 0< <1 και Οι παραπάνω συγκλισεις συνεπάγονται την αλήθεια της σχέσης5. Το παραπάνω θεώρημα γενικεύεται δηλαδή αν το Ω είναι ένα r-διάστατο ανοικτό υποσύνολο του R r r>1, και η υπόθεση Η 0 :θєω, όπου ω ένα m-διάστατο θποσύνολο του Ω (m<r), τότε εφόσον ισχύουν οι συνθληκες ομαλότητας και η Η 0 είναι αληθής, η κατανομή της στατιστικής συνάρτησης -2logλ n είναι η δηλαδή P θ (-2logλ n χ P x,xєr

19 2.3 Έλεγχοι Υποθέσεων Wald test Κάτω από την υπόθεση ότι ισχύουν οι συνθήκες ομαλότητας, οι εκτιμητές μέγιστης πιθανοφάνειας για μεγάλα δείγματά ακολουθούν την κανονική κατανομή με μέση τιμή την πραγματική τιμή του θ και με πίνακα διακυνάνσεων ίσο με τον αντίστοφο του πίνακα πληροφορίας(information matrix) I -1. ~N p (θ, I -1 (θ)) Υπό την συνθήκη Η 0 : θ=θ 0, Η τετραγωνική μορφή: W=( -θ 0 ) var -1 ( )( -θ 0 ) Για μεγάλα δείγματα τείνει ασυμπτωτικά στην Χ 2 -κατανομή με p βαθμούς ελευθερίας. Συνήθως χρησιμοποιούμε την τετραγωνική ρίζα του στατιστικού του Wald και ορίζουμε τον λόγο: ως z-στατιστικό. Z= Score tests Όταν ισχύουν οι συνθήκες ομαλότητας το διάνυσμα των score ακολουθεί ασυμπτωτικά την κανονική κατανομή με μέση τιμή μηδέν και πίνακα διακυμάνσεων ίσο με τον πίνακα πληροφορίας. U(θ)~Ν p (0,I(θ)) 19

20 Υπό την συνθήκη Η 0 : θ=θ 0, η τετραγωνική μορφή: Q=u(θ 0 ) I -1 (θ 0 ) u(θ 0 ) τείνει για μεγάλα δείγματα στην Χ 2 κατανομή με p βαθμούς ελευθερίας Likelihood ratio test Ας υποθέσουμε ότι έχουμε δύο μοντέλα ω 1 και ω 2 τέτοια ώστε ω 1 ω 2. Ας υποθέσουμε για παράδειγμα ότι το ω 1 είναι το απλούστερο μόντέλο που προέκυψε από το ω 2 θέτωντας κάποιες παραμέτρους του ω 2 ίσες με μηδέν. Θέλουμε να ελέξουμε την υπόθεση ότι πράγματι οι συμτελεστές αυτοί είναι μηδέν. Η βασική ιδέα είναι να συγκρίνουμε τις μέγιστές τιμές πιθανοφάνειας των δύο αυτών μοντέλων. Η μέγιστη πιθανοφάνεια για το μοντέλο ω 1 είναι: ) = L(,y) Όπου είναι ο εκτιμητής μέγιστης πιθανοφάνειας της παραμέτρου θ για το μοντέλο ω 1 Η μέγιστη πιθανοφάνεια για το μοντέλο ω 1 είναι: )=L(,y) Όπου είναι ο εκτιμητής μέγιστης πιθανοφάνειας της παραμέτρου θ για το μοντέλο ω 2 Ο λόγος αυτών των δύο ποσοτήτων λ= παίρνει τιμές απο 0 ( η συνάρτηση πιθανοφάνειας δεν παίρνει αρνητικές τιμές) ως 1.

21 Τιμές κοντά στο μηδέν δηλώνουν ότι το απλούστερο μοντέλο δεν γίνεται αποδεκτό ενώ τιμές κοντά στο 1 δηλώνουν ότι το απλούστερο μοντέλο είναι σχεδόν τόσο καλό όσο και το πιο σύνθετο μοντέλο. Κάτω από συνθήκες ομαλότητας η ποσότητ -2logλ τείνει για αρκετά μεγάλα δείγματα στην Χ 2 κατανομή με βαθμούς ελευθερίας ίσους με την διαφορά στον αριθμό των παραμέτρων ανάμεσα στα δύο μοντέλα.δηλαδη: όπου ν=dim(ω 2 )-dim(ω 1 ) -2logλ=2log )-2log ) Ας σημειώσουμε ότι ότι ο υπολογισμός του likelihood ratio test απαιτεί την προσαρμογή δύο μοντέλων, το wald test απαιτεί τουλάχιστον ένα μοντέλο ενώ το score test δεν απαιτεί κάποιo μοντέλο. 3. Το Μοντέλο της Λογιστικής Παλινδρόμησης Αν προσπαθήσουμε να εκφράσουμε την πιθανότητα επιτυχίας p, μιας δίτιμης μεταβλητής Y με την βοήθεια ενός απλού γραμμικόυ μοντέλου : p= b 0 +b 1 x όπου x οι τιμές μιας ανεξάρτητης μεταβλητής X το κύριο πρόβλημα που θα αντιμετωπίσουμε είναι ότι, αν και οι τιμές της p θεωρητικά δεν μπορούν να βρίσκονται εκτός του διαστήματος [0,1], οι τιμές της ποσότητας b 0 +b 1 x κυμαίνονται σε όλο το εύρος των πραγματικών αριθμών. Μια πρώτη σκέψη για την αντιμετώπιση αυτού του προβλήματος είναι να αντικαταστήσουμε στο μοντέλο την πιθανότητα p του γεγονότος της επιτυχίας με την σχετική πιθανότητα επιτυχίας. Δηλαδη με τον λόγο της πιθανότητας του γεγονότος της επιτυχίας προς την πιθανότητα του γεγονότος της αποτυχίας Ο λόγος αυτός αν και θεωρητικά παίρνει τιμές μέχρι και το +, δεν παίρνει αρνητικές τιμές. Επομένως και πάλι ένα γραμμικό μοντέλο της μορφής = b 0 +b 1 x δεν είναι επαρκές για την εκτίμηση της πιθανότητας p. Αν όμως αντί του λόγου 21

22 χρησιμοποιηθεί ο φυσικός λογάριθμος ln[ τότε οι τιμές του μετασχηματισμένου λόγου, οι οποίες κυμαίνονται στο διάστημα (-,+ ) μπορούν να εκτιμήθούν με την βοήθεια ενός γραμμικού μοντέλου της μορφής ln[ = b 0 +b 1 x Η συνάρτηση ln[p/ 1-p] η οποία συνδέει την πιθανότητα της επιτυχίας p με την ανεξαρτητη μεταβλητή X, στην ορολογία των λογαριθμικών μοντέλων ονομάζεται logit της p και συμβολίζεται με logit(p). Δηλαδή Logit(p)= ln[ = b 0 +b 1 x Αντιλογαριθμίζοντας τα δύο μέλη της εξίσωσης: προκύπτει: ln[ = b 0 +b 1 x = Και αν θέσουμε z= b 0 +b 1 x παίρνουμε: = Επιλύοντας την τελευταία εξίσωση ως προς p, παίρνουμε: p= Η τελευταία εξίσωση (διατυπώνεται επίσης με την μορφή P=1/1+e -z ) αποτελεί την εκτίμηση της πιθανότητας της επιτυχίας p της δίτιμης μεταβλητής Y. Το θεωρητικό διάγραμμα της συνάρτησης

23 f(z)= η οποία εκτιμά την p είναι σιγμοειδής (σχήμα1) ενώ οι τιμές της κυμαίνονται στο διάστημα [0,1] εφόσον η z παίρνει τιμές στο διάστημα [-,+ ] και είναι αυτό στο οποίο κατατείνουν οι αθροιστικές πιθανότητες κανονικής κατανομής. Σχήμα1 Η συνάρτηση f(z)= είναι επομένως κατάλληλη να χρησιμοποιηθεί ως μοντέλο για την εκτίμηση μιας πιθανότητας. Από το διάγραμμα γίνεται φανερό ότι η σχέση της ανεξάρτητής μεταβλητής X και της πιθανότητας πραγματοποίησης του γεγονότος είναι μη γραμμική και οι εκτιμητές πιθανότητας θα βρίσκονται μεταξύ 0 και 1 ανεξαρτήτως της τιμής του Ζ. Το γραμμικό μοντέλο που χρησιμοποιήθηκε για την εκτίμηση του λογαρίθμου της σχετικής πιθανότητας της επιτυχίας της δίτιμης μεταβλητής Y διευρύνεται και στην περίπτωση των περισσότερων της μίας ανεξαρτήτων μεταβλητών. Σε αυτήν την περίπτωση θέτωντας Z=b 0 +b 1 x 1 +b 2 x 2 + +b k x k όπου x 1,x 2,.,x k είναι οι τιμές των ανεξάρτητων μεταβλητών X 1,X 2,,X k προκύπτει ή ισοδύναμα: ln[ = b 0 +b 1 x 1 +b 2 x 2 + +b k x k =e b 0 +b 1 x 1 +b 2 x 2 + +b k x k Ενώ κατά την κλασσική γραμμική παλινδρόμηση η εκτίμηση των παραμέτρων b 0,b 1,b 2, b k γίνεται με την μέθοδο των ελαχίστων τετραγώνων κατά την λογιστική παλινδρόμηση η εκτίμηση των παραμέτρων γίνεται με την μέθοδο της μέγιστης πιθανοφάνειας(maximum likelihood) δηλαδή επιλέγονται οι πιο πιθανοφανείς τιμές των παραμέτρων προκειμένου να οδηγήσουν στα παρατηρούμενα αποτελέσματα. 23

24 4. Εκτίμηση καλής προσαρμογής του Μοντέλου Υπάρχουν πολλοί τρόποι για την εκτίμηση της καλής προσαρμογής του μοντέλου λογιστικής παλινδρόμησης για τα δεδομένα καθενός προβλήματος. Μεταξύ αυτών είναι, η σύγκριση του αριθμόυ των προβλεπόμενων με τις εμπειρικές ( παρατηρούμενες) παρατηρήσεις σε πίνακα ταξινόμησης, το ιστόγραμμα των εκτιμώμενων πιθανοτήτων, η διερεύνηση της πιθανοφάνειας των αποτελεσμάτων, το στατιστικό Z 2 της καλής προσαρμογής, το υπόδειγμα του X 2 και ο έλεγχος των Hosmer και Lameshow της ποσοστιαίας κατανομής των παρατηρήσεων σε ομάδες. 4.1.Ταξινόμηση των παρατηρήσεων Μέτρο εκτίμησης καλής προσαρμογής του μοντέλου για τα δεδομένα συγκεκριμένου παραδείγματος είναι η εκτίμηση του βαθμού ορθής ταξινόμησης.δηλαδή το ποσοστό των ορθών ταξινομημένων παρατηρήσεων με την σύγκριση του αριθμόυ των προβλεπόμενων ως προς τις εμπειρικές παρατηρήσεις στις ομάδες της εξαρτημένης μεταβλητής, όπως ακριβώς λειτουργεί ο συντελεστής R 2, για το μοντέλο της κλασσικής παλινδρόμησης. Πρόκειται ουσιαστικά για την κατασκευή ενός πίνακα συνάφειας στον οποίο οι παρατηρήσεις ταξινομόυνται ως προς την πραγματοποίηση του γεγονότος με βάση τα δειγματικά δεδομένα( observed outcome) και ως προς την πραγματοποίηση του γεγονότος με βάση τις εκτιμήσεις του μοντέλου (predicted outcome). Για να εκτιμηθεί σύμφωνα με το μοντέλο- ότι το γεγονός θα συμβεί σε μια παρατήρηση, πρέπει η εκτιμώμενη πιθανότητα πραγματοποίησης του γεγονότος, για την παρατήρηση, να είναι μεγαλύτερη ή ίση με Πίνακας ταξινόμησης των Παρατηρήσεων

25 predicted observed Οχι Ναι Percentage correct Οχι Ναι ,7 Overall percentage 64,8 Σε έναν πίνακά ταξινόμησης θα πρέπει οι παρατηρούμενες και οι εκτιμώμενες τιμές να συμφωνούν κατά το δυνατόν περισσότερο. Στον παραπάνω πίνακα η συμφωνία αυτή προσσεγγίζει το 65% περίπου των παρατηρήσεων. Τα διαγώνια κελιά του πίνακα περιέχουν τις παρατηρήσεις που συμφωνούν οι παρατηρούμενες και οι εκτιμώμενες τιμές ενώ τα εκτός διαγωνίου κελιά περιέχουν τις παρατηρήσεις που δεν συμφωνούν οι παρατηρούμενες και οι εκτιμώμενες τιμές. Το πρόβλημα με τον πίνακα ταξινόμησης είναι ότι δεν μας πληροφορεί για το μέγεθος των εκτιμώμενων πιθανοτήτων στις περιπτώσεις που έχουμε λανθασμένες εκτιμήσεις. Ο πίνακας ταξινόμησης δεν δείχνει την κατανομή των εκτιμώμενων πιθανοτήτων στις δύο ομάδες αλλά κατά πόσο η πιθανότητα για κάθε ομάδα είναι μεγαλύτερη ή μικρότερη του 50%. 4.2.Ιστόγραμμα Εκτιμώμενων Πιθανοτήτων Όπως είπαμε και πριν το πρόβλημα με τον πίνακα ταξινόμησης είναι ότι δεν μας δίνει πληροφοριες για το μέγεθος των εκτιμώμενων πιθανοτήτων στις περιπτώσεις που έχουμε λανθασμένες εκτιμήσεις. Για παράδειγμα δεν γνωρίζουμε ποιές είναι οι εκτιμώμενες πιθανότητες για τα 38 άτομα που ενώ η παρατηρούμενη τιμή είναι «Ναι», από το μοντέλο εκτιμάται «Όχι». Μια ερώτηση που πρέπει να απαντηθεί είναι αν οι εκτιμώμενες πιθανότητες για τα άτομα αυτά είναι κοντά στο όριο του 0,50 ή απέχουν σημαντικά από αυτό ( γεγονός που θα μείωνε ακόμη περισσότερο την αξιοπιστία του μοντέλου). Ερωτήματα τέτοια μπορούν να απαντηθόυν από το ιστόγραμμα εκτιμώμενων πιθανοτήτων. Το ιστόγραμμα εκτιμωμένων πιθανοτήτων για τα δεδομένα που χρησιμοποιήσαμε και στον πίνακα ταξινόμησης είναι το παρακάτω: 25

26 Ο οριζόντιος άξονας του διαγράμματος ταξινόμησης αντιστοιχεί στις εκτιμώμενες από το μοντέλο πιθανότητες. Επάνω στον άξονα τοποθετούνται οι παρατηρήσεις της ανάλυσης υπό μορφή ιστογράμματος. Οι παρατηρήσεις οι οποίες έχουν εκτιμώμενη πιθανότητα πραγματοποίησης του γεγονότος μεγαλύτερη του 0.5 τοποθετούνται στο δεξιό μέλος του άξονα, ενώ οι παρατηρήσεις με πιθανότητα μικρότερη του 0.5 τοποθετούνται στο αριστερό μέλος του άξονα. Έπίσης κάθε παρατήρηση ορίζεται από το αρχικό διάγραμμα της κατηγορίας που αντιστοιχεί στην πραγματοποίηση ή μη του γεγονότος, έτσι όπως προκύπτει από τα δειγματικά δεδομένα. Όσο στο ιστόγραμμα των εκτιμώμενων πιθανοτήτων διακρίνονται με μεγαλύτερη ευκρίνεια οι δύο ομάδες παρατηρήσεων, δηλαδή οι παρατηρήσεις ως προς το γεγονός που συνέβη βρίσκονται στο δεξιό τμήμα του 0.5 και ως προς το γεγονός που δεν συνέβη βρίσκονται στο αριστερό του 0.5 τόσο το μοντέλο είναι καλά προσαρμοσμένο στα δεδομένα του συγκεκριμένου παραδείγματος. Στο ιστόγραμμα του παραδείγματος μας εμφανίζεται ένας αρκετά μεγάλος αριθμός παρατηρήσεων με ορθά εκτιμώμενες πιθανότητες επιτυχίας σημαντικά μεγαλύτερες του 0.5 (αρκετά από αυτές μεγαλύτερες του 0.7). Αντίθετα ο αριθμός των παρατηρήσεων που έχουν ορθά εκτιμώμενες πιθανότητες αποτυχίας είναι αρκετά μικρότερος και με τιμές των αντίστοιχων πιθανοτήτων να μην διαφοροποιούνται σημαντικά από το 0.5. Επιπλέον το σύνολο αυτών των παρατηρήσεων περιλαμβάνεται στο διάστημα (0.25,0.5) των εκτιμώμενων πιθανοτήτων. 4.3 Διερεύνηση της πιθανοφάνειας των αποτελεσμάτων

27 Εκτός από την διαπίστωση του κατά πόσο ικανοποιητικά το μοντέλο της λογιστικής παλινδρομησης ταξινομεί τις παρατηρήσεις μπορεί να αναζητηθεί κατά πόσο είναι «πιθανά» τα αποτελέσματα του μοντέλου με βάση τις δεδομένες παραμέτρους. Η πιθανότητα των παρατηρούμενων αποτελεσμάτων είναι γνωστή ως «πιθανοφάνεια» και επειδή η πιθανοφάνεια έιναι μικρός αριθμός (μικρότερος της μονάδας) είναι συνήθες να χρησιμοποιείται το διπλάσιο του λογαρίθμου της πιθανοφάνειας (-2lnL) ως μέτρο καλής προσαρμογής του εκτιμώμενου μοντέλου στα δεδομένα μας. Όσο μεγαλύτερη είναι η τιμή της συνάρτησης της πιθανοφάνειας ή όσο μικρότερη είναι η τιμή της συνάρτησης λογαριθμοπιθανοφάνειας -2lnL, τόσο καλύτερη είναι η προσαρμογή του μοντέλου στα δειγματικά δεδομένα. Δηλαδή όσο μεγαλύτερη είναι η πιθανότητα τα διαθέσιμα δειγματικά δεδομένα να προέρχονται από έναν πληθυσμό με παραμετρους τις εκτιμώμενες από το μοντέλο, τόσο καλύτερη η προσαρμογή του λογιστικού μοντέλου. Θα λέγαμε ότι το μοντέλο είναι απόλυτα προσαρμοσμένο όταν η πιθανοφάνεια είναι 1 και η τιμή -2lnL μηδενική. Επειδή όμως η τιμή του L και αντίστοιχα και η τιμή του -2lnL εξαρτώνται κάθε φορά από το μέγεθος του δείγματος, προκειμένου οι δύο αυτές ποσότητες να χρησιμοποιηθούν για την αξιολόγηση ενός λογιστικού μοντέλου, θα πρέπει να συγκρίνονται με τις αντίστοιχες ποσότητες ενός άλλου απλούστερου μοντέλου (baseline model ) που εκτιμάται για τα ίδια δειγματικά δεδομένα. Η σύγκριση αυτή μπορεί να γίνει με την βοήθεια του λόγου των μέγιστων τιμών της συνάρτησης πιθανοφάνειας γαι τα δύο συγκρινόμενα μοντέλα. Αν για παράδειγμα πρόκειται να αξιολογηθεί η προσαρμογή του μοντέλου logit(p)=b 0 +b 1 x 1 +b 2 x 2 (με μέγιστη πιθανοφάνεια L 2 ) σε σχέση με τα απλούστερα μοντέλα logit(p)= b 0 +b 1 x 1 (με μέγιστη πιθανοφάνεια L 1 ) και logit(p)= b 0 (με μέγιστη πιθανοφάνεια L 0 ) αυτό γίνεται με την βοήθεια του λόγου -2ln( )=-2lnL 1 -(-2lnL 2 ) για την πρώτη σύγριση και του λόγου: -2ln( )=-2lnL 0 -(-2lnL 2 ) για την δεύτερη σύγκριση Υπό την προυπόθεση ότι ισχύουν οι μηδενικές υποθέσεις: H 0 : β 2 =0 για την πρώτη σύγκριση και H 0 : β 1 =β 2 =0 για την δεύτερη σύγκριση. Οι λόγοι που προκύπτουν ακολουθόυν την κατανομή X 2, με βαθμούς ελευθερίας 1 και 2 αντίστοιχα. Γενικά οι βαθμοί ελευθερίας του λόγου των τιμών της συνάρτησης πιθανοφάνειας είναι ίσοι με την διαφορά του αριθμού των ανεξάρτητων μεταβλητών που περιλαμβάνονται στα δύο συκρινόμενα κάθε φορά μοντέλα. 27

28 4.4.Το μοντέλο X 2 Στην περίπτωση που αξιολογείται συνολικά η προσαρμογή του μοντέλου logit(p)=b 0 +b 1 x 1 +b 2 x 2 +.+b k x k στα δειγματικά δεδομένα χρησιμοποιείται ο λόγος -2ln( )=-2lnL 0 -(-2lnL f ) όπου L f η τιμή της συνάρτησης πιθανοφάνειας για το πλήρες μοντέλο και L 0 η τιμή της συνάρτησης πιθανοφάνειας για το μοντέλο που περιλαμβάνει μόνο το σταθερό όρο (σημειώνεται ότι εάν δεν περιλαμβάνεται σταθερός όρος στο μοντέλο χρησιμοποιείται για σύγκριση η πιθανοφάνεια για το μοντέλο χωρίς καμιά μεταβλητή). Η ποσότητα -2ln( ) ακολουθεί την κατανομή X 2 με κ-βαθμούς ελευθερίας. Με άλλα λόγια, το μοντέλο X 2 - με το αντίστοιχο επίπεδο σημαντικότητας - ελέγχει την μηδενική υπόθεση για τους συντελεστές β 1,β 2,...,β κ H 0 : β 1 =β 2 =...=β κ =0 Η απόρριψη της μηδενικής υπόθεσης οδηγεί στην ενναλακτική H A : τουλάχιστον ένας συντελεστής β i,i=1,2,,κ είναι διάφορος του 0. Ο έλεγχος αυτός είναι ισοδύναμός με τον έλεγχο F που πραγματοποιείται σε ένα μοντέλο κλασικής πολλαπλής γραμμικής παλινδρόμησης προκειμένου να αξιολογηθεί η προσαρμογή του στα δειγματικά δεδομένα Έλεγχος βελτίωσης της τιμής X 2 Η βελτιωμένη τιμή του X 2 είναι η μεταβολή της τιμής -2lnL μεταξύ διαδοχικών σταδίων στη δημιουργία του μοντέλου. Ελέγχει την μηδενική υπόθεση ότι οι συντελεστές παλινδρόμησης των μεταβλητών που εισέρχονται στο μοντέλο στο τελευταίο στάδιο είναι μηδενικοί. Η τιμή X 2 είναι η ίδια με την βελτιωμένη τιμή του εάν θεωρήσουμε τα μοντέλα με το σταθερό όρο και το πλήρες μοντέλο(με όλες τις μεταβλητες). Εάν αντιθέτως, θεωρήσουμε περισσότερα των δύο αυτών υποδειγμάτων, κάνοντας π.χ επιλογή μεταβλητών, οι τιμές των X 2 θα διαφέρουν. Ο έλεγχος είναι ανάλογος με εκείνον της μεταβολής F στην κλασσική πολλαπλή γραμμική παλινδρόμηση.

29 4.6. Στατιστικό Z 2 της καλής προσαρμογής Ένα άλλο μέτρο καλής προσαρμογής του μοντέλου είναι το στατιστικό Z 2 το οποίο συγκρίνει τις παρατηρούμενες πιθανότητες με εκείνες που προβλέπονται από το μοντέλο. Η τιμή του στατιστικού Z 2 δίνεται από την σχέση Z 2 = Όπου το υπόλοιπο είναι η διαφορά μεταξύ της παρατηρούμενης τιμής Y i και της προβλεπόμενης P i Έλεγχος των Hosmer και Lemeshow Οι Hosmer και Lemeshow χρησιμοποίησαν το στατιστικό C για τον έλεγχο της καλής προσαρμογής των δεδομένων (ποσοστιαίας κατανομής των παρατηρήσεων σε ομάδες). Το στατιστικό C θεωρείται ότι κατανέμεται με βάση την κατανομή X 2 του Pearson. Τιμή του Χ 2 που αντιστοιχεί σε επίπεδο σημαντικότητας a>0.05 δηλώνει ότι το μοντέλο της λογιστικής παλινδρόμησης είναι καλά προσαρμοσμένο στα δεδομένα Ο συντελεστής προσδιορισμού R 2 των Cox και Snell Για την αξιολόγηση της προσαρμογής του λογιστικού μοντέλου εκτός από όλα τα προηγούμενα χρησιμοποιείται και ένα επιπλέον μέτρο καλής προσαρμογής, αντίστοιχο με τον συντελεστή προσδιορισμού R 2 που χρησιμοποιείται στην πολλαπλή γραμμική παλινδρόμηση. Το μέτρο αυτό ονομάζεται R 2 των Cox και Snell και ισούται με όπου n το μέγεθος του δείγματος. R 2 =1-[ ] 2/n Το πρόβλημα με τον συγκεκριμένο συντελεστή προσδιορισμού είναι ότι ποτέ δεν καταλήγει να πάρει μέγιστη τιμή το 1. Ο Nagelkerke το 1991 πρότεινε μια τροποποίηση του συντελεστή των Cox και Snell προκειμένου να ξεπεράσει το συγκεκριμένο πρόβλημα. Ο συντελεστής που πρότεινε είναι ο: =R 2 /R 2 max (0,1) όπου R 2 max=1-[l 0 ] 2/n 5. Έλεγχος και Ερμηνεία των Συντελεστών Παλινδρόμησης 5.1. Ερμηνεία των Συντελεστών Παλινδρόμησης 29

30 Η ερμηνεία των συντελεστών του μοντέλου της γραμμικής παλινδρόμησης είναι απλή και ορίζεται ευθέως. Ο κάθε ένας από τους συντελεστές b 1,b 2,.,b k της εξίσωσης =b 0 +b 1 x 1 +b 2 x 2 + +b k x k εκφράζει την μέση μεταβολή της εξαρτημένης μεταβλητής Y για μία μονάδα αύξησης της αντίστοιχης ανεξάρτητης μεταβλητής X i, όταν οι τιμές των άλλων ανεξάρτητων μεταβλητών παραμένουν σταθερές. Στη λογιστική παλινδρόμηση η ερμηνεία των συντελεστών μπορεί να γίνει σε εναρμόνιση με τα παραπάνω εφόσον προηγουμένως γίνει κάποιος αναγκαίος μετασχηματισμός. Ο μετασχηματισμός αυτός αφορά την απόδοση της εξίσωσης της λογιστικής παλινδρόμησης με το λογάριθμο του λόγου πιθανότητας πραγματοποίησης του γεγονότος προς την πιθανότητα μη πραγματοποίησης του γεγονότος. Ουσιαστικά είναι η μορφή της γραμμικής συνάρτησης με την οποία μπορεί να εκτιμηθεί ο λογάριθμός της σχετικής πιθανότητας, δηλαδή: Ln[ ]=b 0 +b 1 x 1 +b 2 x 2 + +b k x k Με τον παραπάνω μετασχηματισμό προκύπτει η ερμηνεία των συντελεστών του λογιστικού μοντέλου με τρόπο ανάλογο με αυτόν της γραμμικής παλινδρόμησης. Κάθε ένας από τους συντελεστές b 1,b 2,.,b k μπορεί να ερμηνευθεί ως τη μεταβολή του λογαρίθμου της σχετικής πιθανότητας Ln[ ] από την κατά μονάδα μεταβολή της ανεξάρτητης μεταβλητής X i, εφόσον οι τιμές των υπολοίπων ανεξάρτητων μεταβλητών παραμένουν σταθερές. Επειδή είναι όμως πιο ενδιαφέρον οι συντελεστές να μπορούν να ερμηνεύουν την μεταβολή στο λόγο των πιθανοτήτων και όχι στο λογάριθμο της σχετικής πιθανότητας-από την κατα μονάδα μεταβολή της ανεξάρτητης μεταβλητής X i, είναι προτιμότερο η εξίσωση Ln[ ]=b 0 +b 1 x 1 +b 2 x 2 + +b k x k να γραφεί με αντιλογαρίθμιση των δύο μερών της ως =e b 0 +b 1 x 1 +b 2 x 2 + +b k x k= Από την τελευταία εξίσωση προκύπτει ότι ο παράγοντας e b i είναι ο παράγοντας επί τον οποίο πολλαπλασιάζεται η σχετική πιθανότητα πραγματοποίησης του γεγονότος, όταν η ανεξάρτητη μεταβλητή X i, αυξηθεί κατά μία μονάδα και εφόσον οι υπόλοιπες μεταβλητές παραμένουν σταθερές. Αν το b i είναι θετικό, ο παράγοντας e b i είναι μεγαλύτερος από την μονάδα, γεγονός που σημαίνει ότι η σχετική πιθανότητα αυξάνει. Αν το b i είναι αρνητικό, ο παράγοντας e b i είναι μικρότερος της μονάδας, δηλαδή η σχετική πιθανότητα (δηλαδή η η εξαρτημένη μεταβλητη

31 ) μειώνεται. Τέλος όταν το b i είναι μηδέν, ο παράγοντας e b i γίνεται ίσος με την μονάδα, που σημαίνει ότι δεν συμβαίνει καμιά μεταβολή στην σχετική πιθανότητα Έλεγχοι για τους συντελεστές του λογιστικού μοντέλου Ο προσδιορισμός των συντελεστών του λογιστικού μοντέλου γίνονται με την βοήθεια της μεθόδου εκτίμησης μέγιστης πιθανοφάνειας, μιας διαδικασίας η οποία εκτιμά τις πληθυσμιακές παραμέτρους του μοντέλου με κριτήριο τη μεγιστοποίηση της πιθανότητας τα διαθέσιμα δειγματικά δεδομένα να έχουν παραχθεί από τις εκτιμώμενες παραμέρους. Εκτός των συντελεστών του δειγματικού μοντέλου b 1,b 2,.,b k, η μέθοδος εκτίμησης μέγιστης πιθανοφάνειας εκτιμά και τα αντίστοιχα τυπικά σφάλματα αυτών. Είναι γνωστό ότι ένας οποιοσδήποτε συντελεστής b i, του λογιστικού μοντέλου, για μεγάλα δείγματα ακολουθεί κατα προσέγγιση την κανονική κατανομή με μέση τιμή τον αντίστοιχο πληθυσμιακό συντελεστή β i, και εκτιμώμενο τυπικό σφάλμα se(b i ). Επομένως όταν το μέγεθος του δείγματος είναι αρκετά μεγάλο το πηλίκο: ακολουθεί κατά προσέγγιση την τυπική κανονική κατανομή. Ο έλεγχος της μηδενικής υπόθεσης ότι ο συντελεστής παλινδρόμησης είναι μηδενικός δηλαδή H 0 : β i =0 ( ή ισοδύναμα e β ι=1 ) έναντι της ενναλακτικής H A : β i 0 ( ή ισοδύναμα e β ι 1 ) βασίζεταί στο στατιστικό του Wald και στο επίπεδο στατιστικής σημαντικότητας του, το οποίο ακολουθεί X 2 κατανομή. Αν μια μεταβλητή έχει ένα βαθμό ελευθερίας το στατιστικό του Wald είναι το τετράγωνο του λόγου του συντελεστή προς το τυπικό σφάλμα αυτού: z=[ 2 όπου όταν ισχύει η μηδενική υπόθεση H 0 : β i =0, ακολουθεί X 2 κατανομή με 1 βαθμό ελευθερίας. Για κατηγορικές μεταβλητές το στατιστικό του Wald έχει βαθμούς ελευθερίας κατά ένα λιγότερους από τον αριθμό των κατηγοριών. Η εγκυρότητα του στατιστικόυ του Wald απαιτεί την εφαρμογή του σε μεγάλα δείγματα, ώστε να διασφαλίζεται και η αξιοπιστία των ασυμπτωτικών προσεγγίσεων από τις οποίες προκύπτει η δειγματοληπτική κατανομή του. Το στατιστικό του Wald έχει ένα βασικό μειονέκτημα. Με την αύξηση της απόλυτης τιμής του συντελεστή παλινδρόμησης, το εκτιμώμενο τυπικό σφάλμα γίνεται επίσης μεγάλο που οδηγεί σε πολύ μικρή τιμή του στατιστικού Wald, με αποτέλεσμα η υπόθεση ότι η τιμή του συντελεστή παλινδρόμησης είναι μηδενική να απορρίπτεται ενώ θα έπρεπε να γίνεται αποδεκτή. Συμπερασματικά όταν η τιμή του συντελεστή παλινδρόμησης είναι μεγάλη, δεν πρέπει να στηριζόμαστε στο στατιστικό του Wald για τον έλεγχο του αντίστοιχου συντελεστή παλινδρόμησης. Σε αυτές τις περιπτώσεις είναι προτιμότερο να χρησιμοποιείται για τον 31

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή 1. Γενικά... 25 2. Έννοια και Είδη Μεταβλητών... 26 3. Κλίμακες Μέτρησης Μεταβλητών... 29 3.1 Ονομαστική κλίμακα... 30 3.2. Τακτική κλίμακα... 31 3.3 Κλίμακα ισοδιαστημάτων... 34 3.4

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος

Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος ΜΑΘΗΜΑ 10 ο Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος Η μέθοδος της συνολοκλήρωσης είναι ένας τρόπος με τον οποίο μπορούμε να εκτιμήσουμε τη μακροχρόνια σχέση ισορροπίας που υπάρχει μεταξύ δύο ή

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Το διάστημα εμπιστοσύνης είναι ένα διάστημα αριθμών

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Οικονομετρία Ι Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής Ενότητα 2 Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής Ένας από τους βασικούς σκοπούς της Στατιστικής είναι η εκτίμηση των χαρακτηριστικών ενός πληθυσμού βάσει της πληροφορίας από ένα δείγμα.

Διαβάστε περισσότερα

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Ενότητα 3 Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Εκτός από τις μέσες τιμές, τυπικές αποκλίσεις κλπ, θέλουμε να βρούμε κατά πόσον αυτές οι παρατηρούμενες τάσεις εξαρτώνται από συγκεκριμένες συνθήκες ή προϋποθέσεις.

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΚΑΙ ΣΠΟΥΔΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ (Α ΜΕΡΟΣ: ΣΥΝΑΡΤΗΣΕΙΣ) Επιμέλεια: Καραγιάννης Ιωάννης, Σχολικός Σύμβουλος Μαθηματικών

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ 4ο Διαδικασία των συντελεστών αυτοσυσχέτισης Ονομάζουμε συνάρτηση αυτοσυσχέτισης (autocorrelation function) και συμβολίζεται με τα γράμματα

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ι (ΘΕ ΠΛΗ ) ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ ΤΕΛΙΚΗΣ ΕΞΕΤΑΣΗΣ 9 Ιουνίου (διάρκεια ώρες και λ) Διαβάστε προσεκτικά και απαντήστε

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

Δ Ι Α Γ Ω Ν Ι Σ Μ Α Σ Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α Γ Ε Ν Ι Κ Η Σ Π Α Ι Δ Ε Ι Α Σ. οι τιμές μιας μεταβλητής Χ ενός δείγματος πλήθους ν με k.

Δ Ι Α Γ Ω Ν Ι Σ Μ Α Σ Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α Γ Ε Ν Ι Κ Η Σ Π Α Ι Δ Ε Ι Α Σ. οι τιμές μιας μεταβλητής Χ ενός δείγματος πλήθους ν με k. Δ Ι Α Γ Ω Ν Ι Σ Μ Α Σ Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α Γ Ε Ν Ι Κ Η Σ Π Α Ι Δ Ε Ι Α Σ ΘΕΜΑ Α A Να αποδείξετε ότι η συνάρτηση () είναι παραγωγίσιμη στο R με () Α Έστω k οι τιμές μιας μεταβλητής Χ ενός δείγματος πλήθους

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή 4.3.3 Ο Έλεγχος των Shapro-Wlk για την Κανονική Κατανομή Ένας άλλος πολύ γνωστός έλεγχος καλής προσαρμογής για την κανονική κατανομή, ο οποίος μπορεί να χρησιμοποιηθεί στην θέση του ελέγχου Lllefors, είναι

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής Διαγνωστικοί Έλεγχοι Διαπίστωσης της Αυτοσυσχέτισης Οι περισσότεροι από τους διαγνωστικούς ελέγχους της αυτοσυσχέτισης αναφέρονται σε αυτοσυσχέτιση

Διαβάστε περισσότερα

Μάθημα Αστικής Γεωγραφίας

Μάθημα Αστικής Γεωγραφίας Μάθημα Αστικής Γεωγραφίας Διδακτικό Έτος 2015-2016 Παραδόσεις Διδακτικής Ενότητας: Πληθυσμιακή πρόβλεψη Δούκισσας Λεωνίδας, Στατιστικός, Υποψ. Διδάκτορας, Τμήμα Γεωγραφίας, Χαροκόπειο Πανεπιστήμιο Σελίδα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ Φροντιστήριο Μ.Ε. «ΑΙΧΜΗ» Κ.Καρτάλη 8 Βόλος Τηλ. 43598 ΠΊΝΑΚΑΣ ΠΕΡΙΕΧΟΜΈΝΩΝ 3. Η ΕΝΝΟΙΑ ΤΗΣ ΠΑΡΑΓΩΓΟΥ... 5 ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ...

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής στην Προσχολική Ηλικία Περιεχόμενα ενότητας Παρουσιάζονται οι βασικές

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX Θεμελιώδης αλγόριθμος επίλυσης προβλημάτων Γραμμικού Προγραμματισμού που κάνει χρήση της θεωρίας της Γραμμικής Άλγεβρας Προτάθηκε από το Dantzig (1947) και πλέον

Διαβάστε περισσότερα

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Ο παρακάτω πίνακας παρουσιάζει θανάτους από καρδιακή ανεπάρκεια ανάμεσα σε άνδρες γιατρούς οι οποίοι έχουν κατηγοριοποιηθεί κατά ηλικία

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός. ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr Καθ η γη

Διαβάστε περισσότερα

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης Σφάλματα Μετρήσεων 4.45 Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης Διάστημα εμπιστοσύνης βρίσκονται εκτός του Διαστήματος Εμπιστοσύνης 0.500 X 0.674σ 1 στις 0.800 X 1.8σ 1 στις

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

- ΟΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΕΝΟΤΗΤΑ 6: ΜΗ ΠΕΠΕΡΑΣΜΕΝΟ ΟΡΙΟ ΣΤΟ

- ΟΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΕΝΟΤΗΤΑ 6: ΜΗ ΠΕΠΕΡΑΣΜΕΝΟ ΟΡΙΟ ΣΤΟ ΚΕΦΑΛΑΙΟ ο: ΣΥΝΑΡΤΗΣΕΙΣ - ΟΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΕΝΟΤΗΤΑ 6: ΜΗ ΠΕΠΕΡΑΣΜΕΝΟ ΟΡΙΟ ΣΤΟ R - ΟΡΙΟ ΣΥΝΑΡΤΗΣΗΣ ΣΤΟ ΑΠΕΙΡΟ - ΠΕΠΕΡΑΣΜΕΝΟ ΟΡΙΟ ΑΚΟΛΟΥΘΙΑΣ [Κεφ..6: Μη Πεπερασμένο Όριο στο R - Κεφ..7: Όρια Συνάρτησης

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ ΚΕΦΑΛΑΙΟ ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ Ως γνωστό δείγμα είναι ένα σύνολο παρατηρήσεων από ένα πληθυσμό. Αν ο πληθυσμός αυτός θεωρηθεί μονοδιάστατος τότε μπορεί να εκφρασθεί με τη συνάρτηση

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ)

ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ) ΑΣΚΗΣΕΙΣ. Ο διευθυντής προσωπικού μιας μεγάλης εταιρείας πιστεύει ότι ίσως υφίσταται κάποια σχέση μεταξύ των ημερών απουσίας και της ηλικίας των εργαζομένων. Με βάση την υπόθεση αυτή ενδιαφέρεται να κατασκευάσει

Διαβάστε περισσότερα

ΔΕΟ13 - Επαναληπτικές Εξετάσεις 2010 Λύσεις

ΔΕΟ13 - Επαναληπτικές Εξετάσεις 2010 Λύσεις ΔΕΟ - Επαναληπτικές Εξετάσεις Λύσεις ΘΕΜΑ () Το Διάγραμμα Διασποράς εμφανίζεται στο επόμενο σχήμα. Από αυτό προκύπτει καταρχήν μία θετική σχέση μεταξύ των δύο μεταβλητών. Επίσης, από το διάγραμμα φαίνεται

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι Πανεπιστημίου Πειραιώς) Τηλ.: 4..97,,, Fax : 4..634 URL : www.vtal.gr emal: f@vtal.gr Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 12ο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 12ο ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ 12ο ΑΙΤΙΟΤΗΤΑ Ένα από τα βασικά προβλήματα που υπάρχουν στην εξειδίκευση ενός υποδείγματος είναι να προσδιοριστεί η κατεύθυνση που μία μεταβλητή

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης ΜΑΘΗΜΑ 3ο Υποδείγματα μιας εξίσωσης Οι βασικές υποθέσεις 1. Ο διαταρακτικός όρος u t είναι μια τυχαία μεταβλητή με μέσο το μηδέν. Eu t = 0 για t = 1,2,3..n 2. Η διακύμανση της τυχαίας μεταβλητής u t είναι

Διαβάστε περισσότερα

Συνολοκλήρωση και VAR υποδείγματα

Συνολοκλήρωση και VAR υποδείγματα ΜΑΘΗΜΑ ο Συνολοκλήρωση και VAR υποδείγματα Ησχέσησ ένα στατικό υπόδειγμα συνολοκλήρωσης και σ ένα υπόδειγμα διόρθωσης λαθών μπορεί να μελετηθεί καλύτερα όταν χρησιμοποιούμε τις ιδιότητες των αυτοπαλίνδρομων

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Πολλαπλές συγκρίσεις Στην ανάλυση διακύμανσης ελέγχουμε την ισότητα

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2 ΚΕΦΑΛΑΙΟ ο: ΣΥΝΑΡΤΗΣΕΙΣ - ΟΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΕΝΟΤΗΤΑ 8: ΘΕΩΡΗΜΑ BOLZANO - ΠΡΟΣΗΜΟ ΣΥΝΑΡΤΗΣΗΣ - ΘΕΩΡΗΜΑ ΕΝΔΙΑΜΕΣΩΝ ΤΙΜΩΝ - ΘΕΩΡΗΜΑ ΜΕΓΙΣΤΗΣ ΚΑΙ ΕΛΑΧΙΣΤΗΣ ΤΙΜΗΣ - ΣΥΝΟΛΟ ΤΙΜΩΝ ΣΥΝΕΧΟΥΣ ΣΥΝΑΡΤΗΣΗΣ

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΣΙΜΟΣ ΜΕΙΝΤΑΝΗΣ, Αναπληρωτής Καθηγητής Τμήμα Οικονομικών Επιστημών, ΕΚΠΑ ΓΙΑΝΝΗΣ Κ. ΜΠΑΣΙΑΚΟΣ, Επίκουρος Καθηγητής Τμήμα Οικονομικών

Διαβάστε περισσότερα

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) 4. ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) Η μέθοδος της βηματικής παλινδρόμησης (stepwise regression) είναι μιά άλλη μέθοδος επιλογής ενός "καλού" υποσυνόλου ανεξαρτήτων μεταβλητών.

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα