ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ανδρομάχη Σκουφά Επιβλέπουσα: Φ. Κολυβά-Μαχαίρα Επικ.Καθηγήτρια Α.Π.Θ Θεσσαλονίκη Νοέμβριος 2008

2 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ανδρομάχη Σκουφά Επιβλέπουσα: Φ. Κολυβά-Μαχαίρα Επικ.Καθηγήτρια Α.Π.Θ Θεσσαλονίκη Νοέμβριος 2008

3 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ανδρομάχη Σκουφά Επιβλέπουσα: Φ. Κολυβά-Μαχαίρα Επικ.Καθηγήτρια Α.Π.Θ Εγκρίθηκε από την τριμελή επιτροπή τον Νοέμβριο Φ. Κολυβά-Μαχαίρα Μωυσιάδης Πολυχρόνης Μπόρα-Σέντα Ευθυμία Επικ.Καθηγήτρια Α.Π.Θ Καθηγητής Α.Π.Θ Επικ.Καθηγήτρια Α.Π.Θ Θεσσαλονίκη Νοέμβριος

4 «Σε εκείνους που οφείλω τα πάντα, στους γονείς μου και στον Γιώργο»

5 5

6 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή Εκτιμητές μέγιστης πιθανοφάνειας Η log-likelihood συνάρτηση Το διάνυσμα των score Πίνακας Πληροφορίας(Information Matrix) Newton-Raphson και Fisher Scoring Η κατανομή της τυχαίας μεταβλητής -2logλ n Έλεγχοι Υποθέσεων Wald test Score tests Το Μοντέλο της Λογιστικής παλινδρόμησης Εκτίμηση της Καλής Προσαρμογής του Μοντέλου Ταξινόμηση των παρατηρήσεων Ιστόγραμμα Εκτιμώμενων Πιθανοτήτων Διερεύνηση της πιθανοφάνειας των αποτελεσμάτων Το μοντέλο X Έλεγχος βελτίωσης της τιμής X Στατιστικό Z 2 της καλής προσαρμογής Έλεγχος των Hosmer και Lemeshow Ο συντελεστής προσδιορισμού R 2 των Cox και Snell...

7 5. Έλεγχος και Ερμηνεία των Συντελεστών Παλινδρόμησης Ερμηνεία των Συντελεστών Παλινδρόμησης Έλεγχοι για τους συντελεστές του λογιστικού μοντέλου Διαστήματα εμπιστοσύνης για τους συντελεστές του λογαριθμικού μοντέλου Μερική Συσχέτιση Προσθήκη στο Μοντέλο Όρων Αλληλεπίδρασης Επιλογή των Ανεξάρτητων Μεταβλητών Κριτήρια επιλογής Μεταβλητών Μέθοδοι Επιλογής των ανεξάρτητων μεταβλητών ενός μοντέλου Διαγνωστικά Καταλληλότητας του Μοντέλου Διαγνωστικές μέθοδοι Διαγνωστικά Διαγράμματα Εφαρμογή Λογιστικής παλινδρόμησης Συντελεστές Παραμέτρων Εκτίμηση της καλής Προσαρμογής του Μοντέλου Επιλογή των ανεξάρτητων μεταβλητών Διαγνωστικά Διαγράμματα του Μοντέλου... ΒΙΒΛΙΟΓΡΑΦΙΑ... 7

8

9 1. Εισαγωγή Η Λογιστική παλινδρόμηση είναι μία μέθοδος πολυπαραγοντικής στατιστικής ανάλυσης που χρησιμοποιεί ένα σύνολο ανεξαρτήτων μεταβλητών για την διερεύνηση της κίνησης μιας κατηγορικής εξαρτημένης μεταβλητής. Η Λογιστική παλινδρόμηση είναι χρήσιμη σε καταστάσεις στις οποίες επιθυμούμε την πρόβλεψη ύπαρξης ή της απουσίας ενός χαρακτηριστικού ή ενός συμβάντος. Η πρόβλεψη αυτή βασίζεται στην κατασκευή ενός γραμμικού μοντέλου και συγκεκριμένα στον προσδιορισμό των τιμών που παίρνουν οι συντελεστές ενός συνόλου ανεξαρτήτων μεταβλητών που χρησιμοποιούνται ως μεταβλητές πρόβλεψης. Η πρόβλεψη κατα πόσο θα συμβεί η όχι κάποιο γεγονός και η αναγνώριση των μεταβλητών των αναγκαιών για την πρόβλεψη είναι θέμα συχνού προβληματισμού. Για την αντιμετώπιση τέτοιων προβλημάτων το υπόδειγμα της γραμμικής παλινδρόμησης δεν είναι κατάλληλο για την εκτίμηση των τιμών της εξαρτημένης μεταβλητής από τις τιμές των ανεξάρτητων. Σε μια τέτοια περίπτωση χρησιμοποιώντας την τιμή 1 για το ενδεχόμενο της επιτυχίας ( την πραγματοποίηση,δηλαδή,του γεγονότος) και την τιμή 0 για το ενδεχόμενο της αποτυχίας, ο υπολογισμός της μέσης τιμής της εξαρτημένης δίτιμης μεταβλητής, ουσιαστικά ορίζει την αναλογία p, των επιτυχιών στο σύνολο των δυνατών τιμών της. Όπως με την βοήθεια του μοντέλου της γραμμικής παλινδρόμησης, εκτιμάται η μέση τιμή της συνεχούς μεταβλητής Y, για ένα συγκεκριμένο σύνολο τιμών των ανεξάρτητων μεταβλητών, έτσι μπορεί να εκτιμηθεί και η πιθανότητα p της επιτυχίας μιας δίτιμης μεταβλητής (η μέση τιμή της δηλαδή) για ένα σύνολο τιμών μιας ή περισσότερων ανεξάρτητων μεταβλητών. Η τεχνική που χρησιμοποιείται σε αυτές τις περιπτώσεις ονομάζεται λογιστική παλινδρόμηση(logistic regression). Εκτός από την πρόβλεψη ένα μοντέλο λογιστικής παλινδρόμησης δίνει την δυνατότητα να εκτιμήσουμε την επίδραση κάθε ανεξάρτητης μεταβλητής στην διαμόρφωση των τιμών της εξαρτημένης μεταβλητής. Στην λογιστική παλινδρόμηση, σε αντίθεση με την πολλαπλή γραμμική παλινδρόμηση είναι δυνατόν να χρησιμοποιήθουν ως εξαρτημένες μεταβλητές εκτός από αναλογικές αριθμητικές μεταβλητές(ratio scales) και κατηγορικές μεταβλητές(nominal scale). Η πιο διαδεδομένη βιβλιογραφικά έκφραση της λογιστικής παλινδρόμησης είναι: Ln(odds)=a+b 1 x 1 +b 2 x b k x k Το δεξί μέλος της εξίσωσης δημιουργείται από ένα γραμμικό συνδυασμό των ανεξάρτητών μεταβλητών που συμμετέχουν στο μοντέλο παλινδρόμησης. Το αριστερό μέλος περιέχει τις τιμές της εξαρτημένης μεταβλητής με την μορφή του λογαρίθμου των odds(απόδοση), δηλαδή του λογαρίθμου της σχέσης: odds= Τα odds εναλλακτικά ονομάζονται logit και ο όρος prob εκφράζει την πιθανότητα του συμβάντος του γεγονότος. Οι συντελεστές των ανεξαρτήτων μεταβλητών στην εξίσωση λογιστικής παλινδρόμησης εκτιμούνται με βάση της μεθόδου Μέγιστης Πιθανοφάνειας. Σύμφωνα με την μέθοδο αυτή η τιμή των συντελεστών των ανεξαρτήτων μεταβλητών είναι αυτή που κάνει τις παρατηρηθείσες τιμές της εξαρτημένης μεταβλητής πιο πιθανές, βάσει του συνόλου των ανεξαρτήτων μεταβλητών. 9

10 2. Εκτιμητές μέγιστής πιθανοφάνειας Ας είναι y=(υ 1,...,Υ n ) ένα τυχαίο ανεξάρτητο διάνυσμα με συνάρτηση πυκνότητας πιθανότητας f i ( y i ;θ), θ Ω R r και ω Ω. 2.1 Η log-likelihood συνάρτηση Σαν συνάρτηση πιθανοφάνειας (Likelihood function) ορίζουμε την από κοινού κατανομή των τυχαίων μεταβλητών Υ 1,...,Υ n όταν η κατανομή θεωρείται συνάρτηση της παραμέτρου θ, δηλαδή: f(y;θ)= Συχνά χρησιμοποιούμε τον λογάριθμο της συνάρτησης πιθανοφάνειας και την ονομάζουμε log-likelihood συνάρτηση η οποία είναι: Log= Ένας απλός τρόπος για να εκτιμήσουμε την παραμέτρο θ είναι να μεγιστοποιήσουμε την συνάρτηση πιθανοφάνειας (maximize) επιλέγοντας τις πιο πιθανοφανείς τιμές των παραμέτρων προκειμένου να οδηγήσουν στα παρατηρούμενα αποτελέσματα. Τελικά ορίζουμε ως εκτιμητή μέγιστης πιθανοφάνειας της παραμέτρου θ την: Log Log για κάθε θ Το διάνυσμα των score

11 Η πρώτη παράγωγος της log-likelihood συνάρτησης ονομάζεται Fisher s score συνάρτηση και συμβολίζεται ως: u(θ)= Αν η log-likelihood συνάρτηση είναι κοίλη μπορούμε να βρούμε τους εκτιμητές μέγιστης πιθανοφάνειας μηδενίζοντας το διάνυσμα των score, λύνοντας δηλαδή τις εξισώσεις: u( )= Πίνακας Πληροφορίας(Information Matrix) Το διάνυσμα των score έχει κάποιες ενδιαφέρουσες στατιστικές ιδιότητες. Η μέση τιμή του είναι ίση με μηδέν, δηλαδή: Ε[u(θ)]=0 και ο πίνακάς διακυμάνσεων-συνδιακυμάνσεων δίνεται από τον Information Matrix: var[u(θ)]= Ε[u(θ)u (θ)]=i(θ) Κάτω από συνθήκες ομαλότητας ο πίνακας πληροφορίας(information matrix) ορίζεται και ως η αρνητκή μέση τιμή της δεύτερης παραγώγου της log- likehood συνάρτησης, δηλαδή ως: I(θ)=-Ε[ ] Newton-Raphson και Fisher Scoring Ο υπολογισμός των εκτιμητών μέγιστής πιθανοφάνειας συχνά απαιτεί επαναληπτικές διαδικασίες. Ας θεωρήσουμε ότι θέλουμε να εκτιμήσουμε με το διάνυσμα των score τους εκτιμητές μέγιστης πιθανοφάνειας γύρω από μία αρχική τιμή θ 0 χρησιμοποιώντας σειρά taylor πρώτης τάξης, δηλαδή: u( )] u(θ 0 )+ (θ-θ 0 ) Ας είναι H ο εσσιανός πίνακας ή αλλιώς ο πίνακας των δεύτερων παραγώγων της loglikelihood συνάρτησης: H(θ)= = Θέτωντας u( )=0 και λύνοντας ως προς έχουμε: 11

12 =θ 0 -H -1 (θ 0 ) u(θ 0 ) (1) αυτό το αποτέλεσμα αποτελεί την βάση μιας επαναληπτικής διαδικασίας προσσεγγιστικής λύσης για τους εκτιμητές μέγιστης πιθανοφάνειας γνωστή ως τεχνική Newton-Raphson. Δοσμένης μιας αρχικής τιμής χρησιμοποιούμε την (1) εξίσωση για να λάβουμε μια βελτιωμένη εκτίμηση και επαναλαμβάνουμε μέχρις ώτου οι διαφορές ανάμεσα στις διαδοχικές εκτιμήσεις να τείνουν στο μηδεν. Μία εναλλακτική διαδικασία που προτάθηκε από τον Fisher είναι να αντικαταστήσουμε τον εσσιανό πίνακα με την μέση τίμή του δηλαδή με τον information matrix I: γνωστό ως Fisher Scoring. =θ 0 -I -1 (θ 0 ) u(θ 0 ) Θεώρημα 2.2 Η κατανομή της τυχαίας μεταβλητής -2logλ n Υποθέτουμε ότι ισχύουν οι συνθήκες ομαλότητας, ότι το μέγεθος n του δείγματος είναι αρκετά μεγάλο και ότι υπάρχει μονοσήμαντα ορισμένος εκτιμητής μέγιστης πιθανοφάνειας n του θ. Τότε για τον έλεγχο της υπόθεσης Η 0 : θєω={θ 0 }, η ασυμπτωτική κατανομή της στατιστικής συνάρτησης -2logλ n είναι η, όταν η Η 0 είναι αληθής, δηλαδή P 2logλ n x P x Επειδή κατά την απόδειξη θα χρησιμοποιήσουμε τις συνθήκες ομαλότητας τις αναφέρουμε παρακάτω: Συνθήκες ομαλότητας 1) Για όλα τα x Є R-N, όπου P θ (χ Є Ν)=0 και για κάθε θ Є Ω υπάρχουν οι παράγωγοι

13 logf(x;θ), logf(x;θ), logf(x;θ), θ Є Ω 2) Υπάρχει μετρήσιμη συνάρτηση Η:R R + α) logf(x;θ) <Η(x) για κάθε θ Є Ω και β) Ε θ Η(x)<Μ< και το Μ είναι ανεξάρτητο του θ 3) Ε θ [ logf(x;θ)]=0 για κάθε θ Є Ω 4) Για κάθε θ Є Ω ισχύει: α) Ε θ [ logf(x;θ)] 2 =- Ε θ [ logf(x;θ)]=ι(θ) και β) 0< Ι(θ)< όπου Ι(θ) ο πίνακας οληροφορίας. Απόδειξη Θεωρήματος Αν θέσουμε ψ(x;θ)= logf(x;θ), Ψ (x;θ)= ψ(x;θ)=φ(x;θ), Ψ (x;θ)=φ ( x;θ) και ψ (x;θ)=φ (x;θ). Αναπτύσσουμε σε σειρά Taylor τη συνάρτηση ψ(x;θ) στην περιοχή του θ, με όρους μέχρι τρίτης τάξης. Έτσι έχουμε: 13

14 ψ(x;θ 0 )= ψ(x;θ)+(θ 0 -θ) ψ (x;θ)+ (θ 0 -θ) 2 ψ (x;θ)+ (θ 0 -θ) 3 ψ (x;θ * )= = ψ(x;θ)+(θ 0 -θ) φ(x;θ) )+ (θ 0 -θ) 2 φ ( x;θ) )+ (θ 0 -θ) 3 φ (x;θ * ) Όπου θ * κατάλληλη τιμή του θ μεταξύ θ και θ 0. Αν αθροίσουμε τις n παραπάνω σχέσεις για τις δάφορες τιμές του x i, i=1,2,.,n, θα έχουμε: = (θ 0 θ)+ (θ 0 θ) (θ 0 θ) 3 (σχέση 1) Αλλά από τη συνθήκη ομαλότητας (2) είναι: <Η(x i ), άρα υπάρχει κατάλληλος : 1 ώστε Σ = Σ Η(x i ), και η σχέση 1 γίνεται: = (θ 0 θ)+ (θ 0 θ) (θ 0 θ) 3 Σ Η(x i ) (σχέση2)

15 Αν είναι n ο εκτιμητής μέγιστης πιθανοφάνειας για το θ, τότε n θ. Άρα για κάθε ε>0 υπάρχει Ν=Ν(ε) ώστε για κάθε n N P( θ n -θ <ε)>1-ε. 15

16 Αν στη σχέση2 αντικαταστήσουμε το θ με το n έχουμε: = + (θ 0 ) 2 + (θ 0 ) 3 Διότι =0, αφού είναι εκτιμητής μέγιστης πιθανοφάνειας του θ και η αντίστοιχη τιμή του όταν θ=. Επειδή =logf(x i ;θ) προκύπτει ότι -2logλ n =-2[logL(X/θ 0 )-logl(x/ )]=-2[ - =-[ ( -θ 0 )] + [ ( - θ 0 )] 2 ( - θ 0 )](σχέση3) Επειδή όμως ( - θ 0 ) ( - θ 0 ) όπου X~N(0,1). Τότε όμως [ ( - θ 0 )] 2 όπου η X 2 ~, άρα [ ( - θ 0 )] 2 (σχέση4) Αν δεχτούμε ότι ) (σχέση5) Τότε από τα θεωρήματα σύγκλισης προκύπτει ότι -[ ( - θ 0 )] 2 (σχέση6)

17 Επειδή ακόμη - θ 0 0, Η(x) και <1 η σχέση4 συνεπάγεται ότι [ ( - θ 0 )] 2 ( - θ 0 )] 0, άρα [ ( - θ 0 )] 2 ( - θ 0 )] 0 (σχέση7) Από τις σχέσεις 3,6,7 προκύπτει ότι (-2logλ n x P,XЄR Για να ολοκληρωθεί η απόδειξη πρέπει να αποδείξουμε ότι ο ισχυρισμός της σχέσης 5 είναι αληθής. Αν αναπτύξουμε σε σειρά taylor τη συνάρτηση έχουμε +( - θ 0 ) Όπου κατάλληλη τιμή μεταξύ θ 0 και. 17

18 Αθροίζοντας έχουμε - =(θ n- θ 0 ) Όπου κατάλληλη τιμή 0< <1 Επειδή όμως όπως προαναφέρθηκε θ 0 θα είναι -Ι(θ 0 ) 0< <1 και Οι παραπάνω συγκλισεις συνεπάγονται την αλήθεια της σχέσης5. Το παραπάνω θεώρημα γενικεύεται δηλαδή αν το Ω είναι ένα r-διάστατο ανοικτό υποσύνολο του R r r>1, και η υπόθεση Η 0 :θєω, όπου ω ένα m-διάστατο θποσύνολο του Ω (m<r), τότε εφόσον ισχύουν οι συνθληκες ομαλότητας και η Η 0 είναι αληθής, η κατανομή της στατιστικής συνάρτησης -2logλ n είναι η δηλαδή P θ (-2logλ n χ P x,xєr

19 2.3 Έλεγχοι Υποθέσεων Wald test Κάτω από την υπόθεση ότι ισχύουν οι συνθήκες ομαλότητας, οι εκτιμητές μέγιστης πιθανοφάνειας για μεγάλα δείγματά ακολουθούν την κανονική κατανομή με μέση τιμή την πραγματική τιμή του θ και με πίνακα διακυνάνσεων ίσο με τον αντίστοφο του πίνακα πληροφορίας(information matrix) I -1. ~N p (θ, I -1 (θ)) Υπό την συνθήκη Η 0 : θ=θ 0, Η τετραγωνική μορφή: W=( -θ 0 ) var -1 ( )( -θ 0 ) Για μεγάλα δείγματα τείνει ασυμπτωτικά στην Χ 2 -κατανομή με p βαθμούς ελευθερίας. Συνήθως χρησιμοποιούμε την τετραγωνική ρίζα του στατιστικού του Wald και ορίζουμε τον λόγο: ως z-στατιστικό. Z= Score tests Όταν ισχύουν οι συνθήκες ομαλότητας το διάνυσμα των score ακολουθεί ασυμπτωτικά την κανονική κατανομή με μέση τιμή μηδέν και πίνακα διακυμάνσεων ίσο με τον πίνακα πληροφορίας. U(θ)~Ν p (0,I(θ)) 19

20 Υπό την συνθήκη Η 0 : θ=θ 0, η τετραγωνική μορφή: Q=u(θ 0 ) I -1 (θ 0 ) u(θ 0 ) τείνει για μεγάλα δείγματα στην Χ 2 κατανομή με p βαθμούς ελευθερίας Likelihood ratio test Ας υποθέσουμε ότι έχουμε δύο μοντέλα ω 1 και ω 2 τέτοια ώστε ω 1 ω 2. Ας υποθέσουμε για παράδειγμα ότι το ω 1 είναι το απλούστερο μόντέλο που προέκυψε από το ω 2 θέτωντας κάποιες παραμέτρους του ω 2 ίσες με μηδέν. Θέλουμε να ελέξουμε την υπόθεση ότι πράγματι οι συμτελεστές αυτοί είναι μηδέν. Η βασική ιδέα είναι να συγκρίνουμε τις μέγιστές τιμές πιθανοφάνειας των δύο αυτών μοντέλων. Η μέγιστη πιθανοφάνεια για το μοντέλο ω 1 είναι: ) = L(,y) Όπου είναι ο εκτιμητής μέγιστης πιθανοφάνειας της παραμέτρου θ για το μοντέλο ω 1 Η μέγιστη πιθανοφάνεια για το μοντέλο ω 1 είναι: )=L(,y) Όπου είναι ο εκτιμητής μέγιστης πιθανοφάνειας της παραμέτρου θ για το μοντέλο ω 2 Ο λόγος αυτών των δύο ποσοτήτων λ= παίρνει τιμές απο 0 ( η συνάρτηση πιθανοφάνειας δεν παίρνει αρνητικές τιμές) ως 1.

21 Τιμές κοντά στο μηδέν δηλώνουν ότι το απλούστερο μοντέλο δεν γίνεται αποδεκτό ενώ τιμές κοντά στο 1 δηλώνουν ότι το απλούστερο μοντέλο είναι σχεδόν τόσο καλό όσο και το πιο σύνθετο μοντέλο. Κάτω από συνθήκες ομαλότητας η ποσότητ -2logλ τείνει για αρκετά μεγάλα δείγματα στην Χ 2 κατανομή με βαθμούς ελευθερίας ίσους με την διαφορά στον αριθμό των παραμέτρων ανάμεσα στα δύο μοντέλα.δηλαδη: όπου ν=dim(ω 2 )-dim(ω 1 ) -2logλ=2log )-2log ) Ας σημειώσουμε ότι ότι ο υπολογισμός του likelihood ratio test απαιτεί την προσαρμογή δύο μοντέλων, το wald test απαιτεί τουλάχιστον ένα μοντέλο ενώ το score test δεν απαιτεί κάποιo μοντέλο. 3. Το Μοντέλο της Λογιστικής Παλινδρόμησης Αν προσπαθήσουμε να εκφράσουμε την πιθανότητα επιτυχίας p, μιας δίτιμης μεταβλητής Y με την βοήθεια ενός απλού γραμμικόυ μοντέλου : p= b 0 +b 1 x όπου x οι τιμές μιας ανεξάρτητης μεταβλητής X το κύριο πρόβλημα που θα αντιμετωπίσουμε είναι ότι, αν και οι τιμές της p θεωρητικά δεν μπορούν να βρίσκονται εκτός του διαστήματος [0,1], οι τιμές της ποσότητας b 0 +b 1 x κυμαίνονται σε όλο το εύρος των πραγματικών αριθμών. Μια πρώτη σκέψη για την αντιμετώπιση αυτού του προβλήματος είναι να αντικαταστήσουμε στο μοντέλο την πιθανότητα p του γεγονότος της επιτυχίας με την σχετική πιθανότητα επιτυχίας. Δηλαδη με τον λόγο της πιθανότητας του γεγονότος της επιτυχίας προς την πιθανότητα του γεγονότος της αποτυχίας Ο λόγος αυτός αν και θεωρητικά παίρνει τιμές μέχρι και το +, δεν παίρνει αρνητικές τιμές. Επομένως και πάλι ένα γραμμικό μοντέλο της μορφής = b 0 +b 1 x δεν είναι επαρκές για την εκτίμηση της πιθανότητας p. Αν όμως αντί του λόγου 21

22 χρησιμοποιηθεί ο φυσικός λογάριθμος ln[ τότε οι τιμές του μετασχηματισμένου λόγου, οι οποίες κυμαίνονται στο διάστημα (-,+ ) μπορούν να εκτιμήθούν με την βοήθεια ενός γραμμικού μοντέλου της μορφής ln[ = b 0 +b 1 x Η συνάρτηση ln[p/ 1-p] η οποία συνδέει την πιθανότητα της επιτυχίας p με την ανεξαρτητη μεταβλητή X, στην ορολογία των λογαριθμικών μοντέλων ονομάζεται logit της p και συμβολίζεται με logit(p). Δηλαδή Logit(p)= ln[ = b 0 +b 1 x Αντιλογαριθμίζοντας τα δύο μέλη της εξίσωσης: προκύπτει: ln[ = b 0 +b 1 x = Και αν θέσουμε z= b 0 +b 1 x παίρνουμε: = Επιλύοντας την τελευταία εξίσωση ως προς p, παίρνουμε: p= Η τελευταία εξίσωση (διατυπώνεται επίσης με την μορφή P=1/1+e -z ) αποτελεί την εκτίμηση της πιθανότητας της επιτυχίας p της δίτιμης μεταβλητής Y. Το θεωρητικό διάγραμμα της συνάρτησης

23 f(z)= η οποία εκτιμά την p είναι σιγμοειδής (σχήμα1) ενώ οι τιμές της κυμαίνονται στο διάστημα [0,1] εφόσον η z παίρνει τιμές στο διάστημα [-,+ ] και είναι αυτό στο οποίο κατατείνουν οι αθροιστικές πιθανότητες κανονικής κατανομής. Σχήμα1 Η συνάρτηση f(z)= είναι επομένως κατάλληλη να χρησιμοποιηθεί ως μοντέλο για την εκτίμηση μιας πιθανότητας. Από το διάγραμμα γίνεται φανερό ότι η σχέση της ανεξάρτητής μεταβλητής X και της πιθανότητας πραγματοποίησης του γεγονότος είναι μη γραμμική και οι εκτιμητές πιθανότητας θα βρίσκονται μεταξύ 0 και 1 ανεξαρτήτως της τιμής του Ζ. Το γραμμικό μοντέλο που χρησιμοποιήθηκε για την εκτίμηση του λογαρίθμου της σχετικής πιθανότητας της επιτυχίας της δίτιμης μεταβλητής Y διευρύνεται και στην περίπτωση των περισσότερων της μίας ανεξαρτήτων μεταβλητών. Σε αυτήν την περίπτωση θέτωντας Z=b 0 +b 1 x 1 +b 2 x 2 + +b k x k όπου x 1,x 2,.,x k είναι οι τιμές των ανεξάρτητων μεταβλητών X 1,X 2,,X k προκύπτει ή ισοδύναμα: ln[ = b 0 +b 1 x 1 +b 2 x 2 + +b k x k =e b 0 +b 1 x 1 +b 2 x 2 + +b k x k Ενώ κατά την κλασσική γραμμική παλινδρόμηση η εκτίμηση των παραμέτρων b 0,b 1,b 2, b k γίνεται με την μέθοδο των ελαχίστων τετραγώνων κατά την λογιστική παλινδρόμηση η εκτίμηση των παραμέτρων γίνεται με την μέθοδο της μέγιστης πιθανοφάνειας(maximum likelihood) δηλαδή επιλέγονται οι πιο πιθανοφανείς τιμές των παραμέτρων προκειμένου να οδηγήσουν στα παρατηρούμενα αποτελέσματα. 23

24 4. Εκτίμηση καλής προσαρμογής του Μοντέλου Υπάρχουν πολλοί τρόποι για την εκτίμηση της καλής προσαρμογής του μοντέλου λογιστικής παλινδρόμησης για τα δεδομένα καθενός προβλήματος. Μεταξύ αυτών είναι, η σύγκριση του αριθμόυ των προβλεπόμενων με τις εμπειρικές ( παρατηρούμενες) παρατηρήσεις σε πίνακα ταξινόμησης, το ιστόγραμμα των εκτιμώμενων πιθανοτήτων, η διερεύνηση της πιθανοφάνειας των αποτελεσμάτων, το στατιστικό Z 2 της καλής προσαρμογής, το υπόδειγμα του X 2 και ο έλεγχος των Hosmer και Lameshow της ποσοστιαίας κατανομής των παρατηρήσεων σε ομάδες. 4.1.Ταξινόμηση των παρατηρήσεων Μέτρο εκτίμησης καλής προσαρμογής του μοντέλου για τα δεδομένα συγκεκριμένου παραδείγματος είναι η εκτίμηση του βαθμού ορθής ταξινόμησης.δηλαδή το ποσοστό των ορθών ταξινομημένων παρατηρήσεων με την σύγκριση του αριθμόυ των προβλεπόμενων ως προς τις εμπειρικές παρατηρήσεις στις ομάδες της εξαρτημένης μεταβλητής, όπως ακριβώς λειτουργεί ο συντελεστής R 2, για το μοντέλο της κλασσικής παλινδρόμησης. Πρόκειται ουσιαστικά για την κατασκευή ενός πίνακα συνάφειας στον οποίο οι παρατηρήσεις ταξινομόυνται ως προς την πραγματοποίηση του γεγονότος με βάση τα δειγματικά δεδομένα( observed outcome) και ως προς την πραγματοποίηση του γεγονότος με βάση τις εκτιμήσεις του μοντέλου (predicted outcome). Για να εκτιμηθεί σύμφωνα με το μοντέλο- ότι το γεγονός θα συμβεί σε μια παρατήρηση, πρέπει η εκτιμώμενη πιθανότητα πραγματοποίησης του γεγονότος, για την παρατήρηση, να είναι μεγαλύτερη ή ίση με Πίνακας ταξινόμησης των Παρατηρήσεων

25 predicted observed Οχι Ναι Percentage correct Οχι Ναι ,7 Overall percentage 64,8 Σε έναν πίνακά ταξινόμησης θα πρέπει οι παρατηρούμενες και οι εκτιμώμενες τιμές να συμφωνούν κατά το δυνατόν περισσότερο. Στον παραπάνω πίνακα η συμφωνία αυτή προσσεγγίζει το 65% περίπου των παρατηρήσεων. Τα διαγώνια κελιά του πίνακα περιέχουν τις παρατηρήσεις που συμφωνούν οι παρατηρούμενες και οι εκτιμώμενες τιμές ενώ τα εκτός διαγωνίου κελιά περιέχουν τις παρατηρήσεις που δεν συμφωνούν οι παρατηρούμενες και οι εκτιμώμενες τιμές. Το πρόβλημα με τον πίνακα ταξινόμησης είναι ότι δεν μας πληροφορεί για το μέγεθος των εκτιμώμενων πιθανοτήτων στις περιπτώσεις που έχουμε λανθασμένες εκτιμήσεις. Ο πίνακας ταξινόμησης δεν δείχνει την κατανομή των εκτιμώμενων πιθανοτήτων στις δύο ομάδες αλλά κατά πόσο η πιθανότητα για κάθε ομάδα είναι μεγαλύτερη ή μικρότερη του 50%. 4.2.Ιστόγραμμα Εκτιμώμενων Πιθανοτήτων Όπως είπαμε και πριν το πρόβλημα με τον πίνακα ταξινόμησης είναι ότι δεν μας δίνει πληροφοριες για το μέγεθος των εκτιμώμενων πιθανοτήτων στις περιπτώσεις που έχουμε λανθασμένες εκτιμήσεις. Για παράδειγμα δεν γνωρίζουμε ποιές είναι οι εκτιμώμενες πιθανότητες για τα 38 άτομα που ενώ η παρατηρούμενη τιμή είναι «Ναι», από το μοντέλο εκτιμάται «Όχι». Μια ερώτηση που πρέπει να απαντηθεί είναι αν οι εκτιμώμενες πιθανότητες για τα άτομα αυτά είναι κοντά στο όριο του 0,50 ή απέχουν σημαντικά από αυτό ( γεγονός που θα μείωνε ακόμη περισσότερο την αξιοπιστία του μοντέλου). Ερωτήματα τέτοια μπορούν να απαντηθόυν από το ιστόγραμμα εκτιμώμενων πιθανοτήτων. Το ιστόγραμμα εκτιμωμένων πιθανοτήτων για τα δεδομένα που χρησιμοποιήσαμε και στον πίνακα ταξινόμησης είναι το παρακάτω: 25

26 Ο οριζόντιος άξονας του διαγράμματος ταξινόμησης αντιστοιχεί στις εκτιμώμενες από το μοντέλο πιθανότητες. Επάνω στον άξονα τοποθετούνται οι παρατηρήσεις της ανάλυσης υπό μορφή ιστογράμματος. Οι παρατηρήσεις οι οποίες έχουν εκτιμώμενη πιθανότητα πραγματοποίησης του γεγονότος μεγαλύτερη του 0.5 τοποθετούνται στο δεξιό μέλος του άξονα, ενώ οι παρατηρήσεις με πιθανότητα μικρότερη του 0.5 τοποθετούνται στο αριστερό μέλος του άξονα. Έπίσης κάθε παρατήρηση ορίζεται από το αρχικό διάγραμμα της κατηγορίας που αντιστοιχεί στην πραγματοποίηση ή μη του γεγονότος, έτσι όπως προκύπτει από τα δειγματικά δεδομένα. Όσο στο ιστόγραμμα των εκτιμώμενων πιθανοτήτων διακρίνονται με μεγαλύτερη ευκρίνεια οι δύο ομάδες παρατηρήσεων, δηλαδή οι παρατηρήσεις ως προς το γεγονός που συνέβη βρίσκονται στο δεξιό τμήμα του 0.5 και ως προς το γεγονός που δεν συνέβη βρίσκονται στο αριστερό του 0.5 τόσο το μοντέλο είναι καλά προσαρμοσμένο στα δεδομένα του συγκεκριμένου παραδείγματος. Στο ιστόγραμμα του παραδείγματος μας εμφανίζεται ένας αρκετά μεγάλος αριθμός παρατηρήσεων με ορθά εκτιμώμενες πιθανότητες επιτυχίας σημαντικά μεγαλύτερες του 0.5 (αρκετά από αυτές μεγαλύτερες του 0.7). Αντίθετα ο αριθμός των παρατηρήσεων που έχουν ορθά εκτιμώμενες πιθανότητες αποτυχίας είναι αρκετά μικρότερος και με τιμές των αντίστοιχων πιθανοτήτων να μην διαφοροποιούνται σημαντικά από το 0.5. Επιπλέον το σύνολο αυτών των παρατηρήσεων περιλαμβάνεται στο διάστημα (0.25,0.5) των εκτιμώμενων πιθανοτήτων. 4.3 Διερεύνηση της πιθανοφάνειας των αποτελεσμάτων

27 Εκτός από την διαπίστωση του κατά πόσο ικανοποιητικά το μοντέλο της λογιστικής παλινδρομησης ταξινομεί τις παρατηρήσεις μπορεί να αναζητηθεί κατά πόσο είναι «πιθανά» τα αποτελέσματα του μοντέλου με βάση τις δεδομένες παραμέτρους. Η πιθανότητα των παρατηρούμενων αποτελεσμάτων είναι γνωστή ως «πιθανοφάνεια» και επειδή η πιθανοφάνεια έιναι μικρός αριθμός (μικρότερος της μονάδας) είναι συνήθες να χρησιμοποιείται το διπλάσιο του λογαρίθμου της πιθανοφάνειας (-2lnL) ως μέτρο καλής προσαρμογής του εκτιμώμενου μοντέλου στα δεδομένα μας. Όσο μεγαλύτερη είναι η τιμή της συνάρτησης της πιθανοφάνειας ή όσο μικρότερη είναι η τιμή της συνάρτησης λογαριθμοπιθανοφάνειας -2lnL, τόσο καλύτερη είναι η προσαρμογή του μοντέλου στα δειγματικά δεδομένα. Δηλαδή όσο μεγαλύτερη είναι η πιθανότητα τα διαθέσιμα δειγματικά δεδομένα να προέρχονται από έναν πληθυσμό με παραμετρους τις εκτιμώμενες από το μοντέλο, τόσο καλύτερη η προσαρμογή του λογιστικού μοντέλου. Θα λέγαμε ότι το μοντέλο είναι απόλυτα προσαρμοσμένο όταν η πιθανοφάνεια είναι 1 και η τιμή -2lnL μηδενική. Επειδή όμως η τιμή του L και αντίστοιχα και η τιμή του -2lnL εξαρτώνται κάθε φορά από το μέγεθος του δείγματος, προκειμένου οι δύο αυτές ποσότητες να χρησιμοποιηθούν για την αξιολόγηση ενός λογιστικού μοντέλου, θα πρέπει να συγκρίνονται με τις αντίστοιχες ποσότητες ενός άλλου απλούστερου μοντέλου (baseline model ) που εκτιμάται για τα ίδια δειγματικά δεδομένα. Η σύγκριση αυτή μπορεί να γίνει με την βοήθεια του λόγου των μέγιστων τιμών της συνάρτησης πιθανοφάνειας γαι τα δύο συγκρινόμενα μοντέλα. Αν για παράδειγμα πρόκειται να αξιολογηθεί η προσαρμογή του μοντέλου logit(p)=b 0 +b 1 x 1 +b 2 x 2 (με μέγιστη πιθανοφάνεια L 2 ) σε σχέση με τα απλούστερα μοντέλα logit(p)= b 0 +b 1 x 1 (με μέγιστη πιθανοφάνεια L 1 ) και logit(p)= b 0 (με μέγιστη πιθανοφάνεια L 0 ) αυτό γίνεται με την βοήθεια του λόγου -2ln( )=-2lnL 1 -(-2lnL 2 ) για την πρώτη σύγριση και του λόγου: -2ln( )=-2lnL 0 -(-2lnL 2 ) για την δεύτερη σύγκριση Υπό την προυπόθεση ότι ισχύουν οι μηδενικές υποθέσεις: H 0 : β 2 =0 για την πρώτη σύγκριση και H 0 : β 1 =β 2 =0 για την δεύτερη σύγκριση. Οι λόγοι που προκύπτουν ακολουθόυν την κατανομή X 2, με βαθμούς ελευθερίας 1 και 2 αντίστοιχα. Γενικά οι βαθμοί ελευθερίας του λόγου των τιμών της συνάρτησης πιθανοφάνειας είναι ίσοι με την διαφορά του αριθμού των ανεξάρτητων μεταβλητών που περιλαμβάνονται στα δύο συκρινόμενα κάθε φορά μοντέλα. 27

28 4.4.Το μοντέλο X 2 Στην περίπτωση που αξιολογείται συνολικά η προσαρμογή του μοντέλου logit(p)=b 0 +b 1 x 1 +b 2 x 2 +.+b k x k στα δειγματικά δεδομένα χρησιμοποιείται ο λόγος -2ln( )=-2lnL 0 -(-2lnL f ) όπου L f η τιμή της συνάρτησης πιθανοφάνειας για το πλήρες μοντέλο και L 0 η τιμή της συνάρτησης πιθανοφάνειας για το μοντέλο που περιλαμβάνει μόνο το σταθερό όρο (σημειώνεται ότι εάν δεν περιλαμβάνεται σταθερός όρος στο μοντέλο χρησιμοποιείται για σύγκριση η πιθανοφάνεια για το μοντέλο χωρίς καμιά μεταβλητή). Η ποσότητα -2ln( ) ακολουθεί την κατανομή X 2 με κ-βαθμούς ελευθερίας. Με άλλα λόγια, το μοντέλο X 2 - με το αντίστοιχο επίπεδο σημαντικότητας - ελέγχει την μηδενική υπόθεση για τους συντελεστές β 1,β 2,...,β κ H 0 : β 1 =β 2 =...=β κ =0 Η απόρριψη της μηδενικής υπόθεσης οδηγεί στην ενναλακτική H A : τουλάχιστον ένας συντελεστής β i,i=1,2,,κ είναι διάφορος του 0. Ο έλεγχος αυτός είναι ισοδύναμός με τον έλεγχο F που πραγματοποιείται σε ένα μοντέλο κλασικής πολλαπλής γραμμικής παλινδρόμησης προκειμένου να αξιολογηθεί η προσαρμογή του στα δειγματικά δεδομένα Έλεγχος βελτίωσης της τιμής X 2 Η βελτιωμένη τιμή του X 2 είναι η μεταβολή της τιμής -2lnL μεταξύ διαδοχικών σταδίων στη δημιουργία του μοντέλου. Ελέγχει την μηδενική υπόθεση ότι οι συντελεστές παλινδρόμησης των μεταβλητών που εισέρχονται στο μοντέλο στο τελευταίο στάδιο είναι μηδενικοί. Η τιμή X 2 είναι η ίδια με την βελτιωμένη τιμή του εάν θεωρήσουμε τα μοντέλα με το σταθερό όρο και το πλήρες μοντέλο(με όλες τις μεταβλητες). Εάν αντιθέτως, θεωρήσουμε περισσότερα των δύο αυτών υποδειγμάτων, κάνοντας π.χ επιλογή μεταβλητών, οι τιμές των X 2 θα διαφέρουν. Ο έλεγχος είναι ανάλογος με εκείνον της μεταβολής F στην κλασσική πολλαπλή γραμμική παλινδρόμηση.

29 4.6. Στατιστικό Z 2 της καλής προσαρμογής Ένα άλλο μέτρο καλής προσαρμογής του μοντέλου είναι το στατιστικό Z 2 το οποίο συγκρίνει τις παρατηρούμενες πιθανότητες με εκείνες που προβλέπονται από το μοντέλο. Η τιμή του στατιστικού Z 2 δίνεται από την σχέση Z 2 = Όπου το υπόλοιπο είναι η διαφορά μεταξύ της παρατηρούμενης τιμής Y i και της προβλεπόμενης P i Έλεγχος των Hosmer και Lemeshow Οι Hosmer και Lemeshow χρησιμοποίησαν το στατιστικό C για τον έλεγχο της καλής προσαρμογής των δεδομένων (ποσοστιαίας κατανομής των παρατηρήσεων σε ομάδες). Το στατιστικό C θεωρείται ότι κατανέμεται με βάση την κατανομή X 2 του Pearson. Τιμή του Χ 2 που αντιστοιχεί σε επίπεδο σημαντικότητας a>0.05 δηλώνει ότι το μοντέλο της λογιστικής παλινδρόμησης είναι καλά προσαρμοσμένο στα δεδομένα Ο συντελεστής προσδιορισμού R 2 των Cox και Snell Για την αξιολόγηση της προσαρμογής του λογιστικού μοντέλου εκτός από όλα τα προηγούμενα χρησιμοποιείται και ένα επιπλέον μέτρο καλής προσαρμογής, αντίστοιχο με τον συντελεστή προσδιορισμού R 2 που χρησιμοποιείται στην πολλαπλή γραμμική παλινδρόμηση. Το μέτρο αυτό ονομάζεται R 2 των Cox και Snell και ισούται με όπου n το μέγεθος του δείγματος. R 2 =1-[ ] 2/n Το πρόβλημα με τον συγκεκριμένο συντελεστή προσδιορισμού είναι ότι ποτέ δεν καταλήγει να πάρει μέγιστη τιμή το 1. Ο Nagelkerke το 1991 πρότεινε μια τροποποίηση του συντελεστή των Cox και Snell προκειμένου να ξεπεράσει το συγκεκριμένο πρόβλημα. Ο συντελεστής που πρότεινε είναι ο: =R 2 /R 2 max (0,1) όπου R 2 max=1-[l 0 ] 2/n 5. Έλεγχος και Ερμηνεία των Συντελεστών Παλινδρόμησης 5.1. Ερμηνεία των Συντελεστών Παλινδρόμησης 29

30 Η ερμηνεία των συντελεστών του μοντέλου της γραμμικής παλινδρόμησης είναι απλή και ορίζεται ευθέως. Ο κάθε ένας από τους συντελεστές b 1,b 2,.,b k της εξίσωσης =b 0 +b 1 x 1 +b 2 x 2 + +b k x k εκφράζει την μέση μεταβολή της εξαρτημένης μεταβλητής Y για μία μονάδα αύξησης της αντίστοιχης ανεξάρτητης μεταβλητής X i, όταν οι τιμές των άλλων ανεξάρτητων μεταβλητών παραμένουν σταθερές. Στη λογιστική παλινδρόμηση η ερμηνεία των συντελεστών μπορεί να γίνει σε εναρμόνιση με τα παραπάνω εφόσον προηγουμένως γίνει κάποιος αναγκαίος μετασχηματισμός. Ο μετασχηματισμός αυτός αφορά την απόδοση της εξίσωσης της λογιστικής παλινδρόμησης με το λογάριθμο του λόγου πιθανότητας πραγματοποίησης του γεγονότος προς την πιθανότητα μη πραγματοποίησης του γεγονότος. Ουσιαστικά είναι η μορφή της γραμμικής συνάρτησης με την οποία μπορεί να εκτιμηθεί ο λογάριθμός της σχετικής πιθανότητας, δηλαδή: Ln[ ]=b 0 +b 1 x 1 +b 2 x 2 + +b k x k Με τον παραπάνω μετασχηματισμό προκύπτει η ερμηνεία των συντελεστών του λογιστικού μοντέλου με τρόπο ανάλογο με αυτόν της γραμμικής παλινδρόμησης. Κάθε ένας από τους συντελεστές b 1,b 2,.,b k μπορεί να ερμηνευθεί ως τη μεταβολή του λογαρίθμου της σχετικής πιθανότητας Ln[ ] από την κατά μονάδα μεταβολή της ανεξάρτητης μεταβλητής X i, εφόσον οι τιμές των υπολοίπων ανεξάρτητων μεταβλητών παραμένουν σταθερές. Επειδή είναι όμως πιο ενδιαφέρον οι συντελεστές να μπορούν να ερμηνεύουν την μεταβολή στο λόγο των πιθανοτήτων και όχι στο λογάριθμο της σχετικής πιθανότητας-από την κατα μονάδα μεταβολή της ανεξάρτητης μεταβλητής X i, είναι προτιμότερο η εξίσωση Ln[ ]=b 0 +b 1 x 1 +b 2 x 2 + +b k x k να γραφεί με αντιλογαρίθμιση των δύο μερών της ως =e b 0 +b 1 x 1 +b 2 x 2 + +b k x k= Από την τελευταία εξίσωση προκύπτει ότι ο παράγοντας e b i είναι ο παράγοντας επί τον οποίο πολλαπλασιάζεται η σχετική πιθανότητα πραγματοποίησης του γεγονότος, όταν η ανεξάρτητη μεταβλητή X i, αυξηθεί κατά μία μονάδα και εφόσον οι υπόλοιπες μεταβλητές παραμένουν σταθερές. Αν το b i είναι θετικό, ο παράγοντας e b i είναι μεγαλύτερος από την μονάδα, γεγονός που σημαίνει ότι η σχετική πιθανότητα αυξάνει. Αν το b i είναι αρνητικό, ο παράγοντας e b i είναι μικρότερος της μονάδας, δηλαδή η σχετική πιθανότητα (δηλαδή η η εξαρτημένη μεταβλητη

31 ) μειώνεται. Τέλος όταν το b i είναι μηδέν, ο παράγοντας e b i γίνεται ίσος με την μονάδα, που σημαίνει ότι δεν συμβαίνει καμιά μεταβολή στην σχετική πιθανότητα Έλεγχοι για τους συντελεστές του λογιστικού μοντέλου Ο προσδιορισμός των συντελεστών του λογιστικού μοντέλου γίνονται με την βοήθεια της μεθόδου εκτίμησης μέγιστης πιθανοφάνειας, μιας διαδικασίας η οποία εκτιμά τις πληθυσμιακές παραμέτρους του μοντέλου με κριτήριο τη μεγιστοποίηση της πιθανότητας τα διαθέσιμα δειγματικά δεδομένα να έχουν παραχθεί από τις εκτιμώμενες παραμέρους. Εκτός των συντελεστών του δειγματικού μοντέλου b 1,b 2,.,b k, η μέθοδος εκτίμησης μέγιστης πιθανοφάνειας εκτιμά και τα αντίστοιχα τυπικά σφάλματα αυτών. Είναι γνωστό ότι ένας οποιοσδήποτε συντελεστής b i, του λογιστικού μοντέλου, για μεγάλα δείγματα ακολουθεί κατα προσέγγιση την κανονική κατανομή με μέση τιμή τον αντίστοιχο πληθυσμιακό συντελεστή β i, και εκτιμώμενο τυπικό σφάλμα se(b i ). Επομένως όταν το μέγεθος του δείγματος είναι αρκετά μεγάλο το πηλίκο: ακολουθεί κατά προσέγγιση την τυπική κανονική κατανομή. Ο έλεγχος της μηδενικής υπόθεσης ότι ο συντελεστής παλινδρόμησης είναι μηδενικός δηλαδή H 0 : β i =0 ( ή ισοδύναμα e β ι=1 ) έναντι της ενναλακτικής H A : β i 0 ( ή ισοδύναμα e β ι 1 ) βασίζεταί στο στατιστικό του Wald και στο επίπεδο στατιστικής σημαντικότητας του, το οποίο ακολουθεί X 2 κατανομή. Αν μια μεταβλητή έχει ένα βαθμό ελευθερίας το στατιστικό του Wald είναι το τετράγωνο του λόγου του συντελεστή προς το τυπικό σφάλμα αυτού: z=[ 2 όπου όταν ισχύει η μηδενική υπόθεση H 0 : β i =0, ακολουθεί X 2 κατανομή με 1 βαθμό ελευθερίας. Για κατηγορικές μεταβλητές το στατιστικό του Wald έχει βαθμούς ελευθερίας κατά ένα λιγότερους από τον αριθμό των κατηγοριών. Η εγκυρότητα του στατιστικόυ του Wald απαιτεί την εφαρμογή του σε μεγάλα δείγματα, ώστε να διασφαλίζεται και η αξιοπιστία των ασυμπτωτικών προσεγγίσεων από τις οποίες προκύπτει η δειγματοληπτική κατανομή του. Το στατιστικό του Wald έχει ένα βασικό μειονέκτημα. Με την αύξηση της απόλυτης τιμής του συντελεστή παλινδρόμησης, το εκτιμώμενο τυπικό σφάλμα γίνεται επίσης μεγάλο που οδηγεί σε πολύ μικρή τιμή του στατιστικού Wald, με αποτέλεσμα η υπόθεση ότι η τιμή του συντελεστή παλινδρόμησης είναι μηδενική να απορρίπτεται ενώ θα έπρεπε να γίνεται αποδεκτή. Συμπερασματικά όταν η τιμή του συντελεστή παλινδρόμησης είναι μεγάλη, δεν πρέπει να στηριζόμαστε στο στατιστικό του Wald για τον έλεγχο του αντίστοιχου συντελεστή παλινδρόμησης. Σε αυτές τις περιπτώσεις είναι προτιμότερο να χρησιμοποιείται για τον 31

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή 1. Γενικά... 25 2. Έννοια και Είδη Μεταβλητών... 26 3. Κλίμακες Μέτρησης Μεταβλητών... 29 3.1 Ονομαστική κλίμακα... 30 3.2. Τακτική κλίμακα... 31 3.3 Κλίμακα ισοδιαστημάτων... 34 3.4

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος

Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος ΜΑΘΗΜΑ 10 ο Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος Η μέθοδος της συνολοκλήρωσης είναι ένας τρόπος με τον οποίο μπορούμε να εκτιμήσουμε τη μακροχρόνια σχέση ισορροπίας που υπάρχει μεταξύ δύο ή

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ Το ενδιαφέρον επικεντρώνεται πάντα στον πληθυσμό Το δείγμα χρησιμεύει για εξαγωγή συμπερασμάτων για τον πληθυσμό π.χ. το ετήσιο εισόδημα των κατοίκων μιας περιοχής Τα στατιστικά

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 4 ου κεφαλαίου Ελεγχοσυναρτήσεις Γενικευμένου Λόγου Πιθανοφανειών Σταύρος Χατζόπουλος 27/03/2017, 03/04/2017, 24/04/2017 1 Εισαγωγή Έστω το τ.δ. X,,, από την κατανομή

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Το διάστημα εμπιστοσύνης είναι ένα διάστημα αριθμών

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) 1. Έχοντας στη διάθεσή μας ένα δείγμα, προκύπτει ότι το 95% διάστημα εμπιστοσύνης για το μέσο μ ενός κανονικού

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n) ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) Θέμα ο (Παρ..3.4, Παρ..4.3, Παρ..4.8.) Εάν = ( ) τυχαίο δείγμα από την ομοιόμορφη ( 0, ) X X,, X. Δείξτε ότι η στατιστική συνάρτηση T = X = το δειγματικό

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Οικονομετρία Ι Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. σε μη γραμμικές μορφές. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. σε μη γραμμικές μορφές. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 7: Επεκτάσεις του γραμμικού υποδείγματος σε μη γραμμικές μορφές Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή Χρονικές σειρές 12 Ο μάθημα: Έλεγχοι στασιμότητας ΑΝΑΚΕΦΑΛΑΙΩΣΗ: Εκτίμηση παραμέτρων γραμμικών μοντέλων Συνάρτηση μερικής αυτοσυσχέτισης Εαρινό εξάμηνο 2018-2019 Τμήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 5: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (1 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: ageliki.papaa@gmail.com, agpapaa@auth.gr Webpage: http://users.auth.gr/agpapaa

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ ΚΕΦΑΛΑΙΟ ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ Ως γνωστό δείγμα είναι ένα σύνολο παρατηρήσεων από ένα πληθυσμό. Αν ο πληθυσμός αυτός θεωρηθεί μονοδιάστατος τότε μπορεί να εκφρασθεί με τη συνάρτηση

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 7: Κανονική Κατανομή Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής Ενότητα 2 Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής Ένας από τους βασικούς σκοπούς της Στατιστικής είναι η εκτίμηση των χαρακτηριστικών ενός πληθυσμού βάσει της πληροφορίας από ένα δείγμα.

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ 4ο Διαδικασία των συντελεστών αυτοσυσχέτισης Ονομάζουμε συνάρτηση αυτοσυσχέτισης (autocorrelation function) και συμβολίζεται με τα γράμματα

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα