Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R"

Transcript

1 Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Εφαρμογών, Εθνικό Μετσόβιο Πολυτεχνείο.

2 Περιεχόμενα Εισαγωγή στη Στατιστική Εισαγωγή στο Στατιστικό Πακέτο R Περιγραφική Στατιστική Προσομοίωση Στατιστική Συμπερασματολογία Ένα Δείγμα Δύο Ανεξάρτητα Δείγματα Δείγματα κατά Ζεύγη Ποσοστά Έλεγχος καλής προσαρμογής Πίνακες Συνάφειας 2 2. Ανάλυση Διασποράς 2

3 Εισαγωγή Αρκετές φορές σε μια στατιστική μελέτη ερχόμαστε αντιμέτωποι με το πρόβλημα της πρόβλεψης μιας μεταβλητής (μεταβλητή απόκρισης) όταν γνωρίζουμε τις τιμές κάποιας ή κάποιων άλλων μεταβλητών (επεξηγηματικές μεταβλητές). Ας θεωρήσουμε καταρχήν ότι έχουμε μία μόνο επεξηγηματική μεταβλητή. 3

4 Απλό Γραμμικό Μοντέλο Πιο συγκεκριμένα ας υποθέσουμε ότι Υ είναι η μεταβλητή απόκρισης και Χ η επεξηγηματική μεταβλητή και ας υποθέσουμε ότι και οι δύο μεταβλητές είναι ποσοτικές. Σκοπός μας είναι να δημιουργήσουμε ένα μοντέλο, έστω Y=g(X), έτσι ώστε στο μέλλον να μπορούμε να προσδιορίσουμε την τιμή του Y με βάση την τιμή του Χ. 4

5 Απλό Γραμμικό Μοντέλο Πώς όμως επιλέγουμε την συναρτησιακή μορφή της g(x); Η επιλογή της κατάλληλης συνάρτησης g(x) μπορεί γίνει με την βοήθεια ενός τυχαίου δείγματος (Υ 1,Χ 1 ),...,(Υ n,x n ). Πιο συγκεκριμένα αν (y 1,x 1 ),,(y n,x n ) οι παρατηρήσεις μας, τότε μπορούμε να σχηματίσουμε το γράφημα των σημείων (y i,x i ), γνωστό ως διάγραμμα διασποράς των σημείων, και να εκτιμήσουμε την συναρτησιακή μορφή της g. Στο επόμενο γράφημα, π.χ., το διάγραμμα διασποράς υποδεικνύει ότι η σχέση της Χ με την Υ είναι γραμμική και άρα μπορούμε να θεωρήσουμε ότι g(χ)=a+bχ. Μένει τότε να εκτιμήσουμε τις τιμές των a και b, με την βοήθεια και πάλι της πληροφορίας που έχουμε από το τυχαίο δείγμα. 5

6 Απλό Γραμμικό Μοντέλο y x 6

7 Απλό Γραμμικό Μοντέλο H ανάλυση μας λοιπόν είναι εμπειρική (βασίζεται στην υπάρχουσα εμπειρία μας με βάση το τυχαίο δείγμα) και άρα το μοντέλο μας είναι στοχαστικό. Αντιθέτως αν η ανάλυσή μας ήταν θεωρητική, γνωρίζαμε δηλαδή όλον τον πληθυσμό, το μοντέλο θα ήταν προσδιοριστικό. Στα στοχαστικά μοντέλα προφανώς έχουμε ελλιπή πληροφορία, το μοντέλο στο οποίο θα καταλήξουμε μπορεί να μην ικανοποιείται ακριβώς για ζεύγη τιμών του πληθυσμού που δεν έχουν παρατηρηθεί στο τυχαίο δείγμα. Για τον λόγο αυτό στο μοντέλο προσθέτουμε και ένα τυχαίο σφάλμα ε το οποίο θεωρούμε ότι προέρχεται από μια γνωστή κατανομή με άγνωστες παραμέτρους. Το στοχαστικό δηλαδή μοντέλο παίρνει την μορφή Υ = g(x) + ε. Ακούγεται λογικό να θεωρήσουμε ότι η μέση τιμή του ε είναι 0, δηλαδή κατά μέσο όρο το σφάλμα μας είναι μηδενικό. Συνήθως θεωρούμε ε~ν(0, σ 2 ), με σ 2 άγνωστο. 7

8 Απλό Γραμμικό Μοντέλο Ας θεωρήσουμε τώρα ότι η g είναι μια γραμμική συνάρτηση, g(x) = a + bx, με a, b άγνωστες ποσότητες. Δηλαδή θεωρούμε ότι η τυχαία μεταβλητή Χ επηρεάζει γραμμικά την αναμενόμενη τιμή της τυχαίας μεταβλητής Y. 2 Y= a+ bx +ε, ε Ν(0,σ ) Ε( Υ Χ= x) = a+ bx Ισοδύναμα σε τυχαίο δείγμα (Υ 1,Χ 1 ),...,(Υ n,x n ) θεωρούμε ότι ισχύει η σχέση Y = a+ bx +ε, ε Ν(0,σ ) Ε( Υ Χ = x ) = a+ bx 2 i i i i i i i i με ε i ανεξάρτητες (και ισόνομες) τυχαίες μεταβλητές. Τα ε i καλούνται τυχαία σφάλματα, και παριστάνουν την άγνωστη κατακόρυφη απόκλιση της τιμής y i από την ευθεία για δοθείσα τιμή x i. Ε( Υ Χ = x ) = a+ bx i i i i 8

9 Απλό Γραμμικό Μοντέλο Το παραπάνω μοντέλο καλείται απλό (γιατί έχουμε μία μόνο επεξηγηματική μεταβλητή Χ) γραμμικό (λόγω της γραμμικής συνάρτησης που χρησιμοποιούμε) μοντέλο παλινδρόμησης. Τα a, b και σ 2 είναι οι άγνωστες παράμετροι του μοντέλου μας (συντελεστές μοντέλου), τις οποίες θα εκτιμήσουμε με την βοήθεια των παρατηρήσεων που διαθέτουμε (y 1,x 1 ),,(y n,x n ) που είναι οι τιμές ενός τυχαίου δείγματος (Υ 1,Χ 1 ),...,(Υ n,x n ). 9

10 Ερμηνεία παραμέτρων Ησταθεράa εκφράζει την μέση τιμή της Υ όταν το Χ=0. H σταθερά b εκφράζει το πόσο αναμένεται να μεταβληθεί η αναμενόμενη τιμή της Υ, αν η Χ αυξηθεί κατά μία μονάδα. Η ποσότητα σ 2 εκφράζει την διασπορά των σφαλμάτων, την οποία θεωρούμε σταθερή ανεξάρτητα της τιμής της τ.μ. Χ (υπόθεση ομοσκεδαστικότητας). Επειδή η τυχαιότητα της Υ δεδομένης μιας τιμής της Χ = x οφείλεται στα σφάλματα, το σ 2 εκφράζει και την διασπορά της δεσμευμένης κατανομής της τ.μ. Υ x. 10

11 Απλό Γραμμικό Μοντέλο 2 2 Y= a+ bx +ε, ε Ν(0,σ ) Υ x N(a+ bx, σ ) Υ + σ 2 x N(a bx, ) (x,y ) i i ε i Ε( Υ x) = a+ bx 11

12 Απλό Γραμμικό Μοντέλο Εκτιμώντας λοιπόν τα a και b από τα και αντίστοιχα καταλήγουμε στο Ŷ Το καλείται προβλεπόμενη τιμή και είναι όπως είδαμε η αναμενόμενη τιμή που θα πάρει η Υ όταν Χ=x, όπως αυτήν την εκτιμήσαμε με βάση το μοντέλο παλινδρόμησης. Η προβλεπόμενη τιμή είναι τ.μ., δηλαδή για διαφορετικό δείγμα ενδέχεται να πάρει άλλη τιμή όταν X=x. Η προβλεπόμενη τιμή αποτελεί μία αμερόληπτη εκτιμήτρια της άγνωστης τιμής y που παίρνει η τ.μ. Υ όταν X=x. Παρακάτω θα δούμε δύο διαφορετικά Δ.Ε. για την τιμή αυτή y όταν X=x. Yˆ = aˆ + bx. ˆ 12 â ˆb

13 Απλό Γραμμικό Μοντέλο Για κάθε παρατήρηση x i μπορούμε να υπολογίσουμε τις προβλεπόμενες τιμές ŷ = aˆ + bx ˆ. Αν η ευθεία â+ bx ˆ δεν περνάει ακριβώς από i τα σημεία (y i,x i ), περιμένουμε να έχουμε αποκλίσεις μεταξύ των y i και των ŷ i. Οι ποσότητες εˆ i = yi yˆ i αποτελούν τις εκτιμήσεις των άγνωστων τυχαίων σφαλμάτων ε i και καλούνται υπόλοιπα (residuals). i i 13

14 Απλό Γραμμικό Μοντέλο Τους συντελεστές του μοντέλου τους εκτιμούμε με βάση τις παρατηρήσεις (y 1,x 1 ),...,(y n,x n ), εφαρμόζοντας τη μέθοδο ελαχίστων τετραγώνων. Με την μέθοδο ελαχίστων τετραγώνων επιλέγουμε την ευθεία (δηλαδή τα â και ˆb ) εκείνη που προσαρμόζεται καλύτερα στα δεδομένα που έχουμε. Πιο συγκεκριμένα επιλέγουμε την ευθεία εκείνη y= aˆ + bx ˆ που ελαχιστοποιεί τα ˆε. i 14

15 Απλό Γραμμικό Μοντέλο Τα a ˆ και b ˆ τέτοια ώστε να n n 2 i + i = εi i= 1 i= 1 [ ] 2 ελαχιστοποιείται η συνάρτηση y (a bx ). 15

16 Απλό Γραμμικό Μοντέλο Μετά από πράξεις προκύπτουν τότε οι εκτιμήτριες ˆb = n 1 ( x x)( y y) i ( x x) n 2 1 i i â = y bx ˆ οι οποίες είναι τυχαίες μεταβλητές (από διαφορετικό δείγμα ενδέχεται να προκύψουν διαφορετικές εκτιμήτριες). 16

17 Απλό Γραμμικό Μοντέλο Το σ 2 το εκτιμούμε από την ποσότητα 1 s y y n 2 = n 2 2 yx = ( i ˆ i) Εκτίμηση διασποράς των σφαλμάτων i 1 Η θετική τετραγωνική της ρίζα της παραπάνω εκτιμήτριας καλείται τυπικό σφάλμα της παλινδρόμησης και όσο μικρότερη τιμή έχει τόσο καλύτερη προσαρμογή έχουμε για το μοντέλο παλινδρόμησης. 2 To s αποτελεί αμερόληπτη εκτιμήτρια του σ 2 yx καλείται μέσο τετραγωνικό σφάλμα (MSE). και 17

18 Απλό Γραμμικό Μοντέλο 18

19 Συντελεστής Συσχέτισης Ο συντελεστής συσχέτισης (correlation coefficient) μεταξύ των τ.μ. Χ και Υ εκφράζει το βαθμό στον οποίο μπορούμε να εκτιμήσουμε γραμμικά τη μία τ.μ. όταν γνωρίζουμε την τιμή της άλλης. ρ = CovX,Y/VXVY ( ) { [ ] [ ]} Όταν ρ=0 οι τ.μ. Χ και Υ είναι ασυσχέτιστες. Όταν ρ=1 υπάρχει τέλεια θετική γραμμική συσχέτιση των δύο τ.μ. ενώ όταν ρ=-1 υπάρχει τέλεια αρνητική γραμμική συσχέτιση. 19

20 Συντελεστής Συσχέτισης Όταν δεν γνωρίζουμε το ρ το εκτιμούμε με την βοήθεια των παρατηρήσεων (y i,x i ) r = n 1 ( x x)( y y) i { n n ( x ) 2 ( ) 2 } i x yi y 1 1 i 1/2 από το δειγματικό συντελεστή συσχέτισης. 20

21 Συντελεστής Συσχέτισης Ο δειγματικός συντελεστής συσχέτισης εκτιμά το βαθμό στον οποίο οι τ.μ. Χ και Υ είναι γραμμικά συσχετισμένες, χωρίς να συνεπάγεται κατά ανάγκη κάποιο είδος αιτιακής σχέσης μεταξύ των Χ και Υ. Αρκετά συχνά μας ενδιαφέρει να ελέγξουμε, σε ε.σ. έστω α%, κατά πόσο οι δύο τ.μ. Χ και Υ είναι ασυσχέτιστες ή όχι, δηλαδή τον έλεγχο Η 0 : ρ=0 με εναλλακτική Η 1 : ρ 0. Αποδεικνύεται ότι κάτω από την μηδενική υπόθεση r T= n 2 St( n 2 ). 2 1 r 21

22 Συντελεστής Συσχέτισης Υπολογίζουμε λοιπόν την τιμή του στατιστικού ελέγχου Τ και η P-τιμή του αμφίπλευρου ελέγχου είναι 2 φορές η πιθανότητα δεξιά του Τ με βάση την St(n-2). Στην R μπορούμε να εφαρμόσουμε τον εν λόγω έλεγχο με την βοήθεια της εντολής cor.test(x,y). Αν οι δυο μεταβλητές δεν είναι συνεχείς τότε ο παραπάνω έλεγχος (γνωστός με το όνομα Pearson correlation coefficient test) δεν είναι πλέον έγκυρος. Πρέπει αντί αυτού να εφαρμοστεί ο μη παραμετρικός Spearman rank correlation coefficient test, κατά τον οποίο αντικαθιστούμε τις παρατηρήσεις με την σειρά κατάταξης των τιμών τους (rank) και εφαρμόζουμε την προηγούμενη μεθοδολογία. Στην R μπορούμε να εφαρμόσουμε τον μη παραμετρικό έλεγχο με την βοήθεια της εντολής cor.test(x,y, method= spearman ). Όταν στο δείγμα υπάρχουν ισοπαλίες (παρατηρήσεις με την ίδια τιμή) η παραπάνω εντολή μας δίνει προειδοποιητικό μήνυμα και δεν υπολογίζει την ακριβή P-τιμή του ελέγχου αλλά αυτή που προκύπτει από μια προσέγγιση. 22

23 Συντελεστής Προσδιορισμού Στο απλό γραμμικό μοντέλο ηποσότητα R = 1 ( yi yˆ i) ( y y) καλείται συντελεστής προσδιορισμού, παίρνει τιμές στο [0,1] και εκφράζει το ποσοστό της διασποράς της τ.μ. Υ που εξηγείται με βάση το μοντέλο παλινδρόμησης. Αποδεικνύεται ότι, στο απλό γραμμικό μοντέλο, η παραπάνω ποσότητα ισούται με το τετράγωνο του δειγματικού συντελεστή συσχέτισης r. Γενικά όσο μεγαλύτερες τιμές παίρνει ο συντελεστής προσδιορισμού τόσο ισχυρότερη είναι η γραμμική σχέση εξάρτησης των τ.μ. Υ και Χ, υπό την προϋπόθεση ότι το γραμμικό μοντέλο είναι το κατάλληλο. n 2 i= 1 n i= 1 i

24 Συντελεστής Προσδιορισμού Αρκετές φορές υπολογίζουμε και τον διορθωμένο συντελεστή προσδιορισμού 2 R 1 = n i= 1 n i= 1 ( yi yˆ i) ( y y) i του οποίου η ερμηνεία δίνεται στο πολλαπλό γραμμικό μοντέλο. 2 2 n 2 n 1 24

25 Συντελεστής Προσδιορισμού Fitted values/var var5 Fitted values R 2 =0.46 var Fitted values/advertising expenditures ($ million) Εσφαλμένη υπόθεση γραμμικότητας R 2 = var4 Fitted values Advertising expenditures ($ million) 25

26 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Οι εκτιμήσεις των a και b που λαμβάνουμε με την μέθοδο ελαχίστων τετραγώνων βασίζονται στα συγκεκριμένα δεδομένα που διαθέτουμε. Συχνά λοιπόν ενδιαφερόμαστε να ελέγξουμε τις ακόλουθες υποθέσεις, σε ε.σ. έστω α: Η 0 : b=0 έναντι της εναλλακτικής Η 1 : b 0 Η 0 : a=0 έναντι της εναλλακτικής Η 1 : a 0 26

27 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Με τον πρώτο έλεγχο θέλουμε να διαπιστώσουμε αν πράγματι αύξηση κατά μιαμονάδατηςχσημαίνεικαιμεταβολή της αναμενόμενης τιμής της Υ. Στο δεύτερο έλεγχο θέλουμε να δούμε κατά πόσο η αναμενόμενη τιμή της Υ είναι 0 όταν Χ=0. Πολλές φορές η τιμή αυτή δεν έχει ερμηνεία, διότι η τιμή Χ=0 δεν παρατηρείται ποτέ στην πράξη. 27

28 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Τα στατιστικά ελέγχου με βάση τις μηδενικές υποθέσεις τότε είναι: bˆ 0 bˆ bˆ Τ 2 = = St(n 2) se(b) ˆ σ n n / (xi x) s yx / (xi x) i= 1 i= 1 aˆ 0 aˆ 0 aˆ Τ 1 = = St ( n 2 ). se(a) ˆ x 2 1 x σ + s n yx + n n 2 n 2 (xi x) (xi x) i= 1 i= 1 28

29 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Υπολογίζουμε λοιπόν τα παραπάνω δύο στατιστικά ελέγχου Τ 1 και Τ 2 και η P-τιμή των ελέγχων είναι 2 φορές η πιθανότητα της περιοχής της St(n -2) δεξιά από τις τιμές των στατιστικών ελέγχων που παρατηρούμε. Ισοδύναμα θα μπορούσαμε να είχαμε κατασκευάσει συμμετρικά (1-α)% Δ.Ε. για τα a και b και να ελέγξουμε αν η τιμή 0 ανήκει σ αυτά τα Δ.Ε. n ˆb ± tn 2,α /2s yx / (xi x) i= x â± tn 2,α /2syx + n n (xi x) i= (1-α)% Δ.Ε. για το b (1-α)% Δ.Ε. για το a

30 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Ένας άλλος έλεγχος που συνήθως εξετάζουμε στο μοντέλο παλινδρόμησης, γνωστός με την ονομασία F-test, είναι και ο παρακάτω, ο οποίος ελέγχει κατά πόσο το προτεινόμενο μοντέλο y=a+bx διαφέρει από το σταθερό y=a. Στη απλή γραμμική παλινδρόμηση ο εν λόγω έλεγχος είναι ισοδύναμος με τον έλεγχο για το b που είδαμε πριν. 30

31 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Υπολογίζουμε το στατιστικό ελέγχου F = n i= 1 1 n 2 ( ŷi y) n i= 1 ( yi yˆ i) το οποίο κάτω από την μηδενική υπόθεση Η 0 :b=0 (με εναλλακτική Η 1 :b 0) ακολουθεί την F(1,n-2). Υπολογίζουμε λοιπόν την τιμή του στατιστικού ελέγχου F και η P-τιμή είναι πιθανότητα της περιοχής της F(1,n-2) δεξιά από το F που παρατηρούμε

32 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Τέλος ένα συμμετρικό (1-α)% Δ.Ε. για το y όταν X=x είναι το 1 ( x x) 2 ŷ± tn 2,α/2s y x +. n n 2 (x 1 i x) Το παραπάνω διάστημα εμπιστοσύνης καλείται και διάστημα μέσης πρόβλεψης (mean prediction interval) μιας και στην πραγματικότητα είναι ένα συμμετρικό (1- α)% Δ.Ε. της τιμής, έστω y, της δεσμευμένης μέσης τιμής της μεταβλητής απόκρισης Υ όταν η επεξηγηματική μεταβλητή Χ ισούται με x, δηλαδή της τιμής της ποσότητας [ ] EYX= x= a+ bx. 32

33 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Εναλλακτικά, θα μπορούσαμε να κατασκευάζαμε το παρακάτω συμμετρικό (1-α)% Δ.Ε. για την τιμή, έστω y, της μεταβλητής απόκρισης Υ όταν η επεξηγηματική μεταβλητή X ισούται με x είναι το ( x x) 2 1 ŷ± tn 2, α/2s y x n n 2 (x 1 i x) Το εν λόγω διάστημα, καλείται διάστημα (ατομικής) πρόβλεψης ((individual) prediction interval) και αποτελεί ένα συμμετρικό (1-α)% Δ.Ε. της τιμής, έστω y, της τ.μ. Y= a+ bx +ε. 33

34 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Το πρώτο Δ.Ε. παρέχει πληροφορία για τον βαθμό αβεβαιότητας που έχουμε για την εκτίμηση της δεσμευμένης μέσης τιμής EYX [ = x. ] Το δεύτερο διάστημα παρέχει πληροφορία για τον βαθμό αβεβαιότητας που έχουμε για την τιμή που θα πάρει η τυχαία μεταβλητή Υ όταν Χ = x. Το δεύτερο δηλαδή διάστημα λαμβάνει επιπλέον υπόψιν, πέραν της αβεβαιότητας που έχουμε από την εκτίμηση της δεσμευμένης μέσης τιμής EYX [ = x] και την μεταβλητότητα της δεσμευμένης κατανομής Υ (Χ = x). Χρησιμοποιώντας δηλαδή το διάστημα μέσης πρόβλεψης γενικά υποεκτιμούμε την αβεβαιότητά μας για την χρήση της τιμής ŷ ως εκτιμήτρια της τιμής που θα πάρει η τυχαία μεταβλητή Υ όταν Χ = x. 34

35 Συμπερασματολογία στο Απλό Γραμμικό Μοντέλο Το πρώτο διάστημα θεωρείται κατάλληλο και χρησιμοποιείται όταν θέλουμε να κατασκευάσουμε διάστημα εμπιστοσύνης για την τιμή, έστω y, της μεταβλητής απόκρισης Υ δοσμένης μίας εκ των ήδη παρατηρηθέντων τιμών της επεξηγηματικής μεταβλητής Χ, για αυτό και λέγεται επίσης και διάστημα εμπιστοσύνης προσαρμοσμένων (fitted) τιμών. Αντιθέτως αν θέλουμε να χρησιμοποιήσουμε μια μελλοντική παρατήρηση, έστω x, της επεξηγηματικής μεταβλητής Χ τότε για την κατασκευή του διαστήματος εμπιστοσύνης της τιμής y της μεταβλητής απόκρισης Υ χρησιμοποιούμε το διάστημα (ατομικής) πρόβλεψης. 35

36 Προϋποθέσεις απλού γραμμικού μοντέλου 1. Γραμμικότητα 2. Κανονικότητα Σφαλμάτων 3. Ομοσκεδαστικότητα 4. Ανεξαρτησία Σφαλμάτων 36

37 Παράδειγμα απλού γραμμικού μοντέλου στην R Μετρήσεις της ποσότητας οξειδίου Υ που σχηματίζεται στην επιφάνεια ενός μετάλλου που τίθεται για χρόνο Χ (min) σε κλίβανο σταθερής θερμοκρασίας δίνεται από τον παρακάτω πίνακα. x y Ζητείται να προσαρμόσουμε ένα μοντέλο απλής γραμμικής παλινδρόμησης και να ελέγξουμε κατά πόσο ο χρόνος Χ όπου το μέταλλο τίθεται σε κλίβανο σταθερής θερμοκρασίας επηρεάζει την ποσότητα οξειδίου Υ που σχηματίζεται στην επιφάνειά του μετάλλου. 37

38 Παράδειγμα απλού γραμμικού μοντέλου στην R > x<-seq(10,90,by=10) > x [1] > y<-c(2,5,6.5,9.5,11,13.5,15,17.5,19) Δημιουργούμε ένα διάγραμμα διασποράς, μια απεικόνιση δηλαδή των σημείων (x i,y i ), για να ελέγξουμε αν η γραμμική συνάρτηση φαίνεται να είναι η κατάλληλη. > plot(x,y) 38

39 Παράδειγμα απλού γραμμικού μοντέλου στην R y Υπόθεση γραμμικότητας λογική x 39

40 Παράδειγμα απλού γραμμικού μοντέλου στην R > results<-lm(y~x) > results Call: lm(formula = y ~ x) Συνάρτηση στην R που προσαρμόζει το γραμμικό μοντέλο με y τα δεδομένα για την μεταβλητή απόκρισης και x τα δεδομένα για την επεξηγηματική μεταβλητή. â Coefficients: (Intercept) x ˆb 40

41 Παράδειγμα απλού γραμμικού μοντέλου στην R > plot(x,y) > abline(results) Ευθεία ελαχίστων τετραγώνων y x 41

42 Παράδειγμα απλού γραμμικού μοντέλου στην R > summary(results) Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max e e e e e-01 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) x e-09 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 7 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: 1441 on 1 and 7 DF, p-value: 2.292e-09 F ˆb R 2 â se(a) ˆ T1 se(b) ˆ T2 Περιγραφικοί δείκτες υπολοίπων P-τιμή για τον έλεγχο του a P-τιμή για τον έλεγχο του b s yx διορθωμένος συντελεστής προσδιορισμού P-τιμή για τον F έλεγχο του b (ίδιο με το παραπάνω) 42

43 Παράδειγμα απλού γραμμικού μοντέλου στην R > confint(results) 2.5 % 97.5 % (Intercept) x Συμμετρικά 95% Δ.Ε. για τις παραμέτρους Συμμετρικό 95% Δ.Ε. για το a > confint(results, level=0.99) 0.5 % 99.5 % (Intercept) x Συμμετρικό 95% Δ.Ε. για το b (δεν περιέχει το 0) > predict(results) Συμμετρικά 99% Δ.Ε. για τις παραμέτρους Προβλεπόμενες τιμές για κάθε x i. Το ίδιο αποτέλεσμα προκύπτει και με την εντολή fitted(results), όπως και με την εντολή results$fitted. > residuals(results) e e e e e e e e e-01 Υπόλοιπα. Το ίδιο αποτέλεσμα προκύπτει και με την εντολή results$res. 43

44 Παράδειγμα απλού γραμμικού μοντέλου στην R > predict(results, int="c") fit lwr upr Αναμενόμενες τιμές των y και συμμετρικά 95% Δ.Ε. για κάθε x i (διαστήματα μέσης πρόβλεψης) Προβλεπόμενες τιμές των y και συμμετρικά 95% Δ.Ε. όταν x=15 και x=47 (διαστήματα μέσης πρόβλεψης) > predict(results,list(x=c(15,47)), int="c") fit lwr upr > predict(results,list(x=c(15,47)), int="c", level=0.99) fit lwr upr Προβλεπόμενες τιμές των y και συμμετρικά 99% Δ.Ε όταν x=15 και x=47 (διαστήματα μέσης πρόβλεψης) 44

45 Παράδειγμα απλού γραμμικού μοντέλου στην R > predict(results, int="p") fit lwr upr Warning message: In predict.lm(results, int = "p") : Predictions on current data refer to _future_ responses Αναμενόμενες τιμές των y και συμμετρικά 95% Δ.Ε. για κάθε x i (διαστήματα ατομικής πρόβλεψης) προειδοποιητικό μήνυμα λάθους διότι κατασκευάζουμε διαστήματα πρόβλεψης για τα παρατηρηθέντα δεδομένα αντί για διαστήματα εμπιστοσύνης των προσαρμοσμένων τιμών. > predict(results,list(x=c(15,47)), int= p", level=0.99) fit lwr upr Προβλεπόμενες τιμές των y και συμμετρικά 99% Δ.Ε όταν x=15 και x=47 (διαστήματα ατομικής πρόβλεψης) 45

46 Παράδειγμα απλού γραμμικού μοντέλου στην R Παρατηρούμε λοιπόν ότι ŷ = x. Ακόμα παρατηρούμε ότι ο συντελεστής προσδιορισμού R 2 = 0.99, έχουμε δηλαδή σχεδόν τέλεια προσαρμογή του μοντέλου, ενώ s Τέλος θα μπορούσαμε να είχαμε υπολογίσει τον δειγματικό συντελεστή συσχέτισης με την βοήθεια της εντολής cor(x,y) > cor(x,y) [1] > cor(x,y)^2 [1] yx = 0.43 (αρκετά μικρό). =R 2 46

47 Παράδειγμα απλού γραμμικού μοντέλου στην R Στον έλεγχο για το b βλέπουμε ότι η P-τιμή είναι πολύ μικρή οπότε πράγματι αύξηση κατά μια μονάδα της Χ σημαίνει και μεταβολή της αναμενόμενης τιμής της Υ. Πιο συγκεκριμένα αύξηση του χρόνου κατά 1 λεπτό σημαίνει αύξηση της αναμενόμενης ποσότητας οξειδίου κατά Αντιθέτως η σταθερά δεν φαίνεται από την p-τιμή του αντίστοιχου ελέγχου να είναι στατιστικά διάφορη του μηδενός. Για να ελέγξουμε τις προϋποθέσεις του μοντέλου κάνουμε τα εξής: 47

48 Παράδειγμα απλού γραμμικού μοντέλου στην R Γραμμικότητα. Ήδη ελέγχθηκε με το διάγραμμα διασποράς. Κανονικότητα σφαλμάτων. Ιστογράμματα και QQplots γιαταυπόλοιπα. Π.χ. > qqnorm(results$res) > qqline(results$res) υπόλοιπα 48

49 Παράδειγμα απλού γραμμικού μοντέλου στην R Normal Q-Q Plot Sample Quantiles Theoretical Quantiles 49

50 Παράδειγμα απλού γραμμικού μοντέλου στην R Ομοσκεδαστικότητα. Γραφική παράσταση των υπολοίπων συναρτήσει των προβλεπόμενων τιμών ή συναρτήσει των τιμών της Χ. Τα ζεύγη αυτών των τιμών δεν πρέπει να εμφανίζουν κάποιο συστηματικό τρόπο συμπεριφοράς. > plot(results$res, results$fitted) > plot(results$res, x) προβλεπόμενες τιμές 50

51 Παράδειγμα απλού γραμμικού μοντέλου στην R results$fitted x results$res results$res 51

52 Παράδειγμα απλού γραμμικού μοντέλου στην R Ανεξαρτησία σφαλμάτων. Κατασκευάζουμε ένα διάγραμμα υπολοίπων σε σχέση με την σειρά των δεδομένων, στο οποίο δεν πρέπει να παρουσιάζεται κάποια σχέση και τα υπόλοιπα να συμπεριφέρονται τυχαία. > plot(1:9,results$res) 52

53 Παράδειγμα απλού γραμμικού μοντέλου στην R results$res :9 53

54 Παράδειγμα απλού γραμμικού μοντέλου στην R Διάφορα διαγνωστικά διαγράμματα μπορούν να γίνουν στην R με την βοήθεια της εντολής > plot(results) 54

55 Γενικό Γραμμικό Μοντέλο Ας θεωρήσουμε τώρα ότι διαθέτουμε p επεξηγηματικές μεταβλητές Χ=(Χ 1,...,Χ p ), έστω όλες ποσοτικές, οι οποίες συνδέονται πάλι γραμμικά με την ποσοτική μεταβλητή απόκρισης Υ. 2 Y a b1x 1... bpx p, ε Ν(0,σ ) = ε ΕΥ ( Χ,...,X ) = a + b X b X 1 p 1 1 p p Γενικό ή πολλαπλό γραμμικό μοντέλο παλινδρόμησης 55

56 Γενικό Γραμμικό Μοντέλο Έστω (Υ 1,Χ 11,...,Χ p1 ),,(Υ n,χ 1n,...,Χ pn ) τυχαίο δείγμα. Τότε ισοδύναμα: 2 Y = a+ b X b X +ε, ε Ν(0,σ ) i 1 1i p pi i i ΕΥ ( Χ,...,X ) = a + b X b X i 1i pi 1 1i p pi όπου εi ανεξάρτη τα. Με την βοήθεια των παρατηρήσεων (y 1,x 11,...,x p1 ),,(y n,x 1n,...,x pn ) και με βάση την μέθοδο ελαχίστων τετραγώνων παίρνουμε πάλι εκτιμήτριες για τις παραμέτρους του μοντέλου a, b 1,,b p, σ 2. 56

57 Ερμηνεία Παραμέτρων Ηπαράμετροςa εκφράζει την μέση τιμή της τ.μ. Υ όταν όλα τα Χ j, j=1,,p, είναι μηδέν. Η παράμετρος b j, j=1,,p, εκφράζει την αναμενόμενη μεταβολή της τιμή της τ.μ. Υότανη Χ j αυξηθεί κατά μία μονάδα και οι υπόλοιπες Χ k, k j, παραμείνουν σταθερές. Η ποσότητα σ 2 εκφράζει την διασπορά των σφαλμάτων, την οποία θεωρούμε σταθερή ανεξάρτητα των τιμών των τ.μ. Χ 1,...,Χ p (υπόθεση ομοσκεδαστικότητας). Επειδή η τυχαιότητα της Υ δεδομένου των τιμών των Χ οφείλεται στα σφάλματα, το σ 2 εκφράζει και την διασπορά της δεσμευμένης κατανομής της τ.μ. Υ Χ. 57

58 Γενικό Γραμμικό Μοντέλο με πίνακες Υ1 1 X11 X 1p a ε1 b Υ2 X21 1 ε2 Υ =, X =, b=, ε = Υ b n 1 X n1 X np p εn Υ= Χb + ε Η εκτιμήτριες με την μέθοδο ελαχίστων τετραγώνων είναι: n 1 bˆ = X X X Y = y x 1,...,xp n p 1 = ( ) -1 T T 2 και s ( y ˆ i yi) οι οποίες είναι τυχαίες μεταβλητές (από διαφορετικό δείγμα ενδέχεται να προκύψουν διαφορετικές εκτιμήτριες). 58 i 1 2

59 Γενικό Γραμμικό Μοντέλο Εκτιμώντας λοιπόν το b από το καταλήγουμε στο ˆb Ŷ Υ ˆ = Χb ˆ. Το καλείται προβλεπόμενη τιμή και είναι η αναμενόμενη που θα πάρει η τ.μ. Υ όταν Χ=x, όπως αυτήν την εκτιμήσαμε με βάση το μοντέλο παλινδρόμησης. Η προβλεπόμενη τιμή είναι τ.μ., δηλαδή για διαφορετικό δείγμα ενδέχεται να πάρει άλλη τιμή όταν X=x. Η προβλεπόμενη τιμή αποτελεί μία αμερόληπτη εκτιμήτρια της άγνωστης τιμής y που παίρνει η τ.μ. Υ όταν X=x. Παρακάτω θα δούμε ένα Δ.Ε. για την τιμή αυτή y όταν X=x. 59

60 Γενικό Γραμμικό Μοντέλο Για κάθε x 1i,...,x pi μπορούμε να υπολογίσουμε τις προβλεπόμενες τιμές ŷ = aˆ + bˆ x bˆ x. i 1 1i p pi εˆ = y yˆ Οι ποσότητες i i i αποτελούν τις εκτιμήσεις των σφαλμάτων των μετρήσεωνκαικαλούνταιόπωςκαιπριν υπόλοιπα. 60

61 Συντελεστής πολλαπλού προσδιορισμού Στογενικόγραμμικόμοντέλοηποσότητα καλείται πολλαπλός συντελεστής προσδιορισμού, παίρνει τιμές στο [0,1] και εκφράζει το ποσοστό της διασποράς της τ.μ. Υπου εξηγείται με βάση το μοντέλο παλινδρόμησης. Κάθε φορά που προσθέτουμε μια επεξηγηματική μεταβλητή στο μοντέλο ο πολλαπλός συντελεστής προσδιορισμού αυξάνεται. Όταν δεν θέλουμε να υπάρχει αυτή η εξάρτηση από το p υπολογίζουμε τον διορθωμένο συντελεστής προσδιορισμού n 2 y yˆ 61 R = 1 n 2 i= 1 n 2 R 1 = i= 1 i= 1 ( yi yˆ i) ( y y) i ( i i) n i= 1 ( y y) i n p 1 n 1

62 Συμπερασματολογία στο γενικό γραμμικό μοντέλο Ενδιαφερόμαστε όπως και πριν για τους εξής ελέγχους υποθέσεων: Η 0 : a=0 έναντι της εναλλακτικής Η 1 : a 0 Η 0 : b 1 =0 έναντι της εναλλακτικής Η 1 : b Η 0 : b p =0 έναντι της εναλλακτικής Η 1 : b p 0 Επίσης ενδιαφέρον έχει και το F-test το οποίο ελέγχει την μηδενική υπόθεση Η 0 : b 1 = b 2 = = b p = 0, με εναλλακτική ότι τουλάχιστον ένα από τα b j δεν είναι 0. 62

63 Συμπερασματολογία στο γενικό γραμμικό μοντέλο Τέλος ένα συμμετρικό (1-α)% διάστημα μέσης πρόβλεψης για την αναμενόμενη τιμή, έστω y, της μεταβλητής απόκρισης Υ όταν η επεξηγηματική μεταβλητή X ισούται με x = (x 1,,x p ) T είναι το ( ) -1 T T T ŷ± tn p 1, α/2s x X X x, όπου = (1,x y x 1,...,x p). x 63

64 Συμπερασματολογία στο γενικό γραμμικό μοντέλο Ένα συμμετρικό (1-α)% διάστημα (ατομικής) πρόβλεψης για την προβλεπόμενη τιμή, έστω y, της μεταβλητής απόκρισης Υ όταν η επεξηγηματική μεταβλητή X ισούται με x = (x 1,,x p ) T είναι το ( ) -1 T T T ŷ± tn p 1, α/2s 1 + x X X x, όπου = (1,x y x 1,...,x p). x 64

65 Προϋποθέσεις γενικού γραμμικού μοντέλου 1. Γραμμικότητα 2. Κανονικότητα Σφαλμάτων 3. Ομοσκεδαστικότητα 4. Ανεξαρτησία Σφαλμάτων 65

66 Προϋποθέσεις γενικού γραμμικού μοντέλου Γραμμικότητα. Στην απλή γραμμική παλινδρόμηση ο έλεγχος της γραμμικότητας γινόταν με το διάγραμμα διασποράς των (y i,x i ). Στην πολλαπλή παλινδρόμηση, με p επεξηγηματικές μεταβλητές, θα μπορούσαμε να δημιουργήσουμε p διαφορετικά διαγράμματα διασποράς, ένα για κάθε επεξηγηματική μεταβλητή, και να εξετάσουμε την υπόθεση της γραμμικότητας. Βέβαια με τον τρόπο αυτόν δεν ελέγχουμε την εγκυρότητα του γενικού γραμμικού μοντέλου αλλά ελέγχουμε την εγκυρότητα των παρακάτω απλών γραμμικών μοντέλων: [ ] EYx = a+ bx, j = 1,...,p. j j j 66

67 Προϋποθέσεις γενικού γραμμικού μοντέλου Αν οι επεξηγηματικές μεταβλητές είναι ασυσχέτιστες, τότε δεν υπάρχει διαφορά από το να ελέγξουμε τα παραπάνω μοντέλα ή το γενικό γραμμικό μοντέλο. Αλλά στις περισσότερες περιπτώσεις οι επεξηγηματικές μεταβλητές συσχετίζονται. Τότε αυτό που πρέπει να ελέγξουμε είναι αν πράγματι η επεξηγηματική μεταβλητή Χ j, j = 1,...,p, συνδέεται γραμμικά με την δεσμευμένη μέση τιμή της Υ, αν όλες οι άλλες επεξηγηματικές τ.μ. Χ 1,,Χ j-1, Χ j+1,,χ p συνδέονται γραμμικά με την δεσμευμένη μέση τιμή της Υ. Με άλλα λόγια αν θεωρήσουμε την σχέση y aˆ + bˆ x bˆ x + p (x ) + bˆ x bˆ x i = 1,..., n, i 1 i1 j 1 i,j 1 j ij j+ 1 i,j+ 1 p ip ( ) χρησιμοποιώντας τις εκτιμήτριες ελαχίστων τετραγώνων που έχουμε από το γενικό γραμμικό μοντέλο, αρκεί να δείξουμε ότι ησυνάρτησηp j είναι γραμμική. 67

68 Προϋποθέσεις γενικού γραμμικού μοντέλου Αν τώρα θεωρήσουμε την σχέση που μας δίνει τα υπόλοιπα y = a ˆ+ bˆ x + bˆ x bˆ x + εˆ i = 1,..., n i p p i ( ) και την αφαιρέσουμε από την σχέση στην προηγούμενη διαφάνεια έχουμε p(x) bx ˆ + εˆ P i = 1,...,n. j ij j ij i ij ( ) 68

69 Προϋποθέσεις γενικού γραμμικού μοντέλου Οι όροι P ij καλούνται j μερικά υπόλοιπα (partial residuals). Από την τελευταία σχέση είναι εμφανές ότι μπορούμε να ελέγξουμε αν η συνάρτηση p j είναι γραμμική, με το διάγραμμα διασποράς των σημείων (x ij, P ij ), i=1,,n Επαναλαμβάνοντας την διαδικασία για κάθε j=1,,p ελέγχουμε την γραμμικότητα στο γενικό γραμμικό μοντέλο. Οι υπόλοιπες προϋποθέσεις ελέγχονται όπως και στο απλό γραμμικό μοντέλο. 69

70 Παράδειγμα γενικού γραμμικού μοντέλου στην R Η αντοχή Υ ξύλινων δοκών, σε σχέση με την περιεκτικότητα τους σε νερό Χ 1 και το ειδικό τους βάρος Χ 2, αποτέλεσε το αντικείμενο μιας μελέτης. Με βάση τα παρακάτω δεδομένα, να προσαρμοστεί το μοντέλο Υ=a+b 1 X 1 +b 2 X 2 και να ερμηνευτούν τα αποτελέσματά του. 70

71 Παράδειγμα γενικού γραμμικού μοντέλου στην R Δοκός Αντοχή Y Περιεκτικότητα σε Νερό X 1 Ειδικό Βάρος X

72 Παράδειγμα γενικού γραμμικού μοντέλου στην R > Y<-c(11.14, 12.74, 13.13, 11.51, 12.38, 12.60, 11.13, 11.70, 11.02, 11.41) > X1<-c(11.1, 8.9, 8.8, 8.9, 8.8, 9.9, 10.7, 10.5, 10.5, 10.7) > X2<-c(0.499, 0.558, 0.604, 0.441, 0.55, 0.528, 0.418, 0.48, 0.406, 0.467) > cor(x1,x2) [1] παρατηρούμε ότι Χ 1 και Χ 2 συσχετίζονται Με τα επόμενα γραφήματα δεν μπορούμε να ελέγξουμε υπόθεση γραμμικότητας 72

73 Παράδειγμα γενικού γραμμικού μοντέλου στην R > plot(y,x1) > plot(y,x2) X X Y Y 73

74 Παράδειγμα γενικού γραμμικού μοντέλου στην R > results<-lm(y~x1+x2) > results Call: lm(formula = Y ~ X1 + X2) Coefficients: â ˆb 1 (Intercept) X1 X > residuals(results) Υπόλοιπα Προσαρμόζουμε το μοντέλο Υ=a+b 1 X 1 +b 2 X ˆb 2 Ισοδύναμο με την εντολή results$res 74

75 Παράδειγμα γενικού γραμμικού μοντέλου στην R > residuals(results, "partial") X1 X attr(,"constant") [1] Μερικά υπόλοιπα. Γιανατα υπολογίσει η R μετασχηματίζει πρώτα τις Χ 1 και Χ 2 αφαιρώντας τον μέσο τους και διαιρώντας με την τυπική τους απόκλιση > newx1<-(x1-mean(x1))/sd(x1) > newx2<-(x2-mean(x2))/sd(x2) > lm(y~newx1+newx2) Call: lm(formula = Y ~ newx1 + newx2) Coefficients: (Intercept) newx1 newx > *newx1[1] [1] ˆε + bx ˆ i

76 Παράδειγμα γενικού γραμμικού μοντέλου στην R > plot(residuals(results, "partial")[,1],x1) > plot(residuals(results, "partial")[,2],x2) υπόθεση γραμμικότητας λογική X residuals(results, "partial")[, 1] X residuals(results, "partial")[, 2] 76

77 Παράδειγμα γενικού γραμμικού μοντέλου στην R > summary(results) Call: lm(formula = Y ~ X1 + X2) Residuals: Min 1Q Median 3Q Max â se(a) ˆ Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) *** X1 ˆb X ** --- ˆb 2 se(b ˆ 1) se(b ˆ 1) Περιγραφικοί δείκτες υπολοίπων P-τιμή για τον έλεγχο του a P-τιμή για τον έλεγχο του b 1 P-τιμή για τον έλεγχο του b 2 Signif. codes: 0 *** ** 0.01 * Residual standard error: on 7 degrees of freedom Multiple R-squared: 0.9, Adjusted R-squared: F-statistic: 31.5 on 2 and 7 DF, p-value: F R 2 s yx P-τιμή για τον F έλεγχο διορθωμένος συντελεστής προσδιορισμού 77

78 Παράδειγμα γενικού γραμμικού μοντέλου στην R > confint(results) 2.5 % 97.5 % (Intercept) X X Συμμετρικά 95% Δ.Ε. για τις παραμέτρους Συμμετρικό 95% Δ.Ε. για το a Συμμετρικό 95% Δ.Ε. για το b 1 (περιέχει το 0) Συμμετρικό 95% Δ.Ε. για το b 2 (δεν περιέχει το 0) > predict(results) Προβλεπόμενες τιμές για κάθε x i Υπόλοιπα > residuals(results)

79 Παράδειγμα γενικού γραμμικού μοντέλου στην R > predict(results, int="c") fit lwr upr Προβλεπόμενες τιμές των y και συμμετρικά 95% Δ.Ε. για κάθε x i (διαστήματα μέσης πρόβλεψης) Προβλεπόμενες τιμές των y και συμμετρικά 95% Δ.Ε. όταν x 1 =10 και x 2 =0.42 και όταν x1=11 και x2 =0.48 (διαστήματα μέσης πρόβλεψης) > predict(results,list(x1=c(10,11), X2=c(0.42, 0.48)), int="c") fit lwr upr > predict(results,list(x1=c(10,11), X2=c(0.42, 0.48)), int="p") fit lwr upr Προβλεπόμενες τιμές των y και συμμετρικά 95% Δ.Ε όταν x 1 =10 και x 2 =0.42 και όταν x1=11 και x2 = (διαστήματα ατομικής πρόβλεψης) 79

80 Παράδειγμα γενικού γραμμικού μοντέλου στην R Προϋποθέσεις Normal Q-Q Plot > qqnorm(residuals(results)) > qqline(residuals(results)) κανονικότητα υπολοίπων Sample Quantiles Theoretical Quantiles 80

81 Παράδειγμα γενικού γραμμικού μοντέλου στην R > plot(results$res, results$fitted) ομοσκεδαστικότητα results$fitted results$res 81

82 Παράδειγμα γενικού γραμμικού μοντέλου στην R > plot(1:10,results$res) ανεξαρτησία υπολοίπων results$res :10 82

83 Παράδειγμα γενικού γραμμικού μοντέλου στην R Παρατηρούμε λοιπόν ότι ŷ = x x. 1 2 Ακόμα παρατηρούμε ότι ο συντελεστής προσδιορισμού R 2 = 0.9, έχουμε δηλαδή σχεδόν τέλεια προσαρμογή του μοντέλου, ενώ ο διορθωμένος είναι 0.87 επίσης πολύ υψηλός, ενώ syx = 0.27 (αρκετά μικρό). 83

84 Παράδειγμα γενικού γραμμικού μοντέλου στην R Στον έλεγχο για το b 1 βλέπουμε ότι η P-τιμή δεν είναι πολύ μικρή οπότε σε ε.σ. 5% δεν μπορούμε να απορρίψουμε την μηδενική υπόθεση ότι αύξηση κατά μια μονάδα της Χ 1 δεν σημαίνει μεταβολή της αναμενόμενης τιμής της Υ (υπό την προϋπόθεση ότι η Χ 2 παραμένει σταθερή). Στον έλεγχο για το b 2 βλέπουμε ότι η P-τιμή είναι πολύ μικρή οπότε πράγματι αύξηση κατά μια μονάδα της Χ 2 σημαίνει και μεταβολή της αναμενόμενης τιμής της Υ (υπό την προϋπόθεση ότι η Χ 1 παραμένει σταθερή). Πιο συγκεκριμένα αύξηση του ειδικού βάρους των δοκών κατά 1 μονάδα σημαίνει αύξηση της αναμενόμενης αντοχής τους κατά 8.49, υπό την προϋπόθεση βέβαια ότι η περιεκτικότητα σε νερό παραμένει σταθερή. Τέλος η σταθερά φαίνεται από την p-τιμή του αντίστοιχου ελέγχου να είναι στατιστικά διάφορη του μηδενός. Πιο συγκεκριμένα η αναμενόμενη αντοχή των δοκών με μηδενική περιεκτικότητα σε νερό και μηδενικό ειδικό βάρος είναι Φυσικά η συγκεκριμένη δήλωση δεν έχει ερμηνεία! Τέλος από το F-test καταλήγουμε να απορρίψουμε την υπόθεση ότι b 1 =b 2 =0, δηλαδή μπορούμε να εξηγήσουμε την μεταβλητότητα της αντοχής των δοκών από το γενικό γραμμικό μοντέλο. 84

85 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Επιλογή Μεταβλητών: Ένα πρόβλημα που αρκετές φορές αντιμετωπίζουμε είναι η επιλογή των κατάλληλων ανεξάρτητων μεταβλητών που θα χρησιμοποιήσουμε στο μοντέλο μας. Όταν στην διάθεσή μας έχουμε στοιχεία από πολλές επεξηγηματικές μεταβλητές δεν σημαίνει κατά ανάγκη ότι στο τελικό μοντέλο θα πρέπει να χρησιμοποιηθούν όλες αυτές. Υπάρχουν πολλά κριτήρια επιλογής μεταβλητών, η παρουσίαση των οποίων ξεφεύγει από τα όρια αυτών των σημειώσεων. 85

86 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Συγχυτικοί Παράγοντες: Συγχυτικός παράγοντας (confounder) ονομάζεται μια μεταβλητή, έστω Ζ, η οποία διαστρεβλώνει τη σχέση μεταξύ της μεταβλητής απόκρισης Υ και μιας επεξηγηματικής μεταβλητής Χ. Ο λόγος αυτής της διαστρέβλωσης είναι ότι ο συγχυτικός παράγοντας Ζ σχετίζεται και με την επεξηγηματική μεταβλητή Χ αλλά και με την μεταβλητή απόκρισης Υ. Άρα μπορεί η επεξηγηματική μεταβλητή Χ να είναι στατιστικά σημαντική (δηλαδή αύξησή της κατά μια μονάδα πράγματι να προκαλεί μεταβολή στην αναμενόμενη τιμή της μεταβλητής απόκρισης Υ) στο απλό γραμμικό μοντέλο Ε( Υ Χ ) = a+ bx, αλλά όταν στο μοντέλο προσθέσουμε και την μεταβλητή Ζ η επίδρασή της να εξαλείφεται και η Ζ να είναι αυτή που περιγράφει την μεταβλητότητα της Υ. 86

87 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Ως παράδειγμα θεωρήστε τα ακόλουθα δεδομένα τα οποία μας δίνουν το ποσοστό των ενηλίκων που χρησιμοποιούν το διαδίκτυο (Internet), το Ακαθάριστο Εγχώριο Προϊόν (GDP) και το μέσο αριθμό παιδιών ανά ενήλικη γυναίκα (Fertility), για 39 χώρες. 87

88 Διάφορα θέματα στο γενικό γραμμικό μοντέλο INTERNET GDP FERTILITY INTERNET GDP FERTILITY INTERNET GDP FERTILITY

89 Διάφορα θέματα στο γενικό γραμμικό μοντέλο > summary(lm(data$internet~data$fertility)) Call: lm(formula = data$internet ~ data$fertility) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-09 *** data$fertility *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 37 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 37 DF, p-value: >summary(lm(data$internet~data$fertility+data$gdp)) Call: lm(formula = data$internet ~ data$fertility + data$gdp) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) data$fertility data$gdp e-11 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 36 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 36 DF, p-value: 6.957e-13 89

90 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Παρατηρήστε πως η επίδραση της μεταβλητής Fertility στο γραμμικό μοντέλο εξαλείφεται όταν προσθέσουμε τον συγχυτικό παράγοντα GDP. Παρατηρήστε πως σχετίζονται μεταξύ τους οι 3 αυτές μεταβλητές. > cor(data) INTERNET GDP FERTILITY INTERNET GDP FERTILITY

91 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Πολυσυγγραμικότητα. Δεν θα πρέπει στο μοντέλο παλινδρόμησης να συμπεριλαμβάνουμε επεξηγηματικές μεταβλητές με υψηλή συσχέτιση μεταξύ τους, διότι τότε τα αποτελέσματα δεν είναι έγκυρα. Ως παράδειγμα θεωρήστε τα ακόλουθα δεδομένα τα οποία μας δίνουν το ύψος 25 ανδρών σε inches (Height) καθώς και το μήκος σε cm του αριστερού (LeftFoot) καθώς και δεξιού τους ποδιού (RtFoot). Σκοπός είναι να προσαρμόσουμε ένα γραμμικό μοντέλο με μεταβλητή απόκρισης Height και επεξηγηματικές μεταβλητές LeftFoot και RtFoot. 91

92 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Height LeftFoot RtFoot Height LeftFoot RtFoot

93 Διάφορα θέματα στο γενικό γραμμικό μοντέλο >summary(lm(data$height~data$leftfoot+data$rtfoot)) > summary(lm(data$height~data$leftfoot)) Call: lm(formula = data$height ~ data$leftfoot + data$rtfoot) Call: lm(formula = data$height ~ data$leftfoot) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-05 *** data$leftfoot data$rtfoot Signif. codes: 0 *** ** 0.01 * Residual standard error: on 22 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 22 DF, p-value: Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-05 *** data$leftfoot ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 23 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 23 DF, p-value:

94 Διάφορα θέματα στο γενικό γραμμικό μοντέλο > summary(lm(data$height~data$rtfoot)) Call: lm(formula = data$height ~ data$rtfoot) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-06 *** data$rtfoot ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 23 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 23 DF, p-value:

95 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Παρατηρήστε πως όταν συμπεριλαμβάνουμε και τις δύο επεξηγηματικές μεταβλητές στο μοντέλο (γενικό γραμμικό μοντέλο) καμία δεν είναι στατιστικά σημαντική, ενώ αντίθετα κάθε μία εξ αυτών έχει πολύ μεγάλη επίδραση στην μεταβλητή απόκρισης (όπως προφανώς αναμενόταν) όπως παρατηρούμε από τα απλά γραμμικά μοντέλα. Το παραπάνω φαινόμενο οφείλεται στην υψηλή συσχέτιση των δύο επεξηγηματικών μεταβλητών. > cor(data$rtfoot,data$leftfoot) [1]

96 Διάφορα θέματα στο γενικό γραμμικό μοντέλο Πρόβλεψη: Οι προβλέψεις είναι σωστές και αξιόπιστες μόνο για τις τιμές του Χ που είναι σχετικά κοντά με αυτές που έχουμε παρατηρήσει. Στο παράδειγμα με τις ξύλινες δοκούς δεν θα ήταν λογικό να εκτιμούσαμε την αντοχή των δοκών με περιεκτικότητα σε νερό

97 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Μέχρι τώρα οι επεξηγηματικές μεταβλητές του μοντέλου παλινδρόμησης θεωρήσαμε ότι είναι ποσοτικές τυχαίες μεταβλητές. Ωστόσο, μερικές φορές έχουμε επεξηγηματικές μεταβλητές που αποδίδουν έναν παράγοντα με δύο ή περισσότερες κατηγορίες, όπως π.χ. το φύλο ή την φυσική κατάσταση ενός ατόμου (κακή, μέτρια, καλή και άριστη). Ας υποθέσουμε παραδείγματος χάρη, ότι θέλουμε να δημιουργήσουμε ένα μοντέλο γραμμικής παλινδρόμησης με μεταβλητή απόκρισης Υ το καθαρό εισόδημα και επεξηγηματική μεταβλητή Χ το επίπεδο εκπαίδευσης (δημοτικό, γυμνάσιο, λύκειο, πανεπιστήμιο). Τότε δημιουργούμε τις λεγόμενες εικονικές μεταβλητές ή ψευδομεταβλητές, οι οποίες είναι (m-1) στον αριθμό, όπου m είναι ο αριθμός των κατηγοριών της κατηγορικής μεταβλητής Χ, και λαμβάνουν τις τιμές 0 ή 1. Στο παράδειγμα με το εισόδημα και το επίπεδο εκπαίδευσης (4 κατηγορίες), ορίζουμε τις εξής 3 εικονικές μεταβλητές: 97

98 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο 1, δημοτικό 1, γυμνάσιο 1, λύκειο Χ 1 = Χ 2 = Χ3 = 0, διαφορετικά 0, διαφορετικά 0, διαφορετικά και εκτιμούμε με την μέθοδο ελαχίστων τετραγώνων τους συντελεστές του γραμμικού μοντέλου [ ] EYΧ,Χ,Χ = a+ b x + b x + b x

99 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Ισοδύναμα με το παραπάνω γραμμικό μοντέλο είναι σαν να έχουμε τα ακόλουθα 4 γραμμικά μοντέλα: a, πανεπιστήμιο a + b 1, δημοτικό E(Y X 1,X 2,X 3) =. a + b 2, γυμνάσιο a + b, λύκειο 3 99

100 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Η κατηγορία για την οποία δεν ορίσαμε ψευδομεταβλητή ονομάζεται κατηγορία αναφοράς (reference category), στο παράδειγμα μας η κατηγορία αυτή είναι η πανεπιστημιακή μόρφωση, και η επιλογή της εξαρτάται συχνά από το υπό μελέτη πρόβλημα. Αν στο παράδειγμά μας θέλουμε να εξετάσουμε αν η πανεπιστημιακή μόρφωση αυξάνει κατά μέσο όρο το εισόδημα, τότε είναι φυσικό να θέσουμε ως κατηγορία αναφοράς την εν λόγω κατηγορία. Οι παράμετροι του παραπάνω γραμμικού μοντέλου μπορούν να ερμηνευτούν αν θεωρήσουμε τις πιθανές τιμές των εικονικών μεταβλητών. Έτσι η παράμετρος a στο παραπάνω παράδειγμα εκφράζει το μέσο καθαρό εισόδημα όταν Χ 1 = Χ 2 = Χ 3 = 0, άρα όταν η μόρφωση τουατόμουείναιπανεπιστημιακή. Η παράμετρος b 1 αντιπροσωπεύει την διαφορά μεταξύ του μέσου καθαρού εισοδήματος ατόμων με μόρφωση δημοτικού από το μέσο καθαρό εισόδημα ατόμων με πανεπιστημιακή μόρφωση. Ανάλογα ερμηνεύονται και οι υπόλοιποι συντελεστές. Τα γραμμικά μοντέλα με μία κατηγορική επεξηγηματική μεταβλητή είναι ισοδύναμα με τα μοντέλα Ανάλυσης Διασποράς με έναν Παράγοντα (One Way ANOVA). Αν η κατηγορική μεταβλητή είναι δίτιμη τα συμπεράσματα του γραμμικού μοντέλο είναι ισοδύναμα με αυτά του one sample t-test που είδαμε στο προηγούμενο κεφάλαιο. 100

101 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Παράδειγμα: Μετρήσεις του ετήσιου μισθού Υ (σε χιλιάδες ) των υπαλλήλων μιας εταιρείας, συναρτήσει της εμπειρίαςτουςχ 1 (σε έτη υπηρεσίας) και του μορφωτικού τους επιπέδου Χ 2 (1 = απολυτήριο λυκείου, 2 = απόφοιτος ΑΕΙ και 3 = μεταπτυχιακός τίτλος) δίνονται από τον πίνακα της επόμενης διαφάνειας. Να εκτιμηθούν και να ερμηνευτούν με την μέθοδο ελαχίστων τετραγώνων οι συντελεστές του μοντέλου E(Y X,X 1 22,X 23) = a+ bx 1 1+ bx bx , απόφοιτος ΑΕΙ 1, μεταπτυχιακός τίτλος όπου X 22 = X23 = 0, διαφορετικά 0, διαφορετικά 101

102 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Υ Χ Χ

103 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Έστω τα δεδομένα είναι αποθηκευμένα στο αρχείο data.txt (στον φάκελο από όπου τρέχουμε την R) υπό μορφή πίνακα διάστασης > data<-matrix(scan("data.txt"), ncol=16, byrow=t) Read 48 items > data [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [1,] [2,] [3,] [,15] [,16] [1,] [2,] 3 1 [3,] 2 1 > y<-data[1,] > x1<-data[2,] > x2<-data[3,] Διαβάζουμε τα δεδομένα από το αρχείο 103

104 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο > x2<-as.factor(x2) > x2 [1] Levels: > results<-lm(y~x1+x2) > summary(results) Call: lm(formula = y ~ x1 + x2) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-07 *** x e-05 *** x x ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 12 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 12 DF, p-value: 8.193e-07 μετατρέπουμε την μεταβλητή σε κατηγορική Η R παίρνει αυτόματα την 1 η κατηγορία ως κατηγορία αναφοράς 104

105 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο > model.matrix(results) (Intercept) x1 x22 x βλέπουμε τις εικονικές μεταβλητές που δημιουργήθηκαν 105

106 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Παρατηρούμε λοιπόν ότι: (α) ο αναμενόμενος μισθός ενός υπαλλήλου της εν λόγω εταιρείας με απολυτήριο λυκείου χωρίς προϋπηρεσία είναι 15190, (β) η αύξηση ενός έτους στα χρόνια εμπειρίας μεταφράζεται σε αύξηση του αναμενόμενου μισθού κατά 2370 για υπαλλήλους ανεξαρτήτως πανεπιστημιακής μόρφωσης, (γ) οι απόφοιτοι ΑΕΙ έχουν αναμενόμενο μισθό κατά 3640 υψηλότερο σε σχέση με τους συναδέλφους τους με τα ίδια χρόνια εμπειρίας που έχουν απολυτήριο λυκείου και (δ) οι κάτοχοι μεταπτυχιακών τίτλων έχουν αναμενόμενο μισθό κατά 7670 υψηλότερο σε σχέση με τους συναδέλφους τους με τα ίδια χρόνια εμπειρίας που έχουν απολυτήριο λυκείου. 106

107 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Παρατηρούμε λοιπόν ότι E(Y X 1, X 22, X 23) = x x x 23 Ισοδύναμα Χ 1, απολυτήριο λυκείου ( ) 2.37Χ 1 E(Y X, απόφοιτος ΑΕΙ 1,X 22,X 23) = + + ( ) Χ 1, μεταπτυχιακός τίτλος 107

108 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο > plot(x1,y,type='n') > abline(15.19,2.37, col=1) > abline(18.83,2.37, col=2) > abline(22.86,2.37, col=3) > legend(1,40, lty=1, col=1:3,legend=c("high School", "University", "Master")) y High School University Master x1

109 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο Αν θέλαμε να χρησιμοποιήσετε άλλη κατηγορία αναφοράς, αλλάζουμε την σειρά των κατηγοριών της μεταβλητής, έτσι ώστε η πρώτη να είναι αυτή που θέλουμε να είναι κατηγορία αναφοράς. Π.χ. αν θέλουμε η δεύτερη κατηγορία (απόφοιτος ΑΕΙ) να είναι η κατηγορία αναφοράς κάνουμε τα εξής: > x2 <- factor(x2, levels = c(2, 1, 3)) > x2 [1] Levels: > lm(y~x1+x2) Call: lm(formula = y ~ x1 + x2) Coefficients: (Intercept) x1 x21 x

110 Εικονικές Μεταβλητές στο γενικό γραμμικό μοντέλο > model.matrix(lm(y~x1+x2)) (Intercept) x1 x21 x

111 Επίλογος Αν η μεταβλητή απόκρισης Υ είναι κατηγορική μεταβλητή, τότε το γραμμικό μοντέλο δεν είναι πλέον το κατάλληλο, και χρησιμοποιούμε γενικευμένα γραμμικά μοντέλα, η παρουσίαση των οποίων ξεφεύγει από τους σκοπούς αυτών των σημειώσεων. 111

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών

Διαβάστε περισσότερα

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ ΜΕΜ264: Εφαρμοσμένη Στατιστική 1 ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ 1. Σε μελέτη της επίδρασης γεωργικών χημικών στην προσρόφηση ιζημάτων και εδάφους, δίνονται στον πιο κάτω πίνακα 13 δεδομένα για το δείκτη

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 30 Μαρτίου 2017 1/32 Ανάλυση Παλινδρόμησης: Γενικά. Με την ανάλυση παλινδρόμησης εξετάζουμε

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Γραµµική Παλινδρόµηση

Γραµµική Παλινδρόµηση Κεφάλαιο 8 Γραµµική Παλινδρόµηση Η γραµµική παλινδρόµηση είναι ένα από τα πιο σηµαντικά ϑέµατα της Στατιστική ϑεωρείας. Στη συνέχεια αυτή η πολύ γνωστή µεθοδολογία ϑα αναπτυχθεί στην R µέσω των τύπων για

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20, ΜΕΜ64: Εφαρμοσμένη Στατιστική 1 ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=0, X = 7.5, σ = 16, α = 5%. Πως αλλάζει το διάστημα αν

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΠΟΤΕ ΚΑΙ ΓΙΑΤΙ ΧΡΗΣΙΜΟΠΟΙΕΙΤΑΙ ΜΟΝΤΕΛΟ ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ ΕΡΜΗΝΕΙΑ ΤΩΝ ΕΚΤΙΜΗΤΩΝ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΤΩΝ ΣΥΝΤΕΛΕΣΤΩΝ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΥΠΟΘΕΣΕΙΣ ΠΙΝΑΚΑΣ ΑΝΑ ΙΑ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΓΙΑ ΤΙΣ ΠΑΡΑΜΕΤΡΟΥΣ

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Άσκηση 2. i β. 1 ου έτους (Υ i )

Άσκηση 2. i β. 1 ου έτους (Υ i ) Άσκηση Ο επόμενος πίνακας δίνει τους βαθμούς φοιτητών (Χ i ) στις εισαγωγικές εξετάσεις ενός κολεγίου και τους αντίστοιχους βαθμούς τους (Υ i ) στο τέλος της πρώτης χρονιάς φοίτησης στο συγκεκριμένο κολέγιο.

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ... ΚΕΦΑΛΑΙΟ 0 Ένα Πρόβλημα Δεδομένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Απλή Γραμμική Παλινδρόμηση Μωυσιάδης Χρόνης 6 o Εξάμηνο Μαθηματικών Έχει σχέση το με το ; Ειδικότερα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο Παράδειγμα 1 Ο παρακάτω πίνακας δίνει τις πωλήσεις (ζήτηση) ενός προϊόντος Υ (σε κιλά) από το delicatessen μιας περιοχής και τις αντίστοιχες τιμές Χ του προϊόντος (σε ευρώ ανά κιλό) για μια ορισμένη χρονική

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α) Τμήμα Διοίκησης Επιχειρήσεων (Αγ. Νικόλαος), Τ.Ε.Ι. Κρήτης Σελίδα 1 από 13 5η Εργαστηριακή Άσκηση Σκοπός: Η παρούσα εργαστηριακή άσκηση στοχεύει στην εκμάθηση κατασκευής γραφημάτων που θα παρουσιάζουν

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Στατιστική ανάλυση αποτελεσμάτων

Στατιστική ανάλυση αποτελεσμάτων HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια

Διαβάστε περισσότερα

ΠΑΛΙΝ ΡΟΜΗΣΗ..Π.Μ.Σ. Μαθηµατικά των Υπολογιστών και των Αποφάσεων. Πάτρα, 27 Ιανουαρίου 2011

ΠΑΛΙΝ ΡΟΜΗΣΗ..Π.Μ.Σ. Μαθηµατικά των Υπολογιστών και των Αποφάσεων. Πάτρα, 27 Ιανουαρίου 2011 Πάτρα, 7 Ιανουαρίου 011 Γενικά Πολλές ϕορές µας ενδιαφέρει να µελετήσουµε τις σχέσεις που υπάρχουν ανάµεσα στις µεταβλητές. Παράδειγµα 1 OZON 300 80 60 40 0 00 180 150 00 50 300 350 400 450 CFC 1 Από το

Διαβάστε περισσότερα

Λογιστική Παλινδρόµηση

Λογιστική Παλινδρόµηση Κεφάλαιο 10 Λογιστική Παλινδρόµηση Στο κεφάλαιο αυτό ϑα δούµε την µέθοδο της λογιστικής παλινδρόµησης η οποία χρησιµεύει στο να αναπτύξουµε σχέση µίας δίτιµης ανεξάρτητης τυχαίας µετα- ϐλητής και συνεχών

Διαβάστε περισσότερα

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται Κεφάλαιο 10 Η Ανάλυση Παλινδρόμησης Η Ανάλυση Παλινδρόμησης Το στατιστικό κριτήριο που μας επιτρέπει να προβλέψουμε τις τιμές μιας μεταβλητής από τις τιμές μιας ή πολλών άλλων γνωστών μεταβλητών Η σχέση

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα Εργασία στα Γενικευμένα Γραμμικά Μοντέλα Μ. Παρζακώνης ΜΕΣ/ 06015 Ο παρακάτω πίνακας δίνει τα αποτελέσματα 800 αιτήσεων για δάνειο σε μία τράπεζα. Ο πίνακας παρουσιάζει τον αριθμό των δανείων που εγκρίθηκαν,

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 28 Μαρτίου /36

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 28 Μαρτίου /36 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 28 Μαρτίου 2017 1/36 Πολλαπλή Γραμμική Παλινδρόμηση. Σε αρκετά προβλήματα η μεταβλητή απόκρισης

Διαβάστε περισσότερα

Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ

Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ Α/Α ΗΛΙΚΙΑ ΦΥΛΟ ΕΠΙΔΟΣΗ ΕΚΠΑΙΔΕΥΣΗ Στον πίνακα που ακολουθεί δίδονται οι επιδόσεις 30 ατόμων σε ένα ψυχομετρικό test, που προσήλθαν ως υποψήφιοι για πρόσληψη σε τραπεζικό οργανισμό. Οι επιδόσεις αυτές συνοδεύονται και από το φύλο κάθε ατόμου,

Διαβάστε περισσότερα

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Κλωνάρης Στάθης ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Μέχρι τώρα ασχοληθήκαμε με τις τεχνικές εκτίμησης παραμέτρων για ένα πληθυσμό όπως: τον Μέσο µ και το ποσοστό p Θα συνεχίσουμε

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Περιεχόμενα Εισαγωγή Το πρόβλημα - Συντελεστής συσχέτισης Μοντέλο απλής γραμμικής παλινδρόμησης

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ ΔΥΟ ΠΟΙΟΤΙΚΕΣ ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ ΕΞΕΤΑΣΗ ΤΗΣ ΥΠΑΡΞΗΣ Ή ΟΧΙ ΣΧΕΣΗΣ ΕΝΤΑΣΗ ΚΑΙ ΦΥΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΠΟΙΟΤΙΚΕΣ ΔΙΑΔΙΚΑΣΙΑ CROSSTABS ΠΙΝΑΚΑΣ ΣΥΝΑΦΕΙΑΣ Ο πίνακας συνάφειας είναι

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΟ 13 ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Στις προηγούμενες ενότητες ασχοληθήκαμε με μεθόδους που οδηγούν σε εκτιμήτριες των τιμών μιας ή και περισσοτέρων αγνώστων παραμέτρων. Αυτό έγινε με την κατασκευή

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 4 Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Δεδομένων

Εισαγωγή στην Ανάλυση Δεδομένων ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 09-10-2015 Εισαγωγή στην Ανάλυση Δεδομένων Βασικές έννοιες Αν. Καθ. Μαρί-Νοέλ Ντυκέν ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 30-10-2015 1. Στατιστικοί παράμετροι - Διάστημα εμπιστοσύνης Υπολογισμός

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ Ονοματεπώνυμο: Όνομα Πατρός:... Σ ΑΜ:. Ημερομηνία: Παρακαλώ μη γράφετε στα παρακάτω

Διαβάστε περισσότερα

Ανάλυση της ιακύµανσης

Ανάλυση της ιακύµανσης Κεφάλαιο 9 Ανάλυση της ιακύµανσης Η ανάλυση της διακύµανσης είναι µια από τις πλέον σηµαντικές µεθόδους για ανάλυση δεδοµένων. Η µέθοδος αυτή αναφέρετε στη διαµέριση του συνολικού αθροίσµατος τετραγώνων

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 6: Συσχέτιση και παλινδρόμηση εμπειρική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία. . ΣΤΑΤΙΣΤΙΚΗ ΣΥΣΧΕΤΙΣΗ. Υπολογισµός συντελεστών συσχέτισης Προκειµένου να ελέγξουµε την ύπαρξη γραµµικής σχέσης µεταξύ δύο ποσοτικών µεταβλητών, χρησιµοποιούµε συνήθως τον παραµετρικό συντελεστή συσχέτισης

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι Πανεπιστημίου Πειραιώς) Τηλ.: 4..97,,, Fax : 4..634 URL : www.vtal.gr emal: f@vtal.gr Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι

Διαβάστε περισσότερα

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Μοντέλα Παλινδρόμησης Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Εισαγωγή (1) Σε αρκετές περιπτώσεις επίλυσης προβλημάτων ενδιαφέρει η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Άσκηση 1: Μια τράπεζα ενδιαφέρεται να μελετήσει την αποταμιευτική συμπεριφορά των πελατών της. Θεωρείται ως δεδομένο ότι η ετήσια αποταμίευση των πελατών της

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων Γένεση Μετακινήσεων Παναγιώτης Παπαντωνίου Δρ. Πολιτικός Μηχανικός, Συγκοινωνιολόγος ppapant@upatras.gr Πάτρα, 2017 Εισαγωγή Αθροιστικά μοντέλα (Aggregate models) Ανάλυση κατά ζώνη πόσες μετακινήσεις ξεκινούν

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Νίκος Καλογερόπουλος 2014 Τι είναι έρευνα στην στατιστική Αρχική παρατήρηση: κάτι που πρέπει να διευκρινιστεί Κάθε χρόνο υπόσχομαι στον εαυτό μου ότι

Διαβάστε περισσότερα

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α εξάμηνο 2010-2011 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Ποιοτικές και Ποσοτικές μέθοδοι και προσεγγίσεις για την επιστημονική έρευνα users.sch.gr/abouras

Διαβάστε περισσότερα

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Άσκηση 1. Πληθυσμός (Χ i1 )

Άσκηση 1. Πληθυσμός (Χ i1 ) Άσκηση Μία αντιπροσωπεία πωλήσεως αυτοκινήτων διαθέτει καταστήματα σε 5 διαφορετικές πόλεις. Ο επόμενος πίνακας δίνει τις πωλήσεις Υ i του τελευταίου μήνα καθώς επίσης και τον πληθυσμό Χ i και το οικογενειακό

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται

Διαβάστε περισσότερα

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p ΑΣΚΗΣΗ 1 ΣΕΜΦΕ 14-15 i. Έστω yi ο αριθμός των προσπαθειών κάθε μαθητή μέχρι να πετύχει τρίποντο. Ο αριθμός των προσπαθειών πριν ο μαθητής να πετύχει τρίποντο θα είναι xi = yi - 1, i = 1,,18. 2 2 3 2 1

Διαβάστε περισσότερα