Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Σχετικά έγγραφα
Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Κατανομές Πιθανοτήτων. Γεωργία Φουτσιτζή, Καθηγήτρια, Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Ιωαννίνων Ακαδ.

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

3. Κατανομές πιθανότητας

Πανεπιστήμιο Πελοποννήσου

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΚΕΦΑΛΑΙΟ ΕΙΣΑΓΩΓΗ... 25

Στατιστική Συμπερασματολογία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Στατιστική. Εκτιμητική

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Start Random numbers Distributions p-value Confidence interval.

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ιωνυµική Κατανοµή(Binomial)

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ

Θεωρητικές Κατανομές Πιθανότητας

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ρ. Ευστρατία Μούρτου

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

X = = 81 9 = 9

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Ηλεκτρονικοί Υπολογιστές I

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

Τυχαία μεταβλητή (τ.μ.)

ΕΡΓΑΣΤΗΡΙΟ ΠΙΘΑΝΟΤΗΤΩΝ

= p 20 1 p p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

Στατιστική Συμπερασματολογία

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

Προσοµοίωση. Κεφάλαιο Ο Ασθενής Νόµος των Μεγάλων Αριθµών. X = 1 n

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

Το Κεντρικό Οριακό Θεώρημα

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

4 Πιθανότητες και Στοιχεία Στατιστικής για Μηχανικούς


Το Κεντρικό Οριακό Θεώρημα

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

n + 1 X(1 + X). ) = X i i=1 i=1

Μέθοδος Newton-Raphson

Πιθανότητες & Στατιστική (ΜΥΥ 304)

& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

Στατιστική ΙΙ Ενότητα 2: ειγµατοληψία

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

Γνωστές κατανομές συνεχών μεταβλητών (συν.) (Δ). Γάμμα κατανομή

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΣΚΕΨΗ ΤΟΜΟΣ ΙΙ

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

Στατιστική Ι-Θεωρητικές Κατανομές Ι

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής

3 ο Μέρος Χαρακτηριστικά τυχαίων μεταβλητών

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

ΠΙΘΑΝΟΤΗΤΕΣ -ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ(τελικές εξετάσεις πλη12)

Στατιστική Συμπερασματολογία

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ' ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2006 ΕΚΦΩΝΗΣΕΙΣ

pdf: X U(a, b) 0, x < a 1 b a, a x b 0, x > b

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

Στατιστική Συμπερασματολογία

Το Κεντρικό Οριακό Θεώρημα

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Συνεχείς Τυχαίες Μεταβλητές

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΚΕΦΑΛΑΙΟ 1, Εισαγωγή στη θεωρία ακραίων τιμών

12xy(1 x)dx = 12y. = 12 y. = 12 y( ) = 12 y 1 6 = 2y. x 6x(1 x)dx = 6. dx = 6 3 x4

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Δειγματικές Κατανομές

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Στατιστική Συμπερασματολογία

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Περίληψη ϐασικών εννοιών στην ϑεωρία πιθανοτήτων

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ.

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Πιθανότητες. Συνεχείς τυχαίες μεταβλητές Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στην Μακροοικονοµική Ανάλυση. Εισαγωγή στην Οικονοµική Ανάλυση. Εισαγωγή στην Οικονοµική Ιστορία

Συνεχείς Κατανομές. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. Ασκήσεις για ΑΕΙ και ΤΕΙ. Kglykos.gr. σε Συνεχείς Κατανομές. τεχνικές. 30 ασκήσεις.

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

Transcript:

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο.

Περιεχόµενα Εισαγωγή στη Στατιστική Εισαγωγή στο Στατιστικό Πακέτο R Περιγραφική Στατιστική Προσοµοίωση Στατιστική Συµπερασµατολογία Ένα Δείγµα Δύο Ανεξάρτητα Δείγµατα Δείγµατα κατά Ζεύγη Ποσοστά Έλεγχος καλής προσαρµογής Πίνακες Συνάφειας 2 2 Ανάλυση Παλινδρόµησης Ανάλυση Διασποράς Προσοµοίωση 2

Κατανοµές στην R Στην R υπάρχουν πολλές συναρτήσεις που σχετίζονται µε γνωστές κατανοµές και υπολογισµό ποσοτήτων από αυτές. Κάθε συνάρτηση έχει ένα όνοµα που αρχίζει µε ένα από τα ακόλουθα γράµµατα, τα οποία καθορίζουν το είδος της συνάρτησης: r: Γεννήτρια τυχαίων αριθµών. p: Συνάρτηση Κατανοµής Πιθανότητας (σ.κ.π.) F(x). d: Συνάρτηση Πυκνότητας Πιθανότητας (σ.π.π.) ή Συνάρτηση Μάζας Πιθανότητας (σ.µ.π.), f(x). q: Υπολογισµός Ποσοστιαίων σηµείων ή ισοδύναµα αντίστροφη Συνάρτηση Κατανοµής Πιθανότητας F -1 (x) (δηλαδή το µικρότερο x: F(x)>=α για καθορισµένο α). Προσοµοίωση 3

Κατανοµές στην R Εντολή Κατανοµή Εντολή Κατανοµή beta Βήτα hyper Υπεργεωµετρική norm Κανονική unif Οµοιόµορφη pois Poisson cauchy Cauchy nbinom Αρνητική Διωνυµική weibull Weibull gamma Γάµµα chisq X 2 t Student exp Εκθετική binom Διωνυµική geom Γεωµετρική f Snedecor mvnorm Πολυµεταβλητή Κανονική Με την βοήθεια του help µπορείτε να δείτε τι παραµέτρους παίρνουν οι εν λόγω συναρτήσεις, π.χ. > help("dnorm") Προσοµοίωση 4

Κατανοµές στην R Παραδείγµατα: > pnorm(3,2,2) [1] 0.6914625 > qgamma(0.3,1,1) [1] 0.3566749 > dt(2,3) [1] 0.06750966 Υπολογίζει την σ.κ.π. της Κανονικής κατανοµής µε µέσο 2 και τυπική απόκλιση (ΟΧΙ διασπορά) 2 στο σηµείο 3. Βρίσκει το 0.3 ποσοστιαίο σηµείο της Γάµµα κατανοµής µε παραµέτρους 1 και 1. Υπολογίζει την σ.π.π. της Student κατανοµής µε 3 βαθµούς ελευθερίας στο σηµείο 2. > runif(5,-2,2) [1] 1.3448055-0.4691324 1.2517269 1.5576504 0.9563447 Δηµιουργεί 5 τυχαίους αριθµούς από την οµοιόµορφη στο (-2,2). Προσοµοίωση 5

Κατανοµές στην R Τα ορίσµατα των συναρτήσεων µπορεί να είναι και διανύσµατα, π.χ. > dexp(1:5,2) [1] 2.706706e-01 3.663128e-02 4.957504e-03 6.709253e-04 9.079986e-05 Υπολογίζει την σ.π.π. της Εκθετικής κατανοµής µε παράµετρο 2 στα σηµεία 1,2,3,4 και 5. Υπάρχουν για πολλές κατανοµές προκαθορισµένες τιµές στις παραµέτρους, π.χ. η εντολή rnorm(50) (λείπουν οι τιµές για τις 2 παραµέτρους) γεννάει 50 τιµές από την Κανονική κατανοµή µε µέσο 0 και τυπική απόκλιση 1 (0 και 1 αντίστοιχα οι προκαθορισµένες τιµές). Προσοµοίωση 6

Κατανοµές στην R Μπορούµε να βρούµε και την 1-F. Π.χ. αν Χ~Student(10) τότε για να βρούµε την P(X 2) πληκτρολογούµε > pt(2,10) [1] 0.963306 ενώ για να βρούµε την P(X>2) πληκτρολογούµε > pt(2,10, lower.tail=false) [1] 0.03669402 Προσοµοίωση 7

Κατανοµές στην R Υπάρχει η δυνατότητα οι προηγούµενες συναρτήσεις (µε αρχικά p και d) να είναι σε λογαριθµική κλίµακα > pnorm(3,2,2) [1] 0.6914625 > pnorm(3,2,2, log=t) [1] -0.3689464 > dt(2,3) [1] 0.06750966 > dt(2,3, log=t) [1] -2.695485 Προσοµοίωση 8

Γραφικές Παραστάσεις Κατανοµών Για να δούµε την γραφική παράσταση µιας σ.π.π. ή σ.µ.π. δηµιουργούµε µια ακολουθία τιµών και παίρνουµε το γράφηµα της σ.π.π. ή σ.µ.π. υπολογισµένης στην ακολουθία τιµών. Προσοµοίωση 9

Γραφικές Παραστάσεις Κατανοµών Παράδειγµα: > x<-seq(0,10, 0.01) > plot(x, dgamma(x,1,1), type='l') Γάµµα κατανοµή µε παραµέτρους (1,1) Προσοµοίωση 10

Γραφικές Παραστάσεις Κατανοµών > n<-6 > p<-0.1 > x<-0:6 > pr<-dbinom(x,n,p) >plot(x,pr,type="h",xlim=c (0,6),ylim=c(0,1), col="blue",ylab="p") >points(x,pr,pch=20,col="dark red") Διωνυµική κατανοµή µε παραµέτρους n=6 και p=0.1 Προσοµοίωση 11

Γραφικός έλεγχος καταλληλότητας κατανοµής Όπως αναφέραµε και στην εισαγωγή στην παραµετρική στατιστική υποθέτουµε ότι γνωρίζουµε την κατανοµή του υπό µελέτη χαρακτηριστικού του πληθυσµού. Μπορούµε να ελέγξουµε γραφικά αυτήν την υπόθεση. Ο πιο απλός τρόπος είναι να κάνουµε το ιστόγραµµα των τιµών του δείγµατός µας και να το συγκρίνουµε µε την γραφική παράσταση της υποτιθέµενης κατανοµής. Προσοµοίωση 12

Γραφικός έλεγχος καταλληλότητας κατανοµής Για παράδειγµα ας υποθέσουµε ότι έχουµε τα εξής δεδοµένα > x 1.2126793 0.1811545 12.6740008 12.1543243 18.2933201 8.3776755 11.7624305 14.6615550 21.3756432 3.1409630 8.7359266 13.5479024 10.9576792 17.4204680 7.3268606 13.8451238 8.7802663 34.4452373-6.7201282-5.2785726 Το ιστόγραµµά τους µας λέει ότι η υπόθεση της κανονικότητας των εν λόγω δεδοµένων δεν είναι παράλογη. Προσοµοίωση 13

Γραφικός έλεγχος καταλληλότητας κατανοµής Προσοµοίωση 14

Γραφικός έλεγχος καταλληλότητας κατανοµής Αντί για ιστόγραµµα µπορούµε να απεικονίσουµε την µη παραµετρική εκτιµήτρια της σ.π.π., µε βάση τις παρατηρήσεις και µε την βοήθεια της εντολής density στην R > plot(density(x)) Προσοµοίωση 15

Γραφικός έλεγχος καταλληλότητας κατανοµής Προσοµοίωση 16

Γραφικός έλεγχος καταλληλότητας κατανοµής Ειδικά για να ελέγξουµε αν τα δεδοµένα µας προέρχονται από την Κανονική κατανοµή κάνουµε µια γραφική παράσταση των δειγµατικών ποσοστηµορίων ως προς τα θεωρητικά ποσοστηµόρια της Κανονικής Κατανοµής (QQ - PLOT). Όσο πιο κοντά στην γραµµή, που αναπαριστά τα θεωρητικά ποσοστηµόρια, είναι τα σηµεία, που µε την σειρά τους αναπαριστούν τα δειγµατικά ποσοστηµόρια, τόσο καλύτερη προσαρµογή έχουµε. > qqnorm(x) > qqline(x) Προσοµοίωση 17

Γραφικός έλεγχος καταλληλότητας κατανοµής Προσοµοίωση 18

Ασθενής Νόµος των Μεγάλων Αριθµών (ΑΝΜΑ) Με βάση τον Ν.Μ.Α. αν Χ 1,...,Χ n είναι ανεξάρτητες και ισόνοµες τυχαίες µεταβλητές µε πεπερασµένη µέση τιµή µ, τότε µε πιθανότητα 1 Εφαρµογή: Έστω Χ i ~Be(p). Τότε µ= P(X i =1)=p, άρα από τον Ν.Μ.Α., ο δειγµατικός µέσος τείνει στο p. Προσοµοίωση 19

Νόµος των Μεγάλων Αριθµών (ΝΜΑ) Για να δούµε γραφικά τον Ν.Μ.Α. ας υποθέσουµε ότι p=0.2, n=500 και ας τρέξουµε τον παρακάτω κώδικα: > x<-rbinom(500,1,0.2) > xbar<-cumsum(x)/(1:500) > plot(xbar) > abline(h=0.2) Προσοµοίωση 20

Νόµος των Μεγάλων Αριθµών (ΝΜΑ) Με την πρώτη εντολή προσοµοιώνουµε (γεννάµε) τυχαίο δείγµα µεγέθους n=500 από την Bernoulli(0.2). Εν συνεχεία θεωρούµε την συνάρτηση του δειγµατικού µέσου ως ακολουθία και απεικονίζουµε το γράφηµά της εν λόγω ακολουθίας µαζί µε την ευθεία y=0.2 για να ελέγξουµε την σύγκλιση. Προσοµοίωση 21

Νόµος των Μεγάλων Αριθµών (ΝΜΑ) Προσοµοίωση 22

Νόµος των Μεγάλων Αριθµών (ΝΜΑ) Για να ελέγξουµε την σύγκλιση επαναλαµβάνουµε την διαδικασία 4 φορές. > par(mfrow=c(2,2)) > i<-1 > for(i in 1:4) { x<-rbinom(500,1,0.2) xbar<-cumsum(x)/(1:500) plot(xbar) abline(h=0.2) i<-i+1 } Προσοµοίωση 23

Νόµος των Μεγάλων Αριθµών (ΝΜΑ) Προσοµοίωση 24

Νόµος των Μεγάλων Αριθµών (ΝΜΑ) Όταν η µέση τιµή της θεωρητικής κατανοµής δεν υπάρχει τότε ο Α.Ν.Μ.Α. δεν ισχύει προφανώς. Παράδειγµα κατανοµής της οποίας δεν υπάρχει η µέση τιµή είναι η Cauchy. Με την βοήθεια της R βλέπουµε ότι δεν υπάρχει σύγκλιση. > par(mfrow=c(2,2)) > i<-1 > for(i in 1:4) { x<-rcauchy(500) xbar<-cumsum(x)/(1:500) plot(xbar) i<-i+1 } Προσοµοίωση 25

Νόµος των Μεγάλων Αριθµών (ΝΜΑ) Προσοµοίωση 26

Κεντρικό Οριακό Θεώρηµα Με βάση το Κ.Ο.Θ. αν Χ 1,...,Χ n είναι ανεξάρτητες και ισόνοµες τυχαίες µεταβλητές µε πεπερασµένη µέση τιµή µ και διασπορά σ 2, τότε Προσεγγιστικά, για µεγάλα n έχουµε Προσοµοίωση 27

Κεντρικό Οριακό Θεώρηµα Εφαρµογή: Έστω τυχαίο δείγµα µεγέθους 150 από την κατανοµή Poisson παραµέτρου λ=2 (τότε λ=µ=σ 2 =2). > poisson.clt<-function(k,n,l) { Sn<-rep(NA,k) i<-1 for(i in 1:k) { x<-rpois(n,l) Sn[i]<-(sum(x)-n*l)/(sqrt(n*l)) } return(sn) } Προσοµοίωση 28

Κεντρικό Οριακό Θεώρηµα Στην παραπάνω συνάρτηση δηµιουργούµε k δείγµατα µεγέθους n από την Poisson µε παράµετρο l, και για κάθε δείγµα υπολογίζουµε το S n. Ας ελέγξουµε, µε βάση τις k τιµές για το S n, αν πράγµατι η κατανοµή του είναι Κανονική. Επιλέγουµε k=300. > run<-poisson.clt(300,150,2) > par(mfrow=c(1,2)) > hist(run) > qqnorm(run) > qqline(run) Προσοµοίωση 29

Κεντρικό Οριακό Θεώρηµα Προσοµοίωση 30