Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R



Σχετικά έγγραφα
Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Κατανομές Πιθανοτήτων. Γεωργία Φουτσιτζή, Καθηγήτρια, Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Ιωαννίνων Ακαδ.

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Πανεπιστήμιο Πελοποννήσου

3. Κατανομές πιθανότητας

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών. κλίµακα µέτρησης

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Στατιστική Συμπερασματολογία

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

Στατιστική. Εκτιμητική

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Start Random numbers Distributions p-value Confidence interval.

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Θεωρητικές Κατανομές Πιθανότητας

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΚΕΦΑΛΑΙΟ ΕΙΣΑΓΩΓΗ... 25

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ιωνυµική Κατανοµή(Binomial)

= p 20 1 p p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

Εισαγωγή στη Στατιστική

Στατιστική Συμπερασματολογία

Ηλεκτρονικοί Υπολογιστές I

Στατιστική Ι-Θεωρητικές Κατανομές Ι

Τυχαία μεταβλητή (τ.μ.)

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΠΙΘΑΝΟΤΗΤΕΣ -ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ(τελικές εξετάσεις πλη12)

4 Πιθανότητες και Στοιχεία Στατιστικής για Μηχανικούς

Συνεχείς Τυχαίες Μεταβλητές

Το Κεντρικό Οριακό Θεώρημα

ρ. Ευστρατία Μούρτου

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

Το Κεντρικό Οριακό Θεώρημα

Γνωστές κατανομές συνεχών μεταβλητών (συν.) (Δ). Γάμμα κατανομή

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

X = = 81 9 = 9

3 ο Μέρος Χαρακτηριστικά τυχαίων μεταβλητών

Εισαγωγή στη Στατιστική

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΚΕΦΑΛΑΙΟ 1, Εισαγωγή στη θεωρία ακραίων τιμών

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΚΕΦΑΛΑΙΟ 4ο ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΑΠΟ ΣΥΝΕΧΕΙΣ ΚΑΙ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

pdf: X U(a, b) 0, x < a 1 b a, a x b 0, x > b

Στατιστική Συμπερασματολογία

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΣΚΕΨΗ ΤΟΜΟΣ ΙΙ

Στατιστική Συμπερασματολογία

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής

ΤΕΧΝΙΚΗ ΥΔΡΟΛΟΓΙΑ Πιθανοτική προσέγγιση των υδρολογικών μεταβλητών

Το Κεντρικό Οριακό Θεώρημα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Πιθανότητες. Συνεχείς τυχαίες μεταβλητές Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Θεωρία Πιθανοτήτων & Στατιστική

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

Κεφάλαιο 5. Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

Πιθανότητες & Στατιστική (ΜΥΥ 304)

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Δειγματικές Κατανομές

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Στατιστική Επιχειρήσεων ΙΙ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Στατιστική Ι-Θεωρητικές Κατανομές ΙΙ

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

Εισαγωγή στην Εκτιμητική

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Συνεχείς Κατανομές. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. Ασκήσεις για ΑΕΙ και ΤΕΙ. Kglykos.gr. σε Συνεχείς Κατανομές. τεχνικές. 30 ασκήσεις.

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Συνοπτικά περιεχόμενα

Μέθοδος Newton-Raphson

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Γραφήµατα. Κεφάλαιο Απλά Γραφήµατα. > x <- rnorm(50, mean=1, sd=2) > plot(x) > y <- seq(0,20,.1) > z <- exp(-y/10)*cos(2*y)

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Γνωριμία με τον προγραμματισμό μέσω της γλώσσας R Στοιχεία Περιγραφικής Στατιστικής

ΕΡΓΑΣΤΗΡΙΟ ΠΙΘΑΝΟΤΗΤΩΝ

Transcript:

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο.

Περιεχόμενα Εισαγωγή στη Στατιστική Εισαγωγή στο Στατιστικό Πακέτο R Περιγραφική Στατιστική Προσομοίωση Στατιστική Συμπερασματολογία Ένα Δείγμα Δύο Ανεξάρτητα Δείγματα Δείγματα κατά Ζεύγη Ποσοστά Έλεγχος καλής προσαρμογής Πίνακες Συνάφειας 2 2 Ανάλυση Παλινδρόμησης Ανάλυση Διασποράς Προσομοίωση 2 Δημήτρης Φουσκάκης

Κατανομές στην R Στην R υπάρχουν πολλές συναρτήσεις που σχετίζονται με γνωστές κατανομές και υπολογισμό ποσοτήτων από αυτές. Κάθε συνάρτηση έχει ένα όνομα που αρχίζει με ένα από τα ακόλουθα γράμματα, τα οποία καθορίζουν το είδος της συνάρτησης: r: Γεννήτρια τυχαίων αριθμών. p: Συνάρτηση Κατανομής Πιθανότητας (σ.κ.π.) F(x). d: Συνάρτηση Πυκνότητας Πιθανότητας (σ.π.π.) ή Συνάρτηση Μάζας Πιθανότητας (σ.μ.π.), f(x). q: Υπολογισμός Ποσοστιαίων σημείων ή ισοδύναμα αντίστροφη Συνάρτηση Κατανομής Πιθανότητας F -1 (x) (δηλαδή το σημείο x: P(X x)>q για καθορισμένο q). Προσομοίωση 3 Δημήτρης Φουσκάκης

Κατανομές στην R Εντολή Κατανομή Εντολή Κατανομή beta Βήτα hyper Υπεργεωμετρική norm Κανονική unif Ομοιόμορφη pois Poisson cauchy Cauchy nbinom Αρνητική Διωνυμική weibull Weibull gamma Γάμμα chisq X 2 t Student exp Εκθετική binom Διωνυμική geom Γεωμετρική f Snedecor mvnorm Πολυμεταβλητή Κανονική Με την βοήθεια του help μπορείτε να δείτε τι παραμέτρους παίρνουν οι εν λόγω συναρτήσεις, π.χ. > help("dnorm") Προσομοίωση 4 Δημήτρης Φουσκάκης

Κατανομές στην R Παραδείγματα: > pnorm(3,2,2) [1] 0.6914625 > qgamma(0.3,1,1) [1] 0.3566749 > dt(2,3) [1] 0.06750966 Υπολογίζει την σ.κ.π. της Κανονικής κατανομής με μέσο 2 και τυπική απόκλιση (ΟΧΙ διασπορά) 2 στο σημείο 3. Βρίσκει το 0.3 ποσοστιαίο σημείο της Γάμμα κατανομής με παραμέτρους 1 και 1. Υπολογίζει την σ.π.π. της Student κατανομής με 3 βαθμούς ελευθερίας στο σημείο 2. > runif(5,-2,2) [1] 1.3448055-0.4691324 1.2517269 1.5576504 0.9563447 Δημιουργεί 5 τυχαίους αριθμούς από την ομοιόμορφη στο (-2,2). Προσομοίωση 5 Δημήτρης Φουσκάκης

Κατανομές στην R Τα ορίσματα των συναρτήσεων μπορεί να είναι και διανύσματα, π.χ. > dexp(1:5,2) [1] 2.706706e-01 3.663128e-02 4.957504e-03 6.709253e-04 9.079986e-05 Υπολογίζει την σ.π.π. της Εκθετικής κατανομής με παράμετρο 2 στα σημεία 1,2,3,4 και 5. Υπάρχουν για πολλές κατανομές προκαθορισμένες τιμές στις παραμέτρους, π.χ. η εντολή rnorm(50) (λείπουν οι τιμές για τις 2 παραμέτρους) γεννάει 50 τιμές από την Κανονική κατανομή με μέσο 0 και τυπική απόκλιση 1 (0 και 1 αντίστοιχα οι προκαθορισμένες τιμές). Προσομοίωση 6 Δημήτρης Φουσκάκης

Κατανομές στην R Μπορούμε να βρούμε και την 1-F. Π.χ. αν Χ~Student(10) τότε για να βρούμε την P(X 2) πληκτρολογούμε > pt(2,10) [1] 0.963306 ενώ για να βρούμε την P(X>2) πληκτρολογούμε > pt(2,10, lower.tail=false) [1] 0.03669402 Προσομοίωση 7 Δημήτρης Φουσκάκης

Κατανομές στην R Υπάρχει η δυνατότητα οι προηγούμενες συναρτήσεις (με αρχικά p και d) να είναι σε λογαριθμική κλίμακα > pnorm(3,2,2) [1] 0.6914625 > pnorm(3,2,2, log=t) [1] -0.3689464 > dt(2,3) [1] 0.06750966 > dt(2,3, log=t) [1] -2.695485 Προσομοίωση 8 Δημήτρης Φουσκάκης

Γραφικές Παραστάσεις Κατανομών Για να δούμε την γραφική παράσταση μιας σ.π.π. ήσ.μ.π. δημιουργούμε μια ακολουθία τιμών και παίρνουμε το γράφημα της σ.π.π. ή σ.μ.π. υπολογισμένης στην ακολουθία τιμών. Προσομοίωση 9 Δημήτρης Φουσκάκης

Γραφικές Παραστάσεις Κατανομών Παράδειγμα: > x<-seq(0,10, 0.01) > plot(x, dgamma(x,1,1), type='l') Γάμμα κατανομή με παραμέτρους (1,1) dgamma(x, 1, 1) 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 x Προσομοίωση 10 Δημήτρης Φουσκάκης

Γραφικές Παραστάσεις Κατανομών > n<-6 > p<-0.1 > x<-0:6 > pr<-dbinom(x,n,p) >plot(x,pr,type="h",xlim=c(0,6), ylim=c(0,1), col="blue",ylab="p") >points(x,pr,pch=20,col="dark red") Διωνυμική κατανομή με παραμέτρους n=6 και p=0.1 p 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 6 x Προσομοίωση 11 Δημήτρης Φουσκάκης

Γραφικός έλεγχος καταλληλότητας κατανομής Όπως αναφέραμε και στην εισαγωγή στην παραμετρική στατιστική υποθέτουμε ότι γνωρίζουμε την κατανομή του υπό μελέτη χαρακτηριστικού του πληθυσμού. Μπορούμε να ελέγξουμε γραφικά αυτήν την υπόθεση. Ο πιο απλός τρόπος είναι να κάνουμε το ιστόγραμμα των τιμών του δείγματός μας και να το συγκρίνουμε με την γραφική παράσταση της υποτιθέμενης κατανομής. Προσομοίωση 12 Δημήτρης Φουσκάκης

Γραφικός έλεγχος καταλληλότητας κατανομής Για παράδειγμα ας υποθέσουμε ότι έχουμε τα εξής δεδομένα > x 1.2126793 0.1811545 12.6740008 12.1543243 18.2933201 8.3776755 11.7624305 14.6615550 21.3756432 3.1409630 8.7359266 13.5479024 10.9576792 17.4204680 7.3268606 13.8451238 8.7802663 34.4452373-6.7201282-5.2785726 Το ιστόγραμμά τους μας λέει ότι η υπόθεση της κανονικότητας των εν λόγω δεδομένων δεν είναι παράλογη. Προσομοίωση 13 Δημήτρης Φουσκάκης

Γραφικός έλεγχος καταλληλότητας κατανομής Histogram of x Frequency 0 1 2 3 4 5 6 7-10 0 10 20 30 x Προσομοίωση 14 Δημήτρης Φουσκάκης

Γραφικός έλεγχος καταλληλότητας κατανομής Αντί για ιστόγραμμα μπορούμε να απεικονίσουμε την μη παραμετρική εκτιμήτρια της σ.π.π., με βάση τις παρατηρήσεις και με την βοήθεια της εντολής density στην R > plot(density(x)) Προσομοίωση 15 Δημήτρης Φουσκάκης

Γραφικός έλεγχος καταλληλότητας κατανομής density.default(x = x) Density 0.00 0.01 0.02 0.03 0.04 0.05-10 0 10 20 30 40 N = 20 Bandwidth = 2.866 Προσομοίωση 16 Δημήτρης Φουσκάκης

Γραφικός έλεγχος καταλληλότητας κατανομής Ειδικά για να ελέγξουμε αν τα δεδομένα μας προέρχονται από την Κανονική κατανομή κάνουμε μια γραφική παράσταση των δειγματικών ποσοστημορίων ως προς τα θεωρητικά ποσοστημόρια της Κανονικής Κατανομής (QQ - PLOT). Όσο πιο κοντά στην γραμμή, που αναπαριστά τα θεωρητικά ποσοστημόρια, είναι τα σημεία, που με την σειρά τους αναπαριστούν τα δειγματικά ποσοστημόρια, τόσο καλύτερη προσαρμογή έχουμε. > qqnorm(x) > qqline(x) Προσομοίωση 17 Δημήτρης Φουσκάκης

Γραφικός έλεγχος καταλληλότητας κατανομής Normal Q-Q Plot Sample Quantiles 0 10 20 30-2 -1 0 1 2 Theoretical Quantiles Προσομοίωση 18 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) Με βάση τον Α.Ν.Μ.Α. αν Χ 1,...,Χ n είναι ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με πεπερασμένη μέση τιμή μ, τότε 1 n X= n X 1 i μ κατά πιθανότητα καθώς n. Εφαρμογή: Έστω Χ i ~Bernoulli(p). Τότε μ=p(x i =1)=p, άρα από Α.Ν.Μ.Α. X p κατά πιθανότητα καθώς n. Προσομοίωση 19 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) Για να δούμε ότι πράγματι ισχύει ο Α.Ν.Μ.Α. ας υποθέσουμε ότι p=0.2, n=500 και ας τρέξουμε τον παρακάτω κώδικα: > x<-rbinom(500,1,0.2) > xbar<-cumsum(x)/(1:500) > plot(xbar) > abline(h=0.2) Προσομοίωση 20 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) Με την πρώτη εντολή προσομοιώνουμε (γεννάμε) τυχαίο δείγμα μεγέθους n=500 από την Bernoulli(0.2). Εν συνεχεία θεωρούμε την συνάρτηση του δειγματικού μέσου ως ακολουθία και απεικονίζουμε το γράφημά της εν λόγω ακολουθίας μαζί με την ευθεία y=0.2 για να ελέγξουμε την σύγκλιση. Προσομοίωση 21 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) xbar 0.2 0.4 0.6 0.8 1.0 0 100 200 300 400 500 Index Προσομοίωση 22 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) Για να ελέγξουμε την σύγκλιση επαναλαμβάνουμε την διαδικασία 4 φορές. > par(mfrow=c(2,2)) > i<-1 > for(i in 1:4) { x<-rbinom(500,1,0.2) xbar<-cumsum(x)/(1:500) plot(xbar) abline(h=0.2) i<-i+1 } Προσομοίωση 23 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) xbar 0.2 0.4 0.6 0.8 1.0 0.0 0.1 0.2 0.3 0.4 0.5 0 100 200 300 400 500 In d e x 0 100 200 300 400 500 Index xbar 0.0 0.2 0.4 0.6 xbar 0.2 0.4 0.6 0.8 1.0 xbar 0 100 200 300 400 500 In d e x 0 100 200 300 400 500 Index Προσομοίωση 24 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) Όταν η μέση τιμή της θεωρητικής κατανομής δεν υπάρχει τότε ο Α.Ν.Μ.Α. δεν ισχύει προφανώς. Παράδειγμα κατανομής της οποίας δεν υπάρχει η μέση τιμή είναι η Cauchy. Με την βοήθεια της R βλέπουμε ότι δεν υπάρχει σύγκλιση. > par(mfrow=c(2,2)) > i<-1 > for(i in 1:4) { x<-rcauchy(500) xbar<-cumsum(x)/(1:500) plot(xbar) i<-i+1 } Προσομοίωση 25 Δημήτρης Φουσκάκης

Ασθενής Νόμος των Μεγάλων Αριθμών (ΑΝΜΑ) xbar 0 1 2 3-6 -4-2 0 2 0 100 200 300 400 500 Index 0 100 200 300 400 500 Index xbar -5 0 5 10 15 xbar 0 2000 4000 6000 xbar 0 100 200 300 400 500 Index 0 100 200 300 400 500 Index Προσομοίωση 26 Δημήτρης Φουσκάκης

Κεντρικό Οριακό Θεώρημα Με βάση το Κ.Ο.Θ. αν Χ 1,...,Χ n είναι ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με πεπερασμένη μέση τιμή μ και διασπορά σ 2, τότε n X 1 i nμ Sn = Z N(0,1) κατά νόμο καθώς n. σ n Ισοδύναμα Χ μ σ 2 Y N(, /n) κατά νόμο καθώς n. Προσομοίωση 27 Δημήτρης Φουσκάκης

Κεντρικό Οριακό Θεώρημα Εφαρμογή: Έστω τυχαίο δείγμα μεγέθους 150 από την κατανομή Poisson παραμέτρου λ=2 (τότε λ=μ=σ 2 =2). > poisson.clt<-function(k,n,l) { Sn<-rep(NA,k) i<-1 for(i in 1:k) { x<-rpois(n,l) Sn[i]<-(sum(x)-n*l)/(sqrt(n*l)) } return(sn) } Προσομοίωση 28 Δημήτρης Φουσκάκης

Κεντρικό Οριακό Θεώρημα Στην παραπάνω συνάρτηση δημιουργούμε k δείγματα μεγέθους n από την Poisson με παράμετρο l, και για κάθε δείγμα υπολογίζουμε το S n. Ας ελέγξουμε, με βάση τις k τιμές για το S n, αν πράγματι η κατανομή του είναι Κανονική. Επιλέγουμε k=300. > run<-poisson.clt(300,150,2) > par(mfrow=c(1,2)) > hist(run) > qqnorm(run) > qqline(run) Προσομοίωση 29 Δημήτρης Φουσκάκης

Κεντρικό Οριακό Θεώρημα Histogram of run N o r m a l Q -Q P lo t Frequency 0 20 40 60 80 100 Sample Quantiles -3-2 -1 0 1 2 3-4 -2 0 2 4 run -3-2 -1 0 1 2 3 Theoretical Quantiles Προσομοίωση 30 Δημήτρης Φουσκάκης