Εργαστήριο Ανώτερης Γεωδαισίας Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗΣ «Αναλυτικές Μέθοδοι στη Γεωπληροφορική» (Ακαδ. Έτος )

Σχετικά έγγραφα
3. Κατανομές πιθανότητας

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΕΡΓΑΣΤΗΡΙΟ ΠΙΘΑΝΟΤΗΤΩΝ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Θεωρητικές Κατανομές Πιθανότητας

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Είδη Μεταβλητών. κλίµακα µέτρησης

1 x-μ - 2 σ. e σ 2π. f(x) =

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Εργαστήριο Ανώτερης Γεωδαισίας Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗΣ «Αναλυτικές Μέθοδοι στη Γεωπληροφορική» (Ακαδ. Έτος )

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Δειγματικές Κατανομές

Start Random numbers Distributions p-value Confidence interval.

Γνωριμία με τον προγραμματισμό μέσω της γλώσσας R Στοιχεία Περιγραφικής Στατιστικής

Πανεπιστήμιο Πελοποννήσου

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Ηλεκτρονικοί Υπολογιστές I

ρ. Ευστρατία Μούρτου

Εργαστήριο Ανώτερης Γεωδαισίας Μάθηµα 7ου Εξαµήνου (Ακαδ. Έτος ) «Εισαγωγή στο Γήινο Πεδίο Βαρύτητας» ΕΞΑΜΗΝΟ ΑΣΚΗΣΗ 2

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ


Κατανοµές. Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται από το σχήµα του ιστογράµµατος (histogram).

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Στατιστική Ι-Θεωρητικές Κατανομές Ι

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

07/11/2016. Στατιστική Ι. 6 η Διάλεξη (Βασικές διακριτές κατανομές)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Τ Ε Ι Ιονίων Νήσων Τμήμα Εφαρμογών Πληροφορικής στη Διοίκηση και την Οικονομία. Υπεύθυνος: Δρ. Κολιός Σταύρος

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Ενδεικτικές ασκήσεις ΔΙΠ 50

ιωνυµική Κατανοµή(Binomial)

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Στατιστική ΙΙ Ενότητα 2: ειγµατοληψία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ Σφάλµατα και στατιστική επεξεργασία πειραµατικών µετρήσεων

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Εισαγωγή στη Στατιστική

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

στατιστική θεωρεία της δειγµατοληψίας

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Στατιστική Επιχειρήσεων Ι. Βασικές διακριτές κατανομές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστική Επιχειρήσεων Ι

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Κατανομές Πιθανοτήτων. Γεωργία Φουτσιτζή, Καθηγήτρια, Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Ιωαννίνων Ακαδ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

Διάλεξη 1 Βασικές έννοιες

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

Βιομαθηματικά BIO-156

3 ο Μέρος Χαρακτηριστικά τυχαίων μεταβλητών

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Α4. Να χαρακτηρίσετε τις προτάσεις που ακολουθούν, γράφοντας στο τετράδιό σας δίπλα στο γράµµα που αντιστοιχεί σε κάθε πρόταση, τη λέξη Σωστό, αν η

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ


Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική Εισαγωγικές Έννοιες

Transcript:

Εργαστήριο Ανώτερης Γεωδαισίας Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗΣ «Αναλυτικές Μέθοδοι στη Γεωπληροφορική» (Ακαδ. Έτος 2018-19) ΟΝΟΜΑΤΕΠΩΝΥΜΟ... ΕΞΑΜΗΝΟ... Ηµεροµηνία Παράδοσης : 8/1/2019 ΘΕΜΑΤΙΚΗ ΕΡΓΑΣΙΑ #4 Σκοπός: Η παρούσα θεµατική εργασία αποσκοπεί στην εξοικείωση σας µε βασικές κατανοµές πιθανότητας τυχαίων µεταβλητών, µε έµφαση στο πως µπορούµε να προσοµοιώνουµε κατάλληλα δεδοµένα στο R χρησιµοποιώντας γεννήτριες τυχαίων αριθµών διαφορετικών µεταβλητών που θέλουµε να ελέγξουµε. Μέρος Β Προκαταρκτικά εξάσκησης (1) Πριν προχωρήσετε στα κύρια επόµενα ερωτήµατα της Θεµατικής Εργασίας σας συνιστάται να εκτελέσετε στο R, από τους παρακάτω ιστότοπους τα ενδεικτικά παραδείγµατα χρήσης των βασικών συναρτήσεων που αφορούν στις κατανοµές πιθανότητας: http://www.stat.umn.edu/geyer/old/5101/rlook.html http://www.r-tutor.com/elementary-statistics/probability-distributions http://seankross.com/notes/dpqr/ Με το πέρας της εξάσκησή σας µε τα εν λόγω παραδείγµατα, δηµιουργήστε για τα παραδοτέα σας ένα Rhistory αρχείο. (2) Εκτελέστε µερικές προσοµοιώσεις δειγµατοληψιών από διάφορες κατανοµές πιθανότητας: (a) Ξεκινήστε µε µερικές προσοµοιώσεις δειγµατοληψίας από τη διωνυµική κατανοµή. Θεωρείστε τις ακόλουθες εντολές κώδικα R ως να κάνετε µια κλήρωση, από δείγµα 10 αντικειµένων µε πιθανότητα 0.4. Αναζητήστε στη βοήθεια του R τη σηµασία της χρήσης της συνάρτησης set.seed (). Εκτελέστε τη 2 η εντολή µερικές φορές και παρατηρήστε τις διαφορές ή µη από τα δείγµατα που επιστρέφει κάθε κλήση της συνάρτησης rbinom(): set.seed(100) rbinom(n=1,size=10,prob=0.4) Σκεφτείτε ότι ο κώδικας αυτός ορίζει ένα διωνυµικό "πείραµα". (i) Αλλάξτε τους κανόνες του πειράµατος έτσι ώστε η πιθανότητα να είναι 0.2 και τρέξτε, µε τις κατάλληλες εντολές, το πείραµα µερικές φορές. Κάθε εκτέλεση είναι µια "προσοµοίωση". Κάνετε 300 τέτοιες προσοµοιώσεις του ίδιου "πειράµατος", αλλάζοντας κατάλληλα τις παραµέτρους εισόδου της προηγούµενης εντολής.

(ii) Αντιστοιχίστε (εκχωρήστε) τα αποτελέσµατα της προηγούµενης προσοµοίωσης σε µια µεταβλητή sims και υπολογίστε, το µέσο όρο και τη διάµεση τιµή αυτής της σειράς των προσοµοιώσεων; Σχεδιάστε τον πίνακα συχνοτήτων του αντικειµένου sims. (iii) Ξανατρέξτε το πείραµα, µε 5000 προσοµοιώσεις και για πιθανότητα 0.8, και επανασχεδιάστε τον πίνακα συχνοτήτων του αντικειµένου sims. (b) Η επόµενη προσοµοίωση είναι παρόµοια µε ένα πείραµα του 1987, µε το οποίο ερευνήθηκαν τα προστατευτικά οφέλη της ασπιρίνης: µεταξύ 11037 ατόµων σε µια οµάδα θεραπείας διαγνώστηκαν 104 εµφράγµατα µυοκαρδίου (θανατηφόρα και µη θανατηφόρα), ενώ µεταξύ 11034 ατόµων σε µια οµάδα που λάµβανε ένα πλασµατικό φάρµακο παρατηρήθηκαν 104 εµφράγµατα µυοκαρδίου (ΜΙ). Τα παρατηρούµενα ποσοστά ασθένειας σε άτοµα που έχουν εκτεθεί από µια πάθηση και οι µη εκτεθειµένοι πληθυσµοί µπορούν να χρησιµεύσουν ως πιθανότητες σε δύο σύνολα πειραµατικών προσοµοιώσεων χρησιµοποιώντας τη συνάρτηση της διωνυµικής κατανοµής rbinom(). Τέτοιες διαδικασίες ακολουθούνται στην πράξη για την προσέγγιση των πιθανών αποτελεσµάτων για πολλά προβλήµατα όταν δεν υπάρχει καµία άµεση ή κλειστή λύση, κάτι που συµβαίνει συχνά στις λεγόµενες Bayesian αναλύσεις, όταν η υποκείµενη κατανοµή είναι άγνωστη ή τα δείγµατα µιας στατιστικής ανάλυσης είναι µικρού µεγέθους. Μπορεί επίσης να είναι χρήσιµη σε υπολογισµούς δεικτών κινδύνου. (b-1) Εν προκειµένω, ξεκινήστε καταρχήν από µια "ρύθµιση της συνάρτησης set.seed()" για τις κλήσεις της συνάρτησης rbinom() για τη δηµιουργία τυχαίων αριθµών, ώστε να µπορείτε να αναπαράγετε αργότερα τα αποτελέσµατά σας. Στη συνέχεια, χρησιµοποιήστε τη συνάρτηση rbinom() για να επαναλάβετε 5000 φορές ένα πείραµα όπου µετράµε τον αριθµό των αποτελεσµάτων εµφάνισης εµφράγµατος µυοκαρδίου (ΜΙ) στους δύο προαναφερόµενους πληθυσµούς, µε την πιθανότητα του αποτελέσµατος σε κάθε πληθυσµό να ορίζεται από τα αποτελέσµατα της έρευνας. Εκχωρήστε τα αποτελέσµατα για τους δύο πληθυσµούς σε δύο µεταβλητές, π.χ. exg και plac αντίστοιχα. Στο επόµενο βήµα, για κάθε ένα από τα 5000 πειραµατικά δείγµατα, διαιρέστε τον αριθµό των αποτελεσµάτων από τον αριθµό των ατόµων σε κάθε πληθυσµό για να λάβετε 5000 αντίστοιχες εκτιµήσεις κινδύνου για κάθε οµάδα. Στη συνέχεια, για κάθε ένα από τα 5000 πειράµατα ή επαναλήψεις, διαιρέστε τον κίνδυνος στην οµάδα θεραπείας µε τον κίνδυνο στην οµάδα του εικονικού φαρµάκου για να πάρετε 5000 εκτιµήσεις του σχετικού κινδύνου. Επιπλέον υπολογίστε τα βασικά στατιστικά µέτρα, µέση τιµή, τυπική απόκλιση και τα εκατοστηµόρια πιθανότητας 2.5% και 97.5% για τον σχετικό κίνδυνο εµφάνισης εµφράγµατος του µυοκαρδίου για τα εκατοστηµόρια χρησιµοποιήστε τη συνάρτηση quantile(). (b-2) Χρησιµοποιήστε την ακόλουθη δική σας συνάρτηση my.risk() my.risk<-function(x){ p1<-rbinom(5000, x[1,2], x[1,1]/x[1,2]) p2<-rbinom(5000, x[2,2], x[2,1]/x[2,2]) r.p1<-p1/x[1,2] r.p2<-p2/x[2,2] rr.sim<-r.p1/r.p2 mu<-mean(rr.sim) ci<-quantile(rr.sim, c(0.025, 0.975)) se<-sd(rr.sim) list(rr.boot=mu, rr.ci=unname(ci), stand.err=se)

} η οποία υπολογίζει τις ίδιες τρεις παραµέτρους σχετικού κινδύνου, όπως και προηγουµένως από τις τελευταίες εντολές στο βήµα (b-1). Ακολούθως µε τις επόµενες δύο εντολές συγκρίνετε τα ανάλογα αποτελέσµατα της my.risk() bin.exp<-matrix(c(104, 11037, 189, 11034), 2, 2, byrow=t) my.risk(bin.exp) Τα αποτελέσµατα θα πρέπει να είναι παρόµοια άλλα όχι τα ίδια µε εκείνα από το βήµα (b- 1). Μπορείτε να κάνετε κάποια µικρή αλλαγή στον κώδικα της συνάρτησης my.risk() ώστε αυτή να παράγει ακριβώς τα ίδια αποτελέσµατα µε εκείνα από το βήµα (b-1); (3) (a) οκιµάστε τις ακόλουθες εντολές, προκειµένου να δείτε πως µπορείτε να δηµιουργήσετε δείγµατα από µια κατανοµή πιθανότητας χρησιµοποιώντας την οικογένεια των συναρτήσεων rxxxx() του R. Συγκεκριµένα παρατηρήστε ότι όταν κάνετε δειγµατοληψία από κατανοµές πιθανοτήτων διαφορετικές από την κανονική κατανοµή, πρέπει να καθορίσετε τις παραµέτρους που καθορίζουν αυτή την συγκεκριµένη κατανοµή ενδιαφέροντος. rnorm(6) # 6 std nrml distribution values rnorm(10, mean = 50, sd = 19) # set parameters runif(n = 10, min = 0, max = 1) #uniform distribution rpois(n = 10, lambda = 15) # Poisson distribution # toss coin 8 times using binomial distribution rbinom(n = 8, size = 1, p = 0.5) rbinom(8,1,.5) # args correct order # 18 trials, sample size 10, prob success =0.2 rbinom(18, 10, 0.2) Θεωρήστε την διωνυµική κατανοµή, και µε την κατάλληλη εντολή δηµιουργήστε 10 δείγµατα από 20 επαναλήψεις, κάθε µία µε πιθανότητα επιτυχίας 40%. (b) Χρησιµοποιήστε την κατάλληλη συνάρτηση?norm(x) του R που επιστρέφει την πυκνότητα πιθανότητας της κανονικής κατανοµής (µε µέσο όρο = 0, και τυπική απόκλιση 1 2 x / 2 = 1), δηλ. την τιµή της συνάρτησης P( x ) = e 2π πιθανότητα P(x) για x := [ -3, -2, -1, 0, 1, 2 και 3 ]. για την τιµή x, και υπολογίστε την Ακολούθως υπερθέστε ένα γράφηµα της καµπύλης της κανονικής κατανοµής χρησιµοποιώντας τη συνάρτηση curve() για το εύρος των τιµών 3 x 3. Επιπλέον, δείξτε για το διάστηµα 6 x 6 πως αλλάζει η γραφική µορφή της καµπύλης της κανονικής κατανοµής µε µέσο όρο = 1, και τυπική απόκλιση = 2, ενάντια εκείνης της κανονικής κατανοµής µε µέσο όρο = 0, και τυπική απόκλιση = 1. Χρησιµοποιώντας την κατάλληλη συνάρτηση?norm(x) της κανονικής κατανοµής υπολογίστε την αθροιστική πιθανότητα της κανονικής κατανοµής στο x=1.65, η αλλιώς την περιοχή κάτω από την καµπύλη της κανονικής κατανοµής στα αριστερά του x. Αντίστοιχα, χρησιµοποιώντας κατάλληλες R εντολές υπολογίστε µε δύο τουλάχιστον

τρόπους την πιθανότητα P(x>1.65), δηλ. την περιοχή της ουράς της δεξιάς πλευράς της καµπύλης της κανονικής κατανοµής. Χρησιµοποιώντας την κατάλληλη συνάρτηση?norm(x) της κανονικής κατανοµής υπολογίστε την αντίστοιχη τιµή x για την οποία η πιθανότητα λαµβάνει Ρ(x) αντίστοιχα την τιµή 0.95, 086, 0.34. Χρησιµοποιώντας την κατάλληλη συνάρτηση?norm(x) της κανονικής κατανοµής δηµιουργήστε ένα διάνυσµα 10 τυχαίων τιµών που ακολουθούν την κανονική κατανοµή. Εκτελέστε ακριβώς την ίδια εντολή κλήσης της συνάρτησης και παρατηρήστε ότι επιστρέφει διαφορετικούς αριθµούς κάθε επόµενη φορά που την εκτελείτε. Ακολούθως δηµιουργήστε ένα διάνυσµα 20 τυχαίων τιµών που ακολουθούν την κανονική κατανοµή µε µέση τιµή µηδέν και τυπική απόκλιση 2.2. (c) ηµιουργήστε 5 διανύσµατα τιµών, x1, x2, x3, x4, και x5, το καθένα µε 1000 τυχαίους αριθµούς που ακολουθούν την κανονική κατανοµή και ακολούθως υπολογίστε και εκτυπώστε τον πίνακα της µεταξύ τους συσχέτισης χρησιµοποιώντας την εντολή cor(cbind( )). Θα πρέπει να παρατηρείτε ότι τα εκτός της διαγωνίου στοιχεία του σχηµατιζόµενου πίνακα τιµών είναι µικρά σε µέγεθος, υποδηλώνοντας ότι δεν είναι συσχετισµένα. Επιλέξτε ένα από τα προηγούµενα 5 διανύσµατα των τυχαίων τιµών που δηµιουργήσατε, έστω το x, και υπολογίστε τη µέση τιµή και την τυπική απόκλιση των τιµών του. Ακολούθως δηµιουργήστε ένα ιστόγραµµα των τιµών του χρησιµοποιώντας τη συνάρτηση hist(). Παρατηρήστε τη σύγκλιση του ιστογράµµατος µε την καµπύλη της κανονικής κατανοµής δηµιουργώντας αντίστοιχα ιστογράµµατα χρησιµοποιώντας την εντολή hist(x, freq=false, breaks=k), όπου k να ληφθεί διαδοχικά µε τις τιµές 30, 70, και 100. Για να έχετε µια καλύτερη σύγκριση σχεδιάστε την καµπύλη της κανονικής κατανοµής στην κορυφή του εκάστοτε ιστογράµµατος χρησιµοποιώντας την εντολή curve(?norm(x), col="red", add=true). ηµιουργήστε ένα ιστόγραµµα του τετραγώνου των τιµών του προαναφερόµενου διανύσµατος των 1000 τυχαίων τιµών. Μοιάζει µε κάτι γνώριµο; Για τη διευκόλυνση της απάντησής σας, χρησιµοποιήστε τη συνάρτηση dchisq() για να σχεδιάσετε τις αντίστοιχες συναρτήσεις πυκνότητας πιθανότητας για την κατανοµή χ 2 µε τη βοήθεια των εντολών της µορφής: curve(dchisq(x,1), xlim=c(0,15),ylim=c(0,0.6),ylab="chi Square Density") curve(dchisq(x,2), col="red", lty=2,add=true) curve(dchisq(x,3), col="blue", lty=3,add=true) curve(dchisq(x,5), col="dark green", lty=4,add=true) curve(dchisq(x,10), col="brown", lty=5,add=true) legend(12,0.55, c("k=1","k=2","k=3","k=5","k=10"), col=c("black","red","blue","dark green","brown"), lty=1:5) Χρησιµοποιήστε τη βοήθεια του R αν χρειάζεστε να κατανοήσετε καλύτερα τη χρήση των παραµέτρων στις συναρτήσεις curve() και legend().τώρα γνωρίζετε αρκετά για να απαντήσετε στο προηγούµενο ερώτηµα. Αν όχι δοκιµάστε τις ακόλουθες εντολές:

hist(x^2, freq=false, breaks=200,xlim=c(0,5)) curve(dchisq(x,1),col="red",add=true) ηµιουργήστε µια µεταβλητή Q, τέτοια ώστε Q <- rnorm(1000)^2 + rnorm(1000)^2 + rnorm(1000)^2. Επιβεβαιώστε ότι η παραπάνω έκφραση δεν είναι η ίδια µε την εκχώρηση Q <- 3*rnorm(1000)^2. Εξηγήστε συνοπτικά γιατί συµβάινει αυτό. Ακολούθως ελέγξτε µε ένα κατάλληλο γράφηµα αν η µεταβλητή Q ακολουθεί την κατανοµή χ 2 µε 3 βαθµούς ελευθερίας. Εκχωρήστε αντίστοιχα σε µια µεταβλητή S, ένα διάνυσµα 10000 τιµών που να ακολουθούν την κατανοµή χ 2 µε 10 βαθµούς ελευθερίας, χρησιµοποιώντας αυτή τη φορά τη συνάρτηση rchisq(). Ακολούθως δηµιουργήστε ένα κατάλληλο γράφηµα µε το ιστόγραµµα των τιµών της µεταβλητής S σε συνδυασµό µε την αντίστοιχη καµπύλη της κατανοµής χ 2. Στη συνέχεια, χρησιµοποιήστε τις κατάλληλες συναρτήσεις της κατανοµής χ 2 για να υπολογίσετε την πιθανότητα που αντιστοιχεί στην τιµή χ 2 =21.78 και df=10, και αντίστοιχα την τιµή χ 2 που αντιστοιχεί στην πιθανότητα 5% και df=10. (d) Χρησιµοποιήστε το ακόλουθο κοµµάτι κώδικα R για να απεικονίσετε τις αντίστοιχες καµπύλες πυκνότητας πιθανότητας για την κατανοµή Student µε διάφορους βαθµούς ελευθερίας. curve(dt(x,1),xlim=c(-5,5),ylim=c(0,0.4),ylab="student's t Density") curve(dt(x,2),col="red",lty=2,add=true) curve(dt(x,5),col="blue",lty=3,add=true) curve(dt(x,20),col="dark green",lty=4,add=true) curve(dnorm(x),col="brown",lty=5,add=true) legend(2,0.38,c("k=1","k=2","k=5","k=20","normal curve"), col=c("black","red","blue","dark green","brown"),lty=1:5) ηµιουργήστε δύο ανεξάρτητες τυχαίες µεταβλητές: την Ζ που εκφράζεται µε ένα διάνυσµα 10000 τιµών που ακολουθούν την κανονική κατανοµή και την W που εκφράζεται µε ένα διάνυσµα 10000 τιµών που ακολουθούν την κατανοµή χ 2 µε 5 βαθµούς ελευθερίας. Από αυτές δηµιουργήστε την τυχαία µεταβλητή Τ = Ζ / (W/5) 1/2 και ελέγξτε µε ένα κατάλληλο γράφηµα αν αυτή ακολουθεί την κατανοµή Student. Για τη διευκόλυνσή σας, συνιστάται να χρησιµοποιήσετε τις συναρτήσεις hist() και curve() µε κατάλληλο συνδυασµό παραµέτρων εισόδου, π.χ. breaks, seq, κ.ά. Συµβουλευτείτε τη βοήθεια του R για περισσότερες λεπτοµέρειες. Χρησιµοποιώντας την κατάλληλη συνάρτηση?t() δηµιουργήστε ένα διάνυσµα 10000 τιµών τυχαίων αριθµών που ακολουθούν την κανονική κατανοµή Student και στη συνέχεια κάντε ένα ιστόγραµµα. Τοποθετήστε την καµπύλη πυκνότητας πιθανότητας της κατανοµής t στο ιστόγραµµα και ελέγξτε ότι το ιστόγραµµα ταιριάζει µε την καµπύλη πυκνότητας πιθανότητας. Στη συνέχεια, χρησιµοποιήστε τις κατάλληλες συναρτήσεις για να

υπολογίσετε την πιθανότητα που αντιστοιχεί στην τιµή t=1.5 και df=4, και αντίστοιχα την τιµή t που αντιστοιχεί στην πιθανότητα 5% και df=4. Μέρος Γ Περισσότερα γραφικά για κατανοµές πιθανότητας ηµιουργήστε στο R, για κάθε µια από τις παρακάτω περιπτώσεις, αντίστοιχα τυχαία δείγµατα για τις αναφερόµενες γνωστές κατανοµές πιθανοτήτων. (α) - Κανονική κατανοµή ~ Ν(µ,σ 2 ) ηµιουργήστε δείγµα 100 στοιχείων από την κατανοµή ~ Ν(0,1). ώστε ένα γενικό γράφηµα των παρατηρήσεων του δείγµατος χρησιµοποιώντας τη συνάρτηση plot() και σχεδιάστε το ιστόγραµµα τους. Ελέγξτε ότι οι παρατηρήσεις που προέκυψαν είναι από την κανονική κατανοµή ~N(0,1) χρησιµοποιώντας ένα quantile-quantile plot (QQ plot) µέσω της συνάρτησης stat_qq() από το πακέτο ggplot2 ή της ενσωµατωµένης συνάρτησης qqnorm(). ηµιουργήστε ένα δείγµα µεγέθους 1000000 στοιχείων από την κανονική κατανοµή ~ Ν(0,1) και ακολούθως ένα δείγµα µεγέθους 1500000 στοιχείων από την κανονική κατανοµή ~ Ν(3,1). Ελέγξετε το µέσο όρο και τη διακύµανση κάθε δείγµατος. Στη συνέχεια σχεδιάστε το κοινό τους ιστόγραµµα µε πλάτος διαστήµατος στη βάση του ιστού (binwidth) 0.25. Παρατηρήστε πόσες περιοχές συγκέντρωσης των τιµών υπάρχουν στο γράφηµα. ώστε ένα γράφηµα της πυκνότητας πιθανότητας του συνδυασµένου δείγµατος χρησιµοποιώντας τη συνάρτηση geom_density(), και δείξτε εάν η πυκνότητα σχετίζεται µε το προηγούµενο ιστόγραµµα. Προσπαθήστε να φτιάξετε ένα δείγµα 3000000 στοιχείων από το συνδυασµό δύο δειγµάτων προερχόµενα από κανονικές κατανοµές για τις οποίες οι µέσες τιµές τους απέχουν µεταξύ τους κατά 1 και η διακύµανση της δεύτερης κατανοµής να είναι διπλάσια από τη διακύµανση της πρώτης. Το πρώτο δείγµα να έχει πλήθος στοιχείων διπλάσιο από το δεύτερο. Σχεδιάστε τα ιστόγραµµα του 1 ου, του 2 ου και του συνδυασµένου δείγµατος στους ίδιους άξονες (δηλ. στο ίδιο γράφηµα). Ακολούθως κάντε το ίδιο µε ένα γράφηµα της πυκνότητας πιθανότητας του 1 ου και του 2 ου δείγµατος. ηµιουργήστε ένα δείγµα µεγέθους 5815 στοιχείων από την κανονική κατανοµή ~ Ν(0.56,0.08). Για να κατανοήσετε καλύτερα τη διάκριση µεταξύ ενός πληθυσµού και ενός δείγµατος, υποθέστε (εσφαλµένα) ότι ο πληθυσµός που ενδιαφέρει είναι το συγκεκριµένο σύνολο δεδοµένων από τα 5815 στοιχεία. Υπολογίστε τον µέσο όρο και τη διακύµανση του εν λόγω πληθυσµού. Στην πράξη, είναι συνήθως αδύνατο και χρονοβόρο να συλλέξουµε δεδοµένα από το σύνολο ενός πληθυσµού ενδιαφέροντος, και βασιζόµαστε σε µικρότερα δείγµατα το οποία επιλέγονται τυχαία από τον αρχικό πληθυσµό. Προς τούτο, κάνοντας χρήση της συνάρτησης sample() εξάγετε ένα δείγµα 100 στοιχείων από τον προηγούµενο πληθυσµό και υπολογίστε τον µέσο όρο και τη διακύµανση του δείγµατος. Ποιες είναι οι τυχόν διαφορές µεταξύ των µέσων όρων, και αντίστοιχα των διακυµάνσεων, του πληθυσµού και του δείγµατος; Χρησιµοποιώντας αυτό το δείγµα, υπολογίστε ένα διάστηµα (mean of sample)±2(standard deviation of the sample) που περιέχει ένα τυχαίο στοιχείο του πληθυσµού µε πιθανότητα

95%. ιερευνήστε εάν το εν λόγω διάστηµα περιέχει τον πληθυσµιακό µέσο. Επαναλάβατε την ίδια διαδικασία µε ένα µεγαλύτερο δείγµα 500 στοιχείων από τον προηγούµενο πληθυσµό και διερευνήστε εάν υπάρχει ένδειξη ότι αν το δείγµα γίνει µεγαλύτερο, η κατανοµή του µέσου όρου των δειγµάτων είναι πιο κοντά σε µια κανονική κατανοµή. Αντί του ενός δείγµατος από τον πληθυσµό αποτελούµενο από 100 στοιχεία, ως επόµενο βήµα δηµιουργήστε 200 τέτοια δείγµατα και διερευνήστε τι ποσοστό από τα διαστήµατα (mean of sample_i) ± 2(standard deviation of the sample_i) αναµένεται να περιέχουν τον πληθυσµιακό µέσο. Βοηθητική υποσηµείωση: θα χρειαστεί να χρησιµοποιήσετε ένα από τα λεγόµενα for-loop εντολών της µορφής The for-loop (for example): for (var in vector){ statements } όπου σε κάθε βήµα του for-loop, θα δηµιουργείτε ένα νέο δείγµα από τον πληθυσµό µε 100 στοιχεία το καθένα. (β) ιωνυµική κατανοµή ~ (n,p) Εκτελέστε τις εντολές στο R script simple-binomial.r προκειµένου να πάρετε µια πρώτη εικόνα για τα χαρακτηριστικά της διωνυµικής κατανοµής και τη χρήση βασικών εντολών που σχετίζονται µε τη χρήση της. ηµιουργήστε δείγµα 100 στοιχείων από διωνυµική κατανοµή n=7 δοκιµών και πιθανότητα 0.3. Πως συγκρίνονται η µέση τιµή και τη διακύµανση του δείγµατος µε τις αντίστοιχες τιµές δείγµατος 10000 στοιχείων από την ίδια διωνυµική κατανοµή. Καταχωρίστε 2000 διωνυµικούς τυχαίους αριθµούς µε τις παραµέτρους n = 40 και p = 0.3 σε ένα διάνυσµα U. Συγκρίνετε τη θεωρητική αναµενόµενη τιµή και τη διακύµανση της κατανοµής µε τη µέση τιµή και τη διακύµανση του δείγµατος. Αντίστοιχα, συγκρίνετε µε ένα γράφηµα της θεωρητικής κατανοµή πιθανότητας. Χρησιµοποιήστε τη συνάρτηση qqnorm() για να σχεδιάσετε ποσοτικές διαφορές του δείγµατος σε σχέση µε τα θεωρητικά (πληθυσµιακά) ποσοτικά µεγέθη της διωνυµικής κατανοµής. Υποθέστε ότι το διάνυσµα V είναι µια δυωνυµική τυχαία µεταβλητή µε µέση τιµή 10 και διακύµανση 5. Να βρεθούν οι παράµετροι n και p της διωνυµικής κατανοµής από την οποία προέρχονται οι τιµές του. Στη συνέχεια, προσοµοιώστε 10000 τιµές του V και υπολογίστε το µέσο όρο και διακύµανση τους, και συγκρίνετε µε τις θεωρητικές τιµές τους. Θεωρήστε ότι οι τυχαίες µεταβλητές X1, X2, X3 ακολουθούν κατανοµή Poisson µε άγνωστη παράµετρο λ. Να υπολογιστεί η τιµή λ για την οποία η πιθανότητα P(X1=2) P(X2=3) P(X3=5) παίρνει τη µεγαλύτερη δυνατή τιµή, και ακολούθως να υπολογιστεί η εν λόγω πιθανότητα. Εάν µια τυχαία µεταβλητή X ακολουθεί την κατανοµή Poisson(λ), υπολογίστε για ποια τιµή του λ η πιθανότητα P(X = 6) παίρνει τη µεγαλύτερη δυνατή τιµή; (γ) Κατανοµή Poisson ~ (λ) Εκτελέστε τις εντολές στο R script simple-poisson.r προκειµένου να πάρετε µια πρώτη εικόνα για τα χαρακτηριστικά της κατανοµής Poisson και τη χρήση βασικών εντολών που σχετίζονται µε τη χρήση της.

ηµιουργήστε δείγµα 100 στοιχείων από κατανοµή Poisson µε λ = 3 και υπολογίστε το µέσο όρο και διακύµανση τους. Πως συγκρίνονται οι εν λόγω τιµές µε τις αντίστοιχες θεωρητικές τιµές τους. Υποθέστε ότι σε διάνυσµα V εκχωρούµε 100 ανεξάρτητες τιµές προερχόµενες από µια κατανοµή Poisson(λ=0.7) και να σχεδιαστεί ένα ιστόγραµµα και ένα bar graph (barplot) των εν λόγω τιµών. Στη συνέχεια, προσοµοιώστε 10000 τιµές του V και υπολογίστε το µέσο όρο και διακύµανση τους, και συγκρίνετε µε τις θεωρητικές τιµές τους. ώστε ένα αντίστοιχο bar graph της κατανοµής πιθανότητας της τ.µ. V. Θεωρείστε µια κατανοµή Poisson µε αναµενόµενη τιµή 6. Σχεδιάστε την συνάρτηση πυκνότητας πιθανότητας της σε συνδυασµό µε την καµπύλη της πυκνότητας πιθανότητας από την κανονική κατανοµή. Ακολούθως δηµιουργήστε ένα δείγµα µε µεγάλο πλήθος στοιχείων (π.χ. 10 6 ) της κατανοµής Poisson και δηµιουργήστε ένα ιστόγραµµα µαζί µε την αντίστοιχη καµπύλη της κανονικής κατανοµής στο ίδιο γράφηµα. Αντίστοιχα, χρησιµοποιώντας τη διωνυµική κατανοµή, διερευνήστε µε ένα αντίστοιχο γράφηµα πόσο καλά προσαρµόζεται στα προηγούµενα δεδοµένα ένα δείγµα 600 στοιχείων µε πιθανότητα εµφάνισης 0.01. Προκειµένου να επιβεβαιώσετε ότι η κατανοµή Poison µε παράµετρο λ προκύπτει ως µια προσέγγιση της διωνυµικής κατανοµής µε παραµέτρους (n, p) για τα µεγάλα n και τα µικρά p τέτοια ώστε λ = n*p, συγκρίνετε αριθµητικά και µε ένα γράφηµα, τη διωνυµική κατανοµή µε παραµέτρους n=20 και p=0.1 και τη κατανοµή Poisson µε λ=2.