ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο
Μετασχηματισμός Δεδομένων a. από τα Data demo.sav επιλέγουμε τη στήλη Income b. δημιουργούμε νέο Data Set μόνο με αυτήν τη στήλη c. Click Transform d. Compute Variable e. Επιλέγω Target Value TransIncome f. στην Numeric Expression εισάγω μετασχηματισμό εδώ y i =2*(x i +4) g. μπορώ να δω τη διαφορά ανάμεσα στα μέτρα θέσης και διασποράς της αρχικής και της νέα μεταβλητής ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 2
Μετασχηματισμός Δεδομένων μέτρα θέσης και διασποράς Παρατηρήστε ποια μέτρα επηρεάζονται από τον μετασχηματισμό και με ποιον τρόπο ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 3
Μετασχηματισμός Δεδομένων Ενσωματωμένες συναρτήσεις στο SPSS Για να μετασχηματίσουμε δεδομένα ή να δημιουργήσουμε νέα, έχουμε πρόσβαση σε μια πληθώρα ενσωματωμένων συναρτήσεων a. έχοντας ανοιχτό ένα Data Set (δίνοντας απλώς όνομα σε μια μεταβλητή) b. Click Transform c. Compute Variable d. εμφανίζονται οι ενσωματωμένες συναρτήσεις στο SPSS ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 4
Μετασχηματισμός Δεδομένων Ενσωματωμένες συναρτήσεις στο SPSS d. εμφανίζονται οι ενσωματωμένες συναρτήσεις στο SPSS σε διάφορες ομάδες συναρτήσεων Function Group ανάλογα με τη λειτουργία που εκτελούν e. επιλέγοντας ένα συγκεκριμένο Function Group εμφανίζονται στο υπομενού Functions and Special Variables όλες οι συναρτήσεις που αυτό περιέχει ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 5
Μετασχηματισμός Δεδομένων Ενσωματωμένες συναρτήσεις στο SPSS έτσι, για τις κυριότερες κατανομές, βρίσκουμε στο CDF & Noncentral CDF τις αθροιστικές συναρτήσεις κατανομών Cdf.κατανομή(x,παράμετροι)= F(x)=P(X x) όπου Χ~ κατανομή PDF & Noncentral PDF τις συναρτήσεις πιθανότητας (διακριτών) και τις συναρτήσεις πυκνότητας (συνεχών, κεντρικών και μη) κατανομών Pdf.κατανομή(x,παράμετροι)= P(X =x) Χ~ κατανομή (διακριτή) Pdf.κατανομή(x,παράμετροι)= f X (x) Χ~ κατανομή (συνεχής) Inverse DF τις αντίστροφες συναρτήσεις των αθροιστικών συναρτήσεων κατανομών εάν P(X x)=y τότε Ιdf.κατανομή(y,παράμετροι)=x Χ~ κατανομή Random Numbers γεννήτριες συναρτήσεις τυχαίων αριθμών (παρατηρήσεων) Rv.κατανομή(παράμετροι) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 6
Επανάληψη τυχαίων πειραμάτων για τον υπολογισμό πιθανότητας ενδεχομένου V Pr(E)= lim N N N Εφαρμογή του ορισμού του von Mises Ν: το πλήθος των επαναλήψεων του πειράματος V NΕ : η συχνότητα εμφάνισης του ενδεχομένου Ε στις Ν επαναλήψεις Παράδειγμα 1 Τυχαίο πείραμα: επιλογή αριθμού από τους 1, 2, 3, 4 Ε: εμφάνιση του αριθμού 1 Παράδειγμα 2 (το παράδοξο των κουτιών του Bertrand) Τυχαίο πείραμα: επιλογή μιας κάρτα από τρεις διαφορετικές Κ 1 : μία όψη κόκκινη, μία όψη λευκή Κ 2 : δύο όψεις λευκές Κ 3 : δύο όψεις κόκκινες Εκείνος που επιλέγει κάρτα, όταν βρει λευκή όψη, κερδίζει εάν η άλλη όψη είναι κόκκινη. Ε: εκείνος που επιλέγει κάρτα κερδίζει ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 7 E
Υπολογισμός πιθανότητας ενδεχομένου χρήση του ορίου της σχετικής συχνότητας a. Εισάγουμε το Ν b. Εκτελούμε το πείραμα c. Εισάγουμε το V Ε N d. Υπολογίζουμε την Pr με μετασχηματισμό ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 8
Γραφικές παραστάσεις ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 9
Γραφικές παραστάσεις στο SPSS 19 (interactive) a. επιλέγουμε Simple summary of group of cases b. Define c. Category Axis επιλέγουμε N d. μετακινούμε το Pr στο Variable e. στο Change Statistic επιλέγουμε Sum of values f. Continue g. Ok ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 10
Προσομοίωση στον υπολογιστή το παράδοξο του Bertrand ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 11
Το παράδοξο του Bertrand a. Εκχωρώ τιμή για να προσδιορίσω το μέγεθος του δείγματος b. Click Transform c. Compute Variable d. Επιλέγω Target Variable e. Function group Random numbers f. Rv.Uniform (1,4) παράγεται τ.δ. παρατηρήσεων στο διάστημα (1,4) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 12
Το παράδοξο του Bertrand a. Επιλέγω Target Variable b. Function group Arithmetic c. Trunc(kapta) επειδή εμείς θέλουμε μόνο τις τιμές {1,2,3} με πιθανότητα 1/3 εκάστη, αυτές είναι οι τρεις διαφορετικές κάρτες, κάνουμε τον μετασχηματισμό (1,2) 1 (2,3) 2 (3,4) 3 ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 13
Το παράδοξο του Bertrand a. Εάν kapta=1 πρέπει να προσδιορίσω την πλευρά b. Επιλέγω Target Variable c. If d. Include if Case satisfies condition e. γράφετε τη συνθήκη kapta=1 Continue f. γράφετε την Νumeric Εxpression Bernoulli(0.5) το 0 αντιστοιχεί σε επιλογή της Κόκκινης όψης το 1 αντιστοιχεί σε επιλογή της Λευκής όψης g. Ok ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 14
Το παράδοξο του Bertrand a. Εάν kapta=2 ή 3 η πλευρά προσδιορίζεται πλήρως b. Επιλέγω Target Variable c. If d. Include if Case satisfies condition e. γράφετε τη συνθήκη kapta=2 (ή 3) f. γράφετε την numeric expression kapta g. Ok Continue ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 15
Το παράδοξο του Bertrand a. αντιστοίχηση των τιμών της μεταβλητής kapta στα στοιχειώδη ενδεχόμενα b. δημιουργία ραβδογράμματος για την εκτίμηση των πιθανοτήτων εμφάνισης των ενδεχομένων αυτών ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 16
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή Παράδειγμα 3 Έστω ότι μια ομάδα για την παρακολούθηση ενός εργαστηρίου αποτελείται από 16 φοιτητές και γνωρίζουμε ότι η πιθανότητα κάθε φοιτητής να εξεταστεί επιτυχώς στο εργαστήριο είναι 40%. Ε 1 : το πολύ 10 φοιτητές εξετάζονται επιτυχώς Ε 2 : ακριβώς 10 φοιτητές εξετάζονται επιτυχώς Ε 3 : περισσότεροι από 5 φοιτητές εξετάζονται επιτυχώς Ε 4 : το πολύ 10 φοιτητές εξετάζονται επιτυχώς, όταν τουλάχιστον 6 εξετάστηκαν επιτυχώς Εάν η τ.μ. Χ παριστά τον αριθμό των φοιτητών που εξετάστηκαν επιτυχώς, τότε Χ~ Binomial(n=16,p=0.4) και για την επίλυση του παραδείγματος πρέπει να υπολογιστούν οι πιθανότητες: P(Ε 1 )=P(X 10) P(Ε 2 )=P(X = 10) P(Ε 4 )=P(X 10 X 6)=P(6 X 10)/P(X 6)=P(5<X 10)/(1- P(X< 6)) =(P(X 10)- P(X 5))/(1- P(X 5)) P(Ε 3 )=P(X > 5)=1- P(X 5) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 17
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή a. σε ένα νέο Data Set βάζουμε στη στήλη x τις τιμές 5, 10 που μας ενδιαφέρουν εδώ b. για Target Variable επιλέγω pdfbin_16_0.4 c. για Function group επιλέγουμε CDF & Noncentral CDF d. για Functions and Special Variables επιλέγουμε CDF.BINOM(x,16,0.4) και έτσι υπολογίζουμε την P(X x) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 18
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή e. για Target Variable επιλέγω pdfbin_16_0.4 f. για Function group επιλέγουμε PDF & Noncentral PDF g. για Functions and Special Variables επιλέγουμε PDF.BINOM(x,16,0.4) και έτσι υπολογίζουμε την P(X=x) χρησιμοποιώ ακρίβεια 4 δεκαδικών Variable View > Decimals > 4 ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 19
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή οπότε παίρνουμε τα εξής αποτελέσματα P(X 5)=0.3288 P(X 10)=0.9809 P(X =10)=0.0392 και άρα P(Ε 1 )= 0.9809 P(Ε 2 )= 0.0392 P(Ε 3 )=0.6712 P(Ε 4 )=0.9715 ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 20
Προσομοίωση στον υπολογιστή πιθανότητες Διωνυμικής κατανομής Παράδειγμα 4 Σε 10 διαδοχικές ρίψεις ενός νομίσματος μας ενδιαφέρει πόσες φορές, Χ, θα εμφανιστεί η διεθνής όψη του νομίσματος. Επαναλαμβάνουμε το τυχαίο αυτό πείραμα, με τη βοήθεια του SPSS, πολλές φορές για να μελετήσουμε τη συχνότητα με την οποία εμφανίζονται οι δυνατές τιμές του χαρακτηριστικού Χ που μελετούμε (εδώ οι τιμές αυτές είναι S={0,1,2,,10}) και στη συνέχεια θα εκτιμήσουμε τις αντίστοιχες πιθανότητες. Όσες περισσότερες φορές επαναλάβουμε το πείραμα τόσο καλύτερη εκτίμηση των πιθανοτήτων θα πάρουμε. Στο παράδειγμα Χ~ Binomial(n=10,p=0.5) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 21
Προσομοίωση στον υπολογιστή πιθανότητες Διωνυμικής κατανομής a. σε ένα νέο Data Set βάζουμε στην 1 η στήλη στο 100 ο κελί (για να επαναλάβουμε το πείραμα 100 φορές) έναν αριθμό b. Transform > Compute Variable c. επιλέγω Target Variable Heads d. για Function group επιλέγουμε Random Numbers e. για Functions and Special Variables επιλέγουμε RV.BINOM(10,0.5) και έτσι δημιουργούμε 100 τυχαίες παρατηρήσεις ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 22
Προσομοίωση στον υπολογιστή πιθανότητες Διωνυμικής κατανομής για να σχεδιάσουμε το ραβδόγραμμα των συχνοτήτων a. Click Graphs > Legacy Dialogs > Bar Charts b. επιλέγουμε Simple, click define c. επιλέγουμε Category Axis Ηeads d. Επιλέγουμε Bars Represent % of cases τα ραβδογράμματα προέρχονται από 100 και 200 αντίστοιχα επαναλήψεις του πειράματος ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 23
Ποιες είναι οι πραγματικές πιθανότητες της Διωνυμικής; αυτές τις παίρνουμε από τη συνάρτηση PDF.BINOM(x,10,0.5) όπου στο x περιέχονται όλες οι δυνατές τιμές της τ.μ. Χ a. Transform > Compute Variable b. επιλέγω Target Variable Heads c. για Function group επιλέγουμε PDF & Noncentral PDF d. για Functions and Special Variables επιλέγουμε PDF.BINOM(x,10,0.5) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 24
Ποιες είναι οι πραγματικές πιθανότητες της Διωνυμικής; για να πάρουμε αντίστοιχα ραβδογράμματα πρέπει να «σταθμίσω» το x με τις αντίστοιχες πιθανότητες a. Data > Weight Cases b. επιλέγω Weight Cases by Heads c. Ok d. κάνουμε το ραβδόγραμμα του x ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 25
Προσομοίωση στον υπολογιστή πιθανότητες Διωνυμικής Παρατηρούμε τη διαφορά ανάμεσα στις πραγματικές τιμές των πιθανοτήτων και σε αυτές που προκύπτουν από την προσομοίωση. Η διαφορά αυτή μειώνεται όσο αυξάνεται το μέγεθος του δείγματος (1000, 10000 παρατηρήσεις) Ακριβείς πιθανότητες κατανομής Προσομοίωση: 200 παρατηρήσεις ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 26