ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο
Μετασχηματισμός Δεδομένων a. από τα Data demo.sav επιλέγουμε τη στήλη Income b. δημιουργούμε νέο Data Set μόνο με αυτήν τη στήλη c. Click Transform d. Compute Variable e. Επιλέγω Target Value TransIncome f. στην Numeric Expression εισάγω μετασχηματισμό εδώ y i =2*(x i +4) g. μπορώ να δω τη διαφορά ανάμεσα στα μέτρα θέσης και διασποράς της αρχικής και της νέα μεταβλητής ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 2
Μετασχηματισμός Δεδομένων μέτρα θέσης και διασποράς Παρατηρήστε ποια μέτρα επηρεάζονται από τον μετασχηματισμό και με ποιον τρόπο ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 3
Μετασχηματισμός Δεδομένων μέτρα λοξότητας και κυρτότητας ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 4
Μετασχηματισμός Δεδομένων Ενσωματωμένες συναρτήσεις στο SPSS Για να μετασχηματίσουμε δεδομένα ή να δημιουργήσουμε νέα, έχουμε πρόσβαση σε μια πληθώρα ενσωματωμένων συναρτήσεων a. έχοντας ανοιχτό ένα Data Set (δίνοντας απλώς όνομα σε μια μεταβλητή) b. Click Transform c. Compute Variable d. εμφανίζονται οι ενσωματωμένες συναρτήσεις στο SPSS ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 5
Μετασχηματισμός Δεδομένων Ενσωματωμένες συναρτήσεις στο SPSS e. εμφανίζονται οι ενσωματωμένες συναρτήσεις στο SPSS σε διάφορες ομάδες συναρτήσεων Function Group ανάλογα με τη λειτουργία που εκτελούν f. επιλέγοντας ένα συγκεκριμένο Function Group εμφανίζονται στο υπομενού Functions and Special Variables όλες οι συναρτήσεις που αυτό περιέχει ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 6
Μετασχηματισμός Δεδομένων Ενσωματωμένες συναρτήσεις στο SPSS έτσι, για τις κυριότερες κατανομές, βρίσκουμε στο CDF & Noncentral CDF τις αθροιστικές συναρτήσεις κατανομών Cdf.κατανομή(x,παράμετροι)= F(x)=P(X x) όπου Χ~ κατανομή PDF & Noncentral PDF τις συναρτήσεις πιθανότητας (διακριτών) και τις συναρτήσεις πυκνότητας (συνεχών, κεντρικών και μη) κατανομών Pdf.κατανομή(x,παράμετροι)= P(X =x) Χ~ κατανομή (διακριτή) Pdf.κατανομή(x,παράμετροι)= f X (x) Χ~ κατανομή (συνεχής) Inverse DF τις αντίστροφες συναρτήσεις των αθροιστικών συναρτήσεων κατανομών εάν P(X x)=y τότε Ιdf.κατανομή(y,παράμετροι)=x Χ~ κατανομή Random Numbers γεννήτριες συναρτήσεις τυχαίων αριθμών (παρατηρήσεων) Rv.κατανομή(παράμετροι) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 7
Επανάληψη τυχαίων πειραμάτων για τον υπολογισμό πιθανότητας ενδεχομένου V Pr(E)= lim N N N Εφαρμογή του ορισμού του von Mises Ν: το πλήθος των επαναλήψεων του πειράματος V NΕ : η συχνότητα εμφάνισης του ενδεχομένου Ε στις Ν επαναλήψεις Παράδειγμα 1 Τυχαίο πείραμα: επιλογή αριθμού από τους 1, 2, 3, 4 Ε: εμφάνιση του αριθμού 1 Παράδειγμα 2 (το παράδοξο των κουτιών του Bertrand) Τυχαίο πείραμα: επιλογή μιας κάρτα από τρεις διαφορετικές Κ 1 : μία όψη κόκκινη, μία όψη λευκή Κ 2 : δύο όψεις λευκές Κ 3 : δύο όψεις κόκκινες Εκείνος που επιλέγει κάρτα, όταν βρει λευκή όψη, κερδίζει εάν η άλλη όψη είναι κόκκινη. Ε: εκείνος που επιλέγει κάρτα κερδίζει ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 8 E
Υπολογισμός πιθανότητας ενδεχομένου χρήση του ορίου της σχετικής συχνότητας a. Εισάγουμε το Ν b. Εκτελούμε το πείραμα c. Εισάγουμε το V Ε N d. Υπολογίζουμε την Pr με μετασχηματισμό ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 9
Γραφικές παραστάσεις στο SPSS a. επιλέγουμε Simple summary of group of cases b. Define c. Category Axis επιλέγουμε N d. μετακινούμε το Pr στο Variable e. στο Change Statistic επιλέγουμε Sum of values f. Continue g. Ok οι τιμές στον Category Axis είναι ισαπέχουσες ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 10
Γραφικές παραστάσεις οι τιμές στον X δεν είναι κατ ανάγκη ισαπέχουσες ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 11
Προσομοίωση στον υπολογιστή το παράδοξο του Bertrand Από το θεώρημα Ολικής Πιθανότητας P(E)=P(E Κ 1 )P(Κ 1 )+P(E Κ 2 )P(Κ 2 )+P(E Κ 3 )P(Κ 3 ) =0.5x1/3+0x1/3+0x1/3=1/6=0.1667 ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 12
Το παράδοξο του Bertrand a. Εκχωρώ τιμή για να προσδιορίσω το μέγεθος του δείγματος b. Click Transform c. Compute Variable d. Επιλέγω Target Variable e. Function group Random numbers f. Rv.Uniform (1,4) παράγεται τ.δ. παρατηρήσεων στο διάστημα (1,4) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 13
Το παράδοξο του Bertrand a. Επιλέγω Target Variable b. Function group Arithmetic c. Trunc(kapta) επειδή εμείς θέλουμε μόνο τις τιμές {1,2,3} με πιθανότητα 1/3 εκάστη, αυτές είναι οι τρεις διαφορετικές κάρτες, κάνουμε τον μετασχηματισμό (1,2) 1 [2,3) 2 [3,4) 3 ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 14
Το παράδοξο του Bertrand a. Εάν kapta=1 πρέπει να προσδιορίσω την πλευρά b. Επιλέγω Target Variable c. If d. Include if Case satisfies condition e. γράφετε τη συνθήκη kapta=1 Continue f. γράφετε την Νumeric Εxpression RV.Bernoulli(0.5) το 0 αντιστοιχεί σε επιλογή της Κόκκινης όψης το 1 αντιστοιχεί σε επιλογή της Λευκής όψης g. Ok ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 15
Το παράδοξο του Bertrand a. Εάν kapta=2 ή 3 η πλευρά προσδιορίζεται πλήρως b. Επιλέγω Target Variable c. If d. Include if Case satisfies condition e. γράφετε τη συνθήκη kapta=2 (ή 3) f. γράφετε την numeric expression kapta g. Ok Continue ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 16
Το παράδοξο του Bertrand a. αντιστοίχηση των τιμών της μεταβλητής kapta στα στοιχειώδη, μη ισοπίθανα, ενδεχόμενα b. δημιουργία ραβδογράμματος για την εκτίμηση των πιθανοτήτων εμφάνισης των ενδεχομένων αυτών ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 17
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή Παράδειγμα 3 Έστω ότι μια ομάδα για την παρακολούθηση ενός εργαστηρίου αποτελείται από 16 φοιτητές και γνωρίζουμε ότι η πιθανότητα κάθε φοιτητής να εξεταστεί επιτυχώς στο εργαστήριο είναι 40%. Ε 1 : το πολύ 10 φοιτητές εξετάζονται επιτυχώς Ε 2 : ακριβώς 10 φοιτητές εξετάζονται επιτυχώς Ε 3 : περισσότεροι από 5 φοιτητές εξετάζονται επιτυχώς Ε 4 : το πολύ 10 φοιτητές εξετάζονται επιτυχώς, όταν τουλάχιστον 6 εξετάστηκαν επιτυχώς Εάν η τ.μ. Χ παριστά τον αριθμό των φοιτητών που εξετάστηκαν επιτυχώς, τότε Χ~ Binomial(n=16,p=0.4) και για την επίλυση του παραδείγματος πρέπει να υπολογιστούν οι πιθανότητες: P(Ε 1 )=P(X 10) P(Ε 2 )=P(X = 10) P(Ε 4 )=P(X 10 X 6)=P(6 X 10)/P(X 6)=P(5<X 10)/(1- P(X< 6)) =(P(X 10)- P(X 5))/(1- P(X 5)) P(Ε 3 )=P(X > 5)=1- P(X 5) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 18
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή a. σε ένα νέο Data Set βάζουμε στη στήλη x τις τιμές 0, 1,,16 που είναι οι δυνατές τιμές της τ.μ. Χ b. για Target Variable επιλέγω cdfbin_16_0.4 c. για Function group επιλέγουμε CDF & Noncentral CDF d. για Functions and Special Variables επιλέγουμε CDF.BINOM(x,16,0.4) και έτσι υπολογίζουμε την P(X x) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 19
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή e. για Target Variable επιλέγω pdfbin_16_0.4 f. για Function group επιλέγουμε PDF & Noncentral PDF g. για Functions and Special Variables επιλέγουμε PDF.BINOM(x,16,0.4) και έτσι υπολογίζουμε την P(X=x) χρησιμοποιώ ακρίβεια 4 δεκαδικών Variable View > Decimals > 4 ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 20
Υπολογισμός Πιθανοτήτων Διωνυμική Κατανομή οπότε παίρνουμε τα εξής αποτελέσματα P(X 5)=0.3288 P(X 10)=0.9809 P(X =10)=0.0392 και άρα P(Ε 1 )= 0.9809 P(Ε 2 )= 0.0392 P(Ε 3 )=0.6712 P(Ε 4 )=0.9715 ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 21
Ραβδογράμματα της συνάρτησης πιθανότητας και της αθροιστικής συνάρτησης κατανομής της Διωνυμικής για να σχεδιάσουμε το ραβδόγραμμα της συνάρτησης πιθανότητας ή της α.σ.κ. a. Click Graphs > Legacy Dialogs > Bar Charts b. επιλέγουμε Simple, click define c. επιλέγουμε Category Axis x d. Επιλέγουμε Bars Represent Other statistic (Mean είτε του pdfbin_16_04 είτε του cdfbin_16_04) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 2ο 22