Περιεχόμενα Μέρος 1 Τα βασικά του SPSS 1 Εισαγωγή 23 Σχετικά με το βιβλίο 24 Τα βασικά του SPSS 24 Περιγραφή δεδομένων 25 Έλεγχος υποθέσεων 25 Εξέταση σχέσεων 26 Ας ξεκινήσουμε 26 2 Εισαγωγή στο SPSS 27 Εκκίνηση του SPSS 27 Η βοήθεια είναι πάντα διαθέσιμη 29 Αντιγραφή των αρχείων δεδομένων 29 Άνοιγμα αρχείου δεδομένων 30 Στατιστικές διαδικασίες 33 Το παράθυρο Viewer 36 Τα αντικείμενα του παραθύρου Viewer 39 Το παράθυρο Data Editor 43 Καταχώριση μη αριθμητικών δεδομένων 45 Καθαρισμός του παραθύρου Data Editor χωρίς αποθήκευση των αλλαγών 46
8 Το ηλεκτρονικό εκπαιδευτικό πρόγραμμα του SPSS 47 Η γραμμή εργαλείων του SPSS 47 Το σύστημα Βοήθειας του SPSS 49 Θεματική βοήθεια 51 Τι ακολουθεί; 52 3 Πηγές δεδομένων 53 Γνωρίστε τα δεδομένα σας 53 Τα δεδομένα της έρευνας 54 Υποβολή των ερωτήσεων 54 Μέτρηση του χρόνου 55 Επιλογή συμμετεχόντων 57 Επιλογή ενός δείγματος 58 General Social Survey 60 Τυχαία επιλογή αριθμού τηλεφώνου 60 Έρευνες στο Διαδίκτυο 61 Σχεδιασμός πειραμάτων 62 Τυχαία ανάθεση 63 Ελαχιστοποίηση της μεροληψίας 64 Περίληψη 65 Τι ακολουθεί; 65 Ασκήσεις 66 Μέρος 2 Περιγραφή των δεδομένων 4 Καταμέτρηση αποκρίσεων 71 Περιγραφή των μεταβλητών 72 Ένας απλός πίνακας συχνοτήτων 73 Ταξινόμηση πινάκων συχνοτήτων 78 Κυκλικά γραφήματα 79 Ραβδογράμματα 80 Σύνοψη του χρόνου στο Διαδίκτυο 82 Ιστογράμματα 82
9 Επικρατούσα τιμή και διάμεσος 86 Εκατοστημόρια 88 Περίληψη 89 Τι ακολουθεί; 89 Πώς θα πάρετε έναν πίνακα συχνοτήτων 90 Μορφοποίηση: Εμφάνιση του πίνακα συχνοτήτων 91 Στατιστικές: Μονομεταβλητές στατιστικές 91 Γραφήματα: Ραβδογράμματα, κυκλικά γραφήματα, και ιστογράμματα 92 Ασκήσεις 93 5 Υπολογισμός περιγραφικών στατιστικών 103 Σύνοψη δεδομένων 104 Κλίμακες μέτρησης 104 Επικρατούσα τιμή, διάμεσος, και αριθμητικός μέσος 106 Σύγκριση μέσης τιμής και διαμέσου 107 Σύνοψη του χρόνου στο Διαδίκτυο 110 Μέτρα μεταβλητότητας 113 Εύρος 113 Διακύμανση και τυπική απόκλιση 114 Ο συντελεστής μεταβλητότητας 115 Τυπικές τιμές 116 Περίληψη 118 Τι ακολουθεί; 118 Πώς θα πάρετε μονομεταβλητές περιγραφικές στατιστικές 119 Επιλογές: Εκλογή στατιστικών και ταξινόμηση μεταβλητών 120 Ασκήσεις 121 6 Σύγκριση ομάδων 127 Ηλικία, μόρφωση, και χρήση του Διαδικτύου 128 Γραφήματα μέσων όρων 128 Διαστρωμάτωση: Ορισμός υποομάδων με περισσότερες από μία μεταβλητές 129 Περίληψη 132 Τι ακολουθεί; 132
10 Πώς θα πάρετε μέσους όρους υποομάδων 132 Διαστρωμάτωση: Ορισμός υποομάδων με περισσότερες από μία μεταβλητές 133 Επιλογές: Επιπλέον στατιστικές και εμφάνιση των ετικετών 135 Ασκήσεις 136 7 Εξέταση των κατανομών 143 Χρόνοι ολοκλήρωσης μαραθωνίου 144 Ηλικία και φύλο 146 Χρόνοι μαραθωνίου για μεσήλικες δρομείς 153 Περίληψη 156 Τι ακολουθεί; 157 Πώς να ερευνάτε τις κατανομές 157 Στατιστικές της διαδικασίας Explore 158 Γραφικές παραστάσεις 159 Επιλογές 161 Ασκήσεις 162 8 Καταμέτρηση αποκρίσεων για συνδυασμούς μεταβλητών 167 Χρήση βιβλιοθήκης και εκπαίδευση 168 Ποσοστά γραμμών και στηλών 170 Ραβδογράμματα 173 Προσθήκη μεταβλητών ελέγχου 175 Χρήση βιβλιοθήκης και Διαδίκτυο 177 Περίληψη 181 Τι ακολουθεί; 181 Πώς θα πάρετε έναν πίνακα διασταύρωσης 182 Διαστρωμάτωση: Τρεις ή περισσότερες μεταβλητές ταυτόχρονα 183 Κελιά: Ποσοστά, αναμενόμενες καταμετρήσεις, και υπόλοιπα 184 Διμεταβλητές στατιστικές 185 Μορφοποίηση: Προσαρμογή μορφοποίησης πίνακα 185 Ασκήσεις 186
11 9 Γραφήματα δεδομένων 197 Εξέταση δεικτών πληθυσμού 198 Απλά γραφήματα διασποράς 198 Μήτρες γραφημάτων διασποράς 203 Γραφήματα υπέρθεσης 205 Τρισδιάστατα γραφήματα 207 Προσδιορισμός ασυνήθιστων σημείων 210 Περιστροφή τρισδιάστατων γραφημάτων διασποράς 211 Περίληψη 212 Τι ακολουθεί; 212 Πώς θα πάρετε ένα γράφημα διασποράς 213 Δημιουργία απλού γραφήματος διασποράς 213 Δημιουργία γραφήματος διασποράς υπέρθεσης 215 Δημιουργία μήτρας γραφημάτων διασποράς 216 Δημιουργία τρισδιάστατου γραφήματος διασποράς 216 Επεξεργασία γραφήματος διασποράς 217 Ασκήσεις 223 Μέρος 3 Έλεγχος υποθέσεων 10 Αξιολόγηση αποτελεσμάτων δειγμάτων 231 Από το δείγμα στον πληθυσμό 232 Ένα μοντέλο υπολογιστή 232 Η επίδραση του μεγέθους του δείγματος 237 Ο διωνυμικός έλεγχος 239 Περίληψη 242 Τι ακολουθεί; 242 Ασκήσεις 243 11 Η κανονική κατανομή 247 Η κανονική κατανομή 247 Δείγματα από κανονική κατανομή 251 Μέσες τιμές από κανονικό πληθυσμό 251 Είναι τα αποτελέσματα των δειγμάτων απίθανα; 254
12 Έλεγχος υπόθεσης 255 Μέσες τιμές από μη κανονικές κατανομές 256 Μέσες τιμές από ομοιόμορφη κατανομή 257 Περίληψη 258 Τι ακολουθεί; 258 Ασκήσεις 259 12 Έλεγχος υπόθεσης για μοναδική μέση τιμή 267 Εξέταση των Δεδομένων 268 Η κατανομή Τ 270 Υπολογισμός της στατιστικής Τ 272 Διαστήματα εμπιστοσύνης 273 Άλλα επίπεδα εμπιστοσύνης 276 Διάστημα εμπιστοσύνης για μια διαφορά 277 Διαστήματα εμπιστοσύνης και έλεγχοι υποθέσεων 277 Μηδενικές υποθέσεις και εναλλακτικές υποθέσεις 278 Απόρριψη της μηδενικής υπόθεσης 280 Περίληψη 280 Τι ακολουθεί; 280 Πώς θα πάρετε έναν έλεγχο Τ ενός δείγματος 281 Επιλογές: Επίπεδο εμπιστοσύνης και απόντα δεδομένα 282 Ασκήσεις 283 13 Έλεγχος υπόθεσης για δύο σχετιζόμενες μέσες τιμές 289 Οι δρομείς του μαραθωνίου κατά ζεύγη 290 Εξέταση των διαφορών 291 Είναι η μέση διαφορά μηδέν; 292 Δύο προσεγγίσεις 293 Ο έλεγχος Τ ζευγών δειγμάτων 295 Είστε απόλυτα βέβαιοι; 296 Μερικά πιθανά προβλήματα 296 Εξέταση της κανονικότητας 297 Περίληψη 299 Τι ακολουθεί; 299
Πώς θα πραγματοποιήσετε έναν έλεγχο Τ δειγμάτων κατά ζεύγη 300 Επιλογές: Επίπεδο εμπιστοσύνης και απόντα δεδομένα 301 Ασκήσεις 302 13 14 Έλεγχος υποθέσεων για δύο ανεξάρτητες μέσες τιμές 307 Εξέταση της τηλεθέασης 308 Κατανομή των διαφορών 311 Τυπικό σφάλμα της μέσης διαφοράς 312 Υπολογισμός της στατιστικής Τ 312 Έξοδος του ελέγχου Τ δύο ανεξάρτητων δειγμάτων 313 Διαστήματα εμπιστοσύνης για τη μέση διαφορά 314 Έλεγχος της ισότητας των διακυμάνσεων 314 Επίδραση των έκκεντρων σημείων 316 Εισαγωγή της βαθμίδας εκπαίδευσης 317 Μπορείτε να αποδείξετε τη μηδενική υπόθεση; 324 Ερμηνεία του παρατηρούμενου επιπέδου σημαντικότητας 324 Ισχύς 326 Παρακολούθηση του ποσοστού θανάτων 326 Είναι πραγματικά σημαντική η (στατιστικά) σημαντική μέση τιμή; 329 Περίληψη 330 Τι ακολουθεί; 330 Πώς θα πραγματοποιήσετε έναν έλεγχο Τ ανεξαρτήτων δειγμάτων 330 Ορισμός ομάδων: Καθορισμός των υποομάδων 331 Επιλογές: Επίπεδο εμπιστοσύνης και απόντα δεδομένα 332 Ασκήσεις 333 15 Ανάλυση διακύμανσης ενός παράγοντα 341 Ώρες εργάσιμης εβδομάδας 342 Περιγραφή των δεδομένων 342 Διαστήματα εμπιστοσύνης μέσων τιμών ομάδων 343 Έλεγχος της μηδενικής υπόθεσης 344 Αναγκαίες παραδοχές για την ανάλυση διακύμανσης 345 Ανάλυση της μεταβλητότητας 346
14 Σύγκριση των δύο εκτιμήσεων της μεταβλητότητας 349 Ο πίνακας ανάλυσης διακύμανσης 349 Διαδικασίες πολλαπλής σύγκρισης 353 Περίληψη 360 Τι ακολουθεί; 360 Πώς θα πάρετε μια ανάλυση διακύμανσης ενός παράγοντα 360 Πολλαπλή σύγκριση εκ των υστέρων: Εύρεση της διαφοράς 361 Επιλογές: Στατιστικές και απόντα δεδομένα 362 Ασκήσεις 364 16 Ανάλυση διακύμανσης δύο παραγόντων 371 Ο σχεδιασμός 372 Εξέταση των δεδομένων 373 Έλεγχος υποθέσεων 375 Αλληλεπίδραση βαθμίδας εκπαίδευσης και φύλου 379 Αναγκαίες παραδοχές 379 Πίνακας ανάλυσης διακύμανσης 380 Έλεγχος της αλληλεπίδρασης βαθμίδας εκπαίδευσης και φύλου 382 Έλεγχος των κυρίων επιδράσεων 383 Εξάλειψη της αλληλεπίδρασης 384 Πού είναι οι διαφορές; 386 Αποτελέσματα πολλαπλής σύγκρισης 386 Έλεγχος των παραδοχών 387 Μια ματιά στην τηλεόραση 389 Επεκτάσεις 391 Περίληψη 391 Τι ακολουθεί; 392 Πώς θα πάρετε μια μονομεταβλητή ανάλυση GLM 392 Μονομεταβλητή ανάλυση GLM: Μοντέλο 393 Μονομεταβλητή ανάλυση GLM: Γραφήματα 394 Μονομεταβλητή ανάλυση GLM: Εκ των υστέρων 395 Μονομεταβλητή ανάλυση GLM: Επιλογές 395 Μονομεταβλητή ανάλυση GLM: Αποθήκευση 396 Ασκήσεις 397
15 17 Σύγκριση παρατηρούμενων και αναμενόμενων καταμετρήσεων 403 Ελευθερία ή καλοί τρόποι; 404 Παρατηρούμενες και αναμενόμενες καταμετρήσεις 405 Η στατιστική Χ 2 407 Ένας μεγαλύτερος πίνακας 411 Ανοίγει πόρτες το κολέγιο; 414 Έλεγχος Χ 2 ενός μοναδικού δείγματος 414 Ζητήματα ισχύος 417 Περίληψη 418 Τι ακολουθεί; 418 Ασκήσεις 419 18 Μη παραμετρικοί έλεγχοι 423 Μη παραμετρικοί έλεγχοι για δεδομένα κατά ζεύγη 424 Έλεγχος προσήμου 427 Έλεγχος Wilcoxon 430 Ποιος στέλνει μηνύματα ηλεκτρονικού ταχυδρομείου; 432 Έλεγχος Mann-Whitney 434 Έλεγχος Kruskal-Wallis 436 Έλεγχος Friedman 438 Περίληψη 440 Πώς θα εκτελέσετε μη παραμετρικούς ελέγχους 440 Έλεγχος X 2 440 Διωνυμικός έλεγχος 442 Έλεγχοι δύο ανεξάρτητων δειγμάτων 443 Έλεγχοι πολλών ανεξάρτητων δειγμάτων 444 Έλεγχοι δύο σχετιζόμενων δειγμάτων 445 Έλεγχοι πολλών σχετιζόμενων δειγμάτων 447 Επιλογές: περιγραφικές στατιστικές και απούσες τιμές 448 Ασκήσεις 449
16 Μέρος 4 Εξέταση σχέσεων 19 Μέτρηση της συνάφειας 455 Οι συνιστώσες του συστήματος απονομής δικαιοσύνης 456 Αναλογική μείωση σφάλματος 459 Μέτρα συνάφειας για τακτικές μεταβλητές 465 Σύμφωνα και ασύμφωνα ζεύγη 465 Μέτρα βασισμένα σε σύμφωνα και ασύμφωνα ζεύγη 466 Αξιολόγηση των συνιστωσών 469 Μέτρηση της συμφωνίας 470 Μέτρα βασισμένα στη συσχέτιση 472 Μέτρα βασισμένα στη στατιστική X 2 473 Περίληψη 476 Τι ακολουθεί; 477 Ασκήσεις 477 20 Γραμμική παλινδρόμηση και συσχέτιση 481 Προσδόκιμο ζωής και ρυθμός γεννήσεων 482 Επιλογή της «βέλτιστης» ευθείας 483 Υπολογισμός της ευθείας των ελαχίστων τετραγώνων 488 Υπολογισμός προβλεπόμενων τιμών και υπολοίπων 489 Πόσο καλά ταιριάζει η ευθεία; 490 Ερμηνεία της μεταβλητότητας 493 Μερικές προειδοποιήσεις 495 Περίληψη 497 Τι ακολουθεί; 498 Πώς θα πάρετε μια γραμμική παλινδρόμηση 498 Στατιστικές: Περισσότερες πληροφορίες για το μοντέλο 499 Γραφήματα υπολοίπων: Βασική ανάλυση υπολοίπων 501 Αποθήκευση γραμμικής παλινδρόμησης: Δημιουργία νέων μεταβλητών 502 Επιλογές της γραμμικής παλινδρόμησης 505 Ασκήσεις 507
21 Έλεγχος υποθέσεων παλινδρόμησης 517 Η ευθεία παλινδρόμησης του πληθυσμού 517 Απαραίτητες παραδοχές για τον έλεγχο υποθέσεων 518 Έλεγχος υποθέσεων 519 Έλεγχος υπόθεσης μηδενικής κλίσης 520 Διαστήματα εμπιστοσύνης για την κλίση και το σταθερό όρο 521 Πρόβλεψη του προσδόκιμου ζωής 522 Πρόβλεψη μέσων τιμών και μεμονωμένων παρατηρήσεων 523 Τυπικό σφάλμα προβλεπόμενης μέσης τιμής 524 Διαστήματα εμπιστοσύνης για τις προβλεπόμενες μέσες τιμές 525 Διαστήματα πρόβλεψης για μεμονωμένες περιπτώσεις 526 Περίληψη 528 Τι ακολουθεί; 528 Πώς θα πάρετε μια διμεταβλητή συσχέτιση 528 Επιλογές: Πρόσθετες στατιστικές και απόντα δεδομένα 530 Πώς θα πάρετε μια μερική συσχέτιση 531 Επιλογές: Πρόσθετες στατιστικές και απόντα δεδομένα 532 Ασκήσεις 533 17 22 Ανάλυση υπολοίπων 541 Υπόλοιπα 542 Κανονικοποιημένα υπόλοιπα 543 Υπόλοιπα κατά Student 544 Έλεγχος της κανονικότητας 545 Έλεγχος για σταθερή διακύμανση 548 Έλεγχος της γραμμικότητας 550 Έλεγχος της ανεξαρτησίας 553 Ένα τελευταίο σχόλιο για τις παραδοχές 554 Αναζήτηση σημείων επιρροής 554 Διαγραμμένα υπόλοιπα κατά Student 557 Περίληψη 558 Τι ακολουθεί; 558 Ασκήσεις 558
18 23 Κατασκευή μοντέλων πολλαπλής παλινδρόμησης 565 Πρόβλεψη του προσδόκιμου ζωής 566 Το μοντέλο 567 Παραδοχές πολλαπλής παλινδρόμησης 568 Εξέταση των μεταβλητών 568 Πόσο καλά προσαρμόζεται το μοντέλο; 570 Εξέταση των συντελεστών 572 Ερμηνεία των συντελεστών της μερικής παλινδρόμησης 574 Αλλαγή του μοντέλου 576 Συντελεστές Μερικής Συσχέτισης 576 Ανοχή και πολυσυγγραμμικότητα 577 Συντελεστές Βήτα 578 Κατασκευή μοντέλου παλινδρόμησης 579 Μέθοδοι επιλογής μεταβλητών 580 Περίληψη 588 Τι ακολουθεί; 588 Πώς θα πάρετε μια πολλαπλή γραμμική παλινδρόμηση 589 Επιλογές: Κριτήρια επιλογής μεταβλητών 591 Ασκήσεις 593 24 Διαγνωστικά πολλαπλής παλινδρόμησης 601 Εξέταση της κανονικότητας 602 Γράφημα διασποράς των υπολοίπων 604 Στήριξη 607 Αλλαγές στους συντελεστές 608 Απόσταση του Cook 609 Γραφήματα με ανεξάρτητες μεταβλητές 610 Γράφημα μερικής παλινδρόμησης 613 Πού είναι το πρόβλημα; 614 Περίληψη 614 Ασκήσεις 615
19 Παραρτήματα A Δημιουργία γραφημάτων στο SPSS 623 Γενικά 623 Δημιουργία ραβδογραμμάτων 624 Δημιουργία γραφήματος για τη σύγκριση ομάδων περιπτώσεων 624 Επιλογές σύνοψης δεδομένων 626 Δημιουργία γραφήματος για τη σύγκριση πολλών μεταβλητών 627 Αλλαγή του στατιστικού μεγέθους σύνοψης 628 Επιλογές δημιουργίας γραφημάτων 629 Τροποποίηση γραφημάτων 629 Αλλαγή επιλογών γραφήματος 631 Συμβουλές για την επεξεργασία γραφημάτων 632 Αποθήκευση αρχείων γραφημάτων 633 Γραφήματα γραμμής και περιοχής 633 Κυκλικά γραφήματα 633 Ορθογωνικά γραφήματα 634 Ετικέτες περιπτώσεων 635 Ραβδογράμματα σφάλματος 635 Ιστογράμματα 636 Γραφήματα κανονικής πιθανότητας 637 B Μετασχηματισμός και επιλογή δεδομένων 639 Μετασχηματισμοί δεδομένων 639 Οι μετασχηματισμοί με μια ματιά 640 Αποθήκευση των αλλαγών 641 Καθυστέρηση της επεξεργασίας των μετασχηματισμών 641 Επανακωδικοποίηση τιμών 642 Υπολογισμός μεταβλητών 646 Η αριθμομηχανή 647 Αυτόματη επανακωδικοποίηση 650 Μετασχηματισμοί υπό συνθήκη 651 Επιλογή περιπτώσεων 655 Προσωρινή ή μόνιμη επιλογή 656 Άλλες μέθοδοι επιλογής 658
20 Γ Η κατανομή Τ 659 Δ Επιφάνειες κάτω από την κανονική καμπύλη 661 Ε Περιγραφές αρχείων δεδομένων 663 ΣΤ Απαντήσεις σε επιλεγμένες ασκήσεις 665 Βιβλιογραφία 679 Ευρετήριο 681
Αξιολόγηση αποτελεσμάτων δειγμάτων Τι μπορείτε να συμπεράνετε για έναν πληθυσμό, με βάση τα αποτελέσματα που παρατηρείτε σε ένα τυχαίο δείγμα; Τα αποτελέσματα που παρατηρείτε σε ένα δείγμα είναι πανομοιότυπα με τα αποτελέσματα που θα παίρνατε από έναν ολόκληρο πληθυσμό; Τι είναι η δειγματική κατανομή ενός στατιστικού μεγέθους; Πώς χρησιμοποιείται αυτό για τον έλεγχο μιας υπόθεσης σχετικά με τον πληθυσμό; Ποιοι παράγοντες καθορίζουν πόσο πολύ ποικίλουν οι μέσες τιμές των δειγμάτων από το ένα δείγμα στο άλλο; Τι είναι το παρατηρούμενο επίπεδο σημαντικότητας; Τι είναι ο διωνυμικός έλεγχος και πότε τον χρησιμοποιείτε; Στα προηγούμενα κεφάλαια, απαντήσατε σε ερωτήσεις του τύπου «Τι ποσοστό των ενηλίκων στις Ηνωμένες Πολιτείες χρησιμοποιούν το Διαδίκτυο;» ή «Ποια είναι η σχέση μεταξύ βαθμίδας εκπαίδευσης και χρήσης δημόσιων βιβλιοθηκών;» Αυτό που κάνατε ήταν να αναφέρετε τι βρήκατε στο δείγμα σας. Σε αυτό το μέρος του βιβλίου, θα αρχίσετε να εξετάζετε προβλήματα που α- ντιμετωπίζετε όταν θέλετε να βγάλετε συμπεράσματα για ένα μεγαλύτερο αριθμό ατόμων ή αντικειμένων από αυτά που πραγματικά συμπεριλάβατε στη μελέτη σας. Θα μάθετε πώς να βγάζετε συμπεράσματα για έναν πληθυσμό με βάση τα αποτελέσματα από ένα δείγμα. Αυτό το κεφάλαιο χρησιμοποιεί δεδομένα υπολογιστή τα οποία βρίσκονται στο αρχείο simul.sav. Για οδηγίες σχετικά με τον τρόπο που θα πάρετε τα α- ποτελέσματα του διωνυμικού ελέγχου τα παρουσιάζονται εδώ, δείτε την ενότητα «Διωνυμικός έλεγχος» στη σελίδα 442 του Κεφαλαίου 18.
232 Κεφάλαιο 10 Από το δείγμα στον πληθυσμό Στην έρευνα General Social Survey (GSS), διαπιστώσατε ότι σχεδόν το 47% του δείγματος δήλωσε ότι χρησιμοποίησε το Διαδίκτυο. Εκτός αν έχουν γίνει λάθη κατά την καταγραφή ή την καταχώριση των δεδομένων, αυτό το θεωρείτε γεγονός. Επίσης, ξέρετε την ακριβή ηλικία των ατόμων του δείγματος, τη βαθμίδα εκπαίδευσής τους, και τα λοιπά. Μπορείτε να περιγράψετε με πολλές λεπτομέρειες και βεβαιότητα τα αποτελέσματα που παρατηρούνται σε αυτό το δείγμα. Δυστυχώς, δεν είναι αυτό που σας ενδιαφέρει πραγματικά. Αυτό που θέλετε να κάνετε είναι να βγάλετε συμπεράσματα για τη μεγαλύτερη ομάδα που αντιπροσωπεύουν τα άτομα της έρευνας GSS, τον πληθυσμό. Οι συμμετέχοντες στην GSS αποτελούν ένα δείγμα από τον πληθυσμό των ενηλίκων στις Ηνωμένες Πολιτείες. Βασισμένοι στα αποτελέσματα που παρατηρείτε από τους συμμετέχοντες, θέλετε να βγάλετε συμπεράσματα για όλους τους ενήλικες στις Ηνωμένες Πολιτείες. Θέλετε, για παράδειγμα, να μπορείτε να πείτε ότι στις Ηνωμένες Πολιτείες, τα νεότερα άτομα είναι πιθανότερο να χρησιμοποιήσουν το Διαδίκτυο από τα μεγαλύτερα σε ηλικία. Από μια πρώτη άποψη, αυτό δε φαίνεται και τόσο πολύπλοκο. Γιατί να μην υποθέσουμε ότι αυτό που ισχύει για το δείγμα ισχύει επίσης και για τον πληθυσμό; Αυτό είναι σίγουρα πολύ απλό. Αλλά είναι πάντα σωστό; Πιστεύετε πραγματικά ότι, αφού το 47% του δείγματός σας χρησιμοποιεί το Διαδίκτυο, αυτό είναι και το πραγματικό ποσοστό των χρηστών του Διαδικτύου στον ενήλικο πληθυσμό; Η α- πλή λογική σάς λέει ότι είναι πολύ απίθανο τα αποτελέσματα που παίρνετε από ένα δείγμα να είναι ίδια με εκείνα που θα είχατε αν κάνατε μετρήσεις ή έρευνα στο συνολικό πληθυσμό που σας ενδιαφέρει. Σε μια τέτοια περίπτωση, μια γρήγορη δημοσκόπηση πριν από κάποιες εκλογές θα εξάλειφε την ανάγκη να πραγματοποιηθούν οι εκλογές. Αυτό που ισχύει πράγματι είναι ότι διαφορετικά δείγματα δίνουν διαφορετικά αποτελέσματα, και είναι εξαιρετικά απίθανο οποιοδήποτε δείγμα να αντιπροσωπεύει επακριβώς τα αποτελέσματα για όλο τον πληθυσμό. Για να δείτε τι μπορείτε να συμπεράνετε σχετικά με τον πληθυσμό βασισμένοι σε ένα δείγμα, πρέπει να εξετάσετε ποια αποτελέσματα είναι πιθανά όταν επιλέγετε ένα δείγμα από έναν πληθυσμό. Ένα μοντέλο υπολογιστή Αν και θα μπορούσατε να χρησιμοποιήσετε μαθηματικές μεθόδους για να συμπεράνετε τις ιδιότητες δειγμάτων και πληθυσμών, είναι λιγότερο κουραστικό και περισσότερο διασκεδαστικό να τα ανακαλύψετε μόνοι σας. Μπορείτε να χρησιμοποιήσετε τον υπολογιστή για να εξακολουθήσετε να παράγετε τυχαία δείγματα από τον ίδιο πληθυσμό και να βλέπετε κατά πόσο αλλάζουν τα αποτελέσματα από το ένα δείγμα στο άλλο. Αυτή η διαδικασία είναι γνωστή ως προσομοίωση μέσω υ- πολογιστή (computer simulation).
? Αξιολόγηση αποτελεσμάτων δειγμάτων 233 Τι είναι τυχαίο δείγμα; Ένα τυχαίο δείγμα (random sample) δίνει σε κάθε μέλος του πληθυσμού (ζώο, λαχανικό, ορυκτό, ή οτιδήποτε άλλο) την ίδια πιθανότητα να συμπεριληφθεί στο δείγμα. Δεν αποκλείεται συστηματικά από το δείγμα κανένας συγκεκριμένος τύπος πλάσματος ή πράγματος και κανένας τύπος δεν είναι πιθανότερο να συμπεριληφθεί σε σχέση με οποιονδήποτε άλλο. Επίσης, κάθε μέλος επιλέγεται ανεξάρτητα η συμπερίληψη ενός συγκεκριμένου μέλους δεν αλλάζει την πιθανότητα να συμπεριληφθεί ένα άλλο. Ένα δείγμα είναι μεροληπτικό αν, για παράδειγμα, οι πλούσιοι έχουν μεγαλύτερη πιθανότητα να συμπεριληφθούν από τους φτωχότερους, ή τα υγιέστερα άτομα είναι πιο πιθανό να επιλεγούν από τα πιο άρρωστα. Δεν μπορείτε να βγάλετε σωστά συμπεράσματα για τον πληθυσμό βασισμένοι στα αποτελέσματα από ένα τέτοιο δείγμα. Ας χρησιμοποιήσουμε τον υπολογιστή για να λύσουμε το παρακάτω πρόβλημα. Μια διακεκριμένη παθολόγος ισχυρίζεται ότι εφαρμόζει μια καλύτερη θεραπεία για την ασθένεια που εξετάζεται. Από 10 ασθενείς που υποβλήθηκαν στη νέα θεραπεία της, το 70% θεραπεύτηκε. Η εκτενής βιβλιογραφία για το θέμα δείχνει ότι, σε εθνικό επίπεδο, θεραπεύονται μόνο το 50% των ασθενών με αυτή την ασθένεια. Βασισμένοι στα αποτελέσματα του πειράματός της, μπορείτε να πείτε αν η παθολόγος έχει βελτιώσει πραγματικά τη θεραπεία αυτής της ασθένειας; Είναι τα παρατηρούμενα αποτελέσματα απίθανα; Για να αξιολογήσετε τον ισχυρισμό της παθολόγου, πρέπει να θέσετε στον εαυτό σας την εξής ερώτηση, «Είναι απίθανα τα αποτελέσματα που παρατήρησε (7 ιάσεις στις 10 περιπτώσεις) αν το ποσοστό ίασης του πραγματικού πληθυσμού είναι 50%;» Ξέρετε ότι, αν μπορούν να θεραπευτούν τα μισά από όλα τα άτομα με μια ασθένεια, αυτό δε σημαίνει ότι κάθε φορά που επιλέγετε 10 ασθενείς θα θεραπεύονται σίγουρα 5 με αυτή την θεραπεία. Θεωρήστε μια αναλογία με το στρίψιμο ενός νομίσματος. Ξέρετε ότι, αν το νόμισμα είναι γνήσιο, είναι εξίσου πιθανό να έλθει «κορώνα» ή «γράμματα». Αν στρίψετε ένα γνήσιο νόμισμα 10 φορές όμως, δεν αναμένετε ότι θα πάρετε ακριβώς 5 «κορώνες» κάθε 10 ρίψεις. Μερικές φορές, τυχαίνουν περισσότερες κορώνες και άλλες φορές περισσότερα γράμματα. (Δοκιμάστε να στρίψετε ένα νόμισμα 10 φορές και δείτε πόσες φορές θα πάρετε κορώνα θεραπείες. Καταγράψτε τα αποτελέσματά σας. Επαναλάβετε αυτή τη δοκιμή μέχρι να χάσετε την υπομονή σας, και στη συνέχεια κατασκευάστε ένα φυλλογράφημα των αποτελεσμάτων. Μπορείτε να συγκρίνετε τα αποτελέσματά σας με εκείνα που θα δείτε σε αυτό το κεφάλαιο.) Για να αξιολογήσετε τον ισχυρισμό της παθολόγου, αντί να περάσετε το απόγευμά σας στρίβοντας ένα νόμισμα, μπορείτε να χρησιμοποιήσετε τον υπολογιστή για να κατασκευάσετε έναν πληθυσμό στον οποίο οι μισοί από τους ασθενείς θεραπεύονται και οι άλλοι μισοί όχι. Αυτή είναι η κατάσταση αν ο ισχυρισμός της παθολόγου δεν είναι αληθινός. Κατόπιν, μπορείτε να κάνετε τον υπολογιστή να πάρει
234 Κεφάλαιο 10 ένα τυχαίο δείγμα 10 ασθενών και να καταγράψει το ποσοστό που θεραπεύεται. Βάλτε τον υπολογιστή σας να επαναλάβει αυτή τη διαδικασία 500 φορές. Ο λόγος που το κάνετε αυτό είναι για να δείτε ποιος τύπος αποτελεσμάτων του δείγματος είναι πιθανός αν η νέα θεραπεία δεν είναι διαφορετική από την τυπική. Στη συνέχεια, μπορείτε να προσδιορίσετε αν η διαπίστωση ότι το 70% ίασης των ασθενών σε ένα δείγμα 10 ασθενών είναι ένα ασυνήθιστο εύρημα όταν το πραγματικό ποσοστό ίασης είναι 50%. Στην Εικόνα 10.1 βλέπετε ένα φυλλογράφημα των αποτελεσμάτων των 500 πειραμάτων. Μπορείτε να κατασκευάσετε ένα φυλλογράφημα χρησιμοποιώντας τη διαδικασία Explore, όπως περιγράφεται στο Κεφάλαιο 7. Επιλέξτε τη μεταβλητή cured10 στο πλαίσιο διαλόγου Explore. Εικόνα 10.1 Φυλλογράφημα ποσοστού ίασης για ένα δείγμα με μέγεθος 10 Από αυτό το γράφημα, μπορείτε να συμπεράνετε πόσο συχνά περίπου θα αναμένατε να δείτε ποικίλα αποτελέσματα σε δείγματα με μέγεθος 10. Η κατανομή όλων των πιθανών αποτελεσμάτων των δειγμάτων για ένα στατιστικό μέγεθος (όπως το ποσοστό ίασης) ονομάζεται δειγματική κατανομή ή κατανομή δείγματος (sampling distribution) του στατιστικού μεγέθους.? Για τα περισσότερα δείγματα, το ποσοστό ίασης πλησιάζει το 50% Τι ακριβώς είναι ένα στατιστικό μέγεθος; Ένα στατιστικό μέγεθος (statistic) είναι ένα χαρακτηριστικό κάποιου δείγματος. Η μέση τιμή και η διακύμανση δείγματος είναι και τα δύο παραδείγματα στατιστικών μεγεθών. Ο όρος παράμετρος χρησιμοποιείται για να περιγράψει τα χαρακτηριστικά του πληθυσμού. Για παράδειγμα, το μέσο ύψος των ανθρώπων στο δείγμα σας είναι ένα στατιστικό μέγεθος. Αν μετρήσετε τα ύψη όλων των ανθρώπων στον πληθυσμό που σας ενδιαφέρει, αυτό θα ήταν παράμετρος του πληθυσμού. Οι παράμετροι συνήθως συμβολίζονται (από τους στατιστικολόγους, τουλάχιστον) με ελληνικά γράμματα. Για παράδειγμα, ο μέσος όρος ενός πληθυσμού συμβολίζεται με µ, ενώ ο μέσος όρος ενός δείγματος συμβολίζεται με X. Αντίστοιχα, η τυπική απόκλιση του πληθυσμού συμβολίζεται με σ (σίγμα), ενώ η τιμή για ένα δείγμα συμβολίζεται με s. Τις περισσότερες φορές, οι τιμές του πληθυσμού, ή παράμετροι, δεν είναι γνωστές. Πρέπει να τις εκτιμήσετε με βάση στατιστικά μεγέθη που υπολογίζονται από τα δείγματα.
Αξιολόγηση αποτελεσμάτων δειγμάτων 235 Η δειγματική κατανομή υπολογίζεται συνήθως μαθηματικά. Σε αυτή την περίπτωση, χρησιμοποιείτε έναν υπολογιστή για να σας δώσει μια ιδέα σχετικά με το πώς μοιάζει. Στην Εικόνα 10.1, βλέπετε ότι για τα περισσότερα δείγματα το ποσοστό ίασης είναι πολύ κοντά στο 50%. Για την ακρίβεια, 307 από τα 500 πειράματα κατέληξαν σε ποσοστά ίασης 40%, 50%, ή 60%. Όσο περισσότερο απομακρύνεστε από το 50% σε οποιαδήποτε κατεύθυνση, τόσο λιγότερα δείγματα βλέπετε. Αν και είναι πιθανά διάφορα αποτελέσματα, αυτά δεν είναι εξίσου πιθανά. Για παράδειγμα, μόνον 6 πειράματα από τα 500 κατέληξαν σε ένα ποσοστό ίασης 90% ή μεγαλύτερο. Μπορείτε να υπολογίσετε περιγραφικά στατιστικά μεγέθη για τα δεδομένα που συνοψίζονται στην Εικόνα 10.1. Αυτές οι στατιστικές σύνοψης παρουσιάζονται στην Εικόνα 10.2. Οι τιμές κυμαίνονται από την ελάχιστη 10% έως τη μέγιστη 90%, αλλά η μέση τιμή είναι πολύ κοντά στο 50%. (Για την ακρίβεια, για τη μαθηματικά υπολογιζόμενη δειγματική κατανομή η μέση τιμή είναι ακριβώς 50%, που είναι και η μέση τιμή του πληθυσμού από τον οποίο προέρχονται τα δείγματα.) Η τυπική απόκλιση των ποσοστών, με την ετικέτα Τυπ. απόκλιση στην Εικόνα 10.2, είναι 16.22%. Η τυπική απόκλιση σας λέει πόσο κυμαίνεται το ποσοστό των θεραπευμένων στα δείγματα μεγέθους 10. (Η τυπική απόκλιση της κατανομής όλων των πιθανών τιμών ενός στατιστικού μεγέθους ονομάζεται τυπικό σφάλμα standard error του στατιστικού μεγέθους. Για παράδειγμα, η τυπική απόκλιση όλων των πιθανών τιμών μιας δειγματικής μέσης τιμής ονομάζεται τυπικό σφάλμα της μέσης τιμής.) Εικόνα 10.2 Περιγραφικές στατιστικές για δείγματα με μέγεθος 10 Μπορείτε να πάρετε αυτές τις στατιστικές με τη διαδικασία Descriptives, όπως περιγράφεται στο Κεφάλαιο 5.? Ποια είναι η διαφορά μεταξύ τυπικής απόκλισης και τυπικού σφάλματος; Η τυπική απόκλιση αναφέρεται στη μεταβλητότητα των παρατηρήσεων σε ένα δείγμα. Ο όρος τυπικό σφάλμα χρησιμοποιείται όταν αναφερόμαστε στη μεταβλητότητα ενός στατιστικού μεγέθους. Για παράδειγμα, αν έχετε ένα δείγμα 10 συστολικών πιέσεων αίματος, μπορείτε να υπολογίσετε τη μέση τιμή, τη διακύμανση, και την τυπική απόκλιση όπως συνήθως. Από την τυπική απόκλιση 10 μετρήσεων πίεσης αίματος, μπορείτε επίσης να εκτιμήσετε πόσο ποικίλλουν οι μέσες πιέσεις αίματος που υπολογίζονται για ένα δείγμα 10 ατόμων. Αυτό είναι το τυπικό σφάλμα της μέσης τιμής για δείγματα αυτού του μεγέθους. Η Εικόνα 10.2 περιέχει περιγραφικές στατιστικές για 500 μέσες τιμές δειγμάτων με μέγεθος 10. Η τυπική απόκλιση αυτών των 500 μέσων τιμών είναι μια εκτίμηση του τυπικού σφάλματος της μέσης τιμής για δείγματα με μέγεθος 10.
236 Κεφάλαιο 10 Χρησιμοποιώντας ως οδηγό την Εικόνα 10.1, μπορείτε να εκτιμήσετε κατά πόσο είναι ασυνήθιστα τα αποτελέσματα της παθολόγου αν το πραγματικό ποσοστό ίασης είναι 50%. Βλέπετε ότι 96 από τα 500 προσομοιωμένα πειράματα (19.2%) κατέληξαν σε ποσοστό ίασης 70% ή μεγαλύτερο. Αυτό δείχνει ότι, ακόμη και αν η νέα θεραπεία δεν είναι καλύτερη από την τυπική, θα αναμένατε ποσοστά ίασης τουλάχιστον τόσο υψηλά όσο εκείνα που παρατηρούνται από την παθολόγο τουλάχιστον τη 1 από τις 5 φορές που επαναλάβατε το πείραμα. (Για την ακρίβεια, είναι πιθανό να υπολογιστεί μαθηματικά ότι η πιθανότητα επίτευξης 7 ή περισσότερων ιάσεων σε ένα δείγμα των 10 πλησιάζει το 17% όταν το πραγματικό ποσοστό ίασης είναι 50%.) Φυσικά, είναι πάντα πιθανό η νέα θεραπεία να είναι αρκετά λιγότερο αποτελεσματική από τη συνήθη. Έτσι, αν θέλετε να ελέγξετε την υπόθεση ότι η νέα θεραπεία δε διαφέρει από τη συνήθη, πρέπει να αξιολογήσετε την πιθανότητα αποτελεσμάτων τόσο ακραίων όσο αυτά που παρατηρείτε σε κάθε κατεύθυνση αύξηση ή μείωση του ποσοστού ίασης. Από την Εικόνα 10.1, μπορείτε να εκτιμήσετε ότι η πιθανότητα 30% ή λιγότερων ιάσεων και η πιθανότητα 70% ή περισσότερων ιάσεων είναι (96 + 97)/500= 38.6%. Με βάση αυτά, δεν έχετε σοβαρό λόγο να πιστέψετε ότι η παθολόγος έχει πραγματικά καταφέρει κάτι. Τα αποτελέσματά της είναι βέβαιο ότι συμβαδίζουν με τα δείγματα που επιλέγονται από έναν πληθυσμό στον οποίο το πραγματικό ποσοστό ίασης είναι 50%.? Γιατί να εξετάσουμε ποσοστά ίασης 70% ή μεγαλύτερο και ποσοστά ίασης 30% ή μικρότερο; Θεωρήστε την εξής αναλογία. Ο φίλος σας σας δίνει ένα νόμισμα και υποστηρίζει ότι δεν είναι γνήσιο. Δηλαδή το να φέρει «κορώνα» ή «γράμματα δεν είναι εξίσου πιθανό. Ο φίλος σας θέλει τη γνώμη σας. Τι αποτελέσματα θα σας κάνουν να υποπτευθείτε το νόμισμα; Προφανώς, αν φέρετε πολλές ή πολύ λίγες φορές κορώνα (ή γράμματα) θα σας μπουν υποψίες για το νόμισμα. Πρέπει να εξετάσετε και τις δύο πιθανότητες αν δεν ξέρετε κατά πόσο το νόμισμα μεροληπτεί σε κορώνες ή σε γράμματα. Από την άλλη, αν ξέρετε ότι το νόμισμα είναι κατασκευασμένο έτσι ώστε να φέρνει «γράμματα», επειδή ο ιδιοκτήτης του πάντα στοιχηματίζει σε αυτό, εσείς μπορείτε να αγνοήσετε τη πιθανότητα να φέρετε πολύ λίγες φορές κορώνα. Επιστρέφοντας στο παράδειγμα της παθολόγου, ενδιαφέρεστε και για τις δύο πιθανότητες πολύ λίγες και πάρα πολλές ιάσεις. Αυτό συμβαίνει επειδή είναι πιθανό η νέα θεραπεία να έχει φτωχότερα αποτελέσματα από τη συνήθη, και σεις θέλετε να το ξέρετε αυτό. Αν υπάρχει λόγος για τον οποίο η νέα θεραπεία δεν μπορεί να είναι χειρότερη για παράδειγμα, αν περιλαμβάνει προσθήκη φαρμακευτικής αγωγής στη συνήθη θεραπεία μπορείτε να περιορίσετε την προσοχή σας σε ποσοστά ίασης με τουλάχιστον τόσο μεγάλα ποσοστά όσο αυτό που παρατηρήθηκε.
Η επίδραση του μεγέθους του δείγματος Αξιολόγηση αποτελεσμάτων δειγμάτων 237 Όπως είδατε προηγουμένως, όταν το πραγματικό ποσοστό ίασης είναι 50%, υπάρχει μεγάλη πιθανότητα να θεραπεύονται από 3 έως 7 ασθενείς σε ένα δείγμα 10 ατόμων. Τα περισσότερα από τα δυνατά αποτελέσματα δε θα θεωρούνταν ασυνήθιστα, επειδή είναι λογικό να προκύψουν όταν το πραγματικό ποσοστό ίασης είναι 50%. Εκτός από αυτό, αν η νέα θεραπεία έχει ως αποτέλεσμα ένα ποσοστό ίασης 60% ή 70%, πιθανόν να μην εντοπίζατε τη βελτίωση δεδομένου ότι πολλά ποσοστά δειγμάτων, που είναι συμβατά με πραγματικά ποσοστά 60 ή 70%, είναι επίσης συμβατά με ποσοστό 50%. Αυτό σημαίνει ότι με βάση ένα δείγμα μόνο 10 ασθενών είναι πολύ δύσκολο να αξιολογηθεί μια νέα θεραπεία.? Μπορείτε να συμπεράνετε ποτέ από ένα δείγμα ακριβώς 10 ασθενών ότι μια νέα θεραπεία είναι καλύτερη; Ναι. Εφόσον η ύπαρξη ενός μικρού πράσινου ανθρωπάκου θα μπορούσε να σας πείσει ότι υπάρχει ζωή στον Άρη, το ίδιο και 10 ιάσεις μιας ανίατης προηγουμένως ασθένειας θα μπορούσαν να σας πείσουν ότι η θεραπεία σας αξίζει. Όλα εξαρτώνται από το πόσο απίθανα είναι τα αποτελέσματά σας. Για να δείτε τι επίδραση έχει το μέγεθος του δείγματος στη δυνατότητά σας να α- ξιολογήσετε τον ισχυρισμό της παθολόγου, σκεφθείτε τι συμβαίνει αν πάρετε δείγματα 40 ασθενών, αντί για 10, από τον ίδιο πληθυσμό που παρουσιάζει ποσοστό ίασης 50%. Τα αποτελέσματα αυτού του πειράματος με υπολογιστή παρουσιάζονται στην Εικόνα 10.3. (Παρατηρήστε ότι κάθε μίσχος στο φυλλογράφημα διαιρείται τώρα σε δύο γραμμές.) Όταν συγκρίνετε την Εικόνα 10.3 με την Εικόνα 10.1, βλέπετε ότι οι τιμές είναι πολύ πιο κοντά στο 50% από ό,τι πριν. Τιμές μεγαλύτερες από 60% ή μικρότερες από 40% είναι τώρα εμφανώς λιγότερο πιθανές. Αυτά τα ποσοστά δεν ήταν ιδιαίτερα ασυνήθιστα όταν είχατε δείγματα 10 ασθενών. Με βάση την Εικόνα 10.3, θα υπολογίζατε την πιθανότητα να βρείτε ένα ποσοστό δείγματος 70% ή μεγαλύτερο ή 30% ή μικρότερο, όταν το πραγματικό ποσοστό είναι 50%, σε περίπου 3 στα 500, ή 0.6%. Αυτό σημαίνει ότι μόνο 1 στις 200 φορές περίπου θα εμφανιζόταν ένα τέτοιο ποσοστό ίασης αν η νέα θεραπεία δε διαφέρει από τη συνήθη. Για να συνοψίσουμε, όταν έχετε δείγματα 40 περιπτώσεων, ένα παρατηρούμενο ποσοστό 70% ή μεγαλύτερο, ή 30% ή μικρότερο, είναι πιθανό αλλά όχι πολύ πιθανό όταν το πραγματικό ποσοστό του πληθυσμού είναι 50%. Αν η παθολόγος παρατηρεί το ίδιο ποσοστό ίασης του 70% με βάση ένα δείγμα 40 ασθενών, είναι πιθανότερο να θεωρήσετε ότι ίσως κάτι πάει να καταφέρει. Τα αποτελέσματά της, πραγματικά, θα ήταν ασυνήθιστα όταν το πραγματικό ποσοστό ίασης είναι 50%.
238 Κεφάλαιο 10? Πόσο ακριβώς ασυνήθιστο πρέπει να είναι το «ασυνήθιστο»; Η πρακτική μέθοδος που συνήθως χρησιμοποιείται για να χαρακτηρίσει τα αποτελέσματα ως ασυνήθιστα είναι μια πιθανότητα 5% ή μικρότερη. Δηλαδή, αν αναμένεται να εμφανιστούν, σε 5 (ή λιγότερα) δείγματα από τα 100, αποτελέσματα ακραία ή πολύ ακραία σε σχέση με εκείνα που παρατηρούνται, τα αποτελέσματα θεωρούνται ασυνήθιστα ή στατιστικά σημαντικά. Εικόνα 10.3 Φυλλογράφημα για το ποσοστό των θεραπειών σε ένα δείγμα με μέγεθος 40 Για να πάρετε αυτό το φυλλογράφημα, επιλέξτε τη μεταβλητή cured40 στο πλαίσιο διαλόγου Explore Τα ποσοστά ίασης συγκεντρώνονται περισσότερο γύρω από το 50% σε σύγκριση με την Εικόνα 10.1 Τα μεγαλύτερα δείγματα βελτιώνουν τις πιθανότητές σας να εντοπίσετε κάποια διαφορά (αν υπάρχει στην πραγματικότητα) στα ποσοστά ίασης, επειδή παρουσιάζεται μικρότερη μεταβλητότητα στα πιθανά αποτελέσματα. Κοιτάξτε την Εικόνα 10.4, η οποία περιέχει τις περιγραφικές στατιστικές για την κατανομή που παρουσιάζεται στην Εικόνα 10.3. Η μέση τιμή είναι πάλι κοντά στο 50%. Η τυπική απόκλιση όμως είναι πολύ μικρότερη από ό,τι για τα δείγματα με μέγεθος 10. Τώρα είναι 7.29%, έναντι της τυπικής απόκλισης 16.22% στην Εικόνα 10.2. Υπάρχει ένα μοτίβο στον τρόπο που το μέγεθος του δείγματος επηρεάζει τη διακύμανση της δειγματικής κατανομής των μέσων τιμών. Αν αυξήσετε το μέγεθος του δείγματος κατά ένα συντελεστή τέσσερα, η διακύμανση μειώνεται κατά ένα συντελεστή τέσσερα. Δεδομένου ότι η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης, μειώνεται κατά ένα συντελεστή δύο. Εικόνα 10.4 Περιγραφικές στατιστικές για δείγματα με μέγεθος 40 Το τυπικό σφάλμα της μέσης τιμής είναι πολύ μικρότερο από ό,τι για δείγματα με μέγεθος 10
Ο διωνυμικός έλεγχος Αξιολόγηση αποτελεσμάτων δειγμάτων 239 Στο προηγούμενο παράδειγμα, εκτιμήσατε την πιθανότητα των διαφόρων εκβάσεων ενός πειράματος από ένα φυλλογράφημα το οποίο προέκυψε από επαναλαμβανόμενα δείγματα του ίδιου πληθυσμού. Ο λόγος για τον οποίο ακολουθήσαμε αυτόν τον τρόπο είναι για να σας δείξουμε ότι, όταν παίρνετε ένα δείγμα από έναν πληθυσμό, η τιμή που υπολογίζετε για ένα στατιστικό μέγεθος όπως η μέση τιμή είναι μία από τις πολλές πιθανές τιμές που μπορείτε να πάρετε. Οι πιθανές τιμές έχουν μια κατανομή τη δειγματική κατανομή του στατιστικού μεγέθους. Τα α- ποτελέσματα ποικίλουν από δείγμα σε δείγμα, και πρέπει να πάρετε υπόψη σας αυτή τη μεταβλητότητα όταν βγάζετε συμπεράσματα για τον πληθυσμό με βάση τα αποτελέσματα που παρατηρήθηκαν σε ένα δείγμα. Ευτυχώς, στις περισσότερες καταστάσεις δε χρειάζεται να προσδιορίσετε προσωπικά τις πιθανές εκβάσεις και τις πιθανότητές τους εκτελώντας πειράματα στον υπολογιστή. Αυτά μπορούν να υπολογιστούν μαθηματικά για λογαριασμό σας από το SPSS. Για παράδειγμα, μπορείτε να χρησιμοποιήσετε το διωνυμικό έλεγχο (binomial test) για να προσδιορίσετε κατά πόσο ένα παρατηρούμενο ποσοστό ίασης είναι απίθανο αν το πραγματικό ποσοστό είναι 50%. Ο στόχος σας είναι να συγκρίνετε το ποσοστό επιτυχίας του πειράματός σας με ένα τυπικό ή σύνηθες ποσοστό. Παρατηρείτε την έκβαση που σας ενδιαφέρει για ένα δείγμα των υποκειμένων ή των αντικειμένων. Για να χρησιμοποιήσετε το διωνυμικό έλεγχο, το πείραμα ή η μελέτη σας πρέπει να έχει μόνο δύο πιθανές εκβάσεις, όπως ίαση/μη ίαση, επιτυχία/αποτυχία, αγορά/μη αγορά, ελαττωματικός/μη ελαττωματικός, κ.ο.κ. Όλες οι παρατηρήσεις πρέπει να είναι ανεξάρτητες, και η πιθανότητα επιτυχίας πρέπει να είναι ίδια για κάθε μέλος του πληθυσμού του δείγματος.? Τι σημαίνει ανεξάρτητος; Για να είναι ανεξάρτητες οι παρατηρήσεις, η απάντηση ενός υποκειμένου δεν πρέπει να επηρεάζει αυτή ενός άλλου. Για παράδειγμα, αν οι σπουδαστές συνεργάζονται σε ένα διαγώνισμα, οι επιδόσεις τους δεν είναι ανεξάρτητες. Η επίδοση ενός σπουδαστή επηρεάζει αυτές των άλλων. Αν κάνετε πολλές παρατηρήσεις του ίδιου υποκειμένου, οι παρατηρήσεις είναι επίσης μη ανεξάρτητες. Η θεραπεία τού ίδιου ασθενή σε 10 κρίσεις μιας ασθένειας δεν είναι ισοδύναμη με τη θεραπεία 10 ασθενών σε 1 κρίση. Οι 10 παρατηρήσεις από έναν ασθενή δεν είναι ανεξάρτητες.