ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΑΤΙΣΤΙΚΗΣ ΣΤΗΝ ΒΙΟΪΑΤΡΙΚΗ ΚΑΙ ΕΠΙΔΗΜΙΟΛΟΓΙΚΗ ΕΡΕΥΝΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΑΤΙΣΤΙΚΗΣ ΣΤΗΝ ΒΙΟΪΑΤΡΙΚΗ ΚΑΙ ΕΠΙΔΗΜΙΟΛΟΓΙΚΗ ΕΡΕΥΝΑ"

Transcript

1 ΚΕΦΑΛΑΙΟ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΑΤΙΣΤΙΚΗΣ ΣΤΗΝ ΒΙΟΪΑΤΡΙΚΗ ΚΑΙ ΕΠΙΔΗΜΙΟΛΟΓΙΚΗ ΕΡΕΥΝΑ ΑΝΑΛΥΣΗ ΠΙΝΑΚΟΠΟΙΗΜΕΝΩΝ ΔΕΔΟΜΕΝΩΝ (THE ANALYSIS OF CROSS-TABULATIONS) Απαρίθμηση και Ταξινόμηση Σύγκριση Δύο ποσοστών Συχνά, σε σχέση με τις εφαρμογές, ενδιαφερόμαστε να συγκρίνουμε αναλογίες (ποσοστά). Για παράδειγμα, στο πλαίσιο μίας μελέτης για τις προσφερόμενες υπηρεσίες υγείας, ένας ερευνητής ενδέχεται να ενδιαφέρεται να εξετάσει αν υπάρχουν διαφορές στα ποσοστά των γυναικών που υπόκεινται σε προγεννητικό έλεγχο ανάλογα με το κοινωνικό στρώμα στο οποίο ανήκουν. Ένας κλινικός γιατρός ενδέχεται να ενδιαφέρεται να εξετάσει ποιο από δύο φάρμακα έχει υψηλότερο ποσοστό ίασης. Ένας επιδημιολόγος ενδέχεται να ενδιαφέρεται να μελετήσει τα ποσοστά εμφάνισης θρομβοφλεβίτιδας μεταξύ γυναικών που παίρνουν αντισυλληπτικό χάπι και γυναικών που ακολουθούν άλλη μέθοδο αντισύλληψης. Τα δεδομένα τα οποία αναφέρονται σε τέτοιες περιπτώσεις, συχνά συνιστούν καταμετρήσεις αριθμών στοιχείων με συγκεκριμένα χαρακτηριστικά, δηλαδή, στοιχείων που ανήκουν σε συγκεκριμένες κατηγορίες. Οι καταμετρήσεις αυτές είναι ταξινομημένες σε πίνακες μιας, 7

2 δύο, τριών ή περισσοτέρων διαστάσεων. Οι πίνακες αυτοί ονομάζονται συνήθως πίνακες συναφείας, μιας, δύο, τριών ή περισσοτέρων διαστάσεων (one-, two-, three- or multi- way contingency tables). Κάθε διάσταση αντιστοιχεί σε μία ταξινόμηση σε κατηγορίες που αναφέρονται σε ένα χαρακτηριστικό. Παράδειγμα: Τα στοιχεία που περιέχονται στον πίνακα που ακολουθεί αναφέρονται σε μια μελέτη που έγινε με βάση δύο ανεξάρτητα δείγματα παιδιών με ή χωρίς ιστορικό βρογχίτιδας στην νηπιακή τους ηλικία προκειμένου να συγκριθούν οι αναλογίες οι οποίες τα παιδιά των δύο αυτών κατηγοριών παρουσιάζουν αναπνευστικά προβλήματα αργότερα στην παιδική ηλικία. Το πρώτο δείγμα αποτελείται από 73 παιδιά που είχαν βρογχίτιδα κατά την νηπιακή ηλικία, από τα οποία 6 αναφέρθηκαν ως έχοντα σύμπτωμα επίμονου βήχα κατά την διάρκεια της ημέρας ή της νύκτας γύρω στην ηλικία των -4 ετών. Το δεύτερο δείγμα αποτελείται από 046 παιδιά τα οποία δεν είχαν παρουσιάσει βρογχίτιδα κατά τη νηπιακή ηλικία και από τα οποία 44 αναφέρθηκαν ως παρουσιάζοντα το ίδιο σύμπτωμα κατά την ίδια ηλικία. Ιστορικό Βρογχίτιδας Σύμπτωμα Βήχα Ναι Όχι Σύνολο Ναι Όχι Σύνολο

3 Παράδειγμα: Ο πίνακας που ακολουθεί συνοψίζει το αποτέλεσμα μίας έρευνας με αντικείμενο την μελέτη του κατά πόσο ψυχολογικοί παράγοντες που συνδέονται με το είδος της στέγης κάτω από την οποία ζουν έγκυοι γυναίκες μπορεί να θεωρηθούν ότι περιλαμβάνονται μεταξύ των παραγόντων που οδηγούν σε πρόωρο τοκετό. Είδος Τοκετού Είδος Κατοικίας Πρόωρος Κανονικός Σύνολο Ιδιόκτητη Εργατική Ενοικιασμένη Συγκατοικεί με γονείς Άλλο Σύνολο Στοιχεία, όπως αυτά των παραπάνω πινάκων, συνήθως χρησιμοποιούνται για τον έλεγχο της υπόθεσης ότι οι γραμμές και οι στήλες του πίνακα αντιπροσωπεύουν ανεξάρτητα σχήματα ταξινόμησης (περίπτωση πρώτου παραδείγματος) ή της υπόθεσης μη ύπαρξης «σχέσης» («συσχέτισης», association) μεταξύ δύο ποιοτικών μεταβλητών, όπως αυτές του δευτέρου παραδείγματος, ή, ισοδύναμα, της υπόθεσης ότι οι πληθυσμοί από τους οποίους προήλθαν τα τυχαία δείγματα, εκπροσωπούνται σε ίσα ποσοστά στις διάφορες κατηγορίες. Ο βαθμός, βέβαια, της συσχέτισης (αν αυτή υπάρχει) δεν είναι εύκολο να προσδιορισθεί. (Ο έλεγχος που χρησιμοποιείται στην περίπτωση αυτή μπορεί μόνο να εντοπίσει ενδεχόμενες διαφορές των πληθυσμών ως προς τα ποσοστά εκπροσώπησής τους στις διάφορες κατηγορίες). 9

4 ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ (CONTINGENCY TABLES) Σύμφωνα με τα παραπάνω, ένας rc πίνακας συναφείας αποτελεί μία παράθεση φυσικών αριθμών (οι οποίοι συνήθως παριστούν συχνότητες εμφάνισης αντικειμένων), ταξινομημένων σε r γραμμές και c στήλες, όπως ο πίνακας που ακολουθεί. j c Ο Ο Ο j Ο c Ο Ο Ο j Ο c i Ο i Ο i O Ο ic r Ο r Ο r Ο rj Ο rc Εδώ O συμβολίζει τον παρατηρούμενο αριθμό των αντικειμένων που ανήκουν στο (i, j) κελλί, i =,,, r, j =,,,c. Πίνακες συναφείας αυτής της μορφής χρησιμοποιούνται συνήθως σε σχέση με εφαρμογές για την παρουσίαση δεδομένων που περιέχονται σε r ανεξάρτητα δείγματα (γραμμές), των οποίων τα στοιχεία παριστούν μετρήσεις σε ονομαστική κλίμακα τουλάχιστον, για τον έλεγχο της υπόθεσης ότι οι πιθανότητες με τις οποίες ένα τυχαία επιλεγόμενο 30

5 αντικείμενο θα ανήκει στις κατηγορίες,,,c (στήλες) δεν διαφέρουν από δείγμα σε δείγμα. Οι πίνακες αυτοί προκύπτουν στο πλαίσιο προοπτικών ή αναδρομικών μελετών, όπως στην περίπτωση του πρώτου παραδείγματος. Μία άλλη χρήση του rc πίνακα συναφείας είναι σε σχέση με ένα μοναδικό δείγμα, του οποίου κάθε στοιχείο μπορεί να ταξινομηθεί σε μία από r διαφορετικές κατηγορίες σύμφωνα με ένα κριτήριο ή χαρακτηριστικό και, ταυτόχρονα, σε μία από c διαφορετικές κατηγορίες σύμφωνα με ένα άλλο κριτήριο ή χαρακτηριστικό. Στην περίπτωση αυτή, ενδιαφέρει ο έλεγχος της υπόθεσης ότι οι κατηγορίες του ενός κριτηρίου δεν επηρεάζουν σημαντικά τις αναλογίες των αντικειμένων σε κάθε μία από τις κατηγορίες του άλλου κριτηρίου ή χαρακτηριστικού. Πίνακες αυτής της μορφής προκύπτουν στο πλαίσιο εγκαρσίων μελετών, όπως στην περίπτωση του δευτέρου παραδείγματος. Οι όροι κριτήριο ή χαρακτηριστικό χρησιμοποιούνται με την ευρεία έννοιά τους και μπορούν να αναφέρονται επίσης σε καταστάσεις στις οποίες βρίσκονται τα αντικείμενα ενός δείγματος πριν και μετά από μία αγωγή (treatment). Στις περιπτώσεις αυτές, η προς έλεγχο μηδενική υπόθεση είναι ότι η αγωγή δεν επηρεάζει σημαντικά τις αναλογίες των αντικειμένων στις κατηγορίες των δύο καταστάσεων. Ένας άλλος τρόπος για να ελεγχθεί αυτή η ίδια υπόθεση, βέβαια, είναι με την χρησιμοποίηση ανεξάρτητων τυχαίων δειγμάτων από τον υπό εξέταση πληθυσμό πριν και μετά την αγωγή και την σύγκρισή τους στην συνέχεια. Η πρόσθετη μεταβλητότητα, όμως, που εισάγεται από την χρησιμοποίηση των δύο διαφορετικών δειγμάτων είναι ανεπιθύμητη γιατί, όπως είναι γνωστό, τείνει να «συσκοτίζει» τις μεταβολές που προκαλούνται στον πληθυσμό 3

6 από την χρησιμοποιούμενη αγωγή. Παρόλα αυτά, υπάρχουν περιπτώσεις κατά τις οποίες δεν είναι πρακτικό ή εφικτό να χρησιμοποιηθεί το ίδιο δείγμα δύο φορές. Οι περιπτώσεις αυτές αποτελούν τυπικά παραδείγματα της πρώτης μορφής χρήσης των rc πινάκων συναφείας που αναφέρθηκε παραπάνω. Ο χ Έλεγχος για την Ύπαρξη Διαφορών στα Ποσοστά Εκπροσώπησης r Πληθυσμών σε c Κατηγορίες (Προοπτικές / Αναδρομικές Μελέτες) μεγέθους Ας υποθέσουμε ότι έχουμε r αμοιβαία ανεξάρτητα τυχαία δείγματα n, n,..., n r, (ένα από κάθε ένα από r πληθυσμούς), τα στοιχεία των οποίων μπορούν να ταξινομηθούν σε c κατηγορίες όπως στον πίνακα που ακολουθεί: Κατηγορία c Σύνολο Ο Ο Ο c n Δείγμα Ο Ο Ο c n r Ο r Ο r Ο rc n r Σύνολο C C C c N 3

7 Εδώ Ο συμβολίζει τον αριθμό των παρατηρήσεων που προέρχονται από το i δείγμα και ανήκουν στην κατηγορία j, i =,,, r, j =,,, c. Επομένως, n i O O... O, i =,,, r. i i Ο αριθμός των παρατηρήσεων που ανήκουν στην j κατηγορία, συμβολίζεται με C j, j =,,, c. Δηλαδή, C i O O... O, j =,,, c. j j Ο συνολικός αριθμός των παρατηρήσεων από όλα τα δείγματα συμβολίζεται με Ν, δηλαδή Ν = n + n + +n r. Πέρα από την υπόθεση της ανεξαρτησίας μεταξύ των δειγμάτων, απαιτείται να υποθέσουμε ότι κάθε παρατήρηση μπορεί να ταξινομηθεί σε μία ακριβώς από τις c διαθέσιμες κατηγορίες. Οι υποθέσεις που επιθυμούμε να ελέγξουμε μπορούν να διατυπωθούν με την μορφή: rj ic H 0 H : Οι πληθυσμοί, από τους οποίους προήλθαν τα τυχαία δείγματα, εκπροσωπούνται σε ίσα ποσοστά στις διάφορες κατηγορίες. : Τουλάχιστον δύο από τους πληθυσμούς, από τους οποίους προήλθαν τα τυχαία δείγματα, εκπροσωπούνται σε διαφορετικά ποσοστά στις διάφορες κατηγορίες. Αν με p συμβολίσουμε την πιθανότητα μία τυχαία επιλεγόμενη τιμή από τον i πληθυσμό, i =,,, r να ανήκει στην j κατηγορία, j =,,.., c, οι παραπάνω υποθέσεις παίρνουν την μορφή. H 0 : pj p j... p rj, j =,,, c 33

8 H : p p για κάποια τιμή του j και για κάποιο kj ζεύγος τιμών (i, k). Αν η H 0 είναι αληθής, ο αριθμός στοιχείων που περιμένουμε να παρατηρήσουμε στο κελλί (i, j) είναι Ε = (μέγεθος του i δείγματος) δηλαδή, (ποσοστό των συνολικών παρατηρήσεων, που ανήκουν στην j κατηγορία), Ε n ic j/n. Επομένως, τα δεδομένα παρέχουν ενδείξεις υπέρ της μηδενικής υπόθεσης αν οι παρατηρούμενες τιμές Ο είναι κοντά στις αναμενόμενες τιμές Ε. Κατά συνέπεια, για τον έλεγχο αυτής της υπόθεσης, απαιτείται μια στατιστική συνάρτηση που θα αντιπροσωπεύει ένα μέτρο της εγγύτητας των παρατηρούμενων συχνοτήτων και των αναμενόμενων συχνοτήτων (δηλαδή, των συνάρτηση Ο και των Ε ). Συνήθως, χρησιμοποιείται η στατιστική r c (O E ) T. E i j Η ακριβής μορφή της κατανομής της Τ δεν είναι εύκολο να προσδιορισθεί. Η διαδικασία για τον καθορισμό της ακριβούς μορφής της κατανομής της στατιστικής συνάρτησης Τ είναι πολύπλοκη και χρονοβόρα. Αποδεικνύεται, όμως, ότι μπορεί να προσεγγισθεί από την κατανομή χ με (r-)(c-) βαθμούς ελευθερίας. Δηλαδή, 34

9 r c (O E ) T ~ χ (r) (c). E i j Είναι φανερό, από τον ορισμό της Τ, ότι οι μεγάλες τιμές της αποτελούν ένδειξη εναντίον της μηδενικής υπόθεσης, αφού δείχνουν μεγάλες αποκλίσεις μεταξύ των τιμών που παρατηρούνται και αυτών που αναμένονται να παρατηρηθούν αν η μηδενική υπόθεση είναι αληθής. Επομένως, η κρίσιμη περιοχή του ελέγχου ορίζεται από την ανισότητα T, όπου χ χ (r ) (c),- (r ) (c),- συμβολίζει το ( α)-ποσοστιαίο σημείο της κατανομής χ (r ) (c). Μία ισοδύναμη έκφραση για την στατιστική συνάρτηση Τ, η οποία προσφέρεται για ταχύτερο υπολογισμό της τιμής της, είναι η εξής: r c O T N. E i j Επειδή χρησιμοποιείται η ασυμπτωτική κατανομή της στατιστικής συνάρτησης Τ, η θεωρούμενη τιμή του επιπέδου σημαντικότητας αποτελεί μία καλή προσέγγιση της πραγματικής τιμής του επιπέδου σημαντικότητας στην περίπτωση που οι αναμενόμενες συχνότητες E, i =,,, r, j =,,, c έχουν αρκετά μεγάλες τιμές. Αν, όμως, κάποιες από τις αναμενόμενες συχνότητες είναι χαμηλές, η προσέγγιση μπορεί να μην είναι καθόλου ικανοποιητική, ιδιαίτερα μάλιστα εάν ο αριθμός των γραμμών και των στηλών είναι μικρός. Στην πράξη, εάν κάποιες από τις αναμενόμενες συχνότητες είναι πολύ χαμηλές, οι κατηγορίες στις οποίες ανήκουν συνενώνονται κατάλληλα με άλλες κατηγορίες προκειμένου να προκύψουν κατηγορίες με αναμενόμενες συχνότητες που δεν είναι 35

10 χαμηλές. Ποιες κατηγορίες θα πρέπει να συνενωθούν είναι θέμα κρίσης του ερευνητή. Εν γένει, οι κατηγορίες συνδυάζονται μόνο εάν είναι παρόμοιες με κάποια έννοια, ώστε οι υποθέσεις να διατηρούν το νόημά τους. Ο χ Έλεγχος Ανεξαρτησίας (The Chi-square Test for Independence) Η δεύτερη κατηγορία προβλημάτων, στα οποία οι rc πίνακες συναφείας έχουν εφαρμογή, αναφέρονται στην περίπτωση που έχουμε ένα τυχαίο δείγμα μεγέθους Ν, του οποίου κάθε παρατήρηση μπορεί να ταξινομηθεί σύμφωνα με δύο κριτήρια ή χαρακτηριστικά. Υπάρχουν r κατηγορίες (γραμμές) ως προς το ένα κριτήριο ή χαρακτηριστικό και c κατηγορίες (στήλες) ως προς το δεύτερο κριτήριο ή χαρακτηριστικό. Κάθε παρατήρηση του δείγματος ταξινομείται σύμφωνα και με τα δύο κριτήρια και, επομένως, περιλαμβάνεται σε ένα συγκεκριμένο κελλί του rc πίνακα συναφείας. Χαρακτηριστικό Β c Σύνολο Ο Ο Ο c R Ο Ο Ο c R Χαρακτηριστικό Α r Ο r Ο r Ο rc R r Σύνολο C C C c N 36

11 Ο συνολικός αριθμός των παρατηρήσεων στην i γραμμή του πίνακα συμβολίζεται με R i, i =,,, r. Ο συμβολισμός αυτός, σε αντίθεση με αυτόν της προηγούμενης περίπτωσης, χρησιμοποιείται για να δοθεί έμφαση στο γεγονός ότι τα σύνολα των γραμμών είναι τιμές τυχαίες και όχι γνωστές (δεδομένες), όπως θα ήταν αν οι γραμμές του πίνακα αναφέρονταν σε στοιχεία ανεξαρτήτων δειγμάτων. Ο συνολικός αριθμός των παρατηρήσεων στην j στήλη του πίνακα συμβολίζεται με C j, j =,,, c. Tο άθροισμα των τιμών σε όλα τα κελλιά του πίνακα ισούται με το μέγεθος Ν του τυχαίου δείγματος που έχουμε στην διάθεσή μας. Είναι σαφές ότι και στην συγκεκριμένη περίπτωση, απαιτείται να υποτεθεί ότι κάθε παρατήρηση μπορεί να ταξινομηθεί σε μία ακριβώς από τις rc διαφορετικές κατηγορίες του πίνακα συναφείας. Η απαιτούμενη κλίμακα μέτρησης είναι ονομαστική, παρόλο που ανώτερες κλίμακες μπορούν επίσης να χρησιμοποιηθούν. Η υπόθεση που επιθυμούμε να ελέγξουμε είναι ότι οι γραμμές και οι στήλες του πίνακα εκπροσωπούν δύο ανεξάρτητα σχήματα ταξινόμησης. Είναι, δηλαδή, η μηδενική υπόθεση μία υπόθεση ελέγχου ανεξαρτησίας μεταξύ των χαρακτηριστικών Α και Β. Συγκεκριμένα, η μηδενική υπόθεση μπορεί να διατυπωθεί ως εξής: H 0 : Το ενδεχόμενο {μία παρατήρηση ανήκει στην i γραμμή} Έστω είναι ανεξάρτητο από το ενδεχόμενο {η ίδια παρατήρηση ανήκει στην j στήλη}, για κάθε i και j. p = P (μία τυχαία επιλεγόμενη τιμή από τον πληθυσμό ανήκει στο (i, j) κελλί), 37

12 p i. = P (μία τυχαία επιλεγόμενη τιμή από τον πληθυσμό ανήκει στην i γραμμή), p.j = P (μία τυχαία επιλεγόμενη τιμή από τον πληθυσμό ανήκει στην j στήλη). Από τον ορισμό της ανεξαρτησίας ενδεχομένων, η μηδενική υπόθεση μπορεί, επομένως, να διατυπωθεί ως εξής: H, i =,,, r, j =,,, c. 0 : p pi. p.j Η εναλλακτική υπόθεση Η διατυπώνεται ως εξής: H : p pi. p.j, για κάποιες τιμές των i, j. Εάν η μηδενική υπόθεση είναι αληθής, η αναμενόμενη συχνότητα του (i, j) κελλιού είναι: E = (μέγεθος του τυχαίου δείγματος) (ποσοστό των παρατηρήσεων που ανήκουν στην i γραμμή) (ποσοστό των παρατηρήσεων που ανήκουν στην j στήλη), δηλαδή, E N(R /N) (C /N), i j ή, ισοδύναμα, E # παρατηρήσεων που αναμένονται στο (i, j) κελλί = R C /N i j. Η στατιστική συνάρτηση για τον έλεγχο των παραπάνω υποθέσεων ορίζεται όπως και προηγουμένως. Δηλαδή, 38

13 T r i c j (O E E ) r i c j O E N. Η ακριβής μορφή της κατανομής της στατιστικής συνάρτησης Τ διαφέρει από αυτήν της στατιστικής συνάρτησης της προηγούμενης περίπτωσης, αλλά η διαδικασία προσδιορισμού της είναι εξίσου πολύπλοκη και χρονοβόρα. Και στην περίπτωση αυτή, όμως, η κατανομή χ με (r )(c ) βαθμούς ελευθερίας προσεγγίζει την ακριβή κατανομή της Τ αρκετά ικανοποιητικά. Επομένως, ο κανόνας απόφασης και στην περίπτωση αυτή έχει την μορφή: Η μηδενική υπόθεση Η 0 απορρίπτεται αν η τιμή της στατιστικής συνάρτησης Τ υπερβαίνει το ( α)-ποσοστιαίο σημείο της χ κατανομής με (r )(c ) βαθμούς ελευθερίας, δηλαδή αν T. χ (r ) (c),α Παράδειγμα: Ας θεωρήσουμε τα δεδομένα του παραδείγματος σχετικά με τον χρόνο τοκετού και το είδος κατοικίας. Είδος Τοκετού Είδος Κατοικίας Πρόωρος Κανονικός Σύνολο Ιδιόκτητη Εργατική Ενοικιασμένη Συγκατοικεί με γονείς Άλλο Σύνολο

14 Να ελεγχθεί, σε επίπεδο σημαντικότητας %, κατά πόσον ο χρόνος τοκετού επηρεάζεται από το είδος της στέγης κάτω από την οποία ζουν έγκυοι γυναίκες. Λύση: Έχουμε ένα τυχαίο δείγμα, του οποίου τα άτομα έχουν ταξινομηθεί σε κατηγορίες (διαβαθμίσεις) ως προς τα χαρακτηριστικά «είδος τοκετού» και «είδος κατοικίας». Η προς έλεγχο μηδενική υπόθεση είναι η H 0 : ο χρόνος τοκετού δεν επηρεάζεται από ψυχολογικούς ή, ισοδύναμα, παράγοντες συνδεόμενους με το είδος κατοικίας H :p p,για κάθε i και j, 0 i. p.j όπου και (οι δείκτες i και j αναφέρονται στο είδος κατοικίας και στο είδος τοκετού αντίστοιχα) p = P (Μια τυχαία επιλεγόμενη γυναίκα ανήκει στην κατηγορία (i, j)) p i. = P (Το είδος κατοικίας μιας τυχαία επιλεγόμενης γυναίκας είναι i) p.j = P (Το είδος τοκετού μιας τυχαία επιλεγόμενης γυναίκας είναι j) Αν η μηδενική υπόθεση είναι αληθής, οι αναμενόμενες συχνότητες στα κελλιά του δοθέντος πίνακα υπολογίζονται από τον τύπο E R C /N, για κάθε i και j. Οι τιμές αυτών των συχνοτήτων i j συνοψίζονται στον πίνακα που ακολουθεί. 40

15 Αναμενόμενες Συχνότητες Είδος Τοκετού Είδος Κατοικίας Πρόωρος Κανονικός Σύνολο Ιδιόκτητη Εργατική Ενοικιασμένη Συγκατοικεί με γονείς Άλλο Σύνολο Η κατάλληλη στατιστική συνάρτηση για τον έλεγχο της παραπάνω υπόθεσης δίνεται από τον τύπο: (O E ) T E i j και είναι προφανές ότι η κρίσιμη περιοχή ορίζεται από την ανισότητα T χ , 099 Η παρατηρούμενη τιμή της Τ είναι τ = 0.5. Επομένως, σε επίπεδο σημαντικότητας % δε φαίνεται να υπάρχει εξάρτηση μεταξύ του είδους κατοικίας και του χρόνου τοκετού. Παράδειγμα: Aς θεωρήσουμε τα δεδομένα του παραδείγματος που αναφέρεται στην μελέτη των παιδιών με ή χωρίς ιστορικό βρογχίτιδας κατά την νηπιακή ηλικία που παρουσιάζουν αναπνευστικά προβλήματα στην ηλικία των -4 ετών. 4

16 Ιστορικό Βρογχίτιδας Σύμπτωμα Βήχα Ναι Όχι Σύνολο Ναι Όχι Σύνολο Δείχνουν τα στοιχεία αυτά στατιστικά σημαντική διαφορά στις αναλογίες των αντίστοιχων πληθυσμών παιδιών; (α=5%) Λύση: Είναι προφανές ότι η προς έλεγχο μηδενική υπόθεση μπορεί να διατυπωθεί ως εξής: H, για κάθε j, 0 : Pβήχας, j Pόχι βήχας, j όπου ο δείκτης j αναφέρεται στην ύπαρξη ή μη ιστορικού βρογχίτιδας. Κάτω από την μηδενική υπόθεση, οι αναμενόμενες συχνότητες E στα κελλιά του παραπάνω πίνακα υπολογίζονται από την σχέση n ic j E, για κάθε i και j. N Οι τιμές τους περιέχονται στα αντίστοιχα κελλιά του πίνακα που ακολουθεί. Αναμενόμενες Συχνότητες Ιστορικό Βρογχίτιδας Σύμπτωμα Βήχα Ναι Όχι Σύνολο Ναι Όχι Σύνολο Η κατάλληλη στατιστική συνάρτηση για τον έλεγχο της παραπάνω υπόθεσης δίνεται από την σχέση 4

17 (O E ) T ~ χ, E i j οπότε, η κρίσιμη περιοχή του ελέγχου ορίζεται από την ανισότητα χ T, 0.95 Η παρατηρηθείσα τιμή της στατιστικής συνάρτησης είναι τ=.. Επομένως, σε επίπεδο σημαντικότητας 5%, δεν φαίνεται εύλογη η υπόθεση ότι οι αναλογίες παιδιών με ή χωρίς ιστορικό βρογχίτιδας που παρουσιάζουν αναπνευστικά προβλήματα σε μετέπειτα στάδιο της παιδικής ηλικίας είναι ίσες. Ο χ Έλεγχος με Γνωστά Αθροίσματα Γραμμών και Στηλών (Σταθερές Περιθώριες) (The Chi-square Test with Fixed Marginal Totals) Η ενότητα αυτή αναφέρεται σε μία τρίτη κατηγορία προβλημάτων εφαρμογής των πινάκων συναφείας, τα σύνολα των γραμμών αλλά και των στηλών είναι δεδομένα (γνωστά). Τα δεδομένα συνοψίζονται σε ένα rc πίνακα συναφείας, όπως και στις δύο προηγούμενες περιπτώσεις με την διαφορά ότι τα σύνολα των γραμμών και τα σύνολα των στηλών δεν είναι τυχαίες τιμές, αλλά είναι σταθερές που συμβολίζονται με n i, i =,,.., r και m j, j =,,, c, αντίστοιχα. Ο συνολικός αριθμός των παρατηρήσεων είναι Ν. 43

18 c Σύνολο O O O c n O O O c n r O r O r O rc n r Σύνολο m m m c Ν Και στην περίπτωση αυτή, οι παρατηρήσεις προέρχονται από ένα μόνο τυχαίο δείγμα και κάθε παρατήρηση μπορεί να ταξινομηθεί σε ένα μόνο κελλί του πίνακα. Οι υποθέσεις που ενδιαφερόμαστε να ελέγξουμε στην περίπτωση αυτή, μπορεί να έχουν οποιαδήποτε από τις μορφές των υποθέσεων που αναφέρονται στις δύο προηγούμενες περιπτώσεις με την πρόσθετη προϋπόθεση ότι τα σύνολα των γραμμών και των στηλών έχουν σταθερές τιμές. Εναλλακτικά, οι υποθέσεις μπορούν να διατυπώνονται με κατάλληλες τροποποιήσεις των υποθέσεων των προηγουμένων δύο κατηγοριών προβλημάτων ώστε να ανταποκρίνονται στην συγκεκριμένη πειραματική περίπτωση. Συνήθως, οι υποθέσεις αποτελούν παραλλαγές της υπόθεσης της ανεξαρτησίας της περίπτωσης που εξετάσθηκε στην προηγούμενη ενότητα με τις απαραίτητες τροποποιήσεις που υπαγορεύονται από το συγκεκριμένο πείραμα. (Μία συνήθης πρόσθετη «απαίτηση» είναι η κατασκευή ενός πίνακα συναφείας με ίσες αναμενόμενες συχνότητες στα κελλιά του). Έτσι, όπως θα δούμε στο πλαίσιο του επόμενου παραδείγματος, ο έλεγχος αυτής της περίπτωσης μπορεί να χρησιμοποιηθεί για τον έλεγχο της υπόθεσης 44

19 Η 0 : Οι τυχαίες μεταβλητές Χ και Y είναι ανεξάρτητες με βάση ένα δείγμα ανεξαρτήτων παρατηρήσεων (X,Y ),(X,Y ),...,(X N,YN ) πάνω στην διδιάστατη μεταβλητή (X, Y). Η εναλλακτική υπόθεση είναι η άρνηση της μηδενικής, δηλαδή Η : Οι τυχαίες μεταβλητές Χ και Y είναι εξαρτημένες. Αν η μηδενική υπόθεση είναι αληθής, οι αναμενόμενες συχνότητες στα κελιά του πίνακα δίνονται από την σχέση E n im j/n, i =,,.., r και j =,,, c. Και πάλι, η προφανής επιλογή στατιστικής συνάρτησης είναι η στατιστική συνάρτηση T r i c j (O E ) /E και η κρίσιμη περιοχή του ελέγχου θα αντιστοιχεί σε μεγάλες τιμές αυτής. Η ακριβής μορφή της κατανομής της στατιστικής συνάρτησης Τ μπορεί να προκύψει ευκολότερα από ό,τι στις δύο προηγούμενες περιπτώσεις εφαρμογών λόγω του ότι τα σύνολα των γραμμών και των στηλών του πίνακα συναφείας είναι σταθερά. Παρόλα αυτά, η διαδικασία προσδιορισμού της κατανομής της στατιστικής συνάρτησης Τ εξακολουθεί να είναι πολύπλοκη και χρονοβόρα. Η χ κατανομή και στην περίπτωση αυτή προσφέρει μία ικανοποιητική προσέγγιση της κατανομής της Τ. Συγκεκριμένα, r c (O E ) T ~ χ (r-) (c-). E i j Επομένως, η κρίσιμη περιοχή του ελέγχου των παραπάνω υποθέσεων ορίζεται από την ανισότητα 45

20 T. χ (r ) (c),α Όσο αφορά το επίπεδο σημαντικότητας α του ελέγχου, ισχύουν τα σχόλια τα οποία διατυπώθηκαν στις προηγούμενες δύο περιπτώσεις εφαρμογών. Σημείωση: Όπως αναφέρθηκε στα προηγούμενα, συχνά απαιτείται η κατασκευή πινάκων συναφείας έτσι ώστε οι αναμενόμενες συχνότητες στα προκύπτοντα κελλιά να είναι ίσες. Μεταξύ αυτών των περιπτώσεων περιλαμβάνονται και αυτές κατά τις οποίες περιμένει κανείς ότι οι αναμενόμενες συχνότητες θα έχουν χαμηλές τιμές, πράγμα το οποίο θα έχει επίδραση στον βαθμό που θα είναι ικανοποιητική η προσέγγιση της κατανομής της στατιστικής συνάρτησης Τ από την κατανομή χ. Η επίδραση αυτή «αίρεται» στην περίπτωση που οι αναμενόμενες συχνότητες είναι περίπου ίσες.) Παράδειγμα: Ας θεωρήσουμε το παρακάτω διάγραμμα 4 σημείων, τα οποία παριστούν ανεξάρτητες παρατηρήσεις (X 4,Y ),(X,Y ),...,(X 4,Y ) πάνω στην διδιάστατη τυχαία μεταβλητή (X, Y). Η x-συνιστώσα κάθε σημείου παριστά την παρατηρηθείσα τιμή της μεταβλητής Χ και η y-συνιστώσα την παρατηρηθείσα τιμή της τυχαίας μεταβλητής Y σε κάθε μία από τις παρατηρήσεις πάνω στην (Χ, Y). Ας υποθέσουμε ότι τα παρατηρηθέντα ζεύγη (Χ i, Y i ), i =,,, 4 είναι αμοιβαία ανεξάρτητα. Να ελεγχθούν οι υποθέσεις Η 0 : Οι μεταβλητές Χ και Υ είναι ανεξάρτητες Η : Οι μεταβλητές Χ και Υ είναι εξαρτημένες 46

21 σε επίπεδο σημαντικότητας περίπου ίσο με y x Λύση: Προκειμένου να σχηματίσουμε έναν πίνακα συναφείας μπορούμε να χωρίσουμε τα σημεία του διαγράμματος σε γραμμές και στήλες με την βοήθεια διακεκομμένων γραμμών παράλληλων και κάθετων στον άξονα των x. Οι αριθμοί των σημείων που θα εμφανίζονται στα κελλιά τα οποία θα σχηματισθούν, θα αποτελούν τις παρατηρούμενες συχνότητες εμφάνισης των παρατηρήσεων πάνω στην μεταβλητή (Χ, Υ). Προκειμένου να σχηματισθεί ένας πίνακας συναφείας τέτοιος ώστε όλες οι αναμενόμενες τιμές Ε να είναι ίσες, χωρίζουμε τα σημεία του διαγράμματος σε 3 γραμμές των 8 σημείων και σε 4 στήλες των 6 σημείων όπως στο διάγραμμα που ακολουθεί. Αυτός ο τρόπος χωρισμού οδηγεί σε ίσα αθροίσματα γραμμών και ίσα αθροίσματα στηλών. 47

22 Ο πίνακας συναφείας που προκύπτει δίνει τους παρατηρούμενους αριθμούς σημείων στα κελλιά που σχηματίζονται από τις γραμμές και τις στήλες του προηγουμένου σχήματος. Στήλη Γραμμή 3 4 Σύνολο Σύνολο Η στατιστική συνάρτηση για τον έλεγχο των υποθέσεων του προβλήματος αυτού δίνεται από την σχέση T 3 i 4 j (O E ) /E και η κρίσιμη περιοχή μεγέθους περίπου ίσου με 0.05 ορίζεται από την ανισότητα T χ.59. 6,

23 Προφανώς (6)(8)/4, για κάθε i και j. Επομένως, η E παρατηρούμενη τιμή τ της στατιστικής συνάρτησης Τ είναι (O E ) (O i j E i j ) 4. Επειδή η τιμή τ υπερβαίνει την κρίσιμη τιμή, η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητας 0.05 και συμπεραίνουμε ότι η υπόθεση της ανεξαρτησίας των μεταβλητών Χ και Υ δεν είναι εύλογη. Το κρίσιμο επίπεδο του ελέγχου είναι: αˆ P(T 4 H ) P(χ 4)

24 ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ ΜΙΑ ΕΝΔΙΑΦΕΡΟΥΣΑ ΕΙΔΙΚΗ ΠΕΡΙΠΤΩΣΗ Οι rc πίνακες συναφείας που εξετάσθηκαν την προηγούμενη ενότητα, αποτελούν εν γένει μία παράθεση φυσικών αριθμών ταξινομημένων σε r γραμμές και c στήλες που, έτσι, οδηγούν σε rc κατηγορίες που εκπροσωπούνται από τα κελλιά των πινάκων. Οι περιπτώσεις των πινάκων όπου r= και c=, δηλαδή οι πίνακες συναφείας, αποτελούν μία ενδιαφέρουσα ειδική περίπτωση των rc πινάκων συναφείας, ιδιαίτερα στην περιοχή των βιοϊατρικών προβλημάτων. Για τον λόγο αυτό εξετάζονται ως μία ξεχωριστή κατηγορία στην ενότητα αυτή. Κατ αναλογία με τους rc πίνακες συναφείας, μία εφαρμογή των πινάκων συναφείας προκύπτει όταν επιθυμούμε να αναλύσουμε τα στοιχεία δύο ανεξαρτήτων δειγμάτων από δύο διαφορετικούς πληθυσμούς για να εξετάσουμε κατά πόσο οι δύο πληθυσμοί εκπροσωπούνται με ίσα ή με διαφορετικά ποσοστά στοιχείων σε μία συγκεκριμένη κατηγορία. (Ειδικότερα, δύο τυχαία δείγματα επιλέγονται, ένα από κάθε πληθυσμό, για να ελεγχθεί η μηδενική υπόθεση ότι η πιθανότητα κάποιου συγκεκριμένου ενδεχομένου Α είναι η ίδια για τους δύο πληθυσμούς). Μία άλλη εφαρμογή των πινάκων συναφείας προκύπτει όταν Ν αντικείμενα (ή πρόσωπα), επιλεγέντα με τυχαίο τρόπο από κάποιο πληθυσμό, ταξινομούνται σε μία από δύο κατηγορίες πριν από την εφαρμογή μίας αγωγής (ή πριν από την εμφάνιση κάποιου άλλου ενδεχομένου). Μετά την εφαρμογή της αγωγής (ή μετά την εμφάνιση του ενδεχομένου), τα Ν αντικείμενα (ή πρόσωπα) επανεξετάζονται και ταξινομούνται εκ νέου στις δύο κατηγορίες. Το ερώτημα που επιθυμούμε να 50

25 εξετάσουμε διατυπώνεται ως εξής: «Η υιοθετηθείσα αγωγή (ή η εμφάνιση του ενδεχομένου) μεταβάλλει σημαντικά το ποσοστό των μονάδων ή προσώπων σε κάθε μία από τις δύο κατηγορίες;». Ένας άλλος τρόπος για τον έλεγχο της ίδιας υπόθεσης είναι να χρησιμοποιηθούν εκτιμήσεις των ποσοστών των μονάδων του πληθυσμού στις διάφορες κατηγορίες βασισμένες σε συσχετισμένες παρατηρήσεις, δηλαδή ζεύγη παρατηρήσεων. Οι έλεγχοι υποθέσεων που βασίζονται σε ένα και μοναδικό δείγμα ή σε δύο συσχετισμένα δείγματα (δηλαδή σε ένα δείγμα ζευγών παρατηρήσεων), είναι ιδιαίτερα σημαντικές στην περιοχή των βιοϊατρικών προβλημάτων, όπου τυπικό επιδημιολογικό εργαλείο αποτελούν οι αναδρομικές έρευνες περιπτώσεων μαρτύρων. Ας υποθέσουμε ότι ένας ερευνητής επιθυμεί να εξετάσει κατά πόσο υπάρχει συσχέτιση μεταξύ ενός παράγοντα κινδύνου (για παράδειγμα, χρήσης αντισυλληπτικών χαπιών) και μίας ασθένειας (για παράδειγμα θρομβοεμβολής). Επειδή η εμφάνιση νέων περιστατικών της ασθένειας είναι χαμηλή, θα χρειαζόταν μία εξαιρετικά μεγάλη αναδρομική μελέτη για τον εντοπισμό επαρκούς αριθμού περιπτώσεων. Μία στρατηγική θα ήταν να ξεκινήσει κανείς με τον αριθμό των περιπτώσεων. Τότε, το πρόβλημα θα ήταν να βρεθούν κατάλληλοι μάρτυρες (μονάδες σύγκρισης) για τις περιπτώσεις. Στην περίπτωση των μελετών που στηρίζονται σε συσχετισμένα δείγματα, ορίζεται για κάθε περίπτωση ένας μάρτυρας (μία μονάδα σύγκρισης). Ο μάρτυρας, ο οποίος δεν έχει την ασθένεια, πρέπει να επιλεγεί ώστε να ταυτίζεται με την περίπτωση από όλες τις σχετικές απόψεις εκτός, ενδεχομένως, από τον παράγοντα κινδύνου. Ο έλεγχος που χρησιμοποιείται για την ανάλυση δεδομένων πινάκων τέτοιας μορφής είναι γνωστός ως έλεγχος McNemar. 5

26 Στην περίπτωση που τα δεδομένα προέρχονται από ένα και μοναδικό δείγμα και είναι ταξινομημένα σε πίνακα συναφείας με σταθερά αθροίσματα γραμμών και στηλών, ο χρησιμοποιούμενος έλεγχος είναι γνωστός ως έλεγχος Fisher (Fisher s exact test). Έλεγχος χ για την ισότητα δύο αναλογιών (περίπτωση ανεξαρτήτων δειγμάτων) Ένα τυχαίο δείγμα n παρατηρήσεων επιλέγεται από ένα πληθυσμό και κάθε παρατήρηση ταξινομείται σε μία από δύο κατηγορίες (κατηγορία ή κατηγορία ). Ένα δεύτερο τυχαίο δείγμα n παρατηρήσεων επιλέγεται από έναν άλλο πληθυσμό (ή από τον πρώτο πληθυσμό μετά από την εφαρμογή κάποιας αγωγής) και κάθε παρατήρησή του επίσης ταξινομείται στις κατηγορίες και. Προκύπτει, επομένως, ο εξής πίνακας συναφείας Κατηγορία Κατηγορία Σύνολο Πληθυσμός Ο Ο n Πληθυσμός Ο Ο n Σύνολο C C N = n + n Έστω ότι η πιθανότητα με την οποία ένα τυχαία επιλεγόμενο στοιχείο από τον πληθυσμό ανήκει στην κατηγορία είναι p και ότι η αντίστοιχη πιθανότητα για τον πληθυσμό είναι p. Οι υποθέσεις που ενδιαφερόμαστε να ελέγξουμε έχουν μία από τις εξής μορφές: 5

27 Α. (Αμφίπλευρος Έλεγχος) Η 0 : p =p Η 0 : p p B. (Μονόπλευρος Έλεγχος) Η 0 : p p Η 0 : p >p Γ. (Μονόπλευρος Έλεγχος) Η 0 : p p Η 0 : p <p Όπως και στην περίπτωση των rc πινάκων, αν η Η 0 είναι αληθής, ο αριθμός των στοιχείων που περιμένουμε να παρατηρήσουμε στο κελλί (i, j) του πίνακα είναι E n ic j/n. Και πάλι, ως μέτρο της εγγύτητας μεταξύ παρατηρούμενων και αναμενόμενων συχνοτήτων προκειμένου να εξετασθεί αν τα δεδομένα παρέχουν ενδείξεις υπέρ της μηδενικής υπόθεσης, χρησιμοποιείται η στατιστική συνάρτηση T i j (O E ) E, η οποία μπορεί να γραφεί με την μορφή N(OO OO T n n C C ). 53

28 Για τους μονόπλευρους ελέγχους χρησιμοποιείται συνήθως η στατιστική συνάρτηση T T N(O O n n O C C O ). Η ακριβής μορφή της κατανομής της στατιστικής συνάρτησης Τ, αντίστοιχα της Τ, δεν είναι εύκολο να προσδιορισθεί λόγω του μεγάλου αριθμού των διαφορετικών συνδυασμών των δυνατών τιμών για τις παρατηρούμενες συχνότητες Ο, Ο, Ο και Ο. (Η διαδικασία προσδιορισμού της κατανομής της στατιστικής συνάρτησης Τ περιγράφεται στην συνέχεια). Χρησιμοποιούνται, επομένως, προσεγγίσεις των κατανομών αυτών. Έτσι, σύμφωνα με τα όσα ισχύουν για την περίπτωση των rc πινάκων, η κατανομή της στατιστικής συνάρτησης Τ μπορεί να προσεγγισθεί από την κατανομή χ με βαθμό ελευθερίας. Δηλαδή, T ~. Όσο αφορά την κατανομή της στατιστικής συνάρτησης Τ, αποδεικνύεται ότι μπορεί να προσεγγισθεί από την τυποποιημένη κανονική κατανομή, δηλαδή T ~ N(0,). Επομένως, ο κανόνας απόφασης έχει την εξής μορφή: χ Α. (Αμφίπλευρος Έλεγχος) Η μηδενική υπόθεση Η 0 απορρίπτεται σε επίπεδο σημαντικότητας περίπου ίσο με α αν T, όπου χ, α συμβολίζει το ( α)- χ, α 54

29 ποσοστιαίο σημείο της κατανομής χ. B. (Μονόπλευρος Έλεγχος) Η μηδενική υπόθεση Η 0 απορρίπτεται σε επίπεδο σημαντικότητας περίπου ίσο με α αν T z - α, όπου z α είναι το ( α)-ποσοστιαίο σημείο της τυποποιημένης κανονικής κατανομής. Γ. (Μονόπλευρος Έλεγχος) Η μηδενική υπόθεση Η 0 απορρίπτεται σε επίπεδο σημαντικότητας περίπου ίσο με α αν τυποποιημένης κανονικής κατανομής. T z α, όπου z α είναι το α-ποσοστιαίο σημείο της Παράδειγμα: Το παράδειγμα που αναφέρεται στην μελέτη παιδιών με ή χωρίς ιστορικό βρογχίτιδας κατά την νηπιακή ηλικία που παρουσιάζουν αναπνευστικά προβλήματα σε μετέπειτα στάδιο της παιδικής τους ηλικίας, είναι τυπικό για την περίπτωση ελέγχου υποθέσεων της περίπτωσης Α. Παράδειγμα: Σε μία στρατιωτική σχολή τοποθετήθηκε ένα νέο σύστημα φωτισμού στους θαλάμους των μαθητευομένων. Προκειμένου να ελεγχθεί ο ισχυρισμός ότι το νέο σύστημα φωτισμού προκαλούσε κόπωση στα μάτια που οδηγούσε σε κακή όραση, επελέγησαν δύο ανεξάρτητα τυχαία δείγματα 85 και 86 αποφοιτησάντων από την σχολή, την χρονιά που προηγήθηκε της εγκατάστασης του νέου συστήματος φωτισμού (πρώτο δείγμα) και την χρονιά των πρώτων αποφοίτων μετά την εγκατάσταση του νέου φωτισμού (δείγμα ). Τα αποτελέσματα συνοψίζονται στον πίνακα που ακολουθεί. 55

30 Καλή όραση Κακή όραση Παλαιός Φωτισμός Ο = 74 Ο = n = 85 Νέος Φωτισμός Ο = 66 Ο = 54 n = 86 Σύνολα Ν = 64 Να ελεγχθεί ο ισχυρισμός σε επίπεδο σημαντικότητας περίπου ίσο με α=0.05. Λύση: Έστω p η πιθανότητα ότι ένας τυχαία επιλεγόμενος απόφοιτος είχε καλή όραση κάτω από το παλαιό σύστημα φωτισμού και p η αντίστοιχη πιθανότητα κάτω από το νέο σύστημα φωτισμού. Οι υποθέσεις που έχει έννοια να ελεγχθούν μπορούν να γραφούν με την μορφή: Η 0 : p p H : p >p. Η κατάλληλη στατιστική συνάρτηση για τον έλεγχο των παραπάνω υποθέσεων είναι η Τ και είναι προφανές ότι η κρίσιμη περιοχή μεγέθους 0.05 του ελέγχου ορίζεται από την ανισότητα z.645. T 0.95 Η παρατηρούμενη τιμή της Τ είναι τ 64 [(74)(54) ()(66) ].98. (85)(86)(376)(65) Η τιμή αυτή βρίσκεται μέσα στην κρίσιμη περιοχή μεγέθους 0.05 και, επομένως, η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητας 5%. Το κρίσιμο επίπεδο του ελέγχου είναι ˆ P(T.98 H ) (.98) α 0 56

31 Είναι εύλογο, επομένως, να συμπεράνει κανείς ότι οι πληθυσμοί των δύο τάξεων αποφοίτων διαφέρουν στατιστικά σημαντικά όσο αφορά τα ποσοστά αυτών που έχουν κακή όραση σύμφωνα με τον ισχυρισμό. Δηλαδή, ο πληθυσμός των αποφοίτων πριν από την εγκατάσταση του νέου συστήματος φωτισμού έχει καλύτερη όραση από αυτή του πληθυσμού των αποφοίτων με το νέο σύστημα φωτισμού. Παρατήρηση: Θα πρέπει να σημειωθεί ότι το ερώτημα «κατά πόσο η κακή όραση είναι αποτέλεσμα της τοποθέτησης του νέου συστήματος φωτισμού» δεν έχει απαντηθεί. Όμως, έχει τεκμηριωθεί μία σχέση μεταξύ της χαμηλής όρασης και του νέου φωτισμού. Προσδιορισμός της ακριβούς κατανομής της στατιστικής συνάρτησης Τ Η ακριβής μορφή της κατανομής της στατιστικής συνάρτησης Τ όταν η μηδενική υπόθεση Η 0 : p = p = p είναι σωστή, μπορεί να προσδιορισθεί ως εξής: Για το δείγμα που προέρχεται από τον πληθυσμό, η πιθανότητα ότι ακριβώς x στοιχεία ανήκουν στην κατηγορία και n x στοιχεία ανήκουν στην κατηγορία δίνεται από την σχέση P Πληθυσμός Δείγμα [x Δείγμα n p n x ] x ( p) x nx. Με όμοιο τρόπο, η πιθανότητα ότι το δείγμα που προέρχεται από τον πληθυσμό θα έχει ακριβώς x στοιχεία στην κατηγορία και n x στοιχεία στην κατηγορία δίνεται από την σχέση: 57

32 P Πληθυσμός Δείγμα [x Δείγμα n n x ] x p ( p) x n x. Επειδή τα δύο δείγματα είναι ανεξάρτητα, η από κοινού πιθανότητα των δύο ενδεχομένων προκύπτει ίση με Δείγμα P Πληθυσμός x Πληθυσμός x Δείγμα n x n n xx N-xx p ( p) x x n x Στην απλή περίπτωση όπου n = και n =, υπάρχουν εννέα διαφορετικά σημεία στον δειγματικό χώρο, αντιστοιχούντα στις εννέα δυνατές ταξινομήσεις σε πίνακες συναφείας οι οποίες παρατίθενται στην συνέχεια. 58

33 Πίνακας Δυνατών ταξινομήσεων των στοιχείων δύο ανεξάρτητων δειγμάτων μεγέθους n =n = σε πίνακα συναφείας Πιθανότητα αν η Η 0 είναι αληθής Δυνατές Ταξινομήσεις p / p Τ p /6 Δεν ορίζεται 0 p3( p) /8 0 4/3 0 0 p ( p) / p3 ( p) /8 0 4/3 3 p) p ( p) /4 0 0 p( /8 0 4/3 p ( p) /6 0 4 p( p) /8 0 4/3 ( p) /6 0 Δεν ορίζεται 59

34 Οι τιμές της στατιστικής συνάρτησης Τ, οι οποίες δεν ορίζονται αντιστοιχούν στις περιπτώσεις της απροσδιόριστης μορφής 0/0. Επειδή, όμως, τα δύο ενδεχόμενα τα οποία οδηγούν σε μη οριζόμενες τιμές της Τ είναι ενδεικτικά του ότι η Η 0 είναι αληθής, όπως ακριβώς και το πέμπτο ενδεχόμενο είναι ενδεικτικό ότι η Η 0 είναι αληθής, η τιμή της Τ μπορεί αυθαίρετα να ορισθεί ίση με 0 για το πρώτο και για το τελευταίο ενδεχόμενο, κατ αναλογία με την περίπτωση που αντιστοιχεί στο πέμπτο ενδεχόμενο. Τότε, η στατιστική συνάρτηση Τ έχει την εξής κατανομή πιθανότητας: p / p P(T 0) 3/ 8 P(T 0) P(T 4 / 3) / P(T 4) / 8 Με τον ίδιο τρόπο, για οποιαδήποτε μεγέθη δειγμάτων n και n, η ακριβής μορφή της κατανομής πιθανότητας της στατιστικής συνάρτησης Τ μπορεί να προσδιορισθεί ορίζοντας κατάλληλα τις «μη οριζόμενες» τιμές της Τ. Παρατήρηση: Η συνάρτηση πιθανότητας της στατιστικής συνάρτησης Τ, όμως, δεν ορίζεται μονοσήμαντα ακόμη και στην περίπτωση που η Η 0 υποτίθεται ότι είναι αληθής, αλλά εξαρτάται από την παράμετρο p. Άρα, η μηδενική υπόθεση του παραπάνω ελέγχου είναι σύνθετη. Μπορεί να αποδειχθεί, ότι το μέγεθος της κρίσιμης περιοχής α μεγιστοποιείται όταν 60

35 p=/. Επομένως, το επίπεδο σημαντικότητας α της κατανομής της στατιστικής συνάρτησης Τ μπορεί να προσδιορισθεί στην απλή περίπτωση που έχουμε θεωρήσει παραπάνω θέτοντας p=/. Αν η κρίσιμη περιοχή αντιστοιχεί στην μέγιστη τιμή της στατιστικής συνάρτησης Τ (δηλαδή, τ=4), τότε α=0.5. Όπως αναφέρθηκε στα προηγούμενα, η ασυμπτωτική κατανομή της στατιστικής συνάρτησης Τ είναι η χ με βαθμό ελευθερίας. (Για την απόδειξη του αποτελέσματος αυτού ο ενδιαφερόμενος αναγνώστης παραπέμπεται στο βιβλίο του Cramér (946)). Παρατήρηση: Προκειμένου να αντισταθμισθεί εν μέρει η ανακρίβεια που εισάγεται από την χρήση μίας συνεχούς συνάρτησης κατανομής (της χ ) για την προσέγγιση της διακριτής συνάρτησης κατανομής της στατιστικής συνάρτησης Τ, ο Yates (934) πρότεινε την λεγόμενη διόρθωση συνεχείας (correction for continuity). Η κατά Yates τροποποιημένη μορφή της στατιστικής συνάρτησης Τ έχει την μορφή N [ OO OO (N/)] T'. n n C C Η διόρθωση συνίσταται στην μείωση της απόλυτης τιμής της διαφοράς OO OO κατά την ποσότητα Ν/ πριν από την ύψωσή της στο τετράγωνο. Όμως, πολλοί στατιστικοί (Pearson (947), Plackett (964), Grizzle (967), Conover (974)) θεωρούν ότι η διόρθωση αυτή οδηγεί σε μία πολύ συντηρητική τιμή για το μέτρο της εγγύτητας των παρατηρούμενων και αναμενόμενων τιμών και αντιτίθενται στην εφαρμογή της γιατί οι τιμές της στατιστικής συνάρτησης Τ βρίσκονται εγγύτερα σ 6

36 αυτές μιας χ μεταβλητής με βαθμό ελευθερίας από τις τιμές της στατιστικής συνάρτησης Τ. Ο χ Έλεγχος Ανεξαρτησίας (Περίπτωση Ενός και Μοναδικού Δείγματος) Όπως και στην περίπτωση των rc πινάκων, οι υποθέσεις που θέλουμε να ελέγξουμε αναφέρονται στην ανεξαρτησία των ενδεχομένων {μία παρατήρηση ανήκει στην i γραμμή} και {η ίδια παρατήρηση ανήκει στην j στήλη}. Από τον ορισμό της ανεξαρτησίας ενδεχομένων, οι προς έλεγχο υποθέσεις μπορούν, προφανώς, να διατυπωθούν ως εξής: H 0 : p p, i, j, p i..j H : p pi. p.j, για κάποιες τιμές των i, j, όπου p i. είναι η πιθανότητα εμφάνισης του πρώτου ενδεχομένου, p.j είναι η πιθανότητα εμφάνισης του δευτέρου ενδεχομένου και p είναι η από κοινού πιθανότητα των δύο ενδεχομένων. Επομένως, εάν η μηδενική υπόθεση είναι αληθής, η αναμενόμενη συχνότητα στο (i, j) κελλί προκύπτει από την σχέση E N(R /N) (C /N) R C /N. i Η στατιστική συνάρτηση για τον έλεγχο των παραπάνω υποθέσεων ορίζεται όπως και προηγουμένως από την σχέση j i j 6

37 T i j (O E E ) i j O E N N(OO OO n n C C η οποία ταυτίζεται με την στατιστική συνάρτηση Τ της προηγούμενης περίπτωσης. Όπως και στην προηγούμενη περίπτωση, η ακριβής μορφή της κατανομής της στατιστικής συνάρτησης Τ δεν είναι εύκολο να προσδιορισθεί. (Η διαδικασία προσδιορισμού της κατανομής της στατιστικής συνάρτησης Τ περιγράφεται στην συνέχεια). Για τον λόγο αυτό, συνήθως χρησιμοποιείται η προσέγγισή της από την κατανομή Δηλαδή, χ T ~. ), χ. Η κρίσιμη περιοχή του ελέγχου των παραπάνω υποθέσεων, επομένως, βρίσκεται στην δεξιά ουρά της κατανομής χ με βαθμό ελευθερίας και προσδιορίζεται από την ανισότητα T. χ, -α Παράδειγμα: Τα στοιχεία του πίνακα που ακολουθεί αναφέρονται σε μία έρευνα με στόχο την μελέτη του κατά πόσο το κάπνισμα συνδέεται με την εμφάνιση καρκίνου του πνεύμονα και αναφέρονται στην ταξινόμηση 60 περιστατικών θανάτου όπως αυτά συνελέγησαν από το ληξιαρχείο μίας περιοχής. 63

38 Αιτία θανάτου Καρκίνος Πνεύμονα Άλλη Σύνολα Καπνιστές Μη Καπνιστές Σύνολα Τι θα μπορούσε να συμπεράνει κανείς με βάση τα στοιχεία αυτά; Λύση: Η προς έλεγχο μηδενική υπόθεση είναι η Η 0 : Το κάπνισμα δεν σχετίζεται με την αιτία θανάτου. Η τιμή της στατιστικής συνάρτησης για τα δεδομένα του παραπάνω πίνακα προκύπτει ίση με 60((3)(57) (73)(7)) τ.6. (86)(74)(30)(30) Το κρίσιμο επίπεδο του ελέγχου είναι ίσο με αˆ P(T.6H ) P(χ.6) Επομένως, η υπόθεση ότι το κάπνισμα δεν σχετίζεται με την αιτία θανάτου μπορεί να θεωρηθεί μία εύλογη υπόθεση. Προσδιορισμός της ακριβούς κατανομής της στατιστικής συνάρτησης Τ Η ακριβής μορφή της κατανομής της στατιστικής συνάρτησης Τ μπορεί να προσδιορισθεί με τρόπο ανάλογο αυτού της προηγούμενης περίπτωσης πινάκων συναφείας. Ας θεωρήσουμε και πάλι την απλή περίπτωση Ν=4. Έστω p η πιθανότητα ότι μία παρατήρηση ανήκει στην i γραμμή και j στήλη. (Η πιθανότητα αυτή δεν είναι η ίδια με την πιθανότητα p της προηγούμενης 64

39 περίπτωσης. Εδώ το άθροισμα των p σε όλα τα κελλιά του πίνακα ( p ) είναι ίσο με. Στην προηγούμενη περίπτωση, οι τιμές p σε i, j κάθε γραμμή άθροιζαν στην μονάδα ( p ) ). Επομένως, η πιθανότητα του ενδεχομένου i Στήλη Στήλη Γραμμή a b Γραμμή c d Ν υπολογίζεται με βάση την πολυωνυμική κατανομή ίση με N! a!b!c!d! (p a b c d ) (p ) (p ) (p ) γιατί ο αριθμός των τρόπων με τους οποίους Ν αντικείμενα μπορούν να ταξινομηθούν στα παραπάνω κελλιά ισούται με τον πολυωνυμικό συντελεστή N!/a!b!c!d! και κάθε αποτέλεσμα έχει πιθανότητα (p. a b c d ) (p ) (p ) (p ) Μπορεί να αποδειχθεί ότι τo μέγιστο μέγεθος της κρίσιμης περιοχής, η οποία βρίσκεται στην δεξιά ουρά της κατανομής της στατιστικής συνάρτησης Τ, όταν η μηδενική υπόθεση Η 0 είναι αληθής, αντιστοιχεί στην περίπτωση p /4, i,, j,. σχέση Επομένως, το επίπεδο σημαντικότητας α προσδιορίζεται από την 65

40 N! P a c d b, a!b!c!d! 4 για κάθε δυνατή ταξινόμηση των Ν στοιχείων. Για Ν=4 υπάρχουν 35 διαφορετικές τέτοιες ταξινομήσεις (πίνακες συναφείας), οι οποίες παρατίθενται στην συνέχεια. N Πίνακας Δυνατών ταξινομήσεων των στοιχείων ενός τυχαίου δείγματος μεγέθους Ν=4 σε πίνακα συναφείας Τ=0 Τ=4/9 Τ=4/3 Τ=4 Ενδεχόμενο Πιθανότητα Ενδεχόμενο Πιθανότητα Ενδεχόμενο Πιθανότητα Ενδεχόμενο Πιθανότητα (/4) 4 (/4) (/4) (/4) 4 0 (/4) 4 0 (/4) (/4) (/4) 4 0 (/4) (/4) 4 0 (/4) 4 (/4) (/4) 4 Σύνολο = 48/ (/4) (/4) 4 0 (/4) (/4) 4 0 4(/4) 4 4(/4) 4 0 4(/4) 4 6(/4) 4 0 6(/4) 4 Σύνολο = 8/56 (συνεχίζεται) 66

41 Πίνακας Δυνατών ταξινομήσεων των στοιχείων ενός τυχαίου δείγματος μεγέθους Ν=4 σε πίνακα συναφείας (συνέχεια) Τ=0 Τ=4/9 Τ=4/3 Τ=4 Ενδεχόμενο Πιθανότητα Ενδεχόμενο Πιθανότητα Ενδεχόμενο Πιθανότητα Ενδεχόμενο Πιθανότητα 0 0 4(/4) (/4) 4 0 (/4) 4 4(/4) 4 Σύνολο = 96/56 0 4(/4) (/4) (/4) (/4) (/4) (/4) 4 0 6(/4) (/4) 4 Σύνολο = 84/56 67

42 Όπως και προηγουμένως, ορίζουμε την απροσδιόριστη τιμή 0/0 ως ίση με 0. Επομένως, η ακριβής κατανομή της στατιστικής συνάρτησης Τ όταν όλες οι τιμές p είναι ίσες με ¼ είναι η P(T=0)=84/56= 0.33 P(T=4/9)=48/56= 0.9 P(T=4/3)=96/56= 0.37 P(T=4)=8/56= 0. Αν η κρίσιμη περιοχή αντιστοιχεί στην μέγιστη τιμή, τ=4, της στατιστικής συνάρτησης Τ, τότε α=0.. Σύγκριση της διαδικασίας προσδιορισμού της ακριβούς μορφής της κατανομής της στατιστικής συνάρτησης Τ στην περίπτωση ενός μόνο δείγματος (παρούσα περίπτωση), όπου μόνο η τιμή Ν είναι γνωστή, με την διαδικασία προσδιορισμού της κατανομής της αντίστοιχης στατιστικής συνάρτησης Τ της προηγούμενης περίπτωσης, όπου και τα αθροίσματα γραμμών είναι επίσης γνωστά, δείχνει ότι, στην προκειμένη περίπτωση, η κατανομή της στατιστικής συνάρτησης Τ είναι πολύ πιο δύσκολο να προσδιορισθεί λόγω του πολύ μεγαλύτερου αριθμού δυνατών ταξινομήσεων. Ο χ Έλεγχος Ανεξαρτησίας - Ο Έλεγχος McNemar (Περίπτωση Δύο Συσχετισμένων Δειγμάτων) Όπως ήδη αναφέρθηκε, ένας άλλος τρόπος ελέγχου της ίδιας υπόθεσης με αυτήν που ελέγχει ο έλεγχος ανεξαρτησίας με ένα και μοναδικό δείγμα, είναι με βάση δύο συσχετισμένα δείγματα, ένα από την ομάδα των περιπτώσεων (ασθενούντων) και ένα από την ομάδα σύγκρισης ή μαρτύρων. Κάθε μάρτυρας, ο οποίος δεν έχει την ασθένεια, πρέπει να «ταιριάζει» με 68

43 την περίπτωση (ασθενούντα) ως προς κάθε άλλο σχετικό παράγοντα εκτός, ενδεχομένως, από τον υπό μελέτη παράγοντα κινδύνου. Τα αποτελέσματα μιας μελέτης που βασίζεται σε συσχετισμένα δείγματα πρέπει να συνοψίζονται μέσω των συσχετισμένων ζευγών παρατηρήσεων όπως στον πίνακα που ακολουθεί. Μάρτυρας εκτεθείς στον παράγοντα κινδύνου Περίπτωση εκτεθείσα Ναι Όχι στον παράγοντα κινδύνου Ναι a b Όχι c d Κάθε ένα από τα μέλη ενός ζεύγους παρατηρήσεων έχει ή δεν έχει εκτεθεί στον παράγοντα κινδύνου και ταυτόχρονα, φυσικά, αποτελεί περίπτωση ή μάρτυρα. Τα δεδομένα τέτοιων μελετών είναι, προφανώς, σε ονομαστική κλίμακα με δύο κατηγορίες «Ναι» και «Όχι» ή και 0, αντίστοιχα. Επομένως, τα στοιχεία του παρακάτω πίνακα αποτελούν συχνότητα εμφάνισης των τιμών ενός δείγματος ανεξάρτητων παρατηρήσεων πάνω στο ζεύγος μεταβλητών (Χ, Υ), όπου Χ, αντίστοιχα Υ, αναφέρεται στην κατάσταση περίπτωσης, αντίστοιχα μάρτυρα, όσο αφορά την έκθεση τους στον παράγοντα κινδύνου. Εν γένει, δηλαδή, τα δεδομένα αποτελούνται από n ανεξάρτητες παρατηρήσεις (X i, Y i ), i =,,, n πάνω σε ένα ζεύγος δίτιμων μεταβλητών (Χ, Υ) ταξινομημένες σε έναν πίνακα συναφείας της μορφής: 69

44 Ταξινόμηση των τιμών των Y i Ταξινόμηση των τιμών των Χ i 0 0 a (αριθμός (0, 0)) b (αριθμός (0, )) c (αριθμός (, 0)) d (αριθμός (, )) Ζεύγη με την ίδια κατάσταση έκθεσης στον κίνδυνο τόσο για το μέλος-περίπτωση όσο και για το μέλος-μάρτυρα (δηλαδή ζεύγη της μορφής (, ) και (0, 0)) ονομάζονται εναρμονισμένα (concordant). Τα ζεύγη που αντιστοιχούν σε διαφορετικές καταστάσεις έκθεσης (δηλαδή ζεύγη της μορφής (, 0) και (0, )) ονομάζονται μη εναρμονισμένα (discordant). Οι υποθέσεις που ενδιαφερόμαστε να ελέγξουμε στις περιπτώσεις αυτές έχουν την μορφή: Η 0 : Δεν υπάρχει συσχέτιση μεταξύ του παράγοντα κινδύνου και της ασθένειας Η : Υπάρχει συσχέτιση μεταξύ του παράγοντα κινδύνου και της ασθένειας Κάτω από την μηδενική υπόθεση ότι δεν υπάρχει συσχέτιση μεταξύ του παράγοντα κινδύνου και της ασθένειας, σε κάθε μη εναρμονισμένο ζεύγος το μέλος-περίπτωση και το μέλος-μάρτυρας έχουν ίσες πιθανότητες να έχουν εκτεθεί στον παράγοντα κινδύνου. Επομένως, μόνο τα ζεύγη της μορφής (0, ) και (, 0) είναι ουσιαστικής σημασίας, γιατί η οποιαδήποτε απόκλιση από την μηδενική υπόθεση συνδέεται προφανώς με διαφορές στην αναλογία εμφάνισης αυτών των ζευγών. Ως εκ τούτου, στην πράξη, τα ζεύγη 70

45 της μορφής (, ) και (0, 0) αγνοούνται και η ανάλυση στηρίζεται στα απομένοντα n ζεύγη όπου n = (αριθμός (0, ) ζευγών + (αριθμός (, 0) ζευγών). Είναι προφανές, ότι οι προς έλεγχο υποθέσεις γράφονται με την μορφή: H 0 : P(X H : P(X 0,Y ) P(X,Y 0) 0,Y ) P(X, Y 0). Οι υποθέσεις αυτές παίρνουν την ισοδύναμη μορφή (με την προσθήκη του όρου P(X 0,Y 0) και στα δύο μέλη της εξίσωσης που εμφανίζεται στην Η 0 ) ως εξής: H 0 : P(X 0) P(Y 0) H : P(X 0) P(Y 0). Οι παραπάνω υποθέσεις είναι επίσης ισοδύναμες με τις υποθέσεις: H 0 : P(X H : P(X ) P(Υ ) ) P(Υ ). Θέτοντας p = P(0, ) p = P(, 0), οι προς έλεγχο υποθέσεις γράφονται με την μορφή H 0 : p p ή, ισοδύναμα, με την μορφή H, : p p H 0 : p / 7

46 H : p /. Η προφανής επιλογή στατιστικής συνάρτησης για τον έλεγχο των παραπάνω υποθέσεων είναι η T = αριθμός των (0, ) ζευγών, της οποίας η κατανομή είναι η διωνυμική με παραμέτρους n και p=p =/, H κάτω από την μηδενική υπόθεση. (Συμβολικά, T ~ 0 διωνυμική (n, p=/)). Η διωνυμική αυτή κατανομή είναι απόλυτα συμμετρική (αφού p=/) και μπορεί να προσεγγισθεί για n>0 από την κανονική κατανομή με μέση τιμή μ=n(/) και διασπορά σ H = n(/)(/). (Συμβολικά, Τ ~ 0 Ν(n/, n/4)). Επομένως, στην θέση της επιλεγείσας ελεγχοσυνάρτησης, μπορεί να χρησιμοποιηθεί η τυποποιημένη μορφή της T n(/) b n(/) T '. n(/)(/) (/) n Επειδή n=b+c, η παραπάνω σχέση γράφεται με την μορφή b [(b c)/] b c T '. b c/ b c Η κρίσιμη περιοχή του ελέγχου μπορεί, επομένως, να προσδιορισθεί χρησιμοποιώντας τις ουρές της τυποποιημένης κανονικής κατανομής και ορίζεται από την ανισότητα Τ >z -α. Στην πράξη, συχνά, αντί της στατιστικής συνάρτησης Τ, χρησιμοποιείται η στατιστική συνάρτηση (b c) T ( T '), b c η οποία προφανώς ακολουθεί την χ κατανομή με βαθμό ελευθερίας. Η κρίσιμη περιοχή μεγέθους α, επομένως, ορίζεται από την ανισότητα 7

47 T. χ, α Παράδειγμα: Τα στοιχεία του πίνακα που ακολουθεί αναφέρονται σε μία αναδρομική μελέτη περιπτώσεων-μαρτύρων με συσχετισμένα δείγματα (retrospective matched a case-control study) των Sartwell et All. (969) για την μελέτη της σχέσης μεταξύ θρομβοεμβολής και χρήσης αντισυλληπτικών χαπιών. Οι περιπτώσεις ήταν 75 γυναίκες στην αναπαραγωγική ηλικία (5-44), οι οποίες πήραν εξιτήριο από 43 νοσοκομεία σε 5 πόλεις των ΗΠΑ μετά από εκδήλωση ιδιοπαθούς θρομβοφλεβίτιδας, πνευμονικής εμβολής ή εγκεφαλικής θρόμβωσης. Σε κάθε ασθενούντα (περίπτωση) αντιστοιχίσθηκε ένας μάρτυρας, η επιλογή του οποίου έγινε με τρόπο που να ικανοποιούνται οι προϋποθέσεις για την «ταύτιση» του με τον ασθενούντα ως προς διάφορους σχετικούς με την έρευνα παράγοντες. Συγκεκριμένα, οι μάρτυρες αντιστοιχίσθηκαν με περιπτώσεις που είχαν τα ίδια ή παρόμοια χαρακτηριστικά όσο αφορά το νοσοκομείο στο οποίο νοσηλεύθηκαν, τον τόπο μόνιμης κατοικίας, τον χρόνο εισαγωγής στο νοσοκομείο, την φυλή στην οποία ανήκαν, την ηλικία, την οικογενειακή κατάσταση, το ιατρικό ιστορικό τους (ενδεχόμενες κυήσεις) και το είδος της περίθαλψης (ιδιωτική, ημι-ιδιωτική). Ειδικότερα, οι μάρτυρες ήταν γυναίκες που νοσηλεύθηκαν στο ίδιο νοσοκομείο κατά την διάρκεια του ιδίου εξάμηνου χρονικού διαστήματος. Τα δεδομένα όσο αφορά την χρήση αντισυλληπτικών χαπιών συνοψίζονται στον πίνακα που ακολουθεί. Μάρτυρες Περιπτώσεις Ναι Όχι Ναι 0 57 Όχι

48 Το ερώτημα που ενδιαφέρει να εξετασθεί είναι: Είναι οι περιπτώσεις περισσότερο πιθανές από τους μάρτυρες να έχουν χρησιμοποιήσει αντισυλληπτικά χάπια; Λύση: Αν οι καταστάσεις «Ναι» και «Όχι» αντιστοιχισθούν με τις καταστάσεις και «0», οι προς έλεγχο υποθέσεις μπορούν να γραφούν με την μορφή H 0 : p p ή, ισοδύναμα, την μορφή όπου H, : p p H 0 : p H : p / /, p P(0,) p P(, 0). Σύμφωνα με τα προηγούμενα, η κατάλληλη ελεγχοσυνάρτηση για τον έλεγχο των παραπάνω υποθέσεων είναι η (b c) T (T'), b c η οποία ακολουθεί την χ κατανομή με βαθμό ελευθερίας. Η κρίσιμη περιοχή μεγέθους α, επομένως, ορίζεται από την ανισότητα T. χ, α Με βάση τον παραπάνω πίνακα, η παρατηρούμενη τιμή της στατιστικής ελεγχοσυνάρτησης είναι 74

49 τ (b c) b c (57 3) Το κρίσιμο επίπεδο του ελέγχου είναι ίσο με αˆ P(T 7.66 H ) P(χ 7.66) Επομένως, η υπόθεση ότι δεν υπάρχει συσχέτιση μεταξύ του παράγοντα κινδύνου (χρήση αντισυλληπτικών χαπιών) και εμφάνισης θρομβοεμβολής δεν μπορεί να θεωρηθεί εύλογη. 75

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) .5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) Ο διωνυμικός έλεγχος μπορεί να χρησιμοποιηθεί για τον έλεγχο υποθέσεων αναφερομένων στα ποσοστιαία σημεία μίας τυχαίας μεταβλητής. Στην

Διαβάστε περισσότερα

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV 5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Ο έλεγχος της ενότητας αυτής αποτελεί μία επέκταση του μονόπλευρου ελέγχου Smirnov στην περίπτωση περισσοτέρων από δύο δειγμάτων. Ο έλεγχος αυτός

Διαβάστε περισσότερα

3.4.1 Ο Συντελεστής ρ του Spearman

3.4.1 Ο Συντελεστής ρ του Spearman 3.4. Ο Συντελεστής ρ του Spearma Έστω (, ), (, ),..., (, ) ένα δείγμα παρατηρήσεων πάνω στο τυχαίο διάνυσμα (, ). Έστω ( ) ο βαθμός ή η τάξη μεγέθους της μεταβλητής όταν αυτή συγκρίνεται με τις άλλες Χ

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή 4.3.3 Ο Έλεγχος των Shapro-Wlk για την Κανονική Κατανομή Ένας άλλος πολύ γνωστός έλεγχος καλής προσαρμογής για την κανονική κατανομή, ο οποίος μπορεί να χρησιμοποιηθεί στην θέση του ελέγχου Lllefors, είναι

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής. 2.6 ΟΡΙΑ ΑΝΟΧΗΣ Το διάστηµα εµπιστοσύνης παρέχει µία εκτίµηση µιας άγνωστης παραµέτρου µε την µορφή διαστήµατος και ένα συγκεκριµένο βαθµό εµπιστοσύνης ότι το διάστηµα αυτό, µε τον τρόπο που κατασκευάσθηκε,

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Π Α Ρ Α Ρ Τ Η Μ Α. Πίνακας 9. p ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon

Π Α Ρ Α Ρ Τ Η Μ Α. Πίνακας 9. p ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon ΠΙΝΑΚΕΣ Π Α Ρ Α Ρ Τ Η Μ Α Πίνακας 1. Διωνυμική Κατανομή Πίνακας 2. Τυποποιημένη Κανονική Κατανομή Πίνακας 3. Oρια Εμπιστοσύνης για την Πιθανότητα p της Διωνυμικής Κατανομής Πίνακας 4. Ποσοστιαία Σημεία

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson

Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson Έλεγχος Ανεξαρτησίας x του Parso Έστω ότι λαμβάνουμε δείγμα μεγέθους. Η πιθανότητα π εμφάνισης ενός χαρακτηριστικού να βρεθεί στο κελί (i,j) κάτω από την υπόθεση Η 0 της ανεξαρτησίας δίνεται από την σχέση

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 2 ου κεφαλαίου Σταύρος Χατζόπουλος 20/02/2017, 06/03/2017, 13/03/2017 1 Κεφάλαιο 2. Έλεγχος Απλών Υποθέσεων Τα προβλήματα ελέγχου υποθέσεων απορρέουν από παρατηρήσεις

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

5. Έλεγχοι Υποθέσεων

5. Έλεγχοι Υποθέσεων 5. Έλεγχοι Υποθέσεων Υποθέσεις Η μηδενική υπόθεση Η (ή ΗΑ) εναλλακτική υπόθεση Δεχόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγχος

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Κλωνάρης Στάθης ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Μέχρι τώρα ασχοληθήκαμε με τις τεχνικές εκτίμησης παραμέτρων για ένα πληθυσμό όπως: τον Μέσο µ και το ποσοστό p Θα συνεχίσουμε

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΠΑΡΑΡΤΗΜΑ. Πίνακας 9. Ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon

ΠΑΡΑΡΤΗΜΑ. Πίνακας 9. Ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon ΠΑΡΑΡΤΗΜΑ ΠΙΝΑΚΕΣ Πίνακας. Διωνυμική Κατανομή Πίνακας. Τυποποιημένη Κανονική Κατανομή Πίνακας. Ποσοστιαία Σημεία της Κατανομή t Πίνακας. Ποσοστιαία Σημεία της Κατανομής X Πίνακας 5. Ποσοστιαία Σημεία της

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙO 5 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ Στο προηγούμενο κεφάλαιο εξετάσαμε διάφορες μορφές ελέγχου της υπόθεσης ότι ένα δείγμα παρατηρήσεων προέρχεται από κάποια συγκεκριμένη κατανομή. Στην

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό; Γραπτή Εξέταση Περιόδου Ιουνίου 008 στο Μάθημα Στατιστική /07/08. Η πιθανότητα να υπάρχει στο υπέδαφος μιας συγκεκριμένης περιοχής εκμεταλλεύσιμο κοίτασμα πετρελαίου είναι 50%. Μια εταιρεία, που πρόκειται

Διαβάστε περισσότερα

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ ΔΥΟ ΠΟΙΟΤΙΚΕΣ ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ ΕΞΕΤΑΣΗ ΤΗΣ ΥΠΑΡΞΗΣ Ή ΟΧΙ ΣΧΕΣΗΣ ΕΝΤΑΣΗ ΚΑΙ ΦΥΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΠΟΙΟΤΙΚΕΣ ΔΙΑΔΙΚΑΣΙΑ CROSSTABS ΠΙΝΑΚΑΣ ΣΥΝΑΦΕΙΑΣ Ο πίνακας συνάφειας είναι

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 4 ου κεφαλαίου Ελεγχοσυναρτήσεις Γενικευμένου Λόγου Πιθανοφανειών Σταύρος Χατζόπουλος 27/03/2017, 03/04/2017, 24/04/2017 1 Εισαγωγή Έστω το τ.δ. X,,, από την κατανομή

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling) 5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling) Συχνά, είναι ταχύτερη και ευκολότερη η επιλογή των μονάδων του πληθυσμού, αν αυτή γίνεται από κάποιο κατάλογο ξεκινώντας από κάποιο τυχαίο αρχικό σημείο

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ M. Kούτρας Πειραιάς, 2014 1 Από κοινού συνάρτηση πιθανότητας μιας δισδιάστατης διακριτής τυχαίας μεταβλητής Με λόγια, η f ( x, y) δίνει την πιθανότητα να εμφανισθεί

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Έλεγχοι Χ 2 (Μέρος 1 ο ) 28/4/2017

Έλεγχοι Χ 2 (Μέρος 1 ο ) 28/4/2017 Έλεγχοι Χ 2 (Μέρος 1 ο ) 28/4/2017 2 Έλεγχοι Χ 2 Οι έλεγχοι που μπορούν να πραγματοποιηθούν είναι οι εξής: 1. Έλεγχος Χ 2 καλής προσαρμογής 2. Έλεγχος Χ 2 ανεξαρτησίας 3. Έλεγχος Χ 2 ομογένειας Αυτό που

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test 1 Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου One-Sample t-test 2 Μια σύντομη αναδρομή Στα τέλη του 19 ου αιώνα μια μεγάλη αλλαγή για την επιστήμη ζυμώνονταν στην ζυθοποιία Guinness. Ο William Gosset

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ M. Kούτρας Πειραιάς, 2015 Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ M. Kούτρας Πειραιάς, 2015 1 Από κοινού συνάρτηση πιθανότητας μιας δισδιάστατης διακριτής τυχαίας μεταβλητής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ SPSS

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Απαραμετρική Στατιστική. Το βαθμονομικό κριτήριο του Wilcoxon, για ζευγαρωτες παρατηρήσεις Ο βαθμονομικός συντελεστής συσχέτισης του Spearman

Απαραμετρική Στατιστική. Το βαθμονομικό κριτήριο του Wilcoxon, για ζευγαρωτες παρατηρήσεις Ο βαθμονομικός συντελεστής συσχέτισης του Spearman Απαραμετρική Στατιστική Το βαθμονομικό κριτήριο του Wilcoxon, για ζευγαρωτες παρατηρήσεις Ο βαθμονομικός συντελεστής συσχέτισης του Spearman Το βαθμονομικό κριτήριο του Wilcoxon, για ζευγαρωτες παρατηρήσεις

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011 Εργαστήριο Μαθηματικών & Στατιστικής Γραπτή Εξέταση Περιόδου Φεβρουαρίου για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 5//. [] Η ποσότητα, έστω Χ, ενός συντηρητικού που περιέχεται σε φιάλες αναψυκτικού

Διαβάστε περισσότερα

Στατιστική ανάλυση αποτελεσμάτων

Στατιστική ανάλυση αποτελεσμάτων HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια

Διαβάστε περισσότερα

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο: Ένας Πληθυσμός, μεγάλο δείγμα, άγνωστη κατανομή Έλεγχος για την μέση τιμή, με άγνωστη διασπορά Δίνονται ομαδοποιημένες οι ημερήσιες καταναλώσεις ηλεκτρικής ενέργειας (σε 100-άδες κιλοβατώρες) μιας χημικής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Ενότητα 3 Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Εκτός από τις μέσες τιμές, τυπικές αποκλίσεις κλπ, θέλουμε να βρούμε κατά πόσον αυτές οι παρατηρούμενες τάσεις εξαρτώνται από συγκεκριμένες συνθήκες ή προϋποθέσεις.

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 5 ου κεφαλαίου Ελεγχοσυναρτήσεις για τις Παραμέτρους της Κανονικής Κατανομής Σταύρος Χατζόπουλος 08/05/207, 5/05/207 Εισαγωγή Στις παραγράφους που ακολουθούν παρουσιάζονται

Διαβάστε περισσότερα

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής στην Προσχολική Ηλικία Περιεχόμενα ενότητας Παρουσιάζονται οι βασικές

Διαβάστε περισσότερα

14. Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας)

14. Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Έλεγχος Χ 4. Έλεγχος Χ (καλής προσαρμογής, ανεξαρτησίας και ομογένειας Από διασταύρωση ορισμένου είδους πειραματόζωων προκύπτουν τρεις τύποι απογόνων, Α, Β και Γ. Στο πλαίσιο ενός πειράματος, από μια τέτοια

Διαβάστε περισσότερα

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μη παραμετρικοί στατιστικοί έλεγχοι Καθηγητής ΔΠΘ Κων/νος Τσαγκαράκης Δευτέρα 6 Μαρτίου 13:00-16:00 Ώρα για εξ αποστάσεως συνεργασία Τρίτη 7 Μαρτίου 12:00-14:00

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. StatXact. ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ StatXact

StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. StatXact. ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ StatXact ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΚΑΤΑΝΟΜΩΝ ΒΑΣΙΖΟΜΕΝΟΙ ΣΕ ΠΕΡΙΣΣΟΤΕΡΑ ΑΠΟ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΚΑΤΑΝΟΜΩΝ ΒΑΣΙΖΟΜΕΝΟΙ ΣΕ ΠΕΡΙΣΣΟΤΕΡΑ ΑΠΟ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ ΚΕΦΑΛΑΙΟ 6 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΚΑΤΑΝΟΜΩΝ ΒΑΣΙΖΟΜΕΝΟΙ ΣΕ ΠΕΡΙΣΣΟΤΕΡΑ ΑΠΟ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Οι έλεγχοι που εξετάζονται στο κεφάλαιο αυτό αποτελούν επεκτάσεις για την περίπτωση περισσοτέρων

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες)

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες) Εργαστήριο Μαθηματικών & Στατιστικής Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ η Πρόοδος στο Μάθημα Στατιστική //7 ο Θέμα α) Περιγράψτε τη σχέση Θεωρίας Πιθανοτήτων και Στατιστικής. β) Αν Α, Β ενδεχόμενα του δειγματικού χώρου Ω

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ (Analyss of Varance for two factor Experments) (Two-Way Analyss of Varance) Ο πειραματικός σχεδιασμός για τον οποίο θα μιλήσουμε είναι μια επέκταση της μεθοδολογίας

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20, ΜΕΜ64: Εφαρμοσμένη Στατιστική 1 ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=0, X = 7.5, σ = 16, α = 5%. Πως αλλάζει το διάστημα αν

Διαβάστε περισσότερα