ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗΝ ΕΠΙΔΗΜΙΟΛΟΓΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗΝ ΕΠΙΔΗΜΙΟΛΟΓΙΑ"

Transcript

1 ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗΝ ΕΠΙΔΗΜΙΟΛΟΓΙΑ Ο ρόλος της Στατιστικής στην ιατρική. Ανασκόπηση απλής στατιστικής μεθοδολογίας στην Ιατρική. Αιτία, αιτιότητα, συσχέτιση, συντελεστής kappa. Ταξινόμηση νόσων (Internatonal Classfcaton of Dseases, ICD code. Επίπτωση, επιπολασμός, προτυποποίηση. Αιτιολογικοί δείκτες (κίνδυνος, odds rato. Ευαισθησία, ειδικότητα, προγνωστική άξια. Μέθοδος Mantel-Hanenszel. Ανάλυση μελετών μαρτύρων ασθενών, επιλογή μαρτύρων. Παλινδρόμηση Posson. Μοντέλα συνάφειας. Θέματα ανάλυσης διασποράς και συνδιασποράς με fxed και random effects. Συλλογή ασθενών. Αρχές βιοστατιστικών και επιδημιολογικών μελετών. Εισαγωγή στα Repeated measures longtudnal data και μεταανάλυση. Βιβλιογραφία Παπαιωάννου Τ. και Φερεντίνου Κ. (000. Ιατρική Στατιστική, Εκδόσεις Α. Σταμούλης, Αθηνά. Ahlborn A. and Norell S. (900. Introducton to Modern Epdemology. Epdemology Resources Inc. Agrest A. (990 Categorcal Data Analyss, nd Edton (00. Altman D.G.(99. Practcal statstcs n medcal research, Chapman and Hall. Armtage P., Mathews J.N.S., Berry G. Statstcal methods n medcal research, (00 4th Edton, Blackwell. Breslow N.E. και Day N.E. (980 και 987. Statstcal methods n Cancer Research, Vol I και II. Clayton D. and Hlls M., (993. Statstcal methods n Epdemology, Oxford Unversty Press. Gardner, M.J. and Altman D.G. (984.Statstcs wth Confdence, Brtsh Medcal Journal. Gore S.M. and Altman D.G. (98 Statstcs n Practce, Brtsh Medcal Journal. Woolson R.F. (987. Statstcal Methods for the Analyss of Bomedcal Data, Wley. Άλλες αναφορές Armtage P. and Colton T. (998 Encyclopeda of Bostatstcs, 6 volumes, Wley. World Health Organzaton (99 Internatonal Statstcal Classfcaton of Dseases and Related Health Problems, 0 th revson, WHO Geneva. Αναφορές Βασικής θεωρίας Παπαϊωάννου Τ. (000 Θεωρία Πιθανοτήτων και Στατιστικής, Εκδόσεις Σταμούλης, Αθηνά. Παπαιωαννου Τ. και Φερεντίνος Κ.(000 Μαθηματική Στατιστική:Εκτιμητική, Έλεγχος Υποθέσεων, Εφαρμογές. Εκδόσεις Σταμούλη, Αθήνα.

2 ΠΡΟΛΟΓΟΣ Οι σημειώσεις αυτές:. Αναπτύχθηκαν στα πλαίσια του μαθήματος «Βιοστατιστική και Στατιστικές Μέθοδοι στην Επιδημιολογία το οποίο δίδαξα τα τελευταία χρόνια στο Πρόγραμμα Μεταπτυχιακών Σπουδών «Εφαρμοσμένη Στατιστική, Κατεύθυνση Βιοστατιστικής του Τμήματος Στατιστικής και Ασφαλιστικής Επιστήμης του Παν/μίου Πειραιώς και. Απευθύνονται σε φοιτητές που έχουν διδαχθεί ένα δύο μαθήματα Πιθανοτήτων Στατιστικής χωρίς αναγκαστικά να έχει προηγηθεί ένα μάθημα «Βιοστατιστικής». Κατά συνέπεια σε ότι αφορά τη δυσκολία τους μπορούν να θεωρηθούν ως ενδιάμεσου επιπέδου στον ευρύτερο χώρο της Βιοστατιστικής και της Στατιστικής Επιδημιολογίας. Η έμφαση είναι όχι μόνο στην παρουσίαση των διαφόρων θεμάτων και αποτελεσμάτων αλλά και στη στατιστική τους αιτιολόγηση και προέλευση. Τάκης Παπαϊωάννου Πειραιάς Νοέμβριος 004

3 ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο : ΕΙΣΑΓΩΓΗ ΕΠΑΝΑΛΗΨΗ.... Ο Ρόλος της Στατιστικής στην Ιατρική.... Ανασκόπηση Στατιστικής Θεωρίας..... Εκτιμητής Μέγιστης Πιθανοφάνειας Διαστήματα Εμπιστοσύνης Έλεγχος Υποθέσεων Τεστ Απλή Στατιστική Μεθοδολογία P-Values και Διαστήματα Εμπιστοσύνης Ισχύς (Power...9 Κεφάλαιο : ΠΟΣΟΣΤΑ ΑΝΑΛΟΓΙΕΣ...0. Σύγκριση Ποσοστών κατά Ζεύγη...0. Επίπτωση (Incdence-Επιπολασμός (Prevalence Προτυποποίηση (Standardzaton Ποσοστών...7 Κεφάλαιο 3: ΜΕΤΡΑ ΣΥΝΑΦΕΙΑΣ ΓΙΑ ΚΑΤΗΓΟΡΙΚΑ ΔΕΔΟΜΕΝΑ Μέτρα Συνάφειας ως Συναρτήσεις του Χ Σχετικός Κίνδυνος (Relatve Rsk-Λόγος Πιθανοτήτων (Odds Rato ή Λόγοι Διαγωνίων Γινομένων για Πίνακες Μέτρα Συνάφειας για Διατακτικούς (Ordnal Πίνακες Συνάφειας Μέτρα Συμφωνίας μεταξύ Αξιολογητών Συντελεστής Κάππα του Cohen...3 Κεφάλαιο 4: ΕΥΑΙΣΘΗΣΙΑ ΕΙΔΙΚΟΤΗΤΑ ΠΡΟΒΛΕΠΤΙΚΗ ΑΞΙΑ Ευαισθησία και Ειδικότητα Προβλεπτική Αξία Διαγνωστικών Κριτηρίων...40 Κεφάλαιο 5: ΚΑΛΗ ΠΡΟΣΑΡΜΟΓΗ Χ (Goodness Of Ft Έλεγχοι (Τεστ Καλής Προσαρμογής Έλεγχος συγκεκριμένης Πολυωνυμικής κατανομής Έλεγχος Πολυωνυμικής Κατανομής Έλεγχος Καλής Προσαρμογής με το Λόγο Πιθανοφανειών-G Γινόμενοι Πολυωνυμικών Κατανομών Ομογένεια Ποσοστών Έλεγχοι Ανεξαρτησίας σε Πίνακες Συνάφειας Το Τεστ McNemar ως X Τεστ...63 Κεφάλαιο 6: ΓΕΝΙΚΕΥΣΕΙΣ: STUART-MAXWELL, COCHRAN και MANTEL-HAENSZEL Σύγκριση κατά Ζεύγη με περισσότερα από Δύο Δυνατά Αποτελέσματα- Τεστ των Stuart Maxwell Σύγκριση Περισσότερων από δύο Συσχετισμένων Ποσοστών-Τεστ του Cochran Mantel-Haenzel Test: Ανεξάρτητοι Πίνακες Case Study...7 Κεφάλαιο 7: ΑΛΛΑ ΘΕΜΑΤΑ Χ Τετράγωνο για Τάση (Χ for Trend Καμπύλες ROC...84 Κεφάλαιο 8: ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ...87 Κεφάλαιο 9: ΕΙΔΙΚΕΣ ΜΕΛΕΤΕΣ Μελέτες Ασθενών Μαρτύρων (Case-control studes Μελέτες Ασθενών Ομάδων (Case Cohort studes...88 ΒΙΒΛΙΟΓΡΑΦΙΑ...89

4 4. ΕΥΑΙΣΘΗΣΙΑ ΕΙΔΙΚΟΤΗΤΑ ΠΡΟΒΛΕΠΤΙΚΗ ΑΞΙΑ 4. ΕΥΑΙΣΘΗΣΙΑ ΚΑΙ ΕΙΔΙΚΟΤΗΤΑ Η ευαισθησία και η ειδικότητα ενός διαγνωστικού τεστ ή μίας (νέας θεραπευτικής μεθόδου είναι δύο σημαντικά ποσοστά τα οποία συχνά χρησιμοποιούνται σε θέματα διαγνωστικών κριτηρίων ή τεστ (screenng tests. Είναι γνωστό ότι ένα διαγνωστικό τεστ κάποιου παράγοντα μπορεί να οδηγήσει στον ακόλουθο τετράπτυχο πίνακα Παράγοντας Τεστ - «Τεστ + ή» σημαίνει θετική ή αρνητική δήλωση και «παράγοντας + ή -» σημαίνει παρουσία του παράγοντα, δηλαδή ασθενής ή απουσία του παράγοντα, δηλαδή μη ασθενής (μάρτυρας αντίστοιχα. Έτσι ορίζονται τα παρακάτω ποσοστά:. ευαισθησία (senstvty του κριτηρίου είναι το ποσοστό των ασθενών που ικανοποιούν το κριτήριο ευαισθησία = Ρ(τεστ + / ασθενής. ειδικότητα (specfcty του κριτηρίου είναι το ποσοστό των υγιών (μαρτύρων που δεν ικανοποιούν το κριτήριο ειδικότητα = Ρ(τεστ - / μη ασθενής ή μάρτυρας 3. ποσοστό λανθασμένα θετικά ατόμων (false postve = ειδικότητα 4. ποσοστό λανθασμένα αρνητικών ατόμων (false negatve = ευαισθησία 36

5 5. ποσοστό ολικού σφάλματος λανθασμένης ταξινόμησης = Ρ (θετικό σφάλμα Ρ (υγιής + Ρ (αρνητικό σφάλμα Ρ (ασθενής = = ποσοστό δύο σφαλμάτων δεδομένης της σχετικής συχνότητας των ασθενών Παράδειγμα Σε ένα καινούριο τεστ διαγνώσεων καρκίνου εξετάστηκαν 900 άτομα, εκ των οποίων άλλα είχαν καρκίνο και άλλα δεν είχαν, με τα εξής αποτελέσματα: Αποτελέσματα Άτομα Σύνολο του τεστ με ασθένεια χωρίς ασθένεια Θετικό Αρνητικό Σύνολο Ζητάμε να εκτιμήσουμε τα προηγούμενα ποσοστά. Έτσι έχουμε: Παρατηρούμε ότι : ευαισθησία = 40 80% 300 = ειδικότητα = % 600 = ποσοστό θετικού σφάλματος = 30 5% 600 = ποσοστό αρνητικού σφάλματος = 60 0% 300 = ποσοστό ολικού σφάλματος = = % ευαισθησία = ποσοστό αρνητικού σφάλματος = = Ρ(σφάλμα Τύπου I = -α ειδικότητα = ποσοστό θετικού σφάλματος = = Ρ(σφάλμα Τύπου II = -β 37

6 όπου τα σφάλματα Τύπου I και II είναι τα γνωστά σφάλματα στον έλεγχο υποθέσεων. Εδώ ως μηδενική υπόθεση ορίζεται ένας ασθενής να δηλωθεί αρνητικός. Παράδειγμα Σε μία διαδικασία αιμοδοτών που καθορίζεται από την τιμή του log0sgtp στον όρο του αίματος εξετάστηκαν.000 άτομα εκ των οποίων άλλα έγιναν δεκτά για αιμοδοσία και άλλα όχι όπως φαίνεται στον παρακάτω πίνακα Αποτελέσματα της διαδικασίας δεκτοί για αίμα (τεστ - όχι δεκτοί για αίμα (τεστ + άτομα υγιή άτομα ασθενή Σύνολο Σύνολο Εργαζόμενοι όπως στο προηγούμενο παράδειγμα έχουμε: Ευαισθησία = 94 78,3% 0 = Ειδικότητα = % 880 = Ποσοστό θετικού σφάλματος = 44 5% 880 = Ποσοστό αρνητικού σφάλματος = 6,7% 0 = Παρατηρούμε ομοίως ότι : Ποσοστό ολικού σφάλματος = = =0,044+ 0,0= 0,64=,64% Ευαισθησία = Ρ(Σφάλμα Τύπου I = -6/0 Ειδικότητα = Ρ(Σφάλμα Τύπου II = -44/880 38

7 Σχόλια: Ένα διαγνωστικό τεστ (screenng test μπορεί να είναι λανθασμένο θετικό ή λανθασμένα αρνητικό. Όσο μεγαλύτερος είναι ο αριθμός των λανθασμένων τόσο μικρότερη είναι η ευαισθησία. ευαισθησία ειδικότητα 39

8 4. ΠΡΟΒΛΕΠΤΙΚΗ ΑΞΙΑ ΔΙΑΓΝΩΣΤΙΚΩΝ ΚΡΙΤΗΡΙΩΝ Η προβλεπτική αξία ενός διαγνωστικού τεστ (predctve test αξιολογείται με την πιθανότητα ένα άτομο να έχει τη νόσο δοθέντος ότι το διαγνωστικό τεστ είναι θετικό, δηλαδή την Ρ(ασθενής / τεστ + PPV και την πιθανότητα ένα άτομο να είναι υγιές δοθέντος ότι το διαγνωστικό τεστ είναι αρνητικό, δηλαδή την Ρ(υγιής / τεστ - =NPV Η πρώτη πιθανότητα λέγεται θετική προβλεπτική αξία (postve predctve value και η δεύτερη αρνητική προβλεπτική αξία (negatve predctve value του διαγνωστικού τεστ. Ισχύουν: Ρ(νόσος = επιπολασμός νόσου (prevalence Ρ(νόσος / τεστ θετικό = θετική προβλεπτική αξία Ρ(τεστ θετικό / νόσος = ευαισθησία Ρ(τεστ θετικό / υγιής = ειδικότητα Για τον υπολογισμό των προβλεπτικών αξιών ενός διαγνωστικού τεστ στηριζόμαστε στο Θεώρημα του Bayes και μπορούμε να χρησιμοποιήσουμε τους τύπους: Θετική προβλεπτική αξία (PPV ευαισθησία επιπολασµ ός = ευαισθησία επιπολασµ ός + ( ειδικότητα ( επιπολασµ ός Αρνητική προβλεπόμενη αξία (NVP ειδικότητα ( επιπολασµ ός = ειδικότητα ( επιπολασµ ός + ( ευαισθησία επιπολασµ ός Είναι φανερό ότι οι προβλεπτικές αξίες εξαρτώνται από τον επιπολασμό και μπορεί να διαφέρουν σημαντικά για μικρές διαφορές του επιπολασμού. 40

9 Σε ένα διαγνωστικό τεστ, εκτός από την ευαισθησία ενδιαφερόμαστε και για τις «θετικές προβλεπτικές τιμές» δηλαδή την εκ των υστέρων πιθανότητα ένα άτομο να έχει τη νόσο δοθέντος ότι το τεστ είναι θετικό. Για να υπολογιστεί αυτή η πιθανότητα χρειαζόμαστε την εκ των προτέρων πιθανότητα εμφάνισης της νόσου δηλαδή του επιπολασμού. Μετά η θετική προβλεπτική αξία υπολογίζεται με το θεώρημα Bayes ή με έναν πίνακα της μορφής: Νόσος Διαγν. + Τεστ Ο οποίος συμπληρώνεται για 00 ή 000 άτομα. Ακολουθεί ένα «εύθυμο» παράδειγμα όπως παρουσιάστηκε σε ιατρικό, επιμορφωτικό συνέδριο. Assume that the followng nformaton s true A new dsease affectng people who read books about health care has recently been dentfed. It occurs n % of the populaton at rsk. The symptoms are nasty, but the dsease s not fatal. If t s left untreated, the vctm has chlls and fever for several weeks and suffers from moderate ntermttent nausea and palsy. The symptoms then dmnsh and dsappear. A new treatment elmnates these symptoms entrely, but t only works f admnstered pror to the onset of symptoms. That treatment nvolves no sgnfcant rsk, and nearly always work. But t s costly, nvolves takng daly doses of a foul medcne, and, worse, requres total abstenton from ce cream for eght weeks. A new test has been developed to dentfy vctms of the dsease presymptomatcally. Its specfcty and senstvty are each 98%, that s, t dentfes 98% of those who have the dsease wth a postve test result, and t dentfes 98% of those who do not have the dsease wth a negatve test result. The publc health servce has screened potental vctms of the dsease wth ths test, n order to dentfy those who should be offered the treatment. I regret to nform you that your test was postve. Please answer these two questons: 4

10 . How lkely do you thnk t s that you have the dsease? Probablty: (check one 95% % 74-84% 65-74% 55-64% 45-54% 35-44% 5-34% 5-4% 5-4% 5-4% -5% 0%. Do you want the treatment? Απάντηση: Κατασκευάζουμε τον πίνακα Τεστ Νόσος Θα περίμενε κανείς, εφόσον το τεστ είναι θετικό η πιθανότητα να είναι μεγάλη, π.χ. 95%. Η ακριβής όμως πιθανότητα είναι μικρή: Ρ(νόσος + τεστ + = 98/.096 = 0,0468 4,6% Βλέπουμε ότι είναι μεγαλύτερη του. Καλύτερα όμως να μην «πάρουμε» τη θεραπεία γι αυτή την «περίεργη» νόσο. Η θετική προβλεπτική αξία ενός διαγνωστικού τεστ συνήθως δεν είναι μεγάλη. Για να αυξηθεί πρέπει να αυξηθεί ο επιπολασμός (prevalence, η συχνότητα της νόσου π.χ. στο 0% ή στο 30%. Αυτό επιτυγχάνεται εφαρμόζοντας το διαγνωστικό τεστ σε ομάδες (πληθυσμό υψηλού κινδύνου π.χ. ηλικιωμένους ή καπνίζοντες όπου η συχνότητα (prevalence της νόσου είναι υψηλότερη έναντι του γενικού πληθυσμού. Διαγνωστικό τεστ και καρκίνος: Σε μερικά διαγνωστικά τεστ (screenng tests για τη διάγνωση (πρόβλεψη π.χ. του καρκίνου δεν είναι δυνατόν να διενεργηθεί αναδρομική μελέτη, παρά μόνο προοπτική. Και πάλι, μερικές φορές δεν είναι δυνατόν να αναμένουμε κάποιο μικρό ή μεγάλο χρονικό διάστημα για να διαγνώσουμε τη νόσο με βεβαιότητα και να προσδιορίσουμε την ευαισθησία ή την ειδικότητα του τεστ. Έτσι χρησιμοποιούμε μεταβλητές ή δείκτες (endponts που έχουν μεγάλη σχέση με την παρουσία ή μη της νόσου. 4

11 Για να αξιολογήσουμε ένα διαγνωστικό τεστ (να δούμε αν το screenng αξίζει να γίνει ή να καθιερωθεί εκτελούμε τυχαιοποιημένες ελεγχόμενες κλινικές δοκιμές (randomzed controlled clncal trals στις οποίες χρησιμοποιούνται άτομα τα οποία παίρνουν το τεστ και άτομα (controls που δεν παίρνουν το τεστ. Στον καρκίνο, η θνησιμότητα από τον καρκίνο είναι το συνηθέστερο χρησιμοποιημένο endpont για την αξιολόγηση του screenng. Για παράδειγμα, στον καρκίνο του μαστού υπάρχουν διάφορες διαγνωστικές μέθοδοι: αυτοεξέταση του μαστού, κλινική εξέταση, μαμμογραφία, θερμογραφία, υπέρηχος, lght sound κλπ. 43

12 ΑΣΚΗΣΕΙΣ.. Δίνεται ένας τετραγωνικός πίνακας συνάφειας ((π j I I και έστω ότι ισχύει το πολλαπλασιαστικό μοντέλο: π j = α α j (-β j = a + β a ( a =j (α Να δειχθεί ότι το μοντέλο ικανοποιεί τη συμμετρία και την περιθώρια ομοιογένεια (β Να δειχθεί ότι α = π. = π., =,,...I (c Να δειχθεί ότι β=k (κάππα Cohen και να ερμηνευθεί το k=0 και k= για το παραπάνω μοντέλο... Στην οδοντιατρική, ραδιογραφήματα τραπεζιτών (molars και προτραπεζιτών (premolars εξετάζονται από τρεις οδοντιάτρους με σκοπό τη διάγνωση. Σκοπός είναι να μελετηθεί η μεταβλητότητα (συμφωνία / ασυμφωνία μεταξύ των εξεταστών. Τα αποτελέσματα για κάθε δόντι (ραδιογράφημα χαρακτηρίζονται ως υγιές (Υ και χαλασμένο (Χ και έχουν ως εξής: Οδοντίατροι 3 Συχνότητα Υ Υ Υ.8 Υ Υ Χ. Υ Χ Υ 54 Υ Χ Χ 6 Χ Υ Υ 36 Χ Υ Χ 87 Χ Χ Υ 7 Χ Χ Χ 09 (a (b (c Ποιο ζεύγος οδοντίατρων συμφωνούν καλύτερα; Υπάρχει καλό επίπεδο συμφωνίας; Να αναλυθούν τα δεδομένα και με πρόγραμμα Η/Υ. 44

13 5. ΚΑΛΗ ΠΡΟΣΑΡΜΟΓΗ Χ (GOODNESS OF FIT 5.. ΈΛΕΓΧΟΙ (ΤΕΣΤ ΚΑΛΗΣ ΠΡΟΣΑΡΜΟΓΗΣ Όταν λέμε καλή προσαρμογή (goodness of ft εννοούμε το κατά πόσο πειραματικά ή δειγματοληπτικά δεδομένα, συνήθως συχνότητες, απαριθμήσεις (counts «ταιριάζουν» ή προέρχονται από μια συγκεκριμένη κατανομή ή μοντέλο πιθανοτήτων. Α. Πολυωνυμική κατανομή Το πιο γνωστό τεστ καλής προσαρμογής είναι το τεστ χι-τετράγωνο του Pearson που πρωτοεισήχθηκε από τον Karl Peason το 900. ο έλεγχος αυτός αξιολογεί (ελέγχει κατά πόσον πολυωνυμικές πιθανότητες είναι ίσες με ορισμένες υποθετικές τιμές. Στην επέκταση του, ελέγχει εάν τα δεδομένα ακολουθούν κάποια συγκεκριμένη κατανομή. 5.. Έλεγχος συγκεκριμένης Πολυωνυμικής κατανομής Έστω η μηδενική υπόθεση (Η ο ότι οι κ παράμετροι (π, π,...,π κ μιας πολυωνυμικής κατανομής έχουν τιμές ίσες με κάποιες συγκεκριμένες τιμές (π 0, π 0,...π κ0, όπου Σπ 0 = Σπ =. Όταν αληθεύει η Η 0 οι αναμενόμενες συχνότητες των κελιών ή κατηγοριών της πολυωνυμικής κατανομής είναι m 0 =e =nπ 0 με =,...,κ. Με βάση τις συχνότητες {n, n,...n k } του δείγματος, και για τον έλεγχο της Η 0 ο Pearson πρότεινε το Χ = ( n m m0 0 ( observed o exp ected e = expected e ως στατιστική συνάρτηση του τεστ (ΣΣΤ. Για μεγάλα δείγματα (n, το Χ έχει κατά προσέγγιση χι-τετράγωνο κατανομή ( χ (β.ε. Πιο αυστηρά, η τ.μ. Χ συγκλίνει κατά κατανομή προς την Το τεστ αυτό απορρέει από το ακόλουθο θεώρημα. k με κ- βαθμούς ελευθερίας χ k κατανομή. 45

14 ΘΕΩΡΗΜΑ Αν n,...n k είναι οι συχνότητες που παρατηρούνται και π,..., π κ οι πιθανότητες της πολυωνυμικής κατανομής, τότε η ασυμπτωτική κατανομή του στατιστικού Χ ( n = Απόδειξη m m ( o = e e είναι χ με κ- βαθμούς ελευθερίας. Έχουμε (n,...,n k- M(n,π,...,π κ-. Είναι γνωστό ότι η κάθε μια τ.μ. n I (συχνότητα έχει διωνυμική κατανομή Β (n, π, =,,...,k. Επίσης, για μεγάλα n, τα n (και τα n /n έχουν κατά προσέγγιση κανονική κατανομή. Είναι όμως τα n συσχετισμένα με Cov (n, n j =-nπ π j. Από την επέκταση του θεωρήματος του De Movre για την πολυωνυμική κατανομή ή από το κεντρικό οριακό θεώρημα για πολυδιάστατες τ.μ. έχουμε ότι, αν p=(n /n,..., n k- /n [τα ποσοστά του δείγματος] και π = (π,...,π κ- [τα ποσοστά πληθυσμού], τότε: n (p-π d Ν κ- (0,Σ, όπου Σ=((σ με σ = π (-π και σ j = -π π j, j. H οριακή κατανομή Ν k- (0,Σ έχει σ.π.π. ƒ(x = (π ( k / Σ / exp {- x Σ - x} και από το θεώρημα του Crag γνωρίζουμε ότι η τετραγωνική μορφή x Σ - x χ κ. Ας θεωρήσουμε τώρα τη στατιστική συνάρτηση g(p g(n /n,...n k- /n n (p-π Σ - (p-π n. H συνάρτηση αυτή είναι μια συνεχής συνάρτηση του τυχαίου διανύσματος n (p-π το οποίο συγκλίνει κατά κατανομή στο τυχαίο διάνυσμα x N(0,Σ. Άρα από το γνωστό θεώρημα, τα τυχαία διανύσματα d g(p g(x = x Σ - x n χ k ή n(p-π Σ - (p-π d χ κ (* Ο πίνακας Σ=Dag (π-ππ όπου π=(π,...,π κ- και Σ - =((σ j όπου σ = +, π ι π κ σ j =, j και πκ =-π -π -...-π κ-. π Ν 46

15 Αντικαθιστώντας τις τιμές αυτές στην τετραγωνική μορφή (* και μετά από αλγεβρικές πράξεις παίρνουμε ότι: n(p-π Σ - k ( n nπ ι (p-π= nπ = από το οποίο απορρέει το τελικό αποτέλεσμα. Παρατηρήσεις. Η παραπάνω απόδειξη στηρίζεται στο Κεντρικό Οριακό Θεώρημα ή στην σύγκλιση της πολυωνυμικής προς την πολυδιάστατη κανονική κατανομή (με διάσταση κ- και το θεώρημα του Grag. Αντί να δουλέψουμε με το ποσοστά p θα μπορούσαμε να ξεκινήσουμε την απόδειξη θεωρώντας ότι: προσεγγ (n,n,..., n k- ~. n Σ - =(( σ, j N k- (μ,σ, όπου μ = (nπ,..., nπ κ- και σ =nπ (-π, ι σ j =-nπ π j, j.. O Fsher σκιαγράφησε την απόδειξη ως εξής: Έστω ότι τα {n }, =,,...,k είναι ανεξάρτητες Posson τ.μ. με μέσες τιμές {m }. Για μεγάλα {m } οι τυποποιημένες τιμές {z = κατανομή Ν(0,, και το Σ z =Χ ( n m έχουν κατά προσέγγιση τυπική κανονική m έχει κατά προσέγγιση χ k κατανομή. Επειδή όμως Σn = Σm = n ή Σ(n -m =0 η κατανομή μετατρέπεται σε πολυωνυμική και χάνουμε έναν βαθμό ελευθερίας. 3. Ο Cramer δίνει τη μέση τιμή και διακύμανση, ακριβή και όχι ασυμπτωτική, του Χ : Ε(Χ = κ- Var(X = (k-+ n ( k 4. To X μπορεί να γραφεί και ως εξής: Χ k = n nπ = nπ ι π -k -k+x n με τον περιορισμό nπ nπ π =0. Είναι δηλαδή το Χ μια συνάρτηση των τ.μ. n,...,n k-. Αναπτύσσοντας το Χ σε σειρά Taylor γύρω από το 0 ή από το (nπ,..., nπ κ ή με την ροπογεννήτρια ή την χαρακτηριστική συνάρτηση του Χ, βρίσκουμε την Ε(Χ & Var(X. 47

16 5. Για την απόδειξη της ασυμπτωτικής κατανομής του Χ, ο Cramer βρίσκεται πρώτα την ασυμπτωτική κατανομή του τ.δ. ((n -nπ / n π,...,(n κ -nπ κ / nπ k η οποία είναι ιδιάζουσα (sngular πολυδιάστατη κανονική κατανομή στον χώρο των κ- διαστάσεων. Η απόδειξη του στηρίζεται στο όριο της χαρακτηριστικής συνάρτησης του παραπάνω τυχαίου διανύσματος με ανάπτυγμα σε σειρά Taylor κ.λπ. Η τετραγωνική μορφή στον εκθέτη της ιδιάζουσας κανονικής κατανομής έχει ασυμπτωτικά Grag. χ κ (θεώρημα του Χρήσιμες σχέσεις ( Σn = Σm = n ( X k n = n m Μεγαλύτερες αποκλίσεις των {n } από τα {m } δίνουν μεγαλύτερη τιμή στο Χ. Η τιμή p (p-value του τεστ είναι η πιθανότητα το Χ να πάρει τιμές μεγαλύτερες ή ίσες από την τιμή που παρατηρήθηκε, όταν ισχύει η Η 0, για όλες τις συχνότητες (cell counts, που το άθροισμά τους ισούται με το n οι οποίες παράγουν τιμές του Χ X observed. Για μεγάλα δείγματα (μεγάλο n, το p-value προσεγγίζεται από την πιθανότητα Ρ( χ κ X observed της χι-τετράγωνο κατανομής με κ- βαθμούς ελευθερίας. = Παράδειγμα (θεωρία του Mendel O Mendel διασταυρώνοντας pea plants of pure yellow stran με φυτά of pure green stran διατύπωσε την υπόθεση (πρόβλεψη ότι οι υβριδικοί σπόροι δεύτερης γενιάς θα είναι 75% κίτρινοι και 5% πράσινοι διότι το κίτρινο είναι το κυρίαρχο είδος (stran. Σε ένα πείραμα είχε παραγωγή n=803 σπόρων από τους οποίους n = 60 ήταν κίτρινοι και n =00 πράσινοι. Οι αναμενόμενες συχνότητες με π 0 =0,75 και π 0 =0,5 είναι m =nπ 0 = 607,5 και m =nπ 0 = 005,75. Το χι-τετράγωνο στατιστικό του Pearson X =0,05 με τιμή p=0,88, η οποία επιβεβαιώνει την υπόθεση του Mendel. Το Χ ακολουθεί χ κατανομή. Ο Mendel έκανε πολλά πειράματα σαν το παραπάνω. Ενδιαφέροντα είναι τα δεδομένα από 0 φυτά αρακά και η ανάλυση που δίνει ο Cramer στην σελίδα 43 του βιβλίου του. Σε όλα αυτά η υπόθεση του 3 κίτρινο προς πράσινο 48

17 επιβεβαιώνεται όχι μόνο για κάθε ένα από τα 0 φυτά αλλά και για το σύνολο των αποτελεσμάτων (κίτρινα και πράσινα. Επί πλέον επιβεβαιώνεται και το θεώρημα ελέγχοντας ότι οι 0 Χ τιμές προέρχονται από γεγονός ότι αν χ κατανομή. Το 936 ο R.A Fsher, χρησιμοποιώντας τα δεδομένα του Mendel και το ελευθερίας αντίστοιχα, τότε: X,... X N είναι ανεξάρτητες χι-τετράγωνο τ.μ. με ν,...ν Ν βαθμούς N X ~ ν = N χ με ν = ν, όπου Ν είναι ο αριθμός των πειραμάτων του Mendel. O Fsher για Ν=84 βρήκε: = X =4~ χ 84 Η ο. Η κατανομή αυτή έχει μέση τιμή 84 και τυπική απόκλιση ( 84 / =3.0 και η πιθανότητα δεξιά του 4 είναι Ρ= Η προσαρμογή είναι σχεδόν «τέλεια». Πράγμα λίγο απίθανο αν λάβει κάνεις υπόψη του τις φυσιολογικές διακυμάνσεις της τύχης. Έτσι ο Fsher ισχυρίστηκε ότι τα δεδομένα είχαν παραποιηθεί από τον κηπουρό του Mendel. Παρά τις δυσκολίες με τα δεδομένα του Mendel, περαιτέρω έρευνα οδήγησε στην γενική αποδοχή της θεωρίας του. 5.. Έλεγχος πολυωνυμικής κατανομής με άγνωστες παραμέτρους Όταν οι παράμετροι π, π,...,π κ, της πολυωνυμικής κατανομής είναι άγνωστες θα πρέπει να εκτιμηθούν από τα δεδομένα και να χρησιμοποιηθούν ο τύπος του Χ με την διαφορά ότι e = nπ, όπου π είναι οι εκτιμητές μεγίστης πιθανοφάνειας (Ε.Μ.Π. των αγνώστων παραμέτρων π, και η κατανομή χ k 5 όπου s είναι το πλήθος των εκτιμώμενων παραμέτρων. ΘΕΩΡΗΜΑ Αν οι παράμετροι {π } της πολυωνυμικής κατανομής εξαρτώνται από άλλες άγνωστες παραμέτρους, θ δηλ. π = π (θ, τότε η στατιστική συνάρτηση. Χ k ( n ( d nπ θ = X k s nπ ( θ = 49

18 Όπου θ είναι ο εκτιμητής μέγιστης πιθανοφάνειας των παραμέτρων θ (ή μερικών από αυτές και s είναι ο αριθμός των παραμέτρων που εκτιμούνται από τα δεδομένα. Απόδειξη: παραπέμπουμε στα βιβλία των Cramer, Rao και Agrest Το παραπάνω θεώρημα μας δίνει το στατιστικό και την κατανομή που πρέπει να χρησιμοποιηθούν για τον έλεγχο καλής προσαρμογής διακριτών δεδομένων συχνοτήτων σε πολυωνυμική κατανομή με άγνωστες παραμέτρους. Η κρίσιμη περιοχή είναι Χ χ. k s, a Το ίδιο στατιστικό χρησιμοποιείται και για τον έλεγχο οποιασδήποτε κατανομής διακριτής ή συνεχούς αρκεί να γίνει κατάλληλη ομαδοποίηση της κατανομής σε κλάσεις (κατηγορίες πεπερασμένου πλήθους. Κλασικές περιπτώσεις είναι η κατανομή Posson και η κανονική κατανομή. Ας σημειωθεί ότι για τον έλεγχο συνεχούς (κυρίως κατανομής υπάρχει και ο έλεγχος Kolmogorov-Smrnoff. Παράδειγμα. Προσαρμογή με εκτίμηση συχνοτήτων 56 μικρά ζώα (dary calves ταξινομούνται ανάλογα με το αν προσβλήθηκαν ή όχι με πνευμονία δύο μήνες μετά την γέννησή τους. Τα ζώα που προσβλήθηκαν με πνευμονία ταξινομούνται επίσης ανάλογα με το αν είχαν ή όχι δεύτερη προσβολή με πνευμονία δύο εβδομάδες μετά την θεραπεία τους. Από τα 56 ζώα, τα 93 είχαν μια πρώτη προσβολή και από αυτά τα 30 είχαν δεύτερη προσβολή. Τα δεδομένα μπορούν να παρουσιαστούν με τον εξής πίνακα: Αρχική Δεύτερη προσβολή (nfecton προσβολή Ναι (+ Όχι (- Σύνολο Ναί ( Όχι ( Σύνολο Στον πίνακα αυτόν υπάρχει ένα κελί με μηδενική συχνότητα διότι είναι αδύνατον να έχουμε ζώα με δεύτερη προσβολή πνευμονίας χωρίς να έχουν 50

19 πρώτη. Κελιά με τέτοια δομή, από το πρόβλημα, λέγονται δομικά μηδενικά (structural zeros. Έχουν οι δύο προσβολές την ίδια πιθανότητα να πραγματοποιηθούν; Ως πρώτη αντίδραση, θα συνέκρινε κανείς την πιθανότητα α προσβολής 93/56= 59.6% με την πιθανότητα β προσβολής 30/56=9.% ή 30/93=3.%. Ποια από τις δύο τελευταίες πιθανότητες πρέπει να χρησιμοποιηθεί; Η δεύτερη προσβολή είναι δεσμευμένη, δοθείσης της πρώτης. Έτσι πρέπει να χρησιμοποιηθεί η δεύτερη πιθανότητα και η Η ο είναι: Η ο : Ρ (αρχική προσβολή + = Ρ(δεύτερη προσβολή + αρχική προσβολή+ Αν {π j } είναι άγνωστες (αληθινές πιθανότητες των κελιών του παραπάνω πίνακα,,j=,, όπου το παριστάνει τις γραμμές και το j τις στήλες, έχουμε, π +π +π =, π =0, Ρ(αρχική προσβολή +=π +π = π. Ρ(δεύτερη προσβολή+ αρχική προσβολή+= π /(π +π Και η μηδενική υπόθεση γίνεται, Η 0 : π +π =π /(π +π Έστω π η τιμή του δεξιού ή αριστερού μέλους της Η 0 δηλαδή π=ρ(αρχική προσβολή+=π +π. Τότε η Η 0 γίνεται: Η 0 :π =π, π =π-π, π =-π. Τα δεδομένα ακολουθούν τριωνυμική κατανομή (n=56, π, π, π και όταν ισχύει η Η 0 τα π j έχουν τις τιμές που δίδονται στην Η 0. Έτσι θέλουμε να επιβεβαιώσουμε αν τα δεδομένα προέρχονται από την τριωνυμική δοθείσης της Η 0. Εδώ πρέπει να εκτιμήσουμε τις αναμενόμενες συχνότητες. Για τον σκοπό αυτό πρέπει πρώτα να βρούμε τον εκτιμητή μεγίστης πιθανοφάνειας του π. Η τριωνυμική πιθανοφάνεια είναι: L(π =! n! n! n ( π n ( n n n! π π ( π, όπου n j είναι οι συχνότητες που παρατηρούμε. Λογαριθμίζοντας και αγνοώντας τα παραγοντικά έχουμε LogL(π= n log(π +n log(π-π +n log(-π Η log L( π π =0 μας δίνει 5

20 n n + n - π π π με λύση π = (n (n n - =0 π + n + n + n Για τα δεδομένα του προβλήματος έχουμε π =0,494, π m = n =38,, m = n( π π =39,0 ( π m = n =78,9 και Χ = 9,7 με (κ--s=(3--= β.ε. διότι κ=3 και μια παράμετρος (s= εκτιμήθηκε από τα δεδομένα. Το p-value<0,00. άρα υπάρχει ισχυρή ένδειξη εναντίον της μηδενικής υπόθεσης. Τα δεδομένα δείχνουν ότι πολύ περισσότερα ζώα δέχθηκαν την αρχική προσβολή (nfecton παρά τη δεύτερη. Οι ερευνητές κατέληξαν στο συμπέρασμα ότι «η αρχική προσβολή έχει ένα ανοσοποιητικό αποτέλεσμα που μειώνει την πιθανότητα δεύτερης προσβολής».. Παρατηρήσεις. Ο Pearson πρότεινε το στατιστικό που δίδεται στο Θεώρημα για την παρούσα περίπτωση χωρίς όμως τη διόρθωση για τους βαθμούς ελευθερίας την οποία πρότεινε και απέδειξε ο Fsher.. Ο έλεγχος p=p o στην απλή στατιστική συμπερασματολογία για διωνυμικά δεδομένα είναι και αυτός έλεγχος καλής προσαρμογής και μπορεί να γίνει με το χι-τετράγωνο στατιστικό Χ ( x npo = np o ( n x n( po + n( p o ~ χ Το τεστ αυτό είναι ισοδύναμο με το z-τεστ της Η 0 ( x / n p0 z = και ( p q / n o o z = χ. Η Όταν γίνεται προσαρμογή δεδομένων σε συνεχή κατανομή και ο αριθμός των βαθμών ελευθερίας του Χ είναι πολύ μικρός τότε επιβάλλεται να εφαρμόζεται η διόρθωση συνέχειας του Yates η οποία δίδεται από τη σχέση Χ n ( n e 0,5 = e =. 5

21 4. Κανόνας ορθής εφαρμογής του ελέγχου Χ Οι όροι του στατιστικού Χ έχουν στον παρανομαστή τους τις αναμενόμενες συχνότητες Ε =nπ 0 η nπ ( θ οι οποίες δεν πρέπει να είναι πολύ μικρές διότι έτσι αυξάνεται η τιμή του όρου εξαιτίας των μικρών τιμών των π 0 που ελέγχουμε και όχι λόγω απόκλισης των συχνοτήτων. Έτσι η προσέγγιση της κατανομής χ δεν είναι ικανοποιητική και δεν πρέπει να εφαρμοστεί ο έλεγχος Χ. Οι παρατηρήσεις αυτές οδήγησαν στον λεγόμενο κανόνα ορθής εφαρμογής ο οποίος μετά από σχετική αναθεώρηση στη βιβλιογραφία έχει ως εξής: a Καμία από τις αναμενόμενες συχνότητες Ε δεν πρέπει να είναι μικρότερες του b Το ποσοστό των αναμενόμενων συχνοτήτων Ε οι οποίες είναι μικρότερες του 5 δεν πρέπει να είναι μεγαλύτερο του 0% Έλεγχος καλής προσαρμογής με το λόγο πιθανοφανειών G Έλεγχος καλής προσαρμογής μπορεί να γίνει και με το τεστ πηλίκου πιθανοφανειών (LRT, γνωστού ως G. Έχουμε λ= max L( π Ηο = max L( π Ω k n [ n!/( n!] π ιο k [ n!/( n!] ( n / n n διότι η Η 0 περιέχει ένα μόνο σημείο, το π 0 και για το max L( π επιτυγχάνεται όταν το π γίνει ίσο με τον εκτιμητή ΜΠ: n/n = {n /n, n /n,..., n k /n}. Έτσι μετά από πράξεις k G -logλ = n ( n / mo = log ~ χ k, m 0 = nπ 0. Οι βαθμοί ελευθερίας προσδιορίζονται ως εξής: Ο χώρος Θ έχει διάσταση k- διότι υπάρχουν k παράμετροι, τα π, και ένας περιορισμός Σπ =. Ο χώρος Η 0 ή Θ 0 έχει μηδέν διάσταση. Οι βαθμοί ελευθερίας είναι η διαφορά των δύο διαστάσεων. Το G γράφεται και ως εξής: k G = n π log( π / π o = Ω =ni KΛ (π,π 0, όπου Ι ΚΛ (f,g παριστάνει την απόκλιση των Kullback-Lebler μεταξύ δύο κατανομών f και g ή το μέτρο πληροφορίας των Kullback-Lebler. I ΚΛ (π,π 0 είναι η απόκλιση των Kullback-Lebler μεταξύ της κατανομής του δείγματος 53

22 ( π =n /n και της κατανομής π 0 της Η 0. Όσο πιο μεγάλη είναι η απόκλιση Ι ΚΛ τόσο πιο μεγάλο είναι το G και τόσο πιο πολύ απέχουν τα δεδομένα από την Η 0. Τα Χ και G είναι ισοδύναμα με την έννοια: Χ -G P 0 ή n lm Ρ(Χ G =0 n Με δεδομένο και σταθερό τον αριθμό k των κελιών το Χ συνήθως συγκλίνει πιο γρήγορα από το G. Η χι-τετράγωνο προσέγγιση του G είναι καλή αν n>5 k. 54

23 5.. ΓΙΝΟΜΕΝΟ ΠΟΛΥΩΝΥΜΙΚΩΝ ΚΑΤΑΝΟΜΩΝ ΟΜΟΓΕΝΕΙΑ ΠΟΣΟΣΤΩΝ - Έλεγχος Ομογένειας Ποσοστών - Συγκρίσεις χωρίς ζεύγη περισσότερων από ποσοστών Παράδειγμα (Έλεγχος ομογένειας δύο πολυωνυμικών κατανομών Έστω ότι έχουμε δύο ανεξάρτητα τυχαία δείγματα από δύο πολυωνυμικές κατανομές, δηλαδή (n,...,n c ~M(n,π,...,π c, π j = c j= (n,...,n c ~M(n,π,...,π c, π j = και θέλουμε να ελέγξουμε την υπόθεση αν τα δείγματα αυτά προέρχονται από τον ίδιο πληθυσμό, δηλαδή c j= Η 0 : π j = π j =π j για κάθε j=,,...,c Θα προσπαθήσουμε να βρούμε ένα στατιστικό για τον παραπάνω έλεγχο. Γνωρίζουμε από τα προηγούμενα ότι c j= ( n Άρα λόγω ανεξαρτησίας n j π j n π j χ c c ( n και j n π j j= n π j χ c c Χ = = j= ( n n π j n π j j ~ χ ( c (5.. Αν τώρα η Η 0 καθορίζει τα π j δηλαδή αν τα π j είναι γνωστά, τότε η ( με π j =π j μπορεί να χρησιμοποιηθεί ως Σ.Τ. για τον έλεγχο της υπόθεσης μας με κρίσιμη περιοχή την Χ χ ( c, a (5.. Αν όμως η Η 0 δεν καθορίζει τα π j, τα π j στην ( θα πρέπει να εκτιμηθούν όταν ισχύει η Η 0. τότε όμως, αφού έχουμε δύο ανεξάρτητα δείγματα, είναι σαν αν έχουμε συνολικά ένα τυχαίο δείγμα μεγέθους n +n από μια πολυωνυμική κατανομή με πιθανότητες π, π,..., π c. Οι ΕΜΠ στην περίπτωση αυτή είναι: Έτσι εδώ το Σ.Τ. είναι c Χ = π j = ( n j n n n n + n = n j + n j = j= j n j n π j ( nj π = n = n n j. n n j / n / n (

24 Με κατανομή της Χ την χ c, διότι οι βαθμοί ελευθερίας στην ( που ήταν (c- θα πρέπει να μειωθούν κατά c- λόγω των εκτιμήσεων. Η κρίσιμη περιοχή την περίπτωση αυτή είναι Χ χ ( c, a, όπου το Χ δίνεται από τη σχέση (5..3 Για να κάνουμε έλεγχο πρακτικών προβλημάτων σε αυτή την περίπτωση χρήσιμος είναι ο παρακάτω c πίνακας: n n... n c n n n... n c n n n... n c n Παράδειγμα (κατανομή φύλου από οστά κρανίου Οστά κρανίου ανευρίσκονται σε μια περιοχή κατά τη διάρκεια αρχαιολογικών ανασκαφών. Οι ανασκαφές γίνονται σε 3 διαφορετικές περιόδους. Από τα οστά του κρανίου προσδιορίζεται το φύλο του ατόμου. Στις δύο πρώτες περιόδους ο προσδιορισμός του φύλου γίνεται από τον ερευνητή Α και στην τρίτη περίοδο από τον ερευνητή Β. Η κατανομή των οστών του κρανίου κατά φύλο και περίοδο έχει ως εξής: Οστά κρανίου ανά φύλο και περίοδο Περίοδο Σύνολο Άνδρας Γυναίκα Σύνολο Τι πληροφορίες δίνουν τα δεδομένα αυτά για την αναλογία των φύλων του πληθυσμού της περιοχής; Συγκεκριμένα Είναι η αναλογία των φύλων : για κάθε περίοδο; p άνδρας = p γυναίκα ή p άνδρας = ½ για κάθε περίοδο. Είναι οι αναλογίες και για τις τρεις περιόδους ίσες με : δηλαδή p πρώτη = p δεύτερη = p πρώτη = p δεύτερη = p τρίτη = / Είναι οι αναλογίες ίσες και για τις τρεις περιόδους, δηλαδή v p πρώτη = p δεύτερη = p τρίτη Υπάρχει διαφορά μεταξύ των ερευνητών; 56

25 Απάντηση Εδώ πρέπει να γίνει έλεγχος της υπόθεσης p=/ για κάθε περίοδο με το z-τεστ ή το χ -τέστ με β.ε Έτσι έχουμε: Για την η περίοδο: X (6 36 = 36 ( πρώτη Για την η περίοδο: Ε=5,5, X Για την 3η περίοδο: δεύτερη = 9.94**, η τιμή p<0.5% =9.9**, η τιμή p<0.5% Ε=05, X τρίτη =0.4, η τιμή p>0.5% Οι δύο αστερίσκοι σημαίνουν ότι το τεστ είναι στατιστικά σημαντικό. Εδώ έχουμε Η ο : p πρώτη = p δεύτερη = p τρίτη =/ και πρέπει να γίνουν τα εξής: Ένα χ -τεστ της υπόθεσης : με β.ε στην στήλη «Σύνολο» ( 55 ( 435 X σύνολο = Πρόσθεση των τριών προηγούμενων Χ. X άθροισµα = X πρώτη + X δεύτερη + Διαφορά αθροίσματος και συνόλου X διαφορ ά = X άθροισµα - συνόλου τρίτη =3.87** [ χ ] X = =0.09** [ χ ] X = =6.** [ χ ] Αυτό είναι το τεστ της Η 0 : p πρώτη = p δεύτερη = p τρίτη = ½ με p<5%. Εδώ ο έλεγχος είναι ότι τα 3 ποσοστά είναι ίσα, δηλαδή p πρώτη = p δεύτερη = p τρίτη. Έχουμε σύγκριση 3 ποσοστών από 3 ανεξάρτητους πληθυσμούς. Το τεστ που εφαρμόζεται είναι το ίδιο με εκείνο που προκύπτει αν θεωρήσουμε τον παραπάνω πίνακα ως πίνακα συνάφειας και υπολογίσουμε το χ -τέστ ανεξαρτησίας με (- (3-= β.ε. Πράγματι. X ανεξαρτησίας =6.3* Έτσι οι αναλογίες φύλου διαφέρουν από περίοδο σε περίοδο. Ο ένας αστερίσκος σημαίνει ότι το τεστ είναι στατιστικά σημαντικό. Για περαιτέρω διερεύνηση των αιτίων της απόρριψης της Η 0 εξετάζουμε τους πίνακες των διαφορών ή υπολοίπων (resduals O-E & (O-E /E: Ο-Ε (Ο-Ε /Ε Πρώτη Δεύτερη Τρίτη Πρώτη Δεύτερη Τρίτη Άνδρας Γυναίκα

26 Είναι φανερό από το πρόσημο και το μέγεθος της τρίτης στήλης, ότι η απόκλιση από την ομογένεια ή την ισότητα των ποσοστών οφείλεται στην τρίτη περίοδο. Το θέμα αυτό διερευνάται στην συνέχεια. v Μήπως όμως το παραπάνω συμπέρασμα ( οφείλεται στις διαφορές μεταξύ των ερευνητών Α & Β; Ο προσδιορισμός του φύλου γίνεται με υποκειμενική ανατομική εκτίμηση από τον ερευνητή. Τα αποτελέσματα ανά ερευνητή έχουν ως εξής: Ο j E ιξ Α Β Σύνολο Α Β Άνδρας Άνδρας Γυναίκα Γυναίκα Σύνολο χ τεστ για την ισότητα p A = p B ( ( X = ( ( =6.3 Έτσι σε Χ = 6.3 με β.ε {από το (} που μετρά τη διαφορά αναλογιών του φύλου, ένας ( β.ε αντιστοιχεί σε Χ =6.3 (που οφείλεται στους ερευνητές Α & Β {από το (v}. Άρα η διαφορά μεταξύ αναλογιών οφείλεται μόνο σε διαφορές μεταξύ ερευνητών. Υπάρχουν διαφορές στην τεχνική προσδιορισμού του φύλου μεταξύ των δύο ερευνητών. Τα δεδομένα δείχνουν μια υπεροχή των ανδρών αλλά η απόκλιση από το : οφείλεται στη διαφορά μεταξύ των ερευνητών (πιθανώς σε λανθασμένη τεχνική προσδιορισμού του φύλου. 58

27 5.3. ΕΛΕΓΧΟΙ ΑΝΕΞΑΡΤΗΣΙΑΣ ΣΕ ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ: Πολλές φορές υπάρχει ανάγκη ελέγχου της ανεξαρτησίας δύο χαρακτηριστικών Α και Β ενός πληθυσμού, καθένα από τα οποία διακρίνεται σε διάφορες κατηγορίες Α, Α,...Α r και Β, Β,...Β c αντίστοιχα. Π.χ. χαρακτηριστικά μπορεί να είναι χρώμα των μαλλιών και το χρώμα των ματιών με κατηγορίες τους διάφορους χρωματισμούς (μαύρο, καστανό, ξανθό, κ.λπ.. Για να κάνουμε τον παραπάνω έλεγχο παίρνουμε από τον πληθυσμό δείγμα n μονάδων και έστω n j από αυτές φέρουν το χαρακτηριστικό Α και r c n j = j j= συγχρόνως το Β j, όπου n= Πίνακας συνάφειας: (ή συχνοτήτων είναι ο πίνακας: B B B j B c A j n... n j... n c A A j n... nj... ne nr... nrj... nrc A r. =((n j r c Στον παραπάνω πίνακα αντιστοιχεί ο πίνακας πιθανοτήτων ((π j r c όπου π j, =,...r, j=,...,c είναι οι αντίστοιχες πιθανότητες των κελιών (, j του πίνακα, δηλ. π j =P(A=A, B=B j. Θα χρησιμοποιούμε και τον γνωστό συμβολισμό π = j π j, π. j = j π j, n.. = j n j, π.. = j π j = κλπ. Η υπόθεση ανεξάρτητα των Α και Β διατυπώνεται ως εξής: Η 0 : π j = π. π. j για κάθε και j με εναλλακτική Η α : π j π. π. j για τουλάχιστον ένα ζεύγος, j. Η από κοινού κατανομή των τ.μ. n j είναι πολυωνυμική με παραμέτρους n και π j, =,,...,r και j=,,...,c με π j = και n = r c = j= r c n j = j=. Έτσι από το Θεώρημα προκύπτει ότι η στατιστική συνάρτηση για τον έλεγχο της υπόθεσης Η 0 : π j = π ιj0 θα είναι: r c Χ = = j= ( n j e e j j, (

28 όπου e j = nπ jο με ασυμπτωτική κατανομή χ με rc-i βαθμούς ελευθερίας λόγω της r c σχέσεως π j = όταν ισχύει η Η 0. = j= Έτσι αν τα π j = (π. (π. j είναι γνωστά τότε όταν ισχύει η Η 0 η (5.3. μπορεί να χρησιμοποιηθεί ως Σ.Τ για τον έλεγχο της ανεξαρτησίας με κρίσιμη περιοχή. Χ Χ rc-,α. (5.3. Όταν τα π j άγνωστα τότε βρίσκουμε τους Ε.Μ.Π. που είναι (όταν ισχύει η Η ο n. π n. j = και π j =. n n Έτσι το Σ.Τ θα είναι Χ = r r = j= ( n j e e j j, (5.3.3 όπου τώρα e j = n π j = (n. n. j /n με κρίσιμη περιοχή Χ X (r-(c-,α (5.3.4 Εδώ το Χ έχει κατανομή την χ με (r-(c- βαθμούς ελευθερίας, διότι έχουμε rc- βαθμούς, μείον τις εκτιμώμενες παραμέτρους που είναι (r-+(c- έτσι rc-- [(r-+(c-]= (r-(c-. Ένα βασικό ερώτημα που προκύπτει στους πίνακες συνάφειας είναι το τι κάνουμε μετά τον έλεγχο της ανεξαρτησίας ο οποίος συνήθως απορρίπτει την Η 0 (την ανεξαρτησία των Α και Β. Υπάρχουν διάφοροι τρόποι να προχωρήσουμε: Ένας είναι να εκτιμήσουμε τις πιθανότητες π j και με τις αριθμητικές τιμές τους να διακρίνουμε τάσεις, συμπεριφορές κ.λπ. Άλλος είναι να εξετάσουμε τα υπόλοιπα (resduals των συχνοτήτων. n j -e j ή Ο j - E j και να μπορέσουμε να διακρίνουμε διαφορές, τάσεις κ.λπ. Ας σημειωθεί ότι ( nj e j = 0 και ( nj e j = 0. j Μπορούμε επίσης να εξετάσουμε και τις ποσότητες (Ο j -E j /E j. Τέλος μπορούμε να διερευνήσουμε την καταλληλότητα διαφόρων άλλων μοντέλων όπως π.χ. μοντέλων συνάφειας, θέμα το οποίο θα εξεταστεί στα «Κατηγορικά Δεδομένα». 60

29 Ας υπενθυμίσουμε τον κανόνα ορθής εφαρμογής του χ : οι αναμενόμενες συχνότητες Ε j δεν πρέπει να είναι μικρότερες του και όχι περισσότερες από 0% από αυτές να είναι μικρότερες του 5, επιπλέον το n πρέπει να είναι μεγαλύτερο του 4 rc. Παράδειγμα: Μογγολισμός Λοιμώδης ηπατίτιδα Μια ομάδα ιατρών ερευνητών μιας Πανεπιστημιακής Κλινικής, ισχυρίζεται ότι ο μογγολισμός στα παιδιά έχει σχέση με τη λοιμώδη ηπατίτιδα της μητέρας κατά την διάρκεια της εγκυμοσύνης της. Για τον έλεγχο του ισχυρισμού αυτού 000 περιπτώσεις εκλέγονται τυχαία από το αρχείο μιας μεγάλης μαιευτικής κλινικής και εξετάζονται ως προς την ηπατίτιδα της μητέρας. Μετά, και για κάθε περίπτωση, εντοπίζεται το παιδί και εξετάζεται για να διαπιστωθεί αν είναι μογγολοειδές ή όχι. Τα αποτελέσματα δίνονται στον ακόλουθο πίνακα. Παιδί (πραγματικότητα Μογγολοειδές Μη μογγολοειδές Μητέρα (τεστ Σύνολο + - Με λοιμώδη ηπατίτιδα Χωρίς λοιμώδη ηπατίτιδα Σύνολο Για τα δεδομένα αυτά έχουμε: Ε = = 5. 5, Ε = = Ε = = , Ε = = Έτσι η τιμή της στατιστικής συνάρτησης του τεστ είναι: Χ ( ( ( ( = = = Επειδή χ 0.05,= 3.84 θα έχουμε Χ =776.70>3.84=χ 0.05,. Άρα απορρίπτεται η υπόθεση της ανεξαρτησίας του μογγολισμού με τη λοιμώδη ηπατίτιδα και επομένως το αποτέλεσμα είναι πολύ σημαντικό. Δηλαδή ο μογγολισμός των παιδιών έχει σχέση με την προσβολή ή όχι της μητέρας από λοιμώδη ηπατίτιδα κατά τη διάρκεια της εγκυμοσύνης. Η πιθανότητα το παιδί να είναι μογγολοειδές δοθέντος ότι η μητέρα είχε λοιμώδη ηπατίτιδα είναι 65/4=46% και πολύ μεγαλύτερη από της πιθανότητα μογγολισμού δοθέντος ότι η μητέρα δεν έχει ηπατίτιδα που είναι 8/859=0.4%. Για περισσότερη διερεύνηση του θέματος αυτού εξετάζουμε τις διαφορές Ο-Ε ή (Ο-Ε /Ε. 6

30 Εδώ οι διαφορές Ο-Ε είναι: Μογγολισμός + - Ηπατίτιδα Και φανερώνουν μια θετική συσχέτιση μογγολισμού με την ηπατίτιδα. 6

31 5.4 ΤΟ ΤΕΣΤ McNEMAR ΩΣ χ ΤΕΣΤ. Το τεστ του McNemar εφαρμόζεται και στις ακόλουθες περιπτώσεις: α. Σε αναδρομικές μελέτες με ασθενείς και μάρτυρες (control, όπου κάθε ασθενής «ταιριάζεται» με ένα μάρτυρα (matched pars και το «ταίριασμα» γίνεται με αυστηρές και απαιτητικές προδιαγραφές. Έστω Ν τα ζεύγη ένας ασθενής ένας μάρτυρας. Κάθε ζεύγος βαθμολογείται ως εξής: Ζεύγος Ασθενής Μάρτυρας Α Α Α Όχι Α 3 Όχι Α Α 4 Όχι Α Όχι Α Όπου Α σημαίνει ότι το άτομο έχει χαρακτηριστικό π.χ. Α=καπνίζει και όχι Α=δεν καπνίζει και ασθενής σημαίνει ότι το άτομο έχει καρκίνο του πνεύμονα. Τα αποτελέσματα μπορούν να συνοψισθούν ως ακολούθως: ή σε μορφή πίνακα Αποτελέσματα Ασθενής Μάρτυρας Αριθ. ζευγών Α Α x Α Όχι Α y Όχι Α Α z Όχι Α Όχι Α w Σύνολο N Ασθενής Α Όχι Α Α x z Μάρτυρας όχι Α y w Ν ζεύγη Με άλλο λόγια Ν ζεύγη ταξινομούνται ανάλογα με το αν τα μέλη του ζεύγους έχουν καρκίνο πνεύμονα και αν καπνίζουν ή όχι. Θέλουμε να ελέγξουμε π.χ. αν τα ποσοστά των καπνιστών είναι τα ίδια στους καρκινοπαθείς με τα control (με άλλα λόγια και όχι αυστηρά, αν υπάρχει σχέση μεταξύ καπνίσματος και καρκίνου πνευμόνων. Λόγω του «ταιριάσματος» (parng πρέπει να εφαρμοστεί το τεστ του McNemar. Αν χρησιμοποιήσουμε το συμβολισμό των πινάκων συνάφειας, ο παραπάνω πίνακας γίνεται Ασθενής Μάρτυρας Α Όχι Α Σύνολο Α Ο Ο Ο. Όχι Α Ο Ο Ο. Σύνολο Ο. Ο. Ν 63

32 και το τεστ McNemar ισοδύναμα, με το z τεστ είναι z= O ( O + O /, O + O / Χ = ( O O ~ χ + O O Tα τεστ αυτά απορρέουν από το γεγονός ότι Ο O + O ~ BO ( + O,/ H 0 Αν η πιθανότητα καπνίσματος στους ασθενείς είναι ίση με την πιθανότητα καπνίσματος στους μάρτυρες έχουμε: π = π Κανονικά θα έπρεπε να συγκρίνουμε το ποσοστό των καρκινοπαθών στους καπνιστές με το ποσοστό των καρκινοπαθών στους μη καπνιστές. b. Σε μελέτες συσχέτισης ή μελέτες με διαγνωστικά κριτήρια Σε Ν άτομα καταγράφονται διάφορες ποιοτικές και ποσοτικές μετρήσεις. Για να δούμε αν τα ποσοστά επιτυχίας ή θετικής παρουσίας για δύο ποιοτικά χαρακτηριστικά είναι ίσα, θα εφαρμόσουμε το τεστ του McNemar. Σε Ν ασθενείς εφαρμόζονται δύο διαγνωστικές διαδικασίες για να προσδιοριστεί η παρουσία η απουσία κάποιου στοιχείου μιας ασθένεια. Ο έλεγχος της ισότητας των ποσοστών των θετικών αποτελεσμάτων για τις διαδικασίες γίνεται με τεστ McNemar. Γενική θεωρία Το τεστ McNemar προκύπτει από την τριωνυμική κατανομή (n, n - M(n,π, π όπου η τρίτη κατηγορία είναι δύο «σύμφωνες» ομάδες ++ & -- με σύνολο συχνοτήτων n +n και πιθανότητα π +π και το Χ του Pearson με εκτίμηση των παραμέτρων κάτω από το μοντέλο της μηδενικής Η 0 : π = π. Γενικά αν (Χ,..., Χ κ- Μ (n, π,..., π k- και θέλουμε να ελέγξουμε την +Η 0 : π =π έναντι π π το X τεστ του Pearson είναι: Χ = ( X X X + X χ /Η 0 Οι βαθμοί ελευθερίας προσδιορίζονται ως εξής: Οι βαθμοί ελευθερίας του Χ είναι k--s όπου s είναι ο αριθμός των παραμέτρων που εκτιμούνται. Το s λοιπόν ισούται με k-3 (από τις παραμέτρους π 3,...π κ- συν (από την κοινή τιμή των π και π όταν ισχύει η Η 0. Έτσι s=k- και k--s=. 64

33 6. ΓΕΝΙΚΕΥΣΕΙΣ: STUART MAXWELL, COCHRAN και MANTEL-HAENSZEL 6. Σύγκριση κατά ζεύγη με περισσότερα από δύο δυνατά αποτελέσματα Τεστ των Stuart Maxwell. Εδώ εξετάζεται η περίπτωση του τεστ του McNemar με δύο ποιοτικές μεταβλητές, η κάθε μια όμως έχει περισσότερα από δύο δυνατά αποτελέσματα ή επίπεδα (μη διχοτομικές μεταβλητές. Για παράδειγμα, Ν άτομα (τα ίδια άτομα εξετάζονται σε δύο διαφορετικές χρονικές στιγμές. Σε κάθε χρονική στιγμή εξετάζονται ως προς τα αποτελέσματα μιας ποιοτικής μεταβλητής με 3 ή περισσότερα επίπεδα. Σε άλλη ισοδύναμη περίπτωση αντί Ν ατόμων, μπορεί να υπάρχουν Ν ταιριασμένα ζεύγη (matched pars. Πίνακας Μετρήσεων άτομο πριν μετά ζεύγος ασθενής μάρτυρας ή Ν 3 3 Ν ή συνοπτικά Πριν (ή ασθενείς μετά (ή μάρτυρες 3 O O O 3 O O O 3 3 O 3 O 3 O 33 όπου,,3 είναι τα επίπεδα της ποιοτικής μεταβλητής. 65

34 Θέλουμε να ελέγξουμε την υπόθεση ότι τα πριν-μετά ή ασθενείς μάρτυρες ποσοστά για κάθε επίπεδο της μεταβλητής είναι ίσα. Με άλλα λόγια Η 0 : p =p, p = p, p 3 = p 3 (αρκούν μόνο τα p =p και p =p Οι μάρτυρες συμφωνούν με τους ασθενείς στα διαγνωστικά στοιχεία Ο, Ο και Ο 33. Οι διαφορές μεταξύ τους αντιπροσωπεύονται από τα μη διαγώνια στοιχεία O j και ειδικότερα από τις 3 διαφορές Ο -Ο, Ο -Ο, Ο 3 -Ο 3. Διάφορα τεστ έχουν προταθεί για την Η 0 στηριζόμενα στις διαφορές Ο -O [Bhapkar (966, Grzzle et al (969, Ireland et al (969, Βλ. Fless ή Woolson]. Ένα απλούστερο τεστ που δεν απαιτεί αντιστροφή πίνακα έχει προταθεί από τους Stuart (955 και Maxwell (970 για 3 3 πίνακες (βλ. Fless και Evertt (97: όπου X = O 3 ( O O j= ½ (Ο j +O j. O + O ( O O 3 3 ( O + O + O O 3 + O + O 3 O 3 ( O 3 O 3 ~ χ H 0, Aν η Η ο απορριφθεί, διερευνούμε κάθε ποσότητα χωριστά σχηματίζοντας πίνακες, που προκύπτουν συμπτύσσοντας τον 3 3 πίνακα, και εφαρμόζουμε το απλό τεστ McNemar με χ και k- (όχι β.ε. για να ελέγξουμε δηλαδή να μην επιτρέψουμε την αύξηση του α λόγω πολλαπλών τεστ. Παράδειγμα: 00 άτομα ερωτώνται αν στηρίζουν ή δεν στηρίζουν ή αδιαφορούν για την εξωτερική πολιτική της κυβέρνησης, δύο μήνες και μήνες μετά την ορκωμοσία της με τα ακόλουθα αποτελέσματα: Δύο μήνες στηρίζω δεν στηρίζω αδιαφορώ Στηρίζω Δώδεκα μήνες δεν στηρίζω αδιαφορώ Αλλάζουν τα ποσοστά από τους στους μήνες; 66

35 χ = 5( ( (0 5 ( =8.78 * χ,0.05 = 5.99 p-value<0.00 Έτσι υπάρχει αλλαγή των ποσοστών από τους στους μήνες. Υπάρχει αλλαγή του ποσοστού που στηρίζουν την εξωτερική πολιτική; Η 0 : p =p Πίνακας σύμπτυξης στηρίζω τα άλλα στηρίζω τα άλλα Χ = ( = 8* με χ,0.05 =

36 6. Σύγκριση περισσοτέρων από δύο συσχετισμένων ποσοστών Τεστ του Cochran. Έστω n άτομα τα οποία υποβάλλονται π.χ. σε 3 θεραπευτικές αγωγές Α, Β, C. Είναι τα ποσοστά επιτυχίας p A, p B, p c ίσα; Δεδομένα άτομο Α Β C : : : : n Τα δεδομένα μπορούν να συνοψιστούν και σε ένα πίνακα ανάλογο του πίνακα του τεστ McNemar. Εδώ όμως διατηρούμε τα αρχικά δεδομένα και θεωρούμε ότι έχουμε μια μεταβλητή y η οποία παίρνει τιμές 0 ή (- ή + ανάλογα με το αποτέλεσμα της θεραπείας Α, Β, C που εφαρμόζεται στην τύχη στο άτομο (Σχέδιο πλήρους τυχαιοποιημένου μπλοκ. Συμβολισμός: block (άτομο θεραπεία (ομάς... K y y... y k y y y... y k y : : : : : : : : : : n y n y n... y nk y n y y... y n y.. Tεστ του Cochran: Q = ( k ( k ky.. y y.. ~ y X k H o 68

37 Παράδειγμα: άτομα τα οποία παρακολουθούνται σε μια ψυχιατρική κλινική εξετάζονται ως προς την «διαταραχή της σκέψης» από 4 ιατρούς της κλινικής. Η σειρά της εξέτασης του κάθε ασθενούς ήταν τυχαία και κάθε ιατρός εξέτασε κάθε ασθενή (σχέδιο τυχαιοποιημένου μπλοκ. Υπάρχει διαφορά ως προς τα ποσοστά διάγνωσης διαταραχής της σκέψης μεταξύ των 4 ιατρών. Δεδομένα: ιατρός ιατρός άτομο Σύνολο f Cochran s Q: Q = 3(4( =3.69< 4 4 ( χ 3,0.05 =7.8 Δεν υπάρχει ένδειξη απόρριψης της Η 0 : p =p =p 3 =p 4 69

38 6.3 MANTEL HAENSZEL TEST: S ΑΝΕΞΑΡΤΗΤΟΙ ΠΙΝΑΚΕΣ Έστω ότι έχουμε περισσότερους από πίνακες συνάφειας (n άτομα ταξινομούνται με βάση δύο χαρακτηριστικά π.χ. παράγοντα (factor +,- και ασθένεια +,-, κάπνισμα +,- και καρκίνο +,-, condton +,- και response +,-, π.χ. ( δύο ή περισσότερες μελέτες του ίδιου αιτιολογικού προβλήματος που έχουν γίνει σε διαφορετικές χρονικές περιόδου ή κέντρα ( τα δύο χαρακτηριστικά ταξινομούνται και με βάση άλλο παράγοντα (nusance π.χ. ομάδες ηλικιών, κ.λπ. Υπάρχει σχέση μεταξύ των δύο χαρακτηριστικών για όλα τα επίπεδα του τρίτου χαρακτηριστικού (παράγοντα; Έστω n jk ο αριθμός των ατόμων με τον παράγοντα στο επίπεδο (+ ή - που έχει την ασθένεια στο επίπεδο j (+ ή - στο στρώμα κ, κ=,,..., s,,j=,. n n n j n js n n κ= κ= κ=s To στατιστικό των Mantel-Haenszel προκύπτει παίρνοντας ένα από τα 4 κελιά, π.χ. το n k και υπολογίζοντας τη μέση τιμή και την διακύμανση του n k χρησιμοποιώντας την υπεργεωμετρική κατανομή (υποθέτοντας ότι τα margnal totals είναι σταθερά. Έχουμε n marg.total ~ Hg (n.., n., n /n.. n Και Ε(n = n, Var(n = n.. (X~Hg(N,n,p, EX=np, VarX= npq To στατιστικό είναι: n n n n.. n.. N n N nk E( nk Var( n k n... n n.. n / ~ (Ν(0, n n. n. = ( n.. n.. όταν ισχύει η Η 0 τη μη σχέσης μεταξύ παράγοντα και ασθένειας για όλα τα στρώματα ή 70

39 n k n n k.. k n ( n n k.. k k n n.. n k k k ~ χ. Αντί για το τεστ Mantel Haenszel θα μπορούσε να χρησιμοποιηθεί το χ τεστ ανεξαρτησίας για κάθε πίνακα αθροίζοντας το για τους s πίνακες με χ και s β.ε Το Mantel Haenszel test απαιτεί το n... να είναι μεγάλο ενώ το δεύτερο τεστ χ απαιτεί το n..k σε κάθε στρώμα να είναι μεγάλο. Το τεστ Mantel-Haenszel χρησιμοποιείται ευρύτερα. Είναι ένα τεστ ολικής συσχέτισης / συνάφειας δύο ποιοτικών χαρακτηριστικών. Μπορεί κάποια συχνότητα n jk να είναι 0. Δεν πρέπει όμως τα πηλίκα πιθανοτήτων a να διαφέρουν πολύ μεταξύ τους. Η υπόθεση που ελέγχεται με το παραπάνω τεστ είναι γνωστή και ως υπόθεση δεσμευμένης ανεξαρτησίας (condtonal ndependence για τρισδιάστατους πίνακες συνάφειας. 7

40 6.4 CASE STUDY: ΚΑΡΚΙΝΟΣ ΤΟΥ ΠΡΟΣΤΑΤΗ Όταν γίνεται διάγνωση καρκίνου του προστάτη και πρόκειται να αποφασιστεί η στρατηγική θεραπείας είναι απαραίτητο να απαντηθεί το ερώτημα αν ο καρκίνος έχει απλωθεί στους γειτονικούς λεμφαδένες. Το ερώτημα είναι τόσο κρίσιμο ώστε να συνηθίζεται να γίνεται χειρουργική επέμβαση (laparatomy με μοναδικό σκοπό την εξέταση των αδένων, αφαίρεση δειγμάτων ιστού και ιστολογική εξέταση. Υπάρχουν όμως μεταβλητές που μπορούν να μετρηθούν χωρίς χειρουργική επέμβαση και έχουν «προβλεπτική» ικανότητα για την προσβολή των λεμφαδένων. Οι μεταβλητές αυτές είναι: η ένδειξη ακτινών Χ (Χ «χονδρικό» μέτρο μεγέθους και θέσης του όγκου [στάδιο] (που παίρνεται με ψηλάφηση μέσου του ορθού (Χ προεγχειρητική παθολογοανατομική ένδειξη της βιοψίας του όγκου (παίρνεται με βελόνη πριν από την εγχείρηση (Χ 3 [διαβάθμιση] ηλικία (Χ 4 επίπεδο phosphatase στον όρο του αίματος (Χ 5 Το επιστημονικό ενδιαφέρον είναι να διαπιστωθεί ποιες από τις πέντε (5 προεγχειρητικές μεταβλητές μπορούν να προβλέψουν προσβολή αδένων και με πόση ακρίβεια. Ειδικότερο ενδιαφέρον είναι να διαπιστωθεί αν αυξημένα επίπεδα phosphatase στον όρο του αίματος έχουν επιπρόσθετη προβλεπτική αξία δοθέντων των άλλων τεσσάρων μεταβλητών που χρησιμοποιούνται συνήθως. ΔΕΔΟΜΕΝΑ ΚΑΡΚΙΝΟΥ ΠΡΟΣΤΑΤΗ Χ = ένδειξη ακτινών Χ Διωνυμικές μεταβλητές Χ = στάδιο: «χονδρικό» μέτρο μεγέθους και θέσης όγκου = θετικό ή σοβαρό εύρημα Χ 3 = διαβάθμιση: προεγχειρητική παθολοανατομική ένδειξη 0= «κενό» = αρνητικό ή μη σοβαρό βιοψίας όγκου εύρημα Χ 4 = ηλικία Χ 5 - phosphatase X 6 = λεμφαδένες 7

41 Αριθμός ασθενών Ακτίνες Χ Στάδιο Διαβάθμιση Ηλικία Phosphatase Λεμφανικοί αδένες Αριθμός ασθενών Ακτίνε Χ Στάδιο Διαβάθμιση Ηλικία Phosphatase Λεμφανικοί αδένες Αριθμός ασθενών Ακτίνε Χ Στάδιο Διαβάθμιση Ηλικία Phosphatase Λεμφανικοί αδένες α. Διαγνωστική ικανότητα κάθε μεταβλητής χωριστά Αδένες Αδένες 0 0 X ray Στάδιο (stage Ευαισθησία = /0 Ειδικότητα = 9/33 Ολικό σφάλμα=3/53=4% Ολικό σφάλμα = 7/53=3% α = 8.86 α =

42 Grade Αδένες Αδένες Ηλικία < Ολικό σφάλμα = 8/53 = 34% Ολικό σφάλμα= 3/53= 58% α = 3.6 α = 0.05 Acd <60 60 Αδένες Ολικό σφάλμα = 8/53 = 34% α= 6 9/4 4 = 5.4 Για τον πίνακα Χ ray αδένες έχουμε: Sens= /0, spec = 9/33, P(-Χ ray +αδένες = 9/0 σφάλμα λανθασμένα αρνητικό (false negatve P(+Χ ray -αδένες = 4/33 σφάλμα λανθασμένα θετικό (false postve. Έτσι το ολικό σφάλμα λανθασμένης ταξινόμησης είναι: total msclassfcaton error rate (πιθανότητα ενός ή άλλου σφάλματος δοθέντος των σχετικών συχνοτήτων του 0 και αδένων= = P(-Χ ray και + αδένες+ρ (+ Χ ray και αδένες = P(-Χ ray +αδένεςρ(+αδένες+ρ(+ Χ ray -αδένεςρ-(αδένες = 9/0 0/53+4/33 33/53=(9+4/53=3/53. Για τον πίνακα acd x αδένες το ολικό msclassfcaton σφάλμα είναι 8/53. Για τον πίνακα stage x αδένες το ολικό msclassfcaton σφάλμα είναι 7/53. Για 74

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2 ΠΕΡΙΕΧΟΜΕΝΑ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 Πιθανότητες 1.1 Πιθανότητες και Στατιστική... 5 1.2 ειγματικός χώρος Ενδεχόμενα... 7 1.3 Ορισμοί και νόμοι των πιθανοτήτων... 10 1.4 εσμευμένη πιθανότητα Ολική

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson

Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson Έλεγχος Ανεξαρτησίας x του Parso Έστω ότι λαμβάνουμε δείγμα μεγέθους. Η πιθανότητα π εμφάνισης ενός χαρακτηριστικού να βρεθεί στο κελί (i,j) κάτω από την υπόθεση Η 0 της ανεξαρτησίας δίνεται από την σχέση

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

1. ΕΙΣΑΓΩΓΗ 1.1 Ο ρόλος της Στατιστικής στην Ιατρική Η εξέλιξη της Ιατρικής από το δογµατισµό, ακόµη και το µυστικισµό, στην επιστηµονική αβεβαιότητα

1. ΕΙΣΑΓΩΓΗ 1.1 Ο ρόλος της Στατιστικής στην Ιατρική Η εξέλιξη της Ιατρικής από το δογµατισµό, ακόµη και το µυστικισµό, στην επιστηµονική αβεβαιότητα . ΕΙΣΑΓΩΓΗ. Ο ρόλος της Στατιστικής στην Ιατρική Η εξέλιξη της Ιατρικής από το δογµατισµό, ακόµη και το µυστικισµό, στην επιστηµονική αβεβαιότητα ξεκίνησε τον 7 ο αιώνα. Το κλειδί σ αυτή την εξέλιξη υπήρξε

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Στατιστικοί Έλεγχοι Υποθέσεων Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Τι θέλουμε να συγκρίνουμε; Δύο δείγματα Μέση αρτηριακή πίεση σε δύο ομάδες Πιθανότητα θανάτου με δύο διαφορετικά

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 015 Ανάλυση Διακύμανσης Η Ανάλυση Διακύμανσης είναι μία τεχνική που

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ SPSS

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ Έστω ότι επιθυμούμε να μελετήσουμε ένα τυχαίο πείραμα με δειγματικό χώρο Ω και έστω η πιθανότητα να συμβεί ένα ενδεχόμενο Α Ω Υπάρχουν περιπτώσεις όπου ενώ δεν γνωρίζουμε

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Κριτήρια επιλογής μέτρων συνάφειας

Κριτήρια επιλογής μέτρων συνάφειας Κριτήρια επιλογής μέτρων συνάφειας Ο όρος συνάφεια προέρχεται από τον Pearso (1904) όπου ορίζεται για ένα πίνακα IJ ως ένα μέτρο της συνολικής απόκλισης της ταξινόμησης από την ανεξάρτητη πιθανότητα. Από

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε. ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Χημική Τεχνολογία Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε. Άδειες Χρήσης

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Ενότητα 3 Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Εκτός από τις μέσες τιμές, τυπικές αποκλίσεις κλπ, θέλουμε να βρούμε κατά πόσον αυτές οι παρατηρούμενες τάσεις εξαρτώνται από συγκεκριμένες συνθήκες ή προϋποθέσεις.

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ (Analyss of Varance for two factor Experments) (Two-Way Analyss of Varance) Ο πειραματικός σχεδιασμός για τον οποίο θα μιλήσουμε είναι μια επέκταση της μεθοδολογίας

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Αιτιότητα και τυχαίο σφάλμα στις επιδημιολογικές μελέτες

Αιτιότητα και τυχαίο σφάλμα στις επιδημιολογικές μελέτες Αιτιότητα και τυχαίο σφάλμα στις επιδημιολογικές μελέτες Αιτιότητα Πρόγραμμα εκπαίδευσης στην επιδημιολογική επιτήρηση και διερεύνηση επιδημιών ΕΣΔΥ ΚΕΕΛΠΝΟ, 2007 "Ευτυχισμένος είναι αυτός που κατόρθωσε

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Πολλαπλές συγκρίσεις Στην ανάλυση διακύμανσης ελέγχουμε την ισότητα

Διαβάστε περισσότερα

8. Ελεγχος Υποθεσεων. Μαθηματικά και Στατιστικη στην Βιολογια ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (1 ο ) Τμημα Βιολογιας Αριστοτελειο Πανεπιστημιο Θεσσαλονικης

8. Ελεγχος Υποθεσεων. Μαθηματικά και Στατιστικη στην Βιολογια ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (1 ο ) Τμημα Βιολογιας Αριστοτελειο Πανεπιστημιο Θεσσαλονικης Μαθηματικά και Στατιστικη στην Βιολογια ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (1 ο ) Τμημα Βιολογιας Αριστοτελειο Πανεπιστημιο Θεσσαλονικης Mathematics and Statistics in Biology WINTER SEMESTER (1 st ) School of Biology Aristotle

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2 ΚΕΦΑΛΑΙΟ ο: ΣΥΝΑΡΤΗΣΕΙΣ - ΟΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΕΝΟΤΗΤΑ 8: ΘΕΩΡΗΜΑ BOLZANO - ΠΡΟΣΗΜΟ ΣΥΝΑΡΤΗΣΗΣ - ΘΕΩΡΗΜΑ ΕΝΔΙΑΜΕΣΩΝ ΤΙΜΩΝ - ΘΕΩΡΗΜΑ ΜΕΓΙΣΤΗΣ ΚΑΙ ΕΛΑΧΙΣΤΗΣ ΤΙΜΗΣ - ΣΥΝΟΛΟ ΤΙΜΩΝ ΣΥΝΕΧΟΥΣ ΣΥΝΑΡΤΗΣΗΣ

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Κλινική Επιδηµιολογία. Μέτρα κινδύνου Αιτιολογική συσχέτιση

Κλινική Επιδηµιολογία. Μέτρα κινδύνου Αιτιολογική συσχέτιση Κλινική Επιδηµιολογία Μέτρα κινδύνου Αιτιολογική συσχέτιση Μέτρα κινδύνου Αιτιολογική συσχέτιση Σύγκριση µεταξύ διαφορετικών πληθυσµών ως προς την έκθεση (exposure) Σύγκριση της κατανοµής της συχνότητας

Διαβάστε περισσότερα

Αν έχουμε δύο μεταβλητές Χ και Υ και σύμφωνα με την οικονομική θεωρία η μεταβλητή Χ προσδιορίζει τη συμπεριφορά της Υ το ερώτημα που τίθεται είναι αν

Αν έχουμε δύο μεταβλητές Χ και Υ και σύμφωνα με την οικονομική θεωρία η μεταβλητή Χ προσδιορίζει τη συμπεριφορά της Υ το ερώτημα που τίθεται είναι αν ΜΑΘΗΜΑ 12ο Αιτιότητα Ένα από τα βασικά προβλήματα που υπάρχουν στην εξειδίκευση ενός υποδείγματος είναι να προσδιοριστεί η κατεύθυνση που μία μεταβλητή προκαλεί μία άλλη σε μία εξίσωση παλινδρόμησης. Στην

Διαβάστε περισσότερα

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Το διάστημα εμπιστοσύνης είναι ένα διάστημα αριθμών

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test 1 Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου One-Sample t-test 2 Μια σύντομη αναδρομή Στα τέλη του 19 ου αιώνα μια μεγάλη αλλαγή για την επιστήμη ζυμώνονταν στην ζυθοποιία Guinness. Ο William Gosset

Διαβάστε περισσότερα

Στατιστικοί έλεγχοι για διακριτά δεδομένα

Στατιστικοί έλεγχοι για διακριτά δεδομένα Στατιστικοί έλεγχοι για διακριτά δεδομένα Διαστρωμάτωση Mantel-Haenszel test Γεωργία Σαλαντή Λέκτορας επιδημιολογίας Λεπτοσπείρωση Πιο πολλά κρούσματα στις αγροτικές περιοχές; Πόσο επί τις εκατό του πληθυσμού

Διαβάστε περισσότερα

Περιεχόμενα 3ης Διάλεξης 1 Σύνοψη Προηγούμενου Μαθήματος 2 Δεσμευμένη Πιθανότητα 3 Bayes Theorem 4 Στοχαστική Ανεξαρτησία 5 Αμοιβαία (ή πλήρης) Ανεξαρ

Περιεχόμενα 3ης Διάλεξης 1 Σύνοψη Προηγούμενου Μαθήματος 2 Δεσμευμένη Πιθανότητα 3 Bayes Theorem 4 Στοχαστική Ανεξαρτησία 5 Αμοιβαία (ή πλήρης) Ανεξαρ 3ο Μάθημα Πιθανότητες Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2016-2017 Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής 3ο Μάθημα Πιθανότητες

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες)

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες) Εργαστήριο Μαθηματικών & Στατιστικής Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ η Πρόοδος στο Μάθημα Στατιστική //7 ο Θέμα α) Περιγράψτε τη σχέση Θεωρίας Πιθανοτήτων και Στατιστικής. β) Αν Α, Β ενδεχόμενα του δειγματικού χώρου Ω

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα. Η Διωνυμική Κατανομή Η Διωνυμική κατανομή συνδέεται με ένα πολύ απλό πείραμα τύχης. Ίσως το απλούστερο! Πρόκειται για τη δοκιμή Bernoulli, ένα πείραμα τύχης με μόνο δύο, αμοιβαίως αποκλειόμενα, δυνατά

Διαβάστε περισσότερα

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας. Περιεχόμενα της Ενότητας Στατιστική Ι Ενότητα 5: Συνεχείς Κατανομές Πιθανότητας Δρ. Χρήστος Εμμανουηλίδης Επίκουρος Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

(p 1) (p m) (m 1) (p 1)

(p 1) (p m) (m 1) (p 1) ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ Σκοπός της παραγοντικής ανάλυσης είναι να περιγράψει την συνδιασπορά μεταξύ των μεταβλητών με την βοήθεια τυχαίων άγνωστων ποσοτήτων που ονομάζονται παράγοντες. Το μοντέλο είναι το

Διαβάστε περισσότερα

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ - - ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ3 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 009-0 ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ - - ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΥΝΟΨΗΣ

Διαβάστε περισσότερα

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό; Γραπτή Εξέταση Περιόδου Ιουνίου 008 στο Μάθημα Στατιστική /07/08. Η πιθανότητα να υπάρχει στο υπέδαφος μιας συγκεκριμένης περιοχής εκμεταλλεύσιμο κοίτασμα πετρελαίου είναι 50%. Μια εταιρεία, που πρόκειται

Διαβάστε περισσότερα

Μάστερ στην Εφαρµοσµένη Στατιστική

Μάστερ στην Εφαρµοσµένη Στατιστική Μάστερ στην Εφαρµοσµένη Στατιστική Πρότυπο Πρόγραµµα Master Εξάµηνο Σπουδών Κωδικός Τίτλος Μαθήµατος ιδακτικές Μονάδες 1 ο Εξάµηνο ΜΑΣ650 Μαθηµατική Στατιστική 10 ΜΑΣ655 ειγµατοληψία 10 ΜΑΣ658 Στατιστικά

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα