ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗΝ ΕΠΙΔΗΜΙΟΛΟΓΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗΝ ΕΠΙΔΗΜΙΟΛΟΓΙΑ"

Transcript

1 ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗΝ ΕΠΙΔΗΜΙΟΛΟΓΙΑ Ο ρόλος της Στατιστικής στην ιατρική. Ανασκόπηση απλής στατιστικής μεθοδολογίας στην Ιατρική. Αιτία, αιτιότητα, συσχέτιση, συντελεστής kappa. Ταξινόμηση νόσων (Internatonal Classfcaton of Dseases, ICD code. Επίπτωση, επιπολασμός, προτυποποίηση. Αιτιολογικοί δείκτες (κίνδυνος, odds rato. Ευαισθησία, ειδικότητα, προγνωστική άξια. Μέθοδος Mantel-Hanenszel. Ανάλυση μελετών μαρτύρων ασθενών, επιλογή μαρτύρων. Παλινδρόμηση Posson. Μοντέλα συνάφειας. Θέματα ανάλυσης διασποράς και συνδιασποράς με fxed και random effects. Συλλογή ασθενών. Αρχές βιοστατιστικών και επιδημιολογικών μελετών. Εισαγωγή στα Repeated measures longtudnal data και μεταανάλυση. Βιβλιογραφία Παπαιωάννου Τ. και Φερεντίνου Κ. (000. Ιατρική Στατιστική, Εκδόσεις Α. Σταμούλης, Αθηνά. Ahlborn A. and Norell S. (900. Introducton to Modern Epdemology. Epdemology Resources Inc. Agrest A. (990 Categorcal Data Analyss, nd Edton (00. Altman D.G.(99. Practcal statstcs n medcal research, Chapman and Hall. Armtage P., Mathews J.N.S., Berry G. Statstcal methods n medcal research, (00 4th Edton, Blackwell. Breslow N.E. και Day N.E. (980 και 987. Statstcal methods n Cancer Research, Vol I και II. Clayton D. and Hlls M., (993. Statstcal methods n Epdemology, Oxford Unversty Press. Gardner, M.J. and Altman D.G. (984.Statstcs wth Confdence, Brtsh Medcal Journal. Gore S.M. and Altman D.G. (98 Statstcs n Practce, Brtsh Medcal Journal. Woolson R.F. (987. Statstcal Methods for the Analyss of Bomedcal Data, Wley. Άλλες αναφορές Armtage P. and Colton T. (998 Encyclopeda of Bostatstcs, 6 volumes, Wley. World Health Organzaton (99 Internatonal Statstcal Classfcaton of Dseases and Related Health Problems, 0 th revson, WHO Geneva. Αναφορές Βασικής θεωρίας Παπαϊωάννου Τ. (000 Θεωρία Πιθανοτήτων και Στατιστικής, Εκδόσεις Σταμούλης, Αθηνά. Παπαιωαννου Τ. και Φερεντίνος Κ.(000 Μαθηματική Στατιστική:Εκτιμητική, Έλεγχος Υποθέσεων, Εφαρμογές. Εκδόσεις Σταμούλη, Αθήνα.

2 ΠΡΟΛΟΓΟΣ Οι σημειώσεις αυτές:. Αναπτύχθηκαν στα πλαίσια του μαθήματος «Βιοστατιστική και Στατιστικές Μέθοδοι στην Επιδημιολογία το οποίο δίδαξα τα τελευταία χρόνια στο Πρόγραμμα Μεταπτυχιακών Σπουδών «Εφαρμοσμένη Στατιστική, Κατεύθυνση Βιοστατιστικής του Τμήματος Στατιστικής και Ασφαλιστικής Επιστήμης του Παν/μίου Πειραιώς και. Απευθύνονται σε φοιτητές που έχουν διδαχθεί ένα δύο μαθήματα Πιθανοτήτων Στατιστικής χωρίς αναγκαστικά να έχει προηγηθεί ένα μάθημα «Βιοστατιστικής». Κατά συνέπεια σε ότι αφορά τη δυσκολία τους μπορούν να θεωρηθούν ως ενδιάμεσου επιπέδου στον ευρύτερο χώρο της Βιοστατιστικής και της Στατιστικής Επιδημιολογίας. Η έμφαση είναι όχι μόνο στην παρουσίαση των διαφόρων θεμάτων και αποτελεσμάτων αλλά και στη στατιστική τους αιτιολόγηση και προέλευση. Τάκης Παπαϊωάννου Πειραιάς Νοέμβριος 004

3 ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο : ΕΙΣΑΓΩΓΗ ΕΠΑΝΑΛΗΨΗ.... Ο Ρόλος της Στατιστικής στην Ιατρική.... Ανασκόπηση Στατιστικής Θεωρίας..... Εκτιμητής Μέγιστης Πιθανοφάνειας Διαστήματα Εμπιστοσύνης Έλεγχος Υποθέσεων Τεστ Απλή Στατιστική Μεθοδολογία P-Values και Διαστήματα Εμπιστοσύνης Ισχύς (Power...9 Κεφάλαιο : ΠΟΣΟΣΤΑ ΑΝΑΛΟΓΙΕΣ...0. Σύγκριση Ποσοστών κατά Ζεύγη...0. Επίπτωση (Incdence-Επιπολασμός (Prevalence Προτυποποίηση (Standardzaton Ποσοστών...7 Κεφάλαιο 3: ΜΕΤΡΑ ΣΥΝΑΦΕΙΑΣ ΓΙΑ ΚΑΤΗΓΟΡΙΚΑ ΔΕΔΟΜΕΝΑ Μέτρα Συνάφειας ως Συναρτήσεις του Χ Σχετικός Κίνδυνος (Relatve Rsk-Λόγος Πιθανοτήτων (Odds Rato ή Λόγοι Διαγωνίων Γινομένων για Πίνακες Μέτρα Συνάφειας για Διατακτικούς (Ordnal Πίνακες Συνάφειας Μέτρα Συμφωνίας μεταξύ Αξιολογητών Συντελεστής Κάππα του Cohen...3 Κεφάλαιο 4: ΕΥΑΙΣΘΗΣΙΑ ΕΙΔΙΚΟΤΗΤΑ ΠΡΟΒΛΕΠΤΙΚΗ ΑΞΙΑ Ευαισθησία και Ειδικότητα Προβλεπτική Αξία Διαγνωστικών Κριτηρίων...40 Κεφάλαιο 5: ΚΑΛΗ ΠΡΟΣΑΡΜΟΓΗ Χ (Goodness Of Ft Έλεγχοι (Τεστ Καλής Προσαρμογής Έλεγχος συγκεκριμένης Πολυωνυμικής κατανομής Έλεγχος Πολυωνυμικής Κατανομής Έλεγχος Καλής Προσαρμογής με το Λόγο Πιθανοφανειών-G Γινόμενοι Πολυωνυμικών Κατανομών Ομογένεια Ποσοστών Έλεγχοι Ανεξαρτησίας σε Πίνακες Συνάφειας Το Τεστ McNemar ως X Τεστ...63 Κεφάλαιο 6: ΓΕΝΙΚΕΥΣΕΙΣ: STUART-MAXWELL, COCHRAN και MANTEL-HAENSZEL Σύγκριση κατά Ζεύγη με περισσότερα από Δύο Δυνατά Αποτελέσματα- Τεστ των Stuart Maxwell Σύγκριση Περισσότερων από δύο Συσχετισμένων Ποσοστών-Τεστ του Cochran Mantel-Haenzel Test: Ανεξάρτητοι Πίνακες Case Study...7 Κεφάλαιο 7: ΑΛΛΑ ΘΕΜΑΤΑ Χ Τετράγωνο για Τάση (Χ for Trend Καμπύλες ROC...84 Κεφάλαιο 8: ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ...87 Κεφάλαιο 9: ΕΙΔΙΚΕΣ ΜΕΛΕΤΕΣ Μελέτες Ασθενών Μαρτύρων (Case-control studes Μελέτες Ασθενών Ομάδων (Case Cohort studes...88 ΒΙΒΛΙΟΓΡΑΦΙΑ...89

4 4. ΕΥΑΙΣΘΗΣΙΑ ΕΙΔΙΚΟΤΗΤΑ ΠΡΟΒΛΕΠΤΙΚΗ ΑΞΙΑ 4. ΕΥΑΙΣΘΗΣΙΑ ΚΑΙ ΕΙΔΙΚΟΤΗΤΑ Η ευαισθησία και η ειδικότητα ενός διαγνωστικού τεστ ή μίας (νέας θεραπευτικής μεθόδου είναι δύο σημαντικά ποσοστά τα οποία συχνά χρησιμοποιούνται σε θέματα διαγνωστικών κριτηρίων ή τεστ (screenng tests. Είναι γνωστό ότι ένα διαγνωστικό τεστ κάποιου παράγοντα μπορεί να οδηγήσει στον ακόλουθο τετράπτυχο πίνακα Παράγοντας Τεστ - «Τεστ + ή» σημαίνει θετική ή αρνητική δήλωση και «παράγοντας + ή -» σημαίνει παρουσία του παράγοντα, δηλαδή ασθενής ή απουσία του παράγοντα, δηλαδή μη ασθενής (μάρτυρας αντίστοιχα. Έτσι ορίζονται τα παρακάτω ποσοστά:. ευαισθησία (senstvty του κριτηρίου είναι το ποσοστό των ασθενών που ικανοποιούν το κριτήριο ευαισθησία = Ρ(τεστ + / ασθενής. ειδικότητα (specfcty του κριτηρίου είναι το ποσοστό των υγιών (μαρτύρων που δεν ικανοποιούν το κριτήριο ειδικότητα = Ρ(τεστ - / μη ασθενής ή μάρτυρας 3. ποσοστό λανθασμένα θετικά ατόμων (false postve = ειδικότητα 4. ποσοστό λανθασμένα αρνητικών ατόμων (false negatve = ευαισθησία 36

5 5. ποσοστό ολικού σφάλματος λανθασμένης ταξινόμησης = Ρ (θετικό σφάλμα Ρ (υγιής + Ρ (αρνητικό σφάλμα Ρ (ασθενής = = ποσοστό δύο σφαλμάτων δεδομένης της σχετικής συχνότητας των ασθενών Παράδειγμα Σε ένα καινούριο τεστ διαγνώσεων καρκίνου εξετάστηκαν 900 άτομα, εκ των οποίων άλλα είχαν καρκίνο και άλλα δεν είχαν, με τα εξής αποτελέσματα: Αποτελέσματα Άτομα Σύνολο του τεστ με ασθένεια χωρίς ασθένεια Θετικό Αρνητικό Σύνολο Ζητάμε να εκτιμήσουμε τα προηγούμενα ποσοστά. Έτσι έχουμε: Παρατηρούμε ότι : ευαισθησία = 40 80% 300 = ειδικότητα = % 600 = ποσοστό θετικού σφάλματος = 30 5% 600 = ποσοστό αρνητικού σφάλματος = 60 0% 300 = ποσοστό ολικού σφάλματος = = % ευαισθησία = ποσοστό αρνητικού σφάλματος = = Ρ(σφάλμα Τύπου I = -α ειδικότητα = ποσοστό θετικού σφάλματος = = Ρ(σφάλμα Τύπου II = -β 37

6 όπου τα σφάλματα Τύπου I και II είναι τα γνωστά σφάλματα στον έλεγχο υποθέσεων. Εδώ ως μηδενική υπόθεση ορίζεται ένας ασθενής να δηλωθεί αρνητικός. Παράδειγμα Σε μία διαδικασία αιμοδοτών που καθορίζεται από την τιμή του log0sgtp στον όρο του αίματος εξετάστηκαν.000 άτομα εκ των οποίων άλλα έγιναν δεκτά για αιμοδοσία και άλλα όχι όπως φαίνεται στον παρακάτω πίνακα Αποτελέσματα της διαδικασίας δεκτοί για αίμα (τεστ - όχι δεκτοί για αίμα (τεστ + άτομα υγιή άτομα ασθενή Σύνολο Σύνολο Εργαζόμενοι όπως στο προηγούμενο παράδειγμα έχουμε: Ευαισθησία = 94 78,3% 0 = Ειδικότητα = % 880 = Ποσοστό θετικού σφάλματος = 44 5% 880 = Ποσοστό αρνητικού σφάλματος = 6,7% 0 = Παρατηρούμε ομοίως ότι : Ποσοστό ολικού σφάλματος = = =0,044+ 0,0= 0,64=,64% Ευαισθησία = Ρ(Σφάλμα Τύπου I = -6/0 Ειδικότητα = Ρ(Σφάλμα Τύπου II = -44/880 38

7 Σχόλια: Ένα διαγνωστικό τεστ (screenng test μπορεί να είναι λανθασμένο θετικό ή λανθασμένα αρνητικό. Όσο μεγαλύτερος είναι ο αριθμός των λανθασμένων τόσο μικρότερη είναι η ευαισθησία. ευαισθησία ειδικότητα 39

8 4. ΠΡΟΒΛΕΠΤΙΚΗ ΑΞΙΑ ΔΙΑΓΝΩΣΤΙΚΩΝ ΚΡΙΤΗΡΙΩΝ Η προβλεπτική αξία ενός διαγνωστικού τεστ (predctve test αξιολογείται με την πιθανότητα ένα άτομο να έχει τη νόσο δοθέντος ότι το διαγνωστικό τεστ είναι θετικό, δηλαδή την Ρ(ασθενής / τεστ + PPV και την πιθανότητα ένα άτομο να είναι υγιές δοθέντος ότι το διαγνωστικό τεστ είναι αρνητικό, δηλαδή την Ρ(υγιής / τεστ - =NPV Η πρώτη πιθανότητα λέγεται θετική προβλεπτική αξία (postve predctve value και η δεύτερη αρνητική προβλεπτική αξία (negatve predctve value του διαγνωστικού τεστ. Ισχύουν: Ρ(νόσος = επιπολασμός νόσου (prevalence Ρ(νόσος / τεστ θετικό = θετική προβλεπτική αξία Ρ(τεστ θετικό / νόσος = ευαισθησία Ρ(τεστ θετικό / υγιής = ειδικότητα Για τον υπολογισμό των προβλεπτικών αξιών ενός διαγνωστικού τεστ στηριζόμαστε στο Θεώρημα του Bayes και μπορούμε να χρησιμοποιήσουμε τους τύπους: Θετική προβλεπτική αξία (PPV ευαισθησία επιπολασµ ός = ευαισθησία επιπολασµ ός + ( ειδικότητα ( επιπολασµ ός Αρνητική προβλεπόμενη αξία (NVP ειδικότητα ( επιπολασµ ός = ειδικότητα ( επιπολασµ ός + ( ευαισθησία επιπολασµ ός Είναι φανερό ότι οι προβλεπτικές αξίες εξαρτώνται από τον επιπολασμό και μπορεί να διαφέρουν σημαντικά για μικρές διαφορές του επιπολασμού. 40

9 Σε ένα διαγνωστικό τεστ, εκτός από την ευαισθησία ενδιαφερόμαστε και για τις «θετικές προβλεπτικές τιμές» δηλαδή την εκ των υστέρων πιθανότητα ένα άτομο να έχει τη νόσο δοθέντος ότι το τεστ είναι θετικό. Για να υπολογιστεί αυτή η πιθανότητα χρειαζόμαστε την εκ των προτέρων πιθανότητα εμφάνισης της νόσου δηλαδή του επιπολασμού. Μετά η θετική προβλεπτική αξία υπολογίζεται με το θεώρημα Bayes ή με έναν πίνακα της μορφής: Νόσος Διαγν. + Τεστ Ο οποίος συμπληρώνεται για 00 ή 000 άτομα. Ακολουθεί ένα «εύθυμο» παράδειγμα όπως παρουσιάστηκε σε ιατρικό, επιμορφωτικό συνέδριο. Assume that the followng nformaton s true A new dsease affectng people who read books about health care has recently been dentfed. It occurs n % of the populaton at rsk. The symptoms are nasty, but the dsease s not fatal. If t s left untreated, the vctm has chlls and fever for several weeks and suffers from moderate ntermttent nausea and palsy. The symptoms then dmnsh and dsappear. A new treatment elmnates these symptoms entrely, but t only works f admnstered pror to the onset of symptoms. That treatment nvolves no sgnfcant rsk, and nearly always work. But t s costly, nvolves takng daly doses of a foul medcne, and, worse, requres total abstenton from ce cream for eght weeks. A new test has been developed to dentfy vctms of the dsease presymptomatcally. Its specfcty and senstvty are each 98%, that s, t dentfes 98% of those who have the dsease wth a postve test result, and t dentfes 98% of those who do not have the dsease wth a negatve test result. The publc health servce has screened potental vctms of the dsease wth ths test, n order to dentfy those who should be offered the treatment. I regret to nform you that your test was postve. Please answer these two questons: 4

10 . How lkely do you thnk t s that you have the dsease? Probablty: (check one 95% % 74-84% 65-74% 55-64% 45-54% 35-44% 5-34% 5-4% 5-4% 5-4% -5% 0%. Do you want the treatment? Απάντηση: Κατασκευάζουμε τον πίνακα Τεστ Νόσος Θα περίμενε κανείς, εφόσον το τεστ είναι θετικό η πιθανότητα να είναι μεγάλη, π.χ. 95%. Η ακριβής όμως πιθανότητα είναι μικρή: Ρ(νόσος + τεστ + = 98/.096 = 0,0468 4,6% Βλέπουμε ότι είναι μεγαλύτερη του. Καλύτερα όμως να μην «πάρουμε» τη θεραπεία γι αυτή την «περίεργη» νόσο. Η θετική προβλεπτική αξία ενός διαγνωστικού τεστ συνήθως δεν είναι μεγάλη. Για να αυξηθεί πρέπει να αυξηθεί ο επιπολασμός (prevalence, η συχνότητα της νόσου π.χ. στο 0% ή στο 30%. Αυτό επιτυγχάνεται εφαρμόζοντας το διαγνωστικό τεστ σε ομάδες (πληθυσμό υψηλού κινδύνου π.χ. ηλικιωμένους ή καπνίζοντες όπου η συχνότητα (prevalence της νόσου είναι υψηλότερη έναντι του γενικού πληθυσμού. Διαγνωστικό τεστ και καρκίνος: Σε μερικά διαγνωστικά τεστ (screenng tests για τη διάγνωση (πρόβλεψη π.χ. του καρκίνου δεν είναι δυνατόν να διενεργηθεί αναδρομική μελέτη, παρά μόνο προοπτική. Και πάλι, μερικές φορές δεν είναι δυνατόν να αναμένουμε κάποιο μικρό ή μεγάλο χρονικό διάστημα για να διαγνώσουμε τη νόσο με βεβαιότητα και να προσδιορίσουμε την ευαισθησία ή την ειδικότητα του τεστ. Έτσι χρησιμοποιούμε μεταβλητές ή δείκτες (endponts που έχουν μεγάλη σχέση με την παρουσία ή μη της νόσου. 4

11 Για να αξιολογήσουμε ένα διαγνωστικό τεστ (να δούμε αν το screenng αξίζει να γίνει ή να καθιερωθεί εκτελούμε τυχαιοποιημένες ελεγχόμενες κλινικές δοκιμές (randomzed controlled clncal trals στις οποίες χρησιμοποιούνται άτομα τα οποία παίρνουν το τεστ και άτομα (controls που δεν παίρνουν το τεστ. Στον καρκίνο, η θνησιμότητα από τον καρκίνο είναι το συνηθέστερο χρησιμοποιημένο endpont για την αξιολόγηση του screenng. Για παράδειγμα, στον καρκίνο του μαστού υπάρχουν διάφορες διαγνωστικές μέθοδοι: αυτοεξέταση του μαστού, κλινική εξέταση, μαμμογραφία, θερμογραφία, υπέρηχος, lght sound κλπ. 43

12 ΑΣΚΗΣΕΙΣ.. Δίνεται ένας τετραγωνικός πίνακας συνάφειας ((π j I I και έστω ότι ισχύει το πολλαπλασιαστικό μοντέλο: π j = α α j (-β j = a + β a ( a =j (α Να δειχθεί ότι το μοντέλο ικανοποιεί τη συμμετρία και την περιθώρια ομοιογένεια (β Να δειχθεί ότι α = π. = π., =,,...I (c Να δειχθεί ότι β=k (κάππα Cohen και να ερμηνευθεί το k=0 και k= για το παραπάνω μοντέλο... Στην οδοντιατρική, ραδιογραφήματα τραπεζιτών (molars και προτραπεζιτών (premolars εξετάζονται από τρεις οδοντιάτρους με σκοπό τη διάγνωση. Σκοπός είναι να μελετηθεί η μεταβλητότητα (συμφωνία / ασυμφωνία μεταξύ των εξεταστών. Τα αποτελέσματα για κάθε δόντι (ραδιογράφημα χαρακτηρίζονται ως υγιές (Υ και χαλασμένο (Χ και έχουν ως εξής: Οδοντίατροι 3 Συχνότητα Υ Υ Υ.8 Υ Υ Χ. Υ Χ Υ 54 Υ Χ Χ 6 Χ Υ Υ 36 Χ Υ Χ 87 Χ Χ Υ 7 Χ Χ Χ 09 (a (b (c Ποιο ζεύγος οδοντίατρων συμφωνούν καλύτερα; Υπάρχει καλό επίπεδο συμφωνίας; Να αναλυθούν τα δεδομένα και με πρόγραμμα Η/Υ. 44

13 5. ΚΑΛΗ ΠΡΟΣΑΡΜΟΓΗ Χ (GOODNESS OF FIT 5.. ΈΛΕΓΧΟΙ (ΤΕΣΤ ΚΑΛΗΣ ΠΡΟΣΑΡΜΟΓΗΣ Όταν λέμε καλή προσαρμογή (goodness of ft εννοούμε το κατά πόσο πειραματικά ή δειγματοληπτικά δεδομένα, συνήθως συχνότητες, απαριθμήσεις (counts «ταιριάζουν» ή προέρχονται από μια συγκεκριμένη κατανομή ή μοντέλο πιθανοτήτων. Α. Πολυωνυμική κατανομή Το πιο γνωστό τεστ καλής προσαρμογής είναι το τεστ χι-τετράγωνο του Pearson που πρωτοεισήχθηκε από τον Karl Peason το 900. ο έλεγχος αυτός αξιολογεί (ελέγχει κατά πόσον πολυωνυμικές πιθανότητες είναι ίσες με ορισμένες υποθετικές τιμές. Στην επέκταση του, ελέγχει εάν τα δεδομένα ακολουθούν κάποια συγκεκριμένη κατανομή. 5.. Έλεγχος συγκεκριμένης Πολυωνυμικής κατανομής Έστω η μηδενική υπόθεση (Η ο ότι οι κ παράμετροι (π, π,...,π κ μιας πολυωνυμικής κατανομής έχουν τιμές ίσες με κάποιες συγκεκριμένες τιμές (π 0, π 0,...π κ0, όπου Σπ 0 = Σπ =. Όταν αληθεύει η Η 0 οι αναμενόμενες συχνότητες των κελιών ή κατηγοριών της πολυωνυμικής κατανομής είναι m 0 =e =nπ 0 με =,...,κ. Με βάση τις συχνότητες {n, n,...n k } του δείγματος, και για τον έλεγχο της Η 0 ο Pearson πρότεινε το Χ = ( n m m0 0 ( observed o exp ected e = expected e ως στατιστική συνάρτηση του τεστ (ΣΣΤ. Για μεγάλα δείγματα (n, το Χ έχει κατά προσέγγιση χι-τετράγωνο κατανομή ( χ (β.ε. Πιο αυστηρά, η τ.μ. Χ συγκλίνει κατά κατανομή προς την Το τεστ αυτό απορρέει από το ακόλουθο θεώρημα. k με κ- βαθμούς ελευθερίας χ k κατανομή. 45

14 ΘΕΩΡΗΜΑ Αν n,...n k είναι οι συχνότητες που παρατηρούνται και π,..., π κ οι πιθανότητες της πολυωνυμικής κατανομής, τότε η ασυμπτωτική κατανομή του στατιστικού Χ ( n = Απόδειξη m m ( o = e e είναι χ με κ- βαθμούς ελευθερίας. Έχουμε (n,...,n k- M(n,π,...,π κ-. Είναι γνωστό ότι η κάθε μια τ.μ. n I (συχνότητα έχει διωνυμική κατανομή Β (n, π, =,,...,k. Επίσης, για μεγάλα n, τα n (και τα n /n έχουν κατά προσέγγιση κανονική κατανομή. Είναι όμως τα n συσχετισμένα με Cov (n, n j =-nπ π j. Από την επέκταση του θεωρήματος του De Movre για την πολυωνυμική κατανομή ή από το κεντρικό οριακό θεώρημα για πολυδιάστατες τ.μ. έχουμε ότι, αν p=(n /n,..., n k- /n [τα ποσοστά του δείγματος] και π = (π,...,π κ- [τα ποσοστά πληθυσμού], τότε: n (p-π d Ν κ- (0,Σ, όπου Σ=((σ με σ = π (-π και σ j = -π π j, j. H οριακή κατανομή Ν k- (0,Σ έχει σ.π.π. ƒ(x = (π ( k / Σ / exp {- x Σ - x} και από το θεώρημα του Crag γνωρίζουμε ότι η τετραγωνική μορφή x Σ - x χ κ. Ας θεωρήσουμε τώρα τη στατιστική συνάρτηση g(p g(n /n,...n k- /n n (p-π Σ - (p-π n. H συνάρτηση αυτή είναι μια συνεχής συνάρτηση του τυχαίου διανύσματος n (p-π το οποίο συγκλίνει κατά κατανομή στο τυχαίο διάνυσμα x N(0,Σ. Άρα από το γνωστό θεώρημα, τα τυχαία διανύσματα d g(p g(x = x Σ - x n χ k ή n(p-π Σ - (p-π d χ κ (* Ο πίνακας Σ=Dag (π-ππ όπου π=(π,...,π κ- και Σ - =((σ j όπου σ = +, π ι π κ σ j =, j και πκ =-π -π -...-π κ-. π Ν 46

15 Αντικαθιστώντας τις τιμές αυτές στην τετραγωνική μορφή (* και μετά από αλγεβρικές πράξεις παίρνουμε ότι: n(p-π Σ - k ( n nπ ι (p-π= nπ = από το οποίο απορρέει το τελικό αποτέλεσμα. Παρατηρήσεις. Η παραπάνω απόδειξη στηρίζεται στο Κεντρικό Οριακό Θεώρημα ή στην σύγκλιση της πολυωνυμικής προς την πολυδιάστατη κανονική κατανομή (με διάσταση κ- και το θεώρημα του Grag. Αντί να δουλέψουμε με το ποσοστά p θα μπορούσαμε να ξεκινήσουμε την απόδειξη θεωρώντας ότι: προσεγγ (n,n,..., n k- ~. n Σ - =(( σ, j N k- (μ,σ, όπου μ = (nπ,..., nπ κ- και σ =nπ (-π, ι σ j =-nπ π j, j.. O Fsher σκιαγράφησε την απόδειξη ως εξής: Έστω ότι τα {n }, =,,...,k είναι ανεξάρτητες Posson τ.μ. με μέσες τιμές {m }. Για μεγάλα {m } οι τυποποιημένες τιμές {z = κατανομή Ν(0,, και το Σ z =Χ ( n m έχουν κατά προσέγγιση τυπική κανονική m έχει κατά προσέγγιση χ k κατανομή. Επειδή όμως Σn = Σm = n ή Σ(n -m =0 η κατανομή μετατρέπεται σε πολυωνυμική και χάνουμε έναν βαθμό ελευθερίας. 3. Ο Cramer δίνει τη μέση τιμή και διακύμανση, ακριβή και όχι ασυμπτωτική, του Χ : Ε(Χ = κ- Var(X = (k-+ n ( k 4. To X μπορεί να γραφεί και ως εξής: Χ k = n nπ = nπ ι π -k -k+x n με τον περιορισμό nπ nπ π =0. Είναι δηλαδή το Χ μια συνάρτηση των τ.μ. n,...,n k-. Αναπτύσσοντας το Χ σε σειρά Taylor γύρω από το 0 ή από το (nπ,..., nπ κ ή με την ροπογεννήτρια ή την χαρακτηριστική συνάρτηση του Χ, βρίσκουμε την Ε(Χ & Var(X. 47

16 5. Για την απόδειξη της ασυμπτωτικής κατανομής του Χ, ο Cramer βρίσκεται πρώτα την ασυμπτωτική κατανομή του τ.δ. ((n -nπ / n π,...,(n κ -nπ κ / nπ k η οποία είναι ιδιάζουσα (sngular πολυδιάστατη κανονική κατανομή στον χώρο των κ- διαστάσεων. Η απόδειξη του στηρίζεται στο όριο της χαρακτηριστικής συνάρτησης του παραπάνω τυχαίου διανύσματος με ανάπτυγμα σε σειρά Taylor κ.λπ. Η τετραγωνική μορφή στον εκθέτη της ιδιάζουσας κανονικής κατανομής έχει ασυμπτωτικά Grag. χ κ (θεώρημα του Χρήσιμες σχέσεις ( Σn = Σm = n ( X k n = n m Μεγαλύτερες αποκλίσεις των {n } από τα {m } δίνουν μεγαλύτερη τιμή στο Χ. Η τιμή p (p-value του τεστ είναι η πιθανότητα το Χ να πάρει τιμές μεγαλύτερες ή ίσες από την τιμή που παρατηρήθηκε, όταν ισχύει η Η 0, για όλες τις συχνότητες (cell counts, που το άθροισμά τους ισούται με το n οι οποίες παράγουν τιμές του Χ X observed. Για μεγάλα δείγματα (μεγάλο n, το p-value προσεγγίζεται από την πιθανότητα Ρ( χ κ X observed της χι-τετράγωνο κατανομής με κ- βαθμούς ελευθερίας. = Παράδειγμα (θεωρία του Mendel O Mendel διασταυρώνοντας pea plants of pure yellow stran με φυτά of pure green stran διατύπωσε την υπόθεση (πρόβλεψη ότι οι υβριδικοί σπόροι δεύτερης γενιάς θα είναι 75% κίτρινοι και 5% πράσινοι διότι το κίτρινο είναι το κυρίαρχο είδος (stran. Σε ένα πείραμα είχε παραγωγή n=803 σπόρων από τους οποίους n = 60 ήταν κίτρινοι και n =00 πράσινοι. Οι αναμενόμενες συχνότητες με π 0 =0,75 και π 0 =0,5 είναι m =nπ 0 = 607,5 και m =nπ 0 = 005,75. Το χι-τετράγωνο στατιστικό του Pearson X =0,05 με τιμή p=0,88, η οποία επιβεβαιώνει την υπόθεση του Mendel. Το Χ ακολουθεί χ κατανομή. Ο Mendel έκανε πολλά πειράματα σαν το παραπάνω. Ενδιαφέροντα είναι τα δεδομένα από 0 φυτά αρακά και η ανάλυση που δίνει ο Cramer στην σελίδα 43 του βιβλίου του. Σε όλα αυτά η υπόθεση του 3 κίτρινο προς πράσινο 48

17 επιβεβαιώνεται όχι μόνο για κάθε ένα από τα 0 φυτά αλλά και για το σύνολο των αποτελεσμάτων (κίτρινα και πράσινα. Επί πλέον επιβεβαιώνεται και το θεώρημα ελέγχοντας ότι οι 0 Χ τιμές προέρχονται από γεγονός ότι αν χ κατανομή. Το 936 ο R.A Fsher, χρησιμοποιώντας τα δεδομένα του Mendel και το ελευθερίας αντίστοιχα, τότε: X,... X N είναι ανεξάρτητες χι-τετράγωνο τ.μ. με ν,...ν Ν βαθμούς N X ~ ν = N χ με ν = ν, όπου Ν είναι ο αριθμός των πειραμάτων του Mendel. O Fsher για Ν=84 βρήκε: = X =4~ χ 84 Η ο. Η κατανομή αυτή έχει μέση τιμή 84 και τυπική απόκλιση ( 84 / =3.0 και η πιθανότητα δεξιά του 4 είναι Ρ= Η προσαρμογή είναι σχεδόν «τέλεια». Πράγμα λίγο απίθανο αν λάβει κάνεις υπόψη του τις φυσιολογικές διακυμάνσεις της τύχης. Έτσι ο Fsher ισχυρίστηκε ότι τα δεδομένα είχαν παραποιηθεί από τον κηπουρό του Mendel. Παρά τις δυσκολίες με τα δεδομένα του Mendel, περαιτέρω έρευνα οδήγησε στην γενική αποδοχή της θεωρίας του. 5.. Έλεγχος πολυωνυμικής κατανομής με άγνωστες παραμέτρους Όταν οι παράμετροι π, π,...,π κ, της πολυωνυμικής κατανομής είναι άγνωστες θα πρέπει να εκτιμηθούν από τα δεδομένα και να χρησιμοποιηθούν ο τύπος του Χ με την διαφορά ότι e = nπ, όπου π είναι οι εκτιμητές μεγίστης πιθανοφάνειας (Ε.Μ.Π. των αγνώστων παραμέτρων π, και η κατανομή χ k 5 όπου s είναι το πλήθος των εκτιμώμενων παραμέτρων. ΘΕΩΡΗΜΑ Αν οι παράμετροι {π } της πολυωνυμικής κατανομής εξαρτώνται από άλλες άγνωστες παραμέτρους, θ δηλ. π = π (θ, τότε η στατιστική συνάρτηση. Χ k ( n ( d nπ θ = X k s nπ ( θ = 49

18 Όπου θ είναι ο εκτιμητής μέγιστης πιθανοφάνειας των παραμέτρων θ (ή μερικών από αυτές και s είναι ο αριθμός των παραμέτρων που εκτιμούνται από τα δεδομένα. Απόδειξη: παραπέμπουμε στα βιβλία των Cramer, Rao και Agrest Το παραπάνω θεώρημα μας δίνει το στατιστικό και την κατανομή που πρέπει να χρησιμοποιηθούν για τον έλεγχο καλής προσαρμογής διακριτών δεδομένων συχνοτήτων σε πολυωνυμική κατανομή με άγνωστες παραμέτρους. Η κρίσιμη περιοχή είναι Χ χ. k s, a Το ίδιο στατιστικό χρησιμοποιείται και για τον έλεγχο οποιασδήποτε κατανομής διακριτής ή συνεχούς αρκεί να γίνει κατάλληλη ομαδοποίηση της κατανομής σε κλάσεις (κατηγορίες πεπερασμένου πλήθους. Κλασικές περιπτώσεις είναι η κατανομή Posson και η κανονική κατανομή. Ας σημειωθεί ότι για τον έλεγχο συνεχούς (κυρίως κατανομής υπάρχει και ο έλεγχος Kolmogorov-Smrnoff. Παράδειγμα. Προσαρμογή με εκτίμηση συχνοτήτων 56 μικρά ζώα (dary calves ταξινομούνται ανάλογα με το αν προσβλήθηκαν ή όχι με πνευμονία δύο μήνες μετά την γέννησή τους. Τα ζώα που προσβλήθηκαν με πνευμονία ταξινομούνται επίσης ανάλογα με το αν είχαν ή όχι δεύτερη προσβολή με πνευμονία δύο εβδομάδες μετά την θεραπεία τους. Από τα 56 ζώα, τα 93 είχαν μια πρώτη προσβολή και από αυτά τα 30 είχαν δεύτερη προσβολή. Τα δεδομένα μπορούν να παρουσιαστούν με τον εξής πίνακα: Αρχική Δεύτερη προσβολή (nfecton προσβολή Ναι (+ Όχι (- Σύνολο Ναί ( Όχι ( Σύνολο Στον πίνακα αυτόν υπάρχει ένα κελί με μηδενική συχνότητα διότι είναι αδύνατον να έχουμε ζώα με δεύτερη προσβολή πνευμονίας χωρίς να έχουν 50

19 πρώτη. Κελιά με τέτοια δομή, από το πρόβλημα, λέγονται δομικά μηδενικά (structural zeros. Έχουν οι δύο προσβολές την ίδια πιθανότητα να πραγματοποιηθούν; Ως πρώτη αντίδραση, θα συνέκρινε κανείς την πιθανότητα α προσβολής 93/56= 59.6% με την πιθανότητα β προσβολής 30/56=9.% ή 30/93=3.%. Ποια από τις δύο τελευταίες πιθανότητες πρέπει να χρησιμοποιηθεί; Η δεύτερη προσβολή είναι δεσμευμένη, δοθείσης της πρώτης. Έτσι πρέπει να χρησιμοποιηθεί η δεύτερη πιθανότητα και η Η ο είναι: Η ο : Ρ (αρχική προσβολή + = Ρ(δεύτερη προσβολή + αρχική προσβολή+ Αν {π j } είναι άγνωστες (αληθινές πιθανότητες των κελιών του παραπάνω πίνακα,,j=,, όπου το παριστάνει τις γραμμές και το j τις στήλες, έχουμε, π +π +π =, π =0, Ρ(αρχική προσβολή +=π +π = π. Ρ(δεύτερη προσβολή+ αρχική προσβολή+= π /(π +π Και η μηδενική υπόθεση γίνεται, Η 0 : π +π =π /(π +π Έστω π η τιμή του δεξιού ή αριστερού μέλους της Η 0 δηλαδή π=ρ(αρχική προσβολή+=π +π. Τότε η Η 0 γίνεται: Η 0 :π =π, π =π-π, π =-π. Τα δεδομένα ακολουθούν τριωνυμική κατανομή (n=56, π, π, π και όταν ισχύει η Η 0 τα π j έχουν τις τιμές που δίδονται στην Η 0. Έτσι θέλουμε να επιβεβαιώσουμε αν τα δεδομένα προέρχονται από την τριωνυμική δοθείσης της Η 0. Εδώ πρέπει να εκτιμήσουμε τις αναμενόμενες συχνότητες. Για τον σκοπό αυτό πρέπει πρώτα να βρούμε τον εκτιμητή μεγίστης πιθανοφάνειας του π. Η τριωνυμική πιθανοφάνεια είναι: L(π =! n! n! n ( π n ( n n n! π π ( π, όπου n j είναι οι συχνότητες που παρατηρούμε. Λογαριθμίζοντας και αγνοώντας τα παραγοντικά έχουμε LogL(π= n log(π +n log(π-π +n log(-π Η log L( π π =0 μας δίνει 5

20 n n + n - π π π με λύση π = (n (n n - =0 π + n + n + n Για τα δεδομένα του προβλήματος έχουμε π =0,494, π m = n =38,, m = n( π π =39,0 ( π m = n =78,9 και Χ = 9,7 με (κ--s=(3--= β.ε. διότι κ=3 και μια παράμετρος (s= εκτιμήθηκε από τα δεδομένα. Το p-value<0,00. άρα υπάρχει ισχυρή ένδειξη εναντίον της μηδενικής υπόθεσης. Τα δεδομένα δείχνουν ότι πολύ περισσότερα ζώα δέχθηκαν την αρχική προσβολή (nfecton παρά τη δεύτερη. Οι ερευνητές κατέληξαν στο συμπέρασμα ότι «η αρχική προσβολή έχει ένα ανοσοποιητικό αποτέλεσμα που μειώνει την πιθανότητα δεύτερης προσβολής».. Παρατηρήσεις. Ο Pearson πρότεινε το στατιστικό που δίδεται στο Θεώρημα για την παρούσα περίπτωση χωρίς όμως τη διόρθωση για τους βαθμούς ελευθερίας την οποία πρότεινε και απέδειξε ο Fsher.. Ο έλεγχος p=p o στην απλή στατιστική συμπερασματολογία για διωνυμικά δεδομένα είναι και αυτός έλεγχος καλής προσαρμογής και μπορεί να γίνει με το χι-τετράγωνο στατιστικό Χ ( x npo = np o ( n x n( po + n( p o ~ χ Το τεστ αυτό είναι ισοδύναμο με το z-τεστ της Η 0 ( x / n p0 z = και ( p q / n o o z = χ. Η Όταν γίνεται προσαρμογή δεδομένων σε συνεχή κατανομή και ο αριθμός των βαθμών ελευθερίας του Χ είναι πολύ μικρός τότε επιβάλλεται να εφαρμόζεται η διόρθωση συνέχειας του Yates η οποία δίδεται από τη σχέση Χ n ( n e 0,5 = e =. 5

21 4. Κανόνας ορθής εφαρμογής του ελέγχου Χ Οι όροι του στατιστικού Χ έχουν στον παρανομαστή τους τις αναμενόμενες συχνότητες Ε =nπ 0 η nπ ( θ οι οποίες δεν πρέπει να είναι πολύ μικρές διότι έτσι αυξάνεται η τιμή του όρου εξαιτίας των μικρών τιμών των π 0 που ελέγχουμε και όχι λόγω απόκλισης των συχνοτήτων. Έτσι η προσέγγιση της κατανομής χ δεν είναι ικανοποιητική και δεν πρέπει να εφαρμοστεί ο έλεγχος Χ. Οι παρατηρήσεις αυτές οδήγησαν στον λεγόμενο κανόνα ορθής εφαρμογής ο οποίος μετά από σχετική αναθεώρηση στη βιβλιογραφία έχει ως εξής: a Καμία από τις αναμενόμενες συχνότητες Ε δεν πρέπει να είναι μικρότερες του b Το ποσοστό των αναμενόμενων συχνοτήτων Ε οι οποίες είναι μικρότερες του 5 δεν πρέπει να είναι μεγαλύτερο του 0% Έλεγχος καλής προσαρμογής με το λόγο πιθανοφανειών G Έλεγχος καλής προσαρμογής μπορεί να γίνει και με το τεστ πηλίκου πιθανοφανειών (LRT, γνωστού ως G. Έχουμε λ= max L( π Ηο = max L( π Ω k n [ n!/( n!] π ιο k [ n!/( n!] ( n / n n διότι η Η 0 περιέχει ένα μόνο σημείο, το π 0 και για το max L( π επιτυγχάνεται όταν το π γίνει ίσο με τον εκτιμητή ΜΠ: n/n = {n /n, n /n,..., n k /n}. Έτσι μετά από πράξεις k G -logλ = n ( n / mo = log ~ χ k, m 0 = nπ 0. Οι βαθμοί ελευθερίας προσδιορίζονται ως εξής: Ο χώρος Θ έχει διάσταση k- διότι υπάρχουν k παράμετροι, τα π, και ένας περιορισμός Σπ =. Ο χώρος Η 0 ή Θ 0 έχει μηδέν διάσταση. Οι βαθμοί ελευθερίας είναι η διαφορά των δύο διαστάσεων. Το G γράφεται και ως εξής: k G = n π log( π / π o = Ω =ni KΛ (π,π 0, όπου Ι ΚΛ (f,g παριστάνει την απόκλιση των Kullback-Lebler μεταξύ δύο κατανομών f και g ή το μέτρο πληροφορίας των Kullback-Lebler. I ΚΛ (π,π 0 είναι η απόκλιση των Kullback-Lebler μεταξύ της κατανομής του δείγματος 53

22 ( π =n /n και της κατανομής π 0 της Η 0. Όσο πιο μεγάλη είναι η απόκλιση Ι ΚΛ τόσο πιο μεγάλο είναι το G και τόσο πιο πολύ απέχουν τα δεδομένα από την Η 0. Τα Χ και G είναι ισοδύναμα με την έννοια: Χ -G P 0 ή n lm Ρ(Χ G =0 n Με δεδομένο και σταθερό τον αριθμό k των κελιών το Χ συνήθως συγκλίνει πιο γρήγορα από το G. Η χι-τετράγωνο προσέγγιση του G είναι καλή αν n>5 k. 54

23 5.. ΓΙΝΟΜΕΝΟ ΠΟΛΥΩΝΥΜΙΚΩΝ ΚΑΤΑΝΟΜΩΝ ΟΜΟΓΕΝΕΙΑ ΠΟΣΟΣΤΩΝ - Έλεγχος Ομογένειας Ποσοστών - Συγκρίσεις χωρίς ζεύγη περισσότερων από ποσοστών Παράδειγμα (Έλεγχος ομογένειας δύο πολυωνυμικών κατανομών Έστω ότι έχουμε δύο ανεξάρτητα τυχαία δείγματα από δύο πολυωνυμικές κατανομές, δηλαδή (n,...,n c ~M(n,π,...,π c, π j = c j= (n,...,n c ~M(n,π,...,π c, π j = και θέλουμε να ελέγξουμε την υπόθεση αν τα δείγματα αυτά προέρχονται από τον ίδιο πληθυσμό, δηλαδή c j= Η 0 : π j = π j =π j για κάθε j=,,...,c Θα προσπαθήσουμε να βρούμε ένα στατιστικό για τον παραπάνω έλεγχο. Γνωρίζουμε από τα προηγούμενα ότι c j= ( n Άρα λόγω ανεξαρτησίας n j π j n π j χ c c ( n και j n π j j= n π j χ c c Χ = = j= ( n n π j n π j j ~ χ ( c (5.. Αν τώρα η Η 0 καθορίζει τα π j δηλαδή αν τα π j είναι γνωστά, τότε η ( με π j =π j μπορεί να χρησιμοποιηθεί ως Σ.Τ. για τον έλεγχο της υπόθεσης μας με κρίσιμη περιοχή την Χ χ ( c, a (5.. Αν όμως η Η 0 δεν καθορίζει τα π j, τα π j στην ( θα πρέπει να εκτιμηθούν όταν ισχύει η Η 0. τότε όμως, αφού έχουμε δύο ανεξάρτητα δείγματα, είναι σαν αν έχουμε συνολικά ένα τυχαίο δείγμα μεγέθους n +n από μια πολυωνυμική κατανομή με πιθανότητες π, π,..., π c. Οι ΕΜΠ στην περίπτωση αυτή είναι: Έτσι εδώ το Σ.Τ. είναι c Χ = π j = ( n j n n n n + n = n j + n j = j= j n j n π j ( nj π = n = n n j. n n j / n / n (

24 Με κατανομή της Χ την χ c, διότι οι βαθμοί ελευθερίας στην ( που ήταν (c- θα πρέπει να μειωθούν κατά c- λόγω των εκτιμήσεων. Η κρίσιμη περιοχή την περίπτωση αυτή είναι Χ χ ( c, a, όπου το Χ δίνεται από τη σχέση (5..3 Για να κάνουμε έλεγχο πρακτικών προβλημάτων σε αυτή την περίπτωση χρήσιμος είναι ο παρακάτω c πίνακας: n n... n c n n n... n c n n n... n c n Παράδειγμα (κατανομή φύλου από οστά κρανίου Οστά κρανίου ανευρίσκονται σε μια περιοχή κατά τη διάρκεια αρχαιολογικών ανασκαφών. Οι ανασκαφές γίνονται σε 3 διαφορετικές περιόδους. Από τα οστά του κρανίου προσδιορίζεται το φύλο του ατόμου. Στις δύο πρώτες περιόδους ο προσδιορισμός του φύλου γίνεται από τον ερευνητή Α και στην τρίτη περίοδο από τον ερευνητή Β. Η κατανομή των οστών του κρανίου κατά φύλο και περίοδο έχει ως εξής: Οστά κρανίου ανά φύλο και περίοδο Περίοδο Σύνολο Άνδρας Γυναίκα Σύνολο Τι πληροφορίες δίνουν τα δεδομένα αυτά για την αναλογία των φύλων του πληθυσμού της περιοχής; Συγκεκριμένα Είναι η αναλογία των φύλων : για κάθε περίοδο; p άνδρας = p γυναίκα ή p άνδρας = ½ για κάθε περίοδο. Είναι οι αναλογίες και για τις τρεις περιόδους ίσες με : δηλαδή p πρώτη = p δεύτερη = p πρώτη = p δεύτερη = p τρίτη = / Είναι οι αναλογίες ίσες και για τις τρεις περιόδους, δηλαδή v p πρώτη = p δεύτερη = p τρίτη Υπάρχει διαφορά μεταξύ των ερευνητών; 56

25 Απάντηση Εδώ πρέπει να γίνει έλεγχος της υπόθεσης p=/ για κάθε περίοδο με το z-τεστ ή το χ -τέστ με β.ε Έτσι έχουμε: Για την η περίοδο: X (6 36 = 36 ( πρώτη Για την η περίοδο: Ε=5,5, X Για την 3η περίοδο: δεύτερη = 9.94**, η τιμή p<0.5% =9.9**, η τιμή p<0.5% Ε=05, X τρίτη =0.4, η τιμή p>0.5% Οι δύο αστερίσκοι σημαίνουν ότι το τεστ είναι στατιστικά σημαντικό. Εδώ έχουμε Η ο : p πρώτη = p δεύτερη = p τρίτη =/ και πρέπει να γίνουν τα εξής: Ένα χ -τεστ της υπόθεσης : με β.ε στην στήλη «Σύνολο» ( 55 ( 435 X σύνολο = Πρόσθεση των τριών προηγούμενων Χ. X άθροισµα = X πρώτη + X δεύτερη + Διαφορά αθροίσματος και συνόλου X διαφορ ά = X άθροισµα - συνόλου τρίτη =3.87** [ χ ] X = =0.09** [ χ ] X = =6.** [ χ ] Αυτό είναι το τεστ της Η 0 : p πρώτη = p δεύτερη = p τρίτη = ½ με p<5%. Εδώ ο έλεγχος είναι ότι τα 3 ποσοστά είναι ίσα, δηλαδή p πρώτη = p δεύτερη = p τρίτη. Έχουμε σύγκριση 3 ποσοστών από 3 ανεξάρτητους πληθυσμούς. Το τεστ που εφαρμόζεται είναι το ίδιο με εκείνο που προκύπτει αν θεωρήσουμε τον παραπάνω πίνακα ως πίνακα συνάφειας και υπολογίσουμε το χ -τέστ ανεξαρτησίας με (- (3-= β.ε. Πράγματι. X ανεξαρτησίας =6.3* Έτσι οι αναλογίες φύλου διαφέρουν από περίοδο σε περίοδο. Ο ένας αστερίσκος σημαίνει ότι το τεστ είναι στατιστικά σημαντικό. Για περαιτέρω διερεύνηση των αιτίων της απόρριψης της Η 0 εξετάζουμε τους πίνακες των διαφορών ή υπολοίπων (resduals O-E & (O-E /E: Ο-Ε (Ο-Ε /Ε Πρώτη Δεύτερη Τρίτη Πρώτη Δεύτερη Τρίτη Άνδρας Γυναίκα

26 Είναι φανερό από το πρόσημο και το μέγεθος της τρίτης στήλης, ότι η απόκλιση από την ομογένεια ή την ισότητα των ποσοστών οφείλεται στην τρίτη περίοδο. Το θέμα αυτό διερευνάται στην συνέχεια. v Μήπως όμως το παραπάνω συμπέρασμα ( οφείλεται στις διαφορές μεταξύ των ερευνητών Α & Β; Ο προσδιορισμός του φύλου γίνεται με υποκειμενική ανατομική εκτίμηση από τον ερευνητή. Τα αποτελέσματα ανά ερευνητή έχουν ως εξής: Ο j E ιξ Α Β Σύνολο Α Β Άνδρας Άνδρας Γυναίκα Γυναίκα Σύνολο χ τεστ για την ισότητα p A = p B ( ( X = ( ( =6.3 Έτσι σε Χ = 6.3 με β.ε {από το (} που μετρά τη διαφορά αναλογιών του φύλου, ένας ( β.ε αντιστοιχεί σε Χ =6.3 (που οφείλεται στους ερευνητές Α & Β {από το (v}. Άρα η διαφορά μεταξύ αναλογιών οφείλεται μόνο σε διαφορές μεταξύ ερευνητών. Υπάρχουν διαφορές στην τεχνική προσδιορισμού του φύλου μεταξύ των δύο ερευνητών. Τα δεδομένα δείχνουν μια υπεροχή των ανδρών αλλά η απόκλιση από το : οφείλεται στη διαφορά μεταξύ των ερευνητών (πιθανώς σε λανθασμένη τεχνική προσδιορισμού του φύλου. 58

27 5.3. ΕΛΕΓΧΟΙ ΑΝΕΞΑΡΤΗΣΙΑΣ ΣΕ ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ: Πολλές φορές υπάρχει ανάγκη ελέγχου της ανεξαρτησίας δύο χαρακτηριστικών Α και Β ενός πληθυσμού, καθένα από τα οποία διακρίνεται σε διάφορες κατηγορίες Α, Α,...Α r και Β, Β,...Β c αντίστοιχα. Π.χ. χαρακτηριστικά μπορεί να είναι χρώμα των μαλλιών και το χρώμα των ματιών με κατηγορίες τους διάφορους χρωματισμούς (μαύρο, καστανό, ξανθό, κ.λπ.. Για να κάνουμε τον παραπάνω έλεγχο παίρνουμε από τον πληθυσμό δείγμα n μονάδων και έστω n j από αυτές φέρουν το χαρακτηριστικό Α και r c n j = j j= συγχρόνως το Β j, όπου n= Πίνακας συνάφειας: (ή συχνοτήτων είναι ο πίνακας: B B B j B c A j n... n j... n c A A j n... nj... ne nr... nrj... nrc A r. =((n j r c Στον παραπάνω πίνακα αντιστοιχεί ο πίνακας πιθανοτήτων ((π j r c όπου π j, =,...r, j=,...,c είναι οι αντίστοιχες πιθανότητες των κελιών (, j του πίνακα, δηλ. π j =P(A=A, B=B j. Θα χρησιμοποιούμε και τον γνωστό συμβολισμό π = j π j, π. j = j π j, n.. = j n j, π.. = j π j = κλπ. Η υπόθεση ανεξάρτητα των Α και Β διατυπώνεται ως εξής: Η 0 : π j = π. π. j για κάθε και j με εναλλακτική Η α : π j π. π. j για τουλάχιστον ένα ζεύγος, j. Η από κοινού κατανομή των τ.μ. n j είναι πολυωνυμική με παραμέτρους n και π j, =,,...,r και j=,,...,c με π j = και n = r c = j= r c n j = j=. Έτσι από το Θεώρημα προκύπτει ότι η στατιστική συνάρτηση για τον έλεγχο της υπόθεσης Η 0 : π j = π ιj0 θα είναι: r c Χ = = j= ( n j e e j j, (

28 όπου e j = nπ jο με ασυμπτωτική κατανομή χ με rc-i βαθμούς ελευθερίας λόγω της r c σχέσεως π j = όταν ισχύει η Η 0. = j= Έτσι αν τα π j = (π. (π. j είναι γνωστά τότε όταν ισχύει η Η 0 η (5.3. μπορεί να χρησιμοποιηθεί ως Σ.Τ για τον έλεγχο της ανεξαρτησίας με κρίσιμη περιοχή. Χ Χ rc-,α. (5.3. Όταν τα π j άγνωστα τότε βρίσκουμε τους Ε.Μ.Π. που είναι (όταν ισχύει η Η ο n. π n. j = και π j =. n n Έτσι το Σ.Τ θα είναι Χ = r r = j= ( n j e e j j, (5.3.3 όπου τώρα e j = n π j = (n. n. j /n με κρίσιμη περιοχή Χ X (r-(c-,α (5.3.4 Εδώ το Χ έχει κατανομή την χ με (r-(c- βαθμούς ελευθερίας, διότι έχουμε rc- βαθμούς, μείον τις εκτιμώμενες παραμέτρους που είναι (r-+(c- έτσι rc-- [(r-+(c-]= (r-(c-. Ένα βασικό ερώτημα που προκύπτει στους πίνακες συνάφειας είναι το τι κάνουμε μετά τον έλεγχο της ανεξαρτησίας ο οποίος συνήθως απορρίπτει την Η 0 (την ανεξαρτησία των Α και Β. Υπάρχουν διάφοροι τρόποι να προχωρήσουμε: Ένας είναι να εκτιμήσουμε τις πιθανότητες π j και με τις αριθμητικές τιμές τους να διακρίνουμε τάσεις, συμπεριφορές κ.λπ. Άλλος είναι να εξετάσουμε τα υπόλοιπα (resduals των συχνοτήτων. n j -e j ή Ο j - E j και να μπορέσουμε να διακρίνουμε διαφορές, τάσεις κ.λπ. Ας σημειωθεί ότι ( nj e j = 0 και ( nj e j = 0. j Μπορούμε επίσης να εξετάσουμε και τις ποσότητες (Ο j -E j /E j. Τέλος μπορούμε να διερευνήσουμε την καταλληλότητα διαφόρων άλλων μοντέλων όπως π.χ. μοντέλων συνάφειας, θέμα το οποίο θα εξεταστεί στα «Κατηγορικά Δεδομένα». 60

29 Ας υπενθυμίσουμε τον κανόνα ορθής εφαρμογής του χ : οι αναμενόμενες συχνότητες Ε j δεν πρέπει να είναι μικρότερες του και όχι περισσότερες από 0% από αυτές να είναι μικρότερες του 5, επιπλέον το n πρέπει να είναι μεγαλύτερο του 4 rc. Παράδειγμα: Μογγολισμός Λοιμώδης ηπατίτιδα Μια ομάδα ιατρών ερευνητών μιας Πανεπιστημιακής Κλινικής, ισχυρίζεται ότι ο μογγολισμός στα παιδιά έχει σχέση με τη λοιμώδη ηπατίτιδα της μητέρας κατά την διάρκεια της εγκυμοσύνης της. Για τον έλεγχο του ισχυρισμού αυτού 000 περιπτώσεις εκλέγονται τυχαία από το αρχείο μιας μεγάλης μαιευτικής κλινικής και εξετάζονται ως προς την ηπατίτιδα της μητέρας. Μετά, και για κάθε περίπτωση, εντοπίζεται το παιδί και εξετάζεται για να διαπιστωθεί αν είναι μογγολοειδές ή όχι. Τα αποτελέσματα δίνονται στον ακόλουθο πίνακα. Παιδί (πραγματικότητα Μογγολοειδές Μη μογγολοειδές Μητέρα (τεστ Σύνολο + - Με λοιμώδη ηπατίτιδα Χωρίς λοιμώδη ηπατίτιδα Σύνολο Για τα δεδομένα αυτά έχουμε: Ε = = 5. 5, Ε = = Ε = = , Ε = = Έτσι η τιμή της στατιστικής συνάρτησης του τεστ είναι: Χ ( ( ( ( = = = Επειδή χ 0.05,= 3.84 θα έχουμε Χ =776.70>3.84=χ 0.05,. Άρα απορρίπτεται η υπόθεση της ανεξαρτησίας του μογγολισμού με τη λοιμώδη ηπατίτιδα και επομένως το αποτέλεσμα είναι πολύ σημαντικό. Δηλαδή ο μογγολισμός των παιδιών έχει σχέση με την προσβολή ή όχι της μητέρας από λοιμώδη ηπατίτιδα κατά τη διάρκεια της εγκυμοσύνης. Η πιθανότητα το παιδί να είναι μογγολοειδές δοθέντος ότι η μητέρα είχε λοιμώδη ηπατίτιδα είναι 65/4=46% και πολύ μεγαλύτερη από της πιθανότητα μογγολισμού δοθέντος ότι η μητέρα δεν έχει ηπατίτιδα που είναι 8/859=0.4%. Για περισσότερη διερεύνηση του θέματος αυτού εξετάζουμε τις διαφορές Ο-Ε ή (Ο-Ε /Ε. 6

30 Εδώ οι διαφορές Ο-Ε είναι: Μογγολισμός + - Ηπατίτιδα Και φανερώνουν μια θετική συσχέτιση μογγολισμού με την ηπατίτιδα. 6

31 5.4 ΤΟ ΤΕΣΤ McNEMAR ΩΣ χ ΤΕΣΤ. Το τεστ του McNemar εφαρμόζεται και στις ακόλουθες περιπτώσεις: α. Σε αναδρομικές μελέτες με ασθενείς και μάρτυρες (control, όπου κάθε ασθενής «ταιριάζεται» με ένα μάρτυρα (matched pars και το «ταίριασμα» γίνεται με αυστηρές και απαιτητικές προδιαγραφές. Έστω Ν τα ζεύγη ένας ασθενής ένας μάρτυρας. Κάθε ζεύγος βαθμολογείται ως εξής: Ζεύγος Ασθενής Μάρτυρας Α Α Α Όχι Α 3 Όχι Α Α 4 Όχι Α Όχι Α Όπου Α σημαίνει ότι το άτομο έχει χαρακτηριστικό π.χ. Α=καπνίζει και όχι Α=δεν καπνίζει και ασθενής σημαίνει ότι το άτομο έχει καρκίνο του πνεύμονα. Τα αποτελέσματα μπορούν να συνοψισθούν ως ακολούθως: ή σε μορφή πίνακα Αποτελέσματα Ασθενής Μάρτυρας Αριθ. ζευγών Α Α x Α Όχι Α y Όχι Α Α z Όχι Α Όχι Α w Σύνολο N Ασθενής Α Όχι Α Α x z Μάρτυρας όχι Α y w Ν ζεύγη Με άλλο λόγια Ν ζεύγη ταξινομούνται ανάλογα με το αν τα μέλη του ζεύγους έχουν καρκίνο πνεύμονα και αν καπνίζουν ή όχι. Θέλουμε να ελέγξουμε π.χ. αν τα ποσοστά των καπνιστών είναι τα ίδια στους καρκινοπαθείς με τα control (με άλλα λόγια και όχι αυστηρά, αν υπάρχει σχέση μεταξύ καπνίσματος και καρκίνου πνευμόνων. Λόγω του «ταιριάσματος» (parng πρέπει να εφαρμοστεί το τεστ του McNemar. Αν χρησιμοποιήσουμε το συμβολισμό των πινάκων συνάφειας, ο παραπάνω πίνακας γίνεται Ασθενής Μάρτυρας Α Όχι Α Σύνολο Α Ο Ο Ο. Όχι Α Ο Ο Ο. Σύνολο Ο. Ο. Ν 63

32 και το τεστ McNemar ισοδύναμα, με το z τεστ είναι z= O ( O + O /, O + O / Χ = ( O O ~ χ + O O Tα τεστ αυτά απορρέουν από το γεγονός ότι Ο O + O ~ BO ( + O,/ H 0 Αν η πιθανότητα καπνίσματος στους ασθενείς είναι ίση με την πιθανότητα καπνίσματος στους μάρτυρες έχουμε: π = π Κανονικά θα έπρεπε να συγκρίνουμε το ποσοστό των καρκινοπαθών στους καπνιστές με το ποσοστό των καρκινοπαθών στους μη καπνιστές. b. Σε μελέτες συσχέτισης ή μελέτες με διαγνωστικά κριτήρια Σε Ν άτομα καταγράφονται διάφορες ποιοτικές και ποσοτικές μετρήσεις. Για να δούμε αν τα ποσοστά επιτυχίας ή θετικής παρουσίας για δύο ποιοτικά χαρακτηριστικά είναι ίσα, θα εφαρμόσουμε το τεστ του McNemar. Σε Ν ασθενείς εφαρμόζονται δύο διαγνωστικές διαδικασίες για να προσδιοριστεί η παρουσία η απουσία κάποιου στοιχείου μιας ασθένεια. Ο έλεγχος της ισότητας των ποσοστών των θετικών αποτελεσμάτων για τις διαδικασίες γίνεται με τεστ McNemar. Γενική θεωρία Το τεστ McNemar προκύπτει από την τριωνυμική κατανομή (n, n - M(n,π, π όπου η τρίτη κατηγορία είναι δύο «σύμφωνες» ομάδες ++ & -- με σύνολο συχνοτήτων n +n και πιθανότητα π +π και το Χ του Pearson με εκτίμηση των παραμέτρων κάτω από το μοντέλο της μηδενικής Η 0 : π = π. Γενικά αν (Χ,..., Χ κ- Μ (n, π,..., π k- και θέλουμε να ελέγξουμε την +Η 0 : π =π έναντι π π το X τεστ του Pearson είναι: Χ = ( X X X + X χ /Η 0 Οι βαθμοί ελευθερίας προσδιορίζονται ως εξής: Οι βαθμοί ελευθερίας του Χ είναι k--s όπου s είναι ο αριθμός των παραμέτρων που εκτιμούνται. Το s λοιπόν ισούται με k-3 (από τις παραμέτρους π 3,...π κ- συν (από την κοινή τιμή των π και π όταν ισχύει η Η 0. Έτσι s=k- και k--s=. 64

33 6. ΓΕΝΙΚΕΥΣΕΙΣ: STUART MAXWELL, COCHRAN και MANTEL-HAENSZEL 6. Σύγκριση κατά ζεύγη με περισσότερα από δύο δυνατά αποτελέσματα Τεστ των Stuart Maxwell. Εδώ εξετάζεται η περίπτωση του τεστ του McNemar με δύο ποιοτικές μεταβλητές, η κάθε μια όμως έχει περισσότερα από δύο δυνατά αποτελέσματα ή επίπεδα (μη διχοτομικές μεταβλητές. Για παράδειγμα, Ν άτομα (τα ίδια άτομα εξετάζονται σε δύο διαφορετικές χρονικές στιγμές. Σε κάθε χρονική στιγμή εξετάζονται ως προς τα αποτελέσματα μιας ποιοτικής μεταβλητής με 3 ή περισσότερα επίπεδα. Σε άλλη ισοδύναμη περίπτωση αντί Ν ατόμων, μπορεί να υπάρχουν Ν ταιριασμένα ζεύγη (matched pars. Πίνακας Μετρήσεων άτομο πριν μετά ζεύγος ασθενής μάρτυρας ή Ν 3 3 Ν ή συνοπτικά Πριν (ή ασθενείς μετά (ή μάρτυρες 3 O O O 3 O O O 3 3 O 3 O 3 O 33 όπου,,3 είναι τα επίπεδα της ποιοτικής μεταβλητής. 65

34 Θέλουμε να ελέγξουμε την υπόθεση ότι τα πριν-μετά ή ασθενείς μάρτυρες ποσοστά για κάθε επίπεδο της μεταβλητής είναι ίσα. Με άλλα λόγια Η 0 : p =p, p = p, p 3 = p 3 (αρκούν μόνο τα p =p και p =p Οι μάρτυρες συμφωνούν με τους ασθενείς στα διαγνωστικά στοιχεία Ο, Ο και Ο 33. Οι διαφορές μεταξύ τους αντιπροσωπεύονται από τα μη διαγώνια στοιχεία O j και ειδικότερα από τις 3 διαφορές Ο -Ο, Ο -Ο, Ο 3 -Ο 3. Διάφορα τεστ έχουν προταθεί για την Η 0 στηριζόμενα στις διαφορές Ο -O [Bhapkar (966, Grzzle et al (969, Ireland et al (969, Βλ. Fless ή Woolson]. Ένα απλούστερο τεστ που δεν απαιτεί αντιστροφή πίνακα έχει προταθεί από τους Stuart (955 και Maxwell (970 για 3 3 πίνακες (βλ. Fless και Evertt (97: όπου X = O 3 ( O O j= ½ (Ο j +O j. O + O ( O O 3 3 ( O + O + O O 3 + O + O 3 O 3 ( O 3 O 3 ~ χ H 0, Aν η Η ο απορριφθεί, διερευνούμε κάθε ποσότητα χωριστά σχηματίζοντας πίνακες, που προκύπτουν συμπτύσσοντας τον 3 3 πίνακα, και εφαρμόζουμε το απλό τεστ McNemar με χ και k- (όχι β.ε. για να ελέγξουμε δηλαδή να μην επιτρέψουμε την αύξηση του α λόγω πολλαπλών τεστ. Παράδειγμα: 00 άτομα ερωτώνται αν στηρίζουν ή δεν στηρίζουν ή αδιαφορούν για την εξωτερική πολιτική της κυβέρνησης, δύο μήνες και μήνες μετά την ορκωμοσία της με τα ακόλουθα αποτελέσματα: Δύο μήνες στηρίζω δεν στηρίζω αδιαφορώ Στηρίζω Δώδεκα μήνες δεν στηρίζω αδιαφορώ Αλλάζουν τα ποσοστά από τους στους μήνες; 66

35 χ = 5( ( (0 5 ( =8.78 * χ,0.05 = 5.99 p-value<0.00 Έτσι υπάρχει αλλαγή των ποσοστών από τους στους μήνες. Υπάρχει αλλαγή του ποσοστού που στηρίζουν την εξωτερική πολιτική; Η 0 : p =p Πίνακας σύμπτυξης στηρίζω τα άλλα στηρίζω τα άλλα Χ = ( = 8* με χ,0.05 =

36 6. Σύγκριση περισσοτέρων από δύο συσχετισμένων ποσοστών Τεστ του Cochran. Έστω n άτομα τα οποία υποβάλλονται π.χ. σε 3 θεραπευτικές αγωγές Α, Β, C. Είναι τα ποσοστά επιτυχίας p A, p B, p c ίσα; Δεδομένα άτομο Α Β C : : : : n Τα δεδομένα μπορούν να συνοψιστούν και σε ένα πίνακα ανάλογο του πίνακα του τεστ McNemar. Εδώ όμως διατηρούμε τα αρχικά δεδομένα και θεωρούμε ότι έχουμε μια μεταβλητή y η οποία παίρνει τιμές 0 ή (- ή + ανάλογα με το αποτέλεσμα της θεραπείας Α, Β, C που εφαρμόζεται στην τύχη στο άτομο (Σχέδιο πλήρους τυχαιοποιημένου μπλοκ. Συμβολισμός: block (άτομο θεραπεία (ομάς... K y y... y k y y y... y k y : : : : : : : : : : n y n y n... y nk y n y y... y n y.. Tεστ του Cochran: Q = ( k ( k ky.. y y.. ~ y X k H o 68

37 Παράδειγμα: άτομα τα οποία παρακολουθούνται σε μια ψυχιατρική κλινική εξετάζονται ως προς την «διαταραχή της σκέψης» από 4 ιατρούς της κλινικής. Η σειρά της εξέτασης του κάθε ασθενούς ήταν τυχαία και κάθε ιατρός εξέτασε κάθε ασθενή (σχέδιο τυχαιοποιημένου μπλοκ. Υπάρχει διαφορά ως προς τα ποσοστά διάγνωσης διαταραχής της σκέψης μεταξύ των 4 ιατρών. Δεδομένα: ιατρός ιατρός άτομο Σύνολο f Cochran s Q: Q = 3(4( =3.69< 4 4 ( χ 3,0.05 =7.8 Δεν υπάρχει ένδειξη απόρριψης της Η 0 : p =p =p 3 =p 4 69

38 6.3 MANTEL HAENSZEL TEST: S ΑΝΕΞΑΡΤΗΤΟΙ ΠΙΝΑΚΕΣ Έστω ότι έχουμε περισσότερους από πίνακες συνάφειας (n άτομα ταξινομούνται με βάση δύο χαρακτηριστικά π.χ. παράγοντα (factor +,- και ασθένεια +,-, κάπνισμα +,- και καρκίνο +,-, condton +,- και response +,-, π.χ. ( δύο ή περισσότερες μελέτες του ίδιου αιτιολογικού προβλήματος που έχουν γίνει σε διαφορετικές χρονικές περιόδου ή κέντρα ( τα δύο χαρακτηριστικά ταξινομούνται και με βάση άλλο παράγοντα (nusance π.χ. ομάδες ηλικιών, κ.λπ. Υπάρχει σχέση μεταξύ των δύο χαρακτηριστικών για όλα τα επίπεδα του τρίτου χαρακτηριστικού (παράγοντα; Έστω n jk ο αριθμός των ατόμων με τον παράγοντα στο επίπεδο (+ ή - που έχει την ασθένεια στο επίπεδο j (+ ή - στο στρώμα κ, κ=,,..., s,,j=,. n n n j n js n n κ= κ= κ=s To στατιστικό των Mantel-Haenszel προκύπτει παίρνοντας ένα από τα 4 κελιά, π.χ. το n k και υπολογίζοντας τη μέση τιμή και την διακύμανση του n k χρησιμοποιώντας την υπεργεωμετρική κατανομή (υποθέτοντας ότι τα margnal totals είναι σταθερά. Έχουμε n marg.total ~ Hg (n.., n., n /n.. n Και Ε(n = n, Var(n = n.. (X~Hg(N,n,p, EX=np, VarX= npq To στατιστικό είναι: n n n n.. n.. N n N nk E( nk Var( n k n... n n.. n / ~ (Ν(0, n n. n. = ( n.. n.. όταν ισχύει η Η 0 τη μη σχέσης μεταξύ παράγοντα και ασθένειας για όλα τα στρώματα ή 70

39 n k n n k.. k n ( n n k.. k k n n.. n k k k ~ χ. Αντί για το τεστ Mantel Haenszel θα μπορούσε να χρησιμοποιηθεί το χ τεστ ανεξαρτησίας για κάθε πίνακα αθροίζοντας το για τους s πίνακες με χ και s β.ε Το Mantel Haenszel test απαιτεί το n... να είναι μεγάλο ενώ το δεύτερο τεστ χ απαιτεί το n..k σε κάθε στρώμα να είναι μεγάλο. Το τεστ Mantel-Haenszel χρησιμοποιείται ευρύτερα. Είναι ένα τεστ ολικής συσχέτισης / συνάφειας δύο ποιοτικών χαρακτηριστικών. Μπορεί κάποια συχνότητα n jk να είναι 0. Δεν πρέπει όμως τα πηλίκα πιθανοτήτων a να διαφέρουν πολύ μεταξύ τους. Η υπόθεση που ελέγχεται με το παραπάνω τεστ είναι γνωστή και ως υπόθεση δεσμευμένης ανεξαρτησίας (condtonal ndependence για τρισδιάστατους πίνακες συνάφειας. 7

40 6.4 CASE STUDY: ΚΑΡΚΙΝΟΣ ΤΟΥ ΠΡΟΣΤΑΤΗ Όταν γίνεται διάγνωση καρκίνου του προστάτη και πρόκειται να αποφασιστεί η στρατηγική θεραπείας είναι απαραίτητο να απαντηθεί το ερώτημα αν ο καρκίνος έχει απλωθεί στους γειτονικούς λεμφαδένες. Το ερώτημα είναι τόσο κρίσιμο ώστε να συνηθίζεται να γίνεται χειρουργική επέμβαση (laparatomy με μοναδικό σκοπό την εξέταση των αδένων, αφαίρεση δειγμάτων ιστού και ιστολογική εξέταση. Υπάρχουν όμως μεταβλητές που μπορούν να μετρηθούν χωρίς χειρουργική επέμβαση και έχουν «προβλεπτική» ικανότητα για την προσβολή των λεμφαδένων. Οι μεταβλητές αυτές είναι: η ένδειξη ακτινών Χ (Χ «χονδρικό» μέτρο μεγέθους και θέσης του όγκου [στάδιο] (που παίρνεται με ψηλάφηση μέσου του ορθού (Χ προεγχειρητική παθολογοανατομική ένδειξη της βιοψίας του όγκου (παίρνεται με βελόνη πριν από την εγχείρηση (Χ 3 [διαβάθμιση] ηλικία (Χ 4 επίπεδο phosphatase στον όρο του αίματος (Χ 5 Το επιστημονικό ενδιαφέρον είναι να διαπιστωθεί ποιες από τις πέντε (5 προεγχειρητικές μεταβλητές μπορούν να προβλέψουν προσβολή αδένων και με πόση ακρίβεια. Ειδικότερο ενδιαφέρον είναι να διαπιστωθεί αν αυξημένα επίπεδα phosphatase στον όρο του αίματος έχουν επιπρόσθετη προβλεπτική αξία δοθέντων των άλλων τεσσάρων μεταβλητών που χρησιμοποιούνται συνήθως. ΔΕΔΟΜΕΝΑ ΚΑΡΚΙΝΟΥ ΠΡΟΣΤΑΤΗ Χ = ένδειξη ακτινών Χ Διωνυμικές μεταβλητές Χ = στάδιο: «χονδρικό» μέτρο μεγέθους και θέσης όγκου = θετικό ή σοβαρό εύρημα Χ 3 = διαβάθμιση: προεγχειρητική παθολοανατομική ένδειξη 0= «κενό» = αρνητικό ή μη σοβαρό βιοψίας όγκου εύρημα Χ 4 = ηλικία Χ 5 - phosphatase X 6 = λεμφαδένες 7

41 Αριθμός ασθενών Ακτίνες Χ Στάδιο Διαβάθμιση Ηλικία Phosphatase Λεμφανικοί αδένες Αριθμός ασθενών Ακτίνε Χ Στάδιο Διαβάθμιση Ηλικία Phosphatase Λεμφανικοί αδένες Αριθμός ασθενών Ακτίνε Χ Στάδιο Διαβάθμιση Ηλικία Phosphatase Λεμφανικοί αδένες α. Διαγνωστική ικανότητα κάθε μεταβλητής χωριστά Αδένες Αδένες 0 0 X ray Στάδιο (stage Ευαισθησία = /0 Ειδικότητα = 9/33 Ολικό σφάλμα=3/53=4% Ολικό σφάλμα = 7/53=3% α = 8.86 α =

42 Grade Αδένες Αδένες Ηλικία < Ολικό σφάλμα = 8/53 = 34% Ολικό σφάλμα= 3/53= 58% α = 3.6 α = 0.05 Acd <60 60 Αδένες Ολικό σφάλμα = 8/53 = 34% α= 6 9/4 4 = 5.4 Για τον πίνακα Χ ray αδένες έχουμε: Sens= /0, spec = 9/33, P(-Χ ray +αδένες = 9/0 σφάλμα λανθασμένα αρνητικό (false negatve P(+Χ ray -αδένες = 4/33 σφάλμα λανθασμένα θετικό (false postve. Έτσι το ολικό σφάλμα λανθασμένης ταξινόμησης είναι: total msclassfcaton error rate (πιθανότητα ενός ή άλλου σφάλματος δοθέντος των σχετικών συχνοτήτων του 0 και αδένων= = P(-Χ ray και + αδένες+ρ (+ Χ ray και αδένες = P(-Χ ray +αδένεςρ(+αδένες+ρ(+ Χ ray -αδένεςρ-(αδένες = 9/0 0/53+4/33 33/53=(9+4/53=3/53. Για τον πίνακα acd x αδένες το ολικό msclassfcaton σφάλμα είναι 8/53. Για τον πίνακα stage x αδένες το ολικό msclassfcaton σφάλμα είναι 7/53. Για 74

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2 ΠΕΡΙΕΧΟΜΕΝΑ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 Πιθανότητες 1.1 Πιθανότητες και Στατιστική... 5 1.2 ειγματικός χώρος Ενδεχόμενα... 7 1.3 Ορισμοί και νόμοι των πιθανοτήτων... 10 1.4 εσμευμένη πιθανότητα Ολική

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson

Έλεγχος Ανεξαρτησίας x2 του Pearson x2 του Pearson Έλεγχος Ανεξαρτησίας x του Parso Έστω ότι λαμβάνουμε δείγμα μεγέθους. Η πιθανότητα π εμφάνισης ενός χαρακτηριστικού να βρεθεί στο κελί (i,j) κάτω από την υπόθεση Η 0 της ανεξαρτησίας δίνεται από την σχέση

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20, ΜΕΜ64: Εφαρμοσμένη Στατιστική 1 ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=0, X = 7.5, σ = 16, α = 5%. Πως αλλάζει το διάστημα αν

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 015 Ανάλυση Διακύμανσης Η Ανάλυση Διακύμανσης είναι μία τεχνική που

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Στατιστική. Εκτιμητική

Στατιστική. Εκτιμητική Στατιστική Εκτιμητική Χατζόπουλος Σταύρος 28/2/2018 και 01 /03/2018 Εισαγωγή Το αντικείμενο της Στατιστικής είναι η εξαγωγή συμπερασμάτων που αφορούν τον πληθυσμό ή το φαινόμενο που μελετάμε, με τη βοήθεια

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μη παραμετρικοί στατιστικοί έλεγχοι Καθηγητής ΔΠΘ Κων/νος Τσαγκαράκης Δευτέρα 6 Μαρτίου 13:00-16:00 Ώρα για εξ αποστάσεως συνεργασία Τρίτη 7 Μαρτίου 12:00-14:00

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας Εργαστήριο Υγιεινής Επιδημιολογίας και Ιατρικής Στατιστικής Ιατρική Σχολή, Πανεπιστήμιο Αθηνών Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας Δ. Παρασκευής Εργαστήριο Υγιεινής Επιδημιολογίας και

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

X = = 81 9 = 9

X = = 81 9 = 9 Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο: Ένας Πληθυσμός, μεγάλο δείγμα, άγνωστη κατανομή Έλεγχος για την μέση τιμή, με άγνωστη διασπορά Δίνονται ομαδοποιημένες οι ημερήσιες καταναλώσεις ηλεκτρικής ενέργειας (σε 100-άδες κιλοβατώρες) μιας χημικής

Διαβάστε περισσότερα

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Στατιστικοί Έλεγχοι Υποθέσεων Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Τι θέλουμε να συγκρίνουμε; Δύο δείγματα Μέση αρτηριακή πίεση σε δύο ομάδες Πιθανότητα θανάτου με δύο διαφορετικά

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΜΣ στη «Ναυτιλία» Τμήμα Β art time Χαράλαμπος Ευαγγελάρας hevangel@unipi.gr Η έννοια της Πιθανότητας Ο όρος πιθανότητα είναι συνδέεται άμεσα με τη μελέτη

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ M. Kούτρας Πειραιάς, 2014 1 Από κοινού συνάρτηση πιθανότητας μιας δισδιάστατης διακριτής τυχαίας μεταβλητής Με λόγια, η f ( x, y) δίνει την πιθανότητα να εμφανισθεί

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

1. ΕΙΣΑΓΩΓΗ 1.1 Ο ρόλος της Στατιστικής στην Ιατρική Η εξέλιξη της Ιατρικής από το δογµατισµό, ακόµη και το µυστικισµό, στην επιστηµονική αβεβαιότητα

1. ΕΙΣΑΓΩΓΗ 1.1 Ο ρόλος της Στατιστικής στην Ιατρική Η εξέλιξη της Ιατρικής από το δογµατισµό, ακόµη και το µυστικισµό, στην επιστηµονική αβεβαιότητα . ΕΙΣΑΓΩΓΗ. Ο ρόλος της Στατιστικής στην Ιατρική Η εξέλιξη της Ιατρικής από το δογµατισµό, ακόµη και το µυστικισµό, στην επιστηµονική αβεβαιότητα ξεκίνησε τον 7 ο αιώνα. Το κλειδί σ αυτή την εξέλιξη υπήρξε

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 2 ου κεφαλαίου Σταύρος Χατζόπουλος 20/02/2017, 06/03/2017, 13/03/2017 1 Κεφάλαιο 2. Έλεγχος Απλών Υποθέσεων Τα προβλήματα ελέγχου υποθέσεων απορρέουν από παρατηρήσεις

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Κριτήρια επιλογής μέτρων συνάφειας

Κριτήρια επιλογής μέτρων συνάφειας Κριτήρια επιλογής μέτρων συνάφειας Ο όρος συνάφεια προέρχεται από τον Pearso (1904) όπου ορίζεται για ένα πίνακα IJ ως ένα μέτρο της συνολικής απόκλισης της ταξινόμησης από την ανεξάρτητη πιθανότητα. Από

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 3 ου κεφαλαίου Έλεγχος Σύνθετων Υποθέσεων Σταύρος Χατζόπουλος 13/03/2017, 20/03/2017, 27/03/2017 1 Ιδιότητα Μονότονου Λόγου Πιθανοφανειών Συνήθως, καταστάσεις, όπως

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική Ενότητα 3: Έλεγχοι υποθέσεων - Διαστήματα εμπιστοσύνης Δρ.Ευσταθία Παπαγεωργίου, Αναπληρώτρια Καθηγήτρια Οι ερευνητικές υποθέσεις Στην έρευνα ελέγχουμε

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ M. Kούτρας Πειραιάς, 2015 Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ M. Kούτρας Πειραιάς, 2015 1 Από κοινού συνάρτηση πιθανότητας μιας δισδιάστατης διακριτής τυχαίας μεταβλητής

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 2: Έλεγχοι Υποθέσεων

Διαβάστε περισσότερα

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ Έστω ότι επιθυμούμε να μελετήσουμε ένα τυχαίο πείραμα με δειγματικό χώρο Ω και έστω η πιθανότητα να συμβεί ένα ενδεχόμενο Α Ω Υπάρχουν περιπτώσεις όπου ενώ δεν γνωρίζουμε

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Πειραματικό σχέδιο και ANOVA Η βασική διαφορά μεταξύ των πειραματικών σχεδίων είναι ο τρόπος με τον οποίο ταξινομούνται ή κατατάσσονται οι πειραματικές μονάδες (πειραματικά τεμάχια) Σε όλα τα σχέδια

Διαβάστε περισσότερα

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test 1 Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου One-Sample t-test 2 Μια σύντομη αναδρομή Στα τέλη του 19 ου αιώνα μια μεγάλη αλλαγή για την επιστήμη ζυμώνονταν στην ζυθοποιία Guinness. Ο William Gosset

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

14. Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας)

14. Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Έλεγχος Χ 4. Έλεγχος Χ (καλής προσαρμογής, ανεξαρτησίας και ομογένειας Από διασταύρωση ορισμένου είδους πειραματόζωων προκύπτουν τρεις τύποι απογόνων, Α, Β και Γ. Στο πλαίσιο ενός πειράματος, από μια τέτοια

Διαβάστε περισσότερα