Εισαγωγή στη Βιοστατιστική



Σχετικά έγγραφα
ΕΡΓΟ: «ΕΦΑΡΜΟΓΕΣ ΕΙΚΟΝΙΚΗΣ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑΣ ΣΤΗ ΒΟΙΩΤΙΑ: ΜΑΝΤΕΙΟ ΤΡΟΦΩΝΙΟΥ ΚΑΙ ΜΥΚΗΝΑΪΚΗ ΘΗΒΑ»

Ε.Π. ΕΚΠΑΙΔΕΥΣΗ ΚΑΙ ΑΡΧΙΚΗ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΤΑΡΤΙΣΗ, (ΕΠΕΑΕΚ ΙΙ) ΜΕΤΡΟ 2.5, ΕΝΕΡΓΕΙΑ 2.5.1, ΚΑΤΗΓΟΡΙΑ ΠΡΑΞΕΩΝ α

Τμήμα Ζωικής Παραγωγής ΤΕΙ Δ. Μακεδονίας, Παράρτημα Φλώρινας

Σχετικά µε αυτό το Βιβλίο

(ΜΕ ΤΑ ΔΥΟ ΜΕΙΟΝΕΚΤΗΜΑΤΑ)

Η ΚΑΤΑΝΑΛΩΣΗ ΤΩΝ ΕΜΠΟΡΕΥΜΑΤΩΝ

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ Ο. Τετάρτη 8 Ιουλίου 2015

I.Επί της Αρχής του σχεδίου Νόµου: ΙΙ. Επί των άρθρων του σχεδίου Νόµου: ΕΙΣΗΓΗΤΙΚΗ ΕΚΘΕΣΗ

Συλλόγου ιπλωµατούχων Νοσηλευτριών και Νοσηλευτών Χειρουργείου

ΑΘΗΝΑ, 12 Ιουλίου Αριθ. Πρωτ. : 775. ΠΡΟΣ : Περιφέρεια Αττικής. τον Περιφερειάρχη Αττικής κ. Γ. Σγουρό ΚΟΙΝ : όπως ο συνηµµένος πίνακας

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ ΡΚΣΤ. Τετάρτη 4 Μαΐου 2011

Υπό Παναγιώτη Δαλκαφούκη, μέλους Ένωσης Ελλήνων Ποινικολόγων

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕ ΡΙΑΣΗ Ν. Πέµπτη 28 Ιανουαρίου 2010

Συµβουλεύοµαι το κρυπτογραφικό αλφάβητο της Φιλικής Εταιρείας και. Ελευθερία ή Θάνατος. γ35343 ωβη3οω3η

Ε Φ Υ Μ Ν Ι O N. Παρατίθενται γνώµες και απόψεις. σχετικές µε το έργο του Πρωτοψάλτη, οράρχη και κδότη βιβλίων. κκλησιαστικής ουσικής

Θ Ε Μ Α «Σύνταξη και Ψήφιση προϋπολογισµού ήµου Καβάλας οικονοµικού έτους 2009»

Εργάτες Προλετάριοι οι Αστυνοµικοί


Επιµορφωτικό Πρόγραµµα Ο.ΜΕ Ιανουαρίου 2006 Ν Α Υ Π Λ Ι Ο «Η ΕΞΕΛΙΞΗ ΣΤΙΣ ΕΥΡΩΠΑΪΚΕΣ ΕΡΓΑΣΙΑΚΕΣ ΣΧΕΣΕΙΣ - Ο ΡΟΛΟΣ ΤΟΥ ΚΟΙΝΩΝΙΚΟΥ ΙΑΛΟΓΟΥ»

Ο κόσμος των επιχειρήσεων, τησ οικονομιασ και των αγορών: επιχειρηματικές δραστηριότητες, επιχειρηματικοί κίνδυνοι και επιχειρηματικές πρακτικές

Μη ανταγωνιστικές δραστηριότητες και παιχνίδια (υλικό)

Σ Χ Ο Λ Η :Δ ΙΟ ΙΚ Η Σ Η Σ Κ Α Ι Ο ΙΚ Ο Ν Ο Μ ΙΑ Σ ΤΜ Η Μ Α : Λ Ο Γ ΙΣ Τ ΙΚ Η Σ. ιιιιιιι. Θέμα: Συναλλαγματική Γραμμάτιο εις Δ ια ταγήν Επιταγή

ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΓΕΝΙΚΩΝ ΚΑΙ ΕΙΔΙΚΩΝ ΟΡΩΝ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ «ΑΣΦΑΛΩΣ ΚΑΤΟΙΚΕΙΝ» ΚΟΙΝΟΧΡΗΣΤΟΙ ΧΩΡΟΙ

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ Ε. Παρασκευή 10 Οκτωβρίου 2014

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕ ΡΙΑΣΗ ΡΙΣΤ. Παρασκευή 7 Μαΐου 2010

ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΝΟΜΟΣ ΑΡΚΑ ΙΑΣ ΗΜΟΣ ΒΟΡΕΙΑΣ ΚΥΝΟΥΡΙΑΣ Άστρος 22 Μαΐου 2015


Ταχ. /νση: Ερµού ΠΡΟΣ: Ως Πίνακας Αποδεκτών Ταχ. Κώδικας: Αθήνα Τηλέφωνο:

Αργατία. ίµηνη εφηµερίδα Τεύχος 5 Χορτοθέρτς Αύγουστον ηµοτικές και Νοµαρχιακές Εκλογές 2010

ΕΝΗΜΕΡΩΤΙΚΟ ΔΕΛΤΙΟ ΤΟΥ ΙΑΤΡΙΚΟΥ ΣΥΛΛΟΓΟΥ ΑΘΗΝΩΝ

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ ΡΙΣΤ. Πέµπτη 31 Ιανουαρίου 2013

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ ]Β. Πέµπτη 20 Φεβρουαρίου 2014

Παραδειγματική μικρή δραστηριότητα στο μάθημα της Νεοελληνικής Γλώσσας. «Με προσκαλούν και προσκαλώ»

Α.Ν. Αγγελάκης και Ο.Ν. Κοτσελίδου

Ε Υ Α Ρ ΤΕΥΧΟΣ 4 ΗΜΟΤΙΚΗ ΕΠΙΧΕΙΡΗΣΗ Υ ΡΕΥΣΗΣ ΑΠΟΧΕΤΕΥΣΗΣ ΗΜΟΥ ΡΟ ΟΥ ,00 (χωρίς το Φ.Π.Α.) ΚΑΤΑΣΚΕΥΗ ΣΥΝ ΕΣΕΩΝ ΙΚΤΥΟΥ ΑΠΟΧΕΤΕΥΣΗΣ ΜΕΛΕΤΗ ΕΡΓΟΥ:

Εκπαιδευτικό υλικό για την ΠΕ για τους μαθητές με ειδικές ανάγκες

Λογιστική Παγίων ΛΟΓΙΣΤΙΚΗ Ι. Λογιστική Καταχώρηση Παγίων. Επισκευές & Συντηρήσεις. Προσθήκες βελτιώσεις μετασκευές ΛΟΓΙΣΤΙΚΗ ΑΠΟΣΒΕΣΕΩΝ

1. DIATMHMATIKA/2012:1. DIATMHMATIKA 8/7/12 2:33 PM Page 11 ΙΑΤΜΗΜΑΤΙΚΑ ΣΕΜΙΝΑΡΙΑ

ΔΙΑΚΗΡΥΞΗ ΑΝΟΙΧΤΗΣ ΔΗΜΟΠΡΑΣΙΑΣ. (Τύπος Α) Για έργα που εμπίπτουν λόγω προϋπολογισμού 1 στο πεδίο εφαρμογής των Οδηγιών 2004/18 και 2004/17.

ΠΛΗΡΩΜΕΣ ΩΡΟΜΙΣΘΙΩΝ ΕΜΠΕΙΡΟΤΕΧΝΩΝ ΜΟΥΣΙΚΩΝ (ΕΜ16) ΓΕΝΙΚΑ

Η ΕΠΑΓΓΕΛΜΑΤΙΚΗ & ΕΠΙΧΕΙΡΗΜΑΤΙΚΗ ΔΡΑΣΤΗΡΙΟΠΟΙΗΣΗ ΤΩΝ ΕΛΛΗΝΩΝ ΤΗΣ ΔΙΑΣΠΟΡΑΣ ΜΕΤΑ ΤΟΝ Β ΠΑΓΚΟΣΜΙΟ ΠΟΛΕΜΟ ΚΑΙ Η ΕΠΙΔΡΑΣΗ ΤΗΣ ΣΤΟ ΕΘΝΙΚΟ ΚΕΝΤΡΟ

Παραμυθιά Τάξη Α Μάστορα Έλλη

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΤΜΗΜΑ ΔΙΑΚΟΠΗΣ ΕΡΓΑΣΙΩΝ ΤΗΣ ΒΟΥΛΗΣ ΘΕΡΟΣ 2014 ΣΥΝΕΔΡΙΑΣΗ ΛΒ Πέµπτη 4 Σεπτεµβρίου 2014

ΕΝΩΠΙΟΝ ΠΑΝΤΟΣ ΑΡΜΟΔΙΟΥ ΔΙΚΑΣΤΗΡΙΟΥ Η ΑΡΧΗΣ ΕΞΩΔΙΚΗ ΔΙΑΜΑΡΤΥΡΙΑ - ΠΡΟΣΚΛΗΣΗ

ιδάσκοντας τον Φα στη Συνάντηση µε τους µαθητές της Ασίας και του Ειρηνικού Λι Χονγκτζί

ΑΙΤΙΟΛΟΓΙΚΗ ΕΚΘΕΣΗ. Άρθρο 4 Κοινοί διαδικαστικοί κανόνες

Ευτυχισμένος και δημιουργικός ο νέος χρόνος

ΘΕΜΑ: «Παραθεριστικοί Οικοδοµικοί Συνεταιρισµοί. Μελέτη Περίπτωσης του «Βραχόκηπου» ήµου Γουβών Ηρακλείου Κρήτης»

Ασκήσεις ΙΙΙ Brno

«Ειρήνη» Σημειώσεις για εκπαιδευτικούς

Aπόσπασμα από τις αρκετές εκατοντάδες σελίδες θεωρίες. Λεκτικών δεξιοτήτων Γραμματικής Ορθογραφικών. Ερμηνευτικών παρατηρήσεων και των 2.

Θ Ε Μ Α «Έγκριση Αγροτικού και Αρδευτικού Κανονισµού ήµου Καβάλας» Αριθ. Αποφάσεως 891/2011

35η ιδακτική Ενότητα ΕΝΟΧΙΚΕΣ ΣΧΕΣΕΙΣ ( ΕΝΟΧΙΚΟ ΙΚΑΙΟ)

ΙΑ ΙΚΑΣΙΑ Σ ΕΠ ΠΟΛΙΤΙΚΗ ΠΡΟΜΗΘΕΙΩΝ ( Π.3.4.1) 1. ΣΚΟΠΟΣ

Πάνω Λεύκαρα. Αγαπίου Αθανασία-Αλέξη Τιμόθεος-Χαραλάμπους Γιώργος-Χατζηγιάγκου Δήμητρα

Μέλι, ένας θησαυρός υγείας και δύναμης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ

Καϊσίδου Βασιλική. Άρης Αλεξάνδρου, Το κιβώτιο: Μια μεταμοντέρνα, δια του λόγου άρνηση των μεγάλων αφηγήσεων.

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ ΡΜ. Πέµπτη 7 Μαρτίου 2013

Yrsa Sigurdardόttir. H εκδίκηση. Διεθνες Μπεςτ ςελερ. μην το διαβάσετε στο σκοτάδι. είναι πραγματικά τρομακτικό. marie claire

ΣΧΕΔΙΟ ΕΚΤΑΚΤΗΣ ΑΝΑΓΚΗΣ ΓΙΑ ΤΗΝ ΑΝΤΙΣΕΙΣΜΙΚΗ ΠΡΟΣΤΑΣΙΑ ΤΟΥ ΛΥΚΕΙΟΥ

έκφραση έκθεση γενικό λύκειο

Αρμέγει δήθεν ο Γιώργος τα πρόβατά του κάθε πρωί και γεμίζει καρδάρες με γάλα το οποίο αποθηκεύεται σε δοχεία μεγάλης χωρητικότητας και μεταφέρεται σ

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ ΞΖ. Τρίτη 30 Ιουνίου 2015

ΠΛΑΤΩΝΟΣ ΠΡΩΤΑΓΟΡΑΣ-ΚΕΦ. ΙΑ -ΙΒ Θέμα: ο μύθος του Πρωταγόρα και το επιμύθιο

οι κτηνοτρόφοι Η κυβέρνηση µπορεί να αποδείξει ότι δεν είναι όλοι ίδιοι γράφει ο. Βλαχοπάνος

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΡΙΘΜΟΣ ΜΕΛΕΤΗΣ: 58/ 2014 ΝΟΜΟΣ ΘΕΣΠΡΩΤΙΑΣ ΔΗΜΟΣ ΗΓΟΥΜΕΝΙΤΣΑΣ Δ/ΝΣΗ ΤΕΧΝΙΚΩΝ ΥΠΗΡΕΣΙΩΝ ΜΕΛΕΤΗ

VESTA40 [ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΤΟΠΟΘΕΤΗΣΗ, ΤΗ ΧΡΗΣΗ ΚΑΙ ΤΗ ΣΥΝΤΗΡΗΣΗ] Το εγχειρίδιο οδηγιών χρήσης αποτελεί αναπόσπαστο μέρος του προϊόντος

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ ΜΔ. Κυριακή 4 Δεκεµβρίου 2011

Γιώργος Αλβανός ΣΕΛΙ ΕΣ

Η ΔΙΚΑΙΟΣΥΝΗ ΚΑΙ Ο ΠΟΛΙΤΗΣ

ΘΕΜΑ: Η κοινωνικοποίηση του παιδιού στα πλαίσια του ολοήµερου σχολείου και της οικογένειας.

Τρέχουν και δεν φτάνουν οι αγρότες

Αφιερωμένο σε όλους τους ανθρώπους που ζουν σε αυτό τον υπέροχο πλανήτη, και στις επερχόμενες γενιές.

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ Ρ. Τετάρτη 7 Μαρτίου 2012

ΕΓΚΥΚΛΙΟΣ ΓΙΑ ΤΗΝ ΕΦΑΡΜΟΓΗ ΤΟΥ Ν. 3481/2006

Παρασκευή 7 Μάιου 2004

Κεφάλαιο Πέμπτο Εθνοπολιτισμική Ζωή και Εμπειρίες Ελληνικότητας των Ελληνοαυστραλών Εφήβων

3. Βιτσιλάκη Χ., Γουβιάς Δ. (2007). ΣΧΟΛΕΙΟ ΚΑΙ ΔΟΥΛΕΙΑ: Μία εμπειρική διερεύνηση της εφηβικής απασχόλησης. Αθήνα (εκδόσεις Gutenberg ).

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΣΥΝΕΔΡΙΑΣΗ ΚΘ. Τρίτη 18 Σεπτεµβρίου 2012

ΤΜΗΜΑ ΦΙΛΟΣΟΦΙΑΣ ΚΑΙ ΠΑΙΔΑΓΩΓΙΚΗΣ Πρόγραμμα Μεταπτυχιακών Σπουδών Φιλοσοφίας ΕΣΩΤΕΡΙΚΟΣ ΚΑΝΟΝΙΣΜΟΣ ΛΕΙΤΟΥΡΓΙΑΣ

ΑΝΑΚΟΙΝΩΣΗ ΣΟΧ 3/2015 για τη σύναψη ΣΥΜΒΑΣΗΣ ΕΡΓΑΣΙΑΣ ΟΡΙΣΜΕΝΟΥ ΧΡΟΝΟΥ. Η Κοινωφελής ηµοτική Επιχείρηση ήµου Αµπελοκήπων-Μενεµένης

Π Ι Σ Τ Ο Π Ο Ι Η Σ Ε Ω Ν Κ Α Ι Ε Λ Ε Γ Χ Ω Ν

«ΣΥΝΕΝΤΕΥΞΗ ΤΟΥ ΗΜΑΡΧΟΥ ΙΛΙΟΥ, Κ. ΝΙΚΟΥ ΖΕΝΕΤΟΥ ΣΤΗΝ ΕΦΗΜΕΡΙ Α «ΜΙΤΟΣ» ΚΑΙ ΤΗ ΗΜΟΣΙΟΓΡΑΦΟ ΑΘΗΝΑ ΠΕΡΡΑΚΗ»

Σέρρες Αριθ. Πρωτ.: 1387

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΤΜΗΜΑ ΔΙΑΚΟΠΗΣ ΕΡΓΑΣΙΩΝ ΤΗΣ ΒΟΥΛΗΣ ΘΕΡΟΥΣ 2014 ΣΥΝΕΔΡΙΑΣΗ ΛZ Τρίτη 16 Σεπτεµβριου 2014

Η ευσέβεια, η αξιοπιστία και η ακεραιότητα του Αγησιλάου (1 διδακτική ώρα)

Για έργα που δεν εµπίπτουν στο πεδίο εφαρµογής των Οδηγιών 2004/18/ΕΚ και 2004/17/ΕΚ 2

Συνήγορος του Καταναλωτή Νομολογία ΕφΑθ 5253/2003

E N O T H T A. Ο Κεραμιδοτρέχαλος

ΠΤΤΧΙΑΚΗ ΕΡΓΑΣΙΑ ΜΕ ΘΕΜΑ

ΤΕΧΝΙΚΟ ΕΠΙΜΕΛΗΤΗΡΙΟ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΑΝΑΤΟΛΙΚΗΣ ΚΡΗΤΗΣ

στο σχέδιο νόµου «Κώδικας Μετανάστευσης και Κοινωνικής

γ ρ α π τ ή ε ξ έ τ α σ η σ τ o μ ά θ η μ α Ν Ε Ο Ε Λ Λ Η Ν Ι Κ Η Γ Λ Ω Σ Σ Α Α Λ Υ Κ Ε Ι Ο Υ Τάξη: Α Λυκείου Τμήμα: Βαθμός: Ονοματεπώνυμο: Καθηγητές:

β) κίνημα στο Γουδί: σχολ. βιβλ σελ «το 1909 μέσω της Βουλής».

Η ΑΥΤΕΠΑΓΓΕΛΤΗ ΑΝΑΖΗΤΗΣΗ ΔΙΚΑΙΟΛΟΓΗΤΙΚΩΝ ΜΙΑ ΚΡΙΤΙΚΗ ΑΠΟΤΙΜΗΣΗ. ( Διοικητική Ενημέρωση, τ.51, Οκτώβριος Νοέμβριος Δεκέμβριος 2009)

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΛΟΓΙΣΤΙΚΗ ΚΑΙ ΦΟΡΟΛΟΓΙΚΗ ΑΝΤΙΜΕΤΩΠΙΣΗ ΔΑΠΑΝΩΝ

Τεύχος 21 Μάιος - Ιούλιος Υπέρλαμπρα Αστέρια. K ω π η λ α τ ι κ ά ν έ α

Ι ΑΚΤΙΚΗ ΠΑΡΕΜΒΑΣΗ ΣΤΗΝ ΠΑΡΑΓΩΓΗ ΓΡΑΠΤΟΥ ΛΟΓΟΥ ΣΕ ΤΜΗΜΑ ΕΝΤΑΞΗΣ ΕΥΤΕΡΟΒΑΘΜΙΑΣ ΕΚΠΑΙ ΕΥΣΗΣ

ΑΠΟΣΠΑΣΜΑ. ΘΕΜΑ : Έγκριση δαπανών και διάθεση πιστώσεων Προϋπολογισµού ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΝΟΜΟΣ ΚΕΦΑΛΛΗΝΙΑΣ ΗΜΟΣ ΚΕΦΑΛΛΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΗ ΕΠΙΤΡΟΠΗ

Transcript:

Εισαγωγή στη Βιοστατιστική Π.Μ.Σ.: Έρευνα στη Γυναικεία Αναπαραγωγή Οκτώβριος Νοέµβριος 2013 1

Περιεχόµενα o Ορισµός της Στατιστικής o Περιγραφική στατιστική o t-test o Δοκιµασία X 2 o Μη-παραµετρικές δοκιµασίες o Συντελεστές συσχέτισης o Απλή γραµµική παλινδρόµηση, ANOVA o Πολλαπλή γραµµική παλινδρόµηση o Λογαριθµιστική παλινδρόµηση 2

Διδακτικά Εγχειρίδια (προαιρετικά) o Βιοστατιστική Δ. Τριχόπουλος, Α. Τζώνου και Κ. Κατσουγιάννη Επιστηµονικές εκδόσεις Μαρίας Παρισιάνου o Αρχές της Βιοστατιστικής Pagano, M. and Gauvreau K. (µετάφραση στα ελληνικά Ουρ. Δαφνή). Eκδόσεις Έλλην 3

Τι είναι η Στατιστική; o Εργαλείο αποκάλυψης της αλήθειας που υπάρχει στα δεδοµένα; o Εργαλείο απόκρυψης της αλήθειας που υπάρχει στα δεδοµένα; n «Ψεύδεστε δια της Στατιστικής» o Πονοκέφαλος όσων την χρειάζονται αλλά δεν την γνωρίζουν; 4

Ορισµός o «Στατιστική είναι η τέχνη του να µαθαίνεις από τα δεδοµένα. Περιλαµβάνει τη συλλογή δεδοµένων, την περιγραφή τους και την ανάλυσή τους, η οποία συνήθως οδηγεί σε συµπεράσµατα» (Ross, 2005) 5

Τι είναι η Βιοστατιστική (Ιατρική Στατιστική); o Η επιστήµη που ασχολείται µε n τη συλλογή n τη διαχείριση n την ανάλυση n την ερµηνεία των αριθµητικών δεδοµένων και ερευνητικών υποθέσεων που προκύπτουν στο χώρο της Iατρικής και της Bιολογίας. o Η Bιοστατιστική συνεισφέρει στον σχεδιασµό και στην ορθή εξαγωγή συµπερασµάτων σε έρευνες στο χώρο της Iατρικής και της Bιολογίας. 6

Ιατρικές έρευνες ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΧΕΔΙΑΣΜΟΣ ΕΚΤΕΛΕΣΗ (ΣΥΛΛΟΓΗ ΔΕΔΟΜΕΝΩΝ) ΔΙΟΡΘΩΣΗ ΣΤΟΙΧΕΙΩΝ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΡΜΗΝΕΙΑ ΕΥΡΗΜΑΤΩΝ ΠΑΡΟΥΣΙΑΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΔΗΜΟΣΙΕΥΣΗ 7

Ιατρικές έρευνες ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΧΕΔΙΑΣΜΟΣ ΕΚΤΕΛΕΣΗ (ΣΥΛΛΟΓΗ ΔΕΔΟΜΕΝΩΝ) ΔΙΟΡΘΩΣΗ ΣΤΟΙΧΕΙΩΝ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΡΜΗΝΕΙΑ ΕΥΡΗΜΑΤΩΝ ΠΑΡΟΥΣΙΑΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΔΗΜΟΣΙΕΥΣΗ 8

Στατιστικά προγράµµατα o Σχεδιασµένα για στατιστική ανάλυση o Μεγάλες δυνατότητες στατιστικών τεχνικών o Εύκολος χειρισµός δεδοµένων o Kόστος ; 9

Στατιστικά προγράµµατα Λογιστικά φύλλα (spread sheets) Γενικής χρήσης, περιορισµένων δυνατοτήτων ανάλυσης o Excel o Lotus 123 Ειδικά στατιστικά προγράµµατα Αυξηµένων δυνατοτήτων ανάλυσης o R o SAS o SPSS o STATA o SPlus o Statistica o MINITAB o... 10

Στατιστική o Περιγραφική στατιστική Α σ χ ο λ ε ί τ α ι µ ε τ η σ υ ν ο π τ ι κ ή, α λ λ ά εµπεριστατωµένη παρουσίαση των δεδοµένων o Συµπερασµατολογική στατιστική Επιδιώκεται η συναγωγή συµπερασµάτων που βασίζονται στα ευρήµατα µιας µελέτης 11

Παράδειγµα o Μελέτη σύγκρισης µηχανών και παραδοσιακών µετρήσεων o Θέλουµε να συγκρίνουµε αυτόµατα µηχανήµατα µέτρησης πίεσης (που βρίσκονται στο δρόµο των ΗΠΑ), µε τον παραδοσιακό τρόπο (υπό την παρουσία ειδικού - συνήθως νοσηλευτή). o Η µελέτη αυτή έγινε στις ΗΠΑ (για λεπτοµέρειες στο βιβλίο του Rosner, 1994, σελ. 1 4). 12

(συν.) o Στη µελέτη αυτή για κάθε άτοµο µετράµε την πίεση του µε το µηχάνηµα και για το ίδιο άτοµο µετράµε την πίεση και µε τον παραδοσιακό τρόπο µε τη βοήθεια ενός ειδικευµένου νοσηλευτή. o Το ερευνητικό ερώτηµα είναι κατά πόσο τα αποτελέσµατα των 2 µεθόδων (µέτρηση πίεσης µε το µηχάνηµα και µε τη βοήθεια ειδικού) διαφέρουν µεταξύ τους 13

Σχεδιασµός της µελέτης 1. Πόσα µηχανήµατα θα εξετάσουµε και που θα τοποθετηθούν αυτά ; 2. Πόσους ανθρώπους θα εξετάσουµε ανά µηχάνηµα; 3. Ποια θα είναι η σειρά των µετρήσεων ; 4. Άλλα δεδοµένα που θα πρέπει να συλλέξουµε; 5. Πως θα γίνει η καταχώρηση και η κωδικοποίηση των δεδοµένων; 6. Πως θα γίνει ο έλεγχος της ακρίβειας και της ακεραιότητας των δεδοµένων; 14

Απαντήσεις στα ερωτήµατα 1. Πόσα µηχανήµατα θα εξετάσουµε και που θα τοποθετηθούν αυτά ; Επιλέχθηκαν 4 µηχανήµατα σε µη-κοντινές περιοχές. 2. Πόσους ανθρώπους θα εξετάσουµε ανά µηχάνηµα; Χρησιµοποιήθηκαν στατιστικοί µέθοδοι καθορισµού του µεγέθους δείγµατος. Βάση αυτών, αποφασίστηκε να µετρηθούν 100 άτοµα ανά µηχάνηµα 15

(συν.) 3. Ποια θα είναι η σειρά των µετρήσεων ; Συνήθως η πρώτη µέτρηση είναι πιο υψηλή. Έτσι, αν ορίσουµε την πρώτη µέτρηση να λαµβάνεται συστηµατικά από το µηχάνηµα ή από τον ειδικευµένο νοσηλευτή τότε θα δηµιουργηθεί ένα συστηµατικό σφάλµα που θα οφείλεται στη σειρά δειγµατοληψίας και όχι στην πραγµατική διαφορά των δύο µετρήσεων. n Αυτό µπορεί να αποφευχθεί µέσω της τυχαιοποίησης (ανάθεση της σειράς µε τυχαίο τρόπο). 16

(συν.) 4. Άλλα δεδοµένα που θα πρέπει να συλλέξουµε; Σίγουρα θα πρέπει να ρωτήσουµε τους συµµετέχοντες και επιπλέον ατοµικά τους στοιχεία που επηρεάζουν την πίεση όπως βάρος, ύψος και φύλο. Επίσης άλλα δηµογραφικά στοιχεία (π.χ. ηλικία, τόπος κατοικίας) ή ιατρικά στοιχεία (π.χ. ιστορικό υπέρτασης) που θα µας δώσουν πληροφόρηση ως προς τον πληθυσµό που χρησιµοποιεί τα µηχανήµατα. 17

(συν.) 5. Πως θα γίνει η καταχώρηση και η κωδικοποίηση των δεδοµένων; Στην κωδικοποίηση γίνεται πλήρης ορισµός των ονοµάτων των µεταβλητών, των κωδικών των κατηγοριών όπου υπάρχουν, στις ελλιπείς τιµές (missing values) Επίσης τα δεδοµένα εισήχθηκαν 2 φορές και έγινε αυτόµατη σύγκριση των αρχείων για εντοπισµό λαθών πληκτρολόγησης. 18

(συν.) 6. Πως θα γίνει ο έλεγχος της ακρίβειας και της ακεραιότητας των δεδοµένων; Στον έλεγχο των δεδοµένων έγινε απλή περιγραφική ανάλυση, εκτύπωση ελαχίστων και µεγίστων τιµών ανά µεταβλητή και τυχαίος δειγµατοληπτικός έλεγχος µερικών ερωτηµατολογίων. 19

Περιγραφική ανάλυση και διαγραµµατική απεικόνιση. 20

Ελλιπείς τιµές o Τα αρχικά δεδοµένα ήταν υπολογισµένα να αποδώσουν 100 τιµές ανά τοποθεσία, αλλά όπως παρατηρείται υπήρξαν ελλιπείς τιµές (missing values), γεγονός συνηθισµένο στην Ιατρική Έρευνα και τη Βιοστατιστική. o Ο αναµενόµενος αριθµός µη απόκρισης πρέπει και λαµβάνεται υπ όψιν στον καθορισµό του µεγέθους δείγµατος. 21

Συµπερασµατολογική στατιστική o Μας ενδιαφέρει να ελέξουµε αν υπάρχουν διαφορές µεταξύ των µετρήσεων της µηχανής και του ανθρώπου. o Επειδή έχουµε ζευγάρια ποσοτικών µετρήσεων για κάθε άτοµο (η πίεση µε το µηχάνηµα και µε τον ειδικό) για το λόγο αυτό αποφασίζουµε να χρησιµοποιήσουµε τη δοκιµασία t ανά ζεύγη (paired t-test). o Οπότε, πραγµατοποιούµε τη στατιστική ανάλυση και συµπεραίνουµε... 22

Συµπερασµατολογική στατιστική o Είπαµε ότι µας ενδιαφέρει να ελέξουµε αν υπάρχουν διαφορές µεταξύ των µετρήσεων της µηχανής και του ανθρώπου. o Το ερώτηµα αυτό αφορά τις µηχανές και τους ανθρώπους που χρησιµοποιήσαµε στο δείγµα µας, ή όχι; n Και αν όχι, σε ποιόν πληθυσµό αναφέρεται; o Το ερώτηµα αυτό αναφέρεται σε όλο τον πληθυσµό! 23

Συµπερασµατολογική στατιστική o Οπότε και το συµπέρασµα που θα βγάλουµε θα αναφέρεται σε όλο τον πληθυσµό. o Αυτό ακριβώς κάνουµε στη Στατιστική: συλλέγουµε ένα δείγµα, και βάση αυτών που βλέπουµε στο δείγµα βγάζουµε συµπεράσµατα για όλο τον πληθυσµό! 24

Βασικές έννοιες o Πληθυσµός - δείγµα n Κεντρική ιδέα στην όλη στατιστική διαδικασία αποτελεί η μελέτη ενός δείγματος αποτελούμενου από (n) παρατηρήσεις και προερχόμενου από ένα πληθυσμό αναφοράς αποτελούμενο από (Ν) παρατηρήσεις. o Το δείγμα πρέπει να είναι τυχαίο υποσύνολο του πληθυσμού. o Κάθε έρευνα έχει σκοπό να καταλήξει σε συμπεράσματα για τον πληθυσμό, και όχι για το δείγμα! 25

Παράδειγµα o Έστω ότι µας ενδιαφέρει να ερευνήσουµε το ύψος των ανδρών στο λεκανοπέδιο της Αττικής o Ιδανικά, θα θέλαµε να µετρήσουµε όλους τους άνδρες που ζουν στο λεκανοπέδιο της Αττικής o Αυτό είναι ανέφικτο, για πολλούς λόγους! o Έτσι, θα πάρουµε ένα δείγµα από τον πληθυσµό αναφοράς, και θα δουλέψουµε µε αυτό 26

(συνέχεια) o Συλλέγουµε τυχαία 500 άνδρες (δείγµα), και µετράµε το ύψος τους o Σκοπός µας είναι να καταλήξουµε σε συµπεράσµατα για το ύψος όλων των ανδρών στο λεκανοπέδιο της Αττικής (πληθυσµός αναφοράς) n Και όχι µόνο για τους 500 που είχαµε στο δείγµα µας 27

(συνέχεια) o Για να συµβεί αυτό θα πρέπει το δείγµα µας να είναι αντιπροσωπευτικό όλου του πληθυσµού αναφοράς o Αυτό δεν είναι πάντα τόσο εύκολο και απλό και χρειάζεται να είµαστε πολύ προσεκτικοί στην επιλογή του δείγµατος o Έτσι, στο παράδειγµά µας τι θα µπορούσε να µην λειτουργήσει καλά και να µας οδηγήσει σε εσφαλµένα συµπεράσµατα; 28

(συνέχεια) o Σε κάθε έρευνα, αφού συλλέξουµε το δείγµα µας, περνάµε τα στοιχεία µας στον υπολογιστή (π.χ. στο Excel ή σε κάποιο στατιστικό πρόγραµµα) o Έτσι, στο προηγούµενο παράδειγµα θα έχουµε µια στήλη µε π.χ. το ύψος, την ηλικία κ.λ.π. o Κάθε στήλη αντιπροσωπεύει µια µεταβλητή 29

o 30

Τυχαίες µεταβλητές o Στη Στατιστική για να αποτιµήσουµε ποσοτικά τα διάφορα µεγέθη, χαρακτηριστικά ή έννοιες που µας αφορούν σε µια µελέτη, χρησιµοποιούµε τις τυχαίες µεταβλητές 31

Η ανάγκη χρήσης µεταβλητών Μεγέθη Ηλικία, βάρος, λιπίδια κλπ Χαρακτηριστικά Φύλο, επάγγελµα κλπ Έννοιες Άγχος, µόρφωση, διατροφή κλπ Υπάρχει ανάγκη ποσοτικής αποτίµησης ΜΕΤΑΒΛΗΤΕΣ 32

Είδη µεταβλητών o Ποιοτικές, κατηγορικές (Qualitative, Categorical) Μεταβλητές που δεν µπορούν να µετρηθούν (κατηγοριοποίηση) o Διατάξιµες (ιεράρχηση) o Μη διατάξιµες o Ποσοτικές (Quantitative) Μεταβλητές που µπορούν να µετρηθούν o Συνεχείς o Διακριτές Οι ποσοτικές µεταβλητές µπορούν να µετατραπούν σε ποιοτικές (διατάξιµες) αλλά είναι γνωστό και το σχετικό τους µέγεθος. Το αντίστροφο συνήθως δεν ισχύει. 33

Είδη µεταβλητών o Μη διατάξιµες (δεν επιδέχονται αριθµητικές µετρήσεις και δεν υπάρχει ιεραρχία). Π.χ.: n Φύλο (διχοτοµική µεταβλητή) o 0 άνδρας o 1 γυναίκα n Οµάδα αίµατος o 0 οµάδα αίµατος O o 1 οµάδα αίµατος A o 2 οµάδα αίµατος B o 3 οµάδα αίµατος AB 34

Είδη µεταβλητών o Διατάξιµες (δεν επιδέχονται αριθµητικές µετρήσεις αλλά υπάρχει ιεραρχία). Π.χ.: n 1 χωρίς συµπτώµατα n 2 ελαφρά συµπτώµατα n 3 µέτρια συµπτώµατα n 4 έντονα συµπτώµατα 35

Είδη µεταβλητών o Διακριτές (επιδέχονται αριθµητικές µετρήσεις, αλλά είναι δυνατόν να λάβουν µόνο ορισµένες τιµές) n Αριθµός τροχαίων ατυχηµάτων στην Αθήνα σε µια ηµέρα n Αριθµός µαθητών σε µια τάξη 36

Είδη µεταβλητών o Συνεχείς (επιδέχονται αριθµητικές µετρήσεις και µπορούν να πάρουν θεωρητικά όλες τις τιµές των πραγµατικών αριθµών, σε ένα διάστηµα) n Βάρος n Συστολική πίεση n Χρόνος επιβίωσης n Θερµοκρασία 37

Περιγραφική στατιστική 38

Περιγραφική Στατιστική o Για να περιγράψουµε τα δεδοµένα µας, χρησιµοποιούµε διαφορετικούς τρόπους για τις ποιοτικές και τις ποσοτικές µεταβλητές o Στη συνέχεια θα δούµε τους κυριότερους τρόπους, για κάθε µια από τις δυο κατηγορίες µεταβλητών 39

Ποιοτικές µεταβλητές o Στις ποιοτικές µεταβλητές χρησιµοποιούµε την κατανοµή συχνοτήτων o Κατανοµή συχνοτήτων (frequency distribution). Με την κατανοµή συχνοτήτων καταγράφεται για κάθε τιµή του ποιοτικού µεγέθους ο αντίστοιχος αριθµός παρατηρήσεων ή/και το αντίστοιχο ποσοστό. 40

Παράδειγµα «Σε ποιες βαθµίδες είναι αποτελεσµατικότερες οι Νέες Τεχνολογίες;» Αριθ. Ποσοστό Κατηγορία απάντησης Ατόµων Απαντ. Δηµοτικό 13 6.2 Γυµνάσιο 53 25.4 Λύκειο-ΤΕΕ 68 32.5 Τριτοβάθµια 16 7.7 Όλες 59 28.2 Σύνολο απαντήσεων 209 100 41

o Κατανοµή συχνοτήτων: o 56% γυναίκες, 44% άνδρες σε δείγµα 12.000... o Είναι πολύ σηµαντικό να δίνετε το µέγεθος δείγµατος o Κάθε παρατήρηση πρέπει να µπορεί να περιληφθεί σε µία και µόνο µία από τις υπάρχουσες κατηγορίες n Π.χ. Υγιή άτοµα, πάσχοντα από καρκίνο του πνεύµονα, εµφραγµατίες n Π.χ. Έγγαµοι, άγαµοι o Αν αναµένεται να υπάρχουν απαντήσεις εκτός από αυτές που χρησιµοποιούµε, κατασκευάζουµε και µια κατηγορία παρατηρήσεων που καλύπτει περιστατικά άλλα ή άγνωστα 42

Γραφικές παραστάσεις κατανοµών συχνοτήτων ποιοτικών µεταβλητών o Ιστογράµµατα o Κυκλικά διαγράµµατα o Ραβδογράµµατα 43

Παράδειγµα Κατανοµή συχνοτήτων: 44

Ραβδόγραµµα 45

Πίτα 46

Ποσοτικές µεταβλητές o Αν έχουµε µια ποσοτική µεταβλητή µε πολύ λίγα επίπεδα, µπορούµε να χρησιµοποιήσουµε την κατανοµή συχνοτήτων o Κατανοµή συχνοτήτων (frequency distribution). Με την κατανοµή συχνοτήτων καταγράφεται για κάθε τιµή ή εύρος τιµών του ποσοτικού µεγέθους ο αντίστοιχος αριθµός παρατηρήσεων. Κατανοµή συχνοτήτων 400 οικογενειών µε 3 παιδιά, ανάλογα µε τον αριθµό των αγοριών Αγόρια Συχνότητα Συχνότητα % 0 52 13 1 133 33,25 2 146 36,5 3 69 17,25 47

Ραβδόγραµµα 48

Ιστογράµµατα o Στην περίπτωση που έχουµε µια ποσοτική µεταβλητή µε πολύ λίγα επίπεδα, τότε χρησιµοποιούµε το ραβδόγραµµα n Στο προηγούµενο παράδειγµα είχαµε µια ποσοτική µεταβλητή µε 4 επίπεδα, µόνο o Στην περίπτωση αυτή είναι όντως ποσοτική µεταβλητή ή µήπως είναι ποιοτική; 49

Ιστογράµµατα o Σε γενικές γραµµές, µια ποσοτική µεταβλητή έχει πάρα πολλές δυνατές απαντήσεις n Π.χ. Βάρος o Το κατάλληλο γράφηµα στην περίπτωση αυτή είναι το ιστόγραµµα o Στο επόµενο γράφηµα παρουσιάζεται το ιστόγραµµα του Δείκτη Μάζας Σώµατος από ένα δείγµα 2994 ατόµων 50

Ιστόγραµµα Ιστόγραµµα του ΔΜΣ (ΒΜΙ) σε δείγµα 2994 ατόµων. 51

Ιστογράµµατα o Πόσο συµµετρικά είναι τα δεδοµένα; o Πόσο διεσπαρµένα είναι τα δεδοµένα; o Υπάρχουν διαστήµατα µε υψηλή συγκέντρωση δεδοµένων; o Υπάρχουν κενά στα δεδοµένα; o Υπάρχουν παρατηρήσεις µακριά από τις υπόλοιπες (ακραίες παρατηρήσεις - outliers); 52

Οµαδοποίηση o Σε κάποιες περιπτώσεις, µπορεί να επιλέξουµε την οµαδοποίηση n Την κατασκευή οµάδων βάση των τιµών της ποσοτικής µεταβλητής µας o Στην επόµενη διαφάνεια, έχουµε ένα τέτοιο παράδειγµα 53

Οµαδοποίηση Κατανοµή συχνοτήτων 111 δειγµάτων ούρων ανάλογα µε τον αριθµό πυοσφαιρίων κατά οπτικό πεδίο Αριθµός Πυοσφαιρίων Αριθµός δειγµάτων 0-9 25 10-19 40 20-29 18 30-39 14 40-49 6 50 + 8 54

Οµαδοποίηση o Αριθµός οµάδων; n 6-10 o Κεντρική τιµή κάθε οµάδος; o Ανάγκη διατήρησης σταθερού εύρους όλων των οµάδων; 55

Οµαδοποίηση o Η οµαδοποίηση καταλήγει να µετατρέψει την ποσοτική µεταβλητή µας σε µια ποιοτική o Σε γενικές γραµµές, από στατιστικής πλευράς δεν συνίσταται! n Ειδικά στις περιπτώσεις στατιστικών ελέγχων (που θα δούµε στη συνέχεια) έχουµε σαν αποτέλεσµα να χάνουµε ισχύ 56

Ιστόγραµµα, καµπύλη συχνοτήτων o Η γραφική παράσταση µιας κατανοµής συχνοτήτων γίνεται µε το ιστόγραµµα (histogram), το οποίο τελικά µπορεί να προσεγγίσει µια οµαλή καµπύλη, που ονοµάζεται καµπύλη συχνοτήτων (frequency curve). o Μονοκόρυφες ή πολυκόρυφες o Κανονική κατανοµή, θετικά λοξή, αρνητικά λοξή 57

Περιγραφή ποσοτικών µεταβλητών Γραφήµατα, Ιστόγραµµα συχνοτήτων Ιστόγραµµα Συχνοτήτων του ΔΜΣ (ΒΜΙ) σε δείγµα 2994 ατόµων. 58

Καµπύλες συχνοτήτων (µονοκόρυφες) 59

Αντιπροσωπευτικές τιµές των κατανοµών συχνοτήτων ποσοτικών µεταβλητών o Υπολογίζονται µε βάση τα στοιχεία της κατανοµής και µπορούν να υποδείξουν τα κύρια χαρακτηριστικά της o Τιµές θέσης n Επικρατούσα τιµή, µέση τιµή, διάµεσος o Τιµές βαθµού διασποράς n Σταθερή απόκλιση, ακραίες τιµές, εκατοστηµόρια 60

Τιµές θέσης o Επικρατούσα τιµή είναι η τιµή στην οποία σηµειώθηκαν οι περισσότερες παρατηρήσεις o Μέση τιµή είναι το αλγεβρικό άθροισµα όλων των µετρήσεων διαιρεµένο µε το πλήθος αυτών o Διάµεσος είναι η τιµή που είναι συγχρόνως µεγαλύτερη από τις µισές µετρήσεις και µικρότερη από τις άλλες µισές n +1 n Η τιµή της διατεταγµένης παρατήρησης 2 61

Παράδειγµα: o Οι 17 µαθητές µιας τάξης σηµείωσαν τον παρακάτω αριθµό απουσιών (σε αυξανόµενη σειρά) 0, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 6, 7, 7, 34, 82 62

Παράδειγµα o Οι 17 µαθητές µιας τάξης σηµείωσαν τον παρακάτω αριθµό απουσιών (σε αυξανόµενη σειρά) 0, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 6, 7, 7, 34, 82 Επικρατούσα τιµή: 2 απουσίες Μέση τιµή: 10 απουσίες Διάµεσος: 4 απουσίες 63

Μέση τιµή και διάµεσος o Αν η κατανοµή είναι συµµετρική, η µέση τιµή και η διάµεσος βρίσκονται πολύ κοντά n n Τέτοια κατανοµή είναι η κανονική κατανοµή Σε αυτές τις περιπτώσεις δεν έχει µεγάλη σηµασία αν θα επιλέξουµε τη διάµεσο ή τη µέση τιµή o Συνήθως, τότε προτιµάται η µέση τιµή o Στις µη συµµετρικές κατανοµές προτιµάται η διάµεσος. Η µέση τιµή επηρεάζεται περισσότερο από τις ακραίες τιµές, και από τη µη συµµετρικότητα n Εδώ η χρήση της µέσης τιµές οδηγεί σε παραπλανητικά αποτελέσµατα 64

Μέση τιµή και διάµεσος o Οπότε, στις συµµετρικές κατανοµές προτιµάται η µέση τιµή n n Σε αυτές τις περιπτώσεις δεν έχει µεγάλη σηµασία αν θα επιλέξουµε τη διάµεσο ή τη µέση τιµή Γιατί είναι σχεδόν ο ίδιος αριθµός o Στις µη συµµετρικές κατανοµές προτιµάται η διάµεσος. n Εδώ η χρήση της µέσης τιµές οδηγεί σε παραπλανητικά αποτελέσµατα 65

Μέση τιµή και διάµεσος o Άρα, φαίνεται ότι η διάµεσος είναι σε γενικές γραµµές καλύτερη επιλογή από τη µέση τιµή n Παρόλο που οι περισσότεροι από εµάς πιστεύουν το αντίθετο, και χρησιµοποιούν κυρίως τη µέση τιµή 66

Παράδειγµα: o Το παρακάτω ιστόγραµµα αντιστοιχεί στα δεδοµένα του τελευταίου παραδείγµατος, µε τον αριθµό απουσιών. o Με βάση αυτό το ιστόγραµµα, ποιο µέτρο θέσης θα επιλέγατε για τα δεδοµένα αυτά; 67

Παράδειγµα: 68

Επικρατούσα τιµή; o Η επικρατούσα τιµή είναι χρήσιµη σε περιπτώσεις πολυκόρυφων κατανοµών 69

Τιµές βαθµού διασποράς o Σταθερή απόκλιση (standard deviation): _ Σx 2 SD = ( x i x) = i n 1 n 1 o Οι ακραίες τιµές προσδιορίζουν το εύρος της κατανοµής 2 ( Σxi ) n 2 o Εκατοστηµόρια: ( n + 1)* K 100 70

Τιµές βαθµού διασποράς o Διακύµανση (variance) 2 ( x x) Var = = SD 2 n 1 o Τυπικό σφάλµα (standard error) SE = SD n _ 71

Σύντοµη εισαγωγή στο SPSS o Μέχρι στιγµής µιλήσαµε για την Περιγραφική Στατιστική, και τους τρόπους που την πραγµατοποιούµε ανάλογα µε το αν έχουµε ποιοτικά ή ποσοτικά δεδοµένα o Την Περιγραφική Στατιστική συνήθως την πραγµατοποιούµε σε ένα στατιστικό πρόγραµµα o Μιας και στο µάθηµά µας θα χρησιµοποιήσουµε το SPSS, στις επόµενες διαφάνειες θα κάνουµε µια µικρή εισαγωγή στο πρόγραµµα αυτό 72

Χώρος εισαγωγής δεδοµένων Χώρος διαχείρισης δεδοµένων 73

Ετικέτα µεταβλητής (π.χ. Age of subjects) Ετικέτες τιµών µεταβλητής (π.χ. 1 = male, 2 = female) Όνοµα µεταβλητής (µέχρι 8 χαρακτήρες, χωρίς σηµεία στίξης) Μήκος και αριθµός δεκαδικών ψηφίων µεταβλητής Τύπος µεταβλητής (αριθµητική, κείµενο κλπ) 74

Τρόπος εισαγωγής δεδοµένων Περιστατικά } Μεταβλητές } CRP BMI AGE MALE 1 0,81 23,6 56 1 2 1,18 28,3 53 0 3 1,27 27,2 72 1 4 1,91 29,3 50 1 5 1,53 22,2 47 0 6 2,20 24,3 44 1 7 4,08 24,5 49 1 8 3,01 23,6 54 1 9 2,48 27,5 59 1............... 75

Μενού επιλογών στατιστικών µεθόδων 76

Μενού επιλογών περιγραφικών στατιστικών µεθόδων 77

Μενού επιλογών γραφηµάτων 78

Επιλογή µεταβλητών για ανάλυση 79

Statistics Παράδειγµα Περιγραφικά Στατιστικά Μέτρα (Summary Statistics) Body Mass Index (kg/m2) N Valid Mean Std. Error of Mean Median Mode Std. Deviation Variance Range Minimum Maximum Sum Percentiles Missing 10 20 25 30 40 50 60 70 75 80 90 2994 48 26,3347,08250 25,8841 22,04 a 4,51400 20,376 54,97 11,69 66,67 78846,09 20,9572 22,5896 23,2315 23,8472 24,8971 25,8841 26,9896 28,2828 28,9811 29,5525 32,0501 a. Multiple modes exist. The smallest value is shown 80

Πραγµατική µέση τιµή Δειγµατική µέση τιµή o Αν και έχουµε ορίσει τη µέση τιµή, στη συνέχεια θα δείτε να αναφερόµαστε σε 2 µέσες τιµές: την πραγµατική και τη δειγµατική o Η δειγµατική µέση τιµή είναι η µέση τιµή των παρατηρήσεων στο δείγµα µας. n Και µπορούµε να την υπολογίσουµε o Η πραγµατική µέση τιµή είναι η µέση τιµή των παρατηρήσεων σε όλο τον πληθυσµό αναφοράς n Συνήθως, ΔΕΝ µπορούµε να την υπολογίσουµε 81

Πραγµατική µέση τιµή Δειγµατική µέση τιµή o Από τις δύο µέσες τιµές, αυτή που µας ενδιαφέρει ουσιαστικά είναι η πραγµατική µέση τιµή n Μας ενδιαφέρει όλος ο πληθυσµός αναφοράς o Όµως, η µόνη που µπορούµε να υπολογίσουµε είναι η δειγµατική µέση τιµή o Μπορούµε να εκτιµήσουµε την πραγµατική µέση τιµή, αν γνωρίζουµε τη δειγµατική; n Ναι, και θα δούµε πώς... 82

Πραγµατική µέση τιµή o Τι σχέση έχει η πραγµατική µέση τιµή και η δειγµατική µέση τιµή; o Η µέση τιµή ενός δείγµατος αποτελεί µια κατά προσέγγιση εκτίµηση της πραγµατικής µέσης τιµής του πληθυσµού o Το τυπικό σφάλµα (SE) αποτελεί µέτρο της ενδεχόµενης απόστασης της δειγµατικής µέσης τιµής από την αντίστοιχη πραγµατική 83

Διάστηµα αξιοπιστίας o Ένας τρόπος για να εκτιµήσουµε την πραγµατική µέση τιµή, αν γνωρίζουµε τη δειγµατική είναι χρησιµοποιόντας το διάστηµα αξιοπιστίας, ή διάστηµα εµπιστοσύνης 84

Διάστηµα αξιοπιστίας o Στην κανονική κατανοµή και όταν ο αριθµός των παρατηρήσεων είναι µεγάλος : n το διάστηµα: (δειγµατική µέση τιµή 1,96*SE) περιλαµβάνει την πραγµατική µέση τιµή µε πιθανότητα 95% ± 85

Παράδειγµα o o o Έστω ότι η µέση τιµή µιας σειράς πολυάριθµων µετρήσεων αναστηµάτων ήταν 164 εκ. και το SE ήταν 0,5 εκ. Άρα, η δειγµατική µέση τιµή είναι 164 εκ. n Τότε, το 95% διάστηµα αξιοπιστίας για την πραγµατική µέση τιµή είναι το διάστηµα (164-1.96*0.5, 164+1.96*0.5) Αυτό σηµαίνει ότι είµαστε 95% σίγουροι ότι η πραγµατική µέση τιµή του πληθυσµού βρίσκεται στο διάστηµα (163.02, 164.98) Στην περίπτωση αυτή, η πιθανότητα να κάνουµε λάθος είναι 5%=0,05 86

(συν.) o Αντίστοιχα µπορούµε να κατασκευάσουµε 90% ΔΕ, ή 99% ΔΕ n Αυτά θα έχουν πιθανότητα λάθους 10% και 1%, n αντίστοιχα Τι σχέση θα έχουν αυτά τα 2 µε το 95% ΔΕ; o Το επίπεδο P =5%=0,05 έγινε συµβατικά δεκτό ως το όριο για την πιθανότητα λάθους n Για το λόγο αυτό µας ενδιαφέρει η πιθανότητα λάθους να είναι το πολύ µέχρι και 5%. o Αντίστοιχα, χρησιµοποιείται για να µας δείξει πότε µια διαφορά θεωρείται στατιστικά σηµαντική n Αν έχει πιθανότητα λάθους µικρότερη από 0,05 87

Έλεγχος υπόθεσης o Στην Στατιστική µπορούµε να ελέγξουµε αν µια συγκεκριµένη υπόθεση είναι αληθής ή όχι, στον πληθυσµό αναφοράς n Π.χ. Αν η µέση τιµή µιας ορµόνης στο αίµα είναι ίδια σε γυναίκες που γέννησαν µε καισαρική ή µε φυσιολογικό τοκετό o Υπάρχουν διάφορες στατιστικές δοκιµασίες (έλεγχοι), και η κάθε µια από αυτές ελέγχει ένα συγκεκριµένο είδος υπόθεσης o Στη συνέχεια θα δούµε αναλυτικά τις πιό σηµαντικές από τις δοκιµασίες αυτές 88

Έλεγχος υπόθεσης o Σε όλες τις στατιστικές δοκιµασίες θα έχουµε δύο υποθέσεις, για να αποφασίσουµε ποια από τις 2 φαίνεται να είναι πιο πιθανή για τον πληθυσµό αναφοράς o Η µια υπόθεση λέγεται µηδενική (Η 0 ) και η άλλη εναλλακτική (Η Α ) 89

Έλεγχος υπόθεσης o Στη συνέχεια θα µιλήσουµε για µια διαδικασία που χρησιµοποιείται στη Στατιστική και ονοµάζεται έλεγχος υπόθεσης o Ο έλεγχος υπόθεσης είναι µια διαδικασία βάση της οποίας συνάγουµε συµπεράσµατα για µια παράµετρο του πληθυσµού (π.χ. τη µέση τιµή), χρησιµοποιώντας πληροφορίες που προέρχονται από το δείγµα µας o Έτσι, π.χ. υπάρχει µια στατιστική δοκιµασία που ελέγχει αν η µέση τιµή µιας µεταβλητής είναι ίση µε ένα δοσµένο αριθµό Α 90

Έλεγχος υπόθεσης o Η διαδικασία που ακολουθούµε σε ένα οποιαδήποτε έλεγχο υπόθεσης είναι η παρακάτω: n Εστω, ότι θέλουµε να ελέγξουµε αν η µέση τιµή µ του ύψους µιας οµάδας παιδιών είναι 90εκ. o Αρχικά, ξεκινάµε υποθέτοντας ότι η µηδενική υπόθεση(h 0 ) ισχύει: n π.χ. στο παραπάνω παράδειγµα υποθέτουµε ότι η πραγµατική µέση τιµή του πληθυσµού είναι ίση µε η δοσµένη τιµή n H 0 : µ=90εκ. 91

(συν.) o Η εναλλακτική υπόθεση είναι πάντα αντίθετη της µηδενικής υποθεσης n Έτσι, στο παράδειγµα που αναφερόµαστε: η εναλλακτική υπόθεση είναι H Α : µ 90εκ. o Στη συνέχεια ελέγχουµε αν το δείγµα µας είναι περισσότερο συνεπής µε τη µηδενική υπόθεση ή µε την εναλλακτική υπόθεση o Το τελικό συµπέρασµα θα αντιστοιχεί σε όλο τον πληθυσµό αναφοράς, και όχι µόνο στο δείγµα µας 92

p-value o Πώς καταλαβαίνουµε αν το δείγµα µας είναι περισσότερο συνεπής µε τη µηδενική υπόθεση ή µε την εναλλακτική υπόθεση; n Απο την p-value o Κάθε στατιστική δοκιµασία µας δίνει σαν αποτέλεσµα ένα αριθµό, που λέγεται p-value o Η p-value θα µας δείξει ποια υπόθεση φαίνεται πιο συµβατή για τον πληθυσµό που µας ενδιαφέρει 93

p-value o Έτσι, συγκρίνουµε την υπολογιζόµενη p-value µε το στατιστικό επίπεδο αναφοράς που συνήθως είναι το 0,05 n Θυµηθείτε που µιλάγαµε για πιθανότητα λάθους µέχρι το πολύ 5% = 0,05 n Αν p-value < 0,05, τότε απορρίπτουµε την H 0 και αποδεχόµαστε την H Α n Αν p-value > 0,05, τότε αποτυγχάνουµε να απορρίψουµε την H 0 (ΠΡΟΣΟΧΗ: ποτέ δεν αποδεχόµαστε την H 0!!!) 94

Σύγκριση 2 δειγµάτων o Στην Ιατρική είναι πολύ συχνό να θέλουµε να συγκρίνουµε 2 διαφορετικούς πληθυσµούς, ως προς µια µεταβλητή. Π.χ. n Τη συστολική πίεση, σε 2 οµάδες ασθενών που έχουν n λάβει διαφορετική θεραπεία Το ύψος, µεταξύ ανδρών και γυναικών o Για το λόγο αυτό συγκρίνουµε τα δείγµατά µας και βάση των αποτελεσµάτων, εξάγουµε συµπεράσµατα για τους ευρύτερους πληθυσµούς από τους οποίους προέρχονται τα δείγµατα (πληθυσµοί αναφοράς) 95

t-test για ανεξάρτητα δείγµατα o Ο έλεγχος που χρησιµοποιείται στην περίπτωση αυτή λέγεται t-test o Δυό δείγµατα είναι ανεξάρτητα αν αποτελούνται από διαφορετικά άτοµα που δεν έχουν σχέση µεταξύ τους. n Π.χ δεν είναι ανεξάρτητα αν όλα τα άτοµα ανήκουν και στο ένα και στο άλλο δείγµα n Ή αν π.χ. έχουµε πάρει δίδυµα αδέρφια, και το ένα παιδί ανήκει στη µια οµάδα και το άλλο στην άλλη 96

t-test: Προϋποθέσεις o Έστω ότι θέλουµε να συγκρίνουµε δύο διαφορετικές µέσες τιµές, που προέρχονται από δύο ανεξάρτητους πληθυσµούς. n Προϋποθέσεις: o Η µεταβλητή που µας ενδιαφέρει ακολουθεί την κανονική κατανοµή και στους 2 πληθυσµούς. o Οι τυπικές αποκλίσεις δεν διαφέρουν. n Ελέγχουµε αν η µια δεν είναι διπλάσια της άλλης, ή µεγαλύτερη 97

Εφαρµογή o Μετρήθηκαν τα επίπεδα σιδήρου στον ορό δύο οµάδων παιδιών. Η οµάδα Α αποτελείται από υγιή παιδιά και η οµάδα Β αποτελείται από παιδιά που πάσχουν από κυστική ίνωση. o Να διερευνηθεί αν οι µέσες τιµές σιδήρου στις δύο οµάδες είναι ίσες. o Το πρώτο βήµα είναι να ελέγξουµε αν οι µετρήσεις σιδήρου ακολουθούν την κανονική κατανοµή και στα 2 δείγµατα n Ελέγξαµε τα ιστογράµµατα, και οι δύο κατανοµές προσεγγίζουν την κανονική κατανοµή. 98

(συνέχεια) o Έχουµε: n Οµάδα A: o µ 1 =18,9 µmol/l o n 1 =9 o SD 1 =5,9 µmol/l n Οµάδα B: o µ 2 =11,9 µmol/l o n 2 =13 o SD 2 =6,3 µmol/l 99

(συν.) o Είναι οι 2 δειγµατικές µέσες τιµές µας ίσες; n Προφανώς όχι (18,9 11,9), αλλά δεν µας ενδιαφέρουν οι δειγµατικές τιµές!! n Μας ενδιαφέρει αν οι πραγµατικές µέσες τιµές µπορεί να είναι ίσες! 100

(συνέχεια) o Έτσι, έχουµε δύο υποθέσεις: n H 0 : µ 1 =µ 2 (Μηδενική υπόθεση) n H A : µ 1 µ 2 (Εναλλακτική υπόθεση) o Είναι πιθανό η παρατηρούµενη διαφορά στις δύο δειγµατικές µέσες τιµές (18.9 και 11.9) να οφείλεται σε τυχαίες διακυµάνσεις (αλλά κατά βάση οι 2 µέσες τιµές να είναι ίσες στον πληθυσµό); o Ή πρέπει να συµπεράνουµε ότι η παρατηρούµενη διαφορά στις δειγµατικές µέσες τιµές οφείλεται σε διαφορετικές πραγµατικές µέσες τιµές των δύο πληθυσµών υπό έλεγχο; 101

(συνέχεια) o Η αντίστοιχη p-value=0,006 (αυτή µας τη δίνει το στατιστικό πρόγραµµα) o Επειδή p-value<0,05, απορρίπτουµε την H 0 στο επίπεδο σηµαντικότητας 0,05. Άρα, η διαφορά στις µέσες τιµές σιδήρου ανάµεσα στις 2 οµάδες είναι στατιστικά σηµαντική. n Συµπέρασµα: Προκύπτει ότι τα παιδιά µε κυστική ίνωση έχουν διαφορετική µέση τιµή σιδήρου στον ορό, από τα υγιή παιδιά (σε όλο τον πληθυσµό αναφοράς) n Προσοχή: δεν συµπεραίνουµε ποιά οµάδα έχει υψηλότερα επίπεδα σιδήρου!!! 102

95% διάστηµα εµπιστοσύνης o Τα στατιστικά πακέτα (όπως το SPSS) εκτιµάνε το 95% ΔΕ για τη διαφορά των δύο µέσων τιµών o Στο προηγούµενο παράδειγµα το 95% είναι: (1.4, 12.6) o Οπότε, είµαστε 95% σίγουροι ότι το διάστηµα (1.4, 12.6) καλύπτει την πραγµατική διαφορά στις µέσες τιµές σιδήρου, στους δύο διαφορετικούς πληθυσµούς o Προσέξτε ότι το παραπάνω διάστηµα δεν περιλαµβάνει το 0, οπότε συµβαδίζει µε τον έλεγχο υπόθεσης στο επίπεδο του 0,05 103

99% διάστηµα εµπιστοσύνης o Αν ενδιαφερόµαστε για το 99% ΔΕ; 104

Εφαρµογή 2 o Σε µια έρευνα για τη διάρκεια του 2ου σταδίου του τοκετού συγκρίθηκαν τα ιστορικά τοκετού 10 παιδιών, που πέθαναν ξαφνικά (οµάδα Α), µε τα ιστορικά 10 παιδιών που αποτέλεσαν τη συγκριτική οµάδα (οµάδα Β), ως προς τη διάρκεια του 2ου σταδίου του τοκετού (δεν απαιτείται το n1 να είναι ίσο µε n2). Οι µετρήσεις ήταν: Διάρκεια σε λεπτά Οµάδα Α: 30 25 16 18 15 13 10 25 15 10 Οµάδα Β: 13 20 50 17 45 35 10 28 19 25 105

(συν.) o Ελέγξαµε τις κατανοµές της διάρκειας τοκετού στις 2 οµάδες, και είδαµε ότι και στις 2 περιπτώσεις ακολουθούν την κανονική κατανοµή n Ο έλεγχος έγινε µε το ιστόγραµµα o Οπότε η πρώτη προϋπόθεση του t-test ικανοποιείται 106

(συνέχεια) o Η µέση τιµή της διάρκειας του 2ου σταδίου του τοκετού της οµάδας Α είναι: µ 1 = Σx i 30 + 25 +... + 10 = = 17,7 min n 10 1 o Η µέση τιµή της διάρκειας του 2ου σταδίου του τοκετού της οµάδας Β είναι: Σ n x i µ 2 = = 26,2 min 2 13 + 20 +... + 25 = 10 107

(συνέχεια) o Υπολογισµός των τυπικών σφαλµάτων: SD 1 =6,8 και SD 2 =13,99. Παρατηρούµε ότι το SD 2 είναι υπεριπλάσιο του SD 1 o Άρα, δεν πληρούνται και οι 2 προϋποθέσεις εφαρµογής του t-test. o Έτσι, στην περίπτωση αυτή δεν µπορούµε να εφαρµόσουµε τον έλεγχο t-test. o Θα µάθουµε παρακάτω άλλη µέθοδο που µπορούµε να χρησιµοποιήσουµε n Πρός το παρόν, δεν µπορούµε να κάνουµε κάτι..., 108

Διάστηµα εµπιστοσύνης για τη διαφορά των µέσων τιµών o Στην περίπτωση του t-test, τα στατιστικά προγράµµατα υπολογίζουν το 95% ΔΕ για τη διαφορά των µέσων τιµών των 2 οµάδων o Αυτή ερµηνεύεται: µε 95% πιθανότητα, η διαφορά των µέσων τιµών των 2 οµάδων στο γενικό πληθυσµό βρίσκεται µεταξύ (, ) 109

Σχέση µεταξύ ορίων αξιοπιστίας και στατιστικής σηµαντικότητας o Στενή σχέση µεταξύ των δύο o Μια διαφορά είναι στατιστικά σηµαντική στο επίπεδο του 5% αν και µόνο αν το διάστηµα αξιοπιστίας δεν περιλαµβάνει την τιµή που καθορίζεται από τη µηδενική υπόθεση (στα παραδείγµατα που κάναµε ήταν ότι η διαφορά είναι ίση µε 0). o Αυτό οφείλεται στο ότι και οι δύο µέθοδοι βασίζονται σε παρόµοια προσέγγιση της θεωρητικής κατανοµής του στατιστικού ελέγχου. o Το διάστηµα αξιοπιστίας εκφράζει καλύτερα την αβεβαιότητα και παρέχει περισσότερες πληροφορίες. 110

Μηδενική υπόθεση στο t-test o Στο t-test για τη σύγκριση 2 µέσων τιµών αρχικά υποθέτουµε ότι δεν υπάρχει πραγµατική διαφορά µεταξύ των µ 1 και µ 2 (Η 0 ), δηλαδή µ 1 =µ 2 o Αν µετά τη στατιστική δοκιµασία καταλήξουµε σε πολύ µικρή p-value (< 0,05), απορρίπτουµε την Η 0 και αποδεχόµαστε την Η Α n Στην περίπτωση αυτή δείχνουµε ότι ισχύει η Η Α o Αν όχι (p-value > 0,05), τότε αποτυγχάνουµε να απορρίψουµε την Η 0 n Στην περίπτωση αυτή δε δείχνουµε ΤΙΠΟΤΑ 111

Μηδενική υπόθεση στο t-test o Αυτό, γιατί ποτέ δεν µπορούµε να είµαστε σίγουροι για το τι συµβαίνει. Βρήκαµε, δηλαδή, p-value>0,05 γιατί: 1. Όντως ισχύει η Η 0 ; 2. Έχουµε µικρό δείγµα, µε αποτέλεσµα να µην έχουµε ικανοποιητική ισχύ; 112

Παράδειγµα στο SPSS o Στη συνέχεια, θέλουµε να ελέγξουµε αν ο µέσος ηµερήσιος αριθµός τσιγάρων διαφέρει µεταξύ ανδρών και γυναικών, σε κάποιο συγκεκριµένο πληθυσµό αναφοράς 113

114

115

Παράδειγµα, µε 2 ανεξάρτητα δείγµατα Group Statistics # of cigaretes / day Sex of Subjects Male Female Std. Error N Mean Std. Deviation Mean 941 26,05 16,690,544 655 18,54 12,510,489 Independent Samples Test # of cigaretes / day Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2- tailed) t- test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper 49,312,000 9,757 1594,000 7,50,769 5,996 9,013 10,261 1585,345,000 7,50,731 6,070 8,939 P-value < 0,001 116

(συν.) o Η 0 : µ 1 =µ 2, όπου µ 1 ο µέσος ηµερήσιος αριθµός τσιγάρων για τους άνδρες και µ 2 για τις γυναίκες o p-value<0,001, οπότε p-value<0,05 o Άρα, απορρίπτουµε την Η 0 και συµπεραίνουµε ότι ο µέσος ηµερήσιος αριθµός τσιγάρων ανδρών και γυναικών διαφέρει στατιστικά σηµαντικά, στο γενικό πληθυσµό 117

(συν.) o 95% ΔΕ: (5,996, 9,013) o Άρα, είµαστε 95% σίγουροι ότι η µέση ηµερήσια διαφορά τσιγάρων που καπνίζουν τα 2 φύλα είναι µεταξύ (5,996, 9,013), στο γενικό πληθυσµό 118

t-test για παρατηρήσεις κατά ζεύγη (paired t-test) o Μερικές φορές οι παρατηρήσεις των 2 συγκρινόµενων οµάδων εµφανίζουν ατοµική αντιστοιχία (δηλαδή, δεν είναι ανεξάρτητες). n o Π.χ. n n Για κάθε παρατήρηση στην 1 η οµάδα υπάρχει µια αντίστοιχη παρατήρηση στη 2 η οµάδα Μέτρηση της συστολικής αρτηριακής πίεσης στα ίδια άτοµα, πρίν και µετά από σωµατική άσκηση. Σύγκριση της αποτελεσµατικότητας 2 φαρµάκων στους ίδιους ασθενείς. o Τότε οι συγκρίσεις πρέπει να γίνονται κατά ζεύγη. 119

(συνέχεια) o Αυτή η αντιστοιχία χρησιµοποιείται για να ελαττώσει την επιρροή από εξωτερικούς παράγοντες που αυξάνουν τη µεταβλητότητα των µετρήσεων o Αν οι µετρήσεις γίνονται στα ίδια άτοµα, τότε ένα σηµαντικό µέρος της βιολογικής µεταβλητότητας που υπάρχει µεταξύ ανθρώπων εξαφανίζεται o Αυτό έχει σαν αποτέλεσµα πιο ακριβείς συγκρίσεις 120

(συνέχεια) o Μερικές φορές οι µετρήσεις δε γίνονται στα ίδια άτοµα, αλλά σε εξοµοιωµένα (matched) άτοµα. o Έτσι, είναι δυνατόν να χορηγηθούν τα συγκρινόµενα άτοµα σε δίδυµα αδέρφια, ή σε άτοµα του ίδιου φύλου, ηλικίας, βάρους, κτλ. o Τότε, πάλι οι συγκρίσεις πρέπει να γίνονται κατά ζεύγη. 121

Εφαρµογή o Πέντε άτοµα που έπασχαν από µια νόσο θερµοµετρήθηκαν το πρωί (οµάδα Α) και το βράδυ (οµάδα Β) της ίδιας µέρας. Οι τιµές της θερµοκρασίας (σε ο C) ήταν: Άτοµο 1 ο 2 ο 3 ο 4ο 5 ο Πρωινή θερµ. 37.1 37.4 37.2 37.3 37.0 Βραδυνή θερµ. 37.8 38.2 38.1 38.1 37.6 o Υπάρχει διαφορά µεταξύ πρωινής και βραδινής θερµοκρασίας; 122

(συν.) o Στο παράδειγµά µας οι παρατηρήσεις εµφανίζουν ατοµική αντιστοιχία (κάθε άτοµο έχει παρατήρηση και στις 2 οµάδες). o Άρα, για τον έλεγχο της διαφοράς των µέσων τιµών της θερµοκρασίας µεταξύ των οµάδων Α και Β ενδείκνυται η εφαρµογή του t-test κατά ζεύγη. 123

(συν.) o Η δοκιµασία t-test κατά ζεύγη λαµβάνει υπόψη τις διαφορές των παρατηρήσεων σε κάθε ζευγάρι. o Για τον έλεγχο αυτό, θα υπολογίσουµε τις διαφορές των αντίστοιχων θερµοµετρήσεων. Άτοµο 1 ο 2 ο 3 ο 4 ο 5 ο Διαφορά θερµ. (δ) 0.7 0.8 0.9 0.8 0.6 124

Μηδενική και εναλλακτική υπόθεση o Η µηδενική και η εναλλακτική υπόθεση στο t-test κατά ζεύγη είναι για τη µέση διαφορά δ. o H 0 : δ=0 (µηδενική υπόθεση) o H A : δ 0 (εναλλακτική υπόθεση) όπου: δ=µέση τιµή (βραδυνή θερµ. πρωινή θερµ.) 125

(συν.) o Το αντίστοιχο p-value είναι 0,023. Άρα τι συµπεραίνουµε; 126

(συν.) o Ποιά ήταν η µηδενική υπόθεση στο προηγούµενο παράδειγµα; n n H µέση βραδυνή θερµοκρασία και η µέση πρωινή θερµοκρασία δεν διαφέρουν στατιστικά, ή Η διαφορά της µέσης βραδυνής θερµοκρασίας από τη µέση πρωινή θερµοκρασία δεν είναι στατιστικά διαφορετική από το 0, ή n µ 1 =µ 2 o Άρα, συµπεραίνουµε ότι η µέση βραδινή θερµοκρασία διαφέρει από τη µέση πρωινή (µε πιθανότητα 5% το εύρηµα αυτό να είναι τυχαίο). 127

(συν.) o Το 95% ΔΕ για τη διαφορά είναι: (0,621, 0,899) o Παρατηρείστε ότι το 0 δεν περιλαµβάνεται στο 95% ΔΕ (όπως αναµενόταν)... 128

(συν.) o o Αν θέλαµε το 99% ΔΕ για τη διαφορά; Το 99% ΔΕ της διαφοράς είναι: (0,53, 0,99) o Παρατηρείστε ότι n το 0 δεν περιλαµβάνεται στο 99% διάστηµα αξιοπιστίας n το νέο διάστηµα έχει µεγαλύτερο εύρος, όπως αναµενόταν. Πριν ήταν: (0.62, 0.90) 129

Παράδειγµα o Στη συνέχεια θα ελέγξουµε αν ο δείκτης µάζας σώµατος (ΔΜΣ)) στον πληθυσµό αναφοράς µεταβλήθηκε από το 2001 στο 2006. o Για το λόγο αυτό επιλέξαµε ένα δείγµα 1615 ατόµων από τον πληθυσµό αυτό, και µετρήσαµε το ΔΜΣ το 2001 και το 2006. o Το δείγµα θα µας βοηθήσει να βγάλουµε συµπεράσµατα για τον πληθυσµό αναφοράς. 130

131

Σύγκριση του ΔΜΣ των ιδίων ατόµων σε 2 διαφορετικές χρονικές περιόδους (2001 και 2006). 132

Παράδειγµα Διαφορά µέσων τιµών δύο εξαρτηµένων δειγµάτων. Paired Samples Statistics Pair 1 Body Mass Index (kg/m2) bmi06 Mean N Std. Deviation Std. Error Mean 25,7829 1615 3,69540,09195 26,1831 1615 3,59815,08954 Paired Samples Test Pair 1 Body Mass Index (kg/m2) - bmi06 Mean Std. Deviation Paired Differences 95% Confidence Interval of the Difference Std. Error Mean Lower Upper t df Sig. (2-tailed) -,40015 4,21030,10477 -,60565 -,19466-3,819 1614,000 95% ΔΕ για τη διαφορά των µέσων τιµών ΔΜΣ p-value 133

t-test κατά ζεύγη ή απλό t-test; o Αν αντί γιά t-test κατά ζεύγη στο προηγούµενο παράδειγµα χρησιµοποιούσαµε το απλό t-test θα ήταν λάθος; n Δεν θα ήταν λάθος, αλλά σε περιπτώσεις παρατηρήσεων κατά ζεύγη ενδείκνυται το t-test κατά ζεύγη n Στις περιπτώσεις αυτές, η δοκιµασία αυτή είναι πιό ισχυρή από το απλό t-test, o Δηλαδή, τεκµηριώνει µε µικρότερο αριθµό παρατηρήσεων την ενδεχόµενη στατιστική σηµαντικότητα µιας πραγµατικής διαφοράς. 134

t-test κατά ζεύγη ή απλό t-test; o Αυτό σηµαίνει όταν αν έχουµε ένα σχετικά µικρό δείγµα και υπάρχει πραγµατική διαφορά στις µέσες τιµές που εξετάζουµε στον πληθυσµό, τότε µπορεί: o Αν χρησιµοποιήσουµε το t-test κατά ζεύγη να βρούµε στατιστικά σηµαντικό αποτέλεσµα o Αν χρησιµοποιήσουµε το απλό t-test να µη βρούµε στατιστικά σηµαντικό αποτέλεσµα 135

Πολλαπλές συγκρίσεις o Αν ένα αποτέλεσµα είναι στατιστικά σηµαντικό στο επίπεδο του 5%, αυτό σηµαίνει ότι: αν ισχύει η Η 0, τότε αυτό το αποτέλεσµα θα προέκυπτε από τύχη στο 5% των περιπτώσεων o Αν κατά τη διάρκεια µιας έρευνας επιχειρούνται πολλαπλές συγκρίσεις µεταξύ διαφόρων οµάδων, τότε υπάρχει αυξηµένη πιθανότητα ανάδειξης στατιστικά σηµαντικών ευρηµάτων ακόµα και αν δεν υπάρχει διαφορά (δηλ. από τύχη...) 136

Πολλαπλές συγκρίσεις o Έτσι, αν π.χ. γίνουν 100 συγκρίσεις µεταξύ οµάδων των οποίων οι µέσες τιµές δε διαφέρουν µεταξύ τους (δηλαδή ισχύει η Η 0 ), αναµένεται ότι σε 5 από αυτές θα προκύψει στατιστικά σηµαντικό αποτέλεσµα (σφάλµα τύπου 1), λόγω των πολλαπλών συγκρίσεων n Δηλαδή, ενώ γνωρίζουµε ότι δεν υπάρχει διαφορά στις µέσες τιµές, θα βρούµε στατιστικά σηµαντικό αποτέλεσµα o Στην πράξη προσπαθούµε όσο µπορούµε να αποφεύγουµε τις πολλαπλές συγκρίσεις 137

Πολλαπλές συγκρίσεις o Ένας τρόπος να το πετύχουµε αυτό, είναι να προγραµµατίσουµε από την αρχή της έρευνας τι ακριβώς θέλουµε να κάνουµε στη στατιστική ανάλυση n Και να µην κάνουµε επιπλέον πράγµατα στη συνέχεια o Αν αυτό δεν είναι δυνατό, υπάρχουν µέθοδοι που διορθώνουν τις συνέπειες αυτές των πολλαπλών συγκρίσεων (π.χ. διορθώσεις Bonferroni, µέθοδος Duncan ) 138

Κανονική κατανοµή o Στη Στατιστική και τη Βιοστατιστική, η πιο χρήσιµη κατανοµή είναι η κανονική κατανοµή o Αυτή χαρακτηρίζεται πλήρως από τη µέση τιµή και την τυπική της απόκλιση

(συν.) o Το επόµενο γράφηµα απεικονίζει διάφορες µεταβλητές που ακολουθούν την κανονική κατανοµή, και έχουν διαφορετική µέση τιµή και τυπική απόκλιση

141

Κανονική κατανοµή o Έστω, ότι µας ενδιαφέρει αν µια µεταβλητή ακολουθεί ή όχι την κανονική κατανοµή o Το πρώτο βήµα για να αποφασίσουµε, είναι να κατασκευάσουµε το ιστόγραµµά της, και να ελέγξουµε οπτικά πόσο κοντά είναι στην κανονική κατανοµή o Π.χ., στο επόµενο ιστόγραµµα δίνεται η κατανοµή πνευµονικών µετρήσεων (FEV1)

(συν.) o Με βάση το ιστόγραµµα, τι συµπέρασµα βγάζετε; 144

(συν.) o Κάτι άλλο που µπορούµε να κάνουµε στη συνέχεια για έλεγχο της κανονικότητας, είναι να χρησιµοποιήσουµε τον έλεγχο των Kolmogorov- Smirnov o Η 0 : Η µεταβλητή µας ακολουθεί την κανονική κατανοµή o Η Α : Η µεταβλητή µας δεν ακολουθεί την κανονική κατανοµή o Στην περίπτωση αυτή, δεν θέλουµε να απορρίψουµε την µηδενική υπόθεση

146

147

148

Οπότε, p-value=0,200. Οπότε, δεν µπορούµε να απορρίψουµε τη µηδενική µας υπόθεση. Άρα δεν έχουµε ιδιαίτερες ενδείξεις ότι η µεταβλητή µας δεν ακολουθεί την κανονική κατανοµή... 149

(συν.) o Χρειάζεται να τονίσουµε ότι ο έλεγχος των Kolmogorov-Smirnov παρουσιάζει αρκετά προβλήµατα, µιας και: n Αν έχουµε µικρό δείγµα, ο έλεγχος αυτός δεν έχει αρκετή ισχύ για να απορρίψει την Η 0. Έτσι θα καταλήξουµε στο ότι έχουµε κανονική κατανοµή n Σε µεγάλα δείγµατα, ακόµα και µικρές αποκλίσεις από τη κανονική κατανοµή θα έχουν σαν αποτέλεσµα ο έλεγχος να απορρίπτει την κανονική κατανοµή 150

(συν.) o Πρακτικά, λοιπόν, δεν είναι και πολύ καλός έλεγχος! n Επικίνδυνο να βασιστείς πάνω του o Οπότε, τι κάνουµε στην πράξη; o Στην περίπτωση που έχουµε ένα ικανοποιητικό ιστόγραµµα και πάνω από 50 παρατηρήσεις (ανά οµάδα), τότε συνήθως αποδεχόµαστε την κανονικότητα της µεταβλητής µας. 151

(συν.) o Αν έχουµε µια ποσοτική µεταβλητή και µικρό µέγεθος δείγµατος (λιγότερες από 30 παρατηρήσεις), τότε είναι καλύτερα να χρησιµοποιούµε µη-παραµετρικές µεθόδους n Αυτές θα τις δούµε στη συνέχεια 152

Έλεγχος ανεξαρτησίας 2 ποιοτικών χαρακτηριστικών o Παράδειγµα n η παρουσία καρκίνου δεν εξαρτάται από το φύλο (Η ο ) n η παρουσία καπνίσµατος δεν εξαρτάται από το µορφωτικό επίπεδο: καθόλου δηµοτικό γυµνάσιο - λύκειο ΑΕΙ/ΤΕΙ (Η ο ) o Μπορούµε να χρησιµοποιήσουµε το t-test; 153