ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

Σχετικά έγγραφα
ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

20/12/2016. Συνεχής Ασυνεχής

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αναλυτική Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισόδημα Κατανάλωση

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Βιοστατιστική ΒΙΟ-309

Kruskal-Wallis H

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Απλή Παλινδρόμηση και Συσχέτιση

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Βιοστατιστική ΒΙΟ-309

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

9. Παλινδρόμηση και Συσχέτιση

Βιοστατιστική ΒΙΟ-309

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Περιγραφική Στατιστική

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Γ. Πειραματισμός - Βιομετρία

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Χ. Εμμανουηλίδης, 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

I2. Αριθμητικά περιγραφικά μέτρα

Διάστημα εμπιστοσύνης της μέσης τιμής

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Γ. Πειραματισμός Βιομετρία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Ενδεικτικές ασκήσεις ΔΙΠ 50

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Βιοστατιστική Ι. Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

09_Μη παραμετρικοί έλεγχοι υποθέσεων. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Στατιστική Επιχειρήσεων Ι

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Κατανομή συχνοτήτων. Μέτρα κεντρικής τάσης. Μέτρα διασποράς. Σφάλματα μέτρησης. Εγκυρότητα. Ακρίβεια

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Γ. Πειραματισμός Βιομετρία

Στατιστική ανάλυση αποτελεσμάτων

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΣΥΧΝΟΤΗΤΑΣ ΥΔΡΟΛΟΓΙΚΩΝ ΦΑΙΝΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

Περιεχόμενα. Πρόλογος... 15

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισαγωγή στην Εκτιμητική

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Transcript:

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού Με τις στατιστικές μεθόδους επιδιώκεται αφενός η συνοπτική αλλά εμπεριστατωμένη παρουσίαση των ευρημάτων μιας μελέτης (περιγραφική στατιστική) και αφετέρου η συναγωγή συμπερασμάτων που βασίζονται στα ευρήματα αυτά (συμπερασματολογική στατιστική / επαγωγική στατιστική) Πιθανότητα (P, Probablty) είναι μέτρο του πόσο αναμενόμενο να συμβεί ένα γεγονός ή μια θέση (ισχυρισμός) να είναι αληθής. Οι πιθανότητες παίρνουν τιμές μεταξύ 0 (δεν θα συμβεί) και (θα συμβεί). Όσο μεγαλύτερη η πιθανότητα ενός γεγονότος, τόσο βέβαιοι είμαστε ότι θα συμβεί. Ως μεταβλητή θεωρούμε κάθε χαρακτηριστικό το οποίο μπορεί να μεταβληθεί ή να διαφοροποιηθεί κατά μήκος του χρόνου, απότόποσετόπο, από άτομο σε άτομο ή από ομάδα σε ομάδα (π.χ. ηλικία, ύψος, εισόδημα, συγκέντρωση χοληστερόλης, αρτηριακή πίεση, ρυθμό γεννητικότητας κτλ) Ποιοτική ονομάζεται η μεταβλητή που περιγράφει κάποιο ποιοτικό χαρακτηριστικό ενός ατόμου ή μιας ομάδας. Ποσοτική ονομάζεται η μεταβλητή που μπορεί να μετρηθεί με τη συνήθη έννοια του όρου Συνεχής Ασυνεχής Ως ανεξάρτητη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζει μια άλλη μεταβλητή. Ως εξαρτημένη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζεται από μια άλλη μεταβλητή.

ΠΕΡΙΓΡΑΦΗ ΔΕΔΟΜΕΝΩΝ Γραφικές μέθοδοι Ραβδογράμματα - Ιστογράμματα (Συχνότητα) Κυκλικά διαγράμματα Διαγράμματα πλαισίου Αριθμητικοί στατιστικοί δείκτες ή μέτρα (statstcs) Κεντρικής τάσης - Μέση τιμή (mea) - Διάμεσος (meda) - Επικρατούσα τιμή (mode) Διασποράς - Εκατοστημόρια ή ποσοστιαία σημεία (percetles) - Διακύμανση ή Διασπορά (Varace) - Τυπική απόκλιση (stadard devato) Διάγραμμα πίτας (Pe chart) Ραβδόγραμμα (bar chart) Διάγραμμα πλαισίου (Bo plot) Ma Ιστόγραμμα (Hstogram) 75% 5% Meda M

Μέση τιμή : (mea ή average) N N Διάμεσος : (meda) - Ταξινόμηση των μετρήσεων κατά μέγεθος - Επιλογή της τιμής στο μέσον των μετρήσεων Επικρατούσα τιμή : Η συχνότερη τιμή (mode) 3

Εκατοστημόρια ή ποσοστιαία σημεία (percetles) - Διατάσσουμε τα δεδομένα κατά τάξη μεγέθους - Το p-εκατοστημόριο είναι η τιμή που έχει p% των μετρήσεων μικρότερες από αυτήν Τεταρτημόρια (quartles) Ειδικά εκατοστημόρια - Q 5% - Q 50% - Q 3 75% 4

ΜΕΤΡΑ ΤΗΣ ΔΙΑΣΠΟΡΑΣ Έκταση ή εύρος (rage) : ma - m ( ) Διακύμανση Διασπορά (varace) : s Πληθυσμού «σ» Δείγματος «s» N N Τυπική απόκλιση (stadard devato) : s N ( ) N Συντελεστής διακύμανσης (coeffcet of varace) : 00% s % CV Accurate but mprecse accurate but precse Accurate ad precse Precso: ορθότητα ή επαναληψιμότητα Accuracy: ακρίβεια 5

f ( μ ) σ ( ) Κανονική κατανομή e πσ Ν(μ,σ ) X μ Z σ / Ν(0,) f ( ) e π 6

Κεντρικό οριακό θεώρημα (cetral lmt theorem) Για αρκούντως μεγάλα δείγματα από έναν πληθυσμό, οι μέσες τιμές ακολουθούν περίπου την κανονική κατανομή, ανεξάρτητα από το είδος της κατανομής του πληθυσμού. Όσο μεγαλύτερα τα δείγματα τόσο καλύτερα προσεγγίζεται η κανονική κατανομή. 7

ΕΚΤΙΜΗΤΙΚΗ Εκτίμηση σε σημείο Δίνουμε τους αριθμητικούς δείκτες του δείγματος ως προσεγγιστική (αβέβαιη) εκτίμηση αυτών του πληθυσμού εκτιμώμενο τυπικό σφάλμα : s ) τυπικό σφάλμα : σ Εκτίμηση σε διαστήματα εμπιστοσύνης (cofdece tervals) Δίνουμε ένα διάστημα μέσα στο οποίο αναμένεται με συγκεκριμένη πιθανότητα να εμπίπτει μια παράμετρος του πληθυσμού Στάθμη σημαντικότητας (σ.σ): -a 00(-a)% δ.ε. μ ± t s ) s N ) σ N Διάστημα εμπιστοσύνης για τη μέση τιμή (μεγάλα δείγματα) Η μεταβλητή Ζ ακολουθεί την κανονική κατανομή Αναζητούμε την πιθανότητα για κάποιο z από πίνακες της τυποποιημένης κανονικής κατανομής X σ σ Zα / μ X Zα α P / X μ Z σ / α/ α/ -Z α/ Z α/

Οδείκτης σωματικής μάζας Χ(kgr/m ) ενός ατόμου υπολογίζεται αν διαιρέσουμε το βάρος του με το τετράγωνο του ύψους του. Για άνδρες ηλικίας 30-40 ετών είναι γνωστό ότι Χ~N(μ,σ ). Να προσδιορισθεί το 95% δ.ε. για την σωματική μάζα μ των ανδρών εάν από τυχαίο δείγμα 49 5 ανδρών από αυτόν τον πληθυσμό προέκυψε και s 9. X Δ.ε. 95% Ζ α/ Z 0.05 (πίνακες)->.96 X 3. 96 μ X. 96 49 3 49 Διάστημα εμπιστοσύνης για τη μέση τιμή (μικρά δείγματα) Η μεταβλητή t ακολουθεί την κατανομή t Αναζητούμε την τιμή t από πίνακες για ν β.ε και a Y μ t s / X t s X t μ s Από δείγμα 5 υγιών γυναικών ηλικίας 5-40 ετών, υπολογίσθηκε για την αμυλάση του ορού ότι X 96 μονάδες/00ml και s35 μονάδες/ml. Να υπολογισθεί το 90% διάστημα εμπιστοσύνης για την αληθή τιμή της μέσης τιμής μ της αμυλάσης στον πληθυσμό των υγιών γυναικών στις ίδιες ηλικίες. Δ.ε. 90% t 4,0.05 (πίνακες)->.76 X 35. 76 μ X. 76 5 35 5

3 Διάστημα εμπιστοσύνης για τη διασπορά (μεγάλα και μικρά δείγματα) Ακολουθεί την κατανομή X Αναζητούμε τις τιμές X από πίνακες για P(X > X ν;a )a ) ( σ s X ) / ),( ( / ), ( ) ( ) ( a a s s Χ < < Χ σ

4

Διάστημα εμπιστοσύνης για τη διαφορά μέσων δύο πληθυσμών (μεγάλα ανεξάρτητα δείγματα) - Ακολουθεί την κανονική κατανομή - Αναζητούμε τις τιμές Ζ από πίνακες της τυποποιημένης κανονικής κατανομής ( X Y ) ( μ Z s s μ) s s μ μ XY ±Ζa / Διάστημα εμπιστοσύνης για τη διαφορά μέσων δύο κανονικών πληθυσμών με κοινό σ (μικρά ανεξάρτητα δείγματα) - Ακολουθεί την κατανομή t με ν ν β.ε. - Αναζητούμε την τιμή t από πίνακες για ν ν και a/ ( X Y ) ( μ μ) t s μ μ y± t s Διάστημα εμπιστοσύνης για τη διαφορά μέσων ζευγαρωτών δειγμάτων - Διαφορά δ μεταξύ των μέσων τιμών των δύο δειγμάτων - Ακολουθεί την κατανομή t με ν - β.ε. - Αναζητούμε την τιμή t από πίνακες για ν και a/ Διάστημα εμπιστοσύνης για τον λόγο των διασπορών δύο κανονικών πληθυσμών - Ακολουθεί την κατανομή F με ν, ν β.ε. - Αναζητούμε την τιμή F από πίνακες για ν, ν και a/ 5

αριθμητής 6

34.3% 34.3% -sd- -sd- ------47.7------- μ ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ (ΕΛΕΓΧΟΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ) Sgfcace testg Συγκρίνοντας δύο πληθυσμούς ) διαπιστώνουμε πάντοτε διαφορές μεταξύ των μέσων αλλά και μεταξύ των διασπορών τους s. Απηχούν πραγματικές διαφορές μεταξύ των πληθυσμών; Μηδενική υπόθεση (ull) Η 0 : Εναλλακτική υπόθεση (alteratve) Η : μ ή μ σ ή μ μ σ σ σ Σφάλμα ου είδους (α) : Πιθανότητα εσφαλμένης απόρριψης της Η 0 Σφάλμα ου είδους (β) : Πιθανότητα εσφαλμένης απόρριψης της Η

Έλεγχος για τη μέση τιμή μ (μεγάλα δείγματα), σ.σ. α y μ0 z s / δειγματικός μέσος - υποτιθέμενος μέσος τυπικό σφάλμα του δειγματικού μέσου Κ.Ο.Θ Το «z» ακολουθεί την κανονική κατανομή Για κάθε α αντιστοιχεί ένα κρίσιμο z α Η Η 0 απορρίπτεται όταν z > z α true postve result falseegatveresult true egatve result false postve result sestvty -sestvty specfcty -specfcty Έλεγχος για τη μέση τιμή μ (μικρά δείγματα), σ.σ. α t y μ 0 s / ακολουθεί την κατανομή t Έλεγχος μέσων από δύο πληθυσμούς Όταν upared t-test Δείγματα από ανεξάρτητους πληθυσμούς Διακυμάνσεις όχι σημαντικά διαφορετικές Π.χ. Σύγκριση τιμών γλυκόζης από ασθενείς δύο διαφορετικών νοσοκομείων Όταν κατά ζεύγη (pared) t-test Διακυμάνσεις όχι σημαντικά διαφορετικές Upared

Έλεγχος για διαφορά δύο μέσων τιμών (μεγάλα δείγματα), σ.σ. α ( y z ) s y s δ ακολουθεί την κανονική κατανομή Για κάθε α αντιστοιχεί ένα κρίσιμο z α Η Η 0 απορρίπτεται όταν z > z α Έλεγχος για τη διαφορά δύο μέσων τιμών (μικρά δείγματα), σ.σ. α ( y t s y ) δ ακολουθεί την κατανομή t s ( )s ( )s t-test_mmuoglobul.ls Έλεγχος σημαντικότητας για τη σύγκριση μέσων τιμών κατά ζεύγη (pared ή splt sample) ( y y) δ 0 t s / ακολουθεί την κατανομή t d s d : για τις διαφορές Έλεγχος σημαντικότητας για το «p» της διωνυμικής κατανομής (μεγάλα δείγματα) 6_7.ls Έστω επιτυχίες σε δοκιμές. Συγκρίνουμε την αναλογία / των επιτυχιών με μια δοθείσα πιθανότητα p 0 με την βοήθεια της τυποποιημένης μεταβλητής Ζ. Z p p 0 p ) 0 ( 0 3

Έλεγχος σημαντικότητας για τη διασπορά, σ.σ. α X ( ) s σ ακολουθεί την κατανομή Χ Για κάθε α και ν αντιστοιχεί ένα κρίσιμο X α;v Η Η 0 απορρίπτεται όταν Χ > X α;v Σύγκριση των διασπορών δύο πληθυσμών, σ.σ. α s F s ακολουθεί την κατανομή F Για κάθε α και ν,ν αντιστοιχεί ένα κρίσιμο F ν,ν;α Η Η 0 απορρίπτεται όταν F F ν,ν;α για s > s Η Η 0 απορρίπτεται όταν F F ν,ν;α για s < s Folate.ls Power aalyss Στατιστική ισχύς (Statstcal Power) : P β, P τουλάχιστον.80 Σφάλμα ου είδους (β) : Πιθανότητα εσφαλμένης απόρριψης της Η Ποιο μέγεθος δείγματος θα μου δώσει την απαιτούμενη ακρίβεια; 4

μ ΑΝΑΛΥΣΗ ΤΗΣ ΔΙΑΚΥΜΑΝΣΗΣ (ANOVA) Σύγκριση περισσοτέρων των δύο ανεξαρτήτων δειγμάτων από κανονικούς πληθυσμούς με ίδια διακύμανση Συνολική εκτίμηση για το αν οι μέσοι όλων των δειγμάτων είναι μεταξύ τους ίσοι ή αν τουλάχιστον ένας από αυτούς διαφέρει. Ελέγχουμε αν υπάρχει σημαντική διαφορά μεταξύ της διασποράς των μέσων τιμών και της συνολικής διασποράς των δειγμάτων. s α κ ( ) sυ ) s κ ( F τετράγωνα μεταξύ δειγμάτων τετράγωνα εντός δειγμάτων s s α υ /( κ ) /( κ ) κ κ: πλήθος δειγμάτων Hb_ANOVA.ls 5

Η 0 : 3 κ Η : Τουλάχιστον ένας από τους δειγματικούς μέσους δεν είναι ίσος με κάποιον άλλον ΠΙΝΑΚΑΣ ΑΝΑΛΥΣΗΣ ΔΙΑΣΠΟΡΑΣ Mεταβολή Μεταξύ δειγμάτων Εντός δειγμάτων Αθρ. Τετραγ. s α s υ Β.ε. κ- -κ Μέση μεταβλητ. s α /( κ ) sυ /( κ ) s s α υ F /( κ ) /( κ ) Προϋπόθεση : διασπορές των δειγμάτων ίσες. 09 3_Eample.ls αριθμητής κ- 6

ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ Προϋπόθεση όλων των «παραμετρικών δοκιμασιών» που αναφέρθηκαν είναι η «κανονικότητα» των δεδομένων. Πώς ελέγχουμε την κανονικότητα; Γράφημα συσχέτισης των ποσοστιαίων σημείων (quatles) των δεδομένων με αυτά της κανονικής κατανομής (QQ-plot). Ευθεία γραμμή κανονικότητα Έλεγχος λοξότητας (skewess) και κύρτωσης (kurtoss) συντελεστής λοξότητας: μετρά την ασυμμετρία της κατανομής >0 η δεξιά ουρά μεγαλύτερη από την αριστερή συντελεστής κύρτωσης: μετρά το πόσο πιο απότομη ή πιο επίπεδη είναι η κατανομή σε σχέση με την κανονική. >0 απότομη στο κέντρο με μακρές ουρές <0 επίπεδη στο κέντρο με μικρές ουρές Αποδεχόμαστε ότι τα δεδομένα ακολουθούν την κανονική κατανομή, αν οι συντελεστές ασυμμετρίας και κύρτωσης είναι στο διάστημα (-,). 7

ΠΟΙΟΤΙΚΑ ΔΕΔΟΜΕΝΑ Κατηγορίας (omal) --Διάταξης (ordal) Ποσοστά - Σχετικές Συχνότητες - Αναλογίες p Πλήθος εμφανίσεων κάποιου φαινομένου Σύνολο παρατηρήσεων Σε μεγάλα δείγματα ακολουθεί κανονική κατανομή Δηλ. όταν p(-p) 0 ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΑΣ ΕΝΟΣ ΔΕΙΓΜΑΤΟΣ ΜΕ ΚΑΠΟΙΑ ΑΛΛΗ (H τ.μ. παίρνει δύο τιμές) z p p p0( p0) / Διάστημα εμπιστοσύνης : 0 p ± z a / p( p) ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΑΝΕΞΑΡΤΗΤΩΝ ΔΕΙΓΜΑΤΩΝ z p p p( p) p( p)

ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΔΕΙΓΜΑΤΩΝ ΚΑΤΑ ΖΕΥΓΗ Ανάλυση χ (Μη παραμετρικός έλεγχος) Η τ.μ. παίρνει δύο τιμές (Κατηγορίες, ) - Πίνακες Ομάδα Κατηγορία Κατηγορία Σύνολο π π π π N π π π π N Σύνολο π π π π NN N - Αναμενόμενες τιμές κατ. ομάδας, θ (π π )*(π π )/N, θ (π π )*(π π )/N - Αναμενόμενες τιμές κατ. ομάδας, θ (π π )*(π π )/N, θ (π π )*(π π )/N Εξετάζουμε την τιμή της μεταβλητής : X ( π θ) ( π θ) ( π θ) ( π θ) θ θ η οποία ακολουθεί κατανομή χ με β.ε., όταν οι αναμενόμενες αναλογίες δεν είναι < 5 θ θ _square_operato.ls _square_schmerzld.ls

ΣΥΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ S ΔΕΙΓΜΑΤΩΝ ΜΕ Κ ΚΑΤΗΓΟΡΙΕΣ Ανάλυση χ Πίνακες Συνάφειας (cotgecy tables) Κατηγορία "j" Ομάδα "". k Σύνολο γραμμών π π. π k k Σ j π π. π k k Σ j...... s π s π s π sk sk Σ sj Σύνολο στηλών s Σ s Σ. sk Σ k ΝΣΣ j θ j ( s j ) ( N k j j ) s k ( π j θ j ) X θ j j β.ε. (s-)(k-) 3

4

34.3% 34.3% ------47.7------- μ 34.3% 34.3% -sd- -sd- -sd- -sd- ------47.7------- μ

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΔΟΚΙΜΑΣΙΕΣ Δεν προαπαιτούν να ακολουθούν οι πληθυσμοί κάποια κατανομή. Ενδιαφέρει μόνο η τάξη και όχι η τιμή της τυχαίας μεταβλητής. Δοκιμασία Kolmogorov Smrov (Καλής προσαρμογής, Ομογένειας) Κριτήριο των Ροών ή Wald-Wolfowtz (Δοκιμασία τυχαιότητας) Δοκιμασία προσήμου (sg test) Αθροίσματα τάξεων (rak sum test) - Δοκιμασία Wlcoo - Δοκιμασία Ma-Whthey - Δοκιμασία Kruskal-Walls ΔΟΚΙΜΑΣΙΑ ΟΜΟΓΕΝΕΙΑΣ (Kolmogorov Smrov) Ελέγχει αν δύο δείγματα προέρχονται από την ίδια κατανομή. H 0 Τα δύο δείγματα προέρχονται από την ίδια κατανομή H Τα δύο δείγματα προέρχονται διαφορικές κατανομές Χρησιμοποιεί τον δείκτη D ma F () F () F () και F () είναι οι αθροιστικές συχνότητες των δύο δειγμάτων Η μηδενική υπόθεση απορρίπτεται, όταν το D από τον πίνακα VII. D a,m, Για μεγάλα m, (>5): α0.05 D a, m, 0 Eample.ls. 36 m m α0.0 D a, m,. 63 m m

ΔΟΚΙΜΑΣΙΑ ΤΩΝ ΡΟΩΝ ή WALD-WOLFOWITZ (Δοκιμασία τυχαιότητας) Εξετάζει αν μια ακολουθία παρατηρήσεων είναι τυχαία ή όχι. Π.χ. ΕΕ ΑΑ ΕΕ ΑΑΑ Ε ΑΑΑ ΕΕΕΕ ΑΑΑ Κάθε διαδοχή ομοίων συμβόλων λέγεται «ροή». Το πλήθος των συμβόλων μιας ροής λέγεται «μήκος ροής». Στο παράδειγμα έχουμε 8 ροές 9 E, A Εάν, Ν(μ u,σ ) με Algmet.ls μ u 0 τότε το πλήθος των ροών U ακολουθεί την και U μu Z σ u σ u ( ( ) ( ) ) ΔΟΚΙΜΑΣΙΑ ΠΡΟΣΗΜΟΥ (Sg test) Ανάλογη προς τη δοκιμασία t Χρησιμοποιεί τον διάμεσο (meda) Ζευγαρωτές παρατηρήσεις H 0 : Μ M H H 0 γίνεται αποδεκτή, όταν το πλήθος των αρνητικών (Ν - ) και θετικών (Ν ) διαφορών είναι ίσο. Αυτό συμβαίνει όταν το Ν - εμπίπτει στο διάστημα εμπιστοσύνης που προβλέπεται από πίνακες της διωνυμικής κατανομής για το πλήθος των μη μηδενικών διαφορών και για συγκεκριμένο a. Sg_test.ls 3

Όρια εμπιστοσύνης για το N p (διωνυμική κατανομή), p0.05; N0 έως 99 N 0 3 4 5 6 7 8 9 0 - - - - - - 0-6 0-7 0-8 -8 0-9 -0-0 - - 3-3-3 4-3 4-4 4-5 0 5-5 5-6 5-7 6-7 6-8 7-8 7-9 7-0 8-0 8-30 9-9- 9-3 0-3 0-4 -4-5 -5-6 -7 40 3-7 3-8 4-8 4-9 5-9 5-30 5-3 6-3 6-3 7-3 50 7-33 8-33 8-34 8-35 9-35 9-36 0-36 0-37 -37-38 60-39 -39-40 3-40 3-4 4-4 -4 5-4 5-43 5-44 70 6-44 6-45 7-45 7-46 8-46 8-47 8-48 9-48 9-49 30-49 80 30-50 3-50 3-5 3-5 3-5 3-53 33-53 33-54 34-54 34-55 90 35-55 35-56 36-56 36-57 37-57 37-58 37-59 38-59 38-60 39-60 N: πλήθος μη μηδενικών διαφορών ΔΟΚΙΜΑΣΙΑ ΑΘΡΟΙΣΜΑΤΩΝ ΤΑΞΕΩΝ ΚΑΤA WILCOXON Ζευγαρωτές παρατηρήσεις ( ) H 0 : Μ M Κατατάσσουμε τις απόλυτες τιμές των διαφορών κατά αύξουσα σειρά. Η σειρά εμφάνισης των διαφορών αποτελεί την τάξη τους. Γράφουμε δίπλα σε κάθε διαφορά την τάξη της και το πρόσημό της. Αθροίζουμε τις τάξεις των θετικών διαφορών (Τ ) Αθροίζουμε τις τάξεις των αρνητικών διαφορών (Τ - ) 4

Η μηδενική υπόθεση απορρίπτεται όταν: Tm{T,T - } Τ c. (T c από τον πίνακα ΧΙ, πλήθος μη μηδενικών παρατηρήσεων) Για > 5 η Τ ακολουθεί κανονική κατανομή. μ T ( ) 4 Wlc_Sg_Rak_Sum.ls 0 Eample.ls T μt Z σ T σ T Εναλλακτικά, όταν Τ Τ - Τ - > T p (: πλήθος μη μηδενικών διαφορών) ( )( ) 4 5

Όρια ασφαλείας του δείκτη για τη δοκιμασία προσήμου αθροιστικών τάξεων κατά Wlcoo a0.05 a0.05 Πλήθος διαφορών 0 T 0.95 T 0.975 5 5-6 7 7 4 8 6 30 9 9 35 0 35 39 40 46 44 5 3 49 57 4 55 63 5 60 70 6 66 76 7 7 83 8 77 9 9 84 98 0 90 06 T p Για > 0 z p ( )( ) 6 Z p : το p εκατοστιαίο σημείο της κανονικής κατανομής ΔΟΚΙΜΑΣΙΑ ΑΘΡΟΙΣΜΑΤΩΝ ΤΑΞΕΩΝ ΚΑΤA MANN-WHITNEY (U-test) Δείγματα διαφορετικού μεγέθους, Διατάσσουμε τις παρατηρήσεις των δύο δειγμάτων σε αύξουσα σειρά, σαν να ανήκαν στον ίδιο πληθυσμό. Σημειώνουμε την τάξη κάθε παρατήρησης. Υπολογίζουμε τα αθροίσματα Τ και Τ των τάξεων για κάθε δείγμα. Τ m {T,T } Εξετάζουμε, αν το Τ εμπίπτει στα όρια αποδοχής που βρίσκουμε σε πίνακες για, και συγκεκριμένη σ.σ. Στον πίνακα το Ν είναι το του δείγματος με το μικρότερο Τ. 6

ΔΟΚΙΜΑΣΙΑ KRUSKAL - WALLIS Μη παραμετρικό ανάλογο της ANOVA H τ.μ. πρέπει να έχει συνεχή κατανομή και να είναι διατάξιμη. Χρησιμοποιούμε τις τάξεις των παρατηρήσεων και τις υποβάλουμε σε ανάλυση των διακυμάνσεων. Υπολογίζουμε τον δείκτη H ο οποίος ακολουθεί την κατανομή χ H ( ) κ j R j j 3( ) κ: πλήθος δειγμάτων, j : πλήθος του δείγματος j, Σ j R j : άθροισμα των τάξεων στο δείγμα j Για κ3 και j μέχρι 5 ανατρέχουμε στον πίνακα ΧΙΙ. 7

Στην περίπτωση πολλαπλότητας «μ» των τιμών διορθώνουμε την τιμή του Η διαιρώντας με τον αριθμό C, που λαμβάνει υπόψη το άθροισμα των κύβων των βαθμών πολλαπλότητας καθώς και το άθροισμά των: C 3 3 3 ( μ μ... μ ) ( μ μ )... 3 ρ μ ρ Παραμετρικές δοκιμασίες Δύοανεξάρτητα δείγματα Studet's t test Κατά ζεύγη Studet's t test ANOVA Συντελεστής συσχέτισης του Pearso Προϋποθέσεις παραμετρικών δοκιμασιών ) Τα δεδομένα και των δύο δειγμάτων έχουν συλλεγεί τυχαία ) Τα δεδομένα και των δύο δειγμάτων προέρχονται από πληθυσμούς με κανονική κατανομή 3) Οι διακυμάνσεις τους είναι ίσες ) Η διαφορές (d ) πρέπει να προέρχονται από πληθυσμό διαφορών με κανονική κατανομή ) Τα δεδομένα όλων των δειγμάτων έχουν συλλεγεί τυχαία ) Τα δεδομένα όλων των δειγμάτων προέρχονται από πληθυσμούς με κανονική κατανομή 3) Οι διακυμάνσεις τους είναι ίσες ) Τα δεδομένα Y για κάθε X πρέπει να έχουν συλλεγεί τυχαία από κανονική κατανομή των τιμών Y. ) Τα δεδομένα X για κάθε Y πρέπει να έχουν συλλεγεί τυχαία από κανονική κατανομή των τιμών X. Μη παραμετρικές εναλλακτικές Ma-Whtey U test Wlcoo sged rak Kruskal-Walls H test Συντελεστής συσχέτισης τάξεως του Spearma 8

ΑΠΛΗ ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ -- ΣΥΣΧΕΤΙΣΗ (Smple Lear Lear Regresso --Correlato) Εύρεση μιας μαθηματικής ευθείας που εξηγεί τα δεδομένα y α β e α : τεταγμένη επί την αρχή (tercept) β : κλίση (slope) e : τυχαίο σφάλμα : ελεγχόμενη (predctor) y : απόκριση (respose) Μέθοδος ελαχίστων τετραγώνων y a b e e (y a b )

b y y a yb Προϋποθέσεις για τη χρήση της απλής γραμμικής παλινδρόμησης Τα τυχαία σφάλματα στην είναι αμελητέα Για κάθε τιμή της υπάρχει μια κανονική κατανομή τιμών της y. Η κατανομή του y για κάθε τιμή του έχει την ίδια διακύμανση Lear_Regr.ls Απλή γραμμική παλινδρόμηση Παλινδρόμηση Demg

3 ( ) s s a ) y (y s ) Τυπικό σφάλμα της εκτίμησης (stadard error of the estmato) b s s ) ( Τυπικό σφάλμα για το b δ.ε. β b ± t s b, β. ε. -, a Τυπικό σφάλμα για το a δ.ε. α a ± t s a, β. ε. -, a ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ (Multple Lear Regresso) ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ (Multple Lear Regresso) e y k k β β β α... k k k k k k e y e y e y β β β β β β β β β β β β.......... 0 0 0 Έστω δείγμα μεγέθους e X Y β

4 y y y Y... k k k X............ β β β β... e e e e... β β β β ) ) ) )... ( ) Y X X X ' ' β ) 0.4 7 6.5 0.4 6 5.7 0.4 5 4.0 0.4 4.0 0.3 7 7.5 0.3 6 6.6 0.3 5 5. 0.3 4 4.0 0. 7 8.0 0. 6 6.8 0. 5 5.5 0. 4 4.3 Σχετική υγρασία X Χρόνος έκθεσης X [h] Απώλεια βάρους Y[gr] 8.3.49 5 y )

ΜΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ (No (No Lear Lear Regresso) y k α β β... βk e ΣΥΣΧΕΤΙΣΗ (Correlato) Μέθοδος για την μέτρηση του βαθμού συμμεταβλητότητας των μεταβλητών. 5

6 Συντελεστής συσχέτισης Pearso (Correlato coeffcet) y y y y r ) ( ) ( ) )( ( Διάστημα εμπιστοσύνης (Cofdece terval) ± a t s y / ; ) ( ) ( Διάστημα πρόβλεψης (Predcto terval) ± a t s y / ; ) ( ) ( y : τιμή που προβλέπεται από την γρ. παλ. για το : μέση τιμή του : τιμή της ανεξ. μετ. για την οποία αναζητούμε την y : τιμή της ανεξ. μετ. από τις μετρήσεις )

7 r r t Δοκιμασία ανεξαρτησίας H 0 : b0, απορρίπτεται όταν t > t -;a/ b s b t Δοκιμασία μη συσχέτισης H 0 : r0, απορρίπτεται όταν t > t -;a/ Γραμμική παλινδρόμηση Demg λ U U Demg b N N N y y y y U ) )( ( ) ( ) ( λ y S S λ

Μη Μηπαραμετρική συσχέτιση Συντελεστής συσχέτισης του του Spearma Συσχετίζει τάξεις τ.μ. Έστω ζεύγη τ.μ., y. Δημιουργούμε τις διαφορές των τάξεων των ζευγών των τ.μ. r T p_spearma_0 Eer.ls d T -Ty 6 ( d ) 3 d d Δοκιμασία ανεξαρτησίας Η 0 : r T 0 5 Δεν μπορούμε να αποφανθούμε 5 < 0 Aπορρίπτουμε την Η 0 όταν r T S ;a rt > 0 To tt ακολουθεί την rt κατανομή t. Απορρίπτουμε την Η 0 όταν t T t -;a 8

ΔΙΑΣΤΗΜΑΤΑ ΑΝΑΦΟΡΑΣ ΚΑΙ ΚΑΙ ΚΛΙΝΙΚΑ ΟΡΙΑ ΟΡΙΑ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ (Referece tervals ad ad clcal clcal decso lmts) lmts) Σύγκριση εργαστηριακών αποτελεσμάτων με διαστήματα αναφοράς (δ.α.) για λήψη απόφασης Ανάγκη αξιόπιστων δ.α. για όλες τις εργ. εξετάσεις Υποδείξεις για τυποποιημένο πρωτόκολλο από την NCCLS (βασίζεται σε υποδείξεις του EPTRV) 95% ΔΑ X ± t 0.975,- sd 95% ΔΕ X ± t0. 975, sd

Από ) ΑΤΟΜΑ ΑΝΑΦΟΡΑΣ συνθέτουμε έναν ) ΠΛΗΘΥΣΜΟ ΑΝΑΦΟΡΑΣ από τον οποίον επιλέγουμε μια Η παρατηρούμενες τιμές από δείγματα ασθενών (ή όχι) συγκρίνονται με 3) ΔΕΙΓΜΑΤΙΚΗ ΟΜΑΔΑ ΑΝΑΦΟΡΑΣ στην οποία προσδιορίζουμε 4) ΤΙΜΕΣ ΑΝΑΦΟΡΑΣ στις οποίες παρατηρείται μια 5) ΚΑΤΑΝΟΜΗ ΑΝΑΦΟΡΑΣ από την οποία υπολογίζουμε 6) ΟΡΙΑ ΑΝΑΦΟΡΑΣ τα οποία μπορούν να ορίσουν 7) ΔΙΑΣΤΗΜΑΤΑ ΑΝΑΦΟΡΑΣ

Σχέδιο πρωτοκόλλου για τον προσδιορισμό Διαστημάτων Αναφοράς. Συμβουλευτείτε την ιατρική και επιστημονική βιβλιογραφία και συγκροτήστε κατάλογο με τις πιθανές βιολογικές μεταβολές και παρεμβάσεις.. Καθιερώστε κριτήρια αποκλεισμού και κατηγοριοποίησης καθώς και κατάλληλο ερωτηματολόγιο, τέτοιο ώστε να αποκαλύπτει αυτά τα κριτήρια σε άτομα που ενδεχομένως θα λειτουργήσουν ως άτομα αναφοράς. 3. Κατηγοριοποιήστε τα άτομα αναφοράς με βάση τις απαντήσεις του ερωτηματολογίου καθώς και τα αποτελέσματα από άλλες εκτιμήσεις. 4. Αποκλείστε από την δειγματική ομάδα τα άτομα που με βάση τα κριτήρια αποκλεισμού ή άλλες εκτιμήσεις, φανερώνουν έλλειψη καλής κατάστασης υγείας. 5. Επιλέξτε τα κατάλληλα άτομα αναφοράς. 6. Προετοιμάστε κατάλληλα τα άτομα αναφοράς σύμφωνα με τους κανόνες λήψης δείγματος και με συνέπεια προς τη συνηθισμένη πρακτική για ασθενείς. 7. Κάντε τις λήψεις των δειγμάτων και ετοιμάστε τα για τις αναλύσεις με τρόπο ομοιόμορφο και συνεπή προς τη συνηθισμένη πρακτική για ασθενείς. 8. Προσδιορίστε με την αντίστοιχη μέθοδο ανάλυσης και υπό καλά καθορισμένες συνθήκες τις τιμές αναφοράς. 3

9. Εξετάστε τα δεδομένα τιμών αναφοράς και κατασκευάστε ένα ιστόγραμμα. 0. Ταυτοποιήστε εσφαλμένες και περιθωριακές τιμές.. Επιλέξτε τη στατιστική μέθοδο εκτίμησης ορίων αναφοράς και προσδιορίστε τα όρια αναφοράς και το δ.α. (συμπεριλάβετε την διαίρεση σε υποομάδες για τον προσδιορισμό ξεχωριστών δ.α. αν κριθεί αναγκαίο). Καταγράψτε όλα τα προηγηθέντα βήματα και τις διαδικασίες. Παραδείγματα πιθανών κριτηρίων αποκλεισμού Κατανάλωση οινοπνεύματος Μη φυσιολογική πίεση αίματος Συχνή αιμοδοσία Κατάχρηση φαρμάκων Συνταγογραφημένα φάρμακα Νηστεία ή μη Γενετικοί παράγοντες Πρόσφατη ή τωρινή νοσηλεία Πρόσφατη ασθένεια Γαλουχία Παχυσαρκία Επάγγελμα Αντισύλληψη Εγκυμοσύνη Πρόσφατη εγχείριση Κάπνισμα Πρόσφατη μετάγγιση αίματος Κατάχρηση βιταμινών 4

Παραδείγματα πιθανών παραγόντων ομαδοποίησης Ηλικία Ομάδα αίματος Διατροφικές συνήθειες Εθνικό υπόβαθρο Σωματική άσκηση Νηστεία ή μη Γεωγραφική θέση Φυλή Φάση του έμμηνου κύκλου Φάση εγκυμοσύνης Κάπνισμα Μεταβλητές Πρό Ανάλυσης Προπαρασκευή του υποκειμένου Πρότερη δίαιτα Νηστεία ή μη Αποχή από φαρμακολογικούς παράγοντες Φαρμακευτική αγωγή Συγχρονισμός με την ανάλυση Σχέση προς βιολογικούς ρυθμούς Φυσική δραστηριότητα Περίοδος ανάπαυσης πριν την λήψη δείγματος Στρες 5

Λήψη του δείγματος Περιβαλλοντικές συνθήκες κατά την λήψη Χρονική στιγμή Στάση του σώματος Είδος δείγματος Επιλογή μέρους του σώματος για τη λήψη Προπαρασκευή του μέρους Προώθηση της ροής του αίματος Όργανα, συσκευές Τεχνική Χειρισμός του δείγματος Μεταφορά Πήξη Διαχωρισμός ορού-πλάσματος Αποθήκευση Προετοιμασία για την ανάλυση 6

Χαρακτηριστικά των αναλυτικών μεθόδων Ακρίβεια Ελάχιστο όριο ανίχνευσης Γραμμικότητα Περίοδος αποκατάστασης Αντιδραστήρια (και το νερό) Stadards βαθμονόμησης Μέθοδοι υπολογισμού Μεταβλητότητα στις παρτίδες των αντιδραστηρίων Αλλαγές του προσωπικού που μετέχει στην ανάλυση ΑΝΑΛΥΣΗ ΤΩΝ ΔΙΑΣΤΗΜΑΤΩΝ ΑΝΑΦΟΡΑΣ Διάστημα αναφοράς: Διάστημα μεταξύ δύο αριθμών (ενός άνω ορίου και ενός κάτω ορίου αναφοράς) ώστε να περιλαμβάνεται συνήθως το 95% των τιμών για τον πληθυσμό από όπου προέρχονται τα υποκείμενα αναφοράς. Για τις περισσότερες ουσίες ως κάτω και άνω όριο αναφοράς δεχόμαστε το.5ο και 97.5ο εκατοστιαίο σημείο αντίστοιχα της κατανομής των μετρήσεων. Όπου είναι απαραίτητο μόνο ένα άνω όριο αυτό είναι το 97.5ο εκατοστιαίο σημείο. 7

Στατιστικές μέθοδοι Παραμετρικές διαδικασίες Κανονική κατανομή ; Κατάλληλος μετασχηματισμός των τιμών (αν χρειασθεί). Έλεγχος προσαρμογής με χ ή Kolmogorof-Smrof. H NCCLS συστήνει Μη παραμετρικές διαδικασίες και τουλάχιστον 0 τιμές αναφοράς. (παράδειγμα) Για τα όρια αναφοράς είναι χρήσιμο να δοθούν δ.ε. α) υπενθυμίζουν για την μεταβλητότητα της εκτίμησης και παρέχουν ένα μέτρο της, β) τα δ.ε. στενεύουν καθώς το μέγεθος του δείγματος μεγαλώνει. Ο μελετητής εκτιμά καλύτερα την βελτίωση της ακρίβειας για 95% δ.α. Αντιμετώπιση περιθωριακών παρατηρήσεων Διαίρεση των τιμών αναφοράς Από στατιστικής άποψης δικαιολογείται, όταν οι μέσοι διαφέρουν σημαντικά σε επίπεδο σημαντικότητας 5%. Από κλινικής άποψης ;;; Κατά Harrs και Boyd υπάρχουν περιπτώσεις όπου η ευαισθησία της διάγνωσης επηρεάζεται από την ύπαρξη δ.α. υποομάδων. Αν η μεγαλύτερη από τις τυπ. αποκλίσεις είναι.5 φορά > από την μικρότερη, τότε θα πρέπει να υπολογίζονται ξεχωριστά δ.α. για κάθε υποομάδα. Η κρίσιμη τιμή z * με την οποία θα συγκρίνεται η υπολογιζόμενη τιμή z δίνεται από: z * 3*( aver /0) / 8

Ατομικά δ.α. Οφείλονται σε παράγοντες προ-ανάλυσης, ανάλυσης αλλά και βιολογικούς. Συνήθως η έκτασή τους είναι μικρότερη από αυτή των δ.α. πληθυσμού. Δηλ. μπορεί μια αφύσικη ατομική τιμή να εμπίπτει στο δ.α. υγιούς πληθυσμού. Επίσης θα μπορούσε ένα υγιές άτομο να δώσει τιμές που πέφτουν έξω από ένα δ.α. 95% για το πληθυσμό. Διάστημα αναφοράς για γλυκόζη (νηστείας): 95ου εκατοστιαίου σημείου 65 0 mg/dl 95% του πληθυσμού αναφοράς θα έχει γλυκόζη στο διάστημα αυτό. 9

ΘΕΩΡΙΑ ΠΡΟΓΝΩΣΤΙΚΗΣ ΤΙΜΗΣ ΑΛΗΘΩΣ ΘΕΤΙΚΟΙ (TP): Είναι ο αριθμός των ατόμων που έχουν μια συγκεκριμένη ασθένεια και που δίνουν θετικό αποτέλεσμα στην αντίστοιχη εξέταση. ΕΣΦΑΛΜΕΝΑ ΘΕΤΙΚΟΙ (FP): Είναι ο αριθμός των ατόμων χωρίς μια συγκεκριμένη ασθένεια, που όμως δίνουν θετικό αποτέλεσμα στην αντίστοιχη εξέταση. ΕΣΦΑΛΜΕΝΑ ΑΡΝΗΤΙΚΟΙ (FΝ): Είναι ο αριθμός των ατόμων που έχουν μια συγκεκριμένη ασθένεια, που δίνουν όμως αρνητικό αποτέλεσμα στην αντίστοιχη εξέταση. ΑΛΗΘΩΣ ΑΡΝΗΤΙΚΟΙ (TΝ): Είναι ο αριθμός των ατόμων χωρίς μια συγκεκριμένη ασθένεια και που δίνουν αρνητικό αποτέλεσμα στην αντίστοιχη εξέταση. ΔΙΑΓΝΩΣΤΙΚΗ ΕΥΑΙΣΘΗΣΙΑ (DIAGNOSTIC SENSITIVITY) ΤP/(TPFN), TPFN: σύνολο ατόμων με την ασθένεια Το ποσοστό των ατόμων που έχουν μια συγκεκριμένη ασθένεια και που δίνουν θετικό αποτέλεσμα στην αντίστοιχη εξέταση. ΔΙΑΓΝΩΣΤΙΚΗ ΔΙΑΚΡΙΤΙΚΗ ΙΚΑΝΟΤΗΤΑ (DIAGNOSTIC SPECIFICITY) ΤN/(FPTN), TPFN: σύνολο ατόμων χωρίς την ασθένεια Το ποσοστό των ατόμων χωρίς μια συγκεκριμένη ασθένεια που δίνουν αρνητικό αποτέλεσμα στην αντίστοιχη εξέταση.

ΠΡΟΓΝΩΣΤΙΚΗ ΤΙΜΗ ΘΕΤΙΚΟΥ ΑΠΟΤΕΛΕΣΜΑΤΟΣ (PREDICTIVE VALUE OF POSITIVE TEST) PV ΤP/(TPFP) TPFP: σύνολο ατόμων με θετικό αποτέλεσμα Το ποσοστό των αληθώς θετικών επί του συνόλου των ατόμων που δίνουν θετικό αποτέλεσμα. ΠΡΟΓΝΩΣΤΙΚΗ ΤΙΜΗ ΑΡΝΗΤΙΚΟΥ ΑΠΟΤΕΛΕΣΜΑΤΟΣ (PREDICTIVE VALUE OF NEGATIVE TEST) PV- ΤN/(FNTN) TNFN: σύνολο ατόμων χωρίς την ασθένεια Το ποσοστό των αληθώς αρνητικών επί του συνόλου των ατόμων που δίνουν αρνητικό αποτέλεσμα. ΑΠΟΤΕΛΕΣΜΑΤΙΚΟΤΗΤΑ (EFICIENCY) (ΤPTN)/(TPFPTNFN) Το ποσοστό των ατόμων που ταξινομήθηκαν σωστά με βάση τα αποτελέσματα επί του συνόλου των εξετασθέντων. ΣΥΧΝΟΤΗΤΑ ΑΣΘΕΝΕΙΑΣ (PREVALENCE) (ΤPFN)/(TPFPTNFN) Το ποσοστό των ατόμων που έχουν την ασθένεια επί του συνόλου των εξετασθέντων.

ΚΛΙΝΙΚΑ ΟΡΙΑ ΑΠΟΦΑΣΕΩΝ (CLINICAL DECISION LIMITS) Υψηλή ευαισθησία είναι επιθυμητή σε διαγνωστικές καταστάσεις όπως: - Η ασθένεια είναι σοβαρή και δεν θα πρέπει να διαφύγει - Η ασθένεια αντιμετωπίζεται - Εσφαλμένα θετικό αποτέλεσμα δεν θα προκαλούσε σοβαρό φυσικό, ψυχολογικό ή οικονομικό τραύμα στον ασθενή. Υψηλή διακριτική ικανότητα είναι επιθυμητή σε διαγνωστικές καταστάσεις όπως: - Η ασθένεια είναι σοβαρή, αλλά δεν αντιμετωπίζεται. - Η γνώση της απουσίας της ασθένειας έχει αξία από άποψη ψυχολογική καθώς και δημόσιας υγείας - Εσφαλμένα θετικό αποτέλεσμα μπορεί να προκαλούσε σοβαρό φυσικό, ψυχολογικό ή οικονομικό τραύμα στον ασθενή. 3

Υψηλή προγνωστική τιμή για θετικό αποτέλεσμα είναι σημαντική σε διαγνωστικές καταστάσεις όπως: - Αντιμετώπιση ατόμων εσφαλμένα θετικών θα είχε σοβαρές συνέπειες. Υψηλή αποτελεσματικότητα είναι επιθυμητή σε διαγνωστικές καταστάσεις όπως: - Η ασθένεια είναι σοβαρή, αλλά αντιμετωπίζεται. - Εσφαλμένα θετικά και εσφαλμένα αρνητικά αποτελέσματα βαρύνουν το ίδιο ως προς τις αρνητικές τους επιπτώσεις Ιατρικά όρια αποφάσεων (medcal decso lmts) Οι έννοιες ευαισθησία, διακριτική ικανότητα και προγνωστική τιμή χρησιμοποιούνται και στον προσδιορισμό (καθορισμό) των βέλτιστων τιμών cutoff ή ιατρικών αποφασιστικών ορίων για κάποια κλινική εργαστηριακή εξέταση. 4

Recever - Operatg characterstc Curve (ROC) Gerhardt Plot στη διάγνωση οξείας παγκρεατίτιδας 5

Gerhardt Plot στη διάγνωση οξείας παγκρεατίτιδας Εξάρτηση της διαγνωστικής αποτελεσματικότητας από την επιλογή του cutoff για τον ανοσοχημικό παράγοντα CK-MB στην διάγνωση βλάβης του μυοκαρδίου 6