Αναλυτική Στατιστική

Σχετικά έγγραφα
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Εισόδημα Κατανάλωση

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Kruskal-Wallis H

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Εισαγωγή στην Ανάλυση Δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων ΙΙ

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Απλή Παλινδρόμηση και Συσχέτιση

Γ. Πειραματισμός - Βιομετρία

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Διάστημα εμπιστοσύνης της μέσης τιμής

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Έλεγχος υποθέσεων Ι z-test & t-test

Σκοπός του μαθήματος. Έλεγχος μηδενικής υπόθεσης OR-RR. Έλεγχος μηδενικής υπόθεσης. Σφάλαμα τύπου Ι -Σφάλμα τύπου ΙΙ 20/4/2013

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Στατιστικές Υποθέσεις

Στατιστική ανάλυση αποτελεσμάτων

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Δειγματοληπτικές κατανομές

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Λειτουργικός ορισμός των μεταβλητών

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Στατιστική Επιχειρήσεων Ι

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

3.4.1 Ο Συντελεστής ρ του Spearman

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Χ. Εμμανουηλίδης, 1

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

5 o Μάθημα Έλεγχοι Υποθέσεων

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Περιεχόμενα. Πρόλογος... 15

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Μέρος IV. Ελεγχοι Υποθέσεων (Hypothesis Testing)

Το τυπικό σφάλμα του μέσου (standard error of mean) ενός δείγματος

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Μέθοδοι δειγματοληψίας, καθορισμός μεγέθους δείγματος, τύποι σφαλμάτων, κριτήρια εισαγωγής και αποκλεισμού

9. Παλινδρόμηση και Συσχέτιση

Βιοστατιστική ΒΙΟ-309

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικοί Ελεγχοι. t - Έλεγχος για τον μέσο μ ενός πληθυσμού. t-έλεγχος για την σύγκριση των μέσων δύο πληθυσμών

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Οικονομετρία. Απλή Παλινδρόμηση. Έλεγχοι υποθέσεων και διαστήματα εμπιστοσύνης των συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

Διαχείριση Υδατικών Πόρων

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Λογαριθµιστική εξάρτηση

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Γ. Πειραματισμός Βιομετρία

Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Transcript:

Αναλυτική Στατιστική

Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων (ατόμων) Χαρακτηριστικό: μέτρηση που αφορά όλα τα άτομα του πληθυσμού Δείγμα: υποσύνολο του πληθυσμού

Κλάδοι Στατιστικής Παραμετρική: οι τιμές των παρατηρήσεων ακολουθούν μια γνωστή κατανομή (π.χ. κανονική) Μη-παραμετρική: οι τιμές των παρατηρήσεων ακολουθούν κάποια μη γνωστή κατανομή

Έλεγχοι υποθέσεων Λήψη απόφασης σε κάποιο επιστημονικό πρόβλημα Υπολογισμός σφάλματος στην περίπτωση της εσφαλμένης απόφασης Σε όλους τους στατιστικούς ελέγχους υποθέσεων έχουν οριστεί οι: Μηδενική υπόθεση Η ο : η υπόθεση εκείνη την οποία καλείται να απορρίψει ο ερευνητής Απουσία σχέσης μεταξύ δύο χαρακτηριστικών Εναλλακτική υπόθεση Η 1 : η άρνηση της Η ο Παρουσία σχέσης μεταξύ δύο χαρακτηριστικών

Στρατηγική Βήματα: Καθορίζεται η Η ο Καθορίζεται μια πιθανότητα (συνήθως 0,05) η οποία είναι η μέγιστη πιθανότητα αποδεκτού σφάλματος Λαμβάνουμε ένα κατάλληλο δείγμα για τη μελέτη της ερευνητικής μας υπόθεσης Ανάλογα με τη μορφή της Η ο και την τιμή του στατιστικού κριτηρίου απορρίπτουμε την Η ο

Λήψη απόφασης Πραγματική Κατάσταση της Ηο Η Η ο είναι αληθής (Α) (αποδεκτή) Η Η ο είναι ψευδής (Ψ) (απορρίπτεται) Η Η ο είναι αληθής (Α) Σωστή απόφαση, 1-α Σφάλμα Τύπου Ι, α, επίπεδο σημαντικότητας Η Η ο είναι ψευδής (Ψ) Σφάλμα Τύπου ΙΙ, β Σωστή απόφαση 1-β, δύναμη του ελέγχου Η επιλογή της κατάλληλης στατιστικής εξαρτάται από: τη φύση της μηδενικής υπόθεσης Η ο και της εναλλακτικής υπόθεσης Η 1 τη δύναμη του ελέγχου

Επίπεδο σημαντικότητας Η ακριβής τιμή του σφάλματος Τύπου Ι για τα δεδομένα του προβλήματος (επίπεδο σημαντικότητας, p value, significance level) η πιθανότητα η ληφθείσα απόφαση να είναι υπέρ της ύπαρξης σχέσης, ενώ στην πραγματικότητα δεν υπάρχει σχέση Θέλουμε να έχει πολύ μικρή τιμή (συνήθως < 5%) Μπορεί το επίπεδο σημαντικότητας p να είναι μικρό χωρίς απαραίτητα και η συσχέτιση να είναι βιολογικά ή κλινικά σημαντική

Στατιστική ισχύς Η πιθανότητα να απορριφθεί η H o υπόθεση (δηλ. δεν υπάρχει σχέση), ενώ αυτή είναι εσφαλμένη Αυτό επιζητούμε σε κάθε έρευνα!!!

Τελική Επιλογή Υπόθεσης Ορίζουμε το επίπεδο στατιστικής σημαντικότητας α, στο οποίο θα διεξαχθεί ο έλεγχος p-value: η μικρότερη τιμή του α για την οποία απορρίπτεται η Η ο p-value < α τότε απορρίπτω την Η ο και αποδέχομαι την Η 1 p-value > α τότε δεν απορρίπτω την Η ο Προσοχή τι δηλώνει η Η ο στην ερμηνεία του αποτελέσματος!!!

Έλεγχοι Υποθέσεων για Μέσους Μέσος ενός πληθυσμού π.χ. αν το εισόδημα ενός πληθυσμού είναι 900 Η ο : μ = 900 vs. H 1 : μ 900 Μέσοι δύο πληθυσμών Αξιολόγηση ενός χαρακτηριστικού σε δύο ανεξάρτητα δείγματα π.χ. τη διαφορά της μέσης συστολικής αρτηριακής πίεσης σε άνδρες και γυναίκες Η ο : ΣΑΠ(άνδρες) = ΣΑΠ(γυναίκες) vs. H 1 : ΣΑΠ(άνδρες) ΣΑΠ(γυναίκες) Μέτρηση ενός χαρακτηριστικού στα ίδια άτομα πριν και μετά π.χ. διαφορά στο βάρος σώματος πριν και μετά την παρέμβαση Η ο : Βάρος(πριν) = Βάρος(μετά) vs. H 1 : Βάρος(πριν) Βάρος(μετά)

Όταν θέλουμε να ελέγξουμε αν η μέση τιμή μιας μεταβλητής σε μια ομάδα Α διαφέρει από τη μέση τιμή μιας άλλης ομάδας Β Η μεταβλητή πρέπει να κατανέμεται κανονικά και στις 2 ομάδες Έλεγχος για την ισότητα των διακυμάνσεων Στατιστικό κριτήριο: t-test του Student Η ο : μ1=μ2 έναντι Η 1 : μ1 μ2 (αμφίπλευρος έλεγχος) ή Η 1 : μ1>μ2 ή μ1<μ2 (μονόπλευροι έλεγχοι)

Ανάλυση Διακύμανσης Έλεγχος για την ύπαρξη διαφορών στις μέσες τιμές ενός ποσοτικού χαρακτηριστικού μεταξύ των κατηγοριών (>2) ενός άλλου χαρακτηριστικού π.χ. έλεγχος του σωματικού βάρους σε άτομα με καθιστική ζωή, με μέτρια φυσική δραστηριότητα, με έντονη φυσική δραστηριότητα Η ο : μ1 = μ2 = μ3 vs. H 1 : οι μέσοι διαφέρουν για τουλάχιστον ένα ζεύγος Η μεταβλητή πρέπει να κατανέμεται κανονικά και στις 2 ομάδες Έλεγχος για την ισότητα των διακυμάνσεων

Έλεγχοι υποθέσεων για Ποιοτικές Μεταβλητές Έλεγχος ανεξαρτησίας Χ 2 : δύο ομάδες (ασθενείς-μάρτυρες) εξετάζονται ως προς την έκθεσή τους σε κάποιο κίνδυνο Ελέγχουμε αν τα επίπεδα έκθεσης σε κάποιο παράγοντα διαφέρουν σε δύο ή περισσότερες κατηγορίες του χαρακτηριστικού π.χ. Η ο : το σύνδρομο επαγγελματικής εξουθένωσης και η επαγγελματική κατάσταση είναι ανεξάρτητες vs. H 1 : οι δύο παράγοντες δεν είναι ανεξάρτητοι

Όσο πιο μεγάλες τιμές παίρνει το κριτήριο Χ 2 τόσο πιο κοντά είμαστε στο να απορρίψουμε την Η ο Όσο πιο μικρές τιμές ( 0) παίρνει το κριτήριο Χ 2 τόσο πιο κοντά είμαστε στο να ΜΗΝ απορρίψουμε την Η ο

Το στατιστικό κριτήριο Χ2 μπορεί επίσης να χρησιμοποιηθεί για έλεγχο Ομοιογένειας: π.χ. ελέγχουμε αν η κατανάλωση αλκοόλ διαφέρει στους ασθενείς απ ότι στους υγιείς και αν αυτό επηρεάζεται από το φύλο Καλής προσαρμογής: ελέγχουμε αν η κατανομή του πληθυσμού από όπου προέρχεται το δείγμα είναι μια δεδομένη θεωρητική κατανομή (κανονική)

Συσχέτιση Εξετάζει κατά πόσο η μια μεταβλητή επηρεάζεται από την άλλη Απλή συσχέτιση: 2 μεταβλητές Πολλαπλή συσχέτιση: >2 μεταβλητές Χαρακτηριστικά: Γραμμική μη γραμμική Θετική αρνητική Πλήρης Όχι συσχέτιση

Συντελεστές συσχέτισης Εργαλεία στατιστικού ελέγχου r του Pearson (για συνεχείς και κανονικά κατανεμημένες μεταβλητές) ρ (rho) του Spearman (για διακριτές ή μη κανονικά κατανεμημένες μεταβλητές)

Συντελεστής Συσχέτισης Pearson Ενδεδειγμένος για έλεγχο γραμμικής συσχέτισης μεταξύ δύο μεταβλητών Δεν έχει μονάδες μέτρησης Όρια: -1 ρ 1-1 πλήρης αρνητική συσχέτιση +1 πλήρης θετική συσχέτιση 0 απουσία γραμμικής συσχέτισης Αν δύο μεταβλητές είναι ανεξάρτητες είναι και ασυσχέτιστες Δεν ισχύει το αντίθετο!!!

Συντελεστής Συσχέτισης Τάξεως Spearman Ενδείκνυται όταν μια από τις δύο μεταβλητές που εξετάζουμε είναι διατάξιμη Εναλλακτικός του συντελεστή συσχέτισης Pearson όταν τα δεδομένα παρουσιάζουν ασυμμετρία Όταν οι δύο μεταβλητές είναι κατηγορικές αλλά μπορούν να διαταχθούν Όρια: -1 spearman s rho 1

Συντελεστής Συμφωνίας Kendall s-tau Μετρά το βαθμό συμφωνίας μεταξύ δύο ποσοτικών ή διατάξιμων μεταβλητών Όρια: -1 kendall s tau 1

-1-0,8-0,8-0,3-0,3 +0,3 +0,3 +0,8 +0,8 +1 Ισχυρή αρνητική συσχέτιση Μέτρια αρνητική συσχέτιση Ελαφρά συσχέτιση ή ασυσχέτιστα Μέτρια θετική συσχέτιση Ισχυρή θετική συσχέτιση Η παραπάνω κατηγοριοποίηση δεν εκφράζει στατιστική σημαντικότητα Για να γνωρίζουμε αν η παρατηρηθείσα συσχέστιση είναι το ίδιο σημαντική και στον πληθυσμό πρέπει να γίνει ο κατάλληλος στατιστικός έλεγχος που θα δώσει και το αντίστοιχο σφάλμα (p)

Σύνοψη Ο συντελεστής συσχέτισης εκφράζει μόνο την «ένταση» της γραμμικής σχέσης Αν η τιμή του είναι 0 σημαίνει ότι δεν υπάρχει γραμμική συσχέτιση μεταξύ των μεταβλητών. Αυτό όμως δεν αποκλείει τη δυνατότητα να υπάρχει μη γραμμική συσχέτιση Η τιμή του συντελεστή δεν προσδιορίζει την ευθεία γύρω από την οποία συγκεντρώνονται τα σημεία του διαγράμματος. Δηλαδή δεν προσδιορίζει την κλίση και το σταθερό όρο της ευθείας Ο συντελεστής συσχέτισης δίνει ένα μέτρο της γραμμικής συσχέτισης των μεταβλητών Χ και Υ αλλά δεν προσδιορίζει την αιτιώδη σχέση που τις συνδέει, δηλαδή δεν προσδιορίζει ποιο είναι το αίτιο και ποιο το αποτέλεσμα Έτσι είναι δυνατόν η Χ να επηρεάζει την Υ, ή αντίστροφα ή και τα δύο να συμμεταβάλονται διότι εξαρτώνται από μια

Γραμμική Παλινδρόμηση (Ι) Τεχνική που προσδιορίζει ποια η αιτία και ποιο το αποτέλεσμα Πόσο μεταβάλλεται η τιμή μιας μεταβλητής Υ (εξαρτημένης) από την μεταβολή μιας άλλης μεταβλητής Χ (ανεξάρτητης) Η Υ στη γραμμική παλινδρόμηση είναι συνεχής Υποθέσεις: Γραμμική σχέση Υ κ Χ Γνωρίζουμε όλες τις τιμές της Χ

Γραμμική Παλινδρόμηση (ΙΙ) Y b b X b X... o 1 1 2 2 b k X k Απλή: ένας ανεξάρτητος παράγοντας Πολλαπλή: πολλοί ανεξάρτητοι παράγοντες b o : σταθερός όρος, η τιμή Υ για Χ i =0 b i : κλίση της ευθείας, συντελεστής παλινδρόμησης (i=1,2,..,k) εκφράζει την κατά μέσο όρο μεταβολή στην εξαρτημένη μεταβλητή, όταν η αντίστοιχη ανεξάρτητη μεταβλητή μεταβάλλεται κατά μια μονάδα και οι άλλες μεταβλητές παραμένουν σταθερές

Γραμμική Παλινδρόμηση (ΙΙΙ) Προϋποθέσεις: Κανονικότητα: οι παρατηρήσεις προέρχονται από πληθυσμό ο οποίος ακολουθεί την κανονική κατανομή Ομοσκεδαστικότητα: η διασπορά της Υ είναι η ίδια για κάθε τιμή της Χ Ανεξαρτησία: η τιμή της Υ i δεν επηράζει την τιμή της Υ j (i j, i, j=1,2,,n) Οι τιμές των ανεξάρτητων μεταβλητών Χ i παραμένουν σταθερές σε επανειλημμένα δείγματα Οι τιμές των Χ & Υ έχουν μετρηθεί χωρίς σφάλματα Τα σφάλματα της παλινδρόμησης, έχουν μέση τιμή μηδέν (0) για κάθε τιμή της Χ και διακύμανση ανεξάρτητη από τις τιμές της Χ Σφάλματα μέτρησης, παράλειψη προσθήκης σημαντικών μεταβλητών i

Συσχέτιση vs Παλινδρόμηση Συσχέτιση Οι μεταβλητές Χ κ Υ είναι τυχαίες Δείχνει την παρουσία ή όχι σχέσης μεταξύ δύο μεταβλητών Μετράει την ένταση της σχέσης Θετική συσχέτιση θετική κλίση της ευθείας παλινδρόμησης Παλινδρόμηση Η μεταβλητή Υ είναι τυχαία Η μεταβλητή Χ είναι καθορισμένη Δείχνει το βαθμό μεταβολής μιας μεταβλητής, αν μεταβάλλεται μια ή περισσότερες μεταβλητές Μαθηματική σχέση μεταξύ Υ & Χ

Λογαριθμιστική Παλινδρόμηση (Ι) Η εξαρτημένη μεταβλητή Υ είναι δίτιμη Παίρνει τις τιμές 0 (π.χ. υγιείς, μη καπνιστές) & 1 (π.χ. ασθενείς, καπνιστές) Αναδρομικές μελέτες (ασθενών-μαρτύρων) Τυχαιοποίηση ως προς την έκθεση Εκτιμάμε τον Σχετικό Λόγο (Odds Ratio): η πιθανότητα να έχουν εκτεθεί σε κάποιο παράγοντα οι νοσούντες σε σχέση με τους μη νοσούντες Προοπτικές μελέτες Τυχαιοποίηση ως προς το συμβάν Εκτιμάμε το Σχετικό Κίνδυνο (Risk Ratio): ο κίνδυνος να νοσήσουν οι εκτεθέντες σε κάποιο παράγοντα προς τους μη εκτεθέντες

Λογαριθμιστική Παλινδρόμηση (ΙΙ) Η πιθανότητα π(χ) είναι συνήθως συνάρτηση μιας ή περισσοτέρων μεταβλητών {Χ} (ανεξάρτητες μεταβλητές) οι οποίες ερμηνεύουν σε μικρό ή μεγάλο βαθμό την π, δηλαδή την πιθανότητα της παρουσίας μιας κατάστασης Η πιθανότητα να συμβεί ένα γεγονός για δεδομένες τιμές των ανεξάρτητων μεταβλητών Χ i

Λογαριθμιστική Παλινδρόμηση (ΙΙΙ) Η πιθανότητα π(χ) είναι συνήθως συνάρτηση μιας ή περισσοτέρων μεταβλητών {Χ} (ανεξάρτητες μεταβλητές) οι οποίες ερμηνεύουν σε μικρό ή μεγάλο βαθμό την π, δηλαδή της πιθανότητα της παρουσίας μιας κατάστασης