Κριτήρια επιλογής μέτρων συνάφειας

Σχετικά έγγραφα
Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

Αναλυτική Στατιστική

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Μέθοδος μέγιστης πιθανοφάνειας

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Μέθοδος μέγιστης πιθανοφάνειας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Αν Α και Β είναι δύο ενδεχόμενα ενός δειγματικού χώρου να αποδείξετε ότι: Αν Α Β τότε Ρ(Α) Ρ(Β)

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Στατιστική ανάλυση αποτελεσμάτων

ΚΑΤΑΝΟΜΕΣ Ι ΙΑΣΤΑΤΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

Γ. Πειραματισμός - Βιομετρία

3. Κατανομές πιθανότητας

Περιεχόμενα. Πρόλογος... 15

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Π

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Απλή Γραμμική Παλινδρόμηση II

ΕΠΑΝΑΛΗΨΗ ΒΑΣΙΚΩΝ ΕΝΝΟΙΩΝ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑ ΓΕΝΙΚΑ ΜΑΘΗΜΑΤΙΚΑ

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ ΑΛΓΕΒΡΑΣ Α ΛΥΚΕΙΟΥ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Πιθανότητες. Συναρτήσεις πολλών μεταβλητών Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ» ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΠΑΝΑΛΗΠΤΙΚΗ ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ 5 Ιουλίου 2009

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Διμεταβλητές κατανομές πιθανοτήτων

Τεκµηριωµένη Ιατρική ΒΛΑΒΗ. Βασίλης Κ. Λιακόπουλος Λέκτορας Νεφρολογίας ΑΠΘ

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Συναρτήσεις Θεωρία Ορισμοί - Παρατηρήσεις

Λύσεις των θεμάτων ΔΕΥΤΕΡΑ 19 ΙΟΥΝΙΟΥ 2017 ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Π Ο Λ Ι Τ Ι Κ Α Κ Α Ι Σ Τ Ρ Α Τ Ι Ω Τ Ι Κ Α Γ Ε Γ Ο Ν Ο Τ Α

Δ Ι Α Γ Ω Ν Ι Σ Μ Α Σ Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α Γ Ε Ν Ι Κ Η Σ Π Α Ι Δ Ε Ι Α Σ. οι τιμές μιας μεταβλητής Χ ενός δείγματος πλήθους ν με k.

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Θέμα Α. Θέμα Β. ~ 1/9 ~ Πέτρος Μάρκου. % σχεδιάζουμε το πολύγωνο αθροιστικών σχετικών συχνοτήτων τοις

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Στατιστική Συμπερασματολογία

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Μέρος IV. Πολυδιάστατες τυχαίες μεταβλητές. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ15 ( 1 )

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2015 ΕΚΦΩΝΗΣΕΙΣ

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

ΘΕΜΑ 2 Αν Α, Β είναι ενδεχόμενα ενός δειγματικού χώρου Ω με Ρ(Α ) = 3Ρ(Α), Ρ(Β ) = 1/3 και () 3()

Επαναληπτικό Διαγώνισµα Μαθηµατικά Γενικής Παιδείας Γ Λυκείου

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Το Κεντρικό Οριακό Θεώρημα

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2016 Β ΦΑΣΗ. Ηµεροµηνία: Κυριακή 17 Απριλίου 2016 ιάρκεια Εξέτασης: 2 ώρες ΕΚΦΩΝΗΣΕΙΣ

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΑΛΓΕΒΡΑΣ Α ΛΥΚΕΙΟΥ Δ Ι Α Γ Ω Ν Ι Σ Μ Α 1

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

4 η ΕΚΑ Α ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ 31.

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ

Μέρος ΙΙ. Τυχαίες Μεταβλητές

ÏÅÖÅ = = H f παρουσιάζει µέγιστο για x = -1, το f ( 1) = 2 Οπότε : µ + 4 = 9 µ = 5 iii) Ο συντελεστής διεύθυνσης της εφαπτοµένης της C

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Το Κεντρικό Οριακό Θεώρημα

Εφαρμοσμένα Μαθηματικά ΙΙ 10ο Σετ Ασκήσεων (Λύσεις) Γραμμικοί Μετασχηματισμοί

Kruskal-Wallis H

Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017

Transcript:

Κριτήρια επιλογής μέτρων συνάφειας Ο όρος συνάφεια προέρχεται από τον Pearso (1904) όπου ορίζεται για ένα πίνακα IJ ως ένα μέτρο της συνολικής απόκλισης της ταξινόμησης από την ανεξάρτητη πιθανότητα. Από την στιγμή που απορριφθεί η υπόθεση της ανεξαρτησίας τότε μια σειρά από μέτρα συνάφειας μπορούν να χρησιμοποιηθούν με σκοπό τον υπολογισμό της έντασης της συνάφειας μεταξύ δύο μεταβλητών.

Κριτήρια επιλογής μέτρων συνάφειας Κάθε μέτρο συνάφειας έχει κάποια συγκεκριμένα χαρακτηριστικά. Όταν τα μέτρα εφαρμοσθούν στο ίδιο σύνολο δεδομένων τα αποτελέσματα συχνά διαφέρουν. Για λόγους σύγκρισης τα μέτρα συνάφειας θα πρέπει να ικανοποιούν κάποιες κοινές παραδοχές (Godma & Kruskal (1954)): Να κυμαίνεται στο διάστημα [-1,+1] όταν τα δεδομένα έχουν φυσική διάταξη με τιμές ±1 για πλήρη συνάφεια με το πρόσημο να καθορίζει την κατεύθυνση, και 0 για πλήρη ανεξαρτησία. Να κυμαίνεται στο διάστημα [0,+1] όταν τα δεδομένα δεν έχουν φυσική διάταξη με τιμές 1 για πλήρη συνάφεια και 0 για πλήρη ανεξαρτησία.

Αξιώματα του Reyi Μεγάλος προβληματισμός κατά την εφαρμογή των μέτρων συνάφειας είναι η απόδοση της έντασης της εξάρτησης μεταξύ δύο μεταβλητών με μια αριθμητική τιμή. Ο Reyi (1959), ανέφερε ότι θα μπορούσαμε να χρησιμοποιήσουμε το διάστημα [0,1] με αντιστοίχηση 1 για πλήρη εξάρτηση και 0 για πλήρη ανεξαρτησία. Αν δ(ξ,η) ορίζεται ως ένα γενικό μέτρο εξάρτησης τότε κατά Reyi τα ακόλουθα είναι αξιωματικά:

Αξιώματα του Reyi 1. Το μέτρο δ(ξ,η) ορίζεται για κάθε ζεύγος τυχαίων μεταβλητών ξ και η. δ(ξ,η)= δ(η,ξ) το μέτρο είναι συμμετρικό 3. 0 δ(ξ,η) 1 4. δ(ξ,η)=0 ανν οι μεταβλητές ξ και η είναι ανεξάρτητες 5. δ(ξ,η)=1 αν υπάρχει αυστηρή εξάρτηση μεταξύ των ξ και η δηλ: ξ=g(η) ή η=f(ξ) 6. Αν οι g(x) και f(x) είναι αμφιμονοσήμαντες δηλ: 1-1 τότε δ(f(ξ),g(η))=δ(ξ,η) 7. Εάν η από κοινού κατανομή των ξ και η είναι κανονική τότε δ(ξ,η)= R(ξ,η) όπου R(ξ,η) είναι ο συντελεστής συσχέτισης των ξ και η

Ένταση συνάφειας Ο Cohe (1988) έδωσε μια κλίμακα έντασης: δ(.,.) < 0.3 - αδύναμη 0.3< δ(.,.) 0.5 μέτρια δ(.,.) > 0.5 - ισχυρή

Μέτρα για ονομαστικές μεταβλητές Τα μέτρα συνάφειας για ονομαστικά δεδομένα δεν στηρίζονται στην διάταξη των μεταβλητών Οι τιμές των μέτρων είναι πάντα θετικές κυμαινόμενες [0,1] καθώς η κατεύθυνση της συνάφειας δεν έχει νόημα για ονομαστικές μεταβλητές. Η τιμή 0 δηλώνει ανυπαρξία κάποιας σχέσης μεταξύ των δύο μεταβλητών και η τιμή 1 δηλώνει πλήρης συνάφεια των μεταβλητών

Για δίτομες κατηγορικές μεταβλητές Σχετικός κίνδυνος Ο σχετικός κίνδυνος (Relative Risk) χρησιμοποιείται για διχότομες κατηγορικές μεταβλητές. Χρησιμοποιείται στις ιατρικές μελέτες παραγόντων κινδύνου και ορίζεται ως: Μεταβλη τές RR r r 1 11 11 1 1 Υ1 Υ Σύνολο 1 11 1 1 11 Μεταβλη τές 1 Υ1 Υ Σύνολο Χ1 11 1 1. Χ 1. Σύνολο.1... Χ1 π 11 π 1 π 1. Χ π 1 π π. Σύνολο π.1 π. 1

Για δίτομες κατηγορικές μεταβλητές 11 r = Pr(απόκριση ομάδα 1 Ομάδα Α) 1 11 1 είναι ο κίνδυνος εμφάνισης ενός αποτελέσματος δοθείσης της ομάδας στην οποία ανήκει το υποκείμενο 1 r = Pr(απόκριση ομάδα 1 Ομάδα Β) 1 είναι ο κίνδυνος εμφάνισης του ιδίου αποτελέσματος δοθείσης της άλλης ομάδας στην οποία ανήκει το υποκείμενο

Για δίτομες κατηγορικές μεταβλητές Δειγματοληπτικά ισχύει: RR r 1 r 11 1 11 1 1 Χρησιμοποιείται σε πίνακες x με διχότομες ονομαστικές ή μεταβλητές διάταξης Ο σχετικός κίνδυνος είναι μη αρνητικός με τιμές [0, ). Όταν RR=1 οι μεταβλητές είναι ανεξάρτητες δηλ: δεν υπάρχει διαφορά στον κίνδυνο μεταξύ των ομάδων. Όταν RR 1 τότε οι μεταβλητές είναι εξαρτημένες.

Άσκηση Δίνονται τα δεδομένα του x πίνακα Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 80 40 500 100 400 500 Σύνολο 180 80 1000 Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 0.08 0.4 0.5 0.1 0.4 0.5 Σύνολο 0.18 0.8 1 Η εξαρτημένη μεταβλητή (στήλη) περιγράφει την επιβίωση ενός ατόμου σε σχέση με το αν λαμβάνει κάποια θεραπεία ή ψευτοφάρμακο.

Άσκηση Ο κίνδυνος θανάτου για κάποιο άτομο που παίρνει την θεραπεία Α είναι: 11 0.08 r 1 0.16 11 1 0.5 Ο κίνδυνος θανάτου για κάποιο άτομο που παίρνει την θεραπεία Β είναι: 1 0.1 r 0. 0.5 Επομένως ο σχετικός κίνδυνος ισούται με 1 r 0.16 0. 0.8

Ερμηνεία: Άσκηση Τα άτομα που βρίσκονται υπο-αγωγή, έχουν 80% κίνδυνο μηεπιβίωσης σε σχέση με εκείνα που παίρνουν ψευδοφάρμακο. Αν RR<1, το ενδεχόμενο είναι λιγότερο πιθανό να συμβεί στην ομάδα Α από ότι στην ομάδα Β (αρνητική συνάφεια) Αν RR>1, το ενδεχόμενο είναι περισσότερο πιθανό να συμβεί στην ομάδα Α από ότι στην ομάδα Β (θετική συνάφεια)

Λόγος πιθανοτήτων Χρησιμοποιείται στις επιδημιολογικές μελέτες για να δείξει τον κίνδυνο ενός ατόμου να πάσχει από μια ασθένεια. Εκφράζει το βαθμό συνάφειας μεταξύ δύο μεταβλητών για πίνακες x. Ο τρόπος υπολογισμού του είναι: 1 11 1. 1 1. 1. 1 11 1. r1 1 r r 1 r 1 11 1 1 11 1 1 Μεταβλη τές Υ1 Υ Σύνολο Χ1 π 11 π 1 π 1. Χ π 1 π π. Σύνολο π.1 π. 1

Λόγος πιθανοτήτων Η δειγματική εκτίμηση είναι: Τα odds ενός ενδεχομένου Ε είναι το πηλίκο odds 1 E και περιγράφουν τον λόγο της επιτυχίας ως προς την αποτυχία 11 1 Η τιμή θ(-,+ ). Για θ=1 οι μεταβλητές είναι ανεξάρτητες 1 1 odds E E

Λόγος πιθανοτήτων Για θ<1 το ενδεχόμενο είναι λιγότερο πιθανό να συμβεί στην ομάδα θεραπείας Α από ότι στην ομάδα ελέγχου Β με αρνητική συνάφεια. Για θ>1 θ<1 το ενδεχόμενο είναι περισσότερο πιθανό να συμβεί στην ομάδα θεραπείας Α από ότι στην ομάδα ελέγχου Β με θετική συνάφεια. Όταν ένα κελί έχει μηδενική πιθανότητα τότε θ=0 ή θ= Χρησιμοποιείται για πίνακες x ονομαστικές και διατακτικές. Ισχύει ότι RR 1 1 r r 1

Άσκηση Δίνονται τα δεδομένα του x πίνακα Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 80 40 500 100 400 500 Σύνολο 180 80 1000 Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 0.08 0.4 0.5 0.1 0.4 0.5 Σύνολο 0.18 0.8 1 Η εξαρτημένη μεταβλητή (στήλη) περιγράφει την επιβίωση ενός ατόμου σε σχέση με το αν λαμβάνει κάποια θεραπεία ή ψευτοφάρμακο.

Άσκηση Τα Ω 1 =odds (απόκριση 1 ομάδα Α) 11 0.08 0.4 1 1 0.19 Τα Ω =odds (απόκριση 1 ομάδα Β) 1 0.1 0.5 0.4 Επομένως ο λόγος πιθανοτήτων ισούται με 1 0.19 0.76 0.5

Λόγος πιθανοτήτων Όταν Ω i >1 τότε η πιθανότητα ενός γεγονότος να συμβεί είναι >0.5 ενώ όταν Ω i <1 τότε η πιθανότητα ενός γεγονότος να συμβεί είναι <0.5. Άρα όσο μεγαλύτερο είναι το odds ενός γεγονότος να συμβεί τόσο υψηλότερη είναι η πιθανότητα το γεγονός να συμβεί και αντίστροφα. Όταν Ω i =1 τότε η πιθανότητα το γεγονός να συμβεί ισούται με την πιθανότητα το γεγονός να μην συμβεί και όταν Ω i =0 τότε η πιθανότητα το γεγονός να συμβεί είναι 0.

Λόγος πιθανοτήτων Στο παράδειγμα θ=0.76<1 υποδηλώνει αρνητική συνάφεια και σημαίνει ότι το Ω 1 ένας ασθενής να μην επιβιώσει υπό θεραπεία ισούται με το 76% του Ω αν δεν υποβάλλεται σε θεραπεία. Δηλ: όταν κάποιος ανήκει στην χαμηλή ομάδα (θεραπεία Α) σχετίζεται με το να ανήκει στην υψηλότερη μεταβλητή αποτελέσματος (Επιβίωση : Ναι)

Συντελεστής συνάφεια Q -Yule Ο συντελεστής συνάφειας Q υπολογίζεται από τον τύπο Q 11 Δειγματοληπτικά έχουμε: Q 11 11 11 1 1 1 1 1 1 1 1 1 1 1 1

Άσκηση Δίνονται τα δεδομένα του x πίνακα Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 80 40 500 100 400 500 Σύνολο 180 80 1000 Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 0.08 0.4 0.5 0.1 0.4 0.5 Σύνολο 0.18 0.8 1 Η εξαρτημένη μεταβλητή (στήλη) περιγράφει την επιβίωση ενός ατόμου σε σχέση με το αν λαμβάνει κάποια θεραπεία ή ψευτοφάρμακο.

Άσκηση Έχουμε Q 0.08*0.4 0.08*0.4 0.4*0.1 0.4*0.1 0.14 0.76 0.76 1 1 Η τιμή Q=-0.14 δείχνει αρνητική συνάφεια μεταξύ των δύο μεταβλητών, μικρής έντασης. Ο συντελεστής Q βασίζεται στην διαφορά μεταξύ των σύμφωνων ζευγών παρατηρήσεων C και των ασύμφωνων ζευγών παρατηρήσεων D και εκφράζει την διαφορά (C-D) ως ποσοστό επί του συνόλου των ζευγών παρατηρήσεων χωρίς δεσμούς (C+D)

Άσκηση Έχουμε C 11 D 1 1 Ερμηνεία : 14% υπάρχει διαφορά μεταξύ εκείνων που συμφωνούν και δεν συμφωνούν ως προς το σύνολο. Ο συντελεστής Q κυμαίνεται στο διάστημα [-1,+1]. Q=0 δηλώνει ανεξαρτησία μεταξύ των μεταβλητών. Εφαρμογή σε x πίνακες με διχότομες, ονομαστικές και διατακτικές μεταβλητές. Συμμετρικό μέτρο. Δεν εξαρτάται από την διάταξη γραμμών - στηλών

Συντελεστής συνάφεια Υ -Yule Ο συντελεστής συνάφειας Y υπολογίζεται από τον τύπο Y 11 11 1 1 1 1 1 1 Δειγματοληπτικά έχουμε: Y 11 11 1 1 1 1 1 1

Άσκηση Δίνονται τα δεδομένα του x πίνακα Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 80 40 500 100 400 500 Σύνολο 180 80 1000 Μεταβλη τές Θεραπεία Α Θεραπεία Β ΟΧΙ ΝΑΙ Σύνολο 0.08 0.4 0.5 0.1 0.4 0.5 Σύνολο 0.18 0.8 1 Η εξαρτημένη μεταβλητή (στήλη) περιγράφει την επιβίωση ενός ατόμου σε σχέση με το αν λαμβάνει κάποια θεραπεία ή ψευτοφάρμακο.

Άσκηση Έχουμε Y 0.08*0.4 0.08*0.4 0.4*0.1 0.4*0.1 0.07 0.76 0.76 1 1 Η τιμή Υ=-0.07 δείχνει αρνητική συνάφεια μεταξύ των δύο μεταβλητών, μικρής έντασης. Ο συντελεστήςυ κυμαίνεται στο διάστημα [-1,+1]. Υ=0 δηλώνει ανεξαρτησία μεταξύ των μεταβλητών. Εφαρμογή σε x πίνακες με διχότομες, ονομαστικές και διατακτικές μεταβλητές. Συμμετρικό μέτρο. Δεν εξαρτάται από την διάταξη γραμμών - στηλών

Συντελεστής συνάφεια φ -Yule Ο συντελεστής συνάφειας φ υπολογίζεται από τον τύπο x Ονομάζεται και συντελεστής μέσης τετραγωνικής συνάφειας I J x ij i.. j i1 j1 i.. j Στην περίπτωση x πίνακα, ο συντελεστής ορίζεται ως 11 1..1. 1. 1

Άσκηση Έχουμε x 11 1..1.71 1000. 1. 1 0.05 3000 4000 19094 0.05 Η τιμή φ=-0.05 δείχνει αρνητική συνάφεια μεταξύ των δύο μεταβλητών, μικρής έντασης. Εκφράζει την συνάφεια ως ποσοστό της μέγιστης δυνατής μεταβλητότητας φ κυμαίνεται στο διάστημα [-1,+1] για x πίνακες

Συντελεστής συνάφεια Υ -Yule φ κυμαίνεται στο διάστημα [-1,+1] για x πίνακες Συνθήκες: 1. Οι Carroll Guilford δηλώνουν ότι για να ισχύει φ=1 ή με φ=-1 είναι τα περιθώρια αθροίσματα κάθε γραμμής και στήλης να είναι ίσα. Ο Liu σημειώνει ότι το ίδιο ισχύει όταν δύο συμμετρικά αντίθετα διαγώνια κελία είναι 0. 3. Για IxJ πίνακες με I,J> ο συντελεστής φ κυμαίνεται στο διάστημα [ 0, q 1] όπου q=mi{i,j}. Άρα μπορεί να ισχύει φ>1 και να διαφοροποιείται ανάλογα με το μέγεθος του δείγματος 4. Συμμετρικό μέτρο

Συντελεστής συνάφεια Τ -Tchurow Ο συντελεστής συνάφειας T υπολογίζεται από τον τύπο T I 1J 1 όπου I,J πλήθος γραμμών στηλών με {(I-1)(J-1)} είναι β.ε. Δειγματική εκτίμηση T με αντικατάσταση x I 1 J 1 x

Άσκηση Έχουμε T x.71 I 1 J 1 1000 1 1 0.05 Η τιμή Τ=0.05 δείχνει συνάφεια μεταξύ των δύο μεταβλητών, ασήμαντης βαρύτητας. Τ κυμαίνεται στο διάστημα [0,1] Τ=1 μόνο όταν οι δύο μεταβλητές έχουν ίσα περιθώρια αθροίσματα και ο πίνακας είναι τετραγωνικός

Συντελεστής συνάφεια Τ -Tchurow Η μέγιστη τιμή του συντελεστή Τα υπολογίζεται από τον τύπο T max q 1 l όπου q=mi{i,j} και l=mi{i-1,j-1} Όσο λιγότερο τετραγωνικός είναι ένας πίνακας και όσο ανόμοιες είναι οι περιθώριες κατανομές των γραμμών και των στηλών τόσο περισσότερο ο συντελεστής θα γίνεται μικρότερος του 1. Χρήση μόνο για τετραγωνικούς πίνακες. Για x πίνακες ισχύει ότι Τ=φ

Συντελεστής συνάφεια V-Cramer Ο συντελεστής συνάφειας V υπολογίζεται από τον τύπο όπου q=mi{i,j} Δειγματική εκτίμηση με αντικατάσταση V q 1 V x q 1 x

Άσκηση Έχουμε V x.71 q 1 1000 1 0.05 Η τιμή V=0.05 δείχνει συνάφεια μεταξύ των δύο μεταβλητών, ασήμαντης βαρύτητας. V κυμαίνεται στο διάστημα [0,1] V=1 μόνο όταν οι δύο μεταβλητές έχουν ίσα περιθώρια αθροίσματα και ο πίνακας είναι τετραγωνικός. Όσο πιο άνισα τόσο ο συντελεστής θα είναι μικρότερος της 1. Συμμετρικό μέτρο Για πίνακες x ισχύει V=T=φ

Συντελεστής συνάφεια C-Pearso Ο συντελεστής συνάφειας V υπολογίζεται από τον τύπο C 1 Δειγματική εκτίμηση με αντικατάσταση C x x 1 x x 1 x

Συντελεστής συνάφεια C-Pearso Μπορεί να εφαρμοσθεί σε διδιαστατο IxJ πίνακα οποιοδήποτε μεγέθους. Συμμετρικό μέσο Ο συντελεστής εξαρτάται από την διάσταση του πίνακα. Το άνω όριο του συντελεστή είναι συνάρτηση του αριθμού των γραμμών και των στηλών του IxJ πίνακα με όπου q=mi{i,j} C q 1 q Προτείνεται η χρήση του προσαρμοσμένου δείκτη C C adj max C max

Άσκηση Έχουμε C C adj x.71 x.711000 C 0.05 0.07 C 0.71 max 0.05 Εκφράζει την συνάφεια μεταξύ δύο μεταβλητών ως ποσοστό της μέγιστης δυνατής μεταβλητότητας. Για x πίνακες, C κυμαίνεται στο διάστημα [0,071] Προσεγγίζει την μονάδα όσο ο αριθμός των γραμμών και των στηλών αυξάνει. Ο προσαρμοσμένος συντελεστής κυμαίνεται στο διάστημα [0,1] ανεξάρτητα από το μέγεθος του πίνακα.