ΠΡΑΚΤΙΚΗ ΚΑΘΟΔΗΓΗ ΣΤΟ SPSS

Σχετικά έγγραφα
ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

T-tests One Way Anova

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

Ανάλυση Ερευνητικών Δεδομένων στην Πράξη

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Κεφάλαιο 7. Επαγωγική Στατιστική

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής. Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας

Στατιστικές Υποθέσεις

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΣΥΓΚΡΙΣΕΙΣ

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Εισαγωγή στην Ανάλυση Δεδομένων

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

Τμήμα Λογιστικής και Χρηματοοικονομικής. Δρ. Αγγελίδης Π. Βασίλειος

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Στατιστικό κριτήριο χ 2

Λυμένες Ασκήσεις για το μάθημα:

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Αναλυτική Στατιστική

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Λογαριθµιστική εξάρτηση

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Επαγωγική Στατιστική

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Τι κάνουμε μετά τη συλλογή των δεδομένων

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

6 / 4 / Βιοστατιστικός, MSc, PhD

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Πολλαπλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 7 (συνέχεια)

1991 US Social Survey.sav

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Εισαγωγή στο SPSS. ΚΕΔΙΜΑ 28/9/2013 Γεώργιος Σπανούδης Τμήμα Ψυχολογίας

Ιστορικό, πορεία και εξέλιξη μίας μελέτης Στατιστική ανάλυση των δεδομένων. Σ. Μακρυγιάννης, Γ.Ν Πειραιά«Τζάνειο»

6.4. LOGLINEAR (MANOVA) 121

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Μέρος 1 Εισαγωγή στο SPSS Βασικές αρχές καταχώρισης δεδομένων και στατιστικής ανάλυσης με το SPSS 39

Kruskal-Wallis H

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

Έλεγχος για τις παραμέτρους θέσης περισσοτέρων των δύο πληθυσμών με ανεξάρτητα δείγματα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1)

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Μη Παραµετρικοί Έλεγχοι

Στατιστική Επιχειρήσεων Ι

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Πανεπιστήμιο Πάτρας Τμήμα Βιολογίας. Ανάλυση Περιβαλλοντικών Δεδομένων: συνοπτικός οδηγός για βιολόγους. Σίνος Γκιώκας

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S.

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Στατιστικές μέθοδοι ανάλυσης δεδομένων

Εισαγωγή στη Στατιστική

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square)

Μη Παραµετρικά Κριτήρια. Παραµετρικά Κριτήρια

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Transcript:

ΠΡΑΚΤΙΚΗ ΚΑΘΟΔΗΓΗ ΣΤΟ SPSS Σημειώσεις: Μπεττίνα Χάιδιτς, Επίκουρη Καθηγήτρια Υγιεινής-Ιατρικής Στατιστικής, Τμήμα Ιατρικής ΑΠΘ 1

Προσδιορισμός μεταβλητών και εισαγωγή δεδομένων Ανοίξτε το SPSS και επιλέξτε την επιλογή Type in data για να καταχωρήσετε τα δεδομένα και μετά πατήστε OK : Στο συγκεκριμένο παράδειγμα θα καταχωρηθούν δεδομένα για 2 ποιοτικές μεταβλητές, φύλο (sex) και κάπνισμα (smoke) και 2 ποσοτικές μεταβλητές, ηλικία (age) και αιμοσφαιρίνη (hgb) για 20 άτομα. Αρχικά, στο φύλλο εργασίας Variable View (κάτω αριστερά), προσδιορίζονται τα χαρακτηριστικά των μεταβλητών: Στο Name ονομάζουμε τις μεταβλητές. Προσοχή διότι δεν δέχεται κενά μεταξύ 2 λέξεων και δεν μπορεί ο πρώτος χαρακτήρας να ξεκινήσει με αριθμό. Μέσα στο Label δίνονται πιο πολλές λεπτομέρειες για την μεταβλητή, π.χ. για την ηλικία την μονάδα μέτρησης που είναι σε χρόνια, μέσα στο Label καταχωρείται: Age (years). Με τον ίδιο τρόπο καταχωρούνται και οι μονάδες μέτρησης της αιμοσφαιρίνης, που είναι g/dl. 2

Μετά μέσα στο Values ονομάζονται οι κωδικοί για τις ποιοτικές μεταβλητές, π.χ. για το sex, 1=male και 2=female και για το smoke, 1=yes, 0=no: Τώρα αφού προσδιορίστηκαν οι μεταβλητές, καταχωρούνται τα δεδομένα, κάνοντας κλικ στο Data View, που βρίσκεται κάτω δεξιά: 3

Πατώντας αυτό το κουμπί εμφανίζονται οι ονομασίες των κωδικών Αφού καταχωρηθούν τα δεδομένα, καλό θα ήταν και να τα αποθηκευτούν, πηγαίνοντας στο Toolbar επιλέγεται το File Save και ονομάζεται το αρχείο π.χ. example. 4

Περιγραφή δεδομένων και έλεγχος κανονικότητας Οι ποσοτικές μεταβλητές (age, hgb) περιγράφονται με περιγραφικά στατιστικά και οι ποιοτικές περιγράφονται με συχνότητες (sex, smoke). Αλλά πρώτα πρέπει να εξετασθούν αν οι ποσοτικές μεταβλητές είναι κανονικά κατανεμημένες, επιλέγοντας από το Toοlbar, Analyze Descriptive Statistics Explore Μέσα στο Dependent List μπαίνουν οι ποσοτικές μεταβλητές και μέσα στο Factor List μπαίνουν οι ποιοτικές π.χ. sex Μετά ανοίγει ένα καινούριο παράθυρο (Output) με τα αποτελέσματα: Επιλέγεται το Plots και μετά επιλέγεται το Normality plots with tests για τον έλεγχο κανονικότητας και Continue και OK 5

Περιγραφικά στατιστικά κατά φύλο Έλεγχος κανονικότητας, για Sig. (p-value) < 0.05, η μεταβλητή δεν είναι κανονικά κατανεμημένη, όπως π.χ. το age. Το Shapiro-Wilk test χρησιμοποιείται για δείγματα < 50 παρατηρήσεων Παρακάτω παρουσιάζονται τα θηκογράμματα (Boxplots) για την ηλικία και την αιμοσφαιρίνη ανά φύλο. Όπως φαίνεται η ηλικία που δεν είναι κανονικά κατανεμημένη έχει ακραίες τιμές. 6

Περίπου 95% διάστημα εμπιστοσύνης Outliers (ακραίες τιμές) Q3=3 ο τεταρτημόριο ή 75 ο εκατοστημόριο Διάμεσος, Q2= 2 ο τεταρτημόριο ή 50 ο εκατοστημόριο Q3=3 ο τεταρτημόριο ή 75 ο εκατοστημόριο Από τα αποτελέσματα συμπεραίνουμε ότι η ηλικία δεν είναι κανονικά κατανεμημένη ενώ η αιμοσφαιρίνη είναι κανονικά κατανεμημένη. Οπότε για την ηλικία ο σωστότερος τρόπος περιγραφής των δεδομένων είναι η διάμεσος (από το πινακάκι το Median) διότι πλεονεκτεί έναντι του μέσου όρου στο ότι δεν επηρεάζεται από την παρουσία ακραίων τιμών που απέχουν πολύ από όλες τις άλλες τιμές. Ενώ η αιμοσφαιρίνη μπορεί να περιγραφεί με τον μέσο όρο (από το πινακάκι Mean) μαζί με την τυπική απόκλιση (Std. Deviation). Η διάμεσος συνήθως περιγράφεται μαζί με το εύρος (Range:Maximum- Minimum). 7

Η περιγραφή των συχνοτήτων των ποιοτικών μεταβλητών γίνεται επιλέγοντας από το Toοlbar, Analyze Descriptive Statistics Frequencies. Μέσα στο Variable(s) μεταφέρονται οι ποιοτικές μεταβλητές για να περιγραφούν: Και τα παρακάτω αποτελέσματα παρουσιάζονται: Επίσης, το Output αποθηκεύεται, επιλέγοντας από το Toolbar File Save και ονομάζοντας το αρχείο π.χ. results. Τα αποτελέσματα (file.sav) και τα δεδομένα (file.spo) αποθηκεύονται σε ξεχωριστά αρχεία. Σύγκριση μεταξύ δύο ανεξάρτητων δειγμάτων Αφού περιγράφηκαν τα δεδομένα, το επόμενο βήμα είναι να αναλυθούν με το κατάλληλο τρόπο. Στην περίπτωση που τα δεδομένα μιας μεταβλητής ακολουθούν την κανονική κατανομή χρησιμοποιούνται παραμετρικές μεθόδους ανάλυσης (π.χ., Student s t-test, 8

ANOVA) και στην περίπτωση που υπάρχει απόκλιση από την κανονικότητα χρησιμοποιούνται μη-παραμετρικές μέθοδοι ανάλυσης (π.χ. Mann-Whitney test, Kruskal- Wallis test). Οπότε από το παραπάνω παράδειγμα, για να συγκριθεί η αιμοσφαιρίνη στους άντρες και στις γυναίκες, χρησιμοποιείται το Student s t-test, εφόσον ήταν κανονικά κατανεμημένη. Επιλέγοντας από το Toolbar Analyze Compare Means Independent-Samples T test : Στο Test Variable(s) μπαίνει η ποσοτική μεταβλητή Στο Grouping Variable μπαίνει η ποιοτική μεταβήτή και μετά επιλέγεται το Degine Groups για να προσιοριστούν οι κωδικοί της ποιοτικής μεταβλητής και μετά Continue και τέλος OK Στα παρακάτω αποτελέσματα, πρώτα παρουσιάζεται ένα πινακάκι με τα περιγραφικά στατιστικά ανά φύλο Group Statistics και μετά ένα άλλο πινακάκι Independent Samples Test, με όλα τα στατιστικά για το Student s t-test. Πρώτα γίνεται έλεγχος για ίσες διακυμάνσεις μέσα στις ομάδες Levene s Test for Equality of Variances. Σ αυτήν την περίπτωση οι διακυμάνσεις είναι ίσες (Sig.=p-value=0.748 > 0.05), οπότε χρησιμοποιείται το το p-value (Sig.(two-tailed)) της πρώτης γραμμής, αλλιώς θα χρησιμοποιείται το p-value της δεύτερης γραμμής. Το συμπέρασμα είναι ότι η μέση αιμοσφαιρίνη διαφέρει σημαντικά μεταξύ των 2 φύλων (Sig.(two-tailed)=pvalue<0.001), δηλαδή η αιμοσφαιρίνη κατά μέσο όρο ήταν σημαντικά υψηλότερη στους άντρες απ ότι στις γυναίκες: 9

P > 0.05 P < 0.05 Ενώ, για να συγκριθεί η ηλικία στους άντρες και στις γυναίκες, χρησιμοποιείται η μηπαραμετρική ανάλυση Mann-Whitney U test, εφόσον δεν ήταν κανονικά κατανεμημένη. Επιλέγοντας από το Toolbar Analyze Non Parametric Tests Legacy Dialogs 2 Independent Samples : Και τα αποτελέσματα: 10

P=0.519 >0.05, οπότε δεν διαφέρουν σημαντικά οι ηλικίες ανδρών και γυναικών Άσκηση: Να συγκριθεί η αιμοσφαιρίνη και η ηλικία μεταξύ καπνιστών και μη-καπνιστών, τι συμπεραίνεται; ΣΗΜΕΙΩΣΗ: Να αποθηκευτούν τα παραπάνω δεδομένα γιατί θα χρησιμοποιηθούν και σε επόμενα παραδείγματα 11

Σύγκριση μεταξύ κ ανεξάρτητων δειγμάτων Η Ανάλυση Διακύμανσης (ANOVA) χρησιμοποιείται για την σύγκριση μιας μεταβλητής σε περισσότερες από 2 ομάδες, στην περίπτωση που η μεταβλητή είναι κανονικά κατανεμημένη. Ενώ η δοκιμασία κατά Kruskal-Wallis (Kruskal-Wallis test) χρησιμοποιείται για την ίδια σύγκριση όταν τα δεδομένα δεν είναι κανονικά κατανεμημένα. Π.χ. σε 3 ομάδες ασθενών να συγκριθεί η ηλικία και η συστολική πίεση τους. Τα δεδομένα τους παρουσιάζονται παρακάτω και να καταχωρηθούν στο SPSS. Η ηλικία είναι κανονικά κατανεμημένη οπότε χρησιμοποιείται το One-Way ANOVA για τη σύγκριση των 3 ομάδων. Επίσης, επιλέγεται η ρύθμιση κατά Bonferroni για να διερευνηθεί ποιες από τις ομάδες διαφέρουν σημαντικά μεταξύ τους. Επιλέγοντας από το Toolbar Analyze Compare Means One-Way ANOVA : Στο Dependent List μπάινει η ποσοτική μεταβληή και στο Factor μπαίνει η ποιοτική μεταβλητή Μέσα στο Post Hoc επιλέγεται η ρύθμιση κατά Bonferroni για τις πολλαπλές συγκρίσεις μετά Continue και τέλος OK 12

Και τα αποτελέσματα: P<0.001, δηλαδή κάποιες από τις 3 ομάδες διαφέρουν σημαντικά μεταξύ τους Και οι 3 ομάδες διαφέρουν σημαντικά μεταξύ τους σε σχέση με την ηλικία (1 vs. 2 με P<0.001, 1 vs. 3 με P<0.001 και 2 vs. 3 με P=0.008 Ενώ η συστολική πίεση δεν είναι κανονικά κατανεμημένη οπότε χρησιμοποιείται η μηπαραμετρική ανάλυση κατά Kruskal-Wallis. Επιλέγοντας από το Toolbar Analyze Nonparametric Tests Legacy Dialogs K Independent Samples : Στο Test Variable List επιλέγεται η ποσοτική μεταβλητή και στο Grouping Variable η ποιοτική μεταβλητή Μέσα στο Define Range μπαίνουν οι κωδικοί της ποιοτικής μεταβλητής 1 μέχρι 3, μετά Continue και τέλος OK Και τα αποτελέσματα: 13

P=0.003<0.05, δηλαδή η συστολική πίεση διαφέρει σημαντικά σε κάποιες από τις ομάδες Στο SPSS για την μη-παραμετρική ανάλυση δεν υπάρχει η αυτόματη επιλογή για τις πολλαπλές συγκρίσεις (Bonferroni) όπως στο One-Way ANOVA. Οπότε, για να διερευνηθούν ποιες ομάδες διαφέρουν σημαντικά μεταξύ τους, εφαρμόζεται το Mann- Whitney test όπως παραπάνω, για τη σύγκριση όλων των δυνατών συνδυασμών των ομάδων ανά δύο (δηλ. 1 vs. 2, 1 vs. 3 και 2 vs. 3). Αλλά τώρα κάτι θα θεωρείται στατιστικά σημαντικό αν το P<0.016 (0.05/3) με τη ρύθμιση κατά Bonferroni. ΑΣΚΗΣΗ: Συγκρίνετε την συστολική πίεση στις παραπάνω ομάδες ανά δύο με το Mann-Whitney test. Τελικά ποιες ομάδες διαφέρουν σημαντικά μεταξύ τους; 14

Σύγκριση μεταξύ 2 εξαρτημένων δειγμάτων Πραγματοποιήθηκε μια μελέτη που συμπεριλάμβανε 34 πρωτοδιαγνωσθέντες ασθενείς με σακχαρώδη διαβήτη. Στους 17 ασθενείς συστήθηκε μόνο άσκηση και απώλεια βάρους, ενώ στους υπόλοιπους ασθενείς εκτός της αλλαγής του τρόπου ζωής χορηγήθηκε και μετφορμίνη. Σε 2 ημέρες επαναλαμβάνουμε τη γλυκόζη νηστείας και στις δύο ομάδες. Στον πίνακα φαίνονται τα αποτελέσματα (metformin test.sav) Oμάδα διατροφής και άσκησης Ομάδα διατροφής και άσκησης και μετφορμίνης Πριν Μετά Πριν Μετά 150 151 145 102 125 122 142 123 142 140 136 122 128 120 148 99 162 151 157 158 125 127 195 187 145 122 154 136 138 138 185 112 147 145 154 145 158 154 165 132 142 125 168 122 143 127 142 127 172 155 178 156 169 147 198 128 157 151 122 101 165 99 148 142 141 111 143 113 Τα παραπάνω δεδομένα καταχωρούνται στο SPSS με τον παρακάτω τρόπο: Αρχικά δημιουργούνται οι διαφορές «πριν-μετά» ως μεταβλητές dif1 για την ομάδα της δίαιτας και dif2 για την ομάδα της μετφορμίνης και αυτές ελέγχονται για κανονικότητα.όταν η διαφορά είναι κανονική τότε οι συγκρίσεις των δύο εξαρτημένων ομάδων γίνεται με το t-test κατά ζεύγη (paired t-test)-όπως στην περίπτωση της ομάδας της μετφορμίνης, ενώ αν η διαφορά τους δεν κατανέμεται κανονικά με το 15

WilcoxonSigned Ranks test όπως στην περίπτωση της ομάδας της αλλαγής του τρόπου ζωής. Επιλέγοντας από το Toolbar Analyze Compare Means Paired-Samples T- test Μπαίνουν τα ζεύγη των μεταβλητών για σύγκριση και μετά OK Kαι τα αποτελέσματα: P<0,001 και μικρότερο του 0,05, άρα υπάρχει διαφορά στη γλυκόζη μετά τη λήψη της μετφορμίνης Αντίθετα ύστερα από εξέταση των δεδομένων στην ομάδα της διατροφής η διαφορά dif1 δεν είναι κανονικά κατανεμημένη, οπότε χρησιμοποιείται η μη παραμετρική ανάλυση Wilcoxon Signed Rank test, για την αντίστοιχη σύγκριση. Επιλέγοντας από το Toolbar Analyze Nonparametric Tests Legacy dialog 2 Related samples 16

Μέσα στο Options επιλέγεται το Quartiles για να παρουσιαστούν τα κατάλληλα στατιστικά και μετά Continue και τέλος OK Kαι τα αποτελέσματα: P=0.001 και άρα <0.05, και στην περίπτωση της ομάδας της διατροφής η γλυκόζη μετά την παρέμβαση (διάμεσος=138), είναι μικρότερη από τη γλυκόζη πριν την παρέμβαση (διάμεσος=145) 17

Σχέση μεταξύ δύο ποσοτικών μεταβλητών Ένας τρόπος για να εξεταστεί η σχέση ηλικίας και αιμοσφαιρίνης είναι με τον συντελεστή συσχέτισης (Pearson correlation coefficient). Ο συντελεστής συσχέτισης r κυμαίνεται μεταξύ 1 (αρνητική σχέση) και 1 (θετική σχέση). Επιλέγοντας από το Toolbar Analyze Correlate Bivariate : Στο Variables επιλέγονται οι ποσοτικές μεταβλητές και μετά OK. Στο Correlation Coefficients μπορεί να επιλεγεί και το Spearman αν δεν κατανέμονται κανονικά οι μεταβλητές Και παρουσιάζεται το παρακάτω πινακάκι: Όπου ο συντελεστής συσχέτισης είναι r=0.340 με P=0.143>0.05, δηλαδή η σχέση ηλικίας και αιμοσφαιρίνης δεν είναι σημαντική 18

Ένας άλλος τρόπος για να εξεταστεί η σχέση τους είναι με την γραμμική παλινδρόμηση (linear regression). Επίσης, αυτό το μοντέλο προσφέρεται και για πολυπαραγοντική ανάλυση. Επιλέγοντας από το Toolbar Analyze Regression Linear : Στο Dependent (εξαρτημένη μεταβλητή) επιλέγεται η μία ποσοτική μεταβλητή και στο Independent(s) (ανεξάρτητες μεταβλητές) η άλλη ποσοτική μεταβλητή και μετά OK Και τα παρακάτω αποτελέσματα παρουσιάζονται: Ο συντελεστής β=0.04, δηλαδή για κάθε 1 έτος αύξηση στην ηλικία, η αιμοσφαιρίνη αύξανε κατά 0.04 μονάδες, αλλά αυτή η σχέση δεν ήταν σημαντική (P=0.143>0.05) 19

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ Θα δούμε ένα παράδειγμα από 141 νεογνά που εγχειρίστηκαν σε ένα νοσοκομείο (surgery.sav). Οι παράμετροι που καταγράφηκαν είναι οι εξής: Κωδικός νεογνού (ID), Φύλο Νεογνού (GENDER, M=Male, F=Female), Περιοχή γέννησης (PLACE, L=Local, R= Regional O=Overseas) Βάρος νεογνού σε γραμμάρια (BIRTHWT) Βδομάδες κύησης (GESTATIO), Ημέρες νοσηλείας (LENGTHST), Λοίμωξη (INFECTION, 1= Yes, 0=No), Προωρότητα (PREMATUR, 1= Yes, 0=No) και Περιοχή επέμβασης (SURGERY, 1=Abdominal, 2=Cardiac, 3=Other): Ένα από τα ερωτήματα που δημιουργούνται είναι εάν η προωρότητα σχετίζεται με το φύλο. Τώρα για να εξεταστεί η σχέση φύλου και προωρότητας, χρησιμοποιείται η δοκιμασία χ 2 (Chi-square test). Το φύλο έχει 2 κατηγορίες: αγόρια και κορίτσια, όπως και η προωρότητα έχει 2 κατηγορίες (ναι και όχι) οπότε διαμορφώνεται ένας πίνακας συνάφειας 2x2. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνονται είναι: Η 0 : Το φύλο δεν σχετίζεται με την προωρότητα (είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας στα αγόρια και κορίτσια είναι το ίδιο Η 0 : p A = p K Η a : Το φύλο σχετίζεται με την προωρότητα (δεν είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας διαφέρει μεταξύ αγοριών και κοριτσιών Η a : p A p K Στην περίπτωση που ο αναμενόμενος αριθμός συχνοτήτων είναι <5, χρησιμοποιείται η ακριβή δοκιμασία κατά Fisher s (Fisher s exact-test). Επιλέγοντας από το Toolbar Analyze Descriptive Statistics Crosstabs : Στο Row(s) μπαίνει η μια ποιοτική μεταβλητή και στο Column(s) η άλλη ποιοτική μεταβλητή Μέσα στο Statistics επιλέγεται το Chi-square μετά Continue και τέλος OK 20

Και τα αποτελέσματα: P=0.012 <0.05, υπάρχει σημαντική σχέση μεταξύ φύλου και προωρότητας, το ποσοστό προωρότητας στα αγόρια ήταν σχεδόν διπλάσιο σε σχέση με τα κορίτσια (40.2% vs. 20.3%) Σε περίπτωση που το SPSS έχει ως υποσημείωση ότι κάποιο κελί έχει αναμενόμενο αριθμό συχνοτήτων < 5, χρησιμοποιείται το Fisher s Exact Test Λογαριθμιστική εξάρτηση Ένας άλλος τρόπος έκφρασης της παραπάνω σχέσης είναι με τον λόγο σχετικών πιθανοτήτων (odds-ratio), ο οποίος δίνεται από τη λογαριθμιστική εξάρτηση (logistic regression). Το χαρακτηριστικό αυτού του μοντέλου είναι ότι η έκβαση (εξαρτημένη μεταβλητή) είναι διχότομη. Επίσης, αυτό το μοντέλο προσφέρεται και για πολυπαραγοντική ανάλυση, δηλαδή την εύρεση πολλών σημαντικών παραγόντων που επηρεάζουν την έκβαση. Επιλέγοντας από το Toolbar Analyze Regression Binary Logistic : 21

Στο Dependent μπαίνει η διχότομη μεταβλητή και στο Covariates μπαίνουν οι ανεξάρτητες μεταβλητές, είτε ποιοτικές ή ποσοτικές. Από το Options επιλέγεται CI for exp(b) και μετά Continue και μετά OK. Και τα αποτελέσματα: O λόγος σχετικών πιθανοτήτων (odds ratio=exp(b)) = 0.379, δηλαδή η πιθανότητα προωρότητας ήταν (1-0.379=0.621) 62% μικρότερη στα κορίτσια απ ότι στα αγόρια. Το 95% ΔΕ (0.18, 0.82) δεν περιέχει την μονάδα οπότε η σχέση είναι και στατιστικά σημαντική (P=0.014) Η αντίστροφη σχέση αγόρια σε σχέση με τα κορίτσια μπορεί να οριστεί μέσα από το Categorical : 22

Επιλέγοντας το Categorical προσδιορίζεται ποια θα είναι η ομάδα αναφοράς στην ποιοτική μεταβλητή. Εδώ το Gender είναι κωδικοποιημένο 1=Males και 2=Females, οπότε βάζοντας τη μεταβλητή μέσα στο Categorical Covariates το Reference Category είναι Last. Δηλαδή Males vs. Females. Οπότε τώρα τα αποτελέσματα παρουσιάζονται αντίστροφα, η πιθανότητα για προωρότητα στα αγόρια σε σχέση με κορίτσια: O λόγος σχετικών πιθανοτήτων (odds ratio=exp(b)) = 2.638 (1/0.379), δηλαδή η πιθανότητα προωρότητας ήταν 2.6 φορές μεγαλύτερη στα αγόρια απ ότι στα κορίτσια. Το 95% ΔΕ (1.22, 5.71) δεν περιέχει την μονάδα οπότε η σχέση είναι και στατιστικά σημαντική (P=0.014) 23

2x3 πίνακες συνάφειας: Η δοκιμασία χ 2 μπορεί να εφαρμοστεί και σε μεγαλύτερους πίνακες συνάφειας 2x3. Για παράδειγμα μπορεί να εξεταστεί η σχέση περιοχής γέννησης και προωρότητας. Η περιοχή γέννησης έχει 3 κατηγορίες: τοπικά, περιφερειακά και εξωτερικό και η προωρότητα έχει 2 κατηγορίες (ναι και όχι) οπότε διαμορφώνεται ένας πίνακας συνάφειας 2x3. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνονται είναι: Η 0 : Η περιοχή γέννησης δεν σχετίζεται με την προωρότητα (είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας στις διάφορες περιοχές είναι το ίδιο Η 0 : p Τ = p Π = p Ε Η a : : Η περιοχή γέννησης σχετίζεται με την προωρότητα (δεν είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας διαφέρει μεταξύ των περιοχών (τουλάχιστον μεταξύ δύο περιοχών). Η a : p Τ p Π p Ε Επιλέγοντας από το Toolbar Analyze Descriptive Statistics Cross-tabs : Και τα αποτελέσματα: 24

Τώρα υπάρχει η υποσημείωση ότι ένα κελί έχει αναμενόμενη συχνότητα < 5 οπότε θα πρέπει να εφαρμοστεί το Fisher s Exact Test! To SPSS σε πίνακες συνάφειας μεγαλύτερους από 2x2 δεν εμφανίζει αυτόματα το Fisher s Exact Test διότι είναι μια δοκιμασία με πολλούς εντατικούς υπολογισμούς. Παρόλα αυτά υπάρχει τρόπος να υπολογιστεί πατώντας το κουμπί Exact στο πάνω δεξιά μέρος: Επειδή υπήρχε η υποσημείωση ότι υπάρχει κελί με αναμενόμενη συχνότητα < 5 πρέπει να εφαρμοστεί το Fisher s Exact Test πατώντας το κουμπί Exact Και τα αποτελέσματα: 25

P=0.079 >0.05 άρα δεν υπάρχει σημαντική σχέση μεταξύ περιοχής γέννησης και προωρότητας Έλεγχος γραμμικής τάσης σε διατεταγμένα δεδομένα (Chi-square test adjusting for trend) Για παράδειγμα διερευνάται αν υπάρχει κάποια τάση η οποία να δείχνει ότι τα ποσοστά λοίμωξης αυξάνουν σε νεογνά που μένουν περισσότερο μέσα στο νοσοκομείο. Η εμφάνιση λοίμωξης έχει 2 κατηγορίες: ναι και όχι και οι ημέρες νοσηλείας έχουν χωριστεί σε 5 ίσες κατηγορίες οπότε θεωρείται και διατεταγμένη μεταβλητή οπότε διαμορφώνεται ένας πίνακας συνάφειας 2x5. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνονται είναι: Η 0 : Η εμφάνιση λοίμωξης δεν σχετίζεται με τις ημέρες νοσηλείας (είναι ανεξάρτητα), δηλαδή το ποσοστό λοίμωξης δεν διαφέρει ανάλογα με τις ημέρες νοσηλείας Η 0 : p 0-18 = p 19-22 = p 23-30 = p 31-44 = p 45-244 Η a : Η εμφάνιση λοίμωξης σχετίζεται με τις ημέρες νοσηλείας (δεν είναι ανεξάρτητα), δηλαδή το ποσοστό λοίμωξης διαφέρει ανάλογα με τις ημέρες νοσηλείας Η a : p 0-18 p 19-22 p 23-30 p 31-44 p 45-244 26

Και τα αποτελέσματα: P=0.002 >0.05 υπάρχει γραμμική τάση η οποία δείχνει ότι τα ποσοστά λοίμωξης αυξάνουν ανάλογα με τις ημέρες λοίμωξης Κοιτώντας το και γραφικά με ένα ραβδόγραμμα: 27

Άσκηση για το σπίτι: 1. Να ελέγξετε αν οι ημέρες νοσηλείας (LENGHTST) διαφέρουν ανάλογα με τον τύπο της επέμβασης (SURGERY) 2. Να ελέγξετε αν η εμφάνιση λοίμωξης (INFECTION) σχετίζεται με το φύλο και να το παρουσιάσετε και με λόγο σχετικών πιθανοτήτων. 28

Παρατηρήσεις κατά ζεύγη (εξαρτημένα δείγματα) Στην περίπτωση που τα δείγματα δεν είναι ανεξάρτητα αλλά εξαρτημένα δεν μπορεί να χρησιμοποιηθεί η δοκιμασία χ 2 διότι προϋποθέτει ανεξαρτησία μεταξύ των δειγμάτων. Για παράδειγμα, μια ομάδα ασθενών μελετήθηκε σε δύο χρονικές στιγμές, πριν και μετά τη λήψη μιας παρέμβασης. Η κατάλληλη δοκιμασία σε αυτήν την περίπτωση είναι η δοκιμασία Mc Nemar. Γι αυτήν την ανάλυση θα χρησιμοποιηθεί η βάση pairedcategorical.sav, στην οποία έχει καταγραφεί η ανταπόκριση, θετική + και αρνητική -, 20 ασθενών σε 3 χρονικές στιγμές (antaporkrisia, antapokrisib, antapokrisic). Ένα ερευνητικό ερώτημα είναι εάν η ανταπόκριση μεταβλήθηκε σημαντικά μεταξύ της Α και της Β χρονικής στιγμής. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνεται είναι η εξής: Η 0 : Η ανταπόκριση δεν μεταβλήθηκε σημαντικά μεταξύ της Α και της Β χρονικής στιγμής Η a : Η ανταπόκριση μεταβλήθηκε σημαντικά μεταξύ της Α και της Β χρονικής στιγμής Επιλέγοντας από το Toolbar Analyze Descriptive Statistics Cross-tabs : Στο Row(s) επιλέγεται η μια μεταβλητή και στο Column(s) η άλλη. Μέσα στο Statistics επιλέγεται το McNemar και μετά Continue και μετά OK 29

Και τα αποτελέσματα: P=0.727>0.05 δεν υπήρχε τελικά σημαντική μεταβολή στην ανταπόκριση μεταξύ της Α και της Β χρονικής στιγμής Στην περίπτωση που θα θέλαμε να ελέγξουμε την ανταπόκριση σε 3 χρονικές στιγμές, η κατάλληλη δοκιμασία είναι το Cochrane s Q test. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνεται είναι η εξής: Η 0 : Η ανταπόκριση δεν μεταβλήθηκε σημαντικά μεταξύ της Α, και της Γ χρονικής στιγμής Η a : Η ανταπόκριση μεταβλήθηκε σημαντικά μεταξύ τουλάχιστον 2 χρονικών στιγμών. Επιλέγοντας από το Toolbar Analyze Nonparametrics Tests Legacy dialogs K Related Samples : 30

Επιλέγονται και οι 3 χρονικές στιγμές μέσα στο Test Variables και στο Test Type επιλέγεται το Cochran s Q και μετά OK Και τα αποτελέσματα: P=0.150>0.05 δεν μεταβλήθηκε σημαντικά η ανταπόκριση μεταξύ των 3 χρονικών στιγμών 31

Ανάλυση επιβίωσης Η ανάλυση επιβίωσης χρησιμοποιείται για συμβάντα στο χρόνο, π.χ. χρόνος μέχρι τον θάνατο ή χρόνος μέχρι την υποτροπή. Σε μια μελέτη από 22 ασθενείς εξετάστηκε ο χρόνος μέχρι την υποτροπή για λευχαιμία. Μισοί από τους ασθενείς είχαν τυχαιοποιηθεί για μια καινούρια θεραπεία (6-MP) και οι άλλοι μισοί για μια παλιά θεραπεία (Control). Τα δεδομένα παρουσιάζονται παρακάτω και να καταχωρηθούν στο SPSS: Η σύγκριση δεδομένων που αφορούν συμβάντα στο χρόνο γίνεται με τη δοκιμασία logrank (log-rank test) και παρουσιάζονται με τις καμπύλες Kaplan-Meier. Επιλέγοντας από το Toolbar Analyze Survival Kaplan-Meier : Στο Time μπαίνει η μεταβλητή χρόνου, στο Status η έκβαση, στο Define Event μπαίνει η μονάδα έκβασης και στο Factor η ποιοτική μεταβλητή που υποδηλώνει τις ομάδες σύγκρισης Μέσα στο Compare Factor επιλέγεται η μέθοδος της σύγκρισης Log rank, μετά Continue και μετά Options 32

Μέσα στο Options επιλέγεται στο Plots το Survival για να εμφανιστούν και οι καμπύλες Kaplan-Meier, και μετά Continue και τέλος OK Και τα αποτελέσματα: Ο διάμεσος χρόνος μέχρι την υποτροπή ήταν 4 βδομάδες στην ομάδα Control και 10 βδομάδες στην ομάδα 6-MP και αυτή η διαφορά ήταν στατιστικά σημαντική (Logrank test P<0.001) Και οι καμπύλες Kaplan-Meier: 33

Ένας άλλος τρόπος έκφρασης της παραπάνω σχέσης είναι με τον σχετικό κίνδυνο (hazards ratio), ο οποίος δίνεται από το μοντέλο αναλογικών κινδύνων κατά Cox (Cox proportional Hazards model). Επίσης, αυτό το μοντέλο προσφέρεται και για πολυπαραγοντική ανάλυση, δηλαδή την εύρεση πολλών σημαντικών παραγόντων που επηρεάζουν την έκβαση. Επιλέγοντας από το Toolbar Analyze Survival Cox Regression : Και τα αποτελέσματα: Στο Time μπαίνει η μεταβλητή χρόνου, στο Status η έκβαση, στο Define Event μπαίνει η μονάδα έκβασης και στο Covariates η ποιοτική μεταβλητή που υποδηλώνει της ομάδες σύγκρισης ή άλλες ποσοτικές μεταβλητές 34

Ο κίνδυνος υποτροπής ήταν (1-0.145=0.855) 85% μικρότερος στην ομάδα με 6-MP θεραπεία σε σχέση με την Control και αυτή η διαφορά ήταν στατιστικά σημαντική (P=0.001) 35

Διάγραμμα ροής στατιστικών δοκιμασιών ΠΟΣΟΤΙΚΑ ΔΕΔΟΜΕΝΑ 2 ΟΜΑΔΕΣ > 2 ΟΜΑΔΕΣ ΕΞΑΡΤΗΜΕΝΕΣ ΑΝΕΞΑΡΤΗΤΕΣ ΕΞΑΡΤΗΜΕΝΕΣ ΑΝΕΞΑΡΤΗΤΕΣ Παραμετρική Παραμετρική Παραμετρική Παραμετρική T-TEST KATA ΖΕΥΓΗ T-TEST REPEATED MEASURES ANOVA ANOVA Μη-παραμετρική Μη-παραμετρική Μη-παραμετρική Μη-παραμετρική WILCOXON SIGNED RANKS TEST MANN- WHITNEY U TEST FRIEDMAN S TEST KRUSKAL- WALLIS TEST 36

ΠΟIOΤΙΚΑ ΔΕΔΟΜΕΝΑ 2 ΟΜΑΔΕΣ > 2 ΟΜΑΔΕΣ ΕΞΑΡΤΗΜΕΝΕΣ ΑΝΕΞΑΡΤΗΤΕΣ ΕΞΑΡΤΗΜΕΝΕΣ ΑΝΕΞΑΡΤΗΤΕΣ MC NEMAR S TEST ΑΑΣ 5 COCHRAN S Q TEST ΑΑΣ 5 Χ 2 TEST Χ 2 TEST ΑΑΣ <5 ΑΑΣ <5 FISHER S EXACT TEST FISHER S EXACT TEST ΑΑΣ: Αναμενόμενος αριθμός συχνοτήτων 37

Πίνακας: Στατιστικές δοκιμασίες που χρησιμοποιούνται συχνά Παραμετρική δοκιμασία t test για 2 ανεξάρτητες ομάδες t test για 2 εξαρτημένες ομάδες Ανάλυση διακύμανσης ANOVA Αντίστοιχη μηπαραμετρική δοκιμασία Λόγος εφαρμογής Παράδειγμα Mann-Whitney U test Σύγκριση 2 ανεξάρτητων ομάδων Wilcoxon Σύγκριση μιας signed ranks test μεταβλητής σε δύο περιπτώσεις Kruskall-Wallis test Σύγκριση 3 ή και περισσοτέρων ανεξάρτητων ομάδων Σύγκριση ύψους μεταξύ αγοριών και κοριτσιών Σύγκριση του βάρους νεογνών κατά τη γέννα και την έξοδο από το νοσοκομείο Σύγκριση των επιπέδων γλυκόζης σε 4 διαφορετικές ηλικιακές ομάδες (20-30, 30-40, 40-50, >50) Συντελεστής συσχέτισης κατά Pearson (Pearson's r) Συντελεστής συσχέτισης κατά Spearman (r s ) Εκτίμηση της συσχέτισης μεταξύ δύο ποσοτικών μεταβλητών Διερεύνηση της σχέσης μεταξύ της αιμοσφαιρίνης και των τριγλυκεριδίων σε διαβητικούς ασθενείς 38

Πίνακας: Μοντέλα εξαρτήσεων Μοντέλο Λόγος εφαρμογής Παράδειγμα Γραμμικής εξάρτησης Περιγραφή της σχέσης μιας ποσοτικής εξαρτημένης μεταβλητής με έναν ή περισσότερους ανεξάρτητους παράγοντες είτε ποσοτικούς ή ποιοτικούς Λογαριθμιστικής εξάρτησης Περιγραφή της σχέσης μιας διχότομης ποιοτικής εξαρτημένης μεταβλητής με έναν ή περισσότερους ανεξάρτητους παράγοντες είτε ποσοτικούς ή ποιοτικούς Αναλογικών κινδύνων Cox Περιγραφή της σχέσης μιας διχότομης ποιοτικής εξαρτημένης μεταβλητής που μετράται στο χρόνο με έναν ή περισσότερους ανεξάρτητους παράγοντες είτε ποσοτικούς ή ποιοτικούς Αν η συστολική πίεση εξαρτάται από το φύλο, την ηλικία και το σωματικό λίπος Αν η πιθανότητα υποτροπής εξαρτάται από τη θεραπεία και την ηλικία Αν ο χρόνος μέχρι να πεθάνουν οι ασθενείς εξαρτάται από το στάδιο καρκίνου, τη θεραπεία και την ηλικία 39