ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΙΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ,ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» Μεταπτυχιακή Διπλωματική Εργασία Η Λογιστική Παλινδρόμηση ως μέθοδος της Διαχωριστικής Ανάλυσης The use of Logistic Regression for Discriminant Analysis Επιβλέποντες: Απόστολος Μπατσίδης, Επίκουρος Καθηγητής, Τμήμα Μαθηματικών, Πανεπιστήμιο Ιωαννίνων. Χρήστος Χατζηχριστοδούλου, Καθηγητής Υγιεινής και Επιδημιολογίας, Ιατρική Σχολή Λάρισας, Πανεπιστήμιο Θεσσαλίας Γεώργιος Ραχιώτης, Επίκουρος Καθηγητής Επιδημιολογίας και Επαγγελματικής Υγιεινής, Ιατρική Σχολή Λάρισας, Πανεπιστήμιο Θεσσαλίας Ευαγγελία Αστάρα Λάρισα 2017

2 ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1: Περίληψη.. 3 Κεφάλαιο 2: Λογιστική Παλινδρόμηση.. 3 Κεφάλαιο 3: Διαχωριστική Ανάλυση.. 7 Κεφάλαιο 4: Ομοιότητες και Διαφορές Λογιστικής Παλινδρόμησης και Διαχωριστικής Ανάλυσης Κεφάλαιο 5: Εφαρμογές Βιβλιογραφία

3 Κεφάλαιο 1: Περίληψη Αντικείμενο αυτής της διπλωματικής διατριβής είναι δύο μέθοδοι, που σκοπός τους, μεταξύ άλλων, είναι να κατατάσσουν τις πειραματικές μονάδες σε γνωστές ομάδες βάσει των διαθέσιμων μετρήσεων σε κάποια χαρακτηριστικά γνωρίσματα (μεταβλητές). Αυτές οι μέθοδοι είναι η λογιστική παλινδρόμηση (logistic regression) και η διαχωριστική ή διαφοροποιούσα ανάλυση (discriminant analysis). Απώτερος στόχος της διπλωματικής διατριβής είναι να αναδείξει πώς η λογιστική παλινδρόμηση μπορεί να χρησιμοποιηθεί ως μέθοδος διαχωριστικής ανάλυσης. Στο πλαίσιο αυτό, στο δεύτερο κεφάλαιο («Λογιστική Παλινδρόμηση») το μοντέλο της λογιστικής παλινδρόμησης περιγράφεται εν συντομία, ενώ περιληπτικά αναφέρεται το αντικείμενο της Διαχωριστικής Ανάλυσης στο τρίτο κεφάλαιο («Διαχωριστική Ανάλυση»). Στο τέταρτο κεφάλαιο περιγράφονται οι ομοιότητες και οι διαφορές των δύο μεθόδων. Στο πέμπτο κεφάλαιο («Εφαρμογές») παρατίθενται τρεις εφαρμογές σε γνωστά σύνολα δεδομένων. Ειδικότερα στα τρία αυτά σύνολα δεδομένων η λογιστική παλινδρόμηση χρησιμοποιείται ως μέθοδος της διαχωριστικής ανάλυσης. Η υλοποίηση αυτή πραγματοποιείται με τη βοήθεια του στατιστικού πακέτου ΙΒΜ SPSS. Τέλος, η διπλωματική διατριβή ολοκληρώνεται με την παράθεση χρήσιμων βιβλιογραφικών αναφορών. Κεφάλαιο 2: Λογιστική Παλινδρόμηση Η Λογιστική Παλινδρόμηση (logistic regression, ή logit regression, ή logit model), η οποία πρωτοπαρουσιάσθηκε στη στατιστική βιβλιογραφία από τον D. Cox (1958), είναι ένα μοντέλο παλινδρόμησης στο οποίο η εξαρτημένη μεταβλητή είναι κατηγορική, ενώ οι ανεξάρτητες μεταβλητές μπορεί να είναι είτε ποσοτικές συνεχείς, είτε κατηγορικές. Στο σημείο αυτό θα πρέπει να επισημανθεί ότι μια κατηγορική ανεξάρτητη μεταβλητή υπεισέρχεται στο μοντέλο της λογιστικής παλινδρόμησης με τη βοήθεια κ 1 το πλήθος δείκτριων μεταβλητών (indicators ή dummy), όπου με κ συμβολίζεται το πλήθος των επιπέδων της κατηγορικής ανεξάρτητης μεταβλητής. Δείκτρια είναι κάθε δίτιμη μεταβλητή με τιμές 1 και 0. 3

4 Στόχος λοιπόν της Λογιστικής Παλινδρόμησης είναι η δημιουργία ενός μοντέλου πρόβλεψης των τιμών της υπό μελέτης κατηγορικής εξαρτημένης μεταβλητής χρησιμοποιώντας κάποιες ποσοτικές και ποιοτικές ανεξάρτητες μεταβλητές. Είναι εύκολα αντιληπτό λόγω αντικειμένου της Λογιστικής Παλινδρόμησης ότι βρίσκει εφαρμογή σε πλήθος επιστημονικών πεδίων. Για παράδειγμα στο χώρο της υγείας για την πρόβλεψη αν ένα έμβρυο θα γεννηθεί με βάρος λιγότερο ή περισσότερο από 2.5 κιλά, στο χώρο του Marketing για την πρόβλεψη αν ένας καταναλωτής προβεί στην αγορά ή όχι κάποιων προϊόντων, στο χώρο της παιδείας για την πρόβλεψη αν ένας μαθητής επιτύχει ή όχι στις εξετάσεις ενός μαθήματος. Διακρίνονται τρεις τύποι λογιστικής παλινδρόμησης ανάλογα με την ιδιαίτερη φύση της εξαρτημένης κατηγορικής μεταβλητής, η Binary (Δίτιμη ή διχοτομική), η Multinomial (πολυωνυμική ή πολυχοτομική) και η Ordinal (Διατάξιμη). Ειδικότερα, στην Binary Logistic Regression, η εξαρτημένη κατηγορική μεταβλητή συνίσταται από δύο κατηγορίες, όπως π.χ. είναι οι εκβάσεις επιτυχία/αποτυχία, ΝΑΙ/ΟΧΙ, γεγονός απόν/παρόν. Στην Multinomial Logistic Regression η εξαρτημένη μεταβλητή έχει τρεις ή περισσότερες κατηγορίες, οι οποίες δεν έχουν κάποια φυσική διαβάθμιση. Για παράδειγμα όταν η εξαρτημένη μεταβλητή είναι ο χαρακτηρισμός του χρώματος αντικειμένων ως ερυθρού, πράσινου, κίτρινου κτλ. Τέλος, στην Ordinal Logistic Regression η εξαρτημένη μεταβλητή συνίσταται από δύο ή περισσότερες κατηγορίες μεταξύ των οποίων ισχύει η έννοια της ανισότητας, όπως π.χ. σε μια ερώτηση συμφωνίας/διαφωνίας με κλίμακα καθόλου, λίγο, μέτρια, αρκετά, πολύ ή στην κατάταξη ενός στρώματος υλικού ως λεπτού, μεσαίου, παχέος. Σε όσα ακολουθούν, χωρίς βλάβη της γενικότητας, το ενδιαφέρον περιορίζεται στην περίπτωση της Binary Logistic Regression, δηλαδή σε περιπτώσεις δίτιμων εξαρτημένων τυχαίων μεταβλητών, με την τιμή 1 της εξαρτημένης μεταβλητής να αντιστοιχεί σε "επιτυχία" και την τιμή 0 σε "αποτυχία". Από τα παραπάνω γίνεται αντιληπτό ότι η Λογιστική Παλινδρόμηση έχει σκοπό παρόμοιο με εκείνον της κλασικής Γραμμικής Παλινδρόμησης με τη διαφοροποίηση ότι στην περίπτωση της Λογιστικής Παλινδρόμησης η εξαρτημένη 4

5 μεταβλητή είναι κατηγορική και όχι ποσοτική. Επισημαίνεται ότι σε τέτοιες περιπτώσεις η υιοθέτηση ενός μοντέλου κλασικής γραμμικής παλινδρόμησης είναι εσφαλμένη, καθώς δεν πληρούνται βασικές υποθέσεις για τα σφάλματα (ομοσκεδαστικότητα, κανονικότητα) καθώς επίσης παραβιάζεται και η υπόθεση της γραμμικότητας ορθότητας του μοντέλου. Για να ξεπεραστούν αυτά τα προβλήματα, στην περίπτωση των δίτιμων εξαρτημένων κατηγορικών μεταβλητών, το πιο διαδεδομένο μοντέλο Binary Logistic Regression υιοθετεί τον λεγόμενο λογιστικό µετασχηµατισµό (logit), ο οποίος ορίζεται ως: ή ισοδύναμα ln odds X... X i m mi pi 1 p PY ( 1/ X) ln X... X i i i i m mi όπου 0 1X1... X είναι ένας γραµµικός συνδυασµός των m το πλήθος i m mi ανεξάρτητων μεταβλητών X..., 1, X m που συμμετέχουν στο μοντέλο της λογιστικής παλινδρόμησης, ενώ odds = p/(1 p), με p να συμβολίζεται η πιθανότητα να συμβεί το γεγονός που έχει ορισθεί ως επιτυχία (Υ=1) του πειράματος, με Υ να συμβολίζει την κατηγορική δίτιμη εξαρτημένη μεταβλητή. Τα odds ουσιαστικά παριστάνουν τη σχετική συχνότητα με την οποία διαφορετικά ενδεχόμενα πραγματοποιούνται, ενώ οι συντελεστές ερμηνεύονται ως η αλλαγή στο Log odds για μοναδιαία αύξηση στην τιμή της ανεξάρτητης μεταβλητής, όταν οι υπόλοιπες ανεξάρτητες μεταβλητές παραμένουν σταθερές. Από την παραπάνω σχέση εύκολα προκύπτει με αλγεβρικές πράξεις ότι p i 0 1X1i mx mi 0 1X1i mx mi 0 1X1i mx mi exp exp... 1 exp... 5

6 Επομένως για κάθε πειραματική μονάδα μπορεί να προκύψει μια (προβλεπτική) πιθανότητα πραγματοποίησης του γεγονότος που έχει ορισθεί ως επιτυχία. Αν η πιθανότητα αυτή ξεπερνά το 50% τότε η πειραματική μονάδα κατατάσσεται στο γκρουπ με τιμή στην εξαρτημένη μεταβλητή=1 (επιτυχία), ενώ διαφορετικά στο άλλο γκρουπ. Χρησιμοποιώντας την παραπάνω χαρακτηριστική ιδιότητα προκύπτει ότι κάποιος μπορεί να χρησιμοποιήσει τη λογιστική παλινδρόμηση ως μέθοδο Διαχωριστικής ή Διαφοροποιούσας Ανάλυσης, ως μια μέθοδο δηλαδή για να κατατάσσει μία νέα πειραματική μονάδα σε ένα από τα δύο γκρουπ (τιμές της εξαρτημένης μεταβλητής Υ) με βάση τις τιμές σε ένα πλήθος χαρακτηριστικών, όπως αυτά δηλώνονται στις ανεξάρτητες μεταβλητές. Αυτό απαιτεί τον υπολογισμό για τη νέα πειραματική μονάδα της προβλεπόμενης πιθανότητας, η οποία θα προκύπτει από το μοντέλο της Λογιστικής Παλινδρόμησης. Για να υπολογιστούν αυτές οι πιθανότητες απαραίτητη προϋπόθεση είναι η εκτίμηση των άγνωστων παραμέτρων, συντελεστών (β 0,... β m ). Οι συντελεστές των ανεξάρτητων µεταβλητών στην εξίσωση της παλινδρόµησης εκτιµώνται βάσει της µεθόδου της Μέγιστης Πιθανοφάνειας. Σε αντίθεση με την κλασική γραμμική παλινδρόμηση, όπου υπό την υπόθεση της κανονικότητας των σφαλμάτων, οι Εκτιμητές Μέγιστης Πιθανοφάνειας (ΕΜΠ) προσδιορίζονται σε κλειστή αναλυτική μορφή, στο μοντέλο της Λογιστικής Παλινδρόμησης οι ΕΜΠ δεν προσδιορίζονται σε κλειστή μορφή και χρησιμοποιούνται αριθμητικές μέθοδοι, όπως ο αλγόριθμος Newton (Hosmer and Lemeshow, 2000). Οι υποθέσεις της Λογιστικής Παλινδρόμησης είναι οι ακόλουθες (Tabachnick and Fidell, 2012): Υπόθεση 1 LR. Δεν πρέπει να υπάρχουν ακραίες τιμές στα δεδομένα. Η υπόθεση αυτή μπορεί να ικανοποιηθεί με τη μετατροπή των συνεχών μεταβλητών σε τυποποιημένες τιμές και την απομάκρυνση των πειραματικών μονάδων με τιμές μικρότερες από 3,29 ή μεγαλύτερες από 3,29. Υπόθεση 2 LR. Δεν πρέπει να υπάρχει υψηλή συσχέτιση μεταξύ των ανεξάρτητων μεταβλητών (συγγραμμικότητα). Κάτι τέτοιο μπορεί να ελεγχθεί είτε από τον πίνακα συσχετίσεων είτε με την εφαρμογή διαγνωστικών ελέγχων. 6

7 Υπόθεση 3 LR. Πρέπει να υπάρχει γραμμική σχέση μεταξύ του λογαρίθμου των Odds και των ανεξάρτητων μεταβλητών. Παρατηρήσεις 1. Η Λογιστική Παλινδρόµηση, για την σωστή εφαρµογή της απαιτεί µεγάλο δείγµα, προκειµένου να παράγει αξιόπιστο αποτέλεσµα. Ένας εµπειρικός κανόνας αναφέρει ότι το δείγµα θα πρέπει να είναι 30 φορές µεγαλύτερο από τον αριθµό των παραµέτρων που εκτιµά το µοντέλο 2. Τα βήµατα κατασκευής ενός µοντέλου Λογιστικής Παλινδρόµησης είναι ανάλογα αυτών της γραµµικής παλινδρόµησης. Αρχικά προσδιορίζεται η κατηγορική εξαρτημένη μεταβλητή και το σύνολο των ανεξάρτητων µεταβλητών που θα συµµετέχουν στην παλινδρόµηση. Έπειτα, διερευνούµε τα δεδοµένα για ύπαρξη ασυνήθιστων πειραματικών μονάδων (ύπαρξη ακραίων τιμών), ελέγχουµε την ικανοποίηση των υποθέσεων της Λογιστικής Παλινδρόμησης και διερευνούμε αν υπάρχει κάποια συγκεκριµένη τιµή η οποία επηρεάζει υπερβολικά τα αποτελέσµατα. Τέλος, ερμηνεύουμε τα αποτελέσματα που αφορούν την επίδραση κάθε ανεξάρτητης μεταβλητής στο μοντέλο. Θα ήταν παράλειψη να μην αναφερθεί ότι στο εξεταζόμενο μοντέλο παλινδρόμησης δύναται να εφαρμοστούν τεχνικές βέλτιστης επιλογής ανεξάρτητων μεταβλητών προς ένταξη και διαγνωστικά κριτήρια εγκυρότητας και αξιοπιστίας του μοντέλου (Δημητροπουλάκης, 2017) Κεφάλαιο 3: Διαχωριστική Ανάλυση Η Διαχωριστική ή Διαφοροποιούσα Ανάλυση (Discriminant Analysis) είναι κλάδος της Πολυμεταβλητής Ανάλυσης, που αναπτύχθηκε από τον R. A. Fisher (1936) ο οποίος εισήγαγε την έννοια της γραμμικής διαχωριστικής συνάρτησης σε μία από τις κλασικές εφαρμογές της διαχωριστικής ανάλυσης, για την ταξινόμηση λουλουδιών. Η μέθοδος της διαχωριστικής ανάλυσης έχει διττό στόχο. Ο ένας της 7

8 στόχος είναι η διάκριση ενός πληθυσμού σε ευδιάκριτα σύνολα (ομάδες υποπληθυσμούς) και ο απώτερος στόχος της είναι να κατατάξει, να ταξινομήσει μια νέα παρατήρηση, μια νέα πειραματική μονάδα σε έναν από δύο ή περισσότερους εκ των προτέρων πλήρως προσδιορισμένους πληθυσμούς. Παραδείγματα προβλημάτων τέτοιου τύπου είναι η ταξινόμηση ενός εμβρύου στην ομάδα των βρεφών που θα γεννηθούν με φυσιολογικό βάρος ή στην ομάδα αυτών που θα γεννηθούν ολιγοβαρή, η ταξινόμηση ενός υποψήφιου μεταπτυχιακού φοιτητή σε αυτούς που θα ολοκληρώσουν με επιτυχία τις μεταπτυχιακές σπουδές ή σε αυτούς που θα αποτύχουν. Ένα άλλο παράδειγμα αποτελεί ο διαχωρισμός των πρωτεϊνών σε κατηγορίες με βάση τις γεωμετρικές τους αποστάσεις, διαχωρισμός που επιπρόσθετα θα βοηθήσει στην εύρεση των χαρακτηριστικών που θα μπορέσουν να ομαδοποιήσουν και οποιαδήποτε άλλη πρωτεΐνη. Είναι προφανές ότι η Διαχωριστική Ανάλυση βρίσκει εφαρμογή σε αρκετούς επιστημονικούς τομείς. Ειδικότερα, έχει εφαρμογές για παράδειγμα στην Ιατρική για τη διάγνωση ασθενειών με βάση τα συμπτώματα, στις πολιτικές επιστήμες για τη μελέτη της εκλογικής συμπεριφοράς, στον τραπεζικό τομέα για την ανάλυση του προφίλ των δανειοληπτών, στην Πληροφορική για την αναγνώριση προτύπων (pattern recognition). Η πρώτη βασική προϋπόθεση για την εφαρμογή της διαχωριστικής ανάλυσης είναι ότι οι παρατηρήσεις πρέπει να είναι μέλη δύο ή περισσότερων αμοιβαία αποκλειόμενων ομάδων, δηλαδή οι ομάδες πρέπει να ορίζονται με τέτοιο τρόπο, ώστε κάθε παρατήρηση να ανήκει σε μία και μόνη ομάδα. Οι μεταβλητές στη διαχωριστική ανάλυση είναι είτε ποσοτικές είτε δείκτριες. Οι μεταβλητές αυτές ονομάζονται και διακριτικές μεταβλητές (discriminating variables). Πρέπει να υπάρχει όμως στα δεδομένα μία ποιοτική μεταβλητή, με βάση την οποία να ορίζονται οι ομάδες των παρατηρήσεων, όπως στην ανάλυση διασποράς. Σύμφωνα με την Ηλιοπούλου (2015) η διαχωριστική ανάλυση μπορεί να θεωρηθεί ως μια τεχνική παλινδρόμησης, όπου εξαρτημένη μεταβλητή είναι η ποιοτική μεταβλητή, η οποία ορίζει τις ομάδες των παρατηρήσεων και ανεξάρτητες μεταβλητές οι ποσοτικές μεταβλητές, οι οποίες διαχωρίζουν τις ομάδες (Klecka, 1980). 8

9 Όπως και σε άλλες στατιστικές μεθοδολογίες, έτσι και στη Διαχωριστική Ανάλυση, υπάρχουν κάποιοι περιορισμοί στις στατιστικές ιδιότητες που πρέπει να έχουν οι διακριτικές μεταβλητές. Στη συνέχεια παρατίθενται αυτές (Ηλιοπούλου, 2015): Υπόθεση 1 DA. Κάθε ομάδα έχει προκύψει από πληθυσμό ο οποίος ακολουθεί την πολυδιάστατη (πολυμεταβλητή) κανονική κατανομή. Δηλαδή κάθε μεταβλητή έχει κανονική κατανομή για συγκεκριμένες τιμές των άλλων μεταβλητών. Υπόθεση 2 DA. Δεν πρέπει να χρησιμοποιούνται διακριτικές μεταβλητές με μεγάλους συντελεστές συσχέτισης μεταξύ τους (πολυσυγγραμμικότητα). Υπόθεση 3 DA. Στην περίπτωση του γραμμικού διαχωριστικού κανόνα, οι πίνακες διακύμανσεων συνδιακυμάνσεων (variance covariance matrices) των ομάδων είναι ίσοι. Αυτή η προϋπόθεση διευκολύνει τον υπολογισμό των διακριτικών συναρτήσεων, επειδή οι συναρτήσεις αυτές υπολογίζονται συνήθως ως γραμμικοί συνδυασμοί των διακριτικών μεταβλητών. Τέλος, το δείγμα πρέπει να είναι μεγάλο ώστε να είναι ανθεκτική (robust) η διαδικασία σε περίπτωση μη κανονικών κατανομών. Επιπλέον, το πλήθος των πειραματικών μονάδων πρέπει να υπερβαίνει τον αριθμό των μεταβλητών και για αυτό το λόγο συνήθως προτείνεται ο κανόνας ο αριθμός των πειραματικών μονάδων να είναι εικοσαπλάσιος του αριθμού των διακριτικών μεταβλητών (Ηλιοπούλου, 2015). Στο πλαίσιο αυτό στη βιβλιογραφία έχουν εμφανιστεί διάφορες μεθοδολογίες για την κατασκευή ενός κανόνα διαχωρισμού, διάκρισης δύο πληθυσμών με τη βοήθεια των τιμών που παίρνουν κάποιες μεταβλητές (τις οποίες τις καθορίζουμε κάθε φορά εξαρχής με βάση το διαχωρισμό που θέλουμε να κάνουμε). Στη συνέχεια εν συντομία αναφέρουμε τις τέσσερεις σημαντικότερες και πιο ευρέως χρησιμοποιούμενες μεθόδους. 9

10 α) Το κριτήριο Μέγιστης Πιθανοφάνειας Είναι ένας απλός τρόπος για να αποφασίσουμε σε ποια ομάδα θα κατατάξουμε μια καινούρια παρατήρηση. Η λογική του κριτηρίου είναι να βρεθεί η τιμή της πιθανοφάνειας που έχει αυτή η παρατήρηση στην καθεμία ομάδα, και όπου έχουμε τη μεγαλύτερη πιθανοφάνεια θα είναι και η πιο πιθανή περιοχή για να κατατάξουμε την παρατήρησή μας. β) Ο κανόνας του Bayes Καθώς ο πιο πάνω κανόνας δε λαμβάνει υπόψη του εάν οι ομάδες μας έχουν διαφορετικά μεγέθη, θέλουμε να βρούμε έναν κανόνα στον οποίο θα χρησιμοποιούμε και την πιθανότητα να πάρουμε μια παρατήρηση από την κάθε ομάδα. Για να γίνει αυτό πρέπει να χρησιμοποιήσουμε τον κανόνα απόφασης του Bayes, οπότε πρέπει να βρούμε τις εκ των υστέρων πιθανότητες οι οποίες για να βρεθούν χρειαζόμαστε τις τιμές της πιθανοφάνειας αλλά και τις εκ των προτέρων πιθανότητες. γ) Ο κανόνας ελαχιστοποίησης του κόστους λανθασμένης κατάταξης Όπως είναι κατανοητό οι κανόνες διαχωρισμού κάποιες φορές κάνουν λάθος στην κατάταξη. Όμως σε μερικές περιπτώσεις, ενδέχεται η κατάταξη μιας παρατήρησης που θα έπρεπε να είναι στην 1 η ομάδα, αλλά τοποθετείται στην 2 η ομάδα, να έχει σοβαρότερη επίπτωση από την αντίθετη περίπτωση. Επομένως θα πρέπει να λαμβάνουμε υπόψη και το κόστος που θα έχουμε από την κάθε μια λανθασμένη κατάταξη ώστε να βρεθεί ένας βέλτιστος κανόνας. Η λογική αυτή κρύβεται πίσω από τον κανόνα ελαχιστοποίησης του κόστους λανθασμένης ταξινόμησης δ) Ο κανόνας ελαχιστοποίησης της συνολικής πιθανότητας λανθασμένης κατάταξης Είναι ένας κανόνας που χρησιμοποιείται για το διαχωρισμό δύο πληθυσμών, ο οποίος όμως δε λαμβάνει υπόψη το κόστος. Σκοπός του είναι να ελαχιστοποιήσει 10

11 τη συνολική πιθανότητα λανθασμένων κατατάξεων (TPM Total Probability of Misclassification). Κεφάλαιο 4: Ομοιότητες και Διαφορές Λογιστικής Παλινδρόμησης και Διαχωριστικής Ανάλυσης Στο Κεφάλαιο αυτό περιγράφονται, συνοπτικά, οι ομοιότητες και οι διαφορές της διαχωριστικής ανάλυσης και της λογιστικής παλινδρόμησης. Ομοιότητες: Από την περιγραφή του στόχου των δύο μεθόδων που έγινε στα προηγούμενα κεφάλαια είναι κατανοητό ότι οι δύο μέθοδοι χρησιμοποιούνται ή μπορούν να χρησιμοποιηθούν για να κατατάξουν, ταξινομήσουν μία ή περισσότερες νέες πειραματικές μονάδες σε γνωστές ομάδες. Επιπλέον πρόκειται για διαδεδομένες μεθοδολογίες, οι οποίες είναι διαθέσιμες σε όλα τα στατιστικά πακέτα. Τόσο οι ανεξάρτητες μεταβλητές όσο και οι διακριτικές μεταβλητές δεν πρέπει να έχουν υψηλούς συντελεστές συσχέτισης (βλέπε Υπόθεση 3 DA και Υπόθεση 3 LR). Διαφοροποιήσεις: Στη λογιστική παλινδρόμηση δε χρειάζονται οι περίπλοκες υποθέσεις που απαιτούνται να γίνουν στη διαχωριστική ανάλυση. Δηλαδή, στη λογιστική παλινδρόμηση δε μας ενδιαφέρει αν όλες οι ανεξάρτητες μεταβλητές ακολουθούν κανονική κατανομή ή και αν έχουν ίσες διασπορές για τον κάθε ένα πληθυσμό όπως συμβαίνει στη διαχωριστική ανάλυση. Από την άλλη μεριά η διαχωριστική ανάλυση στηρίζεται σε πιο ρεαλιστικές μεθόδους και υπολογιστικά είναι πιο εύκολη. Αν σε κάποια περίπτωση ισχύουν: α) η υπόθεση της κανονικότητας και β) οι πίνακες διακυμάνσεων συνδιακυμάνσεων για κάθε πληθυσμό είναι ίσοι, η διαχωριστική ανάλυση δίνει καλύτερα αποτελέσματα σε σχέση με τη λογιστική παλινδρόμηση (Ξενή, 2012 ) 11

12 Κεφάλαιο 5: Εφαρμογές Εφαρμογή 1 Στο αρχείο lowbirthweight.sav (πηγή Hosmer and Lemeshow, 2000, logistic.html) καταγράφονται πληροφορίες για 189 γεννήσεις καθώς και για τις μητέρες των νεογνών. Το ενδιαφέρον επικεντρώνεται στη μελέτη του φαινομένου της γέννησης νεογνών με βάρος μικρότερου των γραμμαρίων. Το ενδιαφέρον εξηγείται διότι η θνησιμότητα των νεογνών σε τέτοιες περιπτώσεις είναι πολύ υψηλή. Οι πληροφορίες που μεταξύ άλλων καταγράφονται παρατίθενται στον πίνακα που ακολουθεί. Σκοπός μας είναι να αναδείξουμε πως μπορεί να χρησιμοποιηθεί η λογιστική παλινδρόμηση ως μέθοδος διαχωριστικής ανάλυσης. identification code Κωδικός αριθμός συμμετέχοντα Low birth weight Αν το νεογνό ζυγίζει λιγότερο από 2500γρ Age of mother Ηλικία της μητέρας σε έτη Weight of mother at last menstrual period Βάρος της μητέρας την τελευταία εμμηνορροϊκή περίοδο Race Φυλή, γένος. smoking status during pregnancy Κάπνισμα κατά την κυοφορία History of premature labor Ιστορικό πρόωρων γεννών History of hypertension Ιστορικό υπέρτασης Presence of uterine irritability Παρουσία ερεθιστικότητας Number of physician visits during the first Αριθμός επισκέψεων ιατρού κατά το trimester πρώτο τρίμηνο birth weight Βάρος νεογνού Προσαρμόζουμε το μοντέλο της Binary λογιστικής παλινδρόμησης μέσω της διαδικασίας Analyze Regression Binary Logistic 12

13 Στο παράθυρο διαλόγου που προκύπτει τοποθετούμε στο πλαίσιο Dependent την κατηγορική (δίτιμη αφού επιλέξαμε Binary Logistic) μεταβλητή, ενώ στο πλαίσιο Covariates τις ανεξάρτητες μεταβλητές, οι οποίες είναι είτε κατηγορικές με k το πλήθος δυνατές τιμές είτε συνεχείς. Πατώντας το πλαίσιο Categorical δηλώνουμε τις όποιες ανεξάρτητες μεταβλητές είναι κατηγορικές. Τότε δημιουργούνται k 1 δείκτριες μεταβλητές. Στο αρχείο των αποτελεσμάτων ο πίνακας Dependent Variable Encoding μας πληροφορεί για την κωδικοποίηση της εξαρτημένης μεταβλητής, ενώ ο πίνακας Categorical Variables Encoding δίνει τις συχνότητες για τις κατηγορικές μεταβλητές του μοντέλου καθώς και την κωδικοποίηση των δείκτριων μεταβλητών που θα χρησιμοποιηθούν. Έτσι προκύπτει ότι race (1) είναι για τους λευκούς κοκ. Dependent Variable Encoding Original Value Internal Value >=2500g 0 <2500g 1 13

14 Categorical Variables Codings Parameter coding Frequency (1) (2) race White 96 1,000,000 Black 26,000 1,000 Other 67,000,000 presence of uterine irritability no 161 1,000 yes 28,000 history of hypertension no 177 1,000 yes 12,000 smoking status during pregnancy no 115 1,000 yes 74,000 Στον πίνακα Omnibus Tests of Model Coefficients μας δίνεται η τιμή καθώς και η αντίστοιχη p τιμή του 2 X στατιστικού για τον έλεγχο ότι το συνολικό μοντέλο είναι στατιστικά σημαντικό. Δηλαδή είναι το αντίστοιχο του F τεστ της γραμμικής παλινδρόμησης. Παρατηρούμε ότι η p τιμή είναι μικρότερη του 0.05 επομένως το μοντέλο είναι στατιστικά σημαντικό. Omnibus Tests of Model Coefficients Chisquare df Sig. Step 1 Step 33,387 9,000 Block 33,387 9,000 Model 33,387 9,000 14

15 Στον πίνακα Variables in the Equation έχουμε το προσαρμοζόμενο μοντέλο. Πληροφορούμαστε λοιπόν για την σχέση των ανεξάρτητων μεταβλητών με την εξαρτημένη μεταβλητή, η οποία είναι στην κλίμακα Logit. Από τις τιμές των Wald στατιστικών και τις αντίστοιχες p τιμές κρίνουμε ποιες μεταβλητές είναι στατιστικά σημαντικές. Διαπιστώνουμε ότι οι μεταβλητές age, ptl, ui ftv δεν συνεισφέρουν στατιστικά σημαντικά στο μοντέλο. Αν σκοπός μας είναι να αποκτήσουμε ένα μοντέλο που προσαρμόζεται όσο γίνεται καλύτερα και επιπλέον ελαχιστοποιείται ο αριθμός των παραμέτρων το επόμενο λογικό βήμα είναι η προσαρμογή ενός μοντέλου που περιέχει τις μεταβλητές που είναι στατιστικά σημαντικές και η σύγκρισή του με το πλήρες μοντέλο. Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 1 a AGE,030,037,637 1,425,971 LWT,015,007 4,969 1,026,985 RACE 7,116 2,028 RACE(1),880,441 3,990 1,046,415 RACE(2),392,538,531 1,466 1,480 SMOKE(1),939,402 5,450 1,020,391 PTL,543,345 2,474 1,116 1,722 HT(1) 1,863,698 7,136 1,008,155 UI(1),768,459 2,793 1,095,464 FTV,065,172,143 1,705 1,067 Constant 4,931 1,493 10,908 1, ,506 a. Variable(s) entered on step 1: AGE, LWT, RACE, SMOKE, PTL, HT, UI, FTV. 15

16 Προσαρμόζοντας το νέο μοντέλο προκύπτει ότι Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 1 a LWT,018,007 6,937 1,008,982 RACE 8,095 2,017 RACE(1),944,423 4,968 1,026,389 RACE(2),344,536,411 1,521 1,411 SMOKE(1) 1,072,388 7,646 1,006,342 HT(1) 1,749,691 6,411 1,011,174 Constant 4,116 1,252 10,817 1,001 61,339 a. Variable(s) entered on step 1: LWT, RACE, SMOKE, HT. Οι εκτιμητές (στήλη Β) μας δίνουν την αύξηση (ή αντίστοιχα μείωση αν το πρόσημο είναι αρνητικό), στα προβλεπόμενα log odds της low birth weight=1 όταν θα έχουμε μοναδιαία αύξηση στην αντίστοιχη ανεξάρτητη μεταβλητή διατηρώντας τις υπόλοιπες σταθερές. Έτσι αύξηση του βάρους της μητέρας κατά την τελευταία εμμηνορροϊκή περίοδο κατά ένα κιλό αναμένεται να επιφέρει ελάττωση κατά στα log odds της low birth weight=1. Στη στήλη Exp(B) δίνονται τα odds ratio για τις ανεξάρτητες μεταβλητές. Επομένως το νέο μοντέλο που προκύπτει είναι το ακόλουθο: pˆ ln LWT RACE(1) RACE(2) SMOKE(1) HT (1) 1 pˆ Έτσι για μία μητέρα με βάρος κατά την τελευταία εμμηνορροϊκή περίοδο 60 κιλά που είναι λευκή, δεν κάπνιζε κατά την εγκυμοσύνη ενώ είχε ιστορικό υπέρτασης προκύπτει η ακόλουθη πρόβλεψη: 16

17 pˆ ln * * * * *0 1 pˆ, δηλαδή pˆ ln pˆ. Επομένως αφού Ln(odds)=1.2 μετά από πράξεις έχουμε ότι exp(1.2) pˆ 0,77. 1exp(1.2) Επομένως αυτή η γυναίκα έχει 77% πιθανότητα να γεννήσει παιδί με βάρος μικρότερο των 2500 γραμμαρίων και καθώς ξεπερνά το 50% θα την ταξινομούσαμε στο πρώτο γκρουπ. Αποτίμηση της προβλεπτικής ικανότητας της λογιστικής παλινδρόμησης Το συνολικό ποσοστό ορθής ταξινόμησης είναι 73,5%. Classification Table a low birth weight Predicted Observed >=250 0g <2500 g Percentage Correct Step 1 low birth weight >=2500g ,6 <2500g ,1 Overall Percentage 73,5 a. The cut value is,500 17

18 Επιπλέον παρατηρούμε ότι το ποσοστό ορθής ταξινόμησης εντός των νεογνών με βάρος μεγαλύτερο των 2500 γραμμαρίων είναι ίσο με 94,6% (specificity) ενώ το ποσοστό ορθής ταξινόμησης εντός των νεογνών με βάρος μικρότερο των 2500 γραμμαρίων είναι 27,1% (sensitivity). Ισχύουν οι ακόλουθοι ορισμοί: Accuracy: Correctly Classified Total observed Sensitivity ή true positive fraction: Correctly Classified as Y 1 16 Total observed as Y 1 59 Specificity ή false positive fraction: Correctly Classified as Y Total observed as Y Correctly Classified as Y 1 16 Positive predictive value: Total classified as Y 1 23 Negative predictive value: Correctly Classified as Y Total classified as Y Οι δείκτες sensitivity και specificity χρησιμοποιούνται για την αποτίμηση της ακρίβειας της πρόβλεψης. Μας δίνουν πόσα καλά γίνεται η ταξινόμηση μεταξύ πειραματικών μονάδων που ικανοποιούν ή όχι μία συγκεκριμένη συνθήκη. Η επιλογή του cut off είναι εκείνη που καθορίζει το πλήθος των σωστών και λανθασμένων ταξινομήσεων. Εύκολα γίνεται αντιληπτό ότι καθώς αυξάνεται η sensitivity ταυτόχρονα μειώνεται η specificity. Μία πιο πλήρη περιγραφή της ακρίβειας της ταξινόμησης επιτυγχάνεται με την λεγόμενη Receiver Operating Characteristic (ROC) Curve. Είναι το γράφημα της (1 specificity) στον άξονα των X και sensitivity στον άξονα των Y για τις διάφορες τιμές του cut off point. Το εμβαδό του χωρίου κάτω από την καμπύλη (αναφέρεται και ως index of accuracy A ή concordance index) αποτελεί έναν δείκτη της ακρίβειας. Όσο μεγαλύτερο τόσο καλύτερη η ισχύς της πρόβλεψης. Η ROC αν είναι στη διαγώνιο σημαίνει τυχαίος ταξινομικός κανόνας (ισοδύναμος με το να ρίχνουμε ένα νόμισμα). 18

19 Χρησιμοποιώντας τις αποθηκευμένες προβλεπόμενες πιθανότητες πραγματοποίησης του ενδεχομένου κατασκευάζουμε την ROC Curve. Από το κεντρικό μενού επιλέγουμε Analyze Roc Curve και στη συνέχεια τα ακόλουθα: Το αποτέλεσμα είναι το ακόλουθο ROC Curve 1,0 0,8 Sensitivity 0,6 0,4 0,2 0,0 0,0 0,2 0,4 0,6 1 - Specificity 0,8 1,0 Diagonal segments are produced by ties. 19

20 Area Under the Curve Test Result Variable(s): Predicted probability Asymptotic 95% Confidence Interval Area Std. Error(a) Asymptotic Sig.(b) Upper Bound Lower Bound,718,039,000,641,794 The test result variable(s): Predicted probability has at least one tie between the positive actual state group and the negative actual state group. Statistics may be biased. a Under the nonparametric assumption b Null hypothesis: true area = 0.5 Στο πλαίσιο Area έχουμε ότι η περιοχή κάτω από την ROC είναι ίση με 0.718, που σημαίνει ότι 71,8% των πιθανών ζευγαριών όπου κάποιο νεογνό έχει βάρος μικρότερο των 2500 γραμμαρίων και το άλλο μεγαλύτερο το μοντέλο θα επιφορτίσει με μεγαλύτερη πιθανότητα αυτό με βάρος μεγαλύτερο των Επιπλέον, η p τιμή είναι μικρότερη από 0.05, το οποίο σημαίνει ότι η χρησιμοποίηση του μοντέλου είναι καλύτερη από το στρίψιμο ενός νομίσματος Εφαρμογή 2 Το δεύτερο σύνολο δεδομένων προέρχεται από το σύγγραμμα των Hosmer and Lemeshow (2000, p. 3). Καταγράφεται η ηλικία (age), η κατάταξη σε ηλικιακό γκρουπ (agerp) και η παρουσία ή όχι σημαντικών στεφανιαίων διαταραχών. Το ενδιαφέρον επικεντρώνεται στη μελέτη της σχέσης της ηλικίας με την παρουσία ή όχι διαταραχών.εφαρμόζοντας λοιπόν το μοντέλο της Λογιστικής Παλινδρόμησης μέσω της διαδικασίας Binary Logistic επιλέγουμε την ηλικία (age) ως ανεξάρτητη μεταβλητή. 20

21 Στον πίνακα Omnibus Tests of Model Coefficients μας δίνεται η τιμή καθώς και η αντίστοιχη p τιμή του 2 X στατιστικό για τον έλεγχο ότι το συνολικό μοντέλο είναι στατιστικά σημαντικό Δηλαδή είναι το αντίστοιχο του F τεστ της γραμμικής παλινδρόμησης. Παρατηρούμε ότι η p τιμή είναι μικρότερη του 0.05 επομένως το μοντέλο είναι στατιστικά σημαντικό. Omnibus Tests of Model Coefficients Chi square df Sig. Step 1 Step 29,310 1,000 Block 29,310 1,000 Model 29,310 1,000 Στον πίνακα Variables in the Equation έχουμε το τελικό μοντέλο. Έτσι πληροφορούμαστε ότι το μοντέλο πρόβλεψης είναι: p log 5,309 0,111age. 1 p Variables in the Equation B S.E. Wald df Sig. Exp(B) Step age,111,024 21,254 1,000 1,117 1(a) Constant 5,309 1,134 21,935 1,000,005 a Variable(s) entered on step 1: age. Πληροφορούμαστε λοιπόν για την σχέση των ανεξάρτητων μεταβλητών με την εξαρτημένη μεταβλητή, η οποία είναι στην κλίμακα Logit. Οι εκτιμητές (στήλη Β) μας δίνουν την αύξηση (ή αντίστοιχα μείωση αν το πρόσημο είναι αρνητικό), στα προβλεπόμενα log odds της chd=1 όταν θα έχουμε μοναδιαία αύξηση στην αντίστοιχη ανεξάρτητη μεταβλητή διατηρώντας τις υπόλοιπες σταθερές. Έτσι αύξηση της ηλικία κατά ένας έτος αναμένεται να επιφέρει αύξηση κατά στα log odds της chd. Στη στήλη Exp(B) δίνονται τα odds ratio για τις ανεξάρτητες μεταβλητές. 21

22 Έτσι αν έχουμε μία αύξηση της ηλικίας κατά 10 έτη έχουμε τότε την ακόλουθη πρόβλεψη για το Odds ratio: OR(10) exp(10*0.111) 3.03 Αυτό υποδηλώνει ότι αύξηση της ηλικίας κατά 10 έτη επιφέρει τριπλάσιο ρίσκο ως προς την πρόκληση στεφανιαίων διαταραχών. Έτσι για ένα άτομο ηλικίας 40 ετών προκύπτει η ακόλουθη πρόβλεψη: Ln(odds)= *40= Επομένως η προβλεπόμενη πιθανότητα είναι ίση με άρα μικρότερη από 50% και θα τον ταξινομούσαμε στον γκρουπ αυτών που δεν διατρέχουν κίνδυνο. Το συνολικό ποσοστό ορθής ταξινόμησης είναι 74%. Classification Table(a) Observed chd Predicted Percentage Correct absence presence absence Step 1 chd Absence ,9 a The cut value is,500 Presence ,4 Overall Percentage 74,0 Χρησιμοποιώντας τις αποθηκευμένες προβλεπόμενες πιθανότητες πραγματοποίησης του ενδεχόμενου κατασκευάζουμε την ROC Curve και το αποτέλεσμα είναι το ακόλουθο: 22

23 Test Result Variable(s): age Area Under the Curve Asymptotic 95% Confidence Interval Area Std. Error a Asymptotic Sig. b Lower Bound Upper Bound,800,045,000,712,888 The test result variable(s): age has at least one tie between the positive actual state group and the negative actual state group. Statistics may be biased. a. Under the nonparametric assumption b. Null hypothesis: true area = 0.5 Στο πλαίσιο Area έχουμε ότι η περιοχή κάτω από τη ROC είναι ίση με 0,8, που σημαίνει ότι 80% των πιθανών ζευγαριών όπου κάποιος άνθρωπος που εμφανίζει στεφανιαία νόσο με κάποιον που δεν εμφανίζει θα επιφορτίσει με 23

24 μεγαλύτερη πιθανότητα αυτόν που δεν εμφανίζει στεφανιαία νόσο. Επιπλέον, η p τιμή είναι μικρότερη από 0,05, το οποίο σημαίνει ότι η χρήση του μοντέλου είναι πάρα πολύ καλή. Εφαρμογή 3 Στην τρίτη εφαρμογή θα θεωρηθεί ένα μέρος του συνόλου δεδομένων που χρησιμοποιήθηκε στο πλαίσιο του μαθήματος «Προηγμένα Στατιστικά Μοντέλα» για την κατανόηση της μεθόδους της Διαχωριστικής ή Διαφοροποιούσας Ανάλυσης (βλέπε διαφάνειες Ζιντζαράς, 2016). Στο σύνολο αυτό των δεδομένων που θα χρησιμοποιηθεί καταγράφονται οι μετρήσεις 20 πρωτεϊνών που ανήκουν σε 2 διαφορετικές οικογένειες, ομάδες πρωτεϊνών (10 σε κάθε ομάδα) σε 4 μεταβλητές ενδιαφέροντος. Ειδικότερα, X1= distances between the centres of two secondary structures. X2= intercentroid tilt angles (radius) between each two structures. X3= distances between the ends of secondary structures. X4= connecting loop lengths given in amino acid residues between secondary structures. Παρόμοια με την προηγούμενη εφαρμογή θα εξετάσουμε πως η λογιστική παλινδρόμηση μπορεί να χρησιμοποιηθεί ως μέθοδος διαχωριστικής ανάλυσης. Αρχικά παρατηρούμε ότι οι μεταβλητές Χ1, Χ3, Χ4 έχουν υψηλό συντελεστή συσχέτισης. Επιπλέον, το μοντέλο που προκύπτει ύστερα από διαδοχικές εφαρμογές του μοντέλου της λογιστικής παλινδρόμησης είναι το ή ισοδύναμα pˆ ln pˆ pˆ 1 2 exp( ) exp( ) 24

25 Αν αυτή η προβλεπόμενη πιθανότητα είναι μεγαλύτερη από 50% τότε ταξινομείται στην πρώτη ομάδα πρωτεϊνών. Η απόδοση αυτού του κανόνα δίνεται στον πίνακα Classification Table, με το εμβαδό κάτω από την καμπύλη ROC να είναι 83%. Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 1 a x1,454,195 5,406 1,020,635 x2 1,704,729 5,455 1,020 5,494 a. Variable(s) entered on step 1: x1, x2. Classification Table a Predicted Observed group,00 1,00 Percentage Correct Step 1 group, ,0 1, ,0 Overall Percentage 80,0 a. The cut value is,500 25

26 Βιβλιογραφία 1. Δημητροπουλάκης Π., Διδακτικές Σημειώσεις. Ιστότοπος lib.teiher.gr/webnotes/seyp/spss/kef12.pdf Ηλιοπούλου Π., (2015). Γεωγραφική Ανάλυση. [ηλεκτρ. βιβλ.] Αθήνα:Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών. Διαθέσιμο στο: 3. Ζιντζαράς Ηλίας, Διαφάνειες Μαθήματος «Προηγμένα Στατιστικά Μοντέλα» στα πλαίσια του ΜΔΕ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΙΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ,ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ», Hosmer D.W. & Lemeshow S. (2000). Applied Logistic Regression John Wiley & Sons, N. Jersey. 5. Klecka, W. (1980). Discriminant Analysis. Sage. 6. Tabachnick, B. G. & Fidell, L. S. (2012). Using multivariate statistics. Boston. MA: Pearson. 7. Ξενή Μαρία, (2012). Λογιστική Παλινδρόμηση & Διαχωριστική Ανάλυση. Διπλωματική Διατριβή, Πανεπιστήμιο Πατρών. 26

Logistic Regression in SPSS Πρόχειρες βοηθητικές σημειώσεις

Logistic Regression in SPSS Πρόχειρες βοηθητικές σημειώσεις Logistic Regression in SPSS Πρόχειρες βοηθητικές σημειώσεις Παράδειγμα Στο αρχείο lowbirthweight.sav (πηγή Hosmer and Lemeshow (2000), http://www.umass.edu/statdata/statdata/stat-logistic.html) καταγράφονται

Διαβάστε περισσότερα

ΛΟΓΙΣΤΙΚΗ ΕΞΑΡΤΗΣΗ. Πρώτα θα δούμε την επίδραση των παραπάνω παραγόντων με διμεταβλητή ανάλυση: Variables in the Equation

ΛΟΓΙΣΤΙΚΗ ΕΞΑΡΤΗΣΗ. Πρώτα θα δούμε την επίδραση των παραπάνω παραγόντων με διμεταβλητή ανάλυση: Variables in the Equation ΛΟΓΙΣΤΙΚΗ ΕΞΑΡΤΗΣΗ Θα δούμε ένα παράδειγμα όπου μελετήθηκαν διάφοροι προσδιοριστικοί παράγοντες που μπορεί να επηρεάσουν την γέννηση ελλειποβαρών νεογνών (βάρος < 2.500 γραμμάρια). Συλλέχθηκαν δεδομένα

Διαβάστε περισσότερα

1.α ιαγνωστικοί Έλεγχοι. 2.α Ευαισθησία και Ειδικότητα (εισαγωγικές έννοιες) ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Πολύ σηµαντικό το θεώρηµα του Bayes:

1.α ιαγνωστικοί Έλεγχοι. 2.α Ευαισθησία και Ειδικότητα (εισαγωγικές έννοιες) ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Πολύ σηµαντικό το θεώρηµα του Bayes: ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 6 ΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ 1.β ιαγνωστικοί Έλεγχοι Πολύ σηµαντικό το θεώρηµα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή 1. Γενικά... 25 2. Έννοια και Είδη Μεταβλητών... 26 3. Κλίμακες Μέτρησης Μεταβλητών... 29 3.1 Ονομαστική κλίμακα... 30 3.2. Τακτική κλίμακα... 31 3.3 Κλίμακα ισοδιαστημάτων... 34 3.4

Διαβάστε περισσότερα

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Ο παρακάτω πίνακας παρουσιάζει θανάτους από καρδιακή ανεπάρκεια ανάμεσα σε άνδρες γιατρούς οι οποίοι έχουν κατηγοριοποιηθεί κατά ηλικία

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων 1 Μονοπαραγοντική Ανάλυση Διακύμανσης Παραμετρικό στατιστικό κριτήριο για τη μελέτη της επίδρασης μιας ανεξάρτητης μεταβλητής στην εξαρτημένη Λογική

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 12 ο 12.1 Λογιστική Παλινδρόµηση 12.2 Η εξίσωση της Λογιστικής Παλινδρόµησης. 12.3 Βήµατα δηµιουργίας του

Διαβάστε περισσότερα

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις Οι παρούσες σημειώσεις επιχειρούν να αποτελέσουν μια βοήθεια τόσο στην παρακολούθηση της διάλεξης όσο και στη μελέτη κάποιων εκ των θεμάτων της Γραμμικής

Διαβάστε περισσότερα

Λογαριθµιστική εξάρτηση

Λογαριθµιστική εξάρτηση Είδη δεδοµένων Σε µία επιδηµιολογική έρευνα, καταγράφονται τα παρακάτω δεδοµένα για κάθε άτοµο: Λογαριθµιστική εξάρτηση Βάνα Σύψα Επίκουρη Καθηγήτρια Επιδηµιολογίας και Προληπτικής Ιατρικής Εργαστήριο

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 6: Συσχέτιση και παλινδρόμηση εμπειρική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 3: One-Way ANOVA

Διαβάστε περισσότερα

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,...,Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ ) S σ Τ ( Χ,Y)

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Γενικευμένα Γραμμικά Μοντέλα (GLM) Επισκόπηση

Γενικευμένα Γραμμικά Μοντέλα (GLM) Επισκόπηση Γενικευμένα Γραμμικά Μοντέλα (GLM) Επισκόπηση Γενική μορφή g( E[ Y X ]) Xb Κατανομή της Υ στην εκθετική οικογένεια Ανεξάρτητες παρατηρήσεις Ενας όρος για το σφάλμα g(.) Συνδετική συνάρτηση (link function)

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο Παράδειγμα 1 Ο παρακάτω πίνακας δίνει τις πωλήσεις (ζήτηση) ενός προϊόντος Υ (σε κιλά) από το delicatessen μιας περιοχής και τις αντίστοιχες τιμές Χ του προϊόντος (σε ευρώ ανά κιλό) για μια ορισμένη χρονική

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ Ιωάννα Τζουλάκη Κώστας Τσιλίδης Ιωαννίδης: κεφάλαιο 2 Guyatt: κεφάλαιο 18 ΕΠΙςΤΗΜΟΝΙΚΗ ΙΑΤΡΙΚΗ Επιστήμη (θεωρία) Πράξη (φροντίδα υγείας) Γνωστικό μέρος Αιτιό-γνωση Διά-γνωση Πρό-γνωση

Διαβάστε περισσότερα

Κλινική Επιδηµιολογία

Κλινική Επιδηµιολογία Κλινική Επιδηµιολογία Ρυθµιστικοί παράγοντες Συγχυτικοί παράγοντες Ενδιάµεσοι παράγοντες Πρέπει να πιστέψουµε τις µετρήσεις µας; Κάπνισµα Καρκίνος Πνεύµονα OR = 9.1 Πραγµατική σχέση αιτιολογική µη-αιτιολογική

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο ανεξάρτητα δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,..., Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ )

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Λογιστική Παλινδρόµηση

Λογιστική Παλινδρόµηση Κεφάλαιο 10 Λογιστική Παλινδρόµηση Στο κεφάλαιο αυτό ϑα δούµε την µέθοδο της λογιστικής παλινδρόµησης η οποία χρησιµεύει στο να αναπτύξουµε σχέση µίας δίτιµης ανεξάρτητης τυχαίας µετα- ϐλητής και συνεχών

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Κεφάλαιο 14 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης 1 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Παραµετρικό στατιστικό κριτήριο για τη µελέτη της επίδρασης µιας ανεξάρτητης µεταβλητής στην εξαρτηµένη Λογική παρόµοια

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α εξάμηνο 2010-2011 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Ποιοτικές και Ποσοτικές μέθοδοι και προσεγγίσεις για την επιστημονική έρευνα users.sch.gr/abouras

Διαβάστε περισσότερα

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης

Διαβάστε περισσότερα

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Κωνσταντίνος Τζιόμαλος Επίκουρος Καθηγητής Παθολογίας ΑΠΘ Α Προπαιδευτική Παθολογική Κλινική, Νοσοκομείο ΑΧΕΠΑ 1 ο βήμα : καταγραφή δεδομένων Το πιο πρακτικό

Διαβάστε περισσότερα

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική Μη παραμετρικοί στατιστικοί έλεγχοι Καθηγητής ΔΠΘ Κων/νος Τσαγκαράκης Δευτέρα 6 Μαρτίου 13:00-16:00 Ώρα για εξ αποστάσεως συνεργασία Τρίτη 7 Μαρτίου 12:00-14:00

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται Κεφάλαιο 10 Η Ανάλυση Παλινδρόμησης Η Ανάλυση Παλινδρόμησης Το στατιστικό κριτήριο που μας επιτρέπει να προβλέψουμε τις τιμές μιας μεταβλητής από τις τιμές μιας ή πολλών άλλων γνωστών μεταβλητών Η σχέση

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις: Άσκηση. Δίνονται οι παρακάτω παρατηρήσεις: X X X X Y 7 50 6 7 6 6 96 7 0 5 55 9 5 59 6 8 8 5 0 59 7 7 8 8 5 5 0 7 69 9 6 6 7 6 9 5 7 6 8 5 6 69 8 0 50 66 0 0 50 8 59 76 8 7 60 7 87 6 5 7 88 9 8 50 0 5

Διαβάστε περισσότερα

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ Θα δούμε ένα παράδειγμα από 141 νεογνά που εγχειρίστηκαν σε ένα νοσοκομείο (surgery.sav). Οι παράμετροι που καταγράφηκαν είναι οι εξής: Κωδικός νεογνού (ID), Φύλο Νεογνού

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

στη Συμπεριφορά του Οδηγού Αξιοποιώντας Λεπτομερή Δεδομένα

στη Συμπεριφορά του Οδηγού Αξιοποιώντας Λεπτομερή Δεδομένα Προτυποποίηση της επιρροής της Χρήσης Κινητού Τηλεφώνου στη Συμπεριφορά του Οδηγού Αξιοποιώντας Λεπτομερή Δεδομένα από Αισθητήρες Έξυπνων Κινητών Τηλεφώνων Αναστασία Αργυροπούλου Επιβλέπων: Γιώργος Γιαννής,

Διαβάστε περισσότερα

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ Παιδαγωγικά II Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ Άδεια Χρήσης Το παρόν υλικό υπόκειται σε άδειες χρήσης Creative Commons

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Επίλυση: Oneway Anova Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Έρευνα Μάρκετινγκ Ενότητα 5

Έρευνα Μάρκετινγκ Ενότητα 5 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5 : Μέθοδοι Στατιστικής Ανάλυσης Χριστίνα Μπουτσούκη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων Ασκήσεις Εξετάσεων Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων ΑΣΚΗΣΗ 1: Έλεγχος για τη μέση τιμή ενός πληθυσμού Η αντικαπνιστική νομοθεσία υποχρεώνει τους καπνιστές που εργάζονται σε

Διαβάστε περισσότερα

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Νίκος Καλογερόπουλος 2014 Τι είναι έρευνα στην στατιστική Αρχική παρατήρηση: κάτι που πρέπει να διευκρινιστεί Κάθε χρόνο υπόσχομαι στον εαυτό μου ότι

Διαβάστε περισσότερα

1991 US Social Survey.sav

1991 US Social Survey.sav Παραδείγµατα στατιστικής συµπερασµατολογίας µε ένα δείγµα Στα παραδείγµατα χρησιµοποιείται απλό τυχαίο δείγµα µεγέθους 1 από το αρχείο δεδοµένων 1991 US Social Survey.sav Το δείγµα λαµβάνεται µε την διαδικασία

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Σεμινάριο Προηγμένα Θέματα Στατιστικής. Dr. Nikolaos Mittas Dr. Theodosios Theodosiou

Σεμινάριο Προηγμένα Θέματα Στατιστικής. Dr. Nikolaos Mittas Dr. Theodosios Theodosiou Σεμινάριο Προηγμένα Θέματα Στατιστικής Dr. Nikolaos Mittas Dr. Theodosios Theodosiou Λογιστική Παλινδρόμηση Binary Logistic Regression Dr. Nikolaos Mittas Dr. Theodosios Theodosiou Γενικά-Το κίνητρο (1/2)

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ

ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ ΤΡΟΠΟΙ ΕΛΕΓΧΟΥ ΔΙΟΡΘΩΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΣΥΝΕΠΕΙΕΣ ΠΡΟΒΛΗΜΑΤΟΣ ΠΑΡΑΔΕΙΓΜΑΤΑ 1 ΤΡΟΠΟΙ ΕΛΕΓΧΟΥ Γραφική παράσταση των υπολοίπων (ή των μαθητικοποιημένων υπολοίπων) ως προς την

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) 1. Έχοντας στη διάθεσή μας ένα δείγμα, προκύπτει ότι το 95% διάστημα εμπιστοσύνης για το μέσο μ ενός κανονικού

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : 1. Να χρησιμοποιηθεί το αρχείο gssft.sav για να γίνει έλεγχος της υπόθεσης ότι στους εργαζόμενους με πλήρη απασχόληση η τιμή του μέσου

Διαβάστε περισσότερα

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Θεματικές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

Βιοστατιστική Ι. Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες

Βιοστατιστική Ι. Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες Βιοστατιστική Ι Δείκτες αξιολόγησης διαγνωστικών μεθόδων Θετική-Αρνητική Διαγνωστική Αξία ROC καμπύλες Διαγνωστικές εξετάσεις Κλινικές ή εργαστηριακές Αναγνώριση ατόμου ως πάσχον από ένα νόσημα πολλές

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ 1o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ: ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Email: gvasil@math.auth.gr Ιστοσελίδες Μαθήματος: users.auth.gr/gvasil

Διαβάστε περισσότερα

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στην Ανάλυση Ερευνητικών Δεδομένων στις Κοινωνικές Επιστήμες Με χρήση των λογισμικών IBM/SPSS και LISREL Ενότητα 5 η : Επαγωγική

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100 Ποσοτικές Μέθοδοι Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR 50100 Απλή Παλινδρόμηση Η διερεύνηση του τρόπου συμπεριφοράς

Διαβάστε περισσότερα

Μοντέλα Πολλαπλής Παλινδρόμησης

Μοντέλα Πολλαπλής Παλινδρόμησης Μοντέλα Πολλαπλής Παλινδρόμησης Πέτρος Ρούσσος Πρόγραμμα Ψυχολογίας, ΦΠΨ, ΕΚΠΑ ΕΙΣΑΓΩΓΙΚΑ 1 Ορολογία Προβλεπτικές μεταβλητές ή παράγοντες (predictors) Μεταβλητή κριτήριο (criterion) Απλή και πολλαπλή παλινδρόμηση

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Άσκηση 1 η Ένας παραγωγός σταφυλιών ισχυρίζεται ότι τα κιβώτια σταφυλιών που συσκευάζει

Διαβάστε περισσότερα

ΗΥ-SPSS Statistical Package for Social Sciences 1 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

ΗΥ-SPSS Statistical Package for Social Sciences 1 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ. ΗΥ-SPSS Statistical Package for Social Sciences 1 ο ΜΑΘΗΜΑ ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ. Στατιστική με το SPSS Ως επιστήμονες, χρειαζόμαστε τη Στατιστική για 2 κυρίους λόγους: 1. Για

Διαβάστε περισσότερα

Απλή Ευθύγραµµη Συµµεταβολή

Απλή Ευθύγραµµη Συµµεταβολή Απλή Ευθύγραµµη Συµµεταβολή Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας, Εργαστήριο Γεωργίας Viola adorata Εισαγωγή Ανάλυση Παλινδρόµησης και Συσχέτιση Απλή

Διαβάστε περισσότερα

χ 2 test ανεξαρτησίας

χ 2 test ανεξαρτησίας χ 2 test ανεξαρτησίας Καθηγητής Ι. Κ. ΔΗΜΗΤΡΙΟΥ demetri@econ.uoa.gr 7.2 Το χ 2 Τεστ Ανεξαρτησίας Tο χ 2 τεστ ανεξαρτησίας (όπως και η παλινδρόμηση) είναι στατιστικά εργαλεία για τον εντοπισμό σχέσεων μεταξύ

Διαβάστε περισσότερα

Ανάλυση Κινδύνου & Υποδείγματα Πτώχευσης. Αντώνιος Πανουσιάδης Επιβλέπων καθηγητής: Αθανάσιος Νούλας

Ανάλυση Κινδύνου & Υποδείγματα Πτώχευσης. Αντώνιος Πανουσιάδης Επιβλέπων καθηγητής: Αθανάσιος Νούλας Ανάλυση Κινδύνου & Υποδείγματα Πτώχευσης Αντώνιος Πανουσιάδης Επιβλέπων καθηγητής: Αθανάσιος Νούλας Στόχοι Διπλωματικής Εργασίας I. Ανάλυση βασικών επιχειρηματικών κινδύνων II. Ανάλυση κλασσικών υποδειγμάτων

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Περιεχόμενα Εισαγωγή Το πρόβλημα - Συντελεστής συσχέτισης Μοντέλο απλής γραμμικής παλινδρόμησης

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS Πανεπιστήμιο Θεσσαλίας-Τμήμα Πολιτικών Μηχανικών Εργαστήριο Κυκλοφορίας, Μεταφορών και Διαχείρισης Εφοδιαστικής Αλυσίδας Αντικείμενα διάλεξης Σύντομη εισαγωγή

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες Ενότητα 9 : Περιγραφή του ελέγχου Χ 2 Θεόδωρος Χατζηπαντελής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ ΕΚΤΟ

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Τα υποδείγματα του απλού γραμμικού υποδείγματος της παλινδρόμησης (simple linear regression

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Ιατρικά Μαθηματικά & Βιοστατιστική

Ιατρικά Μαθηματικά & Βιοστατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ιατρικά Μαθηματικά & Βιοστατιστική Λογαριθμιστική παλινδρόμηση Διδάσκοντες: Ευάγγελος Ευαγγέλου, Kωνσταντίνος Τσιλίδης, Ιωάννης Δημολιάτης, Ευαγγελία

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα: ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, 6-5-0 Άσκηση 8. Δίνονται οι παρακάτω 0 παρατηρήσεις (πίνακας Α) με βάση τις οποίες θέλουμε να δημιουργήσουμε ένα γραμμικό μοντέλο για την πρόβλεψη της Υ μέσω των ανεξάρτητων μεταβλητών

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δειγμάτων, που διαχωρίζονται βάσει ενός επαναλαμβανόμενου και ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για εξαρτημένα δείγματα ως προς δύο παράγοντες,

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα ΚΕΦΑΛΑΙΟ ΕΚΤΟ Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Στο κεφάλαιο αυτό θα ασχοληθούμε με τον έλεγχο της υπόθεσης της ισότητα δύο μέσων τιμών με εξαρτημένα δείγματα. Εξαρτημένα

Διαβάστε περισσότερα

Προσδιορισμός των Μετρήσιμων Παραγόντων του Κινδύνου της Αποτυχίας του Μαθητή σε Moodle Courses.

Προσδιορισμός των Μετρήσιμων Παραγόντων του Κινδύνου της Αποτυχίας του Μαθητή σε Moodle Courses. Προσδιορισμός των Μετρήσιμων Παραγόντων του Κινδύνου της Αποτυχίας του Μαθητή σε Moodle Courses. Δρ. Ιωάννης Γεωργακόπουλος Πανεπιστήμιο Δυτικής Αττικής Εθνικό & Καποδιστριακό Πανεπιστήμιο Αθηνών 11/11/18

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας Εργαστήριο Υγιεινής Επιδημιολογίας και Ιατρικής Στατιστικής Ιατρική Σχολή, Πανεπιστήμιο Αθηνών Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας Δ. Παρασκευής Εργαστήριο Υγιεινής Επιδημιολογίας και

Διαβάστε περισσότερα

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11 ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 34 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: 17 Οικονομετρικά Εργαστήριο 15/5/11 ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ 7 ΕΡΓΑΣΤΗΡΙΟ ΜΗ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ Σκοπός του παρόντος µαθήµατος είναι η

Διαβάστε περισσότερα