ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ"

Transcript

1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΤΙΤΛΟΣ ΠΡΑΚΤΙΚΗΣ ΑΣΚΗΣΗΣ: ΤΟ ΠΡΟΒΛΗΜΑ ΤΩΝ ΕΛΛΕΙΠΟΝΤΩΝ Ε ΟΜΕΝΩΝ ΚΑΙ ΟΙ ΝΕΟΙ ΤΡΟΠΟΙ ΑΝΤΙΜΕΤΩΠΙΣΗΣ ΤΟΥ Επιβλέπον Μέλος.Ε.Π.: Ιωάννης Πανάρετος Καθηγητής Οικονοµικού Πανεπιστηµίου Αθηνών Φοιτήτρια: Ευαγγελία Καλπινέλλη του Αποστόλου Αθήνα Σεπτέµβριος 2004

2 Στους γονείς µου,

3 ΠΕΡΙΛΗΨΗ Ευαγγελία Καλπινέλλη ΤΟ ΠΡΟΒΛΗΜΑ ΤΩΝ ΕΛΛΕΙΠΟΝΤΩΝ Ε ΟΜΕΝΩΝ ΚΑΙ ΟΙ ΝΕΟΙ ΤΡΟΠΟΙ ΑΝΤΙΜΕΤΩΠΙΣΗΣ ΤΟΥ Σεπτέµβριος 2004 Τα απολεσθέντα δεδοµένα αποτελούν µέρος σχεδόν όλων των ερευνών, και εµείς θα πρέπει να αποφασίσουµε πώς να αντιµετωπίσουµε το συγκεκριµένο πρόβληµα κάθε φορά. Στις µελέτες όπου υπάρχει απώλεια δεδοµένων είναι κοινό για τους ερευνητές να χρησιµοποιήσουν τις ειδικές µεθόδους για να αντιµετωπίσουν το συγκεκριµένο πρόβληµα. Σε αυτή την εργασία παρουσιάζουµε τα διάφορα είδη ελλειπόντων δεδοµένων καθώς και τρόπους αντιµετώπισής τους. Ακόµη, παρουσιάζουµε τις στατιστικές υποθέσεις που πρέπει να ισχύουν ώστε οι µέθοδοι να µπορούν να εφαρµοστούν, καθώς και ορισµένες συστάσεις τις οποίες θα πρέπει να λαµβάνει υπ όψιν του κάθε ερευνητής µε σκοπό να παράγει αξιόπιστα αποτελέσµατα.

4 ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Ο : ΕΙΣΑΓΩΓΗ... 3 ΚΕΦΑΛΑΙΟ 2 Ο : ΠΡΟΒΛΗΜΑΤΑ ΠΟΥ ΠΡΟΚΑΛΟΥΝΤΑΙ ΛΟΓΩ ΤΗΣ ΑΠΩΛΕΙΑΣ ΤΩΝ Ε ΟΜΕΝΩΝ... 4 ΚΕΦΑΛΑΙΟ 3 Ο : Η ΦΥΣΗ ΤΩΝ ΧΑΜΕΝΩΝ ΣΤΟΙΧΕΙΩΝ Αιτίες Απώλειας των Στοιχείων Γενικά Σχόλια σχετικά µε τις Αιτίες Απώλειας εδοµένων... 8 ΚΕΦΑΛΑΙΟ 4 Ο : ΕΠΙΣΚΟΠΗΣΗ ΤΩΝ ΠΕΝΤΕ ΕΙ ΙΚΩΝ ΜΕΘΟ ΩΝ ΕΛΛΕΙΠΟΝΤΩΝ Ε ΟΜΕΝΩΝ Ιστορική Αναδροµή Listwise διαγραφή (LD) Pairwise διαγραφή (PD) Αντικατάσταση µε τον Μέσο (Mean Substitution) Απλή Hot-Deck (HD) Εκτίµηση Παλινδρόµησης (Regression Estimation) ΚΕΦΑΛΑΙΟ 5 Ο : ΑΠΛΗ ΑΠΟ ΟΣΗ ΜΕ ΑΡΧΕΣ- FIML (PRINCIPLED SINGLE IMPUTATION- FIML) ΚΕΦΑΛΑΙΟ 6 Ο : ΑΠΛΗ ΑΠΟ ΟΣΗ ΜΕ ΑΡΧΕΣ- EM ΑΛΓΟΡΙΘΜΟΣ (PRINCIPLED SINGLE IMPUTATION- EM ALGORITHM) ΚΕΦΑΛΑΙΟ 7 Ο : ΠΟΛΛΑΠΛΗ ΑΠΟ ΟΣΗ (MULTIPLE IMPUTATION- MI) ΚΕΦΑΛΑΙΟ 8 Ο : Η ΣΗΜΑΣΙΑ ΤΩΝ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΙΣ ΜΕΘΟ ΟΥΣ ΜΕ ΑΡΧΕΣ ΚΕΦΑΛΑΙΟ 9 Ο : ΣΥΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΕΡΕΥΝΑ ΒΙΒΛΙΟΓΡΑΦΙΑ

5 2

6 ΚΕΦΑΛΑΙΟ 1 Ο : ΕΙΣΑΓΩΓΗ Σκοπός της παρούσης εργασίας είναι να παρουσιάσουµε το πρόβληµα των ελλειπόντων δεδοµένων ή Missing Data, όπως συναντώνται στην ξενόγλωσση βιβλιογραφία. Για τον σκοπό αυτό συγκεντρώσαµε και παρουσιάζουµε πληροφορίες σχετικά µε τα απολεσθέντα δεδοµένα και τις αιτίες της απώλειας αυτών. Ακόµη, παρουσιάζουµε τις επικρατέστερες µεθόδους αντιµετώπισης του προβλήµατος των χαµένων δεδοµένων καθώς και τους κινδύνους που εγκυµονεί η χρήση καθεµίας εξ αυτών. Συγκεκριµένα, θα ασχοληθούµε αναλυτικά µε τις εξής µεθόδους: Listwise και Pairwise ιαγραφή, Αντικατάσταση από τον Μέσο (Mean Substitution), Απλή Hot-Deck µέθοδο, Εκτίµηση Παλινδρόµησης, Principled Single Imputation- FIML, Principled Single Imputation- EM και Multiple Imputation- MI µέθοδο. Στα πλαίσια της παρουσίασης των µεθόδων αυτών θα αναφερθούµε τόσο σε θέµατα µεθοδολογίας όσο και σε θέµατα εφαρµογής και αξιοπιστίας κάθε µεθόδου. Τέλος, κρίναµε σκόπιµο να παραθέσουµε ορισµένες συστάσεις για τους ερευνητές µε σκοπό, σε περίπτωση που παρουσιαστούν ελλείποντα δεδοµένα, να αντιµετωπιστούν αυτά µε τον βέλτιστο δυνατό τρόπο. 3

7 ΚΕΦΑΛΑΙΟ 2 Ο : ΠΡΟΒΛΗΜΑΤΑ ΠΟΥ ΠΡΟΚΑΛΟΥΝΤΑΙ ΛΟΓΩ ΤΗΣ ΑΠΩΛΕΙΑΣ ΤΩΝ Ε ΟΜΕΝΩΝ Γιατί είναι τα χαµένα δεδοµένα ένα πρόβληµα; Η σοβαρότερη ανησυχία είναι το γεγονός ότι λόγω των χαµένων δεδοµένων µπορεί να έχουµε µεροληψία στις εκτιµήσεις που προέρχονται από ένα στατιστικό µοντέλο. Παραδείγµατος χάριν, είναι δυνατόν αυτοί που δεν απάντησαν σε ορισµένες ερωτήσεις να έχουν διαφορετικό προφίλ απάντησης σε σχέση µε εκείνους που απάντησαν σε όλες τις ερωτήσεις. Κατά συνέπεια, το υπόλοιπο δείγµα δεν είναι πλέον τυχαίο ή αντιπροσωπευτικό του πληθυσµού από τον οποίο προήλθε τυχαία. Έτσι, εάν ο ερευνητής επιλέξει να βασίσει τα συµπεράσµατά του µόνο σε εκείνους που αποκρίθηκαν, τα συµπεράσµατα αυτά θα είναι µάλλον µεροληπτικά. Επιπλέον, τα χαµένα στοιχεία οδηγούν σε µια απώλεια πληροφοριών και στατιστικής ισχύος των διαφόρων στατιστικών ελέγχων. Ένα άλλο πρόβληµα µε την απώλεια των δεδοµένων είναι ότι καθιστούν τις κοινές στατιστικές µεθόδους ακατάλληλες ή δύσκολα εφαρµόσιµες. Παραδείγµατος χάριν, όταν τα χαµένα στοιχεία είναι παρόντα σε ένα παραγοντικό πείραµα ανάλυσης διακύµανσης, τότε το πείραµα θα είναι ασύµµετρο, µε την έννοια ότι το µέγεθος του δείγµατος σε κάθε συνδυασµό παραγόντων θα είναι διαφορετικό. Συνεπώς, η τυποποιηµένη στατιστική ανάλυση που είναι κατάλληλη για πειραµατικούς σχεδιασµούς που προϋποθέτουν ίσο µέγεθος δείγµατος ανά συνδυασµό παραγόντων δεν είναι πλέον κατάλληλη υπό αυτόν τον όρο. Ακόµα κι αν υπάρχει πλήρης τυχαιότητα στην επιλογή των δεδοµένων, η εφαρµογή της τεχνικής της Ανάλυσης ιακύµανσης είναι ιδιαιτέρως περίπλοκη. Τέλος, πολύτιµες πηγές δεδοµένων σπαταλούνται ως αποτέλεσµα της απώλειας των δεδοµένων. Ακόµη, υπάρχουν πολλές περιπτώσεις όπου πριν την διεξαγωγή κάποιας µελέτης γνωρίζουµε ότι θα έχουµε απώλεια δεδοµένων. Τέτοια απώλεια είναι ιδιάζουσας σηµασίας στην έρευνα που σχετίζεται µε τα γεωγραφικά µήκη, στις µεγάλης κλίµακας αξιολογήσεις και στις έρευνες που εξετάζουν τα ευαίσθητα προσωπικά δεδοµένα και τις ευαίσθητες πληροφορίες ή που εξετάζουν πληθυσµούς που δεν είναι εξοικειωµένοι µε το να απαντούν σε διάφορες έρευνες, όπως οι οικονοµικοί και πολιτικοί µετανάστες 4

8 πρώτης γενεάς. Οι προσπάθειες να επιτευχθούν τα υψηλότερα δυνατά ποσοστά απάντησης από τους ερωτώµενους απαιτούν από τους ερευνητές να διαθέσουν πρόσθετο χρόνο και προσπάθεια, ιδιαίτερα σε περιπτώσεις όπου οι ερωτώµενοι αρνήθηκαν να απαντήσουν ή που έδωσαν απαντήσεις ελλιπείς ή ακατάλληλες προς επεξεργασία. 5

9 ΚΕΦΑΛΑΙΟ 3 Ο : Η ΦΥΣΗ ΤΩΝ ΧΑΜΕΝΩΝ ΣΤΟΙΧΕΙΩΝ Ο αντίκτυπος της απώλειας των δεδοµένων, όσον αφορά την ισχύ των ερευνητικών συµπερασµάτων, εξαρτάται από τους µηχανισµούς που οδήγησαν στην απώλεια των δεδοµένων, το είδος των απολεσθέντων δεδοµένων και το ποσοστό των απολεσθέντων δεδοµένων επί του συνολικού δείγµατος. Επιπροσθέτως, έχει αποδειχθεί ότι ο µηχανισµός και το είδος της απώλειας των δεδοµένων ασκούν µεγαλύτερη επιρροή στα ερευνητικά αποτελέσµατα σε σχέση µε την έλλειψη µεγάλου αριθµού δεδοµένων. 3.1 Αιτίες Απώλειας των Στοιχείων Και τα δύο προαναφερθέντα ζητήµατα είναι κρίσιµα ζητήµατα που ένας ερευνητής πρέπει να αντιµετωπίσει πριν επιλέξει µια διαδικασία για να εξετάσει τα χαµένα στοιχεία. Σύµφωνα µε τους Little και Rubin (1987), τα στοιχεία µπορεί: να λείπουν εντελώς τυχαία (missing completely at random), να λείπουν τυχαία (missing at random), και να λείπουν για άγνωστη αιτία (non- ignorable). Αναλυτικά, τα στοιχεία µπορεί: 1. Να λείπουν εντελώς τυχαία (missing completely at random) Υπάρχουν διάφοροι λόγοι για τους οποίους ορισµένα στοιχεία µπορούν να λείπουν. Αυτό µπορεί να συµβεί είτε επειδή ο εξοπλισµός δυσλειτούργησε είτε επειδή παρουσιάστηκε κακοκαιρία και έτσι δεν πραγµατοποιήθηκαν µετρήσεις κάποιες ορισµένες µέρες είτε επειδή τα στοιχεία δεν εισήχθησαν σωστά. Στην περίπτωση αυτή τα στοιχεία λείπουν εντελώς τυχαία (MCAR). Συγκεκριµένα, όταν λέµε ότι τα στοιχεία λείπουν εντελώς τυχαία, σηµαίνει ότι η πιθανότητα µια παρατήρηση (Χ i ) να λείπει είναι ανεξάρτητη από την τιµή του Χ i ή από την τιµή οποιωνδήποτε άλλων συµµεταβλητών. Κατά συνέπεια, στοιχεία που αφορούν το οικογενειακό εισόδηµα δεν θα µπορούσαν να θεωρηθούν MCAR εάν οι άνθρωποι µε τα χαµηλά εισοδήµατα ήταν λιγότερο πιθανό να αναφέρουν το οικογενειακό εισόδηµά τους από τους ανθρώπους µε υψηλότερα 6

10 εισοδήµατα. Οµοίως, εάν οι Λευκοί Αµερικανοί πολίτες ήταν πιθανότερο από τους Αφρικανικούς Αµερικανούς πολίτες να παραλείψουν το εισόδηµα, πάλι δεν θα είχαµε τα στοιχεία που να είναι MCAR επειδή στην συγκεκριµένη περίπτωση η απώλεια συσχετίζεται µε το έθνος. Παρατηρήστε ότι είναι η αξία της παρατήρησης, και όχι η απώλεια (missingness) αυτή καθεαυτή που έχει σηµασία. Εάν οι ερωτώµενοι που αρνήθηκαν να εκθέσουν το ατοµικό τους εισόδηµα είναι επίσης πιθανό να αρνηθούν να εκθέσουν και το οικογενειακό τους εισόδηµα, τότε τα στοιχεία αυτά µπορούν να θεωρηθούν MCAR, εφ' όσον κανένα από αυτά δεν έχει οποιαδήποτε σχέση µε το ύψος του εισοδήµατος αυτό καθεαυτό. 2. Να λείπουν τυχαία (missing at random) Συχνά τα στοιχεία δεν λείπουν εντελώς τυχαία, αλλά αυτά µπορούν να είναι ταξινοµήσιµα όπως ελλείποντα τυχαία (MAR). Για τα στοιχεία που λείπουν εντελώς τυχαία, η πιθανότητα το Χ i στοιχείο να λείπει είναι ανεξάρτητη από την αξία του Χ i. Αλλά τα στοιχεία µπορούν να θεωρηθούν ως να λείπουν τυχαία εάν τα στοιχεία αυτά ικανοποιούν την συνθήκη ότι η απώλεια (missingness) δεν εξαρτάται από την αξία του Χ i αν αυτό δεσµευτεί για µια άλλη µεταβλητή. Παραδείγµατος χάριν, οι άνθρωποι που είναι καταθλιπτικοί πιθανώς να είναι λιγότερο πρόθυµοι να εκθέσουν το εισόδηµά τους και συνεπώς το αναφερόµενο εισόδηµα σχετίζεται µε την κατάθλιψη. Εντούτοις, εάν µέσα στους καταθλιπτικούς ασθενείς η πιθανότητα κάποιος να αναφέρει το εισόδηµά του ήταν ανεξάρτητη από το εισοδηµατικό επίπεδο, τότε τα στοιχεία θα εξετάζονταν σαν MAR. 3. Να λείπουν για άγνωστη αιτία (Ignorability) Εάν τα στοιχεία είναι MCAR ή MAR, λέµε ότι η απώλεια (missingness) εµφανίστηκε για λόγο του οποίου η γνώση δεν είναι δυνατή. Η περίπτωση αυτή ονοµάζεται «ignorable». Με τον όρο αυτό εννοούµε ότι δεν είναι απαραίτητο να µοντελοποιήσουµε την απώλεια. Ακόµη και στη σπάνια κατάσταση όπου ο όρος (2) δεν ικανοποιείται, ορισµένες µέθοδοι που υποθέτουν ότι το «ignorability» ισχύει µπορούν να εφαρµοστούν, αλλά το καλύτερο θα ήταν να διαµορφωθεί ένα µοντέλο για την αντιµετώπιση του προβλήµατος των ελλειπόντων δεδοµένων. Σε αντίθεση µε τα στοιχεία που λείπουν 7

11 τυχαία, τα ελλείποντα στοιχεία λείπουν για γνωστή αιτία, δηλαδή είναι «non- ignorable» εάν η πιθανότητα της απώλειας των δεδοµένων εξαρτάται από τις τιµές αυτών. Αντίθετα από την προηγούµενη περίπτωση όπου αγνοούµε την αιτία που έχουµε ελλείποντα στοιχεία, στην συγκεκριµένη περίπτωση το µοντέλο που περιγράφει τα ελλείποντα στοιχεία πρέπει να διευκρινιστεί από τον ερευνητή και να ενσωµατωθεί στην ανάλυση των δεδοµένων, προκειµένου να παραχθούν οι αµερόληπτες εκτιµήσεις των παραµέτρων. Είναι εύκολο να καταλάβουµε ότι τα «non-ignorable» απολεσθέντα στοιχεία στην έρευνα είναι πλέον πιθανό να εµφανιστούν στις µελέτες που επιδιώκουν να συγκεντρώσουν τις ευαίσθητες ή προσωπικές πληροφορίες των διαφόρων ατόµων. Αξίζει να σηµειώσουµε ότι κανένα στατιστικό τεστ δεν υπάρχει προς το παρόν που να εξετάζει εάν αυτός ο όρος ικανοποιείται. 3.2 Γενικά Σχόλια σχετικά µε τις Αιτίες Απώλειας εδοµένων Στο σηµείο αυτό θα πρέπει να σηµειώσουµε ότι ο όρος MCAR µπορεί να εξεταστεί χρησιµοποιώντας το πολυµεταβλητό τεστ του Little το οποίο εξετάζει εάν ο όρος MCAR ισχύει για τα συγκεκριµένα δεδοµένα.. Η περίπτωση του όρου MAR µπορεί να εξεταστεί µε ένα απλό t-test των µέσων διαφορών µεταξύ του γκρουπ µε τα πλήρη στοιχεία και αυτού µε τα απολεσθέντα στοιχεία. Εντούτοις, προειδοποιούµε τους αναγνώστες ότι τα αποτελέσµατα αυτών των ελέγχων δεν παρέχουν αναµφισβήτητες αποδείξεις ότι βρισκόµαστε είτε στην περίπτωση MCAR είτε στην MAR. Σχετικά µε την ερώτηση που αφορά το µέγιστο ποσοστό των απολεσθέντων δεδοµένων που µπορεί µια µέθοδος να δώσει αξιόπιστα αποτελέσµατα, δεν υπάρχει καµία συγκεκριµένη απάντηση που να βρίσκει σύµφωνους όλους τους στατιστικούς αυτή τη στιγµή. Στην περίπτωση που λείπουν µόνο λίγες τιµές σε ένα τυχαίο υπόδειγµα από ένα µεγάλο σύνολο δεδοµένων (δηλ. στην περίπτωση MCAR), το πρόβληµα ελλειπόντων δεδοµένων είναι λιγότερο σοβαρό και σχεδόν κάθε µέθοδος για τα χαµένα δεδοµένα παράγει παρόµοια αποτελέσµατα. Εντούτοις, αν ένα µεγάλο ποσοστό δεδοµένων λείπει, τότε το πρόβληµα µπορεί να είναι πολύ σοβαρό. 8

12 ΚΕΦΑΛΑΙΟ 4 Ο : ΕΠΙΣΚΟΠΗΣΗ ΤΩΝ ΠΕΝΤΕ ΕΙ ΙΚΩΝ ΜΕΘΟ ΩΝ ΕΛΛΕΙΠΟΝΤΩΝ Ε ΟΜΕΝΩΝ 4.1 Ιστορική Αναδροµή Η ιστορία της ανάπτυξης των µεθόδων των ελλειπόντων δεδοµένων µπορεί να διαιρεθεί σε τρεις χρονικές περιόδους (Schafer, 1997). Στην πρώτη περίοδο, που αφορά τo χρονικό διάστηµα πριν από το έτος 1980, οι περισσότερες ευρέως εφαρµοσµένες µέθοδοι που εξέταζαν τα ελλείποντα δεδοµένα ήταν ειδικές. Αυτές περιλαµβάνουν το LD, το PD, την Αντικατάσταση µε τον Μέσο (Mean Substitution), την απλή Hot-Deck µέθοδο και τις διάφορες βασισµένες στην Παλινδρόµηση µεθόδους (Regression- Based Methods). Οι προαναφερθείσες µέθοδοι είναι εύκολες στην χρήση αλλά παράγουν µεροληπτικούς εκτιµητές. Στη δεύτερη περίοδο, κατά προσέγγιση αρχίζοντας µε τη δηµοσίευση του άρθρου των Little και Rubin (1987), οι µέθοδοι, όπως η Πλήρης Πληροφορίας Μέγιστη Πιθανοφάνεια (Full Information Maximum Likelihood ή FIML) και ο Αλγόριθµος EM (Expectation Maximization), άρχισαν να εµφανίζονται. Αυτές οι µέθοδοι είναι γενικά ανώτερες από τις ειδικές µεθόδους δεδοµένου ότι είναι στατιστικά επαρκείς και παράγουν εκτιµητές των παραµέτρων µε αποδεκτά τυπικά σφάλµατα. Αν και αυτές οι µέθοδοι βασίζονται σε συγκεκριµένα µοντέλα και µπορεί να είναι δύσκολο να εφαρµόσουν, αντιµετωπίστηκαν ως πολύ σηµαντικές και συνάµα εντυπωσιακές ανακαλύψεις στην ιστορία των µεθόδων των απολεσθέντων δεδοµένων. Η τρίτη περίοδος στην ανάπτυξη των µεθόδων των ελλειπόντων δεδοµένων άρχισε προς το τέλος της δεκαετίας του '80 και στις αρχές της δεκαετίας του 90 και χαρακτηρίστηκε από την εισαγωγή των µεθόδων πολλαπλής απόδοσης (multiple imputation methods) για να υπερνικηθούν οι περιορισµοί των απλών µεθόδων απόδοσης. Οι µελέτες προσοµοίωσης έχουν δείξει ότι η µέθοδος Πολλαπλής Απόδοσης είναι ευπροσάρµοστη και ότι παράγει εκτιµητές µε µικρότερα τυπικά σφάλµατα από εκείνα που λαµβάνονται από τις άλλες διαδικασίες. Αν και η µέθοδος πολλαπλής απόδοσης 9

13 αποτελεί την πιο πρόσφατη προσπάθεια από τους µελετητές σχετικά µε την εξέταση του προβλήµατος των ελλειπόντων δεδοµένων, δεν έχει υιοθετηθεί ευρέως από τους ερευνητές. Σε αυτό το µέρος της εργασίας, αναφέρουµε τις πέντε ειδικές µεθόδους για τα χαµένα δεδοµένα λόγω της επικράτησής τους στο στατιστικό λογισµικό. Αυτές περιλαµβάνουν τις δύο µεθόδους που περιγράψαµε νωρίτερα (δηλ. την Listwise και Pairwise deletion), µαζί µε την Αντικατάσταση από τον Μέσο (Mean Substitution), την απλή Hot-Deck µέθοδο, και την Παλινδρόµηση. Τα πλεονεκτήµατα και τα µειονεκτήµατα κάθε µεθόδου συζητούνται από την άποψη της εκτίµησης των παραµέτρων και των ελέγχων υποθέσεων. Ακόµη, παραθέτουµε και τις µεθόδους: Principled Single Imputation- FIML, Principled Single Imputation- EM και Multiple Imputation- MI. 4.2 Listwise διαγραφή (LD) Όπως σηµειώθηκε και νωρίτερα, το LD αφαιρεί από τη στατιστική ανάλυση τα υποκείµενα που έχουν τις ελλείπουσες πληροφορίες για µία ή περισσότερα µεταβλητές. Όπως ο Kim και ο Curry (1977) παρουσιάζουν, το 59% των δεδοµένων µπορεί να χαθεί χρησιµοποιώντας την µέθοδο LD εάν µόνο 10% των δεδοµένων χαθούν τυχαία από κάθε µεταβλητή σε ένα σύνολο δεδοµένων µε πέντε µεταβλητές. Το LD είναι η ευκολότερη και η πιο κοινή µέθοδος για τα χαµένα δεδοµένα, ενώ αυτή η δηµοτικότητά της οφείλεται κυρίως στο γεγονός ότι Listwise ιαγραφή αποτελεί προεπιλογή σε περιπτώσεις πολυµεταβλητών και διαφόρων µονοµεταβλητών στατιστικών διαδικασιών στα δηµοφιλή στατιστικά πακέτα, όπως το SPSS, το SYSTAT και το SAS. Αν και το LD γενικά δεν συστήνεται, µπορεί να χρησιµοποιηθεί ακίνδυνα εάν τόσο οι συσχετίσεις µεταξύ τεσσάρων ή λιγότερων µεταβλητών είναι µικρές όσο και το ποσοστό των απολεσθέντων δεδοµένων είναι µικρό. Εφ' όσον ισχύει η υπόθεση MCAR για τα χαµένα δεδοµένα, ο Allison βεβαίωσε ότι µεταξύ των συµβατικών µεθόδων για τα ελλιπή δεδοµένα, η Listwise Deletion είναι η λιγότερο προβληµατική µέθοδος. Αν και η 10

14 Listwise Deletion µπορεί να απορρίψει ένα ουσιαστικό µέρος των δεδοµένων, δεν υπάρχει κανένας λόγος να αναµείνει κανείς µεροληψία εκτός αν τα στοιχεία δεν λείπουν εντελώς τυχαία. Επιπλέον, τα τυπικά σφάλµατα θα είναι αρκετά καλές εκτιµήσεις των αληθινών τυπικών σφαλµάτων των διαφόρων εκτιµητών. Επιπλέον, εάν εκτιµούµε ένα µοντέλο γραµµικής παλινδρόµησης, η Listwise Deletion είναι αρκετά ευσταθής σε καταστάσεις όπου υπάρχουν ελλειπόντα δεδοµένα στην ανεξάρτητη µεταβλητή και η πιθανότητα απώλειας εξαρτάται από την αξία εκείνης της µεταβλητής. Εάν εκτιµούµε ένα λογιστικό µοντέλο παλινδρόµησης, τότε η Listwise Deletion µπορεί να εφαρµοστεί έστω και αν υπάρχει µη τυχαία απώλεια στην εξαρτηµένη µεταβλητή ή µη τυχαία απώλεια στις ανεξάρτητες µεταβλητές (αλλά όχι και στις δύο). Με άλλα λόγια, όταν έχουµε περίπτωση MCAR, το LD δεν παράγει τις µεροληπτικές εκτιµήσεις και οι συνήθεις στατιστικές διαδικασίες µπορούν να εφαρµοστούν. Ακόµα, η απώλεια στη στατιστική ισχύ κάθε ελέγχου και στην ακρίβεια της εκτίµησης δεν πρέπει να αγνοηθεί, ούτε µπορεί να αντισταθµιστεί. Εάν η υπόθεση MCAR δεν ισχύει, τότε το LD παράγει µεροληπτικές εκτιµήσεις παραµέτρων και µεροληπτικά στατιστικά τεστ και τα αποτελέσµατα είναι µη αντιπροσωπευτικά του πληθυσµού από τον οποίο επιλέχθηκε το δείγµα (Cohen & Cohen, 1983). Το LD εποµένως δεν αποτελεί µια ικανοποιητική λύση στο πρόβληµα των ελλειπόντων δεδοµένων. 4.3 Pairwise διαγραφή (PD) Η Pairwise διαγραφή διατηρεί όλα τα διαθέσιµα δεδοµένα που παρέχονται από ένα υποκείµενο. Όταν αυτή η προσέγγιση εφαρµόζεται στην ανάλυση των δεδοµένων, οι διάφορες µέθοδοι της περιγραφικής στατιστικής και µερικές της επαγωγικής στατιστικής, όπως το t-test, το z-test, το chi-square καθώς και άλλα υπολογίζονται από τα µη - ελλείποντα δεδοµένα ανά µεταβλητή. Αν η Pairwise διαγραφή είναι τόσο εύκολη όσο η Listwise ιαγραφή, δεν χρησιµοποιείται τόσο ευρέως όσο η προαναφερθείσα. Σύµφωνα µε τους Kim και Curry (1977), η Pairwise ιαγραφή είναι µια ελκυστική εναλλακτική 11

15 λύση όταν υπάρχει µικρός αριθµός ελλειπόντων δεδοµένων σε κάθε µεταβλητή σε σχέση µε το συνολικό µέγεθος δείγµατος καθώς και µεγάλος αριθµός µεταβλητών. Έναντι της µεθόδου Listwise Deletion, η Pairwise Deletion χρησιµοποιεί τις πληροφορίες που λαµβάνονται από τις µερικώς πλήρεις παρατηρήσεις. Το µειονέκτηµά της είναι ότι το µέγεθος του δείγµατος αλλάζει από µεταβλητή σε µεταβλητή. Αυτή η µεταβλητότητα στο µέγεθος δείγµατος δηµιουργεί πρακτικά προβλήµατα, όπως ο προσδιορισµός του συνολικού µεγέθους δείγµατος και ο προσδιορισµός του αριθµού των βαθµών ελευθερίας. Όπως η Listwise Deletion, η Pairwise Deletion παράγει µεροληπτικές εκτιµήσεις των παραµέτρων και µεροληπτικά στατιστικά τεστ εκτός αν η υπόθεση MCAR ισχύει. Για αυτούς τους λόγους, η Pairwise Deletion δεν είναι µια ικανοποιητική λύση στο πρόβληµα των ελλειπόντων δεδοµένων. 4.4 Αντικατάσταση µε τον Μέσο (Mean Substitution) Η προσέγγιση MS "λύνει" το πρόβληµα των ελλειπόντων δεδοµένων µε την αντικατάσταση των ελλειπόντων τιµών µε το µέσο όρο της κάθε µεταβλητής. Αυτό το βήµα ολοκληρώνεται στην αρχή της ανάλυσης δεδοµένων. Εποµένως η συγκεκριµένη µέθοδος υποθέτει ότι ο µέσος όρος µίας µεταβλητής είναι η καλύτερη εκτίµηση για οποιαδήποτε παρατήρηση που λείπει από την συγκεκριµένη µεταβλητή. Σε αντίθεση µε την Listwise Deletion και Pairwise Deletion, η µέθοδος MS δεν αλλάζει το µέσο όρο της µεταβλητής και δεν απορρίπτει οποιεσδήποτε πληροφορίες έχουν ήδη συλλεχθεί. Μια παραλλαγή του MS είναι η περίπτωση όπου µία χαµένη τιµή αντικαθίσταται µε τον µέσο της υποοµάδας στην οποία ανήκει. Παραδείγµατος χάριν, εάν η παρατήρηση µε µια ελλείπουσα τιµή ανήκει σε ένα άτοµο που είναι ηµοκρατικός, ο µέσος όρος για όλους τους ηµοκρατικούς υπολογίζεται και αντικαθιστά την ελλείπουσα αυτή τιµή. Αυτή η διαδικασία δεν είναι τόσο συντηρητική όσο να παρεµβάλλαµε το γενικό µέσο όρο της µεταβλητής. Ανεξάρτητα από το είδος της µεθόδου MS που εφαρµόζεται, αυτή η µέθοδος έχει πολλούς περιορισµούς. Σύµφωνα µε τους Little και Rubin (1987), οι περιορισµοί είναι ότι: (α) Το µέγεθος του δείγµατος υπερεκτιµάται, (β) η διασπορά υποτιµάται, (γ) οι 12

16 συσχετίσεις είναι αρνητικά µεροληπτικές, και (δ) η κατανοµή των νέων τιµών είναι µια ανακριβής αντιπροσώπευση των τιµών του πληθυσµών, επειδή η µορφή της κατανοµής διαστρεβλώνεται µε την προσθήκη των τιµών οι οποίες ταυτίζονται µε το µέσο όρο. Η µεροληψία που εισάγεται στη διασπορά του πληθυσµού, στην συσχέτιση και την κατανοµή των µεταβλητών εξαρτάται από το ποσοστό των δεδοµένων που λείπουν. Οι Little και Rubin συνιστούν να µην χρησιµοποιείται ποτέ η µέθοδος MS. 4.5 Απλή Hot-Deck (HD) Η µέθοδος Hot-Deck αντικαθιστά κάθε ελλείπουσα τιµή µε µια τυχαία επιλεγµένη τιµή από το δείγµα στην ίδια µεταβλητή. Οι παράµετροι που υπολογίζονται µ' αυτό τον τρόπο έχουν τις µεγαλύτερες διασπορές έναντι εκείνων που υπολογίζονται από την MS, αλλά µικρότερες διασπορές από εκείνες του πλήρους δείγµατος. Το σοβαρότερο µειονέκτηµα αυτής της µεθόδου είναι η διαστρέβλωση των συσχετίσεων και των συνδιακυµάνσεων. Συνεπώς, αυτή η µέθοδος δεν πρέπει να χρησιµοποιηθεί όταν πρόκειται να χρησιµοποιηθούν στατιστικές µέθοδοι βασισµένες είτε στις συσχετίσεις είτε στις συνδιακυµάνσεις. 4.6 Εκτίµηση Παλινδρόµησης (Regression Estimation) Η Εκτίµηση Παλινδρόµησης αντικαθιστά τις ελλείπουσες τιµές µε τις προβλεφθείσες τιµές που προσδιορίζονται από µια εξίσωση παλινδρόµησης που βασίζεται στις µεταβλητές που δεν έχουν καµία χαµένη τιµή. Οι µεταβλητές µε χαµένα δεδοµένα αντιµετωπίζονται ως κριτήρια και οι τιµές τους προβλέπονται από όλες τις µεταβλητές που έχουν όλα τους τα στοιχεία. Εάν τα ελλείποντα στοιχεία επιδεικνύουν µία µονοτονία και µπορούµε να κάνουµε την ρεαλιστικότερη υπόθεση, δηλαδή ότι λείπουν εντελώς τυχαία, η Εκτίµηση Παλινδρόµησης µπορεί να χρησιµοποιηθεί για να απλοποιήσει την εκτίµηση των παραµέτρων του πληθυσµού. Έναντι άλλων ήδη 13

17 αναφερθέντων µεθόδων, η Εκτίµηση Παλινδρόµησης είναι πιο πληροφοριακή επειδή χρησιµοποιεί τις πληροφορίες που ήδη υπάρχουν σε ένα δείγµα. Παροµοίως µε την µέθοδο MS, η µέθοδος Εκτίµησης Παλινδρόµησης έχει το πλεονέκτηµα ότι στις περιπτώσεις που έχουµε απώλεια δεδοµένων το αρχικό µέγεθος δείγµατος διατηρείται. Τα µειονεκτήµατα της Εκτίµησης Παλινδρόµησης περιλαµβάνουν: (α) ένα µοντέλο παλινδρόµησης που πρέπει να καθοριστεί (β) οι καθ' υπολογισµό τιµές πάντα προβλέπονται σωστά από το µοντέλο παλινδρόµησης ενώ οι συσχετίσεις και οι συνδιακυµάνσεις είναι αναπόφευκτα αυξηµένες (γ) µπορεί να είναι δύσκολο να εφαρµοστεί η µέθοδος της Εκτίµησης Παλινδρόµησης σε πολυµεταβλητά σύνολα δεδοµένων όταν περισσότερες από µια µεταβλητές έχουν ελλείπουσες τιµές (δ) οι προβλεφθείσες τιµές µπορούν να υπερβούν το λογικό εύρος τιµών των αποτελεσµάτων για τα χαµένα δεδοµένα (ε) µπορεί να απαιτήσει µεγάλα δείγµατα για να παράγει σταθερές εκτιµήσεις (στ) µπορούν να παραγάγουν τις λεπτόκυρτες (leptokurtic) κατανοµές, δηλαδή τις κατανοµές που έχουν µεγαλύτερο συντελεστή κύρτωσης από την κανονική κατανοµή, (ζ) εάν οι καλοί εκτιµητές των ελλειπόντων δεδοµένων δεν είναι διαθέσιµοι στο συνολικό δείγµα δεδοµένων, τότε οι προβλεφθείσες τιµές δεν είναι καλύτερες από το µέσο όρο. Με άλλα λόγια, η µέθοδος της Εκτίµησης Παλινδρόµησης και η µέθοδος MS καταλήγουν σε παρόµοια αποτελέσµατα αν ένα αποτελεσµατικό µοντέλο παλινδρόµησης δεν µπορεί να προσδιοριστεί. Για να υπερνικήσουν τον περιορισµό (β) που αναγέρθηκε παραπάνω, οι στατιστικοί έχουν προτείνει µία τροποποιηµένη µέθοδο Εκτίµησης Παλινδρόµησης. Στην µέθοδο αυτή στις καθ' υπολογισµό τιµές προστίθεται ένα τυχαίο σφάλµα. Το τυχαίο σφάλµα παράγεται τυχαία από µια κανονική κατανοµή µε µέσο όρο 0 και τυπικό σφάλµα ίσο µε την τετραγωνική ρίζα του µέσου τετραγωνικού σφάλµατος του µοντέλου παλινδρόµησης. Όπως αναφέρθηκε και νωρίτερα, οι µέθοδοι MS, Εκτίµησης Παλινδρόµησης καθώς και οι ειδικές µέθοδοι "λύνουν" το πρόβληµα των ελλειπόντων δεδοµένων µε το να αποδώσουν τις ελλείπουσες τιµές µία φορά και κατά συνέπεια αναφέρονται ως απλές µέθοδοι απόδοσης. Η απλή αυτή προσέγγιση δυστυχώς δεν απεικονίζει την αβεβαιότητα που πηγάζει από την εκτίµηση των απολεσθέντων δεδοµένων. ηλαδή το σφάλµα στην εξίσωση εκτίµησης (οποιασδήποτε µορφής) που χρησιµοποιείται για να αποδώσει 14

18 κάποια τιµή στις ελλείπουσες τιµές τίθεται µηδέν. Επιπλέον, το µέγεθος του δείγµατος είναι πολύ µεγαλύτερο από το πραγµατικό. Επιπροσθέτως, τα διαστήµατα εµπιστοσύνης για τις εκτιµώµενες παραµέτρους είναι πάρα πολύ στενά, και το σφάλµα τύπου Ι είναι πάρα πολύ υψηλό (Little & Rubin, 1987). Για να παρουσιάσουµε καλύτερα αυτές τις ανεπάρκειες των µεθόδων MS και Εκτίµησης Παλινδρόµησης ας υποθέσουµε ότι το 30% των στοιχείων λείπουν και ότι επιθυµούµε να παραγάγουµε ένα διάστηµα εµπιστοσύνης για έναν συντελεστή παλινδρόµησης. Η χρήση οποιεσδήποτε από αυτές τις δύο µεθόδους για να παραχθεί ένα πλήρες σετ δεδοµένων σηµαίνει ότι τα διαστήµατα µε τις ονοµαστικές τιµές επιπέδων εµπιστοσύνης 90%, 95%, και 99% στην πραγµατικότητα έχουν επίπεδα εµπιστοσύνης 77%, 85%, και 94%, αντίστοιχα (Rubin, 1996). Οµοίως, σε ένα πλαίσιο ελέγχου υποθέσεων που περιλαµβάνει µια µηδενική υπόθεση µε δέκα παραµέτρους στις οποίες τα ελλείποντα στοιχεία έχουν αποδοθεί χρησιµοποιώντας µία από τις προαναφερθείσες µεθόδους, το στατιστικό τεστ που εκτελείται σε επίπεδο σηµαντικότητας α µε τιµές 10%, 5%, ή 1% στην πραγµατικότητα εκτελείται σε επίπεδο σηµαντικότητας 57%, 45%, και 25%, αντίστοιχα, ενώ το πρόβληµα αυτό επιδεινώνεται όσο αυξάνεται το ποσοστό των χαµένων δεδοµένων στο σύνολο ή όσο αυξάνεται ο αριθµός των παραµέτρων του µοντέλου (Rubin 1996). 15

19 ΚΕΦΑΛΑΙΟ 5 Ο : ΑΠΛΗ ΑΠΟ ΟΣΗ ΜΕ ΑΡΧΕΣ- FIML (PRINCIPLED SINGLE IMPUTATION- FIML) H συντοµογραφία FIML σηµαίνει Full Information Maximum Likelihood ή Πλήρους Πληροφορίας Μέγιστη Πιθανοφάνεια και αντιπροσωπεύει µία πρωταρχική µέθοδο για την εκτίµηση των µέσων τιµών και των συνδιακυµάνσεων όταν αυτά βασίζονται σε ελλιπή δεδοµένα και µπορούµε να υποθέσουµε ότι βρισκόµαστε στην περίπτωση MAR. Στη µέγιστη πιθανοφάνεια (ML), οι εκτιµήσεις των παραµέτρων παράγονται έτσι ώστε η πιθανοφάνεια να µεγιστοποιείται. Η µέθοδος FIML για την εκτίµηση των παραµέτρων παρουσία ελλείπων δεδοµένων κάνει εκτενή χρήση του εκτιµητή µέγιστης πιθανοφάνειας. Η µέθοδος FIML έχει τις ρίζες της στην εργασία των Hartley και Hocking (1971). Λαµβάνοντας υπόψη τις q οµάδες, µια για κάθε τύπο των απολεσθέντων δεδοµένων, το FIML υπολογίζει αρχικά την πιθανοφάνεια για κάθε µια από τις q οµάδες. Εάν δεν υπάρχει κανένα ελλείπον στοιχείο, τότε θέτουµε q=1. Η πρόθεση του FIML είναι να χρησιµοποιήσει την πληροφορία από κάθε τύπο απολεσθέντων δεδοµένων για να εκτιµήσει τις παραµέτρους. Στις περιπτώσεις που ισχύει η υπόθεση της πολυµεταβλητής κανονικότητας, οι q πιθανοφάνειες αθροίζονται. Το αποτέλεσµα της άθροισης των πιθανοφανειών χρησιµεύει ως η βάση για την εκτίµηση των παραµέτρων µε χρήση µέγιστης πιθανοφάνειας. Η FIML µέθοδος είναι εννοιολογικά παρόµοια µε την µέθοδο των q-γκρουπ των Hartley και Hocking (1971), εκτός από το ότι η πιθανοφάνεια υπολογίζεται για κάθε παρατήρηση, χρησιµοποιώντας οποιαδήποτε δεδοµένα είναι διαθέσιµα για την συγκεκριµένη παρατήρηση. Στις περιπτώσεις της πολυµεταβλητής κανονικής κατανοµής οι µέθοδοι MAR και FIML υπολογίζουν µια πιθανοφάνεια για κάθε περίπτωση χρησιµοποιώντας όλα τα διαθέσιµα δεδοµένα. Αφότου έχουν υπολογιστεί N πιθανοφάνειες, αθροίζονται και ο εκτιµητής µέγιστης πιθανοφάνειας χρησιµοποιείται για να υπολογίσει τους µέσους, τις διασπορές και τις συνδιακυµάνσεις βασισµένες στην αθροισµένη πιθανοφάνεια. Αυτές οι εκτιµήσεις των παραµέτρων θα είναι αµερόληπτες και επαρκείς παρουσία ελλειπόντων δεδοµένων υπό τις υποθέσεις MAR και πολυµεταβλητής κανονικότητας. 16

20 ΚΕΦΑΛΑΙΟ 6 Ο : ΑΠΛΗ ΑΠΟ ΟΣΗ ΜΕ ΑΡΧΕΣ- EM ΑΛΓΟΡΙΘΜΟΣ (PRINCIPLED SINGLE IMPUTATION- EM ALGORITHM) Ο αλγόριθµος EM αποτελεί την µεγιστοποίηση της προσδοκίας και είναι µία µέθοδος µε αρχές για την επεξεργασία των ελλειπόντων στοιχείων. Ο όρος EM καθιερώθηκε από τους Dempster, Laird και Rubin στην δηµοσιευµένη εργασία τους που σχετιζόταν µε αυτή την µέθοδο το έτος Σύµφωνα τους Little και Rubin (1987), ο αλγόριθµος EM τυποποιεί µια σχετικά παλαιά «ad hoc» ιδέα για το χειρισµό των ελλειπόντων στοιχείων ως εξής: (1) αντικαθιστά τις ελλείπουσες τιµές µε τις κατ' εκτίµηση τιµές, (2) εκτιµά τις παραµέτρους, (3) επανεκτιµά τις ελλείπουσες τιµές υποθέτοντας ότι οι νέες εκτιµήσεις των παραµέτρων είναι σωστές, (4) επανεκτιµά τις παραµέτρους και ούτω καθ εξής, επαναλαµβάνοντας την προαναφερθείσα διαδικασία µέχρι να έχουµε σύγκλιση. Κάθε επανάληψη του αλγορίθµου EM αποτελείται από δύο βήµατα: ένα βήµα Ε (Expectation- Προσδοκία) που ακολουθείται από ένα βήµα Μ (Maximization- Μεγιστοποίηση). Στο βήµα Ε, η αναµενόµενη τιµή του λογαρίθµου της πιθανοφάνειας του πλήρους σετ δεδοµένων προκύπτει, λαµβάνοντας υπόψη τα παρατηρηθέντα στοιχεία και τις κατ' εκτίµηση παραµέτρους από µια προηγούµενη επανάληψη. Στο βήµα Μ, η δεσµευµένη αναµενόµενη τιµή του λογαρίθµου της πιθανοφάνειας του πλήρους σετ δεδοµένων µεγιστοποιείται. Η τιµή αυτή αυξάνεται έως ότου επιτυγχάνεται ένα στάσιµο σηµείο (Dempster et Al, 1977). Με άλλα λόγια, ο αλγόριθµος συνεχίζεται έως ότου η παρατηρηθείσα πιθανοφάνεια που παράγεται σε δύο διαδοχικές επαναλήψεις είναι σχεδόν ίδια. 17

21 ΚΕΦΑΛΑΙΟ 7 Ο : ΠΟΛΛΑΠΛΗ ΑΠΟ ΟΣΗ (MULTIPLE IMPUTATION- MI) Για να υπερνικηθούν οι περιορισµοί των µεθόδων που αποτυγχάνουν να λάβουν υπόψη την αβεβαιότητα που συνδέεται µε τις καθ' υπολογισµό τιµές, ο Rubin και οι συνεργάτες του ανέπτυξαν την πολλαπλή µέθοδο απόδοσης (MI) στη δεκαετία του '80. Η µέθοδος MI είναι µια έγκυρη µέθοδος για τον χειρισµό των χαµένων στοιχείων στην περίπτωση MAR. Είναι µια γενικής χρήσης µέθοδος, ιδιαίτερα αποδοτική ακόµη και για µικρά µεγέθη δείγµατος. Η µέθοδος MI γενικά αποτελείται από τρία βήµατα: απόδοση, ανάλυση, και συγκέντρωση. Στην πρώτη φάση (απόδοση), κάθε ελλείπουσα τιµή αντικαθίσταται από όχι µια, αλλά m >1 προσοµοιωµένες τιµές. Οι καθ' υπολογισµό τιµές προέρχονται από µια κατανοµή που προσδιορίζεται από τον ερευνητή. Στο τέλος του πρώτου βήµατος m πλήρη σετ δεδοµένων δηµιουργούνται. Στο δεύτερο βήµα (ανάλυση), κάθε ένα από τα m πλήρη σετ δεδοµένων αναλύεται µε τις τυποποιηµένες µεθόδους ανάλυσης δεδοµένων. Τέλος, τα αποτελέσµατα των m αναλύσεων είναι ενσωµατωµένα στο τρίτο βήµα (συγκέντρωση) για να παραγάγουν ένα τελικό αποτέλεσµα όπως µια εκτίµηση διαστήµατος εµπιστοσύνης για µια παράµετρο του πληθυσµού ή για έναν έλεγχο υποθέσεων ή για ένα LRT τεστ (Likelihood Ratio Test). 18

22 ΚΕΦΑΛΑΙΟ 8 Ο : Η ΣΗΜΑΣΙΑ ΤΩΝ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΙΣ ΜΕΘΟ ΟΥΣ ΜΕ ΑΡΧΕΣ Οι µέθοδοι FIML, EM, και MI που περιγράφονται στα προηγούµενα τµήµατα της παρούσης εργασίας στηρίζονται σε δύο βασικές υποθέσεις. Η πρώτη υπόθεση είναι ότι τα ελλείποντα στοιχεία λείπουν τυχαία. Εάν ένας ερευνητής αναµένει ότι θα έχει απώλεια δεδοµένων, θα πρέπει να συλλέξει επιπρόσθετα δεδοµένα που να αφορούν µεταβλητές που θεωρούνται ότι συνδέονται µε τα απολεσθέντα δεδοµένα ως στερεότυπο µέρος του σχεδίου µιας µελέτης, ακόµα κι αν αυτές οι µεταβλητές µπορεί να µην σχετίζονται άµεσα µε την συγκεκριµένη έρευνα. Ακόµη, ένα µοντέλο ελλειπόντων δεδοµένων που εξηγεί ένα µέρος της απώλειας µειώνει την µεροληψία και είναι πιθανό να παραγάγει καλύτερους εκτιµητές από αυτούς που βασίζονται στην LD. Οι µέθοδοι FIML, EM, και MI (όπως εφαρµόζονται στο πακέτο SAS PROC MI) επίσης υποθέτουν ότι τα πλήρη στοιχεία ακολουθούν µια πολυµεταβλητή κανονική κατανοµή. Πάλι, υπάρχει πολύ λίγη βιβλιογραφία που να εξετάζει τα αποτελέσµατα της µη κανονικότητας στις εκτιµήσεις των παραµέτρων. Στο σηµείο αυτό θα πρέπει να αναφέρουµε ότι, ενώ µπορεί να φανεί λογικό πως οι δραστικές αποκλίσεις από αυτήν την υπόθεση θα οδηγήσουν σε µεροληπτικά συµπεράσµατα µερικοί επιστήµονες, όπως οι Graham και Schafer (1999) διαφωνούν. Οι προαναφερθέντες υποστήριξαν ότι η µη κανονικότητα ασκεί λίγη επίδραση στα συµπεράσµατα που προέρχονται από την µέθοδο MI, επειδή οι καθ' υπολογισµό τιµές θα µοιάζουν µε τα παρατηρηθέντα δεδοµένα στις πρώτες και δεύτερες ροπές (δηλ. στον µέσο όρο και την διασπορά). εδοµένου ότι οι περισσότερες αναλύσεις δεδοµένων για την εκπαιδευτική έρευνα είναι βασισµένες στις πρώτες και δεύτερες ροπές, µπορούµε να πούµε ότι το πρόβληµα που προκαλείται από την µη κανονικότητα δεν είναι συνήθως αρκετό για να δηµιουργήσει µεροληψία στα συµπεράσµατα. Παρά όµως την αισιοδοξία των Graham και Schafer, φαίνεται συνετό να χρησιµοποιηθούν οι µέθοδοι για ελλείποντα δεδοµένα προσεκτικά όταν υπάρχουν ισχυρές ενδείξεις ώστε να απορρίψουµε την υπόθεση της κανονικότητας. 19

23 ΚΕΦΑΛΑΙΟ 9 Ο : ΣΥΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΕΡΕΥΝΑ Ακριβώς όπως οι ποιοτικοί ερευνητές στην εκπαίδευση έχει αγωνιστεί για να συµβαδίζουν µε τις νέες ανακαλύψεις κατά τη διάρκεια των προηγούµενων 20 ετών, έτσι θα πρέπει και οι ποσοτικοί ερευνητές να ενσωµατώσουν τις προόδους που παρέχονται από τους άλλους επιστήµονες στη σφαίρα της έρευνας. Ο αντίκτυπος των ελλειπόντων δεδοµένων όσον αφορά την ποσοτική έρευνα πρέπει να αποτελέσει αντικείµενο µελέτης για τους ερευνητές. Ακόµη, θα πρέπει να σηµειωθεί ότι στην διάρκεια του 20 ου αιώνα έχουν γίνει πολύ σηµαντικές ανακαλύψεις στον τοµέα αυτό. Εντούτοις, αυτή η πρόοδος δεν έχει ασκήσει επίδραση στον τρόπο µε τον οποίο οι ερευνητές αντιµετωπίζουν το πρόβληµα των ελλειπόντων δεδοµένων. υστυχώς, οι µέθοδοι Listwise Deletion και Pairwise Deletion έχουν παρουσιαστεί στη βιβλιογραφία και έχει αποδειχθεί ότι είναι µεροληπτικές και ανεπαρκείς. Ορισµένες νεώτερες και µε περισσότερες υποθέσεις µέθοδοι λαµβάνουν υπόψη τους όρους κάτω από τους οποίους τα χαµένα στοιχεία εµφανίζονται. Αυτές οι µέθοδοι έχουν εφαρµοστεί στα διάφορα στατιστικά λογισµικά, όπως στο SPSS και το SAS και κατά συνέπεια, είναι προσιτές στους ερευνητές. Σε αυτή την εργασία παρουσιάσαµε την χρήση τριών από αυτές τις µεθόδους για τα ελλείποντα δεδοµένα, δηλαδή την µέθοδο FIML, τον αλγόριθµο EM και την µέθοδο Πολλαπλής Απόδοσης (MI). Ακόµη, θα πρέπει να σηµειωθεί ότι για να ελαχιστοποιήσουν, ή ακόµη και να αποβάλλουν πλήρως τη πιθανή παρουσία µεροληψίας στα ποσοτικά ερευνητικά συµπεράσµατα και για να εξασφαλίσουν αξιόπιστα συµπεράσµατα στα οποία βασίζουν ένα µεγάλο µέρος της σκέψης µας, είναι ουσιαστικό ότι οι ερευνητές να λαµβάνουν υπόψη τις ακόλουθες συστάσεις. Κατ αρχάς, θα πρέπει να γίνονται προσπάθειες να συλλεχθούν δεδοµένα στο µεγαλύτερο βαθµό και µε την υψηλότερη ποιότητα. Με τον τρόπο αυτό οι ερευνητές ελαχιστοποιούν τον αριθµό των χαµένων δεδοµένων και έτσι µειώνουν την µεροληψία και την διαστρέβλωση των εκτιµώµενων παραµέτρων του πληθυσµού ή των ελέγχων υποθέσεων. Ακόµα κι αν οι διαδικασίες για τα χαµένα στοιχεία είναι αξιόπιστες, η ισχύς τους εξαρτάται από τον µηχανισµό απώλειας των δεδοµένων και από την ισχύ των κατάλληλων υποθέσεων. Ο Everitt βεβαίωσε ότι "το ποσοστό της απώλειας των 20

24 δεδοµένων σε µια µελέτη µπορεί να θεωρηθεί ως ένας δείκτης της ποιότητας των δεδοµένων και, εποµένως, της ποιότητας της µελέτης. Είναι σηµαντικό να µην παραπλανηθεί κανείς στη σκέψη ότι οι έρευνες που διεξάγονται µε λανθασµένο πειραµατικό σχεδιασµό µπορούν να παράγουν αξιόπιστα αποτελέσµατα µε την χρήση µίας περίπλοκης στατιστικής ανάλυσης." εύτερον, οι ερευνητές πρέπει να παρέχουν τις ικανοποιητικές και συνεπείς πληροφορίες στις ερευνητικές εκθέσεις έτσι ώστε οι αναγνώστες να µπορούν να αξιολογήσουν την ορθότητα των συµπερασµάτων. Συγκεκριµένα, οι ερευνητές πρέπει πάντα να εκθέτουν το πραγµατικό µέγεθος δείγµατος που χρησιµοποιήθηκε στην ανάλυση, την παρουσία ή την απουσία απολεσθέντων δεδοµένων, την αιτία ή τις αιτίες της απώλειας των δεδοµένων καθώς και την επεξεργασία που έγινε στα απολεσθέντα δεδοµένα. Εάν τα αποτελέσµατα αναφέρονται σε µορφή ποσοστών, είναι απαραίτητο να περιληφθεί επίσης το µέγεθος δείγµατος στο οποίο το κάθε ποσοστό είναι βασισµένο. Οι συνοπτικές στατιστικές όπως το µέγεθος δείγµατος, ο αριθµός των µη αποκρίσεων, το ποσοστό απάντησης και οι βαθµοί ελευθερίας (df) του t, του Χι-Τετράγωνο και του F- Στατιστικού πρέπει να παρουσιάζονται σαφώς και µε συνέπεια στο κείµενο ή τους συνοπτικούς πίνακες. Τρίτον, εάν τα χαµένα στοιχεία είναι παρόντα, οι ερευνητές πρέπει να καθορίσουν εάν η αιτία που υπάρχουν ελλείποντα δεδοµένα θα οδηγήσει στην παραγωγή µη αξιόπιστων συµπερασµάτων. Μια προσεκτική εξέταση των παραγόντων που προκαλούν αυτή την απώλεια των στοιχείων καθώς και το πρότυπο των ελλειπόντων δεδοµένων επιτρέπει στους ερευνητές να αποφασίσουν εάν και πώς είναι καλύτερο να εξεταστούν τα χαµένα αυτά δεδοµένα σε µια µελέτη. Συνοψίζοντας, θα θέλαµε να αναφέρουµε ότι ελπίζουµε πως αυτές οι συστάσεις θα κινήσουν τους ερευνητές καθώς και τους συντάκτες περιοδικών προς τη διατύπωση των νέων προτύπων στις ερευνητικές πρακτικές και των εκδοτικών πολιτικών σχετικά µε την επεξεργασία της απώλειας των δεδοµένων στην ποσοτική έρευνα. Αυτά τα νέα πρότυπα θα βελτιώσουν την ποιότητα των ερευνητικών αποτελεσµάτων σε κάθε επιστηµονικό κλάδο και σε συνδυασµό µε όλα τα νέα επιτεύγµατα της επιστήµης θα βοηθήσουν στην πρόοδό της. 21

25 22

26 ΒΙΒΛΙΟΓΡΑΦΙΑ 1. Cohen J. & Cohen P. (1983). Applied multiple regression correlation analysis for the behavioral sciences (2 nd ed.). Hillsdale, NJ: Lawrence Erlbaum Associates 2. Dempster A. P., Laird N. M. & Rubin D. B. (1997). Maximum Likelyhood estimators from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, Series B, 39, Everitt B. S. (1998). Analysis for longitudinal data. British Journal of Psychiatry, 172, Graham J. W. & Schafer J. L. (1999). On the performance of multiple imputation for multivariate data with small sample size. In Statistical Strategies for smallsample research, Graham J. W. & Schafer J. L. (2002). Missing Data: Our View of the State of the Art. American Psychological Association, 7 (2), Hartley H. O. & Hocking R. R. (1971). The analysis of incomplete data. Biometrics, 27, Howell D. C. Treatment of missing data Kim J. O. & Curry J. (1977). The treatment of missing data in multivariate analysis. Sociological Methods and Research, 6 (2), Little R. J. & Rubin D. B. (1987). Statistical analysis with missing data. New York: Wiley. 10. Rubin D. B. (1996). Multiple imputation after 18+ years. Journal of American Statistical Association, 91, Schafer J. L. (1997). Analysis of incomplete multivariate data. New York: Chapman & Hall. 23

2. Missing Data mechanisms

2. Missing Data mechanisms Κεφάλαιο 2 ο 2. Missing Data mechanisms 2.1 Εισαγωγή Στην προηγούµενη ενότητα περιγράψαµε κάποια από τα βασικά µοτίβα εµφάνισης των χαµένων τιµών σε σύνολα δεδοµένων. Ένα άλλο ζήτηµα που µας απασχολεί

Διαβάστε περισσότερα

Δημιουργία, διαχείριση και οργάνωση βάσεων χωρικών δεδομένων Η περίπτωση των δημοσίων υπαλλήλων της Ελλάδος

Δημιουργία, διαχείριση και οργάνωση βάσεων χωρικών δεδομένων Η περίπτωση των δημοσίων υπαλλήλων της Ελλάδος Πανεπιστήμιο Θεσσαλίας, Πολυτεχνική Σχολή Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης Δημιουργία, διαχείριση και οργάνωση βάσεων χωρικών δεδομένων Η περίπτωση των δημοσίων υπαλλήλων

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2 1 Π Ε Ρ Ι Ε Χ Ο Μ Ε Ν Α ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2 Β. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΕΥΝΑ 1. Γενικά Έννοιες.. 2 2. Πρακτικός Οδηγός Ανάλυσης εδοµένων.. 4 α. Οδηγός Λύσεων στο πλαίσιο

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Η μέθοδος των βοηθητικών μεταβλητών. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Η μέθοδος των βοηθητικών μεταβλητών. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 12: Σφάλματα μέτρησης στις μεταβλητές Η μέθοδος των βοηθητικών μεταβλητών Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ Α εξεταστική περίοδος χειµερινού εξαµήνου 4-5 ιάρκεια εξέτασης ώρες και 45 λεπτά Θέµατα Θέµα (α) Τα υποδείγµατα που χρησιµοποιούνται στην οικονοµική θεωρία ονοµάζονται ντετερµινιστικά ενώ τα οικονοµετρικά

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ Βασικές µορφές Ερωτήσεων - απαντήσεων Ανοιχτές Κλειστές Κλίµακας ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2 Ανοιχτές ερωτήσεις Ανοιχτές

Διαβάστε περισσότερα

Κεφάλαιο 7. Έλεγχος Υποθέσεων. Ένα παράδειγµα

Κεφάλαιο 7. Έλεγχος Υποθέσεων. Ένα παράδειγµα Κεφάλαιο 7 Έλεγχος Υποθέσεων 1 Ένα παράδειγµα Ένας ερευνητής θέλησε να διαπιστώσει κατά πόσο η από απόσταση εκπαίδευση είναι καλύτερη από τη δια ζώσης εκπαίδευση. Για το σκοπό αυτό, επέλεξε δύο οµάδες

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

Κεφάλαιο 13. Εισαγωγή στην. Η Ανάλυση ιακύµανσης

Κεφάλαιο 13. Εισαγωγή στην. Η Ανάλυση ιακύµανσης Κεφάλαιο 13 Εισαγωγή στην Ανάλυση ιακύµανσης 1 Η Ανάλυση ιακύµανσης Από τα πιο συχνά χρησιµοποιούµενα στατιστικά κριτήρια στην κοινωνική έρευνα Γιατί; 1. Ενώ αναφέρεται σε διαφορές µέσων όρων, όπως και

Διαβάστε περισσότερα

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Κεφάλαιο 14 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης 1 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Παραµετρικό στατιστικό κριτήριο για τη µελέτη της επίδρασης µιας ανεξάρτητης µεταβλητής στην εξαρτηµένη Λογική παρόµοια

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Τα υποδείγματα του απλού γραμμικού υποδείγματος της παλινδρόμησης (simple linear regression

Διαβάστε περισσότερα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων 1 Μονοπαραγοντική Ανάλυση Διακύμανσης Παραμετρικό στατιστικό κριτήριο για τη μελέτη της επίδρασης μιας ανεξάρτητης μεταβλητής στην εξαρτημένη Λογική

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100 Ποσοτικές Μέθοδοι Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR 50100 Απλή Παλινδρόμηση Η διερεύνηση του τρόπου συμπεριφοράς

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ Μετά από την εκτίµηση των παραµέτρων ενός προσοµοιώµατος, πρέπει να ελέγχουµε την αλήθεια της υποθέσεως που κάναµε. Είναι ορθή η υπόθεση που κάναµε? Βεβαίως συνήθως υπάρχουν

Διαβάστε περισσότερα

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή Σειρά Β Εξέταση Φεβρουαρίου (0/) στο Μάθηµα: Γεωργικός Πειραµατισµός Θεσσαλονίκη: 4/0/0 Επώνυµο Όνοµα Αρ. Μητρώου Κατεύθυνση Ζήτηµα ο ( µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Π E Ρ IEXOMENA Πρόλογος... xiii ΜΕΡΟΣ ΠΡΩΤΟ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΣΤΑΤΙΣΤΙΚΩΝ Ε ΟΜΕΝΩΝ 1.1 Εισαγωγή... 3 1.2 Ορισµός και αντικείµενο της στατιστικής... 3

Διαβάστε περισσότερα

Συλλογή,, αποθήκευση, ανανέωση και παρουσίαση στατιστικών δεδοµένων

Συλλογή,, αποθήκευση, ανανέωση και παρουσίαση στατιστικών δεδοµένων Συλλογή,, αποθήκευση, ανανέωση και παρουσίαση στατιστικών δεδοµένων 1. Αναζήτηση των κατάλληλων δεδοµένων. 2. Έλεγχος µεταβλητών και κωδικών για συµβατότητα. 3. Αποθήκευση σε ηλεκτρονική µορφή (αρχεία

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το ΜΑΘΗΜΑ 9ο ΣΥΝΟΛΟΚΛΗΡΩΣΗ (Έννοιες, Ορισµοί) Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το πρόβληµα της

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 1 Ο. 1.1 Εισαγωγή Γενικά για χαµένες τιµές (missing values) στα δεδοµένα

ΚΕΦΑΛΑΙΟ 1 Ο. 1.1 Εισαγωγή Γενικά για χαµένες τιµές (missing values) στα δεδοµένα ΚΕΦΑΛΑΙΟ 1 Ο 1.1 Εισαγωγή Με τον όρο «χαµένες τιµές» (missing values), εννοούµε τιµές που απουσιάζουν σύνολα δεδοµένων, όπως έρευνες, δηµοσκοπήσεις, έργα λογισµικού για διάφορους λόγους. Το πρόβληµα των

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική Ενότητα 3: Έλεγχοι υποθέσεων - Διαστήματα εμπιστοσύνης Δρ.Ευσταθία Παπαγεωργίου, Αναπληρώτρια Καθηγήτρια Οι ερευνητικές υποθέσεις Στην έρευνα ελέγχουμε

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ 3.1 Εισαγωγή ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ Στο κεφ. 2 είδαμε πώς θα μπορούσαμε να σχεδιάσουμε έναν βέλτιστο ταξινομητή εάν ξέραμε τις προγενέστερες(prior) πιθανότητες ( ) και τις κλάση-υπό όρους πυκνότητες

Διαβάστε περισσότερα

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ Φεβρουάριος 2015 1 Table of Contents ΔΙΟΙΚΗΤΙΚΗ ΠΕΡΙΛΗΨΗ... 3 1. ΕΙΣΑΓΩΓΗ... 4 2. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΜΟΝΤΕΛΩΝ... 4 2.1 ΔΕΔΟΜΕΝΑ... 4 2.1.1

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

Περίπου ίση µε την ελάχιστη τιµή του δείγµατος.

Περίπου ίση µε την ελάχιστη τιµή του δείγµατος. 1. Η µέση υπερετήσια τιµή δείγµατος µέσων ετήσιων παροχών Q (m3/s) που ακολουθούν κατανοµή Gauss, ξεπερνιέται κατά µέσο όρο κάθε: 1/0. = 2 έτη. 1/1 = 1 έτος. 0./1 = 0. έτος. 2. Έστω δείγµα 20 ετών µέσων

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 2: Έλεγχοι Υποθέσεων

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος Ανάλυση ποσοτικών δεδομένων ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος Εισαγωγή στη στατιστική Στατιστική: σύνολο αρχών και μεθοδολογιών που χρησιμοποιούνται για:

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2 HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Νίκος Καλογερόπουλος 2014 Τι είναι έρευνα στην στατιστική Αρχική παρατήρηση: κάτι που πρέπει να διευκρινιστεί Κάθε χρόνο υπόσχομαι στον εαυτό μου ότι

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 4: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (3 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Επαναληπτικές Ερωτήσεις για Οικονοµετρία 2

Επαναληπτικές Ερωτήσεις για Οικονοµετρία 2 Επαναληπτικές Ερωτήσεις για Οικονοµετρία 2 Κεφάλαιο 8 1) Τι είναι ετεροσκεδαστικότητα και τι είδους προβλήµατα παρουσιάζονται; ( 2, 4, σελίδες 370-372). 2) Γράψτε τον τύπο της διακύµανσης της κλίσης όταν

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018 ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ Αντώνης Κ. Τραυλός (B.A., M.A., Ph.D.) Καθηγητής ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ Σχολή Επιστημών Ανθρώπινης Κίνησης και Ποιότητας Ζωής Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού Στατιστική?????

Διαβάστε περισσότερα

Διπλωματική εργασία της Στυλιανής Κ. Παπαδάκη

Διπλωματική εργασία της Στυλιανής Κ. Παπαδάκη Πολυτεχνείο Κρήτης Τμήμα Μηχανικών Παραγωγής και Διοίκησης Διπλωματική εργασία της Στυλιανής Κ. Παπαδάκη Διατριβή που υπεβλήθη για τη μερική ικανοποίηση των απαιτήσεων για την απόκτηση Μεταπτυχιακού Διπλώματος

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή Ανάλυση Συνδιακύµανσης Alsis of Covrice Η ανάλυση συνδιακύµανσης είναι µία άλλη τεχνική για να βελτιώσουµε την ακρίβεια της προσέγγισης του µοντέλου µας στο πείραµα. Ας υποθέσουµε ότι σ ένα πείραµα εκτός

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 4 Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Ερωτήσεις Πολλαπλών Επιλογών στο Μάθημα «Μέθοδοι Έρευνας»

Ερωτήσεις Πολλαπλών Επιλογών στο Μάθημα «Μέθοδοι Έρευνας» Ερωτήσεις Πολλαπλών Επιλογών στο Μάθημα «Μέθοδοι Έρευνας» 1) Στη δειγματοληψία με πιθανότητα α) η πιθανότητα κάθε περίπτωσης να επιλεγεί στο δείγμα είναι άγνωστη β) η πιθανότητα κάθε περίπτωσης να επιλεγεί

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) 1. Έχοντας στη διάθεσή μας ένα δείγμα, προκύπτει ότι το 95% διάστημα εμπιστοσύνης για το μέσο μ ενός κανονικού

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 5: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (1 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: ageliki.papaa@gmail.com, agpapaa@auth.gr Webpage: http://users.auth.gr/agpapaa

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

ΜΕΡΟΣ Α Κάθε µια από τις παρακάτω φράσεις (1α, 1β, 1γ, 2α κτλ) µπορεί να είναι σωστή ή λανθασµένη. Ποιες είναι σωστές και ποιες όχι;

ΜΕΡΟΣ Α Κάθε µια από τις παρακάτω φράσεις (1α, 1β, 1γ, 2α κτλ) µπορεί να είναι σωστή ή λανθασµένη. Ποιες είναι σωστές και ποιες όχι; 2. ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΓΩΓΗ. ΣΚΟΠΟΣ στο τέλος της ενότητας είναι να γνωρίζετε - Τι είναι η «δειγµατοληπτική κατανοµή» π.χ. της µέσης τιµής - τι είναι και σε τι χρησιµεύει το «τυπικό σφάλµα της µέσης

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

4.ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ

4.ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ 4.ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΕΙΓΜΑΤΟΛΗΨΙΑ (STRATIFIED RANDOM SAMPLING) Στην τυχαία δειγµατοληψία κατά στρώµατα ο πληθυσµός των Ν µονάδων (πρόκειται για τον στατιστικό πληθυσµό και τις στατιστικές µονάδες)

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΠΡΟΒΛΕΨΕΙΣ ΜΕ ΥΠΟΔΕΙΓΜΑΤΑ ΧΡΟΝΟΣΕΙΡΩΝ

ΚΕΦΑΛΑΙΟ 6 ΠΡΟΒΛΕΨΕΙΣ ΜΕ ΥΠΟΔΕΙΓΜΑΤΑ ΧΡΟΝΟΣΕΙΡΩΝ ΚΕΦΑΛΑΙΟ 6 ΠΡΟΒΛΕΨΕΙΣ ΜΕ ΥΠΟΔΕΙΓΜΑΤΑ ΧΡΟΝΟΣΕΙΡΩΝ 6. Εισαγωγή 6. Μονομεταβλητές προβλέψεις Βέλτιστη πρόβλεψη και Θεώρημα βέλτιστης πρόβλεψης Διαστήματα εμπιστοσύνης 6.3 Εφαρμογές A. MILIONIS KEF. 6 08 BEA

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες ΜΑΘΗΜΑ 3ο Βασικές έννοιες Εισαγωγή Βασικές έννοιες Ένας από τους βασικότερους σκοπούς της ανάλυσης των χρονικών σειρών είναι η διενέργεια των προβλέψεων. Στα υποδείγματα αυτά η τρέχουσα τιμή μιας οικονομικής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο Πολλαπλή παλινδρόµηση Μάθηµα 3 ο Πολλαπλή παλινδρόµηση (Multivariate regression ) Η συµπεριφορά των περισσότερων οικονοµικών µεταβλητών είναι συνάρτηση όχι µιας αλλά πολλών µεταβλητών Y = f ( X, X 2, X

Διαβάστε περισσότερα

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation Σταμάτης Πουλακιδάκος Μερικά εισαγωγικά λόγια Οι έλεγχοι των ερευνητικών υποθέσεων πραγματοποιούνται με διάφορους στατιστικούς ελέγχους,

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2) Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2) Εαρινό εξάμηνο 2018-2019 Τμήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική Παπάνα Μεταδιδακτορική Ερευνήτρια Πολυτεχνική σχολή, Α.Π.Θ. & Οικονομικό Τμήμα,

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Πως μπορούμε να συγκρίνουμε μεταβλητές μεταξύ τους? Διαφορά συγκρίνοντας το μέσο μιας μεταβλητής (λόγος ή διάστημα) στις ομάδες πχ. t-test

Διαβάστε περισσότερα

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται δύο κριτήρια απόρριψης απομακρυσμένων από τη μέση τιμή πειραματικών μετρήσεων ενός φυσικού μεγέθους και συγκεκριμένα

Διαβάστε περισσότερα