Η ΜΠΕΫΖΙΑΝΗ ΠΡΟΣΕΓΓΙΣΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΚΑΙ Η ΣΥΓΚΡΙΣΗ ΤΗΣ ΜΕ ΤΗΝ ΚΛΑΣΣΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Η ΜΠΕΫΖΙΑΝΗ ΠΡΟΣΕΓΓΙΣΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΚΑΙ Η ΣΥΓΚΡΙΣΗ ΤΗΣ ΜΕ ΤΗΝ ΚΛΑΣΣΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ"

Transcript

1 ΚΕΦΑΛΑΙΟ 24 Η ΜΠΕΫΖΙΑΝΗ ΠΡΟΣΕΓΓΙΣΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΚΑΙ Η ΣΥΓΚΡΙΣΗ ΤΗΣ ΜΕ ΤΗΝ ΚΛΑΣΣΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΤΟ ΘΕΩΡΗΜΑ ΤΟΥ BAYES ΩΣ ΒΑΣΗ ΓΙΑ ΤΗΝ ΜΠΕΫΖΙΑΝΗ ΣΤΑΤΙΣΤΙΚΗ Στο βιβλίο αυτό, αναπτύχθηκε η κλασσική στατιστική συμπερασματολογία, όπως την θεμελίωσε ο R. A. Fisher. Η συμπερασματολογία αυτή στηρίζεται στον κλασσικό ορισμό της πιθανότητας ως σχετικής συχνότητας. Όπως είδαμε στο πρώτο μέρος, υπάρχουν διάφορες θεωρίες πιθανοτήτων. Η κάθε μια από αυτές εξηγεί και περιγράφει με διαφορετικό τρόπο την τυχαιότητα. Οι βασικές θεωρίες είναι: (1) αυτή η οποία αναφέρεται σε ισοπίθανα ενδεχόμενα (Laplace), (2) εκείνη η οποία υπολογίζει παρατηρηθείσες σχετικές συχνότητες (Von Misses) και (3) αυτή που στηρίζεται στην υποκειμενική αξιολόγηση καταστάσεων με ταυτόχρονη χρήση προσωπικής γνώμης (Μπεϋζιανή). Το βασικό μειονέκτημα της προσέγγισης Laplace είναι ότι αναφέρεται μόνο σε ισοπίθανα ενδεχόμενα. Η προσέγγιση που στηρίζεται στην επί μακρόν παρατηρούμενη συχνότητα επιτρέπει την χρήση των πιθανοτήτων και για ενδεχόμενα που δεν είναι ισοπίθανα. Είναι όμως φανερό ότι η εφαρμογή της περιορίζεται σε περιπτώσεις όπου υπάρχουν δεδομένα διαθέσιμα μετά από επανάληψη καταστάσεων. Πολλά όμως από τα φαινόμενα αβεβαιότητας που μας απασχολούν δεν είναι δυνατόν να αντιμετωπισθούν με την προσέγγιση αυτή. Δεν έχουμε, δηλαδή, δεδομένα για συχνότητα εμφάνισης καταστάσεων που δεν έχουν συμβεί στο παρελθόν. Για παράδειγμα, δεν μπορούμε να μιλάμε για την σχετική συχνότητα σε περιπτώσεις που θέλουμε να προβλέψουμε το αποτέλεσμα των 488

2 επόμενων εκλογών. Το ίδιο συμβαίνει όταν αναφερόμαστε στην επιλογή αγοράς ή πώλησης μετοχών. Δεν έχει, δηλαδή, έννοια να προσπαθήσουμε να προβλέψουμε το αποτέλεσμα των επόμενων εκλογών χρησιμοποιώντας τις σχετικές συχνότητες από την απόδοση των κομμάτων που θα πάρουν μέρος στις επόμενες εκλογές σε σχέση με προηγούμενες εκλογικές αναμετρήσεις. Με την ίδια λογική, ένας επιστήμονας που ασχολείται με την πρόβλεψη του καιρού θα χρειασθεί περισσότερες πληροφορίες από καθαρά ιστορικά δεδομένα για να προβλέψει τον αυριανό καιρό. Ένας γιατρός επίσης δεν είναι δυνατόν να βασίσει την διάγνωσή του για έναν συγκεκριμένο ασθενή μόνο με ένα μέσο σχετικής συχνότητας. Η Μπεϋζιανή Προσέγγιση των Πιθανοτήτων Τον 18ο αιώνα, ο ιερέας Thomas Bayes προβληματίσθηκε με το πρόβλημα που απασχολεί τον άνθρωπο από την δημιουργία του. Την πιθανότητα της ύπαρξης Θεού. Οι θεωρίες που βασίζονται σε ισοπίθανα ενδεχόμενα ή στην έννοια της σχετικής συχνότητας δεν είναι χρήσιμες στην περίπτωση αυτή. Παρ όλα αυτά, μιλάμε για μια αβεβαιότητα που απασχόλησε πολλούς ανθρώπους, περιλαμβανομένου και του Bayes. Η πιθανότητα αυτή φαίνεται να είναι, εκ των πραγμάτων, υποκειμενική. Το καλύτερο που μπορεί να κάνει κάποιος στην περίπτωση αυτή, είναι να συγκεράσει τις διαθέσιμες ενδείξεις και τα λογικά επιχειρήματα και να καταλήξει σε μια προσωπική πιθανότητα ύπαρξης του Θεού. Η ιδέα της προσωπικής πιθανότητας έχει από τότε επεκταθεί, διαμορφωθεί και βελτιωθεί από πολλούς Στατιστικούς που χρησιμοποιούν την Μπεϋζιανή προσέγγιση ως βάση για την ανάπτυξη των απόψεών τους. Παράδειγμα Καθορισμού Προσωπικής Πιθανότητας Όσοι υποστηρίζουν την Μπεϋζιανή προσέγγιση ισχυρίζονται ότι η προσωπική πιθανότητα για ένα ενδεχόμενο καθορίζεται από την διάθεση κάθε ατόμου να στοιχηματίσει για το ενδεχόμενο αυτό. Ας πάρουμε, για παράδειγμα, την περίπτωση ενός φιλάθλου, τον οποίο ρωτάμε να μας εκφράσει την πιθανότητά του να νικήσει ο Παναθηναϊκός στον επόμενο αγώνα με τον Ολυμπιακό. Στην 489

3 συγκεκριμένη περίπτωση, ένας Μπεϋζιανός Στατιστικός θα έθετε στον φίλαθλο το ερώτημα ποιό από τα παρακάτω στοιχήματα θα προτιμούσε. Να πάρει 1000 δρχ. σε περίπτωση νίκης του Παναθηναϊκού ή Να πάρει 1000 δρχ. αν από μια τράπουλα με δέκα χαρτιά, 5 από τα οποία είναι κόκκινα και 5 είναι μαύρα, διαλέξει μια κάρτα και η κάρτα αυτή είναι κόκκινη. Στην πρώτη αυτή ερώτηση, αν ο φίλαθλος προτιμούσε το στοίχημα που αναφέρεται σε νίκη του Παναθηναϊκού, θα έδειχνε ότι πίστευε πως η πιθανότητα νίκης του Παναθηναϊκού ήταν μεγαλύτερη από 0.5. Προκειμένου να προσδιορισθεί περισσότερο η πιθανότητα που δίνει αυτός ο φίλαθλος σε νίκη του Παναθηναϊκού, ο Μπεϋζιανός Στατιστικός θα του προσέφερε μια περαιτέρω επιλογή. Θα προτιμούσε 1000 δρχ. σε περίπτωση νίκης του Παναθηναϊκού ή 1000 δρχ. εάν επιλεγόταν μια κόκκινη κάρτα από μια τράπουλα με 10 κάρτες που περιείχε 9 κόκκινες και μια μαύρη; Αν ο φίλαθλος στην περίπτωση αυτή διάλεγε το στοίχημα με την κάρτα, θα αποτελούσε ένδειξη ότι πίστευε πως η πιθανότητα νίκης του Παναθηναϊκού είναι μικρότερη από 0.9. Στην συνέχεια, ο Μπεϋζιανός Στατιστικός θα του προσέφερε μια νέα επιλογή δρχ. σε περίπτωση νίκης του Παναθηναϊκού ή 1000 δρχ. αν επιλεγόταν μια κόκκινη κάρτα από μια τράπουλα με 10 κάρτες που περιείχε 8 κόκκινες και 2 μαύρες κάρτες. Αν ο φίλαθλος ποντάριζε σε νίκη του Παναθηναϊκού, αυτό θα αποτελούσε ένδειξη ότι η πιθανότητα που έδινε σε νίκη του Παναθηναϊκού ήταν μεταξύ 0.8 και 0.9. Με μια ακόμα προσπάθεια, η πιθανότητα που δίνει ο φίλαθλος αυτός για νίκη του Παναθηναϊκού καθορίσθηκε ίση με 0.85, όταν στην ερώτηση τί θα προτιμούσε 1000 δρχ. σε περίπτωση νίκης του Παναθηναϊκού ή 1000 δρχ. εάν επιλεγόταν μία κόκκινη κάρτα από μια τράπουλα με 100 κάρτες που περιείχε 85 κόκκινες και 15 μαύρες, απάντησε ότι, στην περίπτωση αυτή, η επιλογή ήταν γι αυτόν αδιάφορη και θα μπορούσε να επιλέξει οτιδήποτε από τα δύο. 490

4 Είναι προφανές ότι ο φίλαθλος αυτός υποσυνείδητα πήρε υπόψη του μια σειρά από πράγματα όταν, έμμεσα, καθόρισε την πιθανότητα αυτή. Έλαβε υπόψη του την απόδοση των ομάδων στα προηγούμενα παιχνίδια, την δυναμικότητα των παικτών, την ικανότητα των προπονητών και μια σειρά από άλλα στοιχεία τα οποία επηρεάζουν το αποτέλεσμα ενός ποδοσφαιρικού αγώνα σε μια συγκεκριμένη χρονική στιγμή. Είναι, όμως, εξίσου προφανές ότι τα στοιχεία αυτά επηρέασαν την άποψή του με υποκειμενικό τρόπο οδηγώντας τον στον καθορισμό της πιθανότητας νίκης του Παναθηναϊκού σε Κάποιος άλλος φίλαθλος αποτιμώντας τα ίδια στοιχεία διαφορετικά, θα μπορούσε να είχε οδηγηθεί σε μια άλλη πιθανότητα νίκης του Παναθηναϊκού στον αγώνα αυτό. Ορισμός: Σύμφωνα με την Μπεϋζιανή προσέγγιση, ένα ενδεχόμενο m έχει υποκειμενική πιθανότητα να συμβεί αν το άτομο που την n προσδιορίζει είναι αδιάφορο στην επιλογή να στοιχηματίσει σ αυτό το ενδεχόμενο ή να στοιχηματίσει με τους ίδιους όρους σε ένα παιχνίδι για την επιλογή μιας κόκκινης κάρτας από μια τράπουλα με κάρτες στην οποία το ποσοστό των κόκκινων καρτών είναι n m. 491

5 ΣΥΓΚΡΙΣΗ ΤΗΣ ΚΛΑΣΣΙΚΗΣ ΜΕ ΤΗΝ ΜΠΕΫΖΙΑΝΗ ΣΤΑΤΙΣΤΙΚΗ Όσοι έχουν κάνει μαθήματα τόσο κλασσικής Στατιστικής, που βασίζεται στις έννοιες που διατύπωσε ο Fisher, όσο και μάθημα σε Μπεϋζιανή Στατιστική, αναρωτιούνται πολλές φορές ποια ακριβώς είναι τα σημεία της διαφοράς των δύο αυτών θεωριών. Ενδιαφέρει κυρίως να επισημανθούν οι διαφορές στις βασικές στατιστικές έννοιες που συναντά κανείς στα πρώτα μαθήματα της Στατιστικής, όπως π.χ. στην σημειακή εκτίμηση, στα διαστήματα εμπιστοσύνης από ένα κανονικό πληθυσμό και στους ελέγχους υποθέσεων. Εισαγωγή Σε αντίθεση με την κλασσική Στατιστική (την Στατιστική που στηρίζεται στην έννοια της σχετικής συχνότητας), η οποία αποτελεί την βάση της στατιστικής θεωρίας από την εποχή που ο Fisher παρουσίασε τις πρώτες στατιστικές έννοιες, η Μπεϋζιανή Στατιστική προσέγγιση στην συμπερασματολογία έγινε πρόσφατα ιδιαίτερα δημοφιλής. Αυτό φαίνεται και από τις πολλές επιστημονικές εργασίες που χρησιμοποιούν την Μπεϋζιανή προσέγγιση που δημοσιεύονται τελευταία στα επιστημονικά περιοδικά. Ένας από τους λόγους στους οποίους οφείλεται η δραστηριότητα αυτή είναι, κυρίως, οι εξελίξεις στις υπολογιστικές μεθόδους που έχουν επιτρέψει σε αρκετούς επιστήμονες να χρησιμοποιήσουν Μπεϋζιανές μεθόδους στην ανάλυση δεδομένων. Τα βιβλία των Gelman et al. (1995) και Carlin και Louis (1996) δίνουν πολλά παραδείγματα εφαρμογών των Μπεϋζιανών μεθόδων και περιγράφουν τα θέματα που σχετίζονται με τα υπολογιστικά προβλήματα με λεπτομέρειες. Παρά την αυξανόμενη χρήση των Μπεϋζιανών μεθόδων, υπάρχει ένας μεγάλος αριθμός επιστημόνων που περιλαμβάνει φοιτητές, προπτυχιακούς και μεταπτυχιακούς, και ερευνητές έξω από την περιοχή της Στατιστικής που δεν γνωρίζουν ακριβώς τις διαφορές στις βασικές μεθόδους που χρησιμοποιούνται στην κλασσική Στατιστική και στην Μπεϋζιανή συμπερασματολογία. Στην συνέχεια, γίνεται μία προσπάθεια να επισημανθούν οι διαφορές αυτές στις 492

6 βασικές στατιστικές έννοιες με χρήση απλών παραδειγμάτων. Η προσέγγιση αυτή παρουσιάζει κάποιους κινδύνους γιατί, όπως θα δούμε, για απλά μοντέλα μιας παραμέτρου, η Μπεϋζιανή προσέγγιση δεν διαφέρει πολύ από την προσέγγιση που στηρίζεται στην έννοια της σχετικής συχνότητας και είναι ενδεχόμενο να κάνει κάποιον να αναρωτηθεί γιατί υπάρχει η παρατηρούμενη αντιπαράθεση. Η χρήση όμως κάποιου περισσότερο πολύπλοκου παραδείγματος είναι ενδεχόμενο να κάνει τον αναγνώστη να εμπλακεί με λεπτομέρειες οι οποίες δεν είναι άμεσα σχετικές με τις ιδέες των δύο προσεγγίσεων. Η Κλασσική Συμπερασματολογία Ας θεωρήσουμε ένα από τα απλούστερα στατιστικά προβλήματα. Ας υποθέσουμε ότι Y 1,, Y n είναι n ανεξάρτητες τυχαίες μεταβλητές καθεμιά από τις οποίες ακολουθεί την κανονική κατανομή με μέση τιμή μ και διακύμανση σ 2. Για να γίνει το παράδειγμα περισσότερο κατανοητό, ας θεωρήσουμε τα Y i να είναι επαναλαμβανόμενες μετρήσεις του βάρους ενός συγκεκριμένου αντικειμένου σε μια δεδομένη κλίμακα. Η κλίμακα θεωρείται ακριβής και, επομένως, η μέση τιμή μ είναι το πραγματικό άγνωστο μέσο βάρος του αντικειμένου. Υπάρχουν, όμως, τυχαία λάθη μετρήσεων που οφείλονται σε παράγοντες όπως οι κραδασμοί. Τα λάθη στις μετρήσεις οδηγούν στο ότι υπάρχει διακύμανση (οι μετρήσεις δεν θα είναι όλες ίδιες) και το σ 2 είναι ένα μέτρο των διακυμάνσεων αυτών. Θα ισχυρισθεί, ενδεχομένως, κάποιος ότι εδώ υπάρχει κάποιο μικρό πρόβλημα, δεδομένου ότι η κανονική κατανομή αντιστοιχεί μάζες πιθανοτήτων σε ολόκληρη την ευθεία των πραγματικών αριθμών, περιλαμβανομένων και αρνητικών τιμών, ενώ τα βάρη πρέπει να είναι πάντοτε θετικά. Ας αγνοήσουμε όμως το πρόβλημα αυτό, υποθέτοντας ότι τα αντικείμενα των οποίων μετράμε το βάρος είναι σχετικά βαριά σε σύγκριση με το σ. Για να κάνουμε τα πράγματα ακόμα απλούστερα, υποθέτουμε ότι το σ 2 είναι γνωστό. Παρότι η υπόθεση αυτή είναι συνήθως εξωπραγματική, μπορούμε να θεωρήσουμε ότι υπάρχει μια μεγάλη εμπειρία με την συγκεκριμένη 493

7 κλίμακα και να δεχθούμε να μεταχειρισθούμε την διακύμανση των λαθών των μετρήσεων ως γνωστή. Στόχος της μεθοδολογίας είναι η συμπερασματολογία για την δεδομένη αλλά άγνωστη παράμετρο μ βασισμένη πάνω σε ένα δείγμα παρατηρηθεισών τιμών y 1,, y n. (Χρησιμοποιούμε εδώ τον κλασσικό συμβολισμό με τον οποίο τα κεφαλαία γράμματα δηλώνουν τυχαίες μεταβλητές και τα μικρά δηλώνουν παρατηρηθείσες τιμές). Ο όρος συμπερασματολογία βασισμένη στην σχετική συχνότητα χρησιμοποιείται πολλές φορές για την κλασσική στατιστική προσέγγιση. Προέρχεται από το βασικό επιχείρημα της μεθόδου αυτής που χρησιμοποιεί το όριο της συχνότητας εμφάνισης ενδεχομένων για τον ορισμό των πιθανοτήτων. Γι αυτό τον λόγο, όσοι διαφωνούν με την προσέγγιση αυτή ισχυρίζονται ότι ο όρος συμπερασματολογία βασισμένη στην σχετική συχνότητα δεν είναι ακριβώς ορισμένος. Αυτό το οποίο έχουμε κατ αυτούς είναι μια συλλογή τεχνικών ή διαδικασιών που εμφανίζουν καλές ιδιότητες στην περίπτωση της επαναλαμβανόμενης δειγματοληψίας, η οποία χαρακτηρίζει τον ορισμό των πιθανοτήτων με βάση την σχετική συχνότητα. Αυτές ακριβώς τις διαδικασίες στο πλαίσιο της σημειακής εκτίμησης, των διαστημάτων εμπιστοσύνης και των ελέγχων υποθέσεων, είναι που εξετάζουμε. Δεν επιχειρείται δηλαδή μια εξαντλητική περιγραφή, αλλά παρουσιάζεται μόνο το είδος των συμπερασμάτων που μπορεί κανείς να εξαγάγει χρησιμοποιώντας την κλασσική προσέγγιση και υποδεικνύουμε κάποια ειδικά χαρακτηριστικά της. Σημειακή Εκτίμηση Ο δειγματικός μέσος, = ( 1 n) Y είναι μια φυσική εκτιμήτρια για την μέση τιμή μ του πληθυσμού. Πώς μπορεί κανείς να αποφασίσει εάν είναι πράγματι μία καλή εκτιμήτρια; Η κλασσική προσέγγιση μετρά την εκτιμήτρια (ή οποιαδήποτε άλλη διαδικασία συμπερασματολογίας) βασιζόμενη σε ιδιότητες οι οποίες ισχύουν κάτω από επαναλαμβανόμενη δειγματοληψία με το ίδιο μοντέλο με σταθερές τιμές των αγνώστων παραμέτρων. Έτσι, για παράδειγμα, το i Y i 494

8 Y θεωρείται μια αμερόληπτη εκτιμήτρια γιατί η μέση τιμή του Y, σε επαναλαμβανόμενες δειγματοληψίες από ένα πληθυσμό με μέση τιμή μ, είναι ίση με το μ (δηλαδή, μπορούμε να γράψουμε ότι Ε( Y μ)=μ, όπου η δέσμευση στο μ περιλαμβάνεται προκειμένου να δοθεί έμφαση στο ότι το μ διατηρείται σταθερό στην επαναλαμβανόμενη δειγματοληψία). Η αμεροληψία είναι μια από τις ιδιότητες που ενισχύουν την άποψη υπέρ της χρήσης του δειγματικού μέσου ως μιας εκτιμήτριας για την άγνωστη μέση τιμή μ. Μπορεί κανείς να διερευνήσει άλλες ιδιότητες, όπως π.χ. ότι το Y έχει ελάχιστη διακύμανση μεταξύ των αμερολήπτων εκτιμητριών. Συχνά, επίσης, αξιολογούνται οι ασυμπτωτικές ιδιότητες για μεγάλα δείγματα των εκτιμητριών. (Παραδείγματα αποτελούν ιδιότητες όπως η συνέπεια και η αποτελεσματικότητα). Εκτίμηση με Διαστήματα Εμπιστοσύνης Η δειγματική κατανομή του Y είναι Ν(μ, σ 2 /n). Η κατανομή αυτή είναι εκείνη που θα παρατηρούσαμε σε επαναλαμβανόμενη δειγματοληψία με δείγματα μεγέθους n από ένα κανονικό πληθυσμό μέσης τιμής μ και διακύμανσης σ 2. Από την δειγματική αυτή κατανομή, όπως είναι γνωστό, κατασκευάζεται το διάστημα εμπιστοσύνης ( Y σ n, Y σ n ) το οποίο περιέχει την πραγματική μέση τιμή του πληθυσμού στις 95% των περιπτώσεων επαναλαμβανόμενης δειγματοληψίας. Το διάστημα αυτό ονομάζεται συνήθως το 95% διάστημα εμπιστοσύνης για την μέση τιμή μ του πληθυσμού. Αυτό που πρέπει να τονίζεται είναι ότι το επίπεδο εμπιστοσύνης ισχύει για την απόδοση της διαδικασίας αυτής σε επαναλαμβανόμενα δείγματα. 495

9 Δ 13 Ε 12 Ι 11 Γ 10 Μ 9 Α Η ερμηνεία του διαστήματος εμπιστοσύνης σύμφωνα με την κλασσική θεωρία. Στο σχήμα εμφανίζονται 20 διαστήματα εμπιστοσύνης με επίπεδο εμπιστοσύνης 95% που έχουν προκύψει από 20 δείγματα μεγέθους 10 από μια κανονική κατανομή με μέση τιμή 100 και τυπική απόκλιση 2. Η γραμμή στο μέσο κάθε διαστήματος υποδεικνύει τον δειγματικό μέσο κάθε δείγματος. Η διακεκομμένη κατακόρυφη γραμμή δείχνει την πραγματική μέση τιμή του πληθυσμού. 19 από τα 20 αυτά διαστήματα περιέχουν την πραγματική μέση τιμή του πληθυσμού. Σύμφωνα με την προσέγγιση αυτή, δεν είναι σωστό να πούμε ότι η πραγματική μέση τιμή μ έχει πιθανότητα 95% να περιλαμβάνεται στο διάστημα που προήλθε από ένα δεδομένο δείγμα παρατηρήσεων. (Δεν μπορούμε, δηλαδή, να κάνουμε ένα τέτοιο ισχυρισμό από την στιγμή που ο δειγματικός μέσος Y έχει αντικατασταθεί από τον παρατηρηθέντα μέσο y ). Η διαδικασία αυτή για την δημιουργία διαστημάτων είναι τέτοια ώστε τα διαστήματα να 496

10 περιλαμβάνουν την πραγματική τιμή του μ στις 95% των περιπτώσεων, κατά μέσο όρο. Παρ όλα αυτά, για ένα δεδομένο σύνολο τιμών, το διάστημα που κατασκευάζεται με αυτόν τον τρόπο είτε θα περιλαμβάνει την πραγματική μέση τιμή είτε όχι, χωρίς να υπάρχει τυχαιότητα. Το σχήμα 1 δίνει ένα παράδειγμα με σταθερό μ και διαφορετικά διαστήματα που παράγονται για καθένα από 20 δείγματα (19 από τα 20 περιέχουν την πραγματική μέση τιμή). Θα πρέπει ίσως να παραδεχθεί κανείς ότι η ερμηνεία αυτή δεν είναι πολύ εύκολη για ένα φοιτητή που αρχίζει να παρακολουθεί Στατιστική. Έλεγχοι Υποθέσεων Η συνήθης προσέγγιση στους ελέγχους υποθέσεων στην κλασσική θεώρηση ξεκινά με μια μηδενική υπόθεση και μια εναλλακτική υπόθεση. Στην συνέχεια, με την χρήση μιας κατάλληλης στατιστικής συνάρτησης ελέγχου Τ(Υ 1,, Υ n ), διαμορφώνουμε μια διαδικασία που μας επιτρέπει να καθορίσουμε την καταλληλότητα της μηδενικής υπόθεσης. Η καταλληλότητα αυτή μετριέται με την p-τιμή, η οποία αναφέρεται στην πιθανότητα ότι, σε επαναλαμβανόμενη δειγματοληψία, θα οδηγηθούμε σε μια τιμή της στατιστικής συνάρτησης ελέγχου τόσο ακραία, ή περισσότερο ακραία, από την παρατηρηθείσα τιμή της υποθέτοντας ότι ισχύει η μηδενική υπόθεση. Μικρές τιμές για την p-τιμή αποτελούν ένδειξη ότι τα δεδομένα τα οποία χρησιμοποιήσαμε δεν είναι συνήθη κάτω από την μηδενική υπόθεση (δεν έχουν μεγάλη πιθανότητα να παρατηρηθούν τέτοια δεδομένα αν η μηδενική υπόθεση ισχύει), το οποίο αποτελεί ένδειξη ότι η μηδενική υπόθεση ίσως δεν είναι σωστή (είτε ότι το δείγμα που πήραμε ήταν ένα ατυχές δείγμα). Για παράδειγμα, ας υποθέσουμε ότι ενδιαφερόμαστε να ελέγξουμε αν το βάρος μιας συσκευασίας είναι 100gr, όπως ισχυρίζεται ο παρασκευαστής, ή αν είναι ελαφρότερο. Στην περίπτωση αυτή, θα θέλουμε να ελέγξουμε την μηδενική υπόθεση Η 0 : μ=100 (ή Η 0 :μ 100) έναντι της εναλλακτικής υπόθεσης Η 1 : μ<100 στο κανονικό μοντέλο (υποθέτοντας ότι ισχύει η κανονικότητα). Για τον έλεγχο αυτό, μπορούμε να χρησιμοποιήσουμε το Y ως την στατιστική συνάρτηση 497

11 ελέγχου, οπότε η p-τιμή που θα παρατηρηθεί από ένα δείγμα με μέσο y θα είναι p=φ( σ n ( y -100)). Θα πρέπει στο σημείο αυτό να τονισθούν ορισμένα σημεία της διαδικασίας αυτής. Κατ αρχήν, ο έλεγχος αυτός δεν μεταχειρίζεται την μηδενική υπόθεση και την εναλλακτική υπόθεση συμμετρικά. Ισοδύναμα, η p-τιμή υπολογίζεται κάτω από την υπόθεση ότι ισχύει η μηδενική υπόθεση και, επομένως, αναφέρεται στην καταλληλότητα μόνο της μηδενικής υπόθεσης. Η εναλλακτική υπόθεση χρησιμοποιείται υποβοηθητικά για να μας βοηθήσει να αποφασίσουμε ποιά στατιστική συνάρτηση ελέγχου να χρησιμοποιήσουμε και ποιες από τις τιμές της στατιστικής συνάρτησης ελέγχου θα πρέπει να θεωρούνται ως ενδείξεις εναντίον της μηδενικής υπόθεσης. Δεύτερον, η p-τιμή είναι μια πιθανότητα που αναφέρεται σε επαναλαμβανόμενη δειγματοληψία από τον πληθυσμό με την υπόθεση ότι ισχύει η μηδενική υπόθεση. Η p-τιμή δεν μετρά την πιθανότητα ότι η μηδενική υπόθεση είναι σωστή, όπως πολλές φορές διδάσκεται σε εισαγωγικά μαθήματα στατιστικής. Ένα τρίτο σημείο που θα πρέπει να παρατηρηθεί είναι ότι, προκειμένου να καταλήξουμε σε ένα λογικό συμπέρασμα, περιλάβαμε στον ορισμό μας την έννοια των περισσότερο ακραίων τιμών της στατιστικής συνάρτησης όσο αφορά την p-τιμή, παρότι οι τιμές αυτές δεν παρατηρήθηκαν. Τέλος, θα πρέπει να τονισθεί ότι οι περισσότεροι Στατιστικοί, είτε αυτοί δέχονται την κλασσική προσέγγιση είτε την Μπεϋζιανή, έχουν πια αντιληφθεί ότι το να στηρίζεται κανείς υπερβολικά στους ελέγχους υποθέσεων, ιδιαίτερα στο δυαδικό δίλημμα αποδέχομαι/απορρίπτω δεν είναι χρήσιμο στην επιστήμη. Τα διαστήματα εμπιστοσύνης είναι περισσότερο εποικοδομητικές δηλώσεις για δυνατές τιμές της άγνωστης παραμέτρου μ. Οι έλεγχοι υποθέσεων αποτελούν αρνητικές προτάσεις δηλώσεις που αποκλείουν συγκεκριμένες υποτεθείσες τιμές. 498

12 Μπεϋζιανή Συμπερασματολογία Τα κύρια χαρακτηριστικά της Μπεϋζιανής προσέγγισης στην στατιστική συμπερασματολογία είναι: 1. Όλες οι άγνωστες ποσότητες αντιμετωπίζονται ως τυχαίες μεταβλητές, ενώ χρησιμοποιούνται κατανομές πιθανότητας για να περιγράψουν την κατάσταση της γνώσης μας (ή την γνώση μας) για τις άγνωστες αυτές ποσότητες. 2. Η συμπερασματολογία για τις άγνωστες ποσότητες γίνεται με βάση τον κανόνα του Bayes, που επιτρέπει την χρήση πιθανοτήτων δεσμευμένων επί των τιμών που παρατηρήθηκαν. Ποιοτικά, η Μπεϋζιανή προσέγγιση ξεκινά με μια κατανομή πιθανότητας η οποία περιγράφει το επίπεδο της γνώσης μας (την κατάσταση της γνώσης μας) αναφορικά με τις άγνωστες ποσότητες (συνήθως παραμέτρους) πριν συλλεγούν δεδομένα και στην συνέχεια χρησιμοποιεί τα παρατηρηθέντα δεδομένα για να επανακαθορίσει (επανεξετάσει) την κατανομή αυτή. Ας ξεκινήσουμε την παρουσίαση της Μπεϋζιανής προσέγγισης με την ορολογία που χρησιμοποιείται σε σχέση με κάποιο παράδειγμα. Όπως στην περίπτωση της κλασσικής συμπερασματολογίας, έστω ότι Υ 1, Υ 2,, Υ n είναι n ανεξάρτητες τυχαίες μεταβλητές καθεμιά από τις οποίες ακολουθεί την κανονική κατανομή με άγνωστη μέση τιμή μ και γνωστή διακύμανση σ 2. Σύμφωνα με την Μπεϋζιανή προσέγγιση, η άγνωστη μέση τιμή μ είναι επίσης μια τυχαία μεταβλητή. Για τον λόγο αυτό, είναι ακριβέστερο να χρησιμοποιήσει κανείς την ορολογία ότι Υ 1,, Υ n, δοθείσης της άγνωστης τιμής του μ, είναι n ανεξάρτητες τυχαίες μεταβλητές, καθεμιά από τις οποίες ακολουθεί την κανονική κατανομή με μέση τιμή μ και γνωστή διακύμανση σ 2. Συχνά, αυτό αναφέρεται ως κατανομή των δεδομένων ή, ακριβέστερα, ως η δεσμευμένη κατανομή των δεδομένων δοθεισών των παραμέτρων του μοντέλου. Στην γενική περίπτωση, γράφουμε p(υ 1,, Υ n n). Η κατανομή αυτή είναι γνωστή ως η συνάρτηση πιθανοφάνειας όταν την θεωρήσει κανείς ως συνάρτηση του μ για ένα συγκεκριμένο σύνολο δεδομένων. Είναι ακριβώς η ίδια κατανομή που χρησιμοποιήθηκε στην 499

13 προηγούμενη ενότητα. Για να συμπληρώσουμε την πιθανοθεωρητική περιγραφή όλων των τυχαίων μεταβλητών, θα πρέπει να καθορίσουμε την άγνωστη παράμετρο μ. Η περιθώριος κατανομή του μ την οποία συνήθως συμβολίζουμε με p(μ) ονομάζεται η εκ των προτέρων κατανομή (prior distribution) του μ. Η κατανομή αυτή περιγράφει την κατάσταση της γνώσης μας για το μ πριν να παρατηρήσουμε οποιαδήποτε δεδομένα. Χρησιμοποιούμε τον συμβολισμό p( ) για να παραστήσουμε όλες τις κατανομές που χρησιμοποιούμε, ακόμη και αν έχουν τελείως διαφορετικές συναρτησιακές μορφές. Οι αναγνώστες χωρίς ιδιαίτερες γνώσεις Στατιστικής θεωρίας μπορούν να σκεφθούν την εκ των προτέρων κατανομή p(μ) ως την κατανομή που καθορίζει τις τιμές του μ τις οποίες πιστεύουμε ότι είναι οι περισσότερο πιθανές πριν να παρατηρήσουμε τα δεδομένα. Συμπερασματολογία για την άγνωστη παράμετρο μ δοθεισών των παρατηρήσεων y 1,, y n προκύπτει από τους νόμους των πιθανοτήτων και την χρησιμοποίηση του θεωρήματος του Bayes p(y1,..., y n μ)p(μ) p(μ y 1,, y n ) = p(y1,..., y n ) όπου p(y 1,, y n ) είναι η περιθώριος κατανομή των δεδομένων, η οποία προκύπτει από την κατανομή p(y 1,, y n μ) και p(μ). Το αποτέλεσμα που προκύπτει από την χρήση του κανόνα του Bayes, p(μ y 1,, y n ) είναι γνωστό ως η εκ των υστέρων κατανομή (posterior distribution) του μ και περιγράφει την κατάσταση της γνώσης μας για το μ αφού παρατηρήσουμε τα y 1,, y n. Η εκ των υστέρων κατανομή είναι θεμελιώδης στην Μπεϋζιανή συμπερασματολογία για το μ. Η Μπεϋζιανή προσέγγιση διατυπώνει πιθανοθεωρητικά συμπεράσματα για άγνωστες ποσότητες αφού καθορίσει ποσότητες που έχουν παρατηρηθεί στις παρατηρηθείσες τιμές τους. Αυτό σημαίνει ότι, στην περίπτωση αυτή, δεν χρησιμοποιούμε την λογική της επαναλαμβανόμενης δειγματοληψίας από τον ίδιο πληθυσμό, αλλά συγκεντρώνουμε την προσοχή μας στο συγκεκριμένο δείγμα που έχουμε διαθέσιμο. Η εκ των προτέρων κατανομή είναι το σημείο εκείνο που προβληματίζει τους περισσότερους Στατιστικούς. Αυτό συμβαίνει 500

14 γιατί γεννάται το ερώτημα από που προέρχονται τέτοιες εκ των προτέρων κατανομές, όπως επίσης και ποιά είναι η επίδραση της εκ των προτέρων κατανομής στα συμπεράσματα στα οποία καταλήγουμε. Οι ανησυχίες αυτές είναι σημαντικές και θα πρέπει να εξετασθούν με λεπτομέρεια. Αυτό μπορεί να γίνει σε μάθημα προχωρημένου επιπέδου. Προς το παρόν, θα επιλέξουμε μια βολική εκ των προτέρων κατανομή προκειμένου να επανεξετάσουμε το πρόβλημα της σημειακής εκτίμησης, της εκτίμησης μέσω διαστημάτων εμπιστοσύνης και του ελέγχου υποθέσεων που είχαμε συζητήσει προηγουμένως κάτω από την κλασσική υπόθεση. Έστω ότι το μ ακολουθεί μια κανονική κατανομή με μέση τιμή μ 0 και διακύμανση τ 2, όπου μ 0 και τ 2 είναι καθορισμένες σταθερές. Αυτό σημαίνει ότι, εκ των προτέρων, πιστεύουμε ότι η τιμή του μ είναι κοντά στο μ 0, δηλαδή, σύμφωνα με την εκ των προτέρων κατανομή, με πιθανότητα 0.95 το μ βρίσκεται στο διάστημα (μ 0-2τ, μ 0 +2τ). Με απλές αλγεβρικές πράξεις οδηγούμαστε στο συμπέρασμα ότι η εκ των υστέρων κατανομή από τον κανόνα του Bayes είναι και πάλι μια κανονική κατανομή (μ y 1,, y n ) ~ Ν(μ n, V n ), όπου n 1 y + μ σ τ 1 μ n = n 1 και V n = n σ τ σ τ Προκειμένου να ερμηνεύσουμε την εκ των υστέρων κατανομή χρησιμοποιούμε τον όρο ακρίβεια για το αντίστροφο της διακύμανσης. Η εκ των υστέρων μέση τιμή μ n είναι ένας σταθμισμένος, ως προς την ακρίβεια, μέσος του δειγματικού μέσου y, και της εκ των προτέρων μέσης τιμής μ 0. Αν οι εκ των προτέρων πληροφορίες είναι εξαιρετικά ακριβείς (τ 2 μικρό), τότε η εκ των υστέρων μέση τιμή για την άγνωστη παράμετρο μ θα επηρεάζεται σημαντικά από την εκ των προτέρων μέση τιμή μ 0. Από το άλλο μέρος, αν οι καταρχήν διαθέσιμες πληροφορίες είναι ασαφείς (τ 2 μεγάλο), η εκ των υστέρων μέση τιμή θα καθορίζεται κατά κύριο λόγο 501

15 από τα δεδομένα. Τέλος, η ακρίβεια της εκ των υστέρων κατανομής V n -1 είναι ακριβώς το άθροισμα των ακριβειών της εκ των προτέρων κατανομής και της κατανομής των δεδομένων. Σημειακή Εκτίμηση Η εκ των υστέρων κατανομή περιγράφει την γνώση μας για το μ αφού παρατηρηθούν τα δεδομένα καθορίζοντας ποιές τιμές είναι περισσότερο εύλογες και πόσο πιθανή είναι κάθε μια από αυτές. Μια σημειακή εκτίμηση είναι μόνο μια συνοπτική περιγραφή με μια τιμή της εκ των υστέρων κατανομής. Εν γένει, η μέση τιμή της εκ των υστέρων κατανομής, η διάμεσος της εκ των υστέρων κατανομής και η επικρατούσα τιμή της εκ των υστέρων κατανομής μπορούν να είναι αποδεκτές σημειακές εκτιμήτριες του μ. Στο παράδειγμα που εξετάσαμε, οι εκτιμήτριες αυτές συμπίπτουν, αλλά αυτό δεν συμβαίνει πάντοτε, εν γένει. Προκειμένου να επιλεγεί μία μόνο σημειακή εκτίμηση κάτω από την Μπεϋζιανή προσέγγιση, χρησιμοποιούμε μία συνάρτηση απώλειας (loss function) που καθορίζει το κόστος ενός λάθους στην εκτίμηση. Στην συνέχεια, επιλέγουμε ως εκτίμησή μας την τιμή που ελαχιστοποιεί το αναμενόμενο κόστος (expected loss) κάτω από την εκ των υστέρων κατανομή. Και στο σημείο αυτό, μερικοί αντιτίθενται στον φορμαλισμό που απαιτεί η Μπεϋζιανή προσέγγιση ότι, δηλαδή, απαιτείται μια συνάρτηση απώλειας για να καθορισθεί μια ιδανική σημειακή εκτίμηση. Είναι ενδεχόμενο να εξετάσουμε αν η Μπεϋζιανή σημειακή εκτίμηση έχει επιθυμητές ιδιότητες της κλασσικής προσέγγισης (για παράδειγμα, να καθορίσουμε εάν είναι αμερόληπτες), αλλά οι ιδιότητες αυτές δεν είναι απαραίτητες για την Μπεϋζιανή προσέγγιση. Η αυξανόμενη έμφαση στην υπολογιστική λογική στην Μπεϋζιανή προσέγγιση σημαίνει ότι, πολλές φορές, χρησιμοποιούμε συνοπτικές γραφικές ή αριθμητικές περιγραφές της εκ των υστέρων κατανομής παρά στηριζόμαστε σε μια συγκεκριμένη συνάρτηση απώλειας προκειμένου να καθορίσουμε μία σημειακή εκτίμηση. Εκτίμηση με Διαστήματα Εμπιστοσύνης 502

16 Η εκ των υστέρων κατανομή μας επιτρέπει να προσδιορίσουμε διαστήματα που περιέχουν το μ με οποιαδήποτε καθορισμένη πιθανότητα. Τα διαστήματα αυτά ονομάζονται εκ των υστέρων διαστήματα (posterior intervals) ή σύνολα αξιοπιστίας (credible sets). Στο παράδειγμά μας, (μ 0 ± 1.96 V n ) είναι ένα 95% κεντρικό εκ των υστέρων διάστημα. Δεδομένου ότι το μ θεωρείται μια τυχαία μεταβλητή κάτω από την Μπεϋζιανή προσέγγιση, είναι επιτρεπτό να λέμε ότι, για ένα οποιοδήποτε σύνολο δεδομένων, το μ βρίσκεται στο προαναφερθέν διάστημα με πιθανότητα 95%. Υπενθυμίζεται ότι ένα τέτοιο συμπέρασμα δεν είναι δυνατό στην κλασσική προσέγγιση των διαστημάτων εμπιστοσύνης. Η Μπεϋζιανή προσέγγιση κάνει σαφή χρήση της θεωρίας πιθανοτήτων προκειμένου να καταλήξει σε πιθανοθεωρητικά συμπεράσματα για την άγνωστη παράμετρο δοθέντος ενός μοναδικού συγκεκριμένου δείγματος, ενώ η κλασσική προσέγγιση που βασίζεται στην συχνότητα καταλήγει σε πιθανοθεωρητικά συμπεράσματα για την απόδοση της διαδικασίας σε επαναλαμβανόμενες δειγματοληψίες. Εκ των υστέρων πυκνότητα (posterior density) Η Μπεϋζιανή εκ των υστέρων κατανομή του μ. Η εκ των προτέρων κατανομή έχει υποτεθεί να είναι κανονική με μέση τιμή 110 και τυπική απόκλιση 10. Τα δεδομένα είναι 10 παρατηρήσεις από ένα κανονικό πληθυσμό με y = και σ = 2 (αυτό είναι το δείγμα 1 που χρησιμοποιήσαμε προκειμένου να δημιουργήσουμε το διάστημα εμπιστοσύνης στο σχήμα κάτω από την κλασσική προσέγγιση). Η εκ των υστέρων κατανομή είναι κανονική με μέση τιμή μ n =99.49 και τυπική απόκλιση V = Η γραμμοσκιασμένη περιοχή είναι η κεντρική 95% περιοχή. Μοιάζει n 503

17 πολύ με το διάστημα εμπιστοσύνης για το δείγμα 1 στο σχήμα που έχουμε στην κλασσική προσέγγιση, δεδομένου ότι η εκ των προτέρων κατανομή είναι ασαφής. Έλεγχοι Υποθέσεων Στο απλό παράδειγμά μας, μια απόφαση για το κατά πόσο μ<100 (το βάρος του κομματιού είναι μικρότερο από το διαφημιζόμενο) ή μ 100, μπορεί να γίνει με τον υπολογισμό της εκ των υστέρων κατανομής ότι μ 100. Αυτό γίνεται εύκολα με την χρήση της εκ των υστέρων κατανομής, όπως στο προηγούμενο σχήμα. Θα πρέπει να επισημανθεί ότι αυτή είναι μια πιθανότητα που αναφέρεται απευθείας στο ερώτημα για τον έλεγχο σημαντικότητας της άγνωστης παραμέτρου μ. Διαφέρει σημαντικά από την ερμηνεία της p-τιμής, η οποία είναι μια πιθανότητα που αναφέρεται σε επαναλαμβανόμενη δειγματοληψία κάτω από μια δεδομένη μηδενική τιμή της παραμέτρου. Για τον έλεγχο μιας υπόθεσης έναντι μιας άλλης στην Μπεϋζιανή προσέγγιση υπάρχει μια πιο τυπική διαδικασία η οποία είναι γνωστή ως ο παράγοντας Bayes (the Bayes factor). Η προσέγγιση αυτή χρειάζεται αρκετά εργαλεία και ως εκ τούτου δεν θα εξετασθεί στο σημείο αυτό. Εκ των Προτέρων Κατανομές (prior distributions) Η Μπεϋζιανή προσέγγιση αποφεύγει μέρος της εννοιολογικής δυσκολίας η οποία σχετίζεται με την ερμηνεία των διαστημάτων εμπιστοσύνης και των παρατηρούμενων επιπέδων σημαντικότητας (pvalues). Το κόστος που υφίσταται κανείς για να αποκτήσει αυτά τα πλεονεκτήματα είναι εκείνο που αναφέρεται στον καθορισμό της εκ των προτέρων κατανομής για την άγνωστη παράμετρο και είναι ένα κόστος το οποίο πολλοί επιστήμονες δεν είναι διατεθειμένοι να πληρώσουν. Εκείνο που πολλές φορές δημιουργεί προβλήματα είναι ότι άτομα με διαφορετικές εκ των προτέρων πιθανότητες είναι ενδεχόμενο να οδηγηθούν σε διαφορετικές απαντήσεις. Βέβαια, οι υποστηρίζοντες την Μπεϋζιανή προσέγγιση υπενθυμίζουν ότι αυτό συμβαίνει στην καθημερινή ζωή, όταν άτομα με διαφορετική πληροφόρηση οδηγούνται σε διαφορετικές αποφάσεις. 504

18 Ας εξετάσουμε τώρα ορισμένα στατιστικά θέματα που σχετίζονται με τον καθορισμό της εκ των προτέρων πιθανότητας. Ένα κύριο χαρακτηριστικό είναι ότι, σε μεγάλα δείγματα, η εκ των προτέρων κατανομή καθίσταται άνευ σημασίας. Στο απλό παράδειγμα που χρησιμοποιήσαμε (με την κανονική κατανομή), εάν επιτρέψουμε στο μέγεθος του δείγματος να αυξάνεται (n ) για οποιαδήποτε εκ των προτέρων κατανομή (δηλαδή για οποιαδήποτε επιλογή του μ 0 και του τ 2 ), η ασυμπτωτική συμπεριφορά της εκ των υστέρων κατανομής δεν εξαρτάται από τις παραμέτρους της εκ των προτέρων κατανομής. Ποιοτικά, μπορούμε να πούμε ότι αν ζυγίσουμε ένα αντικείμενο εκατοντάδες ή χιλιάδες φορές, θα αγνοήσουμε τις εκ των προτέρων πληροφορίες υπέρ των δεδομένων από τις ζυγίσεις. Στο όριο, η εκ των υστέρων κατανομή θα συμπεριφέρεται ως εάν δεν υπήρχαν εκ των 2 προτέρων πληροφορίες, μ(y1...yn ) ~ N(y,σ n). Παρατηρούμε ότι το αποτέλεσμα του ορίου είναι όμοιο με αυτό στο οποίο καταλήγουμε στην συνήθη δειγματική κατανομή με την διαφορά, βέβαια, ότι εδώ το μ είναι τυχαία μεταβλητή και το y είναι σταθερό. Δηλαδή, το αποτέλεσμα αυτό υποδεικνύει ότι, παρότι τα Μπεϋζιανά και τα κλασσικά συμπεράσματα ίσως διαφέρουν σε πεπερασμένα δείγματα, τείνουν να συμφωνούν ασυμπτωτικά. Το αποτελέσμα αυτό ισχύει γενικότερα επίσης. Βέβαια, όσοι αναλύουν δεδομένα δεν μπορούν εν γένει να στηρίζονται σε ασυμπτωτικά αποτελέσματα. Για τον λόγο αυτό, αλλά και για την περίπτωση που χρησιμοποιούν την Μπεϋζιανή προσέγγιση, θα περιγράψουμε στην συνέχεια αρκετές μεθόδους για την κατασκευή εκ των προτέρων κατανομών. Η Μπεϋζιανή προσέγγιση απαιτεί ότι η εκ των προτέρων κατανομή πιθανότητας, που θα θεωρήσουμε, είναι μια ειλικρινής αποτίμηση των εκ των προτέρων απόψεων μας σχετικά με τις παραμέτρους του μοντέλου. Παρότι οι άνθρωποι είναι διστακτικοί να δώσουν τέτοιες υποκειμενικές εκ των προτέρων κατανομές, πολλές φορές συμβαίνει ότι τέτοιες εκ των προτέρων πληροφορίες είναι διαθέσιμες. Στο παράδειγμα με την ζύγιση, εάν ξέρουμε το είδος του αντικειμένου που πρόκειται να ζυγισθεί, είναι ενδεχόμενο να είμαστε σε θέση να δώσουμε ένα πεδίο πιθανών βαρών του αντικειμένου. Αν 505

19 είμαστε σε θέση να καθορίσουμε μια εκ των προτέρων κατανομή, τότε η Μπεϋζιανή προσέγγιση παρέχει ένα φυσικό τρόπο (οι Μπεϋζιανοί υποστηρίζουν ότι είναι ο μόνος λογικός τρόπος) να επαναπροσδιορίσουμε τις εκ των προτέρων απόψεις μας με βάση νέα δεδομένα. Μια από τις ερευνητικές περιοχές της Μπεϋζιανής στατιστικής είναι ο προσδιορισμός μεθόδων για να βοηθήσουν τους ερευνητές να κατασκευάσουν εκ των προτέρων πιθανότητες. Συχνά, η επιλογή μιας εκ των προτέρων κατανομής γίνεται ευκολότερη (παρότι, ενδεχομένως, λιγότερο ειλικρινής), λόγω ύπαρξης συζυγών οικογενειών, οικογενειών δηλαδή εκ των προτέρων κατανομών οι οποίες, συνδυαζόμενες με μια κατανομή δεδομένων, οδηγούν σε εκ των υστέρων κατανομές της ίδιας οικογένειας. Η κανονική εκ των προτέρων κατανομή στο παράδειγμά μας είναι μια συζυγής εκ των προτέρων κατανομή για δεδομένα που προέρχονται από την κανονική κατανομή, αφού συνδυαζόμενα οδηγούν σε κανονική εκ των υστέρων κατανομή. Συζυγείς εκ των προτέρων κατανομές διευκολύνουν την συμπερασματολογία δεδομένου ότι κάνουν ευκολότερους τους υπολογισμούς, επειδή συνήθως μελετώνται λεπτομερώς και είναι εύκολο να ερμηνευθούν. Συζυγείς εκ των προτέρων κατανομές έχουν την ικανότητα να υποστηρίζουν μια ποικιλία εκ των προτέρων γνωμών (δηλαδή, να επιτρέπουν διαφορετικές επιλογές των μ 0 και τ 2 ), όχι όμως πάντα. Η επιλογή συγκεκριμένων τιμών για το μ 0 και το τ 2 παραμένει ένα δύσκολο πρόβλημα για πολλούς. Για τον λόγο αυτό, έχουν πολλές φορές προταθεί αυτόματες μέθοδοι για τον καθορισμό της εκ των προτέρων κατανομής. Τέτοιες μέθοδοι είναι οι εμπειρικές Μπεϋζιανές μέθοδοι (empirical Bayes methods), οι οποίες χρησιμοποιούν τα δεδομένα για να βοηθήσουν στην επιλογή των παραμέτρων της εκ των προτέρων κατανομής. Οι εμπειρικές Μπεϋζιανές τεχνικές εφαρμόζονται συνήθως σε περισσότερο πολύπλοκα μοντέλα (π.χ. αναλύσεις που ενσωματώνουν τυχαίες επιδράσεις). Οι τεχνικές αυτές δεν συζητιούνται περισσότερο εδώ. Η επιθυμία αποφυγής χρήσης υποκειμενικών εκ των προτέρων πληροφοριών και/ή αυθαιρέτων μορφών κατανομών, έχει οδηγήσει σε 506

20 μεγάλες ερευνητικές προσπάθειες με χρήση ασαφών ή με χωρίς πληροφορίες (μη πληροφοριακών) εκ των προτέρων κατανομών. Τυπικά, μια ασαφής εκ των προτέρων κατανομή, είναι μια κατανομή η οποία αντιστοιχεί χονδρικά ίσες πιθανότητες σε ένα μεγάλο φάσμα ενδεχομένων τιμών. Στο παράδειγμά μας της κανονικής κατανομής, η συμμετοχή της εκ των προτέρων κατανομής εξαρτάται από την ακρίβειά της σε σύγκριση με την ακρίβεια της κατανομής των δεδομένων. Μια επιλογή τ 2 = (μια πολύ επίπεδη κανονική εκ των προτέρων κατανομή) όταν σ 2 = 1 2, θα θεωρηθεί μια ασαφής εκ των προτέρων κατανομή. Μια ασαφής εκ των προτέρων κατανομή δεν θα έχει ισχυρή επίδραση στην τελική μορφή της εκ των υστέρων κατανομής. Στο όριο, ασαφείς εκ των προτέρων κατανομές είναι ενδεχόμενο να καταστούν τόσο πολύ ασαφείς, ώστε να μην είναι πλέον καλά οριμένες κατανομές (να μην ολοκληρώνουν στην μονάδα!). Παρ όλα αυτά, είναι επιτρεπτό να χρησιμοποιούνται μη καλώς ορισμένες εκ των προτέρων κατανομές, εφόσον μπορούμε να επιβεβαιώσουμε μαθηματικά ότι η εκ των υστέρων κατανομή στην οποία οδηγούμεθα είναι καλά ορισμένη. Οι μη καλά ορισμένες εκ των προτέρων κατανομές είναι δημοφιλείς γιατί, πολλές φορές, εμφανίζονται να μην περιέχουν πληροφορίες κατά το ότι αναπαράγουν αποτελέσματα της κλασσικής θεωρίας. Το καλύτερο είναι ίσως να θεωρούμε τις μη καλά ορισμένες εκ των προτέρων κατανομές ως προσεγγίσεις των πραγματικών εκ των προτέρων κατανομών. Αν μια μη καλά ορισμένη εκ των προτέρων κατανομή οδηγεί σε μια καλά ορισμένη εκ των υστέρων κατανομή και σε ικανοποιητικά ακριβή συμπεράσματα, τότε, ίσως, αποδεχθούμε την ανάλυση στην οποία καταλήγουμε. Εάν όχι, θα πρέπει να σκεφθούμε περισσότερο για τον καθορισμό της εκ των προτέρων κατανομής. 507

21 Πότε Ενδείκνυται η Χρήση των Μπεϋζιανών Μεθόδων; Το σχετικά εύκολο παράδειγμα που χρησιμοποιήθηκε στην προηγούμενη συζήτηση δεν είναι αρκετό για να απαντήσει το ερώτημα αυτό. Δεδομένου ότι η εκ των υστέρων κατανομή του μ στο παράδειγμά μας μοιάζει με την δειγματική κατανομή (sampling distribution) της κλασσικής θεωρίας, είναι ενδεχόμενο να συμπεράνει κανείς ότι, για μεγάλα δείγματα ή για ασαφείς εκ των προτέρων κατανομές, η Μπεϋζιανή ανάλυση είναι χρήσιμη μόνο στις περιπτώσεις όπου οι εκ των προτέρων πληροφορίες είναι ισχυρές. Η επιχειρηματολογία αυτή είναι δυνατόν να ενισχυθεί με το επιχείρημα ότι προβλήματα ανάλυσης δεδομένων για τα οποία υπάρχουν ισχυρές εκ των προτέρων πληροφορίες δεν εμφανίζονται πολύ συχνά. Επομένως, δεν έχει συχνά έννοια να υιοθετήσει κανείς την Μπεϋζιανή προσέγγιση. Οι Μπεϋζιανοί απορρίπτουν την άποψη αυτή ισχυριζόμενοι ότι πάσχει σε πολλά σημεία. Συγκεκριμένα, ισχυρίζονται ότι η Μπεϋζιανή προσέγγιση δίνει μια λογικά συνεπή μέθοδο για την ανάλυση δεδομένων με ερμηνεία των αποτελεσμάτων που βασίζεται στην θεωρία των πιθανοτήτων (π.χ. εκτιμήτριες διαστημάτων εμπιστοσύνης). Δεύτερον, υποστηρίζουν ότι είναι δυνατόν να εξαχθούν σωστά Μπεϋζιανά συμπεράσματα σε πεπερασμένα δείγματα (παρότι οι υπολογισμοί θα είναι κάπως δυσκολότεροι), ενώ, κατά την γνώμη τους, εκτός από ειδικές περιπτώσεις, οι έλεγχοι υποθέσεων και τα διαστήματα εμπιστοσύνης που στηρίζονται στην κλασσική θεωρία βασίζονται σε ασυμπτωτικά αποτελέσματα (αποτελέσματα που στηρίζονται σε μεγάλα δείγματα). Πάντως, ισχυρίζονται οι υποστηρικτές της Μπεϋζιανής προσέγγισης, σε πολλά προβλήματα με πολλές μεταβλητές, εκ των προτέρων πληροφορίες δεν είναι τόσο σπάνιες όσο είναι ενδεχόμενο να πιστεύει κανείς. Για παράδειγμα, εκ των προτέρων πληροφορίες ίσως μας οδηγούν στο συμπέρασμα ότι ένα υποσύνολο των παραμέτρων μπορεί να αντιμετωπισθεί ως ένα δείγμα από ένα κοινό πληθυσμό (π.χ. στο μοντέλο τυχαίων επιδράσεων (random effects models) όπως περιγράφεται στην επόμενη παράγραφο. 508

22 Οι υποστηρικτές της Μπεϋζιανής προσέγγισης ισχυρίζονται ότι ένα περισσότερο πειστικό κίνητρο για την χρήση της προσέγγισης αυτής μπορεί να βρεθεί στα μοντέλα που είναι περισσότερο πολύπλοκα από το απλό κανονικό μοντέλο που χρησιμοποιήσαμε προηγουμένως. Τα πολύπλοκα αυτά μοντέλα δεν είναι υποχρεωτικά εξαιρετικά πολύπλοκα και, συχνά, είναι πολύ ρεαλιστικά για την επίλυση επιστημονικών προβλημάτων. Ας θεωρήσουμε, για παράδειγμα, την χρήση ενός μεικτού γραμμικού μοντέλου (mixed linear model) σε μια εφαρμογή εκτροφής ζώων. Το τυπικό ή το σύνηθες μοντέλο, το οποίο χρησιμοποιείται στην εκτροφή ζώων, περιλαμβάνει ένα αριθμό παραμέτρων γραμμικής παλινδρόμησης που συνδέει τα χαρακτηριστικά των ζώων με το αποτέλεσμα που ενδιαφέρει, συνοδευόμενο από μια παράμετρο για κάθε ζώο που περιγράφει τον μη παρατηρούμενο γενετικό παράγοντα εκτροφής. Η μελέτη, επομένως, χιλιάδων ζώων περιλαμβάνει χιλιάδες παραμέτρους. Ο τιμές αυτές της εκτροφής ζώων υποτίθενται συνήθως ότι ακολουθούν μια κανονική κατανομή με γνωστό μη-διαγώνιο πίνακα συνδιακύμανσης, δηλαδή, αντιμετωπίζονται ως τυχαίες συσχετισμένες επιδράσεις. Για έναν Μπεϋζιανό, η κανονική κατανομή αυτών των τυχαίων επιδράσεων είναι ακριβώς η εκ των προτέρων κατανομή των παραμέτρων αυτών. Η Μπεϋζιανή προσέγγιση μπορεί να χρησιμοποιηθεί στην περίπτωση αυτή για την εξαγωγή συμπερασμάτων σχετικών με τις τυχαίες επιδράσεις (π.χ. σε σχέση με ποιά ζώα έχουν τις μεγαλύτερες τιμές εκτροφής). Μεθοδολογικά, αυτό που κάνουμε είναι η εφαρμογή του θεωρήματος του Bayes. Στην πράξη, αυτό ίσως απαιτεί πολύπλοκες υπολογιστικές τεχνικές, όπως η δειγματοληψία κατά Gibbs (Gibbs sampling) ή άλλους αλγορίθμους προσομοίωσης μαρκοβιανών αλυσίδων (Markov Chain Monte Carlo algorithms). Οι υποστηρικτές της Mπεϋζιανής προσέγγισης την βρίσκουν ιδιαίτερα ελκυστική για την ανάλυση δεδομένων. Θεωρούν ότι υπάρχουν δύο καθοριστικοί παράγοντες για την χρήση τους. Κατ αρχήν, η γλώσσα των πιθανοτήτων είναι εκείνη που οι στατιστικοί χρησιμοποιούν για να περιγράψουν την αβεβαιότητα και είναι, επομένως, φυσικό να χρησιμοποιηθεί η γλώσσα αυτή για να 509

23 περιγράψει την κατάσταση των γνώσεων μας γύρω από την τιμή μιας άγνωστης παραμέτρου. Δεύτερον, ισχυρίζονται, είναι εν γένει αρκετά προφανές με ποιό τρόπο πρέπει να προχωρήσει κανείς, όταν αντιμετωπίζει πρόσθετη πολυπλοκότητα π.χ. ελλείποντα δεδομένα, επιπρόσθετες υποθέσεις για την δομή σε ένα μοντέλο, ή νέα δεδομένα. Συμπεράσματα Η κλασσική προσέγγιση εξακολουθεί να είναι κυρίαρχη στα περισσότερα από τα μεταπτυχιακά προγράμματα Στατιστικής και, ίσως, η μοναδική σε αντίστοιχα προπτυχιακά. Είναι ίσως παρόλα αυτά χρήσιμο να προσπαθεί κανείς να παρουσίαζει την Μπεϋζιανή προσέγγιση και να εξηγεί τόσο τις ομοιότητες με την κλασσική θεωρία (χρήση των κατανομών παραμετρικών δεδομένων που εξαρτώνται από άγνωστες παραμέτρους) και τις διαφορές από την κλασσική θεωρία (χρήση των κατανομών πιθανοτήτων για τους αγνώστους). Στην σύντομη αυτή παρουσίαση, δεν αντιμετωπίσαμε την προσέγγιση που εφαρμόζουν πολλοί Μπεϋζιανοί για την εξαγωγή συμπερασμάτων κατ ευθείαν από την συνάρτηση πιθανοφάνειας (κατανομή των δεδομένων) χωρίς την χρήση είτε της επαναλαμβανόμενης δειγματοληψίας είτε εκ των προτέρων πληροφοριών, ούτε αναφερθήκαμε σε μη παραμετρικές προσεγγίσεις για την ανάλυση δεδομένων. Οι προσεγγίσεις αυτές αναπτύσσονται σε εξειδικευμένα μαθήματα Μπεϋζιανής Στατιστικής. 510

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΣΚΕΨΗ ΤΟΜΟΣ ΙΙ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΣΚΕΨΗ ΤΟΜΟΣ ΙΙ Ι. ΠΑΝΑΡΕΤΟΥ & Ε. ΞΕΚΑΛΑΚΗ Καθηγητών του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΣΚΕΨΗ ΤΟΜΟΣ ΙΙ (Εισαγωγή στις Πιθανότητες και την Στατιστική Συμπερασματολογία)

Διαβάστε περισσότερα

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη Σημειακή εκτίμηση και εκτίμηση με διάστημα 11 η Διάλεξη Εκτιμήτρια Κάθε στατιστική συνάρτηση που χρησιμοποιείται για την εκτίμηση μιας παραμέτρου ενός πληθυσμού (π.χ. ο δειγματικός μέσος) Σημειακή εκτίμηση

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Τυχαίο Δείγμα

Διαβάστε περισσότερα

ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis)

ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis) ΚΕΦΑΛΑΙΟ 23 ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis) ΕΙΣΑΓΩΓΗ Έχοντας παρουσιάσει τις βασικές έννοιες των ελέγχων υποθέσεων, θα ήταν, ίσως, χρήσιμο να αναφερθούμε σε μια άλλη περιοχή στατιστικής συμπερασματολογίας

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test 1 Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου One-Sample t-test 2 Μια σύντομη αναδρομή Στα τέλη του 19 ου αιώνα μια μεγάλη αλλαγή για την επιστήμη ζυμώνονταν στην ζυθοποιία Guinness. Ο William Gosset

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ ΚΕΦΑΛΑΙΟ ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ Ως γνωστό δείγμα είναι ένα σύνολο παρατηρήσεων από ένα πληθυσμό. Αν ο πληθυσμός αυτός θεωρηθεί μονοδιάστατος τότε μπορεί να εκφρασθεί με τη συνάρτηση

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV 5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling) 3 ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratfed Radom Samplg) Είναι προφανές από τα τυπικά σφάλματα των εκτιμητριών των προηγούμενων παραγράφων, ότι ένας τρόπος να αυξηθεί η ακρίβεια τους είναι να αυξηθεί

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΚΕΦΑΛΑΙΟ 11 ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ Θα εισαγάγουμε την έννοια του τυχαίου αριθμού με ένα παράδειγμα. Παράδειγμα: Θεωρούμε μια τυχαία μεταβλητή με συνάρτηση πιθανότητας η οποία σε

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα. Η Διωνυμική Κατανομή Η Διωνυμική κατανομή συνδέεται με ένα πολύ απλό πείραμα τύχης. Ίσως το απλούστερο! Πρόκειται για τη δοκιμή Bernoulli, ένα πείραμα τύχης με μόνο δύο, αμοιβαίως αποκλειόμενα, δυνατά

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου ΠΡΟΛΟΓΟΣ Η γραμμική παλινδρόμηση χρησιμοποιείται για την μελέτη των σχέσεων μεταξύ μετρήσιμων μεταβλητών. Γενικότερα, η γραμμική στατιστική συμπερασματολογία αποτελεί ένα ευρύ πεδίο της στατιστικής ανάλυσης

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC

Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC Μπεϋζιανή Στατιστική και MCMC Μέρος 2 ο : MCMC Περιεχόμενα Μαθήματος Εισαγωγή στο Πρόβλημα. Monte Carlo Εκτιμητές. Προσομοίωση. Αλυσίδες Markov. Αλγόριθμοι MCMC (Metropolis Hastings & Gibbs Sampling).

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

4 Πιθανότητες και Στοιχεία Στατιστικής για Μηχανικούς

4 Πιθανότητες και Στοιχεία Στατιστικής για Μηχανικούς Πρόλογος Ο μηχανικός πρέπει να συνεχίσει να βελτιώνει την ποιότητα της δουλειάς του εάν επιθυμεί να είναι ανταγωνιστικός στην αγορά της χώρας του και γενικότερα της Ευρώπης. Μία σημαντική αναλογία σε αυτήν

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ Πιθανότητες και Στατιστική

ΕΙΣΑΓΩΓΗ Πιθανότητες και Στατιστική ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ Πιθανότητες και Στατιστική Ο μεγάλος Γάλλος μαθηματικός Laplace έγραψε ότι οι Πιθανότητες δεν είναι τίποτα άλλο παρά η μετατροπή της κοινής λογικής σε μαθηματικές εκφράσεις. Η χρήση

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ 3.1 Εισαγωγή ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ Στο κεφ. 2 είδαμε πώς θα μπορούσαμε να σχεδιάσουμε έναν βέλτιστο ταξινομητή εάν ξέραμε τις προγενέστερες(prior) πιθανότητες ( ) και τις κλάση-υπό όρους πυκνότητες

Διαβάστε περισσότερα

Στατιστική. Εκτιμητική

Στατιστική. Εκτιμητική Στατιστική Εκτιμητική Χατζόπουλος Σταύρος 28/2/2018 και 01 /03/2018 Εισαγωγή Το αντικείμενο της Στατιστικής είναι η εξαγωγή συμπερασμάτων που αφορούν τον πληθυσμό ή το φαινόμενο που μελετάμε, με τη βοήθεια

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ)

ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ) ΑΣΚΗΣΕΙΣ. Ο διευθυντής προσωπικού μιας μεγάλης εταιρείας πιστεύει ότι ίσως υφίσταται κάποια σχέση μεταξύ των ημερών απουσίας και της ηλικίας των εργαζομένων. Με βάση την υπόθεση αυτή ενδιαφέρεται να κατασκευάσει

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

X = = 81 9 = 9

X = = 81 9 = 9 Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική Εργαστήριο Μαθηματικών & Στατιστικής ΣΕΙΡΑ Α Γραπτή Εξέταση Περιόδου Φεβρουαρίου 013 στη Στατιστική για τα Τμήματα Ε.Τ.Τ., Γ.Β., Α.Ο.Α. και Ε.Ζ.Π.&Υ. 08/0/013 1. [0] Η ποσότητα, έστω Χ, καλίου που περιέχεται

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

ΓΕΝΙΚΗ ΘΕΩΡΗΣΗ ΤΩΝ ΕΛΕΓΧΩΝ ΥΠΟΘΕΣΕΩΝ

ΓΕΝΙΚΗ ΘΕΩΡΗΣΗ ΤΩΝ ΕΛΕΓΧΩΝ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 22 ΓΕΝΙΚΗ ΘΕΩΡΗΣΗ ΤΩΝ ΕΛΕΓΧΩΝ ΥΠΟΘΕΣΕΩΝ ΓΕΝΙΚΕΥΣΕΙΣ ΚΑΙ ΣΥΓΚΡΙΣΕΙΣ Σύνοψη των Απαιτούμενων Ενεργειών στους Ελέγχους Υποθέσεων Από όσα έχουμε δει μέχρι τώρα, οδηγούμαστε στο συμπέρασμα ότι τα βήματα

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής Chapter 1 Student Lecture Notes 1-1 Ανάλυση Δεδομένων και Στατιστική για Διοικήση Επιχειρήσεων [Basic Business Statistics (8 th Edition)] Κεφάλαιο 1 Εισαγωγή και Συλλογή Δεδομένων Περιεχόμενα Γιατί ένας

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) 4. ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) Η μέθοδος της βηματικής παλινδρόμησης (stepwise regression) είναι μιά άλλη μέθοδος επιλογής ενός "καλού" υποσυνόλου ανεξαρτήτων μεταβλητών.

Διαβάστε περισσότερα

ΜΕΡΟΣ ΠΡΩΤΟ Στατιστικό υπόβαθρο και βασικός χειρισµός δεδοµένων

ΜΕΡΟΣ ΠΡΩΤΟ Στατιστικό υπόβαθρο και βασικός χειρισµός δεδοµένων ΜΕΡΟΣ ΠΡΩΤΟ Στατιστικό υπόβαθρο και βασικός χειρισµός δεδοµένων 1 Βασικές έννοιες... 3 2 Η δοµή των οικονοµικών δεδοµένων και ο βασικός χειρισµός δεδοµένων... 14 ΚΕΦΑΛΑΙΟ 1 Βασικές έννοιες ΠΕΡΙΕΧΟΜΕΝΑ

Διαβάστε περισσότερα

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου 4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου Για την εκτίμηση των παραμέτρων ενός πληθυσμού (όπως η μέση τιμή ή η διασπορά), χρησιμοποιούνται συνήθως δύο μέθοδοι εκτίμησης. Η πρώτη ονομάζεται σημειακή εκτίμηση.

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 16 ης διάλεξης

Ασκήσεις μελέτης της 16 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 16 ης διάλεξης 16.1. (α) Έστω ένα αντικείμενο προς κατάταξη το οποίο

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα Δύο κύριοι τρόποι παρουσίασης δεδομένων Παράδειγμα Με πίνακες Με διαγράμματα Ονομαστικά δεδομένα Εδώ τα περιγραφικά μέτρα (μέσος, διάμεσος κλπ ) δεν έχουν νόημα Πήραμε ένα δείγμα από 25 άτομα και τα ρωτήσαμε

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011 Εργαστήριο Μαθηματικών & Στατιστικής Γραπτή Εξέταση Περιόδου Φεβρουαρίου για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 5//. [] Η ποσότητα, έστω Χ, ενός συντηρητικού που περιέχεται σε φιάλες αναψυκτικού

Διαβάστε περισσότερα