ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ



Σχετικά έγγραφα
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισόδημα Κατανάλωση

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων ΙΙ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Στατιστική Συμπερασματολογία

Χ. Εμμανουηλίδης, 1

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

9. Παλινδρόμηση και Συσχέτιση

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Απλή Παλινδρόμηση και Συσχέτιση

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Γ. Πειραματισμός - Βιομετρία

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

x y max(x))

5. Έλεγχοι Υποθέσεων

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

Εφαρμοσμένη Στατιστική

ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ» ΚΑΛΥΒΑ ΠΑΝΑΓΙΩΤΑ ΛΑΖΑΡΟΥ ΜΑΡΙΕΛΕΝΑ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Ενδεικτικές ασκήσεις ΔΙΠ 50

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

Εισαγωγή στην Εκτιμητική

Στατιστική. Εκτιμητική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Το Κεντρικό Οριακό Θεώρημα

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

ΣΑΣΙΣΙΚΗ. Ακαδ. Έτος Βασίλης ΚΟΤΣΡΑ. Διδάσκων: Διδάσκων επί Συμβάσει Π.Δ 407/80.

Στατιστική Συμπερασματολογία

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

X = = 81 9 = 9

Στατιστική Επιχειρήσεων Ι

Είδη Μεταβλητών. κλίµακα µέτρησης

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Συμπερασματολογία

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Το Κεντρικό Οριακό Θεώρημα

Transcript:

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΣΙΜΟΣ ΜΕΙΝΤΑΝΗΣ, Αναπληρωτής Καθηγητής Τμήμα Οικονομικών Επιστημών, ΕΚΠΑ ΓΙΑΝΝΗΣ Κ. ΜΠΑΣΙΑΚΟΣ, Επίκουρος Καθηγητής Τμήμα Οικονομικών Επιστημών, ΕΚΠΑ ΚΩΣΤΑΣ ΦΡΑΓΚΙΑΔΑΚΗΣ, Ειδικός Επιστήμονας ΠΔ47 Τμήμα Οικονομικών Επιστημών, ΕΚΠΑ Ιανουαρίου Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag of 7

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. ΕΙΣΑΓΩΓΗ Η Στατιστική ως επιστήμη αποτελεί εργαλείο υποστήριξης πολλών άλλων επιστημών, από τις ανθρωπιστικές επιστήμες και τα Οικονομικά έως την Φυσική. Το πλαίσιο λειτουργίας της Στατιστικής είναι το ακόλουθο: Μας ενδιαφέρει να μετρήσουμε μέσω κάποιας μεταβλητής (παραμέτρου) ένα χαρακτηριστικό ενός «πληθυσμού». Παραδείγματος χάριν την διαφορά αποτελεσματικότητας δύο θεραπειών (χαρακτηριστικό), όπως αυτή μετράται από την μείωση του επιπέδου κάποιου αιματολογικού παράγοντα (μεταβλητή). Δεν είναι όμως δυνατόν να υπολογίσουμε τη διαφορά στο σύνολο του πληθυσμού. Στην προκείμενη περίπτωση απλά διότι το σύνολο του πληθυσμού αλλάζει μέσα στο χρόνο, αλλά γενικά διότι το σύνολο του πληθυσμού είναι συνήθως πολύ μεγάλο. Άρα αντί του πληθυσμού επιλέγουμε ένα απλό τυχαίο δείγμα (δηλαδή ένα δείγμα όπου όλες οι τιμές του πληθυσμού έχουν την ίδια πιθανότητα να συμπεριληφθούν σε αυτό), και υπολογίζουμε την τιμή της παραμέτρου στο δείγμα, μέσω μιας εκτιμήτριας (συνάρτησης). Η τιμή αυτή λέγεται εκτίμηση. Κατόπιν γενικεύουμε και ισχυριζόμαστε ότι η υπολογισθείσα τιμή αποτελεί μια καλή προσέγγιση της πραγματικής τιμής της παραμέτρου του πληθυσμού. Για να ευσταθεί ο ισχυρισμός μας πρέπει να ισχύουν μια σειρά από προϋποθέσεις. Ο έλεγχος των προϋποθέσεων, η επιλογή του δείγματος και η διαδικασία υπολογισμού αποτελεί το αντικείμενο της Στατιστικής. Στα επόμενα κεφάλαια θα παρουσιάσουμε μια σειρά από έννοιες και μεθόδους για την ορθή εξαγωγή στατιστικών συμπερασμάτων.. ΕΚΤΙΜΗΤΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Αντικείμενο της Εκτιμητικής είναι ο υπολογισμός εκτιμητριών, δηλαδή συναρτήσεων των δεδομένων, οι οποίες προσεγγίζουν («εκτιμούν») τις πραγματικές τιμές των παραμέτρων των πληθυσμών. Οι εκτιμήτριες εμπίπτουν σε δύο γενικές (αλλά συνδεδεμένες μεταξύ τους) κατηγορίες: (α) σημειακές εκτιμήτριες, δηλαδή εκτιμήτριες που λαμβάνουν μια συγκεκριμένη τιμή, και (β) εκτιμήτριες διαστημάτων, δηλαδή διαστήματα τιμών (υποσύνολα του συνόλου των Pag of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

πραγματικών αριθμών) που καλούνται διαστήματα εμπιστοσύνης, εντός των οποίων περιλαμβάνεται η παράμετρος του πληθυσμού με προκαθορισμένη πιθανότητα. Στο πλαίσιο του παρόντος μαθήματος θα χρησιμοποιήσουμε τρεις εκτιμήτριες: τον μέσο, τη διακύμανση και τα ποσοστά. Στόχος της Στατιστικής Συμπερασματολογίας, είναι ό έλεγχος υποθέσεων σχετικών με τις παραμέτρους του πληθυσμού. Για παράδειγμα, αν η διαφορά ταχύτητας δύο μεθόδων παραγωγής είναι μηδενική... ΓΕΝΙΚΗ ΔΟΜΗ ΕΛΕΓΧΩΝ ΥΠΟΘΕΣΕΩΝ Ένας τυπικός έλεγχος υπόθεσης, που αφορά κάποια παράμετρο θ του πληθυσμού, αποτελείται από την μηδενική υπόθεση Η, την εναλλακτική υπόθεση Η, μια στατιστική (συνάρτηση) ελέγχου και έναν κανόνα απόρριψης της Η (ή τον ορισμό μιας περιοχής απόρριψης της Η ). Ο ορισμός του κανόνα απόρριψης στηρίζεται στην εξίσωση Ρ(απορρίπτουμε την Η / η Η ισχύει)α όπου α προκαθορισμένη πιθανότητα (συνήθως λαμβάνουσα τις τιμές,,,5 ή,). Δεδομένου ότι ο κανόνας απόρριψης στηρίζεται στην στατιστική ελέγχου Τ, και η Τ είναι συνάρτηση κατάλληλης εκτιμήτριας της θ, την οποία ας συμβολίσουμε Jˆ, η εξίσωση παίρνει τη μορφή Ρ[Τ(Jˆ )Î(περιοχή απόρριψης) / η Η ισχύει] α. Γενικά, επειδή οι υπό έλεγχον παράμετροι είναι πραγματικοί αριθμοί, η μηδενική και η εναλλακτική υπόθεση έχουν μορφή ισότητας ή ανισότητας. Μπορεί, για παράδειγμα, η μηδενική υπόθεση να έχει τη μορφή Η : θ θ, έναντι της εναλλακτικής υπόθεσης Η : θ>θ. Σημειωτέον ότι δεν είναι ανάγκη οι δυο υποθέσεις να καλύπτουν το σύνολο των πραγματικών αριθμών, αλλά συνήθως διατυπώνονται με αυτόν τον τρόπο. Επίσης, η στατιστική ελέγχου είναι πραγματικός αριθμός και συνεπώς ο κανόνας απόρριψης παίρνει και αυτός μορφή ανισότητας. Είναι προφανές ότι δυο ειδών σφάλματα μπορεί να γίνουν κατά τον έλεγχο μιας υπόθεσης. Είτε να απορριφθεί η μηδενική υπόθεση ενώ ισχύει (σφάλμα τύπου Ι, με πιθανότητα α), είτε να μην απορριφθεί ενώ δεν ισχύει (σφάλμα τύπου ΙΙ, με πιθανότητα β). Επειδή τα δυο αυτά σφάλματα είναι ανταγωνιστικά, δηλαδή όσο μικρότερο είναι το α, τόσο μεγαλύτερο γίνεται το β, ο κανόνας απόρριψης υπολογίζεται με σταθερό α (συνήθως.5 ή.), ενώ το β ελαχιστοποιείται (δεδομένου του α) μεγιστοποιώντας το μέγεθος του δείγματος. Ο κανόνας απόρριψης υπολογίζεται μέσω της εξίσωσης Ρ(απορρίπτουμε την Η / Η ισχύει) α. Οι πιθανότητες Ρ(απορρίπτουμε την Η / Η ισχύει) π και Ρ(αποδεχόμαστε την Η / Η ισχύει) β είναι η ισχύς και η πιθανότητα σφάλματος τύπου ΙΙ, αντίστοιχα. Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 3 of 7

Παράδειγμα: έστω ότι επιλέγουμε τυχαία μια παρατήρηση x από μια κατανομή. Θέλουμε να ελέγξουμε αν η κατανομή αυτή είναι η Ομοιόμορφη επί του [3,5], (U[3,5]), ή η Κανονική με μέση τιμή μ5.9 και διακύμανση σ, (N(5.9,)). Εδώ το ρόλο της στατιστικής ελέγχου παίζει η παρατήρηση x (αν είχαμε επιλέξει περισσότερες παρατηρήσεις η στατιστική ελέγχου θα ήταν η μέγιστη παρατήρηση. Τότε όμως η κατανομή της θα ήταν πιο περίπλοκη). Η μηδενική και η εναλλακτική υπόθεση είναι: Η : η x προέρχεται από την U[3,5] Η : η x προέρχεται από την N(5.9,) Αφού η N(5.9,) βρίσκεται προς τα δεξιά της U[3,5], ένας λογικός κανόνας απόρριψης είναι «απορρίπτουμε την Η, όταν x x ή x < 3». Ο καθορισμός της μορφής του κανόνα απόρριψης στηρίζεται στο κριτήριο του λόγου πιθανοφάνειας και υπερβαίνει τους στόχους των σημειώσεων. Η μορφή θα θεωρείται δεδομένη για κάθε πρόβλημα. Αυτό που μπορεί να υπολογιστεί είναι το όριο της ανισότητας, στην παρούσα περίπτωση το x. Όπως είπαμε, η προς επίλυση εξίσωση είναι η Ρ(απορρίπτουμε την Η / η Η ισχύει) α. Η δέσμευση «η Η ισχύει» μεταφράζεται στο «η κατανομή της στατιστικής ελέγχου είναι αυτή που καθορίζεται από την Η». Με τα δεδομένα του προβλήματος, και με α.5, η εξίσωση παίρνει τη μορφή Ρ(x x ή x < 3/ x U[3,5]).5 Ρ(x x / x U[3,5]) + Ρ(x < 3/ x U[3,5]).5. Λύνοντας την 5 5 æ xù 5 - x εξίσωση ò dx.5 Û ç.5 Û.5 Û 5 -. Û 4. 9 5-3 è ú x x x û x (αφού Ρ(x < 3/ x U[3,5]) ), έχουμε την τελική μορφή του κανόνα απόρριψης, δηλαδή «απορρίπτουμε την Η, όταν το x 4.9». Με τα δεδομένα αυτά μπορούμε να υπολογίσουμε και την ισχύ του ελέγχου, δηλαδή την πιθανότητα να απορρίψουμε την Η, όταν ισχύει η Η. Η εξίσωση που πρέπει να λύσουμε είναι η Ρ(x 4.9 ή x < 3/ x N(5.9,)) π Ρ(x 4.9/ x N(5.9,)) + Ρ(x < 3/ x N(5.9,)) π æ 4.9-5.9 ö æ 3-5.9 ö Û Pç z ³ + Pç z < p Û P( z ³ -) + P( z -.9) p Û - P( z -) + P( z -.9) p è ø è ø Û -.587 +. p Û p.8434. Στις περισσότερες περιπτώσεις (για υποθέσεις της μορφής Η : θ θ ), η στατιστική ελέγχου Τ qˆ - q θα έχει τη μορφή T, και η κατανομή της θα είναι ή η τυπική τupkήapόklsh thv qˆ κανονική κατανομή, ή η κατανομή του Studt. Ένα ακόμη παράδειγμα θα αποσαφηνίσει το παραπάνω σχόλιο. Έστω ότι μας ενδιαφέρει να ελέγξουμε αν το ποσοστό ελαττωματικών Pag 4 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

προϊόντων μιας γραμμής παραγωγής p είναι μικρότερο όταν χρησιμοποιείται μια νέα μέθοδος παραγωγής σε σχέση με την παραδοσιακή μέθοδο. Ουσιαστικά, αυτό που ενδιαφέρει (η νέα μέθοδος να είναι βελτίωση σε σχέση με το παρελθόν), διατυπώνεται στην εναλλακτική και όχι στη μηδενική υπόθεση. Γενικά οι έλεγχοι υποθέσεων «αποδεικνύουν» την εναλλακτική υπόθεση και όχι τη μηδενική! Οι υποθέσεις (μηδενική και εναλλακτική) παίρνουν τη μορφή: Η : p p Η : p < p όπου p είναι το ποσοστό ελαττωματικών της παραδοσιακής μεθόδου. Η στατιστική ελέγχου βασίζεται στην pˆ x/, εκτιμήτρια του p, και πιο συγκεκριμένα είναι η T pˆ - p p ( - p ) Με δεδομένη την Η, η κατανομή της Τ είναι η τυπική κανονική κατανομή, αφού η κατανομή της pˆ είναι κανονική με μέση τιμή μ p και διακύμανση σ p ( p )/. Ο κανόνας απόρριψης είναι «απορρίπτουμε την Η όταν Τ< z.5», που ισοδυναμεί με τον κανόνα «απορρίπτουμε την Η όταν το x/ είναι αρκετά μικρότερο από το p», και όπου z.5 θα αναλυθεί κατωτέρω (εδάφιο..). Στις περιπτώσεις ελέγχων που αφορούν μέσες τιμές και ποσοστά υποθέτουμε ότι οι στατιστικές ελέγχου ακολουθούν την κανονική κατανομή, η οποία έχει σχήμα κωδωνοειδές, και οι πιθανότητες της είναι πλήρως πινακοποιημένες, στην ειδική περίπτωση της τυπικής κανονικής κατανομής, δηλαδή μιας κανονικής κατανομής με μέση τιμή και διακύμανση, (ή την συγγενική με αυτήν κατανομή του Studt, επίσης πλήρως πινακοποιημένη). Το βασικό προτέρημα της κανονικής κατανομής είναι το ότι αποτελεί το όριο της κατανομής των μέσων τιμών, το γνωστό στη στατιστική θεωρία «Κεντρικό Οριακό Θεώρημα». Επίσης έχει την χρήσιμη ιδιότητα ότι αν μια τυχαία μεταβλητή Χ ακολουθεί την κανονική κατανομή, με μέση τιμή μ και διακύμανση σ τότε η κανονική κατανομή. Επίσης ισχύει ότι η - m s -m s ακολουθεί την τυπική ακολουθεί την τυπική κανονική κατανομή, όπου ο μέσος όρος παρατηρήσεων. Στην περίπτωση ελέγχων που αφορούν διακυμάνσεις, οι στατιστικές ελέγχου ακολουθούν τις κατανομές χ ή F, οι οποίες σχετίζονται με την κανονική κατανομή και είναι ομοίως πλήρως πινακοποιημένες. Στις επόμενες παραγράφους θα παρουσιάσουμε τις πιο συνηθισμένες περιπτώσεις ελέγχων. Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 5 of 7

.. ΕΛΕΓΧΟΙ ΓΙΑ ΤΗΝ ΜΕΣΗ ΤΙΜΗ. Το πρόβλημα αναφέρεται στην περίπτωση όπου ενδιαφέρει η ισότητα της μέσης τιμής μιας μεταβλητής με μια προκαθορισμένη τιμή. Παραδείγματος χάριν ο μέσος χρόνος εξυπηρέτησης ενός πελάτη στο γκισέ μιας τράπεζας να ισούται με κάποια τιμή μ. Η κανονική κατανομή των παρατηρήσεων του δείγματος αποτελεί βασική προϋπόθεση για την εφαρμογή των τύπων που ακολουθούν. Είναι γεγονός ότι η εκτιμήτρια της μέσης τιμής τείνει να ακολουθεί την κανονική κατανομή όταν το μέγεθος του δείγματος είναι μεγάλο. Όταν όμως αυτό δεν συμβαίνει, τότε τα αποτελέσματα των ελέγχων δεν είναι έγκυρα. Σε αυτές τις περιπτώσεις πιο κατάλληλοι είναι οι λεγόμενοι απαραμετρικοί έλεγχοι. Είναι εκτός των στόχων της παρούσης να αναλυθούν και οι απαραμετρικοί έλεγχοι.... Περίπτωση Α. Στην περίπτωση αυτή η διακύμανση σ είναι γνωστή. Υπό αυτές τις συνθήκες η κατανομή της στατιστικής ελέγχου είναι η τυπική κανονική κατανομή. Το z α είναι το ( α) εκατοστημόριο της τυπικής κανονικής κατανομής, δηλαδή Ρ(Χ> z α ) α. Σημειώστε ότι η φορά της ανισότητας του κανόνα απόρριψης ακολουθεί τη φορά της ανισότητας της εναλλακτικής υπόθεσης, όταν ο έλεγχος είναι μονόπλευρος. Στους αμφίπλευρους ελέγχους είναι πάντοτε «>» και αναφέρεται στην απόλυτη τιμή της στατιστικής ελέγχου. Η παρατήρηση αυτή ισχύει σε όλες τις περιπτώσεις που ακολουθούν. Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : μ μ Η : μ > μ Η : μ μ Η : μ < μ T - m s Τ > z α Τ < z α Η : μ μ Η : μ ¹ μ Τ > z α/... Περίπτωση Β. Στην περίπτωση αυτή η διακύμανση σ είναι άγνωστη. Υπό αυτές τις συνθήκες η κατανομή της στατιστικής ελέγχου είναι η κατανομή του Studt με - βαθμούς ελευθερίας. Το t -,α είναι το (-α) εκατοστημόριο της κατανομής του Studt με - Pag 6 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

βαθμούς ελευθερίας, δηλαδή Ρ(Χ>t,α,) α. Το S ( - ) -, είναι η δειγματική τυπική απόκλιση. Όταν το μέγεθος του δείγματος είναι μεγαλύτερο του ή ίσο με 3 είναι δυνατόν να χρησιμοποιηθούν τα εκατοστημόρια της τυπικής κανονικής κατανομής στη θέση των αντιστοίχων της κατανομής του Studt. Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : μ μ Η : μ > μ Τ > t -,α Η : μ μ - m T Η : μ < μ S Τ < t -,α Η : μ μ Η : μ ¹ μ Τ > t -,α/... Παράδειγμα: Έστω δέκα παρατηρήσεις που παριστάνουν χρόνους ολοκλήρωσης μιας διαδικασίας ελέγχου (σε λεπτά):, 35,, 8, 4,,, 45,, 8. Μας ενδιαφέρει να ελέγξουμε αν (κατά μέσο όρο) η διαδικασία δεν υπερβαίνει τα 4 λεπτά. Διατυπώνουμε την υπόθεση Η : μ 4 με εναλλακτική την Η : μ < 4. Αφού το είναι μικρότερο από 3 και η διακύμανση είναι άγνωστη η στατιστική ελέγχου -4 T, ακολουθεί την κατανομή του S Studt με 9 βαθμούς ελευθερίας και ο κανόνας απόρριψης (μονόπλευρος έλεγχος) είναι: «απορρίπτουμε την Η όταν Τ < t -,α.». Υπολογίζουμε 4, S,8. Οπότε (μετά από τις κατάλληλες πράξεις), Τ 3.6 <,833 t -,α.. Άρα απορρίπτουμε την Η και καταλήγουμε ότι όντως ο μέσος χρόνος ελέγχου είναι μικρότερος από 4 λεπτά..3. ΕΛΕΓΧΟΙ ΓΙΑ ΤΗΝ ΙΣΟΤΗΤΑ ΜΕΣΩΝ ΤΙΜΩΝ. Το πρόβλημα αναφέρεται στην περίπτωση όπου ενδιαφέρει η ισότητα των μέσων τιμών μιας μεταβλητής σε δύο διαφορετικούς πληθυσμούς. Στην πράξη μπορεί να αναφέρεται, παραδείγματος χάριν, στην περίπτωση που μας ενδιαφέρει η διαφορά (βελτίωση) των τιμών της μεταβλητής με τη εφαρμογή μιας νέας μεθόδου παραγωγής. Η κανονική κατανομή των παρατηρήσεων των δύο δειγμάτων αποτελεί και πάλι βασική προϋπόθεση για την εφαρμογή Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 7 of 7

των τύπων που ακολουθούν. Γενικά και εδώ ισχύουν ως προϋποθέσεις, όσα αναφέρονται της παράγραφο...3..περίπτωση Α. Στην περίπτωση αυτή οι διακυμάνσεις των δύο δειγμάτων σ, σ είναι γνωστές και ίσες (σ σ σ ). Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : μ μ Τ > z Η : μ μ > α - Η : μ μ T Τ < z Η : μ μ < s + α Η : μ μ Τ > z Η : μ μ ¹ α/.3.. Περίπτωση Β. Στην περίπτωση αυτή οι διακυμάνσεις των δύο δειγμάτων είναι άγνωστες, αλλά ίσες. Τότε με ( -) S + ( -) S S p και t + -, a το (-α)% εκατοστημόριο της κατανομής + - του Studt με ( + ) βαθμούς ελευθερίας, δηλαδή Ρ(Χ> t + -, a) α, έχουμε: Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : μ μ Η : μ μ > Τ > t + -, a - Η : μ μ T Η : μ μ < Τ < t S p + + -, a Η : μ μ Η : μ μ ¹ Τ > t + -, a.3... Παράδειγμα: Έστω είκοσι παρατηρήσεις (σε δύο ομάδες των δέκα) που παριστάνουν χρόνους ολοκλήρωσης μιας διαδικασίας σε δυο διαφορετικά υποκαταστήματα μιας τράπεζας (σε λεπτά): Υποκατάστημα Α:, 35,, 8, 4,,, 45,, 8. Υποκατάστημα Β:, 5,, 9, 3,,, 5,,. Μας ενδιαφέρει να ελέγξουμε αν (κατά μέσο όρο) το Υποκατάστημα Β έχει μικρότερους χρόνους ολοκλήρωσης από το Α. Διατυπώνουμε την υπόθεση Η : μ Α μ Β με εναλλακτική την Η : μ Α μ Β > (αν το Β έχει μικρότερο χρόνο ολοκλήρωσης η διαφορά μ Α μ Β θα είναι θετική). Αφού το είναι μικρότερο από 3 Pag 8 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

και οι διακυμάνσεις είναι άγνωστες, αλλά ίσες, η στατιστική ελέγχου T S - +, με S ( -) S + ( -) S + -, ακολουθεί την κατανομή του Studt με + 8 βαθμούς ελευθερίας και ο κανόνας απόρριψης είναι: «απορρίπτουμε την Η όταν Τ > t,5, 8». Υπολογίζουμε 4, A B, S 8,6. Οπότε (μετά από τις κατάλληλες πράξεις), Τ,4 <,734,, 5 Άρα δεν μπορούμε να απορρίψουμε την Η και καταλήγουμε ότι ο μέσος χρόνος ολοκλήρωσης της διαδικασίας στο υποκατάστημα Β δεν είναι μικρότερος του αντίστοιχου χρόνου στο Α..3.3.Περίπτωση Γ (Πρόβλημα Bhrs-Fshr). Στην περίπτωση αυτή οι διακυμάνσεις των δύο δειγμάτων είναι άγνωστες, αλλά άνισες. - é c ( - c) ù s Τότε με ê + ú όπου c καιt, a το (-α)% ë - - û s + s εκατοστημόριο της κατανομής του Studt με ν βαθμούς ελευθερίας, δηλαδή Ρ(Χ> t, a) α, έχουμε: Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : μ μ Η : μ μ > Η : μ μ Η : μ μ < Η : μ μ Η : μ μ ¹ T s - + s T>t, a T< -t, a T >t,a/ Επειδή οι βαθμοί ελευθερίας είναι κλασματικοί, η λύση αυτού του προβλήματος μπορεί να γίνει μόνον μέσω στατιστικών προγραμμάτων σε Η/Υ. Όταν + > 3,τότε στους ανωτέρω τύπους τα εκατοστημόρια της κατανομής του Studt μπορούν να αντικατασταθούν με τα αντίστοιχα της τυπικής κανονικής κατανομής και το πρόβλημα επιλύεται χωρίς την ανάγκη Η/Υ..4. ΕΛΕΓΧΟΣ ΓΙΑ ΠΟΣΟΣΤΑ. Το πρόβλημα αναφέρεται στην περίπτωση όπου ενδιαφέρει η ισότητα της τιμής του ποσοστού εμφάνισης ενός χαρακτηριστικού με μια προκαθορισμένη τιμή. Παραδείγματος χάριν το ποσοστό δυσαρεστημένων πελατών μιας επιχείρησης, να είναι μικρότερο από t 8 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 9 of 7

κάποια τιμή p. Όταν το μέγεθος του δείγματος είναι μεγάλο (>5), τότε είναι δυνατόν ο έλεγχος να πραγματοποιηθεί με τη βοήθεια της τυπικής κανονικής κατανομής. Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : p p Η : p > p Η : p p Η : p < p Η : p p Η : p ¹ p T x - p ( - p ) p Τ > z α Τ < z α Τ > z α/ Pag of 7.5. ΕΛΕΓΧΟΙ ΓΙΑ ΤΗΝ ΙΣΟΤΗΤΑ ΠΟΣΟΣΤΩΝ. Το πρόβλημα αναφέρεται στην περίπτωση όπου ενδιαφέρει η διαφορά της τιμής των ποσοστών εμφάνισης ενός χαρακτηριστικού μεταξύ δυο πληθυσμών. Παραδείγματος χάριν το ποσοστό δυσαρεστημένων πελατών μιας επιχείρησης Α, να είναι μικρότερο από το ποσοστό δυσαρεστημένων πελατών μιας άλλης επιχείρησης Β. Όταν το μέγεθος των δειγμάτων είναι μεγάλο (>5), τότε είναι δυνατόν ο έλεγχος να πραγματοποιηθεί με τη βοήθεια της τυπικής κανονικής κατανομής. Με pˆ x, όπου x, x οι παρατηρήσεις που εκφράζουν το χαρακτηριστικό στο δείγμα και αντίστοιχα, και, τα μεγέθη των δειγμάτων από καθέναν από τους δυο πληθυσμούς, έχουμε: Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : p p Η : p p > Η : p p Η : p p < Η : p p Η : p p ¹ x - æ pˆ( - pˆ) ç è.6. ΕΛΕΓΧΟΣ ΓΙΑ ΤΗ ΔΙΑΚΥΜΑΝΣΗ. T x + + + x ö ø Τ > z α Τ < z α Τ > z α/ Το πρόβλημα αναφέρεται στην περίπτωση όπου ενδιαφέρει η ισότητα της τιμής της διακύμανσης με μια προκαθορισμένη τιμή. Παραδείγματος χάριν η διακύμανση των τιμών κάποιας μεταβλητής, να είναι μικρότερη από κάποια τιμή σ. Ο έλεγχος πραγματοποιείται με τη βοήθεια της κατανομής χ. Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

Υποθέσεις Στατιστική ελέγχου Κανόνας απόρριψης Η : σ σ Η : σ > σ Η : σ σ Η : σ < σ T ( -) S s Τ > Τ < c -, a c -,-a Η : σ σ Η : σ ¹ σ Τ > c -, a ή Τ < c -,- a.7. ΕΛΕΓΧΟΣ ΓΙΑ ΤΗΝ ΙΣΟΤΗΤΑ ΔΙΑΚΥΜΑΝΣΕΩΝ. Το πρόβλημα αναφέρεται στην περίπτωση όπου ενδιαφέρει η ισότητα ή μη, των διακυμάνσεων μεταξύ δυο πληθυσμών. Βασική χρήση του ελέγχου είναι όταν ενδιαφέρει η ισότητα μέσων τιμών και πρέπει να εκτιμηθεί αν η κατανομή της διαφοράς είναι κανονική (ίσες διακυμάνσεις) ή Studt s t άνισες διακυμάνσεις). Ο έλεγχος πραγματοποιείται με τη βοήθεια της κατανομής F. Στατιστική Υποθέσεις Κανόνας απόρριψης ελέγχου Η : σ σ Η : σ > σ F > U f -, -, a Η : σ σ Η : σ < σ Η : σ σ Η : σ ¹ σ F S S F < f L -, -, a f U -, -, a L F < f -, -, ή a U F > f -, -, a Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag of 7

3. ΛΥΜΕΝΕΣ ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ ΣΤΗΝ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ 3.. Η δομή της οδοντοστοιχίας προσφέρει αποτελεσματικό κριτήριο για την ταξινόμηση απολιθωμάτων. Προ καιρού, ανακαλύφθηκε το κρανίο ενός μπαμπουΐνου άγνωστης προέλευσης, σε ένα σπήλαιο στην Αγκόλα. Το μήκος του τρίτου τραπεζίτη ήταν 9 mm. Υπήρξαν θεωρίες ότι ο συγκεκριμένος μπαμπουΐνος ήταν ο «χαμένος κρίκος» και ανήκε στο γένος Papo. Μέλη του γένους αυτού έχουν τρίτους τραπεζίτες μήκους, κατά μέσον όρο 8.8 mm με τυπική απόκλιση.47 mm. Σχολιάστε την σημαντικότητα του τραπεζίτη με μήκος 9 mm. Τι μπορείτε να σχολιάσετε για την καταγωγή του μπαμπουΐνου; Λύση: Έστω Χ το μήκος του τραπεζίτη. Θεωρούμε ότι η Χ είναι μια τυχαία μεταβλητή που ακολουθεί την κανονική κατανομή. Τότε: 9-8.8 P( ³ 9) P( Z ³ ) P( Z ³.745) - G(.745) -. 9675.35.47 Η εν λόγω πιθανότητα είναι πολύ μικρή και συνεπώς τίθεται εν αμφιβόλω η θεωρία περί «χαμένου κρίκου». Άρα ο μπαμπουΐνος δεν φαίνεται να ανήκει στο γένος Papo. 3.. Ένας καθηγητής Χημείας διδάσκει μεγάλη τάξη πρωτοετών. Για τη βαθμολογία των διαγωνισμάτων χρησιμοποιεί τυποποιημένη βαθμολογία που από πείρα γνωρίζει ότι ακολουθεί κανονική κατανομή με μέση τιμή m 7 και τυπική απόκλιση s. Στόχος του είναι να τυποποιήσει τους βαθμούς κατά τέτοιον τρόπο ώστε η κατανομή της βαθμολογίας να έχει τα ακόλουθα ποσοστά: 4% Α, % Β, 3% C, % D και 4% F. Πιο πρέπει να είναι το όριο μεταξύ Α και Β, και πιο μεταξύ Β και C; Pag of 7 Λύση: Έστω Χ ο βαθμός του διαγωνίσματος. Τότε συμβολίζοντας το κάτω όριο του Α με A επιθυμούμε: Α) P( ).4 Û P( Z > Z ).4 Û Z.8. Αλλά > A A A A - 7 Z A Û A Z A + 7.8 + 7 8.96 @ 83. Δηλαδή το όριο μεταξύ Α και Β πρέπει να είναι το 83. Β) συμβολίζοντας το κάτω όριο του Β με B : Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

P( B Û P( Z Z 83). Û P( 83) - P( B B ). Û P( ) P( 83) -. 83-7 ) P( Z ) -. P( Z.8) -..88-..68Û Z B B.47 Αλλά: B B Z + 7.47 + 7 75.64 @ 76. Άρα το Β κυμαίνεται μεταξύ 76 και 83. Δηλαδή το όριο μεταξύ Β και C πρέπει να είναι το 76. 3.3. Υποθέσατε ότι ο ετήσιος αριθμός σεισμών έντασης μεγαλύτερης των,5 Ρίχτερ που έχουν επίκεντρο μέχρι 4 χιλιόμετρα από το κέντρο των Αθηνών, είναι κατά μέσον όρο 6,5. Υπολογίστε την πιθανότητα να έχουμε το περισσότερους από 8 τέτοιους σεισμούς με δύο τρόπους και συγκρίνετε τα αποτελέσματα. Λύση: Έστω Χ ο ετήσιος αριθμός των σεισμών. Το Χ ακολουθεί την κατανομή Posso με παράμετρο λ6,5. Η ζητούμενη πιθανότητα, P ( ³ 9), μπορεί να υπολογιστεί είτε προσεγγιστικά μέσω της κανονικής κατανομής με μ6,5 και σ 6,5, είτε ακριβώς μέσω της Posso. Α) κανονική κατανομή (με διόρθωση συνέχειας): 8,5-6,5 P( ³ 9) P( ³ 8,5) P( Z ³ ) P( Z ³,784) - P( Z,784) 6,5 -,7838,6 Β) Posso: P( ³ 9) - P( 8) - ( P( ) + P( + P( 4) + P( 5) + P( 6) + P( ) + P( ) + P( 7) + P( 8)) æ -6,5-6,5-6,5-6,5 3-6,5 ç 6,5 6,5 6,5 6,5 6,5 - + + + + è!!! 3! 4! 3) + æ -6,5 5-6,5 6-6,5 7-6,5 8 ö ç 6,5 6,5 6,5 6,5 - + + + è 5! 6! 7! 8! ø - (,5 +,98 +,38 +,688 +,8 +,454 +,575 +,46 +,88) -,796,84. 4 ö - ø Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 3 of 7

ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ. ΕΙΣΑΓΩΓΗ Πρότυπο: Y b + b + () Παρατηρήσεις ( ), Y στο πρότυπο () Y b + b + Υποθέσεις α) E( ),,,...,. Η παραβίαση αυτής της υπόθεσης καλείται σφάλμα εξειδίκευσης. β) Var( ) s,,,...,. Η παραβίαση αυτής της υπόθεσης καλείται ετεροσκεδαστικότητα. γ) Cov(, ), ¹ j. Μια μορφή παραβίασης αυτής της j υπόθεσης καλείται αυτοσυσχέτιση. δ) Η τυχαία μεταβλητή είναι μη στοχαστική. Η υπόθεση α) οδηγεί στην E( Y) b + b Η υπόθεση β) οδηγεί στην VarY ( ) s Η υπόθεση γ) οδηγεί στην Cov( Y, Y ), ¹ j j Pag 4 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

. ΜΕΘΟΔΟΣ ΕΛΕΧΙΣΤΩΝ ΤΕΤΡΑΓΩΝΩΝ ˆ - - - D( b, b ) ( Y Y) ( Y b b ) ( ˆ b, ˆ b ) argm D( b, b ) Ελαχιστοποίηση της D( b, b) ως προς b, b b και b Κανονικές Εξισώσεις D( b, b ) b D( b, b ) b b + b Û Y Y b + b Εκτιμήτριες Ελαχίστων Τετραγώνων bˆ Y -bˆ Y - Y ( - )( Y -Y) ( - ) Y ˆ b - ( -) ( -) wy w ( - ), όπου S ( ) και S - S S -. - - x ( ) Οι συντελεστές στάθμισης w και w w ικανοποιούν τις σχέσεις Επίσης, Sxy ( -)( Y -Y), S ( Y -Y) yy και S y S yy - Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 5 of 7

3. ΙΔΙΟΤΗΤΕΣ ΕΚΤΙΜΗΤΡΙΩΝ ΕΛΑΧΙΣΤΩΝ ΤΕΤΡΑΓΩΝΩΝ E( bˆ ) E( wy) wey ( ). Όμως E( Y ) b + b Αμεροληψία E( bˆ ) b w + b w b, αφού w και w bˆ Y - bˆ b + b + ( / ) - bˆ b + ( b - bˆ ) + E( $ b ) b + E( ) b + E( ) b Διακύμανση ( ˆ b) ( ) var( ) Var Var wy w Y Όμως Var( Y) Var( ) s ˆ s Var( b) s S w ˆ ˆ ˆ s s Var( b) Var( Y ) + x Var( b) - xcov( Y, b) + s æ ö + S ç S è ø Cov( bˆ, bˆ ) Cov( Y - bˆ, ˆ b ) Cov( Y, bˆ )- Cov( bˆ, bˆ ) Συγκεκριμένα ˆ s - Var( b) - διότι CovY ˆ S b (, ) ˆ æ ö s Cov( Y, b) Cov ç Y, wy wvar( Y ) w è. ø Pag 6 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

Αποτελεσματικότητα (Θεώρημα Gauss-Markov) Έστω κάποια άλλη γραμμική εκτιμήτρια b % του b. Αυτή γράφεται υπό την μορφή: b% wy %, w~ w + d, " Επειδή η b % είναι αμερόληπτη πρέπει να ισχύει E ( b ) %. b Έτσι E( % b) wey % ( ) b w % + b w % άρα πρέπει Όμως % ( ) w Û w + d Û d w% Û w + d Û d w%, w % Η διακύμανση της b % υπολογίζεται ως Var( % b ) s w% s ( w + d ) æ ö æ ö ç ç è ø è ø s w + d + wd s w + d ³ Var( ˆ b ) Επειδή - wd ( - ) d / S ( S ) ç d - d. æ è ö ø Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 7 of 7

Pag 8 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

4. ΠΟΙΟΤΗΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ SST SSR + SSE SST ( Y -Y) Συνολική μεταβλητότητα ˆ ( - ) SSR Y Y Ερμηνευόμενη μεταβλητότητα ˆ ( - ) SSE Y Y Ανερμήνευτη μεταβλητότητα R SSR b S $ SST S yy, ( ) ( ˆ ) æ ˆ ˆ ˆ ˆ ö ˆ ˆ ç b b b b b b è ø SSR Y - Y + - - - S ( ) και S - SST S ( Y -Y) yy Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 9 of 7

5. ΕΚΤΙΜΗΣΗ ΤΗΣ ΔΙΑΚΥΜΑΝΣΗΣ ΤΩΝ ΣΦΑΛΜΑΤΩΝ s Var( ) E( )- E ( ) E( ) ˆ ˆ yy b b SSE S - S Y -Y - S ˆ ˆ b b E( SSE) E( Y -Y - S ) E( Y )-E( Y )-S E( ) é s ù æ s ö [ s + ( b+ b ) ]- ê +( b+ b) ú- S + b ê ú ç S ë û è ø ( - ) s + [( b + b ) -( b + b ) -b ( -)] ( -) s Αμερόληπτη Εκτιμήτρια SSE sˆ - - Σημείωση: ( ) ( ) + ( ( ) ) s + ( b+ b ) s ( ) ( ) + ( ) + b+ b E Y Var Y E Y ( ) ( ) ˆ ˆ ˆ s ( b ) ( b) + æ ( b ö ç ) + b EY VarY EY E Var E è ø S Pag of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

6. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΛΟΥ ΓΡΑΜΜΙΚΟΥ ΥΠΟΔΕΙΓΜΑΤΟΣ Υπόθεση: Τα σφάλματα ακολουθουν την κανονική κατανομή :, s N ( ) t bˆ -b ˆ b -b ~ t sˆ ˆ sˆ / S - b Διάστημα Εμπιστοσύνης bˆ mt sˆ bˆ mt -, a/ ˆ b -, a/ sˆ S Η : Η παλινδρόμηση δεν είναι στατιστικά σημαντική Û b Η : Η παλινδρόμηση είναι στατιστικά σημαντική Û b ¹ Κρίσιμη Περιοχή Ελέγχου bˆ -b t ³ t a sˆ ˆ b -, / Εναλλακτικά ο ίδιος έλεγχος μπορεί να γίνει με τη χρήση της F R ( - R ) ( - ) η οποία όταν N(, s ) F - : ακολουθεί την, F³ F - Συνεπώς, απορρίπτουμε την Η αν,, a Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag of 7

7. ΠΡΟΒΛΕΨΗ Πρόβλεψη για την Μέση Τιμή Y b + b + E( Y ) b + b Yˆ ˆ b ˆ + b με EY ( ˆ ) EY ( ) VarY ( ˆ ˆ - EY ( )) VarY ( ) ˆ Var( b ) + Var( bˆ ) + Cov( bˆ, bˆ ) από τις σχέσεις της σελ. 6 προκύπτει ότι ( ) s æ - + ö ç S è ø Το Διάστημα Πρόβλεψης για την μέση τιμή EY ( ) είναι Yˆ mt sˆ -, a/ ( -) + S Πρόβλεψη για την Εξειδικευμένη Τιμή Y Yˆ ˆ b + ˆ b Var( Yˆ - Y) Var( Yˆ ˆ ˆ - ) Var( Y) + Var( ) - Cov( Y, ) Var( Yˆ ) + Var( ) ( ) s æ - + + ö ç S è ø Το Διάστημα Πρόβλεψης για την εξειδικευμένη τιμή Y είναι Yˆ mt s ˆ -, a/ ( -) + + S Pag of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

ΑΣΚΗΣΗ Το κόστος κατασκευής εξαρτάται από το μέγεθος του αντικειμένου σύμφωνα με το πρότυπο: Y + +. Με βάση τα παρακάτω δεδομένα: b b Χ: μέγεθος 3 4 5 6 7 8 9 Υ: κόστος.5 5. 7.5 9. 9.5 3. 4. 5.5 8.5.. Να υπολογιστούν οι συντελεστές ελαχίστων τετραγώνων bˆ ˆ, b.. Να υπολογισθεί και ερμηνευθεί ο συντελεστής προσδιορισμού και να ελεγχθεί η στατιστική σημαντικότητα της παλινδρόμησης. Επίπεδο σημαντικότητας a.5. 3. Να ελεγχθεί η στατιστική σημαντικότητα της παλινδρόνησης με βάση την τιμή b ˆ. Επίπεδο σημαντικότητας a.5. 4. Να ελεγχθεί η στατιστική σημαντικότητα της παλινδρόμησης με την χρήση του πίνακα ανάλυσης διακύμανσης. Επίπεδο σημαντικότητας a.5. 5. Να κατασκευασθεί διάστημα εμπιστοσύνης 95% του προβλεπόμενου μέσου κόστους για μέγεθος αντικειμένου 45. 6. Να κατασκευασθεί διάστημα εμπιστοσύνης 95% της προβλεπόμενης τιμής του κόστους για μέγεθος αντικειμένου 45. Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 3 of 7

ΛΥΣΗ Πριν προχωρήσουμε στην απάντηση των 6 ερωτήσεων χρειαζόμαστε τους ακόλουθους υπολογισμούς: Χ: μέγεθος Υ: κόστος Y Y.5 6.5 5 5. 4 5. 3 7.5 9 56.5 5 4 9. 6 8. 36 5 9.5 5 9.5 475 6 3. 36 69. 78 7 4. 49 96. 98 8 5.5 64 4.5 4 9 8.5 8 34.5 665. 4. Σύνολα: 55 4.5 385 66.5 785 Είναι:, 55, Y.45, ( ), S - - 85 ( ) SST Y - Y 95.5. Απάντηση. Y-Y Y-Y 785-55.45 55.5 ˆ b S - 85 85.88 b ˆ Y - ˆ b.45 -.88 55. Pag 4 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

Απάντηση. R SSR b S ( ) ˆ.88 85 9.5.9896 SST SST 95.5 95.5 Άρα το 98.96% της μεταβλητικότητας στο Y (κόστος) ερμηνεύεται από την μεταβλητικότητα του (μεγέθους). F R.9896 76.63.4 8 ( - R ) ( - ) F 76.63 > F 5.3, άρα η μηδενική υπόθεση b απορρίπτεται και b ¹, δηλαδή η παλινδρόμηση είναι στατιστικά σημαντική. Είναι, 8,.5 δεχόμαστε ότι Απάντηση 3. Η : b έναντι της εναλλακτικής Η : b ¹ T bˆ ˆ b sˆ sˆ / S ˆ b Η μηδενική υπόθεση απορρίπτεται όταν: T ³ t-, a/. Όμως: SSE SST æ SSR ö SST sˆ ( SST SSR) ( R - ç - - ) - - -è SST ø - Þ sˆ -.9896.384 8 95.5 ( ) Þ T ˆ b.88 sˆ / S.384 85 7.58 T 7.58 ³ t.36 απορρίπτουμε τη μηδενική υπόθεση, δηλαδή συμπεραίνουμε Επειδή 8,.5 ότι υπάρχει γραμμική εξάρτηση μεταξύ (μεγέθους) και Y (κόστος). Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 5 of 7

Απάντηση 4. Πηγή Μεταβλητότητας Άθροισμα Τετραγώνων Βαθμοί Ελευθερίας Μέσο Άθροισμα Τετεραγώνων Παλινδρόμηση SSR 9.5 9.5 Υπόλοιπα SSE 3.73-8 3.73 8.384 Στατιστική F 9.5 F 76.63.384 Σύνολο SST 95.5-9 Όπου SSR b ˆ S (.88) 85 9.5 ( ) SST Y - Y S yy 95.5 F 76.63 > F 5.3 απορρίπτεται η μηδενική υπόθεση ότι b Επειδή,8,.5 απορρίπτεται και γίνεται δεκτή η εναλλακτική. Απάντηση 5. Yˆ bˆ + ˆ b.+.88. Είναι: Συνεπώς για 45 έχουμε Y ˆ 9.57 ως προβλεπόμενο μέσο κόστος. Άρα για t-, a/ t8,.5.36 έχουμε το 95% διάστημα εμπιστοσύνης: y - h< E( Y ) < yˆ + h, EY ( ) EY ( ) ˆ f f Όπου h ( - ) ( 45-55) sˆ t-, a/ S 85 +.69 +.36.4547 Άρα το 95% διάστημα εμπιστοσύνης για την προβλεπόμενη μέση τιμή του κόστους σε επίπεδο μεγέθους 45 είναι: ( ) ( ) 9.57 -.4547 < EY < 9.57 +.4547 Þ 9.5 < EY <.5 Pag 6 of 7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ

Απάντηση 6. Το 95% διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή του κόστους για 45 είναι: Y ˆ - h< Y < Y ˆ + h, Όπου h ( - ) ( 45-55) sˆ t-, a/ S 85 + +.69 + +.36.5 Άρα το 95% διάστημα εμπιστοσύνης για την προβλεπόμενη εξειδικευμένη τιμή του κόστους σε επίπεδο μεγέθους 45 είναι: 9.57 -.5 < Y < 9.57 +.5 Þ 8.7 < Y <.7 Σ. Μεϊντάνης, Ι.Κ. Μπασιάκος, Κ. Φραγκιαδάκης: Σημειώσεις Στατιστικής ΙΙ Pag 7 of 7