Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον τρόπο της δειγματοληψίας που επιλέξαμε το δείγμα μας με βάση την διάταξη και την δυνατότητα συνδυασμών των κελιών. Επομένως μπορούμε να έχουμε. Μοναδιαίους πίνακες (μόνο γραμμές) E. Πίνακες συνάφειας (συνδυαζόμενες γραμμές και στήλες) 3. Ανεξάρτητους μονοδιάστατους πίνακες (ανεξάρτητες γραμμές) Ανάλογα με τα παραπάνω σχήματα δειγματοληψίας έχουμε και τα αντίστοιχα μοντέλα
Δειγματοληψία Posso Παρατηρούμε ανεξάρτητες τ.μ. με κατανομή Posso και οι τιμές που παίρνουν οι τ.μ. Επομένως έχουμε μοντελοποίηση μονοδιάστατου πίνακα με μορφή Μεταβλητές Υ Υ Χ Μεταβλητή Χ Χ Χ3 3 3 : : συχνότητες Μεταβλητή Χ 3 Μετατροπή δισδιάστατου σε μονοδιάστατο πίνακα 3
Πολυωνυμική Δειγματοληψία Παίρνουμε τυχαία άτομα και για το καθένα καταγράφουμε σε ποια κατηγορία Χ, Χ,, Χ I, και Υ, Υ,, Υ J, ανήκουν. Έτσι είναι το πλήθος των ατόμων στο κελί (Χ I, Υ J ) Επομένως έχουμε μοντελοποίηση πίνακα διπλής εισόδου με μορφή Συνδιασμός (Χ I, Υ J ) Μεταβλητές Υ Υ Χ Χ Χ3 3 3
Ανεξάρτητη Πολυωνυμική Παίρνουμε τ.δ. μεγέθους. από την κατηγορία Χ, τ.δ. μεγέθους. από την κατηγορία Χ,, και μετράμε σε κάθε κατηγορία πόσα άτομα ανήκουν στην Υ, Υ,, Υ J, και έτσι έχουμε πίνακα συνάφειας (ΙxJ). Επομένως έχουμε μοντελοποίηση ανεξάρτητων μονοδιάστατων πινάκων με μορφή Μεταβλητές Υ Υ ανεξάρτητα Χ Χ Χ3 3 3
Σχέση Πολυωνυμικής και Posso Δειγματοληψίας Ένα Posso μοντέλο δειγματοληψίας θεωρεί τις μετρήσεις Υ, ανεξάρτητες τ.μ. με μέσο μ. Η από κοινού σ.π.π. των πιθανών αποτελεσμάτων ισούται με το γινόμενο των πιθανοτήτων P(Υ = ) για τα κελιά (I,J) που ακολουθούν κατανομή Posso με P Y e j!
Σχέση Πολυωνυμικής και Posso Δειγματοληψίας Όταν το μέγεθος του δείγματος είναι γνωστό αλλά τα αθροίσματα (γραμμών ή στηλών) άγνωστα τότε πολυωνυμικό μοντέλο δειγματοληψίας εφαρμόζεται. Τα κελιά (I,J) είναι τα πιθανά αποτελέσματα με σ.π.π. να ισούται με..! j
Σχέση Πολυωνυμικής και Posso Δειγματοληψίας Ας υποθέσουμε ότι σε κάθε επίπεδο της Χ, έστω Χ =, διαθέτουμε, παρατηρήσεις. Έστω επίσης ότι οι μετρήσεις της Υ σε ένα επίπεδο της Χ είναι ανεξάρτητες από αυτές σε ένα άλλο επίπεδο της Χ, έχοντας συνάρτηση πυκνότητας πιθανότητας (π,..., π J ). Τότε για κάθε γραμμή έχουμε ένα διαφορετικό πολυωνυμικό πείραμα. Οι μετρήσεις, j =,..., J έχουν την πολυωνυμική κατανομή:.! j! j Όταν τα δείγματα σε διαφορετικές τιμές της Χ είναι ανεξάρτητα τότε η από κοινού κατανομή για ολόκληρο το δείγμα είναι το γινόμενο των πολυωνυμικών κατανομών. Η δειγματοληψία αναφέρεται σαν ανεξάρτητη πολυωνυμική ή και γινόμενο πολυωνυμικής δειγματοληψίας. j
Πρόταση Αν έχουμε δειγματοληψία Posso με e f! τότε η δεσμευμένη κατανομή των όταν πολυωνυμική με f!! E και σ.π.π. είναι
Απόδειξη Γνωρίζουμε ότι e e f f f!!!!
Με τελική μορφή Απόδειξη f αφού άθροισμα ανεξάρτητων Posso είναι Posso με!! f ~ Pos Pos Οι πιθανότητες π της πολυωνυμικής είναι
Πρόταση Αν το τυχαίο δείγμα =(,,, ) ακολουθεί πολυωνυμική κατανομή με παραμέτρους, p, p,, p τότε η στατιστική συνάρτηση X * E E ή ή E ή ακολουθεί ασυμπτωτικά ( ) την x κατανομή με κ- βαθμούς ελευθερίας E
Θεώρημα Έστω τυχαίο δείγμα =(,,, ) ακολουθεί πολυωνυμική κατανομή με παραμέτρους, π, π,, π. Έστω η μηδενική υπόθεση ότι σε μια πολυωνυμική κατανομή με κ- κελιά οι παράμετροι π παίρνουν συγκεκριμένες τιμές αλλά άγνωστες. Αν η Η 0 είναι αληθής τότε οι αναμενόμενες τιμές σε κάθε ένα κελί από τα κ θα ισούται με e. Τότε η στατιστική συνάρτηση X * ~ x ακολουθεί ασυμπτωτικά ( ) την x κατανομή με κ- βαθμούς ελευθερίας Τεστ καλής προσαρμογής
Άσκηση Ζάρι το ρίχνουμε 60 φορές και παίρνουμε τα παρακάτω αποτελέσματα Αποτελέσματα 3 4 5 6 Η 0 είναι,,...,6 6 Αναμενόμενες συχνότητες e Έλεγχος συχνότητα 3 9 8 5 4 60 0 6 Αποτελέσματα 3 4 5 6 συχνότητα 3 9 8 5 4 Αναμενόμενες 0 0 0 0 0 0
Άσκηση 30 9 0 4 0 X*... 5.5 0 0 0 Από τους πίνακες της x κατανομή με κ- β.ε (κ-=5) έχουμε x 5,0.05. αποδέχομαι 5.5>. άρα απορρίπτω την Η 0 απορρίπτω. 5.5
Θεώρημα Έστω τυχαίο δείγμα =(,,, ). Για μεγάλο ( ) εφόσον ισχύει η αρχική υπόθεση Η 0 η στατιστική συνάρτηση όπου m= από εκθετική ή m= από κανονική * ~ m x X
Απόδειξη X *
Άσκηση Έχουμε Ώρες λειτουργίας 0-5 5-30 30-45 45-50 τρανζίστορ 50 55 3 Τα δεδομένα προέρχονται από εκθετική κατανομή? Εκθετική κατανομή: f x e x, 0
Απάντηση Η παράμετρος λ της εκθετικής είναι άγνωστη. Θα πρέπει να υπολογισθεί από τον υπολογισμό του μέσου: 0 xe x dx x f x 50*7.5.5*35 37.5* 3 0 0 50* Μέσος διαστήματος 0.0457 x
Απάντηση Η αθροιστική συνάρτηση F(x) δίνεται από τον τύπο: Άρα έχουμε F x F x e e x x e 0.0457x Οι θεωρητικές πιθανότητες εκτιμούνται από: p p p p 3 4 P P P 0 X 5 F5 5 X 30 F30 F5 30 X 45 F45 F30 p p p 3 0.8 e 0.0457*5 0.49 0.496 0.6
Απάντηση Επομένως οι θεωρητικές παρατηρήσεις δίνονται από την σχέση: x p 0*0.496 59.5 Ώρες λειτουργίας 0-5 5-30 30-45 45-50 τρανζίστορ 50 55 3 Θεωρητικές 59.5 9.98 5. 5.37 50 59.5 5.37 X*... 0 0 7. Με βάση την διαπίστωση ότι η εκθετική κατανομή έχει μια παράμετρο, οι βαθμοί ελευθερίας γίνονται κ--m=4--= x 0.59 7.<0.59 άρα αποδέχομαι την Η 0,0.05
Άσκηση Το πλήθος των οχημάτων που θέλει να στρίψει αριστερά σε φανάρι καταμετριέται 0 φορές με Πλήθος οχημάτων 0 3 4 συχνότητες 30 3 46 0 Μπορούμε να ισχυριστούμε ότι η παραπάνω εμπειρική κατανομή προέρχεται από πληθυσμό που ακολουθεί την Posso?
Απάντηση Έχουμε Η 0 : πληθυσμός ~ Posso Η : πληθυσμός διάφορη από Posso Η σ.π.π. της Posso κατανομής δίνεται από την σχέση Πλήθος οχημάτων P X x e x x! 0 3 4 συχνότητες 30 3 46 0 Πιθανότητες 0.5 0.35 0.3 0.55
Απάντηση 35. 4*... 0*30 0 x x X E 0.55 0.36.35 0.35* 0.35.35 0.59* 0.59 0!! 0 3 3 0.35 0 p p p p X P p X P p e x e X P p x x x X P x X P Αναγωγική σχέση
Απάντηση X * Πλήθος οχημάτων 0 3 4 συχνότητες 30 3 46 0 Πιθανότητες 0.59 0.35 0.36 0.55 Εκτιμήσεις 3 4 9 8 p 0*0.59 Πλήθος οχημάτων 3 0 3 4 συχνότητες 30 3 46 0 Πιθανότητες 0.59 0.35 0.36 0.55 Εκτιμήσεις 3 4 9 8 /p 9 4.4 73 8
Απάντηση * X 34.4 0 4.4 x4,0.05 5.99 4.4>5.99 άρα απορρίπτω την Η 0
Άσκηση Ένα τυχαίο δείγμα 500 επιχειρήσεων έδειξε ότι 0 έχουν έντονη δραστηριότητα στο εξωτερικό, 00 μερική και 80 ελάχιστη. Μπορούμε να ισχυριστούμε ότι τα πραγματικά ποσοστά είναι 8%, 37% και 35% αντίστοιχα (α=0.05)
Απάντηση Για να ελέγξουμε αν οι παρατηρούμενες αναλογίες 0 500 00 500 80, 500 συμπίπτουν με τις θεωρητικές 0.8, 0.37, 0.35 εφαρμόζουμε το τέστ καλής προσαρμογής x Έχουμε Η 0 : p =0.8, p =0.37, p 3 =0.35,, Η : κάποιο p διάφορο της θεωρητικής
Απάντηση θεωρητικές δραστηριότητα έντονη μερική Ελάχιστη Συχνότητες (f ) 0 00 80 Πιθανότητες (p ) 0.8 0.37 0.35 Εκτιμήσεις 40 85 75 μ =p =500*p 0 00 80 * X 500 40 85 75 4. x3,0.05 5.99 4.<5.99 άρα αποδέχομαι την Η 0
Απάντηση Μπορούμε να ισχυριστούμε ότι η πραγματική αναλογία των επιχειρήσεων με έντονη δραστηριότητα είναι 30% (α=0.0)? Η 0 : p=0.30 Η : p 0.30 δίπλευρο τεστ z a z a / z 0.005 z0.995 p 0 500 0.4 0.3* 0.7 / 0.3.575* 500.575 [0.79,3.05] Το 0.4 δεν ανήκει στο διάστημα άρα απορρίπτεται η Η 0
Απάντηση Μπορούμε να ισχυριστούμε ότι τα ποσοστά δεν διαφέρουν μεταξύ τους (α=0.05)? Αν δεν διαφέρουν τότε p =p =p 3 =/3. Επομένως έχουμε Η 0 : p =p =p 3 =/3 Η : κάποιο p /3 δραστηριότητα έντονη μερική Ελάχιστη Συχνότητες (f ) 0 00 80 Πιθανότητες (p ) /3 /3 /3 Εκτιμήσεις 500/3 500/3 500/3
Απάντηση X * 0.8 x3,0.05 5.99 0.8>5.99 άρα απορρίπτω την Η 0