ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος

Σχετικά έγγραφα
Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Μέθοδος μέγιστης πιθανοφάνειας

Στατιστική Επιχειρήσεων Ι. Βασικές διακριτές κατανομές

Μέθοδος μέγιστης πιθανοφάνειας

07/11/2016. Στατιστική Ι. 6 η Διάλεξη (Βασικές διακριτές κατανομές)

Η διακριτή συνάρτηση μάζας πιθανότητας δίνεται από την

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

Τυχαία μεταβλητή (τ.μ.)

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

P (A B) = P (AB) P (B) P (A B) = P (A) P (A B) = P (A) P (B)

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα

Θεωρητικές Κατανομές Πιθανότητας

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Στατιστική Ι-Θεωρητικές Κατανομές Ι

Συνδυαστική Ανάλυση. Υπολογισμός της πιθανότητας σε διακριτούς χώρους με ισοπίθανα αποτελέσματα:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Πιθανότητες. Συναρτήσεις πολλών μεταβλητών Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας

ρ. Ευστρατία Μούρτου

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Διακριτά Μαθηματικά. Απαρίθμηση: Διωνυμικοί συντελεστές

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

Στατιστική Συμπερασματολογία

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

3. Κατανομές πιθανότητας

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Θεωρία Πιθανοτήτων, εαρινό εξάμηνο Λύσεις του πέμπτου φυλλαδίου ασκήσεων.. Δηλαδή:

2. Στοιχεία Πολυδιάστατων Κατανοµών

x π 1 i n Το παραμετρικό μοντέλο πιθανότητας (η

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Π

Στατιστική. Εκτιμητική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Τ Ε Ι Ιονίων Νήσων Τμήμα Εφαρμογών Πληροφορικής στη Διοίκηση και την Οικονομία. Υπεύθυνος: Δρ. Κολιός Σταύρος

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Δειγματικές Κατανομές

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Υπολογιστικά & Διακριτά Μαθηματικά

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

Στατιστική Ι. Ενότητα 5: Θεωρητικές Κατανομές Πιθανότητας. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Π

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 2016 (version ) είναι: ( ) f =

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τυχαίες Μεταβλητές. Ορισμός

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΣΗΜΕΙΩΣΕΙΣ. x A αντιστοιχίζεται (συσχετίζεται) με ένα μόνο. = ονομάζεται εξίσωση της

ΕΠΑΝΑΛΗΨΗ ΕΦΑΡΜΟΣΜΕΝΑ ΜΑΘΗΜΑΤΙΚΑ 11/01/2018

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Εισαγωγικές Έννοιες ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών Πόρων

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ

ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να

Στατιστική. 4 ο Μάθημα: Θεωρητικές και Εμπειρικές - Δειγματοληπτικές Κατανομές. Γεώργιος Μενεξές Τμήμα Γεωπονίας

ΚΕΦΑΛΑΙΟ 4ο ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΑΠΟ ΣΥΝΕΧΕΙΣ ΚΑΙ ΔΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ

Μέρος IV. Πολυδιάστατες τυχαίες μεταβλητές. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ15 ( 1 )

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

δεδομένων με συντελεστές στάθμισης (βαρύτητας)

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΕΠΑΝΑΛΗΨΗ ΒΑΣΙΚΩΝ ΕΝΝΟΙΩΝ ΣΤΑΤΙΣΤΙΚΗΣ

Τυχαία μεταβλητή είναι μία συνάρτηση ή ένας κανόνας που αντιστοιχίζει ένα αριθμό σε κάθε αποτέλεσμα ενός πειράματος.

Περίληψη ϐασικών εννοιών στην ϑεωρία πιθανοτήτων

Στατιστική Συμπερασματολογία

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Το Κεντρικό Οριακό Θεώρημα

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

Βασικές Αρχές Μέτρησης επ. Κων/νος Π. Χρήστου

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Στατιστική. Βασικές έννοιες

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Κριτήρια επιλογής μέτρων συνάφειας

ΤΥΧΑΙΑ ΔΙΑΝΥΣΜΑΤΑ F(x) 1, x n. 2. Η F είναι μη φθίνουσα και δεξιά συνεχής ως προς κάθε μεταβλητή. 3.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Transcript:

ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος

Εισαγωγή Αριθμητικά δεδομένα αντιστοιχούν σε πραγματοποιήσεις τυχαίων μεταβλητών των οποίων οι δυνατές τιμές παίρνονται από ένα υποσύνολο των ακεραίων ή των πραγματικών αριθμών. Ωστόσο εκτός από αυτού του τύπου τα δεδομένα μπορούμε να ξεχωρίσουμε και άλλα τα οποία προέρχονται από πραγματοποιήσεις τυχαίων μεταβλητών των οποίων οι τιμές λαμβάνονται από ένα σύνολο που δεν αναπαριστάται απαραίτητα από αριθμούς. Τέτοιες τυχαίες μεταβλητές για παράδειγμα, θα μπορούσαν να είναι απαντήσεις που έχουνε δώσει οι ερωτώμενοι σε ερωτήσεις κάποιου ερωτηματολογίου και υποδεικνύουν την θέση των ερωτώμενων για κάποιο εξεταζόμενο χαρακτηριστικό.

Εισαγωγή Τέτοιες τυχαίες μεταβλητές ονομάζονται κατηγορικές μεταβλητές και τα αντίστοιχα δεδομένα ονομάζονται κατηγορικά. Οι μετρήσεις που προκύπτουν μέσα από τέτοιες διαδικασίες καλούνται κατηγορικές ή ποιοτικές.

Εισαγωγή Ονοματικές (omal), όπου η κάθε μέτρηση αντιπροσωπεύει την κατηγορία στην οποία ανήκει ο ερωτώμενος. Οι αριθμοί που θα μπορούσαν να χρησιμοποιηθούν για την αναπαράσταση των τιμών λειτουργούν σαν ετικέτες που απλά περιγράφουν τις διαφορετικές κατηγορίες. Για παράδειγμα: οικονομικές- κοινωνικές ομάδες, θρήσκευμα

Εισαγωγή Διατεταγμένες (ordal), όπου οι μετρήσεις δείχνουν τη σειρά και την διάταξη των στοιχείων ή ομάδων. Οποιοσδήποτε αριθμός μπορεί να χρησιμοποιηθεί για να περιγράψει τις μετρήσεις αυτές. Θα πρέπει όμως οι αριθμοί αυτοί να διατηρούν την διάταξη των διαφορετικών κατηγοριών. Το χαρακτηριστικό θερμοκρασία θα μπορούσε να έχει τέσσερις κατηγορίες: «πολύ ζεστό», «ζεστό», «κρύο» και «πολύ κρύο» οι οποίες θα μπορούσαν να αναπαρασταθούν από τους αριθμούς 4, 3, και αντίστοιχα. Στις περιπτώσεις ωστόσο τιμών ονομαστικών κλιμάκων αυτό δεν έχει κανένα νόημα.

Κατανομές Διακριτές κατανομές πιθανότητας Έστω Χ μια διακριτή τ.μ. και υποθέτουμε ότι οι τιμές που μπορεί να πάρει είναι x, x,.. διαταγμένες σε αύξουσα σειρά. Οι πιθανότητες να πάρει η μεταβλητή Χ τις τιμές αυτές είναι: με σ.π.π f(x ) 0 Σf(x )=0 P(X=x )=f(x ), =,,

Διωνυμική Κατανομή Αν έχουμε ανεξάρτητες ταυτοτικές δοκιμές οι οποίες μετρούν πόσο συχνά εμφανίζεται ένα ενδεχόμενο τότε η κατάλληλη κατανομή είναι η διωνυμική. Τυπικά, το αποτέλεσμα που μας ενδιαφέρει ονομάζεται «επιτυχία». Αν η πιθανότητα επιτυχίας είναι π σε μια σειρά από Ν ανεξάρτητες ταυτοτικές δοκιμές, τότε ο συνολικός αριθμός επιτυχιών Χ έχει τη διωνυμική κατανομή με παραμέτρους Ν και π. Τότε γράφουμε: X ~ BN,

Διωνυμική Κατανομή Η διακριτή συνάρτηση καλείται διωνυμική κατανομή επειδή για x=0,,, δίνει τους όρους του αναπτύγματος του διωνύμου: N N P X E X N Var X N ( ) x x x q p x p q p pq q p q 0...

Διωνυμική Κατανομή Παράδειγμα Η πιθανότητα να φέρουμε φορές κεφάλι σε 6 ρίψεις είναι: 64 5 4!! 6! 6 4 6 x p

Κατανομή Posso Φαινόμενα τα οποία έχουν πολύ μικρή πιθανότητα εμφάνισης αλλά είναι διαθέσιμος ένας μεγάλος αριθμός δοκιμών, μπορούν να μοντελοποιηθούν από την κατανομή Posso. Για παράδειγμα, ο αριθμός των αυτοκτονιών σε ένα χρόνο. Η πιθανότητα κάποιος να αυτοκτονήσει είναι πολύ μικρή αλλά σε ένα μεγάλο πληθυσμό ένας σχετικά σημαντικός αριθμός ατόμων τελικά θα το κάνουν. Το Posso μοντέλο δειγματοληψίας για τα κατηγορικά δεδομένα θεωρεί ότι στην συλλογή των δεδομένων το συνολικό μέγεθος του δείγματος είναι τυχαία μεταβλητή.

Κατανομή Posso Το Posso μοντέλο υποθέτει ότι ο αριθμός των υποκειμένων σε κάθε κελί ενός πίνακα συνάφειας είναι ανεξάρτητες Posso τυχαίες μεταβλητές. Αν συμβολίσουμε με X τη τυχαία μεταβλητή που μετρά τον αριθμό των υποκειμένων στο κελί τότε: P X E X e m m! m Var X,,...,k m

Κατανομή Posso Αν στην δυωνυμική κατανομή το και η πιθανότητα p είναι μικρή τότε q=-p και m=p Η από κοινού συνάρτηση πιθανότητας για τα είναι το γινόμενο των πιθανοτήτων k k k P X,X,...,X m όπου m είναι το διάνυσμα των παραμέτρων των Posso μεταβλητών. Γίνεται φανερό πως το ολικό μέγεθος δείγματος ακολουθεί Posso κατανομή με παράμετρο ακολουθεί Posso κατανομή με παράμετρο m e m m!

Κατανομή Posso Προσέγγιση κατανομής Posso από διωνυμική Δυωνυμική κατανομή: Θέτω λ=νπ με π=λ/ν. Επομένως N N P X!!... e X p N N N N N N N X p N N e -λ k e k lm

Πολυωνυμική Κατανομή Κάθε ενδεχόμενο έχει πιθανότητα εμφάνισης π j, j =,..., k. Οπωσδήποτε, π + + π k =. Συμβολίζουμε με X j τον αριθμό των φορών που εμφανίστηκε το ενδεχόμενο j στις η δοκιμές. Τότε γράφουμε: και ισχύει: X X,..., X ~ Mult,,,...,,, k! P X,X,...,X...!...! k k k k k

Εύκολα βλέπουμε ότι: E X j Πολυωνυμική Κατανομή Var X j Cov X,X j j j j j Θα μπορούσε κάποιος να αναπαραστήσει τον πίνακα συνδιακύμανσης των Χ ως: dag

Πολυωνυμική Κατανομή Ωστόσο, μπορούμε να φτάσουμε στην πολυωνυμική κατανομή ξεκινώντας από την κατανομή Posso. Αν έχουμε k ανεξάρτητες κατανομές Posso X,, X k με παραμέτρους m,, m k αντίστοιχα τότε το άθροισμα τους είναι κατανομή Posso με παράμετρο m + + m k. Αν δεσμεύσουμε πάνω στην τιμή του αθροίσματος X +... + Χ k = τότε οι παρατηρήσεις X, =,..., k δεν ακολουθούν κατανομή Posso αλλά: k PX,,...,k X j j P X,,...,k k P X j j! j j m j m e j k j e m m!!! m m j

Πολυωνυμική Κατανομή Αυτή η κατανομή είναι πολυωνυμική με παραμέτρους m,,..., k mj m j j j m όπου οι πιθανότητες π σε κάθε κελί είναι: m j j Η ερμηνεία αυτού του αποτελέσματος είναι η ακόλουθη: αν έχουμε k κελιά και ο αριθμός των υποκειμένων θεωρείται ότι παράγεται από ανεξάρτητες κατανομές Posso τότε δεσμεύοντας στο συνολικό μέγεθος του δείγματος παίρνουμε ότι ο αριθμός των υποκειμένων ακολουθεί την πολυωνυμική κατανομή. Ο τρόπος δειγματοληψίας λέγεται πολυωνυμική δειγματοληψία. m

Δυαδικά Δεδομένα (Bary Data) Δυαδικά δεδομένα προέρχονται από τυχαίες μεταβλητές που παίρνουν δύο δυνατές τιμές: ναι/όχι, σωστό/λάθος, άντρας /γυναίκα. Ας υποθέσουμε ότι έχουμε p μεταβλητές / ερωτήσεις και ερωτώμενους. Τα δεδομένα για κάθε υποκείμενο όταν = 5 και p = 9 θα είναι για παράδειγμα της μορφής: 0000 000 0000 00000 0000

Δυαδικά Δεδομένα (Bary Data) Ένας τρόπος περιγραφής των δεδομένων αυτών είναι διαμέσου ενός πίνακα δεδομένων (data matrx) τον οποίο, προς το παρόν, μπορούμε να ονομάσουμε Χ. Κάθε γραμμή αυτού του πίνακα περιέχει τα δεδομένα κάθε υποκειμένου και αποκαλείται σχήμα απάντησης (respose patter). Υπάρχουν συνολικά p δυνατά σχήματα απάντησης. Αν το είναι πολύ μεγαλύτερο του p πολλά από τα σχήματα απάντησης θα εμφανίζονται στο δείγμα περισσότερες από μια φορά. Αυτό μας επιτρέπει να παρουσιάσουμε τον πίνακα σαν ένα πίνακα συχνοτήτων. Ο πίνακας Χ'Χ διαστάσεων (p x p) περιέχει τις εξής πληροφορίες για τα δεδομένα:

Δυαδικά Δεδομένα (Bary Data). Τα διαγώνια στοιχεία του πίνακα είναι το άθροισμα της κάθε στήλης του πίνακα Χ, δηλαδή ο συνολικός αριθμός των θετικών απαντήσεων για το υποκείμενο ί.. Το (, j) στοιχείο του πίνακα Χ'Χ δίνει τον αριθμό των ερωτώμενων που απάντησαν θετικά στις ερωτήσεις και j.

Δυαδικά Δεδομένα (Bary Data) Έστω ότι ο Χ πίνακας περιλαμβάνει τα δεδομένα έξι υποκειμένων, κάθε ένα εκ των οποίων απαντούν θετικά ή αρνητικά σε τρεις ερωτήσεις. Ένας τέτοιος πίνακας Χ μπορεί να είναι της μορφής: 0 0 0 0 0 0 0 0 0

Δυαδικά Δεδομένα (Bary Data) Ο Χ'Χ πίνακας είναι: από τον οποίο καταλαβαίνουμε ότι στην πρώτη ερώτηση απάντησαν θετικά τρία υποκείμενα, ενώ στις επόμενες δύο ερωτήσεις απάντησαν θετικά πέντε και ένα υποκείμενα αντίστοιχα. Δύο υποκείμενα απάντησαν θετικά στις ερωτήσεις ένα και δύο, ενώ ένα υποκείμενο απάντησε θετικά στις ερωτήσεις δύο και τρία. Τέλος, κανένα υποκείμενο δεν απάντησε θετικά στις ερωτήσεις ένα και τρία.

Δεδομένα με Περισσότερες από Δύο Κατηγορίες (Polytomous Data) Ας υποθέσουμε ότι υπάρχουν p ερωτήσεις / μεταβλητές και c, c,, c p δηλώνουν τον αριθμό των δυνατών απαντήσεων (κατηγοριών) για κάθε μεταβλητή. Τα δεδομένα αυτά ονομάζονται πολυωνυμικά δεδομένα. Ένας τρόπος αναπαράστασης των δεδομένων αυτών είναι όπως στην περίπτωση των δυαδικών δεδομένων με τη βοήθεια αριθμών που αναπαριστούν κάθε κατηγορία. Δυστυχώς όμως μια τέτοια αναπαράσταση δε θα έδινε καμιά ερμηνεία στον πίνακα Χ'Χ. Προτιμότερη είναι η παρακάτω αναπαράσταση.

Δεδομένα με Περισσότερες από Δύο Κατηγορίες (Polytomous Data) Έστω ένα διάνυσμα από δυαδικές μεταβλητές που να υποδηλώνει ποια απάντηση (κατηγορία) έχει επιλέξει ο κάθε ερωτώμενος, π.χ. ' = (0,0,,0,0) δείχνει ότι ο ερωτώμενος έχει επιλέξει την απάντηση (κατηγορία) 3 για την ερώτηση (μεταβλητή). Η διάσταση του πίνακα Χ εδώ είναι p c

Δεδομένα με Περισσότερες από Δύο Κατηγορίες (Polytomous Data) Ας υποθέσουμε ότι πέντε υποκείμενα απαντούν σε δύο ερωτήσεις εκ των οποίων η πρώτη έχει δύο δυνατές απαντήσεις (κατηγορίες) και η δεύτερη τρεις. Τα δεδομένα π.χ. είναι: 3 Τότε ο πίνακας Χ είναι ένας πίνακας με πέντε γραμμές (αριθμός υποκειμένων) και πέντε στήλες εκ των οποίων οι δύο πρώτες αντιστοιχούν στις δύο δυνατές απαντήσεις της πρώτης ερώτησης ενώ οι τρεις τελευταίες στις τρεις δυνατές απαντήσεις της δεύτερης ερώτησης.

Δεδομένα με Περισσότερες από Δύο Κατηγορίες (Polytomous Data) X 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Παρατηρείστε ότι ο πίνακας Χ μπορεί να αναπαρασταθεί ως Χ = (Χ,Χ ) όπου ο πίνακας Χ είναι διάστασης 5x και ο πίνακας Χ είναι διάστασης 5 x 3. Ο πίνακας Χ'Χ δίνεται από

Δεδομένα με Περισσότερες από Δύο Κατηγορίες (Polytomous Data) 0 0 0 3 3 0 0 X X X X 0 3 3 0 0 X X X X 0 0 0 0 0 0 Παρατηρείστε ότι οι πίνακες και έχουν την ίδια ερμηνεία όπως και στην περίπτωση των δυαδικών δεδομένων. Δηλαδή, την πρώτη απάντηση της ερώτησης ένα την επέλεξαν δύο υποκείμενα ενώ τη δεύτερη απάντηση της ερώτησης ένα την επέλεξαν τρία υποκείμενα. Με τον ίδιο τρόπο φαίνεται πως τρία υποκείμενα επέλεξαν την πρώτη απάντηση της δεύτερης ερώτησης ενώ από ένα υποκείμενο επέλεξαν τις απαντήσεις δύο

Δεδομένα με Περισσότερες από Δύο Κατηγορίες (Polytomous Data) και τρία της δεύτερης ερώτησης αντίστοιχα. Ο πίνακας έχει ιδιαίτερο ενδιαφέρον και δίνεται στον Πίνακα Απάντ. Απάντ. Απάντ. 3 Σύνολο Απάντ. 0 Χ Χ Απάντ. 3 0 0 3 Σύνολο 3 5 Ο Πίνακας είναι όπως και οι παραπάνω πίνακες ένας πίνακας συχνοτήτων και δείχνει τον αριθμό των υποκειμένων που επιλέγουν μια απάντηση από την πρώτη ερώτηση και μια απάντηση από τη δεύτερη ερώτηση. Το στοιχείο (,) για παράδειγμα μας δείχνει ότι τρία υποκείμενα επέλεξαν την απάντηση δύο και την απάντηση ένα στις ερωτήσεις ένα και δύο αντίστοιχα.

Δεδομένα με Περισσότερες από Δύο Κατηγορίες (Polytomous Data) Τέτοιοι πίνακες αναπαριστούν τη σχέση μεταξύ των δύο ερωτήσεων μιας και εάν υπάρχει εξάρτηση μεταξύ των δύο μεταβλητών θα αναμένουμε μεγαλύτερο αριθμό υποκειμένων να επιλέγει συγκεκριμένο συνδυασμό απαντήσεων από τις δύο ερωτήσεις. Πίνακες αυτού του τύπου είναι ιδιαίτερου ενδιαφέροντος και εξετάζονται στη συνέχεια.