Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).



Σχετικά έγγραφα
Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Μέση τιμή, διασπορά, τυπική απόκλιση. 1) Για την τυχαία διακριτή μεταβλητή Χ ισχύει Ρ(Χ=x i)=

Εισαγωγή στη Στατιστική

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Στατιστικοί πίνακες. Δημιουργία κλάσεων

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Στατιστική. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

, και για h 0, . Άρα. Α2. Μια συνάρτηση f λέγεται γνησίως αύξουσα σε ένα διάστημα Δ του πεδίου ορισμού της, όταν για οποιαδήποτε σημεία x.

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Παράδειγμα. Χρονολογικά δεδομένα. Οι πωλήσεις μιας εταιρείας ανά έτος για το διάστημα (σε χιλιάδες $)

Βιοστατιστική ΒΙΟ-309

Εισόδημα Κατανάλωση

Ποσοτική & Ποιοτική Ανάλυση εδομένων Βασικές Έννοιες. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Υπολογιστικά & Διακριτά Μαθηματικά

Βιοστατιστική ΒΙΟ-309

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Βιοστατιστική ΒΙΟ-309

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Μάθηµα 11. Κεφάλαιο: Στατιστική

Στατιστική Επιχειρήσεων Ι

3. Κατανομές πιθανότητας

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Π

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

Εισαγωγή στη Στατιστική

Περιγραφική Στατιστική

Αναλυτική Στατιστική

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Βασικές έννοιες. Παραδείγµατα: Το σύνολο των φοιτητών που είναι εγγεγραµµένοι

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

ΠΙΘΑΝΟΤΗΤΕΣ Δειγματικός Χώρος. Ενδεχόμενα {,,..., }.

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Αριθμητική Ανάλυση και Εφαρμογές

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Μαθηματικά Γ Γυμνασίου

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Π Α Ν Ε Λ Λ Η Ν Ι Ε Σ Μ Α Θ Η Μ Α Τ Ι Κ Α K A I Σ Τ Ο Ι Χ Ε Ι Α Σ Τ Α Τ Ι Σ Τ Ι Κ Η Σ

Γ. Πειραματισμός - Βιομετρία

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

P(A ) = 1 P(A). Μονάδες 7

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Εφαρμοσμένη Στατιστική

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Στατιστική Ι-Θεωρητικές Κατανομές Ι

ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΟ ΜΑΘΗΜΑ ΜΑΘΗΜΑΤΙΚΑ Ι.Ι (τεύχος-1-)

ΔΙΑΓΩΝΙΣΜΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ ΛΥΚΕΙΟΥ ( ΘΕΡΙΝΑ )

Μέθοδος μέγιστης πιθανοφάνειας

Εύρεση ν-στού πρώτου αριθμού

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Στατιστική Επιχειρήσεων

Στατιστική Ι. Ενότητα 5: Θεωρητικές Κατανομές Πιθανότητας. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΘΕΜΑΤΑ ΚΑΙ ΑΠΑΝΤΗΣΕΙΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΕΞΕΤΑΣΕΩΝ 2014

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική ανάλυση αποτελεσμάτων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Ο Ι ΚΟ Ν Ο Μ Ι Κ Α / Σ ΤΑΤ Ι Σ Τ Ι Κ Η

Transcript:

Δισδιάστατη ανάλυση Πίνακες διπλής εισόδου Σε πολλές περιπτώσεις μελετάμε περισσότερες από μία μεταβλητές ταυτόχρονα. Π.χ. μία έρευνα που έγινε σε ένα δείγμα 58 ατόμων περιείχε τις ερωτήσεις «ποια είναι η οικογενειακή σας κατάσταση» και «πόσα δωμάτια έχει το σπίτι που μένετε» Έστω Χ η μεταβλητή που παριστάνει τον αριθμό δωματίων και Υ η μεταβλητή «οικογενειακή κατάσταση». Κάθε μία από αυτές παίρνει στην πράξη ένα πεπερασμένο πλήθος τιμών. Αν αναλύαμε τα δεδομένα ξεχωριστά, θα κάναμε έναν πίνακα συχνοτήτων για καθεμία. Για παράδειγμα, έστω ότι άτομα δήλωσαν ότι είναι άγαμοι (Α), 6 έγγαμοι (Ε), χήροι (Χ) και 9 διαζευγμένοι (Δ). Συνοπτικά, Τιμή συχνότητα Α Ε 6 Χ Δ 9 Αντίστοιχα, μπορούμε να κατασκευάσουμε τον πίνακα που δίνει τις συχνότητες για τον αριθμό δωματίων Τιμή συχνότητα 5 4 5 8

Οι παραπάνω πίνακες δε μας δίνουν καμία πληροφορία για το αν υπάρχει σχέση ανάμεσα στις δύο μεταβλητές. Π.χ. είναι λογικό ότι αν κάποιος είναι άγαμος μένει σε σπίτι με λιγότερα δωμάτια από κάποιον που έχει οικογένεια. Για να μελετήσουμε τη σχέση αυτή, αν υπάρχει, θα πρέπει να γνωρίζουμε τις συχνότητες που αντιστοιχούν σε κάθε συνδυασμό τιμών της μεταβλητής Χ με τιμές της μεταβλητής Υ. Έτσι κατασκευάζουμε τον πίνακα 0 0 5 7 5 5 4 6 5 8 6 9 Πίνακας διπλής εισόδου Π.χ. πόσα άτομα στο δείγμα είναι έγγαμοι και ζουν σε σπίτι με δωμάτια κοκ. Εδώ υπάρχουν 5 τιμές για τη μεταβλητή Χ και 4 τιμές για την Υ, άρα υπάρχουν 0 τέτοιοι συνδυασμοί. Για να είναι δυνατή η κατασκευή πρέπει οι μεταβλητές να είναι ονομαστικές, ή να είναι διακριτές με μικρό πλήθος από δυνατές τιμές. (όπως εδώ η Χ) 4

Όταν μία μεταβλητή ανήκει σε μία από αυτές τις κατηγορίες, συνήθως αναφέρεται σαν παράγοντας, οι δε τιμές της επίπεδα του παράγοντα. Στη γενική περίπτωση, για να κατασκευάσουμε έναν πίνακα διπλής εισόδου θεωρούμε τα επίπεδα του πρώτου παράγοντα σαν τις γραμμές του πίνακα και τα επίπεδα του ου παράγοντα σαν τις στήλες του πίνακα. Δισδιάστατη ανάλυση Γενική μορφή ενός πίνακα διπλής εισόδου Έστω ότι έχουμε επίπεδα για τον πρώτο παράγοντα και c επίπεδα για το ο. Τότε η γενική μορφή ενός τέτοιου πίνακα είναι c c......... c c Π.χ., είναι η συχνότητα που αντιστοιχεί στη η γραμμή και η στήλη του πίνακα. Οι συχνότητες στην τελευταία στήλη μας δίνουν την περιθώρια (ή περιθωριακή) κατανομή συχνοτήτων της Χ και προκύπτουν με άθροιση όλων των συχνοτήτων της κάθε γραμμής. 5 6

Δηλαδή, i, = c i κοκ. = c Γενικά, i = c Οι συχνότητες στην τελευταία γραμμή προκύπτουν με άθροιση όλων των συχνοτήτων της κάθε στήλης. = i = i κλπ. = c ic Επίσης γράφουμε για το συνολικό μέγεθος του δείγματος και ισχύει = i = j = c j= c j= Ορίζουμε επίσης τις σχετικές συχνότητες i =,,..., και j =,,..., c με βάση τον τύπο και αντίστοιχα p p = i i, Εδώ ισχύουν οι σχέσεις p = c = i j= j p = p j j = p για 7 8

Στο προηγούμενο παράδειγμα (οικογενειακή κατάσταση αριθμός δωματίων), από τον πίνακα 0 0 5 7 5 4 6 5 X = αριθ. δωματίων Υ = οικογενειακή κατάσταση με βάση τις σχέσεις p = παίρνουμε τον ΠΙΝΑΚΑ ΣΧΕΤΙΚΩΝ ΣΥΧΝΟΤΗΤΩΝ /58 0 /58 0 5/58 7/58 /58 /58 /58 /58 5/58 /58 4 /58 6/58 /58 /58 5 /58 /58 /58 /58 /58 6/58 /58 9/58 Στον πρώτο πίνακα (πίνακα συχνοτήτων) ισχύει π.χ. =, = 0, = κ.λπ. Επίσης.. = 58, i, j άρα p = για όλα τα i,j 58 οπότε προκύπτει ο ος πίνακας. 9 0

0 0 5 7 5 5 4 6 5 8 Σύνολο 6 9 58 X = αριθ. δωματίων Υ = οικογενειακή κατάσταση X = Σx i Σ i i + 5 + + 4 + 8 5 = =, 58 Με βάση τα στοιχεία του πίνακα διπλής εισόδου μπορούμε να βρούμε το μέσο αριθμό δωματίων για κάθε επίπεδο (κατηγορία) της μεταβλητής Υ. Για παράδειγμα, για την κατηγορία «διαζευγμένοι» (Δ) οι συχνότητες για κάθε αριθμό δωματίων είναι x i i 0 4 5 οπότε o μέσος αριθμός δωματίων για την κατηγορία (Δ) είναι 0 + + + 4 + 5 =,4 9 σύνολο διαζευγμένων ατόμων Αντίστοιχα μπορούμε να βρούμε π.χ. το μέσο αριθμό δωματίων για την κατηγορία Ε. 0 + 7 + + 4 6 + 5 6 79 = 6

Αν κάποιος λοιπόν είναι στην κατηγορία Δ έχει μεγαλύτερο αριθμό δωματίων κατά μέσο όρο από κάποιον στην κατηγορία Ε. Ο συμβολισμός είναι Ε(Χ / Υ = Ε ) = και αυτή λέγεται μέση τιμή της Χ δεδομένου ότι Υ = Ε (ή Υ = έγγαμος). Γενικά αν Χ,Υ είναι δύο τυχαίες μεταβλητές με αντίστοιχες συχνότητες ( ) σε έναν πίνακα διπλής εισόδου, τότε η μέση τιμή της Χ για Υ= j είναι x i = Ε (Χ / Υ = j) Εδώ = ο αριθμός των γραμμών ενός πίνακα = ο αριθμός των τιμών που παίρνει η μεταβλητή Χ και j =,, c, όπου c είναι ο αριθμός στηλών του πίνακα Γενικά, όταν οι Χ και Υ είναι και οι δύο ποσοτικές μεταβλητές, δηλαδή παίρνουν αριθμητικές τιμές, μπορούμε να ορίσουμε επίσης τη μέση τιμή της Υ για κάθε επίπεδο της Χ. o Στο συγκεκριμένο παράδειγμα δεν μπορούμε να το κάνουμε αυτό γιατί η Υ (οικογ. κατάσταση) είναι ποιοτική. Η μέση τιμή είναι ένα παράδειγμα ροπής ( ης τάξης) γύρω από το μηδέν. Όταν έχουμε δισδιάστατα δεδομένα, μπορούμε να ορίσουμε τη ροπή k τάξης (γύρω από το μηδέν) της μιας μεταβλητής για κάθε επίπεδο της άλλης. Η ροπή k τάξης της Χ όταν Y = j ορίζεται από τη σχέση Ε (Χ k / Y = j) = k xi 4

Στο παράδειγμα, έστω ότι θέλουμε να βρούμε τη δεύτερη ροπή της Χ (γύρω από το μηδέν) για την κατηγορία «Διαζευγμένοι» (Δ). Όταν έχουμε μονοδιάστατα δεδομένα, οι σχετικές συχνότητες βρίσκονται αν διαιρέσουμε τις απόλυτες συχνότητες με το πλήθος των τιμών Ε(Χ / Υ = Δ ) =.0 +. +. + 4 9 8 + 7 + + 50 = 9. + 5. = Για δισδιάστατα δεδομένα που προέρχονται από έναν πίνακα διπλής εισόδου, έχουμε διάφορα είδη σχετικών συχνοτήτων. 7 = =. 9 Η ροπή τρίτης τάξης της Χ δεδομένου ότι Υ = Δ είναι Ε(X.0 + /Υ= Δ ) = =. +. + 4 9. + 5. 0 + 6 + 7. + 64. + 5. 9 475 = 9 = 5,7 Η ροπή τρίτης τάξης είναι χρήσιμη όταν εξετάζουμε την ασυμμετρία. α) Σχετικές συχνότητες (ή ποσοστά) ανά γραμμή. Για να βρούμε τις σχετικές συχνότητες που αντιστοιχούν στην η γραμμή διαιρώ την κάθε απόλυτη συχνότητα σε αυτή τη γραμμή με το πλήθος των ατόμων που αντιστοιχούν συνολικά στην γραμμή αυτή. Αντίστοιχα για τη η, η γραμμή κοκ. Συνήθως αυτές οι σχετικές συχνότητες εκφράζονται σαν ποσοστά, οπότε πολλαπλασιάζουμε το αποτέλεσμα κάθε διαίρεσης επί το 00. 5 6

Έτσι παίρνουμε τον πίνακα: 66,67 0, 0 00, 46,67 6,67, 00 4,76 57,4,8 4,9 00 4 9,09 54,55 8,8 8,8 00 5 5,5 7,5 5 00 Μας δείχνει για κάθε γραμμή (τιμή του Χ) πώς κατανέμονται οι τιμές του Υ. β) Σχετικές Συχνότητες ανά στήλη Εδώ διαιρούμε κάθε συχνότητα με την περιθωριακή συχνότητα της στήλης στην οποία ανήκει. 4 5 0 00 5 7 00. 00 6 00. 00 6 6 00. 00 6 00. 00 6 0 00 00 00 9 5 00 00 9 00 00 9 00 00 9 Έτσι προκύπτει ο πίνακας 8,8 0 8, 0 45,45 6, 8,, 9,09 46,5 4,67, 4 9,09,08 6,67, 5 8,8,85 5, 7 8

Παρατηρήσεις ) Το άθροισμα των σχετικών συχνοτήτων για κάθε στήλη είναι 00. ) Ερμηνεία των τιμών του πίνακα: για παράδειγμα, Χ =, Υ = Α και σχετική συχνότητα: 8,8. Από τα άτομα στο δείγμα που είναι άγαμοι, το 8,8% ζουν σε σπίτι με ένα δωμάτιο. γ) Σχετικές συχνότητες στο σύνολο (τις έχουμε δει ήδη),95 0,7 0 8,6,07,7,45,7 0,69 8,6 5,7 4,7 0,4,45,45 5,45,7 5,7,45 Εδώ διαιρούμε κάθε απόλυτη συχνότητα με το συνολικό πλήθος τιμών του πίνακα (εδώ n = 58) και πολλαπλασιάζουμε επί 00. Παρατηρήσεις ) Το άθροισμα των σχετικών συχνοτήτων για όλο τον πίνακα είναι 00 (σαν ποσοστό). ) Ερμηνεία των τιμών του πίνακα: π.χ. για Χ =, Υ = Α και σχετική συχνότητα,45% από το σύνολο των ατόμων στο δείγμα, το,45% είναι άγαμοι και ζουν σε σπίτι ενός δωματίου. 9 0

Έστω ότι έχουμε έναν πίνακα με σχετικές συχνότητες ανά γραμμή, όπως στο παράδειγμα. Αν οι σχετικές συχνότητες που βρίσκονται στην ίδια στήλη είναι όλες ίσες μεταξύ τους, τότε οι μεταβλητές Χ και Υ είναι ανεξάρτητες, δηλ. οι τιμές που παίρνει η μία μεταβλητή δεν επηρεάζουν τις τιμές της άλλης και αντίστροφα. Ένας τρόπος για να εξετάσουμε αν δύο μεταβλητές είναι ανεξάρτητες βασίζεται στις θεωρητικές συχνότητες. Η θεωρητική συχνότητα είναι η συχνότητα που αντιστοιχεί σε κάθε κελί ενός πίνακα διπλής εισόδου όταν δεν υπάρχει καμία εξάρτηση μεταξύ των Χ και Υ. Στην πράξη ακόμα και όταν οι μεταβλητές είναι ανεξάρτητες, οι τιμές αυτές δεν είναι ακριβώς ίσες, αλλά βρίσκονται κοντά μεταξύ τους, λόγω της τυχαιότητας του δείγματος. Π.χ. από τα 58 άτομα στο δείγμα, τα ζουν σε σπίτι ενός δωματίου, άρα η πιθανότητα να ζει κάποιος σε σπίτι ενός δωματίου είναι /58.

Εάν υποθέσουμε ότι Χ,Υ είναι ανεξάρτητες μεταβλητές τότε η πιθανότητα αυτή είναι η ίδια για κάθε επίπεδο της Υ. Συνεπώς, αν έχουμε άγαμους στο δείγμα, ο αναμενόμενος αριθμός αγάμων που ζουν σε ένα δωμάτιο είναι = 0,57 θεωρητική συχνότητα 58 Παρόμοια ο αναμενόμενος αριθμός εγγάμων που ζουν σε ένα δωμάτιο είναι 6. =,4. 58 Για Υ = χήρος, η θεωρητική συχνότητα είναι:. = 0,6. 58 Για Υ = διαζευγμένος, η θεωρητική συχνότητα είναι 9. = 0,47. 58 0 0 5 7 5 4 6 5 6 9 e, =. = 0,57 58 θεωρητική συχνότητα Γενικά οι θεωρητικές (ή αναμενόμενες) συχνότητες σε έναν πίνακα διπλής εισόδου συμβολίζονται με e και υπολογίζονται από τον τύπο: i j e =.. i =,,., j =,,.., c 4

Πίνακας Θεωρητικών Συχνοτήτων 0,57,4 0,6 0,47,84 6,7,,,98 9,4 4,4,6 4,09 4,9,8,7 5,5,59,66,4 Σημείωση: Δεν στρογγυλοποιούμε ποτέ τις θεωρητικές συχνότητες 5 e = =,84 58 e = e = e 4 = 5 6 58 5 58 5 9 58 = 6,7 =,0 =, Οι διαφορές ε = e ονομάζονται σφάλματα και μπορούν να παρασταθούν σε έναν πίνακα.,4 -,4 0,8-0,47,6 0,8 -,0-0,... 4 5 Για τα σφάλματα ισχύει πάντα c j= c ε = j= ( e ) = 0 5 6

Στην στατιστική συμπερασματολογία, για να ελέγξουμε αν δύο μεταβλητές Χ,Υ σε έναν πίνακα διπλής εισόδου είναι ανεξάρτητες χρησιμοποιούμε το άθροισμα: c X = j= που ονομάζεται Χ του Peason. Όσο μεγαλύτερη είναι η τιμή του Χ τόσο πιο ισχυρή ένδειξη έχουμε ότι οι μεταβλητές δεν είναι ανεξάρτητες. ε e Άσκηση Χ Υ περιθώρια Χ 6 7 0 60 0 90 5 50 0 05 0 5 70 05 65 5 0 00 περιθώρια Υ α) Να βρεθούν οι απόλυτες και σχετικές % περιθωριακές κατανομές Η περιθωριακή κατανομή της Χ δίνεται με κόκκινους χαρακτήρες στον πίνακα, και της Υ με έντονο μπλε χρώμα. Οι σχετικές περιθωριακές συχνότητες είναι: 90 για Χ=7:. 00 = 0% 00 05 για Χ=:.00 = 5% 00 7 8

05 για Χ=:.00 = 5% 00 β) Να βρείτε τις σχετικές συχνότητες του πίνακα με βάση τα σύνολα των γραμμών και στηλών. Για την Υ είναι: 65 για Υ=:.00 =,7% 00 5 για Υ=:. 00 = 4,7% 00 0 για Υ=6:.00 = 6,7% 00 δηλ. για παράδειγμα το 4,7% των τιμών της Υ παίρνει την τιμή, κοκ. ΠΙΝΑΚΑΣ ΣΧΕΤΙΚΩΝ ΣΥΧΝΟΤΗΤΩΝ ΑΝΑ ΓΡΑΜΜΗ Υ 6 7, 66,7, Χ,8 47,6 8,6 9 4, 66,7 Για όσα άτομα έχουν Χ = 7, από αυτά το,% έχουν τιμή Υ =. ΠΙΝΑΚΑΣ ΣΧΕΤΙΚΩΝ ΣΥΧΝΟΤΗΤΩΝ ΑΝΑ ΣΤΗΛΗ 6 7 0,8 48 9, 8,5 40 7, 0,8 6,6 00 00 00 9 0

γ) Να βρεθούν η μέση τιμή Ε(Χ) και η διακύμανση Va(Y) Χ Συχνότητα 7 90 05 05 90 7 + 05 + 05 Ε(Χ) = X = = 4 00 Υ Συχνότητα Υ-Y (Υ-Y ) 65 -,88,5 5-0,88 0,77 6 0, 4,49 65 + 5 + 6 0 Ε(Υ) = =,88 00 65,5 + 5 0,77 + 0 4,49 Va(Y) = =,76. 99 δ) Να βρεθούν τα σφάλματα ε Βρίσκουμε πρώτα τις θεωρητικές συχνότητες: 90 65 π.χ. e = = 9,5 00 Παρόμοια, 05.65 e = =,75, e = 00 90.5 00 Πίνακας θεωρητικών συχνοτήτων 6 7 9,5 7,5,75 4,75 8,5,75 4,75 8,5 Τα σφάλματα βρίσκονται από τον τύπο: ε = - e συνεπώς ο πίνακας για τα σφάλματα είναι 6 7 0,5,5-0,5 6,5-8,5 0 -,75-8,75 7,5 0 0 0 0 = 7,5 κλπ.