ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Σχετικά έγγραφα
2) Περιγραφή ιακριτών Ποσοτικών εδοµένων

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Περιγραφική Στατιστική

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Βιοστατιστική ΒΙΟ-309

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Εισαγωγή στη Στατιστική

Περιγραφική Στατιστική

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Έτος : Διάλεξη 2 η Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

i Σύνολα w = = = i v v i=

ΜΕΘΟΔΟΛΟΓΙΕΣ & ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΑ ΜΑΘΗΜΑΤΙΚΑ Γ ΕΠΑΛ ΚΕΦΑΛΑΙΟ 1 Ο «ΣΤΑΤΙΣΤΙΚΗ»

ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 2 Ο

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ. B. Πώς ορίζεται ο συντελεστής μεταβολής ή συντελεστής. μεταβλητότητας μιας μεταβλητής X, αν x > 0 και πώς, αν

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

ΚΕΦΑΛΑΙΟ 2 Γ ΙΕΥΘΥΝΣΗ ΑΘΗΝΑΣ - 5 Ο ΓΡΑΦΕΙΟ ΣΧΟΛΙΚΟ ΕΤΟΣ ΠΕΡΙΓΡΑΦΗ ΤΩΝ Ε ΟΜΕΝΩΝ ΜΕ ΑΡΙΘΜΗΤΙΚΕΣ ΚΑΙ ΓΡΑΦΙΚΕΣ ΜΕΘΟ ΟΥΣ

2.3. Ασκήσεις σχ. βιβλίου σελίδας Α ΟΜΑ ΑΣ

δεδομένων με συντελεστές στάθμισης (βαρύτητας)

Βιοστατιστική ΒΙΟ-309

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Βιοστατιστική ΒΙΟ-309

ΘΕΜΑ Α Α1. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι ( f (x) + g(x)

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΗΜΟΣΘΕΝΕΙΟ ΓΕΝΙΚΟ ΛΥΚΕΙΟ ΠΑΙΑΝΙΑΣ Γ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 2ο: ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑ Α

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΚΕΦΑΛΑΙΟ 8 ΤΟ ΜΑΘΗΜΑ ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

Θέμα Α. Θέμα Β. ~ 1/9 ~ Πέτρος Μάρκου. % σχεδιάζουμε το πολύγωνο αθροιστικών σχετικών συχνοτήτων τοις

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ

15, 11, 10, 10, 14, 16, 19, 18, 13, 17

Μάθηµα 14. Κεφάλαιο: Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Κεφάλαιο 5 Δείκτες Διασποράς

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Mέτρα (παράμετροι) θέσεως

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΦΥΛΛΑΔΙΟ ΑΣΚΗΣΕΩΝ ΣΤΑΤΙΣΤΙΚΗΣ ΠΑΝΟΣ ΣΑΡΑΚΗΝΟΣ

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

g( x) ( g( x)) ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΕΘΟΔΟΛΟΓΙΑ & ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΕΦΑΛΑΙΟ 2 Ο «ΣΤΑΤΙΣΤΙΚΗ»

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΔΕΟ 13 ΤΟΜΟΣ Δ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΘΕΜΑ Α Α1. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι ( f (x) + g(x)

ΘΕΜΑ Α Α1. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι ( f (x) + g(x)

Πίνακας κατανοµής συχνοτήτων και αθροιστικών συχνοτήτων. Σχετ.

I2. Αριθμητικά περιγραφικά μέτρα

ΘΕΜΑ Α Α1. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι ( f (x) + g(x)

F(x h) F(x) (f(x h) g(x h)) (f(x) g(x)) F(x h) F(x) f(x h) f(x) g(x h) g(x) h h h. lim lim lim f (x) g (x). h h h

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

επ. Κωνσταντίνος Π. Χρήστου

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2012 ΕΚΦΩΝΗΣΕΙΣ

ΕΝΔΕΙΚΤΙΚΕΣ ΛΥΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΜΑΪΟΣ 2018 ΜΑΘΗΜΑΤΙΚΑ (ΑΛΓΕΒΡΑ) Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΕΠΑΛ

ΚΕΦΑΛΑΙΟ 6 ΚΟΙΝΟΙ ΥΠΟΨΗΦΙΟΙ

Εισαγωγή στη Στατιστική

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Υπολογισμοί Παραμέτρων Πληθυσμού και Στατιστικών Δείγματος

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

ΜΕΘΟΔΟΛΟΓΙΑ & ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΕΦΑΛΑΙΟ 2 Ο «ΣΤΑΤΙΣΤΙΚΗ»

Παράδειγμα. Χρονολογικά δεδομένα. Οι πωλήσεις μιας εταιρείας ανά έτος για το διάστημα (σε χιλιάδες $)

P(A ) = 1 P(A). Μονάδες 7

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Transcript:

9/10/009 ΤΕΙ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 3o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Emal: gasl@math.auth.gr Ιστοσελίδα Μαθήματος: users.auth.gr/gasl kastora.tekoz.gr/elearn 1 Διαγράμματα Συνεχών Μεταβλητών Για να παραστήσουμε γραφικά μια συνεχή μεταβλητή κάνουμε ιστόγραμμα συχνοτήτων και πολύγωνο συχνοτήτων είτε των και f είτε των αθροιστικών N και F. Τα ιστογράμματα είναι χρήσιμα γιατί μας βοηθούν να έχουμε μία πρώτη εικόνα για την κατανομή της μεταβλητής. 1

9/10/009 Τρόπος Κατασκευής Ιστογράμματος και Πολυγώνου συχνοτήτων Για να κάνουμε το ιστόγραμμα συχνοτήτων του Ύψους των μαθητών ακολουθούμε τα παρακάτω βήματα: Στον οριζόντιο άξονα ενός συστήματος ορθογωνίων αξόνων βάζουμε τα κέντρα των κλάσεων ή τις κλάσεις και στον κάθετο άξονα τις συχνότητες ή f ανάλογα με το ιστόγραμμα που θέλουμε να κάνουμε. Στη συνέχεια κατασκευάζουμε ορθογώνια με ίσο πλάτος και ύψος ίσο με την συχνότητα ή f. Αν επιπλέον θέλουμε να κάνουμε το πολύγωνο συχνοτήτων τότε ενώνουμε τα μέσα των άνω βάσεων των ορθογωνίων. 3 Τρόπος Κατασκευής Ιστογράμματος και Πολύγωνου Αθροιστικών Συχνοτήτων. Για να κατασκευάσουμε το ιστόγραμμα και το πολύγωνο Αθροιστικών συχνοτήτων ακολουθούμε όλη την παραπάνω διαδικασία με την διάφορα ότι στην κατασκευή του πολύγωνου ενώνουμε τα δεξιά άκρα των ορθογωνίων και όχι τα μέσα όπως προηγουμένως. 4

9/10/009 Ιστόγραμμα Συχνοτήτων Μεταβλητής Ύψος Μαθητών 14 1 10 Συχνότητες 8 6 4 0 (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] Κλάσεις 5 Ιστόγραμμα & Πολύγωνο Συχνοτήτων Μεταβλητής Ύψος Μαθητών 14 1 10 8 6 4 0 (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] [19-00] 6 3

9/10/009 Ιστόγραμμα Αθροιστικών Σχετικών % Συχνοτήτων 100 90 80 70 60 50 40 30 0 10 0 (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] 7 100 Ιστόγραμμα & Πολύγωνο Αθροιστικών Σχετικών % Συχνοτήτων Ζ Η 90 80 Ε 70 60 50 40 30 Γ 0 10 0 Β Α (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] 8 4

9/10/009 Άσκηση: Οι χρόνοι (σε λεπτά) που χρειάστηκαν 55 σπουδαστές για να λύσουν μία άσκηση δίνονται στον παρακάτω πίνακα: 3,4 13, 6,7 1,4 1,3 3,8 3,9,9 13,8 3,9,7 4,4 3,6 1,4,4 3,6 3,1 7,5 6,9 7,8 1,7 3,9 3,3 9,7,0 4,4 3,3 8,7 3,9 11,6 5,6 9,0 3,4 1,4 3,5,8 10,4 11,9 1,3,9,8 1,5 4,1 5,9 3,1 8,7,8 3,8 13,0 3,0 6,4 3, 5,9 7,0 8, α) Να ομαδοποιήσετε τα δεδομένα σε κατάλληλο αριθμό κλάσεων β) Να κατασκευάσετε τον πίνακα συχνοτήτων γ) Να κατασκευάσετε το πολύγωνο σχετικών συχνοτήτων και αθροιστικών σχετικών συχνοτήτων. 9 Αριθμητικά περιγραφικά μέτρα στατιστικών δεδομένων Η βαθμολογία δύο τμημάτων μαθητών στο μάθημα της Στατιστικής δίνεται στους παρακάτω πίνακες: 8 11 13 14 15 16 17 16 18 19 Τμήμα Α 9 11 14 15 15 17 16 17 18 0 10 1 13 16 17 15 17 14 16 18 8 15 16 17 14 17 13 16 18 16 Τμήμα Β 1 13 11 14 18 13 16 19 17 15 8 15 17 13 0 16 0 11 19 16 10 5

9/10/009 Πίνακες Συχνοτήτων Βαθμο Τμήμα Α Τμήμα Β x ί Συχνότητες Συχνότητες 8 1 9 1 0 10 1 0 11 1 1 1 13 4 14 3 15 4 3 16 5 6 17 5 4 18 3 19 1 0 1 Σύνολο 30 30 Αν θέλουμε να συγκρίνουμε τα δύο τμήματα δεν μπορούμε να βγάλουμε κάποιο συμπέρασμα από τους πίνακες συχνοτήτων. 11 Διαγράμματα Συχνοτήτων ιάγραμμα Συχνοτήτων Βαθμολογίας για το τμήμα Α ιάγραμμα Συχνοτήτων Βαθμολογίας για το τμήμα Β 6 6 5 5 4 4 3 3 1 1 0 8 9 10 11 1 13 14 15 16 17 18 19 0 0 8 9 10 11 1 13 14 15 16 17 18 19 0 Παρατηρούμε ότι η βαθμολογία είναι συγκεντρωμένη γύρω από το 16 και ότι το τμήμα Β παρουσιάζει διαφορετική διασπορά σε αντίθεση με το τμήμα Α. 1 6

9/10/009 Ο πίνακας συχνότητας καθώς επίσης και τα γραφήματα αποτελούν μορφές συνοπτικής παρουσίασης των δεδομένων για να μελετήσουμε την κατανομή τους. Στη συνέχεια έ θ υπολογίσουμε θα λ ί ποσοτικά ά μεγέθη έθ που περιγράφουν με περιληπτικό τρόπο τα βασικά χαρακτηριστικά των δεδομένων και λέγονται αριθμητικά περιγραφικά μέτρα. Κάθε τέτοιο αριθμητικό μέτρο υπολογίζεται από το δείγμα και αποτελεί εκτίμηση της παραμέτρου ( αριθμητικό μέτρο που υπολογίζεται από τον πληθυσμό ) 13 Θα δούμε τους παρακάτω τύπους αριθμητικών περιγραφικών μέτρων: τα μέτρα θέσης ή μέτρα κεντρικής τάσης που προσδιορίζουν χαρακτηριστικές θέσεις των δεδομένων ¾ τα μέτρα μεταβλητότητας που δίνουν περιληπτικά τη διασκόρπιση και μεταβλητότητα των δεδομένων ¾ τα μέτρα ασυμμετρίας που ελέγχουν κατά πόσο είναι συμμετρική ή ασύμμετρη η κατανομή των δεδομένων. ¾ 14 7

9/10/009 Μέτρα θέσης ή κεντρικής τάσης Τα κυριότερα μέτρα θέσης είναι τα παρακάτω: 1) Δειγματική μέση τιμή ή αριθμητικός μέσος ) Δειγματική διάμεσος 3) Δειγματική επικρατούσα τιμή 4) Εκατοστιαία σημεία ή p-ποσοστιαία σημεία 15 1) Δειγματική μέση τιμή (aerage) Έστω x1, x,, xn οι τιμές των παρατηρήσεων του δείγματος για μια μεταβλητή Χ που μελετάμε. Η δειγματική μέση τιμή συμβολίζεται με x και ορίζεται ως x = x1 + x +L + x = x =1 16 8

9/10/009 Αν τα δεδομένα είναι ταξινομημένα σε πίνακα συχνοτήτων τότε x 1 + x + + L + x + L + k 1 k k = 1 x ή = 1 k = x x = x 1f1 + x f + L + x k f k = x f k = 1 17 Παράδειγμα: ίνεται η βαθμολογία 10 σπουδαστών στο μάθημα της Στατιστικής. Ποια είναι η μέση επίδοση των σπουδαστών. Βαθμοί: 5, 6, 6, 8, 4, 1, 9, 3, 10, 5. 5+ 6+ 6+ 8+ 4+ 1+ 9+ 3+ 10+ 5 x= = 5.7 10 18 9

9/10/009 ) Δειγματική διάμεσος (medan) Αν οι τιμές του δείγματος έχουν διαταχθεί σε αύξουσα σειρά η διάμεσος δ ορίζεται ως η μεσαία παρατήρηση αν το πλήθος των τιμών είναι περιττός αριθμός, ή ως το ημιάθροισμα των δύο μεσαίων τιμών αν το πλήθος είναι άρτιος αριθμός. Χ +1, δ= 1 Χ + Χ +, αν περιττός αν άρτιος 19 Ιδιότητες της Διαμέσου. α) Αν το πλήθος των δεδομένων είναι μεγάλο και αν οι τιμές δεν επαναλαμβάνονται τακτικά, τότε περίπου οι μισές τιμές είναι μικρότερες της διαμέσου και οι άλλες μισές μεγαλύτερες της διαμέσου. β) Η διάμεσος δεν επηρεάζεται από τις ακραίες τιμές. μ ς 0 10

9/10/009 Παράδειγμα: Έστω οι τιμές μίας μεταβλητής είναι: 1, 19, 16, 0, 17,, 13, 19. Ποια είναι η διάμεσος; ιατάσουμε σε αύξουσα σειρά 1, 13, 16, 17, 19, 19, 0, Η διάμεσος είναι δ = (17+19)/ = 18 1 Παράδειγμα: Έστω οι τιμές μίας μεταβλητής είναι: 4, 7, 8, 0, 5, 3, 8, 3, 9. Ποια είναι η διάμεσος; ιατάσουμε σε αύξουσα σειρά 3, 3, 4, 5, 7, 8, 8, 9, 0 Η διάμεσος είναι δ = 7 11

9/10/009 Για συνεχή ποσοτικά δεδομένα που είναι ομαδοποιημένα σε πίνακα συχνοτήτων για να βρούμε την διάμεσο χρησιμοποιούμε τη σχέση: δ = a + N 1 c a N 1 : κατώτερο όριο της κλάσης που περιέχει τη διάμεσο, : συχνότητα της κλάσης που περιέχει τη διάμεσο, : αθροιστική συχνότητα της προηγούμενης της κλάσης που περιέχει τη διάμεσο, c : πλάτος κλάσης. 3 Παράδειγμα: ίνεται ο πίνακας συχνοτήτων για το χρόνο που χρειάστηκαν 35 ποντίκια για να τρέξουν ένα λαβύρινθο. Να βρεθεί η διάμεσος. Χρόνος Συχνότητα Αθρ. Συχνότητα [368,380) 1 1 [380,39) 3 4 [39,404) 8 1 [404,416) 416) 1 4 [416,48) 8 3 [48,440) 3 35 4 1

9/10/009 Λύση: Η διάμεσος ανήκει στην κλάση [404,416). Άρα α = 404 = 1 N-1 = 1 c = 1 Έτσι αντικαθιστώντας βρίσκουμε δ = 409,5 5 3) Δειγματική επικρατούσα τιμή Αν x1, x,, xn οι τιμές του δείγματος τότε η επικρατούσα τιμή είναι η τιμή της μεταβλητής με τη μεγαλύτερη συχνότητα. Αν όλες οι τιμές έχουν την ίδια συχνότητα δεν ορίζεται επικρατούσα τιμή. Αν δύο ή περισσότερες τιμές έχουν την ίδια συχνότητα τότε υπάρχουν περισσότερες από μία επικρατούσες τιμές. 6 13

9/10/009 Παράδειγμα. Αν οι τιμές της μεταβλητής είναι: 1, 19, 16, 0, 17,, 13, 19 τότε η επικρατούσα τιμή είναι η 19. Παράδειγμα. Αν οι τιμές της μεταβλητής είναι: 4, 7, 8, 0, 5, 3, 8, 3, 9 τότε υπάρχουν δύο επικρατούσες τιμές, η 3 και η 8. Σημείωση. Αν μία μεταβλητή έχει δύο (ή περισσότερες) επικρατούσες τιμές ονομάζεται δίκορφη (η πολύκορφη, αντίστοιχα). 7 Παρατηρήσεις: 1) Η επικρατούσα τιμή σε δεδομένα που είναι ομαδοποιημένα σε πίνακα συχνοτήτων είναι η κεντρική τιμή της κλάσης που έχει τη μεγαλύτερη συχνότητα. ) Η επικρατούσα τιμή ορίζεται και για ποιοτικά δεδομένα. 8 14

9/10/009 4) Εκατοστιαία σημεία ή p-ποσοστιαία σημεία (percentles) Μία παρατήρηση είναι το p-εκατοστιαίο σημείο (p ποσοστιαίο σημείο) αν ποσοστό (p-ποσοστιαίο παρατηρήσεων το πολύ p% είναι μικρότερες απ αυτήν την παρατήρηση. Συμβολίζουμε με Pp. ¾ Το τριακοστό εκατοστημόριο P30 ορίζεται ως η τιμή της μεταβλητής κάτω από την οποία βρίσκεται το 30% των τιμών της μεταβλητής β ¾ Το πεντηκοστό εκατοστημόριο P50 ορίζεται ως η τιμή της μεταβλητής κάτω από την οποία βρίσκεται το 50% των τιμών της μεταβλητής, δηλαδή η διάμεσος 9 Τρόπος εύρεσης των Pp Μη ταξινομημένα δεδομένα: 1) ιατάσσουμε τις τιμές της μεταβλητής σε αύξουσα σειρά. Βρίσκουμε τη θέση των Pp χρησιμοποιώντας τον τύπο: θέση του Pp = p(+1)/100. Αν προκύπτει ρ ωςς θέση η του Pp δεκαδικόςς αριθμός της μορφής a,b τότε ) Pp = X(a) + 0, b (X(a+1) X(a) ) 30 15

9/10/009 Παράδειγμα: Υποθέτουμε ότι έχουμε τις ακόλουθες 14 παρατηρήσεις, κατ αύξουσα σειρά μεγέθους: 3,5,8,10,11,14,18,0,,5,31,48,67,9. Θέλουμε το τριακοστό ποσοστιαίο σημείο. Λύση: Θέση του P 30 : 30(14+1)/100 = 4,5 Άρα P 30 = Χ (4) + 0,5( Χ (5) - Χ (4) ) = 10 + 0,5(11-10) = 10,5 31 Ταξινομημένα δεδομένα: P p = a + c p 100 N 1 a : κατώτερο όριο της κλάσης που περιέχει το p-ποσοστιαίο σημείο, : συχνότητα της κλάσης που περιέχει το p-ποσοστιαίο σημείο, 1 : αθροιστική συχνότητα της προηγούμενης ης της κλάσης που περιέχει το p-ποσοστιαίο σημείο, N c : πλάτος κλάσης. : μέγεθος του δείγματος 3 16

9/10/009 Σύγκριση Μέσης Τιμής, ιαμέσου & Επικρατούσης Τιμής. Μέση Τιμή Διάμεσος Επικρατούσα Τιμή Μεγάλη Εφαρμογή στη Καθόλου εφαρμογή σε Καθόλου εφαρμογή σε στατιστική ανάλυση περαιτέρω στατιστική περαιτέρω στατιστική ανάλυση ανάλυση Εύκολα Κατανοητή Εύκολα Κατανοητή Εύκολα Κατανοητή Επηρεάζεται από ακραίες τιμές εν υπολογίζεται σε ποιοτικά δεδομένα εν επηρεάζεται από ακραίες τιμές εν υπολογίζεται σε ποιοτικά δεδομένα εν επηρεάζεται από ακραίες τιμές Εφαρμόζεται σε ποιοτική μεταβλητή Μοναδική Μοναδική Δεν ορίζεται μονοσήμαντα 33 Ασκήσεις Άσκηση 1. Ο παρακάτω πίνακας δίνει τον αριθμό των επισκέψεων 40 μαθητών σε διάφορα μουσεία της χώρας κατά την διάρκεια ενός έτους. Επισκέψεις Συχνότητα [0,) 8 [,4) 1 [4,6) 10 [6,8) 6 [8,10) 4 Να υπολογιστούν: α) η μέση τιμή β) η διάμεσος γ) η επικρατούσα τιμή δ) το 40ο ποσοστιαίο σημείο 34 17

9/10/009 Άσκηση. Τα δεδομένα του παρακάτω πίνακα είναι οι τιμές μιας ραδιενεργού ουσίας που βρέθηκε στον οργανισμό 60 μικρών ζώων μετά την έκθεση τους σε μία ραδιενεργό πηγή, η οποία γενικώς θεωρείται επικίνδυνη. 3 7 8 6 7 4 9 8 9 10 10 1 10 10 9 11 9 7 10 8 5 10 9 7 5 11 11 8 8 4 9 8 10 9 8 8 1 9 9 9 8 9 6 9 8 10 10 7 9 9 7 11 7 6 9 8 9 9 10 6 Να υπολογιστούν α) η μέση τιμή β) η διάμεσος γ) η επικρατούσα τιμή και δ) το 30ο ποσοστιαίο σημείο. 35 Άσκηση 3. Η κατανομή των ημερήσιων αποδοχών των υπαλλήλων μιας επιχείρησης έχει ως εξής: Ημερήσιες αποδοχές σε ευρώ Άτομα [30,40) 4 [40,50) 6 [50,60) 8 [60,70) 1 [70,80) 9 [80,90) 7 [90,100) 4 Ζητούνται να βρεθούν: α) η μέση τιμή β) η διάμεσος γ) η επικρατούσα τιμή και δ) το 0ο ποσοστιαίο σημείο. 36 18

9/10/009 ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ Γενικά, σε μία κατανομή συχνοτήτων, εκτός από τη γνώση των μέτρων θέσης ενδιαφέρει να γνωρίζουμε και πώς διασκορπίζονται οι τιμές της μεταβλητής γύρω από τη μέση τιμή ή και μεταξύ τους. Επομένως είναι απαραίτητη η χρησιμοποίηση στατιστικών μέτρων που μετρούν τον βαθμό της διασποράς των τιμών μιας μεταβλητής. Τα μέτρα αυτά ονομάζονται μέτρα διασποράς. 37 Τα κυριότερα μέτρα διασποράς είναι: 1) Εύρος δείγματος ) Δειγματική διακύμανση ή δειγματική διασπορά 3) Δειγματική τυπική απόκλιση 4) Ενδοτεταρτημοριακό εύρος 38 19

9/10/009 Εύρος δείγματος Εύρος δείγματος ονομάζεται η διαφορά ανάμεσα στη μεγαλύτερη και τη μικρότερη τιμή του. του Συμβολίζουμε με R και είναι R = Xmax - Xmn 39 Δειγματική διακύμανση ή διασπορά Η διακύμανση ή διασπορά μετρά τη μεταβλητότητα των παρατηρήσεων γύρω από τη μέση τιμή. Αν ορίσουμε την απόκλιση μιας παρατήρησης x από τη μέση τιμή x ως α φανερό φα ερό ό ο άθρο σμα όλων ό ω αυτών αυ ώ των ω x x, εείναι ότι το άθροισμα αποκλίσεων είναι ίσο με 0. Γι αυτό διαλέγουμε να αθροίσουμε όχι τις αποκλίσεις αλλά τα τετράγωνα των αποκλίσεων. Επίσης για να πάρουμε ένα μέτρο της μέσης απόκλισης θα πρέπει να διαιρέσουμε με το πλήθος ν των παρατηρήσεων. Για τεχνικούς λόγους, οι οποίοι δεν θα μας απασχολήσουν, διαιρούμε με ν 1 αντί για ν και η δειγματική διασπορά s δίνεται ως: (x - x ) ( x - x) + (x - x) +L+ (x - x) = = s 1-1 =1-1 40 0

9/10/009 Σε περίπτωση που τα δεδομένα είναι ταξινομημένα τότε: x : κέντρα των κλάσεων : συχν. των κλάσεων s = k = 1 ( x - x ) Σημείωση: οι μονάδες στις οποίες εκφράζεται η διακύμανση δα είναι τα τετράγωνα των μονάδων των τιμών της μεταβλητής. Για αυτό ορίζουμε: - 1 41 Δειγματική τυπική απόκλιση Δειγματική τυπική απόκλιση s ονομάζεται η θετική τετραγωνική ρίζα της δειγματικής διασποράς s, δηλαδή: s = s Η τυπική απόκλιση μετριέται στην ίδια μονάδα μέτρησης με τα δεδομένα και εκφράζει την τυπική απόκλιση των δεδομένων από τη δειγματική μέση τιμή, δηλαδή μέχρι πόσο περιμένουμε μια τυπική τιμή της μεταβλητής να απέχει από τη μέση τιμή. 4 1

9/10/009 Παράδειγμα: Να βρεθεί η διακύμανση και η τυπική απόκλιση των τιμών: 100,105,115,10,15,135,140 Λύση: Η μέση τιμή είναι x 100+ 105+ 115+ 10+ 15+ 135+ 140 x = = = 10 7 43 x 100 105 115 10 15 135 140 x -0-15 -5 0 5 15 0 x ( ) x x 400 5 5 0 5 5 400 Σύνολο 1300 Οπότε θα έχουμε: s ( x x) 1300 = = = 1 6 16,66 s = s = 14,7 44

9/10/009 Ενδοτεταρτημοριακό εύρος Το 5 ποσοστιαίο σημείο ( ο ορισμός του ποσοστιαίου σημείου υπάρχει σε προηγούμενη διαφάνεια) ονομάζεται πρώτο τεταρτημόριο και το συμβολίζουμε Q1, το 50 ποσοστιαίο σημείο ονομάζεται δεύτερο τεταρτημόριο και το συμβολίζουμε Q ενώ το 75 ποσοστιαίο σημείο ονομάζεται τρίτο τεταρτημόριο και το συμβολίζουμε Q3. Η διαφορά Q3 - Q1 λέγεται ενδοτεταρτημορικό εύρος και δίνει το εύρος που καλύπτουν τα μισά από τα δεδομένα που είναι ποιο κοντά στην κεντρική τιμή ( διάμεσο ). 45 Συντελεστής Μεταβλητότητας (coeffcent of araton) Οι παράμετροι Θέσης & ιασποράς δεν επαρκούν για να μας δώσουν πληροφορίες όταν θέλουμε να συγκρίνουμε ομάδες τιμών οι οποίες είτε εκφράζονται στην ίδια μονάδα μέτρησης είτε σε διαφορετικές μονάδες μέτρησης. Παράδειγμα. Θέλουμε να συγκρίνουμε τις κατανομές των μηνιαίων μισθών στην Αμερική & στην Ευρώπη, αν είναι γνωστό ότι x A = 1500$ με s A = 400$ ενώ x Ε = 1000 Ε με s Ε = 350Ε. Παράδειγμα. Σε δύο τμήματα μαθητών παρατηρήσαμε ότι ο βαθμός τους στο μάθημα της Στατιστικής είχε: x A = 15 με s A = 4 ενώ x B = 16 με s B = 4. Τα δύο τμήματα παρουσιάζουν την ίδια διακύμανση? 46 3

9/10/009 Για να αποφύγουμε τις παραπάνω δυσκολίες ορίζουμε ως συντελεστή μεταβολής τον καθαρό αριθμό (βαθμός s διασποράς) για τον οποίο ισχύει ότι: CV = 100 %. x Εκφράζεται επί τοις εκατό και παριστάνει ένα μέτρο σχετικής διασποράς. Εκφράζει δηλαδή τη μεταβλητότητα των δεδομένων απαλλαγμένη από την επίδραση της μέσης τιμής. Σημείωση: Όσο μικρότερος είναι ο συντελεστής μεταβλητότητας τόσο μεγαλύτερη ομοιογένεια υπάρχει στις τιμές της μεταβλητής. Αν CV 10% τότε το δείγμα μας ονομάζεται ομοιογενές. 47 Παράτυπα Σημεία ¾ ¾ Μία τιμή πολύ μεγάλη ή πολύ μικρή σε σχέση με τις μ ςμ β η ής Χ ονομάζεται μ ζ υπόλοιπεςς τιμές μίαςς μ μεταβλητής παράτυπο σημείο (outler). Ονομάζουμε z-score μίας τιμής x ενός συνόλου δεδομένων την απόσταση της τιμής αυτής από τη μέση τιμή, μετρούμενη σε μονάδες τυπικής απόκλισης, δηλαδή: z= x x s Θετικά z-scores έχουν οι τιμές δεξιά της μέσης τιμής, ενώ αρνητικά οι τιμές αριστερά της μέσης τιμής. Οι τιμές που έχουν z-scores μεγαλύτερα του 3 ή μικρότερα του -3 είναι πιθανά παράτυπα σημεία. 48 4