ΠΙΘΑΝΟΤΗΤΕΣ - ΣΦΑΛΜΑΤΑ - ΣΤΑΤΙΣΤΙΚΗ

Σχετικά έγγραφα
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Περιγραφική Στατιστική

Περιγραφική Στατιστική

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Είδη Μεταβλητών. κλίµακα µέτρησης

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΚΕΦΑΛΑΙΟ. 1. α. Tι ονοµάζεται συνάρτηση από το σύνολο Α στο σύνολο Β; β. Tι ονοµάζεται πραγµατική συνάρτηση πραγµατικής µεταβλητής;

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Εισαγωγή στη Στατιστική

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

Εισαγωγή στη Στατιστική Μάθημα του Β Εξαμήνου

Κεφάλαιο 5. Οι δείκτες διασποράς

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΘΕΜΑ Α Α1. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι ( f (x) + g(x)

Εφαρμοσμένη Στατιστική

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

3 η ΕΡΓΑΣΙΑ , , , , , , , , , , , ,189

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

i Σύνολα w = = = i v v i=

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Mέτρα (παράμετροι) θέσεως

Εισαγωγή στη Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Στατιστική Επιχειρήσεων Ι

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Αριθμητικά περιγραφικά μέτρα II. Μέτρα κεντρικής θέσης

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

Αν Α και Β είναι δύο ενδεχόμενα ενός δειγματικού χώρου να αποδείξετε ότι: Αν Α Β τότε Ρ(Α) Ρ(Β)

, και για h 0, . Άρα. Α2. Μια συνάρτηση f λέγεται γνησίως αύξουσα σε ένα διάστημα Δ του πεδίου ορισμού της, όταν για οποιαδήποτε σημεία x.

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Συναρτήσεις. Ορισμός Συνάρτησης

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Στατιστική Ι Ασκήσεις 3

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

15, 11, 10, 10, 14, 16, 19, 18, 13, 17

Στατιστική Ι. Ενότητα 1: Βασικές Έννοιες. Δρ. Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

Δρ. Ευστρατία Μούρτου

ΘΕΜΑΤΑ ΚΑΙ ΑΠΑΝΤΗΣΕΙΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΕΞΕΤΑΣΕΩΝ 2012 ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

I2. Αριθμητικά περιγραφικά μέτρα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Μάθηµα 3 ο. Περιγραφική Στατιστική

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Transcript:

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΦΑΛΜΑΤΑ - ΣΤΑΤΙΣΤΙΚΗ Διδάσκoυσα: Ελενα Φλόκα, Αναπλ. Καθηγήτρια (γραφείο Γ19, κτίριο 5, 3 ος όροφος) e-mail: efloca@phys.uoa.gr Τομέας Φυσικής Περιβάλλοντος - Μετεωρολογίας Τμήμα Φυσικής Κτίριο 5, 1 ος όροφος

Δεύτερη ενότητα Ομαδοποίηση δεδομένων Στατιστικές παράμετροι Δειγματοληπτικές κατανομές Ελεγχοι υποθέσεων -Διαστήματα εμπιστοσύνης Παραμετρικοί έλεγχοι υποθέσεων των δειγματικών στατιστικών παραμέτρων Ελεγχοι καλής προσαρμογής Παλινδρομική ανάλυση-συσχέτιση

ΣΧΕΤΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ Μαθήματα Εφαρμοσμένης Στατιστικής. Λιώκη- Λειβαδά Η και Δ.Ν. Ασημακόπουλος. Εκδόσεις Μ. Αθανασοπούλου Σ. Αθανασόπουλος Ο.Ε., 2010. Εισαγωγή στις Πιθανότητες και στη Στατιστική, Χ. Δαμιανός, Ν. Παπαδάτος και Χ. Χαραλαμπίδης, Εκδόσεις Συμμετρία, 2010. Introductory Statistics. Ross S.McGraw Hill Companies, 1996. Statistical methods in atmospheric sciences-an introduction. D. Wilks, Academic Press, 1995.

ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Πληθυσμός Σύνολο ατόμων ή αντικειμένων στα οποία αναφέρονται οι παρατηρήσεις Δείγμα Υποσύνολο του πληθυσμού που επιλέχτηκε τυχαία Μεταβλητή Το χαρακτηριστικό μέγεθος το οποίο μελετάμε στον πληθυσμό ή το δείγμα

ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Ποσοτική μεταβλητή Η μεταβλητή που επιδέχεται μέτρηση με πραγματικές τιμές Ποιοτική μεταβλητή Η μεταβλητή που δεν επιδέχεται μέτρηση και εκφράζεται με λέξεις Ποσοτικές μεταβλητές Συνεχείς Ασυνεχείς ή διακριτές

ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Συχνότητα (ν i ) Πόσες φορές μια τιμή x i της μεταβλητής Χ παρουσιάζεται στο δείγμα k Μέγεθος του δείγματος (N) i 1 vi N Σχετική Συχνότητα (f i %) fi vi N x100% k i 1 fi 100% Αθροιστική συχνότητα (cf i ) δεξιόστροφη (αριστερόστροφη) Το άθροισμα των συχνοτήτων v i των τιμών που είναι μικρότερες (μεγαλύτερες) ή ίσες της τιμής x i Σχετική Αθροιστική συχνότητα (cf i %) δεξιόστροφη (αριστερόστροφη) Το άθροισμα των σχετικών συχνοτήτων f i των τιμών που είναι μικρότερες (μεγαλύτερες) ή ίσες της τιμής x i

Αθροιστική συχνότητα (%) Αθροιστική συχνότητα (%) Σχετική Αθροιστική συχνότητα 100 100 90 90 80 80 70 70 60 60 50 40 30 20 50 40 30 20 10 10 0 0 1 2 3 4 5 Κλίμακα Beaufort 0 0 1 2 3 4 5 Κλίμακα Beaufort τάξη 1 2 3 4 5 6 f 9.5 23.9 30.8 25.1 9.8 0.9 cf 9.5 33.4 64.2 89.3 99.1 100 τάξη 1 2 3 4 5 6 f 9.5 23.9 30.8 25.1 9.8 0.9 cf 100 90.5 66.6 35.8 10.7 0.9 9.5+23.9 Δεξιόστροφη less than Αριστερόστροφη more than 9.8+0.9

Precision Πόσο κοντά είναι οι διαδοχικές μετρήσεις μιας συγκεκριμένης παραμέτρου μεταξύ τους Οταν οι μετρήσεις χαρακτηρίζονται από μικρά τυχαία (στατιστικά) σφάλματα (σφάλματα που προκύπτουν από τον παρατηρητή ή αλλαγές στις πειραματικές συνθήκες και οδηγούν σε διαφορετικές τιμές της ίδιας παραμέτρου μεταξύ διαδοχικών μετρήσεων). Δεν διορθώνεται η μέτρηση

Precision Good Precision

Precision Poor Precision

Accuracy Πόση είναι η διαφορά μεταξύ μιας μέτρησης και της πραγματικής τιμής (πόσο είναι το σφάλμα της μέτρησης) Αν το σφάλμα τείνει στο μηδέν, τότε η μέτρηση είναι ακριβής. Οταν οι μετρήσεις χαρακτηρίζονται από μικρά συστηματικά σφάλματα (σταθερές αποκλίσεις των μετρήσεων που προκύπτουν από βαθμονομήσεις, ελαττωματικά όργανα, λάθη στην παρατήρηση και πειραματικό σχεδιασμό). Μεταβάλλουν μόνο την μέση τιμή

Accuracy Good Accuracy

Accuracy Poor Accuracy

Precision and Accuracy Ενα σύστημα μπορεί να είναι precise αλλά όχι accurate Αντίστροφα, ένα σύστημα μπορεί να είναι accurate, αλλά όχι precise. Το ιδανικό σύστημα: precise and accurate

Precision and Accuracy Good Precision Good Accuracy

ΟΜΑΔΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ Μη ομαδοποιημένα δεδομένα (Raw data): μη οργανωμένα δεδομένα Ομαδοποιημένα δεδομένα (Grouped data): δεδομένα οργανωμένα και παρουσιαζόμενα σε τάξεις (ή κλάσεις) Διάστημα τάξης (Class interval): το διάστημα που επιλέγεται να απέχουν μεταξύ τους τα δεδομένα Συχνότητα τάξης (class frequency): αριθμός μετρήσεων που υπάγονται σε συγκεκριμένη τάξη Όρια τάξης (Class limits): τα αρχικά και τελικά νούμερα κάθε τάξης (ανώτερο, κατώτερο όριο)

ΟΜΑΔΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ Εύρος διαστήματος (Class width or class size): διαφορά μεταξύ ανώτερου και κατώτερου ορίου π.χ. 62-60=2 (+1) (όταν τα όρια είναι ακέραιοι) 62.9-60.9=2 (όταν τα όρια είναι δεκαδικοί) Αντιπροσωπευτική τιμή τάξης (class midpoint): ανώτερο+κατώτερο όριο)/2 Π.χ. (60+62) / 2=61

ΟΜΑΔΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ Παράδειγμα (με ακέραιο) Όρια τάξης Διάστημα τάξης Αντιπροσωπευτική τιμή 60-62 (60+62)/2 =61 Συχνότη τα Σχετική συχνότητα (%) 2 2x100/22 =9.1 63-65 64 4 18.18 66-68 67 7 31.82 69-71 70 9 40.9 Εύρος διαστήματος (62-60)+1=3 N=22

ΟΜΑΔΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ Παράδειγμα (με 1 δεκαδικό) Όρια τάξης Διάστημα τάξης Αντιπροσωπευτική τιμή 60-61.9 (60+62)/2 =61 Συχνότη τα Σχετική συχνότητα (%) 2 2x100/22 =9.1 62-63.9 63 4 18.18 64-65.9 65 7 31.82 66-67.9 67 9 40.9 Εύρος διαστήματος (61.9-60)=1.9 2 N=22

64.99-63 2 ΟΜΑΔΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ Παράδειγμα (με 2 δεκαδικά) Διάστημα τάξης Αντιπροσωπευτική τιμή Συχνότητα Σχετική συχνότ. Χ100% 63-64.99 64 0.036 1 65-66.99 66 0.071 3 1 2 Απόλυτη αθροιστική συχνότητα 67-68.99 68 0.143 7 4 69-70.99.. 70.. 3.. 0.107. 10 Εύρος διαστήματος N=28

Γενικοί κανόνες για ομαδοποίηση Ταξινόμηση των δεδομένων κατά αύξουσα σειρά. Προσδιόρισε το εύρος των μετρήσεων (max-min) Προσδιόρισε τον πιθανό αριθμό διαστημάτων Α=5logN (Ν=σύνολο μετρήσεων ή μέγεθος του δείγματος) Προσδιόρισε το εύρος του διαστήματος: ύ ό ά maxmin A

Γενικοί κανόνες για ομαδοποίηση Ενδείκνυται: Ο αριθμός διαστημάτων να κυμαίνεται μεταξύ 5-20 Τα διαστήματα να έχουν το ίδιο εύρος Το εύρος να είναι 2, 3, 5 ή πολλαπλάσια του 5 Η επιλογή των τάξεων να γίνεται κατά τρόπο ώστε να μη συγκεντρώνεται μεγάλος αριθμός δεδομένων σε μια από τις πρώτες ή τελευταίες τάξεις

Γενικοί κανόνες για ομαδοποίηση Παράδειγμα: N=28 max=79.2 min=63.2 A=5logN=5log28=7.2αριθμός τάξεων= 7 Εύρος τιμών=max-min=79.2-63.2=16 Εύρος διαστήματος=16/72 1η τάξη: 63-64.99 2η τάξη: 65-66.99.

Παράδειγμα Τάξεις διαστημά των Αντιπροσ ωπευτική τιμή Απόλυτη συχνότητα 1 Σχετική συχνότη τα (%) 63-64.99 64 0,036 1 Απόλυτη αθροιστική συχνότητα 65-66.99 66 2 0,071 3 67-68.99 68 4 0,143 7 69-70.99... 70... 3... =28 0,107... =100 Εύρος διαστήματος=63-64.99=2 N=28 10...

N=40 max=111 min=59 A=5logN=5log40=8αριθμός τάξεων= 8 Εύρος τιμών=max-min=111-59=52 Εύρος διαστήματος=52/8 = 6.5 6 ή 7 (τελικά 7) Τάξεις διαστημάτων Αντιπροσωπε υτική τιμή Απόλυτη συχνότητα Σχετική συχνότητα (%) Αθροιστική απόλυτη συχνότητα Αθροιστική σχετική συχνότητα (%) 59-66 62.5 2 5 2 5 67-74 70.5 3 25 5 30 75-82 78.5 12 3 17 33 83-90 86.5 11 28 28 61 91-98 94.5 5 12 33 73 99-106 102.5 4 2 37 75 107-114 110.5 3 25 40 100

Relative frequency (%) ΓΡΑΦΙΚΗ ΑΠΕΙΚΟΝΙΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ ΣΥΝΕΧΟΥΣ ΜΕΤΑΒΛΗΤΗΣ 35 30 25 20 15 10 5 0 60-62 63-65 66-68 69-71 72-74 Class intervals Ιστόγραμμα και πολύγωνο συχνοτήτων

Relative frequency (%) 35 30 25 20 15 10 5 0 60-62 63-65 66-68 69-71 72-74 Class intervals Καμπύλη συχνοτήτων

ΑΠΕΙΚΟΝΙΣΗ ΑΘΡΟΙΣΤΙΚΗΣ ΣΥΧΝΟΤΗΤΑΣ Δεξιόστροφη Ιστογράμματα Αριστερόστροφη 30 25 20 15 10 5 0 63-64.95 65-66.95 67-68.95 69-70.95 71-72.95 73-74.95 75-76.95 77-78.95 Πολύγωνα 79-80.95 100 90 80 70 60 50 40 30 20 10 0 18-19.95 20-21.95 22-23.95 24-25.95 26-27.95 28-29.95

1 Ημιλογαριθμικό διάγραμμα 64 66 68 70 72 74 76 78 80 Δισδιάστατο κυκλικό διάγραμμα 0,036 0,107 0,25 1 0,357 0,1 0,464 0,964 0,714 0,892 0,01 Λογαριθμικό διάγραμμα 0,964 1 0,036 0,107 0,25 0,892 0,357 0,464 0,714 Τρισδιάστατο κυκλικό διάγραμμα

Αριθμός ημερών με άνεμο που ανήκει σε μια από τις παρακάτω διευθύνσεις Απόλυτη Συχνότη τα Β 158 8 Β Β Α 91 8 Β Α 71 3 ΑΒ Α Α 522 60 7 ΑΝ Α 127 3 ΝΑ ΝΝ Α 107 0 Ν 982 120 2 ΝΝ Δ Ν Δ 801 37 0 ΔΝ Δ Δ 641 113 5 ΔΒ Δ 309 7 ΒΔ ΒΒ Δ 353 6 259 3 210 48 (N) Σχετική Συχνότη τα (%) 7,5 4,4 3,4 2,5 2,9 6 5,1 4,7 5,7 3,8 1,8 3 5,4 14, 7 16, 8 12, 3 100 % Ροδόγραμμα

ΠΙΝΑΚΕΣ ΔΙΠΛΗΣ ΕΙΣΟΔΟΥ (ΣΥΝΑΦΕΙΑΣ) Β ΒΑ Α ΝΑ Ν ΝΔ Δ ΒΔ Calm Σf Ασθενής 5,3 6,2 3,4 2,4 1,7 2 2,5 2,9 26,7 Συχνότητα ως προς τη ταχύτητα του ανέμου Μέτριος 15 11 3,2 2,2 4,4 3,2 2,5 5,6 47,4 Ισχυρός 1,1 1 0,2 0 0,2 0,2 0,1 0,4 3,5 Πολύ ισχυρός 0,1 0,1 0 0 0 0 0 0 0,3 Σf 21,6 18,5 7 4,6 6,5 5,6 5,2 9 22,15 100 15 Β Συχνότητα ως προς τη διεύθυνση του ανέμου Προσοχή στον υπολογισμό της σχετικής συχνότητας: ως προς την διεύθυνση ή την ταχύτητα Δ ΒΔ ΝΔ 10 5 0 ΒΑ ΝΑ Α Ασθενής Μέτριος Ισχυρός Πολύ ισχυρός Ν

Διαγράμματα κατανομής συχνοτήτων Πλατύκυρτη, μεσόκυρτη, λεπτόκυρτη συμμετρική Ασύμμετρη: θετικά λοξή Ασύμμετρη: αρνητικά λοξή

ΠΑΡΑΜΕΤΡΟΙ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ Απλός αριθμητικός μέσος (μέση τιμή) Βαρυκεντρικός μέσος (ή σταθμικός) Διάμεσος Επικρατούσα τιμή

Αριθμητικός μέσος (μέση τιμή) X 1 N N i1 xi Αν x 1, x 2, x n Raw δεδομένα x 1 +c, x 2 +c, x 1.c, x 2.c, n i1 (x i X) 0 X X c cx X τότε, k i1 k i1 fixi f i Ομαδοποιημένα δεδομένα Πλεονεκτήματα Εύκολος υπολογισμός Συγκρίσιμο μέγεθος για διαφορετικά δείγματα Μικρό σφάλμα εκτίμησης Μειονέκτημα Μη αντιπροσωπευτικός όταν η κατανομή είναι πολύ ασύμμετρη

Τάξεις διαστημάτ ων Αντιπροσω πευτική τιμή (x j ) Aπόλυτη συχνότητα 63-64.99 64 1 65-66.99 66 2 67-68.99 68 4 69-70.99 70 3 71-72.99 72 3 73-74.99 74 7 75-76.99 76 5 77-78.99 78 2 79-80.99 80 1 Παράδειγμα x=(1x64+2x66+4x68+ 1x80)/28=72.429

Βαρυκεντρικός μέσος X k i1 k i1 aixi Παράδειγμα 1: Θερμοκρασία στις 8πμ Τ 8 Στις 2 μμ Τ 14 Στις 8 μμ Τ 20 Μέση ημερήσια θερμοκρασία (1xΤ 8 +1xT 14 +2XT 20 ) /4 Παράδειγμα 2: Βαθμοί μαθημάτων χ1=15, χ2=17, χ3=18 Βάρος μαθημάτων α1=7, α2=1.5, α3=1 Μέση βαθμολογία=(15x7+17x1.5+18x1)/(7+1.5+1)=15.6 a i

Διάμεσος (median) Η τιμή της μεταβλητής για την οποία υπάρχουν Ν/2 μικρότερες και Ν/2 μεγαλύτερες τιμές από αυτήν στο δείγμα Είναι η τιμή που αντιστοιχεί στο 50% στο διάγραμμα της αθροιστικής συχνότητας Raw δεδομένα Χρειάζεται ταξινόμηση των τιμών σε αύξουσα σειρά Αν Ν=περιττός τότε διάμεσος είναι αριθμός που αντιστοιχεί στη θέση (Ν+1)/2 Αν Ν=άρτιος τότε η διάμεσος ορίζεται ως τη μέση τιμή των δύο αριθμών που αντιστοιχούν στις θέσεις Ν/2 και Ν/2+1 Μειονέκτημα Δεν προσφέρεται για μαθηματική επεξεργασία αμφισβήτηση για Ν=άρτιος

Παράδειγμα: 3,5,6,9,11 Ν=5 Μe=6 6,8,8,9,12,14,17,19 Ν=8 Me=(9+12)/2=10.5

Διάμεσος Me L R f m N 2 ( cfm 1 ) Ομαδοποιημένα δεδομένα όπου: L=Κατώτερο όριο της τάξης που περιέχει τη διάμεσο τιμή R= εύρος τάξης f m =Συχνότητα της τάξης που περιέχει τη διάμεσο N=μέγεθος του δείγματος cf m-1 =αθροιστική συχνότητα που αντιστοιχεί μέχρι την τιμή L

Τάξεις Αντιπροσωπευτι κή τιμή Απόλυτη συχνότητα fi 18-19.95 19 6 6 20-21.95 21 18 24 22-23.95 23 24 48 24-25.95 25 30 78 26-27.95 27 26 104 28-29.95 29 16 120 R=2 N=120 Απόλυτη αθροιστική συχνότητα cfi Cf m-1 Τάξη της διαμέσου L f m 50%x120=60 Me 2 120 24 ( 48) 30 2 24.8

ΕΠΙΚΡΑΤΟΥΣΑ ΤΙΜΗ (MODE) Η τιμή με τη μεγαλύτερη συχνότητα εμφάνισης Mo L 2 f m f m fm f m 1 1 f m 1 R Ομαδοποιημένα δεδομένα όπου: L= κατώτερο όριο της τάξης που περιέχει την επικρατούσα τιμή R=εύρος τάξης f m =συχνότητα της τάξης που περιέχει την επικρατούσα τιμή f m-1 = συχνότητα της προηγούμενης τάξης f m+1 = συχνότητα της επόμενης τάξης Μειονέκτημα Επηρεάζεται από τις τάξεις της κατανομής Πρόβλημα όταν υπάρχουν περισσότερες από μία τιμές

Τάξεις Αντιπροσωπευτι κή τιμή Απόλυτη συχνότητα fi Απόλυτη αθροιστική συχνότητα cfi 18-19.95 19 6 6 20-21.95 21 18 24 F m-1 22-23.95 23 24 48 24-25.95 25 30 78 26-27.95 27 26 104 28-29.95 29 16 120 R=2 N=120 L f m+1 f m Mo 24 (30 24) 2x30 24 26 x2 25.2

ΣΥΓΚΡΙΣΗ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ συμμετρική κατανομή Αρνητικά λοξή κατανομή mean median mode Θετικά λοξή κατανομή mode median mean

ΠΑΡΑΜΕΤΡΟΙ ΔΙΑΣΠΟΡΑΣ Εύρος διακύμανσης Ενδοτεταρτημοριακή διακύμανση ή ενδοδεκαρτημοριακή διακύμανση Μέση απόκλιση Διακύμανση Τυπική απόκλιση Συντελεστής μεταβλητότητας

1. Μέση απόκλιση MD 1 N N 1 xi X 2. Εύρος διακύμανσης R xi(max) xi(min) 3. Ενδοτεταρτημοριακή διακύμανση Q Q3Q1 4. Ημιενδοτεταρτημοριακή διακύμανση Q Όπου Q1, Q3 = πρώτο και τρίτο τεταρτημόριο Q3 Q1 2

Τεταρτημόρια Είναι οι τιμές που αντιστοιχούν στην δεξιόστροφη αθροιστική συχνότητα cf(25%), cf(50%) και xωρίζουν την αθροιστική κατανομή σε 4 ίσα μέρη: Q1 =cf (25%), η τιμή κάτω από την οποία η συχνότητα είναι 25% Q2=cf (50%)=διάμεσος, Q3=cf(75%)=η τιμή κάτω από την οποία η συχνότητα είναι 75% Εκατοστημόρια Qκ=Είναι οι τιμές στην δεξιόστροφη αθροιστική κατανομή cf(k%) που αντιστοιχούν σε συχνότητα μικρότερη ή ίση του κ%. Παράδειγμα: Q90, Q10

Εκατοστημόρια Qi L R fi N 100 ( i cfk ) Ομαδοποιημένα δεδομένα όπου: L=Κατώτερο όριο της τάξης που περιέχει το ζητούμενο Qi R= εύρος τάξης f i =Συχνότητα της τάξης που περιέχει το Qi i=το ζητούμενο εκατοστημόριο (πχ 25, 50, 90) N=μέγεθος του δείγματος cf k =αθροιστική συχνότητα που αντιστοιχεί μέχρι την τιμή L

Τάξεις Αντιπροσωπευτι κή τιμή Απόλυτη συχνότητα fi 18-19.95 19 6 6 20-21.95 21 18 24 22-23.95 23 24 48 24-25.95 25 30 78 26-27.95 27 26 104 28-29.95 29 16 120 R=2 N=120 Απόλυτη αθροιστική συχνότητα cfi Cf κ Τάξη του Q1 L f i 25%x120=30 2 120 Q1 22 (25 24) 24 100 22.5

Διακύμανση 1) ( ) ( 1 ) ( 1 2 1 2 1 2 2 1 N N x x N N X x N i i N i i N i i S N 1 ) ( 1 2 1 2 2 1 N N x f x f k i i i k i i i sn Όταν το Ν>30, τότε μπορεί να χρησιμοποιηθεί το Ν αντί του Ν-1 στον παρανομαστή Raw δεδομένα Ομαδοποιημένα δεδομένα

x 1, x 2, x n s 2 x 1 +c, x 2 +c, s 2 x 1 λ, x 2 λ, λ 2 s 2 Παράδειγμα: Ιδιότητες της διακύμανσης Τάξεις Αντιπροσωπευτι κή τιμή 18-19.95 19 6 20-21.95 21 18 22-23.95 23 24 24-25.95 25 30 26-27.95 27 26 28-29.95 29 16 Απόλυτη συχνότητα fi R=2 N=120 2 s N 1 6.19 2 2 18.21 2 (6.1918.21...16.29).. 19.29 120 1201 2 7.955

Τυπική απόκλιση 1) ( ) ( 1 ) ( 1 2 1 2 1 2 1 N N x x N N X x N i i N i i N i i S N 1 ) ( 1 2 1 2 1 N N x f x f k i i i k i i i sn Raw δεδομένα Ομαδοποιημένα δεδομένα Όταν γίνεται σύγκριση μέσης τιμής και διακύμανσης του δείγματος χρησιμοποιείται η τυπική απόκλιση

ΔΙΟΡΘΩΣΗ SHEPPARD Υπολογισμός διορθωμένης τιμής της τυπικής απόκλισης όταν τα δεδομένα είναι ομαδοποιημένα, το εύρος των διαστημάτων είναι μεγάλο και το δείγμα είναι μικρό sn 1 S 2 N 1 R 2 12 R=εύρος διαστήματος

Συντελεστής μεταβλητότητας CV 100 s X % Δείχνει τη σημαντικότητα της διασποράς ενός δείγματος γύρω από τη μέση τιμή του Για σύγκριση δειγμάτων διαφορετικού μεγέθους ή δειγμάτων διαφορετικών μεταβλητών

x x ΑΣΚΗΣΗ : Το βάρος των 28 μαθητών μιας τάξης δίνεται στον παρακάτω πίνακα 77.4 75.8 75.8 74.5 71.5 68.8 66.6 73.9 70.1 73.0 71.9 66.6 73.4 75.7 76.0 68.8 73.2 79.2 63.2 67.3 73.4 69.7 68.6 70.4 78.0 73.6 76.4 72.3 Ζητείται να υπολογισθούν η διάμεσος και η επικρατούσα τιμή. ΛΥΣΗ 1η 2η 3η 4η 5η 6η 7η 63.2 66.5 66.6 67.3 68.6 68.8 68.8 8η 9η 10η 11η 12η 13η 14η 69.7 70.1 70.4 71.5 71.9 72.3 73.0 15η 16η 17η 18η 19η 20η 21η 73.2 73.4 73.4 73.6 73.9 74.5 75.7 22η 23η 24η 25η 26η 27η 28η 75.8 75.8 76.0 76.4 77.4 78.0 79.2 Επειδή το μέγεθος του δείγματος είναι άρτιος αριθμός (Ν=28) θεωρούμε σαν διάμεσο τιμή τον μέσο όρο των δύο μεσαίων τιμών στην διατεταγμένη σειρά των τιμών του δείγματος ο μέσος όρος της 14 ης τιμής (Ν/2=28/2=14) και της 15 ης τιμής [(Ν/2)+1=15] στη σειρά του Πίνακα είναι η διάμεσος τιμή Μ ε = (73.0+73.2)/2 = 73.1. οι τιμές 68.8 (6 η και 7 η ), 73.4 (16 η και 17 η ) και 75.8 (22 η και 23 η ) εμφανίζονται δύο φορές, ενώ όλες οι άλλες από μία φορά. Ως εκ τούτου έχουμε τρείς επικρατούσες τιμές (Μ ο ).

ΑΣΚΗΣΗ : Για το δείγμα της προηγούμενης άσκησης να υπολογισθούν οι παράμετροι Διασποράς: Εύρος διακύμανσης, τεταρτημόρια, ημιενδοτεταρτημοριακή δειγματική κύμανση, μέση απόκλιση, διακύμανση, τυπική απόκλιση και συντελεστής μεταβλητότητας. ΛΥΣΗ Το εύρος της διακύμανσης είναι: R s =79.2-63.2 =16.0. Από τον Πίνακα προκύπτει ότι το Q 1 αντιστοιχεί στην 7 η τιμή (7/28=0.25 ή 25%) άρα Q 1 =68.8, το Q 2 =Μ ε =73.1 (από την προηγούμενη άσκηση) και το Q 3 αντιστοιχεί στην 21 η τιμή (21/28=0.75 ή 75%),άρα Q 3 =75.7. H ημιενδοτεταρτημοριακή δειγματική κύμανση Q =(75.7-68.8)/2 =3.45. Η μέση απόκλιση βρέθηκε να είναι: Ε α = 3.177 Η διακύμανση του δείγματος υπολογίσθηκε από τα αναλυτικά δεδομένα και βρέθηκε ότι: V = 15.319. Η τυπική απόκλιση υπολογίσθηκε και βρέθηκε s N-1 = 3.913. Ο συντελεστής μεταβλητότητας βρέθηκε CV= 5.41%.

ΑΣΚΗΣΗ : Για το δείγμα της προηγούμενης άσκησης να ομαδοποιηθούν τα δεδομένα. Στη συνέχεια να υπολογιστούν οι παράμετροι κεντρικής τάσης και διασποράς ΛΥΣΗ Από τον τύπο Α=5logN, για Ν=28 προκύπτει Α=7.2. Λαμβάνοντας υπόψη και τη μέγιστη (79.2) και την ελάχιστη (63.2) τιμή του δείγματος και θέλοντας οι αντιπροσωπευτικές τιμές των τάξεων διαστημάτων να είναι ακέραιοι αριθμοί, κατατάξαμε το δείγμα σε 9 τάξεις διαστημάτων, όπως φαίνεται στον παρακάτω πίνακα Τάξεις διαστημάτων Αντιπροσωπευτική τιμή (x j ) Aπόλυτη συχνότητα Σχετική συχνότητα (f j ) Απόλυτη αθροιστική συχνότητα (cf j ) 63-64.99 64 1 0.036 1 65-66.99 66 2 0.107 3 67-68.99 68 4 0.25 7 69-70.99 70 3 0.357 10 71-72.99 72 3 0.464 13 73-74.99 74 7 0.714 20 75-76.99 76 5 0.892 25 77-78.99 78 2 0.964 27 79-80.99 80 1 1.0 28

f j Από τον τύπο X k i1 k i1 fixi f i προκύπτει μέση τιμή 72.429 με i=9, x i οι αντιπροσωπευτικές τιμές των διαστημάτων και fi οι απόλυτες συχνότητές τους Διάμεσος τιμή Μ ε =73.43. Επικρατούσα τιμή M o (7 3) 2 74 (7 3) (7 5) 75.33 Όπως φαίνεται ενώ με την ομαδοποίηση δεν είχαμε σημαντικές μεταβολές στις εκτιμήσεις του μέσου αριθμητικού, καθώς και στη διάμεση τιμή, προκύπτει σημαντική διαφοροποίηση στην επικρατούσα τιμή, γεγονός που μας δείχνει ότι ανάλογα με τον τρόπο που θα ορισθούν οι τάξεις διαστημάτων είναι δυνατόν να διαμορφωθεί η κατανομή συχνοτήτων του δείγματος έτσι ώστε να είναι τελικά δυνατή η προσέγγισή της από ένα θεωρητικό νόμο.

x j Q 1 =67+(2/4)(25[28/100]-7) = 67, Q 3 =75+(2/5)(75[28/100]-20) = 75.4, ενώ Q 2 =M ε =73.43. Η ημιενδοτεταρτημοριακή δειγματική κύμανση στην περίπτωση των ομαδοποιημένων δεδομένων ισούται με Q=(75.4-67)/2 = 4.2. Η μέση απόκλιση ισούται με Ε α = 1 N j9 j1 f j x j f j x =3.398 όπου f j οι απόλυτες συχνότητες μέσα στις j τάξεις διαστημάτων και οι αντίστοιχες αντιπροσωπευτικές τιμές. H διακύμανση δίνεται από τη σχέση με τα ομαδοποιημένα δεδομένα και ισούται με V = 16.698. Η τυπική απόκλιση ισούται με s N-1 = 4.086 Θεωρώντας ότι η κατανομή συχνοτήτων των ομαδοποιημένων δεδομένων έχει ένα μέγιστο και τείνει εφαπτομενικά στον άξονα των χ σε αμφότερα τα άκρα επειδή η μελετώμενη μεταβλητή είναι συνεχής, μπορούμε να εφαρμόσουμε την διόρθωση του Sheppard όσον αφορά την τυπική απόκλιση, οπότε από τη σχέση sn 2 S N 1 1 λαμβάνουμε s N-1 = 4.045, 12 τιμή η οποία είναι πλησιέστερα στην τιμή της τυπικής απόκλισης (3.913) η οποία υπολογίσθηκε από το αναλυτικό δείγμα στην προηγούμενη άσκηση. R 2

N G x1. x2... xn Γεωμετρικός μέσος N N n1 n2 G x1. x2... j j1 x nj nj j Όταν θέλουμε να υπολογίσουμε το ποσοστό ή τη μέση μεταβολή των τιμών της παραμέτρου Χ Σταθμικός γεωμετρικός μέσος για ομαδοποιημένα δεδομένα Παράδειγμα: το 2007 η αύξηση των μισθών ήταν 3% και το 2008 2.5%, πόση ήταν η μέση μεταβολή? G 3x2.5 2.74%

CALCULATION OF FREQUENCY WITH THE AID OF EXCEL Upper class limit

CALCULATION OF FREQUENCY WITH THE AID OF EXCEL Ctrl+Shift+Enter 1. Επιλογή του πίνακα που θα μπούν οι συχνότητες 2. Χρησιμοποίηση της συνάρτηση FREQUENCY 3. Ctrl+shift+enter

CALCULATION OF FREQUENCY WITH THE AID OF EXCEL

ΕΥΡΕΣΗ ΑΘΡΟΙΣΤΙΚΗΣ ΣΥΧΝΟΤΗΤΑΣ Ακρη του cell με το «ποντίκι»... Μετατροπή σε «+»... σύρσιμο του «ποντίκι» προς τα κάτω μέχρι το τέλος της στήλης... υπολογισμός δεξιόστροφης αθροιστικής συχνότητας