Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Σχετικά έγγραφα
Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Περιγραφική Στατιστική

Ασκήσεις Άλγεβρας. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. B ΓΥΜΝΑΣΙΟΥ Άλγεβρα 265 ασκήσεις και τεχνικές σε 24 σελίδες. εκδόσεις. Καλό πήξιμο

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Στατιστικοί πίνακες. Δημιουργία κλάσεων

Περιγραφική Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Κεφάλαιο Δύο Γραφήματα και Πίνακες Περιγραφικές Τεχνικές

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΜΕΛΕΤΗ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ

Δρ. Ευστρατία Μούρτου

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

F x h F x f x h f x g x h g x h h h. lim lim lim f x

ΣΥΝΑΡΤΗΣΕΩΝ. f3 x = και

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

Μελέτη της συνάρτησης ψ = α χ 2

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Βιοστατιστική ΒΙΟ-309

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Στατιστική Επιχειρήσεων

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΔΙΑΓΩΝΙΣΜΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ. Ύλη: Συναρτήσεις-Στατιστική Θέμα 1 o : Α. i. Να διατυπώσετε το κριτήριο μονοτονίας. (5 μον.)

Κεφάλαιο 3 Περιγραφή Γεωγραφικών Δεδομένων Βασικοί Γεωστατιστικοί Δείκτες

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ. B. Πώς ορίζεται ο συντελεστής μεταβολής ή συντελεστής. μεταβλητότητας μιας μεταβλητής X, αν x > 0 και πώς, αν

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

4.4 ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Εισαγωγή στη Στατιστική

ΖΗΤΗΜ Α 1 Ο. Α1. Τι είναι το ραβδόγραµµα και πότε χρησιµοποιείται; 5) Α2. Σε τι διακρίνονται οι µεταβλητές και τι είναι οι τιµές τους;

Μαθηματικός Περιηγητής σχ. έτος

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Μαθηματικά & Στοιχεία Στατιστικής Γενικής Παιδείας για την Γ Λυκείου. Αν έχετε κάνει σωστά τους υπολογισμούς σας, μεταφοράς ενός

Στατιστική. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. Γενικής κεφάλαιο ασκήσεις. Kglykos.gr. εκδόσεις. Καλό πήξιμο. Ι δ ι α ί τ ε ρ α μ α θ ή μ α τ α

Συλλογή και Παρουσίαση Δεδομένων

ΜΕΘΟΔΟΛΟΓΙΑ & ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΕΦΑΛΑΙΟ 2 Ο «ΣΤΑΤΙΣΤΙΚΗ»

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΜΕΘΟΔΟΛΟΓΙΑ & ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΕΦΑΛΑΙΟ 2 Ο «ΣΤΑΤΙΣΤΙΚΗ»

Θέμα Α. Θέμα Β. ~ 1/9 ~ Πέτρος Μάρκου. % σχεδιάζουμε το πολύγωνο αθροιστικών σχετικών συχνοτήτων τοις

Περιγραφική Στατιστική

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Υπολογισμοί Παραμέτρων Πληθυσμού και Στατιστικών Δείγματος

Στατιστική Επιχειρήσεων Ι

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΘΕΜΑΤΑ ΠΑΝΕΛΛΑΔΙΚΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ. Να γράψετε στο τετράδιο σας τον πίνακα των τιμών της μεταβλητής Χ σωστά συμπληρωμένο.

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

Συναρτήσεις. Ορισμός Συνάρτησης

ΟΜΟΣΠΟΝΔΙΑ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑΔΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2019 B ΦΑΣΗ ΜΑΘΗΜΑΤΙΚΑ / ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

επ. Κωνσταντίνος Π. Χρήστου

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 2ο: ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑ Α

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

(f(x) + g(x)) = f (x) + g (x).

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

F(x h) F(x) (f(x h) g(x h)) (f(x) g(x)) F(x h) F(x) f(x h) f(x) g(x h) g(x) h h h. lim lim lim f (x) g (x). h h h

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 2 Περιγραφικές Τεχνικές

ΚΕΦΑΛΑΙΟ. 1. α. Tι ονοµάζεται συνάρτηση από το σύνολο Α στο σύνολο Β; β. Tι ονοµάζεται πραγµατική συνάρτηση πραγµατικής µεταβλητής;

Μάθηµα 12. Κεφάλαιο: Στατιστική

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Η συνάρτηση y = αχ 2. Βρέντζου Τίνα Φυσικός Μεταπτυχιακός τίτλος: «Σπουδές στην εκπαίδευση» ΜEd

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης Φεβρουάριος, /64

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Transcript:

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος Χρησιμοποιείται μόνο όταν οι τιμές της μεταβλητής έχουν ένα σταθερό άθροισμα (συνήθως 100%, όταν μιλάμε για σχετικές συχνότητες) Είναι χρήσιμο μόνο όταν υπάρχουν αποκλίσεις στις συχνότητες της μεταβλητής από τη μία κατηγορία στην άλλη o ένα κυκλικό διάγραμμα με 7 κατηγορίες που έχουν περίπου την ίδια συχνότητα δε μας είναι χρήσιμο ο αριθμός των κατηγοριών δε θα πρέπει να είναι πολύ μεγάλος Επίσης, σε ένα κυκλικό διάγραμμα καλό είναι να αναφέρονται και οι σχετικές συχνότητες μαζί με τα ονόματα των κατηγοριών Διαφορετικά το διάγραμμα παρέχει πληροφορίες μόνο για την ποιοτική (όχι την ποσοτική) σχέση μεταξύ των κατηγοριών Όταν τα δεδομένα μας είναι διατάξιμα, καλό είναι οι γειτονικές κατηγορίες να εμφανίζονται συνεχόμενα Όταν θέλουμε να δώσουμε έμφαση σε κάποια κατηγορία, μπορούμε να αποκόψουμε τον αντίστοιχο τομέα από το διάγραμμα (υπάρχει τέτοια επιλογή στο Excel) 1 2

Οδηγίες κατασκευής ραβδογραμμάτων 1. Σε ένα σύστημα ορθογωνίων συντεταγμένων, εργαζόμαστε στο πρώτο τεταρτημόριο. 2. Στον άξονα των Χ απεικονίζουμε τις κατηγορίες της μεταβλητής Τα διαστήματα που αντιστοιχούν σε κάθε κατηγορία έχουν ίσο μήκος και ισαπέχουν μεταξύ τους. 3. Στον άξονα των Y απεικονίζουμε τις συχνότητες. 4. Για κάθε κατηγορία, σχεδιάζουμε ένα παραλληλόγραμμο με ύψος ανάλογο με τη συχνότητα της αντίστοιχης κατηγορίας. Πλεονεκτήματα ενός ραβδογράμματος έναντι ενός κυκλικού διαγράμματος 1. Το ραβδόγραμμα κατασκευάζεται εύκολα με το χέρι 2. Με ένα ραβδόγραμμα μπορούμε να διακρίνουμε εύκολα και μικρές διαφορές μεταξύ συχνοτήτων o σε ένα κυκλικό διάγραμμα, ανάμεσα σε δύο κατηγορίες με σχ. συχνότητες 15,1% και 14,9% δεν είναι εύκολο να εντοπίσουμε τη μεγαλύτερη 3. Το ραβδόγραμμα μπορεί να χρησιμοποιηθεί όταν έχουμε πολλές κατηγορίες της μεταβλητής 3 4

4. Με το ραβδόγραμμα μπορούμε εύκολα να μελετήσουμε περισσότερα από ένα χαρακτηριστικά του πληθυσμού ταυτόχρονα 5. Με το ραβδόγραμμα είναι ευκολότερο να κάνουμε συγκρίσεις ανάμεσα σε δύο ή περισσότερα διαγράμματα. Ένα πλεονέκτημα που έχει το κυκλικό διάγραμμα είναι ότι μας δίνει μια καλύτερη εικόνα για τη σχέση που έχει μία συχνότητα με το άθροισμα όλων των συχνοτήτων στο δείγμα Π.χ. είναι εύκολο να διακρίνουμε αν σε μια κατηγορία αντιστοιχεί περισσότερο από το 50% των συχνοτήτων. 5 6

Μέθοδοι για συνεχή δεδομένα Παραδείγματα συνεχών μεταβλητών: o Ύψος, βάρος, μήκος, θερμοκρασία, μηνιαίος μισθός, μηνιαία έξοδα (μιας οικογένειας) κλπ. Πώς θα απεικονίσουμε γραφικά τα δεδομένα, π.χ. το βάρος που αντιστοιχεί σε ένα δείγμα 30 ατόμων; Το πιθανότερο είναι πως στο δείγμα υπάρχουν 30 διαφορετικές τιμές Παράδειγμα (από το βιβλίο Κ. Τσίμπου Φ. Γεωργιακώδη, Πίνακας 4.1) Βάρος 30 ατόμων σε κιλά 79,6 72,3 86,1 75,0 67,3 74,1 76,7 79,9 89,9 76,2 78,6 73,0 85,8 78,0 80,8 81,4 65,1 81,8 76,5 66,8 79,6 77,1 80,1 72,3 78,3 67,9 76,5 73,0 83,9 70,0 Αναζητάμε τη μέγιστη και ελάχιστη τιμή διατάσσουμε τα δεδομένα Άρα δεν έχει νόημα να χρησιμοποιήσουμε συχνότητες για τα ακατέργαστα δεδομένα Αντί γι αυτό, χωρίζουμε τα δεδομένα σε ομάδες και απεικονίζουμε γραφικά τις συχνότητες αυτών των ομάδων 65,1 66,8 67,3 67,9 70,0 72,3 72,3 73,0 73,0 74,1 75,0 76,2 76,5 76,5 76,7 77,1 78,0 78,3 78,6 79,6 79,6 79,6 80,1 80,8 81,4 81,8 83,9 85,8 86,1 89,9 Μέγιστη τιμή 89,9 κιλά Ελάχιστη τιμή 65,1 κιλά Το εύρος των τιμών στο δείγμα = 24,8 κιλά = R 7 8

Στρογγυλοποιούμε (προς τα κάτω) την ελάχιστη τιμή 65,1 65 κιλά Στρογγυλοποιούμε (προς τα πάνω) τη μέγιστη τιμή 89,9 90 κιλά Οπότε το αντίστοιχο εύρος είναι 90-65 = 25 κιλά Χωρίζουμε το εύρος αυτό σε κλάσεις ή διαστήματα Πόσα διαστήματα επιλέγουμε; Σπάνια λιγότερα από 5 ή περισσότερα από 15 Πολύ λίγα διαστήματα ελάχιστη πληροφορία για την κατανομή των τιμών του δείγματος (άρα και του πληθυσμού) Π.χ. είναι αυτή η κατανομή συμμετρική; Πόσο συγκεντρωμένες είναι οι τιμές του δείγματος γύρω από τη μέση τους τιμή; Πάρα πολλά διαστήματα πιθανόν κάποια, ή και πολλά, από αυτά, να είναι κενά (χωρίς παρατηρήσεις) Το διάγραμμα που προκύπτει είναι συνήθως ασαφές και προκαλεί σύγχυση Πλάτος διαστήματος τάξεων δ = R k επιθυμητό πλήθος διαστημάτων Ένας τρόπος επιλογής του k είναι ο εμπειρικός τύπος του Sturges k = ο μικρότερος ακέραιος που είναι μεγαλύτερος ή ίσος από 1 + log(n) / log (2) = 1 + 3,322 log(n) o Ο λογάριθμος εδώ είναι με βάση το 10, και o n είναι το πλήθος των παρατηρήσεων 9 10

Ο τύπος δίνει n k 30 6 50 7 100 8 200 9 500 10 1000 11 2000 12 Επιλέγοντας k = 5 στο παράδειγμα, έχουμε Κλάση Απόλυτες συχνότητες Σχετικές συχνότητες Κεντρική τιμή τάξης 65-69 4 0,13 67,5 70-74 6 0,20 72,5 75-79 12 0,40 77,5 80-84 5 0,17 82,5 85-89 3 0,10 87,5 Για τα δεδομένα του παραδείγματος (n = 30), αν επιλέξουμε 6 κλάσεις, τότε το πλάτος κάθε κλάσης θα είναι R 25 δ = = = k 6 4,167, δηλαδή δεκαδικός αριθμός (καλύτερα να αποφεύγεται). 11 12

Παρατηρήσεις Επιλογή διαστάσεων στο σχεδιάγραμμα 1. Η 1 η κλάση περιλαμβάνει όλες τις τιμές στο διάστημα [65,70), η 2 η στο διάστημα [70,75) κοκ. Οπότε αντί του συμβολισμού 65-69, 70-74 κλπ, θα μπορούσαμε να είχαμε χρησιμοποιήσει το συμβολισμό 65-70, 70-75 κλπ, με τη σύμβαση ότι τα διαστήματα είναι ανοιχτά προς τα πάνω. Αν a,b είναι τα μήκη των αξόνων x,y αντίστοιχα που απεικονίζονται στο διάγραμμα, τότε επιλέγουμε τα a,b έτσι ώστε 1 2 b a 3 4 2. Στην ουσία για ομαδοποιημένα δεδομένα θεωρούμε ότι όλες οι παρατηρήσεις που ανήκουν σε ένα διάστημα είναι συγκεντρωμένες στην κεντρική τιμή αυτού του διαστήματος. Αυτό δημιουργεί πρόβλημα όταν το πλάτος κάθε διαστήματος είναι μεγάλο. Συνήθως το ανώτερο σημείο του κατακόρυφου άξονα είναι μία τιμή λίγο μεγαλύτερη από τη μέγιστη συχνότητα των κλάσεων 13 14

Εδώ ο άξονας των x έχει μήκος μικρότερο από αυτό του άξονα των συχνοτήτων Ένα καλύτερο διάγραμμα είναι το παρακάτω 15 16

Πολύγωνο συχνοτήτων Το πολύγωνο συχνοτήτων για το παράδειγμα με Χρήσιμο για συγκρίσεις δύο ή περισσοτέρων τα βάρη 30 ατόμων κατανομών Προκύπτει από το ιστόγραμμα ενώνοντας τα μέσα των άνω πλευρών των ορθογωνίων Κλείνουμε την πολυγωνική γραμμή ξεκινώντας από το μέσο του διαστήματος αριστερά από το πρώτο ορθογώνιο και καταλήγοντας στο μέσο του διαστήματος δεξιά από το τελευταίο ορθογώνιο Για να μπορούν να γίνουν συγκρίσεις θα πρέπει τα ιστογράμματα να αναφέρονται σε σχετικές συχνότητες Συχνότητα Histogram 14 12 10 8 6 4 2 0 67,5 72,5 77,5 82,5 87,5 Βάρος Frequency 17 18

Καμπύλη συχνοτήτων Είδη κατανομών Τι γίνεται όταν το πλήθος των παρατηρήσεων είναι πολύ μεγάλο; Γενικά έχουμε 4 είδη κατανομών ανάλογα με το σχήμα τους : Καθώς το μέγεθος του δείγματος αυξάνει, μεγαλώνει και ο αριθμός των διαστημάτων στη γραφική παράσταση (ιστόγραμμα, αντίστοιχα πολύγωνο συχνοτήτων) Για πολύ μεγάλο πλήθος διαστημάτων, το πολύγωνο συχνοτήτων προσεγγίζει μία ομαλή καμπύλη, την καμπύλη συχνοτήτων. Αυτή με τη σειρά της προσεγγίζει τη θεωρητική κατανομή του πληθυσμού από τον οποίο προήλθε το δείγμα. o Μονοκόρυφες κατανομές o Κατανομές σχήματος U o Κατανομές σχήματος J o Άλλες κατανομές Οι μονοκόρυφες κατανομές διακρίνονται σε : Συμμετρικές κατανομές Κατανομές με θετική ασυμμετρία Κατανομές με αρνητική ασυμμετρία (βλ. Σχήμα 4.5 στο βιβλίο) Παράδειγμα συμμετρικής κατανομής είναι η κανονική κατανομή 19 20

Παράδειγμα καμπύλης συχνοτήτων από συμμετρική κατανομή Παράδειγμα καμπύλης συχνοτήτων από θετικά ασύμμετρη (αριστερά στο σχήμα) και αρνητικά ασύμμετρη (δεξιά στο σχήμα) κατανομή 21