1.1. Η Χρησιμότητα της Στατιστικής



Σχετικά έγγραφα
ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Εισαγωγή στη Στατιστική

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Αριθμητικά περιγραφικά μέτρα II. Μέτρα κεντρικής θέσης

Περιγραφική Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Περιγραφική Στατιστική

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες


Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Βιοστατιστική ΒΙΟ-309

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

Βιοστατιστική ΒΙΟ-309

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Βιοστατιστική ΒΙΟ-309

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισαγωγή στη Στατιστική

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Γιατί μετράμε την διασπορά;

1. Βασικές Συναρτήσεις Στατιστικής

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 2ο: ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑ Α

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Μέτρα θέσης και διασποράς

Mέτρα (παράμετροι) θέσεως

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι Ασκήσεις 3

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

Στατιστικές Συναρτήσεις

Εισαγωγή στη Στατιστική Μάθημα του Β Εξαμήνου

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ. x 100% = s. lim. x x. γ) Αν οι συναρτήσεις f, g: A είναι παραγωγίσιμες στο πεδίο ορισμού τους Α, τότε ισχύει:

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

11. Ποιες είναι οι άμεσες συνέπειες της διαίρεσης;

i Σύνολα w = = = i v v i=

Βασικές Έννοιες Στατιστικής & Μέθοδοι Πρόβλεψης

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Υπολογισμοί Παραμέτρων Πληθυσμού και Στατιστικών Δείγματος

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Στοιχεία Στατιστικής 1 ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Στατιστικοί πίνακες. Δημιουργία κλάσεων

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ. B. Πώς ορίζεται ο συντελεστής μεταβολής ή συντελεστής. μεταβλητότητας μιας μεταβλητής X, αν x > 0 και πώς, αν

ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 2 Ο

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Θέμα Α. Θέμα Β. ~ 1/9 ~ Πέτρος Μάρκου. % σχεδιάζουμε το πολύγωνο αθροιστικών σχετικών συχνοτήτων τοις

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

Transcript:

ε ν ό τ η τ α 1 1.1. Η Χρησιμότητα της Στατιστικής Οι εφαρμογές των μεθόδων της στατιστικής είναι ευρείες. Πριν την αναφορά μας για τη χρησιμότητα της στατιστικής, είναι σκόπιμο να παραθέσουμε τους παρακάτω δυο ορισμούς για το τι είναι στατιστική *. 1. Στατιστική: «Όνομα ουσιαστικό. Εις τον πληθυντικό αριθμό. Αριθμητικά γεγονότα, ως στατιστικαί του πληθυσμού, αποθεμάτων. Εις τον ενικόν επιστήμη της συλλογής, κατατάξεως και χρησιμοποιήσεως των στατιστικών». 2. Στατιστική: «Σύνολο μαθηματικών μεθόδων, οι οποίες μέσω συλλογής και ανάλυσης πραγματικών δεδομένων, επιτρέπουν τη δημιουργία πιθανολογικών μοντέλων στα οποία θεμελιώνονται προβλέψεις». Χρησιμοποιώντας τις μεθόδους της στατιστικής μπορούμε να οδηγηθούμε στη λήψη μιας τεκμηριωμένης απόφασης. Τις στατιστικές μεθόδους τις χρησιμοποιεί σχεδόν το σύνολο των επιστημονικών ειδικοτήτων, για να θεμελιωθούν προβλέψεις, να εντοπιστούν αιτίες που παράγουν αποτελέσματα και να εξαχθούν συμπεράσματα για ένα μεγάλο σύνολο δεδομένων εξετάζοντας μόνο ένα μικρό σύνολο από αυτά. 1.2. Πηγές και Τρόποι Συλλογής Δεδομένων Η πρώτη πηγή, και κατά τη γνώμη μας η σημαντικότερη, στην οποία μπορούμε να ανατρέξουμε για να αποκτήσουμε δεδομένα που αφορούν στην Ελλάδα είναι η Εθνική Στατιστική Υπηρεσία της Ελλάδος (ΕΣΥΕ). Η ΕΣΥΕ μας παρέχει πληθώρα αξιόπιστων δημοσιευμένων στοιχείων, που * Ο πρώτος ορισμός είναι από το βιβλίο «Στατιστική» του RGD ALLEN σε μετάφραση του Κ.Α. Αθανασιάδη, εκδόσεις ΠΑΠΑΖΗΣΗ και ο δεύτερος ορισμός από το Εγκυκλοπαιδικό λεξικό ΠΑΠΥΡΟΣ LAROUSSE το Παπυράκι, ΑΘΗΝΑ 2003. 31

αφορούν σε διάφορες πτυχές της οικονομικής και κοινωνικής ζωής. Εκτός από την ΕΣΥΕ στοιχεία δημοσιεύει και η Eurostat, δηλαδή η στατιστική υπηρεσία των Ευρωπαϊκών Κοινοτήτων. Επίσης, εκτός από την ΕΣΥΕ, στοιχεία μπορούν να αναζητηθούν απευθείας από τις ημόσιες Υπηρεσίες και τους Οργανισμούς Τοπικής Αυτοδιοίκησης. Αρκετές κατηγορίες στοιχείων είναι δυνατόν να αποκτηθούν και από ιδιωτικές εταιρείες, οι οποίες τα συλλέγουν και τα διαθέτουν σε ενδιαφερόμενους, σε έντυπη ή σε ηλεκτρονική μορφή. 1.3. Ο Στατιστικός Πληθυσμός Σύνολα πραγμάτων ή ανθρώπων που έχουν ένα ή περισσότερα χαρακτηριστικά ονομάζονται Στατιστικοί πληθυσμοί. Ένας στατιστικός πληθυσμός είναι για παράδειγμα το σύνολο των εργαζομένων στον κλάδο του τουρισμού σε μια χρονική περίοδο. Ένας άλλος στατιστικός πληθυσμός είναι το σύνολο των ασθενών που βρίσκονται μια δεδομένη χρονική στιγμή σε όλα τα δημόσια και ιδιωτικά Νοσοκομεία της Ελλάδος. Οι στατιστικοί πληθυσμοί διακρίνονται σε άπειρους και σε πεπερασμένους. Άπειροι ονομάζονται οι πληθυσμοί με πολύ μεγάλο αριθμό στοιχείων, ενώ πεπερασμένοι ονομάζονται ο πληθυσμοί με καθορισμένο μέγεθος. Για παράδειγμα, η παραγωγή αυτοκινήτων τα τελευταία 50 χρόνια μπορεί να θεωρηθεί άπειρος πληθυσμός, ενώ η παραγωγή αυτοκινήτων από μια συγκεκριμένη βιομηχανία για ένα συγκεκριμένο έτος θα θεωρηθεί πεπερασμένος πληθυσμός. Σε μια ακόμη διάκριση οι πεπερασμένοι πληθυσμοί μπορεί να είναι ολιγοπληθείς ή πολυπληθείς. Αν θέλουμε να μελετήσουμε ένα στατιστικό πληθυσμό, χρειάζεται να έχουμε διαθέσιμα όλα τα στοιχεία του πληθυσμού. Επειδή αυτό είναι πολύ δαπανηρό σε χρηματικούς πόρους αλλά και σε χρόνο, εργαζόμαστε με δείγματα που έχουν επιλεγεί με τρόπους που πληρούν τα όσα η μέθοδος της δειγματοληψίας υποδεικνύει. 1.4. Η Στατιστική και οι Μεταβλητές της Στη στατιστική χρησιμοποιούμε τρεις κατηγορίες μεταβλητών. Τις ποσοτικές, τις κατηγορικές και τις ποιοτικές. Οι ποσοτικές μεταβλητές είναι 32

δεκτικές μέτρησης. Μπορούμε με άλλα λόγια να αντιστοιχήσουμε αριθμούς σε αυτή την κατηγορία των μεταβλητών. Παραδείγματα ποσοτικών μεταβλητών είναι το ύψος, το εισόδημα, το βάρος, οι ώρες εργασίας, ο αριθμός επιβατών κ.λπ.. Οι ποσοτικές μεταβλητές περαιτέρω διακρίνονται σε συνεχείς και σε ασυνεχείς. Η μεταβλητή ύψος για παράδειγμα είναι συνεχής μεταβλητή, γιατί θεωρητικά μπορεί να πάρει οποιαδήποτε τιμή μεταξύ δυο τιμών. Παραδείγματος χάρη, όλες οι τιμές μεταξύ 160 εκατοστών και 170 εκατοστών είναι δυνατές τιμές της μεταβλητής ύψος. Αντίθετα, ο αριθμός δωματίων ενός ξενοδοχείου, ενώ είναι ποσοτική μεταβλητή και μπορεί να λάβει τιμές όπως 20, 21, 50 κ.λπ., δεν μπορεί να λάβει τιμές μεταξύ του 20 και 21. Οι κατηγορικές μεταβλητές επιδέχονται απλώς μια ασθενή διάκριση ή κατάταξη. Παραδείγματος χάρη, η μεταβλητή φύλλο επιδέχεται τη διάκριση «άρρεν» ή «θήλυ». Οι ποιοτικές μεταβλητές επιδέχονται μετρήσεις ή διακρίσεις ανώτερου επιπέδου από ότι οι κατηγορικές. Η μεταβλητή κατάσταση υγείας, για παράδειγμα, επιδέχεται διάκριση από κακή έως άριστη και μάλιστα οι καταστάσεις υγείας μπορούν να ιεραρχηθούν: άριστη υγεία, πολύ καλή υγεία, καλή υγεία, μέτρια υγεία, κακή υγεία. Τις μεταβλητές τις συμβολίζουμε με γράμματα συνήθως κεφαλαία, όπως για παράδειγμα X, Y, Z. Οι συγκεκριμένες αριθμητικές εκφράσεις των μεταβλητών ονομάζονται τιμές των μεταβλητών. Την αριθμητική έκφραση μιας μεταβλητής τη συμβολίζουμε με μικρό γράμμα, το οποίο είναι σύνηθες να συνοδεύονται και με ένα δείκτη και γράφουμε x i, y i, z i. Για παράδειγμα, εάν με X συμβολίσουμε τη μεταβλητή ύψος και στον Πίνακα 1.1 καταχωρίσουμε 7 συγκεκριμένες τιμές της μεταβλητής ύψος σε εκατοστά, θα έχουμε: Πίνακας 1.1 i 1 2 3 4 5 6 7 x i 150 166 167 170 171 175 180 Η χρησιμότητα του δείκτη είναι προφανής. Ο δείκτης μας εξυπηρετεί στο να γνωρίζουμε σε ποια συγκεκριμένη παρατήρηση αναφερόμαστε. Εάν για παράδειγμα i = 3, τότε η τιμή x 3 είναι τα 167 εκατοστά ύψους κ.ο.κ.. 33

1.5. Χειρισμός Αριθμητικών Δεδομένων Είναι σύνηθες, τουλάχιστον για όσους ασχολούνται με τη συλλογή και την επεξεργασία αριθμητικών δεδομένων, να βρίσκονται μπροστά σε ένα σωρό από αριθμούς. Οι αριθμοί πάντα λένε κάτι, συνήθως σημαντικό, αρκεί να μπορούμε να τους χειριστούμε με έναν τρόπο που θα μας το αποκαλύψει. Ας υποθέσουμε ότι έχουμε καταγράψει το ύψος σε εκατοστά 8 φοιτητών και τα παραθέσουμε στον πίνακα: Πίνακας 1.2 180 170 171 167 166 175 180 150 Εκτός από το να κατατάξουμε τους 8 φοιτητές κατά σειρά ύψους, μπορούμε να χειριστούμε τους αριθμούς, έτσι ώστε να αντλήσουμε ένα σύνολο από αριθμητικές τιμές που η καθεμία από αυτές θα μας δίνει πληροφορία χρήσιμη για το σύνολο των αριθμών που επεξεργαζόμαστε. 1.5.1 Ο αριθμητικός μέσος όρος Ο αριθμητικός μέσος ή απλώς ο μέσος όρος προκύπτει εάν αθροίσουμε τους 8 προαναφερθέντες αριθμούς για το ύψος των 8 φοιτητών και το αποτέλεσμα το διαιρέσουμε με το πλήθος τους. ηλαδή ο αριθμητικός μέσος όρος είναι ίσος με: εκατοστά Επομένως, «κατά μέσο όρο» το ύψος των 8 φοιτητών είναι 169, 87 εκατοστά. Ο αριθμητικός μέσος όρος συμβολίζεται ως μ ή x, εάν εργαζόμαστε με δείγματα. Εάν οι αποκλίσεις του ύψους μεταξύ των 8 φοιτητών δεν είναι σημαντικές, τότε ο μέσος όρος αντιπροσωπεύει ικανοποιητικά το ύψος των φοιτητών. 1.5.2 Επικρατούσα τιμή H επικρατούσα τιμή, η οποία συμβολίζεται ως M O, είναι η τιμή που εμφανίζεται τις περισσότερες φορές σε ένα σύνολο από αριθμούς. Στο 34

παράδειγμά μας με τα ύψη των 8 φοιτητών, η επικρατούσα τιμή είναι τα 180 εκατοστά ύψους, διότι εμφανίζεται 2 φορές. 1.5.3 Διάμεσος τιμή Η διάμεσος τιμή, η οποία συμβολίζεται ως M, είναι το μεσαίο σημείο (μεσαία παρατήρηση) των αριθμών. Αυτό σημαίνει ότι η διάμεσος τιμή χωρίζει στα δύο το σύνολο των αριθμών και οι μισοί αριθμοί είναι κάτω από τη διάμεσο τιμή και οι άλλοι μισοί πάνω από αυτήν. Στο παράδειγμά μας με το ύψος των 8 φοιτητών, για να βρεθεί το διάμεσο ύψος πρέπει να τακτοποιήσουμε τα ύψη από το μικρότερο προς το μεγαλύτερο ή από το μεγαλύτερο προς το μικρότερο. Μετά την τακτοποίηση θα έχουμε: 150, 166, 167, 170, 171, 175, 180, 180. Εάν η λίστα αποτελείται από περιττό πλήθος αριθμών, είναι εύκολο να βρεθεί η διάμεσος τιμή. Εάν όμως το πλήθος των αριθμών είναι άρτιο, τότε ως διάμεση τιμή μπορούμε να λάβουμε το μέσο όρο των πλησιέστερων στη μέση τιμών. Στο παράδειγμά μας με τα ύψη των 8 φοιτητών: 150, 166, 167, 170, 171, 175, 180, 180. Οι αριθμοί μέσα στο πλαίσιο είναι οι πλησιέστεροι στη μέση. Η διάμεσος τιμή είναι ο αριθμητικός μέσος όρος αυτών των δυο αριθμών και είναι ίση με: (170+171) / 2 = 170, 5. Πράγματι, οι μισοί φοιτητές έχουν ύψος μικρότερο από 170, 5 εκατοστά και οι υπόλοιποι πάνω από 170, 7 εκατοστά. Ο κανόνας για να προκύπτει η διάμεσος, όταν το πλήθος των αριθμητικών μας δεδομένων είναι άρτιος αριθμός, είναι ο εξής: «Εάν το πλήθος των δεδομένων μας είναι αριθμός άρτιος, τότε διαιρούμε το πλήθος των αριθμών δια δυο. Το αποτέλεσμα δείχνει την πλησιέστερη στη διάμεσο τιμή. Στο παράδειγμά μας το πλήθος των αριθμών είναι 8. Το πλήθος δια 2 είναι ίσο με 4, η τέταρτη επομένως στη σειρά παρατήρηση χωρίζει στη μέση τα αριθμητικά δεδομένα μας. Η τέταρτη παρατήρηση είναι ο αριθμός 170. Εάν όμως επιλέξουμε τον 170 ως διάμεσο τιμή πριν από τον αριθμό 170, έχουμε τρεις τιμές, τις: 150, 166, 167 35

και μετά από τον αριθμό 170 έχουμε τέσσερις, τις: 171, 175, 180, 180. Για να έχουμε μοιρασμένες τις παρατηρήσεις θα πρέπει να υπολογίσουμε το μέσο όρο των αριθμών 170 και 171. Ο μέσος αυτός όρος είναι η διάμεσος τιμή. Εάν το πλήθος των δεδομένων μας ήταν αριθμός περιττός και είχαμε αντί για τα ύψη 8 φοιτητών τα ύψη 7 φοιτητών και συγκεκριμένα τα: 150, 166, 167, 170, 171, 175, 180, 180, τότε στο πλήθος των αριθμών που έχουμε προσθέτουμε τη μονάδα και το αποτέλεσμα το διαιρούμε με το δυο. Στο παράδειγμά μας λοιπόν το πλήθος των αριθμών είναι ίσο με 7. Το πλήθος αριθμών συν ένα δίνει αποτέλεσμα ίσο με 8. Το αποτέλεσμα 8 δια δυο δίνει 4. Η τετάρτη στη σειρά παρατήρηση είναι η διάμεσος τιμή. Πράγματι, η τιμή 170 αφήνει τρεις τιμές πριν από αυτή και τρεις μετά. Ο αριθμητικός μέσος όρος, η επικρατούσα τιμή και η διάμεσος τιμή μπορούν εύκολα να υπολογιστούν χρησιμοποιώντας στο λογιστικό φύλλο excel τις παρακάτω συναρτήσεις: AVERAGE: Είναι η συνάρτηση που χρησιμοποιούμε για να υπολογίσουμε τον αριθμητικό μέσο όρο. MODE: Είναι η συνάρτηση που χρησιμοποιούμε για να υπολογίσουμε την επικρατούσα τιμή. MEDIAN: Είναι η συνάρτηση που χρησιμοποιούμε για να υπολογίσουμε τη διάμεσο τιμή. Το παρακάτω παράδειγμα επεξηγεί τη χρήση των συναρτήσεων αυτών. Ως αριθμητικά δεδομένα θα χρησιμοποιήσουμε τα δεδομένα ύψους των 8 φοιτητών, δηλαδή τα ύψη:150, 166, 167, 170, 171, 175, 180, 180. Αφού καταχωρίσουμε τις αριθμητικές τιμές του ύψους στο excel, θα προκύψει η Εικόνα 1.1. Πληκτρολογώντας στο κελί C14 τη σχέση =AVERAGE(C4:C11) προκύπτει ο μέσος όρος. Πληκτρολογώντας κελί C15 τη σχέση =MODE(C4:C11) προκύπτει η επικρατούσα τιμή. Πληκτρολογώντας στο κελί C16 τη σχέση =MEDIAN(C4:C11) προκύπτει η διάμεσος τιμή. 36

Εικόνα 1.1 1.5.4 Τεταρτημόρια Το πρώτο τεταρτημόριο, το οποίο συμβολίζεται ως Q 1, είναι η τιμή εκείνη που κάτω από αυτή βρίσκεται το 25% (το 1/4) των διαθέσιμων αριθμητικών παρατηρήσεων. Το τρίτο τεταρτημόριο, το οποίο συμβολίζεται ως Q 3, είναι η τιμή εκείνη που κάτω από αυτή βρίσκεται το 75% (τα 3/4) των διαθέσιμων αριθμητικών παρατηρήσεων. 1.5.5 Δεκατημόρια Το πρώτο ή, δεύτερο, τρίτο,, ή ένατο δεκατημόριο το οποίο συμβολίζεται ως: D k όπου k = 1, 2, 3,, 9 είναι η τιμή εκείνη που αφήνει κάτω από αυτή το 10% ή το 20% ή το 30%,., ή το 90% των αριθμητικών παρατηρήσεων. 37

1.5.6 Εκατοστημόρια Το πρώτο, δεύτερο, τρίτο,.ή το ενενηκοστό όγδοο εκατοστημόριο, το οποίο συμβολίζουμε ως: C k όπου k = 1, 2, 3,, 98, είναι η τιμή που αφήνει κάτω από αυτή το 1% ή το 2% ή το 3%,., ή το 98% των αριθμητικών παρατηρήσεων. Για τον υπολογισμό των τεταρτημορίων στο λογιστικό φύλλο excel χρησιμοποιούμε τη συνάρτηση QUARTILE και για τον υπολογισμό των δεκατημορίων και εκατοστημορίων χρησιμοποιούμε τη συνάρτηση PER- CENTILE. Όταν τις χρησιμοποιούμε, η σύνταξη των σχέσεων χρειάζεται προσοχή. Γράφουμε =QUARTILE(.. ; 1 ή 3), όπου ο αριθμός 1 δηλώνει το πρώτο τεταρτημόριο και ο αριθμός 3 δηλώνει το τρίτο τεταρτημόριο. Επίσης, για τον υπολογισμό των δεκατημορίων ή εκατοστημορίων γράφουμε =PERCENTILE(. ; k), όπου οι αριθμοί k = 0.10, k = 0.20 δηλώνουν το πρώτο, δεύτερο κ.λπ. δεκατημόρια και οι αριθμοί k = 0.010, k = 0.020,. δηλώνουν το πρώτο, δεύτερο κ.λπ. εκατοστημόρια. εν είναι δύσκολο να αντιληφθούμε ότι η διάμεσος είναι ίση με το δεύτερο τεταρτημόριο και με το πέμπτο δεκατημόριο καθώς και με το πεντηκοστό εκατοστημόριο. Χρησιμοποιώντας ξανά τα δεδομένα ύψους των 8 φοιτητών του Πίνακα 1.2 όπως έχουν καταχωρισθεί στην Εικόνα 1.1 και: Πληκτρολογώντας * τη σχέση: =QUARTILE(C4:C11, 1), στο κελί C17 προκύπτει το πρώτο τεταρτημόριο. Πληκτρολογώντας τη σχέση =QUARTILE(C4:C11, 3), στο κελί C18 προκύπτει το τρίτο τεταρτημόριο. Πληκτρολογώντας τη σχέση =PERCENTILE(C4:C11, 0.03), στο κελί C20 προκύπτει το τρίτο εκατοστημόριο. Η συνάρτηση PERCENTRANK μπορεί να χρησιμοποιηθεί μαζί με τις συναρτήσεις QUARTILE, MEDIAN, PERCENTILE και να μας δώσει κατά- * Η σύνταξη της συνάρτησης χρειάζεται προσοχή. Ορισμένες φορές, και αυτό εξαρτάται από την έκδοση του λογιστικού φύλλου, συντάσσεται χρησιμοποιώντας ελληνικό ερωτηματικό αντί για κόμμα, δηλαδή γράφουμε =QUARTILE(C4:C11; 3) αντί =QUARTILE(C4:C11,3) για να ξεχωρίσουμε τα κελιά από το τεταρτημόριο. Το αυτό ισχύει και για τα εκατοστημόρια, τα δεκατημόρια αλλά και για κάθε άλλη συνάρτηση που απαιτείται διαχωρισμός. Για το λόγο αυτό τα δεκαδικά ψηφία αριθμών μέσα σε συνάρτηση διαχωρίζονται με κουκίδα «.» και όχι με κόμμα «,». 38

ταξη μιας τιμής επί τοις εκατό σε ένα σύνολο δεδομένων. Πληκτρολογώντας τη σχέση =PERCENTRANK(F3:F10;167) θα αποδώσει 0, 285 ή 28, 5%. Πράγματι, το πλήθος τιμών που είναι μικρότερες από 167 είναι 2 (Εικόνα 1.1) και το πλήθος τιμών πάνω από 167 είναι 5. Επομένως, 2/(2+5)= 0, 285. Επίσης, η συνάρτηση RANK βρίσκει τη σειρά που έχει ένας συγκεκριμένος αριθμός σε ένα σύνολο δεδομένων. Εάν πληκτρολογήσουμε τη σχέση =RANK(167;C4:C11), όπου ζητούμενη είναι η σειρά του αριθμού 167, η περιοχή C4, C11 περιέχει το σύνολο των αριθμών στο οποίο ανήκει και ο αριθμός 167 (πίνακας Εικόνας 5). Το αποτέλεσμα είναι 6. ηλαδή ο αριθμός 167 είναι έκτος στη σειρά αν η αναζήτηση της σειράς του αριθμού γίνει από το μεγαλύτερο προς το μικρότερο αριθμό. Εάν όμως πληκτρολογήσουμε =RANK(167;C4:C11;1), το αποτέλεσμα είναι τρία. ηλαδή ο αριθμός 167 είναι τρίτος στη σειρά αν η αναζήτηση της σειράς του αριθμού γίνει από το μικρότερο αριθμό προς το μεγαλύτερο. 1.5.7 Η διακύμανση Ο αριθμητικός μέσος όρος, ενώ μας δίνει σημαντική πληροφορία για το σύνολο των αριθμών που εξετάζουμε, η αξία της αυτής της πληροφορίας μεγαλώνει εάν διαπιστώσουμε ότι κάθε αριθμός έχει μικρή διαφορά από τον αριθμητικό μέσο όρο. Το αριθμητικό παράδειγμα που ακολουθεί επεξηγεί την προηγούμενη παρατήρηση. Ας υποθέσουμε ότι έχουμε τις δύο ομάδες αριθμών του επόμενου πίνακα. Πίνακας 1.3 Ομάδα Α 1 3 5 Ομάδα Β 3 3 3 Και οι δύο ομάδες έχουν τον ίδιο αριθμητικό μέσο όρο μ=3. Ενώ όμως στην ομάδα Β ο μέσος όρος αντιπροσωπεύει πολύ καλά τους αριθμούς, στην ομάδα Α αυτό δε συμβαίνει. Μας χρειάζεται λοιπόν ένα μέτρο που θα παίρνει υπόψη του τη διαφορά (απόσταση) ενός αριθμού από τον αριθμητικό μέσο όρο. Ας το δούμε αυτό στον παρακάτω πίνακα. 39

Ομάδα Α Απόλυτη απόσταση από το μέσο Πίνακας 1.4 Ομάδα Β Απόλυτη απόσταση από το μέσο 1 1 3 = 2 3 3 3 = 0 3 3 3 = 0 3 3 3 = 0 5 5 3 = 3 3 3 3 = 0 Η μέση απόσταση για την ομάδα Α είναι (2+0+2)/3 = 1, 33 και η μέση απόσταση για την ομάδα Β είναι (0+0+0)/3 = 0. Η αξία της χρήσης της μέσης απόλυτης απόστασης, όπως λέγεται, είναι προφανής. Μας πληροφορεί πόσο απέχει κατά μέσο όρο ένας αριθμός από το μέσο όρο. Όμως, όταν επεξεργαζόμαστε αριθμούς είναι περισσότερο βολικό αντί τη μέση απόλυτη απόσταση να υψώνουμε στο τετράγωνο τις αποκλίσεις και στη συνέχεια να υπολογίζουμε το μέσο όρο των τετραγωνισμένων αποκλίσεων. Επομένως, ξαναχρησιμοποιώντας τον Πίνακα 1.4 με τις ομάδες Α και Β θα έχουμε τον επόμενο Πίνακα 1.5. Ομάδα Α ιαφορές από το μέσο όρο υψωμένες στο τετράγωνο Πίνακας 1.5 Ομάδα Β ιαφορές από το μέσο όρο υψωμένες στο τετράγωνο 1 (1 3) 2 = 4 3 (3 3) 2 = 0 3 (3 3) 2 = 0 3 (3 3) 2 = 0 5 (5 3) 2 = 4 3 (3 3) 2 = 0 Ο μέσος όρος των υψωμένων στο τετράγωνο διαφορών καλείται διακύμανση. Η διακύμανση συμβολίζεται ως σ 2 ή ως s 2, εάν εργαζόμαστε με δείγματα. Ο υπολογισμός της διακύμανσης για τις ομάδες Α και Β του Πίνακα 1.5 δίνει τα αποτελέσματα: σ 2 = (4+0+4)/3 =2,66, για την ομάδα Α και σ 2 =(0+0+0)/3 = 0, για την ομάδα Β. 1.5.8 Μέση απόκλιση τετραγώνου ή τυπική απόκλιση Για να ξεπεράσουμε προβλήματα με τις μονάδες μέτρησης το ενδιαφέρον μας εστιάζεται στην τετραγωνική ρίζα της διακύμανσης. Η τετραγωνική ρίζα της διακύμανσης καλείται τυπική απόκλιση και συμβολίζεται ως σ ή ως s, 40

εάν εργαζόμαστε με δείγματα. Η τετραγωνική ρίζα της διακύμανσης για τα αριθμητικά δεδομένα του Πίνακα 1.5 είναι για την ομάδα Α και μηδέν για την ομάδα Β. Η διακύμανση και η τυπική απόκλιση είναι δυο από τα μέτρα διασποράς που χρησιμοποιούμε. 1.5.9 Εύρος μεταβολής και ημι-ενδοτεταρτημοριακό εύρος Εκτός από διακύμανση και την παραγόμενη από αυτή τυπική απόκλιση, το απλούστερο μέτρο για τη διασπορά είναι το εύρος της μεταβολής. Προκύπτει εύκολα, αρκεί από τη μεγαλύτερη τιμή ενός συνόλου δεδομένων να αφαιρέσουμε τη μικρότερη. Ένα άλλο, επίσης απλό μέτρο, είναι το ημιενδοτεταρτημοριακό εύρος, το οποίο προκύπτει εάν από το τρίτο τεταρτημόριο Q 3 αφαιρέσουμε το πρώτο Q 1 και το αποτέλεσμα το διαιρέσουμε με το δύο. Το μέτρο αυτό, σε αντίθεση με το εύρος, δεν επηρεάζεται από τις ακραίες τιμές δεδομένων. 1.5.10 Συντελεστής μεταβλητικότητας Για να εξετάσουμε την απόσταση της τυπικής απόκλισης σε σχέση με τον αριθμητικό μέσο όρο υπολογίζουμε το συντελεστή μεταβλητότητας, ο οποίος προκύπτει αν διαιρέσουμε την τυπική απόκλιση με τον αριθμητικό μέσο όρο. Το συντελεστή μεταβλητικότητας τον συμβολίζουμε ως CV. Για τον υπολογισμό της μέσης απόλυτης απόκλισης, του αθροίσματος απόκλισης τετράγωνων από το μέσο, της διακύμανσης και της τυπικής απόκλισης στο λογιστικό φύλλο excel χρησιμοποιούμε τις παρακάτω συναρτήσεις: AVEDEV είναι η συνάρτηση από την οποία χρησιμοποιούμε για τον υπολογισμό της μέσης απόλυτης απόστασης, DEVSQ η συνάρτηση την οποία χρησιμοποιούμε για τον υπολογισμό του αθροίσματος αποκλίσεων τετραγώνων από το μέσο, VARP, VAR είναι οι συναρτήσεις τις οποίες χρησιμοποιούμε για να υπολογίσουμε τη διακύμανση, STDEVP, STDEV είναι οι συναρτήσεις * τις οποίες χρησιμοποιούμε για να υπολογίσουμε την τυπική απόκλιση. Για τον υπολογισμό του εύρους χρησιμοποιούμε τη διαφορά * Όταν υπολογίζουμε τη διακύμανση ή την τυπική απόκλιση στον πληθυσμό χρησιμοποιούμε τις συναρτήσεις VARP και STDEVP αντίστοιχα. Όταν υπολογίζουμε τη διακύμανση ή την τυπική απόκλιση δείγματος χρησιμοποιούμε τις συναρτήσεις VAR, STDEV για να ληφθούν υπόψη οι βαθμοί ελευθερίας. 41

της συνάρτησης MIN από τη συνάρτηση MAX. Εάν χρησιμοποιήσουμε τα αριθμητικά δεδομένα ύψους των 8 φοιτητών του Πίνακα 1.2, για να υπολογίσουμε το εύρος, τη διακύμανση, την τυπική απόκλιση και το συντελεστή μεταβλητικότητας, θα προκύψει ο πίνακας της Εικόνας 1.2. Εικόνα 1.2 Για να προκύψουν τα αποτελέσματα της Εικόνας 1.2 πληκτρολογήσαμε τις σχέσεις: Πληκτρολογώντας τη σχέση =MAX(C4:C11) MIN(C4:C11), στο κελί C14 προκύπτει το εύρος. Πληκτρολογώντας τη σχέση =DEVSQ(C4:C11), στο κελί C15 προκύπτει το άθροισμα τετραγώνων των αποκλίσεων από το μέσο. Πληκτρολογώντας τη σχέση=avedev(c4:c11), στο κελί C16 προκύπτει η μέση απόλυτη απόκλιση. 42

Πληκτρολογώντας τη σχέση =VARP(C4:C11), στο κελί C17 προκύπτει η διακύμανση στον πληθυσμό. Πληκτρολογώντας τη σχέση =STDEVP(C4:C11), στο κελί C18 προκύπτει η τυπική απόκλιση στον πληθυσμό. Πληκτρολογώντας τη σχέση =VAR(C4:C11), στο κελί C19 προκύπτει η διακύμανση δείγματος. Πληκτρολογώντας τη σχέση =STDEV(C4:C11), στο κελί C20 προκύπτει η τυπική απόκλιση σε δείγμα. Πληκτρολογώντας τη σχέση ο συντελεστής μεταβλητικότητας., στο κελί C21 προκύπτει 1.5.11 Απλή συχνότητα Αθροιστική συχνότητα Η διαχείριση μικρού πλήθους αριθμών δεν είναι μια ιδιαίτερα δύσκολη υπόθεση. Η δυσκολία αυξάνει όσο το πλήθος των αριθμών αυξάνει. Ας υποθέσουμε ότι έχουμε καταχωρίσει στο λογιστικό φύλλο τις εβδομαδιαίες αποδοχές σε ευρώ 200 εργαζομένων (Εικόνα 1.3). Εύκολα γίνεται αντιληπτό ότι τα αριθμητικά δεδομένα, όπως έχουν παρατεθεί, είναι δύσχρηστα *. Εάν όμως τα αριθμητικά δεδομένα παρατεθούν με τρόπο διαφορετικό, είναι δυνατόν να αντληθεί χωρίς δυσκολία πλήθος από χρήσιμες πληροφορίες. Εάν παρατηρήσουμε τα δεδομένα μας, θα δούμε ότι μερικές από τις τιμές των εβδομαδιαίων αποδοχών επαναλαμβάνονται περισσότερες από μια φορά. Για παράδειγμα, εάν μετρήσουμε, θα δούμε ότι 8 εργαζόμενοι από τους 200 λαμβάνουν ως εβδομαδιαίες αποδοχές 100 ευρώ, 19 εργαζόμενοι λαμβάνουν ως εβδομαδιαίες αποδοχές 102, 7 εργαζόμενοι λαμβάνουν ως 115 ευρώ εβδομαδιαίες αποδοχές κ.λπ.. Επομένως, ο πίνακας αποδοχών της Εικόνας 1.3 μπορεί να πάρει τη μορφή του παρακάτω Πίνακα 1.6. * Οι συναρτήσεις που έχουμε ως τώρα αναφέρει μπορούν να εφαρμοστούν κατευθείαν στα δεδομένα της Εικόνας 1.3. Εάν για παράδειγμα πληκτρολογήσουμε τη σχέση =AVERAGE(B3:K22), θα προκύψει η αριθμητική τιμή του μέσου όρου των δεδομένων. 43

Εικόνα 1.3 Εβδομαδιαίες αποδοχές (Ευρώ) Πίνακας 1.6 100 102 104 106 108 110 115 Πλήθος εργαζομένων 8 19 36 70 40 20 7 Η δεύτερη γραμμή του Πίνακα 1.6 μας δίνει την απόλυτη συχνότητα. ηλαδή πόσες φορές εμφανίζεται μια τιμή των εβδομαδιαίων αποδοχών. Κατά άλλη διατύπωση πόσοι εργαζόμενοι λαμβάνουν εβδομαδιαίες αποδοχές ίσες με 100 ευρώ, 102 ευρώ κ.λπ. Ο Πίνακας 1.6, που κατασκευάσαμε, ονομάζεται πίνακας κατανομής συχνοτήτων και συνήθως έχει τη διάταξη του Πίνακα 1.7, έχοντας τόσο τη στήλη της απόλυτης αλλά και της σχετικής (%) συχνότητας. 44

Τιμές x i της μεταβλητής X (Εβδομαδιαίες αποδοχές) Πίνακας 1.7 Απόλυτη Συχνότητα f i των τιμών της μεταβλητής X Σχετική Συχνότητα f i % των τιμών της μεταβλητής X 100 8 4% 102 19 9.5% 104 36 18% 106 70 35% 108 40 20% 110 20 10% 115 7 3.5% Σύνολο= 200 Σύνολο=100% Εκτός από την έννοια της συχνότητας των τιμών f i, έχουμε και την έννοια της αθροιστικής συχνότητας των τιμών F i. Η αθροιστική συχνότητα μας δίνει το αποτέλεσμα εμφάνισης τιμών μέχρι και μιας συγκεκριμένης τιμής. Για παράδειγμα, το πλήθος των εργαζομένων που λαμβάνουν εβδομαδιαίες αποδοχές μέχρι και 104 ευρώ είναι 8+18+36 = 62. Ο αριθμός αυτός είναι η τιμή της ζητούμενης αθροιστικής συχνότητας, η οποία μπορεί να είναι απόλυτη ή σχετική (%), οπότε ο Πίνακας 1.7, αν συμπεριλάβει και την αθροιστική συχνότητα, μας δίνει τον Πίνακα 1.8. x i f i f i % Πίνακας 1.8 Απόλυτη αθροιστική συχνότητα F i των τιμών της μεταβλητής x i Σχετική αθροιστική συχνότητα F i % των τιμών της μεταβλητής x i 100 8 4% 8 4.0% 102 19 9.5% 27 13.5% 104 36 18% 63 31.5% 106 70 35% 133 66.5% 108 40 20% 173 86.5% 110 20 10% 193 96.5% 115 7 3.5% 200 100% 200 100% 45

Η αθροιστική συχνότητα, που υπολογίστηκε προηγουμένως, ονομάζεται δεξιόστροφη. Εύκολα προκύπτει ότι η δεξιόστροφη συχνότητα είναι ίση με: F i = f i + F i-1 όπου F 1 = f 1 και i = 1, 2, 3,. Εκτός από τη δεξιόστροφη αθροιστική συχνότητα έχουμε και την αριστερόστροφη. Η αριστερόστροφη αθροιστική συχνότητα, την οποία συμβολίζουμε ως Φ i, μας δίνει το πλήθος των παρατηρήσεων πάνω από μια συγκεκριμένη τιμή. Η αριστερόστροφη συχνότητα είναι ίση με Φ i = N - F i, όπου Ν είναι το συνολικό πλήθος των δεδομένων μας. Για να κατασκευάσουμε τον Πίνακα 1.8 χρησιμοποιώντας τα αριθμητικά δεδομένα εβδομαδιαίων αποδοχών των 200 εργατών που έχουν καταχωρισθεί στο λογιστικό φύλλο (Εικόνα 1.3), θα χρησιμοποιήσουμε τις συναρτήσεις: COUNT, COUNTIF, MAX, MIN, FREQUENCY. Τρόπος Α: με τη χρήση των συναρτήσεων COUNT, COUNTIF, MAX, MIN. Πληκτρολογώντας τη σχέση =COUNT(B3:K22), προκύπτει το πλήθος των εργαζομένων (Εικόνα 1.4). Πληκτρολογώντας τη σχέση =MAX(B3:K22), προκύπτει η μεγαλύτερη τιμή των εβδομαδιαίων αποδοχών (Εικόνα 1.4). Πληκτρολογώντας τη σχέση =MIN(B3:K22), προκύπτει η μικρότερη τιμή των εβδομαδιαίων αποδοχών (Εικόνα 1.4). Γνωρίζουμε επομένως ότι οι αποδοχές των εργαζομένων είναι από 100 έως και 115 ευρώ. Στη συνέχεια, καταχωρούμε όπως στην Εικόνα 1.4 τις αποδοχές 100, 102, 104 κ.λπ. ως και 115 ευρώ (κελί B28 έως και κελί K28). Πληκτρολογώντας τη σχέση =COUNTIF($B$3:$K$22; =100 ) η συνάρτηση COUNTIF θα μετρήσει στην περιοχή κελιών B3, K22 πόσες φορές υπάρχει ο αριθμός 100. Χρησιμοποιώντας την ίδια συνάρτηση και αλλάζοντας τον αριθμό προκύπτει πόσες φορές υπάρχει ο αριθμός 102, 104 κ.λπ. (Εικόνα 1.4 από κελί B29 έως και H29). Το άθροισμα των συχνοτήτων είναι ίσο με 200 (κελί I29). 46

Εικόνα 1.4 Η αθροιστική συχνότητα είναι εύκολο να προκύψει με απλή άθροιση. Προκύπτει πληκτρολογώντας τη σχέση =B30+C29 και αντιγράφοντάς την από το κελί C30 ως και το κελί H30. Να σημειώσουμε ότι για λόγους οπτικής παρουσίασης των αποτελεσμάτων ο πίνακας με τις συχνότητες στην Εικόνα 1.4 έχει παρατεθεί σε διάταξη γραμμών και όχι στηλών, όπως είναι ο Πίνακας 1.8. Τρόπος Β: με τη χρήση της συνάρτησης FREQUENCY Η συνάρτηση FREQUENCY δίνει την αθροιστική συχνότητα κατευθείαν, αρκεί και εδώ να υπάρχουν οι τιμές για τις οποίες είναι ζητούμενο η συχνότητά τους. Εάν πληκτρολογήσουμε τη σχέση =FREQUENCY($B$3: $K$22;B$28:$H28) στο κελί B31 και την αντιγράψουμε έως και το κελί H31, θα προκύψουν οι τιμές της αθροιστικής συχνότητας * (Εικόνα 1.4). * Τα άγκιστρα $ χρησιμοποιούνται για να «παγιδεύσουν» την περιοχή δεδομένων στην οποία θα γίνει χρήση μιας σχέσης. 47

Με απλή αφαίρεση προκύπτουν οι τιμές της απλής συχνότητας *. Εάν πληκτρολογήσουμε τη σχέση =C31 B31 στο κελί C32 και την αντιγράψουμε έως και το κελί H32, θα προκύψουν οι τιμές της απλής συχνότητας (Εικόνα 1.4). 1.5.12 Κάνοντας ομάδες τα αριθμητικά δεδομένα Ας εξετάσουμε μια νέα σειρά από αριθμητικά δεδομένα εβδομαδιαίων αποδοχών 200 εργαζομένων, τα οποία έχουν καταχωρισθεί στο λογιστικό φύλλο και παρουσιάζονται στην Εικόνα 1.5. Εικόνα 1.5 Εύκολα μπορούμε να διακρίνουμε ότι μεταξύ εβδομαδιαίων αποδοχών ύψους 150 και 154 ευρώ έχουν καταγραφεί και αποδοχές ύψους: 151, * Εκτός από την ισότητα «=» η συνάρτηση COUNTIF μπορεί να συνταχθεί και με σύμβολα όπως «>=», δηλαδή μεγαλύτερο ή ίσο. Εάν για παράδειγμα πληκτρολογήσουμε τη σχέση =COUNTIF($B$3:$K$22; >=102 ), θα αποδώσει όλους τους αριθμούς της Εικόνας 1.4 που είναι μεγαλύτεροι ή ίσοι από τον αριθμό 102. Το αποτέλεσμα είναι 192. Εάν πληκτρολογήσουμε τη σχέση =COUNTIF($B$3: $K$22; >102 ), θα αποδώσει όλους τους αριθμούς της Εικόνας 6.1 που είναι μεγαλύτεροι από τον αριθμό 102. Το αποτέλεσμα είναι 173. 48

152, 153, 154 ευρώ. ηλαδή η καταγραφή είναι περισσότερο λεπτομερής συγκρινόμενη με τα δεδομένα αποδοχών, όπως έχουν καταχωριθεί στην Εικόνα 1.5. Όταν έχουμε καταγραφές με αρκετή λεπτομέρεια, πολλές φορές είναι περισσότερο χρήσιμο αντί να παρουσιάζουμε όλη τη λεπτομέρεια, όπως έχει καταγραφεί, που πολλές φορές δεν προσφέρει επιπλέον πληροφορίες, να κατασκευάζουμε ομάδες. Οι ομάδες αυτές καλούνται τάξεις (classes). Παραδείγματος χάρη, αντί να παρουσιάσουμε αναλυτικά τις αποδοχές 150, 151, 152, 153, 154 παρουσιάζουμε την τάξη από 150 ως και 154 ευρώ. Η τάξη συνοδεύεται και από την πληροφορία του πλήθους (συχνότητα) των εργαζομένων που έχουν αποδοχές εβδομαδιαίες από 150 ως και 154 ευρώ. Έτσι, η πληροφορία ότι: αποδοχές από 150 ως και 154 ευρώ έχουν 8 εργαζόμενοι είναι περισσότερο χρήσιμη. Η κατασκευή ενός τέτοιου πίνακα θα έχει την παρακάτω γενική μορφή: Τάξεις αποδοχών Αριθμός εργαζομένων που ανήκουν στην τάξη (συχνότητα f) Από 150 ως και 154 ευρώ 8 Από 155 ως και 159 ευρώ 10 κ.λπ. κ.λπ. Κάθε τάξη έχει δύο ακραίες τιμές (κάτω όριο και άνω όριο της τάξης), μεταξύ των οποίων είναι κατανεμημένες οι ενδιάμεσες τιμές. Για παράδειγμα, η τιμή 150 ευρώ είναι το κάτω όριο της τάξης και η τιμή 154 ευρώ είναι το άνω όριο της τάξης. Η διαφορά 150 154 = 4 καλείται εύρος της τάξης και η τιμή (150+154) / 2 = 152 καλείται κεντρική τιμή της τάξης. Η διαφορά μεταξύ της μεγαλύτερης τιμής αποδοχών των 200 εργαζομένων και της μικρότερης τιμής αποδοχών των 200 εργαζομένων καλείται εύρος της κατανομής τάξεων. Στο παράδειγμά μας, από την Εικόνα 1.5 έχουμε μεγαλύτερη τιμή αποδοχών 194 ευρώ και μικρότερη τιμή αποδοχών 150 ευρώ. Η διαφορά, 194 150= 44 ευρώ, είναι το εύρος της κατανομής. Οι δυνατές περιπτώσεις με τα όρια της κατανομής των τάξεων έχουν καταχωρισθεί στον επόμενο Πίνακα 1.9. 49

Πίνακας 1.9 Τάξεις κλειστής κατανομής πάνω και κάτω Τάξεις ανοικτής από τα κάτω κατανομής Τάξεις ανοικτής από τα άνω κατανομής Τάξεις ανοικτής από τα κάτω και τα άνω κατανομής α 0 α 1.Έως και α 1 α 0 α 1.Έως και α 1 α 1 α 2 α 1 α 2 α 1 α 2 α 1 α 2 α 2 α 3 α 2 α 3 α 2 α 3 α 2 α 3 α 3 α 4 α 3 α 4 α 3 α 4 α 3 α 4 α 4 α 5 α 4 α 5 α 4 α 5 α 4 α 5.... α k-1 α k α k-1 α k α k-1 και άνω α k-1 και άνω Έχοντας υπόψη τα προηγούμενα, ας εξετάσουμε περισσότερο προσεκτικά το πρόβλημα της ομαδοποίησης των δεδομένων. Σε ένα σύνολο διαθέσιμων αριθμητικών δεδομένων, που θα επεξεργαστούμε, υπάρχει μια ελάχιστη και μια μέγιστη τιμή μεταξύ των οποίων κατανέμονται οι υπόλοιπες τιμές των αποδοχών. Στο παράδειγμά της Εικόνας 1.5 η μεγαλύτερη τιμή είναι τα 194 ευρώ και η ελάχιστη τιμή είναι τα 150 ευρώ. Το διάστημα από 150 ευρώ ως και 194 ευρώ είναι δυνατό να διαιρεθεί με αρκετούς τρόπους σε μικρότερα διαστήματα για να κατασκευάσουμε τις τάξεις και την κατανομή συχνοτήτων των τάξεων. Γενικότερα, το πρόβλημα του πώς κατασκευάζονται οι τάξεις και πόσες τάξεις θα κατασκευάσουμε είναι συνάρτηση του προβλήματος που καλούμαστε να λύσουμε του πλήθους και της φύσης των διαθέσιμων δεδομένων. Γενικά, μπορούμε να έχουμε υπόψη τα παρακάτω: Για να προσδιορίσουμε ποιο θα είναι το εύρος των τάξεων, χρησιμοποιούμε τον παρακάτω εμπειρικό κανόνα. Όπου δ είναι το εύρος των τάξεων. Max(x) είναι η μεγαλύτερη τιμή των διαθέσιμων δεδομένων μας και Min(x) είναι η μικρότερη τιμή των διαθέσιμων δεδομένων. Ν είναι το πλήθος των δεδομένων. Επίσης, σχετικά με το πλήθος των τάξεων μπορούμε να ακολουθήσουμε τις παρακάτω εμπειρικές υποδείξεις σε συνδυασμό με την εμπειρική σχέση 50

ότι το πλήθος τάξεων είναι περίπου ίσο με την τετραγωνική ρίζα του πλήθους των δεδομένων, συνεπώς: 5 ως 9 τάξεις είναι αρκετές, όταν N < 50. 7 ως 12 τάξεις είναι αρκετές, όταν 100 < N < 250. 12 ως 20 τάξεις είναι αρκετές, όταν N > 250. Σύμφωνα λοιπόν με τα δεδομένα του πίνακα της Εικόνας 1.5, η μικρότερη τιμή αποδοχών είναι τα 150 ευρώ και η μεγαλύτερη είναι 194 ευρώ. Οι ομάδες που θα κατασκευάσουμε θα αρχίσουν με τα 150 ευρώ και θα τελειώσουν με τα 194 ευρώ με εύρος 4 ευρώ. Λαμβάνοντας υπόψη τα προηγούμενα, κατασκευάζουμε τον Πίνακα 1.10 που ακολουθεί. Κάτω όριο τάξης Άνω όριο τάξης Πίνακας 1.10 Κεντρική τιμή τάξης Συχνότητα f Αθροιστική συχνότητα F 150 154 152 8 8 155 159 157 10 18 160 164 162 15 33 165 169 167 32 65 170 174 172 70 135 175 179 177 32 167 180 184 182 15 182 185 189 187 10 192 190 194 192 8 200 Σύνολο=200 Εάν τον Πίνακα 1.10 θελήσουμε να το κατασκευάσουμε στο λογιστικό φύλλο, θα πρέπει να προσέξουμε ώστε να οριστούν οι άνω και κάτω τιμές των τάξεων, για να είναι δυνατός ο υπολογισμός της κεντρικής τιμής *. Στο λογιστικό φύλλο θα προκύψει ο πίνακας της Εικόνας 1.6. * Να σημειώσουμε ότι, όταν τα δεδομένα μας είναι ομαδοποιημένα, οι τιμές x i, δηλαδή οι τιμές x 1, x 2, x 3,, x n τις οποίες χρησιμοποιούμε για τον υπολογισμό του μέσου όρου και της διακύμανσης, είναι οι κεντρικές τιμές των τάξεων. Επίσης, να σημειώσουμε ότι ο μέσος όρος στην περίπτωση των ομαδοποιημένων σε τάξεις δεδομένων υπολογίζεται μόνο στην περίπτωση που η κατανομή τάξεων είναι κλειστή. 51

Εικόνα 1.6 Η στήλη της αθροιστικής συχνότητας προκύπτει από την αντιγραφή της σχέσης: =FREQUENCY($B$3:$K$22;$D29:D$37) από το κελί G29 έως και το κελί G37. Τα κελιά Β3:K22 είναι η περιοχή δεδομένων του πίνακα της Εικόνας 1.5. Τέλος, οι τιμές συχνότητας και οι κεντρικές τιμές τάξεων προκύπτουν από την αντιγραφή στα ανάλογα κελιά των =G30 G29 και =(C29+D29)/2 σχέσεων, αντίστοιχα. 1.5.13 Τα εργαλεία: ιστόγραμμα τάξη και εκατοστημόρια To λογιστικό φύλλο excel διαθέτει μια πολύ ισχυρή συλλογή εργαλείων η οποία είναι διαθέσιμη μέσω του analysis tool pack. Για να είναι δυνατή η πρόσβαση στο analysis tool pack, θα πρέπει να έχει γίνει η επιλογή της εγκατάστασής του, όταν γίνεται η εγκατάσταση του excel. Στη συνέχεια, από την επιλογή εργαλεία (tools), ενεργοποιώντας την ανάλυση δεδομένων (data analysis), θα εμφανιστεί η παρακάτω Εικόνα 1.7. Το εργαλείο Ιστόγραμμα το χρησιμοποιούμε για να κατασκευάσουμε έναν πίνακα κατανομής συχνοτήτων, όπως τον πίνακα της Εικόνας 1.8. Επιπλέον, μας δίνει τη δυνατότητα να παρουσιάσουμε τη κατανομή συχνοτήτων σε φθίνουσα σειρά. Τέλος, δίνει τη δυνατότητα και της γραφικής απεικόνισης κατασκευάζοντας ένα ιστόγραμμα. 52

Εικόνα 1.7 Ας δούμε βήμα-βήμα πώς μπορούμε να χρησιμοποιήσουμε το εργαλείο Ιστόγραμμα, χρησιμοποιώντας τα δεδομένα αποδοχών της Εικόνας 1.5. Βήμα 1: Από την επιλογή εργαλεία του λογιστικού φύλου ενεργοποιούμε την ανάλυση δεδομένων. Βήμα 2: Θα εμφανιστεί το παράθυρο της Εικόνας 1.7, θα επιλέξουμε Ιστόγραμμα και στη συνέχεια θα ενεργοποιήσουμε την επιλογή μας από το κουμπί OK. Βήμα 3: Θα εμφανιστεί το παράθυρο της Εικόνας 1.8 και θα συμπληρώσουμε τα κενά πεδία: Περιοχή εισόδου, Περιοχή κλάσης δεδομένων *, Περιοχή εξόδου. Κατόπιν επιλέγουμε τι θέλουμε ως έξοδο (Εικόνα 1.8). Η περιοχή εισόδου $B$3:$K$22 είναι η περιοχή με τα δεδομένα των αποδοχών της Εικόνας 1.5. Ως περιοχή κλάσης δεδομένων καταχωρίζουμε στα κελιά $Μ$4:$Μ$12 τις άνω τιμές των τάξεων της Εικόνας 1.6, δηλαδή τις τιμές: 154, 159, 164,, 189, 194. Για έξοδο επιλέγουμε το κελί $Ν$3. Το αποτέλεσμα της εξόδου είναι ο παρακάτω πίνακας της Εικόνας 1.9 και το γράφημα της Εικόνας 1.10. * Εάν δε συμπληρώσουμε την περιοχή κλάσης δεδομένων, το excel τη συμπληρώνει αυτόματα. Θα δημιουργήσει αριθμό τάξεων ίσο με τη τετραγωνική ρίζα του πλήθους των δεδομένων. 53

Εικόνα 1.8 Εικόνα 1.9 Στο αποτέλεσμα ξανά παρουσιάζεται η περιοχή κλάσης δεδομένων (στήλη Ν). ίπλα παρουσιάζεται η συχνότητα (στήλη Ο) και κατόπιν η σχετική αθροιστική συχνότητα. 54

Ο πίνακας διαβάζεται ως εξής: Μέχρι και 154 ευρώ αποδοχές έχουμε 8 εργαζόμενους, από 155 ευρώ ως και 159 ευρώ 11 εργαζόμενους κ.λπ. Η επόμενη εικόνα παρουσιάζει τη γραφική παράσταση του ιστόγραμμου και την καμπύλη της αθροιστικής συχνότητας. Εικόνα 1.10 Εάν είχαμε επιλέξει ταξινομημένο ιστόγραμμα (Pareto), θα είχαμε τον πίνακα της Εικόνας 1.11. Εικόνα 1.11 55

Το νέο στοιχείο είναι ότι στη στήλη R οι συχνότητες παρουσιάζονται από τη μεγαλύτερη προς την μικρότερη: 70 > 32 > > 8. Εάν ενδιαφερόμαστε, για τη θέση (σειρά) ενός αριθμού και την ποσοστιαία του κατάταξη σε ένα σύνολο από δεδομένα, μπορούμε να εργασθούμε με το εργαλείο Τάξη και εκατοστημόρια μέσω της ανάλυσης δεδομένων. Βήμα-βήμα θα έχουμε: Βήμα 1: Από την επιλογή εργαλεία του λογιστικού φύλου ενεργοποιούμε την ανάλυση δεδομένων. Βήμα 2: Θα εμφανιστεί το παράθυρο της Εικόνας 1.12. Θα επιλέξουμε Τάξη και εκατοστημόρια και στη συνέχεια θα ενεργοποιήσουμε την επιλογή μας από το κουμπί OK. Βήμα 3: Θα εμφανιστεί το παράθυρο της Εικόνας 1.13 και θα συμπληρώσουμε τα κενά πεδία: Περιοχή εισόδου, Περιοχή εξόδου. Εικόνα 1.12 Ως περιοχή εισόδου έχουμε επιλέξει τις δυο πρώτες στήλες του πίνακα της Εικόνας 1.5. Το αποτέλεσμα της εξόδου είναι ο πίνακας της Εικόνας 1.14 που ακολουθεί. 56

Εικόνα 1.13 Εικόνα 1.14 57