ΣΤΟΙΧΕΙΑ ΠΕΡΙΓΡΑΦΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣ



Σχετικά έγγραφα
ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Μάθηµα 3 ο. Περιγραφική Στατιστική

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Εισαγωγή στη Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Περιγραφική Στατιστική

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Βιοστατιστική ΒΙΟ-309

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

2.3. Ασκήσεις σχ. βιβλίου σελίδας Α ΟΜΑ ΑΣ

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Περιγραφική Στατιστική

Πίνακας κατανοµής συχνοτήτων και αθροιστικών συχνοτήτων. Σχετ.

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Μάθηµα 14. Κεφάλαιο: Στατιστική

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Βιοστατιστική ΒΙΟ-309

Είδη Μεταβλητών. κλίµακα µέτρησης

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Βιοστατιστική ΒΙΟ-309

ΚΕΦΑΛΑΙΟ 8 ΤΟ ΜΑΘΗΜΑ ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

Mέτρα (παράμετροι) θέσεως

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα


ΚΕΦΑΛΑΙΟ 6 ΚΟΙΝΟΙ ΥΠΟΨΗΦΙΟΙ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ. Το σύνολο Α, που λέγεται πεδίο ορισµού της συνάρτησης,

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 2ο: ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑ Α

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Οµάδα (I): Οµάδα (II): Οµάδα (III):

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΣΚΗΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΚΕΦΑΛΑΙΟ. 1. α. Tι ονοµάζεται συνάρτηση από το σύνολο Α στο σύνολο Β; β. Tι ονοµάζεται πραγµατική συνάρτηση πραγµατικής µεταβλητής;

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Γ ΛΥΚΕΙΟΥ & ΕΠΑ.Λ. Β 20 ΜΑΪΟΥ 2013 ΑΠΑΝΤΗΣΕΙΣ. x x x 4

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Ιωάννης Σ. Μιχέλης Μαθηματικός

Συναρτήσεις. Ορισμός Συνάρτησης

Γιατί μετράμε την διασπορά;

ΚΕΦΑΛΑΙΟ 4 ΚΑΤΑΝΟΜΕΣ & ΟΜΑ ΟΠΟΙΗΣΗ ΒΑΘΜΟΛΟΓΙΩΝ. 4.1 Κατανοµή γραπτού µέσου όρου ετήσιων πληθυσµών

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΤΑΞΙΝΟΜΗΜΕΝΑ Ε ΟΜΕΝΑ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Συνάρτηση f, λέγεται η διαδικασία µε βάση την. Παρατηρήσεις - Σχόλια f

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

F x h F x f x h f x g x h g x h h h. lim lim lim f x

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μάθηµα 12. Κεφάλαιο: Στατιστική

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2005

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Η γραφική απεικόνιση µιας κατανοµής συχνότητας µπορεί να γίνει µε δύο τρόπους, µε ιστόγραµµα και µε πολυγωνική γραµµή.

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Transcript:

ΣΤΟΙΧΕΙΑ ΠΕΡΙΓΡΑΦΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΕΤΑΒΛΗΤΗ Ποσοτική Ποιοτική ιακριτή ή ασυνεχής (dscrete qutttve vrble (Πεπερασµένο πλήθος πιθανών τιµών Άπειρο αλλά αριθµήσιµο πλήθος πιθανών τιµών Συνεχής (cotuous qutttve vrble ( Άπειρο πλήθος πιθανών τιµών Κλίµακες µέτρησης µεταβλητών Κλίµακα διαστήµατος (tervl scle Ορίζεται διάταξη και απόσταση Η αρχή µέτρησης είναι αυθαίρετη (Η τιµή 0 δεν αποτελεί ένδειξη ανυπαρξίας πχ Θερµοκρασία, βαθµός πτυχίου Ονοµαστική ή κατηγορική κλίµακα (oml scle (ονόµατα, σύµβολα ή κατηγορίες εν ορίζεται διάταξη ούτε απόσταση πχ φύλο : "άνδρας" "γυναίκα" Κλίµακα λόγου (rto scle Ορίζεται διάταξη και απόσταση Η αρχή µέτρησης είναι καθορισµένη Ο λόγος δύο τιµών περιέχει συγκριτική πληροφορία πχ βάρος, ύψος, διάρκεια σπουδών Κλίµακα διάταξης (ordl scle Μπορεί να υπάρχει κάποια διάταξη εν ορίζεται απόσταση ή είναι άνευ σηµασίας πχ "κατάσταση υγείας" : "άριστη", "καλή" "µέτρια" 3, "κακή" 4 Ι ηµόπουλος, ΤΕΙ Καλαµάτας

ΠΙΝΑΚΕΣ ΑΠΛΗΣ ΕΙΣΟ ΟΥ ΜΟΡΦΕΣ ΠΑΡΟΥΣΙΑΣΗΣ Ε ΟΜΕΝΩΝ πχ Πίνακας Πληθυσµός της γης κατά περιοχές (970 Περιοχή Πληθυσµός σε εκατοµ Ευρώπη 46 Ασία 056 Αµερική 5 Αφρική 344 Ωκεανία 9 Ρωσία 43 Πηγή: ΟΗΕ, Demogrphc Yerboo, 970 Πίνακες συχνοτήτων Πίνακας που περιέχει τις τάξεις ή τις τιµές µιας ποσοτικής µεταβλητής, ή τις κατηγορίες µιας κατηγορικής ή ποιοτικής µεταβλητής συνοδευόµενες µε τις αντίστοιχες συχνότητες - Περίπτωση διακριτής, κατηγορικής ή ποιοτικής µεταβλητής Συχνότητα µιας τιµής κάποιας διακριτής (ασυνεχούς µεταβλητής λέγεται το πλήθος των τιµών της µεταβλητής που είναι ίσες µε την τιµή αυτή Στην περίπτωση µιας κατηγορικής ή ποιοτικής µεταβλητή την θέση της τιµής έχει η κατηγορία Αν το πλήθος των τιµών της µεταβλητής είναι µικρό ο πίνακας συχνοτήτων έχει την ακόλουθη µορφή : Παράδειγµα Τιµές της µεταβλητής X Συχνότητα των τιµών της X 3 3 Αριθµός υπαλλήλων που απουσίαζαν λόγω ασθένειας από µία επιχείρηση σε ένα διάστηµα 00 εβδοµάδων 0 5 0 0 0 3 0 0 0 0 4 0 3 0 0 0 0 0 0 0 0 0 0 3 0 0 0 3 0 0 0 0 0 3 0 0 4 0 0 0 0 0 0 4 0 0 3 0 0 0 0 0 0 0 0 0 0 Πίνακας Πίνακας συχνοτήτων ασθενών στην επιχείρηση Αριθµός ασθενών την εβδοµάδα ( Αριθµός των εβδοµάδων ( µε ( ασθενείς 0 47 8 5 3 6 4 3 5 Αν το πλήθος των τιµών της διακριτής µεταβλητής είναι µεγάλος, ο πίνακας συχνοτήτων σχηµατίζεται µε τρόπο παρόµοιο µε αυτόν της συνεχούς µεταβλητής Ι ηµόπουλος, ΤΕΙ Καλαµάτας 3

- Περίπτωση συνεχούς µεταβλητής Συχνότητα (σχετική µιας τάξης κάποιας συνεχούς µεταβλητής λέγεται το πλήθος των τιµών της µεταβλητής που ανήκουν στην τάξη αυτή Αν η µεταβλητή παίρνει τιµές στο διάστηµα [α, α ] (α α µπορούµε να χωρίσουµε το διάστηµα αυτό σε κ ίσες τάξεις [α, α Η διαφορά δ (α -α - λέγεται εύρος της τάξης, το α κάτω όριο της τάξης, το α άνω όριο και το α α κεντρική τιµή (ή κεντρικός όρος της τάξης Στην περίπτωση αυτή ο πίνακας συχνοτήτων έχει την ακόλουθη µορφή : Τιµές της µεταβλητής Συχνότητα των τιµών της α 0 - α α α α α 3 3 α - α Η σχετική συχνότητα µιας τιµής ( ή µιας τάξης (α α είναι : ή Σχετική συχνότητα µιας τιµής ( ή µιας τάξης (α α (συχνότητα (απόλυτη της τιµής ( ή της τάξης (α α / (άθροισµα συχνοτήτων (απόλυτων όλων των τιµών ή τάξεων Σηµείωση : Καθορισµός του αριθµού των τάξεων, Κανόνας του Sturges : Αριθµός τάξεων (κ 33log 0 (όπου είναι ο αριθµός των παρατηρήσεων Παράδειγµα Πίνακας τιµών ενοικίασης δωµατίου (δρχ 00 σε 40 διαφορετικά πανδοχεία σε ένα νησί του Αιγαίου 36 4 5 54 63 7 8 93 0 45 3 4 5 55 38 47 65 7 8 75 47 54 56 59 5 49 6 7 69 7 50 57 58 0 7 65 64 7 68 70 Πίνακας Πίνακας συχνοτήτων των τιµών ενοικίασης δωµατίου Τάξεις τιµών ενοικίασης Συχνότητες τάξεων δωµατίου (δρχ 00 30 40 3 40 50 6 50 60 60 70 7 70 80 8 80 90 90 00 00 0 Ι ηµόπουλος, ΤΕΙ Καλαµάτας 4

ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ Οι γραφικές παραστάσεις των δεδοµένων επιτρέπουν να αντιληφθούµε τα κύρια χαρακτηριστικά της κατανοµής τους Ραβδόγραµµα παρουσίασης διακριτών, κατηγορικών ή ποιοτικών µεταβλητών (δεδοµένων - ιακριτή µεταβλητή Στον άξονα των τοποθετούνται οι τιµές της µεταβλητής ( Για κάθε φέρουµε µια κάθετη γραµµή που τέµνει τον άξονα των στο σηµείο και έχει ύψος ίσο µε τη συχνότητα ή τη σχετική συχνότητα του (τιµές του άξονα των y 50 40 Συχνότητα 30 0 0 0 0 3 4 5 Αριθµός ασθενούντων εβδοµαδιαίως Σχήµα - Ποιοτική, κατηγορική µεταβλητή Γραφική παράσταση Preto Οι κάθετες γραµµές στον άξονα των τοποθετούνται µε τρόπο ώστε η µεγαλύτερη γραµµή (συχνότητα να είναι πρώτη προς τα αριστερά Ιστόγραµµα και πολύγωνο συχνοτήτων για την παρουσίαση συνεχών µεταβλητών (δεδοµένων Ο κατακόρυφος άξονας αντιπροσωπεύει τις συχνότητες και ο οριζόντιος τις τάξεις του πίνακα συχνοτήτων Όλες οι τάξεις είναι ίσου πλάτους : αφού διαιρέσουµε τον άξονα των σε ίσα τµήµατα (µήκους ίσου µε το πλάτος κάθε τάξης, σχεδιάζονται ορθογώνιο µε βάση κάθε διάστηµα τάξης και ύψος ίσο µε την αντίστοιχη συχνότητα της τάξης Η βάση κάθε ορθογωνίου εκτείνεται από το κάτω όριο µέχρι το άνω όριο της αντίστοιχης τάξης 0 Συχνότητα (αριθµός δωµατίων 8 6 4 Πολύγωνο συχνοτήτων 0 0 30 30 40 40 50 50 60 60 70 70 80 80 90 90 00 00 0 0 0 Τιµ ή ενοικίασης δωµ ατίου (δρχ 00 Σχήµα Ι ηµόπουλος, ΤΕΙ Καλαµάτας 5

Προσοχή : Για να συγκρίνουµε δύο πολύγωνα συχνοτήτων που βασίζονται σε διαφορετικό αριθµό δεδοµένων ( δεν χρησιµοποιούµε τις συχνότητες ( αλλά τις σχετικές συχνότητες ( / ή τα ( / 00 Όλες οι τάξεις δεν είναι ίσου πλάτους : το ύψος του ορθογωνίου πρέπει να είναι ανάλογο της συχνότητας της αντίστοιχης τάξης Παίρνουµε δηλαδή στον άξονα των άνισα διαστήµατα, καθένα πλάτους ίσου µε το πλάτος της αντίστοιχης τάξης, και µε βάση τα άνισα αυτά διαστήµατα κατασκευάζουµε ορθογώνια παραλληλόγραµµα, τα ύψη των οποίων είναι ίσα µε το πηλίκο (συχνότητα τάξης/πλάτος τάξης Καµπύλη συχνοτήτων (requecy curve Αν το (εύρος πλάτος των τάξεων ενός ιστογράµµατος συνεχώς µικραίνει (δ 0 και το πλήθος το συχνοτήτων είναι πολύ µεγάλο, ώστε να µην υπάρχει τάξη µε συχνότητα µηδέν τότε το πολύγωνο συχνοτήτων τείνει να πάρει την µορφή µιας οµαλής καµπύλης που ονοµάζεται καµπύλη συχνοτήτων (requecy curve Αθροιστικές κατανοµές συχνοτήτων ή (α - α F ή (α 0 α ή (α - α 3 ή (α - α 3 3 3 4 ή (α 3 - α 4 4 3 4 ή (α - - α 3 4 - Αθροιστικές κατανοµές συχνοτήτων συνεχών µεταβλητών Τα αθροιστικά διαγράµµατα απεικονίζουν τις αθροιστικές κατανοµές συχνοτήτων και µας επιτρέπουν να υπολογίσουµε πόσες συχνότητες (ή τιµές της µεταβλητής βρίσκονται κάτω (ή πάνω από µια ορισµένη τιµή της εξεταζόµενης µεταβλητής Επιτρέπουν επίσης τη σύγκριση δύο ή περισσότερων κατανοµών Παράδειγµα Ενδιαφερόµαστε να γνωρίζουµε των αριθµό των δωµατίων των οποίων η τιµή ενοικίασης είναι µικρότερη από 7000 δρχ Κατασκευάζουµε των πίνακα συχνοτήτων : Τάξεις τιµών ενοικίασης δωµατίου (δρχ 00 Πίνακας 3 Πίνακας συχνοτήτων των τιµών ενοικίασης δωµατίου Συχνότητες τάξεων Αθροιστικές συχνότητες τάξεων Σχετικές συχνότητες τάξεων Σχετικές αθροιστικές συχνότητες τάξεων 30 40 3 3 0075 0075 40 50 6 9 05 05 50 60 0 075 05 60 70 7 7 075 0675 70 80 8 35 0 0875 80 90 37 005 095 90 00 38 005 095 00 0 40 005 Ι ηµόπουλος, ΤΕΙ Καλαµάτας 6

ιαγράµµατα αθροιστικών κατανοµών συχνοτήτων συνεχών µεταβλητών 45 40 Αθροιστικές συχνότητες (F 35 30 5 0 5 0 5 0 30 40 40 50 50 60 60 70 70 80 80 90 90 00 00 0 Τιµ ές ενοικίασης δωµ ατίου (δρχ 00 00 Σχετική αθροιστική συχνότητα ( 00 90 80 70 60 50 40 30 0 0 0 30 40 50 60 70 80 90 00 0 Τιµ ή ενοικίασης δω µ ατίου (δρ χ 00 Σχήµα 3 - Αθροιστικές κατανοµές συχνοτήτων διακριτών µεταβλητών Πίνακας 4 Πίνακας συχνοτήτων ασθενών στην επιχείρηση Αριθµός των εβδοµάδων ( µε ( ασθενείς Αριθµός ασθενούντων την εβδοµάδα ( Αθροιστικές συχνότητες (F 0 47 47 8 75 5 90 3 6 96 4 3 99 5 00 00 90 80 70 60 50 40 30 0 0 0 3 4 5 Σχήµα 4 Ι ηµόπουλος, ΤΕΙ Καλαµάτας 7

Κυκλικά διαγράµµατα Παραδείγµατα Πίνακας 5 Πίνακας συχνοτήτων των κατηγοριών ενοικιαζόµενων δωµατίων Κατηγορίες ενοικιαζόµενων δωµατίων Συχνότητες τάξεων Σχετικές συχνότητες τάξεων Γωνία κυκλικού διαγράµµατος Φτηνά 9 05 05 360 8 o Μέτρια 8 0450 0450 360 6 o Ακριβά 0 050 050 360 90 o Πολύ ακριβά 3 0075 0075 360 7 o Φτηνά Μέτρια Ακριβά Πολύ ακριβά Σχήµα 5 Πίνακας 6 Πληθυσµός της γης κατά περιοχές (970 Περιοχή Πληθυσµός σε εκατοµ Ευρώπη 46 Ασία 056 Αµερική 5 Αφρική 344 Ωκεανία 9 Ρωσία 43 Πηγή: ΟΗΕ, Demogrphc Yerboo, 970 Αφρική 9% Ωκεανία % Ρωσία 7% Αµερική 4% Ευρώπη 3% Ασία 56% Σχήµα 6 Ι ηµόπουλος, ΤΕΙ Καλαµάτας 8

ΠΑΡΑΜΕΤΡΟΙ (ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΘΕΣΗΣ ΚΑΙ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ Παρατηρήσεις Παράµετρος είναι ένα αριθµητικό µέγεθος που περιγράφει κάποιο χαρακτηριστικό ενός στατιστικού πληθυσµού Οι παράµετροι συµβολίζονται µε γράµµατα του ελληνικού αλφαβήτου, πχ ο µέσος αριθµητικός συµβολίζεται µε µ και η διακύµανση µε σ Στατιστικό είναι ένα αριθµητικό µέγεθος που περιγράφει κάποιο χαρακτηριστικό των παρατηρήσεων ενός δείγµατος Τα στατιστικά (ή στατιστικά µέτρα συµβολίζονται µε γράµµατα του λατινικού αλφάβητου, πχ ο µέσος αριθµητικός συµβολίζεται µε και η διακύµανση µε s Οι µαθηµατικοί τύποι που ακολουθούν αναφέρονται σε κάποιο πληθυσµό (ή κάποιο δείγµα που το πλήθος των παρατηρήσεων (ή στοιχείων που περιέχει είναι Όπου δεν διευκρινίζεται οι τύποι αναφέρονται σε δείγµατα Οι παράµετροι ή τα στατιστικά µέτρα κεντρικής θέσης και κεντρικής τάσης είναι αντιπροσωπευτική αριθµοί που συνοψίζουν χαρακτηριστικά των δεδοµένων µας Μέσος αριθµητικός (Arthmetc Me Αστάθµητος µέσος αριθµητικός - Μέσος αριθµητικός αταξινόµητων δεδοµένων Παράδειγµα : τα ύψη πέντε ατόµων (σε µέτρα είναι : 67, 75, 84, 75, 79 Ο µέσος αριθµητικός των τιµών της µεταβλητής "ύψος" (δηλ το µέσο ύψος των 5 ατόµων είναι : (67 75 84 75 79 / 5 76 - Μέσος αριθµητικός ταξινοµηµένων δεδοµένων Παράδειγµα : Πίνακας συχνοτήτων ασθενών/εβδοµάδα σε µια επιχείρηση κατά την διάρκεια 00 εβδοµάδων Αριθµός ασθενών/εβδοµάδα ( Αριθµός των εβδοµάδων ( µε ( ασθενείς 0 47 8 5 3 6 4 3 5 Ο µέσος αριθµητικός των τιµών της µεταβλητής "αριθµός ασθενών/εβδοµάδα" (δηλ ο µέσος αριθµός ασθενών/εβδοµάδα είναι : (470 8 5 63 34 5/00 93 / 00 093 Προσοχή : στην περίπτωση ενός πίνακα συχνοτήτων µιας συνεχούς µεταβλητής τα είναι οι κεντρικές τιµές (ή κεντρικοί όροι των τάξεων ΣΗΜΕΙΩΣΗ : Την σηµερινή εποχή, της γενικευµένης χρήσης των Η/Υ, σπάνια χρησιµοποιούµε την οµαδοποίηση των τιµών της µεταβλητής για την µέτρηση των διαφόρων παραµέτρων Ι ηµόπουλος, ΤΕΙ Καλαµάτας 9

Σταθµικός µέσος αριθµητικός w w w Χρησιµοποιείται όταν θέλουµε να δώσουµε στις διάφορες τιµές διαφορετική σηµασία (βαρύτητα που εκφράζεται από τον συντελεστή στάθµισης (βαρύτητας w Παράδειγµα : Μάθηµα Βαθµός Συντελεστής στάθµισης Μαθηµατικά 8 0 Φυσική 0 7 Χηµεία Έκθεση 8 6 Αρχαία Ελληνικά 9 0 w (08 70 68 09/(0 7 6 0 95/75 693 Ο µέσος βαθµός που προκύπτει από τον σταθµικό µέσο αριθµητικό είναι µικρότερος από το µέσο που θα προέκυπτε από τον αστάθµητο µέσο αριθµητικό ( 34 επειδή ο µαθητής είχε µεγαλύτερου βαθµούς στα µαθήµατα που είχαν µικρότερους συντελεστές στάθµισης Μέσος αριθµητικός δύο ή περισσότερων κατανοµών Παράδειγµα : Τµήµα Αριθµός Φοιτητών Μέσος βαθµός στα Μαθηµατικά Τµήµα 40 6 Τµήµα 60 4 Τµήµα 3 35 8 (406 604 358/(406035 760/35 563 Προσοχή : Ο µέσος βαθµός δεν είναι (6 4 8/3 6 Ι ΙΟΤΗΤΕΣ ΤΟΥ ΜΕΣΟΥ ΑΡΙΘΜΗΤΙΚΟΥ ( 0 ή ( 0 Αν προσθέσουµε (αφαιρέσουµε σε όλες τις τιµές της µεταβλητής µια σταθερή ποσότητα τότε ο µέσος αριθµητικός αυξάνεται (µειώνεται κατά τη σταθερή αυτή ποσότητα 3 Αν πολλαπλασιάσουµε (διαιρέσουµε όλες τις τιµές της µεταβλητής µε µια σταθερή ποσότητα τότε ο µέσος αριθµητικός πολλαπλασιάζεται (διαιρείται µε τη σταθερή αυτή ποσότητα 4 Αν όλες οι τιµές της µεταβλητής είναι ίσες µε µια σταθερή ποσότητα, τότε ο µέσος αριθµητικός είναι ίσος µε τη σταθερή αυτή ποσότητα Επικρατούσα τιµή (mode Είναι η τιµή της µεταβλητής που έχει την µεγαλύτερη συχνότητα (ή που παρουσιάζεται τις περισσότερες φορές µέσα στα δεδοµένα H Επικρατούσα τιµή συνήθως συµβολίζεται µε Mο και χρησιµοποιείται στις Ι ηµόπουλος, ΤΕΙ Καλαµάτας 0

κατηγορικές (ή ονοµαστικές µεταβλητές όπου τα άλλα µέτρα κεντρικής θέσης ή κεντρικής τάσης δεν έχουν νόηµα ιάµεσος (Med Όταν οι τιµές µιας µεταβλητής ταξινοµηθούν από την µικρότερη προς την µεγαλύτερη τότε η ιάµεσος είναι η τιµή εκείνη της µεταβλητής, η οποία κατέχει την κεντρική θέση Η ιάµεσος είναι δηλαδή, η τιµή της µεταβλητής, η οποία χωρίζει το σύνολο των τιµών της µεταβλητής σε δύο ισοπληθή υποσύνολα τιµών : το ένα υποσύνολο περιέχει όλες τις τιµές που είναι µικρότερες από την ιάµεσο (το 50% του συνόλου των τιµών της µεταβλητής και το άλλο υποσύνολο όλες τις τιµές που είναι µεγαλύτερες από την ιάµεσο (το υπόλοιπο 50% του συνόλου των τιµών της µεταβλητής Υπολογισµός της ιαµέσου : Αφού ταξινοµήσουµε τα δεδοµένα σε αύξουσα τάξη βρίσουµε πρώτα την θέση της διαµέσου και µετά την τιµή της - Παράδειγµα αταξινόµητων δεδοµένων : Αριθµός δεδοµένων ( περιττός άρτιος Ύψος 5 ατόµων σε µέτρα Ύψος 4 ατόµων σε µέτρα 75, 67, 84, 75, 79 67, 84, 75, 79 Θέση διαµέσου : (/ 6/3 Θέση ιαµέσου : (/ 5/5 67 67 75 75 75 Θέση διαµέσου 79 Θέση διαµέσου 79 84 84 Τιµή ιαµέσου Μ 75 Τιµή ιαµέσου Μ (7579/ 77 - Παράδειγµα ταξινοµηµένων δεδοµένων Ασυνεχής (ή διακριτή µεταβλητή Πίνακας κατανοµής χειρουργηθέντων σε ένα νοσοκοµείο σε διάστηµα 50 ηµερών Αριθµός χειρουργηθέντων ( Αριθµός ηµερών ( Αθροιστική συχνότητα (F 0 4 6 6 3 0 4 0 4 Θέση διαµέσου 5 8 50 Θέση ιαµέσου : Θέση της F µε τιµή ίση ή αµέσως µεγαλύτερη από / (50/ 5 Τιµή ιαµέσου η τιµή της µεταβλητής που αντιστοιχεί στην θέση της ιαµέσου : Μ 4 Ι ηµόπουλος, ΤΕΙ Καλαµάτας

Συνεχής µεταβλητή Πίνακας κατανοµής τιµών (00 δρχ ενοικίασης δωµατίου σε 40 πανδοχεία ενός νησιού Τάξεις τιµών ενοικίασης δωµατίου Αριθµός δωµατίων ( Αθροισ συχν τάξεων (F 30 40 40 50 6 8 50 60 0 8 60 70 9 7 Θέση ιαµέσου 70 80 8 35 80 90 37 90 00 38 00 0 40 Θέση ιαµέσου : F µε τιµή ίση ή αµέσως µεγαλύτερη από / (40/ 0 Τιµή ιαµέσου : όπου N 40 F 8 M L δ 60 0 9 65 L : το κάτω όριο της τάξης στην οποία εντοπίζεται η διάµεσος, F - : η αθροιστική συχνότητα της τάξης που προηγείται εκείνης στην οποία εντοπίζεται η διάµεσος, : η συχνότητα της τάξης στην οποία εντοπίζεται η διάµεσος, δ : το πλάτος της τάξης στην οποία εντοπίζεται η διάµεσος Τεταρτηµόρια (Qurtles Γενικά τα Τεταρτηµόρια υποδιαιρούν το σύνολο των τιµών της µεταβλητής σε τέσσερα ισοπληθή υποσύνολα Το πρώτο Τεταρτηµόριο (Q είναι η τιµή της µεταβλητής, η οποία χωρίζει το σύνολο των τιµών της µεταβλητής σε δύο υποσύνολα τιµών : το ένα υποσύνολο περιέχει το 5% του συνόλου των τιµών της µεταβλητής που είναι µικρότερες από το Q και το δεύτερο υποσύνολο το υπόλοιπο 75% των τιµών που είναι µεγαλύτερες από το Q Το τρίτο Τεταρτηµόριο (Q 3 είναι η τιµή της µεταβλητής, η οποία χωρίζει το σύνολο των τιµών της µεταβλητής σε δύο υποσύνολα τιµών : το ένα υποσύνολο περιέχει το 75% του συνόλου των τιµών της µεταβλητής που είναι µικρότερες από το Q 3, ενώ το άλλο υποσύνολο το υπόλοιπο 5% των τιµών που είναι µεγαλύτερες από το Q 3 Υπολογισµός πρώτου (Q και τρίτου (Q 3 Τεταρτηµορίου Αφού ταξινοµήσουµε τα δεδοµένα σε αύξουσα τάξη βρίσουµε πρώτα την θέση των τεταρτηµορίων και µετά την τιµή τους Ι ηµόπουλος, ΤΕΙ Καλαµάτας

- Παράδειγµα αταξινόµητων δεδοµένων : Αριθµός δεδοµένων ( Ύψος 7 ατόµων σε µέτρα 75, 63, 67, 84, 75, 79, 80 63 67 Θέση (Q 75 75 79 80 Θέση (Q3 84 Θέση του Q : Θέση του Q3 : (/4 8/4 3(/4 4/46 Τιµή του Q 67 Τιµή του Q 3 80 - Παράδειγµα ταξινοµηµένων δεδοµένων Ασυνεχής (ή διακριτή µεταβλητή Πίνακας κατανοµής χειρουργηθέντων σε ένα νοσοκοµείο σε διάστηµα 50 ηµερών Αριθµός χειρουργηθέντων ( Αριθµός ηµερών ( Αθροιστική συχνότητα (F 0 4 6 6 3 0 Θέση Q 4 0 4 Θέση Q 3 5 8 50 Θέση του Q : F µε τιµή ίση ή αµέσως µεγαλύτερη από /4 (50/4 5 Τιµή του Q 3 Θέση του Q 3 : F µε τιµή ίση ή αµέσως µεγαλύτερη από 3/4 (350/4375 Τιµή του Q 4 Ι ηµόπουλος, ΤΕΙ Καλαµάτας 3

Συνεχής µεταβλητή Πίνακας κατανοµής τιµών (00 δρχ ενοικίασης δωµατίου σε 40 πανδοχεία ενός νησιού Τάξεις τιµών ενοικίασης δωµατίου Αριθµός δωµατίων ( Αθροισ συχν τάξεων (F 30 40 40 50 6 8 50 60 0 8 Θέση Q 60 70 9 7 70 80 8 35 Θέση Q 3 80 90 37 90 00 38 00 0 40 Θέση του Q : F µε τιµή ίση ή αµέσως µεγαλύτερη από /4 (40/4 0 N 40 F 8 4 4 Τιµή του Q L δ 50 0 5 0 Θέση του Q 3 : F µε τιµή ίση ή αµέσως µεγαλύτερη από 3/4 (340/430 Τιµή του 3N 0 F 7 4 4 Q3 L δ 70 0 7375 8 όπου για τα L, F -,, δ ισχύουν οι επεξηγήσεις που δίνονται στην περίπτωση της ιαµέσου ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΠΑΡΑΜΕΤΡΩΝ (ΣΤΑΤΙΣΤΙΚΩΝ ΜΕΤΡΩΝ ΚΕΝΤΡΙΚΗΣ ΘΕΣΗΣ ΚΑΙ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ Η τιµή του µέσου αριθµητικού επηρεάζεται ιδιαιτέρως από τις ακραίες τιµές (δηλ τις πολύ χαµηλές ή τις πολύ υψηλές τιµές Η διάµεσος, τα τεταρτηµόρια και η επικρατούσα τιµή δεν επηρεάζονται από τις ακραίες τιµές Όταν στα δεδοµένα υπάρχουν ακραίες τιµές, τότε η διάµεσος είναι η αντιπροσωπευτική παράµετρος που πρέπει να προτιµάται 3 Η τιµή του µέσου αριθµητικού είναι πάντα µεγαλύτερη από την µικρότερη τιµή της µεταβλητής και πάντα µικρότερη από την µεγαλύτερη τιµή της µεταβλητής 4 Ο µέσος αριθµητικός επιδέχεται αλγεβρικούς χειρισµούς, ενώ αυτό δεν είναι δυνατόν για την διάµεσο, τα τεταρτηµόρια και την επικρατούσα τιµή 5 Η επικρατούσα τιµή πρέπει να προτιµάται σαν αντιπροσωπευτική παράµετρος των δεδοµένων όταν µια κατανοµή συχνοτήτων παρουσιάζει έντονη θετική ή αρνητική ασυµµετρία 6 Η επικρατούσα τιµή έχει έννοια για κατανοµές που παρουσιάζουν µόνο µια κορυφή Ι ηµόπουλος, ΤΕΙ Καλαµάτας 4

ΠΑΡΑΜΕΤΡΟΙ (ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΙΑΣΠΟΡΑΣ Οι παράµετροι (ή µέτρα αυτοί µετράνε πόσο συγκεντρωµένα (οµοιογενή ή διασκορπισµένα (ανοµοιογενή είναι τα δεδοµένα γύρω από την µέση αριθµητική τιµή Γενικά όσο µεγαλύτερες είναι οι τιµές των µέτρων διασποράς για µια µεταβλητή τόσο περισσότερο διασκορπισµένες (και εποµένως λιγότερο οµοιογενείς είναι οι τιµές της γύρω από τον µέσο αριθµητικό της Εύρος µεταβολής (Rge Το Εύρος µεταβολής (αναφέρεται και σαν εύρος διασποράς είναι η διαφορά ανάµεσα στην µεγαλύτερη και την µικρότερη τιµή της µεταβλητής R m m Ηµιενδοτεταρτηµοριακό εύρος (Sem-terqurtle rge Q Q 3 Q ιακύµανση και τυπική απόκλιση Πληθυσµού ιακύµανση (vrce σ σ - ιακύµανση αταξινόµητων δεδοµένων ( µ - ιακύµανση ταξινοµηµένων δεδοµένων ( µ Τυπική απόκλιση (stdrd devto - Τυπική απόκλιση αταξινόµητων δεδοµένων σ ( µ - Τυπική απόκλιση ταξινοµηµένων δεδοµένων σ ( µ ιακύµανση και τυπική απόκλιση δείγµατος ιακύµανση (vrce - ιακύµανση αταξινόµητων δεδοµένων s ( Ι ηµόπουλος, ΤΕΙ Καλαµάτας 5

s - ιακύµανση ταξινοµηµένων δεδοµένων ( Τυπική απόκλιση (stdrd devto - Τυπική απόκλιση αταξινόµητων δεδοµένων s ( - Τυπική απόκλιση ταξινοµηµένων δεδοµένων s ( Προσοχή : στην περίπτωση ενός πίνακα συχνοτήτων µιας ασυνεχούς ή διακριτής ποσοτικής µεταβλητής τα είναι οι τιµές τις µεταβλητής ενώ στην περίπτωση µιας συνεχούς µεταβλητής τα είναι οι κεντρικές τιµές (ή κεντρικοί όροι των τάξεων Ι ΙΟΤΗΤΕΣ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ ΚΑΙ ΤΗΣ ΤΥΠΙΚΗΣ ΑΠΟΚΛΙΣΗΣ Αν όλες οι τιµές της µεταβλητής είναι ίσες µε µια σταθερή ποσότητα, τότε η διακύµανση και η τυπική απόκλιση είναι ίσες µε µηδέν Αν προσθέσουµε (αφαιρέσουµε σε όλες τις τιµές της µεταβλητής µια σταθερή ποσότητα τότε η διακύµανση και η τυπική απόκλιση δεν µεταβάλλονται 3 Αν πολλαπλασιάσουµε (διαιρέσουµε όλες τις τιµές της µεταβλητής µε µια σταθερή ποσότητα τότε η διακύµανση πολλαπλασιάζεται (διαιρείται µε και η τυπική απόκλιση πολλαπλασιάζεται (διαιρείται µε Συντελεστής µεταβλητικότητας (coecet o vrto s CV CV ( 00 % s Χρησιµοποιείται όταν θέλουµε να συγκρίνουµε τις διασπορές δύο διαφορετικών κατανοµών (πχ σύγκριση της διασπορά της κατανοµής των αναστηµάτων µιας οµάδας ατόµων και της διασποράς της κατανοµής των βαρών τους Χρησιµοποιείται ακόµα όταν θέλουµε να συγκρίνουµε τις διασπορές δύο κατανοµές της ίδιας µεταβλητής όταν αυτές εκφράζονται σε διαφορετικές µονάδες Ι ηµόπουλος, ΤΕΙ Καλαµάτας 6

ΜΕΤΡΑ ΑΣΥΜΜΕΤΡΙΑΣ ΚΑΙ ΚΥΡΤΩΣΗΣ Το σχήµα µιας καµπύλης (κατανοµής συχνοτήτων µιας µεταβλητής εξαρτάται από τον τρόπο που κατανέµονται οι τιµές τις µεταβλητής στο διάστηµα µεταβολής της Μια κατανοµή λέγεται συµµετρική όταν οι τιµές της "τοποθετούνται" συµµετρικά γύρω από την µέση αριθµητική τιµή Όταν αυτό δεν συµβαίνει η κατανοµή λέγεται ασυµµετρική Η κύρτωση µιας κατανοµής είναι ο βαθµός συγκέντρωσης των τιµών µιας µεταβλητής γύρω από την µέση αριθµητική τους τιµή Η κύρτωση "µετράει" την αιχµηρότητα ή την πλάτυνση µιας κατανοµής συχνοτήτων Μέτρα ασυµµετρίας 3 3 µ β µ όπου ( µ µ είναι η κεντρική ροπή (δειγµατική τάξης κ β >0 κατανοµή µε θετική ασυµµετρία, β <0 κατανοµή µε θετική ασυµµετρία, β 0 συµµετρική κατανοµή S ( Q3 M ( M Q ( Q M ( M Q 3 - S S >0 κατανοµή µε θετική ασυµµετρία, S <0 κατανοµή µε θετική ασυµµετρία, S 0 συµµετρική κατανοµή Μέτρα κύρτωσης µ β µ 4 β >3 κατανοµή λεπτόκυρτη, β <3 κατανοµή πλατύκυρτη, β 3 0 κατανοµή µεσόκυρτη M 0 M M M 0 Κατανοµή µε θετική ασυµµετρία β > 0 Κατανοµή µε αρνητική ασυµµετρία β <0 5% 5% 5% 5% Q M M 0 Q3 Συµµετρική κατανοµή β 0 Μεσόκυρτη β 3 Πλατύκυρτη β < 3 Λεπτόκυρτη β > 3 Σχήµα 7 Μερικές βασικές µορφές κατανοµής συχνοτήτων Ι ηµόπουλος, ΤΕΙ Καλαµάτας 7

Προσοχή : Όταν µια κατανοµή είναι συµµετρική η µέση αριθµητική τιµή (, η διάµεσος (Μ και η επικρατούσα τιµή (Μο συµπίπτουν Στην περίπτωση θετικής ασυµµετρίας έχουµε >Μ>Μο, ενώ στην περίπτωση αρνητικής ασυµµετρίας έχουµε <Μ<Μο Σε συµµετρικές κατανοµές συχνοτήτων (σχήµα καµπάνας µε µέση αριθµητική τιµή µ και τυπική απόκλιση σ ισχύει : το διάστηµα (µ-σ,µσ περιέχει το 687% των δεδοµένων το διάστηµα (µ-σ,µσ περιέχει το 9545% των δεδοµένων 3 το διάστηµα (µ-3σ,µ3σ περιέχει το 9973% των δεδοµένων ΤΥΠΟΠΟΙΗΜΕΝΗ ΜΕΤΑΒΛΗΤΗ Έστω µια µεταβλητή µε τιµές,,, Η µεταβλητή z µε τιµές : z ( - /s, z ( - /s,, z ( - /s, όπου, s είναι αντίστοιχα η µέση αριθµητική τιµή και η τυπική απόκλιση της µεταβλητής, ονοµάζεται τυποποιηµένη µεταβλητή (stdrdzed vrble Μια τυποποιηµένη µεταβλητή έχει δύο βασικά χαρακτηριστικά : Η µέση αριθµητική της τιµή είναι ίση µε 0 Η τυπική της απόκλιση και η διακύµανσή της είναι ίσες µε Η τυποποίηση των τιµών χρησιµοποιείται όταν θέλουµε να συγκρίνουµε δύο τιµές µιας µεταβλητής που προέρχονται από σειρές δεδοµένων που διαφέρουν α ως προς την µέση τιµή τους ή την τυπική τους απόκλιση, ή β ως προς τις µονάδες µέτρησης Ι ηµόπουλος, ΤΕΙ Καλαµάτας 8

ΑΛΛΗΛΟΕΞΑΡΤΗΣΗ ΥΟ ΜΕΤΑΒΛΗΤΩΝ ύο µεταβλητές και y έχουν συναρτησιακή εξάρτηση, όταν σε κάθε τιµή της µεταβλητής αντιστοιχίζεται µια ορισµένη (και µοναδική τιµή της µεταβλητής y Στην περίπτωση αυτή η εξάρτηση των δύο µεταβλητών µπορεί να παρουσιαστεί µε τη µορφή κάποιας συναρτήσεως που περιγράφει µια σχέση αιτίου-αποτελέσµατος ύο µεταβλητές και y έχουν στοχαστική εξάρτηση, όταν σε κάθε τιµή της µεταβλητής δεν αντιστοιχίζεται µια ορισµένη (και µοναδική τιµή της µεταβλητής y, αλλά µια τιµή ανάµεσα σε ένα πλήθος πιθανών τιµών Πχ µπορούµε να πούµε ότι το βάρος (y µιας οµάδας ατόµων εξαρτάται από το ανάστηµά τους (, αλλά είναι αδύνατον να βρούµε µια και µοναδική σχέση µε τη µορφή συναρτήσεως που να αντιστοιχίζει σε κάθε τιµή της µεταβλητής µια και µοναδική τιµή της µεταβλητής y Η στοχαστική εξάρτηση µεταξύ δύο (ή περισσοτέρων µεταβλητών µπορεί να περιγραφεί από µαθηµατικές σχέσεις που συνδέουν τις συνεξεταζόµενες µεταβλητές και ονοµάζονται διµεταβλητά (ή πολυµεταβλητά στοχαστικά υποδείγµατα (ή πρότυπα ή µοντέλα Με τα διµεταβλητά στοχαστικά υποδείγµατα εξετάζουµε αν υπάρχει σχέση εξάρτησης µιας µεταβλητής y από µια άλλη µεταβλητή Η µεταβλητή,η οποία ενδέχεται να επιδρά και να διαµορφώνει τις τιµές της µεταβλητής y, ονοµάζεται ανεξάρτητη µεταβλητή (depedet vrble, ενώ η µεταβλητή y που επηρεάζεται από την µεταβλητή, ονοµάζεται εξαρτηµένη µεταβλητή (depedet vrble Προσοχή : Ενώ στη περίπτωση συναρτησιακής εξάρτησης µεταξύ δύο µεταβλητών µπορούµε µε ακρίβεια να πούµε ποια είναι η εξαρτηµένη και ποια η ανεξάρτητη µεταβλητή, στη περίπτωση στοχαστικής εξάρτησης µόνο κατά σύµβαση ονοµάζουµε την µία από τις δύο µεταβλητές ανεξάρτητη και την άλλη εξαρτηµένη ύο µέθοδοι µελέτης της αλληλεξάρτησης δύο µεταβλητών Ανάλυση παλινδρόµησης (Regresso lyss : προσδιορισµός µιας γενικής µαθηµατικής σχέσης εξαρτήσεως µεταξύ των συνεξεταζόµενων µεταβλητών, η οποία ονοµάζεται εξίσωση παλινδρόµησης (regresso equto Η εξίσωση παλινδρόµησης µπορεί να είναι γραµµική (γραµµική παλινδρόµηση, ler regresso ή µη γραµµική (µη γραµµική παλινδρόµηση, o ler regresso Συσχέτιση (Correlto : ποσοτικός προσδιορισµός του "βαθµού" και της "φύσης" εξάρτησης µεταξύ των µεταβλητών Ο προσδιορισµός αυτός γίνεται µε την χρησιµοποίηση της στατιστικής παραµέτρου που ονοµάζεται συντελεστής γραµµικής συσχέτισης (ler correlto coecet ή απλά συντελεστής συσχέτισης Ανάλυση παλινδρόµησης (Regresso Το κύριο µέρος της µελέτης της στοχαστικής εξάρτησης δύο µεταβλητών (,y µε την ανάλυση παλινδρόµησης συνοψίζεται στην εύρεση µιας καµπύλης η οποία να διέρχεται κοντά από τα σηµεία του διαγράµµατος διασποράς ιάγραµµα ιασποράς (Sctter plot Απεικονίζει τα ζεύγη τιµών (,y σ'ένα σύστηµα ορθογώνιων αξόνων Σχηµατισµός µιας πρώτης εικόνας για : - το τύπο εξάρτησης της µεταβλητής y από την µεταβλητή (το τύπο του στοχαστικού υποδείγµατος ή την µορφή της καµπύλης* - το βαθµό σχέσης µεταξύ της µεταβλητής y και της µεταβλητής * Το στοχαστικό υπόδειγµα που "συνδέει" τις δύο µεταβλητές µπορεί να είναι γραµµικό (δηλαδή να εκφράζεται από µια γραµµική εξίσωση της µορφής y b ή µη γραµµικό (δηλαδή να εκφράζεται από Ι ηµόπουλος, ΤΕΙ Καλαµάτας 9

µια µη γραµµική εξίσωση µε γενική µορφή y (, όπως πχ ybc ή y b ή y/(b, και ονοµάζεται εξίσωση παλινδρόµησης Παράδειγµα: Πίνακας του µέσου ετήσιου κατά κεφαλή εισοδήµατος (00 3 χιλ δρχ και της µέσης ετήσιας κατά κεφαλή κατανάλωσης ενός αγαθού (σε κιλά 0 ατόµων Εισόδηµα Κατανάλωση y 0 74 73 3 75 5 77 8 78 30 8 33 8 35 83 39 85 37 85 Θέλουµε να δούµε µε την ανάλυση διασποράς εάν η κατανάλωση του αγαθού (y "εξαρτάται" από το εισόδηµα ( Από το διάγραµµα διασποράς των (,y (βλέπε Σχήµα 8( βλέπουµε ότι τα περισσότερα σηµεία βρίσκονται κατά µήκος µιας γραµµής Κάνουµε λοιπόν την υπόθεση ότι η σχέση µεταξύ και y είναι γραµµική (y b Για να βρούµε την εξίσωση της ευθείας που διέρχεται το πλησιέστερο δυνατόν από τα σηµεία του διαγράµµατος διασποράς χρησιµοποιούµε συνήθως την µέθοδο των ελαχίστων τετραγώνων Υπάρχουν διάφοροι µέθοδοι προσδιορισµού των συντελεστών της εξίσωσης παλινδρόµησης η επικρατέστερη όµως είναι η µέθοδος των ελαχίστων τετραγώνων Μέθοδος των ελαχίστων τετραγώνων Προσδιορισµός των συντελεστών παλινδρόµησης y ˆ Ελαχιστοποίηση του ( y ( b y Γραµµική παλινδρόµηση ( ( y Μη Γραµµική παλινδρόµηση ( y ( 0, ( y ( b 0 Εξισώσεις ελαχίστων τετραγώνων Ι ηµόπουλος, ΤΕΙ Καλαµάτας 0

Γραµµική παλινδρόµηση ΥΠΟΘΕΣΗ y b e e y -ŷ, b : Συντελεστές παλινδρόµησης : Τιµή του ŷ όταν 0 b : Γωνιακός συντελεστής ή συντελεστής κατεύθυνσης Απόλυτη µεταβολή της εξαρτηµένης µεταβλητής y όταν η ανεξάρτητη µεταβλητή µεταβληθεί κατά µία µονάδα b > 0 Θετική εξάρτηση της y και της (όταν το µεγαλώνει το y µεγαλώνει επίσης b < 0 Αρνητική εξάρτηση της y και της (όταν το µεγαλώνει το y µικραίνει 9 ( 9 (b Κατανάλ ωση (κιλ ά 85 8 75 Κατανάλ ωση (κιλ ά 85 8 75 ŷ 604 0065 r 097 7 8 0 4 6 8 30 3 34 36 38 40 Εισ ό δ η µα (00^3 δρχ 7 8 0 4 6 8 30 3 34 36 38 40 Εισ ό δ η µα (00^3 δρχ Σχήµα 8 Κάποιοι τρόποι ελέγχου της εγκυρότητας (ή ποιότητας της παλινδρόµησης ( y yˆ Μέσο τετραγωνικό σφάλµα s (Me Squre error - Τυπικό σφάλµα εκτίµησης s (Stdrd error o the estmte Η επιλεχθείσα εξίσωση παλινδρόµησης είναι τόσο καλύτερη όσο µικρότερο (πιο κοντά στο µηδέν είναι το s Ι ηµόπουλος, ΤΕΙ Καλαµάτας

Συντελεστή ς προσδιορισµού r yˆ y y - y (Coecet o Determto 0 r δείχνει το ποσοστό των µεταβολών της εξαρτηµένης µεταβλητής (y που ερµηνεύεται από τις µεταβολές της ανεξάρτητης µεταβλητής ( Όσο r είναι πιο κοντά στο τόσο η εξάρτηση του y από το είναι δυνατή Όταν r είναι ίσο µε 0 δεν υπάρχει καµιά εξάρτηση του y από το Επιπλέον : Οι ποσότητες e y -ŷ (δηλαδή τα σφάλµατα που προκύπτουν από την επιλογή µιας συγκεκριµένης εξίσωσης πρέπει : α να είναι τυχαία ακολουθούν την Κανονική Κατανοµή µε µέσο αριθµητικό 0 και διασπορά σ, β να είναι ανεξάρτητες µεταξύ τους, γ να είναι ανεξάρτητες από τις τιµές των (βλέπε Σχήµα 9(, δ να είναι ανεξάρτητες από τις τιµές των ŷ (βλέπε Σχήµα 9(b 05 ( 05 (b 0 0 e 005 0-005 6 0 4 8 3 36 40 e 005 0-005 7 75 8 85 9-0 -05 Σχήµα 9-0 -05 ŷ ΣΥΝΤΕΛΕΣΤΗΣ ΓΡΑΜΜΙΚΗΣ ΣΥΣΧΕΤΙΣΗΣ Μετρά την ένταση (βαθµό γραµµικής σχέσης µεταξύ δύο τυχαίων µεταβλητών ( ( y y Συντελεστής συσχέτισης r (Correlto coecet ( ( y y Ι ηµόπουλος, ΤΕΙ Καλαµάτας

- r r > 0 Θετική συσχέτιση r Τέλεια θετική συσχέτιση Μεγαλώνοντας οι τιµές της µιας µεταβλητής µεγαλώνουν και οι τιµές της άλλης r<0 Αρνητική συσχέτιση r - Τέλεια αρνητική συσχέτιση Μεγαλώνοντας οι τιµές της µιας µεταβλητής µικραίνουν οι τιµές της άλλης r 0 Έλλειψη γραµµικής συσχέτισης Οι τιµές της µιας µεταβλητής µεταβάλλονται γραµµικά ανεξάρτητα των τιµών της άλλης r έχει το ίδιο πρόσηµο µε το συντελεστή γραµµική παλινδρόµησης b y y y r 0809 r -0809 r 008 ΠΡΟΣΟΧΗ Έλλειψη γραµµικής συσχέτισης (r 0µεταξύ δύο µεταβλητών και y δεν σηµαίνει και ανυπαρξία εξάρτησης µεταξύ τους Οι δύο µεταβλητές µπορεί να έχουν µη γραµµική εξάρτηση Παράδειγµα : y Ο συντελεστής συσχέτισης µεταξύ y και είναι 009 Ο συντελεστής προσδιορισµού που προκύπτει αν χρησιµοποιήσουµε σαν εξίσωση παλινδρόµησης : ŷ 038-0,35 005 είναι 0964 Ι ηµόπουλος, ΤΕΙ Καλαµάτας 3

Ι ηµόπουλος, ΤΕΙ Καλαµάτας 4 ΥΠΕΝΘΥΜΙΣΕΙΣ ΧΡΗΣΙΜΩΝ ΣΥΜΒΟΛΙΣΜΩΝ Άθροισµα από µέχρι των : Άθροισµα φορές της σταθεράς α : Άθροισµα από µέχρι των : Άθροισµα από µέχρι των λ : λ λ λ λ ( λ Άθροισµα από µέχρι των λ( - : ( ( ( ( λ λ λ λ Άθροισµα από µέχρι των : Γινόµενο από µέχρι των : Πολλαπλασιασµός φορές της σταθεράς α : Γινόµενο από µέχρι των : Γινόµενο από µέχρι των λ : λ λ λ λ λ Γινόµενο από µέχρι των λ(-α : ( ( ( ( λ λ λ λ ( ( ( λ Γινόµενο από µέχρι των :