ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική



Σχετικά έγγραφα
ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Περιγραφική Στατιστική

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Στατιστική Επιχειρήσεων Ι

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Μάθηµα 3 ο. Περιγραφική Στατιστική

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Βιοστατιστική ΒΙΟ-309

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισαγωγή στη Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Εφαρμοσμένη Στατιστική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Περιγραφική Στατιστική

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j όπου x j x i για j i. P i =

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

1.1 Data view & Variable view: Μεταβλητές (variables) και περιπτώσεις (cases) Πίνακες συχνοτήτων (η εντολή Frequencies)...

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

6 / 4 / Βιοστατιστικός, MSc, PhD

Είδη Μεταβλητών. κλίµακα µέτρησης

Labels Values Missing Values Columns, Align Measure

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Περιγραφική Στατιστική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η MBA I

Περιγραφική στατιστική μεθοδολογία.

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ


ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ & ΕΚΠΑΙΔΕΥΣΗ

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j. P i = p j.

ΙΖΗΜΑΤΟΛΟΓΙΑ. Ενότητα 3: Κοκκομετρική ανάλυση. Δρ. Αβραμίδης Παύλος Σχολή Θετικών Επιστημών Τμήμα Γεωλογίας

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Ενότητα 2 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

ΚΕΦΑΛΑΙΟ 6 ΚΟΙΝΟΙ ΥΠΟΨΗΦΙΟΙ

Statistics. hrs1 Number of hours worked last week. educ Highest year of school completed. sibs NUMBER OF BROTHERS AND SISTERS. N Valid

ΚΕΦΑΛΑΙΟ 2 ΔΙΕΥΘΥΝΣΗ ΔΕΥΤΕΡΟΒΑΘΜΙΑΣ ΕΚΠΑΙΔΕΥΣΗΣ ΝΟΜΟΥ ΧΑΝΙΩΝ ΣΧΟΛΙΚΟ ΕΤΟΣ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕ ΑΡΙΘΜΗΤΙΚΕΣ ΚΑΙ ΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΥΣ

Περιγραφική Στατιστική

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

Περιγραφική Στατιστική. Π.Μ.Σ. "Μαθηματικά των Υπολογιστών και των Αποφάσεων"

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 4 ΚΑΤΑΝΟΜΕΣ & ΟΜΑ ΟΠΟΙΗΣΗ ΒΑΘΜΟΛΟΓΙΩΝ. 4.1 Κατανοµή γραπτού µέσου όρου ετήσιων πληθυσµών

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΤΟΥ ΔΙΔΑΚΤΙΚΟΥ ΕΡΓΟΥ ΤΩΝ ΥΠΟΧΡΕΩΤΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΧΕΙΜΕΡΙΝΟΥ ΕΞΑΜΗΝΟΥ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΔΙΕΡΕΥΝΗΣΗ ΚΛΙΜΑΤΙΚΩΝ ΑΛΛΑΓΩΝ ΓΙΑ ΤΟ ΝΗΣΙ ΤΗΣ ΝΑΞΟΥ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΚΕΦΑΛΑΙΟ 2 Γ ΙΕΥΘΥΝΣΗ ΑΘΗΝΑΣ - 5 Ο ΓΡΑΦΕΙΟ ΣΧΟΛΙΚΟ ΕΤΟΣ ΠΕΡΙΓΡΑΦΗ ΤΩΝ Ε ΟΜΕΝΩΝ ΜΕ ΑΡΙΘΜΗΤΙΚΕΣ ΚΑΙ ΓΡΑΦΙΚΕΣ ΜΕΘΟ ΟΥΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές Διερευνητική Ανάλυση Δεδομένων

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Περιγραφική στατιστική

Περιγραφή ποιοτικών δεδομένων. Περιγραφή ποιοτικών δεδομένων. Περιγραφή ποιοτικών δεδομένων. Περιγραφή ποιοτικών δεδομένων.

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Εισαγωγή στη Στατιστική

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Κεφάλαιο 6. Περιγραφική Στατιστική

Δείγμα πριν τις διορθώσεις

Περιεχόμενα. Πρόλογος 17 ΚΕΦΑΛΑΙΟ 1 23

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Στατιστική Εισαγωγικές Έννοιες

Εφαρμοσμένη Στατιστική

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Κατανομή συχνοτήτων. Μέτρα κεντρικής τάσης. Μέτρα διασποράς. Σφάλματα μέτρησης. Εγκυρότητα. Ακρίβεια

Transcript:

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 2. Περιγραφική Στατιστική

Βασικά είδη στατιστικής ανάλυσης 1. Περιγραφική στατιστική: περιγραφή του συνόλου των δεδοµένων (δείγµατος) 2. Συµπερασµατολογία: Παραγωγή συµπερασµάτων για τα χαρακτηριστικά του πληθυσµού µε βάση τα δεδοµένα του δείγµατος «There are two kinds of statistics, the kind you look up, and the kind you make up». Rex Stout (1886-1975) American mystery writer ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2

Σύνοψη δεδοµένων (Data summarization) Η διαδικασία περιγραφής του πίνακα των δεδοµένων µε τον υπολογισµό µικρού αριθµού µέτρων που χαρακτηρίζουν το δείγµα Παίρνουµε αρχικές πληροφορίες από µεγάλο πλήθος δεδοµένων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 3

Περιγραφή των δεδοµένων Βασικές κατηγορίες µεθόδων περιγραφής δεδοµένων: Πίνακες και γραφικές παραστάσεις Αριθµητικές µέθοδοι στατιστικά µέτρα Μέθοδοι διερευνητικής ανάλυσης ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 4

Πίνακες & γραφικές µέθοδοι Στην κατηγορία αυτή ανήκουν µέθοδοι που παριστούν περιληπτικά τα δεδοµένα µε πίνακες ή γραφήµατα Πίνακες κατανοµής συχνοτήτων (frequency tables) Ραβδογράµµατα (bar charts) Κυκλικά διαγράµµατα (pie charts) Ιστογράµµατα (histograms) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 5

Πίνακες κατανοµής συχνοτήτων (frequency tables) Για µεταβλητές µε διακριτές (λίγες) τιµές (nominal, ordinal) Για κάθε τιµή υπολογίζονται απόλυτες συχνότητες, σχετικές συχνότητες (ποσοστά) και αθροιστικές συχνότητες Για συνεχείς µεταβλητές πρέπει να γίνει πρώτα οµαδοποίηση των τιµών ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 6

Παράδειγµα πίνακα συχνοτήτων Predominant religion Valid Missing Total Catholic Muslim Protstnt Orthodox Buddhist Animist Taoist Hindu Jewish Tribal Total missing Cumulative Frequency Percent Valid Percent Percent 41 37,6 38,0 38,0 27 24,8 25,0 63,0 16 14,7 14,8 77,8 8 7,3 7,4 85,2 7 6,4 6,5 91,7 4 3,7 3,7 95,4 2 1,8 1,9 97,2 1,9,9 98,1 1,9,9 99,1 1,9,9 100,0 108 99,1 100,0 1,9 109 100,0 ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 7

Ραβδόγραµµα (bar chart) Γραφική παράσταση του πίνακα συχνοτήτων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 8

Κυκλικό διάγραµµα (pie chart) Γραφική παράσταση του πίνακα συχνοτήτων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 9

Ιστόγραµµα (histogram) Κατανοµή συνεχούς µεταβλητής οµαδοποιηµένης ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 10

Αριθµητικές µέθοδοι Χρησιµοποιούνται αριθµητικές ποσότητες (στατιστικά µέτρα) που υπολογίζονται από τα δεδοµένα Κυριότερες κατηγορίες µέτρων: Μέτρα Κεντρικής Τάσης Μέτρα ιασποράς Μέτρα Σχετικής Θέσης Μέτρα Ασυµµετρίας Μέτρα Κύρτωσης ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 11

Μέθοδοι διερευνητικής ανάλυσης (exploratory analysis) Συνδυασµός γραφικών και αριθµητικών µεθόδων για διερεύνηση τάσεων και ιδιαίτερων τιµών στα δεδοµένα Πιο γνωστές τεχνικές: Φυλλόγραµµα (stem and leaf plot) Θηκόγραµµα (box plot) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 12

Μέτρα κεντρικής τάσης Αριθµητικός µέσος ή µέση τιµή (mean): ιάµεσος (median): ητιµή που χωρίζει ένα σύνολο δεδοµένων στη µέση όταν τοποθετηθούν σε αύξουσα σειρά ητιµή για την οποία το 50% των µετρήσεων είναι µικρότερες και το 50% µεγαλύτερες από αυτή Επικρατούσα Τιµή (mode): Ητιµή µε τηµεγαλύτερη συχνότητα εµφάνισης. χρησιµοποιείται συνήθως σε ποιοτικές µεταβλητές ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 13

Σύγκριση µέσης τιµής και διαµέσου Η µέση τιµή Επηρεάζεται από την ύπαρξη ακραίων τιµών Είναι χρήσιµη για συµπερασµατολογία Είναι ευκολότερο να εργαστούµε µε αυτή θεωρητικά Η διάµεσος εν επηρεάζεται από την ύπαρξη ακραίων τιµών εν είναι τόσο χρήσιµη στη συµπερασµατολογία Είναι δύσκολο να εργαστούµε µε αυτήν θεωρητικά ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 14

Μέτρα διασποράς Εύρος (range): η διαφορά µεταξύ της µεγίστης και της ελαχίστης τιµής R = Xmax - Xmin ιακύµανση (variance): µέτρο απόστασης των παρατηρήσεων από τη µέση τιµή Τυπική Απόκλιση (standard deviation): η θετική τετραγωνική ρίζα της διακύµανσης ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 15

Μέτρα σχετικής θέσης Τεταρτηµόρια (quartiles): (Q1, Q2, Q3) τιµές που χωρίζουν ένα σύνολο παρατηρήσεων σε τέταρτα Q1: 25% µικρότερες και 75% µεγαλύτερες από την τιµή αυτή Q2 (διάµεσος): 50% µικρότερες και 50% µεγαλύτερες από την τιµή αυτή Q3: 75% µικρότερες και 25% µεγαλύτερες από την τιµή αυτή Ενδοτεταρτηµοριακό εύρος (interquartile range): IR = Q3 - Q1 περιλαµβάνει το 50% των παρατηρήσεων που βρίσκονται γύρω από τη διάµεσο ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 16

Mέτρα ασυµµετρίας Ασυµµετρία ή λοξότητα (skewness): Πόσο και προς ποια κατεύθυνση αποκλίνει η κατανοµή από την πλήρη συµµετρία (skewness=0) Είδη ασυµµετρίας: Θετική: εξόγκωση προς τα αριστερά και µεγάλη ουρά προς τα δεξιά (skewness>0) Αρνητική: εξόγκωση προς τα δεξιά και µεγάλη ουρά προς τα αριστερά (skewness<0) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 17

Μέτρα κύρτωσης Κύρτωση (Kurtosis): Μέτρο της οξύτητας της κορυφής µιας κατανοµής Κατηγορίες που αναγνωρίζονται: Λεπτόκυρτη (kurtosis>3) Πλατύκυρτη (kurtosis<3) Μεσόκυρτη (kurtosis=3) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 18

ιερευνητική ανάλυση δεδοµένων- Φυλλογράφηµα (Stem-and-Leaf Plot) Απλός και περιγραφικός τρόπος παρουσίασηςόλωντωνδεδοµένων µε τρόπο που να φαίνεται η κατανοµή τους Κάθε παρατήρηση χωρίζεται σε δύο µέρη: κλαδί (stem) και φύλλο (leaf) Αριστερά κατακόρυφης γραµµής οι τιµές των µίσχων και δεξιά τα φύλλα ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 19

Παράδειγµα φυλλογράµµατος Frequency Stem & Leaf 2,00 0. 99 24,00 1. 000000011111112223333444 9,00 1. 555677789 15,00 2. 000011112233444 8,00 2. 56666889 9,00 3. 001122234 11,00 3. 55567788888 10,00 4. 0012223333 2,00 4. 78 4,00 5. 0022 4,00 5. 6688 2,00 6. 23 1,00 6. 5 3,00 7. 233 1,00 7. 8 1,00 8. 0 2,00 Extremes (>=9,3) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 20

ιερευνητική ανάλυση δεδοµένων- Θηκόγραµµα (box-plot) Γραφική παράσταση που παριστάνει την κατανοµή των δεδοµένων και συγκεκριµένα: ιάµεσο Τεταρτηµόρια και ενδοτεταρτηµοριακό εύρος Μέγιστη και ελάχιστη τιµή πουδενείναι στατιστικά ακραίες Τις ακραίες τιµές (outliers and extreme points) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 21

Παράδειγµα θηκογράµµατος Max not outlier Extreme point Outlier Q3 Interquartile range median (Q2) Q1 Min not outlier ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 22

Συµπέρασµα There are no facts, only interpretations. Frederick Nietzsche (1844-1900) Για ονοµαστικές µεταβλητές χρησιµοποιούµε µόνο πίνακα συχνοτήτων, γραφικές παραστάσεις (ραβδόγραµµα, κυκλικό διάγραµµα) και επικρατούσα τιµή Για αριθµητικές µεταβλητές µπορούµε να χρησιµοποιήσουµε όλατα στατιστικά µέτρα ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 23