Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Σχετικά έγγραφα
Εφαρμοσμένη Στατιστική

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

I2. Αριθμητικά περιγραφικά μέτρα

Εφαρμοσμένη Στατιστική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εφαρμοσμένη Στατιστική

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Εισαγωγή στη Στατιστική

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Στατιστική Επιχειρήσεων Ι

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Περιγραφική Στατιστική

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Μάθηµα 3 ο. Περιγραφική Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Περιεχόμενα. Πρόλογος 17 ΚΕΦΑΛΑΙΟ 1 23

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Περιγραφική Στατιστική

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

Δείγμα πριν τις διορθώσεις

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών. κλίµακα µέτρησης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η MBA I

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Περιγραφική Στατιστική. Π.Μ.Σ. "Μαθηματικά των Υπολογιστών και των Αποφάσεων"

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΤΟΥ ΔΙΔΑΚΤΙΚΟΥ ΕΡΓΟΥ ΤΩΝ ΥΠΟΧΡΕΩΤΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΧΕΙΜΕΡΙΝΟΥ ΕΞΑΜΗΝΟΥ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

Βιοστατιστική ΒΙΟ-309

Περιεχόμενα. Πρόλογος... 15

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Ενώ αυτό το ιστόγραμμα δίνει κάποια νέα πληροφόρηση, άλλα ενδιαφέροντα ερωτήματα (π.χ. ποιος είναι ο μέσος όρος της τάξης;) δεν απαντιέται.

Εισαγωγή στη Στατιστική Μάθημα του Β Εξαμήνου

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Αριθμητικά περιγραφικά μέτρα II. Μέτρα κεντρικής θέσης

Θηκόγραμμα - Boxplot. Παράδειγμα 1: Δίνονται οι παρακάτω 20 παρατηρήσεις μιας μεταβλητής x:

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Περιγραφική στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Εισαγωγικές Έννοιες

Εισαγωγή στη Στατιστική

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

Περιγραφική στατιστική μεθοδολογία.

Δειγματοληψία στην Ερευνα. Ετος

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

πολύ συχνά συναντάμε στατιστική και στατιστική πληροφορία. Για παράδειγμα:

Transcript:

Μέρος V. Στατιστική Εισαγωγή: Βασικές έννοιες και ορισμοί Περιγραφική Στατιστική (Descriptive Statistics) Σημαντικές κατανομές δειγματοληψίας (Sampling distributions) Διαστήματα Εμπιστοσύνης (Confidence Intervals) Έλεγχος Υποθέσεων (Statistical Tests) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 1 )

Στατιστική Στατιστική είναι ο κλάδος της επιστήμης που ασχολείται με την περιληπτική περιγραφή, την ανάλυση και την επεξεργασία των δεδομένων ή παρατηρήσεων ή δειγμάτων που παράγει ένα στοχαστικό φαινόμενο. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 2 )

Στατιστική είναι η επιστήμη της επίλυσης προβλημάτων υπό της παρουσίας θορύβου (noise) και μεταβλητότητας (variability). Στόχος της είναι η μετατροπή των παρατηρήσεων σε γνώση και η ερμηνεία του φαινομένου. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 3 )

Χρήσιμοι Ορισμοί Πληθυσμός (population) είναι το σύνολο των στοιχείων που μας ενδιαφέρουν. Συχνά είναι μεγάλος και μη πεπερασμένος (άπειρος) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 4 )

Χρήσιμοι Ορισμοί Πληθυσμός (population) είναι το σύνολο των στοιχείων που μας ενδιαφέρουν. Συχνά είναι μεγάλος και μη πεπερασμένος (άπειρος) Δείγμα (sample) είναι ένα υποσύνολο δεδομένων που συλλέγεται από τον πληθυσμό. Είναι αρκετά μικρότερος από τον πληθυσμό. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 5 )

Χρήσιμοι Ορισμοί Πληθυσμός (population) είναι το σύνολο των στοιχείων που μας ενδιαφέρουν. Συχνά είναι μεγάλος και μη πεπερασμένος (άπειρος) Δείγμα (sample) είναι ένα υποσύνολο δεδομένων που συλλέγεται από τον πληθυσμό. Είναι αρκετά μικρότερος από τον πληθυσμό. Παράμετρος (parameter) είναι ένα μέτρο που περιγράφει τον πληθυσμό Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 6 )

Χρήσιμοι Ορισμοί Πληθυσμός (population) είναι το σύνολο των στοιχείων που μας ενδιαφέρουν. Συχνά είναι μεγάλος και μη πεπερασμένος (άπειρος) Δείγμα (sample) είναι ένα υποσύνολο δεδομένων που συλλέγεται από τον πληθυσμό. Είναι αρκετά μικρότερος από τον πληθυσμό. Παράμετρος (parameter) είναι ένα μέτρο που περιγράφει τον πληθυσμό Στατιστικό στοιχείο είναι ένα μέτρο που περιγράφει το δείγμα. Χρησιμοποιείται για την ανάλυση του δείγματος και την εκτίμηση της τιμής της παραμέτρου. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 7 )

Πληθυσμός Δείγμα (Sample) Υποσύνολο Παράμετρος (?) Στατιστικό στοιχείο (υπολογισμός εκτίμηση παραμέτρου) Οι πληθυσμοί έχουν «παραμέτρους» Τα δείγματα έχουν «στατιστικά στοιχεία» Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 8 )

Τομείς της Στατιστικής Η Συλλογή δεδομένων (Data collection) αναφέρεται σε τεχνικές δειγματοληψίας (sampling), αναπαράστασης δεδομένων, φιλτραρίσματος της πληροφορίας, βελτίωσης της ποιότητας δεδομένων (data cleaning). Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 9 )

Τομείς της Στατιστικής Η Συλλογή δεδομένων (Data collection) αναφέρεται σε τεχνικές δειγματοληψίας (sampling), αναπαράστασης δεδομένων, φιλτραρίσματος της πληροφορίας, βελτίωσης της ποιότητας δεδομένων (data cleaning). Η Περιγραφική Στατιστική (Descriptive Statistics) αναφέρεται στην οργάνωση και περιληπτική περιγραφή ενός συνόλου δεδομένων. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 10 )

Τομείς της Στατιστικής Η Συλλογή δεδομένων (Data collection) αναφέρεται σε τεχνικές δειγματοληψίας (sampling), αναπαράστασης δεδομένων, φιλτραρίσματος της πληροφορίας, βελτίωσης της ποιότητας δεδομένων (data cleaning). Η Περιγραφική Στατιστική (Descriptive Statistics) αναφέρεται στην οργάνωση και περιληπτική περιγραφή ενός συνόλου δεδομένων. Η Επαγωγική ή Συμπερασματική Στατιστική (Inferential Statistics) αναφέρεται στην διαδικασία γενίκευσης και εξαγωγής συμπερασμάτων για έναν πληθυσμό εξετάζοντας μόνο ένα μέρος του (δείγμα). Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 11 )

Συλλογή Δεδομένων Η Δειγματοληψία (Sampling) είναι η συλλογή και ανάλυση δεδομένων από πληθυσμούς. Χρησιμοποιείται ένα υποσύνολο του πληθυσμού (δείγμα), το οποίο θα πρέπει να είναι κατάλληλο έτσι ώστε τα αποτελέσματα να είναι αντιπροσωπευτικά. Τα αποτελέσματα που προκύπτουν πάνω στο δείγμα γενικεύονται στη συνέχεια στον πληθυσμό. Είδη δειγματοληψίας: Τυχαία ή συστηματική δειγματοληψία (χρήση διαστήματος ή βήματος δειγματοληψίας) Στρωματοποιημένη ή κατά συστάδες (clusters) δειγματοληψία (χωρισμός σε ανομοιογενείς ή ομογενείς ομάδες) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 12 )

Περιγραφική Στατιστική Η Περιγραφική Στατιστική αναφέρεται σε μεθόδους που οργανώνουν, συνοψίζουν, και παρουσιάζουν τα δεδομένα με εύκολο και πληροφοριακό τρόπο. Αυτοί οι μέθοδοι περιλαμβάνουν: Γραφικές και Αριθμητικές Τεχνικές Η περιγραφική στατιστική εφαρμόζεται στο δείγμα (σύνολο των δεδομένων το οποίο αναλύεται), αλλά τα συμπεράσματα που προκύπτουν για τον πληθυσμό είναι περιορισμένα. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 13 )

Επαγωγική Στατιστική Η Επαγωγική Στατιστική είναι μία σειρά μεθόδων που χρησιμοποιούνται για την εξαγωγή συμπερασμάτων σχετικά με τα χαρακτηριστικά του πληθυσμού. Χρησιμοποιούμε στατιστικά στοιχεία για να εξάγουμε συμπεράσματα σχετικά με τις παραμέτρους (του πληθυσμού). Ότι γνωρίσουμε σχετικά με το δείγμα μπορούμε να το εφαρμόσουμε στον πληθυσμό. Μορφές συμπερασματολογίας Διαστήματα Εμπιστοσύνης (Confidence intervals) Έλεγχος Υποθέσεων (Statistical test) Εκτιμητική (Estimation) Παλινδρόμηση (Regression analysis) Ανάλυση Διακύμανσης (NOV analysis) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 14 )

Περιγραφική Στατιστική (Descriptive Statistics) 1. Οργάνωση και Γραφική παράσταση στατιστικών δεδομένων 2. Αριθμητικά περιγραφικά μέτρα Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 15 )

1. Οργάνωση και γραφική παράσταση στατιστικών δεδομένων Τρόποι οπτικοποίησης των δεδομένων Πίνακες συχνοτήτων Ραβδογράμματα Κυκλικά διαγράμματα Ιστογράμματα Φυλλογράμματα. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 16 )

Στατιστικοί πίνακες Παρουσίαση των δεδομένων σε συνοπτικούς πίνακες για την ευκολία της κατανόησής τους και την εξαγωγή συμπερασμάτων. Πίνακες συχνοτήτων Έστω τ.μ. X που περιγράφει τα άτομα ενός πληθυσμού και {Χ 1, Χ 2, Χ n } ένα τυχαίο δείγμα μεγέθους n. Έστω σύνολο k τιμών της μεταβλητής {a 1, a 2,, a k } Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 17 )

Συχνότητα (frequency) n i της τιμής a i το πλήθος των δειγμάτων με τιμή a i, Σχετική συχνότητα (relative frequency) διαιρούμε την συχνότητα με τον μέγεθος του δείγματος: n f i i 1,, i n (πιθανότητα της τιμής a i ) k Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 18 )

Ένας πίνακας συχνοτήτων είναι ένας πίνακας που παρουσιάζει τις κατηγορίες (ή τα διαστήματα τιμών) των δεδομένων με τις αντίστοιχες συχνότητές τους. Τιμή a i Συχνότητα n i Σχετ. συχνότητα f i ασπρο 6 6/11 μαύρο 3 3/11 μπλε 2 2/11 Τιμή a i Συχνότητα n i Σχετ. συχνότητα f i 1-4 4 4/12 5-8 5 5/12 9-12 3 3/12 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 19 )

Γραφική παράσταση στατιστικών δεδομένων Ραβδογράμματα (bar charts) Οι κατηγορίες παρουσιάζονται στον x-άξονα ως ισομήκη διαστήματα ενώ οι αντίστοιχες συχνότητες (ή σχετικές συχνότητες) στο y-άξονα Είναι δυνατόν να υπάρχουν πολλαπλά ραβδογράμματα Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 20 )

Κυκλικά διαγράμματα (pie charts) Οι κατηγορίες (τιμές) παρουσιάζονται σε κύκλο χωρισμένο σε κυκλικούς τομείς, τα τόξα των οποίων είναι ανάλογα με τις αντίστοιχες συχνότητες. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 21 )

3 διαφορετικοί τρόποι παρουσίασης a i n i F i (%) 1 73 28.9 2 52 20.6 3 36 14.2 4 64 25.3 5 28 11.1 Σύνολο 253 100 Δείχνουν την ίδια πληροφορία (βασίζονται στα ίδια δεδομένα) απλά διαφέρει ο τρόπος παρουσίασης Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 22 )

Ιστογράμματα (Histograms) συχνότητα τιμές Παράγει μια κατανομή της συχνότητας των δεδομένων σε (συνήθως ίσα) διαστήματα τιμών (ή κάδους - bins). Χρησιμοποιώντας τις σχετικές συχνότητες στα bins τότε παράγεται μία κατανομή των δεδομένων. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 23 )

Ιστογράμματα (Histograms) συχνότητα τιμές P X k n 71 200 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 24 )

Ιστογράμματα (Histograms) συχνότητα τιμές P X k n 71 200 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 25 )

Ιστογράμματα (Histograms) συχνότητα τιμές P P X k n 71 200 X f xdx f x f xv f x15 dx Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 26 )

Ιστογράμματα (Histograms) συχνότητα τιμές P P X k n 71 200 X f xdx f x f xv f x15 dx Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 27 )

Ιστογράμματα (Histograms) συχνότητα τιμές P P X k n 71 200 X f xdx f x f xv f x15 dx f x k nv 71 20015 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 28 )

Φυλλογράμματα (stem-leaf notes) Διατηρεί τις πληροφορίες σχετικά με τις ατομικές παρατηρήσεις (ενώ «χάνονται» με τα ιστογράμματα) Κάθε παρατήρηση χωρίζεται σε 2 μέρη: ένα στέλεχος ή οδηγό (stem) και ένα φύλλο (leaf) Υπάρχουν διάφοροι τρόποι διάσπασης (συνήθως αυθαίρετα) ανάλογα με τον τύπο δεδομένων Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 29 )

Βήματα κατασκευής φυλλογραμμάτων a)επιλέγουμε πρώτα τα στελέχη (ή οδηγούντα ψηφία) και τα φύλλα b)διατάσσουμε τα στελέχη κατά αύξουσα c)γράφουμε τα (διαφορετικά) φύλλα στην ίδια γραμμή των αντίστοιχων στελεχών d)ελέγχουμε εάν έχουν καταγραφεί όλα τα φύλλα (αριθμός τους ίσος με το συνολικό πλήθος παρατηρήσεων) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 30 )

Παράδειγμα Σύνολο δεδομένων Χ={136, 111, 120, 105, 113, 116, 99, 110} Θεωρώντας τις δεκάδες ως στελέχη και τις μονάδες ως φύλλα τότε κατασκευάζουμε το παρακάτω φυλλόγραμμα: Stem 9 9 10 5 11 0 1 3 6 12 0 13 6 Leaf Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 31 )

Διάγραμμα διασποράς (scatter plot) Χρησιμοποιείται για να δείξουμε την σχέση ανάμεσα σε 2 μεταβλητές. Η ανεξάρτητη μεταβλητή συμβολίζεται με X στον οριζόντιο άξονα, ενώ η άλλη μεταβλητή καλείται εξαρτημένη και παριστάνεται με Y στον κάθετο άξονα. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 32 )

2. Αριθμητικά περιγραφικά μέτρα [Α]. Μέτρα θέσης ή κεντρικής τάσης (central tendency) Περιγράφουν την θέση της κατανομής ή του κέντρου των παρατηρήσεων. Δημοφιλέστερα: Μέση τιμή, κορυφή και διάμεσος Ο δειγματικός μέσος (mean) δηλ. ο μέσος όρος των i n παρατηρήσεων x 1 Αν α j είναι οι κεντρικές τιμές των κλάσεων σε ομαδοποιημένα δεδομένα τότε ο μέσος υπολογίζεται ως: (σταθμισμένος μέσος): x k j1 n n n j n a x j i k j1 f j a j Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 33 )

Η κορυφή (mode) ή επικρατούσα τιμή είναι η επικρατέστερη τιμή του δείγματος, δηλ. αυτή με την μέγιστη συχνότητα. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 34 )

Η κορυφή (mode) ή επικρατούσα τιμή είναι η επικρατέστερη τιμή του δείγματος, δηλ. αυτή με την μέγιστη συχνότητα. Η διάμεσος (median) δ χωρίζει το δείγμα σε 2 ίσα μέρη, ώστε ο αριθμός των παρατηρήσεων που είναι δ να είναι ίσος (50%) με τον αριθμό των δεδομένων που είναι δ. Έτσι, αν διατάσουμε τις n παρατηρήσεις του δείγματος: τότε Παρατήρηση: x x x ( 1) (2) ( 1) ( n) ( r) x( r) x 2 ( r1) x n x Αν η κατανομή είναι συμμετρική, τότε ο μέσος, η κορυφή και η διάμεσος συμπίπτουν (π.χ. κανονική κατανομή). n n 2r 1 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 35 ) 2r

Ποσοστημόρια (quantiles): μέτρο σχετικής θέσης Γενίκευση της διαμέσου το a-οστό ποσοστημόριο είναι η τιμή από την οποία το a% των τιμών είναι μικρότερο από την τιμή αυτή και το (100 - a)% είναι μεγαλύτερο από την τιμή αυτή Αν το a είναι ακέραιο {1, 2,, 99} τότε εκατοστημόρια (quantiles). Αν a={10, 20,, 90} δεκατημόρια Αν a={25, 50, 75} τότε έχουμε τεταρτημόρια (quartiles) a=25 : Q 1 πρώτο τεταρτημόριο a=75 : Q 3 τρίτο τεταρτημόριο a=50 : Q 2 δεύτερο τεταρτημόριο (δηλ. η διάμεσος). Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 36 )

Θηκογράμματα (box plots) Απλός τρόπος παρουσίασης των κυριότερων χαρακτηριστικών μιας κατανομής μέσω ενός γραφήματος Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 37 )

Βήματα κατασκευής boxplot 1. Αρχικά βρίσκουμε τα δύο τεταρτημόρια Q1, Q3 και τη διάμεσο δ (δηλ. το Q 2 ). Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 38 )

Βήματα κατασκευής boxplot 1. Αρχικά βρίσκουμε τα δύο τεταρτημόρια Q1, Q3 και τη διάμεσο δ (δηλ. το Q 2 ). 2. Κατασκευάζουμε ένα ορθογώνιο με κάτω πλευρά το Q1 και πάνω πλευρά το Q3. Η διάμεσος παριστάνεται ως ευθύγραμμο τμήμα μέσα στο ορθογώνιο παράλληλο με τις βάσεις. Q 3 δ=q 2 Q 1 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 39 )

Βήματα κατασκευής boxplot Q 3 +1.5(Q 3 Q 1 ) 1. Αρχικά βρίσκουμε τα δύο τεταρτημόρια Q1, Q3 και τη διάμεσο δ (δηλ. το Q 2 ). 2. Κατασκευάζουμε ένα ορθογώνιο με κάτω πλευρά το Q1 και πάνω πλευρά το Q3. Η διάμεσος παριστάνεται ως ευθύγραμμο τμήμα μέσα στο ορθογώνιο παράλληλο με τις βάσεις. 3. Φέρουμε διακεκομμένες γραμμές από τα μέσα των βάσεων του ορθογωνίου μέχρι τις οριακές τιμές (adjacent) που προκύπτουν. Q 3 δ=q 2 Q 1 Q 1-1.5(Q 3 Q 1 ) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 40 )

Βήματα κατασκευής boxplot Q 3 +1.5(Q 3 Q 1 ) 1. Αρχικά βρίσκουμε τα δύο τεταρτημόρια Q1, Q3 και τη διάμεσο δ (δηλ. το Q 2 ). 2. Κατασκευάζουμε ένα ορθογώνιο με κάτω πλευρά το Q1 και πάνω πλευρά το Q3. Η διάμεσος παριστάνεται ως ευθύγραμμο τμήμα μέσα στο ορθογώνιο παράλληλο με τις βάσεις. 3. Φέρουμε διακεκομμένες γραμμές από τα μέσα των βάσεων του ορθογωνίου μέχρι τις οριακές τιμές (adjacent) που προκύπτουν. 4. Κάθε σημείο που πέφτει έξω από το εύρος των δύο οριακών τιμών λέγεται ακραία τιμή (outlier) και παριστάνεται με ένα ιδιαίτερο σύμβολο (π.χ. *) Q 3 δ=q 2 Q 1 Q 1-1.5(Q 3 Q 1 ) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 41 )

Τα θηκογράμματα μας δίνουν το κεντρικό διάστημα με το 50% των παρατηρήσεων μεταξύ του 1 ου και 3 ου τεταρτημορίου (Q1, Q3). Οι επεκτεινόμενες γραμμές και η θέση της διαμέσου μας δίνουν μια εικόνα της συμμετρικότητας της κατανομής. Δυνατότητα μελέτης των ακραίων τιμών Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 42 )

[Β]. Μέτρα διασποράς Εκφράζουν αποκλίσεις των τιμών μιας μεταβλητής γύρω από τα μέτρα κεντρικής τάσης Εύρος (range) τιμών ή κύμανση = max{ x i } min{ x i } εύκολο στον υπολογισμό, αλλά μικρής αξιοπιστίας Ενδοτεταρτημοριακή απόκλιση (interquartile range) = Q 3 Q 1 Μετράει το άπλωμα του 50% των μεσαίων τιμών των παρατηρήσεων. Μεγάλες τιμές αυτής της στατιστικής υποδεικνύει μεταβλητότητας. υψηλό επίπεδο Μικρές τιμές (διάστημα) σημαίνει μεγάλη συγκέντρωση τιμών και άρα μικρότερη διασπορά τιμών. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 43 )

Μέτρα διασποράς Εκφράζουν αποκλίσεις των τιμών μιας μεταβλητής γύρω από τα μέτρα κεντρικής τάσης Εύρος (range) τιμών ή κύμανση = max{ x i } min{ x i } εύκολο στον υπολογισμό, αλλά μικρής αξιοπιστίας Ενδοτεταρτημοριακή απόκλιση (interquartile range) = Q 3 Q 1 Μετράει το άπλωμα του 50% των μεσαίων τιμών των παρατηρήσεων. Μεγάλες τιμές αυτής της στατιστικής υποδεικνύει μεταβλητότητας. υψηλό επίπεδο Μικρές τιμές (διάστημα) σημαίνει μεγάλη συγκέντρωση τιμών και άρα μικρότερη διασπορά τιμών. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 44 )

Μέτρα διασποράς Εκφράζουν αποκλίσεις των τιμών μιας μεταβλητής γύρω από τα μέτρα κεντρικής τάσης Εύρος (range) τιμών ή κύμανση = max{ x i } min{ x i } εύκολο στον υπολογισμό, αλλά μικρής αξιοπιστίας Ενδοτεταρτημοριακή απόκλιση (interquartile range) = Q 3 Q 1 Μετράει το άπλωμα του 50% των μεσαίων (συχνότερων) τιμών των παρατηρήσεων. Μεγάλες τιμές αυτής της στατιστικής υποδεικνύει μεταβλητότητας. υψηλό επίπεδο Μικρές τιμές (διάστημα) σημαίνει μεγάλη συγκέντρωση τιμών και άρα μικρότερη διασπορά τιμών. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 45 )

Μέση απόκλιση (mean deviation) MO Ο αριθμητικός μέσος των αποκλίσεων των τιμών από το μέσον τους n i 1 x i n x Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 46 )

Μέση απόκλιση (mean deviation) Ο αριθμητικός μέσος των αποκλίσεων των τιμών από το μέσον τους Δειγματική διασπορά ή διακύμανση (variance) Παρατήρηση: στον παρονομαστή έχουμε n-1 (και όχι n) για καλύτερη εκτίμηση του (αμερόληπτος εκτιμητής) Δειγματική τυπική απόκλιση (standard deviation) n x x MO n i i 1 1 1 2 2 n x x S n i i 1 1 2 n x x S n i i Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 47 )

[ Γ ]. Μέτρα σχετικής μεταβλητότητας Συντελεστής μεταβλητότητας (coefficient of variation) v x s τυπικήαπόκλιση δειγματικός μέσος 100% Μέτρο σχετικής μεταβλητότητας τιμών. Χρησιμοποιείται για συγκρίσεις ανάμεσα σε δείγματα που είτε εκφράζονται σε διαφορετικές μονάδες μέτρησης, είτε έχουν διαφορετικές μέσες τιμές. Δεχόμαστε ότι δύο δείγματα τιμών θα είναι ομοιογενή αν ο συντελεστής μεταβλητότητας τους διαφέρει το πολύ 10%. Μειονέκτημα όταν ο μέσος πλησιάζει στο μηδέν (τότε δεν πρέπει να χρησιμοποιείται). Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 48 )

Συνδιακύμανση (covariance): μέτρο κατευθυντικότητας δύο μεταβλητών Συντελεστής συσχέτισης (correlation coefficient): μέτρο γραμμικότητας μεταξύ των δύο μεταβλητών [-1, 1] r -> 1 r -> 0 r -> -1 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 49 )

[Δ]. Μέτρα ασυμμετρίας x M0 Συμμετρική κατανομή Η κορυφή (Μ0), ο μέσος και η διάμεσος συμπίπτουν x M0 M0 x Θετική συμμετρία Οι περισσότερες παρατηρήσεις είναι δεξιά της κορυφής (M0). Συντελεστής ασυμμετρίας Pearson Αρνητική συμμετρία Οι περισσότερες παρατηρήσεις είναι αριστερά της κορυφής (M0). 3 x x M0 Y Y1 2 s s Αν Υ=0 => συμμετρία Αν Υ<0 => αρνητική συμμετρία Αν Υ>0 => θετική συμμετρία Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 50 )

180.00 Μέτρα ασυμμετρίας (συν.) 160.00 140.00 Συντελεστής του Bowley S Q Q Q Q3 2 1 3 1 1, 1 Q Q Q Q 3 1 3 1 120.00 100.00 80.00 Q3 δ Q1 IQ Αν S =0 => συμμετρία Αν -1 < S < 0 => αρνητική συμμετρία (η διάμεσος πλησιάζει το Q 3 ) Αν 0 < S < 1 => θετική συμμετρία (η διάμεσος πλησιάζει το Q 1 ) Συντελεστής ασυμμετρίας με βάση τις ροπές 2 3 1 2 2 m m 0 Αν β 1 = 0 τότε συμμετρία Αν β 1 >0 ασυμμετρία (θετική m 3 > 0 ή αρνητική m 3 < 0 ) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 51 )

[Ε]. Μετασχηματισμοί δεδομένων Z-score Έτσι έχουμε τον μετασχηματισμό: Ισχύει ότι z x x x sz i i s x x i z i x i s x Δηλαδή, το z i εκφράζει τον αριθμό των τυπικών αποκλίσεων που το x i διαφέρει από το μέσον του Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 52 )

Παράδειγμα Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 53 )

Παράδειγμα Ο αριθμός των ελαττωματικών μπαταριών που βρέθηκαν σε 72 σωρούς παραγωγής των 500 μπαταριών ήταν 3 7 24 6 9 7 1 19 9 0 6 15 4 5 7 11 5 11 1 13 2 4 3 3 17 2 14 4 22 3 10 12 26 7 8 11 1 10 21 7 2 20 9 2 0 1 20 9 13 18 5 14 12 3 8 1 1 5 2 17 15 13 3 16 4 12 4 6 3 8 22 5 (α) να παραστούν σε μορφή φυλλογραφήματος (β) να υπολογιστούν: (i) η μέση τιμή, (ii) η διάμεσος, (iii) η κορυφή, (iv) η διασπορά, (v) ο συντελεστής μεταβολής. (γ) να κατασκευαστεί το θηκόγραμμα (δ) να κατασκευαστούν το ιστόγραμμα σχετικών συχνοτήτων. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 54 )

(α) φυλλογράφημα (stem-leaf notes) Λύση stem leaf 0 0 0 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 7 7 7 7 7 8 8 8 9 9 9 9 1 0 0 1 1 1 2 2 2 3 3 3 4 4 5 5 6 7 7 8 9 2 0 0 1 2 2 4 6 (β) δειγματικός μέσος: 8 65 διάμεσος = 7 κορυφή = 3 δειγματική διακύμανση = 43.61 συντελεστής μεταβλητότητας = τυπική απόκλιση / μέσος = 0.763 Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 55 )

(γ) θηκόγραμμα ( boxplot(x) ) (δ) Ιστόγραμμα σχετικών συχνοτήτων ( histogram(x,10) ) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ19 ( 56 )