ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σχετικά έγγραφα
Κεφάλαιο Δύο Γραφήματα και Πίνακες Περιγραφικές Τεχνικές

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 2 Περιγραφικές Τεχνικές

Περιγραφική Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Βιοστατιστική ΒΙΟ-309

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Βιοστατιστική ΒΙΟ-309

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Βιοστατιστική ΒΙΟ-309

Εισαγωγή στη Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έτος : Διάλεξη 2 η Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ν ν = 6. όταν είναι πραγµατικός αριθµός.

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

15, 11, 10, 10, 14, 16, 19, 18, 13, 17

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Παράδειγμα. Χρονολογικά δεδομένα. Οι πωλήσεις μιας εταιρείας ανά έτος για το διάστημα (σε χιλιάδες $)

ν ν = 6. όταν είναι πραγµατικός αριθµός.

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές Διερευνητική Ανάλυση Δεδομένων

ΜΕΘΟΔΟΛΟΓΙΕΣ & ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΑ ΜΑΘΗΜΑΤΙΚΑ Γ ΕΠΑΛ ΚΕΦΑΛΑΙΟ 1 Ο «ΣΤΑΤΙΣΤΙΚΗ»

I2. Αριθμητικά περιγραφικά μέτρα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ

Περιγραφική Στατιστική

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Μάθηµα 3 ο. Περιγραφική Στατιστική

Εισαγωγή στη Στατιστική

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 2ο: ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑ Α

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Mέτρα (παράμετροι) θέσεως

Θέμα Α. Θέμα Β. ~ 1/9 ~ Πέτρος Μάρκου. % σχεδιάζουμε το πολύγωνο αθροιστικών σχετικών συχνοτήτων τοις

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Στατιστική Ι Ασκήσεις 3

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

Ενότητα: Περιγραφική Στατιστική 2: Αριθμητικά Μεγέθη

Συναρτήσεις. Ορισμός Συνάρτησης

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Συλλογή και Παρουσίαση Δεδομένων

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΔΕΟ 13 ΤΟΜΟΣ Δ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Είδη Μεταβλητών. κλίµακα µέτρησης

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

f , Σύνολο 40 4) Να συμπληρώστε τον παρακάτω πίνακα f , , Σύνολο 5) Να συμπληρώστε τον παρακάτω πίνακα

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Ενότητα 2: Μέθοδοι δειγματοληψίας & Εισαγωγή στην Περιγραφική Στατιστική

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

επ. Κωνσταντίνος Π. Χρήστου

ΦΥΛΛΑΔΙΟ ΑΣΚΗΣΕΩΝ ΣΤΑΤΙΣΤΙΚΗΣ ΠΑΝΟΣ ΣΑΡΑΚΗΝΟΣ

Εφαρμοσμένη Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 207-208 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 227035468

ΣΤΑΤΙΣΤΙΚΗ Περιγραφική Στατιστική

Περιγραφική Στατιστική Δεν αποτελεί πια το κύριο ή το πιο σημαντικό θέμα της στατιστικής Ωστόσο, χρησιμοποιείται ευρύτατα σε πρωταρχική φάση κάθε ανάλυσης δεδομένων και τα τελευταία χρόνια γνωρίζει άνθηση χάρις στην ανάπτυξη των γραφικών μεθόδων και των ηλεκτρονικών υπολογιστών Περιλαμβάνει μεθόδους παρουσίασης, ταξινόμησης και συνόψισης ενός συνόλου δεδομένων Οι μέθοδοι αυτοί χρησιμοποιούν πίνακες κατανομής διαφόρων συχνοτήτων, γραφήματα όπως ιστογράμματα, πολύγωνα, ραβδογράμματα και άλλα

Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων Ομαδοποιημένα δεδομένα Τα βασικά χαρακτηριστικά ενός μεγάλου συνόλου δεδομένων μπορούν να εκτιμηθούν ευκολότερα με ομαδοποίηση των δεδομένων σε κατηγορίες ή ομάδες και μετά προσδιορίζοντας τον αριθμό των παρατηρήσεων που ανήκουν σε κάθε ομάδα Τέτοιου είδους πινακοποιήσεις καλούνται πίνακες κατανομής συχνοτήτων για ομαδοποιημένα δεδομένα Πώς κατασκευάζουμε ένα πίνακα κατανομής συχνοτήτων ομαδοποιημένων δεδομένων:. Προσδιορίζουμε τον αριθμό k των ομάδων ή κλάσεων: η απόφαση είναι αυθαίρετη και εμπειρική. Συχνά χρησιμοποιούνται 5 έως και 25 ομάδες-κλάσεις ανάλογα με το μέγεθος του συνόλου των δεδομένων 2. Προσδιορίζουμε το εύρος R (rage) των παρατηρήσεων: μέγιστη παρατήρηση ελάχιστη παρατήρηση R max x mi i x i

Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων 3. Προσδιορίζουμε το μήκος l των ομάδων: εύρος αριθμός ομάδων R k έχουμε έτσι ομάδες με ίσα μήκη και άρα μπορούμε να κάνουμε ομοιόμορφες συγκρίσεις (μπορεί να υπάρχουν και άνισα μήκη) 4. Προσδιορίζουμε τα όρια L και U των ομάδων: το κατώτερο όριο L της πρώτης ομάδας συνήθως υπολογίζεται από την ελάχιστη παρατήρηση μείον μισή μονάδα x 0 5 L i mi. και στην συνέχεια προσθέτουμε σε αυτό το μήκος l: U L 5. Ταξινομούμε τις παρατηρήσεις στις ομάδες Μπορούμε λοιπόν με βάση τα παραπάνω να ορίσουμε:

Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων Έστω ότι οι παρατηρήσεις x, x 2,, x αποτελούν ένα σύνολο δεδομένων μεγέθους και ότι θέλουμε τις παρατηρήσεις αυτές να τις ταξινομήσουμε σε ένα πίνακα κατανομής συχνοτήτων, ο οποίος να έχει k ομάδες. Κάθε ομάδα j, j =, 2,, k έχει τα εξής χαρακτηριστικά: L j κατώτερο όριο U j ανώτερο όριο Lj U j m j μέσο σημείο ή τιμή ομάδας m j 2 f j απόλυτη συχνότητα, συμβολίζει τον αριθμό των παρατηρήσεων που ανήκουν στην ομάδα j. Άθροισμα όλων των απολύτων συχνοτήτων = με το μέγεθος k j f j f f 2... f i / σχετική συχνότητα. Συμβολίζει τον αριθμό των παρατηρήσεων που ανήκουν στην ομάδα j υπό μορφή ποσοστού και αθροίζει στην μονάδα k f k j f j j j F j αθροιστική συχνότητα. Είναι ο αριθμός των παρατηρήσεων από την πρώτη ομάδα έως και την j ομάδα αθροιστικά F f f... f j 2 f j k

Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων. Η αθροιστική συχνότητα της τελευταίας ομάδας F k πρέπει να ίση με το μέγεθος F k f f2... f k F i / σχετική αθροιστική συχνότητα. Συμβολίζει τον αριθμό των παρατηρήσεων από την πρώτη ομάδα έως και την j αθροιστικά υπό μορφή ποσοστού F j f... και η σχετική αθροιστική συχνότητα της τελευταίας ομάδας είναι ίση με 00% = f 2 f j

Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων Παράδειγμα Ένα τυχαίο δείγμα 50 ατόμων από το σύνολο των υπαλλήλων μιας εταιρίας έλαβαν μέρος σε μια έρευνα προσωπικών στοιχείων. Μεταξύ των διαφόρων ερωτήσεων ήταν και η ηλικία των υπαλλήλων με τιμές κατά αύξουσα σειρά 8 2 24 25 28 29 30 3 32 32 33 34 35 35 36 36 36 37 38 38 39 39 40 40 4 4 42 42 43 44 44 45 45 46 47 47 49 50 50 50 5 52 52 55 55 57 58 59 62 64 Να κατασκευασθεί ένας πίνακας κατανομής συχνοτήτων που περιγράφει τις ηλικίες των υπαλλήλων του δείγματος.

Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων Μη-ομαδοποιημένα δεδομένα Μερικές φορές η ομαδοποίηση των δεδομένων δεν είναι επιθυμητή γιατί για παράδειγμα θα πρέπει να διατηρηθούν κάποια χαρακτηριστικά των παρατηρήσεων. Επίσης υπάρχουν περιπτώσεις όπου το σύνολο των δεδομένων δεν περιέχει πολλές διαφορετικές τιμές και άρα δεν ενδείκνυται η ομαδοποίηση Τότε στην κατασκευή πίνακα κατανομής συχνοτήτων δεν γίνεται ομαδοποίηση των δεδομένων αλλά απλά μια καταγραφή αυτών και των αντίστοιχων συχνοτήτων κάθε παρατήρησης Αν επιπλέον οι παρατηρήσεις διαταχθούν, τότε ο πίνακας λέγεται διατεταγμένος πίνακας συχνοτήτων Παρατηρήσεις x j Απόλυτες Συχνότητες f j Σχετικές Συχνότητες f j / Αθροιστικές Συχνότητες F j ΣχετικέςΑθροιστικές Συχνότητες F j / x f f / F F / x 2 f 2 f 2 / F 2 F 2 /... x k f k f k / F k = F k / = k f j j k f j j

Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων Παράδειγμα 2 Σε ένα τυχαίο δείγμα 0 εστιατορίων έγινε καταγραφή των ατόμων που εργάζονται σε αυτά. Να κατασκευασθεί ο πίνακας κατανομής συχνοτήτων 8 0 4 4 2 0 8

Περιγραφική Στατιστική Γραφικές απεικονίσεις δεδομένων Οι κατανομές συχνοτήτων παρέχουν χρήσιμες πληροφορίες για ένα σύνολο δεδομένων με μορφή πινάκων. Το επόμενο βήμα είναι η απεικόνιση των πινάκων αυτών με γραφήματα. Τα γραφήματα προσδιορίζουν άμεσα και εύκολα την γενική εικόνα κατανομής ενός συνόλου δεδομένων Υπάρχουν πολλά είδη γραφημάτων για την απεικόνιση ενός συνόλου δεδομένων με κυριότερα τα εξής

Περιγραφική Στατιστική Γραφικές απεικονίσεις δεδομένων ΙΣΤΟΓΡΑΜΜΑ Το ιστόγραμμα είναι περισσότερο κατάλληλο για την απεικόνιση ομαδοποιημένων ποσοτικών μεταβλητών που αντιπροσωπεύουν παρατηρήσεις της διαστημικής ή της αναλογικής κλίμακας μετρήσεων Ο τρόπος απεικόνισης του ιστογράμματος είναι ένα σύνολο από ορθογώνια παραλληλόγραμμα με βάσεις που αντιπροσωπεύουν τις ομάδες επί του άξονα x και ύψη που αντιπροσωπεύουν τις συχνότητες επί του άξονα y Αν στο άξονα y αντιστοιχίσουμε τις απόλυτες συχνότητες, τότε έχουμε το ιστόγραμμα απολύτων συχνοτήτων Ανάλογα για τις σχετικές συχνότητες

Σχετικές συχνότητες Περιγραφική Στατιστική Πίνακες κατανομής συχνοτήτων Παράδειγμα 3 Να κατασκευασθεί το ιστόγραμμα σχετικών συχνοτήτων του πίνακα συχνοτήτων που προκύπτει από τα δεδομένα του παραδείγματος. y 0.36 0.36 0.28 0.28 0.20 0.20 0.08 0.08 0.08 7.5 27.5 37.5 47.5 57.5 67.5 ομάδες

Σχετικές συχνότητες Περιγραφική Στατιστική Γραφικές απεικονίσεις δεδομένων ΠΟΛΥΓΩΝΟ Το πολύγωνο απόλυτων ή σχετικών συχνοτήτων κατασκευάζεται ενώνοντας διαδοχικά με ευθύγραμμα τμήματα τα μέσα των πάνω πλευρών των ορθογωνίων του ιστογράμματος τα οποία και αντιστοιχούν στο μέσο σημείο της κάθε ομάδας Παράδειγμα 4 y 0.36 Να κατασκευασθεί το πολύγωνο σχετικών συχνοτήτων του προηγούμενου πίνακα 42.5 Γ 32.5 Β 0.28 52.5 Δ 0.20 22.5 Α 62.5 Ε 0.08 7.5 27.5 37.5 47.5 57.5 67.5 ομάδες

Σχετικές αθροιστικές συχνότητες Περιγραφική Στατιστική Γραφικές απεικονίσεις δεδομένων Πολύγωνο αθροιστικών συχνοτήτων: Ενώνουμε με διαδοχικά ευθύγραμμα τμήματα τα (L,0), (U,F ), (U 2,F 2 ),, (U k,f k ) Πολύγωνο σχετικών αθροιστικών συχνοτήτων: Ενώνουμε με διαδοχικά ευθύγραμμα τμήματα τα (L,0), (U, F / ), (U 2,F 2 / ),, (U k,f k / ) Παράδειγμα 5 Να κατασκευασθεί το πολύγωνο σχετικών αθροιστικών συχνοτήτων του προηγούμενου πίνακα y 0.92 0.72 0.36 0.08 7.5 27.5 37.5 47.5 57.5 67.5 ομάδες

Περιγραφική Στατιστική Γραφικές απεικονίσεις δεδομένων ΡΑΒΔΟΓΡΑΜΜΑ Είναι κατάλληλο για την απεικόνιση μεταβλητών που αντιπροσωπεύουν παρατηρήσεις της ονομαστική ή της τακτικής κλίμακας μετρήσεων Η κατασκευή ενός ραβδογράμματος είναι παρόμοια με αυτή του ιστογράμματος με την διαφορά ότι οι κατηγορίες στον άξονα των x δεν είναι συνεχόμενες λόγω της διαφορετικής κλίμακας των μετρήσεων Παράδειγμα 6 Σε μια έρευνα έλαβαν μέρος 000 άτομα, από τα οποίο οι 300 ήταν απόφοιτοι Δ.Ε., 550 απόφοιτοι Π.Ε. και 50 Α.Ε. Το ραβδόγραμμα σχετικών συχνοτήτων για το επίπεδο εκπαίδευσης των ερωτηθέντων δίνεται παρακάτω:

Σχετικές συχνότητες Περιγραφική Στατιστική Γραφικές απεικονίσεις δεδομένων y 0.55 0.55 0.30 0.30 0.5 0.5 Δ.Ε Π.Ε. Α.Ε.

Περιγραφική Στατιστική Γραφικές απεικονίσεις δεδομένων ΚΥΚΛΙΚΟ ΔΙΑΓΡΑΜΜΑ Απεικονίζει συνήθως τις σχετικές συχνότητες ως ανάλογα εμβαδά κυκλικών τομέων ενός κύκλου Παράδειγμα 7 Να κατασκευασθεί κυκλικό διάγραμμα του προηγούμενου παραδείγματος: 0.55 0.5 ΠΕ Π.Ε. 0.5 ΑΕ 0.30 Μ.Ε. 0.55 Α.Ε. 0.30 ΔΕ

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων Εκτός από τους πίνακες συχνοτήτων και τα αντίστοιχα γραφήματα, η περιγραφική στατιστική χρησιμοποιεί και αριθμητικά μεγέθη που περιγράφουν το σύνολο των δεδομένων Τα αριθμητικά αυτά μεγέθη ή μέτρα, περιγράφουν βασικά χαρακτηριστικά της κατανομής ενός συνόλου δεδομένων, όπως η κεντρική θέση, τα ποσοστιαία σημεία, η μεταβλητότητα, η λοξότητα και η κύρτωση ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΘΕΣΗΣ Είναι αριθμητικά μεγέθη τα οποία χρησιμοποιούνται για να καθορίσουν το κέντρο γύρω από το οποίο τείνουν να συγκεντρώνονται οι παρατηρήσεις. Μέση τιμή (α) Μέση τιμή πληθυσμού-παράμετρος: Έστω ότι οι παρατηρήσεις x, x 2,, x Ν αποτελούν ένα σύνολο δεδομένων μεγέθους Ν N N i x i

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων (β) Μέση τιμή δείγματος: Έστω ότι οι παρατηρήσεις x, x 2,, x αποτελούν ένα σύνολο δεδομένων μεγέθους X i x i (γ) Μέση τιμή ομαδοποιημένων δεδομένων : Έστω ότι οι παρατηρήσεις x, x 2,, x αποτελούν ένα σύνολο δεδομένων μεγέθους X k j m j f j j (δ) Μέση τιμή με βάρη: Έστω ότι οι παρατηρήσεις x, x 2,, x αποτελούν ένα σύνολο δεδομένων μεγέθους και κάθε μια από τις παρατηρήσεις έχει διαφορετική σημασίασημαντικότητα X w i w x i i k f i j w i

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων 2. Διάμεσος Αρχικά ΔΙΑΤΑΣΣΟΥΜΕ ΤΑ ΔΕΔΟΜΕΝΑ ΣΕ ΑΥΞΟΥΣΑ ΣΕΙΡΑ (α) Περιττός αριθμός παρατηρήσεων: Η μεσαία παρατήρηση (β) Άρτιος αριθμός παρατηρήσεων: το ημι-άθροισμα των δύο μεσαίων παρατηρήσεων Είτε πρόκειται για τον πληθυσμό είτε για το δείγμα η θέση της διαμέσου προσδιορίζεται από την ίδια σχέση 3. Κορυφή 2 2 (α) Μη ομαδοποιημένα δεδομένα: Συμβολίζεται με Μ 0 και είναι η παρατήρηση με την μεγαλύτερη συχνότητα εμφάνισης (β) M N M Ομαδοποιημένα δεδομένα: το μέσο σημείο της ομάδας με την μεγαλύτερη συχνότητα 4. Μέσο εύρος (α) Μη ομαδοποιημένα δεδομένα: (β) Ομαδοποιημένα δεδομένα: 2 2 mi L U k x max i x i

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων ΠΟΣΟΣΤΙΑΙΑ ΣΗΜΕΙΑ Είναι τιμές μέχρι τις οποίες βρίσκονται ορισμένα ποσοστά του αριθμού των παρατηρήσεων. Τεταρτημόρια Είναι τιμές κάτω από τις οποίες βρίσκονται αντίστοιχα το 25%, το 50% και το 75% των παρατηρήσεων. Το δεύτερο τεταρτημόριο ταυτίζεται με τη διάμεσο 25% 25% 25% 25% Q Q 2 Q 3 2. Εκατοστιαία σημεία P, P 2,, P 99 είναι οι τιμές κάτω από τις οποίες βρίσκονται αντίστοιχα το %, το 2%,, το 99% των παρατηρήσεων

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων ΜΕΤΡΑ ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ-ΔΙΑΣΠΟΡΑΣ Δίνουν πληροφορίες σχετικά με τον βαθμό μεταβλητότητας ενός συνόλου δεδομένων. Μαζί με τα μέτρα θέσης παρέχουν σαφέστερη περιγραφή των παρατηρήσεων. Τα κυριότερα είναι το εύρος, η διακύμανση, η τυπική απόκλιση, ο συντελεστής μεταβλητότητας, η λοξότητα και η κύρτωση. Εύρος 2. Διακύμανση Χρησιμοποιεί τα τετράγωνα των αποκλίσεων από την μέση τιμή (α) Πληθυσμού-παράμετρος: (β) Δείγματος στατιστικό: (γ) Ομαδ/να δεδομένα N i x i N 2 2 i x i mi x max R ή X 2 2 2 2 x x x S i i i i i i 2 2 2 m f m f S i j j i j j

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων 3. Τυπική απόκλιση (α) Πληθυσμού-παράμετρος: 2 (β) Δείγματος στατιστικό: S S 2 4. Συντελεστής Μεταβλητότητας Είναι καθαρός αριθμός και εκφράζει την σχετική μεταβλητότητα των παρατηρήσεων ως προς την μέση τιμή. Χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τις μεταβλητότητες διαφόρων πληθυσμών ή δειγμάτων που εκφράζονται σε διαφορετικές μονάδες μέτρησης, είτε εκφράζονται στην ίδια μονάδα αλλά έχουν διαφορετικές μέσες τιμές (α) Πληθυσμού-παράμετρος: CV 00% (β) Δείγματος στατιστικό: S CV 00% X

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων 5. Λοξότητα (i) Μη ομαδοποιημένα δεδομένα (α) Πληθυσμού-παράμετρος: (β) Δείγματος στατιστικό: (ii) Ομαδοποιημένα δεδομένα 3 3 3 N i x i N a 3 3 3 X S x a N i i 3 3 3 X S m f a k j j j

Περιγραφική Στατιστική Αριθμητικά μέτρα Δεδομένων 6. Κύρτωση (i) Μη ομαδοποιημένα δεδομένα (α) Πληθυσμού-παράμετρος: (β) Δείγματος στατιστικό: (ii) Ομαδοποιημένα δεδομένα 4 4 4 N i x i N a 4 4 4 X S x a N i i 4 4 4 X S m f a k j j j

Αρχική Επεξεργασία Δεδομένων

Αρχική Επεξεργασία Δεδομένων Παραδείγματα Παράδειγμα Το 2006 η συνολική κατανάλωση ελαφριάς μπύρας (light) στις ΗΠΑ έφτασε τα 3 εκατομμύρια γαλόνια. Σε μια τόσο μεγάλη αγορά, οι παραγωγοί ενδιαφέρονται να γνωρίζουν τα χαρακτηριστικά των πελατών, και έτσι μια έρευνα κατέγραψε τις προτιμήσεις μεταξύ των φοιτητών που πίνουν ελαφριά μπύρα. Το δείγμα αποτελείται από 285 τελειόφοιτους φοιτητές και οι μάρκες μπύρας ήταν: Bud, Busch, Coors, Michelob, Miller, Natural, Άλλη. Καταγράφεται ακόμα και το φύλο του ερωτηθέντος.

Αρχική Επεξεργασία Δεδομένων Παράδειγμα Κωδικοποίηση Brad Bud 2 Busch 3 Coors 4 Michelob 5 Miller 6 Natural 7 Άλλη Geder Άνδρας 2 Γυναίκα

Αρχική Επεξεργασία Δεδομένων Παράδειγμα Τι μπορεί να μας ενδιαφέρει; Πως κατανέμονται (μοιράζονται) οι προτιμήσεις των φοιτητών; Ποιά μέτρα μπορούμε να χρησιμοποιήσουμε για να «δούμε» την κατανομή αυτή; Brad Συχνότητα Σχετική Συχνότητα (%) Bud 90 3,6 2 Busch 9 6,7 3 Coors 62 2,8 4 Michelob 3 4,6 5 Miller 59 20,7 6 Natural 25 8,8 7 Άλλη 7 6,0 Σύνολο 285 00 Άνδρες Brad Συχνότητα Σχετική Συχνότητα (%) Bud 42 28,6 2 Busch 0 6,8 3 Coors 38 25,9 4 Michelob 9 6, 5 Miller 23 5,6 6 Natural 2 8,2 7 Άλλη 3 8,8 Σύνολο 47 00 Γυναίκες Brad Συχνότητα Σχετική Συχνότητα (%) Bud 48 34,8 2 Busch 9 6,5 3 Coors 24 7,4 4 Michelob 4 2,9 5 Miller 36 26, 6 Natural 3 9,4 7 Άλλη 4 2,9 Σύνολο 38 00

Αρχική Επεξεργασία Δεδομένων Παράδειγμα Τι μπορεί να μας ενδιαφέρει; Μπορούμε να απεικονίσουμε γραφικά την κατανομή για να δώσουμε σε κάποιον μια εικόνα που να μπορεί να καταλάβει αντί για πίνακες με αριθμούς; 00 90 80 70 60 50 40 30 20 0 0 Bud Busch Συχνότητα Coors Michelob Miller Natural Άλλη 35,0 30,0 25,0 20,0 5,0 0,0 5,0 0,0 Bud Σχετική Συχνότητα (%) Busch Coors Michelob Miller Natural Άλλη 00,0 90,0 80,0 70,0 60,0 50,0 40,0 30,0 20,0 0,0 0,0 Σχετική Αθροιστική Συχνότητα (%) Bud Busch Coors Michelob Miller Natural Άλλη 45 40 35 30 25 20 5 0 5 0 Bud Busch Συχνότητα-Άνδρες Coors Michelob Miller Natural Άλλη 35,0 30,0 25,0 20,0 5,0 0,0 5,0 0,0 Bud Σχετική Συχνότητα (%)-Άνδρες Busch Coors Michelob Miller Natural Άλλη 00,0 80,0 60,0 40,0 20,0 0,0 Σχετική Αθροιστική Συχνότητα (%)- Άνδρες Bud Busch Coors Michelob Miller Natural Άλλη 45 40 35 30 25 20 5 0 5 0 Bud Busch Συχνότητα-Γυναίκες Coors Michelob Miller Natural Άλλη 35,0 30,0 25,0 20,0 5,0 0,0 5,0 0,0 Σχετική Συχνότητα (%)-Γυναίκες Bud Busch Coors Michelob Miller Natural Άλλη 00,0 80,0 60,0 40,0 20,0 0,0 Σχετική Αθροιστική Συχνότητα (%)- Γυναίκες Bud Busch Coors Michelob Miller Natural Άλλη

Αρχική Επεξεργασία Δεδομένων Παράδειγμα Τι μπορεί να μας ενδιαφέρει; Μπορούμε να απεικονίσουμε γραφικά την κατανομή για να δώσουμε σε κάποιον μια εικόνα που να μπορεί να καταλάβει αντί για πίνακες με αριθμούς; Σχετική Συχνότητα (%) Σχετική Συχνότητα (%)-Άνδρες Σχετική Συχνότητα (%)-Γυναίκες 8,8 6,0 3,6 Bud Busch Coors 8,2 8,8 28,6 Bud Busch Coors 9,4 2,9 34,8 Bud Busch Coors 20,7 4,6 2,8 6,7 Michelob Miller Natural Άλλη 5,6 6, 25,9 6,8 Michelob Miller Natural Άλλη 26, 2,9 7,4 6,5 Michelob Miller Natural Άλλη

Αρχική Επεξεργασία Δεδομένων Παραδείγματα Παράδειγμα 2 Με την απελευθέρωση των τηλεπικοινωνιών εμφανίστηκαν πολλές νέες εταιρίες τηλεφωνίας που ανταγωνίζονται για την προσέλκυση πελατών. Το πεδίο του ανταγωνισμού είναι σχεδόν οι φθηνότερες τιμές, επειδή οι παρεχόμενες υπηρεσίες δεν έχουν διαφοροποίηση. Ο καθορισμός της τιμής ενός προϊόντος ή μιας υπηρεσίας απέναντι στον τόσο σκληρό ανταγωνισμό είναι μια εξαιρετικά δύσκολή υπόθεση, που εξαρτάται από παράγοντες όπως η προσφορά και ζήτηση, η ελαστικότητα των τιμών και οι προσφορές των ανταγωνιστών. Η χρέωση των υπηρεσιών τηλεφωνίας μπορεί να γίνει με ένα σταθερό μηνιαίο πάγιο ή με χρονοχρέωση ή με συνδυασμό και των δυο. Η επιλογή της καταλληλότερης στρατηγικής διευκολύνεται από τη γνώση της συμπεριφοράς των καταναλωτών, και ιδιαίτερα από το ύψος των μηνιαίων λογαριασμών. Στα πλαίσια μιας ευρύτερης έρευνας, μια εταιρία τηλεφωνίας θέλησε να μάθει για το ύψος των μηνιαίων λογαριασμών νέων συνδρομητών κατά τον πρώτο μήνα μετά την εγγραφή τους. Το Τμήμα Πωλήσεων κατέγραψε τα ποσά του πρώτου μηνιαίου λογαριασμού ενός δείγματος 200 νέων συνδρομητών. Με ποιόν τρόπο πρέπει να παρουσιαστούν τα δεδομένα στην διοίκηση της εταιρίας έτσι ώστε να μπορούν να βγουν χρήσιμα συμπεράσματα;

Αρχική Επεξεργασία Δεδομένων Παράδειγμα 2 Πως μπορούμε να κατηγοριοποιήσουμε τα δεδομένα; Mi 0,00 Max 9,63 Class x<=5 5<x<=30 30<x<=45 45<x<=60 60<x<=75 75<x<=90 90<x<=05 05<x<=20 Class Συχνότητα x<=5 7 5<x<=30 37 30<x<=45 3 45<x<=60 9 60<x<=75 0 75<x<=90 8 90<x<=05 42 05<x<=20 4

Συχνότητα Αρχική Επεξεργασία Δεδομένων Παράδειγμα 2 Μπορούμε να απεικονίσουμε γραφικά την κατανομή για να δώσουμε στη διοίκηση μια εικόνα που να μπορεί να καταλάβει αντί για πίνακες με αριθμούς; 80 70 60 7 x<=5 5<x<=30 50 40 37 42 30<x<=45 45<x<=60 30 20 0 3 9 0 8 4 60<x<=75 75<x<=90 90<x<=05 05<x<=20 0 Bills

Αρχική Επεξεργασία Δεδομένων Παραδείγματα Παράδειγμα 3 Ας υποθέσουμε ότι ένα επενδυτής έχει δυο επιλογές μεταξύ των οποίων μπορεί να επιλέξει για να κάνει μια επένδυση ενός ποσού που έχει συγκεντρώσει. Για να επιλέξει μια από αυτές, ο επενδυτής βρίσκει όλες τις προηγούμενες αποδόσεις (%) των δυο επενδύσεων Επένδυση Α Επένδυση Β 30,00-5,83 8,47 22,92-5,29 30,33 8,29 39,04,53-0,0-2,3 0,63 36,08 20,95-7,04-30,37 6,00 24,76 7,6 35,24 4,30 38,00-2,95 43,7-2, -5,6-20,44 5,28,20 40,70 25,00 6,93 0,33-2,83 2,89 29,00-34,75 34,2 9,94 22,8 2,89-3,24 2,68 0,52 63,00-26,0 54,9 52,00-33,39 3,24-20,24-8,95 3,09 6,00-9,27 0,46 44,00-32,7 58,67 25,0,20 9,43 3,77 -,96-9,22 2,07-20,23 30,3 0,25-24,24-2,59,2 22,42,94-7,00 29,44 4,6 6,06 5,23-38,47 33,00 3,76 34,40 28,45 7,30,00 0,03 4,73 66,00 3,44 4,26,07 49,87-8,55 52,00-25,93 0,5 36,3 24,30 68,00 Από τα δεδομένα ο επενδυτής θέλει να μάθει ποιο είναι το αναμενόμενο ύψος της απόδοσης και ποιος είναι ο κίνδυνος για κάθε επένδυση

Αρχική Επεξεργασία Δεδομένων Παράδειγμα 3 Πως μπορούμε να κατηγοριοποιήσουμε τα δεδομένα; A B mi -2,95-38,47 max 63,00 68,00 Classes -45<x<=-30-30<x<=-5-5<x<=0 0<x<=5 5<x<=30 30<x<=45 45<x<=60 60<x<=75 Classes A B -45<x<=-30 0 5-30<x<=-5 6 5-5<x<=0 0 2 0<x<=5 7 6 5<x<=30 7 8 30<x<=45 6 8 45<x<=60 2 3 60<x<=75 2 3

Αρχική Επεξεργασία Δεδομένων Παράδειγμα 3 Μπορούμε να απεικονίσουμε γραφικά την κατανομή αντί για πίνακες με αριθμούς έτσι ώστε να μπορούν να βγουν χρήσιμα συμπεράσματα για το αναμενόμενο ύψος της απόδοσης αλλά και το ρίσκο; Οι κορυφές βρίσκονται στην ίδια κλάση αποδόσεων Η Β παρουσιάζει μεγαλύτερες αποδόσεις (μεγαλύτερη κατανομή στις μεγαλύτερες τιμές Η Β παρουσιάζει μεγαλύτερο ρίσκο (μεγαλύτερη κατανομή στις αρνητικές αποδόσεις) 8 6 4 2 0 8 6 4 2 0 Retur A 8 6 4 2 0 8 6 4 2 0 Retur B

Αρχική Επεξεργασία Δεδομένων Παραδείγματα Παράδειγμα 2 (επιστροφή) Με την απελευθέρωση των τηλεπικοινωνιών εμφανίστηκαν πολλές νέες εταιρίες τηλεφωνίας που ανταγωνίζονται για την προσέλκυση πελατών. Το πεδίο του ανταγωνισμού είναι σχεδόν οι φθηνότερες τιμές, επειδή οι παρεχόμενες υπηρεσίες δεν έχουν διαφοροποίηση. Ο καθορισμός της τιμής ενός προϊόντος ή μιας υπηρεσίας απέναντι στον τόσο σκληρό ανταγωνισμό είναι μια εξαιρετικά δύσκολή υπόθεση, που εξαρτάται από παράγοντες όπως η προσφορά και ζήτηση, η ελαστικότητα των τιμών και οι προσφορές των ανταγωνιστών. Η χρέωση των υπηρεσιών τηλεφωνίας μπορεί να γίνει με ένα σταθερό μηνιαίο πάγιο ή με χρονοχρέωση ή με συνδυασμό και των δυο. Η επιλογή της καταλληλότερης στρατηγικής διευκολύνεται από τη γνώση της συμπεριφοράς των καταναλωτών, και ιδιαίτερα από το ύψος των μηνιαίων λογαριασμών. Στα πλαίσια μιας ευρύτερης έρευνας, μια εταιρία τηλεφωνίας θέλησε να μάθει για το ύψος των μηνιαίων λογαριασμών νέων συνδρομητών κατά τον πρώτο μήνα μετά την εγγραφή τους. Το Τμήμα Πωλήσεων κατέγραψε τα ποσά του πρώτου μηνιαίου λογαριασμού ενός δείγματος 200 νέων συνδρομητών. Με ποιόν τρόπο μπορεί να μελετηθεί η «συμπεριφορά» των δεδομένων;

Αρχική Επεξεργασία Δεδομένων Παράδειγμα 2 (επ) Χρειαζόμαστε αριθμητικά μέτρα για το πώς κατανέμονται τα δεδομένα που έχουμε στη διάθεση μας Μέσος 43,59 Διάμεσος 26,9 Επικρατούσα Τιμή 0,00 Τυπική Απόκλιση 38,97 Διακύμανση 58,64 Κύρτωση -,29 Ασυμμετρία 0,54 Ελάχιστο 0,00 Μέγιστο 9,63 Εύρος 9,63 Άθροισμα 877,52 Πλήθος 200,00 ο Τεταρτημόριο 9,39 2ο Τεταρτημόριο 26,9 3ο Τεταρτημόριο 84,83 28-εκατοστημόριο 0,83

Αρχική Επεξεργασία Δεδομένων Παραδείγματα Παράδειγμα 4 Σε μια μεγάλη πόλη υπάρχουν 4 μεγάλες εφημερίδες που ανταγωνίζονται μεταξύ τους: Επικαιρότητα, Νέα της Ημέρας, Ενημέρωση, Ημερήσιος Τύπος. Για να σχεδιάσουν τη διαφημιστική τους πολιτική, τα Τμήματα Διαφήμισης κάθε εφημερίδας πρέπει να γνωρίζουν ποια τμήματα της αγοράς διαβάζουν την εφημερίδα τους. Για το λόγο αυτό πραγματοποιήθηκε μια έρευνα που θα εξετάσει τη σχέση μεταξύ επαγγέλματος και ανάγνωσης εφημερίδων. Ένα δείγμα αναγνωστών απάντησε το σχετικό ερωτηματολόγιο. Τα επαγγέλματα των ερωτηθέντων κατατάσσονται σε 3 μεγάλες κατηγορίες: Χειρονακτική Εργασία, Εργασία Γραφείου, Ελεύθερος Επαγγελματίας. Συνδέεται το επάγγελμα με την εφημερίδα που διαβάζουν οι ερωτηθέντες;

Αρχική Επεξεργασία Δεδομένων Παράδειγμα 4 Κωδικοποίηση Επεξεργασία Occupatio Χειρονακτική Εργασία Εργασία Γραφείου 2 Ελέυθερος Επαγγελαμτίας 3 Newspaper Επικαιρότητα Νέα της Ημέρας 2 Ενημέρωση 3 Ημερήσιος Τύπος 4 Πλήθος από Reader Newspaper Occupatio 2 3 4Γενικό άθροισμα 27 8 38 37 20 2 29 43 2 5 08 3 33 5 22 20 26 Γενικό άθροισμα 89 2 8 72 354 Πλήθος από Reader Newspaper Occupatio 2 3 4Γενικό άθροισμα 22,50% 5,00% 3,67% 30,83% 00,00% 2 26,85% 39,8% 9,44% 3,89% 00,00% 3 26,9% 40,48% 7,46% 5,87% 00,00% Γενικό άθροισμα 25,4% 3,64% 22,88% 20,34% 00,00% Παρόμοιες μεταξύ τους συχνότητες. Άρα οι υπάλληλοι γραφείου και οι ελεύθεροι επαγγελματίες διαβάζουν παρόμοιες εφημερίδες

Αρχική Επεξεργασία Δεδομένων Παράδειγμα 4 Απεικόνιση Αν δεν υπάρχει συσχέτιση μεταξύ των μεταβλητών, τότε θα πρέπει τα ραβδογράμματα να είναι κατά προσέγγιση όμοια. Όμως εδώ, τα ραβδογράμματα για τους υπαλλήλους γραφείου και τους ελεύθερους επαγγελματίες είναι παρόμοια και διαφέρουν σημαντικά από το ραβδόγραμμα αυτών που κάνουν χειρονακτική εργασία 60 45,00% 50 40,00% 35,00% 40 30 20 0 2 3 4 30,00% 25,00% 20,00% 5,00% 0,00% 5,00% 2 3 4 0 2 3 0,00% 2 3

Αρχική Επεξεργασία Δεδομένων Παραδείγματα Παράδειγμα 5 Ένα κτηματομεσιτικό γραφείο ενδιαφέρεται να μάθει σε ποιο βαθμό η τιμή πώλησης ενός σπιτιού εξαρτάται από το μέγεθός του. Για να αποκτήσει την πληροφορία αυτή χρησιμοποίησε ως δείγμα τα δεδομένα από τις 2 τελευταίες πωλήσεις που πραγματοποίησε. Size Price 23 35 8 229 26 355 20 26 22 234 4 26 33 308 28 306 23 289 20 204 27 265 8 95 Μπορούμε να περιγράψουμε τη σχέση μεταξύ των δύο μεταβλητών

Price Αρχική Επεξεργασία Δεδομένων Παράδειγμα 5 Απεικόνιση 400 350 300 250 200 50 00 50 0 0 5 0 5 20 25 30 35 Size