Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σχετικά έγγραφα
Σ ΤΑΤ Ι Σ Τ Ι Κ Η MBA I

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

1 ο ΜΑΘΗΜΑ Εισαγωγή στη Στατιστική

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Ποσοτική & Ποιοτική Ανάλυση εδομένων Βασικές Έννοιες. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

Εφαρμοσμένη Στατιστική

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΣΚΗΣΕΙΣ Γ.Π. ΚΕΦ 1,2,3

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

F x h F x f x h f x g x h g x h h h. lim lim lim f x

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Εισαγωγή στη Στατιστική

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΗΥ-SPSS Statistical Package for Social Sciences 1 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα

Ασκήσεις Άλγεβρας. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. B ΓΥΜΝΑΣΙΟΥ Άλγεβρα 265 ασκήσεις και τεχνικές σε 24 σελίδες. εκδόσεις. Καλό πήξιμο

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

ΔΙΑΓΩΝΙΣΜΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ. Ύλη: Συναρτήσεις-Στατιστική Θέμα 1 o : Α. i. Να διατυπώσετε το κριτήριο μονοτονίας. (5 μον.)

Μαθηματικά & Στοιχεία Στατιστικής Γενικής Παιδείας για την Γ Λυκείου. Αν έχετε κάνει σωστά τους υπολογισμούς σας, μεταφοράς ενός

Στατιστική. Βασικές έννοιες

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Περιγραφική Στατιστική

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 2

Θέμα Α. Θέμα Β. ~ 1/9 ~ Πέτρος Μάρκου. % σχεδιάζουμε το πολύγωνο αθροιστικών σχετικών συχνοτήτων τοις

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Συλλογή και παρουσίαση στατιστικών δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Ποσοτική & Ποιοτική Ανάλυση εδοµένων Βασικές Έννοιες. Παιδαγωγικό Τµήµα ηµοτικής Εκπαίδευσης ηµοκρίτειο Πανεπιστήµιο Θράκης Αλεξανδρούπολη

1 x-μ - 2 σ. e σ 2π. f(x) =

4.4 ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

δεδομένων με συντελεστές στάθμισης (βαρύτητας)

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Η Κανονική Κατανομή. Κανονικές Κατανομές με την ίδια διασπορά και διαφορετικές μέσες τιμές.

Εφαρμοσμένη Στατιστική

Ιωάννης Σ. Μιχέλης Μαθηματικός

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΚΕΦΑΛΑΙΟ. 1. α. Tι ονοµάζεται συνάρτηση από το σύνολο Α στο σύνολο Β; β. Tι ονοµάζεται πραγµατική συνάρτηση πραγµατικής µεταβλητής;

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Στατιστικοί πίνακες. Δημιουργία κλάσεων

Λύσεις θεμάτων επαναληπτικών πανελληνίων εξετάσεων 2014 Στο μάθημα: «Μαθηματικά και Στοιχεία Στατιστικής» Γενικής Παιδείας ΗΜΕΡΗΣΙΑ ΓΕ.Λ.

ΘΕΜΑ Α Α1. Για οποιαδήποτε ασυμβίβαστα μεταξύ τους ενδεχόμενα Α και Β ενός δειγματικού χώρου Ω, με απλά ισοπίθανα ενδεχόμενα, να αποδείξετε ότι:

ΔΙΑΓΩΝΙΣΜΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ ΛΥΚΕΙΟΥ ( ΘΕΡΙΝΑ )

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Transcript:

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Τι κάνει η Στατιστική

Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες φορές, με την χρήση και την επεξεργασία ενός μοναδικού δείγματος. Παρέχει μεθόδους για τη συνοπτική παρουσίαση των αριθμητικών δεδομένων. Βοηθά στην εξαγωγή αξιόπιστων συμπερασμάτων. Οδηγεί σε ασφαλείς προβλέψεις που αφορούν τις επιχειρηματικές δραστηριότητες. Συμβάλλει στη λήψη αποφάσεων για τη βελτίωση των επιχειρηματικών διαδικασιών. 3

Οι δύο κύριοι κλάδοι της Στατιστικής Περιγραφική (Descriptive) Το σύνολο των μεθόδων που χρησιμοποιούμε για την οργάνωση, την παρουσίαση και την ανάλυση ενός συνόλου δεδομένων. Επαγωγική (Inferential) Το σύνολο των μεθόδων που χρησιμοποιούμε, ώστε από τα δεδομένα μιας μικρής ομάδας να εξάγουμε συμπεράσματα για μια μεγαλύτερη ομάδα. 4

Το βασικό λεξιλόγιο της Στατιστικής

Μεταβλητή (Variable) Κάθε χαρακτηριστικό ενός αντικειμένου ή ενός ατόμου. Δεδομένα (Data) Οι τιμές που καταγράφονται για μία μεταβλητή. Οι μεταβλητές είναι τα χαρακτηριστικά των ατόμων ή των αντικειμένων τα οποία ενδιαφερόμαστε να μελετήσουμε. Διαφοροποιούνται από άτομο σε άτομο, από αντικείμενο σε αντικείμενο, από περιοχή σε περιοχή ή αλλάζουν με το πέρασμα του χρόνου. Οι τιμές που συλλέγουμε όταν παρατηρούμε τα αντικείμενα αποτελούν τα δεδομένα της μεταβλητής ή, με άλλα λόγια, τα δεδομένα που πρόκειται να αναλυθούν. 6

Πληθυσμός (Population) Το σύνολο όλων των οντοτήτων που επιθυμούμε να μελετήσουμε ως προς ένα ή περισσότερα χαρακτηριστικά του. Δείγμα (sample) Μέρος του πληθυσμού που επιλέγεται για την ανάλυση. Δείγμα Πληθυσμός στόχος 7

Παράμετρος πληθυσμού (parameter) Μέτρο, που περιγράφει (συνοψίζει) κάποιο χαρακτηριστικό του πληθυσμού. Η αριθμητική του τιμή υπολογίζεται από το σύνολο του πληθυσμού και είναι μοναδική. Στατιστικό ή στατιστική δείγματος (statistic) Μέτρο, που περιγράφει (συνοψίζει) κάποιο χαρακτηριστικό του δείγματος. Η αριθμητική του τιμή υπολογίζεται από το δείγμα. Διαφορετικά δείγματα αποδίδουν, κατά κανόνα, διαφορετική τιμή σε ένα στατιστικό. 8

Παράμετρος vs. Στατιστικό Πληθυσμός Δείγμα 1 Στην παλέτα υπάρχουν 100 χάρτινες καρδούλες, 20 από τις οποίες είναι καφέ. Επομένως, στον πληθυσμό, η αναλογία για τις καφέ καρδούλες είναι 20 0,20 100 Η αναλογία π στον πληθυσμό είναι μία παράμετρος του πληθυσμού. Στο δείγμα, η αναλογία για τις καφέ καρδούλες είναι 2 p1 0,18 11 Η αναλογία p στο δείγμα, είναι ένα στατιστικό δείγματος. Η τιμή του στατιστικού p1 = 0,18 που υπολογίζεται από το δείγμα, είναι μία εκτίμηση της αντίστοιχης παραμέτρου π στον πληθυσμό. 9

Παράμετρος Στατιστικό Εκτίμηση Ας υποθέσουμε ότι από τον προηγούμενο πληθυσμό (παλέτα) επιλέγουμε ένα δεύτερο δείγμα. Πληθυσμός Δείγμα 2 Η τιμή της αναλογίας π στον πληθυσμό, για τις καφέ καρδούλες, παραμένει ίδια. Παρατηρούμε όμως, ότι η τιμή της αναλογίας p στο δείγμα είναι διαφορετική. 3 p2 0,21 14 Η τιμή p2 = 0,21 είναι επίσης μία εκτίμηση της παραμέτρου π. Η τιμή μιας παραμέτρου είναι μοναδική, αλλά συνήθως άγνωστη. Η τιμή ενός στατιστικού είναι διαφορετική από δείγμα σε δείγμα. Η τιμή ενός στατιστικού είναι μια εκτίμηση της πραγματικής, αλλά συνήθως άγνωστης τιμής, της αντίστοιχης παραμέτρου στον πληθυσμό. Διαφορετικά δείγματα δίνουν διαφορετικές εκτιμήσεις για την ίδια παράμετρο. Η στατιστική εγγυάται ότι, όποιο και αν είναι το δείγμα που θα επιλέξουμε, η τιμή του στατιστικού θα είναι η βέλτιστη εκτίμηση της παραμέτρου. 10

Είδη Μεταβλητών Κλίμακες Μέτρησης

Είδη μεταβλητών Ποσοτικές (Quantitative) ή Αριθμητικές (Numerical) Αντιστοιχούν στα χαρακτηριστικά που μπορούν να μετρηθούν, με την κοινή έννοια του όρου. Κατηγορικές (Categorical) ή Ποιοτικές (qualitative) Καταγράφουν κάποιο ποιοτικό (μη μετρήσιμο) χαρακτηριστικό. Τιμή μεταβλητής Το αποτέλεσμα που προκύπτει από τη μέτρηση ή την καταγραφή της. 12

Ποσοτικές μεταβλητές Διακριτές (discrete) Τιμές από αριθμήσιμο σύνολο (πεπερασμένο ή άπειρο) Χ: Το πλήθος των μαθημάτων που μπορεί να δηλώσει ένας φοιτητής. Τιμές από το σύνολο {1, 2,.,8} Υ: Το πλήθος των αυτοκινήτων που παιρνούν από μία διαστάυρωση σε μία ημέρα. Τιμές από το σύνολο {0, 1, 2,.} Συνεχείς (continuous) Τιμές από ένα διάστημα πραγματικών αριθμών. T: Η διάρκεια λειτουργίας ενός ηλεκτρικού λαμπτήρα ( σε h) Τιμές στο διάστημα (0, 10.000) Η τιμή που καταγράφουμε όταν μετρούμε μία συνεχή μεταβλητή είναι, τις περισσότερες φορές, μία προσέγγιση της πραγματικής τιμής η οποία εξερτάται από την ακρίβεια του οργάνου μέτρησης. 13

Ποιοτικές μεταβλητές Ονομαστικές (nominal) Οι τιμές τους είναι λέξεις, δηλαδή «χαρακτηρισμοί» ή «ετικέτες», και μεταξύ τους δεν υπάρχει καμιά σχέση ιεραρχίας. W: Το χρώμα των μαλλιών Τιμές από το σύνολο {ξανθό, καστανό, μαύρο} Διατακτικές (ordinal) Οι τιμές τους είναι και πάλι λέξεις, αλλά μεταξύ τους υπάρχει ιεραρχία. Q: Ποιότητα διαμονής σε ένα τουριστικό θέρετρο. Τιμές από το σύνολο {κακή, μέτρια, καλή, εξαιρετική} και μεταξύ των χρωμάτων δεν έχει νόημα να θεωρήσουμε κάποια ιεραρχία. και η ιεραχία μεταξύ των χαρακτηρισμών έχει νόημα. 14

Οργάνωση και παρουσίαση ποσοτικών δεδομένων (ομαδοποίηση)

Τίποτα καλύτερο από ένα παράδειγμα. Κάναμε μια έρευνα, για να μελετήσουμε το ύψος της ατομικής δαπάνης (έξοδα μετακίνησης, καφέδες, τσιγάρα, κ.λ.π.) των εργαζομένων. Για το σκοπό αυτό, ρωτήσαμε 45 εργαζόμενους και πήραμε τις παρακάτω απαντήσεις. 3,7 6,7 4,4 6,2 4,1 6,0 5,1 5,3 2,8 5,3 5,3 1,4 5,4 7,5 3,0 6,6 1,1 4,7 1,6 1,7 4,4 5,5 3,0 9,4 6,5 1,4 5,5 5,4 5,8 6,8 4,2 6,0 2,4 6,1 5,6 6,8 5,6 5,8 6,0 7,4 2,5 6,2 3,9 4,7 3,1 Μπορείτε, κοιτάζοντας τα παραπάνω δεδομένα, να πείτε κάτι για την ατομική δαπάνη των εργαζομένων; Μάλλον, όχι. Χρειαζόμαστε μια «οργανωμένη» παρουσίαση των δεδομένων και αυτή, στην περίπτωση των ποσοτικών δεδομένων, λέγεται ομαδοποίηση. 16

Πίνακας συχνοτήτων Ατομική Δαπάνη /ημέρα [ ) Κέντρο Συχνότητα Αθροιστική xi fi Συχνότητα Σχετική Συχνότητα % Σχετική Αθροιστική Συχνότητα % 1,0 2,5 1,75 6 6 13,33 13,33 2,5 4,0 3,25 7 13 15,56 28,89 4,0 5,5 4,75 12 25 26,67 55,56 5,5 7,0 6,25 17 42 37,78 93,33 7,0 8.5 7,75 2 44 4,44 97,78 8,5 10 9,25 1 45 2,22 100,00 ΣΥΝΟΛΑ n = 45 100,00 12 από τους 45 εργαζόμενους δαπανούν 4 έως 5,5 /ημέρα. 26,67% των εργαζομένων που ρωτήθηκαν, δαπανούν 4 έως 5,5 /ημέρα. 55,56% των εργαζομένων που ρωτήθηκαν, δαπανούν λιγότερα από 5,5 /ημέρα. 100 55,56 = 44,44% των εργαζομένων που ρωτήθηκαν, δαπανούν 5,5 έως 10 /ημέρα. 17

Σχετική Συχνότητα % Ιστόγραμμα Σχετικών Συχνοτήτων 40 35 37,78 30 25 26,67 20 15 10 13,33 15,56 5 4,44 2,22 0 1,0 2,5 2,5 4,0 4,0 5,5 5,5 7,0 7,0 8.5 8,5 10 Ατομική Δαπάνη ( /ημέρα) Κατασκευάζεται από τη στήλη των % σχετικών συχνοτήτων του πίνακα συχνοτήτων. Επομένως, μας δίνει τις ίδιες πληροφορίες. Αναπαριστά τον τρόπο με τον οποίο οι τιμές της μεταβλητής στο δείγμα κατανέμονται στις κλάσεις. Το ιστόγραμμα που κατασκευάζεται από το δείγμα είναι ένα «αποτύπωμα», μια «ακτινογραφία» του πληθυσμού, είναι το «παράθυρο μας στον κόσμο». 18

Σχετική Αθροιστική Συχνότητα % Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων 100 90 80 70 60 50 40 30 20 10 0 93,33 97,78 100 55,56 28,89 13,33 1,0 2,5 2,5 4,0 4,0 5,5 5,5 7,0 7,0 8.5 8,5 10 Ατομική Δαπάνη ( /ημέρα) Κατασκευάζεται από τη στήλη των % σχετικών αθροιστικών συχνοτήτων του πίνακα συχνοτήτων. Επομένως, μας δίνει τις ίδιες πληροφορίες. Αναπαριστά τον τρόπο, την «ταχύτητα» με τον οποίο οι τιμές της μεταβλητής στο δείγμα συσσωρεύονται σταδιακά στις κλάσεις. 19

Συνεχείς Τυχαίες Μεταβλητές Ιστογράμματα και Πολύγωνα Συναρτήσεις Κατανομής

Πίνακας Συχνοτήτων για το βάρος των παραγόμενων απορριμάτων στις 28 χώρες της Ευρωπαϊκής Ένωσης, το 2013. (ΠΗΓΗ: EUROSTAT) Βάρος παραγόμενων απορριμάτων Kgr/κεφαλή [ ) Κέντρο Συχνότητα Αθροιστική xi fi Συχνότητα Σχετική Συχνότητα % Σχετική Αθροιστική Συχνότητα % 250 350 300 6 6 21,43 21,43 350 450 400 8 14 28,57 50,00 450 550 500 7 21 25,00 75,00 550 650 600 5 26 17,86 92,86 650 750 700 2 28 7,14 100 ΣΥΝΟΛΑ n = 28 100,00 ΜΕΤΑΒΛΗΤΗ ΠΛΗΘΥΣΜΟΣ Χ: Το βάρος των παραγόμενων απορριμάτων (Kgr/κεφαλή) Οι 28 χώρες της Ευρωπαϊκής Ένωσης 21

Σχετική Συχνότητα (%) Το ιστόγραμμα των συχνοτήτων (frequency histogram) απεικονίζει το σχήμα, τη μορφή της κατανομής. Για ισοπλατείς κλάσεις, και λαμβάνοντας ως μονάδα μέτρησης το εύρος τους, το ύψος ενός ορθογωνίων είναι ίσο με τη συχνότητα της αντίστοιχης κλάσης. Το συνολικό εμβαδό των ορθογωνίων είναι 1 (ή 100). 30,00 25,00 20,00 15,00 10,00 21,43 28,57 25,00 17,86 5,00 7,14 0,00 ΠΗΓΗ: EUROSTAT 250-350 350-450 450-550 550-650 650-750 Βάρος παραγόμενων απορριμάτων (Kgr/κεφαλή) Παρατηρούμε την αυξημένη συγκέντρωση τιμών στις κλάσεις 350 450 και 450 550. Η κατανομή εμφανίζει μία μόνον κορυφή. Φαίνεται επίσης να μην είναι συμμετρική, καθώς οι παρατητήσεις εκτείνονται προς τα δεξιά περισσότερο απ ότι προς τα αριστερά. 22

Σχετική Συχνότητα (%) Το πολύγωνο των συχνοτήτων (frequency polygon) μας επιτρέπει να κατανοήσουμε το σχήμα της κατανομής. Είναι ιδιαίτερα χρήσιμο όταν θέλουμε να συγκρίνουμε σύνολα δεδομένων. 30,00 28,57 25,00 25,00 20,00 15,00 21,43 17,86 10,00 7,14 5,00 0,00 ΠΗΓΗ: EUROSTAT 300 400 500 600 700 Βάρος παραγόμενων απορριμάτων (Kgr/κεφαλή) Στο πολύγωνο των συχνοτήτων τα κέντρα των κλάσεων χρησιμοποιούνται ως «αντιπρόσωποι» των κλάσεων και, μαζί με δύο υποθετικά κέντρα μηδενικής συχνότητας στα αριστερά της πρώτης κλάσης και στα δεξιά της τελευταίας κλάσης, συνδέονται με ευθύγραμμα τμήματα, σχηματίζοντας το πολύγωνο των συχνοτήτων. 23

Κάτω από το πολύγωνο των συχνοτήτων Χωρίζουμε τώρα το πολύγωνο σε τραπέζια και δύο ορθογώνια τρίγωνα. Το εμβαδό καθενός από αυτά τα χωρία, χρησιμοποιώντας πάντα ως μονάδα μέτρησης το εύρος των κλάσεων, είναι μια εκτίμηση του ποσοστού συγκέντρωσης (της πυκνότητας) των τιμών της μεταβλητής στην αντίστοιχη κλάση. Το άθροισμα όλων των εμβαδών είναι ίσο με 1 (ή 100%). Στο 26,785 % περίπου, των χωρών της Ε.Ε. το βάρος των παραγόμενων απορριμάτων είναι 400 500 Kgr/κεφαλή. 24

Σχετική Συχνότητα (%) Συνάρτηση Κατανομής ( ή Πυκνότητας) Πιθανότητας Probability Distribution (Density) Function 30,00 f(x) 25,00 20,00 15,00 10,00 5,00 0,00 250 300 400 500 600 700 750 ΠΗΓΗ: -5,00 ΕΛΣΤΑΤ Βάρος παραγόμενων απορριμάτων (Kgr/κεφαλή) Τέλος, πάνω στο πολύγωνο συχνοτήτων μιας συνεχούς μεταβλητής προσαρμόζουμε μια λεία καμπύλη. Αυτή η καμπύλη δεν είναι τίποτα άλλο παρά η γραφική παράσταση μιας συνάρτης f(x). Μια τέτοια συνάρτηση ονομάζεται συνάρτηση κατανομής πιθανότητας (probability distribution function) ή συνάρτηση πυκνότητας πιθανότητας (probability density function) της συνεχούς τυχαίας μεταβλητής Χ. 25

Συναρτήσεις πυκνότητας και υπολογισμός πιθανοτήτων Είδαμε παραπάνω πώς, χρησιμοποιώντας το πολύγωνο των συχνοτήτων, μπορούμε να υπολογίσουμε (για την ακρίβεια να εκτιμήσουμε) το ποσοστό των τιμών της μεταβλητής που συγκεντρώνονται σε κάθε μια από τις κλάσεις που έχουμε ορίσει. Αυτό το ίδιο ποσοστό, είναι ταυτόχρονα και μία εκτίμηση της πιθανότητας η μεταβλητής μας να παίρνει τιμή στο συγκεκριμένο διάστημα. Για παράδειγμα, η πρόταση «Στο 26,785 % περίπου, των χωρών της Ε.Ε. το βάρος των παραγόμενων απορριμάτων είναι από 400 500 Kgr/κεφαλή» είναι ισοδύναμη με την πρόταση «Η πιθανότητα για μια χώρα της Ε.Ε. το βάρος των παραγόμενων απορριμάτων να είναι 400 500 Kgr/κεφαλή, εκτιμάται σε 0,26785 (ή 26,785%). Το μειονέκτημα με το πολύγωνο των συχνοτήτων είναι ότι δεν μπορούμε να δώσουμε εύκολα τις απαντήσεις για κάθε διάστημα, αλλά μόνον για τα διαστήματα που ορίζονται από τις κλάσεις. Πώς λοιπόν μπορούμε να απαντήσουμε στην ερώτηση «Ποιά η πιθανότητα για μια χώρα της Ε.Ε., το βάρος των παραγόμενων απορριμάτων να είναι 520 630 Kgr/ κεφαλή;» 26

Συναρτήσεις πυκνότητας και υπολογισμός πιθανοτήτων f f x x A 630 520 630 P X A f x dx 520 Η ζητούμενη πιθανότητα, υπολογίζεται από το εμβαδόν του χωρίου Α που ορίζεται από τη γραφική παράσταση της συνάρτησης πυκνότητας f(x), τον οριζόντιο άξονα και τα κάθετα ευθύγραμμα τμήματα στα σημεία 520 και 630. Έτσι, το πρόβλημα ανάγεται στον υπολογισμό ενός ορισμένου ολοκληρώματος, δηλαδή 630 520 630 P X A f x dx 520 27

Ιδιότητες των συναρτήσεων πυκνότητας πιθανότητας Οι συναρτήσεις πυκνότητας πιθανότητας που περιγράφουν την κατανομή μιας συνεχούς τυχαίας μεταβλητής έχουν τις παρακάτω ιδιότητες. 1) Το συνολικό εμβαδόν κάτω από μία καμπύλη πυκνότητας πιθανότητας είναι ίσο με 1. Δηλαδή f x dx 1 E 1 f x 2) Μια συνάρτηση πυκνότητας πιθανότητας παίρνει μόνον μη αρνητικές τιμές, και επομένως η γραφική της παράσταση βρίσκεται πάνω από τον οριζόντιο άξονα. Δηλαδή f x 0 28

Υπολογισμός πιθανοτήτων από τη συνάρτηση πυκνότητας 1) Για μια συνεχή τυχαία μεταβλητή Χ, η πιθανότητα να πάρει ακριβώς μία συγκεκριμένη τιμή είναι 0,δηλαδή a 0 P X 2) Η πιθανότητα να έχει τιμές σε ένα διάστημα (α, b), υπολογίζεται από το εμβαδόν κάτω από την καμπύλη της πυκνότητας που ορίζεται από τα άκρα του διαστήματος, δηλαδή b P a X b f x dx a f x 3) Η πιθανότητα να έχει τιμές μικρότερες από έναν έναν αριθμό α, υπολογίζεται από το εμβαδόν κάτω από την καμπύλη της πυκνότητας στα αριστερά του α, δηλαδή P X a f x dx a f x α 29

Σετική Αθροιστική Συχν τητα ( % ) Το ιστόγραμμα των αθροιστικών συχνοτήτων (cumulative percentage histogram) μας δείχνει τον τρόπο με τον οποίο συγκεντρώνονται οι τιμές της μεταβλητής. 100,00 100,00 90,00 92,86 80,00 70,00 75,00 60,00 50,00 50,00 40,00 30,00 20,00 21,43 10,00 0,00 ΠΗΓΗ: EUROSTAT 250 350 450 550 650 750 Βάρος παραγόμενων απορριμάτων (Kgr/κεφαλή) Παρατηρούμε ότι ήδη μέχρι την την δεύτερη κλάση έχει συγκεντρωθεί το 50% των τιμών της μεταβλητής. Αυτό σημαίνει ότι στο 50% του δείγματος οι τιμές της μεταβλητής είναι μικρότρες από το άνω άκρο της δεύτερης κλάσης. Επομένως, για το έτος 2013 στις μισές χώρες της Ε.Ε. το βάρος των παραγόμενων απορριμάτων ήταν μικρότερο από 450 Kgr/ κεφαλή. 30

Σχετική Αθροιστική Συχνότητα ( % ) Το πολύγωνο των αθροιστικών συχνοτήτων (cumulative percentage polygon ή ogive) μας δίνει τις ίδιες πληροφορίες με το ιστόγραμμα των αθροιστικών συχνοτήτων. Επίσης, χρησιμεύει όταν θέλουμε να συγκρίνουμε σύνολα δεδομένων 100,00 90,00 80,00 70,00 60,00 75,00 92,86 100,00 50,00 50,00 40,00 30,00 20,00 21,43 10,00 0,00 ΠΗΓΗ: EUROSTAT 250 350 450 550 650 750 Βάρος παραγόμενων απορριμάτων (Kgr/κεφαλή) Για την κατασκευή του χρησιμοποιούμε τα άνω δεξιά άκρα των κλάσεων και το κάτω αριστερό άκρο της πρώτης κλάσης, τα οποία συνδέονται με εθύγραμμα τμήματα. Μεγάλη κλίση ενός τμήματος φανερώνει αυξημένη και απότομη συγκέντρωση τιμών στην κλάση που ορίζεται από τα άκρα του. 31

Η χρησιμότητα της αθροιστικής συνάρτησης κατανομής F(600)=0.85 F 250 350 450 550 600 650 750 ΠΗΓΗ: EUROSTAT Βάρος παραγόμενων απορριμάτων (Kgr/κεφαλή) Η συνάρτηση αθροιστικής κατανομής μας επιτρέπει να υπολογίσουμε την πιθανότητα η μεταβλητής μας να παίρνει τιμές μικρότερες ή ίσες από έναν δοσμένο αριθμό. Για παράδειγμα, η πιθανότητα για μια χώρα της Ε.Ε. το βάρος των παραγόμενων απορριμάτων να είναι το πολύ 600 Kgr/ είναι F P X 600 600 0.85 32

Υπολογισμός πιθανοτήτων από την αθροιστική συνάρτηση κατανομής. F(b) F (x) F(b) F(α) F(α) α b x 1) Για μια συνεχή τυχαία μεταβλητή, η πιθανότητα να έχει τιμές μικρότερες ή ίσες ενός αριθμού α, υπολογίζεται από την τιμή της αθροιστικής συνάρτησης κατανομής στο α, δηλαδή P X a F a 2) Η πιθανότητα να έχει τιμές σε ένα διάστημα (α, b) υπολογίζεται από τη διαφορά των τιμών της αθροιστικής συνάρτησης στα άκρα του διαστήματος, δηλαδή P a x b F b F a 33