Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Σχετικά έγγραφα
Στατιστική Ι (ΨΥΧ-1202) ΑΣΚΗΣΕΙΣ

Διάλεξη 1 Βασικές έννοιες

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 1 Εισαγωγή

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 5

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 2

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Μάθηµα 3 ο. Περιγραφική Στατιστική

Εισαγωγή στη Στατιστική- Κοινωνικές Στατιστικές. Διάλεξη

Κεφάλαιο 5. Οι δείκτες διασποράς

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Μέτρα θέσης και διασποράς

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Εισαγωγή στη Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Κεφάλαιο 4. Οι είκτες Κεντρικής Τάσης. Είναι αριθµητικές τιµές που δείχνουν το ΚΕΝΤΡΟ της κατανοµής. Η εσπόζουσατιµή ( σπ) ΟΜέσοςΌρος(Μ.

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Μαθηματικά: Αριθμητική και Άλγεβρα. Μάθημα 7 ο, Τμήμα Α

Γ. Πειραματισμός - Βιομετρία

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Κεφάλαιο 5 Δείκτες Διασποράς

Στατιστική Επιχειρήσεων Ι

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Ιωάννης Σ. Μιχέλης Μαθηματικός

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

επ. Κωνσταντίνος Π. Χρήστου

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

i Σύνολα w = = = i v v i=

Εφαρμοσμένη Στατιστική


ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Περιγραφική Στατιστική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Εισόδημα Κατανάλωση

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

F x h F x f x h f x g x h g x h h h. lim lim lim f x

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

ΤΙ ΕΙΝΑΙ ΣΤΑΤΙΣΤΙΚΗ; Στατιστική είναι η διαδικασία εξαγωγής πληροφορίας από τα δεδομένα. Διαχείριση Πληροφοριών 1.1

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Mέτρα (παράμετροι) θέσεως

Εισαγωγή στη Στατιστική

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 2016 (version ) είναι: ( ) f =

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

f , Σύνολο 40 4) Να συμπληρώστε τον παρακάτω πίνακα f , , Σύνολο 5) Να συμπληρώστε τον παρακάτω πίνακα

Στατιστική Ι Ασκήσεις 3

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Transcript:

(ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο, 06-03-2013

Σημαντική Υπενθύμιση: εν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα Όλες οι διαλέξεις είναι αναρτημένες στο: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3/ 2

Θυμηθείτε Τι είναι τα στατιστικά μοντέλα και γιατί τα χρειαζόμαστε? Στην ψυχολογία και γενικότερα στις κοινωνικές επιστήμες μας ενδιαφέρει να ανακαλύψουμε κάτι για ένα φαινόμενο, το οποίο υποθέτουμε ότι υπάρχει. Κατασκευάζουμε Μοντέλα του φαινόμενου σε μια προσπάθεια μας να ερμηνεύσουμε ή να προβλέψουμε πως λειτουργεί το φαινόμενο που μας ενδιαφέρει κάτω από διαφορετικές συνθήκες. Επιπλέον επιθυμούμε το μοντέλο μας θέλουμε να έχει όσο το δυνατόν καλύτερη προσαρμογή στα δεδομένα τα οποία έχουμε συλλέξει στην προσπάθεια μας να το περιγράψουμε. ιάλεξη 3/ 3

Θυμηθείτε Ο μέσος όρος ως παράδειγμα ενός απλού στατιστικού μοντέλου Ο μέσος όρος είναι στην ουσία ένα απλό μοντέλο. Αποτελεί μια σύνοψη των δεδομένων μας. Είναι μια υποθετική τιμή, η οποία μπορεί να υπολογιστεί για κάθε σύνολο δεδομένων αλλά δεν είναι απαραίτητο να υπάρχει στα δεδομένα μας. Για παράδειγμα υποθέστε ότι ρωτάμε 5 φοιτητές να μας πουν τον αριθμό των «κολλητών» που έχουν. Τα δεδομένα μας μπορεί να είναι ως εξής: 1, 2, 3, 3 και 4. Στην περίπτωση αυτή ο Μ.Ο = (1+2+3+3+4)/5 = 2,6 Είναι μάλλον αδύνατο να έχουμε 2,6 φίλους. Επομένως η τιμή του Μ.Ο. είναι μια υποθετική τιμή. Υπό την έννοια αυτή ο Μ.Ο. αποτελεί ένα μοντέλο που κατασκευάσαμε προκειμένου να περιγράψουμε κατά τρόπο συνοπτικό τα δεδομένα μας. ιάλεξη 3/ 4

Αφού κατασκευάσουμε το μοντέλο μας, το επόμενο στάδιο είναι να εξετάσουμε πόσο καλά το μοντέλο περιγράφει τα δεδομένα μας. Με άλλα λόγια εξετάζουμε την προσαρμογή του μοντέλου στα δεδομένα μας. ιάλεξη 3/ 5

Εξετάζοντας την προσαρμογή του Μ.Ο. στα δεδομένα μας Μπορούμε να εξετάσουμε τη διαφορά που υπάρχει ανάμεσα δεδομένα που έχουμε συλλέξει και στο μοντέλο που έχουμε κατασκευάσει. μ.ο.=2,6 Από το προηγούμενο παράδειγμα για τους φοιτητές τα δεδομένα ήταν ως εξής: ο 1 ος φοιτητής είχε 1 «κολλητό», ο 2 ος είχε 2 κολλητούς κτλ., 3, 3 και 4. Στην περίπτωση αυτή ο Μ.Ο «κολλητών» = (1+2+3+3+4)/5 = 2,6 Αριθμός φίλων Οι κάθετες γραμμές αποτελούν «το λάθος στο μοντέλου» ή αλλιώς απόκλιση d (deviation) Φοιτητής ιάλεξη 3/ 6

Για τον 1 ο φοιτητή που έχει ένα μόνο κολλητό, η διαφορά ανάμεσα στο μοντέλο και τα δεδομένα είναι αρνητική. Τι σημαίνει αυτό? Αριθμός φίλων Σημαίνει ότι το μοντέλο μας υπερεκτιμά την ποσότητα που μας ενδιαφέρει. Ενώ το μοντέλο μας αναφέρει ότι κάθε φοιτητής έχει 2,6 «κολλητούς» ο φοιτητής νο. 1 στην πραγματικότητα έχει μόνο ένα κολλητό. Φοιτητής Για το φοιτητή νο. 5 το μοντέλο υποτιμά την ποσότητα που εξετάζουμε. ιάλεξη 3/ 7

Στη συνέχεια μπορούμε να χρησιμοποιήσουμε τις διαφορές που υπάρχουν ανάμεσα στο μοντέλο και στα δεδομένα μας ώστε να εξετάσουμε την ακρίβεια του μοντέλου. Ένας τρόπος μπορεί να είναι να προσθέσουμε όλες τις διαφορές δηλ. τις αποκλίσεις, ανάμεσα στο μοντέλο και στα δεδομένα ώστε να προσδιορίσουμε το ολικό σφάλμα (ολική απόκλιση): Ολικό σφάλμα = άθροισμα των αποκλίσεων = ιάλεξη 3/ 8

Δηλαδή αφού το άθροισμα των αποκλίσεων είναι μηδέν τότε ο μ.ο. αναπαριστά τέλεια τα δεδομένα μας?? Ολικό σφάλμα = άθροισμα των διαφορών = ιάλεξη 3/ 9

Δεν είναι ακριβώς έτσι γιατί αν προσέξετε κάποια σφάλματα είναι θετικά και κάποια είναι αρνητικά, οπότε αναιρούνται μεταξύ τους, με αποτέλεσμα να προκύπτει ότι το ολικό σφάλμα είναι μηδέν. Οπότε θα πρέπει να βρούμε μια μέθοδο μέσω της οποία να παρακάμπτουμε την κατεύθυνση στην οποία βρίσκεται το σφάλμα δηλ. το πρόσημο της απόκλισης ιάλεξη 3/ 10

Για να ξεπεράσουμε το προηγούμενο πρόβλημα, δηλ. της κατεύθυνσης (θετικής ή αρνητικής) του σφάλματος, χρησιμοποιούμε ένα μαθηματικό τρικ, πολλαπλασιάζοντας κάθε λάθος με τον εαυτό του (ή αλλιώς το τετραγωνίζουμε). Άθροισμα των τετραγώνων των αποκλίσεων (SS) Όμως το άθροισμα των τετραγώνων των αποκλίσεων εξαρτάται από το πλήθος των δεδομένων που έχουμε συλλέξει: όσο μεγαλύτερο το πλήθος τόσο μεγαλύτερο και το άθροισμα των τετραγώνων των αποκλίσεων. Για να ξεπεράσουμε αυτό το πρόβλημα διαιρούμε το άθροισμα των τετραγώνων των αποκλίσεων με τον αριθμό των παρατηρήσεων μας (Ν). ιάλεξη 3/ 11

ΠΡΟΣΟΧΗ: Αν μας ενδιαφέρει να εκτιμήσουμε μόνο το λάθος για το δείγμα μας, τότε διαιρούμε με τον αριθμό των παρατηρήσεων μας δηλ. το Ν. Αν όμως (και συνήθως αυτό συμβαίνει), μας ενδιαφέρει να χρησιμοποιήσουμε το λάθος από το δείγμα, σε επίπεδο πληθυσμού, τότε διαιρούμε με το Ν-1 (το γιατί έχει να κάνει με την έννοια των βαθμών ελευθερίας και θα την εξετάσουμε σε επόμενα μαθήματα) = ιακύμανση (variance, s 2 ) H διακύμανση, δηλ. ο μέσος όρος των τετραγώνων των αποκλίσεων όλων των τιμών, αποτελεί στην ουσία το μέσο σφάλμα ανάμεσα στο μέσο όρο και στις παρατηρήσεις που έχουμε. Επομένως μπορεί να θεωρηθεί ένα μέτρο της προσαρμογής του μοντέλου μας στα δεδομένα. ιάλεξη 3/ 12

Η διακύμανση όμως παρουσιάζει ένα μειονέκτημα. Το μειονέκτημα της διακύμανσης είναι ότι μας δίνει ένα μέτρο για την προσαρμογή του μοντέλου μας δηλ. του μέσου όρου, το οποίο είναι σε μονάδες στο τετράγωνο. Οπότε για το παράδειγμα μας θα λέγαμε ότι το μέσο λάθος στα δεδομένα μας είναι 1,3 φίλοι στο τετράγωνο. Για να το αντιμετωπίσουμε και αυτό το πρόβλημα, παίρνουμε την τετραγωνική ρίζα της διακύμανσης και διασφαλίζουμε έτσι ότι το μέσο λάθος είναι στην ίδια μονάδα μέτρησης με τις αρχικές μας μετρήσεις = Τυπική απόκλιση (standard deviation, s) ιάλεξη 3/ 13

Επομένως η τυπική απόκλιση είναι ένα μέτρο του πόσο καλή είναι η προσαρμογή του μέσου όρου στα δεδομένα. Μικρές τιμές (σε σχέση με το μ.ο. ) δείχνουν ότι τα δεδομένα μας είναι κοντά στο μ.ο. Μεγάλες τιμές της τυπικής απόκλισης (σε σχέση με το μ.ο.) δείχνουν ότι τα δεδομένα μας βρίσκονται μακριά από το μ.ο. ή αλλιώς ότι ο μ.ο. δεν αναπαριστά με ακρίβεια τα δεδομένα μας. ιάλεξη 3/ 14

Συνοπτικά, ο μέσος όρος είναι το πιο απλό μαθηματικό μοντέλο που μπορεί να προσαρμοστεί στα δεδομένα μας, ενώ η διακύμανση και η τυπική απόκλιση αποτελούν μέτρα της προσαρμογής του μοντέλου στα δεδομένα. ιάλεξη 3/ 15

Γιατί ο μέσος όρος είναι ένα απλό μαθηματικό μοντέλο? Γιατί είναι μια υποθετική τιμή (θυμηθείτε το παράδειγμα με τους 2,6 φίλους) που κατασκευάζουμε προκειμένου να περιγράψουμε τα δεδομένα μας. Επιπλέον με το μ.ο είναι δυνατόν να προβλέψουμε την πιθανή τιμή μιας μεταβλητής για ένα άτομο (αν δεν έχουμε άλλα δεδομένα), αφού το σφάλμα από το μ.ο. είναι ή θα είναι γενικά μικρότερο από μια απλή τυχαία πρόβλεψη. ιάλεξη 3/ 16

Τα παρακάτω σχεδιαγράμματα δείχνουν τη συνολική βαθμολογία (σε πενταβάθμια κλίμακα) δύο καθηγητών σχετικά με τη ελκυστικότητα των παραδόσεων τους σε πέντε διαλέξεις. Και οι δύο έχουν ένα μέσο όρο 2,6. Για ποιον από τους δύο ο μέσος όρος είναι αντιπροσωπευτικός των αξιολογήσεων? ιάλεξη 3/ 17

Η τυπική απόκλιση μας δίνει επίσης πληροφορία για το σχήμα της κατανομής των τιμών της μεταβλητής που μελετάμε. Μικρές τιμές της Τ.Α. έχουν σαν αποτέλεσμα οι τιμές της μεταβλητής να βρίσκονται κοντά στο μ.ο. Μ.Ο. = 60 Τυπική απόκλιση = 20 Μ.Ο. = 60 Τυπική απόκλιση = 40 ιάλεξη 3/ 18

Έστω ότι έχουμε 2 πληθυσμούς ατόμων στην Κρήτη με το ίδιο μέγεθος (8.000 άτομα). Ο πληθυσμός 1, περιλαμβάνει όλους τους φοιτητές στο Ρέθυμνο. Ο πληθυσμός 2, περιλαμβάνει όλους τους κατοίκους μιας μικρής κωμόπολης στο Ρέθυμνο. Σε ποιον πληθυσμό είναι πιο πιθανό να έχουμε μεγαλύτερη τυπική απόκλιση (Τ.Α.) όσο αφορά τη μεταβλητή «ηλικία»? Α. Ο πληθ. 1 είναι πιο πιθανό να έχει μεγαλύτερη (Τ.Α.) από τον πληθ. 2. Β. Ο πληθ. 2 είναι πιο πιθανό να έχει μεγαλύτερη (Τ.Α.) από τον πληθ. 1 Γ. Αφού έχουν το ίδιο πλήθος ατόμων θα έχουν την ίδια (Τ.Α.). εν έχουμε επαρκείς πληροφορίες για να πούμε ιάλεξη 3/ 19

Σε ένα δήμο της Κρήτης, ο δήμαρχος θέλει να εκτιμήσει τον μέσο αριθμό παιδιών ανά νοικοκυριό, που υπάρχουν σε ένα χωριό του δήμου του. ιαιρεί λοιπόν το συνολικό αριθμό των παιδιών στο χωριό με το 50, το συνολικό αριθμό νοικοκυριών του χωριού. Ποια από τις παρακάτω προτάσεις είναι αληθινή, αν υπάρχουν κατά μέσο όρο 2,2 παιδιά ανά νοικοκυριό? Α. Τα μισά νοικοκυριά έχουν περισσότερα από 2 παιδιά Β. Υπάρχουν συνολικά 110 παιδιά στο χωριό Γ. Ο πιο συνιθισμένος αριθμός παιδιών ανά νοικοκυριό είναι 2,2. Καμία από τις παραπάνω προτάσεις δεν είναι αληθινή ιάλεξη 3/ 20

Το τυπικό σφάλμα (standard error) (ή ποσό αντιπροσωπευτικό είναι το δείγμα μας ) Από τα προηγούμενα μαθήματα γνωρίζουμε ότι στην ψυχολογία παίρνουμε τυχαία δείγματα από κάποιον πληθυσμό (στον οποίο δεν έχουμε πρόσβαση) για να εξηγήσουμε φαινόμενα σε επίπεδο πληθυσμού. Είδαμε ότι μπορούμε να περιγράψουμε το δείγμα μας με το μ.ο. και με την τυπική απόκλιση εξετάζουμε την προσαρμογή του μ.ο. στα δεδομένα του δείγματος. Γνωρίσουμε επίσης ότι κάθε δείγμα που παίρνουμε από τον πληθυσμό μας είναι ένα από τα άπειρα δείγματα που μπορούμε να πάρουμε (θυμηθείτε τη δειγματοληπτική κατανομή) Το επόμενο βήμα είναι να εξετάσουμε κατά πόσο το δείγμα που πήραμε είναι αντιπροσωπευτικό του πληθυσμού μας. ιάλεξη 3/ 21

Συνεχίζοντας το παράδειγμα με την αξιολόγηση των καθηγητών, ας υποθέσουμε ότι από όλο τον πληθυσμό των καθηγητών παίρνουμε 5 δείγματα με κάθε ένα από αυτά να περιλαμβάνει 5 καθηγητές ΕΙΓΜΑΤΑ Μ.Ο. ΕΙΓΜΑΤΟΣ Μ.Ο. ΟΛΩΝ ΤΩΝ ΕΙΓΜΑΤΩΝ ιάλεξη 3/ 22

Υπολογίζοντας την τυπική απόκλιση για κάθε δείγμα μπορούμε να έχουμε μια εκτίμηση της απόκλισης που υπάρχει στα δείγματα μας. Αυτό ακριβώς είναι το τυπικό σφάλμα. Με άλλα λόγια το τυπικό σφάλμα είναι η τυπική απόκλιση της δειγματοληπτικής κατανομής (που είδαμε στο προηγούμενο μάθημα) και μας δίνει μια εκτίμηση του πόσο αντιπροσωπευτικό είναι το δείγμα μας. Τυπικό σφάλμα Τυπική απόκλιση δείγματος s X N Αριθμός ατόμων δείγματος ιάλεξη 3/ 23

υο λόγια για τα γραμμικά μοντέλα Linear models Σας τρέλανε ο Λεωνίδας με το μέσο όρο ως απλό στατιστικό μοντέλο. Ο μ.ο. δεν είναι το μοναδικό στατιστικό μοντέλο που θα συναντήσετε. Να θυμάστε ότι σχεδόν όλα σχεδόν τα μοντέλα που θα συναντήσετε αποτελούν παραλλαγές του λεγόμενου γραμμικού μοντέλου. ιάλεξη 3/ 24

Η έννοια γραμμικός, αναφέρεται σε κάτι που έχει σχέση με τις γραμμές. Στη στατιστική όμως η έννοια αναφέρεται στην ευθεία γραμμή. Με άλλα λόγια γραμμικό είναι το μοντέλο το οποίο είναι βασισμένο σε μια ευθεία γραμμή. Αυτό σημαίνει ότι προσπαθούμε να περιγράψουμε (συνοψίσουμε) τα δεδομένα μας με όρους μιας ευθείας γραμμής. Στην ψυχολογία τα περισσότερα μοντέλα που χρησιμοποιούμε είναι γραμμικά. ιάλεξη 3/ 25

O μέσος όρος, η εσπόζουσα τιμή (mode), και η ιάμεσος (median) ανήκουν στους λεγόμενους δείκτες κεντρικής τάσης (central tendency measures) και χρησιμοποιούνται για να δείξουν το κέντρο μιας σειράς δεδομένων (κατανομής). Η τυπική απόκλιση, το Ενδοτεταρτημοριακό εύρος (interquartile range) και το Εύρος (range) και ανήκουν στους λεγόμενους δείκτες διασποράς και χρησιμοποιούνται για να δείξουν τη διακύμανση των τιμών μιας σειράς δεδομένων (κατανομής). ιάλεξη 3/ 26

είκτες κεντρικής τάσης η εσπόζουσα τιμή (mode)=η τιμή με τη μεγαλύτερη συχνότητα π.χ. Συλλέγουμε δεδομένα τα οποία τα βάζουμε αριθμητικά σε σειρά: Υπολογίζουμε τη συχνότητα δηλαδή πόσες φορές εμφανίζεται η κάθε τιμή : η εσπόζουσα τιμή είναι η τιμή που συναντάται τις περισσότερες φορές (το 9) ιάλεξη 3/ 27

Πλεονεκτήματα Μειονεκτήματα Είναι η μόνη που μπορεί να χρησιμοποιηθεί σε ονομαστικά δεδομένα Μπορεί να έχουμε περισσότερες από μια δεσπόζουσες τιμές στα δεδομένα μας Μένει ανεπηρέαστη από ακραίες τιμές εν μπορεί να χρησιμοποιηθεί για να υπολογιστούν παράμετροι του πληθυσμού ιάλεξη 3/ 28

η ιάμεσος (median)= η τιμή στο μέσο του συνόλου των δεδομένων μας, αν αυτά είναι ιεραρχημένα π.χ. Συλλέγουμε δεδομένα τα οποία τα ιεραρχoούμε (αρχίζοντας από τη μικρότερη τιμή): επιλέγουμε την τιμή (ή τιμές) που βρίσκεται στη μεσαία θέση των τιμών Αν έχουμε ζυγό αριθμό τιμών τότε η διάμεσος είναι ο μέσος όρος των 2 μεσαίων τιμών: ιάλεξη 3/ 29

Αν έχουμε μονό αριθμό τιμών τότε η διάμεσος: ιάμεσος Τιμές: 18 25 21 4 13 15 28 17 22 Ιεραρχημένες Τιμές: 4 13 15 17 18 21 22 25 28 Θέση Ταξινόμησης: 1 2 3 4 5 6 7 8 9 Μεσαία Θέση ιάλεξη 3/ 30

Πλεονεκτήματα Μειονεκτήματα εν επηρεάζεται από τις ακραίες τιμές Μπορεί να χρησιμοποιηθεί σε όλους τους τύπους δεδομένων πλην των κατηγορικών Είναι πολύ πιθανό να διαφέρει ανάμεσα σε δείγματα από τον ίδιο πληθυσμό Λιγότερο χρήσιμη από το μ.ο. ιάλεξη 3/ 31

Μέσος όρος = το πηλίκο του συνόλου των τιμών μιας σειράς δεδομένων με τον αριθμό των ατόμων που συμμετέχουν σε αυτή π.χ. Συλλέγουμε δεδομένα Τα προσθέτουμε Μέσος όρος = ιάλεξη 3/ 32

Πλεονεκτήματα Μειονεκτήματα Είναι εύκολος στον υπολογισμό του Είναι ευαίσθητος στις τιμές των δεδομένων της κατανομής (πχ μια αλλαγή σε οποιαδήποτε τιμή αλλάζει το μ.ο.) Αντικατοπτρίζει πιο πιστά την κεντρική τιμή της κατανομής σε σχέση με τους άλλους δείκτες Μπορεί να χρησιμοποιηθεί για τον υπολογισμό των παραμέτρων του πληθυσμού (παραμετρικά τεστ) Επειδή υπολογίζεται αλγεβρικά, η τιμή του είναι πιθανό να μην ανήκει στις τιμές της κατανομής Είναι πολύ ευαίσθητος στις ακραίες τιμές ιάλεξη 3/ 33

είκτες διασποράς το Εύρος,L (range) =η διαφορά μεταξύ μέγιστης και ελάχιστης τιμής στα δεδομένα μας π.χ. Συλλέγουμε δεδομένα: το Εύρος = 10-2 = 8 ιάλεξη 3/ 34

Πλεονεκτήματα: Είναι πολύ εύκολο στον υπολογισμό του Περιλαμβάνει και τις ακραίες τιμές της κατανομής Μειονεκτήματα: Αλλοιώνεται από τις ακραίες τιμές με αποτέλεσμα, σε πολλές περιπτώσεις, να μην παρουσιάζει μια αντιπροσωπευτική εικόνα της διασποράς της κατανομής Χρησιμοποιεί μόνο δύο τιμές και ως αποτέλεσμα δεν μας λέει τίποτε για το τι συμβαίνει ανάμεσα στις μεταβλητές ιάλεξη 3/ 35

το Ενδοτεταρτημοριακό εύρος (interquartile range) =Το εύρος του κεντρικού 50% των τιμών μιας κατανομής π.χ. Συλλέγουμε δεδομένα και τα ταξινομούμε ιεραρχικά: ιαιρούμε το σύνολο των τιμών με το 4: = 12 τιμές / 4 = 3 Αφαιρούμε τόσες τιμές από την αρχή και το τέλος όσο είναι ο αριθμός που βρήκαμε δηλ. το 3 το Ενδοτεταρτημοριακό εύρος= 9-3=6 ιάλεξη 3/ 36

Τι είναι το τεταρτημόριο στο «ενδοτεταρτημοριακό»? Τα σημεία που χωρίζουν το σύνολο των τιμών μας σε 4 ίσα τμήματα 1ο τεταρτημόριο (κάτω από το οποίο βρίσκεται το 25% των τιμών) 2ο τεταρτημόριο (κάτω από το οποίο βρίσκεται το 50% των τιμών) 3ο τεταρτημόριο (κάτω από το οποίο βρίσκεται το 75% των τιμών) ιάλεξη 3/ 37

Για την παρακάτω γραφική παράσταση ποιες είναι οι πιο πιθανές τιμές του μέσου όρου και της διαμέσου? Α. Μ.Ο. = 12 και διάμεσος = 13 Β. Μ.Ο. = 15 και διάμεσος = 14 Γ. Μ.Ο. = 14,3 και διάμεσος = 16. Μ.Ο. = 16,2 και διάμεσος = 16,5 ιάλεξη 3/ 38

Περιγραφική & Επαγωγική Στατιστική Μέθοδοι επεξεργασίας των δεδομένων μας Περιγραφική Στατιστική: Περιλαμβάνει μια σειρά από μεθόδους με τη βοήθεια των οποίων απλά οργανώνουμε και περιγράφουμε τα δεδομένα μας, ώστε να είναι ευκολότερη η ανάγνωση της ιστορίας που έχουν να μας πουν. Επαγωγική Στατιστική: Περιλαμβάνει μια σειρά από μεθόδους με τη βοήθεια των οποίων εξάγουμε συμπεράσματα από τα δεδομένα του δείγματα μας, για τον πληθυσμό μας. ιάλεξη 3/ 39

Τετάρτη: 12-03-2013 ιάλεξη 3/ 40

ιάλεξη 3/ 41