Εισαγωγή στη Στατιστική



Σχετικά έγγραφα
Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Γνωριμία με τον προγραμματισμό μέσω της γλώσσας R Στοιχεία Περιγραφικής Στατιστικής

Μάθηµα 3 ο. Περιγραφική Στατιστική

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Περιγραφική Στατιστική

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Εφαρμοσμένη Στατιστική

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Εισαγωγή στη Στατιστική- Κοινωνικές Στατιστικές. Διάλεξη

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Βιοστατιστική ΒΙΟ-309

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Βιοστατιστική ΒΙΟ-309

Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής. Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας

Έτος : Διάλεξη 2 η Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Βιοστατιστική ΒΙΟ-309

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Περιγραφική Στατιστική

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΤΟΥ ΔΙΔΑΚΤΙΚΟΥ ΕΡΓΟΥ ΤΩΝ ΥΠΟΧΡΕΩΤΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΧΕΙΜΕΡΙΝΟΥ ΕΞΑΜΗΝΟΥ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

I2. Αριθμητικά περιγραφικά μέτρα

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 2016 (version ) είναι: ( ) f =

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Κεφάλαιο 5. Οι δείκτες διασποράς

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Δρ. Ευστρατία Μούρτου

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Σ Τ Α Τ Ι Σ Τ Ι Κ Η Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Στατιστική Επιχειρήσεων Ι

ΚΕΦΑΛΑΙΟ 2 ΔΙΕΥΘΥΝΣΗ ΔΕΥΤΕΡΟΒΑΘΜΙΑΣ ΕΚΠΑΙΔΕΥΣΗΣ ΝΟΜΟΥ ΧΑΝΙΩΝ ΣΧΟΛΙΚΟ ΕΤΟΣ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕ ΑΡΙΘΜΗΤΙΚΕΣ ΚΑΙ ΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΥΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Ποσοτική & Ποιοτική Ανάλυση εδομένων Βασικές Έννοιες. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Περιγραφική Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

πολύ συχνά συναντάμε στατιστική και στατιστική πληροφορία. Για παράδειγμα:

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Labels Values Missing Values Columns, Align Measure

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

i Σύνολα w = = = i v v i=

Ενδεικτικές ασκήσεις ΔΙΠ 50

Συναρτήσεις. Ορισμός Συνάρτησης

Εφαρμοσμένη Στατιστική

Transcript:

Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο.

Περιεχόμενα Εισαγωγή στη Στατιστική Επιδημιολογικές Μελέτες Περιγραφική Στατιστική Στατιστική Συμπερασματολογία Ένα Δείγμα Δύο Ανεξάρτητα Δείγματα Δείγματα κατά Ζεύγη Ποσοστά Έλεγχος καλής προσαρμογής Πίνακες Συνάφειας 2 2 Ανάλυση Παλινδρόμησης Ανάλυση Διασποράς Περιγραφική Στατιστική 2 Δημήτρης Φουσκάκης

Εισαγωγή Ας υποθέσουμε ότι έχουμε ένα ερευνητικό ερώτημα που αφορά στο αποτέλεσμα ενός τυχαίου πειράματος, και έχουμε συλλέξει με τυχαίο τρόπο δεδομένα, τα οποία θα μας βοηθήσουν να ποσοτικοποιήσουμε την αβεβαιότητά μας. Μεταφέρουμε τα δεδομένα στον Η/Υ και με τρόπους που θα δείτε στο εργαστήριο διαβάζουμε τα δεδομένα στο SPSS. Στις εν λόγω σημειώσεις χρησιμοποιούμε το SPSS Statistics 17.0. Περιγραφική Στατιστική 3 Δημήτρης Φουσκάκης

Εισαγωγή Τα δεδομένα τις περισσότερες φορές τα αναπαριστούμε με την βοήθεια ενός n p πίνακα, του οποίου οι γραμμές αποτελούν τα αποτελέσματα που προέκυψαν από μια μονάδα του δείγματος και οι στήλες τις μεταβλητές (χαρακτηριστικά του πληθυσμού) για τις οποίες ενδιαφερόμαστε. Άρα έχουμε πληροφορία για p μεταβλητές για n μονάδες του πληθυσμού (δείγμα). Περιγραφική Στατιστική 4 Δημήτρης Φουσκάκης

Κωδικοποίηση Αρκετές φορές κωδικοποιούμε τις μεταβλητές ειδικά αν αυτές είναι κατηγορικές. Πρέπει να είμαστε όμως προσεκτικοί. Ειδικά αν η μεταβλητή είναι ονομαστική, είναι λάθος να αντικαταστήσουμε τις κατηγορίες με αριθμητικές τιμές διότι έτσι οι κατηγορίες αποκτούν προσδιορισμένη σχέση και διάταξη. Αντίθετα δεν υπάρχει τόσο μεγάλο πρόβλημα αν η μεταβλητή είναι διατάξιμη. Το μόνο ερωτηματικό σε τέτοιου είδους κωδικοποιήσεις είναι αν υπάρχει συμφωνία μεταξύ των αποστάσεων των κατηγοριών της διατάξιμης μεταβλητής και της διακριτής μεταβλητής που την αντικαθιστά. Τέλος δεν υπάρχει κανένα πρόβλημα όταν κωδικοποιούμε μια δίτιμη μεταβλητή. Περιγραφική Στατιστική 5 Δημήτρης Φουσκάκης

Ακραίες, Αγνοούμενες και Εσφαλμένες Τιμές Είναι αρκετά σημαντικό προτού ξεκινήσουμε οποιαδήποτε Στατιστική Ανάλυση να ελέγξουμε τα δεδομένα μας για τυχόν λάθη ή παραλήψεις, να κάνουμε δηλαδή διερευνητική ανάλυση δεδομένων (Exploratory Data Analysis). Με την βοήθεια απλών περιγραφικών πινάκων ή γραφημάτων (όπως θα τα δούμε παρακάτω) μπορούμε να εντοπίσουμε προβληματικές τιμές ή και μονάδες του δείγματος. Περιγραφική Στατιστική 6 Δημήτρης Φουσκάκης

Ακραίες, Αγνοούμενες και Εσφαλμένες Τιμές Αρκετά συχνά παρατηρούμε ότι κάποια ή κάποιες τιμές μιας συγκεκριμένης μεταβλητής είναι ακραίες (outliers), απομακρυσμένες δηλαδή από τις υπόλοιπες τιμές της εν λόγω μεταβλητής. Τέτοιες τιμές δεν πρέπει να τις αντιμετωπίζουμε ως λανθασμένες, παρά μόνο αν είμαστε σίγουροι ότι πράγματι είναι. Ένας τρόπος να μειώσουμε την επιρροή αυτών των τιμών στα τελικά μας αποτελέσματα είναι με την χρήση κατάλληλων στατιστικών τεχνικών ή με κάποιον μετασχηματισμό των δεδομένων. Περιγραφική Στατιστική 7 Δημήτρης Φουσκάκης

Ακραίες, Αγνοούμενες και Εσφαλμένες Τιμές Αρκετά συχνά επίσης ερχόμαστε αντιμέτωποι με αγνοούμενες τιμές (missing values), δηλαδή με κάποιες μονάδες του δείγματος που έχουνε ελλιπή πληροφορία μιας και απουσιάζουν οι τιμές κάποιων μεταβλητών. Συχνά προσπαθούμε να εκτιμήσουμε την αγνοούμενη τιμή με την βοήθεια των υπόλοιπων τιμών. Σε μία τέτοια λύση θα πρέπει να καταλήγουμε μόνο αν το δείγμα μας είναι πολύ μικρό και δεν έχουμε την πολυτέλεια να χάσουμε επιπλέον πληροφορία λόγω των αγνοούμενων τιμών. Από το Variable View του Data Editor του SPSS μπορείτε να εισάγετε το σύμβολο που επιθυμείτε εσείς, το οποίο θα δηλώνει τις αγνοούμενες τιμές που ίσως έχετε στην εν λόγω μεταβλητή. Περιγραφική Στατιστική 8 Δημήτρης Φουσκάκης

Ακραίες, Αγνοούμενες και Εσφαλμένες Τιμές Περιγραφική Στατιστική 9 Δημήτρης Φουσκάκης

Ακραίες, Αγνοούμενες και Εσφαλμένες Τιμές Τέλος υπάρχουν περιπτώσεις που με βεβαιότητα αντιλαμβανόμαστε ότι μια τιμή είναι εσφαλμένη. Σε αυτές τις περιπτώσεις πρέπει να ελέγξουμε αν το λάθος προήλθε από την μεταφορά των δεδομένων στον Η/Υ και ρωτάμε αυτόν που σύλλεξε το δείγμα αν γνωρίζει την σωστή τιμή. Αν δεν μάθουμε την σωστή τιμή αντικαθιστούμε την εσφαλμένη τιμή με μια αγνοούμενη. Συνηθισμένα λάθη που γίνονται κατά την μεταφορά των δεδομένων στον Η/Υ είναι η αντιστροφή ψηφίων, και οι διπλοεγγραφές. Περιγραφική Στατιστική 10 Δημήτρης Φουσκάκης

Περιγραφική Στατιστική Σκοπός της Περιγραφικής Στατιστικής είναι να δώσει μια συνοπτική παρουσίαση του δείγματος, καθώς επίσης και να ελέγξει την ορθότητα των τιμών του. Αποτελείται από διάφορες Αριθμητικές και Γραφικές Μεθόδους. Η επιλογή των κατάλληλων αριθμητικών και γραφικών μεθόδων γίνεται με βάση τον τύπο της μεταβλητής που θέλουμε να παρουσιάσουμε. Περιγραφική Στατιστική 11 Δημήτρης Φουσκάκης

Περιγραφική Στατιστική Περιγραφική Στατιστική Αριθμητικές Μέθοδοι Γραφικές Μέθοδοι Μέτρα Θέσης Μέτρα Μεταβλητότητας Περιγραφική Στατιστική 12 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές A. Αριθμητικές Μέθοδοι. 1. Μέτρα Θέσης: 1. Δειγματικός Μέσος (Mean). Ο Δειγματικός μέσος είναι το συνηθέστερο μέτρο θέσης για παρατηρήσεις από μια ποσοτική μεταβλητή. Έχει το μειονέκτημα όμως ότι επηρεάζεται από ακραίες παρατηρήσεις. n 1 x = x n i = 1 i Περιγραφική Στατιστική 13 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές 2. Δειγματική Διάμεσος (Median). Η μεσαία παρατήρηση από το δείγμα είναι η δειγματική διάμεσος. Αν το μέγεθος του δείγματος είναι n=2m-1 (περιττό) τότε η δειγματική διάμεσος ισούται με y m, όπου y 1,,y n είναι το διατεταγμένο δείγμα. Όταν n=2m (άρτιο) τότε η δειγματική διάμεσος ισούται με (y m + y m+1 )/2. Έχει το πλεονέκτημα ότι δεν επηρεάζεται από ακραίες παρατηρήσεις. 3. Δειγματική Κορυφή (Mode). Η παρατήρηση με την μεγαλύτερη συχνότητα. Ως μέτρο έχει νόημα να υπολογιστεί σε περιπτώσεις όπου έχουμε επαναλήψεις ίδιων τιμών, γεγονός που συνήθως συμβαίνει μόνο για διακριτά δεδομένα. 2. Μέτρα Μεταβλητότητας: 1. Δειγματική Διασπορά Τυπική Απόκλιση (Variance Standard Deviation). Για να εκφράσουμε πόσο μακριά είναι οι παρατηρήσεις από τον δειγματικό μέσο συνήθως υπολογίζουμε την δειγματική διασπορά s 2 ή την θετική τετραγωνική της ρίζα που καλείτε δειγματική τυπική απόκλιση s. Έχει το μειονέκτημα ότι επηρεάζεται από ακραίες παρατηρήσεις. n s = (n 1) (x x) 2 1 2 1 i Περιγραφική Στατιστική 14 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές 2. Εύρος Δείγματος (Range). Η διαφορά μεταξύ της μεγαλύτερης και μικρότερης παρατήρησης. Προφανώς επηρεάζεται από ακραίες παρατηρήσεις. 3. Ενδοτεταρτημοριακό Εύρος (interquartile range - IQR). Η διαφορά του τρίτου από το πρώτο τεταρτημόριο. Το τρίτο τεταρτημόριο (3 rd quartile) είναι η παρατήρηση εκείνη που είναι μεγαλύτερη ή ίση από το 75% ακριβώς των παρατηρήσεων ενώ το πρώτο τεταρτημόριο (1 st quartile) είναι η παρατήρηση εκείνη που είναι μεγαλύτερη ή ίση από το 25% ακριβώς των παρατηρήσεων. Το ενδοτεταρτημοριακό εύρος έχει το πλεονέκτημα ότι δεν επηρεάζεται από ακραίες παρατηρήσεις. Περιγραφική Στατιστική 15 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Παράδειγμα 1: Τα δεδομένα που βλέπεται εκφράζουν το βάρος (σε gr.) 20 αρρένων νεογνών σε ιδιωτικό νοσοκομείο στο San Diego, California. 3265 3260 3245 3484 4146 3323 3649 3200 3031 2069 2581 2841 3609 2838 3541 2759 3248 3314 3101 2834 Περιγραφική Στατιστική 16 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 17 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 18 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές μέγεθος δείγματος εύρος δείγματος μέγιστη τιμή δείγματος δειγματική διασπορά ελάχιστη τιμή δείγματος δειγματική τυπική απόκλιση δειγματικός μέσος Περιγραφική Στατιστική 19 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 20 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές δειγματική διάμεσος πρώτο τεταρτημόριο τρίτο τεταρτημόριο IQR = 3443,75 2838,75 = 605 Περιγραφική Στατιστική 21 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές B. Γραφικές Μέθοδοι. 1. Ιστόγραμμα. Για την κατασκευή ενός ιστογράμματος συχνοτήτων, χρειάζεται να ομαδοποιήσουμε τα δεδομένα μας, και εν συνεχεία να σχηματίσουμε διαδοχικά ορθογώνια των οποίων οι βάσεις είναι τα διαστήματα των κλάσεων που δημιουργήσαμε και το ύψος τους είναι ίσο με την συχνότητα των παρατηρήσεων στην αντίστοιχη κλάση. Στις περισσότερες περιπτώσεις, δημιουργούμε κλάσεις ίδιου εύρους οπότε τα ορθογώνια έχουν τότε εμβαδά ανάλογα των αντίστοιχων συχνοτήτων. Περιγραφική Στατιστική 22 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 23 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 24 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές 2. Θηκογράφημα (box plot). Για να παρουσιάσουμε τα κυριότερα χαρακτηριστικά μιας κατανομής συνήθως δημιουργούμε ένα θηκογράφημα. Για την κατασκευή του δημιουργούμε ένα ορθογώνιο με κάτω βάση στο πρώτο και άνω βάση στο τρίτο τεταρτημόριο. Εν συνεχεία παριστάνουμε την διάμεσο με ένα ευθύγραμμο τμήμα μέσα στο ορθογώνιο. Έπειτα φέρουμε ευθύγραμμα τμήματα στις 2 οριακές τιμές που ορίζονται ως το 3 0 (αντίστοιχα 1 ο ) τεταρτημόριο συν (αντίστοιχα μείον) 1.5 φορές το ενδοτεταρτημοριακό εύρος. Αν δεν υπάρχουν παρατηρήσεις τόσο μακριά, οι γραμμές τοποθετούνται πιο κοντά στο 1 ο και 3 ο τεταρτημόριο. Τέλος πιο ακραίες τιμές (αν υπάρχουν) παριστάνονται με μια κουκκίδα. Περιγραφική Στατιστική 25 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 26 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές 1 η οριακή τιμή 1 ο τεταρτημόριο Δειγματική διάμεσος 3 ο τεταρτημόριο 3 η οριακή τιμή Περιγραφική Στατιστική 27 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Τα θηκογραφήματα είναι χρήσιμα για να συγκρίνουμε δύο δείγματα. Έστω ότι επιπλέον με τα δεδομένα του 1 ου παραδείγματος έχουμε και το βάρος (σε gr.) 20 θηλέων νεογνών στο ίδιο ιδιωτικό νοσοκομείο στο San Diego, California. 3257 3328 2576 2753 3262 3658 2836 3245 3236 3205 3601 3305 3478 3023 2842 3105 4153 2066 3541 2838 Περιγραφική Στατιστική 28 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 29 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 30 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 31 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Ισοδύναμα θα μπορούσαμε να είχαμε θεωρήσει ότι έχουμε μία ποσοτική μεταβλητή (βάρος νεογνών) και μία κατηγορική μεταβλητή (φύλο) και θέλουμε να συγκρίνουμε τις τιμές της ποσοτικής μεταβλητής ανά κατηγορία της κατηγορικής μεταβλητής. Περιγραφική Στατιστική 32 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 33 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 34 Δημήτρης Φουσκάκης

Ποσοτικές Μεταβλητές Περιγραφική Στατιστική 35 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές A. Αριθμητικές Μέθοδοι. Πίνακες Συχνοτήτων. Παράδειγμα 2. Τα παρακάτω δεδομένα αφορούν την οικογενειακή κατάσταση 20 ανδρών (1: έγγαμοι, 2: άγαμος, 3: διαζευγμένος ή χήρος) 1 1 2 1 3 1 2 2 2 1 3 3 1 2 3 1 1 2 2 1 Περιγραφική Στατιστική 36 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 37 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 38 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές συχνότητες σχετικές συχνότητες αθροιστικές σχετικές συχνότητες Περιγραφική Στατιστική 39 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Έστω ότι στο προηγούμενο παράδειγμα οι 10 πρώτοι καταναλώνουν μικρή ποσότητα καφεΐνης ημερησίως (1: 150ml/day) ενώ οι υπόλοιποι 10 μεγάλη ποσότητα καφεΐνης ημερησίως (2: >150ml/day). Μπορούμε τότε να κατασκευάσουμε το πίνακα συνάφειας (contingency table), όπου απεικονίζει τη διμεταβλητή κατανομή συχνοτήτων για τις δύο κατηγορικές μεταβλητές οικογενειακή κατάσταση και ποσότητα καφεΐνης ημερησίως. Περιγραφική Στατιστική 40 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 41 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 42 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές 5 άνδρες είναι παντρεμένοι και δεν καταναλώνουν πολύ καφεΐνη το 55.6% των ανδρών που είναι παντρεμένοι δεν καταναλώνουν πολύ καφεΐνη το 50% των ανδρών που δεν καταναλώνουν πολύ καφεΐνη είναι παντρεμένοι το 25% των ανδρών είναι παντρεμένοι και δεν καταναλώνουν πολύ καφεΐνη Περιγραφική Στατιστική 43 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές B. Γραφικές Μέθοδοι 1. Μία κατηγορική μεταβλητή i. Ραβδόγραμμα. Στο ραβδόγραμμα οι κατηγορίες της μεταβλητής παρουσιάζονται στον ένα άξονα και οι αντίστοιχες συχνότητες (ή σχετικές συχνότητες) τους στον άλλο άξονα, και εν συνεχεία κατασκευάζονται ορθογώνια πάνω από κάθε κατηγορία με ύψος ίσο με την αντίστοιχη συχνότητα της. Περιγραφική Στατιστική 44 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές ή Περιγραφική Στατιστική 45 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 46 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές ii. Τομεόγραμμα. Στο τομεόγραμμα διαιρούμε ένα κύκλο σε κυκλικούς τομείς με εμβαδά ανάλογα προς τις συχνότητες των κατηγοριών της κατηγορικής μεταβλητής. Περιγραφική Στατιστική 47 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 48 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 49 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές 2. Δύο κατηγορικές μεταβλητές i. Ραβδόγραμμακατάομάδες Περιγραφική Στατιστική 50 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 51 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 52 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 53 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 54 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές 2. Δύο κατηγορικές μεταβλητές ii. Ραβδόγραμμα κατά στοίβες Περιγραφική Στατιστική 55 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 56 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 57 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 58 Δημήτρης Φουσκάκης

Κατηγορικές Μεταβλητές Περιγραφική Στατιστική 59 Δημήτρης Φουσκάκης