ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού



Σχετικά έγγραφα
ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

20/12/2016. Συνεχής Ασυνεχής

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών. κλίµακα µέτρησης

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

9. Παλινδρόμηση και Συσχέτιση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΣΥΧΝΟΤΗΤΑΣ ΥΔΡΟΛΟΓΙΚΩΝ ΦΑΙΝΟΜΕΝΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Γ. Πειραματισμός - Βιομετρία

Kruskal-Wallis H

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Βιοστατιστική ΒΙΟ-309

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Αναλυτική Στατιστική

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Βιοστατιστική ΒΙΟ-309

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

Χ. Εμμανουηλίδης, 1

Βιοστατιστική ΒΙΟ-309

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Απλή Παλινδρόμηση και Συσχέτιση

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Εισόδημα Κατανάλωση

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

5. Έλεγχοι Υποθέσεων

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ

3. Κατανομές πιθανότητας

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Περιγραφική Στατιστική

Ενδεικτικές ασκήσεις ΔΙΠ 50

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Διάστημα εμπιστοσύνης της μέσης τιμής

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

I2. Αριθμητικά περιγραφικά μέτρα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Γ. Πειραματισμός Βιομετρία

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Εισαγωγή στην Εκτιμητική

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Επιχειρήσεων Ι

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Transcript:

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού Με τις στατιστικές μεθόδους επιδιώκεται αφενός η συνοπτική αλλά εμπεριστατωμένη παρουσίαση των ευρημάτων μιας μελέτης (περιγραφική στατιστική) και αφετέρου η συναγωγή συμπερασμάτων που βασίζονται στα ευρήματα αυτά (συμπερασματολογική στατιστική / επαγωγική στατιστική) Πιθανότητα (P, Probablty) είναι μέτρο του πόσο αναμενόμενο να συμβεί ένα γεγονός ή μια θέση (ισχυρισμός) να είναι αληθής. Οι πιθανότητες παίρνουν τιμές μεταξύ 0 (δεν θα συμβεί) και (θα συμβεί). Όσο μεγαλύτερη η πιθανότητα ενός γεγονότος, τόσο βέβαιοι είμαστε ότι θα συμβεί. Ως μεταβλητή θεωρούμε κάθε χαρακτηριστικό το οποίο μπορεί να μεταβληθεί ή να διαφοροποιηθεί κατά μήκος του χρόνου, απότόποσετόπο, από άτομο σε άτομο ή από ομάδα σε ομάδα (π.χ. ηλικία, ύψος, εισόδημα, συγκέντρωση χοληστερόλης, αρτηριακή πίεση, ρυθμός γεννητικότητας κτλ) Ποιοτική ονομάζεται η μεταβλητή που περιγράφει κάποιο ποιοτικό χαρακτηριστικό ενός ατόμου ή μιας ομάδας. Ποσοτική ονομάζεται η μεταβλητή που μπορεί να μετρηθεί με τη συνήθη έννοια του όρου Συνεχής Ασυνεχής Ως ανεξάρτητη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζει μια άλλη μεταβλητή. Ως εξαρτημένη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζεται από μια άλλη μεταβλητή.

ΠΕΡΙΓΡΑΦΗ ΔΕΔΟΜΕΝΩΝ Γραφικές μέθοδοι Ραβδογράμματα - Ιστογράμματα (Συχνότητα) Κυκλικά διαγράμματα Διαγράμματα πλαισίου Αριθμητικοί στατιστικοί δείκτες ή μέτρα (tattc) Κεντρικής τάσης - Μέση τιμή (mea) - Διάμεσος (meda) - Επικρατούσα τιμή (mode) Διασποράς - Εκατοστημόρια ή ποσοστιαία σημεία (percetle) - Διακύμανση ή Διασπορά (Varace) - Τυπική απόκλιση (tadard devato) Διάγραμμα πίτας (Pe chart) Ραβδόγραμμα (bar chart) Διάγραμμα πλαισίου (Bo plot) Ma Ιστόγραμμα (Htogram) 75% 5% Meda M

Μέση τιμή : (mea ή average) N N Διάμεσος : (meda) - Ταξινόμηση των μετρήσεων κατά μέγεθος - Επιλογή της τιμής στο μέσον των μετρήσεων Επικρατούσα τιμή : Η συχνότερη τιμή (mode)

Εκατοστημόρια ή ποσοστιαία σημεία (percetle) - Διατάσσουμε τα δεδομένα κατά τάξη μεγέθους - Το p-εκατοστημόριο είναι η τιμή που έχει p% των μετρήσεων μικρότερες από αυτήν Τεταρτημόρια (quartle) Ειδικά εκατοστημόρια - Q 5% - Q 50% - Q 3 75% ΜΕΤΡΑ ΤΗΣ ΔΙΑΣΠΟΡΑΣ Έκτασηήεύρος(rage) : ma - m Διακύμανση Διασπορά (varace) : Πληθυσμού «σ» Δείγματος N ( ) N ( ) Τυπική (ή σταθερή) απόκλιση (tadard devato) : N N Συντελεστής διακύμανσης (coeffcet of varace) : 00% ή % CV Συντελεστής μεταβλητότητας (coeffcet of varato)

Accurate but mprece accurate but prece Accurate ad prece Preco: ορθότητα ή επαναληψιμότητα Accuracy: ακρίβεια Κανονική κατανομή f ( μ ) σ ( ) e πσ Ν(μ,σ )

Ν(0,) f ( ) e π Τυποποιημένη μεταβλητή Z X μ σ http://davdmlae.com/hypertat/z_table.html http://oletatbook.com//ormal_dtr buto/tadard_ormal.html Φ(- <z Z)0.5 + Φ(0 z Z)

Κεντρικό οριακό θεώρημα (cetral lmt theorem) Για αρκούντως μεγάλα δείγματα από έναν πληθυσμό, οι μέσες τιμές ακολουθούν περίπου την κανονική κατανομή, ανεξάρτητα από το είδος της κατανομής του πληθυσμού. Όσο μεγαλύτερα τα δείγματα τόσο καλύτερα προσεγγίζεται η κανονική κατανομή. Έστω Χ, Χ,,Χ ανεξάρτητες μεταβλητές και S X +X + +X Για μεγάλα, η τ.μ. Z S σ μ ακολουθεί την κανονική κατανομή Ν(0,) Κατανομή t του Studet

ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ (ΕΛΕΓΧΟΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ) Sgfcace tetg Συγκρίνοντας δύο πληθυσμούς ) διαπιστώνουμε πάντοτε διαφορές μεταξύ των μέσων αλλά και μεταξύ των διασπορών τους. Απηχούν πραγματικές διαφορές μεταξύ των πληθυσμών; Μηδενική υπόθεση (ull) Η 0 : Εναλλακτική υπόθεση (alteratve) Η : μ μ ή σ ή μ μ σ σ σ Σφάλμα ου είδους (α) : Πιθανότητα εσφαλμένης απόρριψης της Η 0 Σφάλμα ου είδους (β) : Πιθανότητα εσφαλμένης απόρριψης της Η Έλεγχος για τη μέση τιμή μ μεγάλου δείγματος, σ.σ. α y μ0 z / δειγματικός μέσος - υποτιθέμενος μέσος τυπικό σφάλμα του δειγματικού μέσου Κ.Ο.Θ Το «z» ακολουθεί την κανονική κατανομή Για κάθε α αντιστοιχεί ένα κρίσιμο z α Η Η 0 απορρίπτεται όταν z > z α Έλεγχος για διαφορά δύο μέσων τιμών (μεγάλα δείγματα), σ.σ. α ( y z y) + δ ακολουθεί την κανονική κατανομή Για κάθε α αντιστοιχεί ένα κρίσιμο z α Η Η 0 απορρίπτεται όταν z > z α

Έλεγχος για τη μέση τιμή μ μικρού δείγματος, σ.σ. α t y μ 0 / ακολουθεί την κατανομή t από τις τιμές y, β.ε. - Έλεγχος μέσων τιμών μ, μ δύο δειγμάτων Όταν upared t-tet (διαφορετικά υποκείμενα) ( y t Δείγματα από ανεξάρτητους πληθυσμούς Διακυμάνσεις όχι σημαντικά διαφορετικές Π.χ. Σύγκριση τιμών γλυκόζης από ασθενείς δύο διαφορετικών νοσοκομείων y ) δ + ακολουθεί την κατανομή t ( ) + ( ) + Upared β.ε. + - t-tet_mmuoglobul.l Έλεγχος σημαντικότητας για τη διασπορά, σ.σ. α X ( ) σ ακολουθεί την κατανομή Χ Για κάθε α και ν αντιστοιχεί ένα κρίσιμο X α;v Η Η 0 απορρίπτεται όταν Χ > X α;v Σύγκριση των διασπορών δύο πληθυσμών, σ.σ. α F ακολουθεί την κατανομή F Για κάθε α και ν,ν αντιστοιχεί ένα κρίσιμο F ν,ν;α Η Η 0 απορρίπτεται όταν F F ν,ν;α για > ( είναι το δείγμα με την μεγαλύτερη διακύμανση) Folate.l

κ- αριθμητής ν : β.ε αριθμητή ν : β.ε παρονομαστή Όταν κατά ζεύγη (pared) t-tet (ίδια υποκείμενα) Διακυμάνσεις όχι σημαντικά διαφορετικές ( y) δ t 0 ακολουθεί την κατανομή t d / d : τυπική απόκλιση διαφορών δ, β.ε. - y y δ y PO.l

Έλεγχος σημαντικότητας για το «p» τηςδιωνυμικήςκατανομής (μεγάλα δείγματα) Έστω επιτυχίες σε δοκιμές. Συγκρίνουμε την αναλογία / των επιτυχιών με μια δοθείσα πιθανότητα p 0 με την βοήθεια της τυποποιημένης μεταβλητής Ζ. Z p p 0 p ) 0 ( 0 6_7.l ΑΝΙΣΑ ΔΕΙΓΜΑΤΑ, ΑΝΙΣΕΣ ΔΙΣΑΠΟΡΕΣ

ΑΝΑΛΥΣΗ ΤΗΣ ΔΙΑΚΥΜΑΝΣΗΣ (ANOVA) Σύγκριση περισσοτέρων των δύο ανεξαρτήτων δειγμάτων από κανονικούς πληθυσμούς με ίδια διακύμανση Συνολική εκτίμηση για το αν οι μέσοι όλων των δειγμάτων είναι μεταξύ τους ίσοι ή αν τουλάχιστον ένας από αυτούς διαφέρει. Ελέγχουμε αν υπάρχει σημαντική διαφορά μεταξύ της διασποράς των μέσων τιμών και της συνολικής διασποράς των δειγμάτων. α κ ( ) υ ) κ ( F τετράγωνα μεταξύ δειγμάτων τετράγωνα εντός δειγμάτων α υ /( κ ) /( κ ) + + + κ κ: πλήθος δειγμάτων Hb_ANOVA.l Η 0 : 3 κ Η : Τουλάχιστον ένας από τους δειγματικούς μέσους δεν είναι ίσος με κάποιον άλλον ΠΙΝΑΚΑΣ ΑΝΑΛΥΣΗΣ ΔΙΑΣΠΟΡΑΣ Mεταβολή Μεταξύ δειγμάτων Εντός δειγμάτων Αθρ. Τετραγ. α υ Β.ε. κ- -κ Μέση μεταβλητ. α /( κ ) υ /( κ ) α υ F /( κ ) /( κ ) Προϋπόθεση : διασπορές των δειγμάτων ίσες. 09 3_Eample.l

Πίνακας της κατανομής F για P(F > F (κ-),(-κ) ) a κ- -κ 3 4 5 6 7 8 9 6.40 99.50 5.70 4.60 30.0 34.00 36.80 38.90 40.50 8.5 9.00 9.6 9.5 9.30 9.33 9.35 9.37 9.38 3 0.3 9.55 9.8 9. 9.0 8.94 8.89 8.85 8.8 4 7.7 6.94 6.59 6.39 6.6 6.6 6.09 6.04 6.00 5 6.6 5.79 5.4 5.9 5.05 4.95 4.88 4.8 4.77 6 5.99 5.4 4.76 4.53 4.39 4.8 4. 4.5 4.0 7 5.59 4.74 4.35 4. 3.97 3.87 3.79 3.73 3.68 8 5.3 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 9 5. 4.6 3.86 3.63 3.48 3.37 3.9 3.3 3.8 0 4.96 4.0 3.7 3.48 3.33 3. 3.4 3.07 3.0 4.84 3.98 3.59 3.36 3.0 3.09 3.0.95.90 4.75 3.89 3.49 3.6 3. 3.00.9.85.80 3 4.67 3.8 3.4 3.8 3.03.9.83.77.7 4 4.60 3.74 3.34 3..96.85.76.70.65 5 4.54 3.68 3.9 3.06.90.79.7.64.59 6 4.49 3.63 3.4 3.0.85.74.66.59.54 7 4.45 3.59 3.0.96.8.70.6.55.49 8 4.4 3.55 3.6.93.77.66.58.5.46 9 4.38 3.5 3.3.90.74.63.54.48.4 0 4.35 3.49 3.0.87.7.60.5.45.39 ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ Προϋπόθεση όλων των «παραμετρικών δοκιμασιών» που αναφέρθηκαν είναι η «κανονικότητα» των δεδομένων. Πώς ελέγχουμε την κανονικότητα; Γράφημα συσχέτισης των ποσοστιαίων σημείων (quatle) των δεδομένων με αυτά της κανονικής κατανομής (QQ-plot). Ευθεία γραμμή κανονικότητα Έλεγχος λοξότητας (kewe) και κύρτωσης (kurto) Συντ. λοξότητας Ν ( ) ( N ) 3 3 μετρά την ασυμμετρία της κατανομής >0 η δεξιά ουρά μεγαλύτερη από την αριστερή Συντ. κύρτωσης Ν ( ) ( N ) 4 4 μετρά το πόσο πιο απότομη ή πιο επίπεδη είναι η κατανομή σε σχέση με την κανονική. >0 απότομη στο κέντρο με μακρές ουρές, <0 επίπεδη στο κέντρο με μικρές ουρές

Αποδεχόμαστε ότι τα δεδομένα ακολουθούν την κανονική κατανομή, αν οι συντελεστές ασυμμετρίας και κύρτωσης είναι στο διάστημα (-,). P-value Στις δοκιμασίες σημαντικότητας η p-value είναι η πιθανότητα του να πάρει το στατιστικό z ή t τουλάχιστον τόσο ακραίες τιμές όσο αυτή που παρατηρήθηκε, θεωρώντας ότι ισχύει η μηδενική υπόθεση. Ο μελετητής απορρίπτει συνήθως την μηδενική υπόθεση όταν η p value βρίσκεται να είναι μικρότερη από την στάθμη σημαντικότητας a που επέλεξε, συνήθως 0.05 ή 0.0. Μια τόσο μικρή p value δείχνει ότι το παρατηρηθέν αποτέλεσμα θα ήταν πολύ απίθανο να συμβεί εάν ισχύει η μηδενική υπόθεση (δηλαδή ότι η παρατηρηθείσα σχέση είναι πολύ απίθανο να είναι αποτέλεσμα καθαρής τύχης.)

Υπολογισμός της p-value Υπολογίζουμε το στατιστικό z μ / Ανατρέχουμε στους πίνακες του z και βρίσκουμε την πιθανότητα Φ στην οποία αντιστοιχεί. p-value ( Φ) για αμφίπλευρη δοκιμασία σημαντικότητας. 5.67, 00

ΠΟΙΟΤΙΚΑ ΔΕΔΟΜΕΝΑ Κατηγορίας (omal) --Διάταξης (ordal) Ποσοστά - Σχετικές Συχνότητες - Αναλογίες p Πλήθος εμφανίσεων κάποιου φαινομένου Σύνολο παρατηρήσεων Σε μεγάλα δείγματα ακολουθεί κανονική κατανομή Δηλ. όταν p(-p) 0 ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΑΣ ΕΝΟΣ ΔΕΙΓΜΑΤΟΣ ΜΕ ΓΝΩΣΤΗ ΑΝΑΛΟΓΙΑ (H τ.μ. παίρνει δύο τιμές) p / H 0 : p p 0 το p προκύπτει από τον ίδιο H : p p 0 πληθυσμό που αναφέρεται το p 0 z p p 0 p0( p0) / Διάστημα εμπιστοσύνης p ± z a / p( p)

ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ ΑΠΟ ΔΥΟ ΠΛΗΘΥΣΜΟΥΣ H 0 : (p p ) D 0, p /, p / H : (p p ) D 0 Περίπτωση Α: D 0 0 H 0 : p p Περίπτωση Β: D 0 0 H 0 : p -p D 0 + p ) p( p p z 0 ) p ( p ) p ( p D ) p p ( z + p + +

ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΔΕΙΓΜΑΤΩΝ ΚΑΤΑ ΖΕΥΓΗ Ανάλυση χ (Μη παραμετρικός έλεγχος) Η τ.μ. παίρνει δύο τιμές (Κατηγορίες, ) - Πίνακες Ομάδα Κατηγορία Κατηγορία Σύνολο π π π +π N π π π + π N Σύνολο π +π π +π NN +N - Αναμενόμενες τιμές κατ. ομάδας, θ (π +π )*(π +π )/N, θ (π +π )*(π +π )/N - Αναμενόμενες τιμές κατ. ομάδας, θ (π +π )*(π +π )/N, θ (π +π )*(π +π )/N Εξετάζουμε την τιμή της μεταβλητής : X ( π θ) ( π θ ) ( π θ ) ( π θ ) ή θ + η οποία ακολουθεί κατανομή χ με β.ε., θ όταν οι αναμενόμενες αναλογίες δεν είναι < 5 Η χ εξετάζει αμφίπλευρα, αλλά στον πίνακα αναζητούμε για σ.σ0.05 και όχι 0.05/. + θ π π π π X + + + N θ θ θ θ + θ _quare_chmerzld.l _quare_operato.l 3

ΣΥΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ S ΔΕΙΓΜΑΤΩΝ ΜΕ Κ ΚΑΤΗΓΟΡΙΕΣ Ανάλυση χ Πίνακες Συνάφειας (cotgecy table) Κατηγορία "j" Ομάδα "". k Σύνολο γραμμών π π. π k k Σ j π π. π k k Σ j...... π π π k k Σ j Σύνολο στηλών Σ Σ. k Σ k ΝΣΣ j θ j ( j ) ( N k j j ) X k j ( π j θj ) θ j X β.ε. (-) (k-) ήαπλούστερα k π j N j θj Fher Eact Tet : Εναλλακτική για την χ για μικρούς αριθμούς 4

Κρίσιμες τιμές του χ 5

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΔΟΚΙΜΑΣΙΕΣ Δεν προαπαιτούν να ακολουθούν οι πληθυσμοί κάποια κατανομή. Ενδιαφέρει μόνο η τάξη και όχι η τιμή της τυχαίας μεταβλητής. Δοκιμασία Kolmogorov Smrov (Καλής προσαρμογής, Ομογένειας) Κριτήριο των Ροών ή Wald-Wolfowtz (Δοκιμασία τυχαιότητας) Δοκιμασία προσήμου (g tet) Αθροίσματα τάξεων (rak um tet) - Δοκιμασία Wlcoo - Δοκιμασία Ma-Whthey - Δοκιμασία Krukal-Wall ΔΟΚΙΜΑΣΙΑ ΟΜΟΓΕΝΕΙΑΣ (Kolmogorov Smrov) Ελέγχει αν δύο δείγματα προέρχονται από την ίδια κατανομή. H 0 Τα δύο δείγματα προέρχονται από την ίδια κατανομή H Τα δύο δείγματα προέρχονται διαφορικές κατανομές Χρησιμοποιεί τον δείκτη D ma F () F () F () και F () είναι οι αθροιστικές συχνότητες των δύο δειγμάτων Η μηδενική υπόθεση απορρίπτεται, όταν το D D a,, από τον πίνακα VII. α0.05 D a, m, 0 Eample.l. 36 m + m α0.0 D a, m,. 63 m + m

ΔΟΚΙΜΑΣΙΑ ΟΜΟΓΕΝΕΙΑΣ (Kolmogorov Smrov) Για ένα δείγμα που ελέγχεται εάν είναι κανονικό: H 0 Το δείγμα προέρχονται από κανονικό πληθυσμό H Το δείγμα δεν προέρχονται από κανονικό πληθυσμό Χρησιμοποιεί τον δείκτη D ma F () F Ν () F () και F Ν () είναι οι αθροιστικές συχνότητες του δείγματος και της κανονικής κατανομής Η μηδενική υπόθεση απορρίπτεται, όταν το D D a, από τον πίνακα VI. α0.05. 36 a D, α0.0. 63 a D, ΔΟΚΙΜΑΣΙΑ ΠΡΟΣΗΜΟΥ (Sg tet) Ανάλογη προς τη δοκιμασία t Χρησιμοποιεί τον διάμεσο (meda) Ζευγαρωτές παρατηρήσεις Πλήθος μη μηδενικών διαφορών > 5 H 0 : Μ M H H 0 απορρίπτεται, όταν το πλήθος των αρνητικών (Ν - ) και θετικών (Ν + ) διαφορών είναι άνισο. Αυτό συμβαίνει όταν το Ν m m(ν -,Ν + ) της μικρότερης τιμής του διαστήματος εμπιστοσύνης που προβλέπεται από πίνακες της διωνυμικής κατανομής για το πλήθος των μη μηδενικών διαφορών και για συγκεκριμένο a. Sg_tet.l

Όρια εμπιστοσύνης για το N p (διωνυμική κατανομή), p0.05; N0 έως 99 N 0 3 4 5 6 7 8 9 0 - - - - - - 0-6 0-7 0-8 -8 0-9 -0-0 - - 3-3-3 4-3 4-4 4-5 0 5-5 5-6 5-7 6-7 6-8 7-8 7-9 7-0 8-0 8-30 9-9- 9-3 0-3 0-4 -4-5 -5-6 -7 40 3-7 3-8 4-8 4-9 5-9 5-30 5-3 6-3 6-3 7-3 50 7-33 8-33 8-34 8-35 9-35 9-36 0-36 0-37 -37-38 60-39 -39-40 3-40 3-4 4-4 -4 5-4 5-43 5-44 70 6-44 6-45 7-45 7-46 8-46 8-47 8-48 9-48 9-49 30-49 80 30-50 3-50 3-5 3-5 3-5 3-53 33-53 33-54 34-54 34-55 90 35-55 35-56 36-56 36-57 37-57 37-58 37-59 38-59 38-60 39-60 N: πλήθος μη μηδενικών διαφορών ΔΟΚΙΜΑΣΙΑ ΑΘΡΟΙΣΜΑΤΩΝ ΤΑΞΕΩΝ (rak um) ΚΑΤA WILCOXON Ζευγαρωτές παρατηρήσεις ( ) H 0 : Μ M Κατατάσσουμε τις απόλυτες τιμές των διαφορών κατά αύξουσα σειρά. Η σειρά εμφάνισης των διαφορών αποτελεί την τάξη τους. Γράφουμε δίπλα σε κάθε διαφορά την τάξη της και το πρόσημό της. Αθροίζουμε τις τάξεις των θετικών διαφορών (Τ + ) Αθροίζουμε τις τάξεις των αρνητικών διαφορών (Τ - ) 3

Η μηδενική υπόθεση απορρίπτεται όταν: Tm{T +,T - } Τ c. (T c από τον πίνακα ΧΙ, πλήθος μη μηδενικών παρατηρήσεων) Για > 5 η Τ ακολουθεί κανονική κατανομή. μ T ( +) 4 Wlc_Sg_Rak_Sum.l 0 Eample.l T μt Z σ T σ T Εναλλακτικά, όταν Τ Τ + - Τ - > T p (: πλήθος μη μηδενικών διαφορών) ( + )( + ) 4 4

Όρια ασφαλείας του δείκτη για τη δοκιμασία προσήμου αθροιστικών τάξεων κατά Wlcoo a0.05 a0.05 Πλήθος διαφορών 0 T 0.95 T 0.975 5 5-6 7 7 4 8 6 30 9 9 35 0 35 39 40 46 44 5 3 49 57 4 55 63 5 60 70 6 66 76 7 7 83 8 77 9 9 84 98 0 90 06 T p Για > 0 z p ( + )( + ) 6 Z p : το p εκατοστιαίο σημείο της κανονικής κατανομής ΔΟΚΙΜΑΣΙΑ ΑΘΡΟΙΣΜΑΤΩΝ ΤΑΞΕΩΝ (rak um) ΚΑΤA MANN-WHITNEY (U-tet) Δείγματα διαφορετικού μεγέθους, Διατάσσουμε τις παρατηρήσεις των δύο δειγμάτων σε αύξουσα σειρά, σαν να ανήκαν στον ίδιο πληθυσμό. Σημειώνουμε την τάξη κάθε παρατήρησης. Υπολογίζουμε τα αθροίσματα Τ και Τ των τάξεων για κάθε δείγμα. Τ m {T,T } Εξετάζουμε, αν το Τ εμπίπτει στα όρια αποδοχής που βρίσκουμε σε πίνακες για, και συγκεκριμένη σ.σ. Στον πίνακα το Ν είναι το του δείγματος με το μικρότερο Τ. 5

Παραμετρικές δοκιμασίες Δύοανεξάρτητα δείγματα Studet' t tet Κατά ζεύγη Studet' t tet ANOVA Συντελεστής συσχέτισης του Pearo Προϋποθέσεις παραμετρικών δοκιμασιών ) Τα δεδομένα και των δύο δειγμάτων έχουν συλλεγεί τυχαία ) Τα δεδομένα και των δύο δειγμάτων προέρχονται από πληθυσμούς με κανονική κατανομή 3) Οι διακυμάνσεις τους είναι ίσες ) Η διαφορές (d ) πρέπει να προέρχονται από πληθυσμό διαφορών με κανονική κατανομή ) Τα δεδομένα όλων των δειγμάτων έχουν συλλεγεί τυχαία ) Τα δεδομένα όλων των δειγμάτων προέρχονται από πληθυσμούς με κανονική κατανομή 3) Οι διακυμάνσεις τους είναι ίσες ) Τα δεδομένα Y για κάθε X πρέπει να έχουν συλλεγεί τυχαία από κανονική κατανομή των τιμών Y. ) Τα δεδομένα X για κάθε Y πρέπει να έχουν συλλεγεί τυχαία από κανονική κατανομή των τιμών X. Μη παραμετρικές εναλλακτικές Ma-Whtey U tet Wlcoo ged rak Krukal-Wall H tet Συντελεστής συσχέτισης τάξεως του Spearma 6

ΑΠΛΗ ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ -- ΣΥΣΧΕΤΙΣΗ (Smple Lear Lear Regreo --Correlato) Εύρεση μιας μαθηματικής ευθείας που εξηγεί τα δεδομένα y α + β + e α : τεταγμένη επί την αρχή (tercept) β : κλίση (lope) e : τυχαίο σφάλμα : ελεγχόμενη (predctor) y : απόκριση (repoe) Μέθοδος ελαχίστων τετραγώνων y a + b + e e (y a b ) b y y a yb

Προϋποθέσεις για τη χρήση της απλής γραμμικής παλινδρόμησης Τα τυχαία σφάλματα στην είναι αμελητέα Για κάθε τιμή της υπάρχει μια κανονική κατανομή τιμών της y. Η κατανομή του y για κάθε τιμή του έχει την ίδια διακύμανση Lear_Regr.l Απλή γραμμική παλινδρόμηση Παλινδρόμηση Demg

3 ( ) a ) y (y ) Τυπικό σφάλμα της εκτίμησης (tadard error of the etmato) b ) ( Τυπικό σφάλμα για το b δ.ε. β b ± t b, β. ε. -, a Τυπικό σφάλμα για το a δ.ε. α a ± t a, β. ε. -, a ΣΥΣΧΕΤΙΣΗ (Correlato) ΣΥΣΧΕΤΙΣΗ (Correlato) Μέθοδος για την μέτρηση του βαθμού συμμεταβλητότητας των μεταβλητών. Συντελεστής συσχέτισης Pearo (Correlato coeffcet) y y y y r ) ( ) ( ) )( (

Διάστημα εμπιστοσύνης (Cofdece terval) y ± t; a / + ( ) ( ) Διάστημα πρόβλεψης (Predcto terval) y ± t; a/ + + ( ) ( ) y : τιμή που προβλέπεται από την γρ. παλ. για το ) : μέση τιμή του : τιμή της ανεξ. μετ. για την οποία αναζητούμε την y : τιμή της ανεξ. μετ. από τις μετρήσεις Δοκιμασία ανεξαρτησίας H 0 : b0, απορρίπτεται όταν t > t -;a/ t b b Δοκιμασία μη συσχέτισης H 0 : r0, απορρίπτεται όταν t > t -;a/ t r r 4

Δοκιμασία ανεξαρτησίας Η 0 : r T 0 5 Δεν μπορούμε να αποφανθούμε 5 < 0 Aπορρίπτουμε την Η 0 όταν r T S ;a rt > 0 To tt ακολουθεί την rt κατανομή t. Απορρίπτουμε την Η 0 όταν t T t -;a 6