Στατιστική ανάλυση αποτελεσμάτων

Σχετικά έγγραφα
Αναλυτική Στατιστική

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών. κλίµακα µέτρησης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Στατιστική Ι. Ανάλυση Παλινδρόμησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Γ. Πειραματισμός Βιομετρία

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

Kruskal-Wallis H

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Εισόδημα Κατανάλωση

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Περιεχόμενα. Πρόλογος... 15

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

9. Παλινδρόμηση και Συσχέτιση

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Έρευνα Μάρκετινγκ Ενότητα 5

Συνοπτικά περιεχόμενα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Στατιστική Συμπερασματολογία

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Διαχείριση Υδατικών Πόρων

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισαγωγή στην Εκτιμητική

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

Διάστημα εμπιστοσύνης της μέσης τιμής

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Χ. Εμμανουηλίδης, 1

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Το Κεντρικό Οριακό Θεώρημα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Απλή Παλινδρόμηση και Συσχέτιση

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

Το Κεντρικό Οριακό Θεώρημα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΔΗΜΟΣΙΑ ΟΙΚΟΝΟΜΙΚΗ Ι

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Transcript:

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια Τμήμα Στατιστικής Οικονομικό Πανεπιστήμιο Αθηνών 1

Στην ενότητα αυτή θα αναφερθούμε στις κυριότερες στατιστικές τεχνικές που συναντάμε σε επιστημονικές εργασίες κατά την ανάλυση των δεδομένων. 2

Πολλές απόψεις έχουν διατυπωθεί για το ποιο ακριβώς είναι το αντικείμενο της Στατιστικής. Σε πολλά εισαγωγικά βιβλία ως Στατιστική ορίζεται η επιστήμη εκείνη που ασχολείται με τη συλλογή, την ανάλυση και την ερμηνεία δεδομένων. Παρότι ο ορισμός αυτός αντιπροσωπεύει πράγματι ένα μεγάλο μέρος των δραστηριοτήτων της Στατιστικής δεν αποτελεί το αποκλειστικό αντικείμενο της επιστήμης αυτής. Αυτή η πλευρά των δραστηριοτήτων της Στατιστικής αποτελεί αυτό που ονομάζουμε Περιγραφική Στατιστική. Η άλλη διάσταση της Στατιστικής είναι εκείνη η οποία ασχολείται με τη συμπερασματολογία. Για αυτή την πλευρά της Στατιστικής θα μπορούσαμε να δίναμε τον ορισμό ότι Στατιστική είναι η προσπάθεια εξαγωγής συμπερασμάτων κάτω από συνθήκες αβεβαιότητας.

Και οι δύο βασικές δραστηριότητες της Στατιστικής που αναπτύχθηκαν προηγουμένως χρειάζονται ικανότητα στατιστικής σκέψης. Η ικανότητα στατιστικής σκέψης πρέπει βέβαια να συνδυάζεται και με γνώση του αντικειμένου από το οποίο προέρχονται τα προς ανάλυση στοιχεία.

Είναι γνωστό ότι πολλοί ισχυρίζονται πως η Στατιστική είναι ένας τρόπος για να λέει κανείς ψέματα. Στην πραγματικότητα βέβαια δεν είναι η Στατιστική υπεύθυνη για αυτό αλλά οι μη κατάλληλες στατιστικές μέθοδοι που χρησιμοποιούνται για την ανάλυση συγκεκριμένων δεδομένων ή η παραπλανητική ερμηνεία δεδομένων που γίνεται από μη στατιστικούς για εξυπηρέτηση συγκεκριμένων σκοπιμοτήτων. Είναι δηλαδή αποτέλεσμα λανθασμένης στατιστικής σκέψης.

Ένα από τα σημαντικότερα βήματα για να μεγιστοποιήσει κανείς τη χρησιμότητα των στατιστικών εννοιών και μεθόδων βρίσκεται στην επιλογή των δεδομένων. Όσο πιο σχετικά είναι τα δεδομένα με το πρόβλημα που μας ενδιαφέρει να αντιμετωπίσουμε τόσο χρησιμότερη είναι η ανάλυσή τους. Η συλλογή των δεδομένων και η ανάλυση που θα επακολουθήσει επηρεάζεται από τη γνώση του αντικειμένου από εκείνον, ο οποίος ενδιαφέρεται να πάρει κάποια απόφαση και από τις πληροφορίες που είναι αναγκαίες προκειμένου να ληφθεί απόφαση για ένα συγκεκριμένο πρόβλημα.

Καθοριστικό ρόλο στην ανάλυση δεδομένων παίζει η αντίληψη της έννοιας της μεταβλητότητας. Η μεταβλητότητα είναι αναπόφευκτη σε όλες τις πλευρές της ανθρώπινης δραστηριότητας. Για οποιοδήποτε θέμα που αναφέρεται στον άνθρωπο και στο περιβάλλον του είναι προφανές ότι υπάρχει μεταβλητότητα.

Οι άνθρωποι γύρω μας δεν έχουν το ίδιο βάρος, το περιεχόμενο σε μια συγκεκριμένη συσκευασία ενός προϊόντος δεν είναι ποτέ ακριβώς το ίδιο, το εμπόρευμα που πωλούν δύο υπάλληλοι με τα ίδια προσόντα στην ίδια χρονική περίοδο δεν είναι το ίδιο. Έτσι, ανεξάρτητα από το φαινόμενο από το οποίο προέρχεται ένα σύνολο δεδομένων, υπάρχει μεταβλητότητα στις τιμές των δεδομένων αυτών. Κατανόηση της μεταβλητότητας και των λόγων που την προκαλούν είναι απαραίτητα για την ερμηνεία των δεδομένων. Θα μπορούσε κανείς να ισχυρισθεί ότι η κατανόηση και ερμηνεία της μεταβλητότητας σε ένα σύνολο δεδομένων είναι ακριβώς αυτό με το οποίο ασχολείται η Στατιστική. Η κατανόηση της μεταβλητότητας των δεδομένων οδηγεί στην ανακάλυψη, περιγραφή και κατανόηση συσχετίσεων και επαναλαμβανόμενων διαδικασιών. Η γνώση αυτή αποτελεί συχνά τη βάση για αποφάσεις που παίρνουμε σε σχέση με φαινόμενα που προκάλεσαν τα υπό ανάλυση δεδομένα.

Η έννοια της μεταβλητότητας είναι ίσως αυτή ακριβώς που οδήγησε στη σημαντική ανάπτυξη και αξιοποίηση των μεθόδων των Πιθανοτήτων και της Στατιστικής τα τελευταία χρόνια σε κατεύθυνση διαφορετική από εκείνη των Μαθηματικών. Τα Μαθηματικά, όπως είναι γνωστό, ασχολούνται με συγκεκριμένες και σαφώς καθορισμένες διαδικασίες όπου ένα σύνολο συγκεκριμένων υποθέσεων μπορεί να οδηγήσει σε ένα μονοσήμαντο αποτέλεσμα. Αντίθετα, η Στατιστική δημιουργήθηκε από την ανάγκη μελέτης φαινομένων όπου κάτω από τις ίδιες ακριβώς συνθήκες είναι δυνατόν να καταλήξουν σε διαφορετικά αποτελέσματα λόγω της ύπαρξης της μεταβλητότητας.

Θα μπορούσε επομένως κανείς να ισχυρισθεί ότι στατιστική σκέψη είναι μια διαδικασία συλλογισμών που αναγνωρίζει ότι υπάρχει μεταβλητότητα σε όλα τα φαινόμενα και ότι η μελέτη της μεταβλητότητας οδηγεί σε νέες γνώσεις και καλύτερες αποφάσεις.

Το σχήμα που ακολουθεί εξηγεί την χρησιμοποίηση της Στατιστικής ανάλυσης, σε συνδυασμό με την γνώση του αντικειμένου και την κρίση αυτού που λαμβάνει τις αποφάσεις, όπως αυτά συνδέονται με το σχεδιασμό, τη λήψη αποφάσεων και τη βελτίωση συστημάτων. Όπως φαίνεται από το σχήμα αυτό πρόκειται για μια διαδικασία συνεχούς βελτίωσης. Όσο περισσότερο κατανοούμε ένα φαινόμενο με τη χρήση της Στατιστικής ανάλυσης, τόσο περισσότερο βελτιώνουμε τη γνώση μας για το αντικείμενο και έτσι καθίσταται εφικτή η καλύτερη κατανόηση της διαδικασίας την επόμενη φορά.

Περιγραφική Μελέτη Βαθμολογία 150 φοιτητών ενός Πανεπιστημιακού Τμήματος 27 44 61 62 54 53 55 46 66 80 54 60 69 42 51 53 48 73 43 71 42 59 44 61 35 89 48 57 69 44 70 76 62 52 60 44 75 36 63 59 57 80 58 62 68 57 46 54 75 73 51 48 69 54 62 61 39 57 77 44 27 45 62 61 56 55 55 61 68 33 70 56 26 59 68 82 65 40 31 88 58 78 59 57 55 29 58 41 60 73 41 64 54 51 42 47 51 72 35 41 61 54 91 27 85 49 69 40 65 25 40 13 60 45 85 45 56 56 53 46 43 69 51 60 67 59 69 49 86 49 53 39 71 52 55 79 94 55 36 83 82 34 71 53 71 43 51 76 45 67

Περιγραφικά Μέτρα της Βαθμολογίας 150 φοιτητών ενός Πανεπιστημιακού Τμήματος Ερμηνεία παραμέτρων

Βαθμολογίες 2 φοιτητών Φοιτητής Α 9.0 9.0 8.0 8.5 8.0 8.5 8.5 8.0 8.5 8.0 9.5 8.5 Φοιτητής Β 6.0 10.0 9.5 9.5 10.0 6.0 10.0 5.5 5.5 10.0 10.0 10.0

Δειγματική Κατανομή του μέσου Έστω ότι ένας πληθυσμός αποτελείται από N = 4 αριθμούς: : 4, 6, 8, 10. Επιλέγουμε, με επανατοποθέτηση, όλα τα τυχαία δείγματα μεγέθους n = 2. Να προσδιορισθεί η δειγματική κατανομή του δειγματικού μέσου και να απεικονιστεί με ένα ιστόγραμμα σχετικών συχνοτήτων

Δειγματικά σημεία και οι αντίστοιχες τιμές του δειγματικού μέσου Δείγμα Δειγματικό σημείο Τιμή δειγματικού μέσου X x Δείγμα Δειγματικό σημείο Τιμή δειγματικού μέσου X x 1 4, 4 4 9 8, 4 6 2 4, 6 5 10 8, 6 7 3 4, 8 6 11 8, 8 8 4 4, 10 7 12 8, 10 9 5 6, 4 5 13 10, 4 7 6 6, 6 6 14 10, 6 8 7 6, 8 7 15 10, 8 9 8 6, 10 8 16 10, 10 10

Κατανομή του δειγματικού μέσου X x 4 5 6 7 8 9 10 P X x 116 216 316 416 316 216 116

Παραμετρική συμπερασματολογια για τις παραμέτρους ενός πληθυσμού Ερμηνεία του διαστήματος εμπιστοσύνης

Σχηματική παρουσίαση διαστημάτων εμπιστοσύνης

Σχηματική παρουσίαση στατιστικών ελέγχων

Παραμετρική συμπερασματολογια για τις παραμέτρους δύο πληθυσμών

Μη παραμετρικοί έλεγχοι Περίπτωση ενός δείγματος Έλεγχοι Καλής Προσαρμογής I Διωνυμικός Έλεγχος I Χ 2 Έλεγχος Καλής Προσαρμογής I Έλεγχος Kolmogorov I Έλεγχος Lilliefors Έλεγχοι Τυχαιότητας I Ροών I Σημείων Πρώτων Διαφορών Έλεγχοι για τη Θέση μιας Κατανομής I Προσημικός I Wilcoxon

Μη παραμετρικoί έλεγχοι Περίπτωση δύο δειγμάτων: Εξαρτημένων I Προσημικός I Wilcoxon Ανεξαρτήτων I Mann Whitney

Μη παραμετρικoί έλεγχοι Περίπτωση k δειγμάτων: Εξαρτημένων I Cochran I Friedman Ανεξαρτήτων I Έλεγχος Χ 2 I Έλεγχος Kruskal Wallis

Διμεταβλητά Ποσοτικά Δεδομένα Συσχέτιση Εισαγωγική Παρατήρηση Εξετάζουμε αν δύο τυχαίες μεταβλητές Χ και Υ συνδέονται με μία γραμμική σχέση και πόσο στενή είναι η σχέση αυτή.

Συνδιακύμανση Έστω ότι διαθέτουμε n ζεύγη παρατηρήσεων (Χ i, Υ i ). Η θέση και η διασπορά τόσο των παρατηρήσεων Χ i όσο και των παρατηρήσεων Υ i στους αντίστοιχους άξονες εκφράζονται με τα ήδη γνωστά περιγραφικά μέτρα. Θέλουμε πληροφορίες για την από κοινού συμπεριφορά των Χ και Υ με άλλα λόγια για το πώς κατανέμονται τα σημεία (Χ i, Υ i ) στο επίπεδο ΧΥ. συνδιακύμανση s XY,

Ο δειγματικός Συντελεστής Συσχέτισης ορίζεται ως: r XY s X XY s s Y Ο συντελεστής συσχέτισης είναι καθαρός αριθμός επιτρέπονται συγκρίσεις.

Ιδιότητες Συντελεστή Συσχέτισης Ο συντελεστής συσχέτισης παίρνει τιμές στο κλειστό διάστημα [-1,1] Ο συντελεστής συσχέτισης δεν μεταβάλλεται όταν μεταβληθούν γραμμικά οι Χ και Υ.

Ερμηνεία του Συντελεστή Συσχέτισης Ο συντελεστής συσχέτισης είναι μέτρο της γραμμικής συμμεταβολής δύο τυχαίων μεταβλητών Δύο τυχαίες μεταβλητές Χ, Υ μπορεί να έχουν συντελεστή συσχέτισης κοντά στο μηδέν και να μην είναι ανεξάρτητες, αλλά να συνδέονται με μία σχέση η οποία δεν είναι γραμμική. Προσοχή: Συσχέτιση δεν σημαίνει αιτιότητα.

Συντελεστής Συσχέτισης κατά τάξεις Ο συντελεστής συσχέτισης που υπολογίζεται για τις τάξεις n ζευγών παρατηρήσεων (Χ i, Υ i ) ονομάζεται συντελεστής συσχέτισης κατά τάξεις ή συντελεστής συσχέτισης του Spearman και συμβολίζεται με r s. Δηλαδή, n n 2 RX R i Y nr i XRY 6 di i 1 i 1 s n n 2 2 2 2 2 RX nr i X RY nr i Y i 1 i 1 r 1 n n 1 όπου d i =R Xi -R Yi Οι τύποι διαφοροποιούνται όταν υπάρχουν ισοβαθμίες

Χρησιμότητα του Συντελεστή Συσχέτισης κατά τάξεις Όταν τα διμεταβλητά δεδομένα προέρχονται από κατανομή που δεν μπορεί να υποτεθεί κανονική Όταν η συμμεταβολή των Χ i και Υ i, έτσι όπως διαφαίνεται από το διάγραμμα διασποράς, προσεγγίζεται από μία σχέση η οποία δεν είναι γραμμική είναι όμως μονοτονική. Όταν οι διαθέσιμες πληροφορίες δεν είναι οι παρατηρήσεις Χ i και Υ i, αλλά οι τάξεις αυτών Όταν γνωρίζουμε ή υποπτευόμαστε ότι στα δεδομένα μας υπάρχουν μία ή περισσότερες ασυνήθιστες τιμές.

Διμεταβλητά Ποιοτικά Δεδομένα Συνάφεια Έστω ότι σε έναν πληθυσμό ενδιαφερόμαστε να μελετήσουμε τις ποιοτικές μεταβλητές Α και Β για τις οποίες ορίζονται αντίστοιχα οι κατηγορίες Α 1, Α 2,..., Α r και Β 1, Β 2,..., Β c και διαθέτουμε n παρατηρήσεις ταξινομημένες σε έναν πίνακα rxc του οποίου η γενική μορφή είναι η εξής:

Πίνακας Συνάφειας A B B 1 B 2 B c Άθροισμα A 1 f 11 f 12 f 1c A 2 f 21 f 22 f 2c n A 1 n A 2 A r f r1 f r2 f rc n A r Άθροισμα n B 1 n B 2 n B c n

Από τις δειγματικές πληροφορίες που περιέχονται σε έναν τέτοιο πίνακα θέλουμε να κρίνουμε αν η πιθανότητα για ένα στοιχείο του δείγματος να ανήκει σε μια κατηγορία της μεταβλητής Α εξαρτάται από την κατηγορία της μεταβλητής Β στην οποία επίσης ανήκει. Τότε Οι δύο μεταβλητές συνδέονται με κάποιο τρόπο ή όπως λέμε έχουν συνάφεια

Οι πίνακες συνάφειας είναι πίνακες δύο (ή περισσοτέρων) διαστάσεων) όπου οι μεταβλητές είναι κατηγορικές και κάθε κελί περιέχει τη συχνότητα των παρατηρήσεων για την οποία ισχύει ταυτόχρονα ο συνδυασμός των δύο κατηγορικών μεταβλητών. Τους πίνακες συνάφειας τους χρησιμοποιούμε για να ελέγξουμε: αν τα χαρακτηριστικά στις δυο διαστάσεις του πίνακα, είναι εξαρτημένα ή ανεξάρτητα, (έλεγχος ανεξαρτησίας) αν τα δύο δείγματα, που το ένα εξετάζεται ως προς το χαρακτηριστικό 1 και το δεύτερο ως το χαρακτηριστικό 2, προέρχονται από τον ίδιο πληθυσμό (έλεγχος ομοιογένειας) Έλεγχοι X 2

Μέτρηση της έντασης της συνάφειας Μέτρο συνάφειας Q 2 του Cramer: Μέτρο συνάφειας V 2 του Cramer: Q V 2 2 χ 2 n 2 χ nmin[r 1,c 1] 2 Q min[r 1, c 1] Συντελεστής συνάφειας C του Pearson: C χ 2 χ 2 n Συντελεστής συνάφειας Q του Yule: Υπολογίζεται μόνο σε πίνακα συνάφειας 2x2. ad bc Q ad bc

Ανάλυση Παλινδρόμησης Η ανάλυση παλινδρόμησης έχει ως αντικειμενικό σκοπό την πρόβλεψη. Επιδίωξή της δηλαδή, είναι η επιλογή κατάλληλου στοχαστικού μοντέλου το οποίο θα χρησιμοποιηθεί για την πρόβλεψη των τιμών μιας εξαρτημένης μεταβλητής Y από τις τιμές μιας τουλάχιστον ανεξάρτητης τυχαίας μεταβλητής X. Στην παλινδρόμηση η μεταβλητή που μας ενδιαφέρει να μελετήσουμε είναι η εξαρτημένη και θεωρείται τυχαία μεταβλητή. Η ανεξάρτητη δεν είναι τυχαία μεταβλητή και οι παρατηρήσεις που αντιστοιχούν σε αυτήν θεωρούνται ελεγχόμενες ακριβείς μετρήσεις (τιμές) της μεταβλητής, χωρίς σφάλμα. Υπάρχουν πολλές περιπτώσεις που η θεώρηση αυτή είναι ρεαλιστική, ενώ σε άλλες περιπτώσεις, η υπόθεση αυτή δεν είναι ρεαλιστική.

Τα μοντέλα παλινδρόμησης εντάσσονται σε διάφορες κατηγορίες. Οι βασικές διαφορές των μοντέλων αυτών, συνδέονται με τη μορφή της συνάρτησης παλινδρόμησης και την κατανομή της τυχαίας μεταβλητής Υ. Αν, για παράδειγμα, το μοντέλο που πρόκειται να χρησιμοποιηθεί είναι τέτοιο ώστε η τυχαία μεταβλητή Υ να είναι γραμμική συνάρτηση των παραμέτρων του μοντέλου, τότε έχουμε ένα γραμμικό μοντέλο. Στην περίπτωση που η μεταβλητή Υ εξαρτάται από μία μόνο ανεξάρτητη μεταβλητή Χ έχουμε το μοντέλο της απλής γραμμικής παλινδρόμησης: Y X 0 1

Στην περίπτωση που η Υ εξαρτάται από περισσότερες τυχαίες μεταβλητές, έχουμε της πολλαπλής παλινδρόμησης: Y X... X 0 1 1 K K Αν στο μοντέλο που πρόκειται να χρησιμοποιήσουμε, η τυχαία μεταβλητή Υ δεν είναι γραμμική συνάρτηση των παραμέτρων του μοντέλου, τότε έχουμε ένα μη γραμμικό μοντέλο.

Λογιστική Παλινδρόμηση Η Λογιστική Παλινδρόμηση είναι μια ανάλυση παλινδρόμησης όπου η εξαρτημένη μεταβλητή είναι δίτιμη. Στόχος είναι η «εξήγηση» μιας διακριτής εξαρτημένης μεταβλητής η οποία παίρνει τιμές 0 και 1 1 όταν κάποιος έχει την χαρακτηριστική ιδιότητα για την οποία εξετάζουμε τον πληθυσμό 0 όταν κάποιος δεν την διαθέτει Μπορεί έτσι να εκτιμηθεί η πιθανότητα επιτυχίας από τη σύναψη μιας επιχειρηματικής συμφωνίας με βάση την εμπειρία του, τη μόρφωση, την ηλικία κ.λπ. Ή να εκτιμηθεί η πιθανότητα θανάτου ενός ασθενή με βάση ορισμένα χαρακτηριστικά και τη σοβαρότητα της ασθένειας.

Πολυμεταβλητές Τεχνικές Οι κυριότερες μέθοδοι πολυμεταβλητής ανάλυσης είναι: I Η ανάλυση κυρίων συνιστωσών I Η παραγοντική ανάλυση I Η ανάλυση κατά συστάδες I Η διαχωριστική ανάλυση I Ανάλυση Αντιστοιχιών I Ανάλυση Κανονικών Συσχετίσεων I Πολυδιάστατη Κλιμακοποίηση I Πολυμεταβλητό Γραμμικό Μοντέλο I Μέθοδοι για Δεδομένα Διεύθυνσης

Οι πολυμεταβλητές τεχνικές χρησιμοποιούνται για: Την εύρεση μεταβλητών και ερμηνεία συσχετίσεων μεταξύ των Τη δημιουργία ομάδων είτε από παρατηρήσεις είτε από μεταβλητές σύμφωνα με κάποια χαρακτηριστικά Τη μείωση των διαστάσεων συμπύκνωση της πληροφορίας μεταβλητές σε λιγότερες Την πρόβλεψη νέων τιμών του προβλήματος / που περιέχουν πολλές Τη μοντελοποίηση σε πολλές διαστάσεις, ερμηνεία πολλών μεταβλητών σε σχέση με άλλες για Την ποσοτικοποίηση μη παρατηρήσιμων ποσοτήτων την

Η ανάλυση κυρίων συνιστωσών Σκοπός της μεθόδου είναι η δημιουργία γραμμικών συνδυασμών των αρχικών μεταβλητών, έτσι ώστε οι συνδυασμοί αυτοί να είναι ασυσχέτιστοι μεταξύ τους αλλά να περιέχουν όσο το δυνατό μεγαλύτερο μέρος της διακύμανσης των αρχικών μεταβλητών. Κέρδος: Από ένα σύνολο συσχετισμένων μεταβλητών καταλήγουμε σε ένα σύνολο ασυσχέτιστων μεταβλητών. Αν οι κύριες συνιστώσες που προκύπτουν, ερμηνεύουν ένα μεγάλο ποσοστό της διακύμανσης, τότε αντί να έχουμε p μεταβλητές έχουμε λιγότερες. Εξετάζουμε τις συσχετίσεις ανάμεσα στις μεταβλητές και διαπιστώνουμε πόσο οι μεταβλητές μοιάζουν ή όχι.

Η παραγοντική ανάλυση Σκοπός της ανάλυσης είναι η ύπαρξη κοινών παραγόντων ανάμεσα σε μια ομάδα μεταβλητών. Εκφράζοντας αυτούς τους παράγοντες, που δεν είναι υπαρκτή ποσότητα αλλά την κατασκευάζουμε, μπορούμε: Να μειώσουμε τις διαστάσεις του προβλήματος Να δημιουργήσουμε νέες μεταβλητές, τους παράγοντες Να εξηγήσουμε τις συσχετίσεις ανάμεσα στα δεδομένα Στη Παραγοντική Ανάλυση υπάρχει ένα δομημένο μοντέλο και κάποιες υποθέσεις, άρα πρόκειται για μια στατιστική τεχνική, ενώ η Ανάλυση σε Κύριες Συνιστώσες είναι μαθηματικός μετασχηματισμός Στη Παραγοντική Ανάλυση εξηγούμε τη συνδιακύμανση των μεταβλητών, ενώ στην ανάλυση σε κύριες συνιστώσες τη διακύμανση

Η ανάλυση κατά συστάδες Σκοπός της Ανάλυσης Κατά Συστάδες είναι η κατάταξη σε ομάδες των υπαρχουσών παρατηρήσεων, χρησιμοποιώντας την πληροφορία που υπάρχει σε κάποιες μεταβλητές. Εξετάζει πόσο όμοιες είναι κάποιες παρατηρήσεις ως προς κάποιον αριθμό μεταβλητών ώστε να δημιουργήσει ομάδες από παρατηρήσεις που μοιάζουν μεταξύ τους. Μια επιτυχημένη ανάλυση θα πρέπει να καταλήξει σε ομάδες για τις οποίες οι παρατηρήσεις μέσα σε κάθε ομάδα να είναι όσο γίνεται πιο ομοιογενείς. Οι παρατηρήσεις διαφορετικών ομάδων θα πρέπει να διαφέρουν όσο γίνεται περισσότερο.

Η διαχωριστική ανάλυση Η βασική ιδέα της Διαχωριστικής Ανάλυσης είναι να κατατάξει παρατηρήσεις σε γνωστούς πληθυσμούς με γνωστές κατανομές για κάθε πληθυσμό. Έστω ότι έχουμε Κ πληθυσμούς. Για κάθε πληθυσμό Π κ έχουμε μία κατανομή f k (x). Σκοπός της Διαχωριστικής παρατήρηση ομάδες. Ανάλυσης είναι να στους Κ γνωστούς κατανείμει κάθε πληθυσμούς Στην ουσία ψάχνουμε για έναν κανόνα ο οποίος θα κατατάξει παρατηρήσεις. σωστά όσο το δυνατόν περισσότερες

Η Διαχωριστική Ανάλυση μοιάζει με την ανάλυση κατά συστάδες αλλά έχει και σημαντικές διαφορές. Διαχωριστική Ανάλυση Οι ομάδες είναι γνωστές Κύριο μέλημα να βρούμε ένα κανόνα ο οποίος θα βοηθήσει να λάβουμε αποφάσεις στο μέλλον Ανάλυση Κατά Συστάδες Οι ομάδες δεν είναι γνωστές Κύριος στόχος είναι να δημιουργήσουμε ομοειδείς ομάδες με σκοπό την κατανόηση των ήδη υπαρχόντων στοιχείων και τη μείωση της διασποράς σε επιμέρους ομάδες. Η Διαχωριστική Ανάλυση είναι μια μέθοδος αρκετά πολύπλοκη στην κατασκευή της, αλλά πολύ χρήσιμη και διαδεδομένη στην επιστημονική κοινότητα.

Λοιπές Τεχνικές π.χ. Ανάλυση Επιβίωσης