11. ΣΤΑΤΙΣΤΙΚΕΣ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σχετικά έγγραφα
Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Στατιστική Επιχειρήσεων ΙΙ

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Δειγματοληψία στην Ερευνα. Ετος

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Το τυπικό σφάλμα του μέσου (standard error of mean) ενός δείγματος

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική


ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Εισαγωγή στην Εκτιμητική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μέτρα θέσης και διασποράς

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Δειγματοληπτικές κατανομές

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

Ενότητα 2: Μέθοδοι δειγματοληψίας & Εισαγωγή στην Περιγραφική Στατιστική

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης

ΜΑΘΗΜΑ: Γενική Οικολογία

ΔΙΑΔΟΧΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ

Έλεγχος Υποθέσεων (Hypothesis Testing)

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Σκοπός του μαθήματος. Έλεγχος μηδενικής υπόθεσης OR-RR. Έλεγχος μηδενικής υπόθεσης. Σφάλαμα τύπου Ι -Σφάλμα τύπου ΙΙ 20/4/2013

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 2

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

09_Μη παραμετρικοί έλεγχοι υποθέσεων. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Διαστήματα Εμπιστοσύνης

Γ. Πειραματισμός Βιομετρία

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΗΝ ΕΝΟΡΓΑΝΗ ΑΝΑΛΥΣΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 2 ο ) 3/3/2017

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

Γνωστές κατανομές συνεχών μεταβλητών (συν.) (Δ). Γάμμα κατανομή

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Στατιστική Ι (ΨΥΧ-1202) ΑΣΚΗΣΕΙΣ

Σχεδιασμός και Διεξαγωγή Πειραμάτων

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Κεφάλαιο 5 Διασύνδεση Αναλογικών & Ψηφιακών Συστηµάτων

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Διάλεξη 1 Βασικές έννοιες

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

στατιστική θεωρεία της δειγµατοληψίας

Δασική Δειγματοληψία

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Μπεττίνα Χάιδιτς. Επίκουρη Καθηγήτρια Υγιεινής Ιατρικής Στατιστικής e mail:

Στατιστική. Βασικές έννοιες

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Αναγνώριση Προτύπων Ι

Κεφάλαιο 5 Διασύνδεση Αναλογικών & Ψηφιακών Συστημάτων

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Η μέθοδος των βοηθητικών μεταβλητών. Παπάνα Αγγελική

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

20-Ιαν-2009 ΗΜΥ Εισαγωγή στην Ψηφιακή Επεξεργασία Σημάτων

Εισόδημα Κατανάλωση

Αιτιότητα και τυχαίο σφάλμα στις επιδημιολογικές μελέτες

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΝΟΡΓΑΝΗ ΑΝΑΛΥΣΗ. Σινάνογλου Ι. Βασιλεία

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστικοί πίνακες. Δημιουργία κλάσεων

Νοσηλευτική Σεμινάρια

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΆΣΚΗΣΗ 1 Η διάμεσος τιμή της ηλικίας των Ελλήνων το 1990 ήταν 30 έτη. Το 2001, η διάμεσος τιμή ήταν 33,1 (Πηγή:Ε.Σ.Υ.Ε.).

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

80-2 ISBN: ), ορίσαμε μια "μέση" βαθμολογία Μ για κάθε Λύκειο

Transcript:

11. ΣΤΑΤΙΣΤΙΚΕΣ ΑΠΟΤΕΛΕΣΜΑΤΩΝ 1

ΑΚΡΙΒΕΙΑ ΤΑΞΙΝΟΜΗΣΗΣ/ΑΝΑΓΝΩΡΙΣΗΣ Ακρίβεια αναγνώρισης: (Αριθμός δεδομένων που ταξινομήθηκαν στη σωστή ομάδα) / (Συνολικός αριθμός δεδομένων που ανήκουν στην ομάδα) x 100% π.χ. Από τα 150 δεδομένα που ανήκουν στην ομάδα Α, τα 125 αναγνωρίστηκαν σωστά ως μέλη της ομάδας Α Ακρίβεια 125/150 x 100% = 83.33% Λάθος αναγνώρισης: (Αριθμός δεδομένων που ταξινομήθηκαν στη λάθος ομάδα) / (Συνολικός αριθμός δεδομένων που ταξινομήθηκαν στην ομάδα) x 100% π.χ. Από τα 150 δεδομένα που ταξινομήθηκαν στην ομάδα Α, τα 15 δεν ανήκουν στην ομάδα Α Λάθος 15/150 x 100% = 10% 2

Ακρίβεια αναγνώρισης, Acc = μέσος όρος ακρίβειας για Β διαφορετικές ομάδες εκπαίδευσης και αναγνώρισης. Δηλ. έχουμε Ν συνολικά σήματα. Τα διαχωρίζουμε σε ομάδες εκπαίδευσης (π.χ. 80% των σημάτων) και αναγνώρισης (το υπόλοιπο 20% των σημάτων). Ο συγκεκριμένος διαχωρισμός θα δώσει μια τιμή ακρίβειας, η οποία μπορεί να μην είναι αντιπροσωπευτική. Άρα: επαναλαμβάνουμε τη διαδικασία Β φορές, όπου κάθε φορά επιλέγουμε διαφορετικά σήματα στις δύο ομάδες, και: Τελική ακρίβεια = 1 Β Β ι= 1 Acci 3

ΑΝΤΕΠΙΚΥΡΩΣΗ (CROSS-VALIDATION) Leave 1 out : 1 2 3 4 5 6 7 8 9 10 Acc 1 : { 1 2 3 4 5 6 7 8 9 } { 10 } Acc : 2 { 1 2 3 4 5 6 7 8 10 } { 9 } M Acc : 10 { 2 3 4 5 6 7 8 9 10 } { 1 } Ακρίβεια = (Acc 1 + Acc 2 + + Acc 10 )/10 4

Δειγματοληψία χωρίς επανάθεση: 1 2 3 4 5 6 7 8 9 10 Acc 1 : Acc 2 : Acc B : { 1 3 5 6 7 8 4 } { 2 9 10 } { 1 2 4 9 7 8 10 } { 3 5 6 } M { 6 2 5 9 7 3 10 } { 1 4 8 } Ακρίβεια = (Acc 1 + Acc 2 + + Acc B )/B 5

BOOTSTRAP Δειγματοληψία με επανάθεση: 1 2 3 4 5 6 7 8 9 10 Acc 1 : Acc 1 : Acc B : { 1 3 5 6 7 8 4 } { 2 9 10 } { 2 3 5 6 7 8 9 } { 1 4 10 } M { 1 2 4 3 7 8 10 } { 9 5 6 } Ακρίβεια = (Acc 1 + Acc 2 + + Acc B )/B 6

ΔΙΑΣΤΗΜΑΤΑ ΑΞΙΟΠΙΣΤΙΑΣ, ΔΑ (CONFIDENCE INTERVALS, CIS) Ερμηνεία: μπορούμε να είμαστε [(1-α)x100]% σίγουροι ότι η πραγματική τιμή της στατιστικής που μας ενδιαφέρει συμπεριλαμβάνεται στα όρια με επίπεδο α (α<1), βάση των συγκεκριμένων δεδομένων και την υπολογισμένη ΣΚΠ, και αν η διαδικασία από την οποία έχουν παρθεί τα δεδομένα επαναληφθεί. Κλασσική μέθοδος υπολογισμού: χρησιμοποίηση της τυπικής απόκλισης ως ±error bars γύρω από την υπολογισμένη τιμή. εύκολος τρόπος Παραμετρικές μεθόδοι Μη-παραμετρικές μεθόδοι: bootstrap 7

Δημιουργία Β νέων δεδομένων, Χ β*, μέσω δειγματοληψίας με επανάθεση των δεδομένων Χ={x 1,...,x Ν }. Υπολογισμός της τιμής που μας ενδιαφέρει για τα νέα δεδομένα, με αποτέλεσμα να έχουμε Β νέες τιμές, θ β * Κατατάσσουμε τις τιμές από τη μικρότερη στη μεγαλύτερη Τα ΔΑ ορίζονται ως οι τιμές των θ αx(β+1)* και θ (1-α)x(Β+1) * Για υπολογισμό των 90-95% ΔΑ συστήνεται η επιλογή 1000 Β 2000, επειδή όμως χρησιμοποιούμε Β+1 επιλέγουμε Β=999 ή 1999. 8

Π.Χ. ΔΑ ΓΙΑ ΤΙΜΕΣ ΑΠ ΑΝΕΞΑΡΤΗΤΩΝ ΔΕΔΟΜΕΝΩΝ 9

ΣΤΑΤΙΣΤΙΚΗ ΣΗΜΑΝΤΙΚΟΤΗΤΑ Κατά πόσο οι τιμές που παίρνουμε μπορούν να θεωρηθούν σημαντικές από στατιστικής πλευράς. Έλεγχος στατιστικής υπόθεσης: θέτουμε δύο στατιστικές υποθέσεις και μέσω στατιστικών μεθόδων μπορούμε να απορρίψουμε τη μια και να δεχτούμε την άλλη Δημιουργία υποκατάστατων δεδομένων ανάλογα με τη στατιστική υπόθεση χρησιμοποιούμε διαφορετικό τρόπο δημιουργίας τους Το επίπεδο σημαντικότητας, α, προσδιορίζει τον αριθμό των υποκατάστατων δεδομένων, Μ: Μ=1/α-1 10

Π.χ. Αν θέλουμε να δούμε κατά πόσο η τιμή της ΑΠ μεταξύ δύο σημάτων είναι στατιστικά σημαντική με επίπεδο 0.05 τότε έχουμε τις δύο στατιστικές υποθέσεις: Η1: τα δεδομένα είναι ανεξάρτητα Η2: τα δεδομένα είναι εξαρτώμενα (άρα και η τιμή της ΑΠ είναι σημαντική) Δημιουργούμε Μ=1/0.05-1=19 υποκατάστατα σήματα Υπολογίζουμε την ΑΠ για αυτά τα 19 σήματα Από αυτές τις 19 τιμές επιλέγουμε τη μεγαλύτερη Αν η αρχική τιμή της ΑΠ για το σήμα μας υπερβαίνει τη μεγαλύτερη τιμή της ΑΠ από τα 19 υποκατάστατα σήματα τότε μπορούμε να απορρίψουμε την υπόθεση Η1, και επομένως η τιμή της ΑΠ είναι σημαντική. Αν όχι, τότε δεν μπορούμε να πούμε με σιγουριά ότι η τιμή είναι σημαντική. 11

Π.Χ. ΔΑ ΓΙΑ ΤΙΜΕΣ ΑΠ ΑΝΕΞΑΡΤΗΤΩΝ ΔΕΔΟΜΕΝΩΝ 12

13 ΕΠΟΜΕΝΟ ΜΑΘΗΜΑ: Μέτρηση απόδοσης Προβλήματα Το μέλλον