Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download ""

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών ΧΡΗΣΤΟΣ ΧΑΤΖΗΝΑΚΟΣ Πτυχίο Μαθηματικών Αλγόριθμοι Ανίχνευσης Εκτοπων παρατηρήσεων (Outliers) στην Ανθεκτική (Robust) Εκτίμηση Συνδιακύμανσης και Παλινδρόμησης ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ ΘΕΣΣΑΛΟΝΙΚΗ, 2014

2

3 ΧΡΗΣΤΟΣ ΧΑΤΖΗΝΑΚΟΣ Αλγόριθμοι Ανίχνευσης Εκτοπων παρατηρήσεων (Outliers) στην Ανθεκτική (Robust) Εκτίμηση Συνδιακύμανσης και Παλινδρόμησης ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ Παραδόθηκε στον Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών, Πολυτεχνική Σχολή Ημερομηνία προφορικής εξέτασης: Νοέμβριος, 2014 Συμβουλευτική επιτροπή Αναπληρωτής Καθηγητής Γ. Ζιούτας, Επιβλέπων καθηγητής Ομότιμος Καθηγητής Κ. Τσούρος, Μέλος τριμελούς επιτροπής Επίκουρος Καθηγητής Σ. Κορτεσης, Μέλος τριμελούς επιτροπής

4 ς ΧΡΗΣΤΟΣ ΧΑΤΖΗΝΑΚΟΣ ς Α.Π.Θ. Αλγόριθμοι Ανίχνευσης Εκτοπων παρατηρήσεων (Outliers) στην Ανθεκτική (Robust) Εκτίμηση Συνδιακύμανσης και Παλινδρόμησης ISBN Η έγκριση της παρούσης διδακτορικής διατριβής από το Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών της Πολυτεχνικής Σχολής του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης δεν υποδηλώνει αποδοχή των γνωμών του συγγραφέως (Ν. 5343/1932, άρθρο 202, παρ. 2).

5 ΕΥΧΑΡΙΣΤΙΕΣ Τελειώνοντας τη συγγραφή αυτής της διατριβής θα ήθελα να ευχαριστήσω τους ανθρώπους που διέθεσαν τη γνώση, την εμπειρία και το χρόνο τους, συντελώντας έτσι στην ολοκλήρωση της. Θέλω πραγματικά να ευχαριστήσω εκ βαθέων τον επιβλέποντα αυτής της διδακτορικής διατριβής αναπληρωτή καθηγητή Γεώργιο Ζιούτα για την αδιάλειπτη επιστημονική στήριξη τόσο κατά την διεξαγωγή της έρευνας όσο και κατά την διαμόρφωση, με βάση τα ερευνητικά δεδομένα, των δημοσιευμένων ή υπό δημοσίευση εργασιών καθώς και της παρούσας. Ευχαριστώ τα μέλη της συμβουλευτικής μου επιτροπής επίκουρο καθηγητή Σταυρο Κορτέση και τον ομότιμο καθηγητή Κωνσταντίνο-Κλαύδιο Τσούρο για τις εποικοδομητικές παρατηρήσεις και την υποστήριξή τους. Θέλω να εκφράσω τις ειλικρινείς μου ευχαριστίες στους καθηγητές, στο προσωπικό και στους συνεργάτες του πρώην Γενικού Τμήματος της Πολυτεχνικής Σχολής του Α.Π.Θ. που βοήθησαν με τον τρόπο τους στην ολοκλήρωση της διατριβής αυτής. Επίσης θέλω να ευχαριστήσω τον Θεόδωρο Γκεβετζέ για την πολύτιμη βοήθειά του σε τεχνικά θέματα. Τέλος, ευχαριστώ μέσα από την καρδιά μου τους γονείς μου και την γυναίκα μου για την υπομονή που επέδειξαν και την απόλυτη συμπαράσταση και στήριξη που μου προσέφεραν. Χρήστος Ν. Χατζηνάκος Θεσσαλονίκη, Νοέμβριος 2014

6

7 Κάνε πάντα όσο μπορείς το καλό. Προ πάντων αγάπα την Ελευθερία. Και ένα θρόνο αν σου δώσουν ακόμα, ποτέ μην προδώσεις την αλήθεια. Μπετόβεν

8

9 Περιεχόμενα 1 Εισαγωγή Στην Ανθεκτική Στατιστική Γενικά Κριτήρια Ανθεκτικότητας Προβλήματα Θέσης και Κλίμακας Αλγόριθμοι Ανθεκτικής Στατιστικής Ανθεκτική Εκτίμηση Θέσης (μέση τιμή, διάμεσος) Ανθεκτική Εκτίμηση Συνδιακύμανσης Ανθεκτική Εκτίμηση Παλινδρόμησης Ανθεκτική Διαδικασία με Μαθηματικό Προγραμματισμό Νέοι Αλγόριθμοι Ανθεκτική Εκτίμηση Θέσης (μέση τιμή, διάμεσος) Ανθεκτική Εκτίμηση Συνδιακύμανσης Ανθεκτική Εκτίμηση Παλινδρόμησης Συνεισφορά Διατριβής Δομή Διατριβής Ανθεκτική Εκτίμηση Θέσης Γενικά LTAD Εκτιμητής LTAD Νέος Αλγόριθμος για την Εκτίμηση των Ελάχιστων Αποκομμένων Απολύτων Αποκλίσεων χρησιμοποιώντας Μαθηματικό Προγραμματισμό Αριθμητική Μέθοδος για την λύση του LTAD προβλήματος Λύνοντας το Μοντέλο LP-LTAD πιο Αποδοτικά Παράδειγμα-Αποτελέσματα Προσομοίωσης Ιδιότητες του LP-LTAD (Ανθεκτικότητα και Αποδοτικότητα) Παράδειγμα Αποτελέσματα Προσομοίωσης Συμπεράσματα iii

10 3 Εντοπισμός Εκτοπων και Ανθεκτικός Πίνακας Συνδιακύμανσης Γενικά Ορίζουσα Ελάχιστου Πίνακα Συνδιακύμανσης Minimum Covariance Determinant (MCD) Ο Αλγόριθμος του FastMCD OGK Αιτιοκρατικός Αλγόριθμος του MCD Αρχικές Εκτιμήσεις Διασποράς Ο Εκτιμητής SD Ο Εκτιμητής PCOut Νέος Εκτιμητής Ελάχιστων Αποκομμένων Ευκλείδειων Αποκλίσεων LTED Εντοπισμός των Εκτοπων Θέσης Ανθεκτική Πολυδιάστατη Εκτίμηση Θέσης LTED Εντοπισμός Εκτοπων Διασποράς Αποτελέσματα Προσομοίωσης Πραγματικά δεδομένα Ισομεταβλητότητα Υπολογιστικός Χρόνος Συμπεράσματα Εκτιμητές Παλινδρόμησης Υψηλού Σημείου Κατάρρευσης Γενικά Οι Εκτιμητές Υψηλού Σημείου Κατάρευσης LTS, MM Ο Εκτιμητής LTS Οι ΜΜ-Εκτιμητές Ο PTS Εκτιμητής Υπολογισμός του PTS LTED Ανθεκτική Μοχλότητα h i και ο Εκτιμητής PTS-LTED Monte Carlo Αποτελέσματα Συμπεράσματα LTAD-Παλινδρόμηση Γενικά LTAD Παλινδρόμηση Νέα Αποκομμένη Διαδικασία για το LTAD Weighted Least Absolute Deviation (WLAD) Παλινδρόμηση Αποτελέσματα Προσομοίωσης Αποτέλεσμα Προσομοίωσης για τους Εκτιμητές LP-LAD, LP-WLAD Monte Carlo Αποτελέσματα για το LP-WLTAD

11 6 Συμπεράσματα Summary for PhD thesis with title: Algorithms for Detecting Outliers in Robust Location, Covariance and Regression Estimation Introduction Proposed Algorithms-Estimators Robust Location Estimate (mean, median) Robust Covariance Estimate Robust Regression Estimate Conclusions

12

13 Κατάλογος Σχημάτων 2.1 Σχεδίαση της ασυμπτωτικής διακύμανσης σε κανονική κατανομή N(0, 1) Βιοχημικά δεδομένα Γραφική απεικόνιση για τα Stars δεδομένα του παραδείγματος Γραφική απεικόνιση διασποράς του συνόλου δεδομένων για n=100, n out =20 και p = MSE αποτελέσματα 100 επαναλήψεων, ρ=0.99, n=100, n out =20 και p= MSE αποτελέσματα 100 επαναλήψεων, ρ=0.7, n = 100, n out =20 και p= Αποτελέσματα προσομοίωσης για n=40 παρατηρήσεις και δυο προγνωστικούς παράγοντες. Οχι έκτοπα Αποτελέσματα προσομοίωσης για n=40 παρατηρήσεις και δυο προγνωστικούς παράγοντες. 10% έκτοπα, όχι σημεία μόχλευσης Αποτελέσματα προσομοίωσης για n=40 παρατηρήσεις και δυο προγνωστικούς παράγοντες. 20% έκτοπα, όχι σημεία μόχλευσης Αποτελέσματα προσομοίωσης για n=40 παρατηρήσεις και δυο προγνωστικούς παράγοντες. 10% έκτοπα σε σημεία μόχλευσης Αποτελέσματα προσομοίωσης για n=40 παρατηρήσεις και δυο προγνωστικούς παράγοντες. 20% έκτοπα σε σημεία μόχλευσης Αποτελέσματα προσομοίωσης για n=40 παρατηρήσεις και δυο προγνωστικούς παράγοντες. 20% μεγάλα έκτοπα σε σημεία μόχλευσης Αποτελέσματα προσομοίωσησς για n = 100 παρατηρήσεις και έξι προγνωστικούς παράγοντες. Οχι έκτοπα Αποτελέσματα προσομοίωσης για n = 100 παρατηρήσεις και έξι προγνωστικούς παράγοντες. 10% έκτοπα, όχι σημεία μόχλευσης Αποτελέσματα προσομοίωσης για n = 100 παρατηρήσεις και έξι προγνωστικούς παράγοντες. 20% έκτοπα, όχι σημεία μόχλευσης Αποτελέσματα προσομοίωσης για n = 100 παρατηρήσεις και έξι προγνωστικούς παράγοντες. 10% έκτοπα σε σημεία μόχλευσης. 115 vii

14 5.11 Αποτελέσματα προσομοίωσης για n = 100 παρατηρήσεις και έξι προγνωστικούς παράγοντες. 20% έκτοπα σε σημεία μόχλευσης Αποτελέσματα προσομοίωσης για n = 100 παρατηρήσεις και έξι προγνωστικούς παράγοντες. 20% μεγάλα έκτοπα σε σημεία μόχλευσης

15 Κατάλογος Πινάκων 2.1 Εκτίμηση διαμέσου για σύνολο δεδομένων κανονικής κατανομής, N(0, 1) Εκτίμηση θέσης για το σύνολο δεδομένων του Forbes MSE τοπικών εκτιμήσεων, n = 50, p = 1, 2, 3, μόλυνση δεδομένων με N(µ = 3.3, σ 2 = ) MSE τοπικών εκτιμήσεων, n = 50, p = 1, 2, 3, μόλυνση δεδομένων με N(µ = 3.3, σ 2 = ) MSE τοπικών εκτιμήσεων, n = 100, p = 1, 3, 5, μόλυνση δεδομένων με N(µ = 3.3, σ 2 = ) MSE τοπικών εκτιμήσεων, n = 50, p = 2, 3, συσχέτιση ρ=0.7, μόλυνση δεδομένων με N(µ = 3.3, σ 2 = ) MSE τοπικών εκτιμήσεων, n = 50, p = 2, 3, συσχέτιση ρ=0.7, μόλυνση δεδομένων με N(µ = 3.3, σ 2 = ) MSE τοπικών εκτιμήσεων, n = 100, p = 3, 5, συσχέτιση ρ=0.7, μόλυνση δεδομένων με N(µ = 3.3, σ 2 = ) MSE τοπικών εκτιμήσεων, n = 50, p = 1, 3, 5, μόλυνση δεδομένων με N(µ = 0.75, σ 2 = 0.5) MSE τοπικών εκτιμήσεων, n = 100, p = 1, 3, 5, μόλυνση δεδομένων με N(µ = 0.75, σ 2 = 0.5) MSE τοπικών εκτιμήσεων, n = 500, p = 10, 20, μόλυνση δεδομένων με N(µ = 3.3, σ 2 = ) MSE τοπικών εκτιμήσεων, n = 500, p = 10, 20, μόλυνση δεδομένων με N(µ = 0.75, σ 2 = 0.5) Βιοχημικά δεδομένα Βιοχημικά δεδομένα Εκτίμηση θέσης διαμέσου για σύνολα δεδομένων με N(0,1), n= Αποτελέσματα Προσομοίωσης %FN και %FP, p=10, n=1000, n out =100, ɛ=10%, ρ mult =0.5, 500 προσομοιώσεις %FN και %FP, p=10, n=1000, n out =100, ɛ=30%, ρ mult =0.5, 500 προσομοιώσεις ix

16 3.7 Εκτοπα παραγόμενα με ελαφρώς μεγαλύτερο πίνακα συνδιακύμανσης (δ 2 =1.2) Δεδομένα Ιονόσφαιρας: Σημεία με την μεγαλύτερη Mahalanobis απόσταση LRS: Σημεία με την μεγαλύτερη Mahalanobis απόσταση Προσομοίωση για p = 5, n = 50, ɛ =.2 Με σταθερές και τυχαίες συντεταγμένες Μέτρηση της ισομεταβλητότητας για τα δεδομένα της Ιονόσφιαρας Χρόνος για δεδομένα προσομοίωσης σε δευτερόλεπτα a = b + cxd Αποτελέσματα υπολογιστικού χρόνου, n=2000, n out =100, ρ mult = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 32% (6 κακά x-έκτοπα, 4 καλά x-έκτοπα, 6 y-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 12% (6 κακά x-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα καλής μόλυνσης 12% (6 καλά x-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 32% (10 κακά x-έκτοπα, 6 y-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 32% (6 κακά x-έκτοπα, 4 καλά x-έκτοπα, 6 y-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 32% (10 κακά x-έκτοπα, 6 y-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 10% στο (x 1,..., x p, y) = (1, 100, 0,..., 0, 100) Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 20% στο (x 1,..., x p, y) = (1, 100, 0,..., 0, 220) Εκτίμηση (βx i ) για σύνολο δεδομένων κανονικής κατανομής N(0, 1) Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 32% (6 κακά x-έκτοπα, 4 καλά x-έκτοπα, 6 y-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 12% (6 κακά x-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 =

17 5.4 Αποτελέσματα απόδοσης εκτιμητών σε δείγματα καλής μόλυνσης 12% (6 καλά x-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 = Αποτελέσματα απόδοσης εκτιμητών σε δείγματα μόλυνσης 32% (10 κακά x-έκτοπα, 6 y-έκτοπα), n = 50, p = 3. Αληθινές τιμές: β 0 = 0.0, β 1 = 1.20, β 2 =

18

19 Ευρετήριο Αλγορίθμων 1 Κεντράρισμα των x i στον μηδέν για την LP-LTAD διαδικασία Subgradient μέθοδος για την λύση του LP-LTAD Συγκεντρωτικό βήμα C-step OGK Εκτίμηση για θέση και διασπορά Αλγόριθμος του DetMCD Τοπική διαδικασία (X n, h) Βήμα Κεντραρίσματος C-Step Βήμα κεντραρίσματος μετασχηματισμένων Δεδομένων LTED(X n, h) Βήμα κεντραρίσματος C-Βήμα Συγκεντρωτικός Αλγόριθμος της διαδικασίας του LTED Κεντράρισμα των y i στον μηδέν για την LP-LTAD διαδικασία. 101 xiii

20

21 Κεφάλαιο 1 Εισαγωγή Στην Ανθεκτική Στατιστική 1.1 Γενικά Οι περισσότεροι στατιστικοί εκτιμητές βασίζονται σε ένα αριθμό υποθέσεων. Γενικά, αυτές οι υποθέσεις αποσκοπούν στο να μοντελοποιήσουμε τα στατιστικά δεδομένα, έτσι ώστε να διευκολυνθούμε στην τεκμηρίωση των στατιστικών και υπολογιστικών ιδιοτήτων του εκτιμητή. Συχνά όμως, τα μοντέλα είναι α- πλουστεύσεις της πραγματικότητας και η εγκυρότητα τους είναι στην καλύτερη περίπτωση προσεγγιστική. Η πιο συνηθισμένη υπόθεση στην στατιστική μοντελοποιήση είναι ότι τα δεδομένα ακολουθούν την κανονική (Gaussian) κατανομή. Η υπόθεση αυτή εδώ και δυο αιώνες είναι η δομή για όλες τις κλασσικές μεθόδους στην ανάλυση διακύμανσης, παλινδρόμησης και αλλού. Κυρίως, η υπόθεση της κανονικής κατανομής τίθεται διότι αντιπροσωπεύει κατά προσέγγιση τα περισσότερα από τα στατιστικά δεδομένα και ταυτόχρονα επιτρέπει την διεξαγωγή των καλών ιδιοτήτων των εκτιμητών. Τους εκτιμητές αυτούς, οι οποίοι βασίζονται στις υποθέσεις ότι πληρείται ακριβώς η κανονικότητα τους αναφέρουμε ως κλασικούς εκτιμητές. Στην πραγματικότητα όμως, η υποτιθέμενη κανονική κατανομή για ένα σύνολο δεδομένων σε έναν εκτιμητή (κεντρικής τάσης, συνδιακύμανσης, παλινδρόμησης κ.τ.λ) πληρείται προσεγγιστικά στο ότι περιγράφει την πληθώρα των δεδομένων, μερικές παρατηρήσεις ακολουθούν μια διαφορετική μορφή ή και καθόλου μορφή. Με άλλα λόγια, ενώ τα περισσότερα δεδομένα ακολουθούν την κανονική κατανομή, ένα μικρότερο ποσοστό παρατηρήσεων βρίσκεται μακριά από την πληθώρα των δεδομένων. Τέτοιες αχαρακτήριστες παρατηρήσεις ο- νομάζονται έκτοπες (outliers) και επιδρούν καταστροφικά στους κλασσικούς εκτιμητές, οι οποίοι είναι βέλτιστοι κάτω από συνθήκες κανονικότητας. Ε- ναλλακτικά, ως outliers μπορούμε να χαρακτηρίσουμε έκτοπες τιμές οι οποίες εμφανίζονται με μεγαλύτερη συχνότητα από ότι στην κανονική κατανομή, ενώ το σχήμα της κανονικής κατανομής βρίσκεται κυρίως στην κεντρική περιοχή 1

22 των δεδομένων. Αξίζει να παρατηρήσουμε, ότι όταν τα στατιστικά δεδομένα ακολουθούν προσεγγιστικά την κανονική κατανομή, οι εκτιμητές δεν οδηγούν προσεγγιστικά σε καλά αποτελέσματα. Εάν υποθέσουμε ότι η πληθώρα των δεδομένων ακολουθεί κανονική κατανομή αλλά στην πραγματικότητα εμφανίζονται συχνότερα έκτοπες τιμές, τότε οι εκτιμήσεις μέγιστης πιθανοφάνειας παύουν να είναι βέλτιστες. Εμφανίζουν μεγάλη διακύμανση και μεγάλη μεροληψία εάν οι έκτοπες τιμές είναι ασύμμετρες. Στην στατιστική ανάλυση, οι ανθεκτικοί εκτιμητές αποσκοπούν στις α- ξιόπιστες εκτιμήσεις των παραμέτρων των στοχαστικών μοντέλων, όχι μόνο στην περίπτωση όπου τα δεδομένα ακολουθούν την υποτιθέμενη κατανομή (κανονική), αλλά επίσης όταν αυτό συμβαίνει προσεγγιστικά, όπως περιγράψαμε παραπάνω. Ενώ έμφαση δίνεται στις προσεγγιστικές κανονικές κατανομές, οι ανθεκτικοί εκτιμητές είναι αποτελεσματικοί και για άλλες κατανομές, οι οποίες είναι κοντά στην κανονική. Οι ανθεκτικοί εκτιμητές προσαρμόζονται καλά στην πληθώρα των δεδομένων. Αν τα δεδομένα δεν περιέχουν έκτοπα σημεία δίνουν προσεγγιστικά τις ίδιες εκτιμήσεις με τους κλασσικούς εκτιμητές. Παρατήρηση 1.1. Μια καλή συνέπεια από την προσαρμογή στην πληθώρα των δεδομένων ( καθαρά ), οι ανθεκτικοί εκτιμητές αποτελούν αξιόλογη τεχνική για αναγνώριση των έκτοπων, ακόμα και σε πολυδιάστατα δεδομένα. Εναλλακτική προσέγγιση αντιμετώπισης των έκτοπων είναι η τεχνική της διάγνωσης. Τα διαγνωστικά είναι στατιστικά εκτιμημένα με κλασικές μεθόδους, τα οποία οδηγούν σε αριθμητικά ή γραφικά συμπεράσματα για δεδομένα τα οποία αποκλίνουν από την κανονικότητα. Υπάρχει αρκετή βιβλιογραφία? για τα διαγνωστικά των έκτοπων αλλά η προσέγγιση αυτή έχει δυο μειονεκτήματα: Τα διαγνωστικά δεν είναι πάντα αξιόπιστα, κυρίως όταν τα δεδομένα περιέχουν επικαλυπτόμενα έκτοπα. Οταν δεν υπάρχει σαφή κριτήριο για την δειγματική τιμή των διαγνωστικών προκειμένου να χαρακτηρίσουμε τις αντίστοιχες παρατηρήσεις ως έκτοπες. Οι ανθεκτικές μέθοδοι αναπτύχθηκαν μετά το 1960 κυρίως από τους John Tukey (1960, 1962), Peter Huber (1964, 1967) και Frank Hampel (1971, 1974). Εχουν αναπτυχθεί και μελετηθεί ανθεκτικοί εκτιμητές καθώς και οι υπολογιστικοί αλγόριθμοι τους οι οποίοι είναι διαθέσιμοι σε αρκετά στατιστικά πακέτα όπως: S-PLUS, SAS και άλλα. Σκοπός των ανθεκτικών μεθόδων είναι η αύξηση αξιοπιστίας και ακρίβειας της εκτίμησης των διαφόρων στατιστικών μοντέλων. Για κάθε εκτίμηση παραμέτρων κεντρικής τάσης, συνδιακύμανσης, παλινδρόμησης κ.τ.λ., υπάρχουν αρκετές ανθεκτικές μέθοδοι και αναλυτής έχει διάφορες επιλογές για το προβλημά του. Για να επιλέξει κάποιος την πιο κατάλληλη μέθοδο η αλγόριθμο είναι σημαντικό να γνωρίζει πως λειτουργούν οι ανθεκτικοί μέθοδοι. Τα κυριότερα προβλήματα τα οποία μας απασχολούν σε αυτήν την διατριβή είναι τα ακόλουθα:

23 Τα στατιστικά δεδομένα περιέχουν έκτοπες παρατηρήσεις (outliers), οι οποίες αποκλίνουν από την γενική μορφή (pattern) ή τον κύριο όγκο (balk) δεδομένων. Οι κλασικές δειγματικές εκτιμήσεις, όπως μέσης τιμής, συνδιακύμανσης, παλινδρόμησης με ελάχιστα τετράγωνα μπορεί να επηρεασθούν δυσμενώς από τα έκτοπα. Να αναπτυχθούν νέες ανθεκτικές μέθοδοι εκτίμησης παραμέτρων και ταυτόχρονα αναγνώρισης των έκτοπων. Ακόμα να συγκριθούν με τις υπάρχουσες ανθεκτικές μεθόδους και στα δύο, όταν τα δεδομένα περιέχουν έκτοπα, καθώς και όταν είναι ( καθαρά ). Παρατήρηση 1.2. Αξίζει να σημειωθεί ότι δεν θα έπρεπε πάντοτε να θεωρούμε ότι τα έκτοπα είναι ( κακά ) δεδομένα. Αυτά μπορούν να περιέχουν απροσδόκητα σχετική πληροφορία Κριτήρια Ανθεκτικότητας Παραμετρικά Μοντέλα Στην στατιστική εκτιμήση υποθέτουμε ότι οι παρατηρούμενες τιμές x 1, x 2,..., x n είναι ανεξάρτητες τυχαίες μεταβλητές με την ίδια κατανομή πιθανότητας F θ και επιθυμούμε την εκτίμηση του θ από τις n παρατηρήσεις. Δηλαδή προσπαθεί κανείς να προβλέψει με βάση το δείγμα, την τιμή της παραμέτρου θ, όσο το δυνατόν πλησιέστερα στην αληθινή τιμή, εφόσον η υπόθεση μας για την F θ είναι σωστή. Για παράδειγμα, η μέθοδος μεγίστης πιθανοφάνειας οδηγεί στην βέλτιστη εκτίμηση όταν ισχύει το υποθετικό μοντέλο. Συχνά όμως η πραγματική κατανομή των παρατηρήσεων δεν συμπίπτει ακριβώς με κάποια από τις κατανομές F θ του υποθετικού παραμετρικού μοντέλου. Οι τρείς κυριότερες αιτίες που διακρίνει ο Hampel (1971) είναι οι εξής: Ενδέχεται να υπάρχουν μικτά σφάλματα στα δεδομένα, μια τιμή π.χ. δεν αντιγράφθηκε σωστά κ.τ.λ. Πιθανόν να υπάρχει περιορισμένη ακρίβεια στις μετρήσεις. Η αληθινή κατανομή, εκτός των δύο πρώτων παραβιάσεων διαφέρει στην μορφή της από την F θ. Οι παραβιάσεις αυτές από το μοντέλο F θ όσο ήπιες και αν είναι επιδρούν δυσμενώς στην συμπεριφορά του βέλτιστου εκτιμητή. Για να αντιμετωπίσουμε την συνέπεια των αποκλίσεων, από το υποθετικό μοντέλο, ο πιο σωστός τρόπος είναι να περιορίσουμε την επίδραση ή να διαγράψουμε μερικά έκτοπα και να πλησιάσουμε έτσι την υποθετική κατανομή. Οι σύγχρονοι ανθεκτικοί αλγόριθμοι συγκεντρώνονται περισσότερο στο κύριο μέρος των δεδομένων και δουλεύουν σωστά για τις παραμέτρους του

24 μοντέλου παρά την παρουσία των έκτοπων ή και άλλων αποκλίσεων από το μοντέλο F θ. Για να καταλάβουμε τον τρόπο με τον οποίο οι ανθεκτικοί εκτιμητές (θέσης, διασποράς, παλινδρόμησης) συμπεριφέρονται είναι χρήσιμο να αναφερθεί ότι μια καλή ανθεκτικότητα διακρίνεται σε: ποιοτική ποσοτική βέλτιστη Ποιοτική Ανθεκτικότητα Ενας εκτιμητής ορίζεται ως ανθεκτικός αν μικρές αλλαγές στο υποθετικό παραμετρικό μοντέλο F θ επιφέρουν μικρές αλλαγές στον εκτιμητή. Ο Huber (1981) υπέδειξε την Prokhorov απόσταση ως ένα αποδεκτό κατάλληλο μέτρο για να προσδιορίσει τις μικρές αλλαγές σε μια κατανομή. Αν το δείγμα x 1, x 2,..., x n ακολουθεί την εμπειρική κατανομή F θ, ο εκτιμητής ˆθ (για το θ) περιγράφεται ως: ˆθ(F n ) = ˆθ n (x 1, x 2,..., n) (1.1) ή πιο μεθοδικά, ο ορισμός της εκτίμησης ˆθ(F n ) επεκτείνεται φυσιολογικά σ εναν αριθμό του ˆθ(F n ): ˆθ(F ) = lim ˆθ(F n ) (1.2) n όπου F είναι η αληθινή κατανομή των παρατηρήσεων, και εάν ο εκτιμητής ικανοποιεί την παραπάνω σχέση καλείται συνεπής στην F. Ακόμη, αν ο εκτιμητής ικανοποιεί την σχέση: ˆθ(F θ ) = θ, καλείται συνεπής κατά Fisher. Στην περίπτωση όπου το παραμετρικό μοντέλο F θ είναι μια προσέγγιση πραγματική, είναι φυσιολογικό να απαιτούμε ότι ο εκτιμητής ˆθ είναι συνεχής. Συνέχεια σημαίνει ότι το ˆθ(F n ) αλλάζει μόνο ελαφρά, αν γίνει μια μικρή αλλαγή στο δείγμα, είτε εξαιτίας μικτών σφαλμάτων σε μερικές παρατηρήσεις, είτε μικρών αλλαγών σ ολες τις παρατηρήσεις x i. Επίσης συνέχεια σημαίνει ότι αν F είναι κοντά στην F θ, τότε το ˆθ(F ) είναι κοντά στο θ. Συμπεραίνουμε λοιπόν ότι μια εκτιμήτρια ˆθ είναι ανθεκτική, εάν είναι συνεχής. Πιο γενικοί ορισμοί της ποιοτικής ανθεκτικότητας έχουν δοθεί από τους Hampel (1971) και Huber (1981). Μια χρήσιμη πρακτική ερμηνεία των ορισμών ποιοτικής ανθεκτικότητας είναι η εξής: Εάν δύο εμπειρικές κατανομές δεδομένων F n, G n έχουν μικρή απόσταση σύμφωνα με κάποιο μέτρο το οποίο αναφέρθηκε παραπάνω, Prokhovov, π(f n, G n ) < δ, και ισχύει: ˆθ n (F n ) ˆθ n (G n ) < ɛ (1.3)

25 συνεπάγεται ότι η εκτιμήτρια ˆθ n είναι ανθεκτική στην F, σύμφωνα με λήμμα του Hampel (1971). Ακόμα ο Hampel απέδειξε ότι αν μια εκτιμήτρια είναι συνεχής στην F, τότε η ˆθ n είναι ανθεκτική στην F. Συνήθως στην πράξη ενδιαφερόμαστε για την συμπεριφορά του εκτιμητή ˆθ n, για ένα ορισμένο n, και θέλουμε να έχει τις εξής ιδιότητες: Η κατανομή του ˆθ n για δείγμα που προέρχεται από την κατανομή F θ, L Fθ (ˆθ n ), να είναι όσο το δυνατόν πλησίον του θ. Η κατανομή του ˆθ n για δείγμα προέρχεται από την κατανομή G, L G (ˆθ n ), να διαφέρει όσο το δυνατόν λιγότερο από την L Fθ (ˆθ n ) όταν η G είναι πολύ κοντά στην F θ. Οι περισότερρες ανθεκτικές προσεγγίσεις μέχρι τώρα, ερευνούν τις ασυμπτωτικές ιδιότητες της ˆθ (καθώς ο αριθμός των παρατηρήσεων n τείνει στο άπειρο) και ελέγχουν συνήθως με την μέθοδο Monte Carlo τις ιδιότητες των εκτιμητών για κάποιο σταθερό n. Η ερμηνεία των ιδιοτητών της ˆθ μπορεί να είναι διαφορετική για διαφορετικές τιμές του n και πολύ διαφορετική για την ασυμπτωτική ερμηνεία. Λαμβάνοντας υπόψη τα παραπάνω, μια εκτιμήτρια ˆθ θα πρέπει να έχει τις ακόλουθες ιδιότητες: 1. Η ˆθ είναι συνεχής σε όλες τις κατανομές F θ (σύμφωνα με την Prokhorov απόσταση) και αυτό σημαίνει ανθεκτικότητα και συνέπεια ˆθ(F θ ) = Η ˆθ είναι βέλτιστη εκτιμήτρια του θ, με την έννοια ότι η κατανομή της L F (ˆθ n ) έχει την μικρότερη δυνατή διακύμανση. 3. Η εκτιμήτρια ˆθ αλλάζει όσο το δυνατόν λιγότερο σε μικρή περιοχή της F θ για κάθε θ (ανθεκτικότητα). 4. Η εκτίμηση ˆθ δεν απομακρύνεται πολύ από το θ για μια πλατύτερη περιοχή της F θ για κάθε θ. 5. Η εκτίμηση ˆθ είναι εύκολο να υπολογισθεί. Η κυριότερη αντίθεση δημιουργείται μεταξύ των ιδιοτήτων 2 και 3. Εάν ο βέλτιστος εκτιμητής για το μοντέλο δεν είναι ανθεκτικός, πρέπει να γίνει κάποιος συμβιβασμός μεταξύ βελτιστοποίησης και ανθεκτικότητας. Ο συμβιβασμός αυτός εξαρτάται από το μέγεθος του δείγματος, την διακύμανση του εκτιμητή και την ευαισθησία, όπως ορίζεται στην επόμενη παράγραφο. Ποσοτική Ανθεκτικότητα Είναι πολύ χρήσιμο να περιγράψουμε ποσοτικά το μέγεθος της αλλαγής, που επιφέρει μια μικρή αλλαγή της υποκείμενης κατανομής F, στην κατανομή L F (ˆθ) ενός εκτιμητή ˆθ n = ˆθ n (x 1, x 2,..., x n ).

26 Παράδειγμα 1.1. Για να κατανοήσουμε καλύτερα τους ορισμούς, οι οποίοι θα δοθούν συνέχεια, χρησιμοποιούμε ένα τεχνητό σύνολο δεδομένων δημιουργώντας αριθμούς από την κατανομή N(0, 1). Για να μετρήσουμε την επίδραση των διαφορετικών θέσεων ενός έκτοπου, εισάγουμε ένα επιπλέον σημείο x 0 το οποίο επιτρέπεται να περιφέρεται επάνω στην γραμμή. Η καμπύλη ευαισθησίας της εκτίμησης ˆµ για το δείγμα x 1,..., x n είναι η διαφορά: ˆµ(x 1,..., x n, x 0 ) ˆµ(x 1,..., x n ) ως μια συνάρτηση της θέσης του έκτοπου. θεωρούμε τώρα, ότι αντί ενός σημείου x 0 εισάγουμε m σημεία x 0 στο δείγμα (π.χ x 0 =1000), τότε η προκύπτουσα μεροληψία είναι ˆµ(x 0, x 0,..., x 0, x m+1,..., x n ) µ(x 1,..., x n ) Η οποία είναι συνάρτηση των m τιμών x 0. Για να εκφράσουμε τόσο την ευαισθησία όσο και τη μεροληψία με μαθηματικά πρότυπα, θα ήταν πιο εύκολο να θεωρήσουμε τις εκτιμήσεις, όταν το μέγεθος δείγματος τείνει στο άπειρο ασυμπτωτικά. Ο Huber (1981) θεωρεί σαν κριτήριο σε μια ποσοτική ανθεκτικότητα μεγάλου δείγματος, την ασυμπτωτική μεροληψία ˆθ(F ) ˆθ(F θ ) και την ασυμπτωτική διακύμανση V (ˆθ, F ) σε μια περιοχή p του μοντέλου κατανομής F θ. Ετσι, για να αξιολογήσουμε τη συμπεριφορά του εκτιμητή στη γειτονική περιοχή της F θ, δύο από τα πιο σπουδαία χαρακτηριστικά σε μια ποσοτική ανθεκτικότητα είναι η μέγιστη μεροληψία και η μέγιστη διακύμανση b(ɛ) = sup F ˆθ(F ) ˆθ(F θ ) (1.4) U(ɛ) = max F V (ˆθ, F ) (1.5) Επίσης, κατάλληλη πληροφορία για μια ποσοτική ανθεκτικότητα παρέχεται από τη συνάρτηση επίδρασης IF (influence function) και άλλες ποσότητες που προέρχονται απ αυτήν. Η συνάρτηση επίδρασης IF περιγράφει την αλλαγή του εκτιμητή ˆθ από μια επιπλέον παρατήρηση x, δεδομένου ότι υπάρχει ένα μεγάλο δείγμα με κατανομή F. Η συνάρτηση επίδρασης IF (x, T, F ), όπως διατυπώθηκε από τον Hampel (1974), είναι η πρώτη παράγωγος του εκτιμητή ˆθ στην υποκειμενική κατανομή F, όπου η παρατήρηση x επιφέρει μια ελάχιστη αλλαγή στην κατανομή πιθανότητας. IF (x; ˆθ, ˆθ(1 ɛ)f + ɛδx0 F ) = lim ˆθ(F ), (1.6) x 0 ɛ

27 όπου δx 0 παριστάνει μια κατανομή η οποία έχει συγκεντρώσει όλη τη μάζα της στο σημείο x 0. Η IF εκφράζει την μεροληψία που προκαλείται από την εισαγωγή μερικών έκτοπων στο σημείο x 0, τυποποιημένη με την ποσότητα της μόλυνσης ɛ. Άλλα σημαντικά μέτρα ανθεκτικότητας τα οποία προκύπτουν από την συνάρτηση επίδρασης IF είναι: Η ευαισθησία μικτών σφαλμάτων (gross-error sensitivity) γ οριζόμενη ως: γ = sup IF (x; ˆθ, F ). (1.7) x Η ευαισθησία γ περιγράφει τη μέγιστη επίδραση που προκαλείται στον εκτιμητή από μια μικρή μόλυνση της κατανομής F, και γι αυτό, τη σταθερότητα του εκτιμητή ˆθ κάτω από μικρές αλλαγές της F. Σε μια ανθεκτική εκτίμηση επιθυμούμε η ευαισθησία γ να είναι περιορισμένη ή όσο το δυνατόν μικρότερη. Η συνάρτηση IF μας επιτρέπει να εκτιμήσουμε τη διακύμανση του εκτιμητή ˆθ, όπως προτάθηκε από τους Hampel et al. (1986), V (ˆθ, F ) = IF (x; ˆθ, F ) 2 df (x). (1.8) η οποία είναι το βασικό μέτρο αποτελεσματικότητας (efficiency) του ˆθ. Το Σημείο Θραύσης BP (Breakdown Point) Σε μια ανθεκτική εκτίμηση απαιτείται επίσης η ελάχιστη απόσταση από την υποθετική κατανομή F θ, η οποία εξασφαλίζει μοναδική τιμή στον εκτιμητή ˆθ. Η απόσταση αυτή είναι ένα μέτρο ποσοτικής ανθεκτικότητας, είναι γνωστή ως σημείο θραύσης (Breakdown Point) και μπορούμε να πούμε ότι είναι η απόσταση από την κατανομή F θ, πέρα από την οποία ο εκτιμητής γίνεται αναξιόπιστος (δεν παρέχει καμία πληροφορία). Με λίγα λόγια, το σημείο θραύσης BP ενός εκτιμητή ˆθ της παραμέτρου θ, είναι το μέγιστο ποσοστό μόλυνσης (ποσοστό έκτοπων) που μπορούν να περιέχουν τα δεδομένα έτσι ώστε το ˆθ να εξακολουθεί να δίνει πληροφορία για το θ (δεν έχει οδηγηθεί στο άπειρο). Ορισμός 1.1. Η αυμπτωτική μόλυνση BP ενός εκτιμητή ˆθ στην F, συμβολιζόμενη με ɛ (ˆθ, F ) είναι το μέγιστο ɛ (0, 1), έτσι ώστε για ɛ < ɛ, ˆθ((1 ɛ)f + ɛg) ως μια συνάρτηση του G παραμένει φραγμένη. Σήμερα το σημείο θραύσης BP αποτελεί ίσως το πιο σημαντικό μέτρο ανθεκτικότητας για τους σύγχρονους ανθεκτικούς εκτιμητές, οι οποίοι επιδιώκουν BP μέχρι 50%, ɛ (ˆθ, F ) 0, 50. Οι πιο σπουδαίες απαιτήσεις ανθεκτικότητας, εκτός της ποιοτικής ανθεκτικότητας, είναι η χαμηλή ευαίσθησία γ και ένα υψηλό σημείο κατάρρευσης HBP (Maronna and Yohai (1981)).

28 Βέλτιστη Ανθεκτικότητα Σε αυτή την παράγραφο θεωρούμε δυο βασικούς διαφορετικούς τρόπους με τους οποίους μπορούμε να ορίσουμε έναν βέλτιστο εκτιμητή. Προσέγγιση Ελαχιστοποιήσης-Μεγίστου minmax Μια από τις κυριότερες προσεγγίσεις της ανθεκτικής εκτίμησης συνίσταται στην ανεύρεση της πιο ευνοικής κατανομής μεταξύ όλων των εναλλακτικών του παραμετρικού μοντέλου F θ, μέσα σε μια ορισμένη περιοχή p ɛ με την ελαχιστοποιήση της ασυμπτωτικής διακύμανσης των εκτιμητών. Ο Huber (1964) θεμελίωσε θεωρητικά την ανθεκτική εκτίμηση βελτιστοποιώντας το χειρότερο που μπορεί να συμβεί στην περιοχή p ɛ του παραμετρικού μοντέλου, μετρώντας το με την ασυμπτωτική διακύμανση του εκτιμητή. Το πρόβλημα σε μια ανθεκτική εκτίμηση, φορμαρίστηκε από τον Huber σαν το γνωστό παιχνίδι two-person zero sum. Η φύση διαλέγει την κατανομή F από την περιοχή p ɛ, ο στατιστικολόγος διαλέγει έναν εκτιμητή ˆθ με μια συνάρτηση ψ c, και το κέρδος για τη φύση και απώλεια για το στατιστικολόγο είναι η ασυμπτωτική διακύμανση V (ˆθ, F ). Επίσης απέδειξε ο ίδιος ότι υπάρχει λύση στο παιχνίδι και μάλιστα στην περίπτωση του μοντέλου των μικτών σφαλμάτων: η περίφημη συνάρτηση: F = F θ (1 ɛ) + ɛg ψ c (x) = max( c, min(c, x)) (1.9) δίνει έναν εκτιμητή πιθανοφάνειας και συμφωνεί με την γνωστή minmax στρατηγική. Γενικά ο Peter Huber (1964, 1967) πρότεινε σαν βέλτιστη ανθεκτικότητα την ελαχιστοποιήση της μέγιστης διακύμανσης του εκτιμητή ˆθ, μέσα σε μια γνωστή περιοχή p ɛ του υποτιθέμενου παραμετρικού μοντέλου. Ακριβή αποτελέσματα της μεθόδου ελαχιστοποιήσης-μεγίστου (minmax) για πεπερασμένο δείγμα υπάρχουν μόνο για ορισμένες περιπτώσεις. Συγκεκριμένα, δεν είναι δυνατόν να πετύχουμε ακριβή αποτελέσματα σε πεπερασμένο δείγμα, όταν υπάρχουν ενοχλητικές παράμετροι, δηλαδή παράμετροι οι οποίες συντελούν στην τυποποίηση διάφορων εννοιών, όπως π.χ του σφάλματος u στην παλινδρόμηση και η εκτίμηση τους είναι δύσκολη. Προσέγγιση με Συνάρτηση Επίδρασης Η προσέγγιση αυτή ονομάζεται απειροελάχιστη προσέγγιση (infinitesimal approach) και στηρίζεται στις κεντρικές παραδοχές, της ποιοτικής ανθεκτικότητας, της συνάρτησης επίδρασης και του σημείου κατάρρευσης. Περιλαμβάνει μια σφαιρική άποψη ανθεκτικότητας και έχει θεμελιωθεί από τον Hampel (1968) για μονοδιάστατο παραμετρικό μοντέλο και στην συνέχεια γενικεύθηκε για πολυδιάστατο μοντέλου από τον Krasker (1980).

29 Εφ όσον η αληθινή κατανομή των δεδομένων F υποτίθεται ότι βρίσκεται σε κάποια περιοχή του παραμετρικού μοντέλου F θ και εφ όσον για μεγάλο n η εμπειρική κατανομή F n πλησιάζει την F, είναι πολύ χρήσιμη η διερεύνηση της συνάρτησης επίδρασης IF (x; T, F ). Η πιο σπουδαία απαίτηση της ανθεκτικότητας είναι η χαμηλή ευαισθησία γ. Αλλά μια χαμηλή ευαισθησία έρχεται σε αντίθεση με την απαίτηση της αποτελεσματικότητας, η οποία ταυτίζεται με τη χαμηλή ασυμπτωτική διακύμανση V (T, F ). Δεν μπορούμε δηλαδή να βελτιώσουμε ταυτόχρονα τα όρια των δύο ποσοτήτων. Σύμφωνα με τον Hampel (1968), περισσότερη ανθεκτικότητα συνεπάγεται μικρότερη αποτελεσματικότητα και αντίστροφα. Είναι γνωστό, ότι ένας M-εκτιμητής ορίζεται βασικά από μια συνάρτηση ψ(x, θ) ορισμένη στο χώρο R θ και η τιμή του στην F είναι η λύση θ, η οποία ικανοποιεί την εξίσωση: ψ(x, θ)f (dx) = 0 (1.10) Οι M-εκτιμητές επινοήθηκαν για πρώτη φορά από τον Huber (1964, 1967) και είναι βασικοί εκτιμητές μέγιστης πιθανοφάνειας. Απαίτηση της απειροελάχιστης προσέγγισης για έναν M-εκτιμητή συνεπή κατά Fisher είναι η ελαχιστοποιήση της ασυμπτωτικής διακύμανσης κάτω από ένα δεδομένο περιορισμό της ευαισθησίας γ. Η βελτιστοποίηση ενός εκτιμητή δεν στηρίζεται αποκλειστικά στις παραπάνω ιδιότητες. Φυσικά υπάρχουν πρακτικοί λόγοι και άλλες ανθεκτικές απόψεις λιγότερης ή περισσότερης σπουδαιότητας, που πρέπει να περιληφθούν σε μια καλή πρακτική μέθοδο. 1.2 Προβλήματα Θέσης και Κλίμακας Η εκτίμηση θέσης και κλίμακας είναι η εκτίμηση του κέντρου των δεδομένων, όπως η μέση τιμή και διάμεσος. Εστω x = (x 1,..., x n ) είναι ένα σύνολο παρατηρούμενων τιμών. Η δειγματική μέση τιμή x και η δειγματική τυπική απόκλιση s ορίζονται από τις εξισώσεις: x = 1 n n x i, i=1 s 2 = 1 n 1 (1.11) n (x i x) 2 i=1 Η δειγματική μέση τιμή των δεδομένων, αναμένεται να παρέχει μια καλή εκτίμηση του κέντρου ή θέσης (location) των δεδομένων. Παρόμοια, αναμένεται η τυπική απόκλιση να παρέχει μια καλή εκτίμηση διασποράς των δεδομένων. Ομως, η ύπαρξη και ενός μόνο έκτοπου επιδρά αρνητικά σε αυτές τις κλασσικές εκτιμήσεις, κάτι που φαίνεται από το επόμενο παράδειγμα.

30 Παράδειγμα 1.2. Εστω σύνολο 24 παρατηρήσεων το οποίο έχει ως ακολούθως σε αύξουσα σειρά: Η τιμή 28.9 ξεχωρίζει από τις υπόλοιπες παρατηρήσεις και θα μπορούσε να χαρακτηριστεί ως έκτοπο. Θα μπορούσε κανείς να θεωρήσει ότι αυτή η ασυνήθιστη μεγάλη τιμή προέρχεται από λανθασμένη θέση υποδιαστολής στην αληθινή τιμή Σε κάθε περίπτωση, είναι ένα έκτοπο με σημαντική επιρροή όπως ακολουθεί. Η τιμή της δειγματικής μέσης τιμής και τυπικής απόκλισης από το παραπάνω σύνολο δεδομένων είναι x = 4.20 και s = 5.30 αντίστοιχα. Αφού η x = 4.20 είναι μεγαλύτερη όλων εκτός δυο τιμών του δείγματος, δεν βρίσκεται εντός του κυρίου όγκου των παρατηρήσεων και ως εκ τούτου δεν εκπροσωπεί μια καλή εκτίμηση του κέντρου των δεδομένων. Αν διαγράψουμε την ύποπτη τιμή 28.95, τότε οι δειγματικές εκτιμήσεις αλλάζουν σε x = 3.20 και s = 0.7. Τώρα η δειγματική μέση τιμή είναι μια καλή εκτίμηση του κέντρου δεδομένων, όπως φαίνεται στο σχήμα, και η τυπική απόκλιση s είναι περίπου επτά φορές μικρότερη. Παρατηρείται στο παράδειγμα (1.2) πόσο μεγάλη επίδραση μπορεί να έχει μόνο ένα έκτοπο στις δειγματικές εκτιμήσεις για τις παραμέτρους µ και σ. Ε- ξάλλου, είναι εύκολο να διαπιστωθεί ότι καθώς ένα έκτοπο παίρνει αυθαίρετα μεγάλες τιμές από εως + οι τιμές x και s μεταβάλονται από το εως +. Οπότε, ένα μόνο έκτοπο έχει απεριόριστη επιρροή στις δυο αυτές κλασικές εκτιμήσεις, καθώς και στα κλασικά διαστήματα εμπιστοσύνης και ε- λέγχους. Στο παράδειγμα (1.2) φαίνεται ότι ένας εύκολος τρόπος να αντιμετωπιστούν τα έκτοπα είναι να τα ανιχνεύσουμε και να τα διαγράψουμε από το δείγμα. Υπάρχουν αρκετοί τρόποι να ανιχνεύσουμε τα έκτοπα αλλά η διαγραφή τους δημιουργεί προβλήματα όπως: Πότε πραγματοποιείται η διαγραφή ενός έκτοπου; Πότε μια παρατήρηση είναι αρκετά απομακρυσμένη για να διαγραφεί; Η διαγραφή απαιτεί κάποιο κριτήριο; Η παρατήρηση μέσα στο δείγμα μεταφέρει μια πληροφορία και η διαγραφή της δεν είναι πάντα επιθυμητή. Αφού υπάρχει γενικά η αβεβαιότητα ως προς το πότε μια παρατήρηση είναι έκτοπο, υπάρχει ένα ρίσκο διαγραφής μιας καλής παρατήρησης, το οποίο οδηγεί σε υποεκτίμηση της μεταβλητότητας των δεδομένων. Είναι γνωστό ότι η διάμεσος δεν επηρεάζεται από έκτοπες παρατηρήσεις, οπότε αποτελεί μια αρκετά καλή μέθοδο. Σε ένα δείγμα η διάμεσος επιτυγχάνεται, αν ταξινομηθούν οι παρατηρήσεις x = (x 1,..., x n ) σε αύξουσα σειρά, x (1) < x (2) <... < x (n)

31 εάν το n είναι περιττός αριθμός, τότε n = 2m + 1 για κάποιον ακέραιο, και στην περίπτωση αυτή Med(x) = x (m). Εάν το n είναι ζυγός αριθμός, τότε Med(x) = (x (m) + x (m+1) )/2. Στο παράδειγμα (1.2), η διάμεσος είναι 3.38, ενώ η διάμεσος χωρίς τη μέγιστη τιμή είναι 3.37 δείχνοντας ότι δεν επηρεάζεται από την παρουσία έκτοπων. Εάν το έκτοπο πάρει την τιμή +, η διάμεσος παραμένει Γενικά, η δειγματική διάμεσος προσαρμόζεται καλά στα δεδομένα με η χωρίς έκτοπα και δεν επηρεάζεται πολύ από αυτά. Με λίγα λόγια έιναι μια ανθεκτική εκτίμηση για το κέντρο των δεδομένων. 1.3 Αλγόριθμοι Ανθεκτικής Στατιστικής Πολλοί αλγόριθμοι έχουν αναπτυχθεί για την επίλυση διάφορων προβλημάτων, όπως τον υπολογισμό εκτιμητών, της Ανθεκτικής Στατιστικής. Τόσο για εκτίμηση θέσης, πίνακα συνδιακύμανσης αλλά και παλινδρόμησης. Στην συνέχεια αυτής της ενότητας θα γίνει μια εισαγωγική σύντομη επισκόπηση τους με σκοπό την ανάδειξη της κυρίας δομής κάποιων χαρακτηριστικών αλγόριθμων ανθεκτικής στατιστικής, αλλά και τον εντοπισμό των μειονεκτημάτων τους Ανθεκτική Εκτίμηση Θέσης (μέση τιμή, διάμεσος) Μέθοδος των Ελάχιστων Αποκομμένων Απολύτων Αποκλίσεων LTAD Η πιο δημοφιλής μέθοδος ανθεκτικής εκτίμησης θέσης στην μονομεταβλητή περίπτωση είναι η μέθοδος των ελάχιστων αποκομμένων απολύτων αποκλίσεων LTAD η οποία ανήκει στην οικογένεια των εκτιμητών μισού δείγματος (half samples) και μελετήθηκε από τον Tableman (1994a). Ουσιαστικά ερευνά το 50% των παρατηρήσεων με τις μικρότερες αποκλίσεις απο την διάμεσο. Προφανώς αυτό είναι ένα πρόβλημα συνδυαστικής. Το πλεονέκτημα της είναι ότι χρησιμοποιεί ένα κριτήριο το οποίο υπολογίζεται πάνω στα μισά-δείγματα γι αυτό και μειώνονται τα υποσύνολα που χρησιμοποιεί. Το μειονέκτημα της είναι ότι δεν μπορεί να εφαρμοστεί για πολυμεταβλητά προβλήματα. Σύνοψη Αλγόριθμου του LTAD Ενας εύχρηστος αλγόριθμος του LTAD είναι ο εξής: 1. Θεωρούνται τα n h συνεχή δείγματα των x 1 x 2... x n 2. Πάνω σε αυτά τα n h συνεχή δείγματα υπολογίζονται οι αντίστοιχες διάμεσοι. 3. Επιλέγεται ως LTAD η διάμεσος αυτή που αντιστοιχεί στο δείγμα με το ελάχιστο άθροισμα απολύτων αποκλίσεων.

32 1.3.2 Ανθεκτική Εκτίμηση Συνδιακύμανσης Εκτιμητής Ελάχιστης Ορίζουσας Πίνακα Συνδιακύμανσης MCD Ο εκτιμητής ελάχιστης ορίζουσας πίνακα συνδιακύμανσης MCD προτάθηκε από τον Rousseeuw (1984), ανήκει και αυτός στην οικογένεια εκτιμητών μισού δείγματος. Το κυριότερο κριτήριο του είναι η Mahalanobis απόσταση η οποία ορίζεται ως εξής: D 2 i = (x i µ) T Σ 1 (x i µ) Οπου µ είναι η εκτίμηση θέσης και Σ ο πίνακας συνδιάκύμανσης. Το βήμα κλειδί του αλγορίθμου του MCD είναι το C-βήμα (συγκεντρωτικό βήμα, Concentration-step), επειδή συγκεντρώνει h παρατηρήσεις με τις μικρότερες Mahalanobis αποστάσεις. Με απλούς αλγοριθμικούς όρους το C-βήμα περιγράφεται ακολούθως Σύνοψη C-βήματος Δεδομένου ενός υποσυνόλου h παρατηρήσεων 1. Υπολογισμός των Mahalanobis αποστάσεων D 2 i. 2. Ταξινόμηση των αποστάσεων D 2 i. 3. Επιλογή των h μικρότερων D 2 i. 4. Επαναλαμβάνονται τα βήματα 1-3 μέχρι σύγλισης στο δείγμα με τις μικρότερες h αποστάσεις. Εξαιτίας του μικρού αριθμού παρατηρήσεων (n) και του μικρού αριθμού στηλών (p) των δεδομένων που μπορεί να επεξεργαστεί ο αλγόριθμος του MCD αναπτύχθηκε ο αλγόριθμος του Fast-MCD από τους Rousseeuw and Driessen (1999). Ο παραπάνω αλγόριθμος ορίζεται ως εξής: Σύνοψη Αλγόριθμου του Fast-MCD 1. Επιλογή τυχαίων πολλών υποσυνόλων, h παρατηρήσεων, του δείγματος π.χ Εφαρμογή C-βημάτων σε κάθε ένα από τα παραπάνω υποσύνολα έως ότου αυξηθούν σε δείγματα h παρατηρήσεων. 3. Επιλογή του υποσυνόλου με την μικρότερη ορίζουσα του πίνακα συνδιακύμανσης. Αν και βελτιώνει τον υπολογιστικό χρόνο του MCD αρκετά ο αλγόριθμος του Fast-MCD δεν οδηγεί σε βέλτιστη λύση και εξακολουθεί να είναι αποτελεσματικός μόνο για μεσαία προβλήματα και όχι για μεγάλα.

33 Ορθογώνιος Εκτιμητής (OGK), M Εκτιμητής και S Εκτιμητής Ο εκτιμητής του OGK αναπτύχθηκε από τους Maronna and Zamar (2002a). Ο OGK περιορίζει τον μεγάλο αριθμό της διάστασης p γιατί λαμβάνει ανά ζεύγη τις μεταβλητές του πίνακα X για να μειωθεί σημαντικά ο υπολογιστικός χρόνος. Βασικό κριτήριο του είναι η Mahalanobis απόσταση. Η λήψη των μεταβλητών ανά ζεύγη έχει ως αποτέλεσμα τον περιορισμό της αποτελεσματικότητας και ανθεκτικότητας του αλγορίθμου. Για να βελτιωθεί η αποδοτικότητα του στις εκτιμήσεις που προκύπτουν αρχικά γίνεται η ελάφρυνση τους. Οι M-εκτιμήσεις με περιορισμούς αναπτύχθηκαν από τον Rocke (1996). Ξεκινούν με αρχικές ανθεκτικές εκτιμήσεις (µ 0, S 0 ) που προκύπτουν από το MCD, στην συνέχεια γίνονται διαδοχικές επαναλήψεις με την χρήση συνάρτησης ελάφρυνσης, όπου προκύπτουν δυο παράμετροι c και M, οι οποίοι καθορίζουν το επιθυμητό σημείο κατάρρευσης και την ασυμπτωτική πιθανότητα απόρριψης. Οι S-εκτιμήσεις αναπτύχθηκαν από τον Rousseeuw and Leroy (1987) και μελετήθηκαν επιπλέον απο τον Davies (1992). Υπολογίζονται παρόμοια με τα C-βήματα του MCD Ανθεκτική Εκτίμηση Παλινδρόμησης Εχουν αναπτυχθεί πολλές κατηγορίες ανθεκτικών εκτιμητών στην παλινδρόμηση οι οποίες πληρούν αρκετές καλές ιδιότητες. Ανάλογα με τον τύπο των έκτοπων που αντιμετωπίζουν μπορούμε να ξεχωρίσουμε δύο οι οποίες είναι οι εξής: 1. M εκτιμητές Huber Είναι καταλληλότεροι για κατάλοιπα που αντιστοιχούν στα y έκτοπα. 2. GM εκτιμητές Welsch Είναι κατάλληλοι και για τους δύο τύπους x, y έκτοπα. M Εκτιμητές Huber Η κεντρική ιδέα των αλγορίθμων του Huber ακολουθεί την min max στρατηγική αλλά ταυτόχρονα διατηρεί τους ανθεκτικού εκτιμητές στην οικογένεια των εκτιμητών μεγίστης πιθανοφάνειας. Ο επαναληπτικός αλγόριθμος για ένα απλό μοντέλο παλινδρόμησης ακολουθεί τα παρακάτω βήματα. Σύνοψη Αλγόριθμου M-Huber 1. Εκτίμηση γραμμής παλινδρόμησης με ελάχιστα τετράγωνα. 2. Προσέλκυση των παρατηρήσεων στην γραμμή παλινδρόμησης (όπου υ- πάρχουν μεγάλα κατάλοιπα).

34 3. Επανεκτίμηση της γραμμής παλινδρόμησης στα μετασχηματισμένα δεδομένα με ελάχιστα τετράγωνα. 4. Μέχρι σύγκλισης της γραμμής ˆβ. GM Εκτιμητές Welsch Η κεντρική ιδέα των εκτιμητών GM είναι ο περιορισμός της συνάρτησης επίδρασης. Αυτό επιτυγχάνεται με μεγαλύτερη ελάφρυνση στα x έκτοπα, δηλαδή η προσέλκυση των έκτοπων σημείων είναι μεγαλύτερη στα x. Ο πιο δημοφιλής αλγόριθμος υπολογισμού του GM είναι ο Iteratively Reweighted Least Squares, (IRLS) Σύνοψη Αλγόριθμου IRLS 1. Αρχική εκτίμηση των παραμέτρων του μοντέλου παλινδρόμησης, ˆβ, με ελάχιστα τετράγωνα. 2. Υπολογισμός βαρών. 3. Υπολογισμός της ζυγισμένης μέσης τιμής και του αντίστοιχου πίνακα συνδιακύμανσης. 4. Ο συντελεστής διεύθυνσης του μοντέλου παλινδρόμησης να είναι το ιδιοδιάνυσμα με την ελάχιστη ιδιοτιμή του πίνακα συνδιακύμανσης. 5. Ο σταθερός όρος του μοντέλου παλινδρόμησης να είναι ίσος με το ανάστροφο συντελεστή διεύθυνσης που υπολογίστηκε στο παραπάνω βήμα επί την ζυγισμένη μέση τιμή. 6. Επανάληψη των βημάτων 2-5 μέχρι σύγκλισης του ˆβ. Εδώ πρέπει να σημειωθεί ότι οι M και GM εκτιμητές έχουν περισσότερο ιστορική αξία διότι έχουν σχεδόν μηδενικό σημείο κατάρρευσης. Οι πιο μοντέρνοι ανθεκτικοί εκτιμητές είναι αυτοί του υψηλού σημείου κατάρρευσης (LTS,MM). Εκτιμητές Υψηλού Σημείου Κατάρευσης LTS του Rousseeuw και MM του Yohai. Διαγράφονται οι παρατηρήσεις που αντιστοιχούν σε έκτοπα Ελάχιστα Αποκομμένα Τετράγωνα (LTS) Ο εκτιμητής LTS ανήκει στην οικογένεια εκτιμητών μισού δείγματος. Ουσιαστικά προσπαθεί να βρει το 50% των καλύτερων παρατηρήσεων που έχουν το ελάχιστο τετραγωνικό σφάλμα. Είναι πρόβλημα συνδυαστικής και μειονεκτεί ιδιαίτερα σε προβλήματα μεγάλης διάστασης.

35 Σύνοψη Αλγόριθμου LTS 1. Ξεκινά με ένα μεγάλο πλήθος μικρών υποσυνόλων p + 1 παρατηρήσεων. 2. Εφαρμόζει τα ελάχιστα τετράγωνα. 3. Βάζει σε αύξουσα σειρά τα κατάλοιπα (κριτήριο μεγέθους καταλοίπων). 4. Στην συνέχεια εισάγει νέες παρατηρήσεις ώσπου να φτάσει στο 50% της κάλυψης. 5. Επιλέγεται η καλύτερη λύση που προκύπτει Ο αλγόριθμος του LTS δεν βρίσκει το ολικό βέλτιστο, βρίσκει ένα τοπικό βέλτιστο με την πεποίθηση ότι αυτό βρίσκεται κοντά στο ολικό. Χάνει αποτελεσματικότητα γιατί εκ των προτέρων το ποσοστό επικάλυψης είναι 50% (αυτό γιατί θέλει να πετύχει μέγιστη υψηλή κατάρρευση) το πραγματικό όμως συνήθως ποσοστό των έκτοπων σε ένα σύνολο δεδομένων είναι συνήθως 10% με 20%. Επιπροσθέτως είναι μια αρκετά χρονοβόρα διαδικασία γι αυτό το λόγο προτάθηκε το Fast-LTS. Το οποίο με την σειρά του βελτιώνει τον χρόνο του LTS όμως εξακολουθεί να είναι ακατάλληλο για προβλήματα με n > 1000 και p > 500, επιπλέον εξακολουθεί να έχει τα ίδια προβλήματα στην αποτελεσματικότητα εξαιτίας του ποσοστού επικάλυψης το οποίο πρέπει να είναι στο 50%. Εκτιμητές (MM) Ο Yohai (1987) παρουσίασε μια κλάση εκτιμητών, τους ΜΜ-εκτιμητές, οι ο- ποίοι συνδυάζουν υψηλό σημείο κατάρρευσης και υψηλή αποτελεσματικότητα όταν τα σφάλματα προέρχονται από κανονική κατανομή (Tatsuoka and Tyler (2000)) Σύνοψη Αλγόριθμου MM Υπολογίζεται ένας αρχικός εκτιμητής παλινδρόμησης T 0 του β ο οποίος προκύπτει από τον εκτιμητή του LTS Στην συνέχεια υπολογίζονται τα κατάλοιπα και ύστερα υπολογίζεται ο MMεκτιμητής κλίμακας Εξαιτίας της εξάρτησης του από τον εκτιμητή LTS στην κλίμακα σ και οι εκτιμητές MM έχουν πρόβλημα αποτελεσματικότητας. Ολοι οι παραπάνω αλγόριθμοι αλλά και αρκετοί άλλοι με παρόμοια συλλογιστική έχουν σοβαρό μειονέκτημα ότι ξεκινούν με μια αρχική λύση. Αυτό έχει σαν αποτέλεσμα την μείωση της ανθεκτικότητας.

36 1.4 Ανθεκτική Διαδικασία με Μαθηματικό Προγραμματισμό Η τεχνική του Μαθηματικού προγραμματισμού στην στατιστική είναι ένα πολύ χρήσιμο εργαλείο διότι: Μας επιτρέπει να κάνουμε εκτιμήσεις σε προβλήμτα θέσης, παλινδρόμησης και εντοπισμού έκτοπων χωρίς την χρήση αρχικής τιμής. Μας επιτρέπει να εισάγουμε νέους περιορισμούς και συνθήκες στην αντικειμενική μας συνάρτηση εξαιτίας της δομής του. Διάφορες τέτοιες τεχνικές έχουν χρησιμοποιηθεί μέχρι σήμερα, όπως: οι Charnes et al. (1955) εναλλακτική της μεθόδου των ελαχίστων τετραγώνων, Barrodale and Roberts (1973) για την MINMAD παλινδρόμησης, Armstrong and Frome (1976) για το πρόβλημα προσαρμογής μιας καμπύλης στις απόλυτες αποκλίσεις, ο Snyder (1982) για εντοπισμό έκτοπων στις χρονοσειρές κ.α. Σημαντική είναι η συμβολή των Arthanari and Dodge (1993) στην διερεύνηση εφαρμογής του μαθηματικού προγραμματισμού στους διάφορους ανθεκτικούς εκτιμητές ή προβλήματα βελτιστοποιήσης στην στατιστική. Ορισαν ότι, ένα πρόβλημα μαθηματικού προγραμματισμού γενικά έχει την ακόλουθη δομή: εύρεση κάποιου x για το οποίο f(x ) f(x) για κάθε x F. (1.12) Το σπουδαιότερο συμπέρασμα σε αυτήν την μελέτη είναι ότι πολλά προβλήματα βελτιστοποιήσης στην στατιστική μπορούν να μετασχηματιστούν ως κυρτά προβλήματα μαθηματικού προγραμματισμού. Αυτό είναι πολύ ελπιδοφόρο για τους εκτιμητές γιατί η προσέγγιση αυτή οδηγεί σε μοναδική ολική βέλτιστη λύση. Εκτοτε, μετασχηματίστηκαν αρκετά προβλήματα βελτιστοποίησης στην εκτιμητική ως προβλήματα μαθηματικού προγραμματισμού. 1.5 Νέοι Αλγόριθμοι Η νέα ιδέα των αλγορίθμων της διατριβής αυτής είναι η αντιμετώπιση του προβλήματος της συνδυαστικής που παρουσιάζεται στις ανθεκτικές εκτιμήσεις με γραμμικό προγραμματισμό. Αυτό επιτυγχάνεται με νέα προσέγγιση της αντικειμενικής συνάρτησης του προβλήματος η οποία διαμορφώνεται ως πρόβλημα γραμμικού προγραμματισμού. Με αυτό τον τρόπο κερδίζεται χρόνο επίλυσης αλλά ταυτόχρονα οι προκύπτουσες εκτιμήσεις είναι εξίσου ανταγωνιστικές. Οι ανθεκτικές εκτιμήσεις διατηρούν την ανθεκτικότητα και την αποτελεσματικότητα τους.

37 1.5.1 Ανθεκτική Εκτίμηση Θέσης (μέση τιμή, διάμεσος) Εκτιμητής Ελάχιστων Αποκομμένων Απολύτων Αποκλίσεων με Γραμμικό Προγραμματισμό LP-LTAD Η εκτίμηση θέσης είναι ένα από τα πιο σημαντικά προβλήματα στην στατιστική. Οπως αναφέρθηκε και πιο πριν μια καλή προσέγγιση είναι η χρησιμοποίηση των ελάχιστων αποκομμένων απολύτων αποκλίσεων (LTAD). Η οποία είναι μέθοδος που χρησιμοποιεί ένα κριτήριο πάνω στα μισά δείγματα, δηλαδή τουλάχιστον οι μισές παρατηρήσεις παίρνουν βάρη που ισούνται με ένα και τα εναπομείναντα σημεία παίρνουν βάρη που ισούνται με μηδέν. Η λύση του παραπάνω συνδυαστικού προβλήματος με μεικτό ακέραιο προγραμματισμό έχει αντικειμενική συνάρτηση: min w i,µ n i=1 w i x i µ 1, Τα μηδέν-ένα βάρη w i υποδεικνύουν εάν μια παρατήρηση i είναι έκτοπο ή καλή παρατήρηση. Αυτή όμως η συνάρτηση βάρους μπορεί με δυσκολία να ανιχνεύσει μεσαία έκτοπα. Αν σε αυτά τα έκτοπα δεν γίνει ελάφρυνση, τότε θα παίρνουν τα ίδια βάρη όπως τα υπόλοιπα κανονικά σημεία και για αυτό το λόγο θα έλκουν τις εκτιμήσεις ώστε να γίνουν επικαλυπτόμενες. Για να αντιμετωπιστεί η επίδραση των επικαλυπτόμενων έκτοπων, μελετάται μια νέα αποκομμένη διαδικασία, η οποία βασίζεται σε ένα ειδικό γραμμικό πρόγραμμα. Μεγάλες αποκλίσεις παίρνουν μηδέν βάρη μειώνοντας τις παρατηρήσεις x i, το οποίο είναι πιθανόν μόνο στην περίπτωση που η τοπική εκτίμηση είναι μηδέν, η αντικειμενική συνάρτηση της νέας αυτής προσέγγισης είναι: min w,µ n i=1 w ix i µ 1. Στην γενική περίπτωση η νέα διαδικασία μετασχηματίζει τα δεδομένα έτσι ώστε η εκτίμηση θέσης να είναι μηδέν. Η νέα αυτή ιδέα μπορεί να μειώσει την κάλυψη των παρατηρήσεων του δείγματος, με αποτέλεσμα τον εντοπισμό των μεσαίων έκτοπων. Αναπτύχθηκαν γρήγορες αριθμητικές μέθοδοι για την λύση μεγάλων προβλημάτων. Επίσης αποδείχτηκαν ελκυστικές ιδιότητες του νέου εκτιμητή σε όρους ανθεκτικότητας και αποδοτικότητας. Διενεργήθηκαν πειράματα για την επίδειξη των ιδιοτήτων και τον υπολογισμό του LTAD Ανθεκτική Εκτίμηση Συνδιακύμανσης Εκτιμητής Ελάχιστων Αποκομμένων Ευκλείδειων Αποκλίσεων LTED Οι κλασικές μέθοδοι για την εκτίμηση της πολυμεταβλήτης θέσης µ και του πίνακα διασποράς Σ βασίζονται στην απλή δειγματική μέση τιμή και τον απλό

38 πίνακα συνδιακύμανσης, οι οποίες είναι όμως ευαίσθητες σε έκτοπες παρατηρήσεις. Ο εντοπισμός των έκτοπων σε ένα πολυδιάστατο σύννεφο σημείων δεν είναι εύκολη υπόθεση, ειδικά όταν υπάρχουν αρκετά καλυπτόμενα έκτοπα. Ο εκτιμητής του MCD όπως αναφέρθηκε και πιο πριν δεν δίνει τελική βέλτιστη λύση διότι οι αρχικές του λύσεις επηρεάζονται από τα καλυπτόμενα έκτοπα. Για την αποφυγή της παραπάνω επίδρασης προτείνεται μια νέα ιδέα η οποία: i) Κάνει αρχικά ανίχνευση έκτοπων θέσης με τον αλγόριθμο του LTAD και ειδικότερα του LTED (Εκτιμητής Ελάχιστων Αποκομμένων Ευκλείδειων Αποκλίσεων) για πολυμεταβλητά προβλήματα με κριτήριο: µ LT ED = του καλυπτόμενου h υποσυνόλου. h i x i h ii) Στην συνέχεια κάνει ανίχνευση έκτοπων συνδιακύμανσης με κριτήριο την Mahalanobis-απόσταση: D 2 i = (x i µ) T Σ 1 (x i µ) Συνοπτικά ο νέος αλγόριθμος αποτελείται από δύο στάδια: 1. Στο πρώτο στάδιο ένα πολυμεταβλητό L 1 κέντρο διαμέσου µ εκτιμάται αφού πρώτα απομακρυνθούν τα πιθανά έκτοπα. 2. Στο δεύτερο στάδιο εφαρμόζεται το συγκεντρωτικό βήμα της MCD διαδικασίας στο επικαλυπτόμενο σύνολο δεδομένων που έχει προκύψει από το πρώτο στάδιο με σκοπό τον εντοπισμό των παρατηρήσεων που καταστρέφουν την δομή συσχέτισης των μεταβλητών. Το υποσύνολο που προκύπτει από το LTED διαχωρίζεται από το σύνολο όλων των δεδομένων με ένα ελλειψοειδές. Επιπροσθέτως, εφαρμόζοντας μόνο το πρώτο στάδιο της νέας διαδικασίας του LTED είναι από μόνη της ικανή για τον εντοπισμό των έκτοπων σε πολυμεταβλητά δεδομένα όπου ο αριθμός των μεταβλητών είναι μεγαλύτερος του αριθμού των παρατηρήσεων Ανθεκτική Εκτίμηση Παλινδρόμησης Penalized Trimmed Square-LTED (PTS-L) Συνήθως, στα μοντέλα παλινδρόμησης, τα δεδομένα είναι μολυσμένα με έκτοπες παρατηρήσεις. Γι αυτό τον λόγο τα τελευταία 30 χρόνια έχουν αναπτυχθεί ανθεκτικά μοντέλα παλινδρόμησης. Ενας πολύ γνωστός τέτοιος εκτιμητής είναι ο Penalized Trimmed Square (PTS). Για πρώτη φορά με την βοήθεια του LTED εκτιμητή αναπτύχθηκε ανθεκτική μεθοδολογία για την εκτίμηση σημείων μόχλευσης. Εκτεταμένες υπολογιστικές προσομοιώσεις Monte-Carlo, με

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Τοπογραφικά Δίκτυα και Υπολογισμοί 5 ο εξάμηνο, Ακαδημαϊκό Έτος 2016-2017 Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων Τοπογράφων Μηχανικών

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Τοπογραφικά Δίκτυα και Υπολογισμοί 5 ο εξάμηνο, Ακαδημαϊκό Έτος 2017-2018 Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων και Τοπογράφων

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 6.1 Ετεροσκεδαστικότητα: Εισαγωγή Συχνά, η υπόθεση της σταθερής διακύμανσης των όρων σφάλματος,

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ ΚΕΦΑΛΑΙΟ ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ Ως γνωστό δείγμα είναι ένα σύνολο παρατηρήσεων από ένα πληθυσμό. Αν ο πληθυσμός αυτός θεωρηθεί μονοδιάστατος τότε μπορεί να εκφρασθεί με τη συνάρτηση

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Στατιστική. Εκτιμητική

Στατιστική. Εκτιμητική Στατιστική Εκτιμητική Χατζόπουλος Σταύρος 28/2/2018 και 01 /03/2018 Εισαγωγή Το αντικείμενο της Στατιστικής είναι η εξαγωγή συμπερασμάτων που αφορούν τον πληθυσμό ή το φαινόμενο που μελετάμε, με τη βοήθεια

Διαβάστε περισσότερα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας. Περιεχόμενα της Ενότητας Στατιστική Ι Ενότητα 5: Συνεχείς Κατανομές Πιθανότητας Δρ. Χρήστος Εμμανουηλίδης Επίκουρος Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή Πιθανότητες και Αρχές Στατιστικής (10η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2017-2018 Σωτήρης Νικολετσέας, καθηγητής 1 / 48 Σημερινό

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

X = = 81 9 = 9

X = = 81 9 = 9 Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου 4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου Για την εκτίμηση των παραμέτρων ενός πληθυσμού (όπως η μέση τιμή ή η διασπορά), χρησιμοποιούνται συνήθως δύο μέθοδοι εκτίμησης. Η πρώτη ονομάζεται σημειακή εκτίμηση.

Διαβάστε περισσότερα

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ 10ο Μάθημα Πιθανότητες Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2016-2017 Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής 10ο Μάθημα

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Αν Α και Β είναι δύο ενδεχόμενα ενός δειγματικού χώρου να αποδείξετε ότι: Αν Α Β τότε Ρ(Α) Ρ(Β)

Αν Α και Β είναι δύο ενδεχόμενα ενός δειγματικού χώρου να αποδείξετε ότι: Αν Α Β τότε Ρ(Α) Ρ(Β) ΠΡΟΤΥΠΟ ΠΕΙΡΑΜΑΤΙΚΟ ΛΥΚΕΙΟ ΑΝΑΒΡΥΤΩΝ ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΕΞΕΤΑΣΕΙΣ ΠΡΟΣΟΜΟΙΩΣΗΣ 04 ΘΕΜΑ ο Α. Πότε δύο ενδεχόμενα Α και Β ενός δειγματικού χώρου Ω ονομάζονται ασυμβίβαστα;

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ

ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις, Ασκήσεις,

Διαβάστε περισσότερα

1. Πειραματικά Σφάλματα

1. Πειραματικά Σφάλματα . Πειραματικά Σφάλματα Σκοπός της εκτέλεσης ενός πειράματος στη Φυσική είναι ο προσδιορισμός ποσοτικός ή/και ποιοτικός- κάποιων φυσικών μεγεθών που περιγράφουν ένα συγκεκριμένο φαινόμενο. Ο ποιοτικός προσδιορισμός

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Περιλαμβάνει ένα σύνολο αριθμητικών και γραφικών μεθόδων, που μας επιτρέπουν να αποκτήσουμε μια πρώτη εικόνα για την κατανομή των τιμών της μεταβλητής

Διαβάστε περισσότερα

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ - - ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ3 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 009-0 ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ - - ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΥΝΟΨΗΣ

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Παραμέτρων

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ Ενότητα # 7: Δειγματοληψία Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης

Διαβάστε περισσότερα

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2) Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2) Εαρινό εξάμηνο 2018-2019 Τμήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική Παπάνα Μεταδιδακτορική Ερευνήτρια Πολυτεχνική σχολή, Α.Π.Θ. & Οικονομικό Τμήμα,

Διαβάστε περισσότερα

6. Στατιστικές μέθοδοι εκπαίδευσης

6. Στατιστικές μέθοδοι εκπαίδευσης 6. Στατιστικές μέθοδοι εκπαίδευσης Μία διαφορετική μέθοδος εκπαίδευσης των νευρωνικών δικτύων χρησιμοποιεί ιδέες από την Στατιστική Φυσική για να φέρει τελικά το ίδιο αποτέλεσμα όπως οι άλλες μέθοδοι,

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

4 Πιθανότητες και Στοιχεία Στατιστικής για Μηχανικούς

4 Πιθανότητες και Στοιχεία Στατιστικής για Μηχανικούς Πρόλογος Ο μηχανικός πρέπει να συνεχίσει να βελτιώνει την ποιότητα της δουλειάς του εάν επιθυμεί να είναι ανταγωνιστικός στην αγορά της χώρας του και γενικότερα της Ευρώπης. Μία σημαντική αναλογία σε αυτήν

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Χειμερινό εξάμηνο 2010-2011 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 Περιγραφική Στατιστική Ι users.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής

Διαβάστε περισσότερα

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου 4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου Για την εκτίμηση των παραμέτρων ενός πληθυσμού (όπως η μέση τιμή ή η διασπορά), χρησιμοποιούνται συνήθως δύο μέθοδοι εκτίμησης. Η πρώτη ονομάζεται σημειακή εκτίμηση.

Διαβάστε περισσότερα

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Στατιστική Ι Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Παρασκευή, 30 Νοεμβρίου 2012 Στατιστική Ι Έννοιες - Κλειδιά Μεταβλητότητα Εύρος (range) Εκατοστημόρια

Διαβάστε περισσότερα

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται δύο κριτήρια απόρριψης απομακρυσμένων από τη μέση τιμή πειραματικών μετρήσεων ενός φυσικού μεγέθους και συγκεκριμένα

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ Είναι τεχνικές που έχουν σκοπό: τον εντοπισμό χαρακτηριστικών των οποίων οι αριθμητικές τιμές επιτυγχάνουν

Διαβάστε περισσότερα

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics) Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics) Τυχαίο δείγμα και στατιστική συνάρτηση Χ={x 1, x,, x n } τυχαίο δείγμα μεγέθους n προερχόμενο από μια (παραμετρική) κατανομή με σ.π.π. f(x;θ).

Διαβάστε περισσότερα

Στοχαστικές Στρατηγικές

Στοχαστικές Στρατηγικές Στοχαστικές Στρατηγικές 3 η ενότητα: Εισαγωγή στα στοχαστικά προβλήματα διαδρομής Τμήμα Μαθηματικών, ΑΠΘ Ακαδημαϊκό έτος 2018-2019 Χειμερινό Εξάμηνο Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & Πανεπιστήμιο

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση

Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση Εθνικό Μετσόβιο Πολυτεχνείο Τομέας Υδατικών Πόρων και Περιβάλλοντος Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση Ανδρέας Ευστρατιάδης & Δημήτρης Κουτσογιάννης Σχολή Πολιτικών Μηχανικών, Αθήνα Άδεια

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα