ΜΙΑ ΜΕΘΟΔΟΣ ΤΙΜΩΡΙΑΣ ΓΙΑ ΤΗΝ ΑΠΟΡΡΙΨΗ ΑΚΡΑΙΩΝ ΤΙΜΩΝ ΣΤΗΝ ΑΝΘΕΚΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ



Σχετικά έγγραφα
ΥΨΗΛΟΥ ΣΗΜΕΙΟΥ ΚΑΤΑΡΡΕΥΣΗΣ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ PENALIZED TRIMMED SQUARES

ΑΝΙΧΝΕΥΣΗ ΕΚΤΟΠΩΝ ΜΕΤΡΗΣΕΩΝ, ΙΑΓΝΩΣΤΙΚΗ ΚΑΙ ΑΝΘΕΚΤΙΚΗ ΕΚΤΙΜΗΣΗ: ΑΝΑΣΚΟΠΗΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

Εισόδημα Κατανάλωση

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Απλή Παλινδρόμηση και Συσχέτιση

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Y Y ... y nx1. nx1

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΝΕΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΥΠΑΡΞΗ ΕΚΤΙΜΗΤΩΝ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ 3-ΠΑΡΑΜΕΤΡΙΚΗ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

9. Παλινδρόμηση και Συσχέτιση

Εφαρμοσμένη Στατιστική

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Χ. Εμμανουηλίδης, 1

Στατιστική Συμπερασματολογία

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΕΠΙΔΡΑΣΕΩΣ ΜΕΘΟΔΩΝ ΕΡΓΑΣΙΑΣ ΣΤΗΝ ΠΑΡΑΓΩΓΙΚΟΤΗΤΑ ΕΛΛΗΝΙΚΗΣ ΒΙΟΤΕΧΝΙΑΣ ΠΑΡΑΓΩΓΗΣ ΠΑΙΔΙΚΩΝ ΕΝΔΥΜΑΤΩΝ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση II

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς


ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

Στατιστική Ι. Ανάλυση Παλινδρόμησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Γ. Πειραματισμός - Βιομετρία

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Αναγνώριση Προτύπων Ι

8.1 The Nature of Heteroskedasticity 8.2 Using the Least Squares Estimator 8.3 The Generalized Least Squares Estimator 8.

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

Στατιστική. Εκτιμητική

Διαχείριση Υδατικών Πόρων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Προσαρμογή καμπύλης με τη μέθοδο των ελαχίστων τετραγώνων

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή

Αν έχουμε δύο μεταβλητές Χ και Υ και σύμφωνα με την οικονομική θεωρία η μεταβλητή Χ προσδιορίζει τη συμπεριφορά της Υ το ερώτημα που τίθεται είναι αν

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

3.7 Παραδείγματα Μεθόδου Simplex

Στατιστική Συμπερασματολογία

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Αριθμητική Ανάλυση και Εφαρμογές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Απλή Γραμμική Παλινδρόμηση I

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

A Τελική Εξέταση του μαθήματος «Αριθμητική Ανάλυση» Σχολή Θετικών Επιστημών, Τμήμα Μαθηματικών, Πανεπιστήμιο Αιγαίου

Αριθμητική Ανάλυση και Εφαρμογές

Πολλαπλή παλινδρόμηση (Multivariate regression)

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

6. Στατιστικές μέθοδοι εκπαίδευσης

Προσαρμογή καμπύλης με τη μέθοδο των ελαχίστων τετραγώνων

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση


ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Φίλτρα Kalman. Αναλυτικές μέθοδοι στη Γεωπληροφορική. ιατύπωση του βασικού προβλήματος. προβλήματος. μοντέλο. Πρωτεύων μοντέλο

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Κεφάλαιο 5ο: Ακέραιος προγραμματισμός

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

Transcript:

Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 8 ου Πανελληνίου Συνεδρίου Στατιστικής (005) σελ.39-48 ΜΙΑ ΜΕΘΟΔΟΣ ΤΙΜΩΡΙΑΣ ΓΙΑ ΤΗΝ ΑΠΟΡΡΙΨΗ ΑΚΡΑΙΩΝ ΤΙΜΩΝ ΣΤΗΝ ΑΝΘΕΚΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αντώνης Αβραμίδης και Γιώργος Ζιούτας Γενικό Τμήμα Πολυτεχνικής Σχολής Α.Π.Θ. aavram@gen.auth.gr ΠΕΡΙΛΗΨΗ Στην ανθεκτική παλινδρόμηση, συχνά χρειάζεται να αποφανθούμε πόσες είναι οι ασυνήθιστες παρατηρήσεις (outlers) στα δεδομένα και ποιες από αυτές πρέπει να απομακρυνθούν με σκοπό την εύρεση της καλύτερης γραμμής παλινδρόμησης στις υπόλοιπες παρατηρήσεις. Μία βασική μέθοδος είναι η LS (least trmmed squares), η οποία αναφέρεται στην προσαρμογή της γραμμής στην πλειοψηφία των δεδομένων (~5%) αναγνωρίζοντας ως ακραίες παρατηρήσεις τα υπόλοιπα σημεία (~49%) που προκαλούν τη μεγαλύτερη ζημιά στην προσαρμογή της ευθείας. Στην προτεινόμενη μέθοδο, εισάγουμε κόστος τιμωρίας για την απόρριψη κάθε ακραίας παρατήρησης (outler), επομένως, η καλύτερη προσαρμογή της γραμμής στην πλειοψηφία των δεδομένων επιτυγχάνεται απομακρύνοντας μόνο τις παρατηρήσεις που επιδρούν κακώς στην παλινδρόμηση. Η προτεινόμενη ανθεκτική εκτιμήτρια παλινδρόμησης προκύπτει λύνοντας ένα κυρτό μικτό ακέραιο τετραγωνικό πρόβλημα και για την σύγκριση της αποτελεσματικότητας και ανθεκτικότητάς της με άλλες ανθεκτικές εκτιμήτριες, διεξάγουμε μελέτη προσομοίωσης (Monte Carlo Smulaton) με κατάλληλα αριθμητικά δεδομένα.. ΕΙΣΑΓΩΓΗ Έστω το γραμμικό μοντέλο παλινδρόμησης y = x β + u, (.) όπου y η εξαρτημένη μεταβλητή, x το px διάνυσμα των ανεξάρτητων μεταβλητών, β το px διάνυσμα των αγνώστων παραμέτρων και u το διάνυσμα των τυχαίων σφαλμάτων με μέση τιμή μηδέν και διακύμανση σ. Παρατηρούμε ένα τυχαίο δείγμα (x, y ),...,(x n, y n ) και επιθυμούμε να βρούμε μία ανθεκτική εκτιμήτρια εννοώντας ότι η επίδραση κάθε παρατήρησης (x, y ) στη δειγματική εκτιμήτρια περιορίζεται. Όπως είναι γνωστό, η εκτιμήτρια ελαχίστων τετραγώνων β δεν ικανοποιεί τις προϋποθέσεις της ανθεκτικότητας. Οι γενικευμένες M εκτιμήτριες (GM estmators), όπως οι προτάσεις των Mallows (975), Hampel (978), Krasker and Welsch (98) και άλλες ανθεκτικές εκτιμήτριες - 39 -

σχεδιάστηκαν με σκοπό να προστατέψουν την εκτιμήτρια από τις ακραίες παρατηρήσεις. Πιο συγκεκριμένα, έχουν συναρτήσεις επίδρασης περιορισμένες τόσο στα x όσο και στα y. Ατυχώς, αυτές οι περιορισμένης επίδρασης εκτιμήτριες έχουν χαμηλά σημεία κατάρρευσης. Έχουν προταθεί αρκετές εκτιμήτριες υψηλού σημείου κατάρρευσης, γνωστές ως HBP (hgh breakdown pont), οι οποίες επιτυγχάνουν σημεία κατάρρευσης κοντά στο 50%. Ανάμεσα σε αυτές είναι η ελάχιστη διάμεσος τετραγώνων (least medan of squares estmator LMS) Rousseeuw (984) και η least trmmed squares (LS) Rousseeuw (984), Rousseeuw and Leroy (987). Η LS μπορεί να θεωρηθεί ως μία εναλλακτική ανθεκτική μέθοδος παλινδρόμησης των GM-μεθόδων, η οποία ορίζει μια εκτιμήτρια των παραμέτρων (α, β), ελαχιστοποιώντας το άθροισμα τετραγώνων των υπολοίπων στο υποσύνολο των [(n+p+)/] καλύτερων σημείων. Κάποιες καλύτερες προτάσεις εκτιμητριών επιτυγχάνουν υψηλά σημεία κατάρρευσης και ταυτόχρονα βελτιώνουν την αποτελεσματικότητα των HBP εκτιμητριών. Ανάμεσα σε αυτές είναι οι S εκτιμήτριες των Rousseeuw and Yoha (984), οι MM εκτιμήτριες Yoha (987) και Yoha and Zamar (988), οι οποίες συνδυάζουν καλή ασυμπτωτική αποτελεσματικότητα στο κανονικό γραμμικό μοντέλο με HBP. Οι εκτιμήτριες αυτές επιτυγχάνουν καλές ασυμπτωτικές ιδιότητες, μπορεί όμως να έχουν χαμηλή αποτελεσματικότητα σε πεπερασμένα δείγματα εάν το δείγμα περιέχει σημεία υψηλής επίδρασης (hgh leverage ponts). Με σκοπό να επιτευχθούν ταυτόχρονα εκτιμήτριες παλινδρόμησης περιορισμένης επίδρασης, υψηλού σημείου κατάρρευσης και αποτελεσματικότητας, οι Coakley and Hettmansperger (993), Smpson, Ruppert and Carroll (99) πρότειναν την εκτιμήτρια ενός βήματος SS, ξεκινώντας με αρχικές εκτιμήτριες υψηλού σημείου κατάρρευσης και χρησιμοποιώντας το σχήμα Schweppe με συντελεστές βαρύτητας Mallows. Οι εκτιμήτριες αυτές βελτιώνουν την αποτελεσματικότητα. Όμως, η απόδοσή ς στην πράξη εξαρτάται κατά μεγάλο ποσοστό από τις αρχικές τιμές LS. Ο σκοπός αυτής της εργασίας είναι να προτείνει μια νέα ανθεκτική προσέγγιση η οποία βασίζεται μόνο σε ανθεκτική εκτιμήτρια κλίμακας καταλοίπων (παρέχεται από την LS μέθοδο) και σε ανθεκτικά βάρη σχεδιασμού. Για την κατασκευή της νέας εκτιμήτριας παλινδρόμησης NQMIP, η οποία συνδυάζει υψηλό σημείο κατάρρευσης με καλή αποτελεσματικότητα, προτείνουμε νέα αντικειμενική συνάρτηση (loss functon), η οποία αποτελείται από το άθροισμα των τετραγώνων των καταλοίπων και κόσς τιμωρίας για την απομάκρυνση των ακραίων παρατηρήσεων. Στην ουσία, το πέναλτυ κόστος είναι μια συνάρτηση της ανθεκτικής κλίμακας σ και των καταλοίπων των δεδομένων. Η αντικειμενική συνάρτηση της νέας εκτιμήτριας παρουσιάζεται στη η ενότητα. Η ελαχιστοποίηση της προτεινόμενης αντικειμενικής συνάρτησης φορμάρεται ως μικτό ακέραιο τετραγωνικό πρόβλημα προγραμματισμού στην 3 η ενότητα. Τα αποτελέσματα της ΝQMIP εκτιμήτριας παρουσιάζονται χρησιμοποιώντας προσομοιώσεις Monte-Carlo στην 4 η ενότητα. Τέλος, συμπεράσματα, μελλοντική έρευνα και κάποια υπολογιστικά θέματα αναφέρονται στην 5 η ενότητα. - 40 -

. Η ΠΡΟΤΕΙΝΟΜΕΝΗ ΕΚΤΙΜΗΤΡΙΑ. ΟΡΙΣΜΟΣ Θεωρούμε την εκτιμήτρια η οποία ορίζεται ως η λύση στο πρόβλημα ελαχιστοπο ίηση ρ c ( ) (.) β όπου ρ c σ είναι η αντικειμενική συνάρτηση η οποία ορίζεται ως u για u < c h σ ρc σ ( u ) = (.) (cσ) για u c h σ όπου σ είναι κάποια ανθεκτική εκτιμήτρια κλίμακας των καταλοίπων u, c τα σημεία αποκοπής για ακραίες παρατηρήσεις τα οποία εξαρτώνται από τα σημεία σχεδιασμού, c = c ( w( x )), w(x ) είναι τα βάρη σχεδιασμού και c η γνωστή παράμετρος αποκοπής. Η επιλογή της παραμέτρου c ρυθμίζει την ανθεκτικότητα και την αποτελεσματικότητα της εκτιμήτριας. Η προτεινόμενη αντικειμενική συνάρτηση όπως φαίνεται στην (.) είναι απλή. Για μεγάλα κατάλοιπα u ( u c σ ) το άθροισμα των τετραγώνων των καταλοίπων είναι λιγότερο απότομα αυξανόμενο, αφού το μεγάλο τετραγωνικό κατάλοιπο ελαττώνεται στην τιμή ( c σ), η οποία εξαρτάται μόνο από τα σημεία σχεδιασμού και την αρχική εκτιμήτρια κλίμακας σ. Η τιμή αυτή, ( c σ), ερμηνεύεται ως το κόστος τιμωρίας για την απομάκρυνση μιας ακραίας παρατήρησης. Μια βέλτιστη εφικτή λύση προβλήματος (.) επιτυγχάνεται χρησιμοποιώντας μαθηματικό προγραμματισμό. Το πρόβλημα (.) φορμάρεται ως ένα κυρτό μικτό ακέραιο τετραγωνικό πρόβλημα προγραμματισμού. Η τεχνική αυτή αναπτύσσεται στην 3 η ενότητα.. ΙΔΙΟΤΗΤΕΣ Αν και στην παρούσα εργασία το θεωρητικό υπόβαθρο για τις ιδιότητες της προτεινόμενης εκτιμήτριας δεν αναπτύσσεται ικανοποιητικά, κάποιες καλές ιδιότητές της βασίζονται σε λογικές εξηγήσεις οι οποίες προέρχονται από το πρόβλημα ελαχιστοποίησης (.) και την εξίσωση (.). Συνέπεια (Consstency): Η εκτιμήτρια ορίζεται από τη λύση προβλήματος ελαχιστοποίησης (.). Το πρόβλημα αυτό είναι ισοδύναμο με την απόφαση πόσες και ποιες από τις ακραίες παρατηρήσεις πρέπει να απομακρυνθούν ώστε να προκύψει το ελάχιστο άθροισμα τετραγώνων των καταλοίπων και κόσς τιμωρίας. Μετά την απομάκρυνση των ακραίων παρατηρήσεων, η Εκτιμήτρια Ελαχίστων Τετραγώνων (OLS estmator) μπορεί να εφαρμοστεί στα καθαρά δεδομένα. Ανθεκτικότητα (Robustness): Στο πρόβλημα ελαχιστοποίησης (.), το κόστος τιμωρίας ( c σ) για την απομάκρυνση μιας ακραίας παρατήρησης εξαρτάται από τον πίνακα σχεδιασμού και την κλίμακα των καταλοίπων. Στα σημεία υψηλής επίδρασης n = σ u - 4 -

το κόστος τιμωρίας μειώνεται επειδή τα βάρη w(x ) γενικά μικραίνουν στα σημεία μοχλούς. Επομένως, τα σημεία υψηλής επίδρασης τείνουν να απομακρυνθούν εκτός αν τα κατάλοιπά ς είναι μικρά. Επιπλέον, για παρατηρήσεις που είναι y-outlers, μια απομάκρυνση πραγματοποιείται μόνο στην περίπτωση που u c σ. Αποτελεσματικότητα (Effcency): Η προτεινόμενη ανθεκτική διαδικασία απορρίπτει μόνο τις καταστροφικές παρατηρήσεις, αφού υπάρχει κόστος τιμωρίας ( c σ) για κάθε απομάκρυνση, όπως φαίνεται στην (.). Γενικά, μία παρατήρηση απομακρύνεται αν το τελικό κατάλοιπο u είναι μεγάλο ( u c σ ). Τελικά, η καλύτερη προσαρμογή μοντέλου αποκτάται στα καθαρά δεδομένα. Υψηλό Σημείο Κατάρρευσης (Hgh Break Down-Pont): Η προτεινόμενη εκτιμήτρια βασίζεται σε εκτιμήτρια των καταλοίπων σ υψηλού σημείου κατάρρευσης όπως προκύπτει από τον LS και σε ανθεκτική των βαρών w(x ), τα οποία εξαρτώνται μόνο από τα σημεία σχεδιασμού. Υπό αυτές τις συνθήκες, η προτεινόμενη εκτιμήτρια κληρονομεί υψηλό σημείο κατάρρευσης όπως παρουσιάζεται μέσω προσομοιώσεων Monte Carlo στην 4 η ενότητα. 3. ΠΡΟΤΥΠΑ ΜΙΚΤΟΥ ΑΚΕΡΑΙΟΥ ΤΕΤΡΑΓΩΝΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ 3. Η ΕΚΤΙΜΗΤΡΙΑ LS Αφού θεωρούμε ότι η προτεινόμενη εκτιμήτρια είναι μία βελτίωση της LS, δίνουμε τον ορισμό της εκτιμήτριας LS και αναπτύσσουμε μία μαθηματική φόρμα για την επίλυσή της. Στη συνέχεια (επόμενη παράγραφο) τροποποιούμε την φόρμα για να επιτύχουμε την προτεινόμενη μέθοδο «τιμωρίας» Η εκτιμήτρια LS (Least rmmed Squares) η οποία προτάθηκε από τον Rousseeuw (984) ορίζεται σαν το p-διάνυσμα β LS = ελαχιστοποίηση Q LS ( β) (3.) όπου = h ι= u Q (β), LS u β u u 3... u h είναι σε αύξουσα σειρά τα τετράγωνα των καταλοίπων και h είναι η παράμετρος που ρυθμίζει το σημείο κατάρρευσης και για το υψηλότερο σημείο κατάρρευσης έχει την τιμή h=(n+p+)/. Για την επίλυση προβλήματος (3.) αναπτύσσουμε την παρακάτω φόρμουλα μικτού ακέραιου τετραγωνικού προγραμματισμού: ελαχιστοποίηση n β, β, u, ε, δ = u (3.) - 4 -

σύμφωνα με ς περιορισμούς: x β x β ε δ K n δ + u u = n ( n + p + ) / δ : (0,) μεταβλητή β, β, u, ε = x β x β 0 y για ε y + ε =,..., n όπου ε παριστάνει το μέγεθος προσέλκυσης των y που απαιτείται για να μηδενισθούν τα μεγάλα κατάλοιπα u Στην φόρμα αυτή οι μεταβλητές απόφασης είναι όλες θετικές και είναι οι άγνωστοι συντελεστές παλινδρόμησης β =(β,...β p ), β =(β,...,β p ), β=β - β, τα κατάλοιπα u και οι αποστάσεις προσέλκυσης ε. Οι πρώτοι δύο περιορισμοί περιγράφουν γεωμετρικά την παλινδρόμηση για την περίπτωση των θετικών ή αρνητικών καταλοίπων αφού τα u είναι μόνο θετικά. Ακόμη, δ είναι μια δυαδική μεταβλητή λήψης αποφάσεων, τέτοια ώστε: Για δ =,ο τρίτος περιορισμός επιτρέπει την απόσταση προσέλκυσης ε να πάρει οποιοδήποτε άνω όριο K στο μέγιστο απόλυτο κατάλοιπο όπου ή y προσελκύεται προς την εκτιμώμενο πολυεπίπεδο της παλινδρόμησης έτσι ώστε να μειωθεί το κατάλοιπο στο μηδέν, u =0. Για δ =0, ο τρίτος περιορισμός θέτει την απόσταση προσέλκυσης ε στο μηδέν, οπότε, η τιμή y δεν προσελκύεται προς την εκτιμώμενη γραμμή. Στον τέταρτο περιορισμό υποδεικνύεται ότι ο αριθμός των διαγραφόμενων σημείων είναι (n-(n+p+)/), ο οποίος είναι ο μέγιστος αριθμός των σημείων που απορρίπτονται στην εκτιμήτρια LS. Το πρόβλημα (3.) έχει κυρτή αντικειμενική συνάρτηση και οι περιορισμοί σχηματίζουν κυρτό σύνολο Arthanar and Dodge (993), γι αυτό η μέθοδος smplex ψάχνοντας την λύση σταματά στο σημείο ( β, β, u, ε), το οποίο είναι και η μοναδική ολική βέλτιστη λύση. 3. Η ΠΡΟΤΕΙΝΟΜΕΝΗ ΕΚΤΙΜΗΤΡΙΑ NQMIP Με σκοπό την απομάκρυνση μόνο των καταστροφικών ακραίων παρατηρήσεων, οι Zoutas and Avramds (005) πρότειναν κόστος τιμωρίας για κάθε απομάκρυνση μιας ακραίας παρατήρησης (outler). Έτσι το πρόβλημα ελαχιστοποίησης (3.) διαμορφώθηκε στην ακόλουθη φόρμουλα : ελαχιστοποίηση β, β, u, ε, δ n = (u + δ ( c σ) ) (3.3) - 43 -

σύμφωνα με ς περιορισμούς: x β x β + u ε δ K x β x β u δ : (0,) μεταβλητή y β,, β, u ε 0 για =,..., n Για δ =, ο τρίτος περιορισμός επιτρέπει την απόσταση προσέλκυσης ε να πάρει οποιαδήποτε τιμή έτσι ώστε να μειωθεί το κατάλοιπο στο μηδέν, u =0, η αντικειμενική συνάρτηση όμως αυξάνει κατά ένα σταθερό κόστος τιμωρίας ( c σ). Στην περίπτωση αυτή θεωρούμε ότι το σημείο ( x, y ) δεν επηρεάζει πλέον την εκτιμήτρια παλινδρόμησης. Η εκτιμήτρια που προκύπτει από την λύση προβλήματος (3.3) συμβολίζεται με QMIP. Στην παρούσα εργασία διερευνήθηκε ένα καλύτερο κόστος τιμωρίας έτσι ώστε να μην απορρίπτονται από το δείγμα σημεία τα οποία είναι καλοί μοχλοί (good leverage ponts) και συμβάλουν στην ακρίβεια της εκτιμήτριας. Το κόστος τιμωρίας πρέπει να είναι τέτοιο ώστε να απορρίπτονται σημεία των οποίων τα τελικά κατάλοιπα είναι μεγαλύτερα από τρεις φορές το τυποποιημένο σφάλμα u > 3 h σ, όπου h είναι το διαγώνιο στοιχείο πίνακα Η (Hat) και η τιμή δηλώνει αν ένα σημείο είναι μοχλός (leverage). Ατυχώς όμως, όταν υπάρχει μία ομάδα από μοχλούς (leverage ponts) στα δεδομένα, συμβαίνει το φαινόμενο της επικάλυψης και το h αποτυγχάνει να υποδείξει όλα τα σημεία που είναι πράγματι μοχλοί. Για να αποφευχθούν τέτοιες συνέπειες στην παραπάνω εκτιμήτρια QMIP, το κόστος τιμωρίας για παρατηρήσεις με μεγάλη επίδραση (hgh leverage ponts) ελαφρύνεται χρησιμοποιώντας τα βάρη w(x ), όπως υπέδειξε ο Hampel (978) για τον εκτιμητή Mallows, προκειμένου να περιορίσει την επίδραση των μοχλών σε μία παλινδρόμηση. Μέχρι τώρα υπάρχουν εναλλακτικές προτάσεις για την ελάφρυνση των δυνατών μοχλών σε μία παλινδρόμηση. Στη νέα προτεινόμενη μέθοδο τιμωρίας τίθεται κατώτερο φράγμα στο κόστος απόρριψης μιας παρατήρησης, έτσι ώστε να παραμένει στο δείγμα όταν το τελικό της κατάλοιπο είναι μικρό, μικρότερο,5σ. Τελικά, ένα κόστος τιμωρίας που επιτρέπει ευκολότερα την απόρριψη των σημείων που είναι κακοί μοχλοί (bad leverage) στην παλινδρόμηση αλλά διατηρεί ς καλούς μοχλούς (good leverage) στο δείγμα είναι το ακόλουθο ( c σ) = max[(.5σ ), (3wσ ) ]. Τη νέα εκτιμήτρια συμβολίζουμε με NQMIP. ε y + ε 4. ΑΠΟΤΕΛΕΣΜΑΤΑ MONE CARLO Για την αξιολόγηση της αποδοτικότητας της ανθεκτικής μας εκτιμήτριας, διεξάγουμε μελέτη προσομοίωσης συγκρίνοντάς την με άλλες γνωστές ανθεκτικές - 44 -

εκτιμήτριες. Για τη διεξαγωγή ενός πειράματος προχωρούμε ως εξής. Δίνονται οι κατανομές των ανεξάρτητων μεταβλητών και οι τιμές των παραμέτρων. Σφάλματα παράγονται σύμφωνα με μια κατανομή των σφαλμάτων και παρατηρήσεις, y,προκύπν ακολουθώντας το μοντέλο παλινδρόμησης y = β0 + βx + βx + u. Θεωρούμε πως το δείγμα μπορεί να περιέχει τρεις τύπους ακραίων τιμών, bad leverage ponts (κακός μοχλός), good leverage ponts (καλός μοχλός) και y- outlers. Επιλέγουμε δείγματα μεγέθους n=50 και βαθμό μοντέλου παλινδρόμησης p= με συντελεστές β =.0, β =-0.80 και σταθερό όρο β 0 =0.0, ενώ προτιμούμε την κατανομή Gauss ως την κατανομή των σφαλμάτων, u ~ N(0, σ=6). Θεωρούμε πέντε διαφορετικούς τύπους ανθεκτικών εκτιμητριών: την LS, την MM, την SS, την QMIP και τη νέα προτεινόμενη εκτιμήτρια NQMIP (New QMIP). Οι υπολογισμοί των ανθεκτικών εκτιμητριών προέκυψαν από τη χρήση στατιστικού πακέ S-plus, έναν κώδικα MINIAB των Coakley και Hettmansperger (993) και τον επιλυτή FortMP/QMIP-Fortran Code. Για να πετύχουμε αξιόπιστα αποτελέσματα στη Monte Carlo προσομοίωση, συνήθως απαιτείται ένας μεγάλος αριθμός επαναλήψεων, π.χ. 000, Hawkns and Olve (999). Παρόλα αυτά, για τις προτεινόμενες εκτιμήτριες QMIP και NQMIP, οι 00 επαναλήψεις ήταν αρκετές για να επιτύχουμε ακρίβεια μικρότερη από 0%, δηλαδή ( β βˆ) / β < 0%, με επίπεδο εμπιστοσύνης λάχιστον 90%. Η απόδοση των ανθεκτικών εκτιμητριών μετρήθηκε από τις εκτιμήσεις της προσομοίωσης σύμφωνα με τα κριτήρια: μέση β, διακύμανση β, νόρμα μεροληψίας β, μέσο τετραγωνικό σφάλμα προσαρμογής. Όλα τα παρακάτω συμπεράσματα προέκυψαν μετά από προσεκτική εξέταση καθεμιάς από τις εκτιμήτριες. εκτιμήτριες ˆ0 β ΠΙΝΑΚΑΣ Αρ. των bad leverage ponts 6, good leverage ponts 4, y-outlers 6, παράμετροι παλινδρόμησης: β 0 = 0.00, β =.0, β = -0.80 ˆ β ˆ β ˆ0 β ˆ β ˆ β νόρμα μερολ. ˆβ μέσο τετραγ. σφάλμα προσαρ. μέσος χρόνος υπολογ. LS -0.67.008-0.677 98.547 0.309 0.059 7.775 353 < sec MM.87 0.980-0.750 7.65 0.53 0.04 5.974 34 < sec QMIP -0.35.77-0.784.70 0.059 0.005 4.07 84 0 sec SS 8.54 0.96-0.940 45.800 0.40 0.00 9.544 344 < sec NQMIP -0.7.58-0.800 4.77 0.003 0.005 3.07 7 0 sec - 45 -

εκτιμήτριες ˆ0 β ΠΙΝΑΚΑΣ Αρ. των bad leverage ponts 6, good leverage ponts 0, παράμετροι παλινδρόμησης: β 0 = 0.00, β =.0, β = -0.80 ˆ β ˆ β ˆ0 β ˆ β ˆ β νόρμα μερολ. ˆβ μέσο τετραγ. σφάλμα προσαρ. μέσος χρόνος υπολογ. LS 4.946 0.874-0.767 9.7 0.345 0.075.445 378 < sec MM.04.035-0.740 48.430 0.3 0.08 5.474 98 < sec QMIP.034.099-0.76 7.56 0.064 0.0 4.83 83 0 sec SS 3.057 0.805-0.8 0.853 0.6 0.044 6.987 37 < sec NQMIP 0.906.0-0.76.559 0.08 0.0 4.7 8 0 sec Σς Πίνακες -3 παρουσιάζονται τα αποτελέσματα της προσομοίωσης για τις πέντε εκτιμήτριες όσον αφορά τα κριτήρια που αναφέρθηκαν παραπάνω. Και στις τρεις περιπτώσεις, είναι φανερό ότι η νέα εκτιμήτρια NQMIP πλεονεκτεί έναντι των άλλων ως προς το μέσο τετραγωνικό σφάλμα προσαρμογής, το οποίο είναι και το βασικό από τα παραπάνω κριτήρια ως προς την αποτελεσματικότητα των εκτιμητριών. Πιο συγκεκριμένα, το μέσο τετραγωνικό σφάλμα προσαρμογής, δοθέντων των αληθινών τιμών των συντελεστών της παλινδρόμησης (β 0 = 0.00, β =.0, β = -0.80), είναι 56, οπότε με τη νέα προσέγγιση NQMIP υπάρχει σημαντική βελτίωση της τάξης 0%. Ακολουθεί η προηγούμενη προσέγγιση QMIP, εκτός της περίπτωσης μολύνσεως των δεδομένων μόνο με good leverage ponts Πίνακα 3, στην οποία η εκτιμήτρια ΜΜ υπερισχύει έναντι των υπολοίπων τριών εκτιμητριών. εκτιμήτριες ˆ0 β ΠΙΝΑΚΑΣ 3 Αρ. των bad leverage ponts 0, good leverage ponts 6, παράμετροι παλινδρόμησης: β 0 = 0.00, β =.0, β = -0.80 ˆ β ˆ β ˆ0 β ˆ β ˆ β νόρμα μερολ. ˆβ μέσο τετραγ. σφάλμα προσαρ. μέσος χρόνος υπολογ. LS 0.53.70-0.77 76.880 0.09 0.09 7.55 308 < sec MM -.60.04-0.754 8.004 0.004 0.03 3.07 66 < sec QMIP -.760.4-0.77 5.790 0.00 0.00 3.696 69 0 sec SS -.59.0-0.909.855 0.00 0.07 3.66 68 < sec NQMIP -.66.4-0.75 4.897 0.00 0.007.879 63 0 sec Σε όλες τις περιπτώσεις πάντως, οι εκτιμήτριες MM και SS βελτιώνουν την εκτιμήτρια LS, όπως αναμενόταν. Η νέα εκτιμήτρια δίνει επιπλέον τις πιο κοντινές μέσες εκτιμήσεις στις πραγματικές τιμές των παραμέτρων όπως επίσης έχει και τις μικρότερες διακυμάνσεις και στις τρεις εκτιμώμενες παραμέτρους. ΠΙΝΑΚΑΣ 4 Αρ. των bad leverage ponts 6, good leverage ponts 4, y-outlers 6, παράμετροι παλινδρόμησης: β 0 = 0.00, β =.0, β = -0.80 Εκτιμήτριες Αριθμός απόρριψης good leverage ponts QMIP 3 NQMIP 8-46 -

Ο Πίνακας 4 δίνει τον αριθμό των good leverage ponts που απορρίφθηκαν με την προηγούμενη και τη νέα προσέγγιση QMIP στις 00 επαναλήψεις, στην περίπτωση της μεγαλύτερης μόλυνσης που πραγματοποιήθηκε στα δεδομένα (3%). Η μείωση αριθμού των σημείων από 3 σε 8 (επί συνόλου 400) δείχνει το μέγεθος της βελτίωσης της εκτιμήτριας, καθώς τα σημεία αυτά συμβάλλουν στην αποτελεσματικότητα της εκτιμήτριας. 5. ΤΕΛΙΚΑ ΣΧΟΛΙΑ - ΠΑΡΑΤΗΡΗΣΕΙΣ Η προτεινόμενη εκτιμήτρια NQMIP περιορίζει σημαντικά τον αριθμό των απορριπτόμενων good leverage σημείων, για αυτό και παρουσιάζει αξιόλογη αποτελεσματικότητα. Βασιζόμενοι στα παραπάνω κριτήρια και αποτελέσματα, συμπεραίνουμε πως η νέα ΝQMIP εκτιμήτρια συμπεριφέρεται καλά και είναι αποδοτική σε όλα τα είδη ακραίων παρατηρήσεων, και υπάρχει όφελος από την προτεινόμενη προσέγγιση στην ανθεκτική παλινδρόμηση έναντι των γνωστών μεθόδων. Παρόλα αυτά, ο μέσος χρόνος υπολογισμού της επίλυσης προβλήματος ΝQMIP ενός δείγματος μεγέθους n=50 πλησιάζει τα 0 δευτερόλεπτα. Είναι πλέον αποδεκτό ότι στα δείγματα μικρού ή μεσαίου μεγέθους, το όφελος από τη χρήση της προτεινόμενης εκτιμήτριας υπερκαλύπν τον επιπρόσθετο χρόνο υπολογισμού. Η μέθοδος μικτού ακέραιου τετραγωνικού προγραμματισμού προσφέρει μια συστηματική προσέγγιση στη βελτίωση της συμπεριφοράς μικρού ή μεσαίου μεγέθους δειγμάτων στην ανθεκτική παλινδρόμηση. Αφού ο αριθμός των ακραίων παρατηρήσεων σε ένα δείγμα είναι άγνωστος, προτείνουμε τη χρήση της εκτιμήτριας ΝQMIP, η οποία παρέχει την ικανότητα διαχωρισμού των bad και good leverage σημείων, σημαντικό γεγονός στην ανθεκτική παλινδρόμηση. ABSRAC In robust regresson we often have to decde how many are the unusual observatons, whch should be removed from the sample n order to obtan better fttng for the rest of the observatons. Generally, we use the basc prncple of LS, whch s to ft the majorty of the data, dentfyng as outlers those ponts that cause the bggest damage to the robust ft. However, n the LS regresson method the choce of default values for hgh break downpont affects serously the effcency of the estmator. In the proposed approach we ntroduce penalty cost for dscardng an outler, consequently, the best ft for the majorty of the data s obtaned by dscardng only catastrophc observatons. he robust estmaton s obtaned by solvng a convex quadratc mxed nteger programmng problem. Fnally, we conduct a smulaton study to compare other robust estmators wth our approach n terms of ther effcency and robustness. ΑΝΑΦΟΡΕΣ Arthanar,. S. and Dodge, Y. (993), Mathematcal Programmng n Statstcs, John Wley& Sons, Inc. Coakley, C. W. and Hettmansperger,. P. (993), A Bounded Influence, Hgh Breakdown, Effcent Regresson Estmator, J.A.S.Α., 88, 87-880. - 47 -

Hampel, F. R. (978), Optmally boundng the gross error senstvty and nfluence of poston n factor space, Proceedngs of the ASA Statstcal Computng Secton, ASA, Wasnghton, D.C.,pp. 59-64. Huber, P. J. (98), Robust Statstcs, John Wley, New York. Hawkns, D.M. and Olve, D.J. (999), Improved Feasble Soluton Algorthms for Hgh Breakdown Estmaton, Computatonal Statstcs and Data Analyss, 30, -. Krasker, W. S. and Welsch, R. E. (98), Effcent Bounded-Influence Regresson Estmaton, J.A.S.Α., 77, 595-604. Mallows, C. L. (975), On Some opcs n Robustness, unpublshed memorandum, Bell elephone Laboratores, Murray Hll, New Jersey. Rousseeuw, P. J. (984), Least Medan of Squares Regresson, J.A.S.Α., 79, 87-880. Rousseeuw, P. J. and Leroy, A. M. (987), Robust Regresson and Outler Detecton, Wley: New York. Rousseeuw, P. J. and Yoha, V.J. (984), Robust Regresson by Means of S Estmators, n Robust and Nonlnear me Seres Analyses (Lecture Notes n Statstcs No. 6), eds. J. Franke, W. Hardle, and R. D. Martn, New York: Sprnger Verlag pp. 56-7. Smpson, D.J., Ruppert, D. and Carroll, R.J. (99), On One Step GM Estmates and Stablty of Inferences n Lnear Regresson, J.A.S.Α., 87, 439-450. Yoha, V.J. (987), Hgh Breakdown-pont and Hgh Effcency Robust Estmates for Regresson, Annals of Statstcs 5, 64-656. Yoha, V.J. and Zamar, R.Z. (988), Hgh Breakdown-pont Estmates of Regresson by Means of Mnmzaton of an Effcent Scale, J.A.S.Α., 83, 406-43. Zoutas, G. and Avramds, A. (005), Deletng Outlers n Robust Regresson wth Mxed Integer Programmng, Acta Mathematcae Applcatae Snca, Englsh Seres,, 33-334. - 48 -