ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ"

Transcript

1 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Διπλωματική εργασία Θέμα: ΠΟΙΝΙΚΟΠΟΙΗΜΕΝΕΣ ΜΕΘΟΔΟΙ ΜΕ ΣΥΝΑΡΤΗΣΕΙΣ ΠΟΙΝΗΣ ΒΑΣΙΣΜΕΝΕΣ ΣΤΗ ΣΥΣΧΕΤΙΣΗ ΠΑΠΑΓΙΑΝΝΑΚΗΣ ΝΙΚΟΣ Επιβλέπων: Κουκουβίνος Χρήστος, Καθηγητής ΕΜΠ Αθήνα, Οκτώβρης 01

2 ΠΕΡΙΛΗΨΗ Τα τελευταία χρόνια έχουν αναπτυχθεί διάφορες μέθοδοι επιλογής μεταβλητών. Σκοπός τους είναι η επιλογή των στατιστικά σημαντικών μεταβλητών, αυτών δηλαδή που επηρεάζουν σημαντικά τη μεταβλητή απόκρισης. Στην παρούσα εργασία παρουσιάζουμε διάφορες ποινικοποιημένες μεθόδους, που αναπτύχθηκαν πρόσφατα, οι οποίες βασίζονται στην εισαγωγή μίας συνάρτησης ποινής στην πιθανοφάνεια. Ειδικότερα, οι συναρτήσεις ποινής που εξετάζουμε, βασίζονται στη συσχέτιση μεταξύ των μεταβλητών. Στο πρώτο κεφάλαιο, κάνουμε μία εισαγωγή στο γενικό γραμμικό μοντέλο και στις βασικές μεθόδους εκτίμησης των παραμέτρων. Επίσης, παρουσιάζεται το θεωρητικό υπόβαθρο αυτών και αξιολογούμε την απόδοσή τους. Στο δεύτερο κεφάλαιο, παρουσιάζουμε εκτενώς μία νέα ποινικοποιημένη μέθοδο για γραμμικά μοντέλα, της οποίας η συνάρτηση ποινής βασίζεται στη συσχέτιση μεταξύ των μεταβλητών. Επίσης, συγκρίνουμε την απόδοση της νέας μεθόδου με διάφορες άλλες, εφαρμόζοντας αυτές σε διάφορες προσομοιώσεις και πραγματικά δεδομένα. Τέλος, στο τρίτο κεφάλαιο, παρουσιάζουμε την επέκταση της νέας μεθόδου στα γενικευμένα γραμμικά μοντέλα. Επίσης, αναφερόμαστε και σε άλλες μεθόδους και αξιολογούμε την αποδοτικότητά τους μέσω προσομοιώσεων και πραγματικών δεδομένων. Σελίδα 1

3 ABSTRACT Over the last years, various methods for variable selection have been developed. The aim is to choose the relevant variables, which have an important influence on the response. In this thesis, we discuss various, recently developed, penalized methods, which are based on a penalty term that is imposed in the likelihood function. In particular, the penalty terms we consider, are based on the correlation between explanatory variables. In the first chapter, we provide an introduction to the general linear model and to the basic parameter estimation methods. Furthermore, we present the theoretical background of them and we evaluate their performance. In the second chapter, a novel penalized method with correlation based penalty is presented extensively. We also compare its performance with others methods, through many simulations and real data sets. At the end, in the third chapter, an extended version of the new method in generalized linear models is presented. We also mention other methods and we evaluate their performance through many simulations and real data sets. Σελίδα

4 ΕΥΧΑΡΙΣΤΙΕΣ Η εκπόνηση και ολοκλήρωση της παρούσας διπλωματικής εργασίας δεν θα μπορούσε να πραγματοποιηθεί χωρίς την επίβλεψη και τη συνεισφορά στελεχών του Εθνικού Μετσόβιου Πολυτεχνείου. Ως εκ τούτου, οφείλω θερμές ευχαριστίες στον Καθηγητή του Ε.Μ.Π. κ. Χρήστο Κουκουβίνο, για την επίβλεψη και καθοδήγηση του, όπως επίσης και για τη δυνατότητα που μου προσέφερε να ασχοληθώ με το επιστημονικό αντικείμενο που με ενδιαφέρει. Επίσης, θα ήθελα να ευχαριστήσω τον υποψήφιο διδάκτορα Μάνο Ανδρουλάκη, για την πολύτιμη βοήθειά του και το αδιάλειπτο ενδιαφέρον κατά τη διάρκεια εκπόνησης της παρούσας εργασίας. Τέλος, αυτή η εργασία δεν θα μπορούσε να ολοκληρωθεί χωρίς την υπομονή που έκανε η οικογένειά μου το διάστημα αυτό και τα εφόδια που μου προσέφερε. Σελίδα 3

5 ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΛΗΨΗ... 1 ABSTRACT... ΕΥΧΑΡΙΣΤΙΕΣ... 3 ΚΕΦΑΛΑΙΟ Εισαγωγή Το γενικό γραμμικό μοντέλο παλινδρόμησης Εκτίμηση των παραμέτρων του μοντέλου με τη μέθοδο ελαχίστων τετραγώνων Εκτίμηση των παραμέτρων του μοντέλου με τη μέθοδο μέγιστης πιθανοφάνειας Ποινικοποιημένα ελάχιστα τετράγωνα και ποινικοποιημένη πιθανοφάνεια Εισαγωγή Επιλογή μεταβλητών μέσω ποινικοποιημένων ελαχίστων τετραγώνων Επιλογή μεταβλητών μέσω ποινικοποιημένης πιθανοφάνειας Αριθμητικές συγκρίσεις Συμπεράσματα ΚΕΦΑΛΑΙΟ Εισαγωγή Ποινικοποιημένη παλινδρόμηση συνδεδεμένη με τη συσχέτιση Εκτιμητής βασισμένος στη συσχέτιση Κατασκευή της ποινής Το αποτέλεσμα της ομαδοποίησης: Η ακραία περίπτωση Προσομοιώσεις σε μεσαίων διαστάσεων προβλήματα Ενίσχυση κατά ομάδες Το αποτέλεσμα της ομαδοποίησης Εφαρμογή σε πραγματικά δεδομένα (σωματικό λίπος) Απόδοση σε συνθήκες υψηλών διαστάσεων Προβλεπτική ικανότητα και εκτίμηση των επιδράσεων Προσδιορισμός σημαντικών μεταβλητών Συμπεράσματα ΚΕΦΑΛΑΙΟ Εισαγωγή Ποινικοποιημένη εκτιμήτρια μέγιστης πιθανοφάνειας Γενικευμένη ενίσχυση κατά ομάδες Σελίδα 4

6 3.4 Προσομοιώσεις και παραδείγματα πραγματικών δεδομένων (λευχαιμία) Συμπεράσματα ΠΑΡΑΡΤΗΜΑ ΒΙΒΛΙΟΓΡΑΦΙΑ Σελίδα 5

7 ΚΕΦΑΛΑΙΟ Εισαγωγή Έστω ότι Y, μια μεταβλητή που μας ενδιαφέρει και X 1, X,..., X p, ένα σύνολο επεξηγηματικών μεταβλητών ή παραγόντων που αποτελούν διανύσματα n παρατηρήσεων. Το πρόβλημα της επιλογής μεταβλητών εμφανίζεται όταν ο αναλυτής θέλει να μοντελοποιήσει τη σχέση μεταξύ της Y και ενός υποσυνόλου των X 1, X,..., X p, χωρίς όμως να γνωρίζει ποιο υποσύνολο να επιλέξει. Σκοπός δηλαδή, είναι να επιλεγούν οι παράγοντες που έχουν σημαντική επίδραση στην απόκριση Y. Ιδιαίτερο ενδιαφέρον παρουσιάζει η περίπτωση που συναντάται συχνά στις εφαρμογές, το πλήθος p των υποψηφίων παραγόντων να είναι μεγάλο. Στην πράξη, ο αριθμός των στατιστικά σημαντικών παραγόντων είναι αρκετά μικρότερος σε σχέση με το αρχικό σύνολό τους, μια ιδιότητα γνωστή ως «αρχή της σποραδικότητας των επιδράσεων», (Bickel, 1975). Το πρόβλημα της επιλογής μεταβλητών είναι αρκετά σύνηθες στο πλαίσιο των γραμμικών μοντέλων παλινδρόμησης και των γενικευμένων γραμμικών μοντέλων (Mc Cullagh & Nelder, 1989). Τα τελευταία χρόνια, έχουν προταθεί αρκετές μέθοδοι και αλγόριθμοι επιλογής μεταβλητών και αποτελούν αναπόσπαστο κομμάτι αρκετών στατιστικών πακέτων. Η χρήση τους γίνεται όλο και περισσότερο αναγκαία, καθότι το μέγεθος των δεδομένων που ανακύπτουν έπειτα από διάφορες μελέτες, συνεχώς μεγαλώνει. Παρότι που ο αριθμός των μεθόδων αυτών είναι αρκετά μεγάλος, το πεδίο της επιλογής μεταβλητών βρίσκεται ακόμα υπό έρευνα και συνεχώς προτείνονται βελτιωμένες ή καινούργιες μέθοδοι. 1. Το γενικό γραμμικό μοντέλο παλινδρόμησης Αρκετές φορές συναντάμε προβλήματα, για τα οποία υπάρχει η υποψία ότι οι τιμές κάποιας μεταβλητής εξαρτώνται από k επεξηγηματικές μεταβλητές. Το γενικό γραμμικό μοντέλο, το οποίο περιγράφει αυτή τη σχέση είναι k yi 0 1 x1i xi... k xki i 0 j xij i, i 1,,..., n (1..1), j 1 Σελίδα 6

8 οπότε και η απόκριση yi είναι μια γραμμική συνάρτηση των συντελεστών παλινδρόμησης j, με j 1,,..., k. Ως γνωστόν, έχουμε ότι yi, είναι οι τιμές της απόκρισης. xij είναι οι τιμές των επεξηγηματικών μεταβλητών. Υποθέτουμε, όπως και στο απλό γραμμικό μοντέλο, ότι οι μετρήσεις μας δεν υπόκεινται σε σφάλματα. j είναι οι άγνωστες παράμετροι το μοντέλου οι οποίες και πρέπει να εκτιμηθούν. i είναι τα σφάλματα ή υπόλοιπα, τα οποία αποτελούν τυχαίες μεταβλητές και υποθέτουμε ότι ικανοποιούν τα παρακάτω: E ( i ) 0 i. Var ( i ), δηλαδή τα σφάλματα ικανοποιούν την υπόθεση της ομοιοσκεδαστικότητας. Cov( i, j ) 0, i j, δηλαδή τα σφάλματα είναι ασυσχέτιστα Εκτίμηση των παραμέτρων του μοντέλου με τη μέθοδο ελαχίστων τετραγώνων Υποθέτουμε καταρχήν ότι n k. Για να εκτιμηθούν οι παράμετροι j του μοντέλου, χρησιμοποιείται η μέθοδος ελαχίστων τετραγώνων, (Ανδρουλάκης, 008). Αυτή η μέθοδος συνίσταται κατά τα γνωστά στην ελαχιστοποίηση του αθροίσματος τετραγώνων των σφαλμάτων k S ( 0, 1,..., k ) yi 0 j xij, i 1 i 1 j 1 n n i οπότε τελικά προκύπτουν οι εκτιμητές ˆ0, ˆ1,..., ˆk. Είναι βολικότερο να γράψουμε των εξίσωση (1..1) υπό την μορφή πινάκων, ήτοι Y X, όπου Σελίδα 7

9 y1 y Y, yn 1 1 X 1 0 1, k x11 x1k x1 x k xn1 xnk 1. n Το Y είναι ένα n 1 διάνυσμα των παρατηρήσεων, ο X είναι ένας n k πίνακας των επεξηγηματικών μεταβλητών, είναι ένα k 1 διάνυσμα των συντελεστών παλινδρόμησης και το είναι ένα n 1 διάνυσμα των τυχαίων σφαλμάτων. Οπότε προκειμένου να βρεθεί η εκτιμήτρια ελαχίστων τετραγώνων, πρέπει να ελαχιστοποιηθεί το άθροισμα των τετραγώνων των σφαλμάτων n S ( ) i ' (Y X ) '(Y X ). i 1 Τελικά, προκύπτει ότι ˆ ( X ' X ) 1 X ' Y. Αναφέρουμε και κάποιες ιδιότητες της εκτιμήτριας ελαχίστων τετραγώνων. Καταρχήν E ( ˆ ) E ( X ' X ) 1 X ' Y E ( X ' X ) 1 X '( X ) E ( X ' X ) 1 X ' X ( X ' X ) 1 X ', καθότι E ( ) 0 και ( X ' X ) 1 X ' X I. Σελίδα 8

10 Άρα το αποτελεί αμερόληπτη εκτιμήτρια του. Επίσης έχουμε ότι Var ( ˆ ) Var ( X ' X ) 1 X ' Y ( X ' X ) 1 X ' Var (Y ) ( X ' X ) 1 X ' ' ( X ' X ) 1 X ' X ( X ' X ) 1 ( X ' X ) Εκτίμηση των παραμέτρων του μοντέλου με τη μέθοδο μέγιστης πιθανοφάνειας Όπως και στην περίπτωση του απλού γραμμικού μοντέλου, αν στις βασικές υποθέσεις προσθέσουμε και ότι τα σφάλματα είναι κανονικά κατανεμημένα, τότε δεν είναι μόνο ασυσχέτιστα αλλά κατ ανάγκη και ανεξάρτητα. Χρησιμοποιώντας διανύσματα, γράφουμε N (0, ), δηλαδή το ακολουθεί n -διάστατη πολυμεταβλητή κανονική κατανομή με E ( ) 0 και Var ( ). Σε αυτήν την περίπτωση, η εκτιμήτρια ελαχίστων τετραγώνων, ταυτίζεται με την εκτιμήτρια μέγιστης πιθανοφάνειας. Όσον αφορά την τελευταία μέθοδο, ισχύουν τα παρακάτω, (Ανδρουλάκης, 008). Η μέθοδος μέγιστης πιθανοφάνειας, προτάθηκε από τον R.A. Fisher (1997). Συγκεκριμένα, έστω ένας πληθυσμός με άγνωστη παράμετρο ( 1,,..., k ) και συνάρτηση πυκνότητας πιθανότητας f ( x ). Σκοπός είναι η εκτίμηση της παραμέτρου. Οπότε θεωρούμε ένα τυχαίο δείγμα X 1, X,..., X n από τον πληθυσμό. Αν f ( x1 ), f ( x ),..., f ( xn ) είναι η συνάρτηση πυκνότητας πιθανότητας κάθε τιμής του τυχαίου δείγματος, τότε η από κοινού συνάρτηση πυκνότητας πιθανότητας των μεταβλητών X 1, X,..., X n είναι f ( x1, x,..., xn ) f ( x1 ) f ( x ) f ( xn ) (1...1). Σελίδα 9

11 Στην περίπτωση συγκεκριμένων παρατηρήσεων x1, x,..., xn τυχαίου δείγματος, η (1...1) είναι συνάρτηση μόνο της παραμέτρου και συμβολίζεται ως n L( x1, x,..., xn ) f ( x1 ) f ( x ) f ( xn ) f ( xi ) (1...). i 1 Η (1...) καλείται συνάρτηση πιθανοφάνειας (likelihood function) του τυχαίου δείγματος X 1, X,..., X n και εκφράζει το πόσο «πιθανοφανείς», δηλαδή πόσο σύμφωνες με το συγκεκριμένο δείγμα είναι οι διάφορες τιμές της παραμέτρου. Η μέθοδος μέγιστης πιθανοφάνειας συνίσταται στην επιλογή της τιμής ˆ η οποία μεγιστοποιεί τη συνάρτηση πιθανοφάνειας, L( ˆ x1, x,..., xn ) sup L( x1, x,..., xn ). Η τιμή ˆ καλείται εκτιμήτρια μέγιστης πιθανοφάνειας της. Μεγιστοποίηση της L( x1, x,..., xn ) σημαίνει μεγιστοποίηση της πιθανότητας εμφάνισης των τιμών x1, x,..., xn στο δείγμα X 1, X,..., X n. Η τιμή αυτή ˆ ( ˆ1, ˆ,..., ˆk ), βρίσκεται με λύση των εξισώσεων log L( x1, x,..., xn ) 0, r 1,,..., k. r Φυσικά, για να είναι η λύση αυτή πράγματι σημείο μεγίστου, θα πρέπει ο Εσσιανός πίνακας log L( ) i j k k να είναι γνήσια αρνητικός για ˆ. Σελίδα 10

12 1.3 Ποινικοποιημένα ελάχιστα τετράγωνα και ποινικοποιημένη πιθανοφάνεια Εισαγωγή Οι πιο γνωστές και συχνότερα χρησιμοποιούμενες μέθοδοι επιλογής μεταβλητών, είναι ως γνωστόν η κατά βήματα απαλοιφή (stepwise deletion) και η μέθοδος επιλογής καλύτερου υποσυνόλου (best subset selection), (Ανδρουλάκης, 008). Έχουν όμως το μειονέκτημα ότι αγνοούν τα στοχαστικά σφάλματα που εμφανίζονται κατά τη διαδικασία της επιλογής μεταβλητών καθώς και ότι είναι υπολογιστικά χρονοβόρες. Οι Fan και Li (001), πρότειναν μια καινούργια μεθοδολογία, βασισμένη στα ποινικοποιημένα ελάχιστα τετράγωνα (penalized least squares), η οποία διατηρεί τις καλές ιδιότητες της παλινδρόμησης κορυφογραμμής αλλά και της μεθόδου επιλογής καλύτερου υποσυνόλου. Η μεθοδολογία τους αυτή, επεκτείνεται και σε μοντέλα βασισμένα στη πιθανοφάνεια, όπως π.χ. στην περίπτωση όπου έχουμε δίτιμη απόκριση (binary response). Μια γνωστή οικογένεια τέτοιων μοντέλων είναι τα γενικευμένα γραμμικά μοντέλα. Ουσιαστικά τώρα, αυτό που τελικά επιτυγχάνεται, είναι ότι ταυτόχρονα γίνεται και εκτίμηση των παραμέτρων του μοντέλου και μηδενισμός κάποιων, άρα ικανοποιείται ο σκοπός της επιλογής μεταβλητών. Η διαδικασία της ποινικοποίησης, συνίσταται στην εισαγωγή κάποιων συναρτήσεων ποινής (penalty functions), (Ανδρουλάκης, 008), οι οποίες πρέπει να έχουν τις ακόλουθες ιδιότητες: Να είναι ιδιάζουσες (singular) στην αρχή ώστε να παράγουν σποραδικές λύσεις (πολλοί εκ των εκτιμηθέντων συντελεστών να έχουν τιμή μηδέν). Να ικανοποιούν συγκεκριμένες απαιτήσεις ώστε να παράγουν συνεχή μοντέλα (continuous models), οπότε η επιλογή του μοντέλου να χαρακτηρίζεται από σταθερότητα (stability). Να φράσσονται από μια σταθερά, ώστε να παράγουν σχεδόν αμερόληπτους εκτιμητές για μεγάλους συντελεστές. Η παλινδρόμηση bridge που προτάθηκε από τους Frank και Friedman (1993), και η μέθοδος LASSO που προτάθηκε από τον Tibshirani (1996) είναι μέλη της μεθόδου των ποινικοποιημένων ελαχίστων τετραγώνων, με τη διαφορά ότι οι σχετικές με τις μεθόδους αυτές, συναρτήσεις ποινής Lq, δεν ικανοποιούν όλες τις προαναφερθείσες απαιτήσεις. Όπως αναφέραμε και προηγουμένως, η καινούργια μέθοδος επεκτάθηκε και σε μοντέλα βασισμένα στη πιθανοφάνεια (likelihood-based models). Η διαφορά σε σχέση με τις παραδοσιακές μεθόδους (όπου συνήθως χρησιμοποιείται τετραγωνική συνάρτηση ποινής), είναι ότι οι νέες συναρτήσεις ποινής είναι συμμετρικές, κυρτές στο (0, ) και διακατέχονται από ιδιομορφίες Σελίδα 11

13 (singularities) στην αρχή. Να σημειωθεί, ότι εν αντιθέσει με τις παραδοσιακές μεθόδους επιλογής μεταβλητών, η νέα μέθοδος έχει ισχυρό θεωρητικό υπόβαθρο. Επίσης, στην εργασία τους, οι Fan και Li (001), πρότειναν ένα αρκετά αποδοτικό αλγόριθμο βελτιστοποίησης της ποινικοποιημένης πιθανοφάνειας ο οποίος οδηγεί στην εκτίμηση των παραμέτρων και στον υπολογισμό του τυπικού σφάλματος. Δόθηκε μια συγκεκριμένη φόρμουλα υπολογισμού του σφάλματος για τους εκτιμηθέντες συντελεστές χρησιμοποιώντας την μέθοδο sandwich. Η μέθοδος αυτή έχει δοκιμαστεί και είναι αρκετά ακριβής για πρακτικούς σκοπούς ακόμα και στη περίπτωση μέτριου μεγέθους δείγματος. Οι προτεινόμενες αυτές διαδικασίες επιλογής συγκρινόμενες με άλλες μεθόδους επιλογής μεταβλητών δίνουν πάντα καλύτερα και ορθότερα αποτελέσματα. Συνεχίζοντας την περιγραφή των χαρακτηριστικών των μεθόδων αυτών, αναφέρουμε το μεγαλύτερο πλεονέκτημά τους. Συγκεκριμένα, επιλέγουν τις σημαντικές μεταβλητές και εκτιμούν τους συντελεστές τους ταυτόχρονα. Οπότε μπορούν να αναπτυχθούν οι δειγματικές ιδιότητες (sampling properties) των μεθόδων, (Ανδρουλάκης, 008). Στην συνέχεια παρουσιάζουμε πως οι δείκτες σύγκλισης (rates of convergence) των προτεινόμενων εκτιμητών της ποινικοποιημένης πιθανοφάνειας (penalized likelihood estimators) εξαρτώνται από την παράμετρο κανονικοποίησης. Να σημειωθεί, ότι οι εκτιμητές ποινικοποιημένης πιθανοφάνειας, έχουν τόσο καλή απόδοση όσον αφορά την επιλογή του σωστού μοντέλου, όσο και η διαδικασία προβλεψιμότητας (oracle procedure), αρκεί να έχει επιλεγεί σωστά η παράμετρος κανονικοποίησης (regularization parameter). Σαν να ήταν δηλαδή γνωστό εξαρχής γνωστό το σωστό υπο-μοντέλο (submodel). Αυτό πρακτικά, σημαίνει ότι όταν οι σωστές παράμετροι του μοντέλου έχουν κάποιες μηδενικές συνιστώσες, αυτές εκτιμώνται από τη μέθοδο ως μηδενικές με πιθανότητα να τείνει στη μονάδα. Ενώ όσον αφορά τις μη μηδενικές συνιστώσες, αυτές εκτιμώνται τόσο καλά όπως όταν είναι γνωστό το σωστό υπο-μοντέλο. Αυτό προφανώς αυξάνει την ακρίβεια εκτίμησης τόσο των μηδενικών όσο και των μη μηδενικών συνιστωσών. Οπότε και υπερτερούν της μεθόδου εκτίμησης μέγιστης πιθανοφάνειας. Στη συνέχεια θα γίνει μια εκτενής συζήτηση της όλης μεθοδολογίας Επιλογή μεταβλητών μέσω ποινικοποιημένων ελαχίστων τετραγώνων Θεωρούμε το γνωστό γραμμικό μοντέλο Y X Σελίδα 1

14 όπου Y είναι ένα n 1 διάνυσμα των παρατηρήσεων, ο X είναι ένας n d πίνακας των επεξηγηματικών μεταβλητών, είναι ένα d 1 διάνυσμα των συντελεστών παλινδρόμησης και το είναι ένα n 1 διάνυσμα των τυχαίων σφαλμάτων. Όπως και στην περίπτωση του μοντέλου γραμμικής παλινδρόμησης, υποθέτουμε ότι τα yi είναι υπό συνθήκη ανεξάρτητα, δοθέντων των xij. Επίσης, υποθέτουμε και ότι οι στήλες του πίνακα X είναι ορθοκανονικές (orthonormal). Ο υπολογισμός της εκτιμήτριας γίνεται μέσω της ελαχιστοποίησης της ποσότητας Y X, η οποία ισοδυναμεί με την ποσότητα ˆ, όπου ˆ X ' Y είναι η OLS (ordinary least squares) εκτιμήτρια. Θέτοντας τώρα ως z X 'Y και έστω ότι Yˆ XX ' Y, μια μορφή των ποινικοποιημένων ελαχίστων τετραγώνων είναι η εξής: d d d Y X p j ( j ) Y Yˆ ( z j j ) p j ( j ) (1.3..1). j 1 j 1 j 1 Να σημειωθεί ότι οι συναρτήσεις ποινής p j στην (1.3..1) δεν είναι απαραίτητα οι ίδιες για όλα τα j. Για παράδειγμα μπορεί να θέλουμε να κρατήσουμε ορισμένες σημαντικές μεταβλητές σε ένα παραμετρικό μοντέλο και για αυτό το λόγο να μη θέλουμε να ποινικοποιήσουμε τις αντίστοιχες παραμέτρους τους. Για ευκολία όμως, θεωρούμε ότι οι συναρτήσεις ποινής είναι οι ίδιες για όλους τους συντελεστές, και θα συμβολίζονται ως p( ). Επίσης, αντί p( ) θα χρησιμοποιούμε το συμβολισμό p ( ), δείχνοντας έτσι ότι το p( ) εξαρτάται από το. Σελίδα 13

15 Το πρόβλημα ελαχιστοποίησης της (1.3..1) είναι ισοδύναμο με την ελαχιστοποίηση των συνιστωσών. Οπότε θεωρούμε το παρακάτω πρόβλημα ελαχίστων τετραγώνων 1 ( z ) p ( ) (1.3..). Εν συνεχεία, χρησιμοποιώντας τη Hard συνάρτηση ποινής (βλ. σχήμα (α)) p ( ) ( ) I ( ), προκύπτει η Hard εκτιμήτρια (βλ. σχήμα 1.3..α). ˆ zi ( z ) (1.3..3). Με άλλα λόγια, η λύση της (1.3..1) είναι z j I ( z j ) η οποία συμπίπτει με την επιλογή καλύτερου υποσυνόλου και την κατά βήματα πρόσθεση και απαλοιφή στους ορθοκανονικούς σχεδιασμούς. Σημειώνουμε επιπλέον πως η συνάρτηση ποινής Hard είναι ομαλότερη από την συνάρτηση ποινής εντροπίας (entropy penalty) p ( ) I ( 0), η οποία και αυτή οδηγεί στη λύση (1.3..3). Μια συνάρτηση ποινής για να είναι καλή, πρέπει να δίνει εκτιμητές με τις ακόλουθες ιδιότητες: Αμεροληψία: Ο προκύπτων εκτιμητής πρέπει να είναι σχεδόν αμερόληπτος, ιδίως στην περίπτωση όπου η σωστή άγνωστη παράμετρος j είναι μεγάλη. Αποφεύγεται έτσι η μεροληψία του μοντέλου. Σποραδικότητα: Ο προκύπτων εκτιμητής πρέπει να αποτελεί κανόνα περιορισμού (thresholding rule), ώστε οι εκτιμηθέντες συντελεστές με μικρή τιμή, να μηδενίζονται. Έτσι, μειώνεται η πολυπλοκότητα του μοντέλου. Συνέχεια. Ο προκύπτων εκτιμητής πρέπει είναι συνεχής. Αποφεύγεται κατά αυτόν τον τρόπο η αστάθεια στη πρόβλεψη του μοντέλου. Ας εξηγήσουμε τώρα τις παραπάνω ιδιότητες. Καταρχήν η πρώτη παράγωγος της (1.3..) ως προς είναι Σελίδα 14

16 sgn( ) p ( ) z. Παρατηρούμε ότι όταν p ( ) 0 για μεγάλο, τότε ο προκύπτων εκτιμητής είναι ίσος με z όταν το z είναι επαρκώς μεγάλο. Για αυτό το λόγο, όταν η πραγματική παράμετρος είναι μεγάλη, η τιμή z είναι και αυτή μεγάλη και με μεγάλη πιθανότητα. Οπότε, ο PLS (penalized least squares) εκτιμητής είναι ˆ z, ο οποίος και είναι σχεδόν αμερόληπτος. Εν συμπεράσματι, η προϋπόθεση p ( ) 0 για μεγάλο, είναι μια επαρκής προϋπόθεση για την αμεροληψία μιας μεγάλης πραγματικής παραμέτρου. Όσον αφορά τη δεύτερη ιδιότητα, για να αποτελεί ο προκύπτων εκτιμητής κανόνα περιορισμού, πρέπει να ισχύει ότι min p ( ) 0. Το παρακάτω γράφημα παρέχει περισσότερες εξηγήσεις σχετικά με αυτό. Όταν τώρα z min p ( ) 0 η παράγωγος της (1.3..) είναι θετική για όλα τα θετικά και αρνητική για όλα τα αρνητικά. Οπότε σε αυτήν την περίπτωση, ο PLS εκτιμητής ˆ είναι μηδέν. Όταν όμως z min p ( ), δύο 0 διασταυρώσεις (crossings) μπορούν να υπάρξουν, όπως φαίνεται και στο σχήμα Η μεγαλύτερη είναι ο PLS εκτιμητής. Αυτό συνεπάγεται ότι ικανή και αναγκαία συνθήκη για την ύπαρξη συνέχειας είναι το min p ( ) να πετυχαίνεται στο μηδέν. Από αυτό αντιλαμβανόμαστε πως η συνάρτηση ποινής που ικανοποιεί τις ιδιότητες της σποραδικότητας και της συνέχειας, πρέπει να είναι ιδιάζουσα (singular) στην αρχή. Είναι γνωστό πως η συνάρτηση ποινής L p ( ) οδηγεί στην παλινδρόμηση κορυφογραμμής. Η συνάρτηση ποινής L1, οδηγεί στον soft οριακό κανόνα ˆj sgn( z j )( z j ), Σελίδα 15

17 που προτάθηκε από τους Donoho και Johnstone (1994). H LASSO που προτείνεται από τον Tibshirani (1996, 1997), είναι ο PLS εκτιμητής με συνάρτηση ποινής την L1. Επίσης, η Lq συνάρτηση ποινής p ( ) q οδηγεί στην παλινδρόμηση bridge (Frank & Friedman, 1993), (Fu, 1998). Η λύση είναι συνεχής μόνο για q 1. Παρόλα αυτά, όταν q 1, δεν παράγεται μια σποραδική λύση (βλ. σχήμα (a)). Η μόνη συνεχής λύση με κανόνα περιορισμού σε αυτή την οικογένεια συναρτήσεων είναι με τη συνάρτηση ποινής L1, αυτό όμως προκύπτει μεταβάλλοντας τον εκτιμητή κατά μια σταθερά λ, άρα χάνεται και η αμεροληψία (βλ. σχήμα 1.3..(b)). Επίσης για 0 q 1, δεν ικανοποιείται η συνθήκη της συνέχειας. Σχήμα : (a) Οι τρεις συναρτήσεις ποινής και οι τετραγωνικές τους προσεγγίσεις. Σχήμα 1.3..: Οι εκτιμήτριες (thresholding functions) (a) Hard, (b) Soft ή LASSO και (c) Scad, όπου για την τελευταία λ= και a=3.7. Σελίδα 16

18 Σχήμα : Η συνάρτηση p ( ) ως προς. Σχήμα : Οι συναρτήσεις p ( ) ως προς, για (a) τις συναρτήσεις ποινής Lq, (b) τη Hard συνάρτηση ποινής και (c) τη SCAD. Στο (a), η παχιά γραμμή αντιστοιχεί στην L1, η διακεκομμένη στην L0.5 και η λεπτή γραμμή στην L συνάρτηση ποινής Η συνάρτηση ποινής SCAD Οι συναρτήσεις ποινής Lq και Hard δεν ικανοποιούν και τις τρεις απαιτήσεις της αμεροληψίας, της σποραδικότητας και της συνέχειας, (Ανδρουλάκης, 008). Με σκοπό της βελτίωση της L1 και της Hard, οι Fan και Li (001) εισήγαγαν μια συνεχής και διαφορίσιμη συνάρτηση ποινής, τη SCAD (Smoothly Clipped Absolute Deviation penalty) (βλ. σχήμα (c)), η οποία ορίζεται ως ( ) p ( ) I ( ) I ( ), για κάποιο a και 0. ( 1) Σελίδα 17

19 Η συγκεκριμένη συνάρτηση δεν ποινικοποιεί υπερβολικά τις μεγάλες τιμές του και δίνει μια συνεχής λύση, την sgn( z )( z ), ˆ ( 1) z sgn( z ) / ( ), z, z z ( ) z Η λύση αυτή δόθηκε από τον Fan (1997), ο οποίος έκανε μια εκτενής συζήτηση για την περίπτωση των κυματοσυναρτήσεων (wavelets). Η λύση ( ) έχει δύο άγνωστες παραμέτρους, και. Στην πράξη θα μπορούσαμε να υπολογίσουμε το βέλτιστο ζεύγος (, ) βάσει κάποιων κριτηρίων, όπως της διασταυρωμένης επικύρωσης και της γενικευμένης διασταυρωμένης επικύρωσης. Κάτι που μπορεί να είναι υπολογιστικά χρονοβόρο. Οι Fan και Li (001), χρησιμοποιώντας εργαλεία Μπεϋζιανής ανάλυσης ρίσκου (Bayesian risk analysis), κατέληξαν στην επιλογή του Επιλογή μεταβλητών μέσω ποινικοποιημένης πιθανοφάνειας Η μέχρι στιγμής αναπτυχθείσα μεθοδολογία, μπορεί να εφαρμοσθεί σε πλήθος στατιστικών μοντέλων, όπως γραμμικά μοντέλα παλινδρόμησης (linear regression models), εύρωστα γραμμικά μοντέλα (robust linear models) και γενικευμένα γραμμικά μοντέλα βασισμένα στην πιθανοφάνεια (likelihood-based generalized linear models). Από και στο εξής, θα θεωρούμε ότι ο πίνακας σχεδιασμού X ( xij ) είναι κανονικοποιημένος, ώστε κάθε στήλη να έχει μέση τιμή 0 και διασπορά 1. Στο κλασικό μοντέλο παλινδρόμησης οι εκτιμητές ελαχίστων τετραγώνων παράγονται με την ελαχιστοποίηση του αθροίσματος των τετραγώνων των σφαλμάτων. Οπότε η (1.3..1) μπορεί να επεκταθεί για την περίπτωση όπου ο πίνακας σχεδιασμού δεν είναι ορθοκανονικός (orthonormal). Μια ισοδύναμη μορφή της (1.3..1) είναι d 1 (Y X ) '(Y X ) n p ( j ) ( ). j 1 Ελαχιστοποιώντας την ( ) ως προς, οδηγούμαστε σε έναν εκτιμητή ποινικοποιημένων ελαχίστων τετραγώνων του. Σελίδα 18

20 Είναι γνωστό τώρα ότι ο OLS εκτιμητής δεν είναι εύρωστος. Μπορούμε όμως να θεωρήσουμε τη συνάρτηση του Huber (1981), οπότε αντί της ελαχιστοποίησης της ( ), μπορούμε να ελαχιστοποιήσουμε την n d ( y x ' ) n p i i 1 i j 1 ( j ) (1.3.3.), ως προς, ώστε να πάρουμε έναν εύρωστο ποινικοποιημένο εκτιμητή του. Στην περίπτωση των γενικευμένων γραμμικών μοντέλων, γίνεται συμπερασματολογία βάσει των εκάστοτε υποβόσκουσων συναρτήσεων πιθανοφάνειας. Με τη βοήθεια τώρα του ποινικοποιημένου εκτιμητή μέγιστης πιθανοφάνειας, μπορούμε να επιλέξουμε σημαντικές μεταβλητές. Έχουμε τα εξής: Καταρχήν, έστω ότι τα δεδομένα ( xi, Yi ) έχουν συλλεχθεί ανεξάρτητα. Δεδομένων των xi, η Yi έχει συνάρτηση πιθανοφάνειας fi ( g ( xi ' ), yi ), όπου g είναι μια γνωστή συνάρτηση σύνδεσης. Έστω και ότι li log fi είναι ο λογάριθμος της πιθανοφάνειας του Yi. Οπότε μπορούμε να ορίσουμε την ποινικοποιημένη πιθανοφάνεια ως n d li ( g ( xi ' ), yi ) n p ( j ). i 1 j 1 Η μεγιστοποίηση της ως άνω συνάρτησης, είναι ισοδύναμη με την ελαχιστοποίηση της n d li ( g ( xi ' ), yi ) n p ( j ) ( ) i 1 j 1 ως προς. Αν αυτό γίνει για κάποια οριακή παράμετρο, θα πάρουμε τον ποινικοποιημένο εκτιμητή μέγιστης πιθανοφάνειας (penalized maximum likelihood estimator). Σελίδα 19

21 Δειγματοληπτικές και προβλεπτικές ιδιότητες Σε αυτήν την ενότητα θα αναπτύξουμε την ασυμπτωτική θεωρία του μη κοίλου εκτιμητή ποινικοποιημένης πιθανοφάνειας. Έστω )'. 0 ( 10,..., d 0 ) ' ( 10, 0 Χωρίς βλάβη της γενικότητας, θεωρούμε ότι 0 0. Έστω ότι I ( 0 ) είναι ο πίνακας πληροφορίας του Fisher (Fisher information matrix) και έστω I1 ( 10, 0) η πληροφορία κατά Fisher, γνωρίζοντας ότι 0 0. Αρχικά θα δείξουμε ότι υπάρχει ένας εκτιμητής ποινικοποιημένης πιθανοφάνειας που συγκλίνει στο O p (n 1/ n ) όπου n max p n ( j 0 ) : j 0 0 ( ). Αυτό σημαίνει ότι για τις Hard και SCAD συναρτήσεις ποινής, ο εκτιμητής ποινικοποιημένης πιθανοφάνειας είναι n -συνεπής (root-n consistent) αν n 0. Επιπλέον θα δείξουμε ότι για τον εκτιμητή αυτόν πρέπει να ισχύει ότι ˆ 0 και ότι το ˆ1 είναι ασυμπτωτικά της κανονικής κατανομής με πίνακα συνδιασποράς I1 1, αν n1/ n. Αυτό συνεπάγεται ότι ο εκτιμητής ποινικοποιημένης πιθανοφάνειας συμπεριφέρεται τόσο καλά όσο αν ήταν γνωστό ότι 0 0. Αυτή η προβλεπτική συμπεριφορά του εκτιμητή σχετίζεται άμεσα με το φαινόμενο υπεραποδοτικότητας, (superefficiency phenomenon). Έστω το απλούστερο γραμμικό μοντέλο παλινδρόμησης Σελίδα 0

22 Y 1n, όπου N n (0, I n ). Ένας υπερ-αποδοτικός εκτιμητής για το είναι Y, n cy, Y n 1/4 Y n 1/4. Αν θέσουμε το c 0, τότε το n συμπίπτει με τον Hard εκτιμητή με παράμετρο n n 1/4. Αυτός ο εκτιμητής υπολογίζει ακριβώς την παράμετρο στο 0 χωρίς να την υπολογίζει σε οποιοδήποτε άλλο σημείο. Ας γενικεύσουμε τώρα το αποτέλεσμα, θεωρώντας ότι η ποινικοποίηση πραγματοποιείται σε κάθε συνιστώσα του. Η περίπτωση όπου κάποιες συνιστώσες δεν ποινικοποιούνται, όπως για παράδειγμα η διασπορά στο γραμμικό μοντέλο, δεν παρουσιάζει κάποιο πρόβλημα. Έστω λοιπόν Vi ( X i, Yi ), με i 1,..., n και ότι L ( ) είναι ο λογάριθμος της πιθανοφάνειας των παρατηρήσεων V1,..., Vn. Έστω επίσης ότι d Q( ) L( ) n p n ( j ), j 1 είναι η ποινικοποιημένη συνάρτηση πιθανοφάνειας. Θα αναφέρουμε στη συνέχεια τα σχετικά θεωρήματα και λήμματα των Fan και Li (001) των οποίων οι αποδείξεις υπάρχουν στο παράρτημα, αλλά πρωτίστως θα αναφέρουμε κάποιες απαραίτητες υποθέσεις κανονικότητας (regularity conditions): (A) Οι παρατηρήσεις Vi είναι i.i.d. με συνάρτηση πυκνότητας πιθανότητας f (V, ). Η f (V, ) έχει μια κοινή βάση και το μοντέλο είναι αναγνωρίσιμο (identifiable). Επίσης, η πρώτη και η δεύτερη λογαριθμημένη παράγωγος της f ικανοποιεί τις εξισώσεις log f (V, ) 0, για j 1,..., d E j Σελίδα 1

23 και I jk ( ) E log f (V, ) log f (V, ) E log f (V, ). k j j k (B) Ο πίνακας πληροφορίας του Fisher I ( ) E log f (V, ) log f (V, ) είναι πεπερασμένος και θετικά ορισμένος στο 0. (C) Υπάρχει ένα ανοικτό υποσύνολο του το οποίο περιέχει την πραγματική παράμετρο 0 τέτοιο ώστε για σχεδόν όλα τα V, η συνάρτηση πυκνότητας πιθανότητας παραγώγους τρίτης τάξης f (V, ) επιδέχεται τις f (V, ), για όλα τα. j k l Επίσης, υπάρχουν συναρτήσεις M jkl τέτοιες ώστε 3 log f (V, ) M jkl (V ), για όλα τα, j k l όπου m jkl E 0 [ M jkl ], j, k, l. Σελίδα

24 Θεώρημα Έστω ότι τα V1,..., Vn είναι i.i.d. (independent and identically distributed), κάθε ένα με συνάρτηση πυκνότητας πιθανότητας f (V, ) και ότι ικανοποιούν τις παραπάνω υποθέσεις (Α)-(C). Αν max p n ( j 0 ) : j 0 0 0, τότε υπάρχει ένα τοπικό μέγιστο του Q ( ) τέτοιο ώστε ˆ 0 O p (n 1/ n ), με το n να δίνεται από την ( ). Από το θεώρημα αυτό είναι προφανές ότι με μια σωστή επιλογή του n θα υπάρξει ένας n -συνεπής ποινικοποιημένος εκτιμητής. Θα δείξουμε τώρα ότι ο εκτιμητής αυτός έχει την ιδιότητα της σποραδικότητας ˆ 0. Λήμμα Έστω πάλι ότι τα V1,..., Vn είναι i.i.d., κάθε ένα με συνάρτηση πυκνότητας πιθανότητας f (V, ) και ότι ικανοποιούν τις υποθέσεις (Α)-(C). Έστω ότι lim inf lim inf p n ( ) / n 0 ( ). n Αν n 0 και 0 n n όσο το n, τότε με πιθανότητα που τείνει στο 1, για κάθε δοσμένο 1 που ικανοποιεί 1 10 Op (n 1/ ) και για κάθε σταθερά C, ισχύει ότι 1 1 Q max 1/ Q. 0 Cn Ορίζουμε τώρα ως Σελίδα 3

25 diag p n ( 10,..., ( s 0 ) και b p n ( 10 ) sgn( 10 ),..., p n ( s 0 ) sgn( s 0 ) '. Θεώρημα (Προβλεπτική ιδιότητα) Θεωρούμε ξανά ότι ότι τα V1,..., Vn είναι i.i.d, κάθε ένα με συνάρτηση πυκνότητας πιθανότητας f (V, ) και ότι ικανοποιούν τις υποθέσεις (Α)-(C). Έστω επίσης ότι η συνάρτηση ποινής p n ( ) ικανοποιεί τη συνθήκη ( ). Αν n 0 και n n όσο το n, τότε με πιθανότητα που τείνει στο 1, οι τα παρακάτω: ˆ1 n -συνεπείς εκτιμητές ˆ, του Θεωρήματος , πρέπει να ικανοποιούν ˆ Σποραδικότητα (sparsity): ˆ 0. Ασυμπτωτική κανονικότητα (asymptotic normality): n I1 ( 10 ) ˆ1 10 I1 ( 10 ) 1 b 0, I1 ( 10 ), όπου I1 ( 10 ) I1 ( 10, 0) η πληροφορία κατά Fisher, γνωρίζοντας ότι 0. Συνεπώς, ο ασυμπτωτικός πίνακας συνδιασποράς του ˆ1 είναι 1 I1 ( 10 ) n 1 I1 ( 10 ) I1 ( 10 ) 1, και για τις συναρτήσεις ποινής που αναπτύχθηκαν στην ενότητα 1.3., είναι προσεγγιστικά ίσος με Σελίδα 4

26 1 1 I1 ( 10 ) αν το n 0. n Να σημειωθεί ότι για τις SCAD και Hard συναρτήσεις ποινής, αν n 0 τότε n 0. Οπότε βάσει του Θεωρήματος , όταν n n, οι αντίστοιχοι εκτιμητές ποινικοποιημένης πιθανοφάνειας έχουν την προβλεπτική ιδιότητα (oracle property) και συμπεριφέρονται τόσο καλά όσο και οι εκτιμητές μέγιστης πιθανοφάνειας, όσον αφορά την εκτίμηση του 1, δεδομένου ότι 0. Παρόλα αυτά, για την L1 συνάρτηση ποινής, ισχύει ότι n n. Οπότε, η n -συνέπεια απαιτεί n O p (n 1/ ). Όμως, η προβλεπτική ιδιότητα του Θεωρήματος απαιτεί n n. Οι δύο αυτές συνθήκες για τη LASSO δεν ικανοποιούνται ταυτόχρονα. Συνεπώς, δεν ισχύει η προβλεπτική ιδιότητα για την L1 συνάρτηση ποινής. Αντιθέτως, για την Lq συνάρτηση ποινής, με q 1, η προβλεπτική ιδιότητα ισχύει αν έχουμε επιλέξει το σωστό n. Συνεχίζουμε, κάνοντας μια αναφορά περί των συνθηκών κανονικότητας (A)-(C), όσον αφορά τα γενικευμένα γραμμικά μοντέλα. Με μια canonical link, η κατανομή του Y δεδομένου ότι X x, ανήκει στην canonical εκθετική οικογένεια, με συνάρτηση πυκνότητας πιθανότητας yx ' b( x ' ). f ( y, x, ) c( y ) exp ( ) Προφανώς, η συνθήκη (Α) ικανοποιείται. Ο πίνακας πληροφορίας του Fisher είναι I ( ) E b ( x ' ) xx ' / ( ). Οπότε αν το E b ( x ' ) xx ' είναι πεπερασμένο και θετικά ορισμένο, τότε ισχύει και η συνθήκη (B). Επίσης, αν για όλα τα σε κάποια γειτονιά του 0, ισχύει ότι b(3) ( x ' ) M 0 ( x) για κάποια συνάρτηση M 0 ( x) που ικανοποιεί E 0 M 0 ( x ) X j X k X l j, k, l, τότε ισχύει και η συνθήκη (C). Για γενικότερες συναρτήσεις σύνδεσης, παρόμοιες υποθέσεις πρέπει να ικανοποιούνται ώστε να ισχύουν οι συνθήκες (A)-(C). Τα αποτελέσματα των Θεωρημάτων και Σελίδα 5

27 μπορούν να προκύψουν και για τις περιπτώσεις των ποινικοποιημένων ελαχίστων τετραγώνων ( ) και της ποινικοποιημένης εύρωστης γραμμικής παλινδρόμησης (1.3.3.) Ο προτεινόμενος αλγόριθμος Ο Tibshirani (1996) πρότεινε έναν αλγόριθμο για την επίλυση του προβλήματος ελαχίστων τετραγώνων της LASSO, ενώ ο Fu (1998) πρότεινε έναν shooting αλγόριθμο για την μέθοδο LASSO. Στην ενότητα αυτή θα αναπτύξουμε έναν νέο αλγόριθμο που προτάθηκε από τους Fan και Li (001), με τη βοήθεια του οποίου επιλύονται τα προβλήματα ελαχιστοποίησης ( ), (1.3.3.) και ( ). Αυτό γίνεται μέσω τοπικών τετραγωνικών προσεγγίσεων (local quadratic approximations). Ο πρώτος όρος των ( ), (1.3.3.) και ( ) μπορεί να θεωρηθεί ως μια συνάρτηση απώλειας (loss function) του. Ας την ονομάσουμε l ( ). Οπότε οι ( ), (1.3.3.) και ( ) μπορούν να γραφούν σε μια ενιαία μορφή ως d l ( ) n p ( j ) ( ). j 1 Οι συναρτήσεις ποινής L1, SCAD και Hard, είναι ιδιάζουσες στην αρχή και δεν έχουν συνεχείς παραγώγους δεύτερης τάξης. Παρόλα αυτά, μπορούν να προσεγγισθούν τοπικά από μια τετραγωνική συνάρτηση ως ακολούθως: Υποθέτουμε ότι έχουμε μια αρχική τιμή 0 η οποία είναι πολύ κοντά στην τιμή που ελαχιστοποιεί την ( ). Αν το j 0 είναι πολύ κοντά στο 0, τότε θέτουμε ˆ j 0. Αυτό σημαίνει τη διαγραφή της x j από το τελικό μοντέλο. Ειδάλλως, χρησιμοποιούμε μια τοπική προσέγγιση της συνάρτησης ποινής p ( j ), βάσει μιας τετραγωνικής συνάρτησης, ήτοι p ( j ) p ( j ) sgn( j ) p ( j 0 ) j 0 j, όταν j 0. Με άλλα λόγια, έχουμε ότι p ( j ) p ( j 0 ) 1 p ( j 0 ) j 0 j j0 ( ), για j j 0. Σελίδα 6

28 Το σχήμα της ενότητας 1.3. δείχνει τις συναρτήσεις ποινής L1, SCAD και Hard καθώς και τις προσεγγίσεις τους βάσει της ( ), για δύο διαφορετικές τιμές του j 0. Το μόνο μειονέκτημα της προσέγγισης αυτής, είναι ότι από τη στιγμή που κάποιος συντελεστής θα συρρικνωθεί στο 0, θα παραμείνει σε αυτήν την τιμή. Αν τώρα η l ( ) είναι η L1 συνάρτηση απώλειας, όπως στην (1.3.3.), τότε δεν έχει συνεχείς μερικές παραγώγους δευτέρας τάξης ως προς. Παρόλα αυτά, η ποσότητα ( y x ' ) στην (1.3.3.) μπορεί κατά ανάλογο τρόπο να προσεγγισθεί από την ( y x ' ) / ( y x ' ) ( y x ' ) 0 0, αρκεί η αρχική τιμή 0 του να είναι αρκετά κοντά στην τιμή ελαχιστοποίησης. Όταν κάποια από τα υπόλοιπα y x ' 0 είναι μικρά, η προσέγγιση αυτή δεν είναι καλή. Στην επόμενη ενότητα θα αναλύσουμε κάποιες διαφοροποιήσεις αυτής της προσέγγισης. Υποθέτουμε στη συνέχεια ότι ο λογάριθμος της πιθανοφάνειας έχει συνεχείς μερικές παραγώγους δευτέρας τάξης ως προς. Συνεπώς, είναι εφικτό ο πρώτος όρος της ( ) να προσεγγισθεί από μια τετραγωνική συνάρτηση. Οπότε, το πρόβλημα ελαχιστοποίησης ( ) μπορεί να υποβιβασθεί σε ένα τετραγωνικό πρόβλημα ελαχιστοποίησης (quadratic minimization problem) και ο αλγόριθμος Newton-Raphson μπορεί να χρησιμοποιηθεί. Πράγματι, η ( ) προσεγγίζεται (εκτός από έναν σταθερό όρο) από την ποσότητα 1 1 l ( 0 ) l ( 0 ) '( 0 ) ( 0 ) ' l ( 0 )( 0 ) n ' ( 0 ) ( ), όπου l ( 0 ) l ( 0 ), l ( 0 ) l ( 0 ), ' ( 0 ) diag p ( 10 )/ 10,..., p ( d 0 )/ d 0. Το τετραγωνικό πρόβλημα ελαχιστοποίησης ( ), έχει ως λύση την Σελίδα 7

29 l ( ) n ˆ1 ˆ0 l ( 0 ) n ( 0 ) 1 0 ( 0 ) 0. Όταν επέλθει σύγκλιση του αλγορίθμου, ο εκτιμητής ικανοποιεί τη συνθήκη l ( ˆ0 ) np ( ˆ j 0 ) sgn( ˆ j 0 ) 0, j η οποία αποτελεί την εξίσωση ποινικοποιημένης πιθανοφάνειας, για τα μη μηδενικά στοιχεία του ˆ0. Συγκεκριμένα, για το πρόβλημα ποινικοποιημένων ελαχίστων τετραγώνων ( ), η λύση βρίσκεται με επαναληπτικό (iterative) υπολογισμό της παλινδρόμησης κορυφογραμμής 1 X ' X n ( 0 ) 1 X 'Y. Ομοίως, η λύση της (1.3.3.) προκύπτει με επαναληπτικό υπολογισμό της X 'WX n ( 0 ) X 'WY, όπου W diag ( y1 x1 ' 0 ) / ( y1 x1 ' 0 ),..., ( yn xn ' 0 ) / ( yn xn ' 0 ). Όπως και στην περίπτωση του εκτιμητή μέγιστης πιθανοφάνειας, έχοντας μια καλή αρχική τιμή 0, η μονοβηματική διαδικασία μπορεί να είναι εξίσου αποδοτική όσο και η πλήρως επαναληπτική διαδικασία όπου παίρνουμε τον εκτιμητή ποινικοποιημένης πιθανοφάνειας, κάνοντας χρήση του αλγορίθμου Newton-Raphson. Αν τώρα θεωρήσουμε ως ( k 1) μια καλή αρχική τιμή στο k βήμα, ο επόμενος επαναληπτικός υπολογισμός μπορεί να θεωρηθεί ως μονοβηματική διαδικασία, άρα ο προκύπτων εκτιμητής εξακολουθεί να μπορεί να είναι το ίδιο αποδοτικός όσο αυτός που θα προέκυπτε με την πλήρως επαναληπτική μέθοδο. Συμπερασματικά, ο εκτιμητής που θα προκύψει με τον αλγόριθμο που αναφέραμε κάνοντας λίγες επαναλήψεις, μπορεί να θεωρηθεί ως εκτιμητής ενός βήματος και θα έχει την ίδια απόδοση. Οπότε βάσει αυτού του σκεπτικού, δεν χρειάζεται να επαναλάβουμε τον αλγόριθμο μέχρι να επέλθει σύγκλιση, αρκεί οι αρχικές εκτιμήσεις να είναι καλές. Ως αρχικές εκτιμήσεις τώρα, μπορούν να δοθούν αυτές του πλήρους μοντέλου, αρκεί να μην είναι υπερβολικά παραμετροποιημένες. Σελίδα 8

30 Υπολογισμός του τυπικού σφάλματος Τα τυπικά σφάλματα των εκτιμηθέντων παραμέτρων μπορούν άμεσα να υπολογισθούν, λόγω του ότι γίνεται ταυτόχρονη εκτίμηση παραμέτρων και επιλογή μεταβλητών. Ο sandwich τύπος μπορεί να χρησιμοποιηθεί για την εκτίμηση της συνδιασποράς του ˆ1, η μη εξαφανισμένη συνιστώσα του. Οπότε έχουμε, ˆ ) l ( ˆ ) n cov( ( ˆ1 ) l ( ˆ ) l ( ˆ ) n cov ( ˆ1 ) ( ). Ο τύπος αυτός είναι αρκετά ακριβής και για μέτρια μεγέθη δειγμάτων. Όταν χρησιμοποιείται η L1 συνάρτηση απώλειας στην εύρωστη παλινδρόμηση, πρέπει να πραγματοποιηθούν κάποιες τροποποιήσεις στον αλγόριθμο καθώς επίσης και στον αντίστοιχο sandwich τύπο. Στην περίπτωση όπου ( x) x, τα διαγώνια στοιχεία του W είναι { ri 1}, με ri yi xi ' 0 και i 1,..., n. Οπότε για μια δοθείσα τιμή του 0, όταν κάποια από τα υπόλοιπα {ri } είναι κοντά στο 0, αυτά τα σημεία αποκτούν πολύ βάρος. Για αυτό το λόγο αντικαθίσταται το βάρος με ( n ri 1 ). 1/ Στις εφαρμογές που έκαναν οι Fan και Li, χρησιμοποίησαν ως n το n quantile των απολύτων τιμών των υπολοίπων, { ri }. Οπότε το n άλλαζε σε κάθε επανάληψη Έλεγχος τη σύγκλισης του αλγορίθμου Οι Fan και Li, απέδειξαν με χρήση του προγράμματος MATLAB ότι όντως ο αλγόριθμος που πρότειναν συγκλίνει στη σωστή λύση. Συγκεκριμένα, χρησιμοποίησαν ένα διάνυσμα διάστασης 100, αποτελούμενο από 50 μηδενικά και 50 μη μηδενικά στοιχεία που και δημιουργήθηκαν από την κατανομή N (0,5 ). Επίσης χρησιμοποίησαν έναν ορθοκανονικό πίνακα σχεδιασμού, για το λόγο ότι τα ποινικοποιημένα ελάχιστα τετράγωνα ( PLS ) έχουν τότε μαθηματική λύση κλειστής μορφής, οπότε και ήταν εφικτή η σύγκρισή της με αυτήν της αλγοριθμικής μεθόδου τους. Το διάνυσμα Σελίδα 9

31 των αποκρίσεων Y δημιουργήθηκε βάσει του γραμμικού μοντέλου Y X. Τα αποτελέσματα ήταν τα εξής: Το MATLAB χρειάστηκε 0.7, 0.39 και 0.16 sec για να επέλθει σύγκλιση όσον αφορά τα PLS με τη SCAD, L1 και Hard συνάρτηση ποινής αντίστοιχα. Επίσης, ο αριθμός των επαναλήψεων ήταν 30, 30 και 5 αντίστοιχα. Να σημειωθεί, ότι στη δέκατη επανάληψη, ο PLS εκτιμητής ήταν ήδη αρκετά κοντά στη σωστή τιμή Αριθμητικές συγκρίσεις Στην ενότητα αυτή, θα συγκρίνουμε την απόδοση των προτεινόμενων μεθόδων με τις ήδη υπάρχουσες και θα ελέγξουμε την ακρίβεια της μεθόδου εύρεσης του τυπικού σφάλματος. Επίσης θα αναφέρουμε και κάποιες μελέτες προσομοίωσης (simulation studies) που έκαναν οι Fan και Li χρησιμοποιώντας τις ποινικοποιημένες μεθόδους Σφάλμα πρόβλεψης και σφάλμα μοντέλου Το σφάλμα πρόβλεψης (prediction error) ορίζεται ως το μέσο σφάλμα στην πρόβλεψη του Y, δεδομένου νέου x (που προφανώς δεν χρησιμοποιήθηκε στην κατασκευή της εξίσωσης πρόβλεψης). Υπάρχουν δύο περιπτώσεις, το X να είναι τυχαίο (random) και το X να είναι ελεγχόμενο (controlled). Στην πρώτη περίπτωση, τόσο το Y όσο και το x είναι τυχαία επιλεγμένα. Στην δεύτερη περίπτωση, ο πίνακας σχεδιασμού επιλέγεται από τους πειραματιστές και μόνο το Y είναι τυχαίο. Στο εξής θα θεωρούμε ότι το X είναι τυχαίο. Σε αυτήν την περίπτωση, τα δεδομένα ( xi, Yi ) θεωρούνται τυχαίο δείγμα από κάποια κατανομή. Τότε, αν ˆ ( x) είναι η πρόβλεψη βάσει των δεδομένων που έχουμε στην κατοχή μας, το σφάλμα πρόβλεψης ορίζεται ως PE ( ˆ ) E{Y ˆ ( x)}. Ο παραπάνω τύπος μπορεί να αναλυθεί ως PE ( ˆ ) E{Y E (Y x)} E{E (Y x) ˆ ( x)}. Σελίδα 30

32 Ο πρώτος όρος είναι το σφάλμα πρόβλεψης λόγω του θορύβου στα δεδομένα και ο δεύτερος λόγω της έλλειψης προσαρμογής (lack of fit) του μοντέλου. Αυτός ο δεύτερος όρος ονομάζεται σφάλμα μοντέλου (model error) και συμβολίζεται ως ME ( ˆ ). Να σημειώσουμε ότι αν Y x ' e, με E (e x) 0, τότε ME ( ˆ ) ( ˆ ) ' E ( xx ')( ˆ ) Επιλογή των οριακών παραμέτρων Οι Fan και Li, προκειμένου να εκτιμήσουν τη ρυθμιστική (tuning) παράμετρο, όπου (, ) για τη SCAD συνάρτηση ποινής και τη για τη LASSO και Hard, χρησιμοποίησαν δύο μεθόδους. Την πενταπλή (fivefold) διασταυρωμένη επικύρωση και τη γενικευμένη διασταυρωμένη επικύρωση. Θα αναπτύξουμε τις δύο αυτές διαδικασίες για την περίπτωση των γραμμικών μοντέλων παλινδρόμησης. Η επέκταση των διαδικασιών αυτών σε εύρωστα γραμμικά μοντέλα παλινδρόμησης καθώς και γραμμικά μοντέλα βασισμένα στην πιθανοφάνεια, δεν εμπεριέχει ιδιαίτερες δυσκολίες. Στη μέθοδο της πενταπλής διασταυρωμένης επικύρωσης, συμβολίζουμε ως T το σύνολο των δεδομένων και ως T T και T το σύνολο εκπαίδευσης (training set) και το σύνολο ελέγχου (test set) αντίστοιχα, με 1,...,5. Για κάθε και, βρίσκουμε τον εκτιμητή ˆ ( ) ( ) του, χρησιμοποιώντας το σύνολο εκπαίδευσης T T. Εν συνεχεία, εφαρμόζουμε το κριτήριο της διασταυρωμένης επικύρωσης 5 CV ( ) yk xk ' ˆ ( ) ( ) 1 ( yk, xk ) T και βρίσκουμε το ˆ που ελαχιστοποιεί το CV ( ). Στη μέθοδο της γενικευμένης διασταυρωμένης επικύρωσης, μετατρέπουμε τη λύση ως 1 ( ) X ' X n ( 0 ) 1 X 'Y. Οπότε η προσαρμοσμένη τιμή Yˆ του Y είναι X X ' X n ( 0 ) 1 X ' Yˆ Σελίδα 31

33 και μπορούμε να θεωρήσουμε ως πίνακα προβολής τον 1 PX { ˆ ( )} X X ' X n ( ˆ ) X '. Ορίζοντας τώρα το πλήθος των σημαντικών παραμέτρων στην προσαρμογή του ποινικοποιημένου μοντέλου ελαχίστων τετραγώνων ως e( ) tr[ PX { ˆ ( )}], το κριτήριο της γενικευμένης διασταυρωμένης επικύρωσης είναι 1 Y X ( ) GCV ( ) n {1 e( ) / n} και ˆ arg min{gcv ( )} Προσομοιώσεις Οι Fan και Li, στα ακόλουθα παραδείγματα προσομοιώσεων, σύγκριναν τις προτεινόμενες μεθόδους επιλογής μεταβλητών με τις ακόλουθες μεθόδους: Α) Ελάχιστα τετράγωνα. Β) Παλινδρόμηση κορυφογραμμής. Γ) Επιλογή καλύτερου υποσυνόλου. Δ) Garrote. Οι προσομοιώσεις έγιναν με χρήση του MATLAB. Χρησιμοποιήθηκε επίσης η γενικευμένη διασταυρωμένη επικύρωση για την εκτίμηση των οριακών παραμέτρων. Σελίδα 3

34 Προσομοίωση 1-Γραμμική παλινδρόμηση: Δημιουργήθηκαν 100 σύνολα δεδομένων, αποτελούμενα από n παρατηρήσεις, βάσει του μοντέλου Y x ', όπου τα x και είναι της Τυποποιημένης Κανονικής κατανομής και (3,1.5, 0, 0,, 0, 0, 0) '. Η συσχέτιση μεταξύ των xi και x j είναι i j με 0.5. Αρχικά, έγινε η επιλογή του n 40 και του 3. Έπειτα, μειώθηκε το σε 1 και το n αυξήθηκε στις 60 παρατηρήσεις. Το σφάλμα του μοντέλου συγκρίθηκε με αυτό του εκτιμητή ελαχίστων τετραγώνων. Η διάμεσος των σχετικών σφαλμάτων του μοντέλου (Median of Relative Model Errors MRME ) από 100 προσομοιωμένα σύνολα δεδομένων, υπάρχει στον πίνακα Επίσης, στον ίδιο πίνακα φαίνεται και ο μέσος αριθμός των μηδενικών συντελεστών, με τη στήλη «correct» να αντιστοιχεί στο μέσο αριθμό των σωστά εκτιμηθέντων ως μηδενικοί συντελεστών, ενώ η στήλη «incorrect» αντιστοιχεί σε αυτούς που λανθασμένα εκτιμήθηκαν ως μηδενικοί. Πίνακας : Αποτελέσματα προσομοιώσεων για το γραμμικό μοντέλο 1 παλινδρόμησης. Για τη SCAD το α επιλέχθηκε βάσει της GCV και για τη SCAD έχει την τιμή 3.7. Σελίδα 33

35 Από τον παραπάνω πίνακα, παρατηρούμε ότι όταν ο θόρυβος είναι υψηλός και το μέγεθος του δείγματος μικρό, η LASSO έχει την καλύτερη απόδοση. Επίσης μειώνει σημαντικά τόσο το σφάλμα του μοντέλου όσο και την πολυπλοκότητά του. Αυτό ισχύει και για τις υπόλοιπες μεθόδους επιλογής μεταβλητών, ενώ αντιθέτως, η παλινδρόμηση κορυφογραμμής μειώνει μόνο το σφάλμα του μοντέλου. Όταν όμως μειώθηκε ο θόρυβος, η SCAD είναι αποδοτικότερη από τη LASSO και τη Hard. Η παλινδρόμηση κορυφογραμμής έχει κακή απόδοση ενώ η μέθοδος επιλογής καλύτερου υποσυνόλου έχει παρόμοια απόδοση με τη SCAD. Επίσης, η garrote έχει γενικά καλή απόδοση. Να σημειώσουμε και ότι η SCAD είχε πολύ καλά αποτελέσματα με επιλογή του 3.7 (βλ. αποτελέσματα για SCAD1 και SCAD ), η οποία τιμή χρησιμοποιήθηκε και στις επόμενες προσομοιώσεις. Τελειώνοντας, συμπεραίνουμε ότι αναμένεται η SCAD να έχει τόσο καλά αποτελέσματα όσο αυτά του oracle εκτιμητή (ο οποίος επίσης χρησιμοποιήθηκε ώστε να συγκριθεί με τις προτεινόμενες μεθόδους), καθώς το μέγεθος του δείγματος αυξάνει. Όσον αφορά τώρα την ακρίβεια της μεθόδου υπολογισμού του τυπικού σφάλματος ( ), έχουμε τα εξής: Η διάμεσος των απολύτων τιμών της απόκλισης των 100 εκτιμηθέντων συντελεστών των 100 συνόλων δεδομένων, διαιρεμένη με , συμβολιζόμενη ως SD, βρίσκεται στον πίνακα και μπορεί να θεωρηθεί ως το πραγματικό τυπικό σφάλμα. Η διάμεσος των 100 αυτών εκτιμηθέντων SDs, συμβολίζεται με SDm και η διάμεσος των απολύτων τιμών του σφάλματος της απόκλισης των 100 εκτιμημένων τυπικών σφαλμάτων διαιρεμένη με , συμβολίζεται με SDmad αποτελούν μια αποτίμηση της συνολικής απόδοσης της ( ). Ο πίνακας περιέχει τα αποτελέσματα για τους μη μηδενικούς συντελεστές, στην περίπτωση όπου n 60. Στην περίπτωση όπου n 40, είχαμε παρόμοια αποτελέσματα. Βάσει του πίνακα αυτού, συμπεραίνουμε ότι ο sandwich τύπος είναι αρκετά αποτελεσματικός. Πίνακας : Τυπικές αποκλίσεις των εκτιμητών στο γραμμικό μοντέλο παλινδρόμησης (n=60). Σελίδα 34

36 Προσομοίωση -Εύρωστη γραμμική παλινδρόμηση: Δημιουργήθηκαν 100 σύνολα δεδομένων αποτελούμενα από 60 παρατηρήσεις, βάσει του μοντέλου Y x', με τα ίδια και x όπως και στην προηγούμενη προσομοίωση. Το είναι της Τυποποιημένης Κανονικής κατανομής με ένα ποσοστό 10% άτυπων σημείων (outliers) της κατανομής Cauchy. Τα αποτελέσματα βρίσκονται στον πίνακα Βλέπουμε ότι την καλύτερη απόδοση την έχει η SCAD. Επίσης, οι αληθείς και οι εκτιμώμενες βάσει της ( ) τυπικές αποκλίσεις των εκτιμητών βρίσκονται στον πίνακα , όπου και καταδεικνύεται η πολύ καλή απόδοση της μεθόδου. Πίνακας : Αποτελέσματα προσομοίωσης για το εύρωστο γραμμικό μοντέλο παλινδρόμησης. Πίνακας : Τυπικές αποκλίσεις των εκτιμητών για το εύρωστο γραμμικό μοντέλο παλινδρόμησης. Σελίδα 35

37 Προσομοίωση 3-Λογιστική παλινδρόμηση: Δημιουργήθηκαν 100 σύνολα δεδομένων αποτελούμενα από 00 παρατηρήσεις, βάσει του μοντέλου Y Bernoulli{ p ( x ' )}, όπου p(u ) exp(u ), 1 exp(u ) με τις πρώτες 6 συνιστώσες των και x να είναι οι ίδιες με αυτές της πρώτης προσομοίωσης. Οι δύο τελευταίες συνιστώσες του x ήταν i.i.d. από την Bernοulli κατανομή με πιθανότητα επιτυχίας 0.5. Επίσης, όλες οι μεταβλητές ήταν κανονικοποιημένες. Τα σφάλματα του μοντέλου υπολογίσθηκαν μέσω 1000 Monte Carlo προσομοιώσεων. Τα αποτελέσματα βρίσκονται στους πίνακες και Η εκτιμήτρια ποινικοποιημένης πιθανοφάνειας με χρήση της SCAD είχε καλύτερη απόδοση από αυτήν της LASSO και της Hard. Επιπλέον, είχε παρόμοια απόδοση συγκριτικά με τον oracle εκτιμητή όσον αφορά το MRME και την ακρίβεια των εκτιμώμενων τυπικών σφαλμάτων. Πίνακας : Αποτελέσματα προσομοίωσης για τη λογιστική παλινδρόμηση. Πίνακας : Τυπικές αποκλίσεις των εκτιμητών για τη λογιστική παλινδρόμηση. Σελίδα 36

38 Παρατηρούμε ότι οι εκτιμώμενες τυπικές αποκλίσεις για τον L1 εκτιμητή ποινικοποιημένης πιθανοφάνειας (LASSO) είναι μικρότερες από αυτές της SCAD, αλλά με το συνολικό MRME μεγαλύτερο. Αυτό σημαίνει ότι η μεροληψία των εκτιμητών της LASSO είναι μεγάλη. Κάτι που ισχύει και για όλες τις προαναφερθείσες προσομοιώσεις Συμπεράσματα Οι μέθοδοι που πρότειναν οι Fan και Li, αποδεδειγμένα έχουν πολύ καλή απόδοση όσον αφορά την επιλογή σημαντικών μεταβλητών. Ο sandwich τύπος που κατασκεύασαν για την εκτίμηση των τυπικών σφαλμάτων είναι επίσης αρκετά αποτελεσματικός και ο αλγόριθμος υλοποίησης της όλης μεθόδου υποστηρίζεται από στατιστική θεωρία, με αποτέλεσμα οι εκτιμητές που κατασκευάζονται να έχουν καλές στατιστικές ιδιότητες. Σε σύγκριση με τη μέθοδο επιλογής καλύτερου υποσυνόλου, η οποία είναι αρκετά χρονοβόρα, οι νέες μέθοδοι δίνουν αποτελέσματα αρκετά πιο γρήγορα. Το μεγάλο πλεονέκτημά τους είναι η ταυτόχρονη επιλογή σημαντικών μεταβλητών και η εκτίμηση των συντελεστών, κάτι που γίνεται βελτιστοποιώντας μια ποινικοποιημένη πιθανοφάνεια. Αυτό έχει ως αποτέλεσμα και την ακριβής εκτίμηση των τυπικών σφαλμάτων. Επίσης, απέδειξαν ότι η συνάρτηση ποινής SCAD, έχει την καλύτερη απόδοση στην επιλογή σημαντικών μεταβλητών, χωρίς να δημιουργείται μεροληψία, εν αντιθέσει με τη LASSO μέθοδο του Tibshirani (1996) όπου χρησιμοποιείται η L1 συνάρτηση ποινής. Σελίδα 37

39 ΚΕΦΑΛΑΙΟ Ποινικοποιημένη παλινδρόμηση με ποινή βασισμένη στη συσχέτιση των μεταβλητών.1 Εισαγωγή Επικεντρωνόμαστε στο σύνηθες γραμμικό μοντέλο παλινδρόμησης y 0 xt β όπου xt x1,..., x p είναι ένα διάνυσμα μεταβλητών και είναι ένα διάνυσμα θορύβου με E 0. Ειδικά για υψηλών διαστάσεων διάνυσμα μεταβλητών x, ο εκτιμητής των συνήθων ελαχίστων τετραγώνων μπορεί να μην είναι μοναδικός. Επιπλέον, δεν είναι η πρώτη επιλογή όταν σκοπός μας είναι η πρόβλεψη. Εναλλακτικοί εκτιμητές όπως της παλινδρόμησης κορυφογραμμής, ridge regression estimator (Hoerl & Kennard, 1970), είναι καλύτεροι και είναι μοναδικοί για μία κατάλληλα επιλεγμένη μειούμενη παράμετρο. Την τελευταία δεκαετία έχουν προταθεί αρκετοί εναλλακτικοί εκτιμητές που μειώνουν τον αριθμό των παραμέτρων στο τελικό μοντέλο, ειδικά η LASSO (Tibshirani, 1996) που επιβάλλει μια L1 ποινή στους συντελεστές παλινδρόμησης. Χρησιμοποιώντας μια μη-κυρτή ποινή, κάνει αυτόματα επιλογή μεταβλητών σε αντίθεση με τη παλινδρόμηση κορυφογραμμής που μόνο μειώνει τους εκτιμητές κοντά στο μηδέν. Πιο πρόσφατα, προτάθηκε η μέθοδος elastic net, Enet (Zou & Hastie, 005), ως μια εναλλακτική διαδικασία που αντιμετωπίζει τις ελλείψεις της LASSO και της παλινδρόμησης κορυφογραμμής, συνδυάζοντας τις L1 και L ποινές. Ένα κίνητρο των Zou & Hastie ήταν ότι η μέθοδός τους έχει την ιδιότητα να περιλαμβάνει στο τελικό μοντέλο τις ομάδες των μεταβλητών που είναι ισχυρά συσχετισμένες. Όταν οι μεταβλητές είναι ισχυρά συσχετισμένες, η LASSO επιλέγει μόνο μία μεταβλητή από το γκρουπ, ενώ η Enet επιλέγει όλη την ομάδα. Σε αυτή την εργασία μια εναλλακτική διαδικασία ποινικοποίησης προτείνεται που σκοπεύει στην επιλογή των ομάδων των συσχετισμένων μεταβλητών. Στην απλούστερη έκδοση βασίζεται σε μία Σελίδα 38

40 ποινή που κατηγορηματικά χρησιμοποιεί τη συσχέτιση μεταξύ των μεταβλητών σαν βάρη. Στην επεκταμένη έκδοση χρησιμοποιούνται ενισχυτικές τεχνικές για τις ομάδες των μεταβλητών.. Ποινικοποιημένη παλινδρόμηση συνδεδεμένη με τη συσχέτιση Έστω τα δεδομένα yi, xi, i 1,..., n, με τα yi να δηλώνουν την απόκριση και τα xti xi1,..., xip να δηλώνουν την επεξηγηματική μεταβλητή. Για λόγους απλοποίησης θεωρούμε την απόκριση και τις μεταβλητές κεντραρισμένες. Οι ποινικοποιημένοι εκτιμητές του παραμετρικού διανύσματος βt 1,..., p μπορούν να αποκομιστούν από την ελαχιστοποίηση των ποινικοποιημένων ελαχίστων τετραγώνων n PLS yi xti β P (β ) (1) i 1 όπου P(β) είναι ένας συγκεκριμένος όρος ποινής. Οι κοινές συναρτήσεις ποινής είναι τύπου bridge (Frank & Friedman, 1993, Fu, 1998), δηλαδή p P(β) j, 0, j 1 όπου είναι μία ρυθμιστική παράμετρος. Για λαμβάνουμε τη παλινδρόμηση κορυφογραμμής, για 1 τη LASSO. Οι συναρτήσεις με 1 έχουν ονομαστεί soft περιοριστικές ( Donoho & Johnstone, 1995, Klinger, 1998). Η πιο πρόσφατα (το paper γράφτηκε το 006) προτεινόμενη, Enet, βασίζεται στο συνδυασμό των ποινών που χρησιμοποιούν η LASSO και η παλινδρόμηση κορυφογραμμής, χρησιμοποιώντας έναν όρο ποινής με δύο ρυθμιστικές παραμέτρους 1,, που δίνεται από τον τύπο p p j 1 j 1 P β 1 j j. Η μέθοδος κληρονομεί ιδιότητες της LASSO πραγματοποιώντας επιλογή μεταβλητών, αλλά σε καταστάσεις όπου η παλινδρόμηση κορυφογραμμής (rigde regression) λειτουργεί καλύτερα ( n p και υψηλή συσχέτιση μεταξύ των μεταβλητών), βασίζεται στον δικό της όρο ποινής. Η Enet τείνει να συμπεριλάβει όλες τις υψηλά συσχετισμένες μεταβλητές, παρά να επιλέξει κάποιες από αυτές. Σελίδα 39

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

Στατιστική. Εκτιμητική

Στατιστική. Εκτιμητική Στατιστική Εκτιμητική Χατζόπουλος Σταύρος 28/2/2018 και 01 /03/2018 Εισαγωγή Το αντικείμενο της Στατιστικής είναι η εξαγωγή συμπερασμάτων που αφορούν τον πληθυσμό ή το φαινόμενο που μελετάμε, με τη βοήθεια

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΓΙΑ ΕΠΙΛΕΓΜΕΝΟ ΕΚΘΕΤΙΚΟ ΠΛΗΘΥΣΜΟ ΑΠΟ k ΠΛΗΘΥΣΜΟΥΣ

ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΓΙΑ ΕΠΙΛΕΓΜΕΝΟ ΕΚΘΕΤΙΚΟ ΠΛΗΘΥΣΜΟ ΑΠΟ k ΠΛΗΘΥΣΜΟΥΣ ΚΩΝΣΤΑΝΤΙΝΟΣ Γ. ΑΓΓΕΛΟΥ ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΓΙΑ ΕΠΙΛΕΓΜΕΝΟ ΕΚΘΕΤΙΚΟ ΠΛΗΘΥΣΜΟ ΑΠΟ k ΠΛΗΘΥΣΜΟΥΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΑΤΡΙΒΗ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΑ

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ ΚΕΦΑΛΑΙΟ ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ Ως γνωστό δείγμα είναι ένα σύνολο παρατηρήσεων από ένα πληθυσμό. Αν ο πληθυσμός αυτός θεωρηθεί μονοδιάστατος τότε μπορεί να εκφρασθεί με τη συνάρτηση

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα

Διαβάστε περισσότερα

Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE)

Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE) Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE) Εστω τ.δ. X={x, x,, x } με κατανομή με σ.π.π. f(x;θ). Η από-κοινού σ.π.π. των δειγμάτων είναι η συνάρτηση L f x, x,, x; f x i ; και

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Παραμέτρων

Διαβάστε περισσότερα

(p 1) (p m) (m 1) (p 1)

(p 1) (p m) (m 1) (p 1) ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ Σκοπός της παραγοντικής ανάλυσης είναι να περιγράψει την συνδιασπορά μεταξύ των μεταβλητών με την βοήθεια τυχαίων άγνωστων ποσοτήτων που ονομάζονται παράγοντες. Το μοντέλο είναι το

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III 0 TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III Νοέμβριος Eστω,,, τυχαίο δείγμα από κατανομή f( x; ), όπου συμβολίζει άγνωστη παράμετρο (a) Να ορισθεί η έννοια του επαρκούς στατιστικού

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Παρεμβολή και Παρεκβολή Εισαγωγή Ορισμός 6.1 Αν έχουμε στη διάθεσή μας τιμές μιας συνάρτησης

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

X = = 81 9 = 9

X = = 81 9 = 9 Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 9 10 Γραμμική παλινδρόμηση (Linear regression) Μπεϋζιανή εκτίμηση για την κανονική κατανομή Γνωστή μέση τιμή μ, άγνωστη διασπορά σ 2. Ακρίβεια λ=1/σ 2 : conjugate

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics) Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics) Τυχαίο δείγμα και στατιστική συνάρτηση Χ={x 1, x,, x n } τυχαίο δείγμα μεγέθους n προερχόμενο από μια (παραμετρική) κατανομή με σ.π.π. f(x;θ).

Διαβάστε περισσότερα

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή Πιθανότητες και Αρχές Στατιστικής (10η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2017-2018 Σωτήρης Νικολετσέας, καθηγητής 1 / 48 Σημερινό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.outras@e.aegea.gr Τηλ: 7035468 Μέθοδος Υπολογισμού

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 4 ου κεφαλαίου Ελεγχοσυναρτήσεις Γενικευμένου Λόγου Πιθανοφανειών Σταύρος Χατζόπουλος 27/03/2017, 03/04/2017, 24/04/2017 1 Εισαγωγή Έστω το τ.δ. X,,, από την κατανομή

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2 HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)

Διαβάστε περισσότερα

HMY 799 1: Αναγνώριση Συστημάτων

HMY 799 1: Αναγνώριση Συστημάτων HMY 799 : Αναγνώριση Συστημάτων Διάλεξη Γραμμική παλινδρόμηση (Linear regression) Εμπειρική συνάρτηση μεταφοράς Ομαλοποίηση (smoothing) Y ( ) ( ) ω G ω = U ( ω) ω +Δ ω γ ω Δω = ω +Δω W ( ξ ω ) U ( ξ) G(

Διαβάστε περισσότερα

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης). Μέθοδος Euler 3. Μέθοδοι

Διαβάστε περισσότερα

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης Μάθημα 5 ο Δρ. Ανέστης Γ. Χατζημιχαηλίδης Τμήμα Μηχανικών Πληροφορικής Τ.Ε. ΤΕΙ Ανατολικής Μακεδονίας και Θράκης 2016-2017 Διευρυμένη Υπολογιστική Νοημοσύνη (ΥΝ) Επεκτάσεις της Κλασικής ΥΝ. Μεθοδολογίες

Διαβάστε περισσότερα

E[ (x- ) ]= trace[(x-x)(x- ) ]

E[ (x- ) ]= trace[(x-x)(x- ) ] 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX Θεμελιώδης αλγόριθμος επίλυσης προβλημάτων Γραμμικού Προγραμματισμού που κάνει χρήση της θεωρίας της Γραμμικής Άλγεβρας Προτάθηκε από το Dantzig (1947) και πλέον

Διαβάστε περισσότερα

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ 10ο Μάθημα Πιθανότητες Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2016-2017 Σωτήρης Νικολετσέας, αναπληρωτής καθηγητής 10ο Μάθημα

Διαβάστε περισσότερα

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Γραμμικός Προγραμματισμός Μέθοδος Simplex ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραμμικός Προγραμματισμός Μέθοδος Simplex Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Πρότυπη Μορφή ΓΠ 2. Πινακοποίηση

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Εκτιμητική Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

HMY 799 1: Αναγνώριση Συστημάτων

HMY 799 1: Αναγνώριση Συστημάτων HMY 799 : Αναγνώριση Συστημάτων Διάλεξη Στοχαστικές Τυχαίες Μεταβλητές/ Στοχαστικά Σήματα Πειραματικά δεδομένα >Επιλογή τύπου μοντέλου >Επιλογή κριτηρίου >Υπολογισμός >Επικύρωση Προσαρμογή καμπύλης (Curve

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 6 Κατανομές πιθανότητας και εκτίμηση παραμέτρων Κατανομές πιθανότητας και εκτίμηση παραμέτρων κανονικές τυχαίες μεταβλητές Εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Τυχαία Διανύσματα και Ανεξαρτησία

Τυχαία Διανύσματα και Ανεξαρτησία Τυχαία Διανύσματα και Ανεξαρτησία Θα γενικεύσουμε την έννοια της τυχαίας μεταβλητής από συνάρτηση στο R σε συνάρτηση στο R n. Ακολούθως, θα επεκτείνουμε τις έννοιες με τις οποίες ασχοληθήκαμε μέχρι τώρα

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής

Κεφάλαιο 1. Εισαγωγή: Βασικά Στοιχεία Θεωρίας Πιθανοτήτων και Εκτιμητικής Κεφάλαιο 1. Εισαγωγή: Βασικά και Εκτιμητικής Ορισμός 1.1. Όλα τα δυνατά αποτελέσματα ενός πειράματος αποτελούν το δειγματοχώρο (sample space) που συμβολίζεται με. Κάθε δυνατό αποτέλεσμα του πειράματος,

Διαβάστε περισσότερα

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών 7. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης) 7. Μέθοδος Euler 7.3

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n) ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) Θέμα ο (Παρ..3.4, Παρ..4.3, Παρ..4.8.) Εάν = ( ) τυχαίο δείγμα από την ομοιόμορφη ( 0, ) X X,, X. Δείξτε ότι η στατιστική συνάρτηση T = X = το δειγματικό

Διαβάστε περισσότερα

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας. Περιεχόμενα της Ενότητας Στατιστική Ι Ενότητα 5: Συνεχείς Κατανομές Πιθανότητας Δρ. Χρήστος Εμμανουηλίδης Επίκουρος Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς

Διαβάστε περισσότερα

ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX

ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX ΚΕΦΑΛΑΙΟ 3 ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX 3.1 Εισαγωγή Ο αλγόριθμος Simplex θεωρείται πλέον ως ένας κλασικός αλγόριθμος για την επίλυση γραμμικών προβλημάτων. Η πρακτική αποτελεσματικότητά του έχει

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Διαχωριστικές συναρτήσεις Ταξινόμηση κανονικών

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Τοπογραφικά Δίκτυα και Υπολογισμοί 5 ο εξάμηνο, Ακαδημαϊκό Έτος 2016-2017 Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων Τοπογράφων Μηχανικών

Διαβάστε περισσότερα

Y Y ... y nx1. nx1

Y Y ... y nx1. nx1 6 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ ΤΗ ΧΡΗΣΗ ΠΙΚΑΚΩΝ Η χρησιμοποίηση και ο συμβολισμός πινάκων απλοποιεί σημαντικά τα αποτελέσματα της γραμμικής παλινδρόμησης, ιδίως στην περίπτωση της πολλαπλής παλινδρόμησης Γενικά,

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Εκτιμητική Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ... ΚΕΦΑΛΑΙΟ 0 Ένα Πρόβλημα Δεδομένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Απλή Γραμμική Παλινδρόμηση Μωυσιάδης Χρόνης 6 o Εξάμηνο Μαθηματικών Έχει σχέση το με το ; Ειδικότερα

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Πανεπιστήμιο Πατρών Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Διάλεξη 11

Πανεπιστήμιο Πατρών Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Διάλεξη 11 Πανεπιστήμιο Πατρών Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Τομέας Συστημάτων και Αυτομάτου Ελέγχου ΠΡΟΣΑΡΜΟΣΤΙΚΟΣ ΕΛΕΓΧΟΣ Διάλεξη 11 Πάτρα 2008 Προσαρμοστικός LQ έλεγχος για μη ελαχίστης

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Μαθηματικά Και Στατιστική Στη Βιολογία

Μαθηματικά Και Στατιστική Στη Βιολογία ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Μαθηματικά Και Στατιστική Στη Βιολογία Ενότητα 5 : Εκτιμήσεις Ι. Αντωνίου, Χ. Μπράτσας Τμήμα Μαθηματικών Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 7 8 Μπεϋζιανή εκτίμηση συνέχεια Μη παραμετρικές μέθοδοι εκτίμησης πυκνότητας Εκτίμηση ML για την κανονική κατανομή Μπεϋζιανή εκτίμηση για την κανονική κατανομή Γνωστή

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ . ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ. Μέγιστα και Ελάχιστα Συναρτήσεων Χωρίς Περιορισμούς Συναρτήσεις μιας Μεταβλητής Εστω f ( x) είναι συνάρτηση μιας μόνο μεταβλητής. Εστω επίσης ότι x είναι ένα σημείο στο πεδίο ορισμού

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής Θεωρία Παιγνίων και Αποφάσεων Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος Ε. Μαρκάκης Επικ. Καθηγητής Περίληψη Παίγνια μηδενικού αθροίσματος PessimisIc play Αμιγείς max-min και

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Τοπογραφικά Δίκτυα και Υπολογισμοί 5 ο εξάμηνο, Ακαδημαϊκό Έτος 2017-2018 Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων και Τοπογράφων

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Bayesian decision Minimum misclassificaxon rate decision: διαλέγουμε την κατηγορία Ck για

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Πεπερασμένες και Διαιρεμένες Διαφορές Εισαγωγή Θα εισάγουμε την έννοια των διαφορών με ένα

Διαβάστε περισσότερα