ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ Ασφαλιστικής Επιστήμης του Πανεπιστημίου Πειραιώς δεν υποδηλώνει αποδοχή των γνωμών του συγγραφέα.

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ Ασφαλιστικής Επιστήμης του Πανεπιστημίου Πειραιώς δεν υποδηλώνει αποδοχή των γνωμών του συγγραφέα."

Transcript

1 Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Π Ε Ι Ρ Α Ι Ω Σ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚ ΗΣ ΕΠΙΣΤΗΜΗΣ ΜΕΤΑΠΤΥΧΙΑΚ Ο ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚ Η Μικτά Μοντέλα και Παλινδρόμηση Ποσοστιαίων Σημείων Ηλίας Κ. Γκανέτσος Διπλωματική Εργασία που υποβλήθηκε στο Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης του Πανεπιστημίου Πειραιώς ως μέρος των απαιτήσεων για την απόκτηση του Μεταπτυχιακού Διπλώματος Ειδίκευσης στην Εφαρμοσμένη Στατιστική Πειραιάς Μάιος 2007

2 Η παρούσα Διπλωματική Εργασία εγκρίθηκε ομόφωνα από την Τριμελή Εξεταστική Επιτροπή που ορίσθηκε από τη ΓΣΕΣ του Τμήματος Στατιστικής και Ασφαλιστικής Επιστήμης του Πανεπιστημίου Πειραιώς στην υπ αριθμ... συνεδρίασή του σύμφωνα με τον Εσωτερικό Κανονισμό Λειτουργίας του Προγράμματος Μεταπτυχιακών Σπουδών στην Εφαρμοσμένη Στατιστική Τα μέλη της Επιτροπής ήταν: -.. (Επιβλέπων) Η έγκριση της Διπλωματική Εργασίας από το Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης του Πανεπιστημίου Πειραιώς δεν υποδηλώνει αποδοχή των γνωμών του συγγραφέα.

3 U N I V E R S I T Y O F P I R A E U S DEPARTMENT OF STATISTICS AND INSURANCE SCIENCE POSTGRADUATE PROGRAM IN APPLIED STATISTICS Mxed Models and Quantle Regresson By Ilas K. Gkanetsos MSc Dssertaton submtted to the Department of Statstcs and Insurance Scence of the Unversty of Praeus n partal fulflment of the requrements for the degree of Master of Scence n Appled Statstcs Praeus, Greece May 2007

4 v

5 v Στον Αποστόλη

6 v

7 Ευχαριστίες Θα ήθελα να ευχαριστήσω θερμά όλους εκείνους που με τον τρόπο τους ο καθένας με βοήθησαν να ολοκληρώσω την παρούσα διπλωματική εργασία, η οποία αποτελεί μέρος των σπουδών μου για την απόκτηση του Μεταπτυχιακού Διπλώματος Εφαρμοσμένης Στατιστικής. Τις μεγαλύτερες ευχαριστίες οφείλω στον Λέκτορα του τμήματος Στατιστικής και Ασφαλιστικής Επιστήμης, κ. Γεώργιο Πιτσέλη, που με τη διαρκή του στήριξη και καθοδήγηση συνέβαλε στο να ολοκληρωθεί επιτυχώς η συγγραφή της εργασίας. Επίσης θα ήθελα να ευχαριστήσω την Επίκουρη Καθηγήτρια κα Μαρία Κατέρη και τον Επίκουρο Καθηγητή κ. Κωνσταντίνο Πολίτη που συμμετείχαν στην τριμελή επιτροπή, αλλά και τον Καθηγητή του Πανεπιστημίου του Southampton κ. Νίκο Τζαβίδη για το πολύτιμο υλικό που μου παρείχε για την ολοκλήρωση ενός σημαντικού μέρους της διπλωματικής. Επίσης επιθυμώ να ευχαριστήσω την οικογένεια μου για την εμπιστοσύνη και την υποστήριξη που μου παρείχε όλο αυτό το διάστημα των 2,5 ετών. Τέλος από όλους τους αναγνώστες ζητώ κατανόηση για τυχόν λάθη και ελλείψεις που υπάρχουν στο παρόν σύγγραμμα. Ηλίας Γκανέτσος Μάιος 2007 v

8 v

9 Περίληψη Η ανάλυση παλινδρόμησης είναι η πλέον γνωστή τεχνική για να μελετήσουμε τη μέση συμπεριφορά μιας μεταβλητής, δοθέντων άλλων μεταβλητών που την επηρεάζουν. Ωστόσο, πολλές φορές έχει ενδιαφέρον να μελετήσουμε την επιρροή αυτή σε όλο το εύρος της κατανομής της εξαρτημένης μεταβλητής και όχι μόνο στη μέση της τιμή. Στην παρούσα διπλωματική εργασία παρουσιάζουμε μία ανθεκτική σε έκτροπες παρατηρήσεις τεχνική που δίνει την απάντηση στο παραπάνω ζήτημα, την Παλινδρόμηση Ποσοστιαίων Σημείων. Θα αναλυθεί το μοντέλο, θα ερμηνευτούν τα χαρακτηριστικά εκτίμησής του και θα συνοψιστούν τα πλεονεκτήματά του έναντι της Κλασικής Παλινδρόμησης. Στη συνέχεια θα δούμε μια σειρά εφαρμογών της μεθόδου. Θα διαπιστώσουμε με τη βοήθεια ενός απλού σετ δεδομένων την ανθεκτικότητα της Παλινδρόμησης της Διαμέσου σε έκτροπες παρατηρήσεις σε σχέση με την Κλασική Παλινδρόμηση, θα δούμε μεγάλες έρευνες όπως την εφαρμογή της μεθόδου σε δεδομένα οικονομικά και ιατρικά και θα αναλύσουμε βάσει αυτής κάποια εκλογικά αποτελέσματα των τελευταίων Ελληνικών βουλευτικών εκλογών, καθώς και οικονομικά χαρακτηριστικά κάποιων ασφαλιστικών εταιριών μηχανοκίνητων οχημάτων που δραστηριοποιούνται στην Ελλάδα. Τέλος, η μελέτη θα επεκταθεί στη σύνδεση της Παλινδρόμησης Ποσοστιαίων Σημείων με τα Γραμμικά Μικτά Μοντέλα. Θα παρουσιαστεί και θα αξιολογηθεί η μέθοδος της Μ- Παλινδρόμησης Ποσοστιαίων Σημείων, που αποτελεί μία εναλλακτική επιλογή για δεδομένα που αναλύονται με τα Μικτά Μοντέλα. Η νέα αυτή τεχνική, αν και δεν μπορεί να κριθεί πιο αξιόπιστη, ξεπερνάει κάποια προβλήματα που θα αντιμετωπίζαμε αν επιλέγαμε την ανάλυση μέσω των Γραμμικών Μικτών Μοντέλων. x

10 x

11 Abstract Regresson analyss s the most prevalent technque for studyng the mean behavour of a varable, gven other varables whch affect t. That sad, t s often nterestng to nvestgate ths correlaton at the whole range of the dependent varable s dstrbuton rather than just ts mean. In ths dssertaton, a resstant to outlyng observatons technque, called Quantle Regresson, wll be presented and analyzed n an effort to provde an answer to the aforementoned ssue. After we analyze the model, we wll reach some conclusons n regards to the estmaton characterstcs and we wll summarze ts advantages to Classcal Regresson. Moreover, a number of practcal applcatons of ths method wll be portrayed. Through a smple set of varables, the robustness of the Medan Regresson n outlers wll be shown and contrasted to that of the Classc Lnear Regresson. Internatonal studes wll be revewed, whch contan economc and medcal applcatons of the method. Furthermore, ths method wll be used to analyze and explan electoral results taken from the last Greek Parlamentary Electons, as well as to analyze some automoble nsurance companes fnancal characterstcs as t concerns the case of Greece. Fnally, the study wll consder the connecton between Quantle Regresson and Lnear Mxed Models. The M-Quantle Regresson wll also be evaluated; ths method provdes an alternatve way to deal wth data whch are analyzed through Mxed Models. Ths new technque, though t may not be consdered more relable, does solve some problems that we would have faced f we had chosen to analyze a set of varables through Lnear Mxed Models. x

12 x

13 Κατάλογος Πινάκων Κατάλογος Σχημάτων Κατάλογος Συντομογραφιών Περιεχόμενα Κεφάλαιο 1: Η Παλινδρόμηση Ποσοστιαίων Σημείων Εισαγωγή Το μοντέλο της Παλινδρόμησης Ποσοστιαίων Σημείων Εκτίμηση παραμέτρων μέσω βελτιστοποίησης Υπολογιστικά θέματα Ερμηνεία μοντέλων Παλινδρόμησης Ποσοστιαίων Σημείων Ιδιότητες Παλινδρόμησης Ποσοστιαίων Σημείων Equvarance Ανθεκτικότητα (Robustness) Ασυμπτωτικές Ιδιότητες Στατιστική Συμπερασματολογία της ΠΠΣ Επιλογή βέλτιστου μοντέλου Πλεονεκτήματα Παλινδρόμησης Ποσοστιαίων Σημείων 18 Κεφάλαιο 2: Εφαρμογές της Παλινδρόμησης Ποσοστιαίων Σημείων Εισαγωγή Σύγκριση Παλινδρόμησης Διαμέσου με Κλασική Παλινδρόμηση Δεδομένα του Engel (1857) Βάρος νεογέννητων (Abreveya 2001) Βουλευτικές εκλογές (Ελλάδα, Μάρτιος 2004) Ασφαλιστικές εταιρίες μηχανοκίνητων οχημάτων ( ) 46 Κεφάλαιο 3: Μικτά Μοντέλα και Παλινδρόμηση Ποσοστιαίων Σημείων Εισαγωγή 53 xv xx xx x

14 xv

15 3.2 Γραμμικά Μικτά Μοντέλα Ανθεκτικοί εκτιμητές Συνάρτηση επίδρασης Μ-εκτιμητές L-εκτιμητές Μ-Παλινδρόμηση Ποσοστιαίων Σημείων Εφαρμογή της Μ-ΠΠΣ σε μικρές περιοχές Σύγκριση της Μ-ΠΠΣ με το ΓΜΜ για εκτίμηση σε μικρές περιοχές Μελέτη προσομοίωσης για τη σύγκριση Μ-ΠΠΣ και ΓΜΜ Μία εναλλακτική προσέγγιση στη σύνδεση μεταξύ ΠΠΣ και ΓΜΜ 71 Παράρτημα 73 Παράρτημα Α: Στατιστικό πακέτο 73 Παράρτημα Β: Δεδομένα 75 Παράρτημα Γ: Διαγράμματα 76 Βιβλιογραφία 80 xv

16 xv

17 Κατάλογος Πινάκων 2-1 Πίνακας δεδομένων (x,y) Συγκριτικός πίνακας Κλασικής Γραμμικής Παλινδρόμησης και Παλινδρόμησης Διαμέσου για τα δεδομένα παρατήρηση. (x, y) χωρίς έκτροπη 2-3 Συγκριτικός πίνακας Κλασικής Γραμμικής Παλινδρόμησης και Παλινδρόμησης Διαμέσου για τα δεδομένα παρατήρηση. (x, y) με έκτροπη 2-4 Πίνακας περιγραφικών στατιστικών για τα δεδομένα των βουλευτικών εκλογών. 2-5 Πίνακας Κλασικής Γραμμικής Παλινδρόμησης για τα δεδομένα των βουλευτικών εκλογών. 2-6 Πίνακας Παλινδρόμησης Ποσοστιαίων Σημείων για τ = 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95 για τα δεδομένα των βουλευτικών εκλογών. 2-7 Πίνακας περιγραφικών στατιστικών για τα δεδομένα των ασφαλιστικών. 2-8 Πίνακας Παλινδρόμησης Ποσοστιαίων Σημείων για τ = 0.05, 0.25, 0.5, 0.75, 0.95 για τα δεδομένα των ασφαλιστικών. 2-9 Πίνακας με τα μέτρα σύγκρισης των εκτιμήσεων των μέσων μέσω ΓΜΜ και Μ-ΠΠΣ. (Πηγή: Chambers, Tzavds,2006) 2-10 Πίνακας με τα μέτρα σύγκρισης των εκτιμήσεων των διαμέσων μέσω ΓΜΜ και Μ-ΠΠΣ. (Πηγή: Chambers, Tzavds,2006) xv

18 xv

19 Κατάλογος Σχημάτων 1-1 Συνάρτηση Ελέγχου για τ = 0.2, 0.5, 0.8. (Πηγή: Koenker, Hallock, 2001) 2-1 Διάγραμμα διασποράς των (x, y) χωρίς έκτροπη παρατήρηση Διάγραμμα διασποράς των (x, y) χωρίς έκτροπη παρατήρηση με τις προσαρμοσμένες ευθείες παλινδρόμησης. 2-3 Διάγραμμα διασποράς των (x, y) με έκτροπη παρατήρηση Διάγραμμα διασποράς των (x, y) με έκτροπη παρατήρηση με τις προσαρμοσμένες ευθείες παλινδρόμησης. 2-5 Διάγραμμα διασποράς των δεδομένων του Engel με τις προσαρμοσμένες ευθείες παλινδρόμησης. 2-6 Παλινδρόμηση Ποσοστιαίων Σημείων για τα δεδομένα του Engel Συνάρτηση παλινδρόμησης ποσοστιαίων σημείων και εμπειρική συνάρτηση πυκνότητας για τα 0,1 και 0,9 ποσοστιαία σημεία των δεδομένων του Engel. 2-8 Παλινδρόμηση Ποσοστιαίων Σημείων για το βάρος γέννας. (Πηγή: Koenker, Hallock, 2001) 2-9 Διάγραμμα διασποράς των ψήφων ΠΑ.ΣΟ.Κ. με τις ψήφους της αριστεράς Διάγραμμα διασποράς των ψήφων ΠΑ.ΣΟ.Κ. με τις ψήφους της αριστεράς με την προσαρμοσμένη ευθεία ΚΓΠ Διάγραμμα διασποράς των ψήφων ΠΑ.ΣΟ.Κ. με τις ψήφους της αριστεράς με τις προσαρμοσμένες ευθείες ΚΓΠ και ΠΠΣ για τ = 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, Παλινδρόμηση Ποσοστιαίων Σημείων για τα δεδομένα των βουλευτικών εκλογών Παλινδρόμηση Ποσοστιαίων Σημείων για τα δεδομένα των ασφαλιστικών xx

20 xx

21 ΠΠΣ ΚΓΠ ΠΔ ΓΜΜ Μ-ΠΠΣ Κατάλογος Συντομογραφιών Παλινδρόμηση Ποσοστιαίων Σημείων Κλασική Γραμμική Παλινδρόμηση Παλινδρόμηση Διαμέσου Γραμμικό Μικτό Μοντέλο Μ-Παλινδρόμηση Ποσοστιαίων Σημείων xx

22 xx

23 ΚΕΦΑΛΑΙΟ 1 Η ΠΑΛΙΝΔΡΟΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ 1.1 Εισαγωγή Σε πολλές εφαρμοσμένες μελέτες παρατηρείται ότι μία εξαρτημένη μεταβλητή που μας ενδιαφέρει επηρεάζεται έμμεσα, μέσω κάποιων επεξηγηματικών μεταβλητών. Όπως είναι γνωστό, ένα συνηθισμένο μοντέλο παλινδρόμησης μοντελοποιεί τη σχέση μιας ή περισσοτέρων επεξηγηματικών μεταβλητών Χ με τη δεσμευμένη μέση τιμή μιας εξαρτημένης μεταβλητής Υ, δοθέντος Χ=x. Τα κλασικά αυτά μοντέλα παλινδρόμησης δεν είναι πάντα κατάλληλα όσον αφορά τη φύση των δεδομένων και ποιες ακριβώς τιμές της εξαρτημένης μεταβλητής θέλουμε να εξηγήσουμε. Αυτό συμβαίνει σε πολλές περιπτώσεις, όπου ο υποπληθυσμός δεν έχει τόσο ενδιαφέρον να μελετηθεί στη μέση συμπεριφορά του και προκύπτει η ανάγκη να βρούμε τρόπους να μοντελοποιήσουμε ως προς τις ακραίες του τιμές. Αντί λοιπόν να εξηγούμε τη μέση συμπεριφορά της Υ δοθέντος της Χ, θα μπορούσαμε να μελετήσουμε τη συμπεριφορά της Υ δοθέντος της Χ σε όλο το εύρος της κατανομής της πρώτης. Την απάντηση στα παραπάνω ζητήματα έρχεται να δώσει η Παλινδρόμηση Ποσοστιαίων Σημείων (ΠΠΣ), της οποίας η θεωρία αναπτύχθηκε από τους Roger Koenker και Glbert Basset το 1978 στην εργασία τους με τίτλο «Regresson Quantles» που δημοσίευσε το επιστημονικό περιοδικό Econometrca. Η ΠΠΣ είναι μια επέκταση της κλασικής μεθόδου παλινδρόμησης που βασίζεται στη μέθοδο ελαχίστων τετραγώνων και έχει σκοπό την εκτίμηση και συμπερασματολογία γύρω από συναρτήσεις ποσοστιαίων σημείων της δεσμευμένης κατανομής της εξαρτημένης μεταβλητής δοθέντων άλλων ανεξάρτητων. Όπως η Κλασική Γραμμική Παλινδρόμηση (ΚΓΠ) 1

24 χρησιμοποιείται για να εκτιμούμε μοντέλα για δεσμευμένες συναρτήσεις του μέσου όρου, έτσι και η ΠΠΣ διαθέτει έναν άλλο μηχανισμό για εκτίμηση μοντέλων υπό συνθήκη συναρτήσεων της διαμέσου, καθώς και όλου του εύρους των ποσοστιαίων σημείων της κατανομής. Έτσι, η στατιστική αυτή τεχνική συμπληρώνει την ΚΓΠ, προσφέροντας μια πιο πλήρη στατιστική ανάλυση στοχαστικών σχέσεων μεταξύ τυχαίων μεταβλητών. Όπως γίνεται αντιληπτό η μέθοδος αυτή είναι πολύ πιο ανθεκτική στην ύπαρξη έκτροπων παρατηρήσεων στο υπό μελέτη δείγμα, ενώ έχει μια σειρά επιπλέον πλεονεκτημάτων που θα μελετήσουμε παρακάτω. Η σπουδαιότητα της μεθόδου της ΠΠΣ φαίνεται και από τη θεωρητική ενασχόληση σπουδαίων στατιστικών με αυτήν, αλλά και από τις πολλές και ενδιαφέρουσες εφαρμογές της σε διάφορους τομείς. Τη θεωρία των Koenker και Basset (1978) ήρθαν να συμπληρώσουν μεταξύ άλλων οι Powell (1986), Koenker και Portnoy (1987, 1997), Portnoy (1991), Guttembrunner και Jureckova (1992), Hendrcks και Koenker (1991), Buchnsky (1998), Chamberlan (1994), Chaudhur, Doksum και Samarov (1997) και Knght (1998). Στη συνέχεια θα επιχειρήσουμε να δώσουμε τα βασικά στοιχεία της θεωρίας που θεμελίωσαν οι παραπάνω στατιστικοί και στην οποία βασίζεται η μέθοδος της ΠΠΣ. 1.2 Το Μοντέλο Παλινδρόμησης Ποσοστιαίων Σημείων Έστω τυχαία μεταβλητή Χ με συνάρτηση κατανομής: F ( x) Pr( X x). = (1.2.1) Το τ-οστό ποσοστιαίο σημείο, για 0 < τ < 1, ορίζεται ως: ( τ ) = nf{ x : F( X ) τ}, Q (1.2.2) όπου Χ είναι μια μεταβλητή με συνάρτηση κατανομής την (1.2.1). 2

25 Ο ορισμός του ποσοστιαίου σημείου λέει ότι μια παρατήρηση στο τ-οστό ποσοστημόριο είναι μεγαλύτερη από το τ% των παρατηρήσεων και μικρότερη από το (1-τ)% των παρατηρήσεων. Το 25%-ποσοστιαίο σημείο είναι η τιμή Q ( 1/ 4), η διάμεσος, που παίζει τον κεντρικό ρόλο, είναι η τιμή Q ( 1/ 2), το 75%-ποσοστιαίο σημείο είναι η τιμή ( 3/ 4) Q κ.ο.κ. Σε συνδυασμό με τη συνάρτηση κατανομής, η συνάρτηση ποσοστιαίων σημείων, παρέχει μια πιο πλήρη εικόνα της τυχαίας μεταβλητής Χ. Έστω τώρα ( y, x ), =1,2,,n, ένα δείγμα από κάποιον πληθυσμό, όπου y οι τιμές της εξαρτημένης μεταβλητής που μας ενδιαφέρει και x το διάνυσμα των επεξηγηματικών μεταβλητών. Το γενικό μοντέλο ΠΠΣ, όπως το περιγράφει ο Bunchnsky (1998), παίρνει τη γραμμική μορφή: για =1,2,,n, όπου ( ) ( τ ) u ( τ ), T y = x β + (1.2.3) βτ είναι ένα kx1 διάνυσμα συντελεστών προς εκτίμηση, είναι το διάνυσμα στήλη, που είναι η αντιμετάθεση της -οστής γραμμής του nxk πίνακα Χ των επεξηγηματικών μεταβλητών, μεταβλητής και ( ) y είναι η -οστή παρατήρηση της εξαρτημένης u τ είναι ένας άγνωστος όρος σφάλματος. Το τ-οστό δεσμευμένο ποσοστιαίο σημείο της y δοθέντος της x μπορεί να γραφεί ως εξής: έστω Για παράδειγμα, έστω τ T ( y x ) x β ( τ ). Q = (1.2.4) y η απόδοση του -οστού μαθητή σε κάποιο σχολείο και x οι τιμές του διανύσματος των επεξηγηματικών μεταβλητών για τον -οστό μαθητή, που μπορεί να είναι το κοινωνικό και οικονομικό του επίπεδο, η μόρφωση των γονιών του κλπ. x 3

26 Σύμφωνα με το κλασικό μοντέλο ΓΠ, οι αποδόσεις των μαθητών θα έχουν αναμενόμενη τιμή που θα είναι γραμμική συνάρτηση των επεξηγηματικών μεταβλητών που αναφέραμε παραπάνω και θα συνδέονται με τη σχέση: ( y x ) x β, E = (1.2.5) ή αν θέλουμε να δηλώσουμε σαν α τον σταθερό όρο: ( y x ) a x β. T E = + (1.2.6) T Το διάνυσμα των συντελεστών β, περιγράφει τον τρόπο με τον οποίο οι επεξηγηματικές μεταβλητές x επηρεάζουν την μέση απόδοση των μαθητών y. Όσον αφορά το γραμμικό μοντέλο ΠΠΣ, η τιμή που εξαρτάται από τις επεξηγηματικές μεταβλητές που έχουμε χρησιμοποιήσει δεν είναι η μέση τιμή της δεσμευμένης κατανομής της μεταβλητής της απόδοσης των μαθητών αλλά το τ-οστό ποσοστιαίο σημείο της. Έτσι το μοντέλο για το τ-οστό ποσοστιαίο σημείο είναι το εξής: τ T ( y x ) x β ( τ ), ή αν θέλουμε να δηλώσουμε σαν ( τ ) σημείο: Q = (1.2.7) τ a τον σταθερό όρο για το τ-οστό ποσοστιαίο T ( y x ) a( τ ) x β ( τ ). Q = + (1.2.8) Αναφορικά με το παραπάνω παράδειγμα, ενώ η ΚΓΠ μελετά το πώς παράγοντες όπως κοινωνικό επίπεδο, οικονομικό επίπεδο, μόρφωση γονέων κλπ επηρεάζουνε την απόδοση μόνο του μέσου μαθητή, το μοντέλο της ΠΠΣ προχωράει παραπέρα και μελετά το πώς οι παραπάνω παράγοντες επηρεάζουνε την απόδοση ξεχωριστά των καλών, των μεσαίων και των κακών μαθητών ανάλογα με την επιλογή του τ. 4

27 Ας επικεντρωθούμε τέλος στο ρόλο που παίζουν τα κατάλοιπα Η σχέση (1.2.4) σε συνδυασμό με τη σχέση (1.2.3) μας λέει ότι Q ( ( τ ) ) = 0 επεξηγηματικών x. Θεωρούμε το μοντέλο πρόβλεψης: y ˆ = T β ( τ ), (1.2.9) x τ u x για δοθέν διάνυσμα το οποίο προβλέπει την απόκριση της εξαρτημένης μεταβλητής y για συγκεκριμένες τ ˆ αποτελούν τιμές των επεξηγηματικών μεταβλητών. Τότε τα κατάλοιπα u ( ) = y y ένα μέτρο για το πόσο καλά σχετίζεται το μοντέλο με τις πραγματικές αποκρίσεις. Η διαφορά ανάμεσα στην ΠΠΣ και στην ΚΓΠ είναι ότι αντί να ισχύει ( ) = 0, τ ( u ( τ )) = 0 E έχουμε Q για την παλινδρόμηση του ποσοστιαίου σημείου με αντίστοιχη τιμή τ. Αυτό οδηγεί στη σχέση: Q ( u ( )) Q ( y yˆ ) = 0. τ τ = τ (1.2.10) Στο σημείο αυτό πρέπει να σημειωθεί ότι επειδή ο καθορισμός των ποσοστιαίων σημείων απαιτεί διάταξη των παρατηρήσεων, ο τελεστής Q δεν είναι γραμμικός, οπότε: τ Q τ ( y yˆ ) Q ( y ) Q ( yˆ ). (1.2.11) 1.3 Εκτίμηση παραμέτρων μέσω βελτιστοποίησης τ τ Τα ποσοστιαία σημεία έχουν άμεση σχέση με τη διάταξη των δειγματικών παρατηρήσεων που χρησιμοποιούμε για να τα ορίσουμε. Έτσι μπορούμε να τα μελετήσουμε από μια άλλη οπτική γωνία, ως ένα πρόβλημα βελτιστοποίησης. Όπως ορίζουμε τον δειγματικό μέσο ως τη λύση ενός προβλήματος ελαχιστοποίησης του αθροίσματος των τετραγώνων των καταλοίπων, έτσι ορίζουμε την διάμεσο ως τη λύση u 5

28 ενός προβλήματος ελαχιστοποίησης ενός αθροίσματος απόλυτων καταλοίπων. Τι γίνεται όμως με τα υπόλοιπα ποσοστιαία σημεία; Αν η συνάρτηση της συμμετρικής απόλυτης τιμής προσεγγίζει τη διάμεσο, τότε μπορούμε να χρησιμοποιήσουμε μία συνάρτηση μη συμμετρικής σταθμισμένης απόλυτης τιμής ώστε να προσεγγίσουμε και τα υπόλοιπα ποσοστιαία σημεία. Με βάση το παραπάνω σκεπτικό η προσέγγιση των ποσοστιαίων σημείων ανάγεται στη λύση του παρακάτω προβλήματος ελαχιστοποίησης: όπου ( ) τ mn ξ R ρ τ ( y ξ ), (1.3.1) ρ η «συνάρτηση ελέγχου», που ορίζεται ως εξής: + ( u) = u( τ I ( u < 0) ) = τ u + ( 1 τ ) u, ρ τ (1.3.2) + όπου τα u = u I[ u > 0] και = u I[ u < 0] u δηλώνουν αντίστοιχα τα θετικά και αρνητικά μέρη του u R. Στο παρακάτω σχήμα φαίνεται και η γραφική απεικόνιση της εν λόγω συνάρτησης για διάφορες τιμές του τ: ρ τ ( u) ΣΧΗΜΑ 1-1 : Συνάρτηση Ελέγχου για τ = 0.2, 0.5, 0.8. (Πηγή: Koenker, Hallock, 2001) u 6

29 Έχοντας επιτύχει τον ορισμό των μη δεσμευμένων ποσοστιαίων σημείων ως ένα πρόβλημα βελτιστοποίησης, είναι τώρα εύκολο να ορίσουμε με ανάλογο τρόπο και τα δεσμευμένα ποσοστιαία σημεία. Η μέθοδος ελαχίστων τετραγώνων της ΚΓΠ προσφέρει ένα μοντέλο για τον τρόπο που θα ακολουθήσουμε. Έστω ένα τυχαίο δείγμα { y, y2,..., y }. Αν λύσουμε το παρακάτω πρόβλημα ελαχιστοποίησης: 1 n n µ R ( y ), (1.3.3) = 1 mn µ τότε παίρνουμε τον δειγματικό μέσο ως μία εκτίμηση του μη δεσμευμένου πληθυσμιακού μέσου ΕΥ. Αν αντικαταστήσουμε την παράμετρο μ με την παραμετρική συνάρτηση μ( x,β) και λύσουμε το παρακάτω πρόβλημα ελαχιστοποίησης: τότε θα πάρουμε μια εκτίμηση της δεσμευμένης μέσης τιμής Ε(Υ x). (1.3.4) Στην ΠΠΣ ακολουθείται ο ίδιος ακριβώς τρόπος. Για να πάρουμε μια εκτίμηση της δεσμευμένης συνάρτησης της διαμέσου απλά αντικαθιστούμε στη σχέση (1.3.1) την παράμετρο ξ με την παραμετρική συνάρτηση ξ( x,β) και θέτουμε τ=1/2. Στην περίπτωση της διαμέσου η συνάρτηση ελέγχου είναι η συνάρτηση της απόλυτης τιμής, δηλαδή ρ ( ) τ mn =, επομένως αρκεί να βρούμε τη λύση ενός προβλήματος ελαχιστοποίησης του αθροίσματος των απόλυτων καταλοίπων. Για να βρούμε τώρα τις εκτιμήσεις των δεσμευμένων συναρτήσεων άλλων ποσοστιαίων σημείων απλά αντικαθιστούμε τις απόλυτες τιμές με την ρ ( ) πρόβλημα ελαχιστοποίησης: mn β R p n ( y µ ( x, β )) = 1 ( y ξ ( x β )) π ρ β τ, R 2, τ, για το αντίστοιχο τ, και λύνουμε το εξής. (1.3.5) 7

30 Εναλλακτικά, χωρίς τη χρήση της συνάρτησης ελέγχου ρ ( ) τ, για να βρούμε τις εκτιμήσεις μπορούμε να λύσουμε το παρακάτω πρόβλημα ελαχιστοποίησης που πρότειναν οι Koenker και Basset το 1978 και είναι ισοδύναμο του (1.3.5): mn π β R { y ξ ( x, β )} τ y ξ ( x, β ) + ( 1 τ ) y ξ ( x, β ). (1.3.6) { : y ξ ( x β )} : <, 1.4 Υπολογιστικά θέματα Ένα από τα πλεονεκτήματα της ΠΠΣ όπως είδαμε παραπάνω είναι ότι η εκτίμηση των παραμέτρων μπορεί να παρασταθεί σαν ένα πρόβλημα γραμμικού προγραμματισμού, κάτι που έχει σημαντική σημασία και από θεωρητική αλλά και από πρακτική σκοπιά. Συγκεκριμένα έχουμε το πρόβλημα ελαχιστοποίησης (1.3.5). Το πρόβλημα αυτό, ( ) όταν η ξ, βˆ ( τ ) x είναι μια γραμμική συνάρτηση μπορεί να λυθεί πολύ εύκολα με μεθόδους Γραμμικού Προγραμματισμού. Τέτοιες είναι οι παρακάτω: Μέθοδος των Barrodale & Roberts (Barrodale & Roberts, 1973 και 1974) (για μικρό μέγεθος δείγματος). Μέθοδος Smplex (Koenker & D Orey, 1987 και 1993) (για μέτριο μέγεθος δείγματος). Μέθοδος Εσωτερικού Σημείου (Portnoy & Koenker, 1997) (για αρκετά μεγάλο μέγεθος δείγματος). Μέθοδος Εσωτερικού Σημείου με preprocessng (Portnoy & Koenker, 1997) (για πολύ 5 μεγάλο μέγεθος δείγματος n >10 ). 8

31 Μέθοδος εξομάλυνσης (Chen, 2004). Ο Buchnsky (1998), μελέτησε τα υπολογιστικά θέματα της μεθόδου αρκετά συνοπτικά αλλά και από μια «μη τεχνική» σκοπιά. T Από την έκφραση y x β ( τ ) + u ( τ ) σχέση γράφοντας το = μπορούμε να περάσουμε σε μία άλλη y σαν μια συνάρτηση μόνο θετικών στοιχείων και εν συνεχεία να την μετατρέψουμε σε έναν πίνακα. Με τον τρόπο αυτό μετατρέπουμε τον αρχικό τύπο σε πρόβλημα γραμμικού προγραμματισμού. Δηλαδή μπορούμε να γράψουμε : όπου y β, 1 τj = σε πίνακες : K j = 1 2 τj x j K 1 2 β + u = x ( β β ) + ( ε v ), (1.4.1) τj β, ε τ και τj j = 1 j τj τj v τ μη αρνητικά με j = 1,..., K και = 1,..., n. Η μορφή του αρχικού προβλήματος γραμμικού προγραμματισμού θα είναι τότε mn c T z z με περιορισμούς Αz=y, z 0, (1.4.2) όπου A = ( X X,, ) Επιπλέον n T T 1 2., z ( β, β, u ) T, v T T I n I n τ T T T = και c = 0,0, τ l,( 1 τ ) I είναι ο n-διάστατος ταυτοτικός πίνακας, T 0 είναι ένα Κ x 1 διάνυσμαστήλη με μηδενικά και l είναι ένα n x 1 μοναδιαίο διάνυσμα. τ T T ( l ). Τέλος όσον αφορά δυική μορφή του παραπάνω προβλήματος γραμμικού προγραμματισμού, αυτή είναι εύκολο να γραφεί, με τη βοήθεια της σχέσης (1.4.2) : max w T w y T T με περιορισμούς w y c. (1.4.3) 9

32 Το θεώρημα της δυικότητας λέει πως υπάρχουν λύσεις και για τους δυο τύπους αν ο πίνακας Χ είναι πλήρους τάξεως. Επιπλέον το θεώρημα ισορροπίας του Γραμμικού Προγραμματισμού εγγυάται το βέλτιστο αυτών των λύσεων. 1.5 Ερμηνεία μοντέλων Παλινδρόμησης Ποσοστιαίων Σημείων Θεωρούμε πάλι το μοντέλο (1.1.4) της ΠΠΣ. Όπως θα δούμε σε μία από τις παρακάτω παραγράφους, για κάθε μονότονο μετασχηματισμό ( ) τότε: Q ( Y )( X = x) = h( QY ( τ X x) ) τ. h = h ισχύει: T Από την παραπάνω σχέση προκύπτει άμεσα ότι αν Q ( )( τ X = x) = x β ( τ ), Q Y 1 T ( τ X = x) h ( x β ) =. x j x j h Y (1.5.1) Επομένως, αν για παράδειγμα η h είναι η λογαριθμική συνάρτηση, τότε από τη T σχέση ( )( τ ) β ( τ ), Q X = x = x προκύπτει ότι log Y Q Y ( τ X = x) T = exp( x β ) β. Άρα αρκεί να προσπαθούμε σε κάθε περίπτωση να δίνουμε την ερμηνεία της μερικής παραγώγου ιδιαίτερη προσοχή. ( τ X = x) QY x j x j κάτι που τις περισσότερες φορές χρειάζεται j 10

33 1.6 Ιδιότητες Παλινδρόμησης Ποσοστιαίων Σημείων Equvarance Ας υποθέσουμε ότι έχουμε ένα μοντέλο για τη θερμοκρασία ενός υγρού που εκφράζεται μέσω της τυχαίας μεταβλητής y και αποφασίζουμε να αλλάξουμε την κλίμακα των μετρήσεων από Κελσίου σε Φαρενάιτ, ή αποφασίζουμε να μελετήσουμε και την επίδραση του αθροίσματος ή της διαφοράς των δύο επεξηγηματικών μεταβλητών που διαθέτουμε. Οι αλλαγές αυτές δε θα έχουν βασική επίδραση στις εκτιμήσεις μας. Όταν τα δεδομένα αλλάζουν με παρόμοιο με τους παραπάνω προβλέψιμους τρόπους, τότε αναμένουμε και οι εκτιμήσεις της παλινδρόμησης να αλλάζουν και αυτές έτσι ώστε να αφήνουν την ερμηνεία των αποτελεσμάτων αμετάβλητη. Αρκετές τέτοιες ιδιότητες μπορούν να συνοψιστούν υπό τον τίτλο «equvarance» και συχνά προσφέρουν μια σημαντική βοήθεια στην προσεκτική ερμηνεία των αποτελεσμάτων μιας στατιστικής ανάλυσης. Έστω ότι εκτελείται παλινδρόμηση του τ-οστού ποσοστιαίου σημείου σε ένα σετ δεδομένων (y,x) και προκύπτει ο εκτιμητής β ˆ ( τ ; y, X ) ιδιότητες του ˆ ( τ ; y, X ) β συνοψίζονται στο παρακάτω θεώρημα:. Τέσσερις βασικές equvarance p Θεώρημα (Koenker & Basset, 1978): Έστω Α ένας pxp ουδέτερος πίνακας, γ R και α>0. Τότε, για κάθε τ [ 0,1] : () β ˆ( τ ; ay, X ) = αβˆ ( τ ; y, X ) () βˆ ( τ ; ay, X ) = αβˆ ( 1 τ; y, X ) ˆ () β ( τ ; y + Xγ, X ) = β ( τ ; y, X ) + γ (v) ˆ β ( τ ; y, XA) = A 1 βˆ ( τ; y, X ) ˆ 11

34 Οι ιδιότητες () και () υποδηλώνουν την equvarance της κλίμακας, η ιδιότητα () συνήθως ονομάζεται equvarance της παλινδρόμησης ή της μετατόπισης (shft equvarance), ενώ η ιδιότητα (v) έχει να κάνει με την αναπαραμετροποίηση (equvarance to reparameterzaton of desgn). Τα ποσοστιαία σημεία όμως διαθέτουν μία ακόμη equvarance ιδιότητα. Αυτή η ιδιότητα ονομάζεται equvarance σε μονότονους μετασχηματισμούς. Έστω ( ) αύξουσα συνάρτηση του R. Τότε, για κάθε τυχαία μεταβλητή Y ισχύει: Q = ( ). (1.6.1) h ( Y )( τ ) h QY ( τ ) h μία Αυτό σημαίνει ότι τα ποσοστιαία σημεία της μετασχηματισμένης τυχαίας μεταβλητής ( Y ) h είναι απλώς τα μετασχηματισμένα ποσοστιαία σημεία της αρχικής τυχαίας μεταβλητής Y. Στο σημείο αυτό πρέπει να σημειωθεί ότι η μέση τιμή δεν έχει αυτή την ιδιότητα, δηλαδή: E( h( Y )) h( E( Y )). (1.6.2) Η σχέση (1.6.1) προκύπτει άμεσα από το γεγονός ότι για κάθε μονότονο μετασχηματισμό h ισχύει: P ( Y y) = P h( Y ) h( y) ( ). (1.6.3) Η ιδιότητα (1.6.3) έχει αρκετά σημαντικά αποτελέσματα. Συχνά θέτουμε ως εξής το μοντέλο της ΚΓΠ: T ( y ) = x β u, h λ + (1.6.4), 12

35 όπου το h ( y,λ) δηλώνει κάποιον μετασχηματισμό της αρχικής εξαρτημένης μεταβλητής y, έτσι ώστε η μέση τιμή E( h( y ) x) μεταβλητές x και η διακύμανση V ( h( y ) x) (ομοσκεδαστικότητα) Ανθεκτικότητα (Robustness),λ να έχει γραμμική σχέση με τις επεξηγηματικές,λ να είναι ανεξάρτητη των x Η ανθεκτικότητα του εκτιμητή της ΠΠΣ σε ακραίες τιμές της εξαρτημένης μεταβλητής y μπορεί να αξιολογηθεί με κλασικές τεχνικές όπως η καμπύλη ευαισθησίας, η συνάρτηση επίδρασης (nfluence functon) ή το breakdown pont. Μπορεί όμως να φανεί και εύκολα αν σκεφτούμε το εξής. Ας φανταστούμε ένα διάγραμμα δισποράς κάποιων δεδομένων με την προσαρμοσμένη γραμμή της παλινδρόμησης του τ-οστού ποσοστιαίου σημείου. Ας θεωρήσουμε ότι παίρνουμε ένα οποιοδήποτε σημείο, ας πούμε το y, το οποίο βρίσκεται πάνω από τη γραμμή, και το μετακινούμε αρκετά μακριά από τη γραμμή, προς την κατεύθυνση του άξονα y. Εφόσον δεν περάσαμε πάνω από την γραμμή προσαρμογής, θα παρατηρήσουμε ότι η νέα προσαρμογή της γραμμής παλινδρόμησης του τ-οστού ποσοστιαίου σημείου είναι ίδια με την παλιά, κάτι που δε θα συνέβαινε αν κάναμε το ίδιο πείραμα με τη γραμμή της μέσης απόκρισης της ΚΓΠ. Αυτό το χαρακτηριστικό της ανθεκτικότητας του εκτιμητή της ΠΠΣ μπορεί να διατυπωθεί μαθηματικά στο παρακάτω θεώρημα: Θεώρημα (Koenker 2005): Έστω D ένας διαγώνιος πίνακας με μη αρνητικά στοιχεία d, με =1,,n. Τότε: όπου u ˆ y Xβˆ ( τ ; y, X ) β ˆ( τ ; y, X ) = βˆ ( τ; Xβˆ ( τ ; y, X ) + Duˆ, X ), (1.6.5) =. 13

36 Στο κεφάλαιο 3 θα ασχοληθούμε εκτενέστερα με αυτή την ιδιότητα της μεθόδου της ΠΠΣ, καθώς θα συνδέσουμε τη μέθοδο με κάποιους ιδιαίτερα ανθεκτικούς εκτιμητές Ασυμπτωτικές ιδιότητες Εκτός από τις παραπάνω βασικές ιδιότητες της ΠΠΣ, η μέθοδος έχει και κάποιες ενδιαφέρουσες ασυμπτωτικές ιδιότητες. Έστω ότι το τ-οστό δεσμευμένο ποσοστιαίο σημείο της y δοθέντος της x έχει την εξής παραμετρική μορφή: Q ( τ X x ) g ( x, β 0( τ Y = = )). (1.6.6) Γεννάται λοιπόν το ερώτημα κάτω από ποιες συνθήκες ο εκτιμητής βˆ n n ( τ ) = argmn p ρ ( y ( )) R τ g x, β β συγκλίνει κατά πιθανότητα στο β 0 ( τ ), ή αλλιώς πότε ˆ ( τ ) β ( τ ) 0 = 1 0 Με λίγα λόγια θέλουμε να ελέγξουμε τη συνέπεια του εκτιμητή ( τ ) (1.6.7) β n, όταν n. ˆ. Στην απλούστερη περίπτωση των δειγματικών ποσοστιαίων σημείων μιας μεταβλητής y με κατανομή F, έχουμε ότι: ξˆ ( τ ) = argmn R ρτ ( ξ ) n y = 1 και θέλουμε να δούμε αν ˆ ( τ ) ξ ( τ ) ξ 0 1 ποσοστιαίο σημείο, το ξ ( τ ) ( ). n ξ (1.6.8) n με την υπόθεση ότι η F έχει ένα μοναδικό τ-οστό = F Στην περίπτωση αυτή αποδεικνύεται ότι αν η F 0 τ έχει μία συνεχή συνάρτηση πυκνότητας f, τότε: β n 14

37 όπου τ ( τ ) F ( τ) 2 1 ω = 2 1 f ( ). ( ˆ ( τ) ξ ( τ) ) 2 n ~ N ( 0, ω ), (1.6.9) ξ n 0 Τα παραπάνω αποτελέσματα αφορούν όπως είπαμε την περίπτωση των δειγματικών ποσοστιαίων σημείων μιας μεταβλητής y. Η εισαγωγή τώρα επεξηγηματικών μεταβλητών x περιπλέκει την κατάσταση,αφού πλέον περνάμε στην ασυμπτωτική θεωρία της εκτίμησης συναρτήσεων δεσμευμένων ποσοστιαίων σημείων, την οποία θεμελίωσαν οι Koenker και Basset το 1978 και συμπλήρωσαν οι He και Shao το Θεωρούμε μία γενική μορφή του γραμμικού μοντέλου ΠΠΣ. Έστω Y,... 1, Y2 ανεξάρτητες τυχαίες μεταβλητές με αντίστοιχες συναρτήσεις κατανομής F,... Έχουμε την παρακάτω γραμμική συνάρτηση ως προς x ποσοστιαίου σημείου: P Y T ( τ x) x β ( τ ). 1, F2 των του τ-οστού δεσμευμένου Q = (1.6.10) Οι δεσμευμένες συναρτήσεις κατανομής των ( Y y x ) = F ( y x ) F ( y), < οπότε: Y = Q Y 1 ( τ x ) F ( τ x ) ξ ( τ ). Y Y μπορούν να γραφούν = (1.6.11) Πριν δούμε ποια ακριβώς είναι η ασυμπτωτική συμπεριφορά του εκτιμητή ˆ ( τ ) της ΠΠΣ πρέπει πρώτα να θέσουμε τις παρακάτω δύο συνθήκες: 1) Οι συναρτήσεις κατανομών { } F είναι απόλυτα συνεχείς και έχουν συνεχείς συναρτήσεις πυκνότητας ( ξ ) f ομοιόμορφα φραγμένες από 0 μέχρι. β n 15

38 2) Υπάρχουν θετικά ορισμένοι πίνακες 0 1 T α) lm n x x = D0 n 1 T β) lm n f ( ξ ( τ )) x x = D1 ( τ ) n max x = 1,..., n γ) 0 n D και ( τ ) D τέτοιοι ώστε: Κάτω λοιπόν από τις παραπάνω συνθήκες, η ασυμπτωτική συμπεριφορά του εκτιμητή ( τ ) ˆ της ΠΠΣ είναι η εξής: β n n( β ˆ ( τ ) β ( τ )) ~ N 0, ( 1 τ ) n 1 1 ( D D D ) 1.7 Στατιστική Συμπερασματολογία της ΠΠΣ τ. (1.6.12) Έχουν προταθεί κατά καιρούς πολλά τεστ για τον έλεγχο της μηδενικής υπόθεσης ( τ ) ( τ ) H 0 : Rβ = r (1.7.1) Ο Koenker προτείνει τον εξής έλεγχο της H 0 που είναι ουσιαστικά ένας έλεγχος λόγου πιθανοφανειών. Στην περίπτωση της Παλινδρόμησης της Διαμέσου ο έλεγχος της υπόθεσης H 0 για το μοντέλο (1.2.3) για τ=1/2 βασίζεται στο στατιστικό L n ~ ( V ( 1/ 2) Vˆ ( 1/ 2) )/ ( 1/ 2), = 8 s (1.7.2) ~ T T όπου V ( τ ) = mn ρ ( y x b), p τ V ( τ ) = mn ρ ( y x b) p τ [ ( )] 1 1 ( τ ) = f F ( τ ) { b R } ˆ και { b R Rb = r} s. 16

39 Αποδεικνύεται ότι κάτω από τη μηδενική υπόθεση η ποσότητα ασυμπτωτικά την χ κατανομή, όπου q=rank(r). 2 q L n ακολουθεί Η παραπάνω προσέγγιση μπορεί να επεκταθεί άμεσα και για άλλα ποσοστιαία σημεία εκτός από τη διάμεσο. Το αντίστοιχο στατιστικό που ακολουθεί ασυμπτωτικά την 2 χ q κατανομή στο οποίο θα βασίζεται ο έλεγχος της 0 είναι το εξής: L 2 όπου λ ( τ ) = τ ( 1 τ ) n 2 ~ [ V ( τ ) ( )], ( )() ˆ n Vn τ s τ H για το τ-ποσοστιαίο σημείο = τ 2 (1.7.3) λ και V ~ ( τ ), Vˆ ( τ ) και ( τ ) 1.8 Επιλογή βέλτιστου μοντέλου s όπως έχουν οριστεί παραπάνω. Ένα ερώτημα που τίθεται ύστερα από τη μελέτη όλων των βασικών συνιστωσών της μεθόδου της ΠΠΣ είναι η επιλογή του βέλτιστου μοντέλου ΠΠΣ με μεθόδους αντίστοιχες των stepwse αλγορίθμων της ΚΓΠ. Αν και σε αυτόν τον τομέα η αλήθεια είναι ότι δεν υπάρχει μία κοινά αποδεκτή μέθοδος η οποία να χρησιμοποιείται ευρέως, έχουν προταθεί 2 κριτήρια. Ο Machado to 1993 πρότεινε το κριτήριο: SIC n 1 = σ j + j (1.8.1) 2 ( j) log( ˆ ) p log n, ( ) 1 T όπου ˆ = n ρ y x β ( 1/ 2) σ και p j η διάσταση του j μοντέλου. j = 1 1/ 2 n 17

40 Εναλλακτικά θα μπορούσε κανείς να χρησιμοποιήσει το κριτήριο του Akake: ( j) log( ˆ ) p. AIC = σ + (1.8.2) j 1.9 Πλεονεκτήματα Παλινδρόμησης Ποσοστιαίων Σημείων j Όπως είδαμε παραπάνω, η μέθοδος της ΠΠΣ έχει μια σειρά από πλεονεκτήματα, τα οποία θα επιχειρήσουμε να συνοψίσουμε: Η ΠΠΣ μπορεί να χρησιμοποιηθεί για να μελετηθεί σε όλο το εύρος της η δεσμευμένη κατανομή της Y δοθέντος X=x και όχι μόνο στη μέση της συμπεριφορά. Αυτό επιτυγχάνεται με τη δοκιμή της αντίστοιχης τιμής του ( 0,1) σημεία της δεσμευμένης κατανομής της Y μας ενδιαφέρουν. τ ανάλογα με το ποια Το πρόβλημα της εκτίμησης των παραμέτρων του μοντέλου της ΠΠΣ μπορεί να εκφραστεί μέσω Γραμμικού Προγραμματισμού, κάτι που κάνει πολύ εύκολη την εκτίμηση χρησιμοποιώντας κάποιον από τους αλγορίθμους που αναφέραμε στην παράγραφο 1.4. Τα ποσοστιαία σημεία έχουν την ιδιότητα της equvarance σε μονότονους μετασχηματισμούς. Για παράδειγμα σε κάποιο παράδειγμα που η εξαρτημένη μεταβλητή εκφράζει μισθούς η δεσμευμένη διάμεσος των λογαρίθμων των μισθών είναι ίση με το λογάριθμο της δεσμευμένης διαμέσου των μισθών. Η αντικειμενική συνάρτηση της ΠΠΣ είναι ένα σταθμισμένο άθροισμα απολύτων αποκλίσεων, που δίνει ανθεκτικούς εκτιμητές, κι έτσι το εκτιμώμενο διάνυσμα των παραμέτρων δεν είναι ευαίσθητο σε παρατηρούμενες έκτροπες παρατηρήσεις της εξαρτημένης μεταβλητής. 18

41 Όταν τα σφάλματα δεν ακολουθούν την κανονική κατανομή, οι εκτιμητές της ΠΠΣ είναι πολύ πιο αξιόπιστοι από τους εκτιμητές ελαχίστων τετραγώνων. Μέσω της μεθόδου της ΠΠΣ μπορούμε να μελετήσουμε την ετεροσχεδαστικότητα των δεδομένων μας. 19

42 2.1 Εισαγωγή ΚΕΦΑΛΑΙΟ 2 ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ Όπως είδαμε και στο Κεφάλαιο 1, η μέθοδος της Παλινδρόμησης Ποσοστιαίων Σημείων έχει μία σειρά από πλεονεκτήματα τα οποία παρέχουν στον στατιστικό αναλυτή τρόπους για την αντιμετώπιση προβλημάτων που η Κλασική Παλινδρόμηση δεν μπορεί να λύσει. Επομένως, όπως είναι φυσικό, η μέθοδος έχει βρει ευρεία εφαρμογή σε πάρα πολλούς τομείς. Έχει χρησιμοποιηθεί για την εκτίμηση των ανώτερων και των χαμηλότερων καμπυλών που αντιστοιχούν σε ποσοστιαία σημεία και έχουν να κάνουν για παράδειγμα με την ηλικία, το φύλο και άλλες επεξηγηματικές μεταβλητές, χωρίς να τεθούν αυστηρές παραμετρικές υποθέσεις στις σχέσεις μεταξύ αυτών των καμπυλών. Ως παράδειγμα μπορούμε να αναφέρουμε ότι μέσω της μεθόδου έχει μοντελοποιηθεί η απόδοση των μαθητών στα σχολεία συναρτήσει κοινωνικοοικονομικών χαρακτηριστικών καθώς και άλλων μεταβλητών όπως σχολικές δαπάνες, προσόντα δασκάλων κλπ. Οι μεταβλητές αυτές δεν επηρεάζουν όλο τον πληθυσμό κατά τον ίδιο τρόπο, οπότε η ΠΠΣ μας βοηθάει να μελετήσουμε την επίδραση των παραπάνω μεταβλητών στην απόδοση των ισχυρότερων μαθητών και να δούμε αν είναι ίδιος ο τρόπος που οι αδύνατοι μαθητές επηρεάζονται. Μία τέτοια εφαρμογή έγινε από τους Ede και Showalter (1998). Επίσης σημαντικές είναι οι εφαρμογές στη μελέτη της κατανομής των μισθών και στις τάσεις της εισοδηματικής ανισότητας. Χαρακτηριστικές είναι οι εργασίες των 20

43 Buchnsky και Hunt (1997) και Ede και Showalter (1999). Μία από τις πιο σημαντικές εφαρμογές της μεθόδου, στην οποία θα αναφερθούμε αναλυτικότερα και παρακάτω, ήταν η ανάλυση των παραγόντων που οδηγούν σε νεογέννητα πολύ χαμηλού βάρους από τον Abreveya (2001). Η έρευνα του Abreveya έδωσε κίνητρο για περαιτέρω ενασχόληση με τη μέθοδο σε τομείς όπως η οικονομετρία και η βιοστατιστική Η μέθοδος της ΠΠΣ έχει εφαρμοστεί και σε πολλές ακόμα περιπτώσεις όπως στην ανάλυση των υψηλότερων προσφορών σε δημοπρασίες από τους Donald και Paarsch (1993), στην εκτίμηση των παραγόντων υψηλού ρίσκου στα οικονομικά από τον Tsay (2002), στην ανάλυση επιβίωσης σε ακραίες διάρκειες από τους Koenker και Gelng (2001) και στην ανάλυση των παραγόντων που επιδρούν στα προσεγγιστικά φράγματα βιολογικών διαδικασιών από τον Cade (2003). Τέλος μεγάλη είναι η συνεισφορά της μεθόδου στη μελέτη των χρηματιστηρίων. Χαρακτηριστικές είναι οι εργασίες των Buchnsky (1994, 1997), που μελετά το αμερικάνικο χρηματιστήριο, Ftzenberger (1999), που μελετά το χρηματιστήριο της Γερμανίας, Machado και Mata (1999), που μελετούν το χρηματιστήριο της Πορτογαλίας, Garca, Hernadez και Lopez-Ncolas (2001), που μελετούν το χρηματιστήριο της Ισπανίας και Schultz και Mwabu (1998), που μελετούν το χρηματιστήριο της Νοτίου Αφρικής. Παρακάτω θα δώσουμε πέντε παραδείγματα εφαρμογής της μεθόδου. Στο πρώτο παράδειγμα χρησιμοποιούμε ένα μικρό υποθετικό σετ δεδομένων, στο δεύτερο εφαρμόζουμε τη μέθοδο στα δεδομένα του Engel, στο τρίτο αναλύουμε την έρευνα του Abreveya, στο τέταρτο χρησιμοποιούμε την ΠΠΣ για την ανάλυση κάποιων ελληνικών εκλογικών αποτελεσμάτων και τέλος στο πέμπτο αναλύουμε μέσω της μεθόδου οικονομικά χαρακτηριστικά κάποιων ασφαλιστικών εταιριών. 2.2 Σύγκριση Παλινδρόμησης Διαμέσου με Κλασική Παλινδρόμηση Με τη βοήθεια του στατιστικού πακέτου της γλώσσας R θα επιχειρήσουμε να συγκρίνουμε την ΠΠΣ με την ΚΓΠ σε δεδομένα που δεν υπάρχει έκτροπη παρατήρηση καθώς και σε δεδομένα που εμφανίζεται έκτροπη παρατήρηση. 21

44 Έστω ότι έχουμε το παρακάτω σετ δεδομένων που αποτελείται από 20 τιμές μιας εξαρτημένης μεταβλητής y και τις αντίστοιχες 20 μιας επεξηγηματικής x: Παρατήρηση x y 1η η η η η η η η η η η η η η η η η η η η ΠΙΝΑΚΑΣ 2-1 : Πίνακας δεδομένων (x, y). Αν κάνουμε το διάγραμμα διασποράς των παραπάνω δεδομένων θα παρατηρήσουμε ότι η εξαρτημένη μεταβλητή y και η επεξηγηματική x διέπονται από μία γραμμική σχέση, χωρίς να υπάρχει κάποια έκτροπη παρατήρηση. Το σχήμα που προκύπτει είναι χαρακτηρηστικό: 22

45 y ΣΧΉΜΑ 2-1: Διάγραμμα διασποράς των (x, y) χωρίς έκτροπη παρατήρηση. x Στα παραπάνω δεδομένα με τη βοήθεια του στατιστικού πακέτου της R εφαρμόζουμε την ΠΠΣ συγκεκριμένα στο 0.5-ποσοστιαίο σημείο, δηλαδή στη διάμεσο. Επίσης εφαρμόζουμε και την ΚΓΠ που χρησιμοποιεί τη μέθοδο των ελαχίστων τετραγώνων. Τα συγκριτικά αποτελέσματα της μεθόδου της Παλινδρόμησης της Διαμέσου (ΠΔ) με τη μέθοδο της ΚΓΠ δίνονται στον παρακάτω πίνακα: 23

46 ΠΙΝΑΚΑΣ 2-2: Συγκριτικός πίνακας Κλασικής Γραμμικής Παλινδρόμησης και Παλινδρόμησης Διαμέσου για τα δεδομένα (x, y) χωρίς έκτροπη παρατήρηση. Είναι φανερό ότι η παλινδρόμηση με την κλασική μέθοδο των ελαχίστων τετραγώνων μας δίνει παρόμοια αποτελέσματα με την παλινδρόμηση της διαμέσου, αφού οι εκτιμήσεις για τους συντελεστές παλινδρόμησης είναι πολύ κοντά. Επίσης η προσαρμογή του μοντέλου της ΚΓΠ είναι σχεδόν άψογη καθώς ο συντελεστής παλινδρόμησης 2 R είναι 99.5%. Η πολύ καλή προσαρμογή του μοντέλου της ΚΓΠ, καθώς και αυτή του μοντέλου της ΠΔ φαίνονται ξεκάθαρα και στο παρακάτω διάγραμμα με τις προσαρμοσμένες πλέον ευθείες παλινδρόμησης. Η ευθεία της ΚΓΠ είναι η διακεκομμένη, ενώ αυτή της ΠΔ είναι η συνεχής ευθεία. Βλέπουμε ότι για τα δεδομένα χωρίς καμία έκτροπη παρατήρηση οι δύο ευθείες σχεδόν ταυτίζονται και εξηγούν σχεδόν 100% τη γραμμική σχέση των δύο μεταβλητών: 24

47 y ΣΧΉΜΑ 2-2: Διάγραμμα διασποράς των (x, y) χωρίς έκτροπη παρατήρηση με τις προσαρμοσμένες ευθείες παλινδρόμησης. x Έστω τώρα ότι έχουμε πάλι τα δεδομένα του πίνακα 2-1 με τις 20 τιμές της εξαρτημένης μεταβλητής y και τις αντίστοιχες 20 της επεξηγηματικής x με μία όμως αλλαγή: αντί για την τιμή 28 στη 10 η παρατήρηση της μεταβλητής x έχουμε την τιμή 280. Αν κάνουμε το διάγραμμα διασποράς των νέων δεδομένων θα παρατηρήσουμε ότι η εξαρτημένη μεταβλητή y και η επεξηγηματική x διέπονται και πάλι από μία γραμμική σχέση, αλλά υπάρχει πλέον μία έκτροπη παρατήρηση. Το σχήμα που προκύπτει είναι χαρακτηριστικό: 25

48 y ΣΧΉΜΑ 2-3: Διάγραμμα διασποράς των (x, y) με έκτροπη παρατήρηση. x Στα νέα δεδομένα με την παρουσία της έκτροπης παρατήρησης εφαρμόζουμε και πάλι την ΠΠΣ στη διάμεσο καθώς και την ΚΓΠ. Τα συγκριτικά αποτελέσματα των δύο μεθόδων δίνονται στον παρακάτω πίνακα: 26

49 ΠΙΝΑΚΑΣ 2-3: Συγκριτικός πίνακας Κλασικής Γραμμικής Παλινδρόμησης και Παλινδρόμησης Διαμέσου για τα δεδομένα (x, y) με έκτροπη παρατήρηση. Βλέπουμε στον παραπάνω πίνακα ότι τα αποτελέσματα της ΠΔ έχουν παραμείνει σχεδόν αναλλοίωτα. Η εκτίμηση του σταθερού όρου από που ήταν στα δεδομένα χωρίς έκτροπη παρατήρηση έγινε τώρα και είναι και πάλι στατιστικά σημαντική. Επίσης είναι σημαντικός και ο συντελεστής της επεξηγηματικής μεταβλητής x, ο οποίος από 0.32 που εκτιμήθηκε να είναι στα δεδομένα χωρίς έκτροπη παρατήρηση τώρα έγινε Αντίθετα, η έκτροπη παρατήρηση φαίνεται να επηρέασε την εφαρμογή της ΚΓΠ αφού ο πίνακας 2-3 μας οδηγεί σε εντελώς διαφορετικά συμπεράσματα από τον πίνακα 2-2 με τα αντίστοιχα αποτελέσματα της παλινδρόμησης με την κλασική μέθοδο των ελαχίστων τετραγώνων για τα δεδομένα χωρίς την έκτροπη παρατήρηση. Ο σταθερός όρος από που είχε εκτιμηθεί, εκτιμάται πλέον 53.54, ενώ η εκτίμηση του συντελεστή της επεξηγηματικής μεταβλητής x από 0.32 έχει γίνει Επίσης ενώ η προσαρμογή του μοντέλου στα δεδομένα χωρίς την έκτροπη παρατήρηση ήταν απόλυτα ικανοποιητική, στα νέα δεδομένα με την έκτροπη παρατήρηση δεν είναι καθόλου καλή. Ο συντελεστής παλινδρόμησης 2 R από 99.5% είναι πλέον 23.8%. Η πολύ κακή προσαρμογή του μοντέλου της ΚΓΠ, σε συνδυασμό με την σταθερά ικανοποιητική 27

50 προσαρμογή του μοντέλου της ΠΔ φαίνονται ξεκάθαρα και στο παρακάτω διάγραμμα με τις προσαρμοσμένες ευθείες παλινδρόμησης: y ΣΧΉΜΑ 2-4: Διάγραμμα διασποράς των (x, y) με έκτροπη παρατήρηση με τις προσαρμοσμένες ευθείες παλινδρόμησης. Είναι ξεκάθαρο και από το παραπάνω σχήμα ότι η ευθεία της ΚΓΠ έχει επηρεαστεί πολύ από την παρουσία της έκτροπης παρατήρησης και δεν μπορεί να εξηγήσει επαρκώς τη γραμμική σχέση που διέπει τα δεδομένα. Αντίθετα, βλέπουμε ότι η ευθεία της ΠΔ δεν έχει επηρεαστεί σχεδόν καθόλου από την έκτροπη παρατήρηση. Το παραπάνω παράδειγμα αναδεικνύει το πλεονέκτημα της μεθόδου της ΠΠΣ έναντι της κλασικής μεθόδου των ελαχίστων τετραγώνων όσον αφορά την ανθεκτικότητα σε ακραίες τιμές x 28

51 2.3 Δεδομένα του Engel (1857) Το 1857 στο Βέλγιο ο Engel έκανε μία έρευνα για να αναλύσει τη σχέση μεταξύ των εξόδων ενός νοικοκυριού για τρόφιμα και του εισοδήματός του. Χρησιμοποίησε δεδομένα από 235 νοικοκυριά της εργατικής τάξης και θεώρησε ότι το εισόδημα ενός νοικοκυριού αποτελεί επεξηγηματική μεταβλητή για τα έξοδα για τρόφιμα, που είναι η εξαρτημένη μεταβλητή. Τα δεδομένα του Engel υπάρχουν στη βιβλιοθήκη της R στο πακέτο quantreg. Μπορεί κανένας να τα δει απλά πλήκτρολογώντας τις εντολές: > data(engel) > engel εφόσον έχει εγκαταστήσει και ενεργοποιήσει το πακέτο quantreg (βλ. Παράρτημα Α). Στα δεδομένα αυτά μπορούμε να εφαρμόσουμε τη μέθοδο της ΠΠΣ καθώς και την κλασική μέθοδο των ελαχίστων τετραγώνων και να βγάλουμε χρήσιμα συμπεράσματα. Παρακάτω βλέπουμε οπτικοποιημένα τα αποτελέσματα της εφαρμογής της ΠΠΣ και της ΚΓΠ, αφού έχουμε τις αντίστοιχες προσαρμοσμένες ευθείες στο διάγραμμα διασποράς με τα δεδομένα του Engel. Η ευθεία της ΚΓΠ είναι η διακεκομμένη, ενώ η ευθεία της ΠΔ είναι η συνεχής. Οι υπόλοιπες έξι ευθείες χρώματος γκρι είναι οι προσαρμοσμένες ευθείες παλινδρόμησης για τα ποσοστιαία σημεία με τ = 0.05, 0.1, 0.25, 0.75, 0.9, 0.95 αντίστοιχα από την ευθεία με τη μικρότερη κλίση μέχρι την ευθεία με τη μεγαλύτερη κλίση: 29

52 Food Expendture Household Income ΣΧΉΜΑ 2-5: Διάγραμμα διασποράς των δεδομένων του Engel με τις προσαρμοσμένες ευθείες παλινδρόμησης. Από το διάγραμμα αυτό φαίνεται καθαρά η αυξητική τάση της διασποράς των εξόδων για τρόφιμα καθώς αυξάνεται το εισόδημα του νοικοκυριού (ετεροσχεδαστικότητα). Τα διαστήματα μεταξύ των προσαρμοσμένων ευθειών της ΠΠΣ δείχνουν ότι η δεσμευμένη κατανομή της μεταβλητής των εξόδων για τρόφιμα είναι λοξή προς τα αριστερά: τα στενότερα διαστήματα των ευθειών των ανώτερων ποσοστιαίων σημείων δηλώνουν μεγάλη πυκνότητα στην πάνω «ουρά» της κατανομής, ενώ τα πλατύτερα διαστήματα των ευθειών των κατώτερων ποσοστιαίων σημείων δηλώνουν μικρή πυκνότητα στην κάτω «ουρά» της κατανομής. Όσον αφορά τις προσαρμογές των 30

53 ευθειών της διαμέσου και της ΚΓΠ, βλέπουμε ότι σε αυτό το παράδειγμα αυτές είναι αρκετά διαφορετικές. Αυτό εξηγείται από την ασυμμετρία της δεσμευμένης πυκνότητας που περιγράψαμε παραπάνω, καθώς και από τις δύο ακραίες τιμές που παρατηρούνται στο δείγμα και φαίνονται στο παραπάνω διάγραμμα. Είχαμε δηλαδή δύο νοικοκυριά με σχετικά χαμηλά έξοδα για τρόφιμα και υψηλό εισόδημα, που επηρέασαν την ευθεία της ΚΓΠ «τραβώντας» την προς τα κάτω αλλά άφησαν σχεδόν ανεπηρέαστες τις ευθείες της ΠΠΣ. Αυτό το χαρακτηριστικό της έλλειψης ανθεκτικότητας της ΚΓΠ έχει ως συνέπεια η συγκεκριμένη μέθοδος να μας δίνει μία φτωχή εκτίμηση της δεσμευμένης μέσης τιμής για τα φτωχότερα νοικοκυριά του δείγματος, μιας και η αντίστοιχη ευθεία περνάει πάνω από τη συντριπτική πλειοψηφεία των παρατηρήσεων με πολύ χαμηλή τιμή στη μεταβλητή του εισοδήματος. Παρακάτω παριστάνονται οι εκτιμήσεις της ΠΠΣ με ένα 90% διάστημα εμπιστοσύνης για τον σταθερό όρο και το συντελεστή της επεξηγηματικής μεταβλητής, δηλαδή του εισοδήματος του νοικοκυριού: ooo o oo o o oo ooo ooo oooo ooo oooooo oo o oooooo (Intercept) ooooo ooooo oo oo o oo oooooo o ooooooo o ooooo oooooo oo o ooo o ooo o ooo o o o o o oooo o ooooo oo oooooo o oo oooooo o ooooooo oo o xx oo o oooooo oo oooo oooo ooooo oo o oo o o o oo oo ooo oo o ooooo oooooo o o o ΣΧΉΜΑ 2-6: Παλινδρόμηση Ποσοστιαίων Σημείων για τα δεδομένα του Engel. 31

54 Στα παραπάνω διαγράμματα η μεταβλητή του εισοδήματος του νοικοκυριού είναι κεντραρισμένη στη μέση τιμή της, επομένως στο διάγραμμα με το σταθερό όρο παριστάνονται οι εκτιμήσεις της ΠΠΣ για τα έξοδα για τρόφιμα ενός νοικοκυριού με μέσο εισόδημα. Στο δεύτερο διάγραμμα με τις εκτιμήσεις για το συντελεστή της επεξηγηματικής μεταβλητής φαίνεται ότι το εισόδημα του νοικοκυριού επηρεάζει περισσότερο τα έξοδα για τρόφιμα στα ανώτερα ποσοστιαία σημεία και λιγότερο στα χαμηλότερα. Τέλος ενδιαφέρον παρουσιάζουν και τα παρακάτω δύο διαγράμματα, όπου παριστάνονται η εκτιμώμενη συνάρτηση παλινδρόμησης ποσοστιαίων σημείων και η αντίστοιχη εκτιμώμενη εμπειρική συνάρτηση πυκνότητας για τα σχετικά φτωχά νοικοκυριά με εισόδημα Βελγικά φράγκα (0.1-ποσοστιαίο σημείο) και τα σχετικά πλούσια με εισόδημα Βελγικά φράγκα (0.9-ποσοστιαίο σημείο). Τα φτωχά νοικοκυριά παριστάνονται με τη μαύρη γραμμή και τα πλούσια με τη γκρι: ΣΧΉΜΑ 2-7: Συνάρτηση παλινδρόμησης ποσοστιαίων σημείων και εμπειρική συνάρτηση πυκνότητας για τα 0.1 και 0.9 ποσοστιαία σημεία των δεδομένων του Engel. 32

55 2.4 Βάρος νεογέννητων (Abreveya 2001) Στο παράδειγμα αυτό θα δούμε μία επέκταση της έρευνας του Abreveya για την επίδραση διάφορων δημογραφικών και κοινωνικών χαρακτηριστικών της μητέρας στα βάρη των νεογέννητων στις Η.Π.Α.. Το χαμηλό βάρος γέννας είναι συνδεδεμένο με μία σειρά άλλων προβλημάτων υγείας που ακολουθούν. Για το λόγο αυτόν έχει δοθεί ιδιαίτερο ενδιαφέρον στους παράγοντες που επηρεάζουν το βάρος γέννας με σκοπό να μειωθεί η συχνότητα των νεογέννητων χαμηλού βάρους. Στο μεγαλύτερο μέρος της ανάλυσης το προβλήματος έχει χρησιμοποιηθεί η ΚΓΠ, με τη χρήση της μεθόδου ελαχίστων τετραγώνων. Παρόλα αυτά έχει διαπιστωθεί ότι οι εκτιμήσεις των διαφόρων επιδράσεων στη δεσμευμένη μέση τιμή της εξαρτημένης μεταβλητής, που στην περίπτωσή μας είναι το βάρος γέννας, δεν ήταν πάντα ενδεικτικές του μεγέθους και της φύσης των επιδράσεων αυτών στα χαμηλότερα ποσοστιαία σημεία της εν λόγω μεταβλητής. Στην προσπάθεια να επικεντρωθεί η ανάλυση στη συγκεκριμένη περιοχή της κατανομής χρήσιμη ήταν η συμβολή της μεθόδου της ΠΠΣ. Έχοντας εκτιμήσει, λοιπόν, μία οικογένεια δεσμευμένων συναρτήσεων ποσοστιαίων σημείων, δόθηκε μία πιο πλήρη εικόνα των επιδράσεων των επεξηγηματικών μεταβλητών. Το δείγμα της μελέτης προήλθε από μητέρες εγγεγραμμένες ως λευκές ή έγχρωμες, μεταξύ 18 και 45 ετών που κατοικούσαν στις Η.Π.Α.. Το μέγεθος του δείγματος ήταν νεογέννητα. Όπως είπαμε η εξαρτημένη μεταβλητή ήταν το βάρος γέννας ενώ οι επεξηγηματικές μεταβλητές ήταν οι παρακάτω: Η εκπαίδευση της μητέρας (κατηγορική), που χωρίστηκε σε τέσσερις κατηγορίες: «κάτω από λύκειο» «λύκειο» «πάνω από λύκειο» ( some college ) «απόφοιτος πανεπιστημίου» 33

56 Η κατηγορία που παραλήφθηκε ήταν η «κάτω από λύκειο», γι αυτό και οι συντελεστές ερμηνεύτηκαν σε σχέση με αυτήν την κατηγορία. Η ιατρική περίθαλψη της μητέρας πριν από τη γέννα (κατηγορική), που χωρίστηκε σε τέσσερις κατηγορίες: «καμία επίσκεψη πριν τη γέννα» «η πρώτη επίσκεψη πριν τη γέννα στο πρώτο τρίμηνο της εγκυμοσύνης» «η πρώτη επίσκεψη πριν τη γέννα στο δεύτερο τρίμηνο της εγκυμοσύνης» «η πρώτη επίσκεψη πριν τη γέννα στο τελευταίο τρίμηνο της εγκυμοσύνης» Η κατηγορία που παραλήφθηκε ήταν η «η πρώτη επίσκεψη πριν τη γέννα στο πρώτο τρίμηνο της εγκυμοσύνης». Το φύλο του νεογέννητου (κατηγορική): «αγόρι» «κορίτσι» Η οικογενειακή κατάσταση της μητέρας (κατηγορική). «παντρεμένη» «ανύπαντρη» Η ηλικία της μητέρας (συνεχής). Το τετράγωνο της ηλικίας της μητέρας (συνεχής). Αν η μητέρα ήταν καπνίστρια ή όχι (κατηγορική). «καπνίστρια» «μη καπνίστρια» Ο αριθμός των τσιγάρων που κάπνιζε ανά ημέρα (συνεχής). 34

57 Τα κιλά που πήρε κατά την εγκυμοσύνη (συνεχής). Το τετράγωνο των κιλών που πήρε κατά την εγκυμοσύνη (συνεχής). Τα παρακάτω σχήμα μας δίνει οπτικοποιημένα όλα τα αποτελέσματα της εφαρμογής της μεθόδου της ΠΠΣ στα δεδομένα: 35

58 ΣΧΉΜΑ 2-8: Παλινδρόμηση Ποσοστιαίων Σημείων για το βάρος γέννας. (Πηγή: Koenker, Hallock, 2001) Σε κάθε ένα από τα παραπάνω διαγράμματα παριστάνεται ο συντελεστής ΠΠΣ για την αντίστοιχη επεξηγηματική μεταβλητή. Η έντονη γραμμή είναι η γραμμή των εκτιμήσεων ( τ ) ˆ με j=1,2,,16 για τα διάφορα ποσοστιαία σημεία τ, όπως φαίνονται β j στον οριζόντιο άξονα, ενώ η γκρίζα περιοχή πάνω και κάτω από τη γραμμή αυτή παριστάνει ένα 90% διάστημα εμπιστοσύνης για τις σημειακές αυτές εκτιμήσεις. Η διακεκομμένη γραμμή σε κάθε διάγραμμα μας δείχνει την εκτίμηση της μέσης επίδρασης της επεξηγηματικής μεταβλητής με την κλασική μέθοδο των ελαχίστων τετραγώνων ενώ οι δύο παράλληλες γραμμές που βρίσκονται πάνω και κάτω από τη γραμμή της μέσης επίδρασης μας δίνουν αντίστοιχα το πάνω και το κάτω άκρο ενός 90% διαστήματος εμπιστοσύνης για την εκτίμηση αυτή. Τέλος, σε κάποια διαγράμματα υπάρχει μία 36

59 οριζόντια ευθεία γραμμή που μας δείχνει σε ποιο σημείο η γραμμή των εκτιμήσεων περνάει από το 0. Ο συντελεστής παλινδρόμησης σε ένα δοθέν ποσοστιαίο σημείο δείχνει την επίδραση που έχει στο βάρος γέννας η αλλαγή μίας μονάδας της αντίστοιχης επεξηγηματικής μεταβλητής, θεωρώντας ότι οι υπόλοιπες παραμένουν σταθερές. Στο πρώτο διάγραμμα του σχήματος ο σταθερός όρος του μοντέλου (ntercept) μπορεί να ερμηνευτεί ως το εκτιμώμενο δεσμευμένο ποσοστιαίο σημείο της κατανομής της μεταβλητής του βάρους γέννας ενός κοριτσιού που γεννήθηκε από ανύπαντρη, λευκή μητέρα, με μόρφωση μικρότερη από λύκειο, είναι 27 ετών, κατά την εγκυμοσύνη της πήρε 13 κιλά, δεν κάπνιζε και η πρώτη της επίσκεψη στο γιατρό ήταν στο πρώτο τρίμηνο της εγκυμοσύνης. Η ηλικία της μητέρας και τα κιλά που πήρε κατά τη διάρκεια της εγκυμοσύνης της έχουν επιλεγεί να παίρνουν τη μέση τιμή των αντίστοιχων μεταβλητών στο δείγμα. Από το δεύτερο διάγραμμα βλέπουμε ότι σύμφωνα με την εκτίμηση της μέσης επίδρασης με τη μέθοδο των ελαχίστων τετραγώνων τα αγόρια που γεννιούνται είναι περίπου 110 γραμμάρια βαρύτερα από τα κορίτσια. Είναι όμως φανερό από τα αποτελέσματα της ΠΠΣ ότι η διαφορά αυτή είναι πολύ μικρότερη στα χαμηλότερα ποσοστιαία σημεία της κατανομής και κάπως μεγαλύτερη από 110 γραμμάρια στα ανώτερα ποσοστιαία σημεία της κατανομής. Για παράδειγμα τα νεογέννητα αγόρια είναι 45 γραμμάρια βαρύτερα από τα κορίτσια στο 0.05-ποσοστιαίο σημείο, ενώ είναι περίπου 130 γραμμάρια βαρύτερα στο 0.95-ποσοστιαίο σημείο. Γενικότερα σε κάθε ποσοστιαίο σημείο φαίνεται από το διάγραμμα ποια είναι η διαφορά μεταξύ αγοριών και κοριτσιών όσον αφορά το βάρος τους, δεδομένου ότι οι υπόλοιπες επεξηγηματικές μεταβλητές παραμένουν σταθερές. Είναι επίσης φανερό ότι το διάστημα εμπιστοσύνης για τη μέση επίδραση δεν αναπαριστά το πραγματικό εύρος αυτών των διαφορών. Στο τρίτο διάγραμμα βλέπουμε ότι αν η μητέρα είναι παντρεμένη, φαίνεται να υπάρχει μία θετική επίδραση στο βάρος του νεογέννητού της κυρίως στα χαμηλά ποσοστιαία σημεία της κατανομής. Και σε αυτή την περίπτωση το διάστημα εμπιστοσύνης για τη μέση επίδραση δεν δείχνει την πραγματική εικόνα όλου του εύρους της κατανομής. 37

60 Στο τέταρτο διάγραμμα παρατηρούμε ότι τα βάρη των νεογέννητων από μαύρες μητέρες είναι πολύ διαφορετικά από τα αντίστοιχα από λευκές μητέρες, κυρίως στα χαμηλά ποσοστιαία σημεία της κατανομής του βάρους της γέννας. Ενδεικτικά, η διαφορά στα βάρη γέννας μεταξύ ενός νεογέννητου από μαύρη μητέρα και ενός άλλου από λευκή μητέρα στο 0.05-ποσοστιαίο σημείο είναι περίπου το 1/3 του κιλού υπέρ του νεογέννητου από λευκή μητέρα. Και πάλι το διάστημα εμπιστοσύνης για τη μέση επίδραση δεν είναι αντιπροσωπευτικό. Στα επόμενα δύο διαγράμματα έχουμε δύο συνεχείς μεταβλητές, την ηλικία της μητέρας και το τετράγωνό της. Αυτό που έχουμε να παρατηρήσουμε είναι ότι στα πολύ χαμηλά ποσοστιαία σημεία η ηλικία της μητέρας έχει μεγαλύτερη επίδραση στο βάρος του νεογέννητου σε σχέση με τα υπόλοιπα ποσοστιαία σημεία. Τα τρία διαγράμματα που ακολουθούν μας δείχνουν τις επιδράσεις του παράγοντα της εκπαίδευσης της μητέρας. Η εκπαίδευση που φτάνει μέχρι την αποφοίτηση από το λύκειο έχει μία αρκετά ομοιόμορφη επίδραση σε όλο το εύρος της κατανομής γύρω στα +15 γραμμάρια. Δηλαδή οι μητέρες που έχουν τελειώσει το λύκειο γεννούν περίπου 15 γραμμάρια βαρύτερα νεογέννητα σε σχέση με αυτές που δεν έχουν τελειώσει το λύκειο. Στη συνέχεια βλέπουμε ότι οι μητέρες που έχουν κάποια εκπαίδευση άνω του λυκείου έχουν θετική επίδραση στο βάρος γέννας κυρίως στα χαμηλότερα ποσοστιαία σημεία της κατανομής. Η επίδραση αυτής της κατηγορίας ποικίλει από 35 γραμμάρια στα χαμηλά ποσοστιαία σημεία σε 25 γραμμάρια στα ανώτερα ποσοστιαία σημεία. Στα δύο τελευταία αυτά διαγράμματα τα διαστήματα εμπιστοσύνης για τις μέσες επιδράσεις είναι αντιπροσωπευτικά για το εύρος της κατανομής, κάτι που δεν ισχύει στο διάγραμμα της επίδρασης της πανεπιστημιακής εκπαίδευσης της μητέρας. Το πτυχίο πανεπιστημίου έχει μία πολύ θετική επίδραση στα χαμηλά ποσοστιαία σημεία, άλλα όσο προχωράμε στα ανώτερα ποσοστιαία σημεία της κατανομής η επίδραση αυτή όλο και μειώνεται. Παρακάτω έχουμε την επίδραση της ιατρικής περίθαλψης της μητέρας κατά τη διάρκεια της εγκυμοσύνης. Τα νεογέννητα από μητέρες που δεν έκαναν καμία επίσκεψη στο γιατρό πριν τη γέννα βρέθηκαν να είναι περίπου 150 γραμμάρια ελαφρύτερα από εκείνα που γεννήθηκαν από μητέρες που έκαναν την πρώτη τους επίσκεψη στο πρώτο τρίμηνο της εγκυμοσύνης. Στα χαμηλότερα ποσοστιαία σημεία της κατανομής η 38

61 επίδραση αυτή είναι αρκετά μεγαλύτερη. Μάλιστα στο 0.05-ποσοστιαίο σημείο τα νεογέννητα αυτά είναι περίπου μισό κιλό ελαφρύτερα. Αντίθετα, οι μητέρες που ακύρωσαν τις επισκέψεις μέχρι το δεύτερο ή το τρίτο τρίμηνο στα χαμηλά ποσοστιαία σημεία της κατανομής γεννούν βαρύτερα μωρά από τις μητέρες που έκαναν την πρώτη τους επίσκεψη στο πρώτο τρίμηνο. Το τελευταίο αυτό αποτέλεσμα είναι σίγουρα αρκετά απρόσμενο, αλλά ίσως ερμηνεύεται από το γεγονός η επιλογή της επίσκεψης ανήκει στην ίδια τη μητέρα και οι μητέρες αυτές αισθάνονταν σίγουρες για το αποτέλεσμα της γέννας τους, ακυρώνοντας τις πρώτες επισκέψεις. Πάντως, αξίζει να σημειωθεί ότι στα πάνω 3/4 της κατανομής οι αντίστοιχες επιδράσεις δεν είναι σημαντικές. Όσον αφορά το κάπνισμα από τα αντίστοιχα διαγράμματα βλέπουμε ότι η επίδρασή του στο βάρος των νεογέννητων είναι σταθερά αρνητική σε όλο το εύρος της κατανομής. Οι μητέρες που καπνίζουν γεννούν ελαφρύτερα νεογέννητα κατά μέσο όρο 175 γραμμάρια. Στη συνέχεια βλέπουμε την επίδραση των τσιγάρων που καπνίζει η μητέρα την ημέρα. Εδώ υπάρχει μία αρνητική επίδραση γύρω στα 4 με 5 γραμμάρια ανά τσιγάρο την ημέρα σε όλο το εύρος της κατανομής. Δηλαδή μία μητέρα που καπνίζει ένα πακέτο την ημέρα εμφανίζεται να έχει ως αποτέλεσμα ένα νεογέννητο περίπου 80 με 100 γραμμάρια ελαφρύτερο σε σχέση με μία μη καπνίστρια. Τα παραπάνω συμπεράσματα ισχύουν για όλο το εύρος της κατανομής, κάτι που φαίνεται και από το γεγονός ότι στα αντίστοιχα διαγράμματα για το κάπνισμα η οριζόντια γραμμή της μέσης επίδρασης που προκύπτει από την ΚΓΠ είναι σχεδόν όλη καλυμμένη από το 90% σκιασμένο διάστημα εμπιστοσύνης της ΠΠΣ. Τέλος μελετάται η επίδραση στο βάρος του νεογέννητου της συνεχούς μεταβλητής του βάρους που πήρε η μητέρα κατά την εγκυμοσύνη της. Όπως θα περίμενε κανείς, ο παράγοντας αυτός βρέθηκε να έχει πολύ ισχυρή ανάλογη επίδραση στην εξαρτημένη μεταβλητή, γεγονός που φαίνεται και από τα πολύ στενά διαστήματα εμπιστοσύνης τόσο της ΚΓΠ όσο και της ΠΠΣ. Και πάλι στα χαμηλότερα ποσοστιαία σημεία έχουμε μεγαλύτερη επίδραση του παράγοντα σε σχέση με τα ανώτερα ποσοστιαία σημεία. Από το τελευταίο διάγραμμα του τετραγώνου της παραπάνω μεταβλητής φαίνεται πόσο παραπλανητικά μπορούν να είναι τα αποτελέσματα της ΚΓΠ. Η εκτίμηση της ΚΓΠ δείχνει ότι η επίδραση του τετραγώνου του βάρους που πήρε η μητέρα κατά την 39

62 εγκυμοσύνη δεν είναι σημαντική, δηλαδή υπάρχει μόνο γραμμική επίδραση. Αντίθετα οι εκτιμήσεις της ΠΠΣ δίνουν μία εντελώς διαφορετική εικόνα, όπου η τετραγωνική επίδραση είναι αρκετά σημαντική σε όλο το εύρος της κατανομής εκτός από το σημείο που η αντίστοιχη γραμμή των εκτιμήσεων διέρχεται από το 0, δηλαδή το ποσοστιαίο σημείο τ= Βουλευτικές εκλογές (Ελλάδα, Μάρτιος 2004) Στην εφαρμογή αυτή χρησιμοποιούμε ένα σετ δεδομένων με τις ψήφους που πήρε κάθε κόμμα σε 47 εκλογικά τμήματα του δήμου Αγίων Αναργύρων στις τελευταίες Ελληνικές βουλευτικές εκλογές της 7 ης Μαρτίου του 2004 (βλ. Παράρτημα). Επιλέξαμε να εξετάσουμε τη σχέση που υπάρχει μεταξύ των ψήφων των κομμάτων που χαρακτηρίζονται ως «αριστερά» και των ψήφων του ΠΑ.ΣΟ.Κ. Συγκεκριμένα μέσω της μεθόδου της ΠΠΣ, όπως θα δούμε παρακάτω μελετήσαμε τον τρόπο που το σύνολο των ψήφων της αριστεράς επηρεάζει όχι μόνο τη μέση τιμή, αλλά όλο το φάσμα της κατανομής των ψήφων που παίρνει το ΠΑ.ΣΟ.Κ. Έτσι ως εξαρτημένη μεταβλητή έχουμε θεωρήσει τις ψήφους του ΠΑ.ΣΟ.Κ. σε κάθε εκλογικό τμήμα και ως μοναδική επεξηγηματική μεταβλητή έχουμε θεωρήσει το σύνολο των ψήφων του Συνασπισμού, του Κ.Κ.Ε. και του ΔΗ.Κ.ΚΙ. σε κάθε εκλογικό τμήμα. Αρχικά ας δούμε τον πίνακα με τα περιγραφικά στατιστικά των δύο μεταβλητών: Descrptve Statstcs pasok arstera Mean Medan Standard Devaton ,83 Sample Varance Range Mnmum Maxmum ΠΙΝΑΚΑΣ 2-4: Πίνακας περιγραφικών στατιστικών για τα δεδομένα των βουλευτικών εκλογών. 40

63 Το διάγραμμα διασποράς των δύο μεταβλητών είναι το παρακάτω: pasok kommata_arsteras ΣΧΉΜΑ 2-9: Διάγραμμα διασποράς των ψήφων ΠΑ.ΣΟ.Κ. με τις ψήφους της αριστεράς. Το παραπάνω σχήμα δε μας δίνει πολύ σαφή εικόνα, αν και φαίνεται ότι η εφαρμογή της ΚΓΠ δε θα μας δώσει αξιόπιστα αποτελέσματα λόγω της ετεροσχεδαστικότητας που παρατηρείται. Αντίθετα, όπως έχουμε πει, η ΠΠΣ σε τέτοια δεδομένα είναι πιο χρήσιμη. Πράγματι, η εφαρμογή της ΚΓΠ μας δίνει τα παρακάτω αποτελέσματα: ΠΙΝΑΚΑΣ 2-5: Πίνακας Κλασικής Γραμμικής Παλινδρόμησης για τα δεδομένα των βουλευτικών εκλογών. 41

64 Από τον παρακάτω πίνακα βλέπουμε ότι η προσαρμογή του μοντέλου της ΚΓΠ είναι πολύ κακή αφού ο συντελεστής παλινδρόμησης 2 R είναι μόλις 16.98%. Αυτό εξάλλου φαίνεται και από την προσαρμογή της ευθείας παλινδρόμησης, που όπως αναμενόταν, λόγω της διασποράς των δεδομένων, δεν είναι καθόλου καλή: pasok kommata_arsteras ΣΧΉΜΑ 2-10: Διάγραμμα διασποράς των ψήφων ΠΑ.ΣΟ.Κ. με τις ψήφους της αριστεράς με την προσαρμοσμένη ευθεία ΚΓΠ. Είναι φανερή και από το παραπάνω σχήμα η ασυμμετρία της δεσμευμένης πυκνότητας της εξαρτημένης μεταβλητής, που είναι οι ψήφοι του ΠΑ.ΣΟ.Κ. Φαίνεται ότι υπάρχει μία αυξητική τάση της διασποράς των ψήφων του ΠΑ.ΣΟ.Κ. καθώς αυξάνονται οι ψήφοι της αριστεράς. Την κατάσταση αυτή μπορεί να περιγράψει καλύτερα, όπως είπαμε, η εφαρμογή της μεθόδου της ΠΠΣ. Με τη βοήθεια του στατιστικού πακέτου της R, εφαρμόζουμε την ΠΠΣ για τα ποσοστιαία σημεία με τ = 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95 και παίρνουμε το νέο 42

65 διάγραμμα διασποράς με τις αντίστοιχες ευθείες παλινδρόμησης για τα παραπάνω ποσοστιαία σημεία, καθώς και τον πίνακα με αποτελέσματα των παλινδρομήσεων αυτών. Στο παρακάτω σχήμα η ευθεία της ΚΓΠ είναι η διακεκομμένη, ενώ η ευθεία της ΠΔ είναι η συνεχής. Οι υπόλοιπες έξι ευθείες χρώματος γκρι είναι οι προσαρμοσμένες ευθείες παλινδρόμησης για τα ποσοστιαία σημεία με τ = 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95 αντίστοιχα από κάτω προς τα πάνω: pasok kommata_arsteras ΣΧΉΜΑ 2-11: Διάγραμμα διασποράς των ψήφων ΠΑ.ΣΟ.Κ. με τις ψήφους της αριστεράς με τις προσαρμοσμένες ευθείες ΚΓΠ και ΠΠΣ για τ = 0.05, 0.1, 0.25, 0.5, 0.75, 0.9,

66 ΠΙΝΑΚΑΣ 2-6: Πίνακας Παλινδρόμησης Ποσοστιαίων Σημείων για τ = 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95 για τα δεδομένα των βουλευτικών εκλογών. Από τον παραπάνω πίνακα μπορούμε πλέον να βγάλουμε κάποια χρήσιμα συμπεράσματα για την αποτελεσματικότητα της χρήσης της ΠΠΣ στα δεδομένα μας. Ο εκτιμώμενος σταθερός όρος του μοντέλου β ˆ QR 0, αν και στατιστικά σημαντικός στα ποσοστιαία σημεία που έχουμε επιλέξει, στο παράδειγμά μας δεν έχει κάποια ποιοτική σημασία αφού δηλώνει το πως συμπεριφέρεται το εκάστοτε ποσοστιαίο σημείο της κατανομής των ψήφων του ΠΑ.ΣΟ.Κ. όταν δεν υπάρχει κανένας ψηφοφόρος των τριών κομμάτων της αριστεράς, ενδεχόμενο το οποίο είναι μη ρεαλιστικό. Επομένως θα επικεντρωθούμε στην ερμηνεία του εκτιμώμενου συντελεστή που δείχνει την επιρροή του αριθμού των ψήφων της αριστεράς στον αριθμό των ψήφων β ˆ QR 1 44

ΠΡΟΒΛΕΨΗ ΑΦΕΡΕΓΓΥΟΤΗΤΑΣ Η ΝΟΡΜΑ ΤΟΥ ΑΣΦΑΛΙΣΤΙΚΟΥ ΚΛΑΔΟΥ ΓΙΑ ΥΓΙΕΙΣ ΕΤΑΙΡΙΕΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΦΕΡΕΓΓΥΟΤΗΤΑΣ ΙΙ

ΠΡΟΒΛΕΨΗ ΑΦΕΡΕΓΓΥΟΤΗΤΑΣ Η ΝΟΡΜΑ ΤΟΥ ΑΣΦΑΛΙΣΤΙΚΟΥ ΚΛΑΔΟΥ ΓΙΑ ΥΓΙΕΙΣ ΕΤΑΙΡΙΕΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΦΕΡΕΓΓΥΟΤΗΤΑΣ ΙΙ Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 20 ου Πανελληνίου Συνεδρίου Στατιστικής (2007), σελ 355-362 ΠΡΟΒΛΕΨΗ ΑΦΕΡΕΓΓΥΟΤΗΤΑΣ Η ΝΟΡΜΑ ΤΟΥ ΑΣΦΑΛΙΣΤΙΚΟΥ ΚΛΑΔΟΥ ΓΙΑ ΥΓΙΕΙΣ ΕΤΑΙΡΙΕΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΦΕΡΕΓΓΥΟΤΗΤΑΣ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση I

Απλή Γραμμική Παλινδρόμηση I Απλή Γραμμική Παλινδρόμηση I. Εισαγωγή Έστω ότι θέλουμε να ερευνήσουμε εμπειρικά τη σχέση που υπάρχει ανάμεσα στις δαπάνες κατανάλωσης και στο διαθέσιμο εισόδημα, των οικογενειών. Σύμφωνα με την Κεϋνσιανή

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

Y Y ... y nx1. nx1

Y Y ... y nx1. nx1 6 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ ΤΗ ΧΡΗΣΗ ΠΙΚΑΚΩΝ Η χρησιμοποίηση και ο συμβολισμός πινάκων απλοποιεί σημαντικά τα αποτελέσματα της γραμμικής παλινδρόμησης, ιδίως στην περίπτωση της πολλαπλής παλινδρόμησης Γενικά,

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Ανάλυση εισοδήματος των μισθωτών και παράγοντες που το επηρεάζουν

Ανάλυση εισοδήματος των μισθωτών και παράγοντες που το επηρεάζουν Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Π Ε Ι Ρ Α Ι Ω Σ ΤΜΗΜΑ Σ Τ Α Τ Ι Σ Τ Ι Κ Η Σ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ Ε Π Ι Σ Τ Η Μ Η Σ Μ Ε Τ Α Π Τ Υ Χ Ι Α Κ Ο ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ Ε Φ Α Ρ Μ Ο Σ Μ Ε Ν Η Σ Τ Α Τ Ι Σ Τ Ι Κ Η Ανάλυση εισοδήματος

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος. ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΣΥΛΛΟΓΗ ΑΣΚΗΣΕΩΝ ου ΚΕΦΑΛΑΙΟΥ Άσκηση 1 (Προτάθηκε από Χρήστο Κανάβη) Έστω CV 0.4 όπου CV ο συντελεστής μεταβολής, και η τυπική απόκλιση s = 0. ενός δείγματος που έχει την ίδια

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Εισαγωγή στην Κανονική Κατανομή Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Ένα πρόβλημα Πρόβλημα: Ένας μαθητής είχε επίδοση στο τεστ Μαθηματικών 18 και στο τεστ

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές Εαρινό εξάμηνο 2018-2019 μήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική Παπάνα Μεταδιδακτορική Ερευνήτρια Πολυτεχνική σχολή, Α.Π.Θ. & Οικονομικό μήμα, Πανεπιστήμιο

Διαβάστε περισσότερα

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι)

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΟΙΚΟΝΟΜΕΤΡΙΑ (Ι) ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΕΝΔΥΣΕΙΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗ ΑΝΑΠΤΥΞΗ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΑΓΩΓΙΚΗ

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΝΕΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΥΠΑΡΞΗ ΕΚΤΙΜΗΤΩΝ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ 3-ΠΑΡΑΜΕΤΡΙΚΗ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ

ΝΕΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΥΠΑΡΞΗ ΕΚΤΙΜΗΤΩΝ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ 3-ΠΑΡΑΜΕΤΡΙΚΗ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά ου Πανελληνίου Συνεδρίου Στατιστικής 008, σελ 9-98 ΝΕΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΥΠΑΡΞΗ ΕΚΤΙΜΗΤΩΝ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ 3-ΠΑΡΑΜΕΤΡΙΚΗ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ Γεώργιος

Διαβάστε περισσότερα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα Δύο κύριοι τρόποι παρουσίασης δεδομένων Παράδειγμα Με πίνακες Με διαγράμματα Ονομαστικά δεδομένα Εδώ τα περιγραφικά μέτρα (μέσος, διάμεσος κλπ ) δεν έχουν νόημα Πήραμε ένα δείγμα από 25 άτομα και τα ρωτήσαμε

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Εισαγωγή στην Γραμμική Παλινδρόμηση

Εισαγωγή στην Γραμμική Παλινδρόμηση ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 13-11-015 Εισαγωγή στην Γραμμική Παλινδρόμηση Γραμμική σχέση μεταξύ μεταβλητών Αν. Καθ. Μαρί-Νοέλ Ντυκέν Στόχος Πολύ συχνά, η Τ.Μ. που εξετάζουμε π.χ. η κατανάλωση των νοικοκυριών

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Το διάστημα εμπιστοσύνης είναι ένα διάστημα αριθμών

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) Α. Ερωτήσεις πολλαπλών επιλογών.(11 βαθµοί) (1:3 βαθµοί, 2-9:8 βαθµοί) 1. ίνεται ο πίνακας: Χ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΜΣ στη «Ναυτιλία» Τμήμα Β Part tme Χαράλαμπος Ευαγγελάρας hevangel@unp.gr Έλεγχοι υποθέσεων Εισαγωγή Έστω ότι ασχολούμαστε με ένα χαρακτηριστικό, το οποίο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ 1 ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ 1. Ποιες μεταβλητές λέγονται ποσοτικές; (ΓΕΛ 2005) 2. Πότε μια ποσοτική μεταβλητή ονομάζεται διακριτή και πότε συνεχής; (ΓΕΛ 2005,2014) 3. Τι ονοµάζεται απόλυτη

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ. ΛΥΚΕΙΟΥ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΨΗΣ - ΘΕΜΑ Ο Έστω η συνάρτηση f( ) =, 0 ) Να αποδείξετε ότι f ( ). f( ) =. ) Να υπολογίσετε το όριο lm f ( )+ 4. ) Να βρείτε την εξίσωση της εφαπτομένης

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 6.1 Ετεροσκεδαστικότητα: Εισαγωγή Συχνά, η υπόθεση της σταθερής διακύμανσης των όρων σφάλματος,

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.outras@e.aegea.gr Τηλ: 7035468 Μέθοδος Υπολογισμού

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

3.7 Παραδείγματα Μεθόδου Simplex

3.7 Παραδείγματα Μεθόδου Simplex 3.7 Παραδείγματα Μεθόδου Simplex Παράδειγμα 1ο (Παράδειγμα 1ο - Κεφάλαιο 2ο - σελ. 10): Το πρόβλημα εκφράζεται από το μαθηματικό μοντέλο: max z = 600x T + 250x K + 750x Γ + 450x B 5x T + x K + 9x Γ + 12x

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 4 Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson Σχεδιαζόντας ταξινομητές: Τα δεδομένα Στην πράξη η γνώση σχετικά διαδικασία γέννεσης των δεδομένων είναι πολύ σπάνια γνωστή. Το μόνο που έχουμε στη διάθεσή

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011 Εργαστήριο Μαθηματικών & Στατιστικής Γραπτή Εξέταση Περιόδου Φεβρουαρίου για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 5//. [] Η ποσότητα, έστω Χ, ενός συντηρητικού που περιέχεται σε φιάλες αναψυκτικού

Διαβάστε περισσότερα

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV 5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Γραμμικός Προγραμματισμός Μέθοδος Simplex ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραμμικός Προγραμματισμός Μέθοδος Simplex Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Πρότυπη Μορφή ΓΠ 2. Πινακοποίηση

Διαβάστε περισσότερα

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ 1.Έστω ο δειγματικός χώρος Ω = { 1,,, K,10} με ισοπίθανα απλά ενδεχόμενα. Να 4 βρείτε την πιθανότητα ώστε η συνάρτηση f ( x ) = x 4x + λ να

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Λογιστική Παλινδρόμηση & Διαχωριστική Ανάλυση

Λογιστική Παλινδρόμηση & Διαχωριστική Ανάλυση ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΤΩΝ ΑΠΟΦΑΣΕΩΝ» Λογιστική Παλινδρόμηση & Διαχωριστική Ανάλυση ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διαβάστε περισσότερα