Πολλαπλή Παλινδρόµηση µε Έµφαση στο Πρόβληµα της Ετεροσκεδαστικότητας

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Πολλαπλή Παλινδρόµηση µε Έµφαση στο Πρόβληµα της Ετεροσκεδαστικότητας"

Transcript

1 ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΟΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Πολλαπλή Παλινδρόµηση µε Έµφαση στο Πρόβληµα της Ετεροσκεδαστικότητας ΚΟΝΤΟΥΔΑΚΗΣ ΖΩΗΣ ΜΑΡΤΖΑΚΛΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΧΟΡΤΑΤΟΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΧΡΗΣΤΟΣ ΕΙΣΗΓΗΤΗΣ ΜΕΓΑΡΙΤΗΣ ΑΘΑΝΑΣΙΟΣ ΜΕΣΟΛΟΓΓΙ 015

2 ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΟΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Πολλαπλή Παλινδρόµηση µε Έµφαση στο πρόβληµα της Ετεροσκεδαστικότητας ΚΟΝΤΟΥΔΑΚΗΣ ΖΩΗΣ (Α.Μ ) ΜΑΡΤΖΑΚΛΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ (Α.Μ ) ΧΟΡΤΑΤΟΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΧΡΗΣΤΟΣ (Α.Μ ) ΕΙΣΗΓΗΤΗΣ ΜΕΓΑΡΙΤΗΣ ΑΘΑΝΑΣΙΟΣ ΜΕΣΟΛΟΓΓΙ 015 Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα

3 ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΠΕΡΙΛΗΨΗ...6 ΠΡΟΛΟΓΟΣ...7 ΕΙΣΑΓΩΓΗ.7 ΚΕΦΑΛΑΙΟ 1. ΑΝΑΛΥΣΗ ΠΑΛΙΝ ΡΟΜΗΣΗΣ Το Γενικό Γραµµικό Μοντέλο Απλή Γραµµική Παλινδρόµηση..9 ΚΕΦΑΛΑΙΟ. ΠΟΛΛΑΠΛΗ ΠΑΛΙΝ ΡΟΜΗΣΗ Πίνακας Συνάφειας (Contngency Table) Μοντέλο µε δύο ανεξάρτητες µεταβλητές Μοντέλο µε k ανεξάρτητες µεταβλητές Μέθοδος των Ελαχίστων Τετραγώνων: Εκτίµηση των παραµέτρων του γραµµικού µοντέλου Μοντέλο δύο µεταβλητών....1 Μοντέλο k µεταβλητών Μέθοδος σταθµισµένων ελαχίστων τετραγώνων Έλεγχοι υποθέσεων- Ένας µερικός έλεγχος του µοντέλου Συντελεστής Προσδιορισµού- Μερικός συντελεστής προσδιορισµούσυσχέτισης 16.8 Συντελεστής Μερικής Συσχέτισης (Partal Correlaton Coeffcent) Πρόβλεψη και παρεµβολή Ορθογωνιότητα (Orthogonalty) Σφάλµα προσαρµογής- Επαναλαµβανόµενες µετρήσεις Το πρόβληµα της Πολυσυγγραµµικότητας (Multcollnearty).1.13 Αµφικλινής Παλινδρόµηση (Rdge Regresson) Όριο ανοχής ΚΕΦΑΛΑΙΟ 3. Η ΕΞΕΤΑΣΗ ΤΩΝ ΥΠΟΛΟΙΠΩΝ Εισαγωγή Συνολικό ιάγραµµα Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 3

4 3.3 ιάγραµµα σε Χρονική Ακολουθία Y ) ιάγραµµα ως προς ιάγραµµα ως προς τις ανεξάρτητες µεταβλητές Χj, Αποµονωµένες τιµές Σειριακή Συσχέτιση Υπολοίπων Εξέταση Ροών στο ιάγραµµα Χρονικής Ακολουθίας Έλεγχος των Durbn-Watson για ένα συγκεκριµένο τύπο σειριακής συσχέτισης ΚΕΦΑΛΑΙΟ 4. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΜΕΤΑΒΛΗΤΩΝ ΣΕ ΠΕΡΙΠΤΩΣΕΙΣ ΑΠΟΚΛΙΣΗΣ ΑΠΟ ΤΙΣ ΥΠΟΘΕΣΕΙΣ Εισαγωγή Μετασχηµατισµοί στο Γραµµικό Μοντέλο Ετεροσκεδαστικότητα Πολυπλοκότερα Μοντέλα- Εισαγωγή Πολυωνυµικά Μοντέλα διαφόρων τάξεων ως προς Χ j 1ης τάξης Μοντέλα µε Μετασχηµατισµούς διαφορετικούς από τους µετασχηµατισµούς ακέραιων δυνάµεων Οικογένειες Μετασχηµατισµών Η χρήση «εικονικών» µεταβλητών στην Πολλαπλή Παλινδρόµηση.38 ΚΕΦΑΛΑΙΟ 5. ΕΠΙΛΟΓΗ ΤΗΣ «ΚΑΛΥΤΕΡΗΣ» ΕΞΙΣΩΣΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ Εισαγωγή Επιλογή Μοντέλου µε τη Μέθοδο του Αποκλεισµού Μεταβλητών (Backward Elmnaton Procedure) Η Πιθανότητα λάθους πρώτου είδους (Probablty of a type 1 error) ιαστήµατα εµπιστοσύνης για τον µέσο µ Y/X ιάστηµα πρόβλεψης για το Y Επιλογή Μοντέλου µε τη Μέθοδο της προοδευτικής µεταβλητών (Forward Procedure) Μέθοδος της Βηµατικής Παλινδρόµησης (Stepwse Regresson) 46 Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 4

5 5.8 Σύγκριση της µεθόδου της Βηµατικής Παλινδρόµησης (µε τη µέθοδο αποκλεισµού µεταβλητών Σταδιακή επιλογή µεταβλητών Η ιαδικασία της προς τα πίσω Απαλοιφής Η ιαδικασία της Παλινδρόµησης κατά βήµατα Η ιαδικασία της Παλινδρόµησης κατά στάδια.. 51 ΚΕΦΑΛΑΙΟ 6. ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ ΚΑΙ ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ Εισαγωγή Ερµηνεία του πίνακα Πολλαπλής Παλινδρόµησης από το SPSS.54 ΕΠΙΛΟΓΟΣ ΒΙΒΛΙΟΓΡΑΦΙΑ Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 5

6 Περίληψη Η Απλή Γραµµική Παλινδρόµηση αφορά έναν πληθυσµό όπου εξετάζουµε δύο χαρακτηριστικά- µεταβλητές Y & X και πιο συγκεκριµένα, µας ενδιαφέρει να δούµε πώς διαµορφώνονται οι τιµές της εξαρτηµένης µεταβλητής Y όταν µεταβάλλονται οι τιµές της ανεξάρτητης µεταβλητής X. Στην περίπτωση που διερευνούµε τρεις ή περισσότερες µεταβλητές µε απώτερο σκοπό να διαπιστώσουµε κατά κύριο λόγο το πώς µεταβάλλονται οι τιµές της εξαρτηµένης µεταβλητής Y όταν γνωρίζουµε τις τιµές των ανεξαρτήτων µεταβλητών X 1, X,, X n και κατά δεύτερον να εξετάσουµε τον βαθµό συσχέτισης ανάµεσα σε αυτές τις µεταβλητές. Η σχέση η οποία συνδέει την εξαρτηµένη µεταβλητής Y µε τις περισσότερες από δύο ανεξάρτητες µεταβλητές καλείται Πολλαπλή Παλινδρόµηση. Η Απλή Παλινδρόµηση αναπαριστάνεται στο χώρο µε µια ευθεία ή µε µια άλλη καµπύλη ενώ αντίθετα η Πολλαπλή Παλινδρόµηση απεικονίζεται µε µια επιφάνεια (επίπεδο) ή µια υπερεπιφάνεια. Η Πολλαπλή Γραµµική Παλινδρόµηση εφαρµόζεται στην περίπτωση που διαθέτουµε ένα πλήθος ανεξαρτήτων µεταβλητών X, οι οποίες εµφανίζουν έντονες κατά προτίµηση γραµµικές συσχετίσεις µε την εξαρτηµένη µεταβλητή Y. Όσο πιο ισχυρές είναι αυτές οι συσχετίσεις τόσο πιο καλή εφαρµογή βρίσκει η Πολλαπλή Γραµµική Παλινδρόµηση µέσω της µεθόδου των Ελαχίστων Τετραγώνων και προσαρµόζεται έτσι η εκτιµώµενη ευθεία παλινδρόµησης στα δεδοµένα. Η µέθοδος των Ελαχίστων Τετραγώνων µας βοηθά να ) εκτιµήσουµε τους συντελεστές παλινδρόµησης a, ) β, να υπολογίσουµε τα σφάλµατα ή αποκλίσεις ε, να κάνουµε ελέγχους υποθέσεων αναφορικά µε τις παραµέτρους της παλινδρόµησης και παράλληλα να προβλέψουµε τιµές της εξαρτηµένης µεταβλητής Y. Αν όµως υφίστανται έντονες συσχετίσεις και ανάµεσα στις ανεξάρτητες µεταβλητές X, κατάσταση η οποία δεν είναι επιθυµητή ή οι προϋποθέσεις του γραµµικού µοντέλου δεν πληρούνται, τότε συνήθως καταφεύγουµε στην χρήση κατάλληλων µετασχηµατισµών για να διορθωθεί το πρόβληµα και να προχωρήσουµε στην υλοποίηση της µεθόδου και στην στατιστική συµπερασµατολογία. Οι προϋποθέσεις που αφορούν το γραµµικό µοντέλο είναι :1) Η κανονικότητα των σφαλµάτων ε, ) η ανεξαρτησία των σφαλµάτων ε, 3) η γραµµικότητα µεταξύ των ανεξαρτήτων µεταβλητών X και της εξαρτηµένης µεταβλητής Y και 4) η Οµοσκεδαστικότητα των σφαλµάτων ε. Όταν τα σφάλµατα ε δεν έχουν ίσες διακυµάνσεις προκύπτει το πρόβληµα της Ετεροσκεδαστικότητας, το οποίο µπορούµε να διαπιστώσουµε αν ισχύει διαγραµµατικά εξετάζοντας τα σφάλµατα ή «υπόλοιπα» του µοντέλου. Η Οµοσκεδαστικότητα είναι µία από τις βασικότερες υποθέσεις του γραµµικού µοντέλου και η µη ικανοποίηση της έχει αντίκτυπο στην σωστή εφαρµογή της Πολλαπλής Παλινδρόµησης. Όπως αναφέραµε και προηγουµένως, η λύση στο πρόβληµα της Ετεροσκεδαστικότητας και γενικά σε κάθε απόκλιση από τις υποθέσεις της Παλινδρόµησης είναι ο µετασχηµατισµός των µεταβλητών. Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 6

7 ΠΡΟΛΟΓΟΣ Το θέµα που πραγµατεύεται η παρούσα πτυχιακή εργασία εστιάζεται στην Πολλαπλή Παλινδρόµηση (Multple Regresson). Η παλινδρόµηση είναι µια ευρέως χρησιµοποιούµενη στατιστική τεχνική µοντελοποίησης για την έρευνα της συσχέτισης µεταξύ µίας εξαρτώµενης µεταβλητής και µιας ή περισσότερων ανεξάρτητων µεταβλητών. Χρησιµοποιείται µε σκοπό την εκχώρηση δεδοµένων σε µία πραγµατική µεταβλητή πρόβλεψης, όπως ισχύει και στην περίπτωση της κατηγοριοποίησης όταν είναι διακριτή, αλλιώς καλείται παλινδρόµηση αν η µεταβλητή είναι συνεχής. Η παλινδρόµηση προϋποθέτει ότι τα σχετικά δεδοµένα ταιριάζουν µε µερικά γνωστά είδη συνάρτησης και µετά καθορίζει την καλύτερη συνάρτηση αυτού του είδους που µοντελοποιεί τα δεδοµένα που έχουν δοθεί. Αποτέλεσµα της παλινδρόµησης όταν χρησιµοποιείται ως τεχνική εξόρυξης δεδοµένων, αποτελεί ένα µοντέλο που χρησιµοποιείται αργότερα για να προβλέψει τις τιµές της κατηγορίας για τα νέα δεδοµένα. Τέτοια παραδείγµατα εφαρµογής της παλινδρόµησης αποτελεί η πρόβλεψη της ζήτησης για ένα νέο προϊόν ή υπηρεσία συναρτήσει των δαπανών διαφήµισης ή ο υπολογισµός της ταχύτητας του ανέµου σε σχέση µε την θερµοκρασία, την υγρασία και την ατµοσφαιρική πίεση του περιβάλλοντος. Συµπερασµατικά, θα πραγµατοποιηθεί µια θεωρητική επισκόπηση της µεθόδου της Πολλαπλής Παλινδρόµησης δίνοντας έµφαση στο πρόβληµα της Ετεροσκεδαστικότητας, της µη ισότητας δηλαδή των διακυµάνσεων των τυχαίων µεταβλητών. ΕΙΣΑΓΩΓΗ Ως Στατιστική ορίζεται η επιστήµη η οποία ασχολείται µε την συλλογή, την ανάλυση και την ερµηνεία δεδοµένων. Εναλλακτικά µπορούµε να πούµε ότι Στατιστική είναι η προσπάθεια εξαγωγής συµπερασµάτων κάτω από συνθήκες αβεβαιότητας. Συµπερασµατικά, η Στατιστική περιλαµβάνει τόσο τις µεθόδους συλλογής και επεξεργασίας στοιχείων, όσο και τις µεθόδους ανάλυσης και µελέτης τους, ανακαλύπτοντας µε αυτόν τον τρόπο τις σχέσεις που υφίστανται ανάµεσα στα διάφορα φαινόµενα και διατυπώνοντας συµπεράσµατα που είναι χρήσιµα για την λήψη ορθών αποφάσεων. Τα βασικά στάδια που ακολουθούνται για την εξέταση των ιδιοτήτων των διαφόρων στοιχείων µιας πολυπληθούς οµάδας είναι τα εξής: a) Η συγκέντρωση των στατιστικών στοιχείων που είναι αναγκαία για την µελέτη του προβλήµατος που θέλουµε να διερευνήσουµε. b) Η συστηµατική επεξεργασία και παρουσίαση των στατιστικών στοιχείων υπό την µορφή στατιστικών πινάκων και διαγραµµάτων. Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 7

8 c) Η ανάλυση των στοιχείων αυτών και η εξαγωγή συµπερασµατολογίας για την λήψη ορθών αποφάσεων. Η λέξη «Στατιστική» προέρχεται από την λατινική λέξη «status» και η οποία σηµαλινει κράτος. Αρχικά η Στατιστική δήλωνε την συλλογή στοιχείων για κρατικούς σκοπούς και ανάγκες. Κατά το πέρασµα του χρόνου, η Στατιστική θα ξεφύγει από τον περιγραφικό της χαρακτήρα µε την ανάπτυξη ενός νέου κλάδου, του λογισµού των Πιθανοτήτων. Η Στατιστική βρίσκει εφαρµογές σε όλες σχεδόν τις εκφάνσεις της ανθρώπινης δραστηριότητας. Ενδεικτικά ορισµένα πεδία εφαρµογής της είναι η ηµογραφία, η Ιατρική, η Αστρονοµία, η Γεωργία, η Βιοµηχανία, η ιοίκηση Επιχειρήσεων, η Οικονοµία κ.α. Πιο ειδικά, στην περίπτωση των διπαραµετρικών κατανοµών, όπου µελετάµε συγχρόνως δύο µεταβλητές, ενδιαφερόµαστε να εξακριβώσουµε την ύπαρξη ή όχι συσχέτισης µεταξύ τους, δηλαδή να διαπιστώσουµε αν οι τιµές της µιας µεταβλητής επηρεάζονται από τις τιµές της άλλης και να διακριβώσουµε τον τρόπο συσχέτισης τους. Αυτά στην Απλή Γραµµική Παλινδρόµηση όπου έχουµε µια εξαρτηµένη µεταβλητή Y και µια ανεξάρτητη µεταβλητή X. Όταν το πλήθος των ανεξαρτήτων µεταβλητών είναι µεγαλύτερο ή ίσο του δύο, τότε µιλάµε για την Πολλαπλή Παλινδρόµηση, που αποτελεί το αντικείµενο της συγκεκριµένης πτυχιακής εργασίας. - Κεφάλαιο 1: Ανάλυση Παλινδρόµησης 1.1: Το Γενικό Γραµµικό Μοντέλο Βασικός στόχος της µελέτης των Γραµµικών Μοντέλων είναι η πρόβλεψη µιας µεταβλητής Υ µε βάση τα στοιχεία που διαθέτουµε για ένα σύνολο άλλων µεταβλητών X 0, X 1, X ρ-1. Η Υ αναφέρεται σαν εξαρτηµένη µεταβλητή, ενώ οι X 0, X 1, X ρ-1 σαν ανεξάρτητες ή προβλέπουσες. Οι εφαρµογές των Γραµµικών Μοντέλων είναι πολλές και ανάγονται σχεδόν σε όλες τις επιστήµες. Στο κλασσικό Γραµµικό Μοντέλο υποθέτουµε ότι η Υ αποτελείται από ένα γραµµικό κοµµάτι που περιέχει τα X 0, X 1, X ρ-1 και ένα τυχαίο σφάλµα ε που αντανακλά τα διάφορα σφάλµατα των µετρήσεων καθώς επίσης και επιδράσεις από άλλες προβλέπουσες µεταβλητές που δεν περιλήφθηκαν στο µοντέλο. Οι τιµές που παίρνουν τα x θεωρούνται καθορισµένες (µη τυχαίες ) ενώ αντίθετα τα σφάλµατα ε και εποµένως και τα παρατηρούµενα Υ θεωρούνται σαν τυχαίες µεταβλητές που ικανοποιούν κάποιες στατιστικές υποθέσεις. Η γενική µορφή του γραµµικού µοντέλου είναι η Υ=β 0 +β 1 X 1 + +β ρ-1 X ρ-1 +ε όπου ο όρος γραµµικό αναφέρεται στις άγνωστες παραµέτρους β 0,,β ρ-1. Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 8

9 Μια µέθοδος εύρεσης εκτιµητριών για τις παραµέτρους β είναι η λεγόµενη Μέθοδος Ελαχίστων Τετραγώνων, σύµφωνα µε την οποία επιδιώκουµε να ελαχιστοποιήσουµε το άθροισµα των τετραγώνων των σφαλµάτων. 1.: Απλή Γραµµική Παλινδρόµηση Η απλούστερη περίπτωσης παλινδρόµησης είναι η Απλή Γραµµική Παλινδρόµηση όπου υπάρχει µόνο µια ανεξάρτητη µεταβλητή X και η εξαρτηµένη µεταβλητή Y µπορεί να προσεγγιστεί ικανοποιητικά από µια γραµµική συνάρτηση του X. Ας υποθέσουµε γενικά ότι έχουµε n ζεύγη παρατηρήσεων (x,y ) =1,,n και ότι αναζητούµε προσέγγιση της µορφής: Y =β 0+ β 1 X +ε όπου τα ε θα παριστάνουν τις αποκλίσεις της πραγµατικής τιµής από την προηγούµενη. Είναι φανερό ότι η εκλογή των παραµέτρων β 0 και β 1 θα πρέπει να γίνει κατά τέτοιο τρόπο ώστε να ελαχιστοποιηθούν οι ποσότητες ε. Για να αποφευχθεί το πρόβληµα των θετικών αρνητικών αποκλίσεων αρχικά υψώνουµε τα ε στο τετράγωνο και στη συνέχεια αθροίζουµε φτάνοντας έτσι στο άθροισµα τετραγώνων το οποίο προσπαθούµε να ελαχιστοποιήσουµε. Εφαρµόζοντας την παραπάνω µέθοδο καταλήγουµε στα ) β 0 και ) β 1 που είναι γνωστά µε την ονοµασία εκτιµήτριες ελάχιστων τετραγώνων και δίνονται από τους ακόλουθους τύπους: ) β = 1 S S xy xx ) 1 β0 = ( y ) β1 x) = y ) β1x n όπου ( )( ) S = x x y y xy xx ( ) S = x x ή καλύτερα υπολογιστικά S = x y nxy xy xx S = x nx Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 9

10 - Κεφάλαιο : Πολλα λή Παλινδρόµηση.1: Γενική Εισαγωγή στην Πολλαπλή Παλινδρόµηση Σε πολλά πρακτικά προβλήµατα είναι απαραίτητο να χρησιµοποιήσουµε δύο και περισσότερες ανεξάρτητες µεταβλητές προκειµένου να ερµηνεύσουµε µε µεγαλύτερη ακρίβεια ένα φυσικό φαινόµενο ώστε να βγάλουµε σωστότερα συµπεράσµατα. Για παράδειγµα προκείµενου να χρησιµοποιηθεί ένα µοντέλο παλινδρόµησης για να προβλεφθεί η ζήτηση ενός προϊόντος µιας εταιρίας σε 5 διαφορετικές πόλεις είναι ίσως σκόπιµο να χρησιµοποιηθούν κοινωνικοοικονοµικές µεταβλητές (µέσο οικογενειακό εισόδηµα, µόρφωση του αρχηγού της οικογένειας και µέσος αριθµός και χρόνος εκπαίδευσης), δηµογραφικές µεταβλητές (µέσο µέγεθος οικογενειών, ποσοστό συνταξιούχων) και περιβαλλοντικές µεταβλητές (µέση ηµερήσια θερµοκρασία, δείκτης ατµοσφαιρικής ρύπανσης). Μοντέλα παλινδρόµησης που περιέχουν δύο ή περισσότερες ανεξάρτητες µεταβλητές ονοµάζονται Μοντέλα Πολλαπλής Παλινδρόµησης (multple regresson models)..: Μοντέλο µε ύο ανεξάρτητες µεταβλητές Το µοντέλο µε δύο ανεξάρτητες µεταβλητές είναι η φυσική επέκταση της απλής ευθείας παλινδρόµησης ώστε να µελετώνται δύο ανεξάρτητες µεταβλητές X 1 και X. Έτσι θα έχουµε : Y = α + β 1 X 1 + β X + ε = 1,,,n (1) όπου: -Y είναι η τιµή της εξαρτηµένης µεταβλητής στην παρατήρηση. -X 1 και X είναι τιµές των ανεξάρτητων µεταβλητών X 1 και X στην παρατήρηση οι οποίες υποτίθεται ότι είναι γνωστές σταθερές. -α, β 1 και β είναι οι παράµετροι του µοντέλου. - Τα ε είναι ανεξάρτητες τυχαίες µεταβλητές που ακολουθούν την Κανονική κατανοµή Ν (0,σ ). Η συνάρτηση παλινδρόµησης (regresson functon) ή αλλιώς συνάρτηση ανταπόκρισης (response functon) του µοντέλου (1) είναι: (, ) E Y x x = a+ β x + β x Η συνάρτηση αυτή ονοµάζεται αρκετές φορές επιφάνεια παλινδρόµησης (regresson surface) ή επιφάνεια ανταπόκρισης (response surface). Οι παράµετροι της πολλαπλής παλινδρόµησης έχουν ερµηνείες ανάλογες µε αυτές της γραµµικής παλινδρόµησης. Έτσι στην επιφάνεια παλινδρόµησης : Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 10

11 Το α αντιστοιχεί στο σηµείο τοµής του άξονα του Υ από την επιφάνεια (επίπεδο) παλινδρόµησης. Το β 1 δείχνει την µεταβολή της Ε(Υ) όταν το x 1 αυξάνει κατά µια µονάδα ενώ το x παραµένει σταθερό Το β δείχνει την µεταβολή της Ε(Υ) όταν x αυξάνει κατά µια µονάδα ενώ το x 1 παραµένει σταθερό..3: Μοντέλο µε k ανεξάρτητες µεταβλητές Το µοντέλο παλινδρόµησης µε k ανεξάρτητες µεταβλητές X 1,X, X κ θα έχει τη µορφή Υ = α + β1x 1 + β X + + β κ X κ + ε =1,,,n (1.) όπου -Υ είναι η τιµή της εξαρτηµένης (dependent) ή µεταβλητής απόκρισης (response) για την παρατήρηση. -X 1, X,, X k είναι οι τιµές των ανεξάρτητων (ndepedent) ή «προβλεπουσών» (predctor) µεταβλητών στην παρατήρηση (υποτίθενται γνωστές σταθερές). - β 0, β 1,,β k είναι (k+1) άγνωστες παράµετροι (συντελεστές παλινδρόµησης) που ζητείται να εκτιµηθούν. -Τα ε είναι ανεξάρτητα σφάλµατα και ακολουθούν την Κανονική κατανοµή Ν(0,σ ). Και στην περίπτωση αυτή α είναι η Ε(Υ) για X 1 = X = X κ = 0 ενώ το β (= 1,, k) δείχνει την µεταβολή της Ε(Υ) όταν η µεταβλητή Χ αυξηθεί κατά µια µονάδα ενώ όλες οι άλλες ανεξάρτητες µεταβλητές παραµένουν σταθερές. Ένα σηµαντικό ερώτηµα σε πάρα πολλά προβλήµατα, σχεδόν κάθε είδους, όπως παραγωγής (βιοµηχανική, αγροτική κ.λπ.), εκπαίδευσης (µαθητών, στελεχών, στρατιωτών κλπ.) πρόβλεψης (εκλογές, καιρός κλπ.) χωροθέτησης, βελτιστοποίησης και άλλων, είναι αν µπορούµε να εκτιµήσουµε ή να προβλέψουµε την τιµή µιας ή περισσοτέρων µεταβλητών κάτω από ορισµένες συνθήκες. Οι δοσµένες συνθήκες περιγράφονται και αυτές από µεταβλητές, οι τιµές των τιµών είναι δυνατό να ελεγχθούν από τον ερευνητή. Έτσι για παράδειγµα η µεταβλητή Υ που ζητούµε να εκτιµηθεί ή να προβλεφθεί, µπορεί να παριστάνει ζήτηση κάποιου προϊόντος στην αγορά, παραγωγή κάποιου γεωργικού προϊόντος, απόδοση µαθητού, αύξηση ποσοστού σε εκλογές, κλπ. Ενώ οι µεταβλητές Χ που περιγράφουν τις συνθήκες και που µπορούν να ελεγχθούν, µπορεί να παραστάνουν τιµή πώλησης προϊόντος, συσκευασία, κόστος διαφήµισης, ταχύτητα διανοµής, ποικιλία, λίπανση, θερµοκρασία, είδος διδασκαλίας, φύλο, και πολλά άλλα. Για την εύρεση του µοντέλου εκτίµησης ή πρόβλεψης χρησιµοποιούνται δεδοµένα που έχουν προκύψει από µια σειρά n παρατηρήσεων και που συχνά δίνονται µε τη µορφή του παρακάτω πίνακα: Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 11

12 x11 x1 x31... xk1 y1 x1 x x3... xk y x1n xn x3n... xkn yn (1.1) Οι γραµµές του πίνακα παριστάνουν τις παρατηρήσεις, ενώ οι στήλες δίνουν τις τιµές των αντίστοιχων µεταβλητών για κάθε παρατήρηση. Η µορφή του µοντέλου πρόβλεψης µπορεί να είναι οποιαδήποτε, εδώ όµως θα ασχοληθούµε µόνο µε το γραµµικό µοντέλο. Το γενικό γραµµικό µοντέλο είναι το: Για τις µεταβλητές Χ 1, Χ, Χ k η ονοµασία «ανεξάρτητες» δε σηµαίνει ότι είναι πράγµατι ανεξάρτητες. Μπορεί για παράδειγµα να ισχύει X =X 1 ή X 3 =X 1 +X. Ο λόγος στον οποίο οφείλεται αυτή η ονοµασία, είναι ότι το ζητούµενο συνήθως είναι, πως οι τιµές αυτών των µεταβλητών επηρεάζουν τις τιµές της εξαρτηµένης µεταβλητής και µπορούν να ελέγχονται από τον ερευνητή. Από το τελευταίο αυτό προκύπτει και η ονοµασία «προβλέπουσες» µεταβλητές. Στην πράξη πολλές φορές οι µεταβλητές εναλλάσσουν ρόλους. Μια µεταβλητή, πχ που στο πρώτο µέρος µιας µελέτης είναι εξαρτηµένη, µπορεί στο δεύτερο µέρος της µελέτης να είναι ποσοτικές, να περιγράφουν δηλ. µετρήσιµα µεγέθη. Το σφάλµα ε, περιέχει κάθε απόκλιση της πραγµατικής κατάστασης από το µοντέλο. Έτσι εκτός από τα πιθανά σφάλµατα µετρήσεων, περιέχει επίσης και σφάλµατα προσαρµογής, που οφείλονται είτε σε παράλειψη µεταβλητών είτε σε χρήση µεταβλητών που δε σχετίζονται µε την Υ. Η δυνατότητα των προβλεπουσών µεταβλητών να συσχετίζονται µεταξύ τους διευρύνει τις περιπτώσεις εφαρµογής του µοντέλου (1.)..4: Μέθοδος των ελαχίστων Τετραγώνων: Εκτίµηση των παραµέτρων του γραµµικού µοντέλου 1. - Μοντέλο ύο µεταβλητών Η εκτιµήτρια της επιφάνειας παλινδρόµησης (, ) Y x1, x E Y x x = µ = a+ β x + β x θα είναι η επιφάνεια ) ) ) ) µ = a+ β x + β x Y x x 1, 1 1 Οι τιµές a,b 1,b των εκτιµητριών a ), ) β 1και ) β προκύπτουν κατά τα γνωστά µε την µέθοδο των ελαχίστων τετραγώνων. Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 1

13 Το σύστηµα των κανονικών εξισώσεων για τα a,b 1,b είναι = ν + ( ) + ( ) y a x b x b 1 1 = ( ) + ( ) + ( ) x y x a x b x x b = ( ) + ( ) + ( ) x y x a x b x x b 1 Η επίλυση των κανονικών αυτών εξισώσεων λόγω της πολυπλοκότητας των πράξεων γίνεται στον υπολογιστή. Εκτός από την προσαρµογή µε την µέθοδο των ελαχίστων τετραγώνων κάποιου µοντέλου σε µια σειρά από δεδοµένα υπάρχει το πρόβληµα στην πολλαπλή παλινδρόµηση το κατά πόσον µερικοί από τους όρους β x στο µοντέλο έχουν σηµαντική συνεισφορά στην εξήγηση της διακύµανσης που παρατηρείται στην εξαρτηµένη µεταβλητή Y. Η πολλαπλή παλινδρόµηση παρέχει τη στατιστική συµπερασµατολογία για τον καθορισµό του κατά πόσο µια µεταβλητή είναι σηµαντική µε έλεγχο της µηδενικής υπόθεσης Η 0 : β = 0 έναντι της εναλλακτικής H 1 : β 0, = 1,,, k. Αν η Η 0 δεν απορριφθεί για κάποια τιµή του συµπεραίνουµε ότι δεν υπάρχουν στοιχεία ικανά να µας πείσουν ότι η µεταβλητή έχει συνεισφορά σηµαντική στο µοντέλο. Στην περίπτωση αυτή ο όρος β x διαγράφεται από το µοντέλο. Στην περίπτωση αυτή ο όρος β x διαγράφεται από το µοντέλο απλοποιώντας έτσι τη διαδικασία. Πρέπει να σηµειώσουµε ότι οι έλεγχοι υποθέσεων είναι µέθοδοι που βοηθούν τον ερευνητή να καθορίσει τη σηµαντικότητα µεταβλητών του µοντέλου. Θα πρέπει όµως να τονισθεί ότι η απόφαση για το κατά πόσον µια µεταβλητή θα πρέπει να περιληφθεί στο µοντέλο ή όχι δεν θα πρέπει να ληφθεί µε αποκλειστικό κριτήριο τον προηγηθέντα έλεγχο υποθέσεων. Οποιαδήποτε πρόσθετη πληροφορία είναι διαθέσιµη στον ερευνητή η οποία µπορεί να θεωρηθεί από αυτόν περισσότερο πειστική από ότι ο έλεγχος υποθέσεων δεν θα πρέπει να αγνοείται. Ο έλεγχος της υποθέσεως που προαναφέραµε στηρίζεται στη στατιστική συνάρτηση T = ) β S ) β όπου ) β είναι η εκτιµήτρια ελαχίστων τετραγώνων του συντελεστή β της µεταβλητής Χ στο γενικό γραµµικό µοντέλο και S ) β είναι η εκτιµούµενη τυπική απόκλιση της εκτιµήτριας Όπως συνήθως η τιµή της στατιστικής συνάρτησης Τ συγκρίνεται µε τα ποσοστιαία σηµεία της κατανοµής t µε n-k-1 βαθµούς ελευθερίας. Οι υπολογισµοί αυτοί γίνονται συνήθως στους υπολογιστές. ) β. Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 13

14 - Μοντέλο k µεταβλητών Έστω ότι σε κάποιο πρόβληµα έχουµε τα δεδοµένα (1.). Τότε όπως αναφέρθηκε, θα ικανοποιείται το σύστηµα (1.3) δηλ. το y = β + β x + β x β x + ε k k1 1 y = β + β x + β x β x + ε k k... y = β + β x + β x β x + ε n 0 1 1n n k kn n (1.4) Το ζητούµενο είναι να λυθεί το σύστηµα (1.4) ως προς τα β µε τον «καλύτερο» δυνατόν τρόπο δηλ. µε έναν τρόπο που να ελαχιστοποιεί όσο είναι δυνατόν τα σφάλµατα. Υπάρχουν πολλά κριτήρια ελαχιστοποίησης των σφαλµάτων, ένα από τα οποία είναι αυτό που απαιτεί το άθροισµα των τετραγώνων των σφαλµάτων n ε να γίνεται ελάχιστο. Η µέθοδος που = 1 χρησιµοποιείται για την εκτίµηση των β µ αυτό το κριτήριο λέγεται «µέθοδος ελαχίστων τετραγώνων». Οι εκτιµήσεις των β θα συµβολίζονται µε ) β και µ αυτές το µοντέλο παίρνει τη µορφή: ) ) ) ) ) Y = β + β X + β X + + β X k k (1.5) Η τιµή Y ) είναι η εκτίµηση της πραγµατικής τιµής τη Υ, όταν δίνονται οι τιµές Χ 1, Χ,,X k και διαφέρει απ αυτήν κατά ένα σφάλµα. Αν οι X j πάρουν τις τιµές Χ j που δίνονται ε = Y Y ) στην γραµµή του πίνακα (1.1), τότε η Y ) συµβολίζεται µε Y ) και ισχύει όπου n ε είναι ελάχιστο. Η διαφορά Y = 1 Y ) λέγεται υπόλοιπο (resdual). 1. Η διαφορά των δύο τιµών Y και Y ) διαιρεµένη µε την εκτιµηθείσα τυπική απόκλιση των σφαλµάτων λέγεται τυποποιηµένο υπόλοιπο (standardzed resdual)..5 Μέθοδος σταθµισµένων ελαχίστων τετραγώνων Όπως είδαµε υπάρχουν περιπτώσεις όπου η βασική προϋπόθεση της σταθερότητας της διασποράς δεν ικανοποιείται. Μπορούµε στη γενική περίπτωση να υποθέσουµε ότι ισχύει Y = Xβ+ ε (3.18) Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 14

15 όπου E( ε ) = 0 V ε = Vσ, ( ) (3.19) ή αν ενδιαφερόµαστε για ελέγχους υποθέσεων (F τεστ) ότι N (0, Vσ ) (3.0) ε.6: Έλεγχοι υποθέσεων- Ένας µερικός έλεγχος του µοντέλου Είδαµε ότι κάτω από τις συνθήκες κανονικότητας ε N( 0, σ In) και µε την βοήθεια του στατιστικού F=MSR/MSE µπορούµε να ελέγχουµε συνολικά το µοντέλο (1.). Αν ο λόγος F είναι σηµαντικός, το µοντέλο είναι «καλό», ενώ αν είναι ασήµαντος, τότε είτε η Υ δεν εξαρτάται καθόλου από τις Χ 1 Χ Κ ή η σχέση εξάρτησης είναι διαφορετική από την (1.). Μέχρι τώρα µιλήσαµε για δύο µεθόδους ελέγχου υποθέσεων στην πολλαπλή παλινδρόµηση. Ο ένας αναφερόταν στον έλεγχο των συγκεκριµένων όρων του µοντέλου (όταν ελέγχεται η υπόθεση Η 0 : β 1 = β k = 0) που περιλαµβάνει όλους τους όρους του γενικού γραµµικού µοντέλου. Υπάρχει και µια τρίτη στατιστική µεθοδολογία που βρίσκεται στο ενδιάµεσο των δυο προαναφερθεισών µεθοδολογιών. Η µεθοδολογία αυτή επιτρέπει τον ταυτόχρονο έλεγχο ενός αριθµού από τους όρους του µοντέλου χωρίς ταυτόχρονα να απαιτεί να ελεγχθούν όλοι οι όροι του µοντέλου. Η µεθοδολογία αυτή είναι χρήσιµη όταν ο ερευνητής ξέρει ότι κάποιοι από τους όρους πρέπει οπωσδήποτε να χρησιµοποιηθούν αλλά είναι βέβαιος για έναν αριθµό από τους υπόλοιπους όρους του µοντέλου και θεωρεί ότι χρειάζεται έναν έλεγχο για να αποφασίσει για όλους του υπόλοιπους όρους ταυτόχρονα. Πιο συγκεκριµένα αν β 1, β,, β q είναι οι συντελεστές των όρων για τους οποίους είµαστε βέβαιοι ότι θα πρέπει να περιλαµβάνονται στο µοντέλο και β q+1 = β q+ = = β k = 0. Με την υπόθεση αυτή ελέγχουµε ουσιαστικά το κατά πόσον το πλήρες µοντέλο Ε(Υ) = α + β 1 x 1 + β x + + β q x q + β q+1 x q β k X k είναι κατάλληλο για να περιγράψει τα δεδοµένα. Το άθροισµα των τετραγώνων των λαθών του µοντέλου αυτού συµβολίζεται µε SSE 1 και οι βαθµοί ελευθερίας για το λάθος συµβολίζονται µε DF 1. To περιορισµένο µοντέλο που µας ενδιαφέρει να εξετάσουµε είναι Ε(Υ) = α + β 1 Χ 1 + β Χ + β q X q, q < k Το άθροισµα των τετραγώνων των λαθών για το περιορισµένο αυτό µοντέλο συµβολίζεται µε SSE και οι βαθµοί ελευθερίας του λάθους συµβολίζεται µε DF. Η στατιστική συνάρτηση F που χρησιµοποιείται για τον έλεγχο αυτής της υπόθεσης είναι η ( SSE SSE1) /( DF DF1) F = SSE / DF 1 1 Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 15

16 Η τιµή της στατιστικής αυτής συνάρτησης συγκρίνεται µε τα εκατοστιαία σηµεία της κατανοµής F που δίνονται στους αντίστοιχους πίνακες µε (DF DF 1 ) βαθµούς ελευθερίας του αριθµητή και DF 1 βαθµούς ελευθερίας για τον παρονοµαστή..7: Συντελεστής Προσδιορισµού- Μερικός συντελεστής Προσδιορισµού Συσχέτισης Η σχέση SST=SSR+SSE εκφράζει ότι η συνολική διασπορά γύρω από το µέσο όρο αναλύεται σε δύο µέρη. Στο SSR που εξηγείται από τη γραµµική σχέση και στο SSE, που οφείλεται είτε σε σφάλµατα είτε σε άλλους απροσδιόριστους παράγοντες. Ένα µοντέλο, εποµένως θα είναι τόσο περισσότερο κατάλληλο για τα δεδοµένα µας, όσο το SSE είναι πιο µικρό συγκρινόµενο µε το SSR. Το τελευταίο οδηγεί στον παρακάτω ορισµό. Η ποσότητα R = SSR SSE 1 SST = SST (1.43) λέγεται συντελεστής προσδιορισµού (Coeffcent of determnaton). Είναι ένας αριθµός µεταξύ 0 και 1, και µάλιστα όσο πλησιάζει το 1 τόσο η προσαρµογή είναι καλύτερη ενώ όσο πλησιάζει το 0 γίνεται χειρότερη. Ο αριθµός %R εκφράζει το ποσοστό της συνολικής µεταβλητότητας που εξηγείται από το γραµµικό µοντέλο. Ο συντελεστής προσδιορισµού R µπορεί να χρησιµοποιηθεί και για τον έλεγχο της υπόθεσης Η 0 : β 1 =β = β κ =0 αντί του F. Πράγµατι µπορεί εύκολα να διαπιστωθεί ότι F n k 1 R = k 1 R ή kf / ( n k 1) R = 1 + kf / ( n k 1) Όταν το δείγµα είναι µικρό σε σύγκριση µε τον αριθµό των µεταβλητών, ένας «καλύτερος» συντελεστής προσδιορισµού υπολογίζεται µε αντικατάσταση στη δεύτερη από τις σχέσεις (1.43) των αθροισµάτων τετραγώνων µε µέσα τετράγωνα. Ο συντελεστής που προκύπτει συµβολίζεται µε R και λέγεται «διορθωµένος συντελεστής προσδιορισµού» (adjusted coeffcent of determnaton), και ισχύει SSE / ( n k 1) s R = 1 = 1 SST / ( n 1) vary (1.45) Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 16

17 Ο συµβολισµός R,δε σηµαίνει ότι ο διορθωµένος συντελεστής προσδιορισµού είναι πάντα θετικός αριθµός. Πράγµατι µπορεί το R να πάρει και αρνητικές τιµές αρκεί το s να είναι µεγαλύτερο του VarY, πράγµα που συµβαίνει κάποιες φορές στην πράξη. Η σχέση µεταξύ των δύο συντελεστών είναι n 1 1 R = 1 n k 1 ( R ) Η τετραγωνική ρίζα του R λέγεται συντελεστής πολλαπλής συσχέτισης (coeffcent of multple correlaton) και συµβολίζεται µε R. Πολλοί ερευνητές προκειµένου να αναφερθούν στην προσαρµογή του µοντέλου, προτιµούν να χρησιµοποιούν τον συντελεστή R αντί του R. O λόγος γίνεται φανερός αν σκεφθούµε ότι επειδή 0<R <1 ισχύει R>R, η φυσική όµως σηµασία του R και ιδιαίτερα του προσήµου του είναι δύσκολο να εξηγηθεί. Ας θεωρήσουµε πάλι το πλήρες µοντέλο Υ = β 0 + β 1 Χ 1 + β χ + + β k Χ k + ε και το περιορισµένο που προκύπτει από αυτό µε την απαλοιφή της µεταβλητής X Υ = β 0 + β 1 Χ β -1 X +1 + β -1 X -1 + β ι+1 X +1 + β k X k + ε. Αν SSE και SSE () είναι το άθροισµα τετραγώνων των αποκλίσεων που µένουν ανεξήγητα από την προσαρµογή του πλήρους και του περιορισµένου µοντέλου αντίστοιχα, τότε προφανώς η διαφορά SSE () - SSE δίνει το µέρος της ανεξήγητης διασποράς που εξηγεί η µεταβλητή X και λέγεται µερικός συντελεστής προσδιορισµού (coeffcent of partal determnaton) και θα το συµβολίσουµε µε r + δηλαδή: Y ;1...( 1)( 1)... k r Y ;1...( 1)( + 1)... k = SSE ( ) SSE SSE ( ) Ο συντελεστής αυτός συµβολίζεται επίσης και µε r όπου ο υποδείκτης k σηµαίνει ότι οι προβλέπουσες µεταβλητές µαζί µε την X είναι σε πλήθος k. Ο συµβολισµός αυτός δεν δείχνει ποιες από τις µεταβλητές είναι στο µοντέλο, πράγµα που δηµιουργεί µερικές φορές σύγχυση, ιδιαίτερα όταν µελετούµε ταυτόχρονα πολλά µοντέλα µε το ίδιο πλήθος µεταβλητών. Η θετική τετραγωνική ρίζα του µερικού συντελεστή προσδιορισµού συµβολίζεται ry ;1...( 1)( + 1)... k και λέγεται µερικός συντελεστής συσχέτισης (partal correlaton coeffcent). Y ; k Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 17

18 .8: Συντελεστής Μερικής Συσχέτισης (Partal Correlaton Coeffcent) Στην απλή παλινδρόµηση η σχέση µεταξύ Υ και X 1 µπορεί να µετρηθεί από το δειγµατικό συντελεστή συσχέτισης r. Οµοίως η ένταση της σχέσης της X 1 µε το Υ, YX 1 λαµβάνονται υπόψη την επίδραση της X στην X 1, µπορεί να συνοψισθεί από το δειγµατικό συντελεστή συσχέτισης των καταλοίπων της Παλινδρόµησης του Y στην X. Ο τελευταίος αυτός συντελεστής συσχέτισης ονοµάζεται συντελεστής µερικής συσχέτισης και συµβολίζεται µε r YX1 X. Πολλές φορές χρησιµοποιείται ο όρος µερικός συντελεστής συσχέτισης µεταξύ του Υ και του X 1 προσαρµοζόµενος για το Χ (partal correlaton between Y and X 1 adjusted for X )..9: Πρόβλεψη και παρεµβολή Έστω ότι για τις µεταβλητές Υ, Χ 1, X,, X k έχουµε κάνει ένα σύνολο παρατηρήσεων που δίνονται µε ένα πίνακα της µορφής (1.1). Ενδιαφερόµαστε να εκτιµήσουµε την τιµή Υ 0 της Υ, όταν οι τιµές των X είναι δοσµένες π.χ. X 10, X 0,,X k αντίστοιχα. Μια τέτοια πρόβλεψη της τιµής της Υ, είναι αξιόπιστη όταν οι δοσµένες τιµές των X είναι µέσα στην περιοχή που «καλύπτεται» από τα δεδοµένα. Αν k=1, η πρόβλεψη σ αυτή την περίπτωση λέγεται παρεµβολή (nterpolaton). Για k > 1 χρησιµοποιούµε γενικά τον όρο πρόβλεψη (predcton - forecastng). Με την υπόθεση ότι το µοντέλο που προσαρµόζεται στα δεδοµένα είναι Y = Xβ+ ε και ότι τα σφάλµατα ικανοποιούν τις συνθήκες E( ε ) = 0 & ( ) = ) των παραµέτρων β. V ε σ I n, εκτιµούµε το διάνυσµα Αν, τώρα συµβολίσουµε µε SST, το συνολικό άθροισµα τετραγώνων των αποκλίσεων γύρω από το µέσο όρο και µε SSR το µέρος αυτού του αθροίσµατος που αποµένει από το SST µετά την αφαίρεση του SSE, τότε µπορούµε να πούµε ότι SSR είναι το µέρος της συνολικής διασποράς που εξηγείται από την παλινδρόµηση. Θα έχουµε εποµένως: SST = SSR + SSE Αν εποµένως υποθέσουµε ότι όλες οι παράµετροι β 1, β, βκ είναι ίσες µε 0,τότε θα είναι και το SSR ίσο µε 0, και κατά συνέπεια και ο λόγος F MSR SSR / k = = MSE SSE / ( n k 1) Ο λόγος F κατανέµεται µε κατανοµή F k,n-k-1, πράγµα που οδηγεί στον παρακάτω έλεγχο: Η υπόθεση Η 0 : β 1 =β = =β κ =0 έναντι της εναλλακτικής της Η 1 : ένα τουλάχιστο από τα β 1, β κ 0, Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 18

19 ελέγχεται συγκρίνοντας την τιµή του λόγου F µε την κρίσιµη τιµή F K,n-k-1,α για επίπεδο σηµαντικότητας α. Τότε αν: F > F K,n-k-1,α απορρίπτουµε την Η 0,σε ε.σ. α F < F K,n-k-1,α δεν απορρίπτουµε την Η 0 Η µη απόρριψη της Η 0 στην τελευταία περίπτωση, σηµαίνει ότι από τα δεδοµένα του πειράµατος δεν προκύπτουν επαρκείς ενδείξεις για την ύπαρξη γραµµικής σχέσης µεταξύ των µεταβλητών Υ και Χ 1,Χ, Χ Κ.. Αυτό βέβαια δεν αποκλείει την ύπαρξη κάποιας άλλης σχέσης, π.χ. πολυωνυµικής, εκθετικής κλπ. Μεταξύ των ίδιων µεταβλητών..10: Ορθογωνιότητα (Orthogonalty) ύο µεταβλητές Χ 1 και Χ λέγονται ορθογώνιες (orthogonal) αν η παλινδρόµηση της Υ επί της Χ 1, προσαρµοσµένης για την X ταυτίζεται µε την παλινδρόµηση της Y επί της X 1 αγνοώντας την Χ. Η ευχάριστη αυτή κατάσταση συµβαίνει όταν ο δειγµατικός συντελεστής συσχέτισης των Χ 1 και Χ είναι ακριβώς µηδέν. Όταν η Χ 1 και η Χ είναι ορθογώνιες, η επίδραση κάθε µιας από τις µεταβλητές είναι σαφώς καθορισµένη. Για το λόγο αυτό, όποτε είναι δυνατό τα πειράµατα σχεδιάζονται µε τρόπο ώστε οι µεταβλητές να είναι ορθογώνιες..11: Σφάλµα προσαρµογής- Επαναλαµβανόµενες µετρήσεις Το άθροισµα τετραγώνων SSE οφείλεται, όπως αναφέρθηκε και προηγούµενα, είτε σε σφάλµατα είτε σε άλλους παράγοντες. εν είναι εύκολο, στη γενική περίπτωση να ξεχωρίσουµε τα σφάλµατα από το SSE. Αν όµως στα δεδοµένα µας υπάρχουν επαναλαµβανόµενες µετρήσεις, τότε µπορούµε να υπολογίσουµε το µέρος του SSE που οφείλεται µόνο σε σφάλµατα. Αν αυτό το µέρος είναι µεγάλο σε σύγκριση µε το µέρος του SSE που οφείλεται και σε άλλους παράγοντες, τότε δεν µπορούµε να αµφισβητήσουµε το µοντέλο. Αν όµως το µέρος που οφείλεται σε σφάλµατα είναι ασήµαντο σε σχέση µε το άλλο µέρος, θα σηµαίνει ότι το µοντέλο θέλει αναθεώρηση. Ένας έλεγχος των διαγραµµάτων διασποράς είναι στην περίπτωση αυτή χρήσιµος για την προσαρµογή καταλληλότερου µοντέλου. Ας υποθέσουµε λοιπόν ότι υπάρχουν επαναλαµβανόµενες µετρήσεις.τότε στο σηµείο πχ. Ρ 1 για το οποίο Χ 1 =x 11, Χ =x 1, Χ Κ =x Κ1, θα έχουµε αντί µιας πολλές n 1 έστω παρατηρήσεις τις οποίες µπορούµε να συµβολίσουµε Υ 11, Υ 1,, Υ 1n, n1 1. Όµοια στο σηµείο Ρ για το οποίο X 1 = x 1, X = x,,x k = x k θα έχουµε n παρατηρήσεις τις Υ 1, Υ,,Υ n, n 1. Συνεχίζοντας ανάλογα βρίσκουµε ότι οι n παρατηρήσεις που θα έχουµε συνολικά, ταξινοµούνται σε m οµάδες µε n j παρατηρήσεις η κάθε µια όπου n 1 + n n m = n. Μπορούµε εποµένως συνοπτικά να γράψουµε τις n παρατηρήσεις όπως παρακάτω: Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 19

20 Y, Y,..., Y ( X = x, X = x,..., X = x ) n k k1 1 Y, Y,..., Y ( X = x, X = x,..., X = x ) 1 1 n 1 1 k k... Y, Y,..., Y ( X = x, X = x,..., X = x ) m1 m m, n 1 1m m k km m Το µέρος του SSE που οφείλεται σε καθαρά σφάλµατα, µόνο από τις n 1 παρατηρήσεις στο σηµείο Ρ 1 θα είναι το άθροισµα των τετραγώνων των αποκλίσεων γύρω από το µέσο όρο Y 1, των παρατηρήσεων αυτών. Θα είναι δηλαδή n n Yls Y1 = Yls n1y 1 = ( n1 1) syl s= 1 s= ( ) όπου s Y η τυπική απόκλιση των n l 1 πρώτων παρατηρήσεων της Υ. m n Το συνολικό εποµένως καθαρό σφάλµα θα είναι το άθροισµα ( ) r SSe = Yrs Yr r= 1 s= 1 που έχει e m r βαθµούς ελευθερίας. r= 1 n = n m s Το µέσο άθροισµα τετραγώνων που οφείλεται σε καθαρά σφάλµατα θα είναι = MS = r= 1 s= 1 e e m m n ( ) r Yrs Yr r= 1 n r m που είναι ένας εκτιµητής του σ, οποιοσδήποτε και αν είναι το µοντέλο, που προσαρµόζουµε στα δεδοµένα µας. Ας συµβολίσουµε τώρα MS L το µέσο άθροισµα τετραγώνων που προκύπτει αν αφαιρέσουµε το καθαρό σφάλµα από το SSE και διαιρέσουµε µε n L = (n-k-1)-n e. Τότε µπορεί να δειχτεί ότι ο λόγος MS F = = s ( ) SSE SS / n L e se ακολουθεί κατανοµή F µε n L και n e βαθµούς ελευθερίας. e L Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 0

21 Αν ο λόγος F είναι σηµαντικός, τότε το µέρος του SSR που οφείλεται σε µη ελέγξιµους παράγοντες είναι σηµαντικά µεγαλύτερο από το µέρος που οφείλεται σε καθαρά σφάλµατα. Στην περίπτωση αυτή το s e είναι καλύτερη εκτίµηση του σ απ ότι το MSE. Μια πρώτη αντιµετώπιση είναι να προσθέσουµε δευτεροβάθµιους όρους στο µοντέλο και να ελέγξουµε την προσαρµογή του νέου µοντέλου. Αν ο λόγος F είναι ασήµαντος, τότε η ακρίβεια του µοντέλου δεν αµφισβητείται. Στην περίπτωση αυτή εκτιµούν το σ πάλι από το MSE, αν και αυτή η εκτίµηση δεν είναι πολύ διαφορετική από την s. e.1: Το πρόβληµα της Πολυσυγγραµµικότητας (Multcollnearty) Η ερµηνεία ενός προβλήµατος µε την χρησιµοποίηση της µεθόδου αναλύσεως της πολλαπλής παλινδρόµησης επιτυγχάνεται καλύτερα όταν οι ανεξάρτητες µεταβλητές που αποτελούν το µοντέλο είναι µεταξύ τους ασυσχέτιστες. Όταν υφίστανται έντονες συσχετίσεις µεταξύ των µεταβλητών είναι δύσκολο, αν όχι αδύνατο, να αξιολογηθεί η ουσιαστική προσφορά µιας συγκεκριµένης ανεξάρτητης µεταβλητής επί της εξαρτηµένης που οφείλεται αποκλειστικά στη συγκεκριµένη ανεξάρτητη µεταβλητή. Όταν οι ανεξάρτητες µεταβλητές δεν είναι ορθογώνιες µεταξύ τους είναι ενδεχόµενο οι εκτιµούµενοι συντελεστές παλινδρόµησης να είναι εξαιρετικά ασταθείς και οι τιµές τους να υφίστανται δραµατικές αλλαγές όταν κάποια νέα µεταβλητή προστίθενται ή αποµακρύνεται ή όταν µικρές µεταβολές στα δεδοµένα του προβλήµατος. Η κατάσταση η οποία δηµιουργείται όταν υπάρχουν ισχυρές συσχετίσεις µεταξύ των ανεξάρτητων µεταβλητών στην πολλαπλή παλινδρόµηση ονοµάζεται πολυσυγγραµµικότητα (multcollnearty). Στις περιπτώσεις που το πρόβληµα αυτό υφίσταται θα πρέπει κανείς να είναι ιδιαίτερα προσεκτικός στην ερµηνεία όλων των εκτιµητριών που προκύπτουν από το µοντέλο αυτό. Υπάρχει µια σειρά από προειδοποιητικές ενδείξεις που αν ο ερευνητής τις προσέξει είναι δυνατόν να αντιληφθεί ότι υπάρχει πολυσυγγραµµικότητα. Η πιο σηµαντική από αυτές είναι ο πίνακας των συντελεστών συσχετίσεως (Correlaton Matrx) των ανεξάρτητων µεταβλητών. Αν στον πίνακα αυτόν υπάρχουν µεγάλες θετικές ή αρνητικές τιµές θα έχουµε µια ένδειξη ότι οι αντίστοιχες ανεξάρτητες µεταβλητές που χρησιµοποιούνται στο µοντέλο έχουν µεταξύ τους ισχυρό βαθµό συσχέτισης. Το στατιστικό συµπέρασµα που προκύπτει στις περιπτώσεις αυτές είναι ότι κάποιες από τις µεταβλητές συνεισφέρουν ελάχιστα ή καθόλου, στην πρόβλεψη της εξαρτηµένης µεταβλητής οπότε και θα πρέπει να αποµακρυνθούν από το µοντέλο. Εάν, παρ όλα αυτά, ο ερευνητής είναι βέβαιος ότι ο καθαρισµός των ανεξάρτητων µεταβλητών έγινε σωστά και θα πρέπει να εξετάσει δύο άλλες ενδείξεις για το κατά πόσον υπάρχει πολυσυγγραµµικότητα: Εάν τα πρόσηµα ορισµένων συντελεστών στην παλινδρόµηση είναι αντίθετα από αυτά που θα περίµενε κανείς λόγω της φύσης του προβλήµατος και Εάν σηµαντικοί συντελεστές της παλινδρόµησης εµφανίζονται να έχουν µεγάλες τιµές στις τυπικές αποκλίσεις τους Οποιαδήποτε από τις δύο αυτές ενδείξεις θα πρέπει να προβληµατίσει τον ερευνητή και να τον οδηγήσει σε µια σοβαρή έρευνα για το κατά πόσον υφίστανται πολυσυγγραµµικότητα. Ο καθορισµός εκείνων των γραµµικών συνδυασµών των παραµέτρων β που µπορούν να Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 1

22 εκτιµηθούν µε ακρίβεια είναι εξαιρετικά δύσκολο στην περίπτωση που υφίστανται πολυσυγγραµµικότητα. Παρότι, εν γένει, δεν είναι δυνατόν να εξαλειφθεί τελείως το πρόβληµα αυτό υπάρχει µια διαδικασία µε την οποία ο ερευνητής µπορεί να εργασθεί µε ένα µοντέλο που προκύπτει από το αρχικό µετασχηµατισµό των αρχικών µεταβλητών σε ένα σύνολο άλλων µεταβλητών που είναι ασυσχέτιστες µεταξύ τους. Η µεθοδολογία αυτή ονοµάζεται ανάλυση κυρίων συνιστωσών (prncpal component analyss). Η τεχνική αυτή είναι µια πάρα πολύ ισχυρή τεχνική τόσο στον εντοπισµό της πολυσυγγραµµικότητας όσο και ως µεθοδολογία που οδηγεί στον καθορισµό εκείνων των γραµµικών συνδυασµών των συντελεστών παλινδρόµησης που µπορούν να εκτιµηθούν µε ακρίβεια. Μια άλλη προσέγγιση είναι να υπολογισθούν οι k συντελεστές προσδιορισµού των παλινδροµήσεων κάθε µιας από τις ανεξάρτητες µεταβλητές στις υπόλοιπες k-1 ανεξάρτητες µεταβλητές. Εκείνες οι µεταβλητές που εµφανίζουν υψηλό συντελεστή προσδιορισµού θα πρέπει να θεωρηθεί ότι είναι συγγραµµικές µε τουλάχιστον µια από τις υπόλοιπες µεταβλητές. Στη συνέχεια θα πρέπει να υπολογισθεί η οµάδα εκείνων των µεταβλητών που έχουν υψηλή πολυσυγγραµµικότητα και µια ή περισσότερες από αυτές τις µεταβλητές µέσα στη συγκεκριµένη οµάδα θα πρέπει να αποµακρυνθούν πριν προχωρήσει κανείς σε ανάλυση παλινδρόµησης για την αρχική εξαρτηµένη µεταβλητή. Συµπερασµατικά, µε τον όρο πολυσυγγραµµικότητα (multcollnearty), εννοούµε την ύπαρξη µιας ανεξάρτητης µεταβλητής X j που είναι γραµµικά συσχετισµένη µε µια άλλη ανεξάρτητη µεταβλητή ή µε ένα γραµµικό συνδυασµό άλλων ανεξάρτητων µεταβλητών. Η πολυσυγγραµµικότητα είναι αρκετά συχνό φαινόµενο, ιδιαίτερα όταν τα δεδοµένα προέρχονται από κοινωνικές ή οικονοµικές µελέτες και είναι από τις κυριότερες αιτίες για την εξαγωγή λαθεµένων συµπερασµάτων στην πολλαπλή γραµµική παλινδρόµηση. Η ύπαρξη πολυσυγγραµµικότητας συνεπάγεται την αύξηση των τυπικών σφαλµάτων των συντελεστών παλινδρόµησης. Μάλιστα αν υπάρχει πλήρης ή τέλεια πολυσυγγραµµικότητα αν δηλ. X λ λ X = + τότε ο πίνακας σχεδιασµού Χ έχει βαθµό µικρότερο του k+1 δηλ. j 0 j είναι ιδιάζων και εποµένως δεν µπορούν να βρεθούν συντελεστές παλινδρόµησης. Όσο περισσότερο προσεγγίζεται η παραπάνω ακραία περίπτωση τόσο περισσότερο προσεγγίζεται η παραπάνω ακραία περίπτωση, τόσο περισσότερες υπολογιστικές δυσκολίες δηµιουργούνται. Η απαλοιφή της µεταβλητής Χ j δεν λύνει πάντα το πρόβληµα διότι σε αυτήν την περίπτωση οι συντελεστές παλινδρόµησης των υπολοίπων µεταβλητών δεν εκτιµούνται αµερόληπτα. Πράγµατι ας θεωρήσουµε το µοντέλο Y = β 0 + β 1 Χ 1 + β Χ + ε (.1) όπου οι µεταβλητές Χ 1, Χ είναι γραµµικά συσχετισµένες. Αν η γραµµική συσχέτιση είναι πλήρης δηλ. αν X = λ + µχ 1 τότε όπως είναι γνωστό r ± X1, X 1 = αλλιώς αν η γραµµική συσχέτιση είναι σχεδόν πλήρης τότε X1, X Εν συνεχεία µπορούµε να δείξουµε ότι ισχύει r είναι περισσότερο ή λιγότερο κοντά στο +1. Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα

23 ) ε s( β1) = X1 X1 1 r n 3 ( ) ( ) ( X ) 1, X ) ε s( β) = X X 1 r n 3 X1, X 1 ( ) ( ) ( X ) 1, X 1/ 1/ Αν r ± τότε = s( ) β 1), s( ) β ) απειρίζονται, ενώ όσο περισσότερο πλησιάζει το r την τιµή 1 τόσο περισσότερο µεγαλώνουν οι τυπικές αποκλίσεις των ) β 1, ) β. Το ίδιο συµβαίνει και όταν υπάρχουν περισσότερες µεταβλητές. Μπορεί όµως σε αυτήν την περίπτωση να έχουµε ακόµη και πλήρη πολυσυγγραµµικότητα, π.χ. X = X 3 + Χ 4 χωρίς να έχουµε µεγάλες ανά δύο συσχετίσεις των προβλεπουσών µεταβλητών. Έτσι ο έλεγχος και µόνο του πίνακα των συσχετίσεων δεν αποκαλύπτει πάντα την ύπαρξη πολυσυγγραµµικότητας. Ας υποθέσουµε τώρα ότι επειδή r X1, X είναι αρκετά µεγάλο, απαλείφουµε τη µεταβλητή ) ) ) Χ, θεωρώντας ως καταλληλότερο το µοντέλο Y = b0 + b1 X1. Τότε µπορεί να δειχτεί ότι ) Eb = β + β 1 1 s S X X 1 r X X 1 δηλαδή για να είναι ο b ) 1αµερόληπτος εκτιµητής του β 1 θα πρέπει είτε β = 0 είτε r X1X =0. X1, X Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 3

24 .13: Αµφικλινής Παλινδρόµηση (Rdge Regresson) Μια εναλλακτική µέθοδος για την αντιµετώπιση της πολυγραµµικότητας είναι µέθοδος της αµφικλινούς παλινδρόµησης (rdge regresson). Η µέθοδος αυτή προτάθηκε από το Hoerl (196) και αναλύθηκε µε λεπτοµερή τρόπο από τους Hoerl & Kennard (1970). Η διαδικασία που προτείνεται µε τη µέθοδο αυτή έχει ως στόχο να ξεπεράσει τη δυσκολία που δηµιουργείται από την ύπαρξη συσχέτισης µεταξύ των ανεξάρτητων µεταβλητών. Σύµφωνα µε τν µέθοδο αυτή προστίθεται µια σταθερά Θ στα στοιχεία της διαγωνίου του πίνακα. Ζ Ζ όπου: Z x11 x1... x1k x x... x xm 1 xm... xmk 1 k = (Ζ είναι δηλαδή ο πίνακας που έχει ως στήλες του τις παρατηρήσεις των ανεξάρτητων µεταβλητών Χ 1,Χ,,Χ k). Οι εκτιµήτριες των συντελεστών παλινδρόµησης της µεθόδου αυτής δίνονται από τον ) * τύπο: β = ( + ) 1 Z Z ki Z Y Οι εκτιµητές που προκύπτουν από την µέθοδο αυτή είναι πάντοτε µεροληπτικοί αλλά οι διασπορές τους είναι αισθητά µικρότερες από αυτές των εκτιµητριών ελαχίστων τετραγώνων. Οι λόγοι που οι εκτιµήτριες τετραγώνων χρησιµοποιούνται περισσότερο στις µεθόδους παλινδρόµησης οφείλονται στο ότι είναι απλές όσον αφορά τον υπολογισµό τους, γεωµετρικά αισθητές και µε δεδοµένο ότι κάποιες υποθέσεις ισχύουν µε απόλυτο τρόπο είναι βέλτιστες για µια σειρά από κριτήρια. Οι εκτιµήτριες ελαχίστων τετραγώνων έχουν χρησιµοποιηθεί µε επιτυχία για περισσότερα από 160 χρόνια. Τα τελευταία χρόνια, κυρίως λόγω της πληθώρας των ηλεκτρονικών υπολογιστών διαφόρων µορφών που είναι διαθέσιµοι, έχουν αναπτυχθεί και χρησιµοποιούνται µια σειρά από άλλες εκτιµήτριες κυρίως για να καλύψουν κάποιες συγκεκριµένες αδυναµίες της µεθόδου ελαχίστων τετραγώνων. (Για παράδειγµα οι εκτιµήτριες που αναφέραµε στη µέθοδο της αµφικλινούς παλινδρόµησης αναπτύχθηκαν για να ξεπερασθεί το πρόβληµα που δηµιουργείται στις εκτιµήτριες της παλινδρόµησης από το πρόβληµα της πολυσυγγραµµικότητας).14: Όριο ανοχής Ο χαρακτηρισµός µιας ανεξάρτητης µεταβλητής Χ ως σηµαντικής για την πρόβλεψη των τιµών της Υ, εξαρτάται όπως προκύπτει από τα προηγούµενα όχι µόνο από την εκτίµηση ) β του συντελεστού παλινδρόµησης της X, αλλά και από το τυπικό σφάλµα µε το οποίο εκτιµάται ο συντελεστής ) β δηλ, από το ( ) s β ). Συντελεστές µε µεγάλα τυπικά σφάλµατα Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 4

25 θεωρούνται µη αξιόπιστοι και µπορούν να παίρνουν πολύ διαφορετικές τιµές για διαφορετικά δείγµατα. Η ύπαρξη πολυσυγγραµµικότητας µεταξύ των ανεξάρτητων µεταβλητών έχει ως αποτέλεσµα την εκτίµηση συντελεστών παλινδρόµησης µε µεγάλα τυπικά σφάλµατα. Πράγµατι µπορεί να δειχτεί ότι s ( ) ) s β = (1 R )( N 1) s όπου s είναι η διασπορά των σφαλµάτων στο µοντέλο Y = Xβ+ ε, s είναι η διασπορά της µεταβλητής X και R ο συντελεστής προσδιορισµού του µοντέλου X = X ( ) β( ) + ε που θεωρεί τη µεταβλητή X ως εξαρτηµένη από τις υπόλοιπες ανεξάρτητες µεταβλητές. Με Χ και β συµβολίσαµε όπως και προηγούµενα τους πίνακες που προκύπτουν από τους Χ και β µε τη διαγραφή της στήλης τους που αντιστοιχεί στη µεταβλητή Χ. Η ποσότητα R πλησιάζει την µονάδα αν υπάρχει µεγάλη πολυσυγγραµµικότητα στα δεδοµένα αν δηλ. η µεταβλητή είναι περίπου γραµµικός συνδυασµός των υπόλοιπων ανεξάρτητων µεταβλητών. Στη περίπτωση αυτή είναι φανερό ότι η ποσότητα 1-R πλησιάζει το µηδέν και εποµένως το τυπικό σφάλµα του συντελεστή ) β αυξάνει. Μάλιστα για σταθερό µέγεθος δείγµατος και σταθερή διασπορά σφαλµάτων το τυπικό σφάλµα αυξάνει τόσο περισσότερο όσο µικρότερο γίνεται το 1 R. Αν όµως το 1- R γίνει αρκετά µικρό τότε είναι ενδεχόµενο να έχουµε και υπολογιστικά προβλήµατα. Έτσι ορίζουµε ανάλογα µε την αριθµητική που χρησιµοποιούµε µια οριακή τιµή που λέγεται όριο ανοχής (tolerance bound) και είναι τέτοια ώστε αν το 1-R γίνει µικρότερο από το όριο ανοχής να αποκλείσουµε την µεταβλητή X από το µοντέλο παλινδρόµησης. Το όριο ανοχής που δέχεται αυτόµατα το SPSS στις νεώτερες παραλλαγές του είναι Τ= ενώ σε παλιότερες ήταν Υπάρχει τρόπος όµως να ορίσουµε ως όριο ανοχής και κάποια άλλη µεγαλύτερη τιµή ώστε να αποκλείσουµε µεταβλητές που έχουν µεγάλη πολυσυγγραµµικότητα. Στο πρόγραµµα REGRESSION SPSS η τιµή 1-R αναφέρεται ως ανοχή (TOLERANCE) της µεταβλητής X και η τιµή αυτή συγκρίνεται µε το όριο ανοχής. Αν η «ανοχή της X» είναι µικρότερη του ορίου ανοχής Τ η µεταβλητή Χ δεν µπαίνει στο µοντέλο ακόµη και αν η συµµετοχή της θα εξηγούσε µεγάλο µέρος της ανεξήγητης διασποράς. Τέλος είναι δυνατό η προσθήκη µιας µεταβλητής στο µοντέλο µε επιτρεπή ανοχή να ελαττώσει τόσο πολύ την ανοχή κάποιας άλλης µεταβλητής που υπήρχε ήδη στο µοντέλο και έτσι να δηµιουργηθεί πρόβληµα. Γι αυτό το SPSS για κάθε µεταβλητή που δεν είναι στο µοντέλο υπολογίζει όχι µόνο την δική της ανοχή που θα είχε αν συµµετείχε στο µοντέλο αλλά και όλως των άλλων µεταβλητών που είναι στο µοντέλο. Τυπώνει τέλος ως ελάχιστη ανοχή (MIN TOLER) τη µικρότερη από τις τιµές αυτές. Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 5

26 - Κεφάλαιο 3: Η εξέταση των Υ ολοί ων 3.1: Εισαγωγή Τα υπόλοιπα e ορίζονται ως οι n διαφορετικές ε = Y Y ), =1,,., n όπου Υ είναι µια παρατήρηση και Y ) είναι η αντίστοιχη προσαρµοσµένη τιµή που προσδιορίζεται από την προσαρµοσµένη εξίσωση παλινδρόµησης. Από τον ορισµό αυτό µπορούµε να δούµε ότι τα υπόλοιπα e είναι οι διαφορές µεταξύ αυτού που πραγµατικά παρατηρείται και αυτού που προβλέπεται από την εξίσωση παλινδρόµησης, δηλαδή είναι η ποσότητα την οποία η εξίσωση της παλινδρόµησης δεν είναι ικανή να ερµηνευτεί. Έτσι µπορούµε να θεωρήσουµε τα e ως τα παρατηρούµενα σφάλµατα αν το µοντέλο είναι σωστό. Για να εκτελέσουµε τώρα την ανάλυση της παλινδρόµησης κάνουµε συγκεκριµένες υποθέσεις για τα σφάλµατα, οι συνήθεις υποθέσεις είναι ότι τα σφάλµατα είναι ανεξάρτητα, έχουν µέση τιµή µηδέν, σταθερή διασπορά σ και ακολουθούν µια κανονική κατανοµή. Η τελευταία υπόθεση απαιτείται για να κάνουµε F ελέγχους. Έτσι αν το µοντέλο προσαρµογής είναι σωστό, τα υπόλοιπα θα πρέπει να παρουσιάζουν τάσεις που τείνουν να επιβεβαιώσουν τις υποθέσεις που κάναµε ή το λιγότερο δεν θα πρέπει να παρουσιάζουν µια άρνηση των υποθέσεων. Την τελευταία αυτή ιδέα θα πρέπει να τη διατηρούµε στο µυαλό µας όταν εξετάζουµε τα υπόλοιπα και οφείλουµε να διερωτηθούµε: είχνουν τα υπόλοιπα ότι οι υποθέσεις µας είναι λανθασµένες. Αφού εξετάσουµε τα υπόλοιπα τότε θα είµαστε σε θέση να συµπεράνουµε (1) ότι οι υποθέσεις φαίνεται ότι παραβιάζονται (µε τρόπο που µπορεί να προσδιοριστεί) () ότι οι υποθέσεις δε φαίνεται να παραβιάζονται. Σηµειώνουµε ότι η περίπτωση () δεν σηµαίνει ότι καταλήγουµε στο συµπέρασµα ότι οι υποθέσεις είναι σωστές, απλά σηµαίνει ότι µε βάση τα διαθέσιµα δεδοµένα δεν έχουµε λόγο να πούµε ότι οι υποθέσεις δεν είναι σωστές. Το ίδιο ισχύει και στις περιπτώσεις ελέγχου υποθέσεων όπου είτε απορρίπτουµε είτε δεν απορρίπτουµε (πάρα αποδεχόµαστε) τη µηδενική υπόθεση. Τώρα θα δώσουµε τρόπους εξέτασης των υπολοίπων για να ελέγξουµε το µοντέλο. Όλοι αυτοί οι τρόποι είναι γραφικοί, εύκολα εφαρµόσιµοι και συνήθως πολύ αποκαλυπτικοί όταν οι υποθέσεις παραβιάζονται. Οι βασικοί τρόποι για να παραστήσουµε γραφικά τα υπόλοιπα e είναι 1. Συνολικά.. Σε χρονική ακολουθία, αν είναι γνωστή η σειρά. 3. Ως προς τις προσαρµοσµένες τιµές Y ). 4. Ως προς τις ανεξάρτητες µεταβλητές Χ j, για j = 1,,..k 5. Με κάθε τρόπο που είναι λογικός για το ειδικότερο πρόβληµα που εξετάζεται. 3.: Συνολικό ιάγραµµα Αν το µοντέλο µας είναι σωστό τα υπόλοιπα αυτά θα πρέπει να µοιάζουν µε παρατηρήσεις από µια κανονική κατανοµή µε µέση τιµή µηδέν. Πρώτα σηµειώνουµε ότι η µέση τιµή των υπολοίπων είναι µηδέν, αλλά αυτό αναγκαστικά συµβαίνει σε κάθε µοντέλο παλινδρόµησης που περιλαµβάνει ένα σταθερό όρο β 0. Αυτό εύκολα φαίνεται από την πρώτη κανονική εξίσωση που προκύπτει διαφορίζοντας το Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 6

27 άθροισµα τετραγώνων των σφαλµάτων ως προς β 0. Αν το µοντέλο προσαρµογής είναι E( Y) = β0+ β1x βk X k, η εξίσωση µπορεί να γραφεί ως ( Y b b X b X )... = k k όπου το άθροισµα λαµβάνεται για =1,,..,n. Η εξίσωση αυτή ανάγεται στην ) ( Y Y) = 0 Εποµένως ισχύει e e = = 0 n Μια εναλλακτική διαδικασία είναι να κατασκευάσουµε είτε ένα κανονικό διάγραµµα (normal plot) είτε ένα ηµικανονικό διάγραµµα (half normal plot) των υπολοίπων σε χαρτί τυπικής πιθανότητας. Τα σηµεία θα πέφτουν κατά προσέγγιση πάνω σε µια ευθεία γραµµή. Ωστόσο, για µια ακόµα φορά, απαιτούνται κανόνες αξιολόγησης του διαγράµµατος. Όταν ο αριθµός των υπολοίπων είναι πολύ µεγάλος, το συνολικό διάγραµµα µπορεί να γίνει σε µορφή ιστογράµµατος αντί σε µορφή στικτού διαγράµµατος. Σ αυτή την περίπτωση, το κανονικό ή το ηµικανονικό διάγραµµα µπορεί να κατασκευαστεί µόνο από µια συλλογή των µικρότερων παρατηρήσεων, για παράδειγµα µε (έστω, π.χ.) 00 παρατηρήσεις, στο ηµικανονικό διάγραµµα µπορούµε να χρησιµοποιήσουµε τη 10 η µικρότερη, 0 η µικρότερη κτλ µέχρι (έστω, π.χ.)την 180 η και κατόπιν να κατασκευάσουµε το διάγραµµα όλων όσων αποµένουν στις οποίες είναι πιθανό να παρατηρηθεί η εκτός-ουράς της κατανοµής συµπεριφορά. Η Μορφή Τυπικής Κανονικής Απόκλισης των Υπολοίπων Συνήθως υποθέτουµε ότι ε N( 0, σ ) σωστό, το µέσο τετράγωνο υπολοίπων, έτσι ώστε e / σ N(0,1). Τώρα αν το µοντέλο είναι s n n ( e ) 1 e e = = 1 = = ( n p) ( n p) εκτιµά τη σ. (Αν αγνοήσουµε το σφάλµα στρογγυλοποίησης τότε e = e / n= 0 ). Η ποσότητα e /s συχνά ονοµάζεται µορφή της τυπικής κανονικής απόκλισης (unt normal devate form) του υπολοίπου e. Τα e /s, =1,,.n, µπορούν να εξεταστούν σε ένα συνολικό διάγραµµα για να δούµε αν η υπόθεση ε /σ Ν(0,1) είναι λανθασµένη. Επειδή το 95% µιας Ν(0,1) κατανοµής βρίσκεται µεταξύ των ορίων (-1.96, 1,96) µπορούµε να αναµένουµε (κατά προσέγγιση) ότι χονδρικά το 95% των e/s είναι µεταξύ των ορίων (-, ). Επιβλέπων Καθηγητής: Μεγαρίτης Αθανάσιος Σελίδα 7

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

x y max(x))

x y max(x)) ΚΕΦΑΛΑΙΟ 0 Απλή Γραµµική Παλινδρόµηση Μωυσιάδης Χρόνης 6 o Εξάµηνο Μαθηµατικών Ένα Πρόβληµα εδοµένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 y 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Έχει σχέση το yµε το ; Ειδικότερα

Διαβάστε περισσότερα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή Ανάλυση Συνδιακύµανσης Alsis of Covrice Η ανάλυση συνδιακύµανσης είναι µία άλλη τεχνική για να βελτιώσουµε την ακρίβεια της προσέγγισης του µοντέλου µας στο πείραµα. Ας υποθέσουµε ότι σ ένα πείραµα εκτός

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 4 Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου ΠΡΟΛΟΓΟΣ Η γραμμική παλινδρόμηση χρησιμοποιείται για την μελέτη των σχέσεων μεταξύ μετρήσιμων μεταβλητών. Γενικότερα, η γραμμική στατιστική συμπερασματολογία αποτελεί ένα ευρύ πεδίο της στατιστικής ανάλυσης

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 9 ο 9.1 ηµιουργία µοντέλων πρόβλεψης 9.2 Απλή Γραµµική Παλινδρόµηση 9.3 Αναλυτικά για το ιάγραµµα ιασποράς

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Κεϕάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεϕάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ Μετά από την εκτίµηση των παραµέτρων ενός προσοµοιώµατος, πρέπει να ελέγχουµε την αλήθεια της υποθέσεως που κάναµε. Είναι ορθή η υπόθεση που κάναµε? Βεβαίως συνήθως υπάρχουν

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Στα πλαίσια της ΣΤΑΤΙΣΤΙΚΗΣ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑΣ προσπαθούµε να προσεγγίσουµε τα χαρακτηριστικά ενός συνόλου (πληθυσµός) δια της µελέτης των χαρακτηριστικών αυτών επί ενός µικρού

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Πρακτική µε στοιχεία στατιστικής ανάλυσης

Πρακτική µε στοιχεία στατιστικής ανάλυσης Πρακτική µε στοιχεία στατιστικής ανάλυσης 1. Για να υπολογίσουµε µια ποσότητα q = x 2 y xy 2, µετρήσαµε τα µεγέθη x και y και βρήκαµε x = 3.0 ± 0.1και y = 2.0 ± 0.1. Να βρεθεί η ποσότητα q και η αβεβαιότητά

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5 ΤΟ ΠΛΕΟΝΕΚΤΗΜΑ ΤΩΝ ΥΠΟΨΗΦΙΩΝ ΠΑΛΑΙΟΤΕΡΩΝ ΕΤΩΝ

ΚΕΦΑΛΑΙΟ 5 ΤΟ ΠΛΕΟΝΕΚΤΗΜΑ ΤΩΝ ΥΠΟΨΗΦΙΩΝ ΠΑΛΑΙΟΤΕΡΩΝ ΕΤΩΝ ΚΕΦΑΛΑΙΟ 5 ΤΟ ΠΛΕΟΝΕΚΤΗΜΑ ΤΩΝ ΥΠΟΨΗΦΙΩΝ ΠΑΛΑΙΟΤΕΡΩΝ ΕΤΩΝ Εισαγωγή Στο κεφάλαιο αυτό διερευνούµε αν το να είναι κανείς υποψήφιος παλαιοτέρων ετών, που έχει δώσει τουλάχιστον µια φορά εξετάσεις, του προσδίδει

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων Γρεβενά Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Ιδιότητες εκτιμώμενης ευθείας παλινδρόμησης με τη μέθοδο των ελαχίστων

Διαβάστε περισσότερα

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής. 2.6 ΟΡΙΑ ΑΝΟΧΗΣ Το διάστηµα εµπιστοσύνης παρέχει µία εκτίµηση µιας άγνωστης παραµέτρου µε την µορφή διαστήµατος και ένα συγκεκριµένο βαθµό εµπιστοσύνης ότι το διάστηµα αυτό, µε τον τρόπο που κατασκευάσθηκε,

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων Φίλτρα Kalman Εξαγωγή των εξισώσεων τους µε βάση το κριτήριο ελαχιστοποίησης της Μεθόδου των Ελαχίστων Τετραγώνων. Αναλυτικές Μέθοδοι στη Γεωπληροφορική Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ ιατύπωση του

Διαβάστε περισσότερα

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια Αθήνα, 6-4-7 Γραμμικά Μοντέλα Λύσεις Ασκήσεων η Άσκηση: (α) Eίναι η σχέση μεταξύ των δύο μεταβλητών γραμμική; Διάγραμμα Διασποράς Για το Υψόμετρο & τις Αρνητικές Τιμές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο Πολλαπλή παλινδρόµηση Μάθηµα 3 ο Πολλαπλή παλινδρόµηση (Multivariate regression ) Η συµπεριφορά των περισσότερων οικονοµικών µεταβλητών είναι συνάρτηση όχι µιας αλλά πολλών µεταβλητών Y = f ( X, X 2, X

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι Πανεπιστημίου Πειραιώς) Τηλ.: 4..97,,, Fax : 4..634 URL : www.vtal.gr emal: f@vtal.gr Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 5: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (1 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: ageliki.papaa@gmail.com, agpapaa@auth.gr Webpage: http://users.auth.gr/agpapaa

Διαβάστε περισσότερα

στατιστική θεωρεία της δειγµατοληψίας

στατιστική θεωρεία της δειγµατοληψίας στατιστική θεωρεία της δειγµατοληψίας ΕΙΓΜΑΤΟΛΗΨΙΑ : Εισαγωγή δειγµατοληψία Τα στοιχεία που απαιτούνται τόσο για την ανάλυση των µεταφορικών συστηµάτων και όσο και για την ανάπτυξη των συγκοινωνιακών µοντέλων

Διαβάστε περισσότερα

Στατιστική για Χημικούς Μηχανικούς Συσχέτιση και Γραμμική Παλινδρόμηση. Κουγιουμτζής Δημήτριος Τμήμα Χημικών Μηχανικών

Στατιστική για Χημικούς Μηχανικούς Συσχέτιση και Γραμμική Παλινδρόμηση. Κουγιουμτζής Δημήτριος Τμήμα Χημικών Μηχανικών Στατιστική για Χημικούς Μηχανικούς Συσχέτιση και Γραμμική Παλινδρόμηση Κουγιουμτζής Δημήτριος Τμήμα Χημικών Μηχανικών Θεσσαλονίκη, Μάιος 15 Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ Α εξεταστική περίοδος χειµερινού εξαµήνου 4-5 ιάρκεια εξέτασης ώρες και 45 λεπτά Θέµατα Θέµα (α) Τα υποδείγµατα που χρησιµοποιούνται στην οικονοµική θεωρία ονοµάζονται ντετερµινιστικά ενώ τα οικονοµετρικά

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές ΠΜΣ στη «Ναυτιλία» Τμήμα Β Part tme Χαράλαμπος Ευαγγελάρας hevangel@unp.gr Έλεγχοι υποθέσεων Εισαγωγή Έστω ότι ασχολούμαστε με ένα χαρακτηριστικό, το οποίο

Διαβάστε περισσότερα

1 Ορισµός ακολουθίας πραγµατικών αριθµών

1 Ορισµός ακολουθίας πραγµατικών αριθµών ΜΑΣ 02. Απειροστικός Λογισµός Ι Ορισµός ακολουθίας πραγµατικών αριθµών Ορισµός.. Ονοµάζουµε ακολουθία πραγµατικών αριθµών κάθε απεικόνιση του συνόλου N των ϕυσικών αριθµών, στο σύνολο R των πραγµατικών

Διαβάστε περισσότερα

Y Y ... y nx1. nx1

Y Y ... y nx1. nx1 6 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ ΤΗ ΧΡΗΣΗ ΠΙΚΑΚΩΝ Η χρησιμοποίηση και ο συμβολισμός πινάκων απλοποιεί σημαντικά τα αποτελέσματα της γραμμικής παλινδρόμησης, ιδίως στην περίπτωση της πολλαπλής παλινδρόμησης Γενικά,

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) 1. Έχοντας στη διάθεσή μας ένα δείγμα, προκύπτει ότι το 95% διάστημα εμπιστοσύνης για το μέσο μ ενός κανονικού

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα