ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creatve Commo. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Αθηνών» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3
Σκοποί ενότητας Είναι η πιθανοθεωρητική θεμελίωση της απλής γραμμικής παλινδρόμησης 4
Περιεχόμενα ενότητας Διαγράμματα διασποράς Μονοδιάστατη παλινδρόμηση Τύποι διασποράς συνδιασποράς Διαστήματα εμπιστοσύνης για τις παραμέτρους της εξίσωσης Συντελεστής προσαρμογής Συντελεστής συσχέτισης Εφαρμογές Άλυτες ασκήσεις
Παλινδρόμηση - Συσχέτιση παραδοσιακός τρόπος περιγραφής της σχέσης μεταξύ δύο ή περισσοτέρων μεταβλητών, είναι η εξεύρεση μιας συναρτησιακής σχέσης που τις συνδέει, π.χ. U I R Νόμος του O h m E r Νόμος του κύκλου και γενικότερα,, g g,, εξηρτημένη μεταβλητή ανεξάρτητη μεταβλητή : Στην περίπτωση τυχαίων μεταβλητών η εξεύρεση μιας συναρ-τησιακής σχέσης της παραπάνω μορφής είναι πρακτικά αδύνατη. Σε κάθε τιμή της (ανεξάρτητης ή ελεγχόμενης μεταβλητής) αντιστοιχεί ένα πλήθος δυνατών τιμών της (εξηρτημένης ή μη ελεγχόμενης μεταβλητής). π.χ. ύψος γιού - ύψος πατέρα ποσό διαφήμισης - κέρδος επιχείρησης εισόδημα - εκταμίευση
Διαγράμματα Διασποράς Η γραφική παράσταση των δειγματικών σημείων στο σύστημα καρτεσιανών συντεταγμένων ονομάζεται διάγραμμα διασποράς (catter dagram) και δίνει χρήσιμες πληροφορίες για την εξειδίκευση του μοντέλου : ετήσιο εισόδημα οικογένειας : ετήσια έξοδα διατροφής : καταπόνηση υλικού : ωφέλιμη διάρκεια ζωής
3 4 : κόστος προϊόντος : συνολικές αποδοχές : ηλικία εργαζομένων : απόσταση από τη θέση εργασίας : ετήσιος αριθμός οχημάτων : ετήσιο πλήθος θανάτων από από καρκίνο 5 3 4 5 γραμμική σχέση αντιγραμμική σχέση μη γραμμική σχέση καμία σχέση «φορμαλιστική» σχέση, μη ουσιαστική
Παλινδρόμηση : εκτίμηση της μέσης τιμής της Υ για διάφορα. : ελεγχόμενη, : τυχαία Συσχέτιση : εκτίμηση του βαθμού «συνάφειας» μεταξύ των X και X και τυχαίες μεταβλητές Μονοδιάστατη Παλινδρόμηση : Υ : ύψος γιού ; : ύψος πατέρα μόνο μία ανεξάρτητη μεταβλητή Πολυδιάστατη Παλινδρόμηση : ανεξάρτητες μεταβλητές,,, Υ : ύψος γιού ; : : ύψος ύψος πατέρα μητέρας 3 : ποιότης διατροφής Στα πλαίσια της παλινδρόμησης, οι είναι καθορισμένες. ελέγχονται από τον «ερευνητή» και Στα πλαίσια της συσχέτισης, και εκλαμβάνονται ως τυχαίες
Μονοδιάστατη Παλινδρόμηση f f f 3 3 E g δεσμευμένη μέση τιμή της Υ 3 Γραμμικό μοντέλο : E
Μονοδιάστατη Παλινδρόμηση Μέση τιμή της Υ E E μέση τιμή της Υ, αν γνωρίζουμε την τιμή της f δεσμευμένη συνάρτηση πυκνότητας της Υ δεσμευμένη διασπορά της Υ Συνήθεις παραδοχές N, f Οι δεσμευμένες συναρτήσεις είναι κανονικές : Η δεσμευμένη διασπορά ( Ο μ ο σ κ ε δ α σ τ ι κ ό τ η τ α ) είναι ανεξάρτητη του
, E τυχαίο σφάλμα Υποθέσεις : f VAR E, 0 ( ομοσκεδαστικότητα ) και ε κανονικά κατανεμημένο, 0 N ~ E E 0
Μετατροπή μη γραμμικών μοντέλων σε γραμμικά E b g μέση πυκνότητα διαλυμένου οξυγόνου θερμοκρασία διαλύματος όπου g () : ή e ή l κ.τ.λ. Ορίζοντας μια νέα ανεξάρτητη μεταβλητή E g π.χ. γραμμική Z ep b l z b Z b Z b
Εκτίμηση των παραμέτρων α και β, ευθεία παλινδρόμησης Η εκτίμηση των α και β γίνεται με το σκεπτικό της ελαχιστοποίησης των τετραγώνων των αποκλίσεων των παρατηρήσεων από την ευθεία ( Μέθοδος ελαχίστων τετραγώνων ) m παρατήρηση σημείο στην ευθεία παλινδρόμησης
E γραμμικό μοντέλο μονοδιάστατης παλινδρόμησης 0,,, 0 N VAR E ~ ευθεία παλινδρόμησης α, β : πραγματικοί παράμετροι μοντέλου :, εκτιμήσεις ελαχίστων τετραγώνων των α και β : ŷ εκτίμηση του E ή
, F 0, F A και 0, F 0 A 0 ^ ^ Το σημείο βρίσκεται επί της ευθείας παλινδρόμησης,
0 0 0 ^ ά συνδιασπορ δειγματική : του διασπορά δειγματική :
X X E τετραγωνικός μέσος Τύποι Δειγματικής Διασποράς Τύποι Διασποράς
X E X Cov, X X E X Cov, E X E X E X E X E Επειδή E X E X E αν οι μεταβλητές Χ, Υ ανεξάρτητες, έχουμε : ς ανεξάρτητε, αν, 0, X X Cov Τύποι Συνδιασποράς (covarace)
Τύποι Δειγματικής Συνδιασποράς
Παράδειγμα Εξετάζοντας τη σχέση μεταξύ του ετήσιου οικογενειακού εισοδήματος και των ετήσιων εξόδων διατροφής, είχαμε το εξής δείγμα 0 οικογενειών. οικογένεια 000 σε $ 00 σε $ A B C D E F G 8 0 7 4 6 7 3 8 9 4 0 5 0 5 0 5 D H I J 6 4 6 8 6 9 4 6 8 0 Διάγραμμα Διασποράς
A B 0 8 76 64 484 3 30 00 59 C 7 8 6 49 34 D 9 8 4 8 E 4 4 56 6 96 F 6 0 0 36 400 G 7 45 49 44 H 6 8 08 36 34 I 4 6 64 6 56 J 6 9 4 36 36 : 6 0 80 59 406 3396 60 0 6 ; 80 0 8 59 406 0 0 6 8 36, 77 8,77 6 7,698 7,698, 77 ευθεία παλινδρόμησης
ŷ 5 0 5.486, 8 $ ŷ 7, 698, 77 4, 868 σε εκατοντάδε ς $ 0 5, 6, 8 : επί ευθείας παλινδρόμησης 0 4 6 8 0 π.χ. πόσο ξοδεύει για διατροφή κατά μέσον όρο μια οικογένεια με εισόδημα 0.000$
7, 698,77 0 4, 868.486, 8 $ Η τιμή.486,8 $ αποτελεί εκτίμηση του μεγέθους 0.000 0.000 Στην παλινδρόμηση διακρίνουμε δύο βασικές κατηγορίες ερωτημάτων εκτίμηση του δεσμευμένου μέσου της μεταβλητής Υ. Η αντίστοιχη σημειακή εκτιμήτρια είναι η εκάστοτε τιμή της γραμμής παλινδρόμησης, δηλ. η ŷ. Παραμένει ο υπολογισμός διαστήματος εμπιστοσύνης για το. π.χ. πόσο ξοδεύει για διατροφή κατά μέσο όρο μια οικογένεια με ετήσιο εισόδημα 0.000 $. Η τιμή.486.8 $ αποτελεί σημειακή εκτίμηση του δεσμευμένου μέσου 0.000 0.000. Παραμένει η εκτίμηση κατά διάστημα, δηλ. ο υπολογισμός διαστήματος που να περικλείει το εκάστοτε με δεδομένη πιθανότητα -α.
πρόγνωση πιθανολογικών χαρακτηριστικών της Υ ( όχι των δεσμευμένων μέσων τιμών ) για δεδομένο. π.χ. ποιο ποσοστό οικογενειών με ετήσιο εισόδημα = 0.000 $ έχει έξοδα διατροφής Υ : κ.τ.λ. - μεταξύ 3.000 και 5.000 $ - > των 3.500 δολ. 0.000 0.000.486, 8
Διαστήματα εμπιστοσύνης και διαστήματα πρόγνωσης στην Παλινδρόμηση Σημαντικό ρόλο για την «μέτρηση» της αβεβαιότητας των εκτιμήσεων / προγνώσεων στην παλινδρόμηση, παίζει το μέγεθος : VAR : δεσμευμένη διασπορά : τ υ π ι κ ό σ φ ά λ μ α ( t a d a r d e r r o r ) Το της, δηλ. είναι ένα μέτρο για την μεταβλητικότητα της Υ γύρω από την δεσμευμένη μέση τιμή VAR, όπου : γραμμικό μοντέλο
Το μέγεθος αποτελεί γνώρισμα του πληθυσμού και ως εκ τούτου δεν εξαρτάται από την τάξη του εκάστοτε δείγματος Από την εξειδίκευση του γραμμικού μοντέλου, έχουμε : 0, ~ N : ομοσκεδαστικότητα f VAR VAR VAR σταθερό για δεδομένο παρατηρήσεις εκτίμηση του εκτιμήτρια του - βαθμοί ελευθερίας λόγω των δύο δεσμεύσεων για την εκτίμηση των α και β
Λόγω της σχέσης : καλή προσαρμογή στην ευθεία παλινδρόμησης, συνεπάγεται μικρά σφάλματα μικρό τυπικό σφάλμα. Στην ακραία περίπτωση που όλα τα σημεία ε,, βρίσκονται επί της ευθείας παλινδρόμησης, τα μεγέθη και μηδενίζονται. 0 μικρό μεγάλο
Στη πράξη, χρησιμοποιείται η παρακάτω εκτιμήτρια : ] [ που είναι ισοδύναμη με την προηγούμενη, αλλά πιο εύχρηστη. Η ισοδυναμία δείχνεται ως εξής : ] [ Έχουμε : 0
από ελάχιστα τετράγωνα 0 ] [ ] [
Παράδειγμα Στο παράδειγμα, ετήσιο οικογενειακό εισόδημα ετήσια έξοδα διατροφής Υ, είχαμε : 3.396, 80, 59 7, 698 και,77 0 3.396 7,698 80,77 59, 54,59 ( σε εκατοντάδες $ ) όπου εκτίμηση του τυπικού σφάλματος : τυπικό σφάλμα εκτίμησης
Διάστημα εμπιστοσύνης εκτίμησης δεσμευμένου μέσου, αξιολόγηση της εκτιμήτριας Η αποτελεί εκτιμήτρια (ελαχίστων τετραγώνων ) της δεσμευμένης μέσης τιμής της μεταβλητής Υ. Αποδεικνύεται ότι : E E E
Δειγματοληπτική κατανομή και διαστήματα εμπιστοσύνης για το Από τη σχέση : w w Και δοθέντος, ότι βασική υπόθεση είναι ότι τα είναι κανονικά κατανεμημένα, έπεται : ~ κανονική κατανομή, σαν άθροισμα κανονικά κατανεμημένων μεταβλητών w ~ N, VAR λόγω, αμεροληψία
Η διασπορά του υπολογίζεται ως : VAR w w VAR w VAR VAR τυχαίο δείγμα,, ανεξάρτητες Λόγω της ομοσκεδαστικότητας : VAR ανεξαρτήτως w VAR [ ] ] [ Δειγματοληπτική κατανομή και διαστήματα εμπιστοσύνης για το
Άρα :, ~ Προφανώς, το διάστημα εμπιστοσύνης του υπολογίζεται από : εκτιμήτρια του από τον Πίνακα της S t u d e t με - βαθμούς ελευθερίας δηλ. : ; t Δειγματοληπτική κατανομή και διαστήματα εμπιστοσύνης για το
Παράδειγμα Να κατασκευαστεί διάστημα εμπιστοσύνης επιπέδου 95% για την εκτίμηση της β στο παράδειγμα : ετήσιο εισόδημα ετήσια έξοδα για διατροφή Έχουμε :, 59 46 0, 34 46 4 0 6 0 36 t ; t 8 ; 0, 05, 306 Διάστημα εμπιστοσύνης :,77,306 0, 34,77 ;, 57 0, 5396
Από τη σχέση : w q w q έχουμε : Η εκτιμήτρια είναι κανονικά κατανεμημένη σαν άθροισμα των κανονικά κατανεμημένων ανεξάρτητων μεταβλητών q, ~ VAR N Δειγματοληπτική κατανομή και διαστήματα εμπιστοσύνης για το
Διασπορά του Η διασπορά του υπολογίζεται ως : w VAR q VAR VAR VAR w ανεξαρτησία των w w w w w 0
VAR VAR Άρα :, ~ N Τα διαστήματα εμπιστοσύνης υπολογίζονται από : ; t Πίνακας κατανομής Studet Διασπορά του
Παράδειγμα Να κατασκευαστεί διάστημα εμπιστοσύνης επιπέδου 95% για την εκτίμηση της α στο παράδειγμα : ετήσιο εισόδημα ετήσια έξοδα για διατροφή Έχουμε :, 59 0 46 36, 494 Διάστημα εμπιστοσύνης : 7, 698, 494 t t ; 8 ; 0, 05, 306 7,698,306,494 4, 5 ;,4 3, 445
ŷ Γνωρίζουμε ήδη, ότι το μέγεθος, δηλ. η γραμμή παλινδρόμησης, αποτελεί εκτιμήτρια του δεσμευμένου μέσου του πληθυσμού. ŷ Από τις γνωστές σχέσεις : q w ; w έχουμε : w q p w q Δειγματοληπτική κατανομή και διαστήματα εμπιστοσύνης για το
Άρα η εκτιμήτρια της είναι κανονικά κατανεμημένη, σαν άθροισμα των κανονικά κατανεμημένων ανεξάρτητων μεταβλητών ŷ. p VAR N ; ~ Για την διασπορά της έχουμε : ŷ p p VAR p VAR VAR, ομοσκεδαστικότητα Ανεξαρτησία των ŷ Δειγματοληπτική κατανομή και διαστήματα εμπιστοσύνης για το
w w w p q w w [ ] w w 0 p ŷ Δειγματοληπτική κατανομή και διαστήματα εμπιστοσύνης για το
Παρατηρούμε ότι η διασπορά του ŷ εξαρτάται από το. Για, η διασπορά του ŷ γίνεται ελάχιστη, αυξάνεται δε άμα το απομακρύνεται από τη δειγματική μέση τιμή του. Τα διαστήματα εμπιστοσύνης υπολογίζονται μέσω : t ; και έχουν την εξής μορφή : άνω όριο εμπιστοσύνης ελάχιστο διάστημα εμπιστοσύνης για κάτω όριο εμπιστοσύνης
Να δοθεί εκτίμηση διαστήματος επιπέδου 95% για τα μέσα έξοδα διατροφής οικογενειών με μέσο εισόδημα = 8.000 $. Παράδειγμα Από την γραμμή παλινδρόμησης : 7, 698, 77 λαμβάνουμε σαν σημειακή εκτίμηση : 7, 698,77 8, 434 43,4 $ Εκτίμηση του 8. 000
Παράδειγμα Η δειγματική τυπική απόκλιση του ŷ εκτιμάται από : 6 46 0, 59 0, 59 0, 43 4 6 6 8 0, 43 0, 687
Παράδειγμα Το αντίστοιχο διάστημα εμπιστοσύνης επιπέδου 95%, υπολογίζεται τέλος :, 434,306 0, 687, 58 t ; t 8 ; 0, 05, 306 9, 85 ; 3, 0 σε εκατοντάδες $ ή 985 ; 30 σε $
Διαστήματα Πρόγνωσης (Πρόβλεψης) (Predcto Iterval) Εκτός από εκτιμήσεις της της, που όπως είδαμε επι-τυγχάνεται μέσω της, στην πράξη ενδιαφέρουν και εκτιμήσεις της ίδιας της μεταβλητής για συγκεκριμένο. Στην περίπτωση αυτή μιλάμε για πρόβλεψη ή πρόγνωση της Υ. Γενικότερα το πρόβλημα τίθεται ως εξής : Έστω δείγμα τάξης που οδήγησε στην ευθεία παλινδρόμησης, ŷ Για δεδομένο, ποια η προβλεπόμενη τιμή της Προφανώς στην περίπτωση αυτή, η ακρίβεια της τιμής, θα είναι σημαντικά μικρότερη από την ακρίβεια της εκτίμησης, της δεσμευμένης μέσης τιμής
Παρόλο που η σημειακή εκτίμηση της Υ + παραμένει η, τώρα υπάρχουν δύο αιτίες αβεβαιότητας (διασποράς) : Διασπορά της εκτίμησης, δηλ. η ŷ Διασπορά του, γύρω από τη μέση τιμή του, δηλ. γύρω από την η δηλ., σ Συμβολίζοντας με την συνολική διασπορά της πρόβλεψης έχουμε : d d Διαστήματα Πρόγνωσης (Πρόβλεψης) (Predcto Iterval)
Διαστήματα Πρόγνωσης (Πρόβλεψης) (Predcto Iterval) Τα διαστήματα πρόβλεψης υπολογίζονται μέσω : [ I N D ] t ; Κατανομή Studet τυπικό σφάλμα πρόβλεψης ( tadard error of forecat ) γραμμή παλινδρόμησης διαστήματα πρόβλεψης διαστήματα εκτίμησης
Παράδειγμα Έστω, ότι επιλέγεται μια οικογένεια με ετήσιο εισόδημα = 8.000 $. Να υπολογιστεί διάστημα πρόβλεψης επιπέδου 95% για τα ετήσια έξοδα διατροφής της. Σαν σημειακή πρόβλεψη έχουμε : 7, 698, 77 8, 434 Το τυπικό σφάλμα πρόβλεψης εκτιμάται σε : d,59 0 8 4 6 6,73 Διάστημα πρόβλεψης, 434,306,73 7,44 ; 5,4
Παράδειγμα Υπολογίστε το ποσοστό των οικογενειών με ετήσιο εισόδημα = 8.000 $ που ξοδεύει πάνω από 3000 $ για διατροφή. Θεωρήστε ότι οι εκτιμήσεις ŷ και είναι σχεδόν ταυτές με τις θεωρητικές τιμές του πληθυσμού. Έχουμε : 8.000, 434,59 Ζητούμε : Z ~ N 0, P, 434 30,434 30 P P Z 5, 438 0, 59, 59 ~ N, 434 ;, 59
b, ŷ συνολικό σφάλμα παρατήρησης μη εξηγούμενο σφάλμα παρατήρησης εξηγούμενο σφάλμα παρατήρησης συνολικό σφάλμα μη εξηγούμενο σφάλμα εξηγούμενο σφάλμα Συντελεστής Προσαρμογής, Συντελεστής Συσχέτισης
Τετραγωνίζοντας και αθροίζοντας τις σχέσεις : για...,,,, έχουμε : 0 Όπως δείξαμε προηγουμένως : 0 και 0 0 Συντελεστής Προσαρμογής, Συντελεστής Συσχέτισης
r 4 Συντελεστής Προσαρμογής, Συντελεστής Συσχέτισης
Συντελεστής Προσαρμογής r εξηγούμενο συνολικό σφάλμα σφάλμα r ; r όταν όλα τα σημεία βρίσκονται πάνω στην ευθεία, τότε r = ( τέλεια προσαρμογή ) όταν όλα τα σημεία βρίσκονται πάνω στην γραμμή ή όταν είναι γραμμικά ασυσχέτιστα, τότε r = 0 r = 0, 4 σημαίνει ότι το ( 0,4 ) 00 = 6 % της μεταβλητότητας του Υ ερμηνεύεται μέσω της παλινδρόμησής του στο
Συντελεστής Συσχέτισης r r το πρόσημο του r ταυτίζεται με το πρόσημο του β, οπότε, οι ακραίες τιμές - και + αντιστοιχούν στη περίπτωση που όλα τα σημεία βρίσκονται πάνω σε ευθεία με θετική ( + ) ή αρνητική ( - ) κλίση μια τιμή ίση ή κοντά στο 0, δηλώνει απουσία γραμμικής αλλά όχι οποιασδήποτε σχέσης Στην περίπτωση ανεξάρτητων μεταβλητών Χ, Υ το r ισούται με 0. επειδή cov (, ) 0 0
Παράδειγμα Στο παράδειγμα έχουμε :, 77 406 0 6 5, 9 3.396 0 8 7, 33 9 r,77 7,33 5, 0, 869 r 0, 869 0, 93
Άσκηση ) ) ) Ποια από τις 5 γραμμές αντιπροσωπεύει καλύτερα την δεσμευμένη τιμή των 4 παρατηρήσεων του σχήματος Ι ; Ποια στο σχήμα ΙΙ ; Ο συντελεστής προσδιορισμού για την ευθεία παλινδρόμησης είναι : II r 0, r 0, 0 r 0, 5, r 0, 5, r 0,5
Αν μπει ο περιορισμός ότι η ευθεία παλινδρόμησης πρέπει να περνά από την αρχή των αξόνων, ποια ευθεία παριστάνει καλύτερα την ευθεία παλινδρόμησης ; ) Έστω. Ταξινομήστε κατά μέγεθος τα διαστήματα εμπιστοσύνης της για ) 0 ŷ 4, 9,, 7 ) ) E ευθεία η E ευθεία η ), 0 r επειδή προφανώς δεν υπάρχει γραμμική σχέση r
Έχουμε : b b 0 0 0 0 4 b b 4 0 4 4 4 4 0 0 0 0 b b b b b b b b b b Στο σχήμα Ι, τα σημεία αριστερά της ευθείας δεν παίζουν ρόλο. Το άθροισμα των τετραγώνων γίνεται ελάχιστο, αν η ευθεία «μοιράζει» την απόσταση. ) 3 Λύση
Τα δύο αυτά σημεία δεν παίζουν ρόλο, δεδομένου ότι τα παραμένουν ίδια για όλες τις ευθείες που παιρνούν από την αρχή των αξόνων. Έχουμε : m c σταθ. c c 0 m c ) Το εύρος κανονίζεται από το μέγεθος 4 7 9
Άσκηση Έστω ο μέσος αριθμός τσιγάρων που κάπνιζε ημερησίως η μητέρα στην διάρκεια της εγκυμοσύνης και Υ το βάρος γεννήσεως του παιδιού της, σε kg. Δείγμα τάξης 5 έδωσε : 0 3,73 8 3,9 5 3,4 9 3,84 7 3,5 5 3,5 5,60 3 3,37 3 3,43 8 3,84 7 3,0,9 0,84,58 9 3,09 Πηγή : ΕΣΥΕ, Συνοπτική Επετηρίς της Ελλάδας 983-84, Τμήμα Υγείας Να εκτιμηθεί ένα γραμμικό μοντέλο παλινδρόμησης της Υ επί της. Να ερμηνευτούν οι τιμές των και σε σχέση με το δοθέν πρόβλημα.
Έχουμε : και Από πίνακα : 5 6, 80 Λύση 5 47,98 47,98 3,0 5 5 4606 78,6 78 4,6 606 5 5 6,8 6, 8 3, 0,066 3, 0, 066 6,8 4,3 4,3 0, 066 Ερμηνεία Κάθε τσιγάρο μειώνει το βάρος του παιδιού κατά 66 gr. Επειδή = 0 δυνατή τιμή, α 4, 3 kg το βάρος του παιδιού μή καπνίζουσας μητέρας ( επιφύλαξη, = 0 εκτός δεδομένων )
Να εκτιμηθεί το μέσο βάρος γέννησης των παιδιών που οι μητέρες τους καπνίζουν 3 τσιγάρα ημερησίως. Να δοθεί διάστημα εμπιστοσύνης επιπέδου 0,95 %. Η εκτιμήτρια N, ~ με : Άσκηση 3 και 55, 6 4,3 47, 98 0, 066 78, 6 7, 7 0 3 0, 68 0,68 5 3 6,8 37,3 0,04
Εκτίμηση : 4, 3 0, 066 3 4, k g Διάστημα εμπιστοσύνης t 3,68 ; 4,56 3 ; 0, 05 σε kg 4,,60 0, 04 3 Να προβλεφθεί το βάρος γέννησης παιδιού που η μητέρα του καπνίζει 3 τσιγάρα ημερησίως και να υπολογιστεί διάστημα πρόβλεψης επιπέδου 95 % Η πρόβλεψη είναι και στη περίπτωση αυτή, 4,3 0,066 3 4, kg
Το διάστημα πρόβλεψης δίνεται όμως τώρα από : 3 t ; 4,, 60 0,04 4, 0,553 3,57 ; 4,67 4 Ταξινομήστε χωρίς πράξεις το εύρος των διαστημάτων πρόβλεψης για : 0, 5,8, 7,8, 0 Το εύρος καθορίζεται από το :
Άσκηση 4 Εξετάστηκε η διαλυτότητα νιτρικού νατρίου σε σχέση με τη θερμοκρασία του νερού. Έστω ότι οι παρατηρήσεις έδωσαν : 67, 5 0, 87 T διαλυτότητα θερμοκρασία και T, 53, 9, 6 Τι μπορούμε να πούμε για την ποιότητα της προσαρμογής ; Δώστε μια εκτίμηση για την συνδιασπορά., 53 Έχουμε : r 0,87 0, 999 Από : r 9, 6 σχεδόν ντετερμινιστική γραμμική σχέση r 44, 4 εκτιμήτρια συνδιασποράς
Άλυτες ασκήσεις
Τέλος Ενότητας