α = ---------- και β = ---------------- --------- = ----------



Σχετικά έγγραφα
Σχολικός Σύµβουλος ΠΕ03

11 Το ολοκλήρωµα Riemann

ΘΕΤΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Πρακτική µε στοιχεία στατιστικής ανάλυσης

14 Εφαρµογές των ολοκληρωµάτων

ΜΕΛΕΤΗ ΣΥΝΑΡΤΗΣΗΣ. Άρτια και περιττή συνάρτηση. Παράδειγµα: Η f ( x) Παράδειγµα: Η. x R και. Αλγεβρα Β Λυκείου Πετσιάς Φ.- Κάτσιος.

ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ ΑΠΟΣΤΟΛΟΥ ΓΙΩΡΓΟΣ ΜΑΘΗΜΑΤΙΚΟΣ

Μαθηματική Εισαγωγή Συναρτήσεις

Κεφάλαιο 6 Παράγωγος


Μαθηματική Εισαγωγή Συναρτήσεις


5 Γενική µορφή εξίσωσης ευθείας

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ

2.3. Ασκήσεις σχ. βιβλίου σελίδας Α ΟΜΑ ΑΣ

2. Στοιχεία Πολυδιάστατων Κατανοµών

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους.

ΘΕΩΡΙΑ ΑΛΓΕΒΡΑΣ της Α ΛΥΚΕΙΟΥ

Σηµειώσεις στις σειρές

ΙΑΝΥΣΜΑΤΑ ΘΕΩΡΙΑ ΘΕΜΑΤΑ ΘΕΩΡΙΑΣ. Τι ονοµάζουµε διάνυσµα; αλφάβητου επιγραµµισµένα µε βέλος. για παράδειγµα, Τι ονοµάζουµε µέτρο διανύσµατος;

Σύνολα. 1) Με αναγραφή των στοιχείων π.χ. 2) Με περιγραφή των στοιχείων π.χ.

ΜΑΘΗΜΑΤΙΚΑ Β ΓΥΜΝΑΣΙΟΥ ΜΙΑ ΠΡΟΕΤΟΙΜΑΣΙΑ ΓΙΑ ΤΙΣ ΕΞΕΤΑΣΕΙΣ

Παρουσίαση 1 ΙΑΝΥΣΜΑΤΑ

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΣΥΝΑΡΤΗΣΕΙΣ

1.1.3 t. t = t2 - t x2 - x1. x = x2 x

ΑΠΑΝΤΗΣΕΙΣ - ΥΠΟ ΕΙΞΕΙΣ ΣΤΙΣ ΕΡΩΤΗΣΕΙΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

1.1 ΣΥΝΑΡΤΗΣΕΙΣ. 1. Ορισµός. 2. Συµβολισµός. 3. Επεξήγηση συµβόλων. 4. Γραφική παράσταση της συνάρτησης f : A R

Γραµµική Αλγεβρα Ι. Ενότητα: Εισαγωγικές Εννοιες. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

lim είναι πραγµατικοί αριθµοί, τότε η f είναι συνεχής στο x 0. β) Να εξετάσετε τη συνέχεια της συνάρτησης f (x) =

ΑΠΑΝΤΗΣΕΙΣ - ΥΠΟ ΕΙΞΕΙΣ ΣΥΝΤΟΜΕΣ ΛΥΣΕΙΣ ΣΤΙΣ ΕΡΩΤΗΣΕΙΣ

ΜΑΘΗΜΑΤΙΚΑ B ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

Εκφωνήσεις και λύσεις των ασκήσεων της Τράπεζας Θεμάτων στην Άλγεβρα Α ΓΕΛ

Θέματα ενδοσχολικών εξετάσεων Άλγεβρας Α Λυκείου Σχ. έτος , Ν. Δωδεκανήσου ΘΕΜΑΤΑ ΕΝΔΟΣΧΟΛΙΚΩΝ ΕΞΕΤΑΣΕΩΝ ΤΑΞΗ: Α ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΑΛΓΕΒΡΑ

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

ΣΥΝΤΕΤΑΓΜΕΝΕΣ ΙΑΝΥΣΜΑΤΟΣ

ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ 1 η εκάδα

Α. Ροπή δύναµης ως προς άξονα περιστροφής

11. Η έννοια του διανύσµατος 22. Πρόσθεση & αφαίρεση διανυσµάτων 33. Βαθµωτός πολλαπλασιασµός 44. Συντεταγµένες 55. Εσωτερικό γινόµενο

Ερωτήσεις κατανόησης σελίδας Κεφ. 1

A2. ΠΑΡΑΓΩΓΟΣ-ΚΛΙΣΗ-ΜΟΝΟΤΟΝΙΑ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 1. Σταύρος Παπαϊωάννου

Γ ΤΑΞΗ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑ Α Β )

Παραδείγµατα συναρτήσεων: f:[0,+ ) IR, f(x)=2+ x f:ir IR: f(x)=

Α. ΑΠΑΡΑΙΤΗΤΕΣ ΓΝΩΣΕΙΣ ΘΕΩΡΙΑΣ

ΑΣΚΗΣΕΙΣ ΤΡΙΓΩΝΟΜΕΤΡΙΑΣ Β ΛΥΚ. ΕΞΙΣΩΣΕΙΣ

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Διαφορικός Λογισμός. Κεφάλαιο Συναρτήσεις. Κατανόηση εννοιών - Θεωρία. 1. Τι ονομάζουμε συνάρτηση;

αx αx αx αx 2 αx = α e } 2 x x x dx καλείται η παραβολική συνάρτηση η οποία στο x

ΕΞΙΣΩΣΗ ΕΥΘΕΙΑΣ ΓΕΝΙΚΗ ΜΟΡΦΗ

5 Παράγωγος συνάρτησης

Πίνακας κατανοµής συχνοτήτων και αθροιστικών συχνοτήτων. Σχετ.

µηδενικό πολυώνυµο; Τι ονοµάζουµε βαθµό του πολυωνύµου; Πότε δύο πολυώνυµα είναι ίσα;

ΜΑΘΗΜΑ 8. B 2.3 Χρησιµοποιώντας Ευκλείδεια Γεωµετρία

6.1 Η ΕΝΝΟΙΑ ΤΗΣ ΣΥΝΑΡΤΗΣΗΣ

Η Ευκλείδεια διαίρεση

Ιωάννης Σ. Μιχέλης Μαθηματικός

1. ** Αν F είναι µια παράγουσα της f στο R, τότε να αποδείξετε ότι και η

Μάθηµα 14. Κεφάλαιο: Στατιστική

ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών. ιαφόριση συναρτήσεων πολλών µεταβλητών

1ο Κεφάλαιο: Συστήματα

τα βιβλία των επιτυχιών

x - 1, x < 1 f(x) = x - x + 3, x

ΜΑΘΗΜΑΤΙΚΑ Θετικής & Τεχνολογικής Κατεύθυνσης Β ΜΕΡΟΣ (ΑΝΑΛΥΣΗ) ΚΕΦ 1 ο : Όριο Συνέχεια Συνάρτησης

ΑΛΓΕΒΡΑ - ΚΕΦΑΛΑΙΟ 4ο Εξισώσεις - Ανισώσεις Δευτέρου Βαθμού

Ανάλυση Γ Λυκείου όριο συνάρτησης στο xο. 0, τότε

Η γεωµετρική εποπτεία στην παρουσίαση της απόλυτης τιµής

ΘΕΩΡΙΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑΤΙΚΑ Β ΓΥΜΝΑΣΙΟΥ. ΜΕΡΟΣ 1ο ΑΛΓΕΒΡΑ

Αριθµητική Παραγώγιση και Ολοκλήρωση

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ Γραφικές παραστάσεις, κλίση καµπύλης Μέθοδος των ελαχίστων τετραγώνων

Κεφάλαιο 3 ΠΑΡΑΓΩΓΟΣ. 3.1 Η έννοια της παραγώγου. y = f(x) f(x 0 ), = f(x 0 + x) f(x 0 )

Γ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΙΚΑ ΚΑΤΕΥΘΥΝΣΗΣ ΕΚΦΩΝΗΣΕΙΣ ΘΕΜΑ Α

Thanasis Xenos ΕΛΛΗΝΙΚΗ ΜΑΘΗΜΑΤΙΚΗ ΕΤΑΙΡΕΙΑ ΠΑΡΑΡΤΗΜΑ ΗΜΑΘΙΑΣ

δίου ορισμού, μέσου του τύπου εξαρτημένης μεταβλητής του πεδίου τιμών που λέγεται εικόνα της f για x α f α.

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Ποια μπορεί να είναι η κίνηση μετά την κρούση;

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ


Μαθηματικά Γενικής Παιδείας Κεφάλαιο 1ο Ανάλυση ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΑΝΑΛΥΣΗ

Συνάρτηση f, λέγεται η διαδικασία µε βάση την. Παρατηρήσεις - Σχόλια f

Σηµειώσεις στις συναρτήσεις

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

1 ΘΕΩΡΙΑΣ...με απάντηση

3.5 Η ΣΥΝΑΡΤΗΣΗ y=α/x-η ΥΠΕΡΒΟΛΗ Ποσά αντιστρόφως ανάλογα- Η υπερβολή

ΜΕΛΕΤΗ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ

Ρητοί αριθμοί λέγονται οι αριθμοί που έχουν ή μπορούν να πάρουν τη μορφή

ΣΥΝΑΡΤΗΣΕΩΝ. f3 x = και

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

15, 11, 10, 10, 14, 16, 19, 18, 13, 17

f(x) = και στην συνέχεια

ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ. 1 ο Αχαρνών 197 Αγ. Νικόλαος ο Αγγ. Σικελιανού 43 Περισσός Ε. ΛΙΑΤΣΟΣ Μαθηµατικός 1

Transcript:

04 Γ) ΠΑΛΙΝ ΡΟΜΗΣΗ ΚΑΙ ΣΥΣΧΕΤΙΣΗ Γ.. ΠΑΛΙΝ ΡΟΜΗΣΗ. Γ... Η εξίσωση της ευθείας. Η εξίσωση της ευθείας είναι ένα βασικό εργαλείο για το κεφάλαιο της παλινδρόµησης και της συσχέτισης. Για το λόγο αυτό κρίνουµε απαραίτητο να ασχοληθούµε περιληπτικά µ'αυτήν. i) Η εξίσωση ψ = αχ+β. Η εξίσωση ψ = f(x) = αχ+β είναι µία πολυωνυµική συνάρτηση ου βαθ- µού, όπου το χ είναι η ανεξάρτητη µεταβλητή και το ψ η εξαρτηµένη, ενώ τα α και β είναι δύο παράµετροι. Προσπαθώντας να κάνουµε την γραφική της παράσταση, µε δοσµένες βέβαια τιµές για τα α και β, δηµιουργούµε τον παρακάτω πίνακα τιµών, δίνοντας κάποιες αυθαίρετες τιµές στο χ και υπολογίζοντας από τη συνάρτηση την αντίστοιχη τιµή του ψ. χ κ ψ κ χ 0 χ χ... χ ν ψ 0 ψ ψ... ψ ν ψ ψ ν ε Τοποθετώντας τα ζεύγη τιµών (χ κ,ψ κ ) στο Καρτεσιανό σύστηµα συντεταγµένων, παρατηρούµε (Σχ.Γ.) πως όλα τα σηµεία είναι τοποθετηµένα πάνω σε µία ευθεία, την ε, πράγµα που συµβαίνει για οποιαδήποτε δυάδα τιµών των παραµέτρων α και β. Έτσι φθάνουµε στον παρακάτω ορισµό: ψ x 0 x... x ν x ψ 0 Σχ.Γ.. Η γραφική παράσταση της συνάρτησης ψ=αχ+β.

05 Ορισµός Γ.. Η πρωτοβάθµια πολυωνυµική συνάρτηση ψ = f(χ) = αχ+β είναι η εξίσωση της ευθείας στο Καρτεσιανό επίπεδο. Κάθε δυάδα τιµών, των παραµέτρων α και β, οδηγεί σε µια νέα ευθεία, ενώ υπάρχει πάντα µια δυάδα τιµών (α,β), για κάθε ευθεία του επιπέδου Οχψ (µε εξαίρεση τις ευθείες που είναι κάθετες στον άξονα των χ). ii) Ερµηνεία των συντελεστών α και β. Ως γνωστό, δύο σηµεία ορίζουν τη θέση µιας ευθείας. Ποιά λοιπόν είναι η εξίσωση της ευθείας που διέρχεται από τα σηµεία Σ (χ,ψ ) και Σ (χ,ψ ); Στο ερώτηµα αυτό θα απαντήσουµε µε δύο τρόπους. Ο καθένας µπορεί να διαλέξει όποιον θέλει, ή σωστότερα, όποιον ταιριάζει στο πρόβληµα που αντιµετωπίζει. Λύση η: Έστω πως η ευθεία που ορίζεται από τα σηµεία Σ και Σ, είναι η ε : ψ=αχ+β. Εφ όσον όµως τα σηµεία αυτά ανήκουν στην ε, θα πρέπει οι συντεταγµένες τους να επαληθεύουν την εξίσωσή της. Άρα, θα ισχύουν οι σχέσεις: ψ = αχ + β ψ = αχ + β Πρόκειται για ένα γραµµικό σύστηµα δύο εξισώσεων µε δύο αγνώ-στους, τις παραµέτρους α και β. Λύνοντάς το, υπολογίζουµε τις τιµές των α και β, έτσι ώστε η εξίσωση ψ=αχ+β να ορίζει την ευθεία που διέρχεται από τα σηµεία Σ και Σ : ψ - ψ χ ψ - χ ψ α = ---------- και β = ---------------- χ - χ χ - χ Λύση η: Η εξίσωση της ευθείας ε, που διέρχεται από τα σηµεία Σ και Σ είναι η εξής: χ - χ ψ - ψ --------- = ---------- χ - χ ψ - ψ Σχέση η οποία εκφράζει την αναλογία που προκύπτει από τα όµοια τρίγωνα του διπλανού σχήµατος. ψ ψ ψ ψ ε χ χ χ χ

06 Γεωµετρική ερµηνεία. Η παράµετρος α, που ονοµάζεται συντελεστής διεύθυνσης ή κλίση της ευθείας ε, είναι ίση µε την εφαπτοµένη της γωνίας φ, η οποία ορίζεται από την θετική κατεύθυνση του άξονα των χ και την ευθεία ε (Σχ.Γ..). α = (ψ -ψ )/(χ -χ ) = = εφ φ = συντελεστής διεύθυνσης της ε = κλίση της ε Το σηµείο (0,β) είναι το σηµείο του άξονα των ψ στο οποίο τέµνει η ε τον άξονα των ψ (Σχ.Γ..). ψ ψ φ x β x x ψ Σχ.Γ.. Η ερµηνεία των παραµέτρων α και β. ε iii) Παραδείγµατα. ο) Οι ευθείες ψ=χ+4 και ψ=χ- είναι δύο ευθείες µε τον ίδιο συντελεστή διεύθυνσης και διαφορετικό β. Πρόκειται εποµένως για δύο ευθείες παράλληλες, µε κλίση α=. Η πρώτη τέµνει τον άξονα των ψ στο σηµείο ψ=4 ενώ η δεύτερη στο ψ=-. Από την κλίση µπορούµε να υπολογίσουµε την γωνία φ που σχηµατίζουν η ευθείες µε την θετική κατεύθυνση του άξονα των χ. α = = εφ φ φ = Τοξεφ = tan - () = 63.435 (µοίρες) (=.075 rad) Να παρατηρήσουµε εδώ πως η αντίστροφη συνάρτηση της ψ=εφ(χ), δηλαδή η ψ=τοξεφ(χ), δεν πρέπει να σας προβληµατίζει, µια και δίνεται από τον υπολογιστή τσέπης µε το πλήκτρο που αντιστοιχεί στην ένδειξη tan -. Oι µονάδες στις οποίες θα είναι η γωνία εξαρτώνται από την επιλογή σας. Εάν στην ο- θόνη υπάρχει η ένδειξη DEG τότε το αποτέλεσµα θα είναι σε µοίρες. Εάν στην οθόνη υπάρχει η ένδειξη RAD, τότε το αποτέλεσµα θα είναι σε ακτίνια, ενώ εάν υπάρχει η ένδειξη GRA, τότε το αποτέλεσµα θα είναι σε βαθµούς.

07 ο) Η εξίσωση ψ=3 αντιστοιχεί σε µία ευθεία µε κλίση µηδέν (α=0), σε µία ευθεία εποµένως που θα είναι παράλληλη µε τον άξονα των χ και διέρχεται από το σηµείο ψ=3 του άξονα των ψ. Άλλωστε η εξίσωση ψ=3 δηλώνει πως περιλαµβάνει όλα τα σηµεία, των οποίων η τεταγµένη (η συντεταγµένη ψ) είναι σταθερά ίση µε 3, ανεξάρτητα από την τιµή του χ. Η εξίσωση χ=4 αντιστοιχεί σε µία ευθεία κάθετη στον άξονα των χ στο σηµείο χ=4 (άρα παράλληλη του άξονα των ψ, οπότε η κλίση της θα είναι η εφ(90), δηλ. άπειρη), και όµοια, περιλαµβάνει τα σηµεία µε τετµηµένη σταθερή (=4). 3ο) Στην επόµενη γραφική παράσταση, εµφανίζονται οι ευθείες που αντιστοιχούν στις εξισώσεις: ε : ψ = f (x) = x ε : ψ = f (x) = x ε 3 : ψ = f 3 (x) = 3x ε 4 : ψ = f 4 (x) = -x ε 5 : ψ = f 5 (x) = -3x Είναι εξισώσεις 5 ευθειών που διέρχονται από το κέντρο των αξόνων (0,0), διότι το β είναι µηδέν για όλες τους. Να παρατηρήσουµε πως οι ευθείες που αντιστοιχούν σε θετικούς συντελεστές διεύθυνσης είναι αύξουσες, ενώ αυτές που αντιστοιχούν σε αρνητικά α είναι φθίνουσες. Να παρατηρήσουµε επίσης πως ο συντελεστής α κάθε µιας απ'τις ευθείες είναι ίσος µε την µεταβολή της τιµής του ψ, όταν το χ µεταβάλλεται κατά µία µονάδα. Για παράδειγµα εάν πάρουµε την τιµή του ψ της ευθείας ψ=3χ, για χ=3 και για χ=4, έχουµε τις τιµές: ψ(3)=9 και ψ(4)=. ψ ε 3 ε ε x -3 ε 4 ε 5 Σχ.Γ.3. Η γραφική παράσταση των πέντε ευθειών. Η µεταβολή του ψ που αντιστοιχεί σε µεταβολή του χ κατά µία µονάδα είναι ίση µε το 3 (ίση δηλ. µε το συντελεστή α της ευθείας).

08 Γ... Ταυτόχρονη καταµέτρηση δύο τυχαίων µεταβλητών. Είναι πολύ συχνό το φαινόµενο της ταυτόχρονης καταµέτρησης δύο ή περισσότερων τυχαίων µεταβλητών στα ν-στοιχεία ενός πληθυσµού. Στη συνέχεια θα ασχοληθούµε µε την περίπτωση της καταµέτρησης δύο µόνο τυχ.µεταβλητών. Κατά την περίπτωση αυτή το βασικό Στατιστικό δεδοµένο είναι η δυάδα (χ i,ψ i ), η µέτρηση δηλαδή των τιµών των δύο τ.µ. Χ και Ψ στο i- οστό άτοµο του πληθυσµού. Εποµένως το σύνολο των δεδοµένων αποτελείται από ν δυάδες: (X,Ψ ), (X,Ψ ), (X 3,Ψ 3 ),..., (X ν,ψ ν ). όπου βέβαια είναι δυνατό η ίδια δυάδα να εµφανίζεται περισσότερες από µία φορές. Ένα κλασσικό παράδειγµα είναι οι µετρήσεις του ύψους και του βάρους ενός πληθυσµού ατόµων. Γενικά δύο τέτοιες µεταβλητές λέγονται ανεξάρτητες, µια και η γνώση της τιµής της µιας σε κάποιο άτοµο του πληθυσµού δεν επαρκεί για τον καθορισµό της τιµής της δεύτερης (στο ίδιο πάντα άτοµο). Πράγµατι, δεν µπορούµε να καθορίσουµε το βάρος ενός άνδρα, εάν γνωρίζουµε πως έχει ύψος 85 cm. Η δυσκολία της "ανάγνωσης" και της κατανόησης των δεδοµένων αυτών επιβάλλει την επεξεργασία τους και την εµφάνισή τους κατά τρόπο παραστατικό και συνοπτικό. Στη συνέχεια θα αναφερθούν κάποιες µέθοδοι συστηµατοποίησης και συνοπτικότερης παρουσίασης των δεδοµένων αυτών. Γ..3. Γραφικές παραστάσεις. Η πρώτη µας προσπάθεια αφορά στην παραστατική εµφάνιση των διπλών αυτών µετρήσεων µε τη βοήθεια µιας γραφικής παράστασης (µια εικόνα αξίζει όσο χίλιες λέξεις).

09 Η γραφική παράσταση γίνεται σ'ένα Καρτεσιανό σύστηµα συντεταγµένων όπου στον άξονα των Χ θέτουµε την πρώτη τυχ.µεταβλητή (έστω την X i, i=,,..,ν), ενώ στον άξονα των Ψ θέτου- µε τη δεύτερη τυχ.µεταβλητή (την Ψ i, i=,,..,ν). Τότε έχουµε το διπλανό σχεδιάγραµµα, το οποίο συχνά µας επιτρέπει να εξάγουµε κάποια πρώτα συµπεράσµατα. Έτσι για παράδειγµα, από το σχ.γ.4 συµπεραίνουµε πως στα στοιχεία του πληθυσµού στα οποία η τιµή της µεταβλητής Χ είναι µεγάλη, υπάρχει µία χαλαρή τάση για µεγάλες τιµές και στην ψ * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Σχ.Γ.4. ιάγραµµα διασποράς των ν-µετρήσεων (Χ i,y i ). τιµή της µεταβλητής Ψ, και αντίστροφα, οι µικρές τιµές στα Χ συνδυάζονται µε µικρές, κατά βάση, τιµές στα Ψ. Για λόγους που θα εξηγηθούν αργότερα, προσπαθούµε να τοποθετού- µε στον άξονα των Χ την τυχαία µεταβλητή για την οποία, κατά κανόνα, έχουµε ακριβέστερες ή πιο αξιόπιστες µετρήσεις. Συχνά, η µία από τις δύο µετρήσεις θεωρείται σαν ανεξάρτητη µεταβλητή, ενώ η δεύτερη θεωρείται εξαρτηµένη από την τιµή της πρώτης. Για παράδειγµα εάν µετρούµε την απόσταση που χρειάζεται για να ακινητοποιηθεί ένα αυτοκίνητο, το οποίο κινείται µε διάφορες ταχύτητες, τότε έχουµε µια σειρά διπλών µετρήσεων: ( Ταχύτητα, Απόσταση ακινητοποίησης ) όπου κατανοούµε πως η δεύτερη µέτρηση είναι συνέπεια της πρώτης. Βέβαια, ακριβολογώντας, δεν µπορούµε παρά να τη θεωρούµε ανεξάρτητη µεταβλητή, µια και η απόσταση ακινητοποίησης από κάποια συγκεκριµένη ταχύτητα εξαρτάται από το αυτοκίνητο, την επιλογή ελαστικών, την κατάσταση των αµορτισέρ, του οδηγού (εάν το αυτοκίνητο δεν έχει ABS), το οδόστρωµα κ.λ.π.. Ταυτόχρονα, ακόµη και εάν κρατήσουµε σταθερές όλες τις παραµέτρου είναι απίθανο (πιθανότητα µηδέν) να επαναληφθεί η ίδια ακριβώς µέτρηση. Παρ όλα αυτά, στο προηγούµενο πρόβληµα θεωρούµε την ταχύτητα σαν την ανεξάρτητη µεταβλητή και την τοποθετούµε στον άξονα των χ, ενώ η απόσταση ακινητοποίησης σαν την εξαρτηµένη, τοποθετώντας την στον άξονα των ψ. x

0 Γ..4. Πίνακες διπλής εισόδου. Η προσπάθεια για συνοπτική παρουσίαση των δεδοµένων, γίνεται µε τη βοήθεια Στατιστικών πινάκων, στους οποίους εµφανίζονται ταυτόχρονα οι δύο τυχ.µεταβλητές, και ονοµάζονται πίνακες διπλής εισόδου. Στους πίνακες αυτούς οι µετρήσεις της κάθε τυχαίας µεταβλητής εµφανίζονται µε τη βοήθεια κλάσεων, εκτός κι'αν είναι λιγοστές οι τιµές που µπορούν να πάρουν οι τυχ.µεταβλητές. Η µορφή των πινάκων αυτών είναι η παρακάτω: Χ Ψ Ψ Ψ Ψ 3... Ψ κ- Ψ κ Σύνολο Χ Χ Χ 3... Χ λ- Χ λ f, f, f,3... f,κ- f,κ f, f, f,3... f,κ- f,κ f 3, f 3, f 3,3... f 3,κ- f 3,κ.................. f λ-, f λ-, f λ-,3... f λ-,κ- f λ-,κ f λ, f λ, f λ,3... f λ,κ- f λ,κ Σf,j Σf,j Σf 3,j... Σf λ-,j Σf λ,j Σύνολο Σf i, Σf i, Σf i,3... Σf i,κ- Σf i,κ ΣΣf i,j =ν Πίνακας Γ.: Η γενική µορφή ενός πίνακα διπλής εισόδου. Κατά την εξήγηση του πιο πάνω πίνακα πρέπει να ξεχωρίσουµε την περίπτωση κατά την οποία οι τυχ. µεταβλητές Χ i και Ψ i δίνονται σε κλάσεις. Τότε οι µεν τιµές των Χ κατανέµονται σε λ κλάσεις, ενώ αυτές των Ψ σε κ κλάσεις. Α- ντίθετα, όταν τα δεδοµένα δίνονται σε αναλυτικές τιµές, τότε το πλήθος όλων των διαφορετικών τιµών του Χ είναι ίσο µε το πλήθος των τιµών του Ψ, οπότε ισχύει η ισότητα κ=λ (=ν όπου ν είναι το πλήθος των στοιχείων του πληθυσµού). Με την έκφραση f i,j συµβολίζουµε το πλήθος των στοιχείων του πληθυσµού, των οποίων η µέτρηση Χ είναι ίση µε το Χ i (ή ανήκει στην Χ i κλάση), ενώ ταυτόχρονα η µέτρηση Ψ είναι ίση µε το Ψ j (ή ανήκει στην Ψ j κλάση).

Αξίζει να παρατηρήσουµε πως στην κάτω γραµµή γράφονται τα αθροίσµατα των συχνοτήτων της κάθε στήλης. Ισχύει για παράδειγµα η σχέση: λ Σf i,3 = Σ f i,3 = f,3 + f,3 + f 3,3 +... + f λ,3 i= η οποία δίνει το άθροισµα της τρίτης στήλης. Πρόκειται δηλαδή για το πλήθος των στοιχείων του πληθυσµού, των οποίων η τιµή της τυχ.µεταβλητής Ψ είναι ίση µε Ψ 3, ανεξάρτητα από την τιµή της τυχ.µεταβλητής Χ. Είναι εποµένως η "γενική" συχνότητα της τιµής Ψ 3. Όµοια, στην τελευταία στήλη εµφανίζονται τα µερικά αθροίσµατα της κάθε σειράς. Ισχύει και εδώ (για παράδειγµα) η σχέση: κ Σf 3,j = Σ f 3,j = f 3, + f 3, + f 3,3 +... + f 3,κ j= η οποία δίνει το άθροισµα της τρίτης γραµµής. Πρόκειται δηλαδή για το πλήθος των στοιχείων του πληθυσµού, των οποίων η τιµή της τυχ.µεταβλητής Χ είναι ίση µε Χ 3, ανεξάρτητα από την τιµή της τυχ.µεταβλητής Ψ. Είναι εποµένως η "γενική" συχνότητα της τιµής Χ 3. Τέλος στο τελευταίο (άκρο δεξιό) τετράγωνο της κάτω γραµµής υπάρχει το άθροισµα όλων των µερικών αθροισµάτων. Η τιµή είναι ακριβώς η ίδια, είτε προσθέσουµε τα µερικά αθροίσµατα της τελευταίας στήλης, ή αυτά της τελευταίας γραµµής. Ισχύει τώρα η σχέση: λ κ κ κ κ ΣΣf i,j = Σ Σ f i,j = Σ f,j + Σ f,j +... + Σ f λ,j = ν i= j= j= j= j= η οποία δίνει τελικά το συνολικό πλήθος των (διπλών -(Χ i,y i )-) µετρήσεων που συµπεριλαµβάνονται στον πίνακα διπλής εισόδου. Παράδειγµα Γ.. Ο επόµενος πίνακας δίνει τους βαθµούς στο µάθηµα των Αρχαίων Ελληνικών (Χ i ) και στο µάθηµα της Άλγεβρας (Ψ i ) 4 µαθητών της Β' Λυκείου ενός Λυκείου της Θεσσαλονίκης.

X i Ψ i 3 3 3 3 4 4 5 0 4 3 3 7 4 6 6 7 8 9 0 X i Ψ i 5 5 6 6 6 6 7 7 7 7 8 9 6 9 3 4 3 4 8 9 5 8 Πίνακας Γ.. Η βαθµολογία στα Αρχαία Ελληνικά (Χ i ) και στην Άλγεβρα (Ψ i ), 4 µαθητών της Β' Λυκείου. Ο προηγούµενος πίνακας δεδοµένων γίνεται ο επόµενος πίνακας διπλής εισόδου. Αξίζει να παρατηρήσουµε πως ένας πίνακας διπλής εισόδου έχει κάτι από την παραστατικότητα µιας γραφικής παράστασης. Συνήθως, οριζόντια τοποθετείται ο άξονας των Ψ ενώ στον κατακόρυφο άξονα, όπου έχουµε τις τιµές των Χ, οι τιµές αυτές αυξάνουν από πάνω προς τα κάτω. Χ Ψ 0 3 4 5 6 7 8 9 Σύνολο 3 4 5 6 7 8 9 3 4 3 4 4 Σύνολο 0 4 4 3 3 3 4 Πίνακας Γ.3. Η βαθµολογία των 4 µαθητών στα Αρχαία και στην Αλγεβρα σε πίνακα διπλής εισόδου.

3 Στο παράδειγµα αυτό, στους άξονες Χ και Ψ τοποθετούνται οι καταµετρηµένες τιµές, οι οποίες όµως θα µπορούσαν να θεωρηθούν και κλάσεις. Αυτό συµβαίνει διότι οι τιµές που µπορούν να πάρουν οι τυχ. µεταβλητές Χ και Ψ είναι ακέραιες, µε αποτέλεσµα τη συχνή επανάληψή τους. Θα µπορούσαµε όµως να πούµε πως συνήθως χρησιµοποιούµε πίνακες διπλής εισόδου όταν οι τιµές των τ.µ. Χ και Ψ είναι κατανεµηµένες σε κλάσεις. Τα προηγούµενα δεδοµένα τα τοποθετούµε σε ορθογώνιο σύστηµα συντεταγµένων, οπότε έχουµε την παρακάτω γραφική παράσταση. Αξίζει να παρατηρήσουµε την διαφορετική αίσθηση που µας δίνει αυτή σε σχέση µε τον πίνακα διπλής εισόδου, όπου, όπως τονίστηκε ήδη, ο άξονας των Χ αυξάνεται προς τα κάτω. Όµως, περιστρέφοντας τον πίνακα διπλής εισόδου κατά 90 µοίρες (θετική φορά - αντίθετα από τους δείκτες του ρολογιού), τότε έχουµε ταύτιση των αξόνων. ψ 8 6 4 0 3 4 5 6 7 8 9 Χ Σχ.Γ.5: Γραφική παράσταση της βαθµολογίας 4 µαθητών, στα µαθήµατα Αρχαία (Χ) και Άλγεβρα (Ψ). Με ( ) συµβολίζουµε την ύπαρξη ενός µαθητή µε τη συγκεκριµένη δυάδα τιµών, ενώ µε ( ) συµβολίζουµε την ύπαρξη µαθητών στο εν λόγω σηµείο.

4 Γ..5. Εξάρτηση των τυχαίων µεταβλητών. Επανερχόµαστε και πάλι στις µετρήσεις των τυχαίων µεταβλητών Χ και Ψ, στα ν στοιχεία ενός πληθυσµού. Αναρωτιόµαστε τώρα για το εάν υπάρχει κάποια σχέση ανάµεσα στις τιµές που παίρνει η τυχ. µεταβλητή Χ, και σ'αυτές που παίρνει, στα ίδια άτοµα, η τυχ.µεταβλητή Ψ. Η αναζήτηση µιας τέτοιας σχέσης (εξάρτησης) ανάµεσα σε δύο τυχ. µεταβλητές είναι ιδιαίτερα σηµαντική. Εάν καταλήξουµε στην ύπαρξη µιας τέτοιας εξάρτησης, τότε, γνωρίζοντας την µέτρηση Χ ενός στοιχείου του πληθυσµού, µπορούµε να έχουµε µια ιδέα για την τιµή που θα πάρει η τ.µ. Ψ στο ίδιο άτοµο. (i) Συναρτησιακή εξάρτηση. Η ύπαρξη απόλυτης εξάρτησης ανάµεσα στις τ.µεταβλητές Χ και Ψ, ση- µαίνει πως µετρώντας την τιµή Χ ενός στοιχείου του πληθυσµού, γνωρίζουµε αυτόµατα και την τιµή Ψ του ίδιου στοιχείου. Αυτό συµβαίνει γιατί υπάρχει µια συνάρτηση της µορφής Ψ=f(Χ) που τις συνδέει και που εκφράζει την φυσική εξάρτηση που υπάρχει ανάµεσα στα δύο Φυσικά µεγέθη Χ και Ψ. Σαν παράδειγµα, θα αναφερθούµε στην ελεύθερη πτώση ενός σώµατος στο κενό κάτω από την επίδραση της επιτάχυνσης της Βαρύτητας, g. Εάν αφήσουµε ένα σώµα µάζας m να πέσει ελεύθερα από το σηµείο Α, και αρχίσουµε να καταγράφουµε σε κάποιες τυχαίες χρονικές στιγµές: Α m S α) τις τιµές της απόστασης που έχει διανύσει το σώµα m, και β) τις τιµές της στιγµιαίας ταχύτητάς του v, V θα παρατηρήσουµε πως η µία µέτρηση µπορεί να συναχθεί από την άλλη. Εάν καταµετρήσουµε την ταχύτητα σε κάποια χρονική στιγµή t, τότε το διάστη- µα s που το σώµα έχει διανύσει δίνεται από τη σχέση: v S(v) = ---- g

5 ενώ, εάν µετρήσουµε το διάστηµα s, µπορούµε να υπολογίσουµε την στιγµιαία ταχύτητα απ'τη σχέση: v(s) = gs Εάν λοιπόν καταµετρήσουµε τις διανυθείσες αποστάσεις και την ταχύτητα που αντιστοιχεί σ αυτές, τότε προκύπτει η διπλανή γραφική παράσταση, όπου οι µετρήσεις ακολουθούν πιστά την θεωρητική κα- µπύλη, µη έχοντας καµία σχέση µε το νέφος των ση- µείων της προηγούµενης γραφικής παράστασης. Ταχύτητα (m/sec) 0 5 0 5 0 0 5 0 5 0 ιανυθείσα απόσταση (m) Ελεύθερη πτώση σε κενό. Μετρήσεις της απόστασης και της ταχύτητας του σώµατος που πέφτει. Η Θεωρητική καµπύλη. Ορισµός Γ. Στις περιπτώσεις (σαν την προηγούµενη) της απόλυτης αµοιβαίας εξάρτησης δύο τυχαίων µεταβλητών, µιλάµε για συναρτησιακή εξάρτηση. Συχνά µάλιστα µιλάµε για συναρτησιακή εξάρτηση χωρίς να µπορούµε να διατυπώσουµε τον ακριβή Μαθηµατικό τύπο µε τον οποίο ορίζεται αυτή η εξάρτηση. Στην περίπτωση αυτή συνήθως πρόκειται για πειραµατικά δεδοµένα. Επιστρέφοντας στο παράδειγµα όπου µετρούµε το διάστηµα s που χρειάζεται για να φρενάρει ένα συγκεκριµένο αυτοκίνητο που κινείται µε κάποια ταχύτητα, διαπιστώνουµε την ύπαρξη µιας εξάρτησης (η οποία θα µπορούσε προσεγγιστικά να θυµίζει Μαθηµατική συνάρτηση), ανάµεσα στις δύο αυτές µεταβλητές (εφ' όσον δεν έχουµε αλλοίωση των ελαστικών του αυτοκινήτου ή των υλικών τριβής). Εκτελώντας µερικές φορές το πείραµα αυτό, δηµιουργούµε έναν πίνακα τιµών, από τον οποίο (µε τη βοήθεια κάποιων Μαθηµατικών µεθόδων) έχου- µε τη δυνατότητα να υπολογίσουµε µε αρκετή ακρίβεια τις οποιεσδήποτε ενδιά- µεσες τιµές.

6 (ii) Στοχαστική εξάρτηση. Το παράδειγµα της ελεύθερης πτώσης ενός σώµατος της προηγουµένης παραγράφου, αναφέρεται σε ένα πρόβληµα που επ'ουδενί δεν θα µπορούσε να ονοµαστεί πρόβληµα τύχης, µια και το αποτέλεσµά του είναι πολύ καλά µελετηµένο και εποµένως γνωστό εκ των προτέρων. Όµως τα περισσότερα σύγχρονα προβλήµατα των διαφόρων Επιστηµών όπως η Βιολογία, η Ιατρική, η Οικονοµία, η Κοινωνιολογία, η Ψυχολογία κ.λ.π., δεν αντιµετωπίζουν ποσότητες που να συνδέονται συναρτησιακά µεταξύ τους. Παρ όλα αυτά είναι δυνατό να υπάρχει κάποια (πολλές φορές ισχυρότατη) ε- ξάρτηση ανάµεσα σε δύο µεταβλητές, χωρίς αυτή να είναι συναρτησιακή. Την εξάρτηση αυτής της µορφής την λέµε Στοχαστική. Ένας πιο πλήρης ορισµός είναι ο επόµενος (εάν δεν τον καλοκαταλάβετε ξαναδιαβάστε τον, αφού πρώτα διαβάσετε το παράδειγµα που ακολουθεί!...). Ορισµός Γ.3. Έστω δύο τυχαίες µεταβλητές Χ i και Y i, που αναφέρονται στα ν στοιχεία ενός πληθυσµού Ω. Λέγεται πως ανάµεσα στις δύο αυτές τυχαίες µεταβλητές υπάρχει Στοχαστική εξάρτηση, όταν η γνώση της τιµής X j στο j-οστό άτοµο του πληθυσµού, µεταβάλλει την πιθανότητα που έχει η τιµή Y j να ανήκει σε κάποιο διάστηµα. Ο προηγούµενος ορισµός λέει ουσιαστικά πως σε δύο µεταβλητές που συνδέονται στοχαστικά, η γνώση της τιµής της µιας τυχ.µεταβλητής σε κάποιο άτοµο του πληθυσµού, δίνει σηµαντικές πληροφορίες για την τιµή που θα πάρει η άλλη τυχαία µεταβλητή στο ίδιο άτοµο. Παράδειγµα: Ένα από τα πιο κλασσικά παραδείγµατα στοχαστικής εξάρτησης είναι αυτής που συνδέει το ύψος µε το βάρος των ανθρώπων, ιδιαίτερα του ίδιου φύλου. Μελετώντας το βάρος 000 ενηλίκων ανδρών φθάσαµε στο συµπέρασµα πως η πιθανότητα του διαστήµατος (*) (0,0), εάν δεν ληφθεί υπ' όψην το (*) Οπως αναφέρθηκε στην παρατήρηση της παραγράφου Β.., έχουµε τις τρείς εκφράσεις της ίδιας ουσιαστικά έννοιας: "η πιθανότητα ενός διαστήµατος" ή "η πιθανότητα η µέτρηση Χ να ανήκει σε κάποιο συγκεκριµένο διάστηµα" ή "το ποσοστό του συνολικού πληθυσµού που ανήκει στο συγκεκριµένο διάστηµα".

7 ύψος του, είναι 5 τοις εκατό. Παίρνουµε στη συνέχεια κάποιο άτοµο στην τύχη, ελέγχουµε το ύψος του, και βρίσκουµε πως είναι µέτρα. Τώρα όµως αλλάζει ριζικά η πιθανότητα για να ανήκει το βάρος του συγκεκριµένου άνδρα στο διάστηµα (0,0). Σύµφωνα µάλιστα µε τις µετρήσεις που έχουµε κάνει, βρίσκουµε πως η πιθανότητα του διαστήµατος αυτού είναι ίση µε το 60 τοις εκατό. Η διαπίστωση της στοχαστικής εξάρτησης λοιπόν ανάµεσα στο βάρος και στο ύψος ενός άνδρα δηλώνει σε τελική ανάλυση πως η γενική τάση που επικρατεί στον πληθυσµό είναι πως "τα µεγάλα ύψη αντιστοιχούν κατά βάση και σε µεγάλα βάρη". Η ύπαρξη εξάρτησης ανάµεσα σε δύο τυχ.µεταβλητές, γίνεται εύκολα φανερή από την γραφική τους παράσταση. Βάζουµε τις τιµές της πρώτης τυχ. µεταβλητής (Χ i ) στον άξονα των χ, και της δεύτερης (Υ i ) στον άξονα των ψ. Τα ζεύγη των τιµών (X i,y i ), που αντιστοιχούν στα ν στοιχεία του πληθυσµού, δηµιουργούν τη γραφική παράστασή τους. Αν υποθέσουµε πως στη διπλανή γραφική παράσταση βάλαµε το ύψος στον άξονα των χ και το βάρος στα ψ, τότε παρατηρούµε την γενική τάση που αναφέρθηκε πιο πάνω, σύµφωνα µε την οποία οι πιο ψηλοί άνδρες έχουν και µεγαλύτερο βάρος. Βάρος * ** * *** ** * * ** * * * * ** * * * ** * * * * * * Ύψος Εδώ θα µπορούσε να τεθεί το ερώτηµα: " εν είναι δυνατό να βρεθεί µια συνάρτηση που να συνδέει αυτά τα δεδοµένα, της οποίας δηλαδή η καµπύλη να διέρχεται από τα χίλια σηµεία (ύψος, βάρος) των δεδοµένων:" Μια τέτοια συνάρτηση θα µπορούσε πράγµατι να βρεθεί, εφ' όσον βέβαια δεν θα υπάρχουν δύο άτοµα που να έχουν ίδιο ύψος (ίδιο χ) και διαφορετικό βάρος. Όµως η φυσική της σηµασία θα ήταν µικρή ενώ ταυτόχρονα δεν θα µπορούσαµε να µιλήσουµε για συναρτησιακή εξάρτηση, µια και η συνάρτηση αυτή θα ίσχυε µόνο για τους συγκεκριµένους άνδρες. Είναι σίγουρο πως τα δεδοµένα του πρώτου άνδρα έξω από τον πληθυσµό των χιλίων θά'ταν έξω από την κα- µπύλη που µε τόσο κόπο χαράξαµε. Τα ερωτήµατα που θα µας απασχολήσουν στη συνέχεια έχουν να κάνουν µε το εάν υπάρχει στοχαστική εξάρτηση ανάµεσα σε δύο τυχ. µεταβλητές, και µε το πόσο ισχυρή είναι η εξάρτηση αυτή.

8 iii) Καµπύλες παλινδρόµησης. Ορισµός Γ.4. Ονοµάζουµε καµπύλη παλινδρόµησης µια Μαθηµατική συνάρτηση ψ=f(χ), η οποία προσπαθεί να προσεγγίσει τα δεδοµένα (τις µετρήσεις) δύο τυχ.µεταβλητών Χ i και Y i, στα στοιχεία ενός πληθυσµού, ή ενός δείγµατος. Σύµφωνα λοιπόν µε τον πιο πάνω ορισµό η καµπύλη παλινδρόµησης είναι ένα Μαθηµατικό µοντέλο το οποίο προσπαθούµε να προσαρµόσου-µε στα αριθµητικά δεδοµένα ενός προβλήµατος στοχαστικής εξάρτησης. Το ερώτηµα που αµέσως έρχεται στα χείλη µας αφορά στη µορφή της συνάρτησης µε την οποία θα προσπαθήσουµε να προσεγγίσουµε τα δεδοµένα µας. Πρόκειται για ένα σηµαντικότατο πρόβληµα, στο οποίο η απάντηση είναι εντελώς σχετική. Συνήθως έχουµε να διαλέξουµε ανάµεσα από κάποια µοντέλα, από τα οποία θα πρέπει να επιλέξουµε το καταλληλότερο. Την επιλογή θα κάνει κάποιος που έχει υπ'όψην του τις γραφικές παραστάσεις των Μαθηµατικών συναρτήσεων που εµφανίζονται στα διαθέσιµα µοντέλα, παρατηρώντας τη γραφική παράσταση των δεδοµένων (των σηµείων (χ i,ψ i )). Στη συνέχεια θα µας απασχολήσουν τριών ειδών καµπύλες παλινδρόµησης, οι οποίες εφαρµόζονται σ'ένα µεγάλο αριθµό προβληµάτων. Πρόκειται για την ευθεία, την εκθετική καµπύλη και τη λογαριθµική καµπύλη. Το µεγάλο πλεονέκτηµα των συναρτήσεων αυτών είναι η σχετική απλότητα των υπολογισµών. Ταυτόχρονα, είναι εύκολο να δοθούν οδηγίες για το πότε χρησιµοποιούµε την κάθε µια απ'αυτές. Γ..6. Ευθύγραµµη παλινδρόµηση (ευθεία ελ.τετραγώνων). Η πιο απλή καµπύλη παλινδρόµησης δεν θα µπορούσε να είναι άλλη από την ευθεία, η εξίσωση της οποίας είναι η ψ=f(χ)=αχ+β. Πρέπει όµως να βρεθεί ένας τρόπος να ορισθούν οι παράµετροι α και β, έτσι ώστε η ευθεία να προσεγγίζει τα σηµεία (Χ i,y i ) των δεδοµένων, όσο το δυνατόν καλύτερα. Σαν την καλύτερα προσαρµοσµένη ευθεία στα δεδοµένα µας επιλέγουµε την ευθεία των ελαχίστων τετραγώνων.

9 i) Το πρόβληµα της ευθείας των ελαχίστων τετραγώνων. ίνονται οι συντεταγµένες ν-σηµείων του επιπέδου Οχy, έστω οι: (χ,ψ ), (χ,ψ ), (χ 3,ψ 3 ),...,(χ ν,ψ ν ). τα οποία φαίνονται στην επόµενη γραφική παράσταση. Μαζί µ'αυτά έχει χαραχθεί µία ευθεία που προσεγγίζει τα ν δοσµένα σηµεία. Η εξίσωσή της είναι φυσικά η ψ=αχ+β, της οποίας όµως τις παραµέτρους α και β προς το παρόν α- γνοούµε!... Οπως µπορούµε να παρατηρήσουµε στο σχήµα Γ.6. σε κάθε σηµείο χ i αντιστοιχούν δύο τιµές: η) η ψ i του i-οστού σηµείου των δεδοµένων η) η Υ i που είναι η τιµή που παίρνει η ευθεία ε στο σηµείο χ i, δηλαδή Υ i = αχ i +β. ψ * * ψ * d * Υ = αx +β d 3 * d ε * χ χ χ 3 χ 4 χ 5... χ ν- x ν x Σχ.Γ.6. Τα ν σηµεία των δεδοµένων (χ i,ψ i ) και οι αποστάσεις d i του i-οστού σηµείου από την ευθεία των ελαχίστων τετραγώνων. * d ν Ορίζουµε σαν "απόσταση" του κάθε σηµείου από την ευθεία, το µήκος του ευθύγραµµου τµήµατος που συνδέει το σηµείο µε την ευθεία, ενώ είναι παράλληλο µε τον άξονα των ψ (*). Άρα η απόσταση του i-οστού σηµείου από την ευθεία θα είναι ίση µε: d i = ψ i - Y i = ψ i - (αχ i +β) (*) Λέµε πως ορίζουµε την "απόσταση" διότι, για λόγους ευκολίας, δεν ορίζουµε την Ευκλείδεια απόσταση, η οποία φέρνεται κάθετα προς την ευθεία.

0 Ορισµός Γ.5. Η ευθεία (ψ=αχ+β) που διέρχεται ανάµεσα από τα ν σηµεία (χ i,ψ i ), για την οποία ελαχιστοποιείται το άθροισµα Α = d + d +... + d ν των τετραγώνων των "αποστάσεων" του κάθε σηµείου από την ευθεία, λέγεται ευθεία των ελαχίστων τετραγώνων. Προσπαθούµε δηλαδή να ελαχιστοποιήσουµε την ποσότητα: ν ν Α(α,β) = Σ (ψ i -Υ i ) = Σ (ψ i -αχ i -β) i= i= Παρατηρούµε πως η ποσότητα Α εξαρτάται από τις παραµέτρους α και β, άρα είναι µία συνάρτηση των α και β. Αντιµετωπίζουµε λοιπόν ένα τυπικό πρόβληµα προσδιορισµού των τιµών για τα α και β, στα οποία η συνάρτηση δύο µεταβλητών Α(α,β), παίρνει ακρότατη (ελάχιστη) τιµή. ii) Υπολογισµός των παραµέτρων α και β της ευθείας των ελαχίστων τετραγώνων. Βέβαια ο υπολογισµός µεγίστων και ελαχίστων οδηγεί τη σκέψη µας στις παραγώγους. Πράγµατι µε τη βοήθεια των παραγώγων των συναρτήσεων δύο µεταβλητών (µερικών παραγώγων), φθάνουµε σ'ένα γραµµικό σύστηµα δύο ε- ξισώσεων µε δύο αγνώστους, τα α και β (*). Το σύστηµα αυτό είναι γνωστό σαν σύστηµα των κανονικών εξισώσεων για την ευθύγραµµη παλινδρόµηση: α Σ(χ i ) + βν = Σ(ψ i ) α Σ(χ i ) + β Σ(χ i ) = Σ(χ i ψ i ) όπου όλα τα αθροίσµατα Σ "πηγαίνουν" από i= έως i=ν. (*) Παρ'όλον ότι οι πράξεις της παραγώγησης είναι ιδιαίτερα εύκολες, δεν θα τις αναφέρουµε µια και η έννοια της µερικής παραγώγισης είναι άγνωστη σε κάποιους απ'τους αναγνώστες.

Το σύστηµα των κανονικών εξισώσεων λύνεται εύκολα (*), είτε χρησιµοποιώντας τη µέθοδο των οριζουσών, είτε κλασσικά, λύνοντας τη µια εξίσωση ως προς τον έναν άγνωστο και αντικαθιστώντας τον στη δεύτερη. Στο τέλος των πράξεων βρίσκουµε πως η ελάχιστη τιµή του αθροίσµατος Α(α,β), επιτυγχάνεται για τις παρακάτω τιµές των α και β: (Σχ i )*(Σψ i ) - ν*σ(χ i *ψ i ) α = -------------------------------- [Σχ i ] - ν*σ(χ i ) (Σχ i )*(Σχ i ψ i ) - Σ(χ i )*Σ(ψ i ) β = ------------------------------------ = --- (Σψ i ) - α(σχ i ) [Σχ i ] - ν*σ(χ i ) ν όπου, και πάλι, όλα τα αθροίσµατα Σ "πηγαίνουν" από i= έως i=ν. Να παρατηρήσουµε πως η λύση των κανονικών εξισώσεων µας οδηγεί στον προσδιορισµό ελάχιστου, µια και µέγιστο δεν µπορεί να υπάρξει (η ευθεία ε µπορεί να αποµακρυνθεί οσοδήποτε, και έτσι η ποσότητα Α µπορεί να γίνει οσοδήποτε µεγάλη). iii) Παράδειγµα Γ.. Να υπολογισθεί η ευθεία των ελαχίστων τετραγώνων που προσεγγίζει τα ση- χ κ 3 3 5 7 7 µεία του διπλανού πίνακα και να γίνει η ψ κ 5 6 4 3 3 γραφική παράσταση των σηµείων, καθώς και της ευθείας των ελαχ.τετραγώνων. (*) Στο σύστηµα αυτό οι µοναδικές άγνωστοι είναι οι παράµετροι α και β. Σκεφθείτε πως τα χ i και τα ψ i είναι γνωστά (τα δεδοµένα µας), οπότε όλες οι ποσότητες που εµφανίζονται στο σύστηµα είναι συγκεκριµµένες τιµές, που υπολογίζονται εύκολα.

Λύση: Για να υπολογίσουµε τα αθροίσµατα που συναντούµε στους τύπους των παραµέτρων α και β, δηµιουργούµε το διπλανό πίνακα. Από τα αποτελέσµατά του έχουµε για τα α και β: (Σχ i )*(Σψ i ) - n*σ(χ i *ψ i ) α = ------------------------------ = [Σχ i ] - n*σ(χ i ) 30*6-8*76 7 = ----------------- = ------ = -0.57333 30-8*50-300 Χ κ Ψ κ Χ κ 3 3 5 7 7 5 6 4 3 3 4 4 9 9 5 49 49 Χ κ Ψ κ 5 8 6 9 5 7 4 30 6 50 76 και (Σχ i )*(Σχ i ψ i ) - Σ(χ i )*Σ(ψ i ) 30*76-50*6-60 β = ----------------------------------- = -------------------- = ------- = 5.4 [Σχ i ] - n*σ(χ i ) 30-8*50-300 οπότε η εξίσωση της ευθείας των ελαχίστων τετραγώνων είναι η: ψ = αχ+β ψ = -0.573333*χ + 5.4 Yi 6 4 Στο διπλανό σχήµα έχουµε τη γραφική παράσταση των 8 σηµείων των δεδοµένων και την ευθεία των ελαχ. τετραγώνων. Την χαράξαµε µε τη βοήθεια δύο σηµείων της. Πήραµε: 0 0 4 6 8 Σχ.Γ.7. Η γραφική παράσταση των δεδοµένων και της ευθείας ελαχίστων τετραγώνων. Xi για χ=0, ψ = 5.4 για χ=7, ψ =.38667

3 Γ.. ΣΥΣΧΕΤΙΣΗ. Γ... Συνδιακύµανση δύο τυχαίων µεταβλητών. Με τη συνδιακύµανση δύο τυχαίων µεταβλητών θα επιχειρήσουµε µια πρώτη προσπάθεια να διερευνήσουµε το πρόβληµα της αλληλοεξάρτησης δύο τυχαίων µεταβλητών. Ορισµός Γ.6. Εστω οι τυχαίες µεταβλητές X i και Y i, στα ν στοιχεία κάποιου πληθυσµού, µε µέσες τιµές τις µ χ και µ ψ αντίστοιχα. Ονοµάζουµε συνδιακύµανση των δύο αυτών τυχ.µεταβλητών την ποσότητα: (X -µ χ )(Υ -µ ψ ) + (X -µ χ )(Υ -µ ψ ) +... + (X ν -µ χ )(Υ ν -µ ψ ) Cov(X,Y) = --------------------------------------------------------------------- ν ή συνοπτικότερα: ν Cov(X,Y) = --- Σ (X i -µ χ )(Υ i -µ ψ ) ν i= Ιδιότητες της συνδιακύµανσης. i) Cov(X,Y) = Cov(Y,X) ii) Cov(X,X) = σ x iii) Εάν η µία (ή και οι δύο) τυχαία µεταβλητή είναι σταθερή τότε η συνδιακύµανση είναι ίση µε το µηδέν (*). ηλαδή: Cov(c,Y) = 0 (*) Οι τρείς αυτές ιδιότητες αποδεικνύονται πολύ εύκολα, µε τη βοήθεια του τύπου της συνδιακύµανσης και της διακύµανσης σ.

4 iv) Ενας ακόµη τύπος για την συνδιακύµανση είναι και ο Σ(Χ i Y i ) νσ(χ i Y i ) - Σ(Χ i )Σ(Y i ) Cov(X,Y) = ----------- - µ x µ ψ = ----------------------------- ν ν που προκύπτει από τον προηγούµενο τύπο µε πράξεις (*), και χρησιµοποιείται πολύ συχνά. Γεωµετρική ερµηνεία της συνδιακύµανσης. α) Αρχικά να εκφράσουµε την ερµηνεία της Αλγεβρικής σχέσης που εκφράζει τη συνδιακύµανση. Εάν θεωρήσουµε πως τα Χ i και Ψ i είναι οι µετρήσεις των δύο τ.µ. Χ και Ψ στο i-οστό άτοµο του πληθυσµού, τότε οι ποσότητες: Α i = (Χ i -µ χ ) και B i = (Ψ i -µ ψ ) ορίζουν τις αλγεβρικές "αποστάσεις" της κάθε µιας µέτρησης από τον αντίστοιχο µέσο όρο της κάθε τ.µ.. Η συνδιακύµανση Cov(X,Ψ) είναι ο µέσος όρος του γινοµένου αυτών των Αλγεβρικών αποστάσεων Α i *B i. β) Ας εξετάσουµε τώρα τις τιµές που µπορεί να πάρει η συνδιακύµανση Cov(Χ,Ψ), και στο τί σηµαίνουν οι τιµές αυτές. Η διαφορά (Χ i -µ x ) είναι θετική, όταν το Χ i είναι µεγαλύτερο της µέσης τιµής µ x. Το ίδιο συµβαίνει και µε τη διαφορά (Υ i -µ ψ ). Εποµένως το γινόµενο (Χ i -µ x )(Υ i -µ ψ ) θα είναι θετικό όταν οι δύο διαφορές είναι οµόσηµες, όταν δηλαδή η κάθε µια από τις δύο τιµές του i-οστού στοιχείου του πληθυσµού είναι ταυτόχρονα µεγαλύτερες ή µικρότερες από τον αντίστοιχο µέσο όρο. (*) Οι πράξεις αυτές, όπως και άλλες, θα σηµειωθούν στο τέλος του κεφαλαίου για να επιτρέπουν την απρόσκοπτη ανάγνωση του κειµένου από τον αναγνώστη που δεν ενδιαφέρεται για τις Μαθηµατικές αποδείξεις. Η παραποµπή για τις συγκεκριµένες πράξεις είναι η [].

5 Ακριβώς το αντίθετο συµβαίνει όταν οι δύο διαφορές (Χ i -µ x ) και (Υ i -µ ψ ) είναι ετερόσηµες. Τότε έχουµε πως η τιµή της µιας µεταβλητής στο i-οστό ά- τοµο είναι µεγαλύτερη του µέσου όρου της, ενώ η άλλη είναι µικρότερη. Όταν λοιπόν οι περισσότερες διαφορές (Χ i -µ x ) και (Υ i -µ ψ ) είναι οµόσηµες συµπεραίνουµε πως υπάρχει µια γενική τάση σύµφωνα µε την οποία τα στοιχεία του πληθυσµού µε µικρές τιµές στα Χ να έχουν µικρές τιµές και στα Υ, ενώ τα στοιχεία µε µεγάλα Χ να έχουν και µεγάλα Υ. Τα αντίθετα ισχύουν όταν οι περισσότερες διαφορές είναι ετερόσηµες. Εποµένως, όταν οι οµόσηµες διαφορές είναι περισσότερες και µεγαλύτερες σε απόλυτη τιµή από τις ετερόσηµες, τότε η τιµή της συνδιακύµανσης είναι θετική. Αντίθετα, όταν οι ετερόσηµες διαφορές είναι περισσότερες και µεγαλύτερες σε απόλυτη τιµή από τις οµόσηµες, τότε η τιµή της συνδιακύµανσης είναι αρνητική. γ) Ύστερα απ'όλα αυτά γίνεται φανερό το γιατί µπορούµε να θεωρήσουµε την συνδιακύµανση σαν ένα δείκτη για την συµµεταβολή των τυχ.µεταβλητών Χ και Υ. Το τελικό συµπέρασµα παρουσιάζεται στον επόµενο πίνακα: Συνδιακύµανση Παρατηρήσεις Cov(X,Y) > 0 Υπάρχει µια γενική τάση σύµφωνα µε την οποία όταν η τ.µ. Χ αυξάνεται, η τ.µ Υ να µεταβάλλεται σαν αύξουσα συνάρτησή της. Cov(X,Y) = 0 εν υπάρχει κάποιας µορφής συσχέτιση ανά- µεσα στις δύο τ.µ., ή η µία από τις δύο είναι σταθερή. Cov(X,Y) < 0 Υπάρχει µια γενική τάση σύµφωνα µε την οποία όταν η τ.µ. Χ αυξάνεται, η τ.µ Υ να µεταβάλλεται σαν φθίνουσα συνάρτησή της.

6 Παρατήρηση: Η τιµή της συνδιακύµανσης δεν αποτελεί απόλυτο κριτήριο για το βαθµό συσχέτισης των δύο τυχ.µεταβλητών, αλλά µια ένδειξη τάσης. Ας υποθέσουµε, για παράδειγµα πως η τιµή αυτή είναι θετική µεν, αλλά αρκετά µικρή, ενώ οι διακυµάνσεις των δύο τυχαίων µεταβλητών σ x και σ ψ είναι αισθητά µεγαλύτερες. Στην περίπτωση αυτή αντιλαµβανόµαστε πως η τιµή της συνδιακύµανσης δείχνει πως σε κάποια άτοµα του πληθυσµού οι τιµές των τυχαίων µεταβλητών µεταβάλλονται παρόµοια (αυξάνονται ή µειώνονται και οι δύο), ενώ σε κάποια άλλα συµβαίνει το ακριβώς αντίθετο, µόνο που το πρώτο φαινόµενο είναι κάπως ισχυρότερο (ή συχνότερο). Εδώ λοιπόν η θετική τιµή της συνδιακύµανσης δεν δηλώνει τίποτε άλλο πέρα από µια ασθενή τάση. Εάν τέλος η τιµή της συνδιακύµανσης είναι κοντά στο µηδέν (και εφ'όσον οι διακυµάνσεις της κάθε µιας τυχ.µεταβλητής δεν είναι πολύ µικρές) µπορούµε να µιλούµε για ασυσχέτιστες τυχαίες µεταβλητές. Παράδειγµα Γ.. (η συνέχεια...) Ξαναγυρνώντας στο παράδειγµα της προηγούµενης παραγράφου, χ κ 3 3 5 7 7 θα υπολογίσουµε την συνδιακύ- ψ κ 5 6 4 3 3 µανση των τιµών Χ i και Υ i του διπλανού πίνακα. Λύση: Πριν υπολογίσουµε την τιµή της συνδιακύµανσης, παρατη-ρούµε τη γραφική παράσταση του σχήµατος Γ.7. Αµέσως αντιλαµβανό-µαστε πως υπάρχει µια φθίνουσα τάση στις τιµές της Υ όταν αυξάνονται οι τιµές των Χ. Περιµένουµε λοιπόν τη συνδιακύµανση αρνητική και µάλιστα όχι κοντά στο µηδέν. Ιδωµεν... Από τον πίνακα του προηγούµενου παραδείγµατος έχουµε πως: Σχ i = 30, Σψ i = 6, Σ(χ i ψ i ) = 76 οπότε: νσ(χ i Y i ) - Σ(Χ i )Σ(Y i ) Cov(X,Y) = ---------------------------- = ν

7 8*76-30*6-7 = ------------------ = ------- = -.6875 8 64 Οι τυπικές αποκλίσεις σ x και σ ψ αποδεικνύεται πως είναι ίσες µε: σ x =.65 και σ ψ =.56 οπότε η τιµή της συνδιακύµανσης δείχνει αυτό που παρατηρήσαµε από τη γραφική παράσταση των δεδοµένων (Σχ.Γ.7), ότι δηλαδή οι τιµές Χ i και Y i έχουν σηµαντικό βαθµό συσχέτισης. Γ... Συντελεστής γραµµικής συσχέτισης. Σύµφωνα µε τα όσα είπαµε στην παρατήρηση της προηγούµενης παραγράφου για τη συνδιακύµανση, η τιµή της είναι µόνο ένας σχετικός δείκτης για την εξάρτηση των τιµών µιας τυχ.µεταβλητής, απ'αυτές µιας άλλης. Οταν µάλιστα η τιµή της συνδιακύµανσης είναι σαφώς µικρότερη απ'αυτές των τυπικών αποκλίσεων των τιµών Χ και Υ, τότε η σηµασία της είναι ελάχιστη. Ο επόµενος λοιπόν ορισµός είναι ένα λογικό επακόλουθο των προηγουµένων. Ορισµός Γ.7. Έστω οι δύο τυχαίες µεταβλητές Χ i και Υ i στα ν στοιχεία ενός πληθυσµού, µε τυπικές αποκλίσεις τις σ x και σ ψ. Ο βαθµός γραµµικής εξάρτησης της µιας µεταβλητής από την άλλη δίνεται από τον συντελεστή γραµµικής συσχέτισης: Cov(X,Y) r xψ = --------------- σ x σ ψ

8 Αντικαθιστώντας τους τύπους της συνδιακύµανσης, της τυπικής απόκλισης και της µέσης τιµής στον τύπο του συντελεστή γραµµικής συσχέτισης, έ- χουµε τον τύπο υπολογισµού του r: νσ(χ i Y i ) - Σ(Χ i )Σ(Y i ) ---------------------------- Cov(X,Y) ν r xψ = ------------- = ------------------------------------------- Σ x Σ ψ Σ(Χ i ) Σ(Υ i ) -------- - µ x -------- - µ ψ ν ν ν(σχ i ψ i ) - (Σχ i )(Σψ i ) r xψ = ---------------------------------------------- [ν(σχ i ) - (Σχ i ) ]*[ν(σψ i ) - (Σψ i ) ] όπου όλα τα αθροίσµατα (Σ) "πηγαίνουν" από i= έως ν. Ιδιότητες του συντελεστή γραµµικής συσχέτισης: i) Ο συντελεστής γραµµικής συσχέτισης r είναι καθαρός αριθµός, δεν εξαρτάται εποµένως από τις µονάδες των τυχ.µεταβλητών Χ και Υ. ii) Αποδεικνύεται [] πως ο r µπορεί να πάρει τιµές από το - έως το. iii) Το πρόσηµο του r δηλώνει µόνο την κλίση της ευθείας ελαχίστων τετραγώνων που ορίζεται από τα σηµεία (Χ i,y i ). Είναι εποµένως το r οµόσηµο µε τον συντελεστή διεύθυνσης της ευθείας ελαχίστων τετραγώνων, α. iv) Το r παίρνει ακριβώς την τιµή (ή -), όταν όλα τα δεδοµένα (Χ i,υ i ) βρίσκονται ακριβώς πάνω στην ευθεία των ελαχίστων τετραγώνων, που είναι αύξουσα (φθίνουσα). Στην περίπτωση αυτή µιλάµε βέβαια για συναρτησιακή εξάρτηση και µάλιστα γραµµική. v) Όσο η απόλυτη τιµή του r είναι κοντά στη µονάδα, τόσο πιό κοντά στην ευθεία των ελαχίστων τετραγώνων βρίσκονται τα δεδοµένα (Χ i,υ i ). Τόσο ισχυρότερη είναι λοιπόν η γραµµική συσχέτιση που υπάρχει ανάµεσα στις µεταβλητές Χ και Υ.

9 vi) Αντίθετα, όσο πιο κοντά στο µηδέν είναι η τιµή του r, τόσο λιγότερο καλά προσεγγίζει η ευθεία των ελαχίστων τετραγώνων τα σηµεία (Χ i,υ i ). Τότε λέµε πως δεν υπάρχει γραµµική εξάρτηση, ή γραµµική συσχέτιση ανάµεσα στις µεταβλητές Χ και Υ. vii) Η ύπαρξη συσχέτισης ανάµεσα στις µεταβλητές Χ και Υ δεν εξαρτάται µόνον από την τιµή του r, αλλά και από το πλήθος ν των στοιχείων του πληθυσµού. Έτσι, µία τιµή του r µπορεί να µην εξασφαλίζει την ύπαρξη συσχέτισης για ν=8, αλλά να εξασφαλίζει την ύπαρξη συσχέτισης σ'έναν πληθυσµό µε ν=30. Παρατηρούµε δηλαδή πως όσο το πλήθος των δεδοµένων ν είναι µεγαλύτερο, τόσο µικρότερη είναι η οριακή τιµή του r, η οποία δηλώνει την ύπαρξη συσχέτισης. Ο επόµενος πίνακας δίνει µια αντιστοιχία ανάµεσα στην τιµή του r, στον χαρακτηρισµό της συσχέτισης και στο πλήθος ν. Χαρακτηρισµός της συσχέτισης: ν=0 ν=0 ν=40 Απόλυτη Ισχυρότατη Ισχυρή Μέτρια Ασθενής 0.95-0.99 0.85-0.95 0.70-0.85 0.55-0.70 0.90-0.99 0.75-0.90 0.55-0.75 0.40-0.55 0.85-0.99 0.65-0.85 0.40-0.65 0.30-0.40 Απίθανη η ύπαρξη συσχέτισης... r < 0.55 r < 0.40 r < 0.30 Πίνακας Γ.4. Η αντιστοιχία ανάµεσα στο χαρακτηρισµό της συσχέτισης και στην τιµή του συντελεστή γραµµικής συσχέτισης, σε σχέση µε το πλήθος ν των στοιχείων (X i,y i ). Στα επόµενα σχεδιαγράµµατα παρατηρούµε τέσσερις διαφορετικές περιπτώσεις όπου η συσχέτιση των δύο τυχαίων µεταβλητών ανήκει σε διαφορετικές κατηγορίες.

30 ψ ψ * * * * * * * * * * * * * * * * * * * * * Α:απόλυτη συσχέτιση (r=-) x B:ισχυρή συσχέτιση (r=0.9) x ψ ψ * * ** ** * * * * * * * * * * * * * ** * * * * * * * * * * * * * * * * * ** * * * * * * ** * ** * * * * ** * Γ:χαλαρή συσχέτιση (r=-0.6) x x :δεν υπάρχει συσχέτιση (r=-0.) Σχ.Γ.8. Τέσσερα διαφορετικά ζεύγη τυχ.µεταβλητών και οι γραµµικές συσχετίσεις τους. iix) Είναι, νοµίζουµε προφανές πως εάν αλλάξουµε αµοιβαία στους άξονες τις τιµές των χ και των ψ, η ευθεία ελαχίστων τετραγώνων µετα-βάλλεται τελείως. Συµβαίνει όµως να µεταβάλλεται και ο συντελεστής γραµµικής συσχέτισης. Αυτό οφείλεται στον τρόπο µε τον οποίο ορίζουµε τις "αποστάσεις" των σηµείων των δεδοµένων από την ευθεία των ελαχίστων τετραγώνων (παράλληλα προς τον άξονα των ψ). Η προσέγγιση των δεδοµένων µε τη βοήθεια της ευθείας ελαχίστων τετραγώνων, µε τον τρόπο αυτό του ορισµού των αποστάσεων, υπονοεί πως το σηµείο των δεδοµένων (X i,y i ) θα έπρεπε να βρίσκεται πάνω στην ευθεία, οπότε η απόσταση d i, µπορεί να θεωρηθεί σαν σφάλµα της τιµής Υ i, θεωρώντας ταυτόχρονα τη µέτρηση Χ i, ακριβή. ψ * * * * * * * * d i * * * *

3 Συµπέρασµα: Βάζουµε στον άξονα των Χ i, εκείνη από τις δύο τυχαίες µεταβλητές της οποίας τις τιµές τις θεωρούµε ακριβέστερες. Παράδειγµα Γ.. (3η συνέχεια...) Ξαναγυρίζουµε, για τελευταία φορά στα δεδοµένα του παραδείγµατος χ κ 3 3 5 7 7 Γ., προσπαθώντας να υπολογίσουµε ψ κ 5 6 4 3 3 τον συντελεστή γραµµικής συσχέτισης. ος τρόπος: Για να µπορέσουµε να εφαρµόσουµε τον τύπο του r µε τα διάφορα αθροίσµατα, θα πρέπει να προσθέσουµε στον πίνακα που δηµιουργήσαµε για τον υπολογισµό της ευθείας ελαχίστων τετραγώνων, µία ακόµη κολόνα, όπου θα αθροίζονται τα ψ. Με τη βοήθεια λοιπόν του διπλανού πίνακα ο τύπος του r δίνει τα εξής: και Σχ=30, Σχ =50, Σχψ=76, Σψ=6, Σψ =04. χ κ χ κ 3 3 5 7 7 4 4 9 9 5 49 49 ψ κ ψ κ 5 6 4 3 3 5 36 6 4 9 9 4 χ κ ψ κ 5 8 6 9 5 7 4 30 50 6 04 76 ν(σχ i ψ i ) - (Σχ i )(Σψ i ) 8*76-30*6 r xψ = --------------------------------------------- = --------------------------------- = [ν(σχ i ) - (Σχ i ) ]*[ν(σψ i ) - (Σψ i ) ] (8*50-30 )(8*04-6 ) -7 = -------------- = -0.795 300*56

3 ος τρόπος: Στη η συνέχεια του παραδείγµατος υπολογίσαµε πως: Cov(X,Y) = -.594, σ x =.65 και σ ψ =.56 Αντικαθιστώντας τις τιµές αυτές στον τύπο του ορισµού του συντελεστή γραµ- µικής συσχέτισης r, έχουµε: Cov(X,Y) -.6875 r xψ = -------------- = --------------- = -0.795 σ x σ ψ.65*.56 Σύµφωνα µε τον πίνακα Γ.4, ο συντελεστής συσχέτισης που µόλις υπολογίσαµε δείχνει την ύπαρξη µιας µέτριας γραµµικής συσχέτισης ανάµεσα στις τιµές Χ και Υ. Γ..3. Επίδραση των γραµµικών µετασχηµατισµών στην τιµή της συνδιακύµανσης και του συντελεστή γραµµικής συσχέτισης. Στο µάθηµα της Στατιστικής Ι αντιµετωπίσαµε τους µετασχηµατισµούς µιας τυχαίας µεταβλητής Χ i, και την επίδρασή τους στις παραµέτρους µ (µέση τιµή) και σ (τυπική απόκλιση). Είδαµε επίσης πόσο οι µετασχηµατισµοί µπορούν να απλοποιήσουν τις πράξεις κατά τους υπολογισµούς. Στην παράγραφο αυτή θα γνωρίσουµε την επίδραση των γραµµικών µετασχηµατισµών στην τιµή της συνδιακύµανσης και του συντελεστή γραµ.συσχέτισης. Έστω λοιπόν οι τυχ.µεταβλητές X i και Y i, για i=,,..,ν, µε τις παρακάτω παραµέτρους: Μέση τιµή: µ x και µ ψ, τυπική απόκλιση: σ x και σ ψ και συνδιακύµανση: Var(X,Y). Εάν τα a, b, c και d είναι τέσσερις πραγµατικές σταθερές, οι παράµετροι των τυχαίων µεταβλητών: T i = ax i + b και

33 Ρ i = cy i + d δίνονται από τον πίνακα: Τυχαία µεταβλητή µέσος όρος τυπική απόκλιση συνδιακύµανση και συντ.συσχ.: r T i = ax i +b Ρ i = cy i +d µ τ = aµ x +b µ p = cµ ψ +d σ τ = aσ x σ p = cσ x Cov(T,P) = accov(x,y) r τp = r xψ Οι σχέσεις που αφορούν στο µέσο όρο και την τυπική απόκλιση έχουν αποδειχθεί στη Στατιστική Ι. Η απόδειξη της σχέσης για το r είναι προφανής, εάν δεχθούµε τις σχέσεις της συνδιακύµανσης και της τυπικής απόκλισης. Α- ποµένει εποµένως η απόδειξη για τη συνδιακύµανση, που υπάρχει στο τέλος του κεφαλαίου [3]. Αν τέλος δεχθούµε τα προηγούµενα, εύκολα µπορούµε να υπολογίσουµε τις παραµέτρους του πιο συνηθισµένου µετασχηµατισµού: όπου έχουµε: και X i -b Y i -d ZX i = -------- και ZΥ i = --------- a c Cov(ZX,ZY) = Cov(X,Y)/(ac) r zx,zψ = r xψ Εφαρµογή: Όλα τα προηγούµενα µπορούν, όταν τα δεδοµένα το επιτρέπουν, να α- πλοποιήσουν τους τύπους των παραµέτρων α και β της ευθείας των ελαχίστων τετραγώνων, καθώς και τον τύπο του συντελεστή r της γραµµικής συσχέτισης. Μπορούµε να απλοποιήσουµε τους τύπους αυτούς όταν τα δεδοµένα του άξονα των χ είναι ισαπέχοντα. Στην περίπτωση αυτή εκτελούµε έναν από τους παρακάτω δύο µετασχηµατισµούς:

34 ος) Οταν το πλήθος ν των σηµείων των δεδοµένων είναι περιττό, εκτελούµε τον, πολύ γνωστό από τη Στατιστική Ι, µετασχηµατισµό: όπου, X i - µ Ζ i = --------- ε µ : η µεσαία τιµή από τις ν τιµές των Χ i, ε : X i+ - X i, δηλ. η απόσταση ανάµεσα σε δύο διαδοχικά Χ, η οποία είναι σταθερή, µια και όπως έχουµε ήδη πεί, οι τιµές του άξονα των χ είναι διαδοχικές και ισαπέχουσες. ος) Οταν το πλήθος ν των σηµείων των δεδοµένων είναι άρτιο, εκτελού- µε τον µετασχηµατισµό: X i - µ' Ζ i = ---------- ε/ όπου, µ': το ηµιάθροισµα των δύο µεσαίων τιµών από τις ν τιµές των Χ i, ε : X i+ - X i, και πάλι δηλαδή η απόσταση ανάµεσα σε δύο διαδοχικά Χ. Εχουµε λοιπόν, κατά την περίπτωση αυτή, στον παρονο- µαστή το µισό της απόστασης δύο διαδοχικών Χ. Το τελικό αποτέλεσµα των δύο αυτών µετασχηµατισµών είναι πως το ά- θροισµα Σ(Ζ i ) είναι πάντα ίσο µε το µηδέν. Εάν λοιπόν στους τύπους που δίνουν τους συντελεστές α, β και r για τα νέα δεδοµένα (Ζ i,y i ), αντικαταστήσουµε το εν λόγω άθροισµα µε το µηδέν, καταλήγουµε εύκολα στους τύπους: Σ(z i *ψ i ) α = ------------ Σ(z i ) και Σ(ψ i ) β = ---------- ν (Σz i ψ i ) r zψ = ------------------------------------ (Σz i )*[(Σψ i ) - (Σψ i ) /ν]

35 Παράδειγµα: Ο ετήσιος τζίρος µιας οικογενειακής επιχείρησης, σε εκατοµµύρια δραχµές, από το έτος ίδρυσής της (988), έως το προηγούµενο οικονοµικό έτος (993) δίνεται από τον διπλανό πίνακα. Θέλουµε να υπολογίσουµε την τιµή των παραµέτρων α,β και r της γραµµικής παλινδρόµησης και συσχέτισης. Έτος 988 989 990 99 99 993 Τζίρος.8 5.3 49.4 55.6 60.3 57.9 Λύση: Παρατηρούµε πως οι τιµές που θα τοποθετηθούν στον άξονα των χ είναι ισαπέχουσες, ενώ το πλήθος τους είναι άρτιο (ν=6). Σύµφωνα µε τα παραπάνω αξίζει να κάνουµε τον µετασχηµατισµό: X i - 990.5 Ζ i = ---------------- / Με τον τρόπο αυτό δηµιουργούµε τον επόµενο πίνακα, στον οποίο υπολογίζονται όλες οι ποσότητες που απαιτούνται για την εύρεση των τιµών των συντελεστών α, β, r. Έχουµε λοιπόν: Σ(z i *ψ i ) 3.7 α = ------------ = --------- = 3.053 Σ(z i ) 70 X i Z i Z i 988 989 990 99 99 993-5 -3-3 5 5 9 9 5 Y i Y i.8 5.3 49.4 55.6 60.3 57.9 475.4 63.69 440.36 309.36 3636.09 335.4 Ζ i Y i -09.0-53.9-49.4 55.6 80.9 89.5 Σύν. 0 70 90.3 567.5 3.7 Σ(ψ i ) 96.3 β = --------- = -------- = 49.383 ν 6 (Σz i ψ i ) 3.7 r zψ = --------------------------------- = ---------------------------------- = (Σz i )*[(Σψ i ) - (Σψ i ) /ν] 70*(567.5-96.3 /6) = 3.7/63.895 = 0.8098

36 Τα παραπάνω αποτελέσµατα γίνονται φανερά και από την παρακάτω γραφική παράσταση. Παρατηρείστε πως η ευθεία ελαχίστων τετραγώνων χαράσσεται µε τη βοήθεια δύο σηµείων Σ και Σ, τα οποία µπορούν να αντιστοιχούν στις τιµές της ευθείας για δύο οποιαδήποτε z. Συνήθως (για µεγαλύτερη ακρίβεια στη χάραξη) διαλέγουµε τα δύο πιο αποµακρυσµένα z (εδώ το -5 και το 5). Έχουµε λοιπόν τον πίνακα τιµών: z ψ = 3.053*z+49.383-5 5 34.8 64.648 και στη γραφική παράσταση: 75 50 5 0-6 -4-0 4 6-5 Σχ.Γ.9: Ο ετήσιος τζίρος µιας οικογενειακής επιχείρησης από το 988 έως το 993 και η ευθεία των ελαχίστων τετραγώνων που προσαρµόζεται στα δεδοµένα αυτά. Γ..4. Παράδειγµα Γ.3. Ο κάθε οδηγός διαλέγει συνήθως το αυτοκίνητό του έτσι ώστε να τον ι- κανοποιεί σε κάποιες προσωπικές του ανάγκες, επιλογές και προτεραιότητες. Όµως η ενηµέρωση του κάθε καταναλωτή, σ'ένα τόσο σηµαντικό ζήτηµα, γίνεται πάντα µε σωστό κατά βάση τρόπο; Επίσης από τις πληροφορίες, που τον κατακλύζουν από τον έντυπα και ηλεκτρονικά µέσα µαζικής ενηµέρωσης, θα µπορέσει να ξεχωρίσει αυτές που τον ενδιαφέρουν πραγµατικά και ανταποκρίνονται στις ιεραρχήσεις του;

37 Οι περισσότεροι οδηγοί δηλώνουν πως αναζητούν ένα αυτοκίνητο που να έχει καλή οδική συµπεριφορά, καλές επιδόσεις, να είναι αξιόπιστο, να είναι ξεκούραστο και άνετο κατά την οδήγηση και να έχει καλή ποιότητα κατασκευής. Οι περισσότεροι όµως οδηγοί, όταν ζητούν καλές επιδόσεις, ζητούν από το αυτοκίνητό τους να προσπερνά µε άνεση και ασφάλεια. ιαλέγουν λοιπόν ένα αυτοκίνητο µε βάση την ιπποδύναµή του, την επιτάχυνσή του από στάση (*) και την τελική του ταχύτητα. Άλλωστε, τα στοιχεία αυτά βρίσκονται συνήθως στα διαφηµιστικά φυλλάδια των αντιπροσωπειών. Βέβαια, η επιτάχυνση από στάση ενός αυτοκινήτου δείχνει, κυρίως, την ικανότητά του να ξεφεύγει µπροστά από τα άλλα αυτοκίνητα στον... "αγώνα των φωτεινών σηµατοδοτών". Κάτι τέτοιο όµως δεν αποτελεί την πρώτη προτεραιότητα των περισσοτέρων οδηγών. Εµείς, θεωρούµε πως ο βασικός δείκτης για το πώς προσπερνά ένα αυτοκίνητο στις Ελληνικές συνθήκες (**) είναι η εν κινήσει επιτάχυνσή του από τα 80 στα 0 µε την τέταρτη ταχύτητα. Πρόκειται για έναν δείκτη που δεν αναφέρεται συνήθως στα διαφηµιστικά φυλλάδια των αντιπροσωπειών αυτοκινήτων. Τίθεται εποµένως το ερώτηµα του κατά πόσο η εν κινήσει επιτάχυνση ενός αυτοκινήτου, είναι κάτι που µπορεί να συναχθεί από τις συνηθισµένες παραµέτρους: ιπποδύναµη, επιτάχυνση από στάση και ροπή στρέψης (την οποία σπάνια προσέχουµε). Την απάντηση στο ερώτηµα αυτό µπορεί να µας την δώσει ο συντελεστής της ευθύγραµµης συσχέτισης. Το πρόβληµα: ιαλέξαµε λοιπόν 5 αυτοκίνητα της µεσαίας κατηγορίας, µε κινητήρα ίδιου κυβισµού.6 lit. Βέβαια κάποιοι θα αναρωτηθούν γιατί δεν επιλέξαµε αυτοκίνητα διαφορετικού κυβισµού, έτσι ώστε να µελετήσουµε και την εξάρτηση της άνεσης στην προσπέραση από τον κυβισµό του κινητήρα. υστυχώς όµως η Ελληνική νοµοθεσία επιβαρύνει υπερβολικά τα αυτοκίνητα µε µεγάλο κυβισµό, καθιστώντας δυσπρόσιτα στην πλειοψηφία των Ελλήνων καταναλωτών. Για το λόγο αυτό διαλέξαµε (µε εξαίρεση το Rover) τον µικρότερο κινητήρα που διατίθεται από την κάθε εταιρεία, για το συγκεκριµένο αµάξωµα. Στον επόµενο πίνακα υπάρχουν τα στοιχεία για την ισχύ του κινητήρα, καθώς και µετρήσεις των επιδόσεών τους, από το περιοδικό 4 Τροχοί. (*) Συνήθως πρόκειται για το χρόνο που απαιτείται για να φθάσει το αυτο-κίνητο από στάση, στην ταχύτητα των 00 Km/h. (**) Μιλούµε για τις συνθήκες που επικρατούν στο µεγαλύτερο κοµµάτι του οδικού δικτύου της χώρας µας, αλλά και τις συνήθειες των Ελλήνων οδηγών.

38 Μάρκα-Τύπος Iσχύς Hp-DIN Ροπή (kg/m) 0-0 km/h (sec) 80-0 4n (sec) Τελική ταχύτητα ALFA ROMEΟ 75.6 AUDI 80.6 BMW 36i CITROEN XANTIA.6 FIAT TEMPRA.6 FORD MONDEO.6 HYNDAI LANTRA.6 LANCIA DEDRA.6 MAZDA XEDOS.6 NISSAN PRΙMERA.6 OPEL VECTRA.6 PEUGEOT 405.6 ROVER 6 GTI SUBARU LEGACY.6 TOYOTA CARINA.6 07 00 0 89 80 90 4 90 3 0 75 89 95 5 4.0 3.3 5.3 3.5 3.0 4. 4. 3.0 4. 3.9.7 3.0 4.3 3.0 5.0 8.4 8.3 6.7.9.5 9. 5.8 8.3 4.9 7.3.4 7.8 4.3 0.5 4. 0.6 9.0 9.3.4 9.9 9.6 9.. 0.0 0.7. 9.6 9..7 9.4 7 83 00 80 69 87 86 76 97 85 80 76 00 70 95 Πίνακας Γ.5. Οι παράµετροι του κινητήρα και οι επιδόσεις 5 αυτοκινήτων της µεσαίας κλάσης (διαλέξαµε την επιτάχυνση 0-0 Km/h, αντί της κλασσικής 0-00, γιατί πιστεύουµε πως στα σύγχρονα αυτοκίνητα είναι πιο χαρακτηριστική). Το πρόβληµα που θα αντιµετωπίσουµε είναι να υπολογίσουµε την ύπαρξη ή όχι συσχέτισης ανάµεσα στις διάφορες µετρήσεις. Το πιο ενδιαφέρον όµως στοιχείο του παραδείγµατος αυτού θα είναι ο σχολιασµός των αποτελεσµάτων, µια και ο τρόπος λύσης της άσκησης θα είναι παρόµοιος µ'αυτόν των δύο προηγουµένων. υστυχώς όµως καµιά από τις παραµέτρους δεν έχει τιµές διαδοχικές και ισαπέχουσες, µε αποτέλεσµα να µην µπορούµε να χρησιµοποιήσουµε τον µετασχηµατισµό της προηγούµενης παραγράφου. i) Αρχικά θα υπολογίσουµε το συντελεστή γραµµικής συσχέτισης ανάµεσα στα µεγέθη της ιπποδύναµης του κινητήρα και της επιτάχυνσης 0-0. Θέτουµε λοιπόν: Χ i = ιπποδύναµη του i-οστού αυτοκινήτου και Y i = επιτάχυνση 0-0 του i-οστού αυτοκινήτου. Από τον πίνακα υπολογίζουµε: ΣX i = 483.00 ΣX i = 493.00 ΣY i = 7.30 ΣY i = 5007.9 και ΣX i Y i = 6369.60

39 οπότε οι συντελεστές α και β της ευθείας ελαχίστων τετραγώνων και ο συντελεστής συσχέτισης r είναι ίση µε: ψ = αχ+β = -0.7395*χ + 35.8489 και r = -.88640 4 sec 0 6 70 90 0 30 Ch(Din) Σχ.Γ.0. Η επιτάχυνση 0-0 σαν συνάρτηση της ιπποδύναµης του κινητήρα. Το συµπέρασµα είναι το ίδιο, είτε βασιστούµε στο συντελεστή r, είτε ε- µπιστευτούµε την εικόνα της γραφικής παράστασης. ιαπιστώνουµε µια ισχυρή αρνητική συσχέτιση των δύο αυτών µεγεθών, πράγµα που σηµαίνει πως δεν είναι απαραίτητο να γνωρίζουµε και τις δύο αυτές τιµές, µια και η πρώτη (ιπποδύναµη) µας δίνει αρκετές πληροφορίες για τη δεύτερη (επιτάχυνση). ii) Θα επιλέξουµε τώρα σαν Χ i την ιπποδύναµη του κινητήρα και σαν Y i την επιτάχυνση 80-0 (µε 4η). Έχουµε τώρα πως: ΣΧ i = 483.00 ΣX i = 493.00 ΣY i = 5.80 ΣY i = 570.78 r = -0.47970 και ΣX i Y i = 504.40 Το αποτέλεσµα αυτό µας δηλώνει πως αν υπάρχει κάποια συσχέτιση της επιτάχυνσης εν κινήσει (80-0) µε την ιπποδύναµη, αυτή θα είναι πολύ χαλαρή. Άρα κάποιος που θέλει κατά βάση ένα αυτοκίνητο που να προσπερνά άνετα και εύκολα, και αγοράζει ένα αυτοκίνητο µε βάση την ιπποδύναµη του κινητήρα, έχει τελικά µεγάλη πιθανότητα να πέσει έξω!...