ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ



Σχετικά έγγραφα
2. Στοιχεία Πολυδιάστατων Κατανοµών

Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια.

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Κεφάλαιο 6 Παράγωγος

2. Missing Data mechanisms

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές»

1 Ορισµός ακολουθίας πραγµατικών αριθµών

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

1.1.3 t. t = t2 - t x2 - x1. x = x2 x

3 Αναδροµή και Επαγωγή

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Κατανοµές. Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται από το σχήµα του ιστογράµµατος (histogram).

Γραµµική Αλγεβρα Ι. Ενότητα: ιανυσµατικοί χώροι. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

Αριθµητική Παραγώγιση και Ολοκλήρωση

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

1 Συνοπτική ϑεωρία. 1.1 Νόµοι του Προτασιακού Λογισµού. p p p. p p. ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9

Πρακτική µε στοιχεία στατιστικής ανάλυσης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

Κεφάλαιο 4. Ευθέα γινόµενα οµάδων. 4.1 Ευθύ εξωτερικό γινόµενο οµάδων. i 1 G 1 G 1 G 2, g 1 (g 1, e 2 ), (4.1.1)

ΑΝΩΣΗ µε λογισµικό PheT ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ. Πείραµα. (εικονικό).

3 ΙΣΟΡΡΟΠΙΕΣ 3 ΙΣΟΡΡΟΠΙΕΣ

Διαβάζοντας το βιβλίο του Θρασύβουλου εγώ εστιάζω στο εξής:

Αρµονική Ανάλυση. Ενότητα: Το ϑεώρηµα παρεµβολής του Riesz και η ανισότητα Hausdorff-Young. Απόστολος Γιαννόπουλος.

f (x) = l R, τότε f (x 0 ) = l. = lim (0) = lim f(x) = f(x) f(0) = xf (ξ x ). = l. Εστω ε > 0. Αφού lim f (x) = l R, υπάρχει δ > 0

Δυναμική ενέργεια στο βαρυτικό πεδίο. Θετική ή αρνητική;

X:S X(S) Έστω ότι στρίβουµε ένα αµερόληπτο νόµισµα δύο φορές και ενδιαφερόµαστε για τον αριθµό των Κ που θα εµφανιστούν.

Περιγραφική και πειραματική έρευνα

ONE WAY ANOVA. .Π.Μ.Σ. Μαθηµατικά των Υπολογιστών & των αποφάσεων. Πάτρα, 11 Ιανουαρίου 2011

a 1d L(A) = {m 1 a m d a d : m i Z} a 11 a A = M B, B = N A, k=1

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ Ασκησεις - Φυλλαδιο 9

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ Λυσεις Ασκησεων - Φυλλαδιο 1

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ 12) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ 3

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

HY118- ιακριτά Μαθηµατικά. Παράδειγµα. Από τα συµπεράσµατα στις υποθέσεις Αποδείξεις - Θεωρία συνόλων. Από τις υποθέσεις στα συµπεράσµατα...

Κεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Συναρτησιακές Εξαρτήσεις. Βάσεις εδοµένων Ευαγγελία Πιτουρά 1

ικτυωτά διαγράµµατα και οµάδες αυτοµορφισµών Παρουσίαση εργασίας φοιτητή (x,a) 1) (xy)a=x(ya) x,y G και a A 1) a(xy)=(ax)y 2) ae=a

Επαναληπτικό μάθημα Βασικών επιδημιολογικών εννοιών. Ειρήνη Αγιαννιωτάκη

, όπου οι σταθερές προσδιορίζονται από τις αρχικές συνθήκες.

< 1 για κάθε k N, τότε η σειρά a k συγκλίνει. +, τότε η η σειρά a k αποκλίνει.

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Κεφάλαιο 5ο: Εντολές Επανάληψης

ΑΛΓΕΒΡΙΚΕΣ ΟΜΕΣ Ι. Ασκησεις - Φυλλαδιο 2

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

(GNU-Linux, FreeBSD, MacOsX, QNX

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

Αναλυτική Στατιστική

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

KΕΦΑΛΑΙΟ 6 ΥΝΑΜΟΣΕΙΡΕΣ-ΣΕΙΡΕΣ TAYLOR

Σχολικός Σύµβουλος ΠΕ03

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Πρόβληµα 2 (12 µονάδες)

HY118- ιακριτά Μαθηµατικά

Θεώρηµα: Z ( Απόδειξη: Περ. #1: Περ. #2: *1, *2: αποδεικνύονται εύκολα, διερευνώντας τις περιπτώσεις ο k να είναι άρτιος ή περιττός

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex

ΚΕΦΑΛΑΙΟ 3 ΜΕΛΕΤΗ ΑΠΟ ΟΣΗΣ ΚΑΙ ΕΠΙΤΥΧΙΑΣ ΗΜΕΡΗΣΙΩΝ ΗΜΟΣΙΩΝ ΚΑΙ Ι ΙΩΤΙΚΩΝ ΛΥΚΕΙΩΝ ΕΙΣΑΓΩΓΗ

ΕΙΣΑΓΩΓΗ ΣΤΟ MATLAB- SIMULINK

Κεφάλαιο 3 ΠΑΡΑΓΩΓΟΣ. 3.1 Η έννοια της παραγώγου. y = f(x) f(x 0 ), = f(x 0 + x) f(x 0 )

Κεφάλαιο 7. Έλεγχος Υποθέσεων. Ένα παράδειγµα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

ΗΜΙΟΥΡΓΙΑ ΠΑΙΧΝΙ ΙΟΥ ΣΤΟ SCRATCH ΒΗΜΑ ΠΡΟΣ ΒΗΜΑ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

10ο Φροντιστηριο ΗΥ217 - Επαναληπτικό

Τυχαιοποιηµένοι Πλήρως Σχεδιασµοί κατά Μπλοκ (Randomized Complete Block Design)

Σηµειώσεις στις σειρές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Προτεινοµενες Ασκησεις - Φυλλαδιο 9

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Μηχανική ΙI. Μετασχηµατισµοί Legendre. της : (η γραφική της παράσταση δίνεται στο ακόλουθο σχήµα). Εάν

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

11, 12, 13, 14, 21, 22, 23, 24, 31, 32, 33, 34, 41, 42, 43, 44.

ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΙΚΗΣ ΑΝΑΛΥΣΗΣ Ι ( )

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

x 2 = x x 2 2. x 2 = u 2 + x 2 3 Χρησιµοποιώντας το συµβολισµό του ανάστροφου, αυτό γράφεται x 2 = x T x. = x T x.

Ορισµοί και εξισώσεις κίνησης

HY118- ιακριτά Μαθηµατικά

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Ελεύθερη αρµονική ταλάντωση χωρίς απόσβεση

HY118- ιακριτά Μαθηµατικά

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Kεφάλαιο 4. Συστήµατα διαφορικών εξισώσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

1 Το ϑεώρηµα του Rademacher

Περί της Ταξινόμησης των Ειδών

. Κουζούδης 1 ΠΑΡΑΓΩΓΟΙ

Σε αυτό το µάθηµα θα ασχοληθούµε µε τη βελτίωση της εµφάνισης ενός ιστοτόπου, αλλά και τον εύκολο χειρισµό όλων των αλλαγών στην εµφάνιση της σελίδας

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΕΑΡΙΝΟ ΕΞΑΜΗΝΟ 2003-2004 Μάθηµα: Η ΣΤΑΤΙΣΤΙΚΗ ΤΟΝ 21 ο ΑΙΩΝΑ ιδάσκοντες: Ι. ΠΑΝΑΡΕΤΟΣ Εργασία: 1 Φοιτητής Ονοµατεπώνυµο: ΚΟΝΟΜΗ ΜΠΛΕΝΤΑΡ Α.Μ.: s6010082 Ηµεροµηνία Υποβολής: 11/09/2004

Εισαγωγή Θέλω να ξεκινήσω αυτή την εισαγωγή µε τη φράση που είναι και η αιτία της απόφασης να ασχοληθώ µε το θέµα αυτό. Correlation does not imply causation Η συσχέτιση δεν συνεπάγεται αναγκαστικά τη σχέση αιτίου-αποτελέσµατος, λένε οι στατιστική που ασχολούνται µε το θέµα. Πολλές επιστήµες έχουν ασχοληθεί µε το θέµα αυτό, όπως Φιλόσοφοι, Οικονοµολόγοι, Κοινωνιολόγοι, Βιολόγοι και τα τελευταία χρόνια όλο και ποιό πολλή στατιστικοί. Η δικά µου γνώµη είναι πως: Από τη στιγµή που η ερώτηση µπορεί να γίνει στη µορφή µιας µηδενικής υπόθεσης τότε η στατιστική πρέπει να παίξει το κυριότερο ρόλο στη πρακτική και φιλοσοφική προσέγγιση. (στη συγκεκριµένη περίπτωση η ερώτηση είναι:εάν το t είναι αιτία ή όχι). Υπάρχουν δυο προσεγγίσεις τις οποίες ο Holland θέλει να ξεκαθαρίσει από την αρχή: η ερώτηση που τίθεται είναι εάν θα πρέπει να δούµε την επίδραση της αιτίας ή την αιτία µίας επίδρασης. Και οι δυο αυτές ερώτησης είναι σπουδαίες αλλά θεωρώ ότι ποιό πρακτική, ποιό καλά ορισµένη και αυτό που η στατιστική µπορεί να απαντήσει αποτελεσµατικά είναι η πρώτη προσέγγιση. Αυτό ακριβός συµµερίζεται και ο Holland και το εξηγεί αυτό σε όλο του το άρθρο. Όπως χαρακτηριστικά λέει The emphasis here will be on meaning the effect-f causes because this seems to be a place where statistics, which is concerned with measurement, has contributions to make. Η σειρά των θεµάτων που θα παρουσιάσω είναι αυτή που ακολουθεί ο Holland αλλά µε κάποιες δικές µου παρεµβάσεις θα προσπαθήσω να δώσω µια άλλη οπτική γωνιά στο θέµα. Μοντέλα για συσχέτιση Ορίζουµε ένα µοντέλο συσχέτισης σε ένα πληθυσµό U τις µονάδες του οποίου τις συµβολίζουµε µε u. (παρακάτω θα δώσω ένα ορισµό του u). Σε κάθε u µπορούµε να µετρήσουµε ή καλύτερα να ορίσουµε µια µεταβλητή Υ. Εάν το Υ είναι µεταβλητό τότε προσπαθούµε να εξηγήσουµε αυτή τη µεταβλητότητα. Έστω Α µια άλλη µεταβλητή η οποία ορίζετε όπως και το Υ σε όλα τα u. Από αυτές τις δυο τιµές µπορούµε να βρούµε την από κοινού κατανοµή, τις δεσµευµένες πιθανότητες ή να φτιάξουµε ένα µοντέλο παλινδρόµησης που δεν είναι τίποτα άλλο από τη Ε(Υ/Α) σε σχέση µε το Α.Ο χρόνος εδώ παίζει σηµαντικό ρόλο από την άποψη της µη µεταβολής του πληθυσµού ή καλύτερα της ορισιµότιτας του πληθυσµού U και να δώσει έννοια στις µεταβλητές. Αυτό µε την έννοια ότι εάν τα u παραµένουν αµετάβλητα στο χρόνο τότε πάντοτε τα αποτελέσµατα ισχύουν. Για αυτό ουσιαστικά θα πρέπει να δώσουµε το χρονικό της έρευνας.( κάθε έρευνα ισχύ σε ένα σχετικό χρόνο. Ό χρόνος αυτός εξαρτάτε από το ρυθµό µεταβολής του πληθυσµού.). Στο causal inference θα δούµε ένα ποιο κύριο ρόλο του χρόνου από εδώ. Μοντέλα Rubin για Causal Inference Κατά κύριο ρόλο θα ασχοληθούµε µε την αιτιατή συµπερασµατολογια σε πειραµατικά µοντέλα. Αυτό δεν γίνετε επειδή οι άλλες έρευνες δεν µπορούν να αποδείξουνε κάτι τέτοιο αλλά στα πειραµατικά µοντέλα αυτό είναι ποιο εύκολο και ποιο πρακτικό. (π.χ. στα πειραµατικά µοντέλα µπορούµε να ελέγξουµε την ανεξαρτησία του S µε Υc και Υt όπως θα δούµε στη συνέχεια ή δεν περιµένουµε επ-αόριστων για να συµβεί ένα treatment). Όπως και στα µοντέλα συσχέτισης και εδώ πρέπει να ορίσουµε ένα πληθυσµό U από µονάδες u πάνω στα οποία θα εφαρµόσουµε τα treatment. Θα ασχοληθούµε µε treatment για να έχουµε τη δυνατότητα σύγκρισης µε άλλα επίπεδα. Όπως επισηµαίνει

και ο Holland όταν λέµε Α προκαλεί το Β σηµαίνει ότι Α προκαλεί Β σε σύγκριση (σχέση) µε κάποιο άλλο επίπεδο που είναι όχι Α. εν µπορούµε να ορίσουµε αιτιατή συµπερασµατολογια εάν δεν έχουµε περισσότερα από ένα επίπεδα. Αυτή είναι µια πολλή έξυπνη παρατήρηση από τον Holland γιατί καταφέρνει να ορίσει ουσιαστικά την αιτία. Η αιτία ποια δεν είναι µια αυθαίρετη έννοια. Με αυτή τη παρατήρηση ο Holland κάνει τη στατιστική κύρια επιστήµη για τη µελέτη του αιτίου. Παρακάτω θα δούµε µε αυτή ακριβός τη λογική ποια µπορεί να θεωρηθεί αιτία. Πρόχειρα µπορούµε να πούµε πως: Για αιτιατή συµπερασµατολογια θα πρέπει να έχουµε τη δυνατότητα κάθε µονάδα να την εκθέτουµε σε οποιαδήποτε αιτία ή treatment. Θα χρησιµοποιήσουµε για ευκολία µόνο δυο αιτίες ή treatments. S είναι µια µεταβλητή η οποία µετράει την τιµή των αιτίων. Εάν S=t αυτό σηµαίνει πως η µονάδα u την εκθέτουµε στο treatment t και εάν S=c αυτό σηµαίνει πως τη µονάδα την εκθέτουµε στο control c. To S είναι ανάλογο µε το Α που είδαµε στη συσχέτιση αλλά µε τη διαφορά ότι S(u) εκθέτη τη u σε µια αιτία ενώ Α(u) είναι µια ιδιότητα ή χαρακτηριστικό του u. Το S(u) µπορεί να πάρει οποιαδήποτε τιµή ενώ το Α(u) παίρνει µια µοναδική τιµή. Ο χρόνος τώρα έχει ένα σηµαντικότατο ρόλο όταν µια µονάδα την εκθέτουµε σε µια αιτία αυτό πρέπει αν συµβεί σε ένα συγκεκριµένο χρόνο ή περίοδο. Οι µεταβλητές τώρα διακρίνονται σε pre-exposure- που η τιµή ορίζετε (µετριέται) πριν από την έκθεση στην αιτία και τα post-exposure που οι µεταβλητές ορίζονται (µετριούνται) µετά από την έκθεση του u σε µια αιτία. Ο ρόλος του Υ εδώ είναι να µετρήσουµε την επίδραση της αιτίας και είναι post-exposure µεταβλητή. Το Υ είναι µια κατάλληλα επιλεγµένη µεταβλητή (θα πρέπει να ξεκαθαρίσουµε ότι το Υ δεν µπορεί να είναι µια ιδιότητα µε τον ορισµό που δίνει σε αυτή ο Holland) ο οποίος ορίζετε για κάθε units µονάδα. Για να µπορέσουµε να δούµε την αιτία θα πρέπει να µετρήσουµε τις τιµές των Υ όταν εφαρµόζουµε κάθε treatment.όταν έχουµε ένα treatment (t) και ένα control (c) τότε θα πρέπει να µετρήσουµε δύο τιµές Υt(u) και Υc(u) στην ίδια µονάδα. Αυτό ουσιαστικά είναι η µετάφραση της ερώτησης εάν στο u αντί για c βάζαµε t τότε θα είχαµε την ίδια τιµή του Υ? Που πρώτη στο επιστηµονικό πεδίο τη θέσανε ο Neyman και ο Fisher. (στη περίπτωση µας το Υ είναι post-exposure και το S είναι pre-exposure). Θα πρέπει εδώ να ανοίξω µια παρένθεση για να ορίσω µε ένα διαφορετικό τρόπο από ότι ο Holland το u. Θέλω από την αρχή να ξεχωρίσω το u σαν ύπαρξη και το u σαν ουσία. Το υπαρξιακό u είναι ο ίδιος άνθρωπος µετά από 30 χρόνια και το ουσιαστικό u είναι µια µονάδα που έχει ίδιες µεταβλητές. Πιστεύω πως ο Holland µε το u εννοεί το ουσιαστικό u. Το u παραµένει αµετάβλητο όταν όλες οι µεταβλητές εκτός του S και Υs παραµένουν ίδιες. (ίδιες µεταβλητές => ίδιο u). εύτερων θα πρέπει να προσέξουµε πως εάν στο ίδιο υπαρξιακό u δεν µεταβάλλονται οι µεταβλητές, δηλαδή το υπαρξιακό= ουσιαστικό, τότε οποτεδήποτε εφαρµόζουµε το c ή t θα πάρουµε την ίδια τιµή του Y. ( όταν έχουµε δοθέντος όλων των τότε δεν µπορεί να υπάρχει τυχαιοτιτα, η τυχαιοτιτα δηµιουργείτε όταν δεν παίρνουµε υποψιών κάποια µεταβλητή. Ακόµα και στα ζάρια εάν προσδιορίζουµε το έδαφος, τη ταχύτητα που θα φύγει το ζάρι από το χέρι, των τρόπο µε τον οποίο ρίχνουµε,..(όλες οι δυνατές µεταβλητές) τότε θα ήµασταν σε θέση να βρούµε τη τιµή που θα έχει το ζάρι). Άρα όταν εφαρµόζω c και στη διάρκεια µέχρι να πάρω το Υ δεν αλλάζει κάποια άλλη µεταβλητή τυχαία θα πάρω πάντα το ίδιο Υ.

Όταν γράφουµε Υt(u)=Y(t,u) σηµαίνει: η τιµή του Υ στο u όταν εκθέτω το u στο t treatment και Υt(u)=Y(t,u) η τιµή του Υ στο u όταν εφαρµόζουµε c. Την επίδραση της αιτίας t στο u σε σχέση µε την αιτία c είναι η διαφορά µεταξύ Υt(u) και Υc(u). ηλαδή: Επίδραση της αιτίας t στο u=υt(u)-yc(u) Αυτή η διαφορά δεν επιβάλετε να είναι ίδια σε όλα τα u. Αυτό γιατί η επίδραση της αιτίας µπορεί να είναι διαφορετική από δέσµευση σε δέσµευση. Όταν η διαφορά δεν θα είναι ίδια εγώ θα την ονοµάσω αλληλεπίδραση. Το πρόβληµα που αντιµετωπίζουµε συνήθως στην αιτιατή συµπερασµατολογία είναι ότι δεν µπορούµε να έχουµε τις δυο µεταβλητές Υt(u) και Yc(u) στην ίδια µονάδα unit. Αυτό το πρόβληµα ο Holland το αποκαλεί The FUNDAMENTAL PROBLEM OF CAUSAL INFERENCE. ίνει µάλιστα και δυο παραδείγµατα στα οποία στο ένα αντιµετωπίζουµε το πρόβληµα και στο άλλο όχι. Το πρώτο αφορά δυο εκπαιδευτικές µεθόδους που δεν µπορούν να εφαρµοστούν στο ίδιο άτοµο και το δεύτερο είναι µε το διακόπτη και το φως που µπορούµε να εφαρµόσουµε στην ίδια µονάδα και τα δυο treatment. Θέλω εδώ να προσθέσω και δυο άλλα παραδείγµατα που µπορούµε να τα βρούµε στα σχόλια του Rubin στη σελ. 61. Στα παραδείγµατα αυτά δεν µπορούµε να µετρήσουµε τη τιµή του Υ σε ένα από τα treatment. Από αυτά τα παραδείγµατα µπορούµε να συµπεράνουµε πως ακόµα και εάν η τιµή του Υ δεν µπορεί να µετρηθεί (οριστεί) αλλά να προβλεφθεί πλήρως µπορούµε να έχουµε causal inference (αρκεί η πρόβλεψη να µπορεί να καθορίσει τη τιµή του Υ). Χαρακτηριστικά ο Rubin αναφέρει τα δυο παρακάτω παραδείγµατα: The sun cause the planet to travel in their orbit (1) If John Doe had been born a famel, (2) His life would have been diferent Και τα δυο αυτά π.χ. µπορούν να εκφραστούν σαν µηδενικές υποθέσεις του Fisher. Για να αντιµετωπίσουµε το F.P.o.C.I o Hollland χωρίζει το αιτιατό συµπέρασµα σε δυο κατηγορίες. Επιστηµονική προσέγγιση που πρέπει αν µετρήσουµε όλες τις τιµές Υt(u) και Yc(u) για κάθε u και να βρούµε τη διαφορά Υt(u)- Yc(u). Που φανερά το πρόβληµα δεν αντιµετωπίζετε. Στατιστική προσέγγιση που ορίζουµε τη µέσο όρο επίδραση του αιτίου πάνω στο πληθυσµό U. E(Yt-Yc)=T => E(Yt)- E(Yc)=T Όπου E(Yt) είναι η µέση τιµή του Υt στο U και Ε(Υt) είναι η µέση τιµή του Υc στο U. Αυτή η προσέγγιση ξεπερνάει την αδυναµία να έχουµε την επίδραση της αιτίας στα µεµονωµένα στοιχεία και έχει τη δυνατότητα να µετρήσει την κατά µέσο όρο επίδραση της αιτίας. Με τη στατιστική λύση έχουµε τη δυνατότητα αν ξεπεράσουµε το F.P.o.C.I. όπως θα δούµε στη συνέχεια. Το µοντέλο του Rubin περιλαµβάνει τρις µεταβλητές που είναι S, Yc και Yt. Συνήθως µπορούµε να παρατηρήσουµε µόνο δυο, S και Ys. To Ys o Holland το αποκαλεί The observed response variable παρατηρούµενη εξαρτηµένη µεταβλητή.

Όταν κάνουµε αιτιατή συµπερασµατολογια θα πρέπει να διακρίνουµε µεταξύ (α)τη τιµή του Υ (β)τις δυο εκδοχές της εξαρτηµένης µεταβλητής Υt, Yc και (c) στη παρατηρούµενη απαντητική µεταβλητή Υs. Θα πρέπει να τονίσουµε σε αυτό το σηµείο τις διαφορές που υπάρχουν µεταξύ συµπερασµατολογικης συσχέτισης associational inference και Rubin Model. Θα χρησιµοποιήσουµε τους συµβολισµούς (Α,Υ) και (S,Ys) για συσχέτιση και αιτία αντίστοιχα. Α και Υ είναι απλός µεταβλητές ορισµένες στα u του U ενώ S και Υs προϋποθέτει το S να συµβεί πριν από το Υs και τα treatment πρέπει να τα εφαρµόσουµε σε όλα τα unit u. Αυτή η εφαρµογή µπορεί να γίνει τυχαία ή όχι. Από τα παραπάνω γίνεται φανερό ότι το Rubin Model είναι τετραδιάστατο R=(U,K,Y,S) όπου U o πληθυσµός των µονάδων u, K είναι τα treatment και S(u) είναι η αιτία ή τα treatment στην οποία τα u εκτίθενται πριν (prior) από τη µέτρηση των Υ. Κάθε απαντητική µεταβλητή Υ θα πρέπει να θεωρηθεί σαν µια συνάρτηση του U*K. Ο Holland δίνει ένα ορισµό για την ιδιότητα τον οποίο θέλω λίγο να το συζητήσω If the value of X(u,k) does not depend on which cause k to which u is exposed I shall call X an attribute of. Αυτός ο ορισµός για µένα είναι λίγο σχετικός γιατί µπορεί να µην επηρεάζεται το Χ στο ίδιο u όταν το k διαφέρει όµως εάν πάρουµε µια άλλη πιθανή αιτία S και το Χ διαφέρει τότε το Χ δεν είναι µια ιδιότητα. Π.χ. το ύψος ενός ανθρώπου µπορεί να µην διαφέρει εάν αυτός κάνει ιδιαίτερα µαθήµατα ή όχι αλλά µπορεί να επηρεάζεται από τη διατροφή του. Μπορούµε να πούµε όµως για κάθε δυνατό αίτιο που µπορεί να εµφανιστεί να ισχύει ο παραπάνω ορισµός. Σε αυτό το σηµείο ας δούµε κάποιες ιδικές περιπτώσεις που µπορούµε να έχουµε αιτιατή συµπερασµατολογία. (1) Temporal Stability and Causal Transience Συµβαίνει όταν (α) το Υc(u) δεν εξαρτάτε από το πότε έχουµε εκθέσει το u στο c και (β) όταν το Yt(u) δεν εξαρτάτε από το εάν έχουµε εκθέσει το u πριν στο c. Το Temporal Stability ικανοποιείτε από (α) και Causal Transience από (β). Το µόνο που πρέπει να προσέξουµε είναι να µπορούµε να καταφέρουµε να µην µεταβάλετε καµία άλλη µεταβλητή µε το χρόνο και να µην µεταβάλετε όταν εφαρµόζουµε το c στο u ή για πρακτικούς λόγους να θεωρήσουµε πως η µεταβολή είναι µη σηµαντική από την άποψη ότι η µεταβολές δεν δηµιουργούν αλληλεπιδράσεις µεταξύ Υs και S. (2) Unit Homogenity Εάν θεωρήσουµε πως Υt(u1)=Yt(u2) και Υc(u1)=Yc(u2) για τις δυο µονάδες u1, u2. Τότε µπορούµε να βρούµε την επίδραση της αιτίας και στα δυο u από τη διαφορά Yt(u1)-Yc(u2). (3) Independence-Ανεξαρτησία Είναι πιστεύω ο ποίο σηµαντικός και γενικός τρόπος για να βγάλουµε αιτιατή σηµπερασµατολογια. Όταν ο Holland ξεχώριζε σε επιστηµονική και στατιστική προσέγγιση ίσος είχε στο µυαλό του αυτή ακριβός τη µέθοδο. Για να έχουµε καλά

αποτελέσµατα αυτής της µεθόδου θα πρέπει το U να είναι πολλή µεγάλο.(όταν το U µικρό τότε η µέθοδος µπορεί να αποτύχει). Οι παρατηρούµενες παρατηρήσεις έχουν τη µορφή (S,Ys) και µπορούµε να έχουµε πληροφορίες µόνο για τα : E(Ys/S=t)=E(Yt/S=t) και E(Ys/S=c)=E(Yc/S=c) Θα πρέπει να διακρίνουµε ότι Ε(Yt) δεν είναι ίσο µε το E(Yt/S=t). Η πρώτο είναι η µέση τιµή του Υt για όλο το πληθυσµό και η δεύτερη είναι η µέση τιµή του Υt για τα u που εκτίθενται στην αιτία. π.χ. εάν S(u)=t για όλα τα Yt(u) που είναι µικρά, τότε Ε(Yt/S=t) θα είναι µικρότερο από το Ε(Yt). Αυτό συµβαίνει διότι η δεσµευµένες µεταβλητές δεν είναι ίδια στα δυο grup, ή αλός δεν είναι τυχαία κατανεµηµένα. Εάν εκθέτουµε το u τυχαία στα treatment τότε καταφέρνουµε να οι (δεσµευµένες) µεταβλητές αν είναι τυχαία επιλεγµένα για το t και για το c εποµένως S είναι ανεξάρτητο από τα Yt και Yc (αυτό δεν σηµαίνει S ανεξάρτητο µε Ys) και από όλες τις άλλες µεταβλητές πάνω στη u. Αυτή είναι ουσιαστικά η υπόθεση ανεξαρτησίας. Όταν ισχύ η ανεξαρτησία µπορούµε να γράψουµε: Ε(Υt)=E(Yt/S=t) και E(Yc)=E(Yc/S=c) Κάτω από την υπόθεση της ανεξαρτησίας µπορούµε να υπολογίσουµε το µέσο όρο της επίδρασης της αιτίας που είναι: Τ=Ε(Υs/S=t)-E(Ys/S=c) Για να ξεχωρίσουµε αυτό το Τ από το ακριβές και όταν η ανεξαρτησία δεν ισχύει ο Holland δανείζεται από τον Suppes το prima facie causal effect του t (σε σχέση µε το c) Tpf=E(Yt/S=t)-E(Yc/S=c) => Tpf=E(Ys/S=t)-E(Ys/S=c) H ανεξαρτησία σε συνδυασµό µε το γεγονός ότι έχουµε µεγάλο (ή άπειρο) πληθυσµό µπορούµε αν υποστηρίξουµε τη σχέση Τ=Τpf. Tpf => µπορούµε να βγάλουµε από όλα τα µοντέλα ANOVA και µε δεδοµένο ότι η επιλογή (των treatment) γίνετε τυχαία το µοντέλο είναι µοντέλου αιτίου αποτελέσµατος. (4) Constant Effect- Σταθερή επίδραση Η σταθερή επίδραση προϋποθέτει απλός σε κάθε u η διαφορά Υt(u)-Yc(u) να είναι ίδια. Τ=Yt(u)-Yc(u) για κάθε u στο U Αλλιώς αυτό λέγετε και προσθετικός µοντέλο. Η υπόθεση αυτή είναι πολλή σηµαντική επειδή στατιστική και επιστηµονική προσέγγιση ταυτίζονται, µπορούµε να βρούµε την επίδραση της αιτίας σε κάθε µονάδα του πληθυσµού ξεχωριστά π.χ. εάν έχουµε δυο φάρµακα και θέλουµε να χορηγήσουµε ένα σε κάποιο άτοµο δεν είναι ανάγκη να δούµε τη χαρακτηρίσθηκα χαρακτιριστικά έχει το άτοµο για να δούµε ποίο είναι κατάλιλο για αυτόν. Η υπόθεση της σταθερής επίδρασης µπορεί να ελεγχθεί µε το κλασσικό τρόπο: ιαιρούµε το U σε U1,U2,U3 και υπολογίζουµε τα Τ1,Τ2,Τ3.. και ελέγχουµε εάν αυτά τα Τi διαφέρουν ή όχι. Σε αυτό το σηµείο θα πρέπει να εισάγουµε τα δικαιολογηµένα παράπονα του Cox για το ότι η δέσµευση δεν είναι ολοκληρωτική. (σελ.963). Την απάντηση τη στο ίδιο άρθρο ο Holland (σελ.969) λέγοντας πως εάν Χ µια ιδιότητα ή ενδιαφέρουσα µεταβλητή είµαστε

σε θέση να δούµε για διαφορετικά Χ το Constant effect assumption αλλά όχι µέσα στις δεσµεύσεις που είναι : Τ(x)=Yt(u)-Yc(u) για όλα τα u τα οποία έχουν Χ(u)=x. Εύκολα αποδεικνύετε ότι το Constant effect assumption ικανοποιείτε από το Unit Homogenity και µπορεί να θεωρηθεί σαν µια ποίο αδύναµη υπόθεση από αυτήν. Ακόµα και όταν έχουµε υποθέσει σταθερή επίδραση το Τpf δεν ισούται µε το Τ. Αυτό ικανοποιείται µόνο µε την υπόθεση ανεξαρτησίας όπως γίνετε αντιληπτό από τη σχέση: Τpf=T+{E(Yt/S=t)-E(Yc/S=c)} Τέλος µπορούµε και όταν δεν έχουµε τυχαιότητα να βγάλουµε σχέσεις αρκεί να ικανοποιούνται κάποιες άλλες υποθέσεις. Θα αφήσω το φιλοσοφικό κοµµάτι για ποίο µετά, πριν θέλω να κάποιες προσεγγίσεις στατιστικών. Ο Kempthorue το (1952) συζητάει για τυχαιοποιηµένο block designs. Αυτό κατά τη γνώµη µου είναι ουσιαστικά να βρούµε το πραγµατικό Τ αλλά και το επιστηµονικό causal effect για κάθε u, εφόσον βέβαια κάθε block περιλαµβάνει ίδια ουσιαστικά unit (πολλές φορές τα block έχουν σχεδόν ίδια unit). Τα radomized block designs µπορούν να αντιµετωπίζουν το πρόβληµα του Causal Inference. To (1958) o Cox δείχνει να έχει συνειδητοποιήσει σε ένα από τα βιβλία του (the planning of experiments) την ύπαρξη δυο (ή περισσότερων) µεταβλητών στην ίδια µονάδα. Χαρακτηριστικά λέει πως εάν την u την εκθέτουµε σε ένα άλλο treatment τότε πιθανών θα παίρναµε µια άλλη τιµή. Ο Neyman και ο Fisher σε µια από τις κόντρες τους εµφανίζονται να διαφωνούν στη προσέγγιση που πρέπει να έχουµε στη µηδενική υπόθεση. Ο Neyman υποστηρίζει πως πρέπει να ελέγξουµε τη µέση αιτιατή επίδραση E(Yt-Yc)=0 και ο Fisher την µηδενική αιτιατή επίδραση για όλα τα u U. ηλ. Υt-Yc=0 για όλα τα u U. Κάποιες Φιλοσοφικές Προσεγγίσεις Οι ποίο πολλές προσεγγίσεις στο παρελθόν για την αιτία έχουνε γίνει από τους φιλόσοφους. Οι παρακάτω αφιερώνονται στις ποίο γνωστές κάνοντας ταυτόχρονα σύγκριση µε τo Rubin Model. Πρώτος ο Αριστοτέλης διακρίνει τέσσερις είδους αιτίων Material cause, formal cause, afficient cause and final cause. Αυτό ήταν καλό από την άποψη ότι για το καλύτερο ορισµό πρέπει να «ειδικεύουµε» τις αιτίες (κάτι που κάνει και ο Holland). (1) Hume O Hume ορίζει τρία κριτήρια για το αιτιατό (α) temporal/spatial contiguition (b) temporal succession (c) constant conjunction =>A and B alwys occour. Το πρώτο κριτήριο το temporal/spetial contiguition εκφράζετε από την δράση του αιτίου και τη µέτρηση της επίδρασης πάνω στην ίδια οντότητα το u. Αυτό το κριτήριο ικανοποιείται κατευθείαν από τον ορισµό της µονάδας u. Το δεύτερο κριτήριο σηµαίνει απλός πώς η αιτία πρέπει να προηγείται της επίδρασης. Το τρίτο κριτήριο είναι κατά κάποιο τρόπο άχρηστο. Αυτό γιατί: µπορούµε να έχουµε λάθος στις µετρήσεις και

δεύτερων που είναι και ποιο ουσιαστικό αποτυγχάνει όταν δεν υπάρχει το constant effect assumption δηλ. όταν το Yt(u)-Yc(u) διαφέρουν από u σε u1. Επίσης θα πρέπει να τονίσουµε πως ο Hume δεν βλέπει και τόσο τη σηµαντικότητα του πειράµατος και προσπαθεί να βρει την αιτία ποίο πολλή εµπειρικά. (κάτι που όπως θα δούµε στη συνέχεια είναι απαραίτητο). (2) Mill Ο Mill σε αντίθεση µε των Hume δίνει στο πείραµα ένα κύριο ρόλο για την εξαγωγή σχέσεων αιτίου αποτελέσµατος. Ο Mill διακρίνει 4 µεθόδους από τις οποίες µπορούµε να βγάλουµε σχέσεις αιτίου αποτελέσµατος. (α) Concominant Variation Method Αυτή η µέθοδος ουσιαστικά διακρίνει µεταξύ συσχέτισης και αιτίας. Ο Mill σε αυτή τη µέθοδο λέει ότι: οποιαδήποτε συσχέτιση δεν µπορεί να είναι αιτία αλλά πίσω από κάθε συσχέτιση κρύβεται µια αιτία. (β) Methods of Difference Ουσιαστικά αυτή διακρίνει σε φαινόµενο της έρευνας συµβαίνει Y=1 και φαινόµενο κάτω από την έρευνα δεν συµβαίνει Υ=0 και στη περιπτώσει που τα περιστατικά διαφέρουν από t σε c. Στο Rubin Model µπορούµε να την εκφράσουµε αυτή τη σχέση ως Yt(u)-Yc(u)=1. (c) The Method of Residues H µέθοδος αυτή ουσιαστικά είναι η µέτρηση της διαφοράς Yab(u)-Ya(u) και εκφράζει το υπόλειµµα. Αυτή η διαφορά είναι πολλή κοντά στο Rubin Model. (d) The Method of Agreement O Mill σε αυτή τη µέθοδο δείχνει να έχει συνειδητοποιήσει ότι µπορεί να υπάρχει και µηδενική επίδραση. Αυτή τη µέθοδο µπορούµε να τη φανταστούµε σαν µια µηδενική υπόθεση. Στη περίπτωση αυτή Yt(u)-Yc(u)=0 και η t είναι µια αιτία µε µηδενική επίδραση. Από τα παραπάνω γίνεται φανερό ότι ο Mill δείχνει να είναι ποιο κοντά στην ιδέα ότι η επίδραση µιας αιτίας είναι πάντα σε σχέση µε µια άλλη αιτία, κάτι που ο Hume δείχνει να αγνοεί. Όµως όπως και ο Hume αυτός θεωρεί πως όλα µπορούν να είναι αιτίες κάτι που όπως θα δούµε στη συνέχεια δεν είναι σωστό. (3) Suppes O Suppes εισάγει στην αιτία την έννοια της πιθανότητας (Στο βιβλίο του (1970) propabilistic theory of causal). Ουσιαστικά προσπαθεί να βελτιώσει τα κριτήρια του Hume και κυρίως το κριτήριο (c) constant conjuction. O Suppes ρητά αποδέχεται το temporal succession. Όλες οι αιτίες προηγούνται στο χρόνο. Πρώτον ο Suppes ορίζει το prima facie cause ενός γεγονότος ένα γεγονός το οποίο προηγείται στο χρονικά και είναι θετικά συσχετισµένο µε αυτό. Ορίζει ως spurious cause ενός γεγονότος ένα γεγονός που είναι prima facie και είναι ανεξάρτητα εάν δεσµεύσουµε (conditional independent) σε ένα άλλο γεγονός το οποίο προηγείται του

prima facie cause και τελευταίο ορίζει το genuine cause σαν ένα prima facie cause αλλά όχι spurious cause. Μια ποίο εύκολη παρουσίαση είναι: (S1)αν r<s δείχνει δυο τιµές του χρόνου, το γεγονός Cr είναι prima facie (p.f.) ενός γεγονότος Es εάν : Pr(Es/Cs)>Pr(Es) (S2) Cr είναι spurious cause ενός Es εάν Cr είναι p.f. του Es και για q<r<s υπάρχει ένα γεγονός Dq το οποίο ικανοποιεί τις σχέσεις: Pr(Es/Cr,Dq)=Pr(Es/Dq) και Pr(Es/Cr,Dq)>=Pr(Es/Cr) (S3) Cr είναι genuine cause του Es εάν Cr είναι p.f.c. και όχι spurious cause του Es. Όπως µπορούµε να παρατηρήσουµε ο Suppes προσπαθεί να ορίσει περισσότερο την αιτία µιας επίδρασης παρά την επίδραση µιας αιτίας. O Suppes επίσης δεν έχει το µηχανισµό να εκφράσει την επίδραση µιας αιτίας σε ένα πρόβληµα. Το µοντέλο αυτό συµφωνώ µε των Holland πως περιγράφει γενική συµπεριφορά και όχι ιδική και ακριβής συµπεριφορά. Με τους ορισµούς που έχει δώσει µου θυµίζει περισσότερο πρόβλεψη παρά αιτία. Το σκεπτικό αυτό του Suppes χρησιµοποιείτε και από τον Granger µε κάποιες µικρές διαφορές που δεν είναι ικανές να αντιµετωπίζουν το πρόβληµα. Μπορούµε ωστόσο να δούµε κάποιες σχέσεις του Suppes και του Rubim Model. Τη συσχέτιση στο p.f.c. του Ys και του S µπορούµε να τη βρούµε στο Rubin Montel σαν prima facie causal effect: Τpf=E(Ys/S=t)-E(Ys/S=c) To Tpf όπως έχουµε εξηγήσει µπορεί να είναι διαφορετικό από το Τ. Για αυτό ο Suppes ορίζει το prima facie cause. Εάν έχουµε ένα spurous cause σε ένα τυχαιοποιηµένο πείραµα µπορεί εύκολα να δειχθεί ότι: (α) δοθέντος του Dq η επίδραση της µέσο όρο αιτίας είναι µηδέν και (β) Στο υπο-πληθυσµό το γεγονός (η απαντητική Υs=1) είναι ποιο πολλή πιθανόν να συµβεί κάτω από το Cr ( t ) από ότι σε όλο το πληθυσµό. Για να το βρούµε αυτό µπορούµε να υποθέσουµε Υ παίρνει τιµές 0/1. Το {Ys=1} είναι σαν Es και {S=t} είναι σαν Cr. Τα αποτελέσµατα είναι Τ(Dq)=0 και P(Yt=1/Dq)>=P(Yt=1) Το ποίο σηµαντικό ίσος κοµµάτι αυτού του άρθρου είναι η παράγραφος 7. What Can Be A Cause? O Holland αντίθετα µε τους Hume και Mill υποστηρίζει πως όχι όλα µπορεί να είναι αιτίες. Αυτός υποστηρίζει πως αιτία είναι µόνο αυτό που µπορεί εκ τον προτέρων να είναι treatment σε ένα πείραµα (που µπορεί να πάει σε όλα τα u του πληθυσµού). Σε ένα πείραµα υποστηρίζει µπορούµε να έχουµε όλα τα treatment ενώ σε ένα natural experiment πρέπει να περιµένω µέχρι να συµβούν όλα τα treatment. Οι στατιστική ορίζουν το Observational Study για να ξεχωρίσουνε τις άλλες έρευνες από το experimental Study (και οι δυο αυτές έρευνες θεωρούν πως το u εκτίθεται στα treatment και όχι ότι υπάρχει).

Ό ορισµός της αιτίας και στις δυο περιπτώσεις κατά των Holland είναι ίδιος. Η διαφορά υφίσταται στο βαθµό ελέγχου µιας έρευνας. Χαρακτηριστική είναι η φράση του Holland Total control can make S independent of Yt and Yc Στη πειραµατική έρευνα µπορεί να έχουµε total control (ολικό έλεγχο) άρα και S ανεξάρτητο από Υt και Yc. Στο observational Study αυτή η ιδιότητα είναι αµφισβητούµενη και µπορεί να µας οδηγήσει σε λανθασµένα αποτελέσµατα. Θα πρέπει να γίνει φανερό πως αυτό γίνετε µε σκοπό να βρούµε efficint cause. (η επίδραση θα είναι αποκλειστικά της αιτίας). Θα πρέπει να τονίσουµε επίσης πως αυτός ο ορισµός δεν είναι κατάλληλος όταν το u αλλάζει από την αιτία. Σε αυτές τις περιπτώσεις είναι καλύτερο να βρούµε άλλες προσεγγίσεις (όπως τη προσέγγιση του Αριστοτέλη). Ο Holland δίνει ένα π.χ. που εγώ δεν θα παρουσιάσω εδώ αλλά απλός θα πάρω τα ποιο σηµαντικά αποτελέσµατα. Πρώτων όταν έχουµε µια ιδιότητα δεν µπορούµε να βγάλουµε σχέσεις αιτίου αποτελέσµατος είµαστε µόνο σε θέση να δούµε τη συσχέτιση του Α (Attribute) µε το Υ (response). Μια ιδιότητα µπορεί να έχει πολλές µεταβλητές (όπως για π.χ. γυναίκα και άντρας που έχουν διαφορετικό DNA στα φυλετικά χρωµοσώµατα). εν µπορούµε να αλλάξουµε στο u όλες αυτές τις µεταβλητές. (Αυτό κατά κάποιο τρόπο είναι αδύνατον άρα και meaningles χωρείς νόηµα). Η συσχέτιση που βλέπουµε µπορεί να έχει πολλές µεταβλητές σαν αιτίες κάτι που δεν αντιµετωπίζει την επίδραση της αιτίας. Για να αλλάζουµε µια ιδιότητα θα πρέπει να αλλάξουµε πολλές µεταβλητές και κατά συνέπεια δεν θα ξέρουµε σε ποία µεταβλητή οφείλετε η επίδραση. Άρα το ποίο σηµαντικό πρόβληµα που καλείται να αντιµετωπίσει ένας ερευνητής είναι να βρει εάν η µεταβλητή που έχει ως υποψήφια αιτία είναι µια ιδιότητα ή ένα treatment ( υπό την έννοια τις έκθεσης του u σε αυτά). Ενδιαφέρον είναι εδώ να δούµε την διαφωνία µεταξύ Fisher µε τους Doll and Hill στο εάν το καρκίνο των πνευµόνων προκαλείται από το κάπνισµα. Ο Fisher υποστήριζε πως δεν προκαλεί το κάπνισµα το καρκίνο των πνευµόνων αλλά η γενετική ιδιαιτερότητα των καπνιστών (το DNA στα καρκινικά κύτταρα διαφέρει από καπνίζοντες σε µη καπνίζοντες). Ουσιαστικά υποστήριζε ότι το κάπνισµα σχετίζετε µε τα καρκινικά κύτταρα των πνευµόνων. Άρα δεν µπορούµε να πούµε ότι το κάπνισµα είναι η αιτία. Η απάντηση ήρθε από µια έρευνα που πήρανε µέρος οµόζυγα δίδυµα που ο ένας κάπνιζε και ο άλλος όχι. Αυτή που καπνίζανε εµφανίζανε συχνότερα και γρηγορότερα καρκίνο των πνευµόνων. Μια άλλη έρευνα µοιάζει µε αυτή και έχει γίνει τελευταία αφορούσε τη µυωπία κα εάν αυτή προκαλείται από τα ηλεκτρονικά µέσα. Τα αποτελέσµατα δείξανε ότι η µυωπία είναι κληρονοµική και επιβαρύνεται από την έκθεση στη τηλεόραση. Μπορώ εδώ να αναφέρω πολλές έρευνες, όπως το επίπεδο τεστοστερόνης που προκαλεί τη δύναµη, που χρησιµοποιούν Rubin Model και δείχνουν να ξεπερνούν το F.P.o.C.I.. O Holland στο άρθρο αυτό κάνει κάποιες συγκρίσεις του Rubin s Model και κάποιων παλιών µεθόδων που χρησιµοποιούσαν οι Γιατροί, Οικονοµολόγοι και Κοινωνιολόγοι. Οι απόψεις αυτές είναι παρόµοιες µε τις απόψεις των Φιλοσόφων που έχουµε αναφέρει ποίο πριν και δεν τις θεωρό αναγκαίες για την εργασία αυτή (αυτό και για λόγους συντόµευσης). Καλό ωστόσο είναι, για την καλύτερη παρουσίαση των σχέσεων της αιτίας και του αποτελέσµατός, δανεισθούµε από τους κοινωνιολόγους τα

διαγράµµατα αιτίου. Π.χ. S Ys σηµαίνει ότι το S είναι µια αιτία και Ys είναι η εξαρτηµένη µεταβλητή. Τέλος θα ήθελα να συζητήσω τα σχόλια του Rubin and Cox. Rubin and Cox Coment O Rubin ορίζει τη S.U.T.V.A. ( εν θα δώσω εδώ τον ορισµό θέλω µόνο να το συζητήσω. Ο ενδιαφερόµενος µπορεί το βρει στη σελ. 961) και υποστηρίζει πως είναι καλύτερος ορισµός για causation. Σε αυτό συµφωνώ και εγώ. Θεωρώ πως το.s.u.t.v.a. είναι καλύτερα θεωρητικά διατυπωµένο από το Rubin Model. Όµως το SUTVA δεν είναι πρακτικό. Π.χ. µπορούµε να βρούµε πως η µέση τιµές δυο µεταβλητών είναι ίδιες αλλά δεν µπορούµε να βρούµε εάν κάθε u έχει µηδενική τιµή Yt(u)-Yc(u)=0. Για τα σχόλια του Rubin στη σελ. 962 ο Holland απαντάει µε τη απόσπασµα «Το συµπέρασµα είναι χωρίς νήµα όταν η αιτία είναι µια ιδιότητα. Εννοώ πως το Y δεν µπορεί να οριστεί σε όλα τα U*K». Συµπληρώνω σε αυτά που δεν µπορεί να οριστεί ή να προβλεφθεί πλήρως. Επίσης θα πρέπει να προσέξουµε όταν κάνουµε µια αιτιατή συµπετρασµατολογια τις εξής ερωτήσεις: Τη είναι η µονάδες (u) η αιτία και η εξαρτηµένη µεταβλητή? Πως εκθέτουµε τα u στην αιτία? Εάν Υ ορίζετε για κάθε U*K? O Cox ορίζει εσωτερικές και εξωτερικές µεταβλητές που εάν προσπαθούµε να τα µεταφράσουµε στη γλώσσα του Holland είναι ιδιότητες και αιτίες. Περίληψη Θέλω να κλείσω αυτή την εργασία µε τις ποίο σηµαντικές προτάσεις που αυορουν την αιτία: (1) Η ανάλυση της αιτίας πρέπει να ξεκινήσει µε την έρευνα της επίδρασης µιας αιτίας παρά µε την αιτία µιας επίδρασης. (2) Η επίδραση µιας αιτίας είναι πάντα σε σχέση µε µια άλλη αιτία (3) Όχι όλα µπορούν να είναι αιτία; Η ιδιότητα ενός u δεν µπορεί να είναι ποτέ µια αιτία. Όταν κάνουµε αιτιατή συµπερασµατολογια θα πρέπει να έχουµε πάντα τη προσοχή µας στη φράση: NO CAUSATION WHITHOUT MANIPULATION

ΑΝΑΦΟΡΕΣ (1) Cook, R.D. Smoking and Lung Cancer in R.A. Fisher : An Aprecciation,eds. (2) Cox,D.R. (1958) The planing of experiment, New York: John Wiley ] (3) Hill A.B. (1965) The Enviroment and Disease: Association or Causation Proceding of the Royal Society of Medicine, 58, 295-300. (4) Holland Statistics and causal Inference. Journal of the American Association, December. (5) Holland,P.W.,and Rubin,D.B.(1980, Causal inference in Prospective and Retrospective Studies adress given at the Jerome Cornfild Memory Session of the American Association Annual Meeting,August. (6) Kempthorne, O.(1952), The Designs and Analysis of Experiment, New York: John Wiley. (7) Rosenbaum, P.R. (1984a), From Association to Causation in Observational Studies: The Role of the Tests of Strongly Ignorable Treatment Assignment, Journal of the American Association, 79. 41-48. (8) Rubin, D.B. (1974) Estimating Causal Effect Of Treatments in Randomized and Nonrandomized Studies Journal of Educational Psychology,66, 688-701.