Εργαστήρα στη Στατστή ΙΙ - Απ Γα α- Simple Linear Regression πκζζϋμ αδδεϋμ φαληκΰϋμ υθαθϊη κ πλσίζβηα βμ ηζϋβμ τκ β πλδσλπθ υξαέπθ ηαίζβυθ. Σκ πλσίζβηα πκυ γϋζκυη θα ζτκυη έθαδ αφ θσμ θα απκφαέκυη Ϊθ υπϊλξδ ηέα Ϋκδα ξϋβ εαδ β υθϋξδα θα πλκδκλέκυη β ξϋβ αυά η ίϊβ κλδηϋθμ παλαβλάδμ. α πζαέδα κυ ηαγάηακμ αυκτ, ηαμ θδαφϋλδ θα ηζάκυη ππμ ηαίϊζζαδ ηέα υξαέα ηαίζβά Τ ξϋβ η ηέα-ά πλδσλμ- ηαίζβϋμ Χ, Χ,, Χ ν πθ κπκέπθ κ λυθβάμ ηπκλέ θα πδζϋιδ δμ δηϋμ. Ϊθ κ ηκθϋζκ πκυ ιϊακυη έθαδ Ϋκδαμ ηκλφάμ πκυ β υξαέα ηαίζβά Τ έθαδ ΰλαηηδεά υθϊλββ πθ παλαηϋλπθ κυ ηκθϋζκυ, σ ηδζϊη ΰδα Ϋθα ΰλαηηδεσ ηκθϋζκ. Η απζκτλβ ηκλφά Ϋκδαμ ξϋβμ έθαδ β i = + i + ε i, σπκυ, έθαδ αγλϋμ δμ κπκέμ εδηκτη. υσ πκυ ξλάαδ δδαέλβμ πλκκξάμ έθαδ σδ κ σλκμ «ΰλαηηδεσ ηκθϋζκ» αθαφϋλαδ δμ παλαηϋλκυμ εαδ σξδ δμ ηαίζβϋμ. Γδα παλϊδΰηα, Υ i = + Χ i + ε ι ία γραό οτέο Υ i = + i + ε i ία γραό οτέο. ζϋπκυη πέβμ ππμ κ παλαπϊθπ ηκθϋζκ πλδζαηίϊθδ εαδ Ϋθαθ σλκ ε i. υσμ κ σλκμ αθδπλκππτδ Ϋθα υξαέκ ζϊγκμ. Χπλέμ αυσθ γα έξαη Ϋθα απζσ θληδθδδεσ ηκθϋζκ ξπλέμ εαηέα αίίαδσβα. π α α υαα φαα ε i ~N, σ ΰδα σζα α i=1,2,,n ε i υξαέα εαδ κηαεαδεϊ Σα ε i κθκηϊακθαδδ φϊζηαα ά εαϊζκδπα εαδ ηπκλκτη θα πκτη σδ πλδϋξκυθ σζκυμ κυμ Ϊζζκυμ παλϊΰκθμ εσμ απσ α Χ i, κδ κπκέκδ ηπκλκτθ θα ιβΰάκυθ β ηαίζβσβα βμ Υ i. πσ αυϋμ δμ υπκγϋδμ ζκδπσθ πλκετπδ σδ (Υ i i = + i, V i i = σ εαδ πέβμ σδ α i έθαδ εαδ αυϊ αθιϊλβα. Η παλαπϊθπ ξϋβ πκυ εφλϊαδ β ηϋβ δηά βμ Τ κηϋθπθ δηυθ βμ Χ, εφλϊαδ βθ υγέα βμ ΰλαηηδεάμ παζδθλσηββμ. πδά κδ δηϋμ βμ Τ γα απκεέθκυθ απσ βθ πλαΰηαδεά ηϋβ δηά, αυσ πκυ εϊθκυη έθαδ θα εδηκτη αυά βθ υγέα ΰλαηηδεάμ παζδθλσηββμ, ηϋπ βμ ηγσκυ πθ ζαξέπθ λαΰυθπθ πκυ Ϋξκυη δ β γπλέα. Γδα θα κτη ζκδπσθ ππμ φαλησααδ β γπλέα πκυ ηαγαέθκυη κ αδδεσ παεϋκ SPSS. κ πλκβΰκτηθκ λΰαάλδκ κυζϋοαη η κ αλξέκ tests.sav. Θα κτη ζκδπσθ εϊπκδα πλϊΰηαα απσ κ έδκ αλξέκ. αυσ κ αλξέκ Page 1 of 7
Εργαστήρα στη Στατστή ΙΙ - Ϋξκυη κυμ ίαγηκτμ 30 ηαγβυθ βμ Γ ΰυηθαέκυ α ηαγάηαα ΰΰζδεΪ, ΜαγβηαδεΪ εαδ Φυδεά. Όππμ εαδ βθ πλκβΰκτηθβ φκλϊ, υπκγϋκυη σδ γϋζκυη θα ζϋΰικυη Ϊθ υπϊλξδ εϊπκδκ έκμ ξϋβμ ηαιτ βμ απσκβμ πθ ηαγβυθ κ ηϊγβηα πθ ΰΰζδευθ η βθ απσκά κυμ κ ηϊγβηα πθ Μαγβηαδευθ. λξδεϊ ίζϋπκυη σδ εαδ κδ τκ ηαίζβϋμ ηαμ έθαδ πκκδεϋμ. Άλα ΰδα θα αθααβάκυη υξϋδβ ηαιτ τκ πκκδευθ ηαίζβυθ εφσηα κθ υθζά ΰλαηηδεάμ υξϋδβμ (Pearson ά Spearman). ΠΪθκ πλδθ φαλησκυη εϊπκδκ ΰλαηηδεσ ησθζκ γα πλϋπδ θα ίζϋπκυη η Ϋθα δϊΰλαηηα δαπκλϊμ-scatter Plot, Ϊθ φαέθαδ θα υπϊλξδ εϊπκδα ΰλαηηδεσβα εαδ πέβμ θα ίλέεκυη κθ υθζά υξϋδβμ. (βηέπβ: έπαη κ πλκβΰκτηθκ λΰαάλδκ ππμ ΰδα θα πδζϋικυη κ πσ υθζά ΰλαηηδεάμ υξϋδβμ, γα πλϋπδ θα ζϋΰικυη αλξδεϊ βθ εαθκθδεσβα πθ κηϋθπθ). Οπσ ιεέθαη πμ ιάμ: 1. Έ αα : Analyze Descriptive Statistics Explore. Dependent List: Maths,English Plots: πδζϋΰκυη κ δσΰλαηηα ησθκ εαδ αελδίυμ απσ εϊπ θλΰκπκδκτη βθ πδζκΰά Normality Plots with tests. Continue. Display: θλΰκπκδκτη ησθκ βθ πδζκΰά Plots. OK. ΚκδΪη κ πδθαεϊεδ Tests of Normality εαδ υΰεελδηϋθα κ ηϋλκμ η κ Shapiro-Wilk ΰδαέ έηα κλδαεϊ δμ 30 παλαβλάδμ ΰδα εϊγ ηαίζβά. πσ β άζβ Sig. ίζϋπκυη κ p-value κυ ζϋΰξκυ. Παλαβλκτη σδ ΰδα β ηαίζβά English Ϋξκυη p- value=0.915>0.05 εαδ ΰδα β ηαίζβά Maths Ϋξκυη p- value=0.458>0.05. πκηϋθπμ θ ηπκλκτη θα απκλλέοκυη βθ υπσγβ βμ εαθκθδεσβαμ ΰδα εαηέα απσ δμ τκ ηαίζβϋμ. 2. αα απ- Scatter Plot : Graphs Legacy Dialogs Scatter/Dot Simple Scatter Y Axis: English X Axis: Maths OK ζϋπκυη ζκδπσθ απσ κ δϊΰλαηηα ππμ υπϊλξδ Ϋθδιβ τπαλιβμ εϊπκδαμ ΰλαηηδεάμ ξϋβμ ηαιτ πθ τκ ηαίζβυθ. 3. υ υ: Analyze Correlate Bivariate. Όππμ Ϋξκυη ιαθαπέ θ ηπκλκτη πκϋ θα ηϋθκυη εαδ θα ίαδασηα ησθκ εϊπκδκ πλδΰλαφδεσ απκϋζηα. ΠΪθα γϋζκυη θα υπϊλξδ εαδ ηέα πδίίαέπβ απσ εϊπκδκ αδδεσ λΰαζέκ. Γδα αυσ κ ζσΰκ αυά βθ πλέππβ ίλέεκυη κ υθζά ΰλαηηδεάμ υξϋδβμ. βθ πλέππβ ηαμ αφκτ κ ίάηα (1) θ ηπκλϋαη θα απκλλέοκυη βθ εαθκθδεσβα πθ ηαίζβυθ, γα ίλκτη κθ υθζά Pearson. Page 2 of 7
Εργαστήρα στη Στατστή ΙΙ - Variables: English, Maths OK πσ κ πδθαεϊεδ ίζϋπκυη σδ κ υθζάμ υξϋδβμ κυ Pearson έθαδ r=-0.470 η p-value=0.009<0.05( ΚκδΪη βθ ΰλαηηά Sig.(2- tailed). αυά βθ πλέππβ κ Ϋζΰξκμ πκυ ΰέθαδ έθαδ κ ιάμ Η : ρ = Η : ρ Άλα αφκτ κ p-value=0.009<0.05 απκλλέπκυη βθ ηβθδεά υπσγβ.. α=5%. πκηϋθπμ υπϊλξδ αδδεϊ βηαθδεά ΰλαηηδεά υξϋδβ ηαιτ πθ ηαγβηϊπθ πθ ΰΰζδευθ εαδ πθ Μαγβηαδευθ. Θα κτη ζκδπσθ υλα ππμ κ έδκ αελδίυμ απκϋζηα γα πλκετοδ Ϊθ λϋικυη κ ΰλαηηδεσ ηκθϋζκ Enl = + M + e. Γδα θα ΰέθδ αυσ αεκζκυγκτη βθ ιάμ δαδεαέα. Analyze Regression Linear Dependent: English Independent(s): Maths Statistics: πυ Estimates, Confidence Intervals, Descriptives, Model Fit Continue. Save: Residuals π π Standardized α Predicted Values π Unstandardized & Standardized Continue OK υ ζκδπσθ α τκ ίαδεϊ πδθαεϊεδα πκυ εκδϊη βθ αθϊζυβ παζδθλσηββμ έθαδ κ πέθαεαμ ANOVA εαδ κ πέθαεαμ Coefficients. αα ANOVA βθ πλυβ άζβ ηφαθέακθαδ α αγλκέηαα πθ λαΰυθπθ πκυ Ϋξκυη ηϊγδ β γπλέα. βζαά α SSR(Regression), SSE(Residual) εαδ SST(Total). β έπζα αελδευμ άζβ ηφαθέακθαδ κδ ίαγηκέ ζυγλέαμ κυ εϊγ αγλκέηακμ, βζαά ΰδα κ SSR Ϋξκυη df=degrees of freedom= m-1=2-1=1, σπκυ m: κ πζάγκμ πθ i κυ ηκθϋζκυ ηαμ, ΰδα κ SSE Ϋξκυη df=n-m=30-2=28 εαδ ΰδα κ SST Ϋξκυη df=n- 1=30-1=29. βθ αελδίυμ έπζα άζβ ηφαθέακθαδ α ηϋα λαΰπθδεϊ αγλκέηαα, βζαά α MSR= Rgi Ϋξκυη βθ δηά βμ ζΰξκυθϊλββμ F= M εαδ MSE= ME E Riual. ελδίυμ έπζα ΰδα βθ κπκέα ΰθπλέακυη απσ β γπλέα ηαμ σδ αεκζκυγέ βθ εααθκηά F(df i, df iul ) = F,8. Οπσ κ δπζαθσ significance level=p-value=0.009 αφκλϊ κθ Ϋζΰξκ βμ δηάμ βμ ζΰξκυθϊλββμ η κ 0.05 Ϊθπ πκκδαέκ βηέκ βμ παλαπϊθπ F εααθκηάμ. Page 3 of 7
Εργαστήρα στη Στατστή ΙΙ - Οπσ απσ υ ίζϋπκυη σδ p-value=0.009<0.05 πλϊΰηα πκυ βηαέθδ σδ κ ηκθϋζκ ηαμ πλκαλησααδ α κηϋθα δξυλϊ αδδεϊ βηαθδεσ ίαγησ. αα Coefficients πσ αυσθ κθ πέθαεα παέλθκυη δμ εδηάδμ πθ παλαηϋλπθ κυ ΰλαηηδεκτ ηαμ ηκθϋζκυ. αυσ κ πδθαεϊεδ εκδϊη δμ άζμ πθ Unstandardized Coefficients εαδ β άζβ Sig. ά β άζβ 95% Confidence Interval. πσ βθ πλυβ άζβ ζκδπσθ παέλθκυη δμ εδηάλδμ πθ παλαηϋλπθ κυ ηκθϋζκυ. Έπ b, b κδ εδηάλδμ πθ αθδκέξπμ. Σσ ίζϋπκυη σδ b = 8.(Constant) εαδ b =.668(Maths). : β άζβ Standardized Coefficients Beta βθ απζά ΰλαηηδεά παζζδθλσηββ ηφαθέααδ κ υθζάμ υξϋδβμ. Ο πδκ βηαθδεσμ Ϋζΰξκμ αυσ κ πδθαεϊεδ αφκϊ β αδδεά βηαθδεσβα κυ υθζά πκυ έθαδ κ υθζάμ βμ τγδαμ ΰλαηηδεάμ παζδθλσηββμ. βζαά κ Ϋζΰξκμ: Η : = νντ της εντς Η :. Σκ απκϋζηα αυκτ κυ ζϋΰξκυ γα κ κτη απσ β άζβ Sig ΰδα κ Maths, σπκυ παλαβλκτη σδ p-value=0.009<0.05. Άλα απκλλέπκυη β ηβθδεά υπσγβ, βζαά υπϊλξδ ΰλαηηδεά υξϋδβ ηαιτ ΰΰζδευθ εαδ Μαγβηαδευθ αδδεϊ βηαθδεσ ίαγησ. αα Model Summary κθ πέθαεα αυσ ηφαθέααδ Ϋθα ηϋΰγκμ πκζτ βηαθδεσ ΰδα βθ παζδθλσηββ, κ κπκέκ έθαδ κ υθζάμ R Square. Ο υθζάμ αυσμ ηαμ έξθδ δ πκκσ βμ ηαίζβσβαμ βμ ιαλβηϋθβμ ηαίζβάμ (υ English) ιβΰέαδ απσ βθ αθιϊλββ (υ Maths). βθ πλέππβ κυ απζκτ ΰλαηηδεκτ ηκθϋζκυ, κ R Square δκταδ η κ λϊΰπθκ κυ υθζά ΰλαηηδεάμ υξϋδβμ. κ παλϊδΰηα ηαμ παλαβλκτη σδ R Square =0.221=22.1%. βζαά β ηαίζβά Maths ιβΰέ ησθκ κ 22.1% βμ ηαίζβσβαμ βμ ηαίζβάμ English. Κααζαίαέθκυη ζκδπσθ σδ θ έθαδ εαδ κ εαζτλκ ηκθϋζκ θα πλδΰλϊοδ α κηϋθα ηαμ αφκτ αφάθαδ ηΰϊζκ ηϋλκμ βμ ηαίζβσβαμ αθιάΰβκ. : Σκ ΰΰκθσμ Ϊθ β αθιϊλββ ηαίζβά ηπκλέ θα ιβΰάδ ηΰϊζκ ηϋλκμ βμ ηαίζβσβαμ βμ ιαλβηϋθβμ ηαμ ηαίζβάμ, φαέθαδ εαδ απσ α αγλκέηαα λαΰυθπθ. βθ πλέππβ ηαμ ίζϋπκυη σδ κ SSE=6806.095 θυ κ SSR=1928.605 η SST=8734.700. ΠλΫπδ θα εααζϊίκυη ζκδπσθ σδ θαδ ηθ ηπκλέ θα υπϊλξδ αδδεϊ βηαθδεά υξϋδβ ηαιτ πθ τκ ηαίζβυθ, αζζϊ αυσ Page 4 of 7
Εργαστήρα στη Στατστή ΙΙ - θ βηαέθδ απαλαέβα σδ β αθιϊλββ ηαίζβά ηπκλέ θα ιβΰάδ Ϋζδα β ηαίζβσβα βμ ιαλβηϋθβμ ηαίζβάμ. πσ α παλαπϊθπ ζκδπσθ πλκϋευο κ ηκθϋζκ Εηεία του = 8, EEnl M = 8,. 668 M υθάγπμ αυσθ κθ υθζά κθ ληβθτκυη πμ ιάμ: Η ηϋβ ίαγηκζκΰέα πθ ηαγβυθ κ ηϊγβηα πθ αΰΰζδευθ έθαδ 81,102 ηκθϊμ κηϋθκυ σδ α ΜαγβηαδεΪ Ϋξκυθ ΰλΪοδ 0. Χ: πδά κ 0 θ πλδϋξαδ α κηϋθα ηαμ, κ δϊβηα ηζϋβμ βζαά, β παλαπϊθπ ληβθέα θ Ϋξδ πλαεδεά αιέα. α υ =, 668 Γδα εϊγ ηέα ηκθϊα ατιββμ β ίαγηκζκΰέα κ ηϊγβηα πθ Μαγβηαδευθ, β ηϋβ ίαγηκζκΰέα α ΰΰζδεΪ, ηδυθαδ εαϊ 0,668 ηκθϊμ. Έ ππ υ Γα υ Όππμ έπαη ι αλξάμ κ ΰλαηηδεσ ηκθϋζκ ίαέααδ πϊθπ κλδηϋθμ ίαδεϋμ πλκςπκγϋδμ. υϋμ έθαδ β εαθκθδεσβα, β κηκεαδεσβα εαδ β αθιαλβέα πθ εααζκέππθ ά φαζηϊπθ. Γα αα, εϊθκυη Ϋζΰξκ εαθκθδεσβαμ ΰδα α Standardized Residuals. Analyze Descriptive Statistics Explore Dependent List: Standardized Residuals Plots: Histogram + Normality Plots with Tests Coninue Display: Plots OK πσ κθ Ϋζΰξκ Shapiro-Wilk ίζϋπκυη σδ p-value=0,410>0.05 Ϊλα θ ηπκλκτη θα απκλλέοκυη βθ εαθκθδεσβα πθ εααζκέππθ. Γα αα, εϊθκυη Ϋθα Scatter Plot η Ϊικθα Y α Standardized Residuals εαδ Ϊικθα Χ α Predicted Values. αυσ κ δϊΰλαηηα, γα πλϋπδ θα υπϊλξδ εϊπκδκ υβηαδεσ pattern πθ βηέπθ, αζζϊ γα πλϋπδ α βηέα θα εααθϋηκθαδ η υξαέκ λσπκ ΰτλπ απσ κ 0. Ό αφ ααα, Ϊθ θ Ϋξκυη εϊπκδκ κδξέκ απσ β δΰηακζβοέα πθ κηϋθπθ πκυ θα ηαμ υπκβζυθδ ιϊλββ σ θ ξλδϊααδ θα εϊθκυη εϊπκδκθ Ϋζΰξκ. δαφκλδεϊ, εαϊζζβζκ έθαδ Page 5 of 7
Εργαστήρα στη Στατστή ΙΙ - αυσ πθ Durbin-Watson, κυ κπκέκυ κδ δηϋμ πλϋπδ θα ευηαέθκθαδ απσ 1,5 Ϋπμ 2,5 πλκεδηϋθκυ θα ηδζάκυη ΰδα αθιαλβέα. α πυ «α» π απ απ α Έπ σδ Ϋξκυη κ απζσ ΰλαηηδεσ ηκθϋζκ Τ i= ί 0 +ί 1 *Χ i + i, σπκυ α i ~Ν(0, 2 ). Οδ υπκγϋδμ ηαμ ΰδα κ ΰλαηηδεσ ηκθϋζκ έθαδ σδ α i αεκζκυγκτθ βθ εαθκθδεά εααθκηά, έθαδ κηκεαδεϊ( βζαά Ϋξκυθ βθ έδα δαετηαθβ) εαδ πέβμ έθαδ αθιϊλβα. πα αα α ; τηφπθα η σα Ϋξκυη ηϊγδ β εαζτλβ υγέα ΰλαηηδεάμ παζδθλσηββμ γα πλκετοδ ξλβδηκπκδυθαμ β ηϋγκκ πθ ζαξέπθ Σλαΰυθπθ. Η ηϋγκκμ αυά γα ηαμ υδ δμ εαζτλμ υθαϋμ εδηάλδμ ζαξέπθ λαΰυθπθ(..) η ίϊβ δμ κπκέμ γα φδαξέ β υγέα πκυ γα ηπκλϋδ θα πλκαληκέ α κηϋθα ηαμ η κθ εαζτλκ υθασ λσπκ. Έπ ζκδπσθ b 0, b 1 κδ.. πθ ί 0 εαδ ί 1 αθδκέξπμ. α..; b 0 =E(Y)-b 1 *E(X), σπκυ (Τ) εαδ (Χ) κδ δΰηαδεϋμ ηϋμ δηϋμ πθ Y i & X i αθέκδξα, βζαά ΕΧ = i i= ΕΥ = i b 1 = ε i = n i= (i E) i E n (i E) i= Χi EX (Xi EX) i= α αα b 0 α b 1 ;; = n n i=(i E) i E i=i E n (i E) i= i=. n = i= κi Yi, σπκυ φκτ α i ~N(0, 2 ) υθπϊΰαδ σδ α Τ i ~N(ί 0 +ί 1 *Χ δ, 2 ). φκτ ζκδπσθ υηίαέθδ αυσ εαδ απσ δμ παλαπϊθπ ξϋδμ ίζϋπκυη σδ α b 0, b 1 απκζκτθ ΰλαηηδεσ υθυαησ πθ Τ i, σ εαδ αυϊ γα αεκζκυγκτθ βθ εαθκθδεά εααθκηά. πδά β ηϋγκκμ ζαξέπθ λαΰυθπθ ηαμ έθδ αηλσζβπκυμ εδηβϋμ πθ ί 0 εαδ ί 1, απσ β αδδεά Ι ιϋλκυη σδ αυσ βηαέθδ σδ (b 0 )= 0 εαδ (b 1 )= 1. Άλα b 0 ~N( 0, 2 *[ n + (EX) n (X EX) = ] ) α b 1 ~N( 1, σ n (X EX) = ) Page 6 of 7
Εργαστήρα στη Στατστή ΙΙ - αα α SPSS π;; Ο Ϋζΰξκμ πκυ ΰέθαδ απσ κ SPSS έθαδ κ: 0 : 1 =0 Ϋθαθδ βμ θαζζαεδεάμ 1 : 1 0. Γδα βθ πλαΰηακπκδάβ αυκτ κυ ζϋΰξκυ άθαδ β ιάμ ζΰξκυθϊλββ Σ= β ( ) β κπκέα αεκζκυγέ βθ t-student εααθκηά η n-2 ίαγηκτμ ζυγλέαμ. ( α απ b 1, αφ παα απ 2 π α υ. ππ πυ α υ α α α α υ α α αυ α αα (0,1) ). ΚΪπ απσ βθ Η 0 παλαβλκτη βθ Σ * = ( ). Γδα θα απκφαέκυη Ϋθα γα απκλλέοκυη β ηβθδεά υπσγβ Ϋθαθδ βμ θαζζαεδεάμ ηαμ ά Ϊθ θ γα απκλλέοκυη, γα πλϋπδ θα υΰελέθκυη βθ απσζυβ δηά αυάμ βμ παλαβλκτηθβμ Σ * η κ t a/2;n-2 πκκδαέκ βηέκ βμ t-student εααθκηάμ. α, αππυ υπ.. α, * >t a/2;n-2. Σκ αδδεσ παεϋκ SPSS ζκδπσθ ηαμ έθδ απυγέαμ κ p-value(sig.) κυ παλαπϊθπ ζϋΰξκυ ξπλέμ θα ξλδϊααδ θα αθαλϋξκυη κυμ πέθαεμ βμ t εααθκηάμ ΰδα θα ίλκτη κ εαϊζζβζκ πκκδαέκ βηέκ. Αππυ π 0 p-value(sig.)<0,05. π Ϊθ έξαη κθ Ϋζΰξκ Η 0 :ί 1 =0 Ϋθαθδ βμ θαζζαεδεάμ 1 : 1 >0 σ γα απκλλέπαη βθ Η 0... α, Ϊθ * >t α;n-2. Καδ αθέκδξα Ϊθ έξαη βθ θαζζαεδεά 1 : 1 <0, σ γα απκλλέπαη βθ Η 0.. α, Ϊθ * <-t a;n-2. (!!!) ππ α p-value α απυ p-value<a, πα αα α υ. Page 7 of 7