ΜΔΣΑΠΣΤΥΗΑΚΟ ΠΡΟΓΡΑΜΜΑ ΠΟΤΓΩΝ «ΠΟΤΓΔ ΣΖΝ ΔΚΠΑΗΓΔΤΖ»

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΜΔΣΑΠΣΤΥΗΑΚΟ ΠΡΟΓΡΑΜΜΑ ΠΟΤΓΩΝ «ΠΟΤΓΔ ΣΖΝ ΔΚΠΑΗΓΔΤΖ»"

Transcript

1 ΔΛΛΗΝΙΚΟ ΑΝΟΙΚΣΟ ΠΑΝΔΠΙΣΗΜΙΟ ΥΟΛΗ ΑΝΘΩΠΙΣΙΚΩΝ ΠΟΤΓΩΝ ΜΔΣΑΠΣΤΥΗΑΚΟ ΠΡΟΓΡΑΜΜΑ ΠΟΤΓΩΝ «ΠΟΤΓΔ ΣΖΝ ΔΚΠΑΗΓΔΤΖ» ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ΥΔΓΙΑΜΟ, ΑΝΑΠΣΤΞΗ ΚΑΙ ΑΞΙΟΛΟΓΗΗ ΔΝΑΛΛΑΚΣΙΚΟΤ ΓΙΓΑΚΣΙΚΟΤ ΤΛΙΚΟΤ: ΔΠΔΞΔΡΓΑΙΑ ΚΑΙ ΑΝΑΛΤΗ ΔΡΔΤΝΗΣΙΚΩΝ ΓΔΓΟΜΔΝΩΝ Δ R ΓΔΩΡΓΗΟ ΚΑΡΑΒΑΗΛΖ ΔΠΗΒΛΔΠΩΝ ΚΑΘΖΓΖΣΖ ΑΝΑΣΑΗΟ ΔΜΒΑΛΩΣΖ ΠΑΣΡΑ ΔΠΣΔΜΒΡΗΟ 2012

2

3 Πεξίιεςε Ζ R είλαη κηα γιψζζα πξνγξακκαηηζκνχ κε ελζσκαησκέλν πεξηβάιινλ γηα ζηαηηζηηθνχο ππνινγηζκνχο θαη γξαθηθέο παξαζηάζεηο. Δίλαη κηα ςεθηαθή εθαξκνγή αλνηθηνχ θψδηθα ε νπνία δηαδίδεηαη δηεζλψο κε νινέλα θαη απμαλφκελν ξπζκφ, απφ ην Αληηζέησο, ζηελ Διιάδα ε ρξήζε ηεο είλαη αθφκα πεξηνξηζκέλε ζηνλ ηνκέα ησλ θνηλσληθψλ επηζηεκψλ θαη εηδηθφηεξα ζηελ Δθπαίδεπζε. Ζ παξνχζα δηπισκαηηθή εξγαζία απνζθνπεί ζηε δηάδνζε ηεο R ζηελ Διιάδα θαη απεπζχλεηαη ζηνπο πνιίηεο πνπ επηζπκνχλ λα θαηαλννχλ θαη λα αμηνινγνχλ ηα επξήκαηα ηεο επηζηεκνληθήο έξεπλαο αιιά θαη ζε εξεπλεηέο απφ ηνλ εθπαηδεπηηθφ ρψξν. Σν πεξηερφκελν ηεο εξγαζίαο απνηειείηαη απφ ηε ζηαηηζηηθή κεζνδνινγία πνπ είλαη απαξαίηεηε γηα ηελ εθπαηδεπηηθή έξεπλα κε ηαπηφρξνλε εθαξκνγή ηεο R ζηα παξαδείγκαηα πνπ ηε ζπλνδεχνπλ. Παξάιιεια, αλαπηχζζεηαη δηαδξαζηηθφ ελαιιαθηηθφ δηδαθηηθφ πιηθφ πνπ είλαη θαηάιιειν γηα ηηο αλάγθεο ηεο Αλνηθηήο θαη εμ Απνζηάζεσο Δθπαίδεπζεο. Σα απνηειέζκαηα ηεο αμηνιφγεζεο ηνπ δηδαθηηθνχ πιηθνχ έδεημαλ φηη κπνξεί λα ζπκβάιιεη ζεηηθά ζηε ρξήζε ηεο R γηα ηελ αλάιπζε θαη επεμεξγαζία εξεπλεηηθψλ δεδνκέλσλ, απφ εθπαηδεπηηθνχο Πξσηνβάζκηαο θαη Γεπηεξνβάζκηαο εθπαίδεπζεο, αιιά θαη κεηαπηπρηαθνχο θνηηεηέο ηνπ Διιεληθνχ Αλνηθηνχ Παλεπηζηεκίνπ. i

4 Abstract R is a language and environment for statistical computing and graphical display. The R environment is an open source project which has been spreading increasingly all over the world, since On the contrary, its usage is limited in Greece in the field of social sciences and in particular in Education. Purpose of this work is the increasing usage of R in Greece from citizens who want to understand and evaluate the results of scientific research but also by researchers in the educational field. The content of the present work includes the statistical methodology which is necessary for educational purposes with relevant R examples. Furthermore, alternative interactive didactical material is developed appropriate for Open and Distance Education. The results of the evaluation of the didactical material has shown that it can enhance the use of R for the analysis and data processing by educators of primary and secondary education but also by postgraduate students of the Hellenic Open University. ii

5 ΠΔΡΙΔΥΟΜΔΝΑ Πεξίιεςε.. i Abstract... ii 1. Δλαιιαθηηθό Γηδαθηηθό Τιηθό γηα ηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε Δλαιιαθηηθφ Γηδαθηηθφ Τιηθφ Ζ ζεκαζία ηεο εθπαηδεπηηθήο έξεπλαο Γεκφζηα θαηαλφεζε ηεο ηαηηζηηθήο ΣΠΔ θαη ηαηηζηηθή ηαηηζηηθή Αλάιπζε θαη Δπεμεξγαζία Δξεπλεηηθώλ Γεδνκέλσλ κε ηε Γιώζζα Πξνγξακκαηηζκνύ R Δηζαγσγή Γεληθή επηζθφπεζε ησλ ςεθηαθψλ εθαξκνγψλ αλάιπζεο θαη επεμεξγαζίαο δεδνκέλσλ Αηηηνιφγεζε επηινγήο ζηαηηζηηθνχ παθέηνπ θνπφο θαη πξνζδνθψκελα απνηειέζκαηα ηεο δηπισκαηηθήο εξγαζίαο Δηζαγσγή ζηελ R Ζ βαζηθή έθδνζε ηεο R Πιεξνθνξηθφο αιθαβεηηζκφο γηα ηελ R Οη αξηζκεηηθνί ππνινγηζκνί Οη εθθξάζεηο θεηκέλνπ Οη ινγηθέο εθθξάζεηο Αληηθείκελα δεδνκέλσλ Γηαλχζκαηα Πίλαθεο Παξάγνληεο Πιαίζηα δεδνκέλσλ Γξαθηθέο παξαζηάζεηο ηνηρεηψδεο πξνγξακκαηηζκφο κε ηελ R RStudio

6 3.7 Παθέηα επέθηαζεο: εγθαηάζηαζε θαη ελεξγνπνίεζε ηαηηζηηθή Μεζνδνινγία Ζ έλλνηα ηεο κεηαβιεηήο Πεξηγξαθηθή ζηαηηζηηθή Καηαλνκέο ζπρλνηήησλ Γξαθηθέο παξαζηάζεηο θαηαλνκψλ ζπρλνηήησλ Μέηξα ζέζεο θαη δηαζπνξάο Ζ έλλνηα ηεο πηζαλφηεηαο Καηαλνκέο πηζαλφηεηαο Καλνληθή θαηαλνκή Οη θαηαλνκέο t θαη Έιεγρνη ππνζέζεσλ πζρέηηζε θαη γξακκηθή παιηλδξφκεζε Δλαιιαθηηθό Γηδαθηηθό Τιηθό γηα ηε ηαηηζηηθή Αλάιπζε θαη Δπεμεξγαζία Γεδνκέλσλ κε ηελ R Μνξθέο ΔΓΤ γηα ηελ R Πξνεηνηκαζία ηεο βαζηθήο έθδνζεο ηεο R θαη ηνπ RStudio Παξνπζίαζε ηνπ ελαιιαθηηθνχ δηδαθηηθνχ πιηθνχ γηα ηελ R ΔΓΤ γηα ηελ πεξηγξαθηθή ζηαηηζηηθή ΔΓΤ γηα ηηο θαηαλνκέο πηζαλφηεηαο ΔΓΤ γηα ηνπο ειέγρνπο ππνζέζεσλ ΔΓΤ γηα ηε ζπζρέηηζε θαη ηε γξακκηθή παιηλδξφκεζε Αμηνιόγεζε ηνπ Πιεξνθνξηαθνύ πζηήκαηνο Αλάιπζεο θαη Δπεμεξγαζίαο Δξεπλεηηθώλ Γεδνκέλσλ κε ηελ R Αμηνιφγεζε ηνπ δηδαθηηθνχ πιηθνχ γηα ηε ζηαηηζηηθή κεζνδνινγία κε ηελ R Αμηνιφγεζε ηνπ δηαδηθηπαθνχ ηφπνπ πκπεξάζκαηα θαη Μειινληηθή Δξγαζία πκπεξάζκαηα Μειινληηθή εξγαζία ΠΑΡΑΡΣΗΜΑ Α : Κώδηθαο εληνιώλ ησλ ζπλαξηήζεσλ ηεο R.195

7 ΠΑΡΑΡΣΗΜΑ Β : Σξνπνπνηεκέλν εξσηεκαηνιόγην SATS ΠΑΡΑΡΣΗΜΑ Γ : Αμηνιόγεζε ηνπ δηαδηθηπαθνύ ηόπνπ ειεθηξνληθήο κάζεζεο Βηβιηνγξαθία Γηθηπνγξαθία...221

8

9 1 Δλαιιαθηηθό Γηδαθηηθό Τιηθό γηα ηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε Σν θεθάιαην απηφ απνηειεί κηα εηζαγσγή ζηηο έλλνηεο πνπ ζα απαζρνιήζνπλ ηε δηπισκαηηθή εξγαζία θαη αθνξνχλ ηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε θαη ην Δλαιιαθηηθφ Γηδαθηηθφ Τιηθφ πνπ είλαη θαηάιιεια ζρεδηαζκέλν γηα απηή ηελ εηδηθή κνξθή εθπαίδεπζεο. 1.1 Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε Σηο ηειεπηαίεο δεθαεηίεο έρεη αλαπηπρζεί, παξάιιεια κε ην παξαδνζηαθφ εθπαηδεπηηθφ ζχζηεκα, ε Αλνηθηή θαη εμ Απνζηάζεσο εθπαίδεπζε. Γηα λα αληηιεθζνχκε ηηο δηαθνξέο ηνπο, παξαζέηνπκε ηνπο πεξηνξηζκνχο ελφο παξαδνζηαθνχ ζπζηήκαηνο εθπαίδεπζεο (Βεξγίδεο θ. ζπλ., 1998, ζει. 26): Ζ αδπλακία ηεο θπζηθήο παξνπζίαο ηνπ θνηηεηή ζηηο αίζνπζεο δηδαζθαιίαο Ζ ππνρξέσζε ηνπ ππνςήθηνπ θνηηεηή λα απνδείμεη εθ ησλ πξνηέξσλ ηηο δπλαηφηεηεο ηνπ γηα επηηπρή παξαθνινχζεζε ηνπ πξνγξάκκαηνο ζπνπδψλ, ζπλήζσο κε εηζαγσγηθέο εμεηάζεηο Σν ζρεηηθφ κηθξφ θάζκα ειηθηψλ ζην νπνίν απεπζχλεηαη. Αθνξά ζπλήζσο ηηο ειηθίεο ρξνλψλ Ζ αδπλακία πξνζθνξάο απηνηειψλ θαη κηθξήο ρξνληθήο δηάξθεηαο επηκνξθσηηθψλ πξνγξακκάησλ ζπνπδψλ. Δλαιιαθηηθά, ε Αλνηθηή εθπαίδεπζε έρεη σο βαζηθή θηινζνθία ηελ άξζε ησλ παξαπάλσ πεξηνξηζκψλ θαη ηε δεκηνπξγία εθπαηδεπηηθψλ επθαηξηψλ γηα φινπο. Ζ Αλνηθηή εθπαίδεπζε πηνζεηεί ηελ άπνςε φηη ε παηδεία είλαη δηθαίσκα φισλ θαη φρη κφλν απηψλ πνπ ηθαλνπνηνχλ θάπνηεο ζπγθεθξηκέλεο πξνυπνζέζεηο. Έηζη, ζηελ Αλνηθηή Δθπαίδεπζε: 1

10 Γελ είλαη απαξαίηεηε ε θπζηθή παξνπζία ηνπ θνηηεηή ζηηο αίζνπζεο δηδαζθαιίαο. Ο θνηηεηήο κπνξεί λα ρξεζηκνπνηεί ηελ θαηνηθία ηνπ σο βαζηθφ ρψξν κάζεζεο αίξνληαο φινπο ηνπο πεξηνξηζκνχο πξνζβαζηκφηεηαο πνπ κπνξεί λα ππάξρνπλ, φπσο ζηα άηνκα κε εηδηθέο αλάγθεο Γελ πξνυπνζέηεη ηε ζπκκεηνρή θαη επηηπρία ηνπ ππνςήγηνπ θνηηεηή ζε εηζαγσγηθέο εμεηάζεηο. Αξθεί ζπλήζσο κηα βεβαίσζε νινθιήξσζεο ζπνπδψλ ζηελ πξνεγνχκελε βαζκίδα εθπαίδεπζεο Απεπζχλνληαη ζπλήζσο ζε ειηθίεο άλσ ησλ 18 εηψλ ρσξίο αλψηαην φξην ειηθίαο. Σν ειιεληθφ Αλνηθηφ Παλεπηζηήκην απεπζχλεηαη ζε ειηθίεο 23 εηψλ θαη άλσ Παξέρεη επέιηθηα πξνγξάκκαηα ζπνπδψλ πξνζαξκνζκέλα ζηηο αλάγθεο ησλ θνηηεηψλ. Ο θνηηεηήο κπνξεί λα παξαθνινπζήζεη είηε κηα ζεκαηηθή ελφηεηα ηνπ ελδηαθέξνληφο ηνπ είηε νινθιεξσκάλε πξνγξάκκαηα ζπνπδψλ πνπ θηάλνπλ κέρξη ηελ απφθηεζε κεηαπηπρηαθψλ θαη δηδαθηνξηθψλ ηίηισλ. Ζ Δθπαίδεπζε απφ Απφζηαζε (distance education) είλαη έλα ζχζηεκα εθπαίδεπζεο αιιά θαη κηα κέζνδνο γηα ηελ ηθαλνπνίεζε ησλ ζηφρσλ ηεο Αλνηθηήο Δθπαίδεπζεο. Ο θνηηεηήο βξίζθεηαη καθξηά απφ νπνηνδήπνηε ζπκβαηηθφ καζεζηαθφ ρψξν (αίζνπζεο δηδαζθαιίαο, βηβιηνζήθε, θηήξηα δηνίθεζεο) θαη θαζνδεγείηαη απφ απφζηαζε. Ζ θαζνδήγεζε πξνέξρεηαη απφ έλαλ θαζεγεηή-ζχκβνπιν θαη απφ εηδηθά ζρεδηαζκέλν εθπαηδεπηηθφ πιηθφ. Ο φξνο θαζεγεηήο-ζχκβνπινο αληηθαηνπηξίδεη ηα ηδηαίηεξα ραξαθηεξηζηηθά απηνχ ηνπ ξφινπ ζηελ Δθπαίδεπζε απφ Απφζηαζε. Γελ είλαη δηδάζθσλ φπσο ζηε ζπκβαηηθή εθπαίδεπζε, αιιά θαζνδεγεηήο θαη εκςπρσηήο ηνπ θνηηεηή ζηελ πνξεία πξνο ηε γλψζε. Βαζηθά θαζήθνληα ησλ θαζεγεηψλ-ζπκβνχισλ είλαη ε δηδαζθαιία φρη ζην ζχλνιν ηνπ πιηθνχ αιιά ζε ζεκεία πνπ ρξεηάδεηαη βνήζεηα ν θνηηεηήο, ε αμηνιόγεζε ησλ θνηηεηψλ, ζπλήζσο κέζα απφ γξαπηέο εξγαζίεο θαη ε ππνζηήξημε ησλ θνηηεηψλ κέζσ πξνζσπηθήο επηθνηλσλίαο ( , ηειέθσλν) ή νκαδηθψλ ζπκβνπιεπηηθψλ ζπλαληήζεσλ. Σν εηδηθά ζρεδηαζκέλν δηδαθηηθφ πιηθφ ζα αλαιπζεί ζηελ επφκελε ελφηεηα. 2

11 1.2 Δλαιιαθηηθό Γηδαθηηθό Τιηθό Σν δηδαθηηθφ πιηθφ ζηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε έρεη νξηζκέλα ραξαθηεξηζηηθά πνπ απνξξένπλ απφ ηελ ηδηαηηεξφηεηα απηήο ηεο εθπαηδεπηηθήο κεζφδνπ. Καηαξρήλ, θαζνξίδεη ζε πνιχ κεγάιν βαζκφ ηελ πνηφηεηα ησλ ζπνπδψλ δηφηη ζηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε απνπζηάδνπλ φιεο νη ππφινηπεο ππνζηεξηθηηθέο δνκέο ησλ θνηηεηψλ, φπσο γηα παξάδεηγκα νη δηδάζθνληεο, νη βηβιηνζήθεο θαη ηα εξγαζηήξηα. Δπηπιένλ, απνπζηάδεη ε δηαπξνζσπηθή επηθνηλσλία θαη ζπλαλαζηξνθή κεηαμχ ησλ θνηηεηψλ πνπ αθνινπζνχλ ην ίδην πξφγξακκα ζπνπδψλ θαη ελδερνκέλσο αληηκεησπίδνπλ παξφκνηα πξνβιήκαηα ζηε καζεζηαθή δηαδηθαζία. Δίλαη ινηπφλ απαξαίηεην ην δηδαθηηθφ πιηθφ λα (Βεξγίδεο θ. ζπλ., 1998, ζει. 49): Δίλαη πεξηζζφηεξν αλαιπηηθφ απφ φηη ζηε ζπκβαηηθή εθπαίδεπζε φπνπ ππάξρεη ε δπλαηφηεηα εθηελνχο παξέκβαζεο ηνπ δηδάζθνληα γηα ηελ απνζαθήληζε θαη επεμήγεζε ελλνηψλ ηνπ γλσζηηθνχ αληηθεηκέλνπ. Πξέπεη ινηπφλ λα πεξηιακβάλεη πνιιά παξαδείγκαηα θαη κειέηεο πεξίπησζεο Πξνάγεη ηελ αιιειεπίδξαζε ηνπ θνηηεηή κε ην καζεζηαθφ πιηθφ, ψζηε λα πξνθαιεί ην ελδηαθέξνλ θαη ηελ ελεξγφ ζπκκεηνρή ηνπ θνηηεηή. Δηδηθφηεξα, γηα ηνπο ελήιηθεο θνηηεηέο ην δηδαθηηθφ πιηθφ πξέπεη λα πεξηέρεη πηπρέο ηνπ γλσζηηθνχ αληηθεηκέλνπ πνπ ζρεηίδνληαη κε ηηο εκπεηξίεο θαη ηδηαίηεξεο καζεζηαθέο αλάγθεο ηνπο Αμηνινγεί θαη ελεκεξψλεη ην θνηηεηή γηα ηελ πξφνδφ ηνπ κε πνιιέο αζθήζεηο απηναμηνιφγεζεο θαη αληίζηνηρεο ππνδεηγκαηηθέο απαληήζεηο. Καζνδεγεί ην θνηηεηή ζηε κειέηε κε ελδεηθηηθά ρξνλνδηαγξάκκαηα γηα ηελ πνξεία εθηέιεζεο ησλ εξγαζηψλ. Πέξα απφ ηα παξαπάλσ ραξαθηεξηζηηθά ηνπ δηδαθηηθνχ πιηθνχ, έλα νινθιεξσκέλν παθέην εθπαηδεπηηθνχ πιηθνχ γηα ηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε πξέπεη λα πεξηιακβάλεη εθηφο απφ ηα ζπκβαηηθά δηδαθηηθά κέζα, φπσο έληππν πιηθφ (βηβιία, άξζξα, κειέηεο) θαη ελαιιαθηηθφ δηδαθηηθφ πιηθφ (ΔΓΤ), ζην νπνίν ρξεζηκνπνηνχληαη 3

12 κνξθέο δηδαθηηθνχ πιηθνχ πνπ βαζίδνληαη θπξίσο ζηηο ζχγρξνλεο ηερλνινγίεο, φπσο: CD/DVD κε νπηηθναθνπζηηθφ πιηθφ (εηθφλα, ήρν θαη video) Πξνγξάκκαηα εθπαίδεπζεο ζηνλ ειεθηξνληθφ ππνινγηζηή. Γίλνπλ ηε δπλαηφηεηα γηα ηελ αλάπηπμε εθαξκνγψλ κε πςειφ βαζκφ δηαδξαζηηθφηεηαο κεηαμχ ρξήζηε-θνηηεηή θαη ππνινγηζηή. Δπίζεο δεκηνπξγνχλ πεξηβάιινληα πξνζνκνίσζεο πνπ ππνθαζηζηνχλ ζε θάπνην βαζκφ ηα πιενλεθηήκαηα ηεο ζπκβαηηθήο εθπαίδεπζεο, φπσο γηα παξάδεηγκα έλα εηθνληθφ εξγαζηήξην θπζηθψλ επηζηεκψλ Ηζηνζειίδεο θαη εθπαηδεπηηθέο εθαξκνγέο νη νπνίεο ιεηηνπξγνχλ ζην Internet. Σν Internet είλαη ηδαληθφ γηα ηελ αλάξηεζε, ζπγθέληξσζε θαη νξγάλσζε ηνπ δηδαθηηθνχ πιηθνχ κε ηξφπν πνπ λα δεκηνπξγείηαη έλα θηιηθφ πξνο ηε κάζεζε πεξηβάιινλ. Σα ηειεπηαία ρξφληα ε αλάπηπμε ηεο ηερλνινγίαο θαη εηδηθφηεξα ησλ ειεθηξνληθψλ ππνινγηζηψλ θαη ηνπ Internet έρεη θαηαζηήζεη απηέο ηηο κνξθέο ελαιιαθηηθνχ δηδαθηηθνχ πιηθνχ σο ηηο πιένλ θαηάιιειεο γηα ηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε. ε απηφ ζπλέβαιιε ε ξαγδαία δηάδνζε ησλ πξνζσπηθψλ ππνινγηζηψλ φρη κφλν ζε εθπαηδεπηηθά ηδξχκαηα αιιά θαη πνιίηεο θαη ε αλάπηπμε πιεζψξαο εθαξκνγψλ γηα φιν ην εχξνο δπλαηνηήησλ ησλ ρξεζηψλ. Δπηπιένλ, ην Internet ζπλέβαιε θαζνξηζηηθά ζηελ πιεξνθφξεζε ησλ ρξεζηψλ θαη ηε δηάδνζε ησλ ςεθηαθψλ εθαξκνγψλ ζε θάζε ζπίηη, κε κηθξφ θφζηνο θαη κε ζρεηηθά κηθξέο απαηηήζεηο ζε ηερλνγλσζία. Ζ παξνχζα δηπισκαηηθή εξγαζία αζρνιείηαη κε ηε δεκηνπξγία ΔΓΤ γηα ηελ πινπνίεζε Δθπαηδεπηηθήο Έξεπλαο. Σν δηδαθηηθφ πιηθφ είλαη θαηάιιειν θαη γηα ηε ζπκβαηηθή εθπαίδεπζε θπξίσο φκσο γηα ηελ Αλνηθηή θαη εμ Απνζηάζεσο Δθπαίδεπζε. 1.3 Η ζεκαζία ηεο εθπαηδεπηηθήο έξεπλαο Σν πιαίζην ηεο ζπδήηεζεο πνπ πξαγκαηνπνηείηαη γηα ηελ εθπαηδεπηηθή έξεπλα ζπλδέεηαη κε ηελ πξνψζεζε ηεο πνηφηεηαο ηεο δηδαθηηθήο πξάμεο θαη ησλ εθπαηδεπηηθψλ 4

13 ζπζηεκάησλ, ψζηε λα επηηεπρζεί ε βέιηηζηε απνηειεζκαηηθφηεηα ζηελ εθπαίδεπζε. Ο φξνο απνηειεζκαηηθφηεηα είλαη πνιχ γεληθφο, δηφηη ζρεηίδεηαη κε εθπαηδεπηηθέο, παηδαγσγηθέο θαη δηνηθεηηθέο ιεηηνπξγίεο ηεο εθπαηδεπηηθήο δηαδηθαζίαο θαζψο θαη κε πνίθηιεο πξνο εμέηαζε παξακέηξνπο, πνπ αθνξνχλ ηα απνηειέζκαηά ηεο, φπσο είλαη ε επίδνζε ησλ καζεηψλ/θνηηεηψλ, ε θνηλσληθνπνίεζε ησλ καζεηψλ, ε απφθηεζε γλψζεσλ ηθαλψλ γηα ηελ παξαπέξα επαγγεικαηηθή ηνπο εμέιημε, ε αλάπηπμε δεμηνηήησλ θαη ζηάζεσλ θαη πνιιά άιια. Τπάξρνπλ πνιπάξηζκα παξαδείγκαηα εθπαηδεπηηθήο έξεπλαο ζηε βηβιηνγξαθία πνπ αθνξνχλ κεηαμχ άιισλ ηελ ςπρνινγηθή ζεσξία θαη παηδαγσγηθή έξεπλα, ηε ζχληαμε αλαιπηηθψλ πξνγξακκάησλ, ηελ αμηνιφγεζε, ηελ εθπαηδεπηηθή ηερλνινγία (De Landsheere, 1996, θεθ. 3). Ζ πξνζέγγηζε πνπ επηρεηξείηαη γηα ηελ αληηκεηψπηζε ηέηνηνπ είδνπο έξεπλαο είλαη, ζχκθσλα κε ηνπο Verma & Mallick (2004, ζει ): Θεσξεηηθή ή βαζηθή έξεπλα, ε νπνία πξνζαλαηνιίδεηαη ζηελ αλάπηπμε γεληθψλ ζεσξηψλ θαη δελ αζρνιείηαη, πξσηαξρηθψο ηνπιάρηζηνλ, κε ηελ θαηαλφεζε πξαθηηθψλ πξνβιεκάησλ Δθαξκνζκέλε ή έξεπλα πεδίνπ, ε νπνία αζρνιείηαη κε ηελ εθαξκνγή λέαο γλψζεο γηα ηελ επίιπζε θαζεκεξηλψλ πξνβιεκάησλ Έξεπλα δξάζεο, ε νπνία αζρνιείηαη κε ηελ άκεζε εθαξκνγή παξά κε ηελ αλάπηπμε κηα ζεσξίαο. Απηφ ην είδνο ηεο έξεπλαο κνηάδεη κε ηελ εθαξκνζκέλε έξεπλα, αιιά κηα βαζηθή δηαθνξά είλαη φηη ε εθαξκνζκέλε έξεπλα επηηξέπεη γεληθεχζεηο ησλ ζπκπεξαζκάησλ ηεο, ελψ ε έξεπλα δξάζεο επηθεληξψλεηαη ζε έλα ζπγθεθξηκέλν πξφβιεκα θαη ζε έλα ζπγθεθξηκέλν πεξηβάιινλ. Μηα αθφκα ζεκαληηθή δηαθνξά είλαη φηη ν εξεπλεηήο ηαπηίδεηαη κε ηνλ εθπαηδεπηηθφ κε ζηφρν λα βειηησζεί ε δηθή ηνπ πξαθηηθή. Έρνπκε δειαδή ην γεθχξσκα αλάκεζα ζηε ζεσξεηηθή έξεπλα θαη ηελ εθπαηδεπηηθή δξάζε (Hammersley, 1999, ζει ) Έξεπλα αμηνιφγεζεο, ε νπνία ρξεζηκνπνηείηαη γηα λα κειεηεζεί ε απνηειεζκαηηθφηεηα ελφο ζπγθεθξηκέλνπ εθπαηδεπηηθνχ πξνγξάκκαηνο (Καξαηδηά-ηαπιηψηε & Λακπξφπνπινο, 2006). 5

14 Μηα άιιε ηαμηλφκεζε ησλ εηδψλ ηεο εθπαηδεπηηθήο έξεπλαο πνπ έρεη πξνηαζεί απφ ηνπο Cohen & Manion (1994, ζει ) είλαη δηηηή, ε θαλνληζηηθή θαη ε εξκελεπηηθή. Σν θαλνληζηηθφ κνληέιν δηέπεηαη απφ δχν βαζηθέο αξρέο κε ζεηηθηζηηθή νπηηθή. Πξψηνλ, φηη ε αλζξψπηλε ζπκπεξηθνξά αθνινπζεί θαηά βάζε θαλφλεο θαη δεχηεξνλ, φηη πξέπεη λα δηεξεπλεζεί κε βάζε ηηο κεζφδνπο ησλ καζεκαηηθψλ θαη θπζηθψλ επηζηεκψλ. Σν εξκελεπηηθφ κνληέιν, ζε αληίζεζε κε ην θαλνληζηηθφ, ελδηαθέξεηαη γηα ην άηνκν θαη ηελ θαηαλφεζε ηεο αλζξψπηλεο ζπκπεξηθνξάο. Αληίζηνηρε είλαη θαη ε κεζνδνινγία πνπ αθνινπζείηαη. ην θαλνληζηηθφ κνληέιν αλαδεηείηαη έλα καζεκαηηθφ κνληέιν, κηα ζρέζε αηηίαο-αηηηαηνχ, πνπ δηέπεηαη απφ αληηθεηκεληθφηεηα. ην εξκελεπηηθφ κνληέιν πνπ δηέπεηαη απφ ππνθεηκεληθφηεηα ην επίθεληξν είλαη ην άηνκν θαη ε θαηαλφεζε ησλ πξάμεσλ, ζπλήζσο κε ηελ ελεξγφ αλάκεημε ηνπ εξεπλεηή. Έηζη ε πιεηνλφηεηα ησλ εξεπλψλ ηνπ θαλνληζηηθνχ κνληέινπ πεξηνξίδεηαη ζηε ρξήζε πνζνηηθψλ κεζφδσλ (Bird et al., 1999, ελ. 7), ελψ νη πνηνηηθέο κέζνδνη (Bird et al., 1999, ελ. 6) απνηεινχλ ην βαζηθφ εξγαιείν ηνπ εξκελεπηηθνχ κνληέινπ. Ζ πνζνηηθή πξνζέγγηζε αζρνιείηαη κε ηελ αλάιπζε θαη επεμεξγαζία πνζνηηθψλ, δειαδή αξηζκεηηθψλ δεδνκέλσλ, ελψ ε πνηνηηθή έξεπλα ρξεζηκνπνηεί ηερληθέο φπσο ε παξαηήξεζε, ε ζπλέληεπμε, ε πξνζνκνίσζε. Οη δχν κέζνδνη έρνπλ πιενλεθηήκαηα θαη κεηνλεθηήκαηα θαη ε ζπκπιεξσκαηηθή ηνπο ρξήζε ζεσξείηαη ελδεδεηγκέλε γηα ηελ αληηκεηψπηζε ησλ ζχλζεησλ πξνθιήζεσλ ζην ρψξν ηεο εθπαηδεπηηθήο έξεπλαο (Βηηζηιάθε-νξσληάηε, 1998). ηαλ ρξεζηκνπνηείηαη ε πνζνηηθή πξνζέγγηζε είλαη απαξαίηεηε ε θαηαλφεζε ηεο ζηαηηζηηθήο κεζνδνινγίαο, αιιά θαη ε αμηνπνίεζε ησλ ηερλνινγηψλ πιεξνθνξηθήο θαη επηθνηλσληψλ. Σα δχν απηά απαξαίηεηα εθφδηα κπνξεί λα απνηεινχλ ηππηθά πξνζφληα γηα νξηζκέλνπο εηδηθνχο εξεπλεηέο, φρη φκσο θαη γηα ηνπο ππφινηπνπο εξεπλεηέο ή απνδέθηεο ηεο εθπαηδεπηηθήο έξεπλαο, πνπ είλαη: ηα κέιε ηεο εθπαηδεπηηθήο θνηλφηεηαο (εθπαηδεπηηθνί, καζεηέο, γνλείο θαη θεδεκφλεο) εθπαηδεπηηθνί εξεπλεηέο απηνί πνπ αζθνχλ πνιηηηθή (policy makers) θαη παίξλνπλ απνθάζεηο (decision 6

15 makers) ζην ρψξν ηεο εθπαίδεπζεο ε θνηλσλία ζπλνιηθά. Ζ ρξήζε θαη πνιχ πεξηζζφηεξν ε βαζχηεξε θαηαλφεζε ηεο ζηαηηζηηθήο θαη ησλ ΣΠΔ δελ πξέπεη λα ζεσξνχληαη δεδνκέλα ζε θάπνηεο απφ ηηο νκάδεο ησλ ελδηαθεξνκέλσλ, φπσο γηα νξηζκέλνπο εξεπλεηέο (π.ρ. ςπρνιφγνπο), ηνπο εθπαηδεπηηθνχο-εξεπλεηέο (π.ρ. ζηελ έξεπλα δξάζεο), ηα δηνηθεηηθά ζηειέρε ηεο εθπαίδεπζεο θαη πνιχ πεξηζζφηεξν γηα ηνπο γνλείο/θεδεκφλεο ζηνπο νπνίνπο ελδερνκέλσο λα αλαθνηλσζνχλ ηα απνηειέζκαηα ηεο έξεπλαο. Δπνκέλσο, ε ζπκβνιή ηεο εθπαηδεπηηθήο έξεπλαο ζηε βειηίσζε ησλ απνηειεζκάησλ ηεο παξερφκελεο εθπαίδεπζεο δελ κπνξεί λα είλαη νπζηψδεο ρσξίο ηελ επεμεξγαζία θαη αλάιπζε πνζνηηθψλ δεδνκέλσλ θαη ηε δηάρπζε ησλ αληίζηνηρσλ απνηειεζκάησλ ζε φιε ηελ θνηλσλία. 1.4 Γεκόζηα θαηαλόεζε ηεο ηαηηζηηθήο Οη πνζνηηθέο κέζνδνη ζηελ εθπαηδεπηηθή έξεπλα βαζίδνληαη ζηε ζηαηηζηηθή. Ζ ζηαηηζηηθή κπνξεί λα νξηζηεί σο ε επηζηήκε πνπ αζρνιείηαη κε: ηε δηαδηθαζία ζπιινγήο ησλ δεδνκέλσλ (δεηγκαηνιεςία) ηελ αλάιπζε θαη παξνπζίαζε ησλ δεδνκέλσλ (πεξηγξαθηθή ζηαηηζηηθή) ηελ επεμεξγαζία ησλ δεδνκέλσλ θαη ηελ εμαγσγή ζπκπεξαζκάησλ θάησ απφ ζπλζήθεο αβεβαηφηεηαο (ζηαηηζηηθή ζπκπεξαζκαηνινγία). Γηα παξάδεηγκα, αλ ζε έλα ζρνιείν ζέινπκε λα επηιέμνπκε έλα κέξνο ησλ καζεηψλ γηα λα κειεηήζνπκε ηνλ αξηζκφ θαη ην είδνο (π.ρ. δηθαηνινγεκέλεο ή αδηθαηνιφγεηεο) ησλ απνπζηψλ ηνπ ζπλφινπ ησλ καζεηψλ, πξέπεη αξρηθά λα ζρεδηάζνπκε ην κέγεζνο ηεο δεηγκαηνιεςίαο (πφζνπο καζεηέο ζα επηιέμνπκε) θαη ηνλ ηξφπν επηινγήο ηνπο (π.ρ. ηπραία, ίζν αξηζκφ απφ θάζε ηάμε ή θχιν θιπ). Αλ, ν δηεπζπληήο ηνπ ζρνιείνπ αλαθέξεη φηη 20 απφ ηνπο 100 καζεηέο πνπ επηιέρζεθαλ έρνπλ αδηθαηνιφγεηεο απνπζίεο ηφηε απιψο πεξηγξάθεη ην απνηέιεζκα ηεο έξεπλαο, ελψ φηαλ αλαθέξεη φηη ην 20% ησλ καζεηψλ ηνπ ζρνιείνπ έρνπλ αδηθαηνιφγεηεο απνπζίεο ηφηε ζπκπεξαίλεη φηη ην απνηέιεζκα πνπ δείγκαηνο επεθηείλεηαη ζην ζχλνιν ησλ καζεηψλ ηνπ ζρνιείνπ. 7

16 Ζ αλαγθαηφηεηα ηεο δεκφζηαο θαηαλφεζεο ηεο ζηαηηζηηθήο αλαδεηθλχεηαη απφ ηηο πξνεγνχκελεο ελφηεηεο, αιιά θαη απφ ηε ζρεηηθή βηβιηνγξαθία (Gal, 2002 Von Roten, 2006 Hand, 2009). Ζ ζηαηηζηηθή δηεηζδχεη ζε φινπο ζρεδφλ ηνπο ηνκείο ηεο αλζξψπηλεο δξαζηεξηφηεηαο, φπσο ε εθπαίδεπζε, ε εξγαζία, ε νηθνλνκία θαη ε πγεία, κε νινέλα αλαπηπζζφκελνπο ξπζκνχο. Οη πνιίηεο έξρνληαη ζε θαζεκεξηλή επαθή κε εθηηκήζεηο πηζαλνηήησλ θαη πνζνζηψλ γηα πξνγλψζεηο θαηξνχ, ηνλ πιεζσξηζκφ ηνλ επφκελν ρξφλν, ηελ πηζαλφηεηα λα απνθηήζνπλ πξεζβπσπία κεηά ηα 40 ρξφληα δσήο θαη πνιιά άιια. Αθφκα θαη ε αλάγλσζε κηαο απιήο πιεξνθνξίαο ζε κηα εθεκεξίδα κπνξεί λα απνηειέζεη ζεκαληηθφ θξηηήξην γηα ηελ ςεθνθνξία ησλ επφκελσλ εζληθψλ εθινγψλ, γηα απηφ εμάιινπ απαγνξεχνληαη νη δεκνζθνπήζεηο πξφβιεςεο εθινγηθνχ απνηειέζκαηνο ηηο ηειεπηαίεο κέξεο πξηλ απφ ηηο εθινγέο. Δπνκέλσο ε θαηαλφεζε ηεο παξνπζίαζεο θαη αλάιπζεο δεδνκέλσλ θαζψο θαη ε εμαγσγή ζηαηηζηηθψλ ζπκπεξαζκάησλ απνηειεί ζεκαληηθφ παξάγνληα γηα ηε ιήςε απνθάζεσλ ζε πνιινχο ηνκείο ηεο δσήο καο. Ζ θαηαλφεζε φκσο ηεο ζηαηηζηηθήο πξνυπνζέηεη ηελ ηθαλφηεηα πηνζεηνχκε ηελ πηζαλνθξαηηθή πξνζέγγηζε ησλ ππφ εμέηαζε ζεκάησλ, θαη λα θαηαλννχκε πνζνηηθέο αλαιχζεηο πνπ εκπεξηέρνπλ ελίνηε ιεπηέο έλλνηεο. O Gal (2002) πξφηεηλε έλα κνληέιν αμηνιφγεζεο ηνπ ζηαηηζηηθνχ αιθαβεηηζκνχ ησλ ελειίθσλ, ηνπ νπνίνπ ηα ζηνηρεία θαίλνληαη ζηνλ παξαθάησ πίλαθα: Γλσζηηθό αληηθείκελν Βαζηθέο δεμηφηεηεο αιθαβεηηζκνχ Βαζηθέο γλψζεηο ηαηηζηηθήο Βαζηθέο γλψζεηο Μαζεκαηηθψλ Γλψζε ηνπ πιαηζίνπ αλαθνξάο ηεο ηαηηζηηθήο (π.ρ. ηα απνηειέζκαηα έρνπλ πεξηζψξην ιάζνπο) Γηεξεπλεηηθέο δεμηφηεηεο Τπνθεηκεληθά ζηνηρεία Πεπνηζήζεηο θαη ζπκπεξηθνξέο Κξηηηθή ζηάζε ΣΑΣΙΣΙΚΟ ΑΛΦΑΒΗΣΙΜΟ Ζ αλάπηπμε φισλ ησλ ζπληζησζψλ ηνπ γλσζηηθνχ αληηθεηκέλνπ ζηνλ νξηζκφ ηνπ 8

17 Gal δηεπθνιχλεηαη απφ ηελ αλαβάζκηζε ηεο καζεκαηηθήο θαη εηδηθφηεξα ηεο ζηαηηζηηθήο εθπαίδεπζεο. Αιιά αθφκα θαη αλ θάπνηνο ελήιηθαο αμηνινγείηαη ζεηηθά σο πξνο ηελ ηθαλφηεηά ηνπ ζην ζηαηηζηηθφ αιθαβεηηζκφ, πνιιέο θνξέο ππάξρνπλ αξθεηέο παξαλνήζεηο ή παξεμεγήζεηο σο πξνο νξηζκέλεο έλλνηεο ηεο ζηαηηζηηθήο, φπσο ε ζεκαληηθφηεηα (significance), ε αηηηφηεηα (causality) θαη ε αθξίβεηα ησλ γξαθεκάησλ σο πξνο ηα δεδνκέλα πνπ αλαπαξηζηνχλ θαζψο θαη ησλ ζηαηηζηηθψλ αλαιχζεσλ σο πξνο ηα ζπκπεξάζκαηα πνπ εμάγνπλ (representativeness). Οη παξαλνήζεηο απηέο νθείινληαη ελ κέξεη ζηελ παξεξκελεία νξηζκέλσλ ιέμεσλ, πνπ ρξεζηκνπνηνχληαη ζηελ θαζεκεξηλή πξνθνξηθή ή γξαπηή γιψζζα, φηαλ απηέο ρξεζηκνπνηνχληαη γηα λα πεξηγξάςνπλ ή λα νξίζνπλ ζηαηηζηηθέο έλλνηεο (Lavy & Mashiach-Eizenberg, 2009). πγθεθξηκέλα: Έλα απνηέιεζκα ζηαηηζηηθψο ζεκαληηθφ δελ είλαη νπσζδήπνηε ζεκαληηθφ γηα ην επξχ θνηλφ. Ωο παξάδεηγκα ζα αλαθέξνπκε απηφ πνπ έρεη παξαηεζεί απφ ηελ Utts (2003). Πξφθεηηαη γηα κηα έξεπλα ηνπ πεξηνδηθνχ Nature γηα ην χςνο 507,124 λενζχιιεθησλ ζηξαηησηψλ, γηα ηνπο νπνίνπο ε ζηαηηζηηθή κεζνδνινγία έδεημε φηη κε κεγάιν επίπεδν ζεκαληηθφηεηαο (απηφ κπνξεί λα ζεκαίλεη ρνλδξηθά: κε πηζαλφηεηα 95% ή 99%) φηη ην χςνο γηα απηνχο πνπ έρνπλ γελλεζεί ηελ άλνημε θαη ην θζηλφπσξν, δηαθέξεη θαηά 0.6 εθαηνζηά. Απηφ ην εξεπλεηηθφ απνηέιεζκα ελδερνκέλσο λα απνηειεί έλα ζεκαληηθφ εχξεκα γηα ηνπο εηδηθνχο εξεπλεηέο πνπ αζρνινχληαη κε ηελ αλζξψπηλε αλάπηπμε, φκσο είλαη κάιινλ αδηάθνξν γηα ηελ επξχηεξε θνηλσλία. Μηα ζρέζε κε κεγάιν επίπεδν ζεκαληηθφηεηαο, δελ ζεκαίλεη νπσζδήπνηε θαη αηηηφηεηα (Imai, King & Stuart, 2008). Γηα παξάδεηγκα, αλ κειεηήζνπκε ηε ζπζρέηηζε ηνπ αξηζκνχ ησλ αηφκσλ πνπ έρνπλ θνιιήζεη κηα γξίπε ηνλ ρεηκψλα θαη ηεο θαηαλάισζεο πεηξειαίνπ ζέξκαλζεο ηελ ίδηα πεξίνδν, ελδερνκέλσο λα δηαπηζηψζνπκε φηη φζν απμάλεηαη ην έλα κέγεζνο απμάλεηαη θαη ην άιιν (ζεηηθή ζπζρέηηζε), φκσο απηφ δελ ζεκαίλεη φηη ε αχμεζε ηεο θαηαλάισζεο πεηξειαίνπ πξνθαιεί γξίπε ζηνπο αλζξψπνπο. Πξνθαλψο ε αηηηφηεηα έρεη λα θάλεη κε ην γεγνλφο φηη ην ρεηκψλα έρνπκε πνιχ ρακειέο ζεξκνθξαζίεο πνπ επλννχλ θαη ηελ απμεκέλε θαηαλάισζε πεηξειαίνπ θαη ηε δηάδνζε ηνγφλσλ αζζελεηψλ. 9

18 Σα γξαθήκαηα ζα πξέπεη λα αλαπαξηζηνχλ αμηφπηζηα ηελ πιεξνθνξία ησλ δεδνκέλσλ πνπ πεξηγξάθνπλ θαη γεληθφηεξα νη ζηαηηζηηθέο αλαιχζεηο λα παξνπζηάδνπλ κε απιφηεηα, ε νπνία λα κελ είλαη ζε βάξνο ηεο αθξίβεηαο, ηα εμαγφκελα απνηειέζκαηα (King et al., 2000). Γηα παξάδεηγκα, ζε δεκνζθνπήζεηο πξφζεζεο ςήθνπ ησλ πνιηηψλ φπσο ζην ρήκα 2, ηα νξζνγψληα πνπ αλαπαξηζηνχλ ην πνζνζηφ ππνζηήξημεο θάζε πνιηηηθνχ θφκκαηνο, πξέπεη λα έρνπλ χςνο αλάινγν κε ην πνζνζηφ ηνπο θαη βέβαηα ηελ ίδηα αθξηβψο βάζε. ε απηέο ηηο πεξηπηψζεηο ζα πξέπεη ν πνιίηεο λα έρεη ηε δπλαηφηεηα ηεο θξηηηθήο αλάγλσζεο απηψλ ησλ γξαθεκάησλ δηφηη κεξηθέο θνξέο είλαη παξαπιαλεηηθά. Σν πιενλέθηεκα φκσο ηεο παξνπζίαζεο θαη αλάιπζεο δεδνκέλσλ κέζσ γξαθεκάησλ είλαη φηη κπνξνχλ λα δψζνπλ ηε, γεληθή ηνπιάρηζηνλ, εηθφλα ηεο έξεπλαο κε ειάρηζηα γξαθήκαηα-εηθφλεο απνθεχγνληαο ηνπο, κάιινλ βαξεηνχο γηα ηνπο πεξηζζφηεξνπο πνιίηεο, αξηζκεηηθνχο ππνινγηζκνχο (Goodyear-Smith et al., 2008). Ζ αδπλακία θαηαλφεζεο θαη επίγλσζεο ησλ παξαπάλσ ελλνηψλ κπνξεί λα νδεγήζεη ζε παξαλνήζεηο, ησλ πνιηηψλ πνπ δελ έρνπλ ζεκαληηθφ καζεκαηηθφ ππφβαζξν, ησλ πεγψλ πιεξνθφξεζεο ζηαηηζηηθψλ εξεπλψλ πνπ ζπλήζσο κεηαθέξνπλ εξεπλεηηθά απνηειέζκαηα ζην επξχ θνηλφ, αιιά αθφκα θαη εξεπλεηψλ ρσξίο κεγάιε εκπεηξία ζηε ζηαηηζηηθή. ρήκα 2. 10

19 1.5 ΣΠΔ θαη ηαηηζηηθή Ζ αλάιπζε θαη επεμεξγαζία δεδνκέλσλ κέζσ ηεο ζηαηηζηηθήο κεζνδνινγίαο έρεη επεθηαζεί εθπιεθηηθά ιφγσ ηεο αλάπηπμεο ησλ ζηαηηζηηθψλ εθαξκνγψλ γηα ππνινγηζηέο. Πξηλ ηε δηάδνζε ησλ ππνινγηζηψλ νη ζηαηηζηηθέο κέζνδνη απαηηνχζαλ επίπνλνπο αξηζκεηηθνχο ππνινγηζκνχο, πνπ δελ ήηαλ πξνζηηνί ζε έλα επξχ ηκήκα ησλ πνιηηψλ. Οη δπζθνιίεο απηέο έρνπλ μεπεξαζηεί κε ηε ρξήζε ησλ ΣΠΔ. Σν θχξην κέιεκα ηνπ εξεπλεηή δελ είλαη πιένλ ε εθηέιεζε ησλ αξηζκεηηθψλ ππνινγηζκψλ αιιά ε επηινγή ηεο θαηάιιειεο ζηαηηζηηθήο κεζφδνπ γηα ην θάζε πξφβιεκα. Παξφια απηά, νη δπζθνιίεο θαηαλφεζεο θαη αμηνπνίεζεο ηεο επηζηήκεο θαη ηεο ηερλνινγίαο πνπ έρνπλ αλαθεξζεί ζηηο πξνεγνχκελεο ελφηεηεο εκθαλίδνληαη θαη ζηε ρξήζε ησλ ΣΠΔ. Αξθεηνί πνιίηεο έρνπλ δπζθνιίεο ζηελ θαηαλφεζε ηεο επηζηήκεο ηεο πιεξνθνξηθήο θαη ηεο ρξήζεο ησλ ειεθηξνληθψλ ππνινγηζηψλ ζηελ θαζεκεξηλφηεηά ηνπο θαη πνιχ πεξηζζφηεξν γηα επηζηεκνληθνχο ή εξεπλεηηθνχο ζθνπνχο. Ζ επηηπρία ηεο ρξήζεο ησλ ππνινγηζηψλ εμαξηάηαη ζε ζεκαληηθφ βαζκφ απφ ηε ζηάζε απέλαληη ζηνπο ππνινγηζηέο (computer attitude). Ωο ζηάζε απέλαληη ζηνπο ππνινγηζηέο κπνξνχκε λα νξίζνπκε ηε γεληθή αμηνιφγεζε ή ην αίζζεκα επκελνχο ή δπζκελνχο δηάζεζεο ελφο αηφκνπ απέλαληη ζηελ ηερλνινγία ησλ ππνινγηζηψλ ή ζε θάπνηεο ζπγθεθξηκέλεο δξαζηεξηφηεηεο ηνπο, φπσο γηα παξάδεηγκα ε πινήγεζε ζην Internet (Smith, Caputi & Pawstorne, 2000, ζει. 61). Οη παξάγνληεο πνπ επεξεάδνπλ ηε ζηάζε απέλαληη ζηνπο ππνινγηζηέο είλαη (Παπαπαλαγηψηνπ, 2010, ζει ): Σν θχιν, νη άληξεο έρνπλ πεξηζζφηεξν επλντθή ζηάζε απφ ηηο γπλαίθεο (Coffin & MacIntyre, 1999, ζει. 558 Durndell & Haag, 2002) Ο βαζκφο ζπζρέηηζεο ηεο βαζηθήο θαη παλεπηζηεκηαθήο εθπαίδεπζεο κε ηνπο ππνινγηζηέο Ζ θαηνρή ελφο πξνζσπηθνχ ππνινγηζηή Ζ εκπεηξία ζηνπο ππνινγηζηέο (computer experience). χκθσλα κε ηνλ Davis (1993, ζει ), αλεμάξηεηα απφ ην πφζν εμεδεηεκέλε θαη απνηειεζκαηηθή είλαη κηα ηερλνινγία, ε απνηειεζκαηηθή εθαξκνγή ηεο εμαξηάηαη 11

20 απφ ην θαηά πφζν νη ρξήζηεο έρνπλ ζεηηθή ζηάζε απέλαληί ηεο. Γηα ηνπο πεξηζζφηεξνπο ελήιηθεο νη ηξεηο πξψηνη παξάγνληεο πνπ επεξεάδνπλ ηε ζηάζε απέλαληη ζηνπο ππνινγηζηέο είλαη ζπλήζσο δεδνκέλνη. Ο ηέηαξηνο παξάγνληαο, ε εκπεηξία ζηνπο ππνινγηζηέο, ζπζρεηίδεηαη ζεηηθά κε ηε ζηάζε απέλαληη ζηνπο ππνινγηζηέο θαη αξλεηηθά κε ην άγρνο απέλαληη ηνπο. Γειαδή, φζν κεγαιχηεξε είλαη ε εκπεηξία ζηνπο ππνινγηζηέο ηφζν ζεηηθφηεξε είλαη ε ζηάζε απέλαληη ζηνπο ππνινγηζηέο θαη ηφζν κηθξφηεξν είλαη ην άγρνο απέλαληη ηνπο (Smith et al., 2000, ζει. 60 Νενθψηηζηνο, Βαιθάλνο, Γηαβξίκεο & Παπάλεο, 2010). Δπηπιένλ, ε εκπεηξία ζηνπο ππνινγηζηέο ζρεηίδεηαη άκεζα κε ηελ απφδνζή ζηε ρξήζε θαη εθκάζεζε ηνπ ππνινγηζηή. ζν πην ηθαλνπνηεηηθή είλαη ε απφδνζε ηφζν ε έληαζε ηεο ρξήζεο απμάλεηαη θαη θαη' επέθηαζε εληζρχεηαη ε απηνπεπνίζεζε ηνπ ρξήζηε θαη αληηζηξφθσο. Ζ ρξήζε ινηπφλ ηεο θαηάιιειεο ζηαηηζηηθήο εθαξκνγήο ησλ ΣΠΔ πξέπεη λα ζπλδπαζηεί κε ηε δεκηνπξγία ελφο ςεθηαθνχ πεξηβάιινληνο πνπ λα είλαη πξνζαξκνζκέλν ζηηο αλάγθεο θαη λα αμηνπνηεί ηηο δπλαηφηεηεο ηνπ ρξήζηε, ψζηε, εηδηθά γηα ηνπο ελήιηθεο, λα εληζρχεη ηε δηαζεζηκφηεηα θαη ηελ άκεζε εκπινθή ηνπο πνπ είλαη δχν πνιχ ζεκαληηθά ζηνηρεία ηα νπνία κπνξνχλ λα ζπκβάιινπλ ζηελ επηηπρή ελαζρφιεζε κε νπνηαδήπνηε καζεζηαθή δηεξγαζία (Βεξγίδεο & Καξαιήο, 2008, ζει ). Ζ δηαζεζηκφηεηα θαη ε άκεζε εκπινθή ησλ ρξεζηψλ ζα δεκηνπξγήζεη επλντθέο ζπλζήθεο γηα ηελ απφθηεζε εκπεηξίαο θαη ηε δηακφξθσζε ζεηηθήο ζηάζεο απέλαληη ζηνπο ππνινγηζηέο θαη εηδηθφηεξα ζηηο ζηαηηζηηθέο εθαξκνγέο. Αιιά αθφκα θαη εηδηθνί εξεπλεηέο αληηκεησπίδνπλ πξνβιήκαηα φρη ηφζν θαηαλφεζεο ή απνδνηηθήο ρξήζεο ηνπ ππνινγηζηή, φζν επηινγήο ηνπ θαιχηεξνπ ινγηζκηθνχ, γιψζζαο πξνγξακκαηηζκνχ ή γεληθά ςεθηαθήο εθαξκνγήο πνπ λα επηηξέπεη ηελ απνηειεζκαηηθφηεξε πξνζέγγηζε ζην εξεπλεηηθφ ηνπο αληηθείκελν. Δπνκέλσο, έρνπκε έλα επξχ θάζκα αλαγθψλ απφ ηνπο ππνςήθηνπο ρξήζηεο πνπ μεθηλνχλ απφ ηνλ απιφ πνιίηε πνπ ζέινπκε λα εμνηθεησζεί, λα θαηαλνήζεη θαη αλ είλαη δπλαηφλ λα παξάγεη εξεπλεηηθή εξγαζία, ηνπο δεκνζηνγξάθνπο θαη ζπγγξαθείο πνπ κεηαθέξνπλ ηα λέα επηζηεκνληθά επηηεχγκαηα ζηελ θνηλσλία κέζσ ησλ δηάθνξσλ πεγψλ πιεξνθφξεζεο, ηα κέιε ηεο αθαδεκατθήο θνηλφηεηαο (θνηηεηέο, θαζεγεηέο), ηνπο 12

21 decision θαη policy makers θαη ηέινο ηνπο εξεπλεηέο. Με βάζε ηα ραξαθηεξηζηηθά ηεο θάζε πεξίπησζεο ε επηινγή ηνπ θαηάιιεινπ ζηαηηζηηθνχ εξγαιείνπ ζηηο ΣΠΔ απνηειεί έλα ζέκα πξνο δηεξεχλεζε. Παξά ηα πξνβιήκαηα πνπ ζπλνδεχνπλ ηε ρξήζε ησλ ΣΠΔ, ε ζπλεηζθνξά ησλ ππνινγηζηψλ ζε νπνηνδήπνηε θιάδν ησλ καζεκαηηθψλ, φπσο ε ζηαηηζηηθή, είλαη ζεκειηψδνπο ζεκαζίαο. ε ηέηνην βαζκφ κάιηζηα πνπ ν D. Brillinger, θαζεγεηήο ηνπ ηκήκαηνο ηαηηζηηθήο ηνπ Παλεπηζηεκίνπ Berkeley ζηηο ΖΠΑ, πξνηείλεη ζηνπο λένπο θνηηεηέο ηελ αληηθαηάζηαζε ελφο κέξνπο ηεο Μαζεκαηηθήο ηνπο εθπαίδεπζεο απφ ηελ επηζηήκε ησλ Τπνινγηζηψλ. πγθεθξηκέλα, εμεγεί απηή ηελ πξνηξνπή σο εμήο (Panaretos, 2011, ζει. 467): It seems to me that learning mathematics is nowadays being replaced by learning computer science. I think it would be good for students to learn near equal amounts of each of these. Computer science lets one check out proposed methods, learn about data structures after all the data are typically in a computer and get approximate answers. Παξφια απηά ε βαζχηεξε γλψζε κπνξεί λα πξνέιζεη κφλν απφ ην ζπγθεξαζκφ ησλ δχν αληηθεηκέλσλ, ζηαηηζηηθήο θαη ππνινγηζηψλ. Σν πιενλέθηεκα ησλ γξήγνξσλ θαη αθξηβψλ απνηειεζκάησλ πνπ παξέρνπλ ηα ζηαηηζηηθά παθέηα δελ κπνξεί λα αληηθαηαζηήζεη ηελ αλάγθε γηα εξκελεία ησλ θαηαζηάζεσλ πνπ ζπλαληάκε ζε κηα ζηαηηζηηθή έξεπλα. Πάλσ ζε απηφ ην ζέκα ν θαζεγεηήο Brillinger, επηζεκαίλεη: However, I am uneasy about throwing everything in there and getting an answer without a scientific interpretation. I would like to see students come back to studying more serious mathematics. People learn a lot by just doing something and seeing what you get. That s a system identification approach where one inputs a signal and sees what comes out. I think it is a lot more rewarding to really get some understanding of why it is happening. I think learning what the thing was doing is fundamental, because then you can improve on it. Αλ ιάβνπκε ππφςε καο φια ηα παξαπάλσ νδεγνχκαζηε ζην ζπκπέξαζκα, φηη φπνην 13

22 ζηαηηζηηθφ παθέην θαη λα επηιέμνπκε είλαη απαξαίηεην λα κειεηήζνπκε θαη λα θαηαλνήζνπκε έλα ζεκαληηθφ κέξνο ηεο ζηαηηζηηθήο κεζνδνινγίαο, ψζηε λα κπνξέζνπκε φρη απιψο λα εμάγνπκε αιιά θαη λα εξκελεχζνπκε ηα απνηειέζκαηα ηνπ αληηθεηκέλνπ ηεο κειέηεο καο. Με απηή ηε θηινζνθία έρνπλ ζπληαρζεί ηα ππφινηπα θεθάιαηα ηεο παξνχζαο εξγαζίαο. 14

23 2 ηαηηζηηθή Αλάιπζε θαη Δπεμεξγαζία Δξεπλεηηθώλ Γεδνκέλσλ κε ηε Γιώζζα Πξνγξακκαηηζκνύ R ην πξνεγνχκελν θεθάιαην δηαπηζηψζακε πφζν ζεκαληηθή είλαη ε επηινγή ηεο θαηάιιειεο ςεθηαθήο εθαξκνγήο γηα ηε δηακφξθσζε επλντθήο ζηάζεο απέλαληη ζηνπο ππνινγηζηέο αιιά θαη γηα ηελ απνηειεζκαηηθή αλάιπζε θαη επεμεξγαζία δεδνκέλσλ. Πνιχ πεξηζζφηεξν φηαλ απηφ πξέπεη λα γίλεη γηα δεδνκέλα πνπ πξνέξρνληαη απφ ηελ εθπαηδεπηηθή έξεπλα. Ζ επηπιένλ δπζθνιία έγθεηηαη ζην γεγνλφο φηη απαηηνχληαη θξηηήξηα επηινγήο πνπ ζπλάδνπλ κε ηελ ηδηαηηεξφηεηα ηεο δηεπηζηεκνληθήο πξνζέγγηζεο (ζηαηηζηηθή - εθπαίδεπζε) ηεο εθπαηδεπηηθήο έξεπλαο, θαζψο θαη κε θξηηήξηα πνπ ζρεηίδνληαη κε ηνπο ηειηθνχο ρξήζηεο ηεο εθαξκνγήο, νη νπνίνη κπνξεί λα είλαη εθπαηδεπηηθνί, γνλείο ή αθφκα θαη εηδηθνί εξεπλεηέο. ε θάζε πεξίπησζε ζα πξέπεη ηα απνηειέζκαηα απηά λα είλαη έγθπξα, αμηφπηζηα θαη πξνζηηά ζηελ επξχηεξε θνηλσλία ρσξίο φκσο απηφ λα γίλεηαη ζε βάξνο ηεο επηζηεκνληθήο αθξίβεηαο θαη απζηεξφηεηαο. 2.1 Δηζαγσγή Ζ θηινζνθία ησλ ζηαηηζηηθψλ παθέησλ βαζίδεηαη ζηε δπλαηφηεηα πνπ παξέρεη ζε θάζε ρξήζηε, κέζσ πιεζψξαο εληνιψλ, γηα πνιχπινθνπο αξηζκεηηθνχο ππνινγηζκνχο, γξαθηθέο παξαζηάζεηο, καζεκαηηθή κνληεινπνίεζε θαη πξνζνκνηψζεηο. Οη εληνιέο ηεο εθαξκνγήο είηε επηιέγνληαη απφ θαηαιφγνπο (menu) είηε πιεθηξνινγνχληαη ζε κηα γξακκή εληνιψλ (command line). ηελ πξψηε πεξίπησζε έρνπκε έλα γξαθηθφ πεξηβάιινλ εξγαζίαο θαη επηθνηλσλίαο ρξήζηε - ππνινγηζηή (graphical user interface - GUI), ελψ ζηε δεχηεξε έρνπκε έλα πεξηβάιινλ κε δηεπαθή γξακκήο εληνιψλ (command line interface - CLI). Ωο παξαδείγκαηα κπνξνχκε λα αλαθέξνπκε, ην SPSS (Statistical Package for Social Sciences) πνπ ρξεζηκνπνηεί GUI θαη ην Mathematica πνπ ρξεζηκνπνηεί CLI, φπσο θαίλεηαη ζην ρήκα 3. Γεληθφηεξα, ζεσξείηαη φηη ην γξαθηθφ πεξηβάιινλ εξγαζίαο βνεζά ηνπο ρξήζηεο ρσξίο κεγάιε εκπεηξία ζηε ρξήζε 15

24 ειεθηξνληθψλ ππνινγηζηψλ πεξηζζφηεξν απφ φηη ην CLI. Δπνκέλσο ηίζεηαη ην εξψηεκα ρήκα 3. Πεξηβάιινλ εξγαζίαο ζην SPSS (επάλσ) θαη ζην Mathematica (θάησ). γηα πην ιφγν νξηζκέλεο εθαξκνγέο ρξεζηκνπνηνχλ CLI αληί γηα GUI. Οη επηινγέο πνπ παξέρνπλ ηα κελνχ κπνξεί λα είλαη εθηελείο δελ παχεη φκσο λα είλαη πεπεξαζκέλεο. Αλ ν ρξήζηεο ζέιεη λα εθηειέζεη κηα ζεηξά εληνιψλ πνπ δε ζπκπεξηιακβάλνληαη ζηα κελνχ ηφηε απηφ δελ είλαη εθηθηφ ή πινπνηείηαη πνιχ δπζθνιφηεξα απφ φηη κε CLI. Δπηπιένλ, ε εθκάζεζε ηνπ CLI αλαπηχζζεη δεμηφηεηεο ζην ρξήζηε θαη κπνξεί λα ηνπ δψζεη κηα βαζχηεξε γλψζε γηα ηε ζηαηηζηηθή έλλνηα πνπ κειεηά (Braun & Murdoch, 2007, ζει. 3). Σν δηδαθηηθφ φθεινο είλαη πνιχ κεγαιχηεξν φηαλ ν ρξήζηεο κπνξεί λα παξάγεη ηε ζεηξά 16

25 εληνιψλ πνπ απαηηείηαη γηα ηνλ ππνινγηζκφ αθφκα θαη απιψλ ζηαηηζηηθψλ ελλνηψλ, π.ρ. ηνπ κέζνπ φξνπ, απφ φηη κε ηνλ απεπζείαο ππνινγηζκφ ηνπ απφ έλα κελνχ. Τπάξρνπλ βέβαηα θαη εθαξκνγέο πνπ αθνινπζνχλ θαη ηηο δχν επηινγέο γηα ηελ εθηέιεζε εληνιψλ, φπσο ην Maxima. Σν πεξηβάιινλ εξγαζίαο ζην Maxima απεηθνλίδεηαη ζην ρήκα 4. ην αξηζηεξφ ηκήκα θαίλεηαη ην γξαθηθφ πεξηβάιινλ ζην νπνίν θάζε θνπκπί αληηζηνηρεί ζε κία εληνιή, ελψ δεμηφηεξα ε εληνιή θαη ην απνηέιεζκα ηεο εθηέιεζήο ηεο εκθαλίδεηαη ζε έλα πεξηβάιινλ γξακκήο εληνιψλ. ρήκα 4. Πεξηβάιινλ εξγαζίαο ζην Maxima. Γηα λα εθηειεζηεί φκσο νπνηαδήπνηε εληνιή πξέπεη λα πξνεγεζεί ε εηζαγσγή ησλ δεδνκέλσλ ζηελ εθαξκνγή. ηηο ςεθηαθέο εθαξκνγέο κε GUI ηα δεδνκέλα εηζάγνληαη ζηελ νζφλε εξγαζίαο ζε κνξθή ινγηζηηθνχ θχιινπ (data worksheet) φπνπ θάζε ηηκή πεξηέρεηαη ζε έλα θειί, ελψ ζηηο εθαξκνγέο κε CLI ηα δεδνκέλα εηζάγνληαη φπσο φιεο νη ππφινηπεο εληνιέο, δειαδή κέζσ ηεο γξακκήο εληνιψλ (βι. ρήκα 3). 2.2 Γεληθή επηζθόπεζε ησλ ςεθηαθώλ εθαξκνγώλ αλάιπζεο θαη επεμεξγαζίαο δεδνκέλσλ Τπάξρνπλ πνιπάξηζκεο ςεθηαθέο εθαξκνγέο πνπ αθνξνχλ ηα καζεκαηηθά θαη 17

26 εηδηθφηεξα ηε ζηαηηζηηθή (http://en.wikipedia.org/wiki/mathematical_software, Antoch, 2008 Karavasilis, Kotti, Tsitsis, Vassiliadis & Rigas, 2005). Οη Altman & Jackman (2011, ζει. 3-7) πξνηείλνπλ ηξφπνπο γηα λα βειηησζεί ε ρξεζηκφηεηα θαη απνηειεζκαηηθφηεηά ηνπο. Αθνινπζψληαο ηε γεληθή δνκή ηεο αλάιπζήο ηνπο κπνξνχκε λα δηαηππψζνπκε ηα παξαθάησ θξηηήξηα θαηαιιειφηεηαο ελφο ζηαηηζηηθνχ παθέηνπ. πγθεθξηκέλα: 1. Ζ επηινγή ηνπ θαηάιιεινπ αιγφξηζκνπ ή ππνινγηζηηθήο δηαδηθαζίαο. Σα απνηειέζκαηα θαη γεληθφηεξα ηα εμαγφκελα ελφο ζηαηηζηηθνχ παθέηνπ πξέπεη πξσηίζησο λα ζηεξίδνληαη ζηε ζρεηηθή ζηαηηζηηθή ζεσξία, ε νπνία λα αθνινπζείηαη ζαθψο απφ ηελ πξνηεηλφκελε ππνινγηζηηθή δηαδηθαζία. Δπηπιένλ, ε ιχζε πξέπεη λα είλαη ππνινγηζηηθά αθξηβήο θαη αμηφπηζηε. Ο πην πξνζηηφο ηξφπνο γηα λα πινπνηεζνχλ νη παξαπάλσ απαηηήζεηο είλαη ε ρξήζε, είηε εμ νινθιήξνπ είηε ζε κεγάιν βαζκφ, ησλ ήδε ππαξρφλησλ αιγνξίζκσλ, ζηαηηζηηθψλ ινγηζκηθψλ θαη εθαξκνζκέλσλ πξνγξακκάησλ πνπ έρνπλ δεκηνπξγεζεί ζπλήζσο απφ έκπεηξνπο θαη εμεηδηθεπκέλνπο επηζηήκνλεο θαη έρνπλ ειεγρζεί σο πξνο ηελ αμηνπηζηία ηνπο απφ πνιινχο ρξήζηεο. Γελ ππάξρεη θαλέλαο ιφγνο λα δεκηνπξγήζνπκε έλα λέν πξφγξακκα πνπ λα πινπνηεί φζα δηαζέηεη έλα απφ ηα πνιιά γλσζηά ινγηζκηθά πνπ δηαηίζεληαη ήδε θαη είλαη ελδερνκέλσο θαιχηεξν απφ ην δηθφ καο. Ζ δηθηά καο ζπκβνιή είλαη αλαγθαία κφλν φηαλ ζέινπκε λα δεκηνπξγήζνπκε θάηη πνπ δελ ππάξρεη, αιιά θαη ηφηε ν θαιχηεξνο ηξφπνο είλαη λα ρηίζνπκε ηε λέα εθαξκνγή πάλσ ζηελ πξνεγνχκελε εκπεηξία θαη γλψζε. Πνιιέο καζεκαηηθέο εθαξκνγέο πνπ δηαζέηνπλ ζηαηηζηηθά παθέηα θαζψο θαη πην εμεηδηθεπκέλα απηφλνκα ζηαηηζηηθά παθέηα αθνινπζνχλ θαηά ηελ επεμεξγαζία δεδνκέλσλ ηελ έγθπξε ζηαηηζηηθή κεζνδνινγία θαη ζεσξνχληαη αμηφπηζηα. Δλδεηθηηθά αλαθέξνπκε ηα καζεκαηηθά παθέηα Mathematica, Matlab, Maple, Mathcad, Scilab, Sage (http://www.math.fsu.edu/ Virtual/index.php?f=21) θαη ηα ακηγψο ζηαηηζηηθά SPSS, Splus, R, SAS, Stata, Microsoft Excel (http://www.amstat.org/careers/statisticalsoftware.cfm). Παξφιν πνπ ηα καζεκαηηθά ινγηζκηθά δηαζέηνπλ πιεζψξα καζεκαηηθψλ εξγαιείσλ, δελ είλαη 18

27 πιήξσο πξνζαξκνζκέλα ζηε ζηαηηζηηθή επεμεξγαζία δεδνκέλσλ. Αληηζέησο, ππεξηεξνχλ, ζε νξηζκέλεο ηνπιάρηζηνλ πεξηπηψζεηο, έλαληη ησλ ακηγψο ζηαηηζηηθψλ παθέησλ ζε πην ζπκβνιηθέο καζεκαηηθέο δηεξγαζίεο, πην γλσζηέο σο ζπκβνιηθά καζεκαηηθά (symbolic mathematics), φπσο ζπκβαίλεη κε ην Maple θαη ην ζηαηηζηηθφ παθέην mathstatica (http://www. mathstatica.com) ηνπ Mathematica. 2. Έλα πεξηβάιινλ εξγαζίαο πνπ λα είλαη θηιηθφ πξνο ην ρξήζηε θαη λα ζπκβάιιεη ζηε δηακφξθσζε ζεηηθήο ζηάζεο γηα ηε γλσξηκία θαη επαλαρξεζηκνπνίεζε ηεο ςεθηαθήο εθαξκνγήο, κε απψηεξν ζηφρν ηελ αχμεζε ηεο εκπεηξίαο θαη ηεο απνηειεζκαηηθφηεηαο ηνπ ρξήζηε. Ζ δνκή ηεο εθαξκνγήο πξέπεη λα είλαη επθξηλήο, απιή θαη θαηαλνεηή. Γηα παξάδεηγκα, κηα νζφλε εξγαζίαο ρσξηζκέλε ζε δηαθξηηνχο ηνκείο γηα: νξηζκφ θαη αλαγξαθή ησλ δεδνκέλσλ γξαθηθέο παξαζηάζεηο εθηέιεζε εληνιψλ θαη παξνπζίαζε απνηειεζκάησλ βνήζεηα ζε ελδερφκελεο απνξίεο ηνπ ρξήζηε, είλαη κηα ελδεδεηγκέλε επηινγή. Σν πεξηβάιινλ εξγαζίαο φισλ ζρεδφλ ησλ καζεκαηηθψλ θαη ζηαηηζηηθψλ εθαξκνγψλ ζηνλ ειεθηξνληθφ ππνινγηζηή απεπζχλεηαη ζε έκπεηξνπο ρξήζηεο κε εμεηδηθεπκέλεο γλψζεηο. Γηα απηφ ζπλήζσο δελ είλαη ηδηαηηέξσο θηιηθφ πξνο ην ρξήζηε πνπ δε δηαζέηεη απηά ηα ραξαθηεξηζηηθά. Σν πεξηβάιινλ εξγαζίαο απηψλ ησλ εθαξκνγψλ δηαζέηεη ζπλήζσο δχζρξεζην (π.ρ. Mathematica) ή αλχπαξθην (π.ρ. R) γξαθηθφ πεξηβάιινλ δηεπαθήο ρξήζηε-ππνινγηζηή. Δπίζεο, είλαη δηαζέζηκεο πνιπάξηζκεο δπλαηφηεηεο ζηαηηζηηθήο επεμεξγαζίαο ζε κελνχ επηινγψλ, νη νπνίεο είλαη πνιχ ρξήζηκεο γηα ηνλ εμεηδηθεπκέλν ρξήζηε αιιά κάιινλ πξνθαινχλ ζχγρπζε ζην κέζν ρξήζηε (π.ρ. SPSS) ή ιεπηνκεξέο ζπληαθηηθφ εληνιψλ πνπ απαηηεί πνιχ θαιή κειέηε ηεο ηεθκεξίσζεο (documentation) ηεο εθαξκνγήο (π.ρ. R). Ζ βειηίσζε ηεο παξαπάλσ εηθφλαο κπνξεί λα επηηεπρζεί κε ζηνρεπκέλεο επεθηάζεηο ησλ βαζηθψλ εθαξκνγψλ νη νπνίεο ζπλήζσο πινπνηνχληαη κε γξαθηθφ πεξηβάιινλ δηεπαθήο, πνπ λα είλαη πξνζαξκνζκέλεο ζηηο δεμηφηεηεο θαη αλάγθεο 19

28 ησλ ρξεζηψλ. Γηα παξάδεηγκα, νη κε-εμεηδηθεπκέλνη ζηελ πιεξνθνξηθή εθπαηδεπηηθνί-εξεπλεηέο ρξεηάδνληαη είηε κηα θαιά νξγαλσκέλε θαζνδεγνχκελε αθνινπζία βεκάησλ είηε έλα γξαθηθφ πεξηβάιινλ δηεπαθήο, γηα ζηαηηζηηθή επεμεξγαζία ζπγθεθξηκέλσλ εθπαηδεπηηθψλ αλαγθψλ πνπ λα ηνπο παξέρεη ζπλερή βνήζεηα θαη ππνδείμεηο. Σέηνηεο δπλαηφηεηεο πξνγξακκαηηζκνχ ππάξρνπλ ζηηο πεξηζζφηεξεο απφ ηηο εθαξκνγέο κε ηε δεκηνπξγία θψδηθα εληνιψλ (http://en.wikipedia.org/ wiki/category:statistical_programming_language, www. scientificweb. de/ncrunch). 3. Ζ ζσξάθηζε ηνπ παθέηνπ απέλαληη ζε ελδερφκελεο αβιεςίεο θαηά ην ζρεδηαζκφ ή ηνλ πξνγξακκαηηζκφ, δειαδή ηελ πινπνίεζή ηνπ. Οη ρξήζηεο δελ είλαη πάληα εμεηδηθεπκέλνη νχηε δηαβάδνπλ πάληα ηηο νδεγίεο ρξήζεο. Έλαο ζπλδπαζκφο ινηπφλ κηαο επηινγήο πνπ δελ πξνβιέθζεθε αξρηθά θαη κηαο κε ζπκβαηήο, κε ηηο δπλαηφηεηεο ηεο εθαξκνγήο, επηινγήο κπνξεί λα νδεγήζεη ζε δηαθνπή ηεο ιεηηνπξγίαο ή αθφκα ρεηξφηεξα ζε κε αλακελφκελα απνηειέζκαηα. Γηα παξάδεηγκα, αλ κηα κεηαβιεηή ζρεδηάζηεθε λα παίξλεη αθέξαηεο ηηκέο ηφηε ην ζηαηηζηηθφ παθέην πξέπεη λα δίλεη ζην ρξήζηε έλα κελνχ ζπγθεθξηκέλσλ επηινγψλ (π.ρ. -2, -1, 0, 1, 2) ή φηαλ απηφ δελ είλαη εθηθηφ θαη ν ρξήζηεο εηζάγεη κε-αθέξαηα δεδνκέλα, ηφηε ην ζηαηηζηηθφ παθέην πξέπεη θαηαξρήλ λα κελ δηαθφπηεηαη θαη αθνινχζσο λα πξνηείλεη κηα ιχζε ζηελ άζηνρε επηινγή ηνπ ρξήζε, π.ρ. έλα θείκελν πνπ λα δεηάεη δεδνκέλα κε αθέξαηεο ηηκέο. Άξα, ρξεηάδεηαη εμαληιεηηθφο έιεγρνο θαιήο ιεηηνπξγίαο αιιά θαη πξνηάζεηο πνπ βνεζνχλ ην ρξήζηε λα μεπεξάζεη ηα ελδερφκελα ιάζε θαη ηηο αδπλακίεο ηνπ. Ζ νκαιή ιεηηνπξγία κηαο ςεθηαθήο εθαξκνγήο γηα εθπαηδεπηηθή έξεπλα κπνξεί λα δηαζθαιηζηεί ζε κεγάιν βαζκφ αλ ζηεξηρηνχκε ζηηο ήδε ππάξρνπζεο ελζσκαησκέλεο εληνιέο ή ζπλαξηήζεηο (built-in functions) πνπ δηαζέηνπλ φιεο νη πξναλαθεξφκελεο ςεθηαθέο εθαξκνγέο, νη νπνίεο είλαη δνθηκαζκέλεο θαη ελδερνκέλσο πην αμηφπηζηεο απφ ηηο αληίζηνηρεο πνπ κπνξεί λα δεκηνπξγήζεη έλαο κεκνλσκέλνο πξνγξακκαηηζηήο. Δπηπιένλ, ε εθηελήο θαη ιεπηνκεξεηαθή βνήζεηα ησλ επηινγψλ πνπ έρεη ν ρξήζηεο απηψλ ησλ εθαξκνγψλ κπνξεί λα ζπκβάιεη ζηελ 20

29 απνηειεζκαηηθή εθαξκνγή ηνπο. 4. Θα πξέπεη ε νπνηαδήπνηε εθαξκνγή λα ειεγρζεί σο πξνο ηελ νξζφηεηα ησλ απνηειεζκάησλ πνπ παξάγεη. Έλα ζπλαθέο ζέκα είλαη ε κέηξεζε ηεο αθξίβεηαο ησλ φπνησλ απνηειεζκάησλ (McCullough, 2000). Αληίζεηα κε ηηο πεξηζζφηεξεο ςεθηαθέο εθαξκνγέο, νη νπνίεο απιψο απνηπγράλνπλ λα παξάγνπλ απνηέιεζκα φηαλ δηαθφπηνληαη ή ρξεζηκνπνηνχληαη κε αθαηάιιειν ηξφπν, ηα ζηαηηζηηθά παθέηα ζρεδφλ πάληα θαηαιήγνπλ ζε θάπνην απνηέιεζκα πνπ αλ δελ είλαη αθξηβέο, ηφηε είλαη ζπλήζσο αιεζνθαλέο. Ζ νξζφηεηα ησλ απνηειεζκάησλ κηαο εθπαηδεπηηθήο ςεθηαθήο εθαξκνγήο κπνξεί λα δηαπηζησζεί κε ηε ρξήζε δεκνζηεπκέλσλ πνζνηηθψλ ζηνηρείσλ απφ φιεο ηηο πξναλαθεξζείζεο εθαξκνγέο. Τπάξρνπλ πνιιέο δπλαηφηεηεο εηζαγσγήο δεδνκέλσλ (απφ ην πιεθηξνιφγην ή απφ θάπνην αξρείν), απφ δεκνζηεπκέλεο εξγαζίεο ή ηζηνζειίδεο πνπ δίλνπλ ηε δπλαηφηεηα αλαπαξαγσγήο ησλ επηζηεκνληθψλ επξεκάησλ (Schwab, Karrenbach & Claerbout, 2000). 5. Ζ δπλαηφηεηα ρξήζεο ηνπ ζηαηηζηηθνχ παθέηνπ απφ νπνηνλδήπνηε, ρσξίο νηθνλνκηθή επηβάξπλζε. Οη δπλαηφηεηεο πνπ ππάξρνπλ είλαη: δσξεάλ παξνρή ελφο νινθιεξσκέλνπ ειεχζεξνπ ινγηζκηθνχ ρσξίο δεκνζηνπνίεζε ηνπ θψδηθα εληνιψλ (freeware) κηα εθαξκνγή αλνηθηνχ θψδηθα (open source), ηεο νπνίαο ν θψδηθαο εληνιψλ δηαηίζεηαη ειεχζεξα ζε φζνπο ζέινπλ λα ηνλ κειεηήζνπλ, λα ηνλ ρξεζηκνπνηήζνπλ, αθφκα θαη λα ηνλ ηξνπνπνηήζνπλ (Fuggetta, 2003, ζει. 78). Ζ δεκνζηνπνίεζε ηνπ θψδηθα εληνιψλ δίλεη αθελφο ηε δπλαηφηεηα ειέγρνπ ηεο εγθπξφηεηαο ηεο εθαξκνγήο θαη αθεηέξνπ πξνζθέξεη ηδέεο, ζηνπο έκπεηξεο θπξίσο ρξήζηεο, γηα ηελ πινπνίεζε ησλ δηθψλ ηνπο εξεπλεηηθψλ ελδηαθεξφλησλ (von Krogh & Spaeth, 2007). Ζ επηινγή ηεο εθαξκνγήο αλνηθηνχ θψδηθα έρεη ην επηπιένλ πιενλέθηεκα ηεο επεθηαζηκφηεηαο κε ηελ πξνζζήθε εμεηδηθεπκέλσλ παθέησλ απφ ηνπο δεκηνπξγνχο ηεο εθαξκνγήο ή απφ νπνηνλδήπνηε άιιν ρξήζηε. Αληίζεηα, νη εκπνξηθέο εθαξκνγέο δηαηίζεληαη έλαληη ρξεκαηηθνχ πνζνχ θαη ρσξίο 21

30 θακία πξφζβαζε ζηελ θψδηθα εληνιψλ πνπ ρξεζηκνπνηήζεθε. Δπηπιένλ, κηα ελδερφκελε αλαβάζκηζε απαηηεί πξφζζεην θφζηνο. Σν πιενλέθηεκα ησλ εκπνξηθψλ εθαξκνγψλ είλαη ε ηαρεία πξνζαξκνγή ζηηο αλάγθεο ηνπ επξχηεξνπ θνηλνχ, ε νπνία δελ είλαη θαζφινπ εμαζθαιηζκέλε απφ ηηο ελαιιαθηηθέο επηινγέο πνπ παξέρνληαη δσξεάλ. Παξά ηα πιενλεθηήκαηα ησλ εκπνξηθψλ ςεθηαηθψλ εθαξκνγψλ, ηα ηειεπηαία ρξφληα δηαπηζηψλεηαη κηα ζηξνθή ησλ ρξεζηψλ ζηα ινγηζκηθά αλνηθηνχ θψδηθα (Kilamo, Hammouda, Mikkonen & Aaltonen, 2012). Οη πεξηζζφηεξεο απφ ηηο εθαξκνγέο πνπ αλαθέξζεθαλ είλαη εκπνξηθέο, δειαδή ν ηειηθφο ρξήζηεο επηβαξχλεηαη κε θφζηνο αγνξάο θαη κειινληηθψλ αλαβαζκίζεσλ. Σα καζεκαηηθά ινγηζκηθά Mathematica, Matlab, Maple, Mathcad θαζψο θαη ηα ζηαηηζηηθά παθέηα SPSS, Splus, SAS, Stata, Microsoft Excel είλαη εκπνξηθέο εθαξκνγέο, κε ηηκέο πνπ θηάλνπλ ή θαη μεπεξλνχλ ηα 1,500 πεξίπνπ (σο πεγή ρξεζηκνπνηήζεθαλ ηα site ησλ ινγηζκηθψλ). Οη ηηκέο κεηψλνληαη ζεκαληηθά φηαλ ε ρξήζε ηνπο πξννξίδεηαη γηα αθαδεκατθφ ίδξπκα ή γηα θάπνην θνηηεηή. Αληίζεηα, ηα Scilab, Sage θαη R είλαη εθαξκνγέο αλνηρηνχ θψδηθα θαη δηαλέκνληαη δσξεάλ. Σν θφζηνο απνηειεί έλα ζεκαληηθφ αλαζηαιηηθφ παξάγνληα ελαζρφιεζεο κε ηνπο ππνινγηζηέο, θπξίσο γηα ηνπο κεκνλσκέλνπο ρξήζηεο πνπ δελ έρνπλ δπλαηφηεηεο ρξεκαηνδφηεζεο ησλ επηζηεκνληθψλ ή εξεπλεηηθψλ ηνπο δξαζηεξηνηήησλ. 6. Σεθκεξίσζε ηνπ ζηαηηζηηθνχ παθέηνπ, κε θείκελα, παξαδείγκαηα θαη αληηπαξαδείγκαηα, παξαηεξήζεηο, αξρεία πνιπκέζσλ (κε ήρν, video θιπ) θαη γεληθφηεξα ελαιιαθηηθφ δηδαθηηθφ πιηθφ. ιν απηφ ην ζπλνδεπηηθφ πιηθφ είλαη ηδηαηηέξσο ρξήζηκν γηα ηνπο ρξήζηεο δηφηη απμάλεη ηελ απφδνζή ηνπο θαη πεξηνξίδεη ηα ελδερφκελα ιάζε ηνπο. Σν πιηθφ απηφ είλαη ηδηαηηέξσο θαηαηνπηζηηθφ αθφκα θαη γηα ηνπο δεκηνπξγνχο ηεο εθαξκνγήο, νη νπνίνη κεξηθέο θνξέο μερλνχλ ηηο ιεπηνκέξεηέο ηεο, φηαλ ζειήζνπλ λα θάλνπλ θάπνηα ηξνπνπνίεζε, δηφξζσζε ή αλαβάζκηζε. Δμάιινπ, φπσο επηζεκαίλεη θαη ν Knuth (1974, ζει. 327): It has often said that a person does not really understand something until he teaches it to someone else. Actually a person does not really understand 22

31 something until he can tech it to a computer, i.e., express it as an algorithm. Ζ ηεθκεξίσζε φισλ ησλ παξαπάλσ εθαξκνγψλ είλαη ηδηαηηέξσο εθηελήο θαη ρνξεγείηαη καδί κε ην πξντφλ αιιά θαη απφ έληππεο θαη ειεθηξνληθέο εθδφζεηο κεκνλσκέλσλ ρξεζηψλ, παλεπηζηεκηαθψλ ηδξπκάησλ ή εξεπλεηηθψλ θέληξσλ. Παξφια απηά ε βνήζεηα ελίνηε δελ είλαη πξνζαξκνζκέλε ζηηο ηδηαίηεξεο αλάγθεο ησλ εξεπλεηψλ εθπαηδεπηηθψλ ζεκάησλ θαη δελ είλαη πάληα πνιχ πξνζηηή, αθφκα θαη ζε έκπεηξνπο ρξήζηεο, φπσο ζπκβαίλεη θπξίσο ζηηο εθαξκνγέο αλνηθηνχ θψδηθα. 7. Δπηθνηλσλία κεηαμχ ησλ δεκηνπξγψλ θαη ησλ ρξεζηψλ ηνπ ζηαηηζηηθνχ παθέηνπ. Ζ ρξεζηκφηεηα απηήο ηεο επηθνηλσλίαο δελ έρεη κφλν ηνλ αιηξνπηζηηθφ ραξαθηήξα επίιπζεο θάπνησλ πξνβιεκάησλ ή απνξηψλ πνπ έρνπλ νη ρξήζηεο, αιιά απνηειεί νπζηψδεο εθαιηήξην βειηίσζεο ηεο εθαξκνγήο. Ζ επηθνηλσλία ησλ δεκηνπξγψλ ησλ εθαξκνγψλ κε ηνπο ρξήζηεο επηδηψθεηαη είηε σο επαγγεικαηηθή ζρέζε εηαηξείαο-πειάηε ζηηο εκπνξηθέο εθαξκνγέο, είηε δηά κέζσ fora, blogs ή mailing lists ζηα πιαίζηα ηεο αληαιιαγήο εκπεηξηψλ, απνξηψλ ή πξνηάζεσλ κεηαμχ ρξεζηψλ κε θνηλά ελδηαθέξνληα. Με βάζε ηνλ Muenchen (2012), ε R πξνεγείηαη κε πνιχ κεγάιε δηαθνξά έλαληη ησλ άιισλ ινγηζκηθψλ, ζηα ησλ discussion lists θαη ηα blogs ζην Internet. Σν ζηνηρείν απηφ είλαη έλαο δείθηεο ηνπ ελδηαθέξνληνο ησλ ρξεζηψλ γηα ηελ R πνπ ζε θάπνην βαζκφ ζπκβάιιεη ζηε βειηίσζε θαη ζηε δηάδνζή ηεο. 2.3 Αηηηνιόγεζε επηινγήο ζηαηηζηηθνύ παθέηνπ Λακβάλνληαο ππφςε ηα θξηηήξηα επηινγήο ζηαηηζηηθνχ παθέηνπ θαη ηε γεληθή επηζθφπεζε πνπ πξνεγήζεθε κπνξνχκε λα θαηαιήμνπκε ζηελ επηινγή πνπ πηνζεηνχκε ζηελ παξνχζα εξγαζία γηα ηε ζηαηηζηηθή επεμεξγαζία δεδνκέλσλ θαη πνπ είλαη ε γιψζζα πξνγξακκαηηζκνχ R (R Core Team, 2012a). Ζ R ζηεξίδεηαη ζηε γιψζζα πξνγξακκαηηζκνχ S ε νπνία δεκηνπξγήζεθε απφ ηα Bell Laboratories (πξψελ AT&T θαη ηψξα Lucent Technologies) απφ ηνλ John Chambers θαη ηνπο ζπλεξγάηεο ηνπ. Ζ R 23

32 δεκηνπξγήζεθε απφ ηνπο Ihaka θαη Gentleman ην 1996 (Ihaka & Gentleman, 1996). Δίλαη κηα δσξεάλ εθαξκνγή αλνηθηνχ θψδηθα ζε αληίζεζε κε ην Splus, ην νπνίν επίζεο βαζίδεηαη ζηελ S, αιιά είλαη εκπνξηθφ ινγηζκηθφ θαη δηαηίζεηαη απφ ηελ TIBCO Software Inc. Ζ R κπνξεί λα απνθηεζεί απφ ηελ ηζηνζειίδα ηεο ή απφ νπνηνδήπνηε mirror ηνπ CRAN (Comprehensive R Archive Network), ην νπνίν είλαη δίθηπν δηαλνκήο ζε πνιιά κέξε ηνπ θφζκνπ. Ζ R είλαη κηα γιψζζα πξνγξακκαηηζκνχ κε ελζσκαησκέλν πεξηβάιινλ, εκπινπηηζκέλν κε ζπλαξηήζεηο γηα ζηαηηζηηθνχο ππνινγηζκνχο θαη γξαθήκαηα. Σα πιενλεθηήκαηα ηεο R πνπ ηελ θαζηζηνχλ κηα πνιχ θαιή επηινγή έρνπλ αλαπηπρζεί ζηελ πξνεγνχκελε ελφηεηα θαη αλαθέξνληαη ζπλνπηηθά παξαθάησ: είλαη κηα ςεθηαθή εθαξκνγή αλνηθηνχ θψδηθα, δειαδή ην πεξηερφκελν ηεο είλαη απνηέιεζκα ηεο ζπλεηζθνξάο ηνπ R Core team (http://www.r-project.org/ contributors.html) πνπ δηαρεηξίδεηαη ηελ εμέιημε ηεο R, αιιά θαη νπνηνπδήπνηε πξνηίζεηαη λα δεκηνπξγήζεη επηπιένλ παθέηα επέθηαζεο κε θψδηθα εληνιψλ πνπ λα είλαη ζε φινπο πξνζβάζηκνο. Έηζη δηαζθαιίδεηαη ε εγθπξφηεηα ηεο ζηαηηζηηθήο κεζνδνινγίαο θαη ησλ ζρεηηθψλ ππνινγηζηηθψλ αιγνξίζκσλ δηαηίζεηαη δσξεάλ ιεηηνπξγεί ζηα ζεκαληηθφηεξα ιεηηνπξγηθά ζπζηήκαηα, φπσο Windows, Linux, MacOS πεξηέρεη ηεξάζηηα πνηθηιία ελζσκαησκέλσλ εληνιψλ γηα ζηαηηζηηθή αλάιπζε, επεμεξγαζία δεδνκέλσλ θαη γξαθηθέο παξαζηάζεηο είλαη κηα γιψζζα πξνγξακκαηηζκνχ γηα ηε δεκηνπξγία πξνγξακκάησλ πνπ απεπζχλνληαη ζηηο ηδηαίηεξεο αλάγθεο θάζε πξνγξακκαηηζηή. ε επεθηαζηκφηεηα πνπ πξνζθέξεη κε ηα πνιπάξηζκα παθέηα επέθηαζεο (packages), πνπ αλαξηψληαη ζηελ ηζηνζειίδα ηεο R (http://cran.cc.uoc.gr) θαη ηα νπνία έρνπλ απμαλφκελν ξπζκφ R θαη νη γεληθφηεξεο πξννπηηθέο πνπ αθνξνχλ ην κέιινλ ηεο είλαη επνίσλεο (Fox, 2009). ε δεκνθηιία ηεο R, ε νπνία επηβεβαηψλεηαη απφ ηνλ Muenchen (2012), ζε κηα ζεηξά απφ δείθηεο, φπσο ην Internet, data mining, ηα παθέηα επέθηαζεο (4,002 24

33 δηαζέζηκα παθέηα επέθηαζεο ζηηο 25/08/2012) ε ηζηνζειίδα ηεο ζπκπεξηιακβάλεη πιήζνο απφ πιεξνθνξίεο θαη κειέηεο πνπ ζρεηίδνληαη κε ηε ρξήζε θαη ηνλ πξνγξακκαηηζκφ ηεο R έλα πνιχ δξαζηήξην mailing list βνεζάεη αξράξηνπο θαη έκπεηξνπο ρξήζηεο ζηελ επίιπζε πξνβιεκάησλ θαη ηελ αληαιιαγή απφςεσλ ε ζπκκεηνρή ζε κηα θνηλφηεηα κε αιηξνπηζηηθά ραξαθηεξηζηηθά, φπσο ε θνηλφηεηα ησλ αηφκσλ πνπ αζρνινχληαη κε ινγηζκηθά αλνηθηνχ θψδηθα (Baytiyeh & Pfaffman, 2010). ηα κεηνλεθηήκαηα ηεο R κπνξνχκε λα θαηαρσξίζνπκε: ην πεξηβάιινλ ηεο R (R console) πνπ δηαηίζεηαη κε δηεπαθή εληνιψλ γξακκήο, ην νπνίν πξνηηκάηαη απφ ηνπο έκπεηξνπο ρξήζηεο αιιά απνζαξξχλεη ηνπο αξράξηνπο ή ηνπο ρξήζηεο κε κηθξή εκπεηξία. χκθσλα κε ην ζρεηηθφ site ηεο R (http://sciviews.org/rgui) ε δηαδηθαζία εθκάζεζεο κέζσ CLI απαηηεί ζπλήζσο πεξηζζφηεξε πξνζπάζεηα απφ φηη κέζσ GUI, φκσο ν ρξήζηεο κέζα απφ απηή ηελ πξνζπάζεηα θαηαλνεί βαζχηεξα ηελ επεμεξγαζία θαη ζηαηηζηηθή αλάιπζε ησλ δεδνκέλσλ ηνπ. Γίλνληαη δηάθνξεο πξνζπάζεηεο γηα λα μεπεξαζηεί ή έζησ λα ακβιπλζεί ε έιιεηςε GUI (Unwin, 2012 Valero-Mora & Ledesma, 2012). ε κάιινλ ζπλνπηηθή θαη ζε κεξηθέο πεξηπηψζεηο δπζλφεηε ηεθκεξίσζε ηεο R, εηδηθά γηα ηνπο κε εηδηθνχο. ν πεξηνξηζκέλνο αξηζκφο παθέησλ επέθηαζεο θαη ηεο ζρεηηθήο ηεθκεξίσζεο πνπ αθνξνχλ ηελ εθπαηδεπηηθή έξεπλα. ε ρακειή ηαρχηεηα ηεο R ζε νξηζκέλεο πεξηπηψζεηο ζηηο νπνίεο ην πιήζνο ησλ δεδνκέλσλ είλαη εμαηξεηηθά κεγάιν (Καξαβαζίιεο, Ρήγαο & Κχδξνο, 2011). πκπεξαζκαηηθά, ζα ιέγακε φηη ε R είλαη κηα εμαηξεηηθή επηινγή γηα ηελ αλάιπζε θαη επεμεξγαζία δεδνκέλσλ. Γηα ηηο αλάγθεο ηεο εθπαηδεπηηθήο έξεπλαο φκσο πξέπεη ηνπιάρηζηνλ λα πεξηνξηζηνχλ νη αξλεηηθέο επηπηψζεηο ησλ κεηνλεθηεκάησλ ηεο R. Δηδηθά γηα ηνπο πνιίηεο ρσξίο εμεηδηθεπκέλεο γλψζεηο ζηε ρξήζε ησλ ειεθηξνληθψλ 25

34 ππνινγηζηψλ κπνξνχλ λα απνβνχλ αμεπέξαζηα εκπφδηα. Γηα απηφ ν ζπλδπαζκφο ηεο R κε ηε ρξήζε GUI θαη κε εθηελή παξνπζίαζε ησλ δπλαηνηήησλ ηεο απνηειεί κηα πνιχ θαιή επηινγή γηα ηηο αλάγθεο ηεο δηπισκαηηθήο εξγαζίαο. 2.4 θνπόο θαη πξνζδνθώκελα απνηειέζκαηα ηεο δηπισκαηηθήο εξγαζίαο Ζ παξνχζα δηπισκαηηθή εξγαζία θηινδνμεί λα δεκηνπξγήζεη έλα νινθιεξσκέλν πεξηβάιινλ εξγαζίαο πνπ ζα παξέρεη ηελ απαξαίηεηε ζεσξεηηθή ηεθκεξίσζε θαη ηα θαηάιιεια ππνινγηζηηθά εξγαιεία γηα ηε ζηαηηζηηθή αλάιπζε θαη επεμεξγαζία δεδνκέλσλ, θπξίσο ζε ζέκαηα εθπαηδεπηηθήο έξεπλαο. Ηδηαίηεξε βαξχηεηα δίλεηαη ζηελ, φζν γίλεηαη, απινπνηεκέλε παξνπζίαζε ηεο ζηαηηζηηθήο κεζνδνινγίαο, θαζψο ζα απνθεπρζεί ε πεξαηηέξσ εκβάζπλζε πνπ απαηηεί πςειφ καζεκαηηθφ ππφβαζξν θαη ζηελ επεμεξγαζία δεδνκέλσλ ζηνλ ειεθηξνληθφ ππνινγηζηή κέζσ ηεο R. Οη εθαξκνγέο αλνηθηνχ θψδηθα, φπσο ε R, απνηεινχλ πιένλ κηα βαζηθή επηινγή ζην ρψξν ηεο εθπαίδεπζεο (Carmichael & Honour, 2002). Δλψ ε R ρξεζηκνπνηείηαη επξέσο γηα ηε δηδαζθαιία θαη ηελ έξεπλα ζε πνιινχο επηζηεκνληθνχο θιάδνπο (βηνινγία, νηθνλνκία, κεραληθή), δε ζπκβαίλεη θάηη αλάινγν ζηνλ εθπαηδεπηηθφ ρψξν, παξά ηηο φπνηεο εμαηξέζεηο (Adalbert, 2007). Δηδηθφηεξα, ζηελ Διιάδα ε ρξήζε ηεο R είλαη πεξηνξηζκέλε. Ζ δηπισκαηηθή εξγαζία θηινδνμεί λα πξνζθέξεη ην πιηθφ πνπ ζα δηεπθνιχλεη φινπο ηνπο ελδηαθεξφκελνπο ζηε γλσξηκία θαη ηελ πεξαηηέξσ ρξήζε ηεο R. Ζ δηπισκαηηθή εξγαζία απεπζχλεηαη ζε: πνιίηεο πνπ επηζπκνχλ λα θαηαλννχλ θαη λα αμηνινγνχλ ηα επξήκαηα ηεο επηζηεκνληθήο έξεπλαο εθπαηδεπηηθνχο θαη εθπαηδεπηηθνχο εξεπλεηέο πνπ επηπιένλ επηζπκνχλ λα νξγαλψλνπλ, δηαρεηξίδνληαη, επεμεξγάδνληαη, αλαιχνπλ, παξνπζηάζνπλ θαη ηέινο λα παξάγνπλ εθπαηδεπηηθή έξεπλα. 26

35 Γηα λα επηηεπρζνχλ νη παξαπάλσ ζηφρνη αλαπηχζζεηαη ζηα πιαίζηα ηεο δηπισκαηηθήο εξγαζίαο ελαιιαθηηθφ δηδαθηηθφ πιηθφ κε πςειφ βαζκφ δηαδξαζηηθφηεηαο. Σν πιηθφ απηφ ζπλάδεη κε ηελ εμ απνζηάζεσο εθπαίδεπζε πνπ έρεη βαζηθφ θνξέα πινπνίεζεο ζηελ Διιάδα ην Διιεληθφ Αλνηθηφ Παλεπηζηήκην. ιν ην δηδαθηηθφ πιηθφ είλαη πξνζβάζηκν ζε νπνηνλδήπνηε κέζσ ηνπ δηαδηθηπαθνχ ηφπνπ κε ηίηιν «Αλάιπζε θαη Δπεμεξγαζία Δξεπλεηηθψλ Γεδνκέλσλ κε ηελ R», ζηε δηεχζπλζε gkaravasilis/. Δηδηθφηεξα, ε κειέηε ηεο δηπισκαηηθήο εξγαζίαο ζα επηηξέςεη ζηνλ αλαγλψζηε λα: γλσξίζεη θαη λα εμνηθεησζεί κε ηε ρξήζε βαζηθψλ ελλνηψλ θαη ηερληθψλ ηεο ζηαηηζηηθήο κεζνδνινγίαο γλσξίζεη θαη λα αμηνπνηήζεη ηηο δπλαηφηεηεο θαη ην πεξηβάιινλ εξγαζίαο ηεο γιψζζαο πξνγξακκαηηζκνχ R αζρνιεζεί κε ζπγθεθξηκέλα παξαδείγκαηα απφ ην ρψξν ηεο εθπαίδεπζεο ρσξίο λα απαηηείηαη ζεκαληηθφ καζεκαηηθφ ππφβαζξν ρξεζηκνπνηεί κε απιφ θαη άκεζν ηξφπν ηηο δπλαηφηεηεο ηνπ δηαδηθηπαθνχ ηφπνπ «Αλάιπζε θαη Δπεμεξγαζία Δξεπλεηηθψλ Γεδνκέλσλ κε ηελ R». Σέινο, επηρεηξείηαη ε αμηνιφγεζε ηεο ζπλνιηθήο πξνζπάζεηαο ψζηε λα είλαη δπλαηή ε βειηίσζε ηνπ πξνζθεξφκελνπ δηδαθηηθνχ πιηθνχ. Σν εξεπλεηηθφ εξψηεκα ηεο αμηνιφγεζεο αθνξά ην πιεξνθνξηαθφ ζχζηεκα αλάιπζεο θαη επεμεξγαζίαο εξεπλεηηθψλ δεδνκέλσλ κε R. Γηεξεπλάηαη αλ ζπκβάιεη ζεηηθά ζηελ θαηαλφεζε θαη αμηνπνίεζε ηεο ζηαηηζηηθήο κεζνδνινγίαο, απφ ηελ εθπαηδεπηηθή θνηλφηεηα αιιά θαη ηελ επξχηεξε θνηλσλία. Δηδηθφηεξα, κειεηάηαη αλ κεηά ηε κειέηε ηνπ δηδαθηηθνχ πιηθνχ (ζπκβαηηθφ θαη ελαιιαθηηθφ) δηακνξθψζεθε επκελέζηεξε δηάζεζε απφ ηνπο ζπκκεηέρνληεο απέλαληη ζηε ζηαηηζηηθή κεζνδνινγία θαη ηε ρξήζε ηεο R. Δπηπιένλ, αμηνινγείηαη αλ ν δηαδηθηπαθφο ηφπνο επλνεί ηελ ελεξγή εκπινθή ησλ εθπαηδεπνκέλσλ κε ην γλσζηηθφ αληηθείκελν. 27

36 28

37 3 Δηζαγσγή ζηελ R ην θεθάιαην απηφ ζα παξνπζηάζνπκε ηηο βαζηθέο έλλνηεο, ηελ εηζαγσγή θαη επεμεξγαζία δεδνκέλσλ, ηελ εμαγσγή απνηειεζκάησλ θαη ηέινο ηηο γξαθηθέο παξαζηάζεηο πνπ πινπνηνχληαη κε ηε γιψζζα πξνγξακκαηηζκνχ R. Οη δπλαηφηεηεο ηεο R παξνπζηάδνληαη ζε δχν δηαθνξεηηθά πεξηβάιινληα εξγαζίαο, ζηε βαζηθή έθδνζε ηεο R θαη ζην RStudio. Ζ δηεπαθή γξακκήο εληνιψλ είλαη ην θνηλφ ραξαθηεξηζηηθφ ησλ δχν ςεθηαθψλ εθαξκνγψλ, φκσο ην RStudio παξέρεη επηπιένλ πιενλεθηήκαηα γηα ηελ απνδνηηθφηεξε αμηνπνίεζε ηεο R. 3.1 Η βαζηθή έθδνζε ηεο R Αξρηθά, ζα παξνπζηάζνπκε ηηο νδεγίεο εγθαηάζηαζεο ηεο βαζηθήο έθδνζεο ηεο R, ε νπνία δηαλέκεηαη ειεχζεξα απφ ην δηαδηθηπαθφ ηφπν κε δηεχζπλζε Γηα λα απνζεθεχζνπκε ην αξρείν εγθαηάζηαζεο ζηνλ ππνινγηζηή καο, επηιέγνπκε CRAN απφ ην αξηζηεξφ ηκήκα ηεο ηζηνζειίδαο θαη αθνινχζσο θάπνην απφ ηα πξνζθεξφκελα mirror sites, ελδερνκέλσο ηνπ Παλεπηζηεκίνπ ηεο Κξήηεο. Καηφπηλ, επηιέγνπκε Download R for Windows ή ηνλ αληίζηνηρν ζχλδεζκν αλ δηαζέηνπκε θάπνην άιιν ιεηηνπξγηθφ ζχζηεκα (Linux θαη MacOS X) θαη ζην επφκελν παξάζπξν install R for the first time. Σέινο, επηιέγνπκε Download R for Windows θαη απνζήθεπζε ζηνλ ππνινγηζηή καο, ηνπ αξρείνπ R win.exe. Ζ δηαδηθαζία εγθαηάζηαζεο μεθηλά κε δηπιφ αξηζηεξφ θιηθ πάλσ ζην φλνκα ηνπ παξαπάλσ αξρείνπ θαη νινθιεξψλεηαη αθνινπζψληαο ηηο αλαγξαθφκελεο ζε θάζε βήκα νδεγίεο. Δπηζεκαίλεηαη φηη, αλ ην ιεηηνπξγηθφ ζχζηεκα ηνπ ππνινγηζηή καο είλαη Windows 64bit, ηφηε κπνξνχκε λα εγθαηαζηήζνπκε θαη ηηο δχν εθδφζεηο ηεο R (32bit θαη 64bit). Αλ ην ιεηηνπξγηθφ ζχζηεκα ηνπ ππνινγηζηή καο είλαη Windows 32bit πξέπεη λα εγθαηαζηήζνπκε κφλν ηελ 32bit έθδνζε ηεο R. Γηα λα ειέγμνπκε πνηα έθδνζε ησλ Windows ρξεζηκνπνηεί ν ππνινγηζηήο 29

38 καο επηιέγνπκε Έλαξμε/Πίλαθαο Διέγρνπ/ύζηεκα ή παηάκε δεμί θιηθ πάλσ ζην εηθνλίδην Τπνινγηζηήο (ζπλήζσο βξίζθεηαη ζηελ επηθάλεηα εξγαζίαο) θαη επηιέγνπκε Ιδηόηεηεο. Γηα λα εθθηλήζνπκε ηελ R, επηιέγνπκε Έλαξμε/Όια ηα Πξνγξάκκαηα/R/R Ζ αξρηθή νζφλε ηεο R έρεη ηελ παξαθάησ κνξθή: Ζ βαζηθή έθδνζε ηεο R δηαζέηεη ηα κελνχ File, Edit, View, Misc, Packages, Windows θαη Help. ια ηα κελνχ ρξεζηκνπνηνχληαη γηα λα γίλνπλ ξπζκίζεηο ηνπ πεξηβάιινληνο ηεο βαζηθήο έθδνζεο ηεο R θαη δελ πεξηέρνπλ εληνιέο γηα ηε ζηαηηζηηθή αλάιπζε θαη επεμεξγαζία δεδνκέλσλ. ηε ζπλέρεηα ζα αλαθεξζνχκε ζε νξηζκέλεο απφ ηηο δπλαηφηεηεο πνπ παξέρνπλ απηά ηα κελνχ. Σα εηθνλίδηα ζηελ ακέζσο επφκελε απφ ηα κελνχ γξακκή, αληηζηνηρνχλ ζε θάπνηεο απφ ηηο πην ζπλεζηζκέλεο εληνιέο πνπ εκθαλίδνληαη ζε επεμεξγαζηέο θεηκέλνπ (φπσο αληηγξαθή, επηθφιιεζε, εθηχπσζε) θαη δελ θξίλεηαη ζθφπηκν λα αλαιπζνχλ πεξεηαίξσ. 3.2 Πιεξνθνξηθόο αιθαβεηηζκόο γηα ηελ R Ζ R είλαη κηα γιψζζα πξνγξακκαηηζκνχ ζηελ νπνία νη εληνιέο δηαβάδνληαη θαη 30

39 θαηφπηλ εθηεινχληαη ακέζσο. Ζ επηθνηλσλία ηνπ ρξήζηε κε ηελ R δηεμάγεηαη κέζσ ηεο θνλζφιαο ηεο R (R Console). Οη εληνιέο δίλνληαη ζε θάζε γξακκή κεηά ηελ έλδεημε > θαη ηα απνηειέζκαηά ηνπο εκθαλίδνληαη ζηελ επφκελε γξακκή κεηά ην πάηεκα ηνπ πιήθηξνπ Enter. Σα ζπζηαηηθά ζηνηρεία θάζε εληνιήο ηεο R είλαη ζπλδπαζκφο ησλ παξαθάησ εθθξαζηηθψλ κνξθψλ: αξηζκεηηθή (numeric) θεηκέλνπ (character) ινγηθή (logical) ηηο επφκελεο ππνελφηεηεο ζα παξνπζηαζηνχλ θαη νη ηξεηο παξαπάλσ κνξθέο Οη αξηζκεηηθνί ππνινγηζκνί Οη αξηζκεηηθέο πξάμεηο ζηελ R γίλνληαη κε ηε βνήζεηα ησλ ζπκβφισλ πνπ βξίζθνληαη ζηνλ παξαθάησ πίλαθα: ύκβνιν Αξηζκεηηθή πξάμε + Πξφζζεζε Αθαίξεζε * Πνιιαπιαζηαζκφο / Γηαίξεζε ^ Όςσζε ζε δχλακε %/% Αθέξαην πειίθν %% Αθέξαην ππφινηπν Αλ γηα παξάδεηγκα ζέινπκε ην απνηέιεζκα ηεο πξφζζεζεο ηνπ 3 κε ην 5, πιεθηξνινγνχκε 3+5 θαη παηάκε ην πιήθηξν Enter, δειαδή > 3+5 [Enter] ηελ επφκελε γξακκή εκθαλίδεηαη ην απνηέιεζκα ηεο πξάμεο πνπ είλαη 8. [1] 8 31

40 Ζ έλδεημε [1] δειψλεη ην πιήζνο ησλ εμαγνκέλσλ απνηειεζκάησλ, πνπ ζηελ πεξίπησζε καο είλαη κνλαδηθφ θαη ίζν κε 8. Οκνίσο (ζηα ππφινηπα παξαδείγκαηα ε εληνιή Enter ζα παξαιείπεηαη, φπνπ απηφ δε δεκηνπξγεί ζχγρπζε): > 2-7 [1] -5 > 3*8 [1] 24 > 24/3 [1] 8 Ζ δχλακε > 2^3 [1] 8 θαη γηα επηβεβαίσζε > 2*2*2 [1] ηζνχηαη κε ηελ R γξάθεηαη Αλ ζηελ αθέξαηα δηαίξεζε, δηαηξέζνπκε ην 23 κε ην 7 πξνθχπηεη πειίθν 3 θαη ππφινηπν 2. Πξάγκαηη, > 23%/%7 [1] 3 > 23%%7 [1] 2 Οη αξηζκεηηθνί ππνινγηζκνί εκπινπηίδνληαη ζηελ R κε ηε βνήζεηα νξηζκέλσλ γλσζηψλ καζεκαηηθψλ ζπλαξηήζεσλ, νη νπνίεο είλαη εγθαηεζηεκέλεο θαη κπνξνχλ λα θιεζνχλ νπνηαδήπνηε ζηηγκή απφ ην ρξήζηε. Οη πην απιέο απφ απηέο είλαη ε απφιπηε ηηκή ελφο αξηζκνχ, πνπ ζπκβνιίδεηαη κε abs, π.ρ. > abs(3) [1] 3 > abs(-3) [1] 3 θαη ε ηεηξαγσληθή ξίδα ελφο αξηζκνχ, πνπ ζπκβνιίδεηαη κε sqrt, π.ρ. > sqrt(25) [1] 5 32

41 > 2+sqrt(2) [1] Ζ R δηαζέηεη επίζεο πιεζψξα άιισλ ζπλαξηήζεσλ πνπ δηεπθνιχλνπλ ηελ επεμεξγαζία δεδνκέλσλ, φπσο ε εληνιή round γηα ηε ζηξνγγπινπνίεζε δεθαδηθψλ αξηζκψλ. Γηα παξάδεηγκα ε εληνιή > round(2+sqrt(2), digits=3) [1] ζηξνγγπινπνηεί ην απνηέιεζκα ηεο αξηζκεηηθή πξάμεο 2 2 ζε ηξία δεθαδηθά ςεθία. Αλ ν ρξήζηεο ζέιεη λα κάζεη πεξηζζφηεξα ζηνηρεία γηα θάπνηα εληνιή (π.ρ. round) αξθεί λα πιεθηξνινγήζεη >?round ή > help(round) ή απφ ην κελνχ Help λα επηιέμεη R functions (text), ζην εκθαληδφκελν πιαίζην ηεο νπνίαο λα πιεθηξνινγήζεη round θαη ζα αλνίμεη κηα ζειίδα ζην πξφγξακκα πεξηήγεζεο ηνπ Internet (φπσο ν Internet Explorer θαη ν Mozilla Firefox) κε φιεο ηηο ζρεηηθέο πιεξνθνξίεο ζηελ Αγγιηθή γιψζζα Οη εθθξάζεηο θεηκέλνπ ε νξηζκέλεο πεξηπηψζεηο επεμεξγαζίαο δεδνκέλσλ είλαη απαξαίηεηεο νη εθθξάζεηο κε πεξηερφκελν θάπνηνπο ραξαθηήξεο θεηκέλνπ, φπσο έλα γξάκκα ηεο αιθαβήηνπ, κία ή πεξηζζφηεξεο ιέμεηο. ηελ R νη εθθξάζεηο θεηκέλνπ πεξηέρνληαη κεηαμχ εηζαγσγηθψλ. πλήζε παξαδείγκαηα απνηεινχλ ε δήισζε ηνπ θχινπ ή ηνπ επαγγέικαηνο θάπνηνπ αηφκνπ. Έηζη, ην θχιν δειψλεηαη κε "male" ή "female" ελψ ην επάγγεικα π.ρ. κε "teacher", "policeman" θιπ. Ζ R δηαζέηεη εληνιέο θεηκέλνπ πνπ πεξηέρνπλ ηα γξάκκαηα ηνπ ιαηηληθνχ αιθαβήηνπ (κηθξά ή θεθαιαία) θαη ηνπο κήλεο ηνπ ρξφλνπ ζηελ αγγιηθή γιψζζα. Έηζη > letters 33

42 [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" [17] "q" "r" "s" "t" "u" "v" "w" "x" "y" "z" ή > LETTERS [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" [17] "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z" θαη > month.name [1] "January" "February" "March" "April" "May" "June" [7] "July" "August" "September" "October" "November" "December" Σν απνηέιεζκα ηεο εληνιήο month.name πεξηέρεη 12 ζηνηρεία, φζνη θαη νη κήλεο ηνπ ρξφλνπ. Ζ πξψηε γξακκή ηνπ απνηειέζκαηνο μεθηλά απφ ην κήλα "January" πνπ βξίζθεηαη κεηά απφ ην [1] θαη ηειεηψλεη ζην κήλα "June", πνπ είλαη ν έθηνο κήλαο ηνπ έηνπο. Σν [7] κπξνζηά απφ ηνλ "July" δειψλεη φηη ε αλαγξαθή ησλ κελψλ ζπλερίδεηαη απφ ηνλ έβδνκν κήλα θαη ζπλερίδεηαη κέρξη ηέινπο Οη ινγηθέο εθθξάζεηο Λνγηθή έθθξαζε ζηελ R είλαη κηα νπνηαδήπνηε έθθξαζε πνπ κπνξεί λα ραξαθηεξηζηεί αιεζήο (TRUE) ή ςεπδήο (FALSE). Οη ινγηθέο εθθξάζεηο ζπληάζζνληαη κε ηε βνήζεηα ησλ ζπκβφισλ πνπ βξίζθνληαη ζηνλ πίλαθα πνπ αθνινπζεί. ύκβνιν Αξηζκεηηθή πξάμε < Μηθξφηεξν απφ < = Μηθξφηεξν ή ίζν απφ > Μεγαιχηεξν απφ > = Μεγαιχηεξν ή ίζν απφ = = Αθξηβψο ίζν κε! = ρη ίζν κε 34

43 Γηα παξάδεηγκα, ε ινγηθή έθθξαζε «ν αξηζκφο 3 είλαη κεγαιχηεξνο απφ ηνλ αξηζκφ 1», θσδηθνπνηείηαη ζηελ R κε ηελ έθθξαζε 3>1, ε νπνία είλαη πξνθαλψο αιεζήο. > 3>1 [1] TRUE Αληίζεηα, > 2+sqrt(2)==3 [1] FALSE 3.3 Αληηθείκελα δεδνκέλσλ Δίλαη ελδεδεηγκέλν ε αλάιπζε θαη επεμεξγαζία δεδνκέλσλ ζηελ R λα δηελεξγείηαη κέζσ κεηαβιεηψλ, νη νπνίεο ζηε γιψζζα ηεο R νλνκάδνληαη αληηθείκελα δεδνκέλσλ (data objects). Έηζη, ην απνηέιεζκα ηνπ αξηζκεηηθνχ ππνινγηζκνχ 2 2 κπνξεί λα θαηαρσξεζεί ζην αληηθείκελν δεδνκέλσλ x, κέζσ ηνπ ζπκβφινπ αλάζεζεο <-, σο εμήο: x <- 2+sqrt(2) [Enter] Γηα επηβεβαίσζε πιεθηξνινγνχκε x γηα λα δνχκε ηελ ηηκή ηνπ. > x [1] Σα αληηθείκελα δεδνκέλσλ απνζεθεχνληαη ζην ρψξν εξγαζίαο (Workspace) ηεο R, ν νπνίνο δελ είλαη νξαηφο ζηε βαζηθή έθδνζε ηεο R. Γηα λα δνχκε ην πεξηερφκελφ ηνπ αξθεί λα πιεθηξνινγήζνπκε > objects() ή > ls() ή λα επηιέμνπκε απφ ην κελνχ Misc ηελ εληνιή List objects, γηα λα έρνπκε έλαλ θαηάινγν κε φια ηα αληηθείκελα δεδνκέλσλ. ηελ πεξίπησζε πνπ δελ έρνπκε θαηαρσξεκέλν θαλέλα αληηθείκελν ηφηε ε απφθξηζε ηεο R είλαη: character(0) Οη ζεκαληηθφηεξεο κνξθέο αληηθεηκέλσλ πνπ ρξεζηκνπνηεί ε R είλαη ην δηάλπζκα, ν πίλαθαο, ν παξάγνληαο θαη ην πιαίζην δεδνκέλσλ. 35

44 3.3.1 Γηαλύζκαηα Σν πην απιφ είδνο αληηθεηκέλνπ δεδνκέλσλ είλαη ην δηάλπζκα (vector). Σν δηάλπζκα είλαη έλα δηαηεηαγκέλν ζχλνιν ηηκψλ, δειαδή κία ζεηξά αξηζκψλ ή ραξαθηήξσλ θεηκέλνπ ή ινγηθψλ εθθξάζεσλ ή ζπλδπαζκφο φισλ απηψλ ησλ κνξθψλ. Αλ γηα παξάδεηγκα ζέινπκε λα εηζάγνπκε ηα αξηζκεηηθά δεδνκέλα 15, 12, 14, 11, -2 ζηελ R, ν πην εχθνινο ηξφπνο είλαη κε ηε ζπλάξηεζε c (ην αξρηθφ γξάκκα απφ ηε ιέμε concatenation, πνπ ζεκαίλεη κηα ζεηξά απφ γεγνλφηα, ηδέεο ή αληηθείκελα ηα νπνία είλαη ζπλδεδεκέλα). Έηζη, > y <- c(15, 12, 14, 11, -2) > y [1] Δπηζεκαίλεηαη φηη ηα θελά αλάκεζα ζηα θφκκαηα δελ έρνπλ θακία επίδξαζε ζηνλ νξηζκφ ηνπ y. Σν y είλαη έλα δηάλπζκα πνπ απνηειείηαη απφ αξηζκεηηθά δεδνκέλα, επνκέλσο > mode(y) [1] "numeric" Δπίζεο, ην y είλαη έλα δηάλπζκα πνπ δηαζέηεη πέληε δηαηεηαγκέλα ζηνηρεία, ή ην κήθνο (length) ηνπ δηαλχζκαηνο είλαη 5. Έηζη, > length(y) [1] 5 Σν αληηθείκελν δεδνκέλσλ ηεο κεηαβιεηήο x, πνπ νξίζηεθε παξαπάλσ, είλαη έλα δηάλπζκα κε κήθνο 1. Πξάγκαηη, > length(x) [1] 1 Γηα ην δηάλπζκα y δελ έρνπκε νξίζεη θάπνηα εηηθέηα, επνκέλσο > names(y) NULL Σν NULL παξηζηάλεη ζηελ R ην αληηθείκελν δεδνκέλσλ πνπ δελ πεξηέρεη ηίπνηα. Γηα λα εκθαλίζνπκε θάπνηα κφλν απφ ηα ζηνηρεία ελφο αληηθεηκέλνπ δεδνκέλσλ, πιεθηξνινγνχκε ην φλνκα ηνπ αληηθεηκέλνπ θαη κέζα ζηηο αγθχιεο [] θάπνηνλ αξηζκφ πνπ αληηζηνηρεί ζηε ζεηξά ηνπ ζηνηρείνπ. Γηα παξάδεηγκα, γηα λα εκθαλίζνπκε ην 36

45 δεχηεξν ζηνηρείν ηνπ y θαη ηα ηξία ηειεπηαία ζηνηρεία ηνπ y πιεθηξνινγνχκε αληίζηνηρα > y[2] [1] 12 > y[3:5] [1] Σν φξηζκα 3:5 πξνθαιεί ηε ζεηξά ησλ αξηζκψλ απφ ην 3 έσο ην 5, κε αχμεζε θαηά 1. Πξάγκαηη, > 3:5 [1] > -5:30 [1] [21] Γηα λα πξνζζέζνπκε π.ρ. ην 2 ή λα πςψζνπκε ζην ηεηξάγσλν θάζε ζηνηρείν ηνπ y, απιψο πιεθηξνινγνχκε > y+2 [1] ή > y^2 [1] Μηα άιιε δπλαηφηεηα γηα λα θαηαζθεπάδνπκε δηαλχζκαηα, εηδηθά ζηελ πεξίπησζε πνπ γίλεηαη επαλάιεςε θάπνησλ ηηκψλ, δίλεηαη κε ηε βνήζεηα ηεο ζπλάξηεζεο rep. Ζ ζπλάξηεζε rep() θαζνξίδεη πφζεο θνξέο ζα γίλεη ε επαλάιεςε θάπνησλ ηηκψλ, κε ην φξηζκα times. > rep(3, times=5) [1] > rep( c(-1,2), times=3 ) [1] Αλ θαηά ηε δηαδηθαζία πιεθηξνιφγεζεο έγηλε θάπνην ιάζνο, π.ρ. ην πέκπην ζηνηρείν ηνπ y ζέιακε λα είλαη 2, ελψ πιεθηξνινγήζακε -2, ηφηε κπνξνχκε λα επαλαιάβνπκε ηνλ νξηζκφ κε ηα ζσζηά ζηνηρεία, π.ρ. > y <- c(15, 12, 14, 11, 2) 37

46 > y [1] ή απιψο λα αληηθαηαζηήζνπκε κφλν ην πέκπην ζηνηρείν ηνπ y πνπ είλαη ιαλζαζκέλν: > y[5]=2 > y [1] Δπηπιένλ, λα επηζεκάλνπκε φηη κπνξνχκε λα ρξεζηκνπνηνχκε ηειείεο ζηελ νλνκαηνδνζία ησλ αληηθεηκέλσλ δεδνκέλσλ. Γηα παξάδεηγκα, αλ νη ηηκέο ηνπ y αληηζηνηρνχλ ζηνπο βαζκνχο πέληε καζεηψλ ζηα καζεκαηηθά, έλα θαηάιιειν φλνκα ζα ήηαλ > maths.grades <- c(15, 12, 14, 11, 2) > maths.grades [1] Δθηφο, απφ ηα αξηζκεηηθά δηαλχζκαηα κπνξνχκε λα νξίζνπκε δηαλχζκαηα ραξαθηήξσλ θεηκέλνπ ή ινγηθώλ εθθξάζεσλ. Γηα παξάδεηγκα, > gender <- c( "male", "female", "female", "male", "male" ) > gender [1] "male" "female" "female" "male" "male" > mode(gender) [1] "character" > length(gender) [1] 5 θαη > y.men <- gender=="male" Ζ ινγηθή έθθξαζε gender=="male" είλαη αιεζήο γηα φζα ζηνηρεία ηνπ δηαλχζκαηνο gender έρνπλ ηηκή ίζε κε "male". Δπνκέλσο, > y.men [1] TRUE FALSE FALSE TRUE TRUE > mode(y.men) [1] "logical" Αλ ζέινπκε λα επεμεξγαζηνχκε ζηελ R έλα αληηθείκελν δεδνκέλσλ ζε πεξηβάιινλ πνπ έρεη ηε κνξθή ινγηζηηθνχ θχιινπ, πξέπεη θαηαξρήλ λα δειψζνπκε ηη είδνπο 38

47 αληηθείκελν ζέινπκε λα θαηαζθεπάζνπκε, π.ρ. έλα δηάλπζκα x > x <-vector() ην νπνίν αξρηθά δελ πεξηέρεη θαλέλα ζηνηρείν. Δηζάγνπκε ηα ζηνηρεία ηνπ δηαλχζκαηνο κεηά ηελ εληνιή > data.entry(x) ζην παξαθάησ ινγηζηηθφ θχιιν ζηε ζηήιε κε ηίηιν x. Ζ κεηάβαζε απφ θειί ζε θειί γίλεηαη κε Enter ή κε ην πνληίθη. ηαλ νινθιεξψζνπκε ηελ εηζαγσγή ησλ ζηνηρείσλ θιείλνπκε ην παξάζπξν. Αλ ζέινπκε λα δνχκε ην λέν δηάλπζκα x ζε κνξθή ινγηζηηθνχ θχιινπ πιεθηξνινγνχκε > View(x) θαη ζα πξνθχςεη έλα λέν παξάζπξν ηεο κνξθήο: 39

48 3.3.2 Πίλαθεο Οη πίλαθεο (matrices) ρξεζηκνπνηνχληαη γηα λα δηαηάμνπκε ηηο ηηκέο ελφο αληηθεηκέλνπ δεδνκέλσλ θαηά γξακκέο θαη ζηήιεο. Τπάξρνπλ δηάθνξνη ηξφπνη γηα λα νξίζνπκε έλαλ πίλαθα. Ο πην ζπλεζηζκέλνο είλαη κέζσ ηεο εληνιήο matrix. > z <- matrix( c(1,2,3, 4,5,6), nrow = 2, ncol=3, byrow=true ) > z [,1] [,2] [,3] [1,] [2,] Σν πξψην φξηζκα c(1,2,3, 4,5,6) πεξηιακβάλεη φια ηα ζηνηρεία πνπ ζέινπκε λα ηνπνζεηήζνπκε ζηνλ πίλαθα z. Σα δχν επφκελα νξίζκαηα nrow = 2, ncol=3 θαζνξίδνπλ ηηο δηαζηάζεηο ηνπ πίλαθα, δειαδή ηνλ αξηζκφ ησλ γξακκψλ (ζηελ πεξίπησζή καο 2) θαη ηνλ αξηζκφ ησλ ζηειψλ (ζηελ πεξίπησζή καο 3). Ζ παξάκεηξνο byrow θαζνξίδεη αλ ηα πεξηερφκελα ηνπ πίλαθα ηνπνζεηεζνχλ θαηά γξακκέο. Αλ ην φξηζκα απηφ ηζνχηαη κε TRUE, φπσο ζπκβαίλεη ζην παξαπάλσ παξάδεηγκα ηφηε ηα ζηνηρεία 1,2,3 ζα ηνπνζεηεζνχλ ζηελ πξψηε γξακκή θαη ηα ζηνηρεία 4,5,6 ζα ηνπνζεηεζνχλ ζηε δεχηεξε γξακκή. Έλαο άιινο ηξφπνο ζρεκαηηζκνχ πίλαθα γίλεηαη κε ηε βνήζεηα ηεο εληνιήο rbind. πγθεθξηκέλα, δίλνπκε σο νξίζκαηα ζηελ εληνιή απηή θάζε γξακκή ηνπ πίλαθα, πνπ ζέινπκε λα ζρεκαηίζνπκε, κε ηε κνξθή δηαλχζκαηνο. Γηα ην πξνεγνχκελν παξάδεηγκα, > z <- rbind( c(1,2,3), c(4,5,6) ) > z [,1] [,2] [,3] [1,] [2,] Ο πίλαθαο z πεξηέρεη αξηζκεηηθά δεδνκέλα νπφηε > mode(z) [1] "numeric" Με ηε γλσζηή εληνιή length δίλεηαη ην ζχλνιν φισλ ησλ ζηνηρείσλ ηνπ πίλαθα, ελψ κε ηελ εληνιή dim νη δηαζηάζεηο ηνπ πίλαθα, δειαδή ην πιήζνο ησλ γξακκψλ θαη ησλ 40

49 ζηειψλ ηνπ. > length(z) [1] 6 > dim(z) [1] 2 3 Αλ ζέινπκε λα εκθαληζηεί θάπνην ζπγθεθξηκέλν ζηνηρείν ηνπ πίλαθα z πξέπεη λα θαζνξηζηεί ε γξακκή θαη ε ζηήιε ζηελ νπνία αλήθεη. Έηζη, κε > z[2,3] [1] 6 δειψλνπκε ην ζηνηρείν ηνπ πίλαθα z πνπ βξίζθεηαη ζηε δεχηεξε γξακκή (πξψην φξηζκα) θαη ζηελ ηξίηε ζηήιε (δεχηεξν φξηζκα). Δπηπιένλ, ε έλδεημε [,2] αληηζηνηρεί ζε φια ηα ζηνηρεία ηεο δεχηεξεο ζηήιεο θαη ε έλδεημε [1,] ζε φια ηα ζηνηρεία ηεο πξψηεο γξακκήο. Γειαδή, > z[,2] [1] 2 5 θαη > z[1,] [1] Γηα λα νλνκάζνπκε ηηο γξακκέο θαη ηηο ζηήιεο ελφο πίλαθα ρξεζηκνπνηνχκε ηηο εληνιέο rownames θαη colnames. Έηζη, γηα ηνλ πίλαθα z, δίλνπκε ηηο νλνκαζίεο Γ1, Γ2 γηα ηηο γξακκέο θαη 1, 2, 3 γηα ηηο ζηήιεο, σο εμήο: > rownames(z) <- c("γ1", "Γ2") > colnames(z) <- c("σ1", "Σ2", "Σ3") > z Σ1 Σ2 Σ3 Γ Γ Με παξφκνην κε ηα δηαλχζκαηα ηξφπν κπνξνχκε λα δεκηνπξγήζνπκε πίλαθεο κε ραξαθηήξεο θεηκέλνπ ή ινγηθέο εθθξάζεηο, π.ρ. κε ηελ εληνιή z>2 δειψλνπκε φηη ηα ζηνηρεία ηνπ πίλαθα z είλαη κεγαιχηεξα ηνπ 2, θάηη πνπ είλαη αιεζέο κφλν γηα νξηζκέλα απφ απηά. > z.log <- z>2 41

50 > z.log [,1] [,2] [,3] [1,] FALSE FALSE TRUE [2,] TRUE TRUE TRUE > mode(z.log) [1] "logical" Παξάγνληεο ε αξθεηέο πεξηπηψζεηο ζηελ αλάιπζε θαη επεμεξγαζία δεδνκέλσλ καο ελδηαθέξεη ε νκαδνπνίεζε ησλ ηηκψλ ελφο αληηθεηκέλνπ δεδνκέλσλ. ε απηή ηελ πεξίπησζε νη νκάδεο ηηκψλ ηνπ αληηθεηκέλνπ νλνκάδνληαη θαηεγνξίεο (levels) θαη ην αληηθείκελν δεδνκέλσλ παξάγνληαο (factor). Έηζη, ην δηάλπζκα gender κπνξεί λα γίλεη παξάγνληαο κε θαηεγνξίεο "male" θαη "female", κέζσ ηεο εληνιήο > factor(gender) [1] male female female Levels: female male ε αξηζκεηηθά δεδνκέλα έλαο παξάγνληαο κπνξεί λα θαηαζθεπαζηεί θαη κε ηελ εθαξκνγή ηεο εληνιήο cut, φπσο γηα ην δηάλπζκα > x <- c(9, 11, 9, 14, 16, 19, 17, 11, 10, 18) > x [1] Ζ εληνιή cut θαζνξίδεη ηα φξηα ησλ θαηεγνξηψλ ηνπ αληηθεηκέλνπ x, κέζσ ηνπ νξίζκαηνο breaks. > x.factor <- cut( x, breaks=c(8, 12, 16, 20) ) > x.factor [1] (8,12] (8,12] (8,12] (12,16] (12,16] (16,20] (16,20] (8,12] [9] (8,12] (16,20] Levels: (8,12] (12,16] (16,20] Σν αληηθείκελν δεδνκέλσλ x.factor είλαη πιένλ έλαο παξάγνληαο κε θαηεγνξίεο 8,12, 12,16 θαη 16,20. Απηφ ζεκαίλεη φηη φπνην ζηνηρείν ηνπ δηαλχζκαηνο x είλαη 42

51 κεγαιχηεξν απφ ην 8 θαη κηθξφηεξν ή ίζν απφ ην 12 εληάζζεηαη ζηελ πξψηε νκάδα ηηκψλ 8,12, κεγαιχηεξν απφ ην 12 θαη κηθξφηεξν ή ίζν απφ ην 16 εληάζζεηαη ζηε δεχηεξε νκάδα ηηκψλ 12,16 θαη ηέινο κεγαιχηεξν απφ ην 16 θαη κηθξφηεξν ή ίζν απφ ην 20 εληάζζεηαη ζηελ ηξίηε νκάδα ηηκψλ 16,20. Έηζη ε αθνινπζία [1] (8,12] (8,12] (8,12] (12,16] (12,16] (16,20] (16,20] (8,12] [9] (8,12] (16,20] ζεκαίλεη φηη ηα ηξία πξψηα ζηνηρεία ηνπ x, δειαδή ηα 9, 11 θαη 9 αλήθνπλ ζην 8,12, ηα επφκελα δχν, δειαδή ηα 14 θαη 16 ζην 12,16 θαη νχησ θαζεμήο Πιαίζηα δεδνκέλσλ Σα πιαίζηα δεδνκέλσλ (data frames) είλαη αληηθείκελα ζηα νπνία θάζε ζηήιε είλαη έλα δηάλπζκα ηνπ ηδίνπ κήθνπο, αιιά ελδερνκέλσο δηαθνξεηηθνχ ηχπνπ (αξηζκεηηθφ, θεηκέλνπ, ινγηθφ). Γηα λα θαηαζθεπάζνπκε έλα πιαίζην δεδνκέλσλ θαινχκε ηελ εληνιή data.frame. Γηα παξάδεηγκα, ην πιαίζην δεδνκέλσλ students πεξηέρεη 5 παξαηεξήζεηο (καζεηέο) γηα θαζεκία απφ ηηο νπνίεο θαηαγξάθνπκε ην θχιν θαη ηελ επίδνζε ζηα καζεκαηηθά. Έηζη, ε πξψηε παξαηήξεζε αληηζηνηρεί ζε έλα καζεηή κε επίδνζε 15, ε δεχηεξε ζε κηα καζήηξηα κε επίδνζε 12 θαη νχησ θαζεμήο. > students <- data.frame( gender, maths.grades ) > students gender maths.grades 1 male 15 2 female 12 3 female 14 4 male 11 5 male 2 Παξαηεξνχκε φηη ε πξψηε ζηήιε είλαη έλα δηάλπζκα ραξαθηήξσλ θεηκέλνπ, ελψ ε δεχηεξε έλα αξηζκεηηθφ δηάλπζκα. Σα δχν δηαλχζκαηα έρνπλ ίδην κήθνο, πνπ ηζνχηαη κε 5. Κάπνηεο ρξήζηκεο εληνιέο γηα ηα πιαίζηα δεδνκέλσλ είλαη νη αθφινπζεο: > length(students) 43

52 [1] 2 > dim(students) [1] 5 2 > names(students) [1] "gender" "maths.grades" Γηα λα επεμεξγαζηνχκε θάπνηα απφ ηηο ζηήιεο ηνπ students ρξεζηκνπνηνχκε ην ζχκβνιν $ θαη ην φλνκα ηεο ζηήιεο, σο εμήο: > students$maths.grades [1] Γξαθηθέο παξαζηάζεηο Μηα άιιε πνιχ ζεκαληηθή δπλαηφηεηα ηεο R, πνπ είλαη ζεκειηψδεο γηα ηε ζηαηηζηηθή, είλαη ε δεκηνπξγία γξαθηθψλ παξαζηάζεσλ. Μία απφ ηηο βαζηθφηεξεο εληνιέο γηα ηε δεκηνπξγία γξαθεκάησλ είλαη ε plot. Έηζη, αλ ζέινπκε λα θάλνπκε ηε γξαθηθή παξάζηαζε ησλ ηηκψλ ηνπ δηαλχζκαηνο maths.grades, δίλνπκε ηελ εληνιή > plot(maths.grades) κε απνηέιεζκα ε R λα δεκηνπξγήζεη απηφκαηα έλα παξάζπξν κε ην παξαγφκελν γξάθεκα (ρήκα 5). ρήκα 5. Πεξηβάιινλ εξγαζίαο ηεο R κεηά ηε δεκηνπξγία γξαθήκαηνο. 44

53 ηνλ νξηδφληην άμνλα κε ηνλ ηίηιν Index έρνπκε ηηο ηηκέο πνπ εθθξάδνπλ ηε δηάηαμε θάζε ηηκήο ηνπ maths.grades (απφ 1 έσο 5), ελψ ζηνλ θαηαθφξπθν άμνλα έρνπκε ηηο ηηκέο ηνπ δηαλχζκαηνο, ζηελ πξνθεηκέλε πεξίπησζε ηνπο βαζκνχο. Έηζη, ηα ζεκεία ηνπ γξαθήκαηνο αληηζηνηρνχλ ζηα δεχγε 1,15, 2,12, 3,14, 4,11 θαη 5,2. Ο ραξαθηήξαο κε ηνλ νπνίν ζπκβνιίδνπκε ην θάζε ζεκείν κπνξεί λα αιιάμεη κε ηελ παξάκεηξν pch, ε νπνία κπνξεί λα πάξεη νπνηαδήπνηε αθέξαηα ηηκή απφ ην κεδέλ κέρξη θαη ην 18 (πξνθαζνξηζκέλε ηηκή ην 1). ε θάζε ηηκή αληηζηνηρεί έλα δηαθνξεηηθφ ζχκβνιν. Αλ επηπιένλ ζέινπκε ηα ζεκεία ηνπ γξαθήκαηνο λα ζπλδένληαη κε επζχγξακκα ηκήκαηα, ηφηε πξέπεη λα ρξεζηκνπνηήζνπκε ην φξηζκα type="b". Ζ δπλαηφηεηα απηή ζα καο ελδηέθεξε αλ ην δηάλπζκα maths.grades πεξηείρε ηνπο πέληε βαζκνχο ελφο καζεηή ζηε δηάξθεηα κηαο ρξνληθήο πεξηφδνπ. Ζ γξακκή ζε απηή ηελ πεξίπησζε αλαπαξηζηά ηε ρξνληθή εμέιημε ηεο επίδνζεο. Σν φξηζκα lwd=5 θαζνξίδεη ην πιάηνο ηεο γξακκήο ζε 5, απφ 1 πνπ είλαη ε πξνθαζνξηζκέλε ηηκή ηεο R. Γηα λα ηξνπνπνηήζνπκε ηηο εηηθέηεο ησλ αμφλσλ εκπινπηίδνπκε ηα νξίζκαηα ηεο εληνιήο plot κε xlab="μαθητές" θαη ylab="βαθμοί". ρήκα 6. Σν γξάθεκα ηνπ δηαλχζκαηνο maths.grades κεηά απφ ηξνπνπνηήζεηο ζηηο παξακέηξνπο ηεο εληνιήο plot. 45

54 Aλ ζέινπκε λα ηξνπνπνηήζνπκε ην κέγεζνο ηεο γξακκαηνζεηξάο, ηφηε πξνζζέηνπκε cex.lab=1.5 (γηα ηηο εηηθέηεο ησλ αμφλσλ), cex.axis=1.5 (γηα ην κέγεζνο ησλ αξηζκψλ ζηνπο άμνλεο). Ζ γξακκαηνζεηξά πνπ ζα ρξεζηκνπνηήζνπκε δειψλεηαη κε ην φξηζκα family. Σειηθά, ε εληνιή > plot(maths.grades, type="b", lwd=5, xlab="μαθητές", ylab="βαθμοί", cex.lab=1.5, cex.axis=1.5, family="serif") καο δίλεη ην παξαθάησ απνηέιεζκα ηνπ ρήκαηνο 6. Οη πνιιαπιέο δπλαηφηεηεο ηεο εληνιήο plot ζα παξνπζηαζηνχλ εθηελέζηεξα ζην 5 ν θεθάιαην. Δπίζεο, ε R δηαζέηεη κηα ηεξάζηηα πνηθηιία γξαθηθψλ παξαζηάζεσλ, εθηφο απφ ηελ plot, ζηηο νπνίεο ζα αλαθεξζνχκε ζε επφκελα θεθάιαηα. 3.5 ηνηρεηώδεο πξνγξακκαηηζκόο κε ηελ R Οη εληνιέο πνπ δψζακε κέρξη ηψξα ζηελ R απνθαινχληαη θαη ζπλαξηήζεηο (functions), επεηδή δέρνληαη νξίζκαηα πνπ δηαθνξνπνηνχλ ην απνηέιεζκα ηεο εληνιήο. Γηα παξάδεηγκα, ε εληνιή plot δέρεηαη δηάθνξα νξίζκαηα γηα ην είδνο ηεο γξακκήο, ηηο εηηθέηεο ησλ αμφλσλ θαη ηε γξακκαηνζεηξά, πνπ παξάγνπλ δηαθνξεηηθφ θάζε θνξά απνηέιεζκα. Οη ζπλαξηήζεηο πνπ ρξεζηκνπνηνχληαη ζηελ R ρσξίδνληαη ζε δχν θαηεγνξίεο. Σηο ελζσκαησκέλεο ζπλαξηήζεηο (built-in functions) πνπ δηαζέηεη ε γιψζζα πξνγξακκαηηζκνχ θαη απηέο πνπ κπνξεί λα δεκηνπξγήζεη ν ρξήζηεο. Παξφιν πνπ ε R δηαζέηεη κηα επξχηαηε ζπιινγή ζηαηηζηηθψλ θπξίσο ζπλαξηήζεσλ εληνχηνηο πνιιέο θνξέο είλαη πνιχ ρξήζηκε ε δπλαηφηεηα, ν ίδηνο ν ρξήζηεο λα δεκηνπξγεί λέεο ζπλαξηήζεηο πνπ είλαη πξνζαξκνζκέλεο ζηηο δηθέο ηνπ αλάγθεο θαη πξνηηκήζεηο. Γηα λα θαηαλνήζνπκε ηνλ ηξφπν δεκηνπξγίαο θαη εθαξκνγήο ησλ ζπλαξηήζεσλ, ζα αζρνιεζνχκε κε ηελ έλλνηα ηνπ κέζνπ φξνπ θάπνησλ ηηκψλ, πνπ είλαη ίζσο ε πην ζπλεζηζκέλε ζηαηηζηηθή ζπλάξηεζε. Αο ππνζέζνπκε φηη ζέινπκε λα ππνινγίζνπκε ην κέζν φξν ησλ ηηκψλ ηνπ δηαλχζκαηνο maths.grades πνπ νξίζακε παξαπάλσ. Ζ κέζε ηηκή απηψλ ησλ ηηκψλ ππνινγίδεηαη απφ ην πειίθν ηνπ αζξνίζκαηνο ησλ ηηκψλ κε ην πιήζνο ηνπο, δειαδή ην πέληε. Δπνκέλσο, δίλεηαη απφ ηε ζρέζε 46

55 Ο κέζνο φξνο ππνινγίδεηαη ζηελ R κε ηε ζπλάξηεζε mean. > mean (maths.grades) [1] 10.8 Σν ίδην απνηέιεζκα κπνξνχκε λα επηηχρνπκε κε κηα ζπλάξηεζε πνπ ζα θαηαζθεπάζνπκε εκείο θαη ζα έρεη ην φλνκα mean.1. Ο θψδηθαο εληνιψλ ηεο ζπλάξηεζεο είλαη: > mean.1 <- function(x) [Enter] + { [Enter] + (x[1]+x[2]+x[3]+x[4]+x[5]) / 5 [Enter] + } [Enter] Με ηελ πξψηε γξακκή θαηαζθεπάδνπκε ην αληηθείκελν ηεο ζπλάξηεζεο κε φλνκα mean.1, σο κηα ζπλάξηεζε ηεο κεηαβιεηήο x θαη παηάκε Enter. Ζ R εληνπίδεη φηη δελ έρεη νινθιεξσζεί ε ζπλάξηεζε, δηφηη νη εληνιέο νπνηαζδήπνηε ζπλάξηεζεο πξέπεη λα πεξηέρνληαη κεηαμχ δχν αγθίζηξσλ { }. Γηα απηφ θαη εκθαλίδεη ζηελ επφκελε γξακκή ην + πνπ ππνδειψλεη φηη αλακέλεη απφ ην ρξήζηε λα ζπκπιεξσζνχλ νη ππφινηπεο εληνιέο ηεο ζπλάξηεζεο. Αθνινχζσο πιεθηξνινγνχκε { θαη παηάκε θαη πάιη Enter. Μεηά απφ ην + ηεο ηξίηεο γξακκήο δίλνπκε ηνλ ηχπν ηνπ κέζνπ φξνπ ησλ πέληε ηηκψλ ηεο κεηαβιεηήο x. Σν άζξνηζκα κέζα ζηελ παξέλζεζε απνηειεί ηνλ αξηζκεηή ηνπ θιάζκαηνο θαη ην 5 ηνλ παξνλνκαζηή. Σέινο, ε ζπλάξηεζε νινθιεξψλεηαη κε ην άγθηζηξν }. Αλ γηα νπνηνδήπνηε ιφγν θάλνπκε ιάζνο θαηά ηελ πιεθηξνιφγεζε ν θαιχηεξνο ηξφπνο δηφξζσζεο είλαη ε επαλάιεςε ηεο πιεθηξνιφγεζεο. Δπίζεο, ε πιεθηξνιφγεζε ζα κπνξνχζε λα γίλεη ζε κία κφλν γξακκή, σο εμήο: > mean.1 <- function(x) { (x[1]+x[2]+x[3]+x[4]+x[5]) / 5 } Με ηελ εληνιή objects() δηαπηζηψλνπκε φηη ην αληηθείκελν mean.1 έρεη πξνζηεζεί ζην Workspace. Γηα λα θαιέζνπκε ηε λέα ζπλάξηεζε λα ππνινγίζεη ηε κέζε ηηκή ηνπ δηαλχζκαηνο maths.grades πιεθηξνινγνχκε > mean.1(maths.grades) [1] 10.8 Ζ ζπλάξηεζε mean.1 είλαη θαηάιιειε γηα ηνλ ππνινγηζκφ ηεο κέζεο ηηκήο ηνπ 47

56 maths.grades, φκσο έρεη έλα βαζηθφ κεηνλέθηεκα. Τπνινγίδεη ην άζξνηζκα ησλ πξψησλ πέληε ζηνηρείσλ ηεο κεηαβιεηήο x, αθφκα θαη αλ απηή έρεη πεξηζζφηεξα ζηνηρεία. Δπηπιένλ, ν παξνλνκαζηήο ηνπ θιάζκαηνο παξακέλεη πέληε, αλεμάξηεηα απφ ην κήθνο ηνπ δηαλχζκαηνο x. Γηα παξάδεηγκα ην δηάλπζκα maths.grades.6 έρεη ηα πέληε ζηνηρεία ηνπ maths.grades θαη επηπιένλ ηνλ αξηζκφ 18. Γειαδή > maths.grades.6 <- c(15, 12, 14, 11, 2, 18) κε λέν κέζν φξν ην 12. Πξάγκαηη, > mean(maths.grades.6) [1] 12 Παξφια απηά ε ζπλάξηεζε mean.1 δίλεη ιαλζαζκέλν απνηέιεζκα πνπ πξνθχπηεη απφ ηηο πξψηεο πέληε ηηκέο ηνπ maths.grades.6. > mean.1(maths.grades.6) [1] 10.8 Γηα λα δηνξζψζνπκε ην ιάζνο θαηαζθεπάδνπκε ηε ζπλάξηεζε mean.2, σο εμήο: > mean.2 <- function(x) + { + sum(x) / length(x) + } ηε ζπλάξηεζε απηή έρνπκε αληηθαηαζηήζεη ηνλ αξηζκεηή ηνπ θιάζκαηνο κε ην άζξνηζκα φισλ ησλ ζηνηρείσλ ηεο κεηαβιεηήο x (κε ηελ εληνιή sum(x)), αλεμάξηεηα απφ ην κήθνο ηεο θαη ηνλ παξνλνκαζηή κε ην πιήζνο ησλ ζηνηρείσλ ηνπ x (κε ηελ εληνιή length(x)). Σν ζθεπηηθφ ηεο ζπλάξηεζεο mean.2 είλαη φηη αληηθαηαζηήζακε ηηο «ζηαηηθέο» εληνιέο ηεο ζπλάξηεζεο mean.1 κε ηηο «δπλακηθέο» εληνιέο ηεο ζπλάξηεζεο mean.2. Έηζη, > mean.2(maths.grades.6) [1] 12 Σν κεγάιν πιενλέθηεκα ησλ γισζζψλ πξνγξακκαηηζκνχ, φπσο ε R, είλαη ε ζηαδηαθή αλάπηπμε (incremental development). Γειαδή, κηα ζπλάξηεζε (φπσο ε mean.2) κπνξεί λα δεκηνπξγεζεί απφ ηηο ελζσκαησκέλεο ζπλαξηήζεηο ηεο R (φπσο νη sum θαη length), λα εθηειεζηεί θαη κεηά λα δεκηνπξγεζεί κία άιιε ζπλάξηεζε πνπ λα ζηεξίδεηαη ζε απηήλ θαη νχησ θαζ εμήο. Με ηνλ ηξφπν απηφλ απινπνηείηαη ν θψδηθαο 48

57 εληνιψλ ησλ λέσλ ζπλαξηήζεσλ θαη έηζη κπνξνχκε λα επεμεξγαζηνχκε κε ζρεηηθή επθνιία πην πνιχπινθεο ζπλαξηήζεηο. Οινθιεξψλνληαο ηηο θαηαζθεπέο ησλ ζπλαξηήζεσλ γηα ηνλ ππνινγηζκφ ηεο κέζεο ηηκήο ησλ ζπλαξηήζεσλ ζέινπκε λα δηαγξάςνπκε ηηο ζπλαξηήζεηο mean.1 θαη mean.2 απφ ην Workspace, ψζηε λα ρξεζηκνπνηνχκε κφλν ηελ εληνιή mean. Απηφ γίλεηαη κε ηελ εληνιή > rm(mean.1, mean.2) 3.6 RStudio Σν RStudio είλαη κηα εθαξκνγή αλνηθηνχ θψδηθα πνπ δηαλέκεηαη δσξεάλ. Σν RStudio είλαη έλα νινθιεξσκέλν πεξηβάιινλ αλάπηπμεο (Integrated Devepopment Enviroment - IDE) ηεο R (Verzani, 2011). Γηαλέκεηαη ειεχζεξα απφ ηελ ηζηνζειίδα ηνπ, ζηε δηεχζπλζε Αξρηθά, ζα δψζνπκε ηηο νδεγίεο εγθαηάζηαζεο θαη ιεηηνπξγίαο ηνπ RStudio. Δπηζεκαίλνπκε φηη, γηα ηελ θαλνληθή ιεηηνπξγία ηνπ RStudio είλαη απαξαίηεηε ε εγθαηάζηαζε ηεο βαζηθήο έθδνζεο ηεο R ( ή νπνηαδήπνηε λεψηεξε απφ απηή). Γηα λα απνζεθεχζνπκε ην αξρείν εγθαηάζηαζεο ζηνλ ππνινγηζηή, επηιέγνπκε Download RStudio (ζην άλσ δεμί ηκήκα ηεο ηζηνζειίδαο) θαη αθνινχζσο Download RStudio Desktop. Καηφπηλ, απνζεθεχνπκε ην αξρείν Recommended For Your System ζηνλ ππνινγηζηή καο (RStudio exe Windows XP/Vista/7). Ζ δηαδηθαζία εγθαηάζηαζεο μεθηλά κε δηπιφ αξηζηεξφ θιηθ πάλσ ζην φλνκα ηνπ παξαπάλσ αξρείνπ θαη νινθιεξψλεηαη αθνινπζψληαο ηηο αλαγξαθφκελεο ζε θάζε βήκα νδεγίεο. Ζ δηαδηθαζία εγθαηάζηαζεο πεξηγξάθεηαη αλαιπηηθά κε θείκελν θαη δχν βηληενδηαιέμεηο ζηε δηεχζπλζε Γηα λα εθθηλήζνπκε ην RStudio ζην ιεηηνπξγηθφ ζχζηεκα ησλ Windows, επηιέγνπκε Έλαξμε/Όια ηα Πξνγξάκκαηα/RStudio/RStudio. Ζ αξρηθή νζφλε ηεο έθδνζεο , έρεη πεξίπνπ ηελ παξαθάησ κνξθή: 49

58 Σν RStudio δηαζέηεη ηα κελνχ File, Edit, View, Project, Workspace, Plots, Tools θαη Help. ια ηα κελνχ ρξεζηκνπνηνχληαη γηα λα γίλνπλ ξπζκίζεηο ηνπ πεξηβάιινληνο εξγαζίαο ηνπ RStudio θαη δελ πεξηέρνπλ εληνιέο γηα ηε ζηαηηζηηθή αλάιπζε θαη επεμεξγαζία δεδνκέλσλ. ηε ζπλέρεηα ζα αλαθεξζνχκε ζε νξηζκέλεο απφ ηηο δπλαηφηεηεο πνπ παξέρνπλ απηά ηα κελνχ. ιεο νη εληνιέο ηεο R πνπ παξνπζηάζηεθαλ ζηηο πξνεγνχκελεο ελφηεηεο κπνξνχλ λα ρξεζηκνπνηεζνχλ ζηελ θνλζφια ηνπ RStudio, ζην αξηζηεξφ νξζνγψλην πιαίζην ηεο νζφλεο (Console), φπσο αθξηβψο ρξεζηκνπνηνχληαη θαη ζηελ θνλζφια ηεο βαζηθήο έθδνζεο ηεο R. Σν δεμί ηκήκα ηεο νζφλεο είλαη ρσξηζκέλν ζε δχν νκάδεο παξαζχξσλ. ην πιαίζην πνπ βξίζθεηαη άλσ δεμηά έρνπκε ηνλ θαηάινγν αληηθεηκέλσλ ηεο R, δειαδή ην Workspace, έλαλ θαηάινγν κε ηηο ηειεπηαίεο εληνιέο ηηο νπνίεο πιεθηξνινγήζακε ζηελ θνλζφια (History) θαη έλα πιαίζην γηα ηελ εκθάληζε ησλ γξαθεκάησλ (Plots). ην πιαίζην πνπ βξίζθεηαη θάησ δεμηά παξαηεξνχκε ην παξάζπξν κε ηα αξρεία πνπ δεκηνπξγεί ν ρξήζηεο (Files), ηνλ θαηάινγν ησλ εγθαηεζηεκέλσλ παθέησλ (Packages) πνπ ζα αλαιχζνπκε ζηελ επφκελε ελφηεηα θαη ηε βνήζεηα ηεο εθαξκνγήο (Help). Ζ παξνπζίαζε ησλ δπλαηνηήησλ θαη ιεηηνπξγηψλ ηνπ RStudio πνπ αθνινπζεί ζα ρξεζηκνπνηεί ηελ παξαπάλσ δηάηαμε. Ζ δηάηαμε ησλ παξαζχξσλ απηψλ κπνξεί λα ηξνπνπνηεζεί απφ ηελ επηινγή Options ζην κελνχ Tools. ηε ζπλέρεηα επηιέγνληαο Pane 50

59 Layout κπνξνχκε λα δηακνξθψζνπκε ην πεξηβάιινλ πνπ καο ηαηξηάδεη. Σν RStudio, φπσο θαη ε βαζηθή έθδνζε ηεο R, δελ έρεη θάπνην κελνχ εληνιψλ πνπ ζα δηεπθφιπλε ηελ αλάιπζε θαη επεμεξγαζία δεδνκέλσλ, δηαζέηεη φκσο έλα πεξηβάιινλ κε φιεο ηηο βαζηθέο ιεηηνπξγίεο ηεο R πνπ επηηξέπνπλ ηνλ εχθνιν ρεηξηζκφ ησλ δεδνκέλσλ, ησλ ζπλαξηήζεσλ θαη ησλ απνηειεζκάησλ ηνπο. Έλα απφ ηα πιενλεθηήκαηα ηνπ RStudio ζε ζρέζε κε ηε βαζηθή έθδνζε ηεο R είλαη ε δεκηνπξγία θαη ε επεμεξγαζία ηνπ θψδηθα εληνιψλ ησλ ζπλαξηήζεσλ. Έρνπκε ήδε αλαθέξεη φηη ε δεκηνπξγία κηαο ζπλάξηεζεο πινπνηείηαη ζηελ θνλζφια ηεο βαζηθήο έθδνζεο ηεο R, ελψ ε επεμεξγαζία ηεο κπνξεί λα γίλεη κε ηνλ ελζσκαησκέλν editor πνπ δηαζέηεη. Παξφια απηά, ε δεκηνπξγία θαη θπξίσο ε επεμεξγαζία ζπλαξηήζεσλ κε ην RStudio είλαη πνιχ πην εχρξεζηε θαη ιεηηνπξγηθή. Καη αξρήλ, επηιέγνπκε ηνλ θαηάινγν εξγαζίαο (working directory), απφ ην κελνχ Tools, ηελ επηινγή Options θαη ηελ ελφηεηα R General, π.ρ. C:/Program Files/R/R_HOU θαη παηάκε ην OK, φπσο θαίλεηαη ζην παξαθάησ ζρήκα: Γηα λα επηβεβαηψζνπκε φηη απνζεθεχηεθε ν επηζπκεηφο θαηάινγνο εξγαζίαο, πιεθηξνινγνχκε ζηελ θνλζφια: > getwd() [1] "C:/Program Files/R/R_HOU" 51

60 Ο θαηάινγνο εξγαζίαο είλαη έλαο θάθεινο ζηνλ νπνίν απνζεθεχεηαη φιεο νη εξγαζίεο ηνπ ρξήζηε. Σν Workspace, κε φια ηα αληηθείκελα δεδνκέλσλ, ην ηζηνξηθφ ησλ εληνιψλ πνπ δφζεθαλ ζηελ θνλζφια θαη φια ηα αξρεία πνπ πεξηέρνπλ ζπλαξηήζεηο ή γξαθήκαηα. Γηα απηφ θαη φηαλ θιείλνπκε ην RStudio απνζεθεχνπκε ηηο εξγαζίεο καο απαληψληαο θαηαθαηηθά ζην ζρεηηθφ κήλπκα: Γηα λα δεκηνπξγήζνπκε ηελ πξψηε καο ζπλάξηεζε κε ην RStudio, επηιέγνπκε File/New/R Script θαη εκθαλίδεηαη κία θελή ζειίδα ζην αξηζηεξφ ηκήκα ηεο νζφλεο ζηελ νπνία θαηαρσξνχκε ηνλ θψδηθα εληνιψλ ηεο ζπλάξηεζεο. Γηα παξάδεηγκα, ε ζπλάξηεζε example.sum, πνπ ππνινγίδεη ην άζξνηζκα ησλ ζηνηρείσλ ηνπ δηαλχζκαηνο x αθνχ πξψηα αθαηξεζεί απφ απηά ε κέζε ηνπο ηηκή mean(x). example.sum <- function(x) { sum( x-mean(x) ) } Έηζη, γηα ην δηάλπζκα maths.grades ε εληνιή x-mean(x) ππνινγίδεη ηηο δηαθνξέο , , , , , πνπ έρνπλ άζξνηζκα κεδέλ. Πξαγκαηηθά, Ζ ρξεζηκφηεηα ηεο ζπλάξηεζεο example.sum έγθεηηαη ζηε δπλαηφηεηα λα εθαξκφζνπκε απηή ηε δηαδηθαζία φρη κφλν γηα ην δηάλπζκα maths.grades, αιιά γηα νπνηνδήπνηε δηάλπζκα ηεζεί ζηε ζέζε ηνπ x, ρσξίο λα επαλαιακβάλνπκε θάζε θνξά ηνλ θψδηθα εληνιψλ ηεο ζπλάξηεζεο. Πξνθαλψο ε ρξεζηκφηεηα απηή γηα νπνηαδήπνηε ζπλάξηεζε απμάλεηαη θαζψο απμάλεηαη ε έθηαζε θαη θπξίσο ε πνιππινθφηεηα ηνπ θψδηθα εληνιψλ. 52

61 Γηα λα απνζεθεχζνπκε θαη θαηφπηλ λα εθηειέζνπκε ηελ παξαπάλσ ζπλάξηεζε επηιέγνπκε ην πιαίζην Source on Save θαη κεηά ηε δηζθέηα πνπ βξίζθεηαη ιίγν πην αξηζηεξά. ην παξάζπξν πνπ αλνίγεη εκθαλίδνληαη ηα πεξηερφκελα ηνπ working directory, ζην νπνίν ην RStudio πξνηείλεη λα απνζεθεχζνπκε ην αξρείν καο. Πιεθηξνινγνχκε ην φλνκα ηνπ αξρείνπ πνπ επηζπκνχκε ζην ζρεηηθφ πιαίζην θαη κεηά παηάκε ην θνπκπί Απνζήθεπζε, ψζηε λα νινθιεξσζεί ε απνζήθεπζε ηνπ αξρείνπ ζην working directory, π.ρ. example_sum (ηνλίδεηαη φηη ζην φλνκα ηνπ αξρείνπ δελ ρξεζηκνπνηνχκε ηειείεο). Απηφ πξνθαιεί ηελ εκθάληζε ζηελ θνλζφια ηεο εληνιήο > source('c:/program Files/R/R_HOU/example_sum.R') θαη ηνπ νλφκαηνο ηεο ζπλάξηεζεο ζην Workspace. Δπίζεο, ζην παξάζπξν κε ηίηιν Files εκθαλίδεηαη ην φλνκα ηνπ αξρείνπ κε ηελ πξνζζήθε ηεο επέθηαζεο.r, δειαδή example_sum.r. Ζ δεκηνπξγία ηεο ζπλάξηεζεο έρεη νινθιεξσζεί θαη απνκέλεη ε εθηέιεζε ηεο, πνπ κπνξεί λα γίλεη κε ηελ εληνιή (ζηελ θνλζφια) > example.sum(x=maths.grades) [1] e-15 Με ηελ εληνιή απηή δεηάκε ηελ εθηέιεζε ηεο ζπλάξηεζεο example.sum, αλ ζηε ζέζε ηνπ x αληηθαηαζηήζνπκε ην δηάλπζκα maths.grades. Σν απνηέιεζκα είλαη θαη δίλεηαη ιφγσ ηεο έθηαζεο ηνπ ζηε ιεγφκελε εθζεηηθή κνξθή αξηζκψλ, δειαδή Σν απνηέιεζκα είλαη αλαπάληερν, δηφηη γλσξίδνπκε εθ ησλ πξνηέξσλ φηη ε ζσζηή ηηκή είλαη ην κεδέλ. Παξφια απηά, επεηδή ην απνηέιεζκα παξνπζηάδεη ειάρηζηε απφθιηζε απφ ην κεδέλ, δελ επεξεάδεη ηελ εμαγσγή ζπκπεξαζκάησλ. Ζ εμήγεζε απηήο ηεο απφθιηζεο νθείιεηαη ζηνλ ηξφπν απνζήθεπζεο ησλ αξηζκψλ απφ ηνπο ππνινγηζηέο θαη δελ είλαη αζχλεζεο θαηλφκελν (Braun & Murdoch 2007, ζει. 9-11). Γηα παξάδεηγκα > [1] e-17 Αλ ζειήζνπκε λα ηξνπνπνηήζνπκε θάπνηεο απφ ηηο εληνιέο ηεο ζπλάξηεζεο example.sum, π.ρ. example.sum <- function(x) 53

62 { plot ( x-mean(x) ) } επεκβαίλνπκε ζην αλνηθηφ αξρείν θαη επαλαιακβάλνπκε ηε δηαδηθαζία. Απνζεθεχνπκε ην αξρείν κε ην πάηεκα ηεο δηζθέηαο θαη πιεθηξνινγνχκε ζηελ θνλζφια: > example.sum(maths.grades) Σν απνηέιεζκα πιένλ είλαη έλα γξάθεκα ησλ δηαθνξψλ x-mean(x), πνπ εκθαλίδεηαη ζηελ ελφηεηα Plots (ρήκα 7). ρήκα 7. Γξάθεκα ησλ δηαθνξψλ x-mean(x), πνπ δεκηνπξγήζεθε κε ηελ εθηέιεζε ηεο ζπλάξηεζεο example.sum. Αλ ζέινπκε λα απνζεθεχζνπκε ην γξάθεκα γηα κειινληηθή ρξήζε ή γηα λα ην ελζσκαηψζνπκε ζε έλα αξρείνπ θεηκέλνπ, επηιέγνπκε Export θαη Save Plot as Image ή Save Plot as PDF. ε θάζε πεξίπησζε εκθαλίδεηαη έλα παξάζπξν κε ηα πεξηερφκελα ηνπ working directory γηα λα επηιέμνπκε ηηο δηαζηάζεηο ηνπ γξαθήκαηνο, ηνλ ηχπν ηεο εηθφλαο (Image format) θαη ην φλνκα ηνπ αξρείνπ. Μεηά ηελ νινθιήξσζε ηεο απνζήθεπζεο ην φλνκα ηνπ αξρείνπ εκθαλίδεηαη ζην παξάζπξν Files. Σέινο, αλ ζέινπκε λα επεμεξγαζηνχκε ηε ζπλάξηεζε ζε κηα επφκελε είζνδν ζην RStudio, αξθεί ε επηινγή 54

63 ηνπ αληίζηνηρνπ αξρείνπ απφ ην παξάζπξν Files (κε αξηζηεξφ θιηθ πάλσ ζην φλνκά ηνπ αξρείνπ) γηα λα εκθαληζηεί ν θψδηθαο εληνιψλ ζην άλσ αξηζηεξά πιαίζην ηνπ RStudio. 3.7 Παθέηα επέθηαζεο: εγθαηάζηαζε θαη ελεξγνπνίεζε ηαλ εγθαζίζηαηαη ε R ζε έλαλ ππνινγηζηή ελεξγνπνηνχληαη απηφκαηα νξηζκέλα παθέηα (packages), πνπ πεξηέρνπλ ηηο βαζηθφηεξεο εληνιέο γηα ηελ αλάιπζε θαη επεμεξγαζία δεδνκέλσλ. Σα παθέηα είλαη ζπιινγέο ζπλαξηήζεσλ θαη δεδνκέλσλ ηα νπνία έρνπλ ζπλήζσο θάπνην θνηλφ ζεκείν αλαθνξάο, φπσο γηα παξάδεηγκα ην παθέην graphics πνπ πξνζαλαηνιίδεηαη ζηε δεκηνπξγία γξαθηθψλ παξαζηάζεσλ. Μπνξνχκε λα δνχκε ηα παθέηα απηά αλ πιεθηξνινγήζνπκε > search() [1] ".GlobalEnv" "package:stats" "package:graphics" [4] "package:grdevices" "package:utils" "package:datasets" [7] "package:methods" "Autoloads" "package:base" Τπάξρνπλ φκσο ζπλαξηήζεηο ηεο R νη νπνίεο παξφιν πνπ είλαη πνιχ ρξήζηκεο αλήθνπλ ζε θάπνην παθέην πνπ δελ ελεξγνπνηείηαη αξρηθά θαη απαηηείηαη κηα επηπιένλ δηαδηθαζία γηα ηελ ελεξγνπνίεζή ηνπ. Θα δψζνπκε ηψξα ηηο απαξαίηεηεο νδεγίεο γηα ηελ εγθαηάζηαζε θαη ελεξγνπνίεζε ησλ παθέησλ επέθηαζεο δπλαηνηήησλ (π.ρ. TeachingDemos, pmg, Rcmdr θαη άιια) ζηε βαζηθή έθδνζε ηεο R θαη ζην RStudiν, ζε ππνινγηζηέο πνπ δηαζέηνπλ ην ιεηηνπξγηθφ ζχζηεκα ησλ Windows. Δπηζεκαίλεηαη φηη νη νδεγίεο απηέο κπνξεί λα ρξεηάδνληαη, θαηά ηελ εθαξκνγή ηνπο ζε θάπνην ππνινγηζηή, κηθξέο θαη ζπλήζσο πξνθαλείο ηξνπνπνηήζεηο ιφγσ ησλ δηαθνξεηηθψλ εθδφζεσλ ησλ Windows πνπ θπθινθνξνχλ. Απαξαίηεηεο πξνυπνζέζεηο ζε θάζε πεξίπησζε απνηεινχλ: ε ζχλδεζε ηνπ ππνινγηζηή κε ην Internet θαη νη ξπζκίζεηο ειέγρνπ ινγαξηαζκνχ ρξήζηε. Ζ ξχζκηζε γίλεηαη απφ ηελ αθνινπζία επηινγψλ: Έλαξμε\Πίλαθαο Διέγρνπ\Όια ηα ζηνηρεία ηνπ Πίλαθα Διέγρνπ\Λνγαξηαζκνί ρξεζηώλ θαη Αλλαγή ρυθμίζεων ελέγχου λογαριαζμού χρήζηη, ζην νπνίν επηιέγνπκε Να μην ειδοποιούμαι ποηέ (φηαλ επηρεηξνχληαη αιιαγέο ζηνλ ππνινγηζηή καο απφ πηζαλψο επηβιαβή πξνγξάκκαηα), ελλνψληαο 55

64 φηη δελ ζα έρνπκε κήλπκα πξνεηδνπνίεζεο ζηελ νζφλε καο, φηαλ επηρεηξνχκε λα εγθαηαζηήζνπκε έλα ινγηζκηθφ ή κηα εθαξκνγή ζηνλ ππνινγηζηή καο, ζπλήζσο απφ ην Internet. Καηφπηλ θάλνπκε επαλεθθίλεζε ηνπ ππνινγηζηή καο θαη αλνίγνπκε ηε βαζηθή έθδνζε ηεο R ή ην RStudio. Ζ ιεηηνπξγία ησλ παθέησλ κπνξεί λα γίλεη είηε κε ηε βαζηθή έθδνζε ηεο R είηε κε ην RStudio. Παξαθάησ ζα δνζνχλ φια ηα βήκαηα πνπ απαηηνχληαη γηα ηε ιεηηνπξγία ηνπο θαη ζηηο δχν πεξηπηψζεηο. Βαζηθή έθδνζε ηεο R. Μεηά ηελ έλαξμε ηεο R, απφ ην κελνχ Packages επηιέγνπκε Install package(s) θαη απφ ην εκθαληδφκελν παξάζπξν κε ηίηιν CRAN mirror, επηιέγνπκε θάπνην απφ ηα mirror sites ηεο R ζε δηάθνξεο ρψξεο ηνπ θφζκνπ, γηα παξάδεηγκα ηεο Διιάδαο (Greece) θαη παηάκε ην θνπκπί OK. ην επφκελν παξάζπξν κε ηίηιν Packages αλαδεηνχκε νπνηνδήπνηε παθέην επηζπκνχκε (π.ρ. ην TeachingDemos), ην επηιέγνπκε κε αξηζηεξφ θιηθ θαη παηάκε ην θνπκπί OK. Απηφκαηα, ζα εθθηλήζεη ε εγθαηάζηαζε ηνπ παθέηνπ ζηνλ ππνινγηζηή καο θαη φισλ ησλ άιισλ παθέησλ πνπ ελδερνκέλσο ππνζηεξίδνπλ ηε ιεηηνπξγία ηνπ. ην ηέινο ηεο δηαδηθαζίαο, γηα λα δνχκε φια ηα παθέηα πνπ είλαη εγθαηεζηεκέλα ζηνλ ππνινγηζηή καο, πιεθηξνινγνχκε > library() θαη εκθαλίδεηαη έλα παξάζπξν κε ηα δηαζέζηκα παθέηα, αλάκεζα ζηα νπνία πξέπεη λα ππάξρεη θαη ην TeachingDemos. ια απηά ηα παθέηα είλαη εγθαηεζηεκέλα αιιά φρη ελεξγνπνηεκέλα. Ζ ελεξγνπνίεζε γίλεηαη αλ επηιέμνπκε μαλά ην κελνχ Packages θαη κεηά Load package. Απφ ην παξάζπξν Select one επηιέγνπκε κε αξηζηεξφ θιηθ ην παθέην πνπ ζέινπκε (π.ρ. ην TeachingDemos) θαη κεηά παηάκε OK. RStudio. Μεηά ηελ έλαξμε ηνπ RStudio, ζην θάησ δεμηά ηκήκα ηεο νζφλεο ηνπ RStudio επηιέγνπκε, κε απιφ αξηζηεξφ θιηθ, ηελ ηακπέια Packages. Καηφπηλ, ζην παξάζπξν πνπ αλνίγεη επηιέγνπκε ηελ εληνιή Install Packages πνπ βξίζθεηαη αθξηβψο θάησ απφ ηελ ηακπέια Packages. ηελ νζφλε ηνπ ππνινγηζηή εκθαλίδεηαη έλα ζρεηηθά κηθξφ παξάζπξν, φπσο απηφ πνπ θαίλεηαη παξαθάησ: 56

65 ην παξάζπξν απηφ πξέπεη λα ζπκπιεξψζνπκε κφλν ηε δεχηεξε γξακκή κε ην φλνκα ηνπ παθέηνπ πνπ ζέινπκε λα εγθαηαζηήζνπκε (π.ρ. TeachingDemos). Παηάκε έλα αξηζηεξφ θιηθ ζηε δεχηεξε γξακκή, ψζηε λα ελεξγνπνηεζεί ν cursor (ε θαηαθφξπθε θάζεηε γξακκή πνπ αλαβνζβήλεη), πιεθηξνινγνχκε TeachingDemos θαη παηάκε ην θνπκπί Install. To RStudio μεθηλά ηε δηαδηθαζία εγθαηάζηαζεο ηνπ παθέηνπ, ε νπνία φηαλ νινθιεξσζεί ζα έρεη πξνζηεζεί, ζηε ιίζηα παθέησλ πνπ είλαη πξνεγθαηεζηεκέλα, ην TeachingDemos. Σα εγθαηεζηεκέλα παθέηα εκθαλίδνληαη ζην θάησ δεμί κέξνο ηνπ RStudio, ζηελ ηακπέια Packages. Γηα ηελ ελεξγνπνίεζε ηνπο ρξεηάδεηαη απιψο λα ηζεθάξνπκε ην αληίζηνηρν θνπηί κπξνζηά απφ ην φλνκα ηνπ παθέηνπ. 57

66 58

67 4 ηαηηζηηθή Μεζνδνινγία ην θεθάιαην απηφ ζα παξνπζηάζνπκε ην απαξαίηεην καζεκαηηθφ ππφβαζξν κε ην νπνίν κπνξνχκε λα πξνζεγγίζνπκε ηελ πνζνηηθή κέζνδν επεμεξγαζίαο δεδνκέλσλ ζε ζέκαηα εθπαηδεπηηθήο έξεπλαο. πγθεθξηκέλα ζα δνζνχλ νη νξηζκνί, νη βαζηθέο καζεκαηηθέο ζρέζεηο ηεο ζηαηηζηηθήο ζεσξίαο, ε ζηαηηζηηθή κεζνδνινγία πνπ εθαξκφδεηαη ζηε κειέηε εκπεηξηθψλ δεδνκέλσλ θαη παξαδείγκαηα πνπ πξνέξρνληαη απφ ηνλ εθπαηδεπηηθφ ρψξν. Σα παξαδείγκαηα ζπλνδεχνληαη απφ ηηο εληνιέο ηεο R πνπ ρξεζηκνπνηήζεθαλ γηα ηε ζηαηηζηηθή επεμεξγαζία καδί κε ηηο απαξαίηεηεο εμεγήζεηο θαη δηεπθξηλήζεηο πνπ απαηηνχληαη γηα ηελ θαηαλφεζή ηνπο. 4.1 Η έλλνηα ηεο κεηαβιεηήο ηε ζηαηηζηηθή καο ελδηαθέξεη λα εμεηάζνπκε νξηζκέλα ραξαθηεξηζηηθά ελφο ζπλφινπ ην νπνίν απνθαινχκε πιεζπζκό (population). Ο πιεζπζκφο ζηελ εθπαηδεπηηθή έξεπλα ζπλήζσο απαξηίδεηαη απφ ηα κέιε ηεο εθπαηδεπηηθήο θνηλφηεηαο (καζεηέο, θνηηεηέο, θαζεγεηέο, γνλείο) γηα ηνπο νπνίνπο εμεηάδνπκε δηάθνξα ραξαθηεξηζηηθά φπσο ε επίδνζε ησλ θνηηεηψλ ζηα καζεκαηηθά, ε δηαγσγή ησλ καζεηψλ ησλ γπκλαζίσλ ηεο ρψξαο, νη εμσζρνιηθέο δξαζηεξηφηεηεο ησλ καζεηψλ ηνπ ιπθείνπ, νη εβδνκαδηαίεο ψξεο κειέηεο καζεηψλ/θνηηεηψλ, ε επίδξαζε ηεο νηθνλνκηθήο θαηάζηαζεο ησλ γνλέσλ ζηελ απνηπρία ησλ παηδηψλ ηνπο ζηηο εμεηάζεηο, ε επίδξαζε δχν δηαθνξεηηθψλ πξνγξακκάησλ ζπνπδψλ ζηε ζρνιηθή δηαξξνή. Σα ραξαθηεξηζηηθά σο πξνο ηα νπνία εμεηάδνπκε έλαλ πιεζπζκφ ιέγνληαη κεηαβιεηέο (variables). Οη κεηαβιεηέο δηαθξίλνληαη ζε πνζνηηθέο (quantitative) θαη πνηνηηθέο (qualitative). Οη ηηκέο κηαο πνζνηηθήο κεηαβιεηήο είλαη αξηζκνί, ελψ ηεο πνηνηηθήο εθθξάδνληαη ζε κε αξηζκεηηθή κνξθή. Γηα παξάδεηγκα, ην πιήζνο ησλ αηπρεκάησλ ζην ζρνιείν είλαη κηα πνζνηηθή κεηαβιεηή πνπ κπνξεί λα πάξεη ηηκέο 0,1,2,3,, ελψ ε εμσζρνιηθή δξαζηεξηφηεηα ησλ καζεηψλ είλαη κηα πνηνηηθή 59

68 κεηαβιεηή κε ηηκέο «ηειεφξαζε», «αζιεηηζκφο», «ππνινγηζηέο» θαη «δηαζθέδαζε». Δηδηθφηεξα, νη πνζνηηθέο κεηαβιεηέο δηαθξίλνληαη ζε: Γηαθξηηέο, πνπ παίξλνπλ κφλν αθέξαηεο ηηκέο, δειαδή 0, 1, 2, 3,. Γηα παξάδεηγκα, ε επίδνζε ησλ καζεηψλ κηαο ηάμεο ηνπ ιπθείνπ ζε θάπνην κάζεκα είλαη κηα δηαθξηηή κεηαβιεηή κε ηηκέο 0,1,2,,20. πλερείο, πνπ κπνξνχλ λα πάξνπλ νπνηαδήπνηε ηηκή ζε έλα δηάζηεκα αξηζκψλ. Γηα παξάδεηγκα, ν ρξφλνο πνπ ρξεηάδνληαη νη καζεηέο ηεο Γ ιπθείνπ γηα λα ιχζνπλ κηα άζθεζε ζε έλα ηεζη αμηνιφγεζεο δηάξθεηαο 20 ιεπηψλ είλαη κηα κεηαβιεηή κε ηηκέο ζην ρξνληθφ δηάζηεκα 0,20. Απηφ ζεκαίλεη φηη ε ζπλερήο κεηαβιεηή κπνξεί λα έρεη σο ηηκή νπνηαδήπνηε ρξνληθή ζηηγκή κεγαιχηεξε απφ ην κεδέλ θαη κηθξφηεξε ή ίζε απφ ηα είθνζη ιεπηά. 4.2 Πεξηγξαθηθή ζηαηηζηηθή Μεηά απφ ηε ζπιινγή ησλ δεδνκέλσλ αθνινπζεί ε ζπλνπηηθή θαη παξαζηαηηθή επεμεξγαζία ησλ δεδνκέλσλ πνπ νλνκάδεηαη πεξηγξαθηθή ζηαηηζηηθή. Ζ πεξηγξαθηθή ζηαηηζηηθή ζπλίζηαηαη απφ δχν θχξηνπο άμνλεο αλάιπζεο δεδνκέλσλ. Ο πξψηνο πεξηιακβάλεη ηνλ ππνινγηζκφ νξηζκέλσλ ζηαηηζηηθψλ δεηθηψλ (φπσο ν κέζνο φξνο), ελψ ν δεχηεξνο ηε δεκηνπξγία γξαθηθψλ αλαπαξαζηάζεσλ γηα ηελ παξαζηαηηθή, ζαθή θαη αθξηβή νπηηθή απεηθφληζε ησλ δεδνκέλσλ. Ζ πεξηγξαθηθή ζηαηηζηηθή απνηειεί ην πξψην βήκα ζηελ επεμεξγαζία δεδνκέλσλ, πνπ νδεγεί ζηε δηαηχπσζε ησλ αξρηθψλ εξεπλεηηθψλ εξσηεκάησλ θαη ππνζέζεσλ Καηαλνκέο ζπρλνηήησλ Ζ πεξηγξαθηθή ζηαηηζηηθή βαζίδεηαη ζηε ζπιινγή δεδνκέλσλ ηα νπνία πξνέξρνληαη απφ έλα ππνζχλνιν, δειαδή έλα ηκήκα, ηνπ πιεζπζκνχ πνπ νλνκάδεηαη δείγκα (sample). Μέγεζνο (size) ηνπ δείγκαηνο νλνκάδνπκε ην πιήζνο ησλ ζηνηρείσλ 60

69 ηνπ πιεζπζκνχ πνπ έρνπλ θαηαγξαθεί ζε κηα δεηγκαηνιεςία. Γηα παξάδεηγκα, έζησ ε δηαθξηηή πνζνηηθή κεηαβιεηή Χ: «αξηζκφο εθπαηδεπηηθψλ επηζθέςεσλ ησλ καζεηψλ ελφο Ννκνχ ζε κνπζεία θαηά ην έηνο 2011». Ο πιεζπζκφο καο είλαη ην ζχλνιν ησλ καζεηψλ ηνπ Ννκνχ. Γηα πξαθηηθνχο ιφγνπο δπζθνιεπφκαζηε λα ξσηήζνπκε φινπο ηνπο καζεηέο ηνπ Ννκνχ πφζα κνπζεία επηζθέθζεθαλ ην 2011, νπφηε επηιέγνπκε 20 απφ απηνχο νη νπνίνη απνηεινχλ ην δείγκα ηεο έξεπλαο, κεγέζνπο 20. Έζησ x1, x2, x k νη δηαθνξεηηθέο ηηκέο κηαο κεηαβιεηήο X, πνπ αθνξνχλ ηα ζηνηρεία ελφο δείγκαηνο κεγέζνπο, φπνπ k. πλερίδνληαο ην παξάδεηγκά καο, κε x1 0 παξηζηάλνπκε ηελ απάληεζε ησλ καζεηψλ «δελ επηζθέθζεθα θαλέλα κνπζείν», κε x2 1 «επηζθέθζεθα κία θνξά έλα κνπζείν» θαη νχησ θαζεμήο. Πξνθαλψο, ην πιήζνο k ησλ δηαθνξεηηθψλ απαληήζεσλ δελ κπνξεί λα μεπεξλά ην ζχλνιν ησλ εξσηεζέλησλ πνπ είλαη 20, δειαδή k 20. Ολνκάδνπκε (απφιπηε) ζπρλόηεηα (frequency) ην θπζηθφ αξηζκφ 61 i, φπνπ i 1,2, k, πνπ εθθξάδεη ηνλ αξηζκφ ησλ επαλαιήςεσλ ηεο ηηκήο x i ζην ζχλνιν ησλ παξαηεξήζεσλ ηνπ δείγκαηνο. Δίλαη πξνθαλέο φηη ην άζξνηζκα φισλ ησλ ζπρλνηήησλ ηζνχηαη κε ην κέγεζνο ηνπ δείγκαηνο, δειαδή: k. Έηζη, κε v 1 παξηζηάλνπκε ην πιήζνο ησλ καζεηψλ πνπ αληηζηνηρνχλ ζην x1 0, δειαδή δελ επηζθέθζεθαλ θαλέλα κνπζείν, κε v 2 ην πιήζνο ησλ καζεηψλ πνπ αληηζηνηρνχλ ζην x2 1, δειαδή έθαλαλ κία εθπαηδεπηηθή επίζθεςε ζε κνπζείν θαη νχησ θαζεμήο. Πξνθαλψο, ην ζπλνιηθφ πιήζνο ησλ απαληήζεσλ ηζνχηαη κε 20, φζνη θαη νη καζεηέο πνπ ζπκκεηείραλ ζηελ έξεπλα. Ζ πνζφηεηα i δελ κπνξεί λα πεξηγξάςεη επαξθψο ην κέγεζνο ηεο εκθάληζεο ηνπ xi, αλ δελ ζπγθξηζεί κε ην κέγεζνο ηνπ δείγκαηνο. Γηα απηφ νξίδνπκε ηε ζρεηηθή ζπρλόηεηα (relative frequency) f i ηεο ηηκήο x i, πνπ νξίδεηαη απφ ηε ζρέζε i fi, i 1,2,..., k.

70 Πνιιέο θνξέο εθθξάδνπκε ηε ζρεηηθή ζπρλφηεηα κε ηε κνξθή πνζνζηνχ, γηα απηφ θαη νξίδνπκε ηε ζρεηηθή ζπρλόηεηα %, πνπ ζπκβνιίδεηαη f i %, σο Σα δεχγε x, f, φπνπ i1,2,..., k κεηαβιεηήο X. i i i fi% 100 fi100, i 1,2,..., k. απνηεινχλ ηελ θαηαλνκή ζπρλνηήησλ ηεο Παπάδειγμα 1 (Πίνακαρ καηανομήρ ζςσνοηήηων) Έζησ ε κεηαβιεηή Χ: «αξηζκφο εθπαηδεπηηθψλ επηζθέςεσλ ησλ καζεηψλ ελφο Ννκνχ ζε κνπζεία θαηά ην έηνο 2011». Σν δείγκα κεγέζνπο 20 πνπ ζπιιέρζεθε πεξηιακβάλεη ηηο παξαηεξήζεηο 0, 1, 3, 0, 2, 0, 1, 1, 1, 0, 2, 2, 0, 0, 1, 0, 0, 1, 2, 0. Οη ζπρλφηεηεο γηα ηηο ηηκέο x1 0, x2 1, x3 2, x4 3 είλαη αληίζηνηρα, 1 9, 2 6, 3 4, 4 1. Ο ππνινγηζκφο ησλ ζπρλνηήησλ γίλεηαη κε ηε δηαινγή ησλ παξαηεξήζεσλ, φπσο θαίλεηαη ζηνλ παξαθάησ Πίλαθα 1. Καζψο δηαηξέρνπκε ηα δεδνκέλα θαηαγξάθνπκε θάζε παξαηήξεζε κε ην ζχκβνιν ζηελ αληίζηνηρε ηηκή ηεο κεηαβιεηήο Έηζη, γηα ηελ πξψηε ηηκή ηνπ δείγκαηνο πνπ είλαη ην 0 γξάθνπκε κία θάζεηε γξακκή ζηελ πξψηε γξακκή ηεο ζηήιεο Γηαινγή, γηα ηε δεχηεξε ηηκή ηνπ δείγκαηνο πνπ είλαη ην 1 γξάθνπκε κία θάζεηε γξακκή ζηελ δεχηεξε γξακκή ηεο ζηήιεο Γηαινγή θαη νχησ θαζεμήο. Γηα ηνλ ππνινγηζκφ ησλ ζρεηηθψλ ζπρλνηήησλ, έρνπκε f , f θηι. 20 Γηα λα βξνχκε ηηο ζρεηηθέο ζπρλφηεηεο % απιψο πνιιαπιαζηάδνπκε ηηο παξαπάλσ ηηκέο κε ην 100. Γειαδή f1% f , f2% f θηι. Δπηπιένλ, παξαηεξνχκε φηη ην άζξνηζκα ησλ ζπρλνηήησλ i ηζνχηαη κε ην κέγεζνο ηνπ δείγκαηνο v, ην άζξνηζκα ησλ ζρεηηθψλ ζπρλνηήησλ f i ηζνχηαη κε έλα θαη ησλ ζρεηηθψλ 62

71 ζπρλνηήησλ f i % κε 100. x i Γηαινγή i f f % i χλνιν i Πίλαθαο 1. Καηαλνκή ζπρλνηήησλ ηεο κεηαβιεηήο Υ: «αξηζκφο εθπαηδεπηηθψλ επηζθέςεσλ ησλ καζεηψλ ελφο Ννκνχ ζε κνπζεία θαηά ην έηνο 2011». Με ηε βνήζεηα ηεο R κπνξνχκε λα ππνινγίζνπκε ηηο ζπρλφηεηεο θαη ζρεηηθέο ζπρλφηεηεο ηνπ παξαπάλσ πίλαθα. Αξρηθά εηζάγνπκε ηηο ηηκέο ηνπ δείγκαηφο καο κε έλα δηάλπζκα, γηα παξάδεηγκα > museum.visits <- c(0, 1, 3, 0, 2, 0, 1, 1, 1, 0, 2, 2, 0, 0, 1, 0, 0, 1, 2, 0) Καηφπηλ, εθηεινχκε ηελ εληνιή > table(museum.visits) πνπ καο δίλεη ηηο ζπρλφηεηεο εκθάληζεο v i ζηελ παξαθάησ κνξθή: museum.visits Γηα ηνλ ππνινγηζκφ ησλ ζρεηηθψλ ζπρλνηήησλ f i έρνπκε > prop.table( table(museum.visits) ) museum.visits

72 Γηα ηηο ζρεηηθέο ζπρλφηεηεο f i % αξθεί λα πνιιαπιαζηάζνπκε ηελ ηειεπηαία εληνιή κε ην 100, δειαδή: > prop.table( table(museum.visits) ) * 100 museum.visits ηαλ ην πιήζνο ησλ δηαθνξεηηθψλ ηηκψλ κηαο πνζνηηθήο κεηαβιεηήο είλαη αξθεηά κεγάιν ν πίλαθαο ζπρλνηήησλ παξέρεη κηα κάιινλ ζπγθερπκέλε εηθφλα ηνπ δείγκαηνο, πνπ δελ βνεζά ηνλ εξεπλεηή λα πξνρσξήζεη ζηε δηαηχπσζε εξεπλεηηθψλ εξσηεκάησλ. ε απηέο ηηο πεξηπηψζεηο ρξεηάδεηαη νκαδνπνίεζε ησλ δεδνκέλσλ ζε ππννκάδεο πνπ νλνκάδνληαη θιάζεηο (bins). ε θαζεκία απφ απηέο ηηο θιάζεηο επηιέγνπκε σο αληηπξνζσπεπηηθή ηηκή ην θέληξν (center) ηεο πνπ ην ζπκβνιίδνπκε κε x i, κε βάζε ην νπνίν ππνινγίδνπκε ηελ θαηαλνκή ζπρλνηήησλ φπσο αθξηβψο θάλνπκε ζην επφκελν παξάδεηγκα. Παπάδειγμα 2 (Πίνακαρ καηανομήρ ομαδοποιημένων δεδομένων) Έζησ ε πνζνηηθή κεηαβιεηή Χ: «o ρξφλνο (ζε sec) πνπ ρξεηάδνληαη νη καζεηέο γηα ηελ επίιπζε κηαο άζθεζεο θπζηθήο». Σν δείγκα κεγέζνπο 20 πνπ ζπιιέρζεθε πεξηιακβάλεη ηηο παξαηεξήζεηο 53, 62, 70, 95, 97, 101, 112, 115, 118, 124, 130, 135, 141, 151, 157, 182, 185, 190, 245, 263. Σν ελδηαθέξνλ ζε απηή ηελ έξεπλα δελ είλαη ηφζν ν αθξηβήο ρξφλνο επίιπζεο φζν ε νκαδνπνίεζε ησλ ρξφλσλ ζε θιάζεηο πνπ αλαπαξηζηνχλ ην βαζκφ δπζθνιίαο πνπ αληηκεηψπηζαλ νη καζεηέο. Αλ νκαδνπνηήζνπκε ηα δεδνκέλα ζε πέληε θιάζεηο, πξνθχπηεη ν Πίλαθαο 2. Οη θεληξηθέο ηηκέο ησλ θιάζεσλ πξνθχπηνπλ σο ην εκηάζξνηζκα ησλ άθξσλ ηεο θάζε θιάζεο, γηα παξάδεηγκα x1 30 θαη x Γηα λα ππνινγίζνπκε ηηο ηηκέο ηνπ παξαπάλσ πίλαθα κε ηελ R αθνινπζνχκε αληίζηνηρε 64

73 Γηάζηεκα xi Γηαινγή i f f % 0, , , , , ύλνιν i i Πίλαθαο 2. Καηαλνκή ζπρλνηήησλ ηεο κεηαβιεηήο Χ: «o ρξφλνο (ζε sec) πνπ ρξεηάδνληαη νη καζεηέο γηα ηελ επίιπζε κηαο άζθεζεο θπζηθήο». δηαδηθαζία κε ην πξνεγνχκελν παξάδεηγκα κε ηελ πξνζζήθε ηεο εληνιήο cut γηα ην ζρεκαηηζκφ ησλ θιάζεσλ. Αξρηθά, εηζάγνπκε ηα δεδνκέλα > solve.time <- c(53, 62, 70, 95, 97, 101, 112, 115, 118, 124, 130, 135, 141, 151, 157, 182, 185, 190, 245, 263) Καηφπηλ, ν παξάγνληαο difficulty νξίδεηαη κέζσ ηεο εληνιήο cut, ε νπνία εηζάγεη γηα ηα δεδνκέλα ηνπ solve.time ηα φξηα ησλ θιάζεσλ πνπ επηζπκνχκε. > difficulty <- cut( solve.time, breaks=c(0, 60, 120, 180, 240, 300) ) Αθνινχζσο κε ηηο γλψξηκεο πιένλ εληνιέο table θαη prop.table κπνξνχκε λα έρνπκε ηηο ζπρλφηεηεο (απφιπηεο θαη ζρεηηθέο) πνπ επηζπκνχκε. Έηζη, νη ζρεηηθέο ζπρλφηεηεο f i ηνπ Πίλαθα 2, ππνινγίδνληαη σο εμήο: > prop.table( table(difficulty) ) difficulty (0,60] (60,120] (120,180] (180,240] (240,300] Δλψ γηα ηηο ζρεηηθέο ζπρλφηεηεο f i % έρνπκε > prop.table( table(difficulty) ) *

74 difficulty (0,60] (60,120] (120,180] (180,240] (240,300] Γξαθηθέο παξαζηάζεηο θαηαλνκώλ ζπρλνηήησλ Μηα ελδηαθέξνπζα επηινγή ηεο πεξηγξαθηθήο ζηαηηζηηθήο πνπ ζπκβάιεη ζηελ θαηαλφεζε ηεο θαηαλνκή κηαο κεηαβιεηήο είλαη ε ρξεζηκνπνίεζε γξαθηθψλ παξαζηάζεσλ. Οη γξαθηθέο παξαζηάζεηο παξνπζηάδνπλ κε πεξηεθηηθφ θαη παξαζηαηηθφ ηξφπν ηα βαζηθά ραξαθηεξηζηηθά θαη ηηο ηδηφηεηεο ηεο θαηαλνκήο. Μηα γξαθηθή παξάζηαζε νθείιεη λα είλαη (Δκβαισηήο, 2006, ζει. 13): παξαζηαηηθή, δηεπθνιχλνληαο ηελ αλαγλψξηζε θαη θαηαλφεζε ησλ βαζηθψλ ραξαθηεξηζηηθψλ ηεο θαηαλνκήο ζαθήο, απνθεχγνληαο ηηο ζπγρχζεηο αλάκεζα ζηηο ηηκέο ηεο κεηαβιεηήο αθξηβήο, ψζηε λα απνθεχγνληαη νη παξεξκελείεο πνπ νθείινληαη ζπλήζσο ζε νπηηθέο πιάλεο Οη πην ζπλεζηζκέλεο γξαθηθέο παξαζηάζεηο είλαη ην δηάγξακκα ζπρλνηήησλ θαη ην αληίζηνηρν πνιχγσλν, ην ηζηφγξακκα θαη ην αληίζηνηρν πνιχγσλν, ην ξαβδφγξακκα θαη ηέινο ην θπθιηθφ δηάγξακκα. a. Γηάγξακκα ζπρλνηήησλ (line diagram). Υξεζηκνπνηείηαη ζπλήζσο γηα δηαθξηηέο κεηαβιεηέο. Οη ηηκέο ηεο κεηαβιεηήο δηαηάζζνληαη ζηνλ νξηδφληην άμνλα ελψ ην χςνο ηεο θαηαθφξπθεο γξακκήο ζε θάζε ηηκή αληηζηνηρεί ζηε ζπρλφηεηά ηεο (απφιπηε ή ζρεηηθή). πλήζσο είλαη επηζπκεηή θαη ε ζρεδίαζε ηνπ αληίζηνηρνπ πνιπγψλνπ πνπ ζπλδέεη κε επζχγξακκα ηκήκαηα ηηο θνξπθέο ησλ θαηαθφξπθσλ γξακκψλ. Σν πνιχγσλν καο δίλεη κηα γεληθή εηθφλα γηα ηε κεηαβνιή ηεο ζπρλφηεηαο θαζψο απμάλεηαη ε ηηκή ηεο κεηαβιεηήο. 66

75 Παπάδειγμα 1 (ζςνέσεια) ην παξαθάησ ζρήκα δίλεηαη ην δηάγξακκα ζπρλνηήησλ θαη ην αληίζηνηρν πνιχγσλν ηεο κεηαβιεηήο ηνπ Παξαδείγκαηνο 1. Ζ πξψηε θφθθηλε θαηαθφξπθε γξακκή, ε νπνία είλαη ε κεγαιχηεξε, αληηζηνηρεί ζηε ζπρλφηεηα ησλ καζεηψλ πνπ δελ έρνπλ πάεη ζε θαλέλα κνπζείν θαη ηζνχηαη κε 9, ε δεχηεξε θφθθηλε θαηαθφξπθε γξακκή ζηε ζπρλφηεηα ησλ καζεηψλ πνπ έρνπλ πάεη ζε έλα κνπζείν θαη ηζνχηαη κε 6 θαη νχησ θαζεμήο. Απφ ην πνιχγσλν ζπρλνηήησλ πξνθχπηεη κηα γεληθή ηάζε ησλ καζεηψλ λα κελ επηζθέπηνληαη πνιιά κνπζεία. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ηνπ ζρήκαηνο πεξηιακβάλνληαη ζην αξρείν plot_line_diagram.r. ρήκα 8. Γηάγξακκα ζπρλνηήησλ ηεο κεηαβιεηήο Υ: «αξηζκφο εθπαηδεπηηθψλ επηζθέςεσλ ησλ καζεηψλ ελφο Ννκνχ ζε κνπζεία θαηά ην έηνο 2011» ηνπ Παξαδείγκαηνο 1. b. Ιζηόγξακκα (histogram) Υξεζηκνπνηείηαη γηα νκαδνπνηεκέλα δεδνκέλα πνζνηηθψλ κεηαβιεηψλ. Οη ηηκέο ηεο κεηαβιεηήο δηαηάζζνληαη ζηνλ νξηδφληην άμνλα νξηνζεηεκέλεο απφ ηηο θιάζεηο. Με βάζε ην πιάηνο θάζε θιάζεο ζρεκαηίδνληαη νξζνγψληα παξαιιειφγξακκα κε χςνο πνπ αληηζηνηρεί ζηε ζπρλφηεηα (απφιπηε ή ζρεηηθή) ηεο θιάζεο. Αλ ελψζνπκε ηα κέζα ησλ άλσ βάζεσλ ησλ νξζνγσλίσλ ζρεκαηίδεηαη ην αληίζηνηρν πνιχγσλν. 67

76 Παπάδειγμα 2 (ζςνέσεια) ην επφκελν ζρήκα δίλεηαη ην ηζηφγξακκα ζρεηηθψλ ζπρλνηήησλ f i θαη ε αληίζηνηρε πνιπγσληθή γξακκή ησλ νκαδνπνηεκέλσλ δεδνκέλσλ ηνπ Παξαδείγκαηνο 2. Απφ ην ηζηφγξακκα απηφ πξνθχπηεη φηη ειάρηζηνη καζεηέο έιπζαλ πνιχ γξήγνξα ηελ άζθεζε (πξψηε θιάζε), φηη ην 40% ησλ καζεηψλ αλάισζαλ 60 κε 120 sec ζηελ επίιπζή ηεο, ελψ γηα ηνπο ππφινηπνπο καζεηέο ε ηάζε ηεο πνιπγσληθήο γξακκήο είλαη δηαξθψο πησηηθή θαζψο νη ρξφλνη επίιπζεο απμάλνληαη. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ηνπ ζρήκαηνο πεξηιακβάλνληαη ζην αξρείν plot_hist.r. ρήκα 9. Ηζηφγξακκα ζρεηηθψλ ζπρλνηήησλ ηεο κεηαβιεηήο Υ: «o ρξφλνο (ζε sec) πνπ ρξεηάδνληαη νη καζεηέο γηα ηελ επίιπζε κηαο άζθεζεο θπζηθήο» ηνπ Παξαδείγκαηνο 2. c. Ραβδόγξακκα (bar chart) Υξεζηκνπνηείηαη γηα πνηνηηθέο κεηαβιεηέο νη νπνίεο ζπλήζσο ηνπνζεηνχληαη ζηνλ νξηδφληην άμνλα, ελψ ζρεκαηίδνληαη νξζνγψληα παξαιιειφγξακκα, πνπ δελ είλαη ζπλερφκελα φπσο ζην ηζηφγξακκα, κε χςνο πνπ αληηζηνηρεί ζηε ζπρλφηεηα (απφιπηε ή 68

77 ζρεηηθή) ηεο θάζε ηηκήο ηεο κεηαβιεηήο. Παπάδειγμα 3 (Ποιοηική μεηαβληηή - Ραβδόγπαμμα) Ζ εμσζρνιηθή δξαζηεξηφηεηα ησλ καζεηψλ ζε κηα έξεπλα ζεσξήζεθε κηα πνηνηηθή κεηαβιεηή κε ηηκέο «ηειεφξαζε», «αζιεηηζκφο», «ππνινγηζηέο» θαη «δηαζθέδαζε». Οη ζπρλφηεηεο i ησλ απαληήζεσλ ησλ 40 καζεηψλ πνπ ζπκκεηείραλ ζηελ έξεπλα, ζηηο παξαπάλσ επηινγέο ήηαλ αληίζηνηρα 12, 5, 8, 15. Με βάζε ηα δεδνκέλα απηά νη ζρεηηθέο ζπρλφηεηεο f i είλαη 0.30, 0.125, 0.20 θαη αληίζηνηρα. Σν ζρεηηθφ ξαβδφγξακκα θαίλεηαη ζην παξαθάησ ζρήκα. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ηνπ ζρήκαηνο πεξηιακβάλνληαη ζην αξρείν plot_bar.r. ρήκα 10. Ραβδφγξακκα ζρεηηθψλ ζπρλνηήησλ ηεο κεηαβιεηήο Υ: «εμσζρνιηθή δξαζηεξηφηεηα ησλ καζεηψλ» ηνπ Παξαδείγκαηνο 3. d. Κπθιηθό δηάγξακκα (pie chart) Υξεζηκνπνηείηαη γηα πνζνηηθέο θαη πνηνηηθέο κεηαβιεηέο νη νπνίεο θαηά πξνηίκεζε δελ παίξλνπλ κεγάιν πιήζνο δηαθνξεηηθψλ ηηκψλ. ε θάζε κία απφ ηηο ηηκέο ηεο κεηαβιεηήο 69

78 αληηζηνηρεί έλα ηκήκα ηνπ θπθιηθνχ δηαγξάκκαηνο, πνπ νλνκάδεηαη θπθιηθφο ηνκέαο, ηνπ νπνίνπ ε γσλία δίλεηαη απφ ηνλ ηχπν: a i έρεη κέγεζνο αλάινγν κε ηε ζπρλφηεηα (απφιπηε ή ζρεηηθή) θαη i ai 360 fi 360. Παπάδειγμα 4 (Ποιοηική μεηαβληηή Κςκλικό διάγπαμμα) Ζ εμσζρνιηθή δξαζηεξηφηεηα ησλ καζεηψλ ηνπ Παξαδείγκαηνο 3 κπνξεί λα παξαζηαζεί θαη κε ηε βνήζεηα ελφο θπθιηθνχ δηαγξάκκαηνο γηα ηηο ηηκέο «ηειεφξαζε», «αζιεηηζκφο», «ππνινγηζηέο» θαη «δηαζθέδαζε». Οη γσλίεο ησλ θπθιηθψλ ηνκέσλ ππνινγίδνληαη σο εμήο: a f , a f θιπ. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ηνπ ζρήκαηνο πεξηιακβάλνληαη ζην αξρείν plot_pie.r. ρήκα 11. Κπθιηθφ δηάγξακκα ζρεηηθψλ ζπρλνηήησλ % ηεο κεηαβιεηήο Υ: «εμσζρνιηθή δξαζηεξηφηεηα ησλ καζεηψλ» ηνπ Παξαδείγκαηνο 3. 70

79 4.2.3 Μέηξα ζέζεο θαη δηαζπνξάο Δθηφο απφ ηνλ πίλαθα θαηαλνκήο ζπρλνηήησλ θαη ηηο γξαθηθέο παξαζηάζεηο ππάξρνπλ θαη αξηζκεηηθά κέηξα ηα νπνία αλαδεηθλχνπλ βαζηθέο ηδηφηεηεο θαη ραξαθηεξηζηηθά ησλ θαηαλνκψλ κηαο κεηαβιεηήο. πγθεθξηκέλα, ηα κέηξα ζέζεο εθθξάδνπλ ηε ζέζε ηεο θεληξηθήο ηηκήο, δειαδή ηεο αληηπξνζσπεπηηθφηεξεο ηηκήο ηνπ δείγκαηνο, ελψ ηα κέηξα δηαζπνξάο εμεηάδνπλ ηε δηαζπνξά ησλ ηηκψλ γχξσ απφ ηελ θεληξηθή ηηκή. ζν κεγαιχηεξε ηηκή έρνπλ ηα κέηξα δηαζπνξάο ηφζν πεξηζζφηεξν «απιψλνληαη» ηα δεδνκέλα γχξσ απφ ηελ θεληξηθή ηηκή θαη αληηζηξφθσο. a. Μέζε ηηκή ή κέζνο όξνο (κέηξν ζέζεο). Έζησ έλα δείγκα κεγέζνπο κε παξαηεξήζεηο x 1, x 2,, x k, θαζεκηά απφ ηηο νπνίεο εκθαλίδεηαη 1, 2,, k, αληίζηνηρα. Ζ κέζε ηηκή (mean) ηνπ δείγκαηνο νξίδεηαη σο ην άζξνηζκα ησλ ηηκψλ ησλ παξαηεξήζεσλ πξνο ην κέγεζνο ηνπ δείγκαηνο. Γειαδή, x x x x... x 1 i. i i k k k i1 xi i1 Μηα πνιχ ζπλεζηζκέλε εθαξκνγή ηεο κέζεο ηηκήο ζηνλ εθπαηδεπηηθφ ρψξν είλαη ε εχξεζε ηνπ κέζνπ φξνπ ησλ βαζκνινγηψλ ελφο ζρνιηθνχ ειέγρνπ επίδνζεο. Γηα παξάδεηγκα νη βαζκνί 10, 12, 10, 15, 17, 20, 18, 12, 11, 19, έρνπλ κέζε ηηκή x ηνλ παξαπάλσ ηχπν ζεσξήζεθε φηη θάζε ηηκή 71 k x έρεη ζπρλφηεηα v 1. Γηα λα εμάγνπκε ην απνηέιεζκα απηφ κέζσ ηεο R νξίδνπκε θαηαξρήλ ην δηάλπζκα ησλ δεδνκέλσλ x, σο εμήο: > x <- c ( 10, 12, 10, 15, 17, 20, 18, 12, 11, 19 ) Γηα λα επηβεβαηψζνπκε φηη ην δηάλπζκα x πεξηέρεη ηηο παξαηεξήζεηο ηνπ δείγκαηνο, πιεθηξνινγνχκε x ζηελ θνλζφια ηεο R θαη παηάκε Enter: > x i i

80 [1] Ζ κέζε ηηκή ηνπ x ζα πξνθχςεη κε ηελ εληνιή > mean(x) [1] 14.4 b. Γηαθύκαλζε (κέηξν δηαζπνξάο). Ζ δηαθχκαλζε (variance) ελφο δείγκαηνο νξίδεηαη σο: x x x x 2 2 k k k 1 2 ( i ) 1 1 i1 s x x ηνλ παξαπάλσ ηχπν ε πνζφηεηα xi απφ ηελ θεληξηθή ηηκή ηνπ δείγκαηνο x. Ζ πνζφηεηα xi x εθθξάδεη ηελ απφζηαζε ηεο παξαηήξεζεο xi i x πςψλεηαη ζην ηεηξάγσλν ψζηε λα είλαη κεγαιχηεξε ή ίζε απφ ην κεδέλ δηφηη δηαθνξεηηθά ην άζξνηζκα ζηνλ αξηζκεηή, επνκέλσο θαη ε δηαθχκαλζε, ζα ήηαλ πάληα κεδέλ. Καζεκηά απφ ηηο πνζφηεηεο x x 2 i, εκθαλίδεηαη ηφζεο θνξέο φζεο ε αληίζηνηρε ζπρλφηεηα εκθάληζεο i. ζν κεγαιχηεξεο είλαη νη απνζηάζεηο ησλ x i απφ ηε x ηφζν κεγαιχηεξεο είλαη νη πνζφηεηεο x x 2 i 72, επνκέλσο θαη ε δηαθχκαλζε. Γηα παξάδεηγκα, ηα δείγκαηα κε ηηκέο 48, 49, 50, 51, 52 θαη 0, 25, 50, 75, 100 έρνπλ ηελ ίδηα κέζε ηηκή πνπ ηζνχηαη κε 50, φκσο ε δηαζπνξά ησλ ηηκψλ ηνπ δεπηέξνπ δείγκαηνο γχξσ απφ ην 50 είλαη κεγαιχηεξε. Απηή ε παξαηήξεζε απνηππψλεηαη ζηηο δηαθπκάλζεηο ησλ δχν δεηγκάησλ πνπ είλαη 2.5 θαη 1,562.5 αληίζηνηρα. Πξάγκαηη, γηα ην πξψην δείγκα έρνπκε x 50 θαη s Με ηελ R, κπνξνχκε λα έρνπκε ηα ίδηα απνηειέζκαηα, κε ηελ εληνιή var, σο εμήο: x<- c( 48, 49, 50, 51, 52 ) > mean(x)

81 [1] 50 > var(x) [1] 2.5 Παξαηεξνχκε φηη ην άζξνηζκα ησλ xi x ηζνχηαη κε κεδέλ. Πξαγκαηηθά, > sum ( x - mean(x) ) [1] 0 Γηα ην δεχηεξν δείγκα 0, 25, 50, 75, 100, έρνπκε x 50 θαη s , Αληηζηνίρσο κε ηελ R, πξνθχπηεη: > x<- c( 0, 25, 50, 75, 100 ) > mean(x) [1] 50 > var(x) [1] > sum ( x - mean(x) ) [1] 0 c. Σππηθή απόθιηζε (κέηξν δηαζπνξάο). Ζ ηππηθή απφθιηζε (standard deviation) είλαη ε ηεηξαγσληθή ξίδα ηεο δηαθχκαλζεο, δειαδή: s 2 s. Ζ ηππηθή απφθιηζε εθθξάδεη ηε δηαζπνξά ησλ ηηκψλ γχξσ απφ ηε κέζε ηηκή, φπσο θαη ε δηαθχκαλζε, φκσο ε ρξεζηκφηεηά ηεο έγθεηηαη ζην φηη έρεη ίδηεο κνλάδεο κέηξεζεο κε ηηο ηηκέο ηνπ δείγκαηνο παξαθάησ παξαδείγκαηα. x i θαη ηε κέζε ηηκή x, φπσο θαίλεηαη ζηα 73

82 Παπάδειγμα 1 (ςνέσεια) Ζ κέζε ηηκή ηεο κεηαβιεηήο είλαη x 0.85 επηζθέςεηο > x <- c( rep(0, times=9), rep(1, times=6), rep(2, times=4), 3 ) > x [1] > mean(x) [1] 0.85 Ζ δηαθχκαλζε θαη ε ηππηθή απφθιηζε ππνινγίδνληαη σο εμήο: s 0.87 επηζθέςεηο 2 19 θαη s επηζθέςεηο Παξαηεξνχκε φηη νη κνλάδεο κέηξεζεο ηεο δηαθχκαλζεο 2 s (επηζθέςεηο 2 ) δελ έρνπλ θπζηθή ζεκαζία ζε αληίζεζε κε ηηο κνλάδεο κέηξεζεο ηεο ηππηθήο απφθιηζεο s (επηζθέςεηο). Δπηπιένλ επηζεκαίλνπκε φηη δελ ζα είραλ θαλέλα λφεκα νη αξηζκεηηθέο πξάμεηο κεηαμχ πνζνηήησλ κε δηαθνξεηηθέο κνλάδεο κέηξεζεο φπσο ε κέζε ηηκή θαη ε δηαθχκαλζε, ζε αληίζεζε κε πνζφηεηεο φπσο νη κέζε ηηκή θαη ε ηππηθή απφθιηζε πνπ ζα ρξεζηκνπνηεζνχλ ζε επφκελεο ελφηεηεο. Ζ θνλζφια ηεο R ζην παξάδεηγκα απηφ ζα είρε ηε κνξθή: > var(x) [1] > sd(x) [1] φπνπ sd είλαη ε εληνιή γηα ηνλ ππνινγηζκφ ηεο ηππηθήο απφθιηζεο. Παπάδειγμα 2 (ςνέσεια) Ζ κέζε ηηκή ηεο κεηαβιεηήο είλαη 74

83 x 141 δεπηεξφιεπηα. 20 Ζ δηαθχκαλζε θαη ε ηππηθή απφθιηζε ππνινγίδνληαη σο εμήο: s 19 4, δεπηεξφιεπηα 2. θαη s δεπηεξφιεπηα. Αληηζηνίρσο κε ηελ R έρνπκε > x <- c( rep(30, times=1), rep(90, times=8), rep(150, times=6), rep(210, times=3), rep(270, times=2) ) > x [1] > mean(x) [1] 141 > var(x) [1] > sd(x) [1] Η έλλνηα ηεο πηζαλόηεηαο Σν βαζηθφ ραξαθηεξηζηηθφ φισλ ησλ παξαδεηγκάησλ πνπ είδακε κέρξη ζηηγκήο είλαη ε αβεβαηφηεηα γηα ηα απνηειέζκαηα ησλ εξεπλεηηθψλ εξσηεκάησλ. Έηζη, δελ κπνξνχκε λα γλσξίδνπκε εθ ησλ πξνηέξσλ πφζνη καζεηέο επηζθέθζεθαλ κία θνξά θάπνην κνπζείν ζην Παξάδεηγκα 1, νχηε ην πνζνζηφ ησλ καζεηψλ πνπ ρξεηάζηεθαλ πάλσ απφ 4 ιεπηά γηα ηελ επίιπζε ηεο άζθεζεο ζην Παξάδεηγκα 2. Δπηπιένλ, αλ ηα παξαπάλσ πεηξάκαηα ηχρεο (δειαδή πεηξάκαηα ηα απνηειέζκαηα ησλ νπνίσλ εμαξηψληαη απφ ηελ αβεβαηφηεηα, ηελ ηχρε) επαλαιεθζνχλ είλαη ζρεδφλ βέβαην φηη δελ 75

84 ζα έρνπκε αθξηβψο ηα ίδηα απνηειέζκαηα. Θα ήηαλ ινηπφλ πνιχ ρξήζηκν λα αληηζηνηρήζνπκε ζε θάζε θαηάζηαζε ελφο πεηξάκαηνο ηχρεο, ηελ νπνία απνθαινχκε ελδερόκελν (event), έλαλ αξηζκφ πνπ λα εθθξάδεη απηή ηελ άγλσζηε ζε εκάο ηηκή ηεο ζρεηηθήο ζπρλφηεηαο. Ο αξηζκφο απηφο νλνκάδεηαη πηζαλόηεηα (probability). Ζ πηζαλφηεηα ινηπφλ είλαη έλα κέηξν ηεο πξνζδνθίαο κε ηελ νπνία αλακέλνπκε λα πινπνηεζνχλ δηάθνξεο θαηαζηάζεηο ηεο πξαγκαηηθφηεηαο πνπ δηέπνληαη απφ αβεβαηφηεηα. Τπάξρνπλ δηάθνξνη νξηζκνί γηα ηελ έλλνηα ηεο πηζαλφηεηαο. ηελ παξνχζα εξγαζία ζα αθνινπζήζνπκε ηνλ εκπεηξηθφ ή ζηαηηζηηθφ νξηζκφ. Ο νξηζκφο βαζίδεηαη ζε εκπεηξηθέο παξαηεξήζεηο πνπ δείρλνπλ φηη ε ζρεηηθή ζπρλφηεηα πνπ εκθαλίδεηαη ζε πνιιαπιέο επαλαιήςεηο ηνπ ίδηνπ πεηξάκαηνο ηείλεη λα ζηαζεξνπνηεζεί ζε θάπνηα ζπγθεθξηκέλε ηηκή ηελ νπνία ζεσξνχκε σο ηελ πηζαλφηεηα ηνπ ελδερνκέλνπ (Παπατσάλλνπ 1982, ζει ). πγθεθξηκέλα, νξίδνπκε πηζαλφηεηα ελφο ελδερνκέλνπ A θαη ηε ζπκβνιίδνπκε κε Pr A ηε ζρεηηθή ζπρλφηεηα απηνχ ηνπ ελδερνκέλνπ, φηαλ ην πείξακα επαλαιακβάλεηαη ζεσξεηηθά άπεηξεο θνξέο. Γειαδή, A Pr A f A, θαζψο ην v ηείλεη ζην άπεηξν. ηελ πξάμε ε έθθξαζε «θαζψο ην v ηείλεη ζην άπεηξν» ζεκαίλεη φηη εθηεινχκε ην πείξακα πάξα πνιιέο θνξέο. Πξέπεη λα ηνληζηεί φηη ε πηζαλφηεηα ελφο ελδερνκέλνπ είλαη γεληθά άγλσζηε θαη ζπλήζσο δχζθνιν λα ππνινγηζηεί, γηα απηφ θαη πξνζεγγίδεηαη απφ ηε ζρεηηθή ζπρλφηεηα. Ζ εθαξκνγή ηνπ εκπεηξηθνχ νξηζκνχ ηεο πηζαλφηεηαο αλαδεηθλχεηαη απφ ην παξαθάησ παξάδεηγκα. Παπάδειγμα 1 (ςνέσεια - Εμπειπικόρ οπιζμόρ πιθανόηηηαρ) Σν ελδερφκελν Α: «Έλαο ηπραία επηιεγκέλνο καζεηήο ηνπ Ννκνχ επηζθέθζεθε 2 θνξέο θάπνην κνπζείν θαηά ην έηνο 2011» γξάθεηαη ηζνδχλακα Α: X 2 θαη έρεη, κε βάζε ηνλ πίλαθα θαηαλνκήο ζπρλνηήησλ, πηζαλφηεηα πνπ δίλεηαη απφ ηε ζρέζε: X f3 Pr A Pr ή 20%. Σν απνηέιεζκα απηφ ζα ήηαλ πην θνληά ζηελ πξαγκαηηθφηεηα αλ ην δείγκα καο 76

85 απνηεινχληαλ απφ πνιχ πεξηζζφηεξνπο καζεηέο, ψζηε λα ηθαλνπνηείηαη ε ζπλζήθε «ην v ηείλεη ζην άπεηξν». Παπάδειγμα 2 (ςνέσεια - Εμπειπικόρ οπιζμόρ πιθανόηηηαρ) Σν ελδερφκελν Α: «Έλαο ηπραία επηιεγκέλνο καζεηήο ρξεηάζηεθε πάλσ απφ 2 ιεπηά γηα ηελ επίιπζε ηεο άζθεζεο θπζηθήο» γξάθεηαη ηζνδχλακα Α: X 120 θαη έρεη, κε βάζε ηνλ πίλαθα θαηαλνκήο ζπρλνηήησλ, πηζαλφηεηα πνπ δίλεηαη απφ ηε ζρέζε: X f3 f4 f5 Pr A Pr ή 55%. Παπάδειγμα 5 (Εμπειπικόρ οπιζμόρ πιθανόηηηαρ) ε έλα εθπαηδεπηηθφ παηρλίδη γλψζεσλ νη καζεηέο έρνπλ λα επηιέμνπλ κία κφλν εξψηεζε απφ δχν θαηεγνξίεο: Μαζεκαηηθά & Φπζηθέο Δπηζηήκεο θαη Νενειιεληθή Γιψζζα & Λνγνηερλία. Πνηα είλαη ε πηζαλφηεηα ηνπ ελδερνκέλνπ Α: «έλαο ηπραία επηιεγκέλνο καζεηήο λα επηιέμεη ηελ θαηεγνξία εξσηήζεσλ Μαζεκαηηθά & Φπζηθέο Δπηζηήκεο», αλ είλαη γλσζηφ φηη ζα ζπκκεηέρνπλ 500 καζεηέο; Ζ πξνζδνθία πνπ έρνπκε γηα ην παξαπάλσ πείξακα ηχρεο είλαη φηη πεξίπνπ νη κηζνί καζεηέο ζα επηιέμνπλ ηελ πξψηε θαηεγνξία εξσηήζεσλ θαη νη ππφινηπνη ηε δεχηεξε θαηεγνξία. Δπνκέλσο, ε πηζαλφηεηα ηνπ Α ηζνχηαη κε 0.50 ή 50%. Γελ ζα είρακε ηελ ίδηα αθξηβψο αίζζεζε γηα ηα απνηειέζκαηα αλ νη ζπκκεηέρνληεο ήηαλ ιίγνη, π.ρ. 10 καζεηέο. Σφηε δελ ζα ήηαλ θαζφινπ δχζθνιν 7 ή 8 απφ απηνχο λα επέιεγαλ ηελ πξψηε θαηεγνξία θαη νη ππφινηπνη ηε δεχηεξε. Οη ζρεηηθέο ζπρλφηεηεο θαη νη αληίζηνηρεο πηζαλφηεηεο ζε απηή ηελ πεξίπησζε ζα ήηαλ αξθεηά δηαθνξεηηθέο απφ ην 50%. Ζ παξαπάλσ δηαηζζεηηθή πξνζέγγηζε ζπκθσλεί κε ηα απνηειέζκαηα απφ ηέζζεξα δηαθνξεηηθά δείγκαηα 500 καζεηψλ πνπ αλαπαξηζηψληαη ζην ρήκα 12. ε θάζε κία απφ ηηο ηέζζεξηο γξαθηθέο παξαζηάζεηο ηνπ ρήκαηνο παξαηεξνχκε φηη ζηηο πξψηεο επαλαιήςεηο ηνπ πεηξάκαηνο (δειαδή ζηνπο πξψηνπο καζεηέο πνπ επέιεμαλ ηελ θαηεγνξία Μαζεκαηηθά & Δπηζηήκεο) έρνπκε έληνλεο κεηαβνιέο ζηε ζρεηηθή ζπρλφηεηα. κσο κεηά ηνπο 100 πεξίπνπ πξψηνπο καζεηέο ε ζρεηηθή ζπρλφηεηα 77

86 νκαινπνηείηαη θαη ηείλεη ζηελ ηηκή 0.50 (δηαθεθνκκέλε γξακκή), πνπ ζεσξείηαη κε βάζε ηνλ εκπεηξηθφ νξηζκφ πηζαλφηεηαο ε πηζαλφηεηα ηνπ ελδερνκέλνπ, δειαδή Pr(«έλαο καζεηήο λα επηιέμεη ηελ θαηεγνξία Μαζεκαηηθά & Φπζηθέο Δπηζηήκεο»)=0.5 ηα ίδηα ζπκπεξάζκαηα ζα θαηαιήμνπκε φζεο θνξέο θαη αλ εθηειέζνπκε ην ίδην πείξακα ηχρεο. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ηνπ ζρήκαηνο πεξηιακβάλνληαη ζην αξρείν probability_definition.r (Φσθηαλφο & Υαξαιάκπνπο, 2010, ζει ). ρήκα 12. ε θαζέλα απφ ηα ηέζζεξα γξαθήκαηα αλαπαξίζηαηαη ην πνιχγσλν ζρεηηθψλ ζπρλνηήησλ ησλ επηινγψλ (Μαζεκαηηθά & Φπζηθέο Δπηζηήκεο θαη Νενειιεληθή Γιψζζα & Λνγνηερλία) 500 καζεηψλ. Ζ νξηδφληηα δηαθεθνκκέλε γξακκή αληηζηνηρεί ζηελ ηηκή

87 4.4 Καηαλνκέο πηζαλόηεηαο Αλ ππνζέζνπκε φηη ν αξηζκφο ησλ θιάζεσλ ζε νκαδνπνηεκέλα δεδνκέλα κηαο πνζνηηθήο κεηαβιεηήο είλαη αξθεηά κεγάινο, δειαδή ηείλεη ζην άπεηξν, θαη ην πιάηνο ησλ θιάζεσλ είλαη αξθεηά κηθξφ, δειαδή ηείλεη ζην κεδέλ, ηφηε ην πνιχγσλν ζρεηηθψλ ζπρλνηήησλ ηείλεη ζε κηα νκαιή θακπχιε, ηελ νπνία νλνκάδνπκε θακπύιε ζπρλνηήησλ (frequency curve). Παπάδειγμα 6 (Καμπύλη ζςσνοηήηων) ην ρήκα 13 νκαδνπνηήζακε ηνπο βαζκνχο 5,000 καζεηψλ ζε έλα κάζεκα ησλ Παλειιελίσλ εμεηάζεσλ ηνπ 2011, νη νπνίνη θπκαίλνληαη απφ 8 έσο 20 ζηελ θιίκαθα αμηνιφγεζεο κε άξηζηα ην 20. ηα ηξία ηζηνγξάκκαηα ζπρλνηήησλ κεηαβάιινπκε ηνλ αξηζκφ ησλ θιάζεσλ θαη ζρεκαηίδνπκε ην αληίζηνηρν πνιχγσλν ζε θάζε πεξίπησζε. Παξαηεξνχκε φηη θαζψο απμάλνπκε ηνλ αξηζκφ ησλ θιάζεσλ, κεηψλεηαη ην πιάηνο θάζε θιάζεο θαη ε πνιπγσληθή γξακκή κεηαηξέπεηαη απφ κηα ηεζιαζκέλε γξακκή ζε κηα θακπχιε, ηελ θακπχιε ζπρλνηήησλ ηεο κεηαβιεηήο. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ησλ ζρεκάησλ πεξηιακβάλνληαη ζην αξρείν plot_frequency_polygon.r. Ζ θιήζε ηεο ζπλάξηεζεο απηνχ ηνπ αξρείνπ γίλεηαη κε ηελ εληνιή (γηα ην πξψην γξάθεκα): > plot.frequency.polygon(n=6) φπνπ ην n εθθξάδεη ην πιήζνο ησλ θιάζεσλ κε ην νπνίν ν αλαγλψζηεο κπνξεί λα πεηξακαηηζηεί ψζηε λα ζρεκαηίζεη ηα γξαθήκαηα ηεο επηινγήο ηνπ. 79

88 ρήκα 13. Ηζηφγξακκα ζρεηηθψλ ζπρλνηήησλ θαη ην αληίζηνηρν πνιχγσλν ησλ βαζκψλ 5,000 καζεηψλ, ζε 6, 20 θαη 50 θιάζεηο. Μεξηθέο ραξαθηεξηζηηθέο θακπχιεο ζπρλνηήησλ, νη νπνίεο γηα ηελ πεξίπησζε ησλ ζπλερψλ κεηαβιεηψλ νλνκάδνληαη ζπλαξηήζεηο ππθλφηεηαο πηζαλφηεηαο (probability density function), είλαη ηδηαηηέξσο ρξήζηκεο ζηελ κειέηε ησλ πεηξακαηηθψλ δεδνκέλσλ. Ζ πην γλσζηή απφ απηέο είλαη ε θαλνληθή θαηαλνκή (normal distribution), ελψ πνιχ ρξήζηκεο είλαη ε t, θαη ε 2. Ζ R δηαζέηεη έλαλ επξχ θαηάινγν θαηαλνκψλ πηζαλφηεηαο, πνπ κπνξνχκε λα δνχκε κε ηελ εληνιή: >?Distributions 80

89 4.4.1 Καλνληθή θαηαλνκή Δίλαη ίζσο ε πην ζεκαληηθή θαηαλνκή δηφηη πνιιά θαηλφκελα ζηελ εθπαηδεπηηθή έξεπλα θαη φρη κφλν αθνινπζνχλ θαλνληθή θαηαλνκή κε κέζε ηηκή θαη δηαθχκαλζε 2. Ζ κέζε ηηκή είλαη κηα άγλσζηε παξάκεηξνο ηεο θαηαλνκήο ε νπνία κπνξεί λα εθηηκεζεί, δειαδή λα πξνζεγγηζηεί, απφ ην κέζν φξν ηνπ δείγκαηνο x. Οκνίσο, ε δηαθχκαλζε δείγκαηνο 2 είλαη κηα ζεηηθή παξάκεηξνο πνπ εθηηκάηαη απφ ηε δηαθχκαλζε ηνπ 2 s. Ζ θαλνληθή θαηαλνκή έρεη ζρήκα θψδσλα, είλαη ζπκκεηξηθή γχξσ απφ ην θαη ην εχξνο ησλ ηηκψλ ηεο κεηαβιεηήο (δειαδή ε απφζηαζε απφ ηε κηθξφηεξε κέρξη ηε κεγαιχηεξε ηηκή) είλαη πεξίπνπ 6. Παπάδειγμα 7 (Κανονική καηανομή) ην ρήκα 14 έρνπκε ην ηζηφγξακκα ησλ βαζκψλ απφ ηηο γξαπηέο εμεηάζεηο 250 καζεηψλ θαη ηελ θφθθηλε γξακκή πνπ αληηζηνηρεί ζηελ θακπχιε ζπρλνηήησλ ηεο θαλνληθήο θαηαλνκήο κε κέζε ηηκή 14 θαη δηαθχκαλζε 4. Παξαηεξνχκε φηη ε ζεσξεηηθή θαηαλνκή πξνζεγγίδεη κε ζρεηηθά κεγάιε αθξίβεηα ηα εκπεηξηθά δεδνκέλα. Ζ θακπχιε ηεο θαλνληθήο θαηαλνκήο είλαη ζπκκεηξηθή σο πξνο ην 14, δειαδή είλαη ζπκκεηξηθή σο πξνο έλα λνεηφ θαηαθφξπθν άμνλα πνπ δηέξρεηαη απφ ην 14. Δπηπιένλ, ε δηαθχκαλζε είλαη 2 4, νπφηε 2. Παξαηεξνχκε φηη νη ηηκέο ηεο κεηαβιεηήο πνπ εθθξάδεη ηνπο βαζκνχο ησλ καζεηψλ θπκαίλνληαη απφ 8 έσο 20, νπφηε ησλ εχξνο ησλ ηηκψλ είλαη 12 πνπ ηζνχηαη πξάγκαηη κε 6. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ηνπ ζρήκαηνο πεξηιακβάλνληαη ζην αξρείν plot_normal.r. Θεσξεηηθά ε θακπχιε ζπρλνηήησλ ηεο θαλνληθήο θαηαλνκήο κηαο κεηαβιεηήο X εθθξάδεηαη απφ ηε ζπλάξηεζε ππθλφηεηαο πηζαλφηεηαο: 1 f x e 2 x 2 2 2, 81

90 ρήκα 14. Ηζηφγξακκα ζρεηηθψλ ζπρλνηήησλ ησλ βαζκψλ 250 καζεηψλ. Ζ θφθθηλε γξακκή αληηζηνηρεί ζηελ θακπχιε ζπρλνηήησλ ηεο Καλνληθήο θαηαλνκήο κε κέζε ηηκή 14 θαη ηππηθή απφθιηζε 2. φπνπ x είλαη κηα ζπγθεθξηκέλε ηηκή ηεο κεηαβιεηήο, f x ε αληίζηνηρε ζρεηηθή ζπρλφηεηα, 3.14 θαη e Σν εκβαδφλ πνπ πεξηθιείεηαη απφ ηελ θακπχιε ηεο θαλνληθήο θαηαλνκήο, αιιά θαη ηελ θακπχιε νπνηαζδήπνηε άιιεο θαηαλνκήο θαη ηνλ νξηδφληην άμνλα ηζνχηαη κε έλα. Ζ έλλνηα ηνπ εκβαδνχ καο βνεζάεη λα αληηιεθζνχκε ηε ρξεζηκφηεηα ηεο θακπχιεο ζπρλνηήησλ ζηνλ ππνινγηζκφ πηζαλνηήησλ. Αλ κηα κεηαβιεηή X αθνινπζεί ηελ θαλνληθή θαηαλνκή ηφηε ε πηζαλφηεηα ηνπ ελδερνκέλνπ a x b ηζνχηαη κε ην εκβαδφλ πνπ πεξηθιείεηαη απφ ηελ θακπχιε ζπρλνηήησλ ηεο θαλνληθήο θαηαλνκήο, ηνλ νξηδφληην άμνλα θαη ηηο θαηαθφξπθεο επζείεο πνπ ηέκλνπλ ηνλ άμνλα ησλ x ζηα ζεκεία a θαη b. Παπάδειγμα 8 (Κανονική καηανομή ςπολογιζμόρ πιθανοηήηων) Έρεη παξαηεξεζεί φηη ν δείθηεο IQ ησλ παηδηψλ αθνινπζεί θαλνληθή θαηαλνκή κε κέζε 82

91 ηηκή 100 θαη ηππηθή απφθιηζε 15. Πνηα είλαη ε πηζαλφηεηα έλα παηδί λα έρεη δείθηε IQ κεηαμχ 80 θαη 120; Σν εξψηεκα απηφ είλαη ηζνδχλακν κε ηε δηαηχπσζε: πνην πνζνζηφ παηδηψλ πεξηκέλνπκε λα έρνπλ δείθηε IQ κεηαμχ 80 θαη 120; Ζ απάληεζε πξνθχπηεη απφ ηνλ ππνινγηζκφ ηνπ εκβαδνχ ηνπ θφθθηλνπ επίπεδνπ ρσξίνπ πνπ θαίλεηαη ζην ρήκα 15 θαη είλαη ίζν κε ή 81.8%. Ο ππνινγηζκφο ηνπ εκβαδνχ γίλεηαη κε ηε βνήζεηα ηεο πξνρσξεκέλεο καζεκαηηθήο έλλνηαο ηνπ νινθιεξψκαηνο πνπ μεθεχγεη απφ ηνπο ζθνπνχο απηήο ηεο εξγαζίαο. Γηα λα ππνινγίζνπκε ηελ πηζαλφηεηα απηή κε ηε βνήζεηα ηεο R πξέπεη θαηαξρήλ λα παξαηεξήζνπκε φηη: Pr 80 IQ 120 Pr IQ 120 Pr IQ 80, πνπ αληηζηνηρεί ζηηο παξαθάησ εληνιέο ηεο R: > pnorm(q=120, mean=100, sd=15)-pnorm(q=80, mean=100, sd=15) [1] ρήκα 15. Ζ θακπχιε ζπρλνηήησλ ηεο Καλνληθήο θαηαλνκήο ηνπ Παξαδείγκαηνο 8. Μπνξνχκε φκσο λα επηβεβαηψζνπκε πξνζεγγηζηηθά ηα απνηειέζκαηα ρξεζηκνπνηψληαο 83

92 ηνπο γλσζηνχο ηχπνπο επίπεδσλ ζρεκάησλ. Έηζη ην ζρήκα ηνπ θψδσλα πξνζεγγίδεηαη κε ηξίγσλν εκβαδνχ: άύ Σα δχν επίπεδα θνκκάηηα εθαηέξσζελ ηνπ θφθθηλνπ ρσξίνπ κπνξνχλ λα πξνζεγγηζηνχλ απφ νξζνγψληα ηξίγσλα, φπσο ην γξακκνζθηαζκέλν ηξίγσλν ηνπ ζρήκαηνο, εκβαδνχ: άύ Δπνκέλσο ην δεηνχκελν εκβαδφλ είλαη πεξίπνπ ή 80%, πνπ απνηειεί κηα πνιχ ηθαλνπνηεηηθή πξνζέγγηζε ηνπ ζσζηνχ απνηειέζκαηνο. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ηνπ ζρήκαηνο πεξηιακβάλνληαη ζην αξρείν probability_normal.r. Μηα άιιε πνιχ ζεκαληηθή ηδηφηεηα ηεο θαλνληθήο θαηαλνκήο πνπ βνεζά θαη ζηνλ ππνινγηζκφ πηζαλνηήησλ είλαη φηη ην 68% ησλ ηηκψλ ηνπ x βξίζθνληαη ζην δηάζηεκα, ην 95% ησλ ηηκψλ ζην δηάζηεκα 2 θαη ην 99% ησλ ηηκψλ ζην δηάζηεκα 3. Παπάδειγμα 8 (ςνέσεια) Ζ πηζαλφηεηα έλα παηδί λα έρεη δείθηε IQ κεηαμχ 70 θαη 130, κπνξεί λα ππνινγηζηεί άκεζα αλ παξαηεξήζνπκε φηη 2 70 θαη Δπνκέλσο Pr 70 IQ ή 95%. Δπίζεο, αλ ζεσξήζνπκε φηη ην IQ ησλ ραξηζκαηηθψλ παηδηψλ είλαη κεγαιχηεξν ή ίζν απφ ην 130, ην πνζνζηφ απηψλ ησλ παηδηψλ είλαη: 0.05 Pr IQ ή 97.5%. 2 Αλαιπηηθή παξνπζίαζε ηεο θαλνληθήο θαηαλνκήο κπνξεί λα αλαδεηήζεη ν αλαγλψζηεο 84

93 απφ ηνπο Johnson et al. (1994, ζει ) Οη θαηαλνκέο t θαη 2 χ Ζ θαηαλνκή t είλαη εμίζνπ ζεκαληηθή κε ηελ θαλνληθή. Οη δχν θαηαλνκέο παξνπζηάδνπλ ζεκαληηθέο νκνηφηεηεο. Δίλαη θαη νη δχν ζπκκεηξηθέο κε θσδσλνεηδή γξαθηθή παξάζηαζε. Ζ ζεκαληηθφηεξε δηαθνξά είλαη φηη ε θαηαλνκή t δηαζέηεη κηα δηαθνξεηηθή ζπλάξηεζε ππθλφηεηαο πηζαλφηεηαο γηα θάζε ηηκή ηεο παξακέηξνπ 1, ε νπνία αληηζηνηρεί ηνπο βαζκνχο ειεπζεξίαο ηεο θαηαλνκήο. Ο ζηαηηζηηθφο φξνο γηα ηνπο βαζκνύο ειεπζεξίαο (degrees of freedom) νξίδεηαη σο ν αξηζκφο ησλ παξαηεξήζεσλ ηνπ δείγκαηνο κείνλ ηνλ αξηζκφ ησλ πεξηνξηζκψλ πνπ δελ επηηξέπνπλ ζηηο παξαηεξήζεηο λα κεηαβάιινληαη ειεχζεξα (Ρνχζζνο & Σζανχζεο 2011, ζει. 293). Γηα λα θαηαλνήζνπκε ηελ έλλνηα ησλ βαζκψλ ειεπζεξίαο αο ππνζέζνπκε φηη έρνπκε έλα δείγκα πνπ απαξηίδεηαη απφ 5 παξαηεξήζεηο, π.ρ. 5, 2, 0, 1, 2, κε κέζν φξν ην 2. Απφ ηε ζηηγκή πνπ νη 5 ηηκέο κεηαβάιινληαη ειεχζεξα νη βαζκνί ειεπζεξίαο είλαη 5, δηφηη ζα κπνξνχζακε λα έρνπκε επηιέμεη νπνηεζδήπνηε 5 άιιεο ηηκέο, κε δηαθνξεηηθφ θάζε θνξά κέζν φξν. Αλ φκσο ζέινπκε έλα δείγκα κεγέζνπο 5, κε ηνλ ίδην κέζν φξν ηφηε έρνπκε έλαλ πεξηνξηζκφ. Αλ είρακε επηιέμεη ηηο 4 απφ ηηο πέληε ηηκέο, κε δεδνκέλν κέζν φξν ην 2, π.ρ. 4, 3, 0, 2, ηφηε ε επηινγή ηεο πέκπηεο ηηκήο δελ είλαη ειεχζεξε, δηφηη γηα λα έρνπκε κέζν φξν 2, ε πέκπηε ηηκή ηνπ δείγκαηνο x 5, ζα πξνθχςεη απφ ηε ζρέζε X x 9 x x5 Θα δηαπηζηψζνπκε ζηε ζπλέρεηα φηη νξηζκέλεο ζηαηηζηηθέο ζπλαξηήζεηο ελφο δείγκαηνο αθνινπζνχλ θαηαλνκή t κε βαζκνχο ειεπζεξίαο, ζπκβνιηθά t. Ο γεληθφο ηχπνο ηεο θαηαλνκήο t είλαη αξθεηά πνιχπινθνο θαη ζα δψζνπκε ελδεηθηηθά κφλν ηελ πεξίπησζε γηα 5, πνπ δίλεηαη απφ ηε ζρέζε: f x x

94 ην ρήκα 16 πνπ αθνινπζεί δίλεηαη ε γξαθηθή παξάζηαζε ηεο θαηαλνκήο γηα 1, 5, 50. Παξαηεξνχκε φηη θαζψο νη βαζκνί ειεπζεξίαο ηείλνπλ πξνο ην άπεηξν ε θαηαλνκή t πξνζεγγίδεη ηελ θαλνληθή θαηαλνκή. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ησλ ζρεκάησλ πεξηιακβάλνληαη ζην αξρείν t_graph.r. ρήκα 16. Οη θακπχιεο ζπρλνηήησλ ηεο θαηαλνκήο t γηα 1, 5 θαη 50 βαζκνχο ειεπζεξίαο. Ζ θαηαλνκή 2 εμαξηάηαη επίζεο απφ ηνπο βαζκνχο ειεπζεξίαο. εκαληηθή δηαθνξά κε ηηο ζπλαξηήζεηο ππθλφηεηαο πηζαλφηεηαο ησλ δχν πξνεγνχκελσλ θαηαλνκψλ είλαη φηη δελ είλαη ζπκκεηξηθή θαη φηη ε κεηαβιεηή παίξλεη κφλν ζεηηθέο ηηκέο. Ο ηχπνο θαη απηήο ηεο θαηαλνκήο είλαη αξθεηά πνιχπινθνο θαη ζα αξθεζηνχκε ζηε γξαθηθή ηνπ αλαπαξάζηαζε θαη ζηνλ ππνινγηζκφ πηζαλνηήησλ. Οη εληνιέο ηεο R γηα ηε δεκηνπξγία ησλ ζρεκάησλ πεξηιακβάλνληαη ζην αξρείν prob_chisq.r. Παπάδειγμα 9 (Καηανομή 2 ςπολογιζμόρ πιθανοηήηων) Έζησ φηη κηα κεηαβιεηή X αθνινπζεί θαηαλνκή 86 2 κε 12 βαζκνχο ειεπζεξίαο,

95 ζπκβνιηθά ππνινγίδεηαη σο εμήο: 2 X 12. Ζ πηζαλφηεηα ε X λα πάξεη ηηκή κηθξφηεξε ή ίζε π.ρ. απφ ην 22, > pchisq(q=22, df=12) [1] Αλ ζέινπκε ζηξνγγπινπνίεζε ζε ηέζζεξα δεθαδηθά ςεθία, ηφηε ζα ρξεζηκνπνηήζνπκε ηελ εληνιή round, σο εμήο: > round( pchisq(q=22, df=12), 4) [1] Γειαδή, βξήθακε φηη Pr X ή 96.25%. ρήκα 17. Ζ θακπχιε ζπρλνηήησλ ηεο θαηαλνκήο 2 κε 12 βαζκνχο ειεπζεξίαο. Σν εκβαδφλ ηνπ κπιε ρσξίνπ (shaded area) αληηζηνηρεί ζηελ πηζαλφηεηα ε κεηαβιεηή λα είλαη κεγαιχηεξε απφ 22. Αλ ζέινπκε ηελ πηζαλφηεηα ε X λα πάξεη ηηκή κεγαιχηεξε απφ ην 22, ηφηε επεηδή ην εκβαδφλ πνπ πεξηθιείεηαη απφ ηε ζπλάξηεζε θαη ηνλ νξηδφληην άμνλα ηζνχηαη κε έλα 87

96 πξνθχπηεη φηη: Pr X 22 1 Pr X ή 3.75%. Ζ ηηκή αληηζηνηρεί ζην εκβαδφλ ηνπ κπιε ρσξίνπ ηνπ ρήκαηνο 17, ελψ ην εκβαδφλ ηνπ ππφινηπνπ ιεπθνχ ρσξίνπ ηζνχηαη κε Έιεγρνη ππνζέζεσλ Ζ Δπαγσγηθή ηαηηζηηθή ή ηαηηζηηθή πκπεξαζκαηνινγία (Statistical Inference) κπνξεί λα νξηζηεί σο ην ζχλνιν ησλ κεζφδσλ ζηηο νπνίεο ρξεζηκνπνηνχληαη δεηγκαηηθά δεδνκέλα γηα λα ιεθζνχλ απνθάζεηο θαη λα πξνθχςνπλ ζπκπεξάζκαηα γηα νιφθιεξν ηνλ πιεζπζκφ (Γηαιακάο, 2004, ζει. 20). Ζ ζηαηηζηηθή κεζνδνινγία κε ηελ νπνία ζα αζρνιεζνχκε ζηα πιαίζηα ηεο δηπισκαηηθήο εξγαζίαο, πεξηιακβάλεη ηνπο έιεγρνπο ππνζέζεσλ (hypotheses tests), ηελ αλάιπζε ζπζρέηηζεο (correlation analysis), ηε γξακκηθή παιηλδξφκεζε (linear regression) θαη ηελ αλάιπζε δηαθχκαλζεο (analysis of variance). Ζ ζπνπδαηφηεηα ηεο επαγσγηθήο ζηαηηζηηθήο έγθεηηαη ηφζν ζηελ επέθηαζε ησλ ζπκπεξαζκάησλ απφ ην δείγκα ζε νιφθιεξν ηνλ πιεζπζκφ φζν θαη ζηελ αληηθεηκεληθφηεηα ησλ πνζνηηθψλ κεζφδσλ ηηο νπνίεο ρξεζηκνπνίεη, έηζη ψζηε νη ζεσξεηηθέο πξνθαηαιήςεηο ηνπ εξεπλεηή λα κελ επεξεάδνπλ ηα επξήκαηα ηεο έξεπλαο. κσο γηα λα πηνζεηήζνπκε ηα απνηειέζκαηα ηεο Δπαγσγηθήο ηαηηζηηθήο ζα πξέπεη λα αθνινπζνχληαη ζπγθεθξηκέλεο πξνυπνζέζεηο γηα ηελ θάζε εξεπλεηηθή κέζνδν θαη επηπιένλ λα δίλεηαη ηδηαίηεξε πξνζνρή ζηελ εμαγσγή ησλ ζπκπεξαζκάησλ ψζηε λα απνθεχγνληαη παξεξκελείεο, ζηηο νπνίεο αλαθεξζήθακε αλαιπηηθά ζηελ ελφηεηα 1.4. Οη έιεγρνη ησλ ζηαηηζηηθψλ ππνζέζεσλ είλαη απφ ηα πιένλ βαζηθά ζέκαηα ηεο ζηαηηζηηθήο ζπκπεξαζκαηνινγίαο. Ωο ππφζεζε κπνξνχκε λα νξίζνπκε κηα άπνςε ή έλα εξεπλεηηθφ εξψηεκα, ε αμηνιφγεζε ησλ νπνίσλ ρξήδεη δηεξεχλεζεο. Με ηηο δηαδηθαζίεο ηνπ ειέγρνπ ππνζέζεσλ θαζνξίδνπκε θαηά πφζν ηέηνηεο εξεπλεηηθέο ππνζέζεηο ηθαλνπνηνχληαη απφ ηα δεδνκέλα ηεο έξεπλαο. Οη εξεπλεηηθέο ππνζέζεηο φηαλ 88

97 δηαηππσζνχλ κε ηελ πην απζηεξή γιψζζα ηεο ζηαηηζηηθήο νδεγνχλ ζηηο ζηαηηζηηθέο ππνζέζεηο πνπ ειέγρνληαη κε καζεκαηηθέο δηαδηθαζίεο σο πξνο ηελ νξζφηεηά ηνπο. Οη έιεγρνη ππνζέζεσλ κε ηνπο νπνίνπο ζα αζρνιεζνχκε αθνξνχλ ηηο κέζεο ηηκέο, ελφο ή δχν δεηγκάησλ θαζψο θαη ην 2 θαιήο πξνζαξκνγήο θαη αλεμαξηεζίαο. Ζ εηζαγσγή ζηελ έλλνηα ησλ ζηαηηζηηθψλ ππνζέζεσλ ζα γίλεη κε ηε βνήζεηα ηνπ παξαθάησ παξαδείγκαηνο. Παπάδειγμα 11 (Έλεγσορ ςποθέζεων z test) Έρνπκε θαηαγξάςεη ηηο βαζκνινγίεο 10 καζεηψλ κηαο ηάμεο ζε κηα γξαπηή εμέηαζε ελφο καζήκαηνο θαη καο ελδηαθέξεη λα εμεηάζνπκε αλ ε κέζε επίδνζε ησλ καζεηψλ ζην ζπγθεθξηκέλν κάζεκα δηαθέξεη απφ ην 15, πνπ ζπλήζσο ζεσξείηαη ν κέζνο φξνο ηεο επίδνζεο ζε κία ηάμε. Ζ εξεπλεηηθή ππφζεζε: «ν κέζνο φξνο ηεο επίδνζεο ηεο ηάμεο είλαη δηαθνξεηηθή απφ ην 15» είλαη απνηέιεζκα παξαηήξεζεο απφ ηνλ εξεπλεηήεθπαηδεπηηθφ θαη ζα ειεγρζεί κε βάζε ηα δεδνκέλα πνπ ζπιιέρζεθαλ απφ ηηο βαζκνινγίεο ηεο γξαπηήο εμέηαζεο. Πξνθαλψο ε απάληεζε δελ κπνξεί λα δνζεί κφλν απφ ηνλ ππνινγηζκφ ηεο κέζεο ηηκήο x ηνπ δείγκαηνο ησλ βαζκνινγηψλ, ε νπνία ππφθεηηαη ζε απξφβιεπηνπο θαη ηπραίνπο παξάγνληεο. Πξέπεη λα θαζνξίζνπκε ηηο πξνυπνζέζεηο θαη ηα θξηηήξηα κε ηα νπνία ζα απνθαλζνχκε αλ ε κέζε ηηκή ηεο επίδνζεο είλαη ή δελ είλαη 15. Ζ δηαδηθαζία ηνπ ειέγρνπ ζηαηηζηηθψλ ππνζέζεσλ ζα παξνπζηαζηεί κε ηέζζεξα βήκαηα ηα νπνία ζα αθνινπζεζνχλ ζε φια ηα παξαθάησ παξαδείγκαηα θαη ζηελ πινπνίεζε ηνπο κέζσ ηεο R. 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Σα εξεπλεηηθά εξσηήκαηα κπνξνχλ λα πξνθχςνπλ είηε απφ ηζρπξέο πεπνηζήζεηο ηνπ εξεπλεηή είηε απφ ηε γεληθή εηθφλα πνπ πξνθχπηεη γηα ην δείγκα κε ηηο κεζφδνπο πεξηγξαθηθήο ζηαηηζηηθήο. Οη ζηαηηζηηθέο ππνζέζεηο πνπ πξνθχπηνπλ απφ ηα εξεπλεηηθά εξσηήκαηα ζε θάζε έιεγρν ππνζέζεσλ είλαη ε κεδεληθή ή αξρηθή 89

98 ππφζεζε (null hypothesis) πνπ ζπκβνιίδεηαη κε H 0 θαη ε ελαιιαθηηθή ή εξεπλεηηθή ππφζεζε (alternative ή research hypothesis) πνπ ζπκβνιίδεηαη κε H a. Ο φξνο κεδεληθή ππφζεζε πξνέθπςε απφ ην γεγνλφο φηη ζπρλά νη ππνζέζεηο ζρεκαηίδνληαη βάζεη θάπνησλ εξεπλεηηθψλ ηζρπξηζκψλ, π.ρ. φηη ε κέζε επίδνζε ησλ καζεηψλ ζην κάζεκα ηνπ Παξαδείγκαηνο 11 δηαθέξεη απφ κία ζπγθεθξηκέλε ηηκή, ην 15. Έηζη, ε H 0 είλαη ε ππφζεζε πνπ «κεδελίδεη», δειαδή αληηπαξαηίζεηαη ζηνλ ηζρπξηζκφ απηφ. Ζ κεδεληθή θαη ε ελαιιαθηηθή ππφζεζε ζην Παξάδεηγκα 11 δηαηππψλνληαη σο εμήο: H 0 : Ζ κέζε επίδνζε ηεο ηάμεο είλαη ίζε κε 15 ή H : 15 0 H : Ζ κέζε επίδνζε ηεο ηάμεο είλαη δηαθνξεηηθή απφ ην 15 ή H : 15. a Οη έιεγρνη ππνζέζεσλ φπσο ν πξνεγνχκελνο ιέγνληαη ακθίπιεπξνη έιεγρνη (twosided tests). Τπάξρνπλ επηπιένλ θαη νη κνλόπιεπξνη έιεγρνη (one-sided test) νη νπνίνη έρνπλ ίδηα κεδεληθή ππφζεζε κε ηνπο ακθίπιεπξνπο αιιά δηαθνξεηηθέο ελαιιαθηηθέο. ηελ πεξίπησζε ηνπ Παξαδείγκαηνο 11, ν δηδάζθσλ ηνπ καζήκαηνο ελδερνκέλσο λα παξαηήξεζε φηη ην γλσζηηθφ επίπεδν ηεο ηάμεο ζην κάζεκά ηνπ δελ αμηνινγείηαη απιψο σο δηαθνξεηηθφ απφ ην 15, αιιά είηε πάλσ απφ ην 15, νπφηε ε ελαιιαθηηθή ππφζεζε γίλεηαη: H : Ζ κέζε επίδνζε ηεο ηάμεο είλαη κεγαιχηεξε απφ ην 15 ή H : 15, a είηε θάησ απφ ην 15, νπφηε H : Ζ κέζε επίδνζε ηεο ηάμεο είλαη κηθξφηεξε απφ ην 15 ή H : 15. a a a a 2. Πξνϋπνζέζεηο. Ζ πην ζπλεζηζκέλε πξνυπφζεζε ζηνλ έιεγρν ππνζέζεσλ είλαη φηη ην δείγκα πξνέξρεηαη απφ έλαλ πιεζπζκφ πνπ αθνινπζεί θαλνληθή θαηαλνκή. Αλ ππνζέζνπκε φηη ηα δεδνκέλα ηνπ Παξαδείγκαηνο 11 πξνέξρνληαη απφ έλαλ θαλνληθφ πιεζπζκφ κε κέζε ηηκή θαη δηαθχκαλζε 90 2 απηφ ζεκαίλεη, ζχκθσλα κε ηελ ελφηεηα 3.4.1, φηη ε θακπχιε ζπρλνηήησλ ηνπ δείγκαηνο πξνζεγγίδεηαη απφ ηελ θσδσλνεηδή κνξθή ηεο θαλνληθήο θαηαλνκήο, ζηελ νπνία νη πεξηζζφηεξεο βαζκνινγίεο ησλ καζεηψλ ζπγθεληξψλνληαη γχξσ απφ ην θαη κε πνζνζηφ 68% ζην

99 δηάζηεκα. Δπηπιένλ, θαζψο νη ηηκέο ηεο βαζκνινγίαο απνκαθξχλνληαη απφ ην απηέο θαηαλέκνληαη ζπκκεηξηθά γχξσ απφ ην θαη κε πνζνζηά 95% ζην δηάζηεκα 2 θαη 99% ησλ ηηκψλ ζην δηάζηεκα 3. Απηφο ν πεξηγξαθηθφο έιεγρνο γηα ηελ ηζρχ ηεο πξνυπφζεζεο ηεο θαλνληθφηεηαο δελ είλαη αξθεηφο θαη απαηηνχληαη πην απζηεξνί ζηαηηζηηθνί έιεγρνη, φπσο ν ζηαηηζηηθφο έιεγρνο ησλ Kolmogorov-Smirnov (Mood et al., 1974, ζει Stuart, Ord & Arnold, 1999, ζει ), πνπ φκσο μεθεχγεη απφ ην ζθνπφ ηεο παξνχζαο κειέηεο. 3. Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Έλα ζεκειηψδεο δήηεκα ζηνπο ειέγρνπο ππνζέζεσλ είλαη ν θαζνξηζκφο ηνπ θξηηεξίνπ ζηαηηζηηθνχ ειέγρνπ. Έηζη, γηα ηελ πεξίπησζε ηνπ κέζνπ φξνπ ελφο δείγκαηνο, πξέπεη λα θαζνξίζνπκε πφζν «θνληά» ή «καθξηά» πξέπεη λα βξίζθεηαη ν δεηγκαηηθφο κέζνο φξνο x ζηελ θαζνξηζκέλε κέζε ηηκή, ψζηε λα ζεσξήζνπκε ηε δηαθνξά ηνπο 0 ζηαηηζηηθψο ζεκαληηθή. πγθεθξηκέλα, ζην Παξάδεηγκα 11 ζέινπκε λα εθηηκήζνπκε αλ ε δηαθνξά ησλ x θαη 0 15 είλαη ζηαηηζηηθψο ζεκαληηθή, γηα απηφ καο ελδηαθέξεη ε ηηκή ηεο δηαθνξάο ηνπο x 15. Σαπηφρξνλα φκσο πξέπεη λα ιεθζεί ππφςε ε δηαζπνξά ησλ ηηκψλ ηνπ x γηα δηαθνξεηηθά δείγκαηα απφ ηνλ ίδην πιεζπζκφ. Έηζη, εκπεηξηθά κπνξνχκε λα πνχκε φηη ε δηαθνξά x 15 2 ζεσξείηαη κάιινλ ζεκαληηθή ζηελ εηθνζάβαζκε θιίκαθα αμηνιφγεζεο, ελψ ζεσξείηαη κάιινλ ακειεηέα ζηελ αληίζηνηρε εθαηνληάβαζκε. ηαλ ην δείγκα πξνέξρεηαη απφ έλαλ πιεζπζκφ κε κέζε ηηκή θαη δηαθχκαλζε 2 ηφηε έρεη απνδεηρζεί (Mood et al. 1974, ζει. 231) φηη ε ηππηθή απφθιηζε, πνπ είλαη κέηξν δηαζπνξάο, ησλ ηηκψλ ηνπ x ηζνχηαη κε, πνπ νλνκάδεηαη ηππηθφ ζθάικα ηνπ κέζνπ φξνπ (standard error ή ζπληνκνγξαθηθά SE). Λακβάλνληαο ππφςε ηελ παξαπάλσ παξαηήξεζε νξίδνπκε ηε γεληθή κνξθή ηεο ζηαηηζηηθήο ζπλάξηεζεο πνπ ρξεζηκνπνηείηαη γηα ηνλ έιεγρν ππνζέζεσλ ηνπ κέζνπ φξνπ ελφο δείγκαηνο (Καηζήο 2011, ζει. 84, Δκβαισηήο θ. ζπλ. 2006, ζει. 53 θαη Γηαιακάο 2004, ζει. 115): 91

100 δεηγκαηηθφο κέζνο φξνο θαζνξηζκέλε ηηκή. ηππηθή απφθιηζε δεηγκαηηθνχ κέζνπ φξνπ Ζ παξαπάλσ πνζφηεηα νλνκάδεηαη ζηαηηζηηθή ζπλάξηεζε ή απιά ζηαηηζηηθφ. Γηα ην Παξάδεηγκα 11, αλ ην δείγκα πξνέξρεηαη απφ έλαλ πιεζπζκφ κε γλσζηή δηαθχκαλζε 2, ην ζηαηηζηηθφ ειέγρνπ γίλεηαη: x 15 z Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Ο θαλφλαο απφθαζεο βαζίδεηαη ζηελ πηζαλφηεηα πνπ ππάξρεη γηα κηα ζηαηηζηηθή ζπλάξηεζε (φπσο ην z) λα πάξεη ηηκέο πνπ νθείινληαη ζε ηπραίνπο παξάγνληεο νη νπνίνη αιινηψλνπλ ηελ πξαγκαηηθφηεηα. Αλ ε πηζαλφηεηα απηή, πνπ νλνκάδεηαη ηηκή p (p value), είλαη κηθξή ηφηε απνξξίπηνπκε ηε κεδεληθή ππφζεζε. Σν αλψηαην απνδεθηφ φξην γηα ηελ ηηκή p ιέγεηαη επίπεδν ζεκαληηθόηεηαο (significance level) θαη ζπκβνιίδεηαη κε a. Πην ζπγθεθξηκέλα, ην a εθθξάδεη ην αλψηαην επίπεδν ηεο πηζαλφηεηαο απφξξηςεο ηεο κεδεληθήο ππφζεζεο φηαλ ζηελ πξαγκαηηθφηεηα ηζρχεη. Γηα απηφ θαη επηδηψθνπκε απηφ ην ζθάικα λα είλαη πνιχ κηθξφ, ζπλήζσο 0.01 ή Ζ δηαδηθαζία ηνπ θαλφλα απφθαζεο θαη ηεο εμαγσγήο ζπκπεξαζκάησλ μεθηλά κε ηνλ ππνινγηζκφ ηνπ θξηηεξίνπ ειέγρνπ. Οη δπλαηέο ηηκέο πνπ κπνξεί λα πάξεη ε ζηαηηζηηθή ζπλάξηεζε ειέγρνπ ρσξίδνληαη ζε απηέο πνπ απνηεινχλ ηελ πεξηνρή απφξξηςεο ηεο κεδεληθήο ππφζεζεο θαη ζε απηέο πνπ ζρεκαηίδνπλ ηελ πεξηνρή απνδνρήο ηεο κεδεληθήο ππφζεζεο. Ο θαζνξηζκφο ησλ πεξηνρψλ γίλεηαη κε βάζε ην επηζπκεηφ επίπεδν ζεκαληηθφηεηαο. Δηδηθφηεξα, γηα ην Παξάδεηγκα 11 απνδεηθλχεηαη φηη, θάησ απφ ηελ ππφζεζε ηεο θαλνληθφηεηαο, ε ζηαηηζηηθή ζπλάξηεζε 0 z x αθνινπζεί θαλνληθή θαηαλνκή κε κέζε ηηκή 0 θαη δηαθχκαλζε 1 (Παπατσάλλνπ & Φεξεληίλνο 1983, ζει ). Οπφηε, φηαλ a 0.05, ε πεξηνρή απφξξηςεο 92

101 θαζνξίδεηαη απφ ηε ζρέζε: φπνπ 1.96 z ή z, είλαη ε ηηκή γηα ηελ νπνία z δείρλεη ην παξαθάησ ζρήκα. Pr ή z 0.05 ή 5%, φπσο Ζ παξαπάλσ πηζαλφηεηα αληηζηνηρεί ζην εκβαδφλ ηνπ θφθθηλνπ ρσξίνπ ηνπ ρήκαηνο 18. Αλ γηα παξάδεηγκα, ε ηηκή ηεο ζηαηηζηηθήο ζπλάξηεζεο είλαη z 2.37, ηφηε ηζρχεη φηη z, δηφηη , νπφηε ε κεδεληθή ππφζεζε απνξξίπηεηαη. ην ίδην ζπκπέξαζκα κπνξνχκε λα θαηαιήμνπκε επνπηηθά, δηφηη αλ ζεσξεηηθά εθηειέζνπκε ην ίδην πείξακα πνιιέο θνξέο αλακέλνπκε κε βάζε ην ζρήκα, φηη ην 95% ησλ ηηκψλ ηνπ z ζα βξίζθεηαη ζην ιεπθφ θνκκάηη ηνπ νξηδφληηνπ άμνλα, δειαδή κεηαμχ ηνπ θαη ηνπ. Έηζη φηαλ ην z βξίζθεηαη ζηελ θφθθηλε πεξηνρή ζεσξνχκε φηη είλαη «καθξηά» απφ ηε κέζε ηηκή ηνπ πνπ είλαη ην κεδέλ θαη έηζη ε κεδεληθή ππφζεζε απνξξίπηεηαη, ελψ αλ βξίζθεηαη ζηε ιεπθή πεξηνρή ζεσξνχκε φηη είλαη «θνληά» ζην κεδέλ νπφηε ε κεδεληθή ππφζεζε δελ απνξξίπηεηαη. ρήκα 18. Γξαθηθή εξκελεία ηνπ επηπέδνπ ζεκαληηθφηεηαο α θαη ηεο ηηκήο p ζην Παξάδεηγκα

102 Σν ζθάικα πνπ πξνθχπηεη απφ ηελ εζθαικέλε απφξξηςε ηεο κεδεληθήο ππφζεζεο ιέγεηαη ζθάικα ηύπνπ Ι, ελψ ην ζθάικα πνπ πξνθχπηεη απφ ηελ εζθαικέλε απνδνρή ηεο κεδεληθήο ππφζεζεο ιέγεηαη ζθάικα ηύπνπ ΙΙ θαη ε αληίζηνηρε πηζαλφηεηα ζπκβνιίδεηαη κε. Οη δπλαηέο επηινγέο απφ ηελ εθαξκνγή ελφο ζηαηηζηηθνχ ηεζη θαη ηα αληίζηνηρα ζθάικαηα θαίλνληαη ζηνλ παξαθάησ πίλαθα: Πξαγκαηηθόηεηα πκπέξαζκα ειέγρνπ H 0 είλαη αιεζηλή Απνδνρή ηεο H 0 Απφξξηςε ηεο H 0 σζηή απφθαζε Λαλζαζκέλε απφθαζε θάικα ηχπνπ Η H a είλαη αιεζηλή Λαλζαζκέλε απφθαζε - θάικα ηχπνπ ΗΗ σζηή απφθαζε Δίλαη πξνθαλέο φηη ζα πξνηηκήζνπκε εθείλν ην ζηαηηζηηθφ ηεζη κε ηα κηθξφηεξα a θαη ηαπηνρξφλσο. Έρεη φκσο απνδεηρζεί φηη ε ηαπηφρξνλε ειαρηζηνπνίεζε ησλ a θαη είλαη αδχλαηε (Παπατσάλλνπ & Φεξεληίλνο 1983, ζει. 131). Γεληθά δελ αζθείηαη έιεγρνο πάλσ ζην, είλαη φκσο γλσζηφ φηη είλαη κεγαιχηεξν απφ ην a (Γηαιακάο 2004, ζει. 116). Έλα ηζνδχλακνο θαλφλαο απφθαζεο βαζίδεηαη ζηνλ ππνινγηζκφ ηεο ηηκήο p πνπ απνηειεί ην ειάρηζην επίπεδν ζεκαληηθφηεηαο ζην νπνίν κπνξεί λα απνξξηθζεί ε κεδεληθή ππφζεζε (Stuart et al., 1999, ζει. 172). ην παξαπάλσ παξάδεηγκα ε ηηκή ηνπ p πξνθχπηεη σο Pr z 2.37 ή z θαη αληηζηνηρεί ζην εκβαδφλ ηνπ γξακκνζθηαζκέλνπ ρσξίνπ ηνπ ζρήκαηνο. ε απηή ηελ πεξίπησζε αλ ην εκβαδφλ ηνπ ρσξίνπ πνπ αληηζηνηρεί ζηελ ηηκή p (γξακκνζθηαζκέλν ρσξίν) είλαη κηθξφηεξν ή ίζν απφ ην εκβαδφλ ηνπ ρσξίνπ πνπ αληηζηνηρεί ζην επίπεδν ζεκαληηθφηεηαο a (θφθθηλν ρσξίν) ηφηε απνξξίπηνπκε ηε κεδεληθή ππφζεζε. Γειαδή, ζπγθξίλνπκε ηελ ηηκή p πνπ ζα πξνθχςεη απφ ην δείγκα καο κε ην επίπεδν 94

103 ζεκαληηθφηεηαο θαη πηνζεηνχκε ηνλ αθφινπζν θαλφλα απφθαζεο (Καηζήο θαη ζπλ., 2010, ζει. 80): Απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a Γελ απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a. πσο είδακε, ε ζηαηηζηηθή απφθαζε ζπλίζηαηαη ζηελ απφξξηςε ή φρη ηεο κεδεληθήο ππφζεζεο, ζχκθσλα κε ηνλ θαλφλα απφθαζεο. Ο εξεπλεηήο φκσο ζα πξέπεη λα είλαη ζε ζέζε λα αληιήζεη φζν γίλεηαη πεξηζζφηεξεο πιεξνθνξίεο απφ ηα ζηαηηζηηθά απνηειέζκαηα. Γηα λα γίλεη απηφ ζα πξέπεη λα κεηαζρεκαηίζνπκε ηα ζηαηηζηηθά απνηειέζκαηα ζε εξεπλεηηθά ζπκπεξάζκαηα, δειαδή εθθξάζεηο θαη ινγηθέο πξνηάζεηο νη νπνίεο (King et al., 2000, ζει. 347): πεξηέρνπλ ηα αθξηβή αξηζκεηηθά απνηειέζκαηα πνπ είλαη αλαγθαία γηα ηελ εμαγσγή εξεπλεηηθψλ ζπκπεξαζκάησλ ζπκπεξηιακβάλνπλ ηελ έλλνηα ηεο αβεβαηφηεηαο ή ησλ ιαζψλ ζηα νπνία ππφθεηληαη νη ζηαηηζηηθνί ππνινγηζκνί, φπσο είλαη ηα ζηαηηζηηθά ζθάικαηα ηχπνπ Η θαη ΗΗ, πνπ έρνπκε ήδε αλαιχζεη θαη δελ απαηηνχλ εμεηδηθεπκέλεο γλψζεηο ζηαηηζηηθήο γηα ηελ θαηαλφεζή ηνπο. Δπαλαθέξνληαο ην Παξάδεηγκα 11, ζηελ πεξίπησζε πνπ απνξξηθζεί ε κεδεληθή ππφζεζε ην εξεπλεηηθφ ζπκπέξαζκα πνπ ηθαλνπνηεί ηα παξαπάλσ θξηηήξηα, ζα κπνξνχζε λα είλαη: «Ζ κέζε επίδνζε ηεο ηάμεο ζην ζπγθεθξηκέλν κάζεκα δηαθέξεη απφ ην 15 κε πηζαλφηεηα ιάζνπο 1.8%». ηελ πεξίπησζε πνπ ε κεδεληθή ππφζεζε δελ απνξξίπηεηαη ε δηαηχπσζε ηνπ εξεπλεηηθνχ ζπκπεξάζκαηνο ζα κπνξνχζε λα είλαη: «Ζ κέζε επίδνζε ηεο ηάμεο ζην ζπγθεθξηκέλν κάζεκα είλαη 15. Δπηπιένλ, επεηδή ην δείγκα ησλ 10 καζεηψλ πξνέξρεηαη απφ ηνλ πιεζπζκφ φισλ ησλ καζεηψλ νη νπνίνη θνηηνχλ ζε απηή ηελ ηάμε πνπ αθνινπζεί θαλνληθή θαηαλνκή κε γλσζηή δηαθχκαλζε 2 1, αλακέλνπκε φηη ην 95% ησλ βαζκνινγηψλ ζε επφκελε γξαπηή εμέηαζε ζα βξίζθνληαη κεηαμχ ησλ ηηκψλ , δειαδή κεηαμχ ηνπ 12 θαη ηνπ 18.». Οη έιεγρνη ππνζέζεσλ κε ηνπο νπνίνπο ζα αζρνιεζνχκε ζηελ παξνχζα κειέηε είλαη 95

104 νη εμήο: a. Έιεγρνο γηα ηε κέζε ηηκή ελόο πιεζπζκνύ κε γλσζηή δηαθύκαλζε. Ζ δηαδηθαζία απηνχ ηνπ ειέγρνπ ππνζέζεσλ πεξηιακβάλεη ηα εμήο ζηάδηα: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Γηα ηνλ ακθίπιεπξν έιεγρν έρνπκε ηηο ππνζέζεηο ελψ νη δχν κνλφπιεπξνη έιεγρνη είλαη H0: 0 έλαληη Ha : 0, H0: 0 έλαληη Ha : 0 θαη H0: 0 έλαληη Ha : Πξνϋπνζέζεηο. Σν δείγκα κεγέζνπο πξνέξρεηαη απφ έλαλ πιεζπζκφ ηα ζηνηρεία ηνπ νπνίνπ αθνινπζνχλ θαλνληθή θαηαλνκή κε γλσζηή δηαθχκαλζε Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Σν θξηηήξην ειέγρνπ είλαη ε ζπλάξηεζε z κε: z 0, 96 x ε νπνία θάησ απφ ηηο παξαπάλσ πξνυπνζέζεηο αθνινπζεί θαλνληθή θαηαλνκή κε κέζε ηηκή 0 θαη δηαθχκαλζε 1, φηαλ ηζρχεη ε ππφζεζε H Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Ο θαλφλαο απφθαζεο γηα ηνλ ακθίπιεπξν έιεγρν βαζίδεηαη ζηελ πεξηνρή απφξξηςεο z ή z, φπνπ είλαη κηα ηηκή γηα ηελ νπνία Pr z ή z a. Γηα ηνλ κνλφπιεπξν έιεγρν H0: 0 έλαληη Ha : 0 ε πεξηνρή απφξξηςεο ηεο κεδεληθήο ππφζεζεο είλαη z, φπνπ ηθαλνπνηεί ηε ζρέζε Pr z a, ελψ γηα ηνλ άιιν κνλφπιεπξν έιεγρν ε πεξηνρή απφξξηςεο είλαη z, φπνπ ηθαλνπνηεί ηε ζρέζε Pr z a. ηελ πξάμε φκσο ρξεζηκνπνηείηαη ζπλήζσο ε δεχηεξε πξνζέγγηζε γηα ηνλ θαλφλα απφθαζεο κε ηελ ηηκή p, ε νπνία είλαη θνηλή γηα φινπο ηνπο ζηαηηζηηθνχο ειέγρνπο. πσο είδακε, ζχκθσλα κε απηήλ, απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a

105 ελψ δελ απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a. Παπάδειγμα 11 ( z test επεξεπγαζία με ηην R) Οη βαζκνινγίεο ησλ 10 καζεηψλ ηεο ηάμεο είλαη: 13, 15, 17, 18, 20, 10, 14, 16, 16, 15. Ζ εηζαγσγή ησλ δεδνκέλσλ ζηελ R γίλεηαη κε ηελ εληνιή > grades <- c(13, 15, 17, 18, 20, 10, 14, 16, 16, 15) Καηφπηλ, αθνινπζνχκε ηε δηαδηθαζία πνπ έρνπκε πεξηγξάςεη: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Γηα ην ακθίπιεπξν ζηαηηζηηθφ ηεζη έρνπκε H 0 : Ζ κέζε επίδνζε ηεο ηάμεο είλαη ίζε κε 15 ή H : 15 0 H : Ζ κέζε επίδνζε ηεο ηάμεο είλαη δηάθνξε απφ ην 15 ή H : 15. a 2. Πξνϋπνζέζεηο. Τπνζέηνπκε φηη ε δεηγκαηνιεςία πξνέξρεηαη απφ θαλνληθή θαηαλνκή κε ηππηθή απφθιηζε Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Αξρηθά ελεξγνπνηνχκε ην παθέην TeachingDemos θαη αθνινχζσο θαινχκε ηε ζπλάξηεζε z.test(). ηε ζπλάξηεζε απηή δίλνπκε ηελ πξνθαζνξηζκέλε ηηκή 0 15 κε ην φξηζκα mu = 15, επηιέγνπκε ηε κνξθή ηεο ελαιιαθηηθήο ππφζεζεο κε ην φξηζκα alternative κε δπλαηέο ηηκέο κία απφ ηηο "two.sided", "less", "greater", νξίδνπκε ηελ ηππηθή απφθιηζε 1 κε ην φξηζκα sd = 1 θαη ηέινο ην επίπεδν ζεκαληηθφηεηαο, conf.level = 0.95, αλ επηζπκνχκε a Γειαδή, > z.test(grades, mu=15, sd=1) Δπηζεκαίλνπκε φηη δελ ρξεηάζηεθε λα δψζνπκε ηα νξίζκαηα alternative θαη conf.level ηα νπνία έρνπλ σο πξνθαζνξηζκέλεο ηηκέο ηηο "two.sided" θαη 0.95 αληίζηνηρα. Απηφ είλαη απαξαίηεην λα γίλεη αλ επηιέμνπκε γηα νπνηνδήπνηε φξηζκα δηαθνξεηηθή απφ ηελ πξνθαζνξηζκέλε ηηκή. Σα απνηειέζκαηα πνπ πξνθχπηνπλ είλαη: One Sample z-test data: grades 97 a

106 z.mean = , n = , Std. Dev. = 1.000, SE of the sample mean = 0.316, p-value = alternative hypothesis: true mean is not equal to percent confidence interval: sample estimates: mean of grades Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Απφ φια απηά θπξίσο καο ελδηαθέξεη ε ηηκή p, πνπ είλαη ίζε κε , ε νπνία είλαη κεγαιχηεξε απφ ην a 0.05, νπφηε ε κεδεληθή ππφζεζε δελ απνξξίπηεηαη. Γειαδή δελ κπνξνχκε λα απνξξίςνπκε φηη ε κέζε επίδνζε ησλ καζεηψλ είλαη ίζε κε 15. b. Έιεγρνο γηα ηε κέζε ηηκή ελόο πιεζπζκνύ κε άγλσζηε δηαθύκαλζε. Σν Παξάδεηγκα 11 παξνπζηάδεη ην ζεκαληηθφ κεηνλέθηεκα ηεο εθ ησλ πξνηέξσλ γλψζεο ηεο ζεσξεηηθήο δηαθχκαλζεο πεξηπηψζεηο απηέο ρξεζηκνπνηείηαη ην t ηεζη. 2, θάηη πνπ ζπλήζσο δε ζπκβαίλεη ζηελ πξάμε. Γηα ηηο 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Γηα ηνλ ακθίπιεπξν έιεγρν έρνπκε ηηο ππνζέζεηο ελψ νη δχν κνλφπιεπξνη έιεγρνη είλαη H0: 0 έλαληη Ha : 0, H0: 0 έλαληη Ha : 0 θαη H0: 0 έλαληη Ha : Πξνϋπνζέζεηο. Σν δείγκα κεγέζνπο πξνέξρεηαη απφ έλαλ πιεζπζκφ ηα ζηνηρεία ηνπ νπνίνπ αθνινπζνχλ θαλνληθή θαηαλνκή κε άγλσζηε δηαθχκαλζε. 3. Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Σν θξηηήξην ειέγρνπ απνηειεί ε ζπλάξηεζε t κε: t 0, 98 x s

107 φπνπ s είλαη ε δεηγκαηηθή δηαθχκαλζε. Ζ πνζφηεηα t αθνινπζεί θάησ απφ ηηο παξαπάλσ πξνυπνζέζεηο ηελ θαηαλνκή t κε 1 βαζκνχο ειεπζεξίαο, φηαλ ηζρχεη ε ππφζεζε H Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a ελψ δελ απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a. Παπάδειγμα 12 (Έλεγσορ ςποθέζεων t test με έναν πληθςζμό) Θεσξνχκε φηη νη καζεηέο ειηθίαο 12 εηψλ αζρνινχληαη θαηά κέζν φξν 8 ψξεο εβδνκαδηαίσο κε εμσζρνιηθέο δξαζηεξηφηεηεο (μέλεο γιψζζεο, αζιεηηζκφο, θ.ιπ). Οη αξηζκνί 12, 17, 9.5, 7.5, 6.5, 9.5, 11, 14, 8.5, 9.5 αθνξνχλ ηηο ψξεο πνπ αθηεξψλνπλ ηελ εβδνκάδα δέθα ηπραία επηιεγκέλνη καζεηέο απηήο ηεο ειηθίαο γηα εμσζρνιηθέο δξαζηεξηφηεηεο. Μαο ελδηαθέξεη λα εμεηάζνπκε εάλ ν αξρηθφο ζπιινγηζκφο είλαη ζσζηφο. Σν παξάδεηγκα αλαθέξεηαη απφ ηνπο Καηζή θ. ζπλ. (2010, ζει. 85). 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Καζνξίδνπκε ηηο ζηαηηζηηθέο ππνζέζεηο: H : 0 Οη καζεηέο απαζρνινχληαη θαηά κέζν φξν 8 ψξεο ηελ εβδνκάδα ζε εμσζρνιηθέο δξαζηεξηφηεηεο, δειαδή H : 8 έλαληη 0 Ha : Οη καζεηέο δελ απαζρνινχληαη θαηά κέζν φξν 8 ψξεο ηελ εβδνκάδα ζε εμσζρνιηθέο δξαζηεξηφηεηεο, δειαδή Ha : Πξνϋπνζέζεηο. Αξρηθά ειέγρνπκε αλ ηα δεδνκέλα καο πιεξνχλ ηελ πξνυπφζεζε ηεο θαλνληθφηεηαο. Γηα απηφ ζην ρήκα 19 παξαζέηνπκε ην ηζηφγξακκα ησλ δεδνκέλσλ καο, ηνλ αξηζκφ ησλ ζηνηρείσλ ζε θάζε θιάζε θαη ηελ αληίζηνηρε ζεσξεηηθή θαλνληθή θαηαλνκή πνπ κπνξνχκε λα πξνζαξκφζνπκε ζηα δεδνκέλα (κε ηελ κπιε γξακκή). Δπνπηηθά δηαπηζηψλνπκε φηη επηηπγράλεηαη κηα ηθαλνπνηεηηθή πξνζαξκνγή ηεο θακπχιεο ηεο θαλνληθήο θαηαλνκήο ζηα δεδνκέλα. Απηφ ζεκαίλεη φηη κπνξνχκε λα εθαξκφζνπκε ην t test. Γηα έλα πην απζηεξφ έιεγρν 99

108 ηεο θαλνληθφηεηαο ππελζπκίδνπκε φηη ελδείθλπηαη ην ηεζη ησλ Kolmogorov- Smirnov. ρήκα 19. Ηζηφγξακκα ζρεηηθψλ ζπρλνηήησλ ησλ δεδνκέλσλ ηνπ Παξαδείγκαηνο 12. Ζ ζπλερήο γξακκή παξηζηάλεη ηελ θακπχιε ζπρλνηήησλ ηεο θαλνληθήο θαηαλνκήο πνπ πξνζαξκφδεηαη ζηα δεδνκέλα θαη ε δηαθεθνκκέλε θαηαθφξπθε γξακκή ηε κέζε ηηκή ηεο θαηαλνκήο. 3. Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Τπνινγίδνπκε ηελ ηηκή ηνπ ζηαηηζηηθνχ t θαη ηελ ηηκή p γηα επίπεδν ζεκαληηθφηεηαο a πγθεθξηκέλα νη ππνινγηζκνί δίλνπλ t θαη ηηκή p Γηα λα πινπνηήζνπκε απηνχο ηνπο ππνινγηζκνχο κε ηελ R, αξρηθά εηζάγνπκε ηα δεδνκέλα κε ην δηάλπζκα activities, σο εμήο: > activities <- c(12, 17, 9.5, 7.5, 6.5, 9.5, 11, 14, 8.5, 9.5) Καηφπηλ, θαινχκε ηε ζπλάξηεζε t.test(). πγθεθξηκέλα, θαζνξίδνπκε φηη ην δηάλπζκα ησλ δεδνκέλσλ x αληηζηνηρεί ζην δηάλπζκα activities θαη ηελ πξνθαζνξηζκέλε ηηκή 0 8 κε ην φξηζκα mu=8. Ζ ζπλάξηεζε απηή έρεη πξνθαζνξηζκέλεο ηηκέο γηα ην είδνο ηνπ ειέγρνπ (ακθίπιεπξνο) θαη γηα ην επίπεδν 100

109 ζεκαληηθφηεηαο (0.05), νπφηε δελ ρξεηάδεηαη λα δνζνχλ. Έηζη, > t.test(x=activities, mu=8) One Sample t-test data: activities t = 2.514, df = 9, p-value = alternative hypothesis: true mean is not equal to 8 95 percent confidence interval: sample estimates: mean of x 10.5 Αλ δελ καο ελδηαθέξνπλ φιεο απηέο νη πιεξνθνξίεο ηφηε κπνξνχκε λα επηιέμνπκε νξηζκέλεο απφ απηέο κε ηελ εληνιή > t.test(x=activities, mu=8)$statistic t ε νπνία καο δίλεη κφλν ηελ ηηκή ηνπ ζηαηηζηηθνχ t ή > t.test(x=activities, mu=8)$p.value [1] ε νπνία καο δίλεη κφλν ηελ ηηκή p. 4. Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Γηα a 0.05 παξαηεξνχκε φηη p a, νπφηε απνξξίπηνπκε ηε κεδεληθή ππφζεζε. Σν ζπκπέξαζκα απηφ ζπκθσλεί θαη κε ην γξάθεκα ηνπ ηζηνγξάκκαηνο, ζην πνίν ε θαηαθφξπθε δηαθεθνκκέλε γξακκή αληηζηνηρεί ζηε κέζε ηηκή ηεο θαλνληθήο θαηαλνκήο πνπ δηαθέξεη ζεκαληηθά απφ ην 8. Φαίλεηαη φηη είλαη πεξίπνπ Σν εξεπλεηηθφ ζπκπέξαζκα κε πηζαλφηεηα ιάζνπο 3.31% είλαη φηη νη καζεηέο ειηθίαο 12 εηψλ δελ αζρνινχληαη θαηά κέζν φξν 8 ψξεο εβδνκαδηαίσο κε εμσζρνιηθέο δξαζηεξηφηεηεο. Με βάζε ην ρήκα 19 αλ επαλαιάβνπκε ην t test γηα ην ίδην δείγκα ζα πξέπεη λα αλαδεηήζνπκε ηελ πξνθαζνξηζκέλε ηηκή 0 ιίγν πάλσ απφ ην 10, ίζσο c. Έιεγρνο γηα ηε ζύγθξηζε ησλ κέζσλ ηηκώλ δύν πιεζπζκώλ. Οη έιεγρνη ππνζέζεσλ 101

110 γηα ηε κέζε ηηκή ελφο πιεζπζκνχ επεθηείλνληαη ζε δείγκαηα πνπ πξνέξρνληαη απφ δχν πιεζπζκνχο. ηελ θαηεγνξία ησλ δχν πιεζπζκψλ βάδνπκε πεξηπηψζεηο φπνπ έρνπκε πξαγκαηηθά δχν δηαθνξεηηθνχο πιεζπζκνχο (π.ρ. δεηγκαηνιεςία απφ ηνπο καζεηέο δχν δηαθνξεηηθψλ ηάμεσλ), αιιά θαη φηαλ έρνπκε ηνλ ίδην πιεζπζκφ απφ ηνλ νπνίν παίξλνπκε δείγκα δχν θνξέο (π.ρ. δχν δεηγκαηνιεςίεο πνπ αθνξνχλ ηελ ίδηα κεηαβιεηή απφ ηνπο καζεηέο ηεο ίδηαο ηάμεο). Παπάδειγμα 13 (Έλεγσορ ςποθέζεων) Μαο ελδηαθέξεη λα ζπγθξίλνπκε ηελ απνηειεζκαηηθφηεηα δχν δηαθνξεηηθψλ κεζφδσλ δηδαζθαιίαο. Γηα απηφ ρσξίδνπκε ηνπο καζεηέο ζε δχν νκάδεο, ζε θάζε κία απφ ηηο νπνίεο δηδάζθεηαη κία κέζνδνο δηδαζθαιίαο. Γηα λα έρνπκε αμηφπηζηα απνηειέζκαηα επηδηψθνπκε νη δχν νκάδεο λα απνηεινχληαη απφ καζεηέο κε ηζνδχλακεο πεξίπνπ ηθαλφηεηεο. Μεηά ηελ νινθιήξσζε ηεο εθπαηδεπηηθήο δηαδηθαζίαο αμηνινγνχκε ηηο νκάδεο. Θα ειέγμνπκε θαηά πφζν δηαθέξνπλ νη κέζνη φξνη ησλ βαζκνινγηψλ ησλ δχν νκάδσλ. Παπάδειγμα 14 (Έλεγσορ ςποθέζεων) Μαο ελδηαθέξεη λα εμεηάζνπκε ηελ επίδξαζε ησλ λέσλ ηερλνινγηψλ ζηελ εθπαηδεπηηθή δηαδηθαζία. Γηα απηφ, κεηά ηνλ «παξαδνζηαθφ» ηξφπν δηδαζθαιίαο κηαο δηδαθηηθήο ελφηεηαο, δηδάζθεηαη ζηνπο καζεηέο κηαο ηάμεο ε επφκελε δηδαθηηθή ελφηεηα κε ηε βνήζεηα ηερλνινγηψλ πιεξνθνξίαο θαη επηθνηλσλίαο (ΣΠΔ). Οη καζεηέο αμηνινγνχληαη πξηλ θαη κεηά ηε δηδαζθαιία κε ηηο λέεο ηερλνινγίεο. Σα δεδνκέλα απνηεινχληαη απφ έλα δεχγνο βαζκνινγηψλ γηα θάζε καζεηή. Ο εξεπλεηήο ελδηαθέξεηαη λα εμεηάζεη αλ ε επίδνζε ησλ καζεηψλ βειηηψζεθε κεηά ηελ ρξήζε ησλ ΣΠΔ. ην Παξάδεηγκα 13 ηα δείγκαηα πξνέξρνληαη απφ καζεηέο δχν δηαθνξεηηθψλ νκάδσλ, νπφηε είλαη αλεμάξηεηα, ελψ ζην Παξάδεηγκα 14 πξνέξρνληαη απφ ηνπο ίδηνπο καζεηέο, νπφηε είλαη εμαξηεκέλα. ε θάζε πεξίπησζε, φηαλ έρνπκε δχν δείγκαηα 102

111 κεγέζνπο 1, 2, κε δεηγκαηηθέο κέζεο ηηκέο x, y θαη δεηγκαηηθέο δηαθπκάλζεηο 2 s αληίζηνηρα, ηφηε έρνπκε δχν ειέγρνπο ππνζέζεσλ γηα αλεμάξηεηα θαη εμαξηεκέλα 2 δείγκαηα πνπ αλαιχνληαη ζηε ζπλέρεηα. Ι. Αλεμάξηεηα δείγκαηα. 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. H 0 : Γελ ππάξρεη δηαθνξά ζηε κέζε ηηκή ησλ δχν πιεζπζκψλ ή H :, έλαληη H :. H a : Τπάξρεη δηαθνξά ζηε κέζε ηηκή ησλ δχν πιεζπζκψλ ή a 1 2 Αλάινγα κπνξνχλ λα δηαηππσζνχλ θαη νη δχν κνλφπιεπξνη έιεγρνη. 2. Πξνϋπνζέζεηο. Σα δείγκαηα πξνέξρνληαη απφ δχν πιεζπζκνχο πνπ αθνινπζνχλ ηελ θαλνληθή θαηαλνκή κε ζεσξεηηθέο κέζεο ηηκέο 1, 2 θαη δηαθπκάλζεηο, αληίζηνηρα. Οη δηαθπκάλζεηο, είλαη άγλσζηεο Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Σν ζθεπηηθφ γηα ην θξηηήξην ειέγρνπ είλαη αληίζηνηρν κε ην ζθεπηηθφ πνπ αλαπηχρζεθε γηα ην θξηηήξην ειέγρνπ ηεο κέζεο ηηκήο ελφο πιεζπζκνχ. Γίλεηαη απφ ηε ζρέζε: θαη εθθξάδεηαη απφ ην ζηαηηζηηθφ t δηαθνξά κέζσλ φξσλ ζπλνιηθή ηππηθή απφθιηζε x y s 1 1 s φηαλ νη ζεσξεηηθέο δηαθπκάλζεηο, είλαη ίζεο θαη s, 1 t x y 2 2 s1 s φηαλ νη ζεσξεηηθέο δηαθπκάλζεηο, είλαη άληζεο. ε θάζε πεξίπησζε, ε 1 2 πνζφηεηα t αθνινπζεί θάησ απφ ηηο παξαπάλσ πξνυπνζέζεηο ηελ θαηαλνκή t, 103

112 φηαλ ηζρχεη ε ππφζεζε H Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a ελψ δελ απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a. Παπάδειγμα 13 (ςνέσεια t test με δύο ανεξάπηηηοςρ πληθςζμούρ) Ωο παξάδεηγκα ζα ρξεζηκνπνηήζνπκε ηα δεδνκέλα πνπ έρνπλ δεκνζηεπζεί απφ ηνλ Θενραξάηνπ (1999) θαη παξνπζηάδνληαη απφ ηνλ Γηαιακά (2004, ζει ). Πξφθεηηαη γηα ηε βαζκνινγία 17 καζεηψλ ηεο νκάδαο Α θαη 16 καζεηψλ ηεο νκάδαο Β, Οκάδα Α: 10, 5.6, 10, 6.2, 7.6, 6.4, 7.4, 5.2, 7.2, 5.6, 5.6, 5.6, 3.6, 7.6, 6.2, 6.6, 10 Οκάδα Β: 2, 2, 6, 3.2, 3.8, 1.8, 1.8, 2.6, 3.2, 2.8, 2.6, 3.4, 2, 2.8, 2.8, 2.8 κέζσ ησλ νπνίσλ εμεηάδεηαη ε απνηειεζκαηηθφηεηα δχν κεζφδσλ δηδαζθαιίαο αξκνλίνπ. πγθεθξηκέλα ζα εμεηαζηεί θαηά πφζν ε πξψηε κέζνδνο νδεγεί ηνπο καζεηέο ζε πςειφηεξεο επηδφζεηο απφ ηε δεχηεξε κέζνδν. Ο έιεγρνο ηεο ππφζεζήο καο έρεη σο εμήο: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Ο εξεπλεηήο γηα λα έρεη κηα πξψηε εηθφλα ησλ επηδφζεσλ ησλ καζεηψλ ππνινγίδεη ηε κέζε ηηκή ηεο επίδνζεο ηεο θάζε νκάδαο. Γηα λα εηζάγνπκε ηα δεδνκέλα ζηελ R πιεθηξνινγνχκε > music.a <- c(10, 5.6, 10, 6.2, 7.6, 6.4, 7.4, 5.2, 7.2, 5.6, 5.6, 5.6, 3.6, 7.6, 6.2, 6.6, 10) > music.b <- c (2, 2, 6, 3.2, 3.8, 1.8, 1.8, 2.6, 3.2, 2.8, 2.6, 3.4, 2, 2.8, 2.8, 2.8) Γηα λα ππνινγίζνπκε ηηο κέζεο ηηκέο ηνπο θαινχκε ηελ εληνιή mean: > mean(music.a) [1] > mean(music.b) [1] 2.85 Σν εξεπλεηηθφ εξψηεκα εμεηάδεη αλ νη καζεηέο πνπ δηδάρζεθαλ κε ηε κέζνδν Α έρνπλ κέζε επίδνζε 1 πνπ είλαη κεγαιχηεξε απφ ηε κέζε επίδνζε 2 ησλ καζεηψλ πνπ δηδάρζεθαλ κε ηε κέζνδν Β, φπσο κπνξνχκε λα εηθάζνπκε απφ ηελ 104

113 παξαηήξεζε ησλ επηδφζεψλ ηνπο, δειαδή H0 : 1 2 έλαληη Ha : 1 2. Ζ αληζφηεηα ηεο κεδεληθήο ππφζεζεο ζεκαίλεη φηη απηή απνηειείηαη απφ ηελ ππφζεζε 1 2 θαη άπεηξεο ππνζέζεηο ηεο κνξθήο 1 2. Ο έιεγρνο φκσο γίλεηαη κφλν γηα 1 2 δηφηη αλ απηή απνξξηθζεί ηφηε απνξξίπηεηαη θαη θάζε άιιε πεξίπησζε ζηελ νπνία 1 2. Δπνκέλσο νη ζηαηηζηηθέο ππνζέζεηο επαλαδηαηππψλνληαη σο εμήο: H0 : 1 2 έλαληη Ha : Πξνϋπνζέζεηο. Γερφκαζηε φηη ηα δχν δείγκαηα πξνέξρνληαη απφ πιεζπζκνχο πνπ αθνινπζνχλ θαλνληθή θαηαλνκή, νη δηαζπνξέο ησλ νπνίσλ είλαη άγλσζηεο αιιά ίζεο. Σα ηζηνγξάκκαηα ησλ δεδνκέλσλ ησλ δχν δεηγκάησλ (αξηζηεξά ηεο νκάδαο Α θαη δεμηά ηεο νκάδαο Β) θαη νη αληίζηνηρεο θακπχιεο ηεο θαλνληθήο θαηαλνκήο πνπ πξνζαξκφδνληαη ζε απηά, θαίλνληαη ζην παξαθάησ ζρήκα: 3. Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Τπνινγίδνπκε ηελ ηηκή ηνπ ζηαηηζηηθνχ t θαη ηελ ηηκή p. πγθεθξηκέλα νη ππνινγηζκνί δίλνπλ t θαη ηηκή p Γηα λα πινπνηήζνπκε ηελ ππνινγηζηηθή δηαδηθαζία κε ηελ R, θαινχκε θαη πάιη ηελ εληνιή t.test(), ζηελ νπνία δίλνπκε ηα δεδνκέλα ησλ δχν δεηγκάησλ (x=music.a, y=music.b), ηε κνξθή ηεο ελαιιαθηηθήο 105

114 ππφζεζεο (alternative="greater") θαη ηέινο δειψλνπκε φηη νη άγλσζηεο δηαθπκάλζεηο ησλ δχν πιεζπζκψλ είλαη ίζεο (var.equal=true). > t.test(x=music.a, y=music.b, alternative="greater", var.equal=true)$statistic t θαη > t.test(x=music.a, y=music.b, alternative="greater", var.equal=true)$p.value [1] e Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Γηα επίπεδν ζεκαληηθφηεηαο a 0.05 παξαηεξνχκε φηη p a, νπφηε απνξξίπηνπκε ηε κεδεληθή ππφζεζε, δειαδή απνξξίπηεηαη ν ηζρπξηζκφο φηη νη καζεηέο πνπ δηδάρζεθαλ κε ηε κέζνδν Α έρνπλ κέζε επίδνζε 1 πνπ είλαη ίζε κε ηε κέζε επίδνζε 2 ησλ καζεηψλ πνπ δηδάρζεθαλ κε ηε κέζνδν Β. Δπνκέλσο, κε βάζε ηα απνηειέζκαηα δελ κπνξνχκε λα πνχκε φηη απνδεηθλχεηαη ε ελαιιαθηηθή ππφζεζε αιιά φηη εληζρχεηαη ν ηζρπξηζκφο γηα ηελ αλσηεξφηεηα ηεο κεζφδνπ Α ζε ζρέζε κε ηε κέζνδν Β σο πξνο ηελ απνηειεζκαηηθφηεηα ζηε δηδαζθαιία ηεο κνπζηθήο. ΙΙ. Δμαξηεκέλα δείγκαηα. Ο έιεγρνο απηφο νλνκάδεηαη έιεγρνο ζπγθξίζεσλ θαηά δεύγε, δηφηη ηα δεδνκέλα πξνέξρνληαη απφ ηα ίδηα ππνθείκελα (π.ρ. καζεηέο) ζηα νπνία γίλεηαη θαηαγξαθή ησλ ηηκψλ κηαο κεηαβιεηήο (π.ρ. επίδνζε ζε έλα κάζεκα) πξηλ θαη κεηά απφ κηα παξέκβαζε ή έλα γεγνλφο (π.ρ. ρξήζε λέσλ ηερλνινγηψλ). Ωο εθ ηνχηνπ ηα δεδνκέλα έρνπλ ηε κνξθή x, y, i 1,2,, φπνπ x i θαη i i y i είλαη νη ηηκέο ηεο κεηαβιεηήο (πξηλ θαη κεηά αληίζηνηρα) ηνπ ίδηνπ ππνθεηκέλνπ i. Σφηε ππνινγίδνπκε ηηο δηαθνξέο κεηαμχ ησλ ηηκψλ ηεο κεηαβιεηήο ζε θάζε ππνθείκελν, δειαδή d1 x1 y1,, d x y. 106

115 Ζ δηαδηθαζία ηνπ ειέγρνπ ππνζέζεσλ έρεη σο εμήο: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Οη ζηαηηζηηθέο ππνζέζεηο είλαη H : Γελ ππάξρεη δηαθνξά ζηε κέζε ηηκή ησλ δχν δεηγκάησλ ή H0 : d H : d 0 H a : Τπάξρεη δηαθνξά ζηε κέζε ηηκή ησλ δχν δεηγκάησλ ή a Πξνϋπνζέζεηο. Έζησ φηη ηα δχν δείγκαηα πξνέξρνληαη απφ ηνλ ίδην πιεζπζκφ θαη νη δηαθνξέο ηνπο d i αθνινπζνχλ θαλνληθή θαηαλνκή κε άγλσζηε δηαθχκαλζε. 3. Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Σν θξηηήξην ειέγρνπ δίλεηαη απφ ηε ζρέζε θαη εθθξάδεηαη απφ ην ζηαηηζηηθφ κέζνο φξνο δηαθνξψλ ηππηθή απφθιηζε ηνπ κέζνπ d t, s φπνπ d είλαη ν δεηγκαηηθφο κέζνο φξνο θαη s ε δεηγκαηηθή ηππηθή απφθιηζε ησλ d,, d 1. Ζ ζηαηηζηηθή ζπλάξηεζε t αθνινπζεί θάησ απφ ηηο παξαπάλσ πξνυπνζέζεηο θαηαλνκή t κε 1 βαζκνχο ειεπζεξίαο, φηαλ ηζρχεη ε ππφζεζε H Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a ελψ δελ απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a. Παπάδειγμα 14 (ςνέσεια t test με δύο εξηπηημένα δείγμαηα) Γηα λα ζπγθξίλνπκε ηελ επίδξαζε ησλ λέσλ ηερλνινγηψλ ζηελ εθπαηδεπηηθή δηαδηθαζία ζα ρξεζηκνπνηήζνπκε ηα δεδνκέλα απφ 10 δεχγε ζηα νπνία νη αξηζκνί εθθξάδνπλ ηηο δχν αμηνινγήζεηο ησλ 10 καζεηψλ ηεο ίδηα ηάμεο, πξηλ θαη κεηά ηε ρξήζε λέσλ ηερλνινγηψλ. Ζ κεδεληθή ππφζεζε είλαη φηη ε ρξήζε ησλ λέσλ ηερλνινγηψλ δελ επηθέξεη ζεκαληηθή δηαθνξά ζηελ επίδνζε ησλ καζεηψλ, ελψ ε ελαιιαθηηθή φηη βειηηψλεη ηελ επίδνζε ηνπο. Σα δεδνκέλα είλαη ηα εμήο: 107

116 15,18, 12,11, 18,19, 12,16, 17,18, 10,11, 14,16, 19,19, 16,18. 19,20 θαη Μηα πξψηε εηθφλα γηα ην εξεπλεηηθφ εξψηεκα πξνθχπηεη απφ ηηο δηαθνξέο ησλ βαζκψλ θάζε καζεηή, πνπ είλαη: d 3, 1, 1, 4, 1, 1, 2, 0, 1, 2. i Παξαηεξνχκε φηη φιεο νη δηαθνξέο είλαη αξλεηηθέο εθηφο απφ ηε δεχηεξε πνπ είλαη ζεηηθή θαηά κία κφλν κνλάδα θαη ηελ φγδνε ε νπνία είλαη κεδεληθή. Δπίζεο κε ηελ αθνινπζία ησλ εληνιψλ > method.a <- c(15, 12, 18, 12, 17, 10, 14, 19, 19, 16) > method.b <- c(18, 11, 19, 16, 18, 11, 16, 19, 20, 18) > d <- method.a - method.b > mean(d) [1] -1.4 αθελφο εηζάγνπκε ζηελ R ηα δεδνκέλα αθεηέξνπ ππνινγίδνπκε ηε κέζε ηηκή ησλ δηαθνξψλ d i, ε νπνία είλαη αξλεηηθή. Απηέο νη κεηξήζεηο απνηεινχλ κηα έλδεημε φηη ε ρξήζε λέσλ ηερλνινγηψλ βειηηψλεη ηελ επίδνζε ησλ καζεηψλ, θάηη πνπ επηβεβαηψλεηαη θαη απφ ηελ εθαξκνγή ηνπ t test. 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Καζνξίδνπκε ηηο ζηαηηζηηθέο ππνζέζεηο. H 0 : Ζ ρξήζε ησλ λέσλ ηερλνινγηψλ δελ επηθέξεη ζεκαληηθή δηαθνξά ζηελ επίδνζε ησλ καζεηψλ ή H0 : d 1 2 0, έλαληη H a : Ζ ρξήζε ησλ λέσλ ηερλνινγηψλ βειηηψλεη ηελ επίδνζε ησλ καζεηψλ ή H : d 0. a Πξνϋπνζέζεηο. Ζ πξνυπφζεζε γηα λα εθαξκφζνπκε ην t test ζπγθξίζεσλ δεπγψλ είλαη νη ηηκέο d,, d 1 λα αθνινπζνχλ θαλνληθή θαηαλνκή θάηη πνπ επηβεβαηψλεηαη κέζσ ηνπ επνπηηθνχ ειέγρνπ ζην παξαθάησ ζρήκα: 108

117 3. Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Τπνινγίδνπκε ηελ ηηκή ηνπ ζηαηηζηηθνχ t θαη ηελ ηηκή p. πγθεθξηκέλα νη ππνινγηζκνί δίλνπλ t θαη ηηκή p Γηα λα πινπνηήζνπκε ηελ ππνινγηζηηθή δηαδηθαζία κε ηελ R, θαινχκε θαη πάιη ηελ εληνιή t.test(), ζηελ νπνία δίλνπκε ηα δεδνκέλα ησλ δχν δεηγκάησλ (x=method.a, y=method.b), ηε κνξθή ηεο ελαιιαθηηθήο ππφζεζεο (alternative="less") θαη ηέινο δειψλνπκε φηη πξφθεηηαη γηα έιεγρν ζπγθξίζεσο θαηά δεχγε (paired=true). > t.test(x=method.a, y=method.b, alternative="less", paired=true)$statistic t > t.test(x=method.a, y=method.b, alternative="less", paired=true)$p.value [1] Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Με επίπεδν ζεκαληηθφηεηαο a 0.05 παξαηεξνχκε φηη p a, νπφηε απνξξίπηνπκε ηε κεδεληθή ππφζεζε. 109

118 Γειαδή κε ακειεηέα πηζαλφηεηα ιάζνπο, ίζε κε 0.64%, απνξξίπηεηαη ν ηζρπξηζκφο φηη ε ρξήζε ησλ λέσλ ηερλνινγηψλ δελ επηθέξεη ζεκαληηθή δηαθνξά ζηελ επίδνζε ησλ καζεηψλ. Δπνκέλσο, ηα απνηειέζκαηά καο ζπλεγνξνχλ ππέξ ηεο άπνςεο φηη ε ρξήζε λέσλ ηερλνινγηψλ επηθέξεη ζηαηηζηηθψο ζεκαληηθή βειηίσζε ζηελ επίδνζε ησλ καζεηψλ ζε ζρέζε κε ηνλ «παξαδνζηαθφ» ηξφπν δηδαζθαιίαο. d. Έιεγρνη ππνζέζεσλ πνπ βαζίδνληαη ζην θξηηήξην ηνπ 2 χ. Σν θξηηήξην ηνπ 2 είλαη θαηάιιειν φηαλ εξγαδφκαζηε κε πνηνηηθέο κεηαβιεηέο. Απηφ ζεκαίλεη φηη δελ επεμεξγαδφκαζηε αξηζκεηηθά δεδνκέλα κε ηα νπνία ζπλήζσο κεηξάκε έλα ραξαθηεξηζηηθφ ησλ ζπκκεηερφλησλ αιιά ηνπο εληάζζνπκε ζε θαηεγνξίεο. Γηα παξάδεηγκα, δελ καο ελδηαθέξεη ν γεληθφο κέζνο φξνο ελφο ειέγρνπ επίδνζεο, αιιά ε ηαμηλφκεζε ηνπ καζεηή ζε κηα απφ ηηο θαηεγνξίεο κε ηνπο ραξαθηεξηζκνχο επίδνζεο «κέηξηα», «θαιά», «πνιχ θαιά», «άξηζηα». Σν 2 εθαξκφδεηαη είηε γηα κηα πνηνηηθή κεηαβιεηή σο έιεγρνο θαιήο πξνζαξκνγήο είηε γηα δχν πνηνηηθέο κεηαβιεηέο σο έιεγρνο αλεμαξηεζίαο. Ι. Έιεγρνο θαιήο πξνζαξκνγήο. Ο έιεγρνο θαιήο πξνζαξκνγήο γηα κηα πνηνηηθή κεηαβιεηή εμεηάδεη αλ ππάξρνπλ ζηαηηζηηθψο ζεκαληηθέο δηαθνξέο κεηαμχ ησλ θαηεγνξηψλ ηνπ δείγκαηνο, ζπγθξίλνληαο ηηο ζπρλφηεηεο εκθάληζεο ησλ θαηεγνξηψλ ηνπ δείγκαηνο (πξαγκαηηθέο ζπρλφηεηεο) κε ηηο ζπρλφηεηεο πνπ αλακέλνπκε (αλακελφκελεο ζπρλφηεηεο) φηαλ ηζρχεη ε κεδεληθή ππφζεζε, δειαδή φηαλ ππνζέηνπκε φηη φιεο νη θαηεγνξίεο έρνπλ ηελ ίδηα ζπρλφηεηα εκθάληζεο. Γηα ηελ θαηαλφεζε ηεο ρξήζεο θαη σθειηκφηεηαο ηνπ ειέγρνπ παξαζέηνπκε έλα παξάδεηγκα απφ ην βηβιίν ησλ Ρνχζζνπ & Σζανχζε (2011, ζει. 469). Παπάδειγμα 15 (Έλεγσορ ςποθέζεων 2 test καλήρ πποζαπμογήρ) ε κία έξεπλα έρνπλ θαηαγξαθεί νη ηξφπνη κειέηεο 120 θνηηεηψλ δηαθφξσλ ζρνιψλ, ζηηο 110

119 θαηεγνξίεο κεζνδηθή (θαζεκεξηλή κειέηε), αθαλφληζηε (ρσξίο θαλέλα πξνγξακκαηηζκφ) θαη ζπλδπαζηηθή (ζπλδπαζκφο ησλ δχν πξνεγνχκελσλ). Οη αληίζηνηρεο ζπρλφηεηεο i, i 1,2,3 ησλ ζπκκεηερφλησλ ζηηο ηξεηο θαηεγνξίεο δίλνληαη ζηνλ πίλαθα πνπ αθνινπζεί: Σξόπνο Μειέηεο Μεζνδηθή Αθαλφληζηε πλδπαζηηθή ύλνιν Σν εξψηεκα πνπ απαζρνιεί ηνλ εξεπλεηή είλαη αλ ηα δεδνκέλα αληηθαηνπηξίδνπλ ζηαηηζηηθψο ζεκαληηθέο δηαθνξέο ζηνλ ηξφπν κειέηεο ησλ θνηηεηψλ ή αλ πξφθεηηαη γηα ηπραίεο δηαθνξέο κεηαμχ ησλ ηξηψλ κεζφδσλ. Ζ δηαδηθαζία ηνπ ειέγρνπ θαιήο πξνζαξκνγήο είλαη: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Αλ ππνζέζνπκε φηη εληάζζνπκε ηνλ πιεζπζκφ ζε k θαηεγνξίεο, νη ζηαηηζηηθέο ππνζέζεηο ηνπ ειέγρνπ είλαη ε κεδεληθή H : 0 νη ζπρλφηεηεο εκθάληζεο ησλ k θαηεγνξηψλ ηνπ πιεζπζκνχ δελ είλαη δηαθνξεηηθέο κεηαμχ ηνπο ή H0 : 1 2 k, έλαληη ηεο ελαιιαθηηθήο H : νη ζπρλφηεηεο εκθάληζεο ησλ k θαηεγνξηψλ ηνπ πιεζπζκνχ είλαη a δηαθνξεηηθέο κεηαμχ ηνπο ή H a : δελ ηζρχεη φηη 1 2 k. 2. Πξνϋπνζέζεηο. Έλα άιιν ζεκαληηθφ ραξαθηεξηζηηθφ ησλ ειέγρσλ ππνζέζεσλ πνπ βαζίδνληαη ζην θξηηήξην ηνπ 2 είλαη φηη δελ είλαη παξακεηξηθνί έιεγρνη ππνζέζεσλ, δειαδή δελ απαηηείηαη θακία πξνυπφζεζε γηα ηελ αθξηβή κνξθή ηεο θαηαλνκήο ηνπ πιεζπζκνχ. Παξφια απηά ππφθεηηαη ζε θάπνηνπο πεξηνξηζκνχο (Ρνχζζνο & Σζανχζεο, 2011, ζει ): πξέπεη νη ζπκκεηέρνληεο λα εκθαλίδνληαη κφλν κία θνξά ζηνλ πίλαθα ζπρλνηήησλ ν ζπλνιηθφο αξηζκφο ησλ ζπκκεηερφλησλ λα είλαη ηνπιάρηζηνλ

120 ε πξαγκαηηθή ζπρλφηεηα ηνπ θάζε θειηνχ λα είλαη ηνπιάρηζηνλ Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Με ην θξηηήξην ηνπ 2 ζπγθξίλεηαη ε πξαγκαηηθή ζπρλφηεηα Π ηνπ θάζε θειηνχ ηνπ πίλαθα κε ηελ αληίζηνηρε αλακελφκελε ζπρλφηεηα Α. ζν κεγαιχηεξεο είλαη νη δηαθνξέο, ηφζν πηζαλφηεξν είλαη λα απνξξηθζεί ε κεδεληθή ππφζεζε, δειαδή λα ππάξρνπλ ζηαηηζηηθψο ζεκαληηθέο δηαθνξέο κεηαμχ ησλ θαηεγνξηψλ ηνπ δείγκαηνο. Σν 2 αληαλαθιά ην κέγεζνο ησλ δηαθνξψλ κεηαμχ ησλ πξαγκαηηθψλ θαη ησλ αλακελφκελσλ ζπρλνηήησλ κέζσ ηνπ ηχπνπ: 2 2. Ο αξηζκεηήο ζηνλ παξαπάλσ ηχπν ππνινγίδεη θαη αζξνίδεη φιεο ηηο δηαθνξέο, νη νπνίεο πςψλνληαη ζην ηεηξάγσλν γηα λα είλαη πάληα ζεηηθέο. Ο παξνλνκαζηήο είλαη αλαγθαίνο ψζηε λα ζπγθξίλνπκε ηελ δηαθνξά 2 κε ην πιήζνο ησλ πεξηπηψζεσλ ηεο θαηεγνξίαο, πνπ εθθξάδεηαη απφ ην. Γηα παξάδεηγκα, αλ 36, 21, ηφηε 15, φπσο θαη ζηελ πεξίπησζε 336, 321, 15. κσο ε ζπλεηζθνξά ηνπ φξνπ 2, ζην ζπλνιηθφ άζξνηζκα είλαη πνιχ κηθξφηεξε ζηε δεχηεξε πεξίπησζε εμαηηίαο ηνπ κεγαιχηεξνπ ζε ζρέζε κε ηελ πξψηε πεξίπησζε. πγθεθξηκέλα, είλαη Σν θξηηήξην ειέγρνπ ειεπζεξίαο, φηαλ ηζρχεη ε ππφζεζε H θαη αθνινπζεί ηελ θαηαλνκή ηνπ 2 κε k 1 βαζκνχο 4. Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a ελψ δελ απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a. Παπάδειγμα 15 (ςνέσεια 2 test καλήρ πποζαπμογήρ) 112

121 Ο έιεγρνο ηεο ππφζεζήο καο έρεη σο εμήο: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Απφ ηα δεδνκέλα αλαδχεηαη ην εξεπλεηηθφ εξψηεκα ηεο πξνηίκεζεο ησλ θνηηεηψλ ζηε κεζνδηθή κειέηε ζε βάξνο ησλ άιισλ δχν θαηεγνξηψλ (αθαλφληζηε θαη ζπλδπαζηηθή). πγθεθξηκέλα νη ζηαηηζηηθέο ππνζέζεηο είλαη: H : 0 νη ζπρλφηεηεο ησλ ηξηψλ ηχπσλ κειέηεο είλαη ίζεο κεηαμχ ηνπο ή H :, έλαληη H : νη ζπρλφηεηεο ησλ ηξηψλ ηχπσλ κειέηεο δελ είλαη ίζεο κεηαμχ ηνπο ή H : δελ a ηζρχεη Πξνϋπνζέζεηο. Ηθαλνπνηνχληαη νη πξνυπνζέζεηο εθαξκνγήο ηνπ ειέγρνπ, δηφηη ην κέγεζνο ηνπ δείγκαηνο είλαη 120, επνκέλσο θαηά πνιχ κεγαιχηεξν απφ ην 50 θαη νη ζπρλφηεηεο θάζε θειηνχ 51, 27 θαη 42 είλαη κεγαιχηεξεο απφ ην Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Ζ δηαδηθαζία ππνινγηζκνχ ηνπ 2 είλαη ε εμήο: a Τπνινγίδνπκε ηηο αλακελφκελεο ζπρλφηεηεο βαζηδφκελνη ζηε κεδεληθή ππφζεζε Δπεηδή επηπιένλ ηζρχεη πξνθχπηεη φηη 40. Αληηθαζηζηνχκε ηηο ηηκέο ησλ πξαγκαηηθψλ θαη αλακελφκελσλ ζπρλνηήησλ ζηνλ ηχπν ηνπ 2 : Ζ πινπνίεζε ησλ παξαπάλσ ππνινγηζκψλ κε ηε βνήζεηα ηεο R, γίλεηαη σο εμήο: Καηαξρήλ, εηζάγνπκε ζην RStudio ή ζηε βαζηθή έθδνζε ηεο R, ηα δεδνκέλα κε ην δηάλπζκα > method.study <- c(51, 27, 42) Γηα επηβεβαίσζε πιεθηξνινγνχκε > method.study [1]

122 Γηα ηνλ ππνινγηζκφ ηνπ > chisq.test(method.study) 2 ρξεζηκνπνηνχκε ηελ εληνιή Chi-squared test for given probabilities data: method.study X-squared = 7.35, df = 2, p-value = απφ ηελ νπνία επηβεβαηψλνπκε ηελ ηηκή ηνπ 2, ηνπο βαζκνχο ειεπζεξίαο ηεο θαηαλνκήο πνπ είλαη k 1 2 θαη βξίζθνπκε ηελ ηηκή p πνπ ηζνχηαη κε ρήκα 20. Ζ θακπχιε ζπρλνηήησλ ηεο θαηαλνκήο 2 πνπ αληηζηνηρεί ζην Παξάδεηγκα 15 θαη είλαη ην απνηέιεζκα ηεο εληνιήο prob.chisq.pvalue(). 4. Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. πγθξίλνπκε ηελ ηηκή p κε ην επίπεδν ζεκαληηθφηεηαο ηεο επηινγήο καο (π.ρ. a 0.05 ), απφ φπνπ πξνθχπηεη φηη πξέπεη λα απνξξίςνπκε ηε κεδεληθή ππφζεζε. Ζ ζηαηηζηηθή απφθαζε επηβεβαηψλεηαη απφ ην ρήκα 20 ζην νπνίν ην κπιε ηκήκα ηνπ νξηδφληηνπ 114

123 άμνλα αληηζηνηρεί ζηελ θξίζηκε πεξηνρή, δειαδή ζηελ πεξηνρή απφξξηςεο ηεο κεδεληθήο ππφζεζεο. Απηφ ζεκαίλεη φηη αλ ε ηηκή ηνπ ζηαηηζηηθνχ 2, ππεξβαίλεη ην ηφηε απνξξίπηνπκε ηε κεδεληθή ππφζεζε, δηφηη ε πηζαλφηεηα λα ζπκβεί θάηη ηέηνην είλαη πνιχ κηθξή θαη κηθξφηεξε ή ίζε κε 5% (εκβαδφλ κπιε ρσξίνπ). Απηφ αθξηβψο ζπκβαίλεη θαη ζην Παξάδεηγκα 15, ζην νπνίν ην Ζ πηζαλφηεηα ιαλζαζκέλεο απφθαζεο ηζνχηαη κε ηελ ηηκή p πνπ είλαη 2.53% (εκβαδφλ κπιε ρσξίνπ πνπ πεξηθιείεηαη απφ ηελ πξάζηλε γξακκή). Δπνκέλσο, ηα παξαπάλσ επξήκαηα είλαη επαξθή γηα λα ππνζηεξίμνπλ ηελ ππφζεζε φηη νη θνηηεηέο ησλ δηάθνξσλ ζρνιψλ ρξεζηκνπνηνχλ έλα ηξφπν κειέηεο πεξηζζφηεξν απφ ηνπο άιινπο. ΙΙ. Έιεγρνο αλεμαξηεζίαο. Δθηφο απφ ηνλ έιεγρν θαιήο πξνζαξκνγήο, ην ζηαηηζηηθφ θξηηήξην 2 εμεηάδεη ηελ χπαξμε αλεμαξηεζίαο κεηαμχ δχν πνηνηηθψλ κεηαβιεηψλ. Γηα λα επηηεπρζεί απηφο ν ζηφρνο ρξεζηκνπνηνχληαη πίλαθεο ζπλάθεηαο (contingency tables), φπσο ζην παξαθάησ παξάδεηγκα. Παπάδειγμα 16 (Έλεγσορ ςποθέζεων 2 έλεγσορ ανεξαπηηζίαρ) Ο παξαθάησ πίλαθαο ζπλάθεηαο: Απνθνίηεζε Γελ απνθνίηεζε ύλνιν Με εληζρπηηθή δηδαζθαιία Υσξίο εληζρπηηθή δηδαζθαιία ύλνιν

124 αλαπαξηζηά ηηο ζπρλφηεηεο 167 αηφκσλ, γηα ηα νπνία εμεηάδνπκε αλ απνθνίηεζαλ απφ ηε δεπηεξνβάζκηα εθπαίδεπζε (πνηνηηθή κεηαβιεηή X, κε ηηκέο ΝΑΗ θαη ΟΥΗ) θαη αλ παξαθνινχζεζαλ θαηά ηε δηάξθεηα ησλ ζπνπδψλ ηνπο εληζρπηηθή δηδαζθαιία επηπξνζζέησο ηνπ βαζηθνχ πξνγξάκκαηνο ζπνπδψλ (πνηνηηθή κεηαβιεηή Y, κε ηηκέο ΝΑΗ θαη ΟΥΗ). ηνλ πίλαθα απηφ νη αξηζκνί παξηζηάλνπλ ζπρλφηεηεο εκθάληζεο. Γηα παξάδεηγκα ην θειί κε ηνλ αξηζκφ 73 ζεκαίλεη φηη 73 καζεηέο πνπ παξαθνινχζεζαλ πξφγξακκα εληζρπηηθήο δηδαζθαιίαο απνθνίηεζαλ απφ ηε δεπηεξνβάζκηα εθπαίδεπζε, ελψ ην θειί κε ζπρλφηεηα 43 αλαθέξεηαη ζε απηνχο πνπ απνθνίηεζαλ ρσξίο λα παξαθνινπζήζνπλ πξφγξακκα εληζρπηηθήο δηδαζθαιίαο επί ζπλφινπ 167 αηφκσλ πνπ ζπκκεηείραλ ζηελ έξεπλα. Ζ πξψηε εηθφλα ηνπ πίλαθα ζπλάθεηαο δείρλεη φηη ην πξφγξακκα εληζρπηηθήο δηδαζθαιίαο ζπλεηέιεζε ψζηε νη καζεηέο πνπ ην παξαθνινχζεζαλ λα έρνπλ κεγαιχηεξν πνζνζηφ απνθνίηεζεο απφ ηε δεπηεξνβάζκηα εθπαίδεπζε ζε ζρέζε κε ηνπο καζεηέο πνπ δελ ην παξαθνινχζεζαλ. Με ηε βνήζεηα ηνπ ειέγρνπ αλεμαξηεζίαο ηνπ 2 ζα εμεηάζνπκε αλ ηα δεδνκέλα καο νδεγνχλ ζην ζπκπέξαζκα φηη ππάξρεη ζηαηηζηηθψο ζεκαληηθή εμάξηεζε κεηαμχ ηεο παξαθνινχζεζεο ησλ πξνγξακκάησλ εληζρπηηθήο δηδαζθαιίαο ηεο νινθιήξσζεο ησλ ζπνπδψλ ζηε δεπηεξνβάζκηα εθπαίδεπζε. Ζ δηαδηθαζία ηνπ ειέγρνπ αλεμαξηεζίαο 2 έρεη σο εμήο: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Αλ ππνζέζνπκε φηη έρνπκε δχν πνηνηηθέο κεηαβιεηέο κε k θαη r θαηεγνξίεο αληίζηνηρα, νη ζηαηηζηηθέο ππνζέζεηο ηνπ ειέγρνπ είλαη ε κεδεληθή H : 0 νη κεηαβιεηέο είλαη αλεμάξηεηεο, έλαληη ηεο ελαιιαθηηθήο H : νη κεηαβιεηέο δελ είλαη αλεμάξηεηεο. a 2. Πξνϋπνζέζεηο. Οη πξνυπνζέζεηο εθαξκνγήο ηνπ ειέγρνπ αλεμαξηεζίαο 2 είλαη αθξηβψο ίδηεο κε απηέο ηνπ ειέγρνπ θαιήο πξνζαξκνγήο. 3. Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Αλ θαη ην θξηηήξην ειέγρνπ παξακέλεη ην ίδην κε απηφ ηνπ θαιήο πξνζαξκνγήο, δειαδή

125 είλαη 2 2, είλαη ζεκαληηθφ λα θαηαλνήζνπκε ηε ινγηθή πνπ δηέπεη ηηο αλακελφκελεο ζπρλφηεηεο θαη ηνλ ηξφπν ππνινγηζκνχ ηνπο. Γηα απηφ ζα ρξεζηκνπνηήζνπκε ηα δεδνκέλα ηνπ Παξαδείγκαηνο 16. Παξαηεξνχκε φηη απφ ηνπο εξσηεζέληεο νη κηζνί πεξίπνπ παξαθνινχζεζαλ πξφγξακκα εληζρπηηθήο δηδαζθαιίαο θαη νη άιινη κηζνί φρη (85 θαη 82 άηνκα αληίζηνηρα). Θα πεξηκέλακε ινηπφλ, αλ δελ ππήξρε ζρέζε κεηαμχ ηνπ πξνγξάκκαηνο ζπνπδψλ θαη ηεο ζρνιηθήο δηαξξνήο (δειαδή ηνπ πνζνζηνχ ησλ καζεηψλ πνπ δελ απνθνηηνχλ), λα εκθαληδφηαλ ην ίδην πεξίπνπ πνζνζηφ, δειαδή πεξίπνπ 50%, κεηαμχ απηψλ πνπ απνθνίηεζαλ θαη απηψλ πνπ δελ απνθνίηεζαλ. Έηζη, γηα ην θειί κε ζπρλφηεηα 73, ε αλακελφκελε ζπρλφηεηα πξνθχπηεη σο εμήο: πνζνζηφ φζσλ παξαθνινχζεζαλ εληζρπηηθή δηδαζθαιία πνπ ηζνχηαη κε 117 αξηζκφο αηφκσλ πνπ απνθνίηεζαλ Οκνίσο, γηα ην θειί κε ζπρλφηεηα 43, ε 167 αλακελφκελε ζπρλφηεηα πξνθχπηεη σο εμήο: πνζνζηφ φζσλ δελ παξαθνινχζεζαλ εληζρπηηθή δηδαζθαιία πνπ ηζνχηαη κε αξηζκφο αηφκσλ πνπ απνθνίηεζαλ Οκνίσο κπνξνχλ λα ππνινγηζηνχλ νη 167 αλακελφκελεο ζπρλφηεηεο ησλ ππνινίπσλ θειηψλ. Σππνπνηψληαο ηελ παξαπάλσ δηαδηθαζία, θαηαιήγνπκε ζηνλ ηχπν κε ηνλ νπνίν ππνινγίδνληαη νη αλακελφκελεο ζπρλφηεηεο: ζπρλφηεηα γξακκήο ζπρλφηεηα ζηήιεο. ζχλνιν ζπρλνηήησλ Δπνκέλσο, ν πίλαθαο ζπλάθεηαο κε ηηο αληίζηνηρεο αλακελφκελεο ζπρλφηεηεο ζε παξέλζεζε γίλεηαη:,,

126 Απνθνίηεζε Γελ απνθνίηεζε ύλνιν Με εληζρπηηθή δηδαζθαιία (59.042) (25.958) 85 Υσξίο εληζρπηηθή δηδαζθαιία (56.958) (25.042) 82 ύλνιν Σν θξηηήξην ηνπ k 1 r 1 2 ζην έιεγρν αλεμαξηεζίαο αθνινπζεί θαηαλνκή 2 κε βαζκνχο ειεπζεξίαο, φηαλ ηζρχεη ε ππφζεζε H 0. ηε ζπλήζε πεξίπησζε ησλ πηλάθσλ ζπλάθεηαο κε 2 γξακκέο ( r 2) θαη 2 ζηήιεο ( k 2 ) ε θαηαλνκή είλαη 2 κε 1 βαζκφ ειεπζεξίαο. 4. Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a ελψ δελ απνξξίπηνπκε ηε κεδεληθή ππφζεζε αλ p a. Παπάδειγμα 16 (ςνέσεια 2 έλεγσορ ανεξαπηηζίαρ) Ο έιεγρνο ηεο ππφζεζήο καο έρεη σο εμήο: 1. Γηαηύπσζε εξεπλεηηθώλ εξσηεκάησλ θαη θαζνξηζκόο ησλ ζηαηηζηηθώλ ππνζέζεσλ. Οη ζηαηηζηηθέο ππνζέζεηο είλαη: H : 0 Ζ παξαθνινχζεζε πξνγξάκκαηνο εληζρπηηθήο δηδαζθαιίαο θαη ε ζρνιηθή δηαξξνή είλαη αλεμάξηεηεο H : Ζ παξαθνινχζεζε πξνγξάκκαηνο εληζρπηηθήο δηδαζθαιίαο θαη ε ζρνιηθή a δηαξξνή δελ είλαη αλεμάξηεηεο. 2. Πξνϋπνζέζεηο. Οη πξνυπνζέζεηο εθαξκνγήο ηνπ ειέγρνπ αλεμαξηεζίαο ηθαλνπνηνχληαη δηφηη νη ζπκκεηέρνληεο εκθαλίδνληαη κφλν κία θνξά ζηνλ πίλαθα ζπλάθεηαο, ν ζπλνιηθφο αξηζκφο ησλ ζπκκεηερφλησλ είλαη ηνπιάρηζηνλ 50 θαη ε πξαγκαηηθή ζπρλφηεηα θάζε θειηνχ είλαη ηνπιάρηζηνλ Καηαζθεπή θαη ππνινγηζκόο θξηηεξίνπ ζηαηηζηηθνύ ειέγρνπ. Σν ζηαηηζηηθφ 118 2

127 ηζνχηαη κε Πξάγκαηη, Ζ ηηκή p ηνπ ειέγρνπ είλαη κηθξφηεξε απφ Ζ πινπνίεζε ησλ παξαπάλσ ππνινγηζκψλ κε ηε βνήζεηα ηεο R, γίλεηαη σο εμήο: Καηαξρήλ, εηζάγνπκε ζην RStudio ή ζηε βαζηθή έθδνζε ηεο R, ηα δεδνκέλα κε δχν δηαλχζκαηα πνπ αληηζηνηρνχλ ζηηο γξακκέο ηνπ πίλαθα ζπλάθεηαο. > curriculum.yes <- c(73, 12) > curriculum.no <- c(43, 39) Καηφπηλ ζπλδπάδνπκε ηα δχν δηαλχζκαηα γηα λα δεκηνπξγήζνπκε ηνλ πίλαθα ζπλάθεηαο. > curriculum.graduation <- rbind(curriculum.yes, curriculum.no) > curriculum.graduation [,1] [,2] curriculum.yes curriculum.no Αλ ζέινπκε λα πξνζζέζνπκε νλφκαηα ζηηο γξακκέο θαη ζηήιεο ηνπ πίλαθα ζπλάθεηαο, ηφηε: > rownames(curriculum.graduation) <- c("με ενισχυτική διδασκαλία", "Χωρίς ενισχυτική διδασκαλία") > colnames(curriculum.graduation) <- c("αποφοίτησε", "Δεν αποφοίτησε") Ο πίλαθαο ζπλάθεηαο παίξλεη ηφηε ηελ πην γλψξηκε κνξθή > curriculum.graduation Αποφοίτησε Δεν αποφοίτησε Με ενισχυτική διδασκαλία Χωρίς ενισχυτική διδασκαλία Σέινο, γηα ηνλ ππνινγηζκφ ηνπ 2 ρξεζηκνπνηνχκε ηελ εληνιή > chisq.test(curriculum.graduation, correct=false) Pearson's Chi-squared test 119

128 data: curriculum.graduation X-squared = , df = 1, p-value = 2.718e-06 Ζ κεηαβιεηή correct=false, απνηξέπεη ηελ R λα δηνξζψζεη ηελ αξηζκεηηθή ηηκή ηνπ 2. Ζ δπλαηφηεηα δηφξζσζεο πξνζθέξεηαη απφ ηελ R θαη βαζίδεηαη ζηελ άπνςε φηη ην θξηηήξην 2 δελ είλαη πνιχ αζθαιέο ζηελ πεξίπησζε πνπ έρνπκε 1 βαζκφ ειεπζεξίαο (Ρνχζζνο & Σζανχζεο, 2011, ζει. 486). Γηα λα επηβεβαηψζνπκε φηη ε αξηζκεηηθέο ηηκέο ησλ X-squared θαη p-value είλαη αθξηβείο, αιιά θπξίσο γηα λα εκπεδψζνπκε ηνλ ηξφπν πνπ νη ζηαηηζηηθέο ςεθηαθέο εθαξκνγέο δεκηνπξγνχλ ζπλαξηήζεηο φπσο ε chisq.test, κπνξνχκε λα θάλνπκε ηα εμήο: > Expected <- chisq.test(curriculum.graduation)$expected > Expected Αποφοίτησε Δεν αποφοίτησε Με ενισχυτική διδασκαλία Χωρίς ενισχυτική διδασκαλία πνπ ππνινγίδεη ηηο αλακελφκελεο ηηκέο ηνπ πίλαθα ζπλάθεηαο. Αθνινχζσο κε ηνλ πίλαθα Observed παίξλνπκε ηηο πξαγκαηηθέο ζπρλφηεηεο εκθάληζεο. > Observed <- chisq.test(curriculum.graduation)$observed > Observed Αποφοίτησε Δεν αποφοίτησε Με ενισχυτική διδασκαλία Χωρίς ενισχυτική διδασκαλία θαη κε ηνλ ηχπν > chi.sq <- (Observed - Expected)^2 / Expected > chi.sq Αποφοίτησε Δεν αποφοίτησε Με ενισχυτική διδασκαλία Χωρίς ενισχυτική διδασκαλία φινπο ηνπο φξνπο ηεο κνξθήο άζξνηζκα φισλ ησλ φξσλ ηνπ πίλαθα chi.sq. 2. Ζ ηηκή ηνπ 2 πξνθχπηεη απφ ην > sum(chi.sq) [1]

129 Ζ ηηκή p ηνπ ειέγρνπ πξνθχπηεη κέζσ ηεο εληνιήο > 1-pchisq( , df=1) [1] e-06 Σα απνηειέζκαηα απηά επηβεβαηψλνληαη θαη απφ ην ρήκα 21, ην νπνίν δεκηνπξγήζεθε κε ηελ εληνιή > prob.chisq.pvalue(df=1, chisq.obs= ) ρήκα 21. Ζ θακπχιε ζπρλνηήησλ ηεο θαηαλνκήο 2 πνπ αληηζηνηρεί ζην Παξάδεηγκα Καλόλαο απόθαζεο θαη εμαγσγή ζπκπεξαζκάησλ. Δπεηδή ε ηηκή p , ε κεδεληθή ππφζεζε κε επίπεδν ζεκαληηθφηεηαο 0.05 απνξξίπηεηαη. Δπεηδή ε ηηκή p είλαη πνιχ κηθξή κπνξνχκε κε ζρεηηθή αζθάιεηα (πηζαλφηεηα ιάζνπο κηθξφηεξε απφ 0.01%) λα απνξξίςνπκε ηε κεδεληθή ππφζεζε ηεο αλεμαξηεζίαο. Καηαιήγνπκε ινηπφλ ζην ζπκπέξαζκα φηη ε εληζρπηηθή δηδαζθαιία θαη ε ζρνιηθή δηαξξνή δελ είλαη αλεμάξηεηεο, επνκέλσο έρεη λφεκα λα εμεηάζνπκε επηπιένλ ηελ σθειηκφηεηα ηεο εληζρπηηθήο δηδαζθαιίαο ζηνλ πεξηνξηζκφ ηεο ζρνιηθήο δηαξξνήο. 121

130 4.6 πζρέηηζε θαη γξακκηθή παιηλδξόκεζε Ζ ζπζρέηηζε (correlation) κεηαμχ δχν ή πεξηζζφηεξσλ πνζνηηθψλ κεηαβιεηψλ απνηειεί έλα απφ ηα ζεκαληηθφηεξα αληηθείκελα ζηε ζηαηηζηηθή. Μαο ελδηαθέξεη λα κειεηήζνπκε ηελ χπαξμε ζρέζεο κεηαμχ δχν ραξαθηεξηζηηθψλ, γηα παξάδεηγκα κεηαμχ ησλ σξψλ δηαβάζκαηνο θαη ηεο ζρνιηθήο επίδνζεο ελφο αηφκνπ, ηνπ δείθηε λνεκνζχλεο θαη ηεο ηθαλφηεηαο επεμεξγαζίαο αξηζκεηηθψλ ελλνηψλ, ηεο θιεξνλνκηθφηεηαο θαη ηεο επθπΐαο. ηελ πεξίπησζε πνπ δηαπηζησζεί ε χπαξμε ηέηνηαο ζρέζεο κεηαμχ δχν κεηαβιεηψλ, επηρεηξνχκε λα ηελ πξνζεγγίζνπκε κε ηελ πην απιή κνξθή ζρέζεο, ηε γξακκηθή. Αλ X θαη Y είλαη δχν πνζνηηθέο κεηαβιεηέο, ηφηε ε γξακκηθή ζρέζε πνπ ζπλδέεη ηα X θαη Y είλαη ηεο κνξθήο Y a b X, φπνπ a θαη b είλαη δχν ζηαζεξέο ηηο νπνίεο ζέινπκε λα πξνζδηνξίζνπκε. πλήζσο ε δηεξεχλεζε γηα ηελ χπαξμε γξακκηθήο ζρέζεο μεθηλά κε έλα δηάγξακκα ζθεδαζκνχ (scatter diagram). Παπάδειγμα 17 (ςζσέηιζη) Σα δεδνκέλα Β Λπθείνπ Γ Λπθείνπ παξηζηάλνπλ ηελ επίδνζε ησλ γξαπηψλ ησλ απνιπηήξησλ εμεηάζεσλ ζηα καζεκαηηθά θαηεχζπλζεο ηεο Β ιπθείνπ (κεηαβιεηή X ) θαη ζηα καζεκαηηθά θαηεχζπλζεο ηεο Γ ιπθείνπ (κεηαβιεηή Y ) επηά καζεηψλ. Παξαηεξψληαο ηα δεδνκέλα νδεγνχκαζηε ζην εξεπλεηηθφ εξψηεκα γηα χπαξμε ζρέζεο κεηαμχ ησλ κεηαβιεηψλ X θαη Y, δηφηη ηα δεχγε ηηκψλ XY, 10,10.5, 11.5,12, 12,14.5, 15.5,14.5, 18,17, 19,18.5, 20,20 πνπ αλαπαξηζηνχλ ηνπο βαζκνχο ηνπ θάζε καζεηή, δείρλνπλ φηη νη δχν βαζκνί δελ 122

131 δηαθέξνπλ ζεκαληηθά κεηαμχ ηνπο. Ίδηεο ελδείμεηο καο δίλεη ην δηάγξακκα ζθεδαζκνχ κεηαμχ ησλ X θαη Y, πνπ απεηθνλίδεηαη ζην ρήκα 22. Κάζε ζεκείν ηνπ δηαγξάκκαηνο αληηζηνηρεί ζην δεχγνο ηηκψλ XY, κε ηηο βαζκνινγίεο ηεο Β θαη ηεο Γ Λπθείνπ. Γηα παξάδεηγκα, ην ζεκείν πνπ βξίζθεηαη θάησ αξηζηεξά θαη παξηζηάλεηαη κε κπιε ηεηξαγσλάθη, αληηζηνηρεί ζηε ζηήιε ηνπ πίλαθα, δειαδή ζην δεχγνο 10,10.5. Παξαηεξνχκε φηη νη δχν επηδφζεηο ζπζρεηίδνληαη, θαζψο φζν κεγαιψλεη ε ηηκή ηεο Β ηφζν κεγαιψλεη ε αληίζηνηρε ηηκή ηεο Γ, πνπ κπνξεί λα εθθξαζζεί απφ κηα γξακκηθή ζρέζε, πνπ αληηζηνηρεί γξαθηθά ζε κε κηα επζεία γξακκή. ρήκα 22. Γηάγξακκα ζθεδαζκνχ θαη ε αληίζηνηρε επζεία γξακκηθήο παιηλδξφκεζεο γηα ηα δεδνκέλα ηνπ Παξαδείγκαηνο 17. Πέξα φκσο απφ ηελ νπηηθφ εληνπηζκφ γξακκηθήο ζρέζεο κεηαμχ δχν κεηαβιεηψλ ππάξρεη ν ζπληειεζηήο ηνπ Pearson πνπ είλαη έλα αξηζκεηηθφ κέηξν εληνπηζκνχ ηεο χπαξμεο γξακκηθήο ζρέζεο κεηαμχ δχν κεηαβιεηψλ. Ο ζπληειεζηήο ζπζρέηηζεο ηνπ Pearson ελλνηνινγηθά κπνξεί λα πεξηγξαθεί σο εμήο: 123

132 βαζκφο ζπκκεηαβνιήο X θαη Y γηλφκελν βαζκψλ κεηαβιεηφηεηαο ηνπ X θαη Y. Έηζη, ν ζπληειεζηήο γξακκηθήο ζπζρέηηζεο δχν κεηαβιεηψλ X θαη Y κε βάζε έλα δείγκα δεπγψλ x, y, φπνπ i 1,2,,, ζπκβνιίδεηαη κε r θαη δίλεηαη απφ ηνλ ηχπν: r ή ζπληνκνγξαθηθά i i ( x x)( y y) ( x x)( y y) 1 1 ( x x) ( x x) ( y y) ( y y) r i 124 ( x x)( y y) i ( x x) ( y y) i 2 2 i Ο αξηζκεηήο ζηνλ παξαπάλσ ηχπν εθθξάδεη ηε ζπλδηαθχκαλζε (covariance) ησλ κεηαβιεηψλ X θαη Y. Ζ ζπλδηαθχκαλζε είλαη νπζηαζηηθά έλαο αξηζκφο πνπ εθθξάδεη ην βαζκφ αιιειεπίδξαζεο, δειαδή ζπκκεηαβνιήο, ησλ δχν κεηαβιεηψλ. Πξέπεη λα ζεκεησζεί ε αληηζηνηρία ηνπ ηχπνπ ηεο ζπλδηαθχκαλζεο κε ην ηχπν ηεο δηαθχκαλζεο κηαο κεηαβιεηήο πνπ έρνπκε νξίζεη ζηελ ελφηεηα 4.2. Γηα ιφγνπο απινπνίεζεο ησλ ηχπσλ, ζεσξνχκε φηη θάζε ηηκή x i εκθαλίδεηαη κφλν κία θνξά, δειαδή i 1, ηφηε 1 1 s ( x x) ( x x) ( x x) 2 2 i i i 1 i1 1 i1. 1 Οπζηαζηηθά, αλ εμαηξέζνπκε ηε ζηαζεξά, ν ηχπνο ηεο ζπλδηαθχκαλζεο πξνθχπηεη 1 κε ηελ αληηθαηάζηαζε ελφο απφ ηα δχν x i απφ ην. y i. Ο παξνλνκαζηήο ζηνλ ζπληειεζηή 1 ηνπ Pearson, αλ εμαηξέζνπκε θαη πάιη ηηο ζηαζεξέο, εθθξάδεη ηηο δχν δεηγκαηηθέο 1 ηππηθέο απνθιίζεηο ησλ X θαη Y, πνπ εθθξάδεη ην βαζκφ ηεο κεηαβιεηφηεηάο ηνπο. Απφ ηνλ νξηζκφ ηνπ r πξνθχπηεη φηη φηαλ νη ηηκέο x i παίξλνπλ ηηκέο πάλσ απφ ην κέζν φξν x, ηφηε ε παξάζηαζε ( x x) είλαη ζεηηθή. Αλ ην ίδην ζπκβαίλεη γηα ην i ( y y) ηφηε ην γηλφκελν ( x x)( y y) είλαη ζεηηθφ φπσο επίζεο θαη ην r, θαζψο ν i i i

133 παξνλνκαζηήο είλαη πάληα ζεηηθφο. Γειαδή φηαλ ζε κεγάιεο ηηκέο ηεο κεηαβιεηήο X αληηζηνηρνχλ κεγάιεο ηηκέο ηεο κεηαβιεηήο Y, ηφηε ν ζπληειεζηήο ζπζρέηηζεο είλαη ζεηηθφο θαη νη αληίζηνηρεο κεηαβιεηέο ζεηηθά ζπζρεηηζκέλεο. Αληίζηνηρα, φηαλ νη ηηκέο x παίξλνπλ ηηκέο θάησ απφ ην κέζν φξν x, ηφηε ε παξάζηαζε ( x x) είλαη αξλεηηθή. i Αλ ην ίδην ζπκβαίλεη γηα ην ( y y) ηφηε ην γηλφκελν ( x x)( y y) είλαη ζεηηθφ φπσο i επίζεο θαη ην r. Γειαδή φηαλ ζε κηθξέο ηηκέο ηεο κεηαβιεηήο X αληηζηνηρνχλ κηθξέο ηηκέο ηεο κεηαβιεηήο Y, ηφηε ν ζπληειεζηήο ζπζρέηηζεο είλαη ζεηηθφο θαη νη αληίζηνηρεο κεηαβιεηέο ζεηηθά ζπζρεηηζκέλεο. Αληίζεηα φηαλ κεγάιεο ηηκέο ηεο X αληηζηνηρνχλ ζε κηθξέο ηηκέο ηεο Y, ηφηε ν ζπληειεζηήο ζπζρέηηζεο είλαη αξλεηηθφο θαη νη αληίζηνηρεο κεηαβιεηέο αξλεηηθά ζπζρεηηζκέλεο. Σν εχξνο ηηκψλ ηνπ ζπληειεζηή ζπζρέηηζεο είλαη απφ ην 1 έσο θαη ην 1. Σν κεδέλ αληηπξνζσπεχεη κεδεληθή ζρέζε κεηαμχ ησλ δχν κεηαβιεηψλ, ην 1 ηέιεηα ζεηηθή ζρέζε, ελψ ην 1 κηα ηέιεηα αξλεηηθή ζρέζε. Μεηαμχ ηνπ 1 θαη ηνπ 1, πξνηείλνληαη νη εμήο θαηεγνξηνπνηήζεηο ζηε βηβιηνγξαθία (Καηζήο θ. ζπλ. 2011, ζει. 112) σο πξνο ηελ απφιπηε ηηκή ηνπ r : κεδεληθή ζρέζε κηθξή ζρέζε κέηξηα ζρέζε ηζρπξή ζρέζε πνιχ ηζρπξή ζρέζε. Έηζη, ζην ρήκα 22 ηνπ Παξαδείγκαηνο 17 θαίλεηαη φηη έρνπκε ηζρπξή ζεηηθή ζπζρέηηζε, ε νπνία επηβεβαηψλεηαη απφ ην ζπληειεζηή ζπζρέηηζεο ηνπ Pearson πνπ ηζνχηαη κε Οη ζρεηηθνί αξηζκεηηθνί ππνινγηζκνί κέζσ ηεο R, μεθηλνχλ κε ηελ εηζαγσγή ησλ δεδνκέλσλ: > maths.b <- c(10, 11.5, 12, 15.5, 18, 19, 20) > maths.c <- c(10.5, 12, 14.5, 14.5, 17, 18.5, 20) θαη νινθιεξψλνληαη κε ηελ εληνιή > cor(maths.b, maths.c) [1] i i i

134 Αληίζεηα, ζην ρήκα 23Α ηα δεδνκέλα είλαη αζπζρέηηζηα ( r ) θαη ζην ρήκα 23Β αξλεηηθψο ζπζρεηηζκέλα ( r ). ρήκα 23. Α. Γηάγξακκα ζθεδαζκνχ γηα αζπζρέηηζηα δεδνκέλα. Β. Γηάγξακκα ζθεδαζκνχ θαη ε αληίζηνηρε επζεία γξακκηθήο παιηλδξφκεζεο γηα αξλεηηθψο ζπζρεηηζκέλα δεδνκέλα. Ωο ινγηθφ επφκελν ηεο χπαξμεο γξακκηθήο ζρέζεο κεηαμχ δχν κεηαβιεηψλ πξνθχπηεη ν θαζνξηζκφο ελφο ζπγθεθξηκέλνπ ηχπνπ ηεο κνξθήο Y a b X πνπ λα ηελ εθθξάδεη επαθξηβψο. Θέινπκε δειαδή λα πξνζδηνξίζνπκε ηελ θφθθηλε επζεία ζην ρήκα 22 πνπ αλαθέξεηαη ζηα δεδνκέλα ηνπ Παξαδείγκαηνο 17. Ωο κεηαβιεηέο έρνπκε νξίζεη ηελ X, πνπ ζπκβνιίδεη ηελ επίδνζε ζηα καζεκαηηθά ηεο Β Λπθείνπ, ε νπνία απνθαιείηαη αλεμάξηεηε κεηαβιεηή θαη σο Y ηελ επίδνζε ζηα καζεκαηηθά ηεο Γ Λπθείνπ ε νπνία απνθαιείηαη εμαξηεκέλε κεηαβιεηή. Ζ νξνινγία απηή βαζίδεηαη θπξίσο ζηε ρξήζε ηεο γξακκηθήο παιηλδξφκεζεο σο κνληέιν πξόβιεςεο ησλ ηηκψλ ηεο Y φηαλ νη ηηκέο ηεο X είλαη γλσζηέο. Γηα λα πξνζδηνξίζνπκε ηελ επζεία παιηλδξφκεζεο πξέπεη λα βξνχκε ηα a, b πνπ ιέγνληαη ζπληειεζηέο παιηλδξφκεζεο. Ο ζπληειεζηήο a, ν νπνίνο νλνκάδεηαη ζηαζεξφο φξνο (constant term ή intercept), εθθξάδεη ηελ ηηκή ηεο εμαξηεκέλεο κεηαβιεηήο Y φηαλ ε αλεμάξηεηε κεηαβιεηή X είλαη ίζε κε ην κεδέλ. Ο ζπληειεζηήο b αληηπξνζσπεχεη ηελ θιίζε ηεο επζείαο παιηλδξφκεζεο. Αλ ην b είλαη ζεηηθφ ηφηε ηα δεδνκέλα καο είλαη ζεηηθά ζπζρεηηζκέλα, ελψ αλ είλαη αξλεηηθφ ηα 126

135 δεδνκέλα είλαη αξλεηηθά ζπζρεηηζκέλα. Δπηπιένλ, ην b δείρλεη ηε κεηαβνιή ηεο Y φηαλ ε X κεηαβιεζεί θαηά κία κνλάδα. Γηα παξάδεηγκα, αλ ζηελ επζεία παιηλδξφκεζεο Y 23 X ζέζνπκε X 0 πξνθχπηεη Y 2 θαη αλ ζέζνπκε X 1 πξνθχπηεη Y 5. Γειαδή, φηαλ ε κεηαβιεηή X απμάλεηαη θαηά κία κνλάδα ηφηε ε κεηαβιεηή Y απμάλεηαη θαηά 3 κνλάδεο. Ο πην εχθνινο ηξφπνο γηα λα γίλεη ε εθηίκεζε ησλ a θαη b είλαη ε κέζνδνο ησλ ειαρίζησλ ηεηξαγψλσλ. πγθεθξηκέλα, ζεσξνχκε φηη ε επζεία πνπ ζα πξνζαξκφζνπκε ζηα δεδνκέλα καο δελ ζα δηέξρεηαη απφ φια ηα ζεκεία ηνπ δηαγξάκκαηνο ζθεδαζκνχ. ε απηή ηελ πεξίπησζε ζα είρακε απνιχησο ζπλεπζεηαθά δεδνκέλα πνπ δελ επηηπγράλεηαη ζηελ πξάμε. Δπνκέλσο, ε επζεία παιηλδξφκεζεο ζα παξνπζηάδεη θάπνην ζθάικα πξνζαξκνγήο γηα θάζε δεχγνο x, y ην νπνίν δελ αλήθεη ζηελ επζεία i i παιηλδξφκεζεο. Αλ y ˆi είλαη ε εθηηκψκελε ηηκή (fitted value) γηα ην Y φηαλ ζέζνπκε ζηελ επζεία παιηλδξφκεζεο φπνπ X ην x i, δειαδή yˆi a b x i, ηφηε ηθαλνπνηείηαη ε ζρέζε: y a b x y ( a b x ) y yˆ, φπνπ i 1,2,,. i i i i i i i i i Δίλαη ινηπφλ εχινγν λα επηιέμνπκε σο θξηηήξην γηα ηελ επηινγή ηεο επζείαο παιηλδξφκεζεο εθείλα ηα a θαη b ηα νπνία ειαρηζηνπνηνχλ ην ζπλνιηθφ ζθάικα πξνζαξκνγήο πνπ είλαη i y a b x i i i Υξεζηκνπνηνχκε ηα ηεηξάγσλα ησλ ζθαικάησλ 127 i γηα λα εμαζθαιίζνπκε φηη απηά ζα είλαη κεγαιχηεξα ή ίζα κε ην κεδέλ. Θα κπνξνχζακε λα πηνζεηήζνπκε σο ζπλνιηθφ ζθάικα πξνζαξκνγήο ην άζξνηζκα ησλ i, δειαδή ηελ πνζφηεηα. 1 ε απηή ηελ πεξίπησζε, επεηδή ηα i είλαη θαη ζεηηθά θαη αξλεηηθά, ζα κπνξνχζακε λα βξνχκε πνιχ κηθξφ ζπλνιηθφ ζθάικα πνπ δελ ζα αληαπνθξίλνληαλ ζηελ πξαγκαηηθφηεηα, επεηδή νη ζεηηθέο ηηκέο ζα αθπξψλνπλ ηηο αξλεηηθέο. Ζ ειαρηζηνπνίεζε ηνπ ζπλνιηθνχ ζθάικαηνο πξνζαξκνγήο γίλεηαη κε

136 καζεκαηηθέο κεζφδνπο, νη νπνίεο θαηαιήγνπλ ζηα εμήο απνηειέζκαηα (Mood et al., 1974, ζει. 499), γηα ηνπο εθηηκεηέο ησλ a θαη b πνπ ζπκβνιίδνληαη κε θαπειάθηα: bˆ i aˆ y bˆ x ( x x)( y y) x x 2 i i Παπάδειγμα 17 (ςνέσεια - Εςθεία γπαμμικήρ παλινδπόμηζηρ) Ζ εθαξκνγή ησλ παξαπάλσ ηχπσλ κε ηελ R, γίλεηαη κε ηελ εληνιή lm ε νπνία δέρεηαη ηνλ ηχπν ηεο γξακκηθήο παιηλδξφκεζεο ζηε κνξθή Y ~ ζπληειεζηέο a θαη ηνλ ζπληειεζηή ηνπ X πνπ είλαη b > lm(maths.c ~ maths.b) Call: lm(formula = maths.c ~ maths.b) Coefficients: (Intercept) maths.b X θαη καο δίλεη ηνπο Σν απνηέιεζκα αληηζηνηρεί ζηελ επζεία παιηλδξφκεζεο Y X. Με βάζε απηφλ ηνλ ηχπν ζρεκαηίδνπκε ηνλ πίλαθα κε ζηήιεο x i, y i, πνπ αλαθέξνληαη ζηα δεδνκέλα, ηηο εθηηκψκελεο ηηκέο y ˆi θαη ηέινο ηα ζθάικαηα πξνζαξκνγήο (residuals) i. x i y i y ˆi i

137 Με ηελ R κπνξνχκε λα έρνπκε ηηο δχν ηειεπηαίεο ζηήιεο ηνπ πίλαθα, σο εμήο: > lm(maths.c ~ maths.b)$fitted.values > lm(maths.c ~ maths.b)$residuals Ζ επζεία παιηλδξφκεζεο καδί κε ηα θαηαθφξπθα επζχγξακκα ηκήκαηα πνπ παξηζηάλνπλ ηα ζθάικαηα πξνζαξκνγήο i, γηα θάζε καζεηή απεηθνλίδνληαη ζην ρήκα 24. Ζ ζρέζε Y X καο δίλεη ηε δπλαηφηεηα πξφβιεςεο ηνπ βαζκνχ ζηα καζεκαηηθά ηεο Γ Λπθείνπ αλ είλαη γλσζηφο ν αληίζηνηρνο βαζκφο ηεο Β. Γηα παξάδεηγκα, αλ X 15, ηφηε πξνβιέπνπκε, κεηά απφ ζηξνγγπινπνίεζε ηνπ απνηειέζκαηνο, φηη Y ρήκα 24. Ζ επζεία γξακκηθήο παιηλδξφκεζεο ησλ δεδνκέλσλ ηνπ Παξαδείγκαηνο 17. Σα θαηαθφξπθα επζχγξακκα ηκήκαηα αληηζηνηρνχλ ζηα ζθάικαηα πξνζαξκνγήο. 129

138 130

139 5 Δλαιιαθηηθό Γηδαθηηθό Τιηθό γηα ηε ηαηηζηηθή Αλάιπζε θαη Δπεμεξγαζία Γεδνκέλσλ κε ηελ R Οη ζχγρξνλεο κνξθέο κάζεζεο θαη δηδαζθαιίαο δελ πεξηνξίδνληαη κφλν ζηελ παξαδνζηαθή κνξθή εθπαίδεπζεο (αίζνπζα δηδαζθαιίαο, πίλαθαο βηβιία), αιιά έρνπλ επεθηαζεί ξαγδαία ζε ελαιιαθηηθέο κνξθέο φπσο ε εμ απνζηάζεσο εθπαίδεπζε θαη ε εθπαίδεπζε πνπ βαζίδεηαη ζε καζεζηαθά πεξηβάιινληα κε επίθεληξν ηνπο ππνινγηζηέο (computer based learning environment) ή εηδηθφηεξα ην Internet (web based learning environment). Γηα λα κπνξέζεη ην δηδαθηηθφ πιηθφ λα αληαπνθξηζεί ζηηο λέεο απαηηήζεηο πξνέθπςε ε αλάγθε αλακφξθσζεο θαη εκπινπηηζκνχ ηνπ ζπκβαηηθνχ δηδαθηηθνχ πιηθνχ (π.ρ. ζπγγξάκκαηα) πνπ ζπλήζσο ζπλνδεχεη ηνλ παξαδνζηαθφ ηξφπν δηδαζθαιίαο. Γηα απηφ ην ιφγν αλαπηχρζεθε Δλαιιαθηηθφ Γηδαθηηθφ Τιηθφ (ΔΓΤ), κε ζηφρν λα βνεζήζεη νπνηνλδήπνηε ζέιεη λα εκπιαθεί ζε κηα δηεξγαζία κάζεζεο (καζεηή, ζπνπδαζηή, επαγγεικαηία, επηζηήκνλα ή αλεηδίθεπην πνιίηε), λα θαηαλνήζεη θαη λα αθνκνηψζεη ην πξνο κειέηε γλσζηηθφ αληηθείκελν, ζε ζπλζήθεο ζηηο νπνίεο ε επηθνηλσλία κε ην δηδάζθνληα θαη ηνπο άιινπο εθπαηδεπφκελνπο είλαη πεξηνξηζκέλε ή απνπζηάδεη πιήξσο. Αιιά αθφκα θαη ζηνλ παξαδνζηαθφ ηξφπν δηδαζθαιίαο ζηνλ νπνίν ε παξνπζία ηνπ δηδάζθνληα-εθπαηδεπηή είλαη ζπλερήο ζχγρξνλε ηερλνινγία παξέρεη εξγαιεία πνπ πιαηζηψλνπλ θαη ελίνηε νινθιεξψλνπλ ηε ζπκβαηηθή δηδαζθαιία. ην ΔΓΤ ρξεζηκνπνηνχληαη κνξθέο δηδαθηηθνχ πιηθνχ πνπ βαζίδνληαη ζηε ζχγρξνλε ηερλνινγία, φπσο νπηηθναθνπζηηθφ πιηθφ πνπ απνηειείηαη απφ βηληενζθνπεκέλεο δηαιέμεηο, δηαθάλεηεο ζε ειεθηξνληθή κνξθή, πξνζνκνηψζεηο ζηνλ ππνινγηζηή, ππεξθείκελα θαη άιια. 5.1 Μνξθέο ΔΓΤ γηα ηελ R Ζ ζηαηηζηηθή αλάιπζε θαη επεμεξγαζία δεδνκέλσλ ππνβνεζείηαη ζεκαληηθά απφ ηνπο ππνινγηζηέο, επνκέλσο ε δηδαζθαιία ηεο ζηαηηζηηθήο ρξεζηκνπνηεί θαη ελίνηε 131

140 βαζίδεηαη ζηνλ ππνινγηζηή, εδψ θαη πνιιά ρξφληα. Βαζηθά εξγαιεία γηα ηελ ζηαηηζηηθή εθπαίδεπζε απνηεινχλ ηα ινγηζκηθά, ηα παθέηα θαη νη γιψζζεο πξνγξακκαηηζκνχ ζηα νπνία αλαθεξζήθακε εθηελψο ζην 2 ν θεθάιαην. Ζ ρξήζε απηψλ ησλ ςεθηαθψλ εθαξκνγψλ ζεσξείηαη πιένλ απαξαίηεηε ζηε δηδαζθαιία ηεο ζηαηηζηηθήο θαη δελ πεξηνξίδεηαη απιψο ζηελ εμαγσγή αξηζκεηηθψλ απνηειεζκάησλ θαη γξαθηθψλ παξαζηάζεσλ αιιά ε ρξήζε ηνπο επεθηείλεηαη σο εξγαιεία εκβάζπλζεο ζηηο έλλνηεο ηεο ζηαηηζηηθήο επηζηήκεο. Έηζη, ην ΔΓΤ πνπ πξνηείλεηαη ζην ρψξν ηεο ζηαηηζηηθήο θαη ζρεηίδεηαη κε ηελ R, πεξηιακβάλεη: Τπεξθείκελα (hypertexts) θαη ηζηνζειίδεο (websites). Σα ππεξθείκελα είλαη θείκελα πνπ επηηξέπνπλ ηε κε γξακκηθή κειέηε ηνπ πιηθνχ πνπ επηηπγράλεηαη κε ηε βνήζεηα ππεξζπλδέζκσλ. Με ηνπο ππεξζπλδέζκνπο κπνξνχκε λα κεηαβαίλνπκε απφ πιεξνθνξία ζε πιεξνθνξία ή δηδαθηηθή ελφηεηα ζε δηδαθηηθή ελφηεηα εληφο ηνπ ππεξθεηκέλνπ ρσξίο λα απαηηείηαη ε γξακκηθή, δειαδή ζεηξηαθή, κειέηε φινπ ηνπ θεηκέλνπ, φπσο ζπκβαίλεη κε ηα ζπκβαηηθά βηβιία. Τπεξθείκελα κπνξνχκε λα βξνχκε ζρεδφλ ζε νπνηαδήπνηε ηζηνζειίδα, ε νπνία απνηειείηαη απφ ζχλνιν ππεξθεηκέλσλ, αιιά θαη άιισλ κνξθψλ ΔΓΤ, φπσο απηέο πνπ αθνινπζνχλ. Δλδεηθηηθά κπνξνχκε λα αλαθέξνπκε ηνπο παξαθάησ δηαδηθηπαθνχο ηφπνπο: 1. R Tutorial, κε αληηθείκελν ηελ εηζαγσγή ζηε ζηαηηζηηθή κε ηελ R, 2. Quick-R, πνπ παξέρεη ζχληνκα άξζξα γηα ηελ R ζε πνιιέο ζεκαηηθέο ελφηεηεο ηεο ζηαηηζηηθήο, 3. R-Wiki, κε ζθνπφ λα ζπκπιεξψζεη ή λα δηαιεπθάλεη κε ηε βνήζεηα παξαδεηγκάησλ ηα εγρεηξίδηα ηεο R θαη άιισλ ζπγγξαθέσλ, 4. R Graph Gallery, πνπ επηθεληξψλεηαη ζηηο γξαθηθέο δπλαηφηεηεο ηεο R, 5. R seek, κηα κεραλή αλαδήηεζεο γηα ηελ R, 6. R-bloggers, πνπ είλαη έλα blog γηα ηνπο ρξήζηεο ηεο R θαη 7. New Statistics (ζηε Γεξκαληθή γιψζζα) & The Statistical Lab, πνπ πεξηιακβάλνπλ ΔΓΤ θαη ινγηζκηθφ αληίζηνηρα γηα ηε δηδαζθαιία ηεο ζηαηηζηηθήο κε ηελ R απφ ην Free University Berlin. 132

141 Βηληενδηαιέμεηο (webcasts). Δίλαη κηα εθαξκνγή ινγηζκηθνχ κε δπλαηφηεηα πξνβνιήο βίληεν κε δηαιέμεηο απφ θάπνην δηδάζθνληα-εθπαηδεπηή. ηε δηδαζθαιία ηεο ζηαηηζηηθήο είλαη πνιχ ζπλεζηζκέλν λα παξνπζηάδνληαη κε απηφλ ηνλ ηξφπν ηα δηαδνρηθά βήκαηα πνπ αθνινπζνχληαη ζε κηα ςεθηαθή εθαξκνγή γηα ηε δεκηνπξγία ελφο γξαθήκαηνο ή ελφο ειέγρνπ ππνζέζεσλ ζε έλα δείγκα. Ο εθπαηδεπφκελνο έρεη ηε δπλαηφηεηα ηεο αζχγρξνλεο πξνζπέιαζεο κέζσ CD/DVD ή ηνπ Internet. Δίλαη έλα πνιχ επέιηθην δηδαθηηθφ πιηθφ δηφηη ν εθπαηδεπφκελνο κπνξεί λα ην δηαθφςεη πξνζσξηλά, λα ην επαλεθθηλήζεη θαη ηέινο λα ην επαλαιάβεη ζχκθσλα κε ηηο αλάγθεο ηνπ. Σν κεηνλέθηεκά ηνπ webcast είλαη φηη απνηειεί κνλφδξνκε επηθνηλσλία δηφηη ν εθπαηδεπφκελνο δελ έρεη ηε δπλαηφηεηα αιιειεπίδξαζεο κε ην δηδάζθνληα. Πιεζψξα ηέηνησλ βηληενδηαιέμεσλ γηα ηελ R κπνξεί θαλείο λα βξεη ζηε δηεχζπλζε θαη βέβαηα ζην YouTube δίλνληαο σο ιέμεηο θιεηδηά ζηελ αλαδήηεζε π.ρ. statistics with R. Πξόγξακκα επηδείμεσλ ησλ δπλαηνηήησλ ησλ ςεθηαθώλ εθαξκνγώλ (demos). Ζ ε R δηαζέηεη ηέηνηα demos γηα ηε δεκηνπξγία γξαθηθψλ παξαζηάζεσλ, γηα ηελ παξνπζίαζε παξαδεηγκάησλ γξακκηθήο παιηλδξφκεζεο θαη άιισλ δπλαηνηήησλ πνπ δηαζέηεη. ρήκα 25. ηηγκηφηππν απφ ηελ εθηέιεζε ηνπ demo graphics. 133

142 Έηζη αλ πιεθηξνινγήζνπκε > demo(graphics) ζε θάζε πάηεκα ηνπ αξηζηεξνχ θνπκπηνχ ηνπ πνληηθηνχ πάλσ ζην παξάζπξν ησλ γξαθεκάησλ (ζηα δεμηά) έρνπκε θαη κηα δηαθνξεηηθή γξαθηθή παξάζηαζε θαη ηνλ αληίζηνηρν θψδηθα εληνιψλ κε ζρνιηαζκφ (ζηα αξηζηεξά). ην ρήκα 25 παξαθάησ ζρήκα θαίλεηαη ην δεχηεξν θαηά ζεηξά γξάθεκα, έλα θπθιηθφ δηάγξακκα. Γηα λα δνχκε ην ζχλνιν ησλ demos ηεο R αξθεί λα πιεθηξνινγήζνπκε > demo() Κώδηθα εληνιώλ. Ο θψδηθαο κπνξεί λα απνηειείηαη απφ ιίγεο γξακκέο εληνιψλ πνπ δίλνληαη ζηελ θνλζφια ηεο βαζηθήο έθδνζεο ηεο R ή ηνπ RStudio, φπσο γηα παξάδεηγκα > mean( c(-1, 3, 4) ) [1] 2 ή λα απνηειείηαη απφ παξακεηξνπνηεκέλεο ζπιινγέο εληνιψλ πνπ είλαη θαηαρσξεκέλεο ζε θάπνην αξρείν, ην νπνίν ζηελ R απνθαιείηαη ζπλάξηεζε (function), φπσο νη ζπλαξηήζεηο ηνπ Παξαξηήκαηνο Α. Γηα λα απνηειεί ν θψδηθαο εληνιψλ δηδαθηηθφ πιηθφ πξέπεη λα έρεη ηα ραξαθηεξηζηηθά πνπ αλαθέξνληαη ζην mailing list ηεο R, δειαδή λα είλαη commented, minimal, selfcontained and reproducible. Δίλαη θαιφ ν θψδηθαο λα πεξηέρεη ζρφιηα, πιεξνθνξίεο θαη λα ζπλνδεχεηαη απφ επαξθή ηεθκεξίσζε (documentation) ψζηε λα θαηαηνπίδεη φζν γίλεηαη θαιχηεξα ην ρξήζηε γηα ην πεξηερφκελν ηνπ. ηελ R ζεσξείηαη σο ζρφιην νηηδήπνηε αθνινπζεί ζηελ ίδηα γξακκή ην ζχκβνιν #. Δπηπιένλ, ν θψδηθαο πξέπεη λα είλαη φζν απινπνηεκέλνο γίλεηαη, δηφηη ηφηε είλαη πεξηζζφηεξν θαηαλνεηφο θαη ιηγφηεξν εθηεζεηκέλνο ζε ιάζε. Ζ απηάξθεηα ηνπ θψδηθα ζρεηίδεηαη κε ηα επηπξφζζεηα ζηνηρεία πνπ απαηηνχληαη γηα λα εθηειεζηνχλ νη εληνιέο θαη λα πάξνπκε ηα ίδηα απνηειέζκαηα κε απηά πνπ ηζρπξίδεηαη ν ζπγγξαθέαο ηνπ. Απηφ έρεη λα θάλεη ζπλήζσο κε ηελ 134

143 ελεξγνπνίεζε θάπνησλ παθέησλ ή ηε ρνξήγεζε δεδνκέλσλ. Σειηθά, πξέπεη λα δίλεηαη ε δπλαηφηεηα ζε νπνηνλδήπνηε ρξήζηε λα κπνξεί λα αλαπαξάγεη ηνλ θψδηθα ψζηε λα γίλεηαη θαηαλνεηφο αιιά θαη λα ειέγρεηαη απφ ηελ επηζηεκνληθή θνηλφηεηα ε αθξίβεηα ησλ απνηειεζκάησλ ηνπ (Schwab, Karrenbach & Claerbout, 2000, ζει. 61). Ζ θηινζνθία ησλ ινγηζκηθψλ αλνηθηνχ θψδηθα, φπσο ε R, ζπλάδεη κε ηελ ηδέα ηεο αλαπαξαγσγήο θψδηθα. Γηα απηφ θαη ν δηαδηθηπαθφο ηφπνο ηεο R δηαζέηεη επξεία ηεθκεξίσζε κε εγρεηξίδηα, ζπρλέο εξσηήζεηο (FAQs), πεξηνδηθφ (The R Journal), βηβιία θαη άιια. Δπηπιένλ ν θψδηθαο εληνιψλ φισλ ησλ εληνιψλ είλαη δηαζέζηκνο ζε νπνηνλδήπνηε ρξήζηε. Γηα παξάδεηγκα αλ πιεθηξνινγήζνπκε ζηελ θνλζφια ηεο R: > sd ην απνηέιεζκα ζα είλαη ν θψδηθαο εληνιψλ γηα ηνλ ππνινγηζκφ ηεο ηππηθήο απφθιηζεο. Μηα αθφκα ελδηαθέξνπζα παξαθαηαζήθε κε θψδηθα ηεο R πνπ είλαη δπλαηφ λα αλαπαξαρζεί κπνξεί ν αλαγλψζηεο λα βξεη ζην δηαδηθηπαθφ ηφπν θαη ην ζχλδεζκν Statistics Software (Wessa, 2012). Πξνζνκνηώζεηο. ηε ηαηηζηηθή είλαη αξθεηά δηαδεδνκέλε ε άπνςε (King et al., 2000 Wood 2005 Chance & Rossman 2006) φηη ε εθκάζεζε ησλ ελλνηψλ δηεπθνιχλεηαη κε ηε βνήζεηα ζηαηηζηηθψλ πξνζνκνηψζεσλ (statistical simulations). Οη ζηαηηζηηθέο πξνζνκνηψζεηο ρξεζηκνπνηνχλ έλα ή πεξηζζφηεξα δείγκαηα γηα λα πξνζεγγίζνπλ ελδηαθέξνπζεο παξακέηξνπο ηνπ πιεζπζκνχ. Γηα παξάδεηγκα, αλ ζέινπκε λα ππνινγίζνπκε ηε κέζε ηηκή ελφο πιεζπζκνχ πνπ αθνινπζεί ηελ θαηαλνκή 2 κε 5 βαζκνχο ειεπζεξίαο πξέπεη λα ππνινγίζνπκε ηελ ηηκή ελφο νινθιεξψκαηνο πνπ απαηηεί εμεηδηθεπκέλεο καζεκαηηθέο γλψζεηο. Δλαιιαθηηθά, κπνξνχκε λα πξνζεγγίζνπκε ηε κέζε ηηκή ηνπ πιεζπζκνχ κε ηε κέζε ηηκή ελφο δείγκαηνο πνπ πξνέξρεηαη απφ απηφλ ηνλ πιεζπζκφ. Ζ R δίλεη ηέηνηεο δπλαηφηεηεο κε ηηο εληνιέο rnorm, rt θαη rchisq γηα ηηο θαηαλνκέο θαλνληθή, t θαη 2 αληίζηνηρα. Έηζη γηα ηελ πεξίπησζε ηεο 2 κε 5 βαζκνχο ειεπζεξίαο, ην δηάλπζκα sample.chisq απνηειείηαη απφ 10 ηπραίνπο αξηζκνχο πνπ πξνέξρνληαη απφ ηνλ παξαπάλσ πιεζπζκφ, κε ηελ εληνιή 135

144 > sample.chisq <- rchisq(n=10, df=5) Γηα λα δνχκε ηηο παξαηεξήζεηο ηνπ δείγκαηνο θαη λα βξνχκε ηε κέζε ηνπο ηηκή πιεθηξνινγνχκε > sample.chisq [1] > mean (sample.chisq) [1] Ζ κέζε ηηκή 4.71 ηνπ δείγκαηνο πξνζεγγίδεη ηθαλνπνηεηηθά ηε κέζε ηηκή ηνπ πιεζπζκνχ πνπ είλαη 5. Γεληθά, έλαο πιεζπζκφο πνπ αθνινπζεί θαηαλνκή κε βαζκνχο ειεπζεξίαο έρεη κέζε ηηκή ίζε κε (Mood et al., 1974, ζει. 242). Αλ ζέινπκε λα απμήζνπκε ηελ αθξίβεηα ησλ ζπκπεξαζκάησλ καο ή λα κειεηήζνπκε πην ζχλζεηεο καζεκαηηθέο έλλνηεο ηφηε ε καζεζηαθή δηαδηθαζία εκπινπηίδεηαη απφ ηελ παξακεηξνπνίεζε ηεο πξνζνκνίσζεο. Έηζη, ζην πξνεγνχκελν παξάδεηγκα, γηα λα απμήζνπκε ηελ αθξίβεηα ζηνλ ππνινγηζκφ ηεο κέζεο ηηκήο κπνξνχκε λα απμήζνπκε ην κέγεζνο ηνπ δείγκαηνο ή λα ρξεζηκνπνηήζνπκε πνιιαπιά δείγκαηα ή λα θάλνπκε ηαπηφρξνλα θαη ηα δχν. Δπηπιένλ, ηδηαίηεξν ελδηαθέξνλ παξνπζηάδνπλ νη πξνζνκνηψζεηο πνπ βνεζνχλ ζηελ θαηαλφεζε ελλνηψλ πνπ δελ κπνξνχλ λα δηδαρζνχλ εχθνια κε ην ζπκβαηηθφ ηξφπν δηδαζθαιίαο, φπσο ε κεηαηξνπή ηνπ πνιπγψλνπ ζπρλνηήησλ ζε θακπχιε ζπρλνηήησλ (ελφηεηα 3.4). Ζ πξνζνκνίσζε απηή εθαξκφδεηαη ζε έλα δείγκα κεγάινπ κεγέζνπο κε κεηαβαιιφκελν αξηζκφ θιάζεσλ, ψζηε λα είλαη νξαηφο ν κεηαζρεκαηηζκφο ηνπ πνιπγψλνπ ζε θακπχιε. 2 ηηο επφκελεο ελφηεηεο απηνχ ηνπ θεθαιαίνπ παξνπζηάδεηαη ΔΓΤ πνπ αθνξά ηε ζηαηηζηηθή κεζνδνινγία κε ηελ R. Μέξνο απηνχ ηνπ πιηθνχ δεκηνπξγήζεθε ζηα πιαίζηα ηεο παξνχζαο δηπισκαηηθήο εξγαζίαο. Σν ζχλνιν ηνπ ΔΓΤ έρεη νξγαλσζεί ζηo δηαδηθηπαθφ ηφπν κε ηίηιν «Αλάιπζε θαη Δπεμεξγαζία Δξεπλεηηθψλ Γεδνκέλσλ κε ηελ R», ζηε δηεχζπλζε 136

145 5.2 Πξνεηνηκαζία ηεο βαζηθήο έθδνζεο ηεο R θαη ηνπ RStudio Ζ αλάιπζε θαη επεμεξγαζία εξεπλεηηθψλ δεδνκέλσλ κπνξεί λα πινπνηεζεί κε ηε βαζηθή έθδνζε ηεο R, ε νπνία δηαζέηεη δηεπαθή κε γξακκή εληνιψλ θαη ζρεηηθά ιίγα κελνχ πνπ αθνξνχλ απνθιεηζηηθά ηερληθέο ξπζκίζεηο ηεο R θαη φρη εληνιέο πνπ αλαθέξνληαη ζηε ζηαηηζηηθή κεζνδνινγία (ελφηεηα 3.1). Δλαιιαθηηθά, κπνξεί λα ρξεζηκνπνηεζεί ην RStudio, πνπ είλαη έλα νινθιεξσκέλν πεξηβάιινλ εξγαζίαο κε ζηφρν ηε δηεπθφιπλζε ηεο ρξήζεο θαη ηελ αμηνπνίεζε ησλ ηερληθψλ ραξαθηεξηζηηθψλ ηεο R (ελφηεηα 3.6). Γηα λα δηεπθνιπλζεί αθφκα πεξηζζφηεξν ε αιιειεπίδξαζε κεηαμχ ρξήζηε, ππνινγηζηή θαη R, έρνπλ αλαπηπρζεί επηπξφζζεηα παθέηα (packages) πνπ θάλνπλ εθηεηακέλε ρξήζε γξαθηθνχ πεξηβάιινληνο δηεπαθήο, κε κελνχ πνπ πεξηέρνπλ εληνιέο γηα ηε ζηαηηζηηθή αλάιπζε θαη επεμεξγαζία ησλ δεδνκέλσλ (π.ρ. ππνινγηζκφο αξηζκεηηθψλ κέηξσλ, γξακκηθή παιηλδξφκεζε θιπ). Οξηζκέλα απφ απηά είλαη ην pmg (Verzani & Noel, 2010 Verzani, 2008), ην R commander (Fox et al., 2012 Fox, 2005), ην rattle (Williams, 2012 Williams 2009 & 2011) θαη ην Deducer (Fellows, 2012). Απφ απηά ηα παθέηα πξνθξίλνπκε ην pmg θαη ην R commander σο ηα πιένλ θαηάιιεια γηα λα πινπνηήζνπκε ηε ζηαηηζηηθή κεζνδνινγία κε ηελ R πνπ αλαπηχρζεθε ζην 4 ν θεθάιαην. Ζ επηινγή ηνπ pmg ζηεξίδεηαη φρη κφλν ζην γξαθηθφ πεξηβάιινλ δηεπαθήο πνπ δηαζέηεη αιιά θαη ζηνλ πξνζαλαηνιηζκφ ηνπ ζηε δηδαζθαιία ηεο ζηαηηζηηθήο γηα κε-έκπεηξνπο ρξήζηεο. Δλδεηθηηθφο είλαη ν ζαξθαζηηθφο ηίηινο ηεο ηζηνζειίδαο ηνπ παθέηνπ ζην CRAN: pmg: Poor s man GUI, αιιά θαη νη επηζεκάλζεηο ηνπ ζπγγξαθέα ηνπ παθέηνπ, Verzani (2008, ζει. 2): the use of pmg greatly simplifies the initial learning curve required of the students. Απφ ηελ άιιε κεξηά ην R commander είλαη έλα αμηνζεκείσην παθέην δηφηη απνηειεί ηε ζπλεηζθνξά ηεο νκάδαο ησλ επηζηεκφλσλ πνπ δηαρεηξίδνληαη ηελ R (R Project Contributors), γηα λα θαιπθζνχλ ηα θελά ηεο βαζηθήο εθαξκνγήο ζηνλ ηνκέα ηεο ζηαηηζηηθήο αλάιπζεο θαη επεμεξγαζίαο δεδνκέλσλ κε GUI. Γηα λα ηελ εγθαηάζηαζε θαη ελεξγνπνίεζε ησλ παθέησλ pmg θαη Rcmdr ζε ππνινγηζηέο πνπ δηαζέηνπλ ην ιεηηνπξγηθφ ζχζηεκα ησλ Windows αθνινπζνχκε ηηο νδεγίεο ηεο ελφηεηαο 3.7. Αλ ε δηαδηθαζία νινθιεξσζεί ζσζηά γηα ην παθέην pmg, είηε 137

146 ζηε βαζηθή έθδνζε ηεο R είηε ζην RStudio, εκθαλίδεηαη ην παξάζπξν κε ηίηιν PMG Dialogs, φπσο θαίλεηαη ζην παξαθάησ ζρήκα: Ζ πξψηε γξακκή ηνπ PMG Dialogs πεξηιακβάλεη ηα κελνχ File, Data, Plots, Tests, Models θαη Help. Σν κελνχ File ζρεηίδεηαη κε ηε δηαρείξηζε αξρείσλ, ηνπ workspace θαη άιισλ παθέησλ εθηφο ηνπ pmg. Σν κελνχ Help παξέρεη βνήζεηα γηα ηελ επίιπζε απνξηψλ θαη πξνβιεκάησλ ζηε ιεηηνπξγία ηεο εθαξκνγήο. Σα ππφινηπα κελνχ φκσο, αλαθέξνληαη απνθιεηζηηθά ζηελ αλάιπζε θαη επεμεξγαζία δεδνκέλσλ θαη ζα ηα δνχκε αλαιπηηθά ζηηο επφκελεο ελφηεηεο. Γηα ηελ εγθαηάζηαζε θαη ελεξγνπνίεζε ηνπ Rcmdr αθνινπζνχκε ηελ ίδηα δηαδηθαζία, φκσο κφλν απφ ηε βαζηθή έθδνζε ηεο R, δηφηη δελ είλαη αθφκα φιεο νη ιεηηνπξγίεο ηνπ R Commander ζπκβαηέο κε ην RStudio. Μεηά ηελ νινθιήξσζή ηεο δηαδηθαζίαο εκθαλίδεηαη ην παξάζπξν κε ηίηιν R Commander. Ζ εθαξκνγή R Commander έρεη ζηελ νζφλε ηνπ ππνινγηζηή ηε κνξθή πνπ απεηθνλίδεηαη ζην ρήκα 26. Σν R Commander πεξηιακβάλεη ηα κελνχ File, Edit, Data, Statistics, Graphs, Models, Distributions, Tools θαη Help. Σα κελνχ File θαη Tools παξέρνπλ δπλαηφηεηεο δηαρείξηζεο αξρείσλ ή παθέησλ αληίζηνηρα, ην κελνχ Edit πεξηέρεη ηηο γλσζηέο εληνιέο γηα επεμεξγαζία θεηκέλνπ (αληηγξαθή, επηθφιιεζε, αλαίξεζε θιπ) θαη ην κελνχ Help 138

147 βνήζεηα γηα ηε ιεηηνπξγία ηεο εθαξκνγήο. Οη ππφινηπνη θαηάινγνη εληνιψλ παξέρνπλ πιεζψξα επηινγψλ γηα ηε ζηαηηζηηθή αλάιπζε θαη επεμεξγαζία δεδνκέλσλ, κε ηνπο νπνίνπο θπξίσο ζα αζρνιεζνχκε ζηηο επφκελεο ελφηεηεο. ηε δεχηεξε γξακκή, ε έλδεημε Data set πεξηέρεη ην φλνκα ηνπ αληηθεηκέλνπ ην νπνίν επηζπκνχκε λα επεμεξγαζηνχκε. Ζ ππφινηπε εθαξκνγή ρσξίδεηαη ζε ηξία ηκήκαηα, Script Window γηα εηζαγσγή ησλ εληνιψλ, Output Window γηα ηελ εμαγσγή ησλ απνηειεζκάησλ θαη Messages γηα ηελ εκθάληζε κελπκάησλ. ρήκα 26. Αξρηθή νζφλε ηνπ R Commander. Δπηζεκαίλεηαη φηη ζε θάζε πεξίπησζε ε βαζηθή έθδνζε ηεο R ή ην RStudio, εμαθνινπζνχλ λα ιεηηνπξγνχλ θαη δελ πξέπεη λα ηα δηαθφςνπκε δηφηη ηφηε ηεξκαηίδνληαη θαη νη εθαξκνγέο PMG Dialogs θαη R Commander. ηελ ηζηνζειίδα ν αλαγλψζηεο κπνξεί λα βξεη θείκελα θαη βηληενδηναιέμεηο γηα ηελ εγθαηάζηαζε θαη ελεξγνπνίεζε ησλ παθέησλ pmg θαη Rcmdr. 139

148 5.3 Παξνπζίαζε ηνπ ελαιιαθηηθνύ δηδαθηηθνύ πιηθνύ γηα ηελ R Αθνινχζσο ζα παξνπζηάζνπκε ην ΔΓΤ γηα ηελ R πνπ είλαη θαηάιιειν γηα ηα ζέκαηα ζηαηηζηηθήο κεζνδνινγίαο πνπ αλαπηχρζεθαλ ζην 4 ν θεθάιαην. Ζ παξνπζίαζε ηνπ ΔΓΤ ππνβνεζείηαη ζε πνιιέο πεξηπηψζεηο απφ ηηο εθαξκνγέο PMG Dialogs θαη R Commander ΔΓΤ γηα ηελ πεξηγξαθηθή ζηαηηζηηθή Ζ παξνπζίαζε ηεο πεξηγξαθηθήο ζηαηηζηηθήο πνπ αλαπηχρζεθε ζηελ ελφηεηα 4.2 παξνπζηάδεηαη ελαιιαθηηθά κε ηε βνήζεηα ηνπ PMG Dialogs θαη θαηάιιεινπ ΔΓΤ. ην κελνχ Data, κεηαμχ άιισλ πεξηιακβάλεηαη ε επηινγή Univariate summaries κε ηελ νπνία ππνινγίδνπκε ηε κέζε ηηκή, ηελ ηππηθή απφθιηζε, ηε δηαθχκαλζε θαη ηελ θαηαλνκή ζπρλνηήησλ κηαο κεηαβιεηήο. Γηα λα δνχκε ηε ρξήζε ηνπο, ζα ππνινγίζνπκε αξρηθά ηε κέζε ηηκή ηεο κεηαβιεηήο museum.visits ηνπ Παξαδείγκαηνο 1. Δπηιέγνπκε Data/Univariate summaries/mean. Σν παξάζπξν κε ηίηιν mean(), πνπ εκθαλίδεηαη ρσξίδεηαη ζε δχν ηκήκαηα κε ηίηινπο data θαη Arguments. ην ηκήκα data πξέπεη λα εηζάγνπκε ζην πιαίζην κε ηελ έλδεημε x= ηε κεηαβιεηή ηεο νπνίαο ζέινπκε λα ππνινγίζνπκε ην κέζν φξν. Ζ εηζαγσγή γίλεηαη είηε εηζάγνληαο ην φλνκα ελφο ήδε νξηζκέλνπ αληηθεηκέλνπ δεδνκέλσλ απφ ηνλ θαηάινγν ησλ κεηαβιεηψλ πνπ βξίζθεηαη ζην αξηζηεξφ ηκήκα ηεο εθαξκνγήο (π.ρ. museum.visits) είηε εηζάγνληαο κε πιεθηξνιφγεζε εληφο ηνπ πιαηζίνπ κε ηελ έλδεημε x= ησλ δεδνκέλσλ, φπσο ζηελ θνλζφια ηεο R, δειαδή X=museum.visits <-c(0, 1, 3, 0, 2, 0, 1, 1, 1, 0, 2, 2, 0, 0, 1, 0, 0, 1, 2, 0) Ζ εηζαγσγή ηνπ αληηθεηκέλνπ απφ ην αξηζηεξφ ηκήκα ηεο εθαξκνγήο γίλεηαη κε ζχξζηκν ηνπ νλφκαηνο ηεο κεηαβιεηήο κέζα ζην πιαίζην κε ηελ έλδεημε x=, κέρξη λα εκθαληζηεί ην πξφζεκν + ζην ζρεηηθφ εηθνλίδην κε ζρήκα ζειίδαο εγγξάθνπ. Σν παξάζπξν mean() πεξηέρεη κηα ζεηξά άιιεο επηινγέο ζην ηκήκα Arguments ζηηο νπνίεο δελ επεκβαίλνπκε, 140

149 εθηφο αλ επηζεκαίλεηαη ην αληίζεην. Σέινο, παηάκε ην θνπκπί OK. Ζ εληνιή θαη ην απνηέιεζκα ηεο εθαξκνγήο ηεο εκθαλίδνληαη ζηελ πεξηνρή Command area. Με θφθθηλε γξακκαηνζεηξά εκθαλίδεηαη ε εληνιή πνπ ζα δίλακε ζηελ θνλζφια ηεο R γηα λα πάξνπκε ηα απνηειέζκαηα απηά θαη ζηελ επφκελε γξακκή ην απνηέιεζκα ηεο εληνιήο. Γηα ην Παξάδεηγκα 1 ην απνηέιεζκα είλαη 0.85, φζν ην είρακε ππνινγίζεη θαη κέζσ ηεο βαζηθήο έθδνζεο ηεο R ή ηεο θνλζφιαο ηνπ RStudio. Αληίζηνηρα, κπνξνχκε λα ππνινγίζνπκε ηελ ηππηθή απφθιηζε κηαο κεηαβιεηήο, κε ηηο επηινγέο Data/Univariate summaries/standard deviation. ε απηή ηελ πεξίπησζε ζην Command area ζα εκθαληζηνχλ νη γξακκέο > sd(x=museum.visits, na.rm=true) [1] Παξαηεξνχκε φηη δελ ππάξρεη ζην κελνχ Univariate summaries επηινγή γηα ηνλ ππνινγηζκφ ηεο δηαθχκαλζεο. Απηφ ζπκβαίλεη δηφηη φπσο αλαθέξακε ζηελ ππνελφηεηα 4.2.3, ε ηππηθή απφθιηζε ηζνχηαη κε ηελ ηεηξαγσληθή ξίδα ηεο δηαθχκαλζεο, νπφηε ε δηαθχκαλζε ηζνχηαη κε ην ηεηξάγσλν ηεο ηππηθήο απφθιηζεο. Γηα λα δψζνπκε απηέο ηηο εληνιέο ζηελ εθαξκνγή, ζην παξάζπξν Command area παηάκε ην θνπκπί Edit. Ζ γξακκή κε ηελ εληνιή είλαη πιένλ επεμεξγάζηκε θαη κπνξνχκε λα πξνζζέζνπκε ζην ηέινο ηεο ^2 (παηψληαο ζην πιεθηξνιφγην Shift+6 θαη 2), ψζηε λα πάξνπκε ην ηεηξάγσλν απηή ηεο πνζφηεηαο πνπ είλαη ε δηαθχκαλζε. Παηψληαο ην θνπκπί evaluate ζα έρνπκε > sd(x=museum.visits, na.rm=true)^2 [1] Γηα ηελ εχξεζε ηεο θαηαλνκήο ζπρλνηήησλ ηεο κεηαβιεηήο museum.visits επηιέγνπκε Data/Univariate summaries/table, εηζάγνπκε ηα δεδνκέλα ζην πιαίζην κε ηελ έλδεημε x= θαη παηάκε ην θνπκπί OK. Σα απνηειέζκαηα εκθαλίδνληαη ζην Command area θαη είλαη φκνηα κε απηά ηνπ πξνεγνχκελνπ θεθαιαίνπ. > table(x = museum.visits, exclude = c(na, NaN), deparse.level = 1) x

150 Γηα λα ππνινγίζνπκε ηηο ζρεηηθέο ζπρλφηεηεο 142 f i θαη ηηο ζρεηηθέο ζπρλφηεηεο f i %, ρξεζηκνπνηνχκε θαη πάιη ην παξάζπξν Command area ζην νπνίν παηάκε ην θνπκπί Edit. Ζ ηξνπνπνηεκέλε εληνιή πξνθχπηεη πξνζζέηνληαο ζην ηέινο ηεο /length(museum.visits), δειαδή δηαηξψληαο θάζε έλαλ απφ ηνπο αξηζκνχο 9, 6, 4, 1 κε ην κέγεζνο ηνπ δείγκαηνο πνπ ηαπηίδεηαη κε ην πιήζνο ησλ ζηνηρείσλ ηνπ δηαλχζκαηνο museum.visits. > table(x = museum.visits, exclude = c(na, NaN), deparse.level = 1) / length(museum.visits) x Γηα λα βξνχκε ηα απνηειέζκαηα ηνπ Παξαδείγκαηνο 2 κε ηελ εθαξκνγή PMG Dialogs πξέπεη λα νξίζνπκε αξρηθά ηηο θιάζεηο 0,60, 60,120, 120,180, 180,240 θαη 240,300. Απηφ κπνξεί λα γίλεη είηε απφ ηελ θνλζφια ηεο R ή ηνπ RStudio είηε ρξεζηκνπνηψληαο ην παξάζπξν Command area. πγθεθξηκέλα, αλ επηιέμνπκε Data/Univariate summaries/table γηα ηα δεδνκέλα, κε ην φλνκα solve.time, παίξλνπκε ηελ θαηαλνκή ζπρλνηήησλ ηνπ δηαλχζκαηνο ρσξίο φκσο νκαδνπνίεζε. Γειαδή, > table(x=solve.time, exclude=c(na,nan), deparse.level=1) x Γηα λα πεηχρνπκε ηελ νκαδνπνίεζε, ζην παξάζπξν Command area παηάκε ην θνπκπί Edit θαη θαηφπηλ Clear. ην θελφ παξάζπξν πνπ πξνθχπηεη πιεθηξνινγνχκε ηελ εληνιή > difficulty <- cut( solve.time, breaks=c(0, 60, 120, 180, 240, 300) ) φπσο αθξηβψο ζην Παξάδεηγκα 2 θαη παηάκε evaluate. Σν αληηθείκελν δεδνκέλσλ difficulty έρεη πιένλ πξνζηεζεί ζηνλ θαηάινγν κεηαβιεηψλ ζην αξηζηεξφ ηκήκα ηεο εθαξκνγήο, κε ηελ έλδεημε factor. Καηφπηλ, επηιέγνπκε Data/Univariate summaries/table θαη ζηε ζέζε ησλ δεδνκέλσλ καο (πιαίζην κε ηελ έλδεημε x=)

151 εηζάγνπκε ην αληηθείκελν δεδνκέλσλ difficulty. Σα απνηειέζκαηα είλαη πιένλ ηα επηζπκεηά > table(x=difficulty, exclude=c(na,nan), deparse.level=1) x (0,60] (60,120] (120,180] (180,240] (240,300] Γηα λα θάλνπκε γξαθηθέο παξαζηάζεηο κε ηε βνήζεηα ηνπ PMG Dialogs πξψηα αλνίγνπκε έλα παξάζπξν ζην νπνίν ζα γίλεη ην γξάθεκα, παηψληαο ην εηθνλίδην κε ηίηιν plot. Αθνινχζσο, απφ ην κελνχ Plots, επηιέγνπκε univariate θαη θάπνην απφ ηα δηαζέζηκα γξαθήκαηα, π.ρ. histogram. ην παξάζπξν κε ηίηιν hist() πνπ εκθαλίδεηαη εηζάγνπκε ηα δεδνκέλα solve.time θαη κε ην πάηεκα ηνπ OK ζρεκαηίδεηαη ην αληίζηνηρν ηζηφγξακκα, φπσο θαίλεηαη ζην παξαθάησ ζρήκα: Αλ ην παξάζπξν δελ είλαη νξαηφ, ζα πξέπεη λα ην αλαδεηήζνπκε ζηε γξακκή εξγαζηψλ ησλ Windows, πνπ βξίζθεηαη ζην θάησ κέξνο ηεο νζφλεο, πίζσ απφ ην εηθνλίδην. Σν γξάθεκα πνπ πξνθχπηεη βαζίδεηαη ζε θάπνηεο πξνθαζνξηζκέλεο παξακέηξνπο ηεο αληίζηνηρεο εληνιήο, νη νπνίεο δελ επηηξέπνπλ λα δηαηεξεζνχλ νη θιάζεηο πνπ νξίζακε κέζσ ηεο εληνιήο difficulty. Γηα λα μεπεξάζνπκε απηέο ηηο αθακςίεο ηεο εθαξκνγήο 143

152 πξέπεη λα επέκβνπκε κε ηε βνήζεηα ζπλαξηήζεσλ ηεο R, νη νπνίεο δηαζέηνπλ απεξηφξηζηεο δπλαηφηεηεο, ηαπηφρξνλα φκσο απαηηνχλ γλψζεηο πξνγξακκαηηζκνχ. Ο πην εχθνινο ηξφπνο γηα λα εμνηθεησζεί ν ρξήζηεο κε ηνλ πξνγξακκαηηζκφ είλαη ε ρξήζε θάπνησλ ζρεηηθά απιψλ παξαδεηγκάησλ, φπσο ε ζπλάξηεζε plot.hist() ε νπνία θαηαζθεπάδεη ην ηζηφγξακκα ηεο ελφηεηαο 4.2.2, γηα ηα νκαδνπνηεκέλα δεδνκέλα ηνπ Παξαδείγκαηνο 2. Γηα ηελ πξνβνιή θαη επεμεξγαζία ηνπ θψδηθα ζπλαξηήζεσλ ελδείθλπηαη ε ρξήζε ηνπ RStudio. ην θάησ δεμί κέξνο ηνπ RStudio θαη ζηελ ηακπέια Files εκθαλίδνληαη φιεο νη δηαζέζηκεο ζπλαξηήζεηο. Γηα λα επεμεξγαζηνχκε νπνηαδήπνηε απφ απηέο, ηελ επηιέγνπκε κε ην πνληίθη θαη ν θψδηθαο εκθαλίδεηαη ζε μερσξηζηφ παξάζπξν πάλσ απφ ηελ θνλζφια. Ο θψδηθαο ηεο ζπλάξηεζεο plot.hist() είλαη ν αθφινπζνο: plot.hist <- function(x=solve.time) { par(mar=c(5,6,2,2)) hist ( x, breaks=c(0,60,120,180,240,300), axes=false, freq=true, cex.lab=1.2, family="serif", col="cyan", main="", xlab="χρόνος επίλυσης (sec)", ylab=expression(paste("σχετική συχνότητα ", f[i])) ) axis( 1, at=c(0, 60, 120, 180, 240, 300), label=c(0, 60, 120, 180, 240, 300), cex.axis=1.2, family="serif" ) axis( 2, at=c(0, 2, 4, 6, 8), labels=c(0, 0.10, 0.20, 0.30, 0.40), cex.axis=1.2, family="serif" ) lines(c(0, 30, 90, 150, 210, 270, 300), c(0, 1, 8, 6, 3, 2, 0), lwd=4) } Ζ εληνιή par(mar=c(5,6,2,2)) ζρεηίδεηαη κε ηα φξηα ηνπ γξαθήκαηνο κέζα ζην παξάζπξν πνπ ζα ζρεδηαζηεί, γηα απηφ θαη δελ ζα καο απαζρνιήζεη πεξηζζφηεξν. Ζ εληνιή hist είλαη ε εληνιή ηεο R γηα ηε δεκηνπξγία ηζηνγξάκκαηνο ησλ δεδνκέλσλ κε 144

153 ην φλνκα x, ζην νπνίν έρνπκε δψζεη ηελ ηηκή x=solve.time, ζηελ πξψηε γξακκή ηεο ζπλάξηεζεο. Σν φξηζκα breaks=c(0,60,120,180,240,300) θαζνξίδεη ηα φξηα ησλ θιάζεσλ ηνπ ηζηνγξάκκαηνο θαη ην φξηζκα axes=false, ηελ εμάιεηςε ησλ πξνθαζνξηζκέλσλ επηινγψλ γηα ηνλ νξηδφληην θαη θαηαθφξπθν άμνλα. Γηα λα εκθαληζηνχλ νη άμνλεο ηεο επηινγήο καο αθνινπζνχλ νη εληνιέο axis( 1, at=c(0, 60, 120, 180, 240, 300), label=c(0, 60, 120, 180, 240, 300), cex.axis=1.2, family="serif" ) γηα ηνλ νξηδφληην άμνλα θαη axis( 2, at=c(0, 2, 4, 6, 8), labels=c(0, 0.10, 0.20, 0.30, 0.40), cex.axis=1.2, family="serif" ) γηα ηνλ θαηαθφξπθν άμνλα. Με ηα νξίζκαηα at θαη label δίλνπκε ηελ εληνιή λα ηνπνζεηεζνχλ (γηα ηνλ νξηδφληην άμνλα) ζηε ζέζε 0 ε ηηκή 0, ζηε ζέζε 60, ε ηηκή 60 θαη νχησ θαζεμήο. Οη εληνιέο cex.axis=1.2 θαη family="serif" αλαθέξνληαη ζην κέγεζνο θαη ηελ νηθνγέλεηα ηεο γξακκαηνζεηξάο πνπ ζα ρξεζηκνπνηεζεί ζην ζρήκα. Σέινο, κε ηελ εληνιή lines(c(0, 30, 90, 150, 210, 270, 300), c(0, 1, 8, 6, 3, 2, 0), lwd=4) ελψλνπκε κε επζχγξακκα ηκήκαηα ηα ζεκεία κε ζπληεηαγκέλεο ηηο αληίζηνηρεο ηηκέο ησλ c(0, 30, 90, 150, 210, 270, 300) θαη c(0, 1, 8, 6, 3, 2, 0), δειαδή ηα ζεκεία κε ζπληεηαγκέλεο 0,0, 30,1, 90,8, 150,6, 210,3, 300,0, ψζηε λα δεκηνπξγεζεί ην πνιχγσλν ζπρλνηήησλ. 270,2 θαη Σξνπνπνηψληαο θάπνηεο απφ ηηο παξακέηξνπο ησλ εληνιψλ κπνξνχκε λα έρνπκε κηα λέα ζπλάξηεζε κε ηηο επηινγέο πνπ επηζπκεί ν ρξήζηεο. Γηα παξάδεηγκα, κπνξνχκε λα ηξνπνπνηήζνπκε ηελ παξάκεηξν breaks κεηαβάιινληαο ηα φξηα ησλ θιάζεσλ ή λα πξνζζέζνπκε έλαλ ηίηιν γηα ην γξάθεκα, κε ην φξηζκα main="", γηα παξάδεηγκα main="πρώτη τροποποίηση στο ιστόγραμμα". Αληίζηνηρε ζπλάξηεζε γηα ην δηάγξακκα ζπρλνηήησλ ηνπ Παξαδείγκαηνο 1, είλαη ε plot.line.diagram. Σα αξρεία πνπ πεξηέρνπλ απηέο ηηο ζπλαξηήζεηο, θαζψο θαη απηέο πνπ δεκηνχξγεζαλ ην ξαβδφγξακκα θαη ην θπθιηθφ δηάγξακκα ηεο ππνελφηεηαο παξαηίζεληαη ζην Παξάξηεκα Α. 145

154 ε πνιιέο ζπλαξηήζεηο ηνπ Παξαξηήκαηνο Α (π.ρ. plot.line.diagram) ρξεζηκνπνηείηαη ε εληνιή plot, ε νπνία είλαη κηα απφ ηηο ζεκαληηθφηεξεο εληνιέο γηα ηε δεκηνπξγία γξαθηθψλ παξαζηάζεσλ. Ζ εληνιή plot παξνπζηάζηεθε ζπλνπηηθά ζηελ ελφηεηα 3.4. Παξφια απηά, ιφγσ ηεο ζπνπδαηφηεηάο ηεο, ζα παξνπζηάζνπκε εθηελέζηεξα ηηο δπλαηέο επηινγέο νξηζκέλσλ παξακέηξσλ ηεο, κε ηε βνήζεηα ελφο δηαδξαζηηθνχ πξνγξάκκαηνο επίδεημεο (demo) ησλ δπλαηνηήησλ ηεο. Θα ρξεηαζηνχκε ην παθέην manipulate πνπ είλαη δηαζέζηκν κφλν αλ ην θαιέζνπκε κε ην RStudio. Με ην παθέην απηφ κπνξνχκε λα δεκηνπξγήζνπκε δηαδξαζηηθά γξαθήκαηα, φπσο απηφ πνπ θαίλεηαη ζην ρήκα 27, πνπ αθνινπζεί: ρήκα 27. Γηαδξαζηηθή επίδεημε ησλ δπλαηνηήησλ ηεο εληνιήο plot. ην γξάθεκα αλαπαξίζηαηαη, κε ηε βνήζεηα ηεο εληνιήο plot, έλα ζχλνιν δεδνκέλσλ κε παξακεηξνπνηεκέλεο νξηζκέλεο ζεκαληηθέο επηινγέο ηεο εληνιήο. Σν γξάθεκα ηξνπνπνηείηαη δπλακηθά θαζψο κεηαβάιινληαη νη παξάκεηξνη ζην πιαίζην κε ηίηιν Manipulate, ζηα αξηζηεξά ηνπ γξαθήκαηνο. πγθεθξηκέλα, νη δχν πξψηεο παξάκεηξνη κε ηίηινπο «ειάρηζηε» θαη «κέγηζηε ηηκή νξηδφληηνπ άμνλα» δεκηνπξγεζήθαλ κε ην φξηζκα slider ηεο εληνιήο manipulate (ηνπ νκψλπκνπ 146

155 παθέηνπ) θαη θαζνξίδνπλ ηα φξηα ηνπ νξηδφληηνπ άμνλα, κέζσ δεηθηψλ πνπ κεηαηνπίδνληαη κεηαμχ νξηζκέλσλ ηηκψλ. Οη επφκελεο πέληε παξάκεηξνη, δεκηνπξγήζεθαλ κε ην φξηζκα picker θαη αθνξνχλ ηνλ ηχπν ηνπ γξαθήκαηνο, ηνλ ηχπν ηεο γξακκήο, ην πάρνο ηεο γξακκήο, ην ρξψκα ηεο γξακκήο θαη ηε γξακκαηνζεηξά. Σν φξηζκα picker παξάγεη έλα κελνχ κε ζπγθεθξηκέλα ζηνηρεία απφ ηα νπνία επηιέγνπκε κφλν έλα θάζε θνξά. Μεηά ηνλ ηίηιν ηεο θάζε παξακέηξνπ αθνινπζεί ην φλνκα ηνπ νξίζκαηνο ζηε γιψζζα ηεο R. Γηα παξάδεηγκα, ν ηίηινο γηα ην ρξψκα ηεο γξακκήο ηζνχηαη κε col πνπ είλαη ην φξηζκα ζηε γιψζζα ηεο R θαη έρεη πέληε δηαθνξεηηθέο επηινγέο: black, blue, red, yellow θαη purple. Απηφ καο δίλεη ηε δπλαηφηεηα λα αληηιεθζνχκε ηε ζχληαμε ηεο εληνιήο ζηελ θνλζφια ηεο R. Σέινο, κε ην φξηζκα checkbox δίλνπκε ηε δπλαηφηεηα λα πξνζζέηνπκε ή λα αθαηξνχκε ηνλ νξηδφληην θαη θαηαθφξπθν άμνλα. Γηα παξάδεηγκα, ε εληνιή plot ηεο R γηα ην γξάθεκα ηνπ ρήκαηνο 27, είλαη plot(cars, xlim = c(0, 25), type = "b", lty="solid", lwd=2, col="red", axes = TRUE, xlab="οριζόντιος άξονας", ylab="κατακόρυφος άξονας", main="διαδραστική εφαρμογή επίδειξης της εντολής plot", family="mono") Αλ ην πιαίζην κε ηίηιν Manipulate δελ εκθαληζηεί ζην αξρηθφ ζηηγκηφηππν ηεο εθαξκνγήο ηφηε ν ρξήζηεο πξέπεη λα παηήζεη κε ην πνληίθη ζην πάλσ αξηζηεξά ηκήκα ηνπ γξαθήκαηνο, φπνπ ππάξρεη ην εηθνλίδην ή λα παηήζεη ην ζπλδπαζκφ πιήθηξσλ Ctrl+Shift+M. Σν ζπγθεθξηκέλν δηαδξαζηηθφ γξάθεκα είλαη ην απνηέιεζκα ηεο ζπλάξηεζεο demo.graphics, ε νπνία παξαηίζεηαη ζην Παξάξηεκα Α. Δπίζεο, ν θψδηθαο φισλ ησλ ζπλαξηήζεσλ απηήο ηεο ππνελφηεηαο καδί κε ηα ζπλνδεπηηθά θείκελα είλαη αλαξηεκέλα ζηε ηζηνζειίδα ΔΓΤ γηα ηηο θαηαλνκέο πηζαλόηεηαο Σν ΔΓΤ απηήο ηεο ππνελφηεηαο πεξηιακβάλεη κία πξνζνκνίσζε ηεο θακπχιεο 147

156 ζπρλνηήησλ θαη κηα δηαδξαζηηθή εθαξκνγή γηα ηνλ ππνινγηζκφ ησλ πηζαλνηήησλ ηεο θαλνληθήο θαηαλνκήο. Ζ έλλνηα ηεο θακπχιεο ζπρλνηήησλ αλαπηχρζεθε ζηελ ελφηεηα 4.4 κε ηε βνήζεηα δηαδνρηθψλ ζρεκάησλ κε δηαθνξεηηθφ πιήζνο θιάζεσλ ηνπ ηζηνγξάκκαηνο ζπρλνηήησλ γηα ην ίδην δείγκα. Με ηελ πξνζνκνίσζε πνπ ζα παξνπζηάζνπκε έρνπκε ηε δπλαηφηεηα ηεο δεκηνπξγίαο ηζηνγξάκκαηνο ζπρλνηήησλ κε κεηαβαιιφκελν αξηζκφ θιάζεσλ ζηηο νπνίεο εκθαλίδεηαη ην πιήζνο ησλ ζηνηρείσλ ηνπο, ηνπ αληίζηνηρνπ πνιπγψλνπ ζπρλνηήησλ θαη ηεο θακπχιεο ηεο θαλνληθήο θαηαλνκήο πνπ κπνξεί λα πξνζαξκνζηεί ζηα δεδνκέλα καο. ε θάζε επαλάιεςε ηεο πξνζνκνίσζεο έλα δηαθνξεηηθφ δείγκα επηιέγεηαη. Έρνπκε επηπιένλ ηε δπλαηφηεηα επηινγήο ηνπ κεγέζνπο ηνπ δείγκαηνο θαη ηεο 2 εηδηθήο θαηαλνκήο ηνπ πιεζπζκνχ απφ ηνλ νπνίν πξνέξρεηαη (θαλνληθή, t, ). Ζ ζπγθεθξηκέλε πξνζνκνίσζε επηηξέπεη ηελ θαηαλφεζε ηεο έλλνηαο ηεο θακπχιεο ζπρλνηήησλ κε έλα δπλακηθφ ζρήκα ζην νπνίν νη πνιιαπιέο αλαπαξαζηάζεηο ηνπ πνιπγψλνπ ζπρλνηήησλ καο νδεγνχλ ζηαδηαθά ζηελ θακπχιε ζπρλνηήησλ. Ζ κεηάβαζε απηή πιενλεθηεί ζε ζρέζε κε ηα ζηαηηθά ζρήκαηα (φπσο απηά ηεο ελφηεηαο 4.4) θαη πνιχ πεξηζζφηεξν κε ην ζπκβαηηθφ ηξφπν δηδαζθαιίαο πνπ βαζίδεηαη ζην ραξηί ή ζηνλ πίλαθα ηεο αίζνπζα δηδαζθαιίαο. Δπηπιένλ, ε ζπγθεθξηκέλε πξνζνκνίσζε είλαη ρξήζηκε δηφηη βνεζάεη ην ρξήζηε λα εμαζθεζεί ζηνλ νπηηθφ έιεγρν ηεο ππφζεζεο φηη ηα δεδνκέλα καο πξνέξρνληαη απφ έλαλ πιεζπζκφ πνπ αθνινπζεί ηελ θαλνληθή θαηαλνκή κε κέζε ηηκή θαη δηαθχκαλζε 2. Ζ ππφζεζε απηή παξνπζηάδεηαη πνιχ ζπρλά ζηε ζηαηηζηηθή, φπσο γηα παξάδεηγκα ζηνπο ειέγρνπο ππνζέζεσλ. Ζ πξνζνκνίσζε πινπνηείηαη κέζσ ηεο ζπλάξηεζεο simulation.freqcurve.normal, ε νπνία δέρεηαη σο νξίζκαηα: ην δηάλπζκα δεδνκέλσλ data κε πξνθαζνξηζκέλε ηηκή rnorm(500, mean=8, sd=1). Γειαδή, ηα δεδνκέλα καο απνηεινχληαη απφ 500 ηπραίνπο αξηζκνχο πνπ πξνέξρνληαη απφ ηελ θαλνληθή θαηαλνκή κε κέζε ηηκή 8 θαη ηππηθή απφθιηζε 1. Ο ρξήζηεο έρεη ηε δπλαηφηεηα λα επηιέμεη δηαθνξεηηθή κέζε ηηκή ή ηππηθή απφθιηζε γηα ηελ θαλνληθή θαηαλνκή ή αθφκα θαη νπνηαδήπνηε άιιε εηδηθή θαηαλνκή. 148

157 ην n πνπ αληηζηνηρεί ζην πιήζνο ησλ θιάζεσλ, κε πξνθαζνξηζκέλε ηηκή 5. Σν n κεηαβάιιεηαη κε ηε βνήζεηα ελφο δξνκέα, δειαδή κηαο νξηδφληηαο γξακκήο θχιηζεο ε ηηκή ηεο νπνίαο αληηζηνηρεί ζην πιήζνο ησλ θιάζεσλ. Καζψο ν δξνκέαο παίξλεη ηηκέο απφ 2 έσο 50, ηαπηφρξνλα κεηαβάιινληαη φια ηα ζηνηρεία ηνπ γξαθήκαηνο, δειαδή ην ηζηφγξακκα θαη ην αληίζηνηρν πνιχγσλν ζπρλνηήησλ. ηελ εηηθέηα ηνπ νξηδφληηνπ άμνλα x.lab, κε πξνθαζνξηζκέλε ηηκή ="ώρες εξωσχολικών δραστηριοτήτων". ην άλσ φξην ηνπ θαηαθφξπθνπ άμνλα y.lim.max, κε πξνθαζνξηζκέλε ηηκή ρήκα 28. Πξνζνκνίσζε κε 500 ηπραίνπο αξηζκνχο πνπ πξνέξρνληαη απφ ηελ Καλνληθή θαηαλνκή κε κέζε ηηκή 8 θαη ηππηθή απνθιηζε 1. Σν ηζηφγξακκα ζρεκαηίδεηαη κε 5 θιάζεηο (επάλσ) θαη 15 θιάζεηο (θάησ). 149

158 Οη πξνθαζνξηζκέλεο ηηκέο ηεο ζπλάξηεζεο πξνέξρνληαη ζε γεληθέο γξακκέο απφ ην Παξάδεηγκα 12, πνπ αθνξνχζε ηηο εμσζρνιηθέο δξαζηεξηφηεηεο ησλ καζεηψλ. Ζ ζπλάξηεζε θαιείηαη κε ηελ εληνιή: > simulation.freqcurve.normal (data=rnorm(500, mean=8, sd=1), + x.lab="ώπερ εξωςχολικών δπαςσηπιοσήσων", + y.lim.max=0.55) ή > simulation.freqcurve.normal() ηε δεχηεξε πεξίπησζε ε R δέρεηαη γηα ηα νξίζκαηα ηεο εληνιήο ηηο πξνθαζνξηζκέλεο ηηκέο, επνκέλσο νη δχν παξαπάλσ εληνιέο παξάγνπλ ην ίδην απνηέιεζκα, πνπ απεηθνλίδεηαη ζε δχν δηαθνξεηηθά ζηηγκηφηππα (κε πιήζνο θιάζεσλ 5 θαη 15) ζην ρήκα 28. Παξαηεξνχκε φηη ε πξνζαξκνγή ησλ δεδνκέλσλ ζηελ θαλνληθή θαηαλνκή είλαη ηθαλνπνηεηηθή δηφηη δελ είλαη ζεκαληηθή ε απφθιηζε ηνπ πνιπγψλνπ ζπρλνηήησλ απφ ηελ θακπχιε ηεο θαλνληθήο θαηαλνκήο. Γηα λα εθηειεζηεί ε ζπλάξηεζε simulation.freqcurve.normal είλαη απαξαίηεην λα ελεξγνπνηεζνχλ ηα παθέηα RGtk2 (Lawrence & Lang, 2012) θαη cairodevice (Lawrence, 2011). Αληίζεηα φηαλ ην δείγκα απνηειείηαη απφ 500 ηπραίνπο αξηζκνχο πνπ 2 πξνέξρνληαη απφ ηελ θαηαλνκή κε 3 βαζκνχο ειεπζεξίαο, ηφηε ε απφθιηζε απφ ηελ θαλνληθή θαηαλνκή είλαη ζεκαληηθή, φπσο είλαη αλακελφκελν. Σν πνιχγσλν ζπρλνηήησλ δελ είλαη ζπκκεηξηθφ θαη ε πξνζαξκνγή ηεο θαλνληθήο θαηαλνκήο είλαη ηθαλνπνηεηηθή κφλν ζε έλα κηθξφ κέξνο ησλ δεδνκέλσλ. Σα δχν ζηηγκηφηππα ηεο πξνζνκνίσζεο πξνθχπηνπλ γηα 20 θαη 40 θιάζεηο ηνπ ηζηνγξάκκαηνο ζπρλνηήησλ, αλαπαξηζηψληαη ζην ρήκα 29. Οη ζρεηηθέο εληνιέο είλαη: > simulation.freqcurve.normal (data=rchisq(500, df=3), + x.lab="ώπερ εξωςχολικών δπαςσηπιοσήσων", + y.lim.max=0.3) Ζ ζπλάξηεζε prob.normal είλαη κηα δηαδξαζηηθή εθαξκνγή γηα ηνλ ππνινγηζκφ πηζαλνηήησλ φηαλ ε κεηαβιεηή καο, έζησ X, αθνινπζεί θαλνληθή θαηαλνκή. Ζ εθαξκνγή πινπνηείηαη κφλν ζην RStudio δηφηη ρξεζηκνπνηεί ην παθέην manipulate. Δπίζεο, βαζίδεηαη ζηελ εληνιή xpnorm ηνπ παθέηνπ mosaic (Pruim, Kaplan & Horton, 150

159 ρήκα 29. Πξνζνκνίσζε κε 500 ηπραίνπο αξηζκνχο απφ ηελ Καλνληθή θαηαλνκή κε κέζε ηηκή 8 θαη ηππηθή απνθιηζε 1, κε 5 θιάζεηο (επάλσ) θαη 15 θιάζεηο (θάησ) 2012). πγθεθξηκέλα, ε εληνιή > prob.normal(mean=0, sd=1) επηηξέπεη ηνλ ππνινγηζκφ πηζαλνηήησλ ζηελ θαλνληθή θαηαλνκή κε κέζε ηηκή κεδέλ θαη ηππηθή απφθιηζε έλα. ην πξψην ζηηγκηφηππν ηεο εθαξκνγήο ππνινγίδνληαη νη πηζαλφηεηεο ε κεηαβιεηή X λα είλαη κηθξφηεξε ή ίζε κε ην 3 θαη λα είλαη κεγαιχηεξε απφ ην 3, κε ηηκέο θαη 151

160 αληίζηνηρα. ηελ θνλζφια ηνπ RStudio εκθαλίδνληαη νη ζρεηηθέο καζεκαηηθέο δηαηππψζεηο If X ~ N(0,1), then P(X <= -3) = P(Z <= -3) = P(X > -3) = P(Z > -3) = ελψ ζην γξάθεκα νη ίδηεο πηζαλφηεηεο αλαπαξηζηψληαη κε ηε βνήζεηα εκβαδψλ. Ζ κεηαβιεηή Z είλαη ε ιεγφκελε ηππνπνηεκέλε κεηαβιεηή ηεο X, ε νπνία πξνθχπηεη απφ ηε X αλ αθαηξέζνπκε ηε κέζε ηηκή θαη δηαηξέζνπκε κε ηελ ηππηθή απφθιηζε. ηε ζπγθεθξηκέλε πεξίπησζε δελ πξνθαιείηαη θακηά κεηαβνιή ζηε X δηφηη X X 0 Z X. 1 πσο ζα δνχκε παξαθάησ ε Z είλαη δηαθνξεηηθή απφ ηε X φηαλ ε κέζε ηηκή δελ είλαη κεδέλ ή ε ηππηθή απφθιηζε δελ είλαη έλα. Ζ ρξεζηκφηεηα ηεο ηππνπνηεκέλεο κεηαβιεηήο Z έρεη λα θάλεη κε ηελ επνρή ζηελ νπνία νη ππνινγηζκνί ησλ πηζαλνηήησλ δελ γηλφηαλ κε ηνπο ππνινγηζηέο αιιά κε πίλαθεο αξηζκψλ πνπ αλαθέξνληαλ ζηε Z, νπφηε ν κεηαζρεκαηηζκφο ηεο X ήηαλ απαξαίηεηνο. Ο ρξήζηεο κπνξεί λα ππνινγίζεη αληίζηνηρεο πηζαλφηεηεο γηα ηηκέο ηεο κεηαβιεηήο X νη νπνίεο θπκαίλνληαη απφ ην 3 κέρξη θαη ην 3 κεηαθηλψληαο ην δείθηε κε ηίηιν «ηηκή ηεο κεηαβιεηήο:». Αλ ν δείθηεο δελ εκθαληζηεί ζην αξρηθφ ζηηγκηφηππν ηεο εθαξκνγήο ηφηε ν ρξήζηεο πξέπεη λα παηήζεη κε ην πνληίθη ζην πάλσ αξηζηεξά ηκήκα ηνπ γξαθήκαηνο, φπνπ ππάξρεη ην εηθνλίδην ή λα παηήζεη ην ζπλδπαζκφ πιήθηξσλ Ctrl+Shift+M. Έλα ζηηγκηφηππν ηεο εθαξκνγήο γηα X=1.6 θαίλεηαη ζην ρήκα 30. Ζ εθαξκνγή ππνινγίδεη πηζαλφηεηεο γηα ηελ θαλνληθή θαηαλνκή κε νπνηαδήπνηε κέζε ηηκή θαη ηππηθή απφθιηζε. Γηα παξάδεηγκα, γηα ηελ θαλνληθή θαηαλνκή κε κέζε ηηκή 100 θαη ηππηθή απφθιηζε 15 έρνπκε: > prob.normal(mean=100, sd=15) If X ~ N(100,15), then P(X <= 55) = P(Z <= -3) = P(X > 55) = P(Z > -3) =

161 ε απηή ηελ πεξίπησζε ε πηζαλφηεηα Pr X 55 κεηαζρεκαηίδεηαη σο εμήο: X Pr 55 Pr Pr Pr X X Z. ρήκα 30. Γηαδξαζηηθή εθαξκνγή γηα ηνλ ππνινγηζκφ πηζαλνηήησλ φηαλ ν πιεζπζκφο καο αθνινπζεί Καλνληθή θαηαλνκή ΔΓΤ γηα ηνπο ειέγρνπο ππνζέζεσλ Γηα ηνπο ειέγρνπο ππνζέζεσ&lambda