Εργασία στο µάθηµα Ανάλυση εδοµένων

Σχετικά έγγραφα
E mail:

Εργασία στο µάθηµα Ανάλυση εδοµένων

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Διάστημα εμπιστοσύνης της μέσης τιμής

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Εργαστήριο Οικονομετρίας Προαιρετική Εργασία 2016 Χειμερινό Εξάμηνο

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Παράλληλη Επεξεργασία Εργαστηριακή Ασκηση Εαρινού Εξαµήνου 2008


Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Πολλαπλή παλινδρόμηση (Multivariate regression)

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΟΝΟΜΑΤΕΠΩΝΥΜΟ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

Είδη Μεταβλητών. κλίµακα µέτρησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Μάθημα: ΥΔΡΟΓΕΩΠΛΗΡΟΦΟΡΙΚΗ

ΠΑΡΑΡΤΗΜΑ. Πίνακας 9. Ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

Κασταλία Σύστηµα στοχαστικής προσοµοίωσης υδρολογικών µεταβλητών

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Ανάλυση Χρονοσειρών. Κεφάλαιο Ανάλυση Χρονοσειρών

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΑΣΚΗΣΕΙΣ ΜΕΡΟΣ ΙΙ - ΟΙΚΟΝΟΜΕΤΡΙΑ Ι Ι ΑΣΚΩΝ : ΤΣΕΡΚΕΖΟΣ ΙΚΑΙΟΣ ΑΣΚΗΣΗ 1. Ν'αποδειχθεί η σχέση : σ 2 =Ε(Χ 2 )-µ 2 ΑΣΚΗΣΗ 2

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

Περίπου ίση µε την ελάχιστη τιµή του δείγµατος.

3η Ενότητα Προβλέψεις

Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Λογιστική Παλινδρόµηση

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Τυπικές και εξειδικευµένες υδρολογικές αναλύσεις

9. Παλινδρόμηση και Συσχέτιση

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

Μάστερ στην Εφαρµοσµένη Στατιστική

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αναλυτική Στατιστική

Εισόδημα Κατανάλωση

Παρουσίαση Νο. 5 Βελτίωση εικόνας

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Τυπικές και εξειδικευµένες υδρολογικές αναλύσεις

Γραμμικά Μοντέλα. Βιολέττα Ε. Πιπερίγκου. Τμήμα Μαθηματικών Πανεπιστήμιο Πατρών. h p://

Μάθημα 2: Mη-στάσιμη χρονοσειρά, έλεγχος μοναδιαίας ρίζας και έλεγχος ανεξαρτησίας

3. Κατανομές πιθανότητας

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΞΕΤΑΣΕΙΣ ΠΕΡΙΟ ΟΥ ΣΕΠΤΕΜΒΡΙΟΥ 2000

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Χρονικές σειρές 3 Ο μάθημα: Βασικές στοχαστικές διαδικασίες Μη στάσιμες χρονοσειρές Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Kruskal-Wallis H

Διαχείριση Υδατικών Πόρων

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχετίσεις Χρονοσειρών Οδικών Ατυχηµάτων και Μετεωρολογικών Συνθηκών

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

Συμπίεση Πληροφορίας Πλαισίου με Ανάλυση Κύριων Συνιστωσών

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

Στατιστική Επιχειρήσεων Ι

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Transcript:

Μεταπτυχιακό Υπολογιστικής Φυσικής Εργασία στο µάθηµα Ανάλυση εδοµένων ηµήτρης Κουγιουµτζής E-mail: dkugiu@gen.auth.gr 31 Ιανουαρίου 2017 Οδηγίες : Σχετικά µε την παράδοση της εργασίας ϑα πρέπει : Το κείµενο της αναφοράς της ανάλυσης που Ϲητείται να είναι γραµµένο σε κάποιο πρόγραµµα επεξεργασίας κειµένου (π.χ. Word, LaTeX). Τα προγράµµατα που χρησιµοποιήθηκαν, καθώς και τα γραφήµατα και οι πίνακες, να παρουσιάζονται στο σηµείο του κειµένου που ανα- ϕέρονται. Επίσης τα προγράµµατα ϑα πρέπει να παραδοθούν µαζί µε την εργασία. Η εργασία και τα προγράµµατα ϑα πρέπει να αποσταλούν στο διδάσκοντα µε το ηλεκτρονικό ταχυδροµείο (e-mail: dkugiu@gen.auth.gr) τουλάχιστον µια µέρα πριν την εξέταση στο µάθηµα, καλύτερα σε ένα συµπιεσµένο αρχείο. Για την απάντηση στα Ϲητήµατα της εργασίας ϑα χρειαστεί να αναπτύξετε κάποιους αλγόριθµους (σε µορφή συνάρτησης), ενώ άλλοι αλγόριθµοι δίνονται (κάποιοι σε µορφή συνάρτησης Matlab) στην ιστοσελίδα του µαθήµατος (στα πλαίσια των ασκήσεων στο µάθηµα). Επίσης ϑα πρέπει να κάνετε και τα κατάλληλα προγράµµατα που καλούν τις συναρτήσεις, τα οποία και πρέπει να αντιγράψετε στην εργασία. Για τη µεταφορά σχήµατος από το Matlab στο πρόγραµµα επεξεργασίας κειµένου ϑα πρέπει να αποθηκεύσετε το σχήµα σε αρχείο χρησιµοποιώντας είτε το παράθυρο εντολών (δες εντολή print του Matlab) ή το µενού στο πα- ϱάθυρο του σχήµατος (File Export). Για µεταφορά στο Word υπάρχουν 1

διάφορες κατάλληλες µορφές αρχείου εικόνας, η πιο απλή είναι "Enhanced Metafile" (*.emf). Για µεταφορά στο LaTeX η πιο κατάλληλη µορφή είναι "Encapsulated Postscript" (*.eps). Περιγραφή εργασίας και δεδοµένα Στο αρχείο WindWeather.txt που υπάρχει στην ιστοσελίδα του µαθήµατος, δίνονται τα δεδοµένα δεικτών για τον καιρό και τον άνεµο στην περιοχή Wilson s Promontory, Victoria (το νοτιότερο σηµείο της ηπειρωτικής Αυστραλίας) για το έτος 1989 σε χρονικά διαστήµατα 3 ωρών (κάθε µέρα έγιναν 7 παρατηρήσεις µε 3 ώρες διαφορά). Υπάρχει ένα διάστηµα 6 ωρών από την τελευταία παρατήρηση στις 20:00 της µιας ηµέρας στις 2:00 της επόµενης µέρας. Η πρώτη γραµµή του πίνακα του αρχείου έχει τα ονόµατα των δεικτών σε κάθε στήλη δεδοµένων και δίνονται στον παρακάτω πίνακα (ϑα πρέπει να την αφαίρεσετε αν ϑα εισάγετε τα δεδοµένα στο Matlab µε την εντολή load). Για κάθε δείκτη έγιναν συνολικά N = 2555 µετρήσεις. Α/Α Ονοµα Περιγραφή 1 Year 89 2 Month 01-12 3 Day ηµέρα του µήνα 4 Hour ώρα της ηµέρας 5 Pressure πίεση ϐαροµέτρου 6 WetTemp ϑερµοκρασία υγρού ϐολβού 7 DryTemp ϑερµοκρασία ξηρού ϐολβού 8 Humidity σχετική υγρασία σε ποσοστά 9 Direction διεύθυνση ανέµου σε κλίµακα 0-16, (ϐόρεια είναι 16 ή 1) 10 Speed ταχύτητα ανέµου σε κόµβους 11 Rainfall ϐροχόπτωση σε mm από την τελευταία µέτρηση Ζητήµατα εργασίας 1. Φτιάξε µια συνάρτηση που να κάνει τα παρακάτω : (αʹ) (ϐʹ) να επιλέγει τυχαία n παρατηρήσεις από το σύνολο των N παρατη- ϱήσεων (όπου N = 2555 και οι παρατηρήσεις είναι από κάποιον από τους δείκτες) και να υπολογίζει την εµπειρική συνάρτηση πυκνότητας πιθανότητας (σππ) µε τη µέθοδο του ιστογράµµατος για κατάλληλη ισοµερή διαµέριση. 2

Φτιάξε ένα πρόγραµµα που για κάποιον από τους δείκτες να καλεί αυτή τη συνάρτηση M = 50 ϕορές για n = 100 και στη συνέχεια να σχηµατίζει M καµπύλες για τα M ιστογράµµατα σε ένα σχήµα. Επιπλέον στο ίδιο σχήµα να σχηµατίζει επίσης και την εµπειρική σππ από όλα τα N = 2555 δεδοµένα για το δείκτη (µε άλλο χρώµα ή µορφή καµπύλης για να ξεχωρίζει). Εφάρµοσε αυτή τη διαδικασία για τους δείκτες Pressure, WetTemp και Humidity. Σχολίασε κατά πόσο οι σππ από τα M δείγµατα των 100 πα- ϱατηρήσεων συµφωνούν µε την σππ από το σύνολο των παρατηρήσεων. Φαίνεται η σππ για τον κάθε ένα από τους τρεις δείκτες να προσεγγίζει κάποια γνωστή κατανοµή ; 2. Φτιάξε µια συνάρτηση που να κάνει τα παρακάτω : (αʹ) (ϐʹ) να επιλέγει τυχαία n παρατηρήσεις από το σύνολο των N παρατη- ϱήσεων (όπου N = 2555 και οι παρατηρήσεις είναι από κάποιον από τους δείκτες) και να κάνει έλεγχο X 2 καλής προσαρµογής σε κανονική κατανοµή. Η συνάρτηση ϑα πρέπει να δίνει στην έξοδο την p-τιµή του ελέγχου. Φτιάξε ένα πρόγραµµα που για κάποιον από τους δείκτες να καλεί αυτή τη συνάρτηση M = 100 ϕορές για n = 10, 20, 40, 80, 160 και να µετρά το ποσοστό που η υπόθεση της κανονικής κατανοµής µπορεί να γίνει αποδεκτή για κάθε µέγεθος δείγµατος n. Εφάρµοσε αυτή τη διαδικασία για τους δείκτες Pressure, WetTemp και Humidity. Σχολίασε αν η απόφαση για κανονική κατανοµή του κάθε δείκτη εξαρτάται από το µέγεθος του δείγµατος n. 3. Επανέλαβε το ίδιο πρόγραµµα (και συνάρτηση) αλλά για να ελέγξεις αν η κατανοµή του δείγµατος (για κάθε n) είναι αυτή του µεγάλου δείγµατος των N = 2555 παρατηρήσεων. Εφάρµοσε αυτή τη διαδικασία για τους δείκτες Pressure, WetTemp και Humidity. Σχολίασε αν η κατανοµή του δείκτη µε ϐάση το δείγµα µπορεί να διαφέρει από αυτήν του µεγάλου δείγµατος των N = 2555 παρατηρήσεων. 4. Για κάποιο δείκτη, επέλεξε τυχαία M = 100 δείγµατα των n = 15 παρατηρήσεων το καθένα, και υπολόγισε µε ϐάση το κάθε δείγµα το 95% διάστηµα εµπιστοσύνης για τη µέση τιµή. Υπολόγισε επίσης τη µέση τιµή του δείκτη στο σύνολο των δεδοµένων. Σε τι ποσοστό τα M διαστήµατα εµπιστοσύνης της µέσης τιµής του δείκτη περιλαµβάνουν τη 3

µέση τιµή του δείκτη υπολογισµένη στο σύνολο των δεδοµένων ; Είναι το ποσοστό αυτό αναµενόµενο ; Εφάρµοσε αυτή τη διαδικασία στους δείκτες Pressure, WetTemp και Direction. 5. Με ϐάση τα M δείγµατα στο Ερώτηµα 4 για τους δείκτες WetTemp και Humidity υπολόγισε M παραµετρικά 95% διαστήµατα εµπιστοσύνης για το συντελεστή συσχέτισης µεταξύ αυτών των δεικτών κάνοντας χρήση του µετασχηµατισµού Fisher. Υπολόγισε επίσης τον ίδιο συντελεστή συσχέτισης στο σύνολο των δεδοµένων. Σε τι ποσοστό τα M διαστήµατα εµπιστοσύνης του συντελεστή συσχέτισης περιλαµβάνουν το συντελεστή συσχέτισης υπολογισµένο στο σύνολο των δεδοµένων ; Είναι το ποσοστό αυτό αναµενόµενο ; 6. Κάνε παραµετρικό έλεγχο της υπόθεσης σε επίπεδο σηµαντικότητας 5% για µηδενική συσχέτιση των δεικτών Pressure και WetTemp, χρησιµοποιώντας το στατιστικό της κατανοµής Student σε κάθε ένα από τα M δείγµατα στο Ερώτηµα 4 καθώς και στο σύνολο των δεδοµένων. Συµ- ϕωνεί η απόφαση ελέγχου στο σύνολο των δεδοµένων µε τις αποφάσεις στα M δείγµατα των 20 παρατηρήσεων ; 7. Επέλεξε τυχαία 60 από τις N = 2555 καταγραφές. Σε αυτό το δείγµα, υπολόγισε µοντέλο πολυωνυµικής παλινδρόµησης για κατάλληλο ϐαθ- µό πολυωνύµου που να αποδίδει καλύτερα την εξάρτηση της υγρασίας (δείκτης Humidity) από τη ϑερµοκρασία (δείκτης WetTemp). Για την επιλογή του κατάλληλου πολυωνυµικού µοντέλου παλινδρόµησης κάνε διαγνωστικό έλεγχο µε το διάγραµµα διασποράς των τυποποιηµένων υ- πολοίπων για κάθε µοντέλο που δοκιµάζεις (πρώτου ϐαθµού, δευτέρου ϐαθµού κτλ) και υπολόγισε το συντελεστή προσδιορισµού καθώς και τον προσαρµοσµένο συντελεστή προσδιορισµού. Εφάρµοσε τη διαδικασία προσαρµογής πολυωνυµικού µοντέλου και στο σύνολο των n = 2555 δεδοµένων. ιαφέρουν τα δύο µοντέλα που κατέληξες ; Φαίνεται κάποιο από τα δύο µοντέλα να είναι πιο ακριβές ; 8. Για κάθε ένα από τα δύο σύνολα δεδοµένων στο Ερώτηµα 7 (των 60 και των 2555 παρατηρήσεων), διερεύνησε το κατάλληλο µοντέλο πολλαπλής γραµµικής παλινδρόµησης για την ταχύτητα του ανέµου (δείκτης Speed). οκίµασε το µοντέλο µε τις υπόλοιπες 6 ανεξάρτητες µετα- ϐλητές και σύγκρινε το µε το µοντέλο που δίνει κάποια µέθοδος ϐη- µατικής παλινδρόµησης. Υπολόγισε για το κάθε µοντέλο τη διασπορά των σφαλµάτων και το συντελεστή προσδιορισµού καθώς και τον προσαρµοσµένο συντελεστή προσδιορισµού. Είναι τα δύο µοντέλα από τη 4

ϐηµατική παλινδρόµηση ίδια για τα δύο δείγµατα (για τις 60 και 2555 παρατηρήσεις); 9. Σε συνέχεια της διερεύνησης µοντέλου ϐηµατικής παλινδρόµησης στο Ερώτηµα 8, πρόσθεσε στις 6 ανεξάρτητες µεταβλητές και άλλες 18 µεταβλητές ως εξής. Για κάθε µια από τις 6 µεταβλητές, δηµιούργησε 3 νέα δείγµατα µε τυχαία αντιµετάθεση του αρχικού δείγµατος. Οι 18 νέες µεταβλητές είναι ϕυσικά ασυσχέτιστες µε την εξαρτηµένη µεταβλητή (ταχύτητα του ανέµου (δείκτης Speed)). Θα πρέπει να ϕτιάξεις µια συνάρτηση που δηµιουργεί τα 18 νέα δείγ- µατα και υπολογίζει το µοντέλο παλινδρόµησης για την ταχύτητα του ανέµου µε ϐάση τις 24 ανεξάρτητες µεταβλητές (τις 6 ϕυσικές και τις 18 τεχνητές) µε τη µέθοδο ϐηµατικής παλινδρόµησης. Η συνάρτηση ϑα δίνει στην έξοδο τις ανεξάρτητες µεταβλητές (δηλαδή τους αντίστοιχους δείκτες από 1 ως 24) που έχουν επιλεγεί στο µοντέλο παλινδρόµησης. Θα ϕτιάξεις ένα πρόγραµµα που ϑα καλεί την παραπάνω συνάρτηση 100 ϕορές για δείγµατα των 30 παρατηρήσεων από τους 7 δείκτες και ϑα µετράει το ποσοστό εµφάνισης κάθε µιας από τις 24 µεταβλητές στο µοντέλο. Παρουσιάζονται στο µοντέλο ασυσχέτιστες µεταβλητές (οι 18 τεχνητές µεταβλητές) και σε τι ποσοστό ; 10. Για το δείκτη WetTemp διώξε την τάση χρησιµοποιώντας κατάλληλη πολυωνυµική συνάρτηση του χρόνου. Στη χρονοσειρά απαλλαγµένη από την τάση υπολόγισε και σχηµάτισε τη συνάρτηση αυτοσυσχέτισης. Φαίνεται να υπάρχει κάποια περιοδικότητα ; Σε αυτήν την περίπτωση εντόπισε την περίοδο και αφού εκτιµήσεις κατάλληλη περιοδική συνάρτηση αφαίρεσε την από τη χρονοσειρά. Υπολόγισε και πάλι τη συνάρτηση αυτοσυσχέτισης. Φαίνεται η χρονοσειρά των υπολοίπων να είναι λευκός ϑόρυβος ; 5