Εργαστήριο Ανώτερης Γεωδαισίας Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗΣ «Αναλυτικές Μέθοδοι στη Γεωπληροφορική» (Ακαδ. Έτος )

Σχετικά έγγραφα
Εργαστήριο Ανώτερης Γεωδαισίας Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗΣ «Αναλυτικές Μέθοδοι στη Γεωπληροφορική» (Ακαδ. Έτος )

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

στατιστική θεωρεία της δειγµατοληψίας

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

Είδη Μεταβλητών. κλίµακα µέτρησης

ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ

Γ. Πειραματισμός - Βιομετρία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΛΥΣΕΙΣ AΣΚΗΣΕΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

Εργαστήριο Ανώτερης Γεωδαισίας Μάθηµα 7ου Εξαµήνου (Ακαδ. Έτος ) «Εισαγωγή στο Γήινο Πεδίο Βαρύτητας» ΕΞΑΜΗΝΟ ΑΣΚΗΣΗ 2

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΠΡΟΣΑΡΤΗΜΑ IΙΙ (III-1.1) όπου x i η τιµή της µέτρησης i και Ν ο αριθµός των µετρήσεων.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΡΓΑΣΤΗΡΙΟ ΕΝΟΡΓΑΝΗΣ ΑΝΑΛΥΣΗΣ ΤΡΟΦΙΜΩΝ Οδηγός Συγγραφής Εργαστηριακών Αναφορών

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Ενδεικτικές ασκήσεις ΔΙΠ 50

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

Κεφάλαιο 5. Οι δείκτες διασποράς

ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

Εισόδημα Κατανάλωση

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Πα.Δα. Τμήμα Μηχανικών Πληροφορικής και Υπολογιστών ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΕΩΝ

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ Η ΣΥΝΟΡΘΩΣΗ ΤΩΝ ΟΡΙΖΟΝΤΙΩΝ ΔΙΚΤΥΩΝ (Η ΕΝΝΟΙΑ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΑΝΑΦΟΡΑΣ ΚΑΙ Η ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΠΟΙΟΤΗΤΑΣ ΤΟΥ ΔΙΚΤΥΟΥ)

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ Σφάλµατα και στατιστική επεξεργασία πειραµατικών µετρήσεων

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Βιοστατιστική ΒΙΟ-309

ΔΕΟ13 - Επαναληπτικές Εξετάσεις 2010 Λύσεις

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Πρακτική µε στοιχεία στατιστικής ανάλυσης

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Εργαστήριο Ανώτερης Γεωδαισίας Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗΣ «Αναλυτικές Μέθοδοι στη Γεωπληροφορική» (Ακαδ. Έτος )

Ανάλυση και Σχεδιασμός Μεταφορών Ι Δειγματοληψία - Μέθοδοι συλλογής στοιχείων

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Εργασία στο µάθηµα Ανάλυση εδοµένων

Στατιστική. Εκτιμητική

Βιοστατιστική ΒΙΟ-309

Στατιστική Εισαγωγικές Έννοιες

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Πειραματική Ρευστοδυναμική. Σφάλματα και Αβεβαιότητα Μετρήσεων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

AΣΚΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Στατιστική Συμπερασματολογία

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Χ. Εμμανουηλίδης, 1

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Βιοστατιστική ΒΙΟ-309

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

ΣΤΟΧΑΣΤΙΚΑ ΣΗΜΑΤΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ

Εργασία στο µάθηµα Ανάλυση εδοµένων

Στατιστική Συμπερασματολογία

Φίλτρα Kalman. Αναλυτικές μέθοδοι στη Γεωπληροφορική. ιατύπωση του βασικού προβλήματος. προβλήματος. μοντέλο. Πρωτεύων μοντέλο

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Τοπογραφικά Δίκτυα & Υπολογισμοί

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ για τη λήψη αποφάσεων

Θεματολογία. Δεδομένα και αβεβαιότητα. Αντικείμενο της Στατιστικής. Βασικές έννοιες. Δεδομένα και αβεβαιότητα. Στατιστική Ι

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Ανάλυση αξιοπιστίας δικτύων (μέρος ΙΙ)

Ζήτηµα 2. Κατεύθυνση µεταβολής γονιµότητας. Πειραµατικός Αγρός. Επεµβάσεις: Α1Β1:1, Α1Β2:2, Α1Β3:3, Α2Β1:4, Α2Β2:5 και Α2Β3:6

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Πιθανότητες - Κατανομές ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών

Transcript:

Εργαστήριο Ανώτερης Γεωδαισίας Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗΣ «Αναλυτικές Μέθοδοι στη Γεωπληροφορική» (Ακαδ. Έτος 2018-19) ΟΝΟΜΑΤΕΠΩΝΥΜΟ... ΕΞΑΜΗΝΟ... Ηµεροµηνία Παράδοσης : 29/1/2019 Αρχεία δεδοµένων που χρειάζονται για τους σκοπούς των συγκεκριµένων θεµατικών εργασιών και ζητείται να ανακτηθούν από τις ιστοσελίδες του µαθήµατος, θα βρίσκονται εντός του ντοσιέ δεδοµένων askdata, στο σύνδεσµο http://prtal.survey.ntua.gr/main/labs/hged/ddeli/analmge/askdata/, π.χ. ένα αρχείο testdata.txt θα µπορεί να ανακτηθεί απευθείας από το σύνδεσµο http://prtal.survey.ntua.gr/main/labs/hged/ddeli/analmge/askdata/testdata.txt. ΘΕΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ #5 & 6 Σκοπός: Η θεµατική εργασία #5 αποσκοπεί στην εξοικείωση σας µε βασικές κατανοµές πιθανότητας τυχαίων µεταβλητών, µε έµφαση στο πως µπορούµε να προσοµοιώνουµε κατάλληλα δεδοµένα στο R χρησιµοποιώντας γεννήτριες τυχαίων αριθµών διαφορετικών µεταβλητών που θέλουµε να ελέγξουµε. (α) Επιλέξτε, από τη σχετική ιστοσελίδα του µαθήµατος το αρχείο δεδοµένων faithful.csv µε τις παρατηρήσεις του θερµοπίδακα Old Faithful και χρησιµοποιήστε για τις µεταβλητές του, eruptins και waiting, τις παραπάνω συναρτήσεις που δίνουν διάφορα στατιστικά µέτρα θέσης και διακύµανσης. Επιπλέον υπολογίστε τη συµµεταβλητότητα και τον συντελεστή συσχέτισης µεταξύ των µεταβλητών eruptins και waiting και αποφανθείτε εάν υπάρχει γραµµική σχέση µεταξύ των εν λόγω µεταβλητών. Ακολούθως υπολογίστε την 3 η κεντρική ροπή των ίδιων µεταβλητών, χρησιµοποιώντας τις κατάλληλες συναρτήσεις από τα πακέτα mments ή e1071 του R, και περαιτέρω αποφανθείτε εάν υπάρχει λοξότητα και κύρτωση στα εν λόγω δεδοµένα. (b) Υπενθυµίζεται ότι ένα δείγµα δεδοµένων καλείται ποιοτικό, επίσης γνωστό ως κατηγορηµατικό, αν οι τιµές του ανήκουν σε µια συλλογή γνωστών καθορισµένων κατηγοριών που δεν αλληλεπικαλύπτονται. Στην ιστοσελίδα του µαθήµατος βρίσκεται το αρχείο NA_Brder_Crssings_Entry_Data.csv ή εναλλακτικά το ίδιο αρχείο NA_Brder_Crssings_Entry_Data.xls που και τα δύο περιέχουν δεδοµένα από µια συγκοινωνιακή µελέτη που Persnal Vehicle Passengers Persnal Vehicles Trucks Bus Passengers Buses Rail Cntainers Empty

αφορά τη διερχόµενη κίνηση µεταφορικών µέσων και ατόµων στους συνοριακούς σταθµούς των ΗΠΑ µε το Μεξικό και τον Καναδά. Ειδικότερα στην ποιοτική µεταβλητή measure περιέχονται οι ακόλουθοι τύποι πληροφοριών που φαίνονται στην παραπλεύρως λίστα ποιοτικών χαρακτηριστικών. Αντίστοιχες ποιοτικές πληροφορίες δίνονται για τα σύνορα που χρησιµοποιήθηκαν (US-Canada, US-Mexic) Truck Cntainers Empty Rail Cntainers Full Truck Cntainers Full Pedestrians Train Passengers Trains Ζητείται να διερευνηθούν τα ακόλουθα: Η κατανοµή συχνότητας των ποιοτικών δεδοµένων για τις µεταβλητές: Measure, και Brder Σχετική κατανοµή συχνότητας ποιοτικών δεδοµένων των ποιοτικών δεδοµένων για τις ίδιες µεταβλητές: Measure, και Brder Στατιστικά µέτρα (max, min, mean, standard deviatin) για τις διαφορετικές κατηγορίες διελεύσεων (π.χ. Trucks,, Rail Cntainers Empty,, Trains) Σε ποια σύνορα γίνονται οι περισσότερες διελεύσεις ανεξαρτήτως τύπου φορτηγών (Trucks) επιβατών τραίνων (Train Passengers) Σε ποια πολιτεία γίνονται οι λιγότερες διελεύσεις ανεξαρτήτως τύπου πεζών (Pedestrians) ιδιωτικών αυτοκινήτων (Persnal Vehicles) Ποσοστό διελεύσεων κατά τις οποίες ο αριθµός των κενών βαγονιών τραίνων (Rail Cntainers Empty) είναι ίσος ή µεγαλύτερος από 520. (c) Η συµπεριφορά των κλιµατικών φαινοµένων El Nin και El Nina εκφράζεται µε τους λεγόµενους δείκτες ONI (Oceanic Nin Index) που βασίζονται στις ανωµαλίες της θερµοκρασίας της θαλάσσιας επιφάνειας (SSTA, Sea Surface Temperature Anmalies) από τις µέσες συνθήκες συνήθως σε µια περίοδο 30 ετών κατά µήκος 4 συγκεκριµένων περιοχών του Νότιου Ειρηνικού. Οι τέσσερεις περιοχές είναι γνωστές ως Nin 1+2 (φ:0-12 ο S, λ:90 ο 120 ο W), Nin 3 (5N-5S, 150W- 90W), Nin 3.4 (5N-5S, 170W-120W) και Nin 4 (5N-5S, 160E-150W). Ειδικά ο δείκτης ΟΝΙ από την περιοχή Nin 3.4 συνήθως χρησιµοποιείται για να χαρακτηριστούν έντονα El Niñ και La Niña συµβάντα. Για τους σκοπούς της άσκησης θα χρειαστείτε το σχετικό αρχείο elnin.fr το οποίο ακολουθεί τον µορφότυπο fixed width frmat. Για τη διευκόλυνσή σας, τα πρώτα στοιχεία του αρχείου είναι: Weekly SST data starts week centered n 3Jan1990 Nin1+2 Nin3 Nin34 Nin4 Week SST SSTA SST SSTA SST SSTA SST SSTA 03JAN1990 23.4-0.4 25.1-0.3 26.6 0.1 28.6 0.5 10JAN1990 23.4-0.8 25.2-0.3 26.6 0.1 28.6 0.5 17JAN1990 24.2-0.3 25.3-0.3 26.5-0.1 28.6 0.5 24JAN1990 24.4-0.4 25.5-0.4 26.5-0.1 28.4 0.3 31JAN1990 25.1-0.1 25.8-0.2 26.7 0.1 28.4 0.3 Συγκεκριµένα, κατεβάστε στο χώρο εργασίας σας του R, χρησιµοποιώντας τη σχετική εντολή dwnlad(), µόνο τα δεδοµένα από τις στήλες Week και Nin34/SST SSTA, εκχωρώντας τα δεδοµένα σε µια µεταβλητή area_34. Σηµειώστε ότι κάτω από τις ετικέτες των στηλών Nin ακολουθούν δύο στήλες δεδοµένων, SST (Sea Surface Temperatures, σε ο C) και SSTA (Sea Surface Temperature Anmalies, επίσης σε ο C). Εκχωρήστε στα δεδοµένα τις ετικέτες week, sst, ssta. Με τις κατάλληλες εντολές στο R, δώστε εκτυπώστε τη δοµή του συνόλου των δεδοµένων που έχει αποθηκευθεί από το R, καθώς και µια περίληψη των επιµέρους δεδοµένων που περιέχονται στο συγκεκριµένο αντικείµενο του R. Ακολούθως εκτελέστε τις ακόλουθες εντολές εξαγωγής υποσυνόλων των δεδοµένων: Εξάγετε τις πρώτες και τις τελευταίες 20 σειρές των δεδοµένων Ποιο είναι το πλήθος των δεδοµένων SST ή/και SSTA για την περιοχή Nin 3.4

Εξάγετε τη στήλη των δεδοµένων SSTA για την περιοχή Nin 3.4 χρησιµοποιώντας την ονοµασία της στήλης. Εξάγετε τη 3 η, 5 η και 12 η γραµµή από τις στήλες SST ή/και SSTA για την περιοχή Nin 3.4 Μετατρέψτε τις ενδείξεις του χρόνου των δεδοµένων (π.χ. 03JAN1990), στη µορφή ως ηµεροµηνία (yyyy_dy_m), π.χ. 1990-01-03, και ακολούθως ως Έτος(year), Μήνα(mnth), Ηµέρα(day) και τέλος ως έτος σε δεκαδική µορφή (yr_frac). Τυπώστε µερικές από αυτές τις ενδείξεις στην αρχική µορφή τους και κατόπιν των σχετικών µετατροπών τους. ηµιουργήστε ένα νέο πλαίσιο δεδοµένων nin34 που να περιλαµβάνει ως στήλες του τα δεδοµένα yyyy_dy_m, yr_frac, και sst, stta από την περιοχή Nin 3.4. Επιβεβαιώστε µε τις κατάλληλες εντολές τον τύπο και τη δοµή του εν λόγω αντικειµένου. Πόσες γραµµές δεδοµένων περιλαµβάνονται σε αυτό; Εκτυπώστε τα δεδοµένα από την τελευταία χρονική εποχή. ηµιουργήστε, από το προηγούµενο αντικείµενο του R, δύο διανύσµατα δεδοµένων, και εκτυπώστε µερικές από τις πρώτες και τελευταίες τιµές των δεδοµένων εκάστου διανύσµατος sst_v, τα στοιχεία µε όλες τις τιµές sst ssta_v, τα στοιχεία µε όλες τις τιµές ssta Οµοίως, δηµιουργήστε δύο υποσύνολα δεδοµένων, εξακριβώστε τον τύπο και τη δοµή τους στο R, και εκτυπώστε το πλήθος των στοιχείων τους, καθώς µερικές από τις πρώτες και τελευταίες τιµές των δεδοµένων εκάστου διανύσµατος: la_nina, τα στοιχεία µε εκείνες τις τιµές ssta<0 el_nin, τα στοιχεία µε εκείνες τις τιµές ssta 0. Χρησιµοποιώντας τη βασική συνάρτηση plt() του R, δηµιουργήστε δύο ξεχωριστά γραφήµατα, όπου στο καθένα: στον άξονα των x είναι οι χρονικές εποχές µε ετικέτα Years, και στον άξονα των y, για τα αντίστοιχα γραφήµατα τα δεδοµένα ssta που περιλαµβάνονται στα αντικείµενα la_nina (χρησιµοποιήστε µπλέ χρώµα), και ετικέτα στον άξονα La Nina, SSTA in C στο ένα και el_nin (χρησιµοποιήστε κόκκινο χρώµα), και ετικέτα στον άξονα El Nin, SSTA in C στο άλλο. Χρησιµοποιώντας κατάλληλες εντολές κλήσης των βασικών συναρτήσεων plt() και pints() του R, δηµιουργήστε ένα ενιαίο γράφηµα στο οποίο στον άξονα των x είναι οι χρονικές εποχές µε ετικέτα Years, στον άξονα των y να υπάρχει ετικέτα SST Anmalies, in C, ο τίτλος στην κεφαλή του γραφήµατος να είναι Nin 3.4 Weekly SST Anmalies since 1990 να απεικονίζονται στο ίδιο γράφηµα τα προηγούµενα δεδοµένα, la_nina (µε µπλέ χρώµα), και el_nin (µε κόκκινο χρώµα). Για την διευκόλυνσή σας, το ενιαίο γράφηµα τυπικά θα πρέπει να φαίνεται όπως στην ενδεικτική παραπλεύρως απεικόνιση. Είναι προαιρετικό για τις ανάγκες της άσκησης, αλλά σας συνιστάται να δοκιµάσετε να δηµιουργήσετε ένα αντίστοιχο ενιαίο γράφηµα χρησιµοποιώντας το πακέτο ggplt2. Θεωρείστε ότι το διάνυσµα τιµών sst_v ως το θεωρητικό πληθυσµό θερµοκρασιών της θαλάσσιας επιφάνειας στην περιοχή Nin 3.4. Υπολογίστε τη µέση τιµή και τη διασπορά του εν λόγω πληθυσµού. Ακολούθως δηµιουργήστε από τον πληθυσµό τυχαία δείγµατα sst_10,

sst_20, sst_50, sst_200, sst_600 και sst_900 το καθένα αντίστοιχα µε 10, 20, 50, 200, 600 και 900 στοιχεία και επιβεβαιώστε αν η δειγµατική µέση τιµή και η διασπορά ενός δείγµατος µε αυξανόµενο πλήθος στοιχείων συγκλίνει προς τη µέση τιµή και τη διασπορά του πληθυσµού. Εξακριβώστε, µε γραφικό τρόπο, αλλά και υπολογίζοντας τις στατιστικές ροπές µ 2, µ 3 και µ 4 των δεδοµένων sst_v και ssta_v, αν σε αυτά υπάρχει λοξότητα και κύρτωση στην κατανοµή τους. Εξακριβώστε, γραφικά και αναλυτικά χρησιµοποιώντας τις συναρτήσεις plt() και cr(), αν υπάρχει συσχέτιση µεταξύ των δεδοµένων sst_v και ssta_v. Στις κλιµατολογικές µελέτες συνηθίζεται τα συµβάντα El Nin και El Nina να κατατάσσονται ως Ασθενή (Weak), Μέτρια (Mderate), Ισχυρά (Strng), και Ακραία (Extreme ή Very Strng) ανάλογα µε τις τιµές των ανωµαλιών της θερµοκρασίας της θάλασσας (δηλ. το µέγεθος της παραµέτρου SSTA). Από τα διαθέσιµα δεδοµένα δηµιουργήστε 8 αντίστοιχα πλαίσια δεδοµένων τα οποία να περιλαµβάνουν τις εποχές (στη µορφή π.χ. 2012-03-14 ή/και YEAR, MONTH, DAY), SST και SSTA για τις ακόλουθες κατηγορίες συµβάντων: el_nin_weak (0 SSTA <1.0), el_nin_md (1 SSTA <1.5), el_nin_strng (1.5 SSTA <2.0), el_nin_super (2.0 SSTA) la_nina_weak (-1.0 SSTA < 0), la_nina _md (-1.5 SSTA < -1.0), la_nina _strng (-2.0 SSTA < -1.5), la_nina _super (-2.0 SSTA) Για τα δεδοµένα κάθε κατηγορίας συµβάντων υπολογίστε τα κύρια στατιστικά χαρακτηριστικά των συµβάντων. Εξακριβώστε, γραφικά και αναλυτικά, εάν τα συµβάντα ισχυρών (strng) El Nin και El Nina αναπτύσσονται κυρίως κατά τους µήνες Απρίλιο-Ιούνιο. Εξακριβώστε, γραφικά και αναλυτικά, εάν τα συµβάντα ισχυρών (strng) El Nin και El Nina τείνουν να φθάνουν στη µέγιστή ισχύ τους κατά τους µήνες Οκτώβριο-Φεβρουάριο. Εξακριβώστε, γραφικά και αναλυτικά, εάν τα συµβάντα El Nin και El Nina τυπικά διαρκούν από 9-12 µήνες, αν και ενίοτε µπορεί να διαρκούν µέχρι και 2 έτη. Εξακριβώστε, γραφικά και αναλυτικά, εάν τα συµβάντα ισχυρών (strng) El Nin ή El Nina τυπικά επαναλαµβάνονται κάθε 2 µε 7 έτη.

ΘΕΜΑΤΙΚΗ ΕΡΓΑΣΙΑ #6 Σκοπός: Η παρούσα θεµατική εργασία αποσκοπεί στην εξοικείωση σας µε βασικές έννοιες και πρακτικές που σχετίζονται µε τον στατιστικό έλεγχο υποθέσεων, και κυρίως τη λογική, το νόηµα και τον ρόλο τους στη Στατιστική Συµπερασµατολογία. Η έµφαση θα δοθεί στη χρήση των εργαλείων για ποικιλία στατιστικών δοκιµών που προσφέρει το λογισµικό R για αυτόν το σκοπό και κυρίως για τον έλεγχο καλής προσαρµογής δειγµατοληπτικών δεδοµένων και της στατιστικής αξιοπιστίας των υπό διερεύνηση παραµέτρων. Το 2 ο µέρος αποσκοπεί στην εφαρµογή της Μεθόδου των Ελαχίστων Τετραγώνων σε αντιπροσωπευτικά προβλήµατα γεωεπιστηµονικού ενδιαφέροντος. Μέρος Α Έλεγχοι υποθέσεων 1. (a) Χρησιµοποιήστε τις κατάλληλες συναρτήσεις του R για τη κατανοµή χ 2 προκειµένου να δηµιουργήσετε διαστήµατα εµπιστοσύνης για τη διακύµανση ενός πληθυσµού δεδοµένων για τις ακόλουθες περιπτώσεις: Επίπεδο αξιοπιστίας a=0.10, βαθµοί ελευθερίας df=25 Επίπεδο αξιοπιστίας a=0.05, βαθµοί ελευθερίας df=15 Επίπεδο αξιοπιστίας a=0.05, βαθµοί ελευθερίας df=10 Επίπεδο αξιοπιστίας a=0.01, βαθµοί ελευθερίας df=30 (b) Αντίστοιχα, χρησιµοποιήστε τις κατάλληλες συναρτήσεις του R για τη κατανοµή Student προκειµένου να δηµιουργήσετε διαστήµατα εµπιστοσύνης για τη µέση τιµή ενός πληθυσµού δεδοµένων για τις ακόλουθες περιπτώσεις: Επίπεδο αξιοπιστίας a=0.10, βαθµοί ελευθερίας df=25 Επίπεδο αξιοπιστίας a=0.05, βαθµοί ελευθερίας df=15 Επίπεδο αξιοπιστίας a=0.01, βαθµοί ελευθερίας df=10 Επίπεδο αξιοπιστίας a=0.01, βαθµοί ελευθερίας df=40 (c) Αντίστοιχα, χρησιµοποιήστε τις κατάλληλες συναρτήσεις του R για τη κατανοµή F (Fisher) προκειµένου να δηµιουργήσετε διαστήµατα εµπιστοσύνης για τη µέση τιµή ενός πληθυσµού δεδοµένων για τις ακόλουθες περιπτώσεις δειγµάτων: Επίπεδο αξιοπιστίας a=0.20, βαθµοί ελευθερίας df1=25 (δείγµα 1) και df2=2 (δείγµα 2) Επίπεδο αξιοπιστίας a=0.01, βαθµοί ελευθερίας df1=15 (δείγµα 1) και df2=8 (δείγµα 2) Επίπεδο αξιοπιστίας a=0.05, βαθµοί ελευθερίας df1=60 (δείγµα 1) και df2=20 (δείγµα 2) Επίπεδο αξιοπιστίας a=0.80, βαθµοί ελευθερίας df1= 2 (δείγµα 1) και df2=24 (δείγµα 2) Χωρίς να είναι απαραίτητο για τους σκοπούς τις θεµατικής εργασίας, αλλά σας συνιστάται να επιβεβαιώσετε τους προηγούµενους υπολογισµούς χρησιµοποιώντας τα εργαλεία/πίνακες υπολογισµού κατανοµής πιθανοτήτων που βρίσκονται στις ιστοσελίδες του µαθήµατος. (d) Το βαθµονοµηµένο µήκος µιας βάσης µεταξύ δύο γεωδαιτικών βάθρων είναι 402.167 m. Θεωρείστε ότι η εν λόγω απόσταση µετρήθηκε πέντε φορές µε EDM και η µέση απόσταση ήταν 402.151 m µε τυπική απόκλιση ±0.0055 m. (i) Ποιο είναι το διάστηµα εµπιστοσύνης 95% για τη εν λόγω µέτρηση; (ii) Σε επίπεδο εµπιστοσύνης 95%, µπορείτε να δηλώσετε ότι το EDM λειτουργεί σωστά; ικαιολογήστε την απάντησή σας µε στατιστικούς όρους. ιερευνήστε το ίδιο, σε επίπεδο εµπιστοσύνης 90%. 2. Θεωρήστε ότι ο πίνακας των τιµών που δίνονται παραπλεύρως αντιπροσωπεύει έναν πληθυσµό δεδοµένων, µε µέση τιµή µ= 26.069 και τυπική απόκλιση σ= 4.179. (a) Χρησιµοποιώντας τη συνάρτηση sample(), επιλέξτε τυχαία από τις εν λόγω τιµές, 4 δείγµατα µε 10 τιµές το 18.2 26.4 20.1 29.9 29.8 26.6 26.2 25.7 25.2 26.3 26.7 30.6 22.6 22.3 30.0 26.5 28.1 25.6 20.3 35.5 22.9 30.7 32.2 22.2 29.2 26.1 26.8 25.3 24.3 24.4 29.0 25.0 29.9 25.2 20.8 29.0 21.9 25.4 27.3 23.4 38.2 22.6

καθένα και προσδιορίστε εκτιµήσεις του µέσου όρου y και της διακύµανσης S 2 του εκάστοτε δείγµατος. Τυπικά, δεν πρέπει να αναµένεται ότι αυτές οι εκτιµήσεις θα ταιριάζουν ακριβώς µε τον µέσο όρο και τη διακύµανση του πληθυσµού (εξήγηση: εδοµένου ότι ο µέσος όρος και η τυπική απόκλιση ενός δείγµατος υπολογίζονται από τυχαίες µεταβλητές, είναι επίσης τυχαίες µεταβλητές). (b) Προκειµένου να διερευνήστε καθώς το µέγεθος του δείγµατος αυξάνεται, εάν ο µέσος όρος και η 28.0 24.0 19.4 27.0 32.0 27.3 15.3 26.5 31.5 28.0 22.4 23.4 21.2 27.7 27.1 27.0 25.2 24.0 24.5 23.8 28.2 26.8 27.7 39.8 19.8 29.3 28.5 24.7 22.0 18.4 26.4 24.2 29.9 21.8 36.0 21.3 28.8 22.8 28.5 30.9 19.1 28.1 30.3 26.5 26.9 26.6 28.2 24.2 25.5 30.2 18.9 28.9 27.6 19.6 27.9 24.9 21.3 26.7 διακύµανση του δείγµατος θα πρέπει να προσεγγίζουν τις αντίστοιχες τιµές του πληθυσµού, δηµιουργήστε 4 τυχαία δείγµατα που να περιλαµβάνουν αντίστοιχα 15, 30, 50, 70 τυχαία στοιχεία από τον αρχικό πληθυσµό και υπολογίστε τις αντίστοιχες εκτιµήσεις για τον µέσο όρο και την τυπική απόκλιση κάθε δείγµατος. (c) Χρησιµοποιήστε κάθε ένα από τα δείγµατα από το ερώτηµα (a) και µέσω της κατανοµής χ 2, προσδιορίστε την περιοχή στην οποία µπορεί να αναµένεται να εµφανιστεί η διακύµανση σ 2 του πληθυσµού, µε πιθανότητα 95%, και ανάλογα µε τη διακύµανση S 2 και τον βαθµό ελευθερίας του εκάστοτε δείγµατος. (d) Χρησιµοποιήστε κάθε ένα από τα δείγµατα από το ερώτηµα (b) και µέσω της κατανοµής Student και της κανονικής κατανοµής κάθε φορά, σε επίπεδο εµπιστοσύνης 95%, συγκρίνετε τον µέσο του πληθυσµού µε τον µέσο όρο κάθε δείγµατος βάσει του πλήθους των στοιχείων (ή των βαθµών ελευθερίας) κάθε δείγµατος. Σχολιάστε την καταλληλότητα της κατανοµής Student (έναντι της κανονικής κατανοµής) όταν το δείγµα περιέχει λιγότερα ή περισσότερα από 30 στοιχεία. (e) Ενίοτε µπορεί να είναι επιθυµητό να ελεγχθεί η µέση τιµή ενός δείγµατος έναντι µιας γνωστής τιµής, π.χ. της αντίστοιχης τιµής ενός πληθυσµού. Εν προκειµένω χρησιµοποιήστε τα δείγµατα µε τα 15 και τα 30 στοιχεία από το ερώτηµα (b) και την κατανοµή Student για την διερεύνηση αυτής της δοκιµής σε επίπεδο εµπιστοσύνης 95%. Η µηδενική υπόθεση για αυτή τη δοκιµή να είναι σε δύο µορφές: µονόπλευρη ή αµφίπλευρη δοκιµή. Όπως φαίνεται παραπάνω, στη µονόπλευρη δοκιµή, ερευνάται αν ο µέσος του δείγµατος είναι στατιστικά είτε µεγαλύτερος ή µικρότερος από την µέση τιµή του θεωρούµενου πληθυσµού. Στη αµφίπλευρη δοκιµή, ερευνάται αν ο µέσος του δείγµατος είναι στατιστικά διαφορετικός από τον µέσο όρο του πληθυσµού.

Αντίστοιχα χρησιµοποιήστε τα ίδια δείγµατα µε τα 15 και τα 30 στοιχεία από το ερώτηµα (b) και την κατανοµή χ 2 για να διερευνήσετε σε επίπεδο εµπιστοσύνης 95% την διακύµανση του κάθε δείγµατος σε σύγκριση µε εκείνη του θεωρούµενου πληθυσµού. Η µηδενική υπόθεση και για αυτή τη δοκιµή να είναι σε δύο µορφές: µονόπλευρη ή αµφίπλευρη δοκιµή. Όπως φαίνεται παραπάνω, στη µονόπλευρη δοκιµή, ερευνήστε αν η διακύµανση του δείγµατος είναι στατιστικά είτε µεγαλύτερη ή µικρότερη από την αντίστοιχη τιµή του θεωρούµενου πληθυσµού. Στη αµφίπλευρη δοκιµή, ερευνήστε αν η διακύµανση του δείγµατος είναι στατιστικά διαφορετική από τη διακύµανση του πληθυσµού. 3. Θεωρήστε ότι κατά τη διεξαγωγή µιας τοπογραφικής εργασίας, έγιναν 16 µετρήσεις της διεύθυνσης µεταξύ δύο αποµακρυσµένων σηµείων. Ο µέσος όρος (µόνο για τα δευτερόλεπτα της µοίρας) των αναγνώσεων των γωνιακών µετρήσεων ήταν y = 25.4, µε τυπική απόκλιση S = ±1.3. a) Προσδιορίστε σε επίπεδο εµπιστοσύνης 95% το διάστηµα εµπιστοσύνης για τον πληθυσµιακό µέσο των µετρήσεων χρησιµοποιώντας την κατανοµή Student και τη συνάρτηση qt() στην R. Ακολούθως συγκρίνετε το εν λόγω διάστηµα εµπιστοσύνης µε το διάστηµα που υπολογίζεται από την κανονική κατανοµή (µέσω της συνάρτησης qnrm() στην R). Εξακριβώστε εάν λόγω του µικρού δείγµατος, η κατανοµή Student δίνει ένα λίγο διαφορετικό (µικρότερο ή µεγαλύτερο;) εύρος για τον µέσο του πληθυσµού από ότι η κανονική κατανοµή. Χρησιµοποιώντας τον πολλαπλασιαστή της κατανοµής Student t df, a, υπολογίστε ένα διάστηµα εµπιστοσύνης επί τοις εκατό εκατέρωθεν της παρατηρηθείσας µέσης τιµής του δείγµατος που θα µπορούσατε να χρησιµοποιήσετε για να αποµονώσετε τυχόν αποµακρυσµένες παρατηρήσεις (utliers): y tdf,a S < yi < y + tdf, a S. Κατά αντίστοιχο τρόπο, κάνετε το ίδιο χρησιµοποιώντας τον z πολλαπλασιαστή της κανονικής κατανοµής a, προκειµένου να υπολογίστε ένα διάστηµα εµπιστοσύνης επί τοις εκατό εκατέρωθεν της παρατηρηθείσας µέσης τιµής του δείγµατος που θα µπορούσατε να χρησιµοποιήσετε για να αποµονώσετε τυχόν αποµακρυσµένες παρατηρήσεις (utliers): x za S < xi < x + za S b) Επαναλάβετε τη διαδικασία υπολογισµού του διαστήµατος εµπιστοσύνης του µέσου του πληθυσµού, αυτή τη φορά χρησιµοποιώντας το δείγµα των ακόλουθων µετρήσεων: 24.42498 24.09340 23.91083 24.52861 23.83480 28.50403 25.47299 26.76686 26.01766 25.09180 25.87468 25.96720 26.26995 25.13933 25.28580 26.79375 και επιβεβαιώστε τα προηγούµενα αποτελέσµατα σας για την κατανοµή Student χρησιµοποιώντας τη συνάρτηση t.test(), και για την κανονική κατανοµή χρησιµοποιώντας τη συνάρτηση ZTest() από το πακέτο της R DescTls. c) Προκειµένου να επιβεβαιώσετε την εγκυρότητα της θεωρίας του διαστήµατος εµπιστοσύνης για το µέσο ενός πληθυσµού, δηµιουργήστε, µε τη χρήση των συναρτήσεων rnrm() και

sample(), ένα σύνολο δεδοµένων αποτελούµενο από 1000 δείγµατα το καθένα µε 16 στοιχεία που συλλέγονται τυχαία από έναν πληθυσµό µε µέση τιµή 25.4 και τυπική απόκλιση 1.3. Χρησιµοποιώντας επίπεδο εµπιστοσύνης 95% υπολογίστε το διάστηµα εµπιστοσύνης για τη µέση τιµή του πληθυσµό που προκύπτει από κάθε δείγµα και συγκρίνετε το κάθε φορά µε τον πραγµατικό µέσο όρο του πληθυσµού. Εάν η προηγούµενη θεωρία είναι έγκυρη, το 95% των διαστηµάτων που θα κατασκευαστούν αναµένεται να περιέχουν το µέσο όρο του πληθυσµού µε βάση το επίπεδο αξιοπιστίας 0.05 (δηλ. περίπου 50 από τα 1000 δείγµατα δεν θα περιέχουν τον θεωρητικό µέσο όρο του πληθυσµού, ή µε άλλα λόγια το 5% των δειγµάτων θα αποτύχουν το t.test). Σηµειώστε ότι, εν προκειµένω, θα χρειαστεί να χρησιµοποιήσετε ένα fr-lp εντολών όπως κάνατε στην προηγούµενη Θεµατική Εργασία #4. d) Κατ επέκταση της προηγούµενης πρακτικής διαδικασίας, θεωρήστε ότι ως µέρος του σχεδιασµού των µετρήσεων πεδίου, κατά την προανάλυση ενός γεωδαιτικού δικτύου σηµείων ελέγχου, είναι γνωστό ότι όλες οι γωνίες πρέπει να µετρηθούν µε τυπική ακρίβεια ±2, σε επίπεδο εµπιστοσύνη 95%. Πόσες επαναληπτικές µέτρησης της εκάστοτε γωνίας θα χρειαστεί να γίνουν εάν, βάσει του θεοδόλιχου που θα χρησιµοποιηθεί, η τυπική απόκλιση για την µέτρηση µιας γωνίας έχει καθοριστεί ότι θα είναι στο επίπεδο ±2.6 ; Βοηθητική υποσηµείωση: ξεκινήστε το συλλογισµό σας από τον τρόπο που αναφερθήκατε στο ερώτηµα (a) προκειµένου να αποµονώσετε τυχόν αποµακρυσµένες παρατηρήσεις (utliers) και διερευνήστε αν µπορείτε να χρησιµοποιήσετε την κατανοµή Student ή την κανονική κατανοµή. Θεωρείστε ότι το σφάλµα στόχευσης και ανάγνωσης µιας γωνιακής µέτρησης, από έναν παρατηρητή που χρησιµοποιεί ένα θεοδόλιχο µε δυνατότητες µετρήσεων στο επίπεδο ±1, υπολογίζεται από τη συλλογή 20 αναγνώσεων γωνιακών µετρήσεων προς έναν καλά καθορισµένο στόχο. Η τυπική απόκλιση του δείγµατος ορίζεται ότι είναι ±1.8. Χρησιµοποιώντας την κατανοµή χ 2 διερευνήστε ποιό είναι, σε επίπεδο πιθανότητας 95%, το διάστηµα εµπιστοσύνης για τη διασπορά (variance) σ 2 του πληθυσµού των γωνιακών µετρήσεων; e) Υποθέστε ότι από µια ελάχιστα δεσµευµένη συνόρθωση (minimally cnstrained adjustment) ενός γεωδαιτικού δικτύου σηµείων ελέγχου µε 24 βαθµούς ελευθερίας προκύπτει διακύµανση αναφοράς S 2 =0.49 και ότι η πλήρως δεσµευµένη συνόρθωση (fully cnstrained adjustment) του ίδιου δικτύου µε 30 βαθµούς ελευθερίας έδωσε διακύµανση αναφοράς S 2 =2.25. Προκειµένου να ελέγξετε αν υπάρχει ή όχι λόγος να ανησυχείτε για το ότι οι εν λόγω διαφορές των δύο τιµών της διακύµανσης µπορεί να µην είναι στατιστικά συνεπείς µεταξύ τους, διερευνήστε ποιο είναι σε επίπεδο πιθανότητας 95% το διάστηµα εµπιστοσύνης για το λόγο των δύο διακυµάνσεων και εάν το διάστηµα αυτό περιέχει την αριθµητική τιµή 1. Όπως φαίνεται στην παραπάνω αναφερόµενη σχετική σχέση, για την απαιτούµενη δοκιµή θα πρέπει να χρησιµοποιηθεί η κατανοµή F. Μέρος Β Απλές εφαρµογές της Μεθόδου Ελαχίστων Τετραγώνων 1. (i) Υπολογίστε µε τη ΜΕΤ τη λύση του συστήµατος των ακόλουθων (µη γραµµικών) εξισώσεων: F: x+y-2y 2 = -4 G: x 2 + y 2 = 8 H: 3x 2 - y 2 = 7.7 (ii) Θεωρήστε ότι τα δεδοµένα του διανύσµατος τιµών x = [3 6 7 9 11 12 14 16 18 19 23 24 33 35 39 41 42 44 45 49] T εκφράζουν µετρήσεις χρόνου Τ (σε days) και του διανύσµατος y= [0.435 0.706 0.729 0.975 1.063 1.228 1.342 1.491 1.671 1.696 2.122 2.181 2.938 3.135 3.419 3.724 3.705 3.820 3.945 4.320] T εκφράζουν τα σφάλµατα ενός χρονοµέτρου (σε sec). Ο συµβολισµός [ ] Τ υποδηλώνει το ανάστροφο του διανύσµατος. ηµιουργήστε στο R ένα απλό γράφηµα που να δείχνει

την εξέλιξη των σφαλµάτων του χρονοµέτρου ως συνάρτηση του χρόνου. Ακολούθως εκτελέστε µια τυπική γραµµική παλινδρόµηση, εξετάζοντας το πρόβληµα ως ένα σύστηµα γραµµικών εξισώσεων Ax = b οποίο καλείστε να επιλύσετε µε τη ΜΕΤ και να σχεδιάσετε στο ίδιο γράφηµα την βέλτιστη ευθεία που διέρχεται διαµέσου των σηµείων. είξτε από την εξίσωση της ευθείας που υπολογίστηκε ότι αυτή διέρχεται από το σηµείο µε συντεταγµένες τις µέσες τιµές. ιερευνήστε το ίδιο πρόβληµα χρησιµοποιώντας τη συνάρτηση lm() της R. Για τη διευκόλυνσή σας συµβουλευτείτε το παράδειγµα παρόµοιας εφαρµογής στο σύνδεσµο http://r-statistics.c/linear-regressin.html. (iii) Προσαρµόστε µια 2-D επιφάνεια στο σύνολο των σηµείων που δίνονται στο αρχείο rls_data.csv στην ιστοσελίδα του µαθήµατος (10000 τριάδες τιµών <x, y, value>. Η λύση έχει τη µορφή x, y g (χ, γ) = a 1 x 2 + a 2 y 2 + a 3 x + a 4 x + a 5 y + a 6 που ελαχιστοποιεί το σφάλµα του αθροίσµατος των ελάχιστων τετραγώνων. 1. ιαµορφώστε τα βήµατα επίλυσης του προβλήµατος στο R ως ένα πρόβληµα της ΜΕΤ στη µορφή πινάκων Ax = b. Συγκεκριµένα, καταστρώστε τον πίνακα σχεδιασµού A, του διανύσµατος των άγνωστων x και του διανύσµατος των γνωστών τιµών b. Ακολούθως επιλύστε το προκύπτον υπερπροσδιορισµένο σύστηµα των εξισώσεων, και υπολογίστε τις τιµές για a 1, a 2, a 3, a 4, a 5 και a 6. 2. Λύστε το πρόβληµα χρησιµοποιώντας τις εντολές στο R lm ή lsfit και συγκρίνετε τα αποτελέσµατα µε αυτά από το προηγούµενο ερώτηµα. Υποβάλετε τον κώδικα R και τη σύγκρισή σας. D A DH f DH b 919.9710 919.9904 919.9904 313.0810 313.1009 313.1007 331.2526 331.2727 331.2725 518.0927 518.1133 518.1123 364.4440 364.4633 364.4637 217.7238 217.7432 217.7438 939.9613 939.9811 939.9811 728.7362 728.7559 728.7549 547.2609 547.2811 547.2811 471.5447 471.5648 471.5635 2. (i) Η χρήση οργάνων EDM (αποστασιόµετρα, Electrmagnetic Distance Measurement) προϋποθέτει ότι το εκάστοτε χρησιµοποιούµενο σύστηµα EDM - κατάφωτα είναι βαθµονοµηµένο προκειµένου να προσδιοριστούν οι λεγόµενες σταθερά κλίµακας S για το όργανο και C η σταθερά του συστήµατος. Η βαθµονόµηση γίνεται συνήθως σε βάσεις γνωστού µήκους και χρησιµοποιούνται εξισώσεις παρατήρησης της µορφής: S D A + C = D H D A + V DH όπου D H είναι η εκάστοτε παρατηρούµενη απόσταση (συνήθως µετρούµενη µε εµπρόσθια ή οπίσθια µέτρηση), D A είναι το αποδεκτό (βαθµονοµηµένο) µήκος της εκάστοτε βάσης, και V DH είναι το σφάλµα της εκάστοτε µέτρησης. Θεωρείστε ότι µια τέτοια σειρά µετρήσεων βαθµονόµησης σε διαφορετικές βάσεις έδωσαν τα δεδοµένα που δίνονται στο παραπάνω πίνακα τιµών. Εφαρµόζοντας τη ΜΕΤ να υπολογιστούν οι εκτιµήσεις των σταθερών S και C µε τις αβεβαιότητες τους. Κατά την επίλυση του προβλήµατος στο R να εκτυπωθούν όλα τα ενδιάµεσα αποτελέσµατα αξιολόγησης της συνόρθωσης των µετρήσεων, όπως: πίνακας σχεδιασµού των συντελεστών των άγνωστων παραµέτρων, ο πίνακας των συντελεστών των µετρηµένων στοιχείων, το διάνυσµα των σφαλµάτων του κλεισίµατος των µετρήσεων, οι πίνακες των βαρών, των κανονικών εξισώσεων, της apsteriri πίνακας µεταβλητότητας-συµµεταβλητότητας για τις άγνωστες παραµέτρους, το διάνυσµα των υπολοίπων των µετρήσεων, οι συνορθωµένες µετρήσεις κ.ά. (ii) Θεωρείστε ότι µεταξύ τεσσάρων σηµείων A, B, C και D που βρίσκονται σε ευθεία γραµµή έχουµε µετρήσει τις αποστάσεις AB, BC, CD, AC, AD και BD και οι τιµές τους ήταν, σε µέτρα, y = [3.17 1.12 2.25 4.31 6.51 3.36] T. Ζητείται να υπολογίσετε τις αποστάσεις d1 = AB, d2 = BC και d3 = CD χρησιµοποιώντας τη ΜΕΤ. Ακολούθως, υπολογίσετε τις ίδιες αποστάσεις d1 = AB, d2 = BC και d3 = CD χρησιµοποιώντας τη ΜΕΤ, αλλά αυτή τη φορά θεωρήστε ότι στο πρόβληµα θα πρέπει να ληφθεί υπόψη µια επιπλέον παράµετρος d0 που αντιστοιχεί σε ένα συστηµατικό σφάλµα της συσκευή που χρησιµοποιείται στο µηδενικό σηµείο της µέτρησης των αποστάσεων. Και στις δύο περιπτώσεις εκτελέστε τη συνόρθωση των µετρήσεων στο R και παρουσιάστε όλα τα ενδιάµεσα και τελικά αποτελέσµατα που τεκµηριώνουν την ποιότητα των µετρήσεων και τα µέτρα ακρίβειας της εκτίµησης των παραµέτρων του προβλήµατος.

(iii) Θεωρήστε τα ακόλουθα δεδοµένα ταυτόχρονων µετρήσεων από έναν δέκτη GPS προς 7 ορατούς δορυφόρους (1, 4, 7, 13, 20, 24 και 25) και τις αντίστοιχες ψευδοαποστάσεις που µετρήθηκαν. Ζητείται να υπολογιστεί το διάνυσµα θέσης του δέκτη (δηλ. οι συντεταγµένες του [Χ R, Y R, Z R ]) καθώς και το σφάλµα cdt του χρονοµέτρου του δέκτη. Με άλλα λόγια, ζητείται να προσδιοριστούν µε τη ΜΕΤ οι παράµετροι [x1 x2 x3 x4] T = [X Y Z cdt ] T. GPS X[m] Υ[m] Ζ[m] d[m] 1 16,577,402.072 5,640,460.750 20,151,933.185 20,432,524.0 4 11,793,840.229 10,611,621.371 21,372,809.480 21,434,024.4 7 20,141,014.004 17,040,472.264 2,512,131.115 24,556,171.0 13 22,622,494.101 4,288,365.463 13,137,555.567 21,315,100.2 20 12,867,750.433 15,820,032.908 16,952,442.746 21,255,217.0 24 3,189,257.131 17,447,568.373 20,051,400.790 24,441,547.2 25 7,437,756.358 13,957,664.984 21,692,377.935 23,768,678.3 Για τους σκοπούς της άσκησης θεωρήστε ότι η πραγµατική θέση του δέκτη (σε m) είναι [X Y Z] T = [3507884.948 780492.718 5251780.403] T. Ωστόσο, για την επίλυση του προβλήµατος θεωρήστε ως αρχικές τιµές [X ο Y ο Z ο cdt ο ] T = [0, 0, 0, 0] Τα, δηλ. το κέντρο της Γης και µηδενικό σφάλµα χρονοµέτρου του δέκτη. Οι εξισώσεις παρατήρησης είναι της µορφής d = ( Xs X ) + (Ys Y ) + ( Zs Z ) + cdt + e 2 2 2 i i i όπου (Χ s, Y s, Z s ) είναι οι συντεταγµένες των δορυφόρων και e είναι το σφάλµα της εκάστοτε µέτρησης ψευδοαπόστασης. Για κάθε µέτρηση ψευδοαπόστασης θεωρήστε ότι το τυπικό σφάλµα της µέτρησης είναι σ = 10m ( αντίστοιχο βάρος 1/σ 2 ). ιερευνήστε µετά από πόσες επαναλήψεις (iteratins) της συνόρθωσης των µετρήσεων καταλήγουµε σε ικανοποιητική λύση, και πόσο απέχουν οι υπολογισµένες συντεταγµένες του δέκτη από τις θεωρούµενες γνωστές τιµές τους; Αξιολογήστε και σχολιάστε την ποιότητα των µετρήσεων και τα τελικά αποτελέσµατα της λύσης σας.