Οδηγίες χρήσης του R, μέρος 2 ο

Σχετικά έγγραφα
Οδηγίες χρήσης του R, μέρος 1 ο. Κατεβάζουμε το λογισμικό από την ιστοσελίδα


Wan Nor Arifin under the Creative Commons Attribution-ShareAlike 4.0 International License. 1 Introduction 1

Wan Nor Arifin under the Creative Commons Attribution-ShareAlike 4.0 International License. 1 Introduction 1

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p


Ο ΑΞΟΝΑΣ FGF23-KLOTHO ΣΕ ΑΣΘΕΝΕΙΣ ΜΕ ΧΡΟΝΙΑ ΝΕΦΡΙΚΗ ΝΟΣΟ ΣΤΑΔΙΟΥ 1-5

FORD ST _ST_Range_V2_2015MY.indd FC1-FC3 06/11/ :29:57

Ο παραπάνω κώδικας δημιουργεί ένα πλαίσιο δεδομένων (data frame) και δίνει ονόματα στην κάθε μεταβλητή που αυτό περιέχει (στην κάθε στήλη)

ckoullas 2 c k : :. :.. . : -

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

waffle Chris Parrish June 18, 2016

ΟΙΚΟΝΟΜΕΤΡΙΑ 2 ΦΡΟΝΤΙΣΤΗΡΙΟ 2 BASICS OF IV ESTIMATION USING STATA

Supplementary Materials: A Preliminary Link between Hydroxylated Metabolites of Polychlorinated Biphenyls and Free Thyroxin in Humans

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΤΕΧΝΙΚΕΣ ΦΙΛΤΡΑΡΙΣΜΑΤΟΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΒΙΟΜΙΙΧΑΝΊΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΗΤ\ ΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Αγρονόµων Τοπογράφων Μηχανικών ΠΜΣ Γεωπληροφορική Αναλυτικές Μέθοδοι στη Γεωπληροφορική

Group 2 Methotrexate 7.5 mg/week, increased to 15 mg/week after 4 weeks. Methotrexate 7.5 mg/week, increased to 15 mg/week after 4 weeks

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΟΝΟΜΑΤΕΠΩΝΥΜΟ : Αντικείμενο: Εισαγωγή στο στατιστικό πακέτο R και στις δυνατότητές του για δημιουργία γραφημάτων. Χρήση του λογισμικού RStudio.

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

= p 20 1 p p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Το TEX στο χώρο της στατιστικής: η δύναμη του ελεύθερου λογισμικού

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

Orders%numerical%data%and%how%they%are%distributed% Dot%Plot% % Shows%the%number%of%times%each% %occurs%

Start Random numbers Distributions p-value Confidence interval.

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ηλεκτρονικοί Υπολογιστές I

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΤΟΥ ΔΙΔΑΚΤΙΚΟΥ ΕΡΓΟΥ ΤΩΝ ΥΠΟΧΡΕΩΤΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΧΕΙΜΕΡΙΝΟΥ ΕΞΑΜΗΝΟΥ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

Τ.Ε.Ι. ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΔΟΜΙΚΩΝ ΕΡΓΩΝ ΣΚΥΡΟΔΕΜΑ ΙΙ.

MATHACHij = γ00 + u0j + rij

ΕΝ ΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΗΣ 2 (Εργαστήρια µαθήµατος «Στατιστικά Προγράµµατα», τµ. Στατ. & Ασφ. Επιστ., 04-05) (Επιµέλεια: Ελευθεράκη Αναστασία)

Άσκηση 10, σελ Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

, -.

RALLY GREECE OFF ROAD «Όπως παλιά!»

Ηλεκτρονικοί Υπολογιστές IV

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

Biostatistics for Health Sciences Review Sheet

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

Κατευθυντήριες Γραµµές για την Ερµηνεία της Δύναµης Ανύψωσης της Γλώσσας (P max )

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

1991 US Social Survey.sav

Π.Μ.Σ. ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΚΑΙ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΤΕΛΙΚΟ ΔΙΑΓΩΝΙΣΜΑ 27/6/2016

R & R- Studio. Πασχάλης Θρήσκος PhD Λάρισα


Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S.

Περιγραφική Στατιστική

ΟΣΤΕΟΧΡΟΝΟΛΟΓΗΣΗ Εικόνα 27 Figure 27 Εικόνα 28 Figure 28

Εισαγωγή στην Ανάλυση Δεδομένων

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΦΟΙΤΗΤΩΝ

Ο ρόλος της Λεπτίνης, της Αδιπονεκτίνης και της Γρελίνης στο Άσθµα στη σταθερή νόσο και στην παρόξυνση

Ανάλυση της ιακύµανσης

Γραμμικός Προγραμματισμός και Βελτιστοποίηση (Εργαστήριο 2)

Privacy - k-anonymity. Πιλαλίδου Αλίκη

< (0.999) Graft (0.698) (0.483) <0.001 (0.698) (<0.001) (<0.001) 3 months (0.999) (0.483) (<0.001) 6 months (<0.

Ακαδημαϊκό Έτος 2014/15 Εαρινό Εξάμηνο Σελίδα 1 από 5

(i) Περιγραφική ανάλυση των μεταβλητών PRICE

Συστήματα Στήριξης Αποφάσεων

m4.3 Chris Parrish June 16, 2016

ΓΕΝΙΚΟ ΛΥΚΕΙΟ ΜΟΙΡΩΝ Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον Ασκήσεις με Λύση - Δομή Επανάληψης

Τεχνικές Προβλέψεων Προετοιμασία Χρονοσειράς Data and Adjustments

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

Digital Image Processing

Α ΤΑΞΗ 6/27/2013 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΙΟΥΝΙΟΥ 2013 ΜΑΘΗΜΑΤΙΚΑ. ΓΙΑ OΛΑ ΤΑ ΜΑΘΗΜΑΤΑ ΕΓΙΝΕ: Α) Περιγραφική ανάλυση ( Mean, Median, Mode)

Επιστημονικά Υπεύθυνος: Συλαίος Γιώργος Ομάδα Εργασίας: Πρίνος Παναγιώτης, Σαμαράς Αχιλλέας

Simon et al. Supplemental Data Page 1

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Σ. Mακρυγιάννης 1, Γ. Aναγνώστου 2, Σ. Kαλιαµπάκος 1, Γ. Τσάκωνας 1, Κ. Παπαδόπουλος 1, N. Σουρλάς 1, Π. Mάλλιος 1, Θ. Kωστελίδου 2, A.

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

ΣΤΑΤΙΣΤΙΚΑ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΤΜΗΜΑΤΟΣ (ΧΩΡΙΣ ΣΧΟΛΙΑ)

5.1 logistic regresssion Chris Parrish July 3, 2016

ΧΑΜΗΛΗ ΠΙΕΣΗ ΠΡΙΝ ΤΗΝ ΑΙΜΟΣΟΣΙΑ

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης


Συστήματα Γνώσης. Πρακτικό Κομμάτι Μαθήματος Πρότυπα Γεγονότων. Νίκος Βασιλειάδης, Αναπλ. Καθηγητής Τμήμα Πληροφορικής

Tanzania. General Climate. UNDP Climate Change Country Profiles. C. McSweeney 1, M. New 1,2 and G. Lizcano 1

Transcript:

ΟδηγίεςχρήσηςτουR,μέρος2 ο Ελληνικά Ανπροσπαθήσουμεναγράψουμεελληνικάήναανοίξουμεκάποιοαρχείοδεδομένωνμε ελληνικούςχαρακτήρεςστοr,μπορείαντίγιαελληνικάναδούμελατινικούςχαρακτήρεςμε τόνουςήάλλακαλλικαντζαράκια.τότεδίνουμετηνπαρακάτωεντολήγιαναγυρίσειτοrστα ελληνικά: > Sys.setlocale("LC_CTYPE","Greek") [1] "Greek_Greece.1253" ΗαπόκρισητουR(μεμπλε)επιβεβαιώνειτηρύθμισητωνελληνικών. Πλαίσιαδεδομένων ΤοRδιατηρείμετρήσειςμέσασεδομέςπουονομάζονται«πλαίσιαδεδομένων»(dataframe). Κάθεπλαίσιοδεδομένωνπεριέχειμίαήπερισσότερεςμεταβλητές. Γιαπαράδειγμα,αςκαταγράψουμετοφύλοκαιτηνηλικίαδύοατόμων,τουΓιάννηκαιτης Μαρίας,σεέναπλαίσιοδεδομένωντοοποίοαναθέτουμεσεμιαμεταβλητήμεόνομαatoma: > atoma<-data.frame(sex=c("m","f"),age=c(21,22)) Μετησυνάρτησηdata.frameορίζουμεέναπλαίσιοδεδομένων.Στησυνάρτησηδίνουμεως ορίσματατιςμεταβλητέςπουθέλουμεναπεριέχειτοπλαίσιο,δηλαδήsex(φύλο)καιage (ηλικία).σεκάθεμεταβλητήδίνουμετιςαντίστοιχεςμετρήσεις,ωςακολουθίατιμών (χρησιμοποιώνταςτησυνάρτησηcπουείδαμεστοπρώτομέροςτωνοδηγιών). Ανθέλουμε(δενείναιυποχρεωτικό)μπορούμεναπροσθέσουμεετικέτεςστιςσειρέςτου πλαισίουγιανααναγνωρίζουμεονομαστικάταδεδομένα: > rownames(atoma)<-c("γιάννης","μαρία") Τώραμπορούμεναδούμεταπεριεχόμενατουπλαισίουδεδομένωνatoma: > atoma sex age Γιάννης M 21 Μαρία F 22 ΤοRμαςδίνει,σεμορφήπίνακα,όλαταδεδομένατουπλαισίου.Γιαναεξετάσουμετηδομή τουπλαισίουμπορούμεναχρησιμοποιήσουμετησυνάρτησηstr,ηοποίαμαςδίνει περιληπτικάτοείδοςτωνδεδομένωνκαιενδεικτικέςτιμέςγιακάθεστήλη(μεταβλητή): > str(atoma) 'data.frame': 2 obs. of 2 variables: $ sex: Factor w/ 2 levels "F","M": 2 1 $ age: num 21 22

Στηνπρώτησειράτηςαπόκρισης,ησυνάρτησηstrμαςενημερώνειότιτοatomaείναι πλαίσιοδεδομένων( data frame ),τοοποίοπεριέχειδύο«παρατηρήσεις» (obs.=observations)καιδύο«μεταβλητές».λέγοντας«παρατηρήσεις»αναφερόμαστεστις σειρέςτουπλαισίου,ενώλέγοντας«μεταβλητές»αναφερόμαστεστιςστήλες. Στιςεπόμενεςδύοσειρέςτηςαπόκρισηςδίνονταιοιπληροφορίεςπουαφορούνσεκαθεμιά μεταβλητήξεχωριστά: ΗπρώτημεταβλητήονομάζεταιsexκαιείναιτύπουFactor,δηλαδή«παράγοντας». Αυτό,στηνορολογίατουR,σημαίνειότιπρόκειταιγιακατηγορικήμεταβλητή.Περιλαμβάνει2 «επίπεδα»(levels),δηλαδήδύοκατηγορίες,οιοποίεςονομάζονται F και M (γυναίκες καιάντρες).το F αναφέρεταιπρώτοδιότιτοrχρησιμοποιείαπόμόνοτουαλφαβητική σειράγιατηναναφοράσεκατηγορίες.ησειράπεριγραφήςτηςμεταβλητήςsex ολοκληρώνεταιμεταπρώταστοιχείατηςστήλης,δηλαδήτοναριθμό2(αναφέρεταιστη δεύτερηκατηγορία, M )καιτοναριθμό1(πρώτηκατηγορία, F ).Αυτόμαςλέειότιηπρώτη σειράδεδομένωνείναιτύπου F καιηδεύτερητύπου M. Ηδεύτερημεταβλητήονομάζεταιageκαιείναιτύπουnum,δηλαδή«αριθμητική» (numeric).αυτό,στηνορολογίατουrσημαίνειότιπρόκειταιγιαποσοτικήμεταβλητή.δεν χρειάζονταιάλλεςδιευκρινίσεις,καθώςστιςποσοτικέςμεταβλητέςτανούμεραείναι αυτονόητα.ησειράολοκληρώνεταιμεταπρώταστοιχείατηςστήλης,δηλαδήτουςαριθμούς 21και22,οιοποίοιαντιστοιχούνστηνπρώτηκαιτηδεύτερησειράδεδομένων,αντίστοιχα. ΝαθυμάστεότιτακατηγορικάδεδομέναστοRείναιτύπουfactorενώταποσοτικά δεδομέναείναιτύπουnumeric. Όπωςβλέπουμεστηναπόκρισητηςσυνάρτησηςstr,πριναπόκάθεμεταβλητήεμφανίζεται έναδολλάριο($).τοσύμβολοτουδολλαρίουστοrχρησιμοποιείταιγιαναδηλώνουμε συγκεκριμένεςμεταβλητέςμέσασεπλαίσιαδεδομένων.έτσι,γιανααναφερθούμεστιςηλικίες (μεταβλητήage)πουβρίσκονταιμέσαστοπλαίσιοatomaγράφουμε > atoma$age [1] 21 22 ενώγιανααναφερθούμεστοφύλο(μεταβλητήsex)γράφουμε > atoma$sex [1] M F Levels: F M ΣτηνπερίπτωσητηςκατηγορικήςμεταβλητήςτοRμαςενημερώνεικαιγιατοσύνολοτων κατηγοριώνπουπεριλαμβάνειησυγκεκριμένημεταβλητή. Απομονώνονταςτιςμεταβλητέςμεαυτόντοντρόπο,μπορούμενατιςχειριστούμεωςκοινές ακολουθίες.γιαπαράδειγμα,μπορούμεναχρησιμοποιήσουμετιςσυναρτήσειςαπότοπρώτο μέροςτωνοδηγιώνγιαναυπολογίσουμετοάθροισμα,τοπλήθοςκλπ. > sum(atoma$age) [1] 43 > length(atoma$sex) [1] 2

Γιατηνεπεξεργασίαδεδομένωνσεπλαίσια,τοRμαςδίνειτησυνάρτησηfix,μετηνοποία μαςεμφανίζειέναειδικόπαράθυροστοοποίομπορούμενατροποποιήσουμεήνα προσθέσουμεστοιχείασεέναπλαίσιοδεδομένων. > fix(atoma) Όταντελειώσουμετηνπροσθήκηήεπεξεργασίατωνστοιχείων,κλείνουμετοειδικόπαράθυρο μεκλικστο (πάνωδεξιάγωνία)καιημεταβλητήatomaενημερώνεταιαυτόματα. Γραφικήπαρουσίασηδεδομένων ΤοRδιαθέτειπολλέςσυναρτήσειςγιατηνπαρουσίασηκαιλεπτομερειακήεξέτασηκαι ανάλυσητωνδεδομένωνμας.αςυποθέσουμεότιέχουμεπέντεμετρήσειςύψουςενόςατόμου: > alexh <- c( 1.85, 1.85, 1.81, 1.82, 1.83 ) Ημεταβλητήalexhπεριέχειμιαακολουθίαπέντεαριθμών.Μετησυνάρτησηtable («πίνακας»)μπορούμεναμετρήσουμεπόσεςφορέςεμφανίζεταικάθετιμή: > table(alexh) alexh 1.81 1.82 1.83 1.85 1 1 1 2 Αυτόςείναιέναςαπλόςπίνακαςσυχνοτήτων.Βλέπουμεότιητιμή1.85εμφανίζεταιδύοφορές ενώοιάλλεςτιμέςαπόμίαφορά.ητιμήπουεμφανίζεταιτιςπερισσότερεςφορέςονομάζεται «δεσπόζουσα»(mode).ανηκαλύτερητιμήέβγαινειμεψηφοφορία,ηδεσπόζουσαείναιεκείνη πουθακέρδιζελόγωπλειοψηφίας. Τηνπληροφορίααυτήμπορούμενατηδούμεκαιγραφικά,μετησυνάρτησηplot: > plot(table(alexh)) ΤοRανοίγειένανέοπαράθυρογιατηγραφικήαπεικόνιση,στοοποίοεμφανίζειτοεξής:

Εδώβλέπουμεέναραβδόγραμμαμετούψοςστονοριζόντιοάξονακαιτοπλήθοςτων αντίστοιχωνμετρήσεωνστονκατακόρυφο.κάθεμέτρησηεμφανίζεταισαμιαγραμμούλαπου φτάνεισεύψος1.0,ενώστούψος1.85,πουυπάρχουνδύομετρήσεις,εμφανίζονταιδύο γραμμούλεςημίαπάνωστηνάλλη,κάνονταςμαζίμιαμακρύτερηπουφτάνειστούψος2.0. Αυτόείναιέναδιάγραμμασυχνοτήτων,πουμαςλέειπόσοσυχνάεμφανίζεταικάθεαριθμός. Μπορούμενακαλλωπίσουμεκάπωςτηγραφικήαπεικόνιση,προσθέτονταςετικέτες: > plot(table(alexh),las=1,xlab="ύψος",ylab="αριθµός µετρήσεων") Ηπαράμετροςlasστρίβειτηναρίθμησηστονκατακόρυφοάξοναώστεναδιαβάζεταιόρθια, ενώοιδύοπαράμετροιlab(απότοlabel=ετικέτα)καθορίζουντιςετικέτεςστονοριζόντιοάξονα (μετοx)καιστονκατακόρυφοάξονα(μετοy).

ΓιαναδούμεγραφικάτηνκατανομήτωνμετρήσεωνστηνκλίμακατοRμαςδίνειτησυνάρτηση hist(histogram=ιστόγραμμα).τηνκατανομήαυτή,μεπερισσότερηαριθμητικήλεπτομέρεια αλλάχωρίςγραφικά,μπορούμεναδούμεμετησυνάρτησηstemπουπαράγειδιάγραμμα μίσχου φύλλων. Γιατοσχετικόπλήθοςτωνεπιμέρουςκατηγοριώνσεκατηγορικάδεδομένα,έχουμετη συνάρτησηtable,πουείδαμεπαραπάνωότιμαςδίνειτονπίνακακατανομής,καθώςκαιτη συνάρτησηpie,πουμαςδίνειγραφικάτηνίδιαπληροφορίαμεκυκλικόδιάγραμμα(piechart). Δοκιμάστετιςσυναρτήσειςαυτέςσταδικάσαςδεδομένα! Περίληψηδεδομένων Μιαπολύχρήσιμησυνάρτησηγιαγρήγορηεπισκόπησητωνδεδομένωνμαςείναιηπερίληψη: > summary(alexh) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.810 1.820 1.830 1.832 1.850 1.850 Τααποτελέσματατηςπερίληψηςπεριλαμβάνουντηνελάχιστη(Min.)καιμέγιστη(Max.) τιμή,τομέσοόρο(mean),καθώςκαιτρειςακόμαδείκτες.οπιοσημαντικόςείναιηδιάμεσος (Median),δηλαδήητιμήπουείναιμεγαλύτερηαπότιςμισέςμετρήσειςκαιμικρότερηαπότις άλλεςμισές.γιανατοκαταλάβουμεκαλύτερα,αςδούμετιςτιμέςμαςσεαύξουσασειρά: > sort(alexh) [1] 1.81 1.82 1.83 1.85 1.85 Ημικρότερητιμήείναι1.81(πρώτη)καιημεγαλύτερη1.85(τελευταία).Αφαιρώνταςδύοτιμές απόκάθεάκρημένειημεσαίαμέτρηση,πουείναι1.83.αυτήείναιηδιάμεσος. Ηελάχιστη,μέγιστη,μέση,καιδιάμεσοςτιμήυπολογίζονταιστοRαπευθείαςμετις συναρτήσειςmin, max, meanκαι median,αντίστοιχα. Ανκόψουμετοκάθεμισόστημέσημπορούμεναβρούμετηδιάμεσοτουκάθεμισού,που χωρίζουντοπρώτοτέταρτοκαιτοτελευταίοτέταρτοτωνδεδομένων.τασημείααυτά ονομάζονταιτεταρτημόρια:τοπρώτοτεταρτημόριο(1stquartile)χωρίζειτοχαμηλότερο25%. Τοδεύτεροτεταρτημόριοείναιηδιάμεσοςκαιχωρίζειτο50%.Τοτρίτοτεταρτημόριο(3rd quartile)χωρίζειτουψηλότερο25%.αυτέςείναιοιεπιπλέοντιμέςπουμαςδίνειηπερίληψη τουr.βέβαιαγιατόσολίγεςτιμέςπουέχουμεεδώαυτόδενέχειπολύνόημα,είναιόμωςπάρα πολύχρήσιμοσεμεταβλητέςμεδεκάδεςήεκατοντάδεςμετρήσεις. Ηπερίληψηεφαρμόζεταικαισεολόκληραπλαίσιαδεδομένων.Στηνπερίπτωσηαυτήμαςδίνει πληροφορίεςγιαόλεςτιςμεταβλητέςπουπεριλαμβάνονταιστοπλαίσιοδεδομένωνκαι προσαρμόζεταιαυτόματασεκάθεμεταβλητήανείναικατηγορικήήποσοτική.παράδειγμα: > summary(atoma) sex age F:1 Min. :21.00 M:1 1st Qu.:21.25 Median :21.50 Mean :21.50 3rd Qu.:21.75 Max. :22.00

Χρήσηεξωτερικώναρχείων ΤοRμπορείναδιαβάσειδεδομέναπουέχουμεαποθηκευμένασεαρχείαστοδίσκοτου υπολογιστήμας.μετοrμπορούμεεπίσηςνααποθηκεύσουμεδεδομένα,αποτελέσματα επεξεργασίας,ήκαιτιςεντολέςκαισυναρτήσειςπουχρησιμοποιήσαμεγιατηνανάλυσήμας. Γιαναμπορείναχρησιμοποιηθείκάποιοεξωτερικόαρχείοπρέπειπροηγουμένωςνα υποδείξουμεστοrσεποιοφάκελοβρίσκονταιτααρχείαμας.ηεπιλογήφακέλουγίνεταιμέσα απότονκατάλογοεπιλογώνfile Changedir (dir=directory,δηλαδήκατάλογοςαρχείων). ΜετηνεπιλογήαυτήτοRμαςεμφανίζειτογνωστόπαράθυροεπιλογήςφακέλουτωνwindows. Εντοπίζουμεκαιεπιλέγουμετηντοποθεσίαόπουβρίσκονταιτααρχείαμας. Αφούεπιλέξουμετησωστήτοποθεσία,μπορούμεναφορτώσουμεέναπλαίσιοδεδομένων απευθείαςαπότοδίσκομετησυνάρτησηread.table,αναθέτονταςτοπεριεχόμενο απευθείαςσεμιαμεταβλητή.π.χ.,γιαναχρησιμοποιήσουμετακατηγορικάδεδομένατου3 ου κεφαλαίουτουβιβλίου,τααναθέτουμεστημεταβλητήch3ωςεξής: > read.table("chapter3_1.rdata") -> ch31 Προσοχή,ναμηνξεχνάμετηντελίτσαμέσαστοόνοματηςσυνάρτησης,χωρίςκενά! Ησυνάρτησηstrμαςδείχνειτοαποτέλεσματηςανάθεσης: > str(ch31) 'data.frame': 264 obs. of 1 variable: $ education: Factor w/ 5 levels "Άλλο","Λύκειο",..: 5 5 5 5 5 5 5 5 5 5... Πρόκειταιγιαέναπλαίσιοδεδομένωνμεμιαμοναδικήκατηγορικήμεταβλητήμεόνομα educationηοποίαπεριέχειδεδομέναπέντεκατηγοριών.ταστοιχείατωνπρώτωνσειρών ανήκουνόλαστην5 η κατηγορία. Αργότεραθαδούμεπώςμπορούμενααποθηκεύσουμεδικάμαςδεδομένακαθώςκαινα χρησιμοποιήσουμεαρχείααναλύσεωνκαιεξωτερικάπακέτασυναρτήσεων. ΑθανάσιοςΠρωτόπαπας Μάρτιος2012