Σχολή Διοίκησης και Οικονομίας (ΣΔΟ) Τμήμα Λογιστικής και Χρηματοοικονομικής Διδάσκων: Δρ. Γκόγκος Χρήστος Μάθημα: Πληροφορική ΙI (εργαστήριο) Ακαδημαϊκό έτος 2013-2014 εαρινό εξάμηνο ΟΝΟΜΑΤΕΠΩΝΥΜΟ : ΑΡΙΘΜΟΣ ΜΗΤΡΩΟΥ: Τα γραφήματα που αναφέρονται ως ΕΙΚ1, ΕΙΚ2, ΕΙΚ4, ΕΙΚ6 και ΕΙΚ8 θα πρέπει να αποθηκευτούν με τα προαναφερθέντα ονόματα ως αρχεία.png σε ένα φάκελο με όνομα «PL2_ERG4_Χ» όπου Χ θα είναι ο αριθμός μητρώου σας. Κάθε αρχείο θα πρέπει να έχει ως τίτλο γραφήματος το όνομα και τον αριθμό μητρώου σας (βλ. παράμετρο main). Ο φάκελος μαζί με το φύλλο εργασίας του εργαστηρίου θα πρέπει να παραδοθούν προς βαθμολόγηση. Αντικείμενο: Εισαγωγή στο στατιστικό πακέτο R και στις δυνατότητές του για δημιουργία γραφημάτων. Χρήση του λογισμικού RStudio. [Α Μέρος] Α1. Απλές πράξεις και μεταβλητές A1.1 Να εκτελεστούν οι ακόλουθες εντολές και να καταγραφούν τα αποτελέσματα: Έκφραση στην R Αποτέλεσμα 5.4 ^ 5 4591.65 x <- 5.5 692.12 y <- 8.8 (x +y)*x*y z <- 10 22026.47 exp(z) b <- T TRUE print(b) pi 3.141593 Α2. Διανύσματα A2.1 Δημιουργήστε ένα διάνυσμα με όνομα vath που θα περιέχει υποθετικούς βαθμούς 5 σπουδαστών όπως παρακάτω: vath<-c(5.5, 4, 3.5, 8, 10) A2.2 Αποδώστε ονόματα στις τιμές του διανύσματος names(vath)<-c("μαρια", "ΠΕΤΡΟΣ", "ΝΙΚΟΣ", "ΚΩΣΤΑΣ", "ΝΙΚΗ") Α2.3 Να εκτελεστούν οι ακόλουθες εντολές και να καταγραφούν τα αποτελέσματα: Έκφραση στο R Αποτέλεσμα vath[5] ΝΙΚΗ 10 vath >= 5 ΜΑΡΙΑ ΠΕΤΡΟΣ ΝΙΚΟΣ ΚΩΣΤΑΣ ΝΙΚΗ TRUE FALSE FALSE TRUE TRUE vath["νικοσ"] ΝΙΚΟΣ 3.5 1
vath[vath < 5] ΠΕΤΡΟΣ ΝΙΚΟΣ 4.0 3.5 Α2.4 Δημιουργήστε ένα διάνυσμα με όνομα v1 με όλα τα πολλαπλάσια του 5 από το 100 μέχρι το 500. v1 <- seq(100,500,5) Α2.5 Δημιουργήστε ένα διάνυσμα με όνομα v2 που να περιέχει όλους τους άρτιους αριθμούς από το 100 μέχρι το 0. v2 <- seq(100,0, -2) Α2.6 Δημιουργήστε ένα διάνυσμα 50 τιμών με όνομα v3 που να περιέχει τυχαίες τιμές που θα ακολουθούν την τυπική κανονική κατανομή (μέση τιμή μ=0, τυπική απόκλιση σ=1). Για να υπάρχει επαναληπτικότητα στα αποτελέσματα αρχικοποιήστε την συνάρτηση παραγωγής τυχαίων τιμών με seed την τιμή 2014. set.seed(2014) v3 <- rnorm(50) Α2.7 Ποιος είναι ο ρόλος της εντολής data.entry; Τι θα συμβεί αν εισάγετε την εντολή data.entry(vath); Εμφανίζει ένα παράθυρο που μοιάζει με υπολογιστικό φύλλο για την εισαγωγή και ενημέρωση δεδομένων. Α3. Πίνακες A3.1 Δημιουργήστε ένα πίνακα 2 γραμμών και 3 στηλών με όνομα m1 που να περιέχει στην 1 η γραμμή τις τιμές 10, 20 και 5 και στην δεύτερη γραμμή τις τιμές 50, 5 και 40. m1 <- matrix(data=c(10,20,5, 50,5,40), nrow=2, ncol=3, byrow=t) A3.2 Δημιουργήστε ένα πίνακα 5 γραμμών και 10 στηλών με όνομα m2 που να περιέχει τους ακέραιους αριθμούς από το 1 μέχρι το 50 τοποθετημένους σε αύξουσα σειρά κατά στήλες. m2 <- matrix(data=1:50, nrow=5, ncol=10, byrow=f) Α3.3 Να εκτελεστούν οι ακόλουθες εντολές και να καταγραφούν τα αποτελέσματα: Έκφραση στο R Αποτέλεσμα m1[1,] 10 20 5 m1[,1] 10 50 rowmeans(m1) 11.66667 31.66667 colmeans(m1) 30.0 12.5 22.5 diag(m2) 1 7 13 19 25 Α4. Πλαίσια δεδομένων (data frames) Α4.1 Δημιουργήστε ένα πλαίσιο δεδομένων με όνομα df1 που να περιέχει τα ονόματα 4 πόλεων και τους πληθυσμούς τους ως στήλες. df1 <- data.frame(city=c("πρεβεζα", "ΑΡΤΑ", "ΙΩΑΝΝΙΝΑ", "ΗΓΟΥΜΕΝΙΤΣΑ"), population=c(19042, 21895, 65574, 9145)) Α4.2 Το R έχει φορτωμένα διάφορα σύνολα δεδομένων ως παραδείγματα. Ένα από αυτά είναι το mtcars πλαίσιο δεδομένων που περιέχει χαρακτηριστικά αυτοκινήτων από το περιοδικό του 1974 Motor Trend US. Η εντολή head επιστρέφει τις 4 πρώτες γραμμές των δεδομένων. head(mtcars) Α5. Απλοί στατιστικοί υπολογισμοί με το R 2
Να εκτελεστούν οι ακόλουθες εντολές και να καταγραφούν τα αποτελέσματα: Ενέργεια Έκφραση στο R Αποτέλεσμα Στατιστική σύνοψη δεδομένων summary(vath) Άθροισμα sum(vath) 31 Τυπική απόκλιση sd(vath) 2.752272 Εύρος τιμών range(vath) 3.5 10.0 Μέσος όρος mean(df1$population) 28194 [Β Μέρος] Min. 1st Qu. Median Mean 3rd Qu. Max. 3.5 4.0 5.5 6.2 8.0 10.0 B1. Γραφήματα ράβδων σημείων και γραμμών B1.1 Για το διάνυσμα vath που ορίστηκε στο Α2 κατασκευάστε ένα γράφημα ράβδων, ένα γράφημα σημείων και ένα γράφημα γραμμής χρησιμοποιώντας τις ακόλουθες εντολές. barplot(vath, ylab="βαθμοσ", col="green", main="βαθµοί σπουδαστών") plot(vath, type="p", pch=2) plot(vath, type="l", lwd=3) ΕΙΚ1 ΕΙΚ2 ΕΙΚ3 Β1.2 Σχεδιάστε ένα γράφημα πίτας στις πωλήσεις ανά περιοχή για τα ακόλουθα δεδομένα Πρέβεζα = 10, Ιωάννινα =20, Άρτα =15, Ηγουμενίτσα =5. sales <- c(10,20, 15,5) names(sales)<-c("πρέβεζα", "Ιωάννινα", "Άρτα", "Ηγουµενίτσα") pie(sales, col=c("cyan", "green", "red", "purple")) ΕΙΚ4 3
B1.3 Ζητήστε βοήθεια για την εντολή pie εισάγοντας την εντολή?pie. Στο τμήμα «Note» υπάρχει ένα σχόλιο σχετικά με τα γραφήματα πίτας. Περιγράψτε το με δικά σας λόγια στον ακόλουθο χώρο. Β2. Γραφήματα boxplots B2.1 Για το διάνυσμα v3 που ορίστηκε στο Α2.6 να κατασκευαστεί ένα διάγραμμα boxplot. boxplot(v3) ΕΙΚ5 Β2.2 Για το πλαίσιο δεδομένων mtcars να κατασκευαστεί διάγραμμα boxplot της κατανάλωσης ανά γαλόνι (mpg) σε σχέση με τους κυλίνδρους (cyl) των αυτοκινήτων. boxplot(mpg~cyl, data=mtcars, xlab="αριθµός κυλίνδρων", ylab="κατανάλωση mpg") ΕΙΚ6 B3. Γραφικές παραστάσεις συναρτήσεων Β3.1 Σχεδιάστε την γραφική παράσταση της συνάρτησης f(x)=x 2-3x+5 στο διάστημα τιμών [-5, 5]. curve(x^2-3*x+5, -5, 5) Τα διαγράμματα boxplots είναι γνωστά και ως διαγράμματα Box and Whisker. 4
x^2-3 * x + 5 10 20 30 40-4 -2 0 2 4 ΕΙΚ7 Β3.2 Σχεδιάστε την γραφική παράσταση της συνάρτησης f(x)=ημ(x) στο διάστημα τιμών [-2π, 2π]. curve(sin(x), -2*pi, 2*pi) legend("topright", "ηµίτονο", lwd=1) grid() x B3.3 Ποιος είναι ο ρόλος της συνάρτησης legend; ΕΙΚ8 B4. Πολλαπλά γραφήματα B4.1 Σχεδιάστε ένα πολλαπλό γράφημα με 2 σειρές και 2 στήλες που να εμφανίζει για το πλαίσιο δεδομένων mtcars τα εξής: Ιστόγραμμα για την ισχύ (hp) των αυτοκινήτων Γράφημα ράβδων για την ισχύ (hp) των αυτοκινήτων Γράφημα γραμμής για την ισχύ (hp) σε σχέση με το βάρος (wt) των αυτοκινήτων. Γράφημα boxplot για την κατανάλωση (mpg) των αυτοκινήτων. par(mfrow=c(2,2)) hist(mtcars$hp, breaks=c(seq(50,350,l=6))) 5
barplot(mtcars$hp) plot(mtcars$wt~mtcars$hp, pch=3) boxplot(mtcars$mpg) ΕΙΚ9 B4.2 Ποιος είναι ο ρόλος της παραμέτρου breaks στα γραφήματα τύπου ιστογράμματος; Β4.3 Ποιος είναι ο ρόλος της παραμέτρου pch στα γραφήματα σημείων; Βαθμός Α μέρος (50%) Β μέρος (50%) 6