R & R- Studio. Πασχάλης Θρήσκος PhD Λάρισα

Σχετικά έγγραφα
Γνωριμία με τον προγραμματισμό μέσω της γλώσσας R Στοιχεία Περιγραφικής Στατιστικής

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

= p 20 1 p p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΟΝΟΜΑΤΕΠΩΝΥΜΟ : Αντικείμενο: Εισαγωγή στο στατιστικό πακέτο R και στις δυνατότητές του για δημιουργία γραφημάτων. Χρήση του λογισμικού RStudio.

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΤΟΥ ΔΙΔΑΚΤΙΚΟΥ ΕΡΓΟΥ ΤΩΝ ΥΠΟΧΡΕΩΤΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΧΕΙΜΕΡΙΝΟΥ ΕΞΑΜΗΝΟΥ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

Εισαγωγή στη Στατιστική

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o


ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

(i) Περιγραφική ανάλυση των μεταβλητών PRICE

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

CTEC-153: ΥΤΛΛΑ ΕΡΓΑΙΑ

Εισαγωγή στη Matlab Εισαγωγή στην Αριθμητική Ανάλυση Διδάσκων: Γεώργιος Ακρίβης Βοηθός: Δημήτριος Ζαβαντής

1. Κλικ στην καρτέλα Insert 2. Tables 3. Κλικ Table 4. Σύρουμε το δείκτη του ποντικιού και επιλέγουμε τον επιθυμητό αριθμό γραμμών και στηλών

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Κεφάλαιο 4: Συνοπτική Στατιστική και Οπτικοποίηση

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Βιοστατιστική ΒΙΟ-309

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Εισαγωγή στη Βιοπληροφορική

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Modern Regression HW #8 Solutions

Στατιστική Επιχειρήσεων Ι

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Βιοστατιστική ΒΙΟ-309

Ενότητα 14 Γραφικές Παραστάσεις

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1)

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Η ψηφιακή τεχνολογία στην ερευνητική δραστηριότητα Θέματα κουίζ. Υψηλάντης Γεώργιος, Βαβούρας Θεόδωρος Τμήμα Ιταλικής Γλώσσας & Φιλολογίας

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δρ. Π. Νικολαΐδου

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 2 ΔΙΕΥΘΥΝΣΗ ΔΕΥΤΕΡΟΒΑΘΜΙΑΣ ΕΚΠΑΙΔΕΥΣΗΣ ΝΟΜΟΥ ΧΑΝΙΩΝ ΣΧΟΛΙΚΟ ΕΤΟΣ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕ ΑΡΙΘΜΗΤΙΚΕΣ ΚΑΙ ΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΥΣ

Βιοστατιστική ΒΙΟ-309

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Περιγραφική Στατιστική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Είδη Μεταβλητών. κλίµακα µέτρησης

Παράδειγμα. Χρονολογικά δεδομένα. Οι πωλήσεις μιας εταιρείας ανά έτος για το διάστημα (σε χιλιάδες $)

Συστήματα Αναμονής (Queuing Systems)

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Περιγραφική Στατιστική

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Ιωάννης Ντζούφρας. Ενότητα 2 ιαγραμματική Απεικόνιση. Ανάλυση εδομένων ιαφάνεια ιαγραμματική Απεικόνιση Περιεχόμενα

Εισαγωγή στη γλώσσα προγραμματισμού C++

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Ηλεκτρονικοί Υπολογιστές I

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΜΕ ΕXCEL

Εφαρμοσμένη Στατιστική

Μάθηµα 3 ο. Περιγραφική Στατιστική

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Υπολογιστικά Φύλλα Microsoft Excel 2016 Level I

Ηλεκτρονικοί Υπολογιστές IV

Εργαστήριο Μαθηματικής Ανάλυσης Ι. Εισαγωγή στη Matlab Βασικές Συναρτήσεις-Γραφικές παραστάσεις. Πανεπιστήμιο Θεσσαλίας. Σχολή Θετικών Επιστημών

Ενότητα 2: Μέθοδοι δειγματοληψίας & Εισαγωγή στην Περιγραφική Στατιστική

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

ΕΞΕΤΑΣΤΕΑ ΥΛΗ (SYLLABUS) INTERMEDIATE

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Περιγραφική Στατιστική

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

Γενικό πλαίσιο. Απαιτήσεις Μοντέλο εδοµένων. MinusXLRequirements. Απόστολος Ζάρρας

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

Σε αυτό το κεφάλαιο ϑα αναπτυχθούν όλες οι πιο πάνω µορφές αντικειµένων, εκτός από τις χρονοσειρές οι οποίες ϑα αναλυθούν σε επόµενο κεφάλαιο.

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Γνωρίστε το Excel 2007

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Εφαρμοσμένη Στατιστική

help.start() help.search("regression")).

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Standard Template Library (STL) C++ library

Transcript:

R & R- Studio Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr

Εισαγωγή στο R Διαχείριση Δεδομένων R Project Περιγραφή του περιβάλλοντος του GNU προγράμματος R Project for Statistical Analysis Γραφήματα Περιγραφική Στατιστική

Το R είναι ελεύθερα διαθέσιμο στην ιστοσελίδα http://www.r-project.org/ Υπάρχουν δεκάδες βιβλιοθήκες στην ιστοσελίδα http://cran.r-project.org/. Πάνω από 4300!! Διαθέτει γλώσσα προγραμματισμού Διαθέτει πολλά γραφικά περιβάλλοντα Εύκολος χειρισμός στατιστικών μοντέλων Πλούσια βιβλιογραφία (http://www.r-project.org/doc/bib/rbooks.html) De facto εργαλείο στατιστικών αναλύσεων σε ακαδημαϊκό επίπεδο Μεγάλη βάση χρηστών

Μετά την εγκατάσταση R Studio

Διαχείριση πακέτων Διαχείριση κώδικα

Κειμενογράφος Εργαλεία διαχείρισης δεδομένων Εργαλεία διαχείρισης πακέτων Αποτελέσματα

Βασικές έννοιες Συνεδρίες (sessions) Workspace Βοηθήματα Προγραμματισμός (εργαλεία) Βιβλιοθήκες (εγκατάσταση, ενεργοποίηση) Data editor

Εισαγωγή στο R Διαχείριση Δεδομένων Δεδομένα στο R Στην ενότητα αυτή θα αναφερθούμε στους διαφόρους τύπους δεδομένων του R. Επίσης θα δούμε πως διαχειριζόμαστε δεδομένα όπως για παράδειγμα εισαγωγή, ανάγνωση αρχείων, μετατροπή, αποθήκευση Γραφήματα Περιγραφική Στατιστική

Δεδομένα Το R υποστηρίζει τους εξής τύπους δεδομένων : βασικούς τύπους όπως χαρακτήρες, αριθμούς διανύσμα (vector) πίνακες (matrix) πίνακες πολλών διάστασης (array) λίστες (list) διακριτούς (factor) σύνολα δεδομένων (data frame). Το R υποστηρίζει τους εξής τελεστές αριθμητικών πράξεων : Άθροισμα : (+) πχ 1+2 Αφαίρεση : (-) πχ 4.5-2.8 Πολ/σμός : (*) πχ 2*pi Διαίρεση : (/) πχ 3/4 Ανύψωση σε δύναμη πχ pi*r^2

Δεδομένα Το R υποστηρίζει τους εξής λογικούς τελεστές : μικρότερο: < μικρότερο ή ίσο: <= μεγαλύτερο: > μεγαλύτερο ή ίσο: >= ισότητα : = ανισότητα:!= σύζευξη: x y διάδευξη: x&y αληθής πρόταση istrue(x)

Βασικές έντολές read.table Ανάγνωση αρχείων από το σύστημα αρχείων write.table Εγγραφή αρχείων στο σύστημα αρχείων file.choose Επιλογή αρχείου με τη βοήθεια πλαισίου διαλόγου scan Ανάγνωση δεδομένων από την οθόνη data.frame Δημιουργία ενός πλαισίου δεδομένων (data set) fix Αλλαγή μιας μεταβλητής με τη χρήση διεπαφής subset Επιλογή δεδομένων από ένα data frame na.omit Διαγραφή γραμμών σε data.frame, στις οποίες υπάρχουν missing values merge Σύμπτυξη δύο data sets στη βάση κοινού κλειδιού αναφοράς cbind Προσθήκη νέων στηλών σε data.frame rbind Προσθήκη νέων γραμμών σε data.frame cut Μετατροπή μιας συνεχούς μεταβλήτή σε διακριτή sort Ταξινόμηση ενός διανύσματος apply Εφαρμογή υπολογμών σε μέρος δείγματος

Εισαγωγή στο R Διαχείριση Δεδομένων Γραφήματα στο R Στην ενότητα αυτή θα αναφερθούμε στους διαφόρους τύπους γραφημάτων και στις γραφικές δυνατότητες του R Γραφήματα Περιγραφική Στατιστική

Βασικές εντολές plot Γράφημα δύο μεταβλητών hist Ιστόγραμμα pie Κυκλικό γράφημα boxplot Θηκόγραμμα qqnorm Q-Q γράφημα barplot Ραβδόγραμμα contour Περιγραμόγραμμα pairs Γράφημα διάδων legend Μαρκίζα title Τίτλος γραφήματος par Διαχείριση παραμέτρων γραφήματος

Κοινά ορίσματα γραφικών εντολών Ιστοχώρος για επιλογή χρωμάτων: http://research.stowersinstitute.org/efg/r/color/chart/co lorchart.pdf

Πολλά γραφήματα στο ίδιο γραφικό Για να σχεδιάσουμε 6 γραφήματα σε 2 γραμμές x 3 στήλες, κατά γραμμή: par(mfrow=c(2,3)) # Σχεδίαση των έξι γραφημάτων 1 2 3 layout(matrix(data=1:6, nrow=2, ncol=3, byrow=true)) # Σχεδίαση των έξι γραφημάτων 4 5 6

Κοινά ορίσματα γραφικών εντολών lty τύπος γραμμής lwd πάχος γραμμής pch χαρακτήρας γραφήματος font γραμματοσειρά cex μέγεθος γραμματοσειράς las κατεύθυνση (άξονες γραφημάτων) tck Tick mark ( άξονες ) col Χρώμα γραφήματος bg Χρώμα φόντου adj στοίχιση κειμένου par Διαχείριση παραμέτρων γραφήματος

Ιστόγραμμα Το ιστόγραμμα μας δίνει οπτικά πληροφορία για Τη διάμεσο και τη μέση τιμή Τη μεταβλητότητα Την κατανομή Υπάρχουν διάφορες μέθοδοι που προτείνουν τον αριθμό διαστημάτων όπως Sturges Scott Friedman-Diaconis

Ιστόγραμμα hist(x, breaks = "Sturges", freq = NULL, probability =!freq, include.lowest = TRUE, right = TRUE, density = NULL, angle = 45, col = NULL, border = NULL, main = paste("histogram of", xname), xlim = range(breaks), ylim = NULL, xlab = xname, ylab, axes = TRUE, plot = TRUE, labels = FALSE, nclass = NULL, warn.unused = TRUE,...)

Ραβδόγραμμα Με το ραβδόγραμμα δίνουμε οπτική πληροφορία για : Τα τεταρτημόρια Q 1,Q 2,Q 3 Ακραίες τιμές. Βρίσκονται συνήθως σε απόσταση 1.5 φορές μεγαλύτερη του μήκους της διαφοράς IQR=Q 3 -Q 1

Ραβδόγραμμα boxplot(formula, data = NULL,..., subset, na.action = NULL) ## Default S3 method: boxplot(x,..., range = 1.5, width = NULL, varwidth = FALSE, notch = FALSE, outline = TRUE, names, plot = TRUE, border = par("fg"), col = NULL, log = "", pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL)

Q-Q γράφημα Γράφημα των ποσοστημορίων ενός δείγματος σε σχέση με τα θεωρητικά ποσοστημόρια της κατανομής του πληθυσμού Αν το δείγμα ακολουθεί τη θεωρητική κατανομή, τότε το γράφημα είναι η διαγώνιος

Q-Q γράφημα boxplot(formula, data = NULL,..., subset, na.action = NULL) ## Default S3 method: boxplot(x,..., range = 1.5, width = NULL, varwidth = FALSE, notch = FALSE, outline = TRUE, names, plot = TRUE, border = par("fg"), col = NULL, log = "", pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL)

Εισαγωγή στο R Διαχείριση Δεδομένων Βασικά Μεγέθη Στην ενότητα αυτή θα αναφερθούμε στον υπολογισμό διαφόρων περιγραφικών μεγεθών ενός δείγματος στο R Γραφήματα Περιγραφική Στατιστική

Βασικές εντολές summary υπολογισμός περιγραφικών μεγεθών mean μέση τιμή std τυπική απόκλιση cor συντελεστής συσχέτισης cov συντελεστής συγγραμικότητας stat.desc υπολογισμός διαφόρων περιγραφικών μεγεθών IQR δεκατημόρια min υπολογισμός μικρότερη τιμή max υπολογισμός μεγαλύτερης τιμή table πίνακας συχνοτήτων prop.table πίνακας αναλογιών margin.table υπολογισμός μεγεθών για στήλη/γραμμή πίνακα xtabs πίνακας συχνοτήτων με πολλές δυνατότητες

Ευχαριστώ