Σηµερινή ατζέντα µαθήµατος... Προηγούµενα αναφερθήκαµε. Σήµερα θα συνεχίσουµε µε τις δοµές τους

Σχετικά έγγραφα
Σηµερινή ατζέντα µαθήµατος... Προηγούµενα αναφερθήκαµε. Σήµερα θα συνεχίσουµε µε τις δοµές τους

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

FORTRAN & Αντικειμενοστραφής Προγραμματισμός ΣΝΜΜ 2017

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

Σε αυτό το κεφάλαιο ϑα αναπτυχθούν όλες οι πιο πάνω µορφές αντικειµένων, εκτός από τις χρονοσειρές οι οποίες ϑα αναλυθούν σε επόµενο κεφάλαιο.

Εισαγωγή στη Βιοπληροφορική

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Βάσεις Δεδομένων (4 ο εξάμηνο) Εργαστήριο MySQL #2

Reminders: linear functions

2 Composition. Invertible Mappings

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Σημερινή ατζέντα μαθήματος... εσμευμένες λέξεις στο R

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 2008

Μορφοποίηση υπό όρους : Μορφή > Μορφοποίηση υπό όρους/γραμμές δεδομένων/μορφοποίηση μόο των κελιών που περιέχουν/

Εισαγωγή στην Γλώσσα Προγραμματισμού Python. 12/10/16 1

Εισαγωγή στη Fortran. Μάθημα 1 ο. Ελευθερία Λιούκα

(C) 2010 Pearson Education, Inc. All rights reserved.

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

Προγραμματισμός και Χρήση Ηλεκτρονικών Υπολογιστών - Βασικά Εργαλεία Λογισμικού

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006

Εργαστήριο Σημασιολογικού Ιστού

Εισαγωγή στη Fortran. Μάθημα 3 ο. Ελευθερία Λιούκα

ANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =?

ΕΙΣΑΓΩΓΗ ΣΤΗ ΧΡΗΣΗ ΤΟΥ ΣΤΑΤΙΣΤΙΚΟΥ ΠΑΚΕΤΟΥ MINITAB 12.0

Assalamu `alaikum wr. wb.

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3

Ενότητα 3: Τα δεδομένα στο Web. (και η σημασιολογία τους semantics )

Εισαγωγή στο MATLAB. Κολοβού Αθανασία, ΕΔΙΠ,

Matrices and Determinants

Partial Differential Equations in Biology The boundary element method. March 26, 2013

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

ΑΚΑ ΗΜΙΑ ΕΜΠΟΡΙΚΟΥ ΝΑΥΤΙΚΟΥ ΜΑΚΕ ΟΝΙΑΣ ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

Instruction Execution Times

ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL

Εργαστήριο Σημασιολογικού Ιστού

Σύντοµο Εγχειρίδιο Χρήσης. του Λογισµικού Στατιστικής Επεξεργασίας. SPSS for Windows v. 8.0

HY150a Φροντιστήριο 3 24/11/2017

FORTRAN & Αντικειμενοστραφής Προγραμματισμός ΣΝΜΜ 2017

Partial Trace and Partial Transpose

DESIGN OF MACHINERY SOLUTION MANUAL h in h 4 0.

PARTIAL NOTES for 6.1 Trigonometric Identities

C.S. 430 Assignment 6, Sample Solutions

Numerical Analysis FMN011

EE512: Error Control Coding

Μονοδιάστατοι πίνακες Πολυδιάστατοι πίνακες Μέθοδοι Μέθοδοι Recursive Overloading

Γιάννης Σαμωνάκης. 1 ο ΣΧΟΛΕΙΟ ΚΩΔΙΚΑ «Βασικά Θέματα Προγραμματισμού στην Ανάπτυξη Δυναμικών Διαδικτυακών Εφαρμογών» (Part 4 - PHP)

Other Test Constructions: Likelihood Ratio & Bayes Tests

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δρ. Π. Νικολαΐδου

Σκοπός του μαθήματος

Notes on the Open Economy

ΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός. Εργαστήριο Αρ. 2

6.1. Dirac Equation. Hamiltonian. Dirac Eq.

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

Special edition of the Technical Chamber of Greece on Video Conference Services on the Internet, 2000 NUTWBCAM

derivation of the Laplacian from rectangular to spherical coordinates

The ε-pseudospectrum of a Matrix

Σχήµα 6.1: Εισαγωγή της εντολής Read From Spreadsheet File στο Block Diagram.

ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ

Μετατροπή χαρακτήρων ASCII σε αριθμό (atoi) & διάβασμα, και αποθήκευση του περιεχομένου του στη μνήμη. (Διάλεξη. Πανεπιστήμιο Κύπρου

ΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Χειµερινό Εξάµηνο ΔΙΑΛΕΞΗ 3: Αλγοριθµική Ελαχιστοποίηση (Quine-McCluskey, tabular method)

Σημασιολογικός Ιστός (Semantic Web) - XML

Εργαστήριο Java. Διδάσκουσα: Εργαστηριακοί Συνεργάτες:

Αντικειμενοστρεφής Προγραμματισμός

Homework 3 Solutions

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

Srednicki Chapter 55

The Simply Typed Lambda Calculus

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΝΑΥΤΙΛΙΑΚΩΝ ΣΠΟΥΔΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΝΑΥΤΙΛΙΑ

Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in

Chapter 6: Systems of Linear Differential. be continuous functions on the interval

TMA4115 Matematikk 3

Week. 6: Java Collections

Matrices and vectors. Matrix and vector. a 11 a 12 a 1n a 21 a 22 a 2n A = b 1 b 2. b m. R m n, b = = ( a ij. a m1 a m2 a mn. def

Συµβολοσειρές - Strings

Ακεραιότητα και Ασφάλεια Μέρος 1 Σχεδιασμός Βάσεων Δεδομένων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Προγραμματισμός Η/Υ

Section 8.3 Trigonometric Equations

Κεφάλαιο , 3.2: Συναρτήσεις II. ( ιάλεξη 12) ιδάσκων: ηµήτρης Ζεϊναλιπούρ

Στόχοι και αντικείμενο ενότητας. Εκφράσεις. Η έννοια του τελεστή. #2.. Εισαγωγή στη C (Μέρος Δεύτερο) Η έννοια του Τελεστή

ΕΠΛ 012. JavaScripts

Ορισµοί Σχεσιακού Μοντέλου και Τροποποιήσεις Σχέσεων σε SQL

Οπτικοποίηση με Prefuse. Δομή / Βασικά Χαρακτηριστικά / Παράδειγμα

30 / 3 /

Επιβλέπουσα Καθηγήτρια: ΣΟΦΙΑ ΑΡΑΒΟΥ ΠΑΠΑΔΑΤΟΥ

Elements of Information Theory

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

Trigonometric Formula Sheet

Ει αγωγή η Fortran.

D Alembert s Solution to the Wave Equation

Calculating the propagation delay of coaxial cable

FORTRAN & Αντικειμενοστραφής Προγραμματισμός ΣΝΜΜ 2017

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω

Transcript:

Σηµερινή ατζέντα µαθήµατος... Χρήσεις µονοδιάστατων και πολυδιάστατων ( 2) αντικειµένων στην R Χειρισµός δεδοµένων στο λογισµικό R Προηγούµενα αναφερθήκαµε στους τύπους δεδοµένων στην R Basic Data Types: Integer (ακέραιες τιµές) Double (πραγµατικοί δεκαδικοί αριθµοί) Logical (λογικές τιµές) Character (χαρακτήρες) Complex (µιγαδικοί αριθµοί) Raw (Bytes) Vectors Matrices Arrays Dataframes Factors Εισαγωγή δεδοµένων από αρχεία Σήµερα θα συνεχίσουµε µε τις δοµές τους Vectors: atomic vectors functions mode(), typeof(), storage.mode() implicit coercion principles explicit coercion functions vectorization recycling rules Arrays and Matrices attributes atomic arrays Lists Storing objects in a list Lists as a special type of Non-Atomic vector Data Frames & Factors Functions to inspect contents and attributes of data frames and factors

Πρόσβαση στα επιµέρους στοιχεία ενός διανύσµατος, πίνακα, συστοιχίας,

Data elements: ιανύσµατα (vectors) Coercion µετατροπή από έναν τύπο σε έναν άλλον συνήθως γίνεται αυτόµατα Types from least to most flexible: logical, integer, double, character

lapply(x, lapply(x lapply(x,, FUN, FUN,...)...) Data elements: Factors / Παράγοντες A factor stores the nominal values as a vector of integers in the range [ 1... k ] (where k is the number of unique values in the nominal variable), and an internal vector of character strings (the original values) mapped to these integers # variable rating with 20 old" entries and 30 new" entries > rating <- c(rep( old",20), rep( new", 30)) > rating <- factor(rating) # stores rating as 30 1s and 20 2s and associates 1=new, 2=old internally (alphabetically). R now treats rating as a nominal variable

Data elements: Factors / Παράγοντες Data elements: Factors / Παράγοντες Πλεονεκτήµατα για τη µετατροπή κατηγορηµατικών µεταβλητών σε µεταβλητές παράγοντα Μπορούν να χρησιµοποιηθούν σε στατιστική µοντελοποίηση, όπου θα τους ανατεθεί ο σωστός αριθµός των βαθµών ελευθερίας. Πολύ χρήσιµο σε πολλούς διαφορετικούς τύπους γραφικών Η αποθήκευση µεταβλητών αλληλουχίας χαρακτήρων ως µεταβλητές παράγοντες µια πιο αποτελεσµατική χρήση της µνήµης. Data elements: Factors / Παράγοντες Data elements: Factors / Παράγοντες

Data elements: Factors / Παράγοντες

Πράξεις µε πίνακες (παράδειγµα)

> x <- 1:64 ; dim(x) <- c(2,4,8) Data elements: Πλαίσια δεδοµένων (data frames) General Definition A data frame is a table, or two-dimensional array-like structure, in which each column contains measurements on one variable, and each row contains one case. Technically, in R a data frame is a list of column vectors. Unlike an array, the data you store in the columns of a data frame can be of various types: i.e., one column might be a numerical variable, another might be a factor, and a third might be a character variable. All columns have to be the same length (contain the same number of data items). Data elements: Πλαίσια δεδοµένων (data frames) Data elements: Πλαίσια δεδοµένων (data frames) Αντιπροσωπεύουν τυπικούς πίνακες δεδοµένων κάτι ανάλογο µε ένα υπολογιστικό φύλλο excel Είναι ουσιαστικά ένας ορθογώνιος πίνακας τιµών σε σειρές και στήλες is more general Ένα πλαίσιο δεδοµένων είναι µία λίστα από διανύσµατα, παράγοντες ή άλλα πλαίσια που όλα έχουν το ίδιο µήκος (στη περίπτωση των πινάκων οι γραµµές έχουν το ίδιο µήκος). Στο πλαίσιο δεδοµένων η θεώρηση γίνεται ανά στήλη που είναι και οι µεταβλητές του πλαισίου δεδοµένων Είναι οι δοµές της R που βρίσκονται πιο κοντά στην έννοια των συνόλων δεδοµένων (datasets) άλλων λογισµικών στατιστικής ανάλυσης, π.χ. του SPSS than a matrix Τα δεδοµένα σε κάθε στήλη έχουν τον ίδιο τύπο (π.χ. αριθµός, χαρακτήρες, λογικές µεταβλητές), αλλά διαφορετικές στήλες µπορεί να έχουν δεδοµένα µε διαφορετικούς τύπους

Data elements: Πλαίσια δεδοµένων (data frames) Είναι ο πιο κοινός τρόπος για την αποθήκευση δεδοµένων στο R κάνουν ευκολότερη την ανάλυση των δεδοµένων Ουσιαστικά επειδή είναι µια δοµή 2διαστάσεων, µοιράζονται τις ιδιότητες τόσο των πινάκων (matrices), όσο και των λιστών (lists). Αυτό σηµαίνει ότι ένα πλαίσιο δεδοµένων έχει names (), colnames (), και rownames (). Το µήκος () ενός πλαισίου δεδοµένων είναι το µήκος της υποκείµενης λίστας ncol (). Data elements: Πλαίσια δεδοµένων (data frames) ηµιουργούνται µε την εντολή data.frame() Ως default η εντολή data.frame () µετατρέπει σειρά χαρακτήρων σε παράγοντες (factors) καταστολή αυτής της συµπεριφοράς nrow () δίνει τον αριθµό των γραµµών Για τα µικρά σύνολα δεδοµένων, κάθε µία από τις στήλες (µεταβλητές) του πλαισίου δεδοµένων µπορούν να εισαχθούν χρησιµοποιώντας τη συνάρτηση data.frame Τα ονόµατα των στηλών (αν ορίζονται µε τη δηµιουργία του πλαισίου) εµφανίζονται µε τα δεδοµένα. Ονόµατα µπορούν να προστεθούν και µετά το γεγονός µε τη names() (). συνάρτηση names

Data elements: Πλαίσια δεδοµένων (data frames) Data elements: Πλαίσια δεδοµένων (data frames) Data elements: Πλαίσια δεδοµένων (data frames) Όλα τα στοιχεία σε ένα πλαίσιο δεδοµένων µπορεί να εξαχθούν ως διανύσµατα µε το αντίστοιχο όνοµα: > height <- measrs$ht # as a vector as in a list > height [1] 172.0 186.5 165.0 > attach(measrs) # as a vector with its name > wt [1] 91 99 74 > detach(measrs) Data elements: Πλαίσια δεδοµένων (data frames) Components can also be added to a data frame in the intuitive way > measrs$age <- c(28, 55, 43) > Measrs gender ht wt age S1 M 172.0 91 28 S2 M 186.5 99 55 S3 F 165.0 74 43 Αριθµητικοί υπολογισµοί µεταξύ στηλών (εφ όσον εκφράζουν συναφή µεγέθη) γίνονται παρόµοια µε το χειρισµό διανυσµάτων τιµών

Εισαγωγή δεδοµένων στο R Από αρχεία διαφόρων µορφοτύπων Στη συνέχεια Μένει να δούµε πως εισάγουµε δεδοµένα στο R από αρχεία διαφόρων τύπων Εισαγωγή δεδοµένων από αρχεία κειµένου Κειµένου (ASCII,.txt) Excel (.xls,.xlsx,.csv) Άλλα στατιστικά λογισµικά (SAS, SPSS, Minitab, Strata, Systat, ) Binary (NetCDF, HDF5, dbase, ) Εικόνων (bmp, jpeg, png, tiff, ) και από διαφορετικές πηγές http://, ftp://, file:// Εισαγωγή δεδοµένων από άλλα γνωστά λογισµικά π.χ. SPSS Typically, values in text files are separated, or delimited, by tabs or spaces ή από αρχεία excel ή από CSV αρχεία First few elements Εισαγωγή δεδοµένων: Από ASCII αρχεία Importing free formatted (delimited) data files using the read.table function Last few elements df <- read.table("< FileName>.txt", >.txt", header = FALSE) read.table("<filename FALSE) # the data from the file become a data.frame object

Εισαγωγή δεδοµένων: Από ASCII αρχεία Εισαγωγή δεδοµένων: από.csv αρχεία Εισαγωγή δεδοµένων: από.csv αρχεία Εισαγωγή δεδοµένων: από.csv αρχεία π.χ. αρχείο simple.csv Εισαγωγή δεδοµένων: από.csv αρχεία Εισαγωγή δεδοµένων: από.csv αρχεία π.χ. αρχείο simple.csv

Εισαγωγή δεδοµένων: Input data into R # οι επόµενες 3 εντολές είναι ισοδύναµες >test.txt <- read.table("d:/test.txt", header=t) Εισαγωγή δεδοµένων Από ASCII αρχεία Header & Data σε ξεχωριστά αρχεία >test.csv <- read.csv("d:/test.csv", header=t) >test.csv1 <- read.table("d:/test.csv", header=t, sep=",") # για την ανάγνωση από αρχεία µε άλλους οριοθέτες >test.semi <read.table("d:/testsemicolon.txt", header=t, sep=";") >test.z <- read.table("d:/testz.txt", header=t, sep="z") Importing Fixed Format Files Using the read.fwf Function Εισαγωγή δεδοµένων: using the functions in various packages Εισαγωγή δεδοµένων: Input data into R Από αρχεία Excel using XLConnect https://miraisolutions.wordpress.com/

Εισαγωγή δεδοµένων: using the functions in the foreign package Εισαγωγή δεδοµένων: Input data into R Εισαγωγή δεδοµένων: using the functions in the foreign package Εισαγωγή δεδοµένων: xlsx package Από αρχεία Excel Comma Delimited Text File & using the xlsx package

. ΕΜΠ Μέχρι το επόµενο µάθηµα... Συµβουλευτείτε, στις ιστοσελίδες του µαθήµατος, τη Θεµατική Εργασία #2, η οποία αποσκοπεί στην εξοικείωση σας µε τις βασικές εντολές επικοινωνίας µε το λογισµικό R καιτη χρήση scripts ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. ΕΜΠ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ