Εισαγωγή στη Βιοπληροφορική Αλέξανδρος Κ. Δημόπουλος Πρόγραμμα Μεταπτυχιακών Σπουδών Τεχνολογίες Πληροφορικής στην Ιατρική και τη Βιολογία (ΤΠΙΒ) Τμήμα Πληροφορικής και Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Ακαδημαϊκό έτος 2017-18 Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 1 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις Ειδικές Τιμές I NA Ελλείπουσες τιμές στα δεδομένα αναπαριστώνται με NA Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 2 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις Ειδικές Τιμές II NULL Το NULL αναπαριστά την απουσία τιμής, εν αντιθέσει με το NA που αναπαριστά την έλλειψη υπάρχουσας τιμής Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 3 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις which() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 4 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις which() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 4 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις which() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 4 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις subset() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 5 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις length() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 6 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις dim() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 7 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 8 / 35 colnames()/rownames
Ειδικές Τιμές Ειδικές Συναρτήσεις rbind() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 9 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις cbind() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 10 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις table() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 11 / 35
Ειδικές Τιμές Ειδικές Συναρτήσεις Σύγκριση συνόλων Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 12 / 35
Λογικές Πράξεις if loops Λογικές Πράξεις Τελεστής Περιγραφή x y Λογικό ΚΑΙ για βαθμωτά μεγέθη x y Λογικό ΚΑΙ για διανύσματα x y Λογικό Ή για βαθμωτά μεγέθη x y Λογικό Ή για διανύσματα!x Λογικό ΌΧΙ Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 13 / 35
Λογικές Πράξεις if loops if/else Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 14 / 35
Λογικές Πράξεις if loops loops Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 15 / 35
Λογικές Πράξεις if loops apply() I Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 16 / 35
Λογικές Πράξεις if loops apply() II Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 17 / 35
Λογικές Πράξεις if loops apply() III m ένα πίνακας dimcode είναι η διάσταση που μας ενδιαφέρει 1 αφορά σε γραμμές 2 αφορά σε στήλες f είναι η συνάρτηση που θα εφαρμοστεί fargs είναι ένα προαιρετικό σύνολο ορισμάτων για τη συνάρτηση f Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 18 / 35
Λογικές Πράξεις if loops lapply() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 19 / 35
Λογικές Πράξεις if loops sapply() Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 20 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Πού είμαι; Τρέχουσα θέση: Αλλαγή θέσης: Εμφάνιση αρχείων φακέλου: Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 21 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Ανάγνωση από text αρχεία I read.table() Reads a file in table format and creates a data frame from it, with cases corresponding to lines and variables to fields in the file. Ενδεικτικές παράμετροι: file: the name of the file which the data are to be read from header: logical value. Is the first line a header? sep: the field separator character quote: the set of quoting characters as.is: the default behavior of read.table is to convert character variables (which are not converted to logical, numeric or complex) to factors Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 22 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Ανάγνωση από text αρχεία II strip.white: logical.allows the stripping of leading and trailing white space from unquoted character fields (numeric fields are always stripped)... Υπάρχουν και παρεμφερείς συναρτήσεις όπως:,,, Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 23 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Ανάγνωση από text αρχεία III Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 24 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Ανάγνωση από text αρχεία IV Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 25 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Προσοχή! Το path πρέπει να βρίσκεται μέσα σε διπλά εισαγωγικά Σε περιβάλλον linux το path είναι της μορφής /tmp Σε περιβάλλον windows το path είναι της μορφής c:\\tmp Τα κενά στα ονόματα ενός header δημιουργούν (συνήθως) προβλήματα κατά την ανάγνωση Η λάθος επιλογή sep οδηγεί σίγουρα σε λάθος ανάγνωση! Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 26 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Εγγραφή σε text αρχεία I write.table() write.table prints its required argument x (after converting it to a data frame if it is not one nor a matrix) to a file or connection Παρόμοιες παράμετροι με τη Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 27 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Εγγραφή σε text αρχεία II alexdem@pine : ~ $ c a t / tmp / f i l e 2. t x t V1 V2 V3 V4 1 1 4 7 10 2 2 5 8 11 3 3 6 9 12 Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 28 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Εγγραφή σε text αρχεία III alexdem@pine : ~ $ c a t / tmp / f i l e 2. t x t 1 4 7 10 2 5 8 11 3 6 9 12 Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 29 / 35
Διαχείριση αρχείων Αρχεία csv/tsv Αρχεία Excel Αρχεία Excel Εξωτερικές βιβλιοθήκες όπως π.χ.,,,,... επιτρέπουν την ανάγνωση από αρχεία Excel αλλά και την εγγραφή σε αυτά. Π.χ.: Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 30 / 35
Εξωτερικά πακέτα/βιβλιοθήκες Υπάρχει πληθώρα διαθέσιμων πακέτων Μπορούν να φορτωθούν στο τρέχον περιβάλλον με τις εντολές ή, π.χ. Αν υπάρχει κάποιο πακέτο μπορούμε πολύ εύκολα να το κατεβάσουμε και να το εγκαταστήσουμε από κάποιο αποθετήριο, π.χ. Για εφαρμογές βιοπληροφορικής, το πιο μεγάλο αποθετήριο είναι το bioconductor ( ) Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 31 / 35
IDE I ( ) An integrated development environment (IDE) for R It includes a console, syntax-highlighting editor that supports direct code execution, as well as tools for plotting, history, debugging and workspace management. Available in open source and commercial editions Runs on the desktop (Windows, Mac, and Linux) or in a browser connected to RStudio Server or RStudio Server Pro (Debian/Ubuntu, RedHat/CentOS, and SUSE Linux). Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 32 / 35
IDE II Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 33 / 35
Εγκατάσταση στο VM του ~ Okeanos alexdem@pine : ~ $ s s h ubuntu@snf XXXXXX. vm. okeanos. g r n e t. gr X ubuntu@ snf XXXXXX: ~ $ cd / tmp ubuntu@snf XXXXXX: ~ $ wget h t t p s : / / download1. r s t u d i o. org / r s t u d i o x e n i a l 1.1.383 amd64. deb ubuntu@snf XXXXXX: ~ $ sudo su ubuntu@snf XXXXXX: ~ ubuntu@snf XXXXXX: ~ ubuntu@snf XXXXXX: ~ ubuntu@snf XXXXXX: ~ $ r s t u d i o (Η εκτέλεση είναι για το image TrinityWorkshopVM_U16.04_J1.7) Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 34 / 35
Ερωτήσεις;? Τμήμα Πληροφορικής και Τηλεπικοινωνιών - ΠΜΣ ΤΠΙΒ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 35 / 35