Virtual Hosts Disaster Recovery Plan

Σχετικά έγγραφα
ΕΚΘΕΣΗ ΠΡΟΔΙΑΓΡΑΦΩΝ ΔΑΠΑΝΗΣ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ ΥΠΗΡΕΣΙΩΝ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΙΚΩΝ ΜΕΤΡΩΝ ΑΣΦΑΛΕΙΑΣ ΤΟΥ COMPUTER ROOM ΔΗΜΟΥ ΩΡΑΙΟΚΑΣΤΡΟΥ

Symantec Backup Exec System Recovery 7.0 Server Edition. Πλήρης Επαναφορά Συστημάτων Windows Μέσα σε Λίγα Λεπτά και όχι σε Ώρες ή Ημέρες

Προστασία Δεδομένων. Πιθανά Προβλήματα. Πρόληψη - Αντιμετώπιση

ηµιουργία αντιγράφων ασφαλείας και επαναφορά

Academia Financials Γενική Λογιστική ΠΕΡΙΕΧΟΜΕΝΑ

Αντίγραφα ασφαλείας και επαναφορά Οδηγός χρήσης

Περιεχόµενα. Μέρος I Βασικά στοιχεία των Microsoft Windows XP Professional. Ευχαριστίες Εισαγωγή... 19

Server Virtualization με εργαλεία ΕΛ/ΛΑΚ. ΛΑΚ Δήμος Ρεθύμνης.

Τεχνική Οδηγία. Αναδιάταξη κατατµήσεων (repartitioning) σε συστήµατα µε dynamic volumes και software raid 1 (mirroring) Ιούλιος 2004

ημιουργία εφεδρικών αντιγράφων ασφαλείας για Lenovo T410-T510

1.1 Να προσφερθεί ένα ειδικό σύστημα backup to disk για την τήρηση του συνόλου των αντιγράφων ασφαλείας. 1.2 Αριθμός προσφερόμενων μονάδων.

Σχολική Βιβλιοθήκη 3ου Γυμνασίου Κερατσινίου Σύνταξη Αλέξανδρος Τοπαλίδης

ΠΡΟΣ: ΠΡΟΣΚΛΗΣΗ ΕΚΔΗΛΩΣΗΣ ΕΝΔΙΑΦΕΡΟΝΤΟΣ

Αφαιρέθηκαν οι αναφορές στα RFCs στις προδιαγραφές 7.12, 7.13, 7.14.

Οδηγός Χρήσης προσωπικού χώρου και επιπλέον χώρου αποθήκευσης δεδομένων στο Τμήμα Πληροφορικής

Ε Κρυονερίου VM2.1 VMH2. ίκτυο ΣΥΖΕΥΞΙΣ VM1.1 VM2.1 VM1.1 VM1.2 VMH1. ηµαρχείο ιονύσου

Οδηγός Χρήσης για Mac

ΑΠΟΤΕΛΕΣΜΑΤΑ ΙΑΒΟΥΛΕΥΣΗΣ (Το έντυπο αποστέλλεται στην ΕΥ ΕΠ ΨΣ)

Ζητήματα Ασφάλειας στο σχεδιασμό Επιχειρησιακής Συνέχειας. Τσώχου Αγγελική

ΘΕΜΑ : Διευκρινήσεις επί της διακήρυξης του ανοικτού διεθνή διαγωνισμού για το έργο «Προμήθεια Εξοπλισμού για Αναβάθμιση Εφαρμογών Λοιπών Ταμείων».

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΟΝΑΔΑ ΑΡΙΣΤΕΙΑΣ ΕΛ/ΛΑΚ

Πλάνο υλοποίησης Virtual υποδομής για παροχή VPS (virtual private servers)

Οδηγίες Χρήσης. Εφαρµογή Ενηµέρωσης Firmware του JetDrive. Έκδοση 1.1

Share and Storage Management. Τεχνικός Δικτύων & Τηλεπικοινωνιών - Διαχείριση Δικτύων ΙΙ

Αντίγραφα ασφαλείας και επαναφορά Οδηγίες χρήσης

Web Serve. Dynamic Datacenter Services. Interworks Data Center. Παρεχόμενες υπηρεσίες από το. interworks

Αξιοποίηση της Τεχνολογίας των Εικονικών Μηχανών στην Επαγγελματική Εκπαίδευση και την Κατάρτιση Πληροφορικής. Βασιλάκης Βασίλειος Τζανάκης Δημήτριος

Κ Α Λ Ε Ι. ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Καβάλα ΥΠΟΥΡΓΕΙΟ ΥΓΕΙΑΣ & ΚΟΙΝΩΝΙΚΗΣ

Oλοκληρωμένες λύσεις Πληροφορικής και Τηλεπικοινωνιών στην υπηρεσία της Ναυτιλίας

ΔΥΝΑΜΙΚΗ ΧΡΗΜΑΤΙΣΤΗΡΙΑΚΗ ΑΕΠΕΥ ΔΗΜΟΣΙΟΠΟΙΗΣΗ 5 ΠΡΩΤΩΝ ΤΟΠΩΝ ΕΚΤΕΛΕΣΗΣ 2018

Technical FAQ. Data Encryption: 128bit έως 256Bit με επιλογή πρωτοκόλλου (AES, Triple DES, and TwoFish). Traffic Encryption: 1024bit RCA

ιαδικασία εγκατάστασης - αναβάθµισης MS SQL Server 2014 Express Edition για SingularLogic Control, Accountant, Λογιστικά

ΑΙΓΙΟ 10 / 10 / 2016 Α ) ΣΥΣΤΗΜΑΤΑ ΔΙΑΚΟΜΙΣΤΩΝ. Επιτροπή τεχνικών προδιαγραφών Του Γ.Ν Ανατολικής Αχαΐας Αίγιο 10 / 10/ 2016

Αντίγραφα ασφαλείας και επαναφορά Οδηγίες χρήσης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Ηλεκτρονικό Εμπόριο

Ενηµέρωση λογισµικού, δηµιουργία αντιγράφων ασφαλείας και επαναφορά

Δημιουργία δικτυακού ghost χρησιμοποιώντας το ghost console

ΑΣΦΑΛΕΙΑ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Αξιοποίηση Εικονικών Μηχανών στην διδασκαλία εξειδικευμένων εκπαιδευτικών αντικειμένων

Απαντήσεις σε ερωτήσεις

Σχολή Προγραµµατιστών Ηλεκτρονικών Υπολογιστών (ΣΠΗΥ) Τµήµα Προγραµµατιστών Σειρά 112

Εγχειρίδιο ανάκτησης, δημιουργίας αντιγράφων ασφαλείας και αντιμετώπισης προβλημάτων

1 Αρχική Σελίδα 2. 2 Εγγραφή 3. 3 Προφίλ χρήστη 6. 4 Διαχείριση SSH κλειδιών 7. 5 Δημιουργία νέας εικονικής μηχανής 9. 6 View instance 14

ΕΝΤΥΠΟ ΔΗΜΟΣΙΑΣ ΔΙΑΒΟΥΛΕΥΣΗΣ ΤΕΧΝΙΚΩΝ ΠΡΟΔΙΑΓΡΑΦΩΝ

Περίληψη να αναρτηθεί στο διαδίκτυο Αθήνα, 01/08/2013 Α. Π Προμήθεια, εγκατάσταση και παραμετροποίηση υπολογιστικού συστήματος

Ελληνική Έκδ ση. Εισαγωγή. Υλισμικό. Ενεργοποίηση επιλογών RAID. PU103 Sweex 2 Port Serial ATA RAID PCI Card

Α Ν Α Κ Ο Ι Ν Ω Ν Ε Ι

Σύντομη παρουσίαση των εργαλείων/εντολών telnet, ping, traceroute nslookup και nmap, zenmap

Ανάπτυξη Ηλεκτρονικών Υπηρεσιών του Δημοκρίτειου Πανεπιστημίου Θράκης Υποέργο 4

GDPR και Τεχνικά Μέτρα Ασφάλειας Πληροφοριακών Συστημάτων

Κλωνοποίηση δίσκου με το Acronis TrueImage

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΉΜΙΟ ΚYΠΡΟΥ

ΔΥΝΑΜΙΚΗ ΧΡΗΜΑΤΙΣΤΗΡΙΑΚΗ ΑΕΠΕΥ ΔΗΜΟΣΙΟΠΟΙΗΣΗ 5 ΠΡΩΤΩΝ ΤΟΠΩΝ ΕΚΤΕΛΕΣΗΣ

Κλεισμένοι έξω από τα δεδομένα μας

Υπηρεσία HP Data Replication Solution για το 3PAR Virtual Copy

Volume Managers. Εργασία για το μάθημα Λειτουργικά Συστήματα Ι. Κοντεκάκης Ιωάννης.

Περιεχόμενα. Αντιμετώπιση προβλημάτων Εισαγωγή σε αυτό το εγχειρίδιο...7

Βασική προτεραιότητά μας η ασφάλεια των δεδομένων σας.

ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ ΓΙΑ ΤΟ ΙΑΓΩΝΙΣΜΟ ΜΕ ΑΡΙΘ. ΠΡΩΤ. 1022/

ΕΠΛ425 : Τεχνολογίες Διαδικτύου Εργαστήρια

Οδηγός λήψης αντιγράφων ασφαλείας (backup) στο ηλεκτρονικό ταχυδρομείο

Απαντήσεις της ΕΕΤΤ στις παρατηρήσεις των συµµετεχόντων επί της από 17/2/2014

Ενότητα 2. Πηγές Λογισμικού. Πληροφοριακά Συστήματα Διοίκησης ΙI Νίκος Καρακαπιλίδης 2-1

Ενηµέρωση, δηµιουργία αντιγράφων ασφαλείας και επαναφορά λογισµικού

Οδηγός Χρήσης για Windows

Ενημερωτικός οδηγός για τον εξυπηρετητή Ada

Δημιουργία Active Directory DNS στα Windows Server Τεχνικός Δικτύων & Τηλεπικοινωνιών - Διαχείριση Δικτύων ΙΙ

Microsoft Windows 7: Οδηγός «Τα πρώτα βήµατα»

Οδηγός γρήγορης εκκίνησης του PowerSuite

Προγραμματισμός Διαχείρισης Συστημάτων ΙΙ

Όροι Χρήσης της IBM Όροι για Συγκεκριμένες Προσφορές SaaS. IBM DB2 on Cloud

ISMS κατά ISO Δεκέμβριος 2016

Αξιολόγηση της πορείας υλοποίησης

Τεκμηρίωση Μαζί με τον υπολογιστή σας Sony VAIO περιλαμβάνονται και τα ακόλουθα έγγραφα.

Χρήση του Εργαλείου Διαμόρφωσης...1 Μη αυτόματη προετοιμασία του λογισμικού...4 Εγκατάσταση του λογισμικού...10

Εύρεση πληροφοριών στον υπολογιστή σας Μαζί με τον υπολογιστή σας Sony VAIO περιλαμβάνονται και τα ακόλουθα έγγραφα.

Τεκμηρίωση σε ηλεκτρονική μορφή

ΚΕΠΛΗΝΕΤ ΕΒΡΟΥ. Καλτσίδης Χρήστος

Σενάριο Εστίασης Win XP:

Εύρεση πληροφοριών στον υπολογιστή σας

ΑΝΑΚΟΙΝΩΣΗ ΓΙΑ ΠΡΟΜΗΘΕΙΑ ΜΕ ΑΠΕΥΘΕΙΑΣ ΑΝΑΘΕΣΗ

20 Νοεμβρίου Οδηγός Εκτύπωσης. Πανεπιστήμιο Κύπρου, Τμήμα Πληροφορικής. Ομάδα Τεχνικής Υποστήριξης. v2.2

Λειτουργικά Συστήματα. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Τεκμηρίωση Μαζί με τον υπολογιστή σας Sony VAIO περιλαμβάνονται και τα ακόλουθα έγγραφα.

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΝΕΑΣ ΓΕΝΙΑΣ ΕΙΔΩΛΩΝ ΑΠΟΚΑΤΑΣΤΑΣΗΣ WINDOWS 10

ΟΔΗΓΙΕΣ ΣΥΝΔΕΣΗΣ ΣΤΟ ΔΙΚΤΥΟ ΤΟΥ ΟΠΑ ΑΠΟ ΕΞΩΤΕΡΙΚΟ ΠΑΡΟΧΟ (ΥΠΗΡΕΣΙΑ VPN) Windows 8, Windows 7, Windows Vista, Windows XP

ηµιουργία αντιγράφων ασφαλείας και επαναφορά Οδηγός χρήσης

ΟΔΗΓΙΕΣ ΕΓΚΑΤΑΣΤΑΣΗΣ SQL SERVER 2008 R2 Express

Φύλλα Δραστηριότητας L1 - Εύκολες L2 - Μέτριες L3 - Δύσκολες. Κωδικός Τίτλος Κωδικός Τίτλος Κωδικός Τίτλος. Κατασκευή Ιστοεξερεύν ησης.

ΤΕΧΝΙΚΗ ΠΕΡΙΓΡΑΦΗ. Ανάπτυξη εφαρµογής ΕΛ/ΛΑΚ, για την καταχώριση και εµφάνιση έργων και µελετών από εργολάβους

Ενηµέρωση, δηµιουργία αντιγράφων ασφαλείας και επαναφορά λογισµικού

ΔΙΕΝΕΡΓΕΙΑ ΗΛΕΚΤΡΟΝΙΚΟΥ ΠΛΕΙΣΤΗΡΙΑΣΜΟΥ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΉΜΙΟ ΚYΠΡΟΥ

Το Backup που αφορά στο mainframe (IBM z9). Η σύνδεση μεταξύ του mainframe και του συστήματος backup θα πρέπει να επιτυγχάνεται μέσω FICON channels.

Εγκατάσταση Microsoft SQL Server

ΔΙΑΚΗΡΥΞΗ ΔΑΠΜ ΕΡΓΟ : «ΠΡΟΜΗΘΕΙΑ, ΕΓΚΑΤΑΣΤΑΣΗ, ΑΝΑΒΑΘΜΙΣΗ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΥΠΟΔΟΜΩΝ ΛΟΓΙΣΜΙΚΟΥ ΕΠΙΧΕΙΡΗΣΙΑΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΑΔΜΗΕ»

Ενηµέρωση, δηµιουργία αντιγράφων ασφαλείας και επαναφορά λογισµικού

ιαχείριση και εκτύπωση

Browsers. Λειτουργικότητα και Παραμετροποίηση

Transcript:

Virtual Hosts Disaster Recovery Plan Τμήμα Πληροφορικής, Πανεπιστήμιο Κύπρου Andry Michaelidou Papa 4 April 2016 Έκδοση 2η

Περιεχόμενα Εισαγωγή... 2 Συντομογραφίες... 2 Γενικά... 3 Α. Καθορισμός Ρόλων-Αρμοδιοτήτων... 3 Β. Καθορισμός χρόνου ανάκαμψης και αντιστοίχιση λειτουργιών για προτεραιοποίηση ανάκαμψης... 3 Γ. Κεντρική υποδομή storage... 4 Δ. Προστασία δεδομένων και μέθοδοι λήψης αντιγράφων ασφαλείας... 4 Μέθοδοι λήψης αντιγράφων ασφαλείας... 4 i. Εικονικές μηχανές και δεδομένα (Virtual Machines)... 4 ii. Virtual Host και δεδομένα... 5 1. Αντίγραφα ασφαλείας δεδομένων εξυπηρετητή... 5 2. Αντίγραφα ασφαλείας των VMs images (raw space)... 5 Σενάρια καταστροφής... 5 Σενάριο 1: VHost Hardware Failure... 6 Σενάριο 2: ISCSI Storage Failure... 8 Αναθεώρηση και συντήρηση του Disaster Recovery Plan... 9 Ιστορικό αναθεωρήσεων... 9 1/9

Virtual Hosts Disaster Recovery Plan Εισαγωγή Το πλάνο αυτό μελετά την περίπτωση βλάβης που επηρεάζει τους Virtual Hosts και τον τρόπο επαναφοράς των εικονικών μηχανών και υπηρεσιών που υποστηρίζουν. Ακολουθούν γενικές πληροφορίες, διαδικασίες και μέθοδοι λήψης αντιγράφων ασφαλείας καθώς επίσης και καθορισμός του χρόνου ανάκαμψης αλλά και προτεραιότητας ανάκαμψης αναλόγως με τις κρίσιμες λειτουργίες που εκτελεί κάθε εικονική μηχανή. Στη συνέχεια ακολουθούν τα σενάρια που μελετά αυτό το Disaster Recovery Plan (DRP) καθώς και τα προτεινόμενα βήματα για ανάκαμψη των συστημάτων. Συντομογραφίες Ακρωνύμιο DRP Disaster Recovery Plan VM(s) Virtual Machine(s) VH(s) Virtual Host(s) LVM Logical Volume Manager VG Volume Group ISCSI Internet Small Computer System Interface TSM Tivoli Storage manager OTY Ομάδα Τεχνικής Υποστήριξης 2/9

Γενικά Α. Καθορισμός Ρόλων-Αρμοδιοτήτων Για την αποτελεσματικότερη εφαρμογή του Disaster Recovery Plan (DRP), θεωρείται ότι η ανάθεση των ρόλων και αρμοδιοτήτων σε περίπτωση εφαρμογής του πλάνου αυτού βασίζεται στον πίνακα ευθυνών ΟΤΥ καθώς και στην πάγια πρακτική μας για αντικατάσταση. Η εφαρμογή του DRP καθώς και οι σημαντικές αποφάσεις που θα ληφθούν για την ανάκαμψη των υπηρεσιών θα πρέπει να είναι προσυμφωνημένες με τον συντονιστή της ΟΤΥ, ή και το προεδρείο αν κριθεί απαραίτητο από τον συντονιστή της ΟΤΥ. Β. Καθορισμός χρόνου ανάκαμψης και αντιστοίχιση λειτουργιών για προτεραιοποίηση ανάκαμψης Για την αποτελεσματική εφαρμογή του πλάνου αυτού, θα πρέπει αρχικά να αποφασιστεί ο επιδιωκόμενος χρόνος ανάκαμψης. Λόγω της ιδιαίτερης φύσης των υπηρεσιών αλλά και της ιδιαιτερότητας της κάθε υπηρεσίας ο χρόνος ανάκαμψης διαφέρει και βασίζεται στην διαβάθμιση κρισιμότητας συστημάτων (Πίνακας Κρισίμων Συστημάτων) που προκύπτει από τον πίνακα ευθυνών ΟΤΥ. Σύμφωνα με τη διαβάθμιση αυτή τα συστήματα και υπηρεσίες με βαθμό > 5 θα πρέπει να έχουν ανακάμψει εντός 1 ημέρας (24 ώρες), ενώ τα υπόλοιπα συστήματα μικρότερης κρισιμότητας εντός 3 ημερών ή 1ας εβδομάδας. Ο χρόνος αυτός θα κρίνεται αναλόγως σε κάθε περίπτωση από τον υπεύθυνο εφαρμογής του DRP, σύμφωνα με τους πόρους που θα έχει στη διάθεση του για την ανάκαμψη των συστημάτων. Συνεπώς κατά το σχεδιασμό του DRP θα μπορούσε να επιλεχθεί με ασφάλεια ως επιδιωκόμενος χρόνος ανάκαμψης ο ελάχιστος απαιτούμενος, δηλαδή 1 ημέρα, ενώ παράλληλα μπορούμε να ορίσουμε ως μέγιστο ανεκτό χρόνο ανάκαμψης για το σύνολο των συστημάτων και υπηρεσιών την 1 εβδομάδα (5 εργάσιμες). Συστήματα Συστήματα και υπηρεσίες με βαθμό κρισιμότητας > 5 Συστήματα και υπηρεσίες με βαθμό κρισιμότητας < 5 Μέγιστος χρόνος ανάκαμψης 1 ημέρα (24 ώρες) 3 ημέρες (72 ώρες) - 1 εβδομάδα (5 εργάσιμες μέρες) Ιδιαίτερη σημασία κατά τον καθορισμό του χρόνου ανάκαμψης πρέπει να δοθεί και στο χρόνο που μεσολαβεί από την εκδήλωση της καταστροφής μέχρι και την έναρξη της εφαρμογής του DRP. Στο ίδιο χρονικό διάστημα πρέπει να διερευνηθεί και να αποφασιστεί η αναγκαιότητα χρήσης 3/9

εναλλακτικών εγκαταστάσεων στα πλαίσια εφαρμογής του DRP. Για τη περίπτωση που μελετάμε επιλέγεται ως μέγιστος χρόνος για τη λήψη της παραπάνω απόφασης οι 4 ώρες. Παράλληλα τίθεται ως χρονικό διάστημα-στόχος για τη δυνατότητα φιλοξενίας των συστημάτων σε εναλλακτικές εγκαταστάσεις οι 4 εβδομάδες, στη διάρκεια του οποίου θα πρέπει να έχουν αποκατασταθεί πλήρως οι κυρίως εγκαταστάσεις και να είναι σε θέση να φιλοξενήσουν και πάλι τα συστήματα. Γ. Κεντρική υποδομή storage Στο πλάνο αυτό θεωρείται δεδομένο ότι τουλάχιστον μία από τις υποδομές για storage είναι σε λειτουργία και δεν μελετάται το ενδεχόμενο επαναφοράς των υπηρεσιών storage, καθότι αφορά άλλην υπηρεσία και η επαναφορά των υπηρεσιών πρέπει να αναφέρεται DRP της υπηρεσίας αυτής. Μελετάται όμως ως σενάριο η πιθανότητα προβλήματος ή ολικής καταστροφής ενός εκ των υποδομών storage και η επαναφορά των υπηρεσιών σε άλλη υποδομή storage. Δ. Προστασία δεδομένων και μέθοδοι λήψης αντιγράφων ασφαλείας Στο πλάνο αυτό θεωρείται δεδομένο ότι τα τρέχων αντίγραφα ασφαλείας των συστημάτων που επηρεάζονται και τα δεδομένα τους είναι άθικτα και διαθέσιμα. Η λήψη των αντιγράφων βασίζεται στo TSM Backup policy, ενώ ο διαχειριστής της κάθε εικονικής μηχανής, αλλά και ο διαχειριστής της κάθε υπηρεσίας θα πρέπει να διασφαλίζει ότι τα αντίγραφα ασφαλείας λαμβάνονται σε τακτά χρονικά διαστήματα ώστε να εξασφαλίζεται η ύπαρξη αντιγράφου όλων των πρόσφατων αλλαγών. Μέθοδοι λήψης αντιγράφων ασφαλείας Πιο κάτω αναφέρονται οι μέθοδοι λήψης αντιγράφων ασφαλείας από τις VMs και τους VHs. i. Εικονικές μηχανές και δεδομένα (Virtual Machines) Όπως αναφέρθηκε και πιο πάνω ο διαχειριστής της κάθε εικονικής μηχανής, αλλά και ο διαχειριστής της κάθε υπηρεσίας θα πρέπει να διασφαλίζουν ότι τα αντίγραφα ασφαλείας λαμβάνονται σε τακτά χρονικά διαστήματα ώστε να εξασφαλίζεται η ύπαρξη αντιγράφου όλων των πρόσφατων αλλαγών. Σε κάθε εικονική μηχανή είναι καθήκον του διαχειριστή της μηχανής η εγκατάσταση και διαμόρφωση του TSM για την εξασφάλιση αντίγραφων ασφαλείας με τις πρόσφατες αλλαγές στα δεδομένα της μηχανής. Ο διαχειριστής της κάθε υπηρεσίας σε συνεργασία με τον διαχειριστής της μηχανής θα πρέπει να βεβαιωθεί ότι για τα δεδομένα των υπηρεσιών που χειρίζεται, λαμβάνονται τα απαραίτητα αντίγραφα ασφαλείας. Η λήψη των αντιγράφων ασφαλείας για τα δεδομένα μέσα από τις εικονικές μηχανές βασίζεται στo TSM Backup policy. 4/9

ii. Virtual Host και δεδομένα 1. Αντίγραφα ασφαλείας δεδομένων εξυπηρετητή Όσον αφορά τους VHs και τα δεδομένα τους, δεν έχει καταστεί προς το παρόν ανάγκη για εκτεταμένη ύπαρξη αντιγράφων ασφαλείας. Για σκοπούς όμως μεγαλύτερης ταχύτητας επαναφοράς των εικονικών μηχανών σε περίπτωση βλάβης, καθώς και για ελαχιστοποίηση του χρόνου ανάκαμψης λόγω λανθασμένης ή μη ενημερωμένης τεκμηρίωσης, αποφασίστηκε όπως για κάθε σύστημα δημιουργούνται αντίγραφα ασφαλείας για τους υποκαταλόγους /etc/libvirt/ και /etc/lvm όπου υπάρχουν όλα τα configuration files που αφορούν τις εικονικές μηχανές, το storage και το LVM configuration. Το αντίγραφο αυτό γίνεται σύμφωνα με το TSM Backup και το Schedule: CS_BACKUP_SERVERS_DAILY. 2. Αντίγραφα ασφαλείας των VMs images (raw space) Σύμφωνα με την πολιτική δημιουργίας εικονικών μηχανών προτείνεται όπως χρησιμοποιείται LVM logical volume (raw space) για την εγκατάσταση. Ο χώρος αυτός πιθανό να βρίσκεται σε 2 τοποθεσίες στον VH: / dev/vmvglocal/ (Local storage disk του VH) /dev/ VMvgRemote/ (Remote storage disk, iscsi storage infrastructure) Για κάθε μηχανή έχει γίνει πλάνο δημιουργίας αντίγραφων ασφαλείας (LVM snapshot) των images αυτών ανά 2 εβδομάδες στους VH που εξυπηρετούν τις υπηρεσίες του τμήματος και ανά 4 εβδομάδες στους VH που εξυπηρετούν ερευνητικούς σκοπούς. Το αντίγραφο αυτό μπορεί να χρησιμοποιηθεί ανεξάρτητα σε οποιοδήποτε VH και με χρήση του τελευταίου αντίγραφου ασφαλείας των δεδομένων της εικονικής μηχανής μπορούμε να έχουμε ένα πλήρες και ενημερωμένο αντίγραφο της εικονικής μηχανής. Η χρήση των images των μηχανών και η επαναφορά τους είναι κάτι εντελώς νέο που πρώτη φορά δοκιμάζεται στην υποδομή μας. Σε κάθε περίπτωση, εάν αποτύχει η επαναφορά του image, για την επαναφορά της VM θα ακολουθηθούν τα βήματα επαναφοράς όπως εάν ήταν physical μηχανή, δηλαδή με εγκατάσταση από την αρχή και επαναφορά των δεδομένων από το backup. 5/9

Σενάρια καταστροφής Πιο κάτω μελετούνται κάποια σενάρια καταστροφής, όπου θέτουν μερικές ή όλες τις μηχανές κάποιου VH εκτός λειτουργίας. Στα σενάρια αυτά συγκεκριμενοποιούνται οι ζημιές και τα βήματα που θα πρέπει να ακολουθηθούν για ανάκαμψη των μηχανών. Σενάριο 1: VHost Hardware Failure Στο σενάριο αυτό μελετάται η βλάβη στο hardware ενός VH και τα βήματα που πρέπει να ακολουθηθούν σε κάθε περίπτωση ξεχωριστά για την ανάκαμψη της μηχανής ή την ανάκαμψη των εικονικών μηχανών που εξυπηρετούσε. Σε κάθε μια από τις πιο κάτω περιπτώσεις πρέπει σύμφωνα με τον πίνακα συντήρησης υλικών, καθώς και την περίοδο εγγύησης των VH να γίνεται άμεση επικοινωνία με την εταιρεία που παρέχει συντήρηση στη μηχανή για άμεση αντικατάσταση του προβληματικού hardware. Οι Virtual Hosts είναι εφοδιασμένοι με RAID controller και δύο δίσκους με configuration RAID 1. Σε περίπτωση βλάβης πρέπει ως πρώτο βήμα να γίνει έλεγχος εάν το πρόβλημα οφείλεται σε προβληματικό δίσκο. Εάν είναι μόνο ο ένας από τους 2 δίσκους χαλασμένος μπορεί να αφαιρεθεί από το array ούτως ώστε να γίνουν οι απαραίτητες ενέργειες για επανεκκίνηση της μηχανής. Εάν δεν είναι δυνατή η επανεκκίνηση του εξυπηρετητή, τότε ισχύουν τα πιο κάτω. Ζημιές: /etc/libvirt : όλα τα configuration files που αφορούν τις εικονικές μηχανές και το storage /etc/lvm: όλα τα configuration files που αφορούν το LVM configuration /dev/vmvglocal: Local storage disk του VH (περιλαμβανομένων όλων των εικονικών μηχανών που ήταν αποθηκευμένες στον χώρο αυτό) /dev/ VMvgRemote: Remote storage disk, iscsi storage infrastructure (περιλαμβανομένων όλων των εικονικών μηχανών που ήταν αποθηκευμένες στον χώρο αυτό) Βήματα επαναφοράς: Βήμα 1 ο : Restore /etc/libvirt και /etc/lvm Βήμα 2 ο : Σύμφωνα με το κεφάλαιο «Καθορισμός χρόνου ανάκαμψης και αντιστοίχιση λειτουργιών για προτεραιοποίηση ανάκαμψης» που αναφέρθηκε πιο πάνω εντοπίζονται οι μηχανές που πρέπει να επανεκκινήσουν εντός της ημέρας και προτεραιοποιούνται. Βήμα 3 ο : Καθορισμός του χώρου για επαναφορά των μηχανών. Η επαναφορά μπορεί να αφορά είτε VMs που ήταν στον τοπικό δίσκο του VH (/ dev/vmvglocal) είτε VMs που ήταν στον απομακρυσμένο δίσκο (iscsi) του VH (/ dev/vmvgremote) 6/9

Περίπτωση 1: Επαναφορά από το /dev/vmvglocal σε άλλο VH Bήμα 1 ο : Δημιούργησε τα Logical Volumes για κάθε μηχανή στον νέο VH με: lvcreate -L <size>gb -n <name> VMvg<> Βήμα 2 ο : Κάνε restore το image της μηχανής με: dd if=/vm-backup/<host>/vm_backup.gz gzip -c -d dd of=/dev/ VMvg<>/destination_lv Βήμα 3 ο : Αντέγραψε το /etc/libvirt/qemu/{guestname}.xml από restore του παλιού VH στον νέο. Βήμα 4 ο : Τρέξτε virsh create /etc/libvirt/qemu/{guestname}.xml Βήμα 5: Εκκίνησε την μηχανή κανονικά και κάνε restore τα τελευταία δεδομένα εάν χρειάζεται (μέσα από την μηχανή). Περίπτωση 2: Επαναφορά του /dev/vmvgremote σε άλλο VH (Πρέπει να γίνουν δοκιμές με το vgcfgrestore και το vgimport κατά πόσον οι εικονικές μηχανές που είναι στο iscsi storage μπορούν να επανέλθουν με την σύνδεση του storage με άλλο VHost. Αν ναι τότε θεωρητικά με πιο κάτω commands θα είναι διαθέσιμος ο χώρος σε άλλο VH.) iscsiadm -m discovery -t sendtargets -p 10.16.254.x iscsiadm -m node -T iqn.x -p 10.16.254.x --login pvcreate uuid <<UUID OF VMvgRemote**>> /dev/sdx1 <Where <x> is iscsi disk name appear in the fdisk -l> vgcreate VMvgRemoteNEW /dev/sdx1 *explain new name of Volume Group vgcfgrestore -f /etc/lvm/backup/vmvgremote VMvgRemoteNEW For each guest: copy /etc/libvirt/qemu/{guestname}.xml (from restore) to new VH virsh create /etc/libvirt/qemu/{guestname}.xml Start the guests as usual ** Can be found at /etc/lvm/backup/vmvgremote of the backup files Εάν δεν μπορεί να επιτευχθεί σύνδεση του storage με άλλον VH, τότε θα ακολουθηθούν τα ίδια βήματα όπως πιο πάνω στην Περίπτωση 1: Επαναφορά από το /dev/vmvglocal σε άλλο VH με επαναφορά των images από το backup. 7/9

Σενάριο 2: ISCSI Storage Failure Στο σενάριο αυτό μελετάται η βλάβη στην κεντρική υποδομή του iscsi storage και τα βήματα που πρέπει να ακολουθηθούν σε κάθε περίπτωση για την ανάκαμψη των εικονικών μηχανών που είχαν το storage στην κεντρική υποδομή που εμφάνισε το πρόβλημα. Σημειώνεται ότι στην περίπτωση αυτή δεν μελετάται το ενδεχόμενο επαναφοράς των υπηρεσιών storage, καθότι αφορά άλλην υπηρεσία και πρέπει να αναφέρεται στο DRP της υπηρεσίας αυτής. Μελετάται όμως ως σενάριο η πιθανότητα προβλήματος ή ολικής καταστροφής ενός εκ των υποδομών storage και η επαναφορά των υπηρεσιών των VH σε άλλη υποδομή storage. Ζημιές: /dev/vmvgremote/: Remote storage disk, iscsi storage infrastructure Βήματα επαναφοράς: Βήμα 1 ο : Σύμφωνα με το κεφάλαιο «Καθορισμός χρόνου ανάκαμψης και αντιστοίχιση λειτουργιών για προτεραιοποίηση ανάκαμψης» που αναφέρθηκε πιο πάνω εντοπίζονται οι μηχανές που πρέπει να επανεκκινήσουν εντός της ημέρας. Μαζεύονται οι ανάγκες για storage και προτεραιοποιούνται. Βήμα 2 ο : Καθορισμός του χώρου για επαναφορά των μηχανών. Η επαναφορά μπορεί να γίνει είτε στον ίδιο VH αλλά σε άλλο device (από άλλο iscsi storage) είτε εάν δεν υπάρχει διαθέσιμο storage στο μέγεθος που χρειάζεται σε άλλους VHs. Περίπτωση 1: Επαναφορά στον ίδιο VH Bήμα 1 ο : vgrename VMvgRemote VMvgRemoteOLD Βήμα 2 ο : Ακολούθησε τις οδηγίες για Connect to a storage από https://wiki.cs.ucy.ac.cy/index.php/oty_internal:virtual_host_configuration#connect_to_r emote_iscsi_storage Βήμα 3 ο : Δημιούργησε τα Logical Volumes για κάθε μηχανή με: lvcreate -L <size>gb -n <name> VMvgRemote Βήμα 4 ο : Κάνε restore το image της μηχανής με: dd if=/vm-backup/<host>/vm_backup.gz gzip -c -d dd of=/dev/ VMvg<>/destination_lv Βήμα 5 ο : Εκκίνησε την μηχανή κανονικά και κάνε restore τα τελευταία data αν χρειάζεται (μέσα από την μηχανή) 8/9

Περίπτωση 2: Επαναφορά σε άλλον VH Bήμα 1 ο : Δημιούργησε τα Logical Volumes για κάθε μηχανής στον νέο VH με: lvcreate -L <size>gb -n <name> VMvgRemote Βήμα 2 ο : Κάνε restore το image της μηχανής με : dd if=/vm-backup/<host>/vm_backup.gz gzip -c -d dd of=/dev/vmvg<>/destination_lv Βήμα 3 ο : Αντιγράψτε το /etc/libvirt/qemu/{guestname}.xml από τον παλιό VH στον νέο. Βήμα 4 ο : Τρέξτε virsh create /etc/libvirt/qemu/{guestname}.xml Βήμα 5 Ο : Εκκίνησε την μηχανή κανονικά και κάνε restore τα τελευταία δεδομένα εάν χρειάζεται (μέσα από την μηχανή). Σημειώνεται ότι σε περίπτωση που το ISCSI storage failure αναφέρετε σε βλάβη του συστήματος NetApp, τότε, δεδομένου ότι το /vm-backup που περιέχει τα τελευταία αντίγραφα των images των εικονικών μηχανών θα πρέπει να ανακτηθεί από το backup με επιπλέον χρόνο ανάκαμψης των εικονικών μηχανών. Αναθεώρηση και συντήρηση του Disaster Recovery Plan Προτείνεται η τακτική επικαιροποίηση του DRP σε ετήσια βάση, καθώς και εκτάκτως μετά από κάθε αλλαγή που μπορεί να επηρεάσει την αποτελεσματικότητά του. Εκτός της αναθεώρησης και συντήρησής του που κρίνονται επιβεβλημένες προτείνεται ανά τακτά χρονικά διαστήματα δειγματοληπτικός έλεγχος του DRP και επαναφορά μηχανών τυχαία για έλεγχο των σενάριων καταστροφής και την αποτελεσματικότητα του DRP για επαναφορά. Ιστορικό αναθεωρήσεων Έκδοση 1 η 13 Νοεμβρίου 2013 Έκδοση 2 η 04 Απριλίου 2016 9/9