ΕΠΛ 003 ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Σύστηµα Αρχείων και Καταλόγων ιάλεξη 7 (Κεφάλαιο 11 του βιβλίου) Στόχοι Κεφαλαίου Περιγραφή της έννοιας του αρχείου, συστήµατος αρχείων, και των καταλόγων. Περιγραφή ψηφιακών αρχείων και κειµένου ιάκριση τύπου αρχείων από την κατάληξη Περιγραφή χρήσης αρχείου βάση του τύπου τoυ Περιγραφή βασικών λειτουργιών σε ένα αρχείο 11-2 Στόχοι Κεφαλαίου (συν.) Σύγκριση αρχείων άµεσης και τυχαίας προσπέλασης Θέµατα προστασίας αρχείων Ιεραρχία / δέντρο καταλόγων Ιεραρχική ή άµεση προσπέλαση αρχείων Περιγραφή αλγορίθµων προσπέλασης δίσκου 11-3 Σύστηµα Αρχείων Αρχείο (file) είναι ένα σύνολο δεδοµένων που έχουν σχέση µεταξύ τους. Τα διακρίνουµε µέσω ονοµάτων. Το σύστηµα αρχείων (file system) είναι µια λογική οργάνωση αρχείων από το λειτουργικό σύστηµα για ευκολότερη χρήση. Η πληροφορία µπορεί να ταξινοµηθεί σε ένα σύνολο αρχείων. Τα αρχεία ενός συστήµατος αρχείων οµαδοποιούνται συνήθως σε καταλόγους (directories). 11-4
Αρχεία ψηφιακά και κειµένου Αρχεία ψηφιακά και κειµένου Στα αρχεία κειµένου (text file) τα δεδοµένα (ή το κάθε byte) είναι χαρακτήρες του πίνακα ASCII ή Unicode Στα ψηφιακά αρχεία (binary file) κάθε bit ή byte έχει ειδική σηµασία και η διαχείρηση του γίνεται µε βάση κανόνες που ορίζονται στο ίδιο το αρχείο. 11-5 Οι όροι αρχεία κειµένου και ψηφιακά είναι κάπως παραπλανητικοί. ίνουν την εντύπωση ότι τα δεδοµένα σε ένα αρχείο δεν είναι ψηφιακά Σαφώς, όλα τα δεδοµένα σε ένα Η/Υ είναι σε ψηφιακή µορφή Οι όροι αναφέρονται στη δοµή της πληροφορίας σε bits: ως µια προκαθορισµένη σειρά από 8 ή 16 bits, γνωστή ως χαρακτήρες, ή µε κάποια άλλη δοµή. 11-6 Τύποι Αρχείων Τύποι Αρχείων Τα αρχεία, ψηφιακά ή κειµένου, περιέχουν ένα συγκεκριµένο τύπο πληροφορίας Για παράδειγµα, ένα αρχείο µπορεί να περιέχει ένα πρόγραµµα Java, µία εικόνα σε µορφή JPEG, ή ένα τραγούδι σε µορφή MP3 Το είδος της πληροφορίας που περιέχει το αρχείο ή το έγγραφο λέγεται τύπος αρχείου (file type) Τα περισσότερα λειτουργικά συστήµατα αναγνωρίζουν τους πιο δηµοφιλείς τύπους Μερικοί τύποι αρχείων και οι καταλήξεις τους. Τα ονόµατα αρχείων διαχωρίζονται, συνήθως, σε δύο µέρη από µια τελεία. Κυρίως όνοµα Κατάληξη αρχείου Η κατάληξη του αρχείου δείχνει τον τύπο του 11-7 11-8 αρχείων.
Τύποι Αρχείων Τα ψηφιακά αρχεία µπορεί να είναι αρχεία ήχου, εικόνας, ταινίας, εκτελέσιµα αρχεία (executable), αρχεία δεδοµένων (data file). Τα αρχεία δεδοµένων αποτελούνται από πολλές λογικές εγγραφές ή εγγραφές (records). Κάθε εγγραφή αποτελείται από πολλά πεδία (fields). 11-9 Τύποι Αρχείων Κλειδί (key) είναι ένα συγκεκριµένο πεδίο εγγραφής που χαρακτηρίζει (µοναδικά) κάθε εγγραφή. Κλειδί CY-323434 Νίκος Παν. Κύπρου Λευκωσία 1070 Πεδίο 1 Πεδίο 2 Πεδίο 3 Πεδίο 4 Πεδίο 5 11-10 Λειτουργίες των Αρχείων Τρόποι Επεξεργασίας Αρχείων εδοµένων ηµιουργία αρχείου ιαγραφή αρχείου Άνοιγµα αρχείου Κλείσιµο αρχείου ίαβασµα δεδοµένων Αποθήκευση / γράψιµο δεδοµένων Γράψιµο δεδοµένων στο τέλος του αρχείου (append) ιαγραφή δεδοµένων, όχι όµως του αρχείου (truncate ) Μετονοµασία αρχείου Αντιγραφή αρχείου Οι βασικότερες λειτουργίες που µπορούν να επιτελεστούν σε ένα αρχείο βάσης δεδοµένων είναι Ανάκτηση (retrieval) Ενηµέρωση (updating) Ταξινόµηση (sorting) 11-11 11-12
Τρόποι Επεξεργασίας Αρχείων εδοµένων Η ανάκτηση αφορά τη λήψη του περιεχοµένου µιας εγγραφής χωρίς να γίνει καµιά µεταβολή στο έγγραφο ή αρχείο Ενηµέρωση ονοµάζεται κάθε λειτουργία αλλαγής εγγραφών ή αρχείου, πχ. διαγραφή η προσθήκη εγγραφής, αλλαγή στα πεδία µιας εγγραφής Ταξινόµηση είναι η λειτουργία κατά την οποία οι εγγραφές ενός αρχείου διατάσσονται κατά αύξουσα ή φθίνουσα σειρά µε βάση την τιµή ενός πεδίου ή συνδυασµό από αυτά Φυσική Αποθήκευση Αρχείων Οι εγγραφές των αρχείων καταλαµβάνουν διάφορες περιοχές του µαγνητικού µέσου που αποθηκεύονται Στους δίσκους οι εγγραφές καταλαµβάνουν θέσεις ενός τοµέα (block), και όταν αυτός συµπληρωθεί, παίρνουν θέσεις από τον επόµενο. Όταν συµπληρωθεί όλο το ίχνος (track) πηγαίνουµε στο επόµενο, κ.ο.κ. ηλαδή, στη περίπτωση του δίσκου ένα αρχείο µπορεί να µη καταλαµβάνει συνεχόµενες περιοχές του δίσκου αλλά διάσπαρτες. 11-13 11-14 Φυσική Αποθήκευση Αρχείων Φυσική Αποθήκευση Αρχείων Το λειτουργικό σύστηµα φροντίζει ώστε εµείς να βλέπουµε πάντα το αρχείο µας σαν µια συνεχή παράθεση εγγράφων. Record 4 Record 3 Record 1 Record 2 11-15 11-16
Προσπέλαση Αρχείου Προσπέλαση Αρχείου Figure 11.2 Σειριακή Προσπέλαση Αρχείου Ηπιο συνήθης και η πιο εύκολη για υλοποίηση είναι ή σειριακή προσπέλαση (sequential access) Τα δεδοµένα του αρχείου επεξεργάζονται µε τη σειρά που αποθηκεύονται. Οι λειτουργίες ανάγνωσης και γραφής κινούν την κεφαλή του δίσκου ανάλογα µε το µεγέθος των δεδοµένων που γράφονται ή διαβάζονται 11-17 11-18 Προσπέλαση Αρχείου Προσπέλαση Αρχείου Τα αρχεία άµεσης προσπέλασης (direct access) αποτελούνται από µικρά λογικά αριθµηµένα τµήµατα (records) Η άµεση προσπέλαση επιτρέπει στον χρήστη να έχει άµεση πρόσβαση σε οποιοδήποτε τµήµα χρησιµοποιώντας τον αριθµό του τµήµατος Figure 11.3 Direct file access 11-19 11-20
Προστασία Αρχείων Σε ένα σύστηµα πολλαπλών χρηστών η προστασία των αρχείων είναι πολύ σηµαντική εν θέλουµε κάποιος χρήστης να έχει πρόσβαση στα αρχεία κάποιου άλλου, έκτος εάν ο δεύτερος το επιτρέπει Ο µηχανισµός προστασίας αρχείων ελέγχει ποιος θα έχει πρόσβαση σε ένα αρχείο, και για ποιο σκοπό Προστασία Αρχείων Στο λειτουργικό σύστηµα Unix η προστασία ορίζεται αυτόµατα σε τρείς κατηγορίες ηµιουργός (Owner) Οµάδα (Group) Υπόλοιποι (World) 11-21 Page 356 11-22 Ιεραρχία Καταλόγων έντρο Καταλόγων Ένας κατάλογο αρχείων µπορεί να βρίσκεται µέσα σε ένα άλλο κατάλογο Ο κατάλογος που περιέχει άλλους καταλόγους λέγεται πατρο-κατάλογος (parent directory), και οι κατάλογοι που περιέχει λέγονται υπο-κατάλογοι (subdirectory) Ένα σύστηµα αρχείων λογικά είναι σαν ένα δέντρο καταλόγων (directory tree) Ο κατάλογος στο πιο υψηλό επίπεδο ονοµάζεται κατάλογος ρίζα (root directory) 11-23 Figure 11.4 A Windows directory tree 11-24
έντρο Καταλόγων Figure 11.5 έντρο Καταλόγων του UNIX Σε µια δεδοµένη στιγµή ο χρήστης χειρίζεται ένα συγκεκριµένο κατάλογο. Ο κατάλογος αυτός ονοµάζεται κατάλογος εργασίας (working directory) 11-25 11-26 Ονόµατα Αρχείων Ονόµατα Αρχείων Για να ξεχωρίζουµε ένα αρχείο, συνήθως το περιγράφουµε από τη διαδροµή (path), πού είναι η σειρά των καταλόγων που ανοίγουµε για να βρούµε το αρχείο Ένα όνοµα απόλυτης διαδροµής (absolute) ξεκινά από τη ρίζα και ορίζει κάθε διακλάδωση στο δέντρο καταλόγων µέχρι το αρχείο Ένα όνοµα σχετικής διαδροµής (relative) ξεκινά από το κατάλογο εργασίας 11-27 Παραδείγµατα απόλυτης διαδροµής C:\Program Files\MS Office\WinWord.exe C:\My Documents\letters\applications\vaTech.doc C:\Windows\System\QuickTime Έστω ότι ο κατάλογο εργασίας είναι C:\My Documents\letters Τότε το σχετικό όνοµα διαδροµής µπορεί να είναι cancelmag.doc applications\calstate.doc 11-28
Χρονο-προγραµµατισµός ίσκου Χρονο-προγραµµατισµός ίσκου Το σύστηµα αρχείων πρέπει να προσπελαστεί µε αποδοτικό τρόπο Καθώς τρέχουν πολλά προγράµµατα σε ένα υπολογιστή, µπορεί να δηµιουργηθούν πολλές αιτήσεις προσπέλασης δίσκου Η τεχνική που χρησιµοποιεί το λειτουργικό σύστηµα για την επιλογή και εξυπηρέτηση αιτηµάτων ονοµάζεται χρονο-προγραµµατισµός δίσκου (disk scheduling) 11-29 Figure 11.5 A magnetic disk drive Χρονο-προγραµµατισµός ίσκου Χρονο-προγραµµατισµός ίσκου First-Come, First-Served Disk Scheduling Στο FCFS ή χρονο-προγραµατισµός ουράς, τα αιτήµατα εξυπηρετούνται µε τη σειρά που φτάνουν, άσχετα µε το πού βρίσκεται η κεφαλή του δίσκου Ο χρονο-προγραµµατισµός shortest-seektime-first (SSTF) επιλέγει το αίτηµα το οποίο χρειάζεται τη λιγότερη κίνηση της κεφαλής του δίσκου για εξυπηρέτηση 11-31 Σάρωση δίσκου (SCAN Disk Scheduling) Οχρονο-προγραµµατισµός σάρωσης δίσκου κινεί τη κεφαλή του δίσκου προς και µακριά από τον άξονα, καθώς ο δίσκος γυρίζει συνεχώς προς µια κατεύθυνση. Όταν ένα συγκεκριµένο τµήµα βρίσκεται κάτω από τη κεφαλή τότε αυτή το διαβάζει 11-32