Μελέτη Πολιτικών Χρονοδροµολόγησης σε Κατανεµηµένα Συστήµατα Πλοηγητών. Όνοµα : Ελένη Τσιακκούρη

Σχετικά έγγραφα
ιεργασίες και Επεξεργαστές στα Κατανεµηµένων Συστηµάτων

Social Web: lesson #4

Λειτουργικά Συστήματα (Λ/Σ)

Εργαλεία ανάπτυξης εφαρμογών internet Ι

Στρατηγικό Σχέδιο Για τη Βιώσιµη Ανάπτυξη της Θεσσαλονίκης (ΣΣΒΑΘ) 1 η Ενδιάµεση Έκθεση 3. ηµιουργία και Λειτουργία Web site

Ελληνικό Ανοικτό Πανεπιστήµιο. Η Ανάλυση και ο Σχεδιασµός στην Ενοποιηµένη ιαδικασία. ρ. Πάνος Φιτσιλής

International Diploma in IT Skills Proficiency Level

TRAVIS TRAFFIC VIOLATION INFORMATION SYSTEM ΣΥΣΤΗΜΑ ΔΙΑΧΕΙΡΗΣΗΣ ΠΑΡΑΒΑΣΕΩΝ ΦΩΤΟΕΠΙΣΗΜΑΝΣΗΣ

ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Κατανεμημένα Συστήματα

Πανεπιστήµιο Πατρών Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ και Πληροφορικής

ΘΕΜΑΤΑ ΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ 2006 / 2007

ΠΡΟΤΑΣΗ-ΑΝΑΘΕΣΗ ΕΡΓΟΥ ΠΟΥ ΑΦΟΡΑ ΣΤΗΝ ΑΝΑΠΤΥΞΗ WEB SITE ΓΙΑ ΤΗΝ ΕΤΑΙΡΕΙΑ ΣΑΣ

7.9 ροµολόγηση. Ερωτήσεις

ΕΠΕΞΕΡΓΑΣΙΑ ΚΕΙΜΕΝΟΥ

Περίληψη ιπλωµατικής Εργασίας

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

ΤΕΙ ΗΠΕΙΡΟΥ Τμήμα Τηλεπληροφορικής & Διοίκησης

Day 1 Internet & (Browsers)

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Γ ΓΥΜΝΑΣΙΟΥ

ΠΡΟΤΑΣΗ-ΑΝΑΘΕΣΗ ΕΡΓΟΥ ΠΟΥ ΑΦΟΡΑ ΣΤΗΝ ΑΝΑΠΤΥΞΗ WEB SITE ΓΙΑ ΤΗΝ ΕΤΑΙΡΕΙΑ ΣΑΣ ESHOP

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

Μέρος Ι: Εγκατάσταση και ιαμόρφωση των MySQL, Apache και PHP

Διαδικτυακές Υπηρεσίες Αναζήτησης, Απεικόνισης και Απευθείας Πρόσβασης στα δεδομένα ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ. Έκδοση 0.1.

ΤΕΙ Κρήτης, Παράρτηµα Χανίων

Μάθημα 7: Αλγόριθμοι Χρονοδρομολόγησης

Κεφάλαιο 4: Λογισμικό Συστήματος

Οργάνωση Η/Υ. Γιώργος ηµητρίου. Μάθηµα 12 ο. Πανεπιστήµιο Θεσσαλίας - Τµήµα ΜηχανικώνΗ/Υ, Τηλεπικοινωνιών και ικτύων

ΔΙΑΚΗΡΥΞΗ ΔΗΜΟΠΡΑΣΙΑΣ ΜΕ ΑΡΙΘΜΟ ΔΔ-...

Μάθημα 6 ο. Χρονοδρομολόγηση (Scheduling)

ΚΟΙΝΩΝΙΚΗ ΔΙΚΤΥΩΣΗ ΜΕΣΩ ΚΙΝΗΤΩΝ ΣΥΣΚΕΥΩΝ: ΧΡΗΣΗ ΔΕΚΤΗ GPS ΓΙΑ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΗΣ ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ ΣΕ ΚΙΝΗΤΗ ΣΥΣΚΕΥΗ

Σχεδιασµός βασισµένος σε συνιστώσες

Εγχειρίδιο Χρήσης-Οδηγός Εκπαίδευσης Χρηστών. - Δήμος Δέλτα - Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΠΡΟΤΕΙΝΟΜΕΝΑ ΘΕΜΑΤΑ 1 στα Δίκτυα Υπολογιστών

Ο ΗΓΙΕΣ ΓΙΑ ΤΗΝ ΥΠΟΒΟΛΗ ΑΙΤΗΣΗΣ ΕΓΓΡΑΦΗΣ ΣΤΟ ΜΗΤΡΩΟ ΑΞΙΟΛΟΓΗΤΩΝ ΕΡΓΩΝ Ι ΙΩΤΙΚΟΥ ΤΟΜΕΑ ΤΗΣ ΚΤΠ Α.Ε.

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης


Βασίλης Πλαχούρας. Χρυσόστομος Καπέτης Μιχάλης Βαζιργιάννης. Οικονομικό Πανεπιστήμιο Αθηνών 3/11/2003

Μαλούτα Θεανώ Σελίδα 1

Τη φυσική (MAC) διεύθυνση που δίνει ο κατασκευαστής του δικτυακού υλικού στις συσκευές του (π.χ. στις κάρτες δικτύου). Η περιοχή διευθύνσεων που

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Προσβασιµότητα στους διαδικτυακούς κόµβους

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Τεχνολογίες και Εφαρμογές Διαδικτύου

Λειτουργικά Συστήµατα

Περίληψη ιπλωµατικής Εργασίας

Μάθημα 7 ο. Αλγόριθμοι Χρονοδρομολόγησης

Προσαρμοζόμενα. μενα και Εξατομικευμένα Επικοινωνιακά Περιβάλλοντα. Κων/νος Μουρλάς Επίκουρος Καθηγητής Τμήμα Επικοινωνίας & ΜΜΕ

Βασική δοµή και Λειτουργία Υπολογιστή

Το ολοκληρωμένο κύκλωμα μιας ΚΜΕ. «Φέτα» ημιαγωγών (wafer) από τη διαδικασία παραγωγής ΚΜΕ

Κεφάλαιο 5Β (επανάληψη) Εισαγωγή στην Πληροφορική. Τυπικοί χρόνοι πρόσβασης. Μέσος χρόνος πρόσβασης. Ταχύτητα µεταφοράς δεδοµένων

$./MirrorInitiator -n <MirrorServerAddress> -p <MirrorServerPort> \\ -s <ContentServerAddress1:ContentServerPort1:dirorfile1:delay1, \\

ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ

ΔΗΜΟΣΙΑ ΚΕΝΤΡΙΚΗ ΒΙΒΛΙΟΘΗΚΗ ΛΕΒΑΔΕΙΑΣ ΣΥΛΛΟΓΟΣ «ΦΙΛΟΙ ΒΙΒΛΙΟΘΗΚΗΣ ΛΙΒΑΔΕΙΑΣ» Κατερίνα Κεράστα Α Webmail: Gmail

Λειτουργικά Συστήματα Πραγματικού Χρόνου

Ιστορικό. *Ομάδα ανάπτυξης: Γρεασίδης Θοδωρής: 265 Κουτσαυτίκης Δημήτρης: 258 Μπούρα Βάγια: 257 Πετράκη Ελένη: 266 Φουντά Σταυρούλα: 256

Τι είναι ένα λειτουργικό σύστημα (ΛΣ); Μια άλλη απεικόνιση. Το Λειτουργικό Σύστημα ως μέρος του υπολογιστή

Λειτουργικά Συστήματα (διαχείριση επεξεργαστή, μνήμης και Ε/Ε)

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 7 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

2. Αλγόριθμοι, δομές δεδομένων και πολυπλοκότητα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΙΟΙΚΗΣΗΣ. Ανάπτυξη Πληροφοριακών Συστηµάτων Επισκόπηση Π.Σ. & τεχνικές για Ανάλυση και Ανάπτυξη. πληροφοριακών συστηµάτων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ - Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

ICOP - ΥΠΗΡΕΣΙΕΣ INTERNET-WEBSOLUTIONS ΠΡΟΤΑΣΗ-ΑΝΑΘΕΣΗ ΕΡΓΟΥ

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014

Εισαγωγή. Κατανεµηµένα Συστήµατα 01-1

ΔΙΑΚΗΡΥΞΗ ΔΗΜΟΠΡΑΣΙΑΣ ΜΕ ΑΡΙΘΜΟ ΔΔ-...

Εφαρµογή: Σύστηµα ιαχείρισης ιαδικτυακού Περίπτερου / Ιστοσελίδας στον διαδικτυακό τόπο kalliergea.gr

ΕΡΓΟ : ηµιουργία internet spot στο Πολύκεντρο Ζάκρου & επέκταση δικτύου Wi Fi στην Κάτω Ζάκρο ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΗΜΟΣ ΣΗΤΕΙΑΣ ΤΕΧΝΙΚΗ ΕΚΘΕΣΗ

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών Δίκτυα υπολογιστών. (και το Διαδίκτυο)

Ο ΗΓΟΣ ΕΠΙΜΟΡΦΩΤΗ. ηµοτικό ιαδικτυακό Ραδιόφωνο και Τηλεόραση. Y4 ηµιουργία διαδικτυακής ραδιοφωνικής εκποµπής µε τα εργαλεία

ΟΔΗΓΟΣ ΔΗΜΙΟΥΡΓΙΑΣ ΛΟΓΑΡΙΑΣΜΟΥ ΣΤΟ GOOGLE SCHOLAR ΓΙΑ ΤΑ ΜΕΛΗ ΔΙΔΑΚΤΙΚΟΥ - ΕΡΕΥΝΗΤΙΚΟΥ ΠΡΟΣΩΠΙΚΟΥ

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

11/28/2016 Απόδοση Συστημάτων, Remote Jmeter και Dacappo

Λειτουργικά Συστήματα 7ο εξάμηνο, Ακαδημαϊκή περίοδος


Προσοµοίωση λειτουργίας επικοινωνίας δεδοµένων (µόντεµ)

50 Ketseo,Theoni Sarif,Omar 104

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 001: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 7 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

Χρονοπρογραµµατισµός ιεργασιών (Process Scheduling)

Αριστοµένης Μακρής Εργαστήρια Η/Υ

Διαχειριστικό σύστημα ονομάτων χώρου

Vodafone Business Connect

Οδηγίες Χρήσης Πληροφοριακού Συστήµατος.Α.ΣΤΑ. για Φορείς Πρακτικής Άσκησης

ΠΡΑΞΗ: «Δομή Απασχόλησης και Σταδιοδρομίας (Δ.Α.ΣΤΑ.) Πανεπιστημίου Μακεδονίας» Κωδικός MIS ΥΠΟΕΡΓΟ: και α/α «01»

Network Address Translation (NAT)

Οργάνωση ενός σύγχρονου Υπολογιστικού Συστήματος ή Ηλεκτρονικού Υπολογιστή (Η/Υ) Τα σύγχρονα συστήματα Η/Υ έχουν την παρακάτω οργάνωση:

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

ιαδίκτυα & Ενδοδίκτυα Η/Υ

Σκοπός Μαθήματος. Λειτουργικά Συστήματα Η/Υ. Γενικές Πληροφορίες. Στόχοι Μαθήματος ΚΕΦΑΛΑΙΟ 1 - ΕΙΣΑΓΩΓΗ. Θεωρία: Εργαστήριο: Κεφάλαιο 1 «Εισαγωγή»

Κεφάλαιο 1 : Εισαγωγή

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Α. Ερωτήσεις Ανάπτυξης

Ενότητα 6 (Κεφάλαιο 9) Χρονοδρομολόγηση

Πρωτόκολλα Διαδικτύου (ΨΣ-326 DS151)

Transcript:

Μελέτη Πολιτικών Χρονοδροµολόγησης σε Κατανεµηµένα Συστήµατα Πλοηγητών Όνοµα : Ελένη Τσιακκούρη

οµή Παρουσίασης Εισαγωγή Στόχοι Προηγούµενη Έρευνα Πλαίσιο Εργασίας Βασικά Στάδια Αρχιτεκτονική Συστήµατος Χρονοδροµολογητής Πολιτικές Χρονοδροµολόγησης Πειραµατικά Αποτελέσµατα Προβλήµατα, Συµπεράσµατα & Μελλοντική Έρευνα 2

Εισαγωγή Κατανεµηµένη Πλοήγηση στον Παγκόσµιο Ιστό µέσο του πλοηγητή (web- crawler) WebRACE Σκοπός της πλοήγησης είναι η ικανοποίηση των ενδιαφερόντων των χρηστών (Profile driven Crawling) 3

Στόχοι Κατανεµηµένη πλοήγηση Αυτο-προσαρµοζόµενο σύστηµα Ικανοποίηση των ενδιαφέροντα των χρηστών Με βάση τα δεδοµένα στα προφίλ τους 4

Προηγουµένη Έρευνα Μελέτη πλοηγητών µε την ευρεία χρήση του ιαδικτύου και την αύξηση του όγκου πληροφοριών σ αυτό. Κατανεµηµένοι Ιστιακοί πλοηγητές είναι: Google Sergey Brin and Lawrence Page Μηχανές Αναζήτησης Μercator, UbiCrawler και Parallel Crawlers Heydon (Compaq), Gracia-Molina Molina, Edwards κ.α Εστίαση στην φρεσκάδα και σηµαντικότητα της πληροφορίας 5

Προηγουµένη Έρευνα Ζητήµατα που παραµένουν ανοικτά : Εύρος Ζώνης (Bandwidth) Φρεσκάδα πληροφορίας - τρόποι ανανέωσης των σελίδων. Κατά πόσο η αρχιτεκτονική επηρεάζει στην απόδοση Πρόσφατη έρευνα στο WWW2004 µε θέµα : Distributed Crawling and searching across Web peers 6

Πλαίσιο Εργασίας Αρχιτεκτονική erace 7

Εκτελέσιµα Προφίλ Χρηστών στο erace Είναι XML αρχεία τα οποία αποτελούνται από τρία βασικά µέρη : Προσωπικές πληροφορίες : Όνοµα, επίθετο, ηλεκτρονικό ταχυδροµείο, κτλ Πληροφορίες ενηµέρωσης (Notification information) email, sms, ανάλογα µε το είδος της συσκευής που χρησιµοποιεί (Device information) Πληροφορίες λειτουργικότητας του συστήµατος. 8

Εκτελέσιµα Προφίλ Χρηστών στο erace Πληροφορίες λειτουργικότητας του συστήµατος. Περιγραφή των επιθυµιών του χρήστη για συγκεκριµένους κόµβους (URL) Αυτές βρίσκονται στα στοιχεία URD των εκτελέσιµων προφίλ χρηστών <URD><source> web userid="user1" uri="www.stockwatch.com.cy" depth="0" cookie="" priority="1" frequency= "6" urgency="1"/> </source> <processing filtering="off" summary="off"> <filtering> <keyword key="bowling" weight="1"/> <keyword key="shooting" weight="1"/> <keyword key="hunting" weight="1"/> <keyword key="exercise" weight="1"/> </filtering> </processing> </URD> 9

Βασικά Στάδια ηµιουργία Πλάνου Χρονοδροµολόγησης Προώθηση του Πλάνου στους πλοηγητές για εκτέλεση. 10

ηµιουργίας Πλάνου Χρονοδροµολόγησης (ΠΧ) Ώς Πλάνο Χρονοδροµολόγησης (Π) ορίζουµε ένα σύνολο από Πλάνα εκτέλεσης (π i ) όπου το καθένα έχει διάρκεια δύο ωρών : {,,... } Π= π π π π 1 2 3 12 11

Πλάνα Εκτέλεσης Εντολές (URL,βάθος) Περίοδος ζωής πλάνου Χαρακτηρίζεται µοναδικά από την χρονική στιγµή εκκίνησης της εκτέλεσης του Μετά το πέρας του διαστήµατος των δύο ωρών από την στιγµή που έχει ξεκινήσει η εκτέλεσή του το Πλάνο Εκτέλεσης έχει πλέον ολοκληρώσει το χρόνο ζωής 12

Χρονοδροµολόγηση των Πλάνων Εκτέλεσης στους πλοηγητές Στην περίπτωση µας : ιεργασίες ΕΝΤΟΛΕΣ Πόρους ΠΛΟΗΓΗΤΕΣ Στόχος : Εκτέλεση των πλάνων στον επιθυµητό χρονικό διάστηµα των δύο ωρών. 13

Αρχιτεκτονική Συστήµατος Κατανεµηµένου WebRACE 14

Κατασκευαστής Πλάνων (Planner) Στιγµιότυπο απόφασης στον σχεδιασµό των πλάνων 1ο Στιγµιότυπο URD1 <url1, 4, 2> Συχνότητα = 2, βάθος = 4 URD2 <url1, 2, 2> Συχνότητα = 2, βάθος = 2 2ο Στιγµιότυπο URD1 <url1, 4, 6> Συχνότητα = 4, βάθος = 6 URD2 <url1, 2, 3> Συχνότητα = 2, βάθος = 3 15

Εκτιµητής Φόρτου Εργασίας (Workload Predictor Server) Υπεύθυνος για την δέσµευση και προώθηση πληροφοριών Εντολής Προφίλ Εντολής Ο αριθµός των εντολών που προκύπτουν από κάθε εντολή. Ο συνολικός χρόνος που χρειάστηκε για να ολοκληρωθεί κάθε εντολή. Το συνολικό µέγεθος σε (bytes) που ανακτάται από κάθε πλοηγητή για κάθε εντολή που συµπληρώνει την εκτέλεση της. 16

Εκτιµητής Φόρτου Εργασίας (Workload Predictor Server) 17

Παρακολουθητής Πόρων Παρακολουθεί την κατάσταση των πλοηγητών εσµεύει τα Προφίλ των Πλοηγητών Η διεύθυνση IP του πλοηγητή. Το όνοµα του επεξεργαστή. Τη ταχύτητα του επεξεργαστή. Τη τρέχουσα απόδοση του πλοηγητή. Το τρέχον µέγεθος της ουράς του πλοηγητή. Το ψευδώνυµο του (για τις ανάγκες επικοινωνίας µέσω RMI). 18

Παρακολουθητής Πόρων 19

οµοστοιχείο Προσαρµοστικότητας Σκοπός : Όταν παρατηρήσει ότι ο πλοηγητής δεν µεταβάλλει το µέγεθος της ουράς του και αυτό δεν είναι µηδέν, τότε σηµαδεύει τον πλοηγητή σαν απενεργοποιηµένο. Όταν το σύστηµα τείνει να δεσµεύσει όλο το εύρος ζώνης (bandwidth) που ένα τοπικό δίκτυο διαθέτει για πρόσβαση το ιαδίκτυο τότε αναλαµβάνει να ενεργοποιήσει Πλοηγητές που βρίσκονται σε ξεχωριστό δίκτυο 20

Πλοηγητής Βασικές Απαιτήσεις για κατανεµηµένη λειτουργία πλοηγητών Η εργασία κάθε πλοηγητή να είναι ελεγχόµενη Επικοινωνία µε τα δοµοστοιχεία που περιγράψαµε Επικοινωνία µε τον Εξυπηρετητή Ευρετήριο 21

Πλοηγητής 22

Εξυπηρετητής Ευρετήριο Index Server (IS) Σκοπός : Αποφυγή επανάληψης (duplication) στην εκτέλεση Εντολών και µείωση κύκλων στην πλοήγηση κατά την ανάκτηση ιστοσελίδων Εξυπηρετεί ερωτήµατα που αφορούν την εξουσιοδότηση ή όχι, της δέσµευσης κάθε ιστοσελίδας από κάποιο πλοηγητή. 23

Χρονοδροµολογητής Scheduler Αποφασίζει την κατανοµή των εντολών σε συγκεκριµένους πλοηγητές. Η απόφαση γίνεται µε βάση της πολιτικής χρονοδροµολόγησης 1η,, 2η, 2, 3η. 3 Εκτίµηση των πλοηγητών που χρειάζονται για την εκτέλεση κάποιο πλάνου στο διάστηµα των δύο ωρών. No. of Crawlers = Time to execute Plan / 2h 24

Αλγόριθµος Χρονοδροµολόγησης 25

Τι πρέπει να λάβουµε υπόψη στην Χρονοδροµολόγηση των Εντολών Καθοριστικός παράγοντας ο χρόνος εκτέλεσης της εντολή από κάθε πλοηγητή Ο χρόνος εκτέλεσης µιας εντολής καθορίζεται από παράγοντες : Εύρος ζώνης δικτύου Απόδοση του Πηγαίου Εξυπηρετητή Ταχύτητα του επεξεργαστή του Φόρτος ερωτηµάτων που εξυπηρετεί ταυτόχρονα την δεδοµένη στιγµή Υπολογιστική δύναµη και ο αριθµός των νηµάτων (threads) που τρέχουν ταυτόχρονα στον πλοηγητή 26

Χρόνος εκτέλεσης Εντολής Estimated Time J ( ) = F( Npage, Nbyte, A) Όπου Estimated Time (J) είναι ο συνολικός χρόνος εκτέλεσης της εντολής J ενώ η εντολή J αποτελεί µια δυάδα (URLi,depth i ). F είναι η συνάρτηση που λαµβάνοντας υπόψη τα πιο πάνω µεγέθη δίνει µια προσέγγιση για τον χρόνο εκτέλεσης της εντολής J. Npage είναι ο αριθµός των σελίδων θα προκύψουν κατά την εκτέλεσης της εντολής J. Νbyte είναι το συνολικό µέγεθος των δεδοµένων που πρέπει να δεσµευθούν από τους πλοηγητές. Α είναι η απόδοση του πλοηγητή (Throughput). Throughput = Α όταν αυτός στέλνει ερωτήµατα σε Α διαδικτυακού κόµβους το δευτερόλεπτο. Εποµένως, µονάδα µέτρησης της επίδοσης του πλοηγητή είναι ερωτήµατα ανά δευτερόλεπτο 27

Συνάρτηση F T N ( J) = i 0 = Link b i W i T( J ) είναι Estimated Time (J) Ν-Link είναι ο αριθµός των σελίδων που προκύπτουν από το URL που δόθηκε σαν εντολή. b i είναι το µέγεθος της σελίδας i σε bytes. W i είναι το µέσο διαθέσιµο εύρος ζώνης (available bandwidth) µεταξύ του πλοηγητή και του κόµβου i την χρονική περίοδο 28

Αρχιτεκτονική Χρονοδροµολογητή 29

Βασικοί Υπολογισµοί Απόδοση Πλοηγητή : Throughput( C i) Α = Page Hits Time Alive i Χρόνος Εκτέλεσης : Total Time To Download (J) = Number of Fetches for J Throughput 30

Πολιτικές 1η Πολιτική : Time = fetchnum / Throughput 2η Πολιτική : Ο χρόνος εκτέλεσης βασίζεται στην εκτίµηση του χρόνου ολοκλήρωσης της εντολής J σε ένα πλοηγητή όταν του έχουν ήδη σταλεί K προηγούµενες εντολές, από το τρέχον πλάνο και ο χρόνος ολοκλήρωσής κάθε µίας είναι T Q. Ν είναι οι εντολές θα προσθέσει η τρέχουσα J εντολή στην ουρά του. K T Q + N Q=0 Total Time To Download ( J) = A 31

Πολιτικές 3η Πολιτική Βασίζει την απόφαση της επιλογής του πιο κατάλληλου πλοηγητή στις προηγούµενες εκτιµήσεις χρόνου που έχουν καταχωρηθεί κατά την εκτέλεσης της εντολής για κάθε πλοηγητή του συστήµατος ξεχωριστά Στις περιπτώσεις που έχουν δοθεί προηγούµενες εντολές στον πλοηγητή από τον τρέχον Πλάνο Εκτέλεσης ή δεν υπάρχει καµία καταχώρηση χρόνου εκτέλεσης για την εντολή, τότε η απόφαση του Χρονοδροµολογητή παραµένει όπως και στην 2η πολιτική. 32

Πειραµατικά Αποτελέσµατα Σχεδιασµός Όνοµα thales ΛΣ IBM xseries Linux 9.0 Μνήµη 1GB Επεξεργαστής 2,8GHz wn005 SuperMcro Linux 7.3 1GB 2,4 GHz wn006 SuperMcro Linux 7.3 1GB 2,4 GHz wn007 SuperMcro Linux 7.3 1GB 2,4 GHz wn008 Fujitsu Desktop Linux 7.3 1GB 2,4 GHz 33

Μέγεθος Πλάνων Εκτέλεσης ως προς τον αριθµό των χρηστών 3000 Number of Users Vs Number of Commands 2500 Number of Commands 2000 1500 1000 500 0 10 100 1000 5000 10000 Number of Users 34

Κατανοµή Φόρτου εργασίας (Load Balancing) QueueSize 1700 1600 1500 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0 wn5 wn6 wn7 Πολιτική 1 0 360 720 1080 1440 Time(s) 35

Κατανοµή Φόρτου εργασίας (Load Balancing) QueueSize 1700 1600 1500 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0 wn5 wn6 wn7 0 360 720 1080 Time(s) Πολιτική 2 36

Κατανοµή Φόρτου εργασίας (Load Balancing QueueSize 1700 1600 1500 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0 wn5 wn6 wn7 0 360 720 1080 Time(s) Πολιτική 3 37

Προβλήµατα Προβλήµατα στο περιβάλλον εκπόνησης των πειραµάτων ιακοπές στο ίκτυο Μηχανές Solaris του τµήµατος µε Χαµηλούς επεξεργαστές Περιορισµένη µνήµη ιάφορους χρήστες. Προβλήµατα από τις κατανεµηµένες πλοηγήσεις: Παράπονα εταιριών Αναληθής πληροφορία στα http- response headers Κανονικοποίηση των URL. Το βάθος πλοήγησης. 38

Συµπεράσµατα Καταφέραµε να κατανέµουµε τον φόρτο εργασίας στους πόρους που χρησιµοποιήσαµε Θα ακολουθήσει περαιτέρω πειραµατική δοκιµασία για περισσότερους χρήστες. Το σύστηµα αυτο-προσαρµόζεται σε κάθε κύκλο ζωής του. Η 2η πολιτική φαίνεται να συµπεριφέρεται καλύτερα στην κατανοµή του φόρτου εργασίας. 39

Μελλοντική Έρευνα Πιο αναλυτική παρακολούθηση αποτελεσµάτων µε δυναµικό προσδιορισµό του χρονικού περιθωρίου προώθησης κάθε Πλάνων Εκτέλεσης. Κατανεµηµένα δοµοστοιχεία Scheduler και Index Server Μελέτη κατά πόσο µπορεί η εφαρµογή αυτή να εκτελείται σε περιβάλλοντα πλέγµατος (Grid Environments) 40

Σας ευχαριστώ! Ερωτήσεις?? 41

Γιατί 2 ώρες Είναι µια παράµετρος στο σύστηµα µας Ένας περιορισµός για το σύστηµα Σχετικά µε τους πόρους που έχω ικανότητα συστήµατος να εξυπηρετήσει σε 2 ώρες 42

Πληροφοριακά Σύνολο Γραµµών Κώδικα: 10068 Σύνολο Κλάσεων : 54 Crawler Scheduler Planner Workload Predictor Index Server Monitoring 6791 1331 567 511 564 304 37 3 5 4 6 3 43