Βασίλης Πλαχούρας. Χρυσόστομος Καπέτης Μιχάλης Βαζιργιάννης. Οικονομικό Πανεπιστήμιο Αθηνών 3/11/2003

Σχετικά έγγραφα
Εργαλεία ανάπτυξης εφαρμογών internet Ι

Εργαλεία Ανάπτυξης Εφαρμογών Internet I

Θεματική Ενότητα: Εκπαιδευτικό Λογισμικό. Αποθετήρια & Ανοικτοί Εκπαιδευτικοί Πόροι Ανάλυση εφαρμογής

ΕΡΓΑΣΙΑ. (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών)

Web and HTTP. Βασικά Συστατικά: Web Server Web Browser HTTP Protocol

ΑΡΧΕΙΟΘΕΤΗΣΗ ΙΣTΟΠΕΡΙΕΧΟΜΕΝΟΥ ΚΑΙ ΙΑΤΗΡΗΣΗ ΨΗΦΙΑΚΗΣ ΜΝΗΜΗΣ - Η ΕΜΠΕΙΡΙΑ ΤΟΥ ΟΠΑ

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

Linux Terminal Server Project

Προβλήματα διαλειτουργικότητας κατά την ταυτόχρονη πρόσβαση σε πηγές μέσω του πρωτοκόλλου Z39.50 & Το περιβάλλον πρόσβασης "Η ΑΡΓΩ"

ανοικτά ψηφιακά μαθήματα στα ελληνικά ΑΕΙ Λ. Μεράκος, Π. Μπαλαούρας, Κ. Τσιμπάνης

Οι Ανοικτοί Εκπαιδευτικοί Πόροι του Αποθετηρίου «Κάλλιπος» του ΣEAB: Οφέλη χρήσης και προοπτικές βιώσιμης ανάπτυξης

Αναφορά εργασιών για το δίμηνο Μάϊος Ιούνιος Ανάδοχος. Καμάτσος Παρασκευάς

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Σύστημα διαχείρισης περιεχομένου (Content Management System)

Υπηρεσίες Υποστήριξης, Δικτύωσης, Προδιαγραφών & Πιστοποίησης Ιδρυματικών Αποθετηρίων

ΠΑΝΔΗΜΟΣ Ψηφιακή Βιβλιοθήκη. Οδηγός χρήσης

Ιδρυματικό Αποθετήριο ΕΜΠ

Ερευνα και Ανάπτυξη σε Ψηφιακές / Εικονικές Βιβλιοθήκες

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Το διαδίκτυο είναι ένα δίκτυο που αποτελείτε από πολλά μικρότερα δίκτυα υπολογιστών.

Ανάπτυξη ψηφιακής βιβλιοθήκης και ιδρυματικού αποθετηρίου στην Κεντρική Βιβλιοθήκη ΕΜΠ

ΕΡΓΑΣΙΑ. (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών)

Οδηγίες για τη Ανάπτυξη Ανοικτών Ψηφιακών Μαθημάτων

Περιεχόμενα. Δημιουργία σύνδεσης ΤΙ ΕΙΝΑΙ ΙΣΤΟΣΕΛΙΔΕΣ ΚΑΙ ΤΙ ΤΟΠΟΘΕΣΙΕΣ ΙΣΤΟΥ Γνωριμία με μια ιστοσελίδα:... 38

Οδηγίες για τη Ανάπτυξη Ανοικτών Ψηφιακών Μαθημάτων

Ενισχυμένη Έκδοση Κεφάλαιο 2 Σύνδεση και Επικοινωνία Online

Έρευνα για την προσβασιμότητα των τυφλών και των ατόμων με περιορισμένη όραση στους Δικτυακούς Τόπους των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών

Γεωχωρική πληροφορία και υποστήριξη αποφάσεων σε επίπεδο ΟΤΑ

Εγχειρίδιο Επιμελητή Δράσεων. (Υπηρεσία Ενημέρωσης για Εκπαιδευτικές και Πολιτισμικές Δράσεις)

Ενιαίο Σύστημα Ψηφιακής Βιβλιοθήκης του Πανεπιστημίου Αθηνών

e-publishing Υπηρεσίες Ηλεκτρονικών εκδόσεων- Τίτλος παρουσίασης epublishing Open Book Press

ΑΝΑΠΤΥΞΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΨΗΦΙΑΚΩΝ ΣΥΛΛΟΓΩΝ ΕΦΗΜΕΡΙΔΩΝ

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

To λεξικό του Internet

Αναβάθμιση και εμπλουτισμός ΙδρυματικούΑποθετηρίουΕΜΠ

ανοικτά ψηφιακά μαθήματα στα ελληνικά ΑΕΙ

ΠΡΟΔΙΑΓΡΑΦΕΣ ΔΙΑΔΙΚΤΥΑΚΟΥ ΤΟΠΟΥ ΕΥΡΩΠΑΪΚΟΥ ΚΕΝΤΡΟΥ ΚΑΤΑΝΑΛΩΤΗ ΕΛΛΑΔΑΣ

Τι είναι ένα σύστημα διαχείρισης περιεχομένου; δυναμικό περιεχόμενο

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

, α/α: 1. Εξόδου» Παιδείας

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

World Wide Web: Ο παγκόσµιος ιστός Πληροφοριών

2 Μάρκετινγκ µηχανών αναζήτησης (Search Engine Marketing).

Διαλειτουργικότητα μεταξύ αρχείων (1/2)

XΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Σχεδιασμός και Υλοποίηση ενός πληροφοριακού συστήματος για τους τεχνικούς του φυσικού αερίου

ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ψηφιοποίηση μπορεί να γίνει σε χώρους της Διεύθυνσης Ανθρώπινου Δυναμικού ΕΛΤΑ (ΔΑΔ) με μέσα και πόρους του αναδόχου».

Διαχείριση Πολιτισμικών Δεδομένων

Βασικές Έννοιες Web Εφαρμογών

Αποθετήριο ΕΛ/ΛΑΚ

Αξιοποίηση και διάθεση ελληνικού ψηφιακού έγκριτου περιεχομένου

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΑΝΑΚΟΙΝΩΣΕΙΣ ΠΡΟΜΗΘΕΙΩΝ/ΕΡΓΑΣΙΩΝ ΜΕ ΛΗΨΗ ΠΡΟΣΦΟΡΏΝ 10/16

Ερευνητικό Αποθετήριο Πανεπιστημίου Πειραία

Η ΧΡΗΣΗ ΤΗΣ ΥΠΟΔΟΜΗΣ ΧΩΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΑΝΑΖΗΤΗΣΗ ΚΑΙ ΑΠΕΙΚΟΝΙΣΗ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

«Περιεχόµενα. 03 Εισαγωγή Ένα ολοκληρωµένο πληροφοριακό σύστηµα. 04 Περιγραφή Εργαλείο εφαρµογής διαδικασιών

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΙΣΤΟΤΟΠΩΝ

Ανοικτά Ψηφιακά Μαθήματα Η εμπειρία του ΠΑΜΑΚ

Η Πύλη των Μονάδων Αριστείας ma.ellak.gr & η Υπηρεσία Τηλεκπαίδευσης

ΠΟΛΙΤΙΚΗ ΔΙΑΧΕΙΡΙΣΗΣ ΤΟΥ ΙΔΡΥΜΑΤΙΚΟΥ ΑΠΟΘΕΤΗΡΙΟΥ ΤΟΥ ΤΕΙ ΗΠΕΙΡΟΥ

Ταξινόμηση, φίλτρα, γραφήματα στα υπολογιστικά φύλλα.

Vodafone Business Connect

Εργαλεία Ανάπτυξης Εφαρμογών Internet I

Σχεδιασμός του Ολοκληρωμένου Συστήματος Ψηφιακής Βιβλιοθήκης του Πανεπιστημίου Αθηνών

Ο ΕΘΝΙΚΟΣ ΣΥΣΣΩΡΕΥΤΗΣ ΕΚΠΑΙΔΕΥΤΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΦΩΤΟΔΕΝΤΡΟ» : ΔΥΝΑΤΟΤΗΤΕΣ ΚΑΙ ΛΕΙΤΟΥΡΓΙΕΣ.

Από τον κατάλογο Web επιλέγουμε το Page, οπότε στο κυρίως μέρος της οθόνης εμφανίζονται οι σελίδες τις οποίες έχουμε δικαίωμα να ενημερώσουμε.

Εργαστείτε εξυπνότερα με την Canon

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάης 2013 Όνομα : Μπελούλη Αγάθη

H Αρχή Πιστοποίησης των Ελληνικών Ακαδημαϊκών Ιδρυμάτων (HARICA)

Οι διαδικασίες ενος CMS είναι σχεδιασμένες για να:

E-LIS: E-prints για τη Βιβλιοθηκονομία και την Επιστήμη της Πληροφόρησης (ΒΕΠ)

Συστήματα πανταχού παρόντος υπολογιστή σε περιβάλλοντα υβριδικών βιβλιοθηκών

H υπηρεσία αποθετηρίων SaaS του ΕΚΤ. Απρίλιος 2016

Αρχιτεκτονική πελάτη-εξυπηρέτη Οι διεργασίες που εκτελούνται στο δίκτυο είναι είτε πελάτες (clients) είτε εξυπηρέτες (servers). Εξυπηρέτης: παθητικός,

ΤΕΛΙΚΕΣ ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ (6 Μονάδες ECTS)- Ακαδημαϊκό Έτος

Επικεντρώνεται στην περιγραφή της χρήσης της Ανέμη και στην αξιολόγησή της.

ΠΟΛΙΤΙΚΗ ΔΙΑΧΕΙΡΙΣΗΣ ΤΟΥ ΙΔΡΥΜΑΤΙΚΟΥ ΑΠΟΘΕΤΗΡΙΟΥ ΤΟΥ ΤΕΙ ΗΠΕΙΡΟΥ

Εφαρμογές ΤΠΕ στην εξ Αποστάσεως Εκπαίδευση. Αχιλλέας Καμέας Επικ. Καθηγητής ΣΘΕΤ Διευθυντής ΕΕΥΕΜ

Σχολείο, Εκπαιδευτικοί Διαδικτυακή Παρουσία με χρήση CMS. Α. Χατζηπαπαδόπουλος Φ. Δεληγιάννης 1 ο ΕΚ Αθηνών

CESSDA ATTIKH: Παρουσίαση αποτελεσμάτων υποέργων Εθνικού Κέντρου Κοινωνικών Ερευνών. Ερευνητική Ομάδα ΕΚΚΕ

Ήλιος: Το ψηφιακό Αποθετήριο Ανοικτής Πρόσβασης του Εθνικού Ιδρύματος Ερευνών

Δράση/Αποθετήριο «Κάλλιπος» και η συμβολή των ανοικτών ακαδημαϊκών συγγραμμάτων στη Διά Βίου Μάθηση

Ψηφιακές πηγές για την έρευνα στις Ανθρωπιστικές Επιστήμες

ΗΜΕΡΟΛΟΓΙΟ ΓΛΩΣΣΑΡΙ ΔΙΑΔΙΚΤΥΟΥ

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΕΡΓΟΥ

Σύγχρονη και Ασύγχρονη Τηλεκπαίδευση στο Οικονομικό Πανεπιστήμιο Αθηνών. Άννα Κεφάλα Κέντρο Διαχείρισης Δικτύων

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Όνομα : Μπελούλη Αγάθη

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ web εφαρµογής - ηλεκτρονικού κατατήµατος για έξυπνα κινητά

Υπηρεσίες Ψηφιακής Βιβλιοθήκης Ανοικτής Πρόσβασης Ε.Μ.Π.

Στρατηγικό Σχέδιο Για τη Βιώσιµη Ανάπτυξη της Θεσσαλονίκης (ΣΣΒΑΘ) 1 η Ενδιάµεση Έκθεση 3. ηµιουργία και Λειτουργία Web site

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Σχεδιασμός και υλοποίηση κυκλώματος μέτρησης κατανάλωσης ισχύος

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

Περιεχόμενα. Πληροφορίες Σχετικά με το βιβλίο...11 Τι είναι το WordPress...11 Πληροφορίες για τον συγγραφέα...12

ΑνοικτάΜαθήματασταΕλληνικά ΠανεπιστήμιακαιΤΕΙ

Ανάπτυξη πλήρους διαδικτυακής e-commerce εφαρμογής με χρήση του CMS WordPress

«Εμπειρία ανάπτυξης συστημάτων βιβλιοθηκών Συνεργασίες με βιβλιοθήκες ββ Εξέλιξη ξη ΑΒΕΚΤ»

Transcript:

Χρυσόστομος Καπέτης Μιχάλης Βαζιργιάννης Οικονομικό Πανεπιστήμιο Αθηνών 3/11/2003

Απώλεια της πληροφορίας από τους ιστότοπους του πανεπιστημίου Ανάγκη για μακροπρόθεσμη διατήρηση Προστασία της φήμης του ιδρύματος Απουσία δραστηριοτήτων αρχειοθέτησης ιστοπεριεχομένου στον ελληνικό χώρο Αρχειοθέτηση ιστοπεριεχομένου από τους ιστότοπους του ΟΠΑ Απαιτήσεις σε υλικό Ανάλυση των δεδομένων Συσχέτιση με τους στόχους της βιβλιοθήκης 1/15

Αρχειοθέτηση Ιστοπεριεχομένου Παρουσίαση συστήματος Χαρακτηριστικά δεδομένων Ρόλος της βιβλιοθήκης Επεκτάσεις και συμπεράσματα 2/15

Απώλεια περιεχομένου από ιστότοπους Αλλαγές σε ιστοσελίδες Διακοπή συντήρησης ιστότοπων Αστοχία υλικού Αναγκαιότητα για αρχειοθέτηση ιστοπεριεχομένου Πρωτοβουλίες από φορείς σε διαφορετικά επίπεδα Internet Archive, μη-κερδοσκοπικός οργανισμός Εθνικές βιβλιοθήκες Μεμονωμένοι οργανισμοί Αρχειοθέτηση Ιστοπεριεχομένου 3/15

Βασισμένο σε ελεύθερο λογισμικό - λογισμικό ανοικτού κώδικα 3 υπηρεσίες Αναζήτηση με βάση το URL των ιστοσελίδων Αναζήτηση με λέξεις κλειδιά Πλοήγηση στις αρχειοθετημένες ιστοσελίδες http://archive.aueb.gr Παρουσίαση συστήματος 4/15

Χρησιμοποιεί το λογισμικό Heritrix Crawler σχεδιασμένος απο το Internet Archive για την αρχειοθέτηση ιστοπεριεχομένου Αποθήκευση δεδομένων σύμφωνα με το πρότυπο WARC (ISO 88500 2009) Συμπιεσμένα αρχεία με πολλαπλές εγγραφές Αποθήκευση όλων των τύπων αρχείων Συλλογή δεδομένων με εκκίνηση από 82 URLs Σεβασμός στην ομαλή λειτουργία των εξυπηρετητών. Ανάκτηση ενός URL ανά 10 δευτερόλεπτα από τον ίδιο εξυπηρετητή με αναμονή 10 φορές το χρόνο που χρειάστηκε η τελευταία ανάκτηση Παρουσίαση συστήματος 5/15

Δημιουργία ευρετηρίου με βάση το URL και την ημερομηνία συλλογής κάθε URL Βασισμένο στο λογισμικό Wayback Machine Ερωτήσεις με χρονικό περιορισμό Παρουσίαση συστήματος 6/15

Αναζήτηση στο πλήρες κείμενο των αρχειοθετημένων ιστοσελίδων Βασισμένο στο λογισμικό NutchWax Παρουσίαση συστήματος 7/15

4 συλλογές δεδομένων Crawl C1 C2 C3 C4 Started at 2010-02-26 2010-03-20 2010-04-26 2010-05-13 Not Fetched 2882 2684 17097 8661 2xx (Successful) 139212 96495 113811 141084 3xx (Redirection) 3200 2364 3020 3135 4xx (Client error) 10867 8248 10141 10808 5xx (Server Error) 24 24 15 16 Πιο συχνοί τύποι αρχείων HTML, JPEG, GIF, PDF Αντιστοιχούν σε περισσότερα από 88% των URLs Παρόμοια κατανομή στους ιστότοπους των ΕΚΠΑ, ΕΜΠ Χαρακτηριστικά δεδομένων 8/15

Συλλογή δεδομένων για τους ιστότοπους που δεν υπήρξε αλλαγή στις ρυθμίσεις Crawl C1 C2 C3 C4 Started at 2010-02-26 2010-03-20 2010-04-26 2010-05-13 Not Fetched 1730 1604 1786 1895 2xx (Successful) 68825 67826 67768 66497 3xx (Redirection) 3048 2241 2775 2887 4xx (Client error) 7572 7238 7358 6504 5xx (Server Error) 25 25 15 14 Χαρακτηριστικά δεδομένων 9/15

Δεδομένα από το δίκτυο: μεταξύ 10 και 15GB Αποθήκευση σε συμπιεσμένη μορφή: μεταξύ 8 και 10GB Αποθήκευση των URLs που αλλάζουν μόνο: λιγότερα από 2GB Χαρακτηριστικά δεδομένων 10/15

94% των αλλαγών αφορούν δυναμικές HTML σελίδες στο C1/C2 Crawls C1/C2 C2/C3 C3/C4 All Web sites URL in C i \C i+1 50747 6017 13990 URL in C i+1 \C i 8030 23333 41263 URL in C i C i+1 88465 90578 99821 URL same 56749 63865 59805 URL changes 31716 26613 40016 Excluding reconfigured Web sites URL in C i \C i+1 3848 3847 5347 URL in C i+1 \C i 2849 3429 4076 URL in C i C i+1 64977 64339 62421 URL same 54691 55127 53193 URL changes 10286 9212 9228 Χαρακτηριστικά δεδομένων 11/15

Στόχοι της βιβλιοθήκης Αρχειοθέτηση και διατήρηση ιστοπεριεχομένου του πανεπιστημίου Ολοκλήρωση με το ψηφιακό αποθετήριο της ββ βιβλιοθήκης Θεματικές συλλογές για την πανεπιστημιακή κοινότητα Ζητήματα που προκύπτουν Πνευματικά δικαιώματα Υλικοτεχνική υποδομή Πολιτικές και στρατηγικές σχετικά με Επιλογή πληροφορίας Υιοθέτηση προτύπων για μεταδεδομένα και δεικτοδότηση Ρόλος της βιβλιοθήκης 12/15

Βελτιστοποίηση συλλογής δεδομένων (crawling) Αυξημένη συχνότητα Δείκτες ποιότητας/πληρότητας δεδομένων Συλλογή δεδομένων μέσω φορμών (hidden Web) Συμπίεση αποθηκευμένης πληροφορίας Ανάπτυξη επιπλέον υπηρεσιών Επεκτάσεις και συμπεράσματα 13/15

Η αρχειοθέτηση ιστοπεριεχομένου στο ΟΠΑ αποτελεί μια βιώσιμη διαδικασία Περιορισμένες υλικοτεχνικές απαιτήσεις Η αρχειοθέτηση ιστοπεριεχομένου ε ο ο ως στόχος της βιβλιοθήκης του πανεπιστημίου Μακροπρόθεσμη πρόσβαση στην πληροφορία Ανάλογα μεγέθη για τους ιστότοπους άλλων ιδρυμάτων Επεκτάσεις και συμπεράσματα 14/15

15/15