Ταςηόσπονη αναζήηηζη ζε πολλαπλέρ πηγέρ δεδομένων με σπήζη λογιζμικού ανοισηού κώδικα και επγαλείος εξαγωγήρ πεπιεσομένος από ιζηοζελίδερ]

Σχετικά έγγραφα
Ταυτόχρονη αναζήτηση σε πολλαπλές πηγές δεδοµένων µε χρήση λογισµικού ανοιχτού κώδικα και εργαλείου εξαγωγής περιεχοµένου από ιστοσελίδες

Α Ο Κ Η Α Μ Α Ζ Η Η Ρ Η ( S E A R C H )

Ταςηόσπονη αναζήηηζη ζε πολλαπλέρ πηγέρ δεδομένων με σπήζη λογιζμικού ανοισηού κώδικα και επγαλείος εξαγωγήρ πεπιεσομένος από ιζηοζελίδερ

ΑΛΛΑΓΗ ΟΝΟΜΑΣΟ ΚΑΙ ΟΜΑΔΑ ΕΡΓΑΙΑ, ΚΟΙΝΟΥΡΗΣΟΙ ΦΑΚΕΛΟΙ ΚΑΙ ΕΚΣΤΠΩΣΕ ΣΑ WINDOWS XP

Case Study. Παξαθάηω παξνπζηάδνπκε βήκα - βήκα κε screenshots έλα παξάδεηγκα ππνβνιήο κηαο εξγαζίαο θαη ηελ παξαγωγή ηνπ Originality Report.

ΡΤΘΜΙΕΙ ΔΙΚΣΤΟΤ ΣΑ WINDOWS

Βάσεις Δεδομέμωμ. Εξγαζηήξην V. Τκήκα Πιεξνθνξηθήο ΑΠΘ

Η αξρή ζύλδεζεο Client-Server

Κεθάλαιο 1. Ενόηηηα 2 Πλάνο Μάρκεηινγκ. Εξγαιεία Μάξθεηηλγθ. Dr. Andrea Grimm Dr. Astin Malschinger

ΕΓΧΕΙΡΙΔΙΟ ΕΚΔΟΗ 8.0.0

Απνηειέζκαηα Εξσηεκαηνινγίνπ 2o ηεηξάκελν

Κευάλαιο 8 Μονοπωλιακή Συμπεριφορά- Πολλαπλή Τιμολόγηση

Έκδοζη /10/2014. Νέα λειηοσργικόηηηα - Βεληιώζεις

Ενδεικτικά Θέματα Στατιστικής ΙΙ

Δπηιέγνληαο ην «Πξνεπηινγή» θάζε θνξά πνπ ζα ζπλδέεζηε ζηελ εθαξκνγή ζα βξίζθεζηε ζηε λέα ρξήζε.

ΓΗΑΓΩΝΗΣΜΑ ΣΤΑ ΜΑΘΖΜΑΤΗΚΑ. Ύλη: Μιγαδικοί-Σσναρηήζεις-Παράγωγοι Θεη.-Τετν. Καη Εήηημα 1 ο :

Οργάνωση και Δομή Παρουσιάσεων

H ΜΑΓΕΙΑ ΤΩΝ ΑΡΙΘΜΩΝ

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ. Οξηδόληηα θαη θαηαθόξπθε κεηαηόπηζε παξαβνιήο

Οδηγίες τρήζης για λειηοσργία μεηαθοράς καναλιών ζε υηθιακό δέκηη OST-7060 HD

Άσκηση 1 - Μοπυοποίηση Κειμένου

Αιγόξηζκνη Γνκή επηινγήο. Πνιιαπιή Δπηινγή Δκθωιεπκέλεο Δπηινγέο. Δηζαγωγή ζηηο Αξρέο ηεο Δπηζηήκεο ηωλ Η/Υ. introcsprinciples.wordpress.

Διαδικαζία μεηαθοράς δεδομένων Εκκαθαριζηικής για ηο Eιδικό ζημείωμα περαίωζης Φ.Π.Α

ACTA A.E. Αριςτο Σέλεια Πιςτοποίηςη. Ανθρώπινου Δυναμικοφ. «ΠΙΣΟΠΟΙΗΗ ΑΝΘΡΩΠΙΝΟΤ ΔΤΝΑΜΙΚΟΤ Εξελίξεισ - Προοπτικέσ»

5 η Δργαζηηριακή Άζκηζη Κσκλώμαηα Γσαδικού Αθροιζηή/Αθαιρέηη

TOOLBOOK (μάθημα 2) Δεκηνπξγία βηβιίνπ θαη ζειίδσλ ΠΡΟΑΡΜΟΓΗ: ΒΑΛΚΑΝΙΩΣΗ ΔΗΜ. ΕΚΠΑΙΔΕΤΣΙΚΟ ΠΕ19 1 TOOLBOOK ΜΑΘΗΜΑ 2

Ανάπτυξη Ελληνικής τεχνολογίας μηχανών ηλεκτροπαραγωγής ORC

Α. Εηζαγσγή ηεο έλλνηαο ηεο ηξηγσλνκεηξηθήο εμίζσζεο κε αξρηθό παξάδεηγκα ηελ εκx = 2

Ζαχαρίας Μ. Κοντοπόδης Εργαστήριο Λειτουργικών Συστημάτων ΙΙ

Σημεία Ασύπματηρ Ππόσβασηρ (Hot-Spots)

ΑΝΤΗΛΙΑΚΑ. Η Μηκή ζθέθηεθε έλαλ ηξόπν, γηα λα ζπγθξίλεη κεξηθά δηαθνξεηηθά αληειηαθά πξντόληα. Απηή θαη ν Νηίλνο ζπλέιεμαλ ηα αθόινπζα πιηθά:

ΣΔΥΝΟΛΟΓΙΚΟ ΔΚΠΑΙΓΔΤΣΙΚΟ ΙΓΡΤΜΑ ΚΑΒΑΛΑ ΣΜΗΜΑ ΒΙΟΜΗΥΑΝΙΚΗ ΠΛΗΡΟΦΟΡΙΚΗ

ΕΝΤΟΛΕΣ WINDOWS ΚΑΙ UNIX

ΔΕΟ 13. Ποσοτικές Μέθοδοι. θαη λα ππνινγίζεηε ην θόζηνο γηα παξαγόκελα πξντόληα. Να ζρεδηαζηεί γηα εύξνο πξντόλησλ έσο

Μορθές Κακόβοσλοσ Κώδικα (Malicious Code)

Έλαο πίνακας σσμβόλων ππνζηεξίδεη δύν βαζηθέο ιεηηνπξγίεο:

ΒΗΜΑ 2. Εηζάγεηε ηνλ Κωδηθό Πξόζβαζεο πνπ ιακβάλεηε κε SMS & δειώλεηε επηζπκεηό Όλνκα Πξόζβαζεο (Username) θαη ην ζαο

ΣΕΙ ΙΟΝΙΩΝ ΝΗΩΝ ΣΜΗΜΑ: ΣΕΥΝΟΛΟΓΙΑ ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΣΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΥΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ Ρέππα Μαξγαξίηα

Γοκή επαλάιευες Δληοιές Όζο & Μέτρης_όηοσ

B-Δέλδξα. Τα B-δέλδξα ρξεζηκνπνηνύληαη γηα ηε αλαπαξάζηαζε πνιύ κεγάισλ ιεμηθώλ πνπ είλαη απνζεθεπκέλα ζην δίζθν.

ΘΔΚΑ ΡΖΠ ΑΛΑΓΛΩΟΗΠΖΠ

Αζκήζεις ζτ.βιβλίοσ ζελίδας 13 14

iii. iv. γηα ηελ νπνία ηζρύνπλ: f (1) 2 θαη

ΜΑΘΗΜΑ / ΤΑΞΗ : ΗΛΕΚΤΡΟΛΟΓΙΑ/Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: 08/09/2014

Κβαντικοί Υπολογισμοί. Πέκπηε Γηάιεμε

Hellas online Προεπιλεγμένες ρσθμίσεις για FritzBox Fon WLAN 7140 (Annex B) FritzBox Fon WLAN Annex B ( )

Μονοψϊνιο. Αγνξά κε ιίγνπο αγνξαζηέο. Δύναμη μονοψωνίος Η ηθαλόηεηα πνπ έρεη ν αγνξαζηήο λα επεξεάζεη ηελ ηηκή ηνπ αγαζνύ.

Διαηιμήζεις για Αιολικά Πάρκα. Κώδικες 28, 78 και 84

x x x x tan(2 x) x 2 2x x 1

ΔΙΑΓΩΝΙΣΜΑ ΣΤΗ ΦΥΣΙΚΗ. Ύλη: Εσθύγραμμη Κίνηζη

Constructors and Destructors in C++

Δξγαιεία Καηαζθεπέο 1 Σάμε Σ Δ.Κ.Φ.Δ. ΥΑΝΙΧΝ ΠΡΧΣΟΒΑΘΜΙΑ ΔΚΠΑΙΓΔΤΗ. ΔΝΟΣΗΣΑ 11 ε : ΦΧ ΔΡΓΑΛΔΙΑ ΚΑΣΑΚΔΤΔ. Καηαζθεπή 1: Φαθόο κε ζσιήλα.

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 4 ΣΥΝΔΥΑΣΤΙΚΑ ΚΥΚΛΩΜΑΤΑ

γηα ηνλ Άξε Κσλζηαληηλίδε

Άζκηζη ζτέζης κόζηοσς-τρόνοσ (Cost Time trade off) Καηαζκεσαζηική ΑΔ

ΜΗΧΑΝΟΛΟΓΙΚΟ ΣΧΔΓΙΟ ΙΙ

ΟΠΤΙΚΗ Α. ΑΝΑΚΛΑΣΖ - ΓΗΑΘΛΑΣΖ

ΠΑΝΔΛΛΑΓΗΚΔ ΔΞΔΣΑΔΗ Γ ΣΑΞΖ ΖΜΔΡΖΗΟΤ ΓΔΝΗΚΟΤ ΛΤΚΔΗΟΤ ΚΑΗ ΔΠΑΛ ΣΔΣΑΡΣΖ 25 ΜΑΨΟΤ 2016 ΔΞΔΣΑΕΟΜΔΝΟ ΜΑΘΖΜΑ: ΑΡΥΔ ΟΗΚΟΝΟΜΗΚΖ ΘΔΧΡΗΑ ΠΡΟΑΝΑΣΟΛΗΜΟΤ - ΔΠΗΛΟΓΖ

1. Οδηγίερ εγκαηάζηαζηρ και σπήζηρ έξςπνυν καπηών και τηθιακών πιζηοποιηηικών με σπήζη ηος λογιζμικού Μοzilla Thunderbird

ΟΣΑ Επηρεηξεζηαθή Ννεκνζύλε. Ελόηεηα: Ad1.2.2 «Ση θξύβεηαη» πίζω από κηα Επηρεηξεζηαθή Αλαθνξά (report): XML & XSD γηα αξράξηνπο

ΑΠΑΝΤΗΣΔΙΣ ΓΙΚΤΥΑ ΥΠΟΛΟΓΙΣΤΩΝ II ΔΠΑΛ

ΑΓΩΜΘΡΘΙΞΘ ΤΩΠΞΘ ΡΘΡ ΛΘΙΠΕΡ ΗΚΘΙΘΕΡ ΛΘΤΑΗΚΘΔΗΡ Τ.

7. ΚΑΤΑΧΩΡΗΤΕΣ ΕΡΩΤΗΣΕΙΣ ΑΣΚΗΣΕΙΣ. 3. Έλαο θαηαρσξεηήο SISO ησλ 4 bits έρεη: α) Μία είζνδν, β) Δύν εηζόδνπο, γ) Σέζζεξεηο εηζόδνπο.

ΦΥΣΙΚΗ ΤΩΝ ΡΕΥΣΤΩΝ. G. Mitsou

ΔΡΓΑΙΑ 1. Γιαδικησακά πληροθοριακά σζηήμαηα. Ομάδα Δργαζίας: Μεηαπηστιακοί Φοιηηηές. ηέθανος Κονηοβάς ΑΔΜ :283. Πάζτος Βαζίλειος ΑΔΜ :288

Ηλεκηπονικά Απσεία και Διεπαθέρ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

Σρήκα Α. Γξάθνπκε ηα ζηνηρεία ηνπ Πξνκεζεπηή θαη παηάκε Δηζαγσγή. Σρήκα Β1

Βιομησανικόρ ζσεδιαζμόρ πποϊόνηων από ανακςκλωμένερ ζςζκεςαζίερ

6 η Εργαζηηριακή Άζκηζη Επαλήθεσζη Λειηοσργίας Βαζικών Φλιπ-Φλοπ

Να ζρεδηάζεηο ηξόπνπο ζύλδεζεο κηαο κπαηαξίαο θαη ελόο ιακπηήξα ώζηε ν ιακπηήξαο λα θσηνβνιεί.

ΠΡΩΣΟΚΟΛΛΑ ΓΙΑΥΔΙΡΗΗ ΣΩΝ ΣΔΡΗΓΟΝΙΚΩΝ ΒΛΑΒΩΝ Δ ΔΝΗΛΙΚΔ

Σπληήξεζε ηξνθίκσλ ρσξίο ρεκηθά πξόζζεηα PROJECT B ΛΥΚΕΙΟΥ

Διατείριση Φσσικών Καταστρουών: ACTIVE LANDSLIDE INVENTORY MAPPING AND SUSCEPTIBILITY ZONING

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΤΙΚΗ ΣΚΥΤΑΛΟΓΡΟΜΙΑ 2015 ΓΙΑ ΤΟ ΓΥΜΝΑΣΙΟ Τεηάπηη 28 Ιανουαπίου 2015 ΛΔΥΚΩΣΙΑ Τάξη: Α Γυμναζίου

EL Eνωμένη στην πολυμορυία EL A8-0046/92. Τροπολογία. Sylvie Goddyn εμ νλόκαηνο ηεο νκάδαο ENF

Σ Δ Υ Ν Ι Κ Η Δ Κ Θ Δ Η Π Ρ Ο Μ Η Θ Δ Ι Α Ο Ι Κ Ο Γ Ο Μ Ι Κ Ω Ν Τ Λ Ι Κ Ω Ν Γ Η Μ Ο Τ Β Ο Λ Β Η

Κεθάιαην 20. Ελαχιστοποίηση του κόστους

Απαντήσεις θέματος 2. Παξαθάησ αθνινπζεί αλαιπηηθή επίιπζε ησλ εξσηεκάησλ.

ΥΡΙΣΟΤΓΔΝΝΙΑΣΙΚΔ ΚΑΣΑΚΔΤΔ

Δξγαζηεξηαθή άζθεζε 03. Σηεξενγξαθηθή πξνβνιή ζην δίθηπν Wulf

ΣΔΥΝΟΛΟΓΙΚΟ ΔΚΠΑΙΓΔΤΣΙΚΟ ΙΓΡΤΜΑ (ΣΔΙ) ΓΤΣΙΚΗ ΜΑΚΔΓΟΝΙΑ

ΣΡΑΠΕΖΑ ΘΕΜΑΣΩΝ Α ΛΤΚΕΙΟΤ

Έθδνζε /11/2014. Νέα ιεηηνπξγηθόηεηα - Βειηηώζεηο

ΜΑΘΗΜΑΣΑ ΦΩΣΟΓΡΑΦΙΑ. Ειζαγωγή ζηη Φωηογραθία. Χριζηάκης Σαζεΐδης EFIAP

Γραφεύα Επικοινωνύασ & Ενημϋρωςησ ϋρρεσ, Τψηλϊντου 4 3οσ Όροφοσ ΣΗΛ ΥΑΦ

Κινητός και Διάχυτος Υπολογισμός (Mobile & Pervasive Computing)

Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο κόζηος ανά μονάδα παραγωγής. Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο ζηαθερό κόζηος ανά μονάδα παραγωγής

α) ηε κεηαηόπηζε x όηαλ ην ζώκα έρεη κέγηζην ξπζκό κεηαβνιήο ζέζεο δ) ην κέγηζην ξπζκό κεηαβνιήο ηεο ηαρύηεηαο

Η επιζκόπηζη ηης έμμιζθης ενηολής ζηην Αλλοδαπή. Καηεξίλα Γαιαλνπνύινπ, Intellectual Property Manager, Microsoft Ειιάο Α.Ε.

Τν Πξόγξακκα ζα αλαθνηλσζεί, ακέζσο κεηά ηηο γηνξηέο ηνπ Πάζρα.

Αντισταθμιστική ανάλυση

ΑΙΟΛΙΚΑ ΠΑΡΚΑ. Δρώτηση 1

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

ΔΦΑΡΜΟΜΔΝΑ ΜΑΘΗΜΑΣΙΚΑ ΣΗ ΧΗΜΔΙΑ Ι ΘΔΜΑΣΑ Α επηέκβξηνο Να ππνινγηζηνύλ νη κεξηθέο παξάγσγνη πξώηεο ηάμεο ηεο ζπλάξηεζεο f(x,y) =

ΛΙΜΝΗ ΤΣΑΝΤ. Σρήκα 1. Σρήκα 2

ΔΝΓΔΙΚΣΙΚΔ ΛΤΔΙ ΣΑ ΜΑΘΗΜΑΣΙΚΑ ΠΡΟΑΝΑΣΟΛΙΜΟΤ 2017

Η/Υ A ΤΑΞΕΩΣ ΑΕ Συστήματα Αρίθμησης. Υποπλοίαρχος Ν. Πετράκος ΠΝ

Η ΜΗΧΑΝΗ ΑΝΑΖΗΣΗΗ GOOGLE Περιγραφή λειτουργίασ, επιθέςεισ και τρόποι αντιμετώπιςησ

ΠΑΡΑΡΣΗΜΑ Δ. ΔΤΡΔΗ ΣΟΤ ΜΔΣΑΥΗΜΑΣΙΜΟΤ FOURIER ΓΙΑΦΟΡΩΝ ΗΜΑΣΩΝ

Transcript:

Ταςηόσπονη αναζήηηζη ζε πολλαπλέρ πηγέρ δεδομένων με σπήζη λογιζμικού ανοισηού κώδικα και επγαλείος εξαγωγήρ πεπιεσομένος από ιζηοζελίδερ] Κσλζηαληίλνο Νηνλάο Βηβιηνζήθε θαη Κέληξν Πιεξνθφξεζεο ηνπ Παλεπηζηεκίνπ Μαθεδνλίαο Δγλαηίαο 156, Θεζζαινλίθε 2310891830 donas@uom.gr Εηζαγωγή Η αμία ησλ κεραλψλ αλαδήηεζεο γηα ηνλ εληνπηζκφ πιεξνθνξηψλ είλαη αδηακθηζβήηεηε αιιά είλαη απιψο αδχλαην λα θαηαζθεπαζηεί επξεηήξην (index) γηα νιφθιεξν ηνλ Παγθφζκην Ιζηφ. Απηφ νθείιεηαη ζηελ ηαρχηαηε αλάπηπμε ηνπ Ιζηνχ θαζψο θαη ζην φηη πνιιέο ηζηνζειίδεο (web pages) ελεκεξψλνληαη ηαθηηθά. Ο φγθνο ηεο δηαζέζηκεο πιεξνθνξίαο ζηνλ Ιζηφ είλαη πξαγκαηηθά ηεξάζηηνο θαη κάιηζηα ζπλερψο απμάλεηαη. Οη πιεξνθνξίεο απηέο φκσο βξίζθνληαη θαηαθεξκαηηζκέλεο ζε κεγάιν πιήζνο δηαθνξεηηθψλ ειεθηξνληθψλ ηνπνζεζηψλ. Σν πξφβιεκα είλαη αθφκα κεγαιχηεξν δηφηη ηεξάζηηνο αξηζκφο ζειίδσλ δελ είλαη νξαηφο ζηα πξνγξάκκαηα «ζάξσζεο» πνπ ρξεζηκνπνηνχλ νη κεραλέο αλαδήηεζεο (spiders ή web crawlers). Οη ζειίδεο απηέο απνηεινχλ ην ιεγφκελν βαζύ Ιζηό (deep Web), ην κεγαιχηεξν κέξνο ηνπ νπνίνπ απνηειείηαη απφ online βάζεηο δεδνκέλσλ ειεγρφκελεο ρξήζεο (proprietary databases). πλεπψο, κεγάιε πνζφηεηα πιεξνθνξηαθψλ ηεθκεξίσλ πνπ βξίζθεηαη απνζεθεπκέλε ζε βάζεηο δεδνκέλσλ δελ είλαη πξνζβάζηκε απφ ηηο παξαδνζηαθέο κεραλέο αλαδήηεζεο. Ωζηφζν, νη απαηηήζεηο ησλ θαηξψλ (ή κάιινλ ησλ ρξεζηψλ) είλαη ε απιφηεηα, ε επθνιία ζηε ρξήζε θαη ε ηαρχηεηα. Απηνί είλαη θαη νη βαζηθνί ιφγνη πνπ ε κεγάιε πιεηνςεθία ησλ θνηηεηψλ θαη εξεπλεηψλ ρξεζηκνπνηεί θαηά θχξην ιφγν ηε κεραλή αλαδήηεζεο Google πνπ ζε γεληθέο γξακκέο επηζηξέθεη «αξθεηά θαιά» απνηειέζκαηα. Παξά ην γεγνλφο φηη νη αθαδεκατθέο βηβιηνζήθεο παξέρνπλ πξφζβαζε ζε κεγάιν αξηζκφ απφ ειεθηξνληθέο πεγέο θαη μνδεχνπλ κεγάια πνζά γηα ζπλδξνκέο ζε παξνρείο δεδνκέλσλ, νη πεξηζζφηεξνη ρξήζηεο ζηξέθνληαη ζηνλ αλνηρηφ Ιζηφ. ηαηηζηηθέο έξεπλεο έρνπλ δείμεη πσο πνιινί ρξήζηεο δε ρξεζηκνπνηνχλ ηηο πεγέο πνπ ηνπο παξέρεη κηα βηβιηνζήθε ιφγσ δπζθνιίαο ζηελ επηινγή, πινήγεζε θαη αλαδήηεζε ζηηο εθαηνληάδεο δηαζέζηκεο πεγέο. χκθσλα κε ηελ παξαδνζηαθή πξαθηηθή αλαδήηεζεο, ν ρξήζηεο είλαη ππνρξεσκέλνο λα επηιέμεη κία βάζε δεδνκέλσλ, λα θάλεη ηελ αλαδήηεζή ηνπ, λα ζπιιέμεη θαη λα αμηνινγήζεη ηα επηζηξεθφκελα δεδνκέλα θαη έπεηηα λα επαλαιάβεη ηε δηαδηθαζία κε άιιε βάζε δεδνκέλσλ. Δπηπξφζζεηα, θάζε βάζε δεδνκέλσλ έρεη δηαθνξεηηθά ραξαθηεξηζηηθά θαη επηινγέο αλαδήηεζεο, γεγνλφο πνπ αλαγθάδεη ην ρξήζηε λα αθηεξψζεη ρξφλν ψζηε λα εμνηθεησζεί κε ην πεξηβάιινλ αλαδήηεζεο πνπ απηή παξέρεη. Μάιηζηα έρεη παξαηεξεζεί ην θαηλφκελν λα ςάρλνπλ νη θνηηεηέο ζε ιίγεο κφλν πεγέο κε ηηο νπνίεο είλαη εμνηθεησκέλνη άζρεηα αλ απηέο είλαη νη πιένλ θαηάιιειεο. Δδψ θαη αξθεηά ρξφληα έρεη αλαγλσξηζηεί ε αλάγθε χπαξμεο ελφο θνηλνχ ηξφπνπ αλαδήηεζεο ζε πνιιέο πεγέο. Μία λέα ηερλνινγία πνπ έρεη εμειηρζεί γηα ην ζθνπφ απηφ είλαη ε ηαπηόρξνλε ή παξάιιειε αλαδήηεζε ζε πνιιαπιέο πεγέο δεδνκέλσλ απφ εληαίν πεξηβάιινλ (federated search ή metasearch ή cross-search). Γίλεη ηε δπλαηφηεηα ζηηο βηβιηνζήθεο λα αληαπνθξηζνχλ ζηηο ζχγρξνλεο πξνθιήζεηο κε ηελ παξνρή επαξθνχο θαη απνηειεζκαηηθήο πξφζβαζεο ζε πιεζψξα πεγψλ πιεξνθνξίαο θαη πξνζθέξεη ηελ ειπίδα λα θεξδίζνπλ μαλά νξηζκέλνπο ρξήζηεο (Luther 2003).

Παξάιιειε Αλαδήηεζε Η αλεξρφκελε ηερλνινγία ηεο παξάιιειεο αλαδήηεζεο παξέρεη ηε δπλαηφηεηα ζην ρξήζηε λα ςάμεη ηαπηφρξνλα πνιιέο αλεμάξηεηεο πεγέο θάλνληαο κία θαη κφλν εξψηεζε θαη επηζηξέθεη εληαίν ζχλνιν απνηειεζκάησλ. Έηζη, εμνηθνλνκείηαη επαλαιακβαλφκελε επίπνλε πξνζπάζεηα θαη εμαζθαιίδεηαη πεξηζζφηεξνο ρξφλνο γηα αμηνπνίεζε θαη επεμεξγαζία ησλ επηζηξεθφκελσλ ηεθκεξίσλ. Οπζηαζηηθά, κηα κεραλή ηαπηφρξνλεο αλαδήηεζεο κεηαζρεκαηίδεη ην εξψηεκα ηνπ ρξήζηε ζε κηα κνξθή θαηαλνεηή απφ θάζε επηζπκεηή πεγή, επηθνηλσλεί κε απηέο θαη αλαθηά ηα απνηειέζκαηα. Δπίζεο, εμαιείθεηαη ε αλάγθε εμνηθείσζεο κε πνιιά δηαθνξεηηθά πεξηβάιινληα αλαδήηεζεο θαη κεηαπήδεζεο απφ ηε κηα δηεπαθή (interface) αλαδήηεζεο ζε άιιε. Σα πιενλεθηήκαηα ινηπφλ είλαη πξνθαλή. Η αλάπηπμε θαη ε ρξήζε ηέηνησλ πιεξνθνξηαθψλ ζπζηεκάησλ ζε βηβιηνζήθεο ηα ηειεπηαία ρξφληα έρεη δείμεη πσο είλαη απφ ηηο δεκνθηιέζηεξεο ππεξεζίεο κεηαμχ ησλ ρξεζηψλ θαη είλαη ην βαζηθφ εξγαιείν πνπ ρξεζηκνπνηνχλ νη θνηηεηέο γηα αλαδήηεζε ζηηο δηαζέζηκεο πεγέο κηαο βηβιηνζήθεο (Boyd et al. 2006). Η δεκνηηθφηεηα ηνπο νθείιεηαη θπξίσο ζηε δπλαηφηεηα παξάθακςεο ησλ δπζθνιηψλ πνπ πξνθχπηνπλ απφ ηνλ πνιχ κεγάιν αξηζκφ δηαζέζηκσλ πεγψλ πιεξνθνξηψλ αθνχ θάζε πεγή έρεη ηνπο δηθνχο ηεο θαλφλεο θαη ηηο ηδηαηηεξφηεηεο ηεο ελψ νη δηεπαθέο ησλ πεγψλ παξνπζηάδνπλ αξθεηέο δηαθνξέο κεηαμχ ηνπο. Δπίζεο, ηα ζπζηήκαηα ηαπηφρξνλεο αλαδήηεζεο δηεπθνιχλνπλ ζεκαληηθά ηνλ εληνπηζκφ ρξήζηκσλ πιεξνθνξηψλ θαη βνεζνχλ ηδηαίηεξα ηα άηνκα πνπ δε γλσξίδνπλ ζε πνηεο αθξηβψο βάζεηο δεδνκέλσλ λα ςάμνπλ. Απηφ επηηπγράλεηαη κέζσ ηεο νξγάλσζεο ησλ δηαζέζηκσλ πεγψλ αλά ζεκαηηθή θαηεγνξία. Ωζηφζν, ππάξρνπλ θαη αξθεηά ζέκαηα πνπ πξνθαινχλ πξνβιεκαηηζκφ (Marshall, Herman & Rajan 2006)..Έλα δήηεκα πνπ πξνθχπηεη απφ ηε ρξήζε ελφο ζπζηήκαηνο ηαπηφρξνλεο αλαδήηεζεο είλαη ν κεγάινο φγθνο πιεξνθνξίαο (information overload) πνπ επηζηξέθεηαη, ν νπνίνο δεκηνπξγεί ηελ αλάγθε δηαρείξηζεο, νξγάλσζεο θαη ηαμηλφκεζεο ησλ απνηειεζκάησλ. Έλα άιιν πξφβιεκα, εγγελέο ζηηο κεραλέο ηαπηφρξνλεο αλαδήηεζεο, είλαη ε ζρεηηθά αξγή απφδνζε ηνπο θαζψο ςάρλνπλ ηαπηφρξνλα πνιιέο πεγέο, νπφηε ε πην αξγή πεγή θαζνξίδεη ηε ζπλνιηθή ηαρχηεηα. Δπηπιένλ, πξνβιήκαηα παξνπζηάδνπλ ε αλάθηεζε θαη παξνπζίαζε ησλ ζρεηηθφηεξσλ απνηειεζκάησλ πξψηα. Η ζεηξά εκθάληζεο θαη ε ζρεηηθφηεηα ησλ απνηειεζκάησλ είλαη ζέκαηα πνπ επηδέρνληαη πνιιήο ζπδήηεζεο. Δπίζεο, δελ ππάξρεη δπλαηφηεηα απαινηθήο ησλ δηπιφηππσλ. Αμίδεη αθφκα λα ζεκεησζεί ε πνιππινθφηεηα θαη ε δπζθνιία πινπνίεζεο ηέηνησλ ζπζηεκάησλ. Παξά ηα ζεκαληηθά πιενλεθηήκαηα ηεο παξάιιειεο αλαδήηεζεο, πξνβιεκαηηζκφο επηθξαηεί, ζηηο ηάμεηο ησλ βηβιηνζεθνλφκσλ θπξίσο, γηα ηελ πνηφηεηα ησλ επηζηξεθφκελσλ απνηειεζκάησλ θαη ηελ παξαίζζεζε πνπ ζνπ δίλνπλ ηέηνηα ζπζηήκαηα φηη κπνξεί λα εληνπίζεη θαλείο εχθνια θαη γξήγνξα ηηο δεηνχκελεο πιεξνθνξίεο. Οξηζκέλνη πηζηεχνπλ πσο ηέηνηα ζπζηήκαηα επηζηξέθνπλ ζε γεληθέο γξακκέο ζρεηηθά θαιά απνηειέζκαηα αιιά δελ είλαη ίζσο απηά πνπ νη ρξήζηεο έρνπλ πξαγκαηηθά αλάγθε (Cox 2003). ηελ πξάμε φκσο πνιινί ρξήζηεο έρνπλ ρξεζηκνπνηήζεη εξγαιεία παξάιιειεο αλαδήηεζεο αξθεηά ψζηε λα ςάρλνπλ απνηειεζκαηηθά θαη κε επηηπρία. ίγνπξα πάλησο ηα εξγαιεία απηά έρνπλ κέιινλ θαη ζα βειηησζνχλ αθφκα πεξηζζφηεξν ζηελ πνξεία. Φέξλνπλ ηνπο ρξήζηεο πην θνληά ζηηο δηαζέζηκεο πεγέο πνπ ζε άιιε πεξίπησζε ζα ηηο έραλαλ. Βέβαηα ηα εξγαιεία απηά δελ αληηθαζηζηνχλ ηηο δεμηφηεηεο πνπ πξέπεη λα έρεη θάπνηνο θαιφο εξεπλεηήο νχηε θαη ηελ ηθαλφηεηα εθηίκεζεο θαη θξηηηθήο αλάιπζεο ησλ απνηειεζκάησλ. αλ ζπκπέξαζκα ε ηερλνινγία ηεο ηαπηφρξνλεο αλαδήηεζεο δελ απνηειεί παλάθεηα αιιά είλαη έλα πνιχ βνεζεηηθφ θαη ρξήζηκν εξγαιείν ζηα ρέξηα ηεο αθαδεκατθήο θνηλφηεηαο. Δίλαη έλα πνιχ θαιφ ζεκείν εθθίλεζεο ηεο έξεπλαο γηα ηνλ εληνπηζκφ πεγψλ κε ζρεηηθέο εγγξαθέο. Η πνηφηεηα απνηειεζκάησλ εμαξηάηαη άκεζα απφ ηνπο φξνπο αλαδήηεζεο πνπ έρεη εηζάγεη ν ρξήζηεο. Η ζρεηηθφηεηα θαη ε αθξίβεηα ελφο ηέηνηνπ πιεξνθνξηαθνχ ζπζηήκαηνο θπκαίλνληαη ζπλήζσο ζε πςειά επίπεδα. ε γεληθέο

γξακκέο ηα απνηειέζκαηα είλαη ηνπιάρηζηνλ απνδεθηά. Γελ αληηθαζηζηά φκσο νχηε ηε δηεπαθή αλαδήηεζεο θάζε πεγήο νχηε ηελ εθηελή έξεπλα. Γε βειηηψλεη ηηο δπλαηφηεηεο αλαδήηεζεο πνπ πξνζθέξεη κηα πεγή, απιά ηηο ρξεζηκνπνηεί, νχηε επηζηξέθεη θαιχηεξα απνηειέζκαηα. Δμππεξεηεί θπξίσο ηνπο λένπο ρξήζηεο πνπ αλαδεηνχλ κεξηθέο θαιέο πεγέο πιεξνθνξίαο. Σν δεηνχκελν πάλησο είλαη λα ηθαλνπνηεί ηηο απαηηήζεηο ηφζν ησλ αξράξησλ φζν θαη ησλ έκπεηξσλ ρξεζηψλ πνπ δηεμάγνπλ έξεπλα. Δίλαη ηερλνινγία πνπ έρεη ζπγθεληξψζεη πνιχ κεγάιν ελδηαθέξνλ ζηε βηβιηνζεθνλνκηθή θνηλφηεηα θαη αλαπηχζζεηαη ζπλερψο. Έρνπλ θπθινθνξήζεη νξηζκέλα εκπνξηθά πξντφληα (Chen 2006) αιιά θαη ειεχζεξν ινγηζκηθφ αλνηθηνχ θψδηθα, πνπ ζπληζηά αμηνπξφζερηε ελαιιαθηηθή ιχζε ρακειφηεξνπ θφζηνπο αιιά πςειήο ιεηηνπξγηθφηεηαο. Λνγηζκηθό Αλνηθηνύ Κώδηθα - dbwiz ην πιαίζην ηνπ έξγνπ ΠΛΟΗΓΙ 1, ε Βηβιηνζήθε ηνπ Παλεπηζηεκίνπ Μαθεδνλίαο αλέιαβε ηελ αλάπηπμε εξγαιείνπ ηαπηφρξνλεο αλαδήηεζεο ζηνλ ειεθηξνληθφ θαηάινγν ηεο βηβιηνζήθεο, ζε ζεκαληηθέο βηβιηνγξαθηθέο βάζεηο δεδνκέλσλ, ζπιινγέο δεδνκέλσλ αλνηρηήο ή κε πξφζβαζεο θαη άιιεο πεγέο πιεξνθνξηψλ. Έπεηηα απφ αλαδήηεζε ζρεηηθψλ εξγαιείσλ ινγηζκηθνχ αλνηρηνχ θψδηθα (open source software tools), επηιέρζεθε ην dbwiz (Mah & Stranack 2005), ην νπνίν απνηειεί κέινο ηεο νηθνγέλεηαο πξνγξακκάησλ researcher, κηαο πξαγκαηηθά αμηφινγεο πξνζπάζεηαο ηεο βηβιηνζήθεο ηνπ Simon Fraser University. Σν έρνπλ πηνζεηήζεη θαη ζπλεξγάδνληαη ζηελ αλάπηπμή ηνπ πνιιέο βηβιηνζήθεο θαη θνηλνπξαμίεο ζηνλ Καλαδά. Σν dbwiz είλαη πξνζπειάζηκν κέζσ ηνπ Ιζηνχ, νπφηε κπνξεί θαλείο λα ρξεζηκνπνηήζεη ην πεξηβάιινλ αλαδήηεζήο ηνπ κε ρξήζε ελφο πξνγξάκκαηνο πινήγεζεο (web browser). Σν πεξηβάιινλ αλαδήηεζεο αιιά θαη απηφ ηεο δηαρείξηζεο ηνπ είλαη πινπνηεκέλα ζηε γιψζζα πξνγξακκαηηζκνχ Perl. Γηα ηελ εγθαηάζηαζε θαη ιεηηνπξγία ηνπ απαηηείηαη έλαο ζχγρξνλνο ζηαζκφο εξγαζίαο κε ιεηηνπξγηθφ ζχζηεκα Linux θαη αμηφπηζηε θαη γξήγνξε ζχλδεζε ζην Γηαδίθηπν. Οη ηερληθέο πξνδηαγξαθέο απαηηνχλ ηνλ δηαθνκηζηή Ιζηνχ Apache, ην ζχζηεκα δηαρείξηζεο βάζεσλ δεδνκέλσλ MySQL, ην παθέην ινγηζκηθνχ YAZ γηα αλαδήηεζε κε ην πξσηφθνιιν Z39.50 θαη πιεζψξα Perl ιεηηνπξγηθψλ κνλάδσλ. Σν dbwiz δηαζέηεη κηα κεραλή παξάιιειεο αλαδήηεζεο (parallel search engine) ψζηε λα πξαγκαηνπνηείηαη αλαδήηεζε ζε πνιιαπιέο πεγέο ηαπηφρξνλα. Γηα θαζεκία απφ ηηο πεγέο πνπ ελδηαθέξεηαη ν ρξήζηεο λα ςάμεη, δεκηνπξγείηαη κηα λέα παξάιιειε δηεξγαζία (process) ε νπνία δηεθπεξαηψλεη ηελ επηθνηλσλία θαη ηελ αλάθηεζε πιεξνθνξίαο απφ ηε ζπγθεθξηκέλε πεγή. Όηαλ νινθιεξσζεί ε αλαδήηεζε ζε φιεο ηηο πεγέο, ηφηε ηα απνηειέζκαηα ζπλδπάδνληαη θαη παξνπζηάδνληαη ζην ρξήζηε σο έλα εληαίν ζχλνιν. Απαξαίηεηε πξνυπφζεζε γηα ηελ αλαδήηεζε ζε κηα επηζπκεηή πεγή πιεξνθνξίαο είλαη ε χπαξμε αληίζηνηρεο ιεηηνπξγηθήο κνλάδαο αλαδήηεζεο (search module ή plug-in). Μηα ιεηηνπξγηθή κνλάδα αλαδήηεζεο ηνπ dbwiz είλαη κία ελφηεηα θψδηθα ζηελ γιψζζα πξνγξακκαηηζκνχ Perl πνπ αλαιακβάλεη ηελ επηθνηλσλία κε ηελ πεγή, ηελ ππνβνιή ηνπ εξσηήκαηνο θαη ηελ αλάθηεζε ησλ απνηειεζκάησλ. To dbwiz έρεη κεγάιν αξηζκφ απφ έηνηκεο πξν-εγθαηεζηεκέλεο ιεηηνπξγηθέο κνλάδεο γηα πιεζψξα πεγψλ θαη παξνρέσλ πιεξνθνξίαο. Φπζηθά, είλαη δπλαηή ε πξνζζήθε λέσλ πεγψλ, αξθεί λα θαηαζθεπαζηεί ζρεηηθή ιεηηνπξγηθή κνλάδα αλαδήηεζεο θαη λα γίλνπλ νη θαηάιιειεο ξπζκίζεηο ζην δηαρεηξηζηηθφ πεξηβάιινλ ηνπ dbwiz. Βέβαηα ε θαηαζθεπή θαη ε ζπληήξεζε ησλ 1 Σν Παλεπηζηήκην Μαθεδνλίαο Οηθνλνκηθψλ θαη Κνηλσληθψλ Δπηζηεκψλ πινπνηεί ην έξγν «ΠΛΟΗΓΙ: ΑΠΟ ΣΗΝ ΠΛΗΡΟΦΟΡΙΑ ΣΗ ΓΝΩΗ: Δλίζρπζε δηάζεζεο ειεθηξνληθνχ πεξηερνκέλνπ θαη παξνρή πιεξνθνξηαθήο παηδείαο ζηε Βηβιηνζήθε ηνπ Παλεπηζηεκίνπ Μαθεδνλίαο», ην νπνίν εθηειείηαη ζηα πιαίζηα ηνπ Δπηρεηξεζηαθνχ Πξνγξάκκαηνο Δθπαίδεπζεο θαη Αξρηθήο Δπαγγεικαηηθήο Καηάξηηζεο ΙΙ (ΔΠΔΑΔΚ ΙΙ-Δλέξγεηα 2.1.3, Καηεγνξία Πξάμεσλ δ «Δλίζρπζε θαη Δκπινπηηζκφο Αθαδεκατθψλ Βηβιηνζεθψλ») κε ρξνληθή δηάξθεηα απφ 01/07/2000 κέρξη 30/09/2008 θαη ζπγρξεκαηνδνηείηαη κέζσ ηνπ ΤΠΔΠΘ απφ ηελ Δπξσπατθή Έλσζε [3 ν Κνηλνηηθφ Πιαίζην ηήξημεο θαηά 75% Κνηλνηηθή πκκεηνρή (ΔΚΣ) θαη 25% Δζληθνί πφξνη (ΤΠΔΠΘ/ΔΤΓ ΔΠΔΑΔΚ)].

ιεηηνπξγηθψλ κνλάδσλ αλαδήηεζεο εκπεξηέρνπλ ζεκαληηθέο δπζθνιίεο θαη απαηηνχλ εμεηδηθεπκέλεο γλψζεηο πιεξνθνξηθήο. Γηα ηηο αλάγθεο ηεο βηβιηνζήθεο ηνπ Παλεπηζηεκίνπ Μαθεδνλίαο θαηαζθεπάζηεθαλ λέεο ιεηηνπξγηθέο κνλάδεο αλαδήηεζεο γηα ηνλ θαηάινγν ηεο βηβιηνζήθεο, ην ηδξπκαηηθφ απνζεηήξην (ΨΗΦΙΓΑ), ηελ πχιε ζεκαηηθήο αλαδήηεζεο (ΘΤΡΑ), δεκνθηιείο βάζεηο δεδνκέλσλ ηνπ Δζληθνχ Κέληξνπ Σεθκεξίσζεο (EKT) θαη ζεκαληηθέο βηβιηνγξαθηθέο βάζεηο δεδνκέλσλ (π.ρ. πεγέο ζηηο νπνίεο είλαη δπλαηή ε πξφζβαζε κέζσ ηεο Silverplatter). Γειαδή, πξνζηέζεθε δπλαηφηεηα αλαδήηεζεο γηα ειιεληθέο πεγέο πνπ δελ είλαη πξν-εγθαηεζηεκέλεο ζε θάπνην εκπνξηθφ ή κε πξντφλ παξάιιειεο αλαδήηεζεο. Δπίζεο, ηξνπνπνηήζεθαλ θαηάιιεια νξηζκέλεο ιεηηνπξγηθέο κνλάδεο απφ ηηο έηνηκεο ηνπ dbwiz πνπ παξνπζίαδαλ θάπνηα πξνβιήκαηα. Τπάξρνπλ δχν βαζηθνί κεραληζκνί πξφζβαζεο ζηηο πεγέο ζηφρνπο. Ο πξψηνο είλαη κέζσ ηεο δηεπαθήο ηζηνχ (web interface) θαη ν δεχηεξνο κέζσ πξνγξακκαηηζηηθήο δηεπαθήο (API), ζπλήζσο κέζσ ηνπ πξσηνθφιινπ αλαδήηεζεο θαη αλάθηεζεο πιεξνθνξίαο Z39.50. ηελ πξψηε πεξίπησζε πξνζνκνηψλεηαη ε αιιειεπίδξαζε ελφο ρξήζηε κε ην δηθηπαθφ ηφπν ηεο πεγήο θαη ηα απνηειέζκαηα αληί λα πξνβιεζνχλ ζε έλα πξφγξακκα πινήγεζεο (web browser) ζαξψλνληαη απφ ην dbwiz. H αλαδήηεζε πξαγκαηνπνηείηαη κέζσ απηόκαηεο πινήγεζεο ζηνπο δηθηπαθνχο ηφπνπο ησλ πεγψλ, ζπκπιήξσζεο θαη ππνβνιήο ηεο ζρεηηθήο θφξκαο, εληνπηζκνχ, εμαγσγήο θαη ζπλδπαζκνχ ησλ απνηειεζκάησλ ζε θαηάιιειε κνξθή. Οη ιεηηνπξγηθέο κνλάδεο αλαδήηεζεο (search modules) ηεο θαηεγνξίαο απηήο επηηπγράλνπλ ηνλ εληνπηζκφ ησλ επηζπκεηψλ δεδνκέλσλ ζηηο ηζηνζειίδεο ησλ πεγψλ ζηφρσλ κε ρξήζε θαλνληθώλ εθθξάζεωλ (regular expressions), νη νπνίεο ζπληζηνχλ κία ηππηθή κέζνδν πεξηγξαθήο πξνηχπσλ θεηκέλνπ. Ο κεραληζκφο φκσο απηφο είλαη επηξξεπήο ζε αιιαγέο ζηε δηεπαθή αλαδήηεζεο ησλ πεγψλ θαη ζηνλ ηξφπν εκθάληζεο ησλ απνηειεζκάησλ κε ζπλέπεηα λα απαηηείηαη ζπζηεκαηηθή ζπληήξεζε ησλ ιεηηνπξγηθψλ κνλάδσλ αλαδήηεζεο. Όζν γηα ηηο πεγέο ζηφρνπο ηεο δεχηεξεο πεξίπησζεο, είλαη ζπλήζσο δπλαηή ε αλάθηεζε ησλ δεδνκέλσλ κέζσ ηνπ πξσηνθφιινπ επηθνηλσλίαο Z39.50 θαη ρξήζεο ηνπ ζρεηηθνχ API, κεζνδνινγία πνπ είλαη πεξηζζφηεξν αμηφπηζηε. Η ζχληαμε θαη νη δπλαηφηεηεο αλαδήηεζεο είλαη δηαθνξεηηθέο ζε θάζε πεγή. Γηα ηελ ππνζηήξημε ελφο βαζηθνχ ζπλφινπ ιεηηνπξγηψλ αλαδήηεζεο, επηιέρζεθαλ απφ ηνπο δεκηνπξγνχο ηνπ dbwiz ηα ζπλεζέζηεξα ραξαθηεξηζηηθά ζηηο πεξηζζφηεξεο πεγέο. ηε βαζηθή αλαδήηεζε (Δηθφλα 1: Καηεγνξίεο πεγώλ ζηε βαζηθή αλαδήηεζε) ν ρξήζηεο κπνξεί λα ςάμεη κφλν κε ιέμεηο θιεηδηά ζε κία νκάδα ή ζεκαηηθή θαηεγνξία πεγψλ, ε νπνία πεξηιακβάλεη θάπνηεο πξνθαζνξηζκέλεο απφ ην δηαρεηξηζηή πεγέο. Γηα παξάδεηγκα ε θαηεγνξία 'Τνπηθέο πεγέο βηβιηνζήθεο' πνπ θαίλεηαη ζηελ αθφινπζε εηθφλα πεξηιακβάλεη ηνλ θαηάινγν, ην ςεθηαθφ απνζεηήξην θαη ηελ πχιε ζεκαηηθήο αλαδήηεζεο ηεο Βηβιηνζήθεο ηνπ Παλεπηζηεκίνπ Μαθεδνλίαο. Δηθφλα 1: Καηεγνξίεο πεγψλ ζηε βαζηθή αλαδήηεζε ηνπ dbwiz ηε ζχλζεηε αλαδήηεζε (Δηθφλα 2: Επηινγή κεκνλωκέλωλ πεγώλ ζηε ζύλζεηε αλαδήηεζε) ν ρξήζηεο κπνξεί λα δψζεη ζπλδπαζκφ θξηηεξίσλ (ηίηιν, ζπγγξαθέα, ζεκαηηθή ελφηεηα θαη ιέμε θιεηδί) θαη λα ςάμεη είηε πάιη κηα νκάδα πεγψλ είηε κεκνλσκέλεο πεγέο

πνπ έρεη επηιέμεη ν ίδηνο ζηε ιίζηα κε ηηο δηαζέζηκεο πεγέο. Δίλαη δπλαηή ε αλαδήηεζε κέρξη θαη κε ηέζζεξηο φξνπο ζπλδεδεκέλνπο κεηαμχ ηνπο κε ινγηθνχο ηειεζηέο (AND, OR, NOT). Η αλαδήηεζε επηζηξέθεη πξνθαζνξηζκέλν πιήζνο απφ ηα πξψηα απνηειέζκαηα απφ θάζε πεγή, αξηζκφο πνπ είλαη παξακεηξνπνηήζηκνο απφ ην δηαρεηξηζηή. Όζν κεγαιχηεξνο βέβαηα ν αξηζκφο, ηφζν πεξηζζφηεξνο ρξφλνο απαηηείηαη γηα ηελ νινθιήξσζε ηεο αλαδήηεζεο. Δπίζεο, νη δεκηνπξγνί ηνπ dbwiz έιαβαλ ππφςε ηνπο ην ρξφλν απφθξηζεο ηνπ ζπζηήκαηνο. Γηα ην ζθνπφ απηφ ππάξρεη κέγηζηνο ρξφλνο αλακνλήο ησλ απνηειεζκάησλ απφ κηα πεγή (timeout). ε πεξίπησζε πνπ ε πεγή δελ έρεη απαληήζεη κέζα ζε απηφ ην δηάζηεκα ηφηε απιά δηαθφπηεηαη ε πξνζπάζεηα αλάθηεζεο δεδνκέλσλ θαη επηζηξέθεηαη θαηάιιειν κήλπκα γηα ηε ζπγθεθξηκέλε πεγή. Δηθφλα 2: Δπηινγή κεκνλσκέλσλ πεγψλ ζηε ζχλζεηε αλαδήηεζε ηνπ dbwiz Όηαλ νινθιεξσζεί κία αλαδήηεζε, ηφηε ζπιιέγνληαη ηα επηζηξεθφκελα απνηειέζκαηα θαη παξνπζηάδνληαη εληαία ζην ρξήζηε. Κάζε εγγξαθή (record) απφ ην ζχλνιν ησλ απνηειεζκάησλ εκθαλίδεη κία ζχληνκε αιιά πεξηεθηηθή πνζφηεηα πιεξνθνξίαο πνπ πεξηιακβάλεη ηίηιν, ζπγγξαθέα, εκεξνκελία θαη ην φλνκα ηεο πεγήο απφ ηελ νπνία πξνήιζε (Δηθφλα 3: Ελδεηθηηθό απνηέιεζκα αλαδήηεζεο). Δπίζεο, θάζε εγγξαθή πεξηέρεη ππεξζπλδέζκν πνπ δείρλεη ζηελ ηζηνζειίδα κε ηε ιεπηνκεξή πεξηγξαθή ηνπ απνηειέζκαηνο θαη ζχλδεζκν πξνο ηε ζειίδα ηνπ δηθηπαθνχ ηφπνπ ηεο πεγήο απφ ηελ νπνία εμήρζε ην απνηέιεζκα θαζψο θαη openurl ζχλδεζκν, θαηάιιειν γηα ηνλ link resolver ηεο βηβιηνζήθεο, γηα εληνπηζκφ ηνπ πιήξνπο θεηκέλνπ. Δηθφλα 3: Δλδεηθηηθφ απνηέιεζκα αλαδήηεζεο ζην dbwiz Δπίζεο, ζην αξηζηεξφ ηκήκα ηεο δηεπαθήο αλαδήηεζεο εκθαλίδεηαη πίλαθαο κε ην πιήζνο ησλ απνηειεζκάησλ γηα θάζε πεγή ζηελ νπνία πξαγκαηνπνηήζεθε αλαδήηεζε (Δηθφλα 4: Πίλαθαο κε ην πιήζνο απνηειεζκάηωλ ). Να ζεκεησζεί πσο ππάξρεη δπλαηφηεηα πξνβνιήο απνηειεζκάησλ γηα θάζε κεκνλσκέλε πεγή, αξθεί ν ρξήζηεο λα επηιέμεη ηελ πεγή ζηνλ πίλαθα κε ηα απνηειέζκαηα. Αθφκα, θξαηηέηαη ηζηνξηθφ αλαδεηήζεσλ θαη ζπλεπψο ν ρξήζηεο κπνξεί λα αλαηξέμεη φπνηε ην ζειήζεη ζηα απνηειέζκαηα πξνεγνχκελσλ αλαδεηήζεσλ ηνπ.

Δηθφλα 4: Πίλαθαο κε ην πιήζνο απνηειεζκάησλ θάζε πεγήο έπεηηα απφ αλαδήηεζε ζην dbwiz Σέινο, ηδηαίηεξε έκθαζε έρεη δνζεί ζην θνκκάηη ηεο δηαρείξηζεο (administration) ηνπ ζπζηήκαηνο. Σν πεξηβάιινλ δηαρείξηζεο επηηξέπεη ζηηο βηβιηνζήθεο λα δεκηνπξγήζνπλ ηηο δηθέο ηνπο θαηεγνξίεο αλαδήηεζεο (search categories) θαη λα πξνζζέηνπλ ή λα δηαγξάθνπλ γξήγνξα θαη εχθνια πεγέο (resources) απφ ην dbwiz πξνθίι ηνπο. Οη παξάκεηξνη θαη νη ξπζκίζεηο ηνπ πεξηβάιινληνο δηαρείξηζεο απνζεθεχνληαη ζε βάζε δεδνκέλσλ. Η δεκηνπξγία θαηεγνξηψλ είηε βάζεη ζεκαηηθήο ελφηεηαο ή άιινπ θξηηεξίνπ γίλεηαη εχθνια, απιά κε ηελ εηζαγσγή ηνπ νλφκαηνο ηεο θαηεγνξίαο απφ ην δηαρεηξηζηή θαη επηινγή ησλ πεγψλ πνπ απηή ζα πεξηιακβάλεη (Δηθφλα 5: Πξνζζήθε πεγώλ ζε κηα θαηεγνξία αλαδήηεζεο). Ο ρξήζηεο κεηά ηελ είζνδν ηνπ ζην πεξηβάιινλ δηαρείξηζεο κπνξεί λα πξνζπειάζεη ηε ιίζηα κε φιεο ηηο δηαζέζηκεο πεγέο ηνπ dbwiz θαη λα ελεξγνπνηήζεη κφλν απηέο πνπ ζέιεη λα ζπκπεξηιάβεη ζηε ζπιινγή πεγψλ πνπ ελδηαθέξνπλ ηε βηβιηνζήθε. Σέινο, ε δηεπαθή αλαδήηεζεο έρεη θαηαζθεπαζηεί κε ην Perl Template Toolkit, γεγνλφο πνπ ζεκαίλεη πσο γίλεηαη ρξήζε πξνηχπσλ κνξθνπνίεζεο, νπφηε είλαη δπλαηή ε εθηεηακέλε παξακεηξνπνπνίεζε ηεο εκθάληζεο ηνπ δηθηπαθνχ ηφπνπ ηνπ dbwiz ζχκθσλα κε ηηο αλάγθεο θάζε βηβιηνζήθεο. Οη αιιαγέο απηέο γίλνληαη εχθνια κέζα απφ ην πεξηβάιινλ δηαρείξηζεο. Δηθφλα 5: Πξνζζήθε πεγψλ ζε κηα θαηεγνξία αλαδήηεζεο Εμαγωγή πεξηερνκέλνπ από ηζηνζειίδεο βάζεωλ δεδνκέλωλ ην εξγαιείν ηαπηφρξνλεο αλαδήηεζεο dbwiz, γηα ηηο πεξηζζφηεξεο επηζπκεηέο πεγέο πιεξνθνξίαο ε αλάθηεζε ησλ απνηειεζκάησλ γηα ην εξψηεκα ηνπ ρξήζηε γίλεηαη κέζσ ηεο δηεπαθήο ηνπ δηθηπαθνχ ηνπο ηφπνπ. Η κεζνδνινγία πνπ ρξεζηκνπνηεί ην dbwiz ζε απηέο ηηο πεξηπηψζεηο βαζίδεηαη ζηηο θαλνληθέο εθθξάζεηο θαη ζηνλ πεγαίν θψδηθα ησλ ζειίδσλ. Ο κεραληζκφο απηφο σζηφζν βειηηψζεθε ζεκαληηθά κε ηελ ελζσκάησζε δπλαηφηεηαο εμαγσγήο ηεο επηζπκεηήο πιεξνθνξίαο απφ ηζηνζειίδεο κε δελδξνεηδείο θαλφλεο εμαγσγήο νη νπνίνη θαηαζθεπάδνληαη ζρεηηθά εχθνια κε πξσηφηππν εξγαιείν ινγηζκηθνχ πνπ αλαπηχρζεθε γηα ην ζθνπφ απηφ.

Έλαο θαλόλαο εμαγωγήο (extraction rule) είλαη κία απεηθφληζε (mapping) πνπ επηηξέπεη ηελ πιήξσζε ελφο απνζεηεξίνπ δεδνκέλσλ (data repository) κε πιεξνθνξίεο πνπ πεξηέρνληαη ζε κηα ηζηνζειίδα (Laender 2002) θαη ιεηηνπξγεί νπζηαζηηθά ζαλ πξόηππν (pattern) αλαδήηεζεο ρξήζηκεο πιεξνθνξίαο εληφο κηαο ζειίδαο. Η ζρεηηθή εθαξκνγή αλαπηχρζεθε ζην πεξηβάιινλ αληηθεηκελνζηξαθνχο (object-oriented) θαη νπηηθνχ (visual) πξνγξακκαηηζκνχ Turbo Delphi Explorer, ην νπνίν είλαη έλα εληππσζηαθφ εξγαιείν αλάπηπμεο ινγηζκηθνχ γηα MS Windows κε κεγάιεο δπλαηφηεηεο. ηελ Δηθφλα 6: Εξγαιείν θαηαζθεπήο δελδξνεηδώλ θαλόλωλ εμαγωγήο πνπ αθνινπζεί θαίλνληαη νξηζκέλα απφ ηα ηκήκαηα ηνπ παξαζχξνπ ηεο εθαξκνγήο απηήο. Η επθνιία δεκηνπξγίαο θαλφλσλ έγθεηηαη ζην εχρξεζην γξαθηθφ πεξηβάιινλ ηνπ εξγαιείνπ θαη ζηελ νπηηθνπνίεζε (visualization) ηεο δηαδηθαζίαο ππφδεημεο ηνπ πξνηχπνπ εμαγσγήο κέζσ ηνπ ελζσκαησκέλνπ πξνγξάκκαηνο πινήγεζεο. Οη παξαγφκελνη θαλφλεο εμαγσγήο είλαη αξθεηά επέιηθηνη θαη παξνπζηάδνπλ βειηησκέλε αλζεθηηθφηεηα ζε παξαιιαγέο ηεο δνκήο ησλ επηζπκεηψλ αληηθεηκέλσλ πιεξνθνξία. Δπίζεο, νη θαλφλεο επηδεηθλχνπλ αλεθηηθφηεηα ζε κηθξέο κεηαβνιέο ησλ ηζηνζειίδσλ. ηελ πιεηνςεθία ησλ πεξηπηψζεσλ είλαη δπλαηή αιιά θαη εχθνιε ε επεμεξγαζία θαη ηξνπνπνίεζε ελφο ππάξρνληνο θαλφλα εμαγσγήο, ν νπνίνο γηα θάπνηνπο ιφγνπο ζηακάηεζε λα ιεηηνπξγεί απφιπηα ηθαλνπνηεηηθά. Έλαο θαλφλαο εμαγσγήο παξαγφκελνο απφ ην εξγαιείν απνζεθεχεηαη ζε έλα XML αξρείν ην νπνίν πεξηγξάθεη ηελ HTML δνκή πνπ αθνινπζνχλ ηα ζηηγκηφηππα επηζπκεηήο πιεξνθνξίαο. Γηα ηε ρξήζε ηέηνησλ θαλφλσλ θαη εμαγσγή ησλ επηζπκεηψλ δεδνκέλσλ ρξεηάζηεθε ε θαηαζθεπή κηαο Perl ιεηηνπξγηθήο κνλάδαο, ηθαλήο λα εθηειεί ηνπο θαλφλεο. Με ηνλ ηξφπν απηφ θαηέζηε δπλαηή ε ρξήζε ηέηνησλ θαλφλσλ ζε ιεηηνπξγηθέο κνλάδεο αλαδήηεζεο ηνπ dbwiz, ψζηε λα εμάγνληαη ηα απνηειέζκαηα απφ ηηο ζειίδεο ησλ πεγψλ. Δηθφλα 6: Δξγαιείν θαηαζθεπήο δελδξνεηδψλ θαλφλσλ εμαγσγήο Σν εξγαιείν, βαζίδεηαη ζην Μνληέιν Αληηθεηκέλνπ Εγγξάθνπ (Document Object Model ή DOM) ην νπνίν απνηειεί χζηαζε ηεο Κνηλνπξαμίαο γηα ηνλ Παγθφζκην Ιζηφ (W3C). Γηεπθνιχλεη αξθεηά ηε δεκηνπξγία, δνθηκή, ξχζκηζε θαη ηε ζπληήξεζε απνηειεζκαηηθψλ θαλφλσλ εμαγσγήο γηα ηηο ηζηνζειίδεο ησλ επηζπκεηψλ πεγψλ θαη ην θπξηφηεξν επηηπγράλεη πςειή αθξίβεηα απνηειεζκάησλ. Αμίδεη λα ζεκεησζεί πσο γηα πεγέο ηνπ Δζληθνχ Κέληξνπ Σεθκεξίσζεο (EKT) θαη ηελ πχιε ζεκαηηθήο αλαδήηεζεο (ΘΤΡΑ) ηεο βηβιηνζήθεο ρξεζηκνπνηήζεθε ην εξγαιείν απηφ θαη θαηαζθεπάζηεθαλ αληίζηνηρνη θαλφλεο εμαγσγήο. Σπκπεξάζκαηα

ην πιαίζην αλάπηπμεο εθαξκνγήο ηαπηφρξνλεο αλαδήηεζεο ζε πνιιαπιέο αλεμάξηεηεο πεγέο δεδνκέλσλ γηα ηε Βηβιηνζήθε ηνπ Παλεπηζηεκίνπ Μαθεδνλίαο, επηιέρζεθε ην εξγαιείν dbwiz ην νπνίν είλαη έλα ηδηαίηεξα αμηφινγν έξγν ινγηζκηθνχ αλνηθηνχ θψδηθα. Σν εξγαιείν έρεη εγθαηαζηαζεί ζε ζηαζκφ εξγαζίαο ηεο βηβιηνζήθεο θαη βξίζθεηαη ζε πηινηηθή εθαξκνγή. Σν ζχζηεκα είλαη αθφκα ππφ αλάπηπμε θαη δνθηκάδνληαη ηα ραξαθηεξηζηηθά, νη παξάκεηξνη θαη νη ιεηηνπξγίεο ηνπ ψζηε λα θαιπθζνχλ πιήξσο νη αλάγθεο ηεο βηβιηνζήθεο. Έρνπλ ήδε θαηαζθεπαζηεί αξθεηέο λέεο ιεηηνπξγηθέο κνλάδεο αλαδήηεζεο γηα πεγέο πνπ δελ είλαη πξνεγθαηεζηεκέλεο ζην dbwiz θαζψο θαη έρνπλ ηξνπνπνηεζεί θαηάιιεια θάπνηεο απφ ηηο έηνηκεο. ηελ ηξέρνπζα θάζε ππνζηεξίδεηαη ε αλαδήηεζε ζε αξθεηέο απφ ηηο δεκνθηιέζηεξεο πεγέο πιεξνθνξίαο θαη κειινληηθά ζα πξνζηεζνχλ φζν ην δπλαηφλ πεξηζζφηεξεο. Σα πξψηα δείγκαηα γξαθήο ηνπ ζπζηήκαηνο πάλησο είλαη ελζαξξπληηθά θαη ε απφδνζε ηνπ θξίλεηαη αξθεηά ηθαλνπνηεηηθή. Η κεγάιε πξφθιεζε γηα ηε βηβιηνζήθε είλαη ε εθπαίδεπζε ησλ ρξεζηψλ. Γηα ην ζθνπφ απηφ ε ππεξεζία παξάιιειεο αλαδήηεζεο πξφθεηηαη λα εληαρζεί ζην πξφγξακκα πιεξνθνξηαθήο παηδείαο ηεο βηβιηνζήθεο ψζηε λα ελεκεξσζνχλ νη ρξήζηεο γηα ην εξγαιείν θαη λα εθπαηδεπζνχλ ζηε ρξήζε ηνπ. Πξέπεη επίζεο λα δνζεί ηδηαίηεξν βάξνο ζηνλ ηνκέα ηνπ κάξθεηηλγθ ψζηε λα γίλεη γλσζηή ε αμηφινγε απηή ππεξεζία ηεο βηβιηνζήθεο. Αμίδεη λα δνζεί έκθαζε ζηε δπλαηφηεηα κειινληηθήο ζπλεξγαηηθήο ιεηηνπξγίαο ηνπ κε άιια ζπζηήκαηα ινγηζκηθνχ. Η πιεξφηεηα θαη ν βαζκφο νινθιήξσζεο ηνπ ζπζηήκαηνο ελδερνκέλσο λα βνεζήζνπλ ζηελ ελνπνίεζε (integration) ππαξρφλησλ ππεξεζηψλ πνπ ηψξα ιεηηνπξγνχλ ζε απηφλνκε βάζε. Σέινο, ην κνληέιν αλνηθηνχ ινγηζκηθνχ ζίγνπξα ζα κπνξνχζε λα σθειήζεη ζεκαληηθά ηηο ειιεληθέο αθαδεκατθέο βηβιηνζήθεο νη νπνίεο ζα κπνξνχζαλ λα ζπλεξγαζηνχλ κεηαμχ ηνπο γηα λα θαιχςνπλ πνιιέο θνηλέο ηνπο αλάγθεο γηα επαξθή θαη απνηειεζκαηηθή πξφζβαζε ζε ζεκαληηθέο πεγέο πιεξνθνξίαο. Βηβιηνγξαθηθέο Παξαπνκπέο Boyd, J., Hampton, M., Morrison, P., Pugh, P. & Cervone, F. (2006) The One-Box Challenge: Providing a Federated Search That Benefits the Research Process. Serials Review, 32 (4) December, pp.247-254. Chen, X. (2006) Metalib, WebFeat, and Google: The strengths and weaknesses of federated search engines compared with Google. Online Information Review, 30 (4), pp.413 427. Cox, A. (2003) Choosing a library Portal System. VINE: The Journal of Information and Knowledge Management Systems, 33 (1), pp.37-41. Laender A., Ribeiro-Neto, B., da Silva, A.S. & Teixeira, J. (2002). A Brief Survey of Web Data Extraction Tools. ACM SIGMOD Record, 31 (2), pp.84-93. Luther, J. (2003) Trumping Google? Metasearching's promise. Library Journal, 128 (16), pp. 36 39. Mah, C. & Stranack, K. (2005) dbwiz: Open Source Federated Searching for Academic Libraries. Library Hi Tech, 23 (4), pp.490-503. Marshall, P., Herman, S. & Rajan, S. (2006) In Search of More Meaningful Search. Serials Review, 32 (3) September, pp.172-180.