ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

Σχετικά έγγραφα
ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

Αναζήτηση Πληροφοριών στο Διαδίκτυο

Περιεχόμενα. Δημιουργία σύνδεσης ΤΙ ΕΙΝΑΙ ΙΣΤΟΣΕΛΙΔΕΣ ΚΑΙ ΤΙ ΤΟΠΟΘΕΣΙΕΣ ΙΣΤΟΥ Γνωριμία με μια ιστοσελίδα:... 38

Ο αλγόριθμος PageRank της Google

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

Αναζήτηση στο Google Μαθησιακά Αποτελέσματα

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

Το σύστημα Βοήθειας του Internet Explorer

Ενδοσχολική Επιμόρφωση Εκπαιδευτικών Εσπερινού Γυμνασίου στις ΤΠΕ Δράση: Αυτοαξιολόγηση Σχολικής Μονάδας. Ο Παγκόσμιος Ιστός

6 Εικόνα εξώφυλλου: Λωρίδα του Mobius (Σύνθεση). Νικόλαος Μπαλκίζας 10

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Εικόνα 1. Η μηχανή αναζήτησης Google.

enotita-b3 11/9/ :42 #ϊ ΑΪ>& 145

World Wide Web: Ο παγκόσµιος ιστός Πληροφοριών

ΕΡΓΑΣΙΑ. (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών)

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 11 : Ο αλγόριθμος PageRank της Google. Δρ.

Εργαστήριο Προγραμματισμού και τεχνολογίας Ευφυών συστημάτων (intelligence)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Αναζήτηση στον Ιστό. Πληκτρολόγηση του URL: στο πλαίσιο αναζήτησης του Mozilla Firefox. Enter ή κλικ στο Αναζήτηση

Αναζήτηση στον Παγκόσμιο Ιστό

Η Μηχανή Αναζήτησης της Google. Βασίλης Εφόπουλος Σχολικός Σύμβουλος Πληροφορικής

ΕΙΣΑΓΩΓΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ ΠΛΗΡΟΦΟΡΙΚΗΣ

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

Βασικές Υπηρεσίες Διαδικτύου. Επικοινωνίες Δεδομένων Μάθημα 2 ο

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Επιµόρφωση εκπαιδευτικών στη χρήση και αξιοποίηση των ΤΠΕ στην εκπαιδευτική διδακτική διαδικασία

Ως Διαδίκτυο (Internet) ορίζεται το παγκόσμιο (διεθνές) δίκτυο ηλεκτρονικών υπολογιστών (international network).

Εργαλεία ανάπτυξης εφαρμογών internet Ι

ΕΓΧΕΙΡΙΔΙΟ ΟΡΘΩΝ ΠΡΑΚΤΙΚΩΝ ΠΑΡΟΥΣΙΑ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ

Πώς λειτουργεί το Google?

ΡΑΣΤΗΡΙΟΤΗΤΕΣ. Το εκπαιδευτικό υλικό υπόκειται σε Άδεια Χρήσης Creative Commons Αναφορά Μη-Εµπορική Χρήση Όχι Παράγωγο Έργο v. 3.0

ΥΠΗΡΕΣΙΕΣ ΔΙΑΔΙΚΤΟΥ Explorer & Outlook 2013

Αξιολόγηση Ιστοσελίδων. Εργασία. Χαράλαμπος Κουτσουρελάκης

Δικτυωμένοι: Βασικές Γνώσεις για το Διαδίκτυο και τον Παγκόσμιο Ιστό

Η έρευνα και το διαδίκτυο:

18α γενέθλια της Google

Διαδίκτυο: Ιστορία, Δομή, Υπηρεσίες

πληροφορίας στον παγκόσµιο ιστό. meta-search engines) και θεµατικοί κατάλογοι.

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Μηχανές Αναζήτησης : Δομή & Μέθοδοι Αποτελεσματικής Αναζήτησης Πληροφοριών

Αναζήτηση σε όλα τα άρθρα των επιστηµονικών περιοδικών στα οποία το Α.Π.Θ. είναι συνδροµητής. Η αναζήτηση µπορεί να γίνει µε βάση λέξεις κλειδιά σε

Microsoft Excel Κεφάλαιο 1. Εισαγωγή. Βιβλίο εργασίας

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης

Βασίλης Πλαχούρας. Χρυσόστομος Καπέτης Μιχάλης Βαζιργιάννης. Οικονομικό Πανεπιστήμιο Αθηνών 3/11/2003

Κοινωνικές επισημάνσεις (social bookmarking)

Εισαγωγή Κεφάλαιο 1: Εγκατάσταση της Access Κεφάλαιο 2: Βάσεις δεδομένων και δομικά στοιχεία της Access

Σχεδίαση και ανάπτυξη ιστοχώρου του εργαστηρίου Μηχανικής Λογισμικού. Παληόπουλος Αποστόλης-Παπαναγιώτου Παναγιώτης

WORDPRESS. Εικόνα 1. Πατώντας στη «Σύνδεση» γράψτε το Username (όνομα χρήστη) και το Password (συνθηματικό) (εικόνα 2) που σας έδωσε ο διαχειριστής

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub

Δικτυακοί τόποι. Η σχεδίαση ενός δικτυακού τόπου. Δρ. Ματθαίος Α. Πατρινόπουλος

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

Φύλλο Εργασίας Μαθητή Τίτλος: Γίνομαι Ερευνητής/Ερευνήτρια

Οδηγίες χρήσης ιστοσελίδας VOLVO

ΑΝΑΖΗΤΗΣΗ ΑΡΘΡΩΝ. Ανοιχτή Πρόσβαση στη Γνώση

Περιεχόμενα. Κεφάλαιο 1 : Γενικά περι Μηχανών Αναζήτησης. 1. Εισαγωγή 5. Η πρωτοτυπία της διαδικασίας δεικτοδότησης εγγράφων χρηστών 6

2 Μάρκετινγκ µηχανών αναζήτησης (Search Engine Marketing).

Φύλλο Εργασίας 2 Κατανοώντας το Διαδίκτυο και τον Παγκόσμιο Ιστό

ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ- ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ- ΕΠΛ 425: Τεχνολογίες Διαδικτύου- Καθηγητής: Μάριος Δικαιάκος- 1η ΔΙΑΓΝΩΣΤΙΚΗ ΕΞΕΤΑΣΗ- 17 Φεβρουαρίου 2014!

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

ΟΔΗΓΟΣ καλλιέργειας ελαιώνα για ποιοτικό ελαιόλαδο

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

ΦΑΚΕΛΟΙ ΚΑΙ ΑΡΧΕΙΑ ΥΠΟΛΟΓΙΣΤΩΝ. Βασίλης Πρέκας Β'3

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Ψηφιακή οργάνωση πολιτισμικής πληροφορίας

Εξερευνήστε την Κρήτη -

Τεχνικές σχεδίασης προγραμμάτων, Προγραμματιστικά Περιβάλλοντα

11/8/18. Κεφάλαιο 3. Συνεργασία και εργασία στο web. Χρήση του Internet: Πώς θα εκμεταλλευτούμε καλύτερα τους πόρους του web.

Διαδικτυακές Υπηρεσίες Αναζήτησης, Απεικόνισης και Απευθείας Πρόσβασης στα δεδομένα ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ. Έκδοση 0.1.

Περιεχόμενα. Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών Μέρος 2: Χρήση υπολογιστή και διαχείριση αρχείων Πρόλογος...

ΕΡΓΑΣΙΑ. (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών)

METALIB Σύστημα μετα-αναζήτησης για ηλεκτρονικές πηγές πληροφόρησης

Στατιστικά στοιχεία ιστότοπου Κ.Ε.Π.Α. Α.Ν.Ε.Μ, για το Β εξάμηνο του 2015 και την περίοδο 1/1/ /12/2015

Google AdWords. Κάθε κλικ και µία ευκαιρία. WebOrange

5 ο ΚΕΦΑΛΑΙΟ: ΠΡΑΚΤΙΚΟ ΚΟΜΜΑΤΙ

Κατάλογος Βιβλιοθήκης ΤΕΙ Ηπείρου Ιδρυματικό αποθετήριο ΤΕΙ Ηπείρου Ερευνητικό αποθετήριο ΤΕΙ Ηπείρου:

ΤΕΧΝΟΛΟΓΙΕΣ ΣΧΕΔΙΑΣΗΣ ΔΙΑΔΙΚΤΥΑΚΟΥ ΤΟΠΟΥ (Web Site Design Technologies)

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access...9. Κεφάλαιο 2 Χειρισμός πινάκων... 25

Εισαγωγική Δραστηριότητα: Χωριστείτε σε ομάδες

Ενσωματωμένα controls τα οποία προσαρμόζονται και χρησιμοποιούνται σε οποιαδήποτε ιστοσελίδα επιλέγει ο φορέας.

ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Διπλωματική Εργασία

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Αυτόματο Σύστημα Εύρεσης και Κατηγοριοποίησης Ευκαιριών Εργασίας Μηχανικών (ΕΥΡΗΚΑ)

WORDPRESS ΕΙΣΑΓΩΓΗ ΕΙΚΟΝΑΣ ΕΙΣΑΓΩΓΗ ΒΙΝΤΕΟ ΕΙΣΑΓΩΓΗ ΣΥΝΔΕΣΜΟΥ

Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο. Internet -

Information Technology for Business

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Αναλυτικές οδηγίες χρήσης ΧΡΗΣΗΣ της εφαρμογής Crowdsourcing για το ΣΒΑΚ της Νεμέας à SVAKNEMEA.EU

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Παγκόσμιος Ιστός

Στόχοι. Υπολογιστικά συστήματα: Στρώματα. Βασικές έννοιες [7]

ΕΠΛ 001: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δίκτυα Υπολογιστών

2.9.4 Χρήση του διαδικτύου για την εκτέλεση απλών εργασιών

Στρατηγική έρευνας. Στρατηγική έρευνας. Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται

Transcript:

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανές αναζήτησης

Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους από τους βασικότερους κανόνες χρήσης της μηχανής αναζήτησης της Google. Να σκιαγραφήσουμε την αρχιτεκτονική μιας μηχανής αναζήτησης. Να αναφέρουμε κάποιες από τις σοβαρότερες προκλήσεις που πρέπει να αντιμετωπίσουν οι μηχανές αναζήτησης στο μέλλον.

Εντοπισμός χωρίς URL 2 Ο Ανέστης είναι οπαδός της Ανόρθωσης και θέλει να βρει πληροφορίες για την αγαπημένη του ομάδα: στατιστικά για το τρέχον πρωτάθλημα, στατιστικά για προηγούμενα πρωταθλήματα, φωτογραφίες, βίντεο, ιστορικά στοιχεία, κλπ. Η καλύτερη πηγή αυτών των πληροφοριών είναι, φυσικά, ο επίσημος ιστοτόπος της Ανόρθωσης. Όμως, ο Ανέστης δεν γνωρίζει τον εντοπιστή (URL) αυτού του ιστοτόπου. Τι γίνεται; Πώς μπορεί ο Ανέστης να εντοπίσει τις επίσημες ιστοσελίδες της ομάδας του;

Εντοπισμός χωρίς URL 3 Θα ήταν ωραίο να υπήρχε ένας κατάλογος (σαν τον τηλεφωνικό), όπου ο Ανέστης να μπορούσε να αναζητήσει τις ιστοσελίδες που τον ενδιαφέρουν. Όμως αυτό είναι αδύνατον. Το τοπικό τηλεφωνικό δίκτυο είναι μικρό, αλλάζει αργά, και ελέγχεται από κεντρική αρχή. Αντιθέτως, ο Παγκόσμιος Ιστός είναι τεράστιος (~45 δισεκατομμύρια ιστοσελίδες την 10/11/2011). αλλάζει διαρκώς (ο καθένας μπορεί να δημιουργεί/ τροποποιεί/ διαγράφει ιστοσελίδες, κάθε στιγμή). δεν ελέγχεται κεντρικά (κανείς δεν χρειάζεται ειδική άδεια για να δημιουργήσει/τροποποιήσει/διαγράψει τις ιστοσελίδες του).

Μηχανές αναζήτησης 4 Για την διευκόλυνση της αναζήτησης πληροφοριών στον Παγκόσμιο Ιστό, έχουν δημιουργηθεί ειδικά εργαλεία που ονομάζονται μηχανές αναζήτησης (search engines). Μια μηχανή αναζήτησης μας επιτρέπει να εκτελούμε αναζητήσεις βάσει κάποιων κριτηρίων. Το βασικότερο είναι οι λέξεις κλειδιά (keywords, δηλ. λέξεις που θέλουμε/δεν θέλουμε να περιέχουν οι αναζητούμενες ιστοσελίδες). Άλλα κριτήρια είναι η γλώσσα που χρησιμοποιεί η ιστοσελίδα, η ημερομηνία δημιουργίας της, κ.ά. Η δημοφιλέστερη μηχανή αναζήτησης είναι αυτή της εταιρίας Google. Άλλες μηχανές είναι οι Yahoo! Search (Yahoo), Bing (Microsoft), Ask (Ask.com), Wolfram Alpha, κ.ά.

Μηχανές αναζήτησης 5 www.google.com search.yahoo.com www.bing.com www.ask.com www.wolframalpha.com

Αναζήτηση κειμένου 6 Για να αναζητήσουμε ιστοσελίδες που περιέχουν κάποια λέξη κλειδί, δίνουμε απλώς αυτήν τη λέξη:

Αναζήτηση κειμένου 7 Η μηχανή μας επιστρέφει έναν κατάλογο ιστοσελίδων που περιέχουν την λέξη. πόσα αποτελέσματα βρέθηκαν διάρκεια αναζήτησης μετάφραση Οπτικό Υλικό χάρτες (maps.google.com) φωτογραφίες σχέδια, κτλ.

Αναζήτηση κειμένου 8 Η μηχανή μας επιστρέφει έναν κατάλογο ιστοσελίδων που περιέχουν την λέξη. προεπισκόπηση αντίγραφο στην «κρυφή μνήμη» της Google

Αναζήτηση κειμένου 9 Όταν δίνουμε περισσότερες λέξεις, χωρισμένες με κενά, η μηχανή καταλαβαίνει ότι αναζητούμε ιστοσελίδες που περιέχουν καθεμιά από αυτές τις λέξεις. Στο παράδειγμα, ζητάμε ιστοσελίδες που να περιέχουν και τη λέξη Κύπρος και τη λέξη διακοπές.

Αναζήτηση κειμένου 10 Τα αποτελέσμα περιέχουν οποιαδήποτε από τις 2 λέξεις που αναζητήσαμε, αλλά και παράγωγά τους, χωρίς συγκεκριμένη σειρά.

Αναζήτηση κειμένου 11 Η μηχανή δεν λαμβάνει υπόψη τις πολύ συνήθεις λέξεις (π.χ. «της»), ούτε τη σειρά των λέξεων. Αν θέλουμε μια λέξη να ληφθεί οπωσδήποτε υπόψη, προθέτουμε το +. Αν θέλουμε οι λέξεις να εμφανίζονται διαδοχικά με τη δοσμένη σειρά, τις βάζουμε σε εισαγωγικά. Αν θέλουμε μια λέξη να μην εμφανίζεται, προθέτουμε το.

Αναζήτηση κειμένου 12 Αναζήτηση μόνο σε ένα συγκεκριμένο τομέα ή εξυπηρετητή

Αναζήτηση κειμένου 13 Αναζήτηση σε συγκεκριμένο τύπο αρχείων (π.χ. pdf, doc, xls, κτλ.)

Αναζήτηση κειμένου 14 Η κάθε μηχανή αναζήτησης προσφέρει διάφορους τελεστές αναζήτησης (search operators). Αναζητήστε τους για τη μηχανή που χρησιμοποιείτε!

Αναζήτηση κειμένου 15 Για περισσότερες δυνατότητες, μπορούμε να κατευθυνθούμε στη σύνθετη αναζήτηση (advanced search).

Αναζήτηση εικόνων 16 Για να αναζητήσουμε εικόνες, κατευθυνόμαστε στην αντίστοιχη επιλογή. επιλογή μεγέθους (πολύ μεγάλες, μεγάλες, μικρές, κλπ.) επιλογή είδους (πρόσωπα, σκίτσα, φωτογραφίες, κ.ά)

Άλλες ειδικές αναζητήσεις 17 Παρομοίως, μπορούμε να εκτελέσουμε άλλες ειδικές αναζητήσεις: χάρτες, βίντεο, ειδήσεις, κ.ά. Δοκιμάστε τα!

Άλλες ειδικές αναζητήσεις 18 Οι μηχανές αναζήτησης σαν πολυεργαλεία αριθμομηχανή

Άλλες ειδικές αναζητήσεις 19 Οι μηχανές αναζήτησης σαν πολυεργαλεία μετατροπέας μονάδων

Άλλες ειδικές αναζητήσεις 20 Οι μηχανές αναζήτησης σαν πολυεργαλεία εύρεση ορισμών

Αρχιτεκτονική 21 Η εργασία μιας μηχανής αναζήτησης οργανώνεται σε τρία στάδια: 1. ανίχνευση (crawling): Ένα ειδικό πρόγραμμα (crawler) επισκέπτεται διαδοχικά δισεκατομμύρια ιστοσελίδες, ακολουθώντας απλώς κάθε συνδέσμο που συναντά. 2. ευρετηρίαση (indexing): Τα περιεχόμενα των διαβα σμένων ιστοσελίδων αναλύονται, ώστε να δημιουρ γηθεί ένα ευρετήριο (index) που διευκολύνει την συσχέτιση λέξεων με ιστοσελίδες. 3. αναζήτηση (searching): Με λέξεις κλειδιά και άλλα στοιχεία, ο χρήστης σχηματίζει ένα ερώτημα (query) και το στέλνει στη μηχανή. Η μηχανή ψάχνει στο ευ ρετήριο τις ιστοσελίδες που ταιριάζουν περισσότερο με το ερώτημα, και επιστρέφει έναν κατάλογο αυτών.

Αρχιτεκτονική 22 Η χρησιμότητα μίας μηχανής αναζήτησης καθορίζεται από το πόσο σχετικά προς το ερώτημα του χρήστη είναι τα αποτελέσματα που επιστρέφει. Κατά κανόνα, μια λέξη ή φράση που αναζητείται από τον χρήστη μπορεί να βρίσκεται σε χιλιάδες ή και εκατομμύρια σελίδες. Πριν επιστρέψει αυτές τις σελίδες ως αποτελέσματα, η μηχανή πρέπει να τις κατατάξει βάσει κάποιας βαθμολογίας που να υποδεικνύει πόσο συναφής είναι καθεμιά από αυτές με το ερώτημα του χρήστη.

Προκλήσεις 23 Ο Ιστός μεγαλώνει ταχύτερα από ό,τι μπορεί να τον κατατάξει οποιαδήποτε τεχνολογία αναζήτησης. Πολλές ιστοσελίδες αλλάζουν διαρκώς, με αποτέλεσμα οι μηχανές αναζήτησης να πρέπει να τις επισκέπτονται περιοδικά. Οι περισσότερες ερωτήσεις αφορούν σε λέξειςκλειδιά και πολλά από τα αποτελέσματα δεν είναι σχετικά με αυτό που πραγματικά ψάχνει ο χρήστης (false positives). Πολλές ιστοσελίδες δημιουργούνται δυναμικά (δηλ. από λογισμικό π.χ. ως απάντηση σε κάποια αναζήτηση). Αυτές είναι δύσκολο να καταγραφούν από crawler. Πολλές δεν καταγράφονται ποτέ. Το αποτέλεσμα λέγεται αόρατος ιστός (invisible web).

Προκλήσεις 24 Κάποιες μηχανές δεν ταξινομούν τα αποτελέσματα βάσει της σχετικότητας με τις ερωτήσεις του χρήστη, αλλά ανάλογα με το πόσα χρήματα έχει πληρώσει ο κάθε ιστοτόπος. Κάποιοι ιστοτόποι μετέρχονται τεχνασμάτων ώστε η μηχανή αναζήτησης να τους εμφανίζει ως έχοντες υψηλή συσχέτιση με κάποια ερωτήματα, ενώ στην πραγματικότητα δεν έχουν.