Εργαλεία ελέγχου περιεχοµένου δικτυακών τόπων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Εργαλεία ελέγχου περιεχοµένου δικτυακών τόπων"

Transcript

1 Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης ιαπανεπιστηµιακό ιατµηµατικό Πρόγραµµα Μεταπτυχιακών Σπουδών Προηγµένα Συστήµατα Υπολογιστών και Επικοινωνιών Με κατεύθυνση: Τεχνολογίες Πληροφορικής και Επικοινωνιών της Εικόνας και του Ήχου για την εκπαίδευση και την παραγωγή ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Εργαλεία ελέγχου περιεχοµένου δικτυακών τόπων Γιοµελάκης ηµήτριος Εποπτεύων Καθηγητής: Ανδρέας Βέγλης Θεσσαλονίκη 2010

2 Περιεχόµενα Πρόλογος...4 Κεφάλαιο Μηχανές και Υπηρεσίες Αναζήτησης... 6 Εισαγωγή... 7 Βασικές µέθοδοι: Η αναζήτηση και η πλοήγηση... 7 Τι είναι Μηχανές αναζήτησης;... 8 Τα µέρη µιας µηχανής αναζήτησης... 8 Τρόποι καταχώρησης στις µηχανές αναζήτησης Κριτήρια ιεράρχησης αποτελεσµάτων σε µηχανές αναζήτησης Περισσότερα για τα µετα-δεδοµένα Μετα-µηχανές Αναζήτησης Θεµατικοί κατάλογοι Ορισµός Χαρακτηριστικά Μηχανές αναζήτησης VS Θεµατικοί κατάλογοι Οι Πύλες (Portals) Ορισµός Χαρακτηριστικά Τα Vortals Μηχανή αναζήτησης, θεµατικός κατάλογος και πύλη Κεφάλαιο Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης Η Αναζήτηση στην Ελλάδα Οι µηχανές αναζήτησης σήµερα Κεφάλαιο Η Μηχανή Αναζήτησης της Google Η Ονοµασία Ο Σχεδιασµός Η Τεχνολογία της Google Το Google σε αριθµούς: Υπηρεσίες Google Google Analytics Google Adwords Google AdSense Κεφάλαιο Βελτιστοποίηση για τις Μηχανές Αναζήτησης Εισαγωγή Ορισµός Στόχος Η εµφάνιση του SEO Περιεχόµενα 1

3 Η σπουδαιότητα του SEO Παράγοντες που επηρεάζουν την κατάταξη Εντός ιστοσελίδας (on-page) παράγοντες κατάταξης Εκτός ιστοσελίδας (off-page) παράγοντες κατάταξης Παράγοντες που επηρεάζουν αρνητικά την κατάταξη: Στρατηγικές Κεφάλαιο Λογισµικό / Εργαλεία SEO Αντικείµενα Κατηγορίες ελέγχου των SEO Tools Η περίπτωση του Alexa.com Η περίπτωση του Wayback Archive Machine H ιστοσελίδα Compete.com Social Media Optimization (SMO) Κεφάλαιο Ποιοτική Ανάλυση Περιεχοµένου Ευρεστικές αρχές ποιοτικής ανάλυσης περιεχοµένου Χρήση κλίµακας στην ανάλυση Κεφάλαιο Εργαλεία επεξεργασίας διαδικτυακού περιεχοµένου Web Seo Analytics Ορθογράφος Ιστοσελίδων SEO Power Suite Ranks NL Xenu's Link Sleuth Άλλες κατηγορίες εργαλείων περιεχοµένου δικτυακών τόπων Adobe BrowserLab Mozilla Firefox SEO Add-ons Κεφάλαιο Site Content Analyzer Το λογισµικό Site Content Analyzer Χαρακτηριστικά Κεφάλαιο Άλλες ενδιαφέρουσες περιπτώσεις Η περίπτωση του Spactor.com Το Google Audio Indexing Το Google PDF Η µηχανή αναζήτησης Wolfram Alpha Η µηχανή αναζήτησης OneRiot Κεφάλαιο Case Study Έλεγχος PageRank (PR) Έλεγχος ποσοστού κειµένου (Content Ratio) Έλεγχος ορθογραφίας ιστοσελίδων Περιεχόµενα 2

4 Έλεγχος των εξωτερικών συνδέσµων µε το Xenu s Link Sleuth Αριθµός λέξεων στην εισαγωγή (lead) των ειδήσεων και σύνδεσµοι Έλεγχος περιεχοµένου µε το Site Content Analyzer Συµπεράσµατα Βιβλιογραφία Παράρτηµα Περιεχόµενα 3

5 Πρόλογος Το διαδίκτυο αποτελεί έναν πελώριο «ψηφιακό πλανήτη» που αναπτύσσεται καθηµερινά µε ραγδαίους ρυθµούς και καλεί συνεχώς όλους τους χρήστες του, να τον εξερευνήσουν. Το ταξίδι στο µέσο αυτό, εξελίσσεται σε µια ευχάριστη περιπέτεια αναζήτησης της γνώσης στο κόσµο τη πληροφορίας και της επικοινωνίας. Σε σύντοµο χρονικό διάστηµα το διαδίκτυο κατάφερε να εξελιχθεί σε µια τεράστια πηγή πληροφόρησης ενώ παράλληλα ο δραµατικός και συνεχής ρυθµός αύξησης του όγκου και της χρήσης του, καθιστούν το περιεχόµενο του απέραντο και ανυπολόγιστο. Ένα περιεχόµενο που λαµβάνει χώρα µέσα από την ύπαρξη παγκοσµίως δισεκατοµµυρίων ιστοσελίδων που περιλαµβάνουν πληροφορίες σχετικές µε µια ευρεία γκάµα θεµάτων. Στα πλαίσια των συνεχών τεχνολογικών εξελίξεων, είναι λογικό να παρατηρείται µία ανάπτυξη νέων υπηρεσιών και εργαλείων. Αντικείµενο της παρούσας εργασίας, αποτέλεσαν τα εργαλεία που πραγµατοποιούν κάποιο είδος ελέγχου στο περιεχόµενο των δικτυακών τόπων του διαδικτύου. Η ενίσχυση της µάθησης, µέσω της µελέτης και της επεξεργασίας του υπό πραγµάτευση θέµατος, αποτέλεσε εφαλτήριο για έρευνα. Σκοπός της εργασίας είναι αφού πρωτίστως αποδειχθεί η ύπαρξη τέτοιων εργαλείων µέσω της αναφοράς και παρουσίασης τους, µε τη χρήση αυτών να µετατραπεί η διαδικασία επεξεργασίας και µελέτης του περιεχοµένου των δικτυακών τόπων από τους διαφόρους µελετητές, σε µια πλήρως αυτοµατοποιηµένη διαδικασία µε ότι οφέλη αυτό συνεπάγεται. Αυτό αποτέλεσε και το πλαίσιο στο οποίο κυµάνθηκε η διερεύνηση του θέµατος της πτυχιακής. Η διπλωµατική αυτή εργασία περιλαµβάνει αφενός την πραγµατοποίηση µιας ερευνητικής εργασίας και αφετέρου µια σηµαντική εργασία σύνθεσης και παρουσίασης των αποτελεσµάτων. Σηµαντικότερη συνιστώσα της θεωρητικής αυτής έρευνας, υπήρξε µια βιβλιογραφική κυρίως έρευνα για το τι υπάρχει σχετικά µε το θέµα. Η διάρθρωση της εργασίας αποτελείται από τα εξής δέκα κεφάλαια: Στο κεφάλαιο 1, γίνεται παρουσίαση των µηχανών και των διαφόρων υπηρεσιών αναζήτησης. Ο καλύτερος και ποιοτικότερος έλεγχος περιεχοµένου στο διαδίκτυο είναι γεγονός πως πραγµατοποιείται από τις µηχανές αναζήτησης. Τα περισσότερα εργαλεία που παρουσιάζονται στην εργασία βασίζονται σ αυτές και κυρίως στα Πρόλογος 4

6 κριτήρια µε βάση τα οποία εµφανίζουν τα αποτελέσµατα τους. Για το λόγο αυτό αλλά και για καλύτερη κατανόηση ορισµένων όρων, κρίθηκε σκόπιµη η ύπαρξη αυτού του κεφαλαίου. Στο κεφάλαιο 2 πραγµατοποιείται µια ιστορική εξέλιξη των παραπάνω µηχανών και υπηρεσιών ενώ το κεφάλαιο 3 είναι αφιερωµένο στην µηχανή αναζήτησης της Google. Στο κεφάλαιο 4 γίνεται λεπτοµερειακή αναφορά στη διαδικασία βελτιστοποίησης των δικτυακών τόπων για τις µηχανές αναζήτησης, αυτό που είναι διεθνώς αναγνωρισµένο ως Search Engine Optimization (SEO). Η ύπαρξη και αυτού του κεφαλαίου κρίθηκε απαραίτητη για τους ίδιους λόγους µε το πρώτο. Στο κεφάλαιο 5 γίνεται µια γενική αναφορά στο λογισµικό / εργαλεία του SEO, στο 6 παρατίθεται ευρεστικές αρχές για µια ποιοτική ανάλυση του περιεχοµένου των δικτυακών τόπων ενώ στο κεφάλαιο 7 αναφέρονται συγκεκριµένα εργαλεία που εκτελούν έλεγχο περιεχοµένου σε δικτυακούς τόπους. Αξίζει να σηµειωθεί πως η πλειονότητα των εργαλείων ανήκουν στα SEO Tools, παρόλα αυτά αρκετά χαρακτηριστικά τους εµπίπτουν στο αντικείµενο της εργασίας. Το κεφάλαιο 8 είναι αφιερωµένο εξολοκλήρου στο λογισµικό Site Content Analyzer 3 που κρίθηκε από την έρευνα ως η πιο αξιόπιστη και λειτουργική εφαρµογή. Τέλος στο κεφάλαιο 9 αναφέρονται κάποιες ιδιαίτερα ενδιαφέρουσες περιπτώσεις λογισµικού / εργαλείων που εντοπίστηκαν κατά τη διάρκεια της εκπόνησης της εργασίας ενώ στο 10 επιχειρείται ένα case study και διάφορες συγκρίσεις µε τη βοήθεια ορισµένων από τα συγκεκριµένα αυτά εργαλεία που αναφέρονται στην έρευνα. Στο σηµείο αυτό, θα ήθελα να ευχαριστήσω θερµά τον αναπληρωτή καθηγητή µου κύριο Α.Βέγλη για την εµπιστοσύνη που µου έδειξε στην ανάθεση της πτυχιακής µου µελέτης καθώς και για τη συνεχή του καθοδήγηση, από το ξεκίνηµα και τον προσδιορισµό του θέµατος έως και το τέλος µε τη διεκπεραίωση αυτής. Τέλος, αισθάνοµαι την ανάγκη να ευχαριστήσω τον Κωνσταντίνο Σκλήρη, ιδιοκτήτη του blog netclick όπως επίσης και την Ελευθερία Πάντση για τις πολύτιµες πληροφορίες που µου προσέφεραν και για το χρόνο που µου διέθεσαν. Πρόλογος 5

7 Κεφάλαιο 1 Μηχανές και Υπηρεσίες Αναζήτησης

8 Κεφάλαιο 1 Εισαγωγή Η ύπαρξη παγκοσµίως δισεκατοµµυρίων ιστοσελίδων που περιλαµβάνουν πληροφορίες σχετικές µε µία ευρεία γκάµα θεµάτων, σε συνδυασµό µε την αναρχία που επικρατεί στο διαδίκτυο (επακόλουθο της ίδιας του της δοµής και του τρόπου οργάνωσης του) δηµιούργησαν την επιτακτική ανάγκη για την ύπαρξη ενός µηχανισµού που θα επιτρέπει στο χρήστη να αναζητάει και να βρίσκει ιστοσελίδες µε τα θέµατα που τον ενδιαφέρουν, χωρίς να σπαταλά το χρόνο του βλέποντας άχρηστες ιστοσελίδες. Το διαδίκτυο εξελίχθηκε σε µία τεράστια πηγή πληροφόρησης και ο δραµατικός ρυθµός αύξησης του όγκου και της χρήσης του καθηµερινά, καθιστούν απαραίτητη τη δηµιουργία αξιόπιστων µηχανών αναζήτησης, που αποτελούν και τον κύριο µοχλό ανάπτυξης του internet. Οι υπηρεσίες αναζήτησης περιλαµβάνουν σε γενικές γραµµές τις µηχανές αναζήτησης (search engines) και τους θεµατικούς καταλόγους (subjects directories). Βασικές µέθοδοι: Η αναζήτηση και η πλοήγηση Υπάρχουν δύο βασικές µέθοδοι εύρεσης πληροφοριών στο διαδίκτυο: η αναζήτηση και η πλοήγηση. Η πλοήγηση είναι η διαδικασία όπου ένας χρήστης ακολουθεί ένα µονοπάτι υπερ-συνδέσεων (links µε σχετικό περιεχόµενο) που δηµιουργείται ανάµεσα σε διαφορετικές ιστοσελίδες. Οι λέξεις που περιλαµβάνονται σε µία υπερ-σύνδεση αποτελούν τον τίτλο ή την περιγραφή του εγγράφου όπου οδηγεί η υπερ-σύνδεση. Με αυτό τον τρόπο η πλοήγηση στο διαδίκτυο είναι εύκολη και διαισθητική [6]. Η δεύτερη µέθοδος, η αναζήτηση είναι πιο πολύπλοκη τεχνολογικά καθώς βασίζεται στη χρήση ειδικού λογισµικού που περιλαµβάνει αυτοµατοποιηµένη τεχνολογία για την αναζήτηση websites, την αποθήκευση τους σε έναν ηλεκτρονικό κατάλογο και την αυτόµατη ανάκτηση τους βασισµένη στα ερωτήµατα του χρήστη. Η αποτελεσµατική αναζήτηση, σε αντίθεση µε την πλοήγηση, απαιτεί γνώσεις του τρόπου χρήσης του λογισµικού αναζήτησης αλλά και αρκετή εξάσκηση [6]. Όταν το διαδίκτυο ήταν σχετικά νέο και περιορισµένο σε µέγεθος, η πλοήγηση ήταν µία επαρκής µέθοδος εντοπισµού πληροφοριών. Όµως η αύξηση µε ιλιγγιώδεις Μηχανές και Υπηρεσίες Αναζήτησης 7

9 Κεφάλαιο 1 ρυθµούς των ιστοσελίδων σε καθηµερινή βάση στο ίντερνετ δηµιούργησε ανάγκη για νέα εργαλεία. Η πρώτη µέθοδος που περιλαµβάνει τους θεµατικούς καταλόγους βασίστηκε στα πρώτα εργαλεία έρευνας στο διαδίκτυο όπως το Archie και τον Gopher ενώ η δεύτερη µέθοδος, περιλαµβάνει τις µηχανές αναζήτησης και βασίστηκε σε κλασσικές τεχνικές αναζήτησης πληροφοριών από τον χώρο των βάσεων δεδοµένων. Τι είναι Μηχανές αναζήτησης; Οι µηχανές αναζήτησης είναι προγράµµατα που επιτρέπουν την αναζήτηση µε λέξεις-κλειδιά (keywords) σε τεράστιες βάσεις δεδοµένων αρχείων του διαδικτύου. Είναι τα περισσότερο διαδεδοµένα µέσα για την εύρεση πληροφορίας στο Ίντερνετ και αποτελούν µια αποτελεσµατική µέθοδο για προσέλκυση επισκεπτών στο δικτυακό τόπο µιας επιχείρησης. Έρευνες έδειξαν ότι ένα πολύ µεγάλο ποσοστό των πελατών καταναλωτών χρησιµοποιούν τις Μηχανές Αναζήτησης για να εντοπίσουν µια ιστοσελίδα µε περιεχόµενο που τους ενδιαφέρει. Οι µηχανές αναζήτησης διαθέτουν βάσεις δεδοµένων που περιλαµβάνουν ευρετήριο µε το πλήρες κείµενο των ιστοσελίδων. Όταν ένας χρήστης χρησιµοποιεί µία µηχανή αναζήτησης, στην πραγµατικότητα ερευνά τη βάση δεδοµένων των καταχωρηµένων ιστοσελίδων (και όχι το ίδιο το WWW). Όταν ψάχνουµε στο ιαδίκτυο χρησιµοποιώντας µια Μηχανή Αναζήτησης, αναζητούµε κατά κάποιο τρόπο ένα παλιό αντίγραφο της πραγµατικής ιστοσελίδας, όπως αυτό υπάρχει στη βάση δεδοµένων της µηχανής. Οι βάσεις δεδοµένων των µηχανών αναζήτησης είναι ρυθµισµένες ώστε να δίνουν ταχύτατα αποτελέσµατα, πράγµα το οποίο θα ήταν αδύνατο να συµβεί αν οι µηχανές προσπαθούσαν να ερευνήσουν τα δισεκατοµµύρια ιστοσελίδων σε πραγµατικό χρόνο. Όταν κάνουµε «κλικ» πάνω στους συνδέσµους (links) που παρέχονται από τα αποτελέσµατα αναζήτησης της Μηχανής, ανακτούµε από τον server την τωρινή έκδοση της σελίδας. Τα µέρη µιας µηχανής αναζήτησης Μια µηχανή αναζήτησης αποτελείται από τρία βασικά µέρη: Μηχανές και Υπηρεσίες Αναζήτησης 8

10 Κεφάλαιο 1 Α. Η αράχνη Τα προγράµµατα αράχνες (ή Spider ή Robot) είναι οι ανιχνευτές των µηχανών αναζήτησης. Η αποστολή τους είναι να βρίσκουν και να ανακτούν ιστοσελίδες στο διαδίκτυο και να τις µεταβιβάζουν στο ευρετήριο της µηχανής αναζήτησης. Παρά το ότι το όνοµα των αραχνών υπονοεί ότι ταξιδεύουν πάνω στον παγκόσµιο ιστό στη πραγµατικότητα η λειτουργία τους είναι περίπου όµοια µε έναν περιηγητή, που στέλνει αίτηση για µία ιστοσελίδα, κατεβάζει την ιστοσελίδα και τη διαβιβάζει στον µηχανισµό του ευρετηρίου. Φυσικά οι αράχνες ζητούν και διαβάζουν τις ιστοσελίδες πολύ γρηγορότερα από έναν περιηγητή. Στη πραγµατικότητα οι περισσότερες αράχνες ζητούν ταυτόχρονα εκατοντάδες ακόµη και χιλιάδες διαφορετικές ιστοσελίδες. Εξαιτίας αυτής της δυνατότητας τους οι αράχνες είναι προγραµµατισµένες να κατανέµουν τις αιτήσεις τους σε πολλούς διακοµιστές ώστε να µην κατακλύζουν έναν διακοµιστή µε τις αιτήσεις τους και να µην καταλαµβάνουν µεγάλο κοµµάτι του εύρους ζώνης, ώστε να µην µπορούν να εξυπηρετηθούν οι χρήστες [6]. Περισσότερα για τις αράχνες (Spiders) ή robot ή crawlers Με την τροµακτική αύξηση του διαδικτύου έγινε πάρα πολύ δύσκολο να καταγράφονται όλες οι νέες ιστοσελίδες που εµφανιζόντουσαν κάθε µέρα. Η ιδέα του Wanderer υιοθετήθηκε από πολλούς προγραµµατιστές ώστε να δηµιουργήσουν robot ή spiders (αράχνες) ή crawlers όπως επικράτησε να ονοµάζονται. Το robot, είναι ένα λογισµικό που εξετάζει την hypertext κατασκευή του Web ανακτώντας το κείµενο της ιστοσελίδας και ανακτώντας περιοδικά (µία φορά στους έξι µήνες συνήθως) όλα τα κείµενα για τα οποία υπάρχει αναφορά σε αυτό. Αυτοµατοποιεί επαναλαµβανόµενες εργασίες σε ασσύληπτες ταχύτητες για έναν άνθρωπο. Τα προγράµµατα αυτά που ερευνούν συστηµατικά το διαδίκτυο για ιστοσελίδες, εξερευνούν όλες τις συνδέσεις από ένα δικτυακό τόπο εκκίνησης, που περιλαµβάνει πολλές συνδέσεις µε άλλες ιστοσελίδες. Η ιδέα ήταν ότι εξ ορισµού κάθε ιστοσελίδα πρέπει να συνδέεται µε κάποια άλλη. Ερευνώντας ένα µεγάλο αριθµό ιστοσελίδων και ακολουθώντας όλες τις συνδέσεις, ένας χρήστης θα ανακαλύψει νέες ιστοσελίδες που περιλαµβάνουν άλλες συνδέσεις. Με τον τρόπο αυτό το µεγαλύτερο τµήµα του διαδικτύου µπορεί να εξερευνηθεί, επαναλαµβάνοντας την παραπάνω διαδικασία. Χρησιµοποιήθηκε κατά κόρον όλα τα επόµενα χρόνια µέχρι τις µέρες µας, κυρίως Μηχανές και Υπηρεσίες Αναζήτησης 9

11 Κεφάλαιο 1 από µηχανές αναζήτησης, για την επικαιροποίηση και την κατηγοριοποίηση των ιστοσελίδων του Web. Πάντως η διαδικασία αυτή προκάλεσε πολλές αντιδράσεις, καθώς ορισµένες όχι σωστά προγραµµατισµένες αράχνες, προκαλούσαν τεράστια κίνηση στο δίκτυο επειδή επισκέπτονταν πολλές φορές τις ίδιες ιστοσελίδες. Οι περισσότεροι διαχειριστές τις αντιµετώπιζαν εχθρικά, ενώ οι προγραµµατιστές δηµιουργούσαν όλο και περισσότερες αράχνες. Εικόνα 1: Η λειτουργία µίας αράχνης δικτύου Το κόστος για την λειτουργία της αράχνης είναι αρκετά υψηλό, καθώς η εταιρεία που διατηρεί τη µηχανή αναζήτησης θα πρέπει συνεχώς να αυξάνει την υπολογιστική της ισχύ ώστε να µπορεί να καλύπτει την εκρηκτική ανάπτυξη του WWW, καθώς και να αναβαθµίζει τακτικά το εύρος των συνδέσεων της µε το διαδίκτυο. Για αυτό το λόγο είναι δυνατόν ορισµένες µηχανές αναζήτησης, εκτός απ τον περιορισµό στον αριθµό των ιστοσελίδων από κάθε δικτυακό τόπο, να περιορίζουν και το συνολικό αριθµό των ιστοσελίδων στο ευρετήριο τους (π.χ. διαγράφοντας τις πιο παλιές), ή να περιορίζουν τη συχνότητα των επισκέψεων στις ίδιες σελίδες ή τέλος να περιορίζουν την αράχνη σε ορισµένες περιοχές του διαδικτύου, όπου πιστεύουν ότι περιέχουν αξιόπιστες πληροφορίες. Μηχανές και Υπηρεσίες Αναζήτησης 10

12 Κεφάλαιο 1 Β. Μηχανισµός ευρετηρίου Όταν η αράχνη επισκέπτεται µία ιστοσελίδα, την παραδίδει στον µηχανισµό ευρετηρίου, ο οποίος αποθηκεύει το πλήρες κείµενο της ιστοσελίδας στη βάση δεδοµένων της µηχανής αναζήτησης, συνήθως σε δοµή ανεστραµµένου ευρετηρίου. Το ανεστραµµένο ευρετήριο είναι ταξινοµηµένο αλφαβητικά, µε κάθε καταχώριση του ευρετηρίου να περιλαµβάνει µία λέξη, µία λίστα µε ιστοσελίδες και σε ορισµένες περιπτώσεις τις ακριβείς θέσεις της λέξης µέσα στην ιστοσελίδα. Αυτή η δοµή θεωρείται ιδανική για τις έρευνες µε λέξεις κλειδιά, παρέχοντας γρήγορη πρόσβαση σε ιστοσελίδες που περιλαµβάνουν αυτές τις λέξεις κλειδιά. Με σκοπό τη βελτίωση της αναζήτησης, ορισµένες µηχανές αναζήτησης εξαλείφουν συνηθισµένες λέξεις που ονοµάζονται stop words. Επίσης ο µηχανισµός ευρετηρίου εκτελεί και άλλες ενέργειες βελτίωσης της απόδοσης όπως η εξάλειψη των σηµείων στίξης, των πολλαπλών διαστηµάτων και ορισµένες φορές µετατρέπει όλα τα γράµµατα σε πεζά [6]. Η καταχώριση στο ευρετήριο ολόκληρου του κειµένου των ιστοσελίδων, επιτρέπει σε µία µηχανή αναζήτησης να προσφέρει περισσότερες δυνατότητες από την εύρεση ιστοσελίδων που να εµπεριέχουν τις λέξεις κλειδιά. Αν η θέση κάθε λέξης καταγράφεται µπορούν να χρησιµοποιηθούν τελεστές εγγύτητας (NEAR) για τον περιορισµό του αριθµού αποτελεσµάτων των αναζητήσεων. Επίσης η µηχανή µπορεί να αναζητήσει φράσεις ή ακόµη και µεγαλύτερα κοµµάτια κειµένου. Τέλος, αν η µηχανή καταγράφει εκτός του κειµένου της ιστοσελίδας και τον κώδικα HTML, η αναζήτηση µπορεί να περιοριστεί σε ορισµένα χαρακτηριστικά µίας ιστοσελίδας όπως ο τίτλος, η διεύθυνση και άλλα. Όταν η αράχνη ανακαλύψει αλλαγές σε κάποιες ιστοσελίδες, τότε ενηµερώνονται και τα αντίγραφα στο ευρετήριο. Βέβαια, το τι ακριβώς αντιγράφει στο ευρετήριο, η αράχνη εξαρτάται από κάθε µηχανή αναζήτησης. Οι περισσότερες αξιόλογες µηχανές διαθέτουν το πλήρες κείµενο των ιστοσελίδων στο ευρετήριο τους, υπάρχουν όµως και κάποιες που ευρετηριάζουν µόνο τον τίτλο µιας ιστοσελίδας και τις πρώτες γραµµές κειµένου [6]. Γ. Μηχανισµός αναζήτησης Ο µηχανισµός αναζήτησης είναι χωρίς αµφιβολία το πιο πολύπλοκο τµήµα µίας µηχανής αναζήτησης. Περιλαµβάνει πολλά τµήµατα όπως: (α) τη διασύνδεση µε το χρήστη (φόρµα αναζήτησης), (β) το µηχανισµό που αξιολογεί το ερώτηµα και Μηχανές και Υπηρεσίες Αναζήτησης 11

13 Κεφάλαιο 1 εντοπίζει τις πιο σχετικές ιστοσελίδες στη βάση δεδοµένων της µηχανής και (γ) το µορφοποιητή των αποτελεσµάτων. Η φόρµα αναζήτησης και η µορφοποίηση των αποτελεσµάτων είναι περίπου ίδιες σε όλες τις µηχανές αναζήτησης. Όλες οι µηχανές διαθέτουν φόρµες απλής και προχωρηµένης αναζήτησης και δίνουν στους χρήστες τη δυνατότητα να περιορίσουν την αναζήτηση µε διάφορες παραµέτρους. Επίσης η εµφάνιση των αποτελεσµάτων είναι παρόµοια και περιλαµβάνει συνήθως και επιπλέον υπερ-συνδέσεις (µε γνώµονα το πόσο δηµοφιλείς είναι) [6]. Όταν πραγµατοποιηθεί µια αναζήτηση και γίνει η συλλογή των αποτελεσµάτων από τη βάση δεδοµένων της Μηχανής, τα αποτελέσµατα αυτά επιστρέφονται στο χρήστη µε τη µορφή µιας λίστας µε συνδέσεις στις αντίστοιχες σελίδες. Ο τρόπος µε τον οποίο εµφανίζονται τα αποτελέσµατα αυτά, αλλά και η ταξινόµησή τους στη λίστα, διαφέρει από Μηχανή σε Μηχανή. Τα αποτελέσµατα της αναζήτησης είναι δυνατό : να ακολουθούν κάποιον αλγόριθµο ταξινόµησης προκειµένου να εξαχθεί η σειρά µε την οποία θα εµφανιστούν στη λίστα να τοποθετούνται τυχαία στη λίστα να τοποθετούνται ανάλογα µε τα χρήµατα που πληρώνει ο ιδιοκτήτης του κάθε δικτυακού τόπου στην εταιρία της Μηχανής Αναζήτησης ειδικά για να τοποθετηθεί η ιστοσελίδα του σε καλύτερη σειρά στη λίστα. να χρησιµοποιείται συνδυασµός των παραπάνω µεθόδων, ανάλογα µε την κάθε περίπτωση. Μερικοί τύποι σελίδων και συνδέσµων εξαιρούνται, λόγω πολιτικής από τις περισσότερες Μηχανές Αναζήτησης. Άλλες, πάλι, εξαιρούνται επειδή οι «αράχνες» των Μηχανών Αναζήτησης δεν µπορούν να τις προσπελάσουν (αν µία ιστοσελίδα δεν έχει συνδέσµους από άλλες ιστοσελίδες). Αυτές οι σελίδες που εξαιρούνται αναφέρονται ως το «Αόρατο ιαδίκτυο» (Invisible ή Deep Web) πρόκειται για ότι δεν επιστρέφεται από τις Μηχανές Αναζήτησης ως αποτέλεσµα. Άλλο παράδειγµα είναι πως, µία µηχανή αναζήτησης δεν θα µας δώσει καµιά πληροφορία για τον τηλεφωνικό αριθµό ενός ατόµου (αν αυτός δεν είναι καταγεγραµµένος στο κείµενο µιας ιστοσελίδας), ακόµη και αν µπορούµε να αντλήσουµε αυτή τη πληροφορία από Μηχανές και Υπηρεσίες Αναζήτησης 12

14 Κεφάλαιο 1 την ιστοσελίδα του παρόχου της τηλεφωνικής σύνδεσης. Το Αόρατο ιαδίκτυο εκτιµάται ότι είναι µεγαλύτερο δυο µε τρεις φορές, ή και περισσότερο, από το «ορατό» ιαδίκτυο. Τρόποι καταχώρησης στις µηχανές αναζήτησης Οι µηχανές αναζήτησης βρίσκουν ιστοσελίδες µε διάφορους τρόπους: 1) Φόρµα καταχώρησης: Οι περισσότερες µηχανές αναζήτησης διαθέτουν µία φόρµα καταχώρησης διεύθυνσης (add URL) που επιτρέπει στους διαχειριστές των ιστοσελίδων να ενηµερώνουν τις µηχανές αναζήτησης για τις διευθύνσεις των ιστοσελίδων τους (π.χ. για την google στο Στα πρώτα χρόνια η µέθοδος έδινε καλά αποτελέσµατα µε την πάροδο όµως των χρόνων έγινε αγαπηµένη ασχολία των spammers. 2) Με τους συνδέσµους των ιστοσελίδων (από Spider): Η δεύτερη µέθοδος εύρεσης ιστοσελίδων χρησιµοποιεί την ύπαρξη υπερσυνδέσεων στις ιστοσελίδες. Όταν η αράχνη επισκέπτεται µία ιστοσελίδα καταγράφει όλες τις διευθύνσεις των υπερ-συνδέσεων και τις προσθέτει στη λίστα για µελλοντική προσπέλαση. Η συλλογή υπερ-συνδέσεων από πραγµατικές ιστοσελίδες µειώνει δραµατικά τον όγκο των χαµηλής ποιότητας ιστοσελίδων που συναντά η αράχνη, καθώς η πλειοψηφία των σχεδιαστών ιστοσελίδων εισάγουν υπερ-συνδέσµους µόνο σε ιστοσελίδες υψηλής ποιότητας. Η διαδικασία της συλλογής υπερ-συνδέσεων έχει ως αποτέλεσµα η αράχνη να δηµιουργεί µία ευρεία λίστα διευθύνσεων. Επίσης επιτρέπει στις αράχνες να επισκέπτονται όλες τις ιστοσελίδες σε κάθε δικτυακό τόπο ακολουθώντας τις εσωτερικές υπερ-συνδέσεις. Παρά το ότι η παραπάνω διαδικασία είναι απλή, οι αράχνες απαιτούν προσεκτικό προγραµµατισµό για να αντιµετωπίσουν όλα τα πιθανά ενδεχόµενα. Αρχικά πρέπει η αράχνη να ακολουθεί µόνο τις υπερσυνδέσεις που οδηγούν σε ιστοσελίδες που δεν έχει επισκεφτεί. Σε περίπτωση που η αράχνη έχει επισκεφτεί µία διεύθυνση πρέπει να καθορίσει αν έχει περάσει αρκετός χρόνος ώστε να δικαιολογείται η επανάληψη της επίσκεψης. εν πρέπει ποτέ ο χρήστης να θεωρεί δεδοµένο ότι επειδή µία µηχανή αναζήτησης έχει καταγράψει Μηχανές και Υπηρεσίες Αναζήτησης 13

15 Κεφάλαιο 1 µερικές ιστοσελίδες από ένα δικτυακό τόπο, θα πρέπει να έχει καταγράψει όλες τις ιστοσελίδες του δικτυακού τόπου. Αυτή η διαδικασία τέλος δεν ενδείκνυται κυρίως για επιχειρήσεις καθώς µπορεί να περάσουν ακόµη και µήνες µέχρι οι «αράχνες» των Μηχανών Αναζήτησης να ανακαλύψουν το δικτυακό τόπο. 3) Ειδικά προγράµµατα: Ο λόγος για τις ιστοσελίδες που έχουν καταχωρηθεί στις µηχανές µε τη χρήση ειδικών προγραµµάτων. Το πρόγραµµα αναλαµβάνει να καταχωρήσει την ιστοσελίδα σε µια ή και περισσότερες Μηχανές Αναζήτησης, χωρίς να απαιτείται από τον ενδιαφερόµενο καµιά δική του ανάµειξη σε όλη τη διαδικασία καταχώρησης. Παραδείγµατα τέτοιων προγραµµάτων είναι τα: ACE Search Engine Submission Software, SignPoster, Aid Submission Genius και άλλα. 4) Με πληρωµή: Να πληρώσει δηλαδή ο ιδιοκτήτης ενός δικτυακού τόπου την εταιρία της Μηχανής Αναζήτησης έτσι ώστε αυτή να προχωρήσει στη δεικτοδότηση καταχώρηση του: Το βασικότερο πλεονέκτηµα σε αυτή την περίπτωση είναι ότι δεν χρειάζεται να περιµένει κανείς µέχρι οι Μηχανές Αναζήτησης να βρουν και να δεικτοδοτήσουν το δικτυακό του τόπο. Κριτήρια ιεράρχησης αποτελεσµάτων σε µηχανές αναζήτησης Σε αντίθεση µε τους ανθρώπους οι µηχανές αναζήτησης δεν διαθέτουν κάποια κρίση ή εµπειρία µε βάση την οποία να προβούν στην ιεράρχηση των αποτελεσµάτων µιας αναζήτησης. Έχουν όµως την δυνατότητα να ιεραρχούν τα αποτελέσµατα υπολογίζοντας την συνάφεια, το ποσοστό δηλαδή που αντικατοπτρίζει πόσο σχετικό είναι το περιεχόµενο µιας ιστοσελίδας µε τις λέξεις-κλειδιά της αναζήτησης, ακολουθώντας µία σειρά από κανόνες (αλγόριθµους). Το πως ακριβώς δουλεύει ο αλγόριθµος µιας συγκεκριµένης µηχανής αναζήτησης αποτελεί εµπορικό µυστικό. Σε γενικές γραµµές όµως, οι δύο κυριότεροι κανόνες, που ακολουθούνται από το σύνολο των µηχανών αναζήτησης για την ιεράρχηση των αποτελεσµάτων, αφορούν στην τοποθεσία και την συχνότητα των λέξεων-κλειδιών µέσα σε µία ιστοσελίδα [6]. Μηχανές και Υπηρεσίες Αναζήτησης 14

16 Κεφάλαιο 1 Οι µηχανές αναζήτησης βελτιώνουν συνεχώς τις τεχνικές προσδιορισµού συνάφειας, χρησιµοποιώντας µία σειρά από επιπλέον κριτήρια για την ιεράρχηση των αποτελεσµάτων. Ένα από αυτά είναι και η ανάλυση των υπερ-συνδέσµων. Ένα άλλο κριτήριο είναι η δηµοτικότητα µιας ιστοσελίδας, δηλαδή πόσες επισκέψεις δέχεται µία ιστοσελίδα για µία συγκεκριµένη αναζήτηση. Επιπλέον, χρησιµοποιούν και διάφορες µεθόδους συντακτικής βαθµολόγησης όσον αφορά την κατάταξη των αποτελεσµάτων (όπως page rank). Αξίζει να σηµειωθεί πως, οι µηχανές αναζήτησης χρησιµοποιούνε και διάφορες τεχνικές για να ανακαλύπτουν προσπάθειες παραποίησης από σχεδιαστές ιστοσελίδων, που θέλουν να πετύχουν υψηλές θέσεις στην ιεράρχηση των αποτελεσµάτων. Επειδή όµως η ανθρώπινη λογική είναι πολύ πιο σύνθετη από τον αλγόριθµο που χρησιµοποιεί µία µηχανή αναζήτησης, είναι σκόπιµο να τονιστεί πως ο χρήστης δεν µπορεί να έχει απόλυτη εµπιστοσύνη στην ιεράρχηση των αποτελεσµάτων αν και στην εποχή µας το επίπεδο των κορυφαίων µηχανών έχει φτάσει σε πολύ υψηλά επίπεδα. Οι µηχανές αναζήτησης σύµφωνα µε όλες τις µετρήσεις διακινούν ανάλογα µε την χώρα και τους χρήστες του ίντερνετ από το % των επισκεπτών του ίντερνετ και µε τα αποτελέσµατα τους µπορούν να ανεβάσουν την επισκεψιµότητα ενός δικτυακού τόπου ή να το εξαφανίσουν σε πρακτικό επίπεδο. Για αυτό το λόγο η κύρια δουλειά ενός διαχειριστή δικτυακών τόπων και ιστοσελίδων (webmaster) είναι οι ιστοσελίδες του να είναι φτιαγµένες µε φιλικό προς τις µηχανές αναζήτησης τρόπο ώστε να περιλαµβάνονται στην βάση δεδοµένων και να ανεβαίνουν ψηλά στα αποτελέσµατα των µηχανών αναζήτησης στις αναζητήσεις που τον ενδιαφέρουν. Συνοπτικά οι σηµαντικότεροι παράγοντες που µπορούν να επηρεάσουν την κατάταξη στις λίστες των µηχανών αναζήτησης είναι µε σειρά προτεραιότητας: 1) Ο τίτλος της σελίδας (HTML page title) που αποτελεί και τον νούµερο ένα παράγοντα στους αλγόριθµους κατάταξης που χρησιµοποιούν οι µηχανές αναζήτησης. Βελτιστοποιώντας τον τίτλο µιας σελίδας, αυτό θα έχει άµεση ανταπόκριση στις λίστες κατάταξης των µηχανών αναζήτησης. 2) Κείµενο µιας σελίδας (Visible HTML text). Αν και είναι προφανής παράγοντας πολλοί διαχειριστές σελίδων δεν το εκµεταλλεύονται. Όπως αντιλαµβάνεται κανείς στο κείµενο κρίνεται άκρως απαραίτητο να περιέχονται οι λέξεις - κλειδιά (γύρω στο 5 µε 10 % του συνολικού κειµένου λένε πολλοί ειδικοί). Μηχανές και Υπηρεσίες Αναζήτησης 15

17 Κεφάλαιο 1 3) Εισερχόµενοι σύνδεσµοι (ποιότητα + ποσότητα). Γιατί οι εισερχόµενοι σύνδεσµοι είναι τόσο σηµαντικοί στους αλγόριθµους κατάταξης των Μ.Α; Επειδή µπορούν να ξεχωρίσουν την ποιότητα µιας σελίδας και το πόσο δηµοφιλής αυτή είναι. Οι διαχειριστές των σελίδων έχουν µικρή επιρροή σε αυτούς. Την µεγαλύτερη ισχύ έχουν οι σύνδεσµοι που δεν είναι ανταποδοτικοί ή σύνδεσµοι από αρχική σελίδα. 4) Το κείµενο που περιέχει έναν σύνδεσµο (anchor text) 5) Η «Ηλικία» ενός domain (δικτυακό όνοµα χώρου) που φανερώνει την χρονική διάρκεια που µια σελίδα είναι ενεργή. 6) Φορέας ιδιοκτησία site. ηλαδή το πόσο σηµαντικό θεωρεί το site η Μ.Α. Αυτό µπορεί να είναι κάτι γενικό (π.χ. η Wikipedia θεωρείται πως είναι κοινωφελής και απολαµβάνει υψηλές θέσεις) ή να επηρεάζεται από µια θεµατική ενότητα (π.χ. το Sony.com έχει µεγάλη επιρροή στην κατηγορία των ηλεκτρονικών, αντίθετα όµως σε άλλες κατηγορίες λαµβάνει χαµηλές βαθµολογίες). 7) Μικρότερου µεγέθους παράγοντες όπως τα meta-tags 1, ALT tags 2 εικόνων και άλλα. Περισσότερα για τα µετα-δεδοµένα Τα µετα-δεδοµένα, όπως προείπαµε είναι δεδοµένα που τοποθετούνται στον κώδικα του αρχείου, προγράµµατος ή ιστοσελίδας από τον προγραµµατιστή και παρέχουν πληροφορίες για το αρχείο, πρόγραµµα ή ιστοσελίδα ενώ µπορούν να διαβαστούν από τις µηχανές αναζήτησης. Αυτές οι πληροφορίες µπορεί να είναι τεχνικές, µπορεί να περιέχουν και περιγραφή του αρχείου, προγράµµατος ή ιστοσελίδας ή ακόµη και λέξεις κλειδιά που αφορούν το περιεχόµενο. Αυτό είναι χρήσιµο στην περίπτωση που υπάρχουν λέξεις που έχουν πολλαπλές ερµηνείες. Σε αυτή την περίπτωση, καθοδηγείται η µηχανή αναζήτησης για το πια είναι η σωστή ερµηνεία της λέξης (σηµασιολογική επεξεργασία). Τα δεδοµένα αυτά, µε εξαίρεση 1 Είναι σε γενικές γραµµές, στοιχεία της HTML γλώσσας που χρησιµοποιούνται για να παρέχουν συγκεκριµένες κατηγορίες δεδοµένων (metadata) για µια ιστοσελίδα. Τέτοιες κατηγορίες είναι ο τίτλος (title), η περιγραφή (description), σχετικές λέξεις κλειδιά (keywords) κ.α. Η λειτουργικότητα τους αφορά τις µηχανές αναζήτησης. 2 Το εναλλακτικό κείµενο των εικόνων. Μια µηχανή αναζήτησης διαβάζει τα alt tags ώστε να καταλάβει τι απεικονίζει η εικόνα και αν έχει κάποια λέξη-κλειδί, την θεωρεί σχετική µε το περιεχόµενο και δίνει θετική εικόνα σε µια σελίδα. Μηχανές και Υπηρεσίες Αναζήτησης 16

18 Κεφάλαιο 1 τον τίτλο της ιστοσελίδας, δεν είναι ορατά από τον χρήστη. Μπορούν να τοποθετηθούν στις σελίδες ενός δικτυακού τόπου µε µεγάλη ευκολία ακόµη και από χρήστες οι οποίοι δεν γνωρίζουν τη γλώσσα HTML. Το µόνο που έχει να κάνει κάποιος είναι να ανοίξει τη σελίδα µε έναν επεξεργαστή κειµένου όπως το notepad (υπενθυµίζουµε πως όλες οι ιστοσελίδες αποτελούν στην πραγµατικότητα απλά αρχεία κειµένου) και να τις τοποθετήσει στο κατάλληλο σηµείο (µέσα στην οδηγία <HEAD> και µετά το τέλος της οδηγίας <TITLE>). Κατά την διάρκεια των χρόνων, παρατηρήθηκαν φαινόµενα κακής χρήσης της τεχνολογίας, όπου προγραµµατιστές τοποθετούσαν σαν µετα-δεδοµένα, λέξεις κλειδιά που αφορούσαν δηµοφιλή θέµατα που δεν είχαν σχέση µε το περιεχόµενο της ιστοσελίδας, για να αυξήσουν την επισκεψιµότητά της. Αυτή η κατάχρηση αποτράπηκε αργότερα µε την ανάπτυξη της τεχνολογίας. Αυτή η τεχνολογία, έδινε τη δυνατότητα στις µηχανές αναζήτησης να συσχετίσουν τα µετα-δεδοµένα µε το περιεχόµενο της ιστοσελίδας και να απορρίψουν τα µετα-δεδοµένα που δεν είχαν σχέση µε το κείµενο της. Μια άλλη χρησιµότητα των µετα-δεδοµένων είναι ότι δίνεται η δυνατότητα στον προγραµµατιστή να δηλώσει ότι δεν επιθυµεί να καταχωρηθεί η ιστοσελίδα του σε κανένα ευρετήριο µηχανής αναζήτησης. Αυτό είναι πολύ χρήσιµο σε κάποιες περιπτώσεις, όπως αυτές των διαδικτυακών παιχνιδιών. Εκεί, κατά τη διάρκεια του παιχνιδιού, δηµιουργούνται νέες ιστοσελίδες. Σε αυτή την περίπτωση, αν ένας crawler ακολουθήσει τους συνδέσµους των σελίδων που παράγονται, δηµιουργεί σοβαρό πρόβληµα στο παιχνίδι, αφού το λογισµικό του παιχνιδιού βλέπει τον crawler ως παίχτη. Από την άλλη, δεν έχει νόηµα για µία µηχανή αναζήτησης, να καταχωρίσει τέτοιου είδους ιστοσελίδες στο ευρετήριό της. Μετα-µηχανές Αναζήτησης Οι Μετα-µηχανές Αναζήτησης θα µπορούσε κανείς να πει πως είναι οι µηχανές αναζήτησης των Μηχανών Αναζήτησης καθώς πραγµατοποιούν ερωτήµατα για την ανάκτηση πληροφορίας σε πολλές Μηχανές Αναζήτησης ταυτόχρονα. Επιπλέον, µια Μετα-Μηχανή είναι περισσότερο ισχυρή από µια µέση, απλή Μηχανή Αναζήτησης, αλλά και απαιτεί περισσότερο χρόνο για την εκτέλεση ενός ερωτήµατος καθώς θα Μηχανές και Υπηρεσίες Αναζήτησης 17

19 Κεφάλαιο 1 πρέπει να πραγµατοποιήσει ελέγχους σε πολλές άλλες Μηχανές Αναζήτησης σχετικά µε το ερώτηµα αυτό. Το σηµείο στο οποίο υπερέχουν οι Μετα-Μηχανές Αναζήτησης έναντι των απλών Μηχανών Αναζήτησης είναι ότι συχνά επιστρέφουν απαντήσεις σε σχετικά ασαφείς ερωτήσεις του χρήστη που µια απλή Μηχανή µπορεί να «χάσει». Ο τρόπος λειτουργίας τους είναι ίδιος µε τον τρόπο λειτουργίας των απλών Μηχανών Αναζήτησης. Ο χρήστης πληκτρολογεί στη φόρµα εισαγωγής ερωτήµατος τις λέξεις-κλειδιά ή άλλες λέξεις που περιγράφουν το θέµα για το οποίο επιθυµεί την ανάκτηση πληροφορίας. Με το πάτηµα του πλήκτρου για την έναρξη της αναζήτησης, η Μετα-Μηχανή στέλνει το ερώτηµα του χρήστη ταυτόχρονα σε πολλές, ξεχωριστές, απλές Μηχανές Αναζήτησης και συνεπώς στις βάσεις δεδοµένων των µηχανών αυτών. Οι Μέτα-Μηχανές Αναζήτησης δεν διαθέτουν δικές τους βάσεις δεδοµένων µε ιστοσελίδες, όπως συµβαίνει στις απλές µηχανές. Αυτό που κάνουν είναι να διαβιβάζουν τα ερωτήµατα των χρηστών στις βάσεις δεδοµένων και τα ευρετήρια των εταιριών απλών Μηχανών Αναζήτησης. Μέσα σε λίγα δευτερόλεπτα, η Μετα-Μηχανή επιστρέφει στο χρήστη τα αποτελέσµατα που έχει συλλέξει από όλες τις απλές Μηχανές Αναζήτησης στις οποίες διαβίβασε το ερώτηµα του χρήστη. Παραδείγµατα τέτοιων Μηχανών είναι οι ακόλουθες : Dogpile ( ) : ιαβιβάζει το ερώτηµα του χρήστη σε 25 απλές Μηχανές Αναζήτησης. Μερικές από αυτές είναι: Alta Vista, Excite, Lycos, InfoSeek, WebCraweler, Thunderstone, PlanetSearch και Yahoo. SavvySearch ( ) : Είναι µια από τις παλαιότερες Μηχανές Μετα-Αναζήτησης. Παρέχει στο χρήστη τη δυνατότητα να καθορίσει τον αριθµό των αποτελεσµάτων που επιθυµεί να του επιστραφούν από κάθε µια από τις απλές Μηχανές Αναζήτησης που θα ερωτηθούν. MetaCrawler ( ) : ίνει τη δυνατότητα στο χρήστη να επιλέξει συγκεκριµένη περιοχή (π.χ. Ευρώπη) από την οποία επιθυµεί να προέρχονται τα αποτελέσµατα της αναζήτησης ή ακόµη και συγκεκριµένους δικτυακούς τόπους. Μηχανές και Υπηρεσίες Αναζήτησης 18

20 Κεφάλαιο 1 Η Mετα-µηχανή Jux2 Αποτελεί µια µετα-µηχανή αναζήτησης, η οποία δηµιουργήθηκε µε σκοπό να καλύψει τις διαφορές που παρατηρούνται όσον αφορά τα οργανικά 3 αποτελέσµατα των µεγάλων µηχανών αναζήτησης (έρευνες έχουν δείξει πως είναι κάτω από 3,5). Ένας χρήστης πληκτρολογώντας µία φορά τις λέξεις κλειδιά, διεξάγει έρευνα στις µηχανές αναζήτησης της Google, της Yahoo και της Microsoft συγχρόνως ενώ του προσφέρεται και η δυνατότητα να συγκρίνει τα αποτελέσµατα των τριών παραπάνω µηχανών. Το γεγονός αυτό, του συνδυασµού δηλαδή σε µία ενιαία µηχανή δίνει την ευκαιρία για µια πληρέστερη αναζήτηση στο χρήστη. Εικόνα 2: Ανάλυση στα 500 πρώτα αποτελέσµατα αναζήτησης Θεµατικοί κατάλογοι Ορισµός Μια κατηγορία από σελίδες του δικτύου είναι αφοσιωµένες στο να διατηρούν έναν κατάλογο από δικτυακούς τόπους και σελίδες ταξινοµηµένες και 3 Οργανικά αποτελέσµατα ονοµάζονται τα αποτελέσµατα που εµφανίζονται µετά από µια αναζήτηση χρησιµοποιώντας λέξεις κλειδιά που σχετίζονται µε το περιεχόµενο των ιστοσελίδων αυτών. Το αντίθετο είναι η διαφήµιση στις µηχανές αναζήτησης (pay per click) που θα δούµε παρακάτω. Μηχανές και Υπηρεσίες Αναζήτησης 19

21 Κεφάλαιο 1 κατηγοριοποιηµένες ανάλογα µε συγκεκριµένες θεµατικές περιοχές. Έχουν συνήθως ιεραρχική δοµή και είναι οργανωµένοι σε δοµές που κατατάσσουν τις πληροφορίες κατά θέµα, µε παρόµοιο τρόπο όπως οι παραδοσιακές βιβλιοθήκες οργανώνουν τα βιβλία τους. Περιλαµβάνουν δηλαδή µεγάλες θεµατικές περιοχές που χωρίζονται σε µικρότερες πιο ειδικές υποκατηγορίες. Η καταχώρηση στους καταλόγους αυτούς είναι δωρεάν, µε ελάχιστες εξαιρέσεις. Χαρακτηριστικά Οι Θεµατικοί κατάλογοι εκµεταλλεύονται τις ιδιότητες του υπερκειµένου, δηµιουργώντας ένα µονοπάτι που οδηγεί µέσα από κατηγορίες και υποκατηγορίες, ιεραρχικά δοµηµένες σε µία ιστοσελίδα. Έτσι δίνουν τη δυνατότητα στο χρήστη να εισχωρήσει από µία µεγάλη θεµατική κατηγορία σε µία πιο ειδική υποκατηγορία και τελικά σε µία συγκεκριµένη ιστοσελίδα. Η παραπάνω ιδιότητα των θεµατικών καταλόγων τους καθιστά ιδανικά εργαλεία για την εύρεση πληροφοριών µέσω περιήγησης [6]. Υπάρχουν δύο µέθοδοι δηµιουργίας θεµατικών καταλόγων: Το κλειστό µοντέλο: Αυτού του τύπου οι θεµατικοί κατάλογοι συντηρούνται από µικρές οµάδες ατόµων, τους συντάκτες, οι οποίοι επιλέγουν και σχολιάζουν υπερ-συνδέσεις για κάθε κατηγορία. Ο βαθµός εξειδίκευσης των ατόµων διαφέρει και γενικά προβλέπεται µηχανισµός ποιοτικού ελέγχου που εγγυάται τη συνάφεια του καταλόγου [6]. Παραδείγµατα τέτοιων είναι οι Yahoo και LookSmart. Το ανοικτό µοντέλο: Σε αυτή τη περίπτωση ο κατάλογος συντηρείται από συντάκτες εθελοντές. Αυτού του τύπου οι κατάλογοι τείνουν να αντιµετωπίζουν πολλά προβλήµατα ποιοτικού ελέγχου. Επειδή όµως έχουν ελάχιστο κόστος και τα δεδοµένα διατίθενται δωρεάν σε όποιον θέλει να τους χρησιµοποιήσει, είναι πολύ δηµοφιλείς στους χρηστές του WWW [6]. Παραδείγµατα τέτοιων είναι οι Dmoz και Zeal. Μηχανές και Υπηρεσίες Αναζήτησης 20

22 Κεφάλαιο 1 Αξίζει να σηµειωθεί ότι η πλειοψηφία των θεµατικών καταλόγων περιλαµβάνει κάποιου τύπου αναζήτηση µέσα στις κατηγορίες του, που επιτρέπει στους χρήστες να βρουν απευθείας τα αποτελέσµατα που τους ενδιαφέρει. Αυτή η αναζήτηση είναι συνήθως ένα απλό πλαίσιο διαλόγου. Ο σχετικά περιορισµένος αριθµός υπερσυνδέσεων των θεµατικών καταλόγων που έχουν επιλεγεί από ειδικούς, τους καθιστά ισχυρά εργαλεία για ορισµένου τύπου αναζητήσεις. Όµως οι θεµατικοί κατάλογοι δεν µπορούν να ανταγωνιστούν τις µηχανές αναζήτησης στην κάλυψη του διαδικτύου. Εικόνα 3: Ο Κατάλογος Dmoz σήµερα Τέλος να αναφέρουµε πως υπάρχουν δύο βασικοί τύποι θεµατικών καταλόγων: (α) οι ακαδηµαϊκοί και επαγγελµατικοί θεµατικοί κατάλογοι που έχουν δηµιουργηθεί και συντηρούνται από ειδικούς µε σκοπό να υποστηρίξουν τις ανάγκες ερευνητών και (β) οι εµπορικοί θεµατικοί κατάλογοι που απευθύνονται στο ευρύ κοινό και ανταγωνίζονται για την προσέλκυση περισσοτέρων χρηστών. Μηχανές αναζήτησης VS Θεµατικοί κατάλογοι Σήµερα, δεν υπάρχουν σαφείς διαχωριστικές γραµµές ανάµεσα στους θεµατικούς καταλόγους και στις µηχανές αναζήτησης. Τις περισσότερες φορές, στον ίδιο δικτυακό τόπο µε µία µηχανή αναζήτησης υπάρχει παράλληλα και ένας θεµατικός Μηχανές και Υπηρεσίες Αναζήτησης 21

23 Κεφάλαιο 1 κατάλογος και σε αρκετές περιπτώσεις το περιεχόµενο του θεµατικού καταλόγου ερευνάται ταυτόχρονα µε το περιεχόµενο της βάσης δεδοµένων της µηχανής αναζήτησης. Τα αποτελέσµατα που προέρχονται από ένα θεµατικό κατάλογο, πολλές φορές παρουσιάζονται πριν από τα αποτελέσµατα της µηχανής αναζήτησης, µε σκοπό να προσελκύσουν τους χρήστες στον θεµατικό κατάλογο. Παρόλα αυτά ο τρόπος αυτός µπορεί να φανεί χρήσιµος µερικές φορές, για την πρόσβαση σε ουσιαστικές πληροφορίες σχετικές µε µία έρευνα [6]. Στην ουσία, λοιπόν, οι περισσότερες σύγχρονες υπηρεσίες αναζήτησης στο διαδίκτυο είναι υβριδικές µορφές, µεταξύ µηχανής αναζήτησης και θεµατικού καταλόγου. Παρά τα ασαφή σύνορα όµως µεταξύ των δικτυακών τόπων των µηχανών αναζήτησης και των θεµατικών καταλόγων που οφείλονται κυρίως στη προσπάθεια των δηµιουργών τους να προσελκύσουν όλο και περισσότερους χρήστες, οι διαφορές εξακολουθούν να είναι σηµαντικές [6]. Μηχανές Αναζήτησης vs Θεµατικοί Κατάλογοι Συλλέγουν µόνες τους πληροφορίες από Επιτρέπουν την καταχώρηση το διαδίκτυο ιστοσελίδων από ανθρώπους Τεράστιος αριθµός συνδέσεων µε κανένα Επιλεγµένες συνδέσεις µε βάση την ποιοτικό έλεγχο ποιότητα Τεράστια ευρετήρια Κανένας Σαφώς λιγότερο υλικό Σχετικά µικρό περιορισµός µεγέθους µέγεθος Αναζήτηση µε λέξεις/φράσεις κλειδιά οµηµένη πλοήγηση (όπως τα (σαν ευρετήριο ενός βιβλίου) περιεχόµενα ενός βιβλίου) Βάσεις δεδοµένων οργανωµένες σε Μορφή ενός ιεραρχικού γραφήµατος µε ανεστραµµένη δοµή ευρετηρίου υψηλά και χαµηλότερα επίπεδα Συνήθως καταχωρούν το πλήρες κείµενο Συνήθως παραπέµπουν στην αρχική όλων των σελίδων ενός ιστότοπου σελίδα ενός site και όχι «βαθύτερα» Κατάλληλες για εξαντλητική έρευνα Ακατάλληλοι για εξαντλητική έρευνα Αλλά. Πολλοί θεµατικοί κατάλογοι προσφέρουν φόρµες αναζήτησης και πολλές µηχανές αναζήτησης προσφέρουν προσπέλαση σε πληροφορίες θεµατικού καταλόγου Πίνακας 1 Οι Πύλες (Portals) Οι µηχανές αναζήτησης και οι θεµατικοί κατάλογοι ήταν µέχρι πριν µια δεκαετία το µοναδικό βοήθηµα για την περιήγηση στο διαδίκτυο. Με την τεράστια αύξηση Μηχανές και Υπηρεσίες Αναζήτησης 22

24 Κεφάλαιο 1 όµως του διαδικτύου καθηµερινώς, κρίνεται αναγκαία η χρήση και εναλλακτικών µεθόδων αναζήτησης πληροφοριών, για τον εντοπισµό µε τη µεγαλύτερη δυνατή ακρίβεια στο συντοµότερο χρονικό διάστηµα της συγκεκριµένης πληροφορίας που αναζητεί ο χρήστης. Αυτό το κενό ήρθαν να καλύψουν οι πύλες. Με την πάροδο των χρόνων πολλές από τις µεγάλες µηχανές αναζήτησης µετεξελίχτηκαν σε δικτυακούς τόπους ευρείας θεµατολογίας περιλαµβάνοντας λίστες µε υπερ-συνδέσεις προς δηµοφιλείς δικτυακούς τόπους. Αργότερα για κερδοσκοπικούς λόγους ήρθε ένας ακόµη επανασχεδιασµός των σελίδων, µε έµφαση πλέον στον εµπλουτισµό τους µε πληροφορίες, αντί της πρακτικής παραποµπής των χρηστών σε άλλους δικτυακούς τόπους. Πληροφορίες από πολιτικά και οικονοµικά νέα, µέχρι και τη πρόγνωση του καιρού. Στο ίδιο µοτίβο και οι θεµατικοί κατάλογοι άρχισαν να προσθέτουν στις ιστοσελίδες τους µηχανές αναζήτησης, αλλά και µια σειρά απλών υπηρεσιών. Η µετεξέλιξη αυτή είχε ως αποτέλεσµα, οι περισσότεροι θεµατικοί κατάλογοι, αλλά και οι µηχανές αναζήτησης, να µπορούν να χαρακτηριστούν και σαν πύλες. Ορισµός Πύλη είναι ο ελληνικός όρος που έχει επικρατήσει ως µετάφραση για τον αγγλικό όρο portal, που είναι η µεγάλη ή εντυπωσιακή πόρτα, η είσοδος. Η λέξη portal χρησιµοποιήθηκε για πρώτη φορά στο χώρο της επιστηµονικής φαντασίας, για να περιγράψει την πύλη από την οποία οι ήρωες ενός έργου µπορούσαν να περάσουν άµεσα σε άλλους κόσµους και να βρεθούν σε µια µόνο στιγµή οπουδήποτε επιθυµούσαν. Σήµερα, ο όρος πύλη αφορά στην είσοδο του χρήστη στο κόσµο του διαδικτύου. Μια πύλη προσπαθεί να είναι το σηµείο εισόδου του χρήστη στο διαδίκτυο, δηλαδή η αφετηρία της περιήγησης του. Σαν πρώτη µορφή πληροφοριακής πύλης θα µπορούσαν να χαρακτηριστούν κάποιες εφηµερίδες των πρώτων δεκαετιών του αιώνα, που περιλάµβαναν καταλόγους από οτιδήποτε µπορούσε να χρειαστεί κανείς. Γενικά, πύλη είναι ο δικτυακός τόπος που βοηθά το χρήστη να βρει πληροφορίες για το αντικείµενο του ενδιαφέροντος του, µε τη µορφή υπερσυνδέσεων προς κατάλληλους δικτυακούς τόπους και ιστοσελίδες. Η πύλη παρέχει ευρύ σύνολο πηγών αλλά και υπηρεσίες, όπως θεµατικό κατάλογο, µηχανή αναζήτησης, ηλεκτρονικά καταστήµατα για διαδικτυακές αγορές, forum συζήτησης και chat, ψηφιακά περιοδικά ή εφηµερίδες και πολλά άλλα [6]. Μηχανές και Υπηρεσίες Αναζήτησης 23

25 Κεφάλαιο 1 Χαρακτηριστικά Οι πύλες θα λέγαµε ότι αποτελούν ένα συνδυασµό θεµατικού καταλόγου και µηχανής αναζήτησης. Στην αρχική τους σελίδα ο χρήστης θα βρει υπερ-συνδέσεις σε όλα όσα περιέχονται στη συγκεκριµένη πύλη. Στη συνέχεια, µε µια απλή επιλογή µπορεί να εισχωρήσει σε όποια ενότητα επιθυµεί. Με την πάροδο του χρόνου όλες οι µεγάλες δικτυακές πύλες απέκτησαν την ίδια δοµή και παρέχουν λίγο πολύ τις ίδιες υπηρεσίες, προσαρµοσµένες φυσικά κάθε φορά στις ανάγκες και στις απαιτήσεις των χρηστών, στους οποίους απευθύνονται. Τα βασικά χαρακτηριστικά των πυλών είναι: 1) Οι υπερ-συνδέσεις Οι υπερ-συνδέσεις αποτελούν το βασικό χαρακτηριστικό οποιασδήποτε ιστοσελίδας, το οποίο χρησιµοποιείται σε µεγάλη έκταση στο στήσιµο µίας πύλης. Οι υπερσυνδέσεις βρίσκονται συνήθως σε λέξεις, φράσεις, εικόνες ή τµήµατα εικόνων και παραπέµπουν τον επισκέπτη σε άλλη ιστοσελίδα ή σε οποιαδήποτε άλλη διεύθυνση δικτυακού τύπου. 2) Οι µηχανές αναζήτησης Κάθε δικτυακή πύλη προσφέρει στους επισκέπτες τη χρήση υπηρεσίας αναζήτησης. Κάθε πύλη διαθέτει µία ή και περισσότερες µηχανές αναζήτησης. Οι µηχανές αναζήτησης των πυλών δίνουν συνήθως δύο επιλογές στους χρήστες: πραγµατοποίησης αναζητήσεων στα περιεχόµενα της πύλης ή αναζήτησης σε όλο το διαδίκτυο. Σε πολύ λίγες πύλες δεν περιλαµβάνεται µηχανή αναζήτησης. Η απουσία µηχανής αναζήτησης παρατηρείται κυρίως σε πύλες ειδικού περιεχοµένου [6]. 3) Οι θεµατικοί κατάλογοι Κάθε πύλη εκτός από την µηχανή αναζήτησης διαθέτει απαραίτητα και ένα θεµατικό κατάλογο. 4) Τα banners Το διαδίκτυο αποτελεί ένα ιδιαιτέρως ελκυστικό διαφηµιστικό µέσο. Μέσα διαφήµισης για το WWW είναι τα banners. Είναι χαρακτηριστικό ότι η εισροή διαφηµιστικής δαπάνης στο διαδίκτυο διπλασιάζεται χρόνο µε το χρόνο. Για τις πύλες, τα banners αποτελούν σχεδόν αποκλειστική πηγή εσόδων. Τα banners Μηχανές και Υπηρεσίες Αναζήτησης 24

26 Κεφάλαιο 1 ξεχωρίζουν για τη δυνατότητα τους να αποσπούν την προσοχή του κοινού. Τοποθετούνται σε διάφορα τµήµατα της ιστοσελίδας. Σχεδόν πάντα ένα µεγάλο ορθογώνιο banner υπάρχει στην κορυφή της ιστοσελίδας, δίπλα από το λογότυπο της πύλης ή ακριβώς κάτω από αυτό. Πλεονεκτήµατα Πύλες Αναζήτησης Μειονεκτήµατα Συγκεντρώνουν σηµαντικό τµήµα του Ο χρήστης πρέπει να είναι εξοικειωµένος διαδικτύου µιας συγκεκριµένης χώρας µε την υπηρεσία του WWW Ιδιαίτερα εύχρηστες Σύγχυση από πολλές υπερ-συνδέσεις Καλαίσθητη εµφάνιση Ποιότητα παρεχόµενων πληροφοριών Πίνακας 2 Τα Vortals Πέρα από τις πύλες (portals) όµως, υπάρχουν και τα vortals (vertical industry portals). Πρόκειται για πιο εξειδικευµένες πύλες, που παρέχουν περιεχόµενο ειδικού ενδιαφέροντος και διεκδικούν σηµαντικό µερίδιο της αγοράς. Μοιάζουν αρκετά µε τις πύλες, αλλά αναφέρονται σε συγκεκριµένους τοµείς, π.χ. υγεία, αυτοκίνητα, υπολογιστές, και άλλα [6]. Μηχανή αναζήτησης, θεµατικός κατάλογος και πύλη Οι µέρες στις οποίες ένας χρήστης µπορούσε να διακρίνει µε την πρώτη µατιά µία µηχανή αναζήτησης, από ένα θεµατικό κατάλογο και από µία πύλη έχουν σίγουρα παρέλθει. Οι πύλες φιλοδοξούν να είναι οι πρώτες ιστοσελίδες που θα επισκέπτεται ο χρήστης µόλις µπαίνει στο διαδίκτυο. Με τον καιρό όλο και περισσότερες µηχανές αναζήτησης και θεµατικοί κατάλογοι άρχισαν να ενσωµατώνουν στις ιστοσελίδες τους παρόµοιες υπηρεσίες προκειµένου να προσελκύσουν τους επισκέπτες. Από την άλλη, πολλές από τις νεότερες πύλες έχουν σχεδιάσει τις ιστοσελίδες τους µε βάση τις ιστοσελίδες δηµοφιλών µηχανών αναζήτησης και θεµατικών καταλόγων, ενώ όλες οι πύλες διαθέτουν πλέον έναν µηχανισµό αναζήτησης για τις ιστοσελίδες και τον θεµατικό τους κατάλογο ή προσφέρουν τις υπηρεσίες µίας ή περισσοτέρων µηχανών Μηχανές και Υπηρεσίες Αναζήτησης 25

27 Κεφάλαιο 1 αναζήτησης µέσα από τις ιστοσελίδες τους. Έτσι, αν και η ουσία των µηχανών αναζήτησης και των θεµατικών καταλόγων παραµένει η ίδια, ο σκληρός ανταγωνισµός στο διαδίκτυο απαιτεί όχι µόνο την βελτίωση της λειτουργίας τους, αλλά και τον εµπλουτισµό των ιστοσελίδων τους µε όλο και περισσότερα χαρακτηριστικά και υπηρεσίες που θα προσελκύσουν τους χρήστες του διαδικτύου [6]. Θα ήταν ανόητο να σκεφτεί κάποιος πως δεν υπάρχει καλύτερος τρόπος για να ευρετηριάσουµε το διαδίκτυο και µια νέα δηµιουργική ιδέα ίσως είναι ακριβώς «κάτω από τη µύτη µας». Το γεγονός ότι η Microsoft τα τελευταία χρόνια κάνει µια µεγάλη επένδυση για την ανάπτυξη µιας νέας τεχνολογίας αναζήτησης θα πρέπει να είναι σοβαρός λόγος που θα απασχολήσει τις υπόλοιπες µηχανές αναζήτησης. Είναι απαραίτητο οι µηχανές αναζήτησης να επεκταθούν και στο «deep web» που αναφέρθηκε, ώστε να µπορούν να δώσουν πληροφορίες και από αυτό το κοµµάτι στις αναζητήσεις των χρηστών αλλά και για να γίνει µία καλύτερη εκτίµηση του µεγέθους του διαδικτύου. Οι µηχανές αναζήτησης, εκτός από κείµενο, θα πρέπει να δίνουν και αρχεία εικόνας, ήχου και βίντεο στις αναζητήσεις των χρηστών και να µην τα αντιµετωπίζουν σαν τέσσερις διαφορετικές κατηγορίες αναζήτησης. Είναι αλήθεια ότι οι µηχανές αναζήτησης, µε πρωτοπόρο την Google, δίνουν πλέον ποιοτικά αποτελέσµατα στις αναζητήσεις των χρηστών του διαδικτύου. Όµως, ακόµα και η Google, η πιο δηµοφιλής µηχανή αναζήτησης σήµερα, αντιµετωπίζει τις ιστοσελίδες µε βάση τους συνδέσµους και τις λέξεις κλειδιά και όχι µε βάση τις έννοιες των λέξεων, όπως θα έκανε µία σηµασιολογική µηχανή αναζήτησης. Είναι αναγκαίο να φτιαχτούν µηχανές αναζήτησης που θα µπορούν να κάνουν σηµασιολογική ερµηνεία κειµένου. Θα µπορούν έτσι να αναγνωρίσουν τις έννοιες των λέξεων, τις έννοιες του κειµένου και να εξάγουν συµπεράσµατα. Έτσι θα είναι δυνατόν να εξάγουν µία περίληψη του κειµένου µίας ιστοσελίδας µε νοηµατική απόδοση, να κάνουν καλύτερη κατηγοριοποίηση και ταξινόµηση µε αυτοµατοποιηµένο τρόπο, κάτι που δεν είναι εφικτό σήµερα. Ακόµη, κάνοντας σηµασιολογική ερµηνεία του ερωτήµατος του χρήστη, θα µπορούν να δώσουν ακόµη πιο ποιοτικά αποτελέσµατα. Επίσης, παραµένοντας στο ίδιο µήκος κύµατος θα ήταν ωφέλιµο να είχαν τη δυνατότητα οι µηχανές αναζήτησης να δίνουν στα αποτελέσµατα µίας αναζήτησης, ιστοσελίδες που έχουν γραφτεί για το συγκεκριµένο θέµα σε διάφορες γλώσσες. Έτσι, δεν θα χρειάζεται να µεταφράζει ο ίδιος ο χρήστης το ερώτηµα του σε κάθε γλώσσα. Μηχανές και Υπηρεσίες Αναζήτησης 26

28 Κεφάλαιο 1 Τέλος ένα βήµα παραπάνω θα ήταν και λόγο της ευρείας χρήσης των αρχείων εικόνας, ήχου και βίντεο, να δηµιουργηθούν µηχανές αναζήτησης που θα µπορούν να ερµηνεύσουν σηµασιολογικά τέτοιου είδους αρχεία. Να µπορούν δηλαδή, να εξάγουν συµπεράσµατα. Σήµερα, αν δεν έχει γραφεί σε κείµενο κάτι σχετικό µε ένα τέτοιο αρχείο, δεν είναι δυνατόν µία µηχανή αναζήτησης να συµπεράνει σε τι αφορά αυτό. Μηχανές και Υπηρεσίες Αναζήτησης 27

29 Κεφάλαιο 2 Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης

30 Κεφάλαιο 2 Στο σηµείο αυτό θα επιχειρήσουµε µια αναδροµή όσον αφορά την εξέλιξη των µηχανών αναζήτησης στο πέρασµα των χρόνων και θα αναφέρουµε στοιχεία που σχετίζονται µε την εµφάνιση των πιο γνωστών υπηρεσιών αναζήτησης. Η ιστορία των µοντέρνων µηχανών αναζήτησης έχει τις βάσεις του στο µη εµπορικό ακαδηµαϊκό περιβάλλον και γενικότερα στο τοµέα της επιστηµονικής έρευνας. Από τεχνολογική σκοπιά, οι µηχανές αναζήτησης αναπτύχθηκαν από την ακαδηµαϊκή προσπάθεια για εύρεση πληροφορίας. Η ανάκτηση πληροφορίας αυτή καθαυτή, είναι κάτι υβριδικό µεταξύ της επιστήµης των πληροφοριών και της επιστήµης των υπολογιστών. Όσον αφορά τον τοµέα της επιστήµης της πληροφορίας, η ανάκτηση πληροφορίας εµπεριέχει θεωρίες κατηγοριοποίησης πληροφοριών αλλά και την ανθρώπινη γνωστική διαδικασία στην αναζήτηση πληροφορίας. Όσον αφορά την επιστήµη των υπολογιστών και την τεχνητή νόηση, αναφέρεται στην επιθυµία και την ικανότητα για την αυτοµατοποίηση της δηµιουργίας καταλόγων και της ανάκτηση πληροφοριών από αυτούς. Εξάλλου, οι περισσότερες από τις νεότερες µηχανές αναζήτησης για το Web δηµιουργήθηκαν σε εργαστήρια της επιστήµης των η/υ, πρωτίστως σε ακαδηµαϊκά ιδρύµατα. Μέσα από αυτήν την αναδροµή θα παρατηρήσουµε ότι οι πρώτες µηχανές αναζήτησης είχαν τη µορφή καταλόγου και προυπήρχαν της δηµιουργίας του Web. Archie Ο πρόγονος όλων των µηχανών αναζήτησης µπορεί να θεωρηθεί το Archie. Το Archie δηµιουργήθηκε το 1990 από τον Alan Emtage, φοιτητή στο πανεπιστήµιο McGill του Μόντρεαλ. Ο δηµιουργός αρχικά ήθελε να ονοµάσει την εφαρµογή Archives αλλά τελικά την ονόµασε Archie για να είναι συµβατή µε τα πρότυπα του Unix. Στις αρχές του 1990 δεν υπήρχε το WWW. Παρ όλα αυτά υπήρχαν πολλά αρχεία σε διάφορα σηµεία του διαδικτύου. Η κύρια µέθοδος για την προσπέλαση αρχείων ήταν το FTP 4 (File Transfer Protocol). Μέσα απ αυτή τη διαδικασία λειτουργούσε και ο Archie κατεβάζοντας ονόµατα αρχείων διαµοιραζόµενων µέσω του πρωτοκόλλου FTP από υπηρεσίες καταλόγου του Internet, αποθηκεύοντας τα σε 4 Η διαδικασία είναι η εξής: Όσοι διαχειριστές αποφασίζουν ότι θέλουν να διαθέσουν από τον υπολογιστή τους ορισµένα αρχεία υλοποιούν ένα διακοµιστή FTP. Όταν κάποιος στο διαδίκτυο θέλει να κατεβάσει ένα αρχείο από τον διακοµιστή, συνδέεται µε µία εφαρµογή που καλείται FTP πελάτης. Κάθε εφαρµογή FTP πελάτης µπορεί να συνδεθεί µε ένα FTP διακοµιστή αρκεί και οι δύο να ακολουθούν το σύνολο των προδιαγραφών του πρωτοκόλλου FTP. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 29

31 Κεφάλαιο 2 µία βάση δεδοµένων ονοµάτων αρχείων, που ήταν προσβάσιµη για αναζήτηση. Το πρόβληµα όµως, ήταν ότι πολλά σηµαντικά αρχεία ήταν δύσκολο να βρεθούν από τους χρήστες καθώς ήταν διασκορπισµένα σε µικρούς διακοµιστές FTP. Ο µόνος τρόπος να βρει ένας χρήστης αυτά τα αρχεία ήταν να του υποδείξει κάποιος τη θέση τους. Το Archie άλλαξε αυτή την κατάσταση. Συνδύαζε συλλογή δεδοµένων µε Script (που συνέλλεγε τις λίστες µε τα αρχεία από διακοµιστές FTP) µε ταίριασµα λέξεων για εύρεση ονοµάτων αρχείων µε βάση την επιθυµία του χρήστη. Με λίγα λόγια το Archie κατέγραφε διασκορπισµένους διακοµιστές FTP, δηµιουργούσε ένα ευρετήριο αρχείων υπολογιστών και κατηγοριοποιούσε όλα τα αρχεία που έβρισκε. Οι χρήστες υπέβαλαν ερωτήσεις και έτσι είχαν πρόσβαση στη βάση δεδοµένων του [6]. Εικόνα 4: Η Μ.Α Archie Gopher Το 1991 δηµιουργήθηκε το πρωτόκολλο Gopher. Ο Gopher είχε παρόµοια λειτουργία µε το FTP, αλλά αντί για αρχεία ασχολείται µε έγγραφα. Οι διακοµιστές Gopher περιλάµβαναν έγγραφα απλού κειµένου (χωρίς εικόνες, χωρίς υπερκείµενο) που οι χρήστες µπορούσαν να κατεβάσουν. Τα περισσότερα από τα αρχεία που είχαν καταχωρηθεί στο ευρετήριο του, έγιναν ιστοσελίδες όταν δηµιουργήθηκε το Web, επειδή ακριβώς επρόκειτο για αρχεία κειµένου. Veronica Στο πανεπιστήµιο της Νεβάδα αναπτύχθηκε το 1993 η Veronica. Είχε παρόµοια λειτουργία αναζήτησης µε το Archie αλλά ασχολείτο µε τα αρχεία Gopher, παρέχοντας αναζήτηση µε λέξεις κλειδιά. Μία άλλη µηχανή αναζήτησης σαν Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 30

32 Κεφάλαιο 2 συµπλήρωµα της Gopher εµφανίστηκε λίγο αργότερα, µε όνοµα Jughead. Η λειτουργία της µηχανής ήταν παρόµοια µε αυτή της Veronica [6]. Wanderer Ο Matthew Gray ανέπτυξε το 1993 µία εφαρµογή που έµοιαζε σε µεγάλο βαθµό µε τις σηµερινές µηχανές αναζήτησης. Ήταν το World Wide Web Wanderer, το πρώτο robot software στο διαδίκτυο που είχε σχεδιαστεί για να καταγράφει την αύξηση και το µέγεθος του διαδικτύου. Αρχικά το Wanderer αριθµούσε µόνο τους διακοµιστές WWW αλλά γρήγορα (µετά το 1995) άρχισε να καταγράφει τις διευθύνσεις URL. Η βάση µε τις καταγραµµένες URL δηµιούργησε το Wandex, την πρώτη βάση δεδοµένων του διαδικτύου. Το Wanderer αρχικά οδήγησε σε µείωση της απόδοσης του διαδικτύου. Αυτό οφείλονταν στο γεγονός ότι το Wanderer επισκέπτονταν την ίδια ιστοσελίδα εκατοντάδες φορές την ηµέρα. Σύντοµα όµως το πρόβληµα επιλύθηκε µε τροποποίηση του τρόπου λειτουργίας του [6]. Aliweb Σε απάντηση για το Wanderer o Martijn Koster δηµιούργησε τον Οκτώβριο του 1993 το ALIWEB. Το ALIWEB ήταν ανάλογο µε το Archie και ασχολείτο µε HTTP αλλά δεν περιελάβανε robot έρευνας. Αντί γι αυτό οι διαχειριστές δικτυακών τόπων δηµοσίευαν τις δικές τους πληροφορίες για κάθε ιστοσελίδα που επιθυµούσαν να περιλαµβάνεται στη λίστα. Το πλεονέκτηµα αυτής της µεθόδου είναι ότι οι χρήστες περιγράφουν το δικό τους δικτυακό τόπο και δεν µειώνονταν η απόδοση του δικτύου µε την ύπαρξη robot. Σύµφωνα µε το δηµιουργό της, η ALIWEB ήταν µία µηχανή αναζήτησης που βασιζόταν στην αυτόµατη συλλογή µεταδεδοµένων (meta-data) του Web. Σήµερα το ALIWEB θεωρείται ξεπερασµένο. Το κύριο µειονέκτηµα του είναι ότι πρέπει να υποβληθεί ειδικό αρχείο περιεχοµένων από τους διαχειριστές των δικτυακών τόπων. Οι περισσότεροι διαχειριστές δεν γνωρίζουν πώς να δηµιουργήσουν ένα τέτοιο αρχείο, οπότε δεν υποβάλουν τις ιστοσελίδες τους. Αυτό έχει σαν αποτέλεσµα η βάση δεδοµένων να είναι σχετικά µικρή, οπότε όλο και λιγότεροι χρήστες απευθύνονται στο ALIWEB. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 31

33 Κεφάλαιο 2 Οι πρώτες µηχανές µε Spiders Έως το εκέµβριο του 1993 είχαν εµφανιστεί τρεις µηχανές αναζήτησης που χρησιµοποιούσαν αράχνες: JumpStation, The World Wide Web Worm, Repository Software Engineering (RBSE) spider. Το JumpStation συνέλλεγε πληροφορίες για τον τίτλο και την επικεφαλίδα των ιστοσελίδων και χρησιµοποιούσε ένα πολύ απλό σύστηµα έρευνας και ανάκτησης στη διασύνδεση µε τους χρήστες. Το σύστηµα ερευνούσε τη βάση γραµµικά, ταιριάζοντας λέξεις κλειδιά. Όµως µε την αύξηση του διαδικτύου το JumpStation ανταποκρινόταν όλο και πιο αργά. Το WWW Worm κρατούσε µόνο τους τίτλους και τις διευθύνσεις των ιστοσελίδων. Χρησιµοποιούσε συνηθισµένους τρόπους έρευνας της βάσης. Η σειρά των αποτελεσµάτων του JumpStation και του Worm ήταν τυχαία. Η RBSE αράχνη ήταν η πρώτη που εφάρµοσε διαβάθµιση των αποτελεσµάτων µε βάση τη σχέση τους µε την αναζητούµενη λέξη [6]. Excite Η δηµοφιλής µηχανή αναζήτησης Excite έχει βαθιές ρίζες στην ιστορία του διαδικτύου. Αρχικά το ερευνητικό πρόγραµµα ονοµάζονταν Architext και το ξεκίνησαν 6 φοιτητές του πανεπιστηµίου Stanford το Φεβρουάριο του Η ιδέα ήταν να χρησιµοποιήσουν στατιστική ανάλυση σχέσεων λέξεων για να επιτύχουν αποτελεσµατικότερη έρευνα στις τεράστιες πληροφορίες του διαδικτύου. Η προσπάθεια τους έλαβε πλήρη χρηµατοδότηση στα µέσα του Αρχικά έδωσαν µία έκδοση της µηχανής αναζήτησης για να τη χρησιµοποιήσουν οι διαχειριστές WWW στους δικούς τους δικτυακούς τόπους. Εκείνη την εποχή το λογισµικό ονοµάζονταν Architext αλλά αργότερα µετονοµάστηκε σε Excite for Web Servers. Τον Ιούλιο του 1996 η Excite εξαγόρασε την υπηρεσία αναζήτησης Magellan και τον Νοέµβριο του 1996 την WebCrawler. Σήµερα είναι µέρος της µηχανής αναζήτησης AskJeeves. Οι πρώτοι Θεµατικοί κατάλογοι υστυχώς οι αράχνες δεν διέθεταν την ευφυΐα να αντιλαµβάνονται τι ήταν αυτό που κατέγραφαν. Αυτό είχε σαν αποτέλεσµα ο χρήστης να µη µπορούσε να βρει αυτό που αναζητούσε εκτός αν ήξερε ακριβώς τι ήθελε. Αυτό ώθησε στην δηµιουργία του Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 32

34 Κεφάλαιο 2 ΕΙΝΕΤ Galaxy (Tradewave Galaxy) που µαζί µε την Virtual Library του Tim Berners-Lee αποτελούν τους αρχαιότερους καταλόγους WWW στην ιστορία. Οι υπερσυνδέσεις του Galaxy οργανώνονται σε ιεραρχικές κατηγορίες. Για παράδειγµα ο κατάλογος ανώτερου επιπέδου µπορεί να ονοµάζεται υπολογιστές και µέσα να έχει υποκατηγορίες IBM, Compaq, κ.λ.π. Μέσα σε κάθε υποκατηγορία µπορεί να υπάρχουν και άλλες υποκατηγορίες. Αυτή η µέθοδος οργάνωσης επιτρέπει την πιο αποτελεσµατική έρευνα των περιεχοµένων, περιορίζοντας το πεδίο έρευνας. Ο Galaxy ενεργοποιήθηκε τον Ιανουάριο του Εκτός από αναζητήσεις στο Web, παρείχε τη δυνατότητα αναζήτησης στα πρωτόκολλα Gopher και telnet. Αρχικά το πιο δηµοφιλές χαρακτηριστικό ήταν ο Gopher. Άλλωστε εκείνη την εποχή δεν υπήρχαν και τόσο πολλές ιστοσελίδες. Η δυνατότητα έρευνας για ιστοσελίδες ήταν απλά ένα επιπλέον χαρακτηριστικό. Yahoo Τον Απρίλιο του 1994 δύο υποψήφιοι διδάκτορες του πανεπιστηµίου Stanford, ο David Filo και ο Jerry Yang δηµιούργησαν ορισµένες ιστοσελίδες που σύντοµα έγιναν πολύ δηµοφιλείς. Αρχικά µε το όνοµα Jerry and David s Guide to the World Wide Web ως µια καταγραφή των προσωπικών ενδιαφερόντων τους στο Internet και αργότερα µε την ονοµασία, συλλογή ιστοσελίδων Yahoo!. Ξεκίνησε ως µία µεγάλη συλλογή υπερ-συνδέσεων οργανωµένων σε µία σειρά από θεµατικές κατηγορίες και υποκατηγορίες. Κάθε υπερ-σύνδεση συνοδευόταν από µία σύντοµη περιγραφή και εντασσόταν σε µία ή περισσότερες από τις κατηγορίες του καταλόγου ανάλογα µε το περιεχόµενο της ιστοσελίδας. Καθώς αυξανόταν ο αριθµός των υπερ-συνδέσεων (που περιλάµβαναν οι ιστοσελίδες) και ο αριθµός των επισκέψεων, η οµάδα δηµιούργησε τρόπους καλύτερης οργάνωσης των πληροφοριών. Σε λίγο καιρό ο χρόνος που διέθεταν για τον κατάλογο µε τις αγαπηµένες τους συνδέσεις ήταν πολύ περισσότερος από τον χρόνο που διέθεταν στο µεταπτυχιακό τους. Για να διευκολυνθεί η έρευνα, το Yahoo! (http://www.yahoo.com) έγινε κατάλογος µε δυνατότητα έρευνας. Η έρευνα γινόταν µε µία απλή µηχανή αναζήτησης που ερευνούσε τον κατάλογο. Το καινούργιο που έφερε η Yahoo στις µηχανές αναζήτησης, ήταν ότι για κάθε ιστοσελίδα δινόταν και µία περιγραφή του περιεχοµένου της. Το µειονέκτηµα ήταν ότι όλα αυτά δεν γινόταν αυτόµατα και επειδή οι καταχωρήσεις και η οργάνωση γινόταν από ανθρώπους, το Yahoo! δεν Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 33

35 Κεφάλαιο 2 συγκαταλέγονταν στις µηχανές αναζήτησης. Αργότερα το Yahoo! αυτοµατοποίησε τις διαδικασίες συλλογής και οργάνωσης και µπέρδεψε ακόµη περισσότερο τη διάκριση του Yahoo! σε µηχανή αναζήτησης ή θεµατικό κατάλογο. Να σηµειωθεί πως σήµερα, η Yahoo κατέχει ένα από τα µεγαλύτερα µερίδια της αγοράς των µηχανών αναζήτησης και βρίσκεται στην πρώτη θέση επισκεψιµότητας στον κόσµο, από τότε µέχρι σήµερα. Μαθαίνοντας στον κόσµο τη σηµασία του portal, το Yahoo σήµερα είναι το µεγαλύτερο παγκόσµιο portal µε υπηρεσίες που χρησιµοποιούν πάνω από 345 εκατοµµύρια άνθρωποι από όλο το κόσµο κάθε µήνα. Εικόνα 5: Το Yahoo σήµερα Ο Wanderer κατέγραφε µόνο τις διευθύνσεις και αυτό δυσκόλευε τους χρήστες να βρούνε αυτό που επιθυµούσαν καθώς οι διευθύνσεις είναι αρκετά περίεργες πολλές φορές. Η έρευνα στα Yahoo! και Galaxy ήταν πιο εύκολη καθώς περιλαµβάνονταν επιπλέον πληροφορίες για το περιεχόµενο των ιστοσελίδων. Open Directory Project (Dmoz) Το 1998 ο Rich Skrenta σε συνεργασία µε ένα µικρό γκρουπ φίλων δηµιουργούν το Open Directory Project. Το ODP (γνωστό και ως Dmoz) είναι ένας εκτεταµένος Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 34

36 Κεφάλαιο 2 δηµόσιος κατάλογος που διαχειρίζεται πλέον η εταιρεία Netscape (τον αγόρασε την ίδια χρονιά). Η συντήρηση του πραγµατοποιείται από µια οµάδα εθελοντών συντακτών από όλο τον κόσµο που αξιολογούν ιστότοπους προς συµπερίληψη στον κατάλογο. Οι ιστοσελίδες που επιλέγονται από τους συντάκτες αυτούς οργανώνονται σε έναν αριθµό ευρειών κατηγοριών, στις οποίες υπάγονται πολύ περισσότερες ειδικές υποκατηγορίες. Όπως αντιλαµβάνεται κανείς ο καθένας µπορεί να έχει πρόσβαση στον κατάλογο είτε ως απλός επισκέπτης, είτε ακόµα πιο ουσιαστικά και ως συντάκτης. Χαρακτηριστικό είναι πως το Google χρησιµοποιεί αυτήν την ιεραρχία ως τη βάση για τον κατάλογό του (ξεκινούν τα spiders του). Άλλοι γνωστοί θεµατικοί κατάλογοι υπήρξαν το Librarian s Internet Index που απευθυνόταν κυρίως σε βιβλιοθήκες αλλά και το Business.com, ένας κατάλογος µε επαγγελµατικές κατά κύριο λόγο ιστοσελίδες. LookSmart Ο Θεµατικός κατάλογος LookSmart ιδρύθηκε το Περιλαµβάνει χιλιάδες κατηγορίες και υποκατηγορίες θεµάτων ενώ υπήρξε και ένας από τους ανταγωνιστές του Yahoo. To 2002 µετατράπηκε και υιοθέτησε τη λογική του pay per click κάτι που έφερε µία πτώση όσον αφορά την φήµη και την γενικότερη πορεία του καταλόγου, του επέτρεψε όµως τουλάχιστον τον πρώτο καιρό να έχει κάποια έσοδα πουλώντας τις λίστες του σε µεγάλα portals όπως το MSN. Τον ίδιο χρόνο η εταιρεία εξαγόρασε µία µηχανή αναζήτησης µε το όνοµα WiseNut που δεν κατάφερε όµως να ελκύσει πολύ κοινό. Τέλος, το 1998 η LookSmart προσπάθησε να επεκτείνει το κατάλογο της αγοράζοντας τον µη εµπορικό κατάλογο Zeal, προσπάθεια που τερµατίστηκε το 2006 καθώς η εταιρεία ήλπιζε να αποκοµίσει κέρδη χρησιµοποιώντας το Furl, µία εφαρµογή κοινωνικής σύνδεσης. WebCrawler Καθώς οι αράχνες του διαδικτύου βελτιώνονταν ξεχώρισε η αράχνη του WebCrawler. Οι άλλες αράχνες αποθήκευαν τον τίτλο, τη διεύθυνση και περίπου τις πρώτες 100 λέξεις από ένα έγγραφο. Ο WebCrawler ήταν ο πρώτος που επέτρεψε τον χρήστη να ερευνήσει όλο το κείµενο κάθε ιστοσελίδας που κατέγραφε. Ο WebCrawler ήταν το αποτέλεσµα της εργασίας του Brian Pinkerton φοιτητή στο Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 35

37 Κεφάλαιο 2 τµήµα Πληροφορικής του πανεπιστηµίου της Ουάσιγκτον το Η µεγάλη κίνηση που γνώρισε ο WebCrawler είχε σαν αποτέλεσµα να δηµιουργηθούν προβλήµατα στο δίκτυο του πανεπιστηµίου της Ουάσιγκτον. Πολλές εταιρείες επένδυσαν σε δικτυακό εξοπλισµό για να ελαφρώσουν το φορτίο στους διακοµιστές του WebCrawler, αλλά δεν υπήρχε λύση στο θέµα του εύρους ζώνης. Σε κάποια χρονική στιγµή η υπηρεσία ήταν µη ενεργή κατά τη διάρκεια της ηµέρας. Τελικά η America Online (AOL) εξαγόρασε τον WebCrawler και τον ενσωµάτωσε στο δικό της δικτυακό τόπο. Το 1997 η Excite αγόρασε το WebCrawler και η AOL άρχισε να χρησιµοποιεί το Excite σαν µηχανή αναζήτησης πίσω από την υπηρεσία της NetFind. Το πιο σηµαντικό στοιχείο του WebCrawler είναι ότι ήταν η πρώτη µηχανή αναζήτησης πλήρους κειµένου στο διαδίκτυο. Μέχρι τότε οι χρήστες µπορούσαν να ερευνήσουν µόνο διευθύνσεις ή περιγραφές περιεχοµένου (που προέρχονταν από τις ίδιες τις µηχανές ή από ανθρώπους που προσπαθούσαν να βαθµολογήσουν τους δικτυακούς τόπους) [6]. Lycos Ο Lycos ήταν δηµιούργηµα των εργαστηρίων του πανεπιστηµίου Carnegie Mellon τον Ιούλιο του Αποτελεί επίσης µία από τις παλαιότερες µηχανές αναζήτησης στο διαδίκτυο. Ο υπεύθυνος της προσπάθειας ήταν ο Michael Mauldin που είναι πλέον ο επικεφαλής επιστήµονας της εταιρείας Lycos. Ο Lycos βασίστηκε σε ένα πρόγραµµα της Arpa που περιελάβανε την επεξεργασία και προσπέλαση µεγάλων βάσεων δεδοµένων κειµένου. Τον Ιούλιο του 1994 ο Lycos είχε κατάλογο εγγράφων. Ο Lycos παρείχε αποτελέσµατα βαθµολογηµένα µε βάση τη σχετικότητα αλλά η κύρια δύναµη του ήταν το µέγεθος του καταλόγου του. Συνοπτικά οι καινοτοµίες της Lycos, ήταν η συναφής ανάκτηση (relevance retrieval), το ταίριασµα προθέµατος (prefix matching) και η εγγύτητα των λέξεων (word proximity). Εκτός αυτού, δηµιουργούσε αυτοµατοποιηµένα µία µικρή περίληψη µε τη χρήση στατιστικών µεθόδων, για κάθε κείµενο που καταχωρούσε στο ευρετήριο της. Το Νοέµβριο του 1996, έχοντας δηµιουργήσει ένα ευρετήριο για περισσότερα από 60 εκατοµµύρια έγγραφα, κατέκτησε τον τίτλο της µεγαλύτερης µηχανής αναζήτησης εκείνης της εποχής. Τον Οκτώβριο του 1998 εξαγόρασε την ανταγωνίστριά της HotBot, η οποία όµως συνέχισε να λειτουργεί ξεχωριστά. Τον Απρίλιο του 1999 η Lycos συµπεριέλαβε στην ιστοσελίδα της το θεµατικό κατάλογο του Open Directory Project. Τα επόµενα χρόνια µέχρι και τις µέρες µας, η Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 36

38 Κεφάλαιο 2 συγκεκριµένη µηχανή αναζήτησης παρουσίασε µια σταθερά ανοδική πορεία και προσφέρει µια µεγάλη γκάµα υπηρεσιών. Με βάση τον επίσηµο δικτυακό τόπο, η Lycos δέχεται εκατοµµύρια µοναδικούς επισκέπτες µηνιαίως στις Η.Π.Α. ενώ συγκαταλέγεται στους κορυφαίους 25 διαδικτυακούς προορισµούς παγκοσµίως, φθάνοντας κοντά στα 60 εκατοµµύρια unique visitors σε όλο τον κόσµο. Η Lycos αποτελεί σήµερα θυγατρική εταιρεία της Ασιατικής Daum Communications Corp., της µεγαλύτερης ιντερνετικής πύλης στη Νότια Κορέα. Εικόνα 6: Η µηχανή αναζήτησης Lycos σήµερα Infoseek Ο Infoseek δηµιουργήθηκε τον Ιανουάριο του 1994 αλλά η διαθεσιµότητα του στο κοινό έγινε αρκετά αργότερα τον ίδιο χρόνο. Αρχικά ο Infoseek ήταν µία ακόµη µηχανή αναζήτησης. ανειζόταν στοιχεία από τον Lycos και το Yahoo! χωρίς να πρωτοτυπεί σε κάποιο θέµα. Είχε ένα πολύ φιλικό περιβάλλον διασύνδεσης και παρείχε επιπλέον χαρακτηριστικά. Ο Infoseek έγινε ιδιαίτερα γνωστός µετά την συµφωνία µε την Netscape το εκέµβριο του Η Netscape υιοθέτησε τον Infoseek ως τη βασική υπηρεσία αναζήτησης της εφαρµογής περιήγησης. Προηγουµένως η προεπιλεγµένη υπηρεσία αναζήτησης της Netscape ήταν ο Yahoo!. Ένα δηµοφιλή χαρακτηριστικό του Infoseek ήταν πως επέτρεπε στους webmasters να υποβάλλουν στο ευρετήριο αναζήτησης µία σελίδα σε πραγµατικό χρόνο, κάτι που σύντοµα έγινε αγαπηµένο πεδίο για τους spammers. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 37

39 Κεφάλαιο 2 AltaVista Η AltaVista της εταιρείας Digital Equipment εµφανίστηκε το εκέµβριο του 1995 (αρκετά αργότερα από τις υπόλοιπες µηχανές αναζήτησης). Περιελάβανε όµως αρκετά πρωτοποριακά χαρακτηριστικά που γρήγορα την κατέστησαν µία από τις κορυφαίες µηχανές αναζήτησης. Ένα από αυτά ήταν η ταχύτητα της. Υποστηριζόταν από αρκετούς υπολογιστές DEC Alphas και είχε την δυνατότητα να δέχεται εκατοµµύρια αιτήσεις την ηµέρα, χωρίς να παρουσιάζεται η παραµικρή καθυστέρηση στην απόκριση της. Το 1998 πέρασε στην ιδιοκτησία της Compaq. Τα υπόλοιπα χαρακτηριστικά που ενσωµάτωνε άλλαξαν τον τρόπο επικοινωνίας των µηχανών αναζήτησης µε τους χρήστες. Η Altavista ήταν η πρώτη που χρησιµοποίησε ερωτήσεις σε φυσική γλώσσα, δηλαδή ότι ο χρήστης µπορούσε να πληκτρολογήσει µία πρόταση όπως «What is the weather like in Athens?» και να µην πάρει σαν απάντηση εκατοµµύρια σελίδες που περιέχουν τη λέξη «What». Επιπλέον ήταν η πρώτη που υιοθέτησε προχωρηµένες τεχνικές αναζήτησης όπως η χρήση τελεστών Boolean 5 (AND, OR, NOT, κ.λ.π). Επίσης ο χρήστης µπορεί να ερευνήσει και να προσπελάσει τα άρθρα των newsgroups και να αναζητήσει λέξεις κλειδιά σε ονόµατα αρχείων διαφόρων τύπων (γραφικών, Java applets, αντικειµένων ActiveX). Η µηχανή παρείχε και τη δυνατότητα αναζήτησης ηλεκτρονικής µορφής, φωτογραφιών, µουσικής και βίντεο. Η AltaVista υποστηρίζει ότι είναι η µοναδική µηχανή αναζήτησης που επιτρέπει στους χρήστες να προσθέτουν και να αφαιρούν απευθείας την διεύθυνση της ιστοσελίδας τους από τον κατάλογο της, εικοσιτέσσερις ώρες το εικοσιτετράωρο. Ένα άλλο πολύ ενδιαφέρον χαρακτηριστικό της AltaVista ήταν η δυνατότητα αναζήτησης όλων των δικτυακών τόπων που έχουν σύνδεση σε συγκεκριµένη διεύθυνση. Αυτό ήταν πολύ χρήσιµο για νέους σχεδιαστές που επιθυµούσαν να ελέγξουν την δηµοσιότητα των ιστοσελίδων τους. Μπορούσαν έτσι να ελέγχουν πόσες άλλες ιστοσελίδες παραπέµπουν στις ιστοσελίδες τους. Η AltaVista εισήγαγε ορισµένους νεωτερισµούς στην επικοινωνία µε τον χρήστη. Εµφάνιζε συµβουλές κάτω από το πεδίο εισαγωγής, για να βοηθήσει τους χρήστες να διαµορφώνουν την ερώτηση τους. Αυτές οι συµβουλές άλλαζαν σε τακτικά διαστήµατα έτσι ώστε µε την 5 Η λογική των τελεστών (Boolean logic) είναι µία µέθοδος που επιτρέπει τον συνδυασµό όρων σε µία αναζήτηση χρησιµοποιώντας λογικές πράξεις µε τελεστές, λέξεις όπως and, or, not κτλ. Χρησιµοποιούνται για να αυξήσουν τη σχετικότητα των αποτελεσµάτων της αναζήτησης ως προς το θέµα που ενδιαφέρει. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 38

40 Κεφάλαιο 2 τακτική χρήση της AltaVista ο χρήστης µάθαινε αρκετές ενδιαφέροντες τεχνικές αναζήτησης που πιθανότατα δεν γνώριζε. Η µέθοδος αυτή υιοθετήθηκε στη συνέχεια και από άλλες µηχανές αναζήτησης. Το 1997 η AltaVista δηµιούργησε το LiveTopics, ένα σύστηµα γραφικής αναπαράστασης για να βοηθήσει τους χρήστες να ξεδιαλύνουν τις χιλιάδες αποτελεσµάτων που παράγει η AltaVista σε µία αναζήτηση. Το LiveTopics ήταν ένα ενδιαφέρον εργαλείο αναζήτησης, αλλά πολλές φορές ήταν δυσνόητο [6]. Hotbot Τον Μάιο του 1996 η εταιρεία Inktomi Corporation δηµιούργησε την HotBot, µία µηχανή αναζήτησης που είχε τη µορφή καταλόγου. Η µηχανή αναζήτησης της Inktomi συµπεριλήφθηκε στο δικτυακό τόπο του περιοδικού Wired, που ονοµάζονταν HotWired. Η µεγάλη κίνηση του δικτυακού τόπου βοήθησε ώστε να γίνει γνωστή η HotBot. Η HotBot δεν είναι απλά µία ακόµη µηχανή αναζήτησης. Είναι η πιο δυνατή µηχανή αναζήτησης µε την αράχνη της να µπορεί να καταγράφει 10 εκατοµµύρια ιστοσελίδες την ηµέρα. Η HotBot µπορεί να επανακαταγράφει όλη τη βάση δεδοµένων της πάρα πολύ συχνά. Αυτό έχει σαν αποτέλεσµα όλες οι διευθύνσεις που δίνει η µηχανή να είναι σε λειτουργία, πράγµα που δεν συµβαίνει µε τα αποτελέσµατα άλλων µηχανών αναζήτησης. Η HotBot επίσης χρησιµοποιεί τα cookies (αρχεία που αποθηκεύονται στον υπολογιστή του χρήστη και περιλαµβάνουν στοιχεία για τις επισκέψεις του χρήστη σε συγκεκριµένους δικτυακούς τόπους) για να καταγράφει τις προτιµήσεις έρευνας των χρηστών. Το1999, πρόσθεσε µία νέα τεχνολογία στο λογισµικό της. Οι ιστοσελίδες που καταχωρούνταν σε αυτό τον κατάλογο, αντί να αξιολογούνται και να κατηγοριοποιούνται από ανθρώπους µε εµπειρία στην ανάλυση ιστοσελίδων, αξιολογούνταν και κατηγοριοποιούνταν από την ίδια τη µηχανή αναζήτησης που είχε τη δυνατότητα να µιµηθεί έναν έµπειρο χρήστη. Αυτό ήταν κάτι που η Yahoo δεν το έκανε αυτόµατα και προφανώς γι αυτό αγόρασε την Inktomi το Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 39

41 Κεφάλαιο 2 Οι πρώτες µετα-µηχανές MetaCrawler Ο MetaCrawler δηµιουργήθηκε το 1995 από τον Eric Selburg, µεταπτυχιακό φοιτητή του Πανεπιστηµίου της Ουάσιγκτον (το ίδιο πανεπιστήµιο όπου δηµιουργήθηκε ο WebCrawler). Ο MetaCrawler ήταν η πρώτη µετά-µηχανή αναζήτησης. Εκτελούσε αναζήτηση ταυτόχρονα στις υπηρεσίες αναζήτησης Lycos, Altavista, Yahoo!, Excite WebCrawler και Infoseek. Γρήγορα ξεπέρασε τις δυνατότητες του δικτυακού τόπου του πανεπιστηµίου και χρειάστηκε να µεταφερθεί αλλού. Η µετα-µηχανή δεχόταν τα αποτελέσµατα από τις υπηρεσίες αναζήτησης και τα κατηγοριοποιούσε σε µία περιεκτική ιστοσελίδα. Οι υπηρεσίες αναζήτησης δεν ήταν απόλυτα θετικές απέναντι στην όλη διαδικασία. Η κύρια διαφωνία τους ήταν ότι όταν κάποιος χρήστης χρησιµοποιούσε την υπηρεσία αναζήτησής τους µέσω όµως του MetaCrawler δεν έβλεπε τις διαφηµίσεις τους. Αυτό είχε σαν αποτέλεσµα µείωση των κερδών τους. Όταν η µετα-µηχανή µετακόµισε στην go2net (Φεβρουάριος 1997) το πρόβληµα εξαλείφθηκε καθώς εµφάνιζε πάνω από τα αποτελέσµατα της κάθε µηχανής αναζήτησης και τις διαφηµίσεις της. Αυτό όµως δεν άρεσε και τόσο στους χρήστες που χρειάζονταν περισσότερο χρόνο για να κατεβαίνουν τα αποτελέσµατα µαζί µε τα γραφικά των διαφηµίσεων. Τελικά βρέθηκε µία ενδιάµεση λύση καθώς µε προσεκτικό σχεδιασµό των ιστοσελίδων κατέβαινε αµέσως το κείµενο των αποτελεσµάτων και ακολουθούσαν τα γραφικά των διαφηµίσεων. Ο MetaCrawler ανακτά τα αποτελέσµατα του από τις υπηρεσίες αναζήτησης AltaVista, Infoseek, WebCrawler, Excite, Lycos, Google, GoTo, DirectHit, LookSmart, RealNames, About.com και Thunderstone. Εικόνα 7: Η Metacrawler τα τελευταία χρόνια Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 40

42 Κεφάλαιο 2 Highway61 Ο Highway61 είναι µία από τις παλαιότερες και πιο γνωστές µετα-µηχανές αναζήτησης στο διαδίκτυο. Ξεκίνησε το 1996 και ανακτά τα αποτελέσµατά του από τις υπηρεσίες αναζήτησης Yahoo!, Excite, Lycos, Infoseek και WebCrawler. Google Το 1995 οι Sergey Brin και Larry Page υποψήφιοι διδάκτορες της Επιστήµης των Υπολογιστών στο πανεπιστήµιο Stanford αποφασίζουν να συνεργαστούν για την ανάπτυξη τεχνολογίας αναζήτησης, η οποία και αποτέλεσε τη βάση για τη µηχανή αναζήτησης του Google. Το 1997 οι Brin και Page δηµιούργησαν τη µηχανή αναζήτησης BackRub που ήταν ο πρόγονος του Google. Το 1998 σταµατούν τις σπουδές τους και µε ένα εκατοµµύριο δολάρια ξεκινούν το Google και η µηχανή αρχίζει να εξυπηρετεί το ευρύ κοινό. Η εταιρεία διέθετε τέσσερις υπαλλήλους. Ο Google δεχόταν αιτήσεις για αναζήτηση κάθε µέρα. Το PC Magazine είχε συµπεριλάβει το Google (που ήταν ακόµη σε δοκιµαστική λειτουργία) στις κορυφαίες 100 µηχανές αναζήτησης για το Το 1999 η µηχανή αναζήτησης δεχόταν πλέον 3 εκατοµµύρια αιτήσεις για αναζήτηση κάθε µέρα. Το 2000 οι αιτήσεις έφταναν πλέον τα 60 εκατοµµύρια ενώ το ευρετήριο του περιελάβανε 1,3 δισεκατοµµύρια ιστοσελίδες. Το 2001 οι αιτήσεις ανέρχονταν σε 100 εκατοµµύρια ενώ το ευρετήριο της µηχανής περιελάβανε πλέον ιστοσελίδες σε 40 διαφορετικές γλώσσες, µεταξύ των οποίων και τα ελληνικά. Επίσης την ίδια χρονιά ξεκίνησε η δυνατότητα αναζήτησης γραφικών. Περισσότερες πληροφορίες για την µηχανή αναζήτησης της Google θα αναφερθούν στο τέλος του κεφαλαίου. AskJeeves Τον Απρίλιο του 1997 η AskJeeves εµφανίστηκε ως µία µηχανή αναζήτησης φυσικής γλώσσας. Αποτελεί µία υπηρεσία αναζήτησης που βασίζεται σε ανθρώπινο δυναµικό. Τον πρώτο καιρό η εταιρεία χρησιµοποιούσε την τεχνολογία αναζήτησης DirectHit που αποσκοπούσε στο να βαθµολογεί τα αποτελέσµατα βασιζόµενη στη δηµοτικότητα, µία τεχνολογία που όµως γρήγορα αποδείχτηκε ευάλωτη στο spam. Το 2001 η AskJeeves αγοράζει την µηχανή Teoma που µετρούσε µόλις ένα χρόνο ζωής και χρησιµοποιεί την οµαδοποίηση για την οργάνωση των site σε ειδικές κατηγορίες. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 41

43 Κεφάλαιο 2 Το 2005 η AskJeeves µετονοµάζεται σε Ask ενώ βρίσκεται σήµερα µέσα στις πέντε πιο δηµοφιλείς µηχανές αναζήτησης. Το 1997 µπήκε στην αγορά των µηχανών αναζήτησης και η Northern Light. Η µηχανή αναζήτησης της Microsoft Το 1998 λειτούργησε η µηχανή αναζήτησης της Microsoft, MSN Search. Αρχικά η Microsoft δεν µπήκε πολύ ζεστά όσον αφορά τον ανταγωνισµό στον τοµέα της αναζήτησης στο διαδίκτυο, στη συνέχεια όµως συνεργάστηκε µε εταιρείες όπως οι Overture, Looksmart, και Inktomi προκειµένου να ενισχύσει τις υπηρεσίες αναζήτησης της. Στις 11 Σεπτεµβρίου του 2006 η Microsoft ανακοινώνει την αναβάθµιση της µηχανής της µε όνοµα Live Search. Το καλοκαίρι του 2009 η Microsoft δηµιουργεί την Bing, µία νέα υπηρεσία αναζήτησης που άλλαξε το τοπίο στο χώρο τοποθετώντας inline προτάσεις σε σχετικές αναζητήσεις απευθείας στο χώρο των αποτελεσµάτων. Για παράδειγµα, εάν κάνεις µία αναζήτηση για πιστωτικές κάρτες θα σου προτείνει σχετικές φράσεις όπως: τύποι πιστωτικών καρτών, αίτηση για πιστωτικές κάρτες, συµβουλές για πιστωτικές κάρτες και άλλα. Η Microsoft ανακοίνωσε πως οι πρόσθετες προτάσεις λέξεων κλειδιά βοήθησε στο να µειώσει σηµαντικά τις λίστες των αποτελεσµάτων. Η Bing µέσα από το MSN Portal περιέχει ειδικές κατηγορίες (ταξίδια, αγορές κτλ.) για τις οποίες παρέχει συγκριτικά αποτελέσµατα (τιµών, χαρακτηριστικών κτλ.) που βοηθούν στην έρευνα του χρήστη και πολλές φορές τον οδηγούν να πάρει µια απόφαση, συνήθως για αγορά. AllTheWeb Αποτελεί µια τεχνολογική πλατφόρµα αναζήτησης που εµφανίστηκε το Μάιο του 1999 και αρχικά ανήκε στην εταιρεία Fast Search & Transfer. Η µηχανή ξεκίνησε τη λειτουργία της το 1999 µε την ονοµασία Fast αλλά τον Ιούλιο του 2001 αναδιαµορφώθηκε και άλλαξε σε AlltheWeb. Επιτρέπει στους χρήστες να αναζητήσουν νέα, εικόνες, video και αρχεία µουσικής mp3. ιαθέτει αποτελέσµατα και σε άλλες υπηρεσίες αναζήτησης όπως η Lycos. Η µηχανή καταχωρεί όλο το κείµενο των ιστοσελίδων στη βάση της. Επίσης η µηχανή διαθέτει βάση µε πάνω από 2 δισεκατοµµύρια έγγραφα µε τακτική ανανέωση, αλλά ταυτόχρονα είναι και πολύ Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 42

44 Κεφάλαιο 2 γρήγορη στη απόκριση της, επιστρέφοντας ταχύτατα αποτελέσµατα. ιαθέτει προχωρηµένη αναζήτηση µε πλήρη υποστήριξη τελεστών Boolean. εν υποστηρίζει όµως τελεστή εγγύτητας 6. Από τις αρχές του 2003 παρέχει υποστήριξη σε 49 γλώσσες (συµπεριλαµβανοµένων και των ελληνικών). Παρά το µεγάλο της µέγεθος δεν είναι ευρέως γνωστή στο κοινό. Το Φεβρουάριο του 2003 εξαγοράζεται από την εταιρεία Overture ενώ αργότερα θα καταλήξει στη Yahoo που αποκτά στο δυναµικό της, την Overture. Πολύ συχνά η Yahoo χρησιµοποιεί την συγκεκριµένη ως µια πλατφόρµα δοκιµών. Teoma Μία οµάδα επιστηµόνων πληροφορικής από το πανεπιστήµιο Rutgers ίδρυσε την Teoma τον Απρίλιο του 2000, προσπαθώντας να προσεγγίσει µε διαφορετικό τρόπο το ζήτηµα της αναζήτησης στο διαδίκτυο. Η οµάδα αυτή ανέπτυξε µία µηχανή αναζήτησης που αντιλαµβάνεται το διαδίκτυο σαν κοινότητες ειδικών θεµάτων (τεχνολογία αναζήτησης Subject-Specific Popularity). Η Teoma ξεκίνησε την κανονική της λειτουργία την άνοιξη του Εξαγοράστηκε από την AskJeeves τον Σεπτέµβριο του 2001 και την άνοιξη του 2002 προχώρησε σε αναδιαµόρφωση της λειτουργίας της. Στις αρχές του 2003 η Teoma αναβάθµισε το λογισµικό αναζήτησης προσθέτοντας νέα βελτιωµένα χαρακτηριστικά. Στις 5 του Οκτωβρίου 2004 ο Bill Gross (ιδρυτής της Overture) επαναλειτουργεί την Snap ως µια µηχανή αναζήτησης µε πλήρως διαφανή επιχειρηµατικό µοντέλο. Η Snap διαθέτει πολλά προηγµένα χαρακτηριστικά αλλά εµφανίζεται περισσότερο υπερβολική από ό, τι οι περισσότεροι ερευνητές ψάχνουν. Οι άνθρωποι τείνουν να τους αρέσει η αναζήτηση για την παρατηρούµενη απλότητα που αυτή τους προσφέρει ακόµη κι αν πίσω από την σκηνή απαιτείται µια πολύπλοκη διαδικασία. Τα τελευταία χρόνια η πιο δηµοφιλής µηχανή αναζήτησης είναι το που την προτιµά η συντριπτική πλειοψηφία των χρηστών του ίντερνετ και έχει µεταµορφωθεί µόνο µέσα σε µερικά χρόνια σε εταιρία κολοσσό 6 Σε αρκετές Β χρησιµοποιούνται ειδικοί λογικοί τελεστές που εκφράζουν εγγύτητα (proximity operator), δηλαδή εντοπίζουν όρους σε εγγραφές ή κείµενα που απέχουν µεταξύ τους συγκεκριµένο αριθµό λέξεων (π.χ same, near). Οι µηχανές που υποστηρίζουν τέτοιους τελεστές είναι πολύ λίγες. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 43

45 Κεφάλαιο 2 χάρη στις διαφηµιστικές υπηρεσίες που προσφέρει. Οι πέντε πιο δηµοφιλείς µηχανές αναζήτησης στις µέρες µας είναι οι Google, Yahoo, Live Search της Microsoft (πλέον Bing), AOL και Ask (εξαιρουµένης της Google οι υπόλοιπες συγκεντρώνουν συνολικά γύρω στο 40 % της συνολικής αγοράς στον τοµέα της αναζήτησης στο Web). Από τις 21 Μηχανές Αναζήτησης της παρακάτω εικόνας (εικόνα 8), µόλις έξι παρέµειναν ανεξάρτητες εταιρείες. Απ αυτές, µόλις 4 χρησιµοποιούν αλγοριθµική αναζήτηση αποτελεσµάτων για όλο το Web. Η Yahoo, η Google η MSN (πλέον Bing) και η Ask. Από την άλλη πλευρά όσον αφορά τις υπόλοιπες 2, η Lycos δεν διαχειρίζεται µία δική της µηχανή αλλά δανείζεται την αναζήτηση από την Yahoo, ενώ η LookSmart δεν διαχειρίζεται πλέον κάποιον δικό της κατάλογο, αλλά έχει µετατραπεί σε παροχέα επί πληρωµή αποτελεσµάτων αναζήτησης. Εικόνα 8: Η εξέλιξη των Μ.Α στο χρόνο (από «Web Search-2008») Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 44

46 Κεφάλαιο 2 Η Αναζήτηση στην Ελλάδα Η ανάπτυξη του ελληνικού κυβερνοχώρου, ήταν το έναυσµα για την εµφάνιση των ελληνικών µηχανών αναζήτησης και των θεµατικών καταλόγων. Αξίζει να σηµειωθεί πως, πριν το 2000 καµία διεθνής υπηρεσία αναζήτησης δεν υποστήριζε αναζητήσεις στην ελληνική γλώσσα. Ο Phantis πρωτοξεκίνησε τον Μάιο του 1997 και µαζί µε την Robby είναι από τις παλαιότερες και πιο γνωστές ελληνικές µηχανές αναζήτησης. Τον εκέµβριο του 1997 προστέθηκε στο δικτυακό τόπο του Phantis ο λαβύρινθος, ο πιο εξελιγµένος και πλήρης θεµατικός κατάλογος ελληνικών δικτυακών τόπων της εποχής. Η Trinity είναι µία ακόµη πολύ καλή ελληνική µηχανή αναζήτησης. Είναι η µηχανή αναζήτησης της ελληνικής πύλης Pathfinder. Η Pathfinder ξεκίνησε τον Σεπτέµβριο του 1998 ως µηχανή αναζήτησης και µετατράπηκε σταδιακά σε πύλη. Τον Ιούνιο του 1999 ξεκίνησε την λειτουργία της η Toxo ενώ ένα χρόνο αργότερα ξεκινάει µία ελληνική µεταµηχανή αναζήτησης, η Mixer (άλλες µεταµηχανές υπήρξαν οι hellasfind και oneclick). Αξίζει να αναφέρουµε πως διάφορες άλλες αξιόλογες ελληνικές µηχανές αναζήτησης έχουν δηµιουργήσει κατά καιρούς οι εταιρείες Otenet (anazitisis), Forthnet και Hellas on Line. Σηµαντική ανάπτυξη στον ελλαδικό χώρο είχαν τέλος και οι ελληνικές πύλες 7 (portals) που περιλαµβάνουν τους καλύτερους θεµατικούς καταλόγους και παρέχουν τη δυνατότητα εξερεύνησης του ελληνικού διαδικτύου και όχι µόνο. Η πρώτη ελληνική πύλη που έκανε την εµφάνιση της στην ελληνική αγορά ήταν η πύλη in.gr του ΟΛ ( ηµοσιογραφικός Οργανισµός Λαµπράκη) που κατέχει ακόµα και σήµερα την πρώτη θέση στην σχετική λίστα. Εικόνα 9: Το λογότυπο της Phantis 7 Άλλες πύλες ελληνικού διαδικτύου στις µέρες µας είναι οι: e-go, nooz, zougla online, newsit, eportal, cosmo.gr, GR msn και άλλα. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 45

47 Κεφάλαιο 2 Εικόνα 10: Το in.gr σήµερα Οι µηχανές αναζήτησης σήµερα Μέσα από αυτή την πορεία της ιστορίας έχουν υπάρξει πολλές µικρότερες µηχανές αναζήτησης που ήρθαν και πέρασαν, καθώς η βιοµηχανία της έρευνας παλεύει για να βρει µια ισορροπία µεταξύ της κερδοφορίας και της σχετικότητας. Μερικά από τα νεότερα concept αναζήτησης είναι: η οµαδοποίηση website, οι µικρότερες υλικοτεχνικά ειδικές µηχανές αναζήτησης ή portal ενώ η έρευνα πλέον πραγµατοποιείται από εντελώς διαφορετικές γωνίες σε σύγκριση µε το παρελθόν. Είναι σκόπιµο κλείνοντας αυτή την ιστορική αναδροµή να αναφερθούµε και σε ορισµένους παράγοντες που επηρεάζουν στις µέρες µας τον χώρο της αναζήτησης στο web. Εκτός της τεχνολογίας λοιπόν υπάρχουν άλλοι τέσσερις τοµείς από τους οποίους η αναζήτηση βάλλεται και επηρεάζεται και είναι: α) ιανοµή Λογισµικού / Πλοηγητή Οι εταιρείες αναζήτησης πληρώνουν τους κατασκευαστές υπολογιστών ή τις εταιρείες λογισµικού ένα ποσό εκατοντάδων εκατοµµυρίων ή δισεκατοµµυρίων κάθε χρόνο προκειµένου να προσαρµόσουν τις εργαλειοθήκες αναζήτησης τους στα προϊόντα τους [19]. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 46

48 Κεφάλαιο 2 β) Αναζήτηση κοινωνικής δικτύωσης Μεγάλα κοινωνικά δίκτυα έχουν φτάσει σε ένα πολύ σηµαντικό αριθµό προβολών των σελίδων τους. Φηµολογούνταν πως η Yahoo θα έµπαινε στο χώρο αγοράζοντας την δηµοφιλή εφαρµογή Facebook µε σχεδόν ένα δισεκατοµµύριο δολάρια. Η Yahoo έχει ήδη αγοράσει παρόµοιους δικτυακούς τόπους όπως το Flickr και το Del.icio.us. Τον Αύγουστο του 2006 η Google υπέγραψε 3χρονη συνεργασία για υπηρεσίες αναζήτησης και διαφήµιση µε το MySpace. Επίσης ορισµένες εταιρείες όπως είναι η Eurekster, προσπαθούν να δηµιουργήσουν προϊόντα που θα επιτρέπουν σε γκρουπ διαχειριστών να δηµιουργήσουν συγκεκριµένες υπηρεσίες αναζήτησης για ένα θέµα η µία κοινότητα [19]. γ) Παροχείς περιεχοµένου Ορισµένοι παροχείς περιεχοµένου προσπαθούν να δηµοσιεύσουν περιεχόµενο στα δικά τους domains διαφηµίζοντας το όνοµα τους. Ορισµένοι αρνούνται να συµπεριληφθούν σε ευρετήρια αναζήτησης. Ορισµένοι απαιτούν µία αµοιβή για να καταχωρηθούν. Άλλες ζητούν περαιτέρω έκθεση του ονόµατος τους η καθυστερούν για να κερδίζουν επιπλέον ισχύ διαπραγµάτευσης [19]. δ) Εργαλεία συγκέντρωσης περιεχοµένου Η Αναζήτηση είναι µόνο ένας τρόπος για την εύρεση πληροφοριών. Μέσω RSS feeds και διάφορες άλλες τεχνολογίες πολλά site προσφέρουν ότι πολλοί άνθρωποι θα εύρισκαν µετά από µία επίµονη και πολύωρη αναζήτηση ή ακόµα προσφέρουν έναν τρόπο πρόσβασης σε οποιαδήποτε πληροφορία σχετικά µε ένα συγκεκριµένο θέµα όταν αυτές γίνουν διαθέσιµες. Η Google επίσης αγόρασε απόθεµα του YouTube για ένα αρκετά σηµαντικό ποσό. Το YouTube περιέχει σε µεγάλο βαθµό πειρατικό περιεχόµενο, στο οποίο η Google µπορεί να οργανώσει και να δηµοσιεύσει διαφηµιστικό περιεχόµενο, βασιζόµενο σε δεδοµένα χρήσης και άλλες µορφές διαφηµίσεις στόχευσης [19]. Ιστορική εξέλιξη Υπηρεσιών Αναζήτησης 47

49 Κεφάλαιο 3 Η Μηχανή Αναζήτησης της Google

50 Κεφάλαιο 3 Όπως αναφέρεται και στον επίσηµο δικτυακό της τόπο, αποστολή της Google είναι να οργανώνει τις πληροφορίες του κόσµου και να τις καθιστά προσβάσιµες και χρήσιµες. Πρώτο βήµα εκπλήρωσης αυτής της αποστολής ήταν η ανάπτυξη µιας νέας προσέγγισης στην ηλεκτρονική αναζήτηση από τους ιδρυτές της Google, τον Larry Page και τον Sergey Brin. Η ιδέα γεννήθηκε σε ένα δωµάτιο της φοιτητικής εστίας του Πανεπιστηµίου του Στάνφορντ και γρήγορα εξαπλώθηκε σε όσους χρήστες αναζητούσαν πληροφορίες παγκοσµίως. Η Google αναγνωρίζεται πλέον ως η µεγαλύτερη µηχανή αναζήτησης στον κόσµο µια εύχρηστη και δωρεάν υπηρεσία που συνήθως εµφανίζει συναφή αποτελέσµατα σε κλάσµατα του δευτερολέπτου. Αξίζει να σηµειωθεί πως µε βάση στοιχεία έρευνας του comscore, τον εκέµβριο του 2007 η Google καταλάµβανε το 58,4 % της συνολικής κίνησης στην αγορά όσον αφορά τον χώρο της αναζήτησης. Όπως είδαµε και προηγουµένως, µέχρι τη δηµιουργία της Google υπήρχαν δύο κατηγορίες µηχανών αναζήτησης. Στη πρώτη κατηγορία ανήκουν αυτές που είχαν τη µορφή ευρετηρίου και συντηρούνταν από ανθρώπους, οι οποίοι κατέτασσαν (manually=χειροκίνητα) τις ιστοσελίδες θεµατολογικά. Kαταχωρούσαν στο ευρετήριό τους, ιστοσελίδες πάνω σε δηµοφιλή θεµατολογία, µην καλύπτοντας έτσι µεγάλο µέρος του Web. Από την άλλη, το κόστος δηµιουργίας και συντήρησης τους ήταν αρκετά µεγάλο και η εξέλιξη τους αρκετά αργή. Στη δεύτερη κατηγορία ανήκουν οι αυτοµατοποιηµένες µηχανές αναζήτησης. Αυτές, δηµιουργούσαν και συντηρούσαν αυτόµατα ευρετήρια ιστοσελίδων, µόνο µε βάση λέξεις κλειδιά του κειµένου των ιστοσελίδων ή µετα-δεδοµένων. Αυτή η µέθοδος έδινε συνήθως χαµηλής ποιότητας αποτελέσµατα στις αναζητήσεις των χρηστών. Εκτός αυτού, ήταν πολύ εύκολο για διαφηµιστές, να παραπλανήσουν µία τέτοια µηχανή αναζήτησης, κάνοντας την να φέρει µία ιστοσελίδα στα πρώτα αποτελέσµατα. Όπως αντιλαµβάνεται κανείς, οι Μηχανές αναζήτησης που προυπήρχαν της Google, ήταν εύκολο να παραπλανηθούν και να δίνουν στα πρώτα αποτελέσµατα, ιστοσελίδες που είχαν µικρή ή καµία σχέση µε το ερώτηµα του χρήστη. H Google, είναι η πρώτη µηχανή αναζήτησης, που κατάφερε να ξεπεράσει τέτοιου είδους προβλήµατα. Είναι η πρώτη που κάνει µεγάλη χρήση του υπερκειµένου (hypertext) των ιστοσελίδων και κατατάσσει τις ιστοσελίδες του διαδικτύου µε βάση τους εισερχόµενους συνδέσµους που έχουν από τις ιστοσελίδες. Με αυτό τον τρόπο, αξιολογεί την ιστοσελίδα όχι µόνο µε βάση τις λέξεις κλειδιά που αυτή έχει, αλλά και µε βάση το πόσο γνωστή είναι στο διαδίκτυο. Με λίγα λόγια, Η µηχανή Αναζήτησης της Google 49

51 Κεφάλαιο 3 λαµβάνει υπόψη πόσο γνωστή είναι µια ιστοσελίδα στο διαδίκτυο αλλά και πόσο γνωστές είναι οι ιστοσελίδες που τη γνωρίζουν. Με τον τρόπο αυτό κατάφερε να αξιολογεί την εγκυρότητα των ιστοσελίδων του διαδικτύου και να δίνει πολύ αξιόπιστα αποτελέσµατα στις αναζητήσεις των χρηστών. Ταυτόχρονα, επειδή λειτουργεί εντελώς αυτοµατοποιηµένα, έχει πολύ χαµηλό κόστος συντήρησης ευρετηρίου. Εικόνα 11: Το λογότυπο της Google Η Ονοµασία Το όνοµα της Google προέρχεται από την αγγλική λέξη googol. Το "Googol" αποτελεί µαθηµατικό όρο και δηλώνει το 1 ακολουθούµενο από 100 µηδενικά (ο αριθµός bits του σύµπαντος, κατ εκτίµηση). Ο όρος αποτελεί νεολογισµό του Milton Sirrota, ανιψιό του Αµερικανού µαθηµατικού Edward Kasner, και έγινε γνωστός στο βιβλίο "Mathematics and the Imagination" των Kasner και James Newman. Η χρήση του όρου από τη Google αντιπροσωπεύει την αποστολή της εταιρείας να οργανώνει τις φαινοµενικά άπειρες πληροφορίες που βρίσκονται στον Παγκόσµιο Ιστό [11]. Ο Σχεδιασµός Κατά το σχεδιασµό της Google, οι Sergey Brin και Lawrence Page, έλαβαν υπόψη το µεγάλο ρυθµό ανάπτυξης που επρόκειτο να έχει το διαδίκτυο τα επόµενα χρόνια όπως και τις τεχνολογικές αλλαγές που ανέµεναν να γίνουν. Ήταν αναγκαία η τεχνολογία γρήγορου crawling, ώστε να είναι αποδοτική η συλλογή των ιστοσελίδων Η µηχανή Αναζήτησης της Google 50

52 Κεφάλαιο 3 του διαδικτύου όπως και η επικαιροποίησή τους. Σχεδίασαν το Google µε τέτοιο τρόπο ώστε να µπορεί να διαχειριστεί τεράστιο όγκο δεδοµένων. όθηκε βαρύτητα στην αποδοτική διαχείριση του αποθηκευτικού χώρου τόσο κατά την αποθήκευση του ευρετηρίου, όσο και κατά την αποθήκευση των ιστοσελίδων. Τέλος, προέβλεψαν ότι η ταχύτητα διαχείρισης των αναζητήσεων των χρηστών, έπρεπε να ανέρχεται από µερικές εκατοντάδες έως µερικές χιλιάδες ανά δευτερόλεπτο. Η Google εστιάζει τις προσπάθειές της στην ανάπτυξη της "τέλειας µηχανής αναζήτησης", που όπως την ορίζει ο Larry Page, συνιδρυτής της Google, "πρέπει να καταλαβαίνει επακριβώς τι εννοείτε και πρέπει να σας δίνει επακριβώς αυτό που θέλετε". Το σηµαντικότερο θέµα που είχαν να επιλύσουν οι δηµιουργοί οι δηµιουργοί της, ήταν αυτό της ποιότητας των αποτελεσµάτων που φέρνει µια µηχανή αναζήτησης, στις αναζητήσεις των χρηστών του Web. Για το σκοπό αυτό, η Google κυνήγησε µε σθένος την καινοτοµία και αρνήθηκε να δεχθεί τους περιορισµούς των υπαρχόντων µοντέλων. Αξίζει να σηµειωθεί πως το 1997, µόνο µια από τις τέσσερις καλύτερες εµπορικές µηχανές αναζήτησης µπορούσε να βρει τον εαυτό της (να φέρει την αρχική ιστοσελίδα της, στα πρώτα δέκα αποτελέσµατα, σε µία αναζήτηση του ονόµατός της). Ως αποτέλεσµα, η Google ανάπτυξε τη δική της υποδοµή εξυπηρέτησης και την πρωτοποριακή τεχνολογία PageRank, έναν αλγόριθµο σπουδαιότητας ιστοσελίδων που άλλαξε τον τρόπο διεξαγωγής των αναζητήσεων [11]. Από την αρχή, οι προγραµµατιστές της Google αναγνώρισαν ότι για πιο γρήγορα αποτελέσµατα µε µεγαλύτερη ακρίβεια ήταν απαραίτητη η εξεύρεση µιας νέας διάταξης διακοµιστών. Αν και οι περισσότερες µηχανές αναζήτησης λειτουργούν µε µερικούς µεγάλους διακοµιστές που συχνά είναι βραδύτεροι όταν ο φόρτος αυξάνεται, η Google χρησιµοποίησε συνδεδεµένους υπολογιστές για γρήγορη εύρεση απαντήσεων σε ερωτήµατα. Αυτή η καινοτοµία είχε αποτελέσµατα καθώς εξασφάλισε πιο γρήγορους χρόνους απόκρισης, µεγαλύτερη δυνατότητα κλιµάκωσης και χαµηλότερο κόστος. Πρόκειται για µια ιδέα που βρήκε µιµητές, ενώ η Google συνεχίζει να βελτιώνει την τεχνολογία back-end για ακόµα καλύτερες επιδόσεις [11]. Η µηχανή Αναζήτησης της Google 51

53 Κεφάλαιο 3 Η Τεχνολογία της Google Το λογισµικό στο οποίο βασίζεται η τεχνολογία αναζήτησης της Google διενεργεί µια σειρά ταυτόχρονων υπολογισµών για τους οποίους απαιτείται µόνο ένα κλάσµα του δευτερολέπτου. Οι παραδοσιακές µηχανές αναζήτησης εξαρτώνται σε µεγάλο βαθµό από τη συχνότητα εµφάνισης της λέξης στην ιστοσελίδα. Η Google χρησιµοποιεί το PageRank για να εξετάσει ολόκληρη τη δοµή συνδέσεων του Παγκόσµιου Ιστού και καθορίζει ποιες σελίδες είναι οι πιο σηµαντικές. Στη συνέχεια, διενεργεί µια ανάλυση αντιστοίχησης υπερ-κειµένου, για να καθορίσει ποιες σελίδες είναι συναφείς µε τη συγκεκριµένη αναζήτηση. Συνδυάζοντας τη συνολική σπουδαιότητα και τη συνάφεια για το συγκεκριµένο ερώτηµα, η Google µπορεί να κατατάξει στις πρώτες θέσεις τα πιο συναφή και αξιόπιστα αποτελέσµατα [11]. Τεχνολογία PageRank: Η τεχνολογία PageRank πραγµατοποιεί αντικειµενική µέτρηση της σπουδαιότητας ιστοσελίδων, λύνοντας µια εξίσωση µε περισσότερες από 500 εκατοµµύρια µεταβλητές και 2 εκατοµµύρια όρους. Αντί να µετράει τις άµεσες συνδέσεις, το PageRank ερµηνεύει µια σύνδεση από τη Σελίδα A στη Σελίδα B ως ψήφο για τη Σελίδα B από τη Σελίδα A. Το PageRank αξιολογεί τη σπουδαιότητα µιας σελίδας ανάλογα µε τον αριθµό ψήφων που λαµβάνει ενώ η µηχανή λαµβάνει υπόψη και τις λέξεις που περιέχονται στο anchor text. Η κλίµακα του PR δεν είναι γραµµική (είναι λογαριθµική) ενώ η βαθµολογία κυµαίνεται από 0 έως 10 που είναι και η µέγιστη. Το PageRank λαµβάνει επίσης υπόψη τη σπουδαιότητα κάθε σελίδας που ψηφίζει, καθώς οι ψήφοι από ορισµένες σελίδες θεωρούνται ότι έχουν περισσότερη αξία, και έτσι προσδίδουν µεγαλύτερη αξία στη συνδεδεµένη σελίδα. Οι σηµαντικές σελίδες λαµβάνουν υψηλότερη βαθµολογία PageRank και εµφανίζονται στην κορυφή των αποτελεσµάτων αναζήτησης. Η τεχνολογία της Google χρησιµοποιεί τη συλλογική γνώση του Παγκόσµιου Ιστού για να καθορίσει τη σπουδαιότητα της ιστοσελίδας. εν υπάρχει πουθενά ανάµειξη του ανθρώπινου παράγοντα ή έλεγχος των αποτελεσµάτων, και για αυτό το λόγο οι χρήστες εµπιστεύονται το Google ως πηγή αντικειµενικών πληροφοριών που δεν διαµορφώνουν επί πληρωµή [11]. Συνολικά η συγκεκριµένη τεχνολογία θα λέγαµε πως βασίζεται στην ποσότητα αλλά και ποιότητα των εισερχοµένων και εξερχόµενων συνδέσµων. Η µηχανή Αναζήτησης της Google 52

54 Κεφάλαιο 3 Από την εµφάνιση της πρώτης µορφής του αλγόριθµου τα δεδοµένα του Internet άλλαξαν. Ανάλογη όµως υπήρξε και η προσαρµογή του αλγόριθµου, µε αποτέλεσµα να έχει ακόµα και σήµερα την ίδια επιτυχία µε το παρελθόν. Οι καινούργιες τεχνικές αποτελούν ένα εµπορικό µυστικό. O αλγόριθµος µοιάζει να προσαρµόζεται απόλυτα πάνω σε καινούργια δεδοµένα που προκύπτουν στο Internet και είναι διαρκώς ενηµερωµένος για καινούργιες παραµέτρους που προκύπτουν από την εξέλιξη του διαδικτύου. Φυσικά µεγάλο ρόλο στη διαρκή ανανέωση των στοιχείων που συγκροτούν τη µηχανή αναζήτησης παίζει και η µηνιαία ανανέωση του ευρετηρίου του Google (Index), που είναι ευρύτερα γνωστό σαν Google-Dance [51]. Ανάλυση αντιστοίχησης υπερ-κειµένου: Η µηχανή αναζήτησης της Google αναλύει επίσης το περιεχόµενο των σελίδων. Ωστόσο, αντί να ανιχνεύει απλά για κείµενο στη σελίδα (το οποίο µπορεί να ελέγχεται από τους εκδότες µέσω meta-tag), η τεχνολογία της Google αναλύει ολόκληρο το περιεχόµενο της σελίδας καθώς και παράγοντες στις γραµµατοσειρές(π.χ. πιο έντονες), τις υποδιαιρέσεις και την ακριβή θέση κάθε λέξης(π.χ. πιο σηµαντικές αν βρίσκονται σε επικεφαλίδες κειµένου) σπουδαιότητα των λέξεων. Η Google αναλύει επίσης το περιεχόµενο γειτονικών ιστοσελίδων για να διασφαλίσει ότι τα εµφανιζόµενα αποτελέσµατα είναι τα πιο συναφή για το ερώτηµα του χρήστη [11]. Ο Αλγόριθµος σπουδαιότητας ιστοσελίδων της Google χρησιµοποιείται από πολλούς για να εκτιµηθεί η αξιοπιστία µιας ιστοσελίδας και γενικότερα για το πόσο γνωστή είναι αυτή στο διαδίκτυο (σπουδαιότητα από ρ. σπεύδω = πλησιάζω, συνδέοµαι µε). Σε τακτά χρονικά διαστήµατα, περίπου µία φορά το µήνα, πραγµατοποιείται από τη Google crawling στο διαδίκτυο. Εντοπίζονται έτσι ιστοσελίδες που έχουν προστεθεί στο διαδίκτυο και αλλαγές (προσθήκες, αφαιρέσεις) στους συνδέσµους των ήδη καταγεγραµµένων ιστοσελίδων. Με το πέρας του crawling, υπολογίζεται εκ νέου η σπουδαιότητα (Page Rank) των ιστοσελίδων. Την πρώτη φορά που δοκιµάστηκε η Google, έκανε χαρτογράφηση 518 εκατοµµυρίων συνδέσµων. Οι δηµιουργοί της ισχυρίζονταν ότι η σπουδαιότητα 26 εκατοµµυρίων ιστοσελίδων, µπορούσε να υπολογιστεί σε λίγες ώρες µε τη χρήση ενός κοινού υπολογιστή της εποχής. Υπολογίστηκε ότι ο ρυθµός µε τον οποίο κατέβαζε ο crawler ιστοσελίδες στους αποθηκευτικούς χώρους της Google, ανέρχονταν σε 48.5 σελίδες ανά λεπτό. Η καταχώριση αυτών των ιστοσελίδων στο ευρετήριο της, γινόταν µε Η µηχανή Αναζήτησης της Google 53

55 Κεφάλαιο 3 ρυθµό 54 σελίδες ανά λεπτό. Παράλληλα µε την καταχώριση στο ευρετήριο, γινόταν και η ταξινόµηση του ευρετηρίου που διήρκησε 24 ώρες. Ο χώρος που καταλάµβαναν αυτές οι ιστοσελίδες, δεν ξεπερνούσε τα 160GB. Η σπουδαιότητα µιας ιστοσελίδας δεν αντικατοπτρίζει απαραίτητα τη συνάφεια της ιστοσελίδας µε το ερώτηµα αναζήτησης του χρήστη. Είναι δυνατόν πολλές φορές, σχετικές ως προς το περιεχόµενο ιστοσελίδες να παραλείπονται από τον µηχανισµό της εταιρείας επειδή δεν είναι δηµοφιλείς. Σε αυτό το σηµείο αρκετοί εστιάζουν και το χαρακτηρίζουν ως τη µεγαλύτερη αδυναµία της Google. Από την άλλη βέβαια, αυτή η ανεξαρτησία µεταξύ ερωτήµατος και PageRank ενίσχυσε την µηχανή στην ταχύτητα και ευκολία όσον αφορά την αναζήτηση του ιστού και φυσικά της έδωσε όπως είδαµε ανθεκτικότητα απέναντι στο spamming. Μια προσπάθεια ενός ατόµου ξεχωριστά για αύξηση των εισερχοµένων συνδέσµων σε µία σελίδα µε σκοπό την αύξηση του PR είναι µάλλον ανούσια µιλώντας συνολικά για την θέση του ως προς για τον παγκόσµιο ιστό. Η διάρκεια ζωής ενός ερωτήµατος Google είναι συνήθως λιγότερο από µισό δευτερόλεπτο, αλλά περιλαµβάνει διάφορα βήµατα που πρέπει να ολοκληρωθούν πριν την εµφάνιση των αποτελεσµάτων στο άτοµο που αναζητά τις πληροφορίες [11]. Εικόνα 12: Η πορεία ενός ερωτήµατος στο Google (Πηγή: Google.com) Η µηχανή Αναζήτησης της Google 54

56 Κεφάλαιο 3 Η καινοτοµία της Google δεν σταµατάει στην επιφάνεια εργασίας. Για να εµφανίζονται γρήγορα και µε ακρίβεια τα αποτελέσµατα αναζήτησης στους χρήστες που επισκέπτονται τον Παγκόσµιο Ιστό µε φορητές συσκευές, η Google υπήρξε πρωτοπόρος στην ασύρµατη τεχνολογία αναζήτησης για γρήγορη µετατροπή της HTML σε µορφές που είναι κατάλληλες για τα WAP, i-mode, J-SKY και EZWeb. Η Google παρέχει την ασύρµατη τεχνολογία της σε διάφορες κορυφαίες εταιρείες, όπως τις AT & T Wireless, Sprint PCS, Nextel, Palm, Handspring και Vodafone [11]. Το Google σε αριθµούς: 1) Οι αναζητήσεις που απαντώνται καθηµερινά: περισσότερες από 200 εκατοµµύρια. 2) Σελίδες που αναζητούνται στον ιστό (Indexer): περισσότερες από 3 δισεκατοµµύρια. Θεωρείται η µεγαλύτερη βάση δεικτοδοτηµένων ιστοσελίδων από όλες τις µηχανές αναζήτησης. 3) Τύποι αρχείων που αναζητούνται: πολλοί περιλαµβανοµένων των Hyper Text Markup Language (html), Adobe Portable Document format (pdf), Microsoft Excel (xls), Microsoft Word (doc), κ.α. 4) Εικόνες (Images): περισσότερες από 425 εκατοµµύρια. 5) Μηνύµατα µέσω δικτύου: περισσότερα από 800 εκατοµµύρια. Όσον αφορά τους χρήστες: Το θεωρείται ένας από τα τους πιο δηµοφιλέστερους δικτυακούς τόπους στο διαδίκτυο και χρησιµοποιείται παγκοσµίως από εκατοµµύρια ανθρώπους [51]. 6) Χρήστες ανά µήνα: 73,5 εκατοµµύρια. 7) ιαθέσιµες γλώσσες-πηγές: 88. 8) ιαθέσιµες γλώσσες για παροχή αποτελεσµάτων: 35. Η µηχανή Αναζήτησης της Google 55

57 Κεφάλαιο 3 Υπηρεσίες Google Σήµερα το Google προσφέρει µια πληθώρα υπηρεσιών για το διαδίκτυο οι οποίες δεν είναι µόνο οι καλύτερες από τις ήδη υπάρχουσες αλλά είναι συνήθως τόσο πρωτοποριακές και µοναδικές ώστε το Google αυτήν την στιγµή να καθορίζει σε µεγάλο ποσοστό τον τρόπο που εκµεταλλευόµαστε τις δυνατότητες του διαδικτύου. Η εταιρεία προσφέρει υπηρεσίες όπως , χάρτες, εργαλεία feedreader, ηµερολόγιο, το google scholar για αναζήτηση ακαδηµαϊκής βιβλιογραφίας, εργαλείο µετάφρασης, το google docs, το google earth και µια πλειάδα ακόµα υπηρεσιών. ηµοφιλής είναι και η γραµµή εργαλείων της εταιρείας (Google toolbar) που παρέχει στους χρήστες µια σειρά εργαλείων που βελτιώνουν την πλοήγηση. Το Google Toolbar σχεδιάστηκε για να κάνει ευκολότερη τη χρήση του διαδικτύου και να βοηθήσει τον κόσµο να βρίσκει τις πληροφορίες που ψάχνει, όσο το δυνατόν γρηγορότερα (είναι συµβατό µε τους δηµοφιλέστερους περιηγητές). Επίσης προσφέρει διάφορες υπηρεσίες και εργαλεία για κατόχους ιστότοπου µε σηµαντικότερες: Google Analytics Ένα δωρεάν εργαλείο που παρέχει αναλυτικά στατιστικά στοιχεία, µία ολοκληρωµένη από όλες τις πλευρές εικόνα για την επισκεψιµότητα και δραστηριότητα µιας ιστοσελίδας. Πιο συγκεκριµένα, το Analytics είναι ένα προϊόν ανάλυσης στοιχείων ιστότοπου της Google που παρέχει στους κατόχους των ιστότοπων ένα υψηλό επίπεδο πληροφοριών σχετικά µε τους τρόπους που οι επισκέπτες εντοπίζουν τους ιστότοπους και τον τρόπο που αλληλεπιδρούν µε αυτούς (προσφέρει ανάλυση της κίνησης και επισκεψιµότητας µιας ιστοσελίδας όπως µέσος χρόνος παραµονής, κίνηση ανά σελίδα και άλλα). Κατανοώντας κάποιος πώς να αναλύσει και να εφαρµόσει τους διάφορους τύπους και όγκο πληροφοριών που το εργαλείο αυτό προσφέρει, αποκτά ένα σηµαντικό πλεονέκτηµα ενάντια στον ανταγωνισµό όσον αφορά το τοµέα της αναζήτησης και τα υψηλά αποτελέσµατα στις µηχανές αναζήτησης. Εµφανίστηκε για πρώτη φορά το Χαρακτηρίζεται ως µια από τις πιο σηµαντικές δηµιουργίες των τελευταίων χρόνων όσον αφορά τον τοµέα του SEO (Search Engine Optimization). Η µηχανή Αναζήτησης της Google 56

58 Κεφάλαιο 3 Εικόνα 13: Το Google Analytics Google Adwords Υπηρεσία Pay Per Click (PPC) διαφήµισης στο παγκόσµιο ιστό της µηχανής αναζήτησης της Google. Χιλιάδες διαφηµιστές χρησιµοποιούν το πρόγραµµα Google AdWords για την προώθηση των προϊόντων και των υπηρεσιών τους στον Παγκόσµιο Ιστό µε στοχοθετηµένες διαφηµίσεις. Οι διαφηµίσεις εµφανίζονται δίπλα στα αποτελέσµατα αναζήτησης του Google µε τη µορφή µικρού κειµένου, µόνο όταν ο χρήστης αναζητά κάτι σχετικό µε το θέµα της διαφήµισης. Η διαφήµιση προβάλλεται µόνο σε άτοµα που αναζητούν προϊόντα ή υπηρεσίες παρόµοια µε αυτά που διαφηµίζονται. εν υπάρχει χρέωση για την προβολή της διαφήµισης. Ο διαφηµιζόµενος πληρώνει µόνο όταν κάποιος κάνει click στη διαφήµιση και επισκεφτεί την εν λόγω ιστοσελίδα. Ο διαφηµιζόµενος έχει τη δυνατότητα να ρυθµίσει πολλές παραµέτρους, όπως σε ποιες χώρες και σε ποιες εκδόσεις του google θα εµφανίζεται η διαφήµιση, επιλογή του µέγιστου κόστους / click για κάθε λέξη που η αναζήτηση της στο Google θα εµφανίσει την διαφήµισή και άλλα. Το Pay per Click marketing είναι ένας τρόπος αύξησης της επισκεψιµότητας του δικτυακού τόπου ενός χρήστη πληρώνοντας ώστε να το έχει καταχωρηµένο στις µηχανές αναζήτησης κάτω Η µηχανή Αναζήτησης της Google 57

59 Κεφάλαιο 3 από τις ακριβείς λέξεις κλειδιά που έχει ο ίδιος ορίσει (και σε ξεχωριστή θέση). Σύµφωνα µε τον δικτυακό τόπο της εταιρείας, η Google σχεδίασε το AdWords για διαφηµιστές που θέλουν να απευθυνθούν σε ένα συγκεκριµένο κοινό µε τον πιο αποτελεσµατικό τρόπο. Google AdSense Το Google AdSense είναι ένας γρήγορος και εύκολος τρόπος για τους εκδότες δικτυακών τόπων όλων των µεγεθών να κερδίζουν χρήµατα προβάλλοντας στοχευµένες, διακριτικές διαφηµίσεις Google στους δικτυακούς τους τόπους. Οι διαφηµίσεις αυτές είναι συνήθως συναφείς µε το περιεχόµενο των ιστότοπων τους και βοηθούν στην βελτίωση της εµπειρίας των χρηστών. Το AdSense επιτρέπει επίσης σε κάποιον να παρέχει τη δυνατότητα αναζήτησης Google στους χρήστες του δικτυακού του τόπου, έχοντας κέρδος από την προβολή διαφηµίσεων της Google στις σελίδες αποτελεσµάτων αναζήτησης. Το AdSense προσφέρεται δωρεάν. Η εγγραφή στο AdSense είναι πανεύκολη και η διαδικασία αίτησης διαρκεί µόνο λίγα λεπτά. Εικόνα 14: Happy Birthday Picasso! - October Λογότυπο Η µηχανή Αναζήτησης της Google 58

60 Κεφάλαιο 4 Βελτιστοποίηση για τις Μηχανές Αναζήτησης

61 Κεφάλαιο 4 Εισαγωγή Υπάρχουν εκατοντάδες εκατοµµύρια site στο Internet αλλά µόνο ένα µέρος από αυτά, έχει αρκετούς επισκέπτες έτσι ώστε να είναι οικονοµικά επιτυχηµένο. Τo περιεχόµενο που δηµοσιεύεται στον παγκόσµιο ιστό έχει τις περισσότερες περιπτώσεις σαν στόχο να βρεθεί, να διαβαστεί και να γίνει όσο το δυνατόν πιο γνωστό. Ο ακριβής αριθµός εγγράφων του παγκόσµιου ιστού δεν είναι γνωστός. Οι µηχανές αναζήτησης ισχυρίζονται ότι έχουν σαρώσει και αναλύσει δισεκατοµµύρια διευθύνσεις ιστοσελίδων µέχρι σήµερα, οι οποίες καθηµερινά αυξάνονται µε απίστευτα ταχύ ρυθµό. Κάθε ιστοσελίδα πρέπει να βρει λοιπόν την θέση της µέσα σε ένα χάος πληροφοριών του διαδικτύου, αν θέλει να ξεχωρίσει, να διαβαστεί και τελικά να επιτύχει τον στόχο για τον οποίο δηµιουργήθηκε. Μια και οι µηχανές αναζήτησης έχουν αναλάβει το έργο της αποκατάστασης του δικτυακού χάους, οι διαχειριστές ιστοσελίδων οφείλουν να γνωρίζουν τις ιδιαίτερες προτιµήσεις των µηχανών και να προσαρµόσουν τις σελίδες τους πάνω στις προτιµήσεις αυτές, αυτό που διεθνώς περιγράφεται ως SEO, µια επίµονη και ταυτόχρονα εφικτή διαδικασία. Ορισµός Η φράση SEO περιλαµβάνει τα αρχικά των λέξεων που αντιστοιχούν στον αγγλικό όρο Search Engine Optimization και στα ελληνικά αποδίδεται ως Βελτιστοποίηση στις Μηχανές Αναζήτησης. Ο όρος αυτός περιλαµβάνει όλες τις διαδικασίες και επεµβάσεις που πρέπει να πραγµατοποιηθούν στη δοµή και το περιεχόµενο ενός website, ώστε να λάβει υψηλότερη σειρά κατάταξης από τους αλγόριθµους των µηχανών αναζήτησης και να βελτιωθεί η σειρά ταξινόµησης του στα εµφανιζόµενα αποτελέσµατα (SERP 8 ). Με άλλα λόγια θα την χαρακτηρίζαµε, ως µια διαδικασία προσέγγισης / εκπλήρωσης των κριτηρίων αξιολόγησης των µηχανών αναζήτησης που αφορούν την ταξινόµηση και την σειρά εµφάνισης της κάθε 8 Search Engine Results Page. Τα αποτελέσµατα που επιστρέφουν από τη µηχανή αναζήτησης αποτελούνται από έναν τίτλο, ένα link στη σελίδα και µια µικρή περιγραφή η οποία δείχνει ποιο είναι το σηµείο επαφής της φράσης µέσα στη σελίδα. Η µηχανή αναζήτησης ανανεώνει τα SERP αποτελέσµατα περιοδικά µε σκοπό την κατάταξη νέων σελίδων και την ανακατάταξη παλαιοτέρων. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 60

62 Κεφάλαιο 4 ιστοσελίδας ή πολύ πιο απλά η τέχνη (ή τεχνική) της κατασκευής ιστοσελίδων που θα τα πηγαίνουν καλά στις µηχανές αναζήτησης. Τέλος, θα λέγαµε πως αποτελεί µια υπηρεσία η οποία πλαισιώνει τη γενικότερη ιδέα του Search Engine Marketing (SEM) αλλά και E-Marketing 9, όπου µαζί µε άλλες (Pay per click κτλ.) εντάσσονται σε ένα γενικότερο φάσµα υπηρεσιών προώθησης ιστοσελίδων. Βέβαια και η χρησιµοποίηση ενός προγράµµατος PPC αποτελεί SEO σε µία ιστοσελίδα. Εξαιτίας αυτού και για να είµαστε πιο ακριβείς, για να υπάρχει ένας διαχωρισµός ανάµεσα σε µια γενική βελτιστοποίηση και σε εκείνη που στοχεύει στα οργανικά αποτελέσµατα, χρησιµοποιείτε ο όρος Organic SEO. Το Organic SEO θεωρείται το µεγαλύτερο και σηµαντικότερο κοµµάτι του Search Engine Optimization. Ακόµα κι αν ο βασικός στόχος κάποιου είναι η συχνή εµφάνιση µιας ιστοσελίδα σε διαφηµίσεις και πληρωµένες καταχωρήσεις (π.χ. Adwords), το κέρδος θα είναι πολύ µεγαλύτερο αν παράλληλα έχει πετύχει τις υψηλότερες δυνατές θέσεις κατάταξης στα φυσικά η οργανικά αποτελέσµατα. Το µεγαλύτερο πλεονέκτηµα του Organic SEO είναι: Επειδή είναι βασισµένο στην καθαρή βελτιστοποίηση της ιστοσελίδας, τα αποτελέσµατα του έχουν αντοχή σε βάθος χρόνου. Με λίγα λόγια, όταν ολοκληρωθεί το SEO, η επίτευξη των υψηλών θέσεων κατάταξης µε µια µικρή συντήρηση µπορεί να είναι και µόνιµη. Εικόνα 15: Ο όρος για τη βελτιστοποίηση στις ΜΑ 9 Το e-marketing µπορεί να ορισθεί ως η χρήση του διαδικτύου και των σχετικών ψηφιακών τεχνολογιών για την επίτευξη στόχων marketing και την υποστήριξη των µοντέρνων ιδεών marketing. Τέτοιες τεχνολογίες είναι το διαδίκτυο και άλλα ψηφιακά µέσα όπως η ασύρµατη τεχνολογία. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 61

63 Κεφάλαιο 4 Στόχος Η βελτίωση των σελίδων θεωρείται µια χρονοβόρα και περίπλοκη διαδικασία, που όµως κατά πολλούς έχει θεαµατικά αποτελέσµατα εφόσον γίνει σωστά και µεθοδικά από ανθρώπους που γνωρίζουν καλά το αντικείµενο. Βασικοί στόχοι των αλλαγών αυτών είναι το περιεχόµενο της εκάστοτε ιστοσελίδας να γίνει όσο το δυνατόν πιο φιλικό, ανιχνεύσιµο και δηµοφιλή στις µηχανές αναζήτησης µε άµεσο αντίκρισµα όπως προείπαµε, την υψηλή κατάταξη του site στην χρήση συγκεκριµένων λέξεων κλειδιών που αφορούν το αντικείµενο αλλά και την αύξηση της επισκεψιµότητας της ιστοσελίδας µέσω οργανικών αποτελεσµάτων και ότι αυτό µακροπρόθεσµα συνεπάγεται. Το γεγονός ότι οι εσωτερικοί αλγόριθµοι επεξεργασίας των όρων αναζήτησης όχι µόνο δεν είναι γνωστοί αλλά και µεταβάλλονται/εξελίσσονται συνεχώς, καθιστούν ιδιαίτερα δύσκολη µια τέτοια διαδικασία. Επίσης, η κάθε µηχανή αναζήτησης χρησιµοποιεί τους δικούς της εσωτερικούς αλγόριθµους, κάτι που κάνει την προσπάθεια βελτιστοποίησης ακόµα πιο επίπονη. Για τους λόγους αυτούς γίνεται σαφές, ότι δεν υπάρχουν µαγικά φίλτρα για µία εγγυηµένη υψηλή κατάταξη µίας ιστοσελίδας στα αποτελέσµατα των µηχανών αναζήτησης, αν και πολλές εταιρίες βελτιστοποίησης διαφηµίζουν συχνά το αντίθετο παραπλανώντας έτσι τους πελάτες τους. Παρόλα αυτά, µέσω τόσο των συµβουλών που παρέχουν οι ίδιες οι µηχανές όσο και των µακροχρόνιων εµπειριών των διαχειριστών δικτυακών τόπων όσον αφορά την κατάταξή τους στα αποτελέσµατα, είναι δυνατόν να βγουν κάποια γενικά συµπεράσµατα και κανόνες για την ποιοτική βελτιστοποίηση µίας ιστοσελίδας για τις µηχανές αναζήτησης. Κάποια από τα συµπεράσµατα αυτά είναι σίγουρα εµπειρικά και µάλιστα, ορισµένες φορές αµφιλεγόµενης σηµασίας. Η Βελτιστοποίηση ιστοσελίδων αποτελεί αναπόσπαστο µέρος της προώθησης τους, το οποίο συµβάλει στην επιτυχηµένη προβολή τους στο internet. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 62

64 Κεφάλαιο 4 Εικόνα 16: Στόχος η αύξηση ranking σε ΜΑ κ directories Η εµφάνιση του SEO Στα µέσα της δεκαετίας του 1990, οι µηχανές αναζήτησης ενδιαφερόντουσαν µόνο για το κοµµάτι της καταγραφής των ιστότοπων. Το µόνο πράγµα που έπρεπε να κάνει κάποιος ήταν απλά να δηλώσει το URL της ιστοσελίδας του και η µηχανή αναζήτησης αναλάµβανε όλα τα υπόλοιπα. Αν επιχειρήσουµε µια αναδροµή στο παρελθόν, θα παρατηρήσουµε πως από το 1996 και µετά άρχισαν οι µηχανές αναζήτησης να γίνονται ένα πολύ δηµοφιλές εργαλείο εύρεσης πληροφοριών στο διαδίκτυο. Κάπου εκεί και πιο συγκεκριµένα περί τα τέλη του 1997 ξεκινάει ουσιαστικά η βελτιστοποίηση για τις µηχανές αναζήτησης (SEO) µέσα από διάφορες δηµόσιες τοποθετήσεις και αναφορές, προερχόµενες από ειδικούς του χώρου, όπως ο Danny Sullivan και ο Bruce Clay. Το βάρος έπεφτε βέβαια στους αλγόριθµους των µηχανών και πως αυτές ταξινοµούσαν τα αποτελέσµατα τους. Το γεγονός αυτό είχε άµεση επιρροή σε επιχειρηµατίες και ιδιοκτήτες websites που άρχισαν να σκέφτονται για το πως θα µπορούσαν να ταξινοµηθούν καλύτερα. Η ανάγκη για βελτιστοποίηση των ιστοσελίδων άρχισε να γίνεται αντιληπτή από το σύνολο των διαχειριστών/ιδιοκτητών τους στις αρχές του 1998, και αυτό γιατί υπήρχε ένα ρεύµα χειραγώγησης των αποτελεσµάτων των µηχανών αναζήτησης, µε άσχετες προς το περιεχόµενο των ιστοσελίδων λέξεων - κλειδιών, αλλά και ακόµα χειρότερα, µε την εµφάνιση σε αυτές διαφορετικού περιεχοµένου από αυτό που Βελτιστοποίηση για τις Μηχανές Αναζήτησης 63

65 Κεφάλαιο 4 αποτελούσε πραγµατικά την ιστοσελίδα. Το αποτέλεσµα αυτών των αθέµιτων τεχνικών ήταν η ανάπτυξη περαιτέρω ειδικών αλγόριθµων αναζήτησης αλλά και indexing ιστοσελίδων από τις µηχανές αναζήτησης, ώστε τα φαινόµενα αυτά να περιοριστούν. Το 1998 δύο µεταπτυχιακοί φοιτητές στο Πανεπιστήµιο του Στάνφορντ, ο Larry Page και ο Sergey Brin όπως αναφέρθηκε και στο α κεφάλαιο, ίδρυσαν το Google. Η ιδέα τους ήταν να αξιολογεί η µηχανή αναζήτησης µε µαθηµατικούς αλγόριθµους όλες τις προβολές των ιστοσελίδων. Ο αριθµός του Page Rank, που θα αποτελούνταν από αυτό αλλά και από τη συνάρτηση της ποιότητας και της αντοχής των εισερχοµένων συνδέσεων, θα αποτελούσε το κλειδί για την όσο το δυνατό ψηλότερη κατάταξη [17]. Ένα λογισµικό αλγορίθµων προκειµένου να καθορίσει σε ποια ακριβώς σελίδα των αποτελεσµάτων που δίνει πρέπει να καταταχτεί µια συγκεκριµένη ιστοσελίδα ενός δικτυακού τόπου. Μέχρι λοιπόν και το 2007 όλες οι µηχανές αναζήτησης είχαν ενσωµατώσει τεχνολογίες περίπλοκων αλγορίθµων κατάταξης ιστοσελίδων, µε πρωτοπόρο το Google που χρησιµοποιεί ούτε λίγο ούτε πολύ, παραπάνω από 200 διαφορετικούς αλγόριθµους. Μια παρόµοια στρατηγική εφαρµόζεται στους καταλόγους, όπως το Yahoo! Οι κατάλογοι χρησιµοποιούν ειδικούς για να εξετάζουν τις ιστοσελίδες που καταχωρούνται σε ποιες κατηγορίες αποτελεσµάτων ανήκουν και πόσο σχετικές είναι οι καταχωρηµένες ιστοσελίδες µε τις λέξεις κλειδιά. Στις περιπτώσεις των καταλόγων, ανθρώπινοι «surfers» αντικαθιστούν τους αλγόριθµους των µηχανών αναζήτησης (search engine algorithms) και ταξινοµούν τις ιστοσελίδες σε θεµατικές κατηγορίες. Όλοι αυτοί οι αλγόριθµοι είναι η καρδιά των µηχανών αναζήτησης και όπως προείπαµε, κρατούνται άκρως µυστικοί. Βέβαια από την άλλη, δεν θα µπορούσαν οι χρήστες των αθέµιτων µέσων να µείνουν µε σταυρωµένα χέρια και δηµιούργησαν περίπου από το 2000, τη τεχνική SEO που ονοµάζεται και στις µέρες µας "Black Hat SEO". Αυτή η τεχνική σκοπό έχει την γρήγορη αναρρίχηση µίας ιστοσελίδας στις πρώτες θέσεις των οργανικών αποτελεσµάτων των µηχανών αναζήτησης µε διάφορες κακόβουλες τεχνικές µε ικανοποιητικό µεν αλλά και πολύ σύντοµο χρονικό διάστηµα παραµονής δε σε αυτές τις θέσεις. Η σύντοµη παραµονή σε αυτές δεν είναι και το µοναδικό αποτέλεσµα που τελικώς επιφέρει η τεχνική "Black Hat SEO" σε µία ιστοσελίδα. Όταν οι µηχανές αναζήτησης ανακαλύψουν την απάτη (και πλέον µπορούν), τιµωρούν αυτή την παράνοµη γι' αυτές τεχνική, ρίχνοντας στον πάτο των οργανικών αποτελεσµάτων την ιστοσελίδα. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 64

66 Κεφάλαιο 4 Μερικά παραδείγµατα που µπορούν να αναφερθούν εδώ είναι : Τον Φεβρουάριο του 2006 η Google τιµώρησε τις ιστοσελίδες της γερµανικής αυτοκινητοβιοµηχανίας BMW, της εταιρείας Ricoh και τον Απρίλιο του 2006 της BigMouthMedia, αναγκάζοντας τις τρεις εταιρείες να ζητήσουν ουσιαστικά συγνώµη από τη Google για να τους επαναφέρει στα αποτελέσµατα της, όπως και έγινε τελικά. Τέλος, η τεχνική που θα µπορούσαµε να πούµε "αγαπάνε" οι µηχανές αναζήτησης ονοµάζετε "White Hat SEO" και την οποία δεν την θεωρούν παράνοµη µέθοδο. Τα αποτελέσµατα της είναι µακροπρόθεσµα και αφορούν την αναρρίχηση µίας ιστοσελίδας όσο πιο ψηλά γίνεται στα αποτελέσµατα, µε ταυτόχρονη παραµονή της σε αυτά για µεγάλο χρονικό διάστηµα. Τι είναι τελικά οι λέξεις κλειδιά (keywords), πως τα χρησιµοποιούν οι µηχανές αναζήτησης και πως τα αντιλαµβάνονται οι άνθρωποι ; Μια πολύ σηµαντική έννοια που αναφέρθηκε στο πρώτο κεφάλαιο και θα αναφερθεί αρκετά και στη συνέχεια είναι οι λέξεις κλειδιά. Τα keywords είναι γεγονός πως παίζουν σηµαντικό ρόλο στο Search engine optimization. Σε µια αναζήτηση στο διαδίκτυο µέσω µιας µηχανής αναζήτησης χρησιµοποιούνται µία ή περισσότερες λέξεις που περιγράφουν καλύτερα και συνοπτικά αυτό που κάποιος αναζητά. Οι λέξεις αυτές παίζουν τον ρόλο των keywords δηλαδή των λέξεων κλειδιών, οι οποίες χρησιµοποιούνται ώστε να περιγράψουν ένα θέµα όσο πιο περιληπτικά γίνεται. Επιπλέον, αποτελούν λέξεις ή συνδυασµό λέξεων που επιλέγονται για την προώθηση µιας ιστοσελίδας. Πολλές φορές το εάν κάποιος θα βρει αυτό που αναζητά στο διαδίκτυο είναι καθαρά θέµα των keywords που θα επιλέξει να χρησιµοποιήσει. Παρόλα αυτά, ακόµα και δύο άνθρωποι που αναζητούν ένα κοινό θέµα, είναι πολύ πιθανό να χρησιµοποιήσουν διαφορετικές τέτοιες λέξεις. Ο τρόπος που ένας άνθρωπος αντιλαµβάνεται ένα θέµα δεν µπορεί να αφοµοιωθεί και να αντιγραφεί πλήρως από ένα πρόγραµµα όσο καλό και εάν είναι. Αυτό έχει σαν αποτέλεσµα η έννοια των κάθε keywords να γίνεται διαφορετικά αντιληπτή από τον άνθρωπο και διαφορετικά από τις µηχανές αναζήτησης. Μια µηχανή δεν µπορεί να καταλάβει το νόηµα των λέξεων αλλά προσπαθεί να χρησιµοποιήσει αλγόριθµους για να εντοπίσει τις λέξεις κλειδιά. Οι τρόποι που ένα πρόγραµµα βρίσκει τις λέξεις κλειδιά είναι διάφοροι. Συνήθως όµως, έχουν σχέση µε την πυκνότητα και τον τρόπο εµφάνισης της. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 65

67 Κεφάλαιο 4 Η σπουδαιότητα του SEO Ένα καλοσχεδιασµένο SEO µπορεί να κάνει το περιεχόµενο των ιστοσελίδων ενός website πιο σχετικό, πιο ελκυστικό αλλά και πιο φιλικό προς τους µηχανισµούς ανάγνωσης των µηχανών αναζήτησης έτσι ώστε µε µεγαλύτερη ευκολία και ταχύτητα να σαρώσουν ολόκληρο το site και να το ευρετηριάσουν [16]. Γιατί το SEO όµως είναι τόσο απαραίτητο και πρωταρχικής σηµασίας για ένα website και γιατί µία υψηλή θέση (ranking) στις λίστες των αποτελεσµάτων των µηχανών αναζήτησης είναι τόσο σηµαντική; Πρόσφατες έρευνες έδειξαν ότι πάνω από το 85% της κίνησης στο internet, προέρχεται από τις µηχανές αναζήτησης (43% επισκεπτών ενός ιστότοπου από Μ.Α). Αυτό από µόνο του µάλλον φανερώνει πολλά. Με απλά λόγια, οι µηχανές αναζήτησης είναι ένα πολύτιµο εργαλείο σε κάθε έναν που αναζητεί πληροφορίες στο διαδίκτυο καθώς µπορούµε δυνητικά, να αναζητήσουµε οτιδήποτε και να πάρουµε άµεσα αποτελέσµατα υπό την µορφή ιστοσελίδων που περιέχουν στοιχεία των αναζητήσεων. Θεωρείστε τον εαυτό σας ιδιοκτήτη ενός δικτυακού τόπου µιας επιχείρησης. Σκεφτείτε πόσο σηµαντικό είναι οι ενδιαφερόµενοι επισκέπτες πελάτες ψάχνοντας στο διαδίκτυο να µη µπορούν να βρουν τις πληροφορίες, υπηρεσίες, προϊόντα που προσφέρεται ακόµα και το τηλέφωνο ή τη διεύθυνση σας. Οι πιθανοί πελάτες ψάχνουν να εντοπίσουν πληροφορίες αλλά η ιστοσελίδα σας δεν εµφανίζεται πουθενά, συνεπώς ουδέποτε ο υποψήφιος πελάτης θα µάθει για την ύπαρξη σας. Παρόλο που µπορεί να έχετε σχεδιάσει και κατασκευάσει µια όµορφη και εντυπωσιακή σελίδα αυτή παρουσιάζει χαµηλή κίνηση επισκεπτών και δεν εµφανίζετε πουθενά στα αποτελέσµατα των αναζητήσεων από της µηχανές αναζήτησης. Ίσως και να εµφανίζει κάποια αποτελέσµατα στις αναζητήσεις αλλά όχι σε ικανοποιητική θέση στην κατάταξη των αποτελεσµάτων. Από στατιστικές γνωρίζουµε ότι το 85% των επισκεπτών επιλέγει από τα 3 πρώτα αποτελέσµατα της πρώτης σελίδα SERP (και το 80% µόνο από τα πρώτα δέκα) ενώ µόνο το 15% θα προχωρήσει στα παρακάτω 20 ή 30 αποτελέσµατα και πέρα από την 3η σελίδα των SERP [16]. Εποµένως, για εµπορικούς δικτυακούς τόπους που προσφέρουν προϊόντα Βελτιστοποίηση για τις Μηχανές Αναζήτησης 66

68 Κεφάλαιο 4 ή υπηρεσίες µε χρέωση ή αντιπροσωπεύουν εταιρίες κάθε µορφής, είναι κρίσιµης σηµασίας το περιεχόµενό τους να γίνει δηµοφιλές στο διαδίκτυο, ώστε µέσω της υψηλής επισκεψιµότητας να αυξηθούν αντίστοιχα και οι πωλήσεις. Ας πάρουµε ένα ακόµα παράδειγµα, έναν χρήστη που ψάχνει για µία πληροφορία µέσα από µια µηχανή αναζήτησης π.χ. το Google. ίχως αµφιβολία θα κληθεί να επιλέξει µεταξύ χιλιάδων αποτελεσµάτων που παραπέµπουν σε ανάλογο αριθµό ιστοσελίδων. εδοµένου λοιπόν ότι ένας χρήστης δεν θα αφιέρωνε περισσότερο χρόνο για να αναζητήσει πέρα από τα 20 περίπου πρώτα αποτελέσµατα µιας αναζήτησης, θα πρέπει ο εκάστοτε δικτυακός τόπος να συγκαταλέγεται σε αυτά. Έχοντας λοιπόν µία από τις πρώτες θέσεις, επωφελείται από το µέγιστο αριθµό χρηστών επισκεπτών δωρεάν από τις µηχανές αναζήτησης. Σίγουρα οι επισκέπτες ή πελάτες που γνωρίζουν την ηλεκτρονική διεύθυνση µιας ιστοσελίδας (URL) την βρίσκουν άµεσα, το θέµα όµως είναι ο δυνητικός πελάτης, ο επισκέπτης που δεν γνωρίζει αλλά ψάχνει µέσα από τις µηχανές αναζήτησης για τις όποιες υπηρεσίες ή προϊόντα. Συνεπώς µπορεί να µετατραπεί από έναν απλό επισκέπτη σε πελάτη. Τα οργανικά αποτελέσµατα των µηχανών αναζήτησης δεν είναι µόνο χωρίς κόστος για την εκάστοτε ιστοσελίδα αλλά χρησιµοποιούνται και από µεγαλύτερο αριθµό χρηστών, έτσι ώστε οι δικτυακοί τόποι που εµφανίζονται στις πρώτες θέσεις των αποτελεσµάτων των µηχανών αναζήτησης, να έχουν τεράστια (οικονοµική) επιτυχία. Άρα µια ιστοσελίδα ταυτόχρονα µε την εµφάνιση πρέπει να συνδυάζει και τη βελτιστοποίηση στις µηχανές αναζήτησης. Πολλοί λένε πως «η συνταγή που εγγυάται την σίγουρη επιτυχία της προβολής µιας ιστοσελίδας στο διαδίκτυο, είναι ο σωστός σχεδιασµός και κατασκευή µε παράλληλη βελτιστοποίηση στις µηχανές αναζήτησης SEO». Παράγοντες που επηρεάζουν την κατάταξη Σε γενικές γραµµές, θα µπορούσαµε να κατατάξουµε τα χαρακτηριστικά αυτά σε δύο βασικές κατηγορίες: τους εσωτερικούς εντός σελίδας (on-page) και τους εξωτερικούς εκτός σελίδας (off-page) παράγοντες κατάταξης. Και οι δύο κατηγορίες είναι πολύ σηµαντικές και χρειάζονται την ανάλογη προσοχή. Φυσικά για να έχει νόηµα η βελτιστοποίηση για µηχανές αναζήτησης πρέπει καταρχήν η ιστοσελίδα να Βελτιστοποίηση για τις Μηχανές Αναζήτησης 67

69 Κεφάλαιο 4 γίνει γνωστή στις µηχανές αναζήτησης, ώστε να καταχωρηθεί στο εσωτερικό ευρετήριό τους. Για να συµβεί αυτό αρκεί τις περισσότερες φορές, ένας και µόνο σύνδεσµος κειµένου (text link) από µία άλλη καταχωρηµένη ιστοσελίδα. Εικόνα 17: Σηµαντικότεροι παράγοντες αλγορίθµου Google (πηγή: Seomoz.org) Εκτιµάται ότι υπάρχουν πολλές εκατοντάδες από κριτήρια που µια µηχανή εξετάζει πριν κατατάξει µια ιστοσελίδα στις σελίδες των αποτελεσµάτων. Κάθε µηχανή αναζήτησης δίνει διαφορετική βαρύτητα σε αυτά τα κριτήρια. Για παράδειγµα, άλλη µηχανή δίνει περισσότερη σηµασία στην παλαιότητα της ιστοσελίδας και λιγότερη στις συνδέσεις ενώ άλλη µπορεί να δίνει περισσότερη σηµασία στις συνδέσεις και σχεδόν καθόλου στην παλαιότητα. Εντός ιστοσελίδας (on-page) παράγοντες κατάταξης Η διαδικασία αυτή αφορά την εφαρµογή του On page SEO. Περνάµε πλέον στην επεξεργασία και βελτιστοποίηση επάνω σε έναν ιστότοπο. Θα λέγαµε πως το On Page optimization περιλαµβάνει όλες εκείνες τις τεχνικές του SEO, οι οποίες Βελτιστοποίηση για τις Μηχανές Αναζήτησης 68

70 Κεφάλαιο 4 χρησιµοποιούνται σε µια ιστοσελίδα για την βελτίωση της θέσης της στην κατάταξη των SERP, χωρίς την βοήθεια από άλλους ιστότοπους. Στην κατηγορία αυτή υπάρχουν αρκετά στοιχεία. Μερικά από αυτά είναι πολύ σηµαντικά σε αντίθεση µε κάποια άλλα που αν και χαρακτηρίζονται από πολλούς ως κρίσιµα, στην πραγµατικότητα είναι εντελώς ανούσια και µπορούν ακόµα και να βλάψουν µια κατάταξη. Είναι γεγονός πως οι µηχανές αναζήτησης εξελίσσονται µε το πέρασµα των χρόνων και κάτι που θεωρούνταν σηµαντικό το 2003, σήµερα ίσως είναι εντελώς άχρηστο και ξεπερασµένο. Οι αλγόριθµοι τους γίνονται όλο και πιο πολύπλοκοι λαµβάνοντας υπόψη πολλούς παράγοντες. Μια µικρή αλλαγή στον αλγόριθµο µιας µηχανής αναζήτησης µπορεί να έχει δραµατικά αποτελέσµατα στην προσπάθεια προώθησης και βελτιστοποίησης µιας ιστοσελίδας. Γι αυτό είναι πολύ σηµαντικό για όσους ασχολούνται µε το συγκεκριµένο θέµα να είναι ενήµεροι για τις οποιεσδήποτε αλλαγές γίνονται ή σκοπεύουν να γίνουν και να προσαρµόζουν τη δουλεία τους ανάλογα. Η διαδικασία του on-page έχει να κάνει µε την επεξεργασία της σχεδίασης των ιστοσελίδων, του τίτλους των σελίδων (web titles), τα Meta tags και την διάταξη και διάρθρωση ολόκληρου του ιστότοπου έτσι ώστε να γίνει SEO friendly. Εάν ο ιστότοπος είναι καλά δοµηµένος µε απλή κωδικοποίηση, τότε η διαδικασία του indexing (ευρετηρίασης) θα γίνει πολύ πιο γρήγορα. Ακολουθεί αναφορά των πιο «δυνατών» στοιχείων του on-page optimization καθώς και άλλων που βοηθούν σε µικρότερο βαθµό. Σηµαντικοί παράγοντες: 1) Κατάλληλοι τίτλοι σελίδων Μάλλον ο σηµαντικότερος on-page παράγων. Ιδιαίτερη προσοχή χρειάζεται η βελτιστοποίηση των τίτλων των ιστοσελίδων, δηλαδή του στοιχείου της <title> της HTML. Οι τίτλοι ιστοσελίδων: είναι το πρώτο πράγµα που βλέπει ένας χρήστης µόλις φορτώσει την ιστοσελίδα εµφανίζονται έντονα στα αποτελέσµατα των µηχανών αναζήτησης έχουν προφανώς εξέχουσα σηµασία για τις µηχανές αναζήτησης Βελτιστοποίηση για τις Μηχανές Αναζήτησης 69

71 Κεφάλαιο 4 Χρησιµοποιείτε περιγραφικούς τίτλους, που περιέχουν τις βασικές και κατάλληλες λέξεις-κλειδιά και αφορούν στο συγκεκριµένο περιεχόµενο, σε µορφή φράσης (απευθύνεται σε ανθρώπους) και όχι απλής αναφοράς όρων. Το µέγεθος του τίτλου δεν πρέπει να είναι υπερβολικά µεγάλο. Κάθε σελίδα ενός δικτυακού τόπου πρέπει να έχει ένα και µοναδικό τίτλο. Η χρήση όµοιων τίτλων σε πολλές σελίδες µπορεί να βλάψει σοβαρά την προσπάθεια βελτιστοποίησης για τις µηχανές αναζήτησης. Λόγω αυτής της σπουδαιότητας και της προβεβληµένης θέσης που έχει, θεωρείται από τις µηχανές αναζήτησης µεγάλης σηµασίας, εµφανίζεται στα αποτελέσµατα αναζήτησης και κατά συνέπεια θα πρέπει να χρήζει ιδιαίτερης προσοχής για την όσο το δυνατόν καλύτερη βελτιστοποίησή του. (Αξίζει να σηµειωθεί ότι: οι συστάσεις του W3C 10 θεωρούν σαν ιδανικό µήκος τίτλου, ότι πρέπει να είναι 64 χαρακτήρες συµπεριλαµβανοµένων των διαστηµάτων ή και λιγότερο. Μερικοί λένε πως πρέπει να είναι µικρότερος από 12 λέξεις. Η Google προβάλει 66 χαρακτήρες -µαζί µε τα διαστήµατα- ή την τελευταία πλήρη λέξη για τον τίτλο της ιστοσελίδας). 2) Το περιεχόµενο Οι ιστοσελίδες και τα περιεχόµενά τους πρέπει να δηµιουργούνται για ανθρώπους-χρήστες και όχι για µηχανές αναζήτησης. Το ποιοτικό, χρήσιµο για τον επισκέπτη περιεχόµενο (γενικού ή ειδικού ενδιαφέροντος) αποτελεί τον προφανέστερο παράγοντα βελτιστοποίησης µίας ιστοσελίδας, που δυστυχώς συχνά αγνοείται. Κανείς δεν αναζητεί ούτε επισκέπτεται κάτι που δεν είναι χρήσιµο και αντίστοιχα οι µηχανές αναζήτησης πλέον όχι µόνο δεν παρουσιάζουν ευχάριστα στα αποτελέσµατα τους οτιδήποτε δεν είναι χρήσιµο για τον (άνθρωπο-) χρήστη τους αλλά και δύσκολα εξαπατώνται στον σηµείο αυτό. Χωρίς χρήσιµο περιεχόµενο µία ιστοσελίδα δεν έχει µακροπρόθεσµα καµία ελπίδα υψηλής καταχώρησης στα αποτελέσµατα των µηχανών αναζήτησης, κι ας χρησιµοποιήσουν οι διαχειριστές της όλα τα τεχνάσµατα του κόσµου. Οι µηχανές αναζήτησης δίνουν µεγάλη έµφαση στην πρωτοτυπία και αυθεντικότητα του περιεχοµένου (ξεχωριστό περιεχόµενο σε κάθε 10 Επρόκειτο για την διεθνή κοινοπραξία World Wide Web Consortium. Το W3C δηµιουργήθηκε τον Οκτώβριο του 1994, µε σκοπό να οδηγήσει το Web στην πλήρη αξιοποίηση των δυνατοτήτων του µέσω της ανάπτυξης κοινών πρωτοκόλλων που προάγουν την εξέλιξή του και διασφαλίζουν τη διαλειτουργικότητά του. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 70

72 Κεφάλαιο 4 σελίδα). Οι ειδικοί συµπληρώνουν: «Γράφεται για ανθρώπους, όχι για τις µηχανές, προτείνετε κάτι αξιόλογο και όχι βαρετές λεπτοµέρειες, µοιραστείτε τις εµπειρίες σας και τέλος γράφετε σε κάθε σελίδα για ένα µόνο θέµα. Κάποτε οι µηχανές επικεντρώνονταν περισσότερο στις λέξεις κλειδιά, τώρα ρίχνουν το βάρος στο θέµα». Τα περιεχόµενα ενός δικτυακού τόπου παραµένουν ένα από τα σηµαντικότερα µέρη µίας Web Site optimization στρατηγικής. 3) Πλοήγηση, δοµή και εσωτερικοί σύνδεσµοι (internal links) Αν και είναι λίγο υποτιµηµένο δεν παύει να είναι πολύ σηµαντικό. Μια ορθή και εύκολη πλοήγηση βοηθάει τόσο τις αράχνες των µηχανών αναζήτησης να ακολουθήσει όλους τους συνδέσµους ενός website και να ευρετηριάσει όλες τις σελίδες όσο και τους εκάστοτε επισκέπτες της σελίδας. Οι σελίδες ενός δικτυακού τόπου πρέπει να είναι πλήρως συνδεδεµένες µεταξύ τους. Η σηµασία µίας συγκεκριµένης σελίδας για τις µηχανές αναζήτησης µπορεί να προκύψει και από τον αριθµό και την αρχιτεκτονική των συνδέσµων που δέχεται από άλλες εσωτερικές σελίδες του δικτυακού τόπου. Μια πλήρως συνδεδεµένη σελίδα είναι για τις µηχανές (αλλά και για τους ανθρώπους) σηµαντικότερη από µια άλλη αποµονωµένη ενώ οι ειδικοί αναφέρουν «κάθε σελίδα δεν πρέπει να απέχει περισσότερο από τρία κλικ από οποιαδήποτε άλλη σελίδα, συµπεριλαµβανοµένης της αρχικής». Αν ένας χρήστης δυσκολευτεί να βρει µία πληροφορία σε µία ιστοσελίδα τότε το πιθανότερο είναι να οδηγηθεί στην ιστοσελίδα ενός ανταγωνιστή. Οπότε είναι σηµαντικό ένας χρήστης να οδηγείται σε µια πληροφορία µε όσο το δυνατό λιγότερο κόπο. Βασική προϋπόθεση για το παραπάνω είναι η χρήση συνδέσµων κειµένου (και όχι π.χ. µέσω Javascript) µε το κατάλληλο περιγραφικό κείµενο. Οι εσωτερικοί σύνδεσµοι µπορούν να βοηθήσουν στην αύξηση του rank µέσα στην ιστοσελίδα. Όταν η κεντρική σελίδα έχει υψηλό pagerank και συνδέεται µε µια σελίδα µε χαµηλότερο ranking τότε η σελίδα θα βοηθηθεί να ανεβάσει το pagerank της. Επίσης, πολύ σηµαντική είναι και η χρήση του sitemap για την ευρετηρίαση ενός δικτυακού τόπου από τις µηχανές αναζήτησης Ένα site map είναι µια σελίδα γεµάτη από εσωτερικούς συνδέσµους που αναλύει την δοµή της ιστοσελίδας. Η σελίδα αυτή υπάρχει, έτσι ώστε οι χρήστες να µπορούν να εντοπίσουν και να οδηγηθούν στις εσωτερικές σελίδες. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 71

73 Κεφάλαιο 4 Η βάση κάθε ιστοσελίδας σήµερα είναι ακόµα η περιγραφική γλώσσα HTML. Αυτή αναγνωρίζουν οι φυλλοµετρητές και από αυτήν παίρνουν οι µηχανές αναζήτησης τις πληροφορίες για το περιεχόµενο µίας ιστοσελίδας. Μοντέρνες τεχνικές όπως Javascript, DHTML, Ajax, Flash κ.λ.π. όπως και οι εικόνες προσδίδουν σε µία ιστοσελίδα ειδικά εφέ και µπορούν να βελτιώσουν τόσο την εµφάνισή της όσο και την αλληλεπίδραση µε τον χρήστη. υστυχώς το περιεχόµενο των τεχνικών αυτών όµως δεν µπορεί να διαβαστεί ακόµα πλήρως από τις µηχανές αναζήτησης, οπότε η εφαρµογή τους πρέπει να περιορίζεται σε µέρη τις ιστοσελίδας που δεν είναι άµεσα απαραίτητα για την πλοήγηση και την προβολή του κυρίως περιεχοµένου. Το κυρίως περιεχόµενο µίας ιστοσελίδας πρέπει να παρέχεται σε µορφή HTML και να πληροί τους γενικούς κανόνες του W3C. Αποφύγετε λοιπόν την δηµιουργία ιστοσελίδων, για παράδειγµα αποκλειστικά µέσω Flash, όσο όµορφες κι αν είναι αυτές. Οι µηχανές αναζήτησης δεν µπορούν ακόµα να τις δουν. Γλώσσες Προγραµµατισµού και SEO Ένα στοιχείο που πρέπει να σκεφτούµε όταν σχεδιάζουµε µια ιστοσελίδα για SEO, είναι η γλώσσα προγραµµατισµού που θα χρησιµοποιήσουµε. Όλες οι γλώσσες προγραµµατισµού δεν αντιδρούν το ίδιο σε σχέση µε τις µηχανές αναζήτησης. Οι περισσότεροι όταν σκέφτονται για προγραµµατισµό ιστοσελίδων, σκέφτονται σε όρους html. Στην πραγµατικότητα υπάρχουν πολλές άλλες γλώσσες που κάθε µια χρειάζεται διαφορετική προσοχή και υλοποίηση κατά την εκτέλεση στρατηγικών βελτιστοποίησης [14]. Javascript Η javascript είναι µια γλώσσα προγραµµατισµού που επιτρέπει στους προγραµµατιστές να δηµιουργήσουν δυναµικά και interactive περιεχόµενα. Παρόλα αυτά δεν είναι φιλική ως προς το SEO. Πολλές φορές η χρήση της Javascript µπορεί να σταµατήσει τους crawlers από το να προχωρήσουν και να διαβάσουν τον υπόλοιπο ιστότοπο. Όταν αυτό συµβεί το αποτέλεσµα είναι χαµηλότερες θέσεις κατάταξης (SERPs). Συµπερασµατικά, η javascript µπορεί να χρησιµοποιηθεί αλλά µε πολύ µεγάλη προσοχή και σε συγκεκριµένα κοµµάτια της ιστοσελίδας [14]. Flash Βελτιστοποίηση για τις Μηχανές Αναζήτησης 72

74 Κεφάλαιο 4 Το Flash είναι η τεχνολογία που µερικοί χρήστες απεχθάνονται και άλλοι την λατρεύουν. Είναι η τεχνολογία που δηµιουργεί τις ιστοσελίδες που οι περισσότεροι θαυµάζουµε λόγω της κίνησης και της εντυπωσιακής εναλλαγής των εικόνων και των σελίδων. Παρόλα αυτά το Flash έχει σχεδόν µόνο µειονεκτήµατα. Ένας δικτυακός τόπος υλοποιηµένος σε flash είναι πολύ ποιο αργός από έναν δικτυακό τόπο υλοποιηµένο σχεδόν σε οποιαδήποτε άλλη γλώσσα προγραµµατισµού. Πολλοί έχουν εγκαταλείψει µια ιστοσελίδα γιατί έχουν βαρεθεί να περιµένουν το Flash να φορτωθεί. Άλλα το σηµαντικότερο µειονέκτηµα είναι ότι οι σελίδες αυτές είναι µη φιλικές ως προς το SEO. Οι µηχανές αναζήτησης δεν µπορούν να διαβάσουν τις σελίδες που είναι υλοποιηµένες σε Flash. Συµπερασµατικά, όταν στοχεύει κάποιος στη βελτιστοποίηση µιας ιστοσελίδας πρέπει οπωσδήποτε να αποφεύγει την υλοποίηση αποκλειστικά σε Flash (Full Flash Page). Η λύση είναι η προσθήκη κάποιων banners εντυπωσιασµού, υλοποιηµένα σε Flash µέσα στην υπόλοιπη σελίδα που θα έχει υλοποιηθεί σε κάποια άλλη γλώσσα προγραµµατισµού [14]. Dynamic ASP Οι περισσότερες ιστοσελίδες στο διαδίκτυο είναι στατικές (Static Web Pages). Αυτές οι ιστοσελίδες αλλάζουν µόνο από τον διαχειριστή τους. Οι υπόλοιπες σελίδες είναι δυναµικές (Dynamic Web Pages) δηλαδή αλλάζουν on line από τον χρήστη µε την βοήθεια ενός εργαλείου (Content Management Tool). Πολλές από τις δυναµικές ιστοσελίδες είναι υλοποιηµένες στην γλώσσα προγραµµατισµού ASP. Επειδή οι δυναµικές ιστοσελίδες δηµιουργούνται αυτόµατα από τον χρήστη και µέχρι τότε δεν υπάρχουν, µερικές φορές αυτό µπορεί να είναι εµπόδιο προς της µηχανές αναζήτησης. Παρόλα αυτά σε γενικές γραµµές οι σελίδες που είναι υλοποιηµένες σε ASP µπορούν να διαβαστούν. Συµπερασµατικά, µε την κατάλληλη υλοποίηση του εργαλείου και του site µπορεί κάποιος να πετύχει υψηλές αποδόσεις βελτιστοποίησης. Σηµαντικό είναι να αποφεύγονται τα έτοιµα εργαλεία µαζικής παραγωγής και να προτιµώνται λύσεις προσαρµοσµένες στις ανάγκες της κάθε ιστοσελίδα [14]. PHP Η PHP είναι ακόµα µια γλώσσα προγραµµατισµού που αντιµετωπίζει προβλήµατα µε τις µηχανές αναζήτησης. Οι Crawlers των µηχανών βλέπουν την PHP ιστοσελίδα σαν ένα εµπόδιο εάν δεν έχει υλοποιηθεί σωστά. Σωστή υλοποίηση σηµαίνει ότι όταν προγραµµατίζουµε πρέπει να έχουµε υπόψη το SEO. Για Βελτιστοποίηση για τις Μηχανές Αναζήτησης 73

75 Κεφάλαιο 4 παράδειγµα, η PHP από µόνη της σταµατάει ή καθυστερεί τους crawlers, αλλά µε την απαραίτητη προσοχή και πλήρη κατανόηση της γλώσσας και του SEO είναι πιθανή η δηµιουργία ιστοσελίδων που δουλεύουν για τις µηχανές. Συµπερασµατικά, η γλώσσα έχει κάποια προβλήµατα αλλά µε την βοήθεια ενός έµπειρου προγραµµατιστή µπορούν να ξεπεραστούν και να δηµιουργηθούν βελτιστοποιηµένες ιστοσελίδες [14]. Παράγοντες που βοηθούν: 1) Κατάλληλη χρήση κεφαλίδων Παλαιότερα οι µηχανές αναζήτησης επηρεάζονταν σηµαντικά από τους τίτλους. Κάτι τέτοιο δεν ισχύει σήµερα και οι κεφαλίδες (<h1>,<h2>...<h6> της HTML) έχουν µικρό µερίδιο όσον αφορά τη βελτιστοποίηση παρόλα αυτά όµως είναι σηµαντικοί καθώς βοηθούν στη δοµή µε το να κάνουν πιο αναγνώσιµα και εύχρηστα τα κείµενα για τους επισκέπτες των σελίδων. 2) Λέξεις κλειδιά και η θέση τους Οι όροι αναζήτησης (λέξεις-κλειδιά), µε τους οποίους επιθυµείτε να βρεθεί η ιστοσελίδα στα αποτελέσµατα των µηχανών αναζήτησης πρέπει φυσικά να υπάρχουν στο περιεχόµενο της ιστοσελίδας. Ανάλογα µε το τι λέξεις κλειδιά βρίσκονται στο περιεχόµενο του site, ανάλογη θα είναι η κίνηση (traffic) και το είδος των επισκεπτών του. Η δηµιουργία ποιοτικού, χρήσιµου περιεχοµένου έχει σαν αποτέλεσµα την αυτόµατη χρήση των απαραίτητων λέξεων-κλειδιών στον κορµό του κυρίως κειµένου της σελίδας (όσο πιο υψηλά στη σελίδα και καλύτερα), χωρίς ιδιαίτερη προσπάθεια. Παρόλα αυτά, κάντε ανάλυση των συχνών όρων αναζήτησης των χρηστών, χρησιµοποιείτε εναλλακτικούς τρόπους γραφής για έναν όρο ή συνώνυµους όρους κατά την συγγραφή και ελέγξτε την πυκνότητα (keyword density) και τη σωστή γειτνίαση 12 των λέξεων-κλειδιών των κειµένων σας. Αν είναι δυνατόν, χρησιµοποιήστε κατάλληλες λέξεις κλειδιά στον τίτλο, τις κεφαλίδες, στο όνοµα του δικτυακού τόπου (domain name), στην διεύθυνση URL, στα αρχεία των σελίδων και 12 Το πόσο κοντά θα βρίσκονται 2 ή περισσότερες από τις στοχευµένες φράσεις λέξεις-κλειδιά (keywords) µέσα στο κείµενο λαµβάνεται σοβαρά υπόψη από τις µηχανές αναζήτησης. Όσο πιο κοντά βρίσκονται οι λέξεις-κλειδιά (keywords) τόσο καλύτερα αποδίδουν στην κατάταξη. Αν µπορούν να βρίσκονται δίπλα µεταξύ τους, χωρίς να παρεµβάλετε άλλη λέξη είναι το ιδανικό του συντελεστή της γειτνίασης (proximity) Βελτιστοποίηση για τις Μηχανές Αναζήτησης 74

76 Κεφάλαιο 4 στα στοιχεία εναλλακτικού κειµένου (alt) και τίτλου εικόνων (γιατί υπάρχουν και µηχανές αναζήτησης εικόνων στο διαδίκτυο), περιορίζοντας τον αριθµό τους όµως τόσο, ώστε η ιστοσελίδα να παραµένει εύχρηστη και ευχάριστη για τον επισκέπτη. Η όσο το δυνατόν συχνότερη χρήση των λέξεων κλειδιών στο περιεχόµενο µιας ιστοσελίδας ή σε διάφορες σελίδες ενός δικτυακού τόπου δεν αποτελεί φυσικά δόγµα και έχει µόνο νόηµα εάν δεν γίνεται κουραστική για τον άνθρωπο-αναγνώστη. Αποφύγετε την αδόκιµη επανάληψη ορισµένων µόνο λέξεων ή φράσεων απλά και µόνο για να ικανοποιήσετε τις µηχανές αναζήτησης (µπορεί να θεωρηθούν σαν spam), έχοντας πάντα στο µυαλό σας ότι οι ιστοσελίδες δηµιουργούνται για ανθρώπους και όχι για µηχανές (κάτι τέτοιο όπως θα δούµε παρακάτω µπορεί να αποδειχθεί και µοιραίο). Οι λέξεις-κλειδιά δεν είναι ανάγκη να εµφανίζονται σε όλες τις σελίδες ενός ιστότοπου αλλά κυρίως εκεί που έχουν νόηµα για τον άνθρωποεπισκέπτη. Κάποια συχνά λάθη τα οποία παρατηρούνται και θα πρέπει να αποφεύγουµε είναι: η επιλογή µοναδικών λέξεων κλειδιών και όχι φράσεων αλλά και τους πολύ εξειδικευµένους και δηµοφιλείς όρους. 3) Πιο έντονη, πλάγια γραφή (Bold, Italic) Η σωστή χρήση των Bold και Italics γραµµατοσειρών παίζει κ αυτό µε την σειρά του βοηθητικό ρόλο όσον αφορά την βελτιστοποίηση µιας ιστοσελίδας. Αν θέλετε να δώσετε έµφαση σε ένα τµήµα του κειµένου και ειδικά στις λέξεις-κλειδιά, προτιµήστε να τις κάνετε Bold ή Italic. Οι µορφές αυτές, εκτός από τον τονισµό συντελούν βεβαίως και στην κατανόηση του κειµένου. Τι είναι το Keyword Density Το keyword density (ή «πυκνότητα λέξης-κλειδιού») είναι απλά µια ένδειξη του πλήθους των εµφανίσεων µιας συγκεκριµένης λέξης-κλειδιού στο περιεχόµενο µιας σελίδα. Πάντα εκφράζεται ως ένα ποσοστό (π.χ. 4%) επί του συνόλου των λέξεων της σελίδας. Πολλοί εκφράζουν την άποψη πως αποτελεί έναν βασικό παράγοντα όσον αφορά το SEO. Πώς να υπολογίσετε το keyword density των σελίδων σας ; Βελτιστοποίηση για τις Μηχανές Αναζήτησης 75

77 Κεφάλαιο 4 Για παράδειγµα, ας υποθέσουµε ότι κάποιος έχει µια σελίδα που περιέχει 100 λέξεις καθαρού κειµένου, δηλαδή χωρίς να συµπεριλαµβάνονται οι εντολές HTML και ότι έχει χρησιµοποιήσει µια συγκεκριµένη λέξη-κλειδί (keyword) 5 φορές στην σελίδα. Το keyword density υπολογίζεται αν διαιρέσουµε τον αριθµό των εµφανίσεων της συγκεκριµένης λέξης-κλειδί, δηλαδή το 5, µε τον συνολικό αριθµό των λέξεων της σελίδας, δηλαδή το 100. Άρα, το keyword density στο παράδειγµα µας είναι 5 / 100 = 0.05 ή σε µορφή ποσοστού 0.05 Χ 100 = 5% [52]. Οι επαγγελµατίες που ασχολούνται µε την βελτιστοποίηση των σελίδων για τις µηχανές αναζήτησης (SEO) έχουν προγράµµατα που υπολογίζουν αυτόµατα την πυκνότητα όλων των λέξεων-κλειδιών (keywords) για όλες τις σελίδες ενός δικτυακού τόπου. Αν κάποιος θέλει να ελέγξει µόνος του το keyword density για µια σελίδα µπορεί είτε να χρησιµοποιήσει κάποια από τα ελεύθερα εργαλεία που υπάρχουν στο διαδίκτυο είτε να χρησιµοποιήσει το Word. Για τον έλεγχο του keyword density µε το Word [52]: Αντιγράψτε ολόκληρο το περιεχόµενο µιας σελίδας στο Word. Από το µενού Εργαλεία επιλέξτε Καταµέτρηση Λέξεων. Σηµειώστε τον συνολικό αριθµό των λέξεων στην σελίδα. Από το µενού Επεξεργασία επιλέξτε Αντικατάσταση. Συµπληρώστε στο πεδίο Εύρεση του την λέξη-κλειδί και στο πεδίο Αντικατάσταση µε την λέξη-κλειδί (ώστε να µην αλλάξει το περιεχόµενο της σελίδας). Πατήστε το πλήκτρο Αντικατάσταση όλων και σηµειώστε τον αριθµό των αντικαταστάσεων που έγιναν. ιαιρέστε τον αριθµό των αντικαταστάσεων µε τον αριθµό των λέξεων που είχατε βρει νωρίτερα και έχετε υπολογίσει το keyword density. Όπως αναφέρθηκε και προηγουµένως, ιδιαίτερη προσοχή χρειάζεται στην υπερβολή. Αν επαναλαµβάνει κάποιος συνεχώς τις λέξεις-κλειδιά (τα keywords) στο κείµενο µιας σελίδας, το πιθανότερο είναι ότι οι µηχανές αναζήτησης θα θεωρήσουν ότι ο συγκεκριµένος δικτυακός τόπος δεν είναι πραγµατικός αλλά spam site και θα τον αφαιρέσουν εντελώς από τους καταλόγους τους. Κάποιοι ισχυρίζονται ότι το keyword density επιτρέπεται να φθάσει και το 10%. Ασφαλέστερο όµως είναι, να κινείται ανάµεσα στο 3% και στο 5%. Για 2-3 στοχευµένες φράσεις λέξεις-κλειδιά Βελτιστοποίηση για τις Μηχανές Αναζήτησης 76

78 Κεφάλαιο 4 (keywords) ιδανική αναλογία είναι 6-7% και για τις δευτερεύουσες συναφείς λέξειςκλειδιά (keywords) 1-2%. Αυτός ο κανόνας θα πρέπει να εφαρµόζεται σε όλες τις σελίδες ενός δικτυακού τόπου και για όλες τις λέξεις-κλειδιά. 4) Λογική, έγκυρη χρήση των µεταδεδοµένων Τα µεταδεδοµένα όπως είδαµε και στο πρώτο κεφάλαιο είναι πληροφοριακά δεδοµένα για άλλα δεδοµένα. Λόγω της εκτεταµένης ασυνεπούς χρήσης των µεταδεδοµένων τα προηγούµενα χρόνια από πολλούς δηµιουργούς ιστοσελίδων, οι µηχανές αναζήτησης τείνουν να µην τα λαµβάνουν υπόψη, µε αποτέλεσµα τον τελευταίο καιρό οι δηµιουργοί ιστοσελίδων είτε να τα αγνοούν, θεωρώντας τα άχρηστα ή να µην τα χρησιµοποιούν σκοπίµως, θεωρώντας τα επικίνδυνα για την κατάταξη στις µηχανές αναζήτησης. Κι όµως τα µεταδεδοµένα µπορούν να είναι πολύ χρήσιµα για τις µηχανές αναζήτησης, αν έχουν δηµιουργηθεί για να περιγράψουν το πραγµατικό περιεχόµενο της ιστοσελίδας. Η συνεχής εξέλιξη των αλγορίθµων ελέγχου των µηχανών αναζήτησης σε συνδυασµό µε την πιθανή µελλοντική στροφή του διαδικτύου στην σηµασιολογία (semantic web, Web 3.0) θα µετατρέψουν τα λογικά, έγκυρα µεταδεδοµένα σε βασικό εργαλείο του νέου παγκόσµιου ιστού. Οι µηχανές αναζήτησης όχι µόνο δεν θα τιµωρούν αλλά θα επιβραβεύουν την χρήση τους. 5) Συνάφεια µεταξύ των στοιχείων της ιστοσελίδας Η βελτιστοποίηση µίας ιστοσελίδας για τις µηχανές αναζήτησης µπορεί να επιτευχθεί στο σύνολό της µόνο αν τα επιµέρους στοιχεία της παρουσιάζουν συνάφεια µεταξύ τους. Ο τίτλος, οι κεφαλίδες, το κυρίως περιεχόµενο και τα µεταδεδοµένα της σελίδας πρέπει να έχουν άµεση, λογική σχέση µεταξύ τους, ειδάλλως οδηγούν σε σύγχυση τόσο τους χρήστες όσο και τις µηχανές αναζήτησης. Εκτός ιστοσελίδας (off-page) παράγοντες κατάταξης Έως τα τέλη του 20 ου αιώνα οι µηχανές αναζήτησης ταξινοµούσαν τις ιστοσελίδες µε βάση αποκλειστικά το περιεχόµενο τους. Η κατάσταση αυτή άλλαξε µετά τον Βελτιστοποίηση για τις Μηχανές Αναζήτησης 77

79 Κεφάλαιο 4 θρίαµβο της Google. Οι αλγόριθµοι της Google βασίζονται όχι µόνο στο περιεχόµενο των websites αλλά και στην δηµοτικότητα των συνδέσµων. Οι σύνδεσµοι από άλλες ιστοσελίδες έχουν εξαιρετική σηµασία και αποτελούν βασική προϋπόθεση για την εύρεση της ιστοσελίδας από της µηχανές αναζήτησης αλλά και από τους χρήστες του διαδικτύου, µια και οι δύο µπορούν να ακολουθήσουν τους συνδέσµους αυτούς. Πολλές µηχανές αναζήτησης έχουν δηµιουργήσει ειδικούς αλγόριθµους (όπως για παράδειγµα το Google PageRank), οι οποίοι αξιολογούν το πόσο σηµαντική είναι µία ιστοσελίδα, ανάλογα και µε τους συνδέσµους που υπάρχουν σε αυτήν από άλλες σχετικές ιστοσελίδες. Επίσης εάν ένα πολύ σηµαντικό και δηµοφιλές site έχει link προς τη δική σας ιστοσελίδα, αυτό προσδίδει κύρος, µεγαλύτερη σηµασία και βάρος στην ιστοσελίδα σας και µετράει θετικά, περισσότερο ακόµα και αν υπάρχουν link σε 10 «όχι σηµαντικά site». Εποµένως να συµπληρώσουµε, ότι ρόλο δεν παίζει µόνο η ποσότητα των links αλλά και η ποιότητα τους. Αξίζει να σηµειωθεί ότι websites µε καταλήξεις όπως.edu ή.gov θεωρούνται πιο ποιοτικές. Στις µέρες µας είναι πιθανό µια σελίδα να ταξινοµηθεί για µία λέξη ακόµα και αν αυτή η λέξη δεν περιέχεται καθόλου στο κείµενο της σελίδας. Είναι περιττό να πούµε πως, οι συγκεκριµένοι παράγοντες χρειάζονται την ίδια προσοχή και είναι απαραίτητοι και αλληλένδετοι µε την προηγούµενη κατηγορία. Σηµαντικοί παράγοντες: 1) Ο αριθµός των συνδέσµων που κατευθύνονται προς µια σελίδα (inbound links). Είναι γεγονός πως ένα καλό site αποκτά από µόνο του αρκετούς και ποιοτικούς εισερχόµενους συνδέσµους. Υπάρχουν όµως και άλλοι διαφορετικοί τρόποι που χρησιµοποιούν οι δηµιουργοί ιστοσελίδων για την απόκτηση συνδέσµων και είναι: Το γράψιµο και η καταχώρηση άρθρων Η ανταλλαγή άρθρων µε άλλους δικτυακούς τόπους Η καταχώρηση ενός δικτυακού τόπου σε καταλόγους Η καταχώρηση ενός δικτυακού τόπου σε forum Η καταχώρηση ενός δικτυακού τόπου σε blogs Η ανταλλαγή συνδέσεων (link exchange) µε άλλους δικτυακούς τόπους Η δηµιουργία video που µπορούν να χρησιµοποιήσουν και άλλοι Βελτιστοποίηση για τις Μηχανές Αναζήτησης 78

80 Κεφάλαιο 4 Η δηµιουργία δελτίων τύπου Η αγορά συνδέσεων από άλλους δικτυακούς τόπους 2) Σύνδεσµοι από ιστοσελίδες µε σχετικό περιεχόµενο Είναι ιδιαίτερα σηµαντικό, οι σύνδεσµοι σας να προέρχονται από ιστοσελίδες µε σχετικό περιεχόµενο, αφού ένας σύνδεσµος σε άσχετο περιεχόµενο δεν έχει και πολύ νόηµα για τον χρήστη του διαδικτύου. Ακριβώς σε αυτό βασίζονται και οι µηχανές αναζήτησης, οι οποίες έχουν γίνει αρκετά έξυπνες, ώστε να αναγνωρίζουν τους συνδέσµους από σχετικό περιεχόµενο και να αγνοούν εκείνους από άσχετο. Οι σύνδεσµοι από µία συναφή µε το θέµα ιστοσελίδα, αξιολογούνται ως σηµαντικότεροι. Αποφύγετε συνδέσµους από σελίδες µε παράνοµο ή ανήθικο περιεχόµενο. Πολλοί σύνδεσµοι από άλλες ιστοσελίδες µε σχετικό περιεχόµενο έχουν σαν αποτέλεσµα όχι µόνο την αυτόµατη καταχώρηση µιας ιστοσελίδας στις µηχανές αναζήτησης αλλά και την ταυτόχρονη αύξηση της επισκεψιµότητας της ιστοσελίδας, που αποτελεί και τον κύριο στόχο. 3) Σύνδεσµοι προς άλλες σχετικές ιστοσελίδες (external links) Όχι µόνο οι σύνδεσµοι από αλλά και αυτοί προς άλλες σχετικές ιστοσελίδες αποτελούν βασικό παράγοντα βελτιστοποίησης µιας ιστοσελίδας για τις µηχανές αναζήτησης, κάτι που ίσως δεν είναι ευρέως γνωστό. Οι µηχανές αναζήτησης φαίνεται ότι αξιολογούν τόσο τον αριθµό όσο και την ποιότητα των συνδέσµων µίας σελίδας προς σελίδες άλλων δικτυακών τόπων µε σχετικό, χρήσιµο περιεχόµενο. Η κατάλληλη δηµιουργία συνδέσµων µπορεί λοιπόν να συµβάλλει θετικά στην βελτιστοποίηση ειδικά νέων ιστοσελίδων. 4) Κείµενο/περιγραφή που εµφανίζεται σε µία σύνδεση προς µια ιστοσελίδα (anchor text) Αποφύγετε να βάζετε το ίδιο κείµενο σε όλους τους συνδέσµους. Χρησιµοποιείστε συνώνυµα, παραφράσεις, διαφορετικές λέξεις κλειδιά κτλ. Προσθέστε τα σηµαντικά keywords στην αρχή του anchor text. 5) Σελίδες υποδοχής (landing pages) Βελτιστοποίηση για τις Μηχανές Αναζήτησης 79

81 Κεφάλαιο 4 Πρόκειται για την συγκεκριµένη ιστοσελίδα στην οποία θα φτάσει τελικά ένας χρήστης που επιλέγει να επισκεφθεί µια καταχώριση που εµφανίζεται στα αποτελέσµατα µιας αναζήτησης ή ενός διαφηµιστικού της µορφής Paid Search. Οι landing pages παίζουν καθοριστικό ρόλο στην αποτελεσµατικότητα κάθε διαφηµιστικής και προωθητικής προσπάθειας, γι αυτό και οι marketers προσπαθούν συνεχώς να βελτιώσουν το conversion rate 13 δοκιµάζοντας διάφορους συνδυασµούς στο δηµιουργικό, το διαφηµιστικό κείµενο και την πλοήγηση που περιλαµβάνεται στις ιστοσελίδες αυτές. 6) PageRank Το PR ενός δικτυακού τόπου που έχει σύνδεσµο προς τον δικτυακό τόπο ενός χρήστη, δίνει µια προσέγγιση για την αξία του συγκεκριµένου συνδέσµου και φυσικά µπορεί να ανεβάσει και το δείκτη ταξινόµησης του ιστότοπου του χρήστη. Το SEO και το Page Rank είναι άρρηκτα συνδεδεµένα εφόσον το Google είναι η πλέον δηµοφιλής µηχανή αναζήτησης. Για να µπορέσετε να είστε σίγουροι ότι οι προσπάθεια προβολής σας στο Internet έχει πιάσει τόπο πρέπει να δείτε το PageRank της σελίδας σας να αυξάνεται µε τον καιρό. Τότε θα ξέρετε ότι έχετε µια πολύ καλά «στηµένη» ιστοσελίδα, που προσελκύει το ενδιαφέρον των χρηστών και έχει αξιολογηθεί θετικά από τις µηχανές αναζήτησης. Παράγοντες που βοηθούν: 1) Κατάλογοι Web και όχι µόνο Η στρατηγική συστηµατικής δηµιουργίας συνδέσµων από άλλες ιστοσελίδες πρέπει να είναι βασική προτεραιότητα για κάθε διαχειριστή δικτυακού τόπου. Μια καλή αρχή είναι σίγουρα η χωρίς χρέωση καταχώρηση της ιστοσελιδας σε θεµατικούς καταλόγους (directories), όπως το Open Directory Project ή η δηµιουργία και ο εµπλουτισµός σχετικών µε την ιστοσελίδα θεµάτων στην online εγκυκλοπαίδεια 13 Το ποσοστό των επισκεπτών ενός ιστότοπου που επιλέγουν να πραγµατοποιήσουν µια προκαθορισµένη ενέργεια όπως την συµπλήρωση µιας φόρµας, την πραγµατοποίηση µιας αγοράς σε σχέση µε το συνολικό αριθµό των επισκεπτών του ιστότοπου αυτού. Έτσι εάν υποθέσουµε ότι 100 άτοµα επισκέφθηκαν ένα ηλεκτρονικό κατάστηµα και 10 από αυτά πραγµατοποίησαν µια αγορά τότε το ηλεκτρονικό αυτό κατάστηµα έχει 10 % conversion rate. Το µέγεθος αυτό αποτελεί ένα από τα σηµαντικότερα κριτήρια αποτελεσµατικότητας για έναν ιστότοπο. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 80

82 Κεφάλαιο 4 Βικιπαίδεια µε αναφορά/σύνδεσµο προς την ιστοσελίδα για περαιτέρω ενηµέρωση. Κατάλογοι όπως ο Dmoz διαδραµατίζουν σηµαντικό ρόλο στην παροχή επιπλέον κύρους και βαρύτητας σε έναν δικτυακό τόπο διότι όλες οι µεγάλες µηχανές αναζήτησης θεωρούν τις λίστες των καταλόγων αυτών ως κριτήριο για την κατάταξη των αποτελεσµάτων. 2) Ηλικία του περιεχοµένου και domain name age Οι µηχανές αναζήτησης µάλλον αναλύουν και την ηλικία µίας ιστοσελίδας καθώς και των συνδέσµων προς αυτή, δηλαδή λαµβάνουν υπόψη τον χρόνο, κατά τον οποίο ένα συγκεκριµένο περιεχόµενο βρίσκεται ήδη στο διαδίκτυο. Με βάση αυτόν τον σίγουρα αµφιλεγόµενο παράγοντα, οι µηχανές τείνουν να θεωρούν παλιότερα περιεχόµενα σαν πιο ασφαλή και χρήσιµα, κάτι που σίγουρα δεν ισχύει όλες τις φορές. Όπως και να 'χουν τα πράγµατα, προσπαθείτε να διατηρείτε σταθερή την διεύθυνση URL οποιασδήποτε σελίδας δηµοσιεύετε στον παγκόσµιο ιστό. 3) Χρήση των εργαλείων για διαχειριστές ιστοσελίδων (webmasters) Οι µεγαλύτερες µηχανές αναζήτησης παρέχουν πλέον την δυνατότητα στους διαχειριστές ιστοσελίδων όχι µόνο να καταχωρούν αλλά και να διαχειρίζονται την καταχώρηση των ιστοσελίδων τους µέσω κάποιων εργαλείων που συνήθως βρίσκονται online και απαιτούν την εγγραφή του διαχειριστή. Τα εργαλεία αυτά επιτρέπουν την ανταλλαγή πληροφοριών ανάµεσα στην µηχανή αναζήτησης και τον διαχειριστή όσον αφορά την ιστοσελίδα και σίγουρα ευνοούν την κατάταξή της στο εσωτερικό ευρετήριο της κάθε µηχανής. Τα εργαλεία παρακολούθησης της πορείας της ιστοσελίδας, όπως είναι τα στατιστικά που µας παρέχει η φιλοξενία της ιστοσελίδας αλλά και η υπηρεσία Google Analytics (που είδαµε στο προηγούµενο κεφάλαιο), µας επιτρέπουν την καταγραφή και αξιολόγηση των αποτελεσµάτων για ένα επιτυχηµένο online marketing. Τα εργαλεία για διαχειριστές ιστοσελίδων των βασικών µηχανών αναζήτησης είναι: Google: Yahoo: https://siteexplorer.search.yahoo.com/ Bing (Microsoft): Βελτιστοποίηση για τις Μηχανές Αναζήτησης 81

83 Κεφάλαιο 4 4) Ανταλλαγή links / Χρήση αµοιβαίων συνδέσµων (reciprocal linking) Είναι γνωστή ως τεχνική ανταποδοτικών δεσµών. Η ανταλλαγή αυτή των συνδέσεων µεταξύ δύο δικτυακών τόπων αυξάνει τον αριθµό των ποιοτικών εισερχοµένων συνδέσµων µε άµεσο αντίκρισµα την άνοδο του pagerank. 5) Ιστοσελίδες κοινωνικής δικτύωσης Τέτοιες κοινότητες χρηστών µε πολλαπλά θεµατικά πεδία είναι πλέον πολύ διαδεδοµένες και επιπλέον πολύ χρήσιµες για την δηµιουργία υψηλής επισκεψιµότητας-συνδέσεις. Θα αναφερθούµε εκτενώς στο θέµα παρακάτω στο κεφάλαιο. Παράγοντες που επηρεάζουν αρνητικά την κατάταξη: Εκτός από τους παράγοντες και τεχνικές που βοηθούν στην κατάταξη ενός site στις µηχανές αναζήτησης όπως είδαµε παραπάνω, από την άλλη πλευρά υπάρχουν και χαρακτηριστικά που είναι ανούσια ή µπορούν ακόµη και να βλάψουν µια προσπάθεια για βελτιστοποίηση έως το σηµείο να αποκλείσουν εντελώς µια σελίδα από τις µηχανές αναζήτησης. Χαρακτηριστικά όπως τα Meta Keywords, δυναµικές ή στατικές ιστοσελίδες δεν παίζουν κανένα απολύτως ρόλο στην κατάταξη. Επίσης, παράγοντες που µπορούν να χαρακτηριστούν ως επιβλαβείς είναι: 1) Υπερβολική χρήση λέξεων κλειδιά Όπως αναφέρεται παραπάνω, η τοποθέτηση λέξεων/κλειδιών σε µία ιστοσελίδα και στα µεταδεδοµένα της πρέπει να γίνεται συστηµατικά και χωρίς υπερβολές καθώς και να αντικατοπτρίζει το πραγµατικό περιεχόµενο/στόχο της σελίδας. Σε διαφορετική περίπτωση, οι µηχανές µπορεί να τιµωρήσουν τον δικτυακό τόπο, αποκλείοντας τον από τα αποτελέσµατά τους (keyword spamming / stuffing). 2) Παραπλανητικές τεχνικές σχεδιασµού όπως τα αποκαλούµενα «cloaking» ή «doorway pages». Βελτιστοποίηση για τις Μηχανές Αναζήτησης 82

84 Κεφάλαιο 4 Το Cloaking, είναι µια τεχνική βελτιστοποίησης της θέσης κατάταξης στα αποτελέσµατα των µηχανών αναζήτησης, µε την οποία το περιεχόµενο που παρουσιάζεται στη µηχανή αναζήτησης είναι διαφορετικό από εκείνο που παρουσιάσετε στην απλή επίσκεψη των «web surfers». Όταν ένας χρήστης χαρακτηρισθεί ως µια µηχανή αναζήτησης αράχνη, ένα script παραδίδει µια διαφορετική εκδοχή της ιστοσελίδας, η οποία περιέχει ένα περιεχόµενο που δεν είναι ορατό στη µορφή της σελίδας που βλέπουν οι επισκέπτες. Στις µηχανές αναζήτησης δεν αρέσει η τεχνική της απόκρυψης επειδή ο σκοπός της είναι να εξαπατήσει τις µηχανές αναζήτησης. Αν το Google εντοπίσει ότι ένας δικτυακός τόπος χρησιµοποιεί απόκρυψη, θα καταργήσει οριστικά την ιστοσελίδα από το ευρετήριο. Doorway page είναι η ιστοσελίδα που δηµιουργείται µε αποκλειστικό σκοπό την όσο το δυνατόν καλύτερη κατάταξη στα φυσικά αποτελέσµατα των µηχανών αναζήτησης και η οποία από µόνη της δεν παρέχει αξιόλογες πληροφορίες σε όσους την επισκέπτονται. Συνήθως οι ιστοσελίδες αυτής της µορφής καθοδηγούν ή παρασύρουν τους επισκέπτες σε άλλες ιστοσελίδες πολλές φορές µε αυτόµατο µηχανικό τρόπο π.χ. προωθώντας τους σε άλλες ιστοσελίδες µέσα σε κλάσµατα δευτερολέπτων. Σε ορισµένες περιπτώσεις, όταν γίνεται συνδυασµός µε την τεχνική του cloaking, oι επισκέπτες ενδέχεται να µην αντιληφθούν ποτέ την παρουσία των doorway pages. Μερικά από τα ονόµατα που χρησιµοποιούνται για τις ιστοσελίδες αυτές είναι Bridge Pages, Gateway Pages και Jump Pages. 3) Άχρηστες-µη υπαρκτές σελίδες Άλλος ένας παράγοντας που επηρεάζει αρνητικά την κατάταξη µιας ιστοσελίδας στις µηχανές αναζήτησης. Ιστοσελίδες που δεν υπάρχουν ή είναι χωρίς νόηµα υπολογίζονται και βαθµολογούνται αρνητικά από αυτές. 4) Πανοµοιότυπο περιεχόµενο (duplicate content) Η αντιγραφή και η αναδηµοσίευση του ίδιου ή πολύ παροµοίου περιεχοµένου άλλων ιστοσελίδων, το οποίο έχει ήδη καταχωρηθεί στις µηχανές αναζήτησης, σίγουρα δεν κρίνεται ιδιαίτερα χρήσιµη πρακτική από τις µηχανές και σε πολλές περιπτώσεις το µεταγενέστερο περιεχόµενο δεν εµφανίζεται καν στα αποτελέσµατα. Να σηµειωθεί πως οι µηχανές αναζήτησης δεν ταξινοµούν ολόκληρους δικτυακούς τόπους αλλά ξεχωριστές ιστοσελίδες. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 83

85 Κεφάλαιο 4 5) Κρυµµένο κείµενο / αόρατοι-λανθασµένοι σύνδεσµοι (ή που δεν οδηγούν πουθενά) Σηµαντικό ρόλο στην αξιοπιστία µιας ιστοσελίδας απέναντι στις µηχανές αναζήτησης αλλά και στους επισκέπτες της, είναι η λειτουργία των συνδέσµων της. Πολλοί κατεστραµµένοι σύνδεσµοι που οδηγούν σε δικτυακούς τόπους που έχουν κλείσει ή είναι λανθασµένοι, προκαλούν την αγανάκτηση των επισκεπτών αλλά και την επιβολή ποινών από τις µηχανές αναζήτησης. 6) Χρήση περιεχοµένου σε πολυµέσα, εικόνες ή µέσω ειδικών τεχνικών, χωρίς αντίστοιχο εναλλακτικό κείµενο, αρχεία javascript και flash. Όπως αναφερθήκαµε και νωρίτερα στο κεφάλαιο, στοιχεία και γλώσσες όπως είναι το flash ή τα javascript στη πλειονότητα τους δεν είναι φιλικά προς το SEO. Και αυτό διότι οι crawlers των µηχανών αναζήτησης έχουν µεγάλο πρόβληµα στην ανάγνωση τέτοιων ιστοσελίδων. 7) Παραπλανητικές τεχνικές δηµιουργίας συνδέσµων Αφορά διάφορες τεχνικές, που περιγράφονται µε τον αγγλικό όρο Link Spamming. Όπως για παράδειγµα το: "splogs 14 ", αυτοµατοποιηµένες καταχωρήσεις και σχόλια σε καταλόγους, ιστολόγια και βιβλία επισκεπτών, υπερβολικό reciprocal linking, σύνδεσµοι από ιστοσελίδες µε εντελώς άσχετο περιεχόµενο και στόχο, µη οµαλή αναλογία συνδέσµων/κειµένου κτλ. Τέλος, αξίζει να αναφέρουµε συνοπτικά τους παράγοντες που είναι πιθανόν να είναι υπαίτιοι µιας απώλειας των ήδη υψηλών θέσεων σας στις µηχανές αναζήτησης και είναι: - Απώλειες λόγου υψηλού ανταγωνισµού - Εισερχόµενοι σύνδεσµοι από άλλα site που φιλτραρίστηκαν και έχασαν την αξία και τη ποιότητα τους - ηµιουργία νέων αλγόριθµων ταξινόµησης µε νέα δεδοµένα 14 Προέρχεται από τον συνδυασµό των λέξεων "spam" (= ψεύτικο & επίβουλο) και "logs" (=καταχώρηση). Πρόκειται για ψεύτικα ιστολόγια (blogs) που δηµιουργούνται µε σκοπό την προσέλκυση χρηστών - υποψήφιων θυµάτων. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 84

86 Κεφάλαιο 4 - Εσωτερικά προβλήµατα της σελίδας (π.χ. προβλήµατα εξαιτίας νέου domain) - Ποινή ή ακόµα και οριστικός αποκλεισµός από τις µηχανές αναζήτησης Εικόνα 18: Παράγοντες βελτιστοποίησης on/off page (Πηγή: hermesmyth.com) Στρατηγικές Αν ρωτήσετε 10 ειδικούς στο SEO να σας απαριθµήσουν τις βασικότερες συµβουλές που πρέπει να ακολουθήσετε, το πιθανότερο είναι να καταλήξετε µε 10 διαφορετικές λίστες. Υπάρχουν όµως µερικές βασικές συµβουλές, για τις οποίες όλοι οι ειδικοί SEO συµφωνούν. Θα πρέπει όπως είπαµε, να υπάρχει συνδυασµός των παραπάνω παραγόντων εσωτερικών και µη και όχι κάποια προτίµηση στο περιεχόµενο ή στο «χτίσιµο» συνδέσµων. Το search engine optimization ξεκινάει από τη στιγµή που ξεκινάει και η σχεδίαση της ιστοσελίδας. Κάθε βήµα υλοποίησης πρέπει να δηµιουργείται υπό το πρίσµα του seo. Γι αυτό το λόγο πρέπει όλα τα µέλη µιας οµάδας υλοποίησης µιας ιστοσελίδας να συνεργάζονται αρµονικά υπό την επίβλεψη ειδικών του seo. Όσο πιο καλή συνεργασία και βελτιστοποίηση υπάρχει εξ Βελτιστοποίηση για τις Μηχανές Αναζήτησης 85

87 Κεφάλαιο 4 αρχής, τόσο µεγαλώνει το πλεονέκτηµα έναντι του ανταγωνισµού σε θέµατα κατάταξης στις µηχανές αναζήτησης. Τα πάντα ξεκινούν από το web design. Το web design που θα ακολουθήσετε πρέπει να είναι βελτιστοποιηµένο προς δύο κατευθύνσεις, τον άνθρωπο και τις µηχανές αναζήτησης. εν είναι σωστό να προηγείται η δηµοσιοποίηση µιας ιστοσελίδας στο διαδίκτυο και κατόπιν να ενδιαφέρει η βελτιστοποίηση και η προώθηση της σε µηχανές αναζήτησης. Η διαδικασία του Search Engine Optimization ξεκινάει µε την καταγραφή της υπάρχουσας κατάστασης στις δηµοφιλέστερες µηχανές αναζήτησης όσον αφορά στην κατάταξη της ιστοσελίδας σας. Το πρώτο στοιχείο ανάλυσης για να ξεκινήσει η βελτιστοποίηση ενός δικτυακού τόπου στις µηχανές αναζήτησης και αφού προηγουµένως έχουν οροθετηθεί οι στόχοι, το θέµα και το target group, είναι το keyword research δηλαδή η έρευνα, διαπίστωση και ανάλυση για το ποιες λέξεις κλειδιά (keywords) ταιριάζουν στο θέµα του εκάστοτε ιστοχώρου. Το καλό SEO ξεκινάει µε µια συντονισµένη και στοχευµένη έρευνα. Με βάση αυτή την έρευνα θα επιλέγουν τα κατάλληλα keywords έτσι ώστε να προσελκύσει ένα στοχευµένο traffic στον δικτυακό τόπο και το κοινό να µπορεί να εντοπίζει την ιστοσελίδα χωρίς µεγάλη προσπάθεια. Στη συνέχεια προχωρώντας γίνετε ανάλυση του ανταγωνισµού (δηλαδή Competition Analysis) πάνω στις λέξεις κλειδιά που έχετε προηγούµενα συλλέξει έτσι ώστε να επιλεγούν οι κατάλληλες λέξεις αλλά µε τον µικρότερο δυνατό ανταγωνισµό από άλλους δικτυακούς τόπους. Επίσης, στοχοποιείται η χρήση των µεταδεδοµένων (metatags) της ιστοσελίδας έτσι ώστε να πληρούν τους όρους που θέτει κυρίως το Google και οι άλλες µηχανές, αλλά και να υποβοηθήσουν αποτελεσµατικά την ιστοσελίδα. Είναι σηµαντικό να προσφέρονται σηµαντικές και καθαρές πληροφορίες, ένα ποιοτικό, εύχρηστο (πλήρης εσωτερική διασύνδεση) προορισµένο για ανθρώπους περιεχόµενο, έτσι ώστε οι χρήστες να εντοπίζουν αυτό που θέλουν. Ενώ πολλά από τα κριτήρια αξιολόγησης των µηχανών αναζήτησης µπορούν να ικανοποιηθούν µε προσεχτική διαχείριση του περιεχοµένου (π.χ όγκος πληροφοριών, συχνότητα λέξεων κλειδιών, κλπ) κάποια άλλα όπως οι συνδέσεις από άλλους δικτυακούς τόπους δεν είναι και τόσο εύκολο να επιτευχθούν. Επόµενο στάδιο του SEO είναι η υποβολή ενός δικτυακού τόπου σε µεγάλες µηχανές αναζήτησης (Google, Yahoo, Bing) και καταλόγους (directories) και ο έλεγχος της δηµοτικότητας των υπερσυνδέσµων (link popularity). Ο δικτυακός τόπος θα πρέπει να υποβάλετε και να καταχωρείτε σε µια σειρά µηχανών αναζήτησης και καταλόγων, καθώς αυτό εξασφαλίζει την ορθή και τακτική ευρετηρίαση (indexing) Βελτιστοποίηση για τις Μηχανές Αναζήτησης 86

88 Κεφάλαιο 4 ενός ιστότοπου, έτσι ώστε όλες οι σηµαντικές σελίδες να καταχωρηθούν στη βάση δεδοµένων των µεγάλων µηχανών αναζήτησης. Η καταχώρηση στους διάφορους θεµατικούς καταλόγους και τις µηχανές αναζήτησης γίνεται χειροκίνητα και όχι αυτοµατοποιηµένα για να αποφευχθεί η κατηγοριοποίηση της ιστοσελίδας ως "spam" καθώς πλέον οι µηχανές αναζήτησης έχουν τους κατάλληλους µηχανισµούς για να προστατεύονται από τυχόν µαζικές διαφηµιστικές καταχωρήσεις. Τελευταίο βήµα αλλά και πολύ σηµαντικό για την διατήρηση ενός δικτυακού τόπου µόνιµα σε υψηλές θέσεις κατάταξης των µηχανών αναζήτησης αλλά και η περαιτέρω βελτίωση αυτού, είναι η µηνιαία παρακολούθηση του και οι αναφορές (Reporting). Οι αλγόριθµοι των µηχανών αναζήτησης διαρκώς µεταβάλλονται και εξελίσσονται, συνεπώς είναι απαραίτητη η διαρκής παρακολούθηση και η υποστήριξη του SEO του δικτυακού τόπου. Η παρακολούθηση ενός ιστότοπου µετά την διαδικασία της βελτιστοποίησης είναι σηµαντικό κοµµάτι της όλης τεχνικής φροντίδας, για µακρόχρονη παραµονή σε υψηλές θέσεις, των οργανικών αποτελεσµάτων των µηχανών αναζήτησης. Το καλό SEO θα αυξήσει την ωφέλιµη επισκεψιµότητα µε αποτέλεσµα να αυξηθεί η κατάταξη στις µηχανές αναζήτησης και στο τέλος να αυξηθούν και τα κέρδη της επιχείρησης. Εικόνα 19: Η πυραµίδα της βελτιστοποίησης (πηγή: Seomoz.org) Βελτιστοποίηση για τις Μηχανές Αναζήτησης 87

89 Κεφάλαιο 4 Επίλογος Συµπεράσµατα Πολλές εταιρείες ισχυρίζονται πως µε ένα συγκεκριµένο ποσό µπορούν να εγγυηθούν την πρώτη θέση στα αποτελέσµατα των µηχανών αναζήτησης για όποιες λέξεις κλειδιά επιθυµεί ο πελάτης, ανεξαρτήτως του πόσο ανταγωνιστική είναι η αγορά γύρω από αυτές τις λέξεις κλειδιά. Κάτι τέτοιο όµως φυσικά και δεν ισχύει και οι παρακάτω λόγοι ενισχύουν την άποψη αυτή: 1) Κανείς δεν µπορεί να εγγυηθεί τίποτα για τις µηχανές αναζήτησης εκτός από τις ίδιες τις µηχανές αναζήτησης. Υπάρχουν πράγµατα που µπορεί να γίνουν για να βελτιωθεί ο τρόπος µε τον οποίο βλέπουν οι µηχανές αναζήτησης έναν δικτυακό τόπο. Όµως, οι µηχανές αναζήτησης λαµβάνουν υπόψη τους τόσες πολλές παραµέτρους που είναι πρακτικά αδύνατον να τις λάβεις όλες υπόψη σου. Άλλωστε, είναι επτασφράγιστο µυστικό ο ακριβής αλγόριθµος µε τον οποίο η κάθε µηχανή αναζήτησης επιλέγει τις σελίδες που εµφανίζει στα αποτελέσµατα της [52]. 2) Η βελτιστοποίηση για τις µηχανές αναζήτησης (Search Engine Optimization) είναι µια µακρόχρονη και δύσκολη διαδικασία. Μερικές φορές είναι πιθανό τα αποτελέσµατα να είναι πολύ γρήγορα. Τις περισσότερες φορές όµως, χρειάζονται µήνες για να δείτε αποτελέσµατα ιδιαίτερα σε λέξεις κλειδιά που η αγορά είναι ανταγωνιστική, δηλαδή υπάρχουν πάρα πολλοί δικτυακοί τόποι που ανταγωνίζονται για την πρώτη θέση στα αποτελέσµατα των µηχανών αναζήτησης. Υπάρχουν εταιρείες που δαπανούν ετησίως εκατοµµύρια ευρώ σε µάρκετινγκ και προώθηση για να είναι πρώτες στα αποτελέσµατα. Είναι λογικό να υποθέσει κανείς ότι µε µερικές χιλιάδες ευρώ (όπως υπόσχονται κάποιες εταιρείες) θα καταφέρει να ξεπεράσει τους «µεγάλους παίκτες» που δαπανούν εκατοµµύρια [52]; 3) Όπως είπαµε και παραπάνω, οι µηχανές αναζήτησης χρησιµοποιούν αλγόριθµους που λαµβάνουν υπόψη δεκάδες ή και εκατοντάδες διαφορετικές παραµέτρους για να υπολογίσουν την σειρά κατάταξης των δικτυακών τόπων στα αποτελέσµατα τους. Υπάρχουν τρόποι για να ξεγελάσει κανείς τις µηχανές αναζήτησης και να «βελτιωθούν» ορισµένες παράµετροι, παραβλέποντας τους κανόνες καλής συµπεριφοράς που θέτουν οι µηχανές αναζήτησης. Ο κίνδυνος εδώ είναι να αντιληφθούν οι µηχανές αναζήτησης ότι έχουν χρησιµοποιηθεί τέτοιες πρακτικές για την προώθηση ενός ιστότοπου. Σε αυτή την περίπτωση, η ποινή που Βελτιστοποίηση για τις Μηχανές Αναζήτησης 88

90 Κεφάλαιο 4 επιβάλλουν είναι απλή: διαγράφουν το συγκεκριµένο δικτυακό τόπο εντελώς από τα αποτελέσµατα τους, µε ότι αυτό συνεπάγεται. Αξίζει το ρίσκο [52]; Οι µηχανές αναζήτησης έχουν πλέον γίνει αρκετά εξειδικευµένα και περίπλοκα προγράµµατα, τα οποία µέσω της ταυτόχρονης ανάλυσης ενός µεγάλου πλήθους παραγόντων για µία ιστοσελίδα, δύσκολα µπορούν να εξαπατηθούν, όπως τις πρώτες µέρες του διαδικτύου. Οι χρήστες τους, έχουν πλέον µεγάλες απαιτήσεις όσον αφορά στην ποιότητα των αποτελεσµάτων που προσφέρουν, µε αποτέλεσµα και οι µηχανές να έχουν ανάλογες απαιτήσεις από τους δηµιουργούς ιστοσελίδων. υστυχώς όσο χρόνο κόπο και χρήµατα εάν διαθέσετε στο SEO, η επισκεψιµότητα σας µπορεί να βελτιωθεί µόνο µέχρι ένα σηµείο. Σε αυτό παίζει ρόλο η αξία του περιεχοµένου της σελίδας σας. Ο ανταγωνισµός στο διαδίκτυο είναι σκληρός αλλά είναι και αρκετά δίκαιος. Εάν η σελίδα σας αξίζει να βγει πρώτη σε κάποια αναζήτηση τότε ο µόνος τρόπος είναι η σωστή χρήση του Search Engine Optimization. Εάν όχι το SEO µπορεί να σας βοηθήσει στο να αξιοποιήσετε την σελίδα σας στον βαθµό που της αξίζει. Οι παραπάνω παράγοντες βελτιστοποίησης ιστοσελίδων για τις µηχανές αναζήτησης, θετικοί ή αρνητικοί, δεν είναι απαραίτητο ότι θα έχουν αντίκτυπο στην κατάταξη των αποτελεσµάτων άµεσα. Εκείνοι που επιθυµούν την πραγµατική επιτυχία των ιστοσελίδων τους στο διαδίκτυο, έχουν υποµονή και σχεδιάζουν την στρατηγική βελτιστοποίησης των σελίδων τους µακροπρόθεσµα. Κυρίως όµως σχεδιάζουν ιστοσελίδες για τους επισκέπτες τους και όχι για τις µηχανές αναζήτησης. Γιατί έχουν καταλάβει, ότι η βελτιστοποίηση ιστοσελίδων για µηχανές αναζήτησης είναι στην πραγµατικότητα βελτιστοποίηση για ανθρώπους-χρήστες. Από την άλλη, όπως προείπαµε αν κάποιο website δεν εφαρµόσει καθόλου τεχνικές βελτιστοποίησης τότε το ποιο πιθανό είναι να παραγκωνιστεί σε µια γωνία του διαδικτύου και να καταταγεί στην ένατη, δέκατη σελίδα ή και χειρότερα κάποιων αποτελεσµάτων, όπου κανείς δεν θα το βλέπει. Βελτιστοποίηση για τις Μηχανές Αναζήτησης 89

91 Κεφάλαιο 5 Λογισµικό / Εργαλεία SEO

92 Κεφάλαιο 5 Τα εργαλεία και γενικότερα το λογισµικό αυτό χρησιµοποιείται από επαγγελµατίες, ειδικούς του χώρου και µη µε κύριο στόχο την βελτιστοποίηση των σελίδων στις µηχανές αναζήτησης. Είναι εξειδικευµένο λογισµικό που έχει δηµιουργηθεί µε βάση τα κριτήρια ταξινόµησης και κατάταξης των µεγαλύτερων µηχανών αναζήτησης. ιακρίνουµε τρεις βασικές κατηγορίες τέτοιων εργαλείων που είναι: 1) Προγράµµατα µε εγκατάσταση στον υπολογιστή για χρήση 2) Επεκτάσεις (add-ons) / plugins σε κάποιον πλοηγητή ή toolbars (π.χ. toolbar της google, alexa κ.ά) 3) On-line εφαρµογές Υπάρχει µια πλειάδα τέτοιων εργαλείων άλλα πιο ποιοτικά, άλλα λιγότερο, άλλα πιο επαγγελµατικά και εµπορικά που είναι απαραίτητη µια πληρωµή / συνδροµή και άλλα που κυκλοφορούν δωρεάν στο διαδίκτυο. Υπάρχουν πολλά και διάφορα εργαλεία για τον έλεγχο SEO και βελτιστοποίησης του σχεδιασµού της κατασκευής µιας ιστοσελίδας. Το κάθε ένα από αυτά κάνει κάποιες εργασίες και ελέγχους και έχει κάποια ιδιαίτερα χαρακτηριστικά και πλεονεκτήµατα. Άλλες δυνατότητες είναι: η δηµιουργία προσαρµοσµένων αναφορών, η αποθήκευση τους, η µετατροπή σε pdf, η εκτύπωση, download και διάφορα άλλα. Add-ons Τα add-ons για browsers έγιναν ιδιαίτερα δηµοφιλή εξαιτίας του χρόνου που εξοικονοµούν κατά τη διάρκεια µιας διαδικασίας βελτιστοποίησης καθώς οι χρήστες απαλλάσσονται από το να επισκέπτονται αρκετές διάφορες ιστοσελίδες προκειµένου να συγκεντρώσουν τις πληροφορίες που επιζητούν. Η γραµµή εργαλείων (toolbar) της Google αποτελεί ένα plug-in, που αλληλεπιδρά µε τον πλοηγητή, παρέχοντας χρήσιµες πληροφορίες για τις ιστοσελίδες που επισκέπτεστε. Το εργαλείο εµπεριέχει ένα ευρύ φάσµα χρήσιµων SEO χαρακτηριστικών, συµπεριλαµβανοµένων του page rank κάθε σελίδας, εργαλείο που αναδεικνύει συγκεκριµένες λέξεις-κλειδιά, όπως επίσης και επιλογή auto fill για τον περιορισµό του χρόνου που σπαταλάει κάποιος πληκτρολογώντας τις ίδιες πληροφορίες ξανά και ξανά. Η γραµµή εργαλείων της Google παρέχεται δωρεάν και είναι υψηλά προσαρµοσµένη στις ανάγκες του κάθε Λογισµικό Εργαλεία SEO 91

93 Κεφάλαιο 5 χρήστη. Είναι συµβατή µε τους δύο πιο διάσηµους περιηγητές δικτύου παγκοσµίως, τον Internet Explorer της Microsoft και το Mozilla Firefox. Η εταιρεία έχει τη δυνατότητα να συλλέγει πληροφορίες για τη συµπεριφορά του χρήστη στο web µέσω του toolbar (επιτυγχάνεται και η καλύτερη εξατοµίκευση των προσφερόµενων στοιχείων µε αυτόν τον τρόπο), εφόσον όµως ο χρήστης το επιτρέψει κατά την εγκατάσταση. Από τις πιο χρήσιµες και δηµοφιλείς επεκτάσεις SEO, είναι το SEO για τον Firefox, δηµιούργηµα του Aaron Wall. Προσφέρει εξειδικευµένες υπηρεσίες διαφόρων κατηγοριών, επεκτείνοντας τις δυνατότητες πέρα από τον παραδοσιακό web browser. Αποκτώντας αυτές τις τόσο ουσιώδεις πληροφορίες, ο κάθε χρήστης είναι σε θέση να εκτιµήσει την ισχύ που έχει ο εκάστοτε δικτυακός τόπος. Εκτός από το συγκεκριµένο, στο web υπάρχει µία πλειάδα διαφόρων άλλων επεκτάσεων SEO για Firefox. Τέλος, στην ίδια κατηγορία αξίζει να αναφέρουµε πως υπάρχουν αρκετά διαδεδοµένες επεκτάσεις και για τη δηµοφιλή πλατφόρµα διαχείρισης και δηµοσίευσης περιεχοµένου στο διαδίκτυο, το Wordpress (π.χ. Platinum SEO pack, και άλλα). Εικόνα 20: Επεκτάσεις SEO για Firefox Αντικείµενα Κατηγορίες ελέγχου των SEO Tools 1) Εργαλεία για λέξεις κλειδιά (keywords) Είναι τα εργαλεία που πραγµατοποιούν µια έρευνα και ανάλυση, είτε συνολικά στο web είτε σε συγκεκριµένους δικτυακούς τόπους, όσον αφορά το ποιες λέξειςκλειδιά ταιριάζουν περισσότερο στο θέµα ενός ιστοχώρου. Τέτοια εργαλεία συγκεντρώνουν ή προσπαθούν να υπολογίσουν την δηµοτικότητα συγκεκριµένων Λογισµικό Εργαλεία SEO 92

94 Κεφάλαιο 5 keywords, κάποιες σηµαντικές παραµέτρους τους όπως πχ. την πυκνότητα τους (density) αλλά και να προτείνουν συνώνυµα ή σχετικές µε το θέµα (της σελίδας) λέξεις. 2) Εργαλεία ελέγχου της βαθµολόγησης (ranking) Απλά εργαλεία που ελέγχουν την θέση του site σας σε µια µηχανή αναζήτησης (π.χ. pagerank της google κ.α) 3) Εργαλεία ελέγχου των συνδέσεων (links) Μπορούν να ελέγχουν αριθµό συνδέσµων π.χ από social websites, συνδέσεις incoming/popularity, εσωτερικά-εξωτερικά, συνδέσεις που παρουσιάζουν πρόβληµα ή που δεν λειτουργούν, backlinks αλλά και indexed pages απο google και yahoo για κάποιο ιστότοπο, blogsearching για ένα ιστότοπο στο google κτλ. 4) Εργαλεία µε στόχο την υποβολή ιστοσελίδων Σύνολα εργαλείων που έχουν ως στόχο την υποβολή (submit) ενός website σε συγκεκριµένες λίστες web, καταλόγους, µηχανές αναζήτησης κτλ. 5) Άλλα εργαλεία που παρέχουν διάφορες πληροφορίες όπως π.χ για το περιεχόµενοκείµενο της σελίδας, το όνοµα χώρου (domain) κτλ. 6) Πολυλειτουργικά πακέτα Εφαρµογές SEO που περιέχουν όλες τις απαραίτητες (και µη) λειτουργίες. 7) Λογισµικό αυτοµατοποίησης SEO εν µιλάµε για κάποιο πλήρως αυτοµατοποιηµένο λογισµικό. Εξάλλου όλα τα παραπάνω λειτουργούν άλλα περισσότερο και άλλα λιγότερο αυτοµατοποιηµένα. Ωστόσο, εδώ µιλάµε για εργασίες που δεν µπορούν στο σύνολο τους να αυτοµατοποιηθούν και είναι απαραίτητη η ανθρώπινη παρέµβαση. Τέτοιες εργασίες είναι η διαχείριση των Adwords ή Adsense λογαριασµών που είδαµε νωρίτερα στην εργασία στην ενότητα της Google, η ανάλυση συνεργατών για συνδέσεις κτλ. Αξίζει να σηµειωθεί ότι, πολλές εταιρίες όπως η Google, Yahoo και άλλες προσφέρουν διάφορα εργαλεία και υπηρεσίες SEO όπως τα παραπάνω δωρεάν. (π.χ το Google s keyword, το google analytics που αναφέρθηκε κτλ.). Επιπλέον, τα πιο Λογισµικό Εργαλεία SEO 93

95 Κεφάλαιο 5 απλά εργαλεία για την εύρεση των εισερχόµενων συνδέσµων (backlinks) σε ένα website είναι οι ίδιες οι µηχανές αναζήτησης. Ο λόγος για την αναζήτηση συνδέσµων της Google (Google s link query) και το αντίστοιχο της Yahoo (linkdomain command). Σε µία σύγκριση ανάµεσα τους, η Yahoo δείχνει να αποτελεί το πιο ενηµερωµένο και αναλυτικό εργαλείο προσφέροντας πιο προσαρµοσµένες αναζητήσεις, όπως η εξαίρεση ενός domain. Για παράδειγµα, όταν ένας χρήστης θέλει να ελέγξει πόσα links συνδέονται στο προσωπικό του website, αποκλείοντας όµως τους εσωτερικούς του συνδέσµους (internal links). Οι εντολές και στις δύο περιπτώσεις είναι πολύ απλές: Στο Google πληκτρολογούµε στην αναζήτηση link: και το website (π.χ. link:http://foo.gr, όπου foo.gr οποιοδήποτε site) ενώ στη Yahoo linkdomain: και το website. Για την εξαίρεση των internal επιλέγουµε το except from this domain ενώ υπάρχει και πάλι στη Yahoo, επιλογή για τις σελίδες που οδηγούν σε συγκεκριµένη ιστοσελίδα ή στο σύνολο του δικτυακού τόπου (entire site / only this url). Εικόνα 21: Η µηχανή αναζήτησης της Yahoo Όλα τα παραπάνω αποτελούν φυσικά απλά εργαλεία και εξαιτίας όλων των παραπάνω λόγων που αναφέρθηκαν, κανένα από αυτά δεν µπορεί να σας εγγυηθεί την 1 η θέση στις µηχανές αναζήτησης. Λογισµικό Εργαλεία SEO 94

96 Κεφάλαιο 5 Η περίπτωση του Alexa.com H alexa ξεκίνησε την λειτουργία της το 1995 µε σκοπό να δηµιουργήσει ένα τρόπο αρχειοθέτησης και περιήγησης που να βελτιώνεται µε τη συµµετοχή των χρηστών του διαδικτύου. ιατηρεί ως έδρα την Καλιφόρνια των ΗΠΑ, ιδρυτές της είναι οι Brewster Kahle και Bruce Gilliat ενώ πήρε το όνοµα της από την βιβλιοθήκη της Αλεξάνδρειας. Έχοντας έναν από τους µεγαλύτερους ανιχνευτές (crawler) δικτύου, η εταιρεία έχει αναπτύξει µεγάλη υποδοµή για την επεξεργασία και προσφορά εξειδικευµένων και πολλαπλών ειδών πληροφορίες. Αποτελεί µία ιστοσελίδα στατιστικής επισκεψιµότητας. Ανά τακτικά διαστήµατα ανανεώνει τα στατιστικά δεδοµένα επισκεψιµότητας των ιστοσελίδων και τα κατατάσσει σε ένα παγκόσµιο κατάλογο. Όσο πιο µικρός είναι ο αριθµός κατάταξης τόσο καλύτερη θέση κατέχει η ιστοσελίδα από άποψη επισκεψιµότητας. Για τη λήψη αυτών των στατιστικών (ποια site επισκεφθήκατε, πόσες σελίδες και πόσο χρόνο στο κάθε ένα, κτλ.) χρησιµοποιείται µια γραµµή εργαλείων (toolbar) την οποία µπορείτε να εγκαταστήσετε στον υπολογιστή σας από την συγκεκριµένη σελίδα. Ο αριθµός των χρηστών που χρησιµοποιούν αυτά τα toolbar είναι αρκετά µεγάλος οπότε µπορεί να αποτελέσει για πολλούς ένα καλό στατιστικό δείγµα από τον πληθυσµό του Internet, ικανό για να εξαχθούν κάποια σηµαντικά συµπεράσµατα. Η Alexa έγινε ιδιαίτερα δηµοφιλής για την µπάρα εργαλείων που προσφέρει στους χρήστες της. Το toolbar προσφέρει πληροφορίες στους χρήστες όπως: η κατάταξη στην alexa, σχετικά links και απόψεις χρηστών για συγκεκριµένες σελίδες, δηµοφιλή sites αλλά και πως εµφανίζονταν ιστοσελίδες στο παρελθόν. Εικόνα 22: Η toolbar της Alexa Λογισµικό Εργαλεία SEO 95

97 Κεφάλαιο 5 Τον Σεπτέµβριο του 1997 η alexa διέθεσε την πρώτη µπάρα (alexa toolbar 1.0). Το 1998 και το 1999 η µπάρα της alexa ενσωµατώθηκε στους browsers netscape και internet explorer ενώ είχε ξεπεράσει τα 3 εκατοµµύρια downloads. To 1999 η alexa εξαγοράστηκε από την amazon.com. Το 2000 η καινούργια µπάρα της alexa (alexa toolbar 5.0) ξεπέρασε τα 7 εκατοµµύρια downloads. H alexa συνέχισε σε κάθε έκδοσης της να προσφέρει ξεχωριστές υπηρεσίες. Το 2002 η alexa άρχισε συνεργασία µε το google ενώ στους συνεργάτες της ανήκει και η Microsoft. Η βάση δεδοµένων της Alexa αποτέλεσε την βάση για την δηµιουργία του Wayback Archive Machine. Μέσα στο 2009 η εταιρεία ανανέωσε τις µετρήσεις της, προσθέτοντας νέα χαρακτηριστικά. Εκτός από το toolbar, µέσα από την ιστοσελίδα της η εταιρεία παρέχει πληροφορίες κίνησης για website µε τη συµπλήρωση απλά ενός url, την δηµοφιλή υπηρεσία alexa top sites µε στοιχεία ανά χώρα, γλώσσα και κατηγορία ενώ τέλος προσφέρει και διάφορα άλλα εργαλεία για διαχειριστές δικτυακών τόπων. Εικόνα 23: Το λογότυπο του Alexa.com Τα στοιχεία traffic όπως είπαµε βασίζονται σε αυτούς που έχουν toolbar του Alexa, τα οποία µπορεί να µην είναι ένα αντιπροσωπευτικό δείγµα του παγκόσµιου πληθυσµού του Internet. Προβλήµατα όπως: υπερεκτίµηση / υποτίµηση συγκεκριµένων σελίδων, ρυθµός υιοθέτησης του λογισµικού σε διαφορετικά µέρη του κόσµου, απουσία ασφαλών συνδέσεων από το δείγµα κ.α., καθιστούν τις µετρήσεις του όχι τόσο αξιόπιστες. Επιπροσθέτως, η βάση χρηστών του Alexa είναι µόνο ένα δείγµα του πληθυσµού του Internet, και ιστοσελίδες µε σχετικά χαµηλό traffic δε κατατάσσονται µε ακρίβεια από την Alexa λόγω των στατιστικών περιορισµών του δείγµατος. Τα στοιχεία της Alexa µπορεί να προέρχονται από ένα ευρύ δείγµα κάποιων εκατοµµυρίων χρηστών του Alexa Toolbar: παρόλα ταύτα δεν είναι αρκετά ευρύ ώστε να καθορίσει τις κατατάξεις ιστοσελίδων µε λιγότερους από Λογισµικό Εργαλεία SEO 96

98 Κεφάλαιο συνολικά επισκέπτες µηνιαία. Γενικά, οι κατατάξεις traffic των θεωρούνται από πολλούς ως αναξιόπιστες καθώς η ποσότητα των στοιχείων που λαµβάνει κάποιος δεν είναι στατιστικά σηµαντική. Αντίστροφα, όσο περισσότερο traffic λαµβάνει µια ιστοσελίδα (όσο πιο κοντά βρίσκεται στην πρώτη θέση), τόσο πιο αξιόπιστη καθίσταται η κατάταξη traffic. Όπως κάθε επιτυχηµένη ιδέα, η alexa έχει κατασυκοφαντηθεί. Έχει κατηγορηθεί σαν spyware πρόγραµµα και έτσι αντιµετωπίζεται από µερικά antispyware. Όµως παρόλα αυτά η alexa δεν υπάρχει περίπτωση να κατέβει σε έναν υπολογιστή κατά λάθος και πάντα χρειάζεται την πλήρη κατανόηση και αποδοχή του χρήστη. Εικόνα 24: Το περιβάλλον ανάλυσης του Alexa.com Από την άλλη εκτός από τις πολλές και χρήσιµες υπηρεσίες της, η alexa θεωρείται αυτή τη στιγµή ο πιο αξιόπιστος µετρητής επισκεψιµότητας στο διαδίκτυο. Η απουσία κάποιας άλλης υπηρεσίας που να δίνει έστω µια ιδέα για το πόσο δηµοφιλής είναι ένας δικτυακός τόπος τονίζει την σπουδαιότητα του συγκεκριµένου εργαλείου, παρέχοντας ένα σηµαντικό δείγµα παρόλα τα προβλήµατα και τις δυσκολίες που παρουσιάζει ένα τέτοιο εγχείρηµα. Ένας σηµαντικός αριθµός επεκτάσεων (add-ons) Λογισµικό Εργαλεία SEO 97

99 Κεφάλαιο 5 για τον Mozilla Firefox όπως θα δούµε και σε παρακάτω κεφάλαιο, χρησιµοποιεί την υπηρεσία αυτή στα αποτελέσµατα τους (π.χ Alexa Sparky Traffic Details). Alexa Traffic Rankings Το Alexa Traffic Rankings είναι ένας µηχανισµός σχετικής κατάταξης των δικτυακών τόπων σε παγκόσµια επίπεδο. Τι εννοούµε µε τον όρο µηχανισµός σχετικής κατάταξης; Εάν τρεις δροµείς τρέξουν 100 µέτρα, ο Α θα βγει πρώτος, ο Β δεύτερος και Γ τρίτος. Αυτό είναι µια σχετική κατάταξη που καθορίζει την σειρά µε πρώτο αυτό που έτρεξε γρηγορότερα και είχε καλύτερη επίδοση. Τον χρόνο που έκαναν δεν τον εµπλέξαµε πουθενά. Έτσι λοιπόν η κατάταξη αυτή δεν είναι µέτρηση στατιστικών. Το alexa.com δεν ξέρει δηλαδή πόσους επισκέπτες είχατε ακριβώς ή πόσες σελίδες είδαν αυτοί, αλλά ξέρει εάν είχατε περισσότερους ή λιγότερους επισκέπτες ή σελίδες που είδαν σε ένα άλλον δικτυακό τόπο [53]. Traffic Rank Θεωρείστε για παράδειγµα ένα site που έχει Traffic Ranking Αυτό σηµαίνει ότι εάν αξιολογήσετε όλα τα site του κόσµου βάση κάποιων χαρακτηριστικών που αναλύονται παρακάτω και τα βάλετε σε µια κατάταξη φθίνουσα (το καλύτερο πρώτο µε Alexa Rank #1), τότε το συγκεκριµένο site έχει καταλάβει αυτή την θέση την η, µε υπολογισµό όµως το Μέσο όρο των θέσεων που είχε καταλάβει καθηµερινά µέσα στο τελευταίο τρίµηνο. H κατάταξη traffic βασίζεται σε ιστορικές πληροφορίες κίνησης, συγκεντρωµένες σε ένα τρίµηνο, από εκατοµµύρια χρήστες του Alexa Toolbar και είναι ένα συνδυασµένο µέτρο θέασης σελίδων (pages views) και χρηστών (εµβέλεια). Ως πρώτο βήµα, η Alexa υπολογίζει την εµβέλεια και τον αριθµό των θεάσεων σελίδων για κάθε δικτυακό τόπο σε καθηµερινή βάση. Η κύρια κατάταξη traffic της Αlexa βασίζεται στη γεωµετρική έννοια αυτών των ποσοτήτων κατά µέσο όρο µε άξονα το χρόνο, ούτως ώστε η κατάταξη µιας ιστοσελίδας να αντικατοπτρίζει ταυτόχρονα τον αριθµό των χρηστών που επισκέπτονται την ιστοσελίδα καθώς και τον αριθµό των σελίδων της ιστοσελίδας που βλέπουν αυτοί οι χρήστες. Η τρίµηνη αλλαγή καθορίζεται συγκρίνοντας την τρέχουσα κατάταξη της ιστοσελίδας µε την κατάταξη που κατείχε πριν από τρεις µήνες. Παραδείγµατος χάριν, την 1 η Ιουλίου, η τρίµηνη αλλαγή θα έδειχνε τη διαφορά µεταξύ της κατάταξης βασισµένης στο traffic κατά τη διάρκεια Λογισµικό Εργαλεία SEO 98

100 Κεφάλαιο 5 του πρώτου τριµήνου του έτους και της κατάταξης βασισµένης στο traffic κατά τη διάρκεια του δεύτερου τριµήνου. Reach Το Reach µετράει τον αριθµό των χρηστών. Το Reach εκφράζεται τυπικά ως το ποσοστό όλων των χρηστών του Internet που επισκέπτονται µια δεδοµένη ιστοσελίδα. Έτσι, για παράδειγµα, αν µια ιστοσελίδα όπως η yahoo.com έχει εµβέλεια 28%, αυτό σηµαίνει ότι αν παίρναµε τυχαία δείγµατα ενός εκατοµµυρίου χρηστών του Internet, θα βρίσκαµε κατά µέσο όρο ότι από αυτούς επισκέπτονται τη yahoo.com. Η Alexa εκφράζει το Reach ως τον αριθµό χρηστών ανά εκατοµµύριο. Οι µέσες εβδοµαδιαίες και τρίµηνες µετρήσεις της Alexa αποτελούν µέσοι όροι των ηµερήσιων µετρήσεων reach, που υπολογίζονται κατά µέσο όρο για µια δεδοµένη χρονική περίοδο. Οι τρίµηνες µεταβολές καθορίζονται συγκρίνοντας την τρέχουσα τιµή Reach µε την τιµή της πριν από τρεις µήνες [53]. Pageviews Τα pageviews (θεάσεις σελίδων) µετρούν τον αριθµό των σελίδων που βλέπονται από τους χρήστες του Alexa Toolbar. Οι πολλαπλές θεάσεις σελίδων της ίδιας σελίδας που πραγµατοποιούνται από τον ίδιο χρήστη την ίδια µέρα µετρώνται µόνο µία φορά. Οι αριθµοί που δείχνουν τις θεάσεις σελίδων ανά χρήστη είναι οι µέσοι αριθµοί των µοναδικών σελίδων που βλέπονται ανά χρήστη και ανά ηµέρα από τους χρήστες που επισκέπτονται την ιστοσελίδα. Η κατάταξη θέασης σελίδων είναι µια κατάταξη όλων των ιστοσελίδων βασισµένη αποκλειστικά στο συνολικό αριθµό των θεάσεων σελίδων (και όχι των θεάσεων σελίδων ανά χρήστη). Οι τρίµηνες αλλαγές καθορίζονται συγκρίνοντας τους τρέχοντες αριθµούς θεάσεων σελίδων µιας ιστοσελίδας µε εκείνους τρεις µήνες πριν. Οι θεάσεις σελίδων ανά εκατοµµύριο απεικονίζουν τι κλάσµα όλων των θεάσεων σελίδων που πραγµατοποιούνται από τους χρήστες του που έχουν το Alexa toolbar και πηγαίνουν σε µία συγκεκριµένη ιστοσελίδα. Παραδείγµατος χάριν, αν η yahoo.com έχει θεάσεις σελίδων ανά εκατοµµύριο, αυτό σηµαίνει ότι 7% όλων των θεάσεων σελίδων πηγαίνει στη yahoo.com. Αν αθροίζαµε τις κλασµατικές θεάσεις σελίδων όλων των ιστοσελίδων, θα παίρναµε 100% (αυτό δεν αληθεύει από άποψη εµβέλειας, καθώς κάθε χρήστης µπορεί φυσικά να επισκέπτεται παραπάνω από µία ιστοσελίδες) [53]. Λογισµικό Εργαλεία SEO 99

101 Κεφάλαιο 5 Pageviews/User Το Pageviews / user δείχνει το µέσο όρο του αριθµού των θεάσεων σελίδων που επισκέφθηκε κάθε χρήστης. ηλαδή αν για παράδειγµα το αποτέλεσµα είναι 16, αυτό δείχνει πως κάθε χρήστης επισκέφτηκε κατά µέσο όρο 16 διαφορετικές σελίδες, αριθµός πολύ µεγάλος που δείχνει ότι είτε το περιεχόµενο είναι ενδιαφέρον ή ότι υπάρχει ένα forum ή ένα social web tool µε µεγάλο loyalty και συµµετοχή χρηστών που ενισχύουν της πολλαπλές επισκέψεις σελίδων από το ίδιο άτοµο-επισκέπτη [53]. Bounce Rate Αυτή η τιµή δείχνει το ποσοστό των χρηστών που επισκέφθηκαν έναν δικτυακό τόπο αλλά µονάχα σε µία σελίδα και βγήκαν. Ουσιαστικά δείχνει τι ποσοστό δεν κάθισαν να περιηγηθούν στο δικτυακό τόπο είτε λόγω κακής campaign που τους οδήγησε εκεί, είτε λόγω έλλειψης εσωτερικών Links που θα τους πήγαιναν βαθύτερα κλπ. Γενικά το ποσοστό αυτό θα πρέπει να διατηρείτε σε όσο το δυνατόν χαµηλότερα επίπεδα. Η περίπτωση του Wayback Archive Machine Βασικό χαρακτηριστικό της εξέλιξης του διαδικτύου στις µέρες µας, αποτελούν τα καινούργια projects του web µε τις σύγχρονες τεχνολογίες και ευρήµατα τους, που προσελκύουν µεγάλο αριθµό χρηστών και µονοπωλούν πολύ συχνά το ενδιαφέρον των media. Μερικές αξίες όµως σε όλα τα µέσα είναι διαχρονικές και το διαδίκτυο δεν µπορεί και δεν αποτελεί εξαίρεση. Η ανάπτυξη ενός αρχείου και η αναζήτηση στο σχετικό µε αυτό υλικό, αποτέλεσαν ένα από τα πρώτα «στοιχήµατα» των πρώτων χρόνων της ψηφιακής εποχής (όπως είδαµε και στο α κεφάλαιο). Η ψηφιακή αποθήκευση και διατήρηση σηµαντικών έργων έρευνας ή τέχνης ήταν ανέκαθεν ένα ζήτηµα που απασχολούσε τη διαδικτυακή κοινότητα. Το Internet Archive (archive.org) αποτελεί έναν µη κερδοσκοπικό οργανισµό/site, που επιχειρεί ακριβώς αυτό, να αποτελέσει δηλαδή µια ελεύθερη, διαδικτυακή, ηλεκτρονική βιβλιοθήκη διαφόρων αρχείων. Ιδρύθηκε το 1996 και η έδρα του βρίσκεται στο Σαν Φρανσίσκο των ΗΠΑ. Τα αρχεία ανάµεσα στα οποία µπορείτε να ψάξετε αυτά που εµπίπτουν Λογισµικό Εργαλεία SEO 100

102 Κεφάλαιο 5 στον τοµέα ενδιαφέροντος σας έχουν τη µορφή κειµένων, ηχητικών αρχείων ή video. Βιβλία, ταινίες, συναυλίες, εργασίες κ.ά. διατίθενται προς επισκόπηση αλλά και σχολιασµό. Φυσικά κάθε είδος αρχείων διαιρείται σε υποκατηγορίες για να είναι πιο εύκολη η αναζήτηση. Για τους πιο µυηµένους στην τεχνολογία υπάρχει και αρχείο τίτλων λογισµικού για να «κατεβάσετε», πάντα υπό νόµιµους όρους. Μία από τις πιο ενδιαφέρουσες εφαρµογές του είναι και το Way Back Machine, µια µηχανή αναζήτησης (οπισθοδρόµησης) στην οποία βάζοντας τη διεύθυνση ενός δικτυακού τόπου (URL 15 ), µπορείτε να δείτε πώς εµφανιζόταν αυτό σε διάφορες χρονολογίες. Στο αρχείο αυτό αποθηκεύονται σελίδες του διαδικτύου περιοδικά κατά τη διαχρονική τους παρουσία (ανά δύο µήνες συνήθως). Στα αποτελέσµατα εµφανίζονται ηµεροµηνίες και πίσω από κάθε ηµεροµηνία κρύβεται η αποθηκευµένη µορφή του ιστότοπου εκείνης της περιόδου. Πληκτρολογήστε π.χ. και πηγαίνετε στο 1998, για να δείτε πώς ήταν όταν πρωτοξεκινούσε η σηµερινή κορυφαία µηχανή αναζήτησης. Μία δικτυακή «Μηχανή του Χρόνου» όπως το ίδιο θέλει να αποκαλείται που προσφέρει την δυνατότητα µίας ουσιαστικής περιήγησης σε ένα τεράστιο αρχείο ιστότοπων από όλα τα µήκη και πλάτη της γης και του διαδικτύου (ακόµα και ιστότοποι που δεν υπάρχουν πια) µεταξύ αυτών και η Ελλάδα. Όσο και αν φαίνεται υπερβολικό, η WayBack Machine αποτελεί σήµερα την µοναδική ουσιαστικά βάση δεδοµένων που ξεχώρισε τους δικτυακούς τόπους και την ιστορική διαδροµή τους από το 1996 ως σήµερα και τους έδωσε άλλη υπόσταση, δηµιουργώντας ένα project χρήσιµο όχι µόνο για ιστορικούς αλλά και για επιχειρηµατικούς σκοπούς. Περιλαµβάνει 150 περίπου δισεκατοµµύρια ιστοσελίδες. Ένα εντυπωσιακό όσο και χρήσιµο για πολλούς ταξίδι στην δικτυακή επικοινωνία από τις αρχές του διαδικτύου µέχρι σήµερα. Το αρνητικό στοιχείο της όλης υπηρεσίας είναι ότι πολλά αρχεία δεν αποθηκεύονται και έτσι οι σελίδες δεν είναι πάντα πλήρης. 15 Ο όρος Uniform Resource Locator (συντµ. URL, ελλ. Ενιαίος Εντοπιστής Πόρων) δηλώνει µια διεύθυνση ενός πόρου του Παγκόσµιου Ιστού. Είναι παρόµοιο µε το όνοµα ενός αρχείου, αλλά κρατάει και επιπλέον πληροφορία σχετικά µε το όνοµα του εξυπηρετητή, καθώς και το είδος του πρωτοκόλλου που αυτός χρησιµοποιεί. Οι ιστοσελίδες χρησιµοποιούν τα URLs για να συνδεθούν µε άλλες σελίδες. Εκτός από αυτό τα URLs περιέχουν και πολλές άλλες δηµοφιλείς δικτυακές εντολές όπως δείκτες προς FTP αρχεία, µηνύµατα Usenet κτλ. Λογισµικό Εργαλεία SEO 101

103 Κεφάλαιο 5 Εικόνα 25: Το portal in.gr πριν µια δεκαετία (2000) Επιπροσθέτως, ο δικτυακός τόπος προσφέρει και τις δικές του συλλογές (Web Collections) για σηµαντικά θέµατα όπως οι κυβερνητικοί ιστότοποι του Ηνωµένου Βασιλείου, ή ιστότοπους που φιλοξένησαν ειδήσεις για τις αµερικανικές εκλογές του 2002 και του 2004, ενώ δεν παραλείπει να προσφέρει και Forum για την ανταλλαγή απόψεων µεταξύ των χρηστών του και πολλές ακόµη επιλογές. Παραµένοντας τέλος στην περί web εκδοχή του, ενδιαφέρον συγκεντρώνει και το mirror που διαθέτει πλέον στην online έκδοση της Νέας Βιβλιοθήκης της Αλεξάνδρειας (archive.bibalex.org). H ιστοσελίδα Compete.com Το Compete.com αποτελεί µια αµερικανική υπηρεσία ανάλυσης της κίνησης στο διαδίκτυο και ένα εργαλείο µελέτης θα λέγαµε του ανταγωνισµού. ηµοσιεύει τον κατά προσέγγιση αριθµό των επισκεπτών ανά τον κόσµο όσον αφορά τα κορυφαία website παγκοσµίως. Ο αριθµός αυτός προέρχεται από πηγές όπως: παροχείς Λογισµικό Εργαλεία SEO 102

104 Κεφάλαιο 5 υπηρεσιών διαδικτύου και διαφόρων άλλων εφαρµογών, χρήστες της εργαλειοθήκης (toolbar) του compete και διάφορες άλλες πηγές. Χρησιµοποιείται κατά κόρον από webmasters ιστοσελίδων και προσφέρει ένα πλήθος υπηρεσιών, µεταξύ των οποίων και ποια keywords είναι αυτά που φέρνουν κίνηση στην ιστοσελίδα κάποιου η σε άλλη ανταγωνιστική. Το Compete.com είναι µια υπηρεσία της εταιρείας Compete µε πάνω από δύο εκατοµµύρια µέλη ως το 2008 και η οποία ιδρύθηκε το 2000 από τον Bill Gross, επιχειρηµατία και εµπνευστή της µηχανής αναζήτησης GoTo. Εικόνα 26: Η υπηρεσία Compete.com Social Media Optimization (SMO) Το Internet εξελίσσεται από ένα σύνολο δικτυακών τόπων µε εταιρικό κυρίως προφίλ σε µια ισχυρή, εύχρηστη και εύκολη πλατφόρµα ανταλλαγής πληροφοριών για όλους τους χρήστες. Χάρη σε µια πληθώρα εύχρηστων και συχνά δωρεάν εφαρµογών, ο καθένας έχει τη δυνατότητα να δηµιουργήσει και να δηµοσιεύσει πρωτότυπο περιεχόµενο, σε µορφή κειµένου, ήχου ή βίντεο. Το SMO αποτελεί ένα είδος online-marketing που επικεντρώνεται στη συµµετοχή σε διάφορους δικτυακούς τόπους κοινωνικών διαδικτυακών µέσων µε στόχο την δηµιουργία κίνησης (traffic), Λογισµικό Εργαλεία SEO 103

105 Κεφάλαιο 5 επισκεψιµότητας αλλά και συνδέσµων προς έναν ιστότοπο. Για τους λόγους αυτούς, πολλοί ειδήµονες του χώρου αναφέρονται στο SMO ως το νέο SEO, αφού αποτελεί µια ισχυρή και αποτελεσµατική µέθοδο προσέλκυσης επισκεπτών-πελατών. Τα κοινωνικά µέσα (Social Media) είναι ο συνδυασµός της τεχνολογίας, της διαδικτυακής κοινωνικοποίησης και της πληροφορίας (κείµενο, ήχος, video και φωτογραφίες). Βασικός λόγος δηµιουργίας τους υπήρξε η ανάγκη για διαχείριση και ανάδειξη πληροφοριών. Βασικό χαρακτηριστικό των Social Media στοιχείο που το διαχωρίζει από τα υπόλοιπα µέσα µαζικής ενηµέρωσης είναι η διαδραστικότητα του κοινωνικού συνόλου. Χωρίς αυτή τη συµβολή των διαδικτυακών κοινωνικών µαζών δεν θα υπήρχαν τα Social Media. Ο λόγος είναι απλός: Από µόνη της η τεχνολογία χωρίς τους χρήστες είναι κενή και άχρηστη. Το κλειδί είναι οι χρήστες, χωρίς αυτούς δεν υπάρχει αποτέλεσµα, ούτε καν µέσο. Εικόνα 27: Οι 3 στρατηγικές προώθησης (e-marketing) ενός site (πηγή: sumolabs.com) Λογισµικό Εργαλεία SEO 104

106 Κεφάλαιο 5 Τα Social Media µπορούν και εκφράζονται µέσα από διάφορες τεχνολογικές πλατφόρµες, όπως αυτές των Forum, Blog, Wikis, Message Boards, Podcasts, Vlogs, Picture Sharing, Music Sharing, Online Gaming, κλπ [48]. Γνωστά παραδείγµατα εφαρµογών Social Media στο Web είναι: τα Social Networks sites SNS (Websites κοινωνικής δικτύωσης) όπως για παράδειγµα το Facebook, το MySpace, το LinkedIn, κ.ά. τα Social Bookmarking sites ( ηµόσια δίκτυα/εργαλεία αποθήκευσης σελίδων ή αλλιώς υπηρεσίες σελιδοσήµανσης και διαµοιρασµού µε άλλους), όπως το del.icio.us, το Reddit, το Furl κ.ά. τα News aggregation sites ( ίκτυα συγκέντρωσης ειδήσεων), όπως το Digg, το Newsvine, το Sphinn, το StumbleUpon κ.ά. τα References (Wikis), όπως το Wikipedia τα Music sharing (Μουσικά κοινωνικά σύνολα), όπως το Last.fm τα Photo sharing (Φωτογραφικά κοινωνικά σύνολα), όπως το Flickr και το Picasa τα Video sharing (Video κοινωνικά σύνολα), όπως το YouTube, Metacafe, Vimeo, Revver κ.ά. οι Virtual reality (Κοινωνίες εικονικής πραγµατικότητας), όπως το Second Life τα Online Gaming ( ιαδικτυακά παιχνίδια), όπως το Guild Wars ή το World of Warcraft οι πλατφόρµες Micro Blogging, σαν το Twitter, το Jaiku και το Pownce οι Social networking aggregators (Πλατφόρµες συγκέντρωσης πληροφορίας) όπως το Plaxo, το FriendFeed ή το MyBloglog. τα blogs 16 και µηχανές αναζήτησης για blogs, όπως το Technorati 17, υπηρεσίες video blogging κτλ. 16 Ορίζονται ως διαδικτυακά ηµερολόγια. ιατηρούνται από ένα ή περισσότερους συγγραφείς και δηµοσιεύουν περιεχόµενο σε τακτά διαστήµατα. Κάθε χρήστης που το επιθυµεί µπορεί να στείλει το δικό του σχόλιο, το οποίο θα δηµοσιευτεί στο blog. Η αλληλεπίδραση µεταξύ των διαφόρων blogs γέννησε τον όρο «blogόσφαιρα». 17 Το σηµαντικότερο directory, εργαλείο κατάταξης και αναζήτησης για όλα τα blogs (ιστολόγια) του πλανήτη Λογισµικό Εργαλεία SEO 105

107 Κεφάλαιο 5 Τα Social Media αναπτύσσονται µαζί µε την ανάπτυξη της σχέσης των χρηστών µε το διαδίκτυο. Καθηµερινά προστίθενται νέοι χρήστες σε αυτό, µε νέες ιδέες, νέες τάσεις και νέες ανάγκες. Οι χρήστες αυτοί επηρεάζονται και επηρεάζουν µε τη σειρά τους άλλους και δηµιουργούν µε τη βοήθεια της τεχνολογίας ένα παλιρροιακό κύµα το οποίο µπορεί να επηρεάσει µε τη σειρά του µια ολόκληρη αγορά ή βιοµηχανία. Με εκατοντάδες εκατοµµύρια χρήστες παγκοσµίως και µε µία ραγδαία εξέλιξη που έχουν τα τελευταία 5 χρόνια, τα Social Media websites θεωρούνται σαν σοβαρές πηγές προώθησης της παγκόσµιας διαδικτυακής πληροφορίας. Η αριθµητική δύναµη των µελών των Social websites, δεν µπορεί παρά να ελκύει το ενδιαφέρον όλων των brands τα οποία πλέον παίρνουν στα σοβαρά τη φωνή του διαδικτυακού «λαού». Προσφέρουν στις επιχειρήσεις µια αποτελεσµατική πλατφόρµα επικοινωνίας και µελέτης του κοινού τους. Όσο οι τεχνολογίες και τα µοντέλα λειτουργίας των Social Networking sites και όχι µόνο ωριµάζουν, τόσο µεγαλώνει και η αξία τους ως εργαλεία για την προώθηση µιας επιχείρησης. Εικόνα 28: Τα είδη SMO (πηγή: milestoneinternet.com) Λογισµικό Εργαλεία SEO 106

108 Κεφάλαιο 5 Ειδικοί του χώρου σηµειώνουν ότι το κλειδί στον προγραµµατισµό της χρήσης ιστοσελίδων για την προώθηση προϊόντων δεν είναι µόνο η χρήση διαφηµίσεων για να «σπρώξουν» µηνύµατα στους καταναλωτές, αλλά η δηµιουργία ελκυστικών κοινωνικών περιβαλλόντων τα οποία ενεργοποιούν την επικοινωνία και την αυτόέκφραση. Φανταστείτε ότι µόνο το Facebook έχει πάνω από 250 εκατοµύρια χρήστες! Αν προσθέσετε και τις άλλες µεγάλες κοινότητες χρηστών, το MySpace, το Twitter, τα social bookmarking sites, τα forums, τα Google groups κ.τ.λ. το µέγεθος της επισκεψιµότητας αγγίζει απίστευτα νούµερα. Ένας ολοένα και αυξανόµενος αριθµός επιχειρηµατιών χρησιµοποιούν sites όπως το MySpace και το Facebook ως ένα όχηµα για να προωθήσουν τα προϊόντα τους, να διαχειριστούν και να δηµιουργήσουν την φήµη τους και να χτίσουν µια αναγνώριση του ονόµατος τους. Είναι χαρακτηριστικό πως η Dell γλύτωσε από την καταστροφή το 2005 µόνο και µόνο επειδή έλαβε στα σοβαρά τα Social Media, άκουσε τις φωνές των χρηστών που τα χρησιµοποιούσαν και αποφάσισε να ενεργήσει βάσει αυτών. Εικόνα 29: Οφέλη από τη χρήση SMO (πηγή: farooqseo.blogspot.com) Λογισµικό Εργαλεία SEO 107

109 Κεφάλαιο 5 Υπάρχουν εκατοντάδες τέτοια µέσα κοινωνικής δικτύωσης, καθένα από τα οποία προσφέρει και µια ευκαιρία για την αύξηση της επισκεψιµότητά σας. Μεταξύ των σηµαντικότερων και πιο διαδεδοµένων είναι: Twitter Το Twitter είναι ένα social network και micro-blogging υπηρεσία η οποία επιτρέπει στους χρήστες του να διαβάζουν τα µηνύµατα άλλων χρηστών της υπηρεσίας(τα γνωστά ως tweets). Είναι µια συνεχώς ανερχόµενη online υπηρεσία, που βοηθά τους χρήστες να επικοινωνούν µεταξύ τους απαντώντας σε µια ερώτηση: "Τί κάνεις τώρα;" Μπορεί να χρησιµοποιηθεί ώστε να κρατάτε επαφή µε συναδέλφους, συγγενείς και φίλους, όσο µακριά κι αν βρίσκονται αυτοί. Το µόνο που έχετε να κάνετε είναι να τους "ακολουθήσετε" (follow) µέσω της υπηρεσίας, οπότε και θα µπορείτε να δείτε συγκεντρωµένα όλα τα δηµόσια µηνύµατά τους. Τα µηνύµατα που µπορείτε να αποστείλετε στο Twitter περιορίζονται στους 140 χαρακτήρες, ενώ µπορείτε να στείλετε και προσωπικά µηνύµατα σε άλλα µέλη της υπηρεσίας. Για να δηµιουργήσετε λογαριασµό στο Twitter, απλά µεταβείτε στην υπηρεσία και κάντε κλικ στο κουµπί "Get Started - Join!". Μπορείτε έπειτα να αναζητήσετε φίλους χρησιµοποιώντας τη λειτουργία "Find people" στην κορυφή της σελίδας και αναζητώντας βάσει username, ονόµατος ή επωνύµου. Facebook και MySpace Το Facebook είναι το πιο δηµοφιλές social networking site (ιστοχώρος κοινωνικής δικτύωσης) παγκοσµίως. Ξεκίνησε στις 4 Φεβρουαρίου του 2004 µε ιδρυτή τον Mark Zuckerberg. Το όνοµα της ιστοσελίδας προέρχεται από τα έγγραφα παρουσίασης των µελών πανεπιστηµιακών κοινοτήτων µερικών Αµερικάνικων κολεγίων και προπαρασκευαστικών σχολείων που χρησιµοποιούσαν οι νεοεισερχόµενοι σπουδαστές για να γνωριστούν µεταξύ τους. Με πάνω από 250 εκατοµµύρια ενεργούς χρήστες, κατατάσσεται στην λίστα ταξινόµησης του Alexa ως ένας από τους δηµοφιλέστερους δικτυακούς τόπους του πλανήτη. Τέλος, το Facebook είναι για κάποιους ειδικούς ένα τέλειο «συνεργατικό δίκτυο» επειδή επιτρέπει στις επιχειρήσεις να δηµιουργήσουν απεριόριστο αριθµό από γκρουπ χωρίς να επιβαρύνονται χρηµατικά µε σκοπό βέβαια την προώθηση και την προσέλκυση πελατών. Λογισµικό Εργαλεία SEO 108

110 Κεφάλαιο 5 Κύριος αντίπαλος του facebook και µε παρόµοια χαρακτηριστικά είναι άλλη µία υπηρεσία κοινωνικής δικτύωσης, το MySpace. Ιδρυτής του ο Brad Greenspan. ηµιουργήθηκε µε σκοπό να βοηθήσει άγνωστα µουσικά γκρουπ να κάνουν την µουσική τους ευρύτερα γνωστή και σύντοµα εξελίχθηκε και αυτό σε µία από τις δηµοφιλέστερες ιστοσελίδες παγκοσµίως. Το Myspace κατάφερε να γίνει απαραίτητο για όσους ασχολούνται µε τη βιοµηχανία της µουσικής και τη ψυχαγωγίας επειδή τους συνδέει µε νέο και υψηλά εµπλεκόµενο κοινό. Στους ιστότοπους αυτούς οι χρήστες διατηρούν προφίλ, συνδέονται µεταξύ τους και ανταλλάσουν περιεχόµενο και απόψεις. Τα περισσότερα από αυτά παρέχουν διαφηµιστικές δυνατότητες τύπου display advertising µε υψηλή στόχευση. Stumbleupon (SU) Ήδη χρησιµοποιείται από εκατοµµύρια χρήστες στο διαδίκτυο, έχει φέρει για πολλούς την επανάσταση στα social bookmarking sites και πρόσφατα αγοράστηκε από το ebay για το ποσό των 50 εκατοµµυρίων δολαρίων. Μιλάµε για το Stumbleupon το οποίο βοηθά τους χρήστες να βρίσκουν και να καταχωρούν εύκολα τους δικτυακούς τόπους που τους ενδιαφέρουν. Είναι µία κοινότητα χρηστών στην οποία οι χρήστες βαθµολογούν τους ιστότοπους, (αλλά και βίντεο, άρθρα, εικόνες) που βρίσκουν ενδιαφέρον, έτσι ώστε και οι υπόλοιποι που συνδέονται µαζί τους να ενηµερωθούν για νέους ιστότοπους. Όλη η λειτουργικότητα της ιδέας αυτής βασίζεται στη µπάρα (toolbar) που δίνεται ελεύθερα για IE και Firefox όπου µέσω της οποίας οι χρήστες µπορούν να βαθµολογήσουν άλλα και να βρουν καινούργιους ιστότοπους. Χρησιµοποιώντας search engines για να εντοπίσει κάποιος σχετικό περιεχόµενο, τυπικά σηµαίνει ένα κυνήγι ανάµεσα σε σελίδες αποτελεσµάτων. Αντί για το ψάξιµο ποιοτικών σελίδων στο διαδίκτυο, τα µέλη του StumbleUpon βοηθούν έναν χρήστη να πάει κατευθείαν σε ιστοσελίδες που ταιριάζουν στα προσωπικά του ενδιαφέροντα και προτιµήσεις. Το Stumbleupon εκτός από ένα χρήσιµο εργαλείο για τους απλούς χρήστες, θεωρείται και ισχυρό εργαλείο για τους webmasters. Οι ειδικοί του χώρου επισηµαίνουν πως το Stumbleupon βοηθάει τόσο πολύ στην κίνηση ενός δικτυακού τόπου που την εκτοξεύει κάθε φορά που κάποιος κάνει stumble κάποιες σελίδες του. Φυσικά δεν µπορείτε να κάνετε stumble την ίδια σελίδα πάνω από µία φορά άλλα µπορείτε να κάνετε όλες τις υπόλοιπες σελίδες ενός ιστότοπου (page based). Για να Λογισµικό Εργαλεία SEO 109

111 Κεφάλαιο 5 µιλήσουµε µε νούµερα, αν κάνετε stumble για πρώτη φορά κάποια σελίδα ενός δικτυακού τόπου τότε θα δείτε στα στατιστικά, ότι µόνο από το Stumbleupon θα έχετε 200 µε 300 περισσότερα unique hits. Κάτι τελευταίο που θέλει λίγο προσοχή είναι το θέµα της γλώσσας της σελίδας. Αν πρόκειται να κάνετε stumble κάποιο ελληνικό δικτυακό τόπο, µη ξεχνάτε ποτέ να δηλώνετε τη γλώσσα στο αντίστοιχο πεδίο της φόρµας εισαγωγής του ιστότοπου. Εικόνα 30: Η αρχική σελίδα του StumbleUpon Blinklist Παρόµοιο µε το Stumbleupon όσον αφορά τον τρόπο λειτουργίας. Μια πολύ χρήσιµη εφαρµογή για προχωρηµένη διαχείριση των αγαπηµένων σας bookmarks. Αφού εγκαταστήσετε το plugin του blinklist στον φυλλοµετρητή σας, µπορείτε να προσθέσετε όποιον δικτυακό τόπο σας ενδιαφέρει στη λίστα των αγαπηµένων σας, να γράψετε περιγραφές και λέξεις κλειδιά και να δηµιουργήσετε λίστες. Οι πληροφορίες αυτές είναι στη διάθεσή σας από οπουδήποτε και όχι µόνο σε έναν Η/Υ, γιατί το blinklist δηµιουργεί µια ιστοσελίδα για τις σηµειώσεις σας. είτε ακόµα τις επιλογές των άλλων και µοιραστείτε τις εµπειρίες σας. Λογισµικό Εργαλεία SEO 110

112 Κεφάλαιο 5 LinkedIn To LinkedIn είναι ένας δικτυακός τόπος κοινωνικής δικτύωσης (social nerworking website) που εξειδικεύεται σε επιχειρηµατικές δραστηριότητες. Για τους επιχειρηµατίες που αναζητούν να προωθήσουν τις υπηρεσίες τους, το LinkedIn θεωρείται πολύ χρήσιµο εργαλείο. ίνει τη δυνατότητα στους χρήστες να δηµιουργήσουν ένα δίκτυο από υπάρχουσες και νέες επαγγελµατικές επαφές (που αποκαλούνται συνδέσεις - connections). Όµως, προχωράει περισσότερο από αυτό. Όταν προσθέτει ένας χρήστης µια νέα σύνδεση, οι συνδέσεις αυτής και οι συνδέσεις αυτών των συνδέσεων επίσης θα προστεθούν στο δικό του δίκτυο. Αυτό προσφέρει σε έναν επαγγελµατία ένα πολύ µεγάλο πεδίο επαφών επαγγελµατικών. Σύµφωνα µε τη Wikipedia, το LinkedIn έχει περισσότερους από 30 εκατοµµύρια χρήστες και προσελκύει περισσότερους από 3,2 εκατοµµύρια επισκέπτες κάθε µήνα σε ένα συνολικό αριθµό από περισσότερες από 150 διαφορετικές επιχειρήσεις. Το LinkedIn ταιριάζει περισσότερο σε µη διαδικτυακές επιχειρήσεις από τους άλλους ιστότοπους κοινωνικής διαδικτύωσης. Μπορεί να χρησιµοποιηθεί για να κρατήσει κάποιος λεπτοµέρειες των επαφών του ενώ δηµιουργεί ένα ισχυρό δίκτυο, ενώ άλλοι χρήστες το χρησιµοποιούν κυρίως για να κάνουν επαφές και να εξασφαλίσουν µελλοντική απασχόληση. Επίσης, πολλοί εργοδότες και γραφεία χρησιµοποιούν τα δίκτυά του για να βρουν κατάλληλους υποψηφίους για εργασία. ηµιουργώντας ένα µεγάλο και σχετικό δίκτυο συνδέσεων, ένας επιχειρηµατίας µπορεί να βελτιώσει σηµαντικά το προφίλ του µέσα σε αυτή την κοινότητα. Χρησιµοποιώντας ένα ισχυρό φάκελο επιτευγµάτων (portfolio) εξασφαλίζει ότι αυτές οι συνδέσεις που ενδιαφέρονται να χρησιµοποιήσουν υπηρεσίες παρόµοιες µε αυτές που προσφέρει, θα τον προτιµήσουν. Delicious Κοινωνική υπηρεσία σελιδοσήµανσης. Το Del.icio.us επιτρέπει σε ένα χρήστη να δηµιουργήσει µια λίστα από αγαπηµένες συνδέσεις στον παγκόσµιο ιστό που µπορεί να έχει πρόσβαση από οπουδήποτε. Μοιάζει µε ένα προσωπικό κατάλογο που ταξιδεύει µε κάποιον. Επιπλέον, οι επαγγελµατίες µπορούν να χρησιµοποιήσουν το Delicious για να ανταλλάξουν πηγές που αφορούν επιχειρηµατικές δραστηριότητες. Αλλά και πολλοί που περιηγούνται χρησιµοποιούν το Delicious για να βρίσκουν πηγές που θεωρούν σχετικές και ποιοτικές. Οι σελιδοδείκτες του βρίσκονται σε Λογισµικό Εργαλεία SEO 111

113 Κεφάλαιο 5 φυλλοµετρητές οργανώνονται σε φακέλους από τον ίδιο τον χρήστη. Το Del.icio.us επιτρέπει την οργάνωση των σελιδοδεικτών µε ετικέτες (tags). Προσπαθήστε να χρησιµοποιείτε πολλαπλές ετικέτες για κάθε σελιδοδείκτη για να δηµιουργήσετε πολλαπλούς τρόπους για να βρίσκετε την ίδια πληροφορία. Οι ετικέτες µπορούν να χρησιµοποιηθούν για αναζήτηση πληροφορίας στο διαδίκτυο. Πληκτρολογώντας στο κουτί αναζήτησης (search box) του del.icio.us µπορεί κάποιος χρησιµοποιώντας το drop down µενού να επεκτείνει την έρευνά του από τους δικούς του σελιδοδείκτες σε ολόκληρο το δίκτυο του del.icio.us. Τα αποτελέσµατα αναζήτησης µπορεί να είναι πιο χρήσιµα στον χρήστη µε τη βοήθεια αυτής της υπηρεσίας σελιδοσήµανσης, παρά από µια µηχανή αναζήτησης όπως το Google, γιατί τα αποτελέσµατα προέρχονται από ανθρώπινη σελιδοσήµανση και όχι από κάποιον αλγόριθµο αναζήτησης. Μέσω ενός διαµοιραζόµενου λογαριασµού del.icio.us οι χρήστες µπορούν εύκολα να δηµιουργήσουν µια διαµοιραζόµενη βάση δεδοµένων σε µια οµάδα ή έναν ολόκληρο οργανισµό. Αν κάποιος χρησιµοποιεί για φυλλοµετρητή Firefox θα χρειαστεί να εγκαταστήσει την πρόσθετο delicious. Παρόµοια διαδικασία υπάρχει και για τον Internet Explorer. Ύστερα από µια γρήγορη και εύκολη εγκατάσταση, εµφανίζονται δύο κουµπιά στην µπάρα εργαλείων του φυλλοµετρητή, ένα για την αποθήκευση και το άλλο για να βλέπει ο χρήστης και να επεξεργάζεται τους σελιδοδείκτες του. Εικόνα 31: Η αρχική σελίδα του Delicious Λογισµικό Εργαλεία SEO 112

114 Κεφάλαιο 5 Digg To Digg είναι ένας ιστότοπος (website) µε κοινωνικές υπηρεσίες σελιδοσήµανσης (social bookmarking) ειδήσεων, βασισµένες στην λειτουργία κοινότητας, που επιτρέπει σε ανθρώπους να µοιράζονται άρθρα και δηµοσιεύσεις που έχουν ανακαλύψει στο ίντερνετ και είναι ενδιαφέροντα για τους ίδιους. Επιτρέπει στους χρήστες να µοιράζονται οτιδήποτε θέλουν, όπως νέα, προηχογραφηµένες εκποµπές (podcasts) ή βίντεο κλπ. Οι καταχωρίσεις λαµβάνουν ψήφο από τους χρήστες και αν συγκεντρώσουν πολλές ψήφους, κερδίζουν προβολή και δηµοσιότητα. Χρησιµοποιώντας το Digg µπορεί κάποιος να βοηθήσει την επιχείρησή του να κερδίσει προβολή και αυξηµένη αναγνώριση. Το Digg εµπεριέχει την δυνατότητα αποθήκευσης ιστοτόπων και ιστοσελίδων για να τις δει κάποιος σε µεταγενέστερο χρόνο ή να τις µοιραστεί µε άλλους. Είναι µια δωρεάν υπηρεσία για την κοινότητα των χρηστών του. Είναι πολύ καλό να ελέγχει κάποιος άλλους δικτυακούς τόπους που υπάρχουν στο δίκτυο για να δει και να καταλάβει πώς χρησιµοποιούν κάποιον δικτυακό τόπο. Ο στόχος είναι να µπορεί να προσφέρει παρόµοιο περιεχόµενο, όπως και οι ανταγωνιστές του. Το να δείχνει κάποιος ότι είναι ειδικός στον επαγγελµατικό του χώρο θα βοηθήσει άλλους χρήστες να κατανοήσουν καλύτερα τις υπηρεσίες που προσφέρει η επιχείρησή του. Εικόνα 32: ιάφορες υπηρεσίες κοινωνικής δικτύωσης Λογισµικό Εργαλεία SEO 113

115 Κεφάλαιο 6 Ποιοτική Ανάλυση Περιεχοµένου

116 Κεφάλαιο 6 Ευρεστικές αρχές ποιοτικής ανάλυσης περιεχοµένου Η ανάλυση περιεχοµένου δικτυακών τόπων αποτελεί µια δύσκολη, ιδιαίτερα κοπιαστική διαδικασία που εξαρτάται από ένα ευρύ φάσµα παραµέτρων. Με µια πρώτη γενική εκτίµηση, θα λέγαµε πως µια τέτοια ανάλυση περιλαµβάνει σαφώς την εξέταση των στόχων και µια συνολική αξιολόγηση της αποτελεσµατικότητας µιας ιστοσελίδας µε στόχο τη βελτιστοποίηση του περιεχοµένου που αυτή συµπεριλαµβάνει. Μια αξιολόγηση που εξετάζει παράγοντες όπως είναι η συνολική ευχρηστία, η σχεδιαστική αποτελεσµατικότητα, η διάταξη κειµένου, η πλοήγηση και άλλα. Στο σηµείο αυτό ίσως θα ήταν αρκετά χρήσιµη η δηµιουργία κάποιων κανόνων, κάποιων ευριστικών µεθόδων και αρχών µε βάση τις οποίες θα είχε τη δυνατότητα κάποιος να πραγµατοποιήσει µια τέτοια ανάλυση των περιεχοµένων ενός δικτυακού τόπου. Οι ευριστικές προσεγγίσεις δεν επιδιώκουν την εξεύρεση βέλτιστης λύσης, αλλά οδηγούν σε λύσεις τεχνικά αποδεκτές και αρκετά κοντά στη βέλτιστη. Με τη χρήση λοιπόν κάποιων ευριστικών κανόνων, αποφεύγεται η διερεύνηση όλου του χώρου αναζήτησης λύσεων και κατά συνέπεια µειώνεται ο όγκος και ο χρόνος των απαιτούµενων υπολογισµών. Οι αρχές αυτές παρέχουν έναν σηµαντικό τρόπο οργάνωσης µιας τέτοιας αναφοράς και βοηθούν στην αναγνώριση σηµαντικών προβληµάτων παρέχοντας ποιοτικά κυρίως αποτελέσµατα και αναδεικνύοντας τις γενικότερες τάσεις. Αξίζει να σηµειωθεί πως, ενώ οι αρχές αυτές µπορούν να χρησιµοποιηθούν για οποιοδήποτε είδος δικτυακού τόπου ανεξάρτητα από το µέγεθος ή το περιεχόµενο του, ορισµένες από αυτές ίσως είναι λιγότερο εφαρµόσιµες για κάποιους ιστότοπους. Τέτοιες αρχές περιγράφονται αναλυτικότερα παρακάτω και είναι [9]: 1) (Συµ) παράθεση (Collocation) Τοποθέτηση µαζί σε ένα σηµείο των (επί µέρους) στοιχείων περιεχοµένου µε σχετικό νόηµα και περιεχόµενο ή στοιχεία περιεχοµένου για το ίδιο θέµα σε µία ενότητα. Οι χρήστες θα πρέπει να είναι σε θέση να βρουν εύκολα όλο το σχετιζόµενο περιεχόµενο. Συνεπώς είναι σηµαντικό, το περιεχόµενο αυτό να είναι συγκεντρωµένο σε µια περιοχή ή σε τελική ανάλυση αυτό να είναι προσβάσιµο µέσα από µια τέτοια Ευρεστικές αρχές ποιοτικής ανάλυσης περιεχοµένου 115

117 Κεφάλαιο 6 περιοχή. Προφανώς, εάν η ποσότητα ενός περιεχοµένου είναι αρκετά µεγάλη, οι επισκέπτες θα πρέπει να εισέλθουν σε διαφορετικά υποκεφάλαια για να δουν όλο το συναφή περιεχόµενο. Σε µια τέτοια περίπτωση, ο ίδιος ο δηµιουργός της ιστοσελίδας θα πρέπει να φροντίσει έτσι ώστε να γίνει εύκολα αντιληπτό από τους επισκέπτες πως οι διαφορετικές αυτές περιοχές σχετίζονται µεταξύ τους. Όταν αυτές οι περιοχές θεαθούν µαζί, παρέχουν µια ενιαία εικόνα του προϊόντος ή του ενδιαφεροµένου θέµατος. Το σηµαντικότερο σηµείο εδώ και αυτό που θα πρέπει να προσεχθεί είναι να µην υπάρχει ταυτόχρονα κάποιο περιεχόµενο σε µια ενότητα, πιθανόν εξαιτίας της χρονικής ανάπτυξης του website, ενώ παράλληλα το µεγαλύτερο µέρος του σχετιζόµενου περιεχοµένου βρίσκεται και είναι προσβάσιµο σε διαφορετική περιοχή. 2) ιάκριση/ ιαφοροποίηση (Differentiation) Τοποθέτηση ανόµοιων στοιχείων περιεχοµένων ή στοιχείων διαφορετικών θεµατικών κατηγοριών σε διαφορετικές ενότητες. Χρήση µενού πλοήγησης για διαφορετικές περιοχές που πραγµατικά αναδεικνύουν αυτές τις διαφορές. Ένας από τους χαρακτηριστικούς τρόπους που οι ιστοσελίδες σπάνε αυτή την κατεύθυνση είναι µε τη χρήση των Frequently Asked Questions. Οι FAQ όπως είναι η συντοµογραφία τους, συχνά φέρνουν µαζί µια µεγάλη ποικιλία τίτλων σε θέµατα που είναι σηµαντικά για τους επισκέπτες. Ίσως οι δηµιουργοί ιστοσελίδων θεωρούν πως µε αυτό τον τρόπο κάνουν εύκολο στους χρήστες να βρουν τις πληροφορίες όταν τοποθετούν καθετί σηµαντικό σε ένα µέρος. Το πρόβληµα εδώ για έναν χρήστη είναι πως η αναζήτηση του για µια ειδική συγκεκριµένη πληροφορία ταιριάζει µε το παροµοιώδες «σαν να ψάχνει ψήλους στα άχυρα». Εποµένως, χρειάζεται οι FAQ να έχουν µια σωστή διάταξη τίτλων/επικεφαλίδων έτσι ώστε οι χρήστες να µην χρειάζεται να ψάχνουν µακρές λίστες για να βρουν µια συγκεκριµένη πληροφορία και εδώ αναρωτιέται κανείς πόσο καλύτερα θα ήταν ένας διαχωρισµός σε µεστές νοήµατος και περιεχοµένου ενότητες. 3) Πληρότητα (Completeness) Ολόκληρο το περιεχόµενο που αναφέρεται η συνδέεται µε ένα δικτυακό τόπο θα πρέπει να υπάρχει. Στις µέρες µας δεν υπάρχει καµία δικαιολογία για την αναφορά σφάλµατος 404 (Page not found) σε µια ιστοσελίδα. εν υπάρχει δικαιολογία ούτε Ευρεστικές αρχές ποιοτικής ανάλυσης περιεχοµένου 116

118 Κεφάλαιο 6 και για την ένδειξη under construction. Εάν το περιεχόµενο δεν υπάρχει, είναι ανώφελο να οδηγούνται οι χρήστες σε κάτι που ίσως θα υπάρχει στο µέλλον. Εάν υπάρχει εξωτερική αναφορά σε σχετική θεµατική περιοχή, σιγουρευτείτε πως το περιεχόµενο είναι ενεργό στον εν λόγω δικτυακό τόπο. Το να οδηγείται ένας χρήστης σε πληροφορίες που δεν υπάρχουν, τον κάνουν να χάνει απλά την εµπιστοσύνη του προς την ιστοσελίδα. 4) Αίσθηση πληροφοριών (Information scent) Οι κατηγορίες περιεχοµένου θα πρέπει να είναι καταλλήλως περιγραφικοί όσον αφορά το περιεχόµενο, ούτως ώστε οι χρήστες να κατανοούν ότι είναι στο κατάλληλο µονοπάτι να βρουν την πληροφορία που αναζητούν. Τέτοιες κατηγορίες θα πρέπει εποµένως να αντανακλούν µια διάκριση ή µια ενότητα πληροφοριών. Ειδικοί του χώρου επισηµαίνουν πως: η αίσθηση που αποπνέει µέσα από τις πληροφορίες παρέχεται από την αµεσότητα των στοιχείων που παρατηρεί και αντιλαµβάνεται ένας χρήστης και που αναδεικνύουν τη αξία, το κόστος της πρόσβασης και τον εντοπισµό του περιφερικού περιεχοµένου πληροφοριών. Στο περιβάλλον της αναζήτησης πληροφοριών στο διαδίκτυο για παράδειγµα, κάτι τέτοιο παρέχεται από τα µικρά κοµµάτια κειµένου και τα γραφικά που περιβάλλουν συνδέσµους σε άλλες σελίδες. Η αµεσότητα των στοιχείων που παρέχεται από αυτά τα µικρά κοµµάτια παρέχει όπως προαναφέραµε ενδείξεις της αξίας, του κόστους και του εντοπισµού του ακραίου περιεχοµένου της συνδεδεµένης σελίδας. Ένας καλός δικτυακός τόπος θα πρέπει να προσφέρει στους χρήστες ισχυρά στοιχεία, όπως ακριβώς και το περιεχόµενο που βρίσκει κάποιος επιλέγοντας µία συγκεκριµένη σύνδεση. Εξασφαλίστε ότι: οι σύνδεσµοι και οι περιγραφές των ενοτήτων κατηγορηµατικά περιγράφουν, ότι θα αντικρύσουν οι χρήστες στον συγκεκριµένο προορισµό. Εναντιωθείτε στις διάφορες επιλογές πλοήγησης για µια συγκεκριµένη πληροφορία, είναι προτιµότερο εάν οι χρήστες µπορούν ξεκάθαρα να αναγνωρίσουν την µία και µόνο πορεία προς αυτό που αναζητούν και συνειδητοποιήσουν πως οι άλλες κατευθύνσεις τους είναι άχρηστες. Επίσης µην χρησιµοποιείτε κατασκευασµένες λέξεις ή κάποι&