Social Web: lesson #4

Σχετικά έγγραφα
Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

18α γενέθλια της Google

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

Πώς λειτουργεί το Google?

Ο αλγόριθμος PageRank της Google

Social Web: lesson #3

Το διαδίκτυο στην υπηρεσία µιας επιχείρησης. Χρήση διαδικτύου & socialmedia ως εργαλεία διαφήµισης χαµηλού κόστους

Internet Marketing

Παρακολούθηση και βελτιστοποίηση της επισκεψιμότητας ενός δικτυακού τόπου

2 Μάρκετινγκ µηχανών αναζήτησης (Search Engine Marketing).

Ανάκτηση Πληροφορίας (Information Retrieval IR)

6 Εικόνα εξώφυλλου: Λωρίδα του Mobius (Σύνθεση). Νικόλαος Μπαλκίζας 10

Παγκόσμιος ιστός και Internet συχνά θεωρούνται το ίδιο πράγμα. Η αντίληψη αυτή είναι λανθασμένη καθώς ο ιστός αποτελεί μία μόνο εφαρμογή του

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 11 : Ο αλγόριθμος PageRank της Google. Δρ.

Βελτίωση της θέσης της ιστοσελίδας στις μηχανές αναζήτησης

Liveschool Marketing Services

Παγκόσμιος ιστός και Internet συχνά θεωρούνται το ίδιο πράγμα. Η αντίληψη αυτή είναι λανθασμένη καθώς ο ιστός αποτελεί μία μόνο εφαρμογή του

ΕΓΧΕΙΡΙΔΙΟ ΟΡΘΩΝ ΠΡΑΚΤΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΕΣ ΚΑΜΠΑΝΙΕΣ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ

Σασών Ισαάκ Σπηλιάκος Κωνσταντίνος Τσιάνα Καλλιόπη

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Digital Marketing. Περακάκης Μάνος Καθηγητής Εφαρμογών Τομέας Ηλεκτρονικού Μάρκετινγκ

Αξιολόγηση Ιστοσελίδων. Εργασία. Χαράλαμπος Κουτσουρελάκης

INTERNET MARKETING. Προώθηση και Διαφήμιση στο Διαδίκτυο. Β Ο/Δ Ειδική Θεματική Δραστηριότητα Σχ. Έτος

Πνευµατικά ικαιώµατα

Εργαστήριο Προγραμματισμού και τεχνολογίας Ευφυών συστημάτων (intelligence)

ΠΟΛΥ ΜΕΓΑΛΗ : ΜΕΓΑΛΗ : ΜΕΣΑΙΑ: ΜΙΚΡΗ

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε.

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

Δικτυακά Πολυμέσα ΙΙ Διάλεξη #7 η : Μηχανές αναζήτησης: λειτουργία, αξιολόγηση. Γαβαλάς Δαμιανός

Δημιουργία μιας επιτυχημένης παρουσίας στο διαδίκτυο

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης

Μελέτη Πολιτικών Χρονοδροµολόγησης σε Κατανεµηµένα Συστήµατα Πλοηγητών. Όνοµα : Ελένη Τσιακκούρη

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Google AdWords. Κάθε κλικ και µία ευκαιρία. WebOrange

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

ΒΙΒΛΙΟΘΗΚΗ ΣΕΥΠ Γκουν Γκ ταβά τ Ε.

Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014

Εξωτερική Αναζήτηση. Ιεραρχία Μνήμης Υπολογιστή. Εξωτερική Μνήμη. Εσωτερική Μνήμη. Κρυφή Μνήμη (Cache) Καταχωρητές (Registers) μεγαλύτερη ταχύτητα

Κατάλογος Βιβλιοθήκης ΤΕΙ Ηπείρου Ιδρυματικό αποθετήριο ΤΕΙ Ηπείρου Ερευνητικό αποθετήριο ΤΕΙ Ηπείρου:

Ανάκτηση Πληροφορίας

Επιστήμη της Πληροφορικής. Εργασία του μαθητή Δημήτρη Τσιαμπά του τμήματος Α4

Οικονομική Προσφορά Προώθηση ιστοσελίδας

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

Google AdWords For Business. Antonis Papachrisanthou

ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ. Καταναλωτική συµπεριφορά και προστασία καταναλωτή Ο ρόλος της διαφήµισης στο διαδίκτυο

2 Πώς πουλάει διαφημιστικό χώρο η Google;

ΕΝΗΜΕΡΩΣΗ ΑΝΑΦΟΡΙΚΑ ΜΕ ΤΗΝ ΕΠΕΞΕΡΓΑΣΙΑ ΤΩΝ ΠΡΟΣΩΠΙΚΩΝ ΣΑΣ ΔΕΔΟΜΕΝΩΝ ΜΕΣΩ ΤΗΣ ΙΣΤΟΣΕΛΙΔΑΣ. (Data Privacy Notice)

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

Ανάκτηση Δεδομένων (Information Retrieval)

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΚΟΙΝΩΝΙΚΑ ΔΙΚΤΥΑ: Ο ΡΟΛΟΣΤΟΥΣ ΣΤΗΝ ΚΟΙΝΩΝΙΚΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΖΩΗ. A Τετράμηνο

Social Network : Programming on FACEBOOK

Προγράμματα προσέγγισης χρηστών στις ελληνικές βιβλιοθήκες: έρευνα σε χρήστες και επαγγελματίες της πληροφόρησης

Παρουσίαση Εφαρμογής i-flow Protocol. (Ηλεκτρονική Διαχείριση Αλληλογραφίας Οργανισμών)

ΕΛ. ΚΑΜΠΑΡΑΚΗ 1 ο ΓΥΜΝΑΣΙΟ ΝΕΟΥ ΨΥΧΙΚΟΥ

Μελέτη Περίπτωσης: Random Surfer

Εισαγωγή στην επιστήμη των υπολογιστών. Οργάνωση εδομένων Κεφάλαιο 11ο ομές εδομένων

Google AdWords για βίντεο με TrueView.Πληρώστε

Δημιουργία εσόδων και τιμολόγηση στο διαδίκτυο

Βιβλιοθήκη. Ωράριο Δευτέρα Τετάρτη Παρασκευή 8:00 15:00 Tρίτη Πέμπτη 8:00 20:00

Information Retrieval

ΟΔΗΓΟΣ ΔΗΜΙΟΥΡΓΙΑΣ ΛΟΓΑΡΙΑΣΜΟΥ ΣΤΟ GOOGLE SCHOLAR ΓΙΑ ΤΑ ΜΕΛΗ ΔΙΔΑΚΤΙΚΟΥ - ΕΡΕΥΝΗΤΙΚΟΥ ΠΡΟΣΩΠΙΚΟΥ

Στην πράξη ουσιαστικά αντικαθιστά τον παραδοσιακό κατάλογο μιάς Βιβλιοθήκης με όλα τα παραπάνω πλεονεκτήματα.

Ηλεκτρονική Διαφήμιση. Αντωνιάδου Όλγα

Ομάδα 10: Δαρατζίκης Ιωάννης 47/11 Μπάκας Βασίλειος 48/11

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463

Τα είδη των ιστοσελίδων. Web Sites E-commerce Sites CMS & Blog Sites CMS Flash Facebook Layouts Tumblr Themes

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ Εαρινό Εξάμηνο

Υπολογιστικά Νέφη. Ενότητα 12: MapReduce. Άγγελος Μιχάλας Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΔΙΑΔΙΚΤΥΑΚΗ ΠΡΟΒΟΛΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ

Τα αλγοριθμικά μέσα και οι κοινωνικές τους επιπτώσεις

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Διορθώσεις σελ

Γενικές Ηλεκτρονικές Υπηρεσίες

Διάλεξη 8. Επαναληπτικό μάθημα Ηλεκτρονική Επιχειρηματικότητα Δρ. Α. Στεφανή

ΗΥ360 Αρχεία και Βάσεις εδοµένων

Ο Ι ΚΟ Ν Ο Μ Ι Κ Α / Σ ΤΑΤ Ι Σ Τ Ι Κ Η

Ανάκτηση Πληροφορίας

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Διαδικτυακές Υπηρεσίες Αναζήτησης, Απεικόνισης και Απευθείας Πρόσβασης στα δεδομένα ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ. Έκδοση 0.1.

Πληροφορική 2. Δομές δεδομένων και αρχείων

στην Εκπαίδευση Ομάδα 2 Α Λυκείου 13/6/2014 1

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ ΜΑΘΗΜΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Β ΛΥΚΕΙΟΥ

Για ποιον σκοπό χρησιμοποιούνται τα cookies σε αυτό τον ιστοχώρο; Για ποιούς σκοπούς ΔΕΝ χρησιμοποιούνται τα cookies σε αυτό τον ιστοχώρο;

Διαφάνεια 9.1. Κεφάλαιο 9 Διαχείριση των σχέσεων με τους πελάτες

Η έρευνα και το διαδίκτυο:

Διαδανεισμός, Πρωτόκολλο z39.50 Στρατηγικές αναζήτησης

Ερευνητικές τάσεις στο πεδίο της βιβλιοθηκονομίας και της επιστήμης της πληροφόρησης: Η δημοσιευμένη έρευνα

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών. Τμήμα Οικονομικών Επιστημών. Βιβλιοθήκη. Κανονισμός Λειτουργίας

Επεξεργασία Ερωτήσεων

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων

Transcript:

Social Web: lesson #4 looking for relevant information browsing searching monitoring recommendations Information Retrieval the inverted index Google.com the pagerank algorithm the value of words the price of words

Information Retrieval Η Αναζήτηση Πληροφοριών (ΑΠ) (Information Retrieval (IR)) είναι η επιστήμη που ασχολείται με την αναζήτηση κειμένων, ή και άλλων πληροφοριακών αντικειμένων (εικόνες, κλιπ ήχου). Στόχος της ΑΠ είναι η αντιμετώπιση του φαινομένου του Πληροφοριακού Υπερφόρτου, με την ανεύρεση πληροφορίας που είναι σχετική με τις παρούσες ανάγκες ενός χρήστη. Η ΑΠ είναι ένας διεπιστημονικός τομέας που βασίζεται στην επιστήμη των υπολογιστών, τα μαθηματικά, την βιβλιοθηκονομία, την θεωρία πληροφοριάς, την ψυχολογία, την γλωσσολογία, την στατιστική και την φυσική. Scene from Terry Gilliam s Brazil

inverted index word url url 1 url 2... url n word 1 10 15... 35 word 2 2 3... 5............... Το inverted index είναι μία δομή δεδομένων που χρησιμοποιείται ως ένα ευρετήριο που αντιστοιχεί περιεχόμενο, όπως λέξεις ή αριθμούς, στις θέσεις του σε ένα σύνολο από κείμενα ή σε μία βάση δεδομένων. Γίνεται συνήθως ο διαχωρισμός ανάμεσα record level και word level. word n 3 6... 8 The Inverted Index

google.com Ξεκίνησε το 1996 ως ερευνητικό πρόγραμμα του Larry Page και του Sergey Brin, δύο διδακτορικών φοιτητών του Πανεπιστημίου του Στανφορντ. Σε αντίθεση με τις μέχρι τότε μηχανές αναζήτης που ταξινομούσαν τις ιστοσελίδες με βάση το πόσες φορές εμφανίζεται σε αυτές κάθε όρος αναζήτησης, οι Page και Brin βασίστηκαν στην υπόθεση ότι η ανάλυση των διασυνδέσεων μεταξύ ιστοσελίδων θα μπορούσε να δώσει βελτιωμένα αποτελέσματα για να δημιουργήσουν τον γνωστό πλεόν αλγόριθμο PageRank. The Inverted Index

PageRank To PageRank είναι ένας αλγόριθμος ανάλυσης των δεσμών ενός δικτύου που προσδίδει ένα αριθμητικό βάρος σε κάθε κόμβο του δικτύου για να μετρήσει την σχετική του σημασία. Σύμφωνα με την Google: O PageRank βασίζεται στην δηµοκρατική φύση του διαδικτύου εκµεταλευόµενος την απέραντη συνδεσµολογία του ως ένα δείκτη της αξίας µίας σελίδας. Η Google αντιµετωπίζει κάθε δεσµό από την σελίδα Α στην σελίδα Β σαν µια ψήφο. Αναλύει όχι µόνο τις ψήφους που δέχεται κάθε σελίδα αλλά και το ποιόν των σελίδων από τις οποίες αυτές προέρχονται. Η ψήφοι που προέρχονται από σελίδες που είναι σηµαντικές έχουν µεγαλύτερο ειδικό βάρος. Η Αξία των ιστοχώρων ως συνάρτηση των συνδέσμων προς αυτούς.

the value of Words Οι λέξεις των κειμένων έχουν στατιστική αξία. Αναλύωντας την συχνότητα εμφάνισης των λέξεων μπορούμε να υπολογίσουμε το βάρος τους. Το βάρος μίας λέξης μετράει την ικανότητα της λέξης να διακρίνει το κείμενο στο οποίο ανήκει από τα υπόλοιπα κείμενα μίας συλλογής. Μπορεί επίσης να είναι ένα μέτρο του πόσο η συγκεκριμένη λέξη σχετίζεται με τα ενδιάφεροντα του χρήστη. Το βάρος των λέξεων μας επιτρέπει να είμαστε πιο ακριβείς κατά την ανάκτηση της πληροφορίας. Επίσης, αν περιοριστούμε στις πιο σημαντικές λέξεις μειώνουμε σημαντικά τις διαστάσεις του χώρου στον οποίο πραγματοποιούμε τους υπολογισμούς μας. A Bag of Words

the price of Words Το AdWords είναι η pay-per-click διαφημιστική υπηρεσία της Google και η βασική πηγή εσόδων της εταιρείας. Οι διαφημίσεις της Google παρουσιάζονται υπό την μορφή σύντομου κειμένου με συνοπτικό τίτλο και δύο γραμμές περιεχομένου. Διαφέρουν εμφανισιακά ελάχιστα από τα αποτελέσματα μίας αναζήτησης και σχετίζονται με το περιεχόμενό τους. Οι διαφημιζόμενοι πληρώνουν για τις λέξεις κλειδιά με τις οποίες οι χρήστες αναζητούν πληροφορίες. Το κόστος μίας λέξης αυξάνεται με την συχνότητα χρήσης της. Το AdSence είναι διαφημιστική υπηρεσία της Google που επιτρέπει σε ιδιοκτήτες ιστοχώρων να προσθέσουν σε αυτούς διαφημίσεις. Η επιλογή των διαφημίσεων γίνεται με βάση το περιεχόμενο της σελίδας. Ποσοστό από τα έσοδα των διαφημίσεων πηγαίνει στον ιδιοκτήτη του ιστοχώρου. A Bag of Words