2. Real Web time personalization

Σχετικά έγγραφα
Ανάκτηση Πληροφορίας

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Προτεινόμενες Διπλωματικές Εργασίες 2009

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΟΙΚΟΝΟΜΙΑΣ ΥΠΟΔΟΜΩΝ, ΝΑΥΤΙΛΙΑΣ & ΤΟΥΡΙΣΜΟΥ ΑΠΟΦΑΣΗ ΕΠΙ ΔΗΛΩΣΗΣ ΣΗΜΑΤΟΣ ΑΠΟΦΑΣΗ ΕΞ 3113/

Βασίλης Πλαχούρας. Χρυσόστομος Καπέτης Μιχάλης Βαζιργιάννης. Οικονομικό Πανεπιστήμιο Αθηνών 3/11/2003

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Ανάπτυξη ιστολογίου. Γνωστικό αντικείμενο: Ερευνητική Εργασία - Project. Δημιουργός: ΦΩΤΙΟΣ ΛΑΖΑΡΙΝΗΣ

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή

Social Web: lesson #4

Ηλεκτρονικό Επιχειρείν & Νέες Τεχνολογίες για Επιχειρηματικότητα ΔΕΟ45

Πρόταση θέµατος πτυχιακής εργασίας

Δικτυακοί τόποι. Η σχεδίαση ενός δικτυακού τόπου. Δρ. Ματθαίος Α. Πατρινόπουλος

ΔΙΑΣΥΝΔΕΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΙΣΤΟΣΕΛΙΔΩΝ ΣΕ ΕΝΙΑΙΟ ΠΕΡΙΒΑΛΛΟΝ: ΕΦΑΡΜΟΓΗ ΣΤΟΝ ΙΣΤΟΤΟΠΟ ΤΗΣ ΣΧΟΛΗΣ ΧΗΜΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΕΜΠ

Προτεινόμενες Διπλωματικές Εργασίες 2008

interactivecommunication Search Marketing White Paper Φεβρουάριος , Cybertechnics Ltd. All rights reserved.

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΑΞΙΟΠΟΙΗΣΗ ΑΝΟΙΧΤΩΝ ΔΕΔΟΜΕΝΩΝ ΣΤΗΝ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΓΙΑ ΕΥΦΥΕΙΣ ΔΗΜΟΥΣ

Β Εξάµηνο Τίτλος Μαθήµατος Θ Φ Α.Π Ε Φ.E. Π.Μ Προαπαιτούµενα

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα

Τα είδη των ιστοσελίδων. Web Sites E-commerce Sites CMS & Blog Sites CMS Flash Facebook Layouts Tumblr Themes

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Διαδικαστικά

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΕΥΝΗΤΙΚΗ ΟΜΑΔΑ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ & ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ (DB-NET)

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

Σεμινάριο Wordpress CMS (Δημιουργία Δυναμικών Ιστοσελίδων)

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ «ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑ & ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ» ΚΑΙ ΠΕΡΙΦΕΡΕΙΩΝ ΣΕ ΜΕΤΑΒΑΣΗ ΕΘΝΙΚΟ ΣΤΡΑΤΗΓΙΚΟ ΠΛΑΙΣΙΟ ΑΝΑΦΟΡΑΣ ΕΣΠΑ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΙΣΤΟΤΟΠΩΝ

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014

Κοινωνικά Δίκτυα & Καλές Περιβαλλοντικές Πρακτικές

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

Οικονομική Προσφορά Προώθηση ιστοσελίδας

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

Δίνουμε λύσεις, δεν προτείνουμε

ΕΠΑΓΓΕΛΜΑΤΙΚΟ ΣΕΜΙΝΑΡΙΟ MARKETING & SMS MARKETING ΗΡΑΚΛΕΙΟ 31/5/2014

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια)

1. ΕΙΣΑΓΩΓΗ 2. ΠΕΡΙΓΡΑΦΗ

Ενσωματωμένα controls τα οποία προσαρμόζονται και χρησιμοποιούνται σε οποιαδήποτε ιστοσελίδα επιλέγει ο φορέας.

Βάσεις Δεδομένων Ενότητα 1

ΝΕΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ, ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ, ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ, ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΕΙΣΑΓΩΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Υπηρεσίες Ψηφιακής Βιβλιοθήκης Ανοικτής Πρόσβασης Ε.Μ.Π.

Αριστομένης Μακρής. Συστήματα Επιχειρηματικής Ευφυΐας (BI/BA)

The DeGroot model for Social Influence and Opinions

Σχεδίαση και Ανάπτυξη Ιστότοπων

Παρακολούθηση και βελτιστοποίηση της επισκεψιμότητας ενός δικτυακού τόπου

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Εργαλεία ανάπτυξης εφαρμογών internet Ι

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

4.2.1 Α εξάμηνο Β εξάμηνο Γ εξάμηνο 4.2. ΣΥΝΟΠΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΑΝΑ ΕΞΑΜΗΝΟ

Πώς λειτουργεί το Google?

Μαθησιακοί Στόχοι Προγράμματος Σπουδών

GoDigital.CMS Content Management System. Πλήρης διαχείριση περιεχομένου ιστοσελίδας

10 λόγοι να φτιάξω ιστοσελίδα

ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ: ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ TMHMA ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε.

2 Μάρκετινγκ µηχανών αναζήτησης (Search Engine Marketing).

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

Liveschool Marketing Services

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΔΙΑΔΙΚΤΥΑΚΗ ΠΡΟΒΟΛΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ

BetaCMS. Επισκόπηση. BetaCONCEPT

ΤΕΛΙΚΕΣ ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ (6 Μονάδες ECTS)- Ακαδημαϊκό Έτος

ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting

Τεχνικές Εξόρυξης Δεδομένων

Ανάκτηση Πληροφορίας

Ποια cookies χρησιμοποιούμε στον ιστότοπό μας;

Ανίχνευση απαιτήσεων χρηστών για υπηρεσίες ψηφιακών βιβλιοθηκών μέσα από ποιοτικές μεθοδολογικές προσεγγίσεις

Ημερίδα διάχυσης αποτελεσμάτων έργου Ιωάννινα, 14/10/2015

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Περιεχόμενα. 2 Αριθμητικά συστήματα

ΘΕΜΑΤΑ ΔΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ Εργ. Συστημάτων Βάσεων Γνώσεων & Δεδομένων LOCATION BASED SERVICES ΕΙΣΑΓΩΓΙΚΟ ΣΗΜΕΙΜΩΜΑ

ό ή ύ ύ ύ ώ ά ς ύ ς ής ί ώ,... Τοµέας Επιµόρφωσης & Κατάρτισης

ΠΡΟΔΙΑΓΡΑΦΕΣ ΕΝΟΣ ΗΛΕΚΤΡΟΝΙΚΟΥ ΚΑΤΑΣΤΗΜΑΤΟΣ

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business.

DIGITAL MARKETING. ΠΩΣ τα αξιοποιείτε και ΠΟΙΟΣ τα λειτουργεί;

α. Προσωπικά δεδομένα που δύνανται να ζητηθούν από την σελίδα.

κεφάλαιο Βασικές Έννοιες Επιστήμη των Υπολογιστών

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Προσαρ α μοζό ζ μεν ε ες ε ς Τε Τ χ ε νικ ι έ κ ς έ ς στο τ Ηλεκ ε τ κ ρ τ ον ο ικ ι ό κ Ε μπόρ ό ιο Εργα γ λεί ε α ί κ α κ ι ι Ε φα φ ρ α μογέ γ ς

Υπηρεσίες Ανάπτυξης ικτυακών Τόπων Οργάνωση και Ανάπτυξη Μεθόδων Ανάκτησης Πληροφοριών και Ψηφιακού Υλικού

Φόρμα Επικοινωνίας ΠΡΟΟΙΜΙΟ

Πληροφοριακά Συστήματα Διοίκησης


Γενική Παρουσίαση ADMAN

ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ: ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ TMHMA ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ

Ηλεκτρονική Επιχειρηματικότητα

Τιμοκατάλογος Διαφήμισης 2013

GoDigital.Store E-Commerce Platform

Φιλίππου Θεοδόσιος Εκπαιδευτικός Πληροφορικής

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΕΥΝΗΤΙΚΗ ΟΜΑΔΑ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ & ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ (DB-NET) http://www.db-net.aueb.gr ΥΠΕΥΘΥΝΟΣ: ΑΝ. ΚΑΘΗΓΗΤΗΣ Μ. ΒΑΖΙΡΓΙΑΝΝΗΣ (mvazirg@aueb.gr) ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ 2010 A ΤΙΤΛΟΣ / Α 1. Model learning & mining the spectral structure of the web graph 2. Real Web time personalization ΠΕΡΙΓΡΑΦΗ Στόχος της εργασίας είναι η μάθηση μοντέλων πρόβλεψης κατάταξης ιστοσελιδων στον παγκόσμιο ιστό. Θεωρούμε μια σειρά από παρατηρήσεις (σελίδες, κατάταξη και ένα πλήθος χαρακτηριστικών) στο χρόνο. Με βάση τα δεδομένα εκπαίδευσης θα γίνει εκπαίδευση μοντέλων κατάταξης (στην βάση πολλών χαρακτηριστικών) σελίδων σε κατηγορίες οι οποίες προβλέπουν την κατάταξη της σελίδας. Προβλέπεται η προ επεξεργασία των δεδομένων με spectral μετασχηματισμούς (PCA, SVD). Μέρος της εργασίας θα αφιερωθεί στην συλλογή και διαχείριση δεδομένων από τον παγκόσμιο ιστό - Καλή γνώση μαθηματικών και ειδικότερα γραμμικής άλγεβρας και αναλυτικής γεωμετρίας. Πολύ καλή γνώση προγραμματισμού και ειδικότερα του περιβάλλοντος MATLAB. Σχετική δημοσίευση: - Polyxeni Zacharouli, Michalis Titsias, Michalis Vazirgiannis: «Web Page Rank Prediction with PCA and EM Clustering», WAW 2009: 104-115. Η μεγάλη κινητικότητα στο χώρο της εξατομίκευσης αποδεικνύει το μεγάλο ερευνητικό και κυρίως εμπορικό ενδιαφέρον για την αναζήτηση νέων και τη βελτίωση των υπαρχόντων μεθόδων παροχής προσωποποιημένων υπηρεσιών στο διαδίκτυο. Η πρωτοτυπία της προτεινομενης εργασίας εγκειται στη υλοποίησης αυτού του είδους των υπηρεσιών από τον πάροχο διαδικτύου και όχι από έναν μεμονωμένο δικτυακό τόπο. Μια τέτοια υπηρεσία θα έχει ιδιαίτερα βελτιωμένα αποτελέσματα σε σχέση με τις υπάρχουσες. Αυτό συμβαίνει διότι οι συστάσεις (recommendations) που γίνονται στο χρήστη γίνονται

βάση της συνολικής διαδικτυακής συμπεριφοράς του. Το αντικείμενο της εργασίας είναι η σχεδίαση και ανάπτυξη ενός συστήματος που θα δίνει τη δυνατότητα εξατομίκευσης στον παγκόσμιο ιστό σε πραγματικό χρόνο από τον πάροχο διαδικτύου, δηλαδή την προσαρμογή του περιεχομένου των ιστοσελίδων ενός δικτυακού τόπου, λαμβάνοντας υπόψη τη συμπεριφορά του χρήστη *καθώς* αυτός περιηγείται στο διαδίκτυο. Με τον τρόπο αυτό ο χρήστης υποβοηθείται κατά την περιήγηση του, ακολουθώντας τις προτάσεις με επόμενες ιστοσελίδες που πιθανότατα θα ενδιαφέρεται να επισκεφθεί, ενώ παράλληλα εξυπηρετείται και η εμπορική διαδικασία με την προβολή στο χρήστη πληροφοριών όπως προσφερόμενες υπηρεσίες, διαφημίσεις, προϊόντα που είναι πιθανόν να τον ενδιαφέρουν. Προγραμματισμός Java, γνώση τεχνολογιών Διαδικτύου και χειρισμού κειμένου. Σχετικές Δημοσιεύσεις: Magdalini Eirinaki, Michalis Vazirgiannis: Web site personalization based on link analysis and navigational patterns. ACM Trans. Internet Techn. 7(4): (2007) 3. Συλλογή δεδομένων από τον Κρυφό Ιστό (Deep Web Crawling) επίβλεψη: Δρ. Β. Πλαχούρας) Το μεγαλύτερο μέρος της διαθέσιμης πληροφορίας στον Παγκόσμιο Ιστό είναι αποθηκευμένο σε βάσεις δεδομένων, οι οποίες αποτελούν τον Κρυφό Ιστό (Hidden ή Deep Web), και είναι προσβάσιμες μέσω διεπαφών βασισμένων σε φόρμες. Οι διεπαφές αυτές είναι άμεσα κατανοητές από τους χρήστες, αλλά όχι από το λογισμικό που συλλέγει και επεξεργάζεται αυτόματα ιστοσελίδες για τις μηχανές αναζήτησης στον Παγκόσμιο Ιστό, με αποτέλεσμα μεγάλο μέρος της διαθέσιμης πληροφορίας να μην ευρετηριάζεται από τις μηχανές αναζήτησης. Στόχος της διπλωματικής εργασίας είναι α) η συγκέντρωση και η σύγκριση των προτεινόμενων μεθόδων στη βιβλιογραφία για την αυτόματη εξαγωγή πληροφορίας από βάσεις δεδομένων στον Κρυφό Ιστό, και β) η υλοποίηση και επέκταση των παραπάνω μεθόδων για την αυτόματη εξαγωγή πληροφορίας από τις βάσεις δεδομένων.

προγραμματισμός Java, γνώση τεχνολογιών Διαδικτύου και χειρισμού κειμένου. Σχετικές Δημοσιεύσεις: Versioned Corpora. In Proceedings of the ECIR 2008 Workshop on Efficiency Issues on Information Retrieval (EIIR), 2008. 4. Ευρετηρίαση και συμπίεση αρχειοθετημένο υ ιστοπεριεχομέν ου (Indexing versioned document collections) επίβλεψη: Δρ. Β. Πλαχούρας) Οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό ευρετηριάζουν μόνο την πιο πρόσφατη έκδοση των ιστοσελίδων, αγνοώντας αλλαγές μεταξύ των διαδοχικών εκδόσεών τους. Υπάρχουν όμως πολλά παραδείγματα εφαρμογών όπου είναι απαραίτητη η ευρετηρίαση των διαφορετικών εκδόσεων της ίδιας ιστοσελίδας, όπως το Internet Archive (http://www.archive.org), που διατηρεί ιστορικές συλλογές με το περιεχόμενο ιστοσελίδων, και η Wikipedia (http://www.wikipedia.org) που διατηρεί τις διαδοχικές εκδόσεις του περιεχομένου της. Στην απλούστερη περίπτωση ευρετηρίασης, οι διαφορετικές εκδόσεις αποθηκεύονται ως διαφορετικά κείμενα. Το μειονέκτημά σε αυτή την περίπτωση είναι ότι δεν επιτυγχάνεται βέλτιστη συμπίεση από την εκμετάλλευση των διαφορών μεταξύ των διαδοχικών εκδόσεων. Στόχος της διπλωματικής είναι η υλοποίηση, σύγκριση, και πιθανή εξέλιξη προτεινόμενων μεθόδων από τη βιβλιογραφία για την ευρετηρίαση διαφορετικών εκδόσεων κειμένων. Η υλοποίηση θα βασιστεί σε κάποια από τις υπάρχουσες πλατφόρμες, για παράδειγμα Lucene ή Terrier, καθώς και σε δεδομένα από τη Wikipedia ή διαδοχικές εκδόσεις ιστότοπων. προγραμματισμός Java, γνώσεις τεχνολογιών χειρισμού κειμένου. Σχετικές αναφορές: 1) J. He, H. Yan, T. Suel. Compact full-text indexing of versioned document collections. In Proceedings of the 18th ACM conference on Information and knowledge management, pp 415-424, 2009. 2) K. Berberich, S. Bedathur, G. Weikum. Tunable Word-Level Index Compression for

5. Αυτοματοποιημ ένη δημιουργία διαφημιστικής καμπάνιας Είναι πολύ σημαντική πλέον η διαφήμιση στον Παγκόσμιο Ιστό σε οικονομικά μεγέθη. Η ανάπτυξη μιας καμπανιάς είναι μια σύνθετη διαδικασία η οποία εμπλέκει την επιλογή λέξεων κλειδιών, γεωγραφικών, γλωσσικών, χρονικών και άλλων περιορισμών (όπως τιμές σε δημοπρασίες κλπ). Η καλή σχεδίαση μιας καμπανιάς μπορεί να είναι ιδιαίτερα χρονοβόρα καθώς πρέπει να ικανοποιηθούν διάφοροι περιορισμοί (προϋπολογισμός, CPC, CPA, CPM κλπ). Επίσης είναι αναγκαία η ημιαυτόματη δημιουργία μαζικών αναφορών για την παρακολούθηση μιας καμπανιάς στην βάση των services που παρέχονται από το Google Analytics. Στόχος της εργασίας θα είναι να αναπτυχτεί μια μεθοδολογία και ένα εργαλείο για την ημιαυτόματη ανάπτυξη διαφημιστικής καμπάνιας adwords στην βάση των παραπάνω χαρακτηριστικών. Για την ανάπτυξη θα γίνει χρήση των services παρέχει το Goggle στα σχετικά APIs Σχετικά Links: http://code.google.com/apis/adwords/ http://blog.programmableweb.com/2009/04/23/google-analytics-api-released-now-get-your-web-sitemetrics-via-code/ 6. Word Sense Disambiguation For information Retrieval επίβλεψη: Β. Πλαχούρας) Ο στόχος της εργασίας θα είναι η εφαρμογή και επέκταση μηχανισμού αποσαφήνισης λέξεων που έχει αναπτυχθεί από την ομάδα μας [1] και η επέκταση και εφαρμογή της σε περιβάλλον ανάκτησης πληροφορίας με στόχο την βελτίωση της ποιότητας ανάκτησης. Προαπαιτούμενη γνώση: - αλγόριθμοι ανάλυσης γράφων, εξοικείωση με χειρισμό κειμένου - C/C++ ή Java, Βάσεις Δεδομένων Αναφορές [1] D. Mavroeidis, G. Tsatsaronis, M. Vazirgiannis, M. Theobald, G. Weikum, "Word Sense Disambiguation for Exploiting Hierarchical Thesauri in Text Classification",in the proceedings of the ECML/PKDD 2005 Conference, Portugal

7. Αξιολόγηση πρωτεϊνικών αλληλεπιδράσε ων επίβλεψη: ΥΔ. Μ. Καρκαλή) Το πρόβλημα της αξιοπιστίας των πρωτεϊνικών αλληλεπιδράσεων που έχουν παρατηρηθεί παρουσιάστηκε με τη χρήση των high-throughput πειραμάτων που έδιναν μεγάλο αριθμό αλληλεπιδράσεων αλλά και μεγάλο αριθμό false positives. Σχεδόν αμέσως παρουσιάστηκε και το θέμα της αξιολόγησης αυτών των αλληλεπιδράσεων ώστε να μπορούν απομακρυνθούν τα false positives και να δημιουργηθεί ένας γράφος αξιόπιστων αλληλεπιδράσεων που θα μπορούσαν στην συνέχεια να αξιοποιηθούν για περαιτέρω ανάλυση. Στην εργασία θα γίνει μελέτη πάνω στις ήδη υπάρχουσες μεθόδους αξιολόγησης για τους αλγορίθμους τεχνητής μάθησης, τα χαρακτηριστικά γνωρίσματα και τα σύνολα εκπαίδευσης που χρησιμοποιούν και θα προταθεί μια νέα μέθοδος αξιολόγησης με δυνατότητα εφαρμογής σε ενοποιημένες βάσεις πρωτεϊνικών αλληλεπιδράσεων για τον οργανισμό Yeast. Η εργασία θα στηριχθεί σε προηγούμενη δουλεια πάνω στο θέμα με σκοπό την βέλτιστη επιλογή χαρακτηριστικών γνωρισμάτων και την βέλτιστη επιλογή και παραμετροποίηση αλγορίθμων τεχνητής μάθησης. Προαπαιτούμενη γνώση: C/C++ ή Java, Βάσεις Δεδομένων, 8. Group Formation and Evolution in Social Networks επίβλεψη: ΥΔ. Ν. Σαλαμάνος) 9. Evolution of the Two sided Markets Το αντικείμενο της εργασίας είναι η ανάπτυξη μοντέλων που ερμηνεύουν την εμφάνιση ομάδων (group, communities) σε social networks καθώς η μελέτη της εξέλιξη τους (evolution). Βασικά ερωτήματα είναι: α) υπάρχει κάποιο μοντέλο που προσομοιάζει την τάση των user να συμμετέχουν σε κάποιο group? β) πως συνδέεται η τοπολογία και η σημασιολογία του δικτύου με την εξέλιξη των group? Θα μελετηθούν συγκεκριμένα data-sets από social networks και θα αναπτυχθούν μοντέλα για την ερμηνείας τους. Matlab (ή η διάθεση να μάθετε), Java. Σχετικές Αναφορές: 1. L. Backstrom, D. Huttenlocher, J. Kleinberg, and X. Lan. Group formation in large social networks: Membership, growth, and evolution. In Proc. 12th KDD, pages 44{54, 2006. (http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.62.737 ). 2. Algorithmic Game Theory, (Chapter 24) (http://www.cambridge.org/journals/nisan/downloads/nisan_nonprintable.pdf ) 3. Matthew O. Jackson, Social and Economic Networks,. Princeton University Press (2008). Two sided Markets προκύπτουν όταν ένας αριθμός από online πλατφόρμες (π.χ. websites για: φωτογραφίες, video, question-answering, auctions κ.λ.π.), ανταγωνίζονται μεταξύ τους στο να προσελκύσουν users. Οι users ανήκουν συνήθως σε δύο κατηγορίες και κερδίζουν περισσότερο όταν αλληλεπιδρούν με user από την άλλη κατηγορία. Για

επίβλεψη: ΥΔ. Ν. Σαλαμάνος) παράδειγμα web sites για πλειστηριασμούς προϊόντων συνδέουν αγοραστές με πωλητές. Οι αγοραστές προτιμούν sites με μεγάλο αριθμό πωλητών (ποικιλία προϊόντων) ενώ οι πωλητές sites με μεγάλο αριθμό αγοραστών. Εμφανίζεται συνεπώς το network effect (http://en.wikipedia.org/wiki/network_effect ) όπου η μία κατηγορία χρηστών επηρεάζει τις επιλογές της άλλης. Το αντικείμενο του θέματος είναι η μελέτη της εξέλιξης (evolution) των two sided markets με την ανάπτυξη μοντέλων που θα ερμηνεύουν την επιλογή πλατφόρμας από τους users. Matlab (ή η διάθεση να μάθετε), Java. Σχετικές Αναφορές: 1. Evolution of Two-Sided Markets Kumar, R.; Lifshits, Y.; Tomkins, A., WSDM, (2010). (http://yury.name/papers/kumar2010evolution.pdf) 2. J. Rochet and J. Tirole. Two-sided markets: A progress report. The RAND Journal of Economics, 35(3):645{667, 2006.