Αξιολόγηση της Ποιότητας των Εξωτερικών Συνδέσμων της Wikipedia

Σχετικά έγγραφα
Αρχάνες, 10/12/2012 Αρ. Πρωτ: 561

Ολοκληρωμένη Χωρική Ανάπτυξη. Ειδική Υπηρεσία Στρατηγικής, Σχεδιασμού Και Αξιολόγησης (ΕΥΣΣΑ) Μονάδα Α Στρατηγικής και Παρακολούθησης Πολιτικών

ΜΑΘΗΜΑΤΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Πηγές πληροφόρησης και εργαλεία

Αναγνώριση Προτύπων. Σημερινό Μάθημα

«Εξατομικεύοντας την επιλογή των πόρων των ψηφιακών βιβλιοθηκών για την υποστήριξη της σκόπιμης μάθησης» Άννα Μαρία Ολένογλου

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Η Πληροφορική στο Δημοτικό Διδακτικές Προσεγγίσεις Αδάμ Κ. Αγγελής Παιδαγωγικό Ινστιτούτο

Κεφάλαιο 2.6: Η Διαδικασία Εντοπισμού Επιχειρηματικών Ευκαιριών. Το έκτο κεφάλαιο πραγματεύεται την ευρύτερη έννοια της

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Γιάννης Ι. Πασσάς. Γλώσσα. Οι λειτουργίες της γλώσσας Η γλωσσική 4εταβολή και ο δανεισ4ός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Μία χρονοσειρά (time serie) είναι μια ακολουθία

Εισαγωγή στην Οικονομική Επιστήμη ΙΙ

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

έγγραφο σε κάθε διάσταση αντιστοιχούν στο πλήθος εμφανίσεων της λέξης (που αντιστοιχεί στη συγκεκριμένη διάσταση) εντός του εγγράφου.

Συνοπτική Παρουσίαση Πακέτου Στατιστικών Ιστοσελίδων.

ΤΑΞΙΝΟΜΗΣΗ ΟΡΓΑΝΙΣΜΩΝ

ΑΝΑΚΟΙΝΩΣΗ. Πραγματοποιούν Χειμερινό Σχολείο με Θέμα: «Υποστήριξη ασθενών με καρκίνο και των φροντιστών τους»

Αλγόριθμοι & Βελτιστοποίηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

ΕΚ ΤΩΝ ΠΡΟΤΕΡΩΝ ΑΙΡΕΣΙΜΟΤΗΤΕΣ

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

ΔΕΛΤΙΟΝ ΤΗΣ ΧΡΙΣΤΙΑΝΙΚΗΣ ΑΡΧΑΙΟΛΟΓΙΚΗΣ ΕΤΑΙΡΕΙΑΣ ΟΔΗΓΙΕΣ ΓΙΑ ΤΗ ΔΗΜΟΣΙΕΥΣΗ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΜΕΛΕΤΩΝ

Website review lalemou.com

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Αναγνώριση Προτύπων 1

Η ύδρευση της Καρδίτσας Προβλήματα και προοπτικές Ημερίδα, Καρδίτσα 17 Φεβρουαρίου 2006

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

ΣΤΟ ΦΑΡΜΑΚΕΙΟ. Με την πιστοποίηση του έχει πρόσβαση στο περιβάλλον του φαρμακείου που παρέχει η εφαρμογή.

21/11/2005 Διακριτά Μαθηματικά. Γραφήματα ΒΑΣΙΚΗ ΟΡΟΛΟΓΙΑ : ΜΟΝΟΠΑΤΙΑ ΚΑΙ ΚΥΚΛΟΙ Δ Ι. Γεώργιος Βούρος Πανεπιστήμιο Αιγαίου

(C) 2010 Pearson Education, Inc. All rights reserved.

1. Η ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΚΑΤΑΧΩΡΗΣΗ 1

ΦΥΛΛΑ ΕΡΓΑΣΙΑΣ. Διδακτική ενότητα

1) Abstract (To be organized as: background, aim, workpackages, expected results) (300 words max) Το όριο λέξεων θα είναι ελαστικό.

Επίλυση δικτύων διανομής

Εισαγωγή στη βελτιστοποίηση συστημάτων υδατικών πόρων

Σεπτέμβριος 1998 Σεπτέμβριος 2004 Δίπλωμα Μηχανικού Η/Υ & Πληροφορικής. του Παγκόσμιου ιστού προσαρμοσμένες στις ιδιαιτερότητες της Νέας Ελληνικής.

Μεταπτυχιακό Πρόγραμμα Σπουδών Γεωπληροφορική. Κατεύθυνση: Τοπογραφικές Εφαρμογές Υψηλής Ακρίβειας

Elements of Information Theory

Αποδεικτικές Διαδικασίες και Μαθηματική Επαγωγή.

Προτεινόμενα θέματα. στο μάθημα. Αρχές οργάνωσης και διοίκησης επιχειρήσεων. ΟΜΑΔΑ Α: Ερωτήσεις Σωστού Λάθους.

Information Retrieval

Terabyte Technology Ltd

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Συμπεριφοριακή Επιχειρηματικότητα

Opinion Mining. Χριστίνα Αραβαντινού Χριστίνα Αραβαντινού Opinion Mining Μάιος / 26

Φόρμα Σχεδιασμού Διάλεξης (ημ/α: 17/03/08, έκδοση: 1.0)

ΗY335: Δίκτυα Υπολογιστών Χειμερινό Εξάμηνο Τμήμα Επιστήμης Υπολογιστών Πανεπιστήμιο Κρήτης Διδάσκουσα: Μαρία Παπαδοπούλη

ΕΚΘΕΣΕΙΣ ΑΠΟΛΟΓΙΣΜΟΥ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Πρώτη Γραπτή Εργασία. Εισαγωγή στους υπολογιστές Μαθηματικά

Sampling Basics (1B) Young Won Lim 9/21/13

SOAP API. Table of Contents

Δίκτυα Υπολογιστών Ενότητα 3: Domain Name System - DNS

Web and HTTP. Βασικά Συστατικά: Web Server Web Browser HTTP Protocol

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΜΠΟΡΙΚΟ ΔΙΚΑΙΟ

Εισαγωγή: Έννοιες, μεθοδολογία, μεγέθη Πλαίσιο διαχείρισης υδατικών πόρων στην Ελλάδα

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Frontend optimizations. Θεοδόσης Σουργκούνης

Εισαγωγή στη βελτιστοποίηση συστημάτων υδατικών πόρων

Εισαγωγή: Έννοιες, μεθοδολογία, μεγέθη Πλαίσιο διαχείρισης υδατικών πόρων στην Ελλάδα

ΣΥΝΟΛΑ (προσέξτε τα κοινά χαρακτηριστικά των παρακάτω προτάσεων) Οι άνθρωποι που σπουδάζουν ΤΠ&ΕΣ και βρίσκονται στην αίθουσα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Μούλου Ευγενία

Εισαγωγή στην ανάλυση συνδέσμων

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

European Human Rights Law

συμπεριφοράς που θα παρατηρηθεί

Τεχνολογίες Ανάπτυξης Εφαρμογών στο WEB

Κεφάλαιο 2.3: Marketing Κοινωνικών Επιχειρήσεων. Στο παρόν κεφάλαιο παρουσιάζονται εν τάχει τα βασικά

Δίκτυα Επικοινωνιών ΙΙ: OSPF Configuration

Επίπεδο δικτύου IP Forwading κτλ

Πανεπιστήμιο Ιωαννίνων Τμήμα Πληροφορικής. Διαμόρφωση Κωδικοποίηση. Διδάσκων: Ευάγγελος Παπαπέτρου

Η χρήση της Λεβοσιµεντάνης κατά τη διαδικασία τιτλοποίησης των β- αποκλειστών σε ασθενείς µε καρδιακή ανεπάρκεια

CSE.UOI : Μεταπτυχιακό Μάθημα

Ας υποθέσουμε ότι ο παίκτης Ι διαλέγει πρώτος την τυχαιοποιημένη στρατηγική (x 1, x 2 ), x 1, x2 0,

Φόρμα Σχεδιασμού Διάλεξης (ημ/α: 17/03/08, έκδοση: 1.0)

Ταξινόμηση των μοντέλων διασποράς ατμοσφαιρικών ρύπων βασισμένη σε μαθηματικά κριτήρια.

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

ΠΟΛΥ ΜΕΓΑΛΗ : ΜΕΓΑΛΗ : ΜΕΣΑΙΑ: ΜΙΚΡΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Special edition of the Technical Chamber of Greece on Video Conference Services on the Internet, 2000 NUTWBCAM

Website review diavolakos.net

- 1 - Ποιοι κερδίζουν από το εμπόριο αγαθών και υπηρεσιών; Γιατί η άμεση ανταλλαγή αγαθών, ορισμένες φορές, είναι δύσκολο να

Συγκέντρωση Κίνησης Εισαγωγή Στατική Συγκέντρωση Κίνησης

ΘΕΩΡΙΑ ΣΥΝTAΚΤΙΚΟΥ - ETΥΜΟΛΟΓΙΚΟ ΛΕΞΙΚΟ. 1 α. Η Πρόταση σχετικά με το Περιεχόμενό και το ποιόν της

Επιλογή Χαρακτηριστικών Feature selection Αντικειμενική συνάρτηση Φίλτρα Wrappers Διαδικασία Αναζήτησης Σειριακοί αλγόριθμοι Εκθετικοί αλγόριθμοι

interactivecommunication Search Marketing White Paper Φεβρουάριος , Cybertechnics Ltd. All rights reserved.

12. Σταχυολόγηση Ιστού

Έργο: ΥπΕΠΘ - Τεχνικός Σύμβουλος Υποέργο 17: «Υποστήριξη Συστημάτων Τεχνικής Στήριξης Σχολικών Εργαστηρίων»

Ψηφιακή Εικόνα. Σημερινό μάθημα!

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑ Α ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚ3Ν ΕΠΙΣΤΗΜ3Ν Γ ΛΥΚΕΙΟΥ

«ΑΝΑΠΣΤΞΖ ΓΠ ΚΑΗ ΥΩΡΗΚΖ ΑΝΑΛΤΖ ΜΔΣΔΩΡΟΛΟΓΗΚΩΝ ΓΔΓΟΜΔΝΩΝ ΣΟΝ ΔΛΛΑΓΗΚΟ ΥΩΡΟ»

Εργαστηριακή Άσκηση Θερμομόρφωση (Thermoforming)

Το διαδίκτυο είναι ένα δίκτυο που αποτελείτε από πολλά μικρότερα δίκτυα υπολογιστών.

Αίτηση για Εκχώρηση Άδειας Χρήσης Δικτυακού Ονόματος με κατάληξη.cy

Calculating the propagation delay of coaxial cable

10. Οπτικά Δίκτυα Πρόσβασης

11/28/2016 Απόδοση Συστημάτων, Remote Jmeter και Dacappo

Έχει ληφθεί την 27 DEC 2009 ένα σεισµικό ηλεκτρικό σήµα (SES) από τον σταθµό LAM του δικτύου ΒΑΝ [ 1 ]

Γλωσσική Τεχνολογία. HTML/XML Processing HTTP Services

Transcript:

Αξιολόγηση της Ποιότητας των Εξωτερικών Συνδέσμων της Wikipedia Σοφία Στάμου Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο stamou@ionio.gr

Εισαγωγή Wikipedia Πλούσια, πολυσυλλεκτική πηγή πληροφοριών Βέλτιστο παράδειγμα συνεργατικής δράσης στον Ιστό (wiki) >10.000.000 άρθρα σε 270 γλώσσες >13.000.000 συγγραφείς 1.750 διαχειριστές >78.000.000 επισκέπτες / μήνα Ποια η ποιότητα και η εγκυρότητά της; 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 2

Σχετική έρευνα Ποιοτικά χαρακτηριστικά περιεχομένου: Έκταση άρθρων & κατανομή διακριτών λέξεων [Voss 05] Συχνότητα επικαιροποίησης άρθρων [Wilkinson & Huberman 07] Αφοσίωση [Riehle, 2005], διαφωνίες επιμελητών [Vuong et al. 08] Εξερχόμενοι σύνδεσμοι σε «αξιόπιστες» πηγές [Nielsen 07] Αντικειμενικότητα περιεχομένου [Kirtsis et al. 11] Ποιοτικά χαρακτηριστικά δομής: Συνεκτικότητα γράφου [Koolen & Kamps 09] Κύκλοι πλοήγησης [Kirtsis et al. 10] Πληρότητα και ποιότητα κατηγοριών [Sakai et al. 09] 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 3

Διασφάλιση ποιότητας Προκλήσεις Κριτήρια, μετρικές αξιολόγησης Υποστήριξη συγγραφής και δόμησης περιεχομένου Συντονισμένος περιοδικός έλεγχος (αυτοματοποιημένος) Επικαιροποίηση περιεχομένου και δομής Προβολή «ποιοτικού» περιεχομένου στους χρήστες 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 4

Περιεχόμενα Ομιλίας Συμβολή εξωτερικών συνδέσμων στην ποιότητα του περιεχομένου της Wikipedia Τύποι και σημασιολογία υπερσυνδέσμων Επικάλυψη περιεχομένου άρθρου εξωτερικών πόρων Κανόνες διασύνδεσης άρθρων με εξωτερικές πηγές Επικαιροποίηση υπερσυνδέσμων και διασφάλιση εγκυρότητας περιεχομένου 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 5

Υπερσύνδεσμοι στη Wikipedia Εσωτερικοί (in links): προς άρθρα της Wikipedia Συμπληρωματικότητα άρθρων Αυτονομία εγκυκλοπαίδειας Εξωτερικοί (out links): προς σελίδες εκτός Wikipedia Επιπλέον πληροφορίες σχετικού περιεχομένου Αναφορών (references): προς βιβλιογραφικές πηγές Εγκυρότητα περιεχομένου 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 6

Υπερσύνδεσμοι στη Wikipedia Εξωτερικοί (out links): προς σελίδες εκτός Wikipedia Επιπλέον πληροφορίες σχετικού περιεχομένου Αναφορών (references): προς βιβλιογραφικές πηγές Εγκυρότητα περιεχομένου 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 7

Κίνητρο Μελέτης Η ποιότητα του περιεχομένου της Wikipedia εξαρτάται και απότηνποιότητατωνυπερσυνδέσμωντωνάρθρωντης Δείκτες Ποιότητας Αποφυγή κύκλων (in links) Αξιοπιστία περιεχομένου (references) Συμπληρωματική και επικαιροποιημένη πληροφορία (out links) Πρόκληση: αυτοματοποιημένη αξιολόγηση της ποιότητας των εξωτερικών υπερσυνδέσμων 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 8

Τι εξετάζουμε... Κατανομή υπερσυνδέσμων Συσχέτιση έκτασης άρθρου και πλήθους υπερσυνδέσμων Δημοφιλή domains Παρακμή υπερσυνδέσμων Αναλογία dead links στους υπερσυνδέσμους των άρθρων Soft 404 server errors (redirects) Συνεισφορά υπερσυνδέσμων Συμπληρωματικότητα περιεχομένου «νέα» πληροφορία 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 9

Κατανομή υπερσυνδέσμων Εξόρυξη out links από dump files Απαλοιφή space, bullet χαρακτήρων Συσταδοποίηση out links βάσει σύνταξης [URLs] + hyperlinks Hyperlinked URL names [URLs] + επισημείωση hyperlinks 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 10

Κατανομή υπερσυνδέσμων (2) Εξόρυξη URLs από κάθε συστάδα και αναγνώριση domain names Επεξεργασία XML files και εξόρυξη περιεχομένου Υπολογισμός πλήθους χαρακτήρων κάθε άρθρου Αναπαράσταση κειμένου και out links <μήκος άρθρου, πλήθος out links> 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 11

Παρακμή υπερσυνδέσμων Dead pages (hard 404 errors) url invalid or can t be parsed Local DNS server can t resolve IP of url.host No response from url.host within T(=10) secs url.host returns error HTTP code to the request for url 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 12

Παρακμή υπερσυνδέσμων (2) Decayed pages (soft 404 errors) url redirects to its host s page and a non existing randomly generated url in the same host also redirects to the host s page url redirects to a page, which in turn redirects (loop of redirects) url and a non existing randomly generated url redirect to pages of identical content host returns hard 404 root can t be soft 404 different redirects same redirects 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 13

Συνεισφορά υπερσυνδέσμων Προσκομιδή του περιεχομένου των εξωτερικών συνδέσμων κάθε άρθρου και επεξεργασία Επεξεργασία περιεχομένου άρθρων Εφαρμογή shingling [Broder, 97], υπολογισμός Containment στο κείμενο άρθρων και εξωτερικών συνδέσμων (, ) Containment a d i i = Shingles άρθρου ( ) I i ( i ) S ( a ) S a S d Shingles out linked σελίδας άρθρου i 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 14

Συνεισφορά υπερσυνδέσμων Avg. Containment άρθρου με όλες τα out linked docs D 1 avg. Containment a = Containment a, d,..., a, d D ( ) ( ) ( ) i i j i n d i D Πλήθος out linked docs Uniqueness περιεχομένου άρθρου συγκριτικά με τα out linked docs Uniqueness a ( ) = 1 avg. Containment ( a ) i i 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 15

Πειραματική Αξιολόγηση Κατανομή out links Collection ID October 2009 Wikipedia dump Number of articles 3,290,179 Number of external links 13,355,687 External links/ article 4.06 Articles without external links 786,857 23.91% των άρθρων χωρίς out links Προσκομιδή των 2,503,322 άρθρων με out links, επεξεργασία περιεχομένου, υπολογισμός μεγέθους (πλήθος χαρακτήρων) 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 16

Κατανομή out links Number of articles 2400000 2100000 1800000 1500000 1200000 900000 600000 300000 0 0 10 30 100 500 1000 1500 1800 Number of external links 7.30% άρθρα με > 100 out links (ημιτελής πληροφορία;) 23.91% άρθρα χωρίς out links (ολοκληρωμένη πληροφορία;) 68.79% άρθρα 1 10 out links (συμπληρωματικότητα;) Τήρηση οδηγιών παράθεσης external links από συγγραφείς 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 17

Μέγεθος άρθρων και out links Avg. number of external links 200 180 160 140 120 100 80 60 40 20 0 Warning invoked for >200 out links 1000 10000 20000 50000 100000 200000 800000 Article length (number of characters) Συσχέτιση μεγέθους κειμένου και πλήθους out links 70.6% των άρθρων έχουν 10Κ χαρακτήρες και 3 έως 8 out links Περισσότερη πληροφορία περισσότερες πηγές πληροφόρησης Συμπληρωματικότητα (+) / Αυτοτέλεια ( ) 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 18 18

Κατανομή out link domains Number of external links 2000000 1750000 1500000 1250000 1000000 750000 500000 250000 0 d1 d4 d7 d10 d13 d16 d19 d22 d25 d28 d31 d34 d37 d40 d43 d46 d49 URL domain names (sorted by popularity) Το πιο δημοφιλές domain φιλοξενεί 14.29% των wiki out links 44.87% των out links σε 10 διαφορετικά domain names Υψηλή θεματική συσχέτιση και εσωτερική συνδεσιμότητα μεταξύ 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 19 άρθρων [Koolen & Kamps,09] αύξηση δημοτικότητας domains 19

Πειραματική Αξιολόγηση Παρακμή out links Δεδομένα και διαδικασία αξιολόγησης Articles examined 1,939,445 Out-links evaluated 4,575,154 Page fetching time out 10 secs Max # of redirects 5 Characters appended to host s url 25 lower case Latin Αλγόριθμος υπολογισμού hard (dead) & soft 404 (redirect) page errors 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 20

Κατανομή dead out links Number of dead links 350 300 250 200 150 100 50 0 0 0.02K 0.06K 0.13K 0.24K 0.89K 2.9K 0.43M 1.5M Number of articles 77.31% των άρθρων χωρίς decayed out link 18.34% τωνlinks που εξετάσαμε είναι dead (hard or soft 404 code) Εγκυρότητα πληροφορίας Ορθή επιλογή υπερσυνδέσμων 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 21

Συνεισφορά out links Σε τυχαίο δείγμα 100,000 άρθρων Information Uniqueness 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 89.78% νέα πληροφορία στα άρθρα συγκριτικά με το περιεχόμενο των out links 100 4000 7900 11800 15700 19600 23500 Number of articles Συμπληρωματικότητα περιεχομένου 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 22

Συμπεράσματα μελέτης Τήρηση κανόνων συνδεσιμότητας άρθρων ιστοσελίδων βάσει ποσοτικών και ποιοτικών κριτηρίων Ανάγκη αυτοματοποιημένου ελέγχου και επικαιροποίησης out links Wikipedia: συλλεκτική πηγή πληροφοριών διαφορετικό περιεχόμενο 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 23

Δημοσιευμένη σχετική έρευνα Wikipedia Quality Assessment N. Kirtsis, P. Tzekou, S. Stamou, N. Zotos. Information Uniqueness in Wikipedia. [WebIST 2010] N. Kirtsis, J. Besharat, P. Tzekou, S. Stamou. Identifying Polarized Wikipedia Articles. [Ontology Driven Web Mining 2011] P. Tzekou, S. Stamou, N. Kirtsis, N. Zotos. Quality Assessment of Wikipedia External Links. [WebIST 2011 ] 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 24

Έρευνα σε εξέλιξη Scientometrics Quality Assessment Metrics for Research Conferences Interpreting Self Citations in Scientific Publications Mining Citation Opinion Terms [JDIM10] Impact of Funded Research Works [ICDM09] Web Search Query Rewrites for Task Oriented Web Searches Abandoned Web Searches [ECIR10, SIGIR09] 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 25

Ερωτήσεις... Ευχαριστώ! 5/4/2011 Σοφία Στάμου, Ιόνιο Πανεπιστήμιο 26