Topic Structure Mining based on Wikipedia and Web Search



Σχετικά έγγραφα
Web DEIM Forum 2009 A7-1. Web. Web. Web. Web. 4 Wikipedia. Wikipedia. Web.


Shortness Ambiguity TEAM Ungrammaticality

Twitter 6. DEIM Forum 2014 A Twitter,,, Wikipedia, Explicit Semantic Analysis,

CONFIOUS: The Conference Nous Σύστημα Διαχείρισης Επιστημονικών & Ακαδημαϊκών Συνεδρίων. (

Automatic extraction of bibliography with machine learning

Kenta OKU and Fumio HATTORI

Newman Modularity Newman [4], [5] Newman Q Q Q greedy algorithm[6] Newman Newman Q 1 Tabu Search[7] Newman Newman Newman Q Newman 1 2 Newman 3

Exhaustive Topic Detection and Query Expansion Support Based on Substance-Oriented Term Clustering

Downloaded from HEPHAESTUS Repository, Neapolis University institutional repository


Ερευνητική+Ομάδα+Τεχνολογιών+ Διαδικτύου+

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

Π Τ Υ Χ Ι Α Κ Η /ΔΙ Π Λ Ω Μ ΑΤ Ι Κ Η Ε Ρ ΓΑ Σ Ι Α

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

Wiki. Wiki. Analysis of user activity of closed Wiki used by small groups

GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

Schedulability Analysis Algorithm for Timing Constraint Workflow Models

þÿ ųºÁ¹Ä¹º ¼µ» Ä Ä Å þÿ»» ±Â º±¹ Ä Â Å ±Â Christopoulos, Dimitris Neapolis University þÿ À¹ÃÄ ¼Î½, ±½µÀ¹ÃÄ ¼¹ µ À»¹Â Æ Å

SocialDict. A reading support tool with prediction capability and its extension to readability measurement

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ ΑΘΗΝΑ Ε - ΜΑΙL : mkap@aueb.gr ΤΗΛ: , ΚΑΠΕΤΗΣ ΧΡΥΣΟΣΤΟΜΟΣ. Βιογραφικό Σημείωμα

GPU. CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA. Parallelizing the Number Partitioning Problem for GPUs

Αλγοριθµική και νοηµατική µάθηση της χηµείας: η περίπτωση των πανελλαδικών εξετάσεων γενικής παιδείας 1999

ΑΔΑ: Β4ΜΒΝ-ΖΜ1. Πίνακας περιεχομένων

ΟΙ Υ ΡΟΓΕΩΛΟΓΙΚΕΣ ΣΥΝΘΗΚΕΣ ΣΤΗΝ ΛΕΚΑΝΗ ΠΟΤΑΜΙΑΣ ΚΑΙ Η ΑΛΛΗΛΟΕΠΙ ΡΑΣΗ ΤΟΥ Υ ΑΤΙΚΟΥ ΚΑΘΕΣΤΩΤΟΣ ΜΕ ΤΗ ΜΕΛΛΟΝΤΙΚΗ ΛΙΓΝΙΤΙΚΗ ΕΚΜΕΤΑΛΛΕΥΣΗ ΣΤΗΝ ΕΛΑΣΣΟΝΑ

Buried Markov Model Pairwise

ΕΛΕΓΧΟΣ ΤΩΝ ΠΑΡΑΜΟΡΦΩΣΕΩΝ ΧΑΛΥΒ ΙΝΩΝ ΦΟΡΕΩΝ ΜΕΓΑΛΟΥ ΑΝΟΙΓΜΑΤΟΣ ΤΥΠΟΥ MBSN ΜΕ ΤΗ ΧΡΗΣΗ ΚΑΛΩ ΙΩΝ: ΠΡΟΤΑΣΗ ΕΦΑΡΜΟΓΗΣ ΣΕ ΑΝΟΙΚΤΟ ΣΤΕΓΑΣΤΡΟ

CorV CVAC. CorV TU317. 1

Α.Τ.Ε.Ι.Θ. Θέμα: Μελέτη της Web 2.0 εφαρμογής WIKI. Δημιουργία απλής ιστοσελίδας, πρόταση για εκπαιδευτική ή επαγγελματική αξιοποίηση της εφαρμογής

User Behavior Analysis for a Large2scale Search Engine


ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΗΡΑΚΛΕΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ

þÿ Ç»¹º ³µÃ ± : Ãż²» Ä Â

Determination of Topic Description Terms in Topic Model

ΓΗΠΛΧΜΑΣΗΚΖ ΔΡΓΑΗΑ ΑΡΥΗΣΔΚΣΟΝΗΚΖ ΣΧΝ ΓΔΦΤΡΧΝ ΑΠΟ ΑΠΟΦΖ ΜΟΡΦΟΛΟΓΗΑ ΚΑΗ ΑΗΘΖΣΗΚΖ

Retrieval of Seismic Data Recorded on Open-reel-type Magnetic Tapes (MT) by Using Existing Devices

Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

High order interpolation function for surface contact problem

Quick algorithm f or computing core attribute

ΠΕΡΙΦΕΡΕΙΑ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ

ΟΙ ΥΠΗΡΕΣΙΕΣ ΓΕΩΓΡΑΦΙΚΟΥ ΠΡΟΣΔΙΟΡΙΣΜΟΥ ΣΕ ΚΙΝΗΤΕΣ ΣΥΣΚΕΥΕΣ ΚΑΙ ΟΙ ΔΥΝΑΤΟΤΗΤΕΣ ΠΟΥ ΠΡΟΣΦΕΡΟΥΝ ΣΤΟ SOCIAL MEDIA MARKETING

Research of Han Character Internal Codes Recognition Algorithm in the Multi2lingual Environment

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

ΜΗΝΙΑΙΟ ^KKjlHtiatTIKO

ΓΡΑΜΜΑΤΕΙΑ ΚΥΡΙΟ ΓΡΑΦΕΙΑ ΝΟΜΙΚΩΝ ΣΥΜΒΟΥΛΩΝ & ΔΙΚΑΣΤΙΚΑ ΓΡΑΦΕΙΑ ΠΕΡΙΦΕΡΕΙΑΣ ΠΡΟΣΩΠΙΚΟ ΤΗΛΕΦΩΝΑ Ν.Σ.Κ. FAX. Πάρεδρος. Μπακόπουλος Ιωάννης

Δομή Επανάληψης Άσκηση 1 - μικρότερο/μεγαλύτερο ως φίλτρο Να γραφεί αλγόριθμος σε ψευδογλώσσα που να διαβάζει συνεχώς αριθμούς μέχρι να διαβάσει τον

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ

Σχέση µεταξύ της Μεθόδου των ερµατοπτυχών και της Βιοηλεκτρικής Αντίστασης στον Υπολογισµό του Ποσοστού Σωµατικού Λίπους

Evaluation of Methods to Extract Important Scenes for Automatic Digest Generation from a Presentation Video

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. «Προστασία ηλεκτροδίων γείωσης από τη διάβρωση»

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή)

Οικονοµετρική ιερεύνηση των Ελλειµµάτων της Ελληνικής Οικονοµίας

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΠΑΝΑΣΧΕΔΙΑΣΜΟΣ ΓΡΑΜΜΗΣ ΣΥΝΑΡΜΟΛΟΓΗΣΗΣ ΜΕ ΧΡΗΣΗ ΕΡΓΑΛΕΙΩΝ ΛΙΤΗΣ ΠΑΡΑΓΩΓΗΣ REDESIGNING AN ASSEMBLY LINE WITH LEAN PRODUCTION TOOLS

Detection and Recognition of Traffic Signal Using Machine Learning

, Evaluation of a library against injection attacks

An Automatic Modulation Classifier using a Frequency Discriminator for Intelligent Software Defined Radio

Προσδιορισμός Χαρακτηριστικών των Λεκανών Απορροής

ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ

Study of urban housing development projects: The general planning of Alexandria City

ΜΕΛΕΤΗ ΦΩΤΙΣΜΟΥ Ο ΙΚΩΝ ΣΗΡΑΓΓΩΝ ΚΑΤΑ CIE ΜΕ ΧΡΗΣΗ ΥΠΟΛΟΓΙΣΤΗ

1 n-gram n-gram n-gram [11], [15] n-best [16] n-gram. n-gram. 1,a) Graham Neubig 1,b) Sakriani Sakti 1,c) 1,d) 1,e)

Web. Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages

Τα πέντε κριτήρια που πρέπει να ικανοποιεί ένας αλγόριθμος είναι:

Topic Estimation for Microblogs Taking into Account the Relationships between Adjacent Tweets

Ανάλυση Προτιμήσεων για τη Χρήση Συστήματος Κοινόχρηστων Ποδηλάτων στην Αθήνα

Toward a SPARQL Query Execution Mechanism using Dynamic Mapping Adaptation -A Preliminary Report- Takuya Adachi 1 Naoki Fukuta 2.

«ΟΜΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΚΑΙ ΣΤΑΤΙΚΗ ΣΤΕΡΕΩΣΗ ΙΣΤΟΡΙΚΟΥ ΙΕΡΟΥ ΝΑΟΥ»

Ο ΔΕΙΚΤΗΣ ΑΝΘΡΩΠΙΝΗΣ ΑΝΑΠΤΥΞΗΣ ΣΤΗΝ ΕΛΛΑΔΑ ΤΟ 1991 & 2001 HUMAN DEVELOPMENT INDEX IN GREECE IN 1991 & 2001

ΖΩΝΟΠΟΙΗΣΗ ΤΗΣ ΚΑΤΟΛΙΣΘΗΤΙΚΗΣ ΕΠΙΚΙΝΔΥΝΟΤΗΤΑΣ ΣΤΟ ΟΡΟΣ ΠΗΛΙΟ ΜΕ ΤΗ ΣΥΜΒΟΛΗ ΔΕΔΟΜΕΝΩΝ ΣΥΜΒΟΛΟΜΕΤΡΙΑΣ ΜΟΝΙΜΩΝ ΣΚΕΔΑΣΤΩΝ

Web 論 文. Performance Evaluation and Renewal of Department s Official Web Site. Akira TAKAHASHI and Kenji KAMIMURA

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ. Γνωστικό αντικείμενο Nεοελληνική Iστορία: Σχέση εκπαίδευσης και κοινωνίας κατά τον πρώτο αιώνα της Aνεξαρτησίας

ΗΜΟΣ ΚΑΛΑΜΑΤΑΣ ΙΕΥΘΥΝΣΗ ΟΙΚΟΝΟΜΙΚΩΝ ΥΠΗΡΕΣΙΩΝ. ΜΕΛΕΤΗ α.α. 30/2009 ΕΡΓΟ: ΕΚΤΥΠΩΣΕΙΣ 2010 Κ.Α ΠΡΟΫΠΟΛΟΓΙΣΜΟΣ: ,76 µε Φ.Π.Α.

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΛΕΩΝΙΔΑΣ Α. ΣΠΥΡΟΥ Διδακτορικό σε Υπολογιστική Εμβιομηχανική, Τμήμα Μηχανολόγων Μηχανικών, Πανεπιστήμιο Θεσσαλίας.

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΠΟΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΣΤΗΜΗΣ ΤΡΟΦΙΜΩΝ. Πτυχιακή εργασία

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΣΤΥΛΙΑΝΟΥ ΣΟΦΙΑ

ΕΛΛΗΝΙΚΗ ΓΥΜΝΑΣΤΙΚΗ ΟΜΟΣΠΟΝΔΙΑ

The Algorithm to Extract Characteristic Chord Progression Extended the Sequential Pattern Mining

ΓΕΝΙΚΗ ΣΥΝΕΛΕΥΣΗ Ε.Φ.Ο.Τ. ΣΑΒΒΑΤΟ , ΜΟΥΣΕΙΟ ΜΑΡΑΘΩΝΙΟΥ ΔΡΟΜΟΥ ΣΤΟΝ ΜΑΡΑΘΩΝΑ - ΣΩΜΑΤΕΙΑ ΜΕ ΔΙΚΑΙΩΜΑ ΨΗΦΟΥ(ΑΛΦΑΒΗΤΙΚΑ)

ΠΕΡΙΛΗΨΗ. Λέξεις κλειδιά: Υγεία και συμπεριφορές υγείας, χρήση, ψυχότροπες ουσίες, κοινωνικό κεφάλαιο.

Το κοινωνικό στίγμα της ψυχικής ασθένειας

ΧΑΡΑΚΤΗΡΙΣΜΟΣ ΦΑΣΕΩΝ ΣΙΔΗΡΟΥ ΣΕ ΔΕΙΓΜΑΤΑ ΟΡΥΚΤΩΝ ΑΠΟ ΤΟ ΥΠΟΘΑΛΑΣΣΙΟ ΗΦΑΙΣΤΕΙΟ ΚΟΛΟΥΜΠΟ (ΣΑΝΤΟΡΙΝΗ) ΜΕ ΧΡΗΣΗ ΑΚΤΙΝΟΒΟΛΙΑΣ ΣΥΓΧΡΟΤΡΟΥ

Optimization, PSO) DE [1, 2, 3, 4] PSO [5, 6, 7, 8, 9, 10, 11] (P)

Τ.Ε.Ι. ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΔΗΜΟΣΙΩΝ ΣΧΕΣΕΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΣ

Maxima SCORM. Algebraic Manipulations and Visualizing Graphs in SCORM contents by Maxima and Mashup Approach. Jia Yunpeng, 1 Takayuki Nagai, 2, 1

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

ΕΛΕΓΧΟΣ ΚΑΙ ΤΡΟΦΟΔΟΤΗΣΗ ΜΕΛΙΣΣΟΚΟΜΕΙΟΥ ΑΠΟ ΑΠΟΣΤΑΣΗ

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ "ΠΟΛΥΚΡΙΤΗΡΙΑ ΣΥΣΤΗΜΑΤΑ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ. Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΕΠΙΛΟΓΗΣ ΑΣΦΑΛΙΣΤΗΡΙΟΥ ΣΥΜΒΟΛΑΙΟΥ ΥΓΕΙΑΣ "

ΚΙΝ ΥΝΟΙ ΛΟΙΜΩΞΕΩΝ ΧΕΙΡΟΥΡΓΙΚΗΣ ΘΕΣΗΣ ΓΥΝΑΙΚΩΝ ΠΟΥ ΥΠΟΒΑΛΛΟΝΤΑΙ ΣΕ ΚΑΙΣΑΡΙΚΗ ΤΟΜΗ

n 1 n 3 choice node (shelf) choice node (rough group) choice node (representative candidate)

ΑΝΑΡΤΗΤΕΟ ΣΤΟ ΙΑ ΙΚΤΥΟ. Καστοριά, 25/08/2011 ΑΡ.ΠΡΩΤ.: 1809

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ

ΑΝΤΙΜΕΤΩΠΙΣΗ ΑΙΜΟΡΡΑΓΙΑΣ ΑΠΟ ΤΟ ΜΕΣΟΘΩΡΑΚΙΟ ΑΣΘΕΝΟΥΣ ΜΕΤΑ ΑΠΟ ΧΕΙΡΟΥΡΓΙΚΗ ΕΠΕΜΒΑΣΗ ΚΑΡΔΙΑΣ: ΕΦΑΡΜΟΓΗ ΤΟΥ PERIOPERATIVE NURSING DATA SET

ΣΥΝΟΠΤΙΚΟ BIOΓPAΦIKO ΣHMEIΩMA

0 irotmttm * eka.ia.gtxi Me ΤΗΝ ΠΡΟΝΟΙλ ΜΗΤΡΟΠΟΛΙΤΟΥ Μ V ΤI \ Η Ν Η C

Transcript:

DEWS2008 A7-5 Wikipedia Web AdamJatowt 606-8501 606-8501 E-mail: {nakatani,tezuka,adam,tanaka}@dl.kuis.kyoto-u.ac.jp Wikipedia Web Web Wikipedia Wikipedia Abstract Topic Structure Mining based on Wikipedia and Web Search Makoto NAKATANI, Taro TEZUKA, Adam JATOWT, and Katsumi TANAKA Department of Informatics and Mathematical Science, Faculty of Engineering, Kyoto University Yoshida-honmachi, Sakyo, Kyoto, 606-8501 Japan Department of Social Informatics, Graduate School of Informatics, Kyoto University Yoshida-honmachi, Sakyo, Kyoto, 606-8501 Japan E-mail: {nakatani,tezuka,adam,tanaka}@dl.kuis.kyoto-u.ac.jp This paper proposes a method for extracting topic terms and analyzing characteristics of topic terms by using the structual features of Wikipedia, the free encyclopedia, and Web search. Existing method can t extract topic terms for multiple terms, and extracted terms contain both general terms and special terms for user s requests. Our method enables to extract topic terms for multiple terms by improving existing methods, and analyze generality and specialty of each topic terms by using the structural features of Wikipedia like sections and links. It supports user s understanding of the topic by showing how widely or narrowly the terms are used. Key words Wikipedia, Topic structure, Topic extraction 1. Web Web Google 1 Yahoo! 2 Web Web Web 1 http://www.google.co.jp/ 2 http://www.yahoo.co.jp/ Web Web 2

1 Wikipedia 3 Wikipedia Wikipedia Wikipedia 2 3 Wikipedia 4 1 2 5 6 Web 2. Wikipedia Web [1] Wikipedia [2] Wikipedia DOM Wikipedia Web ipod Wikipedia Web ipod nano cm [3] [4] [5] ipod cm Rada [6] Wikipedia cm Web Wikipedia 1 Web Wikipedia Wikipedia Web Web ipod Web ipod cm [7] [8] Web Web [7] Web A A B A A B A B Web 3 http://ja.wikipedia.org/

& ' (! #" $ % 4. 1. 1 Wikipedia 2 Wikipedia Wikipedia 3. Wikipedia 3. 1 Wikipedia 1 Wikipedia 2008 1 2 Wikipedia 217 3 3. 2 2 Wikipedia Wikipedia (2) wiki {q 1, q 2 } Wikipedia d q1 q 2 q 2 Wikiepdia q 1 80 q 2 q 2 2500 Wikipedia {t 1, t 2,...t n} t Wikipedia d t 4. 1. 2 Wikipedia 3. 3 {t 1, t 2,..., t n} Wikipedia Wikipedia 2 Wikipedia ipod 2 4 PORTER PRADA 4. ipod foobar ipodwizard 4. 1 Web Web Wikipedia [7] Wikipedia Web P 2 A,B Web P p A p A 1 4 http://download.wikimedia.org/jawiki/ 1 2 2 Class B 1 Class B 2 Total Class A 1 x 11 x 12 a 1 Class A 2 x 21 x 22 a 2 Total b 1 b 2 N Wikipedia Web A 2 B

B 1 B 2 1 4. 2 a 1,a 2,b 1,b 2 A 1,A 2,B 1,B 2 Web 4. 2. 1 Wikipedia Web P Wikipedia N A i B j Web x ij(i = 1, 2; j = 1, 2) 2 A,B q t 2 2 χ 2 (x ij a i b j /N) 2 Wikipedia d q = (1) a i b j /N i=1 j=1 t 1 χ 2 α A,B A,B t Wikipedia d q t Wikipedia q 1 q 2 q 1,q 2 t Wikipedia d t Web P A,B / 2 3 / 2 1 1 N,a 1,b 1,x 11 DF Wikipeida Wikipedia d N d {s 1, s 2,..., s Nd } N = DF (intitle(q 1 ) q 2 ) Wikipedia d t a 1 = DF (intitle(q 1 q 2 )) Noise(t, d) Signal(t, d) (2) b 1 = DF (intitle(q 1) q 2 t) x 11 = DF (intitle(q 1 q 2 ) t) freq(t, s i, d) p(s i t, d) = Nd A,B freq(t, s (4) i=1 i, d) (1) N d Noise(t, d) = p(s DF (intitle(q 1 q 2) t) DF (intitle(q1) q2 t) i t, d) log 2 p(s i t, d) (5) > (3) i=1 DF (intitle(q 1 q 2 )) DF (intitle(q 1 ) q 2 ) χ 2 0 > u 5 N (3) d Signal(t, d) = log 2 freq(t, s i, d) N(t, d) (6) t 2,3 i=1 freq(t, s i, d) Wikipedia d s i t p(s i t, d) Wikipedia 2 DF (intitle(q 1 q 2 ) t) DF (intitle(q 1 q 2)) > DF (q 1 q 2 t) d t DF (q 1 q 2) s i Noise(t, d) N = DF (q 1 q 2) t d a 1 = DF (intitle(q 1 q 2 )) Noise(t, d) b 1 = DF (q 1 q 2 t) t x 11 = DF (intitle(q 1 q 2 ) t) Signal(t, d) Noise(t, d) 3 DF (q 1 intitle(q 2) t) DF (q1 q2 t) 1 DF (q 1 intitle(q 2 )) > DF (q 1 q 2 ) N = DF (q 1 q 2 ) a 1 = DF (q 1 intitle(q 2)) / b 1 = DF (q 1 q 2 t) df idf df x 11 = DF (q 1 intitle(q 2 ) t) idf df 5 T 1 (x) dx = α, T 1 (x) = 1 x 1 2 e x 2 u 2π Noise(t, d) Signal(t, d)

6 6 555 : : 6 555 555 8!! 4 : : 8?! 4! 2 P A B 1 q 1 q 2 q 2 t 2 q 1,q 2 q 1,q 2 t 3 q 1,q 2 q 2 t 3 RelativeInlink(d t, d q) Inlink(d t) (q= ipod ) t RelativeInlink(d t, d q) Inlink(d t) 27 639 22 1320 14 1563 12 1380 Macintosh 11 675 10 14753 7 5957 ipod nano 6 64 ipod touch 1 38 8 7 8 9 8 ; <>= 8?? 021 +3"$#$%'& - %"$#$%/& () "*+$#$, ).- % "$#$%'& df idf 3 Wikipedia 4. 2. 2 q d q {t 1, t 2,..., t n} D(q) = {d t1, d t2,..., d tn } t t d t D(q) t t t d t 4. 2. 3 D(q) t Wikipedia t d t D(q) q Wikipedia d q d q RelativeInlink RelativeInlink(d t, d q ) = RelativeInlink(d t, d q ) {t i t t i, d ti d t, t i T opict erms(q)} q t Generality(t, q) d tk d tl d tk d tl RelativeInlink Wikipedia d t q t Inlink(d t) 3 ipod Wikipedia q t RelativeInlink(d t, d q ) t Locality(t, q) Inlink(d t) Wikipedia 3 Locality(t, q) = Signal(t, d q ) (8) Inlink(d t ) q t d q ipod Inlink(d t ) q t RelativeInlink(d t, d q) Specialty(t, q) ipod RelativeInlink(dt, dq) Specialty(t, q) = (9) Inlink(d t ) RelativeInlink(d t, d q) d q Outlink(d q ) T opict erms(q) Wikipedia t 0 1 t t Inlink(d t) T opict erms(q) RelativeInlink(dt, dq) Generality(t, q) = Noise(t, d q ) (7) Wikipedia d q Outlink(d q )

S H 5. 4 q 4. 1 1 q 2 ipod,,,,, 4. 2 cm,,,,,,,,, vaio,,dvd,,,,,,, 5. 1 4. 1,,,,, 4,,,,,,,,, Yahoo! Web,,,, API 6 q 2 q 1 =?> @&A! #"%$&$#' ()+*-,/. 021 4. 1 3 BDCE 3457680:9<; Wikipedia Wikipedia 3 DF Google Web Google SOAP API 7 Google JLKNMPOQ?R J?KMPOQ?R J?KMPOQ?R intitle: α 0.05 4 F<G Wikipedia 4. 2 4 t DF (t q) 4 confidence(t q) = (10) DF (t) Yahoo! q Google SOAP API 100 Web Specialty(t, q) 100 confidence(t q) S S ipod 5 Generality 5. 2 Locality 5. 2. 1 Generality(t, q) Locality(t, q) 100 t Noise(t, S) 5 Signal(t, S) Generality(t, q) Locality(t, q) Noise(t, S) 1 Signal(t, S) 4. 1 Web t q 1 Specialty(t, q) t q t q 1 6 6 http://developer.yahoo.co.jp/search/webunit /V1/webunitSearch.html 7 http://code.google.com/apis/soapsearch/,,,, ipod cm ipod cm ipod ipod F<G I TU

7 5 1 2 3 precision 0.5158 0.4764 0.3868 recall 0.3135 0.175 0.1577 d=ipod d= Specialty ipod ipod ipod ipod ipod ipod ipod Apple Locality Generality ipod ipod ipod cm ipod ipod cm 5,6,7 Generality Locality Specialty Wikipedia ipod Noise(t, S) Signal(t, S) confidence(t q) 5 20 Generality 20 t Noise(t, S) 7 Wikipedia 4 Web q 2 q 1 Wikipedia 6. Wikipedia Web Wikipedia 3 4. 1 3 1 5. 2. 2 4. 2 ipod Generality(t, q) Web Locality(t, q) Specialty(t, q) 10 8 Generality Wikipedia A B

33-0 ) /+ + )*. () q 1 q 2 6 1 ipod cm N.E.R.D,,,,,,,,,,COACH,GUCCI,PORTER,LOUIS VUITTON,PRADA,Paul Smith,! 2,,,,,,,,,,,, K,,,,,,,,,,,,,,,, q ipod Generality 10 8 ipod nano,ipod mini,ipod shuffle,itunes,mac,macintosh,,ipod touch,mac OS X,iPhone,,,,,,,,, q ipod Loacality 10,HTML,Linux,,FAT32,,U2,FireWire,GTK,HFS+,,,,,,,,, q ipod Specialty 10 ipod Classic,,,,,,,, featuring,,,,,,,,,, 332 *0 1 -./ *+,) '(,1 2,-. 66 45 +3 /01 2 2,. +,*-!#"$&% "! #%$ '& (!#"$&%' 5 Generality 6 Locality 7 Specialty A B [2],, Dom wikipedia, 21 (2007). 3 [3] E. Gabrilovich and S. Markovitch: Computing semantic relatedness using wikipedia-based explicit semantic analysis, Proceedings of The Twentieth International Joint Conference for Artificial Intelligence, pp. 1606 1611 (2007). COE [4] R. Bunescu and M. Pasca: Using encyclopedic knowledge for named entity disambiguation, Proceedings of the European Conference of the Association for Computational Linguistics (2006). [5] M. Strube and S. P. Ponzetto: Wikirelate! computing ( semantic relatedness using wikipedia, Proceedings of the American Association for Artificial Intelligence (2006). 18049041 (B) [6] R. Mihalcea and A. Csomai: Wikify! linking documents 18700086 (B) to encyclopedic knowledge, Proceedings of the sixteenth ACM conference on Conference on information and knowledge management, pp. 233 242 (2007). 18700111 [7], web, 14 (DEWS2003) (2003). [8],,,, [1],, Wikipedia web,,, 47, 10, pp. Letters, 5, 2 (2006). 2917 2928 (2006).