Web DEIM Forum 2009 A7-1. Web. Web. Web. Web. 4 Wikipedia. Wikipedia. Web.



Σχετικά έγγραφα
Topic Structure Mining based on Wikipedia and Web Search


Twitter 6. DEIM Forum 2014 A Twitter,,, Wikipedia, Explicit Semantic Analysis,


Shortness Ambiguity TEAM Ungrammaticality

Kenta OKU and Fumio HATTORI

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ ΑΘΗΝΑ Ε - ΜΑΙL : mkap@aueb.gr ΤΗΛ: , ΚΑΠΕΤΗΣ ΧΡΥΣΟΣΤΟΜΟΣ. Βιογραφικό Σημείωμα

Αντώνης Βεντούρης. Επίκουρος Καθηγητής Διδακτικής των Γλωσσών Τμήμα Ιταλικής Γλώσσας και Φιλολογίας Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Ερευνητική+Ομάδα+Τεχνολογιών+ Διαδικτύου+

Ανάκτηση Πληροφορίας Εισαγωγή


ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΠΜΣ «ΠΛΗΡΟΦΟΡΙΚΗ & ΕΠΙΚΟΙΝΩΝΙΕΣ» OSWINDS RESEARCH GROUP

{takasu, Conditional Random Field

Buried Markov Model Pairwise

Δρ. Χρήστος Παπακώστας

Wiki. Wiki. Analysis of user activity of closed Wiki used by small groups


Web. Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages

Automatic Domain2Specific Term Extraction and Its Application in Text Cla ssification

CONFIOUS: The Conference Nous Σύστημα Διαχείρισης Επιστημονικών & Ακαδημαϊκών Συνεδρίων. (

Εικονικά Περιβάλλοντα Μάθησης για Παιδιά με Αυτισμό: Επισκόπηση Πεδίου και Προτάσεις Σχεδιασμού

User Behavior Analysis for a Large2scale Search Engine

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΠΜΣ «ΠΛΗΡΟΦΟΡΙΚΗ & ΕΠΙΚΟΙΝΩΝΙΕς» OSWINDS RESEARCH GROUP

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής. Ακαδηµαϊκό Έτος

2. N-gram IDF. DEIM Forum 2016 A1-1. N-gram IDF IDF. 5 N-gram. N-gram. N-gram. N-gram IDF.

Εμπειρική Μελέτη της Εφαρμογής Gamification στο Μάθημα Εφαρμογές πληροφορικής

ΣΔΥΝΟΛΟΓΗΚΟ ΔΚΠΑΗΓΔΤΣΗΚΟ ΗΓΡΤΜΑ ΗΟΝΗΧΝ ΝΖΧΝ «ΗΣΟΔΛΗΓΔ ΠΟΛΗΣΗΚΖ ΔΠΗΚΟΗΝΧΝΗΑ:ΜΔΛΔΣΖ ΚΑΣΑΚΔΤΖ ΔΡΓΑΛΔΗΟΤ ΑΞΗΟΛΟΓΖΖ» ΠΣΤΥΗΑΚΖ ΔΡΓΑΗΑ ΔΤΑΓΓΔΛΗΑ ΣΔΓΟΤ

ELIXIR-GR / BiP! Finder

, Evaluation of a library against injection attacks

Ανάκτηση πληροφορίας

Online Social Networks: Posts that can save lives. Sotiria Giannitsari April 2016

Αξιολόγηση των εκπαιδευτικών δραστηριοτήτων των νοσοκομειακών βιβλιοθηκών.

Η Διαδραστική Τηλεδιάσκεψη στο Σύγχρονο Σχολείο: Πλαίσιο Διδακτικού Σχεδιασμού

SocialDict. A reading support tool with prediction capability and its extension to readability measurement

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

Πολιτισμός και ψυχοπαθολογία:

* * E mail : matsuto eng.hokudai.ac.jp. Zeiss


ER-Tree (Extended R*-Tree)


Χρήση οντολογιών στη χαρτογράφηση γνώσης: Μελέτη περίπτωσης σε μία ακαδημαϊκή βιβλιοθήκη

DECO DECoration Ontology

Japanese Fuzzy String Matching in Cooking Recipes

MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

(clusters) clusters : clusters : clusters : 4. :

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

1530 ( ) 2014,54(12),, E (, 1, X ) [4],,, α, T α, β,, T β, c, P(T β 1 T α,α, β,c) 1 1,,X X F, X E F X E X F X F E X E 1 [1-2] , 2 : X X 1 X 2 ;

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

Critical Infrastructure Protection: A Roadmap for Greece D. Gritzalis

The st Asian Legislative Experts Symposium ALES ALES KOICA ALES. The 1st Asian Forum of Legislative Information Affairs ALES


Ανάκτηση Πληροφορίας

Study of urban housing development projects: The general planning of Alexandria City

ΝΕΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ, ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ, ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ, ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΕΙΣΑΓΩΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

Security in the Cloud Era

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή)

Ημερίδα διάχυσης αποτελεσμάτων έργου Ιωάννινα, 14/10/2015

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΜΙΧΑΛΗ ΓΛΑΜΠΕΔΑΚΗ ΚΑΘΗΓΗΤΗ ΤΕΙ ΑΘΗΝΩΝ

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΛΕΩΝΙΔΑΣ Α. ΣΠΥΡΟΥ Διδακτορικό σε Υπολογιστική Εμβιομηχανική, Τμήμα Μηχανολόγων Μηχανικών, Πανεπιστήμιο Θεσσαλίας.

From Secure e-computing to Trusted u-computing. Dimitris Gritzalis

Π. Βόλτση - Κ. Π. Ζωντανός

ΠΜΣ στη Διοίκηση Υπηρεσιών Υγείας

ΔΘΝΙΚΗ ΥΟΛΗ ΓΗΜΟΙΑ ΓΙΟΙΚΗΗ ΙΗ ΔΚΠΑΙΓΔΤΣΙΚΗ ΔΙΡΑ

Αλεξάνδρα Παπάζογλου ΕΛΛΗΝΟΑΜΕΡΙΚΑΝΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ, ΨΥΧΙΚΟ, ΑΘΗΝΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Προσαρ α μοζό ζ μεν ε ες ε ς Τε Τ χ ε νικ ι έ κ ς έ ς στο τ Ηλεκ ε τ κ ρ τ ον ο ικ ι ό κ Ε μπόρ ό ιο Εργα γ λεί ε α ί κ α κ ι ι Ε φα φ ρ α μογέ γ ς

The Algorithm to Extract Characteristic Chord Progression Extended the Sequential Pattern Mining

ΠΑΝΤΕΙΟΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΟΙΝΩΝΙΚΩΝ ΚΑΙ ΠΟΛΙΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ & ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ

Maxima SCORM. Algebraic Manipulations and Visualizing Graphs in SCORM contents by Maxima and Mashup Approach. Jia Yunpeng, 1 Takayuki Nagai, 2, 1

Β Ι Ο Γ Ρ Α Φ Ι Κ Ο Σ Η Μ Ε Ι Ω Μ Α ΕΛΕΝΗ ΣΦΑΚΙΑΝΑΚΗ

Online Social Networks: Posts that can save lives. Dimitris Gritzalis, Sotiria Giannitsari, Dimitris Tsagkarakis, Despina Mentzelioti April 2016

Web 論 文. Performance Evaluation and Renewal of Department s Official Web Site. Akira TAKAHASHI and Kenji KAMIMURA


Evaluation of Methods to Extract Important Scenes for Automatic Digest Generation from a Presentation Video

Newman Modularity Newman [4], [5] Newman Q Q Q greedy algorithm[6] Newman Newman Q 1 Tabu Search[7] Newman Newman Newman Q Newman 1 2 Newman 3

Bundle Adjustment for 3-D Reconstruction: Implementation and Evaluation

The Application of Five Ne w Technologies in Intelligence Analysis

Πτυχιακή Εργασία Η ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΤΩΝ ΑΣΘΕΝΩΝ ΜΕ ΣΤΗΘΑΓΧΗ

Optimization, PSO) DE [1, 2, 3, 4] PSO [5, 6, 7, 8, 9, 10, 11] (P)

Συνοπτική Ιστορική εξέλιξη των ΣΓΠ

Query by Phrase (QBP) (Music Information Retrieval, MIR) QBH QBP / [1, 2] [3, 4] Query-by-Humming (QBH) QBP MIDI [5, 6] [8 10] [7]

DEIM Forum 2016 B5-2. Twitter. Twitter. Twitter.

ΕΥΡΕΣΗ ΤΟΥ ΔΙΑΝΥΣΜΑΤΟΣ ΘΕΣΗΣ ΚΙΝΟΥΜΕΝΟΥ ΡΟΜΠΟΤ ΜΕ ΜΟΝΟΦΘΑΛΜΟ ΣΥΣΤΗΜΑ ΟΡΑΣΗΣ

Reading Order Detection for Text Layout Excluded by Image

Εφαρμογή Υπολογιστικών Τεχνικών στη Γεωργία

Απόσπασμα από: «Οδηγός Συγγραφής Πτυχιακής Εργασίας. Αλεξάνδρα Οικονόμου, Βασίλης Παυλόπουλος & Πέτρος Ρούσσος

Οντολογία Ψηφιακής Βιβλιοθήκης

Why We All Need an AIDS Vaccine? : Overcome the Challenges of Developing an AIDS Vaccine in Japan

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΠΑΝΑΣΧΕΔΙΑΣΜΟΣ ΓΡΑΜΜΗΣ ΣΥΝΑΡΜΟΛΟΓΗΣΗΣ ΜΕ ΧΡΗΣΗ ΕΡΓΑΛΕΙΩΝ ΛΙΤΗΣ ΠΑΡΑΓΩΓΗΣ REDESIGNING AN ASSEMBLY LINE WITH LEAN PRODUCTION TOOLS

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΑΣΟΛΟΓΙΑΣ ΚΑΙ ΦΥΣΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΤΟΜΕΑΣ ΣΧΕ ΙΑΣΜΟΥ ΚΑΙ ΑΝΑΠΤΥΞΗΣ ΦΥΣΙΚΩΝ ΠΟΡΩΝ


7. ΕΥΧΑΡΙΣΤΙΕΣ 8. ΠΗΓΕΣ 6. ΣΥΜΠΕΡΑΣΜΑΤΑ

Faruqui [7] WordNet [15] FrameNet [2] PPDB [8]

Transcript:

DEIM Forum 2009 A7-1 Web 606-8501 E-mail: {nakatani,adam,ohshima,tanaka}@dl.kuis.kyoto-u.ac.jp Web Web Web Web Wikipedia Web Wikipedia 1. Web Nakamura 2007 1000 [1] (46%) (ii) 40 (36.8%) 2 Web Web (i) Web Web (ii) (i) Web Web Web Web Web 1 Easiest-first Web 1 2 2 Web (i) 2 3 4 Wikipedia (ii) 5 (i) (ii) Web 6 7 1 http://ja.wikipedia.org/wiki/ 2 http://www.tmin.ac.jp/medical/01/parkinson1.html 1 (i) Parkinson s disease

2. 9:;<>=< 02143?A@ BC@ DFEHGH@ I Web "!$#&% ' ( )+*&,.-, / )*,.-,/&576 8 #&% ' ( 1 Web Web Wikipedia Wikipedia Web LexRank [3] Web Web Wikipedia Xin [2] Web MeSH 3 Xin 3. Web 3. 1 Web Gunning-Fog Index ARI [4] Dale-Chall Readability Index [5] Gray [6] Wikipedia 1 Wikipedia 2 3 4 4 Web Web 1 Web Web Xin [2] 3 http://www.nlm.nih.gov/pubs/factsheets/mesh.html Xin

Web Web [7] [8] 3. 2 Wikipedia Wikipedia 4 Wikipedia 2008 6 Wikipedia 240 2 Wikipedia Wikipedia Wikipedia q Wikipedia Nature C q = {c 1,..., c m } Wikipedia Britannica [9] Milne [10] Agrovoc Wikipedia Wikipedia Strube [11] Wikipedia Ito [12] Wikipedia 4. 1. 2 Wikipedia C q c i D q t Koru [13] Wikipedia q t Wikipedia Mihalcea Wikify! [14] D q Wikipedia 2 t 1 D q Wikipedia t 1 t 2 t 3 D q Wikipedia Web (KLD) D q 4. Wikipedia P(t) Wikipedia t 4. 1 Wikipedia P( t) Wikipedia t P(t D q ) D q Wikipedia t P( t D q ) D q Wikipedia t Wikipedia KLD KLD(t; D q ) = P(t) log P(t D q) + P( t) log P( t D q) (1) P(t) P( t) KLD(t; D q ) > = θ KLD t q 4. 2 Wikipedia 4. 1. 1 q Wikipedia q 4 5 4 http://en.wikipedia.org/wiki/special:statistics t Wikipedia c i

2 149 0.7584 19 0.7895 74 0.8649 83 0.9157 77 0.7922 80.4 0.8184 86 0.7326 42 0.7143 69 0.7826 11 0.7273 12 0.4167 45 0.7273 28 0.7500 SQL 25 0.8400 31 0.7419 138 0.7174 60 0.8833 56.4 0.7695 22 0.5000 46 0.5870 11 0.6364 44 0.6364 20 0.6000 28.6 0.5944 Wikipedia C readability (p) = Obi(p) 1 (2) 5 Obi(p) C readability θ KLD = 0.01 2 5. 1. 2 70% 80%Web Web Wikipedia 3 C technical (p, q) = exp n t(p, q) log p (3) 3,,, 5. 5. 1 5. 1. 1 Web 3. 1 Web Sato [15] 5 13 1 1 13 Web n t (p, q) p q 5 http://kotoba.nuee.nagoya-u.ac.jp/sc/readability/obi.html

! "#$&%('&)&*,+.- 3 LexRank p p C technical 5. 2 Web 5. 2. 2 Web C(p, q) = (1 α) C readability (p) + α C technical (p, q) (5) α 0 < = α < = 1 C LexRank [3] C 6. 5. 2. 1 LexRank 6. 1 LexRank Web PageRank LexRank 4 3 Web API LexRank Web Wikipedia [3] Web Web HTML Web Web tfidf [16] Yahoo!JAPAN Web API 6 Wikipedia 2008 7 24 s i, j i j Wikipedia S 7 6. 2 PageRank LexRank(LR) 100 4 LR = ds LR + (1 d)p, where p = [ 1 n ] n 1 (4) n S S d dumping factor 6 http://developer.yahoo.co.jp/webapi/search/websearch/v1/websearch.html d = 0.85 LexRank 7 http://download.wikimedia.org/jawiki/ 4 α = 0.5 1 4

4 Web 1 (23) Cat Chat:Dr. :? http://www.tbs.co.jp/catchat/friendpark/universe/que blackhole.html 2 (46) -!goo http://oshiete1.goo.ne.jp/qa390129.html 3 (42) http://park1.wakwak.com/ỹumemaru/blackhole.html 4 (98) Yahoo! - - http://contents.kids.yahoo.co.jp/hoshizora/encyclopedia/dic blackhole.html 5 (72)? http://www.h7.dion.ne.jp/ñatsuume/visual/bh1.html 41 (2) SPACE INFORMATION CENTER : http://spaceinfo.jaxa.jp/ja/black holes.html 44 (1) - Wikipedia http://ja.wikipedia.org/wiki/ (3) BLACK HOLE http://www.h3.dion.ne.jp/ black.h/ 1 (33) Neuroinfo Japan: http://square.umin.ac.jp/neuroinf/patient/502.html 2 (84) DBS NouProblem.jp http://www.nouproblem.jp/dbs/index.html 3 (93) asahi.com : : http://www.asahi.com/health/soudan/jh030430.html 4 (3) http://www.niigata-nh.go.jp/nanbyo/pd/pdindex.htm 5 (73) [.com] http://www.peisuke.com/parkinson/top.htm 50 (2) (3)... http://www.nanbyou.or.jp/sikkan/089.htm (1) Parkinson s Disease http://www.parkinson.gr.jp/ Web Web 2 QA 2 5 7. 1 Wikipedia 2 Web Wikipedia Web 3 Wikipedia Web 1 2 Wikipedia 5 1 Web COE Web IT

1809041 NICT (B) Adam Jatowt 18700111 [1] S. Nakamura, S. Konishi, A. Jatowt, H. Ohshima, H. Kondo, T. Tezuka, S. Oyama and K. Tanaka: Trustworthiness analysis of web search results, Proceedings of the 11th ECDL (2007). [2] X. Yan, D. Song and X. Li: Concept-based document readability in domain specific information retrieval, CIKM 06: Proceedings of the 15th ACM international conference on Information and knowledge management, New York, NY, USA, ACM, pp. 540 549 (2006). [3] G. Erkan and D. R. Radev: Lexrank: Graph-based lexical centrality as salience in text summarization, Journal of Artificial Intelligence Research, 22, pp. 457 479 (2004). [4] E. A. Smith and R. J. Senter: Automated readability index, AMRL- TR-66-22 (1967). [5] E. Dale and J. Chall: Readability Revisited: The New Dale-Chall Readability Formula, Brookline Books/Lumen Editions (1995). [6] W. S. Gray and B. Leary.: What makes a book readable, Chicago University Press (1935). [7] M. Y. Ivory and M. A. Hearst: Statistical profiles of highly-rated web sites, CHI 02: Proceedings of the SIGCHI conference on Human factors in computing systems, New York, NY, USA, ACM, pp. 367 374 (2002). [8] T. Mandl: Implementation and evaluation of a quality-based search engine, HYPERTEXT 06: Proceedings of the seventeenth conference on Hypertext and hypermedia, New York, NY, USA, ACM, pp. 73 84 (2006). [9] J. Giles: Internet encyclopedia go head to head, Nature, 438, (2005). [10] D. Milne, O. Medelyan and I. H. Witten: Mining domain-specific thesauri from wikipedia: A case study, International Conference on Web Intelligence (2006). [11] M. Strube and S. P. Ponzetto: Wikirelate! computing semantic relatedness using wikipedia, Proceedings of National Conference for Artificial Intelligence (2006). [12] M. Ito, K. Nakayama, T. Hara and S. Nishio: Association thesaurus construction methods based on link co-occurrence analysis for wikipedia, CIKM 08: Proceeding of the 17th ACM conference on Information and knowledge management, New York, NY, USA, ACM, pp. 817 826 (2008). [13] D. N. Milne, I. H. Witten and D. M. Nichols: A knowledge-based search engine powered by wikipedia, Proceedings of the sixteenth ACM conference on CIKM, New York, NY, USA, ACM (2007). [14] R. Mihalcea and A. Csomai: Wikify!: linking documents to encyclopedic knowledge, Proceedings of the sixteenth ACM conference on CIKM, ACM (2007). [15] S. M. Satoshi Sato and Y. Kondoh: Automatic assessment of japanese text readability based on a textbook corpus, Proceedings of the Sixth International Language Resources and Evaluation (LREC 08) (Ed. by E. L. R. A. (ELRA)), Marrakech, Morocco (2008). [16] G. Salton and C. Buckley: Term-weighting approaches in automatic text retrieval, Inf. Process. Manage., 24, 5, pp. 513 523 (1988).