Part C. CS-463 Information Retrieval Systems. Yannis Tzitzikas. University of Crete PART (C): CS-463,Spring 05 PART (A)

Σχετικά έγγραφα
Part A. CS-463 Information Retrieval Systems. Yannis Tzitzikas. University of Crete. CS-463,Spring 05 PART (A) PART (C):

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μοντέλα Ανάκτησης Ι

Ανάκτηση Πληροφορίας

Other Test Constructions: Likelihood Ratio & Bayes Tests

Ανάκτηση Πληροφορίας

Θα μιλήσουμε για ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. Διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης)

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 2 του βιβλίου. 2 ο ΜΕΡΟΣ

The Simply Typed Lambda Calculus

Solution Series 9. i=1 x i and i=1 x i.

Αιτιολόγηση με αβεβαιότητα

C.S. 430 Assignment 6, Sample Solutions

Μοντέλα Ανάκτησης IΙ (Retrieval Models)

Part B. CS-463 Information Retrieval Systems. Yannis Tzitzikas. University of Crete. CS-463,Spring 05 PART (A) PART (C):

Ανάκτηση Πληροφορίας

The challenges of non-stable predicates

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Numerical Analysis FMN011

Overview. Transition Semantics. Configurations and the transition relation. Executions and computation

Models for Probabilistic Programs with an Adversary

Statistical Inference I Locally most powerful tests

Θα μιλήσουμε για ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. Διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης)

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3

Ανάκτηση πληροφορίας

Web-based supplementary materials for Bayesian Quantile Regression for Ordinal Longitudinal Data

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

TMA4115 Matematikk 3

Chapter 6: Systems of Linear Differential. be continuous functions on the interval

2 Composition. Invertible Mappings

The Probabilistic Method - Probabilistic Techniques. Lecture 7: The Janson Inequality

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

5.4 The Poisson Distribution.

Section 8.3 Trigonometric Equations

Aquinas College. Edexcel Mathematical formulae and statistics tables DO NOT WRITE ON THIS BOOKLET

Fractional Colorings and Zykov Products of graphs

Ανάκτηση Πληροφορίας. Φροντιστήριο 3

Solutions to Exercise Sheet 5

Approximation of distance between locations on earth given by latitude and longitude

Statistics 104: Quantitative Methods for Economics Formula and Theorem Review

6.1. Dirac Equation. Hamiltonian. Dirac Eq.

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in

Θέμα : Retrieval Models. Ημερομηνία : 9 Μαρτίου 2006

derivation of the Laplacian from rectangular to spherical coordinates

Lecture 2. Soundness and completeness of propositional logic

EE512: Error Control Coding

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Sequent Calculi for the Modal µ-calculus over S5. Luca Alberucci, University of Berne. Logic Colloquium Berne, July 4th 2008

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8 questions or comments to Dan Fetter 1

ST5224: Advanced Statistical Theory II

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

2. THEORY OF EQUATIONS. PREVIOUS EAMCET Bits.

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

Homework 8 Model Solution Section

SOLUTIONS TO MATH38181 EXTREME VALUES AND FINANCIAL RISK EXAM

Homework 3 Solutions

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 1

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

Σχέσεις, Ιδιότητες, Κλειστότητες

Areas and Lengths in Polar Coordinates

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ.

Partial Differential Equations in Biology The boundary element method. March 26, 2013

Formal Semantics. 1 Type Logic

Ανάκτηση Πληροφορίας

4.6 Autoregressive Moving Average Model ARMA(1,1)

Elements of Information Theory

About these lecture notes. Simply Typed λ-calculus. Types

Finite Field Problems: Solutions

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

A Lambda Model Characterizing Computational Behaviours of Terms

Ανάκτηση Πληροφορίας

CRASH COURSE IN PRECALCULUS

Srednicki Chapter 55

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

ECE598: Information-theoretic methods in high-dimensional statistics Spring 2016

Every set of first-order formulas is equivalent to an independent set

Areas and Lengths in Polar Coordinates

Practice Exam 2. Conceptual Questions. 1. State a Basic identity and then verify it. (a) Identity: Solution: One identity is csc(θ) = 1

Abstract Storage Devices

Η ΠΡΟΣΩΠΙΚΗ ΟΡΙΟΘΕΤΗΣΗ ΤΟΥ ΧΩΡΟΥ Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ CHAT ROOMS

Solutions to the Schrodinger equation atomic orbitals. Ψ 1 s Ψ 2 s Ψ 2 px Ψ 2 py Ψ 2 pz

SCITECH Volume 13, Issue 2 RESEARCH ORGANISATION Published online: March 29, 2018

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

Notes on the Open Economy

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

SOLUTIONS TO MATH38181 EXTREME VALUES AND FINANCIAL RISK EXAM

ECE 308 SIGNALS AND SYSTEMS FALL 2017 Answers to selected problems on prior years examinations

A Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics

Partial Trace and Partial Transpose

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.

Estimation for ARMA Processes with Stable Noise. Matt Calder & Richard A. Davis Colorado State University

Démographie spatiale/spatial Demography

Ανάκτηση Πληροφορίας

Example of the Baum-Welch Algorithm

Transcript:

CS-463 Information Systems Μοντέλα Ανάκτησης ( Models) Part C Yannis Tzitzikas University of Crete CS-463,Spring 05 Lecture : 5 Date : 8-3- ιάρθρωση ιάλεξης PART (A) Ανάκτηση και Φιλτράρισµα Εισαγωγή στα Μοντέλα Άντλησης Κατηγορίες Μοντέλων Exact vs Best Match Τα κλασσικά µοντέλα ανάκτησης Το Boolean Μοντέλο Στατιστικά Μοντέλα - Βάρυνση Όρων Το ιανυσµατικό Μοντέλο Το Πιθανοκρατικό Μοντέλο PART (B):Εναλλακτικά µοντέλα (Ι) Συνολοθεωρητικάµοντέλα Fuzzy Model Extended Boolean Model (ΙΙ) ΑλγεβρικάΜοντέλα Latent Semantic Indexing Neural Netwok Model PART (C): (ΙΙΙ) ΠιθανοκρατικάΜοντέλα Bayesian Network Model Inference Network Model 116 1

Εναλλακτικά Πιθανοκρατικά Μοντέλα Probability Theory Semantically clear Computationally clumsy Why Bayesian (Belief) Networks? Clean formalism to combine distinct sources of evidence past queries, past feedback cycles, distinct query formulations Modularize the world (dependencies) Bayesian Network Models for IR: Inference Network (Turtle & Croft, 1991) Belief Network (Ribeiro-Neto & Muntz, 1996) 117 Bayesian Inference Basic Probability Axioms: 0 < P(A) < 1 ; P(sure)=1; P(A V B)=P(A)+P(B) if A and B are mutually exclusive Other formulations P(A)=P(A Λ B)+P(A Λ B) P(A)= Σ i P(A Λ B i ), where B i, i is a set of exhaustive and mutually exclusive events P(A) + P( A) = 1 P(A K) belief in A given the knowledge K if P(A B)=P(A), we say:a and B are independent if P(A BΛ C)= P(A C), we say: A and B are conditionally independent, given C P(A Λ B)=P(A B)P(B) P(A)= Σ i P(A B i )P(B i ) 118 2

Bayesian Inference Bayes Rule : the heart of Bayesian techniques P(H e) = P(e H) P(H) P(e) where, H : a hypothesis e : is an evidence P(H) : prior probability P(H e) : posterior probability P(e H) : probability of e if H is true P(e) : a normalizing constant, then we write: P(H e) ~ P(e H)P(H) 119 Bayesian Networks Bayesian networks are directed acyclic graphs (DAGS) in which the nodes represent random variables, the arcs portray causal relationships between these variables, and the strengths of these causal influences are expressed by conditional probabilities. y i : parent nodes (in this case, root nodes) x : child node y i cause x Y the set of parents of x The influence of Y on x can be quantified by any function F(x,Y) such that Σ x F(x,Y) = 1 0 < F(x,Y) < 1 For example, F(x,Y)=P(x Y) y 1 y 2 x y t 120 3

Παράδειγµα I'm at work, neighbor John calls to say my alarm is ringing, but neighbor Mary doesn't call. Sometimes it's set off by minor earthquakes. Is there a burglar? Variables: Burglary, Earthquake, Alarm, JohnCalls, MaryCalls Network topology reflects "causal" knowledge: A burglar can cause the alarm An earthquake can set the alarm The alarm can cause Mary to call The alarm can cause John to call 121 Παράδειγµα 122 4

Bayesian Networks and Joint Probabilities The full joint distribution is defined as the product of the local conditional distributions: Examples: P (x 1,,x n ) = Π i = 1,n P (x i Parents(x i )) x 1 x 2 x 3 x 4 x 5 P(x 1, x 2, x 3, x 4, x 5 )= P(x 1 ) P(x 2 x 1 ) P(x 3 x 1 ) P(x 4 x 2, x 3 ) P(x 5 x 3 ). P(x 1 ) : prior probability of the root node P(j m a b e)= P (j a) P (m a) P (a b, e) P ( b) P ( e) 123 Also In a Bayesian network each variable x is conditionally independent of all its non-descendants, given its parents. (ανεξάρτητης των µη απογόνων δοθέντων των πατέρων) x 2 x 1 x 3 For example: P(x 4, x 5 x 2, x 3 )= P(x 4 x 2, x 3 ) P( x 5 x 3 ) x 4 x 5 124 5

Information Models Inference Network Model Inference Network Model Επιστηµολογική άποψη του προβλήµατος της ΑΠ Σχολές σκέψης στις πιθανότητες: freqüentist: πιθανότητα = στατιστικό µέγεθος σχετιζόµενο µε την τύχη epistemological πιθανότητα = βαθµός πίστης του οποίου η περιγραφή µπορεί να είναι απαλλαγµένη από στατιστικά πειράµατα Η προσέγγιση του Inference Network Model: Επιστηµολογική χρήση των πιθανοτήτων 126 6

Inference Network Model:Τυχαίεςµεταβλητές Εγγράφων Ητυχαίαµεταβλητήπουσχετίζεταιµεέναέγγραφο d j παριστάνειτοσυµβάν παρατήρησης του εγγράφου αυτού Όρων Η παρατήρηση ενός εγγράφου είναι η αιτία για αυξηµένη πίστη στις τυχαίες µεταβλητές που αντιστοιχούν στους όρους που περιέχει το κείµενο Επερωτήσεων εκφράζει το βαθµό ικανοποίησης της επερώτησης Όλες οι τυχαίες µεταβλητές (d,k,q) είναι δυαδικές ( 0 ή 1)! 127 Inference Network Model: οµή (documents => terms => queries) d j has index terms k 2, k i, and k t q has index terms k 1, k 2, and k i q 1 and q 2 model boolean formulation q 1 =((k 1 Λ k 2 ) v k i ); I = (q v q 1 ) d j k 1 k 2 k i k t Nodes documents (d j ) index terms (k i ) queries (q, q 1, and q 2 ) user information need (I) q I or and q 2 or q 1 128 7

Inference Network Model: Ranking Όλες οι τυχαίες µεταβλητές (d,k,q) είναι δυαδικές ( 0 ή 1)! Κατάταξη Rank(q,dj) Rank(q,dj) = P(q Λ d j ) q and dj είναι συντοµογραφίες του q=1 and dj =1 Rank(q,dj) : expresses how much evidential support the observation of dj provides to the query q Rank(q,dj) = P(q=1 Λ d j =1) (dj stands for a state where dj = 1 and i j di =0, because we observe one document at a time) 129 How an inference network can be tuned to subsume the Boolean Model d j P(dj) = 1/N k 1 k 2 k i k t P(k i d j ) = 1 if wij=1 q and q 2 or I or q 1 P(q k) =1 if q cc (q cc q dnf ) Λ ( k i, g i (k)= g i (q cc ) 0 otherwise one of the conjunctive components of the query must be matched by the active index terms in k 130 8

Inference network and TF-IDF d j P(dj) = 1/ d j reflects the importance of document normalization k 1 k 2 k i k t P(k i d j ) = tf i,j q and q 2 or P(q ki) =idf i or q 1 I however the obtained ranking is distinct of the one provided by the vector model 131 Inference Network Model: Σύνοψη Επιστηµολογική προσέγγιση Τοπολογίαδικτύου d -> k -> q Εκφραστική ικανότητα Συλλαµβάνει το Boolean Model (µε δυαδικές τυχαίες µεταβλητές) Μπορεί να προσεγγίσει αρκετά το διανυσµατικό υνατότητα συνδυασµού πολλών αποδεικτικών πηγών Συστήµατα βασισµένα σε αυτό το µοντέλο Inquery system 132 9

Information Models Belief Network Model Belief Network Model Όπως και στο Inference Network Model Επιστηµολογική άποψη του προβλήµατος της ΑΠ Τυχαίες µεταβλητές για έγγραφα, όρους και επερωτήσεις Αντίθεταµετo Inference Network Model, εδώέχουµε πιο ξεκάθαρο δειγµατικό χώρο συνολοθεωρητική προσέγγιση διαφορετική τοπολογία δικτύου 134 10

Belief Network Model: The Probability Space ειγµατικόςχώρος: K={k 1, k 2,...,k t } (sample space) Κάθε όρος ki είναι µια στοιχειώδης έννοια (elementary concept) Κάθεσύνολο u K είναιµιαέννοια Σεκάθε u K αντιστοιχίζεταιέναδυαδικόδιάνυσµα k=(k 1, k 2,...,k t ) τ.ω. w i =1 k i u k i a binary random variable associated with the index term k i, (k i = 1 w i =1 k i u) 135 Belief Network Model: Documents and Queries Εγγραφο d: έναυποσύνολοτουκ(πουπεριέχειτουςόρουςτου d) Επερώτηση q: έναυποσύνολοτουκ(πουπεριέχειτουςόρουςτης q) Ορίζουµε µια κατανοµή πιθανότητας P στο Κ ως εξής: P(c)=Σ u P(c u) P(u) // the degree of coverage of the space K by c c: a generic concept representing a document or a query Αρχικά (πουδενγνωρίζουµετα P(u)), υποθέτουµεότι: P(u)=(1/2) t =1/2 K 136 11

Belief Network Model: Τοπολογία ικτύου και Σηµασιολογία q P(q)=1 means that q covers completely the concept space k 1 k 2 k i k t k u d 1 d j d n P(dj)=1 means that dj covers completely the concept space So user queries and documents are modeled as subsets of index terms. The concept space K works as the common sample space. 137 Belief Network Model: Ranking : P(d q) q k 1 k 2 k i k t k u P(d q) Εκφράζειτοβαθµόκάλυψηςτου d απότηντηνεπερώτηση q d 1 d j d n Όσο πιο µεγάλος είναι, τόσο πιο συναφέςείναιτο d µετο q 138 12

Belief Network Model: Computing P(d q) q k 1 k 2 k i k t k u P(d q) Εκφράζειτοβαθµόκάλυψηςτου d απότηντηνεπερώτηση q d 1 d j d n P(d j q) = P(d j Λ q) / P(q) (εξ ορισµού: θεώρηµα Bayes) ~ P(d j Λ q) (διότιοπαρανοµαστής P(q) είναιίδιοςγιαόλατα d) ~ Σ u P(d j Λ q u) P(u) (εξ ορισµού) ~ Σ u P(d j u) P(q u) P(u) (Bayesian networks) ~ Σ k P(d j k) P(q k) P(k) Αρκεί να ορίσουµε αυτά 139 Defining P(q k) and P(d k) to model the vector model q P( q k ) = i w iq t i= 1 w 2 iq if q contains k i (otherwise= 0) k 1 k 2 k i k t k u d 1 d j d n P( d j k ) = i w ij t i= 1 w 2 ij if d j contains k (otherwise= 0) i In this way we get the ranking of the classic Vector Space Model! 140 13

Belief Network Model: Σύνοψη Επιστηµολογική προσέγγιση Τοπολογίαδικτύου d <- k -> q (τo inference network είχεδοµή d -> k -> q) Εκφραστική ικανότητα Συλλαµβάνει το Boolean Model (µε δυαδικές τυχαίες µεταβλητές) Συλλαµβάνει το ιανυσµατικό Μοντέλο Μπορεί αναπαράγει οποιαδήποτε διάταξη του Inference Network (το αντίστροφο δεν ισχύει) υνατότητα συνδυασµού πολλών αποδεικτικών πηγών Inference Network Model: τοπρώτοκαιπιογνωστό επιτυχηµένη χρήση στο σύστηµα Inquery 141 ιάρθρωση PART (A) Ανάκτηση και Φιλτράρισµα Εισαγωγή στα Μοντέλα Άντλησης Κατηγορίες Μοντέλων Exact vs Best Match Τα κλασσικά µοντέλα ανάκτησης Το Boolean Μοντέλο Στατιστικά Μοντέλα - Βάρυνση Όρων Το ιανυσµατικό Μοντέλο Το Πιθανοκρατικό Μοντέλο PART (B):Εναλλακτικά µοντέλα (Ι) Συνολοθεωρητικάµοντέλα Fuzzy Model Extended Boolean Model (ΙΙ) Αλγεβρικά Μοντέλα PART (C): Latent Semantic Indexing Neural Netwok Model (ΙΙΙ) ΠιθανοκρατικάΜοντέλα Bayesian Network Model Inference Network Model 142 14

Ταξινοµία Μοντέλων που εξετάσαµε Set Theoretic Classic Models boolean vector probabilistic Fuzzy Extended Boolean Algebraic Generalized Vector Lat. Semantic Index Neural Networks Probabilistic Inference Network Belief Network 143 Ταξινοµία Μοντέλων που εξετάσαµε Set Theoretic Classic Models boolean vector probabilistic Fuzzy Extended Boolean Algebraic Generalized Vector Lat. Semantic Index Neural Networks Probabilistic Inference Network Belief Network Partial Matching 144 15

Ταξινοµία Μοντέλων που εξετάσαµε Set Theoretic Classic Models boolean vector probabilistic Fuzzy Extended Boolean Algebraic Generalized Vector Lat. Semantic Index Neural Networks Probabilistic Boolean Queries Inference Network Belief Network Partial Matching 145 WRT Expressive Power (incomplete) Extended Boolean Belief Network Fuzzy Inference Network Neural Network Boolean Vector Probabilistic 146 16

Άλλοι τύποι Μοντέλων Ανάκτησης που θα δούµε αργότερα Αργότερα Μοντέλα Ανάκτησης οµηµένων Εγγράφων Non Overlapping Lists Proximal Nodes Models for XML Μοντέλα Ανάκτησης Ιστοσελίδων Έµφαση στους συνδέσµους Μοντέλα Ανάκτησης Πολυµέσων Μοντέλα Βασισµένα στη Λογική Carlo Meghini and Umberto Straccia, A Relevance Terminological Logic for Information,Proceedings of SIGIR'96, Zurich, Switzerland, 1996 148 17