Ευρετηρίαση ΜΕΡΟΣ ΙΙ
|
|
- Κύρα Λιάπης
- 7 χρόνια πριν
- Προβολές:
Transcript
1 Ευρετηρίαση ΜΕΡΟΣ ΙΙ Ανάκτηση Πληροφορίας Content Processing Boolean Queries Faster posting lists with skip pointers Phrase and Proximity Queries Biwords Positional Indexes Dictionary Wild-Card Queries Permutex k-gram indexes Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
2 Χρήση Καταλόγων/Ευρετηρίων Τα συστήματα ανάκτησης σπάνια αναζητούν την πληροφορία απευθείας στη συλλογή εγγράφων. Συνήθως, χρησιμοποιούνται κατάλογοι οι οποίοι επιταχύνουν τη διαδικασία αναζήτησης. συλλογή εγγράφων Κατάλογος αναζήτηση καταλόγου δημιουργία καταλόγου Έγγραφα Σχεδιάζουμε το ευρετήριο ανάλογα με το μοντέλο ανάκτησης και τη γλώσσα επερώτησης Ανάκτηση Πληροφορίας Sec. 1.2 Inverted index construction Documents to be indexed. Friends, Romans, countrymen. Tokenizer Token stream. Friends Romans Countrymen Linguistic modules Modified tokens. friend roman countryman Indexer friend Inverted index. roman countryman Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
3 Γενική (Λογική) μορφή ενός ευρετηρίου D o c u m e n t s Indexing Items (όροι ευρετηρίου) k 1 k 2... k j... k t d 1 c 1,1 c 2,1... c i,1... c t,1 d 2 c 1,2 c 2,2... c i,2... c t, d i c 1,j c 2,j... c i,j... c t,j d N c 1,N c 2,N... c i,n... c t,n Ερωτήματα: c ij : το κελί που αντιστοιχεί στο έγγραφο d i και στον όρο k j, το οποίο μπορεί να περιέχει: ένα w ij που να δηλώνει την παρουσία ή απουσία του k j στο d i (ή τη σπουδαιότητα του k j στο d i ) τις θέσεις στις οποίες οόροςk j εμφανίζεται στο d i (αν πράγματι εμφανίζεται) Τι πρέπει να έχει το κάθε c ij Πώς να υλοποιήσουμε αυτή τη λογική δομή ώστε να έχουμε καλή απόδοση; Ανάκτηση Πληροφορίας Γλώσσες Επερώτησης για Ανάκτηση Πληροφοριών Επερωτήσεις λέξεων (Keyword-based Queries) Μονολεκτικές επερωτήσεις (Single word Queries) Επερωτήσεις φυσικής γλώσσας (Natural Language Queries) Boolean Επερωτήσεις (Boolean Queries) Επερωτήσεις Συμφραζομένων (Context Queries) Φραστικές Επερωτήσεις (Phrasal Queries) Επερωτήσεις Εγγύτητας (Proximity Queries) Ταίριασμα Προτύπου (Pattern Matching) Απλό (Simple) Ανεκτικές σε ορθογραφικά λάθη (Allowing errors) Levenstein distance, LCS longest common subsequence Κανονικές Εκφράσεις (Regular expressions) Δομικές Επερωτήσεις (Structural Queries) (θα καλυφθούν σε επόμενο μάθημα) Πρωτόκολλα επερώτησης (Query Protocols) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
4 Ανεστραμμένα Αρχεία (Inverted Files) Ανάκτηση Πληροφορίας Ανεστραμμένο Αρχείο Λογική Μορφή Ευρετηρίου Μορφή Ανεστραμμένου Ευρετηρίου Index terms C j,1 k 1 k 2... k t d 1 c 1,1 c 2,1 c t,1 d 2 c 1,2 c 2,2 c t, d i c 1,j c 2,j c t,j d N c 1,N c 2,N c t,n k 1 k 2... k t Vocabulary Postings lists Άρα δεν δεσμεύουμε χώρο για τα «μηδενικά κελιά» της λογικής μορφής του ευρετηρίου Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
5 Inverted Files (Ανεστραμμένα αρχεία) Ιnverted file = a word oriented mechanism for indexing a text collection in order to speed up the searching task. An inverted file consists of: Vocabulary: is the set of all distinct words in the text Occurrences: lists containing all information necessary for each word of the vocabulary (documents where the word appears, frequency, text position, etc.) Τι είδους πληροφορία κρατάμε στις posting lists εξαρτάται από το λογικό μοντέλο και το μοντέλο ερωτήσεων Ανάκτηση Πληροφορίας Ανεστραμμένο αρχείο για πολλά έγγραφα, και βάρυνση tf-idf To df (document frequency, που μας χρειάζεται για το IDF) αρκεί να αποθηκευτεί μια φορά To βάρος tf (term frequency) Index terms df D j, tf j Εδώ θα μπορούσαμε να έχουμε και τις θέσεις εμφάνισης της λέξης computer στο έγγραφο D j computer 3 D 7, 4 database 2 D 1, 3 science 4 D 2, 4 system 1 D 5, 2 Vocabulary file Postings lists Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
6 Another example term df document ids Ανάκτηση Πληροφορίας Ανεστραμμένα Αρχεία: Απαιτήσεις Χώρου μικρές μεγάλες Index terms Cj,1 k1 k2... kt Postings lists Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
7 Ανεστραμμένα Αρχεία (Inverted Files) ΔΥΑΔΙΚΟ ΜΟΝΤΕΛΟ Boolean Keyword Queries Ανάκτηση Πληροφορίας Term-document incidence Sec. 1.1 Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser Brutus AND Caesar BUT NOT Calpurnia 1 if play contains word, 0 otherwise Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
8 Can t build the matrix Sec K x 1M matrix has half a trillion 0 s and 1 s. But it has no more than one billion 1 s. matrix is extremely sparse. What s a better representation? We only record the 1 positions. Ανάκτηση Πληροφορίας Inverted index Sec. 1.2 For each term t, we must store a list of all documents that contain t. Identify each by a docid, a document serial number Can we used fixed size arrays for this? Brutus Caesar Calpurnia What happens if the word Caesar is added to document 14? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
9 Inverted index Sec. 1.2 We need variable size postings lists On disk, a continuous run of postings is normal and best In memory, can use linked lists or variable length arrays Some tradeoffs in size/ease of insertion Posting Brutus Caesar Calpurnia Dictionary Postings Sorted by docid (more later on why). Ανάκτηση Πληροφορίας Inverted index construction Sec. 1.2 Documents to be indexed. Friends, Romans, countrymen. Tokenizer Token stream. Friends Romans Countrymen Linguistic modules Modified tokens. friend roman countryman Indexer friend Inverted index. roman countryman Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
10 Inverted index construction Sec. 1.2 Sequence of (Modified token, Document ID) pairs. Doc 1 I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. Doc 2 So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious Ανάκτηση Πληροφορίας Inverted index construction Sec. 1.2 Sort by terms And then docid Core indexing step Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
11 Inverted index construction Sec. 1.2 Multiple term entries in a single document are merged. Split into Dictionary and Postings Doc. frequency information is added. Ανάκτηση Πληροφορίας Where do we pay in storage? Sec. 1.2 Lists of docids Terms and counts Pointers Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
12 Sec. 1.3 How do we process a query? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
13 Ανάκτηση Πληροφορίας Searching an inverted index General Steps: 1. Vocabulary search: the words present in the query are searched in the vocabulary 2. Retrieval occurrences: the lists of the occurrences of all words found are retrieved 3. Manipulation of occurrences: The occurrences are processed to solve the query Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
14 Sec. 1.3 Query processing: AND Consider processing the query: Brutus AND Caesar Locate Brutus in the Dictionary; Retrieve its postings. Locate Caesar in the Dictionary; Retrieve its postings. Merge the two postings: Brutus Caesar Ανάκτηση Πληροφορίας Query processing: AND Sec. 2.3 The merge Walk through the two postings simultaneously, in time linear in the total number of postings entries Brutus Caesar If the list lengths are m and n, the merge takes O(m+n)operations. Crucial: postings sorted by docid. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
15 Query processing: merge Ανάκτηση Πληροφορίας Boolean queries: More general merges Sec. 1.3 Exercise: Adapt the merge for: Brutus AND NOT Caesar Can we still run through the merge in time O(x+y)? What can we achieve? Exercise: Adapt the merge for: Brutus OR NOT Caesar Can we still run through the merge in time O(x+y)? What can we achieve? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
16 Merging Sec. 1.3 What about an arbitrary Boolean formula? (Brutus OR Caesar) AND NOT (Antony OR Cleopatra) Can we always merge in linear time? Linear in what? Can we do better? Ανάκτηση Πληροφορίας Query optimization Sec. 1.3 What is the best order for query processing? Consider a query that is an AND of n terms. For each of the n terms, get its postings, then AND them together. Query: Brutus AND Calpurnia AND Caesar Brutus Caesar Calpurnia Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
17 Query optimization example Sec. 1.3 Process in order of increasing freq: start with smallest set, then keep cutting further. This is why we kept document freq. in dictionary Brutus Caesar Calpurnia Execute the query as (Calpurnia AND Brutus) AND Caesar. Ανάκτηση Πληροφορίας More general optimization Sec. 1.3 e.g., (madding OR crowd) AND (ignoble OR strife) Get doc. freq. s for all terms. Estimate the size of each OR by the sum of its doc. freq. s (conservative). Process in increasing order of OR sizes. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
18 Exercise Recommend a query processing order for (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes) Term Freq eyes kaleidoscope marmalade skies tangerine trees Ανάκτηση Πληροφορίας Query processing exercises Exercise: If the query is friends AND romans AND (NOT countrymen), how could we use the freq of countrymen? Exercise: Extend the merge to an arbitrary Boolean query. Can we always guarantee execution in time linear in the total postings size? Hint: Begin with the case of a Boolean formula query: in this, each query term appears only once in the query. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
19 Ειδικές Μορφές του Ανεστραμμένου Ευρετηρίου Ανάκτηση Πληροφορίας Recap Ch. 1 Key step in construction: Sorting Boolean query processing Intersection by linear time merging Simple optimizations Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
20 Αποτίμηση Boolean επερωτήσεων με χρήση ανεστραμμένων αρχείων Αποτίμηση με χρήση ανεστραμμένων αρχείων Single keyword: Retrieve containing documents using the inverted index. OR: Recursively (by merge) retrieve e 1 and e 2 and take union of results. AND: Recursively retrieve e 1 and e 2 and take intersection of results. BUT: Recursively retrieve e 1 and e 2 and take set difference of results. Ανάκτηση Πληροφορίας FASTER POSTINGS MERGES: SKIP POINTERS/SKIP LISTS Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
21 Sec. 2.3 Recall basic merge Walk through the two postings simultaneously, in time linear in the total number of postings entries Brutus Caesar If the list lengths are m and n, the merge takes O(m+n)operations. Can we do better? Yes (if index isn t changing too fast). Ανάκτηση Πληροφορίας Sec. 2.3 Augment postings with skip pointers (at indexing time) Why? To skip postings that will not figure in the search results. 1. How? 2. Where do we place skip pointers? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
22 Sec. 2.3 How? Query processing with skip pointers Suppose we ve stepped through the lists until we process 8 on each list. We match it and advance. We then have 41 and 11 on the lower. 11 is smaller. But the skip successor of 11 on the lower list is 31, so we can skip ahead past the intervening postings. Ανάκτηση Πληροφορίας Sec. 2.3 Tradeoff: Where do we place skips? More skips shorter skip spans more likely to skip. But lots of comparisons to skip pointers. Fewer skips few pointer comparison, but then long skip spans few successful skips. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
23 Sec. 2.3 Placing skips Simple heuristic: for postings of length L, use L evenly spaced skip pointers. This ignores the distribution of query terms. Easy if the index is relatively static; harder if L keeps changing because of updates. This definitely used to help; with modern hardware it may not (Bahle et al. 2002) unless you re memory based The I/O cost of loading a bigger postings list can outweigh the gains from quicker in memory merging! Ανάκτηση Πληροφορίας PHRASE QUERIES AND POSITIONAL INDEXES Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
24 Phrase queries Sec. 2.4 Want to be able to answer queries such as stanford university as a phrase Thus the sentence I went to university at Stanford is not a match. The concept of phrase queries has proven easily understood by users; one of the few advanced search ideas that works 10% explicit phrase queries ( ) Many more queries are implicit phrase queries (such as person names) Ανάκτηση Πληροφορίας Phrase queries Sec. 2.4 For this, it no longer suffices to store only <term : docs> entries Είδαμε στο προηγούμενο μάθημα ότι μπορούμε να κρατάμε τη θέση κάθε όρου στο κείμενο ή να χωρίσουμε το κείμενο σε blocks (θα το δούμε ποιο αναλυτικά σήμερα) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
25 A first attempt: Biword indexes Sec Index every consecutive pair of terms in the text as a phrase For example the text Friends, Romans, Countrymen would generate the biwords friends romans romans countrymen Each of these biwords is now a dictionary term Two word phrase query processing is now immediate. Ανάκτηση Πληροφορίας Sec Longer phrase queries stanford university palo alto can be broken into the Boolean query on biwords: stanford university AND university paloand palo alto Without the docs, we cannot verify that the docs matching the above Boolean query do contain the phrase. Can have false positives! Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
26 Sec Extended biwords 1. Parse the indexed text and perform part of speech tagging (POST). 2. Bucket the terms into (say) Nouns (N) and articles/prepositions (X). 3. Call any string of terms of the form NX*N an extended biword 4. Each such extended biword is now made a term in the dictionary. Example: catcher in the rye N X X N Query processing: parse it into N s and X s Segment query into enhanced biwords Look up in index: catcher rye Ανάκτηση Πληροφορίας Issues for biword indexes Sec False positives, as noted before Index blowup due to bigger dictionary Infeasible for more than biwords, big even for them Biword indexes are not the standard solution (for all biwords) but can be part of a compound strategy Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
27 Sec Solution 2: Positional indexes In the postings, store, for each term the position(s) in which tokens of it appear: <term, number of docs containing term; doc1: position1, position2 ; doc2: position1, position2 ; etc.> Ας θεωρήσουμε ότι position είναι η θέση του token Ανάκτηση Πληροφορίας Positional index example Sec <be: ; 1: 7, 18, 33, 72, 86, 231; 2: 3, 149; 4: 17, 191, 291, 430, 434; 5: 363, 367, > Which of docs 1,2,4,5 could contain to be or not to be? For phrase queries, we use a merge algorithm recursively at the document level But we now need to deal with more than just equality Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
28 Processing a phrase query Sec Extract inverted index entries for each distinct term: to, be, or, not. Merge their doc:position lists to enumerate all positions with to be or not to be. to: be: 2:1,17,74,222,551; 4:8,16,190,429,433; 7:13,23,191;... 1:17,19; 4:17,191,291,430,434; 5:14,19,101;... Ανάκτηση Πληροφορίας Proximity queries Sec LIMIT! /3 STATUTE /3 FEDERAL /2 TORT Again, here, /k means within k words of. Clearly, positional indexes can be used for such queries; biword indexes cannot. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
29 Proximity queries Sec Exercise: Adapt the linear merge of postings to handle proximity queries. Can you make it work for any value of k? This is a little tricky to do correctly and efficiently See Figure 2.12 of IIR There s likely to be a problem on it! Ανάκτηση Πληροφορίας Positional index size Sec You can compress position values/offsets Nevertheless, a positional index expands postings storage substantially Nevertheless, a positional index is now standardly used because of the power and usefulness of phrase and proximity queries whether used explicitly or implicitly in a ranking retrieval system. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
30 Positional index size Sec Need an entry for each occurrence, not just once per document Index size depends on average document size Average web page has <1000 terms SEC filings, books, even some epic poems easily 100,000 terms Consider a term with frequency 0.1% Document size Postings Positional postings , Ανάκτηση Πληροφορίας Rules of thumb Sec A positional index is 2 4 as large as a nonpositional index (compressed) Positional index size 35 50% of volume of original text Caveat: all of this holds for English like languages The number of items to check Θ(Ν) -> Θ(Τ), where N:number of documents, T: number of tokens Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
31 Combination schemes Sec These two approaches can be profitably combined For particular phrases ( Michael Jackson, Britney Spears ) it is inefficient to keep on merging positional postings lists Even more so for phrases like The Who In general: Good queries to include: common (based on recent query behavior) and expensive Ανάκτηση Πληροφορίας Combination schemes Sec Williams et al. (2004) evaluate a more sophisticated mixed indexing scheme (+ a partial next word index) A typical web query mixture was executed in ¼of the time of using just a positional index It required 26% more space than having a positional index alone Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
32 Evaluating Phrasal Queries with Inverted Indices Phrasal Queries (summary) Must have an inverted index that also stores positions of each keyword in a document. Retrieve documents and positions for each individual word, intersect documents, and then finally check for ordered contiguity of keyword positions. Best to start contiguity check with the least common word in the phrase. Ανάκτηση Πληροφορίας Evaluating Proximity Queries with Inverted Indices Proximity Queries (summary) Use approach similar to phrasal search to find documents in which all keywords are found in a context that satisfies the proximity constraints a list (in increasing positional order) is generated for each one The lists of all elements are traversed in synchronization to find places where all the words appear close enough (for proximity). During binary search for positions of remaining keywords, find closest position of k i to p and check that it is within maximum allowed distance. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
33 Inverted Index: Κατακλείδα Is probably the most adequate indexing technique Appropriate when the text collection is large and semi static If the text collection is volatile online searching is the only option Some techniques combine online and indexed searching Ανάκτηση Πληροφορίας Resources for today s lecture Skip Lists theory: Pugh (1990) Multilevel skip lists give same O(log n) efficiency as trees H.E. Williams, J. Zobel, and D. Bahle Fast Phrase Querying with Combined Indexes, ACM Transactions on Information Systems. D. Bahle, H. Williams, and J. Zobel. Efficient phrase querying with an auxiliary index. SIGIR 2002, pp Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
34 Vocabulary search Ανάκτηση Πληροφορίας Dictionary data structures for inverted indexes The dictionary data structure stores the term vocabulary, document frequency, pointers to each postings list in what data structure? Sec. 3.1 Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
35 Sec. 3.1 An array of struct: char[20] int Postings * 20 bytes 4/8 bytes 4/8 bytes A naïve dictionary How do we store a dictionary in memory efficiently? How do we quickly look up elements at query time? Ανάκτηση Πληροφορίας Dictionary data structures Sec. 3.1 Two main choices: Hash table Tree Some IR systems use hashes, some trees Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
36 Vocabulary search As each searching task on an inverted file always starts in the vocabulary, it is better to store the vocabulary in a separate file this file is not so big so it is possible to keep it at main memory at search time Suppose we want to search for a word of length m. The structures most used to store the vocabulary are hashing, tries or B trees. Options: Cost of searching a sequential file: O(V) Cost of searching assuming hashing: O(m) Cost of searching assuming tries: O(m) Cost of searching assuming the file is ordered (lexicographically): O(log V) this option is cheaper in space and very competitive Ανάκτηση Πληροφορίας Hashes Sec. 3.1 Each vocabulary term is hashed to an integer Pros: Lookup is faster than for a tree: O(1) Cons: No easy way to find minor variants: judgment/judgement No prefix search [tolerant retrieval] If vocabulary keeps growing, need to occasionally do the expensive operation of rehashing everything Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
37 Tree: binary tree Sec. 3.1 a-m Root n-z log(m) balanced a-hu hy-m n-sh si-z aardvark huygens Ανάκτηση Πληροφορίας sickle zygot Tree: B-tree Definition: Every internal nodel has a number of children in the interval [a,b] where a, b are appropriate natural numbers, e.g., [2,4]. Sec. 3.1 Disk resident data structures a-hu hy-m n-z Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
38 Trees Sec. 3.1 Simplest: binary tree More usual: B trees Trees require a standard ordering of characters and hence strings but we standardly have one Pros: Solves the prefix problem (terms starting with hyp) Cons: Slower: O(log M) [and this requires balanced tree] Rebalancing binary trees is expensive But B trees mitigate the rebalancing problem Ανάκτηση Πληροφορίας WILD-CARD QUERIES Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
39 Wild-card queries: * Sec. 3.2 Wildcard queries are used in any of the following situations: (1) the user is uncertain of the spelling of a query term (e.g., Sydney vs. Sidney, which leads to the wildcard query S*dney); (2) the user is aware of multiple variants of spelling a term and (consciously) seeks documents containing any of the variants (e.g., color vs. colour); (3) the user seeks documents containing variants of a term that would be caught by stemming, but is unsure whether the search engine performs stemming (e.g., judicial vs. judiciary, leading to the wildcard query judicia*); (4) the user is uncertain of the correct rendition of a foreign word or phrase (e.g., the query Universit* Stuttgart). Ανάκτηση Πληροφορίας Wild-card queries: * Sec. 3.2 mon*: find all docs containing any word beginning mon. Easy with binary tree (or B tree) lexicon: retrieve all words in range: mon w < moo *mon: find words ending in mon : harder Trialing wildcards Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
40 Wild-card queries: * Sec. 3.2 *mon: find words ending in mon : harder Maintain an additional B tree for terms backwards. Can retrieve all words in range: nom w < non. Reverse B tree (suffix B tree) Exercise: from this, how can we enumerate all terms meeting the wild-card query pro*cent? ( in general, any query with a single wildcard) Ανάκτηση Πληροφορίας Query processing At this point, we have an enumeration of all terms in the dictionary that match the wild card query. We still have to look up the postings for each enumerated term. Sec. 3.2 E.g., consider the query: se*ate AND fil*er This may result in the execution of many Boolean AND queries. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
41 Sec. 3.2 B-trees handle * s at the end of a query term How can we handle * s in the middle of query term? co*tion We could look up co* AND *tion in a B tree and intersect the two term sets Expensive Ανάκτηση Πληροφορίας Sec. 3.2 B-trees handle * s at the end of a query term The solution: transform wild card queries so that the * s occur at the end This gives rise to the Permuterm Index. Κατασκευάζουμε επιπρόσθετη δομή (πλέον του dictionary + inverted index) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
42 Permuterm index Sec A special symbol $ to indicate the end of a word hello > hello$ Construct a permuterm index, in which the various rotations of each term (augmented with $) all link to the original vocabulary term. hello$, ello$h, llo$he, lo$hel, o$hell Permuterm vocabulary (the vocabulary consists of all such permutations) Ουσιαστικά, θεωρούμεόλαταπιθανάsuffix Ανάκτηση Πληροφορίας Permuterm index Sec A query with one wildcard Rotate so that the wildcard (*) appears at the end of the query Lookup the resulting string in the permuterm index (prefix query trailing wildcard) and get all words in the dictionary Query = hel*o X=hel, Y=o Lookup o$hel* Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
43 Permuterm index Sec Example Permuterm vocabulary for magic and music Query m*ic m*n matches man and moron We lookup these terms in the standard inverted index to retrieve matching documents Ανάκτηση Πληροφορίας Permuterm index Sec Queries: X lookup on X$ X* lookup on $X* *X lookup on X$* *X* lookup on X* X*Y lookup on Y$X* X*Y*Z??? Exercise! Query = hel*o X=hel, Y=o Lookup o$hel* Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
44 Permuterm index Sec Example fi*mo*er fi*mo*er 1. Enumerate all terms in the dictionary that are in the permuted index of er$fi* 2. Then, filter out (exhaustive search) those that do not have mo in the middle 3. Run surviving terms through the standard inverted index Ανάκτηση Πληροφορίας Permuterm query processing (summary) Sec Rotate query wild card to the right Now use B tree lookup as before. Permuterm problem: quadruples lexicon size (tenfold increase of the dictionary) Empirical observation for English. Είναι παρόμοιο με το να εισάγουμε όλους τα suffix σε ένα B tree (SUFFIX TREES) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
45 Bigram (k-gram) indexes Sec A k gram is a sequence of k characters Use as special character $ to denote the beginning or the end of a term In a k gram index, the dictionary contains all k grams that occur in any term in the vocabulary Example 3 grams for music Ανάκτηση Πληροφορίας Bigram (k-gram) indexes Sec Enumerate all k grams (sequence of k chars) occurring in any term e.g., from text April is the cruelest month we get the 2 grams (bigrams) $a,ap,pr,ri,il,l$,$i,is,s$,$t,th,he,e$,$c,cr,ru, ue,el,le,es,st,t$, $m,mo,on,nt,h$ $ is a special word boundary symbol Maintain a second inverted index from bigrams to dictionary terms that match each bigram. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
46 Bigram index example Sec The k gram index finds terms based on a query consisting of k grams (here k=2). $m mace madden mo on among among amortize around Similar to the postings in the inverted index (ordered) Ανάκτηση Πληροφορίας Processing wild-cards Sec Query mon* can now be run as (assume 2 grams) $m AND mo AND on Gets terms that match AND version of our wildcard query. Example re*ve and 3 grams Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
47 Processing wild-cards Sec Query mon* can now be run as (assume 2 grams) $m AND mo AND on Gets terms that match AND version of our wildcard query. But we d enumerate moon. 1. Must post filter these terms against query. (the terms enumerated by the Boolean query on the k gram are checked individually against the original query 2. Surviving enumerated terms are then looked up in the term document inverted index. Fast, space efficient (compared to permuterm). Ανάκτηση Πληροφορίας Processing wild-card queries Sec As before, we must execute a Boolean query for each enumerated, filtered term. Wild cards can result in expensive query execution (very large disjunctions ) pyth* AND prog* If you encourage laziness people will respond! Which web search engines allow wildcard queries? Type your search terms, use * if you need to. E.g., Alex* will match Alexander. Search Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας
Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός
Ανάκληση Πληροφορίας Information Retrieval Διδάσκων Δημήτριος Κατσαρός Διάλεξη 5η: 26/02/2014 1 Phrase queries 2 Phrase queries Want to answer queries such as stanford university as a phrase Thus the sentence
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 5η: 06/03/2017 1 WILD-CARD Ερωτήματα 2 Sec. 3.2 Ερωτήματα με χαρακτήρες wild-card: * mon*: να βρεθούν όλα τα έγγραφα που περιέχουν
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 3: Δομές για Λεξικά. Ανάκτηση Ανεκτική στα Σφάλματα (υποστήριξη *) 1 Ch. 2 Επανάληψη προηγούμενης
Διαβάστε περισσότεραPhysical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.
B-Trees Index files can become quite large for large main files Indices on index files are possible 3 rd -level index 2 nd -level index 1 st -level index Main file 1 The 1 st -level index consists of pairs
Διαβάστε περισσότεραThe Simply Typed Lambda Calculus
Type Inference Instead of writing type annotations, can we use an algorithm to infer what the type annotations should be? That depends on the type system. For simple type systems the answer is yes, and
Διαβάστε περισσότεραΑνάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός
Ανάκληση Πληροφορίας Information Retrieval Διδάσκων Δημήτριος Κατσαρός Διάλεξη 6η: 05/03/2014 1 WILD-CARD QUERIES 2 Sec. 3.2 Wild-card queries: * mon*: find all docs containing any word beginning mon.
Διαβάστε περισσότερα2 Composition. Invertible Mappings
Arkansas Tech University MATH 4033: Elementary Modern Algebra Dr. Marcel B. Finan Composition. Invertible Mappings In this section we discuss two procedures for creating new mappings from old ones, namely,
Διαβάστε περισσότεραPhys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)
Phys460.nb 81 ψ n (t) is still the (same) eigenstate of H But for tdependent H. The answer is NO. 5.5.5. Solution for the tdependent Schrodinger s equation If we assume that at time t 0, the electron starts
Διαβάστε περισσότεραΑνάκληση Πληπουοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληπουοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Γιάλεξη 2η: 23/02/2016 1 Μεγάλες συλλογές (corpora) Έστωσαν N = 1M έγγραφα, το κάθε ένα με περίπου 1K όρους Avg 6 bytes/term, συμπεριλαμβανόμενων
Διαβάστε περισσότεραΔομές Ευρετηρίου: Διάρθρωση Διάλεξης
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηριασμός, Αποθήκευση και Οργάνωση Αρχείων Κειμένων (Indexing,
Διαβάστε περισσότεραSection 8.3 Trigonometric Equations
99 Section 8. Trigonometric Equations Objective 1: Solve Equations Involving One Trigonometric Function. In this section and the next, we will exple how to solving equations involving trigonometric functions.
Διαβάστε περισσότεραΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011
Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι
Διαβάστε περισσότεραCHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS
CHAPTER 5 SOLVING EQUATIONS BY ITERATIVE METHODS EXERCISE 104 Page 8 1. Find the positive root of the equation x + 3x 5 = 0, correct to 3 significant figures, using the method of bisection. Let f(x) =
Διαβάστε περισσότεραΑνάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 7η: 21/03/2016 1 Ch. 4 Κατασκευή του ευρετηρίου Πώς κατασκευάζουμε το ευρετήριο; Ποιες στρατηγικές μπορούμε ν ακολουθήσουμε
Διαβάστε περισσότεραderivation of the Laplacian from rectangular to spherical coordinates
derivation of the Laplacian from rectangular to spherical coordinates swapnizzle 03-03- :5:43 We begin by recognizing the familiar conversion from rectangular to spherical coordinates (note that φ is used
Διαβάστε περισσότεραLecture 2. Soundness and completeness of propositional logic
Lecture 2 Soundness and completeness of propositional logic February 9, 2004 1 Overview Review of natural deduction. Soundness and completeness. Semantics of propositional formulas. Soundness proof. Completeness
Διαβάστε περισσότεραΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006
Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή
Διαβάστε περισσότεραΔομές Ευρετηρίου: Διάρθρωση Διάλεξης
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and
Διαβάστε περισσότεραHOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:
HOMEWORK 4 Problem a For the fast loading case, we want to derive the relationship between P zz and λ z. We know that the nominal stress is expressed as: P zz = ψ λ z where λ z = λ λ z. Therefore, applying
Διαβάστε περισσότερα3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β
3.4 SUM AND DIFFERENCE FORMULAS Page Theorem cos(αβ cos α cos β -sin α cos(α-β cos α cos β sin α NOTE: cos(αβ cos α cos β cos(α-β cos α -cos β Proof of cos(α-β cos α cos β sin α Let s use a unit circle
Διαβάστε περισσότεραHomework 3 Solutions
Homework 3 Solutions Igor Yanovsky (Math 151A TA) Problem 1: Compute the absolute error and relative error in approximations of p by p. (Use calculator!) a) p π, p 22/7; b) p π, p 3.141. Solution: For
Διαβάστε περισσότεραExample Sheet 3 Solutions
Example Sheet 3 Solutions. i Regular Sturm-Liouville. ii Singular Sturm-Liouville mixed boundary conditions. iii Not Sturm-Liouville ODE is not in Sturm-Liouville form. iv Regular Sturm-Liouville note
Διαβάστε περισσότεραΠρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής
Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Να γραφεί πρόγραμμα το οποίο δέχεται ως είσοδο μια ακολουθία S από n (n 40) ακέραιους αριθμούς και επιστρέφει ως έξοδο δύο ακολουθίες από θετικούς ακέραιους
Διαβάστε περισσότεραC.S. 430 Assignment 6, Sample Solutions
C.S. 430 Assignment 6, Sample Solutions Paul Liu November 15, 2007 Note that these are sample solutions only; in many cases there were many acceptable answers. 1 Reynolds Problem 10.1 1.1 Normal-order
Διαβάστε περισσότεραFinite Field Problems: Solutions
Finite Field Problems: Solutions 1. Let f = x 2 +1 Z 11 [x] and let F = Z 11 [x]/(f), a field. Let Solution: F =11 2 = 121, so F = 121 1 = 120. The possible orders are the divisors of 120. Solution: The
Διαβάστε περισσότεραApproximation of distance between locations on earth given by latitude and longitude
Approximation of distance between locations on earth given by latitude and longitude Jan Behrens 2012-12-31 In this paper we shall provide a method to approximate distances between two points on earth
Διαβάστε περισσότεραΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007
Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο
Διαβάστε περισσότεραΔομές Ευρετηρίου: Διάρθρωση Διάλεξης
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and
Διαβάστε περισσότεραEE512: Error Control Coding
EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3
Διαβάστε περισσότεραAssalamu `alaikum wr. wb.
LUMP SUM Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. LUMP SUM Lump sum lump sum lump sum. lump sum fixed price lump sum lump
Διαβάστε περισσότεραBlock Ciphers Modes. Ramki Thurimella
Block Ciphers Modes Ramki Thurimella Only Encryption I.e. messages could be modified Should not assume that nonsensical messages do no harm Always must be combined with authentication 2 Padding Must be
Διαβάστε περισσότεραEvery set of first-order formulas is equivalent to an independent set
Every set of first-order formulas is equivalent to an independent set May 6, 2008 Abstract A set of first-order formulas, whatever the cardinality of the set of symbols, is equivalent to an independent
Διαβάστε περισσότεραΠανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Δημήτρης Πλεξουσάκης. Physical DB Design
Data Structures for Primary Indices Structures that determine the location of the records of a file A primary index is based on a key; the location of a record is determined by its key value. Most common
Διαβάστε περισσότεραΣυστήματα Διαχείρισης Βάσεων Δεδομένων
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 9: Transactions - part 1 Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών Tutorial on Undo, Redo and Undo/Redo
Διαβάστε περισσότεραω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω
0 1 2 3 4 5 6 ω ω + 1 ω + 2 ω + 3 ω + 4 ω2 ω2 + 1 ω2 + 2 ω2 + 3 ω3 ω3 + 1 ω3 + 2 ω4 ω4 + 1 ω5 ω 2 ω 2 + 1 ω 2 + 2 ω 2 + ω ω 2 + ω + 1 ω 2 + ω2 ω 2 2 ω 2 2 + 1 ω 2 2 + ω ω 2 3 ω 3 ω 3 + 1 ω 3 + ω ω 3 +
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραOrdinal Arithmetic: Addition, Multiplication, Exponentiation and Limit
Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ting Zhang Stanford May 11, 2001 Stanford, 5/11/2001 1 Outline Ordinal Classification Ordinal Addition Ordinal Multiplication Ordinal
Διαβάστε περισσότεραInverse trigonometric functions & General Solution of Trigonometric Equations. ------------------ ----------------------------- -----------------
Inverse trigonometric functions & General Solution of Trigonometric Equations. 1. Sin ( ) = a) b) c) d) Ans b. Solution : Method 1. Ans a: 17 > 1 a) is rejected. w.k.t Sin ( sin ) = d is rejected. If sin
Διαβάστε περισσότεραConcrete Mathematics Exercises from 30 September 2016
Concrete Mathematics Exercises from 30 September 2016 Silvio Capobianco Exercise 1.7 Let H(n) = J(n + 1) J(n). Equation (1.8) tells us that H(2n) = 2, and H(2n+1) = J(2n+2) J(2n+1) = (2J(n+1) 1) (2J(n)+1)
Διαβάστε περισσότεραΣυντακτικές λειτουργίες
2 Συντακτικές λειτουργίες (Syntactic functions) A. Πτώσεις και συντακτικές λειτουργίες (Cases and syntactic functions) The subject can be identified by asking ποιος (who) or τι (what) the sentence is about.
Διαβάστε περισσότερα9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr
9.9 #. Area inside the oval limaçon r = + cos. To graph, start with = so r =. Compute d = sin. Interesting points are where d vanishes, or at =,,, etc. For these values of we compute r:,,, and the values
Διαβάστε περισσότεραSCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions
SCHOOL OF MATHEMATICAL SCIENCES GLMA Linear Mathematics 00- Examination Solutions. (a) i. ( + 5i)( i) = (6 + 5) + (5 )i = + i. Real part is, imaginary part is. (b) ii. + 5i i ( + 5i)( + i) = ( i)( + i)
Διαβάστε περισσότεραInstruction Execution Times
1 C Execution Times InThisAppendix... Introduction DL330 Execution Times DL330P Execution Times DL340 Execution Times C-2 Execution Times Introduction Data Registers This appendix contains several tables
Διαβάστε περισσότερα4.6 Autoregressive Moving Average Model ARMA(1,1)
84 CHAPTER 4. STATIONARY TS MODELS 4.6 Autoregressive Moving Average Model ARMA(,) This section is an introduction to a wide class of models ARMA(p,q) which we will consider in more detail later in this
Διαβάστε περισσότεραElements of Information Theory
Elements of Information Theory Model of Digital Communications System A Logarithmic Measure for Information Mutual Information Units of Information Self-Information News... Example Information Measure
Διαβάστε περισσότεραInformation Retrieval
Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης Βάση
Διαβάστε περισσότεραChapter 6: Systems of Linear Differential. be continuous functions on the interval
Chapter 6: Systems of Linear Differential Equations Let a (t), a 2 (t),..., a nn (t), b (t), b 2 (t),..., b n (t) be continuous functions on the interval I. The system of n first-order differential equations
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραMain source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1
Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1 A Brief History of Sampling Research 1915 - Edmund Taylor Whittaker (1873-1956) devised a
Διαβάστε περισσότεραMatrices and Determinants
Matrices and Determinants SUBJECTIVE PROBLEMS: Q 1. For what value of k do the following system of equations possess a non-trivial (i.e., not all zero) solution over the set of rationals Q? x + ky + 3z
Διαβάστε περισσότεραΕύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 1η: 14/02/2007 1 Εισαγωγή στο µάθηµα & Εισαγωγή
Διαβάστε περισσότεραANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =?
Teko Classes IITJEE/AIEEE Maths by SUHAAG SIR, Bhopal, Ph (0755) 3 00 000 www.tekoclasses.com ANSWERSHEET (TOPIC DIFFERENTIAL CALCULUS) COLLECTION # Question Type A.Single Correct Type Q. (A) Sol least
Διαβάστε περισσότερα5.4 The Poisson Distribution.
The worst thing you can do about a situation is nothing. Sr. O Shea Jackson 5.4 The Poisson Distribution. Description of the Poisson Distribution Discrete probability distribution. The random variable
Διαβάστε περισσότεραΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης
ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)
Διαβάστε περισσότεραΕύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Εισαγωγή στο µάθηµα. Εισαγωγή στην Ανάκτηση Πληροφορίας. Απαιτήσεις του µαθήµατος
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 1η: 14/02/2007 1 Εισαγωγή στο µάθηµα & Εισαγωγή
Διαβάστε περισσότεραSection 7.6 Double and Half Angle Formulas
09 Section 7. Double and Half Angle Fmulas To derive the double-angles fmulas, we will use the sum of two angles fmulas that we developed in the last section. We will let α θ and β θ: cos(θ) cos(θ + θ)
Διαβάστε περισσότεραΕυρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι
Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι Κεφάλαιο 8 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 Ανάκτηση Πληροφορίας 2009-2010 1 Δομές
Διαβάστε περισσότεραdepartment listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι
She selects the option. Jenny starts with the al listing. This has employees listed within She drills down through the employee. The inferred ER sttricture relates this to the redcords in the databasee
Διαβάστε περισσότεραΔομές Ευρετηρίου: Διάρθρωση Διάλεξης
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and
Διαβάστε περισσότεραTMA4115 Matematikk 3
TMA4115 Matematikk 3 Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet Trondheim Spring 2010 Lecture 12: Mathematics Marvellous Matrices Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet
Διαβάστε περισσότεραMath221: HW# 1 solutions
Math: HW# solutions Andy Royston October, 5 7.5.7, 3 rd Ed. We have a n = b n = a = fxdx = xdx =, x cos nxdx = x sin nx n sin nxdx n = cos nx n = n n, x sin nxdx = x cos nx n + cos nxdx n cos n = + sin
Διαβάστε περισσότεραChapter 2 * * * * * * * Introduction to Verbs * * * * * * *
Chapter 2 * * * * * * * Introduction to Verbs * * * * * * * In the first chapter, we practiced the skill of reading Greek words. Now we want to try to understand some parts of what we read. There are a
Διαβάστε περισσότεραLecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3
Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3 1 State vector space and the dual space Space of wavefunctions The space of wavefunctions is the set of all
Διαβάστε περισσότεραΑρχεία και Βάσεις Δεδομένων
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Αρχεία και Βάσεις Δεδομένων Διάλεξη 18η: Φυσική Σχεδίαση Βάσεων Δεδομένων Τμήμα Επιστήμης Υπολογιστών Data Structures for Primary Indices Structures that determine
Διαβάστε περισσότεραThe challenges of non-stable predicates
The challenges of non-stable predicates Consider a non-stable predicate Φ encoding, say, a safety property. We want to determine whether Φ holds for our program. The challenges of non-stable predicates
Διαβάστε περισσότεραOther Test Constructions: Likelihood Ratio & Bayes Tests
Other Test Constructions: Likelihood Ratio & Bayes Tests Side-Note: So far we have seen a few approaches for creating tests such as Neyman-Pearson Lemma ( most powerful tests of H 0 : θ = θ 0 vs H 1 :
Διαβάστε περισσότεραΕυρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη
Ευρετήρια Βάσεις Δεδομένων Διδάσκων: Μαρία Χαλκίδη Βασικές έννοιες Οι μηχανισμοί δεικτοδότησης χρησιμοποιούνται για να επιταχύνουν την προσπέλαση σε επιθυμητά δεδομένα. π.χ., author catalog in library
Διαβάστε περισσότεραMath 6 SL Probability Distributions Practice Test Mark Scheme
Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry
Διαβάστε περισσότεραExample of the Baum-Welch Algorithm
Example of the Baum-Welch Algorithm Larry Moss Q520, Spring 2008 1 Our corpus c We start with a very simple corpus. We take the set Y of unanalyzed words to be {ABBA, BAB}, and c to be given by c(abba)
Διαβάστε περισσότεραΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006
ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/26 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι το 1 εκτός αν ορίζεται διαφορετικά στη διατύπωση
Διαβάστε περισσότεραFractional Colorings and Zykov Products of graphs
Fractional Colorings and Zykov Products of graphs Who? Nichole Schimanski When? July 27, 2011 Graphs A graph, G, consists of a vertex set, V (G), and an edge set, E(G). V (G) is any finite set E(G) is
Διαβάστε περισσότερα[1] P Q. Fig. 3.1
1 (a) Define resistance....... [1] (b) The smallest conductor within a computer processing chip can be represented as a rectangular block that is one atom high, four atoms wide and twenty atoms long. One
Διαβάστε περισσότεραExercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1.
Exercises 0 More exercises are available in Elementary Differential Equations. If you have a problem to solve any of them, feel free to come to office hour. Problem Find a fundamental matrix of the given
Διαβάστε περισσότεραReview Test 3. MULTIPLE CHOICE. Choose the one alternative that best completes the statement or answers the question.
Review Test MULTIPLE CHOICE. Choose the one alternative that best completes the statement or answers the question. Find the exact value of the expression. 1) sin - 11π 1 1) + - + - - ) sin 11π 1 ) ( -
Διαβάστε περισσότεραΣυστήματα Διαχείρισης Βάσεων Δεδομένων
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 5: Tutorial on External Sorting Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών TUTORIAL ON EXTERNAL SORTING
Διαβάστε περισσότεραDémographie spatiale/spatial Demography
ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ Démographie spatiale/spatial Demography Session 1: Introduction to spatial demography Basic concepts Michail Agorastakis Department of Planning & Regional Development Άδειες Χρήσης
Διαβάστε περισσότεραOn a four-dimensional hyperbolic manifold with finite volume
BULETINUL ACADEMIEI DE ŞTIINŢE A REPUBLICII MOLDOVA. MATEMATICA Numbers 2(72) 3(73), 2013, Pages 80 89 ISSN 1024 7696 On a four-dimensional hyperbolic manifold with finite volume I.S.Gutsul Abstract. In
Διαβάστε περισσότεραPartial Differential Equations in Biology The boundary element method. March 26, 2013
The boundary element method March 26, 203 Introduction and notation The problem: u = f in D R d u = ϕ in Γ D u n = g on Γ N, where D = Γ D Γ N, Γ D Γ N = (possibly, Γ D = [Neumann problem] or Γ N = [Dirichlet
Διαβάστε περισσότεραCalculating the propagation delay of coaxial cable
Your source for quality GNSS Networking Solutions and Design Services! Page 1 of 5 Calculating the propagation delay of coaxial cable The delay of a cable or velocity factor is determined by the dielectric
Διαβάστε περισσότεραPARTIAL NOTES for 6.1 Trigonometric Identities
PARTIAL NOTES for 6.1 Trigonometric Identities tanθ = sinθ cosθ cotθ = cosθ sinθ BASIC IDENTITIES cscθ = 1 sinθ secθ = 1 cosθ cotθ = 1 tanθ PYTHAGOREAN IDENTITIES sin θ + cos θ =1 tan θ +1= sec θ 1 + cot
Διαβάστε περισσότεραΟι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού)
Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού) Προσδοκώμενα αποτελέσματα Περιεχόμενο Ενδεικτικές δραστηριότητες
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΠανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Ανάκτηση Πληροφοριών
Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 1. Ανάκτηση Boole Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων Γνωριμία ιδάσκων: Χρήστος
Διαβάστε περισσότεραΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών Τέλος Ενότητας Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί
Διαβάστε περισσότεραOverview. Transition Semantics. Configurations and the transition relation. Executions and computation
Overview Transition Semantics Configurations and the transition relation Executions and computation Inference rules for small-step structural operational semantics for the simple imperative language Transition
Διαβάστε περισσότεραΠροσομοίωση BP με το Bizagi Modeler
Προσομοίωση BP με το Bizagi Modeler Α. Τσαλγατίδου - Γ.-Δ. Κάπος Πρόγραμμα Μεταπτυχιακών Σπουδών Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών 2017-2018 BPMN Simulation with Bizagi Modeler: 4 Levels
Διαβάστε περισσότεραΣτο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά.
Διαστημικό εστιατόριο του (Μ)ΑστροΈκτορα Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά. Μόλις μια παρέα πελατών κάτσει σε ένα
Διαβάστε περισσότεραLESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV. 18 February 2014
LESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV 18 February 2014 Slowly/quietly Clear/clearly Clean Quickly/quick/fast Hurry (in a hurry) Driver Attention/caution/notice/care Dance Σιγά Καθαρά Καθαρός/η/ο
Διαβάστε περισσότεραST5224: Advanced Statistical Theory II
ST5224: Advanced Statistical Theory II 2014/2015: Semester II Tutorial 7 1. Let X be a sample from a population P and consider testing hypotheses H 0 : P = P 0 versus H 1 : P = P 1, where P j is a known
Διαβάστε περισσότεραModels for Probabilistic Programs with an Adversary
Models for Probabilistic Programs with an Adversary Robert Rand, Steve Zdancewic University of Pennsylvania Probabilistic Programming Semantics 2016 Interactive Proofs 2/47 Interactive Proofs 2/47 Interactive
Διαβάστε περισσότεραCongruence Classes of Invertible Matrices of Order 3 over F 2
International Journal of Algebra, Vol. 8, 24, no. 5, 239-246 HIKARI Ltd, www.m-hikari.com http://dx.doi.org/.2988/ija.24.422 Congruence Classes of Invertible Matrices of Order 3 over F 2 Ligong An and
Διαβάστε περισσότεραNumerical Analysis FMN011
Numerical Analysis FMN011 Carmen Arévalo Lund University carmen@maths.lth.se Lecture 12 Periodic data A function g has period P if g(x + P ) = g(x) Model: Trigonometric polynomial of order M T M (x) =
Διαβάστε περισσότεραΕγκατάσταση λογισμικού και αναβάθμιση συσκευής Device software installation and software upgrade
Για να ελέγξετε το λογισμικό που έχει τώρα η συσκευή κάντε κλικ Menu > Options > Device > About Device Versions. Στο πιο κάτω παράδειγμα η συσκευή έχει έκδοση λογισμικού 6.0.0.546 με πλατφόρμα 6.6.0.207.
Διαβάστε περισσότεραSrednicki Chapter 55
Srednicki Chapter 55 QFT Problems & Solutions A. George August 3, 03 Srednicki 55.. Use equations 55.3-55.0 and A i, A j ] = Π i, Π j ] = 0 (at equal times) to verify equations 55.-55.3. This is our third
Διαβάστε περισσότεραSolutions to Exercise Sheet 5
Solutions to Eercise Sheet 5 jacques@ucsd.edu. Let X and Y be random variables with joint pdf f(, y) = 3y( + y) where and y. Determine each of the following probabilities. Solutions. a. P (X ). b. P (X
Διαβάστε περισσότεραProblem Set 3: Solutions
CMPSCI 69GG Applied Information Theory Fall 006 Problem Set 3: Solutions. [Cover and Thomas 7.] a Define the following notation, C I p xx; Y max X; Y C I p xx; Ỹ max I X; Ỹ We would like to show that C
Διαβάστε περισσότεραPractice Exam 2. Conceptual Questions. 1. State a Basic identity and then verify it. (a) Identity: Solution: One identity is csc(θ) = 1
Conceptual Questions. State a Basic identity and then verify it. a) Identity: Solution: One identity is cscθ) = sinθ) Practice Exam b) Verification: Solution: Given the point of intersection x, y) of the
Διαβάστε περισσότεραNowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in
Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in : tail in X, head in A nowhere-zero Γ-flow is a Γ-circulation such that
Διαβάστε περισσότερα