Ευρετηρίαση ΜΕΡΟΣ ΙIΙ. Επεξεργασία Κειμένου

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ευρετηρίαση ΜΕΡΟΣ ΙIΙ. Επεξεργασία Κειμένου"

Transcript

1 Ευρετηρίαση ΜΕΡΟΣ ΙIΙ Επεξεργασία Κειμένου Ανάκτηση Πληροφορίας Content Recap: Faster posting lists with skip pointers, Phrase and Proximity Queries, Dictionary Wild-Card Queries Permutex k-gram indexes Spelling Corrections Pattern Matching Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

2 Ανεστραμμένο Αρχείο Λογική Μορφή Ευρετηρίου Μορφή Ανεστραμμένου Ευρετηρίου Index terms C j,1 k 1 k 2... k t d 1 c 1,1 c 2,1 c t,1 d 2 c 1,2 c 2,2 c t, d i c 1,j c 2,j c t,j d N c 1,N c 2,N c t,n k 1 k 2... k t Vocabulary Postings lists Ανάκτηση Πληροφορίας Inverted Files (Ανεστραμμένα αρχεία) Ιnverted file = a word oriented mechanism for indexing a text collection in order to speed up the searching task. An inverted file consists of: Vocabulary: is the set of all distinct words in the text Occurrences: lists containing all information necessary for each word of the vocabulary (documents where the word appears, frequency, text position, etc.) Τι είδους πληροφορία κρατάμε στις posting lists εξαρτάται από το λογικό μοντέλο και το μοντέλο ερωτήσεων Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

3 Searching an inverted index General Steps: 1. Vocabulary search: the words present in the query are searched in the vocabulary 2. Retrieval occurrences: the lists of the occurrences of all words found are retrieved 3. Manipulation of occurrences: The occurrences are processed to solve the query Ανάκτηση Πληροφορίας Sec. 2.3 Augment postings with skip pointers (at indexing time) Why? To skip postings that will not figure in the search results. 1. How? 2. Where do we place skip pointers? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

4 Phrase queries Sec. 2.4 Want to be able to answer queries such as stanford university as a phrase Why? The concept of phrase queries has proven easily understood by users; one of the few advanced search ideas that works 10% explicit phrase queries ( ) Many more queries are implicit phrase queries (such as person names) Ανάκτηση Πληροφορίας Sec Biword Indexes: Index every consecutive pair of terms in the text as a phrase 2. Positional Indexes: In the postings, store, for each term the position(s) in which tokens of it appear Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

5 Proximity queries Sec LIMIT! /3 STATUTE /3 FEDERAL /2 TORT Again, here, /k means within k words of. Clearly, positional indexes can be used for such queries; biword indexes cannot. Ανάκτηση Πληροφορίας Positional index size Sec We can compress position values/offsets Nevertheless, a positional index expands postings storage substantially Nevertheless, a positional index is now standardly used because of the power and usefulness of phrase and proximity queries whether used explicitly or implicitly in a ranking retrieval system. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

6 Combination schemes Sec These two approaches can be profitably combined For particular phrases ( Michael Jackson, Britney Spears ) it is inefficient to keep on merging positional postings lists Even more so for phrases like The Who In general: Potential biwords: common (based on recent query behavior) and expensive Ανάκτηση Πληροφορίας Dictionary data structures Sec. 3.1 Two main choices: Hash table Tree Some IR systems use hashes, some trees Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

7 Trees Sec. 3.1 Simplest: binary tree More usual: B trees Trees require a standard ordering of characters and hence strings but we standardly have one Pros: Solves the prefix problem (terms starting with hyp) Cons: Slower: O(log M) [and this requires balanced tree] Rebalancing binary trees is expensive But B trees mitigate the rebalancing problem Ανάκτηση Πληροφορίας WILD-CARD QUERIES Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

8 B trees handle prefixes Wild Card Queries Suffix B trees to handle * at the beginning Sec. 3.2 Other solutions: permuterms k grams Both build additional data structures Used to locate possible matches + a filtering step to check for false positives Ανάκτηση Πληροφορίας Permuterm index A special symbol $ to indicate the end of a word Sec Construct a permuterm index, in which the various rotations of each term (augmented with $) all link to the original vocabulary term. Permuterm vocabulary (the vocabulary consists of all such permutations) A query with one wildcard Rotate so that the wildcard (*) appears at the end of the query Lookup the resulting string in the permuterm index (prefix query trailing wildcard) and get all words in the dictionary Example: word, walled, w*d, w*r*d Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

9 Bigram (k-gram) index Sec A k gram is a sequence of k characters Use as special character $ to denote the beginning or the end of a term In a k gram index, the dictionary contains all k grams that occur in any term in the vocabulary Maintain a second inverted index from bigrams to dictionary terms that match each bigram. Gets terms that match AND version of our wildcard query. Example: word, walled, w*d, w*r*d Ανάκτηση Πληροφορίας SPELLING CORRECTION Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

10 Spell correction Sec. 3.3 Britney Spears Britian spears Britney s spears Brandy spears Pritanny spears (brittany spears) (all corrected in Google) Ανάκτηση Πληροφορίας Spell correction Sec. 3.3 Two principles for correcting: 1. Of various alternatives: choose the nearest one (proximity, distance) 2. When two correctly spelled queries are (nearly) tied, select the most common one (common? #occurrences in the collection, most common among queries typed in by the users) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

11 Spell correction Sec. 3.3 Two principal uses Correcting document(s) being indexed Correcting user queries to retrieve right answers Ανάκτηση Πληροφορίας Sec. 3.3 Document correction Especially needed for OCR ed documents Correction algorithms are tuned for this: rn/m Can use domain specific knowledge E.g., OCR can confuse O and D more often than it would confuse Oand I (adjacent on the QWERTY keyboard, so more likely interchanged in typing). But also: web pages and even printed material has typos Goal: the dictionary contains fewer misspellings But often we don t change the documents but aim to fix the query document mapping Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

12 Query mis-spellings Sec. 3.3 Our principal focus here E.g., the query Alanis Morisett We can either Retrieve documents indexed by the correct spelling, OR Return several suggested alternative queries with the correct spelling Did you mean? Ανάκτηση Πληροφορίας Spell correction Sec. 3.3 Two main flavors: Isolated word Check each word on its own for misspelling Will not catch typos resulting in correctly spelled words e.g., from form Context sensitive Look at surrounding words, e.g., I flew form Heathrow to Narita. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

13 Isolated word correction Sec Fundamental premise there is a lexicon from which the correct spellings come Two basic choices for this A standard lexicon such as Webster s English Dictionary An industry specific lexicon hand maintained The lexicon of the indexed corpus E.g., all words on the web All names, acronyms etc. (Including the mis spellings) Ανάκτηση Πληροφορίας Isolated word correction Sec Given a lexicon and a character sequence Q, return the words in the lexicon closest to Q What s closest? We ll study several alternatives Edit distance (Levenshtein distance) Weighted edit distance n gram overlap Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

14 Edit distance Sec Given two strings S 1 and S 2, the minimum number of operations to convert one to the other Operations are typically character level Insert, Delete, Replace, (Transposition) E.g., the edit distance from dof to dog is 1 From cat to act is 2 (Just 1 with transpose.) from cat to dog is 3. Ανάκτηση Πληροφορίας Edit distance Sec Generally found by dynamic programming. Θα το δούμε στη συνέχεια See for a nice example plus an applet. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

15 Weighted edit distance Sec As above, but the weight of an operation depends on the character(s) involved Meant to capture OCR or keyboard errors, e.g. m more likely to be mis typed as n than as q Therefore, replacing m by n is a smaller edit distance than by q This may be formulated as a probability model Requires weight matrix as input Modify dynamic programming to handle weights Ανάκτηση Πληροφορίας Using edit distances Sec Given query, first enumerate all character sequences within a preset (weighted) edit distance (e.g., 2) 2. Intersect this set with list of correct words 3. Show terms you found to user as suggestions Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

16 Using edit distances Sec Alternatively, We can look up all possible corrections in our inverted index and return all docs slow, or we can run with a single most likely correction The alternatives disempower the user, but save a round of interaction with the user Ανάκτηση Πληροφορίας Using edit distances Sec Google Query: Powr Μήπως εννοείτε: power Εμφάνιση 2 κυριότερων αποτελεσμάτων Power Magazine OnLine Αν έχετε ξεχάσει τα όσα αναφέραμε στο Part II, έχετε το POWER 128 πρόχειρο και πάμε να ξαναδούμε τι γίνεται με τα καυσαέρια, ότανξεμπουκάρουναπότις... Power Test Mitsubishi EVO X by NS Racing Tests Image Gallery Προσωρινά αποθηκευμένη Παρόμοιες Power Wikipedia, the free encyclopedia [ Μετάφραση αυτής της σελίδας ] Power (philosophy), the ability to control one's environment or other entities... Power (physics), the rate at which work is performed or energy is... en.wikipedia.org/wiki/power Προσωρινά αποθηκευμένη Παρόμοιες Αποτελέσματα για τους όρους: powr. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

17 Edit distance to all dictionary terms? Sec Given a (mis spelled) query do we compute its edit distance to every dictionary term? Expensive and slow Alternative? How do we cut the set of candidate dictionary terms? Simple: words that start with the same letter Other possibility : use n gram overlap for this This can also be used by itself for spelling correction. Ανάκτηση Πληροφορίας n-gram overlap Sec Enumerate all the n grams in the query string as well as in the lexicon Use the n gram index (recall wild card search) to retrieve all lexicon terms matching any of the query n grams Threshold by number of matching n grams Variants weight by keyboard layout, etc. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

18 Matching trigrams Sec Consider the query lord we wish to identify words matching 2 of its 3 bigrams (lo, or, rd) lo alone lord sloth or border lord morbid rd ardent border card Standard postings merge will enumerate Ανάκτηση Πληροφορίας Example with trigrams Sec Suppose the text is november Trigrams are nov, ove, vem, emb, mbe, ber. The query is december Trigrams are dec, ece, cem, emb, mbe, ber. So 3 trigrams overlap (of 6 in each term) How can we turn this into a normalized measure of overlap? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

19 One option Jaccard coefficient A commonly-used measure of overlap Let X and Y be two sets; then the J.C. is Sec X Y / X Y Equals 1 when X and Y have the same elements and zero when they are disjoint X and Y don t have to be of the same size Always assigns a number between 0 and 1 Now threshold to decide if you have a match E.g., if J.C. > 0.8, declare a match Ανάκτηση Πληροφορίας Matching trigrams Sec Consider the query lord we wish to identify words matching 2 of its 3 bigrams (lo, or, rd) lo alone lord sloth or border lord morbid rd ardent border card We know the #k grams for the query, for the term (if it is encoded)? just need its length Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

20 Sec Context-sensitive spell correction Text: I flew from Heathrow to Narita. Consider the phrase query flew form Heathrow We d like to respond Did you mean flew from Heathrow? because no docs matched the query phrase. Ανάκτηση Πληροφορίας Sec Context-sensitive correction Need surrounding context to catch this. First idea: 1. retrieve dictionary terms close (in weighted edit distance) to each query term 2. Now try (run) all possible resulting phrases with one word fixed at a time 1. flew from heathrow 2. fled form heathrow 3. flea form heathrow 3. Hit based spelling correction: Suggest the alternative that has lots of hits. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

21 Sec Exercise Suppose that for flew form Heathrow we have 7 alternatives for flew, 19 for form and 3 for heathrow. How many corrected phrases will we enumerate in this scheme? As we expand the alternatives, retain only the most frequent combinations on the collection (biwords) or in the query log Ανάκτηση Πληροφορίας Sec General issues in spell correction We enumerate multiple alternatives for Did you mean? Need to figure out which to present to the user Use heuristics The alternative hitting most docs Query log analysis + tweaking For especially popular, topical queries Spell correction is computationally expensive Avoid running routinely on every query? Run only on queries that matched few docs Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

22 Sec. 3.5 Resources IIR 3, MG 4.2 Efficient spell retrieval: K. Kukich. Techniques for automatically correcting words in text. ACM Computing Surveys 24(4), Dec J. Zobel and P. Dart. Finding approximate matches in large lexicons. Software practice and experience 25(3), March Mikael Tillenius: Efficient Generation and Ranking of Spelling Error Corrections. Master s thesis at Sweden s Royal Institute of Technology. Nice, easy reading on spell correction: Peter Norvig: How to write a spelling corrector correct.html Ανάκτηση Πληροφορίας Pattern Matching Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

23 Searching Allowing Errors Δεδομένα: Ένα κείμενο (string) T, μήκους n Ένα pattern P μήκους m k επιτρεπόμενα σφάλματα Ζητούμενο: Βρες όλες τις θέσεις του κειμένου όπου το pattern P εμφανίζεταιμετοπολύk σφάλματα (ποιο γενικό) Recall: Edit (Levenstein) Distance: Minimum number of character deletions, additions, or replacements needed to make two strings equivalent. misspell to mispell is distance 1 misspell to mistell is distance 2 misspell to misspelling is distance 3 Ανάκτηση Πληροφορίας Searching Allowing Errors Naïve algorithm Produce all possible strings that could match P (assuming k errors) and search each one of them on T Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

24 Searching Allowing Errors: Solution using Dynamic Programming Dynamic Programming is the class of algorithms, which includes the most commonly used algorithms in speech and language processing. Among them the minimum edit distance algorithm for spelling error correction. Intuition: a large problem can be solved by properly combining the solutions to various subproblems. Ανάκτηση Πληροφορίας Searching Allowing Errors: Solution using Dynamic Programming Έναν m x n πίνακα C Γραμμές θέσεις του pattern Στήλες θέσεις του text C[i, j]: ο ελάχιστος αριθμός λαθών για να ταιριάξουμε το P 1..i με ένα sufix του T 1..j C[0, j] = 0 C[i, 0] = i /* delete i characters Η ιδέα είναι ο υπολογισμός μιας τιμής του πίνακα με βάση τις προηγούμενες (δηλαδή, ήδη υπολογισμένες) γειτονικές της Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

25 Searching Allowing Errors: Solution using Dynamic Programming C[i, j]: ο ελάχιστος αριθμός λαθών για να ταιριάξουμε το P 1..i με ένα suffix του T 1..j C[i, j] = αν P i = T i τότε C[i 1, j 1] Αλλιώς ο καλύτερος τρόπος από τα παρακάτω replace P i με Τ i (ή το συμμετρικό) κόστος 1+C[i 1,j 1] delete P i κόστος 1+ C[i I, j] delete T i 1 + C[i,j 1] add?? Ανάκτηση Πληροφορίας Searching Allowing Errors: Solution using Dynamic Programming (II) Problem Statement: T[n] text string, P[m] pattern, k errors Example: T = surgery, P = survey, k=2 To explain the algorithm we will use a m x n matrix C one row for each char of P, one column for each char of T (latter on we shall see that we need less space) T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

26 Searching Allowing Errors: Solution using Dynamic Programming (III) T = surgery, P = survey, k=2 οι γραμμές του C εκφράζουνπόσα γράμματα του pattern έχουμεήδη καταναλώσει (στη 0 γραμμή τίποτα, στη m γραμμή ολόκληρο το pattern) C[0,j] := 0 for every column j (no letter of P has been consumed) C[i,0] := i for every row i (i chars of P have been consumed, pointer of T at 0. So i errors (insertions) so far) T P Ανάκτηση Πληροφορίας Searching Allowing Errors: Solution using Dynamic Programming (IV) if P[i]=T[j] THEN C[i,j] := C[i 1,j 1] // εγινε match άρα τα λάθη ήταν όσα και πριν Else C[i,j] := 1 + min of: C[i 1,j] // i 1 chars consumed P, j chars consumed of T // ~delete a char from T C[i,j 1] // i chars consumed P, j 1 chars consumed of T // ~ delete a char from P C[i 1,j 1] // i 1 chars consumed P, j 1 chars consumed of T // ~ character replacement Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

27 Searching Allowing Errors: Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

28 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

29 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P 1 + Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P 1 + Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

30 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P 1 + Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

31 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Bold entries indicate matching positions. Cost: O(mn) time where m and n are the lengths of the two strings being compared. Παρατήρηση: η πολυπλοκότητα είναι ανεξάρτητη του κ Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Cost: O(mn) time where m and n are the lengths of the two strings being compared. O(m) space as we need to keep only the previous column stored So we don't have to keep a mxn matrix Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

32 Εφαρμογή στο groogle Ανάκτηση Πληροφορίας Constructing an Inverted File Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

33 Content Hardware basics Blocked sort-based index Distributed index Dynamic Indexing Ανάκτηση Πληροφορίας Ch. 4 Index construction How do we construct an index? What strategies can we use with limited main memory? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

34 Sec. 4.1 Hardware basics Many design decisions in information retrieval are based on the characteristics of hardware We begin by reviewing hardware basics Ανάκτηση Πληροφορίας Sec. 4.1 Hardware basics Access to data in memory is much faster than access to data on disk. Caching (keeping frequently used disk data in memory) Disk seeks: No data is transferred from disk while the disk head is being positioned. (seek time) Therefore: Transferring one large chunk of data from disk to memory is faster than transferring many small chunks. Disk I/O is block based: Reading and writing of entire blocks (as opposed to smaller chunks). Block sizes: 8KB to 256 KB. Data transfers are handled by the system bus, not by the processor Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

35 Sec. 4.1 Hardware basics Servers used in IR systems now typically have several GB of main memory, sometimes tens of GB. Available disk space is several (2 3) orders of magnitude larger. Fault tolerance is very expensive: It s much cheaper to use many regular machines rather than one fault tolerant machine. Ανάκτηση Πληροφορίας Sec. 4.1 Hardware assumptions symbol statistic value s average seek time 5 ms = 5 x 10 3 s b transfer time per byte 0.02 μs= 2 x 10 8 s processor s clock rate 10 9 s 1 p low level operation 0.01 μs= 10 8 s (e.g., compare & swap a word) size of main memory several GB size of disk space 1 TB or more Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

36 Sec. 4.2 RCV1: Our collection for this lecture As an example for applying scalable index construction algorithms, we will use the Reuters RCV1 collection. This is one year of Reuters newswire (part of 1995 and 1996) The collection we ll use isn t really large enough either, but it s publicly available and is at least a more plausible example. Ανάκτηση Πληροφορίας Sec. 4.2 A Reuters RCV1 document Note: we ignore multimedia types Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

37 Sec. 4.2 Reuters RCV1 statistics symbol statistic value N documents 800,000 L avg. # tokens per doc 200 M terms (= word types/distinct) 400,000 avg. # bytes per token 6 (incl. spaces/punct.) avg. # bytes per token 4.5 (without spaces/punct.) avg. # bytes per term 7.5 T (tokens) non positional postings 100,000, bytes per word token vs. 7.5 bytes per word type: why? Ανάκτηση Πληροφορίας Sec. 4.2 Recall IIR 1 index construction Term Doc # I 1 did 1 enact 1 julius 1 caesar 1 Documents are parsed to extract words and these are I 1 saved with the Document ID. was 1 killed 1 i' 1 the 1 capitol 1 brutus 1 killed 1 me 1 Doc 1 Doc 2 so 2 let 2 it 2 I did enact Julius So let it be with be 2 with 2 Caesar I was killed Caesar. The noble caesar 2 the 2 i' the Capitol; Brutus hath told you noble 2 brutus 2 Brutus killed me. Caesar was ambitious hath 2 told 2 you 2 caesar 2 Ανάκτηση Πληροφορίας was 2 74 ambitious 2 Ανάκτηση Πληροφορίας

38 Sec. 4.2 Key step After all documents have been parsed, the inverted file is sorted by terms. We focus on this sort step. We have 100M items to sort. Note: present terms by termid (on the fly or in two passes) Term Doc # I 1 did 1 enact 1 julius 1 caesar 1 I 1 was 1 killed 1 i' 1 the 1 capitol 1 brutus 1 killed 1 me 1 so 2 let 2 it 2 be 2 with 2 caesar 2 the 2 noble 2 brutus 2 hath 2 told 2 you 2 caesar 2 was 2 ambitious 2 Term Doc # ambitious 2 be 2 brutus 1 brutus 2 capitol 1 caesar 1 caesar 2 caesar 2 did 1 enact 1 hath 1 I 1 I 1 i' 1 it 2 julius 1 killed 1 killed 1 let 2 me 1 noble 2 so 2 the 1 the 2 told 2 you 2 was 1 was 2 with 2 Ανάκτηση Πληροφορίας Sec. 4.2 Scaling index construction In memory index construction does not scale. How can we construct an index for very large collections? Taking into account the hardware constraints we just learned about... Memory, disk, speed, etc. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

39 Sort-based index construction As we build the index, we parse docs one at a time. Sec. 4.2 While building the index, we cannot easily exploit compression tricks (you can, but much more complex) The final postings for any term are incomplete until the end. At 12 bytes per non positional postings entry (term, doc, freq), demands a lot of space for large collections. T = 100,000,000 in the case of RCV1 So we can do this in memory in 2009, but typical collections are much larger. E.g. the New York Times provides an index of >150 years of newswire Thus: We need to store intermediate results on disk. Ανάκτηση Πληροφορίας Sec. 4.2 Use the same algorithm for disk? Sorting T = 100,000,000 records on disk is too slow too many disk seeks. We need an external sorting algorithm. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

40 Sec. 4.2 Bottleneck Parse and build postings entries one doc at a time Now sort postings entries by term (then by doc within each term) Doing this with random disk seeks would be too slow must sort T=100M records If every comparison took 2 disk seeks, and N items could be sorted with N log 2 N comparisons, how long would this take? Ανάκτηση Πληροφορίας BSBI: Blocked sort-based Indexing (Sorting with fewer disk seeks) Sec byte (4+4+4) records (term, doc, freq). These are generated as we parse docs. Must now sort 100M such 12 byte records by term. Define a Block ~ 10M such records Can easily fit a couple into memory. Will have 10 such blocks to start with. Basic idea of algorithm: 1. Accumulate postings for each block, sort, write to disk. 2. Then merge the blocks into one long sorted order. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

41 Sec. 4.2 Ανάκτηση Πληροφορίας Sec. 4.2 Sorting 10 blocks of 10M records First, read each block and sort within: Quicksort takes 2N ln N expected steps In our case 2 x (10M ln 10M) steps total time to read each block from disk and quicksort it. 10 times this estimate gives us 10 sorted runs of 10M records each. Done straightforwardly, need 2 copies of data on disk But can optimize this Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

42 Sec. 4.2 Ανάκτηση Πληροφορίας Sec. 4.2 How to merge the sorted runs? Can do binary merges, with a merge tree of log 2 10 = 4 layers. During each layer, read into memory runs in blocks of 10M, merge, write back Merged run. Runs being merged. Disk 4 Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

43 Sec. 4.2 How to merge the sorted runs? But it is more efficient to do a n way merge, where you are reading from all blocks simultaneously Providing you read decent sized chunks of each block into memory and then write out a decent sized output chunk, then you re not killed by disk seeks Ανάκτηση Πληροφορίας Remaining problem with sort-based algorithm Sec. 4.3 Our assumption was: we can keep the dictionary in memory. We need the dictionary (which grows dynamically) in order to implement a term to termid mapping. Actually, we could work with term,docid postings instead of termid,docid postings but then intermediate files become very large. (We would end up with a scalable, but very slow index construction method.) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

44 SPIMI: Single-pass in-memory indexing Sec. 4.3 Key idea 1: Generate separate dictionaries for each block no need to maintain term termid mapping across blocks. Key idea 2: Don t sort. Accumulate postings in postings lists as they occur. With these two ideas we can generate a complete inverted index for each block. These separate indexes can then be merged into one big index. Ανάκτηση Πληροφορίας SPIMI-Invert Sec. 4.3 Merging of blocks is analogous to BSBI. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

45 SPIMI: Compression Sec. 4.3 Compression makes SPIMI even more efficient. Compression of terms Compression of postings Ανάκτηση Πληροφορίας Vocabulary: Tries Vocabulary: Btree but also trie Tries multiway trees for stroring strings able to retrieve any string in time proportional to its length (independent from the number of all stored strings) Description every edge is labeled with a letter searching a string s start from root and for each character of s followtheedgethatislabeledwith the same letter. continue, until a leaf is found (which means that s is found) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

46 Tries: Παράδειγμα This is a text. A text has many words. Words are made from letters. Vocabulary text (11) text (19) many (28) words (33) words (40) made (50) letters (60) Vocabulary (ordered) letters (60) made (50) many (28) text (11,19) words (33,40) Vocabulary trie l m a t w letters:60 made:50 many:28 text:11,19 words:33,40 Ερώτηση: Θα μπορούσε ένα trie να βοηθήσει τη στελέχωση κειμένου βάσει της τεχνικής Successor variety? d n Ανάκτηση Πληροφορίας Παράδειγμα αυξητικής δημιουργίας ενός trie Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

47 Constructing an Inverted File All the vocabulary is kept in a suitable data structure storing for each word a list of its occurrences e.g. in a trie data structure Each word of the text is read and searched in the vocabulary if a trie data structure is used then this search costs O(m) where m the size of the word If it is not found, it is added to the vocabulary with an empty list of occurrences and the new position is added to the end of its list of occurrences Ανάκτηση Πληροφορίας Constructing an Inverted File Once the text is exhausted the vocabulary is written to disk with the list of occurrences. Two files are created: in the first file, the list of occurrences are stored contiguously in the second file, the vocabulary is stored in lexicographical order and, for each word, a pointer to its list in the first file is also included. The overall process is O(n) time 2 nd file 1 st file Trie: O(1) per text character Since positions are appended (in the postings file) O(1) time It follows that the overall process is O(n) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

48 Example of constructing an inverted file (in our example we assume that: each word = one document, position = document identifier ) Once the complete trie structure is constructed theinvertedfilecanbe derived from it: The trie is traversed topdown and left to right. whenever an index term is encountered, it is added to the end of the inverted file. Note that if a term is prefix of another term (such as "a" is prefix of "are") index terms can occur on internal nodes of the trie. analogously the posting file is derived. Ανάκτηση Πληροφορίας Example (cont) The trie structure constructed is a possible access structure to the index file in main memory. Thus the entries of the index files occur as leaves (or internal nodes) of the trie. Each entry has a reference to the position of the postings file that is held in secondary storage. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

49 What if the Inverted Index does not fit in main memory? A technique based on partial Indexes: Use the previous algorithm until the main memory is exhausted. When no more memory is available, write to disk the partial index I i obtained up to now, and erase it from main memory Continue with the rest of the text Once the text is exhausted, a number of partial indices I i exist on disk The partial indices are merged to obtain the final index Ανάκτηση Πληροφορίας Merging two partial indices I1 and I2 Merge the sorted vocabularies and whenever the same word appears in both indices, merge both list of occurences By construction, the occurences of the smaller numbered index are before those at the larger numbered index, therefore the lists are just concatenated Complexity: O(n1+n2) where n1 and n2 the sizes of the indices Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

50 Example of two partial indices and their merging Ανάκτηση Πληροφορίας Merging partial indices to obtain the final I final index 7 level 3 I I level 2 I I I I I 1 I 2 I 3 I 4 I 5 I 6 I 7 I 8 level 1 initial dumps Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

51 Merging all partial indices: Time Complexity Notations n: the size of the text V:the size of the vocabulary M: the amount of main memory available The total time to generate partial indices is O(n) The number of partial indices is O(n/M) To merge the O(n/M) partial indices are necessary log 2 (n/m) merging levels The total cost of this algorithm is O(n log(n/m)) Ανάκτηση Πληροφορίας Sec. 4.4 Distributed indexing Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

52 Distributed indexing Sec. 4.4 For web scale indexing (don t try this at home!): must use a distributed computing cluster Individual machines are fault prone Can unpredictably slow down or fail How do we exploit such a pool of machines? Ανάκτηση Πληροφορίας Distributed indexing Sec. 4.4 Web search engines, therefore, use distributed indexing algorithms for index construction. Constructed index is partitioned across several machines either according to term or according to document. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

53 Sec. 4.4 Google data centers Google data centers mainly contain commodity machines. Data centers are distributed around the world. Estimate: a total of 1 million servers, 3 million processors/cores (Gartner 2007) Estimate: Google installs 100,000 servers each quarter. Based on expenditures of million dollars per year This would be 10% of the computing capacity of the world!?! Ανάκτηση Πληροφορίας Sec. 4.4 Google data centers If in a non fault tolerant system with 1000 nodes, each node has 99.9% uptime, what is the uptime of the system? Answer: 63% Calculate the number of servers failing per minute for an installation of 1 million servers. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

54 Sec. 4.4 Distributed indexing Maintain a master machine directing the indexing job considered safe. Break up indexing into sets of (parallel) tasks. Master machine assigns each task to an idle machine from a pool Divide data into chunks, re assign task if a task on a chunk fails Ανάκτηση Πληροφορίας Sec. 4.4 Parallel tasks We will use two sets of parallel tasks Parsers Inverters Break the input document collection into splits Each split is a subset of documents (corresponding to blocks in BSBI/SPIMI) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

55 Sec. 4.4 Parsers Master assigns a split to an idle parser machine Parser 1. reads a document at a time and emits (term, doc) pairs 2. writes pairs into j partitions Each partition is for a range of terms first letters (e.g., a f, g p, q z) here j = 3. Now to complete the index inversion Ανάκτηση Πληροφορίας Sec. 4.4 Inverters An inverter collects all (term,doc) pairs (= postings) for one termpartition. Sorts and writes to postings lists Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

56 Sec. 4.4 Data flow assign Master assign Postings Parser a-f g-p q-z Inverter a-f Parser a-f g-p q-z Inverter g-p splits Parser a-f g-p q-z Inverter q-z Map phase Segment files Reduce phase Ανάκτηση Πληροφορίας Sec. 4.4 MapReduce The index construction algorithm we just described is an instance of MapReduce. MapReduce (Dean and Ghemawat 2004) is a robust and conceptually simple framework for distributed computing without having to write code for the distribution part. They describe the Google indexing system (ca. 2002) as consisting of a number of phases, each implemented in MapReduce. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

57 Sec. 4.4 MapReduce Index construction was just one phase. Another phase: transforming a term partitioned index into a document partitioned index. Term partitioned: one machine handles a subrange of terms Document partitioned: one machine handles a subrange of documents most search engines use a document partitioned index better load balancing, etc. Ανάκτηση Πληροφορίας Sec. 4.4 MapReduce To minimize write times, before inverters reduce the data, each parser writes its segment files to its local disk. In the reduce phase, the master communicates to an inverter the locations of the relevant segment files (e.g., of the r segment files of the a f partition). Each segment file only requires one sequential read because all data relevant to a particular inverter were written to a single segment file by the parser. This setup minimizes the amount of network traffic needed during indexing. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

58 Schema for index construction in MapReduce (Key, Value) pairs Sec. 4.4 Schema of map and reduce functions map: input list(k, v) reduce: (k,list(v)) output Instantiation of the schema for index construction map: web collection list(termid, docid) reduce: (<termid1, list(docid)>, <termid2, list(docid)>, ) (postings list1, postings list2, ) Example for index construction map: d2 : C died. d1 : C came, C c ed. (<C, d2>, <died,d2>, <C,d1>, <came,d1>, <C,d1>, <c ed, d1> reduce: (<C,(d2,d1,d1)>, <died,(d2)>, <came,(d1)>, <c ed,(d1)>) (<C,(d1:2,d2:1)>, <died,(d2:1)>, <came,(d1:1)>, <c ed,(d1:1)>) Ανάκτηση Πληροφορίας Sec. 4.4 Dynamic indexing Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

59 Sec. 4.5 Dynamic indexing Up to now, we have assumed that collections are static. They rarely are: Documents come in over time and need to be inserted. Documents are deleted and modified. This means that the dictionary and postings lists have to be modified: Postings updates for terms already in dictionary New terms added to dictionary Ανάκτηση Πληροφορίας Sec. 4.5 Simplest approach Maintain big main index New docs go into small auxiliary index Search across both, merge results Deletions Invalidation bit vector for deleted docs Filter docs output on a search result by this invalidation bit vector Periodically, re index into one main index Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

60 Sec. 4.5 Issues with main and auxiliary indexes Problem of frequent merges you touch stuff a lot Poor performance during merge Actually: Merging of the auxiliary index into the main index is efficient if we keep a separate file for each postings list. Merge is the same as a simple append. But then we would need a lot of files inefficient for O/S. Assumption for the rest of the lecture: The index is one big file. In reality: Use a scheme somewhere in between (e.g., split very large postings lists, collect postings lists of length 1 in one file etc.) Ανάκτηση Πληροφορίας Logarithmic merge Sec. 4.5 Maintain a series of indexes, each twice as large as the previous one. Keep smallest (Z 0 ) in memory Larger ones (I 0, I 1, ) on disk If Z 0 gets too big (> n), write to disk as I 0 or merge with I 0 (if I 0 already exists) as Z 1 Either write merge Z 1 to disk as I 1 (if no I 1 ) Or merge with I 1 to form Z 2 etc. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

61 Sec. 4.5 Ανάκτηση Πληροφορίας Sec. 4.5 Logarithmic merge Auxiliary and main index: index construction time is O(T 2 ) as each posting is touched in each merge. Logarithmic merge: Each posting is merged O(log T) times, so complexity is O(T log T) So logarithmic merge is much more efficient for index construction But query processing now requires the merging of O(log T) indexes Whereas it is O(1) if you just have a main and auxiliary index Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

62 Sec. 4.5 Further issues with multiple indexes Collection wide statistics are hard to maintain E.g., when we spoke of spell correction: which of several corrected alternatives do we present to the user? We said, pick the one with the most hits How do we maintain the top ones with multiple indexes and invalidation bit vectors? One possibility: ignore everything but the main index for such ordering Will see more such statistics used in results ranking Ανάκτηση Πληροφορίας Sec. 4.5 Dynamic indexing at search engines All the large search engines now do dynamic indexing Their indices have frequent incremental changes News items, blogs, new topical web pages Sarah Palin, But (sometimes/typically) they also periodically reconstruct the index from scratch Query processing is then switched to the new index, and the old index is then deleted Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

63 Sec. 4.5 Ανάκτηση Πληροφορίας Sec. 4.5 Other sorts of indexes Positional indexes Same sort of sorting problem just larger Building character n gram indexes: As text is parsed, enumerate n grams. For each n gram, need pointers to all dictionary terms containing it the postings. Note that the same postings entry will arise repeatedly in parsing the docs need efficient hashing to keep track of this. E.g., that the trigram uou occurs in the term deciduous will be discovered on each text occurrence of deciduous Only need to process each term once Why? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

64 Maintaining the Inverted File Addition of a new doc build its index and merge it with the final index (as done with partial indexes) Delete a doc of the collection scan index and delete those occurrences that point into the deleted file (complexity: O(n) : extremely expensive!) Ανάκτηση Πληροφορίας A Complete Search System Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

65 Sec Cluster pruning: query processing Process a query as follows: Given query Q, find its nearest leader L. Seek K nearest docs from among L s followers. Ανάκτηση Πληροφορίας Sec Visualization Query Leader Follower Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

66 Sec Why use random sampling Fast Leaders reflect data distribution Ανάκτηση Πληροφορίας Sec General variants Have each follower attached to b 1 =3 (say) nearest leaders. From query, find b 2 =4 (say) nearest leaders and their followers. Can recur on leader/follower construction. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

67 Top-k Aggregation Ανάκτηση Πληροφορίας Top k Rank Aggregation Έχουμε Ν αντικείμενα και τους βαθμούς τους βάσει m διαφορετικών κριτηρίων. Έχουμε έναν τρόπο να συνδυάζουμε τα m σκορ κάθε αντικειμένου σε ένα ενοποιημένο σκορ π.χ. min, avg, sum Στόχος: Βρες τα κ αντικείμενα με το υψηλότερο ενοποιημένο σκορ. Εφαρμογές: Υπολογισμός των κορυφαίων κ στοιχείων της απάντησης ενός ΣΑΠ που βασίζεται στο διανυσματικό μοντέλο (τα m κριτήρια είναι οι m όροι της επερώτησης) ενός μεσίτη (π.χ. μετα μηχανής αναζήτησης) πάνω από m Συστήματα Ανάκτησης Πληροφοριών μιας επερώτησης σε μια Βάση Πολυμέσων κριτήρια (και συνάμα χαρακτηριστικά/features): χρώμα, μορφή, υφή, Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

68 Άλλο ένα παράδειγμα εφαρμογής Ενοποίηση απαντήσεων σε Μεσολαβητές (middleware) πάνω από πηγές που αποθηκεύουν δομημένες πληροφορίες έστω μια υπηρεσία εύρεσης εστιατορίων βάσει τριών κριτηρίων: απόσταση από ένα σημείο κατάταξη εστιατορίου τιμή γεύματος, και άλλα όπου ο χρήστης μπορεί να ορίσει τον επιθυμητό τρόπο υπολογισμού του ενοποιημένου σκορ ενός εστιατορίου π.χ. Σκορ(εστΧ) = Stars(εστΧ)* *DistanceFromHome(εστΧ) η υπηρεσία αυτή υλοποιείται με χρήση τριών απομακρυσμένων υπηρεσιών (α) getrestaurantsbystars επιστρέφει όλα τα εστιατόρια σε φθίνουσα σειρά ως προς τα αστέρια που έχουν (κάθε εστιατόριο συνοδεύεται με ένα σκορ) (β) getrestaurantsbydistance(x,y) επιστρέφει όλα τα εστιατόρια σε φθίνουσα σειρά ως προς την απόσταση τους από ένα συγκεκριμένο σημείο με συντεταγμένες (x,y) // κάθε εστιατόριο συνοδεύεται από την απόσταση του από το (x,y) Ανάκτηση Πληροφορίας Άλλο ένα παράδειγμα εφαρμογής Πως μπορώ να ελαχιστοποιήσω το πλήθος των στοιχείων που πρέπει να διαβάσω από την απάντηση της κάθε υπηρεσίας, προκειμένου να βρω τα κορυφαία 5 εστιατόρια (βάσει σκορ όπως υπολογίζεται από της συνάρτηση βαθμολόγησης που έδωσε ο χρήστης); Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

69 Εύρεση των κ-κορυφαίων Απλοϊκός Αλγόριθμος 1. Ανέκτησε ολόκληρες τις m λίστες 2. Υπολόγισε το ενοποιημένο σκορ του κάθε αντικειμένου 3. Ταξινόμησε τα αντικείμενα βάσει του σκορ και επέλεξε τα πρώτα κ Παρατηρήσεις Κόστος γραμμικό ως προς το μήκος των λιστών Δεν αξιοποιεί το γεγονός ότι οι λίστες είναι ταξινομημένες Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Παράδειγμα: Απλοϊκός Τρόπος Έστω ότι θέλουμε να συναθροίσουμε τις διατάξεις που επιστρέφουν 3 πηγές S1, S2, S3 και ο τρόπος συνάθροισης είναι το άθροισμα. S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Ο Απλοϊκός Τρόπος Score(Α) = = 2.4 Score(B) = = 2 Score(C) = = 2.1 Score(E) = = 2.2 Score(F) = = 1.7 Score(G) = = 1.5 Score(H) = = 1.5 Τελική διάταξη: < A, E, C, B, F, G, H> Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

70 Εύρεση των κ-κορυφαίων Πιο Αποδοτικοί Αλγόριθμοι Γενική ιδέα: Άρχισε να διαβάζεις τις διατάξεις από την κορυφή. Προσπάθησε να καταλάβεις πότε πρέπει να σταματήσεις. Αλγόριθμοι Fagin Algorithm (FA) [Fagin 1999, J. CSS 58] Threshold Algorithm (ΤΑ) [Fagin et al., PODS 2001] Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Πιο Αποδοτικοί Αλγόριθμοι Υποθέσεις 1. Υποθέτουμε ότι έχουμε στη διάθεση μας 2 τρόπους πρόσβασης στα αποτελέσματα μιας πηγής: Σειριακή πρόσβαση στις διατάξεις: φθίνουσαωςπροςτοσκορ Τυχαία προσπέλαση: Δυνατότητα εύρεσης του σκορ ενός συγκεκριμένου αντικειμένου με μία πρόσβαση 2. Συναρτήσεις βαθμολόγησης (σκορ) Τα σκορ ανήκουν στο διάστημα [0,1] Η συνάρτηση ενοποιημένου σκορ είναι μονότονη αν όλα (m) τα σκορ ενός αντικειμένου Α είναι μεγαλύτερα ή ίσα των αντίστοιχων σκορ ενός αντικειμένου Β, τότε σίγουρα το ενοποιημένο σκορ του Α είναι μεγαλύτερο ή ίσο του σκορ του Β Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

71 Εύρεση των κ-κορυφαίων ΟΑλγόριθμοςτουFagin (FA) [1999] 1.α/ Κάνε σειριακή ανάκτηση αντικειμένων από κάθε λίστα (αρχίζοντας από την κορυφή), έως η τομή των αντικειμένων από κάθε λίσταναέχεικαντικείμενα 1.β/ Για κάθε αντικείμενο που ανακτήθηκε (στο 1.α) συνέλεξε τα σκορ που λείπουν (με χρήση του μηχανισμού τυχαίας προσπέλασης) 2/ Υπολόγισε το ενοποιημένο σκορ του κάθε αντικειμένου 3/ Ταξινόμησε τα αντικείμενα βάσει του ενοποιημένου σκορ και επέλεξε τα πρώτα κ Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Ο Αλγόριθμος του Fagin (FA) [1999] Για οποιοδήποτε μη επιλεγμένο αντικείμενο υπάρχουν (τουλάχιστον) κ που είναι καλύτερα από αυτό Σχόλια Αξιοποιεί (α) το γεγονός ότι οι λίστες είναι ταξινομημένες και (β) ότι η συνάρτηση ενοποίησης είναι μονότονη [ ] Το πλήθος των αντικειμένων που θα ανακτηθούν μπορεί να είναι μεγάλο Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

72 Εύρεση των κ-κορυφαίων Παράδειγμα: Αλγόριθμος του Fagin (FA) S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Έστω ότι θέλω το Top 1 Το Ε εμφανίζεται σε όλες (μονοτονία => δεν μπορεί κάποιο δεξιότερο του Ε να είναι καλύτερο του Ε Το Ε δεν είναι σίγουρα ο νικητής. Υποψήφιοι νικητές = {A, B, C, E, F}. Κάνουμε τυχαίες προσπελάσεις για vαβρούμετασκορ που μας λείπουν getscore(s2,a), getscore(s1,b), getscore(s3,b), getscore(s2,c), Πράγματι, top 1= {Α} Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Παράδειγμα: Αλγόριθμος του Fagin (FA) S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Έστω ότι θέλω το Top 2 Το Ε, B (και το Α) εμφανίζονται σε όλες (μονοτονία => δεν μπορεί κάποιο δεξιότερο του Β να είναι καλύτερο του Β Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

73 Εύρεση των κ-κορυφαίων Ο Αλγόριθμος ΤΑ (Threshold Algorithm) [Fagin et al. 2001] Ιδέα: Υπολόγισε το μέγιστο σκορ που μπορεί να έχει ένα αντικείμενο που δεν έχουμε συναντήσει ακόμα. 1/ Κάνε σειριακή ανάκτηση αντικειμένων από κάθε λίστα (αρχίζοντας από την κορυφή) και με χρήση τυχαίας προσπέλασης βρεςόλατασκορκάθε αντικειμένου 2/ Ταξινόμησε τα αντικείμενα (βάσει του ενοποιημένου σκορ) και κράτησε τα καλύτερα κ 3/ Σταμάτησε την σειριακή ανάκτηση όταν τα σκορ των παραπάνω κ αντικειμένων δεν μπορεί να είναι μικρότερα του μέγιστου πιθανού σκορ των απαρατήρητων αντικειμένων (threshold). Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Παράδειγμα: Αλγόριθμος TA: S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Score(A) = = 2.4 Score(B) = = 2 UpperBound = = 2.7 αφού 2.7 > 2.4 συνεχίζω Έστω ότι θέλω το Top 1 Score(C) = = 2.1 Score(E) = = 2.2 UpperBound = = 2.4 αφού 2.4 δεν είναι μεγαλύτερο του 2.4 (σκορ του Α) σταματάω. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 7η: 21/03/2016 1 Ch. 4 Κατασκευή του ευρετηρίου Πώς κατασκευάζουμε το ευρετήριο; Ποιες στρατηγικές μπορούμε ν ακολουθήσουμε

Διαβάστε περισσότερα

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός Ανάκληση Πληροφορίας Information Retrieval Διδάσκων Δημήτριος Κατσαρός Διάλεξη 5η: 26/02/2014 1 Phrase queries 2 Phrase queries Want to answer queries such as stanford university as a phrase Thus the sentence

Διαβάστε περισσότερα

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός Ανάκληση Πληροφορίας Information Retrieval Διδάσκων Δημήτριος Κατσαρός Διάλεξη 6η: 05/03/2014 1 WILD-CARD QUERIES 2 Sec. 3.2 Wild-card queries: * mon*: find all docs containing any word beginning mon.

Διαβάστε περισσότερα

4. Κατασκευή Ευρετηρίου

4. Κατασκευή Ευρετηρίου Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 4. Κατασκευή Ευρετηρίου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων Πλάνο Προηγούμενο

Διαβάστε περισσότερα

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible. B-Trees Index files can become quite large for large main files Indices on index files are possible 3 rd -level index 2 nd -level index 1 st -level index Main file 1 The 1 st -level index consists of pairs

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 6η: 08/03/2016 1 Διόρθωση πληκτρολόγησης 2 Sec. 3.3 Διόρθωση πληκτρολόγησης Δυο κύριες χρήσεις Διόρθωση εγγράφων που θα εισαχθούν

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Ανάκτηση

Διαβάστε περισσότερα

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch: HOMEWORK 4 Problem a For the fast loading case, we want to derive the relationship between P zz and λ z. We know that the nominal stress is expressed as: P zz = ψ λ z where λ z = λ λ z. Therefore, applying

Διαβάστε περισσότερα

2 Composition. Invertible Mappings

2 Composition. Invertible Mappings Arkansas Tech University MATH 4033: Elementary Modern Algebra Dr. Marcel B. Finan Composition. Invertible Mappings In this section we discuss two procedures for creating new mappings from old ones, namely,

Διαβάστε περισσότερα

Homework 3 Solutions

Homework 3 Solutions Homework 3 Solutions Igor Yanovsky (Math 151A TA) Problem 1: Compute the absolute error and relative error in approximations of p by p. (Use calculator!) a) p π, p 22/7; b) p π, p 3.141. Solution: For

Διαβάστε περισσότερα

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required) Phys460.nb 81 ψ n (t) is still the (same) eigenstate of H But for tdependent H. The answer is NO. 5.5.5. Solution for the tdependent Schrodinger s equation If we assume that at time t 0, the electron starts

Διαβάστε περισσότερα

EE512: Error Control Coding

EE512: Error Control Coding EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3

Διαβάστε περισσότερα

The Simply Typed Lambda Calculus

The Simply Typed Lambda Calculus Type Inference Instead of writing type annotations, can we use an algorithm to infer what the type annotations should be? That depends on the type system. For simple type systems the answer is yes, and

Διαβάστε περισσότερα

Block Ciphers Modes. Ramki Thurimella

Block Ciphers Modes. Ramki Thurimella Block Ciphers Modes Ramki Thurimella Only Encryption I.e. messages could be modified Should not assume that nonsensical messages do no harm Always must be combined with authentication 2 Padding Must be

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Ανάκτηση

Διαβάστε περισσότερα

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Συστήματα Διαχείρισης Βάσεων Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 5: Tutorial on External Sorting Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών TUTORIAL ON EXTERNAL SORTING

Διαβάστε περισσότερα

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS CHAPTER 5 SOLVING EQUATIONS BY ITERATIVE METHODS EXERCISE 104 Page 8 1. Find the positive root of the equation x + 3x 5 = 0, correct to 3 significant figures, using the method of bisection. Let f(x) =

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011 Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι

Διαβάστε περισσότερα

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Συστήματα Διαχείρισης Βάσεων Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 9: Transactions - part 1 Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών Tutorial on Undo, Redo and Undo/Redo

Διαβάστε περισσότερα

Instruction Execution Times

Instruction Execution Times 1 C Execution Times InThisAppendix... Introduction DL330 Execution Times DL330P Execution Times DL340 Execution Times C-2 Execution Times Introduction Data Registers This appendix contains several tables

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ανεκτική αναζήτηση. ηµιουργία Ευρετηρίου. ιδάσκων ηµήτριος Κατσαρός, Ph.D.

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ανεκτική αναζήτηση. ηµιουργία Ευρετηρίου. ιδάσκων ηµήτριος Κατσαρός, Ph.D. Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 2η: 21/02/2007 1 Ανεκτική αναζήτηση & ηµιουργία

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 2η: 21/02/2007 1 Ανεκτική αναζήτηση & ηµιουργία

Διαβάστε περισσότερα

derivation of the Laplacian from rectangular to spherical coordinates

derivation of the Laplacian from rectangular to spherical coordinates derivation of the Laplacian from rectangular to spherical coordinates swapnizzle 03-03- :5:43 We begin by recognizing the familiar conversion from rectangular to spherical coordinates (note that φ is used

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Να γραφεί πρόγραμμα το οποίο δέχεται ως είσοδο μια ακολουθία S από n (n 40) ακέραιους αριθμούς και επιστρέφει ως έξοδο δύο ακολουθίες από θετικούς ακέραιους

Διαβάστε περισσότερα

Concrete Mathematics Exercises from 30 September 2016

Concrete Mathematics Exercises from 30 September 2016 Concrete Mathematics Exercises from 30 September 2016 Silvio Capobianco Exercise 1.7 Let H(n) = J(n + 1) J(n). Equation (1.8) tells us that H(2n) = 2, and H(2n+1) = J(2n+2) J(2n+1) = (2J(n+1) 1) (2J(n)+1)

Διαβάστε περισσότερα

Approximation of distance between locations on earth given by latitude and longitude

Approximation of distance between locations on earth given by latitude and longitude Approximation of distance between locations on earth given by latitude and longitude Jan Behrens 2012-12-31 In this paper we shall provide a method to approximate distances between two points on earth

Διαβάστε περισσότερα

Section 8.3 Trigonometric Equations

Section 8.3 Trigonometric Equations 99 Section 8. Trigonometric Equations Objective 1: Solve Equations Involving One Trigonometric Function. In this section and the next, we will exple how to solving equations involving trigonometric functions.

Διαβάστε περισσότερα

Partial Differential Equations in Biology The boundary element method. March 26, 2013

Partial Differential Equations in Biology The boundary element method. March 26, 2013 The boundary element method March 26, 203 Introduction and notation The problem: u = f in D R d u = ϕ in Γ D u n = g on Γ N, where D = Γ D Γ N, Γ D Γ N = (possibly, Γ D = [Neumann problem] or Γ N = [Dirichlet

Διαβάστε περισσότερα

Lecture 2. Soundness and completeness of propositional logic

Lecture 2. Soundness and completeness of propositional logic Lecture 2 Soundness and completeness of propositional logic February 9, 2004 1 Overview Review of natural deduction. Soundness and completeness. Semantics of propositional formulas. Soundness proof. Completeness

Διαβάστε περισσότερα

Other Test Constructions: Likelihood Ratio & Bayes Tests

Other Test Constructions: Likelihood Ratio & Bayes Tests Other Test Constructions: Likelihood Ratio & Bayes Tests Side-Note: So far we have seen a few approaches for creating tests such as Neyman-Pearson Lemma ( most powerful tests of H 0 : θ = θ 0 vs H 1 :

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηριασμός, Αποθήκευση και Οργάνωση Αρχείων Κειμένων (Indexing,

Διαβάστε περισσότερα

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι She selects the option. Jenny starts with the al listing. This has employees listed within She drills down through the employee. The inferred ER sttricture relates this to the redcords in the databasee

Διαβάστε περισσότερα

Elements of Information Theory

Elements of Information Theory Elements of Information Theory Model of Digital Communications System A Logarithmic Measure for Information Mutual Information Units of Information Self-Information News... Example Information Measure

Διαβάστε περισσότερα

9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr

9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr 9.9 #. Area inside the oval limaçon r = + cos. To graph, start with = so r =. Compute d = sin. Interesting points are where d vanishes, or at =,,, etc. For these values of we compute r:,,, and the values

Διαβάστε περισσότερα

The challenges of non-stable predicates

The challenges of non-stable predicates The challenges of non-stable predicates Consider a non-stable predicate Φ encoding, say, a safety property. We want to determine whether Φ holds for our program. The challenges of non-stable predicates

Διαβάστε περισσότερα

Finite Field Problems: Solutions

Finite Field Problems: Solutions Finite Field Problems: Solutions 1. Let f = x 2 +1 Z 11 [x] and let F = Z 11 [x]/(f), a field. Let Solution: F =11 2 = 121, so F = 121 1 = 120. The possible orders are the divisors of 120. Solution: The

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

Fractional Colorings and Zykov Products of graphs

Fractional Colorings and Zykov Products of graphs Fractional Colorings and Zykov Products of graphs Who? Nichole Schimanski When? July 27, 2011 Graphs A graph, G, consists of a vertex set, V (G), and an edge set, E(G). V (G) is any finite set E(G) is

Διαβάστε περισσότερα

Every set of first-order formulas is equivalent to an independent set

Every set of first-order formulas is equivalent to an independent set Every set of first-order formulas is equivalent to an independent set May 6, 2008 Abstract A set of first-order formulas, whatever the cardinality of the set of symbols, is equivalent to an independent

Διαβάστε περισσότερα

Μηχανική Μάθηση Hypothesis Testing

Μηχανική Μάθηση Hypothesis Testing ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Μηχανική Μάθηση Hypothesis Testing Γιώργος Μπορμπουδάκης Τμήμα Επιστήμης Υπολογιστών Procedure 1. Form the null (H 0 ) and alternative (H 1 ) hypothesis 2. Consider

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή

Διαβάστε περισσότερα

TMA4115 Matematikk 3

TMA4115 Matematikk 3 TMA4115 Matematikk 3 Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet Trondheim Spring 2010 Lecture 12: Mathematics Marvellous Matrices Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet

Διαβάστε περισσότερα

C.S. 430 Assignment 6, Sample Solutions

C.S. 430 Assignment 6, Sample Solutions C.S. 430 Assignment 6, Sample Solutions Paul Liu November 15, 2007 Note that these are sample solutions only; in many cases there were many acceptable answers. 1 Reynolds Problem 10.1 1.1 Normal-order

Διαβάστε περισσότερα

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β 3.4 SUM AND DIFFERENCE FORMULAS Page Theorem cos(αβ cos α cos β -sin α cos(α-β cos α cos β sin α NOTE: cos(αβ cos α cos β cos(α-β cos α -cos β Proof of cos(α-β cos α cos β sin α Let s use a unit circle

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :

Διαβάστε περισσότερα

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1.

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1. Exercises 0 More exercises are available in Elementary Differential Equations. If you have a problem to solve any of them, feel free to come to office hour. Problem Find a fundamental matrix of the given

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university

Διαβάστε περισσότερα

Example Sheet 3 Solutions

Example Sheet 3 Solutions Example Sheet 3 Solutions. i Regular Sturm-Liouville. ii Singular Sturm-Liouville mixed boundary conditions. iii Not Sturm-Liouville ODE is not in Sturm-Liouville form. iv Regular Sturm-Liouville note

Διαβάστε περισσότερα

the total number of electrons passing through the lamp.

the total number of electrons passing through the lamp. 1. A 12 V 36 W lamp is lit to normal brightness using a 12 V car battery of negligible internal resistance. The lamp is switched on for one hour (3600 s). For the time of 1 hour, calculate (i) the energy

Διαβάστε περισσότερα

5.4 The Poisson Distribution.

5.4 The Poisson Distribution. The worst thing you can do about a situation is nothing. Sr. O Shea Jackson 5.4 The Poisson Distribution. Description of the Poisson Distribution Discrete probability distribution. The random variable

Διαβάστε περισσότερα

[1] P Q. Fig. 3.1

[1] P Q. Fig. 3.1 1 (a) Define resistance....... [1] (b) The smallest conductor within a computer processing chip can be represented as a rectangular block that is one atom high, four atoms wide and twenty atoms long. One

Διαβάστε περισσότερα

Math221: HW# 1 solutions

Math221: HW# 1 solutions Math: HW# solutions Andy Royston October, 5 7.5.7, 3 rd Ed. We have a n = b n = a = fxdx = xdx =, x cos nxdx = x sin nx n sin nxdx n = cos nx n = n n, x sin nxdx = x cos nx n + cos nxdx n cos n = + sin

Διαβάστε περισσότερα

Section 7.6 Double and Half Angle Formulas

Section 7.6 Double and Half Angle Formulas 09 Section 7. Double and Half Angle Fmulas To derive the double-angles fmulas, we will use the sum of two angles fmulas that we developed in the last section. We will let α θ and β θ: cos(θ) cos(θ + θ)

Διαβάστε περισσότερα

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ting Zhang Stanford May 11, 2001 Stanford, 5/11/2001 1 Outline Ordinal Classification Ordinal Addition Ordinal Multiplication Ordinal

Διαβάστε περισσότερα

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions SCHOOL OF MATHEMATICAL SCIENCES GLMA Linear Mathematics 00- Examination Solutions. (a) i. ( + 5i)( i) = (6 + 5) + (5 )i = + i. Real part is, imaginary part is. (b) ii. + 5i i ( + 5i)( + i) = ( i)( + i)

Διαβάστε περισσότερα

Math 6 SL Probability Distributions Practice Test Mark Scheme

Math 6 SL Probability Distributions Practice Test Mark Scheme Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

Problem Set 3: Solutions

Problem Set 3: Solutions CMPSCI 69GG Applied Information Theory Fall 006 Problem Set 3: Solutions. [Cover and Thomas 7.] a Define the following notation, C I p xx; Y max X; Y C I p xx; Ỹ max I X; Ỹ We would like to show that C

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Δημήτρης Πλεξουσάκης. Physical DB Design

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Δημήτρης Πλεξουσάκης. Physical DB Design Data Structures for Primary Indices Structures that determine the location of the records of a file A primary index is based on a key; the location of a record is determined by its key value. Most common

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ Άνοιξη I. ΜΗΛΗΣ

ΑΛΓΟΡΙΘΜΟΙ  Άνοιξη I. ΜΗΛΗΣ ΑΛΓΟΡΙΘΜΟΙ http://eclass.aueb.gr/courses/inf161/ Άνοιξη 216 - I. ΜΗΛΗΣ ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΑΛΓΟΡΙΘΜΟΙ - ΑΝΟΙΞΗ 216 - Ι. ΜΗΛΗΣ 9 DP II 1 Dynamic Programming ΓΕΝΙΚΗ ΙΔΕΑ 1. Ορισμός υπο-προβλήματος/ων

Διαβάστε περισσότερα

LECTURE 2 CONTEXT FREE GRAMMARS CONTENTS

LECTURE 2 CONTEXT FREE GRAMMARS CONTENTS LECTURE 2 CONTEXT FREE GRAMMARS CONTENTS 1. Developing a grammar fragment...1 2. A formalism that is too strong and too weak at the same time...3 3. References...4 1. Developing a grammar fragment The

Διαβάστε περισσότερα

Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in

Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in : tail in X, head in A nowhere-zero Γ-flow is a Γ-circulation such that

Διαβάστε περισσότερα

Example of the Baum-Welch Algorithm

Example of the Baum-Welch Algorithm Example of the Baum-Welch Algorithm Larry Moss Q520, Spring 2008 1 Our corpus c We start with a very simple corpus. We take the set Y of unanalyzed words to be {ABBA, BAB}, and c to be given by c(abba)

Διαβάστε περισσότερα

Inverse trigonometric functions & General Solution of Trigonometric Equations. ------------------ ----------------------------- -----------------

Inverse trigonometric functions & General Solution of Trigonometric Equations. ------------------ ----------------------------- ----------------- Inverse trigonometric functions & General Solution of Trigonometric Equations. 1. Sin ( ) = a) b) c) d) Ans b. Solution : Method 1. Ans a: 17 > 1 a) is rejected. w.k.t Sin ( sin ) = d is rejected. If sin

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006 ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/26 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι το 1 εκτός αν ορίζεται διαφορετικά στη διατύπωση

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

Section 9.2 Polar Equations and Graphs

Section 9.2 Polar Equations and Graphs 180 Section 9. Polar Equations and Graphs In this section, we will be graphing polar equations on a polar grid. In the first few examples, we will write the polar equation in rectangular form to help identify

Διαβάστε περισσότερα

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Business English Ενότητα # 9: Financial Planning Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Ενότητα 12: Συνοπτική Παρουσίαση Ανάπτυξης Κώδικα με το Matlab Σαμαράς Νικόλαος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη Ευρετήρια Βάσεις Δεδομένων Διδάσκων: Μαρία Χαλκίδη Βασικές έννοιες Οι μηχανισμοί δεικτοδότησης χρησιμοποιούνται για να επιταχύνουν την προσπέλαση σε επιθυμητά δεδομένα. π.χ., author catalog in library

Διαβάστε περισσότερα

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016 Section 1: Listening and responding Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016 Section 1: Listening and responding Section 1: Listening and Responding/ Aκουστική εξέταση Στο πρώτο μέρος της

Διαβάστε περισσότερα

Numerical Analysis FMN011

Numerical Analysis FMN011 Numerical Analysis FMN011 Carmen Arévalo Lund University carmen@maths.lth.se Lecture 12 Periodic data A function g has period P if g(x + P ) = g(x) Model: Trigonometric polynomial of order M T M (x) =

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

PARTIAL NOTES for 6.1 Trigonometric Identities

PARTIAL NOTES for 6.1 Trigonometric Identities PARTIAL NOTES for 6.1 Trigonometric Identities tanθ = sinθ cosθ cotθ = cosθ sinθ BASIC IDENTITIES cscθ = 1 sinθ secθ = 1 cosθ cotθ = 1 tanθ PYTHAGOREAN IDENTITIES sin θ + cos θ =1 tan θ +1= sec θ 1 + cot

Διαβάστε περισσότερα

Démographie spatiale/spatial Demography

Démographie spatiale/spatial Demography ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ Démographie spatiale/spatial Demography Session 1: Introduction to spatial demography Basic concepts Michail Agorastakis Department of Planning & Regional Development Άδειες Χρήσης

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Όλοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι του 10000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Αν κάπου κάνετε κάποιες υποθέσεις

Διαβάστε περισσότερα

Galatia SIL Keyboard Information

Galatia SIL Keyboard Information Galatia SIL Keyboard Information Keyboard ssignments The main purpose of the keyboards is to provide a wide range of keying options, so many characters can be entered in multiple ways. If you are typing

Διαβάστε περισσότερα

Statistical Inference I Locally most powerful tests

Statistical Inference I Locally most powerful tests Statistical Inference I Locally most powerful tests Shirsendu Mukherjee Department of Statistics, Asutosh College, Kolkata, India. shirsendu st@yahoo.co.in So far we have treated the testing of one-sided

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6: Συμπίεση Ευρετηρίου 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Κατασκευή ευρετηρίου Στατιστικά

Διαβάστε περισσότερα

Assalamu `alaikum wr. wb.

Assalamu `alaikum wr. wb. LUMP SUM Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. LUMP SUM Lump sum lump sum lump sum. lump sum fixed price lump sum lump

Διαβάστε περισσότερα

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8 questions or comments to Dan Fetter 1

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8  questions or comments to Dan Fetter 1 Eon : Fall 8 Suggested Solutions to Problem Set 8 Email questions or omments to Dan Fetter Problem. Let X be a salar with density f(x, θ) (θx + θ) [ x ] with θ. (a) Find the most powerful level α test

Διαβάστε περισσότερα

ST5224: Advanced Statistical Theory II

ST5224: Advanced Statistical Theory II ST5224: Advanced Statistical Theory II 2014/2015: Semester II Tutorial 7 1. Let X be a sample from a population P and consider testing hypotheses H 0 : P = P 0 versus H 1 : P = P 1, where P j is a known

Διαβάστε περισσότερα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων Εξάμηνο 7 ο Procedures and Functions Stored procedures and functions are named blocks of code that enable you to group and organize a series of SQL and PL/SQL

Διαβάστε περισσότερα

On a four-dimensional hyperbolic manifold with finite volume

On a four-dimensional hyperbolic manifold with finite volume BULETINUL ACADEMIEI DE ŞTIINŢE A REPUBLICII MOLDOVA. MATEMATICA Numbers 2(72) 3(73), 2013, Pages 80 89 ISSN 1024 7696 On a four-dimensional hyperbolic manifold with finite volume I.S.Gutsul Abstract. In

Διαβάστε περισσότερα

ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση

ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή ευρετηρίου Στατιστικά για τη συλλογή

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΜΥΕ003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4-5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή

Διαβάστε περισσότερα

Partial Trace and Partial Transpose

Partial Trace and Partial Transpose Partial Trace and Partial Transpose by José Luis Gómez-Muñoz http://homepage.cem.itesm.mx/lgomez/quantum/ jose.luis.gomez@itesm.mx This document is based on suggestions by Anirban Das Introduction This

Διαβάστε περισσότερα

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω 0 1 2 3 4 5 6 ω ω + 1 ω + 2 ω + 3 ω + 4 ω2 ω2 + 1 ω2 + 2 ω2 + 3 ω3 ω3 + 1 ω3 + 2 ω4 ω4 + 1 ω5 ω 2 ω 2 + 1 ω 2 + 2 ω 2 + ω ω 2 + ω + 1 ω 2 + ω2 ω 2 2 ω 2 2 + 1 ω 2 2 + ω ω 2 3 ω 3 ω 3 + 1 ω 3 + ω ω 3 +

Διαβάστε περισσότερα

Chapter 6: Systems of Linear Differential. be continuous functions on the interval

Chapter 6: Systems of Linear Differential. be continuous functions on the interval Chapter 6: Systems of Linear Differential Equations Let a (t), a 2 (t),..., a nn (t), b (t), b 2 (t),..., b n (t) be continuous functions on the interval I. The system of n first-order differential equations

Διαβάστε περισσότερα

Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά.

Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά. Διαστημικό εστιατόριο του (Μ)ΑστροΈκτορα Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά. Μόλις μια παρέα πελατών κάτσει σε ένα

Διαβάστε περισσότερα

b. Use the parametrization from (a) to compute the area of S a as S a ds. Be sure to substitute for ds!

b. Use the parametrization from (a) to compute the area of S a as S a ds. Be sure to substitute for ds! MTH U341 urface Integrals, tokes theorem, the divergence theorem To be turned in Wed., Dec. 1. 1. Let be the sphere of radius a, x 2 + y 2 + z 2 a 2. a. Use spherical coordinates (with ρ a) to parametrize.

Διαβάστε περισσότερα

Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού)

Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού) Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού) Προσδοκώμενα αποτελέσματα Περιεχόμενο Ενδεικτικές δραστηριότητες

Διαβάστε περισσότερα

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2)

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) Ιωάννης Τόλλης Τμήμα Επιστήμης Υπολογιστών NP-Completeness (2) x 1 x 1 x 2 x 2 x 3 x 3 x 4 x 4 12 22 32 11 13 21

Διαβάστε περισσότερα

Calculating the propagation delay of coaxial cable

Calculating the propagation delay of coaxial cable Your source for quality GNSS Networking Solutions and Design Services! Page 1 of 5 Calculating the propagation delay of coaxial cable The delay of a cable or velocity factor is determined by the dielectric

Διαβάστε περισσότερα

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11 Potential Dividers 46 minutes 46 marks Page 1 of 11 Q1. In the circuit shown in the figure below, the battery, of negligible internal resistance, has an emf of 30 V. The pd across the lamp is 6.0 V and

Διαβάστε περισσότερα

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3 Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3 1 State vector space and the dual space Space of wavefunctions The space of wavefunctions is the set of all

Διαβάστε περισσότερα

Solutions to Exercise Sheet 5

Solutions to Exercise Sheet 5 Solutions to Eercise Sheet 5 jacques@ucsd.edu. Let X and Y be random variables with joint pdf f(, y) = 3y( + y) where and y. Determine each of the following probabilities. Solutions. a. P (X ). b. P (X

Διαβάστε περισσότερα

Bounding Nonsplitting Enumeration Degrees

Bounding Nonsplitting Enumeration Degrees Bounding Nonsplitting Enumeration Degrees Thomas F. Kent Andrea Sorbi Università degli Studi di Siena Italia July 18, 2007 Goal: Introduce a form of Σ 0 2-permitting for the enumeration degrees. Till now,

Διαβάστε περισσότερα

CE 530 Molecular Simulation

CE 530 Molecular Simulation C 53 olecular Siulation Lecture Histogra Reweighting ethods David. Kofke Departent of Cheical ngineering SUNY uffalo kofke@eng.buffalo.edu Histogra Reweighting ethod to cobine results taken at different

Διαβάστε περισσότερα