Ευρετηρίαση ΜΕΡΟΣ ΙIΙ. Επεξεργασία Κειμένου

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ευρετηρίαση ΜΕΡΟΣ ΙIΙ. Επεξεργασία Κειμένου"

Transcript

1 Ευρετηρίαση ΜΕΡΟΣ ΙIΙ Επεξεργασία Κειμένου Ανάκτηση Πληροφορίας Content Recap: Faster posting lists with skip pointers, Phrase and Proximity Queries, Dictionary Wild-Card Queries Permutex k-gram indexes Spelling Corrections Pattern Matching Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

2 Ανεστραμμένο Αρχείο Λογική Μορφή Ευρετηρίου Μορφή Ανεστραμμένου Ευρετηρίου Index terms C j,1 k 1 k 2... k t d 1 c 1,1 c 2,1 c t,1 d 2 c 1,2 c 2,2 c t, d i c 1,j c 2,j c t,j d N c 1,N c 2,N c t,n k 1 k 2... k t Vocabulary Postings lists Ανάκτηση Πληροφορίας Inverted Files (Ανεστραμμένα αρχεία) Ιnverted file = a word oriented mechanism for indexing a text collection in order to speed up the searching task. An inverted file consists of: Vocabulary: is the set of all distinct words in the text Occurrences: lists containing all information necessary for each word of the vocabulary (documents where the word appears, frequency, text position, etc.) Τι είδους πληροφορία κρατάμε στις posting lists εξαρτάται από το λογικό μοντέλο και το μοντέλο ερωτήσεων Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

3 Searching an inverted index General Steps: 1. Vocabulary search: the words present in the query are searched in the vocabulary 2. Retrieval occurrences: the lists of the occurrences of all words found are retrieved 3. Manipulation of occurrences: The occurrences are processed to solve the query Ανάκτηση Πληροφορίας Sec. 2.3 Augment postings with skip pointers (at indexing time) Why? To skip postings that will not figure in the search results. 1. How? 2. Where do we place skip pointers? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

4 Phrase queries Sec. 2.4 Want to be able to answer queries such as stanford university as a phrase Why? The concept of phrase queries has proven easily understood by users; one of the few advanced search ideas that works 10% explicit phrase queries ( ) Many more queries are implicit phrase queries (such as person names) Ανάκτηση Πληροφορίας Sec Biword Indexes: Index every consecutive pair of terms in the text as a phrase 2. Positional Indexes: In the postings, store, for each term the position(s) in which tokens of it appear Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

5 Proximity queries Sec LIMIT! /3 STATUTE /3 FEDERAL /2 TORT Again, here, /k means within k words of. Clearly, positional indexes can be used for such queries; biword indexes cannot. Ανάκτηση Πληροφορίας Positional index size Sec We can compress position values/offsets Nevertheless, a positional index expands postings storage substantially Nevertheless, a positional index is now standardly used because of the power and usefulness of phrase and proximity queries whether used explicitly or implicitly in a ranking retrieval system. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

6 Combination schemes Sec These two approaches can be profitably combined For particular phrases ( Michael Jackson, Britney Spears ) it is inefficient to keep on merging positional postings lists Even more so for phrases like The Who In general: Potential biwords: common (based on recent query behavior) and expensive Ανάκτηση Πληροφορίας Dictionary data structures Sec. 3.1 Two main choices: Hash table Tree Some IR systems use hashes, some trees Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

7 Trees Sec. 3.1 Simplest: binary tree More usual: B trees Trees require a standard ordering of characters and hence strings but we standardly have one Pros: Solves the prefix problem (terms starting with hyp) Cons: Slower: O(log M) [and this requires balanced tree] Rebalancing binary trees is expensive But B trees mitigate the rebalancing problem Ανάκτηση Πληροφορίας WILD-CARD QUERIES Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

8 B trees handle prefixes Wild Card Queries Suffix B trees to handle * at the beginning Sec. 3.2 Other solutions: permuterms k grams Both build additional data structures Used to locate possible matches + a filtering step to check for false positives Ανάκτηση Πληροφορίας Permuterm index A special symbol $ to indicate the end of a word Sec Construct a permuterm index, in which the various rotations of each term (augmented with $) all link to the original vocabulary term. Permuterm vocabulary (the vocabulary consists of all such permutations) A query with one wildcard Rotate so that the wildcard (*) appears at the end of the query Lookup the resulting string in the permuterm index (prefix query trailing wildcard) and get all words in the dictionary Example: word, walled, w*d, w*r*d Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

9 Bigram (k-gram) index Sec A k gram is a sequence of k characters Use as special character $ to denote the beginning or the end of a term In a k gram index, the dictionary contains all k grams that occur in any term in the vocabulary Maintain a second inverted index from bigrams to dictionary terms that match each bigram. Gets terms that match AND version of our wildcard query. Example: word, walled, w*d, w*r*d Ανάκτηση Πληροφορίας SPELLING CORRECTION Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

10 Spell correction Sec. 3.3 Britney Spears Britian spears Britney s spears Brandy spears Pritanny spears (brittany spears) (all corrected in Google) Ανάκτηση Πληροφορίας Spell correction Sec. 3.3 Two principles for correcting: 1. Of various alternatives: choose the nearest one (proximity, distance) 2. When two correctly spelled queries are (nearly) tied, select the most common one (common? #occurrences in the collection, most common among queries typed in by the users) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

11 Spell correction Sec. 3.3 Two principal uses Correcting document(s) being indexed Correcting user queries to retrieve right answers Ανάκτηση Πληροφορίας Sec. 3.3 Document correction Especially needed for OCR ed documents Correction algorithms are tuned for this: rn/m Can use domain specific knowledge E.g., OCR can confuse O and D more often than it would confuse Oand I (adjacent on the QWERTY keyboard, so more likely interchanged in typing). But also: web pages and even printed material has typos Goal: the dictionary contains fewer misspellings But often we don t change the documents but aim to fix the query document mapping Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

12 Query mis-spellings Sec. 3.3 Our principal focus here E.g., the query Alanis Morisett We can either Retrieve documents indexed by the correct spelling, OR Return several suggested alternative queries with the correct spelling Did you mean? Ανάκτηση Πληροφορίας Spell correction Sec. 3.3 Two main flavors: Isolated word Check each word on its own for misspelling Will not catch typos resulting in correctly spelled words e.g., from form Context sensitive Look at surrounding words, e.g., I flew form Heathrow to Narita. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

13 Isolated word correction Sec Fundamental premise there is a lexicon from which the correct spellings come Two basic choices for this A standard lexicon such as Webster s English Dictionary An industry specific lexicon hand maintained The lexicon of the indexed corpus E.g., all words on the web All names, acronyms etc. (Including the mis spellings) Ανάκτηση Πληροφορίας Isolated word correction Sec Given a lexicon and a character sequence Q, return the words in the lexicon closest to Q What s closest? We ll study several alternatives Edit distance (Levenshtein distance) Weighted edit distance n gram overlap Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

14 Edit distance Sec Given two strings S 1 and S 2, the minimum number of operations to convert one to the other Operations are typically character level Insert, Delete, Replace, (Transposition) E.g., the edit distance from dof to dog is 1 From cat to act is 2 (Just 1 with transpose.) from cat to dog is 3. Ανάκτηση Πληροφορίας Edit distance Sec Generally found by dynamic programming. Θα το δούμε στη συνέχεια See for a nice example plus an applet. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

15 Weighted edit distance Sec As above, but the weight of an operation depends on the character(s) involved Meant to capture OCR or keyboard errors, e.g. m more likely to be mis typed as n than as q Therefore, replacing m by n is a smaller edit distance than by q This may be formulated as a probability model Requires weight matrix as input Modify dynamic programming to handle weights Ανάκτηση Πληροφορίας Using edit distances Sec Given query, first enumerate all character sequences within a preset (weighted) edit distance (e.g., 2) 2. Intersect this set with list of correct words 3. Show terms you found to user as suggestions Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

16 Using edit distances Sec Alternatively, We can look up all possible corrections in our inverted index and return all docs slow, or we can run with a single most likely correction The alternatives disempower the user, but save a round of interaction with the user Ανάκτηση Πληροφορίας Using edit distances Sec Google Query: Powr Μήπως εννοείτε: power Εμφάνιση 2 κυριότερων αποτελεσμάτων Power Magazine OnLine Αν έχετε ξεχάσει τα όσα αναφέραμε στο Part II, έχετε το POWER 128 πρόχειρο και πάμε να ξαναδούμε τι γίνεται με τα καυσαέρια, ότανξεμπουκάρουναπότις... Power Test Mitsubishi EVO X by NS Racing Tests Image Gallery Προσωρινά αποθηκευμένη Παρόμοιες Power Wikipedia, the free encyclopedia [ Μετάφραση αυτής της σελίδας ] Power (philosophy), the ability to control one's environment or other entities... Power (physics), the rate at which work is performed or energy is... en.wikipedia.org/wiki/power Προσωρινά αποθηκευμένη Παρόμοιες Αποτελέσματα για τους όρους: powr. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

17 Edit distance to all dictionary terms? Sec Given a (mis spelled) query do we compute its edit distance to every dictionary term? Expensive and slow Alternative? How do we cut the set of candidate dictionary terms? Simple: words that start with the same letter Other possibility : use n gram overlap for this This can also be used by itself for spelling correction. Ανάκτηση Πληροφορίας n-gram overlap Sec Enumerate all the n grams in the query string as well as in the lexicon Use the n gram index (recall wild card search) to retrieve all lexicon terms matching any of the query n grams Threshold by number of matching n grams Variants weight by keyboard layout, etc. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

18 Matching trigrams Sec Consider the query lord we wish to identify words matching 2 of its 3 bigrams (lo, or, rd) lo alone lord sloth or border lord morbid rd ardent border card Standard postings merge will enumerate Ανάκτηση Πληροφορίας Example with trigrams Sec Suppose the text is november Trigrams are nov, ove, vem, emb, mbe, ber. The query is december Trigrams are dec, ece, cem, emb, mbe, ber. So 3 trigrams overlap (of 6 in each term) How can we turn this into a normalized measure of overlap? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

19 One option Jaccard coefficient A commonly-used measure of overlap Let X and Y be two sets; then the J.C. is Sec X Y / X Y Equals 1 when X and Y have the same elements and zero when they are disjoint X and Y don t have to be of the same size Always assigns a number between 0 and 1 Now threshold to decide if you have a match E.g., if J.C. > 0.8, declare a match Ανάκτηση Πληροφορίας Matching trigrams Sec Consider the query lord we wish to identify words matching 2 of its 3 bigrams (lo, or, rd) lo alone lord sloth or border lord morbid rd ardent border card We know the #k grams for the query, for the term (if it is encoded)? just need its length Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

20 Sec Context-sensitive spell correction Text: I flew from Heathrow to Narita. Consider the phrase query flew form Heathrow We d like to respond Did you mean flew from Heathrow? because no docs matched the query phrase. Ανάκτηση Πληροφορίας Sec Context-sensitive correction Need surrounding context to catch this. First idea: 1. retrieve dictionary terms close (in weighted edit distance) to each query term 2. Now try (run) all possible resulting phrases with one word fixed at a time 1. flew from heathrow 2. fled form heathrow 3. flea form heathrow 3. Hit based spelling correction: Suggest the alternative that has lots of hits. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

21 Sec Exercise Suppose that for flew form Heathrow we have 7 alternatives for flew, 19 for form and 3 for heathrow. How many corrected phrases will we enumerate in this scheme? As we expand the alternatives, retain only the most frequent combinations on the collection (biwords) or in the query log Ανάκτηση Πληροφορίας Sec General issues in spell correction We enumerate multiple alternatives for Did you mean? Need to figure out which to present to the user Use heuristics The alternative hitting most docs Query log analysis + tweaking For especially popular, topical queries Spell correction is computationally expensive Avoid running routinely on every query? Run only on queries that matched few docs Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

22 Sec. 3.5 Resources IIR 3, MG 4.2 Efficient spell retrieval: K. Kukich. Techniques for automatically correcting words in text. ACM Computing Surveys 24(4), Dec J. Zobel and P. Dart. Finding approximate matches in large lexicons. Software practice and experience 25(3), March Mikael Tillenius: Efficient Generation and Ranking of Spelling Error Corrections. Master s thesis at Sweden s Royal Institute of Technology. Nice, easy reading on spell correction: Peter Norvig: How to write a spelling corrector correct.html Ανάκτηση Πληροφορίας Pattern Matching Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

23 Searching Allowing Errors Δεδομένα: Ένα κείμενο (string) T, μήκους n Ένα pattern P μήκους m k επιτρεπόμενα σφάλματα Ζητούμενο: Βρες όλες τις θέσεις του κειμένου όπου το pattern P εμφανίζεταιμετοπολύk σφάλματα (ποιο γενικό) Recall: Edit (Levenstein) Distance: Minimum number of character deletions, additions, or replacements needed to make two strings equivalent. misspell to mispell is distance 1 misspell to mistell is distance 2 misspell to misspelling is distance 3 Ανάκτηση Πληροφορίας Searching Allowing Errors Naïve algorithm Produce all possible strings that could match P (assuming k errors) and search each one of them on T Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

24 Searching Allowing Errors: Solution using Dynamic Programming Dynamic Programming is the class of algorithms, which includes the most commonly used algorithms in speech and language processing. Among them the minimum edit distance algorithm for spelling error correction. Intuition: a large problem can be solved by properly combining the solutions to various subproblems. Ανάκτηση Πληροφορίας Searching Allowing Errors: Solution using Dynamic Programming Έναν m x n πίνακα C Γραμμές θέσεις του pattern Στήλες θέσεις του text C[i, j]: ο ελάχιστος αριθμός λαθών για να ταιριάξουμε το P 1..i με ένα sufix του T 1..j C[0, j] = 0 C[i, 0] = i /* delete i characters Η ιδέα είναι ο υπολογισμός μιας τιμής του πίνακα με βάση τις προηγούμενες (δηλαδή, ήδη υπολογισμένες) γειτονικές της Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

25 Searching Allowing Errors: Solution using Dynamic Programming C[i, j]: ο ελάχιστος αριθμός λαθών για να ταιριάξουμε το P 1..i με ένα suffix του T 1..j C[i, j] = αν P i = T i τότε C[i 1, j 1] Αλλιώς ο καλύτερος τρόπος από τα παρακάτω replace P i με Τ i (ή το συμμετρικό) κόστος 1+C[i 1,j 1] delete P i κόστος 1+ C[i I, j] delete T i 1 + C[i,j 1] add?? Ανάκτηση Πληροφορίας Searching Allowing Errors: Solution using Dynamic Programming (II) Problem Statement: T[n] text string, P[m] pattern, k errors Example: T = surgery, P = survey, k=2 To explain the algorithm we will use a m x n matrix C one row for each char of P, one column for each char of T (latter on we shall see that we need less space) T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

26 Searching Allowing Errors: Solution using Dynamic Programming (III) T = surgery, P = survey, k=2 οι γραμμές του C εκφράζουνπόσα γράμματα του pattern έχουμεήδη καταναλώσει (στη 0 γραμμή τίποτα, στη m γραμμή ολόκληρο το pattern) C[0,j] := 0 for every column j (no letter of P has been consumed) C[i,0] := i for every row i (i chars of P have been consumed, pointer of T at 0. So i errors (insertions) so far) T P Ανάκτηση Πληροφορίας Searching Allowing Errors: Solution using Dynamic Programming (IV) if P[i]=T[j] THEN C[i,j] := C[i 1,j 1] // εγινε match άρα τα λάθη ήταν όσα και πριν Else C[i,j] := 1 + min of: C[i 1,j] // i 1 chars consumed P, j chars consumed of T // ~delete a char from T C[i,j 1] // i chars consumed P, j 1 chars consumed of T // ~ delete a char from P C[i 1,j 1] // i 1 chars consumed P, j 1 chars consumed of T // ~ character replacement Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

27 Searching Allowing Errors: Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

28 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

29 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P 1 + Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P 1 + Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

30 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P 1 + Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

31 Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Bold entries indicate matching positions. Cost: O(mn) time where m and n are the lengths of the two strings being compared. Παρατήρηση: η πολυπλοκότητα είναι ανεξάρτητη του κ Ανάκτηση Πληροφορίας Solution using Dynamic Programming: Example T = surgery, P = survey, k=2 T P Cost: O(mn) time where m and n are the lengths of the two strings being compared. O(m) space as we need to keep only the previous column stored So we don't have to keep a mxn matrix Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

32 Εφαρμογή στο groogle Ανάκτηση Πληροφορίας Constructing an Inverted File Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

33 Content Hardware basics Blocked sort-based index Distributed index Dynamic Indexing Ανάκτηση Πληροφορίας Ch. 4 Index construction How do we construct an index? What strategies can we use with limited main memory? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

34 Sec. 4.1 Hardware basics Many design decisions in information retrieval are based on the characteristics of hardware We begin by reviewing hardware basics Ανάκτηση Πληροφορίας Sec. 4.1 Hardware basics Access to data in memory is much faster than access to data on disk. Caching (keeping frequently used disk data in memory) Disk seeks: No data is transferred from disk while the disk head is being positioned. (seek time) Therefore: Transferring one large chunk of data from disk to memory is faster than transferring many small chunks. Disk I/O is block based: Reading and writing of entire blocks (as opposed to smaller chunks). Block sizes: 8KB to 256 KB. Data transfers are handled by the system bus, not by the processor Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

35 Sec. 4.1 Hardware basics Servers used in IR systems now typically have several GB of main memory, sometimes tens of GB. Available disk space is several (2 3) orders of magnitude larger. Fault tolerance is very expensive: It s much cheaper to use many regular machines rather than one fault tolerant machine. Ανάκτηση Πληροφορίας Sec. 4.1 Hardware assumptions symbol statistic value s average seek time 5 ms = 5 x 10 3 s b transfer time per byte 0.02 μs= 2 x 10 8 s processor s clock rate 10 9 s 1 p low level operation 0.01 μs= 10 8 s (e.g., compare & swap a word) size of main memory several GB size of disk space 1 TB or more Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

36 Sec. 4.2 RCV1: Our collection for this lecture As an example for applying scalable index construction algorithms, we will use the Reuters RCV1 collection. This is one year of Reuters newswire (part of 1995 and 1996) The collection we ll use isn t really large enough either, but it s publicly available and is at least a more plausible example. Ανάκτηση Πληροφορίας Sec. 4.2 A Reuters RCV1 document Note: we ignore multimedia types Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

37 Sec. 4.2 Reuters RCV1 statistics symbol statistic value N documents 800,000 L avg. # tokens per doc 200 M terms (= word types/distinct) 400,000 avg. # bytes per token 6 (incl. spaces/punct.) avg. # bytes per token 4.5 (without spaces/punct.) avg. # bytes per term 7.5 T (tokens) non positional postings 100,000, bytes per word token vs. 7.5 bytes per word type: why? Ανάκτηση Πληροφορίας Sec. 4.2 Recall IIR 1 index construction Term Doc # I 1 did 1 enact 1 julius 1 caesar 1 Documents are parsed to extract words and these are I 1 saved with the Document ID. was 1 killed 1 i' 1 the 1 capitol 1 brutus 1 killed 1 me 1 Doc 1 Doc 2 so 2 let 2 it 2 I did enact Julius So let it be with be 2 with 2 Caesar I was killed Caesar. The noble caesar 2 the 2 i' the Capitol; Brutus hath told you noble 2 brutus 2 Brutus killed me. Caesar was ambitious hath 2 told 2 you 2 caesar 2 Ανάκτηση Πληροφορίας was 2 74 ambitious 2 Ανάκτηση Πληροφορίας

38 Sec. 4.2 Key step After all documents have been parsed, the inverted file is sorted by terms. We focus on this sort step. We have 100M items to sort. Note: present terms by termid (on the fly or in two passes) Term Doc # I 1 did 1 enact 1 julius 1 caesar 1 I 1 was 1 killed 1 i' 1 the 1 capitol 1 brutus 1 killed 1 me 1 so 2 let 2 it 2 be 2 with 2 caesar 2 the 2 noble 2 brutus 2 hath 2 told 2 you 2 caesar 2 was 2 ambitious 2 Term Doc # ambitious 2 be 2 brutus 1 brutus 2 capitol 1 caesar 1 caesar 2 caesar 2 did 1 enact 1 hath 1 I 1 I 1 i' 1 it 2 julius 1 killed 1 killed 1 let 2 me 1 noble 2 so 2 the 1 the 2 told 2 you 2 was 1 was 2 with 2 Ανάκτηση Πληροφορίας Sec. 4.2 Scaling index construction In memory index construction does not scale. How can we construct an index for very large collections? Taking into account the hardware constraints we just learned about... Memory, disk, speed, etc. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

39 Sort-based index construction As we build the index, we parse docs one at a time. Sec. 4.2 While building the index, we cannot easily exploit compression tricks (you can, but much more complex) The final postings for any term are incomplete until the end. At 12 bytes per non positional postings entry (term, doc, freq), demands a lot of space for large collections. T = 100,000,000 in the case of RCV1 So we can do this in memory in 2009, but typical collections are much larger. E.g. the New York Times provides an index of >150 years of newswire Thus: We need to store intermediate results on disk. Ανάκτηση Πληροφορίας Sec. 4.2 Use the same algorithm for disk? Sorting T = 100,000,000 records on disk is too slow too many disk seeks. We need an external sorting algorithm. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

40 Sec. 4.2 Bottleneck Parse and build postings entries one doc at a time Now sort postings entries by term (then by doc within each term) Doing this with random disk seeks would be too slow must sort T=100M records If every comparison took 2 disk seeks, and N items could be sorted with N log 2 N comparisons, how long would this take? Ανάκτηση Πληροφορίας BSBI: Blocked sort-based Indexing (Sorting with fewer disk seeks) Sec byte (4+4+4) records (term, doc, freq). These are generated as we parse docs. Must now sort 100M such 12 byte records by term. Define a Block ~ 10M such records Can easily fit a couple into memory. Will have 10 such blocks to start with. Basic idea of algorithm: 1. Accumulate postings for each block, sort, write to disk. 2. Then merge the blocks into one long sorted order. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

41 Sec. 4.2 Ανάκτηση Πληροφορίας Sec. 4.2 Sorting 10 blocks of 10M records First, read each block and sort within: Quicksort takes 2N ln N expected steps In our case 2 x (10M ln 10M) steps total time to read each block from disk and quicksort it. 10 times this estimate gives us 10 sorted runs of 10M records each. Done straightforwardly, need 2 copies of data on disk But can optimize this Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

42 Sec. 4.2 Ανάκτηση Πληροφορίας Sec. 4.2 How to merge the sorted runs? Can do binary merges, with a merge tree of log 2 10 = 4 layers. During each layer, read into memory runs in blocks of 10M, merge, write back Merged run. Runs being merged. Disk 4 Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

43 Sec. 4.2 How to merge the sorted runs? But it is more efficient to do a n way merge, where you are reading from all blocks simultaneously Providing you read decent sized chunks of each block into memory and then write out a decent sized output chunk, then you re not killed by disk seeks Ανάκτηση Πληροφορίας Remaining problem with sort-based algorithm Sec. 4.3 Our assumption was: we can keep the dictionary in memory. We need the dictionary (which grows dynamically) in order to implement a term to termid mapping. Actually, we could work with term,docid postings instead of termid,docid postings but then intermediate files become very large. (We would end up with a scalable, but very slow index construction method.) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

44 SPIMI: Single-pass in-memory indexing Sec. 4.3 Key idea 1: Generate separate dictionaries for each block no need to maintain term termid mapping across blocks. Key idea 2: Don t sort. Accumulate postings in postings lists as they occur. With these two ideas we can generate a complete inverted index for each block. These separate indexes can then be merged into one big index. Ανάκτηση Πληροφορίας SPIMI-Invert Sec. 4.3 Merging of blocks is analogous to BSBI. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

45 SPIMI: Compression Sec. 4.3 Compression makes SPIMI even more efficient. Compression of terms Compression of postings Ανάκτηση Πληροφορίας Vocabulary: Tries Vocabulary: Btree but also trie Tries multiway trees for stroring strings able to retrieve any string in time proportional to its length (independent from the number of all stored strings) Description every edge is labeled with a letter searching a string s start from root and for each character of s followtheedgethatislabeledwith the same letter. continue, until a leaf is found (which means that s is found) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

46 Tries: Παράδειγμα This is a text. A text has many words. Words are made from letters. Vocabulary text (11) text (19) many (28) words (33) words (40) made (50) letters (60) Vocabulary (ordered) letters (60) made (50) many (28) text (11,19) words (33,40) Vocabulary trie l m a t w letters:60 made:50 many:28 text:11,19 words:33,40 Ερώτηση: Θα μπορούσε ένα trie να βοηθήσει τη στελέχωση κειμένου βάσει της τεχνικής Successor variety? d n Ανάκτηση Πληροφορίας Παράδειγμα αυξητικής δημιουργίας ενός trie Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

47 Constructing an Inverted File All the vocabulary is kept in a suitable data structure storing for each word a list of its occurrences e.g. in a trie data structure Each word of the text is read and searched in the vocabulary if a trie data structure is used then this search costs O(m) where m the size of the word If it is not found, it is added to the vocabulary with an empty list of occurrences and the new position is added to the end of its list of occurrences Ανάκτηση Πληροφορίας Constructing an Inverted File Once the text is exhausted the vocabulary is written to disk with the list of occurrences. Two files are created: in the first file, the list of occurrences are stored contiguously in the second file, the vocabulary is stored in lexicographical order and, for each word, a pointer to its list in the first file is also included. The overall process is O(n) time 2 nd file 1 st file Trie: O(1) per text character Since positions are appended (in the postings file) O(1) time It follows that the overall process is O(n) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

48 Example of constructing an inverted file (in our example we assume that: each word = one document, position = document identifier ) Once the complete trie structure is constructed theinvertedfilecanbe derived from it: The trie is traversed topdown and left to right. whenever an index term is encountered, it is added to the end of the inverted file. Note that if a term is prefix of another term (such as "a" is prefix of "are") index terms can occur on internal nodes of the trie. analogously the posting file is derived. Ανάκτηση Πληροφορίας Example (cont) The trie structure constructed is a possible access structure to the index file in main memory. Thus the entries of the index files occur as leaves (or internal nodes) of the trie. Each entry has a reference to the position of the postings file that is held in secondary storage. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

49 What if the Inverted Index does not fit in main memory? A technique based on partial Indexes: Use the previous algorithm until the main memory is exhausted. When no more memory is available, write to disk the partial index I i obtained up to now, and erase it from main memory Continue with the rest of the text Once the text is exhausted, a number of partial indices I i exist on disk The partial indices are merged to obtain the final index Ανάκτηση Πληροφορίας Merging two partial indices I1 and I2 Merge the sorted vocabularies and whenever the same word appears in both indices, merge both list of occurences By construction, the occurences of the smaller numbered index are before those at the larger numbered index, therefore the lists are just concatenated Complexity: O(n1+n2) where n1 and n2 the sizes of the indices Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

50 Example of two partial indices and their merging Ανάκτηση Πληροφορίας Merging partial indices to obtain the final I final index 7 level 3 I I level 2 I I I I I 1 I 2 I 3 I 4 I 5 I 6 I 7 I 8 level 1 initial dumps Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

51 Merging all partial indices: Time Complexity Notations n: the size of the text V:the size of the vocabulary M: the amount of main memory available The total time to generate partial indices is O(n) The number of partial indices is O(n/M) To merge the O(n/M) partial indices are necessary log 2 (n/m) merging levels The total cost of this algorithm is O(n log(n/m)) Ανάκτηση Πληροφορίας Sec. 4.4 Distributed indexing Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

52 Distributed indexing Sec. 4.4 For web scale indexing (don t try this at home!): must use a distributed computing cluster Individual machines are fault prone Can unpredictably slow down or fail How do we exploit such a pool of machines? Ανάκτηση Πληροφορίας Distributed indexing Sec. 4.4 Web search engines, therefore, use distributed indexing algorithms for index construction. Constructed index is partitioned across several machines either according to term or according to document. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

53 Sec. 4.4 Google data centers Google data centers mainly contain commodity machines. Data centers are distributed around the world. Estimate: a total of 1 million servers, 3 million processors/cores (Gartner 2007) Estimate: Google installs 100,000 servers each quarter. Based on expenditures of million dollars per year This would be 10% of the computing capacity of the world!?! Ανάκτηση Πληροφορίας Sec. 4.4 Google data centers If in a non fault tolerant system with 1000 nodes, each node has 99.9% uptime, what is the uptime of the system? Answer: 63% Calculate the number of servers failing per minute for an installation of 1 million servers. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

54 Sec. 4.4 Distributed indexing Maintain a master machine directing the indexing job considered safe. Break up indexing into sets of (parallel) tasks. Master machine assigns each task to an idle machine from a pool Divide data into chunks, re assign task if a task on a chunk fails Ανάκτηση Πληροφορίας Sec. 4.4 Parallel tasks We will use two sets of parallel tasks Parsers Inverters Break the input document collection into splits Each split is a subset of documents (corresponding to blocks in BSBI/SPIMI) Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

55 Sec. 4.4 Parsers Master assigns a split to an idle parser machine Parser 1. reads a document at a time and emits (term, doc) pairs 2. writes pairs into j partitions Each partition is for a range of terms first letters (e.g., a f, g p, q z) here j = 3. Now to complete the index inversion Ανάκτηση Πληροφορίας Sec. 4.4 Inverters An inverter collects all (term,doc) pairs (= postings) for one termpartition. Sorts and writes to postings lists Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

56 Sec. 4.4 Data flow assign Master assign Postings Parser a-f g-p q-z Inverter a-f Parser a-f g-p q-z Inverter g-p splits Parser a-f g-p q-z Inverter q-z Map phase Segment files Reduce phase Ανάκτηση Πληροφορίας Sec. 4.4 MapReduce The index construction algorithm we just described is an instance of MapReduce. MapReduce (Dean and Ghemawat 2004) is a robust and conceptually simple framework for distributed computing without having to write code for the distribution part. They describe the Google indexing system (ca. 2002) as consisting of a number of phases, each implemented in MapReduce. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

57 Sec. 4.4 MapReduce Index construction was just one phase. Another phase: transforming a term partitioned index into a document partitioned index. Term partitioned: one machine handles a subrange of terms Document partitioned: one machine handles a subrange of documents most search engines use a document partitioned index better load balancing, etc. Ανάκτηση Πληροφορίας Sec. 4.4 MapReduce To minimize write times, before inverters reduce the data, each parser writes its segment files to its local disk. In the reduce phase, the master communicates to an inverter the locations of the relevant segment files (e.g., of the r segment files of the a f partition). Each segment file only requires one sequential read because all data relevant to a particular inverter were written to a single segment file by the parser. This setup minimizes the amount of network traffic needed during indexing. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

58 Schema for index construction in MapReduce (Key, Value) pairs Sec. 4.4 Schema of map and reduce functions map: input list(k, v) reduce: (k,list(v)) output Instantiation of the schema for index construction map: web collection list(termid, docid) reduce: (<termid1, list(docid)>, <termid2, list(docid)>, ) (postings list1, postings list2, ) Example for index construction map: d2 : C died. d1 : C came, C c ed. (<C, d2>, <died,d2>, <C,d1>, <came,d1>, <C,d1>, <c ed, d1> reduce: (<C,(d2,d1,d1)>, <died,(d2)>, <came,(d1)>, <c ed,(d1)>) (<C,(d1:2,d2:1)>, <died,(d2:1)>, <came,(d1:1)>, <c ed,(d1:1)>) Ανάκτηση Πληροφορίας Sec. 4.4 Dynamic indexing Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

59 Sec. 4.5 Dynamic indexing Up to now, we have assumed that collections are static. They rarely are: Documents come in over time and need to be inserted. Documents are deleted and modified. This means that the dictionary and postings lists have to be modified: Postings updates for terms already in dictionary New terms added to dictionary Ανάκτηση Πληροφορίας Sec. 4.5 Simplest approach Maintain big main index New docs go into small auxiliary index Search across both, merge results Deletions Invalidation bit vector for deleted docs Filter docs output on a search result by this invalidation bit vector Periodically, re index into one main index Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

60 Sec. 4.5 Issues with main and auxiliary indexes Problem of frequent merges you touch stuff a lot Poor performance during merge Actually: Merging of the auxiliary index into the main index is efficient if we keep a separate file for each postings list. Merge is the same as a simple append. But then we would need a lot of files inefficient for O/S. Assumption for the rest of the lecture: The index is one big file. In reality: Use a scheme somewhere in between (e.g., split very large postings lists, collect postings lists of length 1 in one file etc.) Ανάκτηση Πληροφορίας Logarithmic merge Sec. 4.5 Maintain a series of indexes, each twice as large as the previous one. Keep smallest (Z 0 ) in memory Larger ones (I 0, I 1, ) on disk If Z 0 gets too big (> n), write to disk as I 0 or merge with I 0 (if I 0 already exists) as Z 1 Either write merge Z 1 to disk as I 1 (if no I 1 ) Or merge with I 1 to form Z 2 etc. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

61 Sec. 4.5 Ανάκτηση Πληροφορίας Sec. 4.5 Logarithmic merge Auxiliary and main index: index construction time is O(T 2 ) as each posting is touched in each merge. Logarithmic merge: Each posting is merged O(log T) times, so complexity is O(T log T) So logarithmic merge is much more efficient for index construction But query processing now requires the merging of O(log T) indexes Whereas it is O(1) if you just have a main and auxiliary index Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

62 Sec. 4.5 Further issues with multiple indexes Collection wide statistics are hard to maintain E.g., when we spoke of spell correction: which of several corrected alternatives do we present to the user? We said, pick the one with the most hits How do we maintain the top ones with multiple indexes and invalidation bit vectors? One possibility: ignore everything but the main index for such ordering Will see more such statistics used in results ranking Ανάκτηση Πληροφορίας Sec. 4.5 Dynamic indexing at search engines All the large search engines now do dynamic indexing Their indices have frequent incremental changes News items, blogs, new topical web pages Sarah Palin, But (sometimes/typically) they also periodically reconstruct the index from scratch Query processing is then switched to the new index, and the old index is then deleted Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

63 Sec. 4.5 Ανάκτηση Πληροφορίας Sec. 4.5 Other sorts of indexes Positional indexes Same sort of sorting problem just larger Building character n gram indexes: As text is parsed, enumerate n grams. For each n gram, need pointers to all dictionary terms containing it the postings. Note that the same postings entry will arise repeatedly in parsing the docs need efficient hashing to keep track of this. E.g., that the trigram uou occurs in the term deciduous will be discovered on each text occurrence of deciduous Only need to process each term once Why? Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

64 Maintaining the Inverted File Addition of a new doc build its index and merge it with the final index (as done with partial indexes) Delete a doc of the collection scan index and delete those occurrences that point into the deleted file (complexity: O(n) : extremely expensive!) Ανάκτηση Πληροφορίας A Complete Search System Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

65 Sec Cluster pruning: query processing Process a query as follows: Given query Q, find its nearest leader L. Seek K nearest docs from among L s followers. Ανάκτηση Πληροφορίας Sec Visualization Query Leader Follower Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

66 Sec Why use random sampling Fast Leaders reflect data distribution Ανάκτηση Πληροφορίας Sec General variants Have each follower attached to b 1 =3 (say) nearest leaders. From query, find b 2 =4 (say) nearest leaders and their followers. Can recur on leader/follower construction. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

67 Top-k Aggregation Ανάκτηση Πληροφορίας Top k Rank Aggregation Έχουμε Ν αντικείμενα και τους βαθμούς τους βάσει m διαφορετικών κριτηρίων. Έχουμε έναν τρόπο να συνδυάζουμε τα m σκορ κάθε αντικειμένου σε ένα ενοποιημένο σκορ π.χ. min, avg, sum Στόχος: Βρες τα κ αντικείμενα με το υψηλότερο ενοποιημένο σκορ. Εφαρμογές: Υπολογισμός των κορυφαίων κ στοιχείων της απάντησης ενός ΣΑΠ που βασίζεται στο διανυσματικό μοντέλο (τα m κριτήρια είναι οι m όροι της επερώτησης) ενός μεσίτη (π.χ. μετα μηχανής αναζήτησης) πάνω από m Συστήματα Ανάκτησης Πληροφοριών μιας επερώτησης σε μια Βάση Πολυμέσων κριτήρια (και συνάμα χαρακτηριστικά/features): χρώμα, μορφή, υφή, Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

68 Άλλο ένα παράδειγμα εφαρμογής Ενοποίηση απαντήσεων σε Μεσολαβητές (middleware) πάνω από πηγές που αποθηκεύουν δομημένες πληροφορίες έστω μια υπηρεσία εύρεσης εστιατορίων βάσει τριών κριτηρίων: απόσταση από ένα σημείο κατάταξη εστιατορίου τιμή γεύματος, και άλλα όπου ο χρήστης μπορεί να ορίσει τον επιθυμητό τρόπο υπολογισμού του ενοποιημένου σκορ ενός εστιατορίου π.χ. Σκορ(εστΧ) = Stars(εστΧ)* *DistanceFromHome(εστΧ) η υπηρεσία αυτή υλοποιείται με χρήση τριών απομακρυσμένων υπηρεσιών (α) getrestaurantsbystars επιστρέφει όλα τα εστιατόρια σε φθίνουσα σειρά ως προς τα αστέρια που έχουν (κάθε εστιατόριο συνοδεύεται με ένα σκορ) (β) getrestaurantsbydistance(x,y) επιστρέφει όλα τα εστιατόρια σε φθίνουσα σειρά ως προς την απόσταση τους από ένα συγκεκριμένο σημείο με συντεταγμένες (x,y) // κάθε εστιατόριο συνοδεύεται από την απόσταση του από το (x,y) Ανάκτηση Πληροφορίας Άλλο ένα παράδειγμα εφαρμογής Πως μπορώ να ελαχιστοποιήσω το πλήθος των στοιχείων που πρέπει να διαβάσω από την απάντηση της κάθε υπηρεσίας, προκειμένου να βρω τα κορυφαία 5 εστιατόρια (βάσει σκορ όπως υπολογίζεται από της συνάρτηση βαθμολόγησης που έδωσε ο χρήστης); Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

69 Εύρεση των κ-κορυφαίων Απλοϊκός Αλγόριθμος 1. Ανέκτησε ολόκληρες τις m λίστες 2. Υπολόγισε το ενοποιημένο σκορ του κάθε αντικειμένου 3. Ταξινόμησε τα αντικείμενα βάσει του σκορ και επέλεξε τα πρώτα κ Παρατηρήσεις Κόστος γραμμικό ως προς το μήκος των λιστών Δεν αξιοποιεί το γεγονός ότι οι λίστες είναι ταξινομημένες Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Παράδειγμα: Απλοϊκός Τρόπος Έστω ότι θέλουμε να συναθροίσουμε τις διατάξεις που επιστρέφουν 3 πηγές S1, S2, S3 και ο τρόπος συνάθροισης είναι το άθροισμα. S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Ο Απλοϊκός Τρόπος Score(Α) = = 2.4 Score(B) = = 2 Score(C) = = 2.1 Score(E) = = 2.2 Score(F) = = 1.7 Score(G) = = 1.5 Score(H) = = 1.5 Τελική διάταξη: < A, E, C, B, F, G, H> Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

70 Εύρεση των κ-κορυφαίων Πιο Αποδοτικοί Αλγόριθμοι Γενική ιδέα: Άρχισε να διαβάζεις τις διατάξεις από την κορυφή. Προσπάθησε να καταλάβεις πότε πρέπει να σταματήσεις. Αλγόριθμοι Fagin Algorithm (FA) [Fagin 1999, J. CSS 58] Threshold Algorithm (ΤΑ) [Fagin et al., PODS 2001] Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Πιο Αποδοτικοί Αλγόριθμοι Υποθέσεις 1. Υποθέτουμε ότι έχουμε στη διάθεση μας 2 τρόπους πρόσβασης στα αποτελέσματα μιας πηγής: Σειριακή πρόσβαση στις διατάξεις: φθίνουσαωςπροςτοσκορ Τυχαία προσπέλαση: Δυνατότητα εύρεσης του σκορ ενός συγκεκριμένου αντικειμένου με μία πρόσβαση 2. Συναρτήσεις βαθμολόγησης (σκορ) Τα σκορ ανήκουν στο διάστημα [0,1] Η συνάρτηση ενοποιημένου σκορ είναι μονότονη αν όλα (m) τα σκορ ενός αντικειμένου Α είναι μεγαλύτερα ή ίσα των αντίστοιχων σκορ ενός αντικειμένου Β, τότε σίγουρα το ενοποιημένο σκορ του Α είναι μεγαλύτερο ή ίσο του σκορ του Β Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

71 Εύρεση των κ-κορυφαίων ΟΑλγόριθμοςτουFagin (FA) [1999] 1.α/ Κάνε σειριακή ανάκτηση αντικειμένων από κάθε λίστα (αρχίζοντας από την κορυφή), έως η τομή των αντικειμένων από κάθε λίσταναέχεικαντικείμενα 1.β/ Για κάθε αντικείμενο που ανακτήθηκε (στο 1.α) συνέλεξε τα σκορ που λείπουν (με χρήση του μηχανισμού τυχαίας προσπέλασης) 2/ Υπολόγισε το ενοποιημένο σκορ του κάθε αντικειμένου 3/ Ταξινόμησε τα αντικείμενα βάσει του ενοποιημένου σκορ και επέλεξε τα πρώτα κ Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Ο Αλγόριθμος του Fagin (FA) [1999] Για οποιοδήποτε μη επιλεγμένο αντικείμενο υπάρχουν (τουλάχιστον) κ που είναι καλύτερα από αυτό Σχόλια Αξιοποιεί (α) το γεγονός ότι οι λίστες είναι ταξινομημένες και (β) ότι η συνάρτηση ενοποίησης είναι μονότονη [ ] Το πλήθος των αντικειμένων που θα ανακτηθούν μπορεί να είναι μεγάλο Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

72 Εύρεση των κ-κορυφαίων Παράδειγμα: Αλγόριθμος του Fagin (FA) S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Έστω ότι θέλω το Top 1 Το Ε εμφανίζεται σε όλες (μονοτονία => δεν μπορεί κάποιο δεξιότερο του Ε να είναι καλύτερο του Ε Το Ε δεν είναι σίγουρα ο νικητής. Υποψήφιοι νικητές = {A, B, C, E, F}. Κάνουμε τυχαίες προσπελάσεις για vαβρούμετασκορ που μας λείπουν getscore(s2,a), getscore(s1,b), getscore(s3,b), getscore(s2,c), Πράγματι, top 1= {Α} Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Παράδειγμα: Αλγόριθμος του Fagin (FA) S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Έστω ότι θέλω το Top 2 Το Ε, B (και το Α) εμφανίζονται σε όλες (μονοτονία => δεν μπορεί κάποιο δεξιότερο του Β να είναι καλύτερο του Β Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

73 Εύρεση των κ-κορυφαίων Ο Αλγόριθμος ΤΑ (Threshold Algorithm) [Fagin et al. 2001] Ιδέα: Υπολόγισε το μέγιστο σκορ που μπορεί να έχει ένα αντικείμενο που δεν έχουμε συναντήσει ακόμα. 1/ Κάνε σειριακή ανάκτηση αντικειμένων από κάθε λίστα (αρχίζοντας από την κορυφή) και με χρήση τυχαίας προσπέλασης βρεςόλατασκορκάθε αντικειμένου 2/ Ταξινόμησε τα αντικείμενα (βάσει του ενοποιημένου σκορ) και κράτησε τα καλύτερα κ 3/ Σταμάτησε την σειριακή ανάκτηση όταν τα σκορ των παραπάνω κ αντικειμένων δεν μπορεί να είναι μικρότερα του μέγιστου πιθανού σκορ των απαρατήρητων αντικειμένων (threshold). Ανάκτηση Πληροφορίας Εύρεση των κ-κορυφαίων Παράδειγμα: Αλγόριθμος TA: S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Score(A) = = 2.4 Score(B) = = 2 UpperBound = = 2.7 αφού 2.7 > 2.4 συνεχίζω Έστω ότι θέλω το Top 1 Score(C) = = 2.1 Score(E) = = 2.2 UpperBound = = 2.4 αφού 2.4 δεν είναι μεγαλύτερο του 2.4 (σκορ του Α) σταματάω. Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 7η: 21/03/2016 1 Ch. 4 Κατασκευή του ευρετηρίου Πώς κατασκευάζουμε το ευρετήριο; Ποιες στρατηγικές μπορούμε ν ακολουθήσουμε

Διαβάστε περισσότερα

4. Κατασκευή Ευρετηρίου

4. Κατασκευή Ευρετηρίου Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 4. Κατασκευή Ευρετηρίου Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων Πλάνο Προηγούμενο

Διαβάστε περισσότερα

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός Ανάκληση Πληροφορίας Information Retrieval Διδάσκων Δημήτριος Κατσαρός Διάλεξη 6η: 05/03/2014 1 WILD-CARD QUERIES 2 Sec. 3.2 Wild-card queries: * mon*: find all docs containing any word beginning mon.

Διαβάστε περισσότερα

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός Ανάκληση Πληροφορίας Information Retrieval Διδάσκων Δημήτριος Κατσαρός Διάλεξη 5η: 26/02/2014 1 Phrase queries 2 Phrase queries Want to answer queries such as stanford university as a phrase Thus the sentence

Διαβάστε περισσότερα

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible. B-Trees Index files can become quite large for large main files Indices on index files are possible 3 rd -level index 2 nd -level index 1 st -level index Main file 1 The 1 st -level index consists of pairs

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Ανάκτηση

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 6η: 08/03/2016 1 Διόρθωση πληκτρολόγησης 2 Sec. 3.3 Διόρθωση πληκτρολόγησης Δυο κύριες χρήσεις Διόρθωση εγγράφων που θα εισαχθούν

Διαβάστε περισσότερα

Homework 3 Solutions

Homework 3 Solutions Homework 3 Solutions Igor Yanovsky (Math 151A TA) Problem 1: Compute the absolute error and relative error in approximations of p by p. (Use calculator!) a) p π, p 22/7; b) p π, p 3.141. Solution: For

Διαβάστε περισσότερα

2 Composition. Invertible Mappings

2 Composition. Invertible Mappings Arkansas Tech University MATH 4033: Elementary Modern Algebra Dr. Marcel B. Finan Composition. Invertible Mappings In this section we discuss two procedures for creating new mappings from old ones, namely,

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Ανάκτηση

Διαβάστε περισσότερα

EE512: Error Control Coding

EE512: Error Control Coding EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3

Διαβάστε περισσότερα

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Συστήματα Διαχείρισης Βάσεων Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 5: Tutorial on External Sorting Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών TUTORIAL ON EXTERNAL SORTING

Διαβάστε περισσότερα

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Συστήματα Διαχείρισης Βάσεων Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 9: Transactions - part 1 Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών Tutorial on Undo, Redo and Undo/Redo

Διαβάστε περισσότερα

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS CHAPTER 5 SOLVING EQUATIONS BY ITERATIVE METHODS EXERCISE 104 Page 8 1. Find the positive root of the equation x + 3x 5 = 0, correct to 3 significant figures, using the method of bisection. Let f(x) =

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011 Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ανεκτική αναζήτηση. ηµιουργία Ευρετηρίου. ιδάσκων ηµήτριος Κατσαρός, Ph.D.

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ανεκτική αναζήτηση. ηµιουργία Ευρετηρίου. ιδάσκων ηµήτριος Κατσαρός, Ph.D. Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 2η: 21/02/2007 1 Ανεκτική αναζήτηση & ηµιουργία

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 2η: 21/02/2007 1 Ανεκτική αναζήτηση & ηµιουργία

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Να γραφεί πρόγραμμα το οποίο δέχεται ως είσοδο μια ακολουθία S από n (n 40) ακέραιους αριθμούς και επιστρέφει ως έξοδο δύο ακολουθίες από θετικούς ακέραιους

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηριασμός, Αποθήκευση και Οργάνωση Αρχείων Κειμένων (Indexing,

Διαβάστε περισσότερα

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι She selects the option. Jenny starts with the al listing. This has employees listed within She drills down through the employee. The inferred ER sttricture relates this to the redcords in the databasee

Διαβάστε περισσότερα

Elements of Information Theory

Elements of Information Theory Elements of Information Theory Model of Digital Communications System A Logarithmic Measure for Information Mutual Information Units of Information Self-Information News... Example Information Measure

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή

Διαβάστε περισσότερα

Μηχανική Μάθηση Hypothesis Testing

Μηχανική Μάθηση Hypothesis Testing ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Μηχανική Μάθηση Hypothesis Testing Γιώργος Μπορμπουδάκης Τμήμα Επιστήμης Υπολογιστών Procedure 1. Form the null (H 0 ) and alternative (H 1 ) hypothesis 2. Consider

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

TMA4115 Matematikk 3

TMA4115 Matematikk 3 TMA4115 Matematikk 3 Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet Trondheim Spring 2010 Lecture 12: Mathematics Marvellous Matrices Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :

Διαβάστε περισσότερα

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1.

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1. Exercises 0 More exercises are available in Elementary Differential Equations. If you have a problem to solve any of them, feel free to come to office hour. Problem Find a fundamental matrix of the given

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Δημήτρης Πλεξουσάκης. Physical DB Design

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Δημήτρης Πλεξουσάκης. Physical DB Design Data Structures for Primary Indices Structures that determine the location of the records of a file A primary index is based on a key; the location of a record is determined by its key value. Most common

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ting Zhang Stanford May 11, 2001 Stanford, 5/11/2001 1 Outline Ordinal Classification Ordinal Addition Ordinal Multiplication Ordinal

Διαβάστε περισσότερα

Math 6 SL Probability Distributions Practice Test Mark Scheme

Math 6 SL Probability Distributions Practice Test Mark Scheme Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ Άνοιξη I. ΜΗΛΗΣ

ΑΛΓΟΡΙΘΜΟΙ  Άνοιξη I. ΜΗΛΗΣ ΑΛΓΟΡΙΘΜΟΙ http://eclass.aueb.gr/courses/inf161/ Άνοιξη 216 - I. ΜΗΛΗΣ ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΑΛΓΟΡΙΘΜΟΙ - ΑΝΟΙΞΗ 216 - Ι. ΜΗΛΗΣ 9 DP II 1 Dynamic Programming ΓΕΝΙΚΗ ΙΔΕΑ 1. Ορισμός υπο-προβλήματος/ων

Διαβάστε περισσότερα

LECTURE 2 CONTEXT FREE GRAMMARS CONTENTS

LECTURE 2 CONTEXT FREE GRAMMARS CONTENTS LECTURE 2 CONTEXT FREE GRAMMARS CONTENTS 1. Developing a grammar fragment...1 2. A formalism that is too strong and too weak at the same time...3 3. References...4 1. Developing a grammar fragment The

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη Ευρετήρια Βάσεις Δεδομένων Διδάσκων: Μαρία Χαλκίδη Βασικές έννοιες Οι μηχανισμοί δεικτοδότησης χρησιμοποιούνται για να επιταχύνουν την προσπέλαση σε επιθυμητά δεδομένα. π.χ., author catalog in library

Διαβάστε περισσότερα

Problem Set 3: Solutions

Problem Set 3: Solutions CMPSCI 69GG Applied Information Theory Fall 006 Problem Set 3: Solutions. [Cover and Thomas 7.] a Define the following notation, C I p xx; Y max X; Y C I p xx; Ỹ max I X; Ỹ We would like to show that C

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006 ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/26 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι το 1 εκτός αν ορίζεται διαφορετικά στη διατύπωση

Διαβάστε περισσότερα

Inverse trigonometric functions & General Solution of Trigonometric Equations. ------------------ ----------------------------- -----------------

Inverse trigonometric functions & General Solution of Trigonometric Equations. ------------------ ----------------------------- ----------------- Inverse trigonometric functions & General Solution of Trigonometric Equations. 1. Sin ( ) = a) b) c) d) Ans b. Solution : Method 1. Ans a: 17 > 1 a) is rejected. w.k.t Sin ( sin ) = d is rejected. If sin

Διαβάστε περισσότερα

Example of the Baum-Welch Algorithm

Example of the Baum-Welch Algorithm Example of the Baum-Welch Algorithm Larry Moss Q520, Spring 2008 1 Our corpus c We start with a very simple corpus. We take the set Y of unanalyzed words to be {ABBA, BAB}, and c to be given by c(abba)

Διαβάστε περισσότερα

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Business English Ενότητα # 9: Financial Planning Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016 Section 1: Listening and responding Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016 Section 1: Listening and responding Section 1: Listening and Responding/ Aκουστική εξέταση Στο πρώτο μέρος της

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 6: Συμπίεση Ευρετηρίου 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Κατασκευή ευρετηρίου Στατιστικά

Διαβάστε περισσότερα

Section 9.2 Polar Equations and Graphs

Section 9.2 Polar Equations and Graphs 180 Section 9. Polar Equations and Graphs In this section, we will be graphing polar equations on a polar grid. In the first few examples, we will write the polar equation in rectangular form to help identify

Διαβάστε περισσότερα

Démographie spatiale/spatial Demography

Démographie spatiale/spatial Demography ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ Démographie spatiale/spatial Demography Session 1: Introduction to spatial demography Basic concepts Michail Agorastakis Department of Planning & Regional Development Άδειες Χρήσης

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Όλοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι του 10000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Αν κάπου κάνετε κάποιες υποθέσεις

Διαβάστε περισσότερα

ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση

ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή ευρετηρίου Στατιστικά για τη συλλογή

Διαβάστε περισσότερα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων Εξάμηνο 7 ο Procedures and Functions Stored procedures and functions are named blocks of code that enable you to group and organize a series of SQL and PL/SQL

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΜΥΕ003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4-5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή

Διαβάστε περισσότερα

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2)

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) Ιωάννης Τόλλης Τμήμα Επιστήμης Υπολογιστών NP-Completeness (2) x 1 x 1 x 2 x 2 x 3 x 3 x 4 x 4 12 22 32 11 13 21

Διαβάστε περισσότερα

Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά.

Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά. Διαστημικό εστιατόριο του (Μ)ΑστροΈκτορα Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά. Μόλις μια παρέα πελατών κάτσει σε ένα

Διαβάστε περισσότερα

On a four-dimensional hyperbolic manifold with finite volume

On a four-dimensional hyperbolic manifold with finite volume BULETINUL ACADEMIEI DE ŞTIINŢE A REPUBLICII MOLDOVA. MATEMATICA Numbers 2(72) 3(73), 2013, Pages 80 89 ISSN 1024 7696 On a four-dimensional hyperbolic manifold with finite volume I.S.Gutsul Abstract. In

Διαβάστε περισσότερα

Partial Trace and Partial Transpose

Partial Trace and Partial Transpose Partial Trace and Partial Transpose by José Luis Gómez-Muñoz http://homepage.cem.itesm.mx/lgomez/quantum/ jose.luis.gomez@itesm.mx This document is based on suggestions by Anirban Das Introduction This

Διαβάστε περισσότερα

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8 questions or comments to Dan Fetter 1

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8  questions or comments to Dan Fetter 1 Eon : Fall 8 Suggested Solutions to Problem Set 8 Email questions or omments to Dan Fetter Problem. Let X be a salar with density f(x, θ) (θx + θ) [ x ] with θ. (a) Find the most powerful level α test

Διαβάστε περισσότερα

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω 0 1 2 3 4 5 6 ω ω + 1 ω + 2 ω + 3 ω + 4 ω2 ω2 + 1 ω2 + 2 ω2 + 3 ω3 ω3 + 1 ω3 + 2 ω4 ω4 + 1 ω5 ω 2 ω 2 + 1 ω 2 + 2 ω 2 + ω ω 2 + ω + 1 ω 2 + ω2 ω 2 2 ω 2 2 + 1 ω 2 2 + ω ω 2 3 ω 3 ω 3 + 1 ω 3 + ω ω 3 +

Διαβάστε περισσότερα

Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού)

Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού) Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού) Προσδοκώμενα αποτελέσματα Περιεχόμενο Ενδεικτικές δραστηριότητες

Διαβάστε περισσότερα

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11 Potential Dividers 46 minutes 46 marks Page 1 of 11 Q1. In the circuit shown in the figure below, the battery, of negligible internal resistance, has an emf of 30 V. The pd across the lamp is 6.0 V and

Διαβάστε περισσότερα

Calculating the propagation delay of coaxial cable

Calculating the propagation delay of coaxial cable Your source for quality GNSS Networking Solutions and Design Services! Page 1 of 5 Calculating the propagation delay of coaxial cable The delay of a cable or velocity factor is determined by the dielectric

Διαβάστε περισσότερα

(C) 2010 Pearson Education, Inc. All rights reserved.

(C) 2010 Pearson Education, Inc. All rights reserved. Connectionless transmission with datagrams. Connection-oriented transmission is like the telephone system You dial and are given a connection to the telephone of fthe person with whom you wish to communicate.

Διαβάστε περισσότερα

Bounding Nonsplitting Enumeration Degrees

Bounding Nonsplitting Enumeration Degrees Bounding Nonsplitting Enumeration Degrees Thomas F. Kent Andrea Sorbi Università degli Studi di Siena Italia July 18, 2007 Goal: Introduce a form of Σ 0 2-permitting for the enumeration degrees. Till now,

Διαβάστε περισσότερα

Right Rear Door. Let's now finish the door hinge saga with the right rear door

Right Rear Door. Let's now finish the door hinge saga with the right rear door Right Rear Door Let's now finish the door hinge saga with the right rear door You may have been already guessed my steps, so there is not much to describe in detail. Old upper one file:///c /Documents

Διαβάστε περισσότερα

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

Main source: Discrete-time systems and computer control by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1 Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1 A Brief History of Sampling Research 1915 - Edmund Taylor Whittaker (1873-1956) devised a

Διαβάστε περισσότερα

Capacitors - Capacitance, Charge and Potential Difference

Capacitors - Capacitance, Charge and Potential Difference Capacitors - Capacitance, Charge and Potential Difference Capacitors store electric charge. This ability to store electric charge is known as capacitance. A simple capacitor consists of 2 parallel metal

Διαβάστε περισσότερα

Terabyte Technology Ltd

Terabyte Technology Ltd Terabyte Technology Ltd is a Web and Graphic design company in Limassol with dedicated staff who will endeavour to deliver the highest quality of work in our field. We offer a range of services such as

Διαβάστε περισσότερα

Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι

Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι Κεφάλαιο 8 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 Ανάκτηση Πληροφορίας 2009-2010 1 Δομές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΔΙΠΛΩΜΑΤΟΣ ΕΙΔΙΚΕΥΣΗΣ ΕΠΙΣΤΗΜΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ του Γεράσιμου Τουλιάτου

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΨΥΧΟΛΟΓΙΚΕΣ ΕΠΙΠΤΩΣΕΙΣ ΣΕ ΓΥΝΑΙΚΕΣ ΜΕΤΑ ΑΠΟ ΜΑΣΤΕΚΤΟΜΗ ΓΕΩΡΓΙΑ ΤΡΙΣΟΚΚΑ Λευκωσία 2012 ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ

Διαβάστε περισσότερα

Advanced Subsidiary Unit 1: Understanding and Written Response

Advanced Subsidiary Unit 1: Understanding and Written Response Write your name here Surname Other names Edexcel GE entre Number andidate Number Greek dvanced Subsidiary Unit 1: Understanding and Written Response Thursday 16 May 2013 Morning Time: 2 hours 45 minutes

Διαβάστε περισσότερα

LESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV. 18 February 2014

LESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV. 18 February 2014 LESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV 18 February 2014 Slowly/quietly Clear/clearly Clean Quickly/quick/fast Hurry (in a hurry) Driver Attention/caution/notice/care Dance Σιγά Καθαρά Καθαρός/η/ο

Διαβάστε περισσότερα

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α. Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:.

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α.  Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:. ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α 2 ειδήσεις από ελληνικές εφημερίδες: 1. Τα Νέα, 13-4-2010, Σε ανθρώπινο λάθος αποδίδουν τη συντριβή του αεροσκάφους, http://www.tanea.gr/default.asp?pid=2&artid=4569526&ct=2 2. Τα Νέα,

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 4: Ανάκτηση Ανεκτική στα Σφάλματα 1 Κεφ. 3 Τι είδαμε στο προηγούμενο μάθημα Δομές δεδομένων για Λεξικά

Διαβάστε περισσότερα

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE)

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE) EPL 603 TOPICS IN SOFTWARE ENGINEERING Lab 5: Component Adaptation Environment (COPE) Performing Static Analysis 1 Class Name: The fully qualified name of the specific class Type: The type of the class

Διαβάστε περισσότερα

4.6 Autoregressive Moving Average Model ARMA(1,1)

4.6 Autoregressive Moving Average Model ARMA(1,1) 84 CHAPTER 4. STATIONARY TS MODELS 4.6 Autoregressive Moving Average Model ARMA(,) This section is an introduction to a wide class of models ARMA(p,q) which we will consider in more detail later in this

Διαβάστε περισσότερα

Θεωρία Πληροφορίας και Κωδίκων

Θεωρία Πληροφορίας και Κωδίκων Θεωρία Πληροφορίας και Κωδίκων Δρ. Νικόλαος Κολοκοτρώνης Λέκτορας Πανεπιστήμιο Πελοποννήσου Τμήμα Επιστήμης και Τεχνολογίας Υπολογιστών Τέρμα Οδού Καραϊσκάκη, 22100 Τρίπολη E mail: nkolok@uop.gr Web: http://www.uop.gr/~nkolok/

Διαβάστε περισσότερα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων Εξάμηνο 7 ο Oracle SQL Developer An Oracle Database stores and organizes information. Oracle SQL Developer is a tool for accessing and maintaining the data

Διαβάστε περισσότερα

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ.

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ. Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο The time integral of a force is referred to as impulse, is determined by and is obtained from: Newton s 2 nd Law of motion states that the action

Διαβάστε περισσότερα

Συντακτικές λειτουργίες

Συντακτικές λειτουργίες 2 Συντακτικές λειτουργίες (Syntactic functions) A. Πτώσεις και συντακτικές λειτουργίες (Cases and syntactic functions) The subject can be identified by asking ποιος (who) or τι (what) the sentence is about.

Διαβάστε περισσότερα

Nuclear Physics 5. Name: Date: 8 (1)

Nuclear Physics 5. Name: Date: 8 (1) Name: Date: Nuclear Physics 5. A sample of radioactive carbon-4 decays into a stable isotope of nitrogen. As the carbon-4 decays, the rate at which the amount of nitrogen is produced A. decreases linearly

Διαβάστε περισσότερα

Αρχεία και Βάσεις Δεδομένων

Αρχεία και Βάσεις Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Αρχεία και Βάσεις Δεδομένων Διάλεξη 18η: Φυσική Σχεδίαση Βάσεων Δεδομένων Τμήμα Επιστήμης Υπολογιστών Data Structures for Primary Indices Structures that determine

Διαβάστε περισσότερα

Chapter 2 * * * * * * * Introduction to Verbs * * * * * * *

Chapter 2 * * * * * * * Introduction to Verbs * * * * * * * Chapter 2 * * * * * * * Introduction to Verbs * * * * * * * In the first chapter, we practiced the skill of reading Greek words. Now we want to try to understand some parts of what we read. There are a

Διαβάστε περισσότερα

CRASH COURSE IN PRECALCULUS

CRASH COURSE IN PRECALCULUS CRASH COURSE IN PRECALCULUS Shiah-Sen Wang The graphs are prepared by Chien-Lun Lai Based on : Precalculus: Mathematics for Calculus by J. Stuwart, L. Redin & S. Watson, 6th edition, 01, Brooks/Cole Chapter

Διαβάστε περισσότερα

Areas and Lengths in Polar Coordinates

Areas and Lengths in Polar Coordinates Kiryl Tsishchanka Areas and Lengths in Polar Coordinates In this section we develop the formula for the area of a region whose boundary is given by a polar equation. We need to use the formula for the

Διαβάστε περισσότερα

(1) Describe the process by which mercury atoms become excited in a fluorescent tube (3)

(1) Describe the process by which mercury atoms become excited in a fluorescent tube (3) Q1. (a) A fluorescent tube is filled with mercury vapour at low pressure. In order to emit electromagnetic radiation the mercury atoms must first be excited. (i) What is meant by an excited atom? (1) (ii)

Διαβάστε περισσότερα

Διάρθρωση. Στατιστικά Κειμένου Text Statistics. Συχνότητα Εμφάνισης Λέξεων Ο Νόμος του Zipf Ο Νόμος του Heaps. Ανάκτηση Πληροφορίας 2008-2009 1

Διάρθρωση. Στατιστικά Κειμένου Text Statistics. Συχνότητα Εμφάνισης Λέξεων Ο Νόμος του Zipf Ο Νόμος του Heaps. Ανάκτηση Πληροφορίας 2008-2009 1 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 Στατιστικά Κειμένου Text Statistics CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete, Spring 2008 1 Διάρθρωση Συχνότητα Εμφάνισης

Διαβάστε περισσότερα

Second Order RLC Filters

Second Order RLC Filters ECEN 60 Circuits/Electronics Spring 007-0-07 P. Mathys Second Order RLC Filters RLC Lowpass Filter A passive RLC lowpass filter (LPF) circuit is shown in the following schematic. R L C v O (t) Using phasor

Διαβάστε περισσότερα

Introduction to Information Retrieval

Introduction to Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 5: Κατασκευή και Συμπίεση Ευρετηρίου 1 Η βασική δομή: Το αντεστραμμένο ευρετήριο (inverted index)

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών Τέλος Ενότητας Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 10η: Basics of Game Theory part 2 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 10η: Basics of Game Theory part 2 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Διάλεξη 0η: Basics of Game Theory part 2 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών Best Response Curves Used to solve for equilibria in games

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

ίκτυο προστασίας για τα Ελληνικά αγροτικά και οικόσιτα ζώα on.net e-foundatio //www.save itute: http:/ toring Insti SAVE-Monit

ίκτυο προστασίας για τα Ελληνικά αγροτικά και οικόσιτα ζώα on.net e-foundatio //www.save itute: http:/ toring Insti SAVE-Monit How to run a Herdbook: Basics and Basics According to the pedigree scheme, you need to write down the ancestors of your animals. Breeders should be able easily to write down the necessary data It is better

Διαβάστε περισσότερα

Web Data Mining ΕΡΓΑΣΤΗΡΙΟ 2 & 3. Prepared by Costantinos Costa Edited by George Nikolaides. EPL 451 - Data Mining on the Web

Web Data Mining ΕΡΓΑΣΤΗΡΙΟ 2 & 3. Prepared by Costantinos Costa Edited by George Nikolaides. EPL 451 - Data Mining on the Web EPL 451 - Data Mining on the Web Web Data Mining ΕΡΓΑΣΤΗΡΙΟ 2 & 3 Prepared by Costantinos Costa Edited by George Nikolaides Semester Project Microsoft Malware Classification Challenge (BIG 2015) More info:

Διαβάστε περισσότερα

Paper Reference. Paper Reference(s) 1776/04 Edexcel GCSE Modern Greek Paper 4 Writing. Thursday 21 May 2009 Afternoon Time: 1 hour 15 minutes

Paper Reference. Paper Reference(s) 1776/04 Edexcel GCSE Modern Greek Paper 4 Writing. Thursday 21 May 2009 Afternoon Time: 1 hour 15 minutes Centre No. Candidate No. Paper Reference(s) 1776/04 Edexcel GCSE Modern Greek Paper 4 Writing Thursday 21 May 2009 Afternoon Time: 1 hour 15 minutes Materials required for examination Nil Paper Reference

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #10 εικτοδότηση και Αναζήτηση Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια

Διαβάστε περισσότερα

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΘΕΜΑ: «ιερεύνηση της σχέσης µεταξύ φωνηµικής επίγνωσης και ορθογραφικής δεξιότητας σε παιδιά προσχολικής ηλικίας»

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΘΕΜΑ: «ιερεύνηση της σχέσης µεταξύ φωνηµικής επίγνωσης και ορθογραφικής δεξιότητας σε παιδιά προσχολικής ηλικίας» ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΑΝΘΡΩΠΙΣΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΠΡΟΣΧΟΛΙΚΗΣ ΑΓΩΓΗΣ ΚΑΙ ΤΟΥ ΕΚΠΑΙ ΕΥΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ «ΠΑΙ ΙΚΟ ΒΙΒΛΙΟ ΚΑΙ ΠΑΙ ΑΓΩΓΙΚΟ ΥΛΙΚΟ» ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ που εκπονήθηκε για τη

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ Μελέτη των υλικών των προετοιμασιών σε υφασμάτινο υπόστρωμα, φορητών έργων τέχνης (17ος-20ος αιώνας). Διερεύνηση της χρήσης της τεχνικής της Ηλεκτρονικής Μικροσκοπίας

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΥΨΗΛΩΝ ΤΑΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΥΨΗΛΩΝ ΤΑΣΕΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΥΨΗΛΩΝ ΤΑΣΕΩΝ Διπλωµατική Εργασία Της Φοιτήτριας του Τµήµατος Ηλεκτρολόγων

Διαβάστε περισσότερα

14 Lesson 2: The Omega Verb - Present Tense

14 Lesson 2: The Omega Verb - Present Tense Lesson 2: The Omega Verb - Present Tense Day one I. Word Study and Grammar 1. Most Greek verbs end in in the first person singular. 2. The present tense is formed by adding endings to the present stem.

Διαβάστε περισσότερα