Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Δομές Ευρετηρίου: Διάρθρωση Διάλεξης"

Transcript

1 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) Κεφάλαιο 8 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 1 Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Εισαγωγή κίνητρο Ανεστραμμένα Αρχεία (Inverted files) Αρχεία Υπογραφών (Signature files) Δένδρα Καταλήξεων (Suffix trees) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 2 Ανάκτηση Πληροφορίας

2 Ευρετηριασμός Κειμένου:Εισαγωγή Σκοπός Σχεδιασμός δομών δεδομένων που επιτρέπουν την αποδοτική υλοποίηση της γλώσσας επερώτησης Απλοϊκή προσέγγιση: σειριακή αναζήτηση (online sequential search) Ικανοποιητική μόνο αν η συλλογή των κειμένων είναι μικρή Είναι η μόνη επιλογή αν η συλλογή κειμένων είναι ευμετάβλητη Σχεδιασμός δομών δεδομένων, που ονομάζονται ευρετήρια (called indices), για επιτάχυνση της αναζήτησης CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 3 Χρήση Καταλόγων/Ευρετηρίων Τα συστήματα ανάκτησης σπάνια αναζητούν την πληροφορία απευθείας στη συλλογή εγγράφων. Συνήθως, χρησιμοποιούνται κατάλογοι οι οποίοι επιταχύνουν τη διαδικασία αναζήτησης. συλλογή εγγράφων Κατάλογος αναζήτηση καταλόγου δημιουργία καταλόγου Έγγραφα Ανάκτηση Πληροφορίας

3 Ανάγκες Γλωσσών Επερώτησης (και μοντέλων ανάκτησης γενικότερα) Απλές βρες έγγραφα που περιέχουν μια λέξη t βρες πόσες φορές εμφανίζεται η λέξη t σε ένα έγγραφο βρες τις θέσεις τωνεμφανίσεωντηςλέξηςt στο έγγραφο Πιο σύνθετες λογικές (Boolean) επερωτήσεις επερωτήσεις εγγύτητας (phrase/proximity queries) ταιριάσματος προτύπου (pattern matching) κανονικές εκφράσεις (regular expressions) δομικές επερωτήσεις (structure-based queries)... Σχεδιάζουμε το ευρετήριο ανάλογα με το μοντέλο ανάκτησης και τη γλώσσα επερώτησης CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 5 Γενική (Λογική) μορφή ενός ευρετηρίου Indexing Items D o c u m e n t s k 1 k 2... k j... k t d 1 c 1,1 c 2,1... c i,1... c t,1 d 2 c 1,2 c 2,2... c i,2... c t, d i c 1,j c 2,j... c i,j... c t,j d N c 1,N c 2,N... c i,n... c t,n c ij : το κελί που αντιστοιχεί στο έγγραφο d i και στον όρο k j, το οποίο μπορεί να περιέχει: ένα w ij που να δηλώνει την παρουσία ή απουσία του k j στο d i (ή τη σπουδαιότητα του k j στο d i ) τις θέσεις στις οποίες ο όρος k j εμφανίζεται στο d i (αν πράγματι εμφανίζεται) Ερωτήματα: Τι πρέπει να έχει το κάθε c ij Πώς να υλοποιήσουμε αυτή τη λογική δομή ώστε να έχουμε καλή απόδοση; CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 6 Ανάκτηση Πληροφορίας

4 Τεχνικές Ευρετηριασμού (Indexing Techniques) Ανεστραμμένα Αρχεία (Inverted files) η πιο διαδεδομένη τεχνική Δένδρα και Πίνακες Καταλήξεων (Suffix trees and arrays) γρήγορες για phrase queries αλλά η κατασκευή και η συντήρησή τους είναι δυσκολότερη και ακριβότερη Αρχεία Υπογραφών (Signature files) Χρησιμοποιήθηκαν πολύ τη δεκαετία του 80. Σπανιότερα σήμερα αλλά σε κατανεμημένα διάφορες παραλλαγές τους. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 7 Ανεστραμμένα Αρχεία (Inverted Files) Ανάκτηση Πληροφορίας

5 Ανεστραμμένο Αρχείο Λογική Μορφή Ευρετηρίου Μορφή Ανεστραμμένου Ευρετηρίου Index terms C j,1 k 1 k 2... k t d 1 c 1,1 c 2,1 c t,1 d 2 c 1,2 c 2,2 c t, d i c 1,j c 2,j c t,j d N c 1,N c 2,N c t,n k1 k2... kt Postings lists Άρα δεν δεσμεύουμε χώρο για τα «μηδενικά κελιά» της λογικής μορφής του ευρετηρίου CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 9 Inverted Files (Ανεστραμμένα αρχεία) Ιnverted file = a word-oriented mechanism for indexing a text collection in order to speed up the searching task. An inverted file consists of: Vocabulary: is the set of all distinct words in the text Occurrences: lists containing all information necessary for each word of the vocabulary (documents where the word appears, frequency, text position, etc.) Τι είδους πληροφορία κρατάμε στις posting lists εξαρτάται από το λογικό μοντέλο και το μοντέλο ερωτήσεων CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 10 Ανάκτηση Πληροφορίας

6 Ανεστραμμένο αρχείο για ένα μόνο έγγραφο και αποθήκευση θέσεων εμφάνισης κάθε λέξης Κείμενο That house has a garden. The garden has many flowers. The flowers are beautiful Inverted File: Vocabulary beautiful flowers garden house Occurrences 70 45, 58 18, 29 6 Τι άλλο θα κάνατε (κρατούσατε) αν είχαμε πολλά έγραφα και θέλαμε να υλοποιήσουμε το Διανυσματικό Μοντέλο; CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 11 Ανεστραμμένο αρχείο για πολλά έγγραφα, και βάρυνση tf-idf To df (document frequency, που μας χρειάζεται για το IDF) αρκεί να αποθηκευτεί μια φορά To βάρος tf (term frequency) Vocabulary Index terms df D j, tf j Εδώ θα μπορούσαμε να έχουμε και τις θέσεις εμφάνισης της λέξης computer στο έγγραφο D j computer 3 D 7, 4 database 2 D 1, 3 science 4 D 2, 4 system 1 D 5, 2 Vocabulary file Postings lists CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 12 Ανάκτηση Πληροφορίας

7 Παράδειγμα ανεστραμμένου αρχείου όπου για κάθε λέξη i και έγγραφο j κρατάμε μόνο το freq ij Document Corpus Doc CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 13 Text 1 Pease porridge hot 2 Pease porridge cold 3 Pease porridge in the pot 4 Pease porridge hot, pease porridge not cold 5 Pease porridge cold, pease porridge not hot 6 Pease porridge hot in the pot Vocabulary Inverted Lists cold hot in not Inverted File pease <1,1> <2,1> <3,1> <4,2> <5,2> <6,1> porridge pot the <2,1> <4,1> <1,1> <4,1> <5,1> <6,1> <3,1> <6,1> <4,1> <5,1> <1,1> <2,1> <3,1> <4,2> <5,2> <3,1> <6,1> <3,1> <6,1> <5,1> <6,1> Another example term df document ids CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 14 Ανάκτηση Πληροφορίας

8 Block Addressing The text is divided in blocks The occurrences point to the blocks where the word appears CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 15 Block Addressing: Example That house has a garden. The garden has many flowers. The flowers are beautiful beautiful 70 Vocabulary flowers Occurrences 45, 58 garden 18, 29 house 6 Block 1 Block 2 Block 3 Block 4 That house has a garden. The garden has many flowers. The flowers are beautiful beautiful 4 Vocabulary flowers Occurrences 3 garden 2 house 1 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 16 Ανάκτηση Πληροφορίας

9 Block Addressing Advantages: the number of pointers is smaller than positions all the occurrences of a word inside a single block are collapsed to one reference (indices of only 5% overhead over the text size can be obtained with this technique. Of course this depends on the block size). In many cases instead of defining the block size, we define the number of blocks (in this way we know how many bits we need per pointer) Disadvantages: online sequential search over the qualifying blocks if exact positions are required e.g. for finding the sentence where the word occurs e.g. for evaluating a context (phrasal or proximity) query CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 17 Ανεστραμμένα Αρχεία: Απαιτήσεις Χώρου μικρές μεγάλες Index terms Cj,1 k1 k2... kt Postings lists CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 18 Ανάκτηση Πληροφορίας

10 Ανεστραμμένα Αρχεία: Απαιτήσεις Χώρου Notations n: the size of the text (of all documents in the collection) V: the size of the vocabulary For the Vocabulary: Rather small. According to Heaps law the vocabulary grows as O(n β ), where β is a constant between 0.4 and 0.6 in practice. So V ~ sqrt(n) // άρα ανάλογο της τετραγωνικής ρίζας του μεγέθους της συλλογής) For Occurrences: Much more space. Since each word appearing in the text is referenced once in that structure (i.e. we keep a pointer), the extra space is O(n) To reduce space requirements, a technique called block addressing is used how? CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 19 Size of Inverted Files as percentage of the size of the whole collection 45% of all words are stopwods Index Small collection Medium collection Large collection (1Mb) (200Mb) (2Gb) Addressing words 45% 73% 36% 64% 35% 63% Addressing 64K blocks 27% 41% 18% 32% 5% 9% Addressing 256 blocks 18% 25% 1.7% 2.4% 0.5% 0.7% Without stopwords All words Without stopwords All words Without stopwords All words Addressing words: 4 bytes per pointer (2^32 ~ giga) Addressing 64K blocks: 2 bytes per pointer Addressing 256 blocks: 1 byte per pointer CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 20 Ανάκτηση Πληροφορίας

11 Searching an inverted index CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 22 Ανάκτηση Πληροφορίας

12 (cont) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 23 Searching an inverted index General Steps: 1/ Vocabulary search: the words present in the query are searched in the vocabulary 2/ Retrieval occurrences: the lists of the occurrences of all words found are retrieved 3/ Manipulation of occurrences: The occurrences are processed to solve the query If block addressing is used we have to search the text of the blocks in order to get the exact positions and number of occurrences CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 24 Ανάκτηση Πληροφορίας

13 1/ Vocabulary search As Searching task on an inverted file always starts in the vocabulary, it is better to store the vocabulary in a separate file this file is not so big so it is possible to keep it at main memory at search time Suppose we want to search for a word of length m. The structures most used to store the vocabulary are hashing, tries or B-trees. Options: Cost of searching a sequential file: O(V) Cost of searching assuming hashing: O(m) Cost of searching assuming tries: O(m) Cost of searching assuming the file is ordered (lexicographically): O(log V) this option is cheaper in space and very competitive CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 25 Υπόβαθρο/Επανάληψη: Tries Tries multiway trees for stroring strings able to retrieve any string in time proportional to its length (independent from the number of all stored strings) Description every edge is labeled with a letter searching a string s start from root and for each character of s follow the edge that is labeled with the same letter. continue, until a leaf is found (which means that s is found) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 26 Ανάκτηση Πληροφορίας

14 Tries: Παράδειγμα This is a text. A text has many words. Words are made from letters. Vocabulary text (11) text (19) many (28) words (33) words (40) made (50) letters (60) Vocabulary (ordered) letters (60) made (50) many (28) text (11,19) words (33,40) Vocabulary trie l m a t w d n letters:60 made:50 many:28 text:11,19 words:33,40 Ερώτηση: Θα μπορούσε ένα trie να βοηθήσει τη στελέχωση κειμένου βάσει της τεχνικής Successor variety? CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 27 Παράδειγμα αυξητικής δημιουργίας ενός trie CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 28 Ανάκτηση Πληροφορίας

15 1/ Vocabulary Search (II) Remarks prefix and range queries can also be solved with binary search, tries or B-trees but not with hashing context queries are more difficult to solve with inverted indices 1. each element must be searched separately and 2. a list (in increasing positional order) is generated for each one 3. The lists of all elements are traversed in synchronization to find places where all the words appear in sequence (for a phrase) or appear close enough (for proximity). CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 29 Inverted Index: A general remark Experiments show that both the space requirements and the amount of text traversed can be close to O(n^0.85). Hence, inverted indices allow us to have sublinear search time and sublinear space requirements. This is not possible on other indices. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 30 Ανάκτηση Πληροφορίας

16 Constructing an Inverted File Constructing an Inverted File All the vocabulary is kept in a suitable data structure storing for each word a list of its occurrences e.g. in a trie data structure Each word of the text is read and searched in the vocabulary if a trie data structure is used then this search costs O(m) where m the size of the word If it is not found, it is added to the vocabulary with an empty list of occurrences and the new position is added to the end of its list of occurrences CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 32 Ανάκτηση Πληροφορίας

17 Constructing an Inverted File (II) Once the text is exhausted the vocabulary is written to disk with the list of occurrences. Two files are created: in the first file, the list of occurrences are stored contiguously in the second file, the vocabulary is stored in lexicographical order and, for each word, a pointer to its list in the first file is also included. The overall process is O(n) time 2 nd file 1 st file Trie: O(1) per text character Since positions are appended (in the postings file) O(1) time It follows that the overall process is O(n) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 33 Example of constructing an inverted file (in our example we assume that: each word = one document, position = document identifier ) Once the complete trie structure is constructed the inverted file can be derived from it: The trie is traversed top-down and left-toright. whenever an index term is encountered, it is added to the end of the inverted file. Note that if a term is prefix of another term (such as "a" is prefix of "are") index terms can occur on internal nodes of the trie. analogously the posting file is derived. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 34 Ανάκτηση Πληροφορίας

18 Example (cont) The trie structure constructed is a possible access structure to the index file in main memory. Thus the entries of the index files occur as leaves (or internal nodes) of the trie. Each entry has a reference to the position of the postings file that is held in secondary storage. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 35 What if the Inverted Index does not fit in main memory? A technique based on partial Indexes: Use the previous algorithm until the main memory is exhausted. When no more memory is available, write to disk the partial index I i obtained up to now, and erase it from main memory Continue with the rest of the text Once the text is exhausted, a number of partial indices I i exist on disk The partial indices are merged to obtain the final index CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 36 Ανάκτηση Πληροφορίας

19 Merging two partial indices I1 and I2 Merge the sorted vocabularies and whenever the same word appears in both indices, merge both list of occurences By construction, the occurences of the smaller-numbered index are before those at the larger-numbered index, therefore the lists are just concatenated Complexity: O(n1+n2) where n1 and n2 the sizes of the indices CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 37 Example of two partial indices and their merging CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 38 Ανάκτηση Πληροφορίας

20 Merging partial indices to obtain the final I final index 7 level 3 I I level 2 I I I I I 1 I 2 I 3 I 4 I 5 I 6 I 7 I 8 level 1 initial dumps CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 39 Merging all partial indices: Time Complexity Notations n: the size of the text V: the size of the vocabulary M: the amount of main memory available The total time to generate partial indices is O(n) The number of partial indices is O(n/M) To merge the O(n/M) partial indices are necessary log 2 (n/m) merging levels The total cost of this algorithm is O(n log(n/m)) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 40 Ανάκτηση Πληροφορίας

21 Maintaining the Inverted File Addition of a new doc build its index and merge it with the final index (as done with partial indexes) Delete a doc of the collection scan index and delete those occurrences that point into the deleted file (complexity: O(n) : extremely expensive!) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 41 Αποτίμηση Boolean επερωτήσεων με χρήση ανεστραμμένων αρχείων Αποτίμηση με χρήση ανεστραμμένων αρχείων Primitive keyword: Retrieve containing documents using the inverted index. OR: Recursively retrieve e 1 and e 2 and take union of results. AND: Recursively retrieve e 1 and e 2 and take intersection of results. BUT: Recursively retrieve e 1 and e 2 and take set difference of results. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 42 Ανάκτηση Πληροφορίας

22 Evaluating Phrasal and Proximity Queries with Inverted Indices Phrasal Queries Must have an inverted index that also stores positions of each keyword in a document. Retrieve documents and positions for each individual word, intersect documents, and then finally check for ordered contiguity of keyword positions. Best to start contiguity check with the least common word in the phrase. Proximity Queries Use approach similar to phrasal search to find documents in which all keywords are found in a context that satisfies the proximity constraints -- a list (in increasing positional order) is generated for each one The lists of all elements are traversed in synchronization to find places where all the words appear close enough (for proximity). During binary search for positions of remaining keywords, find closest position of k i to p and check that it is within maximum allowed distance. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 43 Inverted Index: Κατακλείδα Is probably the most adequate indexing technique Appropriate when the text collection is large and semi-static If the text collection is volatile online searching is the only option Some techniques combine online and indexed searching Είδαμε τρόπους για να μειώσουμε το μέγεθος ενός ανεστραμμένου ευρετηρίου (λέξεις αποκλεισμού, block addressing). Θα δούμε και άλλους τρόπους στο μάθημα περί συμπίεσης (συγκεκριμένα τρόπους μείωσης του χώρου που καταλαμβάνουν οι λίστες εμφανίσεων) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 44 Ανάκτηση Πληροφορίας

23 Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Εισαγωγή κίνητρο Ανεστραμμένα Αρχεία (Inverted files) Αρχεία Υπογραφών (Signature files) Δένδρα Καταλήξεων (Suffix trees) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 45 Signature files (αρχεία υπογραφών) Ανάκτηση Πληροφορίας

24 Αρχεία Υπογραφών (Signature Files) Κύρια σημεία: Δομή ευρετηρίου που βασίζεται στο hashing Μικρή χωρική επιβάρυνση (10%-20% του μεγέθους των κειμένων) Xαρακτηρίζεται από απώλεια πληροφορίας: κατά τη διαδικασία της αναζήτησης σχετικών εγγράφων μπορεί να ανακτηθούν έγγραφα τα οποία δεν περιέχουν τους όρους του ερωτήματος. Αναζήτηση = σειριακή αναζήτηση στο αρχείο υπογραφών Κατάλληλη για όχι πολύ μεγάλα κείμενα CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 47 Αρχεία Υπογραφών Συγκεκριμένα 1. Χρήση hash function που αντιστοιχεί λέξεις κειμένου σε bit masks των Β bits 2. Διαμέριση τουκειμένουσεblocks των b λέξεων το καθένα 1. Bit mask of a block = Bitwise OR of the bits masks of all words in the block 2. Bit masks are then concatenated CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 48 Ανάκτηση Πληροφορίας

25 Αρχεία Υπογραφών: Παράδειγμα b = 3 ( 3 words per block) B = 6 (bit masks of 6 bits) Text Block 1 Block 2 Block 3 Block 4 This is a text. A text has many words. Words are made from letters. Text Signature Signature Function h(text)= h(many)= h(words)= h(made)= h(letters)= Γιατί Bitwise-OR? CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 49 Αρχεία Υπογραφών: Αναζήτηση Έστω ότι αναζητούμε μια λέξη w: 1/ W := h(w) (we hash the word to a bit mask W) 2/ Compare W with all bit masks Bi of all text blocks If (W & Bi = W), the text block i is candidate (may contain the word w) 3/ For all candidate text blocks, perform an online traversal to verify that the word w is actually there CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 50 Ανάκτηση Πληροφορίας

26 False drops (false hits) False drop (false hit, false positive): All bits of the W are set in Bi but the word w is not there w=«words», h(«words»)= Text Block 1 Block 2 Block 3 Block 4 This is a text. A text has many words. Words are made from letters. Text Signature Signature Function h(text)= h(many)= h(words)= h(made)= h(letters)= CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 51 Υπογραφές (σύγκρουση) Ακόμα και να δεν υπάρχει υπέρθεση (ORing) υπάρχει περίπτωση δύο διαφορετικοί όροι να έχουν την ίδια υπογραφή. Το φαινόμενο αυτό καλείται σύγκρουση (collision) και η εμφάνισή του επηρεάζεται από το μέγεθος της υπογραφής και από τη συνάρτηση κατακερματισμού που χρησιμοποιείται. Όσο αυξάνει ο αριθμός των συγκρούσεων αυξάνει και ο αριθμός των false alarms (drops). Ανάκτηση Πληροφορίας

27 Διαμόρφωση (Configuration) υπογραφών Σχεδιαστικοί στόχοι: Μείωσε την πιθανότητα εμφάνισης false drops Κράτησε το μέγεθος του αρχείου υπογραφών μικρό δεν έχουμε κανένα false drop αν b=1 και Β=log 2 (V) Παράμετροι: Β (το μέγεθος των bit mask) L (L<B) to πλήθος των bit που είναι 1 (σε κάθε h(w)) The (space)-(false drop probability) tradeoff: 10% space overhead => 2% false drop probability 20% space overhead => 0.046% false drop probability CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 53 Εξαγωγή Υπογραφής μήκος υπογραφής Β αριθμός άσσων L όρος t Κατασκευή Υπογραφής Υπογραφή συνάρτηση κατακερματισμού h(t) Ανάκτηση Πληροφορίας

28 Αρχεία Υπογραφών: Άλλες Παρατηρήσεις Μέγεθος αρχείου υπογραφών: bit masks of each block plus one pointer for each block (pointing to the corresponding position at the original text) Συντήρηση αρχείου υπογραφών: Η προσθήκη/διαγραφή αρχείων αντιμετωπίζεται εύκολα προσθέτονται/διαγράφονται τα αντίστοιχα bit masks CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 55 Signature files: Phrase and Proximity Queries Good for phrase searches and reasonable proximity queries this is because all the words must be present in a block in order for that block to hold the phrase or the proximity query. Hence the OR of all the query masks is searched Remark: no other patterns (e.g. range queries) can be searched in this scheme CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 56 Ανάκτηση Πληροφορίας

29 Phrase/Proximity Queries and Block Boudaries q=<information retrieval> Text blocks Information retrieval (πρόβλημα! Μπορούμε όμως να το λύσουμε με επικαλυπτόμενα blocks) Overlapping blocks For j-proximity queries Information retrieval j-1 common words CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 57 Οργάνωση Υπογραφών Ανάκτηση Πληροφορίας

30 Σειριακή Οργάνωση Υπογραφών Η πιο απλή μορφή καταλόγου βασίζεται στη σειριακή παράθεση των υπογραφών σε ένα αρχείο που καλείται σειριακό αρχείο υπογραφών (sequential signature file - SSF). Το αρχείο υπογραφών είναι στην ουσία ένας πίνακας L x F με L γραμμές (πλήθος blocks - λογικών τμημάτων) και F στήλες (πλήθος δυαδικών ψηφίων ανά υπογραφή). Σε κάθε υπογραφή αντιστοιχεί και ένα δείκτης (pointer) που δείχνει στην αρχή του λογικού τμήματος του εγγράφου. Σειριακή Οργάνωση Υπογραφών Ανάκτηση Πληροφορίας

31 Οργάνωση Υπογραφών Με βάση τον τρόπο λειτουργίας του καταλόγου SSF προκύπτει ότι για την αναζήτηση ενός και μόνο όρου θα πρέπει να εξεταστούν όλες οι υπογραφές των λογικών τμημάτων. Eναλλακτικές μορφές οργάνωσης του αρχείου υπογραφών. Κάθετος Διαμερισμός: BSSF Tεμαχισμός (slicing) του πίνακα υπογραφών (1988): BSSF (bit-sliced signature file). Κάθετος διαμερισμός του πίνακα υπογραφών: η αποθήκευση του πίνακα γίνεται κατά στήλες (και όχι κατά γραμμές όπως στη μέθοδο SSF). Δηλαδή, ανά bit της υπογραφής Ο πίνακας υπογραφών του αντιστρέφεται, και αποκτά διαστάσεις F x L (F γραμμές και L στήλες): Η κάθε γραμμή του αντεστραμμένου πίνακα καλείται τεμάχιο (slice) και αποτελείται από τα δυαδικά ψηφία που βρίσκονται στην ίδια θέση σε όλες τις υπογραφές των λογικών τμημάτων. Για να μπορεί η δομή να υποστηρίξει εισαγωγές και διαγραφές αποδοτικά, ηκάθε γραμμή του αντεστραμμένου πίνακα αποθηκεύεται σε ξεχωριστό αρχείο. Ανάκτηση Πληροφορίας

32 Κάθετος Διαμερισμός: BSSF Κάθετος Διαμερισμός: BSSF Η αναζήτηση ενός όρου στη δομή BSSF: Υπολογισμός της υπογραφής του όρου. H υπογραφή του όρου θα περιέχει άσσους σε ακριβώς m δυαδικά ψηφία. ( σε αντίθεση με τη δομή SSF) Εξέταση m τεμαχίων (γραμμών του αντεστραμμένου πίνακα) αυτών που είναι 1 στην υπογραφή Τα δυαδικά ψηφία των m γραμμών συνδυάζονται με τη χρήση υπέρθεσης (λογικό AND) και προκύπτει ένα διάνυσμα L θέσεων. Λαμβάνονται υπόψη οι θέσεις των άσσων στο διάνυσμα αυτό και προσπελαύονται οι αντίστοιχοι δείκτες του αρχείου δεικτών για να οδηγηθούμε τελικά στα λογικά τμήματα των εγγράφων. Ανάκτηση Πληροφορίας

33 Κάθετος Διαμερισμός: BSSF Κάθετος Διαμερισμός: BSSF Για την εισαγωγή ενός νέου εγγράφου, αρχικά προσδιορίζονται τα νέα λογικά τμήματα και οι αντίστοιχες υπογραφές. για κάθε νέο λογικό τμήμα πραγματοποιείται τεμαχισμός της υπογραφής του και κάθε ένα από τα F διαφορετικά αρχεία λαμβάνει και ένα δυαδικό ψηφίο της υπογραφής που αποθηκεύεται στο τέλος. Ανάκτηση Πληροφορίας

34 Κάθετος Διαμερισμός: BSSF Η μέθοδος BSSF είναι πιο αποδοτική από την SSF ως προς τη λειτουργία της αναζήτησης. Ωστόσο, υπάρχει επιπλέον χώρος για βελτίωση που οφείλεται σε δύο κυρίως λόγους: Η αναζήτηση ενός όρου επιβάλλει την προσπέλαση m τεμαχίων, όπου m είναι ο αριθμός των άσσων στην υπογραφή του όρου. Αν m=1 τότε θα μπορούσε να αυξηθεί η απόδοση της μεθόδου. Η εισαγωγή ενός νέου λογικού τμήματος απαιτεί ένα μεγάλο αριθμό προσπελάσεων που ρυθμίζεται από τον αριθμό των δυαδικών ψηφίων της υπογραφής του λογικού τμήματος F. Αν η τιμή της παραμέτρου F είναι μεγάλη (π.χ. 1000) τότε αυξάνεται σημαντικά το κόστος εισαγωγής. Σύνοψη Οι κατάλογοι υπογραφών αποτελούν μία διαφορετική προσέγγιση για την οργάνωση μίας συλλογής εγγράφων. Το βασικό χαρακτηριστικό των καταλόγων αυτών είναι ότι στηρίζονται στη δημιουργία υπογραφών από τους όρους των εγγράφων. Μία υπογραφή είναι μία ακολουθία δυαδικών ψηφίων (bits) τα οποία περιέχουν άσσους σε συγκεκριμένες θέσεις που καθορίζονται από τη συνάρτηση κατακερματισμού που χρησιμοποιείται. Ανάκτηση Πληροφορίας

35 Σύνοψη Σύμφωνα με πειραματικές μελέτες σχετικά με την επίδοση των καταλόγων υπογραφών σε σχέση με τους ανεστραμμένους καταλόγους, έχει επαληθευτεί ότι οι κατάλογοι που στηρίζονται στην αντιστροφή έχουν γενικά καλύτερες επιδόσεις από τους καταλόγους που στηρίζονται σε υπογραφές. Ωστόσο, οι κατάλογοι υπογραφών έχουν μερικές πολύ καλές ιδιότητες (π.χ., ευκολία στον παραλληλισμό) Δομή ενός ΣΑΠ Έγγραφο Ερωτήματος Νέα Έγγραφα Ερώτημα Χρήστης Ανάδραση Προεπεξεργασία Εγγράφου Ερωτήματος Προεπεξεργασία Εγγράφου Επαναπροσδιορισμός Ερωτήματος Αναζήτηση Σχετικών Εγγράφων Ενημέρωση Καταλόγου Βαθμολόγηση Εγγράφων Παραγωγή και Μορφοποίηση Αποτελεσμάτων Κατάλογος Έγγραφα Ανάκτηση Πληροφορίας

36 Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Εισαγωγή κίνητρο Ανεστραμμένα Αρχεία (Inverted files) Αρχεία Υπογραφών (Signature files) Δένδρα Καταλήξεων (Suffix trees) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 71 Δένδρα και Πίνακες Καταλήξεων (Suffix Trees and Suffix Arrays) Ανάκτηση Πληροφορίας

37 Δένδρα και Πίνακες Καταλήξεων (Suffix Trees and Arrays ) Κίνητρο Γρήγορη αποτίμηση των phrase queries H έννοια της λέξης (στην οποία βασίζονται τα inverted files) δεν υπάρχει σε άλλες εφαρμογές (π.χ. στις γενετικές βάσεις δεδομένων), άρα υπάρχει ανάγκη για διαφορετικές δομές δεδομένων. Μια αλυσίδα DNA είναι μια ακολουθία από διατεταγμένα ζευγάρια βάσεων. Υπάρχουν 4 βάσεις: η αδενίνη (Α), η γουανίνη(g), ηκυτοσίνη(c) και η θυμίνη (T). Κάθε ζευγάρι βάσεων του DNA αποτελείται από διαφορετικές βάσεις. Συγκεκριμένα, η αδενίνη (A) μπορεί να συνδέεται μόνο με τη θυμίνη (T), ενώ η γουανίνη (G) μπορεί να συνδέεται μόνο με την κυτοσίνη (C). Ένα παράδειγμα αποσπάσματος αλυσίδας DNA ακολουθεί: AGGCTACCCT TA T C C G A T G G G A A T CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 73 Δένδρα Καταλήξεων (Suffix Trees) Δένδρο Καταλήξεων: Το δένδρο καταλήξεων ενός κειμένου είναι ένα trie πάνω σε όλες τις καταλήξεις του κειμένου. Οι δείκτες προς το κείμενο αποθηκεύονται στα φύλλα του δένδρου. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 74 Ανάκτηση Πληροφορίας

38 Suffix Trie για τη λέξη cacao (θεωρώντας κάθε θέση ως σημείο ευρετηρίου) Καταλήξεις: o ao cao acao cacao Trie Καταλήξεων o c a a c c o o a a o Κανονικά ταξινομημένα o CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 75 Suffix Trie για τη λέξη cacao (θεωρώντας κάθε θέση ως σημείο ευρετηρίου) Καταλήξεις: o ao cao acao cacao caca o cac a ca c c a o ε c cao a o a c o o ac a aca o ao acao cacao CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 76 Ανάκτηση Πληροφορίας

39 Δένδρα και Πίνακες Καταλήξεων (Suffix Trees and Arrays ) Γενική ιδέα Βλέπουμε όλο το κείμενο ως μία μακριά συμβολοσειρά (long string) Θεωρούμε κάθε θέση του κειμένου ως κατάληξη κειμένου (text suffix) Δύο καταλήξεις που ξεκινούν από διαφορετικές θέσεις είναι λεξικογραφικά διαφορετικές άρα κάθε κατάληξη προσδιορίζεται μοναδικά από τη θέση της αρχής της Επιλογές Ευρετηριάζουμε όλες τις θέσεις του κειμένου Ευρετηριάζουμε κάποιες θέσεις του κειμένου (π.χ. μόνο τις αρχές λέξεων) Άρα εδώ έχουμε την έννοια του σημείου ευρετηρίου (index point) Τα σημεία που δεν είναι σημεία ευρετηρίου δεν είναι παραδόσιμα (deliverable) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 77 Παράδειγμα καταλήξεων (θεωρώντας ως σημεία ευρετηρίου (index points) τις αρχές των λέξεων) This is a text. A text has many words. Words are made from letters. letters. made from letters. Words are made from letters. words. Words are made from letters. many words. Words are made from letters. text has many words. Words are made from letters. text. A text has many words. Words are made from letters. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 78 Ανάκτηση Πληροφορίας

40 Δένδρα Καταλήξεων (Suffix Trees) Δένδρο Καταλήξεων: Το δένδρο καταλήξεων ενός κειμένου είναι ένα trie πάνω σε όλες τις καταλήξεις του κειμένου. Οι δείκτες προς το κείμενο αποθηκεύονται στα φύλλα του δένδρου. Για μείωση του χώρου, το trie συμπυκνώνεται ως ένα Patricia tree Patricia = Practical Algorithm To Retrieve Information Coded in Alphanumerical CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 79 Παράδειγμα καταλήξεων και του αντίστοιχου Suffix Trie This is a text. A text has many words. Words are made from letters. letters. made from letters. Words are made from letters. words. Words are made from letters. many words. Words are made from letters. text has many words. Words are made from letters. text. A text has many words. Words are made from letters. Suffix Trie l d a m n t e x t. 11 w o r d s CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 80 Ανάκτηση Πληροφορίας

41 Suffix tree = Suffix trie compacted into a Patricia tree This involves compressing unary paths, ι.e. paths where each node has just one child. If unary paths are not present, the tree has O(n) nodes instead of the worstcase O(n 2 ) of the trie. Suffix Trie Suffix Tree l d a m n t e x t. 11 w o r d s l 3 m d n 28 1 t w CS463 - Information Retrieval Systems Yannis Tzitzikas, Τι είναιu. αυτοί of Crete οι αριθμοί; 81 Πίνακες Καταλήξεων (Suffix arrays) Ανάκτηση Πληροφορίας

42 Πίνακες Καταλήξεων (Suffix arrays) (Space efficient implementation of suffix trees) Suffix trees have a space overhead of 120%-240% over the text size (assuming that index points = word beginnings) assuming node size of 12 or 24 bytes Now we will present a data structure with space requirements like those of the inverted file (~40% overhead over the text size) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 83 Πίνακες Καταλήξεων (Suffix arrays) (Space efficient implementation of suffix trees) Πίνακας Καταλήξεων: Πίνακας με δείκτες προς όλες τις «καταλήξεις» σε λεξικογραφική σειρά Για να τον δημιουργήσουμε αρκεί μια depth-fist-search διάσχιση του suffix tree This is a text. A text has many words. Words are made from letters l 3 m d n 28 1 t 19 w Suffix Tree 33 Suffix Array l m m t t w w CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 84 Ανάκτηση Πληροφορίας

43 Πίνακες Καταλήξεων This is a text. A text has many words. Words are made from letters. Suffix Tree l 3 m d n 28 1 t w Suffix Array l m m t t w w Οφέλη: Μείωση χώρου κρατάμε 1 δείκτη ανά κατάληξη (7 καταλήξεις, πίνακας 7 κελιών) (space overhead ~ that of inverted files) Δυνατότητα binary search CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 85 Πίνακες Καταλήξεων(III) This is a text. A text has many words. Words are made from letters. Suffix Tree l 3 m d n 28 1 t w Suffix Array l m m t t w w Αναζήτηση βάσει Suffix Array Γιαναδούμεανυπάρχειμιακατάληξηστο κείμενο κάνουμε δυαδική αναζήτηση (binary search) στο περιεχόμενο των δεικτών CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 86 Ανάκτηση Πληροφορίας

44 Πίνακες Καταλήξεων(IV) Αναζήτηση βάσει Suffix Array Για να δούμε αν υπάρχει μια κατάληξη στο κείμενο κάνουμε δυαδική αναζήτηση (binary search) στο περιεχόμενο των δεικτών Μπορεί να οδηγήσει σε πολλά disk accesses Therefore if vocabulary is big (and the suffix array does not fit in main memory), supra indices are employed they store the first l characters for each of every b entries of the suffix array Supra-Index lett text word l=4, b=3 Suffix Array l m m t t w w CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 87 Πίνακες Καταλήξεων (με supra-index) έναντι Ανεστραμμένων Αρχείων For word-indexing suffix array, it has been suggested that a new sample could be taken each time the first word of the suffix changes, and to store the word instead of l characters This is exactly as having a vocabulary of the text plus pointers to the array The only important difference between this structure and an inverted index is that the occurrences of each word in an inverted index are stored by text position, while in a suffix array they are stored lexicographically by the text following the word. CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 88 Ανάκτηση Πληροφορίας

45 Δένδρα και Πίνακες Καταλήξεων Κόστος Αποτίμησης Επερωτήσεων Κόστος αναζήτησης μιας συμβολοσειράς μήκους m χαρακτήρων O(m) στην περίπτωση των δένδρων καταλήξεων (suffix tree) O(log n) στην περίπτωση των πινάκων καταλήξεων (suffix array) θυμηθείτε οτι κάθε σημείο του κειμένου προσδιορίζει μια κατάληξη Αποτίμηση phrase queries Η φράση αναζητείται σαν να ήταν μια συμβολοσειρά Αποτίμηση proximity queries proximity queries have to be resolved element wise CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 89 Ανάκτηση Πληροφορίας

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηριασμός, Αποθήκευση και Οργάνωση Αρχείων Κειμένων (Indexing,

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι

Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and File Organization) ΜΕΡΟΣ Ι Κεφάλαιο 8 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 Ανάκτηση Πληροφορίας 2009-2010 1 Δομές

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #10 εικτοδότηση και Αναζήτηση Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια

Διαβάστε περισσότερα

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible. B-Trees Index files can become quite large for large main files Indices on index files are possible 3 rd -level index 2 nd -level index 1 st -level index Main file 1 The 1 st -level index consists of pairs

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #11 Suffix Arrays Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης Το παρόν

Διαβάστε περισσότερα

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required) Phys460.nb 81 ψ n (t) is still the (same) eigenstate of H But for tdependent H. The answer is NO. 5.5.5. Solution for the tdependent Schrodinger s equation If we assume that at time t 0, the electron starts

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :

Διαβάστε περισσότερα

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch: HOMEWORK 4 Problem a For the fast loading case, we want to derive the relationship between P zz and λ z. We know that the nominal stress is expressed as: P zz = ψ λ z where λ z = λ λ z. Therefore, applying

Διαβάστε περισσότερα

Block Ciphers Modes. Ramki Thurimella

Block Ciphers Modes. Ramki Thurimella Block Ciphers Modes Ramki Thurimella Only Encryption I.e. messages could be modified Should not assume that nonsensical messages do no harm Always must be combined with authentication 2 Padding Must be

Διαβάστε περισσότερα

Approximation of distance between locations on earth given by latitude and longitude

Approximation of distance between locations on earth given by latitude and longitude Approximation of distance between locations on earth given by latitude and longitude Jan Behrens 2012-12-31 In this paper we shall provide a method to approximate distances between two points on earth

Διαβάστε περισσότερα

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη Ευρετήρια Βάσεις Δεδομένων Διδάσκων: Μαρία Χαλκίδη Βασικές έννοιες Οι μηχανισμοί δεικτοδότησης χρησιμοποιούνται για να επιταχύνουν την προσπέλαση σε επιθυμητά δεδομένα. π.χ., author catalog in library

Διαβάστε περισσότερα

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Να γραφεί πρόγραμμα το οποίο δέχεται ως είσοδο μια ακολουθία S από n (n 40) ακέραιους αριθμούς και επιστρέφει ως έξοδο δύο ακολουθίες από θετικούς ακέραιους

Διαβάστε περισσότερα

EE512: Error Control Coding

EE512: Error Control Coding EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3

Διαβάστε περισσότερα

Homework 3 Solutions

Homework 3 Solutions Homework 3 Solutions Igor Yanovsky (Math 151A TA) Problem 1: Compute the absolute error and relative error in approximations of p by p. (Use calculator!) a) p π, p 22/7; b) p π, p 3.141. Solution: For

Διαβάστε περισσότερα

2 Composition. Invertible Mappings

2 Composition. Invertible Mappings Arkansas Tech University MATH 4033: Elementary Modern Algebra Dr. Marcel B. Finan Composition. Invertible Mappings In this section we discuss two procedures for creating new mappings from old ones, namely,

Διαβάστε περισσότερα

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS CHAPTER 5 SOLVING EQUATIONS BY ITERATIVE METHODS EXERCISE 104 Page 8 1. Find the positive root of the equation x + 3x 5 = 0, correct to 3 significant figures, using the method of bisection. Let f(x) =

Διαβάστε περισσότερα

C.S. 430 Assignment 6, Sample Solutions

C.S. 430 Assignment 6, Sample Solutions C.S. 430 Assignment 6, Sample Solutions Paul Liu November 15, 2007 Note that these are sample solutions only; in many cases there were many acceptable answers. 1 Reynolds Problem 10.1 1.1 Normal-order

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011 Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university

Διαβάστε περισσότερα

derivation of the Laplacian from rectangular to spherical coordinates

derivation of the Laplacian from rectangular to spherical coordinates derivation of the Laplacian from rectangular to spherical coordinates swapnizzle 03-03- :5:43 We begin by recognizing the familiar conversion from rectangular to spherical coordinates (note that φ is used

Διαβάστε περισσότερα

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω 0 1 2 3 4 5 6 ω ω + 1 ω + 2 ω + 3 ω + 4 ω2 ω2 + 1 ω2 + 2 ω2 + 3 ω3 ω3 + 1 ω3 + 2 ω4 ω4 + 1 ω5 ω 2 ω 2 + 1 ω 2 + 2 ω 2 + ω ω 2 + ω + 1 ω 2 + ω2 ω 2 2 ω 2 2 + 1 ω 2 2 + ω ω 2 3 ω 3 ω 3 + 1 ω 3 + ω ω 3 +

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Φροντιστήριο 3

Ανάκτηση Πληροφορίας. Φροντιστήριο 3 Ανάκτηση Πληροφορίας Φροντιστήριο 3 Τσιράκης Νίκος Νοέμβριος 2007 2 Περιεχόμενα Ανεστραμμένα Αρχεία Εισαγωγή Δημιουργία Συμπίεση Πιθανοτικά Μοντέλα 3 Ανεστραμμένα Αρχεία 4 Εισαγωγή Με ποιους τρόπους μπορούμε

Διαβάστε περισσότερα

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Συστήματα Διαχείρισης Βάσεων Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 9: Transactions - part 1 Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών Tutorial on Undo, Redo and Undo/Redo

Διαβάστε περισσότερα

Ανάκτηση πληροφορίας

Ανάκτηση πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 7: Κατάλογοι Υπογραφών Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Section 8.3 Trigonometric Equations

Section 8.3 Trigonometric Equations 99 Section 8. Trigonometric Equations Objective 1: Solve Equations Involving One Trigonometric Function. In this section and the next, we will exple how to solving equations involving trigonometric functions.

Διαβάστε περισσότερα

Fractional Colorings and Zykov Products of graphs

Fractional Colorings and Zykov Products of graphs Fractional Colorings and Zykov Products of graphs Who? Nichole Schimanski When? July 27, 2011 Graphs A graph, G, consists of a vertex set, V (G), and an edge set, E(G). V (G) is any finite set E(G) is

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Συστήματα Διαχείρισης Βάσεων Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 5: Tutorial on External Sorting Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών TUTORIAL ON EXTERNAL SORTING

Διαβάστε περισσότερα

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β 3.4 SUM AND DIFFERENCE FORMULAS Page Theorem cos(αβ cos α cos β -sin α cos(α-β cos α cos β sin α NOTE: cos(αβ cos α cos β cos(α-β cos α -cos β Proof of cos(α-β cos α cos β sin α Let s use a unit circle

Διαβάστε περισσότερα

ST5224: Advanced Statistical Theory II

ST5224: Advanced Statistical Theory II ST5224: Advanced Statistical Theory II 2014/2015: Semester II Tutorial 7 1. Let X be a sample from a population P and consider testing hypotheses H 0 : P = P 0 versus H 1 : P = P 1, where P j is a known

Διαβάστε περισσότερα

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

Main source: Discrete-time systems and computer control by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1 Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1 A Brief History of Sampling Research 1915 - Edmund Taylor Whittaker (1873-1956) devised a

Διαβάστε περισσότερα

εικτοδότηση και Αναζήτηση (Indexing & Searching) Ανάκτηση Πληροφορίας

εικτοδότηση και Αναζήτηση (Indexing & Searching) Ανάκτηση Πληροφορίας εικτοδότηση και Αναζήτηση (Indexing & Searching) 1 Εισαγωγή Με ποιους τρόπους µπορούµενααναζητήσουµε πληροφορία από µία συλλογή κειµένων; Ο πιο απλός και εύκολα υλοποιήσιµος τρόπος είναι να ψάξουµεσειριακάόλατακείµενα

Διαβάστε περισσότερα

The Simply Typed Lambda Calculus

The Simply Typed Lambda Calculus Type Inference Instead of writing type annotations, can we use an algorithm to infer what the type annotations should be? That depends on the type system. For simple type systems the answer is yes, and

Διαβάστε περισσότερα

Every set of first-order formulas is equivalent to an independent set

Every set of first-order formulas is equivalent to an independent set Every set of first-order formulas is equivalent to an independent set May 6, 2008 Abstract A set of first-order formulas, whatever the cardinality of the set of symbols, is equivalent to an independent

Διαβάστε περισσότερα

Elements of Information Theory

Elements of Information Theory Elements of Information Theory Model of Digital Communications System A Logarithmic Measure for Information Mutual Information Units of Information Self-Information News... Example Information Measure

Διαβάστε περισσότερα

Partial Differential Equations in Biology The boundary element method. March 26, 2013

Partial Differential Equations in Biology The boundary element method. March 26, 2013 The boundary element method March 26, 203 Introduction and notation The problem: u = f in D R d u = ϕ in Γ D u n = g on Γ N, where D = Γ D Γ N, Γ D Γ N = (possibly, Γ D = [Neumann problem] or Γ N = [Dirichlet

Διαβάστε περισσότερα

The challenges of non-stable predicates

The challenges of non-stable predicates The challenges of non-stable predicates Consider a non-stable predicate Φ encoding, say, a safety property. We want to determine whether Φ holds for our program. The challenges of non-stable predicates

Διαβάστε περισσότερα

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ting Zhang Stanford May 11, 2001 Stanford, 5/11/2001 1 Outline Ordinal Classification Ordinal Addition Ordinal Multiplication Ordinal

Διαβάστε περισσότερα

Example Sheet 3 Solutions

Example Sheet 3 Solutions Example Sheet 3 Solutions. i Regular Sturm-Liouville. ii Singular Sturm-Liouville mixed boundary conditions. iii Not Sturm-Liouville ODE is not in Sturm-Liouville form. iv Regular Sturm-Liouville note

Διαβάστε περισσότερα

Concrete Mathematics Exercises from 30 September 2016

Concrete Mathematics Exercises from 30 September 2016 Concrete Mathematics Exercises from 30 September 2016 Silvio Capobianco Exercise 1.7 Let H(n) = J(n + 1) J(n). Equation (1.8) tells us that H(2n) = 2, and H(2n+1) = J(2n+2) J(2n+1) = (2J(n+1) 1) (2J(n)+1)

Διαβάστε περισσότερα

Section 7.6 Double and Half Angle Formulas

Section 7.6 Double and Half Angle Formulas 09 Section 7. Double and Half Angle Fmulas To derive the double-angles fmulas, we will use the sum of two angles fmulas that we developed in the last section. We will let α θ and β θ: cos(θ) cos(θ + θ)

Διαβάστε περισσότερα

Διάρθρωση. Στατιστικά Κειμένου Text Statistics. Συχνότητα Εμφάνισης Λέξεων Ο Νόμος του Zipf Ο Νόμος του Heaps. Ανάκτηση Πληροφορίας 2008-2009 1

Διάρθρωση. Στατιστικά Κειμένου Text Statistics. Συχνότητα Εμφάνισης Λέξεων Ο Νόμος του Zipf Ο Νόμος του Heaps. Ανάκτηση Πληροφορίας 2008-2009 1 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 Στατιστικά Κειμένου Text Statistics CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete, Spring 2008 1 Διάρθρωση Συχνότητα Εμφάνισης

Διαβάστε περισσότερα

the total number of electrons passing through the lamp.

the total number of electrons passing through the lamp. 1. A 12 V 36 W lamp is lit to normal brightness using a 12 V car battery of negligible internal resistance. The lamp is switched on for one hour (3600 s). For the time of 1 hour, calculate (i) the energy

Διαβάστε περισσότερα

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Δομές Δεδομένων Συμβολοσειρές Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Συμβολοσειρές Συμβολοσειρές και προβλήματα που αφορούν συμβολοσειρές εμφανίζονται τόσο συχνά που

Διαβάστε περισσότερα

Matrices and Determinants

Matrices and Determinants Matrices and Determinants SUBJECTIVE PROBLEMS: Q 1. For what value of k do the following system of equations possess a non-trivial (i.e., not all zero) solution over the set of rationals Q? x + ky + 3z

Διαβάστε περισσότερα

2. THEORY OF EQUATIONS. PREVIOUS EAMCET Bits.

2. THEORY OF EQUATIONS. PREVIOUS EAMCET Bits. EAMCET-. THEORY OF EQUATIONS PREVIOUS EAMCET Bits. Each of the roots of the equation x 6x + 6x 5= are increased by k so that the new transformed equation does not contain term. Then k =... - 4. - Sol.

Διαβάστε περισσότερα

ANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =?

ANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =? Teko Classes IITJEE/AIEEE Maths by SUHAAG SIR, Bhopal, Ph (0755) 3 00 000 www.tekoclasses.com ANSWERSHEET (TOPIC DIFFERENTIAL CALCULUS) COLLECTION # Question Type A.Single Correct Type Q. (A) Sol least

Διαβάστε περισσότερα

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2007-2008 Εαρινό Εξάµηνο Άσκηση 1 Φροντιστήριο 4 Θεωρείστε ένα έγγραφο με περιεχόμενο «αυτό είναι ένα κείμενο και

Διαβάστε περισσότερα

4.6 Autoregressive Moving Average Model ARMA(1,1)

4.6 Autoregressive Moving Average Model ARMA(1,1) 84 CHAPTER 4. STATIONARY TS MODELS 4.6 Autoregressive Moving Average Model ARMA(,) This section is an introduction to a wide class of models ARMA(p,q) which we will consider in more detail later in this

Διαβάστε περισσότερα

Instruction Execution Times

Instruction Execution Times 1 C Execution Times InThisAppendix... Introduction DL330 Execution Times DL330P Execution Times DL340 Execution Times C-2 Execution Times Introduction Data Registers This appendix contains several tables

Διαβάστε περισσότερα

Math 6 SL Probability Distributions Practice Test Mark Scheme

Math 6 SL Probability Distributions Practice Test Mark Scheme Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Δημήτρης Πλεξουσάκης. Physical DB Design

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Δημήτρης Πλεξουσάκης. Physical DB Design Data Structures for Primary Indices Structures that determine the location of the records of a file A primary index is based on a key; the location of a record is determined by its key value. Most common

Διαβάστε περισσότερα

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ.

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ. Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο The time integral of a force is referred to as impulse, is determined by and is obtained from: Newton s 2 nd Law of motion states that the action

Διαβάστε περισσότερα

Areas and Lengths in Polar Coordinates

Areas and Lengths in Polar Coordinates Kiryl Tsishchanka Areas and Lengths in Polar Coordinates In this section we develop the formula for the area of a region whose boundary is given by a polar equation. We need to use the formula for the

Διαβάστε περισσότερα

Finite Field Problems: Solutions

Finite Field Problems: Solutions Finite Field Problems: Solutions 1. Let f = x 2 +1 Z 11 [x] and let F = Z 11 [x]/(f), a field. Let Solution: F =11 2 = 121, so F = 121 1 = 120. The possible orders are the divisors of 120. Solution: The

Διαβάστε περισσότερα

PARTIAL NOTES for 6.1 Trigonometric Identities

PARTIAL NOTES for 6.1 Trigonometric Identities PARTIAL NOTES for 6.1 Trigonometric Identities tanθ = sinθ cosθ cotθ = cosθ sinθ BASIC IDENTITIES cscθ = 1 sinθ secθ = 1 cosθ cotθ = 1 tanθ PYTHAGOREAN IDENTITIES sin θ + cos θ =1 tan θ +1= sec θ 1 + cot

Διαβάστε περισσότερα

Areas and Lengths in Polar Coordinates

Areas and Lengths in Polar Coordinates Kiryl Tsishchanka Areas and Lengths in Polar Coordinates In this section we develop the formula for the area of a region whose boundary is given by a polar equation. We need to use the formula for the

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006 ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/26 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι το 1 εκτός αν ορίζεται διαφορετικά στη διατύπωση

Διαβάστε περισσότερα

Αντισταθμιστική ανάλυση

Αντισταθμιστική ανάλυση Αντισταθμιστική ανάλυση Θεωρήστε έναν αλγόριθμο Α που χρησιμοποιεί μια δομή δεδομένων Δ : Κατά τη διάρκεια εκτέλεσης του Α η Δ πραγματοποιεί μία ακολουθία από πράξεις. Παράδειγμα: Θυμηθείτε το πρόβλημα

Διαβάστε περισσότερα

(C) 2010 Pearson Education, Inc. All rights reserved.

(C) 2010 Pearson Education, Inc. All rights reserved. Connectionless transmission with datagrams. Connection-oriented transmission is like the telephone system You dial and are given a connection to the telephone of fthe person with whom you wish to communicate.

Διαβάστε περισσότερα

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions SCHOOL OF MATHEMATICAL SCIENCES GLMA Linear Mathematics 00- Examination Solutions. (a) i. ( + 5i)( i) = (6 + 5) + (5 )i = + i. Real part is, imaginary part is. (b) ii. + 5i i ( + 5i)( + i) = ( i)( + i)

Διαβάστε περισσότερα

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 5: Στατιστικά Συλλογής. Συμπίεση.

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 5: Στατιστικά Συλλογής. Συμπίεση. ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 5: Στατιστικά Συλλογής. Συμπίεση. 1 Κεφ. 4-5 Τι θα δούμε σήμερα Κατασκευή ευρετηρίου Στατιστικά για τη συλλογή Συμπίεση 2 ΣΤΑΤΙΣΤΙΚΑ

Διαβάστε περισσότερα

Review Test 3. MULTIPLE CHOICE. Choose the one alternative that best completes the statement or answers the question.

Review Test 3. MULTIPLE CHOICE. Choose the one alternative that best completes the statement or answers the question. Review Test MULTIPLE CHOICE. Choose the one alternative that best completes the statement or answers the question. Find the exact value of the expression. 1) sin - 11π 1 1) + - + - - ) sin 11π 1 ) ( -

Διαβάστε περισσότερα

Math221: HW# 1 solutions

Math221: HW# 1 solutions Math: HW# solutions Andy Royston October, 5 7.5.7, 3 rd Ed. We have a n = b n = a = fxdx = xdx =, x cos nxdx = x sin nx n sin nxdx n = cos nx n = n n, x sin nxdx = x cos nx n + cos nxdx n cos n = + sin

Διαβάστε περισσότερα

Συντακτικές λειτουργίες

Συντακτικές λειτουργίες 2 Συντακτικές λειτουργίες (Syntactic functions) A. Πτώσεις και συντακτικές λειτουργίες (Cases and syntactic functions) The subject can be identified by asking ποιος (who) or τι (what) the sentence is about.

Διαβάστε περισσότερα

Statistical Inference I Locally most powerful tests

Statistical Inference I Locally most powerful tests Statistical Inference I Locally most powerful tests Shirsendu Mukherjee Department of Statistics, Asutosh College, Kolkata, India. shirsendu st@yahoo.co.in So far we have treated the testing of one-sided

Διαβάστε περισσότερα

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι She selects the option. Jenny starts with the al listing. This has employees listed within She drills down through the employee. The inferred ER sttricture relates this to the redcords in the databasee

Διαβάστε περισσότερα

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8 questions or comments to Dan Fetter 1

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8  questions or comments to Dan Fetter 1 Eon : Fall 8 Suggested Solutions to Problem Set 8 Email questions or omments to Dan Fetter Problem. Let X be a salar with density f(x, θ) (θx + θ) [ x ] with θ. (a) Find the most powerful level α test

Διαβάστε περισσότερα

TMA4115 Matematikk 3

TMA4115 Matematikk 3 TMA4115 Matematikk 3 Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet Trondheim Spring 2010 Lecture 12: Mathematics Marvellous Matrices Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet

Διαβάστε περισσότερα

Homework 8 Model Solution Section

Homework 8 Model Solution Section MATH 004 Homework Solution Homework 8 Model Solution Section 14.5 14.6. 14.5. Use the Chain Rule to find dz where z cosx + 4y), x 5t 4, y 1 t. dz dx + dy y sinx + 4y)0t + 4) sinx + 4y) 1t ) 0t + 4t ) sinx

Διαβάστε περισσότερα

Lecture 2. Soundness and completeness of propositional logic

Lecture 2. Soundness and completeness of propositional logic Lecture 2 Soundness and completeness of propositional logic February 9, 2004 1 Overview Review of natural deduction. Soundness and completeness. Semantics of propositional formulas. Soundness proof. Completeness

Διαβάστε περισσότερα

9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr

9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr 9.9 #. Area inside the oval limaçon r = + cos. To graph, start with = so r =. Compute d = sin. Interesting points are where d vanishes, or at =,,, etc. For these values of we compute r:,,, and the values

Διαβάστε περισσότερα

Capacitors - Capacitance, Charge and Potential Difference

Capacitors - Capacitance, Charge and Potential Difference Capacitors - Capacitance, Charge and Potential Difference Capacitors store electric charge. This ability to store electric charge is known as capacitance. A simple capacitor consists of 2 parallel metal

Διαβάστε περισσότερα

Numerical Analysis FMN011

Numerical Analysis FMN011 Numerical Analysis FMN011 Carmen Arévalo Lund University carmen@maths.lth.se Lecture 12 Periodic data A function g has period P if g(x + P ) = g(x) Model: Trigonometric polynomial of order M T M (x) =

Διαβάστε περισσότερα

Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in

Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in : tail in X, head in A nowhere-zero Γ-flow is a Γ-circulation such that

Διαβάστε περισσότερα

Μηχανική Μάθηση Hypothesis Testing

Μηχανική Μάθηση Hypothesis Testing ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Μηχανική Μάθηση Hypothesis Testing Γιώργος Μπορμπουδάκης Τμήμα Επιστήμης Υπολογιστών Procedure 1. Form the null (H 0 ) and alternative (H 1 ) hypothesis 2. Consider

Διαβάστε περισσότερα

Αρχεία και Βάσεις Δεδομένων

Αρχεία και Βάσεις Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Αρχεία και Βάσεις Δεδομένων Διάλεξη 18η: Φυσική Σχεδίαση Βάσεων Δεδομένων Τμήμα Επιστήμης Υπολογιστών Data Structures for Primary Indices Structures that determine

Διαβάστε περισσότερα

Practice Exam 2. Conceptual Questions. 1. State a Basic identity and then verify it. (a) Identity: Solution: One identity is csc(θ) = 1

Practice Exam 2. Conceptual Questions. 1. State a Basic identity and then verify it. (a) Identity: Solution: One identity is csc(θ) = 1 Conceptual Questions. State a Basic identity and then verify it. a) Identity: Solution: One identity is cscθ) = sinθ) Practice Exam b) Verification: Solution: Given the point of intersection x, y) of the

Διαβάστε περισσότερα

Solutions to Exercise Sheet 5

Solutions to Exercise Sheet 5 Solutions to Eercise Sheet 5 jacques@ucsd.edu. Let X and Y be random variables with joint pdf f(, y) = 3y( + y) where and y. Determine each of the following probabilities. Solutions. a. P (X ). b. P (X

Διαβάστε περισσότερα

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΗΥ463 Συστήµατα Ανάκτησης Πληροφοριών Εργασία: Ανεστραµµένο Ευρετήριο Εισαγωγή Σκοπός της εργασίας είναι η δηµιουργία ενός ανεστραµµένου ευρετηρίου για τη µηχανή αναζήτησης Μίτος, το

Διαβάστε περισσότερα

Assalamu `alaikum wr. wb.

Assalamu `alaikum wr. wb. LUMP SUM Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. LUMP SUM Lump sum lump sum lump sum. lump sum fixed price lump sum lump

Διαβάστε περισσότερα

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1.

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1. Exercises 0 More exercises are available in Elementary Differential Equations. If you have a problem to solve any of them, feel free to come to office hour. Problem Find a fundamental matrix of the given

Διαβάστε περισσότερα

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Information Retrieval. Διδάσκων Δημήτριος Κατσαρός Ανάκληση Πληροφορίας Information Retrieval Διδάσκων Δημήτριος Κατσαρός Διάλεξη 5η: 26/02/2014 1 Phrase queries 2 Phrase queries Want to answer queries such as stanford university as a phrase Thus the sentence

Διαβάστε περισσότερα

Galatia SIL Keyboard Information

Galatia SIL Keyboard Information Galatia SIL Keyboard Information Keyboard ssignments The main purpose of the keyboards is to provide a wide range of keying options, so many characters can be entered in multiple ways. If you are typing

Διαβάστε περισσότερα

( y) Partial Differential Equations

( y) Partial Differential Equations Partial Dierential Equations Linear P.D.Es. contains no owers roducts o the deendent variables / an o its derivatives can occasionall be solved. Consider eamle ( ) a (sometimes written as a ) we can integrate

Διαβάστε περισσότερα

b. Use the parametrization from (a) to compute the area of S a as S a ds. Be sure to substitute for ds!

b. Use the parametrization from (a) to compute the area of S a as S a ds. Be sure to substitute for ds! MTH U341 urface Integrals, tokes theorem, the divergence theorem To be turned in Wed., Dec. 1. 1. Let be the sphere of radius a, x 2 + y 2 + z 2 a 2. a. Use spherical coordinates (with ρ a) to parametrize.

Διαβάστε περισσότερα

Example of the Baum-Welch Algorithm

Example of the Baum-Welch Algorithm Example of the Baum-Welch Algorithm Larry Moss Q520, Spring 2008 1 Our corpus c We start with a very simple corpus. We take the set Y of unanalyzed words to be {ABBA, BAB}, and c to be given by c(abba)

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων Εξάμηνο 7 ο Procedures and Functions Stored procedures and functions are named blocks of code that enable you to group and organize a series of SQL and PL/SQL

Διαβάστε περισσότερα

On a four-dimensional hyperbolic manifold with finite volume

On a four-dimensional hyperbolic manifold with finite volume BULETINUL ACADEMIEI DE ŞTIINŢE A REPUBLICII MOLDOVA. MATEMATICA Numbers 2(72) 3(73), 2013, Pages 80 89 ISSN 1024 7696 On a four-dimensional hyperbolic manifold with finite volume I.S.Gutsul Abstract. In

Διαβάστε περισσότερα

[1] P Q. Fig. 3.1

[1] P Q. Fig. 3.1 1 (a) Define resistance....... [1] (b) The smallest conductor within a computer processing chip can be represented as a rectangular block that is one atom high, four atoms wide and twenty atoms long. One

Διαβάστε περισσότερα

Tridiagonal matrices. Gérard MEURANT. October, 2008

Tridiagonal matrices. Gérard MEURANT. October, 2008 Tridiagonal matrices Gérard MEURANT October, 2008 1 Similarity 2 Cholesy factorizations 3 Eigenvalues 4 Inverse Similarity Let α 1 ω 1 β 1 α 2 ω 2 T =......... β 2 α 1 ω 1 β 1 α and β i ω i, i = 1,...,

Διαβάστε περισσότερα

Other Test Constructions: Likelihood Ratio & Bayes Tests

Other Test Constructions: Likelihood Ratio & Bayes Tests Other Test Constructions: Likelihood Ratio & Bayes Tests Side-Note: So far we have seen a few approaches for creating tests such as Neyman-Pearson Lemma ( most powerful tests of H 0 : θ = θ 0 vs H 1 :

Διαβάστε περισσότερα

The Probabilistic Method - Probabilistic Techniques. Lecture 7: The Janson Inequality

The Probabilistic Method - Probabilistic Techniques. Lecture 7: The Janson Inequality The Probabilistic Method - Probabilistic Techniques Lecture 7: The Janson Inequality Sotiris Nikoletseas Associate Professor Computer Engineering and Informatics Department 2014-2015 Sotiris Nikoletseas,

Διαβάστε περισσότερα

forms This gives Remark 1. How to remember the above formulas: Substituting these into the equation we obtain with

forms This gives Remark 1. How to remember the above formulas: Substituting these into the equation we obtain with Week 03: C lassification of S econd- Order L inear Equations In last week s lectures we have illustrated how to obtain the general solutions of first order PDEs using the method of characteristics. We

Διαβάστε περισσότερα