Ανάκτηση Κειμένου (εισαγωγικά θέματα)

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ανάκτηση Κειμένου (εισαγωγικά θέματα)"

Transcript

1 Ανάκτηση Κειμένου και από τον Παγκόσμιο Ιστό Ανάκτηση Κειμένου (εισαγωγικά θέματα) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Βάσεις Κειμένων (document databases) Μεγάλη συλλογή από κείμενα από διάφορες πηγές: news articles, research papers, books, digital libraries, messages, and Web pages, library database, etc. Τα δεδομένα δεν ακολουθούν κάποιο αυστηρό μοντέλο ημιδομημένα semi-structured Information retrieval Ανάκτηση Πληροφορίας Η πληροφορία οργανώνεται σε (ένα μεγάλο αριθμό) από κείμενα -documents Information retrieval problem: εντοπισμός των σχετικών κειμένων (documents) με βάση την είσοδο του χρήστη όπως λέξεις κλειδιά ή παραδείγματα κειμένου Typical IR systems Online library catalogs Online document management systems Information retrieval vs. database systems Some DB problems are not present in IR, e.g., update, transaction management, complex objects Some IR problems are not addressed well in DBMS, e.g., unstructured documents, approximate search using keywords and relevance Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 3 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 4 Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Βασικές έννοιες Ένα κείμενο (αρχείο) document μπορεί να περιγράφει από ένα σύνολο αντιπροσωπευτικών λέξεων-κλειδιά (keywords) που ονομάζονται όροι δεικτοδότησης - index terms. ιαφορετικοί όροι με διαφορετικό βαθμό σχετικότητας μπορούν να χρησιμοποιηθούν για την περιγραφή κειμένων με διαφορετικό περιεχόμενο Αυτό επιτυγχάνεται με την ανάθεση αριθμητικών βαρών (numerical weights) σε κάθε όροι δεικτοδότησης του κειμένου (π.χ.: συχνότητα, tf-idf) Αναλογία με Σ Β : Όροι εικτοδότησης Γνωρίσματα Βάρη Τιμές γνωρισμάτων Αναζήτηση με μια λέξη κλειδί (keyword queries) Αίτημα Boole (t t 2 t i ) (t 2 t 22 t 2i2 ). (t j t j2 t jij ) Όπου τα t ij είναι όροι Αίτημα ιαβάθμισης (Ranking) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 5 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 6

2 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 7 Ανάκτηση Πληροφορίας Ευρετηριοποίηση για την Ανάκτηση Κειμένου Βασικές Μετρικές Relevant Relevant & Retrieved All Documents Retrieved Συνήθως, κατασκευάζονται ευρετήρια που περιέχουν ζεύγη <όρος, id-αρχείου> με πιθανών επιπλέον πεδία όπως η συχνότητα εμφάνισης του όρου στο αρχείο Precision Ακρίβεια : το ποσοστό των ανακτημένων documents που είναι σχετικά με την ερώτηση (δηλαδή, το ποσοστό των «σωστών» απαντήσεων») { Relevant} { Retrieved} precision = { Retrieved} Παρόμοια, δουλεύουν και οι μηχανές αναζήτησης Recall Ανάκληση: το ποσοστό των σχετικών documents που ανακτούνται { Relevant} { Retrieved} recall = { Relevant} Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 8 Ευρετηριοποίηση για την Ανάκτηση Κειμένου Ευρετηριοποίηση για την Ανάκτηση Κειμένου Μια ταξινομημένη λίστα (ανεστραμμένη λίστα) (inverted file, inverted list) για κάθε όρο Παράδειγμα Rid Λέξεις-Κλειδιά agent James Bond 2 agent mobile computer 3 James Madison movie 4 James Bond movie Agent <,2> Bond <,4> Computer <2> James <,3,4> Madison <3> Mobile <2> Movie <3,4> Ευρετήριο Λεξιλογίου: Για τον ταχύτερο εντοπισμό της λίστας για κάθε όρο: Το σύνολο των όρων μπορεί να οργανωθεί με τη χρήση μιας δομής ευρετηρίου (π.χ. Β+-δέντρο) Στα φύλλα, δείκτες προς την αντίστοιχη ανεστραμμένη λίστα Παράδειγμα Ένας όρος, σύζευξη, διάζευξη Παράδειγμα ερωτήσεων Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 9 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 0 Ευρετηριοποίηση για την Ανάκτηση Κειμένου Ευρετηριοποίηση για την Ανάκτηση Κειμένου Υπογραφή εγγράφου (File Signature) Μια εγγραφή ευρετηρίου για κάθε έγγραφο στη βάση δεδομένων Κάθε εγγραφή σταθερό μέγεθος b bits, εύρος της υπογραφής Κατασκευή της υπογραφής ενός αρχείου: Σε κάθε όρο που υπάρχει στο αρχείο, εφαρμόζεται μια συνάρτηση κατακερματισμού, που επιστρέφει ένα αριθμό από το ως το b και το αντίστοιχο bit της υπογραφής του αρχείου γίνεται Για μια ερώτηση, φτιάχνουμε την υπογραφή της και σαρώνουμε τις υπογραφές των αρχείων για να βρούμε κάποια που ταιριάζει False positives Αποφυγή σάρωσης όλου του αρχείου υπογραφών: Αρχείο υπογραφών με κατακόρυφο διαμερισμό σε μονοψήφιες στήλες: ιαμερίζουμε ένα αρχείο υπογραφών σε ένα σύνολο κατακόρυφων δυαδικών στηλών Για κ άσσους ανάκτηση κ-στηλών Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2

3 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 3 Boolean Model υαδικό Μοντέλο Το μοντέλο που είδαμε μέχρι στιγμής θεωρεί ότι οι όροι δεικτοδότησης είναι είτευπάρχουν είτε δεν υπάρχουν στο αρχείο (κείμενο) ηλαδή, τα βάρη είναι όλα δυαδικά (0 ή ) Οι ερωτήσεις είναι όροι συνδεδεμένοι με : not, and, και or πχ.: car and repair, plane or airplane Το δυαδικό μοντέλο προβλέπει ότι ένα αρχείο είναι είτε σχετικό είτε μη σχετικό με βάση ένα ταίριασμα της ερώτησης με το αρχείο Συχνότητα όρου term frequency : πόσες φορές εμφανίζεται ένας όρος σε ένα έγγραφο Κανονικοποιημένο ώστε να αποφύγουμε να δώσουμε μεγαλύτερο βάρος σε μεγάλα έγγραφα Σημασία του όρου t i σε ένα έγγραφο tf i = Μοντέλο με βάρη k ni n k Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 4 Ανεστραμμένη συχνότητα εγγράφου inverse document frequency μετρά πόσο είναι γενικά σημαντικός ένας όρος tfidf = tf idf D αριθμός εγγράφων D idfi = log { d : d ti} Μεγάλη τιμή όταν μεγάλη συχνότητα εμφάνισης (σε ένα συγκεκριμένο έγγραφο) και μικρή συχνότητα εμφάνισης του όρου ε όλη τη συλλογή Βάρος χρήσιμο για να αποφύγουμε κοινούς όρους Έγγραφα στα οποία ανήκει ο όρος t i Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 5 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 6 Άλλα Μοντέλα Ένας πίνακας με τη συχνότητα των όρων (term frequency table) Κάθε εγγραφή frequent_table(i, j) = # of occurrences of the word t in document d i Συνήθως, το ποσοστό (ratio) αντί του πραγματικού αριθμού εμφανίσεων Similarity metrics μετρική ομοιότητας: μεταξύ ενός κειμένου και μιας ερώτησης (συνόλου από λέξεις-κλειδιά - όρους) v v2 Relative term occurrences sim( v, v2) = v v2 Cosine distance: Vector Model Μοντέλο ιανυσμάτων Τα αρχεία και οι ερωτήσεις αναπαρίστανται ως m-διάστατα διανύσματα, όπου m είναι ο συνολικός αριθμός όρων στη συλλογή Ο βαθμός ομοιότητας ενός αρχείου d και μιας ερώτησης q υπολογίζεται ως η συνέλιξη τους, χρησιμοποιώντας μετρικές όπως η Ευκλείδεια απόσταση ή το συνημίτονο της γωνίας των δύο διανυσμάτων Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 7 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 8

4 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 9 Βασική Ιδέα Latent Semantic Indexing Similar documents have similar word frequencies Difficulty: the size of the term frequency matrix is very large Use a singular value decomposition (SVD) techniques to reduce the size of frequency table Retain the K most significant rows of the frequency table Ρίζα λέξεων -Word stem Άλλα Θέματα Several words are small syntactic variants of each other since they share a common word stem E.g., drug, drugs, drugged Συνώνυμα - Synonymy: A keyword T does not appear anywhere in the document, even though the document is closely related to T, e.g., data mining Πολυσημία - Polysemy: The same keyword may mean different things in different contexts, e.g., mining Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 20 Άλλα Θέματα Stop list Set of words that are deemed irrelevant, even though they may appear frequently, πχ, a, the, of, for, to, with, etc. στον Παγκόσμιο Ιστό Οντολογίες -Wordnet Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 22 Εισαγωγή the World-Wide Web The WWW is huge, widely distributed, global information service center for ΥΠΗΡΕΣΙΕΣ - Information services: news, advertisements, consumer information, financial management, education, government, e-commerce, etc. ΣΥΝ ΕΣΜΟΙ - Hyper-link information ΠΛΗΡΟΦΟΡΙΑ ΧΡΗΣΗΣ - Access and usage information WWW provides rich sources for data mining Challenges Too huge for effective data warehousing and data mining Too complex and heterogeneous: no standards and structure Growing and changing very rapidly Hosts Internet growth Broad diversity of user communities 0 Sep-69 Sep-72 Sep-75 Only a small portion of the information on the Web is truly relevant or useful 99% of the Web information is useless to 99% of Web users How can we find high-quality Web pages on a specified topic? Sep-78 Sep-8 Sep-84 Sep-87 Sep-90 Sep-93 Sep-96 Sep-99 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 23 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 24

5 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 25 από το Web Κατηγορίες ς από το Web Ψάχνουμε για Web access patterns Web structures Regularity and dynamics of Web contents Problems The abundance problem: ο αριθμός των σελίδων που συσχετίζονται με έναν όρο μπορεί να είναι πολύ μεγάλος Limited coverage of the Web: hidden Web sources, majority of data in DBMS Limited query interface based on keyword-oriented search Limited customization to individual users περιεχομένου σελίδων Περιεχομένου αποτελεσμάτων αναζήτησης από το Web ομής Ανίχνευση Γενικών Προτύπων Προσπέλασης Χρήσης Ανίχνευση προσαρμοσμένης (customized) χρήσης Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 26 Κατηγορίες ς από το Web από το Web the World-Wide Web Περιεχομένου Web Page Content Web Page Summarization WebLog (Lakshmanan et.al. 996), WebOQL(Mendelzon et.al. 998): Web Structuring query languages; Can identify information within given web pages Ahoy! (Etzioni et.al. 997):Uses heuristics to distinguish personal home pages from other web pages ShopBot (Etzioni et.al. 997): Looks for product prices within web pages αποτελεσμάτων αναζήτησης ομής Ανίχνευση Γενικών Προτύπων Προσπέλασης Χρήσης Ανίχνευση προσαρμοσμένης (customized) χρήσης Web Page Content Web Content Web Search Result Web Structure Search Engine Result Summarization Clustering Search Result (Leouski and Croft, 996, Zamir and Etzioni, 997): Categorizes documents using phrases in titles and snippets Web Usage General Access Pattern Tracking Customized Usage Tracking Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 27 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 28 the World-Wide Web the World-Wide Web Web Web Web Content Search Result Web Page Content Web Structure Using Links PageRank (Brin et al., 998) CLEVER (Chakrabarti et al., 998) Use interconnections between web pages to give weight to pages. Using Generalization MLDB (994), VWV (998) Uses a multi-level database representation of the Web. Counters (popularity) and link lists are used for capturing structure. Web Usage General Access Pattern Tracking Customized Usage Tracking Web Page Content Web Content Search Result Web Structure Web Usage General Access Pattern Tracking Web Log (Zaïane, Xin and Han, 998) Uses KDD techniques to understand general access patterns and trends. Can shed light on better structure and grouping of resource providers. Customized Usage Tracking Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 29 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 30

6 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 3 the World-Wide Web Web Usage Web Page Content Web Content Search Result Web Structure Web Web Usage General Access Customized Usage Tracking Pattern Tracking Adaptive Sites (Perkowitz and Etzioni, 997) Analyzes access patterns of each user at a time. Web site restructures itself automatically by learning from user access patterns. Web log records to discover user access patterns of Web pages Applications Target potential customers for electronic commerce Enhance the quality and delivery of Internet information services to the end user Improve Web server system performance Identify potential prime advertisement locations Web logs provide rich information about Web dynamics Typical Web log entry includes the URL requested, the IP address from which the request originated, and a timestamp Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 32 Techniques for Web usage mining Construct multidimensional view on the Weblog database Perform multidimensional OLAP analysis to find the top N users, top N accessed Web pages, most frequently accessed time periods, etc. Perform data mining on Weblog records Find association patterns, sequential patterns, and trends of Web accessing May need additional information,e.g., user browsing sequences of the Web pages in the Web server buffer Conduct studies to Analyze system performance, improve system design by Web caching, Web page prefetching, and Web page swapping Automatic Classification of Web Documents Assign a class label to each document from a set of predefined topic categories Based on a set of examples of preclassified documents Example Use Yahoo!'s taxonomy and its associated documents as training and test sets Derive a Web document classification scheme Use the scheme classify new Web documents by assigning categories from the same taxonomy Keyword-based document classification methods Statistical models Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 33 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 34 Multilayered Web Information Base Layer 0 : the Web itself Layer : the Web page descriptor layer Contains descriptive information for pages on the Web An abstraction of Layer 0 : substantially smaller but still rich enough to preserve most of the interesting, general information Organized into dozens of semistructured classes document, person, organization, ads, directory, sales, software, game, stocks, library_catalog, geographic_data, scientific_data, etc. Layer 2 and up: various Web directory services constructed on top of Layer provide multidimensional, application-specific services Multiple Layered Web Architecture Layer n More Generalized Descriptions... Layer Generalized Descriptions Layer 0 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 35 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 36

7 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 37 the World-Wide Web Layer-0: Primitive data Layer-: dozen database relations representing types of objects (metadata) document, organization, person, software, game, map, image, document(file_addr, authors, title, publication, publication_date, abstract, language, table_of_contents, category_description, keywords, index, multimedia_attached, num_pages, format, first_paragraphs, size_doc, timestamp, access_frequency, links_out,...) person(last_name, first_name, home_page_addr, position, picture_attached, phone, , office_address, education, research_interests, publications, size_of_home_page, timestamp, access_frequency,...) image(image_addr, author, title, publication_date, category_description, keywords, size, width, height, duration, format, parent_pages, colour_histogram, Colour_layout, Texture_layout, Movement_vector, localisation_vector, timestamp, access_frequency,...) the World-Wide Web Layer-2: simplification of layer- doc_brief(file_addr, authors, title, publication, publication_date, abstract, language, category_description, key_words, major_index, num_pages, format, size_doc, access_frequency, links_out) person_brief (last_name, first_name, publications,affiliation, , research_interests, size_home_page, access_frequency) Layer-3: generalization of layer-2 cs_doc(file_addr, authors, title, publication, publication_date, abstract, language, category_description, keywords, num_pages, form, size_doc, links_out) doc_summary(affiliation, field, publication_year, count, first_author_list, file_addr_list) doc_author_brief(file_addr, authors, affiliation, title, publication, pub_date, category_description, keywords, num_pages, format, size_doc, links_out) person_summary(affiliation, research_interest, year, num_publications, count) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 38 Benefits of Multi-Layer Meta-Web the World-Wide Web Benefits: Multi-dimensional Web info summary analysis Approximate and intelligent query answering Web high-level query answering (WebSQL, WebML) Web content and structure mining Observing the dynamics/evolution of the Web Is it realistic to construct such a meta-web? Benefits even if it is partially constructed Benefits may justify the cost of tool development, standardization and partial restructuring Design of a Web Log Miner Web log is filtered to generate a relational database A data cube is generated form database OLAP is used to drill-down and roll-up in the cube OLAM is used for mining interesting knowledge Web log Database Data Cube Data Cleaning 2 Data Cube Creation 3 OLAP Sliced and diced cube 4 Data Knowledge Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 39 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 40 Μηχανές Αναζήτησης Μηχανές Αναζήτησης Βασισμένες σε ευρετήρια: Αναζητούν σελίδες, τις δεικτοδοτούν και κατασκευάζουν τεράστια ευρετήρια βασισμένα σε λέξεις κλειδιά Χρήσιμες για τον εντοπισμό σελίδων που περιέχουν συγκεκριμένες λέξεις κλειδιά Θα δούμε Page Rank HITS Προβλήματα Ένα θέμα μπορεί να περιέχει χιλιάδες έγγραφα Πολλά σχετικά με κάποιο θέμα έγγραφα μπορεί να μην περιέχουν τις λέξεις κλειδιά που το προσδιορίζουν Και οι δύο εκμεταλλεύονται την ύπαρξη links Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 4 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 42

8 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 43 PageRank: Capturing Page Popularity (Brin & Page 98) Ο αρχικός αλγόριθμος του google, παρουσιάστηκε στην κλασική εργασία: The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin and Lawrence Page Η εργασία περιλαμβάνει μια πολύ ενδιαφέρουσα «ιστορικής σημασίας» εισαγωγή We chose our system name, Google, because it is a common spelling of googol, or 0 00 and fits well with our goal of building very large-scale search engines. The verb, "google", was added to the Merriam Webster Collegiate Dictionary and the Oxford English Dictionary in 2006, meaning, "to use the Google search engine to obtain information on the Internet." (source: Wikipedia) Βασική Ιδέα Ακόμα και αν ένα τεράστιο ευρετήριο με όλες τις λέξεις -> αυτό πουέχεισημασίαείναιοισημαντικέςprecision vs recall Τι είναι σημαντικό οι συνδέσεις Μια σελίδα που δέχεται πολλές αναφορές περιμένει κανείς να είναι γενικά πιο σημαντική Οι Web pages δεν είναι όλες το ίδιο σημαντικές v Αναφορές (Inlinks) ως «ψήφοι» as votes 23,400 inlinks inlink Ο PageRank βασίζεται στην «μέτρηση αναφορών» citation counting, αλλά με μια βελτίωση: Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 44 Βασική Ιδέα Απλή Αναδρομική ιατύπωση εν είναι όλες οι αναφορές το ίδιο σημαντικές! Θεωρεί «έμμεσες αναφορές» indirect citations (αναφορές από σελίδες που επίσης έχουν πολλές αναφορές θεωρούνται πιο σημαντικές) Αναδρομικό πρόβλημα! Η ψήφος κάθε ακμής (αναφοράς) είναι ανάλογη της σημαντικότητας (PR)της σελίδας από την οποία προέρχεται Αν μια σελίδα P με σημαντικότητα (PR) x έχει n outlinks, κάθε link παίρνει x/n ψήφους Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 45 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 46 Παράδειγμα Υπάρχει μια γενική ποσότητα PR που μοιράζεται στις σελίδες του συστήματος. Έστω 4 σελίδες: A, B,C και D. Αρχική προσεγγιστική τιμή για καθεμία PR = 0.25 Έστω B, C, και D έχουν link μόνο στο A, τότε όλα το PageRank PR( ) τους θα μαζευόταν στο Α Γενικός ορισμός του PageRank για μια σελίδα Α: Έστω ότι η A έχει τις σελίδες T...Tn που δείχνουν σε αυτήν (δηλαδή, αναφορές) Έστω C(Τ) ο αριθμός των εξωτερικών ακμών μιας σελίδας Α Έστω τώρα ότι η Β έχει link στη C, και η D έχει links και στο Β και στο C ΗτιμήτουPR μιας σελίδας μοιράζεται ανάμεσα στις εξωτερικές ακμές της Άρα η ψήφος της B έχει αξία για την Α 0.25 και 0.25 για την C. Αντίστοιχα, μόνο το /3 του PageRank του D μετρά για PageRank του Α (περίπου 0.083). PR(A) = PR(T)/C(T) PR(Tn)/C(Tn) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 47 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 48

9 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 49 Απλό μοντέλο «ροής» - flow model Το web το 839 y a/2 Yahoo y/2 y/2 y = y /2 + a /2 a = y /2 + m m = a /2 Λύση των εξισώσεων ροής 3 εξισώσεις, 3 άγνωστοι, όχι σταθερές Μη μοναδική λύση Οι λύσεις ισοδύναμες με scale factor Επιπρόσθετος περιορισμός για μοναδικότητα της λύσης m y+a+m = (το συνολικό PR που μοιράζεται στις σελίδες) y = 2/5, a = 2/5, m = /5 a a/2 m Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 50 ιατύπωσημετηνμορφήπίνακα(παράδειγμα) Ο πίνακας M έχει μια γραμμή και μια στήλη για κάθε web σελίδα (πίνακας γειτνίασης) Έστω ότι η σελίδα j έχει n outlinks Αν j -> i, τότε M ij =/n Αλλιώς, M ij =0 ιατύπωσημετηνμορφήπίνακα M είναι column stochastic matrix Οι στήλες έχουν άθροισμα Yahoo y = y /2 + a /2 a = y /2 + m m = a /2 y a m y /2 /2 0 a /2 0 m 0 /2 0 Άθροισμα (οι ψήφοι του y) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 5 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 52 ιατύπωσημετηνμορφήπίνακα Έστω r ένα διάνυσμα με μια εγγραφή web σελίδα r i είναι η σημαντικότητα (PR) της σελίδας i r: rank vector [PR(y) PR(a) PR(m)] Yahoo y = y /2 + a /2 a = y /2 + m m = a /2 PR ιάνυσμα (παράδειγμα) y a m y /2 /2 0 a /2 0 m 0 /2 0 r = Mr y /2 /2 0 y a = /2 0 a m 0 /2 0 m Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 53 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 54

10 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 55 Έστω ότι η σελίδα j έχει links σε 3 σελίδες, συμπεριλαμβανομένου του i j Ιδιοδιανύσματα (eigenvectors) Οι εξισώσεις ροής μπορούν να γραφούν i /3 M r r = i r = Mr ηλαδή, ο rank vector είναι ένα ιδιοδιάνυσμα (eigenvector) του στοχαστικού πίνακα γειτνίασης του web Συγκεκριμένα είναι το βασικό ιδιοδιάνυσμα (αυτό που αντιστοιχεί στην ιδιοτιμή ) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 56 Power Iteration method Επαναληπτική Μέθοδο Παράδειγμα Ένα απλό επαναληπτικό σχήμα (aka relaxation) Έστω N web σελίδες Αρχικοποίηση: r 0 = [/N,.,/N] T Επανάληψη: r k+ = Mr k Τερματισμός όταν r k+ - r k < ε Yahoo y a m y /2 /2 0 a /2 0 m 0 /2 0 x = i N x i είναι L norm Μπορεί να χρησιμοποιηθούν και άλλες μετρικές, πχ Ευκλείδεια y a = m /3 /3 /3 /3 /2 /6 5/2 /3 /4 3/8 /24 /6... 2/5 2/5 /5 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 57 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 58 Μοντέλο Τυχαίου Surfer (random walk) Tο PageRank μιας σελίδας μπορεί επίσης να θεωρηθεί ότι εκφράζει την πιθανότητα ένας τυχαίος surfer να φτάσει σε αυτήν (δηλαδή, εκφράζει πόσο δημοφιλής είναι) The stationary distribution Ένας τυχαίος surfer ξεκινά από μια τυχαία σελίδα και συνεχίζει να κάνει click σε links, χωρίς να επιστρέφει σε προηγούμενη σελίδα Τη χρονική στιγμή t, ο surfer είναι σε κάποια σελίδα P Τη χρονική στιγμή t+, ο surfer ακολουθεί ένα εξωτερικό link- outlink του P τυχαία - uniformly at random Φτάνει σε κάποια σελίδα Q του P Συνεχίζει την παραπάνω διαδικασία επ άπειρω Έστω p(t) το διάνυσμα του οποίου το i th στοιχείο είναι η πιθανότητα ο surfer να είναι στη σελίδα i τη χρονική στιγμή t p(t) probability distribution - κατανομή πιθανότητας στις σελίδες Where is the surfer at time t+? Follows a link uniformly at random p(t+) = Mp(t) Μ (transition probabaility from state j (web page) state I Suppose the random walk reaches a state such that p(t+) = Mp(t) = p(t) Then p(t) is called a stationary distribution for the random walk Our rank vector r satisfies r = Mr So it is a stationary distribution for the random surfer Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 59 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 60

11 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 6 Spider traps (παράδειγμα) A central result from the theory of random walks (aka Markov processes): For graphs that satisfy certain conditions, the stationary distribution is unique and eventually will be reached no matter what the initial probability distribution at time t = 0. y a = m Yahoo /2 3/2 3/4 /2 7/4 y a m y /2 /2 0 a /2 0 0 m 0 /2 5/8 3/ Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 62 Spider traps (παράδειγμα) Spider traps Yahoo y a m Μια ομάδα σελίδων είναι μια αραχνο-παγίδα spider trap αν δεν υπάρχουν ακμές από την ομάδα σε σελίδες εκτός της ομάδας Οτυχαίοςsurfer παγιδεύεται y /2 /2 0 a /2 0 0 m 0 /2 Οι συνθήκες που χρειάζονται για το θεώρημα των τυχαίων περιπάτων παύουν να ισχύουν y a = m /2 3/2 3/4 /2 7/4 5/8 3/ Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 63 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 64 Επέκταση Μοντέλου Επέκταση Μοντέλου Σε κάθε βήμα, ο τυχαίος surfer έχει δύο δυνατότητες: Με πιθανότητα β, ακολουθεί ένα τυχαίο link Με πιθανότητα -β πετάγεται σε κάποια άλλη σελίδα τυχαία Τιμές για το β Καταφέρνει να βγει από την παγίδα μετά από κάποιες χρονικές στιγμές Αρχικός ορισμός του PageRank για μια σελίδα Α: PR(A) = PR(T)/C(T) PR(Tn)/C(Tn) Ορισμός με τον παράγοντας απόσβεσης d (damping factor) μεταξύ του 0 και του PR(A) = (-d) + d (PR(T)/C(T) PR(Tn)/C(Tn)) Ώστε το άθροισμα να είναι > -d/n Ο πρώτος παράγοντας με την ίδια πιθανότητα διαλέγω οποιαδήποτε σελίδα Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 65 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 66

12 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 67 Παράδειγμα (d=0.8) Μοντέλο Τυχαίου Surfer Ένας τυχαίος surfer ξεκινά από μια τυχαία σελίδα και συνεχίζει να κάνει click σε links, χωρίς να επιστρέφει σε προηγούμενη σελίδα αλλά τελικά βαριέται και ξεκινά από κάποια άλλη τυχαία σελίδα Το d (ο παράγοντας απόσβεσης) είναι η πιθανότητα σε κάθε σελίδα ο τυχαίος surfer να βαρεθεί και να αρχίσει από κάποια άλλη τυχαία σελίδα y a = m Yahoo /2 / / / y 7/5 7/5 /5 a 7/5 /5 /5 m /5 7/5 3/ /3 /3 /3 /3 /3 /3 /3 /3 /3 7/ 5/ 2/ Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 68 Matrix formulation Έστω Ν σελίδες Έστω σελίδα j, με ένα σύνολο outlinks O(j) M ij = / O(j) αν j-> i and M ij = 0 otherwise Η τυχαία μεταπήδηση είναι ισοδύναμη με το Να προσθέσουμε ένα τυχαίο link από το j to σε οποιαδήποτε άλλη σελίδα με (-β)/n Ελάττωση της πιθανότητας να ακολουθήσουμε ένα outlink από / O(j) σε β/ O(j) Ή ισοδύναμα: χρέωσε σε κάθε σελίδα ένα ποσοστό (-β) της τιμής της και κάνε κατανομή αυτού ισοδύναμα Κατασκευή του Νxn πίνακα Α A ij = βm ij + (-β)/n Ο A είναι στοχαστικός πίνακας Το page rank διάνυσμα r είναι το βασικό ιδιοδιάνυσμα αυτού του πίνακα r = Ar Ισοδύναμα, r είναι stationary distribution των τυχαίων περιπάτων με μεταπηδήσεις (random walk with teleports) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 69 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 70 Αδιέξοδα Yahoo /2 /2 0 /3 /3 /3 0.8 / /3 /3 /3 0 /2 0 /3 /3 /3 Οι σελίδες χωρίς outlinks για τον τυχαίο surfer y 7/5 7/5 /5 a 7/5 /5 /5 m /5 7/5 /5 y a = m Nonstochastic! Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 7 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 72

13 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 73 Dealing with dead-ends Μεταπήδηση Για αδιέξοδα, ακολούθησε τυχαία μεταπήδηση με πιθανότητα Τροποποίησε τον πίνακα Ψαλίδισε της -- Prune and propagate Preprocess the graph to eliminate dead-ends Might require multiple passes Compute page rank on reduced graph Approximate values for deadends by propagating values from reduced graph ΜιασελίδαμπορείναέχειυψηλόPR αν υπάρχουν πολλές σελίδες που δείχνουν σε αυτήν ή όταν κάποιες σελίδες που δείχνουν σε αυτήν έχουν υψηλό PR Και οι δύο περιπτώσεις έχουν σημασία: Πχ στη δεύτερη περίπτωση αν υπάρχει link από πχ Yahoo! Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 74 Spamdexing Google: Άλλα στοιχεία Anchor Text Content spam Link spam Google bombing: Προσθήκη αναφορών που επηρεάζουν άμεσα το PR Link farms: Σελίδες που αναφέρονται η μία στην άλλη Το κείμενο που υπάρχει στα links έχει διαφορετική αντιμετώπιση Οι περισσότερες μηχανές αναζήτησης το συσχέτιζαν με τη σελίδα στην οποία εμφανίζεται Google και με τη σελίδα στην οποία δείχνει Ποιο ακριβή πληροφορίες για τις σελίδες που δείχνουν παρά για τις σελίδες στις οποίες εμφανίζονται Μπορεί να δείχνουν σε σελίδες που δεν έχουν κείμενο αλλά εικόνες, προγράμματα, κλπ Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 75 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 76 Most of Google is implemented in C or C++ for efficiency and can run in either Solaris or Linux. The web crawling (downloading of web pages) is done by several distributed crawlers. There is a URLserver that sends lists of URLs to be fetched to the crawlers. Google: Αρχιτεκτονική Every web page has an associated ID number called a docid which is assigned whenever a new URL is parsed out of a web page. The indexing function is performed by the indexer and the sorter. The indexer reads the repository, uncompresses the documents, and parses them. document -> a set of word occurrences called hits. Google: Αρχιτεκτονική The web pages that are fetched are then sent to the storeserver. The storeserver then compresses and stores the web pages into a repository. Ηits: word, position in document, an approximation of font size, and capitalization. The indexer distributes these hits into a set of "barrels", creating a partially sorted forward index. Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 77 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 78

14 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 79 Google: Αρχιτεκτονική Google: Αρχιτεκτονική Indexer: It parses out all the links in every web page and stores important information about them in an anchors file. This file contains enough information to determine where each link points from and to, and the text of the link. URLresolver relative URLs -> absolute URLs -> docids. The sorter takes the barrels, which are sorted by docid and resorts them by wordid to generate the inverted index. + lexicon Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 80 Google: Αρχιτεκτονική The searcher is run by a web server uses the lexicon built by DumpLexicon together with the inverted index and the PageRanks to answer queries. Problems with the Web linkage structure Not every hyperlink represents an endorsement Other purposes are for navigation or for paid advertisements If the majority of hyperlinks are for endorsement, the collective opinion will still dominate Μια αυθεντία (authority) για κάποιο θέμα σπάνια θα έχει link σε αντίπαλη αυθεντία στον ίδιο τομέα Οι αυθεντικές σελίδες σπάνια είναι περιγραφικές/αντιπροσωπευτικές Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 8 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 82 ΟαλγόριθμοςHITS (Hyperlink-Induced Topic Search) Για κάθε θέμα: δύο τύποι σελίδων Αυθεντική: Μια σελίδα που είναι αυθεντία σε ένα θέμα και αναγνωρίζεται ως τέτοια από άλλες σελίδες (δηλαδή, υπάρχουν πολλοί σύνδεσμοι σε αυτήν) Κομβικοί: Μια σελίδα που αναφέρεται σε μια αυθεντική σελίδα Βασική ιδέα: Οι σελίδες που αναφέρονται από άλλες σελίδες συχνά πρέπει να είναι αυθεντίες (Authorities) Οι σελίδες που αναφέρουν πολλές άλλες σελίδες πρέπει να είναι καλά κομβικά σημεία (hubs) Κομβικοί Αυθεντικοί Βασική ιδέα του HITS Καλές αυθεντίες είναι αυτές στις οποίες αναφέρονται καλά κομβικά σημεία Καλά κομβικά σημεία είναι αυτά τα οποία αναφέρονται σε καλές αυθεντίες Αναδρομική έκφραση Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 83 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 84

15 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 85 h p = Σ α q Βασικές σελίδες q στις οποίες δείχνει η p Το web ως ένας κατευθυνόμενος γράφος Κόμβοι: ιστοσελίδες Ακμή από Α στον Β: η ιστοσελίδα Α έχει έναν υπερ-σύνδεσμο στην ιστοσελίδα Β Ο αλγόριθμος σε 2 φάσεις: Φάση Ι: (δειγματοληπτικό στάδιο) ένα σύνολο σελίδων που αποτελεί το βασικό σύνολο για κάποιο θέμα Φάση ΙΙ: (επαναληπτικό στάδιο) επεξεργασία του βασικού συνόλου για τον εντοπισμό καλών αυθεντικών και κομβικών ιστοσελίδων Φάση Ι: Υπολογισμός βασικού συνόλου. Υπολογισμός αρχικού συνόλου: σύνολο-ρίζα Κλασικοί μέθοδοι: πχ ανάκτηση όλων των σελίδων που περιέχουν τις λέξεις κλειδιά (περιμένουμε ότι θα περιέχει (τουλάχιστον) αναφορές προς σχετικές σελίδες) Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 86 Φάση Ι: Υπολογισμός βασικού συνόλου 2. Σελίδες-σύνδεσμοι: σελίδα που είτε συμπεριλαμβάνει σύνδεσμο που να αναφέρεται σε έναν κόμβο p στο σύνολο ρίζα (p είναι αυθεντία) είτε Ένας κόμβος p στο σύνολο ρίζα (p είναι κομβικό σημείο) περιέχει σύνδεσμο που αναφέρεται σε αυτήν Φάση ΙΙ: Ποιες βασικές ιστοσελίδες είναι κόμβοι και αυθεντίες Κάθε βασική σελίδα p δύο τιμές: h p - Συντελεστής Κομβικού Ρόλου (πολλούς δείκτες σε αυθεντικές) a p - Συντελεστής Αυθεντικότητας (πολλοί δείκτες από κομβικές σε αυτήν) Βασικό Σύνολο: διεύρυνση του συνόλου-ρίζα ώστε να περιλαμβάνει και τις σελίδες συνδέσμους Βασικές ιστοσελίδες Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 87 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 88 Βασική διαφορά από τον Page Rank ύο τιμές ανά σελίδα (αυθεντία κομβικό σημείο) Θεματικά υποσύνολα του web γράφου - ξεκινάμεαπότοβασικό σύνολο Φάση ΙΙ: Ποιες βασικές ιστοσελίδες είναι κόμβοι και αυθεντίες Αρχικοποίηση, p, h p = και α p = Επαναληπτικά, αυξάνεται a p = Σ h q Βασικές σελίδες q που δείχνουν στην p Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 89 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 90

16 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 9 Αναπαράσταση με πίνακες Έστω το βασικό σύνολο σελίδων {, 2,..., n} Πίνακας Γειτνίασης (adjacency matrix) B: n x n B[i, j] = αν η σελίδα i περιέχει σύνδεσμο που δείχνει στη σελίδα j Έστω h = <h, h 2,, h n > το διάνυσμα συντελεστών κομβικών ρόλων και α = <α, α 2,..., α n > το διάνυσμα συντελεστών αυθεντικότητας Οι κανόνες ενημέρωσης Αρχικά h = B a η επανάληψη h = B B Τ h = (B B Τ )h 2η επανάληψη h = (B B Τ ) 2 h a = B Τ h a = B T B a = (B T B) a a = (B T B) 2 a (αντίστοιχο του r vector) Σύγκλιση στα ιδιοδιανύσματα του ΒΒ Τ και Β Τ Β αν κανονικοποιηθούν αρχικά οι συντελεστές Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 92 ιατύπωσημετηνμορφήπίνακα(παράδειγμα) h = BB T h Netscape B = n m a n m a B T = n m a 3 2 B B T = = d 3 d d 2 i d ( ) d j OUT di Adjacency matrix A = Initial values: a=h= hd ( ) = ad ( j) Iterate ad ( i) = hd ( j) dj IN( di) Normalize: v v v v T h = Aa; a = A h 2 2 v v T v T v ad ( i) = hd ( i) = h = AA h; a = A Aa i i Again eigenvector problems Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 93 Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 94 Προβλήματα Drifting: όταν ένα κομβικό σημείο περιέχει πολλά θέματα Topic hijacking: όταν πολλές σελίδες από το ίδιο web site δείχνουν στοίδιοδημοφιλές Δεδομένων: Ακ. Έτος ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 95

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2010-2011 1

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2010-2011 1 Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό Εξόρυξη Δεδομένων: Ακ. Έτος 2010-2011 ΑΝΑΛΥΣΗ ΣΥΝΔΕΣΕΩΝ 1 Ανάκτηση Κειμένου (εισαγωγικά θέματα) Εξόρυξη Δεδομένων: Ακ. Έτος 2010-2011 ΑΝΑΛΥΣΗ ΣΥΝΔΕΣΕΩΝ

Διαβάστε περισσότερα

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2008-2009 1

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2008-2009 1 Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό Ανάκτηση Κειμένου (εισαγωγικά θέματα) Εξόρυξη Δεδομένων: Ακ. Έτος 2008-2009 ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 Εξόρυξη Δεδομένων 2008-2009 1 Ανάκτηση Πληροφορίας Βάσεις

Διαβάστε περισσότερα

Βάσεις ιαδικτύου. Θέματα. Εισαγωγή στην XML. Ευρετήρια για την Ανάκτηση Κειμένων. Ο αλγόριθμος HITS. είναι η XML. Παράδειγμα XML

Βάσεις ιαδικτύου. Θέματα. Εισαγωγή στην XML. Ευρετήρια για την Ανάκτηση Κειμένων. Ο αλγόριθμος HITS. είναι η XML. Παράδειγμα XML Θέματα Βάσεις ιαδικτύου Ο αλγόριθμος HITS Βάσεις Δεδομένων ΙΙ 2004-2005 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων ΙΙ 2004-2005 Ευαγγελία Πιτουρά 2 Τι είναι η XML XML Mark-up Γλώσσες (Γλώσσες Σημειοθέτησης)

Διαβάστε περισσότερα

Μηχανές Αναζήτησης. Εξόρυξη εδοµένων: Ακ. Έτος ΑΝΑΛΥΣΗ ΣΥΝ ΕΣΕΩΝ 1

Μηχανές Αναζήτησης. Εξόρυξη εδοµένων: Ακ. Έτος ΑΝΑΛΥΣΗ ΣΥΝ ΕΣΕΩΝ 1 Μηχανές Αναζήτησης Εξόρυξη εδοµένων: Ακ. Έτος 2010-2011 ΑΝΑΛΥΣΗ ΣΥΝ ΕΣΕΩΝ 1 Μηχανές Αναζήτησης Βασισμένες σε ευρετήρια: Αναζητούν σελίδες, τις δεικτοδοτούν και κατασκευάζουν ευρετήρια βασισμένα σε λέξεις

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΔΙΠΛΩΜΑΤΟΣ ΕΙΔΙΚΕΥΣΗΣ ΕΠΙΣΤΗΜΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ του Γεράσιμου Τουλιάτου

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #14 Αναζήτηση στο Web Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη

Διαβάστε περισσότερα

Εισαγωγή στην ανάλυση συνδέσμων

Εισαγωγή στην ανάλυση συνδέσμων Εισαγωγή στην ανάλυση συνδέσμων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μαρία Χαλκίδη Why link analysis? Why link analysis? The web is not just a collection of documents its hyperlinks are important!

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Διδάζκων Δημήηριος Καηζαρός Διάλεξη 18η: 17/05/2017 1 Η μέθοδος BrowseRank 2 Εισαγωγή Η page importance, που αναπαριστά την αξία μιας σελίδας του Web, είναι παράγων-κλειδί για την

Διαβάστε περισσότερα

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Ψηφιακή ανάπτυξη Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Learning Objective : SEO και Analytics Fabio Calefato Department of Computer

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ» ΜΕΤΑΠΤΥΧΙΑΚΗ ΙΑΤΡΙΒΗ ΤΟΥ ΕΥΘΥΜΙΟΥ ΘΕΜΕΛΗ ΤΙΤΛΟΣ Ανάλυση

Διαβάστε περισσότερα

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός Ανάκληση Πληροφορίας Διδάσκων Δημήτριος Κατσαρός Διάλεξη 13η: 28/04/2014 1 Παράμετροι του μοντέλου PageRank 2 Ηπαράμετροςα(1/2) Η παράμετρος αυτή ελέγχει στην ουσία την προτεραιότητα που δίνεται στη δομή

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΕΝΑ ΦΛΟΚΑ Επίκουρος Καθηγήτρια Τµήµα Φυσικής, Τοµέας Φυσικής Περιβάλλοντος- Μετεωρολογίας ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Πληθυσµός Σύνολο ατόµων ή αντικειµένων στα οποία αναφέρονται

Διαβάστε περισσότερα

Other Test Constructions: Likelihood Ratio & Bayes Tests

Other Test Constructions: Likelihood Ratio & Bayes Tests Other Test Constructions: Likelihood Ratio & Bayes Tests Side-Note: So far we have seen a few approaches for creating tests such as Neyman-Pearson Lemma ( most powerful tests of H 0 : θ = θ 0 vs H 1 :

Διαβάστε περισσότερα

Statistical Inference I Locally most powerful tests

Statistical Inference I Locally most powerful tests Statistical Inference I Locally most powerful tests Shirsendu Mukherjee Department of Statistics, Asutosh College, Kolkata, India. shirsendu st@yahoo.co.in So far we have treated the testing of one-sided

Διαβάστε περισσότερα

Homework 3 Solutions

Homework 3 Solutions Homework 3 Solutions Igor Yanovsky (Math 151A TA) Problem 1: Compute the absolute error and relative error in approximations of p by p. (Use calculator!) a) p π, p 22/7; b) p π, p 3.141. Solution: For

Διαβάστε περισσότερα

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required) Phys460.nb 81 ψ n (t) is still the (same) eigenstate of H But for tdependent H. The answer is NO. 5.5.5. Solution for the tdependent Schrodinger s equation If we assume that at time t 0, the electron starts

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Ψηφιακή ανάπτυξη Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Learning Objective : Βασικά συστατικά του Web Fabio Calefato Department of

Διαβάστε περισσότερα

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE)

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE) EPL 603 TOPICS IN SOFTWARE ENGINEERING Lab 5: Component Adaptation Environment (COPE) Performing Static Analysis 1 Class Name: The fully qualified name of the specific class Type: The type of the class

Διαβάστε περισσότερα

Math 6 SL Probability Distributions Practice Test Mark Scheme

Math 6 SL Probability Distributions Practice Test Mark Scheme Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :

Διαβάστε περισσότερα

Approximation of distance between locations on earth given by latitude and longitude

Approximation of distance between locations on earth given by latitude and longitude Approximation of distance between locations on earth given by latitude and longitude Jan Behrens 2012-12-31 In this paper we shall provide a method to approximate distances between two points on earth

Διαβάστε περισσότερα

4.6 Autoregressive Moving Average Model ARMA(1,1)

4.6 Autoregressive Moving Average Model ARMA(1,1) 84 CHAPTER 4. STATIONARY TS MODELS 4.6 Autoregressive Moving Average Model ARMA(,) This section is an introduction to a wide class of models ARMA(p,q) which we will consider in more detail later in this

Διαβάστε περισσότερα

ΑΠΟΔΟΤΙΚΗ ΑΠΟΤΙΜΗΣΗ ΕΡΩΤΗΣΕΩΝ OLAP Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην

ΑΠΟΔΟΤΙΚΗ ΑΠΟΤΙΜΗΣΗ ΕΡΩΤΗΣΕΩΝ OLAP Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην ΑΠΟΔΟΤΙΚΗ ΑΠΟΤΙΜΗΣΗ ΕΡΩΤΗΣΕΩΝ OLAP Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ Υποβάλλεται στην ορισθείσα από την Γενική Συνέλευση Ειδικής Σύνθεσης του Τμήματος Πληροφορικής Εξεταστική Επιτροπή από την Χαρά Παπαγεωργίου

Διαβάστε περισσότερα

Instruction Execution Times

Instruction Execution Times 1 C Execution Times InThisAppendix... Introduction DL330 Execution Times DL330P Execution Times DL340 Execution Times C-2 Execution Times Introduction Data Registers This appendix contains several tables

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

2 Composition. Invertible Mappings

2 Composition. Invertible Mappings Arkansas Tech University MATH 4033: Elementary Modern Algebra Dr. Marcel B. Finan Composition. Invertible Mappings In this section we discuss two procedures for creating new mappings from old ones, namely,

Διαβάστε περισσότερα

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 7α: Impact of the Internet on Economic Education Τμήμα Εφαρμοσμένης Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως

Διαβάστε περισσότερα

Assalamu `alaikum wr. wb.

Assalamu `alaikum wr. wb. LUMP SUM Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. LUMP SUM Lump sum lump sum lump sum. lump sum fixed price lump sum lump

Διαβάστε περισσότερα

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα Ν. Μ. Σγούρος Τμήμα Ψηφιακών Συστημάτων, Παν. Πειραιώς sgouros@unipi.gr Δομή του WWW Ορισμός Προβλήματος Υποθέτουμε ότι οι πηγές πληροφοριών αναπριστώνται

Διαβάστε περισσότερα

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β 3.4 SUM AND DIFFERENCE FORMULAS Page Theorem cos(αβ cos α cos β -sin α cos(α-β cos α cos β sin α NOTE: cos(αβ cos α cos β cos(α-β cos α -cos β Proof of cos(α-β cos α cos β sin α Let s use a unit circle

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Test Data Management in Practice

Test Data Management in Practice Problems, Concepts, and the Swisscom Test Data Organizer Do you have issues with your legal and compliance department because test environments contain sensitive data outsourcing partners must not see?

Διαβάστε περισσότερα

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη

Διαβάστε περισσότερα

Section 8.3 Trigonometric Equations

Section 8.3 Trigonometric Equations 99 Section 8. Trigonometric Equations Objective 1: Solve Equations Involving One Trigonometric Function. In this section and the next, we will exple how to solving equations involving trigonometric functions.

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #03 Βασικές έννοιες Ανάκτησης Πληροφορίας Δομή ενός συστήματος IR Αναζήτηση με keywords ευφυής

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΠΗΡΕΑΖΕΙ ΤΗΝ ΠΡΟΛΗΨΗ ΚΑΡΚΙΝΟΥ ΤΟΥ ΜΑΣΤΟΥ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΠΗΡΕΑΖΕΙ ΤΗΝ ΠΡΟΛΗΨΗ ΚΑΡΚΙΝΟΥ ΤΟΥ ΜΑΣΤΟΥ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΠΩΣ Η ΚΑΤΑΝΑΛΩΣΗ ΦΡΟΥΤΩΝ ΚΑΙ ΛΑΧΑΝΙΚΩΝ ΕΠΗΡΕΑΖΕΙ ΤΗΝ ΠΡΟΛΗΨΗ ΚΑΡΚΙΝΟΥ ΤΟΥ ΜΑΣΤΟΥ Όνομα φοιτήτριας ΚΑΛΑΠΟΔΑ ΜΑΡΚΕΛΛΑ

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ. Σχολή Τεχνολογικών Εφαρμογών Τμήμα Εφαρμοσμένης Πληροφορικής & Πολυμέσων

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ. Σχολή Τεχνολογικών Εφαρμογών Τμήμα Εφαρμοσμένης Πληροφορικής & Πολυμέσων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ Σχολή Τεχνολογικών Εφαρμογών Τμήμα Εφαρμοσμένης Πληροφορικής & Πολυμέσων Πτυχιακή Εργασία Εξερεύνηση / Ανασκαφή σε μεγάλης κλίμακας κοινοτικά δίκτυα του διαδικτύου:

Διαβάστε περισσότερα

1) Abstract (To be organized as: background, aim, workpackages, expected results) (300 words max) Το όριο λέξεων θα είναι ελαστικό.

1) Abstract (To be organized as: background, aim, workpackages, expected results) (300 words max) Το όριο λέξεων θα είναι ελαστικό. UΓενικές Επισημάνσεις 1. Παρακάτω θα βρείτε απαντήσεις του Υπουργείου, σχετικά με τη συμπλήρωση της ηλεκτρονικής φόρμας. Διευκρινίζεται ότι στα περισσότερα θέματα οι απαντήσεις ήταν προφορικές (τηλεφωνικά),

Διαβάστε περισσότερα

DEIM Forum 2014 A8-1, 606 8501 E-mail: {tsukuda,ohshima,kato,tanaka}@dl.kuis.kyoto-u.ac.jp 1 2,, 1. Google 1 Yahoo 2 Bing 3 Web Web BM25 [1] HITS [2] PageRank [3] Web 1 [4] 1http://www.google.com 2http://www.yahoo.com

Διαβάστε περισσότερα

Web. Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages

Web. Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages Vol. 44 No. 1 Jan. 2003 Web 1 2, 3 4 Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages Yutaka Matsuo, 1 Yukio Ohsawa 2, 3 and Mitsuru Ishizuka 4 The pages

Διαβάστε περισσότερα

Lecture 2. Soundness and completeness of propositional logic

Lecture 2. Soundness and completeness of propositional logic Lecture 2 Soundness and completeness of propositional logic February 9, 2004 1 Overview Review of natural deduction. Soundness and completeness. Semantics of propositional formulas. Soundness proof. Completeness

Διαβάστε περισσότερα

TMA4115 Matematikk 3

TMA4115 Matematikk 3 TMA4115 Matematikk 3 Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet Trondheim Spring 2010 Lecture 12: Mathematics Marvellous Matrices Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του 510 σελίδες 1η

Διαβάστε περισσότερα

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8 questions or comments to Dan Fetter 1

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8  questions or comments to Dan Fetter 1 Eon : Fall 8 Suggested Solutions to Problem Set 8 Email questions or omments to Dan Fetter Problem. Let X be a salar with density f(x, θ) (θx + θ) [ x ] with θ. (a) Find the most powerful level α test

Διαβάστε περισσότερα

ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΣΜΗΜΑΣΟ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ

ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΣΜΗΜΑΣΟ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΣΜΗΜΑΣΟ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΑΝΑΠΣΤΞΗ ΓΤΝΑΜΙΚΗ ΙΣΟΔΛΙΓΑ ΓΙΑ ΣΟ ΓΔΝΙΚΟ ΚΑΣΑΣΗΜΑ ΚΡΑΣΗΗ ΓΡΔΒΔΝΧΝ ΜΔ ΣΗ ΒΟΗΘΔΙΑ PHP MYSQL Γηπισκαηηθή Δξγαζία ηνπ Υξήζηνπ

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής oard Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή ιατριβή Τίτλος ιατριβής Masters Thesis Title Ονοµατεπώνυµο Φοιτητή Πατρώνυµο Ανάπτυξη διαδικτυακής

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Ανάκτηση Πληροφορίας (Information Retrieval IR) Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Όλοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι του 10000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Αν κάπου κάνετε κάποιες υποθέσεις

Διαβάστε περισσότερα

Πλήρης και λεπτομερής τεχνική γνωστοποίηση των cookies

Πλήρης και λεπτομερής τεχνική γνωστοποίηση των cookies Digital Control Room Limited Apex Plaza, Forbury Road, Reading, RG1 1AX United Kingdom t: +44 20 7129 8113 www.digitalcontorlroom.com Πλήρης και λεπτομερής τεχνική γνωστοποίηση των cookies Ιστοσελίδα που

Διαβάστε περισσότερα

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS CHAPTER 5 SOLVING EQUATIONS BY ITERATIVE METHODS EXERCISE 104 Page 8 1. Find the positive root of the equation x + 3x 5 = 0, correct to 3 significant figures, using the method of bisection. Let f(x) =

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

Αξιολόγηση των εκπαιδευτικών δραστηριοτήτων των νοσοκομειακών βιβλιοθηκών.

Αξιολόγηση των εκπαιδευτικών δραστηριοτήτων των νοσοκομειακών βιβλιοθηκών. Αξιολόγηση των εκπαιδευτικών δραστηριοτήτων των νοσοκομειακών βιβλιοθηκών. Καλογεράκη Ελένη Βιβλιοθήκη Γ.Ν.Α «Ο Ευαγγελισμός», Msc Inf Scienc, Κοινωνιολόγος, Βιβλιοθηκονόμoς, Σαρανταπόρου 8, Άνω Ηλιούπολη

Διαβάστε περισσότερα

Section 9.2 Polar Equations and Graphs

Section 9.2 Polar Equations and Graphs 180 Section 9. Polar Equations and Graphs In this section, we will be graphing polar equations on a polar grid. In the first few examples, we will write the polar equation in rectangular form to help identify

Διαβάστε περισσότερα

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks P2P 1,a) 1 1 1 P2P P2P P2P P2P A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks NARISHIGE Yuki 1,a) ABE Kota 1 ISHIBASHI Hayato 1 MATSUURA Toshio 1

Διαβάστε περισσότερα

derivation of the Laplacian from rectangular to spherical coordinates

derivation of the Laplacian from rectangular to spherical coordinates derivation of the Laplacian from rectangular to spherical coordinates swapnizzle 03-03- :5:43 We begin by recognizing the familiar conversion from rectangular to spherical coordinates (note that φ is used

Διαβάστε περισσότερα

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν

Διαβάστε περισσότερα

ST5224: Advanced Statistical Theory II

ST5224: Advanced Statistical Theory II ST5224: Advanced Statistical Theory II 2014/2015: Semester II Tutorial 7 1. Let X be a sample from a population P and consider testing hypotheses H 0 : P = P 0 versus H 1 : P = P 1, where P j is a known

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Σημασιολογική Συσταδοποίηση Αντικειμένων Με Χρήση Οντολογικών Περιγραφών.

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική»

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική» Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή Διατριβή Τίτλος Διατριβής Επίκαιρα Θέματα Ηλεκτρονικής Διακυβέρνησης Ονοματεπώνυμο Φοιτητή Σταμάτιος

Διαβάστε περισσότερα

The Simply Typed Lambda Calculus

The Simply Typed Lambda Calculus Type Inference Instead of writing type annotations, can we use an algorithm to infer what the type annotations should be? That depends on the type system. For simple type systems the answer is yes, and

Διαβάστε περισσότερα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων Εξάμηνο 7 ο Oracle SQL Developer An Oracle Database stores and organizes information. Oracle SQL Developer is a tool for accessing and maintaining the data

Διαβάστε περισσότερα

(C) 2010 Pearson Education, Inc. All rights reserved.

(C) 2010 Pearson Education, Inc. All rights reserved. Connectionless transmission with datagrams. Connection-oriented transmission is like the telephone system You dial and are given a connection to the telephone of fthe person with whom you wish to communicate.

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011 Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι

Διαβάστε περισσότερα

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου E-commerce Networks & Applications Η διαφήμιση στο Internet Νίκος Κωνσταντίνου Εισαγωγή Ηαπλήδημιουργίαενόςsite δεν είναι πλέον αρκετή Μια επένδυση σε ανάπτυξη και συντήρηση δεν αποδίδει χωρίς διαφήμιση

Διαβάστε περισσότερα

Chapter 6: Systems of Linear Differential. be continuous functions on the interval

Chapter 6: Systems of Linear Differential. be continuous functions on the interval Chapter 6: Systems of Linear Differential Equations Let a (t), a 2 (t),..., a nn (t), b (t), b 2 (t),..., b n (t) be continuous functions on the interval I. The system of n first-order differential equations

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή

Διαβάστε περισσότερα

Η αλληλεπίδραση ανάμεσα στην καθημερινή γλώσσα και την επιστημονική ορολογία: παράδειγμα από το πεδίο της Κοσμολογίας

Η αλληλεπίδραση ανάμεσα στην καθημερινή γλώσσα και την επιστημονική ορολογία: παράδειγμα από το πεδίο της Κοσμολογίας Η αλληλεπίδραση ανάμεσα στην καθημερινή γλώσσα και την επιστημονική ορολογία: παράδειγμα από το πεδίο της Κοσμολογίας ΠΕΡΙΛΗΨΗ Αριστείδης Κοσιονίδης Η κατανόηση των εννοιών ενός επιστημονικού πεδίου απαιτεί

Διαβάστε περισσότερα

Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΕΠΙΚΟΙΝΩΝΙΩΝ, ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών

Διαβάστε περισσότερα

EE512: Error Control Coding

EE512: Error Control Coding EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται

Διαβάστε περισσότερα

HY335Α Δίκτυα Υπολογιστών Xειμερινό Εξάμηνο Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Routing Algorithms. Network Layer.

HY335Α Δίκτυα Υπολογιστών Xειμερινό Εξάμηνο Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών. Routing Algorithms. Network Layer. HY335Α Δίκτυα Υπολογιστών Xειμερινό Εξάμηνο 2016-2017 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Routing Algorithms Network Layer Nena Basina Υποδίκτυα (subnets) 200.23.18.0/23 11001000 00010111

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3. Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα

Διαβάστε περισσότερα

Elements of Information Theory

Elements of Information Theory Elements of Information Theory Model of Digital Communications System A Logarithmic Measure for Information Mutual Information Units of Information Self-Information News... Example Information Measure

Διαβάστε περισσότερα

6.1. Dirac Equation. Hamiltonian. Dirac Eq.

6.1. Dirac Equation. Hamiltonian. Dirac Eq. 6.1. Dirac Equation Ref: M.Kaku, Quantum Field Theory, Oxford Univ Press (1993) η μν = η μν = diag(1, -1, -1, -1) p 0 = p 0 p = p i = -p i p μ p μ = p 0 p 0 + p i p i = E c 2 - p 2 = (m c) 2 H = c p 2

Διαβάστε περισσότερα

UNIVERSITY OF CALIFORNIA. EECS 150 Fall ) You are implementing an 4:1 Multiplexer that has the following specifications:

UNIVERSITY OF CALIFORNIA. EECS 150 Fall ) You are implementing an 4:1 Multiplexer that has the following specifications: UNIVERSITY OF CALIFORNIA Department of Electrical Engineering and Computer Sciences EECS 150 Fall 2001 Prof. Subramanian Midterm II 1) You are implementing an 4:1 Multiplexer that has the following specifications:

Διαβάστε περισσότερα

Μηχανική Μάθηση Hypothesis Testing

Μηχανική Μάθηση Hypothesis Testing ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Μηχανική Μάθηση Hypothesis Testing Γιώργος Μπορμπουδάκης Τμήμα Επιστήμης Υπολογιστών Procedure 1. Form the null (H 0 ) and alternative (H 1 ) hypothesis 2. Consider

Διαβάστε περισσότερα

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014 Web Mining Χριστίνα Αραβαντινού aravantino@ceid.upatras.gr Ιούνιος 2014 1 / 34 Χριστίνα Αραβαντινού Web Mining Περιεχόµενα 1 2 3 4 5 6 2 / 34 Χριστίνα Αραβαντινού Web Mining Το Web Mining στοχεύει στην

Διαβάστε περισσότερα

The Nottingham eprints service makes this work by researchers of the University of Nottingham available open access under the following conditions.

The Nottingham eprints service makes this work by researchers of the University of Nottingham available open access under the following conditions. Luevorasirikul, Kanokrat (2007) Body image and weight management: young people, internet advertisements and pharmacists. PhD thesis, University of Nottingham. Access from the University of Nottingham repository:

Διαβάστε περισσότερα

( ) 2 and compare to M.

( ) 2 and compare to M. Problems and Solutions for Section 4.2 4.9 through 4.33) 4.9 Calculate the square root of the matrix 3!0 M!0 8 Hint: Let M / 2 a!b ; calculate M / 2!b c ) 2 and compare to M. Solution: Given: 3!0 M!0 8

Διαβάστε περισσότερα

The challenges of non-stable predicates

The challenges of non-stable predicates The challenges of non-stable predicates Consider a non-stable predicate Φ encoding, say, a safety property. We want to determine whether Φ holds for our program. The challenges of non-stable predicates

Διαβάστε περισσότερα

Terabyte Technology Ltd

Terabyte Technology Ltd Terabyte Technology Ltd is a Web and Graphic design company in Limassol with dedicated staff who will endeavour to deliver the highest quality of work in our field. We offer a range of services such as

Διαβάστε περισσότερα

Architecture οf Integrated Ιnformation Systems (ARIS)

Architecture οf Integrated Ιnformation Systems (ARIS) Architecture οf Integrated Ιnformation Systems (ARIS) Η αρχιτεκτονική ARIS (ARchitecture οf Integrated information Systems) έχει ως στόχο της την περιγρφή όλων των όψεων ή οπτικών ενός επιχειρηματικού

Διαβάστε περισσότερα

CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS

CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS EXERCISE 01 Page 545 1. Use matrices to solve: 3x + 4y x + 5y + 7 3x + 4y x + 5y 7 Hence, 3 4 x 0 5 y 7 The inverse of 3 4 5 is: 1 5 4 1 5 4 15 8 3

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Ηλεκτρονική Υγεία Ενότητα: Use Case - an example of ereferral workflow Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr Τμήμα Μηχανικών Πληροφορικής

Διαβάστε περισσότερα

How to register an account with the Hellenic Community of Sheffield.

How to register an account with the Hellenic Community of Sheffield. How to register an account with the Hellenic Community of Sheffield. (1) EN: Go to address GR: Πηγαίνετε στη διεύθυνση: http://www.helleniccommunityofsheffield.com (2) EN: At the bottom of the page, click

Διαβάστε περισσότερα

Σχέσεις, Ιδιότητες, Κλειστότητες

Σχέσεις, Ιδιότητες, Κλειστότητες Σχέσεις, Ιδιότητες, Κλειστότητες Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Ο. Τελέλης Πανεπιστήµιο Πειραιώς Σχέσεις 1 / 26 Εισαγωγή & Ορισµοί ιµελής Σχέση R από

Διαβάστε περισσότερα

Κεφάλαιο 5. Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό

Κεφάλαιο 5. Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό Κεφάλαιο 5. Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό 5.1 Βασικές Έννοιες Στην ενότητα αυτή παρουσιάζονται ορισµένες βασικές έννοιες σχετικά µε την Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό. Αρχικά δίνεται

Διαβάστε περισσότερα

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems 2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems Multiple User Interfaces MobileSoft'16, Multi-User Experience (MUX) S1: Insourcing S2: Outsourcing S3: Responsive design

Διαβάστε περισσότερα

Προσομοίωση BP με το Bizagi Modeler

Προσομοίωση BP με το Bizagi Modeler Προσομοίωση BP με το Bizagi Modeler Α. Τσαλγατίδου - Γ.-Δ. Κάπος Πρόγραμμα Μεταπτυχιακών Σπουδών Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών 2017-2018 BPMN Simulation with Bizagi Modeler: 4 Levels

Διαβάστε περισσότερα

Abstract Storage Devices

Abstract Storage Devices Abstract Storage Devices Robert König Ueli Maurer Stefano Tessaro SOFSEM 2009 January 27, 2009 Outline 1. Motivation: Storage Devices 2. Abstract Storage Devices (ASD s) 3. Reducibility 4. Factoring ASD

Διαβάστε περισσότερα

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science. Bayesian statistics DS GA 1002 Probability and Statistics for Data Science http://www.cims.nyu.edu/~cfgranda/pages/dsga1002_fall17 Carlos Fernandez-Granda Frequentist vs Bayesian statistics In frequentist

Διαβάστε περισσότερα

Congruence Classes of Invertible Matrices of Order 3 over F 2

Congruence Classes of Invertible Matrices of Order 3 over F 2 International Journal of Algebra, Vol. 8, 24, no. 5, 239-246 HIKARI Ltd, www.m-hikari.com http://dx.doi.org/.2988/ija.24.422 Congruence Classes of Invertible Matrices of Order 3 over F 2 Ligong An and

Διαβάστε περισσότερα

Προσωπική Aνάπτυξη. Ενότητα 2: Διαπραγμάτευση. Juan Carlos Martínez Director of Projects Development Department

Προσωπική Aνάπτυξη. Ενότητα 2: Διαπραγμάτευση. Juan Carlos Martínez Director of Projects Development Department Προσωπική Aνάπτυξη Ενότητα 2: Διαπραγμάτευση Juan Carlos Martínez Director of Projects Development Department Unit Scope Σε αυτή την ενότητα θα μελετήσουμε τα βασικά των καταστάσεων διαπραγμάτευσης winwin,

Διαβάστε περισσότερα

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων.

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων. ΜΥΕ3: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 2: Ανάλυση Συνδέσμων. Κεφ 2 Τι θα δούμε σήμερα Πως μπορούμε να χρησιμοποιήσουμε το δίκτυο στη διάταξη των αποτελεσμάτων Δεν είναι όλες

Διαβάστε περισσότερα