Information Retrieval

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Information Retrieval"


1 Introduction to Information Retrieval MYE003-ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 10: Βασικές Θέματα Αναζήτησης στον Παγκόσμιο Ιστό. 1

2 Κεφ 21 Ανάλυση Συνδέσμων (link analysis) Ανάλυση συνδέσμων PageRank HITS (Κομβικές σελίδες και σελίδες κύρους) 2

3 Κεφ 21 PageRank Ποιοι είναι οι σημαντικοί κόμβοι σε ένα γράφο; Degree centrality degree(v)/ E Υποθέστε ότι ο Χ και ο Y έχουν 3 φίλους, αλλά οι φίλοι του Χ είναι ο Barak Obama, Larry Page, the Pope Είναι το ίδιο σημαντικό; 3

4 Κεφ 21 PageRank Eigenvector centrality While (not converged) for each vertex v for each incoming edge from node u rank(v) = + rank(u) Αλλά: το ίδιο σημαντικό μια σελίδα να έχει link από μια σελίδα με εκατομμύρια outgoing links και από μια σελίδα με μόνο λίγα outgoing links? 4

5 Κεφ 21 PageRank Eigenvector centrality While (not converged) for each vertex v for each incoming edge from node u rank(v) = + rank(u)/outdegree(u) 5

6 Παράδειγμα v 2 w 1 = 1/3 w 4 + 1/2 w 5 w 2 = 1/2 w 1 + w 3 + 1/3 w 4 w 3 = 1/2 w 1 + 1/3 w 4 w 4 = 1/2 w 5 w 5 = w 2 v 1 v 3 v 5 v 4

7 Παράδειγμα v 2 w 1 = 1/3 w 4 + 1/2 w 5 w 2 = 1/2 w 1 + w 3 + 1/3 w 4 w 3 = 1/2 w 1 + 1/3 w 4 w 4 = 1/2 w 5 w 5 = w 2 v 1 v 3 v 5 v 4

8 Κεφ PageRank: Διανυσματική αναπαράσταση Stochastic Adjacency Matrix Πίνακας Γειτνίασης Μ Πίνακας M πίνακας γειτνίασης του web Αν j -> i, τότε Μ ij = 1/outdegree(j) Αλλιώς, M ij = 0 Η πιθανότητα να πάμε στη σελίδα i αν είμαστε στη σελίδα j j Έστω ότι η σελίδα j έχει links σε 3 σελίδες, συμπεριλαμβανομένη της i αλλά όχι της x. i x 1/3 0 8

9 Κεφ PageRank: Διανυσματική αναπαράσταση Page Rank Vector r Ένα διάνυσμα με μία τιμή για κάθε σελίδα (το PageRank της σελίδας) r = M r Principal eigenvector του Μ Προσομοιώνει ένα τυχαίο περίπατο (random walks) 9

10 Random walk Question: what is the probability p i t of being at node i after t steps? v 2 p 1 0 = 1 5 p 1 t = 1 3 p 4 t p 5 t 1 v 1 v 3 p 2 0 = 1 5 p 2 t = 1 2 p 1 t 1 + p 3 t p 4 t 1 p 3 0 = 1 5 p 3 t = 1 2 p 1 t p 4 t 1 p 4 0 = 1 5 p 4 t = 1 2 p 5 t 1 v 5 v 4 p 5 0 = 1 5 p 5 t = p 2 t 1

11 Κεφ PageRank with restart Δύο προβλήματα 1. Dead ends: σελίδες χωρίς εξερχόμενες ακμές Έχουν ως αποτέλεσμα να ξεφεύγει (leak out) to PageRank 2. Spider traps: Ομάδα σελίδων που όλες οι εξερχόμενες ακμές είναι μεταξύ τους Τελικά απορροφούν όλο το PageRank 11

12 Κεφ Dead end (αδιέξοδα) y y a m y 1/2 1/2 0 a 1/2 0 0 m 0 1/2 0 a m y a = m 1/3 1/3 1/3 1/3 1/6 1/6 3/12 1/6 1/12 5/24 3/24 1/12 8/48 5/48 3/

13 Κεφ Spider trap y y a m y 1/2 1/2 0 a 1/2 0 0 m 0 1/2 1 a m y a = m 1/3 1/3 1/3 1/3 1/6 1/2 3/12 1/6 8/12 5/24 3/24 9/12 8/48 5/48 39/

14 Κεφ PageRank with restart Dumping factor: Random jump (teleport) to any node in the graph Add a random jump to any node in the network (reduce the effect of distant nodes in the PageRank) 14

15 Κεφ Επεκτάσεις Topic specific PageRank Personalized PageRank 15

16 Κεφ HITS Κάθε σελίδα έχει δύο βαθμούς: ένα βαθμό κύρους (authority rank) και ένα κομβικό βαθμό (hub rank) 16

17 Κεφ HITS Authorities: pages containing useful information (the prominent, highly endorsed answers to the queries) Newspaper home pages Course home pages Home pages of auto manufacturers Hubs: pages that link to authorities (highly value lists) List of newspapers Course bulletin List of US auto manufacturers A good hub links to many good authorities A good authority is linked from many good hubs 17

18 Κεφ HITS: Algorithm Each page p, has two scores A hub score (h) quality as an expert Total sum of authority scores that it points to An authority score (a) quality as content Total sum of hub scores that point to it 18

19 Κεφ Iterative update Repeat the following updates, for all x: I operation h( x) O operation a( x y y) x a( x) h( y x y) x Normalize (scale down)

20 Example hubs authorities

21 Example Initialize hubs authorities

22 Example Step 1: O operation hubs authorities

23 Example Step 1: I operation hubs authorities

24 Example Step 1: Normalization (Max norm) 1/3 2/3 1 2/3 1/3 hubs 1 5/6 5/6 2/6 1/6 authorities

25 Example Step 2: O step 1 11/6 16/6 7/6 1/6 hubs 1 5/6 5/6 2/6 1/6 authorities

26 Example Step 2: I step 1 11/6 16/6 7/6 1/6 hubs 33/6 27/6 23/6 7/6 1/6 authorities

27 Example Step 2: Normalization 6/16 11/16 1 7/16 1/16 hubs 1 27/33 23/33 7/33 1/33 authorities

28 Example Convergence hubs authorities

29 Κεφ Πίνακας γειτνίασης n n adjacency matrix A: each of the n pages in the base set has a row and column in the matrix. Entry A ij = 1 if page i links to page j, else =

30 Κεφ Hub/authority vectors View the hub scores h() and the authority scores a() as vectors with n components. Recall the iterative updates h( x) a( x y y) a( x) h( y x y)

31 Κεφ Rewrite in matrix form h=aa. a=a t h. Recall A t is the transpose of A. Substituting, h=aa t h and a=a t Aa. Thus, h is an eigenvector of AA t and a is an eigenvector of A t A. Further, our algorithm is a particular, known algorithm for computing eigenvectors: the power iteration method. Guaranteed to converge.

32 Κεφ Query dependent link analysis Given text query (say browser), use a text index to get all pages containing browser. Call this the root set of pages. Add in any page that either points to a page in the root set, or is pointed to by a page in the root set. Call this the base set.

33 Query dependent input Root set obtained from a text-only search engine Root Set

34 Query dependent input IN Root Set OUT

35 Query dependent input IN Root Set OUT

36 Query dependent input Base Set IN Root Set OUT

37 Κεφ Things to note Pulled together good pages regardless of language of page content. Use only link analysis after base set assembled iterative scoring is query-independent. Iterative computation after text index retrieval - significant overhead.

38 Κεφ. 19 Τι άλλο θα δούμε σήμερα; Τι ψάχνουν οι χρήστες Spam Πόσο μεγάλος είναι ο Ιστός; 38

39 Κεφ ΟΙ ΧΡΗΣΤΕΣ 39

40 Κεφ Ανάγκες Χρηστών Ποιοι είναι οι χρήστες; Μέσος αριθμός λέξεων ανά αναζήτηση 2-3 Σπάνια χρησιμοποιούν τελεστές 40

41 Κεφ Ανάγκες Χρηστών Need [Brod02, RL04] Informational (πληροφοριακά ερωτήματα) θέλουν να μάθουν (learn) για κάτι (~40% / 65%) Συνήθως, όχι μια μοναδική ιστοσελίδα, συνδυασμός πληροφορίας από πολλές ιστοσελίδες Low hemoglobin Navigational (ερωτήματα πλοήγησης) θέλουν να πάνε (go) σε μια συγκεκριμένη ιστοσελίδα (~25% / 15%) Μια μοναδική ιστοσελίδα, το καλύτερο μέτρο = ακρίβεια στο 1 (δεν ενδιαφέρονται γενικά για ιστοσελίδες που περιέχουν τους όρους United Airlines) United Airlines 41

42 Κεφ Ανάγκες Χρηστών Transactional (ερωτήματα συναλλαγής) θέλουν να κάνουν (do) κάτι (σχετιζόμενο με το web) (~35% / 20%) Προσπελάσουν μια υπηρεσία (Access a service) Να κατεβάσουν ένα αρχείο (Downloads) Να αγοράσουν κάτι Να κάνουν κράτηση Seattle weather Mars surface images Canon S410 Γκρι περιοχές (Gray areas) Find a good hub Exploratory search see what s there Car rental Brasil 42

43 Examples of Typing Queries Calculation: 5+4 Unit conversion: 1 kg in pounds Currency conversion: 1 euro in kronor Tracking number: Flight info: LH 454 Area code: 650 Map: columbus oh Stock price: msft Albums/movies etc: coldplay 43

44 Κεφ Τι ψάχνουν; Δημοφιλή ερωτήματα Και ανά χώρα Τα ερωτήματα ακολουθούν επίσης power law κατανομή 44

45 Κεφ Ανάγκες Χρηστών Επηρεάζει (ανάμεσα σε άλλα) την καταλληλότητα του ερωτήματος για την παρουσίαση διαφημίσεων τον αλγόριθμο/αξιολόγηση, για παράδειγμα για ερωτήματα πλοήγησης ένα αποτέλεσμα ίσως αρκεί, για τα άλλα (και κυρίως πληροφοριακά) ενδιαφερόμαστε για την περιεκτικότητα/ανάκληση 45

46 Πόσα αποτελέσματα βλέπουν οι χρήστες (Source: WhitePaper_2006_SearchEngineUserBehavior.pdf) 46

47 Πως μπορούμε να καταλάβουμε τις προθέσεις (intent) του χρήστη; Guess user intent independent of context: Spell correction Precomputed typing of queries Better: Guess user intent based on context: Geographic context (slide after next) Context of user in this session (e.g., previous query) Context provided by personal profile (Yahoo/MSN do this, Google claims it doesn t) 47

48 Geographical Context Three relevant locations 1. Server ( New York) 2. Web page ( article about Albania) 3. User (located in Palo Alto) Locating the user IP address Information provided by user (e.g., in user profile) Mobile phone Geo-tagging: Parse text and identify the coordinates of the geographic entities Example: East Palo Alto CA Latitude: N, Longitude: W Important NLP problem 48

49 Geographical Context How to use context to modify query results: Result restriction: Don t consider inappropriate results For user on only results Ranking modulation: use a rough generic ranking, rerank based on personal context Contextualization / personalization is an area of search with a lot of potential for improvement. 49

50 Αξιολόγηση από τους χρήστες Relevance and validity of results Precision at 1? Precision above the fold? Comprehensiveness must be able to deal with obscure queries Recall matters when the number of matches is very small UI (User Interface) Simple, no clutter, error tolerant No annoyances: pop-ups, etc. Trust Results are objective Coverage of topics for polysemic queries Diversity, duplicate elimination 50

51 SERP Layout 51

52 Αξιολόγηση από τους χρήστες Pre/Post process tools provided Mitigate user errors (auto spell check, search assist, ) Explicit: Search within results, more like this, refine... Anticipative: related searches Deal with idiosyncrasies Web specific vocabulary Impact on stemming, spell-check, etc. Web addresses typed in the search box 52

53 Navigational 53

54 Informational 54

55 Typo: Ioanina Transactional query: adds 55


57 Κεφ The trouble with paid search ads It costs money. What s the alternative? Search Engine Optimization (SEO): Tuning your web page to rank highly in the algorithmic search results for select keywords Alternative to paying for placement Thus, intrinsically a marketing function Performed by companies, webmasters and consultants ( Search engine optimizers ) for their clients Some perfectly legitimate, some very shady 57

58 Κεφ Η απλούστερη μορφή Οι μηχανές πρώτης γενιάς βασίζονταν πολύ στο tf/idf Οι πρώτες στην κατάταξη ιστοσελίδας για το ερώτημα maui resort ήταν αυτές που περιείχαν τα περισσότερα maui και resort SEOs απάντησαν με πυκνή επανάληψη των επιλεγμένων όρων π.χ., maui resort maui resort maui resort Συχνά, οι επαναλήψεις στο ίδιο χρώμα με background της ιστοσελίδα Οι επαναλαμβανόμενοι όροι έμπαιναν στο ευρετήριο από crawlers Αλλά δεν ήταν ορατοί από τους ανθρώπους στους browsers Απλή πυκνότητα όρων δεν είναι αξιόπιστο ΑΠ σήμα 58

59 Κεφ Παραλλαγές «keyword stuffing» a web page loaded with keywords in the meta tags or in content of a web page (outdated) Παραπλανητικά meta-tags, υπερβολική επανάληψη Hidden text with colors, position text behind the image, style sheet tricks, etc. Meta-Tags = London hotels, hotel, holiday inn, hilton, discount, booking, reservation, sex, mp3, britney spears, viagra, 59

60 Κεφ Cloaking (Απόκρυψη) Παρέχει διαφορετικό περιεχόμενο ανάλογα αν είναι ο μηχανισμός σταχυολόγησης (search engine spider) ή ο browser κάποιου χρήστη DNS cloaking: Switch IP address. Impersonate Cloaking Is this a Search Engine spider? N Y SPAM Real Doc 60

61 Κεφ Άλλες τεχνικές παραπλάνησης (spam) Doorway pages Pages optimized for a single keyword that re-direct to the real target page If a visitor clicks through to a typical doorway page from a search engine results page, redirected with a fast Meta refresh command to another page. Lander page: optimized for a single keyword or a misspelled domain name, designed to attract surfers who will then click on ads 61

62 Κεφ Άλλες τεχνικές παραπλάνησης (spam) Link spamming Mutual admiration societies, hidden links, awards Domain flooding: numerous domains that point or redirect to a target page Pay somebody to put your link on their highly ranked page Leave comments that include the link on blogs Robots (bots) Fake query stream rank checking programs Curve-fit ranking programs of search engines Millions of submissions via Add-Url 62

63 The war against spam Quality signals - Prefer authoritative pages based on: Votes from authors (linkage signals) Votes from users (usage signals) Policing of URL submissions Anti robot test Limits on meta-keywords Robust link analysis Ignore statistically implausible linkage (or text) Use link analysis to detect spammers (guilt by association) Spam recognition by machine learning Training set based on known spam Family friendly filters Linguistic analysis, general classification techniques, etc. For images: flesh tone detectors, source text analysis, etc. Editorial intervention Blacklists Top queries audited Complaints addressed Suspect pattern detection 63

64 More on spam Web search engines have policies on SEO practices they tolerate/block Adversarial IR (Ανταγωνιστική ανάκτηση πληροφορίας): the unending (technical) battle between SEO s and web search engines Check out: Webmaster Tools (Google) 64


66 Κεφ Ποιο είναι το μέγεθος του web? Θέματα Στην πραγματικότητα, ο web είναι άπειρος Dynamic content, e.g., calendars Soft 404: is a valid page Static web contains syntactic duplication, mostly due to mirroring (~30%) Some servers are seldom connected Ποιο νοιάζει; Media, and consequently the user Σχεδιαστές μηχανών Την πολιτική crawl - αντίκτυπο στην ανάκληση. 66

67 Κεφ Τι μπορούμε να μετρήσουμε; Το σχετικό μέγεθος των μηχανών αναζήτησης The notion of a page being indexed is still reasonably well defined. Already there are problems Document extension: e.g., engines index pages not yet crawled, by indexing anchortext. Document restriction: All engines restrict what is indexed (first n words, only relevant words, etc.) Multi-tier indexes (access only top-levels) 67

68 Κεφ New definition? The statically indexable web is whatever search engines index. IQ is whatever the IQ tests measure. Different engines have different preferences max url depth, max count/host, anti-spam rules, priority rules, etc. Different engines index different things under the same URL: frames, meta-keywords, document restrictions, document extensions,... 68

69 Κεφ Μέγεθος μηχανών αναζήτησης Relative Size from Overlap Given two engines A and B 1. Sample URLs randomly from A 2. Check if contained in B and vice versa A B A B = (1/2) * Size A A B = (1/6) * Size B (1/2)*Size A = (1/6)*Size B \ Size A / Size B = (1/6)/(1/2) = 1/3 Each test involves: (i) Sampling (ii) Checking 69

70 Κεφ Δειγματοληψία (Sampling) URLs Ideal strategy: Generate a random URL Problem: Random URLs are hard to find (and sampling distribution should reflect user interest ) Approach 1: Random walks / IP addresses In theory: might give us a true estimate of the size of the web (as opposed to just relative sizes of indexes) Approach 2: Generate a random URL contained in a given engine Suffices for accurate estimation of relative size 70

71 Κεφ Statistical methods Approach 2 1. Random queries 2. Random searches Approach 1 1. Random IP addresses 2. Random walks 71

72 Κεφ Random URLs from random queries 1. Generate random query: how? Lexicon: 400,000+ words from a web crawl Not an English dictionary Conjunctive Queries: w 1 and w 2 e.g., vocalists AND rsi 2. Get 100 result URLs from engine A 3. Choose a random URL as the candidate to check for presence in engine B This distribution induces a probability weight W(p) for each page. 72

73 Κεφ Query Based Checking Either search for the URL if the engine B support this or Generate a Strong Query to check whether an engine B has a document D: Download D. Get list of words. Use 8 low frequency words as AND query to B Check if D is present in result set. 73

74 Κεφ Random searches Choose random searches extracted from a local query log [Lawrence & Giles 97] or build random searches [Notess] Use only queries with small result sets. For each random query: compute ratio size(r1)/size(r2) of the two result sets Average over random searches 74

75 Κεφ Random searches 575 & 1050 queries from the NEC RI employee logs 6 Engines in 1998, 11 in 1999 Implementation: Restricted to queries with < 600 results in total Counted URLs from each engine after verifying query match Computed size ratio & overlap for individual queries Estimated index size ratio & overlap by averaging over all queries 75

76 Κεφ Queries from Lawrence and Giles study adaptive access control neighborhood preservation topographic hamiltonian structures right linear grammar pulse width modulation neural unbalanced prior probabilities ranked assignment method internet explorer favourites importing karvel thornber zili liu softmax activation function bose multidimensional system theory gamma mlp dvi2pdf john oliensis rieke spikes exploring neural video watermarking counterpropagation network fat shattering dimension abelson amorphous computing 76

77 Κεφ Random IP addresses Generate random IP addresses Find a web server at the given address If there s one Collect all pages from server From this, choose a page at random 77

78 Κεφ Random IP addresses HTTP requests to random IP addresses Ignored: empty or authorization required or excluded [Lawr99] Estimated 2.8 million IP addresses running crawlable web servers (16 million total) from observing 2500 servers. OCLC using IP sampling found 8.7 M hosts in 2001 Netcraft [Netc02] accessed 37.2 million hosts in July 2002 [Lawr99] exhaustively crawled 2500 servers and extrapolated Estimated size of the web to be 800 million pages Estimated use of metadata descriptors: Meta tags (keywords, description) in 34% of home pages, Dublin core metadata in 0.3% 78

79 Κεφ Τυχαίοι Περίπατοι (Random walks) Το διαδίκτυο ως ένας κατευθυνόμενος Ένας τυχαίος περίπατος σε αυτό το γράφο Includes various jump rules back to visited sites Does not get stuck in spider traps! Can follow all links! Συγκλίνει σε μια κατανομή σταθερής κατάστασης (stationary distribution) Must assume graph is finite and independent of the walk. Conditions are not satisfied (cookie crumbs, flooding) Time to convergence not really known Sample from stationary distribution of walk Use the strong query method to check coverage by SE 79

80 Κεφ Size of the web Check out The Indexed Web contains at least 3.57 billion pages (Tuesday, 20 May, 2014). The Indexed Web contains at least 4.58 billion pages (Thursday, 19 May, 2016). 80

81 Size of the web Based on the number of pages indexed by search engines (Google, Bing, Yahoo, Ask) (minus their overlap) Size of the index of a search engine based on a method that combines word frequencies obtained from a large offline text collection (corpus), and search counts returned by the engines. 81

82 Size of index Each day 50 words are sent to all four search engines. Record number of webpages found for these words Compare their relative frequencies in the background corpus Make multiple extrapolated estimations of the size of the engine's index which are subsequently averaged. Example Say word 'the' is present in 67,61% of all documents within the corpus Google says that it found 'the' in webpages Estimated size of the Google's total index would be Background corpus contains more than 1 million webpages from DMOZ 50 words selected evenly across logarithmic frequency intervals (Zipf's Law) 82

83 Size of the web Overlap between the indices of two search engines is estimated by daily overlap counts of URLs returned in the top-10 by the engines Words randomly drawn from the DMOZ background corpus. 83

84 84

85 Τι άλλο θα δούμε Web crawlers or spiders (κεφ 20) 85

86 Spiders (σταχυολόγηση ιστού) Web Spider Document corpus Query String IR System 1. Page1 2. Page2 3. Page3.. Ranked Documents 86

87 Κεφ 20 Web Crawling (σταχυολόγηση ιστού) Web crawler or spider How hard and why? Getting the content of the documents is easier for many other IR systems. E.g., indexing all files on your hard disk: just do a recursive descent on your file system For web IR, getting the content of the documents takes longer, because of latency. But is that really a design/systems challenge? 87

88 κεφ Βασική λειτουργία Begin with known seed URLs Fetch and parse them Extract URLs they point to Place the extracted URLs on a queue Fetch each URL on the queue and repeat 88

89 Κεφ URL frontier 89

90 Κεφ Processing steps in crawling Pick a URL from the frontier Fetch the document at the URL Parse the URL Extract links from it to other docs (URLs) Check if URL has content already seen If not, add to indexes For each extracted URL Ensure it passes certain URL filter tests Which one? E.g., only, obey robots.txt, etc. Check if it is already in the frontier (duplicate URL elimination) 90

91 κεφ Simple picture complications Web crawling isn t feasible with one machine All of the above steps distributed Malicious pages Spam pages Spider traps incl dynamically generated Even non-malicious pages pose challenges Latency/bandwidth to remote servers vary Webmasters stipulations How deep should you crawl a site s URL hierarchy? Site mirrors and duplicate pages Politeness don t hit a server too often 91

92 κεφ Simple picture complications Magnitude of the problem To fetch 20,000,000,000 pages in one month... we need to fetch almost 8000 pages per second! Actually: many more since many of the pages we attempt to crawl will be duplicates, unfetchable, spam etc. 92

93 Sec Explicit and implicit politeness Explicit politeness: specifications from webmasters on what portions of site can be crawled robots.txt Implicit politeness: even with no specification, avoid hitting any site too often 93

94 Κεφ Robots.txt Protocol for giving spiders ( robots ) limited access to a website, originally from Website announces its request on what can(not) be crawled For a server, create a file /robots.txt This file specifies access restrictions 94

95 Κεφ Robots.txt example No robot should visit any URL starting with "/yoursite/temp/", except the robot called searchengine": User-agent: * Disallow: /yoursite/temp/ User-agent: searchengine Disallow: 95

96 Κεφ Βασική αρχιτεκτονική του σταχυολογητή DNS Doc FP s robots filters URL set WWW Fetch Parse Content seen? URL filter Dup URL elim URL Frontier 96

97 Κεφ DNS (Domain Name Server) A lookup service on the internet Given a URL, retrieve its IP address Service provided by a distributed set of servers thus, lookup latencies can be high (even seconds) Common OS implementations of DNS lookup are blocking: only one outstanding request at a time Solutions DNS caching Batch DNS resolver collects requests and sends them out together 97

98 Κεφ Parsing: URL normalization When a fetched document is parsed, some of the extracted links are relative URLs E.g., has a relative link to /wiki/wikipedia:general_disclaimer which is the same as the absolute URL During parsing, must normalize (expand) such relative URLs 98

99 Κεφ Content seen? Duplication is widespread on the web If the page just fetched is already in the index, do not further process it This is verified using document fingerprints or shingles 99

100 Κεφ Distributing the crawler Run multiple crawl threads, under different processes potentially at different nodes Geographically distributed nodes 100

101 Κεφ Distributing the crawler 101

102 Κεφ Distributing the crawler Partition hosts being crawled into nodes Hash used for partition How do these nodes communicate and share URLs? 102

103 Κεφ Communication between nodes Output of the URL filter at each node is sent to the Dup URL Eliminator of the appropriate node DNS Doc FP s robots filters To other nodes URL set WWW Fetch Parse Content seen? URL Frontier URL filter Host splitter From other nodes Dup URL elim 103

104 Κεφ URL frontier: two main considerations Politeness: do not hit a web server too frequently Freshness: crawl some pages more often than others E.g., pages (such as News sites) whose content changes often These goals may conflict each other. (E.g., simple priority queue fails many links out of a page go to its own site, creating a burst of accesses to that site.) 104

105 ΤΕΛΟΣ 10 ου Μαθήματος Ερωτήσεις? Χρησιμοποιήθηκε κάποιο υλικό από: Pandu Nayak and Prabhakar Raghavan, CS276:Information Retrieval and Web Search (Stanford) Hinrich Schütze and Christina Lioma, Stuttgart IIR class 105

Information Retrieval

Information Retrieval Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηπιορ Καηζαπόρ Διάλεξη 12η: 09/05/2016 Τμ. HMMY, Πανεπιστήμιο Θεσσαλίας 1 Ερπυστές στον Παγκόσμιο Ιστό 2 Sec. 20.2 Βασική λειτουργία του crawler

Διαβάστε περισσότερα

12. Σταχυολόγηση Ιστού

12. Σταχυολόγηση Ιστού Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 12. Σταχυολόγηση Ιστού Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων Βασική Λειτουργία

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 10: Βασικά Θέματα Αναζήτησης στον Παγκόσμιο Ιστό. 1 Κεφ. 19 Τι θα δούμε σήμερα; Τι ψάχνουν οι χρήστες

Διαβάστε περισσότερα

Other Test Constructions: Likelihood Ratio & Bayes Tests

Other Test Constructions: Likelihood Ratio & Bayes Tests Other Test Constructions: Likelihood Ratio & Bayes Tests Side-Note: So far we have seen a few approaches for creating tests such as Neyman-Pearson Lemma ( most powerful tests of H 0 : θ = θ 0 vs H 1 :

Διαβάστε περισσότερα

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Ψηφιακή ανάπτυξη Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Learning Objective : SEO και Analytics Fabio Calefato Department of Computer

Διαβάστε περισσότερα



Διαβάστε περισσότερα

derivation of the Laplacian from rectangular to spherical coordinates

derivation of the Laplacian from rectangular to spherical coordinates derivation of the Laplacian from rectangular to spherical coordinates swapnizzle 03-03- :5:43 We begin by recognizing the familiar conversion from rectangular to spherical coordinates (note that φ is used

Διαβάστε περισσότερα

TMA4115 Matematikk 3

TMA4115 Matematikk 3 TMA4115 Matematikk 3 Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet Trondheim Spring 2010 Lecture 12: Mathematics Marvellous Matrices Andrew Stacey Norges Teknisk-Naturvitenskapelige Universitet

Διαβάστε περισσότερα

EE512: Error Control Coding

EE512: Error Control Coding EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3

Διαβάστε περισσότερα


ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

2 Composition. Invertible Mappings

2 Composition. Invertible Mappings Arkansas Tech University MATH 4033: Elementary Modern Algebra Dr. Marcel B. Finan Composition. Invertible Mappings In this section we discuss two procedures for creating new mappings from old ones, namely,

Διαβάστε περισσότερα

The challenges of non-stable predicates

The challenges of non-stable predicates The challenges of non-stable predicates Consider a non-stable predicate Φ encoding, say, a safety property. We want to determine whether Φ holds for our program. The challenges of non-stable predicates

Διαβάστε περισσότερα

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

Main source: Discrete-time systems and computer control by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1 Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1 A Brief History of Sampling Research 1915 - Edmund Taylor Whittaker (1873-1956) devised a

Διαβάστε περισσότερα

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required) Phys460.nb 81 ψ n (t) is still the (same) eigenstate of H But for tdependent H. The answer is NO. 5.5.5. Solution for the tdependent Schrodinger s equation If we assume that at time t 0, the electron starts

Διαβάστε περισσότερα

Math 6 SL Probability Distributions Practice Test Mark Scheme

Math 6 SL Probability Distributions Practice Test Mark Scheme Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry

Διαβάστε περισσότερα

Homework 3 Solutions

Homework 3 Solutions Homework 3 Solutions Igor Yanovsky (Math 151A TA) Problem 1: Compute the absolute error and relative error in approximations of p by p. (Use calculator!) a) p π, p 22/7; b) p π, p 3.141. Solution: For

Διαβάστε περισσότερα

Εισαγωγή στην ανάλυση συνδέσμων

Εισαγωγή στην ανάλυση συνδέσμων Εισαγωγή στην ανάλυση συνδέσμων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μαρία Χαλκίδη Why link analysis? Why link analysis? The web is not just a collection of documents its hyperlinks are important!

Διαβάστε περισσότερα

Section 8.3 Trigonometric Equations

Section 8.3 Trigonometric Equations 99 Section 8. Trigonometric Equations Objective 1: Solve Equations Involving One Trigonometric Function. In this section and the next, we will exple how to solving equations involving trigonometric functions.

Διαβάστε περισσότερα

Approximation of distance between locations on earth given by latitude and longitude

Approximation of distance between locations on earth given by latitude and longitude Approximation of distance between locations on earth given by latitude and longitude Jan Behrens 2012-12-31 In this paper we shall provide a method to approximate distances between two points on earth

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς Διάλεξη #14 Αναζήτηση στο Web Φοίβος Μυλωνάς Ανάκτηση Πληροφορίας 1 Άδεια χρήσης

Διαβάστε περισσότερα

5.4 The Poisson Distribution.

5.4 The Poisson Distribution. The worst thing you can do about a situation is nothing. Sr. O Shea Jackson 5.4 The Poisson Distribution. Description of the Poisson Distribution Discrete probability distribution. The random variable

Διαβάστε περισσότερα


CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS CHAPTER 5 SOLVING EQUATIONS BY ITERATIVE METHODS EXERCISE 104 Page 8 1. Find the positive root of the equation x + 3x 5 = 0, correct to 3 significant figures, using the method of bisection. Let f(x) =

Διαβάστε περισσότερα

Μηχανική Μάθηση Hypothesis Testing

Μηχανική Μάθηση Hypothesis Testing ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Μηχανική Μάθηση Hypothesis Testing Γιώργος Μπορμπουδάκης Τμήμα Επιστήμης Υπολογιστών Procedure 1. Form the null (H 0 ) and alternative (H 1 ) hypothesis 2. Consider

Διαβάστε περισσότερα

The Simply Typed Lambda Calculus

The Simply Typed Lambda Calculus Type Inference Instead of writing type annotations, can we use an algorithm to infer what the type annotations should be? That depends on the type system. For simple type systems the answer is yes, and

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :

Διαβάστε περισσότερα


ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΕΝΑ ΦΛΟΚΑ Επίκουρος Καθηγήτρια Τµήµα Φυσικής, Τοµέας Φυσικής Περιβάλλοντος- Μετεωρολογίας ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Πληθυσµός Σύνολο ατόµων ή αντικειµένων στα οποία αναφέρονται

Διαβάστε περισσότερα

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Ψηφιακή ανάπτυξη Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Learning Objective : Βασικά συστατικά του Web Fabio Calefato Department of

Διαβάστε περισσότερα

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11 Potential Dividers 46 minutes 46 marks Page 1 of 11 Q1. In the circuit shown in the figure below, the battery, of negligible internal resistance, has an emf of 30 V. The pd across the lamp is 6.0 V and

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών

Διαβάστε περισσότερα

How to register an account with the Hellenic Community of Sheffield.

How to register an account with the Hellenic Community of Sheffield. How to register an account with the Hellenic Community of Sheffield. (1) EN: Go to address GR: Πηγαίνετε στη διεύθυνση: (2) EN: At the bottom of the page, click

Διαβάστε περισσότερα


ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Όλοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι του 10000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Αν κάπου κάνετε κάποιες υποθέσεις

Διαβάστε περισσότερα

Website review

Website review Website review Generated on September 16 2017 11:58 AM The score is 52/100 SEO Content Title Κάνε Γνωριμίες στο chat μπαμ! Live & Ανώνυμα lalemou Length : 54 Perfect, your title contains between

Διαβάστε περισσότερα

the total number of electrons passing through the lamp.

the total number of electrons passing through the lamp. 1. A 12 V 36 W lamp is lit to normal brightness using a 12 V car battery of negligible internal resistance. The lamp is switched on for one hour (3600 s). For the time of 1 hour, calculate (i) the energy

Διαβάστε περισσότερα

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible. B-Trees Index files can become quite large for large main files Indices on index files are possible 3 rd -level index 2 nd -level index 1 st -level index Main file 1 The 1 st -level index consists of pairs

Διαβάστε περισσότερα

Block Ciphers Modes. Ramki Thurimella

Block Ciphers Modes. Ramki Thurimella Block Ciphers Modes Ramki Thurimella Only Encryption I.e. messages could be modified Should not assume that nonsensical messages do no harm Always must be combined with authentication 2 Padding Must be

Διαβάστε περισσότερα


ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή

Διαβάστε περισσότερα

Instruction Execution Times

Instruction Execution Times 1 C Execution Times InThisAppendix... Introduction DL330 Execution Times DL330P Execution Times DL340 Execution Times C-2 Execution Times Introduction Data Registers This appendix contains several tables

Διαβάστε περισσότερα

Statistical Inference I Locally most powerful tests

Statistical Inference I Locally most powerful tests Statistical Inference I Locally most powerful tests Shirsendu Mukherjee Department of Statistics, Asutosh College, Kolkata, India. shirsendu So far we have treated the testing of one-sided

Διαβάστε περισσότερα

Modern Greek Extension

Modern Greek Extension Centre Number 2017 HIGHER SCHOOL CERTIFICATE EXAMINATION Student Number Modern Greek Extension Written Examination General Instructions Reading time 10 minutes Working time 1 hour and 50 minutes Write

Διαβάστε περισσότερα



Διαβάστε περισσότερα

Δημιουργία Λογαριασμού Διαχείρισης Business Telephony Create a Management Account for Business Telephony

Δημιουργία Λογαριασμού Διαχείρισης Business Telephony Create a Management Account for Business Telephony Δημιουργία Λογαριασμού Διαχείρισης Business Telephony Create a Management Account for Business Telephony Ελληνικά Ι English 1/7 Δημιουργία Λογαριασμού Διαχείρισης Επιχειρηματικής Τηλεφωνίας μέσω της ιστοσελίδας

Διαβάστε περισσότερα

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3 Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3 1 State vector space and the dual space Space of wavefunctions The space of wavefunctions is the set of all

Διαβάστε περισσότερα

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων.

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων. ΜΥΕ3: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 2: Ανάλυση Συνδέσμων. Κεφ 2 Τι θα δούμε σήμερα Πως μπορούμε να χρησιμοποιήσουμε το δίκτυο στη διάταξη των αποτελεσμάτων Δεν είναι όλες

Διαβάστε περισσότερα

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8 questions or comments to Dan Fetter 1

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8  questions or comments to Dan Fetter 1 Eon : Fall 8 Suggested Solutions to Problem Set 8 Email questions or omments to Dan Fetter Problem. Let X be a salar with density f(x, θ) (θx + θ) [ x ] with θ. (a) Find the most powerful level α test

Διαβάστε περισσότερα

[1] P Q. Fig. 3.1

[1] P Q. Fig. 3.1 1 (a) Define resistance....... [1] (b) The smallest conductor within a computer processing chip can be represented as a rectangular block that is one atom high, four atoms wide and twenty atoms long. One

Διαβάστε περισσότερα

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your GP practice in Islington Σε όλα τα Ιατρεία Οικογενειακού

Διαβάστε περισσότερα

Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά.

Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά. Διαστημικό εστιατόριο του (Μ)ΑστροΈκτορα Στο εστιατόριο «ToDokimasesPrinToBgaleisStonKosmo?» έξω από τους δακτυλίους του Κρόνου, οι παραγγελίες γίνονται ηλεκτρονικά. Μόλις μια παρέα πελατών κάτσει σε ένα

Διαβάστε περισσότερα

Ρύθμιση e-mail σε whitelist

Ρύθμιση e-mail σε whitelist Ρύθμιση e-mail σε whitelist «Δουλεύω Ηλεκτρονικά, Δουλεύω Γρήγορα και με Ασφάλεια - by» Web : E-mail : Facebook : Like Twitter : @ebasegr Πολλές φορές αντιμετωπίζετε

Διαβάστε περισσότερα

Section 9.2 Polar Equations and Graphs

Section 9.2 Polar Equations and Graphs 180 Section 9. Polar Equations and Graphs In this section, we will be graphing polar equations on a polar grid. In the first few examples, we will write the polar equation in rectangular form to help identify

Διαβάστε περισσότερα


CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS EXERCISE 01 Page 545 1. Use matrices to solve: 3x + 4y x + 5y + 7 3x + 4y x + 5y 7 Hence, 3 4 x 0 5 y 7 The inverse of 3 4 5 is: 1 5 4 1 5 4 15 8 3

Διαβάστε περισσότερα

Οδηγίες Αγοράς Ηλεκτρονικού Βιβλίου Instructions for Buying an ebook

Οδηγίες Αγοράς Ηλεκτρονικού Βιβλίου Instructions for Buying an ebook Οδηγίες Αγοράς Ηλεκτρονικού Βιβλίου Instructions for Buying an ebook Βήμα 1: Step 1: Βρείτε το βιβλίο που θα θέλατε να αγοράσετε και πατήστε Add to Cart, για να το προσθέσετε στο καλάθι σας. Αυτόματα θα

Διαβάστε περισσότερα

C.S. 430 Assignment 6, Sample Solutions

C.S. 430 Assignment 6, Sample Solutions C.S. 430 Assignment 6, Sample Solutions Paul Liu November 15, 2007 Note that these are sample solutions only; in many cases there were many acceptable answers. 1 Reynolds Problem 10.1 1.1 Normal-order

Διαβάστε περισσότερα

HISTOGRAMS AND PERCENTILES What is the 25 th percentile of a histogram? What is the 50 th percentile for the cigarette histogram?

HISTOGRAMS AND PERCENTILES What is the 25 th percentile of a histogram? What is the 50 th percentile for the cigarette histogram? HISTOGRAMS AND PERCENTILES What is the 25 th percentile of a histogram? The point on the horizontal axis such that of the area under the histogram lies to the left of that point (and to the right) What

Διαβάστε περισσότερα

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων.

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων. ΜΥΕ3: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 2: Ανάλυση Συνδέσμων. Κεφ 2 Τι θα δούμε σήμερα Πως μπορούμε να χρησιμοποιήσουμε το δίκτυο στη διάταξη των αποτελεσμάτων Δεν είναι όλες

Διαβάστε περισσότερα

Code Breaker. TEACHER s NOTES

Code Breaker. TEACHER s NOTES TEACHER s NOTES Time: 50 minutes Learning Outcomes: To relate the genetic code to the assembly of proteins To summarize factors that lead to different types of mutations To distinguish among positive,

Διαβάστε περισσότερα

Assalamu `alaikum wr. wb.

Assalamu `alaikum wr. wb. LUMP SUM Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. Assalamu `alaikum wr. wb. LUMP SUM Wassalamu alaikum wr. wb. LUMP SUM Lump sum lump sum lump sum. lump sum fixed price lump sum lump

Διαβάστε περισσότερα



Διαβάστε περισσότερα

Paper Reference. Paper Reference(s) 1776/04 Edexcel GCSE Modern Greek Paper 4 Writing. Thursday 21 May 2009 Afternoon Time: 1 hour 15 minutes

Paper Reference. Paper Reference(s) 1776/04 Edexcel GCSE Modern Greek Paper 4 Writing. Thursday 21 May 2009 Afternoon Time: 1 hour 15 minutes Centre No. Candidate No. Paper Reference(s) 1776/04 Edexcel GCSE Modern Greek Paper 4 Writing Thursday 21 May 2009 Afternoon Time: 1 hour 15 minutes Materials required for examination Nil Paper Reference

Διαβάστε περισσότερα

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι She selects the option. Jenny starts with the al listing. This has employees listed within She drills down through the employee. The inferred ER sttricture relates this to the redcords in the databasee

Διαβάστε περισσότερα

Every set of first-order formulas is equivalent to an independent set

Every set of first-order formulas is equivalent to an independent set Every set of first-order formulas is equivalent to an independent set May 6, 2008 Abstract A set of first-order formulas, whatever the cardinality of the set of symbols, is equivalent to an independent

Διαβάστε περισσότερα

Lecture 2. Soundness and completeness of propositional logic

Lecture 2. Soundness and completeness of propositional logic Lecture 2 Soundness and completeness of propositional logic February 9, 2004 1 Overview Review of natural deduction. Soundness and completeness. Semantics of propositional formulas. Soundness proof. Completeness

Διαβάστε περισσότερα

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE)

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE) EPL 603 TOPICS IN SOFTWARE ENGINEERING Lab 5: Component Adaptation Environment (COPE) Performing Static Analysis 1 Class Name: The fully qualified name of the specific class Type: The type of the class

Διαβάστε περισσότερα

Δίκτυα Επικοινωνιών ΙΙ: OSPF Configuration

Δίκτυα Επικοινωνιών ΙΙ: OSPF Configuration Δίκτυα Επικοινωνιών ΙΙ: OSPF Configuration Δρ. Απόστολος Γκάμας Διδάσκων 407/80 Δίκτυα Επικοινωνιών ΙΙ Διαφάνεια 1 1 Dynamic Routing Configuration Router (config) # router protocol [ keyword

Διαβάστε περισσότερα


ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 133: ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΓΑΣΤΗΡΙΟ 3 Javadoc Tutorial ΕΡΓΑΣΤΗΡΙΟ 3 Javadoc Tutorial Introduction Το Javadoc είναι ένα εργαλείο που παράγει αρχεία html (παρόμοιο με τις σελίδες στη διεύθυνση από τα σχόλια

Διαβάστε περισσότερα

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions SCHOOL OF MATHEMATICAL SCIENCES GLMA Linear Mathematics 00- Examination Solutions. (a) i. ( + 5i)( i) = (6 + 5) + (5 )i = + i. Real part is, imaginary part is. (b) ii. + 5i i ( + 5i)( + i) = ( i)( + i)

Διαβάστε περισσότερα

Web 論 文. Performance Evaluation and Renewal of Department s Official Web Site. Akira TAKAHASHI and Kenji KAMIMURA

Web 論 文. Performance Evaluation and Renewal of Department s Official Web Site. Akira TAKAHASHI and Kenji KAMIMURA 長 岡 工 業 高 等 専 門 学 校 研 究 紀 要 第 49 巻 (2013) 論 文 Web Department of Electronic Control Engineering, Nagaoka National College of Technology Performance Evaluation and Renewal of Department s Official Web Site

Διαβάστε περισσότερα

Example of the Baum-Welch Algorithm

Example of the Baum-Welch Algorithm Example of the Baum-Welch Algorithm Larry Moss Q520, Spring 2008 1 Our corpus c We start with a very simple corpus. We take the set Y of unanalyzed words to be {ABBA, BAB}, and c to be given by c(abba)

Διαβάστε περισσότερα

ST5224: Advanced Statistical Theory II

ST5224: Advanced Statistical Theory II ST5224: Advanced Statistical Theory II 2014/2015: Semester II Tutorial 7 1. Let X be a sample from a population P and consider testing hypotheses H 0 : P = P 0 versus H 1 : P = P 1, where P j is a known

Διαβάστε περισσότερα

Démographie spatiale/spatial Demography

Démographie spatiale/spatial Demography ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ Démographie spatiale/spatial Demography Session 1: Introduction to spatial demography Basic concepts Michail Agorastakis Department of Planning & Regional Development Άδειες Χρήσης

Διαβάστε περισσότερα

( ) 2 and compare to M.

( ) 2 and compare to M. Problems and Solutions for Section 4.2 4.9 through 4.33) 4.9 Calculate the square root of the matrix 3!0 M!0 8 Hint: Let M / 2 a!b ; calculate M / 2!b c ) 2 and compare to M. Solution: Given: 3!0 M!0 8

Διαβάστε περισσότερα

9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr

9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr 9.9 #. Area inside the oval limaçon r = + cos. To graph, start with = so r =. Compute d = sin. Interesting points are where d vanishes, or at =,,, etc. For these values of we compute r:,,, and the values

Διαβάστε περισσότερα

Example Sheet 3 Solutions

Example Sheet 3 Solutions Example Sheet 3 Solutions. i Regular Sturm-Liouville. ii Singular Sturm-Liouville mixed boundary conditions. iii Not Sturm-Liouville ODE is not in Sturm-Liouville form. iv Regular Sturm-Liouville note

Διαβάστε περισσότερα

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch: HOMEWORK 4 Problem a For the fast loading case, we want to derive the relationship between P zz and λ z. We know that the nominal stress is expressed as: P zz = ψ λ z where λ z = λ λ z. Therefore, applying

Διαβάστε περισσότερα

ANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =?

ANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =? Teko Classes IITJEE/AIEEE Maths by SUHAAG SIR, Bhopal, Ph (0755) 3 00 000 ANSWERSHEET (TOPIC DIFFERENTIAL CALCULUS) COLLECTION # Question Type A.Single Correct Type Q. (A) Sol least

Διαβάστε περισσότερα

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2)

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) Ιωάννης Τόλλης Τμήμα Επιστήμης Υπολογιστών NP-Completeness (2) x 1 x 1 x 2 x 2 x 3 x 3 x 4 x 4 12 22 32 11 13 21

Διαβάστε περισσότερα

CYTA Cloud Server Set Up Instructions

CYTA Cloud Server Set Up Instructions CYTA Cloud Server Set Up Instructions ΕΛΛΗΝΙΚΑ ENGLISH Initial Set-up Cloud Server To proceed with the initial setup of your Cloud Server first login to the Cyta CloudMarketPlace on

Διαβάστε περισσότερα

Οδηγίες χρήσης υλικού D U N S Registered

Οδηγίες χρήσης υλικού D U N S Registered Οδηγίες χρήσης υλικού D U N S Registered Οδηγίες ένταξης σήματος D U N S Registered στην ιστοσελίδα σας και χρήσης του στην ηλεκτρονική σας επικοινωνία Για οποιαδήποτε ερώτηση, σας παρακαλούμε επικοινωνήστε

Διαβάστε περισσότερα

Partial Differential Equations in Biology The boundary element method. March 26, 2013

Partial Differential Equations in Biology The boundary element method. March 26, 2013 The boundary element method March 26, 203 Introduction and notation The problem: u = f in D R d u = ϕ in Γ D u n = g on Γ N, where D = Γ D Γ N, Γ D Γ N = (possibly, Γ D = [Neumann problem] or Γ N = [Dirichlet

Διαβάστε περισσότερα

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 7α: Impact of the Internet on Economic Education Τμήμα Εφαρμοσμένης Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως

Διαβάστε περισσότερα

11. Βασικές Αρχές Αναζήτησης στον Ιστό

11. Βασικές Αρχές Αναζήτησης στον Ιστό Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 11. Βασικές Αρχές Αναζήτησης στον Ιστό Ανάκτηση Πληροφοριών Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

Numerical Analysis FMN011

Numerical Analysis FMN011 Numerical Analysis FMN011 Carmen Arévalo Lund University Lecture 12 Periodic data A function g has period P if g(x + P ) = g(x) Model: Trigonometric polynomial of order M T M (x) =

Διαβάστε περισσότερα

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016 Section 1: Listening and responding Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016 Section 1: Listening and responding Section 1: Listening and Responding/ Aκουστική εξέταση Στο πρώτο μέρος της

Διαβάστε περισσότερα

Reminders: linear functions

Reminders: linear functions Reminders: linear functions Let U and V be vector spaces over the same field F. Definition A function f : U V is linear if for every u 1, u 2 U, f (u 1 + u 2 ) = f (u 1 ) + f (u 2 ), and for every u U

Διαβάστε περισσότερα

Models for Probabilistic Programs with an Adversary

Models for Probabilistic Programs with an Adversary Models for Probabilistic Programs with an Adversary Robert Rand, Steve Zdancewic University of Pennsylvania Probabilistic Programming Semantics 2016 Interactive Proofs 2/47 Interactive Proofs 2/47 Interactive

Διαβάστε περισσότερα


ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011 Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι

Διαβάστε περισσότερα

Terabyte Technology Ltd

Terabyte Technology Ltd Terabyte Technology Ltd is a Web and Graphic design company in Limassol with dedicated staff who will endeavour to deliver the highest quality of work in our field. We offer a range of services such as

Διαβάστε περισσότερα

(C) 2010 Pearson Education, Inc. All rights reserved.

(C) 2010 Pearson Education, Inc. All rights reserved. Connectionless transmission with datagrams. Connection-oriented transmission is like the telephone system You dial and are given a connection to the telephone of fthe person with whom you wish to communicate.

Διαβάστε περισσότερα

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Business English Ενότητα # 9: Financial Planning Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Section 7.6 Double and Half Angle Formulas

Section 7.6 Double and Half Angle Formulas 09 Section 7. Double and Half Angle Fmulas To derive the double-angles fmulas, we will use the sum of two angles fmulas that we developed in the last section. We will let α θ and β θ: cos(θ) cos(θ + θ)

Διαβάστε περισσότερα

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Συστήματα Διαχείρισης Βάσεων Δεδομένων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Συστήματα Διαχείρισης Βάσεων Δεδομένων Φροντιστήριο 9: Transactions - part 1 Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών Tutorial on Undo, Redo and Undo/Redo

Διαβάστε περισσότερα

Advanced Subsidiary Unit 1: Understanding and Written Response

Advanced Subsidiary Unit 1: Understanding and Written Response Write your name here Surname Other names Edexcel GE entre Number andidate Number Greek dvanced Subsidiary Unit 1: Understanding and Written Response Thursday 16 May 2013 Morning Time: 2 hours 45 minutes

Διαβάστε περισσότερα

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α. Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:.

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α.  Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:. ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α 2 ειδήσεις από ελληνικές εφημερίδες: 1. Τα Νέα, 13-4-2010, Σε ανθρώπινο λάθος αποδίδουν τη συντριβή του αεροσκάφους, 2. Τα Νέα,

Διαβάστε περισσότερα



Διαβάστε περισσότερα

Copernicus for Local and Regional Authorities

Copernicus for Local and Regional Authorities S P A C E T E C H N O L O G I E S F O R P U B L I C A D M I N I S T R A T I O N S I N C H A R G E O F C O N T R O L S R E L A T E D T O T H E E L I G I B I L I T Y O F F A R M E R S F O R E U A I D S I

Διαβάστε περισσότερα


GREECE BULGARIA 6 th JOINT MONITORING GREECE BULGARIA 6 th JOINT MONITORING COMMITTEE BANSKO 26-5-2015 «GREECE BULGARIA» Timeline 02 Future actions of the new GR-BG 20 Programme June 2015: Re - submission of the modified d Programme according

Διαβάστε περισσότερα

Οδηγίες χρήσης. Registered. Οδηγίες ένταξης σήματος D-U-N-S Registered στην ιστοσελίδα σας και χρήσης του στην ηλεκτρονική σας επικοινωνία

Οδηγίες χρήσης. Registered. Οδηγίες ένταξης σήματος D-U-N-S Registered στην ιστοσελίδα σας και χρήσης του στην ηλεκτρονική σας επικοινωνία Οδηγίες χρήσης υλικού D-U-N-S Registered Οδηγίες ένταξης σήματος D-U-N-S Registered στην ιστοσελίδα σας και χρήσης του στην ηλεκτρονική σας επικοινωνία Οδηγίες χρήσης υλικού D-U-N-S Για οποιαδήποτε ερώτηση

Διαβάστε περισσότερα

Αναερόβια Φυσική Κατάσταση

Αναερόβια Φυσική Κατάσταση Αναερόβια Φυσική Κατάσταση Γιάννης Κουτεντάκης, BSc, MA. PhD Αναπληρωτής Καθηγητής ΤΕΦΑΑ, Πανεπιστήµιο Θεσσαλίας Περιεχόµενο Μαθήµατος Ορισµός της αναερόβιας φυσικής κατάστασης Σχέσης µε µηχανισµούς παραγωγής

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Ηλεκτρονική Υγεία Ενότητα: Use Case - an example of ereferral workflow Αν. καθηγητής Αγγελίδης Παντελής e-mail: Τμήμα Μηχανικών Πληροφορικής

Διαβάστε περισσότερα