ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

Σχετικά έγγραφα
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Ανάκτηση Πληροφορίας

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Εισαγωγικό Φροντιστήριο

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Information Extraction

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

EXTRA LEARNING COMPONENT. for Junior B pupils

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Κεφάλαιο 9: Διαδίκτυο, Web 2.0 και Web X.0. Εφαρμογές Πληροφορικής Κεφ. 9 Καραμαούνας Πολύκαρπος 1

(SEO) - Ανοίγοντας τους ορίζοντες τις ΜΜΕ Ελληνικής τουριστικής επιχείρησης στο ιαδίκτυο

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

How to register an account with the Hellenic Community of Sheffield.

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Οι αδελφοί Montgolfier: Ψηφιακή αφήγηση The Montgolfier Βrothers Digital Story (προτείνεται να διδαχθεί στο Unit 4, Lesson 3, Αγγλικά Στ Δημοτικού)

Εισαγωγή στα Πληροφοριακά Συστήματα. Ενότητα 4:

ΚΕΙΜΕΝΟΚΕΝΤΡΙΚΗ ΘΕΩΡΙΑ: ΘΕΩΡΗΤΙΚΟ ΠΛΑΙΣΙΟ ΚΑΙ ΠΕΙΡΑΜΑΤΙΚΗ ΕΦΑΡΜΟΓΗ ΣΕ ΣΠΠΕ ΜΕ ΣΤΟΧΟ ΤΟΝ ΠΕΡΙΒΑΛΛΟΝΤΙΚΟ ΓΡΑΜΜΑΤΙΣΜΟ ΤΩΝ ΜΑΘΗΤΩΝ

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΘΕΜΑ: «ιερεύνηση της σχέσης µεταξύ φωνηµικής επίγνωσης και ορθογραφικής δεξιότητας σε παιδιά προσχολικής ηλικίας»

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α. Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:.

derivation of the Laplacian from rectangular to spherical coordinates

STARTING STEPS IN GRAMMAR, FINAL TEST C TERM 2012 UNITS 1-18

Ψηφιακά Mέσα Υπολογιστική Νοημοσύνη

ΙΟΥΝΙΟΣ 2017 ΠΡΟΓΡΑΜΜΑ ΕΚΔΗΛΩΣΕΩΝ

ίκτυο προστασίας για τα Ελληνικά αγροτικά και οικόσιτα ζώα on.net e-foundatio // itute: toring Insti SAVE-Monit

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

Διαχείριση Περιεχομένου Παγκόσμιου Ιστού και Γλωσσικά Εργαλεία ΕΙΣΑΓΩΓΙΚΟ ΦΡΟΝΤΙΣΤΗΡΙΟ

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Opinion Mining

Οδηγίες χρήσης. Registered. Οδηγίες ένταξης σήματος D-U-N-S Registered στην ιστοσελίδα σας και χρήσης του στην ηλεκτρονική σας επικοινωνία

ΑΛΕΞΑΝΔΡΟΣ ΠΑΛΛΗΣ SCHOOLTIME E-BOOKS

Η γεφύρωση της οικονομικής θεωρίας και της εφαρμοσμένης οικονομικής ανάλυσης: η χρησιμότητα μίας ενημερωμένης οικονομικής Βιβλιοθήκης

Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Πέτρος Γ. Οικονομίδης Πρόεδρος και Εκτελεστικός Διευθυντής

Right Rear Door. Let's now finish the door hinge saga with the right rear door

MathCity.org Merging man and maths

Ανάκτηση Δεδομένων (Information Retrieval)

Calculating the propagation delay of coaxial cable

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

Οδηγίες χρήσης υλικού D U N S Registered

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΣΜΗΜΑΣΟ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ

Advanced Subsidiary Unit 1: Understanding and Written Response

7 Present PERFECT Simple. 8 Present PERFECT Continuous. 9 Past PERFECT Simple. 10 Past PERFECT Continuous. 11 Future PERFECT Simple

1) Abstract (To be organized as: background, aim, workpackages, expected results) (300 words max) Το όριο λέξεων θα είναι ελαστικό.

Τεχνολογία Πολυμέσων

ΣΔΥΝΟΛΟΓΗΚΟ ΔΚΠΑΗΓΔΤΣΗΚΟ ΗΓΡΤΜΑ ΗΟΝΗΧΝ ΝΖΧΝ «ΗΣΟΔΛΗΓΔ ΠΟΛΗΣΗΚΖ ΔΠΗΚΟΗΝΧΝΗΑ:ΜΔΛΔΣΖ ΚΑΣΑΚΔΤΖ ΔΡΓΑΛΔΗΟΤ ΑΞΗΟΛΟΓΖΖ» ΠΣΤΥΗΑΚΖ ΔΡΓΑΗΑ ΔΤΑΓΓΔΛΗΑ ΣΔΓΟΤ

36 ο Δημοτικό Σχολείο Αθηνών ΣΧΕΔΙΟ ΔΡΑΣΗΣ. ΤΙΤΛΟΣ: ΠΑΙΔΙ και ΕΥΡΩΠΑΙΚΗ ΕΝΩΣΗ-Μάθε τα Δικαιώματά σου

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

«ΨΥΧΙΚΗ ΥΓΕΙΑ ΚΑΙ ΣΕΞΟΥΑΛΙΚΗ» ΠΑΝΕΥΡΩΠΑΪΚΗ ΕΡΕΥΝΑ ΤΗΣ GAMIAN- EUROPE

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

τεύχος #20, Οκτώβριος#Νοέμβριος#Δεκέμβριος 2009, περιοδικό των Μεγάλων Οδηγών

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ. 7. How much money do you plan to spend on Kos per person? (Excluding tickets)

Finite Field Problems: Solutions

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική»

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Python & NLTK: Εισαγωγή

Assalamu `alaikum wr. wb.

Η ΠΡΟΣΩΠΙΚΗ ΟΡΙΟΘΕΤΗΣΗ ΤΟΥ ΧΩΡΟΥ Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ CHAT ROOMS

ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ ΣΕ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΕΘΝΩΝ ΣΧΕΣΕΩΝ & ΟΙΚΟΝΟΜΙΑΣ

ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΕΥΝΗΤΙΚΗ ΔΙΑΤΡΙΒΗ

ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΣΕΞΟΥΑΛΙΚΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ ΤΩΝ ΓΥΝΑΙΚΩΝ ΚΑΤΑ ΤΗ ΔΙΑΡΚΕΙΑ ΤΗΣ ΕΓΚΥΜΟΣΥΝΗΣ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ

ΔΙΟΙΚΗΣΗ ΔΙΕΘΝΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Can I open a bank account online? Ερώτηση αν μπορείτε να ανοίξετε τραπεζικό λογαριασμό μέσω του ίντερνετ

Επίλυση Προβλήματος σε Προγραμματιστικό Περιβάλλον από Παιδιά Προσχολικής Ηλικίας

Εφαρμογές των Η/Υ στη διδασκαλία της ξένης γλώσσας. Γεώργιος Μικρός Πανεπιστήμιο Αθηνών

Instruction Execution Times

Πρακτική Εφαρμογή του Προγράμματος Σπουδών Επιπέδου Α' στην Διδασκαλία της Ελληνικής Γλώσσας. Στέφανος Παπαζαχαρίας

Η ΕΕ εγκρίνει νέο πρόγραµµα για ασφαλέστερη χρήση του Ίντερνετ και διαθέτει 55 εκατ. ευρώ ώστε να καταστεί ασφαλές για τα παιδιά

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Γλώσσες & Τεχνικές 4 ο Εξάμηνο. - Ενότητα 1 - Δημοσθένης Σταμάτης

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your

Συστήματα Διαχείρισης Βάσεων Δεδομένων

Γλωσσική Τεχνολογία. Εισαγωγικό Φροντιστήριο

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ.

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Example Sheet 3 Solutions

Verklarte Nacht, Op.4 (Εξαϋλωμένη Νύχτα, Έργο 4) Arnold Schoenberg ( )

NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE FACULTY OF INFORMATICS AND TELECOMMUNICATIONS

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

Σχεδίαση Εφαρμογών και Υπηρεσιών Διαδικτύου 7 η Διάλεξη: Σύντομη εισαγωγή στην Java

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Δοµές Δεδοµένων. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Φθινοπωρινό Εξάµηνο Ευάγγελος Μαρκάκης

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Δημιουργία Λογαριασμού Διαχείρισης Business Telephony Create a Management Account for Business Telephony

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Ανάκτηση Πληροφορίας (Information Retrieval IR)

DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS

LESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV. 18 February 2014

Transcript:

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ 19/2/213 1 ο ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ

Αντικείμενο του Μαθήματος 2 Εφαρμογές και εργαλεία ΓλωσσικήςΤεχνολογίας με στόχο τη βελτίωση της πρωτογενούς λειτουργίας των συστημάτων διαχείρισης δυναμικών δεδομένων κειμένου την παροχή προηγμένων υπηρεσιών προς τους χρήστες που αλληλεπιδρούν με τα δεδομένα αυτά.

θεματικές ενότητες 3 Γλώσσα και Αναζήτηση Πληροφορίας Text Mining Ν-grams Data Mining Opinion Mining Δυναμική Εξαγωγή Πληροφορίας από τα Δεδομένα Διαδικτύου Οντολογίες Question Answering Ο πολυγλωσσικός Παγκόσμιος Ιστός

Εξέταση του Μαθήματος 4 εκπόνηση ενός project(8%) Υποχρεωτική παράδοση στην ημερομηνία που θα ανακοινωνθεί Ο βαθμός του project δεν διατηρείται για την επόμενη χρονιά συμμετοχή σε προφορική εξέταση (2%) Μπορεί να επαναληφθεί στην εξεταστική Σεπτεμβρίου

Που, Πότε, Ποιος, Τι... 5 Που: Αίθουσα Β3 Πότε Δευτέρα 11: -13: Ώρες γραφείου: Δευτέρα 13: -14: Email: kozanid@ceid.upatras.gr simaki@ceid.upatras.gr Προτεινόμενη βιβλιογραφία Υπολογιστική Γλωσσολογία Αλεξανδρή Χριστίνα, εκδόσεις παπασωτηρίου Speech and Language Processing (2nd Edition) by Daniel Jurafsky and James H. Martin (ISBN-13: 978131873216) Dive Into Python Natural Language Processing with Python Επιπλέον εκπαιδευτικό υλικό στο site του μαθήματος Διαφάνειες Επιλεγμένες δημοσίεύσεις

Επεξεργασία Φυσικής Γλώσσας 6 Κλάδος της επιστήμης των υπολογιστών, Aξιοποιεί τεχνικές, τεχνητής νοημοσύνης και γλωσσολογίας, Σκοπός : η διευκόλυνση της αλληλεπίδρασης των υπολογιστών και των ανθρώπων με την χρήση φυσικών γλωσσών

Ιστορική Αναδρομή 7 195 Turing test 1954 Georgetown experiment 1964-66 ELIZA bot During the 7's 'conceptual ontologies', real-world information into computer-understandable data 198, εισαγωγή machine learning αλγορίθμων για NLP statistical models, Recent research unsupervised / semi-supervised learning algorithms

Ο παγκόσμιος ιστό σήμερα 8 http://www.worldwidewebsize.com/

Ο παγκόσμιος ιστός σήμερα 9 To μέγεθος του Παγκόσμιου Ιστού μεταβάλλεται συνεχώς. Surface Web 11.5 billion web pages (25) http://www.cs.uiowa.edu/~asignori/web-size 48 billion web pages (213) Deep Web Τουλάχιστον 538.5 billion deep web pages (25) Γλώσσες στον Παγκόσμιο Ιστό (22) Αγγλικά 56.4% Γερμανικά 7.7% Γαλλικά 5.6% Γιαπωνέζικα 4.9%

1 Χρήση διαφορετικών γλωσσών

Γλωσσική Ανάλυση στο Web 11 Ο Παγκόσμιος Ιστός παρέχει πληροφορία Η πληροφορία περιέχεται κυρίως σε κείμενα Πρόσβαση στην πληροφορία μέσω ερωτημάτων προς μηχανές αναζήτησης query Web Search engine Retrieved docs

Τι είναι η Γλωσσική Ανάλυση; 12 Επεξεργασία κειμένου Λεξική: tokenization, PoS tagging Συντακτική Σημασιολογική Λόγου (επίλυση αναφοράς) Επεξεργασία φωνής Φωνητική μεταγραφή Προσωδία Εκφορά

Πού χρειάζεται η Γλωσσική Ανάλυση; 13 Επεξεργασία ερωτημάτων Δεικτοδότηση και αναζήτηση ιστοσελίδων Μηχανική μετάφραση ιστοσελίδων Web Question - Answering Ανάλυση Weblogs Εξαγωγή πληροφορίας από δεδομένα Εξόρυξη γνώσης

Επεξεργασία Ερωτημάτων 14 Computer table Περιέχει λέξεις (δομικά στοιχεία των γλωσσών) Οι λέξεις απαρτίζουν μεγαλύτερες μονάδες φράσεις. Μερικές φορές αποτελούν από μόνες τους ολόκληρες προτάσεις.

Δεικτοδότηση Ιστοσελίδων 15 Αρχείο Ευρετηρίου Αρχείο κειμένων

Αναζήτηση πληροφορίας 16 Ερώτημα: not c:\docs\einstein.txt: Σύγκριση συμβολοσειρών αργή! The important thing is not to stop questioning. Λύση: Inverted index c:\docs\shakespeare.txt: To be or not to be.

Inverted index Query: not be important is not 1 1 c:\docs\einstein.txt: The important thing is not to stop questioning. or 1 questioning stop c:\docs\shakespeare.txt: 1 to 1 the thing To be or not to be. Document IDs 17

Inverted index Query: not to be important is not 1 1 c:\docs\einstein.txt: 1 2 3 4 5 The important thing is not to stop questioning. 6 7 or 1 questioning stop c:\docs\shakespeare.txt: 1 to the thing 1 1 2 3 4 5 To be or not to be. Document IDs 18

Inverted index Query: not to be important is not 1 1 1 3 4 5 1 c:\docs\einstein.txt: 1 2 3 4 5 The important thing is not to stop questioning. 6 7 or 1 2 questioning stop 7 6 c:\docs\shakespeare.txt: 1 to the thing 5 2 1 4 1 2 3 4 5 To be or not to be. Document IDs Positions 19

2 Μηχανική Μετάφραση

21 Web Question - Answering

Ανάλυση Weblogs 22 Εξόρυξη γνώσης από Weblogs, forums, blogs, και άλλα μέσα online πληροφορίας που δημιουργούν οι χρήστες Πληροφορία για marketing προϊόντων Αποτύπωση πολιτικών απόψεων Ανάλυση κοινωνικών δικτύων Buzz analysis (επικαιρότητα, τι συζητούν τώρα οι χρήστες του web).

23 Facebook s Gross National Happiness Index

Επίλυση αναφοράς 24 But the little prince could not restrain admiration: "Oh! How beautiful you are!" "Am I not?" the flower responded, sweetly. "And I was born at the same moment as the sun..." The little prince could guess easily enough that she was not any too modest--but how moving--and exciting--she was! "I think it is time for breakfast," she added an instant later. "If you would have the kindness to think of my needs--" And the little prince, completely abashed, went to look for a sprinkling-can of fresh water. So, he tended the flower.

25 Αναγκαιότητα Χρήσης Γλωσσικών Εργαλείων Οι φυσικές γλώσσες χαρακηρίζονται από ασάφεια ΜτΛ ΑΠΑΝΤΗΣΕΙΣ (ουσιαστικό ή ρήμα;) Σημασιολογική ΠΟΝΤΙΚΙ (τρωκτικό, μυς ή εξάρτημα υπολογιστή;) Πραγματολογική Φέρε τη γάτα με το γάντι Web and NLP 19/2/213

Ασάφεια 26 Βρείτε 3 διαφορετικά νοήματα για την πρόταση: Είδα τον άντρα στο πάρκο με το τηλεσκόπιο

Σχετικά με το Project 27 Εργασία 2 ατόμων Γλώσσα υλοποίησης Python 2.7.3 Πακέτο επεξεργασίας φυσικής γλώσσας nltk 2. Περισσότερα στο Φροντιστήριο

Ερωτήσεις 28 Ευχαριστώ!!!