ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ΣΟΓΙΑΝΝΟΤ ΝΙΚΟΛΑΟΤ - ΑΛΔΞΑΝΓΡΟΤ ηος ΒΑΙΛΔΙΟΤ (ΑΜ: 5777)

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ΣΟΓΙΑΝΝΟΤ ΝΙΚΟΛΑΟΤ - ΑΛΔΞΑΝΓΡΟΤ ηος ΒΑΙΛΔΙΟΤ (ΑΜ: 5777)"

Transcript

1 ΠΑΝΔΠΙΣΗΜΙΟ ΠΑΣΡΩΝ ΠΟΛΤΣΔΥΝΙΚΗ ΥΟΛΗ ΣΜΗΜΑ ΗΛΕΚΣΡΟΛΟΓΩΝ ΜΗΥΑΝΙΚΩΝ & ΣΕΥΝΟΛΟΓΙΑ ΤΠΟΛΟΓΙΣΩΝ ΣΟΜΕΑ: ΗΛΕΚΣΡΟΝΙΚΗ & ΤΠΟΛΟΓΙΣΩΝ ΕΡΕΤΝΗΣΙΚΗ ΟΜΑΔΑ ΑΛΛΗΛΕΠΙΔΡΑΗ ΑΝΘΡΩΠΟΤ- ΤΠΟΛΟΓΙΣΗ ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ΣΟΓΙΑΝΝΟΤ ΝΙΚΟΛΑΟΤ - ΑΛΔΞΑΝΓΡΟΤ ηος ΒΑΙΛΔΙΟΤ (ΑΜ: 5777) Θέμα: «Μελέηη και ζςγκπιηική αξιολόγηζη μεθόδυν δόμηζηρ πεπιεσομένος ιζηοηόπυν: εθαπμογή ζε ειδηζεογπαθικούρ ιζηοηόποςρ» Επιβλέπων: Καθηγηηήρ κ. Ν. Αβούπηρ ΑΡΙΘΜΟ ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ /2010 ΠΑΣΡΑ, ΓΔΚΔΜΒΡΙΟ

2 2

3 ΠΙΣΟΠΟΙΗΗ Πιζηοποιείηαι όηι η Διπλωμαηική Επγαζία με θέμα: «Μελέηη και ζςγκπιηική αξιολόγηζη μεθόδυν δόμηζηρ πεπιεσομένος ιζηοηόπυν: εθαπμογή ζε ειδηζεογπαθικούρ ιζηοηόποςρ» ηος θοιηηηή ηος Σμήμαηορ Ηλεκηπολόγων Μησανικών και Σεσνολογίαρ Τπολογιζηών: ηογιάννος Νικόλαος - Αλέξανδπος (ΑΜ: 5777) Παποςζιάζηηκε δημόζια και εξεηάζηηκε ζηο Σμήμα Ηλεκηπολόγων Μησανικών και Σεσνολογίαρ Τπολογιζηών ζηιρ.../.../... Ο επιβλέπων Ο Διεςθςνηήρ Σομέα 3

4 4

5 Απιθμόρ Γιπλυμαηικήρ Δπγαζίαρ: Σίηλορ: «Μελέηη και ζςγκπιηική αξιολόγηζη μεθόδυν δόμηζηρ πεπιεσομένος ιζηοηόπυν: εθαπμογή ζε ειδηζεογπαθικούρ ιζηοηόποςρ» Φοιτητής: ηογιάννορ Νικόλαορ Αλέξανδπορ Επιβλέπων: Καθηγηηήρ κ. Ν. Αβούπηρ Πεπίλητη: Θ κατάλλθλθ οργάνωςθ του περιεχομζνου ενόσ ιςτοτόπου, ζτςι ϊςτε να αυξάνεται θ ευρεςιμότθτα των πλθροφοριϊν και να διευκολφνεται θ επιτυχισ ολοκλιρωςθ των τυπικϊν εργαςιϊν των χρθςτϊν, αποτελεί ζναν από τουσ πρωταρχικοφσ ςτόχουσ των ςχεδιαςτϊν ιςτοτόπων. Οι υπάρχουςεσ τεχνικζσ του πεδίου Αλλθλεπίδραςθσ-Ανκρϊπου Υπολογιςτι που ςυνειςφζρουν ςτθν επίτευξθ αυτοφ του ςτόχου ςυχνά αγνοοφνται εξαιτίασ των απαιτιςεϊν τουσ ςε χρονικοφσ και οικονομικοφσ πόρουσ. Ειδικότερα για ειδθςεογραφικοφσ ιςτοτόπουσ, τόςο το μζγεκοσ τουσ όςο και θ κακθμερινι προςκικθ και τροποποίθςθ των παρεχόμενων πλθροφοριϊν, κακιςτοφν αναγκαία τθ χριςθ αποδοτικότερων τεχνικϊν για τθν οργάνωςθ του περιεχομζνου τουσ. Στθν εργαςία αυτι διερευνοφμε τθν αποτελεςματικότθτα μίασ μεκόδου, επονομαηόμενθσ AutoCardSorter, που ζχει προτακεί ςτθ βιβλιογραφία για τθν θμιαυτόματθ κατθγοριοποίθςθ ιςτοςελίδων, βάςει των ςθμαςιολογικϊν ςυςχετίςεων του περιεχομζνου τουσ, ςτο πλαίςιο οργάνωςθσ των πλθροφοριϊν ειδθςεογραφικϊν ιςτοτόπων. Για το ςκοπό αυτό διενεργικθκαν πζντε ςυνολικά μελζτεσ, ςτισ οποίεσ πραγματοποιικθκε τόςο ποςοτικι όςο και ποιοτικι ςφγκριςθ των κατθγοριοποιιςεων που προζκυψαν από ςυμμετζχοντεσ ςε αντίςτοιχεσ μελζτεσ ταξινόμθςθσ καρτϊν ανοικτοφ και κλειςτοφ τφπου, με τα αποτελζςματα τθσ τεχνικισ AutoCardSorter. Από τθν ανάλυςθ των αποτελεςμάτων προζκυψε ότι θ AutoCardSorter παριγαγε ομαδοποιιςεισ άρκρων που βρίςκονται ςε μεγάλθ ςυμφωνία με αυτζσ των ςυμμετεχόντων ςτισ μελζτεσ, αλλά με ςθμαντικά αποδοτικότερο τρόπο, επιβεβαιϊνοντασ προθγοφμενεσ παρόμοιεσ μελζτεσ ςε ιςτοτόπουσ άλλων κεματικϊν κατθγοριϊν. Επιπρόςκετα, οι μελζτεσ ζδειξαν ότι μία ελαφρϊσ τροποποιθμζνθ εκδοχι τθσ AutoCardSorter 5

6 τοποκετεί νζα άρκρα ςε προχπάρχουςεσ κατθγορίεσ με αρκετά μικρότερο ποςοςτό ςυμφωνίασ ςυγκριτικά με τον τρόπο που επζλεξαν οι ςυμμετζχοντεσ. Θ εργαςία ολοκλθρϊνεται με τθν παρουςίαςθ κατευκφνςεων για τθν βελτίωςθ τθσ αποτελεςματικότθτασ τθσ AutoCardSorter, τόςο ςτο πλαίςιο οργάνωςθσ του περιεχομζνου ειδθςεογραφικϊν ιςτοτόπων όςο και γενικότερα. 6

7 7

8 Δςσαπιζηήπια Κα ικελα να ευχαριςτιςω τθν οικογζνειά μου για τθν βοικεια, ςτιριξθ και ςυνεχι παρότρυνςθ που μου προςζφερε, δίχωσ τθν οποία θ ςυγγραφι τθσ παροφςθσ εργαςίασ κα ιταν πολφ δυςκολότερθ, αν όχι αδφνατθ. Κερμά ευχαριςτιρια κα ικελα επίςθσ να απευκφνω ςτον Χριςτο Κατςάνο για τθν πολφτιμθ κακοδιγθςθ που προςζφερε κακ όλθ τθν διάρκεια ςυγγραφισ τθσ εργαςίασ αυτισ. Επιπρόςκετα, κα ικελα να ευχαριςτιςω όλουσ τουσ ςυμμετζχοντεσ ςτισ πειραματικζσ μελζτεσ που διενεργικθκαν για τθν διάκεςθ του χρόνου τουσ. Τζλοσ, κα ικελα να ευχαριςτιςω τον κ. Αβοφρθ Νικόλαο για τισ ιδιαίτερα ενδιαφζρουςεσ διαλζξεισ του μακιματοσ HCI, που με οδιγθςαν ςτθν απόφαςθ για περεταίρω τριβι με το αντικείμενο, αλλά και φυςικά για τθν εμπιςτοςφνθ που μου ζδειξε, ανακζτοντάσ μου τθν διπλωματικι αυτι. 8

9 Περιεχόμενα 1. Ειςαγωγι Ρεριγραφι του προβλιματοσ Στόχοσ τθσ Διπλωματικισ εργαςίασ Διάρκρωςθ Διπλωματικισ Εργαςίασ Κεωρθτικό υπόβακρο Θ ζννοια τθσ πλθροφοριακισ αρχιτεκτονικισ Επιςκόπθςθ μεκοδολογιϊν για τον ςχεδιαςμό τθσ πλθροφοριακισ δομισ Ταξινόμθςθ Καρτϊν Modified-Delphi ταξινόμθςθ καρτϊν Focus Group ταξινόμθςθ καρτϊν Αξιολόγθςθ ανευρεςιμότθτασ Αυκόρμθτεσ Λίςτεσ Εντατικόσ Ζλεγχοσ Ρλοιγθςθσ Ρροςδιοριςμόσ Ονομάτων Συμπεράςματα Ρειραματικζσ Μελζτεσ και Αποτελζςματα Συγκριτικι μελζτθ Ταξινόμθςθσ Καρτϊν ανοικτοφ τφπου AutoCardSorter Μεκοδολογία και Διαδικαςία Αποτελζςματα τθσ ςυγκριτικισ μελζτθσ Συγκριτικζσ Μελζτεσ Ταξινόμθςθσ Καρτϊν κλειςτοφ τφπου - AutoCardSorter Συγκριτικζσ Μελζτεσ BBC, Athens News Μεκοδολογία και Διαδικαςία Αποτελζςματα Συγκριτικζσ Μελζτεσ News Portal Μεκοδολογία και Διαδικαςία Αποτελζςματα Μζκοδοι υπολογιςμοφ ςθμαςιολογικισ ςυςχζτιςθσ Μια ςφντομθ ειςαγωγι Ραρουςίαςθ Μεκόδων Σθμαςιολογικισ Συςχζτιςθσ LSA Εφαρμογζσ Ρλεονεκτιματα Μειονεκτιματα Ραραλλαγζσ τθσ μεκόδου LSA

10 NLS: A Non-Latent Similarity Algorithm LSA-IR Pointwise Mutual Information for Information Retrieval (PMI-IR) Ραραλλαγζσ τθσ μεκόδου PMI-IR SOC-PMI Local-Context Information Retrieval (LC-IR) Contextual Label Matching PMI (CM-PMI) Positive PMI Cosine SemSim Μζκοδοι που χρθςιμοποιοφν το Διαδίκτυο Normalized Google Distance (NGD) Semantic Similarity Kernel Co-Occurrence Double Check (CODC) Explicit Semantic Analysis (ESA) Wikipedia Link-based Measure (WLM) Επεκτείνοντασ τισ μεκόδουσ για ςφγκριςθ κειμζνων Συγκριτικι αξιολόγθςθ των μεκόδων Συμπεράςματα και Μελλοντικζσ Κατευκφνςεισ Σχολιαςμόσ των Αποτελεςμάτων των Ρειραματικϊν Μελετϊν Συμπεράςματα μελζτθσ AutoCardSorter ταξινόμθςθσ καρτϊν ανοικτοφ τφπου Συμπεράςματα 1θσ ςυγκριτικισ μελζτθσ AutoCardSorter ταξινόμθςθσ καρτϊν κλειςτοφ τφπου Συμπεράςματα 2 θσ μελζτθσ AutoCardSorter ταξινόμθςθ καρτϊν κλειςτοφ τφπου Μζκοδοι Σθμαςιολογικισ Συςχζτιςθσ Μελλοντικζσ Κατευκφνςεισ Εναλλακτικό ςϊμα κειμζνου Oxford English Corpus Corpus of Contemporary American English (COCA) WebCorp: The Web as Corpus Ραρατθριςεισ Μελλοντικι Ζρευνα Βιβλιογραφία Ραράρτθμα... 79

11 1. Ειςαγωγή 1.1. Περιγραφή του προβλήματοσ «Είναι προφανζσ ότι μια πλθροφορία απορροφά τθν προςοχι των αποδεκτών τθσ. Ωσ εκ τοφτου, μια αφκονία πλθροφοριών ςυνεπάγεται τον εφκολο αποπροςανατολιςμό των αποδεκτών και ςυνεπώσ, τθν ανάγκθ για τθν βζλτιςτθ απόδοςθ τθσ προςοχισ τουσ, μεταξφ του πλικουσ των πλθροφοριών που τθν απορροφοφν.» Herb Simon, Nobel Prize Winner Θ άποψθ αυτι περιγράφει χαρακτθριςτικά το πρόβλθμα που αντιμετωπίηουν κακθμερινά οι χριςτεσ του Ραγκοςμίου Λςτοφ. Θ αλλθλεπίδραςθ ανκρϊπου-πλθροφορίασ γενικότερα και ο κατάλλθλοσ ςχεδιαςμόσ τθσ πλθροφοριακισ αρχιτεκτονικισ ιςτοτόπων ειδικότερα, αποτελοφν αντικείμενο μελζτθσ του επιςτθμονικοφ πεδίου Αλλθλεπίδραςθσ Ανκρϊπου-Υπολογιςτι. Σφμφωνα με τον (Kalbach, 2007), θ πλθροφοριακι αρχιτεκτονικι αναφζρεται ςτισ βαςικζσ εκείνεσ δομζσ που δίνουν ςχιμα και νόθμα ςτο περιεχόμενο και τθν λειτουργικότθτα ενόσ δικτυακοφ τόπου ι κατ επζκταςθ, ενόσ ςυςτιματοσ πλθροφοριϊν με το οποίο αλλθλεπιδρά ζνασ χριςτθσ, ενϊ οι (Rosenfeld and Morville, 2006) τονίηουν πωσ βαςικόσ άξονασ τθσ πλθροφοριακισ αρχιτεκτονικισ είναι οι χριςτεσ του δικτυακοφ τόπου και ο λόγοσ για τον οποίο τον επιςκζπτονται, θ ανάγκθ δθλαδι για κάποια πλθροφορία. Ο ςχεδιαςτισ που είναι υπεφκυνοσ για τον ςχεδιαςμό ενόσ δικτυακοφ τόπου 1, ζχει ωσ ςθμαντικότερο ςτόχο τθν ικανοποίθςθ των πλθροφοριακϊν αναγκϊν των χρθςτϊν με τον αποδοτικότερο και αποτελεςματικότερο τρόπο. Φροντίηει δθλαδι, ζτςι ϊςτε ο χριςτθσ όχι μόνο να απολαμβάνει μια ευχάριςτθ εμπειρία κατά τθν περιιγθςι του ςτον δικτυακό τόπο, αλλά και να μπορεί να καλφψει τισ πλθροφοριακζσ του ανάγκεσ εφκολα. Οι ςυνζπειεσ των παραπάνω ςτθν επιςκεψιμότθτα του δικτυακοφ τόπου και ςε ότι αυτι ςυνεπάγεται, είναι προφανείσ. Οι ςθμαντικζσ εξελίξεισ ςτον τομζα των μθχανϊν αναηιτθςθσ δεν κα πρζπει να εκλαμβάνονται ωσ άλλοκι για τον λανκαςμζνο ςχεδιαςμό τθσ δομισ ενόσ δικτυακοφ τόπου. Ραρότι πολλοί χριςτεσ γνωρίηουν ςε μεγάλο βακμό τι ακριβϊσ είναι αυτό που αναηθτοφν, υπάρχουν και πολλοί που το ανακαλφπτουν μζςω τθσ πλοιγθςθσ τουσ ςτισ ιςτοςελίδεσ του δικτυακοφ τόπου (Marchionini, 1997; Maurer, 2006). Αυτόσ ο τρόποσ αναηιτθςθσ πλθροφοριϊν παραμζνει ςε ςθμαντικό βακμό ο 1 Στθν ςυνζχεια χρθςιμοποιοφμε απλϊσ τον όρο ςχεδιαςτισ χάριν ςυντομίασ 11

12 πιο διαδεδομζνοσ, ειδικά για τθν αναηιτθςθ πλθροφοριϊν που ο χριςτθσ δεν ζχει από πριν ςτο μυαλό του (Wu, 2007). Μία ζρευνα ζδειξε πωσ οι χριςτεσ χρθςιμοποίθςαν αναηιτθςθ με λζξεισ-κλειδιά μόνον ςτο 39% των αναηθτιςεϊν τουσ, παρόλο που γνϊριηαν από πριν τον ακριβι ςτόχο τουσ (Teevan, 2004). Μια λανκαςμζνθ αντιμετϊπιςθ, κα μποροφςε να οδθγιςει ςτθν ςπατάλθ ςθμαντικϊν χρθματικϊν πόρων ςε λογιςμικό μθχανϊν αναηιτθςθσ και ςε άλλεσ τεχνολογίεσ, οι οποίεσ τελικά δεν κα βελτιϊςουν τθν εμπειρία χριςθσ ενόσ ιςτοτόπου. Με δεδομζνα τα παραπάνω, ο ςχεδιαςτισ κα πρζπει να ςυνεργαςτεί με ζναν μεγάλο αρικμό ανκρϊπων, οι οποίοι ανικουν ςε διαφορετικζσ ομάδεσ και εμπλζκονται επίςθσ ςτθν ςυνολικι διαδικαςία ςχεδιαςμοφ του δικτυακοφ τόπου. Οι άνκρωποι αυτοί, όπωσ για παράδειγμα οι μθχανικοί λογιςμικοφ, οι ιδιοκτιτεσ του δικτυακοφ τόπου, θ διαχείριςθ προςωπικοφ, το οικονομικό τμιμα, αλλά και οι ςτενότερα εμπλεκόμενοι με τον ςχεδιαςμό, όπωσ οι ςχεδιαςτζσ γραφικϊν και ο ειδικόσ ευχρθςτίασ, ςυνκζτουν μια περίπλοκθ διαδικαςία ςτθν οποία ο ςχεδιαςτισ οφείλει να ςυμμετζχει και να ανταγωνίηεται για τουσ περιοριςμζνουσ πόρουσ που διατίκενται. Στον ανταγωνιςμό αυτό ςτζκεται εμπόδιο θ φφςθ του προβλιματοσ που αντιμετωπίηει ο ςχεδιαςτισ, θ κατανόθςθ δθλαδι, του τρόπου με τον οποίο οι χριςτεσ ομαδοποιοφν, ξεχωρίηουν και αναγνωρίηουν το περιεχόμενο του δικτυακοφ τόπου. Υπάρχει μια πλθκϊρα μεκόδων που χρθςιμοποιοφνται προσ αυτιν τθν κατεφκυνςθ, όπωσ για παράδειγμα θ μελζτθ ταξινόμθςθσ καρτϊν, θ διερεφνθςθ γενικοφ πλαιςίου και οι εκνογραφικζσ μελζτεσ. Κοινό χαρακτθριςτικό των μεκόδων αυτϊν είναι θ απαίτθςθ εμπλοκισ αντιπροςωπευτικϊν χρθςτϊν του υπό ςχεδίαςθ δικτυακοφ τόπου. Θ απαίτθςθ αυτι, προςδίδει αυξθμζνθ πολυπλοκότθτα ςε αυτζσ τισ μεκόδουσ, κάτι που πολλζσ φορζσ οδθγεί ςτθν αγνόθςθ τουσ και κατά ςυνζπεια, ςτθν αποτυχία κατανόθςθσ των νοθτικϊν μοντζλων των χρθςτϊν και των προςδοκιϊν τουσ. Θ πιο διαδεδομζνθ μζκοδοσ χρθςτοκεντρικοφ ςχεδιαςμοφ τθσ πλθροφοριακισ αρχιτεκτονικισ ενόσ ιςτοτόπου είναι θ ταξινόμθςθ καρτϊν, θ οποία και περιγράφεται λεπτομερϊσ ςε επόμενθ ενότθτα. Ρρόκειται για μια ιδιαίτερα απλι και ευζλικτθ τεχνικι που δφναται να ζχει πολλζσ διαφορετικζσ χριςεισ. Δυςτυχϊσ, θ προετοιμαςία, διεξαγωγι και ανάλυςθ των αποτελεςμάτων τθσ μελζτθσ παρουςιάηουν αυξθμζνεσ απαιτιςεισ ςε χρθματικοφσ και ιδιαίτερα ςε χρονικοφσ πόρουσ. Ππωσ βλζπουμε από τα παραπάνω λοιπόν, ο ςχεδιαςμόσ ενόσ δικτυακοφ τόπου είναι κατά μία άποψθ, μια πράξθ επικοινωνίασ, αλλά για να μπορζςει ο ςχεδιαςτισ να επιτφχει μια αποδοτικι επικοινωνία κα πρζπει να ζχει μια κακαρι, ςυνεκτικι εικόνα του προσ ςχεδιαςμοφ δικτυακοφ τόπου και οι χριςτεσ κα πρζπει να μποροφν να κατανοιςουν το μινυμα του ςχεδιαςτι (Norman, 2004). Ππωσ 12

13 αναφζρκθκε, υπάρχει μια πλθκϊρα μεκόδων και τεχνικϊν που χρθςιμοποιοφνται προσ αυτιν τθν κατεφκυνςθ από τουσ ςχεδιαςτζσ δικτυακϊν τόπων, όπωσ για παράδειγμα οι εξισ: Διερεφνθςθ Γενικοφ Ρλαιςίου Ομάδεσ Συηιτθςθσ Ερωτθματολόγια Ρροφίλ Χρθςτϊν Σενάρια Χριςθσ Ταξινόμθςθ Καρτϊν Αυκόρμθτεσ Λίςτεσ Εντατικόσ Ζλεγχοσ Ρλοιγθςθσ Ζλεγχοσ Ανευρεςιμότθτασ Ρροςδιοριςμόσ Ονομάτων Οι ςθμαντικότερεσ και ευρφτερα χρθςιμοποιοφμενεσ από τισ παραπάνω μεκόδουσ, για τον ςχεδιαςμό τθσ πλθροφοριακισ αρχιτεκτονικισ ενόσ δικτυακοφ τόπου, περιγράφονται ςτο κεφάλαιο Στόχοσ τησ Διπλωματικήσ εργαςίασ Θ ςυγγραφι τθσ παροφςθσ εργαςίασ πραγματοποιικθκε ζχοντασ υπόψθ τρεισ διαφορετικοφσ ςτόχουσ. Ρρωταρχικόσ ςτόχοσ ιταν θ αξιολόγθςθ τθσ αποδοτικότθτασ και τθσ ποιότθτασ των αποτελεςμάτων ενόσ πρωτοποριακοφ εργαλείου για τον ςχεδιαςμό και τθν αξιολόγθςθ τθσ δομισ ενόσ δικτυακοφ τόπου, του AutoCardSorter (Katsanos, Tselios, & Avouris, 2008). Δεφτεροσ αλλά εξίςου ςθμαντικόσ ςτόχοσ, ιταν θ εξαγωγι ςυμπεραςμάτων ςχετικά με τα ιδιαίτερα προβλιματα που παρουςιάηονται κατά τθν εφαρμογι του εργαλείου ςτον ςχεδιαςμό δικτυακϊν τόπων ςυγκεκριμζνων κεματολογιϊν. Τρίτοσ και τελευταίοσ ςτόχοσ, ιταν θ προετοιμαςία του επόμενου βιματοσ ανάπτυξθσ του εργαλείου και ςυγκεκριμζνα τθσ ζρευνασ για επιλογι ενόσ κατάλλθλου ςθμαςιολογικοφ αλγορίκμου. Ο αλγόρικμοσ αυτόσ αποτελεί βαςικό ςτοιχείο του εργαλείου και θ επιλογι του καταλλθλότερου ζχει άμεςεσ ςυνζπειεσ ςτθν απόδοςθ και ποιότθτα των αποτελεςμάτων που παρζχει. Το AutoCardSorter προςφζρεται ωσ μια αυτοματοποιθμζνθ εναλλακτικι μζκοδοσ, απζναντι ςτθν επίπονθ αλλά κακιερωμζνθ μζκοδο τθσ ταξινόμθςθσ καρτϊν. Ζχουν ιδθ διενεργθκεί τρεισ ςυγκριτικζσ μελζτεσ (Katsanos, Tselios, & Avouris, 2008), ςε διαφορετικζσ κεματικζσ ενότθτεσ (Υγεία και Διατροφι, Εκπαίδευςθ, Ταξίδια και Τουριςμόσ), οι οποίεσ ζχουν αποδείξει τθν 13

14 αποτελεςματικότθτα και αποδοτικότθτα του εργαλείου ςε ςχζςθ με μία μελζτθ ταξινόμθςθσ καρτϊν ανοικτοφ τφπου. Ρροσ επίτευξθ του πρϊτου ςτόχου πραγματοποιικθκε ακόμα μία μελζτθ, για τθν επαλικευςθ τθσ αποτελεςματικότθτασ του εργαλείου, όςον αφορά τθν προςομοίωςθ μιασ μελζτθσ ταξινόμθςθσ καρτϊν ανοιχτοφ τφπου. Επίςθσ, διενεργικθκαν ακόμα τζςςερεισ ςυγκριτικζσ μελζτεσ, με κφριο ςτόχο τθ διερεφνθςθ τθσ αποτελεςματικότθτασ και αποδοτικότθτασ του AutoCardSorter ςε ςχζςθ με μία μελζτθ ταξινόμθςθσ καρτϊν κλειςτοφ τφπου. Ταυτόχρονα, μελετικθκε θ χριςθ τθσ εργαλείο-κεντρικισ μεκόδου για τθν οργάνωςθ του περιεχομζνου δικτυακϊν τόπων που ανικουν ςε μία ςυγκεκριμζνθ κεματικι ενότθτα (Ειδθςεογραφικζσ Λςτοςελίδεσ) κακϊσ κρίνεται ότι θ προτεινόμενθ μζκοδοσ μπορεί να ζχει χριςιμεσ εφαρμογζσ ςε αυτόν τον κλάδο. Τζλοσ, πραγματοποιικθκε μια επιςκόπθςθ διαφόρων μεκόδων για τθν εκτίμθςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ δυο λζξεων, με ςτόχο τθν εξαγωγι ςυμπεραςμάτων αναφορικά με τθν καταλλθλότθτα τθσ κάκε μεκόδου για χριςθ με το AutoCardSorter Διάρθρωςη Διπλωματικήσ Εργαςίασ Στο επόμενο κεφάλαιο ακολουκεί μια ειςαγωγι ςτο γενικότερο κεωρθτικό υπόβακρο τθσ Ρλθροφοριακισ Αρχιτεκτονικισ, κακϊσ και μια ςφντομθ επιςκόπθςθ οριςμζνων μεκόδων που ςτοχεφουν ςτθν χρθςτοκεντρικι δόμθςθ των περιεχομζνων των δικτυακϊν τόπων. Τζλοσ, παρουςιάηεται μια εναλλακτικι τεχνικι με τθν μορφι ενόσ εργαλείου, του AutoCardSorter (Katsanos, Tselios, & Avouris, 2008). Στο τρίτο κεφάλαιο περιγράφονται οι 5 πειραματικζσ μελζτεσ που διενεργικθκαν, οι ακριβείσ μεκοδολογίεσ που ακολουκικθκαν και τα αποτελζςματα που προζκυψαν. Στο 4 ο κεφάλαιο παρουςιάηονται οριςμζνοι αλγόρικμοι υπολογιςμοφ ςθμαςιολογικισ ςυςχζτιςθσ λζξεων. Θ παρουςίαςθ δίνει ζμφαςθ ςτθν εξαγωγι ςυμπεραςμάτων αναφορικά με τθν δυνατότθτα αποδοτικισ ςυνεργαςίασ των αλγορίκμων αυτϊν με το AutoCardSorter. Τζλοσ, ςτο 5 ο κεφάλαιο γίνεται μια εκτενισ ςυηιτθςθ των ςυμπεραςμάτων που προκφπτουν από τθν ανάλυςθ των αποτελεςμάτων των πειραματικϊν μελετϊν, κακϊσ και από τθν μελζτθ τθσ βιβλιογραφίασ των αλγορίκμων ςθμαςιολογικισ ςυςχζτιςθσ. Ραρουςιάηονται επίςθσ, ςυγκεκριμζνεσ προτάςεισ για βελτίωςθ του εργαλείου AutoCardSorter, κακϊσ επίςθσ και οριςμζνεσ εναλλακτικζσ εφαρμογζσ που κα μποροφςε να ζχει εκτόσ τθσ προςζγγιςθσ τθσ μεκόδου ταξινόμθςθσ καρτϊν. 14

15 2. Θεωρήτικό υπό βαθρό 2.1. Η έννοια τησ πληροφοριακήσ αρχιτεκτονικήσ Ππωσ προαναφζρκθκε ςτθν ειςαγωγι, ο ςχεδιαςμόσ τθσ πλθροφοριακισ αρχιτεκτονικισ ενόσ δικτυακοφ τόπου αποτελεί ζνα από τα αντικείμενα μελζτθσ του επιςτθμονικοφ πεδίου Αλλθλεπίδραςθσ Ανκρϊπου-Υπολογιςτι. Για να είμαςτε ακριβείσ, θ πλθροφοριακι αρχιτεκτονικι (Information Architecture) διευρφνεται ταχφτατα τα τελευταία χρόνια και από πολλοφσ κεωρείται πλζον ξεχωριςτό επιςτθμονικό πεδίο. Οι ςχεδιαςτζσ πλθροφοριακισ αρχιτεκτονικισ, προςπακοφν να απαντιςουν ςε ερωτιματα που αφοροφν τον κατάλλθλο τρόπο παρουςίαςθσ ενόσ μεγάλου όγκου πλθροφοριϊν, ςε ανκρϊπουσ που ψάχνουν μια ςυγκεκριμζνθ πλθροφορία ι υπθρεςία. Στο πλαίςιο των δικτυακϊν τόπων, οι πλθροφορίεσ είναι τα περιεχόμενα του προσ ςχεδιαςμοφ δικτυακοφ τόπου και ο ςτόχοσ των ςχεδιαςτϊν είναι θ δθμιουργία ενόσ ιςτοτόπου που κα προςφζρει μια ευχάριςτθ εμπειρία χριςθσ ενϊ παράλλθλα κα μπορεί να διαχειριςτεί, ςυντθρθκεί και επεκτακεί με ευκολία από τουσ ιδιοκτιτεσ του. Οι (Rosenfeld and Morville, 2006) ςθμειϊνουν πωσ θ πλθροφοριακι αρχιτεκτονικι είναι: Ο ςχεδιαςμόσ τθσ πλθροφοριακισ δομισ των ςυςτθμάτων πλθροφορίασ Ο ςυνδυαςμόσ τθσ οργάνωςθσ και περιγραφισ των περιεχομζνων και των ςυςτθμάτων αναηιτθςθσ και πλοιγθςθσ ενόσ δικτυακοφ τόπου. Ζνα αναδυόμενο επιςτθμονικό πεδίο και μια κοινότθτα ςχεδιαςτϊν που ςτοχεφει ςτθν ειςαγωγι αρχϊν από τα πεδία τθσ αρχιτεκτονικισ και του ςχεδιαςμοφ ςτον ψθφιακό κόςμο. Θ τζχνθ και επιςτιμθ τθσ διαμόρφωςθσ των ςτοιχείων ενόσ ιςτοτόπου με ςκοπό τθν υποςτιριξθ τθσ ευχρθςτίασ και τθσ ανευρεςιμότθτάσ τουσ. Ο δεφτεροσ οριςμόσ υποδεικνφει και τα κεμελιϊδθ ςτοιχεία τθσ πλθροφοριακισ δομισ ενόσ δικτυακοφ τόπου, δθλαδι το μοντζλο πλοιγθςθσ, το ςφςτθμα κατθγοριοποίθςθσ (ι ιεραρχία), τισ περιγραφζσ των δομικϊν ςτοιχείων (κατθγορίεσ, πλθροφορίεσ, υπθρεςίεσ) και το ςφςτθμα αναηιτθςθσ. Τα ςτοιχεία αυτά αναφζρονται γενικά ωσ πλθροφοριακι δομι του δικτυακοφ τόπου. 15

16 Θ ςυγκεκριμζνθ πλθροφοριακι δομι κάκε ιςτοτόπου προκαλεί και ςυγκεκριμζνεσ αντιδράςεισ ςτουσ επιςκζπτεσ του. Οριςμζνοι δικτυακοί τόποι διακζτουν λογικζσ δομζσ που βοθκοφν τον επιςκζπτθ να βρει τισ πλθροφορίεσ που αναηθτά και να επιτφχει τουσ ςτόχουσ τθσ περιιγθςισ του ςτον ςυγκεκριμζνο δικτυακό τόπο. Αντίκετα, δομζσ που ςτεροφνται λογικισ οργάνωςθσ καταςτρζφουν τθν εμπειρία χριςθσ των επιςκεπτϊν. Οι ςχεδιαςτζσ τθσ πλθροφοριακισ δομισ αντιμετωπίηουν μια πλθκϊρα απαιτιςεων και ςυγκρουόμενων ςτόχων και το κυριότερο, τθν εγγενι αμφιςθμία τθσ ανκρϊπινθσ γλϊςςασ που περιπλζκει ςε μεγάλο βακμό τισ αποφάςεισ τουσ ςχετικά με τισ περιγραφζσ των ςτοιχείων του δικτυακοφ τόπου. Ο αποτυχθμζνοσ ςχεδιαςμόσ τθσ πλθροφοριακισ δομισ μπορεί να ζχει τεράςτιο κόςτοσ για τον ιδιοκτιτθ του. Ρικανζσ ςυνζπειεσ μιασ αποτυχθμζνθσ ςχεδίαςθσ είναι οι εξισ (Rosenfeld and Morville, 2006): Αδυναμία ι δυςκολία ανεφρεςθσ πλθροφοριϊν, όπωσ για παράδειγμα θ απαςχόλθςθ κάκε υπαλλιλου μιασ εταιρείασ κατά 5 λεπτά κακθμερινά προκειμζνου να εντοπίςει μια απαραίτθτθ πλθροφορία ι θ αδυναμία εντοπιςμοφ ενόσ επικυμθτοφ προϊόντοσ από ζναν επιςκζπτθ-πελάτθ του δικτυακοφ τόπου τθσ εταιρείασ. Ι αντίςτροφα οι λανκαςμζνεσ αποφάςεισ που κα λθφκοφν από τουσ υπαλλιλουσ που τελικά δεν κα μπορζςουν να βρουν τισ πλθροφορίεσ και αντίςτοιχα ο απογοθτευμζνοσ πελάτθσ που κα εξαντλιςει τθν υπομονι του προκειμζνου να εντοπίςει το προϊόν που αναηθτά. Μθ αποδοτικι διαφιμιςθ και μάρκετινγκ νζων προϊόντων ι υπθρεςιϊν, που ςχετίηονται με αυτά που ιδθ γνωρίηει και αναηθτά ο επιςκζπτθσ. Κόςτοσ επαναςχεδιαςμοφ τθσ αποτυχθμζνθσ πλθροφοριακισ δομισ Κόςτοσ εκπαίδευςθσ των υπαλλιλων ςτθν κατανόθςθ μιασ δφςχρθςτθσ πλθροφοριακισ δομισ Ηθμία ςτθν εικόνα τθσ εταιρίασ, κακϊσ χάνονται όχι μόνο οι απογοθτευμζνοι πελάτεσ αλλά και αυτοί που επθρεάηονται ςτθν ςυνζχεια από αυτοφσ. Ρροσ επίτευξθ των ςτόχων των ςχεδιαςτϊν ζχει επινοθκεί ζνα πλικοσ μεκόδων και τεχνικϊν που προςφζρουν τθν δυνατότθτα κατανόθςθσ των αναγκϊν των χρθςτϊν και των νοθτικϊν μοντζλων τουσ και προςφζρουν δεδομζνα που βοθκοφν ςτθν λιψθ ςχεδιαςτικϊν αποφάςεων. Στθν ςυνζχεια παρουςιάηονται οριςμζνεσ μζκοδοι που βοθκοφν ςτθν λιψθ αποφάςεων ςχετικά με τθν διαμόρφωςθ τθσ πλθροφοριακισ δομισ ενόσ δικτυακοφ τόπου. 16

17 Επιςκόπηςη μεθοδολογιών για τον ςχεδιαςμό τησ πληροφοριακήσ δομήσ Ταξινόμηςη Καρτών Θ ταξινόμθςθ καρτϊν (Card Sorting), είναι μια χρθςτοκεντρικι τεχνικι που βοθκά ςτθν αφξθςθ τθσ ανευρεςιμότθτασ (findability) ενόσ ςυςτιματοσ, με το οποίο αλλθλεπιδροφν διάφοροι χριςτεσ. Θ ανευρεςιμότθτα ενόσ ςυςτιματοσ, αναφζρεται ςτον βακμό ευκολίασ, με τον οποίο οι χριςτεσ του ςυςτιματοσ μποροφν να εντοπίςουν τισ πλθροφορίεσ που αναηθτοφν. Ππωσ αναφζρουν χαρακτθριςτικά οι (Rosenfeld and Morville, 2006), πρόκειται για το πιο αποτελεςματικό και ευζλικτο εργαλείο ςτον ςχεδιαςμό τθσ πλθροφοριακισ αρχιτεκτονικισ ενόσ δικτυακοφ τόπου. Θ αποτελεςματικότθτα τθσ μεκόδου ζχει επαλθκευτεί από πλθκϊρα μελετϊν (Capra, 2005; Nielsen J. S., 1995; Sinha, 2005; Tullis, 2004). Ρολφ γενικά, θ τεχνικι βοθκά ςτθν δθμιουργία μιασ δομισ, τα ςτοιχεία για τθν δθμιουργία τθσ οποίασ, υπάρχουν μζςα ςε μια λίςτα μθ ταξινομθμζνων ιδεϊν ι προτάςεων αλλά δεν είναι άμεςα φανερά. Θ διεξαγωγι μιασ μελζτθσ ταξινόμθςθσ καρτϊν ζχει μικρζσ απαιτιςεισ ςε χρόνο και πόρουσ, ενϊ ταυτόχρονα προςφζρει αξιόπιςτα αποτελζςματα. Χρθςιμοποιείται ωσ πθγι πλθροφοριϊν, από τισ οποίεσ εξάγονται ςυμπεράςματα που βοθκοφν ςτθν διαδικαςία ςχεδιαςμοφ. Συγκεκριμζνα εκτόσ από τθν διαμόρφωςθ μιασ γενικισ δομισ, προςφζρει υποδείξεισ για τθν διαμόρφωςθ ςχεδίων πλοιγθςθσ και τθν δθμιουργία μενοφ. Υπάρχουν δυο κφριεσ μορφζσ τθσ μεκόδου, θ ανοικτι και θ κλειςτι μελζτθ ταξινόμθςθσ καρτϊν. Θ διαφορά εντοπίηεται ςτο ότι ςτθν δεφτερθ περίπτωςθ οι χριςτεσ καλοφνται να τοποκετιςουν τισ κάρτεσ ςε προχπάρχουςεσ κατθγορίεσ, ενϊ ςτθν πρϊτθ να δθμιουργιςουν δικζσ τουσ. Θ μελζτθ ςυνίςταται ςτθν κατθγοριοποίθςθ από μια ομάδα χρθςτϊν, ενόσ αρικμοφ καρτϊν, πάνω ςτισ οποίεσ αναγράφονται διάφορεσ ζννοιεσ ι προτάςεισ που αντιςτοιχοφν ςε κάποια πλθροφορία ι υπθρεςία που παρζχεται ςτον δικτυακό τόπο. Σκοπόσ είναι οι χριςτεσ να κατθγοριοποιιςουν τισ κάρτεσ με τρόπο που αναπαριςτά ομάδεσ ι δομζσ τισ οποίεσ αναγνωρίηουν εφκολα και ζχουν νόθμα για τουσ ίδιουσ. Συνικωσ επίςθσ, ηθτείται από τουσ χριςτεσ να χαρακτθρίςουν αυτζσ τισ ομάδεσ με ζναν όρο που αντιπροςωπεφει τα περιεχόμενα τουσ. Στο πλαίςιο τθσ πλθροφοριακισ αρχιτεκτονικισ ςτο διαδίκτυο, θ μελζτθ επιτρζπει ςτουσ ςχεδιαςτζσ να ζχουν μια εικόνα των νοθτικϊν μοντζλων των χρθςτϊν, φανερϊνοντασ τον τρόπο με τον οποίο κατθγοριοποιοφν, ταξινομοφν και αναγνωρίηουν τισ προσ ομαδοποίθςθ ζννοιεσ (Rosenfeld and Morville, 2006).

18 Θ απλότθτα τθσ μεκόδου είναι ο λόγοσ για τθν ςθμαντικι ευελιξία που παρζχει. Μπορεί να χρθςιμοποιθκεί ςτα αρχικά ςτάδια του ςχεδιαςμοφ ωσ ανοικτι μελζτθ, για να διερευνθκοφν πικανά ςενάρια για τθν πλθροφοριακι αρχιτεκτονικι του δικτυακοφ τόπου. Σε μετζπειτα ςτάδιο, μπορεί να προςφζρει τεκμθρίωςθ για ζναν πρωτότυπο ςχεδιαςμό, με τθν μορφι μιασ κλειςτισ μελζτθσ. Ρροςφζρονται επίςθσ πολλζσ παραλλαγζσ, όπωσ θ δυνατότθτα για κατθγοριοποίθςθ των καρτϊν, ανάλογα με τθν ςθμαςία που ζχει για τουσ χριςτεσ, θ φπαρξθ τθσ αντίςτοιχθσ πλθροφορίασ ςτον δικτυακό τόπο. Τα δεδομζνα που προςφζρει μια μελζτθ ταξινόμθςθσ καρτϊν είναι τόςο ποιοτικά όςο και ποςοτικά. Ροιοτικά δεδομζνα είναι δυνατό να εξαχκοφν κατά τθν κατθγοριοποίθςθ, μζςω τθσ παρατιρθςθσ των χρθςτϊν, και τθσ καταγραφισ των ςχολίων και των προβλθμάτων τουσ. Ρεριςςότερο ςυγκεκριμζνεσ πλθροφορίεσ, είναι δυνατό να ςυγκεντρωκοφν από ερωτιςεισ ςτουσ ςυμμετζχοντεσ μετά το πζρασ τθσ μελζτθσ. Τα ποςοτικά δεδομζνα τθσ μελζτθσ ζχουν να κάνουν με το ποςοςτό των χρθςτϊν που κατθγοριοποίθςαν κάκε κάρτα μαηί με κάποια άλλθ, ι ςε κάποια ςυγκεκριμζνθ προχπάρχουςα κατθγορία, ανάλογα με τθν μορφι τθσ μελζτθσ. Τα δεδομζνα αυτά ςχετίηονται με τθν ςθμαςιολογικι ςυςχζτιςθ των καρτϊν και για τθν εξαγωγι τουσ διατίκεται μια πλθκϊρα εργαλείων. Ραρόλα τα παραπάνω, θ προετοιμαςία τθσ μελζτθσ είναι ιδιαίτερα απαιτθτικι τόςο ςε χρονικά όςο και ςε ανκρϊπινουσ πόρουσ. Για να προκφψουν αξιόπιςτα αποτελζςματα, πρζπει να ςυμμετζχουν ςτθν μελζτθ 20 ςυμμετζχοντεσ (Tullis, 2004), 15 (Nielsen J., 2004) ι και λιγότεροι, π.χ αντιπροςωπευτικοί χριςτεσ (Mauer, 2004). Θ εξεφρεςθ και ο ςυντονιςμόσ των ςυμμετεχόντων μπορεί να αποδειχκεί μια δυςχερισ, χρονοβόρα και ακριβι διαδικαςία. Επιπλζον, θ εκτεταμζνθ προετοιμαςία που απαιτείται για τθν δθμιουργία των καρτϊν και θ ςτατιςτικι ανάλυςθ που είναι απαραίτθτθ ςτθν ςυνζχεια, αποκλείουν τθν πικανότθτα μιασ ευρφτερθσ χριςθσ τθσ μεκόδου. Ππωσ προκφπτει και από τθν εμπειρία διαφόρων ειδικϊν ευχρθςτίασ, οι τυπικζσ εργατομζρεσ που απαιτοφνται για τθν διεξαγωγι μιασ μελζτθσ ταξινόμθςθσ καρτϊν κυμαίνονται μεταξφ 3.5 και 7 (IntranetLeadershipForum, 2006) Modified-Delphi ταξινόμηςη καρτών Θ εμπειρία ςτον ςχεδιαςμό τθσ πλθροφοριακισ αρχιτεκτονικισ ζχει καταδείξει τθν ανάγκθ για μια μζκοδο που μπορεί να αποδϊςει ποιοτικά και χριςιμα αποτελζςματα με μικρζσ απαιτιςεισ ςε πόρουσ, θ οποία κα μπορεί να χρθςιμοποιθκεί από τουσ ςχεδιαςτζσ ςτα αρχικά ςτάδια ςχεδιαςμοφ. Θ modified-delphi μζκοδοσ ταξινόμθςθσ καρτϊν (Celeste, 2008) είναι μια παραλλαγι τθσ κλαςςικισ μεκόδου ταξινόμθςθσ καρτϊν ανοικτοφ τφπου, θ οποία ςτοχεφει ςτθν αναίρεςθ των αδυναμιϊν τθσ κλαςςικισ μεκόδου. Συγκεκριμζνα δθμιουργικθκε με ςκοπό τθν παραγωγι χριςιμων αποτελεςμάτων δίχωσ θ 18

19 διεξαγωγι τθσ να απαιτεί μεγάλο αρικμό ςυμμετεχόντων ι να είναι μεγάλθ ςε διάρκεια. Σφμφωνα με τουσ (Celeste, 2008), θ modified-delphi μζκοδοσ παράγει αποτελζςματα που είναι χρθςιμότερα ςτον ςχεδιαςμό τθσ πλθροφοριακισ αρχιτεκτονικισ από αυτά τθσ κλαςςικισ μεκόδου. Ενϊ θ κλαςςικι μζκοδοσ καταγράφει πολλαπλά νοθτικά μοντζλα ταυτόχρονα και ςτθν ςυνζχεια εξάγει ςυμπεράςματα μζςω πολφπλοκων ςτατιςτικϊν αναλφςεων, θ modified-delphi μζκοδοσ διαχειρίηεται ζνα αρχικό νοθτικό μοντζλο που τροποποιείται από τουσ χριςτεσ ςε μια ςειριακι διαδικαςία μζχρι τθν παραγωγι του τελικοφ μοντζλου. Οι χριςτεσ δθλαδι, προτείνουν αλλαγζσ ςτο αρχικό μοντζλο επαναλθπτικά, με ςκοπό τθν βελτιςτοποίθςθ του. Στθν μελζτθ ςυμμετζχουν ςυνικωσ 8-10 άνκρωποι που αντιπροςωπεφουν τουσ χριςτεσ του προσ ςχεδιαςμοφ δικτυακοφ τόπου. Ο πρϊτοσ ςυμμετζχων διαμορφϊνει εκ του μθδενόσ το νοθτικό του μοντζλο, όπωσ ακριβϊσ ςτθν ταξινόμθςθ καρτϊν ανοικτοφ τφπου και προτείνει μια ςυγκεκριμζνθ πλθροφοριακι δομι. Στθν ςυνζχεια, ζνασ-ζνασ οι υπόλοιποι ςυμμετζχοντεσ τροποποιοφν τθν αρχικι δομι ςθμειϊνοντασ παράλλθλα τα ςχόλιά τουσ πάνω ςτθν δομι που παραλαμβάνουν. Εάν το επικυμοφν μποροφν να καταςτρζψουν τθν δομι που παραλαμβάνουν και να προτείνουν ζνα νζο μοντζλο. Θ τελικι δομι προκφπτει από τον τελευταίο χριςτθ και τισ τροποποιιςεισ που προτείνει. Δεδομζνου ότι παραλαμβάνει μια δομι που ζχει δεχκεί τισ τροποποιιςεισ όλων των άλλων ςυμμετεχόντων, αναμζνεται να προτείνει και τισ μικρότερεσ αλλαγζσ. Θ αρχικι δομι είναι δυνατό να προκφψει από ζναν χριςτθ, μια ομάδα χρθςτϊν, ι ζναν ςχεδιαςτι. Επίςθσ, ζνασ ςχεδιαςτισ μπορεί να παρευρίςκεται κατά τθν διεξαγωγι τθσ μελζτθσ ζτςι ϊςτε να ςθμειϊνει τα ςχόλια των χρθςτϊν αλλά και να τουσ βοθκά με τυχόν απορίεσ. Ραρόλα αυτά, ειςάγοντασ μια δομι επθρεαςμζνθ από τον ςχεδιαςτι, αλλάηει τον ςτόχο τθσ μεκόδου από τθν διαμόρφωςθ μιασ νζασ δομισ, ςτθν αξιολόγθςθ μιασ προτεινόμενθσ. Επίςθσ, οι χριςτεσ δεν κα πρζπει να πλθροφοροφνται για τον αρικμό των χρθςτϊν που προθγικθκαν, κακϊσ είναι πικανό να επθρεαςτοφν ψυχολογικά και να διςτάςουν να προτείνουν αλλαγζσ. Το γεγονόσ ότι ο κακζνασ εργάηεται ατομικά, είναι και ο λόγοσ τθσ ελευκερίασ που αιςκάνεται ο χριςτθσ ςτθν τροποποίθςθ και ςτον ςχολιαςμό τθσ παραλαμβανόμενθσ δομισ. Αυτι θ ανϊνυμθ ςυνεργαςία απαλείφει τθν πίεςθ τθσ ομάδασ (peer pressure) και το άγχοσ για καλι επίδοςθ, προβλιματα που παρουςιάηονται ςυχνά ςε μεκόδουσ που χρθςιμοποιοφν ομάδεσ χρθςτϊν ςτον ίδιο χϊρο. Είναι χαρακτθριςτικό πωσ ςτισ ςυγκριτικζσ μελζτεσ που διενζργθςαν οι (Celeste, 2008), οι ςυμμετζχοντεσ ςτθν modified-delphi μζκοδο ιταν ιδιαιτζρωσ ομιλθτικοί, ςχολιάηοντασ τισ αλλαγζσ που πρότειναν αλλά και γενικότερα 19

20 τα προβλιματα που αντιμετωπίηουν ςτο Διαδίκτυο, προςφζροντασ ζτςι πολφ περιςςότερεσ ευκαιρίεσ για εξαγωγι ποιοτικϊν ςυμπεραςμάτων ςτον ςχεδιαςτι. Θ γενικι ιδζα τθσ μεκόδου, όπωσ προαναφζρκθκε, είναι θ εξαγωγι ςυμπεραςμάτων με λιγότερουσ ςυμμετζχοντεσ και μικρότερο φόρτο εργαςίασ τόςο για αυτοφσ όςο και για τον ςχεδιαςτι. Ακριβϊσ διότι δεν ξεκινοφν όλοι οι ςυμμετζχοντεσ από τθν αρχι ςτθν καταςκευι του νοθτικοφ τουσ μοντζλου, ο φόρτοσ για τον κακζνα είναι μικρότεροσ και οι πικανότθτεσ πωσ θ κοφραςθ των ςυμμετεχόντων κα επθρεάςει αρνθτικά τα αποτελζςματα τθσ μελζτθσ μειϊνονται. Θ μικρότερθ διάρκεια και ο μικρόσ φόρτοσ εργαςίασ κάνουν τθν modified-delphi ιδιαίτερα χριςιμθ ςτον ςχεδιαςμό μεγάλων δικτυακϊν τόπων, όπου το πλικοσ των πλθροφοριϊν κάνει τθν διεξαγωγι τθσ κλαςςικισ μελζτθσ ιδιαίτερα δυςχερι Focus Group ταξινόμηςη καρτών Θ μζκοδοσ αυτι πρόκειται ςτθν ουςία για ζναν ςυνδυαςμό τθσ μεκόδου ταξινόμθςθσ καρτϊν και τθσ τεχνικισ των ομάδων ςυηιτθςθσ. Επιςτρατεφει, επίςθσ, τα εργαλεία που χρθςιμοποιοφνται κατά τισ διαδικτυακζσ ταξινομιςεισ καρτϊν αποκομίηοντασ ζτςι τα οφζλθ που παρζχουν αυτά τα εργαλεία (γραφικό περιβάλλον, ευχρθςτία κτλ). Θ διεξαγωγι τθσ μεκόδου ζχει ωσ εξισ: Αρχικά, οι ςυμμετζχοντεσ ςτθν μελζτθ πραγματοποιοφν μια κλαςςικι μελζτθ ταξινόμθςθσ καρτϊν, χρθςιμοποιϊντασ όμωσ ζναν υπολογιςτι ο κακζνασ και κάποιο από τα εργαλεία που χρθςιμοποιοφνται ςτισ διαδικτυακζσ μελζτεσ. Στθν ςυνζχεια, τόςο οι ξεχωριςτζσ δομζσ που προζκυψαν, όςο και θ τελικι μζςω τθσ ςτατιςτικισ ανάλυςθσ, τίκενται προσ ςυηιτθςθ από τθν ομάδα, με ςκοπό τθν ανάλυςθ του ςκεπτικοφ κάκε χριςτθ και τθν ανάδειξθ των μειονεκτθμάτων και πλεονεκτθμάτων κάκε δομισ. Αυτι θ διαδικαςία εκτόσ από τα κλαςςικά ποιοτικά αποτελζςματα που παρζχει θ μζκοδοσ ταξινόμθςθσ καρτϊν, παρζχει τθν δυνατότθτα εξαγωγισ επιπλζον ςυμπεραςμάτων μζςω τθσ ςυηιτθςθσ που ακολουκεί, αλλά και τθν διαμόρφωςθ νζων ιδεϊν που δεν κα ιταν δυνατό να αναλογιςτεί ο ςχεδιαςτισ. Επίςθσ, κακϊσ ςυμμετζχουν και οι χριςτεσ ςτθν ςυηιτθςθ, θ μζκοδοσ κρίνεται ιδιαίτερα αποτελεςματικι για τθν διευκζτθςθ των εςωτερικϊν προβλθμάτων ενόσ οργανιςμοφ ι μιασ εταιρείασ (για παράδειγμα τον ςχεδιαςμό ενόσ εςωτερικοφ δικτφου), αφοφ είναι δυνατό να ςυμμετζχουν οι άμεςα ενδιαφερόμενοι και να ςυηθτιςουν τα αποτελζςματα μεταξφ τουσ Αξιολόγηςη ανευρεςιμότητασ «Η ανευρεςιμότθτα προθγείται τθσ ευχρθςτίασ, τόςο ςτο αλφάβθτο όςο και ςτο Διαδίκτυο. Είναι αδφνατο να χρθςιμοποιιςεισ κάτι που δεν μπορείσ να βρεισ» Peter Morville Ambient Findability 20

21 Θ αξιολόγθςθ τθσ ανευρεςιμότθτασ ενόσ δικτυακοφ τόπου ςε επίπεδο ςτοιχείου, ζγκειται ςτον ζλεγχο τθσ ευκολίασ εντοπιςμοφ του ςτοιχείου από τουσ χριςτεσ που το αναηθτοφν. Σε επίπεδο ςυςτιματοσ, ζγκειται ςτθν ικανότθτα του δικτυακοφ τόπου να υποςτθρίηει τθν πλοιγθςθ ςτα περιεχόμενά του, αλλά και τθν ευκολία ανάκτθςθσ αυτϊν. Ο καλφτεροσ τρόποσ αξιολόγθςθσ τθσ ανευρεςιμότθτασ, είναι θ πραγματοποίθςθ μιασ ι περιςςότερων μελετϊν ευχρθςτίασ. Υπάρχουν διάφορεσ μζκοδοι για αυτόν τον ςκοπό, όπωσ θ ανάςτροφθ ταξινόμθςθ καρτϊν ι ζλεγχοσ δζντρου, ο ζλεγχοσ πρϊτου κλικ κ.ά. Θ ανάςτροφθ ταξινόμθςθ καρτϊν, ελζγχει τθν ευκολία με τθν οποία εντοπίηουν οι χριςτεσ ςυγκεκριμζνα κζματα ςτθν ιεραρχία του δικτυακοφ τόπου. Ρρόκειται για μια απλι μζκοδο που παρζχει χριςιμα ςυμπεράςματα. Σε μια ανάςτροφθ μελζτθ ηθτείται από τουσ χριςτεσ να εντοπίςουν μια πλθροφορία ι υπθρεςία ςτον προσ ςχεδιαςμό δικτυακό τόπο. Αρχικά, παρουςιάηεται ςτουσ χριςτεσ μια λίςτα των αρχικϊν κατθγοριϊν που υπάρχουν ςτον δικτυακό τόπο, όπωσ για παράδειγμα οι κατθγορίεσ τθσ αρχικισ ςελίδασ. Ο κάκε χριςτθσ επιλζγει τθν κατθγορία που αναμζνει πωσ κα τον οδθγιςει ςτθν επικυμθτι πλθροφορία. Στθν ςυνζχεια επιλζγει κάποια από τισ υποκατθγορίεσ τθσ ιεραρχίασ που επίςθσ του παρουςιάηονται ςε μορφι λίςτασ. Θ διαδικαςία αυτι ςυνεχίηεται, μζχρισ ότου ο χριςτθσ εντοπίςει τθν κατθγορία που περιζχει τθν πλθροφορία που αναηθτά. Τζλοσ, ο κάκε χριςτθσ επαναλαμβάνει τθν μελζτθ αρκετζσ φορζσ με διαφορετικό αντικείμενο αναηιτθςθσ κάκε φορά, αναλόγωσ των περιεχομζνων του δικτυακοφ τόπου. Μετά το πζρασ τθσ ςυνολικισ μελζτθσ τα αποτελζςματα αναλφονται από τθν ομάδα ςχεδιαςμοφ, θ οποία εξάγει ςυμπεράςματα ςχετικά με τθν ανευρεςιμότθτα του περιεχομζνου του δικτυακοφ τόπου και κατά ςυνζπεια ςχετικά με τθν αποδοτικότθτα του ςυγκεκριμζνου τρόπου οργάνωςθσ των πλθροφοριϊν. Θ μζκοδοσ είναι αρκετά απλι και για αυτόν τον λόγο ιδιαίτερα ευζλικτθ. Μια ενδιαφζρουςα παραλλαγι είναι θ χριςθ ενόσ χάρτθ ζνταςθσ, μιασ αναπαράςταςθσ του δικτυακοφ τόπου δθλαδι που απεικονίηει τθν ςυχνότθτα με τθν οποία οι χριςτεσ επζλεξαν κάκε κατθγορία αναηθτϊντασ μια ςυγκεκριμζνθ πλθροφορία. Θ ςυχνότθτα μπορεί να απεικονιςτεί με χρϊματα διαφορετικισ ζνταςθσ που υποδεικνφουν τθν προτίμθςθ των χρθςτϊν. Θ παραλλαγι αυτι, επίςθσ, είναι ιδιαιτζρωσ χριςιμθ ςτα ςτάδια αξιολόγθςθσ του ςχεδιαςμοφ, για τθν αξιολόγθςθ των περιγραφϊν των κατθγοριϊν και του τρόπου οργάνωςθσ του δικτυακοφ τόπου. Θ αξιολόγθςθ τθσ ανευρεςιμότθτασ ενόσ δικτυακοφ τόπου μπορεί να χρθςιμοποιθκεί τόςο ςτα αρχικά ςτάδια δθμιουργίασ μιασ πλθροφοριακισ δομισ, όςο και ςτα τελικά ςτάδια τθσ αξιολόγθςθσ μιασ προτεινόμενθσ δομισ. Στο ςτάδιο τθσ δθμιουργίασ, θ ομάδα ςχεδιαςμοφ μπορεί, μζςα από τθν εμπειρία τθσ ι και 21

22 μζςω μελετϊν όπωσ θ ταξινόμθςθ καρτϊν, να διαμορφϊςει μια αρχικι δομι θ οποία ςτθν ςυνζχεια να αξιολογθκεί βάςει τθσ ανευρεςιμότθτάσ τθσ. Τα ςυμπεράςματα που προκφπτουν μζςα από τθν αξιολόγθςθ βοθκοφν ςτθν τροποποίθςθ και βελτίωςθ τθσ αρχικισ δομισ και ςτθν διαμόρφωςθ νζων αποδοτικότερων δομϊν υποδεικνφοντασ ςτθν ομάδα ςχεδιαςμοφ προβλθματικζσ περιοχζσ τθσ δομισ του δικτυακοφ τόπου. Τζλοσ, ίςωσ το ςθμαντικότερο ςτοιχείο τθσ μεκόδου είναι πωσ αξιολογείται άμεςα θ δυνατότθτα των χρθςτϊν να εντοπίςουν μια πλθροφορία και όχι να τθν κατθγοριοποιιςουν, διαδικαςία που προςομοιϊνει ςε μεγάλο βακμό τισ πραγματικζσ ανάγκεσ των χρθςτϊν Αυθόρμητεσ Λίςτεσ Ζνα από τα προβλιματα που αντιμετωπίηουν οι ςχεδιαςτζσ κατά τθν προετοιμαςία μιασ μελζτθσ ταξινόμθςθσ καρτϊν, είναι θ επιλογι των ςυγκεκριμζνων καρτϊν που κα ςυμπεριλθφκοφν ςτθν μελζτθ κακϊσ και το λεξιλόγιο που κα χρθςιμοποιιςουν ςτισ περιγραφζσ των καρτϊν. Ρροφανϊσ, το καταλλθλότερο περιεχόμενο που κα πρζπει να μελετθκεί είναι αυτό που κεωρείται ςθμαντικότερο από τουσ χριςτεσ. Θ μζκοδοσ των αυκόρμθτων λιςτϊν, χρθςιμοποιείται για τθν αναγνϊριςθ των ςθμαντικότερων ςτοιχείων που αναπαριςτοφν μια κατθγορία με τον καλφτερο τρόπο. Οι αυκόρμθτεσ λίςτεσ μποροφν επίςθσ να χρθςιμοποιθκοφν για τθν αναγνϊριςθ του λεξιλογίου που χρθςιμοποιοφν οι χριςτεσ για να περιγράψουν όρουσ ςχετικοφσ με το περιεχόμενο του δικτυακοφ τόπου. Πταν προθγείται μιασ μελζτθσ ταξινόμθςθσ καρτϊν, θ μζκοδοσ βοθκά ςτον περιοριςμό των περιεχομζνων τθσ ταξινόμθςθσ ςτα απολφτωσ απαραίτθτα και ςτθν περιγραφι των καρτϊν με το λεξιλόγιο που χρθςιμοποιοφν οι ίδιοι οι χριςτεσ, μειϊνοντασ ζτςι τθν υποκειμενικότθτα που ειςάγεται από τθν ανάμιξθ του ςχεδιαςτι. Θ μζκοδοσ τζλοσ, μζςω τθσ ανάλυςθσ των αποτελεςμάτων, προςφζρει πλθροφορίεσ για τον τρόπο οργάνωςθσ των περιεχομζνων του δικτυακοφ τόπου. Θ απλι διεξαγωγι τθσ μεκόδου, θ οποία μπορεί να πραγματοποιθκεί και διαδικτυακά, ζχει ωσ εξισ: Αρχικά, ηθτείται από τουσ χριςτεσ να δθμιουργιςουν μια λίςτα με όλα τα ςτοιχεία που μποροφν να ςκεφτοφν. Τα ςτοιχεία αυτά μπορεί να είναι τα μζλθ μιασ οποιαδιποτε κατθγορίασ, όπωσ για παράδειγμα οικιακά ηϊα, μοντζλα πολεμικϊν αεροπλάνων, προβλιματα κακθμερινότθτασ ι οτιδιποτε άλλο ςχετίηεται με τον προσ ςχεδιαςμό δικτυακό τόπο. Ρροαιρετικά, είναι δυνατό οι χριςτεσ να χρθςιμοποιιςουν τισ λίςτεσ των υπόλοιπων χρθςτϊν για να πάρουν ιδζεσ και ενδεχομζνωσ να τισ επεκτείνουν. 22

23 Τζλοσ, ο ςχεδιαςτισ αναλφει τα αποτελζςματα βάςει τθσ ςυχνότθτασ επιλογισ κάκε ςτοιχείου και τθσ ςειράσ που τοποκετικθκε ςτθν λίςτα. Μια ζρευνα ζχει δείξει πωσ 20 με 30 χριςτεσ είναι αρκετοί για τθν παραγωγι ικανοποιθτικϊν αποτελεςμάτων (Weller & Romney, 1988), αλλά ο ςχεδιαςτισ ζχει τθν δυνατότθτα να χρθςιμοποιιςει ομάδεσ των πζντε ι δζκα ατόμων και να ςταματιςει τθν μελζτθ όταν κρίνει πωσ θ τελευταία ομάδα δεν τροποποίθςε αιςκθτά τα αποτελζςματα ςε ςχζςθ με τθν προθγοφμενθ. Θ μζκοδοσ των ελεφκερων λιςτϊν μπορεί επίςθσ να χρθςιμοποιθκεί για τθν αναγνϊριςθ τθσ οικειότθτασ του κάκε χριςτθ με το κεματικό αντικείμενο του δικτυακοφ τόπου. Οι περιςςότερο οικείοι χριςτεσ μπορεί να χρθςιμοποιθκοφν ωσ οι αρχικοί χριςτεσ μιασ μελζτθσ modified-delphi ι ωσ μια ομάδα ειδικϊν για τθν διεξαγωγι μιασ μελζτθσ ταξινόμθςθσ καρτϊν που αφορά ζνα πιο εξειδικευμζνο κομμάτι του δικτυακοφ τόπου. Αντίκετα επίςθσ, μπορεί να αναγνωριςτοφν χριςτεσ οι οποίοι αντιλαμβάνονται το κεματικό αντικείμενο με εντελϊσ προςωπικό και διαφοροποιθμζνο τρόπο και ςυνεπϊσ να αποκλειςτοφν από τθν μελλοντικι μελζτθ ταξινόμθςθσ καρτϊν Εντατικόσ Έλεγχοσ Πλοήγηςησ Θ μζκοδοσ γνωςτι ωσ navigation stress test, που επινοικθκε από τον (Instone, 1998), επιτρζπει ςτον ςχεδιαςτι να αξιολογιςει τθν προςβαςιμότθτα, ευχρθςτία και πλοθγιςιμότθτα ενόσ δικτυακοφ τόπου. Θ κεντρικι ιδζα τθσ μεκόδου είναι θ χριςθ κάποιων ερωτθμάτων ςχετικϊν με τθν πλοθγιςιμότθτα του δικτυακοφ τόπου, θ απάντθςθ των οποίων οδθγεί ςτθν εξαγωγι χριςιμων ςυμπεραςμάτων. Θ μζκοδοσ περιζχει τον όρο εντατικόσ κακϊσ οι περιςςότερεσ ιςτοςελίδεσ κα αποτφχουν ςτθν απόδοςθ όλων των απαντιςεων ςτα ερωτιματα που κζτει θ μζκοδοσ. Οι ελλείψεισ μπορεί να είναι κρίςιμεσ ι αςιμαντεσ, ςε κάκε περίπτωςθ όμωσ κα προκφψουν χριςιμα ςυμπεράςματα, είτε κετικά είτε αρνθτικά ςχετικά με τθν πλοθγιςιμότθτα του δικτυακοφ τόπου. Οι ερωτιςεισ που κζτει θ μζκοδοσ, είναι ςτθν ουςία οι απορίεσ που ζχουν ςυνικωσ οι χριςτεσ ςχετικά με το μοντζλο πλοιγθςθσ του κάκε δικτυακοφ τόπου που επιςκζπτονται. Οι ερωτιςεισ αυτζσ αποτελοφν παραλλαγζσ των τριϊν βαςικϊν αποριϊν που ζχουν οι χριςτεσ κατά τθν άφιξι τουσ (μζςω μιασ μθχανισ αναηιτθςθσ ςυνικωσ) ςε μια ιςτοςελίδα: Ρου είμαι; Τι υπάρχει εδϊ; Ρου μπορϊ να πάω ςτθν ςυνζχεια; Θ ακριβισ διαδικαςία ζχει ωσ εξισ: 23

24 Αρχικά επιλζγεται τυχαία μια ιςτοςελίδα που βρίςκεται βακιά ςτθν ιεραρχία του δικτυακοφ τόπου. Στθν ςυνζχεια θ ιςτοςελίδα εκτυπϊνεται χωρίσ χρϊμα και χωρίσ να ςυμπεριλαμβάνεται θ διεφκυνςι τθσ (URL) ςτθν εκτφπωςθ. Ο ςχεδιαςτισ προςποιείται ζναν χριςτθ ο οποίοσ επιςκζπτεται για πρϊτθ φορά τον ςυγκεκριμζνο δικτυακό τόπο και προςπακεί να απαντιςει ςτα ερωτιματα τθσ μεκόδου. Τα ςθμεία τθσ ιςτοςελίδασ που κεωρεί ότι περιζχουν τισ απαντιςεισ ςθμειϊνονται ςτο χαρτί και τζλοσ, οι ςθμειϊςεισ και οι παρατθριςεισ του ςχεδιαςτι ςυγκρίνονται με αυτζσ άλλων ςυμμετεχόντων ςτθν μελζτθ, οι οποίοι κατά προτίμθςθ δεν ζχουν καμία προθγοφμενθ επαφι με τον δικτυακό τόπο. Θ ςυμφωνία ι θ διαφωνία μεταξφ των ςυμμετεχόντων υποδεικνφει τα αρνθτικά και κετικά ςτοιχεία του ςυγκεκριμζνου μοντζλου πλοιγθςθσ. Φυςικά, θ μελζτθ μπορεί και κα πρζπει να επαναλθφκεί για περιςςότερεσ τυχαίεσ ιςτοςελίδεσ του δικτυακοφ τόπου, οι οποίεσ βρίςκονται ςε διαφορετικά ςθμεία ςτθν ιεραρχία του. Τα ςυμπεράςματα τθσ μελζτθσ βοθκοφν τον ςχεδιαςτι ςτθν βελτίωςθ του μοντζλου πλοιγθςθσ και ςτθν δθμιουργία μιασ καλφτερθσ δομισ πλθροφοριϊν που ςυμβάλει τελικά ςε μια καλφτερθ εμπειρία χριςθσ Προςδιοριςμόσ Ονομάτων Ο προςδιοριςμόσ ονομάτων είναι μια τεχνικι που ςυμπλθρϊνει τα αποτελζςματα μιασ μελζτθσ ταξινόμθςθσ καρτϊν. Θ ταξινόμθςθ καρτϊν, αν και φανερϊνει τον τρόπο με τον οποίο αντιλαμβάνονται οι χριςτεσ τισ ςχζςεισ μεταξφ των περιεχομζνων του δικτυακοφ τόπου, δεν προςφζρει ςθμαντικζσ πλθροφορίεσ για τθν ονομαςία των κατθγοριϊν ι των ςτοιχείων που τισ αποτελοφν. Μετά το πζρασ μιασ μελζτθσ ταξινόμθςθσ καρτϊν ο ςχεδιαςτισ μπορεί να ηθτιςει από τουσ χριςτεσ να ονομάςουν τισ κατθγορίεσ που δθμιοφργθςαν και ενδεχομζνωσ να αλλάξουν τθν ονομαςία οριςμζνων καρτϊν ςφμφωνα με τισ προτιμιςεισ τουσ. Οι ονομαςίεσ που προςδίδουν οι χριςτεσ αναλφονται ςτθν ςυνζχεια από τον ςχεδιαςτι ζτςι ϊςτε τελικά να χρθςιμοποιθκοφν ονομαςίεσ που περιγράφουν με τον καλφτερο δυνατό τρόπο τισ κατθγορίεσ και τα περιεχόμενά τουσ. Θ διεξαγωγι τθσ τεχνικισ του προςδιοριςμοφ ονομάτων μετά τθν μελζτθ ταξινόμθςθσ καρτϊν και πριν τθν αξιολόγθςθ ανευρεςιμότθτασ προλαμβάνει οριςμζνα προβλιματα που κα αποκάλυπτε θ αξιολόγθςθ ανευρεςιμότθτασ, οδθγϊντασ ζτςι ςε μια αποδοτικότερθ διαδικαςία ςχεδιαςμοφ Συμπεράςματα Με τθν ςφντομθ αναςκόπθςθ των παραπάνω μεκοδολογιϊν, γίνεται φανερό ότι θ χρθςτοκεντρικι δόμθςθ των πλθροφοριϊν ενόσ δικτυακοφ τόπου είναι μια χρονοβόρα και επίπονθ διαδικαςία που εμπλζκει πολλζσ και διαφορετικζσ 24

25 μεκόδουσ. Ο ςχεδιαςμόσ του δικτυακοφ τόπου μζςα ςτο μικρότερο δυνατό χρονικό διάςτθμα, ζχει επιβλθκεί από τον μειοφμενο χρόνο που διατίκεται ςτουσ ςχεδιαςτζσ και τθν πίεςθ για γριγορα και ποιοτικά αποτελζςματα (Calabria, 2004). Διαφαίνεται ζντονα λοιπόν θ ανάγκθ για ανάπτυξθ εργαλείων που κα είναι ικανά να υποςτθρίηουν τον ςχεδιαςτι ςτθν χριςθ αυτϊν των τεχνικϊν, μειϊνοντασ τον απαιτοφμενο χρόνο και το κόςτοσ εφαρμογισ. Συγκεκριμζνα για τθν μζκοδο ταξινόμθςθσ καρτϊν, ζχουν προτακεί ςτθν βιβλιογραφία διάφορα εργαλεία τα οποία υποςτθρίηουν τθ διεξαγωγι και τθν ανάλυςθ των δεδομζνων μιασ τζτοιασ μελζτθσ. Ραραδείγματα τζτοιων εργαλείων είναι τα εξισ : USort/EZCalc (Dong, 2001) CardZort 2 και OptimaSort 3. Αυτά τα εργαλεία αυτοματοποιοφν κάποια ςτάδια τθσ ςυλλογισ δεδομζνων ι/και τθσ ανάλυςισ τουσ και γενικά αποτελοφνται από τρία μζρθ: ζνα εργαλείο διαχείριςθσ που επιτρζπει τθν οργάνωςθ τθσ μελζτθσ, ζνα εργαλείο ταξινόμθςθσ καρτϊν που χρθςιμοποιοφν οι ςυμμετζχοντεσ και ζνα για τθν ανάλυςθ των αποτελεςμάτων. Ακόμα και με αυτά τα εργαλεία όμωσ, θ ςυλλογι και θ ανάλυςθ των δεδομζνων παραμζνει μία χρονοβόρα και επίπονθ διαδικαςία. Συνζπεια των παραπάνω είναι οι ςχεδιαςτζσ τελικά να αγνοοφν τθν μζκοδο και να βαςίηονται ςε εμπειρικζσ προςεγγίςεισ Μία εναλλακτική προςέγγιςη ςχεδιαςμού τησ πληροφοριακήσ αρχιτεκτονικήσ: AutoCardSorter Θ προςζγγιςθ των (Katsanos, Tselios, & Avouris, 2008) ςτο πρόβλθμα που περιγράφθκε, οδιγθςε ςτθν διαμόρφωςθ μιασ εργαλειο-κεντρικισ μεκοδολογίασ, θ οποία ςτοχεφει ςτθν αυτοματοποίθςθ τθσ διαδικαςίασ ςχεδίαςθσ και αξιολόγθςθσ τθσ πλθροφοριακισ αρχιτεκτονικισ ενόσ δικτυακοφ τόπου. Θ αυτοματοποίθςθ κάποιων ςταδίων του κφκλου ςχεδιαςμοφ και αξιολόγθςθσ των δικτυακϊν τόπων είναι κρίςιμθ, δεδομζνου του αρικμοφ, τθσ ςυχνότθτασ ενθμζρωςθσ του περιεχομζνου και του μεγζκουσ των δικτυακϊν τόπων που δθμιουργοφνται κακθμερινά (Brinck, 2002). Είναι εμφανζσ, πωσ τα οφζλθ που προκφπτουν από τθν αυτοματοποίθςθ οριςμζνων ςταδίων τθσ διαδικαςίασ ςχεδιαςμοφ ι/και τθσ διαδικαςίασ αξιολόγθςθσ, είναι πολλαπλά και κρίςιμθσ ςθμαςίασ. Αρχικά, προςφζρεται ςτον ςχεδιαςτι αυξθμζνθ ευελιξία και αποδοτικότθτα, κακϊσ ο απαιτοφμενοσ χρόνοσ για τα αυτοματοποιθμζνα ςτάδια είναι κατά πολφ μικρότεροσ. Ο ςχεδιαςτισ κατά ςυνζπεια, μπορεί να διακζςει περιςςότερο χρόνο ςτα μθ-αυτοματοποιθμζνα ςτάδια, αλλά και ςτθν εκμετάλλευςθ νζων πρακτικϊν οι

26 οποίεσ δεν ιταν δυνατό να ςυμπεριλθφκοφν ςτο χρονοδιάγραμμα. Ππωσ ςθμειϊνουν και οι (Rosenfeld and Morville, 2006), είναι πολφ προτιμότερο να διεξαχκοφν πζντε χρθςτοκεντρικζσ μελζτεσ και πζντε αξιολογιςεισ ευχρθςτίασ, παρά να διεξαχκεί μια μελζτθ δζκα φορζσ. Θ αυτοματοποίθςθ, επίςθσ, μπορεί να οδθγιςει ςτθν επιτάχυνςθ τθσ ςυνολικισ διαδικαςίασ ςχεδιαςμοφ και αξιολόγθςθσ, δθλαδι ςτθν μείωςθ του απαιτοφμενου χρόνου για τθν ολοκλιρωςθ του ζργου του ςχεδιαςτι. Το εργαλείο ςτο οποίο βαςίηεται αυτι θ μζκοδοσ είναι το AutoCardSorter 4, ζνα εργαλείο εμπνευςμζνο από τθν κλαςςικι μζκοδο ταξινόμθςθσ καρτϊν που παρουςιάςτθκε παραπάνω. Το AutoCardSorter ςυνδυάηει μζτρα ςθμαςιολογικισ ςυςχζτιςθσ, όπωσ πχ θ μζκοδοσ Latent Semantic Analysis ι LSA (Landauer & Dumais, 1997) και αλγορίκμουσ ςυγκρότθςθσ ςυςτάδων (clustering algorithms), με ςτόχο τθν πλιρθ αυτοματοποίθςθ τθσ μεκόδου ταξινόμθςθσ καρτϊν, για τθν αποδοτικότερθ επίλυςθ του προβλιματοσ τθσ κατάλλθλθσ οργάνωςθσ του περιεχομζνου ενόσ δικτυακοφ τόπου. Συγκεκριμζνα, το εργαλείο εφαρμόηει τθν μζκοδο LSA πάνω ςε εικονικζσ κάρτεσ, οι οποίεσ αποτελοφνται από τον τίτλο και τθν περιγραφι κάποιασ πλθροφορίασ ι υπθρεςίασ που προςφζρεται ςτον δικτυακό τόπο. Σκοπόσ είναι θ αναπαραγωγι του αποτελζςματοσ μιασ μελζτθσ ταξινόμθςθσ καρτϊν, δθλαδι θ ςυγκρότθςθ των καρτϊν ςε ομάδεσ που ζχουν νόθμα για τουσ χριςτεσ τθσ ιςτοςελίδασ. Για τον ςκοπό αυτό χρθςιμοποιείται θ μζκοδοσ LSA για τθν εκτίμθςθ τθσ ςθμαςιολογικισ ομοιότθτασ μεταξφ όλων των ηευγαριϊν καρτϊν 5. Στθν ςυνζχεια, ο αλγόρικμοσ ςυγκρότθςθσ ςυςτάδων δθμιουργεί ομάδεσ από κάρτεσ με κριτιριο τθ ςθμαςιολογικι τουσ ομοιότθτα όπωσ προζκυψε από τθν εφαρμογι τθσ LSA. Το εργαλείο επίςθσ, προςφζρει δυο ςυμπλθρωματικζσ τεχνικζσ για τον προςδιοριςμό του ςτατιςτικά βζλτιςτου αρικμοφ ομάδων (Eigen Criterion, Elbow Criterion), κακϊσ και υποδείξεισ για πικανζσ ςυνδζςεισ μεταξφ ςτοιχείων που ςυγκροτικθκαν ςε διαφορετικζσ ομάδεσ. Οι ςυνδζςεισ αυτζσ προςφζρουν εναλλακτικζσ διαδρομζσ για τισ ςελίδεσ του δικτυακοφ τόπου και αυξάνουν τθν ανευρεςιμότθτα των πλθροφοριϊν του (Morville, 2005). Το αποτζλεςμα του εργαλείου είναι ζνα διαδραςτικό δενδρόγραμμα που αναπαριςτά τθν προτεινόμενθ κατθγοριοποίθςθ των καρτϊν. Ο ςχεδιαςτισ ζχει τθν δυνατότθτα να επιλζξει τον επικυμθτό αρικμό ομάδων είτε οπτικά (με μεταφορά και απόκεςθ μίασ κάκετθσ γραμμισ που απεικονίηει το βακμό ςυνοχισ των ομάδων), είτε επιλζγοντασ τον ακριβι αρικμό μζςω ενόσ μενοφ. 4 Το εργαλείο AutoCardSorter (Katsanos C. T., 2008) διατίκεται δωρεάν, κατόπιν ςχετικοφ αιτιματοσ που μπορεί να γίνει ςτθν ιςτοςελίδα 5 Μια αναλυτικι περιγραφι τθσ LSA παρουςιάηεται ςτο κεφάλαιο 4 26

27 Σθμειϊνουμε τζλοσ, πωσ τα οφζλθ που παρζχονται από τθν χριςθ του AutoCardSorter αναμζνεται να είναι ακόμα ςθμαντικότερα ςτο ςχεδιαςμό μεγάλων ςε μζγεκοσ δικτυακϊν τόπων, κακϊσ οι κλαςςικζσ τεχνικζσ ταξινόμθςθσ καρτϊν γίνονται ιδιαιτζρωσ χρονοβόρεσ και πολφπλοκεσ για περιςςότερεσ από 100 κάρτεσ (Mauer, 2004). Ρεραιτζρω οφζλθ προκφπτουν ςτθν περίπτωςθ τθσ κατθγοριοποίθςθσ τεχνικϊν και επιςτθμονικϊν εννοιϊν με τισ οποίεσ δεν είναι οικείοσ ο ςχεδιαςτισ, κακϊσ ο αλγόρικμοσ ςθμαςιολογικισ ςυςχζτιςθσ μπορεί να αποδίδει εξίςου καλά ςε αυτζσ τισ περιπτϊςεισ. Θ ακρίβεια τθσ μεκόδου LSA, αν και δεν ζχει διενεργθκεί ςχετικι μελζτθ, αναμζνεται να μειϊνεται ςτθν τελευταία περίπτωςθ για λόγουσ που αναλφονται ςε επόμενο κεφάλαιο. Επίςθσ, δεδομζνου του ότι ακόμα δεν ζχει διερευνθκεί επαρκϊσ ποια μζκοδοσ ςθμαςιολογικισ ςυςχζτιςθσ είναι αποτελεςματικότερθ, το AutoCardSorter ζχει ςχεδιαςτεί ζτςι ϊςτε να επιτρζπει τθν εφκολθ ενςωμάτωςθ εναλλακτικϊν αλγορίκμων. Ολοκλθρϊνοντασ, οφείλουμε να ςθμειϊςουμε πωσ θ αυτοματοποίθςθ οριςμζνων ςταδίων τθσ διαδικαςίασ ςχεδιαςμοφ δεν ζρχεται χωρίσ κόςτοσ. Το AutoCardSorter αδυνατεί να παρζχει τθν ευελιξία τθσ κλαςςικισ μεκόδου, κακϊσ μελζτεσ που ερευνοφν τισ ανάγκεσ των χρθςτϊν ι τθν ςθμαςία που αποδίδουν ςε κάποια πλθροφορία ι υπθρεςία, δεν είναι δυνατό να προςομοιωκοφν από το εργαλείο προσ το παρόν. Επίςθσ, χάνεται θ δυνατότθτα εξαγωγισ ποιοτικϊν δεδομζνων, δυνατότθτα που προςφζρεται από τθν κλαςςικι μελζτθ. Επιπρόςκετα, κα πρζπει να διερευνθκεί κατά πόςο το AutoCardSorter μπορεί να προςομοιϊςει τα αποτελζςματα μιασ ομάδασ εφιβων, υπεριλικων ι οποιαςδιποτε υπο-ομάδασ του γενικοφ πλθκυςμοφ. Τζλοσ, θ ςθμαντικότερθ ίςωσ απϊλεια που προκφπτει από τθν αυτοματοποίθςθ μιασ μελζτθσ που ςυμμετζχουν χριςτεσ, είναι θ απϊλεια τθσ δυνατότθτασ για εκμετάλλευςθ των αποτελεςμάτων ωσ μζςο πίεςθσ προσ τουσ ςυνεργάτεσ του ςχεδιαςτι (Rosenfeld and Morville, 2006), με απϊτερο ςκοπό τθν ενςωμάτωςθ περιςςότερων προτάςεων του ςχεδιαςτι, ςτον τελικό ςχεδιαςμό του δικτυακοφ τόπου. Ακόμα και αν φτάςει ςτακερά ςτο 100% θ ςυμφωνία των αποτελεςμάτων των δυο μεκόδων, θ βαρφτθτα των προτάςεων που προκφπτουν άμεςα από τισ απόψεισ των χρθςτϊν, κα είναι πάντα μεγαλφτερθ. Λδανικά, λοιπόν, κα λζγαμε ότι θ μζκοδοσ ταξινόμθςθσ καρτϊν δεν κα ζπρεπε να αυτοματοποιθκεί, απομακρφνοντασ τουσ χριςτεσ από τθν διαδικαςία ςχεδιαςμοφ. Θ πραγματικότθτα όμωσ επιβάλει τζτοιεσ προςεγγίςεισ κακϊσ λόγω χρονικϊν περιοριςμϊν και φόρτου εργαςίασ θ μζκοδοσ δεν χρθςιμοποιείται όςο κα ζπρεπε. Συνεπϊσ, είναι ςαφϊσ επικυμθτό να υπάρχει μια εναλλακτικι προςζγγιςθ, ακόμα και αν δεν προςφζρει το ςφνολο των δυνατοτιτων τθσ κλαςςικισ μεκόδου. 27

28 28

29 3. Πειραματικε σ Μελε τεσ και Απότελε ςματα 3.1. Συγκριτική μελέτη Ταξινόμηςησ Καρτών ανοικτού τύπου AutoCardSorter Σκοπόσ τθσ μελζτθσ ιταν να διερευνθκεί αν επαλθκεφεται θ αποτελεςματικότθτα και αποδοτικότθτα του εργαλείου Auto Card Sorter για το ςχεδιαςμό τθσ δομισ ενόσ δικτυακοφ τόπου. Ππωσ προαναφζρκθκε ςτθν ειςαγωγι τθσ διπλωματικισ εργαςίασ, ζχουν ιδθ γίνει τρεισ μελζτεσ με τον ίδιο ςκοπό και τα αποτελζςματα ιταν πολφ ενκαρρυντικά (Katsanos, Tselios, & Avouris, 2008). Ακολουκικθκε λοιπόν θ ίδια μεκοδολογία για να ςυγκρικοφν τα αποτελζςματα τθσ παραδοςιακισ μεκόδου ταξινόμθςθσ καρτϊν ανοιχτοφ τφπου με τθν εργαλείοκεντρικι μζκοδο AutoCardSorter, αναφορικά με τον ςχεδιαςμό μίασ υποκετικισ πφλθσ ενθμζρωςθσ (News Portal). Θ μελζτθ ταξινόμθςθσ καρτϊν ζλαβε χϊρα ςτα πλαίςια του εργαςτθρίου του μακιματοσ Επικοινωνίασ Ανκρϊπου Μθχανισ και Σχεδίαςθσ Διαδραςτικϊν Συςτθμάτων, του τμιματοσ Θλεκτρολόγων Μθχανικϊν και Τεχνολογίασ Υπολογιςτϊν τθσ Ρολυτεχνικισ Σχολισ του Ρανεπιςτθμίου Ρατρϊν Μεθοδολογία και Διαδικαςία Αρχικά, το AutoCardSorter χρθςιμοποιικθκε για τθ δόμθςθ τθσ υπό ςχεδίαςθ πφλθσ ενθμζρωςθσ. Στθν ςυνζχεια, τα αποτελζςματα που προζκυψαν ςυγκρίκθκαν με αυτά τθσ κλαςςικισ μεκόδου ταξινόμθςθσ καρτϊν ανοικτοφ-τφπου. Ο ςτόχοσ τθσ διαδικαςίασ ςχεδίαςθσ ιταν να ομαδοποιθκεί ζνα ςφνολο άρκρων, ςφμφωνα με τισ απαιτιςεισ του ανκρωποκεντρικοφ ςχεδιαςμοφ. Για το ςκοπό αυτό επιλζχκθκαν 38 ειδθςεογραφικά άρκρα από διαφορετικοφσ δικτυακοφσ τόπουσ ενθμζρωςθσ, (πχ news.ert.gr, goal.com, greeknewsonline.com, athensnews.gr, feeds.bignewsnetwork.com, reuters.com). Το ςενάριο τθσ μελζτθσ υποκζτει πωσ τα ςυγκεκριμζνα άρκρα αποτελοφν τισ ειδιςεισ τθσ θμζρασ, οι οποίεσ πρζπει να κατθγοριοποιθκοφν με τρόπο που να διευκολφνει τθν πλοιγθςθ ςε αυτά. Επίςθσ, υποκζτουμε πωσ δεν περιοριηόμαςτε από προχπάρχουςεσ κατθγορίεσ και για αυτόν το λόγο θ μελζτθ είναι ανοικτοφ τφπου. Υποκζτουμε δθλαδι, πωσ ο δικτυακόσ τόποσ δεν χρθςιμοποιεί κάποιεσ δεδομζνεσ και αμετάβλθτεσ κατθγορίεσ ςτισ οποίεσ πρζπει να τοποκετθκοφν τα κακθμερινά άρκρα. Αντίκετα, κάκε μζρα δθμιουργοφνται νζεσ κατθγορίεσ, οι οποίεσ εξαρτϊνται από το περιεχόμενο των άρκρων και τυχόν ςυγκεκριμζνεσ προτιμιςεισ των χρθςτϊν. Επιλζχκθκε περίπου ίδιοσ αρικμόσ άρκρων από τισ εξισ γενικζσ κατθγορίεσ: α)πολιτικά, β)οικονομικά, γ)ακλθτικά, δ)επιςτθμονικά. Αυτό αντιςτοιχεί ςε περίπου δζκα άρκρα από κάκε κατθγορία, διακζςιμα προσ κατθγοριοποίθςθ. 29

30 Οι περιγραφζσ και οι τίτλοι των καρτϊν διατθρικθκαν αναλλοίωτοι και για τισ δφο μεκόδουσ (Open Sorting, AutoCardSorter). Οι τίτλοι των άρκρων επιλζχκθκαν ωσ οι τίτλοι των καρτϊν προσ ομαδοποίθςθ, ενϊ το περιεχόμενο των καρτϊν ιταν ζνα μικρό απόςπαςμα από το κάκε άρκρο. Στισ περιςςότερεσ περιπτϊςεισ, το απόςπαςμα ιταν θ πρϊτθ παράγραφοσ του άρκρου, κακϊσ ςυνθκίηεται αυτι να αποτελεί και μια περίλθψθ ολόκλθρου του άρκρου. Τα παραπάνω ζγιναν με τθν λογικι μιασ μελλοντικισ χριςθσ ενόσ τροποποιθμζνου AutoCardSorter, εξειδικευμζνου για ειδθςεογραφικζσ ιςτοςελίδεσ, το οποίο κα μπορεί να κατθγοριοποιεί τα άρκρα ςε πραγματικό χρόνο (πχ κακθμερινι κατθγοριοποίθςθ των νζων άρκρων). Σε αυτό το ςενάριο, οποιαδιποτε αλλαγι ι επεξεργαςία των άρκρων πριν τθν είςοδό τουσ ςτο AutoCardSorter κα ιταν αρκετά δφςκολθ για πρακτικοφσ λόγουσ. Για τον λόγο αυτό, μασ ενδιζφερε να ςυγκρίνουμε τα αποτελζςματα των δυο μεκόδων χωρίσ να ζχει γίνει κάποια ειδικι προεπεξεργαςία. Αξίηει να ςθμειωκεί πωσ οι τίτλοι και το περιεχόμενο των καρτϊν τροποποιικθκαν ελαφρά, όπωσ απαιτείται για τεχνικοφσ λόγουσ από τθν LSA ανάλυςθ (πχ αφαίρεςθ των s από το τζλοσ των λζξεων). Αυτζσ οι αλλαγζσ, όμωσ, μπορεί να γίνονται μελλοντικά αυτόματα από το εργαλείο. Στθ ςυνζχεια οι τίτλοι και οι περιγραφζσ των άρκρων δόκθκαν ωσ είςοδοσ ςτο AutoCardSorter και επιλζχκθκε ο καταλλθλότεροσ, για τθν ςυγκεκριμζνθ κεματικι ενότθτα, LSA ςθμαςιολογικόσ χϊροσ (ςϊμα κειμζνου ςτο οποίο ζχει εκπαιδευτεί ο αλγόρικμοσ). Ο αρικμόσ των χρθςτϊν που κλικθκαν να ςυμμετάςχουν ςτθν ανοικτι μελζτθ ταξινόμθςθσ καρτϊν ιταν 37, αρικμόσ που ςφμφωνα με τθν βιβλιογραφία (Nielsen J., 2004; Tullis, 2004) είναι αρκετόσ για τθν παραγωγι αντιπροςωπευτικϊν αποτελεςμάτων. Θ μελζτθ χωρίςτθκε ςε τρία μζρθ. Στο πρϊτο, οι ςυμμετζχοντεσ πλθροφορικθκαν για τθν γενικότερθ φφςθ τθσ μελζτθσ. Στθν ςυνζχεια δόκθκαν πλθροφορίεσ για τον υπό ςχεδίαςθ δικτυακό τόπο και τον ςτόχο τθσ μελζτθσ. Τζλοσ, οι κάρτεσ δόκθκαν ςτουσ χριςτεσ με θλεκτρονικι μορφι, οι οποίοι και προχϊρθςαν ςτθν κατθγοριοποίθςθ χρθςιμοποιϊντασ το εργαλείο USort (Dong, 2001). 30

31 Larissa Stun AEK Police caught two burglars, members of a gang, in Patras. Depression doubles early birth Larissa loses to Panthrakikos Shares have fallen Prime Minister Satisfied with Eurozone Summit An injury-time Marcelo Sarmiento equalizer stunned AEK in Athens on Sunday, as Larissa grabbed a deserved 1-1 draw at the OAKA Spiros Louis Stadium. Police arrested two burglars that have broken into 10 houses in the last two days. Three more people, members of the same gang, are being sought. Women who are severely depressed during pregnancy have twice the risk of their babies coming early, a study suggests. There was also limited evidence that other factors, such as obesity, and the number of stressful events, could increase the risk posed by depression yet further. Barely a week after scoring an impressive 1-1 draw away against AEK Athens, Larissa lost 2-1 loss at home to newly-promoted Panthrakikos. European share indexes have fallen further, as fears of a global recession swept through the major markets Prime Minister Costas Karamanlis reiterated here on Sunday that the European Union will take all necessary measures to protect its citizens from the repercussions of the ongoing international credit crisis, speaking immediately after an extraordinary summit of Euro zone leaders in the French capital. Πίνακασ 1. Οι τίτλοι και οι περιγραφζσ των καρτών που χρηςιμοποιήθηκαν ςτην μελζτη 6 Για τθν δθμιουργία των κατθγοριϊν, χρθςιμοποιικθκε ο αλγόρικμοσ ςυγκρότθςθσ ςυςτάδων μζςου-ςυνδζςμου (average-linkage) ο οποίοσ ζχει δειχκεί ότι παράγει ιςορροπθμζνεσ ομάδεσ που βοθκοφν ςτθν εξαγωγι ςυμπεραςμάτων (Witten, 2005). Επιπρόςκετα, καταγράφθκε ο ςυνολικόσ χρόνοσ που απαιτικθκε για τθν προετοιμαςία, διεξαγωγι και ανάλυςθ των αποτελεςμάτων τθσ κάκε μεκόδου. Θ εξαγωγι ςυμπεραςμάτων ωσ προσ τθν ποιότθτα των αποτελεςμάτων του AutoCardSorter, ζγινε βάςει τριϊν διαφορετικϊν ςυγκριτικϊν αναλφςεων: α) ανάλυςθ ςυςχζτιςθσ μεταξφ των μθτρϊν ςθμαςιολογικϊν ςυςχετίςεων ι πινάκων ομοιότθτασ (semantic similarity-matrices), β) ςυγκριτικι ανάλυςθ πρωτευόντων ομάδων (base-clusters analysis) και γ) ςφγκριςθ βζλτιςτων δομϊν. Στα πλαίςια αυτισ τθσ εργαςίασ, τα κελιά ενόσ πίνακα ομοιότθτασ περιζχουν τιμζσ που αντιςτοιχοφν ςτθν ςθμαςιολογικι ςυςχζτιςθ κάκε ηεφγουσ καρτϊν. Για το μεν AutoCardSorter οι τιμζσ αυτζσ είναι το αποτζλεςμα του αλγορίκμου LSA, ενϊ για τθν μελζτθ ταξινόμθςθσ καρτϊν ανοικτοφ τφπου, είναι θ ςυχνότθτα τοποκζτθςθσ δφο καρτϊν ςτθν ίδια ομάδα, από τουσ ςυμμετζχοντεσ. Θ μελζτθ τθσ ανάλυςθσ ςυςχζτιςθσ των πινάκων που παράγουν οι δυο μζκοδοι είναι το πρϊτο ςτάδιο ςτθν αξιολόγθςθ τθσ ποιότθτασ των αποτελεςμάτων που παράγει το 6 Για τα πλιρθ δεδομζνα και αποτελζςματα των μελετϊν ο αναγνϊςτθσ παραπζμπεται ςτο παράρτθμα 31

32 AutoCardSorter. Λόγω του ότι τα δεδομζνα είναι τφπου interval, επιλζχκθκε ο δείκτθσ ςτατιςτικισ ςυςχζτιςθσ Pearson (Field, 2005). Επίςθσ, παρότι τα δεδομζνα παραβίαηαν τθν υπόκεςθ τθσ κανονικότθτασ ςτα αντίςτοιχα τεςτ, κεωρικθκε ότι ο μεγάλοσ αρικμόσ των δεδομζνων που προζκυψαν, επιτρζπει τθ χριςθ του παραμετρικοφ δείκτθ ςτατιςτικισ ςυςχζτιςθσ Pearson. Ρροκειμζνου να γίνει θ ανάλυςθ ςυςχζτιςθσ, τα διαγϊνια ςτοιχεία αφαιρζκθκαν από τουσ δυο πίνακεσ, αφοφ δεν ενδιαφζρει θ ςθμαςιολογικι απόςταςθ μιασ κάρτασ από τον εαυτό τθσ. Επίςθσ, οι πίνακεσ μετατράπθκαν ςε δυο ςτιλεσ για να γίνει ευκολότερα θ ανάλυςθ. Θ ςυνολικι ςτατιςτικι επεξεργαςία ζγινε με το πρόγραμμα SPSS. Στθν ςυνζχεια, χρθςιμοποιικθκε θ μζκοδοσ αντικειμενικισ ςφγκριςθσ δυο δενδρογραμμάτων, που προτείνεται από τουσ Tullis και Wood (2004). Θ απόςταςθ δφο δενδρογραμμάτων ορίηεται από τουσ ίδιουσ ωσ: «το μζγεκοσ τθσ απόςταςθσ ανάμεςα ςε δυο κάρτεσ που βρίςκονται ςτο ίδιο βαςικό πρωτογενζσ ςφνολο, τθν ομάδα δθλαδι που δθμιουργείται ςτο πρώτο επίπεδο του αλγορίκμου ομαδοποίθςθσ, τα μζλθ τθσ οποίασ ζχουν τθ μεγαλφτερθ ςθμαςιολογικι ομοιότθτα μεταξφ τουσ». Αυτι θ απόςταςθ υπολογίηεται μετρϊντασ τον αρικμό των κόμβων, (διαςταυρϊςεισ γραμμϊν ςτο δενδρόγραμμα) που βρίςκονται ανάμεςα ςε κάκε ηευγάρι καρτϊν που αποτελεί μία πρωτογενι ομάδα. Ακολουκϊντασ αυτιν τθν λογικι, ορίςαμε το δενδρόγραμμα που παράγεται από τθν ανάλυςθ των αποτελεςμάτων τθσ μελζτθσ ταξινόμθςθσ καρτϊν (EzCalc) ωσ το πρότυπο δενδρόγραμμα και ςτθν ςυνζχεια υπολογίςτθκε θ απόςταςθ μεταξφ αυτοφ του προτφπου και του δζντρου που παράγεται από τθν ανάλυςθ του AutoCardSorter. Αυτι θ απόςταςθ κανονικοποιικθκε βάςει τθσ μζγιςτθσ τιμισ τθσ, που αντιςτοιχεί ςτθν περίπτωςθ κατά τθν οποία παρεμβάλλονται όλοι οι κόμβοι του διαγράμματοσ μεταξφ των δυο καρτϊν. Στθν ςυγκεκριμζνθ μελζτθ, παρουςιάςτθκαν πρωτογενείσ ομάδεσ που ςχθματίηονται από τρεισ θ και τζςςερεισ κάρτεσ. Σε αυτζσ τισ περιπτϊςεισ, μετρικθκε θ απόςταςθ κάκε μζλουσ τθσ πρωτογενοφσ ομάδασ από τα υπόλοιπα και το άκροιςμά τουσ ορίςτθκε ωσ θ απόςταςθ για τθν ςυγκεκριμζνθ ομάδα. Τζλοσ, ςυγκρίκθκε το ςτατιςτικά-βζλτιςτο μοντζλο πλοιγθςθσ για τθν κάκε μζκοδο. Το μοντζλο αυτό προκφπτει όταν επιλεγεί ο ςτατιςτικά-βζλτιςτοσ αρικμόσ κατθγοριϊν, δθλαδι αυτόσ που εξθγεί το μεγαλφτερο ποςοςτό ςυνολικισ διακφμανςθσ ςτα δεδομζνα. Ο αρικμόσ αυτόσ παράγεται μζςω τθσ ανάλυςθσ ιδιοτιμϊν ςτον πίνακα ομοιότθτασ και με τθν εφαρμογι του κριτθρίου Kaiser, απορρίπτοντασ δθλαδι όλεσ τισ ιδιοτιμζσ του πίνακα με τιμι μικρότερθ ι ίςθ τθσ μονάδασ. Αφοφ ορίςτθκε ωσ πρότυπο το μοντζλο πλοιγθςθσ που προζκυψε από τισ ομαδοποιιςεισ των ςυμμετεχόντων ςτθ μελζτθ ταξινόμθςθσ καρτϊν, μετρικθκε το ποςοςτό ςυμφωνίασ μεταξφ αυτοφ και του μοντζλου πλοιγθςθσ που προζκυψε από τθ μζκοδο AutoCardSorter. Αυτό το ποςοςτό ςυμφωνίασ αντιςτοιχεί ςτο ποςοςτό των άρκρων/καρτϊν που οι δυο μζκοδοι τοποκζτθςαν ςτθν ιδία 32

33 κατθγορία. Για τθ μζκοδο ταξινόμθςθσ καρτϊν ανοιχτοφ τφπου χρθςιμοποιικθκε θ ανάλυςθ παραγόντων του προγράμματοσ SPSS, ενϊ για το AutoCardSorter χρθςιμοποιικθκε θ ενςωματωμζνθ λειτουργία που παρζχει το εργαλείο. Εδϊ πρζπει να αναφερκεί πωσ το κριτιριο Kaiser εφαρμόηεται για αρικμό μεταβλθτϊν μικρότερο του 30, ενϊ κα πρζπει όλα οι ςυντελεςτζσ προςδιοριςμοφ (communalities) να είναι μεγαλφτεροι του 0.7 (Field, 2005). Στθν ςυγκεκριμζνθ περίπτωςθ, υπιρχαν 38 μεταβλθτζσ και κάποιοι ςυντελεςτζσ προςδιοριςμοφ ιταν μικρότεροι από 0.7. Από τισ τρεισ παραπάνω μεκόδουσ ςφγκριςθσ, θ ανάλυςθ τθσ ςυςχζτιςθσ των πινάκων ομοιότθτασ είναι θ πιο αυςτθρι προςζγγιςθ, κακϊσ ςυγκρίνει τισ τιμζσ του δείκτθ ςθμαςιολογικισ ομοιότθτασ μεταξφ όλων των ηευγαριϊν άρκρων/καρτϊν που παράγουν οι δυο μζκοδοι. Επίςθσ, είναι και θ γενικότερθ μζκοδοσ κακϊσ δεν προχποκζτει ότι ζχει γίνει ανάλυςθ ςυςτάδων (cluster analysis) ςτα δεδομζνα. Θ μζκοδοσ ςφγκριςθσ των πρωτευόντων ομάδων είναι μια αντικειμενικι μζκοδοσ που ςυγκρίνει τα ηευγάρια με τθν μεγαλφτερθ ομοιότθτα που προκφπτουν από τθν εφαρμογι των αλγορίκμων ομαδοποίθςθσ ςτουσ πίνακεσ ομοιότθτασ τθσ κάκε μεκόδου. Τζλοσ, το μοντζλο πλοιγθςθσ βάςει του κριτθρίου Kaiser ελζγχει τθν περίπτωςθ εκείνθ ςτθν οποία αν και δεν υπάρχει απόλυτθ ςυμφωνία μεταξφ των πρωτευόντων ομάδων, τα ςτατιςτικά-βζλτιςτα μοντζλα πλοιγθςθσ των δυο μεκόδων είναι ακριβϊσ ίδια, κακϊσ οι γραμμζσ διαχωριςμοφ ενόσ δενδρογράμματοσ δεν βρίςκονται πότε ςτο επίπεδο των πρωτογενϊν ομάδων Αποτελέςματα τησ ςυγκριτικήσ μελέτησ Θ ανάλυςθ τθσ ςυςχζτιςθσ των πινάκων ομοιότθτασ που προζκυψαν από τισ δυο μεκόδουσ, παριγαγε ικανοποιθτικά αποτελζςματα, κακϊσ βρζκθκε μεγάλοσ βακμόσ ςυςχζτιςθσ μεταξφ των πινάκων των δυο μεκόδων που χρθςιμοποιικθκαν (r=0.572, p <0.01). Εδϊ κα πρζπει να τονιςτεί ότι τα αποτελζςματα αφοροφν τθν ανάλυςθ βάςει των περιγραφϊν των καρτϊν (ςτθν περίπτωςι μασ,το απόςπαςμα του άρκρου ) και όχι βάςει των τίτλων. Θ ανάλυςθ βάςει των τίτλων παριγαγε ςθμαντικά μικρότερο βακμό ςυςχζτιςθσ (r=0.246, p <0.01), κάτι που ιταν αναμενόμενο, δεδομζνου του ότι θ δθμοςιογραφικι γραφι ςτθν περίπτωςθ των τίτλων δεν παρουςιάηει ςθμαςιολογικι ςυςχζτιςθ με το περιεχόμενο του άρκρου, κακϊσ δεν ζχει ςκοπό να αποδϊςει με ακρίβεια το περιεχόμενο αυτό, αλλά να τραβιξει τθν προςοχι του αναγνϊςτθ. Για αυτόν τον λόγο, οι αρκρογράφοι χρθςιμοποιοφν διάφορεσ μεκόδουσ (μεταφορζσ, παροιμίεσ, υπερβολζσ) οι οποίεσ αν και κατανοθτζσ από τον αναγνϊςτθ του άρκρου, δεν μποροφν πάντα να ερμθνευτοφν ςωςτά από τουσ αλγορίκμουσ ςθμαςιολογικισ ςυςχζτιςθσ που χρθςιμοποιεί το AutoCardSorter. Πςον αφορά τισ υπόλοιπεσ μετριςεισ, θ μζςθ απόςταςθ ανάμεςα ςτα δενδρογράμματα των δυο προςεγγίςεων βρζκθκε: 2,85 κόμβοι, ποςοςτό 0,09% επί 33

34 του ςυνολικοφ αρικμοφ κόμβων. Θ ανάλυςθ παραγόντων ςτα δεδομζνα τθσ ταξινόμθςθσ καρτϊν, παριγαγε ζξι (6) κατθγορίεσ, ενϊ θ αντίςτοιχθ ενςωματωμζνθ λειτουργία του AutoCardSorter πρότεινε 9 κατθγορίεσ. Θ ςυμφωνία μεταξφ των ςτατιςτικά-βζλτιςτων μοντζλων πλοιγθςθσ ιταν 100%. Θ προετοιμαςία των καρτϊν διιρκθςε περίπου 24 ϊρεσ ςυνολικά. Αυτό το διάςτθμα είναι κοινό και για τισ δυο μεκόδουσ. Θ διεξαγωγι τθσ μελζτθσ κακϊσ και θ επεξεργαςία των αποτελεςμάτων απαίτθςε 6 ϊρεσ για τθν μζκοδο ταξινόμθςθσ καρτϊν, και περίπου 15 λεπτά για το AutoCardSorter. Συςχζτιςη πινάκων ομοιότητασ AutoCardSorter Ανοικτήσ μεθόδου Πίνακασ Ανοικτήσ μεθόδου Πίνακασ AutoCardSorter Ρίνακασ Ανοικτισ μεκόδου Ρίνακασ AutoCardSorter Pearson 1,572 ** Correlation Sig. (2-tailed),000 N Pearson,572 ** 1 Correlation Sig. (2-tailed),000 N **. Correlation is significant at the 0.01 level (2-tailed). Συςχζτιςη πινάκων ομοιότητασ AutoCardSorter Ανοικτήσ μεθόδου βάςει τίτλων Ρίνακασ Ανοικτισ Ρίνακασ AutoCardSorter μεκόδου Πίνακασ Pearson 1,246 ** Ανοικτήσ μεθόδου Correlation Sig. (2-tailed),000 N Πίνακασ Pearson,246 ** 1 AutoCardSorter Correlation Sig. (2-tailed),000 N **. Correlation is significant at the 0.01 level (2-tailed). Πίνακασ 2. Συςχετίςεισ μεταξφ των πινάκων ςημαςιολογικών αποςτάςεων 34

35 Πρωτεφοντα Σφνολα Απόςταςη κόμβων 1(10,22) 3 2(1,4,8) 6 3(15,34) 3 4(2,31) 1 5(30,32) 2 6(17,18,20,21) 11 7(5,35) 0 8(6,37) 0 9(11,16) 0 10(7,9) 1 11(26,28) 2 12(3,24,29) 6 13(13,19,25) 2 M.O : 2,846 Πίνακασ 3. Τα πρωτεφοντα ςφνολα και οι αναγνωριςτικοί κωδικοί των άρθρων που τα αποτελοφν. Στα δεξιά ςημειώνεται ο αριθμόσ των κόμβων που παρεμβάλλονται μεταξφ των άρθρων Αριθμόσ Συμμετεχόντων 38 Συςχζτιςη πινάκων ομοιότητασ (r=0.572, p <0.01) Αριθμόσ Βαςικών Cluster Card Sorting 13 AutoCardSorter 12 Μζςη απόςταςη 0,09% Αριθμόσ Κατηγοριών Card Sorting 6 AutoCardSorter 9 % Συμφωνίασ των navigation schemes 100% Συνολικόσ Card Sorting Χρόνοσ AutoCardSorter μελζτησ AutoCardSorter ςε ςχζςη με Card Sorting 31 ϊρεσ 25 ϊρεσ 19% πιο ςφντομοσ Πίνακασ 4. Σφγκριςη των αποτελεςμάτων των δυο μεθόδων 35

36 3.2. Συγκριτικέσ Μελέτεσ Ταξινόμηςησ Καρτών κλειςτού τύπου - AutoCardSorter Το δεφτερο ςετ μελετϊν αποτελείται από τζςςερεισ ςυγκριτικζσ μελζτεσ κλειςτοφ τφπου (Closed Card Sorting). Σκοπόσ των μελετϊν αυτϊν ιταν να διερευνθκεί θ αποδοτικότθτα και αποτελεςματικότθτα του AutoCardSorter ςε ςχζςθ με τθν κλαςςικι μζκοδο ταξινόμθςθσ καρτϊν κλειςτοφ τφπου. Οι πρϊτεσ δυο μελζτεσ αφοροφν πραγματικζσ ιςτοςελίδεσ, ςυγκεκριμζνα τισ BBC news και Athens News. Οι άλλεσ δυο αφοροφν ζνα υποκετικό News Portal, μια ιςτοςελίδα δθλαδι που ςυγκεντρϊνει άρκρα από πολλζσ άλλεσ πθγζσ. Κακϊσ το εργαλείο AutoCardSorter δεν προςφζρει ακόμα τθν δυνατότθτα προςομοίωςθσ μελετϊν κλειςτοφ τφπου, χρθςιμοποιικθκε θ εφαρμογι Matrix Comparison του δικτυακοφ τόπου τθσ LSA ( τθν οποία το AutoCardSorter κα μποροφςε ςτο μζλλον να ενςωματϊςει Συγκριτικέσ Μελέτεσ BBC, Athens News Σκοπόσ των ςυγκεκριμζνων μελετϊν ιταν, αφενόσ μεν να εξεταςτεί θ γενικότερθ αποτελεςματικότθτα των αλγορίκμων ςθμαςιολογικισ ςυςχζτιςθσ ςτθν ταξινόμθςθ εννοιϊν ςε προχπάρχουςεσ κατθγορίεσ και αφετζρου να εξαχκοφν ςυμπεράςματα ςχετικά με τισ ιδιαιτερότθτεσ τθσ κεματικισ κατθγορίασ ειδθςεογραφικϊν δικτυακϊν τόπων. Βαςικόσ αναμενόμενοσ ςτόχοσ ιταν θ κατθγοριοποίθςθ των άρκρων ςτισ υπάρχουςεσ κατθγορίεσ τθσ κάκε ιςτοςελίδασ, με τρόπο κατά το δυνατόν όμοιο με αυτόν που επζλεξαν οι ςυμμετζχοντεσ ςε μία μελζτθ ταξινόμθςθσ καρτϊν κλειςτοφ τφπου Μεθοδολογία και Διαδικαςία Επιλζχκθκαν 40 άρκρα από τον κάκε δικτυακό τόπο που ανικουν ςε οριςμζνεσ από τισ κατθγορίεσ που ιδθ χρθςιμοποιοφνται. Το ςενάριο τθσ μελζτθσ υποκζτει πωσ τα άρκρα αυτά αποτελοφν τισ νζεσ ειδιςεισ οι οποίεσ και πρζπει να τοποκετθκοφν ςτισ κατθγορίεσ ςφμφωνα με τισ προτιμιςεισ των χρθςτϊν. Από το δικτυακό τόπο του BBC αντλικθκαν άρκρα από τισ εξισ κατθγορίεσ: Europe, Business, Entertainment, Arts & Culture, Science & Environment, Technology και Health. Επιλζχκθκαν δυο ηευγάρια όμοιων ςθμαςιολογικά κατθγοριϊν, με ςκοπό να εξεταςτεί αν αυτό κα δθμιουργιςει προβλιματα ςτθν ταξινόμθςθ των άρκρων με χριςθ του LSA αλγορίκμου. Από τον δικτυακό τόπο Athens News αντλικθκαν άρκρα από τισ εξισ κατθγορίεσ: News, Community, Sports, Business και Arts & Features. Ππωσ και ςτθν προθγοφμενθ μελζτθ, οι τίτλοι των άρκρων επιλζχκθκε να είναι και οι τίτλοι των καρτϊν τθσ μελζτθσ, ενϊ ζνα μικρό απόςπαςμα του κάκε άρκρου (2-3 προτάςεισ, από τθν 1 θ ι 2 θ παράγραφο) αποτζλεςε τθν περιγραφι τθσ αντίςτοιχθσ κάρτασ. Ο αρικμόσ των άρκρων είναι περίπου ίςοσ για κάκε κατθγορία, ενϊ οι τίτλοι και οι περιγραφζσ των καρτϊν διατθρικθκαν αναλλοίωτοι. 36

37 Επόμενο βιμα ιταν θ διαμόρφωςθ των καρτϊν που δόκθκαν ςτουσ ςυμμετζχοντεσ. Κάκε ςυμμετζχων ζλαβε δυο φυλλάδια, ζνα που περιείχε τουσ τίτλουσ των άρκρων μαηί με τα αποςπάςματα/περιγραφζσ και ζνα που περιείχε τισ κατθγορίεσ ςτισ οποίεσ ζπρεπε να τα ομαδοποιιςει. Οι ςυμμετζχοντεσ πλθροφορικθκαν για τθν φφςθ τθσ μελζτθσ και των ιςτοςελίδων. Αφοφ ζλαβαν οδθγίεσ για τθν διεξαγωγι τθσ μελζτθσ, προχϊρθςαν ςτθν κατθγοριοποίθςθ των άρκρων και ςτθ ςυνζχεια επζςτρεψαν τα ςυμπλθρωμζνα φυλλάδια. Ο αρικμόσ των χρθςτϊν που κλικθκαν να ςυμμετάςχουν ςτθν κλειςτι μελζτθ ιταν 18, αρικμόσ που ςφμφωνα με τθν προχπάρχουςα ζρευνα (Nielsen J., 2004; Tullis, 2004) είναι αρκετόσ για τθν παραγωγι αντιπροςωπευτικϊν αποτελεςμάτων. Πλοι οι χριςτεσ είναι απόφοιτοι ανϊτατων εκπαιδευτικϊν ιδρυμάτων και ανζφεραν πωσ διακζτουν καλι γνϊςθ τθσ αγγλικισ γλϊςςασ. Συμμετείχε περίπου ίςοσ αρικμόσ ανδρϊν και γυναικϊν, θλικιϊν χρονϊν. Μετά από τθν επεξεργαςία των δεδομζνων, δθμιουργικθκε ζνασ πίνακασ (καρτϊν x κατθγοριϊν) με τισ ςυχνότθτεσ τοποκζτθςθσ τθσ κάκε κάρτασ ςε κάκε κατθγορία. Το κάκε άρκρο τοποκετικθκε ςτθν κατθγορία ςτθν οποία είχε τοποκετθκεί με τθν μεγαλφτερθ ςυχνότθτα. Σε περιπτϊςεισ ιςοτιμίασ, το άρκρο τοποκετικθκε και ςτισ δυο κατθγορίεσ. Τίτλοσ Άρθρου News Community Sports Business Arts 1) Latvia superstar flies to Crete ) Dior is back to the future ) What is hot ) Obama tries to mend fences with 18 Russia 5) Kouvelis: Let form a united 8 12 opposition 6) Roundup ) From the runway to the street Πίνακασ 5. Μζροσ του πίνακα ςυχνοτήτων για τον δικτυακό τόπο Athens News Ρροκειμζνου να εξεταςτεί θ αποτελεςματικότθτα τθσ μεκόδου ταξινόμθςθσ καρτϊν ςε κατθγορίεσ βάςει τθσ LSA, χρθςιμοποιικθκε θ εφαρμογι Matrix Comparison του δικτυακοφ τόπου LSA. Θ ςυγκεκριμζνθ εφαρμογι δζχεται ωσ είςοδο ζνα ςφνολο κειμζνων (ι λζξεων) και επιςτρζφει ζναν πίνακα που περιζχει τισ μετριςεισ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ κάκε κειμζνου. Δθμιουργικθκε ζνα αρχείο κειμζνου για κάκε δικτυακό τόπο που περιείχε τα 40 αποςπάςματα των άρκρων, κακϊσ και τισ κατθγορίεσ ςτισ όποιεσ πρζπει να τοποκετθκοφν, το οποίο δόκθκε ωσ είςοδοσ ςτθν εφαρμογι Matrix Comparison. Για 37

38 τθν ανάλυςθ επιλζχκθκε ωσ ςθμαςιολογικόσ χϊροσ ο general-reading-1 st year college. Στθν ςυνζχεια, το κάκε άρκρο τοποκετικθκε ςτθν κατθγορία με τθν οποία θ εφαρμογι ζδειξε ότι υπάρχει μεγαλφτερθ ςθμαςιολογικι ςυςχζτιςθ. Στισ περιπτϊςεισ ιςοτιμίασ με δυο κατθγορίεσ, το άρκρο τοποκετικθκε και ςτισ δυο. news community sports business arts features Άρθρο Άρθρο Άρθρο Άρθρο Άρθρο Άρθρο Πίνακασ 6. Μζροσ του πίνακα ςυςχετίςεων που επιςτρζφει η εφαρμογή Matrix Comparison Ο ςυνολικόσ χρόνοσ που απαιτικθκε για τθν προετοιμαςία, διεξαγωγι και ανάλυςθ των αποτελεςμάτων και των δυο μεκόδων, υπολογίςτθκε με τθ δυνατι ακρίβεια. Για τθν εξαγωγι ςυμπεραςμάτων ωσ προσ τθν ποιότθτα των αποτελεςμάτων τθσ μεκόδου ταξινόμθςθσ βάςει LSA, ζγιναν δυο διαφορετικζσ ςυγκρίςεισ βαςιηόμενεσ ςε διαφορετικά κριτιρια: α) ανάλυςθ ςυςχετίςεων μθτρϊν ςθμαςιολογικϊν ομοιοτιτων ι μθτρϊν ομοιότθτασ (similarity-matrices) και β) ςφγκριςθ τελικϊν ομαδοποιιςεων. Στα πλαίςια αυτισ τθσ ςυγκριτικισ μελζτθσ, ωσ πίνακεσ ομοιότθτασ χρθςιμοποιικθκαν ο πίνακασ ςυχνοτιτων, για τθν μελζτθ ταξινόμθςθσ καρτϊν κλειςτοφ τφπου και ο πίνακασ ςθμαςιολογικισ ςυςχζτιςθσ των καρτϊν με τισ κατθγορίεσ, που επιςτρζφει θ LSA. Θ ςτατιςτικι επεξεργαςία ζγινε με το πρόγραμμα SPSS. Στθν ςυνζχεια μετρικθκε το ποςοςτό των άρκρων που είχαν τοποκετθκεί ςε διαφορετικι κατθγορία από τισ δυο μεκόδουσ. Κεωρϊντασ τθν τελικι κατθγοριοποίθςθ που προζκυψε από τθν μελζτθ ταξινόμθςθσ καρτϊν κλειςτοφ τφπου ωσ πρότυπθ, υπολογίςτθκε το ποςοςτό των άρκρων που θ LSA τοποκζτθςε ςε λάκοσ κατθγορία, αφοφ κανονικοποιικθκε βάςει του ςυνολικοφ αρικμοφ άρκρων. 38

39 Αποτελέςματα Θ ανάλυςθ τθσ ςυςχζτιςθσ των πινάκων ομοιότθτασ παριγαγε αρκετά καλά αποτελζςματα, κακϊσ βρζκθκε μεγάλοσ βακμόσ ςυςχζτιςθσ μεταξφ των πινάκων των δυο μεκόδων που χρθςιμοποιικθκαν (r=0.506, p <0.01) για τθν ιςτοςελίδα Athens News, ενϊ για τθν BBC News ιταν χαμθλότεροσ (r=0.400, p <0.01). Εδϊ κα πρζπει να τονιςτεί ότι τα αποτελζςματα αφοροφν τθν ανάλυςθ βάςει των περιγραφϊν των καρτϊν (για αυτιν τθν μελζτθ, το απόςπαςμα του άρκρου) και όχι βάςει των τίτλων. Σε αυτιν τθν μελζτθ, δεν ζγιναν αναλφςεισ βάςει τίτλων, δεδομζνου ότι θ πρϊτθ μελζτθ υπζδειξε πωσ δεν παράγονται ικανοποιθτικά αποτελζςματα με αυτόν τον τρόπο. Συςχετίςεισ Πινάκων Ομοιότητασ Ρίνακασ Κλειςτισ μεκόδου Ρίνακασ AutoCard Sorter 1.400** Πίνακασ Pearson Κλειςτήσ Correlation.000 μεθόδου Sig. (2- tailed) Ρίνακασ Κλειςτισ μεκόδου Ρίνακασ AutoCard Sorter Πίνακασ Κλειςτήσ μεθόδου Pearson Correlation Sig. ( **.000 tailed) N N Πίνακασ Pearson.400** 1 Πίνακασ Pearson.506** 1 AutoCard Correlation AutoCard Correlation Sorter Sig. ( Sorter Sig. ( tailed) tailed) N N Πίνακασ 7. Οι μετρήςεισ ςυςχζτιςησ των πινάκων ομοιότητασ Στθν τελικι κατθγοριοποίθςθ των άρκρων, θ ςτθριηόμενθ ςτον αλγόρικμο LSA διαδικαςία τοποκζτθςε 23 άρκρα ςε λάκοσ κατθγορία, ποςοςτό 56%, όςον αφορά τθν ιςτοςελίδα Athens News, ενϊ για τθν ιςτοςελίδα BBC 22, δθλαδι ποςοςτό 54%. Πςον αφορά τθν ιςτοςελίδα BBC, αν οι κατθγορίεσ entertainment και arts&culture,όπωσ επίςθσ και οι science&environment και Technology κεωρθκοφν ωσ μια κατθγορία, με τθν ζννοια ότι είναι παρόμοιου ςθμαςιολογικοφ επιπζδου, τότε ο αρικμόσ μειϊνεται ςτα 17 άρκρα ςε λάκοσ κατθγορία, ποςοςτό 42%. Θ προετοιμαςία των καρτϊν διιρκθςε περίπου 8 ϊρεσ. Θ κατθγοριοποίθςθ από τουσ χριςτεσ απαίτθςε ζνα διάςτθμα τριϊν θμερϊν, κυρίωσ λόγω τθσ δυςκολίασ ςτον ςυντονιςμό των ςυμμετεχόντων για ταυτόχρονθ ςυνεφρεςι τουσ ςτον ίδιο χϊρο. Εδϊ ςθμειϊνουμε πωσ ο τυπικόσ χρόνοσ που απαιτεί μια κλειςτι μελζτθ είναι περίπου δυο ϊρεσ εάν είναι εφικτόσ ο ςυντονιςμόσ όλων των ςυμμετεχόντων. Για τθν επεξεργαςία των αποτελεςμάτων τθσ μελζτθσ χρειάςτθκαν 39

40 δυο ϊρεσ για τθν μελζτθ ταξινόμθςθσ καρτϊν κλειςτοφ τφπου και περίπου 30 λεπτά για τθν μζκοδο που ςτθρίηεται ςτθν LSA Συγκριτικέσ Μελέτεσ News Portal Μεθοδολογία και Διαδικαςία Θ γενικότερθ φφςθ αυτισ τθσ μελζτθσ είναι ίδια με αυτιν τθσ προθγοφμενθσ. Επιλζχκθκαν 80 άρκρα από διάφορουσ δικτυακοφσ τόπουσ. Το ςενάριο τθσ μελζτθσ υποκζτει πωσ τα άρκρα αυτά αποτελοφν τισ νζεσ ειδιςεισ οι οποίεσ και πρζπει να τοποκετθκοφν ςτισ κατθγορίεσ μιασ διαδικτυακισ πφλθσ ενθμζρωςθσ, ςφμφωνα με τισ προτιμιςεισ των χρθςτϊν. Θ διαφορά με τθν προθγοφμενθ μελζτθ είναι ότι εδϊ τα άρκρα προζρχονται από διαφορετικοφσ δικτυακοφ τόπουσ για να προςομοιωκεί θ περίπτωςθ μίασ διαδικτυακισ πφλθσ ενθμζρωςθσ που ςυγκεντρϊνει άρκρα από πολλζσ διαφορετικζσ πθγζσ. Ππωσ και ςτθν προθγοφμενθ μελζτθ, οι τίτλοι των άρκρων επιλζχκθκε να είναι και οι τίτλοι των καρτϊν τθσ μελζτθσ, ενϊ ςε αυτιν τθν περίπτωςθ μόλισ μια πρόταςθ του κάκε άρκρου αποτζλεςε τθν περιγραφι τθσ αντίςτοιχθσ κάρτασ. Ο αρικμόσ των άρκρων είναι τυχαίοσ αυτιν τθν φορά, που ςθμαίνει πωσ ςε κάποιεσ κατθγορίεσ ζτυχε να αντιςτοιχοφν ελάχιςτα άρκρα. Οι τίτλοι και οι περιγραφζσ των καρτϊν διατθρικθκαν αναλλοίωτοι. Τα άρκρα χωρίςτθκαν ςε δυο ςετ των 40 προκειμζνου να γίνουν δυο διαφορετικζσ μελζτεσ, ζτςι ϊςτε να ομαδοποιθκοφν τα άρκρα ςφμφωνα με τθν θμερομθνία ςυγγραφισ τουσ, αλλά και να μειωκεί ο φόρτοσ εργαςίασ για τουσ ςυμμετζχοντεσ. Οι κατθγορίεσ ιταν κοινζσ για τα δυο ςετ και επιλζχκθκε να είναι οι εξισ : Greece, World, Sports, Economy, Science-Technology και Culture. Θ μεκοδολογία για τθν διεξαγωγι τθσ μελζτθσ και τθν ανάλυςθ των αποτελεςμάτων ιταν κοινι με αυτιν τθσ μελζτθσ ςτισ ιςτοςελίδεσ BBC, Athens News. Οι ίδιοι, επίςθσ, χριςτεσ κλικθκαν να ςυμμετάςχουν και ςε αυτιν τθν μελζτθ Αποτελέςματα Θ ανάλυςθ τθσ ςυςχζτιςθσ των πινάκων ομοιότθτασ παριγαγε αρκετά χειρότερα αποτελζςματα από τισ προθγοφμενεσ μελζτεσ, κακϊσ βρζκθκε μικρόσ βακμόσ ςυςχζτιςθσ μεταξφ των πινάκων των δυο μεκόδων που χρθςιμοποιικθκαν, (r=0.243, p <0.01) για τθν πρϊτθ πφλθ ενθμζρωςθσ που τθσ αντιςτοιχεί το 1 ο ςετ άρκρων, ενϊ για τθν δεφτερθ πφλθ ενθμζρωςθσ ιταν (r=0.353, p <0.01). Εδϊ τονίηεται και πάλι, ότι τα αποτελζςματα αφοροφν τθν ανάλυςθ βάςει των περιγραφϊν των καρτϊν (ςτθν περίπτωςι μασ,το απόςπαςμα του άρκρου) και όχι βάςει των τίτλων. 40

41 Στθν τελικι κατθγοριοποίθςθ των άρκρων, θ μζκοδοσ που βαςίηεται ςτθν LSA τοποκζτθςε 24 άρκρα ςε λάκοσ κατθγορία, ποςοςτό 62%, όςον αφορά τθν πρϊτθ πφλθ ενθμζρωςθσ, ενϊ για τθ δεφτερθ πφλθ ενθμζρωςθσ 20, δθλαδι ποςοςτό 50%. Θ προετοιμαςία των καρτϊν διιρκθςε περίπου 8 ϊρεσ. Θ κατθγοριοποίθςθ από τουσ χριςτεσ απαίτθςε ζνα διάςτθμα τριϊν θμερϊν, κυρίωσ λόγω τθσ δυςκολίασ ςτον ςυντονιςμό των ςυμμετεχόντων για ταυτόχρονθ ςυνεφρεςι τουσ ςτον ίδιο χϊρο. Εδϊ ςθμειϊνουμε πωσ ο τυπικόσ χρόνοσ που απαιτεί μια κλειςτι μελζτθ είναι περίπου δυο ϊρεσ, εάν είναι εφικτόσ ο ςυντονιςμόσ όλων των ςυμμετεχόντων. Για τθν επεξεργαςία των αποτελεςμάτων τθσ μελζτθσ χρειάςτθκαν δυο ϊρεσ για τα δεδομζνα τθσ ταξινόμθςθσ καρτϊν κλειςτοφ τφπου και περίπου 30 λεπτά για τθ μζκοδο που ςτθρίηεται ςτθν LSA. Πίνακασ Κλειςτήσ μεθόδου Πίνακασ AutoCard Sorter Συςχετίςεισ Πινάκων Ομοιότητασ Ρίνακασ Κλειςτισ μεκόδου Ρίνακασ AutoCard Sorter Pearson 1,243 ** Correlation Sig. (2-tailed),000 N Pearson,243 ** 1 Correlation Sig. (2-tailed),000 N **. Correlation is significant at the 0.01 level (2-tailed). 41 Πίνακασ Κλειςτήσ μεθόδου Πίνακασ AutoCard Sorter Συςχετίςεισ Πινάκων Ομοιότητασ Ρίνακασ Κλειςτισ μεκόδου Ρίνακασ AutoCard Sorter Pearson 1,353 ** Correlation Sig. (2-tailed),000 N Pearson,353 ** 1 Correlation Sig. (2-tailed),000 N **. Correlation is significant at the 0.01 level (2-tailed). Πίνακασ 8. Τα αποτελζςματα τησ ανάλυςησ ςυςχζτιςησ για τα 2 ςετ άρθρων Κλείνουμε αυτό το κεφάλαιο με τθν παρατιρθςθ ότι τα αποτελζςματα μεταξφ των μελετϊν κλειςτοφ τφπου μεταξφ τουσ, αλλά και ςε ςχζςθ με τθν μελζτθ ανοικτοφ τφπου, διαφζρουν ςθμαντικά. Αυτό μπορεί να οφείλεται ςε διάφορουσ λόγουσ οι οποίοι είναι δφςκολο να εντοπιςτοφν κακϊσ υπάρχουν πολλοί

42 παράγοντεσ που επθρεάηουν τα αποτελζςματα. Για να αναγνωριςτοφν αυτοί οι παράγοντεσ κα πρζπει να γίνουν περαιτζρω μελζτεσ όπου κα μεταβάλλεται μόνο ζνασ κάκε φορά, ενϊ όλοι οι υπόλοιποι παραμζνουν ςτακεροί. Ραρόλα αυτά, μια εκτίμθςθ για τισ πικανζσ αιτίεσ των διαφορϊν, παρουςιάηεται ςτο τελευταίο κεφάλαιο μαηί με μια εκτεταμζνθ ςυηιτθςθ των αποτελεςμάτων. 42

43 4. Μέθοδοι υπολογιςμού ςημαςιολογικήσ ςυςχέτιςησ 4.1. Μια ςύντομη ειςαγωγή Ζνα από τα βαςικά ςτοιχεία του AutoCardSorter, είναι θ χριςθ τθσ μεκόδου LSA για τον υπολογιςμό τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ των περιγραφϊν των καρτϊν. Ππωσ ζχει ιδθ τονιςτεί ςτθν εργαςία των (Katsanos, Tselios, & Avouris, 2008), υπάρχει διαρκισ ζρευνα ςτον χϊρο των μζτρων ςθμαςιολογικισ ςυςχζτιςθσ, με ςκοπό τθν εξζλιξθ των ιδθ υπαρχόντων και τον ςχεδιαςμό νζων. Αυτόσ είναι και ο λόγοσ για τον οποίο ο AutoCardSorter ζχει ςχεδιαςτεί ςε ζνα πλαίςιο που επιτρζπει τθν εφκολθ αλλαγι του αλγόρικμου υπολογιςμοφ τθσ ςθμαςιολογικισ ςυςχζτιςθσ. Τα μζτρα ςθμαςιολογικισ ςυςχζτιςθσ μποροφν να ταξινομθκοφν ςε 3 κφριεσ κατθγορίεσ: 1. Μζτρα που βαςίηονται ςτθν ςτατιςτικι επεξεργαςία και ανάλυςθ ενόσ πολφ μεγάλου ςϊματοσ κειμζνου το οποίο απαρτίηεται από πολυάρικμα μικρότερα κομμάτια κειμζνου (πχ προτάςεισ, παράγραφοι, άρκρα). 2. Μζτρα που βαςίηονται ςε μια γλωςςολογικι δομι καταςκευαςμζνθ από εξειδικευμζνουσ επιςτιμονεσ (πχ WordNet, Roget s Thesaurus), θ οποία περιζχει ςχζςεισ μεταξφ λζξεων, όπωσ ςυνωνυμία, αντωνυμία κ.ά Μζτρα που βαςίηονται ςτο Διαδίκτυο. Οι μζκοδοι που χρθςιμοποιοφν τα μζτρα τισ 2 θσ κατθγορίασ, όπωσ επίςθσ και αυτζσ που χρθςιμοποιοφν ςτατικά ςϊματα κειμζνου ζχουν δεχκεί κριτικι για μια ςειρά λόγων. Ο κυριότεροσ λόγοσ είναι θ αδυναμία κάλυψθσ των νζων λζξεων και όρων, αλλά και των νζων εννοιϊν που αποκτοφν οι ιδθ χρθςιμοποιοφμενεσ λζξεισ. Θ ανανζωςθ των γλωςςολογικϊν δομϊν ζτςι ϊςτε να καλφπτουν τα παραπάνω είναι μια ιδιαίτερα δφςκολθ, χρονοβόρα και δαπανθρι διαδικαςία. Τα ςτατικά ςϊματα κειμζνου πάςχουν, επίςθσ, από ζλλειψθ ανανεωμζνου περιεχομζνου. Σε αυτιν τθν περίπτωςθ όμωσ, θ προςκικθ νζων κομματιϊν ςτο ςϊμα κειμζνου ι ακόμα και θ αλλαγι του ςϊματοσ με ζνα νζο ςυνιςτά μια απλι διαδικαςία. Αναφζρουμε ενδεικτικά τθν χριςθ τθσ διαδικτυακισ εγκυκλοπαίδειασ Wikipedia ωσ ςϊμα κειμζνου, θ οποία ανανεϊνεται κακθμερινά με νζο περιεχόμενο. Άλλθ αιτία κριτικισ που αφορά και τισ δυο περιπτϊςεισ, είναι θ αδυναμία κάλυψθσ διαφορετικϊν γλωςςϊν. Αυτι θ αδυναμία, είναι δφςκολο αν όχι αδφνατο να

44 καλυφκεί από μια γλωςςολογικι δομι. Τζλοσ, τα μζτρα τθσ 2 θσ κατθγορίασ περιορίηονται ςτθν ςφγκριςθ λζξεων και είναι αδφνατο να εφαρμοςτοφν άμεςα για ςθμαςιολογικι ςφγκριςθ μεταξφ δυο κειμζνων. Για να γίνει εφικτό αυτό είναι απαραίτθτο ζνα επιπλζον ςτάδιο επεξεργαςίασ. Για όλουσ τουσ παραπάνω λόγουσ, περιορίςαμε τθν παρακάτω ςυνοπτικι παρουςίαςθ ςε μζτρα των κατθγοριϊν 1 και 3. Σθμειϊνουμε πωσ προχωριςαμε ςτθν παρουςίαςθ αυτι ζχοντασ δυο ςτόχουσ υπόψθ. Ρρϊτον, κζλαμε να ςυγκεντρϊςουμε τισ πλθροφορίεσ που αφοροφν τισ παρακάτω μεκόδουσ, κακϊσ αυτζσ βρίςκονται διάςπαρτεσ ςε ζνα πλικοσ εργαςιϊν, ζτςι ϊςτε να είναι άμεςα διακζςιμεσ ςτον κάκε ενδιαφερόμενο. Δεφτερον, επιχειριςαμε να εξάγουμε χριςιμα ςυμπεράςματα για τα χαρακτθριςτικά τθσ κάκε μεκόδου, αναφορικά με τθν καταλλθλότθτά τθσ για χριςθ με τον AutoCardSorter. Βάςει αυτϊν των ςυμπεραςμάτων, μπορεί να γίνει μια επιλογι οριςμζνων μεκόδων για μελλοντικι ςφγκριςι τουσ ςτθν ςθμαςιολογικι ςυςχζτιςθ κειμζνων και ςυγκεκριμζνα ςτθν προςομοίωςθ μιασ μελζτθσ ταξινόμθςθσ καρτϊν. Αν και θ αναλυτικι παρουςίαςθ των μεκόδων δεν ιταν ςτισ προκζςεισ μασ, καταβλικθκε κάκε προςπάκεια για να παρουςιαςτεί μια ςυνοπτικι και κατανοθτι περίλθψθ τθσ κάκε μεκόδου. Φυςικά, δόκθκε ιδιαίτερο βάροσ ςτον ςχολιαςμό των μεκόδων αναφορικά με τουσ ςυγκεκριμζνουσ ςτόχουσ τθσ παροφςασ εργαςίασ. Για πλιρεισ και αναλυτικζσ πλθροφορίεσ, ο αναγνϊςτθσ παραπζμπεται ςτθν ςχετικι βιβλιογραφία. Παρουςίαςη Μεθόδων Σημαςιολογικήσ Συςχέτιςησ 4.2. LSA Ο όροσ Λανκάνουςα Σθμαςιολογικι Ανάλυςθ (LSA), αναφζρεται ταυτόχρονα ςτθν κεωρία και τθν μζκοδο που χρθςιμοποιείται, για να εξαχκεί και να αναπαραςτακεί το νόθμα των λζξεων, μζςω τθσ ςτατιςτικισ ανάλυςθσ ενόσ μεγάλου ςϊματοσ κειμζνου, το οποίο ιδανικά, αναπαριςτά το ςφνολο των κειμζνων που ζχει διαβάςει ο μζςοσ άνκρωποσ για το κζμα που ενδιαφζρει ςε κάκε περίπτωςθ (Landauer & Dumais, 1997). Ρρόκειται για μία πλιρωσ αυτοματοποιθμζνθ μακθματικι και ςτατιςτικι τεχνικι θ οποία δζχεται ωσ είςοδο το ςϊμα κειμζνου και αναγνωρίηει τισ διαφορετικζσ λζξεισ που περιζχονται ςε αυτό, αλλά και τα διάφορα κομμάτια κειμζνου (προτάςεισ, παράγραφοι) ςτα οποία αυτζσ εμφανίηονται. Θ τεχνικι αυτι προςφζρει ζναν τρόπο προςδιοριςμοφ τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ λζξεων και κειμζνων. Μζςω τθσ ςτατιςτικισ ανάλυςθσ θ LSA αναπαριςτά το ςϊμα κειμζνου ςαν ζνα πίνακα του οποίου οι ςειρζσ αντιςτοιχοφν ςτισ διαφορετικζσ μορφζσ λζξεων 44

45 που ςυναντϊνται ςε αυτό και οι ςτιλεσ ςε ςυγκεκριμζνα κομμάτια κειμζνου (προτάςεισ, παράγραφοι), ενϊ τα κελιά περιζχουν τισ ςυχνότθτεσ με τισ οποίεσ εμφανίηονται οι λζξεισ ςτο αντίςτοιχο κομμάτι. Οι τιμζσ ςτα κελιά τροποποιοφνται μακθματικά για να λθφκεί υπ όψιν το βάροσ κάκε λζξθσ ανάλογα με τθν ςπανιότθτά τθσ. Τζλοσ, θ LSA βαςίηεται ςτθν Ανάλυςθ Λδιοτιμϊν (Singular Value Decomposition, SVD), μια μακθματικι τεχνικι απλοποίθςθσ μεγάλων πινάκων. Θ χριςθ αυτισ τθσ τεχνικισ είναι ζνα ςθμαντικό χαρακτθριςτικό τθσ LSΑ, κακϊσ οι εκτιμιςεισ ςθμαςιολογικισ ομοιότθτασ που προςφζρει βαςίηονται ςε περίπλοκεσ (λανκάνουςεσ) ςχζςεισ μεταξφ των λζξεων και όχι ςε απλι καταμζτρθςθ των ςυνεμφανίςεων των λζξεων μζςα ςε ζνα κομμάτι κειμζνου (πρόταςθ ι παράγραφο). Ρολφ απλοποιθμζνα, κα μποροφςαμε να ποφμε πωσ θ LSA αναπαριςτά το νόθμα μιασ λζξθσ ςαν τον μζςο όρο των διαφορετικϊν νοθμάτων, με τα οποία αυτι εμφανίηεται ςτο ςϊμα κειμζνου και το νόθμα ενόσ κειμζνου ςαν τον μζςο όρο των νοθμάτων των λζξεων που περιζχει Εφαρμογέσ Θ χρθςιμότθτα τθσ LSA ζχει καταδειχκεί μζςα από τισ πολυάρικμεσ εφαρμογζσ τθσ. Ζχει εφαρμοςτεί ςτθν ανάκτθςθ πλθροφοριϊν (Information Retrieval) προςφζροντασ καλφτερα αποτελζςματα κατά 10-30%, αναγνωρίηοντασ ζγγραφα που περιζχουν διαφορετικζσ λζξεισ αλλά με ςχετικό περιεχόμενο (Deerwester, Dumais, Furnas, Landauer, & Harshman, 1990). Επίςθσ, μπορεί να προςομοιϊςει τθν ανκρϊπινθ ςυμπεριφορά ςτθν κατθγοριοποίθςθ εννοιϊν και ςτθν αξιολόγθςθ ςθμαςιολογικισ ομοιότθτασ (Laham, 1997), να προβλζψει ποια κείμενα κα είναι πιο χριςιμα για τθν μόρφωςθ μακθτϊν ςυναρτιςει των προθγοφμενων γνϊςεϊν τουσ (Wolfe, et al., 1998) και να διαχωρίςει ςφμφωνα με το νόθμά τουσ τισ παραγράφουσ μιασ θλεκτρονικισ βιβλιοκικθσ. Τζλοσ, μπορεί να εφαρμοςτεί ςε υπθρεςίεσ φιλτραρίςματοσ ι επιλογισ επικυμθτοφ περιεχομζνου (Dumais, Furnas, Landauer, Deerwester, & Harshman, 1988). Στισ προθγοφμενεσ ενδεικτικζσ εφαρμογζσ τθσ LSA μποροφμε να προςκζςουμε τθν προςομοίωςθ, υπό όρουσ, μιασ μελζτθσ ταξινόμθςθσ καρτϊν ανοιχτοφ τφπου (Katsanos, Tselios, & Avouris, 2008) Πλεονεκτήματα Μειονεκτήματα Θ ςθμαντικι ζρευνα που ζχει διεξαχκεί ςχετικά με τθν LSA ζχει καταδείξει τα πλεονεκτιματα και τα μειονεκτιματα αυτισ τθσ μεκόδου. Κυριότερο μειονζκτθμα αποτελεί θ εξάρτθςθ από ζνα ςϊμα κειμζνου το οποίο ιδανικά πρζπει να αντιπροςωπεφει το ςυνολικό κείμενο από το οποίο θ υπό εξζταςθ ομάδα ανκρϊπων ζχει αποκτιςει τισ γνϊςεισ ςχετικά με το αντικείμενο τθσ εφαρμογισ. Κάτι τζτοιο ςτθν πράξθ είναι μάλλον αδφνατο, κακϊσ το μζγεκοσ του ςϊματοσ κειμζνου που μπορεί να επεξεργαςτεί θ LSA με τθν παροφςα τεχνολογία υπολογιςτϊν είναι πολφ μικρότερο από αυτό που πραγματικά ζχει βιϊςει ο μζςοσ άνκρωποσ. Επίςθσ θ απουςία των μθ-γραπτϊν μζςων απόκτθςθσ γνϊςεων, όπωσ πχ 45

46 θ ςυνομιλία, μασ απομακρφνει ακόμα περιςςότερο από τθν ιδανικι περίπτωςθ (Landauer, Laham, & Foltz, 1998). Οι ςχετικζσ ζρευνεσ ζχουν υποδείξει ότι το μζγεκοσ του ςϊματοσ κειμζνου που τελικά χρθςιμοποιείται ςτθν κάκε εφαρμογι ζχει μεγάλθ ςθμαςία ςτθν αποδοτικότθτα τθσ μεκόδου (Landauer, 2002). Αυτό, ςε ςυνδυαςμό με τον ιδιαίτερα μεγάλο χρόνο που απαιτείται για τθν προεπεξεργαςία του ςϊματοσ κειμζνου (ανάλυςθ ιδιοτιμϊν), κάνει τθν επιλογι του καταλλθλότερου ςϊματοσ κειμζνου ιδιαίτερα κρίςιμθ. Κακ επζκταςθ των παραπάνω, για κάκε εφαρμογι με εξειδικευμζνο λεξιλόγιο κα πρζπει να βρεκεί το καταλλθλότερο ςϊμα κειμζνου ι τουλάχιςτον κάποιο που προςφζρει ικανοποιθτικά αποτελζςματα. Θ εναλλακτικι επιλογι είναι να χρθςιμοποιείται για κάκε εφαρμογι ζνα επαρκϊσ μεγάλο ςϊμα κειμζνου, το οποίο κα καλφπτει όλεσ τισ εφαρμογζσ. Οι παραπάνω λφςεισ είναι προβλθματικζσ, αφενόσ μεν διότι ο χρόνοσ προεπεξεργαςίασ είναι ιδιαίτερα μεγάλοσ και αφετζρου, διότι απαιτείται να είναι διακζςιμθ προσ επεξεργαςία κάποια μορφι του αλγορίκμου τθσ LSA ζτςι ϊςτε να ειςαχκεί ζνα ςϊμα κειμζνου διαφορετικό από τα ιδθ διακζςιμα ςτθν δικτυακι τοποκεςία τθσ LSA. Οι περιςςότερεσ εφαρμογζσ τθσ LSA κάνουν χριςθ του ςϊματοσ κειμζνου TASA, μζςω του δικτυακοφ τόπου, το οποίο αντιςτοιχεί ςτο ςυνολικό κείμενο που ζχει μελετιςει ζνασ νζοσ τελειϊνοντασ το ςχολείο, κακϊσ αυτό είναι και το μεγαλφτερο διακζςιμο. Θ εξάρτθςθ όμωσ από τον ςυγκεκριμζνο δικτυακό τόπο δεν αποτελεί βιϊςιμθ επιλογι. Συνεπϊσ, θ ενςωμάτωςθ τθσ δυνατότθτασ εκπαίδευςθσ του LSA αλγορίκμου από επιλεγμζνα ςϊματα κειμζνων είναι μία αναγκαία μελλοντικι επζκταςθ του εργαλείου AutoCardSorter. Ζνα άλλο μειονζκτθμα τθσ LSA ςχετίηεται με τθν εξάρτθςθ από τον αρικμό των διαςτάςεων του πίνακα που προκφπτει μετά τθν ανάλυςθ ιδιοτιμϊν (Landauer, Foltz, & Laham, 1998), (Dumais, 1992), (Berry, Dumais, & Obrien, 1995). Θ ςθμαςία του αρικμοφ αυτοφ ζχει επίςθσ προκφψει μζςα από τθν ςχετικι ζρευνα και κακϊσ δεν υπάρχει ςυγκεκριμζνοσ τρόποσ για τθν επιλογι του βζλτιςτου αρικμοφ, είναι απαραίτθτο για κάκε εφαρμογι να επιλζγεται εμπειρικά. Επίςθσ δεν είναι γνωςτό εάν ζνασ αρικμόσ διαςτάςεων που προςφζρει ικανοποιθτικά αποτελζςματα για μια εφαρμογι, κα προςφζρει και για κάποια άλλθ. Για παράδειγμα, ςε μία ταξινόμθςθ καρτϊν ανοιχτοφ τφπου με γενικό λεξιλόγιο και ςε μία ταξινόμθςθ με εξειδικευμζνο, τεχνικό ι επιςτθμονικό λεξιλόγιο. Στουσ παραπάνω παράγοντεσ καλισ απόδοςθσ τθσ μεκόδου, προςτίκενται και ο μακθματικόσ μεταςχθματιςμόσ ςτισ τιμζσ των κελιϊν, και κυριότερα το μζγεκοσ των κειμζνων, ςτθν περίπτωςθ που ενδιαφερόμαςτε για τθν ςθμαςιολογικι ςυςχζτιςθ μεταξφ κειμζνων. Σχετικι ζρευνα ζχει υποδείξει ζναν ιδιαίτερα αποτελεςματικό μακθματικό μεταςχθματιςμό (Dumais, 1992), ο οποίοσ και χρθςιμοποιείται ςτισ περιςςότερεσ εφαρμογζσ. Δεν υπάρχουν αντίςτοιχα 46

47 ευριματα όμωσ για το απαραίτθτο μζγεκοσ κειμζνου. Οι (Rehder, Schreiner, Wolfe, Laham, Landauer, & Kintsch, 1998) ζλαβαν ικανοποιθτικά αποτελζςματα χρθςιμοποιϊντασ 200 λζξεισ περίπου, από εκκζςεισ μακθτϊν για να μετριςουν τισ γνϊςεισ των μακθτϊν πάνω ςτο αντικείμενο τθσ ζκκεςθσ. Αυτόσ ο αρικμόσ όμωσ, δεν ζχει επαλθκευτεί ςε περιςςότερεσ εφαρμογζσ. Πλα τα παραπάνω προβλιματα κακιςτοφν δυςχερι τθν χριςθ τθσ LSA για τον ςκοπό που μασ ενδιαφζρει, δθλαδι τθν προςομοίωςθ μιασ μελζτθσ ταξινόμθςθσ καρτϊν. Οι περιγραφζσ των καρτϊν ςε μία τζτοια μελζτθ μπορεί να περιζχουν είτε απλό λεξιλόγιο, είτε εξειδικευμζνο ςε οποιοδιποτε αντικείμενο και επιςτιμθ. Επίςθσ, το μικοσ των περιγραφϊν μπορεί να είναι από μερικζσ λζξεισ μζχρι πχ ολόκλθρεσ τεχνικζσ περιγραφζσ κινθτϊν τθλεφϊνων, αν ςκοπόσ είναι να βρεκεί ο τρόποσ με τον οποίο οι πελάτεσ μιασ εταιρείασ καταςκευισ κινθτϊν τθλεφϊνων, κατθγοριοποιοφν νοθτά τα διάφορα μοντζλα. Το μεγαλφτερο πρόβλθμα όμωσ εντοπίηεται ςτθν ςτατικότθτα του ςϊματοσ κειμζνου που χρθςιμοποιείται κατά τθν αρχικι επεξεργαςία. Εξαιτίασ του μεγάλου υπολογιςτικοφ χρόνου που απαιτείται για τθν ανάλυςθ ιδιοτιμϊν ςτον αρχικό πίνακα, δεν είναι πρακτικι θ ςυχνι ανανζωςθ του ςϊματοσ κειμζνου, ζτςι ϊςτε να περιλαμβάνει τισ νζεσ λζξεισ και τεχνικοφσ όρουσ που προκφπτουν κακθμερινά. Ραρόλα τα προβλιματα, θ LSA παρουςιάηει οριςμζνα ςθμαντικά πλεονεκτιματα. Το κυριότερο είναι πωσ προςφζρει τθν δυνατότθτα για εφρεςθ και αναπαράςταςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ κειμζνων οποιουδιποτε μικουσ, κάτι που είναι απαραίτθτο για τθν εφαρμογι που μασ ενδιαφζρει. Ζνα δεφτερο ςθμαντικό πλεονζκτθμα, είναι ο ιδιαίτερα ταχφσ υπολογιςμόσ τθσ ςυςχζτιςθσ μεταξφ πολλϊν κειμζνων, κάτι επίςθσ απαραίτθτο για τον AutoCardSorter. Ζχουν προτακεί διάφοροι τρόποι για να αυξθκεί θ απόδοςθ τθσ LSA, που επικεντρϊνονται κυρίωσ ςτθν μεταβολι των παραπάνω παραγόντων. Μία ενδιαφζρουςα προςζγγιςθ προτείνει ζναν τρόπο για τθν βζλτιςτθ επιλογι ενόσ υπο-ςϊματοσ κειμζνου ςτο οποίο κα πραγματοποιθκεί θ ανάλυςθ (Papadimitriou, Raghavan, Tamaki, & Vempala, 2000). Θ προςζγγιςθ αυτι ζγκειται ςτο γεγονόσ ότι εξαιτίασ του μεγάλου χρόνου προεπεξεργαςίασ και ςθμαντικϊν υπολογιςτικϊν πόρων που απαιτοφνται, επιλζγεται ςτισ διάφορεσ εφαρμογζσ, ζνα μικρότερο κομμάτι κάποιου πολφ μεγάλου ςϊματοσ κειμζνου και θ επιλογι αυτι είναι ςυνικωσ αυκαίρετθ. Στθν παραπάνω εργαςία, οι ςυγγραφείσ προτείνουν ζναν τρόπο που βαςίηεται ςτθν ςτατιςτικι ανάλυςθ, για τθν βζλτιςτθ επιλογι αυτοφ του υπο-ςϊματοσ. 47

48 4.3. Παραλλαγέσ τησ μεθόδου LSA NLS: A Non-Latent Similarity Algorithm Ο αλγόρικμοσ NLS (αλγόρικμοσ μθ-λανκάνουςασ ςυςχζτιςθσ) (Zhiqiang, Mcnamara, Louwerse, Hu, Rowe, & Graesser, 2004), αν και δεν είναι ακριβϊσ παραλλαγι τθσ LSA, ζχει παρόμοια φιλοςοφία και μοιράηεται με αυτιν ςθμαντικά ςτοιχεία. Χρθςιμοποιεί ζναν πίνακα δεφτερθσ τάξθσ, ο οποίοσ δθμιουργείται βάςθ του ςυνθμίτονου των διανυςμάτων ενόσ πίνακα πρϊτθσ τάξθσ, ο οποίοσ περιζχει μθ-λανκάνουςεσ ςχζςεισ μεταξφ των λζξεων ενόσ μεγάλου ςϊματοσ κειμζνου. Ο πίνακασ πρϊτθσ τάξθσ μπορεί να δθμιουργθκεί με διάφορουσ τρόπουσ, ςτθν παραπάνω εργαςία όμωσ, ζγινε χριςθ μιασ παραλλαγισ τθσ μεκόδου που περιγράφεται ςτθν (Lin, 1998). Θ μζκοδοσ αυτι χρθςιμοποιεί τουσ ςυντακτικοφσ ρόλουσ που ζχουν οι λζξεισ ςτο ςϊμα κειμζνου, για να εξάγει πλθροφορίεσ για τθν ςθμαςιολογικι ςυςχζτιςθ δυο λζξεων. Στον αλγόρικμο NLS, εφαρμόηεται μια τροποποιθμζνθ ζκδοςθ αυτισ τθσ μεκόδου, για τθν δθμιουργία ενόσ πίνακα πρϊτθσ τάξθσ που περιζχει τισ εκτιμιςεισ για τθν ςθμαςιολογικι ςυςχζτιςθ ενόσ αρικμοφ ηευγαριοφ λζξεων από το ςϊμα κειμζνου. Στθν ςυνζχεια, κρατοφνται μόνο οι μεγαλφτερεσ τιμζσ, ενϊ οι υπόλοιπεσ τίκενται ςτο μθδζν. Τζλοσ, δθμιουργείται ο πίνακασ 2 θσ τάξθσ από τα ςυνθμίτονα των διανυςμάτων-ςτθλϊν του πίνακα 1 θσ τάξθσ. Θ αποδοτικότθτα του αλγορίκμου εκτιμικθκε από τθν ικανότθτά του να προβλζπει ζναν αρικμό λζξεων, ςχετικϊν με μία λζξθ-είςοδο (Zhiqiang, Mcnamara, Louwerse, Hu, Rowe, & Graesser, 2004). Ωσ ςϊμα κειμζνου χρθςιμοποιικθκε το TASA, το ςϊμα δθλαδι που χρθςιμοποιείται από τθν πλειοψθφία των αλγορίκμων εκτίμθςθσ τθσ ςθμαςιολογικισ ςυςχζτιςθσ κειμζνων. Βρζκθκε πωσ ο αλγόρικμοσ είναι αποδοτικότεροσ από τθν LSA, όςον αφορά τα ουςιαςτικά και εξίςου αποδοτικόσ όςον αφορά τα ριματα, τα επίκετα και τα επιρριματα. Ζνα από τα ςθμαντικά ςυγκριτικά πλεονεκτιματα του αλγορίκμου ζγκειται ςτο γεγονόσ ότι λαμβάνεται υπόψθ τόςο το ςυντακτικό γλωςςικό περιβάλλον μιασ λζξθσ, όςο και το ςθμαςιολογικό. Αυτό ζχει ςαν αποτζλεςμα τθν καλφτερθ απόδοςθ ςτα ουςιαςτικά, κάτι που ίςωσ οδθγιςει και ςε καλφτερθ ςυνολικι απόδοςθ όςον αφορά τθν ςθμαςιολογικι ςυςχζτιςθ κειμζνων. Ζνα ουςιαςτικό μειονζκτθμα για τθν άμεςθ εφαρμογι του αλγορίκμου για τον ςκοπό μασ, είναι θ απουςία πλθροφοριϊν για τον απαιτοφμενο χρόνο προεπεξεργαςίασ του ςϊματοσ κειμζνου και τθσ δθμιουργίασ του πίνακα 2 θσ τάξθσ. Επίςθσ, δεν υπάρχουν διακζςιμα πειραματικά δεδομζνα για τθν απόδοςθ του αλγορίκμου ςτθν ςυςχζτιςθ κειμζνων. Τζλοσ, μθ γνωρίηοντασ τον απαιτοφμενο 48

49 χρόνο προεπεξεργαςίασ, δεν μποροφμε να αποφανκοφμε για τθν δυνατότθτα ςυχνισ ανανζωςθσ του ςϊματοσ κειμζνου LSA-IR Θ μζκοδοσ LSA-IR (Falconner, Maslov, & Storey, 2008) επιχειρεί να λφςει τα κυριότερα προβλιματα που αντιμετωπίηει θ μζκοδοσ LSA. Ρρόκειται για μια τροποποιθμζνθ ζκδοςθ τθσ αρχικισ μεκόδου, που αντί για ζνα ςτατικό ςϊμα κειμζνου, χρθςιμοποιεί τα αποτελζςματα από αναηθτιςεισ ςτο Διαδίκτυο. Συγκεκριμζνα, για τθν εφρεςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ δυο εκφράςεων, εκτελοφνται δυο αναηθτιςεισ που ωσ όρο αναηιτθςθσ ζχουν τθν κάκε ζκφραςθ. Στθ ςυνζχεια εξάγονται ο τίτλοσ και θ περίλθψθ που προςφζρει θ μθχανι αναηιτθςθσ για κάκε αποτζλεςμα (snippet), για τα πρϊτα Κ=75 αποτελζςματα. Κάκε αποτζλεςμα κεωρείται ωσ ζνα ξεχωριςτό κείμενο. Οι καταλιξεισ αφαιροφνται από κάκε ξεχωριςτι λζξθ που περιλαμβάνεται ςτα 2Κ αποτελζςματα, ενϊ αφαιροφνται λζξεισ που περιλαμβάνονται ςε μια λίςτα κοινϊν λζξεων. Οι υπόλοιπεσ λζξεισ χρθςιμοποιοφνται για τθν δθμιουργία ενόσ πίνακα 2Κ ςτθλϊν, όπου θ κάκε μια αντιςτοιχεί ςε ζνα ξεχωριςτό κείμενο και Ν ςειρϊν, όπου θ κάκε μια αντιςτοιχεί ςε κάκε ξεχωριςτι λζξθ. Κάκε κελί περιζχει τθν ςυχνότθτα εμφάνιςθσ κάκε λζξθσ ςτο αντίςτοιχο κείμενο, όπωσ και ςτθν μζκοδο LSA. Τζλοσ, εφαρμόηεται ανάλυςθ ιδιοτιμϊν (SVD) ςτον πίνακα και θ τιμι τθσ ςθμαςιολογικισ ςυςχζτιςθσ των δυο εκφράςεων αναπαριςτάται από το ςυνθμίτονο των διανυςμάτων που αντιςτοιχοφν ςτθν κάκε ζκφραςθ. Θ αποδοτικότθτα τθσ μεκόδου ςυνάγεται από τθν επιτυχι επίλυςθ τριϊν τεςτ ςυνωνφμων (Falconner, Maslov, & Storey, 2008): TOEFL 80 ερωτιςεισ με 85.10% επιτυχία, ESL 50 ερωτιςεισ με 78% επιτυχία και RDWP 300 ερωτιςεισ με 83,76% επιτυχία. Λόγω τθσ χριςθσ του Διαδικτφου, αναιρείται πλζον το πρόβλθμα του ςτατικοφ ςϊματοσ κειμζνου και των ςυνεπειϊν του. Ο χρόνοσ προεπεξεργαςίασ επίςθσ, είναι πολφ μικρότεροσ, αφοφ το ςυνολικό κείμενο των 2Κ αποτελεςμάτων είναι πολλζσ τάξεισ μεγζκουσ μικρότερο από το ςϊμα κειμζνου που τυπικά χρθςιμοποιείται με τθν LSA. Ραρόλα αυτά, θ απόδοςθ αυξάνεται, κακϊσ το ςυνολικό κείμενο αν και μικρό, είναι άκρωσ ςχετικό ςθμαςιολογικά με τισ εκφράςεισ. Επίςθσ, είναι εφικτζσ διάφορεσ παραλλαγζσ τθσ μεκόδου, όπωσ πχ με τον περιοριςμό των αναηθτιςεων ςε ζναν ςυγκεκριμζνο δικτυακό τόπο ι μια ομάδα δικτυακϊν τόπων, με ςκοπό τθν ακόμα ςτενότερθ ςχζςθ του ςυνολικοφ κειμζνου με τισ δυο εκφράςεισ. Ζνα πικανό πρόβλθμα ςτθν εφαρμογι τθσ μεκόδου για τον ςκοπό μασ παραμζνει ο χρόνοσ προεπεξεργαςίασ. Σε μια ςυνθκιςμζνθ μελζτθ ταξινόμθςθσ καρτϊν, απαιτείται θ ςθμαςιολογικι ςφγκριςθ μεταξφ ενόσ μεγάλου αρικμοφ καρτϊν. Για 10 κάρτεσ πχ, κα πρζπει να εκτελεςτοφν 45 αναηθτιςεισ και να 49

50 εκτελεςτεί ο αλγόρικμοσ 45 φορζσ, ενϊ αρικμόσ αυτόσ αυξάνεται πάρα πολφ για 40 κάρτεσ. Φυςικά, κα μποροφςε να γίνει μόνο μία φορά θ προεπεξεργαςία, ςε ζνα ςυνολικό κείμενο που κα προκφπτει από τα αποτελζςματα των 10 ι 40 αναηθτιςεων αντίςτοιχα. Δυςτυχϊσ, εφόςον δεν γνωρίηουμε τον μζςο χρόνο για τθν πραγματοποίθςθ μιασ ςφγκριςθσ ανάμεςα ςε δυο εκφράςεισ, κα πρζπει να διερευνθκεί ποιοσ τρόποσ προςφζρει καλφτερα αποτελζςματα και ποιοσ είναι ταχφτεροσ. Τζλοσ, ςθμειϊνουμε πωσ θ ακρίβεια τθσ μεκόδου πικανόν να περιορίηεται από το μικοσ των εκφράςεων. Είναι προφανζσ ότι όςο αυξάνονται οι όροι μιασ αναηιτθςθσ τόςο ελαττϊνεται ο αρικμόσ των αποτελεςμάτων. Σφμφωνα με τα παραπάνω, απαιτοφνται τουλάχιςτον 75 αποτελζςματα για κάκε ζκφραςθ που μασ ενδιαφζρει Pointwise Mutual Information for Information Retrieval (PMI -IR) Θ μζκοδοσ PMI-IR (Turney, Mining the Web for Synonyms: PMI-IR Versus LSA on TOEFL, 2001), είναι επίςθσ μία από τισ πιο διαδεδομζνεσ για τθν εφρεςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ δυο λζξεων Α,Β. Ρρόκειται για μια ιδιαίτερα απλι μζκοδο θ οποία χρθςιμοποιεί τθν μθχανι αναηιτθςθσ AltaVista. Συγκεκριμζνα, κάνει χριςθ του τελεςτι NEAR τθσ μθχανισ αναηιτθςθσ και εκτελεί τρεισ αναηθτιςεισ, μία για κάκε λζξθ και μια για τισ δυο μαηί με χριςθ του τελεςτι NEAR (Α NEAR Β). Στθ ςυνζχεια, αποκθκεφονται οι τιμζσ για το πλικοσ των αποτελεςμάτων που επιςτρζφει θ κάκε αναηιτθςθ και τζλοσ, υπολογίηεται ο βακμόσ ςθμαςιολογικισ ςυςχζτιςθσ μζςω τθσ ςτατιςτικισ μεκόδου PMI. Θ αναηιτθςθ με τον τελεςτι NEAR επιςτρζφει ιςτοςελίδεσ που περιζχουν και τισ δυο λζξεισ ςε διάςτθμα μικρότερο των 10 λζξεων. Ο αλγόρικμοσ χρθςιμοποιεί επίςθσ τον τελεςτι NOT (πχ NOT ugly ), για να μθν ςυμπεριλθφκοφν ςτα αποτελζςματα ιςτοςελίδεσ με αναφορζσ ςτα αντϊνυμα των λζξεων. Θ μζκοδοσ ζχει χρθςιμοποιθκεί με επιτυχία για τθν επίλυςθ του τμιματοσ ςυνωνφμων του TOEFL, με ακρίβεια 73,75% (Turney, Mining the Web for Synonyms: PMI-IR Versus LSA on TOEFL, 2001). Άλλεσ εφαρμογζσ ςυμπεριλαμβάνουν τθν επιτυχι κατθγοριοποίθςθ κριτικϊν άρκρων που αφοροφν ταινίεσ με 74% ακρίβεια (Turney, 2002), τθν αναγνϊριςθ λακϊν κατά τθν αυτόματθ καταγραφι ομιλίασ (Inkpen & Desilets, 2005), τθν εκτίμθςθ τθσ πολιτικισ κατεφκυνςθσ κειμζνων (Efron, 2005), τθν εξαγωγι πλθροφοριϊν από το Διαδίκτυο (Popescu, 2007) και τθν εφρεςθ τθσ ςθμαςιολογικισ χροιάσ μιασ λζξθσ (αρνθτικι κετικι) με ακρίβεια 80% (Turney & Littman, 2002). Θ ποιότθτα των αποτελεςμάτων του αλγόρικμου PMI-IR εξαρτάται από το μζγεκοσ τθσ ςυλλογισ εγγράφων που βρίςκεται καταχωρθμζνθ ςτο ευρετιριο τθσ μθχανισ αναηιτθςθσ, αλλά και από τθν εγκυρότθτα και ςτακερότθτα των τιμϊν που 50

51 επιςτρζφει θ μθχανι αναηιτθςθσ. Επίςθσ, είναι απαραίτθτθ θ χριςθ των δυο παραπάνω τελεςτϊν. Οι παραπάνω παράγοντεσ, μποροφν να κεωρθκοφν ωσ τα μειονεκτιματα τθσ μεκόδου. Στθν ςθμερινι εποχι βζβαια, τα ευρετιρια των μθχανϊν αναηιτθςθσ είναι πραγματικά κολοςςιαία ςε μζγεκοσ και μποροφμε να ποφμε ότι προςφζρουν ζνα ικανοποιθτικό πλικοσ πλθροφοριϊν. Θ εγκυρότθτα και ςτακερότθτα των τιμϊν όμωσ, δεν είναι εγγυθμζνεσ, ενϊ το ίδιο ιςχφει για τθν διακεςιμότθτα των τελεςτϊν, κακϊσ ο τελεςτισ NEAR δεν είναι πλζον διακζςιμοσ ςτθν AltaVista και ςυνικωσ οι διάφορεσ μθχανζσ αναηιτθςθσ δεν προςφζρουν παρόμοιεσ επιλογζσ. Δεδομζνθσ τθσ μθ διακεςιμότθτασ του τελεςτι NEAR, κάποιοι ερευνθτζσ χρθςιμοποίθςαν τθν μζκοδο PMI-IR ςε ςυνδυαςμό με το ςφςτθμα WATERLOO, το οποίο επιτρζπει τθν διαχείριςθ ςωμάτων κειμζνου τεράςτιου μεγζκουσ. Σε αυτιν τθν περίπτωςθ αντί του Διαδικτφου γίνεται χριςθ ενόσ ςϊματοσ κειμζνου το οποίο διαχωρίηεται ςε κομμάτια (ιςτοςελίδεσ), ενϊ το διάςτθμα των 10 λζξεων μπορεί να μεταβλθκεί κατά βοφλθςθ. Άλλοι ερευνθτζσ χρθςιμοποίθςαν απλϊσ τον κοινό τελεςτι AND, αντί του NEAR. Το ςθμαντικότερο μειονζκτθμα, όμωσ, είναι ο περιοριςμόσ ςτθν ςφγκριςθ μόνο μεταξφ δυο λζξεων και θ φπαρξθ εφαρμογϊν μόνο για αυτι τθν περίπτωςθ. Σε επόμενθ ενότθτα παρουςιάηονται κάποιεσ τεχνικζσ για τθν επζκταςθ ςε ςφγκριςθ κειμζνων, των μζτρων ςθμαςιολογικισ ομοιότθτασ που περιορίηονται ςε ςυγκρίςεισ μεταξφ λζξεων. Στισ τεχνικζσ αυτζσ, απαιτείται ςυνικωσ ο υπολογιςμόσ τθσ ςυςχζτιςθσ μεταξφ όλων των λζξεων ενόσ κειμζνου. Σε αυτιν τθν περίπτωςθ, για τθν προςομοίωςθ μιασ μελζτθσ ταξινόμθςθσ καρτϊν κα απαιτοφνται πολυάρικμεσ αναηθτιςεισ ςτο Διαδίκτυο, γεγονόσ που πικανϊσ να αυξάνει τον χρόνο υπολογιςμοφ ςε απαγορευτικά επίπεδα. Το πρόβλθμα αυτό βζβαια δεν υφίςταται ςε περίπτωςθ που χρθςιμοποιείται ζνα ςφςτθμα όπωσ το WATERLOO. Θ μζκοδοσ PMI-IR βζβαια, ζχει κάποια ςθμαντικά ςυγκριτικά πλεονεκτιματα. Το ςθμαντικότερο πλεονζκτθμα ζγκειται ςτο γεγονόσ ότι χρθςιμοποιεί ζνα τεράςτιο ςϊμα κειμζνου, το Διαδίκτυο, το οποίο μάλιςτα είναι και δυναμικό. Ξεπερνιοφνται ζτςι τα προβλιματα του περιοριςμζνου λεξιλογίου τθσ LSA και τθσ αδυναμίασ για κάλυψθ νζων όρων. Αυτό είναι ουςιϊδουσ ςθμαςίασ για τθν εφαρμογι που ερευνάμε (AutoCardSorter). Τα παραπάνω ιςχφουν και για τθν περίπτωςθ τθσ χριςθσ του ςυςτιματοσ WATERLOO, αφοφ ο χρόνοσ προεπεξεργαςίασ του ςϊματοσ κειμζνου είναι μικρόσ και ζτςι κακίςταται πρακτικι θ ςυχνι ανανζωςι του, με τθν βοικεια πχ ενόσ Web crawler ι πόρων, όπωσ οι διάφορεσ εκδόςεισ τθσ διαδικτυακισ εγκυκλοπαίδειασ Wikipedia. 51

52 4.5. Παραλλαγέσ τησ μεθόδου PMI-IR SOC-PMI Θ μζκοδοσ SOC-PMI (PMI 2 θσ τάξθσ) (Islam, Inkpen, & Kiringa, Applications of corpus-based semantic similarity and word segmentation to database schema matching, 2008) επεκτείνει τθν PMI-IR, ζτςι ϊςτε να είναι εφικτι θ ςφγκριςθ δυο λζξεων-κλειδιϊν που δεν τυχαίνει να εντοπίηονται μαηί ςε ζνα παράκυρο κειμζνου, αλλά εντοπίηονται ςε παρόμοιο γλωςςικό περιβάλλον, ζχουν δθλαδι τισ ίδιεσ γειτονικζσ λζξεισ. Θ μζκοδοσ χρθςιμοποιεί ζνα ςϊμα κειμζνου για να εντοπίςει διάφορα ςτοιχεία που αφοροφν τισ λζξεισ που μασ ενδιαφζρουν. Αρχικά υπολογίηεται ο αρικμόσ εμφανίςεων κάκε ξεχωριςτισ λζξθσ μζςα ςτο ςϊμα κειμζνου, αφοφ προθγθκεί θ ςυνθκιςμζνθ επεξεργαςία ( απομάκρυνςθ των ςυχνϊν λζξεων και των μορφϊν που οφείλονται ςτθν πτϊςθ, χρόνο, γζνοσ κλπ). Ακολοφκωσ, υπολογίηεται για κάκε ξεχωριςτι λζξθ, θ ςυχνότθτα με τθν οποία εμφανίηεται με κάκε μια από τισ λζξεισ που κζλουμε να ςυγκρίνουμε, μζςα ςε ζνα παράκυρο κειμζνου. Για τισ λζξεισ που θ ςυχνότθτα αυτι είναι κετικι, υπολογίηεται θ PMI τιμι των δφο λζξεων, όπου οι περιςςότερο ςθμαςιολογικά ςχετικζσ λζξεισ ζχουν και μεγαλφτερθ τιμι PMI. Στθ ςυνζχεια δθμιουργοφνται δυο λίςτεσ, μια για κάκε λζξθ που μασ ενδιαφζρει, που περιζχουν λζξεισ με ςτενι ςθμαςιολογικι ςυςχζτιςθ με τισ λζξεισ κλειδιά. Το επόμενο βιμα είναι ο υπολογιςμόσ του ακροίςματοσ των τιμϊν PMI των λζξεων που είναι ςχετικζσ με τθν μια λζξθ-κλειδί, αλλά βρίςκονται επίςθσ και ςτθν λίςτα τθσ άλλθσ. Αφοφ γίνει αυτό και για τισ δυο λζξεισ-κλειδιά, υπολογίηεται τζλοσ θ ςθμαςιολογικι ςυςχζτιςθ των δυο λζξεων που λαμβάνει υπόψθ τα παραπάνω ακροίςματα. Θ μζκοδοσ αντιμετϊπιςε επιτυχϊσ αρκετά τεςτ ςυνωνφμων (Islam, Inkpen, & Kiringa, Applications of corpus-based semantic similarity and word segmentation to database schema matching, 2008) : TOEFL με 76,25% επιτυχία, ESL με 68% επιτυχία, Miller and Charles noun pair subset με ςυςχζτιςθ 0,764 με τουσ κριτζσ και Rubenstein and Goodenough noun pair set με 0,729 ςυςχζτιςθ με τουσ κριτζσ. Ππωσ προαναφζρκθκε, ζνα ςθμαντικό χαρακτθριςτικό τθσ μεκόδου είναι θ ικανότθτα εκτίμθςθσ τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ λζξεων που δεν εμφανίηονται μαηί ςτο παράκυρο κειμζνου. Θ μζκοδοσ βζβαια, προορίηεται για ςφγκριςθ δυο λζξεων και δεν είναι γνωςτό εάν είναι πρακτικι θ επζκταςι τθσ για ςφγκριςθ κειμζνων ι εκφράςεων. Με δεδομζνο όμωσ ότι δεν χρθςιμοποιοφνται αναηθτιςεισ ςτο Διαδίκτυο ι περίπλοκοι μακθματικοί υπολογιςμοί, μια τζτοια επζκταςθ κρίνεται εφικτι. 52

53 Local-Context Information Retrieval (LC-IR) Θ μζκοδοσ LC-IR (Higgins, 2005) βαςίηεται επίςθσ ςτθν PMI-IR, με μια ςθμαντικι διαφορά: χρθςιμοποιεί ζνα πολφ μικρότερο παράκυρο κειμζνου, απαιτϊντασ ςτθν ουςία απόλυτθ γειτονία των δυο λζξεων. Αυτι θ μικρι αλλά ςθμαντικι διαφορά ζχει ςαν αποτζλεςμα, ςφμφωνα με τουσ ερευνθτζσ, εκτόσ από το γενικό γλωςςικό περιβάλλον, να λαμβάνεται υπόψθ και θ ςφνταξθ των λζξεων ςτον προςδιοριςμό τθσ ςθμαςιολογικισ τουσ ςυςχζτιςθσ, αφοφ αυτζσ εντοπίηονται ςτθν ίδια πρόταςθ. Θ απόδοςθ τθσ μεκόδου ςτα τεςτ ςυνωνφμων είναι 81,3% για το TOEFL, 74,8% για το RDWP και 78% για το ESL (Higgins, 2005). Τα αποτελζςματα αυτά είναι ιδιαίτερα ενδιαφζροντα κακϊσ θ μζκοδοσ είναι άμεςα εφαρμόςιμθ, αφοφ δεν χρθςιμοποιεί τον τελεςτι NEAR, οφτε απαιτείται θ επεξεργαςία κάποιου ςϊματοσ κειμζνου. Επίςθσ, θ LC-IR κα μποροφςε να χρθςιμοποιθκεί αντί τθσ κλαςςικισ PMI-IR, ςτον αλγόρικμο τθσ SOC-PMI αλλά και ςε όποιον αλγόρικμο κάνει χριςθ τθσ PMI-IR Contextual Label Matching PMI (CM-PMI) Θ CM-PMI (Wan, 2008)είναι μια μζκοδοσ που ζχει παρόμοια φιλοςοφία με τθν SOC-PMI. Κάνει χριςθ τθσ αναηιτθςθσ ςτο Διαδίκτυο για να εντοπίςει περιγραφικζσ λζξεισ από το γλωςςικό περιβάλλον των λζξεων-κλειδιϊν που μασ ενδιαφζρουν. Ωσ περιγραφικζσ λζξεισ, ορίηονται λζξεισ που εντοπίηονται ςυχνά ςτα αποτελζςματα τθσ αναηιτθςθσ, μαηί με τθν λζξθ κλειδί. Θ μζκοδοσ επεξεργάηεται τα πρϊτα 1000 αποτελζςματα τθσ αναηιτθςθσ, εντοπίηοντασ περιγραφικζσ λζξεισ ςτον τίτλο και τθν περίλθψθ κάκε αποτελζςματοσ. Οι λζξεισ που εμφανίηονται ςυχνότερα με τθν κάκε λζξθ-κλειδί τοποκετοφνται ςε μια λίςτα. Στθν ςυνζχεια γίνεται μια εκτίμθςθ τθσ ςυςχζτιςθσ μεταξφ των δυο λιςτϊν. Μζροσ του αλγορίκμου που υπολογίηει αυτιν τθν ςυςχζτιςθ και τελικά τθν ςθμαςιολογικι ςυςχζτιςθ μεταξφ των δυο λζξεων που μασ ενδιαφζρουν, είναι ο κακοριςμόσ ενόσ βάρουσ ςε κάκε περιγραφικι λζξθ που ςτθν ουςία πρόκειται για τθν PMI-IR τιμι μεταξφ τθσ περιγραφικισ λζξθσ και τθσ αντίςτοιχθσ λζξθσ-κλειδιοφ. Θ μζκοδοσ χρθςιμοποιικθκε με ςχετικι επιτυχία ςτο τεςτ ςυνωνφμων Miller-Charles, με ςυςχζτιςθ 0,5 με τουσ κριτζσ (Wan, 2008). Οι ερευνθτζσ χρθςιμοποίθςαν επίςθσ ζναν απλό ςυνδυαςμό των μεκόδων PMI-IR και CM-PMI (FusionPMI), για να επιτφχουν μια μικρι βελτίωςθ (0,55 ςυςχζτιςθ με τουσ κριτζσ). Ρρζπει να ςθμειωκεί πωσ θ μζκοδοσ εξαρτάται από διάφορουσ παράγοντεσ, όπωσ ο αρικμόσ των αποτελεςμάτων, ο αρικμόσ των περιγραφικϊν λζξεων που χρθςιμοποιοφνται και το βάροσ των δυο μεκόδων ςτον ςυνδυαςμό FusionPMI. Οι παράγοντεσ αυτοί κα πρζπει να βελτιςτοποιθκοφν για τθν εφαρμογι που μασ ενδιαφζρει. Κρίνεται όμωσ, πωσ θ επζκταςθ τθσ μεκόδου για ςφγκριςθ κειμζνων είναι μάλλον ανζφικτθ, κακϊσ απαιτοφνται πολυάρικμεσ αναηθτιςεισ για ςφγκριςθ 53

54 δυο λζξεων, γεγονόσ που ίςωσ αυξιςει υπερβολικά τον χρόνο εκτζλεςθσ ςτθν περίπτωςθ ςφγκριςθσ κειμζνων Positive PMI Cosine Θ τεχνικι των (Bullinaria & Levy, 2006) αξιοποιεί τθν μακθματικι μζκοδο PMI ςε μια πολφ ενδιαφζρουςα παραλλαγι. Οι ςυγγραφείσ χρθςιμοποίθςαν το ςϊμα κειμζνου British National Corpus (BNC), για τθν δθμιουργία διανυςμάτων που περιγράφουν ςθμαςιολογικά τισ λζξεισ-κλειδιά. Τα ςτοιχεία των διανυςμάτων αυτϊν δεν περιζχουν τισ ςυνθκιςμζνεσ πικανότθτεσ εντοπιςμοφ δυο λζξεων ςε ζνα παράκυρο κειμζνου, αλλά τθν τιμι PMI μεταξφ αυτϊν των δυο λζξεων. Επίςθσ, όλεσ οι αρνθτικζσ τιμζσ PMI τίκενται ςτο μθδζν, με τθν λογικι ότι μια αρνθτικι τιμι μπορεί να εξθγθκεί από τθν ανεπαρκι κάλυψθ των ςχετικϊν λζξεων ςτο ςϊμα κειμζνου. Συνεπϊσ, οι αρνθτικζσ τιμζσ μθδενίηονται για να μθν λθφκοφν υπόψθ ςτον υπολογιςμό τθσ ςθμαςιολογικισ ςυςχζτιςθσ. Ο υπολογιςμόσ τθσ ςθμαςιολογικισ ςυςχζτιςθσ δυο λζξεων, βρίςκεται απλά από το ςυνθμίτονο των αντίςτοιχων διανυςμάτων. Οι ερευνθτζσ επιςτράτευςαν ζνα εκτενζσ ςφνολο ελζγχων για τθν επαλικευςθ τθσ αποτελεςματικότθτασ τθσ μεκόδου. Στο κλαςςικό τεςτ ςυνωνφμων του TOEFL θ τεχνικι πζτυχε ακρίβεια 85%. Χρθςιμοποιικθκαν επίςθσ 200 λζξεισ, για κάκε μία από τισ οποίεσ θ μζκοδοσ ξεχϊριςε με επιτυχία 97% τισ μθ ςθμαςιολογικά ςχετικζσ, από μια λίςτα 10 λζξεων, μια εκ των οποίων ιταν ςθμαςιολογικά ςχετικι με τθν λζξθ-κλειδί και οι υπόλοιπεσ τυχαία επιλεγμζνεσ. Επιπρόςκετα, θ τεχνικι κατθγοριοποίθςε με ακρίβεια 98% 530 λζξεισ ςε 53 ςθμαςιολογικζσ κατθγορίεσ. Είναι ενδιαφζρον πωσ θ τεχνικι πζτυχε άκρωσ ενκαρρυντικά αποτελζςματα με ζνα μικρό παράκυρο μικουσ μόλισ 1-3 λζξεων. Θ διάςταςθ των διανυςμάτων είναι ακόμα ζνασ ςθμαντικόσ παράγοντασ επιτυχίασ και μιλϊντασ γενικά, μεγαλφτερεσ διαςτάςεισ προςφζρουν καλφτερα αποτελζςματα. Ζνασ άλλοσ κρίςιμοσ παράγοντασ ςτθν απόδοςθ τθσ μεκόδου, είναι το μζγεκοσ του ςϊματοσ κειμζνου, όπωσ άλλωςτε ςυμβαίνει ςυνικωσ, με τισ τεχνικζσ που χρθςιμοποιοφν ζνα ςτατικό ςϊμα κειμζνου. Οι ςυγγραφείσ ςθμειϊνουν επίςθσ, πωσ θ απόδοςθ ςτθν ςθμαςιολογικι κατθγοριοποίθςθ, μεταβάλλεται ζντονα ςυναρτιςει του μεγζκουσ του ςϊματοσ κειμζνου. Τζλοσ, διαπιςτϊνεται θ μεγάλθ ςθμαςία τθσ ποιότθτασ του ςϊματοσ κειμζνου, κάτι που ζχει ιδιαίτερο ενδιαφζρον για τθν εφαρμογι που μασ απαςχολεί SemSim Θ μζκοδοσ SemSim (Bollegala, Matsuo, & Ishizuka, 2007) αποτελεί επίςθσ μια ενδιαφζρουςα προςζγγιςθ ςτθν εκτίμθςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ δυο λζξεων-κλειδιϊν. Ενοποιεί 5 διαφορετικζσ προςεγγίςεισ ςε μια ενιαία λφςθ με ςθμαντικι επιτυχία. Οι διαφορετικζσ προςεγγίςεισ χρθςιμοποιοφν τον αρικμό αλλά και τισ περιλιψεισ των αποτελεςμάτων μιασ μθχανισ αναηιτθςθσ. 54

55 Αρχικά, εξάγονται οι εκτιμιςεισ από τισ 4 προςεγγίςεισ, που χρθςιμοποιοφν μόνο τον αρικμό των αποτελεςμάτων αναηιτθςθσ (WebPMI, WebOverlap, WebDice και WebJaccard). Ακολοφκωσ, εξάγονται λεξικό-ςυντακτικά μοτίβα από τισ περιλιψεισ, που υποδεικνφουν ςθμαςιολογικι ςυςχζτιςθ (πχ, A είναι Β, Α μζροσ του Β κ.ά.). Τζλοσ, δθμιουργείται ζνα διάνυςμα που ζχει ωσ ςτοιχεία τισ τιμζσ των 4 προςεγγίςεων και άλλεσ 200 τιμζσ που υποδεικνφουν τθν φπαρξθ θ μθ ενόσ λεξικόςυντακτικοφ μοτίβου ανάμεςα ςτισ δυο λζξεισ κλειδιά. Για να υπολογιςτεί θ τελικι εκτίμθςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ δυο λζξεων, το διάνυςμα αυτό ςυγκρίνεται με κάποια προεπεξεργαςμζνα διανφςματα, που αντιςτοιχοφν ςε ςυνϊνυμεσ και μθ λζξεισ. Θ τελικι τιμι πρόκειται για τθν πικανότθτα το διάνυςμα των λζξεων-κλειδιϊν να ανικει ςτθν ομάδα διανυςμάτων των ςυνϊνυμων λζξεων. Θ ςυςχζτιςθ με τουσ κριτζσ, των αποτελεςμάτων τθσ μεκόδου ςτο ςετ ςυνωνφμων των Miller-Charles, είναι 0,834, τιμι ιδιαίτερα υψθλι. Θ μζκοδοσ χρθςιμοποιικθκε επίςθσ, για τθν ςυςχζτιςθ των ονομάτων διαφόρων γνωςτϊν προςωπικοτιτων μεταξφ τουσ, αλλά και με το αντικείμενο τθσ εργαςίασ τουσ. Θ ςυςχζτιςθ με τουσ κριτζσ ςε αυτιν τθν περίπτωςθ ιταν 0,795. Θ μζκοδοσ SemSim παρουςιάηει ιδιαίτερα ενκαρρυντικά αποτελζςματα και εξαρτάται ουςιαςτικά, μόνο από τον αρικμό των αποτελεςμάτων που χρθςιμοποιοφνται για τθν εξαγωγι των λεξικό-ςυντακτικϊν μοτίβων. Οι ςυγγραφείσ διαπίςτωςαν, πωσ γενικά θ απόδοςθ αυξάνεται όςο αυξάνει ο αρικμόσ αυτόσ. Ζνα ςθμαντικό πικανό μειονζκτθμα τθσ μεκόδου, είναι ο χρόνοσ εκτζλεςθσ του ςχετικοφ αλγορίκμου, κακϊσ και ςε αυτιν τθν μζκοδο είναι απαραίτθτο να εκτελεςτοφν πολυάρικμεσ αναηθτιςεισ για κάκε ηευγάρι λζξεων Μέθοδοι που χρηςιμοποιούν το Διαδίκτυο Normalized Google Distance (NGD) Θ μζκοδοσ NGD (Cilibrasi & Vitanyi, 2007) αν και βαςίηεται ςε μια περίπλοκθ κεωρία (απόςταςθ πλθροφορίασ και πολυπλοκότθτα Kolmogorov), υλοποιείται με ιδιαίτερα απλό τρόπο. Αρχικά, πραγματοποιοφνται τρεισ αναηθτιςεισ ςε μια μθχανι αναηιτθςθσ, μια για κάκε λζξθ-κλειδί και μια για τισ δυο μαηί. Ο αρικμόσ των αποτελεςμάτων χρθςιμοποιείται ςε ζνα περίπλοκο τφπο, που προκφπτει από τθν παραπάνω κεωρία, με τον οποίο υπολογίηεται άμεςα θ ςθμαςιολογικι ςυςχζτιςθ των δυο λζξεων. Θ μζκοδοσ χρθςιμοποιικθκε επιτυχϊσ ςε ζνα πλικοσ ελζγχων για τον προςδιοριςμό τθσ απόδοςισ τθσ. Σε ςυνδυαςμό με ζναν αλγόρικμο ομαδοποίθςθσ διαχϊριςε λζξεισ που περιγράφουν χρϊματα από αυτζσ που περιγράφουν αρικμοφσ. Επίςθσ, διαχϊριςε τα ονόματα διαφόρων πινάκων ηωγραφικισ βάςει του δθμιουργοφ τουσ και τουσ τίτλουσ διαφόρων βιβλίων βάςει του αντίςτοιχου ςυγγραφζα. Τζλοσ, χρθςιμοποιικθκε για τθν αναγνϊριςθ διαφόρων καταςτάςεων 55

56 ζκτακτθσ ανάγκθσ, αναλόγωσ τθσ ςοβαρότθτασ τουσ και για τον διαχωριςμό των αρικμϊν ςε άρτιουσ και περιττοφσ. Στισ τελευταίεσ δυο εφαρμογζσ προθγικθκε κάποια προεπεξεργαςία, για να εκπαιδευτεί θ μζκοδοσ με ανάλογα παραδείγματα. Ζνα ςθμαντικό πλεονζκτθμα τθσ μεκόδου είναι θ ικανότθτα για άμεςθ εφαρμογι ςτθν ςφγκριςθ κειμζνων μικροφ μικουσ. Το κείμενο ι θ ζκφραςθ χρθςιμοποιείται απλϊσ ωσ λζξθ-κλειδί ςτισ παραπάνω αναηθτιςεισ. Θ ικανότθτα αυτι βζβαια περιορίηεται ςε μερικζσ μόλισ λζξεισ, κακϊσ για μεγαλφτερο αρικμό λζξεων αυξάνεται θ πικανότθτα επιςτροφισ μθδενικοφ αρικμοφ αποτελεςμάτων Semantic Similarity Kernel Θ προςζγγιςθ των (Sahami & Heilman, 2005) αποτελεί ακόμα μια μζκοδο που εκμεταλλεφεται τα αποτελζςματα μιασ μθχανισ αναηιτθςθσ. Θ ςυγκεκριμζνθ μζκοδοσ χρθςιμοποιεί μόνο δυο αναηθτιςεισ, μία για κάκε λζξθ κλειδί ι ζκφραςθ που μασ ενδιαφζρει. Ακολοφκωσ, επεξεργάηεται τα πρϊτα Ν αποτελζςματα, δθμιουργϊντασ ζνα διάνυςμα για κάκε αποτζλεςμα με ςτοιχεία τισ TFIDF (term frequency inverse document frequency) τιμζσ για τισ λζξεισ που εμφανίηονται ςτθν κάκε ιςτοςελίδα-αποτζλεςμα. Οι διαςτάςεισ των διανυςμάτων περιορίηονται ςτουσ Μ όρουσ με τα υψθλότερα βάρθ. Τα διανφςματα αυτά υπόκεινται ςτθν ςυνζχεια ςε μια απλι μακθματικι επεξεργαςία που οδθγεί ςτθν δθμιουργία δυο άλλων διανυςμάτων και τελικά, ςτθν εκτίμθςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ των δυο εκφράςεων ι λζξεων. Ουςιαςτικά, θ μζκοδοσ υπολογίηει μια πικανι επζκταςθ για κάκε αρχικι αναηιτθςθ, με τθν μορφι ενόσ διανφςματοσ που δθμιουργείται βάςει του γλωςςικοφ περιβάλλοντοσ του κάκε όρου που χρθςιμοποιείται ςτθν αναηιτθςθ. Στθν ςυνζχεια υπολογίηεται το εςωτερικό γινόμενο των δυο αυτϊν διανυςμάτων και το αποτζλεςμα αποτελεί τθν εκτίμθςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ. Για τθν εκτίμθςθ τθσ απόδοςθσ τθσ μεκόδου, οι ςυγγραφείσ διενζργθςαν τρεισ ελζγχουσ. Εξετάςτθκαν οι τιμζσ που επιςτρζφει θ μζκοδοσ για διάφορα ηευγάρια εκφράςεων. Συγκεκριμζνα, εξετάςτθκε θ ικανότθτα τθσ μεκόδου να αντιλαμβάνεται τθν ςχζςθ ανάμεςα ςτα ονόματα διαφόρων προςωπικοτιτων και των κζςεων εργαςίασ τουσ (πχ Google CEO, Larry Page), τθν ςχζςθ ανάμεςα ςε ακρωνφμια και τισ αντίςτοιχεσ ζννοιεσ και τθν ςχζςθ κάποιων διφοροφμενων όρων όπωσ πχ space exploration vs NASA και space travel vs vacation travel. Τα αποτελζςματα ιταν γενικά πολφ ενκαρρυντικά. Θ απόδοςθ τθσ μεκόδου εξαρτάται βζβαια από διάφορουσ παράγοντεσ. Εκτόσ από τουσ αρικμοφσ Ν και Μ, άλλοι παράγοντεσ είναι ο αλγόρικμοσ υπολογιςμοφ των βαρϊν TFIDF και το ποςοςτό του περιεχομζνου κάκε ιςτοςελίδασαποτελζςματοσ που χρθςιμοποιείται. Οι ςυγγραφείσ αναφζρουν πωσ πζτυχαν 56

57 ικανοποιθτικά αποτελζςματα χρθςιμοποιϊντασ Μ=50. Επίςθσ, ςθμειϊνουν πωσ αντί ολόκλθρου του κειμζνου, μπορεί να χρθςιμοποιθκεί θ περίλθψθ του κάκε αποτελζςματοσ που προςφζρουν οι μθχανζσ αναηιτθςθσ. Είναι ςαφζσ ότι θ βζλτιςτθ τιμι του παράγοντα Ν αλλάηει ςε αυτιν τθν περίπτωςθ Co-Occurrence Double Check (CODC) Οι (Chen, Lin, & Wei, 2006) παρουςιάηουν ςτθν εργαςία τουσ μια ενδιαφζρουςα μζκοδο που και αυτι εκμεταλλεφεται τισ ςφντομεσ περιλιψεισ των αποτελεςμάτων μιασ μθχανισ αναηιτθςθσ. Θ μζκοδοσ εξάγει ζνα ςυμπζραςμα για τθν ςθμαςιολογικι ςυςχζτιςθ δυο λζξεων, ανάλογα με τθν δυνατότθτα να βρεκεί θ λζξθ Α αναηθτϊντασ τθν Β, κακϊσ και το αντίςτροφο. Ρραγματοποιείται μια καταμζτρθςθ των εμφανίςεων τθσ λζξθσ Β, ςτισ περιλιψεισ των πρϊτων Ν αποτελεςμάτων τθσ αναηιτθςθσ για τθν λζξθ Α και μια καταμζτρθςθ των εμφανίςεων τθσ λζξθσ Α, κατά τθν αναηιτθςθ για τθν λζξθ Β. Οι ςυγγραφείσ χρθςιμοποίθςαν 5 διαφορετικοφσ μακθματικοφσ τφπουσ για τθν εκτίμθςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ των Α,Β βάςει των παραπάνω ςτοιχείων. Συμπζραναν πωσ το μζτρο CODC προςφζρει τθν καλφτερθ απόδοςθ και μεγαλφτερθ ςυνζπεια ςτα αποτελζςματα των πειραμάτων. Θ μζκοδοσ πζτυχε ςυςχζτιςθ με τουσ κριτζσ ςτο ςετ των 65 λζξεων των Rubenstein and Goodenough (Chen, Lin, & Wei, 2006). Χρθςιμοποιικθκε επίςθσ, επιτυχϊσ ςε άλλουσ τρεισ ελζγχουσ που ςχεδίαςαν οι ςυγγραφείσ και επικεντρϊνονται ςτθν άντλθςθ ςτοιχείων από το Διαδίκτυο. Οι παράγοντεσ που επθρεάηουν τθν απόδοςθ τθσ μεκόδου είναι ο αρικμόσ Ν των περιγραφϊν που χρθςιμοποιοφνται και μια ςτακερά a που χρθςιμοποιείται ςτον μακθματικό τφπο. Οι ςυγγραφείσ χρθςιμοποίθςαν τθν τιμι a=0.15 με ικανοποιθτικά αποτελζςματα ςε όλουσ τουσ ελζγχουσ, αλλά ςθμειϊνουν πωσ ο αρικμόσ Ν πρζπει να προςδιοριςτεί για τθν κάκε εφαρμογι Explicit Semantic Analysis (ESA) Οι (Gabrilovich & Markovich, 2007) προςεγγίηουν το πρόβλθμα τθσ ςθμαςιολογικισ ςυςχζτιςθσ από μια διαφορετικι και ιδιαιτζρωσ ενδιαφζρουςα πλευρά. Ακολουκϊντασ το δρόμο που άνοιξαν οι Strube and Ponzetto με τθν μζκοδο WikiRelate!, εκμεταλλεφονται τθν διαδικτυακι εγκυκλοπαίδεια Wikipedia για τον προςδιοριςμό τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ δυο λζξεων, εκφράςεων ι κειμζνων. Θ μζκοδοσ αναπαριςτά κάκε κείμενο ωσ ζνα διάνυςμα, τα ςτοιχεία του οποίου αναλογοφν ςε ζννοιεσ που εμφανίηονται ςτθν Wikipedia. Θ τελικι ςφγκριςθ γίνεται με τον ςυνθκιςμζνο τρόπο, δθλαδι με το ςυνθμίτονο των διανυςμάτων. 57

58 Συγκεκριμζνα, χρθςιμοποιείται ζνασ αλγόρικμοσ που αντιςτοιχεί το κάκε κείμενο ςε μια ταξινομθμζνθ, βάςει βάρουσ, λίςτα εννοιϊν τθσ Wikipedia. Το νόθμα ενόσ κειμζνου δθλαδι, ερμθνεφεται βάςει τθσ ςχζςθσ του με μια ςυλλογι εννοιϊν. Θ κάκε ζννοια αναπαριςτάται επίςθσ ωσ ζνα διάνυςμα, με ςτοιχεία διάφορεσ λζξεισ οι οποίεσ εμφανίηονται ςτο άρκρο τθσ Wikipedia που αναφζρεται ςτθν ςυγκεκριμζνθ ζννοια. Στα ςτοιχεία αυτά αποδίδεται ζνα βάροσ με τον γνωςτό TFIDF αλγόρικμο. Θ μζκοδοσ ςυγκρίνει το διάνυςμα του κάκε κειμζνου με τα διανφςματα των εννοιϊν ζτςι ϊςτε να δθμιουργθκεί το τελικό διάνυςμα για κάκε κείμενο. Θ ESA αξιολογικθκε βάςει τθσ απόδοςισ τθσ ςε δυο διαφορετικζσ δοκιμαςίεσ ςφγκριςθσ. Για τθν πρϊτθ δοκιμαςία, χρθςιμοποιικθκε θ ςυλλογι WordSimilarity που περιζχει 353 ηευγάρια λζξεων, ςτα οποία μια ομάδα κριτϊν ζχει αποδϊςει μια τιμι για τθν ομοιότθτά τουσ. Για τθν δεφτερθ δοκιμαςία, ζγινε χριςθ 50 εγγράφων από τθν υπθρεςία news τθσ εταιρείασ Australian Broadcasting Corporation, ςτα οποία αποδόκθκε επίςθσ μια τιμι ομοιότθτασ για κάκε ηευγάρι. Θ ςυςχζτιςθ των αποτελεςμάτων τθσ ESA με τουσ κριτζσ ιταν 0.75 για τθν πρϊτθ περίπτωςθ και 0.72 για τθν δεφτερθ, τιμζσ άκρωσ ικανοποιθτικζσ για το μζγεκοσ των ςυλλογϊν που χρθςιμοποιικθκαν. Θ μζκοδοσ παρουςιάηει ςθμαντικά πλεονεκτιματα, όπωσ θ χριςθ τθσ Wikipedia που αποτελεί μια διαρκϊσ ανανεωνόμενθ πθγι πλθροφοριϊν ζναντι ενόσ ςτατικοφ ςϊματοσ κειμζνου. Επιπρόςκετα, θ ESA είναι ικανι να εκτιμιςει τθν ςθμαςιολογικι ςυςχζτιςθ κειμζνων οποιουδιποτε μικουσ, ζνα χαρακτθριςτικό που ελάχιςτεσ άλλεσ μζκοδοι διακζτουν χωρίσ κάποια μετατροπι. Ενδεχόμενο μειονζκτθμα είναι ο αρχικόσ χρόνοσ προεπεξεργαςίασ των δεδομζνων τθσ Wikipedia. Εάν αυτόσ είναι είτε ςτο ίδιο επίπεδο, είτε μικρότεροσ από τον αντίςτοιχο χρόνο που χρειάηεται θ LSA για τθν ανάλυςθ ιδιοτιμϊν (SVD), τότε θ ESA αποτελεί ςαφϊσ μια υποψιφια εναλλακτικι για χριςθ ςτον AutoCardSorter Wikipedia Link-based Measure (WLM) Θ τρίτθ προςζγγιςθ που εκμεταλλεφεται τθν δομι τθσ Wikipedia, μετά τισ WikiRelate! και ESA, θ μζκοδοσ WLM (Milne & Witten, 2008), προςπακεί να επιτφχει ζναν ςυμβιβαςμό μεταξφ τθσ ποιότθτασ των αποτελεςμάτων και τθσ απόδοςθσ του αλγορίκμου. Ρροσ αυτιν τθν κατεφκυνςθ, οι ςυγγραφείσ εκμεταλλεφονται μόνο τισ ςυνδζςεισ μεταξφ των άρκρων τθσ Wikipedia, αντί ολόκλθρου του περιεχομζνου τουσ. Βαςικό ςτοιχείο τθσ μεκόδου είναι οι άγκυρεσ (anchors) τθσ Wikipedia, δθλαδι οι όροι και οι ζννοιεσ που πάντα πρζπει να ςυνδζονται με το αντίςτοιχο άρκρο. Τα ςτοιχεία αυτά χρθςιμοποιοφνται για τθν αντιςτοίχιςθ των δυο όρων που κζλουμε να ςυγκρίνουμε, με τθν ςχετικι ζννοια και τελικά το αντίςτοιχο άρκρο. Για τον ςκοπό αυτό χρθςιμοποιείται ζνασ ςυνδυαςμόσ δυο τεχνικϊν, τθσ NGD και μιασ 58

59 τεχνικισ που ςτθν ουςία τροποποιεί τον αλγόρικμο TFIDF, για χριςθ με τισ ςυχνότθτεσ ςυνδζςεων προσ ζνα άρκρο, παρά τισ ςυχνότθτεσ λζξεων ςε ζνα κείμενο. Για τον υπολογιςμό τθσ τελικισ εκτίμθςθσ, θ μζκοδοσ ακολουκεί μια πορεία κατά κάποιο τρόπο αντίςτροφθ τθσ ςυνθκιςμζνθσ. Αρχικά δθμιουργείται μια λίςτα με άρκρα που πικανϊσ να αντιςτοιχοφν ςτον κάκε όρο. Στθν ςυνζχεια υπολογίηεται θ ςχζςθ μεταξφ όλων αυτϊν των άρκρων με τισ δυο τεχνικζσ που προαναφζραμε. Τζλοσ, γνωρίηοντασ τισ παραπάνω τιμζσ, γίνεται θ τελικι επιλογι του άρκρου που αντιςτοιχεί ςτον κάκε όρο χρθςιμοποιϊντασ μια ςειρά κριτθρίων. Θ εκτίμθςθ τθσ αποδοτικότθτασ τθσ μεκόδου ζγινε με τρεισ ελζγχουσ ςφγκριςθσ. Τα ςετ Miller-Charles, Rubenstein-Goodenough και WordSimilarity-353 χρθςιμοποιικθκαν και οι αντίςτοιχεσ ςυςχετίςεισ με τουσ κριτζσ που πζτυχε θ WLM ιταν 0.70, 0.64 και Οι ςυγγραφείσ ςθμειϊνουν πωσ το ςθμαντικότερο πλεονζκτθμα τθσ μεκόδου είναι θ χριςθ ενόσ πολφ μικρότερου όγκου δεδομζνων, όπωσ επίςθσ και ο μικρότεροσ χρόνοσ προεπεξεργαςίασ, ςυγκριτικά με τθν ESA. Θ μζκοδοσ φυςικά προορίηεται μόνο για ςφγκριςθ δυο όρων. Για τθν ςφγκριςθ κειμζνων είναι απαραίτθτο ακόμα ζνα βιμα, όπωσ πχ θ τεχνικι Wikification (Mihalcea & Csomai, Wikify!: linking documents to encyclopedic knowledge, 2007) Επεκτείνοντασ τισ μεθόδουσ για ςύγκριςη κειμένων Ρροτοφ προχωριςουμε ςτθν αξιολόγθςθ των μεκόδων, παρουςιάηουμε οριςμζνεσ τεχνικζσ που μπορoφν να εφαρμοςτοφν για τθν επζκταςθ των μεκόδων ςτθν ςφγκριςθ κειμζνων. Θ πιο απλι ίςωσ τεχνικι είναι αυτι τθσ διανυςματικισ αναπαράςταςθσ. Σφμφωνα με αυτιν, οι λζξεισ ενόσ κειμζνου αναπαριςτϊνται από διανφςματα, τα ςτοιχεία των οποίων υποδεικνφουν μια ςχζςθ (πχ τθν ςθμαςιολογικι ςυςχζτιςθ) ανάμεςα ςτθν κάκε λζξθ και ζναν αρικμό από λζξεισ που εμφανίηονται ςε ζνα ςϊμα κειμζνου. Λδανικά, οι διαςτάςεισ του διανφςματοσ ιςοφνται με τον αρικμό των διαφορετικϊν λζξεων που εμφανίηονται ςτο ςϊμα κειμζνου. Οι (Bullinaria & Levy, 2006) ςθμειϊνουν όμωσ, πωσ ζνα ςϊμα κειμζνου που περιζχει περίπου 90 εκατομμφρια λζξεισ, αντιςτοιχεί ςε περίπου διαφορετικζσ λζξεισ. Συνεπϊσ, οι διαςτάςεισ περιορίηονται, κρατϊντασ μόνο τισ ςυχνότερεσ λζξεισ προκειμζνου να αυξθκεί θ ταχφτθτα του αλγορίκμου και οι απαιτιςεισ ςε μνιμθ. Τα κείμενα τζλοσ, αναπαριςτϊνται επίςθσ ωσ διανφςματα τα οποία είναι απλϊσ ο μζςοσ όροσ των διανυςμάτων των λζξεων που περιζχονται ςτο κάκε κείμενο. Θ τεχνικι αυτι χρθςιμοποιείται από τουσ (Bullinaria & Levy, 2006) ςτθν μζκοδο Positive PMI Cosine. 59

60 Μια πιο άμεςθ τεχνικι είναι να μετρθκεί θ ςθμαςιολογικι ςυςχζτιςθ μεταξφ όλων των πικανϊν ςυνδυαςμϊν των λζξεων των δυο κειμζνων που κζλουμε να ςυγκρίνουμε. Το κανονικοποιθμζνο άκροιςμα όλων των τιμϊν αναπαριςτά ςτθν ςυνζχεια τθν ςθμαςιολογικι ςυςχζτιςθ των δυο κειμζνων. Τζλοσ, οι (Veksler, Govostes, & Gray, 2008) παρουςιάηουν ςτθν εργαςία τουσ τθν μζκοδο VGEM, μια τεχνικι που χρθςιμοποιεί μόνο 300 προκακοριςμζνεσ διαςτάςεισ (λζξεισ) για τθν διανυςματικι αναπαράςταςθ των κειμζνων. Τα ςτοιχεία του διανφςματοσ μιασ λζξθσ είναι θ ςθμαςιολογικι ςυςχζτιςθ μεταξφ τθσ λζξθσ και των 300 προκακοριςμζνων λζξεων, θ οποία υπολογίηεται κανονικά βάςει ενόσ ςϊματοσ κειμζνου. Ρολλζσ μζκοδοι βζβαια που χρθςιμοποιοφν αναηθτιςεισ ςτο Διαδίκτυο, ζχουν τθν δυνατότθτα να εκτιμιςουν τθν ςθμαςιολογικι ςυςχζτιςθ μεταξφ μικρϊν κειμζνων. Το μικρό κείμενο χρθςιμοποιείται απλϊσ ωσ όροσ αναηιτθςθσ. Σε αυτιν τθν περίπτωςθ βζβαια είναι απαραίτθτο να ερευνθκεί μζχρι πόςουσ όρουσ μπορεί να ζχει το κείμενο, χωρίσ να μειϊνεται θ ακρίβεια τθσ μεκόδου Συγκριτική αξιολόγηςη των μεθόδων Γίνεται φανερό από τθν παραπάνω παρουςίαςθ, πωσ κάκε μζκοδοσ παρουςιάηει οριςμζνα πλεονεκτιματα και οριςμζνα μειονεκτιματα. Επίςθσ διαπιςτϊνουμε, ότι τα κυριότερα μειονεκτιματα και πλεονεκτιματα ςχετίηονται περιςςότερο με τθν χριςθ του Διαδικτφου ι ενόσ ςϊματοσ κειμζνου, παρά με τισ ιδιαιτερότθτεσ τθσ κάκε μεκόδου. Για τθν περαιτζρω διαςαφινιςθ των αρνθτικϊν και κετικϊν ςτοιχείων των μεκόδων, παρακζτουμε τα ευριματα τριϊν εργαςιϊν ςτισ οποίεσ οι ςυγγραφείσ ςυνζκριναν διάφορεσ μεκόδουσ. Στθν εργαςία (Budiu, Royer, & Pirolli, 2007) οι ςυγγραφείσ εξάγουν ςυμπεράςματα ςχετικά με τθν απόδοςθ τριϊν μεκόδων (PMI, LSA, GLSA) ςυναρτιςει των ςωμάτων κειμζνων που χρθςιμοποιοφν. Θ μζκοδοσ GLSA δεν ςυμπεριλαμβάνεται ςτθν παρουςίαςθ μασ, κακϊσ γενικά παρουςιάηει τα ίδια προβλιματα με τθν LSA, δθλαδι το ςτατικό ςϊμα κειμζνου και τθν δυςκολία ανανζωςισ του. Ρολφ γενικά, κα λζγαμε πωσ θ GLSA ςυνδυάηει τισ μεκόδουσ LSA και PMI.Τα γενικά ςυμπεράςματα τθσ εργαςίασ είναι πωσ θ PMI μζκοδοσ αποδίδει καλφτερα ςτουσ ελζγχουσ ομοιότθτασ λζξεων και θ GLSA ςτα ςετ ςυνωνφμων, ενϊ θ PMI είναι θ μόνθ που επωφελείται αιςκθτά από ζνα μεγαλφτερο ςϊμα κειμζνου. Οι ςυγγραφείσ τονίηουν επίςθσ τον ςθμαντικό ρολό που ζχει το είδοσ του ςϊματοσ κειμζνου ςτθν απόδοςθ των μεκόδων. Ππωσ χαρακτθριςτικά αναφζρουν, εάν χρθςιμοποιείται ζνα ςϊμα κειμζνου αποτελοφμενο μόνο από κείμενα ςχετικά με τθν επιςτιμθ των υπολογιςτϊν, είναι αρκετά πικανό να προκφψει μεγάλθ 60

61 ομοιότθτα μεταξφ των λζξεων apple και computer, ενϊ ςτθν πραγματικότθτα θ ςχζςθ των λζξεων είναι πολφ αςκενζςτερθ. Τζλοσ, ςθμειϊνεται πωσ θ PMI είναι θ αποδοτικότερθ τεχνικι, όςον αφορά τθν εκτζλεςθ του αλγορίκμου, κακϊσ εφαρμόηεται εφκολα ςε μεγάλα ςϊματα κειμζνου, τα οποία μάλιςτα είναι δυνατό να ανανεωκοφν με τθν ίδια ευκολία. Μια ακόμα ιδιαίτερα ενδιαφζρουςα εργαςία, είναι αυτι των (Mihalcea, Corley, & Strapparava, 2006). Στθν εργαςία αυτι οι ςυγγραφείσ προτείνουν ζναν γενικό τρόπο για τθν επζκταςθ των μεκόδων, ζτςι ϊςτε να είναι δυνατι θ ςφγκριςθ μικρϊν κειμζνων. Αρχικά υπολογίηονται οι ςθμαςιολογικζσ ςχζςεισ μεταξφ κάκε λζξθσ του κειμζνου Α και κάκε λζξθσ του κειμζνου Β. Στθν ςυνζχεια, για κάκε λζξθ του κειμζνου Α, εντοπίηεται θ λζξθ του κειμζνου Β με τθν μεγαλφτερθ ςυςχζτιςθ. Θ διαδικαςία αυτι ακολουκείται και αντιςτρόφωσ, από το κείμενο Β ςτο Α. Οι τιμζσ για τα πιο όμοια ηευγάρια, αφοφ τροποποιθκοφν αναλόγωσ, βάςει τθσ ςπανιότθτασ των λζξεων, ακροίηονται και κανονικοποιοφνται με το μικοσ του κάκε κειμζνου. Τζλοσ, υπολογίηεται ο μζςοσ όρων των δυο τιμϊν που προκφπτουν, ο οποίοσ αποτελεί και τθν τελικι εκτίμθςθ τθσ ςθμαςιολογικισ ςυςχζτιςθσ των κειμζνων. Για τον υπολογιςμό τθσ ςυςχζτιςθσ μεταξφ των λζξεων των δυο κειμζνων, οι ςυγγραφείσ χρθςιμοποίθςαν οκτϊ διαφορετικζσ μεκόδουσ, τθν LSA, τθν PMI-IR και ζξι μεκόδουσ που βαςίηονται ςτθν γλωςςολογικι δομι WordNet. Θ ακρίβεια όλων των μεκόδων βρζκθκε ςτα ίδια επίπεδα παρ όλεσ τισ επιμζρουσ διαφορζσ τουσ. Το γεγονόσ αυτό, υποδεικνφει πωσ οι διαφορζσ των μεκόδων ενδεχομζνωσ να εξαλείφονται ςτθν ςφγκριςθ κειμζνων. Το ςυμπζραςμα αυτό είναι πολφ ςθμαντικό για τον ςκοπό μασ, κακϊσ μασ επιτρζπει να εςτιάςουμε τθν προςοχι ςε άλλουσ παράγοντεσ και όχι ςτισ ακριβείσ τιμζσ που πετυχαίνουν οι διάφορεσ μζκοδοι ςτισ ςυγκρίςεισ μεμονωμζνων λζξεων. Θ ιδζα των (Mihalcea, Corley, & Strapparava, 2006) επεκτείνεται ςτθν εργαςία των (Islam & Inkpen, 2008), όπου οι ςυγγραφείσ προτείνουν ζναν ακόμα τρόπο για τον υπολογιςμό τθσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ δυο κειμζνων. Χρθςιμοποίθςαν ζναν ςυνδυαςμό τριϊν αλγορίκμων, κάκε ζνασ από τουσ οποίουσ, βαςίηεται αντίςτοιχα ςτθν ομοιότθτα των γλωςςικϊν ςτοιχείων, τθν ομοιότθτα των λζξεων και τθν ςυντακτικι ομοιότθτα, πετυχαίνοντασ ικανοποιθτικά αποτελζςματα. Ο αλγόρικμοσ που βαςίηεται ςτθν ομοιότθτα λζξεων χρθςιμοποιεί τθν μζκοδο SOC- PMI, αντί τθσ PMI-IR. Θ αποδοτικότθτα τθσ μεκόδου των (Islam & Inkpen, 2008) (STS), εκτιμικθκε από τθν ακρίβεια που πζτυχε ςτθν ςφγκριςθ 30 ηευγαριϊν προτάςεων (0,853 ςυςχζτιςθ) και ςτθν αναγνϊριςθ των ςωςτϊν παραφράςεων ςε ζνα δείγμα 1725 ηευγαριϊν (72,6%). Οι ςυγγραφείσ ςθμειϊνουν πωσ αν και θ ακρίβεια τθσ μεκόδου είναι παραπλιςια με αυτι τθσ μεκόδου των (Mihalcea, Corley, & Strapparava, 2006), (70,3%), θ μζκοδοσ STS είναι ταχφτερθ, κακϊσ δεν χρθςιμοποιεί 8 τεχνικζσ, αλλά μόνον μία. Είναι πικανόν όμωσ, θ μζκοδοσ των 61

62 (Mihalcea, Corley, & Strapparava, 2006) να αποδίδει εξίςου καλά, χρθςιμοποιϊντασ μόνον μία μζκοδο, όπωσ τθν SOC-PMI. Αναφζρουμε ενδεικτικά πωσ χρθςιμοποιϊντασ μόνο τθν μζκοδο PMI-IR, πζτυχε ακρίβεια 69,9%. Οι μικρζσ αυτζσ διαφορζσ ςτα ποςοςτά, ίςωσ να μθν ζχουν ορατά αποτελζςματα ςε μια προςομοίωςθ ταξινόμθςθσ καρτϊν, όπου εμπλζκονται και άλλοι παράγοντεσ όπωσ ο αλγόρικμοσ ςυγκρότθςθσ ομάδων (clustering). Ενδιαφζροντα ςυμπεράςματα προκφπτουν επίςθσ από τθν εργαςία των (Reccia & Jones, 2008). Τα ευριματα τθσ εργαςίασ υποδεικνφουν για ακόμα μια φορά τθν καταλλθλότθτα τθσ τεχνικισ PMI ςτισ εκτιμιςεισ ςθμαςιολογικισ ςυςχζτιςθσ. Μια ιδιαίτερα ςθμαντικι παρατιρθςθ που προκφπτει από τθν εργαςία, είναι θ υπεροχι τθσ τεχνικισ PMI-Wiki, ςυγκριτικά με τθν PMI.W. Ραρατθρείται δθλαδι, πωσ θ ζκδοςθ τθσ PMI που εξάγει ςυμπεράςματα από το ςϊμα κειμζνου τθσ Wikipedia, υπερτερεί τθσ ζκδοςθσ που χρθςιμοποιεί διαδικτυακι αναηιτθςθ ςτον δικτυακό τόπο τθσ Wikipedia. Τζλοσ, ιδιαίτερα κρίςιμα ςυμπεράςματα που αφοροφν άμεςα τθν εφαρμογι που μασ ενδιαφζρει, παρουςιάηουν οι (Lindsey, Veksler, Grintsvayg, & Gray, 2007). Στθν εργαςία τουσ αυτι, οι ςυγγραφείσ ανάλυςαν τθν ςθμαςία που ζχει θ επιλογι ενόσ ςωςτοφ ςϊματοσ κειμζνου ςτθν απόδοςθ δφο δθμοφιλϊν μεκόδων, των PMI και NGD. Τα αποτελζςματα τθσ εργαςίασ υποδεικνφουν πωσ και οι δυο μζκοδοι παρουςιάηουν μεγαλφτερθ ακρίβεια με ζνα ςχετικά μικρό αλλά ποιοτικό ςϊμα κειμζνου, παρά με όλο το Διαδίκτυο. Συμπεραίνεται επίςθσ, πωσ θ ακρίβεια μεταβάλλεται ςθμαντικά ανάλογα με το ςϊμα κειμζνου που χρθςιμοποιείται. Αναφζρουμε ενδεικτικά τθν ακραία περίπτωςθ τθσ μεκόδου PMI όπου παρουςιάηεται διαφορά 24,1% ςτθν ακρίβεια, χρθςιμοποιϊντασ δυο διαφορετικά ςϊματα κειμζνου (Project Gutenberg, NY Times). Το γεγονόσ αυτό είναι κρίςιμο κακϊσ, εκτόσ από τθν ακρίβεια, θ επιλογι ενόσ μικρότερου ςϊματοσ κειμζνου αυξάνει και τθν ταχφτθτα εκτζλεςθσ των αλγορίκμων. Με δεδομζνα τα παραπάνω, οι ςυγγραφείσ ςθμειϊνουν πωσ ςε κάκε εφαρμογι κα πρζπει να δίνεται ζμφαςθ ςτισ ςυγκεκριμζνεσ ιδιαιτερότθτεσ του προβλιματοσ και όχι ςτισ λεπτομζρειεσ τθσ κάκε μεκόδου. Συμμεριηόμαςτε αυτιν τθν άποψθ και για αυτόν τον λόγο επιλζξαμε ςτο παρϊν κεφάλαιο να δοκεί ζμφαςθ ςτισ ιδιαιτερότθτεσ τθσ εφαρμογισ που μασ ενδιαφζρει και όχι ςτισ διαδικαςτικζσ λεπτομζρειεσ τθσ κάκε μεκόδου. Θ άποψθ αυτι ενιςχφεται και από τισ παρατθριςεισ που προκφπτουν από τουσ πίνακεσ που παρουςιάηονται ςτθν ςυνζχεια. 62

63 TOEFL ESL Reader s Digest LSA Positive PMI SOC-PMI PMI-IR LC-IR LSA-IR Πίνακασ 8 Επιδόςεισ μεθόδων ςε τεςτ ςυνωνφμων Rubenstein- Miller-Charles WordSimilarity-353 Goodenough LSA SOC-PMI PMI-IR FusionPMI SemSim CODC Sahami WebPMI ESA WLM Πίνακασ 9 Επιδόςεισ μεθόδων ςτα τεςτ ςημαςιολογικήσ ςυςχζτιςησ Στουσ πίνακεσ αυτοφσ, παρουςιάηονται ςυγκεντρωμζνεσ οι επιδόςεισ διαφόρων μεκόδων ςτα ζξι ςετ ςυνωνφμων, που ζχουν πλζον κακιερωκεί ςτθν ερευνθτικι κοινότθτα. Κα πρζπει να ςθμειϊςουμε, πωσ διαφορετικζσ εργαςίεσ παρουςιάηουν διαφορετικζσ τιμζσ ςε οριςμζνεσ περιπτϊςεισ. Αυτό πικανϊσ εξθγείται από τθν ςυνειδθτι ι τυχαία μεταβολι οριςμζνων παραγόντων κατά τθν διενζργεια των πειραμάτων. Από τον πρϊτο πίνακα παρατθροφμε πωσ θ μζκοδοσ LSA-IR πετυχαίνει ςαφϊσ τα καλφτερα αποτελζςματα, ενϊ θ μζκοδοσ LC-IR ζρχεται δεφτερθ με επίςθσ ικανοποιθτικά αποτελζςματα. Είναι προφανισ επίςθσ θ αδυναμία τθσ LSA να ανταποκρικεί με επιτυχία ςτα ςυγκεκριμζνα ςετ ςυνωνφμων. Δυςτυχϊσ, για τθν μζκοδο Positive PMI υπάρχουν αποτελζςματα μόνο για το ζνα ςετ, ςτο οποίο όμωσ πετυχαίνει ιδιαίτερα υψθλι απόδοςθ. Στον δεφτερο πίνακα ςθμειϊνουμε αρχικά τθν απουςία αποτελεςμάτων για αρκετζσ από τισ μεκόδουσ. Πςον αφορά το τεςτ ςυνωνφμων Miller-Charles παρατθροφμε πωσ οι περιςςότερεσ μζκοδοι πετυχαίνουν ικανοποιθτικά αποτελζςματα. Τθν χαμθλότερθ απόδοςθ ςθμειϊνουν οι μζκοδοι FusionPMI, Sahami και WebPMI, ενϊ τθν υψθλότερθ οι μζκοδοι SemSim, PMI-IR και SOC-PMI. Από τισ μεκόδουσ που διακζτουμε αποτελζςματα και για τα τρία ςετ, διακρίνουμε τισ ESA και PMI-IR. Θ μζκοδοσ SOC-PMI πετυχαίνει επίςθσ ικανοποιθτικά αποτελζςματα ςε δυο από τα τρία ςετ ςυνωνφμων. 63

64 Το ςθμαντικότερο ςυμπζραςμα που προκφπτει από τουσ παραπάνω πίνακεσ, είναι ότι αρκετζσ μζκοδοι παρουςιάηουν παραπλιςια αποτελζςματα, τα οποία μάλιςτα κρίνονται ικανοποιθτικά. Θ προτίμθςθ κάποιασ ςυγκεκριμζνθσ μεκόδου όμωσ, δεν μπορεί να βαςιςτεί ςε αυτά τα δεδομζνα, κακϊσ, αφενόσ μεν αφοροφν ςυγκρίςεισ μεταξφ μεμονωμζνων λζξεων και όχι κειμζνων και αφετζρου, υπάρχουν παράγοντεσ πολφ ςθμαντικότεροι, όπωσ θ ταχφτθτα εκτζλεςθσ του αλγορίκμου, το μζγεκοσ των δεδομζνων που απαιτοφνται για επεξεργαςία, θ δυνατότθτα ανανζωςθσ των δεδομζνων και φυςικά θ δυνατότθτα ςφγκριςθσ μεταξφ κειμζνων. Με βάςθ τουσ παραπάνω παράγοντεσ παρουςιάηουμε ςτον παρακάτω πίνακα τισ ςχετικζσ προςωπικζσ μασ εκτιμιςεισ για τθν κάκε μζκοδο. Ταχφτητα Αλγορίθμου Ανανζωςη Σ.Κ Όγκοσ Δεδομζνων Σφγκριςη Κειμζνων LSA Corpus Χρονοβόρα Σϊμα Κειμζνου Άμεςθ/Γριγορθ Processing NLS Corpus Εφικτι Σϊμα Κειμζνου Άμεςθ/Γριγορθ Processing ESA Corpus Εφικτι Σϊμα Κειμζνου Άμεςθ/Γριγορθ Processing Positive PMI Corpus Εφικτι Σϊμα Κειμζνου Άμεςθ/Γριγορθ Processing PMI-Corpus Corpus Εφικτι Σϊμα Κειμζνου Εφικτι/Γριγορθ Processing SOC-PMI Corpus Εφικτι Σϊμα Κειμζνου Εφικτι/Γριγορθ Processing WLM Corpus Εφικτι Wikipedia Link Εφικτι/Άγνωςτθ Processing Data LSA-IR Web Search Αυτόματθ - Εφικτι/Άγνωςτθ CODC Web Search Αυτόματθ - Εφικτι/Άγνωςτθ FusionPMI Web Search Αυτόματθ - Εφικτι/Άγνωςτθ SemSim Web Search Αυτόματθ - Εφικτι/Άγνωςτθ Sahami Web Search Αυτόματθ - Εφικτι/Άγνωςτθ PMI-Web Web Search Αυτόματθ - Εφικτι/Άγνωςτθ NGD Web Search Αυτόματθ - Εφικτι/Άγνωςτθ Πίνακασ 10 Επεξθγιςεισ Οι όροι Corpus Processing και Web Search αναφζρονται ςτο βαςικό ςτοιχείο του αλγορίκμου κάκε μεκόδου, που καταναλώνει υπολογιςτικοφσ πόρουσ. Οι αλγόρικμοι που πραγματοποιοφν αναηθτιςεισ ςτο Διαδίκτυο εξαρτώνται από τθν ταχφτθτα τθσ μθχανισ αναηιτθςθσ και τθν ταχφτθτα ςφνδεςθσ με το Διαδίκτυο και ςυνεπώσ επθρεάηονται ανά πάςα ςτιγμι από τθν υπερφόρτωςθ των δικτφων που χρθςιμοποιοφνται. Οι αλγόρικμοι που επεξεργάηονται ζνα ςώμα κειμζνου, εξαρτώνται μόνο από το μζγεκοσ του ςώματοσ κειμζνου. Η τρίτθ ςτιλθ αναφζρεται ςτον όγκο δεδομζνων που διαχειρίηεται ο κάκε αλγόρικμοσ και ςυνεπώσ απαιτείται να είναι διακζςιμοσ ςτον δίςκο του υπολογιςτι ςτον οποίο εκτελοφνται οι αλγόρικμοι. 64

65 5. Συμπερα ςματα και Μελλόντικε σ Κατευθυ νςεισ 5.1. Σχολιαςμόσ των Αποτελεςμάτων των Πειραματικών Μελετών Συμπεράςματα μελέτησ AutoCardSorter ταξινόμηςησ καρτών ανοικτού τύπου Τα αποτελζςματα τθσ μελζτθσ μασ ςυμβαδίηουν με αυτά των αντίςτοιχων προθγοφμενων μελετϊν (Katsanos, Tselios, & Avouris, 2008). Ο βακμόσ ςυςχζτιςθσ μάλιςτα, κινείται ςε πολφ κοντινά επίπεδα με τουσ βακμοφσ των δυο μελετϊν, κατά τισ οποίεσ ζγινε επίςθσ χριςθ των προγραμμάτων EzSort, EzCalc και οι ςυμμετζχοντεσ ςτθν μελζτθ ιταν όλοι φοιτθτζσ του τμιματοσ. Είναι φανερό, πωσ παρότι ο βακμόσ ςυςχζτιςθσ δεν είναι τόςο ςθμαντικόσ όςο ςτθν πρϊτθ μελζτθ των (Katsanos, Tselios, & Avouris, 2008) (r=0,80), θ προκφπτουςα κατθγοριοποίθςθ είναι πρακτικά ίδια και για τισ δυο μεκόδουσ. Σε αυτιν τθν 4 θ μελζτθ ςφγκριςθσ με τθν ανοικτι μζκοδο ταξινόμθςθσ, υπάρχει μάλιςτα απόλυτθ ταφτιςθ τουσ. Ραρατθρείται δθλαδι ότι θ προτεινόμενθ μζκοδοσ είναι ικανι να προςφζρει αποδοτικι και αποτελεςματικι υποςτιριξθ ςτθν διαμόρφωςθ τθσ πλθροφοριακισ δομισ μιασ ιςτοςελίδασ. Πςον αφορά τθ ςυγκεκριμζνθ περίπτωςθ τθσ εφαρμογισ τθσ προτεινόμενθσ μεκόδου για ομαδοποίθςθ ειδθςεογραφικϊν άρκρων, ζγινε αντιλθπτό πωσ θ ανάλυςθ βάςει των τίτλων των άρκρων δεν προςφζρει αποδεκτά αποτελζςματα. Επίςθσ, δεδομζνου ότι οι περιγραφζσ των άρκρων δεν τροποποιικθκαν αιςκθτά, προκφπτει πωσ θ ανάλυςθ με το AutoCardSorter δεν απαιτεί απαραίτθτα κάποια επεξεργαςία των άρκρων πριν τθν ειςαγωγι τουσ ςτο εργαλείο. Τζλοσ, θ επιλογι τθσ 1 θσ παραγράφου του κάκε άρκρου για περιγραφι τθσ αντίςτοιχθσ κάρτασ φαίνεται πωσ επαρκεί για τθν παραγωγι αξιόπιςτων αποτελεςμάτων. Για τθν ακρίβεια, προτείνεται να γίνεται επιλογι τθσ παραγράφου που χρθςιμεφει ωσ περίλθψθ του νοιματοσ του άρκρου, θ οποία είναι ςυνικωσ θ 1 θ ι θ 2 θ παράγραφοσ και μπορεί εφκολα να εντοπιςτεί. Φυςικά, είναι ςαφζσ ότι κα πρζπει να διερευνθκεί περαιτζρω πιο είναι το ιδανικό μζγεκοσ αποςπάςματοσ και αν πρζπει να γίνεται ςυγκεκριμζνθ επιλογι ι απλϊσ να επιλζγονται αυτόματα οι πρϊτεσ Ν λζξεισ του άρκρου. 65

66 Συμπεράςματα 1ησ ςυγκριτικήσ μελέτησ AutoCardSorter ταξινόμηςησ καρτών κλειςτού τύπου Τα αποτελζςματα των ςυγκριτικϊν μελετϊν με τθν μζκοδο ταξινόμθςθσ καρτϊν κλειςτοφ τφπου ιταν ςε ςθμαντικό βακμό χειρότερα των αντίςτοιχων μελετϊν ανοικτοφ τφπου και γενικά μθ ικανοποιθτικά. Θ πρϊτθ παρατιρθςθ που ζγινε κατά τθν διεξαγωγι τθσ μελζτθσ, αφορά ςτθν επιλογι του ςθμαςιολογικοφ χϊρου που χρθςιμοποιείται με τθν μζκοδο ταξινόμθςθσ βάςει τθσ LSA. Ζγινε φανερό, πωσ το ςυγκεκριμζνο ςϊμα κειμζνων δεν περιζχει ςθμαντικό αρικμό λζξεων που ςυναντϊνται ςτα άρκρα. Οι λζξεισ αυτζσ είναι μεγάλθσ ςθμαςιολογικισ βαρφτθτασ (οικονομικοί όροι, ονόματα πολιτικϊν, τεχνικοί όροι) και χρθςιμοποιοφνται ευρφτατα κατά τθν αρκρογραφία. 7 Αυτό κρίνεται ιδιαίτερα ςθμαντικό, κακϊσ είναι γνωςτό πωσ θ απόδοςθ τθσ LSA μειϊνεται ςθμαντικά, όταν οι λζξεισ προσ ςυςχζτιςθ είναι ςπάνιεσ ςτο ςϊμα κειμζνων που χρθςιμοποιεί (Katsanos C. T., 2008), πόςο μάλλον όταν αυτζσ απουςιάηουν εντελϊσ. Μια πρϊτθ ςκζψθ λοιπόν, είναι ότι για τθν ςυγκεκριμζνθ κεματικι ενότθτα πρζπει να επιλεγεί ζνα καταλλθλότερο ςϊμα κειμζνων. Στο επόμενο κεφάλαιο ακολουκεί μια ςφντομθ παρουςίαςθ οριςμζνων ςυλλογϊν από κείμενα που κρίνονται καταλλθλότερα για τθν ςυγκεκριμζνθ κεματικι ενότθτα. Πςον αφορά τισ μετριςεισ, παρατθρικθκε πωσ παρότι υπάρχει ζνασ βακμόσ ςυςχζτιςθσ μεταξφ των πινάκων ομοιότθτασ, θ τελικι κατθγοριοποίθςθ των άρκρων με τθν LSA απζχει ςθμαντικά από αυτιν που επζλεξαν οι χριςτεσ. Αυτό ιταν ωσ ζνα βακμό αναμενόμενο κακϊσ, κατά τθν μελζτθ κλειςτοφ τφπου πραγματοποιικθκε ςθμαςιολογικι ςφγκριςθ μεταξφ των περιγραφϊν των κατθγοριϊν, μιασ λζξθσ δθλαδι και των επιλεγμζνων άρκρων. Είναι προφανζσ ότι είναι πιο αξιόπιςτθ για τον LSA αλγόρικμο θ ςθμαςιολογικι ςυςχζτιςθ δυο κειμζνων, όπωσ ςυμβαίνει ςτθν ανοικτοφ τφπου ταξινόμθςθ, από τθν ςυςχζτιςθ μιασ λζξθσ με ζνα κείμενο. Ραρόλα αυτά, ο βακμόσ ςυςχζτιςθσ των αποτελεςμάτων του εργαλείου με αυτά των μελετϊν ταξινόμθςθσ καρτϊν κλειςτοφ-τφπου ιταν ςθμαντικόσ, κάτι που δίνει ελπίδεσ για καλφτερα αποτελζςματα ςτο μζλλον. Ρικανότερθ αιτία για αυτό είναι ο ακατάλλθλοσ ςθμαςιολογικόσ χϊροσ που χρθςιμοποιείται για τθ κεματικι κατθγορία τθσ μελζτθσ, για τουσ λόγουσ που προαναφζρκθκαν. Ζνασ επιπλζον παράγοντασ είναι θ γενικότθτα των εννοιϊν που περιγράφουν τισ κατθγορίεσ. Ζννοιεσ όπωσ news, community, Europe κτλ είναι πολφ ευρείεσ και θ γενικότθτα αυτι είναι πολφ πικανό να επθρζαςε αρνθτικά τα αποτελζςματα. Επιπρόςκετα, οι περιγραφζσ των κατθγοριϊν υποφζρουν από τα ίδια προβλιματα που παρουςιάςτθκαν ςτθν κατθγοριοποίθςθ βάςει τίτλων. Ρεριγραφζσ όπωσ οι community, news, Greece και world, γίνονται απολφτωσ 7 πχ Obama, Euro, Internet 66

67 κατανοθτζσ από τουσ αναγνϊςτεσ, αλλά επθρεάηουν αρνθτικά το AutoCardSorter, κακϊσ οι όροι αυτοί δεν ςχετίηονται ςθμαςιολογικά με αντίςτοιχα άρκρα. Γίνεται κατανοθτό ακόμα, πωσ οι παραπάνω ζννοιεσ αποκτοφν διαφορετικι ςθμαςία ανάλογα με τθν εκνικότθτα των αναγνωςτϊν. Τζλοσ, παρατθρικθκε πωσ πρόβλθμα αποτζλεςε και θ ςτενι ςθμαςιολογικι ςχζςθ μεταξφ οριςμζνων κατθγοριϊν, όπωσ για παράδειγμα των Entertainment και Arts & Culture. Από τα ςυνολικά 7 άρκρα που τοποκετικθκαν λανκαςμζνα ςτθν κατθγορία Entertainment, οι χριςτεσ είχαν τοποκετιςει τα 4 ςτθν κατθγορία Arts & Culture. Αυτό δείχνει πωσ κατθγορίεσ με παρόμοιο ςθμαςιολογικό περιεχόμενο ι υποκατθγορίεσ, φαίνεται να αποτελοφν πρόβλθμα για τθν LSA. Θ παραπάνω παρατιρθςθ εξθγεί επίςθσ και τον λόγο για τον οποίο ο βακμόσ ςυςχζτιςθσ βρζκθκε μικρότεροσ για τθν ιςτοςελίδα BBC news Συμπεράςματα 2 ησ μελέτησ AutoCardSorter ταξινόμηςη καρτών κλειςτού τύπου Σε αυτιν τθν μελζτθ τα αποτελζςματα ιταν χειρότερα όςον αφορά τουσ πίνακεσ ομοιότθτασ, ενϊ θ τελικι κατθγοριοποίθςθ ιταν ςτα ίδια επίπεδα, με περίπου τα μιςά άρκρα να ζχουν τοποκετθκεί ςε λάκοσ κατθγορία. Εκτόσ από τουσ παραπάνω λόγουσ, ζνασ πρόςκετοσ λόγοσ για τα χειρότερα αποτελζςματα πικανόν να είναι οι διαφορετικζσ πθγζσ των άρκρων και θ άνιςθ κατανομι τουσ ςτισ κατθγορίεσ. Ενδεικτικά αναφζρουμε πωσ ςτο 2 ο ςετ άρκρων, οι ςυμμετζχοντεσ τοποκζτθςαν ςτθν κατθγορία Science-Technology μόνον δυο άρκρα. Σθμαντικότερθ αιτία όμωσ, κρίνεται ότι είναι το μικρότερο μζγεκοσ του αποςπάςματοσ που χρθςιμοποιικθκε (περίπου το μιςό από τθν προθγοφμενθ μελζτθ). Ενϊ ςτισ προθγοφμενεσ μελζτεσ είχε επιλεχκεί ζνα μζγεκοσ 2-3 προτάςεων, ςε αυτιν το μζγεκοσ ιταν μόλισ μια πρόταςθ. Από το γεγονόσ αυτό υποδεικνφεται επίςθσ πωσ πρζπει να διερευνθκεί περαιτζρω το ιδανικό μζγεκοσ αποςπάςματοσ. Μια γενικι παρατιρθςθ όςον αφορά τισ μελζτεσ κλειςτοφ τφπου ζχει να κάνει με τον τρόπο που διενεργικθκε θ μελζτθ. Θ ςφγκριςθ μιασ λζξθσ με ζνα μικρό κείμενο κα λζγαμε ότι δεν εκμεταλλεφεται πλιρωσ τθσ δυνατότθτεσ του αλγορίκμου ςθμαςιολογικισ ςυςχζτιςθσ. Κα μποροφςαμε εναλλακτικά, αντί τθσ λεκτικισ περιγραφισ τθσ κατθγορίασ, να χρθςιμοποιιςουμε ζνα κείμενο που παρουςιάηει ςτενι ςθμαςιολογικι ςυςχζτιςθ με αυτιν. Το κείμενο αυτό κα μποροφςε να είναι πχ το αντίςτοιχο άρκρο τθσ Wikipedia που αναφζρεται ςτθν ςυγκεκριμζνθ ζννοια. Μια εναλλακτικι επιλογι είναι να εμπλουτίςουμε τθν περιγραφι τθσ κατθγορίασ με ςυνϊνυμεσ λζξεισ ι όρουσ που υποκειμενικά κρίνεται ότι ζχουν ςθμαςιολογικι ςυςχζτιςθ με τθν περιγραφι. Επίςθσ, κα μποροφςαμε να αλλάξουμε 67

68 τον τρόπο με τον οποίο γίνεται θ ςφγκριςθ μεταξφ τθσ περιγραφισ τθσ κατθγορίασ και τθσ περιγραφισ των καρτϊν. Για παράδειγμα, αντί να αναπαριςτάται το κείμενο από ζνα διάνυςμα και να ςυγκρίνεται με το διάνυςμα τθσ λζξθσ, κα μποροφςαμε να ακροίςουμε τισ τιμζσ ςθμαςιολογικισ ςυςχζτιςθσ μεταξφ κάκε λζξθσ του κειμζνου και τθσ περιγραφισ τθσ κατθγορίασ ι να ακροίςουμε μόνο τισ Ν μεγαλφτερεσ τιμζσ. Το άκροιςμα αυτό, κανονικοποιθμζνο με το μικοσ του κειμζνου κα αποτελεί και τθν τιμι τθσ ςυςχζτιςθσ μεταξφ του κειμζνου και τθσ περιγραφισ τθσ κατθγορίασ. Τζλοσ, μια εναλλακτικι προςζγγιςθ για τθν προςομοίωςθ μιασ μελζτθσ κλειςτοφ τφπου, κα μποροφςε να χρθςιμοποιεί πρϊτα μια ανάλυςθ ανοικτοφ τφπου ςτα δεδομζνα και ςτθν ςυνζχεια να επιλζγεται ο αρικμόσ των ςυςτάδων ίςοσ με τον αρικμό των κατθγοριϊν. Θ αντιςτοίχθςθ κάκε ςυςτάδασ με κάκε κατθγορία μπορεί να γίνει με διάφορουσ τρόπουσ. Εκτόσ από τουσ τρόπουσ που αναφζρονται παραπάνω, μπορεί να εξαχκοφν οι Ν πιο κοινζσ λζξεισ που παρουςιάηονται ςτισ περιγραφζσ των καρτϊν τθσ ςυςτάδασ και να ςυγκρικοφν μόνο αυτζσ με τθν περιγραφι των κατθγοριϊν. Εάν είναι υπολογιςτικά εφικτό μπορεί να ςυγκρικεί και το ςυνολικό κείμενο των περιγραφϊν των καρτϊν τθσ ςυςτάδασ με τθν περιγραφι τθσ κατθγορίασ. Είναι προφανζσ ότι κα πρζπει να διερευνθκεί ποιοσ από τουσ παραπάνω είναι ο αποδοτικότεροσ τρόποσ Μέθοδοι Σημαςιολογικήσ Συςχέτιςησ Από τθν παρουςίαςθ και αξιολόγθςθ των μεκόδων ςθμαςιολογικισ ςυςχζτιςθσ προζκυψαν οριςμζνα ςθμαντικά και χριςιμα ςυμπεράςματα. Αρχικά ζγινε κατανοθτό πωσ οι ςυγκεκριμζνεσ τιμζσ ακρίβειασ που πζτυχε θ κάκε μζκοδοσ ςτα διάφορα πειράματα ςφγκριςθσ λζξεων, δεν πρζπει και δεν μποροφν να αποτελζςουν ουςιαςτικό παράγοντα προτίμθςθσ. Ρολλζσ εργαςίεσ ζχουν υποδείξει άλλουσ ςθμαντικοφσ παράγοντεσ που επθρεάηουν ζντονα τθν απόδοςθ των μεκόδων, όπωσ το μζγεκοσ, θ ποιότθτα και θ καταλλθλότθτα του ςϊματοσ κειμζνου, κακϊσ και θ διάςταςθ των διανυςμάτων που αναπαριςτοφν τισ λζξεισ. Για τθν περίπτωςθ του AutoCardSorter αναγνωρίςτθκαν επίςθσ 4 κρίςιμοι παράγοντεσ προτίμθςθσ: 1. Θ ταχφτθτα του αλγορίκμου 2. Θ δυνατότθτα για εφκολθ ανανζωςθ του ςϊματοσ κειμζνου 3. Ο όγκοσ δεδομζνων που απαιτείται ςτον δίςκο 4. Θ δυνατότθτα επζκταςθσ ςε ςφγκριςθ κειμζνων Θ μελλοντικι ζρευνα κα πρζπει να εςτιάςει ςε αυτοφσ τουσ παράγοντεσ ζτςι ϊςτε να επιλεχκεί τελικά θ μζκοδοσ που κα χρθςιμοποιείται από το AutoCardSorter για τθν ςθμαςιολογικι ςφγκριςθ των περιγραφϊν των καρτϊν. Θ επιλογι αυτι κα 68

69 κρικεί φυςικά και από τα χαρακτθριςτικά του ίδιου του εργαλείου. Είναι προφανζσ πωσ θ αποκικευςθ ενόσ μεγάλου ςϊματοσ κειμζνου ςτον δίςκο του χριςτθ του AutoCardSorter αποκλείεται ωσ επιλογι. Συνεπϊσ, αν κα χρθςιμοποιθκεί τελικά μια μζκοδοσ που επεξεργάηεται ζνα ςϊμα κειμζνου, κα πρζπει να δθμιουργθκεί ζνασ εξυπθρετθτισ με τον οποίο κα ςυνδζεται ο χριςτθσ και κα αναλαμβάνει τθν επεξεργαςία του ςϊματοσ κειμζνου και τθν παραγωγι των αποτελεςμάτων. Θ λφςθ αυτι είναι ιδιαίτερα ελκυςτικι κακϊσ ο χριςτθσ κα ζχει τθν δυνατότθτα να ςτείλει τισ περιγραφζσ των καρτϊν ςτον εξυπθρετθτι και απλά να περιμζνει, ενϊ ςυνεχίηει τισ υπόλοιπεσ εργαςίεσ του, για τθν επιςτροφι των αποτελεςμάτων. Ζνασ εξυπθρετθτισ φαίνεται ενδιαφζρουςα προςζγγιςθ και ςτθν περίπτωςθ που χρθςιμοποιθκεί μια μζκοδοσ που απαιτεί αναηθτιςεισ ςτο Διαδίκτυο. Γίνεται κατανοθτό πωσ ςτθν περίπτωςθ που απαιτοφνται πολυάρικμεσ αναηθτιςεισ, δεν είναι επικυμθτό να επιφορτίηεται ο υπολογιςτισ του χριςτθ με το ζργο αυτό. Ζνασ εξυπθρετθτισ αντίκετα, διακζτοντασ μια ταχφτατθ ςφνδεςθ με το Διαδίκτυο κα είναι ςε κζςθ να εκτελεί παράλλθλα πολλζσ αναηθτιςεισ με αποτζλεςμα τθν ςθμαντικι μείωςθ του χρόνου επεξεργαςίασ και αναμονισ των αποτελεςμάτων. Συμπεραίνουμε λοιπόν, πωσ θ τελικι επιλογι τθσ μεκόδου κα εξαρτθκεί όχι μόνο από τθν απόδοςι τθσ, αλλά και από τθν μορφι που κα ζχει το AutoCardSorter ςτα επόμενα ςτάδια ανάπτυξισ του Μελλοντικέσ Κατευθύνςεισ Εναλλακτικό ςώμα κειμένου Το ςϊμα κειμζνου (ςθμαςιολογικόσ χϊροσ) που χρθςιμοποιικθκε ςτο AutoCardSorter κατά τθν διεξαγωγι των μελετϊν που παρουςιάηονται ςε αυτιν τθν εργαςία, κρίνεται ακατάλλθλο για τθν ςυγκεκριμζνθ κεματικι ενότθτα των Ειδθςεογραφικϊν Δικτυακϊν Τόπων. Εκτόσ από τισ παρατθριςεισ που προζκυψαν ςτισ πειραματικζσ μελζτεσ, το ςυγκεκριμζνο ςϊμα κρίνεται ακατάλλθλο και βάςει τθσ κεωρίασ τθσ LSA. Σφμφωνα με αυτιν, το ςϊμα κειμζνου πρζπει να αντιπροςωπεφει τισ γνϊςεισ των χρθςτϊν πάνω ςτθν ειδθςεογραφία. Το ςϊμα που χρθςιμοποιικθκε όμωσ, αντιςτοιχεί ςτισ γενικζσ γνϊςεισ ενόσ νζου που μόλισ ζχει τελειϊςει το ςχολείο. Ρρόκειται για το TASAxx corpus/semantic space, ζνα ςϊμα κειμζνου που βαςίηεται ςτο TASA corpus το οποίο δθμιουργικθκε από τθν Touchstone Applied Science Associates, Inc., για το βιβλίο Οδθγόσ ςυχνότθτασ λζξεων για εκπαιδευτζσ (Zeno, 1995). Το TASA περιζχει 10 εκατομμφρια λζξεισ που προζρχονται από μθ διορκωμζνα ςχολικά κείμενα, ςτθν αγγλικι γλϊςςα. Είναι χωριςμζνο ςε 37,600 κείμενα ςχετικά με διάφορα πεδία, όπωσ Γλωςςολογία, Οικιακι Οικονομία, Υγεία κ.ά. (Kanerva, 2000; 1998).

70 Υπάρχουν πραγματικά αναρίκμθτοι διακζςιμοι ςθμαςιολογικοί χϊροι ςτο διαδίκτυο, άλλοι με ελεφκερθ πρόςβαςθ και άλλοι χωρίσ. Από αυτοφσ επιλζχκθκαν οι παρακάτω, ωσ μια ενδεχόμενα καταλλθλότερθ επιλογι, για χριςθ από το AutoCardSorter πάνω ςτθν κεματικι κατθγορία των ειδθςεογραφικϊν ιςτοςελίδων Oxford English Corpus Το Oxford English Corpus είναι ζνα ςϊμα κειμζνων που, ςφμφωνα με τον δικτυακό τόπο oxforddictionaries.com 8, αποδίδει τθν πλθρζςτερθ και ακριβζςτερθ εικόνα τθσ αγγλικισ γλϊςςασ ςτθν εποχι μασ. Αντιπροςωπεφει όλουσ τουσ τφπουσ τθσ αγγλικισ γλϊςςασ, από μυκιςτοριματα και ειδικευμζνα περιοδικά, μζχρι κακθμερινζσ εφθμερίδεσ και από ομιλίεσ τθσ βουλισ μζχρι τθν γλϊςςα των blogs, των θλεκτρονικϊν μθνυμάτων και όλων των ειδϊν των δικτυακϊν τόπων ανταλλαγισ απόψεων. Επίςθσ, περιζχονται αντιπροςωπευτικά δείγματα, όχι μόνο από αγγλικά και αμερικανικά κείμενα, αλλά και από ιρλανδικά, αυςτραλιανά κ.ά. Το Oxford English Corpus είναι το μεγαλφτερο ςϊμα κείμενων αυτοφ του τφπου και κεωρείται το αντιπροςωπευτικότερο κομμάτι τθσ αγγλικισ γλϊςςασ που είναι διακζςιμο ςιμερα (Oxford University Press, 2010) Corpus of Contemporary American English (COCA) Το ςϊμα κειμζνων Corpus of Contemporary American English (COCA) αποτελεί το μεγαλφτερο ελεφκερα διακζςιμο ςϊμα κειμζνων τθσ Αγγλικισ και το μόνο μεγάλο ςε μζγεκοσ και ταυτόχρονα ιςορροπθμζνο ςϊμα τθσ Αμερικανικισ Αγγλικισ. Είναι διακζςιμο από το 2008 και χρθςιμοποιείται από δεκάδεσ χιλιάδεσ χριςτεσ κάκε μινα (γλωςςολόγοι, κακθγθτζσ, μεταφραςτζσ και άλλοι ερευνθτζσ). Το COCA περιζχει πάνω από 400 εκατομμφρια λζξεισ και είναι ιςομερϊσ διαμοιραςμζνο ςε προφορικά κείμενα, μυκιςτοριογραφθμζνα, περιοδικά, εφθμερίδεσ και ακαδθμαϊκά κείμενα. Συμπεριλαμβάνει 20 εκατομμφρια λζξεισ για κάκε χρόνο από το 1990 ζωσ το 2009 και ανανεϊνεται ετθςίωσ. Λόγω του ςχεδιαςμοφ του, είναι ίςωσ το μόνο ςϊμα κειμζνων τθσ αγγλικισ που είναι κατάλλθλο για ζρευνα των ςφγχρονων και τρεχόντων αλλαγϊν ςτθν αγγλικι γλϊςςα (Davies, 2008) WebCorp: The Web as Corpus «Ανεξαρτιτωσ μεγζκουσ και ςυχνότθτασ ενθμζρωςθσ, τα διακζςιμα θλεκτρονικά ςώματα κειμζνων πάντα κα αποτυγχάνουν ςτθν πλιρθ απόδοςθ όλων των πτυχών μιασ γλώςςασ.» (Research and Development Unit for English Studies, 2010) Το WebCorp 9 είναι ζνα ςφνολο εργαλείων που επιτρζπει τθν χριςθ ολόκλθρου του Διαδικτφου ωσ ςϊματοσ κειμζνου. Ρρόκειται για ζνα διαρκϊσ αναπτυςςόμενο εργαλείο που ςτοχεφει ςτθν ανάκτθςθ λεξιλογικϊν δεδομζνων

71 από το Διαδίκτυο και ςτθν μετατροπι τουσ ςε μορφι κατάλλθλθ για λεξιλογικι ανάλυςθ Παρατηρήςεισ Θ αλλαγι του ςϊματοσ κειμζνου που χρθςιμοποιεί το AutoCardSorter ενδεχομζνωσ να φαντάηει μια απλι διαδικαςία που κα βοθκιςει ςτθν εξαγωγι ςυμπεραςμάτων ςχετικά με τθν μθ ικανοποιθτικι απόδοςθ του εργαλείου ςτθν προςομοίωςθ μιασ κλειςτισ μελζτθσ ταξινόμθςθσ καρτϊν. Αν και το δεφτερο μζροσ τθσ υπόκεςθσ αλθκεφει, δεν ιςχφει το ίδιο και για το πρϊτο. Για να προςτεκεί ζνα νζο ςϊμα κειμζνων ςτισ διακζςιμεσ επιλογζσ του AutoCardSorter, κα πρζπει αυτό να ενςωματωκεί με τον κατάλλθλο τρόπο ςτθν ιςτοςελίδα τθσ LSA 10, του αλγόρικμου ςθμαςιολογικισ ςυςχζτιςθσ που χρθςιμοποιείται από το εργαλείο. Στθν παροφςα φάςθ ανάπτυξθσ του εργαλείου είναι απαραίτθτθ θ ςυνεργαςία με τισ εφαρμογζσ του παραπάνω δικτυακοφ τόπου προκειμζνου να γίνει θ ςθμαςιολογικι ςυςχζτιςθ των καρτϊν που ειςάγονται ςτο εργαλείο. Συνεπϊσ, αλλαγι του ςϊματοσ κειμζνου μπορεί να γίνει μόνον κατόπιν ςχετικισ αίτθςθσ και ςυνεννόθςθσ με τουσ υπεφκυνουσ τθσ ιςτοςελίδασ τθσ LSA. Κάτι τζτοιο ίςωσ αποδειχτεί πολφ δφςκολο ι και αδφνατο. Θ ανάγκθ για αλλαγι του ςϊματοσ κειμζνου δεν περιορίηεται φυςικά ςτθν εξαγωγι ςυμπεραςμάτων για τθν κεματικι ενότθτα των Ειδθςεογραφικϊν Λςτοςελίδων. Εξειδικευμζνοι δικτυακοί τόποι χρθςιμοποιοφν ιδιαίτερο λεξιλόγιο που ίςωσ να μθν καλφπτεται από το TASA corpus. Επίςθσ οποιαδιποτε εφαρμογι του εργαλείου ςε μθ αγγλικζσ ιςτοςελίδεσ απαιτεί τθν αλλαγι του ςϊματοσ κειμζνου με ζνα τθσ ίδιασ γλϊςςασ. Γίνεται φανερι λοιπόν θ ανάγκθ για περαιτζρω ζρευνα πάνω ςτθν επιλογι του κατάλλθλου ςϊματοσ κειμζνων και ενδεχομζνωσ για ανάπτυξθ του εργαλείου ζτςι ϊςτε να υποςτθρίηει τθν ενςωμάτωςθ νζων, όταν αυτό κρίνεται απαραίτθτο. Λδανικά, το AutoCardSorter κα πρζπει να μπορεί να χρθςιμοποιεί πολλά διαφορετικά ςϊματα κειμζνου αναλόγωσ τθσ επιλογισ του χριςτθ. Σε περίπτωςθ που χρθςιμοποιθκεί μια μζκοδοσ που πραγματοποιεί αναηθτιςεισ ςτο Διαδίκτυο, οι επιλογζσ είναι πλζον αναρίκμθτεσ. Ο χριςτθσ δεν ζχει παρά να επιλζξει είτε ζναν ςυγκεκριμζνο είτε μια ομάδα δικτυακϊν τόπων ςτουσ οποίουσ και κα περιοριςτεί θ αναηιτθςθ. Αυτό ιςχφει και για τισ μεκόδουσ που χρθςιμοποιοφν τα αποτελζςματα αναηθτιςεων για τθν δθμιουργία ενόσ ςϊματοσ κειμζνου. Τζλοσ, όςον αφορά τα κλαςςικά ςϊματα κειμζνων, θ ελεφκερθ διάκεςθ του Corpus of Contemporary American English το κάνει μια ιδιαίτερα ελκυςτικι εναλλακτικι επιλογι για χριςθ από το AutoCardSorter. Σε κάκε περίπτωςθ, θ

72 επιλογι του ςϊματοσ κειμζνων που κα χρθςιμοποιθκεί ςε επόμενεσ μελζτεσ κα εξαρτθκεί από διάφορουσ παράγοντεσ, ςυμπεριλαμβανομζνθσ τθσ διακεςιμότθτασ του για τουσ ςκοποφσ που μασ ενδιαφζρουν Μελλοντική Έρευνα Το επόμενο βιμα ςτθν ανάπτυξθ του AutoCardSorter κα πρζπει να είναι θ επιλογι ενόσ καταλλθλότερου αλγορίκμου για τθν ςθμαςιολογικι ςυςχζτιςθ των περιγραφϊν των καρτϊν. Για τον ςκοπό αυτό κρίνεται απαραίτθτο να διενεργθκεί μια πειραματικι μελζτθ, ςτθν οποία κα ςυμμετζχουν οριςμζνεσ μζκοδοι ςθμαςιολογικισ ςυςχζτιςθσ, επιλεγμζνεσ βάςει των ςυμπεραςμάτων που προκφπτουν από το 3 ο κεφάλαιο. Θ επιλογι αυτι κα πρζπει να γίνει λαμβάνοντασ υπόψθ τθν μελλοντικι υλοποίθςθ που κα ζχει το εργαλείο. Ο ςχεδιαςμόσ τθσ μελζτθσ κα πρζπει να είναι τζτοιοσ, ϊςτε να διερευνθκεί θ επίδραςθ παραγόντων, όπωσ οι διαςτάςεισ των διανυςμάτων που αναπαριςτοφν τισ λζξεισ, το μικοσ του κειμζνου που χρθςιμοποιείται ωσ περιγραφι μιασ κάρτασ, ο μζγιςτοσ αρικμόσ των όρων μιασ αναηιτθςθσ χωρίσ να μειϊνεται θ απόδοςθ και τζλοσ θ γενικι απόδοςθ του εργαλείου ςε εφαρμογζσ που απαιτοφν ειδικευμζνο τεχνικό ι επιςτθμονικό λεξιλόγιο. Επίςθσ, είναι ςαφζσ ότι πρζπει να διερευνθκεί περαιτζρω θ απόδοςθ του εργαλείου ςτθν προςομοίωςθ μιασ μελζτθσ ταξινόμθςθσ καρτϊν κλειςτοφ τφπου. Αρχικά κα πρζπει να διερευνθκεί θ απόδοςθ του εργαλείου με τθν χριςθ του αλγορίκμου ςυςχζτιςθσ που κα επιλεγεί τελικά ωσ καταλλθλότεροσ. Στθν περίπτωςθ που δεν βελτιωκοφν τα αποτελζςματα κα πρζπει να διερευνθκοφν διάφορεσ παραλλαγζσ τθσ μελζτθσ, όπωσ πχ αυτζσ που περιγράφονται ςτθν ενότθτα Τζλοσ, αναφζρουμε μερικζσ ιδζεσ για πικανζσ εφαρμογζσ που μπορεί να ζχει το AutoCardSorter ι οι αλγόρικμοι ςθμαςιολογικισ ςυςχζτιςθσ, εκτόσ τθσ προςομοίωςθσ μιασ μελζτθσ ταξινόμθςθσ καρτϊν. Θ πρϊτθ εφαρμογι που ςκεφτικαμε είναι αυτι τθσ αυτόματθσ κατθγοριοποίθςθσ. Εάν το εργαλείο μπορεί να προςομοιϊςει μια μελζτθ κλειςτοφ τφπου είναι πικανό πωσ κα μπορεί να αποδϊςει εξίςου καλά και ςε αυτιν τθν εφαρμογι. Θ κατθγοριοποίθςθ είναι δυνατόν να γίνει με πολλοφσ τρόπουσ. Αρχικά είναι δυνατό να ςυγκρίνεται ςθμαςιολογικά το περιεχόμενο προσ κατθγοριοποίθςθ, με τισ περιγραφζσ των διαφόρων κατθγοριϊν και να τοποκετείται ςτθν κατθγορία με τθν οποία παρουςιάηει τθν μεγαλφτερθ ςυςχζτιςθ. Ρολλζσ φορζσ επίςθσ, χρθςιμοποιοφνται οριςμζνοι όροι-κλειδιά για να χαρακτθρίςουν το κάκε ζγγραφο, οι οποίοι αντιςτοιχοφν ςε ςυγκεκριμζνεσ κατθγορίεσ. Θ κατθγοριοποίθςθ ςε αυτιν τθν περίπτωςθ γίνεται υπόκεςθ ςυςχζτιςθσ του περιεχομζνου με το κατάλλθλο ςετ όρων. 72

73 Μια δεφτερθ πικανι εφαρμογι του AutoCardSorter είναι αυτι τθσ αυτόματθσ εξαγωγισ μετα-δεδομζνων (metadata auto-extraction) από ζγγραφα. Συνικωσ, οι όροι αυτοί επιβάλλεται να προζρχονται, για διάφορουσ λόγουσ, από ζνα περιοριςμζνο και ςυγκεκριμζνο λεξιλόγιο (controlled vocabulary), ξεχωριςτό για κάκε δικτυακό τόπο. Σε αυτιν τθν περίπτωςθ κα μποροφςαμε να εξάγουμε μεταδεδομζνα ςυγκρίνοντασ ςθμαςιολογικά το ζγγραφο με τουσ όρουσ του λεξιλογίου και επιλζγοντασ αυτοφσ με τθν μεγαλφτερθ ςυςχζτιςθ. Επιπρόςκετα, τα μζτρα ςθμαςιολογικισ ςυςχζτιςθσ κα μποροφςαν να χρθςιμοποιθκοφν ςτθν προςομοίωςθ μιασ μελζτθσ αυκόρμθτων λιςτϊν (freelisting). Εφόςον είναι δυνατό, κα μποροφςαμε να εξάγουμε τουσ πρϊτουσ Χ όρουσ με τθν μεγαλφτερθ ςθμαςιολογικι ςυςχζτιςθ με ζναν όρο-κλειδί, οι οποίοι ςυνεμφανίηονται με τον όρο-κλειδί ςε ζνα παράκυρο κειμζνου μεταβλθτοφ μικουσ. Για παράδειγμα κα μποροφςαμε να εξάγουμε τουσ πρϊτουσ 50 όρουσ με τθν μεγαλφτερθ ςυςχζτιςθ με τον όρο οικιακό ηϊο που εντοπίηονται ςε ζνα παράκυρο 200 λζξεων γφρω από τον όρο-κλειδί. Είναι προφανζσ πωσ τα παραπάνω δεν είναι παρά απλζσ ιδζεσ που κα πρζπει να διερευνθκοφν με τισ κατάλλθλεσ ςυγκριτικζσ μελζτεσ για τθν εξαγωγι ςυμπεραςμάτων ςχετικά με τθν εγκυρότθτά και πικανι εφαρμογι τουσ. Κλείνουμε τθν εργαςία αυτι ςθμειϊνοντασ μια χαρακτθριςτικι ζκφραςθ των (Rosenfeld and Morville, 2006) : Ζοφμε ςτθν εποχι τθσ πζτρασ όςον αφορά το λογιςμικό για τθν πλθροφοριακι αρχιτεκτονικι. 73

74 Βιβλιογραφία Berry, Dumais, & Obrien. (1995). Using Linear Algebra for Intelligent Information Retrieval. SIAM Review. Bollegala, Matsuo, & Ishizuka. (2007). Measuring semantic similarity between words using web search engines. Proceedings of the 16th international conference on World Wide Web. Brinck, T. H. (2002). Automatically evaluating the usability of web sites. CHI '02 extended abstracts on Human factors in computing systems (ςς ). Minneapolis, Minnesota: ACM. Budiu, Royer, & Pirolli. (2007). Modeling information scent: a comparison of LSA, PMI and GLSA similarity measures on common tests and corpora. 8th RIAO Conference. Bullinaria, & Levy. (2006). Extracting Semantic Representations from Word Co-occurrence Statistics: A Computational Study. Behavior Research Methods,. Calabria, T. (2004, March 2). An introduction to personas and how to create them. Ανάκτθςθ July 26, 2010, από steptwo.com: Capra, M. (2005). Factor analysis of card sort data: An alternative to hierarchical cluster analysis. Proceedings of the Human Factors and Ergonomics Society 49th Annual Meeting (ςς ). Santa Monica, CA: HFES. Celeste, P. L. (2008). A Modified Delphi Approach to a New Card Sorting Methodology. Journal of Usability Studies, Chen, Lin, & Wei. (2006). Novel Association Measures Using Web Search with Double Checking. Proceedings of the 21st International Conference on Computational Linguistics. Cilibrasi, & Vitanyi. (2007). The Google Similarity Distance. IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, (ςς ). Davies, M. (2008). Corpus of Contemporary American English. Ανάκτθςθ July 30, 2010, από americancorpus.org: Deerwester, Dumais, Furnas, Landauer, & Harshman. (1990). Indexing by Latent Semantic Analysis. Journal of the American Society For Information, 41, Dong, J. M. (2001). A user input and analysis tool for information architecture. CHI '01 extended abstracts on Human factors in computing systems (ςς ). Seattle, Washington: ACM. Dumais. (1992). Enhancing Performance in Latent Semantic Indexing Retrieval. 74

75 Dumais, Furnas, Landauer, Deerwester, & Harshman. (1988). Using latent semantic analysis to improve access to textual information. Proceedings of the SIGCHI conference on Human factors in computing systems. Efron. (2005). Using cocitation information to estimate political orientation in web documents. Springer-Verlag. Falconner, Maslov, & Storey. (2008). Falconner; Maslov; Storey. Field, A. (2005). Discovering Statistics Using SPSS, 2nd Ed. SAGE Publications. Gabrilovich, & Markovich. (2007). Computing semantic relatedness using Wikipedia-based explicit semantic analysis. 20th International Joint Conference on Artificial Intelligence. Higgins. (2005). Which statistics reflect semantics? Rethinking. Στο Kepser, & Reis, Linguistic evidence: empirical, theoretical, and computational perspectives (ς. 265). Inkpen, & Desilets. (2005). Semantic Similarity for Detecting Recognition Errors in Automatic Speech Transcripts. Conference on Empirical Methods in Natural Language Processing. Vancouver. Instone, K. (1998). New York: Seybold Seminars. IntranetLeadershipForum. (2006, September). Professional community in Australia and New Zealand. Ανάκτθςθ February 2, 2008, από How-to guide: Card sorting: Islam, & Inkpen. (2008). Semantic text similarity using corpus-based word similarity and string similarity. ACM Transactions on Knowledge Discovery from Data. Islam, Inkpen, & Kiringa. (2008). Applications of corpus-based semantic similarity and word segmentation to database schema matching. Τhe International Journal on Very Large Data Bases. Kalbach. (2007). Designing web navigation: optimizing the user experience. O'Reilly Media, Inc. Kanerva, P. K. (2000). Random indexing of text samples for Latent Semantic Analysis. Proc. 22nd Annual Conference of the Cognitive Science Society (ς. 1036). Mahwah, New Jersey: Erlbaum: L.R. Gleitman and A.K. Josh. Katsanos, C. T. (2008). AutoCardSorter: Designing the information architecture of a web site using latent semantic analysis. Proceedings of the SIGCHI conference on Human Factors in Computing Systems. Florence, Italy: ACM. Katsanos, Tselios, & Avouris. (2008). Automated semantic elaboration of web site information architecture. Interacting with Computers. 75

76 Laham. (1997). Latent Semantic Analysis approaches to categorization. Proceedings of the 19th annual meeting of the Cognitive Science Society, (ς. 979). Mawhwah, NJ. Landauer. (2002). Applications of Latent Semantic Analysis. Annual Conference of the Cognitive Science Society. Landauer, & Dumais. (1997). A solution to Plato's problem: The Latent Semantic Analysis theory of the acquisition, induction and representation of knowledge. Psychological Review, 104, Landauer, Foltz, & Laham. (1998). Introduction to Latent Semantic Analysis. Discourse Processes, 25, Landauer, Laham, & Foltz. (1998). Learning Human-like Knowledge by Singular Value Decomposition: A Progress Report. In Advances in Neural Information Processing Systems, Vol. 10. Lin. (1998). An information-theoretic definition of similarity. Proceedings of International Conference on Machine Learning, (ςς ). Wisconsin. Lindsey, Veksler, Grintsvayg, & Gray. (2007). Be wary of what your computer reads: the effects of corpus selection on measuring semantic relatedness. 8th International Conference of Cognitive Modeling. LSA@CUBoulder. (1998, October). Semantic Spaces. Ανάκτθςθ July 28, 2010, από Latent Semantic CU Boulder: Marchionini, G. (1997). Information seeking in electronic environments (New ed.). Cambridge University Press. Mauer, D. W. (2004, April 7). Card sorting: a definitive guide. Ανάκτθςθ February 1, 2008, από BoxesandArrows: Maurer, D. (2006, March 14). Four Modes of Seeking Information and How to Design for Them. Ανάκτθςθ February 2, 2008, από BoxesandArrows: how_to_design_for_them Mihalcea, & Csomai. (2007). Wikify!: linking documents to encyclopedic knowledge. Proceedings of the sixteenth ACM conference on Conference on information and knowledge management, (ςς ). Mihalcea, Corley, & Strapparava. (2006). Corpus-based and knowledge-based measures of text semantic similarity. Proceedings of the 21st national conference on Artificial intelligence. 76

77 Milne, & Witten. (2008). An effective, low-cost measure of semantic relatedness obtained from Wikipedia links. Proceedings of the first AAAI Workshop on Wikipedia and Artificial Intelligence. Morville, P. (2005). Ambient findability: what we find changes who we become. O'Reilly Media, Inc. Nielsen, J. (2004, July 19). Card sorting: How many users to test? Ανάκτθςθ February 1, 2008, από Useit: Nielsen, J. S. (1995). Sun Web: user interface design for Sun Microsystem's internal web. Computer Networks and ISDN Systems, 28 (1-2), Norman, D. A. (2004, November 16). Ad-Hoc Personas & Empathetic Focus. Ανάκτθςθ July 25, 2010, από jnd.org: Oxford University Press. (2010). About the Oxford English Corpus. Ανάκτθςθ July 29, 2010, από oxforddictionaries.com: Papadimitriou, Raghavan, Tamaki, & Vempala. (2000). Latent Semantic Indexing: A Probalistic Analysis. Journal of Computer and System Sciences, Popescu. (2007). Information Extraction from Unstructured Web Text. University of Washington. Reccia, & Jones. (2008). More data trumps smarter algorithms: Comparing pointwise mutual information with latent semantic analysis. 38th Meeting of the Society for Computers in Psychology. Rehder, Schreiner, Wolfe, Laham, Landauer, & Kintsch. (1998). Using Latent Semantic Analysis to Assess Knowledge: Some Technical Considerations. Discourse Processes, Research and Development Unit for English Studies. (2010). WebCorp User Guide. Ανάκτθςθ July 30, 2010, από WebCorp: Rosenfeld and Morville. (2006). Information architecture for the world wide web (3rd ed.). O'Reilly Media, Inc. Sahami, & Heilman. (2005). A web-based kernel function for matching short text snippets. International Conference on Machine Learning. Sinha, R. B. (2005). Rapid information architecture prototyping. Proceedings of the 5th conference on Designing interactive systems: processes, practices, methods, and techniques (ςς ). Cambridge, MA: ACM. Teevan, J. A. (2004). The perfect search engine is not enough: a study of orienteering behavior in directed search. Proceedings of the SIGCHI conference on Human factors in computing systems (ςς ). Vienna, Austria: ACM. 77

78 Tullis, T. S. (2004). How many users are enough for a card-sorting study? Usability Professionals Association (UPA) 2004 Conference. Minneapolis, MN. Turney. (2001). Mining the Web for Synonyms: PMI-IR Versus LSA on TOEFL. Proceedings of the Twelth European Conference on Machine Learning, (ςς ). Freiburg, Germany. Turney. (2002). Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews. ACL '02 Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Turney, & Littman. (2002). Unsupervised Learning of Semantic Orientation from a Hundred- Billion-Word Corpus. Veksler, Govostes, & Gray. (2008). Defining the dimensions of the human semantic space. 30th Annual Meeting of the Cognitive Science Society, (ςς ). Wan. (2008). CM-PMI: Improved Web-based Association Measure with Contextual Label Matching. WWW2008. Beijing. Weller, & Romney. (1988). Systematic Data Collection. London: SAGE publications. Witten, I. H. (2005). Data mining: practical machine learning tools and techniques (2nd ed.). Morgan Kaufmann. Wolfe, Schreiner, Rehder, Laham, Foltz, Kintsch, και ςυν. (1998). Learning from text: Matching readers and text by Latent Semantic Analysis. Discourse Processes, 25, Wu, S.-C. M. (2007). Preliminary evidence for top-down and bottom-up processes in web search navigation. CHI '07 extended abstracts on Human factors in computing systems (ςς ). San Jose, CA: ACM. Zeno, S. (1995). The Educator's word frequency guide. USA: Touchstone Applied Science Associates. Zhiqiang, Mcnamara, Louwerse, M., Hu, X., Rowe, M., & Graesser, A. C. (2004). NLS: A NonLatent Similarity Algorithm. Proceedings of the 26th Annual Meeting of the Cognitive Science Society. 78

79 6. Παρα ρτήμα Αριθμόσ κατηγοριών μετά από εφαρμογή του κριτηρίου Kaiser, μζςω τησ ενςωματωμζνησ λειτουργίασ που προςφζρει το AutoCardSorter 79

80 Initial Eigenvalues Component Total % of Variance Cumulative % 1 7,186 18,911 18, ,279 16,525 35, ,368 14,126 49, ,598 12,100 61, ,226 8,490 70, ,699 7,102 77,255 7,723 1,904 79,158 8,646 1,701 80,859 9,491 1,292 82,151 10,464 1,220 83,371 11,399 1,049 84,421 12,340,896 85,316 13,318,837 86,153 14,308,810 86,963 15,308,810 87,773 16,308,810 88,582 17,305,802 89,384 18,257,676 90,061 19,257,676 90,737 20,255,671 91,408 21,252,662 92,070 22,246,647 92,717 23,244,642 93,359 24,244,642 94,000 25,234,616 94,617 26,230,605 95,222 27,212,559 95,780 28,210,553 96,333 29,208,547 96,880 30,208,547 97,428 31,206,542 97,969 32,195,513 98,482 33,191,503 98,985 34,183,482 99,467 35,176,463 99,930 36,015,040 99,970 37,011, ,000 38,000, ,000 Αποτελζςματα ανάλυςησ παραγόντων ςτισ ομαδοποιήςεισ τησ μελζτησ ταξινόμηςησ καρτών 80

81 P1 P2 P3 P4 P5 P6 P7 P ,5 P , ,5 35 P ,5 34 P , , P ,5 0 37,5 36,5 P ,5 37, , P7 46, , P , ,5 P9 42, , ,5 43,5 43,5 P10 42, ,5 34, ,5 35,5 P ,5 45, ,5 P12 49, ,5 46, P13 46,5 30,5 31,5 35,5 29, ,5 P14 49,5 34, , ,5 P ,5 47,5 44,5 44,5 46 P ,5 31,5 35, ,5 33 P17 48,5 32, ,5 34, P18 44, ,5 36, ,5 31,5 P19 48,5 39,5 45,5 46,5 44,5 45,5 45 P , ,5 40,5 P ,5 33,5 35 P22 46, , ,5 37,5 34,5 P23 48, , ,5 P , , ,5 33 P ,5 44,5 46, ,5 43,5 P26 46, P27 45,5 25,5 30,5 35,5 24, P28 45,5 35,5 20, ,5 38,5 35 P29 46,5 43, ,5 P ,5 41,5 39,5 P31 41, , ,5 39,5 39,5 P32 43,5 32, ,5 P ,5 46, , ,5 P ,5 0 38,5 42,5 39 P35 45,5 37, , P36 47,5 24, ,5 29, ,5 P37 46,5 36,5 36,5 42, P , ,5 37,5 36,5 Μζροσ του πίνακα ςημαςιολογικών αποςτάςεων, βάςει τίτλων, του AutoCardSorter 81

82 P1 P2 P3 P4 P5 P6 P7 P ,5 17,5 P , , P3 18 9, ,5 14,5 11,5 P , ,5 P ,5 12,5 21, ,5 P6 20, , P7 17, ,5 15,5 18, P8 5,5 11,5 14,5 5 19, P , ,5 10,5 P ,5 13 7, ,5 11,5 P11 16,5 9 8, P12 23, , P , , ,5 P ,5 22,5 26,5 24,5 24,5 23,5 P ,5 8, P16 14,5 9 10,5 15,5 15,5 15,5 11,5 P ,5 23,5 22,5 18,5 15,5 P18 24, ,5 23,5 23, ,5 P19 23, , , ,5 P , P ,5 12,5 P22 8 9,5 13,5 7, P ,5 20, ,5 P ,5 18,5 17, P25 26, ,5 P , ,5 15,5 P , , P28 21,5 15 5, ,5 20,5 16 P , ,5 P30 16, ,5 12,5 P ,5 13,5 16,5 16, ,5 P32 15,5 9, , ,5 P , P34 7,5 11,5 13, ,5 12 P35 20, ,5 7,5 8 15,5 P36 21,5 14,5 16, ,5 19,5 13 P ,5 11, ,5 15 P38 23,5 15, , ,5 Μζροσ του πίνακα ςημαςιολογικών αποςτάςεων βάςει των περιγραφών. Φαίνεται καθαρά η ςημαντικά μεγαλφτερη ςυςχζτιςη ςε ςχζςη με την προηγοφμενη εικόνα. 82

83 83 Το δεντρόγραμμα που παράγεται από την μζθοδο ταξινόμηςησ καρτών ανοικτοφ τφπου

ελ. 11/235, Περιεχόμενα Φακζλου "Σεχνικι Προςφορά"

ελ. 11/235, Περιεχόμενα Φακζλου Σεχνικι Προςφορά υντάκτθσ : Ευάγγελοσ Κρζτςιμοσ χόλιο: ΠΑΡΑΣΗΡΗΗ 1 ελ. 11/235, Περιεχόμενα Φακζλου "Σεχνικι Προςφορά" Για τθν αποφυγι μεγάλου όγκου προςφοράσ και για τθ διευκόλυνςθ του ζργου τθσ επιτροπισ προτείνεται τα

Διαβάστε περισσότερα

Συγγραφι επιςτθμονικισ εργαςίασ. Η κορφφωςθ τθσ προςπάκειάσ μασ

Συγγραφι επιςτθμονικισ εργαςίασ. Η κορφφωςθ τθσ προςπάκειάσ μασ Συγγραφι επιςτθμονικισ εργαςίασ Η κορφφωςθ τθσ προςπάκειάσ μασ Περίγραμμα Ειςήγηςησ Στάδια υλοποίθςθσ τθσ επιςτθμονικισ εργαςίασ Δομι επιςτθμονικισ / πτυχιακισ εργαςίασ Ζθτιματα ερευνθτικισ και ακαδθμαϊκισ

Διαβάστε περισσότερα

Διδάςκων: Κωνςταντίνοσ τεφανίδθσ

Διδάςκων: Κωνςταντίνοσ τεφανίδθσ ΠΑΝΕΠΙΣΗΜΙΟ ΚΡΗΣΗ ΧΟΛΗ ΘΕΣΙΚΩΝ ΕΠΙΣΗΜΩΝ ΣΜΗΜΑ ΕΠΙΣΗΜΗ ΤΠΟΛΟΓΙΣΩΝ ΜΑΘΗΜΑ ΕΠΙΛΟΓΗ ΗΤ-564 ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΣΑ ΕΠΙΚΟΙΝΩΝΙΑ ΑΝΘΡΩΠΟΤ - ΜΗΧΑΝΗ Διδάςκων: Κωνςταντίνοσ τεφανίδθσ τόχοσ τθσ ςυγκεκριμζνθσ εργαςίασ

Διαβάστε περισσότερα

Περιεχόμενα. χολι Χοροφ Αντιγόνθ Βοφτου - Πολιτικι Διαχείριςθσ Cookie 1

Περιεχόμενα. χολι Χοροφ Αντιγόνθ Βοφτου - Πολιτικι Διαχείριςθσ Cookie 1 Περιεχόμενα Περιεχόμενα... 1 1. Ειςαγωγή... 2 1.1 Σχετικά... 2 2. Γενικέσ Πληροφορίεσ για τα Cookies... 2 2.1 Οριςμόσ... 2 2.2 Χρήςη... 3 2.3 Τφποι... 3 2.4 Έλεγχοσ... 3 3. Cookies Σχολήσ... 4 3.1 Ειςαγωγή...

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ. ΚΕΦΑΛΑΙΟ 5: Γνωριμία με το λογιςμικό του υπολογιςτι

ΕΝΟΤΗΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ. ΚΕΦΑΛΑΙΟ 5: Γνωριμία με το λογιςμικό του υπολογιςτι ΕΝΟΤΗΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ ΚΕΦΑΛΑΙΟ 5: Γνωριμία με το λογιςμικό του υπολογιςτι Λογιςμικό (Software), Πρόγραμμα (Programme ι Program), Προγραμματιςτισ (Programmer), Λειτουργικό Σφςτθμα (Operating

Διαβάστε περισσότερα

Rivensco Consulting Ltd 1B Georgiou Gemistou street Strovolos Nicosia Cyprus tel tel

Rivensco Consulting Ltd 1B Georgiou Gemistou street Strovolos Nicosia Cyprus tel tel Erasmus+ Programme Strategic Partnership Project Title: One Minute May Save A Life No. project: 2015-1-RO01-KA202-014982 Rivensco Consulting Ltd 1B Georgiou Gemistou street Strovolos Nicosia Cyprus tel

Διαβάστε περισσότερα

ΗΛΕΚΣΡΟΝΙΚΗ ΤΠΗΡΕΙΑ ΑΠΟΚΣΗΗ ΑΚΑΔΗΜΑΪΚΗ ΣΑΤΣΟΣΗΣΑ

ΗΛΕΚΣΡΟΝΙΚΗ ΤΠΗΡΕΙΑ ΑΠΟΚΣΗΗ ΑΚΑΔΗΜΑΪΚΗ ΣΑΤΣΟΣΗΣΑ ΗΛΕΚΣΡΟΝΙΚΗ ΤΠΗΡΕΙΑ ΑΠΟΚΣΗΗ ΑΚΑΔΗΜΑΪΚΗ ΣΑΤΣΟΣΗΣΑ Οδηγός Χρήσης Εφαρμογής Ελέγχου Προσφορών Αφοφ πιςτοποιθκεί ο λογαριαςμόσ που δθμιουργιςατε ςτο πρόγραμμα ωσ Πάροχοσ Προςφορϊν, κα λάβετε ζνα e-mail με

Διαβάστε περισσότερα

τατιςτικά ςτοιχεία ιςτότοπου Κ.Ε.Π.Α. Α.Ν.Ε.Μ, www.e-kepa.gr για τθν περίοδο 1/1/2011-31/12/2014

τατιςτικά ςτοιχεία ιςτότοπου Κ.Ε.Π.Α. Α.Ν.Ε.Μ, www.e-kepa.gr για τθν περίοδο 1/1/2011-31/12/2014 τατιςτικά ςτοιχεία ιςτότοπου Κ.Ε.Π.Α. Α.Ν.Ε.Μ, www.e-kepa.gr για τθν περίοδο 1/1/2011-31/12/2014 Ειςαγωγι Στο παρόν κείμενο παρουςιάηονται και αναλφονται τα ςτατιςτικά ςτοιχεία του ιςτοτόπου τθσ ΚΕΠΑ-ΑΝΕΜ,

Διαβάστε περισσότερα

Τεχνικι Παρουςιάςεων με PowerPoint

Τεχνικι Παρουςιάςεων με PowerPoint Τεχνικι Παρουςιάςεων με PowerPoint Δρ. Παφλοσ Θεοδϊρου Ανϊτατθ Εκκλθςιαςτικι Ακαδθμία Ηρακλείου Κριτθσ Περιεχόμενα Ειςαγωγι Γιατί πρζπει να γίνει παρουςίαςθ τθσ εργαςίασ μου Βαςικι προετοιμαςία Δομι παρουςίαςθσ

Διαβάστε περισσότερα

Πειραματικι Ψυχολογία (ΨΧ66)

Πειραματικι Ψυχολογία (ΨΧ66) Πειραματικι Ψυχολογία (ΨΧ66) Διάλεξη 7 Σεχνικζσ για τθν επίτευξθ ςτακερότθτασ Πζτροσ Ροφςςοσ Μζθοδοι για την επίτευξη του ελζγχου Μζςω του κατάλλθλου ςχεδιαςμοφ του πειράματοσ (ςτόχοσ είναι θ εξάλειψθ

Διαβάστε περισσότερα

ΕΝΟΣΗΣΑ 1: ΓΝΩΡIΖΩ ΣΟΝ ΤΠΟΛΟΓΙΣΗ. ΚΕΦΑΛΑΙΟ 3: Εργονομία

ΕΝΟΣΗΣΑ 1: ΓΝΩΡIΖΩ ΣΟΝ ΤΠΟΛΟΓΙΣΗ. ΚΕΦΑΛΑΙΟ 3: Εργονομία ΕΝΟΣΗΣΑ 1: ΓΝΩΡIΖΩ ΣΟΝ ΤΠΟΛΟΓΙΣΗ Εργονομία, ωςτι ςτάςθ εργαςίασ, Εικονοςτοιχείο (pixel), Ανάλυςθ οκόνθσ (resolution), Μζγεκοσ οκόνθσ Ποιεσ επιπτϊςεισ μπορεί να ζχει θ πολφωρθ χριςθ του υπολογιςτι ςτθν

Διαβάστε περισσότερα

Ανάλυςη των επιλεγμζνων Επιχειρηςιακϊν Προγραμμάτων ςτο πλαίςιο του SURF-NATURE

Ανάλυςη των επιλεγμζνων Επιχειρηςιακϊν Προγραμμάτων ςτο πλαίςιο του SURF-NATURE Ανάλυςη των επιλεγμζνων Επιχειρηςιακϊν Προγραμμάτων ςτο πλαίςιο του SURF-NATURE Περίληψη Η βιοποικιλότθτα ζχει αλλάξει δραματικά τα τελευταία 50 χρόνια ςυγκριτικά με τισ αλλαγζσ που παρατθροφνται ςε όλθ

Διαβάστε περισσότερα

Σφντομεσ Οδθγίεσ Χριςθσ

Σφντομεσ Οδθγίεσ Χριςθσ Σφντομεσ Οδθγίεσ Χριςθσ Περιεχόμενα 1. Επαφζσ... 3 2. Ημερολόγιο Επιςκζψεων... 4 3. Εκκρεμότθτεσ... 5 4. Οικονομικά... 6 5. Το 4doctors ςτο κινθτό ςου... 8 6. Υποςτιριξθ... 8 2 1. Επαφζσ Στισ «Επαφζσ»

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΕ ΒΑΕΩΝ ΔΕΔΟΜΕΝΩΝ ΣΗ ΝΟΗΛΕΤΣΙΚΗ. Φιλιοποφλου Ειρινθ

ΕΦΑΡΜΟΓΕ ΒΑΕΩΝ ΔΕΔΟΜΕΝΩΝ ΣΗ ΝΟΗΛΕΤΣΙΚΗ. Φιλιοποφλου Ειρινθ ΕΦΑΡΜΟΓΕ ΒΑΕΩΝ ΔΕΔΟΜΕΝΩΝ ΣΗ ΝΟΗΛΕΤΣΙΚΗ Φιλιοποφλου Ειρινθ Προςθήκη νζων πεδίων Ασ υποκζςουμε ότι μετά τθ δθμιουργία του πίνακα αντιλαμβανόμαςτε ότι ζχουμε ξεχάςει κάποια πεδία. Είναι ζνα πρόβλθμα το οποίο

Διαβάστε περισσότερα

Εγχειρίδιο Χριςθσ τθσ διαδικτυακισ εφαρμογισ «Υποβολι και παρακολοφκθςθ τθσ ζγκριςθσ Εκπαιδευτικών Πακζτων»

Εγχειρίδιο Χριςθσ τθσ διαδικτυακισ εφαρμογισ «Υποβολι και παρακολοφκθςθ τθσ ζγκριςθσ Εκπαιδευτικών Πακζτων» Εγχειρίδιο Χριςθσ τθσ διαδικτυακισ εφαρμογισ «Υποβολι και παρακολοφκθςθ τθσ ζγκριςθσ Εκπαιδευτικών Πακζτων» Το Πλθροφοριακό Σφςτθμα τθσ δράςθσ «e-κπαιδευτείτε» ζχει ςτόχο να αυτοματοποιιςει τισ ακόλουκεσ

Διαβάστε περισσότερα

Άςκθςθ 1θ: Να γραφεί αλγόρικμοσ που κα δθμιουργεί με τθ βοικεια διπλοφ επαναλθπτικοφ βρόχου, τον ακόλουκο διςδιάςτατο πίνακα:

Άςκθςθ 1θ: Να γραφεί αλγόρικμοσ που κα δθμιουργεί με τθ βοικεια διπλοφ επαναλθπτικοφ βρόχου, τον ακόλουκο διςδιάςτατο πίνακα: 2 ο Σετ Ασκήσεων Δομές Δεδομένων - Πίνακες Άςκθςθ 1θ: Να γραφεί αλγόρικμοσ που κα δθμιουργεί με τθ βοικεια διπλοφ επαναλθπτικοφ βρόχου, τον ακόλουκο διςδιάςτατο πίνακα: 2 3 4 5 3 4 5 6 4 5 6 7 5 6 7 8

Διαβάστε περισσότερα

Ένα πρόβλθμα γραμμικοφ προγραμματιςμοφ βρίςκεται ςτθν κανονικι μορφι όταν:

Ένα πρόβλθμα γραμμικοφ προγραμματιςμοφ βρίςκεται ςτθν κανονικι μορφι όταν: Μζθοδος Simplex Η πλζον γνωςτι και περιςςότερο χρθςιμοποιουμζνθ μζκοδοσ για τθν επίλυςθ ενόσ γενικοφ προβλιματοσ γραμμικοφ προγραμματιςμοφ, είναι θ μζκοδοσ Simplex θ οποία αναπτφχκθκε από τον George Dantzig.

Διαβάστε περισσότερα

Megatron ERP Βάςη δεδομζνων Π/Φ - κατηγοριοποίηςη Databox

Megatron ERP Βάςη δεδομζνων Π/Φ - κατηγοριοποίηςη Databox Megatron ERP Βάςη δεδομζνων Π/Φ - κατηγοριοποίηςη Databox 03 05 ΙΛΤΔΑ ΠΛΗΡΟΦΟΡΙΚΗ Α.Ε. αρμά Ιηαμπζλλα Βαρλάμθσ Νίκοσ Ειςαγωγι... 1 Σι είναι το Databox...... 1 Πότε ανανεϊνεται...... 1 Μπορεί να εφαρμοςτεί

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ 3: Χριςθ εργαλείων ζκφραςθσ, επικοινωνίασ, ανακάλυψθσ και δθμιουργίασ. ΚΕΦΑΛΑΙΟ 7: Υπθρεςίεσ Αναηιτθςθσ ςτον Παγκόςμιο Ιςτό

ΕΝΟΤΗΤΑ 3: Χριςθ εργαλείων ζκφραςθσ, επικοινωνίασ, ανακάλυψθσ και δθμιουργίασ. ΚΕΦΑΛΑΙΟ 7: Υπθρεςίεσ Αναηιτθςθσ ςτον Παγκόςμιο Ιςτό ΕΝΟΤΗΤΑ 3: Χριςθ εργαλείων ζκφραςθσ, επικοινωνίασ, ΚΕΦΑΛΑΙΟ 7: Υπθρεςίεσ Αναηιτθςθσ ςτον Παγκόςμιο Ιςτό Αναηιτθςθ πλθροφοριϊν, Διεφκυνςθ Ιςτοςελίδασ (URL), κεματικοί Κατάλογοι, Λζξεισ Κλειδιά, Μθχανζσ

Διαβάστε περισσότερα

ΑΞΙΟΛΟΓΗΣΗ ΕΚΠΑΙΔΕΥΤΙΚΟΥ

ΑΞΙΟΛΟΓΗΣΗ ΕΚΠΑΙΔΕΥΤΙΚΟΥ ΑΞΙΟΛΟΓΗΣΗ ΕΚΠΑΙΔΕΥΤΙΚΟΥ Ειςαγωγή Τπάρχουν τρία επίπεδα ςτα οποία καλείςτε να αξιολογιςετε το εργαςτιριο D-ID: Νζα κζματα Σεχνολογία Διδακτικι Νέα θέματα Σο εργαςτιριο κα ειςαγάγουν τουσ ςυμμετζχοντεσ

Διαβάστε περισσότερα

ΔΕΛΣΙΟ ΣΤΠΟΤ ΣΟΧΑΙ ΑΕ: «ΚΛΑΔΙΚΕ ΣΟΧΕΤΕΙ» ΜΕΛΕΣΗ ΑΓΟΡΑ ΑΛΤΙΔΩΝ ΛΙΑΝΙΚΟΤ ΕΜΠΟΡΙΟΤ

ΔΕΛΣΙΟ ΣΤΠΟΤ ΣΟΧΑΙ ΑΕ: «ΚΛΑΔΙΚΕ ΣΟΧΕΤΕΙ» ΜΕΛΕΣΗ ΑΓΟΡΑ ΑΛΤΙΔΩΝ ΛΙΑΝΙΚΟΤ ΕΜΠΟΡΙΟΤ ΔΕΛΣΙΟ ΣΤΠΟΤ ΣΟΧΑΙ ΑΕ: «ΚΛΑΔΙΚΕ ΣΟΧΕΤΕΙ» ΜΕΛΕΣΗ ΑΓΟΡΑ ΑΛΤΙΔΩΝ ΛΙΑΝΙΚΟΤ ΕΜΠΟΡΙΟΤ Μείωςθ 1,9% ςε ςχζςθ με το 2009, παρουςίαςε θ αγορά των αλυςίδων λιανικοφ εμπορίου των οκτϊ εξεταηόμενων κατθγοριϊν το 2010

Διαβάστε περισσότερα

Μάρκετινγκ V Κοινωνικό Μάρκετινγκ. Πόπη Σουρμαΐδου. Σεμινάριο: Αναπτφςςοντασ μια κοινωνική επιχείρηςη

Μάρκετινγκ V Κοινωνικό Μάρκετινγκ. Πόπη Σουρμαΐδου. Σεμινάριο: Αναπτφςςοντασ μια κοινωνική επιχείρηςη Μάρκετινγκ V Κοινωνικό Μάρκετινγκ Πόπη Σουρμαΐδου Σεμινάριο: Αναπτφςςοντασ μια κοινωνική επιχείρηςη Σφνοψη Τι είναι το Marketing (βαςικι ειςαγωγι, swot ανάλυςθ, τα παλιά 4P) Τι είναι το Marketing Plan

Διαβάστε περισσότερα

Διαχείριςη Αριθμοδεικτών (v.1.0.7)

Διαχείριςη Αριθμοδεικτών (v.1.0.7) Διαχείριςη Αριθμοδεικτών (v.1.0.7) Περιεχόμενα 1. Μενοφ... 5 1.1 Αρικμοδείκτεσ.... 5 1.1.1 Δθμιουργία Αρικμοδείκτθ... 6 1.1.2 Αντιγραφι Αρικμοδείκτθ... 11 2. Παράμετροι... 12 2.1.1 Κατθγορίεσ Αρικμοδεικτϊν...

Διαβάστε περισσότερα

Ειδικά Θζματα Βάςεων Δεδομζνων

Ειδικά Θζματα Βάςεων Δεδομζνων Ειδικά Θζματα Βάςεων Δεδομζνων Ενότητα 15: Εξόρυξη Δεδομζνων (Data Mining) Δρ. Τςιμπίρθσ Αλκιβιάδθσ Τμιμα Μθχανικϊν Πλθροφορικισ ΤΕ Άδειεσ Χρήςησ Το παρόν εκπαιδευτικό υλικό υπόκειται ςε άδειεσ χριςθσ

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium V

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium V Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium V Στατιςτική Συμπεραςματολογία Ι Σημειακζσ Εκτιμήςεισ Διαςτήματα Εμπιςτοςφνησ Στατιςτική Συμπεραςματολογία (Statistical Inference) Το πεδίο τθσ Στατιςτικισ Συμπεραςματολογία,

Διαβάστε περισσότερα

Είναι εφικτι θ ςυναπόφαςθ του αςκενι ςτθ κεραπεία ; Κατερίνα Κουτςογιάννθ φλλογοσ Ρευματοπακϊν Κριτθσ

Είναι εφικτι θ ςυναπόφαςθ του αςκενι ςτθ κεραπεία ; Κατερίνα Κουτςογιάννθ φλλογοσ Ρευματοπακϊν Κριτθσ Είναι εφικτι θ ςυναπόφαςθ του αςκενι ςτθ κεραπεία ; Κατερίνα Κουτςογιάννθ φλλογοσ Ρευματοπακϊν Κριτθσ Κοινόσ κεραπευτικόσ ςτόχοσ Ο πρωταρχικόσ ςτόχοσ τθσ κεραπείασ είναι θ μακροχρόνια βελτίωςη τησ ποιότητασ

Διαβάστε περισσότερα

Πανεπιςτήμιο Θεςςαλίασ. Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών Τομζασ: Συγκοινωνιακόσ

Πανεπιςτήμιο Θεςςαλίασ. Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών Τομζασ: Συγκοινωνιακόσ Πανεπιςτήμιο Θεςςαλίασ Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών Τομζασ: Συγκοινωνιακόσ Μάκθμα: Σχεδιαςμόσ και Λειτουργία Αεροπορικϊν Συςτθμάτων Ζτοσ 5 ο Οδθγόσ μακιματοσ 2013 2014 ΠΙΝΑΚΑ ΠΕΡΙΕΧΟΜΕΝΩΝ

Διαβάστε περισσότερα

Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Εθνικό Τυπογραφείο)

Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Εθνικό Τυπογραφείο) Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Εθνικό Τυπογραφείο) Ιοφνιοσ 2013 Περιεχόμενα: Ειςαγωγή... 3 1.Εθνικό Τυπογραφείο... 3 1.1. Είςοδοσ... 3 1.2. Αρχική Οθόνη... 4 1.3. Διεκπεραίωςη αίτηςησ...

Διαβάστε περισσότερα

Ζρευνα ικανοποίθςθσ τουριςτϊν

Ζρευνα ικανοποίθςθσ τουριςτϊν Ζρευνα ικανοποίθςθσ τουριςτϊν Ammon Ovis_Ζρευνα ικανοποίθςθσ τουριςτϊν_ Ραδιοςτακμόσ Flash 96 1 ΣΤΟΙΧΕΙΑ ΔΕΙΓΜΑΤΟΣ Σο δείγμα περιλαμβάνει 332 τουρίςτεσ από 5 διαφορετικζσ θπείρουσ. Οι περιςςότεροι εξ αυτϊν

Διαβάστε περισσότερα

ΒΙΟΛΟΓΟΙ ΓΙΑ ΦΥΣΙΚΟΥΣ

ΒΙΟΛΟΓΟΙ ΓΙΑ ΦΥΣΙΚΟΥΣ ΦΥΣΙΚΗ vs ΒΙΟΛΟΓΙΑ ΒΙΟΛΟΓΟΙ ΓΙΑ ΦΥΣΙΚΟΥΣ «Προτείνω να αναπτφξουμε πρώτα αυτό που κα μποροφςε να ζχει τον τίτλο: «ιδζεσ ενόσ απλοϊκοφ φυςικοφ για τουσ οργανιςμοφσ». Κοντολογίσ, τισ ιδζεσ που κα μποροφςαν

Διαβάστε περισσότερα

ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ. 3 ο Εργαςτιριο υγχρονιςμόσ Διεργαςιϊν

ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ. 3 ο Εργαςτιριο υγχρονιςμόσ Διεργαςιϊν ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ 3 ο Εργαςτιριο υγχρονιςμόσ Διεργαςιϊν Παράλλθλεσ Διεργαςίεσ (1/5) Δφο διεργαςίεσ λζγονται «παράλλθλεσ» (concurrent) όταν υπάρχει ταυτοχρονιςμόσ, δθλαδι οι εκτελζςεισ τουσ επικαλφπτονται

Διαβάστε περισσότερα

Διαδικαςία Προγράμματοσ Ωρομζτρθςθσ. (v.1.0.7)

Διαδικαςία Προγράμματοσ Ωρομζτρθςθσ. (v.1.0.7) (v.1.0.7) 1 Περίλθψθ Σο ςυγκεκριμζνο εγχειρίδιο δθμιουργικθκε για να βοθκιςει τθν κατανόθςθ τθσ Διαδικαςίασ Προγράμματοσ Ωρομζτρθςθσ. Παρακάτω προτείνεται μια αλλθλουχία ενεργειϊν τθν οποία ο χριςτθσ πρζπει

Διαβάστε περισσότερα

Πωσ δθμιουργώ φακζλουσ;

Πωσ δθμιουργώ φακζλουσ; Πωσ δθμιουργώ φακζλουσ; Για να μπορζςετε να δθμιουργιςετε φακζλουσ ςτο χαρτοφυλάκιό ςασ ςτο Mahara κα πρζπει να μπείτε ςτο ςφςτθμα αφοφ πατιςετε πάνω ςτο ςφνδεςμο Mahara profiles από οποιοδιποτε ςελίδα

Διαβάστε περισσότερα

Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Εθνικό Τυπογραφείο)

Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Εθνικό Τυπογραφείο) Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Εθνικό Τυπογραφείο) Πάτρα, 2013 Περιεχόμενα: Ειςαγωγή... 4 1. Επιμελητήριο... Error! Bookmark not defined. 1.1 Διαχειριςτήσ Αιτήςεων Επιμελητηρίου...

Διαβάστε περισσότερα

Διαχείριςη Εκπαιδευτικού Υλικού (ΠΑΚΕ) Πληροφοριακό Σύςτημα (MIS)

Διαχείριςη Εκπαιδευτικού Υλικού (ΠΑΚΕ) Πληροφοριακό Σύςτημα (MIS) Διαχείριςη Εκπαιδευτικού Υλικού (ΠΑΚΕ) Πληροφοριακό Σύςτημα (MIS) Ειςαγωγή Οι λειτουργίεσ διαχείριςθσ εκπαιδευτικοφ υλικοφ των ΠΑΚΕ διατίκενται ωσ εργαλείο ςτο Πλθροφοριακό Σφςτθμα (MIS) για τθ δθμιουργία

Διαβάστε περισσότερα

ΑΡΙΣΟΣΕΛΕΙΟ ΠΑΝΕΠΙΣΗΜΙΟ ΘΕΑΛΟΝΙΚΗ ΚΕΝΣΡΟ ΗΛΕΚΣΡΟΝΙΚΗ ΔΙΑΚΤΒΕΡΝΗΗ. Αποτελζςματα ζρευνασ αξιολογιςθσ υπθρεςιών ΚΗΔ

ΑΡΙΣΟΣΕΛΕΙΟ ΠΑΝΕΠΙΣΗΜΙΟ ΘΕΑΛΟΝΙΚΗ ΚΕΝΣΡΟ ΗΛΕΚΣΡΟΝΙΚΗ ΔΙΑΚΤΒΕΡΝΗΗ. Αποτελζςματα ζρευνασ αξιολογιςθσ υπθρεςιών ΚΗΔ ΑΡΙΣΟΣΕΛΕΙΟ ΠΑΝΕΠΙΣΗΜΙΟ ΘΕΑΛΟΝΙΚΗ ΚΕΝΣΡΟ ΗΛΕΚΣΡΟΝΙΚΗ ΔΙΑΚΤΒΕΡΝΗΗ Αποτελζςματα ζρευνασ αξιολογιςθσ υπθρεςιών ΚΗΔ Μάιοσ 2014 ΠΕΡΙΕΧΟΜΕΝΑ 1. Ειςαγωγι... 1 2. υνοπτικά αποτελζςματα... 1 2.1) Αξιολόγθςθ γενικισ

Διαβάστε περισσότερα

ΕΝΟΤΘΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΘ. ΚΕΦΑΛΑΙΟ 8: Πειρατεία Λογιςμικοφ

ΕΝΟΤΘΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΘ. ΚΕΦΑΛΑΙΟ 8: Πειρατεία Λογιςμικοφ ΕΝΟΤΘΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΘ ΚΕΦΑΛΑΙΟ 8: Πειρατεία Λογιςμικοφ Άδεια χριςθσ, Πειρατεία Λογιςμικοφ, Πιςτοποιθτικό Αυκεντικότθτασ, Δωρεάν Λογιςμικό (Freeware), Λογιςμικό Ανοικτοφ Κϊδικα (Open source)

Διαβάστε περισσότερα

Πειραματικι Ψυχολογία (ΨΧ66)

Πειραματικι Ψυχολογία (ΨΧ66) Πειραματικι Ψυχολογία (ΨΧ66) Διδάςκουςα: Αλεξάνδρα Οικονόμου Παρουςίαςη διαλζξεων: Πζτροσ Ροφςςοσ Διάλεξη 1 Ειςαγωγι Αντικείμενο και τρόποσ λειτουργίασ του μακιματοσ Τι είναι επιςτιμθ; Καλωςορίςατε ςτο

Διαβάστε περισσότερα

assessment.gr USER S MANUAL (users)

assessment.gr USER S MANUAL (users) assessment.gr USER S MANUAL (users) Human Factor January 2010 Περιεχόμενα 1. Γενικζσ οδθγίεσ ςυςτιματοσ... 3 1.1 Αρχικι ςελίδα... 3 1.2 Ερωτθματολόγια... 6 1.2.1 Τεςτ Γνϊςεων Γενικοφ Ρεριεχομζνου... 6

Διαβάστε περισσότερα

Περιφερειακό Ψθφιακό Αποκετιριο: Ανοικτά Δεδομζνα και Επιχειρθματικότθτα. Γ. Φραγκιαδάκθσ Κζντρο Επικοινωνιϊν και Δικτφων Πανεπιςτιμιο Κριτθσ

Περιφερειακό Ψθφιακό Αποκετιριο: Ανοικτά Δεδομζνα και Επιχειρθματικότθτα. Γ. Φραγκιαδάκθσ Κζντρο Επικοινωνιϊν και Δικτφων Πανεπιςτιμιο Κριτθσ Περιφερειακό Ψθφιακό Αποκετιριο: Ανοικτά Δεδομζνα και Επιχειρθματικότθτα Γ. Φραγκιαδάκθσ Κζντρο Επικοινωνιϊν και Δικτφων Πανεπιςτιμιο Κριτθσ Περιφερειακό υμβοφλιο Καινοτομίασ Κριτθσ Σο ΠΚΚ αποτελείται

Διαβάστε περισσότερα

ΟΔΗΓΙΕ ΓΙΑ ΣΗΝ ΕΙΑΓΩΓΗ ΕΚΔΡΟΜΩΝ & ΝΕΩΝ - ΑΝΑΚΟΙΝΩΕΩΝ ΣΗΝ ΙΣΟΕΛΙΔΑ ΣΗ Δ.Δ.Ε. ΘΕΠΡΩΣΙΑ

ΟΔΗΓΙΕ ΓΙΑ ΣΗΝ ΕΙΑΓΩΓΗ ΕΚΔΡΟΜΩΝ & ΝΕΩΝ - ΑΝΑΚΟΙΝΩΕΩΝ ΣΗΝ ΙΣΟΕΛΙΔΑ ΣΗ Δ.Δ.Ε. ΘΕΠΡΩΣΙΑ ΟΔΗΓΙΕ ΓΙΑ ΣΗΝ ΕΙΑΓΩΓΗ ΕΚΔΡΟΜΩΝ & ΝΕΩΝ - ΑΝΑΚΟΙΝΩΕΩΝ ΣΗΝ ΙΣΟΕΛΙΔΑ ΣΗ Δ.Δ.Ε. ΘΕΠΡΩΣΙΑ ΕΙΑΓΩΓΗ Ο νζοσ δικτυακόσ τόποσ τθσ Δ.Δ.Ε. Θεςπρωτίασ παρζχει πλζον τθ δυνατότθτα τθσ καταχϊρθςθσ νζων, ειδιςεων και

Διαβάστε περισσότερα

Ιδιότθτεσ πεδίων Γενικζσ.

Ιδιότθτεσ πεδίων Γενικζσ. Οι ιδιότθτεσ των πεδίων διαφζρουν ανάλογα με τον τφπο δεδομζνων που επιλζγουμε. Ορίηονται ςτο κάτω μζροσ του παρακφρου ςχεδίαςθσ του πίνακα, ςτθν καρτζλα Γενικζσ. Ιδιότθτα: Μζγεκοσ πεδίου (Field size)

Διαβάστε περισσότερα

Αποτελζςματα Ζρευνασ για τθν Απαςχολθςιμότθτα ςτθν Ελλάδα

Αποτελζςματα Ζρευνασ για τθν Απαςχολθςιμότθτα ςτθν Ελλάδα Αποτελζςματα Ζρευνασ για τθν Απαςχολθςιμότθτα ςτθν Ελλάδα Ιοφνιοσ 2017 Ταυτότθτα τθσ Ζρευνασ Η παροφςα ζρευνα διεξιχκθ το διάςτθμα Μαΐου - Ιουνίου 2017. Δείγμα: 180 επιχειριςεισ που δραςτθριοποιοφνται

Διαβάστε περισσότερα

ΤΙΤΛΟΣ: "SWITCH-ΠΩ ΝΑ ΚΑΣΑΦΕΡΕΙ ΣΗΝ ΑΛΛΑΓΗ ΟΣΑΝ Η ΑΛΛΑΓΗ ΕΙΝΑΙ ΔΤΚΟΛΗ" Σσγγραφείς: Chip Heath & Dan Heath. Εκδόζεις: Κσριάκος Παπαδόποσλος/ΕΕΔΕ

ΤΙΤΛΟΣ: SWITCH-ΠΩ ΝΑ ΚΑΣΑΦΕΡΕΙ ΣΗΝ ΑΛΛΑΓΗ ΟΣΑΝ Η ΑΛΛΑΓΗ ΕΙΝΑΙ ΔΤΚΟΛΗ Σσγγραφείς: Chip Heath & Dan Heath. Εκδόζεις: Κσριάκος Παπαδόποσλος/ΕΕΔΕ ΤΙΤΛΟΣ: "SWITCH-ΠΩ ΝΑ ΚΑΣΑΦΕΡΕΙ ΣΗΝ ΑΛΛΑΓΗ ΟΣΑΝ Η ΑΛΛΑΓΗ ΕΙΝΑΙ ΔΤΚΟΛΗ" Σσγγραφείς: Chip Heath & Dan Heath Εκδόζεις: Κσριάκος Παπαδόποσλος/ΕΕΔΕ www.dimitrazervaki.com Περιεχόμενα ΣΡΕΙ ΑΝΑΠΑΝΣΕΧΕ ΔΙΑΠΙΣΩΕΙ

Διαβάστε περισσότερα

Δείκτησ Αξιολόγηςησ 1.1: χολικόσ χώροσ, υλικοτεχνική υποδομή και οικονομικοί πόροι

Δείκτησ Αξιολόγηςησ 1.1: χολικόσ χώροσ, υλικοτεχνική υποδομή και οικονομικοί πόροι Δείκτησ Αξιολόγηςησ 1.1: χολικόσ χώροσ, υλικοτεχνική υποδομή και οικονομικοί πόροι ΣΟΜΕΑ 1: ΜΕΑ ΚΑΙ ΠΟΡΟΙ ΔΕΔΟΜΕΝΑ ΣΟΤ ΧΟΛΕΙΟΤ Περιγραφή: Ο ςυγκεκριμζνοσ δείκτθσ αναφζρεται ςτον βακμό που οι υπάρχοντεσ

Διαβάστε περισσότερα

ΕΝΟΤΘΤΑ 2: ΕΠΙΚΟΙΝΩΝΩ ΜΕ ΤΟΝ ΥΠΟΛΟΓΙΣΤΘ. ΚΕΦΑΛΑΙΟ 6: Θ «Βοικεια» ςτον Υπολογιςτι

ΕΝΟΤΘΤΑ 2: ΕΠΙΚΟΙΝΩΝΩ ΜΕ ΤΟΝ ΥΠΟΛΟΓΙΣΤΘ. ΚΕΦΑΛΑΙΟ 6: Θ «Βοικεια» ςτον Υπολογιςτι ΕΝΟΤΘΤΑ 2: ΕΠΙΚΟΙΝΩΝΩ ΜΕ ΤΟΝ ΥΠΟΛΟΓΙΣΤΘ ΚΕΦΑΛΑΙΟ 6: Θ «Βοικεια» ςτον Υπολογιςτι Βοικεια (Help), Ευρετιριο, Κόμβοσ, Λζξθ κλειδί, Σφνδεςμόσ, Υπερκείμενο Τι είναι θ «Βοικεια» ςτουσ υπολογιςτζσ; Πώσ ενεργοποιοφμε

Διαβάστε περισσότερα

Θέματα διπλωματικών εργαςιών ςτην ανάλυςη εικόνασ

Θέματα διπλωματικών εργαςιών ςτην ανάλυςη εικόνασ Εθνικό Μετςόβιο Πολυτεχνείο Εργαςτήριο Ευφυών Συςτημάτων, Περιεχομένου και Αλληλεπίδραςησ Θέματα διπλωματικών εργαςιών ςτην ανάλυςη εικόνασ 2010 2011 ΑΚΜΕ, ΣΟΠΚΚΑ ΧΑΡΑΚΣΗΡΚΣΚΚΑ, Θ ΚΑΣΑΣΜΗΗ; ΜΚΑ ΕΝΟΠΟΚΗΜΕΝΗ

Διαβάστε περισσότερα

Διαδικαςία Διαχείριςθσ Στθλϊν Βιβλίου Εςόδων - Εξόδων. (v.1.0.7)

Διαδικαςία Διαχείριςθσ Στθλϊν Βιβλίου Εςόδων - Εξόδων. (v.1.0.7) Διαδικαςία Διαχείριςθσ Στθλϊν Βιβλίου Εςόδων - Εξόδων (v.1.0.7) 1 Περίληψη Το ςυγκεκριμζνο εγχειρίδιο δθμιουργικθκε για να βοθκιςει τθν κατανόθςθ τθσ διαδικαςίασ διαχείριςθσ ςτθλών βιβλίου Εςόδων - Εξόδων.

Διαβάστε περισσότερα

ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ. 7 θ Διάλεξθ Διαχείριςθ Μνιμθσ Μζροσ Γ

ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ. 7 θ Διάλεξθ Διαχείριςθ Μνιμθσ Μζροσ Γ ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ 7 θ Διάλεξθ Διαχείριςθ Μνιμθσ Μζροσ Γ ελιδοποίθςθ (1/10) Σόςο θ κατάτμθςθ διαμεριςμάτων ςτακεροφ μεγζκουσ όςο και θ κατάτμθςθ διαμεριςμάτων μεταβλθτοφ και άνιςου μεγζκουσ δεν κάνουν

Διαβάστε περισσότερα

φντομη Παρουςίαςη epr.gr

φντομη Παρουςίαςη epr.gr φντομη Παρουςίαςη epr.gr Ζνα νζο διαδικτυακό εργαλείο που ζρχεται να αλλάξει τα δεδομζνα τθσ εταιρικισ επικοινωνίασ Ιοφνιοσ 2009 - Ζκδοςθ 1.3 Σι είναι το epr.gr To epr.gr αποτελεί τθν πρϊτθ διαδικτυακι

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ. ΚΕΦΑΛΑΙΟ 6: Το γραφικό περιβάλλον Επικοινωνίασ (Γ.Π.Ε)

ΕΝΟΤΗΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ. ΚΕΦΑΛΑΙΟ 6: Το γραφικό περιβάλλον Επικοινωνίασ (Γ.Π.Ε) ΕΝΟΤΗΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ ΚΕΦΑΛΑΙΟ 6: Το γραφικό περιβάλλον Επικοινωνίασ (Γ.Π.Ε) Γραφικό Περιβάλλον Επικοινωνίασ Περιβάλλον Εντολϊν Γραμμισ (Graphical User Interface/GUI), (Command Line Interface),

Διαβάστε περισσότερα

Μάθημα 9 ο ΤΕΧΝΙΚΕΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΙΚΟΝΙΚΗΣ ΜΝΗΜΗΣ

Μάθημα 9 ο ΤΕΧΝΙΚΕΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΙΚΟΝΙΚΗΣ ΜΝΗΜΗΣ Μάθημα 9 ο ΤΕΧΝΙΚΕΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΙΚΟΝΙΚΗΣ ΜΝΗΜΗΣ Ειςαγωγό Όπωσ είδαμε, ο χϊροσ εικονικϊν διευκφνςεων μνιμθσ που χρθςιμοποιεί κάκε διεργαςία, είναι αρκετά μεγαλφτεροσ από το χϊρο των φυςικϊν διευκφνςεων.

Διαβάστε περισσότερα

ςυςτιματα γραμμικϊν εξιςϊςεων

ςυςτιματα γραμμικϊν εξιςϊςεων κεφάλαιο 7 Α ςυςτιματα γραμμικϊν εξιςϊςεων αςικζσ ζννοιεσ Γραμμικά, λζγονται τα ςυςτιματα εξιςϊςεων ςτα οποία οι άγνωςτοι εμφανίηονται ςτθν πρϊτθ δφναμθ. Σα γραμμικά ςυςτιματα με δφο εξιςϊςεισ και δφο

Διαβάστε περισσότερα

ΣΑΞΗ: Το ςενάριο απευκφνεται ςε παιδιά προςχολικισ θλικίασ. ΤΜΒΑΣΟΣΗΣΑ ΜΕ ΣΟ ΔΕΠΠ ΚΑΙ ΑΠ ΜΑΘΗΜΑΣΙΚΩΝ

ΣΑΞΗ: Το ςενάριο απευκφνεται ςε παιδιά προςχολικισ θλικίασ. ΤΜΒΑΣΟΣΗΣΑ ΜΕ ΣΟ ΔΕΠΠ ΚΑΙ ΑΠ ΜΑΘΗΜΑΣΙΚΩΝ ΔΙΔΑΚΣΙΚΟ ΕΝΑΡΙΟ ΓΙΑ ΣΑ ΜΑΘΗΜΑΣΙΚΑ ΣΙΣΛΟ ΔΙΔΑΚΣΙΚΟΤ ΕΝΑΡΙΟΤ «Τα ςχιματα» ΕΜΠΛΕΚΟΜΕΝΕ ΓΝΩΣΙΚΕ ΠΕΡΙΟΧΕ Μακθματικά, Γλϊςςα, Πλθροφορικι ΣΑΞΗ: Το ςενάριο απευκφνεται ςε παιδιά προςχολικισ θλικίασ. ΔΙΑΡΚΕΙΑ:

Διαβάστε περισσότερα

Δείκτησ Αξιολόγηςησ 5.2: Ανάπτυξη και εφαρμογή ςχεδίων δράςησ για τη βελτίωςη του εκπαιδευτικοφ ζργου

Δείκτησ Αξιολόγηςησ 5.2: Ανάπτυξη και εφαρμογή ςχεδίων δράςησ για τη βελτίωςη του εκπαιδευτικοφ ζργου Δείκτησ Αξιολόγηςησ 5.2: Ανάπτυξη και εφαρμογή ςχεδίων δράςησ για τη βελτίωςη του εκπαιδευτικοφ ζργου ΣΟΜΕΑ 5: ΠΡΟΓΡΑΜΜΑΣΑ, ΠΑΡΕΜΒΑΕΙ ΚΑΙ ΔΡΑΕΙ ΒΕΛΣΙΩΗ ΔΙΑΔΙΚΑΙΕ ΣΟΤ ΧΟΛΕΙΟΤ Περιγραφή: Ο δείκτθσ αυτόσ

Διαβάστε περισσότερα

Epsilon Cloud Services

Epsilon Cloud Services 1 Περίλθψθ Το ςυγκεκριμζνο εγχειρίδιο δημιουργήθηκε για να βοηθήςει την κατανόηςη τησ λειτουργίασ και παραμετροποίηςησ του Epsilon Cloud Services ςτην εφαρμογή extra Λογιςτική Διαχείριςη. 2 2 Περιεχόμενα

Διαβάστε περισσότερα

Ειςαγωγι ςτο Δομθμζνο Προγραμματιςμό. Βαγγζλθσ Οικονόμου

Ειςαγωγι ςτο Δομθμζνο Προγραμματιςμό. Βαγγζλθσ Οικονόμου Ειςαγωγι ςτο Δομθμζνο Προγραμματιςμό Βαγγζλθσ Οικονόμου Περιεχόμενα Πλθροφορίεσ Μακιματοσ Δομθμζνοσ Προγραμματιςμόσ (Οριςμοί, Γενικζσ Ζννοιεσ) Αλγόρικμοι και Ψευδοκϊδικασ Γλϊςςα προγραμματιςμοφ C Πλθροφορίεσ

Διαβάστε περισσότερα

Δείκτησ Αξιολόγηςησ 5.1: Εκπαιδευτικά προγράμματα και καινοτομίεσ, υποςτηρικτικζσ και αντιςταθμιςτικζσ παρεμβάςεισ

Δείκτησ Αξιολόγηςησ 5.1: Εκπαιδευτικά προγράμματα και καινοτομίεσ, υποςτηρικτικζσ και αντιςταθμιςτικζσ παρεμβάςεισ Δείκτησ Αξιολόγηςησ 5.1: Εκπαιδευτικά προγράμματα και καινοτομίεσ, υποςτηρικτικζσ και αντιςταθμιςτικζσ παρεμβάςεισ ΣΟΜΕΑ 5: ΠΡΟΓΡΑΜΜΑΣΑ, ΠΑΡΕΜΒΑΕΙ ΚΑΙ ΔΡΑΕΙ ΒΕΛΣΙΩΗ ΔΙΑΔΙΚΑΙΕ ΣΟΤ ΧΟΛΕΙΟΤ Περιγραφή: Ο ςυγκεκριμζνοσ

Διαβάστε περισσότερα

Η ΠΟΙΟΣΗΣΑ ΔΙΔΑΚΑΛΙΑ ΚΑΙ ΣΟ ΔΤΝΑΜΙΚΟ ΜΟΝΣΕΛΟ ΕΚΠΑΙΔΕΤΣΙΚΗ ΑΠΟΣΕΛΕΜΑΣΙΚΟΣΗΣΑ

Η ΠΟΙΟΣΗΣΑ ΔΙΔΑΚΑΛΙΑ ΚΑΙ ΣΟ ΔΤΝΑΜΙΚΟ ΜΟΝΣΕΛΟ ΕΚΠΑΙΔΕΤΣΙΚΗ ΑΠΟΣΕΛΕΜΑΣΙΚΟΣΗΣΑ «Προωθώντασ την Ποιότητα και την Ιςότητα ςτην Εκπαίδευςη: Ανάπτυξη, Εφαρμογή και Αξιολόγηςη Παρεμβατικοφ Προγράμματοσ για Παροχή Ίςων Εκπαιδευτικών Ευκαιριών ςε όλουσ τουσ Μαθητζσ» Η ΠΟΙΟΣΗΣΑ ΔΙΔΑΚΑΛΙΑ

Διαβάστε περισσότερα

Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Περιφέρειες)

Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Περιφέρειες) Εγχειρίδιο Χρήςησ Προςωποποιημζνων Υπηρεςιών Γ.Ε.ΜΗ. (Περιφέρειες) Ιούνιοσ 2013 Περιεχόμενα: Ειςαγωγή... 3 1. Περιφζρεια... 3 1.1 Διαχειριςτήσ Αιτήςεων Περιφζρειασ... 3 1.1.1. Είςοδοσ... 3 1.1.2. Αρχική

Διαβάστε περισσότερα

Η ςθμαςία τθσ Αξιολόγθςθσ

Η ςθμαςία τθσ Αξιολόγθςθσ Η ςθμαςία τθσ Αξιολόγθςθσ Προςδιορίηει το κατά πόςο οι ςυμμετζχοντεσ επιτυγχάνουν τουσ προκακοριςμζνουσ ςτόχουσ. Βελτιϊνει τισ παρεχόμενεσ υπθρεςίεσ. Προάγει τθν υπευκυνότθτα. Προςδιορίηει εάν τα αναμενόμενα

Διαβάστε περισσότερα

Παράγοντεσ υμμετοχήσ Ενηλίκων ςτην Εκπαίδευςη: Ζητήματα Κινητοποίηςησ και Πρόςβαςησ ςε Οργανωμζνεσ Εκπαιδευτικζσ Δραςτηριότητεσ

Παράγοντεσ υμμετοχήσ Ενηλίκων ςτην Εκπαίδευςη: Ζητήματα Κινητοποίηςησ και Πρόςβαςησ ςε Οργανωμζνεσ Εκπαιδευτικζσ Δραςτηριότητεσ ΑΡΙΣΟΣΕΛΕΙΟ ΠΑΝΕΠΙΣΗΜΙΟ ΘΕΑΛΟΝΙΚΗ ΑΝΟΙΚΣΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΣΑ Παράγοντεσ υμμετοχήσ Ενηλίκων ςτην Εκπαίδευςη: Ζητήματα Κινητοποίηςησ και Πρόςβαςησ ςε Οργανωμζνεσ Εκπαιδευτικζσ Δραςτηριότητεσ Ενότητα 7:

Διαβάστε περισσότερα

Προςέγγιςη ςυςτημάτων και μηχανική ςυςτημάτων. Αντώνησ Μαΰργιώτησ

Προςέγγιςη ςυςτημάτων και μηχανική ςυςτημάτων. Αντώνησ Μαΰργιώτησ Προςέγγιςη ςυςτημάτων και μηχανική ςυςτημάτων Αντώνησ Μαΰργιώτησ Το έργο ωσ ςύςτημα Ζνα ζργο (project), ωσ μία εναλλακτικι κεώρθςθ, είναι ζνα ςφςτθμα ανκρϊπων, ςυςκευϊν, υλικϊν και όλων εκείνων των ςυςτατικϊν

Διαβάστε περισσότερα

Internet a jeho role v našem životě Το Διαδίκτυο και ο ρόλοσ του ςτθ ηωι μασ

Internet a jeho role v našem životě Το Διαδίκτυο και ο ρόλοσ του ςτθ ηωι μασ Internet a jeho role v našem životě Το Διαδίκτυο και ο ρόλοσ του ςτθ ηωι μασ Διαδίκτυο: μια πόρτα ςτον κόςμο Πϊσ μπορεί κανείσ ςε λίγα λεπτά να μάκει ποιεσ ταινίεσ παίηονται ςτουσ κινθματογράφουσ, να ςτείλει

Διαβάστε περισσότερα

ΡΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΑΧΕΣ ΟΓΑΝΩΣΗΣ & ΔΙΟΙΚΗΣΗΣ ΕΡΙΧΕΙΗΣΕΩΝ & ΥΡΗΕΣΙΩΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΡΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΑΧΕΣ ΟΓΑΝΩΣΗΣ & ΔΙΟΙΚΗΣΗΣ ΕΡΙΧΕΙΗΣΕΩΝ & ΥΡΗΕΣΙΩΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΡΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΑΧΕΣ ΟΓΑΝΩΣΗΣ & ΔΙΟΙΚΗΣΗΣ ΕΡΙΧΕΙΗΣΕΩΝ & ΥΡΗΕΣΙΩΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Α1. Να χαρακτηρίςετε τισ προτάςεισ που ακολουθοφν, γράφοντασ ςτο τετράδιό ςασ, δίπλα

Διαβάστε περισσότερα

Πόςεσ φορζσ επιςκζπτεςαι το Μeteo;

Πόςεσ φορζσ επιςκζπτεςαι το Μeteo; Το ερωτθματολόγιο του Meteo Ανάλυςθ των αποτελεςμάτων Πριν από λίγο καιρό το Μeteo ηιτθςε για πρϊτθ φορά τθ γνϊμθ ςασ, με ςτόχο οι υπθρεςίεσ που κακθμερινά εςείσ χρθςιμοποιείτε να γίνουν ακόμθ καλφτερεσ.

Διαβάστε περισσότερα

Διαδικηςακή εθαπμογή ανάλςζηρ και επεξεπγαζίαρ δεδομένων κςβεπνηηικών διαβοςλεύζεων. gov.insight. Η. Ζαβιτσάνος, Γ. Γιαννακόποσλος, Γ.

Διαδικηςακή εθαπμογή ανάλςζηρ και επεξεπγαζίαρ δεδομένων κςβεπνηηικών διαβοςλεύζεων. gov.insight. Η. Ζαβιτσάνος, Γ. Γιαννακόποσλος, Γ. Διαδικηςακή εθαπμογή ανάλςζηρ και επεξεπγαζίαρ δεδομένων κςβεπνηηικών διαβοςλεύζεων gov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόποσλος, Γ. Παλιούρας 2 από 21 gov.insight Τι είναι το gov.insight και ποφ αποςκοπεί;

Διαβάστε περισσότερα

Τεχνικζσ Ανάλυςησ Διοικητικών Αποφάςεων

Τεχνικζσ Ανάλυςησ Διοικητικών Αποφάςεων Τεχνικζσ Ανάλυςησ Διοικητικών Αποφάςεων Ενότητα 3: υςτιματα ουρϊν αναμονισ Κακθγθτισ Γιάννθσ Γιαννίκοσ χολι Οργάνωςθσ και Διοίκθςθσ Επιχειριςεων Σμιμα Διοίκθςθσ Επιχειριςεων Σκοποί ενότητασ Μελζτθ ςυςτθμάτων

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΖσ ΒΆΕΩΝ ΔΕΔΟΜΖΝΩΝ ΚΑΙ ΔΙΑΔΙΚΣΥΟΤ. Ειρινθ Φιλιοποφλου

ΕΦΑΡΜΟΓΖσ ΒΆΕΩΝ ΔΕΔΟΜΖΝΩΝ ΚΑΙ ΔΙΑΔΙΚΣΥΟΤ. Ειρινθ Φιλιοποφλου ΕΦΑΡΜΟΓΖσ ΒΆΕΩΝ ΔΕΔΟΜΖΝΩΝ ΚΑΙ ΔΙΑΔΙΚΣΥΟΤ Ειρινθ Φιλιοποφλου Ειςαγωγι Ο Παγκόςμιοσ Ιςτόσ (World Wide Web - WWW) ι πιο απλά Ιςτόσ (Web) είναι μία αρχιτεκτονικι για τθν προςπζλαςθ διαςυνδεδεμζνων εγγράφων

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑΣΙΜΟ ΠΑΡΑΓΩΓΗ E ΕΞΑΜΗΝΟ. ΔΙΔΑΚΩΝ: ΔΡ. ΝΙΚΟΛΑΟ ΡΑΧΑΝΙΩΣΗ ΓΡΑΦΕΙΟ: 312 ΣΗΛ.:

ΠΡΟΓΡΑΜΜΑΣΙΜΟ ΠΑΡΑΓΩΓΗ E ΕΞΑΜΗΝΟ. ΔΙΔΑΚΩΝ: ΔΡ. ΝΙΚΟΛΑΟ ΡΑΧΑΝΙΩΣΗ ΓΡΑΦΕΙΟ: 312 ΣΗΛ.: ΠΡΟΓΡΑΜΜΑΣΙΜΟ ΠΑΡΑΓΩΓΗ E ΕΞΑΜΗΝΟ ΔΙΔΑΚΩΝ: ΔΡ. ΝΙΚΟΛΑΟ ΡΑΧΑΝΙΩΣΗ ΓΡΑΦΕΙΟ: 312 ΣΗΛ.: 210-4142150 E-mail: nraxan@unipi.gr, nickrah@hotmail.com 1 Αντικείμενο μαθήματος Ο Προγραμματιςμόσ και Ζλεγχοσ Παραγωγισ

Διαβάστε περισσότερα

Νικόλαοσ Μ. Σαλτερισ Σχολικόσ Σφμβουλοσ Δ.Ε. Δρ. Πολιτικισ Επιςτιμθσ και Ιςτορίασ Μζλοσ ΔΣ Πανελλινιασ Ζνωςθσ Σχολικϊν Συμβοφλων

Νικόλαοσ Μ. Σαλτερισ Σχολικόσ Σφμβουλοσ Δ.Ε. Δρ. Πολιτικισ Επιςτιμθσ και Ιςτορίασ Μζλοσ ΔΣ Πανελλινιασ Ζνωςθσ Σχολικϊν Συμβοφλων Νικόλαοσ Μ. Σαλτερισ Σχολικόσ Σφμβουλοσ Δ.Ε. Δρ. Πολιτικισ Επιςτιμθσ και Ιςτορίασ Μζλοσ ΔΣ Πανελλινιασ Ζνωςθσ Σχολικϊν Συμβοφλων Δομι ειςιγθςθσ Επιςτθμονικζσ Προςεγγίςεισ τθσ Αξιολόγθςθσ ςτθν Εκπαίδευςθ

Διαβάστε περισσότερα

Ηλεκτρονικι Υπθρεςία Ολοκλθρωμζνθσ Διαχείριςθσ Συγγραμμάτων και Λοιπϊν Βοθκθμάτων

Ηλεκτρονικι Υπθρεςία Ολοκλθρωμζνθσ Διαχείριςθσ Συγγραμμάτων και Λοιπϊν Βοθκθμάτων Ηλεκτρονικι Υπθρεςία Ολοκλθρωμζνθσ Διαχείριςθσ Συγγραμμάτων και Λοιπϊν Βοθκθμάτων ΟΔΗΓΟΣ ΕΦΑΡΜΟΓΗΣ ΒΙΒΛΙΟΘΗΚΩΝ ΙΔΡΥΜΑΤΩΝ 1/13 2/13 Οδθγίεσ Χριςθσ Εφαρμογισ Βιβλιοκθκϊν Ιδρυμάτων 1. Είςοδοσ ςτθν Εφαρμογι

Διαβάστε περισσότερα

ΕΝΟΣΗΣΑ 1: ΓΝΩΡIΖΩ ΣΟΝ ΤΠΟΛΟΓΙΣΗ. ΚΕΦΑΛΑΙΟ 2: Σο Τλικό του Τπολογιςτι

ΕΝΟΣΗΣΑ 1: ΓΝΩΡIΖΩ ΣΟΝ ΤΠΟΛΟΓΙΣΗ. ΚΕΦΑΛΑΙΟ 2: Σο Τλικό του Τπολογιςτι ΕΝΟΣΗΣΑ 1: ΓΝΩΡIΖΩ ΣΟΝ ΤΠΟΛΟΓΙΣΗ ΚΕΦΑΛΑΙΟ 2: Σο Τλικό του Τπολογιςτι Τλικό υπολογιςτι (Hardware), Προςωπικόσ Τπολογιςτισ (ΡC), υςκευι ειςόδου, υςκευι εξόδου, Οκόνθ (Screen), Εκτυπωτισ (Printer), αρωτισ

Διαβάστε περισσότερα

Δείκτθσ Αξιολόγθςθσ 2.1: Οργάνωςθ και ςυντονιςμόσ τθσ ςχολικισ ηωισ

Δείκτθσ Αξιολόγθςθσ 2.1: Οργάνωςθ και ςυντονιςμόσ τθσ ςχολικισ ηωισ Δείκτθσ Αξιολόγθςθσ 2.1: Οργάνωςθ και ςυντονιςμόσ τθσ ςχολικισ ηωισ ΤΟΜΕΑΣ 2: ΗΓΕΣΙΑ ΚΑΙ ΔΙΟΙΚΗΣΗ ΤΟΥ ΣΧΟΛΕΙΟΥ ΔΙΑΔΙΚΑΣΙΕΣ ΤΟΥ ΣΧΟΛΕΙΟΥ Περιγραφι: Ο ςυγκεκριμζνοσ δείκτθσ εξετάηει τισ πρακτικζσ του ςχολείου

Διαβάστε περισσότερα

Δομζσ Δεδομζνων Πίνακεσ

Δομζσ Δεδομζνων Πίνακεσ Δομζσ Δεδομζνων Πίνακεσ Διάλεξθ 2 Περιεχόμενα Πίνακεσ: Οριςμοί, Γενικζσ ζννοιεσ Αποκικευςθ πινάκων Ειδικζσ μορφζσ πινάκων Αλγόρικμοι Αναηιτθςθσ Σειριακι Αναηιτθςθ Δυαδικι Αναηιτθςθ Οριςμοί, Γενικζσ ζννοιεσ

Διαβάστε περισσότερα

Aux.Magazine Μπιλμπάο, Βιηκάγια, Ιςπανία www.auxmagazine.com Προςωπικά δεδομζνα

Aux.Magazine Μπιλμπάο, Βιηκάγια, Ιςπανία www.auxmagazine.com Προςωπικά δεδομζνα Προςωπικά δεδομζνα Η Λείρ Ναγιάλα, θ Σίλβια Αντρζσ, θ Χουάνα Γκαλβάν και θ Γερμάν Καςτανζντα δθμιοφργθςαν τθ δικι τουσ εταιρία, τθν AUXILIARTE FACTORIA το 2004. Ζχοντασ και ςυνειδθτοποίθςαν ότι μοιράηονταν

Διαβάστε περισσότερα

Διαδικασία Δημιοσργίας Ειδικών Λογαριασμών. (v.1.0.7)

Διαδικασία Δημιοσργίας Ειδικών Λογαριασμών. (v.1.0.7) Διαδικασία Δημιοσργίας Ειδικών Λογαριασμών (v.1.0.7) 1 Περίληψη Το ςυγκεκριμζνο εγχειρίδιο δημιουργήθηκε για να βοηθήςει την κατανόηςη τησ διαδικαςίασ δημιουργίασ ειδικών λογαριαςμών. Παρακάτω προτείνεται

Διαβάστε περισσότερα

Ερωτηματολόγιο ικανοποίηςησ των μελϊν του ΤΥΠΕΤ ςε ςχζςη με τισ προςφερόμενεσ υπηρεςίεσ

Ερωτηματολόγιο ικανοποίηςησ των μελϊν του ΤΥΠΕΤ ςε ςχζςη με τισ προςφερόμενεσ υπηρεςίεσ Προφίλ έρευνασ Η ζρευνα διεξιχκθ μεταξφ Μαΐου και Ιουνίου 2017 ςε όλθ τθν Ελλάδα για λογαριαςμό του ΣΤΠΕΣ. τθν ζρευνα ςυμμετείχαν 3.088 άτομα και είχαν τθν ακόλουκθ ςφνκεςθ Γενικά Συμπεράςματα Η ςυμμετοχι

Διαβάστε περισσότερα

Ηλεκτρονικι Επιχειρθςιακι Δράςθ Εργαςτιριο 1

Ηλεκτρονικι Επιχειρθςιακι Δράςθ Εργαςτιριο 1 1. Εγκατάςταςη Xampp Προκειμζνου να γίνει θ εγκατάςταςθ κα πρζπει πρϊτα να κατεβάςετε και εγκαταςτιςετε το XAMPP ωσ ακολοφκωσ. 1.1. Πάμε ςτθν ακόλουκθ διεφκυνςθ https://www.apachefriends.org/download.html

Διαβάστε περισσότερα

Συηιτθςθ με κζμα «Τι πρζπει να κάνουμε για να προετοιμαςτοφμε ςε περίπτωςθ ςειςμοφ», παρακολοφκθςθ ςχετικϊν video, ανάγνωςθ βιβλίων.

Συηιτθςθ με κζμα «Τι πρζπει να κάνουμε για να προετοιμαςτοφμε ςε περίπτωςθ ςειςμοφ», παρακολοφκθςθ ςχετικϊν video, ανάγνωςθ βιβλίων. Συηιτθςθ με κζμα «Τι πρζπει να κάνουμε για να προετοιμαςτοφμε ςε περίπτωςθ ςειςμοφ», παρακολοφκθςθ ςχετικϊν video, ανάγνωςθ βιβλίων. Καταγραφι των ιδεϊν. (Γλϊςςα- Παραγωγι Προφορικϊν Κειμζνων) Τα παιδιά

Διαβάστε περισσότερα

Διαχείριςη έργου. Αντώνησ Μαΰργιώτησ Msc, PhD Πληροφορικήσ

Διαχείριςη έργου. Αντώνησ Μαΰργιώτησ Msc, PhD Πληροφορικήσ Διαχείριςη έργου Αντώνησ Μαΰργιώτησ Msc, PhD Πληροφορικήσ Ανάλυςη Βαςικών εννοιών για τα έργα (1) Τα ζργα υπιρξαν μζροσ τθσ ανκρώπινθσ ηωισ από τθ ςτιγμι που ξεκίνθςε ο πολιτιςμόσ. Η ανάγκθ για οργάνωςθ

Διαβάστε περισσότερα

TIM Εικονικό Περιβάλλον Συνεργασίας Οδθγίεσ Χριςθσ

TIM Εικονικό Περιβάλλον Συνεργασίας Οδθγίεσ Χριςθσ www.timproject.eu www.tim.project-platform.eu TIM Εικονικό Περιβάλλον Συνεργασίας Οδθγίεσ Χριςθσ This project has been founded with support form the European Commission. This presentation reflects the

Διαβάστε περισσότερα

Ρομποτική. Η υγεία ςασ το αξίηει

Ρομποτική. Η υγεία ςασ το αξίηει Ρομποτική Μάκετε γριγορά και εφκολα ό τι χρειάηεται να ξζρετε για τισ λαπαροςκοπικζσ μεκόδουσ αντιμετϊπιςθσ γυναικολογικϊν πακιςεων Ενθμερωκείτε ςωςτά και υπεφκυνα Η υγεία ςασ το αξίηει Μζκοδοσ και πλεονεκτιματα

Διαβάστε περισσότερα

Πολυτεχνική Σχολή. Οδθγόσ Σπουδϊν

Πολυτεχνική Σχολή. Οδθγόσ Σπουδϊν Πολυτεχνική Σχολή Οδθγόσ Σπουδϊν Μεταπτυχιακό Πρό γραμμα Δόμόςτατική σ Μήχανική σ ΚΟΠΟ Το MSc in Structural Engineering παρζχει ςε Πολιτικοφσ Μθχανικοφσ και άλλουσ ςχετικοφσ πτυχιοφχουσ μία ςυγκεντρωμζνθ

Διαβάστε περισσότερα

Εισαγωγικές έννοιες. Αντώνησ Κ Μαώργιώτησ

Εισαγωγικές έννοιες. Αντώνησ Κ Μαώργιώτησ Εισαγωγικές έννοιες Αντώνησ Κ Μαώργιώτησ Έννοιεσ που πρϋπει να επιβεβαιώςουμε ότι τισ ξϋρουμε (1) - αναζότηςη Ιςτοςελίδα Αρχείο που περιζχει πλθροφορίεσ προοριςμζνεσ για δθμοςίευςθ ςτο Παγκόςμιο Ιςτό (www).

Διαβάστε περισσότερα

Τυπικζσ Γλϊςςεσ Περιγραφισ Υλικοφ Εργαςτιριο 1

Τυπικζσ Γλϊςςεσ Περιγραφισ Υλικοφ Εργαςτιριο 1 Τμήμα Μησανικών Πληποφοπικήρ, Τ.Ε.Ι. Ηπείπος Ακαδημαϊκό Έτορ 2016-2017, 6 ο Εξάμηνο Τυπικζσ Γλϊςςεσ Περιγραφισ Υλικοφ Εργαςτιριο 1 Διδάςκων Τςιακμάκθσ Κυριάκοσ, Phd MSc in Electronic Physics (Radioelectrology)

Διαβάστε περισσότερα

Παράςταςη ακεραίων ςτο ςυςτημα ςυμπλήρωμα ωσ προσ 2

Παράςταςη ακεραίων ςτο ςυςτημα ςυμπλήρωμα ωσ προσ 2 Παράςταςη ακεραίων ςτο ςυςτημα ςυμπλήρωμα ωσ προσ 2 Δρ. Χρήζηος Ηλιούδης Μθ Προςθμαςμζνοι Ακζραιοι Εφαρμογζσ (ςε οποιαδιποτε περίπτωςθ δεν χρειάηονται αρνθτικοί αρικμοί) Καταμζτρθςθ. Διευκυνςιοδότθςθ.

Διαβάστε περισσότερα

Ανάπτυξη Εφαρμογών Σε Προγραμματιςτικό Περιβάλλον

Ανάπτυξη Εφαρμογών Σε Προγραμματιςτικό Περιβάλλον Γραπτι Εξζταςθ ςτο μάκθμα Ανάπτυξη Εφαρμογών Σε Προγραμματιςτικό Περιβάλλον Όνομα: Επϊνυμο: Τμιμα: Ημερομθνία: 20/02/11 Θζμα 1 ο Α. Να χαρακτθρίςετε κακεμιά από τισ παρακάτω προτάςεισ ωσ Σωςτι (Σ) ι Λάκοσ

Διαβάστε περισσότερα

Το έργο υλοποιείται ςτο πλαίςιο τησ δημιουργίασ βίντεο για τα MOOC του υποέργου 4 με τίτλο «Μονάδα Εςωτερικήσ Αξιολόγηςησ και Επιμόρφωςησ» τησ Πράξησ

Το έργο υλοποιείται ςτο πλαίςιο τησ δημιουργίασ βίντεο για τα MOOC του υποέργου 4 με τίτλο «Μονάδα Εςωτερικήσ Αξιολόγηςησ και Επιμόρφωςησ» τησ Πράξησ Το έργο υλοποιείται ςτο πλαίςιο τησ δημιουργίασ βίντεο για τα MOOC του υποέργου 4 με τίτλο «Μονάδα Εςωτερικήσ Αξιολόγηςησ και Επιμόρφωςησ» τησ Πράξησ «Ελληνικό Ανοικτό Πανεπιςτήμιο», η οποία έχει ενταχθεί

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ 2: ΕΠΙΚΟΙΝΩΝΩ ΜΕ ΤΟΝ ΥΠΟΛΟΓΙΣΤΗ. ΚΕΦΑΛΑΙΟ 5: Αρχεία - Φάκελοι

ΕΝΟΤΗΤΑ 2: ΕΠΙΚΟΙΝΩΝΩ ΜΕ ΤΟΝ ΥΠΟΛΟΓΙΣΤΗ. ΚΕΦΑΛΑΙΟ 5: Αρχεία - Φάκελοι ΕΝΟΤΗΤΑ 2: ΕΠΙΚΟΙΝΩΝΩ ΜΕ ΤΟΝ ΥΠΟΛΟΓΙΣΤΗ Αρχείο (File) Φάκελοσ (Folder) Διαχειριςτισ Αρχείων (File Manager) Τφποι Αρχείων Σε τι εξυπθρετεί θ οργάνωςθ των εργαςιϊν μασ ςτουσ υπολογιςτζσ; Πϊσ κα οργανϊςουμε

Διαβάστε περισσότερα

Δια-γενεακι κινθτικότθτα

Δια-γενεακι κινθτικότθτα Δια-γενεακι κινθτικότθτα Κατά κανόνα οι τρζχουςεσ επιλογζσ των ατόμων ζχουν ςυνζπειεσ ςτο μζλλον (δυναμικι ςχζςθ). Σε ότι αφορά τισ επιλογζσ των ατόμων ςε ςχζςθ με τθν εκπαίδευςθ γνωρίηουμε ότι τα άτομα

Διαβάστε περισσότερα

Ανϊτερεσ πνευματικζσ λειτουργίεσ Μνιμθ Μάκθςθ -Συμπεριφορά

Ανϊτερεσ πνευματικζσ λειτουργίεσ Μνιμθ Μάκθςθ -Συμπεριφορά Ανϊτερεσ πνευματικζσ λειτουργίεσ Μνιμθ Μάκθςθ -Συμπεριφορά Οδθγίεσ Προτείνεται να γίνει ςαφισ ο ρόλοσ κάκε τμιματοσ του ΚΝΣ και να αναδειχκεί θ ςχζςθ που ζχουν τα μζρθ αυτά με τισ ανϊτερεσ πνευματικζσ

Διαβάστε περισσότερα

TA EΠΑΓΓΕΛΜΑΣΑ ΠΛΗΡΟΦΟΡΙΚΗ ΣΟΤ ΜΕΛΛΟΝΣΟ. Γυμνάςιο Αμυνταίου Β1

TA EΠΑΓΓΕΛΜΑΣΑ ΠΛΗΡΟΦΟΡΙΚΗ ΣΟΤ ΜΕΛΛΟΝΣΟ. Γυμνάςιο Αμυνταίου Β1 TA EΠΑΓΓΕΛΜΑΣΑ ΠΛΗΡΟΦΟΡΙΚΗ ΣΟΤ ΜΕΛΛΟΝΣΟ Γυμνάςιο Αμυνταίου Β1 Ποια είναι τα ιδανικά επαγγζλματα για να μπορζςω να είμαι ευτυχιςμζνοσ και επιτυχθμζνοσ ςτο μζλλον; Σι ζχει αλλάξει τα τελευταία χρόνια ςτο

Διαβάστε περισσότερα

Διαγωνιςμόσ "Μακθτζσ ςτθν Ζρευνα (ΜΕΡΑ) 2011-2012"

Διαγωνιςμόσ Μακθτζσ ςτθν Ζρευνα (ΜΕΡΑ) 2011-2012 Διαγωνιςμόσ "Μακθτζσ ςτθν Ζρευνα (ΜΕΡΑ) 2011-2012" Ο Διαγωνιςμόσ «ΜΕΡΑ» προκθρφςςεται από το 2001 ςε ετιςια βάςθ, ωσ αποτζλεςμα τθσ διαπίςτωςθσ ότι θ καλλιζργεια πνεφματοσ δθμιουργικότθτασ και πρωτοβουλίασ

Διαβάστε περισσότερα

Διαχείριςη Κοςτολόγηςησ

Διαχείριςη Κοςτολόγηςησ Διαχείριςη Κοςτολόγηςησ 1 Περίληψη Το ςυγκεκριμζνο εγχειρίδιο δημιουργήθηκε για να βοηθήςει την κατανόηςη τησ διαδικαςίασ Κοςτολόγηςησ ςτην εφαρμογή Λογιςτική Διαχείριςη τησ Business. Παρακάτω προτείνεται

Διαβάστε περισσότερα

Προπτυχιακό Πρόγραμμα ςτην Πληροφορική. Οδθγόσ Σπουδϊν

Προπτυχιακό Πρόγραμμα ςτην Πληροφορική. Οδθγόσ Σπουδϊν Προπτυχιακό Πρόγραμμα ςτην Πληροφορική Οδθγόσ Σπουδϊν ΕΙΑΓΩΓΗ Αμερικανικζσ πανεπιςτημιακζσ ςπουδζσ ςτην Πληροφορική Κατά τθ διάρκεια των προπτυχιακϊν ςπουδϊν ςτθν Πλθροφορικι (BSIT), οι φοιτθτζσ αποκτοφν

Διαβάστε περισσότερα

Η θεωρία τησ ςτατιςτικήσ ςε ερωτήςεισ-απαντήςεισ Μέροσ 1 ον (έωσ ομαδοποίηςη δεδομένων)

Η θεωρία τησ ςτατιςτικήσ ςε ερωτήςεισ-απαντήςεισ Μέροσ 1 ον (έωσ ομαδοποίηςη δεδομένων) 1)Πώσ ορύζεται η Στατιςτικό επιςτόμη; Στατιςτικι είναι ζνα ςφνολο αρχϊν και μεκοδολογιϊν για: το ςχεδιαςμό τθσ διαδικαςίασ ςυλλογισ δεδομζνων τθ ςυνοπτικι και αποτελεςματικι παρουςίαςι τουσ τθν ανάλυςθ

Διαβάστε περισσότερα

Δίκτυο Natura 2000 Συνεργαςία για τθν Προςταςία τθσ Φφςθσ. Δζςπω Ζαβροφ Λειτουργόσ Περιβάλλοντοσ Τμιμα Περιβάλλοντοσ

Δίκτυο Natura 2000 Συνεργαςία για τθν Προςταςία τθσ Φφςθσ. Δζςπω Ζαβροφ Λειτουργόσ Περιβάλλοντοσ Τμιμα Περιβάλλοντοσ Δίκτυο Natura 2000 Συνεργαςία για τθν Προςταςία τθσ Φφςθσ Δζςπω Ζαβροφ Λειτουργόσ Περιβάλλοντοσ Τμιμα Περιβάλλοντοσ Στόχοσ Δικτφου Natura 2000 Διατιρθςθ, προςταςία και βελτίωςθ φυςικϊν οικοτόπων και άγριων

Διαβάστε περισσότερα

Δημιουργία Εντφπων Intrastat και Ανακεφαλαιωτικοφ Πίνακα

Δημιουργία Εντφπων Intrastat και Ανακεφαλαιωτικοφ Πίνακα Δημιουργία Εντφπων Intrastat και Ανακεφαλαιωτικοφ Πίνακα 1 Περίληψη Το ςυγκεκριμζνο εγχειρίδιο δημιουργήθηκε για να βοηθήςει την κατανόηςη τησ διαδικαςίασ δημιουργίασ Εντφπων Intrastat και Ανακεφαλαιωτικοφ

Διαβάστε περισσότερα

Γ' ΛΥΚΕΙΟΥ Η ΤΑΞΗ ΤΗΣ ΤΕΛΙΚΗΣ ΕΠΙΛΟΓΗΣ. Στθ ΓϋΛυκείου οι Ομάδεσ Προςανατολιςμοφ είναι τρεισ:

Γ' ΛΥΚΕΙΟΥ Η ΤΑΞΗ ΤΗΣ ΤΕΛΙΚΗΣ ΕΠΙΛΟΓΗΣ. Στθ ΓϋΛυκείου οι Ομάδεσ Προςανατολιςμοφ είναι τρεισ: Γ' ΛΥΚΕΙΟΥ Η ΤΑΞΗ ΤΗΣ ΤΕΛΙΚΗΣ ΕΠΙΛΟΓΗΣ Στθ ΓϋΛυκείου οι Ομάδεσ Προςανατολιςμοφ είναι τρεισ: 1. Ομάδα Ανκρωπιςτικών Σπουδών 2. Ομάδα Οικονομικών, Πολιτικών, Κοινωνικών & Παιδαγωγικών Σπουδών 3. Ομάδα Θετικών

Διαβάστε περισσότερα