Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download ""

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΟΛΟΓΩΝ ΚΑΙ ΑΕΡΟΝΑΥΠΗΓΩΝ ΜΗΧΑΝΙΚΩΝ Ι ΑΚΤΟΡΙΚΗ ΙΑΤΡΙΒΗ «ΙΑΧΕΙΡΙΣΗ ΣΥΝ ΥΑΣΜΕΝΩΝ ΜΕΤΑΦΟΡΙΚΩΝ ΣΥΝΑΛΛΑΓΩΝ ΜΕΣΩ ΤΗΣ ΟΛΟΚΛΗΡΩΣΗΣ ΥΒΡΙ ΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΣΥΣΤΑΣΕΩΝ ΚΑΙ ΤΕΧΝΙΚΩΝ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ» ΑΛΕΞΙΟΣ Η. ΛΑΖΑΝΑΣ ΠΤΥΧΙΟΥΧΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ (ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ) ΠΑΤΡΑ, ΕΚΕΜΒΡΙΟΣ 2008

2

3

4

5 ΕΥΧΑΡΙΣΤΙΕΣ Η παρούσα διδακτορική διατριβή είναι η κατάληξη µιας πορείας επτά ετών. Όλο αυτό το διάστηµα βρέθηκαν δίπλα µου πολλοί άνθρωποι που µου πρόσφεραν τη βοήθειά τους σε διάφορα επίπεδα, τους οποίους και ευχαριστώ. Κατ αρχήν, θα ήθελα να ευχαριστήσω τον Νίκο Καρακαπιλίδη, επιβλέποντα καθηγητή της διατριβής µου, για την συνεργασία µας όλα αυτά τα χρόνια. Οι υποδείξεις και η ενθάρρυνσή του ήταν πολύτιµες. Τους Μανώλη Αδαµίδη και Κλεάνθη Θραµπουλίδη, µέλη της Τριµελούς Επιτροπής παρακολούθησης της διατριβής µου. Τον Σταύρο ηµόπουλο, συνάδελφο υποψήφιο διδάκτορα, για τη βοήθειά του σε τεχνολογίες αιχµής και για τις άµεσες απαντήσεις στα συνήθως πολύπλοκα ερωτήµατά µου. Τον Γιάννη Μουζακίτη, µε τον οποίο ξεκινήσαµε και τελειώνουµε µαζί το ταξίδι αυτό. Μέσα από άγχη, αγωνίες, θυµούς και απογοητεύσεις, µάθαµε κι οι δύο πόσο σηµαντικός είναι ο ένας για τον άλλον. Τον ηµήτρη Κολοστούµπη, για τη συµπαράστασή του σε δύσκολες προσωπικές στιγµές. Τη γυναίκα µου Μαργαρίτα και τους γονείς µου Ηλία και Ευγενία που στάθηκαν ακούραστα δίπλα µου, στηρίζοντάς µε συναισθηµατικά και οικονοµικά. Τέλος, ένα µεγάλο ευχαριστώ στην Εύα που απλά υπάρχει πέρα και πάνω από όλα αυτά. Αλέξης Η. Λαζανάς i

6 ii

7 ΛΙΣΤΑ ΗΜΟΣΙΕΥΣΕΩΝ Karacapilidis N., Lazanas, A., Megalokonomos, G. and Moraitis, P. (2006). On the Development of a Web-based System for Transportation Services. Information Sciences, 176(13), pp Lazanas, A. and Karacapilidis, N. (2007). On the Integration of Hybrid Recommendation Techniques into an Agent Based Transportation Transactions Management Platform. Submitted to International Journal on Artificial Intelligence Tools. Lazanas, A. and Karacapilidis, N. (2008). Augmenting the recommendation process of a transportation management system through data mining. Submitted to International Journal of Advanced Intelligence Paradigms. Karacapilidis, N., Lazanas, A. and Moraitis, P. (2003). An Agent-Mediated Marketplace for Transportation Transactions. In Proceedings of the 5th International Conference on Enterprise Information Systems (ICEIS 2003), Angers, France, April 23-26, 2003, pp Lazanas, A., Evangelou C.E. and Karacapilidis, N. (2005). Ontology-Driven Decision Making in Transportation Transactions Management. In Proceedings of the 8th International Conference on Business Information Systems (BIS 2005), Poznan, Poland, April 20-22, 2005, pp Karacapilidis N., Lazanas, A. and Pyrovolakis, Y. (2005). On construction and evaluation of alternative transportation solutions through a multi-agent system. In Proceedings of the 7th Conference of Operational Research, Constanta, Romania, May 25-28, 2005, pp Lazanas, A. and Megalokonomos, G. (2006). Optimizing Alternative Routes Retrieval in an Agent based Transportation Management System. In Proceedings of the International Conference on Service Systems and Service Management (ICSSSM 2006), Troyes, France, October 25-27, 2006, pp Lazanas, A., Karacapilidis, N. and Pirovolakis, Y. (2006). Providing Recommendations in an Agent - Based Transportation Transactions Management Platform. In Proceedings of the 8th International Conference on iii

8 Enterprise Information Systems (ICEIS 2006), Pafos, Cyprus, May 23-27, 2006, pp Lazanas A., Karacapilidis, N. and Katsoulis V. (2007). Applying Hybrid Recommendation Policies through Agent-Invoked Web Services in E-Markets. In Proceedings of the 9th International Conference on Enterprise Information Systems (ICEIS 2007), Madeira, Portugal, June 12-16, 2007, pp Lazanas, A. and Karacapilidis, N. (2008). Enhancing Recommendations through a Data Mining Algorithm. In Proceedings of the 12th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems (KES 2008), Zagreb, Croatia, September 3-5, 2008, pp Λαζανάς, Α., Καρακαπιλίδης, Ν. και Μωραϊτης, Π. (2003). Πολυ-πρακτορική Ηλεκτρονική Αγορά για διαχείριση µεταφορών αγαθών. 15ο Εθνικό Συνέδριο της Ελληνικής Εταιρείας Επιχειρησιακών Ερευνών, Σεπτεµβρίου 2003, Λάρισα. Λαζανάς Α., Καρακαπιλίδης, Ν. και Πυροβολάκης, Γ. (2005). Σύνθεση και αξιολόγηση εναλλακτικών µεταφορικών διαδροµών µέσω ενός πολυπρακτορικού συστήµατος. 17ο Εθνικό Συνέδριο της Ελληνικής Εταιρείας Επιχειρησιακών Ερευνών, Ιουνίου 2005, Πάτρα. iv

9 ΠΕΡΙΛΗΨΗ Η παρούσα διδακτορική διατριβή αναφέρεται σε µια ειδική κατηγορία Πληροφοριακών Συστηµάτων, αυτή των Συστηµάτων Ηλεκτρονικής Αγοράς. Πιο συγκεκριµένα, αποτελεί µια προσπάθεια ολοκλήρωσης υβριδικών Τεχνικών Συστάσεων και Τεχνικών Εξόρυξης Γνώσης, µε παράλληλη ενσωµάτωσή τους σε ένα πλαίσιο διαχείρισης συνδυασµένων µεταφορών και αξιοποίηση σύγχρονων Τεχνολογιών ιαδικτύου. Λαµβάνοντας υπόψη τη διαπιστωµένη ανάγκη για την ανάπτυξη καινοτόµων συστηµάτων διαχείρισης συνδυασµένων µεταφορών, η διατριβή παρουσιάζει αναλυτικά τις φάσεις ανάπτυξης ενός τέτοιου συστήµατος. Το προτεινόµενο σύστηµα δέχεται αιτήσεις µεταφορικών συναλλαγών και έχει τη δυνατότητα κατασκευής άµεσων ή τµηµατικών λύσεων µε την χρήση κατάλληλων αλγορίθµων Επιχειρησιακής Έρευνας. Στο συγκεκριµένο σύστηµα ενσωµατώνονται υβριδικές τεχνικές συστάσεων µε σκοπό την παροχή υψηλού επιπέδου πληροφόρησης στους εµπλεκόµενους χρήστες. Επιπλέον η διατριβή προτείνει ένα πρωτότυπο υβριδικό µοντέλο συστάσεων µε τη συνδυασµένη χρήση µεθόδων συστάσεων και τεχνικών εξόρυξης γνώσης. Η ανάπτυξη του παραπάνω µοντέλου αποσκοπεί στην αντιµετώπιση των µειονεκτηµάτων που προκύπτουν από τη χρήση προηγούµενων τεχνικών και τη βελτίωση των παρεχόµενων υπηρεσιών. Στο προτεινόµενο σύστηµα συµµετέχουν και αλληλεπιδρούν, µέσω αυστηρά ορισµένων πρωτοκόλλων, ένα σύνολο ευφυών πρακτόρων, αναλαµβάνοντας την διεκπεραίωση µιας σειράς απαραίτητων εργασιών για την πραγµατοποίηση των µεταφορικών συναλλαγών. Το σύστηµα βασίζεται στον Παγκόσµιο Ιστό και υλοποιήθηκε µε τη χρήση σύγχρονων Τεχνολογιών ιαδικτύου. v

10 vi

11 ABSTRACT This Ph.D. thesis refers to a specific area of Information Systems called E- Market Systems. More specifically, it represents an attempt to integrate hybrid Recommendation techniques as well as data mining methods, encapsulating them at the same time, into an intermodal transportation transactions management framework, through the exploitation of innovative internet technologies. Taking into consideration the urgent need for the development of innovative intermodal transportations management systems, this thesis presents analytically all the phases of the development of such a system. The proposed system accepts requests for transportation transactions and is capable of constructing direct or modular transportation solutions exploiting suitable Operation Research Algorithms. The proposed system encapsulates hybrid recommendation techniques aiming at providing a high level of information to the involved users. Moreover, the thesis proposes an innovative hybrid recommendation model which combines recommendation methods and data mining techniques. The development of the above model, aims at facing up the problems that rise by the use of the recommendation methods mentioned before and at the enhancement of the provided services. In the proposed system, an agents community participate and interact with each others, through well defined communication protocols, with the responsibility of performing all the necessary tasks for the establishment of a transportation transaction. The proposed system is Web-based and implemented through the use of contemporary Web technologies. vii

12 Περιεχόµενα viii

13 Περιεχόµενα Περιεχόµενα 1 ΑΝΤΙΚΕΙΜΕΝΟ ΤΗΣ ΙΑΤΡΙΒΗΣ Το επιστηµονικό πλαίσιο της διατριβής Ηλεκτρονικό επιχειρείν Συστήµατα συστάσεων (Recommendation systems) Ευφυείς πράκτορες (Intelligent agents) Εξόρυξη γνώσης από δεδοµένα (Knowledge Μining) Συνδυασµένες µεταφορές (Intermodal transportation) Το αντικείµενο της διατριβής Η συµβολή της διατριβής Μεθοδολογία ιάρθρωση της διατριβής ΣΥΣΤΗΜΑΤΑ ΣΥΣΤΑΣΕΩΝ Γενικά Κατηγορίες συστηµάτων συστάσεων Συστήµατα collaborative filtering Λειτουργία συστηµάτων collaborative filtering Item-based collaborative filtering Αξιολόγηση της µεθόδου collaborative filtering Άµεση έµµεση αξιολόγηση Συστήµατα βασισµένα στην γνώση Critique-based recommendation Goal-based recommendation Αξιολόγηση των συστηµάτων γνώσης Άλλα είδη συστηµάτων συστάσεων Γενικά Μη προσωπικά συστήµατα συστάσεων ηµογραφικά συστήµατα συστάσεων Σύγκριση Τεχνικών Συστάσεων Γενικά Επιλογή κατάλληλης τεχνικής συστάσεων Συνθήκες έλλειψης επαρκούς αριθµού αξιολογήσεων Αιτιολόγηση συστάσεων Χρήστες µε ασυνήθιστες προτιµήσεις Ανάγκη προσαρµογής σε µεταβαλλόµενες προτιµήσεις Έλλειψη επαρκών στοιχείων γνώσης Ανάγκη γρήγορης ανάπτυξης Συµπεράσµατα Υβριδικά Συστήµατα Συστάσεων Γενικά Κατηγορίες υβριδικών συστηµάτων Περιοχές εφαρµογής υβριδικών συστηµάτων Συστήµατα συντελεστών βαρύτητας Συστήµατα εναλλαγής τεχνικών Μικτά συστήµατα Υβριδικά συστήµατα τύπου «καταρράκτη» Υβριδικά συστήµατα συνδυασµού χαρακτηριστικών Συστήµατα µεταφοράς µοντέλου Συµπεράσµατα ΤΕΧΝΙΚΕΣ & ΤΕΧΝΟΛΟΓΙΕΣ ΥΠΟΣΤΗΡΙΞΗΣ ΤΗΣ ΙΑΧΕΙΡΙΣΗΣ ΣΥΝ ΥΑΣΜΕΝΩΝ ΜΕΤΑΦΟΡΩΝ Συστήµατα διαχείρισης συνδυασµένων µεταφορών Εξόρυξη Γνώσης και Αποθήκες εδοµένων Γενικά Προσεγγίσεις στην εξόρυξη γνώσης Τεχνικές εξόρυξης γνώσης Ανάλυση αγοράς (market basket analysis) Μνηµονική αιτιολόγηση (memory-based reasoning) Αυτόµατη ανίχνευση αλυσίδων έντρα Αποφάσεων (Decision Τrees) Εξόρυξη Γνώσης και Συστήµατα Συστάσεων ix

14 Περιεχόµενα 3.3 Ευφυείς πράκτορες στη διαχείριση µεταφορών Γενικά Ερευνητικές προσεγγίσεις ΑΝΑΛΥΣΗ ΚΑΙ ΣΧΕ ΙΑΣΜΟΣ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ Εισαγωγή Ανάλυση του συστήµατος Βασικές λειτουργίες Ρόλοι και αλληλεπιδράσεις Μοντέλο αλληλεπιδράσεων Θέµατα σχεδίασης Το µοντέλο των πρακτόρων (agent model) Μοντέλο Υπηρεσιών (Services Model) Μοντέλο Γνωριµιών (Acquaintances Model) Ορίζοντας τους πράκτορες ια-πρακτορική επικοινωνία (inter-agent communication) Συµπεριφορές πρακτόρων (agent behaviours) ιαχείριση αποµακρυσµένων βάσεων δεδοµένων Λειτουργία των πρακτόρων στο σύστηµα ΣΥΝΘΕΣΗ ΡΟΜΟΛΟΓΙΩΝ Γενικά Άµεσα και τµηµατικά δροµολόγια Ορισµός του προβλήµατος Κατασκευή δροµολογίων Αλγοριθµικές προσεγγίσεις Αλγόριθµος εύρεσης βέλτιστων δροµολογίων Αλγόριθµος εύρεσης υπό-βέλτιστων δροµολογίων Η ΟΜΙΚΗ ΜΟΝΑ Α ΣΥΣΤΑΣΕΩΝ Εισαγωγή Τεχνικές συστάσεων που χρησιµοποιήθηκαν Υβριδική προσέγγιση Κανόνες επιλογής Μεθοδολογία συστάσεων Συνεργατικό Φιλτράρισµα Εξόρυξη Γνώσης Αλγόριθµος δηµιουργίας κανόνων συσχέτισης Παράδειγµα δηµιουργίας κανόνων ηµιουργία προφίλ χρηστών Το µοντέλο βάσης δεδοµένων των συστάσεων ΤΟ ΠΡΟΤΕΙΝΟΜΕΝΟ ΣΥΣΤΗΜΑ Θέµατα υλοποίησης Χρήστες Στιγµιότυπα χρήσης Εισαγωγή καθορισµός προφίλ Συναλλαγές Αξιολόγηση συναλλαγών Παροχή συστάσεων ΣΥΝΟΨΗ Γενικά Συµπεράσµατα Συµβολή Μελλοντικές ερευνητικές κατευθύνσεις ΒΙΒΛΙΟΓΡΑΦΙΑ ΓΛΩΣΣΑΡΙ Παράρτηµα A Ο Αλγόριθµος εύρεσης βέλτιστων διαδροµών Παράρτηµα B Υπολογισµός «δηµοτικότητας» δροµολογίων Παράρτηµα Γ Αξιολόγηση των συναλλαγών Παράρτηµα Το XML Schema της µονάδας συστάσεων Παράρτηµα E Το XML Schema αναπαράστασης του προφίλ των χρηστών x

15 Περιεχόµενα Σύντοµο Βιογραφικό Σηµείωµα xi

16 Περιεχόµενα xii

17 Κεφάλαιο 1 ο Αντικείµενο της διατριβής 1 ΑΝΤΙΚΕΙΜΕΝΟ ΤΗΣ ΙΑΤΡΙΒΗΣ 1.1 Το επιστηµονικό πλαίσιο της διατριβής Ηλεκτρονικό επιχειρείν Η ευρεία αξιοποίηση του ιαδικτύου (Internet), και ειδικότερα η δυνατότητα µαζικής επικοινωνίας και ανταλλαγής δεδοµένων µεταξύ ανθρώπων που δε βρίσκονται στον ίδιο χώρο, δηµιούργησε νέες προοπτικές ανάπτυξης σε πολλούς τοµείς της καθηµερινής ζωής [Crewe, 2000; Birch et al., 2000]. Ο χώρος των επιχειρήσεων και του εµπορίου εκµεταλλεύθηκε την παραπάνω δυνατότητα σε µέγιστο βαθµό. Έτσι, δηµιουργήθηκαν καινοτόµες επιχειρήσεις [Davis et al., 2000; Katros, 2000; Kotha, 1998] που επένδυσαν στην πλήρη διεκπεραίωση των δραστηριοτήτων τους µέσω των τηλεπικοινωνιακών δικτύων [Hoffman & Novak, 1997], των κατανεµηµένων υπολογιστών [Hart et al., 2000] και του ιαδικτύου. οι οποίες διακρίνονται από εκείνες που επιµένουν στους συµβατικούς τρόπους παροχής υπηρεσιών µε τον όρο Ηλεκτρονικό Επιχειρείν (Ε-Βusiness). Σε αντιστοιχία, ο όρος Ηλεκτρονικό Εµπόριο (E-Commerce) αφορά στους οίκους που διεξάγουν εµπόριο µε τη χρήση της νέας υποδοµής και τεχνοτροπίας πωλήσεων [Reynolds, 2000]. Πιο συγκεκριµένα, σύµφωνα µε τον ECA (Electronic Commerce Association), το Ηλεκτρονικό Εµπόριο ορίζεται ως: «το εµπόριο που καλύπτει οποιαδήποτε µορφή επιχειρηµατικής ή διοικητικής συναλλαγής ή ανταλλαγής πληροφοριών, η οποία εκτελείται µε τη χρησιµοποίηση οποιασδήποτε τεχνολογίας Πληροφορικής και Τηλεπικοινωνιών» 1. Γενικά, στόχος του Ηλεκτρονικού Εµπορίου είναι η βελτίωση των συναλλαγών µε τη χρήση των νέων τεχνολογιών [Hoffman & Novak, 1996]. Πράγµατι, η διεξαγωγή του εµπορίου µέσω του Internet παρέχει ουσιαστικές ωφέλειες τόσο στις επιχειρήσεις όσο και στους καταναλωτές [Armstrong & Hagel, 2000]. Πρώτα από όλα, οι επιχειρήσεις που υποστηρίζουν πωλήσεις µέσω του ιαδικτύου πλεονεκτούν έναντι των άλλων λόγω του ότι απευθύνονται σε πολύ µεγαλύτερο εύρος πελατών, χωρίς τον περιοριστικό παράγοντα της απόστασης [Bakos, 2001]. Επίσης, πετυχαίνουν καλύτερη εξυπηρέτηση των πελατών, ταχύτερη παράδοση του προϊόντος, περιορισµό του κόστους πώλησης και σαφώς βελτίωση της δηµόσιας εικόνας της επιχείρησης. Ο µετασχηµατισµός της επιχείρησης είναι απαραίτητος αφού γίνεται εκµάθηση και αξιοποίηση νέων τεχνολογιών και αλλάζει η σχέση της επιχείρησης µε τους

18 Κεφάλαιο 1 ο Αντικείµενο της διατριβής πελάτες [Brynjolfsson, 2000]. Επιπλέον, το Ηλεκτρονικό Εµπόριο επιτρέπει τη δηµιουργία νέων προϊόντων και νέων λειτουργικών µονάδων στις επιχειρήσεις. Από την πλευρά τους, οι καταναλωτές ωφελούνται από την εφαρµογή του Ηλεκτρονικού Εµπορίου, αφού το χαµηλό κόστος των συναλλαγών και ο αυξηµένος ανταγωνισµός µεταξύ των επιχειρήσεων οδηγεί σε καλύτερη ποιότητα προϊόντων και υπηρεσιών, καθώς και σε µείωση των τιµών [Venkatraman, 1994; Stern, 1999]. Η αµεσότητα της επικοινωνίας του πελάτη µε την επιχείρηση [Peterson et al., 1997], οδηγεί στην καλύτερη διαχείριση των πληροφοριών σχετικά µε αυτόν, και κατά συνέπεια στη δηµιουργία νέων προϊόντων σύµφωνα µε τις επιθυµίες και απαιτήσεις των καταναλωτών. Τέλος, η δυνατότητα εκτέλεσης της αγοράς οποιαδήποτε στιγµή το εικοσιτετράωρο, οπουδήποτε κι αν βρίσκεται ο καταναλωτής, αποτελούν ίσως τα βασικότερα πλεονεκτήµατα του Ηλεκτρονικού Εµπορίου [Rowley, 2000] Συστήµατα συστάσεων (Recommendation systems) Τα τελευταία χρόνια γίνεται πολύ συχνά λόγος για τα Συστήµατα Συστάσεων (Recommendation Systems) [Schafer et al., 1999; Mooney and Roy, 1999; Burke, 2000; Resnick and Varian, 1997]. Σήµερα, µε την ολοένα και µεγαλύτερη εισροή δεδοµένων στον παγκόσµιο ιστό και την εκθετική αύξηση του όγκου πληροφορίας την οποία δέχεται ο χρήστης, τα συστήµατα αυτά αποκτούν ακόµη µεγαλύτερη σηµασία. Ο σκοπός της ανάπτυξης τέτοιων συστηµάτων είναι η επιλεκτική προώθηση πληροφορίας στο χρήστη µε κύριο γνώµονα την προσωπικότητα (προφίλ) του. Μέσα από τις επιλογές του χρήστη, το σύστηµα αποκτάει γνώση για τις προτιµήσεις του και εκµεταλλευόµενο τη γνώση αυτή µπορεί να του κάνει «κατάλληλες» συστάσεις [Schwab et al., 2001]. Οι διάφορες τεχνικές που έχουν αναπτυχθεί για τα Συστήµατα Συστάσεων, κάνουν χρήση αλγορίθµων οι οποίοι υπολογίζουν το βαθµό συσχέτισης των προφίλ χρηστών [Zukerman and Albrecht, 2001; Balabanovic, 1998]. Έµµεσα, υπονοείται έτσι η δηµιουργία εικονικών κοινοτήτων, δηλαδή οµάδων χρηστών µε παρόµοιο προφίλ. Οι αλγόριθµοι συστάσεων είναι γνωστοί για τη χρήση τους στις εφαρµογές ηλεκτρονικού εµπορίου, όπου χρησιµοποιούν την εισαγωγή δεδοµένων ενός πελάτη για τα ενδιαφέροντά του προκειµένου να παραχθεί ένας κατάλογος συνιστώµενων στοιχείων. Πολλές εφαρµογές χρησιµοποιούν µόνο τα προϊόντα που οι πελάτες αγοράζουν και ρητά εκτιµούν αυτά που αντιπροσωπεύουν τα ενδιαφέροντά τους. Άλλες, µπορούν να χρησιµοποιήσουν πληροφορίες σχετικά µε δηµογραφικά στοιχεία, ενδιαφέροντα, επιλογές κλπ. [Hill et al., 1995]. Για παράδειγµα, η ηλεκτρονική αγορά Amazon.com, χρησιµοποιεί αλγορίθµους συστάσεων για να προσαρµόσει το online κατάστηµά της για κάθε πελάτη [Kotha, - 2 -

19 Κεφάλαιο 1 ο Αντικείµενο της διατριβής 1998]. Με άλλα λόγια, το κατάστηµα αλλάζει ριζικά βασισµένο στα ενδιαφέροντα του πελάτη. Αλγόριθµοι συστάσεων Ηλεκτρονικού Εµπορίου λειτουργούν συχνά σε περιβάλλοντα όπου : Ένας µεγάλος λιανοπωλητής µπορεί να διαθέτει τεράστιο όγκο δεδοµένων, δεκάδες εκατοµµύρια πελάτες και εκατοµµύρια από διακριτά προϊόντα καταλόγων. Οι νέοι πελάτες έχουν εξαιρετικά περιορισµένες πληροφορίες, βασισµένες µόνο σε µερικές αγορές ή εκτιµήσεις προϊόντων. Οι παλαιότεροι πελάτες µπορούν να έχουν ένα πλεόνασµα πληροφοριών, µε βάση χιλιάδες αγορές και εκτιµήσεις. Τα δεδοµένα των πελατών είναι ευµετάβλητα: Κάθε αλληλεπίδραση παρέχει πολύτιµα δεδοµένα πελατών, και ο αλγόριθµος πρέπει να αποκριθεί αµέσως στις νέες πληροφορίες. Υπάρχουν τρεις βασικές προσεγγίσεις στην επίλυση του προβλήµατος παροχής συστάσεων [Schafer, 1999; Resnick and Varian, 1997]: Η παραδοσιακή προσέγγιση του συνεργατικού φιλτραρίσµατος (collaborative filtering), τα πρότυπα οµαδοποίησης (cluster models), και οι µέθοδοι σύστασης βασισµένες στη γνώση (knowledge-based recommendation) Ευφυείς πράκτορες (Intelligent agents) Οι Ευφυείς Πράκτορες (Intelligent Agents) χρησιµοποιούνται τελευταία σε όλο και περισσότερες περιοχές εφαρµογών. Ήδη, σε περιοχές όπως η αναζήτηση πληροφοριών στο ιαδίκτυο, το Ηλεκτρονικό Εµπόριο, η υλοποίηση φιλικών διεπαφών και η διαχείριση αλληλογραφίας, η τεχνολογία των Ευφυών Πρακτόρων έχει εφαρµοστεί µε ιδιαίτερη επιτυχία [Jennings et al., 2000; Guttman et al., 1998]. Ο όρος ευφυείς πράκτορες δεν είναι µία σαφώς καθορισµένη έννοια, αφού έχουν προταθεί για αυτόν πολλοί και διαφορετικοί ορισµοί [Franklin and Graesser, 1996]. Έτσι, αυτό που θα κάνουµε στη συνέχεια, δεν αφορά στη διατύπωση κάποιου αυστηρού ορισµού, αλλά στην περιγραφή των κυριότερων ιδιοτήτων ενός «πράκτορα», έτσι ώστε να δοθεί µία γενική εικόνα της έννοιας αυτής. Τις ιδιότητες αυτές µπορούµε να τις κατατάξουµε σε δύο κατηγορίες: στις ιδιότητες που εντάσσονται στην «ασθενή» θεώρηση της έννοιας «πράκτορας» και σε αυτές που εντάσσονται στην «ισχυρή» θεώρηση της έννοιας «πράκτορας». Οι ιδιότητες που ανήκουν στην πρώτη θεώρηση είναι αυτές που είναι γενικώς παραδεκτές από τους περισσότερους ερευνητές σχετικά µε το τι πρέπει να διακρίνει έναν πράκτορα λογισµικού [Wooldridge et al., 2000; Sycara and Zeng, 1996]. Αντιθέτως, δεν είναι γενικώς παραδεκτό ότι πρέπει να διακρίνουν έναν πράκτορα οι ιδιότητες της δεύτερης θεώρησης

20 Κεφάλαιο 1 ο Αντικείµενο της διατριβής Πιο συγκεκριµένα, οι ιδιότητες που κατά γενική παραδοχή πρέπει να έχει ένας πράκτορας είναι οι παρακάτω: Αυτονοµία (autonomy): οι πράκτορες λειτουργούν χωρίς την άµεση ανθρώπινη (ή γενικότερα εξωτερική) παρέµβαση και ελέγχουν τις πράξεις τους και την εσωτερική τους κατάσταση. Κοινωνική ικανότητα (social ability): οι πράκτορες έχουν τη δυνατότητα να επικοινωνούν µε άλλους πράκτορες µέσω µίας ειδικά ορισµένης γλώσσας πρακτόρων. Ικανότητα αντίδρασης (reactivity): οι πράκτορες είναι ικανοί να αντιλαµβάνονται το περιβάλλον τους και να αντιδρούν ανάλογα µε τις αλλαγές που γίνονται σ αυτό. Χρονική συνέχεια (temporal continuity): οι πράκτορες «δρουν» συνεχώς, είτε είναι ενεργοί στο προσκήνιο, είτε στο παρασκήνιο (background). Προσανατολισµός σε στόχο (proactivity): οι πράκτορες δεν αντιδρούν απλώς στα ερεθίσµατα του περιβάλλοντος, αλλά µπορούν να δρουν προσανατολισµένοι σε έναν στόχο. Ένα απλό παράδειγµα πράκτορα που έχει τις παραπάνω ιδιότητες είναι το softbot (software robot). Με τον όρο softbot εννοούµε έναν πράκτορα που δρα µέσα σε ένα περιβάλλον λογισµικού. Από την άλλη µεριά, για τους [Froehlich et al., 1999; Guttman et al., 1998] ο όρος πράκτορας έχει πιο σαφές και συγκεκριµένο νόηµα. Αυτοί θεωρούν τον πράκτορα ως ένα υπολογιστικό σύστηµα που, εκτός από τις ιδιότητες που δόθηκαν παραπάνω, έχει και ιδιότητες που συναντάµε στους ανθρώπους όπως γνώση, πεποίθηση και υποχρέωση. Μερικές από τις ιδιότητες που εντάσσονται στην ισχυρή θεώρηση του πράκτορα είναι οι παρακάτω: Ικανότητα Μετακίνησης (mobility): Είναι η ικανότητα του πράκτορα να µετακινείται σε διάφορες τοποθεσίες µέσα σε ένα δίκτυο. Αγαθή προαίρεση (benevolence): Η υπόθεση ότι οι πράκτορες δεν έχουν αλληλοσυγκρουόµενους στόχους, οπότε ο κάθε πράκτορας προσπαθεί να κάνει ό,τι του ζητηθεί. Ορθολογικότητα (rationality): Η υπόθεση ότι ο πράκτορας ενεργεί µε κάποια λογική για να επιτύχει τους στόχους του. Προσαρµοστικότητα (adaptivity): Η ικανότητα του πράκτορα να προσαρµόζεται στις συνθήκες του περιβάλλοντος. Είναι αρκετά δύσκολο να ορίσουµε τι ακριβώς είναι αυτό που κάνει έναν πράκτορα ευφυή. Ωστόσο, µπορούµε γενικά να πούµε ότι ένας πράκτορας είναι ευφυής όταν έχει την ικανότητα να επιτελεί τους στόχους και τα καθήκοντα που έχει επιφορτιστεί. Έτσι, σε ένα ελάχιστο επίπεδο νοηµοσύνης µπορεί να δίνονται - 4 -

21 Κεφάλαιο 1 ο Αντικείµενο της διατριβής στον πράκτορα εντολές µε τη µορφή κανόνων και αυτός να ενεργεί µε τη βοήθεια κάποιου µηχανισµού εξαγωγής συµπεράσµατος. Σε ένα ανώτερο επίπεδο, ο πράκτορας θα είναι ικανός να µαθαίνει και να προσαρµόζεται αυτόµατα στο περιβάλλον έτσι ώστε να πετυχαίνει τους σκοπούς του [Franklin and Graesser, 1996] Εξόρυξη γνώσης από δεδοµένα (Knowledge Μining) Η εξόρυξη γνώσης από βάσεις δεδοµένων (Knowledge Mining in Databases - KMD) αναφέρεται στη διεργασία ανακάλυψης εµφωλευµένης γνώσης σε µεγάλες βάσεις δεδοµένων. Ο όρος εξόρυξη δεδοµένων (Data Mining) χρησιµοποιείται ως συνώνυµο της ανακάλυψης γνώσης, καθώς επίσης και για αναφορά στις τεχνικές που χρησιµοποιούνται για την ανάλυση και την εξαγωγή γνώσης από διάφορα σύνολα δεδοµένων [Argrawal, 1993]. Κατά γενική παραδοχή, ο όρος KMD αναφέρεται στο σύνολο των διαδικασιών από την επεξεργασία των δεδοµένων έως τα τελικά στάδια αξιοποίησης της γνώσης, ενώ ο όρος Data Mining αποτελεί µια από τις διαδικασίες του KMD και αναφέρεται στην εξόρυξη γνώσης από τα δεδοµένα. Για να διαφοροποιηθούµε µεταξύ της διαδικασίας και των εργαλείων, θα χρησιµοποιήσουµε τον πρώτο όρο, δηλαδή τον όρο KMD, για να περιγράψουµε ολόκληρη τη διαδικασία ανάλυσης ενός συνόλου δεδοµένων, και το δεύτερο όρο, την εξόρυξη δεδοµένων, για να αναφερθούµε κυρίως στις µεθόδους και τις τεχνικές που χρησιµοποιούνται στη διαδικασία ανάλυσης. Πολλοί ερευνητές [Alderferer & Blashfiled, 2004; Han & Kamber, 2000], θεωρούν τον όρο εξόρυξη δεδοµένων µη αντιπροσωπευτικό της διαδικασίας που περιγράφει, υποστηρίζοντας ότι ο όρος εξόρυξη γνώσης θα ήταν µια πιο κατάλληλη περιγραφή. Εντούτοις, ένας τέτοιος όρος µπορεί να µη δίνει έµφαση στην ανάλυση και την εξαγωγή των προτύπων από µεγάλα σύνολα δεδοµένων. Ο όρος εξόρυξη δεδοµένων είναι αυτός που έχει επικρατήσει και χαρακτηρίζει τη διαδικασία της εύρεσης δοµών γνώσης, οι οποίες περιγράφουν µε ακρίβεια µεγάλα σύνολα πρωτογενών δεδοµένων. Οι δοµές αυτές αναδεικνύουν γνώση (συσχετίσεις ή κανόνες) που είναι κρυµµένη µέσα στα δεδοµένα και δεν µπορεί να εξαχθεί από τον άνθρωπο-χρήστη µε «γυµνό» µάτι. Οι προκύπτουσες δοµές είναι πλούσιες σε σηµασιολογία και εκµεταλλεύονται πιθανές κοινές ιδιότητες των πρωτογενών δεδοµένων. Ο Fayyad, επικεντρώθηκε στην ανακάλυψη γνώσης από βάσεις δεδοµένων και θεώρησε την προσπάθεια αυτή ως [Fayyad et al.,1996]: «τη διεργασία της χρήσης των βάσεων δεδοµένων µαζί µε οποιαδήποτε απαίτηση επιλογής, προεπεξεργασίας, υποδειγµατοποίησης και µετασχηµατισµού, προκειµένου να εφαρµοσθούν οι διάφοροι µέθοδοι εξόρυξης δεδοµένων για να απαριθµηθούν τα µοτίβα που ενυπάρχουν στη βάση, και να αξιολογηθούν τα - 5 -

22 Κεφάλαιο 1 ο Αντικείµενο της διατριβής προϊόντα της εξόρυξης γνώσης για να αναγνωριστούν τα υποσύνολα των απαριθµηθέντων µοτίβων που θεωρούνται γνώση». Έτσι, παρατηρούµε ότι παρ όλη την διεργασία και τους υπολογισµούς για την εξαγωγή συµπερασµάτων µε ντετερµινιστικό τρόπο, τελικά ο χρήστης ειδικός είναι αυτός που θα κρίνει την χρησιµότητα ή την καταλληλότητα της εξαγόµενης γνώσης. Η ανακάλυψη γνώσης από µία βάση δεδοµένων αναφέρεται σε ολόκληρη τη διαδικασία ανακάλυψης χρήσιµης πληροφορίας από µεγάλα σύνολα δεδοµένων. Ένας γενικός ορισµός, που παρουσιάζει µε περισσότερη σαφήνεια την έννοια του όρου Knowledge Discovery in Databases (KDD) είναι [Frawley et al.,1996]: «Η ανακάλυψη γνώσης στις βάσεις δεδοµένων είναι η ντετερµινιστική και σηµαντική διαδικασία αναγνώρισης έγκυρων, καινοτόµων, ενδεχοµένως χρήσιµων και εν τέλει κατανοητών µοτίβων στα δεδοµένα». Ο όρος µοτίβο ή πρότυπο (pattern) ενσωµατώνει έννοιες όπως: συσχετίσεις (correlations), συνάφειες ή σχέσεις (relationships), τάσεις (trends), περιγραφές σπάνιων γεγονότων, κλπ. Βέβαια υπάρχουν και άλλοι τρόποι περιγραφής του στόχου της ανακάλυψης γνώσης και της εξόρυξης δεδοµένων, ανάλογα πάντα µε τη γενικότητα του προβλήµατος και τις προσδοκίες των επιστηµόνων [Chappelier et al., 2002; Golfarelli et al., 2004]. Η διαδικασία ΚDD είναι µια διαλογική και επαναληπτική διαδικασία που αποτελείται από τα ακόλουθα βήµατα: 1. Την ανάπτυξη και κατανόηση της περιοχής της εφαρµογής, της σχετικά προγενέστερης γνώσης του προς εξέταση τοµέα, και τους στόχους του τελικού χρήστη. 2. Την ολοκλήρωση των δεδοµένων. Υπάρχουν διαφορετικά είδη αποθηκών πληροφοριών που µπορούν να χρησιµοποιηθούν στη διαδικασία εξόρυξης γνώσης. Κατά συνέπεια, οι πολλαπλές πηγές δεδοµένων µπορούν να συνδυαστούν καθορίζοντας το σύνολο στο οποίο πρόκειται τελικά να εφαρµοστεί η διαδικασία εξόρυξης [Han & Kamber, 2000]. 3. Τη δηµιουργία του στόχου-συνόλου δεδοµένων. Αφορά στην επιλογή του συνόλου δεδοµένων (δηλαδή µεταβλητές, δείγµατα δεδοµένων) στο οποίο πρόκειται να εκτελεστεί η διαδικασία εξόρυξης. 4. Τον καθαρισµό και την πρoεπεξεργασία δεδοµένων. Αυτό το βήµα περιλαµβάνει βασικές διαδικασίες όπως η αφαίρεση του θορύβου, η συλλογή των απαραίτητων πληροφοριών για τη διαµόρφωση ή τη µέτρηση του θορύβου, και η απόφαση σχετικά µε τις στρατηγικές διαχείρισης των ελλειπόντων πεδίων δεδοµένων. 5. Τον µετασχηµατισµό των δεδοµένων. Τα δεδοµένα µετασχηµατίζονται ή παγιώνονται σε µορφές κατάλληλες για εξόρυξη. Γίνεται χρήση µεθόδων µείωσης διαστάσεων ή µετασχηµατισµού για τη µείωση του αριθµού των - 6 -

23 Κεφάλαιο 1 ο Αντικείµενο της διατριβής υπό εξέταση µεταβλητών ή την εύρεση κατάλληλης αντιπροσώπευσης των δεδοµένων. 6. Την επιλογή των στόχων και των αλγορίθµων εξόρυξης δεδοµένων. Σε αυτό το βήµα αποφασίζεται ο στόχος της διαδικασίας KMD, επιλέγοντας τους στόχους εξόρυξης δεδοµένων που θέλουµε να επιτύχουµε. Επίσης, επιλέγονται οι µέθοδοι που θα χρησιµοποιηθούν. Αυτό περιλαµβάνει την επιλογή του κατάλληλου µοντέλου και παραµέτρων. Επίσης η µέθοδος εξόρυξης δεδοµένων πρέπει να αντιστοιχηθεί µε τις απαιτήσεις και τα γενικά κριτήρια της διαδικασίας KMD [Benzecri, 1992]. 7. Την εξόρυξη δεδοµένων. Εφαρµόζοντας ευφυείς µεθόδους, αναζητούνται ενδιαφέροντα µοτίβα γνώσης. Τα µοτίβα αυτά θα µπορούσαν να είναι µιας συγκεκριµένης αντιπροσωπευτικής µορφής ή ενός συνόλου αντιπροσωπεύσεων όπως κανόνες κατηγοριοποίησης (classification rules), δέντρα, παλινδρόµηση, οµαδοποίηση (clustering) κ.λπ. Η απόδοση και τα αποτελέσµατα της µεθόδου εξόρυξης δεδοµένων εξαρτώνται από τα προηγούµενα βήµατα της συνολικής διαδικασίας ανακάλυψης γνώσης [Lewis, 1991]. 8. Την αξιολόγηση των µοτίβων. Τα εξαγόµενα πρότυπα ή µοτίβα αξιολογούνται µε κάποια µέτρα, προκειµένου να προσδιοριστούν εκείνα τα οποία αντιπροσωπεύουν καλύτερα τη γνώση, δηλαδή τα µοτίβα για τα οποία ενδιαφερόµαστε περισσότερο. 9. Την σταθεροποίηση και παρουσίαση της γνώσης. Σε αυτό το βήµα, η εξορυγµένη γνώση ενσωµατώνεται στο σύστηµα και χρησιµοποιούνται κάποιες τεχνικές αντιπροσώπευσης αυτής προκειµένου να παρουσιαστεί ευκρινώς στο χρήστη [Fukuda et al., 1996]. Όπως προαναφέραµε, η εξόρυξη δεδοµένων ως βήµα της διαδικασίας KMD ενδιαφέρεται κυρίως για τις µεθοδολογίες και τις τεχνικές εξαγωγής προτύπων δεδοµένων ή τις περιγραφές δεδοµένων από µεγάλες αποθήκες δεδοµένων. Αφ' ετέρου, η διαδικασία KMD περιλαµβάνει την αξιολόγηση και την ερµηνεία των προτύπων, την επιλογή της κωδικοποίησης των προτύπων, της προεπεξεργασίας, της δειγµατοληψίας και του µετασχηµατισµού των δεδοµένων πριν από το βήµα της εξόρυξης των δεδοµένων. Η διαδικασία KMD είναι επαναληπτική και θα µπορούσε να περιέχει βρόχους µεταξύ οποιωνδήποτε από τα παραπάνω βήµατα [Liao, 2003] Συνδυασµένες µεταφορές (Intermodal transportation) Οι ανταγωνιστικές τάσεις που επικρατούν στην αγορά, αλλά και οι αυξηµένες ανάγκες των καταναλωτών, έχουν δηµιουργήσει την ανάγκη για πιο - 7 -

24 Κεφάλαιο 1 ο Αντικείµενο της διατριβής εξελιγµένες µεταφορικές υπηρεσίες [Jensen, 1990]. Οι συνδυασµένες µεταφορές αποτελούν έναν από τους καταλληλότερους τρόπους για την κάλυψη των αναγκών αυτών [Betak et al., 1998]. Ο όρος «συνδυασµένες µεταφορές» περιγράφει το συνδυασµό των βασικών µεταφορικών µέσων. Αναφερόµενοι όµως, µόνο στο συνδυασµό των µέσων, θα δίναµε ένα ελλιπή ορισµό για τις συνδυασµένες µεταφορές. Η Ευρωπαϊκή Κοινότητα [European Conference of Ministers of Transport, 1993] χρησιµοποιεί τον εξής ορισµό: «Οι συνδυασµένες µεταφορές είναι χαρακτηριστικό ενός µεταφορικού συστήµατος, που επιτρέπει τουλάχιστον δύο µέσα να χρησιµοποιηθούν µε ολοκληρωµένο τρόπο για µεταφορές πόρταπόρτα». Από τον ορισµό αυτό είναι φανερό πως οι συνδυασµένες µεταφορές αποτελούν ένα ενιαίο σύνολο υπηρεσιών, που στηρίζεται στη συµπληρωµατικότητα των µέσων, δηλαδή το µειονέκτηµα του ενός µέσου καλύπτεται από το συγκριτικό πλεονέκτηµα του άλλου [Button, 1994; Jani et al., 1998]. Ο συνδυασµός των µέσων πραγµατοποιείται σε κοµβικά σηµεία, που µπορεί να είναι λιµάνια, αεροδρόµια, σιδηροδροµικοί σταθµοί, κ.λ.π. Οι κόµβοι είναι εφοδιασµένοι µε την κατάλληλη υποδοµή για την υποδοχή του φορτίου και τον έλεγχό του, και µπορούν να παρέχουν τηλεπικοινωνιακές υπηρεσίες και υπηρεσίες υποστήριξης [Crainic et al., 1990]. Η λειτουργία των συνδυασµένων µεταφορών βασίζεται σε υπηρεσίες logistics, στην πληροφορία και τις τεχνολογικές εξελίξεις, στη µελέτη των αναγκών της αγοράς και στο ισχύον θεσµικό πλαίσιο [Jones, 2000]. Ένας πληρέστερος ορισµός είναι ο εξής [Κυριαζόπουλος, 1996]: «Ο όρος «συνδυασµένες µεταφορές» σηµαίνει τη µετακίνηση φορτίων από δύο ή περισσότερα µέσα µεταφοράς, τη διαχείριση του φορτίου (ή του επιβάτη) µε ένα και µοναδικό έγγραφο µεταφοράς (π.χ. φορτωτική), µε στόχο την απρόσκοπτη και συνεχή µεταφορική υπηρεσία από πόρτα σε πόρτα, εάν είναι δυνατό». Ο κύριος στόχος των συνδυασµένων µεταφορών είναι η βελτίωση του επιπέδου των προσφερόµενων µεταφορικών υπηρεσιών µε την ταυτόχρονη µείωση του µεταφορικού κόστους. Η επιλογή του κατάλληλου συνδυασµού των µέσων γίνεται µε βάση κάποια κριτήρια, τα κυριότερα από τα οποία είναι η φύση και τα χαρακτηριστικά (µέγεθος, εύφλεκτο, εύθραυστο κλπ.) του προϊόντος, το κόστος, ο χρόνος µεταφοράς και η γεωγραφική κατανοµή της αγοράς. Τέλος, είναι απαραίτητο να αναφέρουµε ότι οι συνδυασµένες µεταφορές έχουν άµεση αλληλεπίδραση µε παράγοντες όπως: Η κοινωνία της πληροφορίας: Η εξέλιξη της τεχνολογίας αποτελεί ένα από τους σηµαντικότερους παράγοντες που επηρεάζουν τον τοµέα των µεταφορών. Οι καινοτοµίες που έχουν πρόσφατα προκύψει, όπως είναι η µερική αντικατάσταση της φυσικής µεταφοράς από την ηλεκτρονική, όπως στην περίπτωση των εγγράφων, και το ηλεκτρονικό εµπόριο δηµιουργούν - 8 -

25 Κεφάλαιο 1 ο Αντικείµενο της διατριβής νέα πλεονεκτήµατα στις µεταφορές και ιδιαίτερα στο συνδυασµό τους. Η έρευνα στο επίπεδο των πληροφοριακών συστηµάτων στις συνδυασµένες µεταφορές είναι ακόµα σε προ-παραδειγµατική φάση, κάτι που καθιστά αναγκαία την περαιτέρω έρευνα στον τοµέα αυτό [Bontekonig & Macharis, 2003]. Η περιφερειακή ανάπτυξη: Η ανάπτυξη των συνδυασµένων µεταφορών εξαρτάται άµεσα από την περιφερειακή ανάπτυξη, αφού για το σχεδιασµό της υποδοµής για συνδυασµένες µεταφορές πρέπει να λαµβάνoνται υπόψη τα δεδοµένα και η ανάπτυξη δραστηριοτήτων σε κάθε περιοχή [Kreutzberger, 2000]. Η ανάπτυξη των ΜΜΕ (Μικροµεσαίες επιχειρήσεις): Η ανάπτυξη των ΜΜΕ τις τελευταίες δεκαετίες είναι θεαµατική. Οι περισσότερες µεταφορικές επιχειρήσεις είναι ΜΜΕ. Για τις ανάγκες των ΜΜΕ, και ιδιαίτερα για τη στήριξη της ανταγωνιστικότητάς τους, η ανάπτυξη των συνδυασµένων µεταφορών αποτελεί έναν ιδιαίτερα σηµαντικό παράγοντα [Stank & Roath, 1998]. Το περιβάλλον: Μια από τις πιο πρόσφατες τάσεις στον τοµέα των µεταφορών είναι οι προσπάθειες που γίνονται για τη µείωση των δυσµενών επιπτώσεων που έχουν στο περιβάλλον. Οι συνδυασµένες µεταφορές είναι σαφώς πιο φιλικές προς το περιβάλλον από τη χρήση µεµονωµένων µέσων µεταφοράς [Walker, 1992; Taylor & Jackson, 2000]. Εκτός από τους βασικούς τύπους µεταφοράς (οδική, σιδηροδροµική, εναέρια, θαλάσσια) και τις συνδυασµένες µεταφορές, υπάρχουν και κάποιες εναλλακτικοί τρόποι µεταφοράς, που αξίζει να αναφέρουµε: 1. Προωθητές εµπορευµάτων (Freight Fordwarders): Οι προωθητές εµπορευµάτων, αγοράζουν υπηρεσίες µεταφορών από τους τέσσερις βασικούς τύπους µεταφοράς και προωθούν µικρές αποστολές από πολλούς προµηθευτές συνθέτοντας έτσι µια µεγάλη αποστολή µε αποτέλεσµα τη µείωση του κόστους. Με τον τρόπο αυτό, οι αποστολείς επιβαρύνονται µε µικρότερο κόστος µεταφοράς [Harper & Evers, 1993]. 2. Ενώσεις Μεταφορέων (Shipper s Association): Οι ενώσεις µεταφορέων ορίζονται «µη κερδοσκοπικοί οργανισµοί που προωθούν τις µικρές αποστολές µε φορτηγά για τα µέλη τους». Το πλεονέκτηµα που προσφέρουν στους αποστολείς είναι το χαµηλότερο κόστος από αυτό που θα πλήρωναν αν πραγµατοποιούσαν µόνοι τους την αποστολή [Ferreira & Sigut, 1993]. 3. Μεσίτες (Brokers): Ο µεσίτης προσλαµβάνεται από διάφορες επιχειρήσεις για να πραγµατοποιεί µεταφορές, λαµβάνοντας προµήθειες για τις µεταφορές αυτές. Οι επιχειρήσεις που χρησιµοποιούν µεσίτες είναι κυρίως αυτές που δε διαθέτουν - 9 -

26 Κεφάλαιο 1 ο Αντικείµενο της διατριβής την εµπειρία, το χρόνο και το προσωπικό για την πραγµατοποίηση των µεταφορών [Ferreira & Sigut, 1995]. 1.2 Το αντικείµενο της διατριβής Το αντικείµενο της παρούσης διατριβής αφορά στη διαχείριση συνδυασµένων µεταφορικών συναλλαγών µέσω της ολοκλήρωσης υβριδικών συστηµάτων συστάσεων και τεχνικών εξόρυξης γνώσης. Πιο συγκεκριµένα, η διατριβή προτείνει ένα καινοτόµο πλαίσιο διαχείρισης συναλλαγών συνδυασµένων µεταφορών, το οποίο βασίζεται σε µια δοµική µονάδα υβριδικών συστάσεων υποβοηθούµενη από µοντέλα γνώσης και αξιοποιεί σύγχρονες τεχνολογίες διαδικτύου. Η προτεινόµενη προσέγγιση υποστηρίζεται από ένα πρωτότυπο πληροφοριακό σύστηµα που βοηθά τους εµπλεκόµενους στην ολοκλήρωση των µεταφορικών τους συναλλαγών, προσφέροντας ένα σύνολο κατάλληλων συστάσεων στον κάθε χρήστη. Βασικός στόχος της προτεινόµενης προσέγγισης είναι ο καθορισµός ενός πλαισίου συναλλαγών, µέσω της αποτύπωσης και προτυποποίησης όλων εκείνων των διαδικασιών που απαιτούνται για την πραγµατοποίηση µιας συνδυασµένης µεταφορικής συναλλαγής, τόσο από την πλευρά του πελάτη όσο και από την πλευρά του µεταφορέα. Για το λόγο αυτό, ορίζονται αυστηρά οι λειτουργίες που θα επιτελεί το σύστηµα, βάσει των χαρακτηριστικών του όρου «συνδυασµένες µεταφορές» που αναλύθηκε στην προηγούµενη ενότητα. Ένας δεύτερος στόχος της διατριβής, είναι να ενσωµατώσει στο συγκεκριµένο πλαίσιο συναλλαγών λειτουργίες που υποβοηθούν τα εµπλεκόµενα µέρη και αφορούν στην επιστηµονική περιοχή των Ευφυών Πρακτόρων, µε παράλληλη χρήση Σύγχρονων Τεχνολογιών ιαδικτύου, αναβαθµίζοντας έτσι τη λειτουργικότητά του µέσω της παροχής υψηλού επιπέδου υπηρεσιών στους χρήστες. Το προτεινόµενο πληροφοριακό σύστηµα είναι ικανό να λαµβάνει αιτήσεις µεταφοράς εµπορευµάτων από τους πελάτες και αφού λάβει υπόψη του τα κριτήρια των πελατών, να παρουσιάζει όλες τις προτεινόµενες συνδυασµένες ή µη µεταφορικές λύσεις, µέσω κατάλληλων αλγορίθµων εύρεσης βέλτιστων και υποβέλτιστων λύσεων [Lazanas and Megalokonomos, 2006]. Ο σχεδιασµός του συστήµατος γίνεται µε την θεώρηση της υπηρεσίας διαµεσολάβησης (brokerage service) [Klusch & Sycara, 2001] και αφορά στην ενσωµάτωση κατάλληλα σχεδιασµένων πρακτόρων λογισµικού (software agents), ικανών να διεκπεραιώνουν κάθε αίτηµα των εµπλεκοµένων πλευρών. Τα χαρακτηριστικά των πρακτόρων του συστήµατος εγγυώνται συνεχή διαµεσολάβηση και διαρκή ενηµέρωση των χρηστών [Karacapilidis et al., 2006]

27 Κεφάλαιο 1 ο Αντικείµενο της διατριβής Η εκµετάλλευση κατάλληλων τεχνικών συστάσεων αποτελεί επίσης βασικό στόχο της διατριβής. Πιο συγκεκριµένα, η διατριβή ολοκληρώνει διαφορετικές τεχνικές συστάσεων, έτσι ώστε οι παρεχόµενες συστάσεις για κάθε εναλλακτική λύση να συνοδεύονται από επαρκή αιτιολόγηση µέσω κατάλληλα ορισµένων µοντέλων γνώσης. Για το σκοπό αυτό, αξιοποιήθηκαν δύο από τις βασικές τεχνικές συστάσεων [Billsus & Pazzani, 1998; Burke, 1999; Sarwar et al., 2001; Adomavicius & Tuzhilin, 2003] µε παράλληλη ή αυτόνοµη χρήση, ανάλογα µε το είδος της συναλλαγής. Το προτεινόµενο υβριδικό µοντέλο συστάσεων εφοδιάζεται µε την απαραίτητη γνώση µέσω ενσωµατωµένων αλγορίθµων εξόρυξης γνώσης [Michalski et al., 1992] από τη βάση δεδοµένων των συναλλαγών του συστήµατος. Οι αλγόριθµοι αυτοί αφορούν σε θέµατα δηµιουργίας κανόνων συσχέτισης, αλυσίδων δεδοµένων και ανάλυσης αγοράς. To σύστηµα βρίσκει σε πρώτη φάση ένα αρχικό σύνολο συστάσεων, βασισµένο στην τεχνική συνεργατικού φιλτραρίσµατος, και στη συνέχεια χρησιµοποιεί την «κατασκευασµένη» γνώση για να το εµπλουτίσει, λαµβάνοντας υπόψη τους κανόνες γνώσης που έχουν προκύψει µε την δεύτερη τεχνική. Με τον τρόπο αυτό, αυξάνεται έτσι η ποιότητα των παρεχόµενων συστάσεων και ουσιαστικά ανατροφοδοτείται θετικά (positive feedback) η δοµική µονάδα συστάσεων του συστήµατος [Srikant et al., 1997], µιας και υψηλού επιπέδου συστάσεις οδηγούν σε βέλτιστη επιλογή µεταφορικής λύσης, µε αποτέλεσµα το υψηλό επίπεδο εγκυρότητας της αξιολόγησης του χρήστη. 1.3 Η συµβολή της διατριβής Η συνεισφορά της παρούσης διατριβής έγκειται στο συνδυαστικό τρόπο προσέγγισης των διαδικασιών παροχής συστάσεων σε µεµονωµένους χρήστες ή επιχειρήσεις, µέσω της δηµιουργίας ισχυρών κανόνων γνώσης και αξιοποίησης σύγχρονων τεχνολογιών διαδικτύου στο πεδίο των συνδυασµένων µεταφορών. Όπως αναφέρθηκε στην Παράγραφο 1.1.5, στη βιβλιογραφία υπήρχε και υπάρχει (µιας και το επιστηµονικό πεδίο των συνδυασµένων µεταφορών βρίσκεται σε «προ-παραδειγµατική» φάση) καταγεγραµµένη η ανάγκη για ανάπτυξη µοντέλων στο χώρο των πληροφοριακών συστηµάτων ικανών να διαχειριστούν το ζήτηµα των συνδυασµένων µεταφορών [Crainic, 1999; Crainic et al., 1990; Declerc & Verbeke, 1999; Eatough et al., 2000], µε ταυτόχρονη παροχή συστάσεων στους εµπλεκόµενους χρήστες. Στο πεδίο των συνδυασµένων µεταφορών η διατριβή προτείνει ένα πλαίσιο διαχείρισης των µεταφορικών συναλλαγών και της πολυπλοκότητας που είναι έµφυτη σε τέτοια περιβάλλοντα, λόγω του µεγάλου αριθµού εµπλεκοµένων πλευρών και πραγµατοποιούµενων λειτουργιών [Karacapilidis et al., 2006]. Η

28 Κεφάλαιο 1 ο Αντικείµενο της διατριβής προτεινόµενη καινοτόµος προσέγγιση αποτυπώνει τις διαδικασίες δροµολόγησης φορτίου από τη σκοπιά του πελάτη όσο και του µεταφορέα, κάνοντας χρήση πολλαπλών µεταφορικών µέσων και διαφορετικών µεταφορικών εταιρειών, προσφέροντας παράλληλα εργαλεία υποβοήθησης των εµπλεκοµένων χρηστών. Όπως βλέπουµε και σε εργασίες ανασκόπησης (reviews) της σχετικής βιβλιογραφία [Bontekoning & Macharis, 2003], έχει ήδη επισηµανθεί η ανάγκη ανάπτυξης τέτοιων συστηµάτων σαν το συγκεκριµένο που προτείνει η διατριβή. Το προτεινόµενο σύστηµα µπορεί να χρησιµοποιηθεί αυτόνοµα ή ως επέκταση/δοµική µονάδα ήδη υπάρχοντος συστήµατος logistics σε µεταφορική επιχείρηση. Πρέπει να σηµειωθεί πως η επισκόπηση της διεθνούς βιβλιογραφίας (µέχρι τον Ιούλιο του 2008), δεν αναφέρει άλλο παρόµοιο υλοποιηµένο σύστηµα, στο πεδίο των συνδυασµένων µεταφορών. Πέρα από την συµβολή στον τοµέα των συνδυασµένων µεταφορών, η παρούσα διατριβή διευρύνει το πλαίσιο παροχής συστάσεων σε χρήστες συστηµάτων βασισµένων στο ιαδίκτυο. Πιο συγκεκριµένα, προτείνει µια δοµική µονάδα συστάσεων που είναι ικανή να παρέχει συστάσεις στους εµπλεκόµενους χρήστες και µεταφορείς, βασισµένη στο συνδυασµό αυτόνοµων τεχνικών συστάσεων που έχουν έως τώρα προταθεί [Lazanas et al., 2007], δηµιουργώντας έτσι ένα υβριδικό µοντέλο συστάσεων βασισµένο στο συνεργατικό φιλτράρισµα και στα µοντέλα γνώσης που κατασκευάζει. Ο υβριδισµός στις τεχνικές συστάσεων παρακάµπτει πολλά από τα προβλήµατα που ανακύπτουν από τη χρήση µιας µόνο τεχνικής [Burke, 1999; Burke, 2000], χρησιµοποιώντας κατάλληλα κάθε τεχνική ξεχωριστά, ή συνδυάζοντας τα αποτελέσµατά τους στις προτάσεις προς τους χρήστες. Λόγω του τρόπου λειτουργίας τους, τα υβριδικά συστήµατα έχουν ιδιαίτερα ευρύ πεδίο εφαρµογής, πολύ ευρύτερο από µια δοµική µονάδα συστάσεων. Οι περιπτώσεις στις οποίες έχουµε µεγάλο όφελος από την εφαρµογή ενός υβριδικού συστήµατος είναι αυτές όπου η διαφορά απόδοσης µεταξύ των δύο τεχνικών είναι µεγάλη (σε διαφορετικές περιοχές του φάσµατος των συνθηκών λειτουργίας του συστήµατος). Θα πρέπει, δηλαδή, σε κάποιες συνθήκες λειτουργίας να υπερέχει η µία τεχνική και σε άλλες η άλλη, πράγµα σύνηθες σε τέτοιου είδους προβλήµατα. Σε ότι αφορά τη συµβολή της προτεινόµενης προσέγγισης στον τοµέα των ευφυών πρακτόρων, αυτή εντοπίζεται στον ορισµό µιας κοινότητας πρακτόρων (agent community) βασισµένη στη διαµεσολάβηση (brokerage) [Karacapilidis et al., 2003], γεγονός που προσοµοιώνει σε µεγάλο βαθµό τη λειτουργία των συναλλαγών σε επίπεδο ανθρώπινων επιχειρήσεων. Στην καθηµερινότητα, τέτοιου είδους µεταφορικές συναλλαγές πραγµατοποιούνται στη συντριπτική τους πλειοψηφία µε την διαµεσολάβηση του ανθρώπινου παράγοντα, µε όλες τις

29 Κεφάλαιο 1 ο Αντικείµενο της διατριβής αδυναµίες που αυτό συνεπάγεται. Στη διατριβή προτείνεται η δηµιουργία µιας κοινότητας πρακτόρων που θα αλληλεπιδρά και θα συνεργάζεται για την επίλυση συγκεκριµένων προβληµάτων στις µεταφορικές συναλλαγές [Sycara & Zeng, 1996]. Η διαφορετικότητα της προσέγγισής µας έγκειται επίσης στο γεγονός της αποκέντρωσης των καθηκόντων (task decentralization) των δοµικών µονάδων, µέσω της ανάθεσής τους σε εξειδικευµένους πράκτορες ικανούς να εκτελέσουν την συγκεκριµένη εργασία. Οι πράκτορες αυτοί είναι αφιερωµένοι στο στόχο τους, διατηρούν κατάλληλη γνώση για το περιβάλλον τους και αλληλεπιδρούν µε τους υπόλοιπους πράκτορες της κοινότητας. Το µοντέλο των πρακτόρων, όπως αυτό ορίστηκε κατά τον σχεδιασµό του συστήµατος, µπορεί να αποτελέσει ένα πρώτο σηµείο αναφοράς στη βιβλιογραφία, σχετικά µε τον σχεδιασµό συστηµάτων διαχείρισης συνδυασµένων µεταφορών βασισµένο στους ευφυείς πράκτορες [Karacapilidis et al., 2006]. Βασική καινοτοµία της διατριβής αποτελεί επίσης η υποστήριξη των παρεχόµενων συστάσεων µέσω κατάλληλων µοντέλων γνώσης. Η εξόρυξη γνώσης είναι ένα επιστηµονικό πεδίο που εκτός των άλλων εφαρµογών βοηθά στη δηµιουργία γνώσης σε κάθε µορφή συστήµατος µε αποθήκες δεδοµένων. Η προσέγγισή µας αξιοποίησε τις µεθόδους και τεχνικές εξόρυξης γνώσης που έχουν παρουσιαστεί στη βιβλιογραφία [Anwar et al., 1992; Fayyad et al., 1993; Chen et al., 1997] µε σκοπό την περαιτέρω υποβοήθηση της δοµικής µονάδας συστάσεων του συστήµατος. Η προτεινόµενη προσέγγιση συνεισφέρει στην αξιοποίηση τριών διακριτών τύπων γνώσης: της περιγραφικής γνώσης (descriptive knowledge), που αφορά δεδοµένα και πληροφορίες από το περιβάλλον του οργανισµού, της διαδικαστικής γνώσης (procedural knowledge), που αφορά στις διαδικασίες επίλυσης των σχετικών προβληµάτων, και της συλλογιστικής γνώσης (reasoning knowledge) που βασίζεται σε καλά ορισµένους κανόνες (rules) και προηγούµενες περιπτώσεις (cases). Σε όλη τη φάση της λειτουργίας του συστήµατος, η συσσωρευµένη γνώση παρουσιάζεται στους χρήστες, βοηθώντας τους έτσι στην ολοκλήρωση των συναλλαγών τους µε αποδοτικό τρόπο [Lazanas & Karacapilidis, 2008]. Τέλος, η παρούσα διατριβή καινοτοµεί σε ότι αφορά τις χρησιµοποιούµενες τεχνολογίες που χρησιµοποιήθηκαν για την ανάπτυξη του προτεινόµενου συστήµατος [Karacapilidis et al., 2006]. Στα πλαίσια της σχετικής έρευνας, διαπιστώθηκε ότι οι υπάρχουσες προσεγγίσεις ελάχιστα εκµεταλλεύονται τις δυνατότητες που παρέχονται σήµερα από τις τεχνολογίες διαδικτύου. Οι τεχνολογίες που χρησιµοποιήθηκαν κατά την υλοποίηση του προτεινόµενου πλαισίου κατ αρχάς προσφέρουν τη δυνατότητα χρήσης του µέσω του ιαδικτύου (Web-based approach). Έτσι, αξιοποιήθηκαν οι νέες τάσεις στην υλοποίηση

30 Κεφάλαιο 1 ο Αντικείµενο της διατριβής διαδικτυακών συστηµάτων µε χρήση τεχνολογιών όπως αυτή της πολυπρακτορικής κοινότητας (multi-agent community), των δικτυακών κατανεµηµένων βάσεων δεδοµένων, των δυναµικών ιστοσελίδων και των συµβάντων στην πλευρά του υπολογιστή - πελάτη (client-side events) µέσω της τεχνολογίας Asynchronous JavaScript and XML (AJAX). Ακόµη, µε την αξιοποίηση του προτεινόµενου Μοντέλου Γνώσης της Βάσης Γνώσης του προτεινόµενου συστήµατος, αλλά και την υλοποίηση αυτών µε τεχνολογίες που εκµεταλλεύονται τα πλεονεκτήµατα της γλώσσας αναπαράστασης δεδοµένων Extensible Markup Language (XML), αναπτύχθηκε µια καινοτόµος προσέγγιση σε ότι αφορά την απόκτηση/εκµαίευση και την αποθήκευση της γνώσης. Επίσης, αναπτύχθηκαν και υλοποιήθηκαν πρωτότυποι αλγόριθµοι για την αναπαράσταση, επεξεργασία και αποθήκευση της νέας γνώσης, οι οποίοι επιτρέπουν την εξαγωγή χρήσιµων συµπερασµάτων [Lazanas and Karacapilidis, 2007] Μεθοδολογία Η µεθοδολογία που ακολουθήθηκε προκειµένου να περατωθεί η παρούσα διατριβή µπορεί να αναλυθεί σε τρία βασικά στάδια. Πιο συγκεκριµένα, το πρώτο στάδιο αφορούσε σε βιβλιογραφική έρευνα µε στόχο τη συλλογή στοιχείων, τόσο για τη θεωρητική προσέγγιση του θέµατος, όσο και για την ανάλυση και το σχεδιασµό του συστήµατος, ώστε αυτό να ανταποκρίνεται στις πραγµατικές ανάγκες των χρηστών. Για το σκοπό αυτό πραγµατοποιήθηκαν δραστηριότητες όπως η αναδίφηση της σχετικής βιβλιογραφίας, η µελέτη των αναγκών των οργανισµών και επιχειρήσεων και η κριτική θεώρηση των υπαρχουσών προσεγγίσεων. Μέσα από τις δραστηριότητες αυτές έγινε η ανάλυση των απαιτήσεων που έχουν οι οργανισµοί, οι επιχειρήσεις και οι πελάτες σε θέµατα συστηµάτων συστάσεων σε µεταφορικές συναλλαγές, και προέκυψε ο καθορισµός των προδιαγραφών του προτεινόµενου συστήµατος. Το δεύτερο στάδιο αφορούσε στην ανάπτυξη των θεωρητικών µοντέλων του προβλήµατος, µε απώτερο στόχο τον ορισµό των βασικών δοµικών µονάδων του προτεινόµενου συστήµατος. Πιο συγκεκριµένα, έγινε ο καθορισµός ενός κατάλληλου υβριδικού µοντέλου συστάσεων που λαµβάνει υπ όψη τις ιδιαίτερες ανάγκες ενός περιβάλλοντος µεταφορικών συναλλαγών. Ιδιαίτερη έµφαση δόθηκε στην εξατοµίκευση των συστάσεων προς τους πελάτες µέσω του καθορισµού υβριδικών µεταφορικών πλάνων µε κριτήρια οριζόµενα πλήρως από το χρήστη. Στη συνέχεια, έγινε ο καθορισµός των απαραίτητων µοντέλων εξόρυξης γνώσης από τη βάση δεδοµένων συναλλαγών του συστήµατος για τη σύγκριση και αξιολόγηση των εναλλακτικών λύσεων, µέσω ειδικών κανόνων γνώσης. Ακολούθησε ο καθορισµός των λειτουργιών των πρακτόρων του συστήµατος και η

31 Κεφάλαιο 1 ο Αντικείµενο της διατριβής ανάθεση των κατάλληλων αρµοδιοτήτων σε καθέναν από αυτούς, και στη συνέχεια η ανάπτυξη των κατάλληλων αλγορίθµων εύρεσης µεταφορικών λύσεων και παρουσίασής τους στους πελάτες. Οι αλγόριθµοι αναπτύχθηκαν βασιζόµενοι σε υπάρχοντες αλγόριθµους της επιχειρησιακής έρευνας µε κατάλληλη προσαρµογή στην πολυπλοκότητα του προβλήµατος έτσι ώστε να είναι ικανοί να διαχειρίζονται σύνθετα προβλήµατα εύρεσης βέλτιστων διαδροµών [Lazanas et al., 2006]. Τέλος, πρέπει να σηµειωθεί πως έγινε ενδελεχής µελέτη και αξιολόγηση των σύγχρονων τεχνολογιών διαδικτύου και των τελευταίων εξελίξεων σε πληροφοριακά συστήµατα βασισµένα σε ευφυείς πράκτορες, προσαρµόζοντας κατάλληλα την ανάλυση και τον σχεδιασµό του συστήµατος στις τεχνολογίες αυτές. Το τελευταίο στάδιο αφορούσε σε βασική και εφαρµοσµένη έρευνα στα πλαίσια της υλοποίησης των κατάλληλων µηχανισµών για την υλοποίηση του προτεινόµενου συστήµατος. Κατά τη διάρκεια αυτού, έγινε η υλοποίηση όλων των παραπάνω θεωρητικών µοντέλων, µε στόχο την επαλήθευση και επικύρωση αυτών. Πιο συγκεκριµένα, έγινε η ανάπτυξη ενός συστήµατος διαχείρισης µεταφορικών συναλλαγών µε τεχνολογίες που βασίζονται στις δυνατότητες του ιαδικτύου. Ακολούθησαν η υλοποίηση της Βάσης Γνώσης η οποία εξυπηρετεί στην αποθήκευση της γνώσης που εξορύσσεται, καθώς επίσης και της Βάσης εδοµένων του συστήµατος όπου αποθηκεύονται όλες οι απαραίτητες πληροφορίες για τη λειτουργία του συστήµατος. Στη συνέχεια υλοποιήθηκαν οι αλγόριθµοι συστάσεων και εξόρυξης γνώσης και τέλος, έγινε η συνένωση όλων των δοµικών µονάδων του προτεινόµενου συστήµατος και η ολοκλήρωση του συστήµατος µε τις σχετικές βάσεις δεδοµένων και γνώσης (συναλλαγές, προφίλ, στοιχεία πελατών και µεταφορέων, βαθµολογήσεις, κανόνες γνώσης, κ.α.). Μετά από την πιλοτική εφαρµογή του προτεινόµενου συστήµατος έγιναν κάποιες τελικές παρεµβάσεις και διορθωτικές αλλαγές για την αποδοτικότερη και φιλικότερη στο χρήστη λειτουργία του ιάρθρωση της διατριβής Το επόµενο κεφάλαιο εξετάζει βασικά θέµατα τα οποία αφορούν σε Συστήµατα Συστάσεων. Πιο συγκεκριµένα, ορίζονται τα βασικά χαρακτηριστικά και οι κυριότερες κατηγορίες των συστηµάτων αυτών, και εξετάζονται οι ιδιαίτερες ανάγκες της παροχής συστάσεων σε χρήστες πληροφοριακών συστηµάτων, όπως αυτές εντοπίζονται στα παραπάνω περιβάλλοντα. Έπειτα, αναφέρονται οι βασικές τεχνικές συστάσεων που εφαρµόζονται από τη σκοπιά της επιστήµης της πληροφορικής και γίνεται µια επισκόπηση των βασικών πλεονεκτηµάτων και µειονεκτηµάτων κάθε µιας απ αυτές. Το κεφάλαιο κλείνει µε την αναφορά στα υβριδικά συστήµατα συστάσεων και στον τρόπο που αυτά µπορούν να

32 Κεφάλαιο 1 ο Αντικείµενο της διατριβής αντιµετωπίσουν µια σειρά προβληµάτων που ανακύπτουν µε την εφαρµογή των παραδοσιακών τεχνικών συστάσεων, καθώς επίσης και µε την αναφορά συµπερασµάτων και προτάσεων οι οποίες αφορούν στον τρόπο µε τον οποίο µπορούν να αντιµετωπισθούν θέµατα που ανακύπτουν σε τέτοιου είδους περιβάλλοντα. Το τρίτο κεφάλαιο παρουσιάζει βασικές έννοιες και προσεγγίσεις από τις επιστηµονικές περιοχές που µελετά η διατριβή. Μέσα από την ανασκόπηση της σχετικής βιβλιογραφίας, καταγράφονται οι βασικές κατευθύνσεις της έρευνας των συγκεκριµένων χώρων. Κατ αρχήν, γίνεται µια παρουσίαση της έρευνας και των εξελίξεων στο χώρο των Συνδυασµένων Μεταφορών καθώς και συνοπτική παρουσίαση των προσεγγίσεων που έχουν προταθεί στο πεδίο αυτό. Στη συνέχεια, παρουσιάζονται οι κυριότερες προσεγγίσεις στην περιοχή της Εξόρυξης Γνώσης από εδοµένα και γίνεται µια συγκριτική θεώρηση των κυριότερων µεθόδων και ερευνητικών προσεγγίσεων. Τέλος, το κεφάλαιο κλείνει µε την επισκόπηση των βασικότερων ερευνητικών προσεγγίσεων στον τοµέα των Ευφυών Πρακτόρων και την εξαγωγή συµπερασµάτων και προτάσεων. Το τέταρτο κεφάλαιο παρουσιάζει την φάση της ανάλυσης και του σχεδιασµού του συστήµατος. Πιο συγκεκριµένα, παρουσιάζεται η διαδικασία που ακολουθήθηκε για τον καθορισµό των βασικών λειτουργιών και των δοµικών στοιχείων του συστήµατος όπως οι ρόλοι, οι αλληλεπιδράσεις και τα µοντέλα των υπηρεσιών. Στη συνέχεια, γίνεται αναφορά σε σχεδιαστικά ζητήµατα που έχουν να κάνουν µε την δια-πρακτορική επικοινωνία και περιλαµβάνουν τον ορισµό των µοντέλων ενεργειών και αλληλεπιδράσεων µεταξύ χρηστών και πρακτόρων του συστήµατος. Τέλος, παρουσιάζεται η αρχιτεκτονική του προτεινόµενου συστήµατος και γίνεται αναφορά στις δοµικές µονάδες που το αποτελούν. Το πέµπτο κεφάλαιο αφορά στην κατασκευή και σύνθεση των προτεινόµενων δροµολογίων και παρουσιάζει µια σειρά από θέµατα τα οποία θεµελιώνουν το προτεινόµενο µοντέλο κατασκευής µεταφορικών λύσεων. Πιο συγκεκριµένα, εξετάζονται η αναγκαιότητα ανάπτυξης ενός αλγορίθµου εύρεσης βέλτιστων και υπο-βέλτιστων µεταφορικών λύσεων στα πλαίσια της ανάπτυξης του συστήµατος, και παρατίθενται οι κυριότερες αλγοριθµικές προσεγγίσεις στο πρόβληµα εύρεσης βέλτιστων διαδροµών σε µονοβαρείς γράφους (single-weighted graphs). Στη συνέχεια, περιγράφεται η πρότασή µας για έναν νέο αλγόριθµο εύρεσης βέλτιστης διαδροµής, σε γράφους µε περισσότερα του ενός βάρη, ταξινοµώντας τις προτεινόµενες λύσεις βάσει των κριτηρίων που έχουν τεθεί από τον χρήστη. Το κεφάλαιο αυτό κλείνει, µε την παρουσίαση της λειτουργίας του πράκτορα λογισµικού Ιtinerary Builder Agent, ο οποίος είναι επιφορτισµένος µε

33 Κεφάλαιο 1 ο Αντικείµενο της διατριβής τον συντονισµό της όλης διαδικασίας εύρεσης, ταξινόµησης και παρουσίασης των προτεινόµενων µεταφορικών λύσεων στον χρήστη. Το έκτο κεφάλαιο παρουσιάζει την δοµική µονάδα δηµιουργίας συστάσεων για την προτεινόµενη προσέγγιση. Πιο συγκεκριµένα, παρουσιάζεται η υβριδική τεχνική παραγωγής συστάσεων που χρησιµοποιήθηκε µε εκτενή αναφορά στις δύο συνιστώσες τεχνικές που την αποτελούν και τον τρόπο που αυτές συνδυάζονται για να παράγουν το τελικό αποτέλεσµα. Περιγράφεται επίσης ο τρόπος δηµιουργίας εξατοµικευµένων προφίλ των πελατών µέσω του ορισµού συγκεκριµένων προτιµήσεων και επιλογής «µεταφορικού πλάνου», καθώς και η δηµιουργία «ισχυρών» κανόνων γνώσης µε τη χρήση ειδικών αλγορίθµων εξόρυξης γνώσης. Γίνεται επίσης παρουσίαση ενός παραδείγµατος δηµιουργίας τέτοιων κανόνων. Τέλος, παρουσιάζεται η δοµή της βάσης δεδοµένων της δοµικής µονάδας συστάσεων και απεικονίζονται οι συσχετίσεις των οντοτήτων που συµµετέχουν στην παραγωγή συστάσεων, µέσω του διαγράµµατος Οντοτήτων Συσχετίσεων ( ΟΣ) αυτής της δοµικής µονάδας. Το έβδοµο κεφάλαιο επικεντρώνεται στην περιγραφή του προτεινόµενου εργαλείου λογισµικού. Πιο συγκεκριµένα, γίνεται τεχνική περιγραφή των διαδικασιών που υποστηρίζονται και απεικονίζονται στιγµιότυπα από τις βασικές διεπαφές του συστήµατος. Για κάθε µία από τις διεπαφές αυτές, αναλύονται οι βασικές λειτουργίες και οι πληροφορίες που παρουσιάζονται στους χρήστες. Οι λειτουργίες του προτεινόµενου εργαλείου περιγράφονται αναλυτικά µέσα από ένα παράδειγµα χρήσης που αφορά στην ολοκλήρωση µιας µεταφορικής συναλλαγής και την παροχή συστάσεων στο χρήστη. Το όγδοο κεφάλαιο συνοψίζει τη διατριβή και παρουσιάζει τα συµπεράσµατα που προέκυψαν κατά την εκπόνηση αυτής. Ακόµη, παρουσιάζεται µια σειρά από µελλοντικές κατευθύνσεις για επέκταση της έρευνας που διεξήχθη στα πλαίσια της προτεινόµενης προσέγγισης

34 Κεφάλαιο 1 ο Αντικείµενο της διατριβής

35 Κεφάλαιο 2 ο Συστήµατα Συστάσεων 2 ΣΥΣΤΗΜΑΤΑ ΣΥΣΤΑΣΕΩΝ 2.1 Γενικά Η διαδικασία διάχυσης της γνώσης έχει ιδιαίτερη σηµασία σε κάθε τοµέα της κοινωνικής ζωής. Ο ρυθµός της κοινωνικής προόδου εξαρτάται σε µεγάλο βαθµό από την διαθεσιµότητα και την ποιότητα των µέσων επικοινωνίας, και της διακίνησης γνώσης. Εποµένως, η ύπαρξη και διατήρηση αποτελεσµατικών µέσων συγκέντρωσης και διάχυσης γνώσης και πληροφορίας είναι κρίσιµος παράγοντας για την πρόοδο της κοινωνίας [Basu et al., 1998]. Στο επίπεδο του µεµονωµένου ατόµου, η γενική συγκεντρωµένη γνώση πολλές φορές δεν αρκεί. Για να µπορέσει ένα άτοµο να λάβει σωστές αποφάσεις για ό,τι τον αφορά, χρειάζεται πρόσθετες και εξειδικευµένες πληροφορίες που αφορούν στο συγκεκριµένο ζήτηµα. Στις προϊστορικές κοινωνίες, όπου το συνολικό ποσό της συσσωρευµένης γνώσης ήταν ελάχιστο, και οι περιπτώσεις όπου απαιτείτο η λήψη περίπλοκων αποφάσεων ήταν σπάνιες, η ανάκτηση των εξειδικευµένων πληροφοριών δεν παρουσίαζε ιδιαίτερες δυσκολίες [Salton & McGill, 1983]. Στις σύγχρονες, εξελιγµένες κοινωνίες όµως, το άτοµο βρίσκεται συνεχώς αντιµέτωπο µε προκλήσεις όπου απαιτείται λήψη αποφάσεων για περίπλοκα ζητήµατα. Επίσης, στην σύγχρονη κοινωνία υπάρχει µία τεράστια ποσότητα συσσωρευµένης γνώσης και ποικιλία πιθανών επιλογών και προτιµήσεων. Για το λόγο αυτό, ο σύγχρονος άνθρωπος στρέφεται στο στενό ή ευρύτερο κοινωνικό περίγυρο προκειµένου να προσλάβει τις απαραίτητες εξειδικευµένες πληροφορίες. Οι πληροφορίες αυτές έχουν συνήθως την µορφή συστάσεων προτάσεων. Σε τέτοιες περιπτώσεις, ο κοινωνικός περίγυρος του ατόµου λειτουργεί ως «φίλτρο» που επιτρέπει στις σχετικές πληροφορίες να φτάσουν στον ενδιαφερόµενο, µπλοκάροντας ταυτόχρονα τον όγκο των άχρηστων στην συγκεκριµένη περίπτωση πληροφοριών. Αυτή η µέθοδος απαιτεί από τον ενδιαφερόµενο να καταβάλλει προσπάθεια, ζητώντας ενεργά πληροφορίες από το περιβάλλον του [Terveen & Hill, 2001]. Στο σύγχρονο περιβάλλον, τα ενδιαφέροντα ενός µέσου ανθρώπου και οι τοµείς της γνώσης στους οποίους υποχρεώνεται να εντρυφήσει πολλαπλασιάζονται συνεχώς, δηµιουργώντας µεγάλη πίεση χρόνου. Οι απαραίτητες πληροφορίες πρέπει να ανευρίσκονται σύντοµα και µάλιστα χωρίς να υπάρχει η ανάγκη ο ενδιαφερόµενος να περιπλανηθεί σε έναν λαβύρινθο άχρηστων στοιχείων, προκειµένου να βρει αυτά που τον ενδιαφέρουν [Konstan et al., 1998]. Η πίεση χρόνου και η ανάγκη για µεγαλύτερη αποτελεσµατικότητα γίνεται ιδιαίτερα

36 Κεφάλαιο 2 ο Συστήµατα Συστάσεων εµφανής στον τοµέα των αγορών. Ο σύγχρονος άνθρωπος πρέπει να κάνει τις αγορές του όσο το δυνατόν γρηγορότερα, έχοντας όµως κάνει προηγουµένως ενδελεχή έρευνα αγοράς. Η έρευνα αγοράς είναι ένα σηµείο ολοένα και πιο κρίσιµο, λόγω του πλήθους των οµοειδών προϊόντων που συναντά πλέον ο υποψήφιος αγοραστής σε κάθε περίπτωση [Hill et al., 1995]. Τα προηγούµενα εξηγούν ως έναν βαθµό την τεράστια άνοδο και ανάπτυξη που παρουσιάζεται στον τοµέα του ηλεκτρονικού εµπορίου και γενικότερα της χρήσης του ιαδικτύου στις σύγχρονες κοινωνίες. Μέσω του ιαδικτύου µπορεί κανείς να αποκτήσει πρόσβαση σε ένα πλήθος πληροφοριών κάθε είδους, καθώς και πρόσβαση σε µία τεράστια παγκόσµια αγορά προϊόντων και υπηρεσιών. Η τεράστια, όµως έκταση του ιαδικτύου και των πληροφοριών που αυτό περιέχει µπορεί να αποτελέσει µειονέκτηµα όταν ο χρήστης πρέπει να βρει γρήγορα την πληροφορία ή το προϊόν που επιθυµεί. Ακόµη όµως και όταν υπάρχει επάρκεια χρόνου, η εξέταση και αξιολόγηση ενός τεράστιου αριθµού οµοειδών προϊόντων είναι µία διαδικασία µε αυξηµένη πολυπλοκότητα. Επιπλέον, η λύση αυτού του προβλήµατος µέσω προσφυγής του χρήστη σε ένα µέλος του κοινωνικού του περιγύρου µε γνώσεις και εµπειρία στο θέµα που τον απασχολεί δεν είναι πάντοτε δυνατή ή τουλάχιστον ευχερής [Guttman et al., 1998]. Προς βοήθεια των χρηστών του ιαδικτύου που αντιµετωπίζουν τέτοια προβλήµατα έρχονται τα Πληροφοριακά Συστήµατα Συστάσεων (Recommendation Systems) [Burke, 1999]. Τα συστήµατα αυτά, λύνουν τέτοιου είδους προβλήµατα παρέχοντας στους χρήστες τους αξιόπιστες συστάσεις για διάφορα προϊόντα, βιβλία, κείµενα, πληροφορίες, κ.α. Τα Συστήµατα Συστάσεων καταλήγουν σε συστάσεις µέσω των τεχνικών που θα αναλύσουµε στις επόµενες παραγράφους και υποκαθιστούν ως έναν βαθµό τη διαδικασία διάχυσης γνώσης µέσω του κοινωνικού περίγυρου, σε συγκεκριµένες κατηγορίες προβληµάτων. Τα Συστήµατα Συστάσεων είναι βασισµένα συνήθως στο ιαδίκτυο και παρέχουν συµβουλές σε διαδικτυακούς χρήστες σχετικά µε προϊόντα ή υπηρεσίες, τα οποία επιθυµούν να αγοράσουν ή να µελετήσουν [Burke, 1999]. Οι συστάσεις που παρέχονται µέσω των συστηµάτων αυτών µπορούν να κατευθύνουν τους χρήστες µέσα σε µεγάλο όγκο πληροφοριών. Στόχος της εισαγωγής και ενσωµάτωσης διαφόρων τύπων Συστηµάτων Συστάσεων σε συστήµατα Ηλεκτρονικού Επιχειρείν, είναι η επιτέλεση µιας πιο ακριβούς αξιολόγησης των διαφόρων υπαρχόντων εναλλακτικών επιλογών και εποµένως ο εµπλουτισµός των προτάσεων που παρέχονται στους χρήστες. Ιστορικά, το πρώτο σύστηµα συστάσεων ήταν το «Tapestry» [Goldberg et al., 1992]. Οι δηµιουργοί του εισήγαγαν για πρώτη φορά τον όρο Συνεργατικό Φιλτράρισµα (Collaborative Filtering) για να περιγράψουν την δυνατότητα

37 Κεφάλαιο 2 ο Συστήµατα Συστάσεων σύγκρισης των αξιολογήσεων ενός χρήστη µε τις αξιολογήσεις των άλλων, µε στόχο την παραγωγή συστάσεων οι οποίες να ικανοποιούν τις προτιµήσεις του. Το σύστηµα αυτό λειτουργούσε στα πλαίσια µίας σχετικά µικρής οµάδας ανθρώπων µε ύπαρξη διαπροσωπικών σχέσεων ανάµεσα στα µέλη της, όπως οι εργαζόµενοι σε ένα γραφείο ή µία επιχείρηση. Γενικά, τα συστήµατα συστάσεων χρησιµοποιούν διάφορες τεχνικές για να συλλέξουν πληροφορίες σχετικά µε τους χρήστες (προτιµήσεις, προτεραιότητες κ.α.) και τις εναλλακτικές επιλογές προϊόντα, τα οποία βρίσκονται στην διάθεση των χρηστών (τεχνικά χαρακτηριστικά, βαθµολογία προερχόµενη από άλλους χρήστες, κ.α.). Τα στοιχεία αυτά αξιοποιούνται µε σκοπό να συσχετιστούν οι χρήστες µε αυτά τα αντικείµενα προϊόντα τα οποία είναι πιο πιθανό να καλύπτουν τις απαιτήσεις τους. Η αξιοποίηση των στοιχείων αυτών και η εξαγωγή των συστάσεων, γίνονται µέσω της χρήσης κατάλληλων αλγορίθµων Κατηγορίες συστηµάτων συστάσεων Τα Συστήµατα Συστάσεων που υπάρχουν σήµερα κατανέµονται σε τρεις γενικές κατηγορίες βάσει της τεχνικής αξιοποίησης στοιχείων και εξαγωγής συστάσεων στην οποία βασίζονται. Οι κατηγορίες αυτές είναι οι εξής: Συστήµατα collaborative social filtering [Resnick & Varian, 1997]: Τα συστήµατα αυτά βασίζονται στις αξιολογήσεις βαθµολογήσεις των αντικειµένων από τους χρήστες τους. Τις αξιολογήσεις αυτές τις αξιοποιούν µε βάση την εξής αρχή: οι χρήστες οι οποίοι δίνουν παρεµφερείς αξιολογήσεις για ορισµένα αντικείµενα, έχουν παρεµφερή ενδιαφέροντα και ανάγκες, και κατά συνέπεια θα ενδιαφέρονται για τα ίδια αντικείµενα. Τα συστήµατα αυτά δεν έχουν καµία γνώση για τα χαρακτηριστικά των αντικειµένων που προτείνουν, ούτε για τις ανάγκες των χρηστών τους. Συστήµατα βασισµένα στην γνώση (Knowledge - based Recommendation Systems) [Burke, 2000]: Τα συστήµατα αυτά δηµιουργούν γνώση για να εξάγουν χρήσιµες συστάσεις. Πιο συγκεκριµένα βασίζονται: α) Στην γνώση των χαρακτηριστικών των αντικειµένων που έχουν στην διάθεσή τους. β) Στην γνώση των αναγκών και των απαιτήσεων των χρηστών τους γ) Στην γνώση σχετικά µε το πώς ορισµένα χαρακτηριστικά των αντικειµένων καλύπτουν και ανταποκρίνονται σε συγκεκριµένες ανάγκες των χρηστών. Υβριδικά συστήµατα [Burke, 2003]: Τα συστήµατα που αναφέρθηκαν πιο πάνω έχουν ορισµένα προβλήµατα και αδυναµίες - διαφορετικά το καθένα - που θα αναλυθούν στην συνέχεια της διατριβής. Ένας τρόπος να αντιµετωπιστούν αυτά τα προβλήµατα, είναι να δηµιουργηθεί ένα σύστηµα που να αξιοποιεί

38 Κεφάλαιο 2 ο Συστήµατα Συστάσεων περισσότερες από µία από τις προαναφερθείσες µεθόδους. Με αυτό τον τρόπο η µία µέθοδος µπορεί να αναιρέσει τις αδυναµίες της άλλης και να προκύψει έτσι ένα πιο αξιόπιστο σύστηµα. 2.2 Συστήµατα collaborative filtering Η τεχνική του Collaborative Filtering (CF) ήταν η πρώτη που χρησιµοποιήθηκε σαν βάση για τα συστήµατα συστάσεων (Tapestry, Group Lens) [Konstan et al., 1998]. Η τεχνική αυτή δεν βασίζεται σε γνώση των χαρακτηριστικών των αντικειµένων προκειµένου να παράγει συστάσεις για κάποιον χρήστη, αλλά αντίθετα βασίζεται στην οµοιότητα του χρήστη αυτού µε άλλους (βλ. Σχήµα 2-1). Η οµοιότητα προκύπτει από την σύγκριση των αξιολογήσεων του εν λόγω χρήστη µε τις αξιολογήσεις άλλων χρηστών. Όταν βρεθούν χρήστες µε µεγάλο βαθµό οµοιότητας, το σύστηµα προβαίνει σε συστάσεις µε βάση την λογική ότι οι χρήστες των οποίων οι αξιολογήσεις µοιάζουν, θα προτιµήσουν τα ίδια αντικείµενα. Στην πραγµατικότητα, το σύστηµα δεν χρειάζεται να έχει καµία γνώση για τα χαρακτηριστικά ή τις ιδιότητες των αντικειµένων που βρίσκονται στην διάθεσή του. Τα αντικείµενα απεικονίζονται αποκλειστικά µέσω των αξιολογήσεων που δέχονται από τους χρήστες. Η τεχνική αυτή είναι ευρέως χρησιµοποιούµενη στα συστήµατα συστάσεων σήµερα. Στις επόµενες παραγράφους θα εξετάσουµε εκτενέστερα την διαδικασία που ακολουθείται. Σχήµα 2-1. Συστήµατος Collaborative Filtering Λειτουργία συστηµάτων collaborative filtering Η τεχνική του Collaborative Filtering βασίζεται κυρίως στην συλλογή ενός µεγάλου αριθµού αξιολογήσεων από τους χρήστες για διάφορα αντικείµενα. Οι αξιολογήσεις αυτές µπορεί να έχουν διάφορες µορφές. Η συνηθέστερη είναι η

39 Κεφάλαιο 2 ο Συστήµατα Συστάσεων µορφή της άµεσης αξιολόγησης σε µία διακριτή κλίµακα βαθµολογίας (π.χ. από το 1 έως το 10) [Littlestone & Warmuth, 1994]. ηµιουργείται έτσι ένας πίνακας Collaborative Filtering Matrix (CFM) που περιέχει όλες τις αξιολογήσεις που έχουν δοθεί από όλους τους χρήστες για όλα τα αντικείµενα. Ο πίνακας αυτός έχει µέγεθος m x n όπου m είναι ο αριθµός των αντικειµένων του συστήµατος και n ο αριθµός των χρηστών. Ο πίνακας αυτός είναι η βάση για την λειτουργία όλου του συστήµατος. Όταν τα συστήµατα αυτού του είδους δεχτούν ένα αίτηµα για παροχή συστάσεων από έναν χρήστη, εφαρµόζουν σε γενικές γραµµές τα ακόλουθα βήµατα: 1ο βήµα: Στην περίπτωση που ένας χρήστης ζητήσει σύσταση, το σύστηµα συγκρίνει τις αξιολογήσεις που έχει δώσει ο χρήστης αυτός, µε αυτές όλων των άλλων χρηστών που βρίσκονται στον πίνακα αξιολογήσεων. Οι αξιολόγηση από τον συγκεκριµένο χρήστη καταχωρείται εκείνη την στιγµή, εάν δεν βρίσκεται ήδη στον πίνακα αξιολογήσεων. Επιπλέον, το σύστηµα µπορεί να χρησιµοποιεί και έµµεσες αξιολογήσεις. Μέσω αυτής της σύγκρισής, και µε βάση κατάλληλο αλγόριθµο, το σύστηµα βρίσκει έναν αριθµό n χρηστών που µοιάζουν περισσότερο στον συγκεκριµένο χρήστη. Οι χρήστες αυτοί ονοµάζονται «γείτονες» (neighbours) του τρέχοντος χρήστη και το σύνολό τους «γειτονιά» του (neighbourhood). Ένας τέτοιος αλγόριθµος, ο οποίος χρησιµοποιείται πολύ συχνά για την εύρεση των γειτόνων ενός χρήστη, είναι ο αλγόριθµος Pearson [Herlocker et al.,1999]. Ο αλγόριθµός Pearson µας δίνει µία «ποσοτικοποίηση» του βαθµού οµοιότητας ανάµεσα σε δύο χρήστες a, b µε βάση τις αξιολογήσεις που έχουν δώσει αυτοί στο παρελθόν. Πιο συγκεκριµένα, αν r mn είναι ο «βαθµός» που έχει αποδοθεί στο αντικείµενο n από τον χρήστη m, τότε ο βαθµός συσχέτισης των δύο χρηστών µε βάση τον αλγόριθµο Pearson δίνεται από τον τύπο: cor a, b = n i= 1 _ ( r r a)( r r b) ai n 2 2 ( rai r a) ( rbi r b ) i= 1 bi _ Μία άλλη µέθοδος [Dron et al., 1999] για την εύρεση των κοντινότερων γειτόνων ενός χρήστη είναι η µοντελοποίηση όλων των χρηστών σαν διανύσµατα σε έναν χώρο µε m διαστάσεις (όπου m ο αριθµός των αντικειµένων στην διάθεση του συστήµατος). Οι συνιστώσες του διανύσµατος του κάθε χρήστη σε κάθε διάσταση προκύπτουν από την αξιολόγηση που έχει δώσει ο χρήστης στο

40 Κεφάλαιο 2 ο Συστήµατα Συστάσεων αντικείµενο που αντιστοιχεί στην συγκεκριµένη διάσταση. Ο βαθµός οµοιότητας µεταξύ δύο χρηστών ισούται µε το συνηµίτονο της γωνίας που σχηµατίζουν τα αντίστοιχα διανύσµατά τους. 2ο βήµα: Αφού καθοριστεί το ποιοι είναι οι κοντινότεροι «γείτονες» του χρήστη, το σύστηµα ελέγχει αν υπάρχουν κάποιο αντικείµενα που να µην έχουν αξιολογηθεί από τον συγκεκριµένο χρήστη ενώ ταυτόχρονα να έχουν λάβει υψηλές βαθµολογίες από τους «γείτονές» του. Το σύστηµα στην συνέχεια προτείνει αυτά τα αντικείµενα στον χρήστη υπό µορφή συστάσεων. Υπάρχουν δύο βασικοί τρόποι για να γίνει αυτό [Fielding, 1992]: 1ος τρόπος: Η µέθοδος των πιο συχνά προτιµούµενων αντικειµένων. Η µέθοδος αυτή ελέγχει όλα τα αντικείµενα που έχουν προτιµηθεί από τους χρήστες που ανήκουν στην γειτονιά του τρέχοντος χρήστη. Βρίσκει τα αντικείµενα που έχουν προτιµηθεί συχνότερα από αυτούς και τα επιστρέφει ως σύσταση στον χρήστη. 2ος τρόπος: Η µέθοδος των κανόνων συσχέτισης (Association rules). Η µέθοδος αυτή θεωρεί το σύνολο των αντικειµένων που έχουν προτιµηθεί από κάθε µέλος της γειτονιάς του τρέχοντος χρήστη ως ξεχωριστό σύνολο αντικειµένων. ηµιουργείται έτσι ένα σύνολο αντικειµένων για κάθε έναν από τους γείτονες του τρέχοντος χρήστη. Ύστερα αξιοποιείται ένας αλγόριθµος εύρεσης κανόνων συσχέτισης ώστε να βρεθούν όλοι οι κανόνες συσχέτισης ανάµεσα στα συγκεκριµένα σύνολα αντικειµένων. Οι κανόνες αυτοί αξιολογούνται µε βάση τον υπολογισµό του βαθµού εµπιστοσύνης (confidence) και υποστήριξης (support) του καθενός. Οι κανόνες µε τους υψηλότερους βαθµούς εµπιστοσύνης και υποστήριξης χρησιµοποιούνται για την εύρεση των αντικειµένων που πρέπει να προταθούν στον τρέχοντα χρήστη. Αν οι χρήστες που απαρτίζουν την «γειτονιά» του τρέχοντος χρήστη είναι λίγοι, υπάρχει η πιθανότητα το σύστηµα να µην µπορέσει να βρει αρκετά ισχυρούς κανόνες συσχέτισης ώστε να µπορέσει να προτείνει αρκετά αντικείµενα. Στην περίπτωση αυτή η µέθοδος µπορεί να «ενισχυθεί» µε την µέθοδο των πιο συχνά προτιµούµενων αντικειµένων, ώστε να συµπληρωθεί η λίστα των αντικειµένων που θα συσταθούν

41 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Item-based collaborative filtering Η αρχή λειτουργίας της µεθόδου collaborative filtering, όπως παρουσιάστηκε στην προηγούµενη παράγραφο, επικεντρώνεται στον συσχετισµό των χρηστών µεταξύ τους. Η µέθοδος αυτή ονοµάζεται user-based collaborative filtering. Είναι φανερό από την περιγραφή της λειτουργίας αυτής της µεθόδου, ότι ο πίνακας αξιολογήσεων θα πρέπει να επαναπροσδιορίζεται σε πραγµατικό χρόνο (real time) κάθε φορά που εισάγεται µία αξιολόγηση από έναν χρήστη, καθιστώντας έτσι τη σχέση µεταξύ των χρηστών δυναµική. Αυτό κάνει την εν λόγω µέθοδο να έχει αρκετά µεγάλο υπολογιστικό κόστος. Το πρόβληµα αυτό µπορεί να αντιµετωπιστεί µε την αξιοποίηση µιας εναλλακτικής µεθόδου collaborative filtering που ονοµάζεται item-based [Sarwar et al., 2001]. Η µέθοδος αυτή, αντί να ερευνά τις οµοιότητες µεταξύ των χρηστών, ανακαλύπτει τις οµοιότητες που υπάρχουν ανάµεσα στα διάφορα αντικείµενα του συστήµατος. Η βάση του συστήµατος είναι ένας πίνακας, ο οποίος περιλαµβάνει τα διάφορα αντικείµενα και τις ιδιότητές τους. Όταν ένας χρήστης ζητήσει σύσταση από το σύστηµα, αυτό εξετάζει τα διάφορα αντικείµενα που έχει κατά καιρούς προτιµήσει ο χρήστης, όπως προκύπτει από στοιχεία αγοράς και άλλες πηγές. Στην συνέχεια το σύστηµα, µέσω ενός αλγορίθµου συσχέτισης και αξιοποιώντας τα στοιχεία µε τις ιδιότητες των αντικειµένων που υπάρχουν στον πίνακα, βρίσκει τα αντικείµενα που έχουν την µεγαλύτερη οµοιότητα µε αυτά που έχει προτιµήσει ο χρήστης, και του τα προτείνει. Σε αντίθεση µε την µέθοδο user based, ο πίνακας συσχετισµών µεταξύ των αντικειµένων, που χρησιµοποιεί αυτή η µέθοδος, είναι σχετικά στατικός. εν υπάρχει εποµένως η ανάγκη για online ενηµέρωσή του κάθε φορά που κάποιος χρήστης αλληλεπιδρά µε το σύστηµα, και έτσι οι ανάγκες του σε υπολογιστική ισχύ είναι πολύ περιορισµένες. Η µέθοδος αυτή χρησιµοποιείται σήµερα σε πολλούς εµπορικούς δικτυακούς τόπους όπως π.χ. στο Amazon.com (βλ. Σχήµα 2-2)

42 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Σχήµα 2-2. Ο δικτυακός τόπος Amazon.com Η µέθοδος όµως αυτή παρουσιάζει άλλου είδους προβλήµατα. Το σηµαντικότερο από αυτά είναι ότι αδυνατεί να αξιοποιήσει τα στοιχεία που δίνονται στο σύστηµα την στιγµή που γίνεται το αίτηµα για σύσταση. εν µπορεί, δηλαδή, να εκτιµήσει το ζήτηµα που απασχολεί τον χρήστη την στιγµή που αυτός χρησιµοποιεί το σύστηµα, παρά µόνο τα αντικείµενα που τον ενδιέφεραν στο παρελθόν. Οι [Herloker & Konstan, 2001] προτείνουν µια λύση σε αυτό το πρόβληµα. Σύµφωνα µε την λύση αυτή το σύστηµα διερευνά τις προθέσεις και τα ενδιαφέροντα του χρήστη την στιγµή που αυτός ζητεί σύσταση, πέρα από τα ενδιαφέροντα και τις προτιµήσεις του στο παρελθόν. Οι προθέσεις του εκείνη την στιγµή µπορούν να προκύψουν µε διαφόρους τρόπους: είτε άµεσα µε την παροχή συγκεκριµένων στοιχείων από την µεριά του που προσδιορίζουν τις προθέσεις του, είτε έµµεσα µε παρατήρηση της συµπεριφοράς του Αξιολόγηση της µεθόδου collaborative filtering Στο σηµείο αυτό είναι σκόπιµο να αναφερθούµε στα πλεονεκτήµατα και τα µειονεκτήµατα που παρουσιάζουν τα συστήµατα συστάσεων που βασίζονται στην µέθοδο collaborative filtering και να τα αναλύσουµε εν συντοµία

43 Κεφάλαιο 2 ο Συστήµατα Συστάσεων A. Πλεονεκτήµατα της µεθόδου: εν υπάρχει ανάγκη διατήρησης βάσης γνώσης για τα χαρακτηριστικά των αντικειµένων. Τα συστήµατα collaborative filtering βασίζονται αποκλειστικά στην συσχέτιση χρηστών µεταξύ τους, µέσω των αξιολογήσεων που έχουν δώσει για τα διάφορα αντικείµενα. Έτσι, δεν έχουν ανάγκη υποστήριξης από µια µεγάλη, πολύπλοκη και δύσκολη στην ανάπτυξη βάσης γνώσης. Στην πραγµατικότητα, τα συστήµατα αυτά δεν χρειάζεται να έχουν καµία γνώση για τα αντικείµενα που χειρίζονται. Αυτό είναι αρκετά χρήσιµο, αφού βοηθά στην γρήγορη ανάπτυξη ενός τέτοιου συστήµατος. Η ποιότητα των συστάσεων της δεν είναι στατική αλλά βελτιώνεται µε τον χρόνο. Ο πίνακας αξιολογήσεων των αντικειµένων από τους χρήστες, στον οποίο βασίζονται τα συστήµατα collaborative filtering προκειµένου να βρουν τους «γείτονες» κάθε τρέχοντος χρήστη, εµπλουτίζεται διαρκώς µε καινούριες αξιολογήσεις. Έτσι η ποιότητα των συστάσεων που µπορούν να παράσχουν αυτά τα συστήµατα βελτιώνεται συνεχώς µε την χρήση τους. B. Μειονεκτήµατα της µεθόδου: Η ποιότητα των συστάσεων βασίζεται σε ένα µεγάλο σύνολο δεδοµένων παρουσιάζοντας το πρόβληµα «ramp up» [Jennings & Higutchi, 1993]. Πιο συγκεκριµένα, προκειµένου να µπορέσει το σύστηµα να δώσει αξιόπιστες συστάσεις, πρέπει να υπάρχει ήδη ένας αρκετά µεγάλος αριθµός αξιολογήσεων από χρήστες. Είδαµε όµως, ότι η βάση αξιολογήσεων στα συστήµατα collaborative filtering δηµιουργείται και εµπλουτίζεται προοδευτικά. Στην περίπτωση λοιπόν που δεν υπάρχει ικανός αριθµός αξιολογήσεων από τους χρήστες, τα συστήµατα αυτά αδυνατούν να δώσουν αξιόπιστες συστάσεις, ειδικά κατά τα πρώτα στάδια της λειτουργίας τους. Εµφανίζει το πρόβληµα sparsity [Nichols, 1997], όταν υπάρχουν πάρα πολλά αντικείµενα και λίγοι σχετικά χρήστες. Ένας µεγάλος αριθµός συστηµάτων collaborative filtering δραστηριοποιείται σε αγορές τέτοιες, ώστε χρειάζεται να περιλαµβάνει έναν µεγάλο αριθµό αντικειµένων. Όταν κάθε χρήστης του συστήµατος δεν αξιολογεί µεγάλο αριθµό αντικειµένων, τότε το σύστηµα θα αντιµετωπίσει το πρόβληµα «sparsity». Ο πίνακας αντικειµένων χρηστών, ο οποίος περιέχει τις αξιολογήσεις θα παραµένει «αραιός» καθιστώντας έτσι εξαιρετικά δύσκολη την εύρεση κατάλληλων «γειτόνων» των χρηστών. Χαρακτηριστικά παραδείγµατα συστηµάτων που µπορούν να

44 Κεφάλαιο 2 ο Συστήµατα Συστάσεων αντιµετωπίσουν το πρόβληµα sparsity είναι το σύστηµα Amazon και το CDnow.com (βλ. Σχήµα 2-3). Σχήµα 2-3. Ο δικτυακός τόπος CDnow Και στις δύο αυτές περιπτώσεις υπάρχει ένας πολύ µεγάλος αριθµός αντικειµένων (ηλεκτρονικές συσκευές, βιβλία, άλµπουµ µουσικής, ταινίες), ενώ ο κάθε χρήστης είναι απίθανο να µπορέσει να αξιολογήσει περισσότερο από το 1% των συνολικών διαθεσίµων αντικειµένων. Παρατηρείται το πρόβληµα «first rater» [Breese et al., 1998]. Τα συστήµατα Collaborative Filtering συστήνουν αντικείµενα στους χρήστες ανάλογα µε τις αξιολογήσεις που έχουν δεχθεί τα αντικείµενα αυτά από άλλους. Ένα νεοεισελθέν αντικείµενο δεν µπορεί να συσταθεί, τουλάχιστον µέχρι να δεχθεί ικανό αριθµό αξιολογήσεων από τους χρήστες του συστήµατος. Αφού όµως ένα νεοεισελθέν αντικείµενο δεν συστήνεται στους χρήστες προκειµένου αυτοί να το χρησιµοποιήσουν και να το αξιολογήσουν, το πρόβληµα µοιάζει να ανατροφοδοτείται. Τα νεοεισελθέντα αντικείµενα χρειάζονται έτσι αρκετό χρόνο µέχρι να µπορέσουν να συσταθούν από το σύστηµα

45 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Αυτό το πρόβληµα είναι σηµαντικό, αν σκεφτεί κανείς ότι στις περισσότερες αγορές όπου δραστηριοποιούνται συστήµατα συστάσεων (µουσικά CD, βιβλία, αυτοκίνητα, κ.α.) η είσοδος νέων προϊόντων είναι συνεχής και το ενδιαφέρον του αγοραστικού κοινού γι αυτά τα προϊόντα είναι µεγάλο. υσκολία στις συστάσεις προς κάποιον µε ιδιαίτερες απαιτήσεις (popularity bias) [Breese et al., 1998]. Είναι φανερό από την περιγραφή της λειτουργίας του συστήµατος, ότι όσο πιο συνηθισµένες προτιµήσεις έχει ένας χρήστης, τόσο πιο εύκολη θα είναι η εύρεση «γειτόνων». Εποµένως, η παροχή συστάσεων προς έναν τέτοιο χρήστη θα είναι εύκολη. Για έναν χρήστη όµως, µε ιδιαίτερες και ασυνήθιστες απαιτήσεις και ενδιαφέροντα, θα είναι πολύ δύσκολο να βρεθεί µία γειτονιά µε αρκετά µέλη ώστε να λειτουργήσουν σωστά οι αλγόριθµοι που περιγράφονται στο 2ο βήµα της µεθόδου. Ευαισθησία σε στατιστικές ανωµαλίες. Τυχόν στατιστικές ανωµαλίες στο σύνολο των χρηστών µπορούν να έχουν σηµαντικές επιπτώσεις στη λειτουργία του συστήµατος. Ανάγκη µεγάλης υπολογιστικής ισχύος [Resnick & Varian, 1997]. Οι αλγόριθµοι που εκτελούν τα συστήµατα collaborative filtering κάθε φορά που χρειάζεται να βρουν τους κοντινότερους «γείτονες» ενός χρήστη, έχουν ανάγκη σηµαντικής υπολογιστικής ισχύος. Αυτή η ανάγκη µεγαλώνει όσο περισσότερους χρήστες και αντικείµενα καλείται να χειριστεί το σύστηµα. Τα συστήµατα που δραστηριοποιούνται στο διαδίκτυο συχνά καλούνται να χειριστούν εκατοµµύρια αντικείµενα και χρήστες και έτσι έχουν ανάγκη πολύ µεγάλης υπολογιστικής ισχύος. Μικρή ευαισθησία σε αλλαγές προτιµήσεων των χρηστών [Rosenstein & Lochbaum, 2000]. Ο πίνακας αντικειµένων χρηστών περιέχει αξιολογήσεις των αντικειµένων από τους χρήστες. Οι αξιολογήσεις αυτές µπορεί να είναι, όπως θα δούµε αργότερα, άµεσες ή έµµεσες. Οι αξιολογήσεις αποτελούν ουσιαστικά ένα «ιστορικό» των προτιµήσεων του χρήστη. Το ιστορικό αυτό µπορεί να είναι µακροχρόνιο και έτσι ακόµα και µία ριζική και ξαφνική αλλαγή προτιµήσεων του χρήστη θα χρειαστεί κάποιο χρόνο ώσπου να επηρεάσει σηµαντικά το «ιστορικό» του ώστε το σύστηµα να αλλάξει τις συστάσεις του προς αυτόν. Εποµένως, η ευαισθησία του συστήµατος στις αλλαγές προτιµήσεων των χρηστών του είναι αρκετά µικρή, και µάλιστα τόσο µικρότερη,

46 Κεφάλαιο 2 ο Συστήµατα Συστάσεων όσο πιο εκτεταµένο χρονικά είναι το αρχείο των αξιολογήσεων που διατηρείται. Το πρόβληµα της σύστασης συχνά προτιµώµενων αντικειµένων (πρόβληµα της «µπανάνας»). Ένα πρόβληµα που συνδέεται στενά µε τον τρόπο λειτουργίας των συστηµάτων collaborative filtering είναι το ότι τα συστήµατα αυτού του είδους έχουν την τάση να συστήνουν κατά κόρον κάποια αντικείµενα που προτιµώνται συχνά από πολλούς χρήστες. Το πρόβληµα αναφέρεται από τον Burke [Burke, 1999b] µε τον όρο «πρόβληµα της µπανάνας» (banana problem). Ας φανταστούµε ένα αντικείµενο που προτιµάται συχνά από τους χρήστες ενός συστήµατος (όπως οι µπανάνες από τους πελάτες των οπωροπωλείων). Ένα τέτοιο αντικείµενο θα προκύπτει σχεδόν πάντα κατά την εκτέλεση των αλγορίθµων του 2ου βήµατος της διαδικασίας και, εποµένως, θα προτείνεται σχεδόν πάντα στους χρήστες Άµεση έµµεση αξιολόγηση Όπως έχει ήδη γίνει σαφές, τα συστήµατα συστάσεων βασίζονται σε µεγάλο βαθµό στην αξιολόγηση από τους χρήστες των διαφόρων αντικειµένων που µπορούν να προτείνουν. Αυτή η εξάρτηση είναι φανερή σε πολύ µεγαλύτερο βαθµό στα συστήµατα συστάσεων που βασίζονται στην τεχνική του Collaborative Filtering. Χωρίς την ύπαρξη ενός πολύ µεγάλου όγκου δεδοµένων αξιολόγησης, είναι το σύστηµα αδυνατεί να εφαρµόσει τον αλγόριθµο και να υπολογίσει τους βαθµούς συσχέτισης µεταξύ των χρηστών, ώστε να παρέχει συστάσεις [Breese et al., 1998]. Τα δεδοµένα αυτά πρέπει να είναι σε µορφή τέτοια ώστε να µπορούν να τα επεξεργαστούν οι διαδικασίες του συστήµατος. Προκύπτει έτσι το ζήτηµα του πώς θα αντληθούν αυτές οι αξιολογήσεις από τους χρήστες. Υπάρχουν βασικά δύο τρόποι για να γίνει αυτό, άµεσα ή έµµεσα. Ο άµεσος τρόπος αξιολόγησης των αντικειµένων από τους χρήστες είναι αυτός µε την πιο ευρεία εφαρµογή. Χρησιµοποιείται όχι µόνο στα συστήµατα συστάσεων, αλλά και σε πολλές άλλες περιπτώσεις όπως π.χ. σε βαθµολογία γραπτών από καθηγητές, σε βαθµολογία ταινιών από κριτικούς, κλπ. Η άµεση αξιολόγηση µπορεί να παρέχεται σε ορισµένες περιπτώσεις µε µορφή ελευθέρου κειµένου σχολίων κ.τ.λ., συνήθως όµως βρίσκεται στην µορφή µίας διακριτής κλίµακας βαθµολογίας (π.χ. από το 1 µέχρι το 10). Αυτή η µορφή είναι η επιβαλλόµενη στα πληροφορικά συστήµατα, προκειµένου να µπορούν µετέπειτα οι αξιολογήσεις αυτές να υποστούν στατιστική επεξεργασία, και να αξιοποιηθούν µε κατάλληλο τρόπο

47 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Όπως είναι φανερό, η άµεση αξιολόγηση παρέχεται από τους χρήστες, αφού τους ζητηθεί από το σύστηµα συστάσεων. Ο χρήστης πρέπει να έχει εξετάσει το προς αξιολόγηση αντικείµενο πριν το βαθµολογήσει µε βάση την κλίµακα που του προτείνεται από το σύστηµα. Προκύπτει λοιπόν ότι η άµεση µορφή αξιολόγησης απαιτεί προσπάθεια και συµµετοχή εκ µέρους του χρήστη. Εποµένως, είναι αναµενόµενη η ύπαρξη µιας τάσης για αποφυγή της αξιολόγησης από την πλευρά του χρήστη, όπου αυτό είναι δυνατόν. Αυτό είναι συχνά πηγή προβληµάτων για πολλά συστήµατα συστάσεων που χρησιµοποιούν την µέθοδο Collaborative Filtering, όταν δεν γίνεται κατανοητό στον χρήστη το ότι «αµοίβεται» µε κάποια ανταλλάγµατα για την προσπάθεια που καταβάλλει αξιολογώντας αντικείµενα [Guttman et al., 1998]. Ο έµµεσος τρόπος απόκτησης στοιχείων αξιολόγησης λειτουργεί εντελώς διαφορετικά. Αντί το σύστηµα να ζητά από τους χρήστες να βαθµολογήσουν αντικείµενα, αντλεί χρήσιµα στοιχεία αξιολόγησης από την συµπεριφορά των χρηστών [Schmidt & Bergmann, 1999]. Έτσι αποφεύγονται πολλά από τα προβλήµατα που προκαλούνται όταν ένα σύστηµα βασίζεται αποκλειστικά στη µέθοδο άµεσης αξιολόγησης. Η µέθοδος αυτή χρησιµοποιεί σαν πηγή δεδοµένων κάποια αρχεία καταγραφής ενεργειών, στα οποία αποθηκεύονται στοιχεία που περιγράφουν την συµπεριφορά των χρηστών. Τέτοια στοιχεία συµπεριφοράς µπορεί να είναι τα εξής: Ποιους δικτυακούς τόπους επισκέπτεται συχνότερα ο χρήστης και για πόσο χρόνο παραµένει σ αυτούς. Ποια προϊόντα αγοράζει µέσω διαδικτύου. Ποια αντικείµενα εξετάζει συχνότερα και για πόσο χρόνο. Τα στοιχεία αυτά µπορούν να συλλεχθούν κατά την διάρκεια της χρήσης του συστήµατος χωρίς την εµπλοκή του χρήστη (όπως αυτή που απαιτεί ένα αίτηµα για αξιολόγηση), ειδικά στην περίπτωση που τα αντικείµενα που τον ενδιαφέρουν µπορεί να τα αποκτήσει αγοράσει κανείς µέσω του ιαδικτύου. Τα στοιχεία που αναφέραµε µπορούν να συλλεχθούν σε πολύ µεγάλες ποσότητες στο διαδίκτυο, ιδιαίτερα λόγω της ολοένα και µεγαλύτερης εξάπλωσης του ηλεκτρονικού εµπορίου. Και από τεχνολογικής πλευράς η διαδικασία δεν είναι δύσκολη. Τα στοιχεία που συλλέγονται όµως, βρίσκονται σε µορφή ακατάλληλη για να αξιοποιηθούν άµεσα από ένα σύστηµα συστάσεων. Πρέπει, εποµένως, να υποστούν την κατάλληλη επεξεργασία ώστε να ποσοτικοποιηθούν [Shardanand & Maes, 1995]. Αυτή η διαδικασία, καθώς και η διαδικασία συλλογής και αποθήκευσης των στοιχείων, έχει υπολογιστικό κόστος, που όµως δεν επιβαρύνει τον χρήστη του

48 Κεφάλαιο 2 ο Συστήµατα Συστάσεων συστήµατος. Η όλη διαδικασία µπορεί µάλιστα να εκτελείται εν αγνοία του χρήστη, εκτός αν άλλοι λόγοι επιβάλλουν την ενηµέρωσή του. Αν και η µέθοδος αυτή λύνει πολλά από τα προβλήµατα που προκύπτουν από την µέθοδο άµεσης αξιολόγησης, προκύπτουν άλλα προβλήµατα που οφείλονται κυρίως στην φύση των στοιχείων που χρησιµοποιούνται. Τα στοιχεία αυτά παράγονται σε τεράστιες ποσότητες, κάθε φορά που κάποιος χρησιµοποιεί το διαδίκτυο, σε βαθµό που µπορεί να δηµιουργηθεί ζήτηµα ύπαρξης πολύ µεγάλου όγκου δεδοµένων, µε όλα τα συνεπακόλουθα σε κόστος συλλογής, αποθήκευσης και επεξεργασίας. Η σχετική χρησιµότητα των στοιχείων αυτών είναι πολύ µικρή, αν συγκριθεί µε αυτή των στοιχείων άµεσης αξιολόγησης. Ένα πρόβληµα που παρατηρείται συχνά σε συστήµατα συστάσεων που χρησιµοποιούν έµµεσες αξιολογήσεις είναι η λανθασµένη ποσοτικοποίηση ή εξαγωγή λανθασµένων συµπερασµάτων από τα δεδοµένα που υπάρχουν για τους χρήστες [Was, 1999]. Αυτό µπορεί να είναι ιδιαίτερα σηµαντικό στην περίπτωση που χρησιµοποιείται σαν στοιχείο ο χρόνος παραµονής ενός χρήστη σε µία ηλεκτρονική σελίδα. εν υπάρχει κανένας τρόπος να καταλάβουµε αν ο χρήστης πραγµατικά εξέταζε την σελίδα ή είχε αποµακρυνθεί από τον υπολογιστή του, αφήνοντάς τον µε την σελίδα ανοιχτή. Σηµαντική δυσχέρεια επίσης παρουσιάζει το γεγονός ότι οι πίνακες αντικειµένων χρηστών που περιλαµβάνουν τις αξιολογήσεις είναι πολύ πιο πιθανό να αντιµετωπίζουν το πρόβληµα sparsity, όταν αυτές οι αξιολογήσεις έχουν προέλθει από έµµεσα στοιχεία. Ένα άλλο πολύ σηµαντικό πρόβληµα που προκύπτει είναι αυτό της εµπιστευτικότητας [U.S. IT Industry Council, 1997]. Τα στοιχεία που αφορούν στην συµπεριφορά των χρηστών στο διαδίκτυο µπορούν να θεωρηθούν σε ορισµένες περιπτώσεις ευαίσθητα στον βαθµό που µπορούν να χρησιµοποιηθούν για να δηµιουργηθεί ένα προφίλ της γενικότερης συµπεριφοράς ή και της προσωπικότητας του χρήστη. Είναι, εποµένως, αναµενόµενο οι χρήστες να είναι ιδιαίτερα επιφυλακτικοί και να µην δίνουν εύκολα την συγκατάθεσή τους στην συλλογή και χρήση τέτοιων δεδοµένων. Είναι λοιπόν απαραίτητο να παρέχονται στους χρήστες οι απαραίτητες εγγυήσεις για την χρήση των δεδοµένων αυτών. Στο άµεσο µέλλον, µε την συνεχώς ευρύτερη χρήση των πιστωτικών καρτών καθώς και του Ηλεκτρονικού Εµπορίου, θα γίνει ίσως δυνατή η ανακατασκευή ενός πλήρους καταναλωτικού προφίλ για όλους τους πολίτες. Οι δυνατότητες, αλλά και τα ηθικά ζητήµατα, που προκύπτουν από µια τέτοια εξέλιξη είναι προφανή. 2.3 Συστήµατα βασισµένα στην γνώση Η δεύτερη κατηγορία συστηµάτων που θα εξεταστεί είναι η κατηγορία των συστηµάτων που βασίζονται στην Γνώση. Τα συστήµατα που ανήκουν σε αυτή την

49 Κεφάλαιο 2 ο Συστήµατα Συστάσεων κατηγορία αξιοποιούν την γνώση σχετικά µε τα χαρακτηριστικά των διαθέσιµων προϊόντων ώστε να καταλήξουν σε µια λογική υπόθεση σύσταση για το ποια προϊόντα καλύπτουν τις ανάγκες ενός συγκεκριµένου χρήστη. Το σύνολο της γνώσης που χρησιµοποιεί ένα τέτοιο σύστηµα µπορεί να χωριστεί σε τρείς κατηγορίες (βλ. Σχήµα 2-4), όπου κάθε µία από αυτές απαιτεί ιδιαίτερο χειρισµό για την απόκτησή της [Burke, 2000]: Γνώση για τα αντικείµενα: Το σύστηµα πρέπει να έχει γνώση σχετικά µε τα αντικείµενα που µπορεί να συστήσει, για τα χαρακτηριστικά αυτών, καθώς και για το πώς αυτά σχετίζονται µεταξύ τους. Γνώση για τους χρήστες: Το σύστηµα πρέπει, επίσης, να αποκτήσει γνώση σχετικά µε τους χρήστες του. Πρέπει να γνωρίζει τις ανάγκες, τα ενδιαφέροντα και, ενδεχοµένως τις συνήθειες του χρήστη στον οποίον πρόκειται να κάνουν σύσταση. Από το είδος αυτό της γνώσης συντίθεται ουσιαστικά ένα «προφίλ» για τον κάθε χρήστη. Γνώση για τον τρόπο κάλυψης των αναγκών: Το σύστηµα πρέπει να γνωρίζει το πώς συγκεκριµένες ανάγκες των χρηστών µπορούν να καλυφθούν από συγκεκριµένα χαρακτηριστικά των αντικειµένων. Πρέπει, δηλαδή, να γνωρίζει ποια αντικείµενα ταιριάζουν στο «προφίλ» ενός χρήστη. Ο τρόπος απόκτησης αυτών των ειδών γνώσης καθώς και ο τρόπος χρήσης τους, αποτελούν χαρακτηριστικά των διαφόρων ειδών αυτής της κατηγορίας συστηµάτων. Το πρώτο είδος γνώσης, δηλαδή η γνώση σχετικά µε τα αντικείµενα - προϊόντα που βρίσκονται στην διάθεση του, µπορεί να αντλείται από το σύστηµα µέσω τεχνικών εξόρυξης γνώσης (data mining) που εφαρµόζονται σε µεγάλους όγκους δεδοµένων [Yang & Pedersen, 1997]. Το σύστηµα αποφασίζει ποια αντικείµενα θα συµπεριλάβει στην βάση δεδοµένων και µε ποια χαρακτηριστικά. Αυτός ο τρόπος δηµιουργίας γνώσης θα µπορούσε να χαρακτηριστεί ως έµµεσος. Άλλος τρόπος δηµιουργίας αυτού του είδους γνώσης είναι ο άµεσος, όπου τα αντικείµενα και τα χαρακτηριστικά του καθενός µπορούν να εισάγονται στο σύστηµα απευθείας από τους διαχειριστές του. Και στις δύο αυτές περιπτώσεις, το αποτέλεσµα είναι µια βάση δεδοµένων «γνώσης». Η βάση αυτή περιλαµβάνει στοιχεία για τα αντικείµενα και τα χαρακτηριστικά τους, δοµηµένα µε τρόπο κατάλληλο ώστε να χρησιµοποιηθούν στην διεργασία της παραγωγής της σύστασης

50 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Σχήµα 2-4. Λειτουργία συστήµατος γνώσης Critique-based recommendation Το επόµενο στάδιο στην διαδικασία, είναι η κατασκευή ενός προφίλ για τον χρήστη, η ενσωµάτωση δηλαδή του δευτέρου είδους γνώσης. Ο τρόπος κατασκευής του προφίλ καθώς και το πώς αυτό χρησιµοποιείται, αποτελεί την βάση για τον περαιτέρω διαχωρισµό των συστηµάτων που βασίζονται στην γνώση, σε υποκατηγορίες. Η πρώτη υποκατηγορία είναι αυτή της case based reasoning (ή αλλιώς critique - based recommendation) [Burke, 1999a]. Τα συστήµατα που ανήκουν σε αυτήν την υποκατηγορία προσπαθούν να εντοπίσουν αντικείµενα µε χαρακτηριστικά τέτοια που να ικανοποιούν τις απαιτήσεις του χρήστη, όπως αυτές καθορίζονται από τον ίδιο. Η διαδικασία αυτή περιλαµβάνει τα ακόλουθα βήµατα: Το πρώτο βήµα αφορά στην καταγραφή των προτιµήσεων του χρήστη. Αυτό µπορεί να γίνει ερωτώντας τον χρήστη κατά πόσο ενδιαφέρεται για ορισµένα χαρακτηριστικά των προϊόντων. Το ενδιαφέρον αυτό ποσοτικοποιείται εύκολα, αφού συνήθως είναι σε µορφή σειράς διακριτών επιπέδων, όπως: πολύ, αρκετά, λίγο, καθόλου κ.τ.λ. Οι προτιµήσεις απαιτήσεις του χρήστη, όπως καθορίζονται στο πρώτο βήµα, αποτελούν το προφίλ του χρήστη. Στο δεύτερο βήµα της διαδικασίας, το σύστηµα εξετάζει τα χαρακτηριστικά των αντικειµένων που έχει στην διάθεσή του, και γνωρίζοντας το πώς τα χαρακτηριστικά αυτά καλύπτουν τις απαιτήσεις των χρηστών, εντοπίζει τα προϊόντα που ταιριάζουν περισσότερο στον συγκεκριµένο χρήστη και τα παρουσιάζει σε αυτόν ως συστάσεις. Η διαδικασία τελειώνει εδώ, αν ο χρήστης δηλώσει ικανοποιηµένος µε κάποιες από τις συστάσεις που του παρουσιάστηκαν, ή αν δεν υπάρχει πια ενδιαφέρον από την πλευρά του

51 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Στο τρίτο βήµα της διαδικασίας ο χρήστης, έχοντας ήδη εξετάσει τα αντικείµενα που του συστάθηκαν στο δεύτερο βήµα, µεταβάλλει σε κάποιο βαθµό τις προτιµήσεις του. Το σύστηµα δέχεται αυτές τις καινούριες προτιµήσεις και επαναλαµβάνει το δεύτερο βήµα Goal-based recommendation Η δεύτερη υποκατηγορία των συστηµάτων που βασίζονται στην γνώση είναι αυτή που χρησιµοποιεί τα µέτρα οµοιότητας σαν µέσο εύρεσης αντικειµένων που εξυπηρετούν τον ίδιο σκοπό µε αυτά που έχουν επιλεγεί από τον χρήστη στο παρελθόν. Η υποκατηγορία αυτή ονοµάζεται «Συστήµατα βασιζόµενα στον σκοπό» ή «Goal based systems». Αναφέρεται, επίσης, ο όρος «Συστήµατα Findme» για αυτήν την κατηγορία συστηµάτων [Burke et al., 1997], ειδικότερα όταν αυτά χρησιµοποιούν παραδείγµατα για να υποβοηθήσουν την επικοινωνία τους µε τον χρήστη. Η λειτουργία των συστηµάτων αυτών περιλαµβάνει τρία στάδια ολοκλήρωσης: Το πρώτο στάδιο της διαδικασίας είναι ο καθορισµός των προτιµήσεων του χρήστη, µέσω των αντικειµένων που αυτός έχει επιλέξει στο παρελθόν. Τα αντικείµενα αυτά έχουν ορισµένα χαρακτηριστικά, τα οποία υποδηλώνουν τους λόγους για τους οποίους ο χρήστης τα προτίµησε και εποµένως και τον σκοπό του. Το δεύτερο βήµα είναι η εύρεση αντικειµένων που είναι παρόµοια µε αυτά που είχε προτιµήσει ο χρήστης. Λέγοντας παρόµοια, εννοούµε ότι εξυπηρετούν παρόµοιους σκοπούς. Χαρακτηριστικό παράδειγµα που αναφέρει ο Burke [Burke et al., 1997] είναι το εξής: µία οµπρέλα είναι παρόµοια µε ένα αδιάβροχο όταν ο σκοπός είναι η προστασία από την βροχή. Είναι όµως παρόµοια µε ένα µπαστούνι, όταν ο σκοπός είναι η προστασία από έναν σκύλο. Στο βήµα αυτό χρησιµοποιείται εκτεταµένα η µέθοδος των κριτηρίων οµοιότητας. Το τρίτο βήµα της διαδικασίας είναι και εδώ, όπως και στην προηγούµενη υποκατηγορία συστηµάτων, ανατροφοδότηση από τον χρήστη, ο οποίος µπορεί να µην µείνει ικανοποιηµένος από την πρώτη σύσταση που θα λάβει. Η ανατροφοδότηση αυτή µπορεί να είναι µέσω της µεθόδου tweak που στρέφει το σύστηµα σε µία διαφορετική κατεύθυνση από την αρχική. Αυτό µπορεί να γίνει µε άµεση βαθµολόγηση των προτεινόµενων αντικειµένων από τον χρήστη. Το σύστηµα µπορεί, επίσης, να παρακολουθήσει την συµπεριφορά του χρήστη µετά από την σύσταση και να εξάγει έµµεσα συµπεράσµατα. Έτσι, την πρώτη οµάδα συστάσεων µπορεί να ακολουθήσει και δεύτερη οµάδα που να εξυπηρετεί καλύτερα τις ανάγκες του

52 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Το πρώτο σύστηµα Συστάσεων που χαρακτηρίσθηκε µε τον όρο Findme ήταν το σύστηµα Car Navigator [Burke et al., 1997]. Το σύστηµα αυτό βοηθούσε τους χρήστες του να βρουν πληροφορίες για καινούρια µοντέλα αυτοκινήτων των οποίων είχε αποθηκεύσει τα χαρακτηριστικά. Τα χαρακτηριστικά αυτά αποτελούν και τα κριτήρια µέσω των οποίων το σύστηµα παρουσιάζει µία πρώτη οµάδα µοντέλων σαν αρχική σύσταση προς τον χρήστη. Τα κριτήρια µπορούν να διαφοροποιηθούν απευθείας από τον χρήστη για να προκύψει µια δεύτερη σύσταση, πλησιέστερη στις ανάγκες του. Παρόλα αυτά, το σύστηµα εµπεριέχει την δυνατότητα αλλαγής πολλών κριτηρίων ταυτόχρονα µε το πάτηµα ενός πλήκτρου (τεχνική tweak). Αν για παράδειγµα, ο χρήστης ήθελε ένα αυτοκίνητο πιο οικονοµικό από αυτά που του είχαν ήδη προταθεί, µέσω του αντίστοιχου κουµπιού µπορούσε να αλλάξει τα κριτήρια εύρεσης προς αυτήν την κατεύθυνση. (π.χ. µικρότερος κινητήρας, χαµηλότερη κατανάλωση, µικρότερη τιµή αγοράς, κ.τ.λ.) Χαρακτηριστικό παράδειγµα εφαρµογής της τεχνικής Συστάσεων βασισµένης στην Γνώση είναι το σύστηµα Entree [Burke, 2000], που παρέχει στους χρήστες του συστάσεις για εστιατόρια (βλ. Σχήµα 2-5). Το βασικό του πλεονέκτηµα είναι η εκτεταµένη βάση δεδοµένων του, η οποία είναι δοµηµένη µε αποτελεσµατικό τρόπο. To σύστηµα Entrée µαζί µε το σύστηµα personal logic, ανήκουν στην υποκατηγορία των συστηµάτων εκείνων που βασίζονται στον σκοπό. Σχήµα 2-5. Το Entrée, σύστηµα συστάσεων βασισµένων στη γνώση

53 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Αξιολόγηση των συστηµάτων γνώσης Στο σηµείο αυτό θα αναφερθούµε στα πλεονεκτήµατα και τα µειονεκτήµατα που παρουσιάζουν τα συστήµατα που βασίζονται στην γνώση και θα αναλύσουµε εν συντοµία το κάθε ένα από αυτά. A. Πλεονεκτήµατα των συστηµάτων γνώσης: εν αντιµετωπίζουν το πρόβληµα Ramp up ή cold start (βλ. Παράγραφο 2.2.3), ένα πρόβληµα πολύ κοινό στη µέθοδο Collaborative filtering. Λόγω του ότι το σύστηµα δεν βασίζεται σε µία σειρά αξιολογήσεων των αντικειµένων από την µεριά των χρηστών, η οποία χρειάζεται αρκετό χρόνο, δεν αντιµετωπίζει το πρόβληµα Rumpup, που είναι ένα από τα πιο σηµαντικά προβλήµατα που παρουσιάζουν τα συστήµατα Collaborative filtering. Ένα σύστηµα βασισµένο στην γνώση µπορεί να δώσει αξιόπιστες συστάσεις από την αρχή της λειτουργίας του και αρκετά µεγάλη ευαισθησία στις αλλαγές των προτιµήσεων των χρηστών. Τα συστήµατα που βασίζονται στην γνώση έχουν την δυνατότητα να δέχονται από τους χρήστες πληροφορίες για τις προτιµήσεις τους µε άµεσο τρόπο. Χάρη σ αυτή την δυνατότητα τα µπορούν να αναγνωρίζουν άµεσα, ακόµη και τις πιο ξαφνικές και απότοµες αλλαγές στις προτιµήσεις ενός χρήστη. Οι συστάσεις τους µπορούν, λοιπόν, να προσαρµοστούν αµέσως στα νέα ενδιαφέροντα των χρηστών. εν χρειάζεται µεγάλη υπολογιστική ισχύ για να υπολογίζει σε πραγµατικό χρόνο τις επιδράσεις των αξιολογήσεων, σε αντίθεση µε τα συστήµατα collaborative filtering, τα οποία απαιτούν σηµαντική υπολογιστική ισχύ για να εντοπίσουν τους κοντινότερους «γείτονες» ενός χρήστη, κάθε φορά που οποιοσδήποτε χρήστης υποβάλλει µία αξιολόγηση. εν επηρεάζεται από στατιστικές ανωµαλίες στο δείγµα χρηστών. Μπορεί να κάνει προτάσεις σε χρήστες µε ιδιαίτερες απαιτήσεις. Ένας χρήστης που έχει προτιµήσεις ή απαιτήσεις που διαφέρουν πολύ από αυτές των περισσότερων άλλων χρηστών θα αντιµετωπίσει πρόβληµα αν χρησιµοποιήσει ένα σύστηµα Collaborative filtering. Ένα σύστηµα που βασίζεται στην γνώση, όµως θα µπορέσει να του παράσχει αξιόπιστες συστάσεις. εν έχει καµία σηµασία πόσο ιδιαίτερες είναι οι ανάγκες του, αρκεί αυτές να µπορούν να εισαχθούν στο σύστηµα και η βάση γνώσης του συστήµατος να «γνωρίζει» το πώς µπορούν να καλυφθούν

54 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Μπορεί να προτείνει καινούρια και µη αξιολογηµένα αντικείµενα. Τα συστήµατα αυτού του είδους δεν βασίζονται σε αξιολογήσεις των αντικειµένων. Ένα καινούριο αντικείµενο µπορεί να ενσωµατωθεί αµέσως µαζί µε τα χαρακτηριστικά του στην βάση γνώσης και να προτείνεται κανονικά, όταν χρειάζεται, χωρίς η έλλειψη αξιολογήσεων γι αυτό να αποτελεί πρόβληµα, όπως θα αποτελούσε για ένα σύστηµα collaborative filtering. Αυτό το πλεονέκτηµα είναι ιδιαίτερα σηµαντικό σε αγορές όπου ο ρυθµός ανανέωσης των προϊόντων είναι µεγάλος. Μπορεί να παράσχει αιτιολόγηση των συστάσεών του µέσω των χαρακτηριστικών των αντικειµένων που προτάθηκαν. Εφόσον απαιτείται από την φύση των συστάσεων ή ζητείται από τον χρήστη, το σύστηµα µπορεί να παρουσιάσει συνοπτικά και µε κατάλληλη µορφή και διατύπωση την σειρά των διαδικασιών που οδήγησαν στις συστάσεις που έγιναν προς τον συγκεκριµένο χρήστη, παρέχοντάς του έτσι µια «αιτιολόγηση» των συστάσεων αυτών. Το γεγονός αυτό δίνει την δυνατότητα στο σύστηµα να είναι πιο «διαφανές» ως προς τις διαδικασίες που ακολουθεί αυξάνοντας έτσι σηµαντικά τη «φιλικότητα» του συστήµατος. B. Μειονεκτήµατα των συστηµάτων γνώσης: Η κατασκευή µιας κατάλληλης βάσης γνώσης για το σύστηµα είναι µια δύσκολη και απαιτητική διαδικασία. Η βάση γνώσης που χρησιµοποιούν τα συστήµατα αυτού του είδους είναι αρκετά δύσκολο να κατασκευαστεί και απαιτείται σηµαντική εργασία. Η βάση αυτή πρέπει να περιλαµβάνει γνώσεις σχετικά µε το ποια χαρακτηριστικά των αντικειµένων είναι σηµαντικά, ποιες ανάγκες καλύπτουν και µε ποιο τρόπο. Πρέπει επίσης να υπάρχει πρόσβαση σε µία βάση δεδοµένων που να περιέχει τα χαρακτηριστικά αυτά των αντικειµένων. Βεβαίως, σε ορισµένες περιπτώσεις, το µειονέκτηµα αυτό είναι λιγότερο έντονο. Τα συστήµατα του είδους «Find Me» δεν απαιτούν ιδιαίτερα µεγάλες προσπάθειες για την κατασκευή βάσης γνώσης. Χαρακτηριστικό παράδειγµα αποτελεί το σύστηµα «Vintage Exchange», ένα σύστηµα συστάσεων για κρασιά, όπου για την κατασκευή της βάσης γνώσης του συστήµατος απαιτήθηκε µόλις ένας µήνας εργασίας. Η δυνατότητα σύστασης του συστήµατος είναι στατική. Η βάση γνώσης του συστήµατος έχει κατασκευαστεί πριν ακόµη το σύστηµα τεθεί σε λειτουργία. Η δυνατότητα σύστασης του συστήµατος εξαρτάται αποκλειστικά από την βάση αυτή και για να βελτιωθεί

55 Κεφάλαιο 2 ο Συστήµατα Συστάσεων πρέπει να ανανεωθεί ή να επαυξηθεί. Σε αντίθετη περίπτωση, η ποιότητα των συστάσεων που παρέχονται από το σύστηµα παραµένει στατική. Χρειάζεται ποσοτικοποίηση των χαρακτηριστικών των αντικειµένων. Προκειµένου να λειτουργήσουν αποτελεσµατικά τα συστήµατα του τύπου αυτού, πρέπει να έχουν πολύ καλή γνώση των χαρακτηριστικών των αντικειµένων που συστήνουν. Τα χαρακτηριστικά αυτά πρέπει να ποσοτικοποιηθούν ώστε να µπορεί η βάση γνώσης του συστήµατος να τα χειριστεί. Συχνά είναι απαραίτητη η επεξεργασία κειµένου γραµµένου σε φυσική γλώσσα µε σκοπό την εξαγωγή συµπερασµάτων που να µπορούν να αξιοποιηθούν. Χαρακτηριστικό παράδειγµα είναι το σύστηµα Entrée που αξιοποιεί κείµενα που περιλαµβάνουν κριτικές διαφόρων εστιατορίων για να υποβοηθήσει την διαδικασία της εύρεσης των χαρακτηριστικών των αντικειµένων. 2.4 Άλλα είδη συστηµάτων συστάσεων Γενικά Εκτός από τα βασικά είδη συστηµάτων που έχουν ήδη αναφερθεί και αναλυθεί, αναφέρονται στη βιβλιογραφία και κάποια άλλα είδη συστηµάτων [Burke et al., 1997], τα οποία δεν έχουν τόσο ευρεία χρήση, ούτε µεγάλη σηµασία στην περιοχή των Συστηµάτων Συστάσεων, παρόλα αυτά θα αναφέρουµε συνοπτικά ορισµένα από αυτά Μη προσωπικά συστήµατα συστάσεων Ένα είδος πολύ απλών Συστηµάτων Συστάσεων είναι αυτά τα οποία παρέχουν συστάσεις που δεν εξαρτώνται από τον χρήστη που τις ζητά. Τα συστήµατα αυτά, εποµένως, παρέχουν τις ίδιες συστάσεις προς όλους τους χρήστες τους. Συνήθως, αυτό που παρουσιάζεται από το σύστηµα στον χρήστη είναι ο µέσος όρος των αξιολογήσεων που έχει δεχθεί το κάθε αντικείµενο από τους προηγούµενους χρήστες. Προφανώς, αυτό το είδος συστηµάτων είναι το απλούστερο και το πιο εύκολο στην ανάπτυξη. Υπάρχουν σε διάφορες µορφές σε πολλούς δηµοφιλείς δικτυακούς τόπους όπως: Amazon, Moviefinder και E-Bay. Συνήθως λειτουργούν συµπληρωµατικά µε άλλα πιο εξελιγµένα συστήµατα συστάσεων

56 Κεφάλαιο 2 ο Συστήµατα Συστάσεων ηµογραφικά συστήµατα συστάσεων Τα δηµογραφικά συστήµατα συστάσεων είναι συστήµατα που έχουν χρησιµοποιηθεί στο παρελθόν και εξακολουθούν να χρησιµοποιούνται. Τα συστήµατα αυτά τοποθετούν τους χρήστες σε κατηγορίες σύµφωνα µε στοιχεία που έχουν για αυτούς και συστήνουν αντικείµενα µε βάση δηµογραφικές κατηγορίες. Μία πρώτη προσπάθεια προς αυτήν την κατεύθυνση αποτελεί το σύστηµα «Grundy» [Rich, 1979] το οποίο σύστηνε βιβλία στους χρήστες του αφού πρώτα τους κατέτασσε σε διάφορες κατηγορίες στερεότυπα χρηστών. Οι κατηγορίες αυτές ήταν ενσωµατωµένες στο σύστηµα. Οι κυριότερες εφαρµογές είναι αυτές των [Krulwich, 1997; Pazzani, 1999; Lee, 2007] µε το σύστηµα συστάσεων Moners (βλ. Σχήµα 2-6), το οποίο παρέχει συστάσεις σχετικά µε τις διάφορες κατηγορίες ειδήσεων που µεταδίδονται σε µια χρονική στιγµή. Σχήµα 2-6. Η διεπαφή του συστήµατος συστάσεων Moners. Τα δηµογραφικά συστήµατα σε όλες τους τις παραλλαγές µοιάζουν µε τα συστήµατα collaborative filtering στο ότι βρίσκουν και αυτά συσχετίσεις ενός χρήστη µε άλλους. ιαφέρουν όµως στο ότι δεν χρησιµοποιούν τις συστάσεις των χρηστών για να τους συσχετίσουν, αλλά στοιχεία που προσδιορίζουν τους χρήστες δηµογραφικά. Τα συστήµατα αυτά πλεονεκτούν στο ότι δεν χρειάζονται είσοδο από τον χρήστη στην µορφή αξιολογήσεων αντικειµένων. Εξαρτώνται όµως σε µεγάλο βαθµό από την ποιότητα των δηµογραφικών µελετών που χρησιµοποιούν. 2.5 Σύγκριση Τεχνικών Συστάσεων Γενικά Οι δύο βασικές τεχνικές που χρησιµοποιούνται στα συστήµατα συστάσεων είναι αυτή του συνεργατικού φιλτραρίσµατος (collaborative filtering) και εκείνη της παροχής συστάσεων βασισµένες στη γνώση (knowledge-based recommendation)

57 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Αναφέρονται, βέβαια, και άλλες τεχνικές [Rich, 1979; Richter, 1995; Rosenstein, 2000], οι οποίες όµως δεν χρησιµοποιούνται πλέον σχεδόν καθόλου. Μία πρώτη σύγκριση των δύο βασικών τεχνικών συστάσεων µπορεί να γίνει µέσω της παράθεσης των πλεονεκτηµάτων και των µειονεκτηµάτων της κάθε µιας. Τα εντελώς διαφορετικά χαρακτηριστικά των δύο τεχνικών αυτών, τις καθιστούν κατάλληλες - σε διαφορετικό βαθµό την κάθε µια- για την αντιµετώπιση των δυσκολιών που προκύπτουν λόγω κάποιων ιδιαίτερων απαιτήσεων των χρηστών. Σε αυτό το τµήµα της διατριβής θα εξαχθούν ορισµένα χρήσιµα συµπεράσµατα σχετικά µε την καταλληλότητα των δύο τεχνικών κάτω από ορισµένες συνθήκες. Πιο συγκεκριµένα, στις επόµενες παραγράφους θα αναπτύξουµε ξεχωριστά τις συνθήκες κάτω από τις οποίες η µία τεχνική υπερτερεί έναντι της άλλης, και θα αναφέρουµε συνοπτικά τους λόγους για τους οποίους συµβαίνει αυτό Επιλογή κατάλληλης τεχνικής συστάσεων Είναι δεδοµένο ότι η επιθυµία των σχεδιαστών ενός συστήµατος συστάσεων είναι η παροχή αξιόπιστων συστάσεων στους χρήστες. Σε ορισµένες περιπτώσεις όµως, η ανάγκη αξιοπιστίας από την αρχή κιόλας της λειτουργίας του συστήµατος είναι επιτακτική. Τέτοιες περιπτώσεις είναι συνηθισµένες σε ένα ανταγωνιστικό περιβάλλον, όταν λειτουργούν ήδη παρόµοια συστήµατα µε αυτό που σχεδιάζεται. Στις περιπτώσεις αυτές η τεχνική collaborative filtering υστερεί, λόγω της ύπαρξης του προβλήµατος ramp up [Burke, 2000]. Η τεχνική αυτή χρειάζεται έναν σχετικά µεγάλο αριθµό αξιολογήσεων για να λειτουργήσει σωστά και γι αυτό είναι συνηθισµένο να δίνει ανακριβείς συστάσεις κατά τα πρώτα στάδια της λειτουργίας της. Αντίθετα, η τεχνική γνώσης βασίζεται σε µεγάλο βαθµό στην βάση γνώσης που διαθέτει από την αρχή της λειτουργίας της, για αυτό και µπορεί να δίνει ακριβείς συστάσεις από τα πρώτα στάδια λειτουργίας Συνθήκες έλλειψης επαρκούς αριθµού αξιολογήσεων Η επιτυχής λειτουργία ενός συστήµατος collaborative filtering βασίζεται κατά κύριο λόγο σε έναν πίνακα αξιολογήσεων. Ο πίνακας αυτός περιέχει τις αξιολογήσεις που έχει κάνει ο κάθε χρήστης για κάθε αντικείµενο. Με βάση αυτόν τον πίνακα συσχετίζονται µεταξύ τους οι χρήστες. Στην περίπτωση που ο πίνακας αυτός είναι «αραιός» (sparse), περιέχει δηλαδή µικρό αριθµό αξιολογήσεων, οι συστάσεις που θα παράγει το σύστηµα συστάσεων θα είναι αναξιόπιστες. Οι περιπτώσεις έλλειψης επαρκούς αριθµού αξιολογήσεων είναι αρκετά συχνές. Οι χρήστες µπορεί να δείχνουν απροθυµία να υποβάλλουν αξιολογήσεις στο σύστηµα για διάφορους λόγους. Είναι επίσης πιθανό, το σύστηµα να σχεδιάζεται µε σκοπό να λειτουργήσει για να εξυπηρετεί έναν σχετικά µικρό αριθµό χρηστών, οι οποίοι

58 Κεφάλαιο 2 ο Συστήµατα Συστάσεων όµως να µπορούν να επιλέξουν ανάµεσα σε µεγάλο αριθµό αντικειµένων. Σε αυτήν την περίπτωση µπορεί να παρουσιαστεί αυτό το πρόβληµα. Στις περιπτώσεις αυτές ένα σύστηµα συστάσεων βασισµένο στην τεχνική γνώσης θα έχει σαφές πλεονέκτηµα. Ένα ακόµη περιβάλλον λειτουργίας στο οποίο παρουσιάζεται έλλειψη αξιολογήσεων είναι το περιβάλλον στο οποίο εµφανίζονται καινούρια αντικείµενα µε αρκετά µεγάλη συχνότητα [Rosenstein, 2000]. Τέτοιες συνθήκες λειτουργίας επικρατούν στην µουσική βιοµηχανία ή στην αγορά βιβλίων, όπου εµφανίζονται συνεχώς καινούρια προϊόντα. Τα καινούρια αντικείµενα δεν θα προτείνονται στους χρήστες, έως ότου δεχθούν ικανό αριθµό αξιολογήσεων, καθιστώντας έτσι εγκυρότερες τις συστάσεις (πρόβληµα του νεοεισελθέντος αντικειµένου). Είναι όµως φανερό, και αυτό ισχύει εµφανέστατα στην περίπτωση της µουσικής βιοµηχανίας, ότι τα καινούρια προϊόντα πρέπει να προτείνονται συχνά, ώστε το αγοραστικό κοινό να αντιληφθεί την άφιξή τους. Αυτή η ανάγκη δεν µπορεί να καλυφθεί από ένα σύστηµα συστάσεων βασισµένο αποκλειστικά στην τεχνική collaborative filtering Αιτιολόγηση συστάσεων Η επιτυχία ενός συστήµατος συστάσεων δεν κρίνεται αποκλειστικά από την ικανότητά του να δίνει καλές συστάσεις. Κρίνεται και από την ικανότητά του να πείθει τους χρήστες του να ακολουθήσουν τις συστάσεις που τους παρέχει [Belkin & Kroft, 1992]. Με άλλα λόγια το σύστηµα συστάσεων πρέπει να εµπνέει εµπιστοσύνη στους χρήστες του. Προφανώς, ο βασικός τρόπος για να γίνει αυτό, είναι οι συστάσεις να είναι ακριβείς. Ένας άλλος τρόπος, µε τον οποίο µπορεί ένα σύστηµα συστάσεων να εµπνεύσει εµπιστοσύνη είναι να αιτιολογήσει την σύστασή του, να εξηγήσει δηλαδή στον χρήστη τους λόγους για τους οποίους θα πρέπει να προτιµήσει το αντικείµενο που του προτείνεται [Pazzani, 1999]. Αυτή η δυνατότητα αυξάνει την αποτελεσµατικότητα του συστήµατος σχεδόν σε κάθε περίπτωση, και υπάρχει µόνο στα συστήµατα που βασίζονται σε κάποιο βαθµό στην τεχνική γνώσης. εδοµένης της εµπορικής οικονοµικής διάστασης της λειτουργίας των συστηµάτων συστάσεων, το πλεονέκτηµα αυτό της τεχνικής γνώσης είναι σηµαντικό Χρήστες µε ασυνήθιστες προτιµήσεις Σε αρκετές συνθήκες λειτουργίας αναµένεται να προκύπτουν περιπτώσεις χρηστών, οι οποίες να βρίσκονται σε µεγάλη απόσταση από τους συνηθισµένους χρήστες όσον αφορά στις προτιµήσεις τους. Οι χρήστες αυτοί δεν µπορούν να λάβουν ικανοποιητικές συστάσεις από ένα σύστηµα collaborative filtering. Αντίθετά, ένα σύστηµα γνώσης θα τους εξυπηρετήσει καλύτερα, αφού µπορεί να

59 Κεφάλαιο 2 ο Συστήµατα Συστάσεων εκτιµήσει τον καλύτερο τρόπο κάλυψης οποιασδήποτε ανάγκης, αρκεί βέβαια να περιλαµβάνεται στην βάση γνώσης του συστήµατος Ανάγκη προσαρµογής σε µεταβαλλόµενες προτιµήσεις Μία κατάσταση στην οποία θα κληθεί να ανταποκριθεί το οποιοδήποτε σύστηµα συστάσεων είναι αυτή όπου οι χρήστες του µεταβάλλουν τις προτιµήσεις τους, είτε γρήγορα, είτε σε βάθος χρόνου. Αυτό αναµένεται να συµβαίνει συχνότερα σε συστήµατα που αντιµετωπίζουν έναν µεγάλο όγκο αρκετά διαφοροποιηµένων µεταξύ τους αντικειµένων. Σε τέτοιες περιπτώσεις, η τεχνική collaborative filtering παρουσιάζει σηµαντική υστέρηση στην καταγραφή και ανταπόκριση της µεταβολής των προτιµήσεων ή των ενδιαφερόντων ενός χρήστη. Αντίθετα, τα συστήµατα γνώσης ανταποκρίνονται σε αυτές τις αλλαγές σχεδόν αµέσως. Αυτό ισχύει ιδιαίτερα για τα «critique based» συστήµατα Έλλειψη επαρκών στοιχείων γνώσης Όπως έχουµε ήδη αναπτύξει, η βάση γνώσης είναι το σηµείο κλειδί για να µπορέσει η τεχνική γνώσης να δώσει αξιόπιστες συστάσεις. Είναι δυνατόν να υπάρχουν περιπτώσεις, κατά τις οποίες οι σχεδιαστές ενός συστήµατος συστάσεων να µην γνωρίζουν τα χαρακτηριστικά των αντικειµένων που αυτό θα χειρίζεται. Είναι πιθανόν τα εν λόγω αντικείµενα να µην είναι ακόµη έτοιµα. Μία άλλη κατάσταση που συναντάται συχνά είναι να µην υπάρχουν διαθέσιµα στοιχεία σχετικά µε τον τρόπο ικανοποίησης των αναγκών των χρηστών από τα αντικείµενα (το τρίτο είδος γνώσης) και να είναι έτσι δύσκολή η κατασκευή ενός µοντέλου γνώσης. Σε αυτές τις περιπτώσεις η χρησιµοποίηση ενός συστήµατος βασισµένου στην τεχνική collaborative filtering µπορεί να είναι προτιµότερη Ανάγκη γρήγορης ανάπτυξης Ο κόσµος του ηλεκτρονικού εµπορίου είναι πολύ ανταγωνιστικός και οι εξελίξεις είναι ταχύτατες. Η ταχύτητα είναι συνήθως κρίσιµος παράγοντας για την επιτυχία ενός εγχειρήµατος στον τοµέα των συστηµάτων συστάσεων. Η έλλειψη ταχύτητας ανάπτυξης σαφώς µειώνει την ωφέλιµη διάρκεια «ζωής» ενός συστήµατος [Resnick et al., 1994]. Στον τοµέα αυτό η τεχνική collaborative filtering έχει σαφές πλεονέκτηµα. Ο χρόνος που χρειάζεται για την ανάπτυξη ενός συστήµατος βασισµένου σε αυτήν την τεχνική είναι πραγµατικά πολύ µικρός, µια και το βασικό σηµείο που χρειάζεται προσοχή είναι ο αλγόριθµος που θα χρησιµοποιηθεί για την συσχέτιση των χρηστών µεταξύ τους και την δηµιουργία «γειτονιών» χρηστών. Σε αντίθεση µε αυτά, η ανάπτυξη συστήµατος βασισµένου στην τεχνική γνώσης είναι χρονοβόρα διαδικασία. Ιδιαίτερα η βάση γνώσης είναι ένα στοιχείο του συστήµατος πολύ απαιτητικό σε χρόνο εξειδικευµένης εργασίας

60 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Πρέπει να σηµειώσουµε ότι τα συστήµατα γνώσης τύπου «FindMe» [Burke et al., 1997], αντιµετωπίζουν αυτό το πρόβληµα σε µικρότερο βαθµό και εποµένως µπορούν να θεωρηθούν ικανοποιητικός συµβιβασµός σε περιπτώσεις όπου η ταχύτητα ανάπτυξης είναι σηµαντική Συµπεράσµατα Η σύγκριση ανάµεσα στις δύο βασικές τεχνικές συστάσεων που προηγήθηκε έγινε µε βάση κάποια βασικά «σενάρια» αναγκών που παρουσιάζονται συχνά κατά την ανάπτυξη και λειτουργία των συστηµάτων συστάσεων. Είναι αυτονόητο ότι δεν συµβαίνει σχεδόν ποτέ το να µας απασχολεί µόνο µία βασική ανάγκη κατά την διάρκεια του σχεδιασµού και της ανάπτυξης. Σε όλες τις περιπτώσεις υπάρχει ένα µείγµα αναγκών και προτεραιοτήτων. Η ικανότητα να συνεκτιµά κανείς τα υπέρ και τα κατά σε κάθε περίπτωσή είναι βασική, αλλά πολλές φορές είναι δύσκολο να βρεθεί ο καλύτερος συνδυασµός. Ο Πίνακας 2-1, παρουσιάζει τα σηµαντικότερα προβλήµατα που αντιµετωπίζουν οι δύο τεχνικές συστάσεων. Πίνακας 2-1. Μειονεκτήµατα των βασικών τεχνικών συστάσεων Προβλήµατα Παροχή συστάσεων βασισµένων στη γνώση Collaborative Filtering Πρόβληµα Cold Start Μικρή ευαισθησία στις αλλαγές προτιµήσεων Ανάγκη µεγάλης υπολογιστικής ισχύος υσκολία σύστασης προς χρήστες µε ιδιαίτερες προτιµήσεις Αδυναµία σύστασης νέων αντικειµένων Στατική δυνατότητα σύστασης Ευαισθησία σε στατιστικές ανωµαλίες του δείγµατος Ανάγκη ποσοτικοποίησης στοιχείων των χρηστών Το πρόβληµα της «µπανάνας»

61 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Με µία πρώτη µατιά στα συµπεράσµατα που προηγήθηκαν, µπορεί κανείς να παρατηρήσει ότι η τεχνική γνώσης υπερτερεί σε περισσότερες περιπτώσεις σε σχέση µε την τεχνική collaborative filtering [Burke, 1999b]. Αυτό δεν πρέπει να οδηγήσει στο εύκολο συµπέρασµα ότι η τεχνική γνώσης είναι γενικά προτιµότερη. Τα λίγα πλεονεκτήµατα που έχει η τεχνική collaborative filtering είναι εξαιρετικά σηµαντικά. Η δυνατότητα λειτουργίας χωρίς καθόλου γνώση των χαρακτηριστικών κάνει δυνατή την παράκαµψη της κατασκευής της βάσης γνώσης. Το αποτέλεσµα είναι η ταχύτατη ανάπτυξη του συστήµατος µε κόστος πολύ µικρότερο από αυτό ενός συστήµατος γνώσης και είναι παραδεκτό ότι το κόστος είναι πολύ σηµαντικός παράγοντας όταν πρόκειται να παρθεί µία οποιαδήποτε απόφαση. Ένα ακόµη πλεονέκτηµα που έχει η τεχνική collaborative filtering είναι το ότι µπορεί να διακρίνει συσχετισµούς ανάµεσα σε χρήστες και προτιµήσεις που η τεχνική γνώσης δεν µπορεί [Herlocker et al., 2000]. Η δυνατότητα συσχετισµού που έχει η τεχνική γνώσης είναι τόσο καλή, όσο καλή είναι και η βάση γνώσης του συστήµατος. Μία επαρκής βάση γνώσης δίνει ικανοποιητικές δυνατότητες συσχέτισης µε βάση τα τρία είδη γνώσης που παρουσιάζονται στο Κεφάλαιο 3. Παρόλα αυτά όµως, υπάρχουν συσχετισµοί ανάµεσα σε χρήστες µε παρόµοιες προτιµήσεις που είναι αδύνατον να ανιχνευθούν µε βάση την συµβατική γνώση σχετικά µε τον τρόπο κάλυψης των αναγκών των χρηστών. Αυτό ισχύει ανεξάρτητα από την πληρότητα και αποτελεσµατικότητα της βάσης γνώσης ενός συστήµατος. Αυτές οι συσχετίσεις µπορούν να βρεθούν και να αξιοποιηθούν µόνο από ένα σύστηµα µε βάση την τεχνική collaborative filtering [Maltz et al., 1995]. εν πρέπει να ξεχνάµε βέβαια ότι αυτό γίνεται µε σηµαντικό κόστος σε ανάγκη υπολογιστικής ισχύος. Σαν γενικότερα συµπεράσµατα από την σύγκριση των δύο βασικών τεχνικών µπορούµε να αναφέρουµε τα εξής: οι δύο τεχνικές έχουν η κάθε µία πλεονεκτήµατα τέτοια, ώστε δεν µπορεί να βγει σαφές συµπέρασµα για την υπεροχή µίας εκ των δύο. Ένα σύστηµα σύστασης που βασίζεται µόνο σε µία τεχνική θα αποτελεί πάντα έναν συµβιβασµό. Ο συµβιβασµός αυτός µπορεί να αποδώσει ικανοποιητικά κυρίως σε περιπτώσεις λειτουργίας σε σχετικά σταθερές και γνωστές από πριν συνθήκες. Όσο µεγαλώνει το εύρος των διαφορετικών καταστάσεων που θα πρέπει να αντιµετωπίζει το σύστηµα, τόσο πιο εµφανή θα γίνονται τα µειονεκτήµατα της µοναδικής τεχνικής που αυτό θα χρησιµοποιεί, όποια τεχνική και αν είναι αυτή. Με αυτήν την σηµαντική παρατήρηση κατά νου, µπορούµε να πούµε ότι σηµεία κλειδιά στην επιλογή τεχνικής σύστασης αποτελούν αφ ενός η προοπτική απόκτησης επαρκούς αριθµού αξιολογήσεων και αφ ετέρου ο περιορισµός του κόστους. Το βέβαιο είναι ότι, πέρα από κάποιες

62 Κεφάλαιο 2 ο Συστήµατα Συστάσεων χαρακτηριστικές και σχετικά ακραίες περιπτώσεις, η επιλογή αυτή δεν είναι εύκολη. 2.6 Υβριδικά Συστήµατα Συστάσεων Γενικά Στις Παραγράφους και της διατριβής αναφερθήκαµε στα πλεονεκτήµατα και µειονεκτήµατα των δύο βασικών τεχνικών συστάσεων. Προκύπτει λοιπόν το συµπέρασµα ότι αν ένα σύστηµα συστάσεων συνδυάσει τις δύο τεχνικές αυτές υπάρχει η δυνατότητα αναίρεσης πολλών µειονεκτηµάτων τους. Επίσης, ένα σύστηµα που χρησιµοποιεί µόνο µία από τις προαναφερθείσες µεθόδους είναι πολύ πιθανό να µην ανταποκρίνεται πλήρως στις απαιτήσεις του περιβάλλοντος στο οποίο θα χρησιµοποιηθεί. Για τους λόγους αυτούς, υπάρχει ισχυρός προσανατολισµός στην ανάπτυξη και χρήση Συστηµάτων Συστάσεων που να ενσωµατώνουν στην λειτουργία τους περισσότερες µεθόδους, έτσι ώστε να συνδυάζονται οι δυνατότητές τους και να αλληλοεξουδετερώνονται οι περισσότερες από τις αδυναµίες τους [Towle & Quin, 2000; Burke 2003; Schwab et al., 2001; Karacapilidis & Hatzieleftheriou, 2005; Tran & Cohen, 2000; Claypool et al., 1999; Basu et al., 1998, Lazanas et al., 2007]. Προκύπτουν έτσι τα λεγόµενα υβριδικά συστήµατα συστάσεων, τα οποία έχουν πολλές δυνατότητες καθώς υπάρχουν περιθώρια βελτίωσης, µέσω της αξιοποίησης τεχνικών µε τις οποίες µπορεί να επιτευχθεί ο συνδυασµός υβριδισµός των δύο βασικών τεχνικών [Tran & Cohen, 2000; Burke, 2000]. Στις επόµενες παραγράφους θα αναλύσουµε κάποιους από τους πιο συνηθισµένους τύπους τέτοιων συστηµάτων Κατηγορίες υβριδικών συστηµάτων Εξετάζοντας τους τρόπους συνδυασµού των τεχνικών συστάσεων, µπορούµε να συµπεράνουµε ότι κατανέµονται σε δύο βασικές κατηγορίες: Η πρώτη κατηγορία, είναι αυτή όπου η λειτουργία των δύο υποσυστηµάτων, που υλοποιούν αντίστοιχα τις δύο τεχνικές συστάσεων, είναι ανεξάρτητη. Τα δύο υποσυστήµατα αποτελούν στην ουσία ανεξάρτητα συστήµατα συστάσεων και το κύριο σύστηµα αξιοποιεί το ένα ή το άλλο ξεχωριστά, ανάλογα µε τις συνθήκες λειτουργίας. Οι τύποι υβριδικών συστηµάτων που κατατάσσονται σε αυτήν την κατηγορία είναι: τα συστήµατα συντελεστών βαρύτητας, τα συστήµατα εναλλαγής τεχνικών και τα µεικτά συστήµατα [Melville et al., 2001]. Στα συστήµατα αυτά, δεν έχει σηµασία η σειρά µε την οποία εφαρµόζονται οι δύο τεχνικές. Η δεύτερη κατηγορία είναι αυτή όπου η λειτουργία του ενός υποσυστήµατος εξαρτάται και επηρεάζεται από την λειτουργία του άλλου. Οι τύποι των συστηµάτων που

63 Κεφάλαιο 2 ο Συστήµατα Συστάσεων ανήκουν σε αυτήν την κατηγορία είναι: τα συστήµατα τύπου καταρράκτη, τα συστήµατα συνδυασµού χαρακτηριστικών και τα συστήµατα µεταφοράς µοντέλου [Basu et al., 1998] Περιοχές εφαρµογής υβριδικών συστηµάτων Λόγω του τρόπου λειτουργίας τους, τα υβριδικά συστήµατα έχουν ιδιαίτερα ευρύ πεδίο εφαρµογής, πολύ ευρύτερο από ένα σύστηµα µίας τεχνικής συστάσεων. Οι περιπτώσεις στις οποίες έχουµε µεγάλο όφελος από την εφαρµογή ενός υβριδικού συστήµατος είναι αυτές όπου η διαφορά απόδοσης µεταξύ των δύο τεχνικών είναι µεγάλη σε διαφορετικές συνθήκες λειτουργίας ενός συστήµατος. Θα πρέπει δηλαδή, σε κάποιες συνθήκες λειτουργίας να υπερέχει η µία τεχνική και το αντίθετο. Θα πρέπει επίσης η υπεροχή αυτή να είναι µεγάλη, µιας και σε τέτοιες περιπτώσεις ένα υβριδικό σύστηµα µε ανεξάρτητη λειτουργία των δύο υποσυστηµάτων, όπως για παράδειγµα ένα σύστηµα εναλλαγής τεχνικών µπορεί να δώσει πολύ καλά αποτελέσµατα [Massa & Avesani, 2004]. Τα υβριδικά συστήµατα µπορούν να εφαρµοστούν επίσης και σε περιπτώσεις όπου έχει καθοριστεί ότι υπάρχει σαφής υπεροχή της µίας τεχνικής έναντι της άλλης σε όλο το φάσµα των αναµενόµενων συνθηκών λειτουργίας του συστήµατος. Ακόµη και τότε, οι εγγενείς αδυναµίες και µειονεκτήµατα της υπερέχουσας τεχνικής θα γίνονται αισθητά. Σε τέτοιες περιπτώσεις, ένα υβριδικό σύστηµα της δεύτερης κατηγορίας, µε εξαρτηµένη δηλαδή λειτουργία των δύο υποσυστηµάτων, µπορεί να εφαρµοστεί. Το αποτέλεσµα θα είναι η άµβλυνση των µειονεκτηµάτων της υπερέχουσας τεχνικής Συστήµατα συντελεστών βαρύτητας Ένα υβριδικό σύστηµα συντελεστών βαρύτητας χρησιµοποιεί τις τεχνικές γνώσης και collaborative filtering ξεχωριστά και στην συνέχεια ενοποιεί τα αποτελέσµατα από την κάθε µία από τις δύο τεχνικές, προκειµένου να καταλήξει σε συστάσεις προς τον χρήστη. Η λειτουργία των συστηµάτων που χρησιµοποιούν αυτήν την προσέγγιση µπορεί να περιλαµβάνει δύο στάδια [Resnick & Varian, 1997] (βλ. Σχήµα 2-7): Αρχικά το σύστηµα χρησιµοποιώντας τα στοιχεία που είναι διαθέσιµα τη δεδοµένη στιγµή, αξιοποιεί χωριστά τις δύο «συνιστώσες» του, δηλαδή το υπο-σύστηµα γνώσης και το υπο-σύστηµα collaborative filtering. Κάθε ένα από τα δύο υπο-συστήµατα λειτουργεί ανεξάρτητα και καταλήγει σε δικά του αποτελέσµατα. Τα αποτελέσµατα αυτά δίνονται συνήθως σε µορφή βαθµολογίας για κάθε ένα από τα διαθέσιµα αντικείµενα, η οποία αναπαριστά το ποσοστό εµπιστοσύνης που

64 Κεφάλαιο 2 ο Συστήµατα Συστάσεων αποδίδει το κάθε υπο-σύστηµα σε κάθε ένα από τα αντικείµενα, προκειµένου να συσταθούν στον χρήστη. Στη συνέχεια, το σύστηµα αφού λάβει την βαθµολογία κάθε αντικειµένου από τα υποσυστήµατά του, συµψηφίζει τις δύο βαθµολογίες, πολλαπλασιάζοντας κάθε µία µε έναν κατάλληλο συντελεστή βαρύτητας, προκειµένου να υπολογίσει την τελική βαθµολογία του κάθε αντικειµένου. Με βάση τις τελικές βαθµολογίες γίνεται και η σύσταση των αντικειµένων στους χρήστες. Γίνεται φανερό, ότι κρίσιµο σηµείο για την επιτυχία ενός υβριδικού συστήµατος αυτού του είδους, είναι ο συντελεστής βαρύτητας που θα χρησιµοποιηθεί για το κάθε υποσύστηµα [Burke, 2003]. Επειδή συχνά είναι δύσκολο να βρεθούν οι κατάλληλοι συντελεστές εκ των προτέρων, πολλά τέτοια συστήµατα ενσωµατώνουν στην λειτουργία τους ένα τρίτο βήµα ανατροφοδότησης. Εκτελούν, δηλαδή, το δεύτερο βήµα µε βάση συντελεστές ορισµένους από πριν και στο τρίτο βήµα της λειτουργίας τους µεταβάλλουν τους συντελεστές ανάλογα µε την αντίδραση του χρήστη στις παρεχόµενες συστάσεις. Αναγνωρίζεται δηλαδή, το υποσύστηµα που ήταν πιο επιτυχές και λαµβάνει µεγαλύτερο συντελεστή, προκειµένου να εκτελεστεί ένας δεύτερος κύκλος λειτουργίας. Ισχυρό πλεονέκτηµα τέτοιων συστηµάτων είναι η ανεξάρτητη λειτουργία των δύο συνιστωσών τους και ο ξεκάθαρος τρόπος που συνδυάζονται αυτές. Είναι εύκολο έτσι να γίνονται ρυθµίσεις στην λειτουργία τους (µεταβολές στους συντελεστές βαρύτητας) ανάλογα µε την απόδοσή τους. Το σηµαντικότερο µειονέκτηµα αυτών των συστηµάτων είναι ότι στην ουσία θεωρούν την σχετική αποτελεσµατικότητα των δύο υποσυστηµάτων σταθερή για το σύνολο των αντικειµένων που µπορούν να συσταθούν [Towle & Quinn, 2000]. Αυτό ισχύει και για τα συστήµατα που ενσωµατώνουν και το τρίτο βήµα της ανάδρασης. Αυτή η θεώρηση, όµως, δεν είναι ακριβής. Σε ένα σύνολο αντικειµένων θα υπάρχουν ορισµένα που για κάποιους λόγους (έλλειψη επαρκούς αριθµού αξιολογήσεων) δεν µπορούν να αξιολογηθούν αποτελεσµατικά από το υποσύστηµα collaborative filtering και εποµένως η αξιολόγηση του υποσυστήµατος γνώσης θα πρέπει να έχει υψηλότερο συντελεστή. Αντίστοιχο πρόβληµα µπορεί να υπάρχει και µε κάποια αντικείµενα για τα οποία η απαραίτητη γνώση δεν είναι επαρκώς διαθέσιµη και εποµένως το υποσύστηµα collaborative filtering θα πρέπει να έχει υψηλότερο συντελεστή. Για το λόγο αυτό, η βελτιστοποίηση των συντελεστών βαρύτητας είναι δύσκολη διαδικασία. Χαρακτηριστικό παράδειγµα τέτοιου συστήµατος είναι το σύστηµα «P Tango» [Claypool et al., 1999]

65 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Σχήµα 2-7. Λειτουργία Συστήµατος Συντελεστών Βαρύτητας Συστήµατα εναλλαγής τεχνικών Ένας άλλος τρόπος υβριδισµού είναι η δηµιουργία ενός συστήµατος που κάνει εναλλασσόµενη χρήση των δύο υποσυστηµάτων ανάλογα µε το ποιο µπορεί να αποδώσει καλύτερα σε κάθε περίπτωση [Burke, 2002]. Ένα τέτοιο σύστηµα χρησιµοποιεί κάποια κριτήρια για να καθορίσει ποια από τις δύο τεχνικές µπορεί να δώσει καλύτερο αποτέλεσµα, ανάλογα µε τα δεδοµένα της κάθε περίπτωσης. Η κάθε τεχνική χρησιµοποιείται ξεχωριστά και εντελώς ανεξάρτητα από την άλλη, όπως και στην περίπτωση των weighed συστηµάτων που είδαµε πιο πάνω. Οι τρόποι µε τους οποίους αποφασίζεται το ποια τεχνική θα χρησιµοποιηθεί κάθε φόρα, είναι δύο: Α) Το σύστηµα χρησιµοποιεί και τις δύο τεχνικές και συγκρίνει τα αποτελέσµατα που δίνει η κάθε µία µε τις αξιολογήσεις που έχει δώσει στο παρελθόν ο χρήστης. Με βάση τη σύγκριση αυτή καθορίζεται το ποια τεχνική τελικά θα χρησιµοποιηθεί. Β) Το σύστηµα χρησιµοποιεί αρχικά την µία από τις δύο τεχνικές. Συνήθως η τεχνική που χρησιµοποιείται πρώτη είναι η τεχνική γνώσης. Σε περίπτωση που η τεχνική γνώσης αδυνατεί να παρέχει αξιόπιστες συστάσεις λόγω ανεπαρκών δεδοµένων ή σε περίπτωση που οι συστάσεις της τεχνικής γνώσης απορριφθούν/αξιολογηθούν δυσµενώς από τον χρήστη, τότε το σύστηµα χρησιµοποιεί την τεχνική collaborative filtering. Ο τρόπος αυτός συνδυασµού των δύο βασικών τεχνικών συστάσεων έχει το µειονέκτηµα της πολυπλοκότητας των κριτηρίων επιλογής της κάθε µίας τεχνικής. Το πλεονέκτηµά τους είναι ότι ισχυροποιούν στην ουσία το σύστηµα δίνοντάς του την δυνατότητα να καταφεύγει στην τεχνική collaborative filtering και έτσι να προτείνει αντικείµενα µε ελάχιστα κοινά χαρακτηριστικά µεταξύ τους, που όµως να ενδιαφέρουν τον χρήστη. Χαρακτηριστικό παραδείγµατα συστήµατος εναλλαγής τεχνικών αποτελούν τα συστήµατα DailyLearner και το Gixo [Pazzani &

66 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Billsus, 2007], που χρησιµοποιεί σαν βάση για τις συστάσεις την οµοιότητα κειµένου (text similarity). Όπως βλέπουµε στο Σχήµα 2-8, οι τίτλοι των ειδήσεων που προτείνονται, δεικτοδοτούνται από ένα εικονίδιο που δείχνει πόσο δηµοφιλής είναι µια είδηση (µπλε µπάρα) και κατά πόσο οµοιάζει µε τις ειδήσεις που ο χρήστης έχει διαβάσει έως τώρα (κόκκινη µπάρα), εξατοµικεύοντας έτσι τις παρεχόµενες συστάσεις του συστήµατος. Σχήµα 2-8. To σύστηµα GIXO Μικτά συστήµατα Ένας ακόµη τρόπος συνδυασµού των δύο κύριων τεχνικών συστάσεων είναι τα µικτά συστήµατα συστάσεων [Adomavicius & Tuzhilin, 2005]. Τα συστήµατα αυτού του είδους, όπως και τα δύο προηγούµενα είδη που συναντήσαµε, ενσωµατώνουν δύο συνιστώσες υποσυστήµατα: ένα υποσύστηµα γνώσης και ένα υποσύστηµα collaborative filtering, τα οποία λειτουργούν ανεξάρτητα µεταξύ τους. Πιο συγκεκριµένα, τα δύο υποσυστήµατα λειτουργώντας το καθένα µε τον τρόπο που αναλύσαµε και ανεξάρτητα από το άλλο, καταλήγουν σε έναν αριθµό συστάσεων. Οι συστάσεις που παράγονται από τα δύο υποσυστήµατα παρουσιάζονται ταυτόχρονα στον χρήστη, ο οποίος έτσι επωφελείται από τις δυνατότητες και των δύο τεχνικών συστάσεων. Τα συστήµατα αυτού του είδους µπορούν να χρησιµοποιηθούν µε µεγαλύτερη ευκολία σε

67 Κεφάλαιο 2 ο Συστήµατα Συστάσεων περιπτώσεις οι οποίες επιτρέπουν την παρουσίαση µεγάλου αριθµού συστάσεων στον χρήστη. Πλεονέκτηµα αυτών των συστηµάτων είναι η αντιµετώπιση του προβλήµατος του νέου αντικειµένου (λόγω του υποσυστήµατος γνώσης) καθώς και η δυνατότητα διάκρισης σχέσεων µεταξύ των αντικειµένων που είναι δύσκολο να γίνουν αντιληπτές από το σύστηµα γνώσης αλλά µπορεί να τις προσδιορίσει το υποσύστηµα collaborative filtering [Adomavicius & Tuzhilin, 2005]. Τα µειονεκτήµατα των µικτών συστηµάτων γίνονται εµφανή σε περιπτώσεις όπου το ζητούµενο είναι η παρουσίαση σχετικά µικρού αριθµού συστάσεων. Στις περιπτώσεις αυτές, είναι απαραίτητη η ύπαρξη µίας διαδικασίας αξιολόγησης των συστάσεων έτσι ώστε να παρουσιάζονται οι πιο αξιόπιστες. Μία άλλη κατάσταση που µπορεί να δηµιουργήσει πρόβληµα σε αυτού του είδους τα συστήµατα, είναι αυτή όπου δύο συστάσεις από διαφορετικά υποσυστήµατα µπορεί να είναι αντίθετες ερχόµενες έτσι σε σύγκρουσή. Όταν συµβαίνει αυτό πρέπει να υπάρχει ένας τρόπος επίλυσης των συγκρούσεων, µέσω της επιλογής της σύστασης που θα πρέπει να παρουσιαστεί και εκείνης που θα απορριφθεί. Παράδειγµα εφαρµογής αυτού του τρόπου υβριδισµού αποτελεί το σύστηµα PTV [Smyth & Cotter, 2000]. Το σύστηµα αυτό (βλ. Σχήµα 2-9) καταρτίζει ένα προτεινόµενο πρόγραµµα τηλεθέασης για τον χρήστη του. Αντιµετωπίζει τις περιπτώσεις ασυµβιβάστου µεταξύ δύο τηλεοπτικών προγραµµάτων συστάσεων δίνοντας προτεραιότητα στην σύσταση που προήλθε από το υποσύστηµα γνώσης. Άλλο παράδειγµα τέτοιου συστήµατος είναι το σύστηµα PickAFlick [Burke et al., 1997; Burke, 2000]

68 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Σχήµα 2-9. To υβριδικό σύστηµα PTV Υβριδικά συστήµατα τύπου «καταρράκτη» Ακόµη ένας τρόπος συνδυασµού των δυο βασικών τεχνικών συστάσεων αποτελεί τα συστήµατα τύπου «καταρράκτη». Τα συστήµατα αυτά χρησιµοποιούν την µία τεχνική για να ταξινοµήσουν καλύτερα τις συστάσεις στις οποίες έχει καταλήξει η άλλη [Alspector et al., 1997]. Σε αντίθεση µε τις τεχνικές που είδαµε προηγουµένως, στην τεχνική καταρράκτη τα δύο υποσυστήµατα δεν λειτουργούν ανεξάρτητα, αλλά επεµβαίνουν το ένα στην λειτουργία του άλλου. Τα συστήµατα τύπου καταρράκτη αποτελούνται, όπως και τα προηγούµενα συστήµατα που εξετάσαµε, από δύο υποσυστήµατα συνιστώσες: ένα υποσύστηµα γνώσης και ένα υποσύστηµα collaborative filtering. Η λειτουργία τους εκτελείται σε δύο στάδια (Σχήµα 2-10): Α) Το ένα από τα δύο υποσυστήµατα, χρησιµοποιώντας τα διαθέσιµα στοιχεία, καταλήγει σε µία αρχική οµάδα συστάσεων. Η οµάδα αυτή µπορεί και πρέπει να

69 Κεφάλαιο 2 ο Συστήµατα Συστάσεων περιλαµβάνει µεγάλο αριθµό συστάσεων. Συνήθως το υποσύστηµα που αναλαµβάνει τον σχηµατισµό της πρώτης οµάδας συστάσεων είναι το υποσύστηµα γνώσης. Β) Η οµάδα των συστάσεων που αποτελεί την έξοδο του πρώτου σταδίου, γίνεται είσοδος για το δεύτερο υποσύστηµα. Οι συστάσεις της οµάδας αυτής κατατάσσονται µε βάση τα κριτήρια του δεύτερου υποσυστήµατος και διακριτοποιούνται περισσότερο. Γίνεται έτσι δυνατή η περαιτέρω βελτίωση των συστάσεων που παρείχε το πρώτο βήµα. Σηµαντικό πλεονέκτηµα της µεθόδου αυτής είναι η υψηλή της αποδοτικότητα. Η µέθοδος αποδίδει καλύτερα διότι η διαδικασία του δευτέρου βήµατος εφαρµόζεται µόνο σε αντικείµενα που έχουν ήδη αξιολογηθεί θετικά από το πρώτο βήµα και όχι σε όλα τα διαθέσιµα αντικείµενα. Σχήµα Λειτουργία συστήµατος τύπου «Καταρράκτη» Βασικό σηµείο στην κατανόηση της λειτουργίας τέτοιων συστηµάτων είναι το ότι το δεύτερο βήµα µπορεί µόνο να βελτιώσει τις συστάσεις που παρέχει το πρώτο βήµα, δεν µπορεί όµως να τις ανατρέψει. Τα δύο υποσυστήµατα λειτουργούν σαν «φίλτρα» τοποθετηµένα εν σειρά. Αυτό το στοιχείο µπορεί να αποβεί θετικό ή αρνητικό ανάλογα µε τις συνθήκες λειτουργίας του συστήµατος Υβριδικά συστήµατα συνδυασµού χαρακτηριστικών Μία ακόµη µέθοδος συνδυασµού των δύο τεχνικών είναι να θεωρηθούν τα collaborative στοιχεία που υπάρχουν για κάθε αντικείµενο σαν χαρακτηριστικά του. Ύστερα τα αντικείµενα αξιολογούνται µε χρήση της τεχνικής γνώσης. Η λειτουργία αυτής της µεθόδου υβριδισµού µπορεί επίσης να αναλυθεί στα εξής δύο βήµατα: Α) Αρχικά γίνεται η ενσωµάτωση των στοιχείων. Για κάθε αντικείµενο, το σύστηµα έχει στην διάθεσή του ορισµένα στοιχεία collaborative χαρακτήρα. Τα στοιχεία αυτά είναι κατά βάση αξιολογήσεις που έχουν λάβει αυτά τα αντικείµενα από τους χρήστες. Έτσι, στο σύνολο της γνώσης που κατέχει το σύστηµα για τα χαρακτηριστικά του κάθε αντικειµένου προστίθενται και τα στοιχεία αυτά. ηµιουργείται έτσι ένα επαυξηµένο σύνολο γνώσης για κάθε αντικείµενο. Β) Το επαυξηµένο αυτό σύνολο γνώσης γίνεται η βάση για το δεύτερο βήµα της διαδικασίας. Με βάση το σύνολο αυτό, λειτουργεί το υποσύστηµα γνώσης και καταλήγει σε συστάσεις προς τον χρήστη. Οι συστάσεις αυτές έχουν καταρτιστεί µε

70 Κεφάλαιο 2 ο Συστήµατα Συστάσεων βάση την τεχνική γνώσης, αυτή η τεχνική όµως έχει λάβει υπόψη της και τα collaborative στοιχεία, αφού αυτά περιλαµβάνονταν στο σύνολο γνώσης για τα αντικείµενα. Το σηµαντικό πλεονέκτηµα αυτής της µεθόδου, είναι ότι λαµβάνει υπόψη της και τα collaborative στοιχεία που υπάρχουν για τα αντικείµενα, χωρίς όµως να βασίζεται αποκλειστικά σε αυτά. Με αυτό τον τρόπο µπορούν να γίνουν αξιόπιστες συστάσεις ακόµη και αν υπάρχει έλλειψη επαρκούς αριθµού συστάσεων για κάποια αντικείµενα. Τα αποτελέσµατα πειραµατισµού προς αυτήν την κατεύθυνση µε βάση το σύστηµα γνώσης Ripper ήταν ενθαρρυντικά [Basu et al., 1998] Συστήµατα µεταφοράς µοντέλου Τα συστήµατα αυτού του είδους χρησιµοποιούν το ένα από τα δύο υποσυστήµατά τους για να παράγουν ένα µοντέλο. Το µοντέλο αυτό αποτελεί την είσοδο και την βάση λειτουργίας του δεύτερου υποσυστήµατος. Αυτή η µέθοδος υβριδισµού διαφέρει από την µέθοδο συνδυασµού χαρακτηριστικών, στο ότι δεν πραγµατοποιείται απλά µεταφορά χαρακτηριστικών των αντικειµένων από το ένα υποσύστηµα στο άλλο, αλλά δηµιουργία και µεταφορά ενός πλήρους µοντέλου των χρηστών [Balabanovic, 1998]. Τα στάδια λειτουργίας ενός τέτοιου συστήµατος (βλ. Σχήµα 2-11) είναι τα ακόλουθα: Α) Κατ αρχήν δηµιουργείται ένα µοντέλο. Το υποσύστηµα που εκτελεί αυτό το βήµα είναι συνήθως το υποσύστηµα γνώσης, όπου λαµβάνοντας υπόψη τις προτιµήσεις των χρηστών κατά το παρελθόν, δηµιουργεί ένα µοντέλο συµπεριφοράς προτιµήσεων για κάθε έναν από αυτούς. Η λειτουργία του υποσυστήµατος γνώσης σε αυτή τη φάση είναι παρόµοια µε την λειτουργία των συστηµάτων γνώσης που βασίζονται στον σκοπό (βλ. Παράγραφο 3.4.2). Το µοντέλο του κάθε χρήστη δείχνει τα ενδιαφέροντά του, όπως αυτά προκύπτουν από τα χαρακτηριστικά των αντικειµένων που έχει προτιµήσει στο παρελθόν. Β) Στη συνέχεια γίνεται η µεταφορά των µοντέλων και η αξιοποίησή τους από το δεύτερο υποσύστηµα µε σκοπό την εξαγωγή συστάσεων. Τα µοντέλα των χρηστών, τα οποία δηµιουργήθηκαν στο πρώτο στάδιο, παρέχονται ως είσοδος στο δεύτερο υποσύστηµα (collaborative filtering). Το υποσύστηµα αυτό αξιοποιεί κατάλληλα τα µοντέλα ώστε να διερευνήσει τις οµοιότητες που υπάρχουν ανάµεσα στους χρήστες και να καταλήξει σε συγκεκριµένους βαθµούς συσχέτισης του ενός χρήστη µε τον άλλον. Με βάση αυτήν την διαδικασία, το σύστηµα καταλήγει σε συστάσεις. Παρατηρούµε ότι στο δεύτερο βήµα το σύστηµα λειτουργεί όπως ένα κλασσικό σύστηµα collaborative filtering. Η µόνη διαφοροποίηση είναι ότι τα στοιχεία που αξιοποιούνται για την ανεύρεση των συσχετίσεων είναι τα µοντέλα προτιµήσεων των χρηστών και όχι οι αξιολογήσεις που έχουν κάνει στο παρελθόν

71 Κεφάλαιο 2 ο Συστήµατα Συστάσεων Το σηµαντικό πλεονέκτηµα που παρουσιάζει η συγκεκριµένη µέθοδος υβριδισµού, είναι η αποτελεσµατικότερη λειτουργία του δεύτερου υποσυστήµατος. Το υποσύστηµα collaborative filtering λειτουργεί µε βάση τα µοντέλα των ενδιαφερόντων των χρηστών. Η «περιεκτικότητα» του υλικού αυτού σε χρήσιµες πληροφορίες που µπορούν να οδηγήσουν στην δηµιουργία της κατάλληλης «γειτονιάς» για τον κάθε χρήστη, είναι πολύ µεγάλη αν συγκριθεί µε αυτή που έχουν τα στοιχεία αξιολογήσεων των χρηστών. Η λειτουργία, του υποσυστήµατος collaborative filtering γίνεται έτσι πιο εύκολη και παρουσιάζει πολύ βελτιωµένα αποτελέσµαται. Σχήµα Λειτουργία Συστήµατος Μεταφοράς Μοντέλου Το πρώτο σύστηµα που µπορεί να τοποθετηθεί σε αυτή την κατηγορία είναι το σύστηµα Fab [Balabanovic, 1997], το οποίο ήταν ένα φίλτρο για χρήση στο διαδίκτυο. Παρόµοιο σύστηµα έχει επίσης περιγραφεί και στο [Pazzani, 1999] Συµπεράσµατα Η αύξηση του ποσοστού των χρηστών που δραστηριοποιούνται στο ιαδίκτυο είναι βέβαιο πως θα συνεχιστεί και στο µέλλον. Αποτελεσµατικά συστήµατα συστάσεων θα είναι ολοένα και πιο χρήσιµα, τόσο για τους περιστασιακούς, όσο και για τους συστηµατικούς χρήστες του διαδικτύου. Η ανάγκη αυτή αφορά τόσο σε συστήµατα «γενικής χρήσης» όσο και σε εξειδικευµένα συστήµατα που θα στοχεύουν σε ειδικές κατηγορίες χρηστών. Τα Υβριδικά Συστήµατα Συστάσεων µπορούν να εξασφαλίσουν αποτελεσµατικότερη παροχή συστάσεων µιας και το πεδίο εφαρµογής των Συστηµάτων Συστάσεων µίας τεχνικής στο µέλλον θα στενεύει ολοένα και περισσότερο, καθώς η έρευνα πάνω στα υβριδικά συστήµατα θα προχωρά. Το πεδίο έρευνας πάνω στα υβριδικά συστήµατα είναι πολύ ευρύ και αναµένεται να επεκταθεί ακόµη περισσότερο µέλλον καθώς υπάρχει πολύ µεγάλο περιθώριο για καινούργιους τρόπους υβριδισµού, ή για τροποποίηση των ήδη υπαρχόντων. Περιθώρια έρευνας και περαιτέρω βελτίωσης υπάρχουν, ιδιαίτερα για τα υβριδικά συστήµατα που ανήκουν στην δεύτερη κατηγορία, δηλαδή σ αυτά που παρατηρείται αλληλεξάρτηση στη λειτουργία των δύο τεχνικών. Χαρακτηριστικό

72 Κεφάλαιο 2 ο Συστήµατα Συστάσεων παράδειγµα είναι η µέθοδος µεταφοράς µοντέλου [Billsus & Pazzani, 2000]. Άλλο σηµείο που χρειάζεται προσοχή είναι ο τρόπος καθορισµού των κριτηρίων µέσω των οποίων αποφασίζεται κάθε φορά το κατά πόσον είναι συµφέρουσα η χρήση ενός υβριδικού συστήµατος. Περιθώρια βελτίωσης υπάρχουν βεβαίως και για τις δύο βασικές τεχνικές σύστασης [Tran & Cohen, 2000]. Είναι φανερό ότι κάθε βελτίωση µίας τεχνικής θα βελτιώνει ταυτόχρονα και κάθε υβριδικό σύστηµα που ενσωµατώνει την τεχνική αυτή. Σηµείο προσοχής για το µέλλον, είναι οι τρόποι ποσοτικοποίησης και αξιοποίησης των έµµεσων στοιχείων αξιολόγησης (βλ. Κεφάλαιο 5). Τα στοιχεία αυτά θα είναι διαθέσιµα σε ολοένα και µεγαλύτερο όγκο. Άλλο σηµείο το οποίο µπορεί να παρουσιάσει ενδιαφέρον µελλοντικά, είναι η δυνατότητα κατασκευής βάσεων γνώσης από ευφυή συστήµατα µε µικρή σχετικά ανθρώπινη καθοδήγηση, χρησιµοποιώντας ένα σύνολο από βασικούς κανόνες

73 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών 3 ΤΕΧΝΙΚΕΣ & ΤΕΧΝΟΛΟΓΙΕΣ ΥΠΟΣΤΗΡΙΞΗΣ ΤΗΣ ΙΑΧΕΙΡΙΣΗΣ ΣΥΝ ΥΑΣΜΕΝΩΝ ΜΕΤΑΦΟΡΩΝ 3.1 Συστήµατα διαχείρισης συνδυασµένων µεταφορών Συνδυασµένη µεταφορά αγαθών ορίζεται η διαδικασία µεταφοράς προϊόντων µε τη διαδοχική χρήση διαφορετικών µεταφορικών µέσων, χωρίς την παρεµβολή οποιασδήποτε ενδιάµεσης επεξεργασίας κατά τη διαδικασία µεταφόρτωσης από το ένα µέσο στο άλλο [European Conference of Ministers of Transport, 1993]. Κατά την εξέταση της πιο πάνω διαδικασίας µπορούµε να παρατηρήσουµε τα ακόλουθα: Στην µεταφορική πρακτική, η συνδυασµένη µεταφορά (intermodal transport) θεωρείται ανταγωνιστικός και αναπτυσσόµενος κλάδος των µεταφορών και ανταγωνίζεται πλέον την παραδοσιακή µορφή µεταφοράς µε τη χρήση ενός µέσου (unimodal transport) [Bontekoning & Macharis, 2003]. Ο κλάδος των συνδυασµένων µεταφορών υποβοήθησε την ανάπτυξη και άλλων παρεµφερών κλάδων υπηρεσιών και παραγωγής εξαρτηµάτων. Στις δεκαετίες 1980 και 1990, οι συνδυασµένες µεταφορές µεταβλήθηκαν σε παράγοντα καθορισµού στρατηγικής των εµπλεκόµενων επιχειρήσεων. Η ανάγκη καθορισµού πολιτικών συνδυασµένων µεταφορών υποστηρίχθηκε σθεναρά λόγω περιβαλλοντικών θεµάτων, αύξησης της προσφερόµενης ροής µεταφερόµενων προϊόντων και ωφέλειας από την εκµετάλλευση των διαφορετικών µεταφορικών µέσων. Το πρόβληµα των συνδυασµένων µεταφορών τέθηκε από µια πλειάδα επιστηµόνων [Mahoney, 1985; Muller, 1995; DeBoer, 1992], διαχωρίστηκε από το πρόβληµα της απλής µεταφοράς αγαθών και διαπιστώθηκε η έλλειψη επιστηµονικής έρευνας σχετικά µε συστήµατα συνδυασµένων µεταφορών που θα ήταν ικανά να χειριστούν τέτοια πολύπλοκα ζητήµατα [Coyle et al., 2000; Button, 1994; Nozick & Morlok, 1997; Powell & Carvalho, 1998; Loureiro, 1994; Newman & Yano, 2000a,b]. Οι συνδυασµένες µεταφορές έχουν εφαρµογή σε µεγάλο γεωγραφικό πεδίο, µιας και στις περισσότερες χώρες υπάρχει ανεπτυγµένο οδικό, σιδηροδροµικό, ναυτιλιακό και αεροπορικό δίκτυο. Ο χώρος των συστηµάτων διαχείρισης συνδυασµένων µεταφορών θα πρέπει να χαρακτηρίζεται από:

74 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Τη διάκριση λειτουργιών (task division) µεταξύ των µεταφορικών µέσων, µε διαφοροποίηση για παράδειγµα, µεταξύ των µακροχρόνιων (long-haul) θαλάσσιων µεταφορών και των βραχυχρόνιων (short-haul) οδικών µεταφορών, µε αντίστοιχο συγχρονισµό των δροµολογίων. Τη χρήση προκαθορισµένων µονάδων µέτρησης φορτίου, µε σκοπό την απλοποίηση της διαδικασίας προγραµµατισµού των µεταφορτώσεων και την αποφυγή χρησιµοποίησης ειδικού τεχνικού εξοπλισµού. Τη βελτιστοποίηση εύρεσης των δροµολογίων και της διαδικασίας των µεταφορτώσεων, µιας και η διαδικασία αυτή επηρεάζει τον συγχρονισµό και την τήρηση των προκαθορισµένων δροµολογίων. Έναν κεντρικό συντονισµό των εµπλεκοµένων µερών, µιας και σε αυτό το είδος των µεταφορών αλληλεπιδρούν διάφορες οντότητες, όπως: µεταφορικές εταιρίες, αυτόνοµοι µεταφορείς, µεσίτες διαµεσολαβητές, και πελάτες ή εταιρείες που επιθυµούν να µεταφέρουν εµπορεύµατα. Το ρόλο του κεντρικού συντονιστή ή διαµεσολαβητή θα πρέπει να διαδραµατίζουν τα ίδια τα συστήµατα. Το επίπεδο παρεχόµενης πληροφορίας θα πρέπει να είναι υψηλό και να περιλαµβάνει σε κάθε περίπτωση αναλυτική περιγραφή των προσφερόµενων/αιτούµενων υπηρεσιών, πληροφορίες για το «προφίλ» των εµπλεκοµένων και εναλλακτικές προτάσεις υπηρεσιών/δροµολογίων βασισµένες σε διάφορα κριτήρια αξιολόγησης. Τα τελευταία χρόνια έχουν προταθεί και υλοποιηθεί αρκετές εφαρµογές µεσολάβησης και διαχείρισης µεταφορών φορτίου και ναύλωσης στόλου (freight brokerage and fleet scheduling) [Fernandez et al., 2002; Parkes & Ungar, 2001; Adler et al., 2005; Choy et al., 2003; Balbo & Pinson, 2001], προσφέροντας υπηρεσίες διαµεσολάβησης µεταξύ των πελατών που επιθυµούν να µεταφέρουν προϊόντα και αγαθά σε ένα συγκεκριµένο σηµείο και των µεταφορικών εταιρειών που παρέχουν τα µέσα για τη µεταφορά αυτή. Οι υπάρχουσες εφαρµογές διαχείρισης µεταφορών µπορούν να διακριθούν σε δύο βασικές κατηγορίες, ανάλογα µε το είδος της προσφερόµενης διαµεσολάβησης. Η πρώτη κατηγορία αφορά συστήµατα βασισµένα στον παγκόσµιο ιστό (webbased approaches), µέσω των οποίων οι υποψήφιοι πελάτες έχουν την δυνατότητα καταχώρησης της αίτησής τους σε προκαθορισµένες φόρµες δεδοµένων (data forms), ενώ στη συνέχεια οι µεσολαβήτριες εταιρείες (brokerage companies) εξετάζουν την αίτηση και προσπαθούν να εκτελέσουν την συναλλαγή µε τον παραδοσιακό τρόπο. Παραδείγµατα τέτοιων συστηµάτων αποτελούν οι:

75 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Spitrans Brokering Inc. 2, Cargo World Inc. 3, Freight Brokers 4, κ.α. Όπως παρατηρούµε στο Σχήµα 3-1, το σύστηµα Freight Brokers είναι βασισµένο στον παγκόσµιο ιστό και ουσιαστικά προσφέρει µια διεπαφή µέσω της οποίας ο υποψήφιος πελάτης καταχωρεί αναλυτικά τα στοιχεία της αιτούµενης µεταφοράς (τύπο φορτίου, βάρος, συσκευασία, τόπο φόρτωσης και αποστολής, κλπ) και στη συνέχεια καταχωρεί την αίτησή του, περιµένοντας την επικοινωνία από την πλευρά της εταιρείας. Η εταιρεία µε τη σειρά της, αφού λάβει την αίτηση του πελάτη, αναζητά στη βάση δεδοµένων της τον κατάλληλο µεταφορέα που θα µπορέσει να διεκπεραιώσει την συναλλαγή. Το αποτέλεσµα της πιο πάνω επεξεργασίας περιλαµβάνει την εξεύρεση µιας µεταφορικής λύσης (δροµολογίου) από το σηµείο φόρτωσης στο σηµείο παράδοσης, µε τη χρήση των διαθέσιµων από την εταιρεία µεταφορικών µέσων. Ο πελάτης καλείται στο τέλος να επιβεβαιώσει ή όχι την προτεινόµενη συναλλαγή για να ξεκινήσει η διαδικασία της µεταφοράς. Σχήµα 3-1: Η διεπαφή του συστήµατος Freight Brokers

76 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Η βασική κριτική σε τέτοιου είδους συστήµατα συνίσταται στα βασικά µειονεκτήµατα του είδους της διαµεσολάβησης που προσφέρουν. Πιο συγκεκριµένα: 1. Η χρησιµοποιούµενη τεχνολογία δεν υποκαθιστά την χρήση του ανθρώπινου παράγοντα σε τέτοιο βαθµό, ώστε το χρονικό όφελος από τη διαµεσολάβηση να είναι σηµαντικό. 2. Ο πελάτης στερείται τη δυνατότητα αλληλεπίδρασης µε το σύστηµα, µη µπορώντας να διαµορφώσει ουσιαστικά τις προτιµήσεις του και να θέσει τους περιορισµούς του. 3. Οι προτεινόµενες λύσεις (δροµολόγια) που παρέχονται από την/τις εταιρεία/ες, δεν µπορούν σε καµία περίπτωση να ελεγχθούν αναφορικά µε την αξιοπιστία τους, την προσφερόµενη ασφάλεια και τη συνέπεια παράδοσης, καθιστώντας έτσι επισφαλή τη συναλλαγή. Η δεύτερη κατηγορία, περιλαµβάνει ένα σχετικά µικρό αριθµό συστηµάτων διαχείρισης µεταφορών (Transportation Management Systems TMSs), µε προηγµένα χαρακτηριστικά και δυνατότητες. Τα συστήµατα αυτά αποτελούν τις περισσότερες φορές δοµικές µονάδες σε ήδη υλοποιηµένα συστήµατα logistics που επιτελούν λειτουργίες όπως διαχείριση εφοδιαστικής αλυσίδας, τιµολόγηση και προώθηση. Αντιπροσωπευτικά συστήµατα αυτής της κατηγορίας είναι µεταξύ άλλων τα Cadence TMS 5, E.R.T. TMS 6 και LoadMaster 7. Το πρώτο από τα συστήµατα αυτά είναι βασισµένο στο ιαδίκτυο, ενώ τα άλλα δύο απαιτούν εγκατάσταση λογισµικού από την πλευρά του χρήστη καθώς και διασύνδεση µε τις βάσεις δεδοµένων των µεταφορέων. Όλα τα παραπάνω συστήµατα παρέχουν φιλικές διεπαφές στους χρήστες και εργαλεία για την επιλογή του κατάλληλου µεταφορέα και τον διακανονισµό της φόρτωσης των προϊόντων. Όλη η διαδικασία µπορεί να παρακολουθείται από την φόρτωση µέχρι την παράδοση, ικανοποιώντας παράλληλα τις απαιτήσεις των χρηστών και ελαχιστοποιώντας τις «άδειες» (empty) και εκτός δροµολογίου µεταφορές (out of route miles). Τα συστήµατα αυτά έχουν συχνά δυνατότητες παρακολούθησης φορτίου (load tracking), όπου µέσω ενός ενσωµατωµένου Γεωγραφικού Πληροφοριακού Συστήµατος (GIS), µπορούν να λαµβάνουν πληροφόρηση για τη µεταφορά σε όλες τις φάσεις της διαδικασίας, επιλέγοντας τους συνοδευτικούς χάρτες εντοπισµού του µεταφεροµένου φορτίου. Ένα στιγµιότυπο του συστήµατος ERT TMS, παρουσιάζεται στο Σχήµα

77 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Σχήµα 3-2: Η διεπαφή του συστήµατος ERT TMS. Παρά τις εµφανείς δυνατότητές τους, τα συστήµατα αυτά απαιτούν την µεσολάβηση έµπειρων και καταρτισµένων χρηστών σε ζητήµατα που αφορούν τις µεταφορικές συναλλαγές, κυρίως λόγω της πολυπλοκότητας διαχείρισης των ζητηµάτων αυτών. Βασικό µειονέκτηµα παραµένει η έντονη ανθρώπινη παρουσία και διαµεσολάβηση στην όλη διαδικασία, και πιο συγκεκριµένα η εµπλοκή ενός υπαλλήλου σε ζητήµατα όπως η επιλογή µεταφορέα, «το ταίριασµα» (matching) των ηµεροµηνιών παραλαβής και παράδοσης, η τιµολόγηση της συναλλαγής και η εύρεση της βέλτιστης διαδροµής. Αρνητικό στοιχείο επίσης της ανθρώπινης εµπλοκής αποτελεί το γεγονός πως δεν λαµβάνεται υπόψη η δυνατότητα παροχής τµηµατικής λύσης, καθώς αγνοείται η έννοια των συνδυασµένων µεταφορών και οι προτεινόµενες λύσεις αφορούν στην θεώρηση ενός µόνο µεταφορέα και ενός µεταφορικού µέσου. Έτσι τα συστήµατα αυτά δεν εγγυώνται σε καµία περίπτωση τη βελτιστοποίηση σηµαντικών κριτηρίων, όπως ο χρόνος, το κόστος, η ασφάλεια και η αξιοπιστία, που αποτελούν βασικές προτεραιότητες για κάθε εµπλεκόµενο χρήστη. Γενικά, το πεδίο της διαχείρισης συνδυασµένων µεταφορών απαιτεί γρήγορες και οικονοµικές λύσεις στα αιτήµατα των πελατών για διανοµή των προϊόντων/αγαθών τους [Boardman et al., 1997]. Επίσης, λόγω της ύπαρξης µεγάλου αριθµού µεταφορικών εταιρειών παγκοσµίως, είναι επιτακτική η ανάγκη προφοράς υπηρεσιών διαµεσολάβησης (brokerage) µε σύγχρονες τεχνικές, οι οποίες θα εξασφαλίζουν την διαρκή ενηµέρωση των συστηµάτων σχετικά µε τις προσφερόµενες υπηρεσίες [Chih & Van Dyke, 1987]. Ένα σηµαντικό επίσης ζήτηµα είναι η ανικανότητα των σηµερινών εφαρµογών στην σύνθεση βέλτιστων ή

78 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών υπο-βέλτιστων λύσεων. Πιο συγκεκριµένα τα συστήµατα στα οποία έγινε ανασκόπηση, δεν έχουν την δυνατότητα δηµιουργίας τέτοιου είδους λύσεων µιας και οι προσφερόµενες υπηρεσίες επικεντρώνονται απλώς στην εξεύρεση ενός µεταφορέα ικανού να αναλάβει την µεταφορά από το πρώτο µέχρι το τελευταίο στάδιο. Μπορεί λοιπόν να εξασφαλίζεται η απρόσκοπτη µεταφορά των προϊόντων από το σηµείο φόρτωσης στο σηµείο παράδοσης, αλλά σε καµία περίπτωση δεν εξασφαλίζεται η βελτιστοποίηση του κόστους και του χρόνου µεταφοράς, κριτηρίων σηµαντικών για κάθε πελάτη. Σε αντίθεση µε τις πιο πάνω προσεγγίσεις, ο ρόλος του προτεινόµενου πλαισίου διαχείρισης συνδυασµένων µεταφορών θα πρέπει να είναι «ενεργός» [Karacapilidis et al., 2006], προσφέροντας: α) Συνεχή αναζήτηση και δυναµική ενηµέρωση όλων των εµπλεκοµένων χρηστών για την αναζήτηση εφικτών λύσεων, β) δυναµική ανάληψη πρωτοβουλιών (λόγω της ηµι-αυτονοµίας των ευφυών πρακτόρων), που αποσκοπεί στην διερεύνηση της ικανοποίησης των αιτηµάτων µεταφοράς και στην επικύρωση της συναλλαγής, γ) θεώρηση εναλλακτικών δροµολογίων και διαφορετικών µεταφορέων για κάθε συναλλαγή, µε στόχο τη βελτιστοποίηση του κόστους και του χρόνου µεταφοράς, δ) αξιολόγηση των εναλλακτικών λύσεων µε αυτοµατοποίηση της διαδικασίας διαπραγµάτευσης µεταξύ πελατών και µεταφορέων, και ε) δυναµική ανανέωση των προφίλ των εµπλεκοµένων χρηστών και καθορισµός των κατάλληλων στρατηγικών βάσει των προτεραιοτήτων που ορίζονται στα προφίλ αυτά. 3.2 Εξόρυξη Γνώσης και Αποθήκες εδοµένων Γενικά Η σηµερινή κατάσταση στο χώρο του ηλεκτρονικού εµπορίου καθιστά αναγκαία τη συλλογή και αποθήκευση δεδοµένων από πολλές πηγές όπως: τραπεζικές συναλλαγές, συναλλαγές µέσω πιστωτικών καρτών, αγορές και πωλήσεις προϊόντων ή υπηρεσιών, τηλεφωνικές κλήσεις, κ.ά. Προκειµένου να εκµεταλλευτούµε και να χρησιµοποιήσουµε τα δεδοµένα αυτά, τα αποθηκεύουµε σε µεγάλες βάσεις δεδοµένων που ονοµάζονται «αποθήκες δεδοµένων» (data warehouses). Στις αποθήκες αυτές, τα δεδοµένα οργανώνονται µε τέτοιο τρόπο, έτσι ώστε να µπορούµε να τα εκµεταλλευτούµε εύκολα και να ανακαλύψουµε την «κρυµµένη» πληροφορία που περιέχουν [Benzecri, 1992]. Τα τελευταία χρόνια εφαρµόζεται µια µέθοδος εξαγωγής χρήσιµης πληροφορίας από τα δεδοµένα αυτά. Η διαδικασία αυτή ονοµάζεται εξόρυξη γνώσης (data mining) και ορίζεται ως «η εξερεύνηση και ανάλυση µεγάλων όγκων δεδοµένων, µε αυτόµατα ή ηµιαυτόµατα µέσα, µε σκοπό τον ορισµό σηµαντικών

79 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών µοντέλων και κανόνων» [Han & Kamber, 2000]. Οι βάσεις δεδοµένων των πληροφοριακών συστηµάτων στις µέρες µας καταλαµβάνουν χώρο πολλών gigabytes. Σε αυτές τις συλλογές δεδοµένων µπορεί να βρίσκονται πληροφορίες στρατηγικής σηµασίας, που για να ανακαλυφθούν πρέπει να χρησιµοποιήσουµε την µέθοδο εξόρυξης γνώσης από δεδοµένα. Έτσι, εξάγουµε πληροφορία από µια βάση δεδοµένων, στην οποία ο χρηστής δεν είχε πρόσβαση και µετατρέπουµε την πληροφορία αυτή σε λύση για κάποιο πρόβληµα που µπορεί να αντιµετωπίζει. Στην ουσία, ο στόχος της µεθόδου αυτής είναι η βελτίωση του marketing, των πωλήσεων, της υποστήριξης των πελατών καθώς και η καλύτερη κατανόηση των απαιτήσεών τους. Το πρώτο και απλούστερο βήµα στην εξόρυξη γνώσης από δεδοµένα, είναι η περιγραφή των δεδοµένων, η σύνοψη δηλαδή των στατιστικών τους ιδιοτήτων, η οπτική παρουσίασή τους µε τη χρήση διαγραµµάτων και γραφικών παραστάσεων και τελικά, η αναζήτηση πιθανών σηµαντικών συνδέσεων µεταξύ των µεταβλητών που τα χαρακτηρίζουν. ίνοντας περισσότερη έµφαση στην διαδικασία της εξόρυξης γνώσης από δεδοµένα, η συλλογή, η εξερεύνηση και η επιλογή των σωστών δεδοµένων είναι πολύ σηµαντική. Η ανάλυση των δεδοµένων από µόνη της δεν εγγυάται πάντοτε τη δηµιουργία ενός αξιόπιστου µοντέλου αλλά σε κάθε περίπτωση µπορεί να αποτελέσει έναν χρήσιµο οδηγό για την κατανόηση του υπό εξέταση προβλήµατος [Berry and Linoff, 1997]. Το τελευταίο βήµα είναι να επαληθεύσουµε το µοντέλο µας εµπειρικά. ιακρίνουµε δυο τύπους µοντέλων, τα περιγραφικά (descriptive) και τα προβλεπτικά (predictive). Για να προσεγγίσουµε ένα πρόβληµα και να καταφέρουµε να δώσουµε µια πιθανή λύση, θα πρέπει να ακολουθήσουµε µια από τις δυο διαδικασίες προσέγγισης [Markellos et al., 2003]. Αυτές είναι η ανακάλυψη γνώσης (knowledge discovery) και ο έλεγχος υπόθεσης (hypothesis testing). Η ανακάλυψη γνώσης προσπαθεί να βρει οµοιότητες µεταξύ οµάδων εγγραφών (records), χωρίς να χρησιµοποιεί συγκεκριµένα πεδία ή προκαθορισµένες οµάδες. ιακρίνουµε την ανακάλυψη γνώσης σε κατευθυνόµενη (directed) και µη-κατευθυνόµενη (undirected). Όσον αφορά στην πρώτη, αναγνωρίζουµε τις πηγές των προκαθορισµένων δεδοµένων, προετοιµάζουµε τα δεδοµένα για ανάλυση, κατασκευάζουµε και ελέγχουµε υπολογιστικά µοντέλα και τέλος τα αξιολογούµε. Στην µη-κατευθυνόµενη ανακάλυψη γνώσης ακολουθούµε τα ίδια βήµατα και συνεχίζουµε τη διαδικασία εφαρµόζοντας νέα δεδοµένα στα υπολογιστικά µας µοντέλα, διακρίνουµε τα πιθανά σηµεία για ανακάλυψη γνώσης, και τέλος δηµιουργούµε νέες υποθέσεις για έλεγχο. Για να αξιολογήσουµε και να συγκρίνουµε την εκτέλεση αυτών των µοντέλων εξόρυξης γνώσης, χρησιµοποιούµε µια µέθοδο ανύψωσης (lift) όπου µετρούµε τα αποτελέσµατα και

80 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών τις πράξεις που µας επιστρέφουν οι διαδικασίες εξόρυξης γνώσης [Berry and Linoff, 1997]. Από την άλλη πλευρά, ο έλεγχος υπόθεσης επιχειρεί να βρει ένα µοντέλο που να εξηγεί τα δεδοµένα που παρατηρούνται, δηµιουργώντας αρχικά µια υπόθεση και δοκιµάζοντας κατόπιν την υπόθεση αυτή στα δεδοµένα. Αναλυτικότερα, αρχίζουµε την διαδικασία δηµιουργώντας νέες ιδέες, προσδιορίζουµε τα δεδοµένα που θα µας επιτρέψουν να ελέγξουµε αυτές τις υποθέσεις, προετοιµάζουµε τα δεδοµένα για ανάλυση, κατασκευάζουµε υπολογιστικά µοντέλα βασισµένα στα δεδοµένα αυτά και τέλος, τα χρησιµοποιούµε για να δούµε αν επιβεβαιώνουν ή απορρίπτουν την αρχική µας υπόθεση [Berry and Linoff, 1997] Προσεγγίσεις στην εξόρυξη γνώσης Παραπάνω δώσαµε τον ορισµό της έννοιας «εξόρυξη γνώσης», καθώς και τη µεθοδολογία που ακολουθείται για να εφαρµοστεί η Τεχνική αυτή. Πριν επικεντρωθούµε στις εργασίες και στις τεχνικές εξόρυξης γνώσης, θα αναφερθούµε σε συστήµατα και µεθόδους που έχουν προταθεί και εφαρµόζουν την εξόρυξη γνώσης, καθώς και σε παρόµοιες προσπάθειες που έχουν γίνει ώστε να καταλάβουµε στην πράξη τα πλεονεκτήµατα της τεχνικής αυτής. Το 2003, δηµοσιεύθηκε µια τεχνική [Durand et al., 2003] που σχετιζόταν µε το πεδίο της εξόρυξης γνώσης από δεδοµένα, και αφορούσε στον προσδιορισµό κατηγορηµατικών οµάδων (categorical clusters) από έναν όγκο δεδοµένων. Τα κατηγορηµατικά δεδοµένα παρέχουν πληροφορία για κοινά στοιχειά µεταξύ πολλαπλών εγγραφών. Η συγκεκριµένη τεχνική εστιάζει την εφαρµογή της κυρίως στον τοµέα της αγοράς και των επιχειρήσεων και αρχικά περιοριζόταν σε µια µέθοδο. Όπως φαίνεται στο Σχήµα 3-3, η τεχνική αυτή λειτουργεί ως εξής: οι αρχικές τιµές καθορίζονται από τα στοιχεία των εγγραφών, και στη συνέχεια η τιµή καθενός υπολογίζεται ξανά, βασισµένη στις τιµές των άλλων στοιχείων που περιλαµβάνονται στις εγγραφές µαζί µε τα δοθέντα στοιχεία. Έτσι, οι σχετιζόµενες τιµές θα τείνουν να αυξηθούν για στοιχεία που παίρνουν µέρος σε πολλαπλές εγγραφές. Αυτά τα κοινά συµβάντα στοιχείων αντιπροσωπεύουν τις κατηγορηµατικές οµάδες κανόνων, που θα ήθελε να γνωρίζει ο «ιδιοκτήτης» των δεδοµένων

81 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Αρχικοποιητής (initializer) Μέχρι τον τερµατισµό (untill termination do) Συνδυαστής (combiner) Τροποποιητής (modifier) ιαδικασία επανάληψης (iteration) Έλεγχος συνθήκης τερµατισµού (check termination condition) Εξαγωγή αποτελέσµατος (report output) Σχήµα 3-3: Η τεχνική Kleinberg Μια άλλη τεχνική [Agrawal et al., 1998], αναφέρεται σε µεθόδους δηµιουργίας ενός ταξινοµητή ένδρων Αποφάσεων από εγγραφές δεδοµένων. Η συγκεκριµένη τεχνική κατορθώνει να ταξινοµεί εγγραφές δεδοµένων από ένα τεράστιο σύνολο δεδοµένων, να παρέχει ένα ταξινοµητή µικρό, ακριβή και µε µικρούς χρόνου εκτέλεσης, και τέλος να µπορεί να «κλαδεύει» το δένδρο χωρίς να προκύπτει το πρόβληµα του υπερκλαδέµατος (overpruning). Κάθε εγγραφή αναγνωρίζεται από µια κλάση έγγραφης (class). Η µέθοδος αναλύει την οµάδα δεδοµένων και αναπτύσσει ένα µοντέλο για κάθε µια κλάση έγγραφης. Οι περιγραφές των κλάσεων οργανώνονται σε ένα δένδρο αποφάσεων, στο οποίο κάθε κόµβος/κλαδί παριστάνει µια κλάση. Ο ταξινοµητής ένδρου Αποφάσεων µπορεί να χρησιµοποιηθεί για µελλοντική ταξινόµηση εγγραφών, όπου οι κλάσεις του είναι άγνωστες. Σύµφωνα µε τη µέθοδο, πρώτα ταξινοµούνται οι εγγραφές βάσει των τιµών των αριθµητικών χαρακτηριστικών τους. Έπειτα, δηµιουργείται ένα ένδρο Αποφάσεων, όπου τα κλαδιά του αναπτύσσονται παράλληλα µε τον έλεγχο των δεδοµένων. Επίσης, χρησιµοποιείται και ένας αλγόριθµος γρήγορης υποοµαδοποίησης - στην περίπτωση κατηγορηµατικών ιδιοτήτων - για να εκτιµήσει τους διαχωρισµούς (splits). Τέλος, το δένδρο αποφάσεων, χρησιµοποιώντας την αρχή του ελάχιστου µήκους περιγραφής (MDL-Minimum Description Length), «κλαδεύεται» για να είναι ένας ιδανικός ταξινοµητής

82 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Τέλος, στην έρευνα των Adomavicius και Tuzhilin [Adomavicius & Tuzhilin, 2001], παρουσιάστηκε το σύστηµα 1:1 Pro (one to one profiling), το οποίο εφαρµόζει τη µέθοδο δηµιουργίας και τεκµηρίωσης προφίλ πελατών (βλ. Σχήµα 3-4). Το σύστηµα δέχεται ως είσοδο τα πραγµατικά δεδοµένα, καθώς και τα δεδοµένα από συναλλαγές που είναι αποθηκευµένα σε µια βάση δεδοµένων, και δηµιουργεί µια οµάδα τεκµηριωµένων κανόνων που αντικατοπτρίζουν την συµπεριφορά του πελάτη. Μπορεί να χρησιµοποιήσει οποιοδήποτε σύστηµα διαχείρισης σχεσιακών βάσεων δεδοµένων (RDBMS Relational Database Management System) για να αποθηκεύσει τα δεδοµένα του πελάτη ώστε να εξάγει κανόνες. Επιπρόσθετα, το σύστηµα αυτό µπορεί να συνεργαστεί και µε άλλα εργαλεία που είναι χρήσιµα στη διαδικασία τεκµηρίωσης των κανόνων. 1:1 Πελάτης (client) 1:1 Εξυπηρετητής (server) Γραφικό περιβάλλον (GUI) Τεκµηρίωση (validation) Περιβάλλον βάσης δεδοµένων (Database interface) Σύστηµα ιαχείρισης Σχεσιακών Βάσεων εδοµένων (RDBMS) Συντονισµός (Coordination) Επικοινωνία (communication) Επικοινωνία (communication) Περιβάλλον εξόρυξης γνώσης (Data mining interface) Εργαλεία εξόρυξης γνώσης (data mining tools) ίκτυα (LAN,WAN,Internet) Σχήµα 3-4: Αρχιτεκτονική του συστήµατος 1:1 Pro Στο 1:1 Pro χρησιµοποιήθηκαν µέθοδοι εύρεσης κανόνων ταξινόµησης ώστε να δηµιουργηθούν τα προφίλ πελατών. Ωστόσο, οι µέθοδοι αυτοί δεν περιορίζονται σε µια συγκεκριµένη δοµή ή σε έναν συγκεκριµένο αλγόριθµο Μπορούν να προσαρµoστούν στο σύστηµα και άλλα εµπορικά ή πειραµατικά εργαλεία εξόρυξης γνώσης

83 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Τεχνικές εξόρυξης γνώσης Ανάλυση αγοράς (market basket analysis) Οι κανόνες συσχέτισης (association rules) είναι µία από τις σηµαντικότερες τεχνικές εξόρυξης από δεδοµένα [Agrawal & Srikant, 1994]. Η κυριότερη εφαρµογή τους είναι η ανάλυση αγοράς (market-basket analysis), όπου η αγορά ενός συνόλου προϊόντων (για παράδειγµα, το περιεχόµενο ενός καλαθιού σούπερ- µάρκετ) αντιµετωπίζεται ως µία µεµονωµένη συναλλαγή. Σκοπός είναι η εύρεση τάσεων (αλληλεξαρτήσεων και συσχετίσεων) µεταξύ ενός αριθµού συναλλαγών, οι οποίες στη συνέχεια µπορούν να αναλυθούν και µέσω αυτών να αναγνωρισθούν αγοραστικά πρότυπα, τα οποία στη συνέχεια θα χρησιµοποιηθούν ως πληροφορία. Μια πιο αναλυτική περιγραφή της τεχνικής αυτής, καθώς και η εφαρµογή της στη δηµιουργία γνώσης, παρουσιάζεται στην παράγραφο Μνηµονική αιτιολόγηση (memory-based reasoning) Η ουσία αυτής της τεχνικής εξόρυξης γνώσης είναι η εκµετάλλευση της εµπειρίας (experience). Αυτό γίνεται ως εξής: αρχικά, διαχωρίζουµε τις παρόµοιες περιπτώσεις από τις εµπειρίες, και στην συνέχεια αντλούµε πληροφορία από τις περιπτώσεις αυτές και προσπαθούµε να δώσουµε λύση στο πρόβληµα µας. Η µνηµονική αιτιολόγηση εντοπίζει «γείτονες» (neighbors) συναφείς µε µια εγγραφή (record) και χρησιµοποιεί τους γείτονες αυτούς για κατηγοριοποίηση και πρόβλεψη. Η απόσταση (distance) µεταξύ οποιωνδήποτε δύο εγγραφών και η συνάρτηση συνδυασµού (combination function) συνδυάζουν τα αποτελέσµατα από τους γείτονες και καταλήγουν στην απάντηση. Για να λύσουµε ένα πρόβληµα µε την τεχνική της µνηµονικής αιτιολόγησης, ακολουθούµε τρία βασικά βήµατα: 1) επιλέγουµε το κατάλληλο σύνολο ιστορικών δεδοµένων (historical data), 2) βρίσκουµε τον κατάλληλο τρόπο αναπαράστασης των ιστορικών δεδοµένων µας, και 3) προσδιορίζουµε την συνάρτηση απόστασης (distance function), την συνάρτηση συνδυασµού (combination function) και τον αριθµό των γειτόνων (number of neighbors). Τα ιστορικά δεδοµένα θα πρέπει να παρέχουν σωστή κάλυψη των εγγραφών, έτσι ώστε οι κοντινότεροι γείτονες σε µια άγνωστη εγγραφή να µπορούν να χρησιµοποιηθούν στην παραγωγή προβλέψεων. Για να προσδιορίσουµε τον σωστότερο τρόπο απεικόνισης των δεδοµένων µας, αναζητούµε τους γείτονες µε την µικρότερη απόσταση από την άγνωστη εγγραφή και επιλέγουµε τα ιστορικά δεδοµένα µε την µικρότερη απόσταση από αυτούς τους γείτονες. Αναπαριστώντας τα ιστορικά δεδοµένα, στην ουσία µειώνουµε τον αριθµό των εγγραφών στην βάση δεδοµένων. Για παράδειγµα, σε ένα γράφηµα µε διακριτά σηµεία, αναζητούµε οµάδες που να περιέχουν εγγραφές διαφορετικών κατηγοριών. Το κέντρο των εγγραφών αυτών µπορεί να χρησιµοποιηθεί σαν ένα

84 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών υποσύνολο δεδοµένων. Τέλος, προσδιορίζουµε την συνάρτηση απόστασης, την συνάρτηση συνδυασµού και τον αριθµό των γειτόνων. Κυριολεκτικά, η απόσταση ορίζεται ως το τµήµα µεταξύ δύο σηµείων. Στην τεχνική µνηµονικής αιτιολόγησης ως σηµεία ορίζουµε τις εγγραφές και ως απόσταση εννοούµε τη συνάφεια µεταξύ δυο εγγραφών. Μια σωστά οριοθετηµένη απόσταση σηµαίνει πως κάθε εγγραφή έχει γείτονες στη βάση δεδοµένων. Η συνάρτηση συνδυασµού, παρουσιάζει διαφορετικούς τρόπους µε τους οποίους µπορούµε να συγκεντρώσουµε τα δεδοµένα από τους γείτονες. Με τη λογική αυτή, υπάρχουν κάποια όρια στη λήψη αποφάσεων βασισµένη στους γείτονες Αυτόµατη ανίχνευση αλυσίδων Η αυτόµατη ανίχνευση αλυσίδων (automated cluster detection) είναι µια τεχνική µη κατευθυνόµενης ανακάλυψης γνώσης. Λειτουργεί σωστά µε διακριτά, αριθµητικά και αυτούσια δεδοµένα. Είναι εύκολο να την εφαρµόσουµε, µιας και µπορεί να εφαρµοστεί ακόµα και όταν δεν έχουµε κατάλληλη γνώση της εσωτερικής δοµής της βάσης δεδοµένων. Επίσης, µπορεί να χρησιµοποιηθεί για να εµφανίσει κρυµµένη δοµή που µπορεί να χρησιµοποιηθεί για να βελτιώσει την εκτέλεση κατευθυνόµενων τεχνικών [Alderferer & Blasfield, 2004]. Οι κυριότερες προσεγγίσεις στην αυτόµατη ανίχνευση αλυσίδων είναι ο αλγόριθµος K-means και οι συσσωρευτικές µέθοδοι (agglomerative methods). Ο αλγόριθµος K-means εντοπίζει έναν αριθµό οµάδων οι οποίες καθορίζονται από την γειτνίαση µεταξύ των σηµείων δεδοµένων (data points). Λειτουργεί ως εξής: ο αλγόριθµος επιλέγει Κ τυχαία σηµεία δεδοµένων, καθορίζει κάθε εναποµείναν σηµείο σε µια Κ οµάδα, υπολογίζει τα κέντρα κάθε οµάδας χρησιµοποιώντας τον µέσο όρο των σηµείων της (βλ. Σχήµα 3-5), και µεταφράζει τις τιµές δεδοµένων (data values) σε αριθµητικές τιµές ώστε να µπορούν να συµπεριφερθούν σαν σηµεία. Αν δυο σηµεία είναι κοντά (µε την γεωµετρική έννοια), τότε αναπαριστούν παρόµοια δεδοµένα στην βάση δεδοµένων. Οι συσσωρευτικές µέθοδοι ξεκινούν έτσι ώστε, κάθε δεδοµένο σηµείο να σχηµατίζει τη δική του οµάδα, ενώ σταδιακά οι οµάδες συγχωνεύονται έως ότου όλα τα σηµεία να συγκεντρωθούν µαζί σε µια ευρύτερη οµάδα

85 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Σχήµα 3-5: Οµάδες σηµείων έντρα Αποφάσεων (Decision Τrees) Τα ένδρα Αποφάσεων είναι µία τεχνική ανάλυσης αποφάσεων. Σκοπός ενός ένδρου Απόφασης ( Α) είναι η επιλογή µιας λύσης από ένα σύνολο εναλλακτικών λύσεων [Berry & Linoff, 1997]. Σε ένα Α αποτυπώνονται οι διάφορες εναλλακτικές ενέργειες, τα γεγονότα µε τις πιθανότητές τους που προκύπτουν από αυτές τις ενέργειες, καθώς και τα αποτελέσµατα που προκύπτουν από τα γεγονότα. Οι κόµβοι κάθε Α διακρίνονται σε τρεις κατηγορίες: κόµβοι απόφασης (decision nodes), κόµβοι πιθανότητας (probability or chance nodes) και τερµατικοί κόµβοι (terminal nodes). Σχήµα 3-6: Παράδειγµα δένδρου αποφάσεων

86 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Η κατασκευή ενός Α (βλ. Σχήµα 3-6) γίνεται από τα αριστερά προς τα δεξιά, από τη ρίζα, που τις περισσότερες φορές δηλώνει ένα κόµβο απόφασης, έως ότου καταλήξει στα φύλλα (τερµατικούς κόµβους), στα οποία δηλώνονται τα αποτελέσµατα. Από τους κόµβους απόφασης διακλαδίζονται εναλλακτικές ενέργειες. Από τους κόµβους πιθανότητας διακλαδίζονται τα ενδεχόµενα γεγονότα. Μεταξύ των εναλλακτικών ενεργειών συµπεριλαµβάνεται και η επιλογή «καµία ενέργεια» ως µία απόφαση που είναι πιθανό να ληφθεί. Η δενδροειδής δοµή διασφαλίζει ότι η διαδροµή (path) που ξεκινάει από τη ρίζα του Α και καταλήγει σε έναν τερµατικό κόµβο είναι µοναδική και αποτυπώνει ένα συγκεκριµένο τρόπο δράσης. Για κάθε µία εναλλακτική ενέργεια υπολογίζεται το κανονικοποιηµένο κέρδος πληροφορίας (normalized information gain) και από αυτές επιλέγεται εκείνη µε το µεγαλύτερο. Η τελευταία αυτή διαδικασία γίνεται πάνω στο Α από το τέλος προς την αρχή Εξόρυξη Γνώσης και Συστήµατα Συστάσεων Ένα από τα ανοικτά προβλήµατα της περιοχής σχετίζεται µε το πώς θα συνδυαστούν οι κατάλληλες πηγές στοιχείων, θα βρεθούν οι σωστές και χρήσιµες πληροφορίες κάθε φορά και θα γίνει κατανοητή η συµπεριφορά του χρήστη, ώστε να υποστηριχθεί µια ικανοποιητική και εξατοµικευµένη ηλεκτρονική µάθηση. Αυτό είχε σαν αποτέλεσµα πολλοί ερευνητές να στραφούν στην επιστηµονική περιοχή του Data Knowledge Mining (Εξόρυξη Γνώσης από εδοµένα) ή απλώς Data Mining (Εξόρυξη εδοµένων) (Hand et al., 2001). Πράγµατι η εξόρυξη γνώσης από αποθήκες δεδοµένων έχει εξελιχθεί σε ένα από τα βασικότερα ερευνητικά ζητήµατα. Μέχρι πρόσφατα η εξόρυξη γνώσης αφορούσε αποκλειστικά δοµηµένα (structured) δεδοµένα δηλαδή δεδοµένα που είναι αποθηκευµένα σε βάσεις δεδοµένων (databases). Τα τελευταία χρόνια το ενδιαφέρον στράφηκε και σε µη δοµηµένα δεδοµένα (semi-structured και unstructured) π.χ. κείµενα, εικόνες, ιστοσελίδες (web pages), κλπ. [Markellos et al., 2003]. Στα πλαίσια της παρούσας διατριβής εκµεταλλευθήκαµε τις τεχνικές εξόρυξης γνώσης όπως αυτές παρουσιάστηκαν στις προηγούµενες παραγράφους µε σκοπό την αξιοποίησή τους στην παραγωγή αξιόπιστων συστάσεων. Πιο συγκεκριµένα, οι διαθέσιµες τεχνικές εξόρυξης γνώσης ενσωµατώθηκαν στην δοµική µονάδα συστάσεων του προτεινόµενου συστήµατος µε σκοπό την βελτίωση του παρεχόµενου επιπέδου των παραγόµενων συστάσεων. Η ενσωµάτωση αυτή πραγµατοποιείται στο υποσύστηµα εκείνο της δοµικής µονάδας που χρησιµοποιεί την τεχνική συστάσεων βασισµένη στη γνώση µε σκοπό την δηµιουργία κανόνων γνώσης που αναπαριστούν σχέσεις και τάσεις στα υπό εξέταση δεδοµένα των µεταφορικών συναλλαγών

87 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών 3.3 Ευφυείς πράκτορες στη διαχείριση µεταφορών Γενικά Η ερευνητική περιοχή της τεχνολογίας των ευφυών πρακτόρων έχει αναπτύξει τεχνικές, εργαλεία και µεθόδους που µπορούν να εφαρµοστούν στο πεδίο της διαχείρισης συνδυασµένων µεταφορών. Στην µελέτη τέτοιων προσεγγίσεων υιοθετούµε τη θεώρηση από τη σκοπιά των logistics και επικεντρωνόµαστε στις µεταφορές αγαθών και όχι ατόµων, αγνοώντας επίσης την διαχείριση της εφοδιαστικής αλυσίδας [Weiss, 1999]. Η ανάπτυξη κατανεµηµένων ετερογενών συστηµάτων αυτοµατισµού, αποτελεί σηµαντική πρόκληση για τους σχεδιαστές συστηµάτων [Sjoland et al., 2002]. Η τεχνολογία των πρακτόρων λογισµικού έχει ως σκοπό την παροχή νέων τεχνικών που θα διευκολύνουν τον σχεδιασµό και την υλοποίηση τέτοιων συστηµάτων [Wooldridge, 2002]. Τα χαρακτηριστικά µιας προσέγγισης βασισµένης στην τεχνολογία πρακτόρων είναι [Parunak, 1999]: Τµηµατική: Κάθε οντότητα λογισµικού θα πρέπει να αποτελείται από ένα ξεχωριστό σύνολο µεταβλητών κατάστασης (state variables), καθιστώντας έτσι εύκολη την διεπαφή µε το περιβάλλον. Αποκεντρωµένη: Η εφαρµογή θα µπορεί να διαιρεθεί σε αυτόνοµες διεργασίες, ικανές να εκτελούν χρήσιµες λειτουργίες χωρίς τη συνεχή καθοδήγηση άλλων διαδικασιών. Ευµετάβλητη: Η δοµή της εφαρµογής θα µπορεί να µεταβάλλεται γρήγορα και συχνά. Σύνθετη: Η εφαρµογή θα ενσωµατώνει ένα σύνολο διαφορετικών «συµπεριφορών» που θα εκτελούνται ως ανταπόκριση σε εισερχόµενα ερεθίσµατα. Τα πιο πάνω συνηγορούν στην χρήση των ευφυών πρακτόρων λογισµικού σε περιβάλλοντα διαχείρισης µεταφορών Ερευνητικές προσεγγίσεις Η ανασκόπηση της σχετικής βιβλιογραφίας δείχνει πως η τεχνολογία των ευφυών πρακτόρων βρίσκει εφαρµογή σε αρκετά προβλήµατα στην περιοχή της διαχείρισης µεταφορών (συνδυασµένων και µη). Συχνά οι προσεγγίσεις αυτές είναι κατανεµηµένες και πολύπλοκες εκ φύσεως, εφαρµοζόµενες σε τοµείς όπως: διαχείριση στόλου (fleet management), προγραµµατισµός µεταφορών (transport scheduling) και έλεγχος κίνησης (traffic control). Στις εργασίες που µελετήθηκαν, οι κατηγορίες µεταφορών κυριαρχούνταν από τις οδικές, τις εναέριες και τις συνδυασµένες µεταφορές. Αξίζει επίσης να σηµειωθεί πως ελάχιστες από τις

88 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών εργασίες αφορούσαν στη µελέτη της στρατηγικής λήψης αποφάσεων, καθώς και στις σιδηροδροµικές και θαλάσσιες µεταφορές. Οι περισσότερες δηµοσιεύσεις που αφορούν τις σιδηροδροµικές µεταφορές, ασχολούνται κυρίως µε ζητήµατα συγχρονισµού των δροµολογίων. Οι προσεγγίσεις είναι προσανατολισµένες σε µηχανισµούς διαπραγµάτευσης για την πραγµατοποίηση των δροµολογίων σε διαφορετικά χρονικά διαστήµατα [Clearwater, 1996]. Κάποιες από τις προσεγγίσεις αυτές έχουν εκτιµηθεί πειραµατικά αλλά δεν βρέθηκε καµία υλοποιηµένη. Αναφορικά µε την έρευνα στην περιοχή των εναέριων µεταφορών, η τεχνολογία των ευφυών πρακτόρων έχει εφαρµοστεί για περίπου µια δεκαετία [Bontekoning & Macharis, 2003]. Οι κυριότερες εφαρµογές αφορούν στη διαχείριση κίνησης αεροσκαφών, ενώ ελάχιστες αφορούν σε θέµατα µεταφορών. Στη µελέτη των εργασιών που αφορούν στις οδικές µεταφορές [Budenske et al., 2001; Perugini et al., 2004; Zhu et al., 2000; Bouzid, 2003; Fischer et al., 1999; Kohout & Erol, 1999], τα κυριότερα προβλήµατα εστιάζονται στον προγραµµατισµό των µεταφορών (transport scheduling), δηλαδή στην ανάθεση µιας µεταφοράς σε ένα όχηµα. Οι προσεγγίσεις αυτές είναι κατανεµηµένες και περιλαµβάνουν διαπραγµάτευση (negotiation) µε τη χρήση πολυ-πρακτορικής προσοµοίωσης (multi agent based simulation). Οι πράκτορες στις εφαρµογές αυτές έχουν διακριτούς ρόλους και µπορεί να αντιπροσωπεύουν έναν πελάτη, ένα όχηµα, µια εταιρεία, κ.τ.λ. Η συνεισφορά τους έγκειται κυρίως στον τοµέα της στρατηγικής και συχνά χρησιµεύουν ως Συστήµατα Υποστήριξης Αποφάσεων (Decision Support Systems) σε κάποιον διαχειριστή της εφαρµογής, µιας και λόγω της πολυπλοκότητάς τους απαιτούν την ανθρώπινη παρέµβαση πριν από την ανάθεση µιας µεταφοράς. Εναλλακτικά της τεχνολογίας των ευφυών πρακτόρων, ορισµένα συστήµατα χρησιµοποιούν τεχνικές επιχειρησιακής έρευνας και µαθηµατικού προγραµµατισµού για την κατασκευή µοντέλων εργασιών (task modeling) [Barton et al., 1999]. Στον τοµέα των θαλάσσιων µεταφορών, οι περισσότερες εφαρµογές των πρακτόρων [Perugini et al., 2004; Zhu & Bos, 1999] προσπαθούν να αυξήσουν την αποδοτικότητα στην φάση της µεταφόρτωσης. Η κατεύθυνση της έρευνας αφορά στον καθορισµό των σχέσεων µεταξύ των εµπλεκοµένων µερών που έχουν κοινούς και αντικρουόµενους στόχους. Η µεγάλη πλειοψηφία των εργασιών που µελετήθηκαν δεν περιγράφουν ξεκάθαρα το είδος των πρακτορικών προσεγγίσεων ή τον τρόπο επικοινωνίας και λήψης αποφάσεων µεταξύ των πρακτόρων. Η απουσία ερευνητικού έργου στον τοµέα αυτό καθιστά απαραίτητο τον καθορισµό του πλαισίου λειτουργίας ενός πολυ-πρακτορικού περιβάλλοντος και τον σαφή καθορισµό των ρόλων και πρωτοκόλλων επικοινωνίας των πρακτόρων

89 Κεφάλαιο 3 ο Τεχνικές & Τεχνολογίες Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Στον τοµέα των συνδυασµένων µεταφορών [Bueckert et al., 2000; Dong & Li, 2003; Bergkvist et al., 2005], οι θεωρήσεις επικεντρώνονται στο συνδυασµό οδικών και σιδηροδροµικών µεταφορών. Οι ελάχιστες δηµοσιευµένες εργασίες που βρέθηκαν τονίζουν την ανάγκη µετάβασης σε πολυ-πρακτορικά µοντέλα καθορισµού ρόλων και διαδικασιών διαχείρισης αυτού του είδους των µεταφορών, µιας και το συγκεκριµένο πεδίο θεωρείται ως ταχέως αναπτυσσόµενο. Στα δύο τρίτα των προσεγγίσεων που µελετήθηκαν, οι πράκτορες χρησιµοποιούνται για να λύσουν τα σχετικά προβλήµατα, χωρίς όµως να εξετάζεται η ενσωµάτωση εναλλακτικών τεχνικών και µεθόδων στη συµπεριφορά τους, όπως π.χ. ευρετικοί αλγόριθµοι, νευρωνικά δίκτυα, τεχνικές επιχειρησιακής έρευνας, κ.λπ. Στον Πίνακα 3-1, παρουσιάζονται συνοπτικά οι κυριότερες προσεγγίσεις στον χώρο των πρακτορικών συστηµάτων διαχείρισης µεταφορών

90 Κεφάλαιο 3 ο Τεχνικές Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Πίνακας 3-1: Οι κυριότερες προσεγγίσεις στον χώρο της βασισµένης σε Πράκτορες ιαχείρισης Μεταφορών Εργασία Τύπος Μεταφοράς Χρήση Προσέγγισης Έλεγχος οµή πρακτόρων Αξιολόγηση Budenske et al. (2001) Εναέρια Σύστηµα αυτοµατισµού Κεντρικός υναµική Όχι Σύστηµα Perugini et al. (2004) Όλες Στήριξης Αποφάσεων Κατανεµηµένος υναµική Ποιοτική/Συγκριτική (ΣΣΑ) Zhu et al. (2000) Εναέρια ΣΣΑ Κατανεµηµένος Στατική Ποιοτική Bouzid (2003) Οδική ΣΣΑ Κατανεµηµένος υναµική Ποιοτική Fischer et al. (1999) Οδική ΣΣΑ Κατανεµηµένος υναµική Ποιοτική/Συγκριτική Kohout and Erol (1999) Sawamoto et al. (2002) Bueckert et al. (2000) Οδική ΣΣΑ Κατανεµηµένος υναµική Ποιοτική/Συγκριτική Οδική ΣΣΑ Κατανεµηµένος υναµική Ποιοτική Συνδυασµένη ΣΣΑ Κατανεµηµένος υναµική Όχι Dong and Li (2003) Συνδυασµένη ΣΣΑ Κατανεµηµένος υναµική Όχι Proshun et al. (2003) Συνδυασµένη Στρατηγικό ΣΣΑ Κατανεµηµένος υναµική Όχι Bergkvist et al. (2005) Συνδυασµένη Στρατηγικό ΣΣΑ Κατανεµηµένος Στατική Όχι Zhu and Bos (1999) Όλες Σύστηµα αυτοµατισµού Κατανεµηµένος υναµική Όχι

91 Κεφάλαιο 3 ο Τεχνικές Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Εργασία Τύπος Μεταφοράς Χρήση Προσέγγισης Έλεγχος οµή πρακτόρων Αξιολόγηση Burstein Λειτουργικό et al. Εναέρια σύστηµα Κεντρικός υναµική Όχι (2000) αυτοµατισµού Rizzoli et al. (2002) Συνδυασµένη ΣΣΑ Κεντρικός υναµική Όχι Allo et al. (2001) Εναέρια Λειτουργικό σύστηµα αυτοµατισµού Κατανεµηµένος υναµική Όχι Callantine Λειτουργικό et al. Εναέρια σύστηµα Κεντρικός υναµική Ποιοτική (2003) αυτοµατισµού Findler Λειτουργικό and Elder Εναέρια σύστηµα Κατανεµηµένος Στατική Ποιοτική (1995) αυτοµατισµού Iordanova (2003) Εναέρια ΣΣΑ Κατανεµηµένος υναµική Όχι Kosecka et al. (1997) Brewer and Plott (1996) Εναέρια ΣΣΑ Κατανεµηµένος υναµική Όχι Σιδηροδροµική ΣΣΑ Κατανεµηµένος Στατική Όχι Cuppari et al. (1999) Σιδηροδροµική ΣΣΑ Κεντρικός υναµική Ποιοτική Fernandez et al. (2002) Σιδηροδροµική ΣΣΑ Κατανεµηµένος υναµική Όχι Parkes and Ungar (2001) Σιδηροδροµική Σύστηµα αυτοµατισµού Κατανεµηµένος Στατική Ποιοτική Adler et al. (2005) Οδική Σύστηµα αυτοµατισµού Κατανεµηµένος υναµική Ποιοτική Choy et al. (2003) Οδική Λειτουργικό σύστηµα αυτοµατισµού Κατανεµηµένος Στατική Ποσοτική

92 Κεφάλαιο 3 ο Τεχνικές Υποστήριξης της ιαχείρισης Συνδυασµένων Μεταφορών Εργασία Τύπος Μεταφοράς Χρήση Προσέγγισης Έλεγχος οµή πρακτόρων Αξιολόγηση Balbo and Pinson (2001) Οδική ΣΣΑ Κατανεµηµένος Στατική Ποιοτική France and Ghorbani (2003) Οδική Λειτουργικό σύστηµα αυτοµατισµού Κεντρικός Στατική Όχι

93 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος 4 ΑΝΑΛΥΣΗ ΚΑΙ ΣΧΕ ΙΑΣΜΟΣ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ 4.1 Εισαγωγή Τα Πληροφοριακά Συστήµατα που είναι βασισµένα στην τεχνολογία των ευφυών πρακτόρων (agent-based systems) είναι ικανά να αντιµετωπίσουν επιτυχώς σύνθετα επιχειρησιακά προβλήµατα, όπως η διαχείριση διαδικασιών [Jennings, 2000], η διαχείριση εφοδιαστικών αλυσίδων [Fox, 2000], και ο προγραµµατισµός παραγωγής [Shen & Norrie, 1998]. Η ανωτέρω επιτυχία οφείλεται σε µεγάλο βαθµό στη φύση των πρακτόρων, οι οποίοι εκτελούν αυτόνοµα τις σαφώς καθορισµένες δραστηριότητες που τους ανατίθενται, βασισµένοι σε κανόνες και διαδικασίες που ενσωµατώνονται στη συµπεριφορά τους. Υποστηρίζεται ευρέως ότι τέτοια συστήµατα γίνονται ισχυρότερα και µπορούν να λύσουν πιο σύνθετα προβλήµατα µέσω της κατάλληλης επικοινωνίας διαφορετικών ειδών πρακτόρων [Sycara & Zeng, 1996]. Το προτεινόµενο σύστηµα εκµεταλλεύεται την τεχνολογία των ευφυών πρακτόρων λογισµικού για τη διαχείριση συναλλαγών µεταφοράς αγαθών. Είναι έτσι σε θέση να χειριστεί αποτελεσµατικά µεταφορικές συναλλαγές διάφορων τύπων. Οι πράκτορες του προτεινόµενου συστήµατος αντιπροσωπεύουν και ενεργούν για λογαριασµό οποιουδήποτε χρήστη συµµετέχει σε ένα σενάριο µεταφορών, όπως πελάτες που ενδιαφέρονται για αποδοτικές λύσεις δροµολόγησης των προϊόντων τους και µεταφορικές εταιρείες που µπορούν - πλήρως ή µερικώς - να ικανοποιήσουν τέτοια αιτήµατα, ενώ παράλληλα συνεργάζονται και λαµβάνουν τις σχετικές πληροφορίες σε πραγµατικό χρόνο [Karacapilidis et al., 2006]. Το γενικό πλαίσιο του συστήµατος, είναι βασισµένο σε δοκιµασµένα πρότυπα που επιτυγχάνουν την αποδοτική επικοινωνία µεταξύ όλων των ενδιαφερόµενων πλευρών, συντονίζουν τη γενική διαδικασία, κατασκευάζουν τις πιθανές εναλλακτικές λύσεις και υποστηρίζουν τη σχετική διαδικασία λήψης αποφάσεων [Karacapilidis & Moraitis, 2001] µέσω ενός υβριδικού υποσυστήµατος (δοµικής µονάδας) συστάσεων [Lazanas et al., 2006]. Επιπλέον, το προτεινόµενο σύστηµα είναι σε θέση να χειριστεί την πολυπλοκότητα που είναι έµφυτη σε περιβάλλοντα συνδυασµένων µεταφορών, κάτι που οφείλεται κυρίως στη συχνή ανάγκη για µια «τµηµατική µεταφορική λύση» (modular transportation solution). Για να αναλύσουµε περαιτέρω τον όρο αυτόν, ας θεωρήσουµε την περίπτωση όπου ένας πελάτης θέλει να µεταφέρει κάποια αγαθά από τη τοποθεσία Α στη τοποθεσία Β, ενώ δεν υπάρχει καµία εταιρία µεταφορών που δραστηριοποιείται άµεσα µεταξύ αυτών των δύο τοποθεσιών. Εάν υποτεθεί ότι δύο διαθέσιµοι µεταφορείς Χ και Υ

94 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος έχουν προγραµµατισµένα δροµολόγια από την τοποθεσία Α στη Γ και από τη Γ στη Β, αντίστοιχα, είναι προφανές ότι µια πιθανή λύση στο αίτηµα του ανωτέρω πελάτη θα περιλαµβάνει και τις δύο µεταφορικές εταιρίες Χ και Υ. Πρέπει να σηµειωθεί επίσης ότι οι µεταφορείς αυτοί µπορεί να σχετίζονται µε διαφορετικά µεταφορικά µέσα, όπως τρένα, φορτηγά, πλοία, αεροπλάνα, κλπ. Το σύστηµα είναι επίσης ικανό να διαχειριστεί όλες τις απαραίτητες διαδικασίες ναύλωσης και δροµολόγησης στόλου σε ένα µεγάλο εύρος δικτύου µεταφορών. Οι πράκτορές του συνεργάζονται βασιζόµενοι σε καλά ορισµένα επιχειρησιακά πρότυπα, τα οποία µπορούν να χειριστούν αποτελεσµατικά τις διαδικασίες της διαπραγµάτευσης και της αποδοχής των συµβάσεων µεταξύ πελατών και µεταφορικών εταιριών. Τέλος, το σύστηµα ενσωµατώνει σύγχρονες τεχνολογίες ιαδικτύου προκειµένου να εξυπηρετηθούν καλύτερα όλα τα ενδιαφερόµενα µέρη. 4.2 Ανάλυση του συστήµατος Βασικές λειτουργίες Μέσω φιλικών διεπαφών, το προτεινόµενο σύστηµα προσφέρει αρχικά στους χρήστες τη δυνατότητα να συνδεθούν µε τις υπηρεσίες µεταφορών της ηλεκτρονικής αγοράς για να δηλώσουν τον τύπο των υπηρεσιών που ενδιαφέρονται να λάβουν ή να προσφέρουν. Τέτοιες δηλώσεις µπορούν να γίνουν σε διαφορετικό επίπεδο αφαιρετικότητας, ανάλογα µε τις προτιµήσεις των χρηστών. Για παράδειγµα, µια µεταφορική εταιρεία που στοχεύει στην εξυπηρέτηση ενός σχετικού αιτήµατος από έναν πελάτη (πώληση υπηρεσιών), µπορεί να δηλώσει τη συνολική ικανότητά της και το πλήρες δίκτυο των ενεργών δροµολογίων της. Ωστόσο, υιοθετώντας ένα άλλο επίπεδο αφαιρετικότητας, µπορεί απλά να δηλώσει τη διαθέσιµη χωρητικότητα σε µερικά ήδη σχεδιασµένα δροµολόγιά της (ίσως µε ταυτόχρονη µείωση των τιµών των συγκεκριµένων δροµολογίων, στοχεύοντας έτσι στο να προσελκύσει το ενδιαφέρον µελλοντικών πελατών και να αποκοµίσει πρόσθετο κέρδος). Από την άλλη, οι πελάτες µπορούν να υποβάλουν τα αιτήµατά τους σχετικά µε την αγορά µεταφορικών υπηρεσιών. Τα αιτήµατα αυτά µπορούν µε τη σειρά τους να είναι όσο λεπτοµερή επιθυµούν οι πελάτες. Είναι λογικό να αναµένονται περισσότερες λύσεις µεταφορέων µε ένα όχι καλά ορισµένο αίτηµα, ενώ ένα πολύ λεπτοµερές αίτηµα αναµένεται να επιστρέψει µικρότερο αριθµό λύσεων. Όπως σηµειώθηκε προηγουµένως, η διαχείριση όλων των απαραίτητων συναλλαγών είναι βασισµένη στην εκµετάλλευση της τεχνολογίας των ευφυών πρακτόρων. Οι πράκτορες του συστήµατος απεικονίζουν το προφίλ κάθε χρήστη

95 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος µεταφορέα ή πελάτη (user s profile), το οποίο ενηµερώνεται δυναµικά (dynamic update) µέσω των συναλλαγών που ο χρήστης πραγµατοποιεί. Για παράδειγµα, ένας πράκτορας που ενεργεί για έναν ορισµένο πελάτη Χ, θα είναι σε θέση να ξέρει ότι ο πελάτης του ενδιαφέρεται για την επίτευξη του χαµηλότερου κόστους, ανεξάρτητα από το χρόνο παράδοσης, για κάθε αίτηµα µεταφοράς που υποβάλλει. Από την άλλη, ένας άλλος πράκτορας που ενεργεί για έναν πελάτη Υ, γνωρίζει ότι ο πελάτης του ενδιαφέρεται περισσότερο για τους χρόνους παράδοσης και την ασφάλεια των εµπορευµάτων που µεταφέρονται. Οι πράκτορες που αντιπροσωπεύουν τις εταιρείες µεταφορών µπορούν επίσης να δηµιουργήσουν το προφίλ τους, µέσω του οποίου θα δηλώνουν τις προσφερόµενες υπηρεσίες (προορισµοί, δροµολόγια, χωρητικότητα, ιδιαίτερα χαρακτηριστικά κλπ.). Η διαρκής ενηµέρωση των προφίλ των πρακτόρων θα εξυπηρετήσει καλύτερα το «ταίριασµα» (matching) των αιτηµάτων και των προσφορών καθώς επίσης και την ικανότητα λήψης αποφάσεων. Τέλος, οι πράκτορες µπορούν να παραµείνουν ενεργοί στην ηλεκτρονική αγορά για όσο διάστηµα επιθυµούν οι διαχειριστές τους (µόνιµα ή µέχρι να εκπληρωθεί ένα ορισµένο αίτηµα). Η ηλεκτρονική αγορά στην οποία δραστηριοποιείται το προτεινόµενο σύστηµα (Σχήµα 4-1), προσφέρει αποδοτικούς µηχανισµούς για το ταίριασµα των αιτηµάτων και των προσφορών για µεταφορικές συναλλαγές, καθώς επίσης και για την κατασκευή των εφικτών λύσεων (η χρήση αλγορίθµων και τεχνικών της Επιχειρησιακής Έρευνας είναι εδώ απαραίτητη, όπως θα δούµε στο κεφάλαιο 5). Τα παραπάνω εκτελούνται µε την βοήθεια δύο πρακτόρων διαφορετικού τύπου: του µεσάζοντα (Βroker) και του κατασκευαστή δροµολογίων (Ιtinerary Βuilder). Από τη στιγµή που θα βρεθεί µια εφικτή λύση, το σύστηµα θα ενηµερώσει δυναµικά τους σχετικούς χρήστες µε τις εναλλακτικές δυνατότητες που βρέθηκαν να καλύπτουν τα αιτήµατά τους. Μια σηµαντική καινοτοµία του συστήµατός µας είναι η ανάπτυξη ενός υβριδικού συστήµατος συστάσεων και υποστήριξης αποφάσεων, µέσω του οποίου οι αγοραστές µπορούν να αξιολογήσουν τις εναλλακτικές λύσεις. Ακριβέστερα, ο υποψήφιος πελάτης θα είναι σε θέση να αξιολογήσει, µέσω ενός συνόλου κριτηρίων (χρόνος παράδοσης, κόστος, ασφάλεια κλπ.), τις εναλλακτικές προσφορές που βρέθηκαν, να εκφράσει τις προτιµήσεις και τους περιορισµούς βάσει των κριτηρίων αυτών, και να κρίνει αναλόγως. Επιπλέον, οι πελάτες µπορούν να τροποποιήσουν µερικά από τα χαρακτηριστικά γνωρίσµατα των προσφορών που λαµβάνουν (π.χ. επιλογή διαφορετικού µεταφορέα, τροποποίηση κριτηρίων), µε στόχο να διαπραγµατευτούν περαιτέρω µε τους µεταφορείς. Μέσω της συνεχούς αλληλεπίδρασης µε τους χρήστες, το σύστηµα θα προτείνει την καλύτερη λύση σύµφωνα µε τις υπάρχουσες πληροφορίες

96 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Σχήµα 4-1: Η προτεινόµενη ηλεκτρονική αγορά. Η ανάπτυξη του συστήµατος βασίζεται στη µεθοδολογία GAIA, µια τεχνική προσανατολισµένη στην ανάλυση και σχεδιασµό πολύ-πρακτορικών συστηµάτων. Σύµφωνα µε τη GAIA, τα πολυ-πρακτορικά συστήµατα αντιµετωπίζονται ως αποτελούµενα από αυτόνοµους πράκτορες που δρουν σε µια οργανωµένη κοινωνία, στην οποία κάθε πράκτορας έχει έναν ή περισσότερους ρόλους ενώ τα πρωτόκολλα αλληλεπίδρασής τους είναι σαφώς ορισµένα [Wooldridge, 2000]. Μέσω της µεθοδολογίας αυτής, οι αναλυτές συστηµάτων έχουν τη δυνατότητα να µεταβούν από το επίπεδο της διατύπωσης των απαιτήσεων στο επίπεδο του λεπτοµερειακού σχεδιασµού και από εκεί απ ευθείας στην υλοποίηση του συστήµατος. Η GAIA «δανείζεται» αρκετή από την ορολογία και τον τρόπο συµβολικής αναπαράστασης από την αντικειµενοστραφή ανάλυση και σχεδιασµό συστηµάτων (object-oriented analysis and design). Εντούτοις όµως, δεν αποτελεί µια απλή απόπειρα εφαρµογής των αντικειµενοστραφών µεθόδων στην ανάπτυξη συστηµάτων βασισµένων σε πράκτορες, αλλά αντίθετα παρέχει ένα προσανατολισµένο σε πράκτορες σύνολο τεχνικών και µεθόδων, µέσω του οποίου ένας αναλυτής µπορεί να κατανοήσει και να µοντελοποιήσει ένα περίπλοκο πρακτορικό σύστηµα [Moraitis et al., 2002]. Ιδιαίτερη έµφαση δίνεται στην προσπάθεια της δηµιουργίας πολυ-πρακτορικών συστηµάτων ως µια διαδικασία οργανωσιακού σχεδιασµού (organisational design) Ρόλοι και αλληλεπιδράσεις Ακολουθώντας τη µεθοδολογία Gaia, ο βασικός στόχος στην ανάλυση του συστήµατός µας ήταν ο προσδιορισµός των ρόλων και ο καθορισµός των ιδιοτήτων τους, που είναι: οι ευθύνες (responsibilities), οι άδειες (permissions), οι

97 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος δραστηριότητες (activities) και τα πρωτόκολλα (protocols). Οι ευθύνες καθορίζουν τη λειτουργία κάθε ρόλου και διαιρούνται σε δύο τύπους: ιδιότητες ύπαρξης (liveness properties), που περιγράφουν τις διαδικασίες που ένας πράκτορας µπορεί να διεκπεραιώσει, και τις ιδιότητες ασφάλειας (safety properties), που δηλώνουν µια κατάσταση που πρέπει να διατηρείται κατά τη διάρκεια του κύκλου εκτέλεσης. Οι άδειες ενός ρόλου προσδιορίζουν τους διαθέσιµους πόρους προκειµένου ένας πράκτορας να πραγµατοποιήσει τα καθήκοντά του. Οι δραστηριότητες ενός ρόλου είναι στόχοι που µπορούν να εκπληρωθούν από έναν πράκτορα χωρίς αλληλεπίδραση µε άλλους πράκτορες. Τέλος, τα πρωτόκολλα ενός ρόλου, καθορίζουν τον τρόπο µε τον οποίον ο ρόλος αυτός αλληλεπιδρά µε άλλους. Στην προτεινόµενη ηλεκτρονική αγορά έχουµε προσδιορίσει έξι «σχήµατα» ρόλων (roles schemata) [Karacapilidis et al., 2003; Karacapilidis et al. 2006] (βλ. Σχήµατα 4.2 έως 4.7). Στα σχήµατα αυτά οι δραστηριότητες εµφανίζονται υπογραµµισµένες, ενώ οι τελεστές που χρησιµοποιούνται και οι ερµηνείες τους είναι: x. y, που σηµαίνει το x ακολουθείται από το y, x y, που σηµαίνει συµβαίνει το x ή το y, x ω, που σηµαίνει το x συµβαίνει πολύ συχνά, [x], που σηµαίνει το x είναι προαιρετικό, x y, που σηµαίνει το x και το y επικαλύπτονται. Η συµπεριφορά ενός πελάτη περιλαµβάνει δύο ευδιάκριτους ρόλους, έναν που ενεργεί ως συνδετικός κρίκος (διεπαφή) µε τον πελάτη (CustomerHandler, Σχήµα 4-2), και έναν που βοηθά τον πελάτη στην αξιολόγηση των εναλλακτικών προσφορών και στην επιλογή µίας από αυτές (CustomerDecisionMaker, Σχήµα 4-3). Σύµφωνα µε τους ανωτέρω δύο ρόλους, ένας πελάτης µπορεί: Να υποβάλει ένα αίτηµα ζητώντας µια υπηρεσία µεταφορών, καθώς επίσης να υποβάλει και τα προσωπικά του στοιχεία στην ηλεκτρονική αγορά (στην πραγµατικότητα, στον Broker). Εκτός από τα γενικά στοιχεία επικοινωνίας (όνοµα επιχείρησης, διεύθυνση, τηλέφωνο, κ.λπ.), ένας πελάτης µπορεί να υποβάλει και πρόσθετα στοιχεία σχετικά µε την ίδια την αποστολή φορτίου (δηλ. διεύθυνση παραλαβής και παράδοσης, επιθυµητή ηµεροµηνία παράδοσης, τρόπο και όρους µεταφοράς, καθώς επίσης και σύνολο, βάρος και διαστάσεις του φορτίου που πρόκειται να µεταφερθεί). Να λάβει µια ή περισσότερες προτάσεις µεταφοράς, οι οποίες αντιπροσωπεύουν στην πραγµατικότητα τις λύσεις που ικανοποιούν (πλήρως ή µερικώς) τα αιτήµατά του. Τέτοιες λύσεις πρέπει να έχουν λάβει υπόψη τις προτιµήσεις και τους περιορισµούς (αν έχουν τεθεί). Να αποφασίσει εάν θα δεχθεί ή όχι µια πρόταση. Η αποδοχή ή η απόρριψη µιας πρότασης πρέπει να βασιστεί στην εκτίµηση ενός συνόλου κριτηρίων (τα κριτήρια που λαµβάνονται υπόψη µπορεί να αφορούν στο κόστος, την

98 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος ασφάλεια, τη διάρκεια της ναύλωσης, το χρόνο παράδοσης, κλπ.). Στο πλαίσιο του συστήµατος, αυτό εκτελείται µέσω ενός πολυ-κριτηριακού εργαλείου δηµιουργίας συστάσεων, το οποίο αξιολογεί τις εφικτές προτάσεις και προτείνει την/τις καταλληλότερη/ες στο συγκεκριµένο χρήστη. Να τροποποιήσει το αρχικό αίτηµα µεταφορών (αφού πρώτα έχει εξετάσει τις ληφθείσες προτάσεις), εµπλεκόµενος κατά συνέπεια σε µια διαδικασία διαπραγµάτευσης µε έναν µεταφορέα. Να ενηµερώσει τον αντίστοιχο µεταφορέα για την απόφασή του. Η συµπεριφορά ενός µεταφορέα µπορεί επίσης να διακριθεί σε δύο ρόλους, έναν που χρησιµοποιείται ως διεπαφή µε το µεταφορέα (CarrierHandler, Σχήµα 4-4), και έναν που επιτρέπει στο µεταφορέα να κάνει προτάσεις, ανταποκρινόµενος σε ένα συγκεκριµένο αίτηµα, σύµφωνα µε την πολιτική του (CarrierPolicyManager, Σχήµα 4-5). Ένας µεταφορέας µπορεί: Να υποβάλει µια προσφορά µεταφοράς αγαθών που παρέχει τις λεπτοµέρειες της επιχείρησης, τον αριθµό και τον τύπο των µεταφορικών µέσων, πληροφορίες σχετικά µε τους σταθµούς φόρτωσης και παράδοσης, την ικανότητα µεταφοράς φορτίου, κλπ. Να λαµβάνει ένα αίτηµα µεταφορών από έναν πελάτη. Να αξιολογεί ένα αίτηµα µεταφορών, λαµβάνοντας υπόψη τις παραµέτρους που εξαρτώνται από το φορτίο (τύπος φορτίου, διαστάσεις, προορισµός), την ήδη δεσµευµένη χωρητικότητα των µεταφορικών µέσων του, την πολιτική ως προς τους πελάτες του, κ.λ.π. Να αποκρίνεται στον πελάτη (µέσω του Broker) µε την αποστολή µιας πρότασης. Να ενηµερώνει την ηλεκτρονική αγορά για τις αλλαγές στο «προφίλ» του (αναφορικά µε την χωρητικότητα, τα δροµολόγια, την πολιτική τιµολόγησης, κλπ.). ύο πρόσθετοι ρόλοι, ο µεσίτης (Broker, Σχήµα 4-6) και o κατασκευαστής δροµολογίων (ItineraryBuilder, Σχήµα 4-7), αντιστοιχούν σε δύο άλλα συµβαλλόµενα µέρη, που συµµετέχουν στο προτεινόµενο πλαίσιο ηλεκτρονικής αγοράς. Πιο συγκεκριµένα, ένας µεσίτης ενεργεί ως µεσάζων µεταξύ των πελατών και των µεταφορέων. Ένα τέτοιο συµβαλλόµενο µέρος µπορεί: Να λάβει τις φόρµες αιτήµατος και προτάσεων από τους πελάτες και τους µεταφορείς, αντίστοιχα, και να τα προωθήσει αναλόγως. Να αλληλεπιδράσει µε ένα άλλο συµβαλλόµενο µέρος, δηλαδή τον κατασκευαστή δροµολογίων, προκειµένου να λάβει τα πιθανά «σχήµατα» διαδροµών (αυτά τα σχήµατα µπορούν να περιλαµβάνουν περισσότερους από

99 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος έναν µεταφορείς), για να διαβιβαστούν έπειτα στους εµπλεκόµενους µεταφορείς. Τέλος, ο κατασκευαστής δροµολογίων (ItineraryBuilder) µελετά τα «προφίλ» των µεταφορέων προκειµένου να καθοριστούν οι διαδροµές που ικανοποιούν το αίτηµα ενός πελάτη. O προσδιορισµός των ρόλων των πρακτόρων συνοδεύεται στη συνέχεια από τον καθορισµό του µοντέλου αλληλεπιδράσεων µεταξύ αυτών, όπου γίνεται λεπτοµερής περιγραφή των µηνυµάτων και πληροφοριών που ανταλλάσσονται. Στα Σχήµατα 4-2 έως 4-7 παρουσιάζονται αναλυτικά οι ρόλοι που αναφέρθηκαν στις προηγούµενες παραγράφους. Ρόλος: CustomerHandler (CSH) Περιγραφή: Λαµβάνει την αίτηση µεταφοράς του πελάτη. Πρωτόκολλα και Ενέργειες: AwaitCall, GetCustDetails, GetCustReq, TransportRequest Άδειες (Permissions): διαβάζει παράγει τα παρεχόµενα customerdetails // στοιχεία επικοινωνίας µε τον πελάτη τα παρεχόµενα customerrequirements // απαιτήσεις µεταφοράς transportrequestquote // συµπληρωµένη αναφορά ή nil Υπευθυνότητες (Responsibilities) Ύπαρξης (Liveness): CustomerHandler = AwaitCall. GetCustDetails. (GenerateQuote) ω GenerateQuote = GetCustReq. TransportRequest Ασφαλείας (Safety): customerdetails = µη έγκυρα transportrequestquote =nil customerrequirements = µη έγκυρα transportrequestquote =nil Σχήµα 4-2: Ο ρόλος CustomerHandler. Ρόλος: CustomerDecisionMaker (CDM) Περιγραφή: Αξιολογεί ένα σύνολο εναλλακτικών λύσεων, βάσει µιας σειράς κριτηρίων και προτείνει την βέλτιστη µεταφορική λύση για την αιτούµενη συναλλαγή. Πρωτόκολλα και Ενέργειες: TransportProposal, EvaluateProposal, DecisionMade, InformCustomer, AmendedTransportRequest. Άδειες: διαβάζει proposaldetails // πληροφορίες σχετικά µε µια πρόταση µεταφοράς (αποστέλλονται από τον ρόλο broker) παράγει suggestedsolution // Αναπαριστά την βέλτιστη λύση παράγει amendedproposaldetails // Τροποποιεί ένα ή περισσότερα στοιχεία µιας ληφθείσας πρότασης Υπευθυνότητες Ύπαρξης: CustomerDecisionMaker = (TransportProposal. DecisionProcess) ω DecisionProcess = EvaluateProposal. (DecisionMade. InformCustomer AmendedTransportRequest. CustomerDecisionMaker) Ασφαλείας: true Σχήµα 4-3: Ο ρόλος CustomerDecisionMaker

100 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Ρόλος: CarrierHandler (CRH) Περιγραφή: Αποτελεί τη διεπαφή µεταξύ του συστήµατος και των µεταφορικών εταιρειών. Ενηµερώνει την ηλεκτρονική αγορά σχετικά µε τα στοιχεία ενός µεταφορέα, τις προφορές του, τα δροµολόγια, κτλ. Πρωτόκολλα και Ενέργειες: AwaitCall, RegisterCarrier, GetCarrInfo, GetCarrUpdInfo, UpdateCarrDB Άδειες: διαβάζει carrierregistrationdetails // Στοιχεία επικοινωνίας του µεταφορέα διαβάζει carrierspecificationdetails // πληροφορίες για προσφορές, δροµολόγια, κλπ. ενηµερώνει carrierdb // καταχωρεί έναν µεταφορέα στην Β.. ή ενηµερώνει τα καταχωρηµένα στοιχεία του Υπευθυνότητες Ύπαρξης: CarrierHandler = AwaitCall. RegisterCarrier.(([GetCarrInfo]. [(GetCarrUpdInfo) ω ]) UpdateCarrDB) Ασφαλείας: carrierregistrationdetails = µη έγκυρα quote =nil carrierspecificationdetails = µη έγκυρα quote =nil successful_connection(carrierdb) // Επιτυχής σύνδεση µε τη βάση δεδοµένων των µεταφορέων Σχήµα 4-4: Ο ρόλος CarrierHandler. Ρόλος: CarrierPolicyManager (CPM) Περιγραφή: Καθορίζει την γενική πολιτική του µεταφορέα και προωθεί τις προτάσεις µεταφοράς στον broker. Κάθε στρατηγική λαµβάνει υπόψη της παραµέτρους που αφορούν στο προφίλ του πελάτη, τη συχνότητα των αιτήσεών του, τις πιθανές εκπτώσεις/προσφορές, κ.τ.λ. Πρωτόκολλα και Ενέργειες: ForwardPotRoutes, EvaluateRequest, PartialTransportProposal, DecisionMade, UpdateCarrDB, UpdateCustProfile, InformCarrier Άδειες: διαβάζει potentialrouterequest διαβάζει carrierdb, customerdb ενηµερώνει carrierdb, customerdb παράγει partialproposaldetails // πληροφορίες σχετικά µε µια πρόταση µεταφοράς (αποστέλλονται στον broker) Υπευθυνότητες Ύπαρξης: CarrierPolicyManager = ((ProposalPreparation) ω ProposalImpact) ProposalPreparation = ForwardPotRoutes. MakeProposal MakeProposal = EvaluateRequest. UpdateCustProfile. PartialTransportProposal ProposalImpact = DecisionMade. UpdateCustProfile. UpdateCarrDB. InformCarrier Ασφαλείας: successful_connection(carrierdb) // Επιτυχής σύνδεση µε τη βάση δεδοµένων των µεταφορέων successful_connection(customerdb) // Επιτυχής σύνδεση µε τη βάση δεδοµένων των πελατών Σχήµα 4-5: Ο ρόλος CarrierHandler

101 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Ρόλος: Broker (BRK) Περιγραφή: ρα ως µεσολαβητής µεταξύ πελατών και µεταφορέων. Συνεργάζεται επίσης µε τον πράκτορα ItineraryBuilder, µε σκοπό την ανάκτηση των προτεινόµενων δροµολογίων (Σηµειώνεται ότι κάθε δροµολόγιο µπορεί να σχετίζεται µε ένα σύνολο µεταφορέων). Πρωτόκολλα και Ενέργειες: TransportRequest, AmendedTransportRequest, RetrieveRoutes, PotentialRoutes, ForwardPotRoutes, PartialTransportProposal, PartialProposalSynthesis, TransportProposal Άδειες: διαβάζει requestdetails, amendedrequestdetails παράγει itinerarydetails // πληροφορίες σχετικά µε το δροµολόγιο (αποστέλλονται στον ItineraryBuilder) διαβάζει potentialroutesdetails // σύνολα δεδοµένων της µορφής: (carrier_id,loading_terminal, delivery_terminal) παράγει potentialrouterequest // αποστέλλονται στον CarrierPolicyManager διαβάζει partialproposaldetails παράγει proposaldetails // µετά την σύνθεση των λύσεων διαβάζει suggestedsolution //έχουν αποσταλεί από τον CustomerDecisionMaker Υπευθυνότητες Ύπαρξης: Broker = (TransportRequest AmendedTransportRequest). RetrieveRoutes. (PartialProp) ω. FinalProp PartialProp= (PotentialRoutes. ForwardPotRoutes. PartialTransportProposal) FinalProp = PartialProposalSynthesis. TransportProposal Ασφαλείας: true Σχήµα 4-6: Ο ρόλος Broker. Ρόλος: ItineraryBuilder (ITB) Περιγραφή: Υπεύθυνος για την δηµιουργία εναλλακτικών συνδυασµών δροµολογίων µε σκοπό την ικανοποίηση µιας αίτησης µεταφοράς. Πρωτόκολλα και Ενέργειες: RetrieveRoutes, PotentialRoutes, QueryCarrDB Άδειες: διαβάζει itinerarydetails // πληροφορίες για το δροµολόγιο (στάλθηκε από τον Broker) διαβάζει carrierdb παράγει potentialroutesdetails // // σύνολα δεδοµένων της µορφής: (carrier_id,loading_terminal, delivery_terminal) Υπευθυνότητες Ύπαρξης: ItineraryBuilder = RetrieveRoutes. QueryCarrDB. PotentialRoutes Ασφαλείας: successful_connection(carrierdb) ) // Απαιτείται επιτυχής σύνδεση µε τη βάση δεδοµένων των µεταφορέων Σχήµα 4-7: Ο ρόλος ItineraryBuilder

102 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Μοντέλο αλληλεπιδράσεων Έχοντας προσδιορίσει τους ρόλους των πρακτόρων του συστήµατός µας, επόµενο βήµα αποτελεί ο καθορισµός του µοντέλου των αλληλεπιδράσεων (interactions). Το µοντέλο των αλληλεπιδράσεων παρέχει µια λεπτοµερή περιγραφή της ανταλλαγής πληροφοριών που λαµβάνει χώρα στο σύστηµα ορίζοντας σαφώς τα µηνύµατα που ανταλλάσσονται µεταξύ των πρακτόρων [Wooldride et al., 2000]. Οι αλληλεπιδράσεις του προτεινόµενου συστήµατος φαίνονται συνοπτικά στον Πίνακα 4-1. Πίνακας 4-1: Το µοντέλο αλληλεπιδράσεων Πρωτόκολο Αποστολέας Παραλήπτης Είσοδος Έξοδος TransportRequest CSH BRK TransportProposal BRK CDM DecisionMade CDM BRK, CPM Amended TransportRequest CDM BRK ForwardPotRoutes BRK CPM PartialTransport Proposal CPM BRK custdetails, customer Requirements partialproposal Details Proposal Details Proposal Details potentialroute Details carrierdb, customerdb, potentialroute Request RetrieveRoutes BRK ITB requestdetails PotentialRoutes ITB BRK itinerarydetail s, CarrierDB Transport request Quote Proposal Details Suggested Solution Amended Proposal Details potentialroute Request partialproposal Details Itinerary Details Potential RoutesDetails Σκοπός/ Επεξεργασία Λαµβάνει τα στοιχεία του πελάτη και την αίτηση συναλλαγής και τα προωθεί στον Broker Συνθέτει τις τµηµατικές προτάσεις και προωθεί το αποτέλεσµα στον CustomerDecisionMa ker Ενηµερώνει τον Broker και εν συνεχεία τον CarrierPolicyManager για την απόφαση που έλαβε ο CustomerDecisionMa ker έχεται µια πρόταση του CarrierPolicyManager (µέσω του Broker), την αξιολογεί και τροποποιεί τα χαρακτηριστικά της Προωθεί τα µέρη που αποτελούν την πρόταση στον CarrierPolicyManager Εξετάζει την αίτηση που αποστέλλει ο Broker καθώς και το σχετιζόµενο προφίλ του πελάτη και συνθέτει µια προσωρινή πρόταση Ζητά από τον ItineraryBuilder να συνθέσει εναλλακτικά δροµολόγια για την αίτηση µεταφοράς Εξετάζει τα στοιχεία ενός δροµολογίου (που αντιστοιχεί σε µια αίτηση µεταφοράς) και δηµιουργεί ένα σύνολο εναλλακτικών δροµολογίων που αποστέλλονται στο Broker

103 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος 4.3 Θέµατα σχεδίασης Το µοντέλο των πρακτόρων (agent model) Η αντιστοιχία µεταξύ των ρόλων και των τύπων πρακτόρων είναι συνήθως ένα προς ένα, δεδοµένου ότι κάθε ρόλος αντιστοιχεί σε έναν διαφορετικό τύπο πρακτόρων. Εντούτοις, αυτό δεν είναι απαραίτητο να συµβαίνει πάντα [Wooldridge et al., 2000; Jennings et al., 2000]. Ένας σχεδιαστής θα µπορούσε εύκολα να αντιστοιχίσει διάφορους ρόλους στον ίδιο τύπο πρακτόρων, ορίζοντας έτσι µια πιο σύνθετη συµπεριφορά για τον πράκτορα αυτόν. Στα πλαίσια της εργασίας µας, οι ρόλοι CustomerHandler και CustomerDecisionMaker έχουν συνενωθεί σε έναν ενιαίο τύπο πρακτόρων, που αποκαλείται Customer (πελάτης). Οµοίως, οι ρόλοι CarrierHandler και CarrierPolicyManager σε έναν άλλο ενιαίο τύπο πρακτόρων, που αποκαλείται Carrier (µεταφορέας). Η αντιστοιχία µεταξύ των ρόλων και των τύπων πρακτόρων, γνωστή και ως «µοντέλο πρακτόρων», παρουσιάζεται στο Σχήµα 4-8 (οι τύποι πρακτόρων εµφανίζονται σε τετράγωνα, ενώ οι ρόλοι σε οβάλ σχήµατα). Σχήµα 4-8. Το µοντέλο των πρακτόρων (agent model) Μοντέλο Υπηρεσιών (Services Model) Το µοντέλο υπηρεσιών παρουσιάζει τα καθήκοντα για τα οποία είναι αρµόδιο κάθε συµβαλλόµενο µέρος. Σύµφωνα µε τη µεθοδολογία της Gaia, κάθε υπηρεσία µπορεί να συσχετισθεί µε ένα συγκεκριµένο πρωτόκολλο. Στον Πίνακα 4-2 παρουσιάζεται το µοντέλο υπηρεσιών των πρακτόρων του συστήµατος

104 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Πίνακας 4-2: Το µοντέλο υπηρεσιών Όνοµα Υπηρεσίας Είσοδος Έξοδος Συνθήκη Συνθήκη προεπεξεργασίας µεταεπεξεργασίας έξου την αίτηση µεταφοράς του πελάτη customerdetails, customerrequirements transportrequestquote true transportrequest Quote nil Αξιολόγησε τις εναλλακτικές προτάσεις proposaldetails suggestedsolution, amendedproposaldetails proposals true Ενηµέρωσε την αγορά για τον νέο µεταφορέα carrierregistrationdetails, carrierspecificationdetails carrierdbquote true carrierdbquote nil Αξιολόγησε την αίτηση µεταφοράς potentialrouterequest, carrierdb, customerdb partialproposaldetails customer_credit _history good true Σύνθεσε τις τµηµατικές προτάσεις partialproposaldetails proposaldetails partial proposals true ώσε εναλλακτικές προτάσεις itinerarydetails, carrierdb potentialroutedetails requested loading_terminal exists in carrierdb potentialroutes nil Μοντέλο Γνωριµιών (Acquaintances Model) Υιοθετώντας την τροποποιηµένη µεθοδολογία της GAIA που προτείνεται στο [Moraitis et al., 2002], το «µοντέλο γνωριµιών» των πρακτόρων όχι µόνο διευκρινίζει ποιος πράκτορας αλληλεπιδρά (interacts) µε ποιους, αλλά και ποιος πράκτορας «γνωρίζεται» (is acquainted) µε ποιους. Πίνακας 4-3: Το µοντέλο γνωριµιών (I: Αλληλεπίδραση, A: Γνωριµία) Customer Broker ItineraryBuilder Carrier Customer I Broker A, I A, I A, I ItineraryBuilder A, I Carrier I

105 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Για παράδειγµα, όπως βλέπουµε στον Πίνακα 4-3, ο πράκτορας Broker (µεσίτης) αλληλεπιδρά και γνωρίζει τους Carriers (µεταφορείς), έτσι ώστε να είναι σε θέση να µεταβιβάσει ένα µήνυµα αιτήµατος µεταφοράς σε ένα ορισµένο υποσύνολο τους (αποφεύγοντας την µετάδοση του µηνύµατος στο σύνολο των πρακτόρων). Αντίθετα, οι πράκτορες Carrier και Customer δεν χρειάζεται να διαθέτουν κάποια ιδιαίτερη γνώση για τον πράκτορα Broker, περιοριζόµενοι έτσι σε ρόλο απλής αλληλεπίδρασης µέσω αποστολής προκαθορισµένων µηνυµάτων. 4.4 Ορίζοντας τους πράκτορες ια-πρακτορική επικοινωνία (inter-agent communication) H επικοινωνία µεταξύ των πρακτόρων του συστήµατος υλοποιείται µέσω προκαθορισµένων µεθόδων. Για παράδειγµα, µέσω του ορισµού των αντίστοιχων κλάσεων, οι πράκτορες µπορούν να δηλωθούν µε ένα µοναδικό όνοµα (µέθοδος setname(aid), της κλάσης dfagentdescription), να καταχωρηθούν στη πλατφόρµα της ηλεκτρονικής αγοράς (µέθοδος register(this, dfagentdescription) της κλάσης dfservice), και να επικοινωνήσουν χρησιµοποιώντας τις µεθόδους send(message) και receive(message) (της κλάσης aclmessage), για την αποστολή και τη λήψη µηνυµάτων, αντίστοιχα. Όλα τα µηνύµατα που ανταλλάσσονται µεταξύ των πρακτόρων είναι συµβατά µε τα πρότυπα που έχουν τεθεί από τη FIPA (Foundation for Intelligent Physical Agents) 8 και χρησιµοποιούν τις προδιαγραφές δοµών µηνυµάτων ACL (Agent Communication Language) 9. Ο σωστός καθορισµός των µηνυµάτων ACL είναι πολύ σηµαντικός, δεδοµένου ότι καθορίζει τη συµπεριφορά ενός πράκτορα. Στο Σχήµα 4-9, παρουσιάζεται η βασική διεπαφή ορισµού των ACL µηνυµάτων που ανταλλάσουν οι πράκτορες του συστήµατος

106 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Σχήµα 4-9: Η διεπαφή ορισµού του περιεχοµένου των ACL µηνυµάτων Κάθε ACL µήνυµα είναι αυστηρά ορισµένο, έτσι ώστε να µπορεί να γίνεται κατανοητό από κάθε πράκτορα κατά τη διαδικασία ανταλλαγής µηνυµάτων (συνοµιλία). Κατά τις διάφορες φάσεις λειτουργίας του συστήµατος πραγµατοποιείται ταχύτατα πλήθος ανταλλαγών τέτοιων µηνυµάτων µε σκοπό την υλοποίηση των ρόλων των πρακτόρων. Πρέπει να τονιστεί πως ο ορισµός των διαφόρων παραµέτρων των ACL µηνυµάτων καθώς και το περιεχόµενο του κάθε ενός από αυτά γίνεται προγραµµατιστικά µέσω των µεθόδων που διαθέτει η κάθε κλάση που είναι επιφορτισµένη µε την ανταλλαγή των µηνυµάτων. Τα βασικά πεδία (fields) ενός µηνύµατος είναι συνήθως ο αποστολέας (sender), ο/οι παραλήπτης/ες (receiver/s), το περιεχόµενο (content), το πρωτόκολλο (protocol) που ακολουθείται και το αναγνωριστικό της συνοµιλίας (conversation_id). Κατά τη διάρκεια µιας «συνοµιλίας» µεταξύ των πρακτόρων κάθε πράκτορας είναι προγραµµατισµένος να δέχεται εισερχόµενα ACL µηνύµατα και να επιλέγει το αντίστοιχο πρωτόκολλο συνοµιλίας από τα διαθέσιµα πρωτόκολλα. Το πώς ένας πράκτορας θα αντιδρά στα εισερχόµενα ερεθίσµατα είναι θέµα της «συµπεριφοράς» του, για την οποία θα µιλήσουµε στην επόµενη παράγραφο. Η δια-πρακτορική επικοινωνία καθορίζεται επίσης από τις εισερχόµενες αιτήσεις παροχής υπηρεσιών των χρηστών (users services requests). Κάθε εισερχόµενη αίτηση καθορίζει σε µεγάλο βαθµό µια αλυσιδωτή επικοινωνιακή διαδικασία µεταξύ των πρακτόρων του συστήµατος, οι οποίοι προσπαθούν να εκπληρώσουν τον ρόλο τους και τελικά να ικανοποιήσουν την εισερχόµενη αίτηση. Βασιζόµενα στα µοντέλα των ρόλων και των υπηρεσιών που ορίστηκαν στις

107 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος προηγούµενες παραγράφους, τα Σχήµατα 4-10 και 4-11, παρουσιάζουν τις ενέργειες και τις αλληλεπιδράσεις µεταξύ των χρηστών και των πρακτόρων του συστήµατος. Σχήµα 4-10: Το διάγραµµα ενεργειών µεταξύ χρηστών και πρακτόρων Σχήµα 4-11: Το διάγραµµα αλληλεπιδράσεων µεταξύ χρηστών και πρακτόρων

108 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Συµπεριφορές πρακτόρων (agent behaviours) Ακολουθώντας την προσέγγιση που περιγράφεται στο [Μoraitis et al., 2002], θεωρούµε τα σχήµατα ρόλων της GAIA ως συµπεριφορές πρακτόρων (απλές η σύνθετες). Όπως και στις ανθρώπινες σχέσεις, µια συµπεριφορά δηλώνει τον τρόπο που ο άνθρωπος αποκρίνεται στο περιβάλλον του, π.χ. ενεργώντας µε έναν ιδιαίτερο τρόπο σε συναλλαγές, απαντώντας σε ερωτήσεις, επιλέγοντας µεταξύ εναλλακτικών λύσεων, κλπ [Guttman et al., 1998]. Ο όρος «συµπεριφορά πρακτόρων» εξηγεί πως ένας πράκτορας αποκρίνεται σε ένα εξωτερικό γεγονός, π.χ. όταν ο πράκτορας Broker (µεσίτης) λαµβάνει ένα µήνυµα transportrequest από έναν πράκτορα Customer (πελάτης). Σε επίπεδο σχεδιασµού πληροφοριακών συστηµάτων µια συµπεριφορά ορίζεται µέσω αφαιρετικών κλάσεων (abstract classes) που διευκολύνουν την υλοποίηση των ενεργειών απόκρισης και µετάβασης καταστάσεων. Επίσης, ορίζονται προκαθορισµένες κλάσεις που προσοµοιώνουν διάφορες εναλλακτικές συµπεριφορές. Οι συµπεριφορές των πρακτόρων στο πλαίσιο της ηλεκτρονικής αγοράς µας, προκύπτουν από τις «εκφράσεις ύπαρξης» (liveness expressions) των ρολών, οι οποίες περιγράφηκαν στη παράγραφο Ενδεικτικά παρουσιάζεται παρακάτω η «συµπεριφορά» του πράκτορα ItineraryBuilder από το χρονικό σηµείο της «εγγραφής» του στην πρακτορική κοινότητα, µέχρι την σύνθεση των προτεινόµενων δροµολογίων και την αποστολή τους στον Broker: { πράκτορας ItineraryBuilder ; καταχώρησε(πράκτορας) στην πρακτορική κοινότητα; Πρόσθεσε νέα συµπεριφορά στον πράκτορα ItineraryBuilder; λάβε το ACL µήνυµα obtainroutes από τον Broker; εάν MessageContent = {loadingterminal, deliveryterminal, CustID} τότε { Αναζήτησε στην CarrierDB διαθέσιµα δροµολόγια; Εφάρµοσε τους Αλγόριθµους Εύρεσης Βέλτιστων Λύσεων; Κατασκεύασε την λίστα δροµολογίων (routelist); // Σύνολα τιµών της µορφής: //{loadingterminal, deliveryterminal, CarrierID} εάν (routelist_elements >0) τότε {

109 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος } Αποδέκτης Broker ; respondroutes new ACLMessage.setContent(routeList); στείλε(respondroutes); } αλλιώς { αποδέκτης Broker ; στείλε(respondroutes.setcontent(null)); // κενό µήνυµα } } αλλιώς µπλοκάρισε την συµπεριφορά του πράκτορα; ιαχείριση αποµακρυσµένων βάσεων δεδοµένων Τα περισσότερα διαδικτυακά συστήµατα (web-based systems) απαιτούν πρόσβαση σε διάφορες φάσεις της λειτουργίας τους [Wooldridge, 2002]. Θα πρέπει λοιπόν να αλληλεπιδρούν σε µια βάση δεδοµένων όπου βρίσκονται αποθηκευµένες οι πληροφορίες του συστήµατος. Το σύστηµά µας χρησιµοποιεί για το σκοπό αυτό την τεχνολογία ADO.NET (Active X Data Object) 10 αξιοποιώντας τα προσφερόµενα πρωτόκολλα ανάκτησης και επεξεργασίας δεδοµένων σε δικτυακές βάσεις δεδοµένων. Το ADO.NET προσφέρει µια τεχνική επεξεργασίας δεδοµένων µη προσανατολισµένη στη σύνδεση. Πιο συγκεκριµένα, η σύνδεση µε την βάση δεδοµένων του συστήµατος παραµένει ενεργή µόνο κατά το χρονικό διάστηµα που εξυπηρετείται µια αίτηση επεξεργασίας δεδοµένων, ενώ µετά το πέρας της διαδικασίας µεταβαίνει σε ανενεργή κατάσταση (inactive connection status). Με τον τρόπο αυτό το σύστηµα εξοικονοµεί σηµαντικούς πόρους και παρέχει τη µέγιστη δυνατή ασφάλεια συναλλαγών, αυξάνοντας παράλληλα την απόδοσή του. Επίσης, η αλληλεπίδραση µε τη βάση δεδοµένων γίνεται µέσω της µετατροπής των δεδοµένων στο πρότυπο XML (Extensible Markup Language) 11 κάνοντας έτσι πιο αποτελεσµατική την λειτουργία του και βελτιώνοντας την συµβατότητά του µε άλλα συστήµατα

110 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Σχήµα 4-12: Οι δοµές διαχείρισης δεδοµένων του ADO.NET Η υλοποίηση της βάσης δεδοµένων του συστήµατος, βασίζεται στον Microsoft SQL Server και MS SQL Server Management Console 13. Η ανταλλαγή δεδοµένων υλοποιείται µε δύο βασικά στοιχεία (components): το DataSet και το DataProvider. Το DataSet είναι µια µη προσανατολισµένη στη σύνδεση αναπαράσταση δεδοµένων και βρίσκεται αποθηκευµένη στην µνήµη κάθε φορά που πραγµατοποιείται µια συναλλαγή (transaction) µε τη βάση δεδοµένων του συστήµατος. Το DataSet παραµένει διαθέσιµο στη µνήµη του υπολογιστή πελάτη (client computer) και µπορεί να επεξεργαστεί και να τροποποιηθεί αυτόνοµα. Με το πέρας της επεξεργασίας, η ενηµερωµένη πλέον οµάδα δεδοµένων του DataSet αποθηκεύεται οριστικά στην κεντρική βάση δεδοµένων. Το DataProvider είναι υπεύθυνο για την εγκατάσταση και διατήρηση της σύνδεσης µε τη βάση δεδοµένων όσο αυτή απαιτείται. Το ADO.NET παρέχει τη δυνατότητα εγκατάστασης σύνδεσης µε διαφορετικούς τύπους βάσεων δεδοµένων όπως: MS SQL Server, Oracle, Access, κλπ. Οι βασικές λειτουργίες επιτελούνται µέσω των κλάσεων Connection (εγκαθιστά τη σύνδεση µε τη βάση), Command (εκτελεί τις εντολές προς/από τη βάση), DataReader (ανακτά αναγνώσιµα δεδοµένα) και DataAdapter (τροφοδοτεί ένα DataSet µε δεδοµένα και πραγµατοποιεί την ενηµέρωση της βάσης) BF72-EC2B4AE69191&displaylang=en

111 Κεφάλαιο 4 ο Ανάλυση και Σχεδιασµός του Συστήµατος Λειτουργία των πρακτόρων στο σύστηµα Όπως φαίνεται στο Σχήµα 4-13, οι πράκτορες του συστήµατος ανταλλάσουν τα κατάλληλα µηνύµατα βάσει των σαφώς ορισµένων πρωτοκόλλων επικοινωνίας. Η λειτουργία της πολυ-πρακτορικής κοινότητας δ&iot