Βελτιστοποίηση Πράκτορα Λογισμικού για την Αγορά Ηλεκτρικής Ενέργειας με τεχνικές Particle Swarm Optimization

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Βελτιστοποίηση Πράκτορα Λογισμικού για την Αγορά Ηλεκτρικής Ενέργειας με τεχνικές Particle Swarm Optimization"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΥΠΟΛΟΓΙΣΜΩΝ Βελτιστοποίηση Πράκτορα Λογισμικού για την Αγορά Ηλεκτρικής Ενέργειας με τεχνικές Particle Swarm Optimization Διπλωματική Εργασία της Ελένης Α. Ντάγκα Α.Ε.Μ.: 6706 Υπό την επίβλεψη του Καθηγητή κ. Περικλή Α. Μήτκα ΘΕΣΣΑΛΟΝΙΚΗ 2013

2 2

3 Ευχαριστίες Εφόσον μου δίνεται η ευκαιρία, θα ήθελα να ευχαριστήσω τα άτομα που χωρίς την άμεση και έμμεση βοήθεια τους δε θα μπορούσα να ολοκληρώσω αυτή τη διπλωματική εργασία. Τον Καθηγητή κ. Περικλή Α. Μήτκα για την εμπιστοσύνη που μου επέδειξε κατά την ανάθεση και κατά την διάρκεια της διπλωματικής, καθώς και για την ποιότητα της γνώσης που έλαβα από τον ίδιο παρακολουθώντας τα μαθήματά του. Τον Υποψήφιο Διδάκτορα κ. Αντώνη Χ. Χρυσόπουλο, για το χρόνο του, το ενδιαφέρον του και την πολύτιμη βοήθεια και καθοδήγησή του καθ όλη τη διάρκεια εκπόνησης της εργασίας. Την οικογένεια μου, που όλα αυτά τα χρόνια είναι πάντα δίπλα μου και στηρίζει με κάθε δυνατό τρόπο τις επιλογές μου. Τους φίλους μου, για την στήριξη και την κατανόηση που μου έδειξαν σε όλο το χρονικό διάστημα που χρειάστηκε για να ολοκληρωθεί η εργασία. 3

4 Περίληψη Η ισορροπία μεταξύ της παραγωγής και της ζήτησης της ηλεκτρικής ενέργειας είναι απαραίτητη για τη σταθερότητα και την ποιότητα της Αγοράς Ηλεκτρικής Ενέργειας. Η ισορροπία αυτή διασφαλίζεται μέσω της διαχείρισης των πόρων είτε από την πλευρά της παραγωγής (Supply Side Management) είτε από την πλευρά της ζήτησης (Demand Side Management). Στην πρώτη περίπτωση, η παραγωγή της ηλεκτρικής ενέργειας διαμορφώνεται έτσι ώστε να καλύψει την αυξανόμενη ζήτηση σε περίπτωση ανάγκης. Στην δεύτερη περίπτωση, ο στόχος είναι η παρακίνηση των καταναλωτών να περιορίσουν τη ζήτηση τους σε περιόδους που το κόστος παραγωγής είναι υψηλό ή η διαθεσιμότητα του ηλεκτρισμού είναι χαμηλή, χρησιμοποιώντας κυριως οικονομικά κίνητρα. Προς αυτή την κατεύθυνση, μία προσέγγιση για την επίτευξη της ζητούμενης ισορροπίας είναι η χρήση Πρακτόρων Λογισμικού, οι οποίοι λειτουργούν ως Μεσάζοντες μεταξύ των παραγωγών και των καταναλωτών ηλεκτρικής ενέργειας (Energy Broker Agents). Πιο συγκεκριμένα, οι Μεσάζοντες αλληλεπιδρούν με τους παραγωγούς και τους καταναλωτές προσφέροντας Τιμολόγια (Tariffs) για την αγορά και την πώληση ΗΕ, με στόχο: α) την παρακίνηση των καταναλωτών να προσαρμόσουν τη ζήτηση τους σύμφωνα με τις ανάγκες του συστήματος καθώς και β) την επίτευξη κέρδους. Σκοπός της παρούσας διπλωματικής είναι η βελτιστοποίηση των στρατηγικών ενός Πράκτορα-Μεσάζοντα με στόχο το μέγιστο δυνατό κέρδος, πάντα με γνώμονα της εξατομικευμένες ανάγκες των καταναλωτών/παραγωγών μίας ανταγωνιστικής αγοράς ηλεκτρικής ενέργειας. Η Αγορά Ηλεκτρικής Ενέργειας όπου εφαρμόστηκε και δοκιμάστηκε ο πράκτορας είναι αυτή του διαγωνισμού PowerTAC, η οποία αποτελεί μία πλατφόρμα ρεαλιστικής προσομοίωσης μίας απελευθερωμένης αγοράς ηλεκτρικής ενέργειας. Προς την επίτευξη του σκοπού του πράκτορα, σχεδιάζονται οι ακόλουθες στρατηγικές: α) μια στρατηγική διαμόρφωσης τιμολογίων και β) μία στρατηγική ενημέρωσης αυτών. Οι στρατηγικές αυτές αντιμετωπίζονται ως προβλήματα βελτιστοποίησης όπου στόχος είναι η μεγιστοποίηση του κέρδους του πράκτορα. Το πρόβλημα αυτό επιλύεται σύμφωνα με τον αλγόριθμο Βελτιστοποίησης με Χρήση Σμήνους Σωματιδίων (Particle Swarm Optimization) της περιοχής της Υπολογιστικής Νοημοσύνης. Τα αποτελέσματα είναι αρκετά ενθαρρυντικά ενώ υπάρχουν πολλές δυνατότητες επέκτασης στο μέλλον. Λέξεις Κλειδιά: Μεσάζοντες Ηλεκτρικής Ενέργειας, Particle Swarm Optimization (PSO), Τιμολόγια Ηλεκτρικής Ενέργειας, Απόκριση Ζήτησης, Ευφυή Δίκτυα, Power TAC. 4

5 Abstract Software Agent Optimization for the Energy Market using Particle Swarm Optimization Techniques In order to ensure the stability and the quality of the Energy Market, a balance between the production and consumption of electricity, needs to be established. Such balance is realised either through Supply Side Management or Demand Side Management. In the first case, the energy production is adapting to cover any increased demand, in case of need. On the other hand, in the case of Demand Side Management, the ultimate goal is the consumers inducement to reduce their demand in periods where the production cost is high or the energy available limited, through economic incentives. To that cause, an approach to achieve the required balance is the use of Software Agents, who take the role of a Broker between producers and consumers. More specifically, the broker agent interacts with the producers and consumers by offering Tariffs, in order to buy or sell energy, respectively, while at the same time he: a) tries to persuade the customers into changing their consumption/production pattern and b) make profit. The scope of this thesis is to optimize the strategies that the aforementioned broker-agent has to follow in order to achieve maximum profit, always considering the customized needs of his customers within a competitive energy market. The Energy Market in which the agent was developed and tested is the platfrorm of the PowerTAC competition, which is a realistic simulation platform of a liberalised energy market. For the attainment of the agent s objective, two types of strategies were implemented: a) a tariff formation strategy and b) a tariff update strategy. Both strategies are confronted as optimization problems, where the objective is the broker s maximum profit. To solve this problem, Particle Swarm Optimization techniques, from the field of Computational Intelligence, were adopted. The results look very promising and there is a great future work potential based on them. Keywords: Energy Brokers, Particle Swarm Optimization (PSO), Electricity Tariffs, Demand Response, Smart Grid, Power TAC. 5

6 Στοιχεία Συγγραφέα Η Ελένη Ντάγκα είναι προπτυχιακή φοιτήτρια του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών της Πολυτεχνικής Σχολής του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης. Διεύθυνση: Κωνσταντινουπόλεως 8, 54640, Θεσσαλονίκη Ηλεκτρονική Διεύθυνση: 6

7 Πίνακας Περιεχομένων Ευχαριστίες... 3 Περίληψη... 4 Abstract... 5 Στοιχεία Συγγραφέα... 6 Πίνακας Περιεχομένων... 7 Λίστα Σχημάτων Λίστα Πινάκων Συντομογραφίες Κεφάλαιο 1 Εισαγωγή Γενικά Ορισμός του προβλήματος Σκοπός και Στόχος της Διπλωματικής Οργάνωση κεφαλαίων Κεφάλαιο 2 Θεωρητικό Υπόβαθρο Ευφυές Δίκτυο (Smart Grid) Απόκριση Ζήτησης (Demand Response) Ορισμός Κατηγορίες Προγραμμάτων Απόκρισης Ζήτησης Πλεονεκτήματα και μειονεκτήματα Μελέτη τιμολογίων Ηλεκτρικής Ενέργειας Fixed Rate Tariff (FRT) Increasing Block Tariff (IBT) Time of Use Tariff (TOU) Critical Peak Pricing (CPP) Real Time Pricing (RTP)

8 2.3.6 Two-Part Real Time Pricing Distributed Generation Tariffs Διμερείς Δημοπρασίες Γενικά Βασικές έννοιες Μικροοικονομική θεωρία Στοιχεία δομής Στοιχεία συμπεριφοράς Στρατηγική Μηδενικής Ευφυΐας Στρατηγική Επιπρόσθετης Μηδενικής Ευφυΐας Στρατηγική Roth-Erev Στρατηγική Gjerstad-Dickhaut Προβλήματα Βελτιστοποίησης Τεχνικές Επίλυσης Προβλημάτων Βελτιστοποίησης Τεχνητά Νευρωνικά Δίκτυα Γενετικοί Αλγόριθμοι Ο αλγόριθμος Particle Swarm Optimization Προσομοιωμένη Ανόπτηση Tabu Search Παλαιότερες εργασίες πάνω στο θέμα Εφαρμογές του PSO στον τομέα της Ηλεκτρικής Ενέργειας Κεφάλαιο 3 O Διαγωνισμός Power TAC Γενικά Επισκόπηση του Συστήματος Αρχή Διανομής Λογιστική Αγορά Χονδρικής Πώλησης Ο πράκτορας Broker

9 3.6.1 Περιγραφή ενός τυπικού παιχνιδιού Έναρξη Παιχνιδιού (Competition Starting) Κύκλος Ενεργειών (Activity Cycle) Ολοκλήρωση Παιχνιδιού (Competition Εnding) Τιμολόγια Ηλεκτρικής Ενέργειας Δομή Καταστάσεις Αγορά Πελατών Λιανικής Αξιολόγηση Τιμολογίων Επιλογή Τιμολογίων Κεφάλαιο 4 Περιγραφή Υλοποίησης Ο πράκτορας Θεωρητική ανάλυση και διατύπωση του αλγορίθμου Βελτιστοποίησης με Χρήση Σμήνους Σωματιδίων (Particle Swarm Optimization) Παράμετροι αλγορίθμου Μέγεθος πληθυσμού Συντελεστής V max Συντελεστές επιτάχυνσης (acceleration coefficients) Συντελεστής αδράνειας (inertia weight) Συντελεστές σύσφιξης (constriction coefficients) Clamping factor Τοπολογίες Παραλλαγές του κλασικού αλγορίθμου Fully informed PSO (FIPS) Στρατηγική διαμόρφωσης τιμολογίων Ο Χώρος του Προβλήματος Συνάρτηση Στόχου (Objective Function) Κέρδος Πράκτορα

10 Πιθανότητα Αποδοχής Τιμολογίου Διαμόρφωση αρχικών τιμολογίων Στρατηγική ενημέρωσης τιμολογίων Μερίδιο της Αγοράς με χρήση Ασαφούς Λογικής Μικρό Ποσοστό της Αγοράς (Λίγοι Πελάτες) Μεγάλο Ποσοστό της Αγοράς (Πολλοί Πελάτες) Μέγιστος Αριθμός Τιμολογίων Σύνοψη Αρχιτεκτονική Συστήματος Διαμόρφωσης και Ενημέρωσης Τιμολογίων Κεφάλαιο 5 Πειράματα και Αποτελέσματα Γενικά Οργάνωση Πειραμάτων Μετρικές Αξιολόγησης Υποδομή Λογισμικού και Υλικού Πειράματα ποσοστού αποδοχής Πειράματα παραμέτρων στρατηγικής Πειράματα παραλλαγών αλγορίθμου PSO Πειράματα αριθμού χρεώσεων Πειράματα ψυχολογίας πελατών Πειράματα με περισσότερους αντιπάλους Πειράματα με την προηγούμενη έκδοση του Mertacor Πειράματα παραμέτρων Power TAC Ο διαγωνισμός Power TAC Κεφάλαιο 6 Συμπεράσματα και Μελλοντικές Επεκτάσεις Συμπεράσματα Μελλοντικές Επεκτάσεις Βιβλιογραφία

11 11

12 Λίστα Σχημάτων Σχήμα 2.1: Η ροή ενέργειας και πληροφορίας στο σημερινό σύστημα ενέργειας (πάνω) και σε ένα έξυπνο δίκτυο (κάτω) [105] Σχήμα 2.2: Η επιρροή της ΑΖ στις τιμές ΗΕ [120] Σχήμα 2.3: Τιμολόγιο ΙΒΤ τεσσάρων κατωφλίων της Southern Electricity Edison [15] Σχήμα 2.4: Τιμολόγιο TOU [120] Σχήμα 2.5: Τιμολόγιο CPP [120] Σχήμα 2.6: Τιμολόγιο RTP [120] Σχήμα 2.7: Two-part RTP τιμολόγηση [50] Σχήμα 2.8: Καμπύλες προσφοράς και ζήτησης με σήραγγα ποσότητας Σχήμα 2.9: Καμπύλες προσφοράς και ζήτησης με σήραγγα τιμής Σχήμα 2.10: Πρόβλημα ελαχιστοποίησης (α) και πρόβλημα μεγιστοποίησης (β) Σχήμα 3.1: Κεντρική σελίδα πληροφοριών του διαγωνισμού Σχήμα 3.2: Κύρια μέρη του Power TAC [79] Σχήμα 3.3: Σχέσεις βασικών μερών του Power TAC με τον μεσάζοντα [104] Σχήμα 3.4: Οι αλληλεπιδράσεις των πρακτόρων στην ΑΧΠ για τις τελευταίες 48 ώρες προσομοίωσης, όπως φαίνονται στο γραφικό περιβάλλον του διαγωνισμού Σχήμα 3.5: Κύκλος ενεργειών πράκτορα κατά τη διάρκεια ενός timeslot [79] Σχήμα 3.6: Το σύνολο των αλληλεπιδράσεων κάθε πράκτορα στη διάρκεια ενός παιχνιδιού, όπως παρουσιάζεται στο γραφικό περιβάλλον του Power TAC Σχήμα 3.7: Δομή Τιμολογίου [79] Σχήμα 3.8: Διάγραμμα καταστάσεων τιμολογίων [79] Σχήμα 3.9: Η ενέργεια που εμπορεύτηκε ένας συγκεκριμένος πελάτης στη διάρκεια του παιχνιδιού και το αντίστοιχο κόστος της, στο γραφικό περιβάλλον του παιχνιδιού Σχήμα 3.10: Το μερίδιο πελατών κάθε πράκτορα για μία συγκεκριμένη στιγμή ενός παιχνιδιού, όπως παρουσιάζεται στο γραφικό περιβάλλον του διαγωνισμού Σχήμα 4.1: Απεικόνιση της ανανέωσης θέσης και ταχύτητας στον αλγόριθμο PSO [54] Σχήμα 4.2: Ο κλασικός αλγόριθμος Particle Swarm Optimization Σχήμα 4.3: PSO με συντελεστή αδράνειας [13] Σχήμα 4.4: α) gbest topology, β) lbest topology [89] Σχήμα 4.5: Ασαφές σύνολο πελατών πράκτορα [136] Σχήμα 4.6: Αλγόριθμος ενημέρωσης τιμολογίων κατανάλωσης για την περίπτωση λίγων καταναλωτών

13 Σχήμα 4.7: Αλγόριθμος ενημέρωσης τιμολογίων παραγωγής για την περίπτωση λίγων παραγωγών Σχήμα 4.8: Αλγόριθμος ενημέρωσης τιμολογίων κατανάλωσης για την περίπτωση πολλών καταναλωτών Σχήμα 4.9: Αλγόριθμος ενημέρωσης τιμολογίων παραγωγής για την περίπτωση πολλών παραγωγών Σχήμα 4.10: Αλγόριθμος διαγραφής τιμολογίων κατανάλωσης Σχήμα 4.11: Αλγόριθμος διαγραφής τιμολογίων παραγωγής Σχήμα 4.12: Κύκλος ενεργειών πράκτορα σε κάθε timeslot, στην αγορά τιμολογίων Σχήμα 4.13: Διάγραμμα κλάσεων συστήματος διαμόρφωσης και ενημέρωσης τιμολογίων του πράκτορα Σχήμα 5.1: Αλγόριθμος δημιουργίας σετ εκπαίδευσης Σχήμα 5.2: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot Σχήμα 5.3: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot Σχήμα 5.4: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot Σχήμα 5.5: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot Σχήμα 5.6: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot Σχήμα 5.7: Μέσο μερίδιο αγοράς σε καταναλωτές τύπου: α) CONS και β) INT CONS, κατά μέσο όρο, σε πειράματα με περισσότερους αντιπάλους, για οικιακούς καταναλωτές και επαγγελματικά γραφεία Σχήμα 5.8: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, και β) INT CONS, κατά μέσο όρο, σε πειράματα με περισσότερους αντιπάλους, για καταναλωτές μεγάλου μεγέθους Σχήμα 5.9: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, β) INT CONS, και γ) PROD, κατά μέσο όρο, σε πειράματα με περισσότερους αντιπάλους, για καταναλωτές μεγάλου μεγέθους και επιπλέον τιμολόγια παραγωγής Σχήμα 5.10: Τα συνολικά κέρδη των πρακτόρων, κατά μέσο όρο, για τα παιχνίδια με περισσότερους αντιπάλους

14 Σχήμα 5.11: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, και β) INT CONS κατά μέσο όρο, σε πειράματα με τον Μ11, για οικιακούς καταναλωτές και επαγγελματικά γραφεία Σχήμα 5.12: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, και β) INT CONS, κατά μέσο όρο, σε πειράματα με τον Μ11, για καταναλωτές μεγάλου μεγέθους Σχήμα 5.13: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, β) INT CONS, και γ) PROD, κατά μέσο όρο, σε πειράματα με τον Μ11, για καταναλωτές μεγάλου μεγέθους και επιπλέον τιμολόγια παραγωγής Σχήμα 5.14: Τα συνολικά κέρδη των πρακτόρων, κατά μέσο όρο, για τα παιχνίδια με την προηγούμενη έκδοση του Mertacor Σχήμα 5.15: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, και β) INT CONS, κατά μέσο όρο, σε πειράματα παραμέτρων Power TAC και πολλούς αντιπάλους Σχήμα 5.16: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, β) INT CONS, και γ) PROD, κατά μέσο όρο, σε πειράματα παραμέτρων Power TAC, πολλούς αντιπάλους και επιπλέον τιμολόγια παραγωγής Σχήμα 5.17: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, και β) INT CONS, κατά μέσο όρο, σε πειράματα παραμέτρων Power TAC, με τον Μ Σχήμα 5.18: Μέσο μερίδιο αγοράς για καταναλωτές τύπου: α) CONS, β) INT CONS και γ) PROD, κατά μέσο όρο, σε πειράματα παραμέτρων Power TAC, πολλούς αντιπάλους και επιπλέον τιμολόγια παραγωγής Σχήμα 5.19: Τα συνολικά κέρδη των πρακτόρων, κατά μέσο όρο, για τα παιχνίδια με τις παραμέτρους του Power TAC και πολλούς αντιπάλους Σχήμα 5.20: Τα συνολικά κέρδη των πρακτόρων, κατά μέσο όρο, για τα παιχνίδια με τις παραμέτρους του Power TAC και τον M Σχήμα 5.21: Αποτελέσματα ανά timeslot από το παιχνίδι με αντίπαλο τον MLLBroker: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.22: Αποτελέσματα ανά timeslot από το παιχνίδι με αντίπαλο τον cwibroker: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.23: Αποτελέσματα ανά timeslot από το παιχνίδι με αντίπαλο τον CrocodileAgent: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.24: Αποτελέσματα ανά timeslot από το παιχνίδι με αντίπαλο τον TacTex: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.25: Αποτελέσματα ανά timeslot από το παιχνίδι με αντίπαλο τον AstonTAC: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS

15 Σχήμα 5.26: Αποτελέσματα ανά timeslot από το παιχνίδι με αντίπαλο τον INAOEBroker02: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.27: Αποτελέσματα ανά timeslot από το παιχνίδι με αντιπάλους τους MLLBroker, AstonTAC και CrocodileAgent: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.28: Αποτελέσματα ανά timeslot από το παιχνίδι με αντιπάλους τους MLLBroker, cwibroker και CrocodileAgent: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.29: Αποτελέσματα ανά timeslot από το παιχνίδι με αντιπάλους τους TacTex, cwibroker και INAOEBroker02: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS Σχήμα 5.30: Αποτελέσματα ανά timeslot από το παιχνίδι με αντιπάλους τους TacTex, cwibroker και MLLBroker: α) κέρδη, β) καταναλωτές τύπου CONS, γ) καταναλωτές τύπου INT CONS

16 Λίστα Πινάκων Πίνακας 2.1: Παραδείγματα τεχνικών επίλυσης προβλημάτων βελτιστοποίησης Πίνακας 2.2: Εφαρμογές PSO στο τομέα της ΗΕ Πίνακας 5.1: Παράμετροι αλγορίθμου PSO Πίνακας 5.2: Πειράματα με βάση την παραλλαγή του αλγορίθμου PSO, για οικιακούς καταναλωτές Πίνακας 5.3: Πειράματα με βάση την παραλλαγή του αλγορίθμου PSO, για τα επαγγελματικά γραφεία Πίνακας 5.4: Συγκεντρωτικά αποτελέσματα πειραμάτων παραλλαγής PSO Πίνακας 5.5: Πειράματα με βάση των αριθμό των χρεώσεων, για οικιακούς καταναλωτές Πίνακας 5.6: Πειράματα με βάση των αριθμό των χρεώσεων, για επαγγελματικά γραφεία Πίνακας 5.7: Συγκεντρωτικά αποτελέσματα πειραμάτων αριθμού χρεώσεων Πίνακας 5.8: Πειράματα παραμέτρου λογικής Πίνακας 5.9: Πειράματα παραμέτρου όχλησης Πίνακας 5.10: Συγκεντρωτικά αποτελέσματα πειραμάτων παραμέτρου λογικής Πίνακας 5.11: Συγκεντρωτικά αποτελέσματα πειραμάτων παραμέτρου όχλησης Πίνακας 5.12: Πειράματα με περισσότερους αντιπάλους, σε οικιακούς καταναλωτές και επαγγελματικά γραφεία Πίνακας 5.13: Πειράματα με περισσότερους αντιπάλους, σε καταναλωτές μεγάλου μεγέθους Πίνακας 5.14: Πειράματα με περισσότερους αντιπάλους, σε καταναλωτές μεγάλου μεγέθους, με επιπλέον τιμολόγια παραγωγής Πίνακας 5.15: Πειράματα με την προηγούμενη έκδοση του Mertacor, σε οικιακούς καταναλωτές και επαγγελματικά γραφεία Πίνακας 5.16: Πειράματα με την προηγούμενη έκδοση του Mertacor, σε καταναλωτές μεγάλου μεγέθους Πίνακας 5.17: Πειράματα με την προηγούμενη έκδοση του Mertacor, σε καταναλωτές μεγάλου μεγέθους, με επιπλέον τιμολόγια παραγωγής Πίνακας 5.18: Πειράματα παραμέτρων Power TAC και πολλούς αντιπάλους Πίνακας 5.19: Πειράματα παραμέτρων Power TAC, πολλούς αντιπάλους και επιπλέον τιμολόγια παραγωγής

17 Πίνακας 5.20: Πειράματα παραμέτρων Power TAC και την προηγούμενη έκδοση του πράκτορα Mertacor Πίνακας 5.21: Πειράματα παραμέτρων Power TAC, την προηγούμενη έκδοση του πράκτορα Mertacor και επιπλέον τιμολόγια παραγωγής Πίνακας 5.22: Κατάταξη Πρακτόρων του της τελικής φάσης του Power TAC

18 Συντομογραφίες btc BYO CBL CPP CPP-F CPP-V CPR ctb DNO DR DSM ED-CPP EDP EPSO FIPS FRT GA GD IBT NLP PHEV PSO RE RTP SSM TOU VPP ZI ZI-C ZIP ZI-U Αγγλικές Broker to customer payment Built - your - own Customer Baseline Load Critical Peak Pricing Fixed Price CPP Variable period CPP Critical Peak Rebate Customer to broker payment Distribution Network Operator Demand Response Demand Side Management Extreme Day CPP Extreme Day Pricing Evolutionary PSO Fully Informed PSO Fixed Rate Tariff Genetic Algorithms Gjerstad - Dickhaut Increasing Block Tariff Non Linear Programming Plug in Hybrid Electric Vehicles Particle Swarm Optimization Roth - Erev Real Time Pricing Supply Side Management Time Of Use Variable Peak Pricing Zero Intelligence Zero Intelligence Constrained Zero Intelligence Plus Zero Intelligence Unconstrained 18

19 ΑΔ ΑΖ ΑΠΕ ΑΧΠ ΓΑ ΔΔ ΔΠ ΗΕ ΛΠ ΠΑ ΣΗΘ ΤΝ ΤΝΔ ΥΝ Ελληνικές Αρχή Διανομής Απόκριση Ζήτησης Ανανεώσιμες Πηγές Ενέργειας Αγορά Χονδρικής Πώλησης Γενετικός Αλγόριθμος Διμερής Δημοπρασία Διανεμημένη Παραγωγή Ηλεκτρική Ενέργεια Λογιστική Παλινδρόμηση Πρωτόκολλο Αγοράς Συμπαραγωγή Ηλεκτρισμού και Θερμότητας Τεχνητή Νοημοσύνη Τεχνητά Νευρωνικά Δίκτυα Υπολογιστική Νοημοσύνη 19

20 Κεφάλαιο 1 Εισαγωγή 1.1 Γενικά Η ηλεκτρική ενέργεια (ΗΕ) αποτελεί κοινωνικό αγαθό, αφού η δυνατότητα χρήσης της αποτελεί, από τα μέσα του εικοστού αιώνα, προϋπόθεση αξιοπρεπούς διαβίωσης για όλους τους πολίτες των σύγχρονων κοινωνιών. Εκτός από την κοινωνική ζωή, η ΗΕ επηρεάζει την ανάπτυξη της οικονομίας σε όλες τις χώρες του κόσμου. Η παραγωγή και εκμετάλλευσή της με ανταγωνιστικούς όρους, οδηγεί με βεβαιότητα σε οικονομική άνθιση. Η κατανάλωση ΗΕ στις αναπτυσσόμενες χώρες αυξάνεται ραγδαία και θα αυξηθεί ακόμα περισσότερο με την αναμενόμενη χρήση ηλεκτρικών οχημάτων (Plug in Hybrid Electric Vehicles (PHEV)) ( [51], [53], [92], [102], [122]). Το υπάρχον σύστημα μεταφοράς ΗΕ, που μας εξυπηρετεί εδώ και δεκαετίες, είναι ήδη καταπονημένο και αντιμετωπίζει σοβαρά προβλήματα, όπως σχετικά υψηλές απώλειες (περίπου 8% της παραγόμενης ενέργειας), διακοπές, βυθίσεις τάσης και υπερφορτίσεις. Τα προβλήματα αυτά, μειώνουν σημαντικά την ποιότητα ρεύματος και την αξιοπιστία. Οι σημερινοί σταθμοί παραγωγής ΗΕ, στηρίζονται, κατά κύριο λόγο, στα ορυκτά καύσιμα (πετρέλαιο, άνθρακας, φυσικό αέριο κ.α.), που είναι μη ανανεώσιμες πηγές ενέργειας και τα αποθέματά τους στη γη καταναλώνονται ταχύτατα. Άμεσο επακόλουθο της ταχύτατης αυτής κατανάλωσης, είναι η λεγόμενη ενεργειακή κρίση, που έχει αναγκάσει 20

21 την παγκόσμια προσοχή να στραφεί στην ανεύρεση εναλλακτικών πηγών ενέργειας, που μπορούν να στηρίξουν μια μακροπρόθεσμη ανάπτυξη της βιομηχανίας [137]. Οι εναλλακτικές πηγές ενέργειας περιλαμβάνουν την αιολική, την ηλιακή, την παλιρροιακή, τη γεωθερμική, την υδροηλεκτρική ενέργεια και τη βιομάζα, οι οποίες ονομάζονται επίσης πράσινες πηγές ενέργειας, γιατί δεν απελευθερώνουν διοξείδιο του άνθρακα (CO2) στην ατμόσφαιρα κατά τη διαδικασία της παραγωγής HE. Η χρήση εναλλακτικών ανανεώσιμων πηγών ενέργειας (ΑΠΕ), θα μπορούσε να βοηθήσει τόσο στην αντιμετώπιση της αυξημένης ζήτησης, όσο και στην αντιμετώπιση των περιβαλλοντικών προβλημάτων που προέρχονται από τη χρήση του ορυκτού άνθρακα. 1.2 Ορισμός του προβλήματος Η συνεχής αύξηση της κατανάλωσης ΗΕ, σε συνδυασμό με τα προβλήματα που αντιμετωπίζει το δίκτυο παροχής της, δημιουργεί την επιτακτική ανάγκη ισορροπίας μεταξύ της παραγωγής και της κατανάλωσης, εχέγγυο της σταθερότητας και της ποιότητας της αγοράς. Η ισορροπία αυτή διασφαλίζεται, μέσω της διαχείρισης πόρων στην πλευρά της παραγωγής - Supply Side Management (SSM) και στην πλευρά της ζήτησης Demand Side Management (DSM). Από την πλευρά του SSM, η ΗΕ διαμορφώνεται έτσι ώστε να καλύψει την αυξανόμενη ζήτηση. Αυτό επιτυγχάνεται, με αναβάθμιση των υποδομών, εγκατάσταση νέων μονάδων ή βέλτιστο προγραμματισμό λειτουργίας των διαθέσιμων ΑΠΕ και εύρεση νέων εναλλακτικών πηγών. Από την πλευρά του DSM, υπάρχουν δύο κύριοι άξονες διαχείρισης: η Ενεργειακή Απόδοση (Energy Efficiency ή Energy Conversation) και η Απόκριση Ζήτησης (Demand Response, DR) [21]. Ο όρος Ενεργειακή Απόδοση, αναφέρεται στη χρήση λιγότερης ενέργειας για την παροχή του ίδιου ή βελτιωμένου επιπέδου υπηρεσιών στον καταναλωτή, με οικονομικά αποδοτικό τρόπο, ενώ ο όρος Απόκριση Ζήτησης, αναφέρεται σε αλλαγές στον τρόπο χρήσης της ΗΕ από τους καταναλωτές, ως απόκριση: α) στις αλλαγές των τιμών της ΗΕ ανά χρονική περίοδο, και β) σε οικονομικά κίνητρα για τη μείωση χρήσης ΗΕ σε περιόδους υψηλών τιμών στη Αγορά Χονδρικής Πώλησης ή όταν απειλείται η αξιοπιστία του συστήματος. 21

22 Η εφαρμογή των παραπάνω τεχνικών διαχείρισης από την μεριά της ζήτησης, δεν είναι δυνατή στο υπάρχον δίκτυο λόγω του μονοπωλιακού καθεστώτος στην αγορά της ΗΕ και της μονής κατεύθυνσης της ροής, τόσο της ΗΕ, όσο και της πληροφορίας κατανάλωσης. Για αυτό το λόγο, η ενεργειακή πολιτική πολλών χωρών, έχει στραφεί προς την απελευθέρωση της αγοράς της ΗΕ, στη μείωση του κόστους παραγωγής, μεταφοράς και διανομής της και στην προώθηση τεχνολογικών καινοτομιών, όπως τα Ευφυή Δίκτυα (Smart Grids). Το Ευφυές Δίκτυο ενσωματώνει τεχνολογίες πληροφοριών και επικοινωνιών στην υποδομή διανομής και παραγωγής, που επιτρέπουν την αμφίδρομη ροή τόσο της ενέργειας όσο και των πληροφοριών. Βασικοί στόχοι ενός Ευφυούς Δικτύου είναι [106]: α) η αύξηση της παραγωγής ΗΕ από ΑΠΕ, β) η μετακίνηση της ζήτησης σε χρονικές περιόδους που η ΗΕ είναι φθηνότερη καθώς και γ) η παραγωγή και πώληση ΗΕ από μικρούς διανεμημένους παραγωγούς όπως μικρά αιολικά πάρκα και οικιακούς ή εμπορικούς καταναλωτές με φωτοβολταϊκά πάνελ. Η αυξημένη πολυπλοκότητα που παρουσιάζει η λειτουργία ενός Ευφυούς Δικτύου, δημιουργεί την ανάγκη για νέους μηχανισμούς ελέγχου της αγοράς ΗΕ. Μία προσέγγιση για την αντιμετώπιση των προκλήσεων που εισάγει ένα Ευφυές Δίκτυο, είναι η εισαγωγή Πρακτόρων Μεσαζόντων HE (Electricity Broker Agents), που προσφέρουν υπηρεσίες Απόκρισης Ζήτησης. Ειδικότερα, ρόλος των πρακτόρων είναι να αγοράζουν ΗΕ από μικρούς διανεμημένους παραγωγούς και να την μεταπωλούν στους καταναλωτές [78]. Οι μεσάζοντες, αλληλεπιδρούν με τους παραγωγούς και τους καταναλωτές μέσω ενός νέου μηχανισμού αγοράς, την Αγορά Τιμολογίων (Tariff Market). Στα πλαίσια αυτής, οι μεσάζοντες δημιουργούν ένα χαρτοφυλάκιο πελατών, παραγωγών και καταναλωτών, μέσω Τιμολογίων (Tariffs) που προσφέρονται για αγορά ή πώληση ΗΕ. Η Αγοράς Τιμολογίων, μέσω ανταμοιβών και κυρώσεων, παρακινεί του πράκτορες να ισορροπούν την προσφορά και τη ζήτηση του χαρτοφυλακίου τους. Οι πράκτορες που κατορθώνουν να διατηρούν ισορροπημένο χαρτοφυλάκιο, αυξάνουν τα κέρδη τους και ταυτόχρονα συμβάλλουν στην σταθερότητα και την αξιοπιστία του δικτύου παροχής ΗΕ. 1.3 Σκοπός και Στόχος της Διπλωματικής Σκοπός της παρούσας διπλωματικής είναι να αναλύσει σε βάθος τις υπηρεσίες Απόκρισης Ζήτησης, και ιδιαίτερα των Τιμολογίων ΗΕ που δύναται να προσφέρει ένας πράκτορας μεσάζοντας. Επιπλέον, επιθυμείται η μελέτη και η κατανόηση του συνόλου των 22

23 στοιχείων που συνθέτουν την αποτελεσματική λειτουργία του πράκτορα, σε μία απελευθερωμένη ανταγωνιστική αγορά ΗΕ. Στόχος της παρούσας διπλωματικής είναι η σχεδίαση και υλοποίηση μίας στρατηγικής διαμόρφωσης τιμολογίων ΗΕ ενός αυτόνομου πράκτορα, που ενεργεί σε μία ανταγωνιστική Αγορά Τιμολογίων, σύμφωνα με τις αρχές της Υπολογιστικής Νοημοσύνης και συγκεκριμένα του αλγόριθμου Βελτιστοποίησης με Χρήση Σμήνους Σωματιδίων (Particle Swarm Optimization). Η στρατηγική αυτή πρέπει να είναι σχεδιασμένη έτσι ώστε με γνώμονα τις εξατομικευμένες ανάγκες του κάθε είδους καταναλωτή παραγωγού, να είναι ικανή να αποφέρει το μέγιστο δυνατό κέρδος στον πράκτορα. 1.4 Οργάνωση κεφαλαίων Η δομή της διπλωματικής είναι η εξής: Κεφάλαιο 2 Θεωρητικό Υπόβαθρο: Στο κεφάλαιο αυτό παρατίθεται μία σύντομη αναφορά σε όλες τις έννοιες που σχετίζονται με τις στρατηγικές διαμόρφωσης και ενημέρωσης τιμολογίων που αναπτύχθηκαν. Πιο συγκεκριμένα, αρχικά παρουσιάζεται η έννοια του Ευφυούς Δικτύου, ώστε να γίνει κατανοητή η φύση της αγοράς ΗΕ στην οποία δρα ο πράκτορας (κεφ.2.1). Έπειτα, παρατίθεται η έννοια της Απόκρισης Zήτησης (κεφ. 2.2) και παρουσιάζονται διάφορα είδη τιμολογίων που έχουν σχεδιαστεί σε πραγματικές αγορές (κεφ. 2.3). Στο κεφάλαιο 2.4, γίνεται μία σύντομη περιγραφή της θεωρίας των Διμερών Δημοπρασιών, πάνω στην οποία στηρίζονται οι πράκτορες που χρησιμοποιήθηκαν ως ανταγωνιστές του πράκτορα μας στην πειραματική διαδικασία της διπλωματικής. Στη συνέχεια, γίνεται μία εισαγωγή στα Προβλήματα Βελτιστοποίησης, αφού ως τέτοιο αντιμετωπίζεται το πρόβλημα διαμόρφωσης τιμολογίων του πράκτορα (κεφ. 2.5), και παρουσιάζονται μερικές από τις πιο δημοφιλείς τεχνικές επίλυσης τους (κεφ. 2.6). Τέλος, γίνεται μια εκτενής αναφορά των τρόπων αντιμετώπισης του προβλήματος διαμόρφωσης τιμολογίων που έχουν αναπτυχθεί μέχρι σήμερα (κεφ. 2.7). Κεφάλαιο 3 Ο Διαγωνισμός Power TAC: Στο κεφάλαιο αυτό παρατίθεται η ανάλυση της πλατφόρμας του Power TAC, στα πλαίσια της οποίας αναπτύχθηκε ο πράκτορας μας. Συγκεκριμένα, γίνεται μία συνοπτική περιγραφή των οντοτήτων που συμμετέχουν στην πλατφόρμα με στόχο την κατανόηση της αγοράς αλλά και την αποσαφήνιση του 23

24 συνόλου των στοιχείων που επηρεάζουν την απόδοση του πράκτορα στα πλαίσια αυτής. Κεφάλαιο 4 Περιγραφή Υλοποίησης: Το κεφάλαιο αυτό αφορά τις στρατηγικές του πράκτορα που υλοποιήθηκαν για την καλύτερη δυνατή λειτουργία του στην Αγορά Τιμολογίων της πλατφόρμας του Power TAC. Συγκεκριμένα, γίνεται αναλυτική περιγραφή: α) του αλγορίθμου Particle Swarm Optimization (κεφ. 4.2) και της στρατηγικής διαμόρφωσης τιμολογίων (κεφ. 4.3), καθώς και β) της στρατηγικής ενημέρωσης τιμολογίων (κεφ. 4.4). Στο τέλος του κεφαλαίου παρατίθεται και μία σύντομη περιγραφή της αρχιτεκτονικής του τμήματος του πράκτορα που είναι υπεύθυνο για την υλοποίηση των παραπάνω στρατηγικών (κεφ. 4.5). Κεφάλαιο 5 Πειράματα και Αποτελέσματα: Στο κεφάλαιο αυτό παρατίθενται όλα τα πειράματα που πραγματοποιήθηκαν στα πλαίσια της παρούσας διπλωματικής. Συγκεκριμένα, αρχικά παρουσιάζονται πειράματα που αφορούν τη ρύθμιση παραμέτρων των στρατηγικών του πράκτορα και στη συνέχεια εκείνα που αφορούν τη μελέτη της απόδοσης του σε διάφορες συνθήκες της αγοράς. Ακόμα, στο κεφάλαιο 5.8, παρουσιάζονται κάποια ενδεικτικά αποτελέσματα από τα παιχνίδια του διαγωνισμού Power TAC 2013 στα οποία συμμετείχε ο πράκτορας μας. Κεφάλαιο 6 Συμπεράσματα και Μελλοντικές Επεκτάσεις: Στο τέλος της διπλωματικής, στο τελευταίο κεφάλαιο, παρατίθενται τα συμπεράσματα, καθώς και προτάσεις για μελλοντική εργασία πάνω στο αντικείμενο. 24

25 Κεφάλαιο 2 Θεωρητικό Υπόβαθρο 2.1 Ευφυές Δίκτυο (Smart Grid) Το Smart Grid ή Ευφυές Δίκτυο (ΕΔ) (όπως συναντάται στην ελληνική βιβλιογραφία) περιλαμβάνει τόσο τα τμήματα της παραγωγής, της μετάδοσης και της διανομής της ΗΕ, όσο και τους τελικούς καταναλωτές/παραγωγούς (Σχήμα 2.1). Για το λόγο αυτό έχει χαρακτηριστεί και ως Internet of Energy [10]. Σχήμα 2.1: Η ροή ενέργειας και πληροφορίας στο σημερινό σύστημα ενέργειας (πάνω) και σε ένα έξυπνο δίκτυο (κάτω) [105]. 25

26 Μέχρι τώρα δεν έχει δοθεί ένας κοινά αποδεκτός ορισμός του ΕΔ. Διάφοροι ορισμοί που υπάρχουν στη βιβλιογραφία διαφέρουν ανάλογα με τον τομέα εφαρμογής και τον τρόπο προσέγγισης του. Ο ορισμός που έχει επικρατήσει στην Ευρώπη, έχει δοθεί από την European Technology Platform for the Electricity Networks of the Future Smart Grids, ένα φορέα της Ευρωπαϊκής Ένωσης, που ιδρύθηκε το 2005 με στόχο την ανάπτυξη των ευρωπαϊκών δικτύων ΗΕ, από το 2020 και μετά. Σύμφωνα με τον ορισμό αυτό [36]: «Ένα Ευφυές Δίκτυο είναι ένα δίκτυο ΗΕ το οποίο έχει τη δυνατότητα να ενσωματώνει έξυπνα τη συμπεριφορά και τις ενέργειες όλων των συνδεδεμένων χρηστών είτε αυτοί είναι παραγωγοί, είτε καταναλωτές είτε και τα δύο με σκοπό να παρέχει αποδοτικά και με ασφάλεια βιώσιμη και οικονομική ηλεκτρική ενέργεια. Χρησιμοποιεί καινοτόμα προϊόντα και υπηρεσίες, μαζί με τεχνολογίες ευφυούς παρακολούθησης, ελέγχου, επικοινωνίας και αυτόματης επιδιόρθωσης, με σκοπό: τη διευκόλυνση της σύνδεσης και της λειτουργίας μονάδων παραγωγής όλων των μεγεθών και τεχνολογιών, τη βελτιστοποίηση της λειτουργίας και της χρήσης των υποδομών του δικτύου, την παροχή περισσοτέρων πληροφοριών, δυνατότητας επιλογής παρόχου και συμμετοχής στη λειτουργία του συστήματος προς τους καταναλωτές, τη σημαντική μείωση των περιβαλλοντικών επιπτώσεων, σε ολόκληρο το σύστημα παροχής ΗΕ, τη διατήρηση της αξιοπιστίας, της ποιότητας και της ασφάλειας εφοδιασμού σε υψηλό επίπεδο του συστήματος παροχής ΗΕ, τη διατήρηση και τη βελτίωση της αποδοτικότητας των υπαρχουσών υπηρεσιών, την ενοποίηση των αγορών σε μία ενιαία ευρωπαϊκή αγορά.» Ένας από τους κύριους σκοπούς του ΕΔ είναι η ανάπτυξη της αμφίδρομης επικοινωνίας μεταξύ των παρόχων και των καταναλωτών ΗΕ, έτσι ώστε να επιτευχθεί η αναμόρφωση της τιμολογιακής πολιτικής. Η χρέωση της κατανάλωσης ΗΕ, θα πρέπει να αντανακλά, αφενός το κόστος παραγωγής και αφετέρου τις πραγματικές ανάγκες των καταναλωτών. Ο σχεδιασμός των τιμολογίων ΗΕ θα πρέπει να είναι τέτοιος, ώστε να δίνεται κίνητρο μείωσης της κατανάλωσης, ή μετατόπισής της, σε περιόδους υψηλού κόστους παραγωγής. 26

27 2.2 Απόκριση Ζήτησης (Demand Response) Ορισμός Σε αποδοτικές αγορές ΗΕ, οι τιμές διαμορφώνονται μέσω πολύπλοκων αλληλεπιδράσεων μεταξύ αγοραστών και πωλητών. Ωστόσο σε πολλές σύγχρονες αγορές ΗΕ, οι περισσότεροι καταναλωτές δεν συμμετέχουν ενεργά στη διαδικασία καθορισμού των τιμών. Άμεσο επακόλουθο των παραπάνω είναι η αστάθειας των τιμών εφόσον αυτές δεν αντιπροσωπεύουν το πραγματικό κόστος της παραγωγής ηλεκτρισμού [66]. Η Απόκριση Ζήτησης (ΑΖ), ή Demand Response, αναφέρεται σε ένα σύνολο στρατηγικών που αποσκοπούν στο να συμπεριλάβουν τον καταναλωτή του ηλεκτρισμού στη διαδικασία του καθορισμού των τιμών. Τα μεταβλητά φορτία που προκύπτουν καθώς οι καταναλωτές προσαρμόζουν την ζήτηση τους στις τιμές της αγοράς, είναι υπεύθυνα για τη μείωση των υπερβολικών τιμών της Αγοράς Χονδρικής Πώλησης (ΑΧΠ) (Wholesale Market). Με άλλα λόγια, ως ΑΖ μπορεί να οριστεί οποιαδήποτε προσπάθεια, βασισμένη σε οικονομικά κίνητρα, δύναται να αυξήσει την ελαστικότητα ζήτησης των αγοραστών [120]. Η ελαστικότητα της ζήτησης μετρά κατά πόσο η ζητούμενη ποσότητα ανταποκρίθηκε στη μεταβολή της τιμής και ορίζεται ως η ποσοστιαία μεταβολή της ποσότητας του αγαθού που ζητείται προς την ποσοστιαία μεταβολή της τιμής του (σχέση 2.1). (2.1) Το αρνητικό πρόσημο οφείλεται στο νόμο της ζήτησης, σύμφωνα με τον οποίο όσο αυξάνεται η τιμή ενός αγαθού, μειώνεται η ποσότητα ζήτησης και αντίστροφα. Όπως φαίνεται στο Σχήμα 2.2, η ΑΖ μπορεί να μεταβάλει την καμπύλη ζήτησης των αγοραστών ως απόκριση στην άνοδο των τιμών. Σκοπός της ΑΖ είναι η μείωση της κατανάλωσης σε κρίσιμες περιόδους για το σύστημα ΗΕ. Οι κρίσιμες περίοδοι είναι οι περίοδοι κατά τη διάρκεια του έτους όπου: 27

28 Σχήμα 2.2: Η επιρροή της ΑΖ στις τιμές ΗΕ [120]. οι τιμές της ΑΧΠ είναι υψηλές, υπάρχει μειωμένο δυναμικό σε εφεδρεία, εμφανίζεται δυσλειτουργία του δικτύου μεταφοράς, εμφανίζονται ακραία καιρικά φαινόμενα και γενικότερα σε περιόδους όπου η αξιοπιστία του συστήματος τίθεται σε κίνδυνο. Με αυτό το τρόπο, η ΑΖ αποτελεί ένα αποδοτικό και ευέλικτο μηχανισμό που εκτός από την αποφυγή δαπανηρών λύσεων όπως η επένδυση σε νέες εγκαταστάσεις παραγωγής ενέργειας, μπορεί να οδηγήσει και σε αυξημένη ασφάλεια και αξιοπιστία διάθεσης της ΗΕ ( [98], [5], [113], [3], [38], [90]) Κατηγορίες Προγραμμάτων Απόκρισης Ζήτησης Τα προγράμματα AZ μπορούν να διακριθούν σε δύο διαφορετικές κατηγορίες: α) βασισμένα σε κίνητρα (Incentive-based DR Programs) και β) βασισμένα σε τιμολογιακές πολιτικές (Price-based DR Programs) ( [5], [44]). Η πρώτη κατηγορία περιλαμβάνει προγράμματα που προσφέρονται στους καταναλωτές μέσω συμβολαίων και παρέχουν οικονομικά κίνητρα (σταθερά ή μεταβαλλόμενα) για την μεταβολή της ζήτησης τους σε κρίσιμες, για το δίκτυο, περιόδους. Σε αυτή την κατηγορία, οι καταναλωτές υποχρεούνται να ανταποκριθούν όταν τους ζητηθεί και σε περίπτωση που δεν το κάνουν, τιμωρούνται με οικονομικές ποινές. Για την αποτίμηση της εξοικονόμησης φορτίου, σε κάθε καταναλωτή αντιστοιχίζεται μια βασική 28

29 κατανάλωση ενέργειας και αποκλίσεις από αυτή την κατανάλωση αντιστοιχούν σε απόκριση του καταναλωτή στο πρόγραμμα. Η δεύτερη κατηγορία περιλαμβάνει τιμολόγια ΗΕ που προσφέρουν χρονικά μεταβαλλόμενες χρεώσεις ώστε να αντανακλούν το κόστος παραγωγής. Αξίζει να σημειωθεί πως σε αυτά τα προγράμματα ΑΖ δεν είναι υποχρεωτική η απόκριση των καταναλωτών. Δηλαδή, οι τελευταίοι ανάλογα με τις ανάγκες τους, δύνανται να μην ανταποκρίνονται στις αντίστοιχες χρεώσεις. Τα προγράμματα αυτής της κατηγορίας βασίζονται στην δυναμική τιμολόγηση και απευθύνονται σε πελάτες που επιθυμούν να προσαρμόσουν το πρότυπο κατανάλωσης τους, με βάση το κόστος της ΗΕ σε πραγματικό χρόνο. Τα διάφορα είδη τέτοιων χρεώσεων θα αναλυθούν εκτενέστερα στη συνέχεια καθώς αποτελούν ένα από τα κύρια αντικείμενα μελέτης της παρούσας διπλωματικής εργασίας Πλεονεκτήματα και μειονεκτήματα Η εφαρμογή προγραμμάτων ΑΖ παρέχει οικονομικά, τεχνικά αλλά και περιβαλλοντικά οφέλη. Τα οικονομικά περιλαμβάνουν: μειώσω των υψηλών τιμολογίων ΗΕ καθυστέρηση ή αναβολή κατασκευής νέων μονάδων παραγωγής και δικτύων μεταφοράς και διανομής [121], και ελάττωση της ανάγκης για αγορά εισαγόμενης ΗΕ από δίκτυα γειτονικών χωρών. Τα τεχνικά οφέλη περιλαμβάνουν: την αύξηση της αξιοπιστίας του συστήματος [49], τη ελάττωση της πιθανότητας εμφάνισης ολικών διακοπών ρεύματος 1 και στη ταχύτερη κάλυψη ξαφνικών αναγκών στο ηλεκτρικό δίκτυο. Τέλος, η ΑΖ μπορεί να συνδράμει στην προστασία του περιβάλλοντος μέσω της ορθολογικής εκμετάλευσης των αποθεμάτων πρωτογενούς ενέργειας. Από την άλλη πλευρά, η υιοθέτηση και η υλοποίηση των προγραμμάτων ΑΖ περιλαμβάνουν κάποια έξοδα για τους καταναλωτές [5]. Πέρα από την προσαρμογή του συνήθους προτύπου κατανάλωσης τους, οι καταναλωτές πρέπει να επενδύσουν στην 1 Επιστήμονες από το EPRI (Electric Power Research Insitute) υποστηρίζουν πως ένας από τους κύριους λόγους που οδήγησαν στην κρίση της Καλιφόρνια [16], ήταν η έλλειψη ΑΖ [41]. 29

30 εγκατάσταση κατάλληλων τεχνολογιών για την παρακολούθηση και διαχείρηση των συσκευών τους. Τέλος, η εκπαίδευση των καταναλωτών σχετικά με τη χρήση των παραπάνω τεχνολογιών είναι ένα ιδιαίτερα σημαντικό ζήτημα, δεδομένου ότι απατούνται επιπλέον πόροι και προσωπικό. 2.3 Μελέτη τιμολογίων Ηλεκτρικής Ενέργειας Fixed Rate Tariff (FRT) Το τιμολόγιο Fixed Rate Tariff (FRT), είναι το απλούστερο αλλά και πιο συνηθισμένο πρόγραμμα τιμολόγησης ΗΕ. Σύμφωνα με αυτό, οι καταναλωτές χρεώνονται για το φορτίο τους σύμφωνα με μία προσυμφωνημένη τιμή ανά KWh ανεξάρτητα από το ύψος του φορτίου και την ώρα της ημέρας [81]. Αυτό το είδος συμβολαίου αφορά κυρίως καταναλωτές που δεν έχουν προβλέψιμη ζήτηση, είναι απρόθυμοι να αναλάβουν οικονομικό ρίσκο ή η κατανάλωση τους είναι τόσο μικρή που άλλοι τύποι συμβολαίων θα τους ήταν ασύμφοροι. Σύμφωνα με τον Hirst ( [59], [2], [60], [58], [1]), η τιμή της ΗΕ για τον τύπο αυτό τιμολογίων, διαμορφώνεται με βάση δύο παράγοντες: το κόστος που απαιτείται κατά μέσο όρο για την μεταφορά της ΗΕ και ένα συντελεστή ασφαλείας σε περίπτωση ακραίων τιμών στην ΑΧΠ. Συνεπώς, όλο το οικονομικό ρίσκο σε σχέση με την τιμή και την ποσότητα της ΗΕ σε πραγματικό χρόνο, αναλαμβάνει ο προμηθευτής. Ακόμα, το συγκεκριμένο είδος τιμολογίων επιτρέπει στις εταιρίες παραγωγής να έχουν σχεδόν εξ ολοκλήρου τον έλεγχο της αγοράς [120]. Μία πιο βελτιωμένη εκδοχή του σταθερού τιμολογίου προβλέπει διαφορετική χρέωση σύμφωνα με την εποχή του χρόνου [120] Increasing Block Tariff (IBT) Το τιμολόγιο Increasing Block Tariff (IBT), αποτελεί μία παραλλαγή του FRT [15]. Σύμφωνα με αυτό προβλέπεται χρέωση κλιμακωτής μορφής, όπου οι καταναλωτές πληρώνουν μια προσυμφωνημένη χαμηλή τιμή μέχρι ένα συγκεκριμένο κατώφλι φορτίου. Σε περίπτωση υπέρβασης του, η χρέωση για το επιπλέον φορτίο είναι ιδιαίτερα ακριβή και ασύμφωρη. 30

31 Υπάρχουν παραλλαγές του τιμολογίου αυτού, όπου προβλέπονται περισσότερα του ενός κατώφλια. Ένα τέτοιο τιμολόγιο με τέσσερα (4) κατώφλια φαίνεται στο Σχήμα 2.3, όπου απεικονίζεται ένα τιμολόγιο της εταιρίας Southern Electricity Edison. Σχήμα 2.3: Τιμολόγιο ΙΒΤ τεσσάρων κατωφλίων της Southern Electricity Edison [15] Time of Use Tariff (TOU) Το τιμολόγιο Time of Use (TOU), είναι το πρώτο τιμολόγιο AZ που χρησιμοποιήθηκε στην Αγορά ΗΕ. Σύμφωνα με αυτό, προβλέπεται διαφορετική χρέωση ανά χρονολογικές ζώνες κατά τη διάρκεια του 24ωρου (Σχήμα 2.4). Οι ζώνες αυτές συνήθως καθορίζονται ώστε να αντικατοπτρίζουν περιόδους αιχμής και μη. Η χρέωση που αντιστοιχεί σε κάθε χρονολογική ζώνη διαμορφώνεται σύμφωνα με το μέσο κόστος παραγωγής και διανομής της ΗΕ. Σχήμα 2.4: Τιμολόγιο TOU [120]. 31

32 Οι χρεώσεις των τιμολογίων TOU, πέρα από τις διακυμάνσεις κατά τη διάρκειας της ημέρας, μπορεί να μεταβάλλονται και κατά τη διάρκεια του έτους. Έτσι οι τιμές αντανακλούν και την εποχιακή επίδραση στους ενεργειακούς πόρους, π.χ. διαθέσιμη υδροηλεκτρική ή αιολική ενέργεια. Συνήθως, τέτοιες χρεώσεις καθορίζονται μερικούς μήνες ή έτη πριν από την εφαρμογή τους. Ωστόσο, ακόμα και στην περίπτωση των TOU τιμολογίων, οι τιμές παραμένουν σταθερές για μεγάλο χρονικό διάστημα και δεν αντικατοπτρίζουν επακριβώς τις διακυμάνσεις των τιμών στην ΑΧΠ. Για παράδειγμα, υπάρχει περίπτωση οι τιμές στην αγορά λιανικής να παραμένουν ίδιες τόσο σε μια πολύ ζεστή μέρα του καλοκαιριού, που η ζήτηση αγγίζει την μέγιστη ετήσια τιμή της, όσο και σε μία λιγότερο ζεστή μέρα της ίδιας εποχής. Οι καταναλωτές στους οποίους απευθύνονται κυρίως τα τιμολόγια αυτά, είναι όσοι μπορούν να μετατοπίσουν την κατανάλωση τους τις βραδινές ή πρώτες πρωινές ώρες, όταν δηλαδή η ζήτηση ΗΕ είναι μειωμένη [81]. Για το λόγο αυτό είναι ευρέως διαδεδομένα σε μεγάλους εμπορικούς και βιομηχανικούς καταναλωτές. Μία παραλλαγή των TOU χρεώσεων, είναι οι Variable Peak Rate [19]. Σύμφωνα με αυτές οι τιμές σε περιόδους μη αιχμής παραμένουν σταθερές, ενώ οι αντίστοιχες τιμές σε περιόδους αιχμής προσδιορίζονται σε ημερήσια βάση, προκειμένου να ανταποκρίνονται στις τιμές της ΑΧΠ Critical Peak Pricing (CPP) Σύμφωνα με το τιμολόγιο Critical Peak Pricing (CPP), οι καταναλωτές χρεώνονται για το φορτίο τους με ιδιαίτερα υψηλές τιμές σε ώρες υψηλής αιχμής (συγκριτικά με τις τιμές της ΑΧΠ) (Σχήμα 2.5) ( [123], [68]). Για τις υπόλοιπες ώρες του 24ωρου, η κατανάλωση τους κοστολογείται σύμφωνα με μία βασική χρέωση, συνήθως τύπου TOU. Ο καταναλωτής ενημερώνεται 24 ώρες πριν για την εφαρμογή ή όχι της επιπλέον CPP χρέωσης, ενώ συνάπτεται συμβόλαιο για τον αριθμό των ημερών που θα ισχύει επιπλέον χρέωση. Συνήθως, οι καταναλωτές που συμμετέχουν σε αυτή τη χρέωση ανταμείβονται με μία έκπτωση στην τιμή ΗΕ στις ώρες εκτός CPP. Αξίζει να σημειωθεί πως οι χρεώσεις CPP αυξάνονται αναλογικά με την αύξηση της ζήτησης ΗΕ σε περιόδους κρίσιμες για το σύστημα, και όχι αναλογικά με την ζήτηση του ίδιου του καταναλωτή. Το γεγονός αυτό δείχνει πως η CPP είναι σαφώς βελτιωμένη 32

33 τιμολογιακή πολιτική σε σχέση με την TOU, αφού η πρώτη είναι άρρηκτα συνδεδεμένη με το πραγματικό κόστος της ΗΕ. αυτές είναι: Σχήμα 2.5: Τιμολόγιο CPP [120]. Έχουν προταθεί διάφορες παραλλαγές του τιμολογίου CPP ( [37], [5]). Μερικές από Extreme Day Pricing (EDP): Το τιμολόγιο EDP, όμοια με το CPP, προβλέπει υψηλότερη χρέωση σε περιόδους αιχμής. Η διαφορά έγκειται στο γεγονός ότι οι υψηλές χρεώσεις EDP βρίσκονται σε ισχύ καθ όλη τη διάρκεια της κρίσιμης ημέρας και ο καταναλωτής ενημερώνεται ένα 24ωρο πριν [21]. Extreme Day CPP (ED-CPP): Οι χρεώσεις ED-CPP, παρόμοια με τις EDP, προβλέπουν 24ώρες CPP χρεώσεις για τις κρίσιμες ημέρες του συστήματος. Η διαφορά έγκειται στο ότι στις ED-CPP, για τις υπόλοιπες μέρες, προβλέπονται σταθερές χρεώσεις [21]. Fixed price CPP (CPP-F): Το τιμολόγιο CPP-F, οι καταναλωτές είναι ενήμεροι για την ακριβή διάρκεια των κρίσιμων περιόδων, αλλά δεν γνωρίζουν εξαρχής την ακριβή μέρα [37]. Variable period CPP (CPP-V): Σύμφωνα με τις χρεώσεις CPP-V, καμία πληροφορία σχετικά με α) τις ημέρες, β) τη διάρκεια, γ) την ώρα έναρξης των κρίσιμων περιόδων παρέχεται εκ ων προτέρων στους καταναλωτές [37]. Variable Peak Pricing (VPP): Το τιμολόγιο VPP προβλέπει προκαθορισμένες χρεώσεις σε περιόδους αιχμής και μη. Ωστόσο οι χρεώσεις σε περιόδους αιχμής υπολογίζονται με βάση τις ημερήσιες τιμές της ΑΧΠ προκειμένου να διατηρείται η σύνδεση της με την Αγορά Λιανικής [37]. Critical Peak Rebate (CPR): Τέλος, το τιμολόγιο CPR μοιάζει με το CPP όμως αντί να υπάρχει επιπλέον χρέωση σε περιόδους αιχμής, οι καταναλωτές παρακινούνται να 33

34 μειώσουν το φορτίο τους λαμβάνοντας μια έκπτωση για κάθε KWh που εξοικονομούν με βάση το λεγόμενο Customer Baseline Load (CBL) 2 που τους αντιστοιχεί [65] Real Time Pricing (RTP) Τα τιμολόγια Real Time Pricing (RTP), αποτελούν τον συνδετικό κρίκο μεταξύ της Λιανικής Αγοράς και της Χονδρικής Αγοράς HE. Οι περισσότεροι οικονομολόγοι είναι πεπεισμένοι πως είναι τα πιο άμεσα και αποτελεσματικά τιμολόγια ΑΖ, ιδανικά για ανταγωνιστικές αγορές ΗΕ [12]. Οι χρεώσεις RTP, αντανακλούν την ωριαία διακύμανση του κόστους παραγωγής και αλλάζουν ανά ώρα (Σχήμα 2.6). Υπάρχει επικοινωνία προμηθευτή και καταναλωτή σε πραγματικό χρόνο καθώς οι χρεώσεις γνωστοποιούνται στους καταναλωτές μία ημέρα ή μία ώρα πριν την εφαρμογή τους. Σχήμα 2.6: Τιμολόγιο RTP [120]. Για παράδειγμα, στην περίπτωση του day-ahead RTP, οι καταναλωτές ενημερώνονται 24 ώρες νωρίτερα για τις εκτιμώμενες τιμές ΗΕ και έτσι έχουν την δυνατότητα είτε να προσαρμόσουν την κατανάλωση τους κατάλληλα, είτε να αντισταθμίσουν το επιπλέον κόστος με άλλα οικονομικά μέσα [120]. Ως εκ τούτου, παρόλο που οι καταναλωτές δεν λαμβάνουν κάποια συγκεκριμένη αμοιβή από τον προμηθευτή για να μειώσουν το φορτίο τους, παρακινούνται να το κάνουν συγκρίνοντας την αξία της ΗΕ με την τιμή στην οποία αυτή πωλείται στην ΑΧΠ [18]. 2 Το φορτίο αυτό προσδιορίζεται σύμφωνα με το πρότυπο κατανάλωσης του καταναλωτή πριν εισέλθει σε κάποιο πρόγραμμα τιμολόγησης. 34

35 Γενικά, οι καταναλωτές που συμμετέχουν σε RTP προγράμματα δεν είναι υποχρεωμένοι να αγοράσουν όλη την HE που χρειάζονται σε τιμές πραγματικού χρόνου. Αντίθετα, έχουν τη δυνατότητα να αγοράσουν το φορτίο που χρειάζονται, για παράδειγμα, πριν από μία κρίσιμη περίοδο του συστήματος, έτσι ώστε να προστατευθούν από τις έντονες διακυμάνσεις των τιμών [17]. Στα τιμολόγια RTP, ένα μεγάλο μέρος το ρίσκου εκχωρείται εξ ολοκλήρου στον πελάτη και για το λόγο αυτό οι προμηθευτές χρεώνουν φθηνότερα τα συμβόλαια αυτού του είδους. Οι πελάτες που επωφελούνται κυρίως από την τιμολόγηση αυτή είναι αυτοί που έχουν σταθερό πρότυπο κατανάλωσης και που επιθυμούν να αγοράζουν μικρές ποσότητες ΗΕ σε χαμηλό κόστος [17]. Τα προγράμματα RTP μπορεί να ωφελήσουν τόσο τους συμμετέχοντες σε αυτά όσο και τους μη [17]. Η μείωση της ζήτησης σε κρίσιμες περιόδους, πέρα από την μείωση του μηνιαίου λογαριασμού των συμμετεχόντων, μακροπρόθεσμα μπορεί να οδηγήσει στην δημιουργία ολοένα και λιγότερων νέων μονάδων παραγωγής. Το γεγονός αυτό ωφελεί το σύνολο των καταναλωτών, αφού τους απαλλάσσει από το κόστος που θα επωμίζονταν σε περίπτωση ανέγερσης νέας μονάδας παραγωγής. Επιπλέον, σε περίπτωση που η αγορά δεν είναι εξ ολοκλήρου ανταγωνιστική, τα τιμολόγια RTP μειώνουν την ικανότητα των παραγωγών να ελέγχουν την αγορά, με αποτέλεσμα μειώσεις τιμών από τις οποίες επωφελούνται όλοι οι καταναλωτές. Ένα παράδειγμα εφαρμογής RTP τιμολογίων αποτελεί μια μελέτη που εξετάσε τα βραχυπρόθεσμα οφέλη από την υιοθέτηση των RTP σε μία προσομοίωση της Αγοράς PJM 3 [62]. Υποστηρίζεται πως εξασφαλίζοντας την συμμετοχή του ενός τρίτου μόνο από το σύνολο των καταναλωτών βελτιώνεται η αποδοτικότητα της αγοράς και περιορίζονται οι μεγάλες διακυμάνσεις σε τιμές και φορτίο. Ταυτόχρονα, παρόλο που το φορτίο αυξάνεται κατά μέσο όρο, τα λειτουργικά κόστη των μονάδων παραγωγής μειώνονται, με τις μονάδες που στηρίζονται στην καύση πετρελαίου να παρουσιάζουν τη μεγαλύτερη μείωση (59% όταν συμμετέχουν όλοι οι καταναλωτές). 3 Πρόκειται για την αγορά ΗΕ που καλύπτει τις περιοχές Pensylvania, New Jersey, Maryland και Delaware. 35

36 2.3.6 Two-Part Real Time Pricing Στα τιμολόγια RTP, όπως αναλύθηκε παραπάνω, οι καταναλωτές υποχρεώνονται να πληρώσουν για το φορτίο τους σε τιμές πραγματικού χρόνου. Οι τιμές αυτές χαρακτηρίζονται από μεγάλες διακυμάνσεις, με αποτέλεσμα μεγάλη μερίδα καταναλωτών να αποφεύγει τα RTP συμβόλαια λόγω του υψηλού οικονομικού ρίσκου που αυτά συνεπάγονται [17]. Ωστόσο, πολλά RTP προγράμματα επιχειρούν να μειώσουν το ρίσκο αυτό, αντιστοιχίζοντας μία βασική κατανάλωση για την οποία η χρέωση είναι συνήθως η αντίστοιχη TOU για κάθε καταναλωτή. Σε περίπτωση που ο καταναλωτής υπερβεί τη βασική αυτή κατανάλωση, πληρώνει την επιπλέον κατανάλωση του σε τιμές RTP. Αντίθετα, αν καταναλώσει λιγότερο επιβραβεύεται με επιστροφή χρημάτων ή έκπτωση στον συνολικό λογαριασμό, πωλώντας ουσιαστικά πίσω στον προμηθευτή την ενέργεια που περισσεύει. Τα προγράμματα τιμολόγησης αυτού του είδους καλούνται Two-Part RTP με CBL 4 [40]. Έτσι οι καταναλωτές έχουν τη δυνατότητα να αντισταθμίσουν τον ρίσκο για ένα μεγάλο μέρος της κατανάλωσης τους, καθώς και να διαχειριστούν αποδοτικά τις διακυμάνσεις στη ζήτηση τους (Σχήμα 2.7). Συγκεκριμένα, ο Borenstein [14] έδειξε πως με την αγορά του εκτιμώμενου φορτίου τους, οι καταναλωτές μπορούν να επιτύχουν μείωση των διακυμάνσεων στο λογαριασμό τους πάνω από 80%. Σχήμα 2.7: Two-part RTP τιμολόγηση [50]. 4 Υπενθυμίζεται ότι το φορτίο αυτό προσδιορίζεται σύμφωνα με το πρότυπο κατανάλωσης του καταναλωτή πριν εισέλθει σε κάποιο πρόγραμμα τιμολόγησης. 36

37 Ωστόσο η κρίση στην Καλιφόρνια [16] ανέδειξε ένα σημαντικό πρόβλημα που μπορεί να προκύψει από την προσέγγιση CBL [17]. Εάν οι καταναλωτές αγοράσουν τη βασική τους κατανάλωση σε τιμή πολύ διαφορετική από την προβλεπόμενη, τότε μπορεί είτε να επιδοτηθούν, είτε να επιβαρυνθούν σε υπερβολικό βαθμό, ανάλογα με το αν η τελική τιμή είναι μεγαλύτερη ή μικρότερη της προβλεπόμενης. Το γεγονός αυτό από μόνο του αποτελεί ζήτημα δικαιοσύνης, όμως στη πράξη δημιουργούνται φαινόμενα άσκησης επιρροής από ομάδες συμφερόντων. Την άνοιξη του 2001, εφαρμόστηκε στην Καλιφόρνια ένα RTP πρόγραμμα με CBL. Οι προβλεπόμενες τιμές RTP αναμενόταν να είναι πολύ υψηλότερες από αυτές που οι καταναλωτές θα πλήρωναν για το CBL. Μόλις οι μεγάλες εταιρίες αντιλήφθηκαν το γεγονός αυτό επιδίωξαν ασκώντας πίεση να εξασφαλίσουν για αυτές υψηλό CBL. Έτσι, παρόλο που η οικονομία της Καλιφόρνια βρισκόταν σε ύφεση, πολλές εταιρίες ισχυριζόμενες υψηλούς ρυθμούς ανάπτυξης, απαιτούσαν μεγαλύτερο CBL σε σχέση με την παλαιότερη κατανάλωση τους. Γίνεται φανερό πως κάθε πρόγραμμα RTP με CBL εμπεριέχει μια άτυπη μεταφορά πληρωμής από ή προς τον πελάτη (όσο η τελική τιμή διαφέρει από την προβλεπόμενη) και για το λόγο αυτό η ορθή εκτίμηση του CBL είναι ιδιαίτερα σημαντική. Για την αποφυγή των προβλημάτων που εισάγει το CBL, προτάθηκε ένα πρόγραμμα τιμολόγησης με όνομα built-your-own (BYO) two-part tariff [17]. Σύμφωνα με αυτό οι καταναλωτές μπορούν να αγοράσουν ένα βασικό φορτίο και να διαθέσουν όσο ποσοστό αυτού επιθυμούν για να αντισταθμίσουν το οικονομικό τους ρίσκο. Το πλεονέκτημα του BYO συγκριτικά με το CBL, είναι πως επειδή το πρώτο πωλείται στους καταναλωτές σε τιμές που καθορίζονται με βάση τις προβλεπόμενες RTP, δεν εισάγει ούτε επιδότηση ούτε επιβάρυνση Distributed Generation Tariffs Η έννοια της Distributed Generation ή Διανεμημένης Παραγωγής (ΔΠ), αναφέρεται σε τεχνολογίες παραγωγής ΗΕ που ανήκουν στους ίδιους τους καταναλωτές, παρά στις επιχειρήσεις κοινής ωφέλειας ή άλλους προμηθευτές. Οι τεχνολογίες αυτές μπορεί να είναι μεγάλες μονάδες παραγωγής που ανήκουν σε μεγάλους βιομηχανικούς καταναλωτές έως μικρές μονάδες που ανήκουν σε μεμονωμένους οικιακούς καταναλωτές (για παράδειγμα φωτοβολταϊκά πάνελ που μερικές φορές παράγουν περισσότερη ενέργεια από όση χρειάζεται ένα νοικοκυριό). 37

38 Με βάση τα παραπάνω έχουν σχεδιαστεί δύο είδη τιμολόγησης που αφορούν πελάτες ΔΠ: Sell-Back και Stand-By χρεώσεις [19]. Οι χρεώσεις Sell-back αφορούν τις τιμές στις οποίες ο πελάτης θα πουλήσει την περίσσεια ενέργεια που παρήγαγε πίσω στο δίκτυο. Οι τιμές αυτές θα πρέπει να διαμορφώνονται με βάση την αξία της ΗΕ τη χρονική στιγμή που πραγματοποιείται η πώληση. Οι χρεώσεις Stand-By αφορούν τις τιμές στις οποίες DG πελάτες θα αγοράσουν ενέργεια από το σύστημα σε περιόδους όπου, για παράδειγμα, λόγω συντήρησης, δεν έχουν την δυνατότητα να παράγουν ΗΕ. 2.4 Διμερείς Δημοπρασίες Στο κεφάλαιο αυτό παρατίθεται μία σύντομη θεωρητική ανάλυση των Διμερών Δημοπρασιών (ΔΔ). Παρόλο που η θεωρία των ΔΔ δεν συνδέεται άμεσα με το θεωρητικό υπόβαθρο στο οποίο στηρίχθηκε η παρούσα διπλωματική, κρίθηκε απαραίτητο να συμπεριληφθεί σε αυτό διότι οι πράκτορες που χρησιμοποιήθηκαν ως αντίπαλοι στην πειραματική διαδικασία έχουν υλοποιηθεί σύμφωνα με αυτή Γενικά Σε αντίθεση με τις μονομερείς δημοπρασίες, όπου υπάρχει ένας πωλητής και πολλοί αγοραστές (ή ένας αγοραστής και πολλοί πωλητές), οι ΔΔ αποτελούνται από πολλαπλούς συμμετέχοντες και των δύο πλευρών που συναγωνίζονται μεταξύ τους για την αγοραπωλησία αγαθών, με αποτέλεσμα την απότομη και απρόβλεπτη μεταβολή των τιμών στα προϊόντα που συναλλάσσονται. Παρόλο που η Θεωρία Δημοπρασιών έχει χρησιμοποιηθεί με αποτελεσματικό τρόπο για τη μοντελοποίηση και επίλυση του προβλήματος των μονομερών δημοπρασιών, η εφαρμογή της στις ΔΔ παραμένει μέχρι και σήμερα δύσκολη έως αδύνατη. Τα παραπάνω στοιχεία, σε συνδυασμό με το ότι οι ΔΔ χρησιμοποιούνται κατ εξοχήν στις αγορές συναλλαγών, όπως είναι τα χρηματιστήρια, τους προσδίδουν ιδιαίτερο ερευνητικό ενδιαφέρον. Στη συνέχεια του υποκεφαλαίου, η θεωρητική ανάλυση των ΔΔ διακρίνεται σε δύο μέρη: α) της δομής και β) της συμπεριφοράς. Το κομμάτι της δομής των ΔΔ αφορά τα πρωτόκολλα και τους κανόνες που διέπουν τις αλληλεπιδράσεις και τις δυνατές κινήσεις των συναλλασσομένων. Με αυτά ελέγχονται κάποια επιθυμητά χαρακτηριστικά όπως το ποιος δικαιούται να είναι αγοραστής και ποιος πωλητής, τι είδους πληροφορία είναι 38

39 διαθέσιμη σε αυτούς, αλλά και τις ενέργειες που έχουν στην διάθεση τους σε κάθε χρονική στιγμή. Το κομμάτι της συμπεριφοράς των ΔΔ αναφέρεται στις αναδυόμενες κινήσεις των εμπορευομένων, όπως αυτές προκύπτουν από τη δομή των δημοπρασιών. Πρόκειται, δηλαδή, για τις στρατηγικές που ακολουθούνται από τους συμμετέχοντες, τον τρόπο με τον οποίον επεξεργάζονται τις πληροφορίες που δέχονται και πως ενεργούν, υποβάλλοντας τις αντίστοιχες προσφορές Βασικές έννοιες Στη συνέχεια παρατίθενται κάποιοι βασικοί ορισμοί που διέπουν τη θεωρία των ΔΔ: Ημέρα εμπορίου (trading day): Είναι η χρονική περίοδος κατά την οποία δίνεται στους εμπορευόμενους το δικαίωμα υποβολής προσφορών. Μετά το πέρας της περιόδου αυτής, το δικαίωμα παύει να ισχύει και η αγορά κλείνει. Γύρος εμπορίου (trading round): Είναι η χρονική περίοδος που μεσολαβεί μεταξύ δύο επιτυχημένων συναλλαγών. Προσφορά αγοράς (bid): Είναι η προσφορά από έναν αγοραστή που περιλαμβάνει την ποσότητα του αγαθού και την τιμή στην οποία θέλει να το αγοράσει. Προσφορά πώλησης (ask): Είναι η προσφορά από ένα πωλητή που περιλαμβάνει την ποσότητα του αγαθού και την τιμή στην οποία θέλει να το πουλήσει. Εξέχουσα προσφορά αγοράς (outstanding bid): Είναι η μέγιστη ενεργή προσφορά αγοράς. Εξέχουσα προσφορά πώλησης (outstanding ask): Είναι η ελάχιστη ενεργή προσφορά πώλησης. Προσφορά (shout): Είναι ένας γενικότερος όρος των προσφορών πώλησης και αγοράς. Εύρος των προσφορών προς πώληση και αγορά (bid-ask spread): Είναι η διαφορά μεταξύ της εξέχουσας προσφοράς αγοράς και της εξέχουσας προσφοράς πώλησης. Μέγιστη τιμή (maximum price): Είναι η μέγιστη επιτρεπόμενη προσφορά πώλησης ή αγοράς. Υιοθετείται κατά την διάρκεια των συναλλαγών ώστε να εξαλείψει τυχόν μεγάλες προσφορές και να επιταχύνει την διαδικασία εμπορίου. 39

40 2.4.3 Μικροοικονομική θεωρία Οι ΔΔ ανήκουν στην κατηγορία των μικροοικονομικών συστημάτων. Η μικροοικονομία (microeconomics) είναι ο κλάδος της οικονομικής επιστήμης που απευθύνεται σε αγορές στις οποίες λαμβάνουν χώρα αγοραπωλησίες αγαθών σε επίπεδο πωλητών και αγοραστών που συνήθως αποτελούν νοικοκυριά ή μικρές επιχειρήσεις. Η μικροοικονομική θεωρία εξετάζει πως οι αποφάσεις των αγοραστών και πωλητών επιδρούν στην προσφορά (supply) και στη ζήτηση (demand) των αγαθών. Η προσφορά και η ζήτηση καθορίζουν την τιμή (price) των αγαθών και η τελευταία την ποσότητα (quantity) που προσφέρεται ή ζητείται. Είναι ευρέως αποδεκτό, ότι σε μια αγορά, όσο υψηλότερη είναι η τιμή του αγαθού ή της υπηρεσίας τόσο χαμηλότερη είναι η ζήτηση, και ταυτόχρονα όσο χαμηλότερη είναι η τιμή τόσο χαμηλότερη είναι η προσφορά. Η προσφορά και η ζήτηση μιας αγοράς μπορούν να παρασταθούν με κατάλληλες καμπύλες, οι οποίες ονομάζονται καμπύλες προσφοράς (supply curve) και ζήτησης (demand curve) αντίστοιχα. Οι καμπύλες αυτές αποτελούν τις γραφικές παραστάσεις της προσφοράς και ζήτησης σε σχέση με την τιμή και τέμνονται στο λεγόμενο (ανταγωνιστικό) σημείο ισορροπίας (competitive equilibrium, CE). Το σημείο ισορροπίας αποτελείται από το ζεύγος της τιμής ισορροπίας και της ποσότητας ισορροπίας,. Το σημείο ισορροπίας σηματοδοτεί το φαινόμενο κατά το οποίο αν η ζήτηση είναι μεγαλύτερη από την προσφορά, η τιμή του αγαθού αυξάνει, με αποτέλεσμα τη μείωση της ζήτησης, αφού δε θα είναι εφικτή η αγορά του αγαθού από κάποιους αγοραστές και κατ επέκταση η αύξηση της προσφοράς, καθώς οι πωλητές έχουν μεγαλύτερο συμφέρον να πουλήσουν σε υψηλότερη τιμή. Αντίστοιχα, αν η προσφορά είναι μεγαλύτερη από τη ζήτηση, η τιμή του αγαθού μειώνεται, με αποτέλεσμα την αύξηση της ζήτησης και παράλληλα τη μείωση της προσφοράς. Συνεπώς, γίνεται προφανές πως ο λόγος που το σημείο ισορροπίας καλείται και ανταγωνιστικό, οφείλεται στο γεγονός ότι ο ίδιος ο ανταγωνισμός των εμπορευόμενων οδηγεί την αγορά στο σημείο αυτό. Σύμφωνα με την κλασσική μικροοικονομική θεωρία, οι τιμές συναλλαγών στις ΔΔ τείνουν να συγκλίνουν στην τιμή ισορροπίας, αφού αυτή αποτελεί στην ουσία την ιδανική τιμή για την εξασφάλιση της μεγιστοποίησης του κέρδους των εμπορευόμενων. Αντίστοιχα, η ποσότητα ισορροπίας, είναι η ιδανική ποσότητα αγαθών που μεγιστοποιεί το κέρδος όλων των εμπλεκομένων. Είναι όμως δυνατό η αγορά να επιτυγχάνει τέτοια 40

41 «ευημερία» για περισσότερες από μία τιμές των προαναφερθέντων μεγεθών. Λόγω της διακριτής φύσης των μονάδων του εμπορεύματος και της συνεχούς φύσης των χρημάτων, σε συνδυασμό με τη μορφή των καμπυλών προσφοράς και ζήτησης, μπορεί να υπάρξει μία σήραγγα ποσότητας (volume tunnel), όπου η ποσότητα ισορροπίας μπορεί να είναι ή (Σχήμα 2.8), ή μία σήραγγα τιμής (price tunnel), όπου η τιμή ισορροπίας θα βρίσκεται στο διάστημα (Σχήμα 2.9). Σχήμα 2.8: Καμπύλες προσφοράς και ζήτησης με σήραγγα ποσότητας. Για να επιτευχθεί μία αγοραπωλησία ή αλλιώς συναλλαγή (exchange), μεταξύ των εμπορευόμενων μερών του συστήματος, απαραίτητη προϋπόθεση είναι αυτή να συμφέρει οικονομικά και τις δύο πλευρές. Σε αυτό το σημείο θα πρέπει να οριστεί η έννοια της οριακής τιμής (limit price). Οριακή τιμή - ή αλλιώς ιδιωτική αξία (private value) - για έναν αγοραστή, αποτελεί η μέγιστη τιμή προσφοράς προς αγορά που επιθυμεί να υποβάλλει και αντίστοιχα, για έναν πωλητή, η ελάχιστη τιμή προσφοράς προς πώληση. Με βάση τις καμπύλες προσφοράς - ζήτησης και την έννοια της οριακής τιμής, διακρίνουμε δύο είδη εμπορευόμενων. Οι αγοραστές με οριακές τιμές μεγαλύτερες ή ίσες από την τιμή ισορροπίας και οι πωλητές με οριακές τιμές μικρότερες ή ίσες από την τιμή ισορροπίας λέγονται ενδοπεριθωριακοί εμπορευόμενοι (intra-marginal ή inframarginal traders). Από την άλλη πλευρά, οι αγοραστές με οριακές τιμές μικρότερες ή ίσες από την τιμή ισορροπίας και οι πωλητές με οριακές τιμές μεγαλύτερες ή ίσες από την τιμή ισορροπίας λέγονται εξωπεριθωριακοί εμπορευόμενοι (extra-marginal traders). Τέλος, οι εμπορευόμενοι με οριακές τιμές ίσες με την τιμή ισορροπίας λέγονται περιθωριακοί εμπορευόμενοι (marginal traders). 41

42 Σχήμα 2.9: Καμπύλες προσφοράς και ζήτησης με σήραγγα τιμής. Στα μικροοικονομικά συστήματα όπως οι ΔΔ, υπάρχει πάντα ένα δημοπράτης (auctioneer) που διαθέτει πλήρη και τέλεια πληροφορία του συστήματος [94]. Ο δημοπράτης έχει γνώση των οριακών τιμών όλων των εμπορευόμενων και καθορίζει πλήρως τις συναλλαγές που θα διεξαχθούν, με κύριο μέλημα του την κοινωνική ευημερία (social welfare). Στόχος του δημοπράτη, σύμφωνα με την παραπάνω προσέγγιση, είναι η επίλυση του προβλήματος του αποτελεσματικού καταμερισμού των πόρων και, ειδικότερα, η μεγιστοποίηση της αντικειμενικής συνάρτησης του κέρδους όλων των εμπλεκομένων. Έτσι, αν υποθέσουμε ότι έχουμε ένα σύνολο αγοραστών και πωλητών, όπου η οριακή τιμή του αγοραστή, η οριακή τιμή του πωλητή,, η τιμή ισορροπίας, τότε η λύση του προβλήματος μεγιστοποίησης δίνεται από την εξίσωση: { ( ) } (2.2) Η λύση του προβλήματος αποτελεσματικού καταμερισμού των πόρων μεγιστοποιεί την αποδοτικότητα της αγοράς (market efficiency) ή αλλιώς την αποδοτικότητα καταμερισμού (allocative efficiency). Ο όρος αυτός εκφράζει το λόγο του πλεονάσματος όλων των εμπορευόμενων προς το μέγιστο δυνατό πλεόνασμα σε έναν καταμερισμό όπου τα κέρδη όλων των εμπορευόμενων μεγιστοποιούνται. Το δεύτερο κριτήριο εκτίμησης της αποτελεσματικότητας της αγοράς είναι ο συντελεστής σύγκλισης (coefficient of convergence),, τον οποίο εισήγαγε ο Smith [119]. Ο συντελεστής σύγκλισης είναι ανάλογος της τυπικής απόκλισης των τιμών των συναλλαγών 42

43 γύρω από την τιμή ισορροπίας και αποτελεί δείκτη της μεταβλητότητας των τιμών στην αγορά (εξίσωση 2.3). (2.3) Ο συντελεστής σύγκλισης και η αποδοτικότητα της αγοράς αποτελούν τα δύο σημαντικότερα κριτήρια εκτίμησης της αποτελεσματικότητας μίας αγοράς ΔΔ Στοιχεία δομής Τα στοιχεία δομής των ΔΔ συνιστούν το Πρωτόκολλο Αγοράς (ΠΑ), δηλαδή τον τρόπο με τον οποίο η αγορά σχεδιάζεται και λειτουργεί για όλους τους εμπορευόμενους. Τα σημαντικά σημεία που καθορίζει το ΠΑ είναι: α) η φύση των προσφορών αγοράς και πώλησης που επιτρέπονται στην αγορά, β) οι πληροφορίες που θα δημοσιεύονται στους αγοραστές και πωλητές, γ) η πολιτική εκκαθάρισης που ορίζει πότε θα συντελείται μια συναλλαγή και δ) η πολιτική τιμολόγησης που ορίζει σε ποια τιμή θα λάβει χώρα η συναλλαγή. Επειδή η ανάλυση των δομικών στοιχείων ξεφεύγει από τα όρια αυτής της διπλωματικής, για μία λεπτομερή ανάλυση ο αναγνώστης παραπέμπεται στην [136] Στοιχεία συμπεριφοράς Το μεγαλύτερο μέρος της έρευνας πάνω στις ΔΔ αναφέρεται στο κομμάτι της συμπεριφοράς τους, στον τρόπο, δηλαδή, με τον οποίον οι συμμετέχοντες επιλέγουν και προσαρμόζουν τις προσφορές τους κατά τη διάρκεια κάθε ημέρας εμπορίου. Αυτός ο τρόπος αναφέρεται ως διαδικασία διαμόρφωσης της τιμής (price formation process). Η ανάγκη αυτή προέκυψε καθώς, όπως αναφέρουν οι Satterthwaite και Williams [112], δεν έχει βρεθεί μία καλά αναπτυγμένη θεωρία που να μπορεί να εξηγήσει πώς οι πράκτορες εισέρχονται στην αγορά και μαθαίνουν από κοινού τις στρατηγικές ισορροπίας. Σύμφωνα με δημοσιεύσεις, η κατηγοριοποίηση των στρατηγικών πλειοδοσίας μπορεί να πραγματοποιηθεί με βάση τα παρακάτω δύο κύρια χαρακτηριστικά: 43

44 Προσαρμοστικότητα (Adaptiveness): Μία στρατηγική καλείται προσαρμοστική όταν ο πράκτορας λαμβάνει υπόψη δεδομένα παλαιότερων γύρων εμπορίου για τη διαμόρφωση των νέων τιμών προσφοράς/αγοράς, κάτι που συνδράμει σε πιο σύνθετες υλοποιήσεις αλλά και πιο αποτελεσματικές. Αντίθετα, μία μη προσαρμοστική (non adaptive) στρατηγική βασίζεται μόνο σε παρόντα δεδομένα, κάτι που σαφώς την κάνει πιο απλή. Ειδική περίπτωση αποτελούν οι στρατηγικές ενισχυτικής μάθησης (reinforcement learning) που χειρίζονται δεδομένα παρελθόντων γύρων εμπορίου, βασίζονται δε στα δικά τους δεδομένα. Για το παρόν κείμενο ορίζονται ως αυτό-προσαρμοστικές (self-adaptive). Προγνωστικότητα (Predictivity): Ανάλογα με το βαθμό στον οποίο οι στρατηγικές επιχειρούν να προβλέψουν την επόμενη κατάσταση της αγοράς διακρίνονται σε προγνωστικές και μη προγνωστικές. Η πρόβλεψη μπορεί να αφορά την τιμή του σημείου ισορροπίας, άλλα στατιστικά στοιχεία της αγοράς, ή ακόμα και τις μελλοντικές κινήσεις των αντιπάλων. Συνήθως, για να επιτευχθεί μία πρόβλεψη είναι απαραίτητο να γίνει χρήση δεδομένων του παρελθόντος, κάτι που σημαίνει ότι μία προγνωστική στρατηγική είναι σίγουρα και προσαρμοστική. Στη συνέχεια ακολουθεί συνοπτική παρουσίαση μερικών από τις γνωστότερες στρατηγικές πλειοδοσίας, που χρησιμοποιούνται στη πειραματική διαδικασία της παρούσας διπλωματικής Στρατηγική Μηδενικής Ευφυΐας Μία από τις σημαντικότερες στρατηγικές πλειοδοσίας είναι η στρατηγική Μηδενικής Ευφυΐας (Zero Intelligence, ZI), η οποία αναπτύχθηκε το 1993 από τους Gode και Sunder [47]. Πρόκειται για μία επιπόλαιη στρατηγική, σύμφωνα με την οποία οι πράκτορες υποβάλλουν προσφορές με τυχαίο τρόπο. Ο πράκτορας που χρησιμοποιεί την στρατηγική ZI δεν είναι προσαρμοστικός, δεν προβλέπει το μέλλον και γενικά δεν χρησιμοποιεί πληροφορίες. Στην βιβλιογραφία εμφανίζονται δύο βασικές υποκατηγορίες: η στρατηγική Μηδενικής Ευφυΐας Απεριόριστου Κεφαλαίου (Zero-Intelligence Unconstrained, ZI-U) και η στρατηγική Μηδενικής Ευφυΐας Περιορισμένου Κεφαλαίου (Zero-Intelligence Constrained, ZI-C). Σύμφωνα με την πρώτη, οι συμμετέχοντες είναι ελεύθεροι να υποβάλλουν 44

45 προσφορές που λαμβάνονται τυχαία από μια ομοιόμορφη κατανομή μεταξύ της ελάχιστης και της μέγιστης τιμής της αγοράς, ακόμα και αν οι προσφορές αυτές συντελούν στην ύπαρξη ζημίας. Η δεύτερη, και περισσότερο ορθολογική, στρατηγική προσθέτει έναν ακόμα περιορισμό, οι αγοραστές να υποβάλλουν προσφορές που λαμβάνονται τυχαία από μία ομοιόμορφη κατανομή στο διάστημα της ελάχιστης τιμής της αγοράς και της οριακής τιμής τους. Αντίστοιχα, οι πωλητές πρέπει να υποβάλλουν προσφορές που λαμβάνονται τυχαία στο διάστημα της οριακής τιμής τους και της μέγιστης αποδεκτής τιμής της αγοράς. Παρά την τυχαιότητα της συγκεκριμένης στρατηγικής, αποτελεί ουσιαστικά μία καλή αρχή για την ανάπτυξη περαιτέρω στρατηγικών, ενώ είναι αξιοσημείωτο ότι μία αγορά ZI πρακτόρων εμφανίζει ικανοποιητικά επίπεδα αποδοτικότητας και ταχύτατη σύγκλιση στο σημείο ισορροπίας [48] Στρατηγική Επιπρόσθετης Μηδενικής Ευφυΐας Τα παραπάνω αποτελέσματα αμφισβήτησαν με μία έρευνά τους οι Cliff και Bruten [24] αποδεικνύοντας μαθηματικά και πειραματικά ότι η μηδενική ευφυΐα δεν επαρκεί για να οδηγήσει τη αγορά στο σημείο ισορροπίας για μη συμμετρικές καμπύλες προσφοράς και ζήτησης. Στα πλαίσια της ίδιας έρευνας προτείνουν μια τροποποίηση της στρατηγικής ZI και την ονομάζουν Στρατηγική Επιπρόσθετης Μηδενικής Ευφυΐας (Zero Intelligence Plus, ZIP). Η λογική της στρατηγικής αυτής στηρίζεται σε κανόνες που μεταβάλλουν το περιθώριο κέρδους 5 (profit margin) κάθε πράκτορα σύμφωνα με το αν αυτός είναι ενεργός ή ανενεργός, την τιμή της τελευταίας υποβληθείσας προσφοράς, τον τύπο της προσφοράς αυτής (αγοράς ή πώλησης) και αν οδήγησε σε συναλλαγή. Ένας πράκτορας θεωρείται ανενεργός όταν έχει ολοκληρώσει όλες τις δυνατές συναλλαγές του κατά τη διάρκεια μίας ημέρας εμπορίου και έχει μόνο τη δυνατότητα να αυξήσει το περιθώριο κέρδους του, αναμένοντας την αρχή της επόμενης ημέρας εμπορίου για να διαπιστώσει αν παραμένει ανταγωνιστικός. Αντίθετα, ένας ενεργός πράκτορας οφείλει να αυξομειώνει το περιθώριο κέρδους του προσαρμόζοντας τη στρατηγική του και προς τις δύο κατευθύνσεις. Κατά την εκκίνηση μιας ημέρας εμπορίου, ένας πράκτορας που ακολουθεί στρατηγική ZIP ξεκινά με μικρό περιθώριο κέρδους. Το περιθώριο αυτό αυξάνεται ή μειώνεται βάση κάποιων κριτηρίων καθ όλη τη διάρκεια της ημέρας και για όσο χρόνο ο 5 Το περιθώριο κέρδους καθορίζει τη διαφορά μεταξύ της οριακής τιμής του πράκτορα και της τιμής της προσφοράς που πρόκειται να υποβάλει. 45

46 πράκτορας αυτός είναι ενεργός. Έτσι, ένας ενεργός αγοραστής επιλέγει να αυξήσει το περιθώριο κέρδους όταν η τιμή του είναι υψηλότερη από την τελευταία επιτυχημένη προσφορά αγοράς, καθώς αντιλαμβάνεται ότι μπορεί να αγοράσει ένα αγαθό σε χαμηλότερη τιμή. Αντίστοιχα, ένας πωλητής αυξάνει το περιθώριο κέρδους όταν η τιμή του είναι χαμηλότερη της τελευταίας επιτυχημένης προσφοράς πώλησης. Μεγαλύτερη προσοχή πρέπει να δοθεί στην περίπτωση της μείωσης. Στο παράδειγμα των αγοραστών, εάν για κάθε αποτυχημένη προσφορά πώλησης γίνεται μείωση του περιθωρίου κέρδους από τους αγοραστές και μόνο, υπάρχει ο κίνδυνος να αποκτήσουν οι πωλητές τη δυνατότητα «ελέγχου» της τάσης των τιμών. Αντίστοιχος κίνδυνος υπάρχει και στην περίπτωση των πωλητών, όπου μπορεί να δοθεί ο «έλεγχος» στους αγοραστές. Για το λόγο αυτό, είναι σημαντικό η μείωση να γίνεται από όλους τους αγοραστές στην περίπτωση που μία προσφορά αγοράς οδηγήσει σε αποτυχημένη συναλλαγή, και αντίστοιχα, η ίδια τακτική να ακολουθείται από τους πωλητές στην περίπτωση μιας αποτυχημένης προσφοράς πώλησης. Στις παραπάνω παρατηρήσεις στηρίζεται η στρατηγική ZIP. Τα βήματα του αλγορίθμου περιγράφονται αναλυτικά από τις παρακάτω εξισώσεις και είναι παρόμοια για τους αγοραστές και τους πωλητές με μερικές διαφορές, που αφορούν κυρίως τις παραμέτρους. Ένας πράκτορας που ακολουθεί στρατηγική ZIP, υπολογίζει την τιμή της επόμενης προσφοράς,, βάσει της οριακής τιμής του,, και του περιθωρίου κέρδους του,, σύμφωνα με την εξίσωση: ( ) (2.4) Όπου για έναν πωλητή είναι, ενώ για έναν αγοραστή ισχύει. Οι D. Cliff και J. Bruten χρησιμοποίησαν ως κανόνα προσαρμογής (ή ενημέρωσης) ή κανόνα εκμάθησης (learning rule) τον κανόνα δέλτα (delta rule) των Widrow-Hoff. Έτσι, κατέληξαν [24] ότι μεταβαίνοντας από τη χρονική στιγμή στην, το περιθώριο κέρδους δίνεται από την εξίσωση 2.5 με τη βοήθεια των 2.6, 2.7, 2.8. (2.5) (2.6) (2.7) 46

47 (2.8) O συντελεστής, που επιρεάζει άμεσα το νέο περιθώριο κέρδους, αρχικοποιείται ως για κάθε. Πέρα από τον συντελεστή των Widrow Hoff, στον υπολογισμό συμμετέχει και ο συντελεστής ορμής (momentum coefficient),, λαμβάνοντας ομοιόμορφα τιμές στο διάστημα. Ο συντελεστής εκμάθησης (learning rate),, που συμμετέχει στον υπολογισμό του συντελεστή, προσδιορίζει το ρυθμό σύγκλισης της προσφοράς στην επιθυμητή τιμή στόχου (target price). Ο συντελεστής επιλέγεται τυχαία και καθορίζει την τίμη στόχου ανάλογα με την προσφορά,. Στην περίπτωση που κριθεί αναγκαία η αύξηση του περιθωρίου κέρδους, ο συντελεστής λαμβάνει τιμές στο διάστημα, ενώ στην περίπτωση μείωσης στο διάστημα. Τέλος, για τον υπολογισμό της τιμής στόχου προστίθεται ο συντελεστή διαταραχής (price perturbation),, που επιλέγεται τυχαία, ακολουθώντας ομοιόμορφη κατανομή στο δίαστημα για αύξηση του ή στο διάστημα στην περίπτωση μείωσης. Μελέτες έδειξαν ότι οι πράκτορες που ακολουθούσαν τη στρατηγική ZIP υπερτερούσαν σημαντικά των πρακτόρων που ακολουθούσαν τη στρατηγική ZI-C, παρατηρώντας τις τιμές των συναλλαγών να συγκλίνουν πολύ γρήγορα στην τιμή ισορροπίας Στρατηγική Roth-Erev Οι Roth και Erev δημιούργησαν μία στρατηγική πλειοδοσίας [111] που μιμείται την ανθρώπινη συμπεριφορά σε παίγνια εκτεταμένης μορφής όπως είναι οι ΔΔ. Υλοποίησαν έναν αλγόριθμο που βασίζεται σε τεχνικές Ενισχυτικής Μάθησης (Reinforcement Learning), σύμφωνα με τον οποίο κάθε πράκτορας λαμβάνει αποφάσεις με γνώμονα το κέρδος του από την πιο πρόσφατη περίοδο εμπορίου. Η στρατηγική αυτή ονομάστηκε Roth-Erev (RE). Κάθε αλγόριθμος ενισχυτικής μάθησης στηρίζεται σε δύο βασικές αρχές, τον νόμο του αποτελέσματος (law of effect) και τον ισχυρό νόμο της εξάσκησης (power law of practice). Σύμφωνα με τον πρώτο, η τάση ολοκλήρωσης μίας ενέργειας πρέπει να ενθαρρύνεται εάν αυτή παράγει θετικά αποτελέσματα (ή να αποθαρρύνεται στην αντίθετη περίπτωση). Σύμφωνα με τον δεύτερο νόμο, ο λογάριθμος του χρόνου αντίδρασης για μία συγκεκριμένη εργασία μειώνεται γραμμικά με τον λογάριθμο του αριθμού προσπαθειών για τη συγκεκριμένη εργασία. 47

48 Λόγω της διμερούς φύσης των παιγνίων που εφαρμόζεται, ο αλγόριθμος RE, εμπεριέχει και δύο επιπλέον αρχές εκμάθησης, το φαινόμενο πειραματισμού (experimentation effect) και το φαινόμενο της αμεσότητας (recency effect). Ο πρώτος νόμος ορίζει πως είναι χρήσιμο να επαναλαμβάνονται παρόμοιες (αλλά όχι ίδιες) επιλογές με τις επικερδείς. Σύμφωνα με τον δεύτερο νόμο, οι πιο πρόσφατες πληροφορίες του πράκτορα θα πρέπει να έχουν μεγαλύτερη βαρύτητα από της παλαιότερες. Με βάση την παραπάνω ανάλυση ο RE χαρακτηρίζεται από τρεις βασικές παραμέτρους: α) την παράμετρο διαβάθμισης (scaling parameter), β) την παράμετρο αμεσότητας (recency parameter) και γ) την παράμετρο πειραματισμού (experimentation parameter), οι οποίες ορίζονται για κάθε πράκτορα. Έστω σύνολο εφικτών τιμών προσφορών (αγοράς ή πώλησης) για έναν RE πράκτορα που καλείται «στρατηγική» και το μέγεθος του συνόλου όλων των δυνατών στρατηγικών. Το σύνολο για κάθε γύρο μπορεί να αλλάζει, οπότε έστω ότι στο γύρο, ο πράκτορας ακολούθησε τη στρατηγική. Στη εκκίνηση του πρώτου γύρου της αγοράς, κάθε πράκτορας χαρακτηρίζεται από μία αρχική τάση (propensity), σύμφωνα με την οποία υποβάλει προσφορές και δίνεται από την εξίσωση: (2.9) Έπειτα, στο γύρο, η τάση για να ακολούθησει ο πράκτορας μια οποιαδήποτε στρατηγική υπολογίζεται από τη σχέση: (2.10) όπου η συνάρτηση εμπειρίας. Η συνάρτηση αυτή λαμβάνει τιμές σύμφωνα με την σχέση: { (2.11) όπου το κέρδος για την κίνηση του πράκτορα. Για την άμεση σύγκριση μεταξύ διαφόρων στρατηγικών, η σχέση 2.10 κανονικοποιείται σύμφωνα με την εξίσωση 2.12, όπου η πιθανότητα επιλογής (choice probability). Το μέγεθος αυτό υπολογίζεται για κάθε j και έπειτα επιλέγεται η στρατηγική με τη μέγιστη πιθανότητα. 48

49 (2.12) Αρχικά, στον πρώτο γύρο, όλες οι δυνατές στρατηγικές έχουν ίδια πιθανότητα επιλογής από τον πράκτορα που δίνεται από την εξίσωση: (2.13) Αν θεωρήσουμε μεταβλητή τέτοια ώστε, οι εκτιμήσεις τιμής για ένα πωλητή και ένα αγοραστή ορίζονται από τις σχέσεις: (2.14) (2.15) όπου η οριακή τιμή του πράκτορα. Η στρατηγική RE μπορεί να χαρακτηριστεί ως: α) προσαρμοστική, αφού χρησιμοποιεί πληροφορίες του παρελθόντος β) μη προγνωστική. Ένα σημαντικό πλεονέκτημα της είναι πως δεν χρειάζεται καμία πληροφορία για την αγορά, πέρα των δικών της κινήσεων. Το γεγονός αυτό την καθιστά ιδανική για παιχνίδια όπου οι πράκτορες δεν διαθέτουν πλήρη γνώση της κατάστασης της αγοράς Στρατηγική Gjerstad-Dickhaut Το 1998, οι Gjerstad και Dickhaut [45] ανέπτυξαν μία νέα προσαρμοστική στρατηγική για το πρόβλημα της εύρεσης της διαδικασίας βέλτιστης διαμόρφωσης τιμής προσφοράς. Η στρατηγική αυτή ονομάστηκε Gjerstad-Dickhaut (GD) και στηρίζεται στη μεγιστοποίηση του λεγόμενου αναμενόμενου κέρδους (expected surplus). Λαμβάνοντας υπόψη τις εξέχουσες προσφορές πώλησης και αγοράς, το αναμενόμενο κέρδος ορίζεται για έναν πωλητή και για έναν αγοραστή από τις σχέσεις: (2.16) (2.17) όπου και ορίζονται οι συναρτήσεις χρησιμότητας (utility functions) του πωλητή και του αγοραστή αντίστοιχα, ενώ τα μεγέθη και αποτελούν τις συναρτήσεις 49

50 Βελτιστοποίηση Πράκτορα Λογισμικού για την Αγορά Ηλεκτρικής Ενέργειας με τεχνικές Particle Swarm Optimization πεποίθησης (belief functions) των πρακτόρων. Η συνάρτηση πεποίθησης των πωλητών είναι φθίνουσα και των αγοραστών είναι αύξουσα. Η συνάρτηση χρησιμότητας ενός πράκτορα, στη γενική της μορφή, ορίζεται για κάθε προσφορά. Στα πλαίσια της στρατηγικής GD, η συνάρτηση χρησιμότητας έχει την παρακάτω μορφή για έναν πωλητή: { (2.18) ενώ για ένα αγοραστή: { (2.19) όπου, οι οριακές τιμές ενός πωλητή και ενός αγοραστή αντίστοιχα, η τιμή μιας προσφοράς πώλησης και μια προσφορά αγοράς. Έστω εφικτή τιμή προσφοράς που ανήκει στο σύνολο όλων των εφικτών τιμών προσφορών και, το πλήθος των προσφορών πώλησης και αγοράς που έχουν τη συγκεκριμένη τιμή. Ακόμα, έστω το πλήθος των αποδεκτών προσφορών πώλησης και αγοράς και των αντίστοιχων απορριφθέντων προσφορών και για την ίδια τιμή. Οι προσφορές αυτές αποτελούν παρελθούσες προσφορές του πράκτορα και το πλήθος τους εξαρτάται από το μέγεθος της μνήμης του πράκτορα,. Μία προσφορά πώλησης γίνεται αποδεκτή αν η τιμή του αυτής είναι μικρότερη από μια τιμή. Σε αντίθετη περίπτωση, η προσφορά αυτή απορρίπτεται. Η συνάρτηση πεποίθησης των πωλητών δίνεται από την σχέση: (2.20) Ομοίως, μία προσφορά αγοράς γίνεται αποδεκτή αν η τιμή του αυτής είναι μεγαλύτερη από μία τιμή, ενώ σε αντίθετη περίπτωση απορρίπτεται. Η συνάρτηση πεποίθησης των αγοραστών δίνεται από την εξίσωση: (2.21) Πρέπει να σημειωθεί ότι η σχέση 2.20 ορίζεται για και η 2.21 για. Σε κάθε άλλη περίπτωση οι 2.20, 2.21 γίνονται μηδέν (0). Ακόμα, έχουν ως σύνολο τιμών τους το ενώ το πεδίο ορισμού τους αποτελείται από διακριτές τιμές του συνόλου. 50

51 Βελτιστοποίηση Πράκτορα Λογισμικού για την Αγορά Ηλεκτρικής Ενέργειας με τεχνικές Particle Swarm Optimization Για τη μετατροπή των εξισώσεων 2.20, 2.21 από διακριτές σε συνεχείς χρησιμοποιήθηκε η μέθοδος κυβικής παρεμβολής με σφηνοειδείς συναρτήσεις (cubic spline interpolation), σύμφωνα με την οποία τελικά ορίζεται η νέα συνάρτηση πεποίθησης ενός πωλητή: (2.22) και ισχύει: (2.23) Σύμφωνα με τις παραπάνω ιδιότητες, οι συντελεστές της συνάρτησης πεποίθησης για ένα πωλητή δίνονται από τη λύση του παρακάτω συστήματος εξισώσεων: a a a 1 a pa ˆ( ) 3 2 k k k 3 k a 2 pa ˆ( 1) ak ak ak k 2 3a a1 0 k a k 2 3a a0 0 k ak (2.24) Αντίστοιχα υπολογίζονται οι συντελεστές για τη συνάρτηση των αγοραστών. 2.5 Προβλήματα Βελτιστοποίησης Ένα πρόβλημα βελτιστοποίησης αφορά την εύρεση της μέγιστης ή ελάχιστης τιμής μίας συνάρτησης. Τα προβλήματα αυτά είναι καίριας σημασίας, τόσο σε επιστημονικό επίπεδο όσο και σε πρακτικό (π.χ. βιομηχανία, υποδομές κα). Για παράδειγμα, προβλήματα βελτιστοποίησης αποτελούν [13]: α) η μεγιστοποίηση της αποτελεσματικότητας της παραγωγής (σε ποσοτικό ή ποιοτικό επίπεδο), β) προβλήματα χρονοπρογραμματισμού ή ανάθεσης εργασιών, γ) η σχεδίαση τηλεπικοινωνιακών δικτύων, δ) προβλήματα στον τομέα της υπολογιστικής βιολογίας και πολλά άλλα. 51

52 Μαθηματικά ένα πρόβλημα βελτιστοποίησης (ελαχιστοποίησης ή μεγιστοποίησης) μπορεί να οριστεί όπως φαίνεται στο Σχήμα 2.10, όπου : και. FOR x = 1 to X FOR x = 1 to X IF IF THEN AND THEN AND ENDIF ENDIF ENDFOR ENDFOR Σχήμα 2.10: Πρόβλημα ελαχιστοποίησης (α) και πρόβλημα μεγιστοποίησης (β). Το πεδίο ορισμού αναφέρεται και ως χώρος αναζήτησης (search space). Κάθε στοιχείο του αποτελεί υποψήφια λύση (candidate solution) στο χώρο αναζήτησης, ενώ το αποτελεί την βέλτιστη λύση (optimal solution). Η τιμή του, αντιπροσωπεύει το πλήθος των διαστάσεων του χώρου αναζήτησης, ή με άλλα λόγια, το πλήθος των παραμέτρων που πρέπει να προσδιοριστούν για την επίλυση του προβλήματος βελτιστοποίησης. Η συνάρτηση ονομάζεται συνάρτηση στόχου (objective function) και αντιστοιχίζει τον χώρο αναζήτησης στο χώρο της συνάρτησης (function space), η διάσταση του οποίου εξαρτάται από τον αριθμό των εξόδων. Έπειτα, ο χώρος της συνάρτησης αντιστοιχίζεται σε έναν μονοδιάστατο χώρο, τον χώρο καταλληλότητας (fitness space), όπου σε κάθε υποψήφια λύση αντιστοιχίζεται μία τιμή καταλληλότητας (fitness value). Αυτή η τιμή προκύπτει αν στη συνάρτηση στόχου δοθεί ως είσοδος η υποψήφια λύση (ως ένας συνδυασμός παραμέτρων) και προσδιορίζει το κατά πόσο αυτή είναι κατάλληλη ή βέλτιστη για την επίλυση του προβλήματος υπό μελέτη. Αξίζει να σημειωθεί πως, στις περισσότερες περιπτώσεις, ο χώρος της συνάρτησης και ο χώρος καταλληλότητας ταυτίζονται. Οι δύο αυτοί χώροι είναι σημαντικό να είναι διαχωρίσιμοι, κυρίως σε προβλήματα όπου εμπεριέχονται πολλές συναρτήσεις στόχου, οι οποίες αντλούν εισόδους από τον ίδιο χώρο αναζήτησης. Τα προβλήματα αυτού του είδους καλούνται προβλήματα βελτιστοποίησης πολλαπλών στόχων (multi-objective optimization problems) [11]. Γνωρίζοντας την συνάρτηση στόχου, δεν είναι δύσκολο να βρεθούν οι ελάχιστες ή οι μέγιστες τιμές της. Παρόλα αυτά, σε πραγματικά προβλήματα βελτιστοποίησης, η συνάρτηση αυτή δεν είναι πάντα γνωστή, στις περισσότερες περιπτώσεις αποτελεί ένα 52

53 «μαύρο κουτί» στο οποίο εφαρμόζοντας τις πιθανές λύσεις λαμβάνουμε μια τιμή καταλληλότητας ως έξοδο. Σε αυτή τη περίπτωση, ο ουσιαστικός στόχος είναι η εύρεση ενός συνδυασμού παραμέτρων που μεγιστοποιούν ή ελαχιστοποιούν την δοθείσα συνάρτηση καταλληλότητας [76]. 2.6 Τεχνικές Επίλυσης Προβλημάτων Βελτιστοποίησης Στις μέρες μας, υπάρχει πληθώρα τεχνικών για την επίλυση προβλημάτων βελτιστοποίησης. Δεν έχει αποδειχθεί ότι υπάρχει συγκεκριμένη τεχνική που να αντιμετωπίζει με τον καλύτερο δυνατό τρόπο όλα τα προβλήματα αυτού του τύπου. Μάλιστα, σύμφωνα με το θεώρημα των Wolpert και MacReady, το γνωστό ως No Free Lunch Theorem [130]: «η μέση απόδοση όλων των αλγορίθμων βελτιστοποίησης επί όλων των προβλημάτων βελτιστοποίησης είναι ισοδύναμη». Ωστόσο, για συγκεκριμένες κατηγορίες προβλημάτων, συνήθως, υπάρχει μία τεχνική να υπερισχύει έναντι των υπολοίπων. Οι τεχνικές επίλυσης προβλημάτων βελτιστοποίησης με βάση τα χαρακτηριστικά τους μπορούν να διακριθούν στις κατηγορίες [135]: Μαθηματικός Προγραμματισμός: Στην κατηγορία αυτή ανήκουν οι τεχνικές που στηρίζονται σε ισχυρό μαθηματικό υπόβαθρο. Οι τεχνικές αυτές αναφέρονται συχνά στη βιβλιογραφία και ως τεχνικές επιχειρησιακής έρευνας. Τεχνητή Νοημοσύνη: Η Τεχνητή Νοημοσύνη (ΤΝ) θεωρείται ο βασικός πυλώνας πάνω στον οποίο χτίζονται τα ευφυή συστήματα. Στόχος των τεχνικών αυτής της κατηγορίας είναι η δημιουργία υπολογιστικών μοντέλων αντίστοιχων με αυτά που εικάζεται ότι χρησιμοποιεί ο ανθρώπινος εγκέφαλος και με τα οποία επιτυγχάνει την γρήγορη επίλυση προβλημάτων. Υπολογιστική Νοημοσύνη: Η Υπολογιστική Νοημοσύνη (ΥΝ) αποτελεί ένα παρακλάδι της ΤΝ που στηρίζεται κατά βάση σε τεχνικές όπως τα ασαφή συστήματα, τα νευρωνικά δίκτυα και διάφορες μορφές εξελικτικών αλγορίθμων. Η έμπνευση των μεθόδων της ΥΝ συχνά λαμβάνεται από βιολογικά συστήματα τα οποία φαίνεται να λειτουργούν αποτελεσματικά στην φύση. Μεταευριστικές Τεχνικές: Ο όρος «μεταευριστικός» αποτελεί σύνθεση των λέξεων «μετά» και «ευρίσκω» και χρησιμοποιείται έχοντας την έννοια της αναζήτησης σε υψηλότερο επίπεδο. Οι Μεταευριστικές Τεχνικές στηρίζονται στην παραδοχή ότι 53

54 ενδεχομένως δεν θα εντοπίσουν την βέλτιστη λύση αλλά μια προσέγγιση αυτής. Στην πράξη έχει αποδειχθεί ότι συχνά αποτελούν τον πλέον ενδεδειγμένο τρόπο για την αντιμετώπιση δύσκολων προβλημάτων βελτιστοποίησης. Στον Πίνακα 2.1 παρατίθενται οι κύριες τεχνικές κάθε κατηγορίας. Στη συνέχεια του κεφαλαίου θα αναλυθούν μερικές από αυτές, καθώς αποτελούν τις πιο συνηθισμένες τεχνικές επίλυσης προβλημάτων βελτιστοποίησης και παρουσιάζουν το μεγαλύτερο ερευνητικό ενδιαφέρον τα τελευταία χρόνια. Μαθηματικός Προγραμματισμός Τεχνητή Νοημοσύνη Υπολογιστική Νοημοσύνη Μεταευρετικές Τεχνικές Γραμμικός Προγραμματισμός Αλγόριθμος Simplex Ανάλυση Ευαισθησίας Ακέραιος και Μεικτός Ακέραιος Προγραμματισμός Χαλάρωση του Lagrance Δυναμική Δημιουργία Μεταβλητών Προγραμματισμός με Περιορισμούς Συμπερασμός από Παραδείγματα Τεχνητά Νευρωνικά Δίκτυα Γενετικοί Αλγόριθμοι Μιμητικοί Αλγόριθμοι Particle Swarm Optimization Ant Colony Optimization Ασαφή Σύνολα Μέθοδοι πολλαπλών εκκινήσεων Προσομοιωμένη Ανόπτηση Tabu search GRASP Οδηγούμενη Τοπική Αναζήτηση Αναζήτηση Μεταβαλλόμενης Γειτονιάς Διασκορπισμένη Αναζήτηση Υπερευρετικές Τεχνικές Πίνακας 2.1: Παραδείγματα τεχνικών επίλυσης προβλημάτων βελτιστοποίησης. 54

55 2.6.1 Τεχνητά Νευρωνικά Δίκτυα Τα Τεχνητά Νευρωνικά Δίκτυα (TNΔ) ή Artificial Neural Networks, αποτελούν μία ισχυρή τεχνική επίλυσης προβλημάτων γενικού σκοπού που στηρίζεται στη λειτουργία των βιολογικών νευρώνων. Οι McCulloch και Pitts περιέγραψαν την ιδέα για πρώτη φορά το 1943, όμως τα ΤΝΔ απέκτησαν ευρεία πρακτική εφαρμογή μετά το 1982, όταν ο Hoplfied εισήγαγε την τεχνική της οπισθοδιάδοσης (back propagation) [135]. Ένα TNΔ μπορεί να θεωρηθεί ως μία οργανωμένη δομή μονάδων επεξεργασίας που συνδέονται μεταξύ τους. Έχει την δυνατότητα να μαθαίνει από πειράματα και η γνώση που αποκτά αποτυπώνεται στην βαρύτητα των συνδέσεων μεταξύ των επιμέρους μονάδων. Μπορεί να γενικεύσει συμπεράσματα (generalize) επί των δεδομένων που δέχεται ως είσοδο και να παράγει λογικές εξόδους για νέες εισόδους που δεν έχουν παρουσιαστεί στο παρελθόν. Η θεωρία των ΤΝΔ μπορεί να εξηγηθεί με την χρήση της θεωρίας της στατιστικής, σύμφωνα με την οποία η γραμμική παλινδρόμηση (linear regression) και η λογιστική παλινδρόμηση (logistic regression) αποτελούν ειδικές περιπτώσεις ΤΝΔ. Ωστόσο, η γραμμική και η λογιστική παλινδρόμηση προϋποθέτουν συγκεκριμένες μορφές συναρτήσεων, σε αντίθεση με τα ΤΝΔ που είναι μια μέθοδος προσέγγισης οποιασδήποτε μορφής συνάρτησης. Παρόλο που τα ΤΝΔ έχουν εφαρμοστεί με επιτυχία κυρίως σε προβλήματα κατηγοριοποίησης και πρόβλεψης [8], μπορούν να εφαρμοστούν και σε εκείνα της βελτιστοποίησης. Σύμφωνα με το [63], εάν ένα ΤΝΔ ικανοποιεί συγκεκριμένους περιορισμούς, τότε συγκλίνει σε καταστάσεις ισορροπίας που αντιστοιχούν σε τοπικά βέλτιστα της λεγόμενης συνάρτησης ενέργειας. Έτσι, για την επίλυση προβλημάτων βελτιστοποίησης αρκεί η έκφραση της συνάρτησης στόχου του προβλήματος στη μορφή της συνάρτησης ενέργειας του δικτύου Γενετικοί Αλγόριθμοι Οι Γενετικοί Αλγόριθμοι (ΓΑ) ή Genetic Algorithms, είναι μία από τις πλέον διαδεδομένες τεχνικές αναζήτησης και βελτιστοποίησης, και προτάθηκε για πρώτη φορά το 1970 από τον Holland [61]. Η βασική ιδέα που κρύβεται πίσω από τους ΓΑ είναι η θεωρία της Εξέλιξης των Ειδών (Evolution of Species) του Δαρβίνου. 55

56 Οι ΓΑ λειτουργούν πάνω σε πληθυσμούς από συμβολοσειρές, οι οποίες κωδικοποιούν υποψήφιες λύσεις του προβλήματος. Κάθε πληθυσμός υφίσταται μία προσομοιωμένη γενετική εξέλιξη. Στους επιτυχημένους πληθυσμούς συμβολοσειρών κάθε γενιάς εφαρμόζονται οι γενετικοί τελεστές: α) αναπαραγωγή, β) διασταύρωση και γ) µετάλλαξη, για να δηµιουργήσουν νέους πληθυσµούς. Αυτοί οι τελεστές είναι πολύ απλοποιημένοι, χωρίς να περιλαμβάνουν τίποτα πιο σύνθετο από παραγωγή τυχαίων αριθµών, αντιγραφή συμβολοσειρών και ανταλλαγή τµηµάτων µεταξύ συµβολοσειρών. Ωστόσο παρόλη την απλότητά τους, η απόδοση της αναζήτησης που προκύπτει είναι ευρεία και εντυπωσιακή. Πολλοί ερευνητές προσπάθησαν να συνδυάσουν με την τεχνική των ΓΑ με αυτή των ΤΝΔ ώστε να ξεπεραστούν τα προβλήματα της μίας από την άλλη [138]. Η χρήση των ΓA µέσα στον χώρο των ΤΝΔ µπορεί να γίνει µε διάφορους τρόπους, οι κυριότεροι από τους οποίους είναι η σχεδίαση (µέσω ΓA) βέλτιστων ΤΝ για συγκεκριµένα προβλήµατα και η εκπαίδευσή τους Ο αλγόριθμος Particle Swarm Optimization Ο αλγόριθμος Particle Swarm Optimization (PSO) παρουσιάστηκε για πρώτη φορά από τους James Kennedy και Russel Eberhart το 1995 [75]. Η βασική ιδέα στην οποία αρχικά στηρίχτηκε ο αλγόριθμος ήταν η παραγωγή υπολογιστικής ευφυΐας βασισμένη σε κοινωνικές αλληλεπιδράσεις μεταξύ των μελών ενός πληθυσμού, χωρίς αυτή να βασίζεται στις ικανότητες κάθε ενός ξεχωριστά. Πιο συγκεκριμένα, οι δημιουργοί του τον περιγράφουν ως εξής: «Ο αλγόριθμος PSO μιμείται την κοινωνική συμπεριφορά των ανθρώπων (ή των εντόμων). Τα άτομα αλληλεπιδρούν μεταξύ τους, ενώ ταυτόχρονα εκπαιδεύονται με την εμπειρία που αποκτούν και έτσι σταδιακά τα μέλη του πληθυσμού μετακινούνται σε καλύτερες περιοχές του χώρου του προβλήματος» [89]. Οι αρχικές προσομοιώσεις που πραγματοποίησαν οι Eberhart και Kennedy στηρίχτηκαν στη μελέτη των Heppner και Grenander πάνω στους κανόνες που συγκρατούν ένα μεγάλο αριθμό πουλιών να πετούν συγχρονισμένα [55]. Η μελέτη αυτή μαζί με τη μελέτη του Reynolds για το μοντέλο συγκέντρωσης Boids [108], αποτέλεσαν τα θεμέλια για την εφαρμογή του PSO σε προβλήματα βελτιστοποίησης. 56

57 Παρόλο που η θεωρητική τεκμηρίωση του PSO είναι σχετικά απλή, στην πράξη έχει δώσει πολύ καλά αποτελέσματα σε πληθώρα προβλημάτων ακόμα και δυναμικής φύσης, δηλαδή σε προβλήματα που η κατάσταση του συστήματος αλλάζει κατά τη διάρκεια επίλυσης του [135]. Ακόμα, ο PSO είναι ιδιαίτερα δημοφιλής στους ερευνητές διότι χάρη στην ευρωστία (robustness) και την ευελιξία (flexibility) που τον χαρακτηρίζουν, ενδείκνυται για την επίλυση προβλημάτων αυξημένης πολυπλοκότητας [13] Προσομοιωμένη Ανόπτηση Η Προσομοιωμένη Ανόπτηση (ΠΑ) ή Simulated Annealing, αποτελεί ιστορικά την πρώτη μεταευριστική τεχνική. Η ΠΑ είναι εμπνευσμένη από την τεχνική της ανόπτησης, όπως αυτή εφαρμόζεται κατά την διαδικασία ψύξης ενός υλικού το οποίο πρώτα έχει περιέλθει σε κατάσταση τήξεως. Η αντιστοιχία ανάμεσα στα προβλήματα αντοχής υλικών και στα προβλήματα βελτιστοποίησης έγινε από τους Kirkpatrick, Gelatt και Vecchi αναγνωρίζοντας την αναλογία μεταξύ του φορτίου ενέργειας ενός υλικού και στο κόστος μιας λύσης ενός συνδυαστικού προβλήματος [82]. Όπως και στην περίπτωση των υλικών, όπου η θερμοκρασία λειτουργεί ως μια παράμετρος ελέγχου της διαδικασίας και επιτρέπει στο σύστημα να οργανωθεί σε καταστάσεις μειωμένης ενέργειας, έτσι και στα προβλήματα βελτιστοποίησης, η ίδια παράμετρος οδηγεί σε εξερεύνηση καταστάσεων με μειωμένο κόστος. Η μέθοδος της ΠΑ έχει εφαρμοστεί με επιτυχία σε πληθώρα προβλημάτων βελτιστοποίησης. Πρόκειται για μια ιδιαίτερα χρήσιμη μέθοδο για σύνθετα προβλήματα για τα οποία δεν μπορούν να σχεδιαστούν με ευκολία άλλες εξειδικευμένες ευριστικές τεχνικές. Ωστόσο απαιτεί μεγάλους υπολογιστικούς χρόνους και, όπως βέβαια συμβαίνει και με άλλες μεταευριστικές τεχνικές, δεν υπάρχει βεβαιότητα για τον βαθμό στον οποίο η προτεινόμενη λύση είναι κοντά στην βέλτιστη. Επιπλέον, η απόδοση και ο χρόνος εκτέλεσης της μεθόδου εξαρτάται σε μεγάλο βαθμό από την επιλογή των παραμέτρων του αλγορίθμου, ενώ η καταλληλότερη επιλογή τιμών για τις παραμέτρους αυτές συχνά γίνεται με μια σειρά πειραμάτων που προηγούνται της κανονικής εκτέλεσης της μεθόδου. 57

58 2.6.5 Tabu Search Η μέθοδος Tabu Search (TS) προτάθηκε από τον Glover το 1986 [46]. Αυτή η μέθοδος είναι μία ευφυής τεχνική αναζήτησης που χρησιμοποιεί δομές δεδομένων για να αποθηκεύσει πληροφορίες σχετικά με τις αποφάσεις που λαμβάνονται κατά την αναζήτηση. Οι πληροφορίες αυτές χρησιμοποιούνται για να κατευθύνουν την αναζήτηση προς νέες περιοχές. Ορισμένες λύσεις που προκύπτουν κατά την αναζήτηση κατατάσσονται ως «απαγορευμένες», προκειμένου να αποφευχθεί ο εγκλωβισμός της διαδικασίας σε κάποια τοπικά βέλτιστη λύση. Η TS έχει εφαρμοστεί με επιτυχία σε μεγάλο αριθμό προβλημάτων, ενώ την τελευταία εικοσαετία εκατοντάδες άρθρα έχουν δημοσιευθεί προτείνοντας παραλλαγές της μεθόδου και την εφαρμογή της σε διάφορα προβλήματα βελτιστοποίησης [135]. Αξίζει να σημειωθεί πως συχνά οι λύσεις που προκύπτουν βρίσκονται κοντά στη αποδεδειγμένη βέλτιστη λύση όταν υπάρχει, ενώ συχνά παρέχει καλύτερα αποτελέσματα σε σχέση με εκείνα που λαμβάνονται από άλλες ευριστικές τεχνικές. 2.7 Παλαιότερες εργασίες πάνω στο θέμα Μέχρι σήμερα έχει πραγματοποιηθεί εκτενής έρευνα στον τομέα των προσφορών πώλησης ΗΕ από εταιρίες παραγωγής, τον τρόπο, δηλαδή, με τον οποίο κοστολογείται η ΗΕ από τους παραγωγούς της. Μία επισκόπηση της σχετικής βιβλιογραφίας παρατίθεται στην εργασία [27]. Ωστόσο οι εργασίες στον τομέα των στρατηγικών προσφορών ΗΕ (Bidding Strategies) σε συστήματα δημοπρασιών, εστιάζουν κυρίως σε προσφορές που πραγματοποιούνται από προμηθευτές σε αντίστροφες-δημοπρασιές, όπου δηλαδή υπάρχουν πολλοί προμηθευτές-πωλητές και ένας αγοραστής [107]. Η Αγορά Τιμολογίων (Tariff Market), που μελετάται στην παρούσα διπλωματική, είναι σημαντικά διαφορετική από τις δημοπρασίες χονδρικής πώλησης, διότι λόγω των ποικίλων αναγκών και προτιμήσεων που έχουν οι πελάτες-αγοραστές που συμμετέχουν, η ζήτηση τους τείνει να κατανέμεται σε πολλαπλούς προμηθευτές και όχι μόνο σε έναν. Μία ακόμα σημαντική διαφορά είναι ότι ο στόχος στα συστήματα δημοπρασιών είναι να πραγματοποιηθεί η αντιστοίχηση και η εκκαθάριση μεταξύ των προσφορών αγοράς και πώλησης, ενώ αντίθετα, στην αγορά τιμολογίων, σε κάθε μία πολιτική τιμολόγησης, μπορούν να 58

59 εγγραφούν περισσότεροι του ενός πελάτες. Τα ιδιαίτερα χαρακτηριστικά που διαθέτει μία Aγορά Tιμολογίων, αναμφίβολα, εισάγουν νέες προκλήσεις για τις αγορές ΗΕ. Στην εργασία [120] μελετάται μία Αγορά Τιμολογίων που απευθύνεται κυρίως σε οικιακούς καταναλωτές, με τη χρήση ενός πολυπρακτορικού συστήματος. Η προσομοίωση που πραγματοποιήθηκε ήταν βασισμένη σε πραγματικά δεδομένα κατανάλωσης και είχε ως σκοπό τη σύγκριση των λογαριασμών ΗΕ που μπορούσαν να επιτύχουν οι πελάτες, από την υιοθέτηση διαφόρων ειδών τιμολογίων. Τα αποτελέσματα έδειξαν πως τόσο οι προμηθευτές όσο και οι οικιακοί καταναλωτές μπορούν να επωφεληθούν από την υιοθέτηση RTP χρεώσεων (ειδικότερα από two-part RTP χρεώσεις), τόσο όσον αφορά οικονομικό κέρδος όσο και το ρίσκο που καλούνται να αναλάβουν. Ωστόσο, στην εργασία αυτή, δεν λαμβάνονται υπόψη ψυχολογικά χαρακτηριστικά των πελατών, όπως για παράδειγμα η πιθανή απροθυμία να αλλάξουν είδος τιμολογίου. Δυστυχώς, μέχρι πρότινως, η τεχνολογία των ευφυών πρακτόρων δεν είχε χρησιμοποιηθεί για την εξομοίωση μιας εικονικής Αγοράς Τιμολογίων. Ως εκ τούτου, η δημοσιευμένη έρευνα στο θέμα των πρακτόρων που λειτουργούν ως μεσάζοντες (Broker Agents) σε τέτοιες αγορές είναι πολύ μικρή ( [107], [101]). Στην εργασία [107] ερευνάται το πρόβλημα της σχεδίασης τιμολογιακής πολιτικής ενός πράκτορα μεσάζοντα σε ανταγωνιστικές αγορές ΗΕ, με χρήση της Μαρκοβιανής Διαδικασίας Αποφάσεων (ΜΔΑ - Markov Decision Process, MDP) και την τεχνική Ενισχυτικής Μάθησης (Reinforcement Learning) Q-Learning. Σύμφωνα με τους συγγραφείς, το πρόβλημα που προκύπτει συνήθως από τη χρήση των ΜΔΑ, είναι ο ανεξέλεγκτα υψηλός αριθμός καταστάσεων που προκύπτουν. Για το λόγο αυτό, προτείνουν μία μέθοδο απεικόνισης των καταστάσεων του χώρου του προβλήματος προσδιορισμού των τιμών ΗΕ Ακόμα, προτείνεται ένα συνόλο δυνατών ΜΔΑ ενεργειών, με βασή τα στατιστικά μεγέθη των τιμών στην αγορά, τα οποία υποδεικνύουν στον πράκτορα πως πρέπει να μεταβάλλει τις τιμές των τιμολογίων που προσφέρει. Η προτεινόμενη τεχνική, συγκρίθηκε πειραματικά με non-learning adaptive στρατηγικές, και σχεδόν πάντα, επιτύγχανε υψηλότερα κέρδη. Ένα από τα μειονεκτήματα της προσέγγισης που παρουσιάστηκε ήταν η χρήση μόλις πέντε (5) καταστάσεων για την προσομοίωση των ενεργειών του πράκτορα, κάτι που περιόρισε πολύ τις δυνατότητες του. Την ίδια χρονιά δημοσιεύτηκε η εργασία [106], όπου ερευνάται η περίπτωση να υπάρχουν περισσότεροι του ενός πράκτορες που να χρησιμοποιούν την στρατηγική που 59

60 αναπτύχθηκε στην [107]. Συγκεκριμένα, σε πειράματα όπου συμμετείχαν δύο (2) πράκτορες με learning και δύο (2) με non-learning, adaptive στρατηγικές, οι πρώτοι παρουσίασαν πολύ υψηλότερα κέρδη. Σύμφωνα με τους συγγραφείς, ένα θέμα που προκύπτει όταν υπάρχουν περισσότεροι από ένα πράκτορες με learning στρατηγική, είναι πως οι τακτικές σύμφωνα με τις οποίες εκπαιδεύονται (learned policies), πρέπει να ανανεώνονται καθώς οι αντίπαλοι ανανεώνουν τις δικές τους. Για το λόγο αυτό, εισήγαγαν μία ακόμα στρατηγική, την relearning, που στηρίζεται σε ένα μη μονότονο εξερευνητικό ευριστικό (non-monotonic exploration heuristic) κανόνα, προκειμένου να λαμβάνονται υπόψη οι αλλαγές στις στρατηγικές των αντιπάλων. Η πειραματική διαδικασία έδειξε πως δύο (2) πράκτορες με relearning στρατηγική, πέτυχαν σημαντικά υψηλότερα κέρδη, συγκριτικά με δύο (2) που χρησιμοποιούσαν learning στρατηγικές. Ωστόσο, τα αποτελέσματα αυτά έχουν περιορισμένη χρησιμότητα καθώς το μοντέλο της αγοράς που χρησιμοποιήθηκε για τις παραπάνω εργασίες, ήταν ιδιαίτερα απλοποιημένο: α) τα τιμολόγια όριζαν μόνο την τιμή κατανάλωσης/παραγωγής, γεγονός που δεν επιτρέπει τη διαμόρφωση διαφόρων ειδών τιμολογίων β) τα μοντέλα των καταναλωτών είχαν ένα σταθερό φορτίο κατανάλωσης/παραγωγής ΗΕ που παρέμενε σταθερό καθ όλη τη διάρκεια της προσομοίωσης γ) για όλα τα είδη των καταναλωτών προσφερόταν οι ίδιες τιμές ανεξαρτήτως της ποσότητας και της ποιότητας του φορτίου τους. Τα προβλήματα αυτά φαίνονται να ξεπερνώνται, στην εργασία [101], σύμφωνα με τους συγγραφείς της. Συγκεκριμένα, προτείνονται πράκτορες μεσάζοντες που στηρίζονται σε τεχνικές ενισχυτικής μάθησης με Συναρτήσεις Προσέγγισης (Function Approximation). Οι πράκτορες αυτοί εκπαιδεύονται σε ένα χώρο καταστάσεων που μπορεί να είναι αρκετά μεγάλος, διότι διαμορφώνεται ανάλογα με τα σήματα τιμών (price signals) που λαμβάνουν από το περιβάλλον τους. Αποδεικνύεται πως με χρήση τεχνικών Επιλογής Χαρακτηριστικών (Feature Selection) και Κανονικοποίησης (Regularization), μπορεί να επιτευχθεί αυτόματη βελτιστοποίηση των πρακτόρων για συγκεκριμένες καταστάσεις που μπορεί να προκύψουν στην αγορά. Στην [101] πραγματοποιείται σύγκριση με την [106], και υποστηρίζεται ότι πρώτη, διαφέρει στον τρόπο με τον οποίο πραγματοποιείται ο ορισμός των καταστάσεων του προβλήματος, καθώς και στο γεγονός ότι οι τιμές που ορίζει είναι διαφορετικές για τα διάφορα είδη καταναλωτών της αγοράς. Τα στοιχεία αυτά δείχνουν πως οι πράκτορες που προτείνονται στην [106] είναι δύσκολο να προσαρμοστούν σε ποικίλα είδη καταναλωτών, 60

61 αλλά και σε ποικίλες συνθήκες της αγοράς, σε αντίθεση με τους αντίστοιχους της [101] γεγονός που επιβεβαιώνεται στην πειραματική διαδικάσια Εφαρμογές του PSO στον τομέα της Ηλεκτρικής Ενέργειας Ο αλγόριθμος PSO μπορεί να εύκολα προσαρμοστεί για την επίλυση πραγματικών προβλημάτων, χωρίς να επηρεάζεται από τον χώρος αναζήτησης (μπορεί να είναι συνεχής, διακριτός, να περιλαμβάνει πολλαπλά τοπικά βέλτιστα κ.α). Στον τομέα της ενέργειας, ο αλγόριθμος PSO έχει χρησιμοποιηθεί σε αρκετά ερευνητικά προβλήματα με πολύ θετικά αποτελέσματα. Στον Πίνακα 2.2 που ακολουθεί παρατίθενται κάποιες από τις εφαρμογές του PSO για την επίλυση προβλημάτων βελτιστοποίησης που σχετίζονται με συστήματα ενέργειας. Πεδίο Εφαρμογής Αναφορές Reactive power and voltage control [131], [25], [133], [132], [93], [83] [100], [88], [6], [87], [43], [118], [99], [134], Economic Dispatch [33], [84], [127] Power System Reliability and Security [110], [20], [115], [70], [85], [86], [74], [97] Load Flow and Optimal Power Flow [4], [32], [126], [9], [56] [96], [29], [52], [22], [80], [69], [109], [57], System Identification and Intelligent Control [34], [73], [129], [128], [72], [91] Electric Machinery [35], [7] Short Term Load Forecasting [64] Πίνακας 2.2: Εφαρμογές PSO στο τομέα της ΗΕ. Στρέφωντας το ενδιαφέρον μας πάλι προς την περιοχή που ανήκει το πρόβλημα που καλείτε να λύσει η παρούσα διπλωματική, ο αλγόριθμος PSO έχει εφαρμοστεί πολλές φορές για την επίλυση προβλημάτων εύρεσης της βέλτιστης στρατηγικής προσφορών αγοράς ή πώλησης ΗΕ για εταιρίες παραγωγής, προμηθευτές ή μεγάλους καταναλωτές που μπορούν να συμμετέχουν σε δημοπρασίες ΗΕ. Ένα τέτοιο ενδιαφέρον παράδειγμα αποτελεί η εργασία [125], όπου μελετάται η εφαρμογή του PSO για την διαμόρφωση βέλτιστων στρατηγικών προσφορών, σε ένα σύστημα που αποτελείται από έξι (6) εταιρίες παραγωγής και δύο (2) μεγάλους 61

62 καταναλωτές. Για κάθε εταιρία παραγωγής διαμορφώνεται μία γραμμική καμπύλη πώλησης ΗΕ, και για κάθε μεγάλο καταναλωτή μία αντίστοιχη καμπύλη αγοράς ΗΕ. Στόχος του αλγορίθμου PSO είναι η εύρεση των παραμέτρων των καμπυλών αυτών, ώστε να επιτυγχάνεται το μέγιστο κέρδος, τόσο για τις εταιρίες παραγωγής, όσο και για τους μεγάλους καταναλωτές. Τα αποτελέσματα της προτεινόμενης μεθόδου, συγκρίθηκαν με τα αντίστοιχα που προέκυψαν από την επίλυση του προβλήματος με ΓΑ, με βάση τον χρόνο σύγκλισης των αλγορίθμων και τα συνολικά κέρδη παραγωγών καταναλωτών, και έδειξαν πως ο PSO υπερέχει σημαντικά. Οι συγγραφείς υπογραμμίζουν πως παρόλο που οι δύο τεχνικές μοιράζονται κοινά χαρακτηριστικά, λόγω του ότι στηρίζονται σε πληθυσμούς υποψήφιων λύσεων, ο αλγόριθμος PSO υπερτερεί διότι τα σωματίδια παραμένουν σταθερά και μεταβάλλονται μόνο τα χαρακτηριστικά τους σε κάθε εκτέλεση του αλγορίθμου, σε αντίθεση με τους ΓΑ, όπου σε κάθε εκτέλεση δημιουργούνται νέοι πληθυσμοί μέσω της μετάλλαξης (mutation) και της διασταύρωσης (crossover). Η διαφορά αυτή, καθιστά τον αλγόριθμο PSO ικανό να επιτυγχάνει λύσεις καλύτερης ποιότητας, σε μικρότερο χρόνο εκτέλεσης. Δυστυχώς, υπάρχουν λίγες εργασίες που να χρησιμοποιούν την μέθοδο PSO για την επίλυση προβλημάτων που να σχετίζονται με την ΑΖ. Παρουσιάζονται οι κυριότερες στις παραγράφους που ακολουθούν. Οι Miranda και Win Oo [95] έδειξαν πως μία παραλλαγή του κλασσικού PSO, ο εξελικτικός PSO (Evolutionary PSO, EPSO), υπερέχει των εξελικτικών της οικογένειας των ΓΑ σε ένα πρόβλημα μοντελοποίησης αποφάσεων πωλητών ενέργειας λιανικής. Τα πειράματα που πραγματοποιήθηκαν αφορούσαν μία ανταγωνιστική αγορά πολλαπλών μορφών ενέργειας και υλοποιηθήκαν στα πλαίσια της πρακτορικής πλατφόρμας FIPA ανοιχτού κώδικα [42]. Οι πράκτορες πωλητές καλούνταν να λάβουν τις βέλτιστες αποφάσεις για: α) αλλαγή τιμών υπηρεσιών/ενέργειας, β) επενδύσεις σε νέες γραμμές μεταφοράς, γ) επένδυση κεφαλαίου για διαφήμιση, δ) παροχή κινήτρων στους πελάτες. Τα αποτελέσματα των πειραμάτων έδειξαν πως οι πράκτορες που ακολουθούσαν στρατηγική βασισμένη στον EPSO, είχαν μεγαλύτερα έσοδα σε σχέση με τους αντιπάλους, παρόλο που οι πρώτοι απαιτούσαν μεγαλύτερη υπολογιστική ισχύ. Ακόμα, ο EPSO σε αντίθεση με τους ΓΑ, φαίνεται να είναι περισσότερο ευέλικτος και δεν παγιδεύεται εύκολα σε τοπικά βέλτιστα. Στο [39] παρουσιάζεται η εφαρμογή του αλγορίθμου PSO σε ένα πρόβλημα ΑΖ. Η έννοια της ΑΖ υλοποιήθηκε με την μεταβολή των τιμών που επιβάλει ο Διαχειριστής του Συστήματος Μεταφοράς (Distribution Network Operator, DNO) και αφορούσε RTP τιμές. 62

63 Στόχος της μοντελοποίησης ήταν η μείωση του κόστους από τη μεριά των καταναλωτών, όταν απαιτούνταν μείωση του φορτίου τους. Η μεθοδολογία υλοποιήθηκε σε ένα προσομοιωτή ΑΖ, τον DemSi, και ο PSO εφαρμόστηκε για τη βελτιστοποίηση των λύσεων που προέκυπταν. Στα πειράματα που πραγματοποιήθηκαν οι λύσεις που ανέδειξε ο PSO συγκρίθηκαν με τις αντίστοιχες που λήφθηκαν με Non-Linear Programming (NLP) μέσω του προσομοιωτή GAMS TM. Τα αποτελέσματα έδειξαν πως όταν το πρόγραμμα ΑΖ επιβάλλει μικρή μείωση του φορτίου των καταναλωτών, το κόστος ενέργειας και για τις δύο υλοποιήσεις είναι το ίδιο, ενώ όταν η απαιτούμενη μείωση αυξάνεται ο PSO δίνει ελάχιστα χειρότερες λύσεις. Ωστόσο, οι συγγραφείς υποστηρίζουν πως οι λύσεις που προκύπτουν από τον PSO είναι πιο ενδιαφέρουσες, γιατί παρόλο που δεν επιτυγχάνεται μεγαλύτερη μείωση φορτίου, προκύπτει μεγαλύτερο εύρος στο είδος των φορτίων που μεταβάλλονται. 63

64 Κεφάλαιο 3 O Διαγωνισμός Power TAC Στο κεφάλαιο αυτό περιγράφεται η πλατφόρμα του διαγωνισμού Power TAC, που χρησιμοποιήθηκε για την υλοποίηση του πράκτορα και την πειραματική διαδικασία. Σκοπός του κεφαλαίου, είναι να εξετασθούν οι αλληλεπιδράσεις του πράκτορα με το περιβάλλον του διαγωνισμού, καθώς και να αναγνωρισθούν οι μεταβλητές που πρέπει να λαμβάνει υπόψη στη διαμόρφωση στρατηγικών για την μεγιστοποίηση του κέρδους του, που είναι το πρόβλημα βελτιστοποίησης που καλείται να λύσει. 3.1 Γενικά Το Power TAC αποτελεί μία πλατφόρμα προσομοίωσης μίας απελευθερωμένης αγοράς ΗΕ, με σκοπό την καλύτερη κατανόηση και ανάλυση της. Βάση και κίνητρο αποτέλεσε ο πολύπλοκος χαρακτήρας μίας τέτοιας αγοράς, αφού τα απρόβλεπτα και αντικρουόμενα οικονομικά συμφέροντα των οντοτήτων που συμμετέχουν είναι δύσκολο να μοντελοποιηθούν με απλούς κανόνες θεωρίας παιγνίων [79]. Ο διαγωνισμός αυτός προσομοιώνει την αγορά με την μέγιστη δυνατή πιστότητα και αποτελεί γόνιμο έδαφος για έρευνα νέων στρατηγικών «έξυπνων» πρακτόρων και λήψης αποφάσεων. 64

65 Το Power TAC 6 ανήκει στην κατηγορία των διαγωνισμών Trading Agent Competition (TAC) 7, επιτυχημένα παραδείγματα των οποίων είναι οι διαγωνισμοί: α) Trading Agent Competition for Supply-Chain Management (TAC SCM) [26] και β) Trading Agent Competition for Ad Auctions (TAC AA) [71]. Κάθε ομάδα που συμμετέχει στον διαγωνισμό, καλείται να υλοποιήσει ένα πράκτορα λογισμικού που λειτουργεί ως Μεσάζων (Broker) και πραγματοποιεί τις κατάλληλες συναλλαγές μεταξύ παραγωγών και καταναλωτών ΗΕ. Σκοπός κάθε πράκτορα είναι να επιτύχει το μέγιστο δυνατό κέρδος, καθώς και την κοινωνική ευημερία μέσω της παροχής υπηρεσιών σε πελάτες. Στο Σχήμα 3.1 παρουσιάζεται η κεντρική οθόνη του γραφικού περιβάλλοντος του διαγωνισμού, στην οποία για ένα τυπικό παιχνίδι φαίνονται: α) πως διαμορφώνονται τα συνολικά κέρδη κάθε πράκτορα στην διάρκεια του παιχνιδιού, και κατ επέκταση ποιός έχει τα υψηλότερα, β) ποιός πράκτορας έχει επιτύχει καλύτερο μερίδιο πελατών στην αγορά, γ) ποιος έχει επιτύχει την καλύτερη ισορροπία προσφοράς και ζήτησης, καθώς και δ) η κατάσταση του καιρού για την τρέχουσα χρονική στιγμή

66 Σχήμα 3.1: Κεντρική σελίδα πληροφοριών του διαγωνισμού. 3.2 Επισκόπηση του Συστήματος Τα κύρια μέρη της πλατφόρμας του Power TAC φαίνονται στο Σχήμα 3.2, και είναι σχεδιασμένα με τρόπο τέτοιο ώστε να συμβάλουν στην όσο το δυνατόν πιο ρεαλιστική προσομοίωση της αγοράς ΗΕ. Η ανάλυση του συνόλου των αλληλεπιδράσεων μεταξύ των οντοτήτων είναι εξαιρετικά δύσκολη, κάτι που οφείλεται στην πολύπλοκη φύσης της αγοράς ΗΕ. Για το λόγο 66

67 αυτό, στο παρόν και στα επόμενα υποκεφάλαια αναλύονται μόνο εκείνες που σχετίζονται άμεσα με τον μεσάζοντα. Σχήμα 3.2: Κύρια μέρη του Power TAC [79]. Το Σχήμα 3.3 αποτελεί ένα πρωταρχικό μοντέλο των αλληλεπιδράσεων του πράκτορα με το υπόλοιπο σύστημα της πλατφόρμας. Γενικά, σε ένα τυπικό παιχνίδι, ο πράκτορας συναλλάσσεται: α) στην Αγορά Τιμολογίων (Tariff Market), προκειμένου να προσελκύσει τους πελάτες λιανικής, β) στην αγορά μεμονωμένων συμβολαίων (Contract Market), όπου προσφέρει συμβόλαια σε πελάτες συμβολαίων και γ) στην Αγορά Χονδρικής Πώλησης (Wholesale Market), όπου αγοράζει ή πουλά ΗΕ. Σχήμα 3.3: Σχέσεις βασικών μερών του Power TAC με τον μεσάζοντα [104]. Στη συνέχεια του κεφαλαίου, παρατίθεται η ανάλυση των βασικών οντοτήτων της προσομοίωσης, με στόχο την καλύτερη κατανόηση των αλληλεπιδράσεων τους με τον πράκτορα. 67

68 3.3 Αρχή Διανομής H Αρχή Διανομής (ΑΔ) ή Distribution Utility, αναπαριστά την ρυθμιστική αρχή ενός συστήματος ΗΕ. Στην προσομοίωση μέσω της πλατφόρμας του Power TAC, η ΑΔ είναι υπεύθυνη για την εξισορρόπηση της ενέργειας στην αγορά καθώς και για την καταβολή των διαφόρων αμοιβών και προστίμων στους μεσάζοντες σε περιπτώσεις μη ισορροπίας του χαρτοφυλακίου τους. Πιο συγκεκριμένα, η ΑΔ σε ένα τυπικό παιχνίδι, έχει τρεις βασικούς ρόλους [79]: Τη διανομή της ισχύος μέσω του συστήματος μεταφοράς στους πελάτες. Οι πράκτορες υποχρεούνται να πληρώνουν φόρους διανομής (distribution fees) που είναι ανάλογοι της ενέργειας που διακινούν μέσω του δικτύου για να ικανοποιήσουν τους πελάτες που είναι συμβεβλημένοι σε αυτούς. Την εξισορρόπηση προσφοράς και ζήτησης στο δίκτυο διανομής, σε πραγματικό χρόνο. Οποιαδήποτε απόκλιση από το σημείο ισορροπίας καλύπτεται από ποσό ενέργειας της ίδιας της ΑΔ και επιβαρύνει τον πράκτορα του οποίου οι πελάτες ευθύνονται για τη συγκεκριμένη ανισορροπία (balancing fees). Προσφέρει προεπιλεγμένα τιμολόγια (default tariffs) για παραγωγή και κατανάλωση ΗΕ. Τα τιμολόγια αυτά αποτελούν ένα όριο στο ενδεχόμενο κέρδος των ανταγωνιστικών μεσαζόντων, διότι οι πελάτες έχουν πάντοτε τη δυνατότητα να τις επιλέξουν αν κρίνουν τις υπόλοιπες ασύμφορες. Τα προεπιλεγμένα τιμολόγια προσφέρονται από τον λεγόμενο Default Broker, ο οποίος παίζει σημαντικό ρόλο στην απρόσκοπτη πρόσβαση των καταναλωτών και των παραγωγών σε φορτία ΗΕ. 3.4 Λογιστική Σε κάθε πράκτορα, αντιστοιχίζεται ένας λογαριασμός στην κεντρική τράπεζα, που αρχικά είναι μηδενικός. Τα κέρδη ή οι χρεώσεις που μπορεί να προκύψουν από τις συναλλαγές του πράκτορα για κάθε ώρα προσομοίωσης, προσμετρούνται στο λογαριασμό του. Το ισοζύγιο στο λογαριασμό κάθε πράκτορα μπορεί να είναι θετικό ή αρνητικό. Σε περίπτωση που είναι αρνητικό, ο πράκτορας επιβαρύνεται με ένα τόκο σε καθημερινή βάση. Έτσι το ισοζύγιο του ανανεώνεται σύμφωνα με τη σχέση: ( ) (3.1) 68

69 όπου είναι το ισοζύγιο για την ημέρα και είναι το ετήσιο επιτόκιο. Μία τυπική τιμή επιτοκίου είναι. Αντίθετα, σε περίπτωση που πράκτορας έχει θετικό ισοζύγιο, επιδοτείται. Έτσι, το καθημερινό του ισοζύγιο ανανεώνεται σύμφωνα με τη σχέση: ( ) (3.2) όπου τυπικές τιμές του. 3.5 Αγορά Χονδρικής Πώλησης Όπως είναι λογικό, τόσο λόγω της φύσης του προβλήματος όσο και λόγω της πολυπλοκότητας των διαφόρων παραμέτρων, οι πράκτορες δεν είναι σε θέση να επιτύχουν την απόλυτη ισορροπία μεταξύ της παραγόμενης και της καταναλισκόμενης ενέργειας του πελατολογίου που διαχειρίζονται. Η Αγορά Χονδρικής Πώλησης (ΑΧΠ) ή Wholesale Market, επιτρέπει στους πράκτορες να υποβάλλουν τις προσφορές τους για αγορά ή πώληση ενέργειας, με στόχο τη ισορροπία του χαρτοφυλακίου τους. Συνήθως, οι προσφορές αυτές αφορούν μέχρι και τις επόμενες 24 ώρες προσομοίωσης και για το λόγο αυτό, η ΑΧΠ, καλείται και ως Day-Ahead Market. Η ΑΧΠ της πλατφόρμας του Power TAC, είναι μία περιοδική διμερής δημοπρασία (periodic double auction), στην οποία πραγματοποιείται εκκαθάριση (market clearing) για κάθε ώρα προσομοίωσης [79]. Κατά τη διαδικασία της εκκαθάρισης, κατασκευάζονται οι καμπύλες προσφοράς και ζήτησης από τις προσφορές αγοράς και πώλησης των συμμετεχόντων, με σκοπό τον προσδιορισμό της τιμής εκκαθάρισης, για κάθε μία από τις επόμενες 24 ώρες προσομοίωσης. Όλες οι προσφορές πώλησης πάνω από το σημείο εκκαθάρισης και όλες οι προσφορές αγοράς κάτω από αυτό πραγματοποιούνται, ενώ οι ανεπιτυχείς προσφορές απορρίπτονται. 69

70 Σχήμα 3.4: Οι αλληλεπιδράσεις των πρακτόρων στην ΑΧΠ για τις τελευταίες 48 ώρες προσομοίωσης, όπως φαίνονται στο γραφικό περιβάλλον του διαγωνισμού. 3.6 Ο πράκτορας Broker Κάθε πράκτορας που συμμετέχει ως μεσάζων στο Power TAC, προκειμένου να επιτύχει το μέγιστο δυνατό κέρδος, καλείται να επιτύχει δύο βασικούς στόχους [79]: Πρωταρχικός στόχος: Κάθε πράκτορας πρέπει είναι να δημιουργήσει ένα χαρτοφυλάκιο καλής ποιότητας. Το ιδανικό χαρτοφυλάκιο είναι κερδοφόρο και ισορροπημένο, με πολύ μικρές αποκλίσεις μεταξύ προσφοράς και ζήτησης, σύμφωνα με τις προβλέψεις του πράκτορα για τη μελλοντική συμπεριφορά των πελατών του αλλά και της αγοράς, λαμβάνοντας υπόψη μια σειρά περιβαλλοντικών συνθηκών. Δευτερεύων στόχος: Κάθε πράκτορας θα πρέπει να διαχειρίζεται με σωστό και προσεγμένο τρόπο τους κινδύνους που μπορεί να προκύψουν από κάποια 70

71 λανθασμένη κίνηση του στην αγορά, όσο και τους κινδύνους απρόσμενης διακύμανσης προσφοράς και ζήτησης του πελατολογίου του. Για την καλύτερη κατανόηση των αρμοδιοτήτων του πράκτορα που καλούμαστε να υλοποιήσουμε, στη συνέχεια παρατίθεται μία συνοπτική περιγραφή ενός τυπικού παιχνιδιού στην πλατφόρμα του Power TAC. Ακόμα, επειδή στόχος της παρούσας διπλωματικής είναι η σχεδίαση της τιμολογιακής πολιτικής του πράκτορα, παρατίθεται η ανάλυση των τιμολογίων ΗΕ που υποστηρίζει η πλατφόρμα Περιγραφή ενός τυπικού παιχνιδιού Έναρξη Παιχνιδιού (Competition Starting) Κατά την έναρξη ενός παιχνιδιού, για λόγους ισότητας, όλοι οι πελάτες είναι εγγεγραμμένοι στα τιμολόγια του Default Broker της ΑΔ. Τα τιμολόγια αυτά, είναι σχεδιασμένα ώστε να μην είναι ελκυστικά, και οι πελάτες να επιλέξουν τα τιμολόγια των ανταγωνιστικών μεσαζόντων, μόλις αυτά εκδοθούν. Ένα τυπικό παιχνίδι ξεκινά αφού ολοκληρωθούν 14 ημέρες προσομοίωσης, όπου τα μόνα ενεργά τιμολόγια είναι αυτά του Default Broker. Τα λεγόμενα δεδομένα εκκίνησης (bootstrap) που προκύπτουν στην περίοδο αυτή των 14 πρώτων ημερών, αποστέλλονται στους παίκτες πριν από την έναρξη του παιχνιδιού και περιλαμβάνουν: Πληροφορίες για τους πελάτες (customer information): Πρόκειται για τα μεγέθη κατανάλωσης ή παραγωγής ΗΕ των διαθέσιμων πελατών της πλατφόρμας, ανά μία (1) ώρα, και για τις 14 ημέρες προσομοίωσης. Πληροφορίες για την αγορά (market information): Πρόκειται για τα μεγέθη ενέργειας σε MWh που διαπραγματεύτηκε ο Default Broker στην ΑΧΠ, καθώς και οι αντίστοιχες τιμές/mwh. Πληροφορίες καιρικών συνθηκών (weather information): Πρόκειται για τις καιρικές συνθήκες ανά 1 ώρα προσομοίωσης. Οι πληροφορίες αυτές είναι ιδιαίτερα σημαντικές για τους πράκτορες προκειμένου να επιτύχουν μία καλή εκκίνηση στην αγορά. Πέρα από τις παραπάνω πληροφορίες, κατά την έναρξη του παιχνιδιού όλοι οι πράκτορες λαμβάνουν ενημέρωση για τα εξής: 71

72 Παράμετροι αρχικοποίησης παιχνιδιού (general & initialization game parameters): Αρχικές παράμετροι του διαγωνισμού όπως π.χ. ο αριθμός των μεσαζόντων, η αναμενόμενη διάρκεια, η διάρκεια ενός timeslot, οι τιμές των διάφορων συνδρομών, τα επιτόκια της τράπεζας κτλ. Στα παραπάνω περιλαμβάνεται η δημοσιοποίηση των ταυτοτήτων των μεσαζόντων. Προεπιλεγμένα Τιμολόγια (Default tariffs): Τα τιμολόγια που προσφέρει ο Default Broker Κύκλος Ενεργειών (Activity Cycle) Για την ανάλυση των ενεργειών που πραγματοποιούνται κατά την διάρκεια του παιχνιδιού, είναι απαραίτητο να ορίσουμε την έννοια του χρόνου στην πλατφόρμα του Power TAC. Έτσι σύμφωνα με το [79], ο χρόνος μετράται σε διακριτές μονάδες, τα λεγόμενα timeslots. Ένα τυπικό παιχνίδι διαρκεί 60 ημέρες προσομοίωσης ή 1440 timeslots. Κάθε χρονική στιγμή υπάρχει ένα τρέχων timeslot και ένα σύνολο από μελλοντικά ενεργά timeslots (συνήθως 24) για τα οποία η ΑΧΠ είναι ανοιχτή για αγοραπωλησίες. Σε κάθε timeslot υπάρχει μια σειρά κινήσεων που μπορεί να πραγματοποιήσει κατά βούληση ένας πράκτορας. Στο Σχήμα 3.5 φαίνεται αυτός ο κύκλος ενεργειών που εκτελεί κάθε πράκτορας, καθώς και οι αλληλεπιδράσεις του με τις υπόλοιπες οντότητες του συστήματος, οι όποιες αναλύονται παρακάτω. 72

73 Σχήμα 3.5: Κύκλος ενεργειών πράκτορα κατά τη διάρκεια ενός timeslot [79]. Αγορά Χονδρικής Πώλησης (Wholesale Market) Στην αρχή του timeslot πραγματοποιείται εκκαθάριση της ΑΧΠ και κάθε πράκτορας μπορεί να υποβάλλει τις προσφορές του προς αγορά ή πώληση ενέργειας για τα επόμενα timeslots. Έπειτα, του αποστέλλεται ένα βιβλίο παραγγελιών που περιλαμβάνει όλες τις επιτυχημένες και μη συναλλαγές που υποβλήθηκαν στην αρχή του timeslot από όλους τους πράκτορες, καθώς και επιπλέον πληροφορίες για τις προσφορές του ιδίου. Μετεωρολογική Υπηρεσία (Weather Service) Η Μετεωρολογική Υπηρεσία ενημερώνει κάθε πράκτορα για τον τρέχοντα καιρό καθώς και τις προβλέψεις για τα επόμενα 24 timeslots. 73

74 Αγορά Τιμολογίων (Tariff Market) Σε κάθε timeslot, κάθε πράκτορας μπορεί να υπολογίζει και να υποβάλλει νέα τιμολόγια ΗΕ στην Αγορά Τιμολογίων, καθώς επίσης και να λαμβάνει ενημέρωση για τα ενεργά τιμολόγια όλων των συμμετεχόντων. Πελάτες (Customers) Πέρα από την έκδοση νέων τιμολογίων, κάθε πράκτορας μπορεί να μεταβάλλει τις τιμές των ήδη ενεργών τιμολογίων (τα οποία συνήθως έχουν συμβεβλημένους πελάτες), με στόχο την εξισορρόπηση των μεγεθών ενέργειας που διαχειρίζεται. Οι συμβεβλημένοι πελάτες αποστέλλουν στον πράκτορα τα στοιχεία για τη ατομική τους κατανάλωση ή παραγωγή ΗΕ. Τέλος, κάθε πράκτορας λαμβάνει ενημέρωση σχετικά με αλλαγές στο χαρτοφυλάκιό του όπως νέες εγγραφές ή αποχωρήσεις πελατών. Αρχή Διανομής (Distribution Utility) Ο πράκτορας υποβάλλει τις προσφορές του για εξισορρόπηση ενέργειας στην ΑΔ. Από την πλευρά της, η ΑΔ εκτελεί όλες τις απαραίτητες ενέργειες εξισορρόπησης της απαιτούμενης ηλεκτρικής ενέργειας και ενημερώνει τον πράκτορα. Λογιστική (Accounting) Η υπηρεσία αυτή είναι υπεύθυνη για την ενημέρωση του πράκτορα σχετικά με α) όλες τις οικονομικές του συναλλαγές, β) τον τραπεζικό του λογαριασμό και γ) τις δεσμεύσεις του για εισαγωγή/εξαγωγή ενέργειας για τα επόμενα 24 timeslots στην χονδρική αγορά. Στη συνέχεια, στο Σχήμα 3.6 φαίνεται πως το σύνολο των παραπάνω αλληλεπιδράσεων, παρουσιάζεται στο γραφικό περιβάλλον του διαγωνισμού. 74

75 Σχήμα 3.6: Το σύνολο των αλληλεπιδράσεων κάθε πράκτορα στη διάρκεια ενός παιχνιδιού, όπως παρουσιάζεται στο γραφικό περιβάλλον του Power TAC Ολοκλήρωση Παιχνιδιού (Competition Εnding) Ένα τυπικό παιχνίδι, ολοκληρώνεται έπειτα από ένα σύνολο timeslots, έπειτα από την 55η ημέρα προσομοίωσης (timeslot 1320). Από τη μέρα εκείνη και μετά, για κάθε timeslot, υπολογίζεται μία πιθανότητα λήξης του παιχνιδιού. Έτσι, η μεταβλητή ακολουθεί γεωμετρική κατανομή. Η αθροιστική κατανομή πιθανότητας ότι το παιχνίδι θα λήξει έπειτα από επιπλέον timeslot δίνεται από τη σχέση: (3.3) 75

76 Η πιθανότητα (timeslot 1440) υπολογίζεται από τη σχέση: ότι το παιχνίδι δεν θα λήξει πριν από την 60 η ημέρα προσομοίωσης (3.4) Έτσι η πιθανότητα, υπολογίζεται από τη σχέση: (3.5) Για παράδειγμα, εάν η πιθανότητα το παιχνίδι να ολοκληρωθεί μετά από 60 ημέρες προσομοίωσης (timeslot 1440 timeslot 1320), είναι, δηλαδή, τότε, και. Η πιθανότητα επιλέγεται τυχαία από μία ομοιόμορφη κατανομή στο διάστημα, όπου η πιθανότητα όπως υπολογίστηκε στο παράδειγμα, δηλαδή. Συμπερασματικά, δοθείσας της τυχαίας ημέρας λήξης και δεδομένου ότι μία ημέρα προσομοίωσης διαρκεί περίπου δύο (2) λεπτά, ένα τυπικό παιχνίδι μπορεί να διαρκέσει συνολικά έως και δύο (2) ώρες πραγματικού χρόνου Τιμολόγια Ηλεκτρικής Ενέργειας Για την καλύτερη κατανόηση των τιμολογίων που δύναται να αναπτύξει κάθε πράκτορας, σε αυτό το κεφάλαιο αναλύεται η δομή που μπορεί να έχει ένα τιμολόγιο ΗΕ στην πλατφόρμα του Power TAC, καθώς και οι πιθανές καταστάσεις που λαμβάνει κατά τη διάρκεια ενός παιχνιδιού Δομή Η αναλυτική δομή ενός τιμολογίου στο Power TAC φαίνεται στο Σχήμα 3.7. Η δομή αυτή είναι ικανή να περιγράψει βέλτιστα όλους τους δυνατούς συνδυασμούς τιμολόγησης που υφίστανται σε μία πραγματική αγορά ΗΕ. 8 Σημειώνεται οτι μέχρι και τον διαγωνισμό του 2013, στην πλατφόρμα δίνεται η δυνατότητα προσέγγισης πελατών μόνο με τιμολόγια ΗΕ, ενώ δεν υπάρχει υλοποιημένο σύστημα συναλλαγής μεμονωμένων συμβολαίων. 76

77 Σχήμα 3.7: Δομή Τιμολογίου [79]. Για κάθε τιμολόγιο μπορούν να οριστούν οι εξής παράμετροι: Πληρωμές εγγραφής (signup payments): Πρόκειται για πληρωμές που πραγματοποιούνται κατά την εγγραφή ενός πελάτη σε ένα από τα ενεργά τιμολόγια του πράκτορα. Οι πληρωμές αυτές μπορεί να είναι σε μορφή συνδρομής από τον πελάτη προς τον πράκτορα, είτε σε μορφή bonus από τον πράκτορα προς τον πελάτη. Κυρώσεις πρόωρης διακοπής συμβολαίου (early withdraw penalties): Για κάθε τιμολόγιο μπορεί να οριστεί μία ελάχιστη διάρκεια. Σε περίπτωση που ο πελάτης επιθυμεί να διακόψει το συμβόλαιο του πριν από τη πέρας αυτής, οφείλει να πληρώσει τις κυρώσεις αυτές. Κλιμακωτές χρεώσεις (tiered rates): Η αξία της ΗΕ διακρίνεται σε κλίμακες όπως και στις χρεώσεις IBT (κεφ ). TOU χρεώσεις: Ανάλογα με την ημέρα της εβδομάδας ή την ώρα της ημέρας κάθε πράκτορας μπορεί να ορίσει διαφορετικές χρεώσεις (κεφ ). Two-part τιμολόγια: Όπως περίπου και στα τιμολόγια Two-Part RTP (κεφ ), πρόκειται για τιμολόγια που ορίζουν μία ημερήσια αμοιβή (πάγιο), και μία αμοιβή για τη χρήση της ενέργειας. Μεταβλητές χρεώσεις (variable rates): Πρόκειται για δυναμικές χρεώσεις, οι οποίες ορίζονται για κάθε timeslot ανάλογα με τις προβλέψεις του πράκτορα που τις 77

78 εκδίδει. Κάθε πράκτορας πρέπει να ενημερώνει τους συμβεβλημένους σε αυτόν πελάτες, για τις χρεώσεις αυτές, μερικά timeslot, πριν την εφαρμογή τους. Διακοπτόμεναa τιμολόγια (Interruptible tariffs): Πρόκειται για τιμολόγια που επιτρέπουν στον πράκτορα να δεσμεύσει ένα μέρος του φορτίου του πελάτη, που βοηθούν τον πράκτορα είτε να μειώσει το συνολικό κόστος της ενέργειας που διαχειρίζεται, είτε να μειώσει το κόστος εξισορρόπησης. Συμπερασματικά, μπορούμε να πούμε, πως το πρόβλημα βελτιστοποίησης που καλείται να επιλύσει κάθε πράκτορας μεσάζων, έγκειται στην εύρεση ενός συνδυασμού των παραπάνω παραμέτρων, που είναι ικανός να του αποφέρει το μέγιστο δυνατό κέρδος Καταστάσεις Από τη στιγμή της έκδοσης μέχρι τη στιγμή της απόσυρσης του, ένα τιμολόγιο ΗΕ μπορεί να διέλθει από διάφορες καταστάσεις όπως φαίνεται στο Σχήμα 3.8. Στη συνέχεια, παρατίθεται η ανάλυση και ο τρόπος μετάβασης μεταξύ των καταστάσεων ενός τιμολογίου. Κάθε πράκτορας μπορεί να υποβάλει νέα τιμολόγια προς έκδοση οποιαδήποτε στιγμή (κατάσταση Pending). Ανά συγκεκριμένα χρονικά διαστήματα, τα νέα τιμολόγια εκδίδονται στην Αγορά Τιμολογίων και γίνονται γνωστά στους πελάτες και στους αντίπαλους πράκτορες (κατάσταση Offered). Από τη στιγμή που ένα τιμολόγιο αποκτά συμβεβλημένους πελάτες γίνεται Active. Κάθε τιμολόγιο μπορεί να έχει ημερομηνία λήξης, μετά από την οποία δεν επιτρέπονται νέοι πελάτες σε αυτό (κατάσταση Expired), και αντίστοιχα οι πελάτες που είναι εγγεγραμμένοι σε αυτό μπορούν να αποσυρθούν χωρίς κυρώσεις. Σε περίπτωση που ένας πράκτορας θέλει να τροποποιήσει ένα ήδη ενεργό τιμολόγιο, θα πρέπει αρχικά να προσφέρει ένα νέο που θα το αντικαταστήσει, και έπειτα να ωθήσει τους πελάτες αποσυρθούν από το παλιό αποσύροντας το από την αγορά (κατάσταση Revoked). Εάν έχει οριστεί το τιμολόγιο που αντικαθιστά αυτό που μόλις διαγράφηκε, οι συμβεβλημένοι πελάτες του περνούν αυτόματα στο νέο, χωρίς όμως να υποχρεούνται να παραμείνουν σε αυτό. Σε περίπτωση που δεν έχει οριστεί νέο τιμολόγιο, οι πελάτες εγγράφονται εκ νέου στα τιμολόγια του Default Broker. 78

79 Σχήμα 3.8: Διάγραμμα καταστάσεων τιμολογίων [79]. 3.7 Αγορά Πελατών Λιανικής Με στόχο την όσο το δυνατόν καλύτερη προσέγγιση μίας πραγματικής αγοράς ΗΕ, το Power TAC περιλαμβάνει διάφορα είδη παραγωγών και καταναλωτών ΗΕ που αποτελούν την λεγόμενη Αγορά Πελατών Λιανικής (Customer Market). Σύμφωνα με το μέγεθος της ενέργειας που διαπραγματεύονται οι πελάτες, ορίζεται και το είδος της συμφωνίας που μπορούν να πραγματοποιήσουν με τους μεσάζοντες. Για τους περισσότερους πελάτες, όπως νοικοκυριά, μικρές επιχειρήσεις και μικρούς παραγωγούς, οι πράκτορες προσφέρουν τιμολόγια ΗΕ μέσω της Αγοράς Τιμολογίων (Tariff Market). Για μεγάλους παραγωγούς και καταναλωτές, όπως μεγάλες βιομηχανικές εγκαταστάσεις, πανεπιστημιακές εγκαταστάσεις, ή θερμοκήπια με μονάδες ΣΗΘ, που έχουν την δυνατότητα να συναλλαχθούν και στην αγορά χονδρικής, οι πράκτορες προσφέρουν Ατομικά Συμβόλαια (Individual Contracts) 9. Τα διάφορα είδη πελατών της πλατφόρμα του Power TAC, προσομοιώνονται από μία σειρά μοντέλων πελατών. Τα μοντέλα αυτά, σύμφωνα με το πρότυπο κατανάλωσης τους, μπορούν να διακριθούν στα εξής κατηγορίες [28]: οικιακοί καταναλωτές (household customers): Πρόκειται για τυπικούς οικιακούς καταναλωτές ΗΕ. Το πρότυπο κατανάλωσης τους χαρακτηρίζεται από ιδιαίτερα υψηλές τιμές κατανάλωσης κυρίως το πρωί και αργά το απόγευμα. 9 Τα μεμονωμένα συμβόλαια δεν υλοποιήθηκαν μέχρι και τον διαγωνισμό του

80 επαγγελματικά γραφεία (office customers): Πρόκειται για μικρούς καταναλωτές ΗΕ η κατανάλωση των οποίων είναι σταθερή τις ώρες γραφείου και χαμηλότερη τις υπόλοιπες. οι καταναλωτές μεγάλου μεγέθους (factored customers): Πρόκειται για βιομηχανικούς πελάτες, είτε οικισμούς σπιτιών, ξενοδοχεία, νοσοκομεία κ.α. που μπορεί να καταναλώνουν αλλά και να παραγάγουν ΗΕ. Η κατανάλωση/παραγωγή τους είναι πολύ μεγαλύτερη σε μέγεθος από τα μικρότερα αλλά λεπτομερέστερα μοντέλα των προαναφερθέντων πελατών, όμως παρουσιάζει έντονες διακυμάνσεις πολύ μεγαλύτερου πλάτους. Οι ενέργειες που πραγματοποιούν τα μοντέλα των πελατών, συνοπτικά περιλαμβάνουν: α) επιλογή τιμολογίων, β) παροχή διακοπτόμενης ισχύος (Interruptible Consumption) στην ΑΔ και γ) παραγωγή/κατανάλωση ισχύος. Σχήμα 3.9: Η ενέργεια που εμπορεύτηκε ένας συγκεκριμένος πελάτης στη διάρκεια του παιχνιδιού και το αντίστοιχο κόστος της, στο γραφικό περιβάλλον του παιχνιδιού. 80

81 3.7.1 Αξιολόγηση Τιμολογίων Οι πελάτες παίζουν πρωταρχικό ρόλο στην Αγορά Τιμολογίων. Επιλέγοντας ή απορρίπτοντας τις διαθέσιμες προσφορές τιμολογίων των πρακτόρων, έχουν την δυνατότητα να ελέγχουν τη διαδικασία καθορισμού των επιτυχημένων τιμολογίων. Επομένως, για τη βέλτιστη διαμόρφωση τιμολογιακής πολιτικής, είναι απαραίτητο να εξετασθεί η στρατηγική επιλογής τιμολογίων που ακολουθούν τα μοντέλα των πελατών. Κάθε έξι (6) timeslot μίας ημέρας προσομοίωσης, οι πελάτες ενημερώνονται για όλες τις διαθέσιμες προσφορές τιμολογίων των πρακτόρων προκειμένου να τις αξιολογήσουν και να επιλέξουν τελικά αυτή που θεωρούν πιο συμφέρουσα για την καταναλωτική τους συμπεριφορά. Κατά τη διαδικασία της αξιολόγησης, κάθε προσφορά αντιστοιχίζεται σε μία τιμή χρησιμότητας (Tariff Utility Value) που δείχνει το κατά πόσο είναι συμφέρουσα για τον πελάτη σύμφωνα με διάφορους παράγοντες. Η τιμή αυτή υπολογίζεται για κάθε διαθέσιμο τιμολόγιο από την συνάρτηση χρησιμότητας (Objective Function), που δίνεται από την εξίσωση: ( ) (3.6) Σύμφωνα με αυτή την εξίσωση, η χρησιμότητα ενός τιμολογίου υπολογίζεται ως συνάρτηση: α) των χρεώσεων ανά kwh,, β) των πάγιων χρεώσεων,, γ) του κόστους εγγραφής,, δ) του κόστους πρόωρης διακοπής συμβολαίου,, σε περίπτωση που ο ελάχιστος χρόνος του τιμολογίου που είναι συμβεβλημένος δεν έχει ολοκληρωθεί και ε) ένα συντελεστή όχλησης (inconvenience factor), πόσο ο πελάτης είναι διατεθειμένος να αλλάξει τιμολόγιο., που δείχνει κατά Η αναλυτική μορφή της εξίσωσης 3.6 μπορεί να είναι διαφορετική για κάθε μοντέλο πελάτη. Σε γενικές γραμμές, πρόκειται για την κανονικοποιημένη διαφορά του κόστους, που θα είχε ο πελάτης, αν ήταν εγγεγραμμένος στο αντίστοιχο τιμολόγιο του Default Broker σε σχέση με το κόστος του τιμολογίου προς αξιολόγηση μείον τον παράγοντα όχλησης. Για τιμολόγια κατανάλωσης, το κόστος υπολογίζεται σύμφωνα με ένα πρότυπο κατανάλωσης, για μία ενδεχόμενη διάρκεια, υιοθέτησης του τιμολογίου προς αξιολόγηση. Το κόστος υιοθέτησης του τιμολογίου του Default Broker δίνεται από τη σχέση: 81

82 (3.7) όπου είναι η ανα kwh σταθερή χρέωση και η πάγια χρέωση που αντιστοιχεί στο Default τιμολόγιο. Το αντίστοιχο κόστος για την υιοθέτηση του τιμολογίου που εκδώθηκε από άλλον πράκτορα, για το ίδιο πρότυπο κατανάλωσης, δίνεται από τη σχέση: (3.8) όπου περιλαμβάνεται τόσο το κόστος απόσυρσης από το τιμολόγιο που είναι ήδη συμβεβλημένος ο πελάτης, καθώς και το ενδεχόμενο κόστος απόσυρσης από το τιμολόγιο,, μειωμένο κατά ένα παράγοντα όπου το ελάχιστο χρονικό διάστημα δέσμευσης που ορίζει το. Τέλος, το κόστος να παραμείνει ο πελάτης στο τιμολόγιο που είναι ήδη εγγεγραμμένος δίνεται από τη σχέση: (3.9) όπου προφανώς δεν απαιτείται να χρεωθεί κόστος εγγραφής ή απόσυρσης. Η κανονικοποιημένη διαφορά για την περίπτωση των τιμολογίων κατανάλωσης δίνεται από τη σχέση Αντίστοιχα, για την περίπτωση των τιμολογίων παραγωγής χρησιμοποιείται η συνάρτηση (3.10) (3.11) Το διαφορετικό πρόσημο των συντελεστών του αριθμητή στις δύο παραπάνω σχέσεις οφείλεται στο ότι οι πληρωμές λαμβάνουν αρνητικό πρόσημο, ενώ οι αντίστοιχες πληρωμές από τον πράκτορα προς τον πελάτη έχουν αρνητικό πρόσημο. Για τιμολόγια που κυμαίνονται σε λογικές χρεώσεις, αναμένεται να ισχύει. Έτσι, τιμολόγια που είναι λιγότερο ελκυστικά από εκείνα που προσφέρει ο Default Broker έχουν, ενώ υπάρχουν ελάχιστες περίεργες περιπτώσεις όπου μπορεί να ισχύει. Μία τέτοια περίπτωση συμβαίνει όταν δίνεται στον πελάτη επιδότηση 82

83 εγγραφής ύψους τέτοιου ώστε να αντισταθμίζει το κόστος κατανάλωσης ΗΕ για την περίοδο αξιολόγησης. Συνδυάζοντας τα παραπάνω, η χρησιμότητα ενός τιμολογίου δίνεται από τη σχέση: (3.12) όπου μεταβλητή που επιλέγεται τυχαία για κάθε πελάτη από μία ομοιόμορφη κατανομή, και ο συντελεστής όχλησης που ορίζεται ως γραμμικός συνδυασμός συντελεστών που τιμωρούν προδιαγραφές τιμολογίων όπως μεταβλητές χρεώσεις, TOU χρεώσεις και κλιμακωτές χρεώσεις. Οι τρεις αυτοί συντελεστές κλιμακώνονται επί μία παράμετρο έτσι ώστε για παράδειγμα μία διακύμανση τιμής 3:1 τιμωρείται κατά το ήμισυ σε σχέση με μία αντίστοιχη 9:1. Προκειμένου να περιοριστούν οι άσκοπες μετεγγραφές μεταξύ ισοδύναμων τιμολογίων, ο συντελεστής όχλησης τιμωρεί επίσης όποιες τέτοιες αλλαγές. Η τιμή χρησιμότητας ενός τιμολογίου μπορεί να λάβει αρνητικές τιμές ακόμα και αν η αντίστοιχη τιμή είναι θετική λόγω της επίδρασης του συντελεστή. Τιμές με μπορεί να προκύψουν για τιμολόγια κατανάλωσης μόνο στην περίπτωση που ο πράκτορας πληρώνει τον πελάτη για να αγοράσει ενέργεια. Από την άλλη μεριά, ένα τιμολόγιο παραγωγής ΗΕ που προσφέρει διπλάσιο κέρδος στον πελάτη σε σχέση με το αντίστοιχο του Default τιμολογίου, αναμένεται και αυτό να έχει. Τέλος, για τιμολόγια που περιλαμβάνουν μεταβλητές χρεώσεις, οι πελάτες προσδιορίζουν το αντίστοιχο αναμενόμενο κόστος συνυπολογίζοντας και το ρίσκο που καλούνται να αναλάβουν. Οι εξισώσεις αυτές δεν περιλαμβάνονται στην παρούσα ανάλυση διότι ο πράκτορας που υλοποιήσαμε, δεν προσφέρει τιμολόγια αυτού του είδους ο ενδιαφερόμενος αναγνώστης παραπέμπεται στο [79] Επιλογή Τιμολογίων Προκειμένου κάθε πελάτης να επιλέξει μεταξύ των προσφερόμενων τιμολογίων, λαμβάνει τα πιο πρόσφατα τιμολόγια κάθε πράκτορα προς αξιολόγηση. Η παράμετρος αυτή ορίζεται συνήθως ίση με πέντε (5) τιμολόγια από κάθε είδος ενέργειας που μπορεί να χρησιμοποιήσει ο πελάτης. Γενικά, εάν στο παιχνίδι συμμετέχουν πράκτορες, και έστω 83

84 ένας πελάτης που μπορεί να χρησιμοποιήσει είδη ενέργειας, τότε το σύνολο των τιμολογίων που καλείται να αξιολόγησει ο συγκεκριμένος πελάτης δίνεται από τη σχέση: (3.13) όπου, ο αριθμός των τιμολογίων που προσφέρει ο πράκτορας, για το είδος ενέργειας, το οποίο μπορεί να χρησιμοποιήσει ο πελάτης, και. Για παράδειγμα, για ένα ηλεκτρικό όχημα, μπορεί να εφαρμοστεί ένα τιμολόγιο τύπου: α) ηλεκτρικών οχημάτων, β) διακοπτόμενης κατανάλωσης, γ) γενικής αποθήκευσης και δ) κατανάλωσης, δηλαδή. Εάν θεωρήσουμε ότι στο παιχνίδι συμμετέχουν τρεις (3) πράκτορες, που προσφέρουν πέντε (5) τιμολόγια για κάθε είδος ενέργειας από τα παραπάνω, τότε σύμφωνα με την σχέση 3.13, ο συγκεκριμένος πελάτης καλείται να αξιολογήσει τιμολόγια. Αφού ολοκληρωθεί η διαδικασία του υπολογισμού της χρησιμότητας κάθε τιμολογίου, οι πελάτες καλούνται να επιλέξουν σε ποιό θα εγγραφούν. Παρόλο που το τιμολόγιο με την μεγαλύτερη τιμή χρησιμότητας θεωρείται το πιο συμφέρον, δεν είναι αυτό που επιλέγεται πάντα από τους πελάτες. Αυτό συμβαίνει διότι δεν είναι όλοι οι πελάτες το ίδιο ορθολογικοί (rational). Για το λόγο αυτό σε κάθε τιμολόγιο του συνόλου των προς αξιολόγηση, αντιστοιχίζεται μία πιθανότητα επιλογής που δίνεται από τη σχέση (3.14) Η παράμετρος αποτελεί ένα μέτρο του κατά πόσο ένας πελάτης είναι ορθολογικός. Έτσι για, ο πελάτης δεν είναι καθόλου ορθολογικός και οι επιλογές του είναι τυχαίες, ενώ όσο το ο πελάτης επιλέγει πάντα το τιμολόγιο με την μέγιστη τιμή χρησιμότητας. Στο Σχήμα 3.10 που ακολουθεί, φαίνεται πως παρουσιάζεται στο γραφικό περιβάλλον του διαγωνισμού το μερίδιο πελατών που αντιστοιχεί σε κάθε πράκτορα. 84

85 Σχήμα 3.10: Το μερίδιο πελατών κάθε πράκτορα για μία συγκεκριμένη στιγμή ενός παιχνιδιού, όπως παρουσιάζεται στο γραφικό περιβάλλον του διαγωνισμού. 85

86 Κεφάλαιο 4 Περιγραφή Υλοποίησης Το κεφάλαιο αυτό έχει ως στόχο να περιγράψει την διαδικασία ανάπτυξης της στρατηγικής διαμόρφωσης τιμολογίων του πράκτορα μας, καθώς και τη γενικότερη λειτουργία του στην Αγορά Τιμολογίων (Tariff Market). Η στρατηγική διαμόρφωσης τιμολογίων που αναπτύχθηκε στηρίζεται στον αλγόριθμο Βελτιστοποίησης με Χρήση Σμήνους Σωματιδίων, η θεωρητική ανάλυση του οποίου περιλαμβάνεται στο παρόν κεφάλαιο. 4.1 Ο πράκτορας Κάθε πράκτορας-μεσάζων στο Power TAC προκειμένου να επιτύχει τη μεγιστοποίηση του κέρδος του, καλείται να λάβει αποφάσεις που στο σύνολο τους συνθέτουν ένα πρόβλημα αυξημένης πολυπλοκότητας. Για την εύρεση μιας ολοκληρωμένης και καλύτερης δυνατής λύσης, διαμερίζουμε το πρόβλημα σε τρία επιμέρους υπό-προβλήματα: τη διαμόρφωση και προσφορά τιμολογίων, την ενημέρωση ή κατάργηση των προσφερόμενων τιμολογίων και την αγορά ΗΕ από την ΑΧΠ 86

87 Στόχος της παρούσας διπλωματικής, είναι η επίλυση των δύο πρώτων υπόπροβλημάτων, αφού όπως έχει ήδη αναφερθεί, εστιάζει στην συμπεριφορά του πράκτορα στην Αγορά Τιμολογίων. Έτσι για τη λειτουργία του πράκτορα, σχεδιάστηκε μία στρατηγική διαμόρφωσης νέων τιμολογίων και μία στρατηγική ενημέρωσης των ήδη ενεργών τιμολογίων. 4.2 Θεωρητική ανάλυση και διατύπωση του αλγορίθμου Βελτιστοποίησης με Χρήση Σμήνους Σωματιδίων (Particle Swarm Optimization) Στην παράγραφο αυτή αναλύεται ο αλγόριθμος PSO στον οποίο στηρίχθηκε η στρατηγική διαμόρφωσης τιμολογίων του πράκτορα. Η βασική ιδέα στην οποία στηρίζεται ο αλγόριθμος PSO είναι ένας πληθυσμός σωματιδίων (particle swarm), οι θέσεις των οποίων αντιπροσωπεύουν υποψήφιες λύσεις του προβλήματος. Κάθε σωματίδιο ορίζεται πλήρως από τρία D-διάστατα διανύσματα, όπου η παράμετρος D καθορίζεται με βάση τις διαστάσεις του χώρου αναζήτησης. Τα διανύσματα αυτά είναι: α) η τρέχουσα θέση, β) η τρέχουσα ταχύτητα και γ) η προηγούμενη ατομική καλύτερη θέση. Σε κάθε εκτέλεση του αλγορίθμου, η τρέχουσα θέση του σωματιδίου, αξιολογείται συμφωνα με τη τιμή καταλληλότητας της. Εάν η θέση αυτή είναι η καλύτερη στην οποία έχει βρεθεί το σωματίδιο ως εκείνη τη στιγμή, δηλαδή έχει την καλύτερη τιμή καταλληλότητας ως τώρα, τότε οι συντεταγμένες της αποθηκεύονται στο διάνυσμα και η τιμή καταλληλότητας αποθηκεύεται σε μία μεταβλητή με όνομα pbest i ( previous best ). Η έννοια του πληθυσμού σωματιδίων είναι κάτι παραπάνω από μία απλή ομάδα σωματιδίων. Κάθε άτομο μπορεί μόνο του να μην έχει καμία ισχύ, όμως το κλειδί της αποτελεσματικότητας του αλγορίθμου για την επίλυση προβλημάτων βρίσκεται στις αλληλεπιδράσεις μεταξύ των ατόμων. Κάθε άτομο επικοινωνεί με τα γειτονικά του προκειμένου οι επόμενες θέσεις του να επηρεάζονται τόσο από το ιστορικό των καλύτερων θέσεων του ιδίου, όσο και από αυτό των γειτόνων του [103]. Η συνολικά καλύτερη θέση είναι πρακτικά το διάνυσμα του «καλύτερου γείτονα» ( neighbor best ). Αυτό 87

88 αποθηκεύεται ως διάνυσμα, και η αντίστοιχη τιμή καταλληλότητας αποθηκεύεται στη μεταβλητή gbest i ( global best ). Ο PSO στηρίζεται σε δύο βασικές λειτουργίες: α) την ανανέωση της ταχύτητας (velocity update) και β) την ανανέωση της θέσης (position update) κάθε σωματιδίου, που δίνονται από τις εξισώσεις [75]: ( ) (4.1) (4.2) όπου: α) ο συντελεστής αναπαριστά ένα διάνυσμα από τυχαίους αριθμούς οι οποίοι κατανέμονται ομοιόμορφα στο διάστημα [0, ] και δημιουργείται εκ νέου τυχαία για κάθε σωματίδιο σε κάθε επανάληψη του αλγορίθμου, β) το συμβολίζει πως ο πολλαπλασιασμός πραγματοποιείται σε επίπεδο συνιστωσών και γ) στην κλασική έκδοση του PSO κάθε συνιστώσα του κυμαίνεται σε ένα προκαθορισμένο εύρος [. Από την εξίσωση 4.1 γίνεται προφανές πως η κίνηση κάθε σωματιδίου επηρεάζεται τόσο από τις θέσεις που έχει ατομικά αξιολογήσει ως καλύτερες το κάθε σωματίδιο, όσο και από αυτές των γειτόνων του. Έτσι, σε κάθε εκτέλεση του αλγορίθμου ο πληθυσμός τείνει να εστιάζει σε περιοχές όπου φαίνεται να υπάρχουν ολοένα καλύτερες υποψήφιες λύσεις (Σχήμα 4.1). Τέλος, ο αλγόριθμος συγκλίνει είτε όταν επιτευχθεί ένας δεδομένος αριθμός επαναλήψεων, είτε όταν βρεθεί μία λύση με αρκούντος καλή τιμή καταλληλότητας. Το κατά πόσο μία τιμή καταλληλότητας είναι καλή ορίζεται συνήθως σύμφωνα με τους περιορισμούς που έχουν τεθεί από το πρόβλημα ( [103], [114]). Σχήμα 4.1: Απεικόνιση της ανανέωσης θέσης και ταχύτητας στον αλγόριθμο PSO [54]. 88

89 Στο Σχήμα 4.2 παρουσιάζεται η κλασική αλγοριθμική υλοποίηση της τεχνικής PSO. FOR each particle Initialize particle ENDFOR REPEAT FOR each particle Calculate fitness value IF the fitness value is better than its personal best THEN set pbest i equal to the current value AND p i equal to the current location x i ENDIF ENDFOR Identify the particle in the neighborhood with the best fitness value so far and assign its index to the variable gbest. FOR each particle Calculate the particle velocity according to equation (4.1) Update particle position according to equation (4.2) ENDFOR UNTIL a criterion is met (usually a sufficient good fitness or a maximum number of iterations) Σχήμα 4.2: Ο κλασικός αλγόριθμος Particle Swarm Optimization Παράμετροι αλγορίθμου Η ρύθμιση των παραμέτρων στην κλασική μορφή του αλγορίθμου PSO παίζουν σημαντικό ρόλο στην επίδοση του. Για το λόγο αυτό, πρέπει να είναι καλά ορισμένες για το πρόβλημα βελτιστοποίησης που καλούμαστε να λύσουμε. Στις παραγράφους που ακολουθούν περιγράφονται οι παράμετροι αυτοί και δίνονται οι τυπικές τιμές τους. 89

90 Μέγεθος πληθυσμού Το μέγεθος του πληθυσμού ή αλλιώς ο αριθμός των σωματιδίων, συνήθως επιλέγεται εμπειρικά με βάση τις διαστάσεις και τη δυσκολία του προβλήματος. Συνήθεις τιμές είναι μεταξύ [103] Συντελεστής Vmax Σύμφωνα με την ανάλυση που προηγήθηκε, γίνεται φανερό πως η ταχύτητα κάθε σωματιδίου είναι υπεύθυνη για την τροχιά που πραγματοποιεί στο χώρο του προβλήματος. Προκειμένου, να αποφευχθούν μεγάλες και ανεξέλεγκτες ταλαντώσεις στην τροχιά αυτή, προσδιορίζονται τα άνω και κάτω όρια της ταχύτητας του σωματιδίου σε ένα εύρος [ ( [76], [103]). Η χρήση των ορίων ταχύτητας μπορεί να παρουσιάσει προβλήματα στην εκτέλεση του αλγορίθμου όταν η επιλογή τους είναι αυθαίρετη. Για την ιδανική τιμή του δεν υπάρχει κάποιος γενικός κανόνας επιλογής, αλλά προσδιορίζεται με βάση το πρόβλημα. Στην περίπτωση που η τιμή που έχει οριστεί είναι πολύ μεγαλύτερη από αυτή που πρέπει, τα σωματίδια θα εκτελούν ασταθή τροχιά περί μίας βέλτιστης λύσης, ενώ αν είναι πολύ μικρή υπάρχει πιθανότητα να μην καταφέρουν ποτέ να προσεγγίσουν την βέλτιστη λύση [30] Συντελεστές επιτάχυνσης (acceleration coefficients) Οι παράμετροι, στην εξίσωση υπολογισμού της ταχύτητας (4.1) ονομάζονται συντελεστές επιτάχυνσης (acceleration coefficients) και προσδιορίζουν το πλάτος των τυχαίων ωθήσεων προς την κατεύθυνση της ατομικής καλύτερης θέσης ενός σωματιδίου αλλά και της καλύτερης θέσης σε επίπεδο γειτόνων [103]. Οι συντελεστές αυτοί επηρεάζουν σημαντικά την εκτέλεση του PSO. Χωρίς αυτούς, ο αλγόριθμος μπορεί να γίνει περισσότερο ή λιγότερο «ευαίσθητος» και πιθανώς ασταθής, ενώ ταυτόχρονα οι ταχύτητες των σωματιδίων μπορεί αυξάνονται ανεξέλεγκτα. Εάν οι τιμές τους είναι μικρές, η κίνηση των σωματιδίων γίνεται περιορισμένη, ενώ αν είναι υψηλές, αποτυγχάνουν να συγκλίνουν [30]. Η τιμή που επιλέγεται συνήθως είναι. 90

91 Ωστόσο σημειώνεται πως η τιμή αυτή μπορεί να μην είναι η ιδανική για κάθε τύπο προβλήματος, όπως και η ισότητα των δύο συντελεστών. Μελέτες έχουν δείξει πως ακόμα και αν οι παράμετροι που περιγράφηκαν στις τρεις παραπάνω παραγράφους οριστούν σε ιδανικές για κάθε πρόβλημα τιμές, υπάρχει περίπτωση τα άτομα να εξακολουθούν να αποτυγχάνουν να συγκλίνουν [30]. Έτσι, στην κλασική εκδοχή του PSO προστέθηκαν οι παράμετροι που περιγράφονται στις παραγράφους που ακολουθούν και συμπληρώνουν την σημερινή μορφή της υλοποίησης του αλγορίθμου Συντελεστής αδράνειας (inertia weight) Το 1998, οι Shi και Eberhart παρουσίασαν μία έκδοση του κλασικού αλγορίθμου PSO με συντελεστή αδράνειας ([116], [117]). Η τροποποίηση αυτή είχε ως έναυσμα την ανάγκη για έλεγχο του εύρους της αναζήτησης, καθώς επίσης και τη μείωση της εξάρτησης από τον συντελεστή. Έτσι οι κλασικές εξισώσεις (4.1, 4.2) για ανανέωση της θέσης και της ταχύτητας πήραν την μορφή: ( ) (4.3) (4.4) Όπως φαίνεται στην 4.3, ο συντελεστής αδράνειας προηγούμενη τιμή της ταχύτητας του σωματιδίου,., πολλαπλασιάζεται με την Ένας μη μηδενικός συντελεστής αδράνειας υποδηλώνει την προτίμηση ενός σωματιδίου να συνεχίσει να κινείται προς την ίδια κατεύθυνση που κινούνταν στην προηγούμενη επανάληψη [114]. Εάν θεωρήσουμε πως ο όρος ( ) είναι η εξωτερική δύναμη που ασκείται σε ένα σωματίδιο, τότε η αλλαγή στην ταχύτητα του μπορεί να γραφεί ως εξής: (4.5) Δηλαδή, η σταθερά δρα ως συντελεστής τριβής, και μπορεί να ερμηνευθεί ως η ρευστότητα του μέσου στο οποίο κινείται το άτομο [103] (Σχήμα 4.3). Η ερμηνεία αυτή του συντελεστή αδράνειας εξηγεί το λόγο για τον οποίο οι ερευνητές υποστηρίζουν πως μία καλή απόδοση του αλγορίθμου επιτυγχάνεται αρχικοποιώντας την τιμή της αδράνειας σε μία μεγάλη τιμή (π.χ. ) και με την σταδιακή μείωση της (π.χ. στα ) [31]. Ωστόσο, το 91

92 κύριο πρόβλημα της συγκεκριμένης μεθόδου είναι πως εάν μειωθεί σημαντικά η τιμή του συντελεστή αδράνειας, το σμήνος χάνει τη δυνατότητα να ερευνά νέες περιοχές διότι χάνει την δυνατότητα του να πραγματοποιεί αναζητήσεις μεγάλου εύρους. Ακόμα, ο συντελεστής αδράνειας είναι δυνατό να πάρει τιμές μεγαλύτερες του, όμως στην περίπτωση αυτή η τροχιά των σωματιδίων γίνεται εξαιρετικά ασταθής. Με κατάλληλη επιλογή του συντελεστή αδράνειας και των συντελεστών επιτάχυνσης φ 1 και φ 2, ο PSO μπορεί να γίνει τόσο ευσταθής ώστε η παράμετρος μην είναι απαραίτητη ή να μπορεί να οριστεί σε υψηλότερη τιμή [103]. να Σχήμα 4.3: PSO με συντελεστή αδράνειας [13] Συντελεστές σύσφιξης (constriction coefficients) Μία άλλη εκδοχή του PSO προτάθηκε από τον Clerc το 2000 [23]. Σε αυτή, η χρήση των συντελεστών σύσφιξης ελέγχει την σύγκλιση των σωματιδίων, ενώ ταυτόχρονα συμβάλλει στην εξάλειψη του αυθαίρετου συντελεστή. Μία από τις απλούστερες μεθόδους για την ενσωμάτωση των συντελεστών αυτών είναι η εφαρμογή των εξισώσεων 4.6, 4.7 αντί των 4.1 και 4.2. ( ) (4.6) (4.7) (4.8) (4.9) 92

93 Με τον όρο σύγκλιση στην ουσία υπονοείται η σταδιακή μείωση της ταλάντωσης που πραγματοποιεί ένα σωματίδιο όταν βρεθεί κοντά σε τοπικά ή καθολικά προηγούμενα καλύτερα σημεία. Η χρήση του συντελεστή σύσφιξης συμβάλει στην πρόληψη πιθανής κατάρρευσης (αποτυχία σύγκλισης) και ταυτόχρονα εξισορροπεί την ανάγκη για τοπική και καθολική αναζήτηση με βάση τις κοινωνικές συσχετίσεις. Ένα μειονέκτημα της μεθόδου είναι ότι τα σωματίδια μπορεί να πραγματοποιήσουν τροχιές μεγάλου πλάτους και μπορεί να αποτύχουν να συγκλίνουν στην περίπτωση που η καλύτερη ατομική θέση τους ως τώρα είναι σε μεγάλη απόσταση από την καλύτερη θέση που έχει βρεθεί στο σύνολο του πληθυσμού [30]. Μία τυπική τιμή για τον συντελεστή είναι συνήθως, όπου ισχύει και ο σταθερός πολλαπλασιαστής υπολογίζεται έτσι ίσος με [103]. Παρόλο που τα άτομα με τη βοήθεια του συντελεστή σύσφιξης συγκλίνουν χωρίς τη χρήση του συντελεστή, μελέτες έδειξαν πως μία καλή τεχνική γρηγορότερης και σίγουρης σύγκλησης είναι η εξίσωση του με το για κάθε διάσταση. Με αυτό τον τρόπο, ο PSO γίνεται ανεξάρτητος από παραμέτρους που εξαρτώνται από τη φύση του προβλήματος. Σημειώνεται πως, αλγεβρικά, η συγκεκριμένη εκδοχή του PSO είναι ανάλογη αυτής του PSO με συντελεστή αδράνειας Clamping factor Προκειμένου τα σωματίδια να μην κινούνται σε ακραίες περιοχές του χώρου αναζήτησης, εισήχθηκε μία τεχνική που καλείται velocity clamping ώστε να τίθενται όρια στη μέγιστη ταχύτητα κάθε σωματιδίου [124]. Έτσι, για ένα χώρο αναζήτησης που εκτείνεται στο εύρος, η ταχύτητα κάθε σωματιδίου εκτείνεται στο, όπου. Ο συντελεστής καλείται clamping factor και ορίζεται στο διάστημα. Σε προβλήματα βελτιστοποίησης όπου ο χώρος αναζήτησης δεν έχει κέντρο το και εκτείνεται σε εύρος, η μέγιστη ταχύτητα του σωματιδίου γίνεται ίση με: (4.10) 93

94 4.2.2 Τοπολογίες Όπως έχει ήδη αναφερθεί παραπάνω, η συμπεριφορά των ατόμων του πληθυσμού, με την έννοια της τροχιάς, επηρεάζεται από αυτή των γειτονικών τους ατόμων. Στις πρώτες εκδοχές του PSO, τα μοντέλα τοπολογιών που εφαρμόστηκαν στηρίζονταν στη έννοια της ευκλείδειας απόστασης των σωματιδίων στον χώρο αναζήτησης. Ωστόσο, η τεχνική αυτή απορρίφθηκε στη συνέχεια λόγω της αυξημένης πολυπλοκότητας αλλά και των μέτριων αποτελεσμάτων σύγκλισης [103]. Δύο είναι τα κύρια είδη τοπολογιών που εφαρμόζονται στον αλγόριθμο PSO: α) η gbest (global best) και β) η lbest (local best). Η επιλογή της τοπολογίας αφορά ουσιαστικά τον κανόνα σύμφωνα με τον οποίο θα γίνεται η επιλογή του διανύσματος. Στην τοπολογία gbest, η οποία επιλέχθηκε για την υλοποίηση της παρούσας διπλωματικής εργασίας, τα σωματίδια επηρεάζονται μόνο από εκείνο με τα καλύτερα αποτελέσματα στο σύνολο του πληθυσμού. Κάθε σωματίδιο είναι συνδεδεμένο με όλα τα υπόλοιπα σχηματίζοντας ένα πλήρως συνδεδεμένο γράφο όπως φαίνεται στο Σχήμα 4.4.α. Η τοπολογία αυτή αποτελεί τυπικό παράδειγμα στατικής τοπολογίας, με την έννοια ότι οι γείτονες κάθε σωματιδίου δεν αλλάζουν κατά διάρκεια μιας εκτέλεσης του αλγορίθμου. Στην τοπολογία lbest (Σχήμα 4.4.β) ή αλλιώς δακτύλιος (ring), που είναι επίσης στατική, κάθε σωματίδιο συνδέεται με κοντινότερους γείτονες, με τυπική τιμή για το. Στην περίπτωση αυτή, τo διάνυσμα κάθε σωματίδιου δείχνει τον «καλύτερο» γείτονα εκ των k κοντινότερων. Η τοπολογία αυτή επιτρέπει την παράλληλη αναζήτηση, μιας και οι υποπληθυσμοί που σχηματίζονται μπορεί να συγκλίνουν σε διαφορετικές περιοχές του χώρου αναζήτησης. Ως εκ τούτου, είναι λιγότερο ευάλωτη στο να παγιδεύεται σε τοπικά βέλτιστα. Ωστόσο, η μη άμεση σύνδεση των σωματιδίων οδηγεί σε αργή σύγκλιση του αλγορίθμου. (α) (β) Σχήμα 4.4: α) gbest topology, β) lbest topology [89]. 94

95 4.2.3 Παραλλαγές του κλασικού αλγορίθμου Τα τελευταία χρόνια, έχουν μελετηθεί αρκετές παραλλαγές του κλασικού αλγορίθμου PSO, με αποτέλεσμα τη βελτίωση τόσο της γενικής απόδοσης του όσο και αυτής που παρουσιάζει για συγκεκριμένα είδη προβλημάτων. Στην παρούσα διπλωματική, πέρα από τον κλασικό αλγόριθμο, υλοποιήθηκε και μία από τις παραλλαγές του, η οποία παρουσιάζεται στην υποπαράγραφο που ακολουθεί Fully informed PSO (FIPS) Στην κλασική του εκδοχή, ο PSO επηρεάζεται μόνο από την προσωπική του καλύτερη θέση και αυτή του καλύτερου γείτονα του, χωρίς να λαμβάνεται άμεσα υπόψη πληροφορία σε σχέση με την τροχιά των υπόλοιπων σωματιδίων του πλήθους [103]. Ο Mendes αναθεώρησε τις κοινωνικές συσχετίσεις μεταξύ των σωματιδίων [77] προτείνοντας μία νέα εκδοχή του PSO, την Fully Informed PSO (FIPS). Σύμφωνα με αυτή, κάθε σωματίδιο επηρεάζεται από την τροχιά όλων των γειτόνων του, και πολλές φορές καθόλου από την δική του προηγούμενη τροχιά. Ο αλγόριθμος FIPS περιγράφεται από τις εξισώσεις 4.11 και 4.12 που αντικαθιστούν τις 4.1 και 4.2. ( ( )) (4.11) (4.12) όπου είναι ο αριθμός των γειτόνων του ατόμου, και είναι ο n-οστός του γείτονας. Έχει παρατηρηθεί πως ο FIPS καταλήγει σε καλύτερες λύσεις, με λιγότερες επαναλήψεις σε σχέση με την κλασική εκδοχή του PSO, όμως ταυτόχρονα εξαρτάται σημαντικά από την τοπολογία του πληθυσμού των σωματιδίων. 95

96 4.3 Στρατηγική διαμόρφωσης τιμολογίων Η στρατηγική διαμόρφωσης των τιμολογίων αποτελεί πρακτικά ένα πρόβλημα βελτιστοποίησης, αφού στόχος είναι η προσφορά τιμολογίων που μεγιστοποιούν το κέρδος του πράκτορα. Κάθε φορά που ο πράκτορας επιθυμεί να εκδώσει ένα νέο τιμολόγιο ή να βελτιώσει ένα ήδη υπάρχον, ο αλγόριθμος PSO καλείται να ερευνήσει το χώρο του προβλήματος (σύμφωνα με τη μεθοδολογία που περιγράφηκε στο κεφ. 4.2), και να επιλέξει αυτό που ικανοποιεί όσο το δυνατόν περισσότερο τις προϋποθέσεις που τίθενται από τη συνάρτηση στόχου. Για να γίνει κατανοητό πως εφαρμόστηκε ο αλγόριθμος PSO για την επίλυση του προβλήματος είναι απαραίτητο να ορίσουμε: α) πως διαμορφώνεται ο χώρος αναζήτησης για το πρόβλημα μας, και β) την συνάρτηση στόχου του αλγορίθμου Ο Χώρος του Προβλήματος Ο χώρος του προβλήματος, όπως έχει ήδη αναφερθεί, αποτελεί τον χώρο στον οποίο κινούνται τα σωματίδια ψάχνοντας τις βέλτιστες λύσεις. Στην προκειμένη περίπτωση, οι ζητούμενες λύσεις αποτελούν τα χαρακτηριστικά των υποψηφίων τιμολογίων προς έκδοση. Από την ανάλυση που προηγήθηκε στο κεφάλαιο 3.6.2, μπορούμε να πούμε ότι ένα τιμολόγιο μπορεί να περιγραφεί πλήρως από τις διάφορες τιμές που ορίζει για τις παραμέτρους πληρωμής, όπως είναι για παράδειγμα οι χρεώσεις ανά kwh, το κόστος εγγραφής κ.α. Έτσι, αν θεωρήσουμε πως η θέση ενός σωματιδίου στο χώρο του προβλήματος, ορίζει ένα τιμολόγιο, τότε ο χώρος αυτός θα είναι διάστασης αντίστοιχης των παραμέτρων που επιθυμούμε να ορίζονται για το εκάστοτε τιμολόγιο. Στη παρούσα διπλωματική, εξετάστηκε η περίπτωση ο πράκτορας να προσφέρει δύο είδη τιμολογίων: α) FRT, όπου ορίζεται μία χρέωση ανά kwh για όλες τις ώρες της ημέρας και β) TOU, όπου η ημέρα διακρίνεται σε δύο ή τρεις ζώνες και εφαρμόζεται διαφορετική χρέωση σε κάθε μια. Ως εκ τούτου, τα τιμολόγια που προσφέρονται ορίζονται από τις παραμέτρους: α) το κόστος εγγραφής (signup payment), β) κύρωση πρόωρης διακοπής συμβολαίου (early withdraw penalty), γ) πάγιες χρεώσεις (periodic payment) και δ) μία (1) έως τρεις (3) επιπλέον διαφορετικές χρεώσεις για την κατανάλωση ανά KWh σε 96

97 διαφορετικές ώρες της ημέρας. Επομένως, αν η διάσταση του χώρου του προβλήματος, τότε κάθε σωματιδίου μπορεί να έχει θέση, με, ανάλογα με πόσες ζώνες τιμολόγησης ορίσαμε κατά την διάρκεια της μέρας. Για τη συνέχεια της ανάλυσης, όταν αναφερόμαστε σε τιμολόγια του χώρου του προβλήματος, πρακτικά, υπονοούνται οι θέσεις που μπορούν να λάβουν τα σωματίδια στο χώρο αυτό, κατά τη διάρκεια της εκτέλεσης του αλγορίθμου Συνάρτηση Στόχου (Objective Function) Όπως γίνεται φανερό από την θεωρητική ανάλυση του αλγορίθμου PSO (κεφ. 4.2), η συνάρτηση στόχου, σε ένα πρόβλημα βελτιστοποίησης, είναι υπεύθυνη για την ποιότητα των λύσεων που προκύπτουν. Συνεπώς, αποτελεί ζήτημα καίριας σημασίας η βέλτιστη διαμόρφωση της. Προκειμένου ο πράκτορας να επιτύχει το βασικό του στόχο, δηλαδή το μέγιστο δυνατό κέρδος, είναι απαραίτητο η στρατηγική διαμόρφωσης των τιμολογίων που προσφέρει να προσαρμόζεται με γνώμονα τις διάφορες συνθήκες της αγοράς. Επομένως, η συνάρτηση στόχου θα πρέπει να ορίζεται ώστε να λαμβάνει υπόψη: α) τις προτιμήσεις των πελατών, β) τα ανταγωνιστικά τιμολόγια και γ) το κέρδος του πράκτορα. Με βάση τους παραπάνω περιορισμούς, ορίστηκε η συνάρτηση στόχου,, η οποία για ένα τιμολόγιο προς αξιολόγηση, δίνεται από τη σχέση: (4.13) όπου, το σύνολο των πελατών που συμμετέχουν στην αγορά τιμολογίων, κέρδος που αναμένεται να έχει ο πράκτορας αν ο πελάτης επιλέξει το τιμολόγιο, η πιθανότητα ο πελάτης να επιλέξει το τιμολόγιο., το, και Από τον τρόπο που ορίστηκε η συνάρτηση, γίνεται φανερό, πως λαμβάνονται υπόψη: Οι προτιμήσεις των πελατών: Ενυπάρχουν τόσο στην πιθανότητα επιλογής των τιμολογίων, όσο και στον υπολογισμό του αναμενόμενου κέρδους που στηρίζεται στο ατομικό πρότυπο κατανάλωσης τους. Τα ανταγωνιστικά τιμολόγια: Πρόκειται για τον ανταγωνισμό που καλείται να αντιμετωπίσει ένα υποψήφιο προς έκδοση τιμολόγιο, και επηρεάζει τον τρόπο υπολογισμού της πιθανότητας. 97

98 Το κέρδος του πράκτορα: Πέρα από τον συντελεστή, το κέρδος, αποτελεί και το βασικό νόημα της συνάρτησης στόχου. Για να γίνουν κατανοητά τα παραπάνω, στη συνέχεια του κεφαλαίου παρατίθεται αναλυτικά ο τρόπος υπολογισμού των παραμέτρων και Κέρδος Πράκτορα Αρχικά, χρησιμοποιώντας ως βάση την εξίσωση 3.8, που υπολογίζει τον τρόπο αξιολόγησης του κόστους ενός τιμολογίου για έναν πελάτη, μπορούμε να πούμε πως το αναμενόμενο κέρδος του πράκτορα, εάν ο πελάτης εγγραφεί στο τιμολόγιο, είναι: (4.14) όπου, το πρότυπο κατανάλωσης/παραγωγής του πελάτη για μία ενδεχόμενη διάρκεια υιοθέτησης του τιμολογίου προς αξιολόγηση, και το ενδεχόμενο κόστος απόσυρσης από το τιμολόγιο μειωμένο κατά ένα παράγοντα, όπου το έλαχιστο χρονικό διάστημα δέσμευσης που ορίζει το. Όπως είναι φυσικό, από την σχέση 3.8, έχει παραληφθεί ο όρος που δίνει το κόστος απόσυρσης από το τιμολόγιο που είναι ήδη συμβεβλημένος ο πελάτης,, διότι οι πράκτορες δεν είναι σε θέση να γνωρίζουν αυτή την πληροφορία για κάθε πελάτη. Επιπλέον, οι πράκτορες δεν μπορούν να γνωρίζουν το ακριβές πρότυπο κατανάλωσης σύμφωνα με το οποίο κάθε πελάτης αξιολογεί τα διαθέσιμα τιμολόγια. Έτσι, προκειμένου να οριστεί ένα αντιπροσωπευτικό πρότυπο κατανάλωσης/παραγωγής για κάθε πελάτη, χρησιμοποιήθηκαν τα λεγόμενα bootstrap δεδομένα. Όπως αναλύθηκε στο κεφάλαιο , ένα τυπικό παιχνίδι ξεκινά αφού ολοκληρωθούν 14 ημέρες προσομοίωσης, όπου τα μόνα ενεργά τιμολόγια είναι αυτά του Default Broker. Tα bootstrap δεδομένα κατανάλωσης που προκύπτουν από την περίοδο αυτή αποστέλλονται στους παίκτες πριν από την έναρξη του παιχνιδιού. Στα δεδομένα αυτά συμπεριλαμβάνονται πληροφορίες για τους πελάτες (customer information), που αφορούν τα μεγέθη κατανάλωσης ή παραγωγής ΗΕ των πελατών, ανά μία (1) ώρα, για τις 14 ημέρες προσομοίωσης. Έτσι, με βάση αυτά τα δεδομένα, ορίζεται από την μέθοδο μας ένα πρότυπο κατανάλωσης μίας ημέρας (24 ωρών προσομοίωσης) για κάθε πελάτη. Κάθε ώρα της ημέρας η κατανάλωση (παραγωγή) υπολογίζεται ως ο μέσος όρος της κατανάλωσης 98

99 (παραγωγής) που είχε ο πελάτης την συγκεκριμένη ώρα της μέρας, στο διάστημα των 14 ημερών Πιθανότητα Αποδοχής Τιμολογίου Ο υπολογισμός της πιθανότητας, βασίστηκε στη σχέση 3.14, σύμφωνα με την οποία οι πελάτες υπολογίζουν την πιθανότητα να επιλέξουν ένα διαθέσιμο τιμολόγιο. Συγκεκριμένα, η πιθανότητα ο πελάτης να επιλέξει το τιμολόγιο, είναι: (4.15) όπου, ο συντελεστής λογικής κάθε πελάτη (ο οποίος είναι σταθερός για όλους σε ένα τυπικό διαγωνισμό), ως ορίζεται το σύνολο των ήδη ενεργών τιμολογίων στην αγορά που μπορεί να επιλέξει ο πελάτης, μαζί με το τιμολόγιο, και, η τιμή χρησιμότητας που αντιστοιχεί ο πελάτης στο τιμολόγιο. Ο υπολογισμός της τιμής χρησιμότητας για κάθε τιμολόγιο πραγματοποιείται σύμφωνα με τη σχέση 3.12, που δίνει την αναλυτική μορφή της συνάρτησης χρησιμότητας που χρησιμοποιούν οι πελάτες για τις αξιολογήσεις τους. Ως εκ τούτου, η τιμή χρησιμότητας που αποδίδει ένας πελάτης, στο τιμολόγιο, δίνεται από τη σχέση: (4.16) Η παράμετρος είναι η κανονικοποιημένη διαφορά του κόστους του τιμολογίου και υπολογίζεται είτε από τη σχέση 3.10, για τιμολόγια κατανάλωσης, είτε από την 3.11, για τιμολόγια παραγωγής. Υπενθυμίζεται πως η παράμετρος είναι το κόστος που θα είχε ο πελάτης εάν εγγραφόταν στο τιμολόγιο (σχέση 4.14), κανονικοποιημένο προς το κόστος που θα είχε εάν εγγραφόταν στο τιμολόγιο του Default Broker. Το κόστος για τα τιμολόγια του Default Broker, υπολογίζεται σύμφωνα με την εξίσωση 3.7, για το ίδιο πρότυπο κατανάλωσης που χρησιμοποιήθηκε για τον υπολογισμό του κόστους στη σχέση Αξίζει να σημειωθεί ότι από τη σχέση 4.16 λείπουν οι συντελεστές και της εξίσωσης (3.12), διότι δεν είναι γνωστοί στον πράκτορα. Υπενθυμίζεται ότι ένας σταθερός συντελεστής για κάθε διαφορετικό είδος πελάτη, που επιλέγεται τυχαία από μία 99

100 ομοιόμορφη κατανομή, και ο συντελεστής όχλησης που ορίζεται ως γραμμικός συνδυασμός των συντελεστών που τιμωρούν προδιαγραφές τιμολογίων όπως μεταβλητές χρεώσεις, TOU χρεώσεις και κλιμακωτές χρεώσεις. Προκειμένου να ληφθούν υπόψη οι και στον υπολογισμό της τιμής χρησιμότητας της σχέσης 4.16, προστέθηκε σε αυτή μία μονάδα (1), που αναπαριστά το γινόμενο των ακραίων τιμών που μπορεί να λάβουν οι συντελεστές αυτοί Διαμόρφωση αρχικών τιμολογίων Στην αρχή του παιχνιδιού, δεδομένου ότι τα μόνα τιμολόγια που υπάρχουν στην αγορά είναι αυτά που προσφέρει ο Default Broker, ο πράκτορας δεν μπορεί να έχει μία σαφή εικόνα του ανταγωνισμού που αναμένεται να αντιμετωπίσει. Όπως, αναλύεται στην προηγούμενη παράγραφο, ο ανταγωνισμός συνυπολογίζεται στην συνάρτηση στόχου του αλγορίθμου, μέσω της πιθανότητας αποδοχής ενός τιμολογίου, που δίνεται από την εξίσωση Προκειμένου ο πράκτορας να εξασφαλίσει μία καλή εκκίνηση, ορίστηκε ένας διαφορετικός τρόπος για τον υπολογισμό της πιθανότητας αποδοχής των αρχικών τιμολογίων. Για την πρόβλεψη του ζητούμενο ποσοστού αποδοχής, χρησιμοποιήθηκε ο αλγόριθμος της Λογιστικής Παλινδρόμησης (ΛΠ) ή Logistic Regression. Η ΛΠ, αποτελεί ένα ευρέως διαδεδομένο αλγόριθμο που χρησιμοποιείται κυρίως σε προβλήματα ταξινόμησης και πρόβλεψης. Σύμφωνα με αυτή, ορίζεται μία συνάρτηση, ή η πιθανότητα, που δείχνει α) την πιθανότητα, η παρατήρηση,, διάστασης, να ανήκει σε μία κλάση από τις διακριτές κλάσεις του προβλήματος ή β) την αντιστοίχηση της παρατήρησης με μια διακριτή ή συνεχή τιμή στο σύνολο τιμών. Η αναλυτική μορφή της πιθανότητας, ορίζεται σύμφωνα με την εξίσωση: (4.17) Το διάνυσμα είναι ίδιας διάστασης με το και ορίζεται κατά τη διαδικασία της εκπαίδευσης του αλγορίθμου. Συγκεκριμένα, στόχος της εκπαίδευσης του αλγορίθμου είναι η εύρεση του διανύσματος, που ελαχιστοποιεί τη συνάρτηση κόστους (cost function),. Η αναλυτική μορφή της συνάρτησης κόστους είναι η εξής: 100

101 ( ( )) ( ) ( ( )) (4.18) όπου, το μέγεθος του σετ εκπαίδευσης. Για την ελαχιστοποίηση της 4.18, χρησιμοποιείται συνήθως η μέθοδος της Επικλινούς Καθόδου (Gradient Descent). Σύμφωνα με αυτή, ορίζονται κάποιες αρχικές τιμές για τις παραμέτρους του διανύσματος (συνήθως ίσες με μηδέν) και στη συνέχεια αλλάζουν επαναληπτικά μέχρι να επιτευχθεί κάποιο ελάχιστο της συνάρτηση κόστους, Οι ενημερώσεις των παραμέτρων πραγματοποιούνται ταυτόχρονα σε κάθε επανάληψη σύμφωνα με τη σχέση: (4.19) Όπου η παράμετρος, που καλείται ρυθμός εκμάθησης (learning rate), επηρεάζει την ταχύτητα σύγκλισης της μεθόδου. Λαμβάνει συνήθως μικρές θετικές τιμές. Για το πρόβλημα προς επίλυση, ορίζονται διανύσματα διάστασης ίσης με το πλήθος των παραμέτρων που προβλέπονται από το εκάστοτε τιμολόγιο (δηλαδή διάστασης ίσης με αυτή που ορίστηκε για το χώρο του προβλήματος ) και, όπου: Κλάση 1: τιμολόγια απόλυτης αποδοχής (πιθανότητα αποδοχής τιμολογίου 100%) Κλάση 0: τιμολόγια μηδενικής αποδοχής (πιθανότητα αποδοχής τιμολογίου 0%) Η εκπαίδευση του αλγορίθμου, πραγματοποιήθηκε με σετ εκπαίδευσης που περιλάμβαναν πληθώρα πιθανών συνδυασμών παραμέτρων τιμολογίων, μαζί με το αντίστοιχο ποσοστό των πελατών που τα επέλεξαν. Ο τρόπος με τον οποίο δημιουργήθηκαν τα σετ εκπαίδευσης, παρατίθεται αναλυτικά στο κεφάλαιο 5.2. Στο τέλος αυτής της διαδικασίας, για κάθε είδος πελάτη (οικιακοί καταναλωτές, επαγγελματικά γραφεία, καταναλωτές μεγάλου μεγέθους) ορίζεται μία συνάρτηση, προκειμένου να υπολογιστεί η πιθανότητα αποδοχής (εξίσωση 4.15) για τα πρώτα τιμολόγια που προσφέρει ο πράκτορας. Με τον τρόπο αυτό, δίνεται πρακτικά μία «πρώτη αίσθηση» στον πράκτορα για τις προτιμήσεις που αναμένεται να έχουν οι πελάτες, σε σχέση με τις τιμές που περιλαμβάνουν τα τιμολόγια που προσφέρει. 101

102 4.4 Στρατηγική ενημέρωσης τιμολογίων Η στρατηγική ενημέρωσης τιμολογίων που αναπτύχθηκε, περιλαμβάνει όλες εκείνες τις λειτουργίες που απαιτούνται για την αύξηση ή διατήρηση: α) του μεριδίου των πελατών του πράκτορα, και β) του συνολικού κέρδους του πράκτορα, πάντα με γνώμονα τις συνθήκες που επικρατούν στην αγορά σε πραγματικό χρόνο. Στην συνέχεια του κεφαλαίου, αναλύονται με τη σειρά, οι ενέργειες που προβλέπονται από τη στρατηγική που υλοποιήθηκε. Η διαδικασία ενημέρωσης τιμολογίων καλείται ανά έξι (6) timeslot, για όλα τα είδη ενέργειας (Consumption, Production και Interruptible Consumption), καθώς τότε έχει την δυνατότητα ο πράκτορας να εκδώσει νέα τιμολόγια στην Αγορά Μερίδιο της Αγοράς με χρήση Ασαφούς Λογικής Αρχικά, ο πράκτορας ελέγχει το μερίδιο του στην αγορά, δηλαδή πόσους πελάτες έχει εγγεγραμμένους στα τιμολόγια του. Για την αξιολόγηση αυτής της παραμέτρου, δηλαδή αν το μερίδιο που έχει ο πράκτορας είναι μεγάλο ή μικρό, χρησιμοποιήθηκε η θεωρία της ασαφούς λογικής. Σύμφωνα με αυτή, είναι απαραίτητη η κατασκευή: α) ασαφών συνόλων, που προκύπτουν από συναρτήσεις συμμετοχής, και είναι ικανά να περιγράψουν τις διάφορες μεταβλητές, και β) ασαφών κανόνων που εμπεριέχουν τις αποφάσεις που χρειάζεται να ληφθούν. Η μεθοδολογία που υλοποιήθηκε, στηρίχθηκε στην ανάλυση που αναπτύχθηκε στην [136] και για λόγους πληρότητας παρατίθεται συνοπτικά. Για τον ορισμό του πλήθους των καταναλωτών, ορίζονται οι εξής συναρτήσεις συμμετοχής: (4.20) { (4.21) { 102

103 όπου η μεταβλητή ορίζεται ως ο συνολικός αριθμός των πελατών του συστήματος, και η μεταβλητή είναι ο συνολικός αριθμός των μεσαζόντων του συστήματος. Οι συναρτήσεις αυτές κατασκευάζουν το εξής ασαφές σύνολο: Σχήμα 4.5: Ασαφές σύνολο πελατών πράκτορα [136]. Από το σύνολο που προκύπτει, γίνεται εύκολα αντιληπτό, πως ο πράκτορας θεωρεί ότι έχει πολλούς πελάτες όταν αυτοί είναι πάνω από αυτούς που θα του «αναλογούσαν», εάν οι πελάτες μοιραζόταν ισόποσα στους μεσάζοντες. Στην αντίθετη περίπτωση, θεωρεί πως έχει λιγότερους από όσους θα έπρεπε. Σημειώνεται πως η αξιολόγηση αυτή πραγματοποιείται ξεχωριστά για τους καταναλωτές και τους παραγωγούς του πράκτορα. Στη συνέχεια, σύμφωνα με το μερίδιο του στην αγορά, ο πράκτορας πρέπει να αποφασίσει αν απαιτείται να εκδώσει νέα τιμολόγια καθώς και σε τι τιμές πρέπει να κυμανθούν οι παράμετροι τους, ώστε να είναι ελκυστικά. Στα σχήματα Σχήμα 4.6 και Σχήμα 4.7, παρατίθενται οι αλγόριθμοι που δείχνουν τις ενέργειες του πράκτορα όταν έχει λίγους καταναλωτές και παραγωγούς αντίστοιχα, και στα σχήματα Σχήμα 4.8 και Σχήμα 4.9 οι αλγόριθμοι για τις περιπτώσεις που ο πράκτορας έχει πολλούς καταναλωτές και παραγωγούς αντίστοιχα. Για την καλύτερη κατανόηση των αλγορίθμων και των παραμέτρων που εισάγουν παρατίθεται λεπτομερής ανάλυση κάθε περίπτωσης Μικρό Ποσοστό της Αγοράς (Λίγοι Πελάτες) Εάν οι πελάτες του πράκτορα είναι λίγοι, σημαίνει πως τα τιμολόγια που μέχρι στιγμής έχει εκδώσει, δεν ήταν αρκετά ελκυστικά. Προκειμένου η πληροφορία αυτή να επηρεάσει το τρόπο αναζήτησης του σμήνους σωματιδίων, ο πράκτορας μεταβάλλει τα όρια του χώρου αναζήτησης. 103

104 Τα όρια του χώρου αναζήτησης, παίζουν ιδιαίτερα σημαντικό ρόλο στην επίλυση του προβλήματος, αφού ορίζουν τις ελάχιστες και τις μέγιστες τιμές που μπορεί να πάρουν οι διάφορες παράμετροι ενός τιμολογίου. Έτσι, ορίζονται τα διανύσματα: που δίνει το κάτω όριο του χώρου αναζήτησης και που δίνει το πάνω όριο του χώρου αναζήτησης. Τα συγκεκριμένα όρια ορίζονται διαφορετικά για τιμολόγια κατανάλωσης και τιμολόγια παραγωγής, αφού απευθύνονται και σε διαφορετικά είδη ενέργειας και πελατών. Πιο συγκεκριμένα, για την περίπτωση που οι πελάτες είναι λίγοι, ανάλογα με το είδος της ενέργειας του τιμολογίου, τα όρια προσαρμόζονται ως εξής: Τιμολόγια Κατανάλωσης: Επειδή τα συγκεκριμένα τιμολόγια περιλαμβάνουν πληρωμές από τον πελάτη προς τον πράκτορα 10 (customer to broker, ctb), προκειμένου να γίνουν πιο ελκυστικά, θα πρέπει οι ανώτατες τιμές των παραμέτρων να περιοριστούν. Έτσι, ο πράκτορας θέτει ως ανώτατες τιμές για τις παραμέτρους των τιμολογίων αυτές του τελευταίου τιμολογίου που εκδόθηκε. Με τον τρόπο αυτό αποτρέπει τα σωματίδια να ερευνήσουν «περιοχές» που μέχρι εκείνη τη στιγμή δεν απέδωσαν. Τιμολόγια Παραγωγής: Τα τιμολόγια αυτά ορίζουν πληρωμές από τον πράκτορα στον προς τον πελάτη 11 (broker to customer, btc). Τα όρια των παραμέτρων αυτών, δηλαδή οι τιμές που ο πράκτορας αγοράζει την ΗΕ από τους παραγωγούς, προσαρμόζονται ώστε να είναι αυξημένες κατά 10% από τη τιμές που όριζε το τελευταίο τιμολόγιο παραγωγής που εκδόθηκε. Ο πράκτορας δηλαδή αυξάνει την κατώτατη τιμή που δύναται να προσφέρει για αγορά ΗΕ, προκειμένου να προσελκύσει περισσότερους παραγωγούς. 10 Οι πληρωμές αυτές ορίζονται ως αρνητικοί αριθμοί, επομένως οι ανώτατες τιμές τους ορίζονται στο διάνυσμα και οι κατώτατες στο. 11 Οι πληρωμές αυτές ορίζονται ως θετικοί αριθμοί, επομένως οι κατώτατες τιμές τους ορίζονται στο διάνυσμα και οι ανώτατες στο. 104

105 IF Consumers are Few THEN minposition ctb parameters = last Consumption tariff ctb parameters Find new Consumption tariff ENDIF Σχήμα 4.6: Αλγόριθμος ενημέρωσης τιμολογίων κατανάλωσης για την περίπτωση λίγων καταναλωτών. IF Producers are Few THEN minposition ctb parameters = last Production tariff ctb parameters minposition btc parameters = 1.1 * (last Production tariff btc parameters) ENDIF Find new Production tariff Σχήμα 4.7: Αλγόριθμος ενημέρωσης τιμολογίων παραγωγής για την περίπτωση λίγων παραγωγών Μεγάλο Ποσοστό της Αγοράς (Πολλοί Πελάτες) Στην περίπτωση που οι πελάτες του πράκτορα είναι πολλοί, σημαίνει πως τα τιμολόγια που έχει προσφέρει μέχρι εκείνη τι στιγμή ικανοποιούν τις προτιμήσεις των πελατών. Ως εκ τούτου η νέα απόφαση που πρέπει να λάβει ο πράκτορας είναι: α) αν επιθυμεί να ρισκάρει, προσφέροντας τιμολόγια που ενδέχεται να του αποφέρουν περισσότερα κέρδη, ή β) να μην ρισκάρει και να αφήσει τα τιμολόγια του ως έχουν. Το κριτήριο που τέθηκε, για την ανάληψη ή μη ρίσκου, είναι ένας ευριστικός κανόνας σύμφωνα με τον οποίο ορίζεται μία περίοδος σταθεροποίησης (stabilization period), η έλευση της οποίας σηματοδοτεί ότι το μερίδιο του πράκτορα στην αγορά είναι σταθερά μεγάλο. Στην περίπτωση που ο πράκτορας αποφασίσει πως μπορεί να ρισκάρει, θα πρέπει όπως και πριν αρχικά να προσαρμόσει κατάλληλα τα όρια του χώρου αναζήτησης. Για τον προσδιορισμό των νέων ορίων, ανάλογα με το είδος ενέργειας των τιμολογίων έχουμε: Τιμολόγια Κατανάλωσης: Επειδή τα συγκεκριμένα τιμολόγια περιλαμβάνουν πληρωμές από τον πελάτη προς τον πράκτορα, προκειμένου να μπορούν να αποφέρουν περισσότερα κέρδη στον πράκτορα, θα πρέπει οι ανώτατες τιμές των 105

106 παραμέτρων να αυξηθούν, ώστε τα σωματίδια να μπορούν να ερευνήσουν και «περιοχές» με ακριβότερα τιμολόγια. Έτσι, ο πράκτορας θέτει ως ανώτατες τιμές για τις παραμέτρους των τιμολογίων, τις παραμέτρους του τελευταίου που εκδόθηκε αυξημένες κατά 10%. Τιμολόγια Παραγωγής: Τα τιμολόγια αυτά ορίζουν πληρωμές από τον πράκτορα προς τον πελάτη. Τα όρια των παραμέτρων αυτών, δηλαδή οι τιμές που ο πράκτορας αγοράζει την ΗΕ από τους παραγωγούς μειώνονται κατά 10% από αυτές του τελευταίου τιμολογίου παραγωγής που εκδόθηκε, προκειμένου ο πράκτορας να αυξήσει τα κέρδη του. Ο πράκτορας δηλαδή μειώνει την κατώτατη τιμή που δύναται να προσφέρει για αγορά ΗΕ. IF Consumers are Μany THEN IF stabilization period has finished THEN minposition ctb parameters = 1.1 * (last Consumption tariff ctb parameters) Find new Consumption tariff ENDIF ENDIF Σχήμα 4.8: Αλγόριθμος ενημέρωσης τιμολογίων κατανάλωσης για την περίπτωση πολλών καταναλωτών. IF Producers are Many THEN IF stabilization period has finished THEN minposition ctb parameters = 1.1 * (last Production tariff ctb parameters) minposition btc parameters = 0.9 * (last Production tariff btc parameters) ENDIF ENDIF Find new Production tariff Σχήμα 4.9: Αλγόριθμος ενημέρωσης τιμολογίων παραγωγής για την περίπτωση πολλών παραγωγών. 106

107 Όπως φαίνεται και στους αλγορίθμους που παρατίθενται παραπάνω, και στις δύο περιπτώσεις (λίγοι/πολλοί πελάτες), εάν ο πράκτορας έχει αποφασίσει να εκδώσει νέο τιμολόγιο πρέπει να καλέσει τη στρατηγική διαμόρφωσης τιμολογίων, αφού πρώτα προσαρμόσει κατάλληλα τα όρια αναζήτησης του σμήνους Μέγιστος Αριθμός Τιμολογίων Μια ακόμη σημαντική παράμετρος κατά την διαδικασία έκδοσης ή ενημέρωσης τιμολογίων είναι ο μέγιστος αριθμός τιμολογίων για κάθε τύπο ενέργειας. Για τον λόγο αυτό ορίζονται οι μεταβλητές: α) max Consumption Offers, που δείχνει τον μέγιστο αριθμό τιμολογίων κατανάλωσης και β) max Production Offers, που δείχνει τον μέγιστο αριθμό τιμολογίων παραγωγής, που μπορεί να προσφέρει ο πράκτορας. Οι μεταβλητές αυτές ορίζονται από τον πράκτορα και μπορούν να αλλάξουν ανά πάσα στιγμή, αφού το σύστημα δεν θέτει περιορισμούς στον αριθμό των προσφερόμενων τιμολογίων. Ωστόσο, μία καλή τιμή και για τις δύο μεταβλητές είναι αυτή των πέντε (5) τιμολογίων για κάθε τύπο ενέργειας, δεδομένου ότι οι πελάτες λαμβάνουν υπόψη τους μόνο τα πέντε (5) πιο πρόσφατα τιμολόγια κάθε πράκτορα προς αξιολόγηση (βλέπε κεφ ). Επιπλέον, λαμβάνοντας υπόψη τον τρόπο που ορίστηκε η συνάρτηση στόχου (βλέπε κεφ ), και συγκεκριμένα την εξίσωση 4.15, γίνεται κατανοητό πως ένας μεγάλος αριθμός ενεργών τιμολογίων, θα οδηγούσε αναμφίβολα σε αύξηση της πολυπλοκότητας του προβλήματος εύρεσης νέων τιμολογίων. Γενικά, η ύπαρξη μεγάλου αριθμού ενεργών τιμολογίων στην αγορά, μπορεί να οδηγήσει μόνο σε ζημία των πρακτόρων, αφού η αύξηση του ανταγωνισμού που συνεπάγεται, επιτάσσει τα προσφερόμενα τιμολόγια να κυμαίνονται σε τιμές ολοένα και πιο ασύμφορες για τους πράκτορες. Στην περίπτωση που ο πράκτορας έχει αποφασίσει να εκδώσει ένα νέο τιμολόγιο, πρέπει να ελέγξει εάν έχει ξεπεράσει τον αριθμό των τιμολογίων για το είδος ενέργειας του τιμολογίου προς έκδοση. Αν έχει ακόμα περιθώριο, εκδίδει το νέο τιμολόγιο και έπειτα αναμένει την έλευση των επόμενων έξι (6) timeslot ώστε να καλέσει εκ νέου τη στρατηγική ενημέρωσης τιμολογίων. Στην αντίθετη περίπτωση, πρέπει να επιλέξει, ποιο τιμολόγιο θα διαγράψει. Το κριτήριο που τέθηκε για τη αξιολόγηση των υποψήφιων ενεργών τιμολογίων προς διαγραφή, είναι η οικονομική επίπτωση που είχαν στα συνολικά κέρδη του πράκτορα. Πιο συγκεκριμένα, αρχικά, για κάθε τιμολόγιο που είναι ενεργό στην αγορά τιμολογίων 107

108 για χρόνο και με βάση τον τύπο ενέργειας του, ορίζεται: α) για τιμολόγια κατανάλωσης, το κέρδος τιμολογίου (tariff profit), που δίνει το συνολικό κέρδος που έχει αποφέρει το τιμολόγιο στο χρόνο, και β) για τιμολόγια παραγωγής, το κόστος τιμολογίου (tariff cost), που δίνει το συνολικό κόστος που είχε για τον πράκτορα το τιμολόγιο στο χρόνο. Το διάστημα, καλείται χρόνος ζωής τιμολογίου (tariff lifetime) και μετράται σε timeslots. Με στόχο να πραγματοποιηθεί μία δίκαιη σύγκριση μεταξύ των τιμολογίων ορίζεται: α) το κανονικοποιημένο κέρδος (normalized profit) για τα τιμολόγια κατανάλωσης, που δίνεται από τη σχέση 4.22, και β) το κανονικοποιημένο κόστος (normalized cost) για τα τιμολόγια παραγωγής, που δίνεται από τη σχέση (4.22) (4.23) Έτσι, για κάθε ενεργό τιμολόγιο έχουμε υπολογίσει μία τιμή, με βάση την οποία μπορούμε να αξιολογήσουμε το κέρδος (για τιμολόγια κατανάλωσης) ή τη ζημία (για τιμολόγια παραγωγής) που απέφεραν στον πράκτορα. Ωστόσο, δεδομένης της αδράνειας που μπορεί να έχουν κάποιοι πελάτες, ως προς τις αξιολογήσεις που πραγματοποιούν στα ενεργά τιμολόγια, τα πολύ πρόσφατα τιμολόγια ενδέχεται να αδικηθούν από την αξιολόγηση που ορίσαμε. Ως εκ τούτου, ορίζουμε μία μεταβλητή που δείχνει το ελάχιστο αριθμό αξιολογήσεων που πρέπει να έχει δεχθεί ένα ενεργό τιμολόγιο, ώστε να είναι υποψήφιο προς διαγραφή ( ). Με άλλα λόγια, δεδομένου ότι οι πελάτες στην καλύτερη περίπτωση πραγματοποιούν αξιολογήσεις ανά έξι (6) timeslot, ένα τιμολόγιο υποψήφιο προς διαγραφή θα πρέπει να είναι ενεργό στην Αγορά Τιμολογίων για περισσότερα από timeslot. Τα παραπάνω φαίνονται σε μορφή αλγορίθμων στο Σχήμα 4.10, για τιμολόγια κατανάλωσης, και στο Σχήμα 4.11, για τιμολόγια παραγωγής. 108

109 IF active Consumption tariffs > max Consumption Offers THEN FOR each active tariff, Calculate normalized tariff profit, ENDFOR ENDIF Find the tariff with the minimum and > Revoke Σχήμα 4.10: Αλγόριθμος διαγραφής τιμολογίων κατανάλωσης. IF active Production tariffs > max Production Offers THEN FOR each active tariff, Calculate normalized tariff cost, ENDFOR Find the tariff with the maximum and > Revoke ENDIF Σχήμα 4.11: Αλγόριθμος διαγραφής τιμολογίων παραγωγής Σύνοψη Συνοψίζοντας, στο Σχήμα 4.12, φαίνονται οι ενέργειες που πραγματοποιεί ο πράκτορας, στην Αγορά Τιμολογίων από την αρχή μέχρι το τέλος ενός παιχνιδιού. Οι ενέργειες που εμπεριέχονται στο σχήμα με τις διακεκομμένες γραμμές είναι αυτές που προβλέπονται από τη στρατηγική ενημέρωσης τιμολογίων. 109

110 Σχήμα 4.12: Κύκλος ενεργειών πράκτορα σε κάθε timeslot, στην αγορά τιμολογίων. 110

111 4.5 Αρχιτεκτονική Συστήματος Διαμόρφωσης και Ενημέρωσης Τιμολογίων Στην παράγραφο αυτή παρατίθεται η ανάλυση της αρχιτεκτονικής του υποσυστήματος διαμόρφωσης και ενημέρωσης τιμολογίων του πράκτορα. Στο υποσύστημα αυτό υλοποιούνται οι στρατηγικές που αναλύθηκαν στις προηγούμενες παραγράφους. Στο Σχήμα 4.13 φαίνεται το διάγραμμα κλάσεων του συστήματος. Οι κλάσεις που αναπτύχθηκαν εξολοκλήρου στα πλαίσια της διπλωματικής ήταν οι: α) Swarm, β) Particle, γ) OptimalTariffManager, και δ) Global, και για το λόγο αυτό παρατίθενται αναλυτικά. Οι κλάσεις: α) DataCollectorService, β) PortfolioManagerService, και γ) FuzzyUpdateService, ήταν ήδη υλοποιημένες από τη προηγούμενη έκδοση του πράκτορα Mertacor. Ωστόσο, επειδή αποτελούν αναπόσπαστο κομμάτι του υποσυστήματος διαμόρφωσης και ανανέωσης τιμολογίων, περιλαμβάνονται και αυτές στο σχήμα. Υπογραμμίζεται πως οι τελευταίες τροποποιήθηκαν σημαντικά, ώστε να υποστηρίζουν τις στρατηγικές που αναπτύχθηκαν στην παρούσα διπλωματική. Για να γίνουν κατανοητά τα παραπάνω, στη συνέχεια παρατίθεται η περιγραφή των κλάσεων του σχήματος. Κλάση Particle: Η κλάση αυτή υλοποιεί τα σωματίδια του σμήνους του αλγορίθμου PSO, που χρησιμοποιείται για τη διαμόρφωση τιμολογίων. Κάθε σωματίδιο, σύμφωνα με τη θεωρία του αλγορίθμου, περιλαμβάνει τις εξής μεταβλητές: o position: Δείχνει την τρέχουσα θέση του σωματιδίου στο χώρο του προβλήματος και ανανεώνεται σε κάθε εκτέλεση του αλγορίθμου. o fitness: Δείχνει την τιμή καταλληλότητας που υπολογίστηκε για την τρέχουσα θέση του σωματιδίου (position). Η μεταβλητή αυτή ανανεώνεται κάθε φορά που το σωματίδιο μετακινείται. o velocity: Δείχνει την τρέχουσα ταχύτητα του σωματιδίου. Όμοια με την προηγούμενη μεταβλητή, ανανεώνεται κάθε φορά που το σωματίδιο αλλάζει θέση. o bestposition: Στη μεταβλητή αυτή αποθηκεύεται η καλύτερη θέση που έχει μεταβεί το σωματίδιο μέχρι στιγμής. o bestfitness: Στη μεταβλητή αυτή αποθηκεύεται η τιμή καταλληλότητας της bestposition. 111

112 Σχήμα 4.13: Διάγραμμα κλάσεων συστήματος διαμόρφωσης και ενημέρωσης τιμολογίων του πράκτορα. 112

113 Κλάση Swarm: Η κλάση αυτή υλοποιεί το σμήνος των σωματιδίων του αλγορίθμου. Όπως φαίνεται και στο διάγραμμα κλάσεων (Σχήμα 4.13), η κλάση Swarm συνδέεται με την κλάση Particle με τη σχέση particles πολλαπλότητας, που δείχνει ότι κάθε σμήνος περιλαμβάνει μηδέν (0) εως άπειρα σωματίδια. Οι μεταβλητές που ορίζονται για την κλάση αυτή είναι οι εξής: o c1, c2, w, k: Οι μεταβλητές αυτές ορίζουν τις εξής παραμέτρους του αλγορίθμου: α) συντελεστές επιτάχυνσης, β) συντελεστής αδράνειας και γ) παράμετρος clamping (βλέπε κεφ ). o maxpos, minpos: Οι μεταβλητές αυτές ορίζουν τα όρια του χώρου του προβλήματος (βλέπε κεφ ). o maxv, minv: Οι μεταβλητές αυτές ορίζουν τα όρια της ταχύτητας των σωματιδίων. o Dim: Η μεταβλητή αυτή ορίζει τη διάσταση του χώρου του προβλήματος (βλέπε κεφ ) o numberparticles: Η μεταβλητή αυτή ορίζει τον αριθμό των σωματιδίων που θα περιλαμβάνει το σμήνος. o numberiterations: Η μεταβλητή αυτή ορίζει το πλήθος των εκτελέσεων του αλγορίθμου. Το συγκεκριμένο πλήθος αποτελεί και τη μόνη συνθήκη σύγκλισης του αλγορίθμου. o bestglobalposition: Η μεταβλητή αυτή δείχνει τη θέση του χώρου του προβλήματος με την καλύτερη τιμή καταλληλότητας. Όπως είναι φυσικό, όταν ο αλγόριθμος συγκλίνει, το περιεχόμενο αυτής της μεταβλητής είναι το τιμολόγιο που κρίθηκε βέλτιστο. o bestglobalfitness: Η μεταβλητή αυτή περιλαμβάνει την τιμή καταλληλότητας της παραπάνω θέσης. o LAMBDA, lambdamax, rationality: Η πρώτη μεταβλητή χρησιμοποιείται στη σχέση υπολογισμού της πιθανότητας (σχέση 4.15), της συνάρτησης στόχου του σμήνους. Οι επόμενες δύο μεταβλητές χρησιμοποιούνται για τον υπολογισμό της πρώτης (σύμφωνα με τη σχέση 5.5. o defaulttariffs: Στη μεταβλητή αυτή αποθηκεύονται τα τιμολόγια του Default Broker, ώστε να είναι δυνατός ο υπολογισμός της τιμής καταλληλότητας των υποψήφιων προς έκδοση τιμολογίων (βλέπε κεφ ). o broker: Η μεταβλητή αυτή δείχνει τον πράκτορα και είναι απαραίτητη για τη δημιουργία τιμολογίων, που υλοποιούνται μέσω της κλάσης TariffSpecification. 113

114 o o o o pt: Η μεταβλητή αυτή δείχνει τον τύπο της ενέργειας του τιμολογίου που καλείται να βρει το σμήνος. usage: Η μεταβλητή αυτή δείχνει την bootstrap κατανάλωση των πελατών που είναι απαραίτητη για τον υπολογισμό του μεταβλητού κόστους κάθε τιμολογίου. tariffevaluationhelper: Η συγκεκριμένη μεταβλητή χρησιμοποιείται για τον υπολογισμό του μεταβλητού κόστους των τιμολογίων. compcoeff: Στη δομή αυτή αποθηκεύεται ένας συντελεστής για κάθε πελάτη, ο οποίος υπολογίζεται κατά την αρχικοποίηση του σμήνους και δείχνει την ποσότητα της εξίσωσης υπολογισμού του ποσοστού αποδοχής o o (σχέση 4.15). Στο σύνολο περιλαμβάνονται όλα τα ενεργά τιμολόγια που καλείται να ανταγωνιστεί το τιμολόγιο που θα προκύψει από τον αλγόριθμο. Η συγκεκριμένη ποσότητα υπολογίζεται εκ των προτέρων, ώστε να χρησιμοποιείται για τον υπολογισμό της πιθανότητας κάθε υποψήφιου τιμολογίου κατά την εκτέλεση του αλγορίθμου. firsttariff: Η boolean αυτή μεταβλητή δείχνει αν είναι το πρώτο τιμολόγιο που εκδίδει ο πράκτορας ή όχι. Χρησιμοποιείται για να δείξει ποιός τύπος πρέπει να χρησιμοποιηθεί για τον υπολογισμό του ποσοστού αποδοχής της συνάρτησης στόχου (βλέπε κεφ ). EPSILON, PERCENTAGE: Όπως φαίνεται και από το όνομα τους, οι σταθερές αυτές περιλαμβάνουν μία προσεγγιστική τιμή του e, και τον αριθμό εκατό (100) αντίστοιχα. Οι συναρτήσεις της κλάσης είναι η εξής: o o o o getobjectivefunction(): Η συνάρτηση αυτή λαμβάνει ως είσοδο ένα διάνυσμα παραμέτρων τιμολογίου και υπολογίζει την τιμή καταλληλότητας του τιμολογίου σύμφωνα με τη συνάρτηση στόχου του σμήνους (βλέπε 4.3.2). estimatefixedtariffpayments(): Η συνάρτηση αυτή υπολογίζει το σταθερό κόστος ενός υποψήφιου τιμολογίου. estimatevariabletariffpayments(): Η συνάρτηση αυτή υπολογίζει το μεταβλητό κόστος ενός υποψήφιου τιμολογίου. tariffcostestimation(): Η συνάρτηση αυτή υπολογίζει το κόστος που αναμένεται να έχει ένα συγκεκριμένο τιμολόγιο για ένα συγκεκριμένο πελάτη. Το κόστος 114

115 αυτό ορίζεται ως το άθροισμα του μεταβλητού και του σταθερού κόστους του τιμολογίου. o o o o utilitycostestimation(): Η συνάρτηση αυτή υπολογίζει την τιμή χρησιμότητας που αντιστοιχεί ο πελάτης στο υποψήφιο τιμολόγιο,, για τον υπολογισμό του ποσοστού του τιμολογίου (σχέση 4.15). postospec(): Η συνάρτηση αυτή είναι υπεύθυνη για τη μετατροπή μίας θέσης του χώρου του προβλήματος σε τιμολόγιο. Συγκεκριμένα, όπως έγινε φανερό από την μέχρι τώρα ανάλυση, ο χώρος του προβλήματος αποτελείται από διανύσματα παραμέτρων τιμολογίων. Προκειμένου ο πράκτορας να υπολογίσει τα διάφορα μεγέθη που απαιτούνται για τον υπολογισμό της τιμής καταλληλότητας κάθε τιμολογίου, απαιτείται αυτά να είναι αντικείμενα τύπου TariffSpecification. Ως εκ τούτου, ρόλος της συνάρτησης είναι να λαμβάνει ένα διάνυσμα παραμέτρων και να το μετατρέπει σε αντικείμενο τύπου TariffSpecification. getinitaccrate(): Η συνάρτηση αυτή υπολογίζει το ποσοστό αποδοχής των αρχικών τιμολογίων του πράκτορα σύμφωνα με τις εξισώσεις που προέκυψαν από τον αλγόριθμο ΛΠ (βλέπε κεφ ). setdefaulttariff(): Η συνάρτηση αυτή αποθηκεύει στη μεταβλητή defaulttariffs, τα τιμολόγια που εκδίδονται από τον Default Broker. Κλάση OptimalTariffManager: Η κλάση αυτή είναι υπεύθυνη για τη διαμόρφωση των τιμολογίων του πράκτορα. Πιο συγκεκριμένα, η κλάση αυτή διαθέτει ένα αντικείμενο τύπου Swarm και είναι υπεύθυνη για την εκτέλεση του αλγορίθμου PSO. Οι μεταβλητές της κλάσης αυτής είναι οι εξής: o r1, r2: Πρόκειται για τους συντελεστές και της εξίσωσης ανανέωσης ταχύτητας του PSO (σχέση 4.1). o Dim: Η μεταβλητή αυτή ορίζει τη διάσταση του χώρου του προβλήματος (βλέπε κεφ ). o bootstrap: Πρόκειται για την bootstrap κατανάλωση των πελατών που όπως αναλύθηκε νωρίτερα, είναι απαραίτητη για τη συνάρτηση στόχου της Swarm. o broker: Όμοια με την αντίστοιχη μεταβλητή της κλάσης Swarm, η μεταβλητή αυτή δείχνει τον πράκτορα που υλοποιεί την συνάρτηση και είναι απαραίτητη για τη δημιουργία τιμολογίων, που υλοποιούνται μέσω της κλάσης TariffSpecification. 115

116 Οι συναρτήσεις της κλάσης είναι η εξής: o o o findoptimalposition(): Η συνάρτηση αυτή είναι υπεύθυνη για την εκτέλεση του αλγορίθμου PSO. Όπως είναι φυσικό, ως αποτέλεσμα επιστρέφει το διάνυσμα του χώρου του προβλήματος που κρίθηκε βέλτιστο. gettariff(): Μέσω της συνάρτησης αυτής αιτούνται οι υπόλοιπες κλάσεις του συστήματος την εύρεση νέου τιμολογίου. Η συνάρτηση αυτή λαμβάνει ως είσοδο: α) το είδος της ενέργειας του ζητούμενου τιμολογίου, και β) δύο λίστες με τα ήδη ενεργά ανταγωνιστικά τιμολόγια που έχει εκδώσει ο πράκτορας και οι αντίπαλοι του αντίστοιχα. Ως αποτέλεσμα, η συνάρτηση επιστρέφει το ζητούμενο βέλτιστο τιμολόγιο. postospec(): Παρόμοια με την αντίστοιχη συνάρτηση της κλάσης Swarm, η συνάρτηση αυτή είναι υπεύθυνη για τη μετατροπή της βέλτιστης θέσης του χώρου του προβλήματος, που προκύπτει ως αποτέλεσμα από την συνάρτηση findoptimalposition, σε τιμολόγιο δηλαδή αντικείμενο τύπου TariffSpecification. Η μετατροπή αυτή είναι απαραίτητη, διότι το τιμολόγιο που επιστρέφει ως αποτέλεσμα η συνάρτηση gettariff πρέπει να είναι αντικείμενο αυτού του τύπου, ώστε να είναι δυνατή η έκδοση του στην Αγορά Τιμολογίων. Κλάση Global: Η κλάση αυτή είναι υπεύθυνη για την προσαρμογή των ορίων του χώρου του προβλήματος, όπως περιγράφηκε στην παράγραφο Για την υλοποίηση της συγκεκριμένης κλάσης χρησιμοποιήθηκε το πρότυπο σχεδίασης Singleton, σύμφωνα με το οποίο εξασφαλίζεται η δημιουργία ενός μοναδικού αντικειμένου της κλάσης. Το πρότυπο αυτό χρησιμοποιήθηκε διότι ήταν απαραίτητο όλες οι κλάσεις με τις οποίες αλληλεπιδρά η κλάση Global να «βλέπουν» το ίδιο ακριβώς αντικείμενο. Οι μεταβλητές της κλάσης αυτής είναι οι εξής: o Dim: Όμοια με την αντίστοιχη μεταβλητή των προηγούμενων κλάσεων, η μεταβλητή αυτή ορίζει τη διάσταση του χώρου του προβλήματος (βλέπε κεφ ). o mylasttariff: Στη μεταβλητή αυτή αποθηκεύεται το τελευταίο τιμολόγιο που έχει εκδώσει ο πράκτορας με βάση τον τύπο ενέργειας του. o minpos: Η μεταβλητή αυτή ορίζει το τρέχων κάτω όριο του χώρου του προβλήματος για κάθε είδος τιμολογίων, με βάση τον τύπο ενέργειας τους. o minposlim: Η μεταβλητή αυτή ορίζει το αυστηρό κάτω όριο του χώρου του προβλήματος για κάθε είδος τιμολογίων, με βάση τον τύπο ενέργειας τους. Η 116

117 μεταβλητή αυτή ορίστηκε ώστε να εξασφαλιστεί ότι όσο και να μετακινηθεί το τρέχων κάτω όριο minpos, δεν θα ξεπεράσει το αυστηρό όριο, αφού σε περιοχές πιο κάτω από το τελευταίο, οι τιμές είναι μη αποδεκτές (για τον αναλυτικό τρόπο προσαρμογής των ορίων βλέπε κεφ ). o maxposlim: Η μεταβλητή αυτή ορίζει το πάνω όριο του χώρου του προβλήματος για κάθε είδος τιμολογίων, με βάση τον τύπο ενέργειας τους. Οι συναρτήσεις της κλάσης είναι η εξής: o getglobalinstance(): Η συνάρτηση αυτή επιστρέφει το μοναδικό αντικείμενο της κλάσης. Την πρώτη φορά που καλείται δημιουργεί το ζητούμενο αντικείμενο. o Init(): Η συνάρτηση αυτή είναι υπεύθυνη για την αρχικοποίηση του αντικειμένου. o setmytariff(): Η συνάρτηση αυτή είναι υπεύθυνη για την αποθήκευση του τελευταίου τιμολογίου που εκδόθηκε για κάθε τύπο ενέργειας στη μεταβλητή mylasttariff. Πιο συγκεκριμένα, κάθε φορά που η κλάση OptimalTariffManager διαμορφώνει ένα νέο τιμολόγιο προς έκδοση, μέσω αυτής της συνάρτησης ενημερώνει την κλάση Global. o setparticlelimits(): Η συνάρτηση αυτή είναι υπεύθυνη για την κατάλληλη προσαρμογή της τρέχουσας τιμής του κάτω ορίου, minpos. Αρχικά πραγματοποιείται η αξιολόγηση του μεριδίου της αγοράς (βλέπε κεφ ) στην κλάση FuzzyUpdateStrategyService, και έπειτα η τελευταία καλεί τη συνάρτηση setparticlelimits, ώστε να προσαρμόσει κατάλληλα τα όρια. o getminpos(): Η συνάρτηση αυτή επιστρέφει την μεταβλητή minpos. Συγκεκριμένα η κλάση Swarm καλεί τη συγκεκριμένη συνάρτηση, για την αρχικοποίηση της μεταβλητής της minpos, κάθε φορά που ο πράκτορας πρέπει να βρει νέο τιμολόγιο. o getmaxpos(): Η συνάρτηση αυτή επιστρέφει την μεταβλητή maxpos. Όμοια με την προηγούμενη, η συνάρτηση αυτή καλείται από την κλάση Swarm για την αρχικοποίηση της μεταβλητής της maxpos. Κλάση PortfolioManagerService: Η κλάση αυτή είναι υπεύθυνη για τη διαχείρηση του χαρτοφυλακίου του πράκτορα. Στις αρμοδιότητες της περιλαμβάνονται: α) η 117

118 διαμόρφωση και η ανανέωση των τιμολογίων του πράκτορα, και β) η λήψη και διαχείριση πληροφοριών. Στις πληροφορίες που διαχειρίζεται περιλαμβάνονται: α) εγγραφές και αποχωρήσεις πελατών για τα τιμολόγια που προσφέρει ο πράκτορας, β) τα μεγέθη κατανάλωσης ή παραγωγής των συμβεβλημένων πελατών και δ) αλλαγές σχετικές με τα τιμολόγια των αντίπαλων πρακτόρων. Κλάση FuzzyUpdateService: Η κλάση αυτή είναι υπεύθυνη για την αξιολόγηση του μεριδίου της αγοράς του πράκτορα, όπως περιγράφηκε στο κεφ Κλάση DataCollectorService: Η κλάση αυτή είναι υπεύθυνη για τη συλλογή όλων των δεδομένων που μπορεί να χρειαστεί ο πράκτορας κατά τη διάρκεια ενός παιχνιδιού. Η καταγραφή των δεδομένων πραγματοποιείται κάθε φορά που ο πράκτορας λαμβάνει οποιαδήποτε πληροφορία από τον server σε μορφή μηνύματος. Όσον αφορά το σύστημα ενημέρωσης και διαμόρφωσης τιμολογίων, η κλάση αυτή παρέχει τα εξής δεδομένα: α) τα τιμολόγια των αντιπάλων, β) τα ενεργά τιμολόγια του πράκτορα, γ) την bootstrap κατανάλωση/παραγωγή των πελατών, δ) το πλήθος όλων των πελατών ανά τύπο ενέργειας καθώς και εκείνων που είναι εγγεγραμμένοι στα τιμολόγια του πράκτορα, ε) το πλήθος των πρακτόρων, στ) τα συνολικά κέρδη του πράκτορα, ζ) το συνολικό κέρδος ή κόστος που επέφερε στον πράκτορα κάθε ένα από τα ενεργά του τιμολόγια, η) την ενέργεια που πρέπει να προμηθευτεί από την αγορά χονδρικής και εκείνη που αγόρασε από τους συμβεβλημένους σε αυτόν παραγωγούς. 118

119 Κεφάλαιο 5 Πειράματα και Αποτελέσματα 5.1 Γενικά Όπως έχει ήδη αναφερθεί, στόχος της παρούσας διπλωματικής είναι η σχεδίαση των στρατηγικών διαμόρφωσης και ενημέρωσης τιμολόγιων ενός πράκτορα που έχει τον ρόλο του μεσάζοντα, ώστε να επιτυγχάνει το μέγιστο δυνατό κέρδος, σε μία ανταγωνιστική Αγορά Τιμολογίων. Στόχος του κεφαλαίου αυτού είναι: α) η ρύθμιση των παραμέτρων των στρατηγικών του πράκτορα, που παρουσιάστηκαν στο προηγούμενο κεφάλαιο, ώστε να αποφέρουν τα βέλτιστα δυνατά αποτελέσματα και β) η μελέτη της απόδοσης που μπορεί να επιτύχει ο πράκτορας, σε διάφορες συνθήκες της αγοράς Οργάνωση Πειραμάτων Τα σετ πειραμάτων που περιλαμβάνονται στο παρόν κεφάλαιο, πραγματοποιήθηκαν σειριακά, για την βέλτιστη παραμετροποίηση του πράκτορα. Η σειρά αυτή παρατίθενται στη συνέχεια του κεφαλαίου, και είναι η εξής: Πειράματα ποσοστού αποδοχής Πρόκειται για τα πειράματα που πραγματοποιήθηκαν για τη δημιουργία των σετ εκπαίδευσης του αλγορίθμου ΛΠ (κεφ ). Τα σετ δεδομένων που προέκυψαν, 119

120 συνέβαλλαν τόσο στη δημιουργία των ζητούμενων εξισώσεων για την εκτίμηση του ποσοστού αποδοχής των αρχικών τιμολογίων, όσο και για την πραγματοποίηση μίας πρώτης εκτίμησης των προτιμήσεων των πελατών της πλατφόρμας. Πειράματα παραμέτρων στρατηγικής Στόχος αυτού του σετ πειραμάτων είναι η βέλτιστη ρύθμιση των παραμέτρων που επηρεάζουν την απόδοση του πράκτορα. Στις παραμέτρους αυτές περιλαμβάνονται: α) οι παράμετροι του αλγορίθμου PSO, β) η παραλλαγή του αλγορίθμου του PSO και γ) ο αριθμός των χρεώσεων που προβλέπουν τα τιμολόγια του πράκτορα. Πειράματα ψυχολογίας πελατών Στο σετ αυτό εξετάζεται η απόδοση του πράκτορα για τις διάφορες τιμές που μπορεί να λάβουν οι παράμετροι της ψυχολογίας των πελατών. Οι παράμετροι αυτοί είναι καίριας σημασίας, διότι επηρεάζουν άμεσα τον τρόπο με τον οποίο οι πελάτες αξιολογούν και επιλέγουν τα τιμολόγια που προσφέρουν οι πράκτορες. Πειράματα με διαφορετικούς αντιπάλους Στο συγκεκριμένο σετ, το ζητούμενο είναι να ερευνηθεί η απόδοση του πράκτορα όταν ο ανταγωνισμός αυξάνεται στην αγορά, είτε λόγω του πλήθους, είτε λόγω της «ποιότητας» των αντιπάλων. Παιχνίδια διαγωνισμού Power TAC 2013 Πρόκειται για τα παιχνίδια στα οποία συμμετείχε ο πράκτορας μας στα πλαίσια του διαγωνισμού Power TAC Μετρικές Αξιολόγησης Στην προηγούμενη παράγραφο αναφέρθηκαν οι κατηγορίες των πειραμάτων που πραγματοποιήθηκαν. Για ένα υποσύνολο αυτών, έγινε χρήση μετρικών αξιολόγησης για την μέτρηση της απόδοσης κάθε πράκτορα. Το υποσύνολο αυτό περιλαμβάνει: α) τα πειράματα παραμέτρων στρατηγικής, β) τα πειράματα ψυχολογίας πελατών και γ) τα πειράματα με διαφορετικούς αντιπάλους. Οι μετρικές που χρησιμοποιήθηκαν στα παραπάνω πειράματα είναι οι εξής: 120

121 Μέσο μερίδιο αγοράς (Mean market share): Υπολογίζεται βρίσκοντας το μέσο όρο των πελατών του μεσάζοντα κατά την διάρκεια ενός παιχνιδιού, διάρκειας timeslots, όπου το μερίδιο αγοράς για κάθε timeslot προκύπτει από τη διαίρεση των πελατών του πράκτορα,, προς το συνολικό αριθμό των πελατών,, σε ποσοστό επί τοις εκατό: (5.1) Συνολικά κέρδη (Total profit): Αφορά το συνολικό κέρδος που αποκόμισε ο πράκτορας για το τρέχων πείραμα. Είναι δυνατό να λάβει αρνητικές τιμές, δηλώνοντας ότι ο πράκτορας είχε ζημία. Από την ανάλυση του αλγορίθμου PSO γίνεται αντιληπτό πως οι αρχικές θέσεις των σωματιδίων, και η τροχιά τους γενικότερα, δεν είναι σταθερές μεταξύ των διαφορετικών εκτελέσεων του αλγορίθμου. Το γεγονός αυτό, όπως είναι φυσικό, επηρεάζει τη στρατηγική διαμόρφωσης τιμολογίων του πράκτορα, αφού με βάση τις θέσεις των σωματιδίων στο χώρο του προβλήματος διαμορφώνονται τα νέα τιμολόγια. Έτσι, προκειμένου να αποδειχθεί ότι αυτή η «τυχαιότητα» δεν επηρεάζει την τελική απόδοση της στρατηγικής διαμόρφωσης τιμολογίων, εφαρμόστηκε η μέθοδος Monte Carlo 12. Προκειμένου να καταλήξουμε σε όσο το δυνατόν πιο αντικειμενικά συμπεράσματα, κάθε πείραμα πραγματοποιήθηκε δέκα (10) φορές, και λήφθηκαν οι μέσοι όροι και οι διακυμάνσεις των παραπάνω μετρικών Υποδομή Λογισμικού και Υλικού Για την υλοποίηση του πράκτορα και κατ επέκταση των στρατηγικών που υλοποιήθηκαν στα πλαίσια της παρούσας διπλωματικής, επιλέχθηκε η γλώσσα αντικειμενοστραφούς προγραμματισμού Java 13, που θεωρείται το πλέον διαδεδομένο προγραμματιστικό εργαλείο για την ανάπτυξη εφαρμογών που βασίζονται σε πράκτορες ή Πολυπρακτορικά Συστήματα. Με στόχο η εργασία να γίνει απρόσκοπτα και χωρίς προβλήματα, χρησιμοποίηθηκε η τελευταία έκδοση της, η Java SE 7. Η πλατφόρμα που χρησιμοποιήθηκε για την ανάπτυξη του πράκτορα καθώς και για την διεξαγωγή των

122 πειραμάτων ήταν η Spring Tool Suite ΤΜ 14, που στηρίζεται στο περιβάλλον του Eclipse. Προκειμένου να παρέχει τη βέλτιστη λειτουργικότητα, η πλατφόρμα ήταν στην τελευταία έκδοση της, την Ο υπολογιστής που χρησιμοποιήθηκε για την εκτέλεση όλων των πειραμάτων ήταν ένα laptop με επεξεργαστή Corei5 στα 2.3 GHz με 4 GB φυσική μνήμη RAM και 500 GB σκληρό δίσκο. 5.2 Πειράματα ποσοστού αποδοχής Στο κεφάλαιο αυτό, αναλύεται ο τρόπος με τον οποίο δημιουργήθηκαν τα σετ εκπαίδευσης για τον αλγόριθμο ΛΠ (παράγραφος 4.3.3). Λαμβάνοντας υπόψη το πρόβλημα που επιθυμούμε να επιλύσουμε, κάθε στοιχείο των σετ εκπαίδευσης αποτελείται από ένα τιμολόγιο και το αντίστοιχο ποσοστό αποδοχής του στην αγορά. Πιο συγκεκριμένα, με βάση τα είδη τιμολογίων που ορίστηκαν για τον πράκτορα μας (βλέπε κεφ ), κάθε στοιχείο του σετ εκπαίδευσης, αποτελείται από τις εξής παραμέτρους: α) το κόστος εγγραφής, β) την κύρωση πρόωρης απόσυρσης, γ) το πάγιο τέλος, δ) το κόστος ΗΕ/kWh, και ε) το ποσοστό αποδοχής. Γίνεται φανερό, πως κάθε στοιχείο αποτελείται από ένα τιμολόγιο που περιγράφεται από τις παραμέτρους α-δ (βλέπε κεφ ) και το ποσοστό των πελατών που το επέλεξαν (παράμετρος ε). Στόχος των πειραμάτων αυτής της παραγράφου, ήταν δοθέντων όσο το δυνατόν περισσότερων διαφορετικών συνδυασμών των παραμέτρων α-δ, να υπολογιστεί η παράμετρος ε. Το πρόβλημα της συλλογής των ζητούμενων δεδομένων, χωρίστηκε σε υποπροβλήματα, με βάση:

123 την ομάδα καταναλωτών, καθώς τα μοντέλα καταναλωτών που υπάρχουν μέσα στην πλατφόρμα διαφέρουν πολύ μεταξύ τους, τόσο στα πρότυπα κατανάλωσης όσο και στις προτιμήσεις των τιμολογίων, και την διάσταση του χώρου του προβλήματος,. Όσον αφορά τη διάσταση του χώρου του προβλήματος (βλέπε κεφ ), υπενθυμίζεται πως ορίζονται, κατ αναλογία, μία (1), δύο (2) ή τρεις (3) διαφορετικές χρεώσεις ΗΕ/kWh. Έτσι, για την περίπτωση που, για κάθε στοιχείο του σετ εκπαίδευσης, ορίζονται μία (1) (για ), ή δύο (2) (για ), επιπλέον παράμετροι για το κόστος ΗΕ/kWH. Για αυτό το λόγο, ορίστηκαν διαφορετικά πειράματα, για: α) οικιακούς καταναλωτές και β) επαγγελματικά γραφεία, καθώς και για τιμολόγια διάστασης: α), β), και γ). Επιλέξαμε να μην κάνουμε πειράματα για τους καταναλωτές μεγάλου μεγέθους καθώς είναι στατιστικά μοντέλα που προέκυψαν από τα μοντέλα που αναλύονται. Όπως αναφέρθηκε παραπάνω, το ζητούμενο των πειραμάτων ήταν η συλλογή των ποσοστών αποδοχής διαφόρων τιμολογίων. Προκειμένου να ληφθούν τα ποσοστά για όσο το δυνατόν περισσότερα τιμολόγια κατά την διάρκεια ενός παιχνιδιού, ο πράκτορας ακολουθεί μία συγκεκριμένη πορεία ενεργειών. Σύμφωνα με αυτή, στην αρχή του παιχνιδιού, ο πράκτορας εκδίδει ένα τιμολόγιο, το οποίο παραμένει ενεργό για διάρκεια timeslots. Με την ολοκλήρωση αυτής της περιόδου, ο πράκτορας αποσύρει το συγκεκριμένο τιμολόγιο, καταγράφει το ποσοστό των πελατών που το επέλεξαν και εκδίδει ένα νέο με διαφορετικές παραμέτρους. Το ζητούμενο ποσοστό, δίνεται από τη σχέση: (5.2) όπου, το πλήθος των πελατών που επέλεξαν το μοναδικό ενεργό τιμολόγιο του πράκτορα και, το πλήθος όλων των πελατών. Έπειτα, όμοια με πριν, μετά από χρονική διάρκεια, ο πράκτορας αποσύρει το νέο τιμολόγιο κ.ο.κ. Υπογραμμίζεται πως η περίοδος των έξι (6) timeslots, επιλέχθηκε έτσι ώστε να συμπίπτει με την χρονική στιγμή που οι πελάτες πραγματοποιούν αξιολογήσεις τιμολογίων. Ως εκ τούτου, προκείμενου να εξασφαλιστεί η σταθερή αυτή περίοδος αξιολογήσεων, ήταν απαραίτητο η παράμετρος αδράνειας (Inertia) των καταναλωτών, να οριστεί ίση με μηδέν (0). Πολύ σημαντικό ρόλο στην παραπάνω διαδικασία παίζει ο τρόπος με τον οποίο ο πράκτορας επιλέγει τις παραμέτρους των νέων τιμολογίων. Όπως αναλύεται στο κεφάλαιο 4.3.1, το σύνολο τον υποψήφιων προς έκδοση τιμολογίων, ορίζει τον χώρο του 123

124 προβλήματος, ο οποίος οριοθετείται από τα διανύσματα και. Δεδομένου ότι ο χώρος του προβλήματος είναι συνεχής και κατ επέκταση τα τιμολόγια που θα μπορούσαν να επιλεχθούν άπειρα, ορίστηκε μία δειγματοληπτική μέθοδος, με στόχο τα σετ εκπαίδευσης που προκύπτουν να είναι όσο το δυνατόν πιο αντιπροσωπευτικά. Πιο συγκεκριμένα, η μέθοδος ορίζει μία παράμετρο, που δείχνει τον αριθμό των δειγμάτων που επιθυμούμε να λάβουμε από κάθε παράμετρο ενός τιμολογίου. Ως εκ τούτου, αντιλαμβάνεται κανείς πως το σύνολο όλων των διαφορετικών τιμολογίων που μπορεί να ληφθούν, με την έννοια των διαφορετικών πιθανών συνδυασμών μεταξύ των παραμέτρων τους, δίνεται από τη σχέση: (5.3) όπου, η διάσταση του χώρου του προβλήματος. Στην αρχή του παιχνιδιού, ο πράκτορας εκδίδει ένα τιμολόγιο με παραμέτρους που δίνονται από το κάτω όριο του χώρου του προβλήματος,, και έπειτα, οι παράμετροι κάθε επόμενου τιμολογίου, που ορίζουν ένα διάνυσμα, διάστασης, δίνονται από τη σχέση: (5.4) Από την εξίσωση (5.4 γίνεται φανερό πως οι παράμετροι κάθε νέου τιμολογίου, υπολογίζονται ώστε να διαφέρουν κατά 15 από το αρχικό τιμολόγιο παραμέτρων. Οι παράμετροι και ορίζονται έτσι ώστε να επιτυγχάνεται η δειγματοληψία που επιθυμούμε στο χώρο αναζήτησης. Ειδικότερα, η παράμετρος, ορίζεται ως ένα διάνυσμα διάστασης, που δίνει το βήμα μεταξύ των δειγμάτων που επιθυμούμε να λάβουμε από κάθε παράμετρο του τιμολογίου, και αρχικοποιείται σύμφωνα με τη σχέση: (5.5) Από την άλλη, η παράμετρος ορίζει ως ένα μετρητή βάσης και διάστασης, που κρατά το πλήθος των τιμολογίων παρατηρήσεων που έχουν ληφθεί, εκφρασμένο ως έναν αριθμό ψηφίων και βάσης. 15 Υπενθυμίζεται ότι ο τελεστής συμβολίζει πως ο πολλαπλασιασμός πραγματοποιείται σε επίπεδο συνιστωσών. 124

125 Με βάση τα παραπάνω, η πορεία των ενεργειών του πράκτορα για τη δημιουργία των σετ εκπαίδευσης διαμορφώνεται όπως φαίνεται στο Σχήμα 5.1. Αρχικά, στο πρώτο timeslot του παιχνιδιού εκδίδεται ένα τιμολόγιο με παραμέτρους που δίνονται από το διάνυσμα και ένας δεκαδικός μετρητής ( ) αυξάνεται κατά ένα (1). Έπειτα από έξι (6) timeslots, αποθηκεύεται το ποσοστό αποδοχής που κατάφερε να επιτύχει το τιμολόγιο αυτό και αποσύρεται από την αγορά. Στη συνέχεια, πραγματοποιείται η κατάλληλη μετατροπή του περιεχομένου του μετρητή σε έναν αριθμό βάσης και διάστασης και αποθηκεύεται στον. Τέλος, υπολογίζονται οι παράμετροι του νέου τιμολογίου σύμφωνα με την εξίσωση 5.4 και έπειτα το νέο τιμολόγιο εκδίδεται στην Αγορά Τιμολογίων. Η παραπάνω διαδικασία, πραγματοποιείται επαναληπτικά, μέχρι να ληφθούν παρατηρήσεις πλήθους. Initialize,,, Set tariff = Publish Increase DO IF current timeslot mod 6 = 0 Create a new observation with parameters and acceptance rate. Revoke IF current observations < Convert in a base number, Save to Set tariff = + Publish Increase ENDIF ENDIF WHILE current observations < Σχήμα 5.1: Αλγόριθμος δημιουργίας σετ εκπαίδευσης. Στη συνέχεια, παρουσιάζεται τα αποτελέσματα των πειραμάτων για αντιπροσωπευτικές τιμές των δειγμάτων. Ενδεικτικά, παρουσιάζεται το σετ εκπαίδευσης, που προέκυψε για οικιακούς καταναλωτές, όταν ο πράκτορας προσέφερε τιμολόγια διάστασης και η παράμετρος της δειγματοληπτικής μεθόδου ήταν ίση με. 125

126 Επειδή η ταυτόχρονη αναπαράσταση των τεσσάρων παραμέτρων κάθε τιμολογίου, συναρτήσει του ποσοστού αποδοχής ήταν αδύνατη, οι γραφικές παραστάσεις ορίστηκαν για σταθερή τιμή της παραμέτρου που ορίζει την χρέωση της ΗΕ/kWh, και δημιουργήθηκαν πέντε (5) διαφορετικές 3-Δ γραφικές παραστάσεις, για τις διαφορετικές τιμές της παραμέτρου που ορίζει το πάγιο τέλος. Η σταθερή τιμή της χρέωσης ΗΕ/kWh ρυθμίστηκε στα /kwh, διότι πάνω από αυτή την τιμή (π.χ. /kwh), το ποσοστό αποδοχής ήταν μηδέν (0), και κάτω από αυτή (π.χ. /kwh), απόλυτα ένα (1). Το γεγονός αυτό προκύπτει διότι στα συγκεκριμένα πειράματα συμμετείχε μόνο ο Default Broker που προσφέρει ένα τιμολόγιο κατανάλωσης στα /kwh. Ως εκ τούτου, οι καταναλωτές παρακινούνται να αλλάξουν μεσάζοντα μόνο εάν τους προσφέρει τιμολόγια ίδιας η χαμηλότερης τιμής. Τέλος, τα όρια του χώρου του προβλήματος είχαν οριστεί ως εξής: α) και β). Στο Σχήμα 5.2 φαίνεται πως μεταβάλλεται το ποσοστό αποδοχής, συναρτήσει του κόστους εγγραφής και του κόστους πρόωρης απόσυρσης, όταν το πάγιο τέλος είναι /timeslot. Το πάγιο τέλος σε αυτή την τιμή, είναι αρκετά υψηλό, έτσι, όπως φαίνεται στο σχήμα, κανένα τιμολόγιο δεν ξεπερνά το ποσοστό αποδοχής. Το ποσοστό φαίνεται να είναι υψηλότερο όταν και οι δύο η μία εκ των δύο παραμέτρων λαμβάνει χαμηλές τιμές ( ). Αντίθετα, όταν λαμβάνουν και οι δύο αρκετά υψηλές τιμές ( ), το ποσοστό φαίνεται να μειώνεται. Στο Σχήμα 5.3 φαίνεται πως μεταβάλλεται το ποσοστό, συναρτήσει του κόστους εγγραφής και του κόστους πρόωρης απόσυρσης, όταν το πάγιο τέλος είναι /timeslot. Παρατηρούμε πως στην περίπτωση αυτή, υπάρχουν τιμολόγια με καλύτερο ποσοστό αποδοχής σε σχέση με πριν, δηλαδή περίπου ίσο με. Παρατηρείται πως για τη συγκεκριμένη τιμή παγίου, οι καταναλωτές προτιμούν τιμολόγια που έχουν τη μία εκ των δύο παραμέτρων ρυθμισμένη σε χαμηλή τιμή ( ). Στο Σχήμα 5.4, το πάγιο τέλος τέθηκε στα /timeslot. Στην περίπτωση αυτή, το ποσοστό αποδοχής φαίνεται να έχει μεγαλύτερη διαφορά μεταξύ μέγιστης και ελάχιστης τιμής. Ειδικότερα, όταν και οι δύο παράμετροι (κόστος εγγραφής και πρόωρης απόσυρσης) κυμαίνονται ταυτόχρονα στις χαμηλότερες τιμές τους ( ), το ποσοστό τείνει στα, ενώ όταν κυμαίνονται στις υψηλότερες ( ), τείνει στα. Γίνεται φανερό πως, σε σχέση με τα προηγούμενα σχήματα, όσο η τιμή του παγίου μειώνεται, τόσο το ποσοστό αποδοχής τείνει να φτάνει σε υψηλότερα επίπεδα. 126

127 Periodic Payment = Acceptance Rate Early Withdrawal Payment Sing Up Payment 0 Σχήμα 5.2: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot. Periodic Payment = Acceptance Rate Early Withdrawal Payment Sing Up Payment 0 Σχήμα 5.3: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot. 127

128 Periodic Payment = Acceptance Rate Early Withdrawal Payment Sing Up Payment 0 Σχήμα 5.4: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot. Periodic Payment = Acceptance Rate Early Withdrawal Payment Sing Up Payment 0 Σχήμα 5.5: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot. 128

129 Στο Σχήμα 5.5, το πάγιο τέλος έχει οριστεί στα /timeslot. Όμοια με την προηγούμενη περίπτωση, παρατηρούμε πως η μέγιστη τιμή του ποσοστού αποδοχής τείνει στα. Ακόμα, φαίνεται πως η συμπεριφορά των καταναλωτών ακολουθεί και πάλι το ίδιο πρότυπο, δηλαδή όταν και οι δύο παράμετροι κυμαίνονται ταυτόχρονα στις χαμηλότερες τιμές τους ( ), το ποσοστό λαμβάνει υψηλότερες τιμές, ενώ όταν κυμαίνονται στις υψηλότερες ( ), λαμβάνει χαμηλότερες. Τέλος, στο Σχήμα 5.6, το πάγιο τέλος είναι /timeslot. Καθώς η τιμή αυτή για την πάγια χρέωση είναι ιδιαίτερα χαμηλή, το ποσοστό αποδοχής πλέον φαίνεται να ξεπερνά τα. Απο την άλλη, η συμπεριφορά των καταναλωτών φαίνεται να παραμένει ίδια με αυτή των δύο προηγούμενων σχημάτων. Συνοψίζοντας, από τα σχήματα που παρατίθενται, γίνεται αντιληπτό πως σε γενικές γραμμές η συμπεριφορά των καταναλωτών ακολουθεί το ίδιο μοτίβο. Σύμφωνα με αυτό, παρατηρείται πως οι αλλαγές στο κόστος ΗΕ/kWh οδηγούν σε σημαντικές αλλαγές στα ποσοστά αποδοχής, ενώ οι αλλαγές των υπόλοιπων τριών παραμέτρων (κόστος εγγραφής, κύρωση πρόωρης απόσυρσης και πάγιο τέλος), φαίνεται πως επηρεάζουν πολύ λιγότερο τις αποφάσεις των καταναλωτών. Το γεγονός αυτό γίνεται εύκολα κατανοητό από τα σχήματα, όπου για κόστος ΗΕ/kWh στα περίπου στο διάστημα., σε κάθε περίπτωση, το ποσοστό αποδοχής κυμαίνεται Τέλος, λαμβάνοντας υπόψη τα παραπάνω, μία καλή ρύθμιση των αρχικών ορίων του χώρου του προβλήματος θα ήταν για: α) και β). 129

130 Periodic Payment = Acceptance Rate Early Withdrawal Payment Sing Up Payment 0 Σχήμα 5.6: Γραφική παράσταση ποσοστού αποδοχής για πάγιο τέλος /timeslot. 5.3 Πειράματα παραμέτρων στρατηγικής Το πρώτο σετ πειραμάτων που έγινε με συμμετοχή ανταγωνιστικών αντιπάλων αφορά τη βελτιστοποίηση των παραμέτρων της στρατηγικής διαμόρφωσης τιμολογίων που υλοποιήθηκε. Από το σύνολο των παραμέτρων που ορίζει η στρατηγική, εκείνες που μπορούν να επηρεάζουν την απόδοση του πράκτορα είναι: α) οι παράμετροι του αλγορίθμου, β) η παραλλαγή του αλγορίθμου PSO, και γ) ο αριθμός τον χρεώσεων που προδιαγράφει ένα τιμολόγιο. Οι παράμετροι που αφορούν τον αλγόριθμο PSO, ορίστηκαν σε τυπικές σταθερές τιμές, οι οποίες δίνονται στον Πίνακα 5.1. Η παράμετρος clamping ορίστηκε σε χαμηλή τιμή ( ), ώστε τα σωματίδια να μην κινούνται σε ακραίες περιοχές του χώρου αναζήτησης. 130

131 Παράμετρος Τιμή Number of Particles 10 Number of Iterations 1000 Cognitive weight Social weight Inertia weight 1.0 Clamping factor 0.3 Πίνακας 5.1: Παράμετροι αλγορίθμου PSO. Με στόχο την βέλτιστη επιλογή των παραμέτρων, για την αξιολόγηση της απόδοσης του πράκτορα σε κάθε περίπτωση χρησιμοποιήθηκε ως αντίπαλος ένας πράκτορας που ακολουθούσε τη στρατηγική ZIP (βλέπε κεφάλαιο ). Η στρατηγική αυτή επιλέχθηκε διότι σύμφωνα με την ανάλυση που παρατίθεται στην [136], φαίνεται να επιτυγχάνει καλύτερα αποτελέσματα συγκριτικά με τις ZI, RE, GD στην αγορά του Power TAC. Τα πειράματα αυτά, πραγματοποιήθηκαν για δύο ομάδες καταναλωτών: α) τους οικιακούς καταναλωτές (household customers) και β) τα επαγγελματικά γραφεία (office customers), ώστε να εξασφαλισθεί η ευρωστία του πράκτορα για διάφορα πρότυπα κατανάλωσης. Επειδή οι δύο αυτές ομάδες πελατών περιλαμβάνουν καταναλωτές ενέργειας (Consumption, CONS) και καταναλωτές παροχής διακοπτόμενης ισχύος (Interruptible Consumption, INT CONS), στους πίνακες των αποτελεσμάτων που ακολουθούν, το μέσο μερίδιο της αγοράς κάθε πράκτορα διακρίνεται σε αυτούς του δύο τύπους καταναλωτών. Συγκεκριμένα, τα νοικοκυριά αποτελούνταν από 240 καταναλωτές τύπου CONS και 240 INT CONS, και τα γραφεία αποτελούνταν από 120 καταναλωτές τύπου CONS και 120 INT CONS Πειράματα παραλλαγών αλγορίθμου PSO Στο συγκεκριμένο σετ πειραμάτων εξετάστηκε η απόδοση της στρατηγικής διαμόρφωσης τιμολογίων με τη χρήση: α) του κλασσικού PSO (βλέπε κεφ. 4.2) και β) με τη χρήση της παραλλαγής FIPS (βλέπε κεφ ). Τα αποτελέσματα παρουσιάζονται παρακάτω: ο Πίνακας 5.2 περιλαμβάνει τις μετρικές για οικιακούς καταναλωτές (240 CONS, 240 INT CONS), και ο Πίνακας 5.3 περιλαμβάνει τις αντίστοιχες για την περίπτωση των επαγγελματικών γραφείων (120 CONS, 120 INT CONS). 131

132 Από τα αποτελέσματα των πινάκων, γίνεται εύκολα αντιληπτό πως και στις δύο περιπτώσεις, ο πράκτορας μας υπερέχει του αντιπάλου ZIP. Από τα συγκεντρωτικά αποτελέσματα του Πίνακα 5.4, παρατηρείται πως και οι δύο παραλλαγές του αλγορίθμου PSO, επιτυγχάνουν σχεδόν όμοια απόδοση. Το γεγονός αυτό ήταν αναμενόμενο, αφού η παραλλαγή FIPS δεν διαφέρει σημαντικά από την κλασσική εκδοχή του αλγορίθμου PSO. Ως εκ τούτου, για την συνέχεια των πειραμάτων επιλέχθηκε η παραλλαγή FIPS. 132

133 Πίνακας 5.2: Πειράματα με βάση την παραλλαγή του αλγορίθμου PSO, για οικιακούς καταναλωτές. ZIP PSO ZIP FIPS PSO VARIANT TEST Test Number Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean STD 133

134 Πίνακας 5.3: Πειράματα με βάση την παραλλαγή του αλγορίθμου PSO, για τα επαγγελματικά γραφεία. ZIP PSO ZIP FIPS PSO VARIANT TEST Test Number Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean STD 134

135 Πίνακας 5.4: Συγκεντρωτικά αποτελέσματα πειραμάτων παραλλαγής PSO. PSO Mean Market Share CONS INT CONS Total Profit FIPS Mean Market Share INT CONS CONS Total Profit households offices Πειράματα αριθμού χρεώσεων Στο συγκεκριμένο σετ πειραμάτων, εξετάστηκε η απόδοση της στρατηγικής για την έκδοση τιμολογίων που περιλαμβάνουν περισσότερες από μία χρεώσεις. Συγκεκριμένα, εξετάζεται η περίπτωση τιμολογίων τύπου TOU, σύμφωνα με τα οποία η ημέρα χωρίζεται στις εξής ωριαίες ζώνες, σε βάση 24-ώρου: α) 0-8, β) 8-22, γ) Ο διαχωρισμός αυτός, στηρίζεται στα συνήθη πρότυπα κατανάλωσης των πελατών, σύμφωνα με τα οποία κάθε ζώνη χαρακτηρίζεται από διαφορετικά επίπεδα ζήτησης [67]. Έτσι, στην πρώτη και στην τελευταία ζώνη, οι χρεώσεις που προτείνοται, θα πρέπει να είναι συνήθως χαμηλές, ώστε οι πελάτες να παρακινούνται να μετακινήσουν το φορτίο τους σε αυτές και όχι στη μεσαία ζώνη, που σηματοδοτεί τις ώρες αιχμής της ζήτησης. Οι περιπτώσεις που εξετάστηκαν είναι οι εξής: Μία (1) χρέωση για όλες τις ζώνες. Δύο (2) χρεώσεις: Στην περίπτωση αυτή, εφαρμόζεται μία χρέωση για τη ζώνη υψηλής ζήτησης, 8-22, και διαφορετική χρέωση για τις ζώνες 0-8, Τρεις (3) χρεώσεις: Στην περίπτωση αυτή εφαρμόζεται διαφορετική χρέωση για κάθε ζώνη της ημέρας. Τα αποτελέσματα παρουσιάζονται παρακάτω: ο Πίνακας 5.5 περιλαμβάνει τις μετρικές για οικιακούς καταναλωτές (240 CONS, 240 INT CONS), και ο Πίνακας 5.6 περιλαμβάνει τις αντίστοιχες για την περίπτωση των επαγγελματικών γραφείων (120 CONS, 120 INT CONS). 135

136 Πίνακας 5.5: Πειράματα με βάση των αριθμό των χρεώσεων, για οικιακούς καταναλωτές. NUMBER OF RATES TEST Test Number Mean STD ZIP 1 ZIP 2 ZIP 3 Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit

137 Πίνακας 5.6: Πειράματα με βάση των αριθμό των χρεώσεων, για επαγγελματικά γραφεία. NUMBER OF RATES TEST Test Number Mean STD ZIP 1 ZIP 2 ZIP 3 Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit Mean CONS Market INT Share CONS Total Profit

138 Πίνακας 5.7: Συγκεντρωτικά αποτελέσματα πειραμάτων αριθμού χρεώσεων. Mean Market Share INT CONS CONS Total Profit Mean Market Share INT CONS CONS Total Profit Mean Market Share INT CONS CONS Total Profit households offices Από τα αποτελέσματα των παραπάνω πινάκων, παρατηρείται ότι και πάλι ο πράκτορας μας υπερέχει έναντι του ZIP. Στο συγκεντρωτικό Πίνακα 5.7, όσον αφορά την επιλογή του ιδανικού αριθμού χρεώσεων, παρατηρείται ότι τα αποτελέσματα σε κάθε περίπτωση τείνουν να είναι παρόμοια. Το γεγονός αυτό οφείλεται κατά κύριο λόγο στο ότι ο αντίπαλος πράκτορας ZIP, και όλοι οι διαθέσιμοι αντίπαλοι, προσφέρουν τιμολόγια σταθερής χρέωσης. Πιο συγκεκριμένα, επειδή η διαμόρφωση των τιμολογίων επηρεάζεται σημαντικά από τα τιμολόγια των ανταγωνιστών (βλέπε κεφ ), για την ανάλυση της συγκεκριμένης κατηγορίας πειραμάτων είναι απαραίτητο και οι αντίπαλοι να προσφέρουν τιμολόγια πολλαπλών χρεώσεων. Για το λόγο αυτό, και για τη αποφυγή της αύξησης της πολυπλοκότητας του προβλήματος, στα επόμενα πειράματα ο πράκτορας προσφέρει μόνο τιμολόγια σταθερής χρέωσης. 5.4 Πειράματα ψυχολογίας πελατών Όπως αναφέρεται και στην παράγραφο 3.7, τα μοντέλα των πελατών της πλατφόρμας του Power TAC, προκειμένου να είναι όσο το δυνατόν πιο ρεαλιστικά, περιλαμβάνουν ένα σύνολο παραμέτρων που ορίζουν την συμπεριφορά τους στην αγορά. Στόχος του συγκεκριμένου σετ πειραμάτων, είναι να εξεταστεί η απόδοση του πράκτορα, για τις διάφορες τιμές που μπορεί να λάβουν οι παράμετροι αυτοί. Ειδικότερα, για την συμπεριφορά των πελατών σχετικά με την αξιολόγηση και επιλογή τιμολογίων, ορίζονται οι εξής παράμετροι: Λογική (Rationality): Η παράμετρος αυτή δείχνει πόσο ορθολογικός είναι ο κάθε πελάτης, δηλαδή αν επιλέγει πάντα το τιμολόγιο που από την αξιολόγηση αναδείχθηκε το πιο συμφέρον. Οι τιμές που μπορεί να λάβει η παράμετρος αυτή 138

139 ανήκουν στο διάστημα. Όσο οι τιμές της παραμέτρου τείνουν στο μηδέν (0), τόσο λιγότερο ορθολογικός είναι ο πελάτης. Όχληση (Inconvenience): Η παράμετρος αυτή λαμβάνει τιμές στο διάστημα, και ορίζεται ως γραμμικός συνδυασμός συντελεστών που τιμωρούν προδιαγραφές τιμολογίων όπως μεταβλητές χρεώσεις, TOU χρεώσεις και κλιμακωτές χρεώσεις. Πρακτικά, ανακαλώντας την εξίσωση με βάση την οποία οι πελάτες υπολογίζουν την τιμή χρησιμότητας κάθε τιμολογίου (σχέση (3.12), συμπεραίνει κανείς πως όσο η παράμετρος αυτή αυξάνεται τόσο πιο δύσκολα ένα τιμολόγιο αξιολογείται ως συμφέρον. Αδράνεια (Inertia): Η παράμετρος αυτή, δείχνει πόσο συχνά ένας πελάτης πραγματοποιεί την διαδικασία της αξιολόγησης και επιλογής τιμολογίων. Οι δυνατές τιμές που μπορεί να πάρει, ανήκουν στο διάστημα, και δίνουν πρακτικά την πιθανότητα ένας πελάτης να μην αξιολογήσει τα νέα τιμολόγια τη στιγμή της έκδοσης τους. Με βάση τις παραπάνω παραμέτρους πραγματοποιήθηκαν τα εξής πειράματα: Πειράματα παραμέτρου λογικής: Στο συγκεκριμένο σετ εξετάστηκε η απόδοση σε μία αγορά που α&pi