ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ"

Transcript

1 Σ ε λ ί δ α 0 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ Διπλωματική Εργασία ΠΑΡΑΣΙΔΗ ΑΛΕΞΑΝΔΡΑ ΠΑΝΑΓΙΩΤΑΚΟΠΟΥΛΟΣ ΔΗΜΗΤΡΙΟΣ Επιβλέπων Καθηγητής: Αλεξιάδης Μηνάς ΘΕΣΣΑΛΟΝΙΚΗ 2013

2 Σ ε λ ί δ α 1

3 Σ ε λ ί δ α 2 Ε Υ Χ Α Ρ Ι Σ Τ Ι Ε Σ Πρώτα απ όλα θα θέλαμε να ευχαριστήσουμε τον επιβλέποντα της διπλωματικής εργασίας, Λέκτορα κ. Αλεξιάδη Μηνά, για το ενδιαφέρον, τη συμμετοχή και την καθοδήγησή του κατά τη διάρκεια της μελέτης μας. Η υπομονή και η πάντα ευδιάθετη αντιμετώπισή του αποτέλεσαν σημαντικούς παράγοντες για μία παραγωγική και ευχάριστη συνεργασία. Επίσης, είμαστε ευγνώμονες για την πολύτιμη βοήθεια που μας προσέφεραν οι απόφοιτοι ΗΜΜΥ, Ζακλίν Δασύρα και Νικόλαος Τζαμπαλάτης, καθώς και ο υποψήφιος διδάκτορας του τμήματός μας, Παναπακίδης Ιωάννης, κατά την πρώτη μας επαφή με το αντικείμενο της μέλέτης. Ακόμα θα θέλαμε να ευχαριστήσουμε τις οικογένειές μας για την πολύτιμη ηθική αλλά και υλική υποστήριξη καθ όλη τη διάρκεια των σπουδών μας. Παναγιωτακόπουλος Δημήτριος Παρασίδη Αλεξάνδρα

4 Σ ε λ ί δ α 3

5 Σ ε λ ί δ α 4 ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΗ... 6 Κ Ε Φ Α Λ Α Ι Ο ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ-ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΔΙΑ ΕΠΙΛΥΣΗΣ ΠΡΟΒΛΗΜΑΤΩΝ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΩΝ ΣΥΣΤΑΔΟΠΟΙΗΣΗ (CLUSTERING): ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ ΕΙΔΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ (CLUSTERING) ΕΙΔΗ ΣΥΣΤΑΔΩΝ ΑΛΓΟΡΙΘΜΟΙ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΚΡΙΤΗΡΙΑ ΔΗΜΙΟΥΡΓΙΑΣ ΣΥΣΤΑΔΩΝ ΤΥΠΟΙ ΕΓΓΥΤΗΤΑΣ ΚΑΙ ΚΛΙΜΑΚΕΣ ΑΠΑΙΤΗΣΕΙΣ ΣΧΕΤΙΚΑ ΜΕ ΤΑ ΜΕΤΡΑ ΟΜΟΙΟΤΗΤΑΣ ΚΑΙ ΑΝΟΜΟΙΟΤΗΤΑΣ ΚΟΙΝΑ ΜΕΤΡΑ ΕΓΓΥΤΗΤΑΣ ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ (DATA NORMALISATION) ΑΛΓΟΡΙΘΜΟΣ K-MEANS ΚΕΦΑΛΑΙΟ ΜΕΛΕΤΗ ΚΑΙ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΣΗΣ ΦΟΡΤΙΟΥ ΕΙΣΑΓΩΓΗ ΣΤΗ ΜΕΛΕΤΗ ΦΟΡΤΙΩΝ ΚΑΤΑΝΑΛΩΣΗΣ ΜΕΘΟΔΟΙ ΔΗΜΙΟΥΡΓΙΑΣ ΠΡΟΦΙΛ ΦΟΡΤΙΟΥ ΣΚΟΠΟΣ ΤΗΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ 1 ΟΥ ΣΤΑΔΙΟΥ ΠΑΡΟΥΣΙΑΣΗ ΚΑΤΑΝΑΛΩΤΩν ΔΙΑΜΟΡΦΩΣΗ ΧΡΟΝΙΚΩΝ ΚΑΜΠΥΛΩΝ ΠΕΡΙΠΤΩΣΕΙΣ ΠΡΟΦΙΛ ΚΑΤΑΝΑΛΩΣΗΣ ΣΧΕΔΙΑΣΗ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ ΕΚΤΕΛΕΣΗ CLUSTERING ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΣΕ 5 ΚΑΙ 10 CLUSTERS ΠΑΡΟΥΣΙΑΣΗ ΕΝΔΕΙΚΤΙΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΚΕΦΑΛΑΙΟ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕΣΩ ΑΝΤΙΠΡΟΣΩΠΕΥΤΙΚΩΝ ΚΑΜΠΥΛΩΝ ΕΙΣΑΓΩΓΗ ΚΡΙΤΗΡΙΑ ΕΞΑΓΩΓΗΣ ΑΝΤΙΠΡΟΣΩΠΕΥΤΙΚΩΝ ΚΑΜΠΥΛΩΝ ΣΧΕΔΙΑΣΗ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ... 57

6 Σ ε λ ί δ α ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΚΑΙ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΔΕΙΚΤΗ ΑΞΙΟΛΟΓΗΣΗΣ (ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΓΙΣΤΗΣ ΤΙΜΗΣ) ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ 2 ΟΥ ΣΤΑΔΙΟΥ ΜΕ ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΣΗΣ ΤΙΜΗΣ ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ 2 ΟΥ ΣΤΑΔΙΟΥ ΤΩΝ ΜΕΣΩΝ ΗΜΕΡΗΣΙΩΝ ΚΑΜΠΥΛΩΝ ΚΕΦΑΛΑΙΟ ΑΞΙΟΛΟΓΗΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΜΕ ΕΞΩΤΕΡΙΚΑ ΚΡΙΤΗΡΙΑ ΕΙΣΑΓΩΓΗ ΕΥΡΕΣΗ ΚΟΣΤΟΥΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΓΕΙΑΣ ΓΙΑ ΚΑΤΑΝΑΛΩΤΕΣ ΚΕΦΑΛΑΙΟ ΔΙΑΜΟΡΦΩΣΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΚΑΜΠΥΛΩΝ ΦΟΡΤΙΟΥ (ΧΚΦ) ΕΙΣΑΓΩΓΗ ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΣΗΣ ΤΙΜΗΣ ΣΥΝΟΨΗ- ΣΥΜΠΕΡΑΣΜΑΤΑ ΒΙΒΛΙΟΓΡΑΦΙΑ

7 Σ ε λ ί δ α 6 ΕΙΣΑΓΩΓΗ Η παρούσα διπλωματική εργασία έχει ως στόχο αρχικά την εφαρμογή του αντικειμένου της αναγνώρισης προτύπων στη μελέτη των φορτίων κατανάλωσης. Έπειτα, την μελέτη της δυνατότητας αξιοποίησης των αποτελεσμάτων για την κοστολόγηση καταναλωτών και την αξιολόγηση των χρησιμοποιούμενων μεθόδων. Διατίθεται ένα δείγμα ωριαίων φορτίων ενός έτους για 150 διαφορετικούς καταναλωτές. Στο Κεφάλαιο 1 γίνεται μια βιβλιογραφική επισκόπηση σχετικά με την αναγνώριση προτύπων, τους αλγόριθμους συσταδοποίησης (clustering), τα κριτήρια αξιολόγησης κλπ. Στο Κεφάλαιο 2 ξεκινά η διαδικασία συσταδοποίησης των 150 καταναλωτών που πραγματοποιείται σε 2 στάδια: Στο 1 ο στάδιο εξετάζονται οι ημερήσιες καμπύλες φορτίου κάθε καταναλωτή του δείγματος για διάστημα ενός έτους. Μέσω της μη επιβλεπόμενης ταξινόμησης και την εφαρμογή του αλγόριθμου K-means, έγινε ομαδοποίηση (συσταδοποίηση) των ημερήσιων φορτίων για κάθε καταναλωτή, αφού πρώτα υπήρξε προβληματισμός για την εύρεση του βέλτιστου αριθμού ομάδων (συστάδων). Αξιοποιώντας τα αποτελέσματα αυτά και με τη χρήση κατάλληλων κριτηρίων επιλέχθηκε (στο Κεφάλαιο 3) μια αντιπροσωπευτική ημερήσια καμπύλη για κάθε καταναλωτή. Δοκιμάστηκαν διάφορα κριτήρια για την επιλογή αυτής της αντιπροσωπευτικής καμπύλης, που θα έπρεπε εφεξής να περιγράφει τη συμπεριφορά του κάθε ενός. Στο 2 ο στάδιο, έγινε συσταδοποίηση μεταξύ των 150 καταναλωτών, όπου κάθε καταναλωτής συμμετείχε με την αντιπροσωπευτική του καμπύλη. Έτσι αποκτάται μια γενική εικόνα για τις μορφές των καμπυλών φορτίων κατανάλωσης που παρατηρούνται. Ο απώτερος σκοπός είναι οι καταναλωτές να χωριστούν σε ομάδες και για κάθε ομάδα να καθοριστεί ένα σταθερό τιμολόγιο (σε /MWh). Στο Κεφ. 4 προτείνονται κριτήρια για την αξιολόγηση της παραπάνω διαδικασίας, καθώς το επιλεγμένο τιμολόγιο συγκρίνεται με το πραγματικό ενεργειακό κόστος (σε /MWh) του κάθε καταναλωτή λαμβάνοντας υπόψη τις ετήσιες χρονοσειρές φορτίου του καταναλωτή και της οριακής τιμής του συστήματος. Τέλος, στο Κεφ. 5 ακολουθείται μια εναλλακτική διαδικασία κατά την οποία γίνεται συσταδοποίηση καμπυλών από όλους τους καταναλωτές και αποδίδεται ένα τιμολόγιο σε κάθε ομάδα καμπυλών. Στη συνέχεια, κάθε καταναλωτής τιμολογείται διαφορετικά κάθε μέρα, ανάλογα με την καμπύλη φορτίου του. Όλες οι παραπάνω διαδικασίες συγκρίνονται και αξιολογούνται, εξετάζονται δε διάφορες παραλλαγές τους με διαφορετικούς τρόπους κανονικοποίησης, διαφορετικές παραμέτρους κλπ.

8 Σ ε λ ί δ α 7 Κ Ε Φ Α Λ Α Ι Ο 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ 1.1 ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ-ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ Πολύ συχνά, κατά τη διάρκεια της σημερινής καθημερινότητας, καλούμαστε να αντιμετωπίσουμε μεγάλες ποσότητες δεδομένων, τα οποία συλλέγονται και καταγράφονται μέσω διαφόρων ειδών μετρήσεων και παρατηρήσεων. Τα δεδομένα αυτά μας δίνουν πληροφορίες για καταστάσεις, φαινόμενα και αντικείμενα και παρουσιάζονται σε ποικίλες μορφές, όπως αριθμητικά δεδομένα, δεδομένα κειμένου, εκπεμπόμενα σήματα κ.α. Η διαδικασία της συλλογής και της ανάλυσης δεδομένων, είναι απαραίτητη για την κατανόηση και την περιγραφή φαινομένων και καταστάσεων. Μέσω της ανάλυσης και της επεξεργασίας τους, είναι δυνατή η εξαγωγή χρήσιμων συμπερασμάτων και η λήψη αποφάσεων ως προς τη διαχείρισή τους. Ένα από τα πιο σημαντικά και χρήσιμα κομμάτια της ανάλυσης δεδομένων είναι η κατηγοριοποίηση ή η ομαδοποίηση, δηλαδή οι τεχνικές σύμφωνα με τις οποίες τα διάφορα δεδομένα τοποθετούνται σε κατηγορίες ή ομάδες με κοινά χαρακτηριστικά και ιδιότητες. Η ομαδοποίηση, αυτή, οδηγεί σίγουρα σε μείωση της λεπτομέρειας της πληροφορίας αλλά και σε απλοποίηση της για περεταίρω επεξεργασία. Χρήσιμο επιστημονικό πεδίο για την ανάλυση και ταξινόμηση των δεδομένων είναι η Αναγνώριση Προτύπων. Με βάση τη θεωρία της Αναγνώρισης Προτύπων, πραγματοποιείται έρευνα του σχεδιασμού και της λειτουργίας συστημάτων, για αναγνώριση προτύπων σε δεδομένα, με αυτοματοποιημένο τρόπο για λήψη αποφάσεων. Αποτελεί την προσέγγιση που πραγματοποιείται όποτε πρέπει κανείς να λάβει υπόψη το σύνολο των σχέσεων,που ισχύουν για τα μέρη

9 Σ ε λ ί δ α 8 των αντικειμένων που πρόκειται να αναλυθούν. Στόχος της είναι η ταξινόμηση ενός συνόλου δεδομένων σε έναν αριθμό ξεχωριστών ομάδων και κατηγοριών, σύμφωνα με κάποιες ομοιότητες που αυτά παρουσιάζουν. Κατηγορίες ή κλάσεις είναι φυσικές καταστάσεις ή ενιαίες οντότητες αντικειμένων που σχετίζονται με μία έννοια ή ένα πρωτότυπο. Όταν αναφερόμαστε σε πρότυπα, εννοούμε ένα διάνυσμά d-διάστασης, το οποίο περιλαμβάνει χαρακτηριστικά x i του αντικειμένου του ενδιαφέροντός μας. Το διάνυσμα χαρακτηριστικών είναι το: x1 x 2 d x. X,. x d όπου x i είναι το i-οστό χαρακτηριστικό του προτύπου και d η διάσταση του χώρου που δημιουργείται από τα πρότυπα. Χαρακτηριστικά είναι οι μετρήσεις, ιδιότητες ή τα αρχέτυπα που προέρχονται από τα πρότυπα και μπορεί να είναι χρήσιμα για το χαρακτηρισμό τους. Η ταξινόμηση και κατηγοριοποίηση (classification) των δεδομένων και αντικειμένων γίνεται με βάση τα συστήματα αναγνώρισης ή κατηγοριοποίησης. Ως σύστημα αναγνώρισης (ή κατηγοριοποίησης) προτύπων ορίζεται αυτό το οποίο έχει ως είσοδο έναν αριθμό προτύπων και μέσω σειράς συγκεκριμένων διαδικασιών επεξεργασίας, δίνει στην έξοδό του τα ίδια πρότυπα ταξινομημένα όμως σε ορισμένες κατηγορίες. Τα συστήματα αυτά χωρίζονται σε δύο κατηγορίες: Επιβλεπόμενα συστήματα αναγνώρισης (Supervised). Τα συστήματα αυτά ταξινομούν ένα σύνολο από δεδομένα που σχετίζονται με τους τύπους των κλάσεων. Οι τύποι των κλάσεων χρησιμοποιούνται ως υποδείγματα κατά το σχεδιασμό του συστήματος. Την εξαρχής γνώση των τύπων των κλάσεων εκμεταλλεύεται το σύστημα για να υπολογίσει τις συναρτήσεις απόφασης που διαχωρίζουν τα πρότυπα. Μη επιβλεπόμενα συστήματα αναγνώρισης (Unsupervised). Τα συστήματα αυτά προσπαθούν να εντοπίσουν ομάδες στα δεδομένα και χαρακτηριστικά που διαχωρίζουν τη μία ομάδα με την άλλη. Δεν είναι γνωστές οι παράμετροι διαχωρισμού, αλλά αυτές εξάγονται από το σύστημα. Στόχος είναι ο εντοπισμός κρυμμένων δομών (συστάδες) των δεδομένων που εισάγονται. Η ταξινόμηση γίνεται με βάση στατιστικά στοιχεία των μετρήσεων και ο χρήστης έχει μόνο ρυθμιστικό ρόλο. Από τα παραπάνω γίνεται αντιληπτή η σημαντικότητα της χρήσης μη επιβλεπόμενης κατηγοριοποίησης, διότι αυτή εξυπηρετεί σε περιπτώσεις άγνωστων πληροφοριών των υπό εξέταση δεδομένων και μπορεί να χρησιμοποιηθεί ακόμα

10 Σ ε λ ί δ α 9 και εάν δεν έχει συμπεριληφθεί στη διαδικασία υπάρχουσα γνώση και πληροφορία. Από τα παραπάνω μπορούμε να συμπεράνουμε ότι χρειάζονται λιγότερες διαδικασίες εργασίας, κάνοντάς την λιγότερο χρονοβόρα και με μικρότερο κόστος. Το μεγαλύτερο πλεονέκτημά της μεθόδου αυτής είναι η ικανότητα της να εξυπηρετεί περιπτώσεις ταξινόμησης μεγάλου όγκου δεδομένων. 1.2 ΣΤΑΔΙΑ ΕΠΙΛΥΣΗΣ ΠΡΟΒΛΗΜΑΤΩΝ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΤΥΠΩΝ Στόχος της μεθόδου είναι η υλοποίηση των παρακάτω σταδίων επεξεργασίας προτύπων : Διατύπωση του προβλήματος: απόκτηση σαφούς κατανόησης των στόχων της έρευνας και του σχεδιασμού των υπόλοιπων σταδίων. Συλλογή δεδομένων: πραγματοποίηση μετρήσεων και παρατηρήσεων σχετικά με τις απαραίτητες μεταβλητές του προβλήματος και καταγραφή λεπτομερειών σχετικών με τη διαδικασία συλλογής δεδομένων. Αρχική εξέταση δεδομένων: έλεγχος δεδομένων, υπολογισμός στατιστικών στοιχείων και παραγωγή απεικονίσεων, χρήσιμων για την κατανόηση της δομής. Επιλογή ή εξαγωγή χαρακτηριστικών: επιλογή μεταβλητών από τα μετρούμενα μεγέθη, οι οποίες είναι κατάλληλες για τη διεξαγωγή της εργασίας, ή τεχνητή εξαγωγή χαρακτηριστικού από το σύστημα ταξινόμησης. Υλοποίηση ή επιλογή του αλγορίθμου συσταδοποίησης (clustering algorithm design or selection): Αυτό το βήμα συνήθως αποτελείται από την απόφαση ενός κατάλληλου μέτρου ακρίβειας και την κατασκευή μιας συνάρτησης κριτηρίου. Ταξινόμηση χωρίς επίβλεψη, συσταδοποίηση (clustering): διερευνητική ανάλυση δεδομένων και συμβολή στην εξαγωγή επιτυχούς αποτελέσματος εργασίας. Το στάδιο αυτό μπορεί να αποτελέσει και μέσο προεπεξεργασίας δεδομένων για επιβλεπόμενη διαδικασία ταξινόμησης. Διαδικασίες οπισθοδρόμησης (κατά περίπτωση): επανασχεδιασμός του ταξινομητή, με βάση το αποτέλεσμα, χρησιμοποιώντας ένα σύνολο εκπαίδευσης από υποδείγματα προτύπων. Εκτίμηση αποτελεσμάτων και ερμηνεία: Ο τελικός στόχος της συσταδοποίησης είναι να παρέχει στους χρήστες σημαντικές πληροφορίες από τα αρχικά δεδομένα, ώστε να γίνει όσο το δυνατόν ολοκληρωμένη κατανόηση του προς επίλυση προβλήματος.

11 Σ ε λ ί δ α 10 Εικόνα 1.1: Στάδια επίλυσης προβλήματος Αναγνώρισης Προτύπων 1.3 ΣΥΣΤΑΔΟΠΟΙΗΣΗ (CLUSTERING): ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ Όπως προαναφέρθηκε, συσταδοποίηση είναι η μη επιβλεπόμενη ταξινόμηση και τοποθέτηση δεδομένων σε ομάδες (clusters). Η διαδικασία αυτή γίνεται με βάση ένα χαρακτηριστικό-οδηγό, χαρακτηριστικό ομοιότητας μεταξύ των διαφόρων αντικειμένων. Οι δημιουργούμενες ομάδες παρουσιάζουν μεταξύ τους μία σχετική ομοιογένεια και τα δεδομένα που ανήκουν σε κάθε μία από αυτές παρουσιάζουν μεγαλύτερη ομοιότητα μεταξύ τους, παρά με αυτά που ανήκουν σε κάποια άλλη ομάδα. Μία αποτελεσματική συσταδοποίηση έχει ως βασικούς στόχους: Την ελαχιστοποίηση του σφάλματος που παρουσιάζεται και, Τον περιορισμό, όσο αυτό είναι δυνατόν, του συνολικού αριθμού των διαφορετικών ομάδων που θα εξαχθούν,κατά την ολοκλήρωση της διαδικασίας. Όπως γίνεται αντιληπτό, τα δύο παραπάνω κριτήρια αποτελεσματικότητας είναι αντικρουόμενα, για το λόγο, ότι η δημιουργία όλο και λιγότερων ομάδων αυξάνει την εισαγωγή σφάλματος και σημαντικό αντικείμενο έρευνας πρέπει να αποτελέσει ο σωστός συνδυασμός αυτών των δύο. Το αν μία διαδικασία συσταδοποίησης είναι επιτυχής ή όχι δεν μπορεί να αποφανθεί μετά την ολοκλήρωση της και αυτό γιατί δεν μπορεί να οριστεί ένα απόλυτα «καλό κριτήριο», το οποίο θα ήταν ανεξάρτητο από τον τελικό στόχο του Clustering. Ένα διαφορετικό κριτήριο, μία διαφορετική μέθοδος υλοποίησης ή ακόμα και μία διαφορετική επιλογή παραμέτρων, ορισμένων αναλόγως με το επιθυμητό αποτέλεσμα, μπορεί να οδηγήσει σε ανόμοια κάθε φορά αποτελέσματα συσταδοποίησης. Για παράδειγμα αντικείμενο ενδιαφέροντος μπορεί να οριστεί ο εντοπισμός αντιπροσωπευτικών ομάδων, φυσικών συστάδων, που να

12 Σ ε λ ί δ α 11 περιγράφουν άγνωστα για το αντικείμενο χαρακτηριστικά, ή ο εντοπισμός ασυνήθιστων και περίεργων αντικειμένων που ανήκουν στα δεδομένα ΕΙΔΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ (CLUSTERING) Σε αυτή την υποενότητα θα διαχωρίσουμε τα είδη συσταδοποίησης, με βάση τις διαφορετικές λειτουργίες και τα διαφορετικά χαρακτηριστικά τους. Αποκλειστικό clustering: σε αυτή την κατηγορία μεθόδων το κάθε αντικείμενο αντιστοιχίζεται αποκλειστικά σε μία μόνο ομάδα. Μη αποκλειστικό ή επικαλυπτόμενο clustering: υπάρχουν περιπτώσεις όπου ένα σημείο μπορεί να είναι τοποθετημένο σε παραπάνω από ένα cluster ταυτοχρόνως. Για καλύτερη κατανόηση της μη αποκλειστικής συσταδοποίησης, κατά την ομαδοποίηση τμημάτων ξένων γλωσσών, ένας μαθητής μπορεί να ανήκει στο τμήμα Αγγλικών αλλά και στο τμήμα Γαλλικών. Διαιρετικό Clustering: είναι μία μέθοδος συσταδοποίησης, κατά την οποία η ομαδοποίηση των αντικειμένων δεδομένων γίνεται σε μη αλληλεπικαλυπτόμενες συστάδες (clusters), έτσι ώστε κάθε πρότυπο να ανήκει σε μία και μόνο συστάδα και οι συστάδες δημιουργούνται σε ένα βήμα μόνο. Ιεραρχικό Clustering : σε αυτή την περίπτωση μεθόδου συσταδοποίησης, κάθε ομάδα (συστάδα) μπορεί να αναλυθεί σε υποομάδες. Η γενική μορφή της ιεραρχικού Clustering είναι δενδροειδής και αποτελείται από ομάδες εμφωλευμένες. Σε κάθε κόμβο του δέντρου ενώνονται όλες οι υποομάδες και η ρίζα του δέντρου αποτελεί το σύνολο των αντικειμένων. Συχνά, αλλά όχι πάντα, τα φύλλα του δέντρου αποτελούν ομάδες που δεν μπορούν να αναλυθούν άλλο και περιγράφουν μεμονωμένα χαρακτηριστικά ενός αντικειμένου δεδομένων. Θα μπορούσαμε να χαρακτηρίσουμε την ιεραρχική, σαν μία ακολουθία από διαιρετικές συσταδοποιήσεις. Ασαφές clustering: σε αυτό το είδος ομαδοποίησης, κάθε αντικείμενο ανήκει σε κάθε συστάδα με βάρος που είναι μεταξύ 0 (δεν ανήκει) και 1 (ανήκει απόλυτα). Το άθροισμα των βαρών για κάθε αντικείμενο πρέπει να ισούται με 1. Η προσέγγιση αυτή είναι κατάλληλη για περιπτώσεις όπου η αντιστοίχιση του αντικειμένου σε μία μόνο συστάδα είναι αυθαίρετη, καθώς αυτό μπορεί να βρίσκεται κοντά σε περισσότερες από μία. Μία ασαφής συσταδοποίηση μπορεί να μετατραπεί σε αποκλειστική, όταν το αντικείμενο αντιστοιχισθεί στη συστάδα εκείνη που φέρει το υψηλότερο βάρος για το αντικείμενο. Πλήρες clustering: κατά τη συσταδοποίηση αυτή, κάθε αντικείμενο του συνόλου δεδομένων αντιστοιχίζεται σε μία συστάδα, ανεξαρτήτως αν αυτή περιγράφει χαρακτηριστικά του ενδιαφέροντός μας, ή χαρακτηριστικά που

13 Σ ε λ ί δ α 12 επηρεάζουν σημαντικά τα συμπεράσματα της διαδικασίας και οδηγούν σε μη αντιπροσωπευτικά αποτελέσματα. Μερικό Clustering: σε αυτή την περίπτωση, στις συστάδες δεν περιλαμβάνονται όλα τα αντικείμενα δεδομένων. Το κίνητρο για την υλοποίηση τέτοιας μορφής ομαδοποίησης είναι ότι υπάρχουν μερικά αντικείμενα στο σύνολο δεδομένων, τα οποία δεν μπορούν να ανήκουν σε σαφώς καθορισμένες ομάδες. Πολλές φορές τα αντικείμενα αυτά, αντιπροσωπεύουν θόρυβο, ακραίες ή μη ενδιαφέρουσες τιμές. Σειριακό clustering : χειρισμός ενός στοιχείου μόνο τη φορά. Ταυτόχρονο clustering: χειρισμός όλων των στοιχείων την ίδια στιγμή ΕΙΔΗ ΣΥΣΤΑΔΩΝ Ο στόχος της δημιουργίας συστάδων, όπως έχει προαναφερθεί, είναι η εύρεση χρήσιμων ομάδων δεδομένων και η χρησιμότητά τους καθορίζεται από τους στόχους της επιθυμητής ανάλυσης. Με τη δημιουργία τους πραγματοποιείται απεικόνιση των αποτελεσμάτων και καλύτερη κατανόηση των παραμέτρων του προβλήματος. Τα διαφορετικά είδη συστάδων παρουσιάζονται παρακάτω: Καλά διαχωρισμένες (well separated): Κάποιες φορές χρησιμοποιείται ένα όριο για να διευκρινίσει εάν τα αντικείμενα που ανήκουν σε μία συστάδα είναι αρκετά κοντά (ή αρκετά όμοια). Για να συμβαίνει κάτι τέτοιο θα πρέπει τα δεδομένα να περιέχουν φυσικές συστάδες, οι οποίες να βρίσκονται, με βάση το καθορισμένο όριο, αρκετά μακριά η μία από την άλλη. Οι αποστάσεις μεταξύ δύο σημείων, το κάθε ένα από τα οποία βρίσκεται σε διαφορετική συστάδα, θα είναι μεγαλύτερη από όλες τις αποστάσεις μεταξύ σημείων που θα κατηγοριοποιηθούν στην ίδια. Εικόνα 1.2: Παράδειγμα απεικόνισης καλά διαχωρισμένων συστάδων.

14 Σ ε λ ί δ α 13 Βασισμένες σε πρωτότυπο (prototype-based): Όταν τα δεδομένα είναι συνεχή, το πρωτότυπο μίας συστάδας είναι ένα κέντρο βάρους, δηλαδή ένας μέσος όρος όλων των σημείων που περιέχονται σε μία συστάδα. Όταν τα δεδομένα είναι ασυνεχή το πρωτότυπο ορίζεται ως το πιο αντιπροσωπευτικό σημείο ενός cluster. Το κάθε αντικείμενο μίας συστάδας παρουσιάζει πιο εμφανείς ομοιότητες με το πρωτότυπο της συστάδας στην οποία περιέχεται, παρά στο πρωτότυπο οποιασδήποτε άλλης συστάδας. Εικόνα 1.3: Παράδειγμα απεικόνισης συστάδων βασισμένων σε πρωτότυπο (ασυνεχή δεδομένα). Βασισμένες σε γράφημα (graph-based): Τα δεδομένα αντιπροσωπεύονται ως οι κόμβοι ενός γραφήματος και οι ενώσεις μεταξύ τους αντιπροσωπεύουν τις συνδέσεις μεταξύ των αντικειμένων. Εικόνα 1.4: Παράδειγμα απεικόνισης συστάδων βασισμένων σε γράφημα.

15 Σ ε λ ί δ α 14 Βασισμένες στην πυκνότητα (density-based): Οι συστάδες είναι οι πιο πυκνές περιοχές που εμφανίζονται στο σύνολο των δεδομένων και περιβάλλονται από μία περιοχή δεδομένων χαμηλής πυκνότητας, η οποία είναι σημαντική γιατί διαχωρίζει έντονα τις «χρήσιμες» συστάδες που δημιουργούνται. Τα αντικείμενα στην αραιή περιοχή είναι συνήθως θόρυβος ή ακραίες τιμές. Εικόνα 1.5: Παράδειγμα απεικόνισης συστάδων βασισμένων στην πυκνότητα. Κοινής ιδιοκτησίας (shared property): Οι συστάδες που εντοπίζονται μοιράζονται κάποιες κοινές ιδιότητες ή αντιπροσωπεύουν μία συγκεκριμένη έννοια ΑΛΓΟΡΙΘΜΟΙ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ Οι αλγόριθμοι συσταδοποίησης, μπορούν να θεωρηθούν ως το μέσο υλοποίησης της μη επιβλεπόμενης ταξινόμησης και κατηγοριοποίησης, παρέχοντας στο χρήστη ένα λογικό και αξιοποιήσιμο clustering, το οποίο προέρχεται από την εξέταση και την επεξεργασία του συνόλου των προτύπων. Τα αποτελέσματα που θα εξαχθούν από την διαδικασία, εξαρτώνται άμεσα από το είδος του αλγόριθμου που θα χρησιμοποιηθεί, όπως επίσης και από τα κριτήρια που θα οριστούν. Έτσι, η χρήση ενός αλγόριθμου συσταδοποίησης έχει ως σκοπό, τον προσδιορισμό των ομάδων που υπάρχουν μεταξύ ενός συνόλου δεδομένων και αποτελούν απαραίτητο εργαλείο για την διεξαγωγή ενός αξιόπιστου clustering. Τα είδη των αλγορίθμων μπορούν να διαχωριστούν στις παρακάτω κατηγορίες:

16 Σ ε λ ί δ α 15 Σειριακοί αλγόριθμοι (sequential algorithms). Πρόκειται για αρκετά απλές και γρήγορες μεθόδους. Το τελικό αποτέλεσμα έχει άμεση σχέση με τη σειρά που εμφανίστηκαν τα πρότυπα. Οι αλγόριθμοι αυτοί, δίνουν συνήθως αποτελέσματα συμπαγών ομάδων, οι οποίες είναι σφαιρικές ή ελλειπτικές, ανάλογα με το κριτήριο απόστασης που χρησιμοποιείται. Ιεραρχικοί αλγόριθμοι (hierarchical algorithms). Αυτοί μπορούν να διαιρεθούν περεταίρω σε: o Ιεραρχικοί αλγόριθμοι συγχώνευσης (hierarchical agglomerative algorithms) : Πραγματοποιούν μία σειρά από κατηγοριοποιήσεις με τον αριθμό των ομάδων να μειώνεται. Σε κάθε βήμα παρουσιάζεται μία ομαδοποίηση που προκύπτει από την ομαδοποίηση του προηγούμενου βήματος και τη συγχώνευση δύο ομάδων. Αυτή η κατηγορία ιεραρχικών αλγορίθμων αντιπροσωπεύεται από τους απλούς αλγόριθμους (single algorithms) και τους αλγόριθμους ολοκληρωμένης σύνδεσης (complete link algorithms). Οι αλγόριθμοι ολοκληρωμένης σύνδεσης μπορούν να διαχωριστούν σε αυτούς που βασίζονται στη θεωρία πινάκων και σε αυτούς που βασίζονται στη θεωρία γραφημάτων. Αυτό το είδος αλγορίθμων χρησιμοποιείται κυρίως σε περιπτώσεις επεκτεινόμενων και συμπαγών ομάδων. o Ιεραρχικοί διαιρούμενοι αλγόριθμοι (hierarchical divisive algorithms): Πραγματοποιούν μία σειρά από κατηγοριοποιήσεις και ο αριθμός των ομάδων αυξάνει, σε αντίθεση με τους αλγορίθμους συγχώνευσης. Η κατηγοριοποίηση κάθε βήματος, προκύπτει από το προηγούμενο και από τη διαίρεση μίας ομάδας σε δύο καινούργιες. Εικόνα 1.6: Στάδια ιεραρχικών αλγορίθμων συγχώνευσης και ιεραρχικών διαιρούμενων αλγορίθμων. Αλγόριθμοι βασισμένοι στη βελτιστοποίηση συνάρτησης κόστους (algorithms based on cost function optimization): Γίνεται χρήση μίας συνάρτησης κόστους J, βάσει της οποίας αξιολογείται το ποσό της «λογικής»

17 Σ ε λ ί δ α 16 της κάθε ομαδοποίησης, διατηρώντας τον αριθμό των ομάδων σταθερό, αλλά αλλάζοντας τη σύνθεσή τους. Αυτοί οι αλγόριθμοι χρησιμοποιούν έννοιες διαφορικού λογισμού και έχουν ως στόχο τη βελτιστοποίηση του κόστους J. Η διαδικασία θεωρείται επιτυχής, όταν η συνάρτηση του κόστους έχει πλησιάσει ένα τοπικό ακρότατο- βέλτιστο. Ονομάζονται επίσης αλγόριθμοι βελτιστοποίησης της επαναληπτικής συνάρτησης (iterative function optimization schemes). Στην κατηγορία αυτή ανήκουν οι εξής υποκατηγορίες: o Αλγόριθμοι σκληρής ομαδοποίησης (hard or crisp clustering algorithms), όπου το κάθε πρότυπο ανήκει αυστηρά και μόνο σε μία συγκεκριμένη ομάδα. o Αλγόριθμοι πιθανοτικής ομαδοποίησης (probabilistic clustering algorithms), οι οποίοι ακολουθούν την κατανομή Bayes και το κάθε πρότυπο x καταχωρείται στην ομάδα C i για την οποία η τιμή πιθανότητας p(c i x) μεγιστοποιείται. Αυτές οι πιθανότητες υπολογίζονται με χρήση μίας κατάλληλα ορισμένης διαδικασίας βελτιστοποίησης. o Αλγόριθμοι ασαφούς ομαδοποίησης (fuzzy clustering algorithms), όπου το πρότυπο ανήκει ξεχωριστά στην κάθε ομάδα με κάποιο βαθμό συμμετοχής. o Αλγόριθμοι ενδεχόμενης ομαδοποίησης (possibilistic clustering algorithms): μετράται το ενδεχόμενο ένα πρότυπο να ανήκει στην ομάδα C i. o Αλγόριθμοι ανίχνευσης συνόρων (boundary detection algorithms): Οι αλγόριθμοι αυτοί αναζητούν τρόπους βέλτιστης οριοθέτησης των συνόρων μεταξύ των ομάδων. Έχουν αντίθετη λειτουργία από τις προηγούμενες υποκατηγορίες αλγορίθμων, διότι δεν προσδιορίζουν τις ομάδες με βάση τα χαρακτηριστικά των προτύπων, αλλά προσαρμόζουν επανειλημμένως τα σύνορα των περιοχών που καταλαμβάνει η κάθε ομάδα. Αλγόριθμοι ομαδοποίησης κλάδων και ορίων (branch and bound clustering algorithms): Οι αλγόριθμοι αυτοί μας δίνουν τη βέλτιστη κατηγοριοποίηση για σταθερό αριθμό ομάδων και με τη χρήση ενός προκαθορισμένου κριτηρίου. Δεν εξετάζουν όλες τις διαφορετικές περιπτώσεις ομαδοποίησης. Γενετικοί αλγόριθμοι (genetic algorithms): Σύμφωνα με αυστηρά ορισμένα κριτήρια, οι αλγόριθμοι αυτοί χρησιμοποιούν έναν αρχικό αριθμό ομαδοποιήσεων τις οποίες και διασταυρώνουν μεταξύ τους, με σκοπό τη δημιουργία νέου πλήθους ομάδων και βελτιστοποίηση της κατηγοριοποίησης. Μέθοδοι στοχαστικής χαλάρωσης (stochastic relaxation methods): Σύμφωνα με κάποιο αυστηρά ορισμένο κριτήριο, εγγυώνται σύγκλιση στην πιθανότητα υλοποίησης μίας συνολικά βέλτιστης ομαδοποίησης. Αλγόριθμοι ανταγωνιστικής μάθησης (competitive learning algorithms): Οι αλγόριθμοι αυτοί δημιουργούν διαφορετικές ομαδοποιήσεις, έως ότου τελικά συγκλίνουν στην πιο λογική, σύμφωνα με ένα κριτήριο απόστασης.

18 Σ ε λ ί δ α 17 Αντιπροσωπευτικοί αλγόριθμοι αυτής της κατηγορίας είναι ο βασικός αλγόριθμος ανταγωνιστικής μάθησης (basic competitive learning scheme) και ο αλγόριθμος διαρρέουσας μάθησης (leaky learning algorithm). Αλγόριθμοι βασισμένοι σε τεχνικές μορφολογικών μετασχηματισμών (algorithms based on morphological transformation techniques): Χρησιμοποιούν μορφολογικούς μετασχηματισμούς για τον καλύτερο δυνατό διαχωρισμό των ομάδων. Ανεξαρτήτως της κατηγορίας, ο εκάστοτε χρησιμοποιούμενος αλγόριθμος θα πρέπει να πληρεί κάποιες απαιτήσεις,έτσι ώστε να είναι βέλτιστος ως προς την αποτελεσματικότητα, όπως: Επεκτασιμότητα. Ικανότητα διαχείρισης διαφορετικών ειδών χαρακτηριστικών. Ικανότητα εύρεσης συστάδων (clusters) με αυθαίρετο σχήμα. Ελάχιστες απαιτήσεις γνώσης, για τον προσδιορισμό των εισαγόμενων παραμέτρων. Ικανότητα αντιμετώπισης θορύβου και ακραίων τιμών δεδομένων. Αναισθησία στην σειρά εισαγωγής των αρχείων. Υψηλή διαστατικότητα, δηλαδή καλύτερη ανάλυση δεδομένων πολλών μεταβλητών καθώς αυξάνουν οι διαστάσεις τους. Επεξηγηματικότητα και ευχρηστία. 1.4 ΚΡΙΤΗΡΙΑ ΔΗΜΙΟΥΡΓΙΑΣ ΣΥΣΤΑΔΩΝ Η δημιουργία των συστάδων συνδέεται άμεσα με τον καθορισμό μέτρων και δεικτών ομοιότητας-ανομοιότητας και αποστάσεων. Τα μέτρα ομοιότητας και οι δείκτες ομοιότητας χρησιμοποιούνται για να περιγράψουν ποσοτικά το κατά πόσο όμοια είναι δύο σημειακά δεδομένα ως εξής: όσο πιο μεγάλος είναι ο δείκτης ομοιότητας, τόσο πιο όμοια είναι τα δύο σημειακά δεδομένα μεταξύ τους. Το μέτρο ανομοιότητας και η απόσταση λειτουργούν αντίστροφα: όσο πιο μεγάλο είναι το μέτρο ανομοιότητας ή η απόσταση, τόσο περισσότερα ανόμοια είναι τα δύο σημειακά δεδομένα ή συστάδες. Κάθε αλγόριθμος συσταδοποίησης στηρίζεται στο δείκτη ομοιότητας ή ανομοιότητας μεταξύ των δεδομένων. Αν δεν υπάρχει κανένα μέτρο ομοιότητας ή ανομοιότητας μεταξύ ζευγών δεδομένων, τότε δεν είναι δυνατή μία αξιόλογη ανάλυση σε συστάδες.

19 Σ ε λ ί δ α ΤΥΠΟΙ ΕΓΓΥΤΗΤΑΣ ΚΑΙ ΚΛΙΜΑΚΕΣ Οι ομοιότητες ή ανομοιότητες των χαρακτηριστικών των αντικειμένων μπορούν να αναφέρονται σε διαφορετικό τύπο δεδομένων και μπορούν να μετρηθούν σε διαφορετικές κλίμακες. Τα διάφορα χαρακτηριστικά μπορούν να χωριστούν σε: Δυαδικά (μόνο δύο τιμές) Διακριτά (πεπερασμένος αριθμός τιμών) Συνεχή (άπειρος αριθμός τιμών) Οι διάφορες κλίμακες μπορούν να χωριστούν σε: Ποιοτικές o Ονομαστικές οι τιμές είναι διαφορετικές ονομασίες. Ως παράδειγμα μπορούμε να αναφέρουμε τους κωδικούς διαφορετικών περιοχών, τις ονομασίες διαφορετικών χρωμάτων, τις αναπαραστάσεις της κατάφασης και της άρνησης με 0 και 1. o Ταξικές οι τιμές αντανακλούν μία σειρά ταξινόμησης και τίποτα παραπάνω. Ως παραδείγματα μπορούμε να αναφέρουμε την ταξινόμηση χρωμάτων με βάση το φάσμα τους ή την ταξινόμηση με βάση κάποια αξιολόγηση (καλός, καλύτερος, άριστος). Ποσοτικές o Διάστημα οι διαφορές ανάμεσα στις τιμές του διαστήματος αντιπροσωπεύουν κάποια αξία. Ως παράδειγμα μπορούμε να αναφέρουμε την αξιολόγηση κάποιου αντικειμένου με κλίμακα από το 1 έως το 10. o Αναλογία η κλίμακα έχει απόλυτο μηδέν, έτσι ώστε οι αναλογίες να αποκτήσουν νόημα. Ως παράδειγμα μπορούμε να αναφέρουμε το ύψος ενός αντικειμένου, το πλάτος, το κέρδος το ηλεκτρικό ρεύμα κ.α ΑΠΑΙΤΗΣΕΙΣ ΣΧΕΤΙΚΑ ΜΕ ΤΑ ΜΕΤΡΑ ΟΜΟΙΟΤΗΤΑΣ ΚΑΙ ΑΝΟΜΟΙΟΤΗΤΑΣ Τα μέτρα εγγύτητας πρέπει να πληρούν κάποιες απαιτήσεις, οι οποίες παρουσιάζονται παρακάτω. Αναφέρουμε ότι p ij είναι η εγγύτητα μεταξύ των σημείων x i και x j. 1. Για ανομοιότητα μεταξύ των σημείων ισχύει: p ii =0 για κάθε i. Το κάθε σημείο με τον εαυτό του δεν παρουσιάζει ανομοιότητα.

20 Σ ε λ ί δ α Για ομοιότητα μεταξύ των σημείων ισχύει: p ii p ijmax για κάθε i. το κάθε σημείο παρουσιάζει μεγαλύτερη ομοιότητα με τον εαυτό του, σε σχέση με την ομοιότητα που παρουσιάζει με τα υπόλοιπα σημεία. 3. p ij = p ji. Αυτό μας οδηγεί στο συμπέρασμα ότι το μέτρο εγγύτητας είναι συμμετρικό. 4. p ij 0 για κάθε i και j (θετικότητα). Εάν το μέτρο εγγύτητας είναι μία πραγματική συνάρτηση, τότε εκτός από τη συνθήκη 3 και 4 ισχύουν ακόμα: 5. p ij 0 μόνο εάν i=j. 6. p p ij p ik jk για κάθε i,j,k (τριγωνική ανισότητα). Οι ανομοιότητες που πληρούν τις σχέσεις 1-6 ονομάζονται αποστάσεις. Ο όρος «ανομοιότητα» διατηρείται μόνο στις περιπτώσεις κατά τις οποίες πληρούνται αποκλειστικά και μόνο οι σχέσεις ΚΟΙΝΑ ΜΕΤΡΑ ΕΓΓΥΤΗΤΑΣ ΜΕΤΡΑ ΑΠΟΣΤΑΣΕΩΝ Το πιο συχνά χρησιμοποιούμενο μέτρο εγγύτητας, τουλάχιστον για ποσοτικές κλίμακες αναλογίας (κλίμακες με απόλυτο μηδέν), είναι το μέτρο Minkowski, το οποίο αποτελεί μία γενίκευση της κανονικής απόστασης μεταξύ σημείων σε Ευκλείδειο χώρο. Ορίζεται ως 1 d r r p ij x x k 1 ik jk Όπου -r είναι μία παράμετρος, -d είναι η διάσταση του αντικειμένου δεδομένων, είναι η k- οστή συνιστώσα του i-οστού και j-οστού - x ik και x jk αντικειμένου x. i Παρακάτω παρουσιάζεται μία λίστα με αποστάσεις Minkowski για συγκεκριμένες τιμές της παραμέτρου r. r=1. Ένα κοινό παράδειγμα είναι η απόσταση Hamming, η οποία είναι απλά ο αριθμός των bits που είναι διαφορετικά μεταξύ δύο δυαδικών διανυσμάτων.

21 Σ ε λ ί δ α 20 r=2. Ευκλείδεια απόσταση. Αποτελεί το πιο κοινό μέτρο απόστασης μεταξύ δύο σημείων. r->. Αυτή είναι η μέγιστη διαφορά μεταξύ οποιουδήποτε στοιχείου διανυσμάτων ΜΕΤΡΑ ΔΙΑΤΑΞΗΣ Ένα άλλο μέτρο εγγύτητας προέρχεται από την κατάταξη των αποστάσεων μεταξύ ζευγών σημείων από το 1 έως το m*(m-1)/2. Αυτό το είδος μέτρου μπορεί να χρησιμοποιηθεί για τους περισσότερους τύπους δεδομένων και χρησιμοποιείται συχνά σε κάποιους αλγόριθμους ιεραρχικής συσταδοποίησης ΜΕΤΡΑ ΟΜΟΙΟΤΗΤΑΣ ΜΕΤΑΞΥ ΔΥΑΔΙΚΩΝ ΔIΑΝYΣΜΑΤΩΝ Υπάρχουν πολλά μέτρα ομοιότητας μεταξύ των δυαδικών διανυσμάτων. Αυτά τα μέτρα αναφέρονται ως συντελεστές ομοιότητας και έχουν τιμές στο διάστημα [0,1]. Η τιμή 1 δείχνει ότι δύο διανύσματα είναι εντελώς ίδια, ενώ η τιμή 0 δείχνει ότι δύο διανύσματα είναι εντελώς ανόμοια. Η σύγκριση μεταξύ δύο δυαδικών διανυσμάτων, p και q, μας οδηγεί σε 4 διαφορετικές ποσότητες: M = ο αριθμός των θέσεων όπου το p ήταν 0 και το q ήταν M = ο αριθμός των θέσεων όπου το p ήταν 1 και το q ήταν M = ο αριθμός των θέσεων όπου το p ήταν 0 και το q ήταν M = 0 αριθμός των θέσεων όπου το p ήταν 1 και το q ήταν Αναφορικά, ο πιο απλός συντελεστής ομοιότητας είναι ο συντελεστής απλής αντιστοιχίας: SMC ( M M ) / ( M M M M ) Ένας ακόμα συντελεστής ομοιότητας που χρησιμοποιείται είναι ο συντελεστής Jaccard. J ( M ) / ( M M M ) Ο πρώτος συντελεστής δίνει βαρύτητα και στις δύο τιμές, 0 και 1, των θέσεων των διανυσμάτων, σε αντίθεση με τον δεύτερο συντελεστή ο οποίος θεωρεί ως σημαντικές θέσεις, αυτές με την τιμή 1. Για το λόγο αυτό πρέπει να γίνει σωστή χρήση των μέτρων, επιλέγοντας, με βάση το πρόβλημα, το καταλληλότερο.

22 Σ ε λ ί δ α ΜΕΤΡΟ ΣΥΝΗΜΙΤΟΝΟΥ (COSINE) Το μέτρο συνημίτονου είναι ένα μέτρο ομοιότητας (το οποίο μπορεί να μετατραπεί σε μέτρο απόστασης και να χρησιμοποιηθεί σε ταξινομητές βασισμένους στην εύρεση αποστάσεων) και χρησιμοποιείται για την ανίχνευση ομοιότητας μεταξύ διανυσμάτων. όπου, cos ab a b a,b είναι τα υπό σύγκριση διανύσματα και a, b είναι τα μέτρα των διανυσμάτων. Τα προκύπτοντα επίπεδα ομοιότητας, κυμαίνονται μεταξύ -1 (τα δύο διανύσματα είναι ακριβώς αντίθετα) και 1 (τα δύο διανύσματα είναι ακριβώς όμοια). Η τιμή 0 συνήθως υποδεικνύει την ανεξαρτησία, και οι ενδιάμεσες τιμές το κατά πόσο όμοια ή ανόμοια είναι τα δύο διανύσματα. Το μέτρο συνημίτονου χρησιμοποιείται επίσης για σκοπούς ανάκτησης πληροφοριών, όπως για παράδειγμα στις μηχανές αναζήτησης. Τα έγγραφα συχνά είναι αποθηκευμένα σαν διανύσματα, κάθε χαρακτηριστικό των οποίων αντιπροσωπεύει τη συχνότητα με την οποία ένας όρος εμφανίζεται στο έγγραφο. Τέτοια διανύσματα μπορούν να έχουν έναν τεράστιο αριθμό χαρακτηριστικών. Η ομοιότητα συνημίτονου για τα έγγραφα κυμαίνεται μεταξύ 0 και ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ (DATA NORMALISATION) Λόγω του ότι τα διαφορετικά χαρακτηριστικά ενός αντικειμένου μπορεί να έχουν μετρηθεί με διαφορετικές κλίμακες μέτρησης, παρουσιάζεται η ανάγκη μετασχηματισμού τους. Σε περιπτώσεις, όπου το εύρος των τιμών διαφέρει από χαρακτηριστικό σε χαρακτηριστικό, αυτές οι διαφορές μεταξύ των κλιμάκων μέτρησης, μπορούν να επηρεάσουν τη διαδικασία της συσταδοποίησης και γι αυτό είναι πολλές φορές απαραίτητη η κανονικοποίηση των χαρακτηριστικών σε κοινή κλίμακα, έτσι ώστε να επιτευχθεί έγκυρη διεξαγωγή αποτελεσμάτων. Οι παρακάτω είναι κάποιες συχνά χρησιμοποιούμενες προσεγγίσεις για την κανονικοποίηση των χαρακτηριστικών, όπου x i είναι το i ό αντικείμενο, x ij είναι η τιμή του j ύ χαρακτηριστικού του i ύ αντικειμένου και τέλος x ij είναι η κανονικοποιημένη τιμή του χαρακτηριστικού. x ij x ij. Διαιρούμε το κάθε χαρακτηριστικό ενός αντικειμένου με τη max i x ij μέγιστη παρατηρούμενη απόλυτη τιμή του χαρακτηριστικού αυτού. Με την εφαρμογή αυτής της κανονικοποίησης, όλες οι τιμές των χαρακτηριστικών θα κυμαίνονται μεταξύ -1 και 1.

23 Σ ε λ ί δ α 22 x ij j x ij. Για κάθε τιμή ενός χαρακτηριστικού, αφαιρούμε τη μέση j τιμή j του εν λόγω χαρακτηριστικού, στη συνέχεια διαιρούμε με την 1 τυπική απόκλιση του j. ( m j x m i 1 ij είναι η μέση τιμή του j ύ 1 m χαρακτηριστικού, 2 j x m i 1 ij j είναι η τυπική απόκλιση του j ύ χαρακτηριστικού). x ij j x ij. Για κάθε τιμή ενός χαρακτηριστικού, αφαιρούμε τη μέση A j τιμή j του εν λόγω χαρακτηριστικού, στη συνέχεια διαιρούμε με την A απόλυτη απόκλιση του j. Οι περισσότερες τιμές της κανονικοποιημένης 1 m τιμής x ij κυμαίνονται μεταξύ -1 και 1. ( A j x m i 1 ij j είναι η απόλυτη τυπική απόκλιση του j ύ χαρακτηριστικού.). x ij x ij. Διαιρούμε κάθε τιμή ενός χαρακτηριστικού με τη διπλάσια 2 j μέση τιμή του χαρακτηριστικού αυτού. Έτσι οι τιμές βρίσκονται γύρω από το -0.5 και 0.5. Η πρώτη προσέγγιση μπορεί να μην παράγει αξιοποιήσιμα αποτελέσματα, εάν τα χαρακτηριστικά είναι ομοιόμορφα κατανεμημένα, ενώ η πρώτη και η δεύτερη προσέγγιση είναι ευαίσθητες σε ακραίες τιμές. Η τρίτη προσέγγιση είναι η κατάλληλη για την απομόνωση των ακραίων τιμών, αν και μερικές φορές αυτό γίνεται πριν την διαδικασία ανάλυσης και συσταδοποίησης. 1.6 ΑΛΓΟΡΙΘΜΟΣ K-MEANS Ο αλγόριθμος k-means είναι ένας από τους πιο απλούς και δημοφιλείς αλγορίθμους ομαδοποίησης που ανήκουν στην ευρύτερη κατηγορία των τεχνικών μάθησης χωρίς επίβλεψη. Χρησιμοποιείται για την υλοποίηση αποκλειστικήςδιαιρετικής συσταδοποίησης και ανήκει στην κατηγορία των αλγορίθμων βελτιστοποίησης συνάρτησης κόστους και σκληρής ομαδοποίησης. Ο αλγόριθμος αυτός χαρακτηρίζεται από την απλότητα της υλοποίησης του, καθώς η χρονική πολυπλοκότητα του αλγόριθμου είναι ανάλογη του Ν k q, όπου q ο αριθμός των επαναλήψεων που πρέπει να τρέξει ο αλγόριθμος για να τερματίσει. Η διαδικασία της ομαδοποίησης ενός συνόλου δεδομένων Ν με βάση τον k-means είναι εύκολη, αρκεί να είναι εκ των προτέρων καθορισμένος ο αριθμός (k) των clusters (συστάδων) που θα προκύψουν.

24 Σ ε λ ί δ α 23 Η κύρια ιδέα είναι να προσδιοριστούν αρχικά k centroids (κεντροειδή), ένα για κάθε cluster. Αυτά τα αρχικά centroids πρέπει να επιλεγούν με επιδέξιο τρόπο, γιατί διαφορετικές αρχικές θέσεις για τα centroids δίνουν διαφορετικά αποτελέσματα. Δηλαδή, η αρχική θέση των centroids επηρεάζει το αποτέλεσμα που θα δώσει ο αλγόριθμος. Έτσι, συχνά θεωρείται καλύτερη η επιλογή εκείνων των centroids ώστε να απέχουν μεταξύ τους όσο περισσότερο γίνεται. Το επόμενο βήμα είναι επιλογή κάθε στοιχείου από το σύνολο δεδομένων και συσχέτιση του με το κοντινότερο σε αυτό centroid. Όταν αυτό γίνει για όλα τα στοιχεία του συνόλου δεδομένων, το πρώτο βήμα έχει ολοκληρωθεί και μία πρώτη και «πρόχειρη» ομαδοποίηση έχει ήδη προκύψει. Στη συνέχεια, απαιτείται να υπολογιστούν ξανά k νέα centroids, τα οποία θα αποτελούν το κέντρο βάρους για κάθε ένα cluster που προέκυψε από το προηγούμενο βήμα. Αφού λοιπόν οριστούν τα νέα k centroids, ακολουθεί και πάλι η ίδια διαδικασία ανάθεσης καθενός από τα στοιχεία του συνόλου δεδομένων στο κοντινότερο με αυτό, νέο πλέον, centroid. Έτσι, γίνεται μια επανάληψη της ίδιας διαδικασίας. Αποτέλεσμα αυτής της επανάληψης είναι ότι σε κάθε βήμα τα centroids αλλάζουν θέση (ορίζονται νέα) και τα στοιχεία ανατίθενται στο κατάλληλο cluster κάθε φορά με βάση το κοντινότερο centroid. Όταν σε κάποια επανάληψη δεν σημειωθούν αντιμεταθέσεις στοιχείων, τότε τερματίζει η εκτέλεση του αλγορίθμου. Το αποτέλεσμα που προκύπτει είναι η ομαδοποίηση του συνόλου δεδομένων σε k clusters. Ο αλγόριθμος στοχεύει να ελαχιστοποιήσει μία αντικειμενική συνάρτηση, την λεγόμενη συνάρτηση τετραγωνικού σφάλματος που ορίζεται ως εξής: k n ( j) J x c 2 i j j 1i 1 Όπου, ( j) x c 2 i j είναι ένα μέτρο απόστασης που χρησιμοποιείται για να μετρά την ( j) απόσταση κάθε στοιχείου x i από το κέντρο cj. n, το σύνολο των στοιχείων του συνόλου δεδομένων. k, ο αριθμός των συστάδων.

25 Σ ε λ ί δ α 24 Παρακάτω φαίνονται συνοπτικά τα βήματα του αλγόριθμου k-means: Πίνακας 1.1: Συνοπτική παρουσίαση βημάτων αλγορίθμου k-means. Αν και μπορεί να αποδειχθεί ότι ο αλγόριθμος πάντα τερματίζει, αξίζει να τονιστεί ότι δεν καταφέρνει πάντα να βρίσκει τη βέλτιστη λύση. Ο αλγόριθμος επηρεάζεται σημαντικά από τα αρχικά centroids. Για αυτό πολλές φορές συνίσταται η εκτέλεση του πολλές φορές μέχρι να μειωθεί η επίδραση αυτή. Έστω ότι υπάρχουν n διανύσματα τα 1, 2,..., n και όλα είναι της ίδια διάστασης. Ακόμη είναι γνωστό ότι όλα εμπίπτουν σε k συμπαγή clusters, για k<n. Έστω Y i είναι το μέσο διάνυσμα του i cluster. Εφόσον τα clusters είναι σαφώς διαχωρισμένα μεταξύ τους, μπορεί να χρησιμοποιηθεί σαν μέτρο απόστασης μεταξύ των στοιχείων η Ευκλείδεια απόσταση όπου ορίζεται απο τον τύπο: n d ( x y 2 ) 1/2 i 1 i i Αυτό σημαίνει ότι σε κάθε βήμα θα λέγεται: το στοιχείο x ανήκει στο cluster i, εάν η Ευκλείδεια απόσταση του από το centroid του i cluster είναι η μικρότερη σε σχέση με όλες τις άλλες αποστάσεις του από τα centroids των άλλων clusters. Έτσι βρίσκονται οι Ευκλείδειες αποστάσεις για όλα τα στοιχεία και κάθε ένα από αυτά ανατίθεται στο cluster από του οποίου το centroid απέχει λιγότερο (δηλαδή η Ευκλείδεια απόσταση είναι η μικρότερη). Στην συνέχεια, υπολογίζονται τα νέα centroids και μετά πάλι οι Ευκλείδειες αποστάσεις όλων των στοιχείων για τα νέα centroids. Γίνονται οι κατάλληλες μετακινήσεις στοιχείων και η ίδια διαδικασία επαναλαμβάνεται μέχρι κανένα στοιχείο να μην μετακινείται σε άλλο cluster, δηλαδή τα clusters να μένουν αμετάβλητα.

26 Σ ε λ ί δ α 25 Παρά την ευκολία χρήσης του συγκεκριμένου αλγορίθμου αυτός παρουσιάζει κάποιες αδυναμίες, όπως: Ο αλγόριθμος συγκλίνει σε τοπικό βέλτιστο και όχι σε καθολικό βέλτιστο. Ο τρόπος με τον οποίο ορίζονται τα αρχικά centroids δεν είναι σαφώς καθορισμένος. Ένας αρκετά δημοφιλής τρόπος επιλογής των αρχικών centroids, είναι επιλεχθούν με τυχαίο τρόπο. Αυτή η μέθοδος εφαρμόζεται και στην παρούσα διπλωματική. Το αποτέλεσμα που προκύπτει εξαρτάται από τα αρχικά centroids. Συχνά προκύπτει μη βέλτιστη λύση λόγω της «κακής» αρχικής επιλογής των centroids. Για αυτό τον λόγο συνίσταται να γίνουν πολλές δοκιμές εκτέλεσης με διαφορετικά αρχικά centroids κάθε φορά. Μπορεί ακόμη ένα cluster να μείνει χωρίς μέλη και έτσι να μην ανανεωθεί κάποιο centroid. Πρόκειται για το γνωστό πρόβλημα των απόμακρων στοιχείων που πολλές φορές δεν συμπεριλαμβάνονται στη διαδικασία. Τα αποτελέσματα εξαρτώνται και από το μέτρο απόστασης που χρησιμοποιείται. Πολλές φορές χρειάζεται να γίνει κανονικοποίηση των στοιχείων του συνόλου δεδομένων προκειμένου να εφαρμοστεί κάποιο μέτρο απόστασης. Ακόμη μια αδυναμία του αλγορίθμου, είναι ότι δυσκολεύεται να αναγνωρίσει ομάδες με διαφορετικό σχηματισμό και μέγεθος. Το πρόβλημα εντείνεται κυρίως σε πολύ μεγάλα σύνολα δεδομένων. Συνήθως το επίπεδο δυσκολίας που αντιμετωπίζει ο αλγόριθμος σε τέτοια μεγάλα σύνολα δεδομένων έχει να κάνει και με την πυκνότητα που εμφανίζουν τα στοιχεία, που μπορεί αλλού να είναι μεγάλη αλλού μικρή και γενικά να ποικίλει. Τα αποτελέσματα εξαρτώνται από την τιμή του k, η οποία αποτελεί στοιχείο εισόδου για τον αλγόριθμο. Αν και υπάρχουν πολλοί τρόποι εκτίμησης του k και έχουν γίνει πολλές προσπάθειες προς αυτή την κατεύθυνση, δυστυχώς το πρόβλημα παραμένει ακόμη άλυτο. Ο αλγόριθμος δεν καταφέρνει να βρει το βέλτιστο k από μόνος του και να γίνει αυτό ευρέως αποδεκτό. Φυσικά με το βέλτιστο k, εννοείται εκείνο το k που αποδίδει με τον καλύτερο τρόπο τον διαχωρισμό του εκάστοτε συνόλου δεδομένων έτσι ώστε οι ομάδες που προκύπτουν να έχουν νόημα. Αυτή η τελευταία αδυναμία του k-means συχνά αποτελεί ενοχλητικό παράγοντα μιας και δεν είναι πάντα δυνατόν να υπάρχει γνώση για το πόσα clusters υπάρχουν, όταν πρέπει να εφαρμοστεί ομαδοποίηση σε δεδομένα του πραγματικού κόσμου. Για την εκτίμηση του αριθμού των clusters (k) έχουν προταθεί οι κατάλληλοι δείκτες, μέσω των οποίων μπορεί να εκτιμηθεί το βέλτιστο k. Ωστόσο χρειάζεται προσοχή γιατί όταν αυξάνεται πολύ το k μπορεί να συμβεί επικάλυψη.

27 Σ ε λ ί δ α 26 Εικόνα 1.7: Παράδειγμα εκτέλεσης του k-means στο ίδιο σύνολο δεδομένων στο αριστερό σχήμα για k=2 και στο δεξί για k=3

28 Σ ε λ ί δ α 27 ΚΕΦΑΛΑΙΟ 2 ΜΕΛΕΤΗ ΚΑΙ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΣΗΣ ΦΟΡΤΙΟΥ 2.1 ΕΙΣΑΓΩΓΗ ΣΤΗ ΜΕΛΕΤΗ ΦΟΡΤΙΩΝ ΚΑΤΑΝΑΛΩΣΗΣ Η ανάλυση και η μελέτη φορτίων κατανάλωσης αποτελεί αντικείμενο ενδιαφέροντος των εταιρειών παροχής ηλεκτρισμού και των διαχειριστών του συστήματος μεταφοράς. Έμμεσα αφορά και τους κατασκευαστές ηλεκτρολογικού εξοπλισμού αλλά και τους ίδιους τους καταναλωτές. Η γνώση των προτύπων κατανάλωσης των πελατών είναι απαραίτητη για την επίτευξη δίκαιων συμφωνιών μεταξύ καταναλωτών και προμηθευτών ως προς την τιμή της ενέργειας, τον καθορισμό πολιτικών διαχείρισης της ηλεκτρικής ζήτησης καθώς και καινοτόμων υπηρεσιών και συμβάσεων. Για τους προμηθευτές οι οποίοι επιλέγουν μία διαφορετική πολιτική, η γνώση των αναγκών των πελατών τους είναι θεμελιώδους σημασίας, ώστε να αναπτύξουν προϊόντα που να ικανοποιούν τις προτιμήσεις των πελατών. Επίσης, η μελέτη των προφίλ φορτίου αποτελεί τη βάση για την ανάπτυξη τεχνολογιών παρακολούθησης και καταγραφής φορτίου, έλεγχου της ποιότητας ενέργειας και του σχεδιασμού των ηλεκτρικών δικτύων διανομής. Επίσης, διευκολύνει την πρόβλεψη φορτίου στο δίκτυο διανομής και την πρόβλεψη αλλαγών και οδηγεί σε ορθότερη επιλογή και διαχείριση των μετασχηματιστών και κατά συνέπεια σε ένα πιο αποδοτικό και αξιόπιστο σύστημα παροχής ενέργειας. Γενικότερα, τα οφέλη που προκύπτουν από την μελέτη των προφίλ φορτίου αφορούν, όχι μόνο τους παραγωγούς αλλά και τους διαχειριστές του συστήματος διανομής, αλλά και τους κατασκευαστές ηλεκτρικών συσκευών καθώς και τους απλούς καταναλωτές. Πιο συγκεκριμένα,οι παραγωγοί έχουν την δυνατότητα να βελτιώσουν το σχεδιασμό και τη μορφή των περιεχόμενων υπηρεσιών και να αναπτύξουν νέα προϊόντα και υπηρεσίες σύμφωνα με τις ανάγκες της αγοράς. Οι διαχειριστές του συστήματος διανομής μπορούν να βελτιώσουν τους κανόνες και την πολιτική διαχείρισης της ενέργειας, ώστε να ανταποκρίνονται καλύτερα στις απαιτήσεις των καταναλωτών. Για τους κατασκευαστές ηλεκτρικών συσκευών, τα οφέλη σχετίζονται με την δημιουργία πιο ποιοτικών και ανταγωνιστικών προϊόντων,

29 Σ ε λ ί δ α 28 συμβατών με τις απαιτήσεις της αγοράς. Τέλος οι τελικοί καταναλωτές ενέργειας επωφελούνται απο τη μείωση του κόστους της ενέργειας, τη βελτιωμένη ποιότητα, την βελτίωση της αξιοπιστίας και τα νέα καλύτερα και πιο ευέλικτα προϊόντα και υπηρεσίες. Έτσι, μπορούμε να ορίσουμε παρακάτω τι είναι προφίλ κατανάλωσης φορτίου και πως αυτά απεικονίζονται για καλύτερη διαχείριση και κατανόηση. Διάγραμμα ή προφίλ κατανάλωσης φορτίου ονομάζεται ο τρόπος με τον οποίο, μια συσκευή ή φορτίο, χρησιμοποιεί την παρεχόμενη σε αυτό ηλεκτρική ισχύ. Η συνηθέστερη πρακτική απεικόνιση του προφίλ φορτίου είναι ως καμπύλη καταναλισκόμενης ισχύος ως προς μία μονάδα χρόνου. Η καμπύλη αυτή μπορεί να αναφέρεται σε μία συσκευή, σε ομάδα συσκευών, σε ομάδα συσκευών, σε ένα σημείο του δικτύου, σε έναν τύπο καταναλωτή π.χ. σε οικιακό καταναλωτή,ακόμα και σε μία ολόκληρη γεωγραφική περιοχή. Τα προφίλ φορτίου μπορεί να είναι στατικά η δυναμικά. Στατικά ονομάζονται τα προφίλ φορτίου που προκύπτουν με βάση ιστορικά δεδομένα κατανάλωσης, ενώ δυναμικά ονομάζονται τα προφίλ φορτίου που δημιουργούνται μετά από διεξαγωγή μετρήσεων σε τακτά χρονικά διαστήματα. Τα δυναμικά προφίλ φορτίου θεωρούνται πιο αξιόπιστα και συνήθως χρησιμοποιούνται για την αξιολόγηση των εκτιμήσεων που γίνονται με βάση τα στατικά προφίλ φορτίου ΜΕΘΟΔΟΙ ΔΗΜΙΟΥΡΓΙΑΣ ΠΡΟΦΙΛ ΦΟΡΤΙΟΥ Υπάρχουν πολλές τεχνικές και εργαλεία που χρησιμοποιούνται για τη μελέτη της ηλεκτρικής κατανάλωσης σε αστικά περιβάλλοντα. Στόχος των τεχνικών αυτών είναι η ομαδοποίηση των καταναλωτών με παρόμοια ηλεκτρική συμπεριφορά, έτσι ώστε να οριστούν κατηγορίες καταναλωτών με κοινό προφίλ φορτίου που μπορούν να χρησιμοποιηθούν για διάφορους σκοπούς, όπως στην τιμολόγηση της ενέργειας, στο marketing και στην οργάνωση των επιχειρήσεων ηλεκτροδότησης. Ο διαχωρισμός των μεθόδων δημιουργίας προφίλ φορτίου και η κατάταξή τους σε κατηγορίες μπορεί να γίνει με βάση διάφορα κριτήρια, όπως το αν η μέθοδος στηρίζεται σε μετρήσεις ή χρησιμοποιεί στατιστικά δεδομένα, αν προκαλεί διαταραχές στο σύστημα λόγω των μετρητικών διατάξεων, δηλαδή αν είναι παρεμβατική μέθοδος (intrusive method) ή μη παρεμβατική(non-intrusive) κ.α.. Μία πιο ειδική και πρακτική ταξινόμηση είναι αυτή που κατατάσσει τις μεθόδους σε κατηγορίες ανάλογα με την τεχνολογία που εφαρμόζεται σε κάθε περίπτωση. Έτσι, οι κατηγορίες μεθόδων δημιουργίας προφίλ φορτίου κατανάλωσης που προκύπτουν είναι αναφορικά οι εξής: Αλγόριθμοι ομαδοποίησης (clustering methods). Προσεγγίσεις με νευρωνικά δίκτυα (neural networks). Τεχνικές ασαφούς λογικής (fuzzy logic). Ανάλυση στατιστικών δεδομένων (statistical methods). Συνδυασμοί των παραπάνω τεχνικών.

30 Σ ε λ ί δ α ΣΚΟΠΟΣ ΤΗΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ 1 ΟΥ ΣΤΑΔΙΟΥ Στόχος του κεφαλαίου αυτού είναι μία λεπτομερής περιγραφή της διαδικασίας του 1 ου σταδίου συσταδοποίησης που πραγματοποιήθηκε σε δείγμα 150 καταναλωτών ηλεκτρικής ισχύος. Για τον κάθε καταναλωτή έχουμε 365 ημερήσιες καμπύλες, οι οποίες περιγράφουν την κατανάλωση καθ όλη τη διάρκεια ενός έτους. Το δείγμα αποτελείται από οικιακούς, εμπορικούς και βιομηχανικούς καταναλωτές. Στο στάδιο αυτό έγινε ομαδοποίηση των κανονικοποιημένων ημερήσιων καμπυλών για κάθε καταναλωτή ξεχωριστά, μέσω του αλγορίθμου συσταδοποίησης K-means. Η υλοποίηση του αλγόριθμου πραγματοποιήθηκε στο λογισμικό MATLAB. Με τη χρήση του MATLAB έγινε η επιλογή αντιπροσωπευτικών καμπυλών του κάθε cluster (κέντρα) και η μετέπειτα ομαδοποίηση όλων των καμπυλών του κάθε καταναλωτή στο πιο κατάλληλο cluster. Ως πιο κατάλληλο cluster ορίζεται αυτό, του οποίου το κέντρο παρουσιάζει μεγαλύτερη ομοιότητα με την εκάστοτε καμπύλη. Σαν μέτρο εγγύτητας χρησιμοποιήθηκε το Ευκλείδειο σφάλμα. Η διαδικασία αυτή επαναλήφθηκε 150 φορές, όσοι και οι καταναλωτές του δείγματος μας. Το αναμενόμενο αποτέλεσμα του σταδίου αυτού, είναι η εξαγωγή απεικονίσεων των ομάδων διαφορετικών ημερήσιων καμπυλών για κάθε καταναλωτή. Το επίκεντρο ενδιαφέροντος του σταδίου αυτού δεν είναι η ποσότητα κατανάλωσης, αλλά η μορφή των καμπυλών στον χρόνο, όπως και η ποικιλία των ειδών συμπεριφοράς ενός καταναλωτή. 2.3 ΠΑΡΟΥΣΙΑΣΗ ΚΑΤΑΝΑΛΩΤΩΝ Αντικείμενο μελέτης μας είναι τα φορτία που μετρήθηκαν από 150 καταναλωτές κατά τη διάρκεια ενός χρόνου. Οι καταναλωτές αυτοί αντιπροσωπεύουν ένα τυχαίο δείγμα και γι αυτό το λόγο δεν ανήκουν αποκλειστικά σε μία κοινή κατηγορία καταναλωτών, αλλά ανήκουν και στις 3 κύριες κατηγορίες αυτών (οικιακοί, εμπορικοί, βιομηχανικοί). Γι αυτό το λόγο εμφανίζεται μία ανομοιομορφία τιμών φορτίων κατανάλωσης, και πιο συγκεκριμένα, με την υψηλότερη μέση τιμή να αγγίζει τα 1410 kw και τη χαμηλότερη τα 0,20 kw. Παρακάτω, παρουσιάζεται ένα διάγραμμα, το οποίο απεικονίζει τις διαφορετικές μέσες τιμές κατανάλωσης του δείγματος και ένα γράφημα, που παραθέτει στοιχεία για τις περιοχές τιμών μέσου ετήσιου φορτίου και τα ποσοστά καταναλωτών που συμμετέχουν σε αυτές.

31 Μέσο ετήσιο φορτίο (kw) Σ ε λ ί δ α 30 Μέση ετήσια κατανάλωση 1400, , ,00 800,00 600,00 400,00 200,00 0,00 Αριθμός Καταναλωτή Διάγραμμα 2.1: Μέσες ετήσιες τιμές κατανάλωσης ισχύος για κάθε καταναλωτή του δείγματος. Περιοχές τιμών μέσου ετήσιου φορτίου 17% 5% 2% 37% [0,5]KW (5,10]KW 11% (10,20]KW (20,100]KW 28% (100,200]KW >200KW Διάγραμμα 2.2: Περιοχές τιμών μέσου ετήσιου φορτίου κατανάλωσης και ποσοστά που περιγράφουν τη συμμετοχή των καταναλωτών σε κάθε περιοχή.

32 kw Σ ε λ ί δ α ΔΙΑΜΟΡΦΩΣΗ ΧΡΟΝΙΚΩΝ ΚΑΜΠΥΛΩΝ Τα δείγματα κατανάλωσης ηλεκτρικής ισχύος των 150 καταναλωτών δημιουργήθηκαν με τη λήψη μετρήσεων σε διαστήματα 15-λεπτων, από κατάλληλους μετρητές. Τα ληφθέντα δεδομένα, υπέστησαν μία μορφή επεξεργασίας για την κανονικοποίηση τους με βάση, σε αυτό το στάδιο, το μέγιστο (peak) φορτίο του εκάστοτε καταναλωτή, ώστε να έχει τιμές μεταξύ 0 και 1 p.u., και τη μετατροπή τους σε αρχεία txt, με περιεχόμενο τις ωριαίες ενδείξεις και όχι τις 15λεπτες. Οι ωριαίες ενδείξεις είναι αποτέλεσμα του μέσου όρου κατανάλωσης των τεσσάρων τετάρτων που αποτελούν την κάθε ώρα. Η μετατροπή αυτή σε ωριαίες ενδείξεις ήταν αναγκαία για τη λειτουργικότητα του προγράμματος MATLAB και την εξαγωγή περιγραφικών και κατανοητών αποτελεσμάτων. Στα διαγράμματα 3.3 και 3.4 παρουσιάζονται για τους καταναλωτές 1-7 οι καμπύλες μέσης ημερήσιας και εβδομαδιαίας κατανάλωσης των μη κανονικοποιημένων και μορφοποιημένων μετρήσεων. 300 Ενδεικτικές μέσες ημερίσιες καμπύλες ΚΑΤΑΝΑΛΩΤΗΣ 1 ΚΑΤΑΝΑΛΩΤΗΣ 2 ΚΑΤΑΝΑΛΩΤΗΣ 3 ΚΑΤΑΝΑΛΩΤΗΣ 4 ΚΑΤΑΝΑΛΩΤΗΣ 5 ΚΑΤΑΝΑΛΩΤΗΣ 6 ΚΑΤΑΝΑΛΩΤΗΣ Χρόνος (15-λεπτα) Διάγραμμα 2.3: Ενδεικτικές μέσες ημερήσιες καμπύλες, όπως αυτές δημιουργήθηκαν με βάση τις ανά 15 λεπτά μετρήσεις.

33 Kw Σ ε λ ί δ α 32 Ενδεικτικές μέσες εβδομαδιαίες καμπύλες ΚΑΤΑΝΑΛΩΤΗΣ 1 ΚΑΤΑΝΑΛΩΤΗΣ 2 ΚΑΤΑΝΑΛΩΤΗΣ 3 ΚΑΤΑΝΑΛΩΤΗΣ 4 ΚΑΤΑΝΑΛΩΤΗΣ 6 ΚΑΤΑΝΑΛΩΤΗΣ Χρόνος (15-λεπτα) Διάγραμμα 2.4: Ενδεικτικές μέσες εβδομαδιαίες καμπύλες, όπως αυτές δημιουργήθηκαν με βάση τις ανά 15 λεπτα μετρήσεις. Από τα διαγράμματα αυτά μπορούμε να διακρίνουμε τα είδη καμπυλών του κάθε καταναλωτή. Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι μέσες εβδομαδιαίες καμπύλες κατανάλωσης, από τις οποίες μπορούμε να διαπιστώσουμε τη μείωση της κατανάλωσης αλλά και την αλλαγή του προφίλ του καταναλωτή κατά τη διάρκεια των σαββατοκύριακων. Παρακάτω παρουσιάζεται αναλυτικά η διαδικασία ανάκτησης των ζητούμενων ημερήσιων καμπυλών τριών τυχαίων καταναλωτών (Νο 10, 11, 12). Δηλαδή στους πίνακες 3.1 και 3.2 παρουσιάζονται οι ληφθείσες τιμές από τους μετρητές στο χρονικό διάστημα 00:00-03:00, η μετατροπή τους σε ωριαίες ενδείξεις καθώς και η κανονικοποίηση των τελικών τιμών με βάση τις μέγιστες τιμές κατανάλωσης.

34 Σ ε λ ί δ α ΛΕΠΤΕΣ ΕΝΔΕΙΞΕΙΣ ΚΑΤΑΝΑΛΩΤΕΣ ΤΕΤΑΡΤΑ 1 ης Ν ο 10 (kw) Ν ο 11 (kw) Ν ο 12 (kw) ΗΜΕΡΑΣ 00: : : : : : : : : : : : : Πίνακας 2.1: Δεκαπεντάλεπτες ενδείξεις μέτρησης κατανάλωσης των καταναλωτών 10, 11,12. ΤΕΤΑΡΤΑ 1 ης ΗΜΕΡΑΣ Πραγματικές τιμές (kw) ΩΡΙΑΙΕΣ ΜΕΤΡΗΣΕΙΣ ΚΑΤΑΝΑΛΩΤΕΣ Ν ο 10 Ν ο 11 (kw) Ν ο 12 (kw) Κανονικοποιημένες τιμές (kw) Πραγματικές τιμές (kw) Κανονικοποιημένες τιμές (kw) Πραγματικές τιμές (kw) Κανονικοποιημένες τιμές (kw) 00: :15 00:30 00:45 01: :15 01:30 01:45 02: :15 02:30 02:45 03: Πίνακας 2.2: Ωριαίες πραγματικές και κανονικοποιημένες ενδείξεις μέτρησης κατανάλωσης, των καταναλωτών 10, 11, 12.

35 p.u. Σ ε λ ί δ α 34 Χρησιμοποιώντας τις ωριαίες τιμές που δημιουργήθηκαν από την επεξεργασία των τιμών κατανάλωσης σε 15-λεπτα και την κανονικοποίηση με βάση τη μέγιστη τιμή, εξάγαμε τις ζητούμενες καμπύλες ωριαίου φορτίου. Στο παρακάτω διάγραμμα παρουσιάζεται ενδεικτικά το αποτέλεσμα της μορφοποίησης δεδομένων και η απεικόνισή τους για τους καταναλωτές 10,11,12. 0,4 0,35 0,3 0,25 Κανονικοποιημένες ωριαίες καταναλώσεις 0,2 0,15 0,1 ΚΑΤΑΝΑΛΩΤΗΣ 10 ΚΑΤΑΝΑΛΩΤΗΣ 11 ΚΑΤΑΝΑΛΩΤΗΣ 12 0, Χρόνος (h) Διάγραμμα 2.5: Απεικόνιση της επεξεργασίας των δεδομένων για τους καταναλωτές 10,11,12 για τη διάρκεια της πρώτης ημέρας μετρήσεων. Από τη μετατροπή των μετρήσεών μας είναι πιο εύκολη η σύγκριση μεταξύ των καμπυλών και η απεικόνιση είναι πιο περιγραφική. Με αυτό εννοούμε ότι,στην περίπτωση όπου τα πλάτη των καμπυλών έχουν μεγάλη διαφορά, η καμπύλη με το μικρότερο πλάτος συνήθως είναι δυσδιάκριτη και ίσως αυτό προκαλέσει δυσκολία στην παρατήρηση των δεδομένων που περιγράφει. Από την παρατήρηση των αποτελεσμάτων μπορούμε να εξάγουμε συμπεράσματα σχετικά με τη σταθερότητα της κατανάλωσης και τις χρονικές στιγμές όπου παρουσιάζεται η μέγιστη, ελάχιστη και μέση κατανάλωση. Αυτό που δεν είναι εφικτό να γίνει στην περίπτωση αυτή, είναι η σύγκριση της πραγματικής τιμής ζήτησης ισχύος μεταξύ των καταναλωτών. Η πληροφορία αυτή δεν υπάρχει μετά την κανονικοποίηση, πράγμα θεμιτό, αφού αντικείμενο ενδιαφέροντος δεν είναι τόσο η ποσότητα κατανάλωσης ισχύος, αλλά η εξαγωγή της μορφής της στο χρόνο. Έτσι, επιτυγχάνεται μέσω της διαδικασίας αυτής η ομοιομορφία μεταξύ των χρονολογικών καμπυλών και η ανεξαρτησία από την πραγματική τιμή του φορτίου του κάθε καταναλωτή.

36 p.u. Σ ε λ ί δ α ΠΕΡΙΠΤΩΣΕΙΣ ΠΡΟΦΙΛ ΚΑΤΑΝΑΛΩΣΗΣ Ανάμεσα στο δείγμα των 150 καταναλωτών και των συνολικά ημερησίων καμπυλών που εξήχθησαν, διακρίθηκαν ποικίλες μορφές κατανάλωσης. Οι πιο συνηθισμένες μορφές απεικονίζουν την ζήτηση ισχύος ως μέγιστη κατά τη διάρκεια της ημέρας και ελάχιστη κατά τη διάρκεια της νύχτας. Επίσης, οι περισσότεροι καταναλωτές είχαν αυξημένη κατανάλωση τις καθημερινές ημέρες της εβδομάδος, και μειωμένη κατά τη διάρκεια των σαββατοκύριακων. Πέραν αυτών όμως, απεικονίσθηκαν καμπύλες οι οποίες είναι εντελώς αντίθετες, δηλαδή παρουσιάζουν μέγιστη τιμή ζήτησης κατά τη διάρκεια των νυχτερινών. Κάποιοι άλλοι καταναλωτές, ενώ παρουσιάζουν μία σταθερότητα ως προς την ζήτηση ισχύος, υπάρχουν ημέρες που η κατανάλωση ξεπερνά κατά πολύ τα συνηθισμένα, ή ημέρες κατά τις οποίες η κατανάλωσή τους είναι μηδενική. Εμφανίστηκαν επίσης στα δεδομένα μας περιπτώσεις απότομης αύξησης της ζήτησης ισχύος αλλά και απότομης μείωσης. Έτσι, μέσω των καμπυλών μπορούμε να διακρίνουμε πιθανές διακοπές παροχής ή σφάλματα. Ακόμα και αν το τελικό αποτέλεσμα επηρεάζεται από τις τελευταίες περιπτώσεις, αποφασίσθηκε η μη απομάκρυνση αυτών των περιπτώσεων από τη μελέτη μας, λόγω του ότι ανταποκρίνονται στην πραγματικότητα. Παρακάτω παρουσιάζονται ενδεικτικά κάποιες καμπύλες, που απεικονίζουν τα προφίλ κατανάλωσης που περιγράφηκαν. 1 0,8 0,6 Κατανάλωση κατά τη διάρκεια της ημέρας 0,4 0,2 ΚΑΤΑΝΑΛΩΤΗΣ Χρόνος (h) Διάγραμμα 2.6: Απεικόνιση ζήτησης φορτίου κατά τη διάρκεια των ωρών της ημέρας. Αποτελεί τη πιο συνηθισμένη μορφή καμπύλης στο δείγμα των καταναλωτών.

37 p.u. p.u. p.u. Σ ε λ ί δ α 36 1 Κατανάλωση κατά τη διάρκεια της νύχτας 0,8 0,6 0,4 ΚΑΤΑΝΑΛΩΤΗΣ 123 0, Χρόνος (h) Διάγραμμα 2.7: Απεικόνιση ζήτησης φορτίου κατά τη διάρκεια των ωρών της νύχτας. 1 Απότομη αύξηση φορτίου 0,8 0,6 0,4 ΚΑΤΑΝΑΛΩΤΗΣ 5 0, Χρόνος (h) Διάγραμμα 2.8: Απεικόνιση απότομης αύξησης ζήτησης ισχύος. 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 Απότομη μείωση φορτίου Χρόνος (h) ΚΑΤΑΝΑΛΩΤΗΣ 5 Διάγραμμα 2.9: Απεικόνιση απότομης μείωσης ζήτησης ισχύος.

38 p.u. p.u. Σ ε λ ί δ α 37 1 Μηδενική κατανάλωση 0,8 0,6 0,4 ΚΑΤΑΝΑΛΩΤΗΣ 107 0, Χρόνος (h) Διάγραμμα 2.10: Απεικόνιση μηδενικής ζήτησης ισχύος. 1 Ομαλή κατανάλωση 0,8 0,6 0,4 ΚΑΤΑΝΑΛΩΤΗΣ 117 0, Χρόνος (h) Διάγραμμα 2.11: Απεικόνιση ομαλής ζήτησης ισχύος. 2.6 ΣΧΕΔΙΑΣΗ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ Για την εκτέλεση της συσταδοποίησης των ημερών του κάθε καταναλωτή, έγινε χρήση, όπως προείπαμε, του αλγορίθμου K-means στο λογισμικό Matlab. Ως είσοδοι του αλγορίθμου, ορίσθηκαν δύο πίνακες, ο ένας εκ των οποίων χρησιμοποιήθηκε για την απαρίθμηση των 24 ωρών και ο άλλος για την απαρίθμηση των 365 ημερών του έτους. Ακόμα απαραίτητοι για την υλοποίηση και την εκτέλεση του αλγορίθμου ήταν η δημιουργία 150 αρχείων.txt, που περιείχαν τις κανονικοποιημένες τιμές ισχύος για τον κάθε ένα καταναλωτή ξεχωριστά. Για την εξαγωγή ενός clustering για τον κάθε καταναλωτή, ως είσοδος στον αλγόριθμο έπρεπε κάθε φορά να είναι και το αντίστοιχο αρχείο.txt του κάθε ενός. Τα ορίσματα που δόθηκαν στον αλγόριθμο, έτσι ώστε να αναγνωρίσει τις επιθυμητές παραμέτρους υλοποίησης, ήταν το μέτρο απόστασης, δηλαδή το Ευκλείδειο

39 Σ ε λ ί δ α 38 σφάλμα και το όρισμα replicates. Το όρισμα αυτό είναι απαραίτητο για τη λειτουργία του αλγόριθμου K-means και αφορά τον αριθμό των επαναλήψεων που θα πραγματοποιηθούν για την τελική δημιουργία του clustering. Σε κάθε επανάληψη ορίζεται και ένα διαφορετικό κέντρο για κάθε cluster. Η έξοδος του αλγορίθμου είναι το βέλτιστο clustering, δηλαδή αυτό του οποίου η συνάρτηση τετραγωνικού λάθους είναι η μικρότερη. Ο κατάλληλος αριθμός replicates για το βέλτιστο αποτέλεσμα, ορίσθηκε έπειτα από δοκιμές. Τελικά καταλήξαμε στα 30 replicates, μιας και για περεταίρω αύξηση του αριθμού αυτών παρουσίαζε σχεδόν ίδιες τιμές αποκλίσεων, με πολύ μικρές διαφορές, της τάξεως το πολύ του 0,1, και η διαδικασία ήταν λιγότερο χρονοβόρα. Η επιλογή των κέντρων για κάθε σειρά επαναλήψεων είναι τυχαία. Κατά την εκτέλεση του αλγορίθμου, δημιουργούνται δύο αρχεία σαν έξοδοι. Το πρώτο περιέχει τον αριθμό του cluster στο οποίο ανήκει κάθε ημέρα, και το δεύτερο τις κανονικοποιημένες ημερήσιες τιμές φορτίου του κάθε κέντρου που επιλέχθηκε για το κάθε cluster. Η δημιουργία των αρχείων αυτών ήταν αναγκαία για την περεταίρω μελέτη της συμπεριφοράς των καταναλωτών στα επόμενα κεφάλαια. Παρακάτω παρουσιάζονται τα βήματα εκτέλεσης του K-means και αναγράφονται τα ορίσματα εισόδου του αλγορίθμου όπως και οι έξοδοί του, για τη δημιουργία του clustering σε 5 clusters. ΕΙΣΟΔΟΣ Pinakas 1 // αρχείο Excel για τον ορισμό των τιμών του x άξονα (24 ώρες) Pinakas 2 // αρχείο Excel για τον ορισμό των 365 ημερών του έτους Pinakas 3 // αρχείο.txt με τα ωριαία κανονικοποιημένα φορτία του εκάστοτε καταναλωτή ΕΚΤΕΛΕΣΗ K-means Clusters = α // ο αριθμός των επιθυμητών clusters Distance= Euclidean // ορισμός του Ευκλείδειου σφάλματος ως μέτρο απόκλισης Replicates= 30 // αριθμός των επιθυμητών επαναλήψεων για την εύρεση του βέλτιστου clustering ΕΞΟΔΟΣ Clusters // αρχείο.txt στο οποίο αναγράφεται ποιες μέρες ανήκουν στο κάθε cluster Centers // αρχείο.txt στο οποίο αναγράφονται οι κανονικοποιημένες τιμές των ωριαίων φορτίων των κέντρων του κάθε cluster Plot // έξοδος της απεικόνισης των διαγραμμάτων του clustering με ορίσματα τους Pinakas 1, Pinakas 2, Pinakas 3 Πίνακας 2.3: Απεικόνιση βημάτων εκτέλεσης του αλγόριθμου K-means και περιγραφή των αρχείων εισόδου, των παραμέτρων αλλά και των αρχείων εξόδου.

40 Σ ε λ ί δ α ΕΚΤΕΛΕΣΗ CLUSTERING Για τη συσταδοποίηση των ημερήσιων καμπυλών κατανάλωσης, που υλοποιήθηκε για κάθε καταναλωτή ξεχωριστά, πραγματοποιήθηκε η μελέτη, η εκτέλεση και η σύγκριση δύο διαφορετικών clustering, ένα για 5 και ένα για 10 clusters. Η επιλογή του αριθμού των clusters έγινε με βάση την βελτιστοποίηση του δείκτη αξιολόγησης «Ευκλείδειο σφάλμα», αλλά και για λόγους αξιοποίησης του συγκεκριμένου σταδίου στα επόμενα της μελέτης μας ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΣΕ 5 ΚΑΙ 10 CLUSTERS Το δείγμα των 150 καταναλωτών, το οποίο επεξεργαζόμαστε, περιέχει μεγάλη ποικιλομορφία ως προς τις καμπύλες κατανάλωσης. Υπάρχουν καταναλωτές με μία σχετική ομοιομορφία μεταξύ των καμπυλών, και καταναλωτές με μεγάλη ανομοιομορφία, πράγμα το οποίο αντανακλάται στις τιμές των Ευκλείδειων αποστάσεων. Οι καταναλωτές που παρουσιάζουν μεγάλη ανομοιομορφία ως προς τις καμπύλες κατανάλωσης,εμφανίζουν αρκετά μεγάλες αποκλίσεις από τα κέντρα του κάθε cluster, σχετικά με αυτούς που παρουσιάζουν ομοιομορφία για τον ίδιο αριθμό clusters. Όπως είναι αυτονόητο, οι πρώτοι χρειάζονται έναν μεγαλύτερο αριθμό συστάδων έτσι ώστε κατά την εκτέλεση της διαδικασίας να μειωθούν οι αποκλίσεις και να γίνει πιο αποτελεσματική συσταδοποίηση για τον κάθε καταναλωτή. Το κριτήριο για την διεκπεραίωση του πιο αποτελεσματικού clustering, είναι ο δείκτης αξιολόγησης του κάθε καταναλωτή, δηλαδή το συνολικό Ευκλείδειο σφάλμα. Για να πραγματοποιηθεί η βελτιστοποίηση του δείκτη, πραγματοποιήθηκαν διάφορες δοκιμές ως προς τον αριθμό των clusters, στα οποία θα κατανεμηθούν οι ημερήσιες καμπύλες φορτίου των καταναλωτών. Ενδεικτικά εκτελέστηκε η διαδικασία της συσταδοποίησης του πρώτου σταδίου για έναν καταναλωτή (Καταναλωτής 4), που επιλέχθηκε τυχαία, για να παρουσιαστεί η διαδικασία βελτιστοποίησης του Ευκλείδειου σφάλματος, η απεικόνιση του clustering και οι αντίστοιχες αποκλίσεις. Ο συγκεκριμένος καταναλωτής έχει μέση τιμή φορτίου 18,5 KW και βρίσκεται ανάμεσα στο 11% του συνόλου καταναλωτών των οποίων η κατανάλωση βρίσκεται στο διάστημα KW. Ο καταναλωτής αυτός επιλέχθηκε λόγω της μέσης τιμής του φορτίου του, η οποία, αν εξαιρεθεί ο μεγαλύτερος καταναλωτής των 1410 kw, βρίσκεται κοντά στην μέση τιμή του συνολικού δείγματος. Αρχικά πραγματοποιήθηκαν οι δοκιμές για την εύρεση του κατάλληλου αριθμού συστάδων που θα επιφέρουν το μικρότερο σφάλμα του clustering. Οι δοκιμές έγιναν για 2 έως και 50 συστάδες. Τα αποτελέσματα των σφαλμάτων παρουσιάζονται παρακάτω.

41 Euclidean error Σ ε λ ί δ α 40 Ευκλείδειο σφάλμα αριθμός clusters Διάγραμμα 2.12: Ευκλείδειο σφάλμα συναρτήσει του αριθμού των clusters για τον καταναλωτή 4 του δείγματος. Από το διάγραμμα μπορούμε να συμπεράνουμε ότι το σφάλμα παρουσιάζει πτώση, καθώς ο αριθμός των συστάδων αυξάνεται, πράγμα αναμενόμενο λόγω του ότι οι καμπύλες φορτίου τοποθετούνται σε περισσότερα clusters, με αποτέλεσμα τη μεγαλύτερη ομοιομορφία μεταξύ των καμπυλών στο ίδιο cluster. Παρατηρούμε λοιπόν ότι, το σφάλμα είναι πολύ μεγάλο όταν ο αριθμός των συστάδων είναι μικρότερος του 5. Για αριθμό μεγαλύτερο των 5 η κλίση της καμπύλης αρχίζει να μειώνεται και παρατηρούμε ότι για αρκετά μεγάλο αριθμό συστάδων (μετά τα 20) σχεδόν σταθεροποιείται. Θεωρούμε ότι ο κατάλληλος αριθμός των συστάδων τελικά είναι τα 10, λόγω του ότι για μεγαλύτερους αριθμούς, η πτώση του Ευκλείδειου σφάλματος δεν είναι σημαντική και όσο μικρότερος είναι ο αριθμός των συστάδων, τόσο πιο απλή και λιγότερο χρονοβόρα κρίνεται η διαδικασία. Παρ όλα αυτά θα γίνει παρουσίαση της απεικόνισης του clustering και για 5 συστάδες, μιας και ο αριθμός αυτός είναι χρήσιμος για τα επόμενα βήματα της μελέτης μας. Στόχος της υλοποίησης clustering με 5 συστάδες είναι η μελέτη του αν η μείωση και η οικονομία του αριθμού των clusters μπορεί να οδηγήσει σε περιγραφικά αποτελέσματα για τον κάθε καταναλωτή.

42 Σ ε λ ί δ α 41 5 clusters για τον καταναλωτή 4. Euclidean error= Εικόνα 2.1: Απεικόνιση του αποτελέσματος συσταδοποίησης των 365 ημερήσιων καμπυλών του καταναλωτή 4. Η συσταδοποίηση έγινε με επιλεγμένο αριθμό clusters clusters για τον καταναλωτή 4. Euclidean error= Εικόνα 2.2: Απεικόνιση του αποτελέσματος συσταδοποίησης των 365 ημερήσιων καμπυλών του καταναλωτή 4. Η συσταδοποίηση έγινε με επιλεγμένο αριθμό clusters 10.

43 Σ ε λ ί δ α 42 Στα παραπάνω σχήματα γίνεται η κατανομή των ημερήσιων καμπυλών σε 5 και σε 10 clusters. Αυτές τοποθετούνται σε κάθε cluster, ανάλογα με την p.u. τιμή τους και ανάλογα με την μορφή τους. Έτσι μπορούμε για παράδειγμα να διακρίνουμε ποια συστάδα περιέχει τις καμπύλες με το μέγιστο για τον καταναλωτή φορτίο,με το ελάχιστο, αλλά και ποιες περιέχουν μέσες καταστάσεις κατανάλωσης. Από κάθε συστάδα επίσης, μπορούμε να εξάγουμε συμπεράσματα για τις διαφορετικές πορείες κατανάλωσης στο χρόνο, παρατηρώντας την γενική εικόνα του κάθε cluster. Είναι δυνατή και η εύρεση του αριθμού των ημερήσιων κυματομορφών που περιέχονται σε κάθε cluster, μέσω των αρχείων εξόδου CLUSTERS, πράγμα το οποίο μας βοηθά στον εντοπισμό του αριθμού των ημερών που ακολουθούν τις πορείες που απεικονίζονται μέσα στις συστάδες. Περιεχόμενο ημερών σε κάθε cluster 22% 20% 13% 32% 13% Διάγραμμα 2.13: Ποσοστά ημερών, που περιέχονται σε κάθε ένα από τα 5 clusters. Περιεχόμενο ημερών σε κάθε cluster 5% 11% 14% 8% 5% 8% 10% 18% 13% 8% Διάγραμμα 2.14: Ποσοστά ημερών, που περιέχονται σε κάθε ένα από τα 10 clusters.

44 Σ ε λ ί δ α 43 Από τα παραπάνω διαγράμματα, μπορούμε να συμπεράνουμε ότι ο αριθμός των ημερήσιων καμπύλων που περιέχονται σε κάθε cluster, διαφέρει αρκετά, ανάλογα με την ομοιότητα που παρουσιάζουν οι καμπύλες μεταξύ τους. Έτσι προκύπτουν clusters με μεγάλη περιεκτικότητα καμπυλών και clusters με πολύ μικρό αριθμό αυτών, ιδιαίτερα σε περιπτώσεις, όπου παρουσιάζεται μία ιδιομορφία ή ανωμαλία στις ημερήσιες καταναλώσεις. Από την παρατήρηση των δύο διαφορετικών συσταδοποιήσεων, μπορούμε να πούμε αρχικά, ότι η Ευκλείδεια απόκλιση στην δεύτερη περίπτωση είναι μικρότερη. Αν παρατηρήσουμε όμως καλύτερα,μπορούμε να συμπεράνουμε ότι ίσως κάποιες συστάδες παρουσιάζουν πολλές ομοιότητες με κάποιες άλλες, και ως προς την μορφή των καμπυλών, αλλά και ως προς τις κλίμακες των τιμών τους. Έτσι για παράδειγμα στην περίπτωση με τα 10 clusters, θα μπορούσαμε να πούμε ότι το δεύτερο (ξεκινώντας την αρίθμηση από αριστερά προς τα δεξιά) παρουσιάζει μεγάλη ομοιότητα με το όγδοο, ως προς τα στοιχεία που προαναφέρθηκαν, όπως επίσης το ίδιο γεγονός συμβαίνει με τις συστάδες 4 και 10, και τέλος 5 και 7. Θα μπορούσαμε να καταλήξουμε λοιπόν στο ότι στη συγκεκριμένη περίπτωση, αν και η Ευκλείδεια απόκλιση μας αποτρέπει από αυτό, θα μπορούσαμε να πραγματοποιήσουμε συγχώνευση κάποιων clusters, δεδομένου ότι αυτό δεν προκαλεί απώλεια της ζητούμενης πληροφορίας, δηλαδή των ειδών συμπεριφοράς του καταναλωτή κατά τη διάρκεια ενός έτους. Αν για παράδειγμα γινόταν οι προτεινόμενες συγχωνεύσεις, τότε θα είχαμε clustering, που θα πλησίαζε κατά πολύ αυτό με τις 5 συστάδες, στο οποίο είναι ευκρινείς οι συμπεριφορές του καταναλωτή. Πρέπει όμως να επισημάνουμε, ότι η προτίμηση για μείωση των συστάδων με αύξηση του Ευκλείδειου σφάλματος, εξαρτάται από τους λόγους για τους οποίους χρησιμοποιείται η διαδικασία της συσταδοποίησης και την επιθυμητή ακρίβεια της μεθόδου ΠΑΡΟΥΣΙΑΣΗ ΕΝΔΕΙΚΤΙΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Η παραπάνω διαδικασία επαναλήφθηκε για το σύνολο των 150 καταναλωτών του δείγματος. Αρχικά έγινε έρευνα για την εύρεση του καταλληλότερου αριθμού clusters και για τους 150 καταναλωτές. Στο παρακάτω διάγραμμα παρουσιάζονται τα clusters που χρειάζεται ο κάθε καταναλωτής, έτσι ώστε να γίνει η βέλτιστη συσταδοποίηση.

45 Clusters Σ ε λ ί δ α Κατάλληλος αριθμός συστάδων Αριθμός καταναλωτή Διάγραμμα 2.15: Κατάλληλος αριθμός clusters για κάθε έναν καταναλωτή του δείγματος. Θα μπορούσαμε λοιπόν να αντιστοιχίσουμε σε κάθε καταναλωτή έναν αριθμό clusters, βασισμένο στη διαδικασία βελτιστοποίησης του δείκτη αξιολόγησης και την εύρεση των σημείων στα οποία το σφάλμα άρχιζε να αποκτά σχεδόν σταθερή τιμή (γόνατο). Έτσι για κάθε έναν από τους 150 καταναλωτές θα είχαμε συσταδοποιήσεις με 5 έως 57 συστάδες. Για να μην υπάρχει αυτή η ανομοιομορφία μεταξύ των καταναλωτών και για την απλούστευση της μελέτης τους, αποφασίσαμε να χρησιμοποιηθεί η μέση τιμή των clusters όλων των καταναλωτών,που απαιτούνται σύμφωνα με την πιο πάνω διαδικασία. Έτσι η διαδικασία είναι λιγότερο χρονοβόρα, και η σύγκριση των συσταδοποιήσεων πιο ευκρινής. Αποφασίστηκε, λοιπόν, ο αριθμός των 10 clusters ο οποίος αντιπροσωπεύει τους περισσότερους καταναλωτές του δείγματος. Το μειονέκτημα της πράξης αυτής, είναι ότι, στις περιπτώσεις που οι απαιτούμενες συστάδες είναι περισσότερες των 10, αυξάνεται το σφάλμα. Όμως στις αντίθετες περιπτώσεις το σφάλμα μειώνεται. Στη συνέχεια παρουσιάζονται απεικονίσεις της συσταδοποίησης κάποιων καταναλωτών, μέσω του λογισμικού Matlab. Οι καταναλωτές που επιλέχθηκαν είναι αντιπροσωπευτικοί και απεικονίζουν αξιοσημείωτες περιπτώσεις που παρουσιάστηκαν κατά την εκτέλεση του clustering. Αρχικά θα παρουσιάσουμε τις συσταδοποιήσεις με 10 και 5 clusters για τους λόγους που προαναφέραμε.

46 Σ ε λ ί δ α 45 ΚΑΤΑΝΑΛΩΤΗΣ 19 - ΜΙΚΡΟΤΕΡΟ ΕΥΚΕΙΔΕΙΟ ΣΦΑΛΜΑ (ΟΜΟΙΟΜΟΡΦΙΑ) 10 clusters για τον καταναλωτή 19. Euclidean error= 2.15 Εικόνα 2.3: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 19 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 19. Euclidean error= 3.15 Εικόνα 2.4: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 19 για επιλεγμένο αριθμό συστάδων ίσο με 5.

47 Σ ε λ ί δ α 46 ΚΑΤΑΝΑΛΩΤΗΣ 134- ΜΕΓΙΣΤΟ ΣΦΑΛΜΑ (ΑΝΟΜΟΙΟΜΟΡΦΙΑ) 10 clusters για τον καταναλωτή 134. Euclidean error= Εικόνα 2.5: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 134 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 134. Euclidean error= Εικόνα 2.6: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 134 για επιλεγμένο αριθμό συστάδων ίσο με 5.

48 Σ ε λ ί δ α 47 ΚΑΤΑΝΑΛΩΤΗΣ 12 - ΠΟΙΚΙΛΙΑ ΠΡΟΦΙΛ 10 clusters για τον καταναλωτή 12. Euclidean error= Εικόνα 2.7: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 12 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 12. Euclidean error= Εικόνα 2.8: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 12 για επιλεγμένο αριθμό συστάδων ίσο με 5.

49 Σ ε λ ί δ α 48 ΚΑΤΑΝΑΛΩΤΗΣ 36- ΒΙΟΜΗΧΑΝΙΚΟΣ ΚΑΤΑΝΑΛΩΤΗΣ (ΜΕΓΙΣΤΟΣ) 10 clusters για τον καταναλωτή 36. Euclidean error= Εικόνα 2.9: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 36 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 36. Euclidean error= Εικόνα 2.10: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 36 για επιλεγμένο αριθμό συστάδων ίσο με 5.

50 Σ ε λ ί δ α 49 ΚΑΤΑΝΑΛΩΤΗΣ 34- ΕΜΠΟΡΙΚΟΣ ΚΑΤΑΝΑΛΩΤΗΣ 10 clusters για τον καταναλωτή 34. Euclidean error= 25.8 Εικόνα 2.11: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 34 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 34. Euclidean error= Εικόνα 2.12: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 34 για επιλεγμένο αριθμό συστάδων ίσο με 5.

51 Σ ε λ ί δ α 50 ΚΑΤΑΝΑΛΩΤΗΣ 26- ΚΑΤΑΝΑΛΩΣΗ ΚΥΡΙΩΣ ΚΑΤΑ ΤΙΣ ΝΥΧΤΕΡΙΝΕΣ ΩΡΕΣ 10 clusters για τον καταναλωτή 26. Euclidean error= Εικόνα 2.13: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 26 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 26. Euclidean error= Εικόνα 2.14: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 26 για επιλεγμένο αριθμό συστάδων ίσο με 5.

52 Σ ε λ ί δ α 51 ΚΑΤΑΝΑΛΩΤΗΣ 1- ΣΤΑΘΕΡΟ ΟΙΚΙΑΚΟ ΠΡΟΦΙΛ (ΚΑΤΑΝΑΛΩΣΗ ΚΥΡΙΩΣ ΚΑΤΑ ΤΗ ΔΙΑΡΚΕΙΑ ΤΗΣ ΗΜΕΡΑΣ) 10 clusters για τον καταναλωτή 1. Euclidean error= 7.23 Εικόνα 2.15: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 1 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 1. Euclidean error= Εικόνα 2.16: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 1 για επιλεγμένο αριθμό συστάδων ίσο με 5.

53 Σ ε λ ί δ α 52 ΚΑΤΑΝΑΛΩΤΗΣ 42- ΠΕΡΙΠΤΩΣΗ ΑΠΟΜΟΝΩΣΗΣ ΜΗΔΕΝΙΚΩΝ ΚΑΤΑΝΑΛΩΣΕΩΝ 10 clusters για τον καταναλωτή 42. Euclidean error= Εικόνα 2.17: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 42 για επιλεγμένο αριθμό συστάδων ίσο με clusters για τον καταναλωτή 42. Euclidean error= Εικόνα 2.18: Απεικόνιση του αποτελέσματος της συσταδοποίησης του καταναλωτή 42 για επιλεγμένο αριθμό συστάδων ίσο με 5.

54 Σ ε λ ί δ α 53 Μέσω των παραπάνω clustering μπορούμε να διακρίνουμε διαφορετικά προφίλ ζήτησης φορτίου καταναλωτών. Για παράδειγμα, στο δείγμα μας υπάρχουν καταναλωτές με μεγάλη σταθερότητα στην κατανάλωση, όπως ο καταναλωτής 19, αλλά και καταναλωτές με μεγάλες διακυμάνσεις, όπως ο καταναλωτής 134, πράγμα το οποίο δυσκολεύει την εξαγωγή ενός προφίλ κατανάλωσης που να τους χαρακτηρίζει. Εμφανίστηκαν,επίσης, καταναλωτές με πολλά ευδιάκριτα προφίλ κατά τη διάρκεια του χρόνου, όπως ο καταναλωτής 12, τα οποία απεικονίστηκαν σε διαφορετικά clusters. Μπορούμε, μέσω της διαδικασίας,να μελετήσουμε τις ώρες μέγιστου φορτίου κάθε καταναλωτή (κατανάλωση κατά τη διάρκεια της ημέρας ή της νύχτας), αλλά και την πορεία της κατανάλωσης κατά τη διάρκεια της εβδομάδας (καθημερινές ή σαββατοκύριακα). Συμπεράναμε επίσης, ότι η εκτέλεση της συσταδοποίησης έχει τη δυνατότητα να απομονώνει τις ιδιαίτερες περιπτώσεις κατανάλωσης, όπως τις μηδενικές (καταναλωτής 42) αλλά και κάποιες ημέρες που δεν αντιστοιχούν στο γενικό προφίλ και τη συμπεριφορά του καταναλωτή, όπως στην περίπτωση του καταναλωτή 19. Αυτή η δυνατότητα του clustering, μας βοηθά στο να διακρίνουμε αυτές τις ιδιαιτερότητες και να κρίνουμε εάν είναι σημαντικές για τον χαρακτηρισμό του προφίλ του κάθε καταναλωτή, ή αν αποτελούν εξαιρέσεις, άρα και να απομακρυνθούν από το σύνολο των ημερήσιων χρονικών καμπυλών, έτσι ώστε να μην επηρεάζουν τη διαδικασία.

55 Σ ε λ ί δ α 54 ΚΕΦΑΛΑΙΟ 3 ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕΣΩ ΑΝΤΙΠΡΟΣΩΠΕΥΤΙΚΩΝ ΚΑΜΠΥΛΩΝ 3.1 ΕΙΣΑΓΩΓΗ Αρχικός στόχος του δεύτερου σταδίου συσταδοποίησης, είναι η απομόνωση αντιπροσωπευτικών καμπυλών του κάθε καταναλωτή, που περιγράφουν τη γενική ηλεκτρική συμπεριφορά του. Οι αντιπροσωπευτικές καμπύλες προήλθαν από την επεξεργασία των αποτελεσμάτων του 1 ου σταδίου. Ο μετέπειτα στόχος είναι ο διαχωρισμός των αντιπροσωπευτικών καμπυλών σε ομάδες-συστάδες, όπου η κάθε ομάδα θα εκπροσωπεί ένα είδος ηλεκτρικής συμπεριφοράς καταναλωτών. Άρα η κάθε ομάδα θα περιέχει ημερήσιες καμπύλες φορτίου, όπου η κάθε μία θα περιγράφει και θα αντιπροσωπεύει κάποιο ηλεκτρικό προφίλ κατανάλωσης. Πρέπει να αναφέρουμε ότι στο κεφάλαιο αυτό έγινε χρήση και της κανονικοποίησης μέσης τιμής και σύγκριση των αποτελεσμάτων των δύο κανονικοποιήσεων που χρησιμοποιήθηκαν. 3.2 ΚΡΙΤΗΡΙΑ ΕΞΑΓΩΓΗΣ ΑΝΤΙΠΡΟΣΩΠΕΥΤΙΚΩΝ ΚΑΜΠΥΛΩΝ Σε αυτό το στάδιο συσταδοποίησης θα χρησιμοποιηθεί επίσης ο αλγόριθμος k-means, με τη διαφορά, ότι οι είσοδοι του δε θα είναι οι 365 ημερήσιες χρονικές καμπύλες φορτίου του κάθε καταναλωτή, αλλά ούτε θα εκτελεστεί 150 φορές όπως στο προηγούμενο στάδιο. Στο στάδιο αυτό ως είσοδοι θα χρησιμοποιηθούν 150

56 Σ ε λ ί δ α 55 καμπύλες, μία για κάθε καταναλωτή, και ο αλγόριθμος θα εκτελεστεί, τόσες φορές όσες χρειαστεί για την εύρεση της βέλτιστης συσταδοποίησης. Αυτό που αποτέλεσε αντικείμενο ενδιαφέροντος είναι ποιες καμπύλες θα ορισθούν ως είσοδοι του αλγορίθμου, δηλαδή ποιες είναι οι καμπύλες που θα αντιπροσωπεύσουν την ηλεκτρική συμπεριφορά του κάθε καταναλωτή, έτσι ώστε με βάση αυτή να κατηγοριοποιηθούν και να χωριστούν σε συστάδες. Λόγω των αρκετά διαφορετικών ημερών κατανάλωσης που υπάρχουν στο δείγμα μας, η απομόνωση των αντιπροσωπευτικών καμπυλών, θα πρέπει να γίνει βάσει κριτηρίων, τα οποία επιλέγονται κάθε φορά αναλόγως με το αντικείμενο της μελέτης και τις ανάγκες αυτής. Για την εύρεση, λοιπόν, της αντιπροσωπευτικής καμπύλης χρησιμοποιήθηκαν 4 διαφορετικά κριτήρια, έτσι ώστε να καλύπτουμε και τις περιπτώσεις όπου στο δείγμα μας υπάρχουν μέρες με ιδιαιτερότητες ως προς το φορτίο, δηλαδή ημέρες με μηδενική κατανάλωση ή ημέρες που δεν αντικατοπτρίζουν το γενικό προφίλ ενός καταναλωτή και γενικά να καλύψουμε διαφορετικές χρήσεις της μεθόδου. Τα κριτήρια που χρησιμοποιήθηκαν για την εύρεση των αντιπροσωπευτικών καμπυλών είναι τα εξής: Κριτήριο πολυπληθέστερης συστάδας. Σε αυτή την περίπτωση επιλέχθηκε ως αντιπροσωπευτική η καμπύλη (centroid) που αντιστοιχεί στη συστάδα η οποία περιέχει το μεγαλύτερο αριθμό ημερών. Πρόκειται για το απλούστερο σκεπτικό ότι δηλαδή η αντιπροσωπευτική καμπύλη είναι αυτή που εμφανίζεται συχνότερα. Κριτήριο μέγιστης ισχύος. Ως αντιπροσωπευτική καμπύλη επιλέγεται το κέντρο της συστάδας, το οποίο μετά από σύγκριση με τα υπόλοιπα κέντρα των clusters εμφανίζει τη μέγιστη στιγμιαία ισχύ. Το κριτήριο αυτό δοκιμάστηκε καθώς ως πολυπληθέστερη συστάδα εμφανιζόταν συχνά η περίπτωση της μηδενικής κατανάλωσης. Οι μηδενικές αυτές καμπύλες δεν έχουν μεγάλη βαρύτητα και δεν μας ενδιαφέρουν ιδίως όταν η συσταδοποίηση γίνεται με σκοπό την τιμολόγηση του καταναλωτή. Επιπλέον, το κριτήριο μέγιστης ισχύος μας ενδιαφέρει καθώς παρέχει πληροφορίες για την αιχμή φορτίου, κάτι που είναι σημαντικό για κάθε εταιρεία παροχής ηλεκτρικής ενέργειας. Κριτήριο μέγιστης ενέργειας. Ως αντιπροσωπευτική καμπύλη επιλέγεται το κέντρο της συστάδας, με τη μεγαλύτερη συνολική ενέργεια (ημερήσια κατανάλωση), δηλαδή η καμπύλη με το μέγιστο εμβαδόν. Το σκεπτικό της εφαρμογής αυτού του κριτηρίου είναι ανάλογο με το κριτήριο μέγιστης ισχύος, αλλά έχει το πλεονέκτημα ότι δεν είναι τόσο περιστασιακό. Στις περισσότερες περιπτώσεις αναμένουμε ότι το κριτήριο αυτό δίνει περίπου το ίδιο αποτέλεσμα με το παραπάνω κριτήριο (της μέγιστης ισχύος). Κριτήριο συνολικής ενέργειας. Σε αυτό το κριτήριο, αρχικά βρίσκουμε τις ενέργειες κάθε κέντρου των clusters. Οι ενέργειες αυτές, έπειτα, πολλαπλασιάζονται με τον αριθμό των ημερήσιων καμπυλών που περιέχονται στο αντίστοιχο cluster και ως αντιπροσωπευτική καμπύλη επιλέγεται το cluster με το μεγαλύτερο γινόμενο. Το κριτήριο αυτό

57 Σ ε λ ί δ α 56 αναμένεται να συνδυάσει τα πλεονεκτήματα των παραπάνω κριτηρίων (πολυπληθέστερου και μέγιστης ενέργειας). Μέση Ημερήσια Καμπύλη: Παραλείπεται η συσταδοποίηση του 1 ου Σταδίου. Ως αντιπροσωπευτική καμπύλη του καταναλωτή επιλέγεται η «μέση ημερήσια καμπύλη» του καταναλωτή. Δηλαδή, για κάθε ώρα του 24ώρου βρίσκεται η μέση τιμή φορτίου και έτσι δημιουργείται μία νέα καμπύλη. Τα παραπάνω 5 κριτήρια εφαρμόστηκαν στο τέλος του 1 ου Σταδίου με σκοπό να επιλεγεί η αντιπροσωπευτική καμπύλη κάθε καταναλωτή που θα συμμετάσχει στη συσταδοποίηση του 2 ου Σταδίου. Η αποτελεσματικότητα του κάθε κριτηρίου θα αξιολογηθεί στο τέλος του επόμενου σταδίου. 3.3 ΣΧΕΔΙΑΣΗ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ Για την εκτέλεση της συσταδοποίησης των αντιπροσωπευτικών καμπυλών του κάθε καταναλωτή έγινε και πάλι, όπως προαναφέρθηκε, χρήση του αλγόριθμου k-means στο λογισμικό Matlab. Χρησιμοποιήθηκαν και εδώ ως είσοδοι του αλγορίθμου δύο πίνακες, εκ των οποίων ο πρώτος ήταν απαραίτητος για την απαρίθμηση των 24 ωρών και ο άλλος για την απαρίθμηση των 150 ημερησίων καμπυλών, οι οποίες θα ομαδοποιήθηκαν. Οι 150 αυτές καμπύλες, επιλέχθηκαν μέσω λογισμικού. Ο κάθε κώδικας, ήταν προσαρμοσμένος στις απαιτήσεις του κάθε κριτήριου αντιπροσωπευτικών καμπυλών. Δηλαδή έγινε ο εντοπισμός του cluster που εξυπηρετεί κάθε φορά ένα από τα τέσσερα πρώτα κριτήρια, και απομονώθηκε η ζητούμενη καμπύλη. Έτσι τα κέντρα συλλέχθηκαν σε αρχεία.txt (συνολικά 4 αρχεία), όπου το κάθε αρχείο περιείχε συγκεντρωμένες τις 150 καμπύλες. Και σε αυτή την περίπτωση ως αριθμός επαναλήψεων της εκτέλεσης του αλγορίθμου (replicates), ορίσθηκε ο αριθμός 30, μίας και μας έδινε το βέλτιστο clustering με το μικρότερο αριθμό επαναλήψεων. Τα αρχεία που χρησιμοποιήθηκαν ως είσοδοι του αλγορίθμου k-means και περιληπτικά ο αλγόριθμος, οι είσοδοι,οι έξοδοι και οι παράμετροί του παρουσιάζονται στον παρακάτω πίνακα.

58 Σ ε λ ί δ α 57 ΕΙΣΟΔΟΣ Pinakas 1 // αρχείο Excel για τον ορισμό των τιμών του x άξονα (24 ώρες) Pinakas 2 // αρχείο Excel για τον ορισμό των τιμών του άξονα y (150 κέντρα) Pinakas 3 // αρχείο.txt με συγκεντρωμένα τα κέντρα του πρώτου σταδίου, που πληρούν το εκάστοτε εφαρμοζόμενο κριτήριο ΕΚΤΕΛΕΣΗ K-means Clusters = α // ο αριθμός των επιθυμητών clusters Distance= Euclidean // ορισμός του Ευκλείδειου σφάλματος ως μέτρο απόκλισης Replicates= 30 // αριθμός των επιθυμητών επαναλήψεων για την εύρεση του βέλτιστου clustering ΕΞΟΔΟΣ Clusters // αρχείο.txt στο οποίο αναγράφεται ποια κέντρα (ή ποιος καταναλωτής) ανήκουν στο κάθε cluster Centers // αρχείο.txt στο οποίο αναγράφονται τα νέα κέντρα του clustering 2 ου σταδίου Plot // έξοδος της απεικόνισης των διαγραμμάτων του clustering με ορίσματα τους Pinakas 1, Pinakas 2, Pinakas 3 Πίνακας 3.1: Περιγραφή του αλγορίθμου k-means, που χρησιμοποιήθηκε για το 2 ο στάδιο συσταδοποίησης. 3.4 ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ Η συσταδοποίηση βασίστηκε αρχικά στο clustering του πρώτου σταδίου με 10 clusters, το οποίο πραγματοποιήθηκε για όλους τους καταναλωτές. Επίσης, χρησιμοποιήθηκε το clustering 1 ου σταδίου με 5 συστάδες, λόγω της ομοιογένειας ως προς τον αριθμό των clusters, αλλά και λόγω του ότι στο 2 ο στάδιο γίνεται η εύρεση καμπυλών που χαρακτηρίζουν το προφίλ και την ηλεκτρική συμπεριφορά ενός καταναλωτή και η μείωση του αριθμού μπορεί να μας οδηγήσει σε πιο συμπυκνωμένες και περιγραφικές πληροφορίες. Αυτός ήταν και ο λόγος για τον οποίο απορρίφθηκε η ιδέα της χρήσης της μεθόδου των διαφορετικών αριθμών συστάδων για κάθε καταναλωτή, που μας οδήγησε στη βελτιστοποίηση του δείκτη αξιολόγησης, δηλαδή του Ευκλείδειου σφάλματος. Για πολύ μεγάλο αριθμό clusters δεν είμαστε σε θέση να πούμε με σιγουριά, ότι ένα κέντρο αποτελεί αντιπροσωπευτική περιγραφή της συμπεριφοράς ενός καταναλωτή, διότι τα χαρακτηριστικά μίας τέτοιας καμπύλης εκπροσωπούν ένα πολύ μικρό δείγμα καμπυλών. Φυσικά και σε αυτή τη συσταδοποίηση έγινε έλεγχος του Ευκλείδειου σφάλματος, για την υλοποίηση του καλύτερου διαχωρισμού μεταξύ των διαφορετικών προφίλ. Έτσι, για κάθε κριτήριο επιλέχθηκε ένας αριθμός συστάδων, με τον οποίο θα έχουμε μία καθαρή απεικόνιση των διαφορετικών ηλεκτρικών συμπεριφορών που αναζητούμε.

59 Euclidean error Euclidean error Σ ε λ ί δ α ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΚΑΙ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΔΕΙΚΤΗ ΑΞΙΟΛΟΓΗΣΗΣ (ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΓΙΣΤΗΣ ΤΙΜΗΣ) Αρχικά, για την εκτέλεση της συσταδοποίησης, έγιναν δοκιμές στο Matlab για την εύρεση του κατάλληλου αριθμού clusters που θα οδηγούσαν στη δημιουργία μίας συσταδοποίησης με το βέλτιστο δείκτη αξιολόγησης- Ευκλείδειο σφάλμα. Οι δοκιμές έγιναν για 2 έως και 60 συστάδες και για τα 4 κριτήρια, και για το κάθε ένα εφαρμόστηκε η κατάλληλη συσταδοποίηση στις αντιπροσωπευτικές καμπύλες. Αρχικά οι τιμές των Ευκλείδειων σφαλμάτων συναρτήσει του αριθμού των συστάδων, παρουσιάζονται στα παρακάτω διαγράμματα και για τις 4 περιπτώσεις κριτηρίων, για 5 και 10 clusters 1 ου σταδίου. 120 Ευκλείδειο σφάλμα ΠΟΛΥΠΛΗΘΕΣΤΕΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Αριθμός clusters Διάγραμμα 3.1: Ευκλείδειο σφάλμα συναρτήσει του αριθμού των clusters για τα 4 κριτήρια αντιπροσωπευτικών καμπυλών. Τα κριτήρια εφαρμόστηκαν στη συσταδοποίηση 1 ου σταδίου με 5 clusters Ευκλείδειο σφάλμα Αριθμός clusters ΠΟΛΥΠΛΗΘΕΣΤΕΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Διάγραμμα 3.2: Ευκλείδειο σφάλμα συναρτήσει του αριθμού των clusters για τα κριτήρια αντιπροσωπευτικών καμπυλών. Το κριτήριο εφαρμόστηκε στη συσταδοποίηση 1 ου σταδίου με 10 clusters.

60 Σ ε λ ί δ α 59 Από τα πάνω διαγράμματα μπορούμε να συμπεράνουμε ότι ο αριθμός clusters που χρειάζεται η συσταδοποίηση με βάση τα 5 clusters 1 ου σταδίου συμπίπτει με τον αριθμό που χρειάζεται η βασισμένη στα 10 clusters. Για παράδειγμα, στη συσταδοποίηση με κριτήριο το κέντρο της πολυπληθούς συστάδας χρειαζόμαστε 15 clusters και στις δύο περιπτώσεις για μία αποτελεσματική επεικόνιση. Το ίδιο ισχύει και για τα άλλα τρία κριτήρια, με τη διαφορά ότι ο κατάλληλος αριθμός συστάδων είναι μεγαλύτερος. Τα Ευκλείδεια Σφάλματα των 4 καμπυλών στα Διαγράμματα δεν είναι άμεσα συγκρίσιμα καθώς οι αντίστοιχες καμπύλες στις οποίες έγινε το clustering δεν είναι οι ίδιες. Άρα η αξιολόγηση των 4 κριτηρίων δεν μπορεί να γίνει μέσω του Ευκλειδείου Σφάλματος και θα πραγματοποιηθεί στη συνέχεια με άλλο τρόπο. Παρακάτω, παρουσιάζονται οι απεικονίσεις των συσταδοποιήσεων, με βάση τα 4 κριτήρια, για διαφορετικό αριθμό συστάδων σε κάθε περίπτωση (συνήθως 15 ή 30). Euclidean error=22.68 Εικόνα 3.1: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο της πολυπληθέστερης συστάδας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 15. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters.

61 Σ ε λ ί δ α 60 Euclidean error=19.11 Εικόνα 3.2: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο της πολυπληθέστερης συστάδας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 15. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 10 clusters.

62 Σ ε λ ί δ α 61 Euclidean error=22.4 Εικόνα 3.3: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο μέγιστης ισχύος. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters.

63 Σ ε λ ί δ α 62 Euclidean error=21.94 Εικόνα 3.4: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο μέγιστης ισχύος. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 10 clusters.

64 Σ ε λ ί δ α 63 Euclidean error=20.36 Εικόνα 3.5: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο μέγιστης ενέργειας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters.

65 Σ ε λ ί δ α 64 Euclidean error=28.68 Εικόνα 3.6: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο μέγιστης ενέργειας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 10 clusters.

66 Σ ε λ ί δ α 65 Euclidean error=18.19 Εικόνα 3.7: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο συνολικής ενέργειας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters.

67 Σ ε λ ί δ α 66 Euclidean error=18.5 Εικόνα 3.8: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο συνολικής ενέργειας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 10 clusters. Από την παραπάνω τοποθέτηση των αντιπροσωπευτικών καμπυλών σε ομάδες, μπορούμε να διακρίνουμε κάποια αντιπροσωπευτικά προφίλ κατανάλωσης και κάποιες συμπεριφορές ως προς τη ζήτηση φορτίου. Το κάθε κριτήριο που θα επιλεχθεί εξαρτάται από τις ανάγκες της εκάστοτε μελέτης. Από την δική μας μελέτη, παρατηρήθηκε ότι το κριτήριο πολυπληθέστερης συστάδας χρειάζεται το μικρότερο αριθμό συστάδων, ενώ τα άλλα δύο κριτήρια χρειάστηκαν μεγαλύτερο αριθμό. Επίσης το κριτήριο πολυπληθέστερης συστάδας και το κριτήριο συνολικής ενέργειας μας οδήγησε στην απόσπαση πιο ομαλών κέντρων και αρκετά πιο αναμενόμενων για τον χαρακτηρισμό των καταναλωτών. Αντιθέτως, τα άλλα δύο κριτήρια παρουσιάζουν αρκετές διαφορετικές περιπτώσεις

68 Σ ε λ ί δ α 67 προφίλ, με ιδιαίτερες καμπύλες κατανάλωσης, εξαιρώντας όμως τις περιπτώσεις μηδενικής κατανάλωσης. Παρατηρήθηκε επίσης, ότι οι συσταδοποιήσεις στην περίπτωση του πρώτου σταδίου με 5 συστάδες παρουσιάζουν κοντινές τιμές σφάλματος με τις συσταδοποιήσεις που πραγματοποιήθηκαν στο πρώτο στάδιο αλλά με 10 clusters. Μπορούμε να πούμε ότι στο στάδιο της εύρεσης αντιπροσωπευτικής καμπύλης, η εξοικονόμηση clusters δεν οδήγησε σε πολύ διαφορετικά αποτελέσματα και πιο συγκεκριμένα στην περίπτωση του κριτηρίου μέγιστης ενέργειας οδήγησε σε καλύτερη συσταδοποίηση ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ 2 ΟΥ ΣΤΑΔΙΟΥ ΜΕ ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΣΗΣ ΤΙΜΗΣ Μετά την ολοκλήρωση της συσταδοποίησης 2 ου σταδίου των κανονικοποιημένων ημερησίων καμπυλών με βάση τη μέγιστη τιμή, πραγματοποιήθηκε το ίδιο στάδιο άλλα με κανονικοποίηση μέσης τιμής. Στην περίπτωση αυτή, τα επιλεγμένα κέντρα με βάση τα 5 κριτήρια, που προαναφέρθηκαν, παρέμειναν ίδια και η κανονικοποίηση μέσης τιμής δεν επέφερε αλλαγές στην επιλογή των αντιπροσωπευτικών καμπυλών. Το μόνο που άλλαξε ήταν το πλάτος των καμπυλών, οι οποίες ήταν συγκεντρωμένες γύρω από την τιμή 0.5 και το μέγιστο πλάτος τους μπορούσε να υπερβαίνει τη μονάδα. Με αυτόν τον τρόπο δε χρειάστηκε η επανάληψη του 1 ου σταδίου συσταδοποίησης και οι απαιτούμενες καμπύλες που συσταδοποιήθηκαν είχαν ήδη επιλεγεί. Ο λόγος, για τον οποίο έγινε αυτό το κομμάτι της μελέτης, είναι γιατί η μέση τιμή είναι πιο περιγραφική για έναν καταναλωτή σε σχέση με ένα περιστασιακό μέγιστο. Έτσι, υπάρχει και ομοιομορφία μεταξύ των καμπυλών αλλά και διατήρηση της πληροφορίας για το εάν η επιλεγμένη αντιπροσωπευτική καμπύλη κυμαίνεται κοντά στη τιμή της μέσης κατανάλωσης του κάθε καταναλωτή ή όχι. Δηλαδή εάν η επιλεγμένη καμπύλη αντιπροσωπεύει τη συνήθη ποσοτικά κατανάλωση φορτίου. Έτσι χρησιμοποιήθηκε ο παρακάτω τύπος: L=Κ *MAXVALUE /(2*AVEVALUE ) i i j j Όπου, i, αντιπροσωπεύει τις ώρες της ημέρας(1-24). Κ, είναι η τιμή του φορτίου κανονικοποιημένη με τη μέγιστη τιμή. L, είναι η τιμή του φορτίου κανονικοποιημένη με τη μέση τιμή. j, είναι η ο αριθμός του καταναλωτή (1-150). AVEVALUE, είναι η μέση τιμή για κάθε καταναλωτή. Η πορεία του 2 ου σταδίου με κανονικοποίηση μέσης τιμής είναι όμοια με το 2 ο στάδιο με κανονικοποίηση μέγιστης τιμής. Αρχικά έγινε βελτιστοποίηση του Ευκλείδειου σφάλματος και επιλογή του κατάλληλου αριθμού συστάδων για κάθε

69 Euclidean error Euclidean error Σ ε λ ί δ α 68 κριτήριο, για 5 και 10 συστάδες 1 ου σταδίου. Έπειτα έγινε απεικόνιση των αποτελεσμάτων. Η βελτιστοποίηση του Ευκλείδειου σφάλματος οδήγησε σε αποτελέσματα της μορφής των διαγραμμάτων 3.1 και Ευκλείδειο σφάλμα ΠΟΛΥΠΛΗΘΕΣΤΕΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Αριθμός clusters Διάγραμμα 3.3: Ευκλείδειο σφάλμα συναρτήσει του αριθμού των clusters για τα κριτήρια αντιπροσωπευτικών καμπυλών. Το κριτήριο εφαρμόστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters. 600 Ευκλείδειο σφάλμα ΠΟΛΥΠΛΗΘΕΣΤΕΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Αριθμός clusters Διάγραμμα 3.4: Ευκλείδειο σφάλμα συναρτήσει του αριθμού των clusters για τα κριτήρια αντιπροσωπευτικών καμπυλών. Το κριτήριο εφαρμόστηκε στη συσταδοποίηση 1 ου σταδίου με 10 clusters.

70 Σ ε λ ί δ α 69 Τα Ευκλείδεια Σφάλματα των 4 καμπυλών στα Διαγράμματα δεν είναι και πάλι άμεσα συγκρίσιμα καθώς οι αντίστοιχες καμπύλες στις οποίες έγινε το clustering δεν είναι οι ίδιες. Ουσιαστικά το σφάλμα είναι μεγαλύτερο στις καμπύλες Μέγιστης Ισχύος και Ενέργειας καθώς τα κεντροειδή που συμμετέχουν παρουσιάζουν μεγάλα και ποικίλα πλάτη και κατ επέκταση μεγάλες αποστάσεις από τις μέσες τιμές. Άρα η αξιολόγηση των 4 κριτηρίων δεν μπορεί να γίνει μέσω του Ευκλειδείου Σφάλματος και θα πραγματοποιηθεί στη συνέχεια με άλλο τρόπο. Ενδεικτικά, θα παρουσιάσουμε κάποια αποτελέσματα συσταδοποίησης 2 ου σταδίου. Euclidean error=30.7 Εικόνα 3.9: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο πολυπληθέστερης συστάδας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 15 Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters.

71 Σ ε λ ί δ α 70 Euclidean error=42.69 Εικόνα 3.10: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο μέγιστης ισχύος. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters. Euclidean error= Εικόνα 3.11: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο μέγιστης ενέργειας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters.

72 Σ ε λ ί δ α 71 Euclidean error=34.18 Εικόνα 3.12: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 καμπυλών, που διακρίθηκαν με το κριτήριο συνολικής ενέργειας. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 30. Βασίστηκε στη συσταδοποίηση 1 ου σταδίου με 5 clusters ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ 2 ΟΥ ΣΤΑΔΙΟΥ ΤΩΝ ΜΕΣΩΝ ΗΜΕΡΗΣΙΩΝ ΚΑΜΠΥΛΩΝ. Τέλος, εκτός από τα 4 κριτήρια εξαγωγής αντιπροσωπευτικών καμπυλών εξετάστηκε η επιλογή παράλειψης της συσταδοποίησης του 1 ου σταδίου. Αντ αυτού κάθε καταναλωτής εκπροσωπείται από τη μέση ημερήσια καμπύλη του και γίνεται απευθείας η συσταδοποίηση του 2 ου σταδίου. Οι τιμές της καμπύλης αυτής υπολογίζονται μέσω της παρακάτω σχέσης: Όπου, -AVE είναι η μέση τιμή για κάθε ώρα του 24ώρου. -i παίρνει τιμές από 1 έως 24. -load είναι το φορτίο της i-οστής ώρας. -j είναι ο αριθμός της ημέρας (από 1 έως n=365). Οι καμπύλες αυτές κανονικοποιήθηκαν με βάση τη μέγιστη τιμή αλλά και με βάση τη μέση τιμή. Όπως για όλα τα κριτήρια, έτσι και για αυτό έγιναν δοκιμές για τον βέλτιστο αριθμό συστάδων.

73 Euclidean error Σ ε λ ί δ α 72 Τα κριτήρια χάριν ευκολίας τα ονομάσαμε Aveloadmax και Aveloadave. Το πρώτο κριτήριο βρίσκει τη μέση καμπύλη με κανονικοποίηση μέγιστης τιμής, ενώ το δεύτερο τη μέση καμπύλη αλλά με κανονικοποίηση μέσης τιμής. 60 Ευκλείδειο σφάλμα AVELOADMAX AVELOADAVE Αριθμός clusters Διάγραμμα 3.5: Ευκλείδειο σφάλμα συναρτήσει του αριθμού των clusters για την εκτέλεση συσταδοποίησης των μέσων ημερήσιων καμπυλών. Από το παραπάνω διάγραμμα μπορούμε να συμπεράνουμε ότι το Ευκλείδειο σφάλμα είναι πιο μικρό από όλες τις άλλες περιπτώσεις κριτηρίων που μελετήσαμε. Αυτό το αποτέλεσμα ήταν κάπως αναμενόμενο, λόγω του ότι η μέση κατανάλωση μπορεί να θεωρηθεί χαρακτηριστική για τον κάθε καταναλωτή και συνήθως έχει μία μορφή παρόμοια με τα πιό συνηθισμένα και αναμενόμενα προφίλ κατανάλωσης. Τα προφίλ αυτά μπορεί να ανήκουν στις περιπτώσεις που περιγράψαμε στο 2 ο κεφάλαιο, κατά τη μελέτη των καταναλωτών. Δηλαδή, μπορεί να παρουσιάστηκαν ομάδες με χαρακτηριστικό την κατανάλωση κατά τη διάρκεια της ημέρας, την κατανάλωση κατά τη διάρκεια της νύχτας, την ομαλή κατανάλωση κ.ο.κ. Έτσι, υπάρει μία σχετική ομοιομορφία των καμπυλών και μπορούν να χωριστούν σε ομάδες χωρίς να παρουσιάζουν μεταξύ τους μεγάλες μορφολογικές διαφορές, αλλά μόνο διαφορές ως προς το πλάτος τους. Επίσης, το ευκλείδειο σφάλμα στην περίπτωση της κανονικοποίησης μέσης τιμής είναι λίγο μεγαλύτερο για όλους τους αριθμούς συστάδων. Παρ όλα και για τα δύο είδη κανονικοποιήσεων ο κατάλληλος συνδυασμός μικρού ευκλείδειου σφάλματος και μικρού αριθμού συστάδων πραγματοποιείται για 20 clusters. Έτσι, παρουσιάζονται οι απεικονίσεις των συσταδοποιήσεων.

74 Σ ε λ ί δ α 73 Euclidean error=10.92 Εικόνα 3.13: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 μέσων ημερήσιων καμπυλών. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 20. Οι καμπύλες είναι κανονικοποιημένες με τη μέγιστη τιμή. Euclidean error=12.23 Εικόνα 3.14: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 μέσων ημερήσιων καμπυλών. Ως κατάλληλος αριθμός συστάδων ορίσθηκε το 20. Οι καμπύλες είναι κανονικοποιημένες με τη μέση τιμή.

75 Σ ε λ ί δ α 74 ΚΕΦΑΛΑΙΟ 4 ΑΞΙΟΛΟΓΗΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΜΕ ΕΞΩΤΕΡΙΚΑ ΚΡΙΤΗΡΙΑ 4.1 ΕΙΣΑΓΩΓΗ Έχοντας ολοκληρώσει τα προηγούμενα στάδια του clustering, μπορέσαμε να διακρίνουμε την ηλεκτρική συμπεριφορά κάθε καταναλωτή και τα διαφορετικά είδη αυτών. Αυτά τα αποτελέσματα θα αξιολογηθούν στο κεφάλαιο αυτό ως προς τη δυνατότητα αντιστοίχισης της κάθε συστάδας σε ένα κοινό κόστος κατανάλωσης ισχύος. Δηλαδή θα γίνει προσπάθεια αξιοποίησης των παραπάνω σταδίων για την εύρεση οικονομικών κατηγοριών στο δείγμα μας. 4.2 ΕΥΡΕΣΗ ΚΟΣΤΟΥΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΓΕΙΑΣ ΓΙΑ ΚΑΤΑΝΑΛΩΤΕΣ Οι τιμές της ηλεκτρικής ενέργειας διαφέρουν μεταξύ των χωρών, ακόμα και μεταξύ των περιοχών που ανήκουν στην ίδια χώρα. Ακόμα υπάρχει διαφορετικό κοστολόγιο για τα διαφορετικά είδη των καταναλωτών, δηλαδή τους οικιακούς, τους εμπορικούς και τέλος τους βιομηχανικούς. Οι τιμές για κάθε μία κατηγορία πελατών ηλεκτρικής ενέργειας μπορεί να διαφέρει ανάλογα με την ώρα της ημέρας ή και την ημέρα του χρόνου. Δηλαδή, οι τιμές μπορεί να διαφέρουν ακόμη και μεταξύ των περιόδων χαμηλής και υψηλής ζήτησης ηλεκτρικού φορτίου και μέσω μετρητών να γίνεται η κατάλληλη κοστολόγηση. Στη μελέτη μας λοιπόν, χρησιμοποιήθηκε η οριακή τιμή του συστήματος, και είναι η τιμή που εισπράττουν όλοι όσοι εγχέουν ενέργεια στο σύστημα και πληρώνουν όλοι όσοι ζητούν ενέργεια από αυτό. Συγκεκριμένα, η οριακή τιμή του συστήματος διαμορφώνεται από τον συνδυασμό των προσφορών τιμών και ποσοτήτων που υποβάλλουν κάθε μέρα οι διαθέσιμες μονάδες παραγωγής ηλεκτρικής ενέργειας, και του ωριαίου φορτίου ζήτησης ηλεκτρικής ενέργειας, που διαμορφώνεται σε καθημερινή βάση από τους καταναλωτές. Μπορεί να αναφερθεί ότι οι μονάδες παραγωγής κατατάσσονται αναλόγως των προσφορών τους σε

76 Σ ε λ ί δ α 75 αύξουσα σειρά, ξεκινώντας από την χαμηλότερη προσφερόμενη τιμή για ορισμένη ποσότητα ενέργειας και καταλήγοντας στην υψηλότερη προσφερόμενη τιμή. Στο σημείο όπου, οι προσφερόμενες ποσότητες ενέργειας εξυπηρετούν το ζητούμενο φορτίο, καθορίζεται και η οριακή τιμή του συστήματος. Στην ουσία, η οριακή τιμή του συστήματος συμπίπτει με την προσφορά της τελευταίας μονάδας που πρέπει να λειτουργήσει για να καλυφθεί η ζήτηση. Λογικά, η οριακή τιμή είναι χαμηλή (ενίοτε μηδενική) τις νυχτερινές ώρες χαμηλού φορτίου και μεγιστοποιείται τις ώρες μεγάλης ζήτησης. Γενικά, πρόκειται για μια στοχαστική χρονοσειρά που εξαρτάται από πολλούς αστάθμητους παράγοντες (πχ περιεχόμενο των αποταμιευτήρων, διαθεσιμότητα μεγάλων μονάδων, απεργίες της ΔΕΗ, παραγωγή των ΑΠΕ, στρατηγικές προσφορών των εταιρειών κλπ). Στην Εικόνα 5.1 φαίνεται μια συσταδοποίηση των 365 καμπυλών οριακής τιμής για ένα έτος (2010) με σκοπό να αναδειχτούν οι χαρακτηριστικές μορφές των καμπυλών και η συχνότητα εμφάνισής τους. Εικόνα 4.1: Απεικόνιση του αποτελέσματος συσταδοποίησης των οριακών τιμών του συστήματος.

77 Σ ε λ ί δ α 76 Έτσι το κόστος του λιανοπωλητή, για κάθε καταναλωτή δίνεται από τη σχέση: Όπου, n I rj( t) d j( t) j 1 -j είναι ο αριθμός των ωρών για τη διάρκεια ενός έτους -n είναι ο αριθμός 365*24=8760 ώρες - r j () t είναι η τιμή της ηλεκτρικής ενέργειας κατά τη διάρκεια της περιόδου j σε /MWh - d j () t είναι η ηλεκτρική ενέργεια που καταναλώθηκε κατά τη διάρκεια του χρονικού διαστήματος j σε MWh Έτσι το κόστος υπολογίζεται από το γινόμενο της τιμής πώλησης ανά MWh κατά τη διάρκεια κάθε περιόδου επί την κατανάλωση σε MWh. Στη μελέτη μας θεωρούμε ότι ένας προμηθευτής που αγοράζει στην οριακή τιμή, παρέχει ηλεκτρική ενέργεια στην ομάδα των καταναλωτών μας και προβληματίζεται για τον αριθμό και τύπο των τιμολογίων που θα ορίσει και για το πώς θα κατατάξει κάθε καταναλωτή σε συγκεκριμένο τιμολόγιο. Θεωρούμε ότι από την συνέλιξη της χρονοσειράς της οριακής τιμής και της χρονοσειράς κάθε καταναλωτή προκύπτει μια συγκεριμένη τιμή μέσου ενεργειακού κόστους για κάθε καταναλωτή. Αυτή η τιμή είναι πολύ σημαντική και θα τη θεωρήσουμε ως σημείο αναφοράς για τον προσδιορισμό ενός δίκαιου τιμολογίου για κάθε καταναλωτή. Θα ορίσουμε,λοιπόν, το Μέσο Ετήσιο Κόστος (ΜΕΚ) του λιανοπωλητή για κάθε καταναλωτή j, ως εξής: AVECOST j 8760 i i όπου, - i είναι η τιμή αγοράς της ηλεκτρικής ενέργειας από την αγορά σε /MWh - Pij είναι το φορτίο του καταναλωτή j κατά τη διάρκεια της περιόδου i. - i είναι η εξεταζόμενη περίοδος. Στη περίπτωσή μας είναι το σύνολο των ωρών κατά την διάρκεια του έτους ( = 8760 ώρες). - j είναι ο αριθμός του καταναλωτή j 1 ap P ij ij

78 Avecost (Euros/MWh) Σ ε λ ί δ α 77 Έτσι, για τον κάθε καταναλωτή, με την εφαρμογή του παραπάνω τύπου και για τους 150 καταναλωτές, προέκυψαν τα παρακάτω αποτελέσματα: 52 Μέσο ετήσιο κόστος αριθμός καταναλωτή Διάγραμμα 4.1: Μέσο ετήσιο κόστος κάθε καταναλωτή. Από το παραπάνω διάγραμμα μπορούμε να διακρίνουμε σε ποιες περιοχές τιμών κινούνται τα μέσα ετήσια κόστη. Οι περιοχές τιμών βρίσκονται στο διάστημα μεταξύ 42 και 51 /ΜWh. Άρα μπορούμε να διακρίνουμε και να χαρακτηρίσουμε τους ακριβούς καταναλωτές και αντίστοιχα τους φθηνούς. Παρακάτω βλέπουμε τις δύο ακραίες περιπτώσεις μέσων ετήσιων κοστών. Εικόνα 4.2: Απεικόνιση του αποτελέσματος συσταδοποίησης 1 ου σταδίου των ημερήσιων καμπυλών για τον καταναλωτή με το μικρότερο μέσο ετήσιο κόστος.

79 Σ ε λ ί δ α 78 Εικόνα 4.3: Απεικόνιση του αποτελέσματος συσταδοποίησης 1 ου σταδίου των ημερήσιων καμπυλών για τον καταναλωτή με το μεγαλύτερο μέσο ετήσιο κόστος. Από τις παραπάνω εικόνες μπορούμε να πούμε ότι ο φθηνός καταναλωτής καταναλώνει περισσότερο κατά τη διάρκεια της νύχτας και λίγο την ημέρα, ενώ ο ακριβός χρησιμοποιεί ελάχιστη ισχύ τις νυχτερινές ώρες σε αντίθεση με τις ώρες τις ημέρας. Κάτι τέτοιο ήταν αναμενόμενο λόγω του ότι η τιμή της ΜWh είναι χαμηλότερη κατά τη διάρκεια της νύχτας. Βέβαια δε μπορούμε να αμελήσουμε, το γεγονός ότι,εκτός από τις ώρες κατανάλωσης,σημαντικός παράγοντας στη διαμόρφωση τιμής είναι και οι ημέρες του έτους κατά τις οποίες γίνεται κατανάλωση. Έπειτα από την εύρεση των μέσων ετήσιων κοστών των καταναλωτών και για και την εξέλιξη της μελέτης θα χρησιμοποιηθεί ο ορισμό της διασποράς: Διασπορά ή διακύμανση μίας μεταβλητής X ( συμβολίζεται με Var[x]) δηλώνει πόσο συγκεντρωμένες γύρω από τη μέση τιμή είναι οι τιμές της μεταβλητής. Στη δική μας περίπτωση η μέση τιμή των μέσων ετήσιων κοστών του κάθε cluster ορίζεται ως εξής: Ave cost k 1 Ave costcluster i N N k Όπου, -AvecostCluster είναι η μέση τιμή των Avecost των καταναλωτών που οι αντιπροσωπευτικές τους καμπύλες περιέχονται στο cluster i -Ν είναι ο αριθμός των αντιπροσωπευτικών καμπυλών που περιέχονται στο i cluster

80 Σ ε λ ί δ α 79 - Ave cos t είναι το μέσο κόστος που εκφράζει η καμπύλη k του i cluster k Με βάση τον παραπάνω τύπο, ορίζεται τελικώς ο τύπος της διασποράς των μέσων ετήσιων κοστών. Όπου, k 2 var [ Ave cos t] Ave cos t Ave cos tcluster i j i j 1 -var[avecost] είναι το άθροισμα των αποστάσεων του κάθε Avecost του i cluster από τη μέση τιμή αυτού -k είναι ο συνολικός αριθμός των Avecost που αντιστοιχούν στις αντιπροσωπευτικές καμπύλες του i cluster Για να υπολογίσουμε συνολικά τη διασπορά όλης της συσταδοποίησης, θα πρέπει να αθροίσουμε τις διασπορές όλων των clusters. Άρα τελικά var total[ Ave cos t] var i[ Ave cos t] Ο λόγος, για τον οποίο έγινε αναφορά στους παραπάνω τύπους, είναι επειδή πραγματοποιήθηκε αξιολόγηση της καταλληλότητας συσταδοποίησης του προηγούμενου σταδίου ως προς τη δυνατότητα χρήσης της για σκοπούς τιμολόγησης. Η καταλληλότητα έχει να κάνει με το αν μπορούν αυτές οι ομάδες αντιπροσωπευτικών καμπυλών, που δημιουργήθηκαν, να μας οδηγήσουν σε ένα κοινό τιμολόγιο για κάθε ομάδα, όπως επίσης και με το αν ο διαχωρισμός των αντιπροσωπευτικών μπορεί να εκφράσει μία ομαδοποίηση καταναλωτών με παρόμοιο κόστος. Για το σκοπό αυτό βρέθηκαν τα μέσα ετήσια κόστη που αντιστοιχούν σε κάθε μία αντιπροσωπευτική καμπύλη. Έπειτα εξακριβώθηκε το ποιες καμπύλες υπάρχουν μέσα σε κάθε cluster και κατ επέκταση ποια τα μέσα κόστη που περιέχονται έμμεσα σε αυτό. Η μέση τιμή των avecost θεωρήθηκε ότι αποτελεί την τιμή τιμολόγησης (κόστος) για τον κάθε καταναλωτή που υπάρχει μέσα σε ένα cluster. Έτσι μέσω του αθροίσματος διασπορών προσπαθήσαμε για τις συσταδοποιήσεις του 2 ου σταδίου (των κανονικοποιημένων καμπυλών με τη μέγιστη και μέση τιμή) και για κάθε κριτήριο αντιπροσωπευτικών καμπυλών να υπολογίσουμε τις αποστάσεις των μέσων ετήσιων κοστών από το μέσο όρο τους. Η καταλληλότητα λοιπόν της μεθόδου αυτής θα κριθεί από το αν το άθροισμα των διασπορών είναι αρκετά μικρό ή όχι. Αρχικά, έγινε απευθείας διαχωρισμός των μέσων ετήσιων κοστών, μέσω συσταδοποίησης για διαφορετικούς αριθμούς συστάδων, των 150 καταναλωτών που υπολογίσθηκαν και απεικονίσθηκαν στα διαγράμματα 4.2, 4.3 και 4.4. Οι εικόνες που δημιουργήθηκαν παρουσιάζονται παρακάτω για διαφορετικούς αριθμούς clusters. Στην περίπτωση αυτής της συσταδοποίησης δεν έγινε εύρεση n i 1

81 Avecost ( /MWh) Avecost ( /MWh) Σ ε λ ί δ α 80 του βέλτιστου αριθμού συστάδων, λόγω του ότι τα μέσα ετήσια κόστη δεν έχουν μεγάλο εύρος τιμών και αποτελούν απλά σημειακά δεδομένα, πράγμα που εξάγει το συμπέρασμα ότι δεν περιέχουν την ποικιλία των τιμών μίας χρονικής καμπύλης ούτε εναλλαγές. 52 Μέσο ετήσιο κόστος αριθμός συστάδας Διάγραμμα 4.2: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 μέσων ετήσιων κοστών σε 5 συστάδες. 52 Μέσο ετήσιο κόστος Αριθμός συστάδας

82 Avecost( /MWh) Σ ε λ ί δ α 81 Διάγραμμα 4.3: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 μέσων ετήσιων κοστών σε 10 συστάδες. 52 Μέσο ετήσιο κόστος Αριθμός συστάδας Διάγραμμα 4.4: Απεικόνιση του αποτελέσματος συσταδοποίησης των 150 μέσων ετήσιων κοστών σε 20 συτάδες. Από τα παραπάνω διαγράμματα μπορούμε να διακρίνουμε ότι οι τιμές των μέσων ετήσιων κοστών για τους 150 καταναλωτές, όσο ο αριθμός των clusters αυξάνει, τόσο καλύτερα ομαδοποιούνται. Επίσης, το clustering αυτό θα αποτελέσει το πρότυπο για την αξιολόγηση του διαχωρισμού των καταναλωτών ανάλογα με το κόστος τους και με βάση το αντιπροσωπευτικό προφίλ τους, μιας και όπως είναι λογικό αποτελεί την «τέλεια» συσταδοποίηση του κόστους. Όπως αναλύθηκε, έπειτα από αυτό το διαχωρισμό και τη συσταδοποίηση των μέσων ετήσιων κοστών των καταναλωτών, θα αξιολογηθεί κατά πόσο η συσταδοποίηση του προηγούμενου σταδίου, μπορεί να είναι αποτελεσματική και να χρησιμοποιηθεί και ως προς το διαχωρισμό των καταναλωτών ανάλογα με το κόστος και να αποδοθεί σε αυτούς ένα κοινό ενεργειακό κόστος. Η δοκιμή έγινε για διάφορους αριθμούς clusters του 2 ου σταδίου συσταδοποίησης, και όχι για τον βέλτιστο αριθμό μόνο, μιας και στόχος μας είναι η σύγκριση των διαφορετικών κριτηρίων και μεθόδων για μικρούς και μεγάλους αριθμούς συστάδων αλλά και η εφαρμογή ενός μικρού εύρους τιμολογίων στους καταναλωτές. Στα επόμενα σχήματα παρουσιάζονται ενδεικτικά κάποια αποτελέσματα της αντιστοίχισης των χρονικών καμπυλών, που περιλαμβάνονταν σε κάθε cluster, με τα μέσα ετήσια κόστη, που πραγματοποιήθηκαν με βάση τα 4 κριτήρια του προηγούμενου σταδίου, για 5 και 10 clusters 1 ου σταδίου αλλά και για τις μέσες ημερήσιες καμπύλες.

83 Avecost ( /MWh) Avecost ( /MWh) Σ ε λ ί δ α 82 ΚΡΙΤΗΡΙΟ ΠΟΛΥΠΛΗΘΕΣΤΕΡΗΣ ΣΥΣΤΑΔΑΣ 52 Μέσο ετήσιο κόστος Αριθμός συστάδας Διάγραμμα 4.5: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 5 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο πολυπληθέστερης συστάδας, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 5 clusters. 52 Μέσο ετήσιο κόστος Αριθμός συστάδας Διάγραμμα 4.6: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 7 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο πολυπληθέστερης συστάδας, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 10 clusters.

84 Avecost ( /ΜWh) Avecost ( /ΜWh) Σ ε λ ί δ α 83 ΚΡΙΤΗΡΙΟ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ 52 Μέσο ετήσιο κόστος Αριθμός συστάδας Διάγραμμα 4.6: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 10 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο μέγιστης ισχύος, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 5 clusters. 52 Μέσο ετήσιο κόστος Αριθμός συστάδας Διάγραμμα 4.7: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 12 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο μέγιστης ισχύος, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 10 clusters.

85 Avecost ( /ΜWh) Avecost ( /ΜWh) Σ ε λ ί δ α 84 ΚΡΙΤΗΡΙΟ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ 52 Μέσο ετήσιο κόστος Αριθμός συστάδας Διάγραμμα 4.8: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 15 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο μέγιστης ενέργειας, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 5 clusters. 52 Μέσο ετήσιο κόστος Αριθμός συστάδας Διάγραμμα 4.9: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 7 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο μέγιστης ενέργειας, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 10 clusters.

86 Avecost ( /ΜWh) Avecost ( /ΜWh) Σ ε λ ί δ α 85 ΚΡΙΤΗΡΙΟ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ 52,00 Μέσο ετήσιο κόστος 50,00 48,00 46,00 44,00 42,00 40, Αριθμός συστάδας Διάγραμμα 4.10: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 30 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο συνολικής ενέργειας, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 5 clusters. 52,00 Μέσο ετήσιο κόστος 50,00 48,00 46,00 44,00 42,00 40, Αριθμός συστάδας Διάγραμμα 4.11: Αντιστοίχιση των μέσων ετήσιων κοστών σε κάθε αντιπροσωπευτική καμπύλη μέσα στις 20 συστάδες 2 ου σταδίου. Η αντιπροσωπευτικές καμπύλες επιλέχθηκαν με βάση το κριτήριο συνολικής ενέργειας, το οποίο εφαρμόστηκε στο 1 ο στάδιο συσταδοποίησης με 10 clusters.

87 Σ ε λ ί δ α 86 Έτσι, εφαρμόζοντας τον τύπο της συνολικής διασποράς για τα παραπάνω αποτελέσματα, αλλά και για άλλα,τα οποία δεν απεικονίσθηκαν, εξήχθησαν τα τελικά αποτελέσματα, τα οποία αναγράφονται στους δύο παρακάτω πίνακες. Επίσης, για λόγους άμεσης σύγκρισης, αναγράφονται σε κάθε πίνακα τα αποτελέσματα της συσταδοποίησης των μέσων ετήσιων κοστών που πραγματοποιήθηκε και καθορίστηκε ως η λογικά «τέλεια» συσταδοποίηση κόστους. ΔΙΑΣΠΟΡΕΣ 3 ΟΥ ΣΤΑΔΙΟΥ ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕ 5 CLUSTERS ΚΑΤΑ ΤΟ 1 Ο ΣΤΑΔΙΟ KAI ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΓΙΣΤΗΣ ΤΙΜΗΣ ΣΥΣΤΑΔΕΣ 2 ΟΥ ΣΤΑΔΙΟΥ Πολυπληθέστερη ΚΡΙΤΗΡΙΑ συστάδα Μέγιστη ισχύς Μέγιστη ενέργεια Συνολική ενέργεια Συσταδοποίηση Avecost Πίνακας 4.1: Αποτελέσματα διασπορών για κάθε κριτήριο, για διαφορετικούς αριθμούς συστάδων 2 ου σταδίου και με κανονικοποίηση μέγιστης τιμής. Η συσταδοποίηση 1 ου σταδίου έγινε με 5 clusters. ΔΙΑΣΠΟΡΕΣ 3 ΟΥ ΣΤΑΔΙΟΥ ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕ 10 CLUSTERS ΚΑΤΑ ΤΟ 1 Ο ΣΤΑΔΙΟ KAI ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΓΙΣΤΗΣ ΤΙΜΗΣ ΣΥΣΤΑΔΕΣ 2 ΟΥ ΣΤΑΔΙΟΥ Πολυπληθέστερη ΚΡΙΤΗΡΙΑ συστάδα Μέγιστη ισχύς Μέγιστη ενέργεια Συνολική ενέργεια Συσταδοποίηση Avecost Πίνακας 4.2 Αποτελέσματα διασπορών για κάθε κριτήριο, για διαφορετικούς αριθμούς συστάδων 2 ου σταδίου και με κανονοκοποίηση μέγιστης τιμής. Η συσταδοποίηση 1 ου σταδίου έγινε με 10 clusters.

88 Σ ε λ ί δ α 87 ΔΙΑΣΠΟΡΕΣ 3 ΟΥ ΣΤΑΔΙΟΥ ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕ 5 CLUSTERS ΚΑΤΑ ΤΟ 1 Ο ΣΤΑΔΙΟ KAI ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΣΗΣ ΤΙΜΗΣ ΣΥΣΤΑΔΕΣ 2 ΟΥ ΣΤΑΔΙΟΥ Πολυπληθέστερη ΚΡΙΤΗΡΙΑ συστάδα Μέγιστη ισχύς Μέγιστη ενέργεια Συνολική ενέργεια Συσταδοποίηση Avecost Πίνακας 4.3 Αποτελέσματα διασπορών για κάθε κριτήριο, για διαφορετικούς αριθμούς συστάδων 2 ου σταδίου και με κανονοκοποίηση μέγιστης τιμής. Η συσταδοποίηση 1 ου σταδίου έγινε με 5 clusters. ΔΙΑΣΠΟΡΕΣ 3 ΟΥ ΣΤΑΔΙΟΥ ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕ 10 CLUSTERS ΚΑΤΑ ΤΟ 1 Ο ΣΤΑΔΙΟ KAI ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΣΗΣ ΤΙΜΗΣ ΣΥΣΤΑΔΕΣ 2 ΟΥ ΣΤΑΔΙΟΥ Πολυπληθέστερη ΚΡΙΤΗΡΙΑ συστάδα Μέγιστη ισχύς Μέγιστη ενέργεια Συνολική ενέργεια Συσταδοποίηση Avecost Πίνακας 4.4 Αποτελέσματα διασπορών για κάθε κριτήριο, για διαφορετικούς αριθμούς συστάδων 2 ου σταδίου και με κανονοκοποίηση μέγιστης τιμής. Η συσταδοποίηση 1 ου σταδίου έγινε με 10 clusters.

89 Διασπορά Σ ε λ ί δ α 88 ΔΙΑΣΠΟΡΕΣ 3 ΟΥ ΣΤΑΔΙΟΥ ΓΙΑ ΤΙΣ ΜΕΣΕΣ ΗΜΕΡΗΣΙΕΣ ΚΑΜΠΥΛΕΣ 2 ΟΥ ΣΤΑΔΙΟΥ ΚΡΙΤΗΡΙΑ ΣΥΣΤΑΔΕΣ 2 ΟΥ ΣΤΑΔΙΟΥ AVELOADMAX AVELOADAVE Συσταδοποίηση Avecost Πίνακας 4.4 Αποτελέσματα διασπορών για τις μέσες ημερήσιες καμπύλες με κανονικοποίηση μέσης και μέγιστης τιμής. Στα παρακάτω διαγράμματα απεικονίζεται η σχέση των τιμών διασποράς με τον αριθμό συστάδων για όλα τα αποτελέσματα. 250 Διασπορές 3ου σταδίου ΠΟΛΥΠΛΗΘΕΣΤΕΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Αριθμός συστάδων Διάγραμμα 4.12: ΟΙ διασπορές που προέκυψαν κατά το 3 ο στάδιο της μελέτης. Τα αποτελέσματα συνδέονται με τη συσταδοποίηση 1 ου σταδίου με 5 συστάδες και κανονικοποίηση μέγιστης τιμής.

90 ΔΙασπορά Διασπορά Σ ε λ ί δ α 89 Διασπορές 3ου σταδίου Αριθμός συστάδων ΠΟΛΥΠΛΗΘΕΣΤΕ ΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Διάγραμμα 4.13: ΟΙ διασπορές που προέκυψαν κατά το 3 ο στάδιο της μελέτης. Τα αποτελέσματα συνδέονται με τη συσταδοποίηση 1 ου σταδίου με 10 συστάδες και κανονικοποίηση μέγιστης τιμής. Διασπορές 3ου σταδίου ΠΟΛΥΠΛΗΘΕΣΤΕΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ 50 ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Αριθμός συστάδων Διάγραμμα 4.14: ΟΙ διασπορές που προέκυψαν κατά το 3 ο στάδιο της μελέτης. Τα αποτελέσματα συνδέονται με τη συσταδοποίηση 1 ου σταδίου με 5 συστάδες και κανονικοποίηση μέσης τιμής.

91 Διασπορά Διασπορά Σ ε λ ί δ α 90 Διασπορές 3ου σταδίου Αριθμός συστάδων ΠΟΛΥΠΛΗΘΕΣΤΕ ΡΗΣ ΣΥΣΤΑΔΑΣ ΜΕΓΙΣΤΗΣ ΙΣΧΥΟΣ ΜΕΓΙΣΤΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΝΟΛΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Διάγραμμα 4.15: ΟΙ διασπορές που προέκυψαν κατά το 3 ο στάδιο της μελέτης. Τα αποτελέσματα συνδέονται με τη συσταδοποίηση 1 ου σταδίου με 10 συστάδες και κανονικοποίηση μέσης τιμής. Διασπορές 3ου σταδίου AVELOADMAX AVELOADAVE Αριθμός συστάδων Διάγραμμα 4.16: ΟΙ διασπορές που προέκυψαν κατά το 3 ο στάδιο της μελέτης. Τα αποτελέσματα συνδέονται με τη συσταδοποίηση 2 ου σταδίου για τις μέσες ημερήσιες καμπύλες και για κανονικοποιήσεις μέγιστης και μέσης τιμής.

92 Σ ε λ ί δ α 91 Από τα αποτελέσματα των διασπορών παρατηρούμε τα εξής: Τα αποτελέσματα μπορούν να θεωρηθούν αξιόπιστα για μεγάλο αριθμό συστάδων, περίπου για 15 συστάδες και πάνω. Έτσι όλα τα συμπεράσματα έχουν να κάνουν με τον παραπάνω περιορισμό. Τα αποτελέσματα των διασπορών που προήλθαν από τη συσταδοποίηση 1 ου σταδίου με 5 clusters είναι καλύτερα από τα αντίστοιχα αποτελέσματα που προήλθαν από τη συσταδοποίηση με 10. Επιβεβαιώνεται έτσι, ότι με τη μείωση του αριθμού clusters στο 1 ο Στάδιο, βελτιώνεται η αντιπροσωπευτικότητα των καμπυλών που επιλέγονται για τη συσταδοποίηση του 2 ου Σταδίου. Όσο αυξάνεται ο αριθμός των συστάδων τόσο μειώνεται η τιμή της διασποράς, κάτι όμως που είναι φυσιολογικό. Υπάρχει λοιπόν και σε αυτή τη διαδικασία ένα ζήτημα βελτιστοποίησης (δηλ. ελαχιστοποίησης της διασποράς) αλλά και οικονομίας (δηλ. ένας λογικός αριθμός συστάδων). Πρέπει να έχουμε υπόψη, ότι κάθε τελική συστάδα θα οδηγήσει σε ένα διαφορετικό τιμολόγιο. Είναι όμως πιθανό, δύο συστάδες με παραπλήσια τιμή AvecostCluster να συγχωνευτούν στο ίδιο τιμολόγιο. Η κανονικοποίηση μέσης τιμής δεν συνδυάζεται επιτυχώς με τις αντιπροσωπευτικές καμπύλες μέγιστης ισχύος και ενέργειας. Αυτό συμβαίνει επειδή οι καμπύλες αυτές δεν έχουν άνω όριο, λαμβάνουν συχνά τιμές πολύ μεγαλύτερες της μονάδας και παρουσιάζουν μεγάλες αποκλίσεις μεταξύ τους. Η κανονικοποίηση μέσης τιμής φέρνει κατά πλειοψηφία χαμηλότερες τιμές διασπορών για το κριτήριο πολυπληθέστερης συστάδας και συνολικής ενέργειας. Η παράλειψη του 1 ου σταδίου και η υιοθέτηση της μέσης ημερήσιας καμπύλης του κάθε καταναλωτή ως αντιπροσωπευτικής επιφέρει καθαρή βελτίωση των αποτελεσμάτων, που γίνεται ακόμα πιο εντυπωσιακή όταν χρησιμοποιείται η κανονικοποίηση με βάση τη μέση τιμή.

93 Σ ε λ ί δ α 92 ΚΕΦΑΛΑΙΟ 5 ΔΙΑΜΟΡΦΩΣΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΚΑΜΠΥΛΩΝ ΦΟΡΤΙΟΥ (ΧΚΦ) 5.1 ΕΙΣΑΓΩΓΗ Στο προηγούμενο κεφάλαιο, παρουσιάσθηκε μια μέθοδος σε 2 στάδια, κατά την οποία με τεχνικές συσταδοποίησης ομαδοποιήθηκαν 150 καταναλωτές και ορίστηκε ένα σταθερό τιμολόγιο για κάθε ομάδα. Στη συνέχεια θα αναπτυχθεί μια διαφορετική μέθοδος, κατά την οποία (και πάλι με τεχνικές συσταδοποίησης) θα οριστούν Ν χαρακτηριστικές ημερήσιες καμπύλες, και ένα σταθερό τιμολόγιο για την καθεμία. Κάθε καταναλωτής θα χρεώνεται καθημερινά με το τιμολόγιο της χαρακτηριστικής καμπύλης στην οποία είναι πλησιέστερη η εκάστοτε καμπύλη φορτίου του. 5.2 ΕΚΤΕΛΕΣΗ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ Το στάδιο αυτό χρησιμοποιεί τα αποτελέσματα του clustering του 1 ου σταδίου όπου είχαμε επεξεργαστεί τα δεδομένα για τους 150 καταναλωτές φορτίου και είχαμε καταλήξει σε 5 κέντρα (centroids), αντίστοιχα των 5 clusters που είχαμε ορίσει. Έτσι δημιουργήθηκε μια βάση δεδομένων, αποτελούμενη από 150 5=750 χαρακτηριστικές ημερήσιες καμπύλες. Η βάση αυτή δεδομένων θεωρούμε ότι είναι πλήρης, περιέχει δηλ. όλες τις πιθανές, συνήθεις ή σπάνιες μορφές καμπυλών φορτίου όπως εμφανίζονται σε όλες τις ημέρες 150 διαφορετικών καταναλωτών. Δημιουργήθηκε ένα αρχείο διαστάσεων το όποιο χρησιμοποιήσαμε ως είσοδο στο clustering που ακολούθησε. Για τη νέα συσταδοποίηση εξετάστηκαν διάφοροι αριθμοί συστάδων, συγκεκριμένα 15, 20, 25,, 50 και χρησιμοποιήθηκε πάλι ο αλγόριθμος k-means στο λογισμικό Matlab.

94 Σ ε λ ί δ α 93 Στον παρακάτω πίνακα εμφανίζονται τα στάδια υλοποίησης και οι παράμετροι του αλγορίθμου K-Means στο Matlab και έπειτα παρουσιάζονται κάποια από τα αποτελέσματα. ΕΙΣΟΔΟΣ Pinakas 1 // αρχείο Excel για τον ορισμό των τιμών του x άξονα (24 ώρες) Pinakas 2 // αρχείο Excel για τον ορισμό των τιμών του άξονα y (750 καμπύλες) Pinakas 3 // αρχείο txt με συγκεντρωμένες τις 750 καμπύλες στις οποίες θα εφαρμοστεί η συσταδοποίηση ΕΚΤΕΛΕΣΗ K-means Clusters = α // ο αριθμός των επιθυμητών clusters Distance= Euclidean // ορισμός του Ευκλείδειου σφάλματος ως μέτρο απόκλισης Replicates= 30 // αριθμός των επιθυμητών επαναλήψεων της διαδικασίας για την εύρεση του βέλτιστου clustering ΕΞΟΔΟΣ Clusters // αρχείο txt στο οποίο αναγράφεται ποια κέντρα (ή ποιος καταναλωτής) ανήκουν στο κάθε cluster Centers // αρχείο txt στο οποίο αναγράφονται τα νέα κέντρα του clustering Plot // έξοδος της απεικόνισης των διαγραμμάτων του clustering με ορίσματα τους Pinakas 1, Pinakas 2, Pinakas 3 Εικόνα 5.1: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με.15 clusters

95 Σ ε λ ί δ α 94 Εικόνα 5.2: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με 35. Εικόνα 5.3: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με 45.

96 Σ ε λ ί δ α 95 Εικόνα 5.4: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με 50. Από τα παραπάνω διαγράμματα μπορούμε να διακρίνουμε ότι η συσταδοποίηση αναδεικνύει την ποικιλία αλλά και τη συχνότητα των διαφόρων καμπυλών φορτίου. Όσο αυξάνει ο αριθμός των clusters μειώνεται το ευκλείδειο σφάλμα και οι αποκλίσεις εντός κάθε ομάδας όπως αναμενόταν. Ωστόσο, για μεγάλο αριθμό clusters παρατηρούμε πάλι τα εξής: (α) υπάρχουν περισσότερες από μια ομάδες με παραπλήσια- παρόμοια μορφή καμπύλης και (β) υπάρχουν αρκετές ομάδες με πολύ λίγα μέλη (πχ δύο η τρεις ασυνήθιστες και σπάνιες καμπύλες φορτίου). Έχουν λοιπόν οριστεί Ν (35<Ν<50) καμπύλες φορτίου που στο εξής θα ονομάζουμε Χαρακτηριστικές Καμπύλες Φορτίου (ΧΚΦ) που αντιστοιχούν στα centroids της παραπάνω συσταδοποίησης. Στη συνέχεια της μεθόδου ακολουθούνται τα εξής βήματα: -Εξάγεται ένα σταθερό τιμολόγιο για καθεμία από τις Χαρακτηριστικές Καμπύλες Φορτίου. Για να οριστεί αυτή η τιμή, έγινε συνέλιξη της 24ωρης καμπύλης με τη μέση ημερήσια καμπύλη της οριακής τιμής και προέκυψε ένα μέσο ενεργειακό κόστος της ΧΚΦ σε /MWh. Το κόστος αυτό ισοδυναμεί με το Μέσο Ετήσιο Κόστος (Avecost) ενός καταναλωτή, ο οποίος κάθε μέρα και σε όλη τη διάρκεια του έτους θα εμφάνιζε μόνο την εκάστοτε χαρακτηριστική καμπύλη. Ακολουθούν παραδείγματα κόστους ΧΚΦ για συσταδοποίηση με 25 και 45 clusters:

97 ευρώ/mwh ευρώ/mwh Σ ε λ ί δ α Κόστος ΧΚΦ (25 clusters) 52 Κόστος ΧΚΦ (45 clusters) Aριθμός Χαρακτηριστικής Καμπύλης Φορτίου Aριθμός Χαρακτηριστικής Καμπύλης Φορτίου Διάγραμμα 5.1: Κόστος κάθε Χαρακτηριστικής Καμπύλης Φορτίου (25 και 45 clusters) -Θεωρητικά, κάθε μέρα που ο κάθε καταναλωτής εμφανίζει μια διαφορετική καμπύλη φορτίου, εντοπίζεται η πλησιέστερη σε αυτήν ΧΚΦ από το παραπάνω σετ και ο καταναλωτής πληρώνει το αντίστοιχο τιμολόγιο. -Μελετήσαμε στατιστικά κάθε καταναλωτή και διαπιστώσαμε ότι η συμπεριφορά του είναι συνήθως σταθερή, δηλ. αντιστοιχεί σε μόλις 3 ή 4 από τα παραπάνω τιμολόγια. Για παράδειγμα οι ημέρες κάποιου καταναλωτή εντάσσονται κατά 57% στο cluster 17, 26% στο cluster 11 και 17% στο cluster 7. -Ανατρέχοντας στη χρονοσειρά φορτίου και το καθημερινό τιμολόγιο κάθε καταναλωτή μπορούμε να υπολογίσουμε την ισοδύναμη μέση τιμή με την οποία χρεώθηκε ο καταναλωτής στη διάρκεια του έτους (σε /MWh) και την οποία θα ονομάσουμε Ισοδύναμο Κόστος Καταναλωτή (ΙΚΚ). - Η τιμή αυτή μπορεί να συγκριθεί με το αντίστοιχο Μέσο Ετήσιο Κόστος (ΜΕΚ ή Avecost) του κάθε καταναλωτή που προκύπτει από τη συνέλιξη των χρονοσειρών φορτίου του καταναλωτή και οριακής τιμής του συστήματος (βλ. 4.2). Οι συγκρίσεις των δύο τιμών κόστους για κάθε clustering φαίνεται στα Διαγράμματα 5.2 έως 5.9. Εκτιμούμε ότι όσο πιο γραμμική είναι η σχέση μεταξύ των δύο τιμών κόστους (και όσο περισσότερο συγκλίνει στo y=x) τόσο πιο δίκαιη είναι η

98 IKK ( /MWh) Σ ε λ ί δ α 97 τιμολόγηση του καταναλωτή και επιτυχημένη η αντίστοιχη διαδικασία του clustering. -Ως μέτρο απόδοσης και αξιολόγησης αυτής της διαδικασίας προτείνεται όπως στο Κεφ. 4 η παρακάτω διασπορά ( ) Αριθμός Clusters Διασπορά 142,3 107,5 100,9 88,0 88,7 87,1 83,0 85,3 Πίνακας 5.1: Διασπορά μεταξύ του Ισοδύναμου Κόστους και του Μέσου Ετήσιου Κόστους Καταναλωτή - Οι διασπορές για τις παραπάνω μεθόδους είναι συγκρίσιμες με τις αντίστοιχες του Κεφ. 4 και παρουσιάζονται συγκεντρωτικά στο τέλος του Κεφ. 5. Ισοδύναμο Κόστος Καταναλωτή (15 clusters) y = 0,4094x + 27,726 R² = 0, Αvecost Καταναλωτή ( /MWh) Διάγραμμα 5.2 Σύγκριση Ισοδύναμου Κόστους Καταναλωτή με το Μέσο Ενεργειακό Κόστος (Avecost) για συσταδοποίηση των ΧΚΦ (15 clusters)

99 IKK ( /MWh) IKK ( /MWh) Σ ε λ ί δ α 98 Ισοδύναμο Κόστος Καταναλωτή (25 clusters) y = 0,5495x + 21,152 R² = 0, Αvecost Καταναλωτή ( /MWh) Διάγραμμα 5.3: Σύγκριση Ισοδύναμου Κόστους Καταναλωτή με το Μέσο Ενεργειακό Κόστος (Avecost) για συσταδοποίηση των ΧΚΦ (25 clusters) Ισοδύναμο Κόστος Καταναλωτή (35 clusters) y = 0,5829x + 19,598 R² = 0, Αvecost Καταναλωτή ( /MWh) Διάγραμμα 5.4 Σύγκριση Ισοδύναμου Κόστους Καταναλωτή με το Μέσο Ενεργειακό Κόστος (Avecost) για συσταδοποίηση των ΧΚΦ (35 clusters)

100 IKK ( /MWh) Σ ε λ ί δ α Ισοδύναμο Κόστος Καταναλωτή (45 clusters) y = 0,6163x + 18,041 R² = 0, Αvecost Καταναλωτή ( /MWh) Διάγραμμα 5.5: Σύγκριση Ισοδύναμου Κόστους Καταναλωτή με το Μέσο Ενεργειακό Κόστος (Avecost) για συσταδοποίηση των ΧΚΦ (45 clusters) 5.3 ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΜΕΣΗΣ ΤΙΜΗΣ Σε όλες τις προηγούμενες διαδικασίες, οι καμπύλες φορτίου ήταν κανονικοποιημένες με βάση τη μέγιστη ετήσια τιμή φορτίου του εκάστοτε καταναλωτή. Στην είχαμε δείξει με διάφορα κριτήρια αξιολόγησης ότι η υιοθέτηση ενός διαφορετικού τρόπου κανονικοποίησης που να βασίζεται στη μέση (και όχι στη μέγιστη) ετήσια τιμή του εκάστοτε καταναλωτή, βελτιώνει τα αποτελέσματα. Η κανονικοποίηση είναι ιδιαίτερα κρίσιμο σημείο της διαδικασίας, ιδίως εφόσον συγκρίνονται ως προς τη μορφή τους καμπύλες φορτίου τελείως διαφορετικών μεγεθών (οικιακών, εμπορικών και βιομηχανικών καταναλωτών). Επομένως, όλη η διαδικασία που παρουσιάστηκε στις επαναλαμβάνεται με κανονικοποίηση μέσης τιμής. Χρησιμοποιούνται τα ίδια προγράμματα και ο αλγόριθμος k-means στο matlab και προκύπτουν τα παρακάτω διαγράμματα για συσταδοποίηση με διάφορες τιμές clusters (15 ως 50). Πρέπει να τονίσουμε ότι στις παρακάτω καμπύλες φορτίου η τιμή 0,5 αντιστοιχεί στη μέση ετήσια τιμή φορτίου του καταναλωτή από τον οποίον προέρχεται. Στις κανονικοποιημένες αυτές τιμές δεν υπάρχει άνω όριο, γι αυτό και εμφανίζονται τιμές μεγαλύτερες του 1 ή ενίοτε και του 2.

101 Σ ε λ ί δ α 100 Εικόνα 5.5: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με 15. Εικόνα 5.6: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με 35.

102 Σ ε λ ί δ α 101 Εικόνα 5.7: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με 45. Εικόνα 5.8: Απεικόνιση του αποτελέσματος της συσταδοποίησης για επιλεγμένο αριθμό συστάδων ίσο με 50.

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: μέθοδοι μονοδιάστατης ελαχιστοποίησης Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 6 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων Clustering Αλγόριθµοι Οµαδοποίησης Αντικειµένων Εισαγωγή Οµαδοποίηση (clustering): οργάνωση µιας συλλογής από αντικείµενα-στοιχεία (objects) σε οµάδες (clusters) µε βάση κάποιο µέτρο οµοιότητας. Στοιχεία

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Ομαδοποίηση Ι (Clustering)

Ομαδοποίηση Ι (Clustering) Ομαδοποίηση Ι (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 2: Δομικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Στάδιο Εκτέλεσης

Στάδιο Εκτέλεσης 16 ΚΕΦΑΛΑΙΟ 1Ο 1.4.2.2 Στάδιο Εκτέλεσης Το στάδιο της εκτέλεσης μίας έρευνας αποτελεί αυτό ακριβώς που υπονοεί η ονομασία του. Δηλαδή, περιλαμβάνει όλες εκείνες τις ενέργειες από τη στιγμή που η έρευνα

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 8: Ομαδοποίηση Μέρος B Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Τμηματοποίηση εικόνας Τμηματοποίηση εικόνας Γενικά Διαμερισμός μιας εικόνας σε διακριτές περιοχές

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Συσταδοποίηση καταναλωτών ηλεκτρικής βάσει αντιπροσωπευτικών καµπύλων

Συσταδοποίηση καταναλωτών ηλεκτρικής βάσει αντιπροσωπευτικών καµπύλων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Συσταδοποίηση καταναλωτών ηλεκτρικής ενέργειας βάσει αντιπροσωπευτικών καµπύλων

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ Σε αντίθεση με την διακριτή τυχαία μεταβλητή, μία συνεχής τυχαία μεταβλητή παίρνει μη-αριθμήσιμο (συνεχές) πλήθος τιμών. Δεν μπορούμε να καταγράψουμε το σύνολο των τιμών

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ ΚΕΦΑΛΑΙΟ 3 Περιγραφή της Μεθόδου Το αντικείμενο αυτής της εργασίας είναι η χρήση μιας μεθόδου προσέγγισης συναρτήσεων που έχει προταθεί από τον hen-ha huang και ονομάζεται Ασαφώς Σταθμισμένη Παλινδρόμηση

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή Τεχνικές διαχωριστικής ομαδοποίησης: Ν πρότυπα k ομάδες Ν>>k Συνήθως k καθορίζεται από χρήστη Διαχωριστικές τεχνικές: επιτρέπουν πρότυπα να μετακινούνται από ομάδα σε

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Άσκηση 5.1 Για ένα σήμα που έχει τη σ.π.π. του σχήματος να υπολογίσετε: μήκος του δυαδικού κώδικα για Ν επίπεδα κβάντισης για σταθερό μήκος λέξης;

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Διαχωριστικές συναρτήσεις Ταξινόμηση κανονικών

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 9/10/009 ΤΕΙ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 3o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Emal: gasl@math.auth.gr Ιστοσελίδα Μαθήματος: users.auth.gr/gasl

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 2

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 2 (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: lzabetak@dpem.tuc.gr Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ 28210 37323 Διάλεξη 2 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Εφαρμοσμένη Βελτιστοποίηση

Εφαρμοσμένη Βελτιστοποίηση Εφαρμοσμένη Βελτιστοποίηση Ενότητα 1: Το πρόβλημα της βελτιστοποίησης Καθηγητής Αντώνιος Αλεξανδρίδης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Σημείωμα Αδειοδότησης Το

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής Chapter 1 Student Lecture Notes 1-1 Ανάλυση Δεδομένων και Στατιστική για Διοικήση Επιχειρήσεων [Basic Business Statistics (8 th Edition)] Κεφάλαιο 1 Εισαγωγή και Συλλογή Δεδομένων Περιεχόμενα Γιατί ένας

Διαβάστε περισσότερα

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Επιλογή δείγματος Κατερίνα Δημάκη Αν. Καθηγήτρια Τμήμα Στατιστικής Οικονομικό Πανεπιστήμιο Αθηνών 1 Τρόποι Συλλογής Δεδομένων Απογραφική

Διαβάστε περισσότερα

Κεφάλαιο 14: Διαστασιολόγηση αγωγών και έλεγχος πιέσεων δικτύων διανομής

Κεφάλαιο 14: Διαστασιολόγηση αγωγών και έλεγχος πιέσεων δικτύων διανομής Κεφάλαιο 14: Διαστασιολόγηση αγωγών και έλεγχος πιέσεων δικτύων διανομής Έλεγχος λειτουργίας δικτύων διανομής με χρήση μοντέλων υδραυλικής ανάλυσης Βασικό ζητούμενο της υδραυλικής ανάλυσης είναι ο έλεγχος

Διαβάστε περισσότερα

Σχεδιασμός Οικολογικού Διαμεσολαβητή για την εποπτεία και διαχείριση δικτύου διανομής ηλεκτρικής ενέργειας

Σχεδιασμός Οικολογικού Διαμεσολαβητή για την εποπτεία και διαχείριση δικτύου διανομής ηλεκτρικής ενέργειας Σχεδιασμός Οικολογικού Διαμεσολαβητή για την εποπτεία και διαχείριση δικτύου διανομής ηλεκτρικής ενέργειας Σωτηρία Δριβάλου Εθνικό Μετσόβιο Πολυτεχνείο Μονάδα Εργονομίας Συστήματα διανομής ηλεκτρικής ενέργειας

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Διοίκηση Παραγωγής & Συστημάτων Υπηρεσιών ΕΡΓΑΣΤΗΡΙΟ ΣΥΣΤΗΜΑΤΩΝ ΑΠΟΦΑΣΕΩΝ ΚΑΙ ΔΙΟΙΚΗΣΗΣ Περιεχόμενα

Διαβάστε περισσότερα

Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι

Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εξόρυξη Δεδομένων Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι 1 2 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6. Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. 7 ο ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκοπός Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. Προσδοκώμενα αποτελέσματα Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου

Διαβάστε περισσότερα

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων. ΠΕΡΙΛΗΨΗ Η τεχνική αυτή έκθεση περιλαµβάνει αναλυτική περιγραφή των εναλλακτικών µεθόδων πολυκριτηριακής ανάλυσης που εξετάσθηκαν µε στόχο να επιλεγεί η µέθοδος εκείνη η οποία είναι η πιο κατάλληλη για

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Δ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Bayesian decision Minimum misclassificaxon rate decision: διαλέγουμε την κατηγορία Ck για

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟ Ι. ΓΙΑΝΝΑΤΣΗΣ

ΑΝΤΙΚΕΙΜΕΝΟ Ι. ΓΙΑΝΝΑΤΣΗΣ ΣΧΕΔΙΑΣΜΟΣ ΣΥΣΤΗΜΑΤΩΝ ΠΑΡΑΓΩΓΗΣ ΜΕΤΡΗΣΗ ΕΡΓΑΣΙΑΣ Ι. ΓΙΑΝΝΑΤΣΗΣ ΑΝΤΙΚΕΙΜΕΝΟ Η Μέτρηση Εργασίας (Work Measurement ή Time Study) έχει ως αντικείμενο τον προσδιορισμό του χρόνου που απαιτείται από ένα ειδικευμένο

Διαβάστε περισσότερα

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Προϋποθέσεις Εφαρμογής

Διαβάστε περισσότερα

Φυσική για Μηχανικούς

Φυσική για Μηχανικούς Φυσική για Μηχανικούς Ο νόμος του Gauss Εικόνα: Σε μια επιτραπέζια μπάλα πλάσματος, οι χρωματιστές γραμμές που βγαίνουν από τη σφαίρα αποδεικνύουν την ύπαρξη ισχυρού ηλεκτρικού πεδίου. Με το νόμο του Gauss,

Διαβάστε περισσότερα

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ ΜΕΡΟΣ ΙΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ 36 ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ Πολλές από τις αποφάσεις

Διαβάστε περισσότερα

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων.

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων. Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων. Στην προηγούμενη Εκπαιδευτική Μονάδα παρουσιάστηκαν ορισμένα χρήσιμα παραδείγματα διαδεδομένων εργαλείων για τον χρονοπρογραμματισμό

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΛΗΘΥΣΜΟΙ ΔΕΙΓΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΕΔΟΜΕΝΩΝ Περιγραφική Στατιστική Με τις στατιστικές μεθόδους επιδιώκεται: - η συνοπτική αλλά πλήρης και κατατοπιστική παρουσίαση των ευρημάτων μιας

Διαβάστε περισσότερα

Φυσική για Μηχανικούς

Φυσική για Μηχανικούς Φυσική για Μηχανικούς Ο νόμος του Gauss Εικόνα: Σε μια επιτραπέζια μπάλα πλάσματος, οι χρωματιστές γραμμές που βγαίνουν από τη σφαίρα αποδεικνύουν την ύπαρξη ισχυρού ηλεκτρικού πεδίου. Με το νόμο του Gauss,

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Τμήμα Μηχανικών Πληροφορικής ΤΕ Η μέθοδος Simplex. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 19/01/2017

Τμήμα Μηχανικών Πληροφορικής ΤΕ Η μέθοδος Simplex. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 19/01/2017 Τμήμα Μηχανικών Πληροφορικής ΤΕ 2016-2017 Η μέθοδος Simplex Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα τελευταία ενημέρωση: 19/01/2017 1 Πλεονεκτήματα Η μέθοδος Simplex Η μέθοδος Simplex είναι μια

Διαβάστε περισσότερα

ΤΕΙ Χαλκίδας Σχολή Διοίκησης και Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων

ΤΕΙ Χαλκίδας Σχολή Διοίκησης και Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων ΤΕΙ Χαλκίδας Σχολή Διοίκησης και Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων Επιχειρησιακή Έρευνα Τυπικό Εξάμηνο: Δ Αλέξιος Πρελορέντζος Εισαγωγή Ορισμός 1 Η συστηματική εφαρμογή ποσοτικών μεθόδων, τεχνικών

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Κεφάλαιο 2: Έννοιες και Ορισμοί

Κεφάλαιο 2: Έννοιες και Ορισμοί ΔΙΟΙΚΗΣΗ ΟΛΙΚΗΣ ΠΟΙΟΤΗΤΑΣ Ε.ΜΙΧΑΗΛΙΔΟΥ - 1 Κεφάλαιο 2: Έννοιες και Ορισμοί Η επιτυχία των επιχειρήσεων βασίζεται στην ικανοποίηση των απαιτήσεων των πελατών για: - Ποιοτικά και αξιόπιστα προϊόντα - Ποιοτικές

Διαβάστε περισσότερα

Αστικά υδραυλικά έργα

Αστικά υδραυλικά έργα Εθνικό Μετσόβιο Πολυτεχνείο Τομέας Υδατικών Πόρων και Περιβάλλοντος Αστικά υδραυλικά έργα Διαστασιολόγηση αγωγών και έλεγχος πιέσεων δικτύων διανομής Δημήτρης Κουτσογιάννης, Καθηγητής ΕΜΠ Σχολή Πολιτικών

Διαβάστε περισσότερα

Φάση 3: Λεπτομερής Σχεδιασμός

Φάση 3: Λεπτομερής Σχεδιασμός 76 Φάση 3: Λεπτομερής Σχεδιασμός Διαδικασίες που περιλαμβάνει: Βιομηχανικός Σχεδιασμός (ολοκληρώνεται) Σχεδιασμός για το περιβάλλον (ολοκληρώνεται) Σχεδιασμός για τη παραγωγή Πρωτοτυποποίηση Εύρωστος Σχεδιασμός

Διαβάστε περισσότερα

Μελέτη προβλημάτων ΠΗΙ λόγω λειτουργίας βοηθητικών προωστήριων μηχανισμών

Μελέτη προβλημάτων ΠΗΙ λόγω λειτουργίας βοηθητικών προωστήριων μηχανισμών «ΔιερΕΥνηση Και Aντιμετώπιση προβλημάτων ποιότητας ηλεκτρικής Ισχύος σε Συστήματα Ηλεκτρικής Ενέργειας (ΣΗΕ) πλοίων» (ΔΕΥ.Κ.Α.Λ.Ι.ΩΝ) πράξη ΘΑΛΗΣ-ΕΜΠ, πράξη ένταξης 11012/9.7.2012, MIS: 380164, Κωδ.ΕΔΕΙΛ/ΕΜΠ:

Διαβάστε περισσότερα

Το Ευρωπαϊκό Πρόγραμμα. Motor Challenge

Το Ευρωπαϊκό Πρόγραμμα. Motor Challenge ΕΥΡΩΠΑΪΚΗ ΕΠΙΤΡΟΠΗ Γενική Διεύθυνση Ενέργειας και Μεταφορών Προώθηση των Ανανεώσιμων Πηγών Ενέργειας & Απαιτούμενη Διαχείριση Το Ευρωπαϊκό Πρόγραμμα Motor Challenge Ενότητα Πολιτικής Ενεργειακής Διαχείρισης

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

Προβλήματα, αλγόριθμοι, ψευδοκώδικας

Προβλήματα, αλγόριθμοι, ψευδοκώδικας Προβλήματα, αλγόριθμοι, ψευδοκώδικας October 11, 2011 Στο μάθημα Αλγοριθμική και Δομές Δεδομένων θα ασχοληθούμε με ένα μέρος της διαδικασίας επίλυσης υπολογιστικών προβλημάτων. Συγκεκριμένα θα δούμε τι

Διαβάστε περισσότερα

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα Θεωρία Δυαδικότητας Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Περιεχόμενα Παρουσίασης 1. Βασικά Θεωρήματα 2. Παραδείγματα 3. Οικονομική Ερμηνεία

Διαβάστε περισσότερα

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι:

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι: Χωρική Ανάλυση Ο σκοπός χρήσης των ΣΓΠ δεν είναι μόνο η δημιουργία μίας Β.Δ. για ψηφιακές αναπαραστάσεις των φαινομένων του χώρου, αλλά κυρίως, η βοήθειά του προς την κατεύθυνση της υπόδειξης τρόπων διαχείρισής

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: βελτιστοποίηση χωρίς περιορισμούς Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 7-8 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Κεφάλαιο 7 Φορτία Συστηµάτων ιανοµής

Κεφάλαιο 7 Φορτία Συστηµάτων ιανοµής Κεφάλαιο 7 Φορτία Συστηµάτων ιανοµής Σύνοψη Στο κεφάλαιο αυτό µελετώνται τα φορτία του συστήµατος διανοµής ηλεκτρικής ενέργειας. Ορίζονται και αναλύονται τα τεχνικά χαρακτηριστικά των φορτίων, όπως ο συντελεστής

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Σημειώσεις Δικτύων Αναλογικά και ψηφιακά σήματα Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Χαρακτηριστικά

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα