Τεχνικές Οµαδοποίησης Καταναλωτών & Εξαγωγή Καµπυλών Φορτίου ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Τεχνικές Οµαδοποίησης Καταναλωτών & Εξαγωγή Καµπυλών Φορτίου ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ"

Transcript

1 Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Τοµέας Ηλεκτρικής Ενέργειας Τεχνικές Οµαδοποίησης Καταναλωτών & Εξαγωγή Καµπυλών Φορτίου ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του ΧΑΡΑΛΑΜΠΟΥ ΛΟΥΚΑ Επιβλέποντες : Καθηγητής : ΛΑΜΠΡΙ ΗΣ ΗΜΗΤΡΙΟΣ ιδάκτωρ : ΜΠΟΥΧΟΥΡΑΣ ΑΓΓΕΛΟΣ Υποψήφιος ιδάκτωρ : ΓΚΑΪ ΑΤΖΗΣ ΠΑΣΧΑΛΗΣ ΘΕΣΣΑΛΟΝΙΚΗ,ΟΚΤΩΒΡΙΟΣ 2015

2

3 Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Τοµέας Ηλεκτρικής Ενέργειας Τεχνικές Οµαδοποίησης Καταναλωτών & Εξαγωγή Καµπυλών Φορτίου ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του ΧΑΡΑΛΑΜΠΟΥ ΛΟΥΚΑ Επιβλέποντες : Καθηγητής : ΛΑΜΠΡΙ ΗΣ ΗΜΗΤΡΙΟΣ ιδάκτωρ : ΜΠΟΥΧΟΥΡΑΣ ΑΓΓΕΛΟΣ Υποψήφιος ιδάκτωρ : ΓΚΑΪ ΑΤΖΗΣ ΠΑΣΧΑΛΗΣ Εγκρίθηκε από την τριµελή εξεταστική επιτροπή την 16η Νοεµβρίου (Υπογραφή) (Υπογραφή) (Υπογραφή) ηµήτρης Λαµπρίδης Γρηγόρης Παπαγιάννης Γιώργος Ανδρέου Καθηγητής Α.Π.Θ. Καθηγητής Α.Π.Θ. Επίκουρος Καθηγητής Α.Π.Θ. ΘΕΣΣΑΛΟΝΙΚΗ,ΟΚΤΩΒΡΙΟΣ 2015

4

5 Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Τοµέας Ηλεκτρικής Ενέργειας Copyright c All rights reserved. Με την επιφύλαξη παντός δικαιώµατος. ΧΑΡΑΛΑΜΠΟΣ ΛΟΥΚΑΣ, Απαγορεύεται η αντιγραφή, αποθήκευση και διανοµή της παρούσας εργασίας, εξ ολοκλήρου ή τµήµατος αυτής, για εµπορικό σκοπό. Επιτρέπεται η ανατύπωση, αποθήκευση και διανο- µή για σκοπό µη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής ϕύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν µήνυµα. Το περιεχόµενο αυτής της εργασίας δεν απηχεί απαραίτητα τις απόψεις του Τµήµατος, του Επιβλέποντα, ή της επιτροπής που την ενέκρινε. ΗΛΩΣΗ ΜΗ ΛΟΓΟΚΛΟΠΗΣ ΚΑΙ ΑΝΑΛΗΨΗΣ ΠΡΟΣΩΠΙΚΗΣ ΕΥΘΥΝΗΣ Με πλήρη επίγνωση των συνεπειών του νόµου περί πνευµατικών δικαιωµάτων, δηλώνω ενυπογράφως ότι είµαι αποκλειστικός συγγραφέας της παρούσας Πτυχιακής Εργασίας, για την ολοκλήρωση της οποίας κάθε ϐοήθεια είναι πλήρως αναγνωρισµένη και αναφέρεται λεπτο- µερώς στην εργασία αυτή. Εχω αναφέρει πλήρως και µε σαφείς αναφορές, όλες τις πηγές χρήσης δεδοµένων, απόψεων, ϑέσεων και προτάσεων, ιδεών και λεκτικών αναφορών, είτε κατά κυριολεξία είτε ϐάσει επιστηµονικής παράφρασης. Αναλαµβάνω την προσωπική και ατοµική ευθύνη ότι σε περίπτωση αποτυχίας στην υλοποίηση των ανωτέρω δηλωθέντων στοιχείων, είµαι υπόλογος έναντι λογοκλοπής, γεγονός που σηµαίνει αποτυχία στην Πτυχιακή µου Εργασία και κατά συνέπεια αποτυχία απόκτησης του Τίτλου Σπουδών, πέραν των λοιπών συνεπειών του νόµου περί πνευµατικών δικαιωµάτων. ηλώνω, συνεπώς, ότι αυτή η Πτυχιακή Εργασία προετοιµάστηκε και ολοκληρώθηκε από εµένα προσωπικά και αποκλειστικά και ότι, αναλαµβάνω πλήρως όλες τις συνέπειες του νόµου στην περίπτωση κατά την οποία αποδειχθεί, διαχρονικά, ότι η εργασία αυτή ή τµήµα της δεν µου ανήκει διότι είναι προϊόν λογοκλοπής άλλης πνευµατικής ιδιοκτησίας. (Υπογραφή)... ΧΑΡΑΛΑΜΠΟΣ ΛΟΥΚΑΣ 16 Νοεµβρίου 2015

6

7 Περίληψη Η παρούσα διπλωµατική εργασία επικεντρώνεται στις τεχνικές οµαδοποίησης καµπυλών ϕορτίου, που αφορούν σε δεδοµένα ϕόρτισης τόσο για την ενεργό όσο και για την άεργο ισχύ. Αυτές οι τεχνικές εφαρµόσθηκαν χρησιµοποιώντας το πρότυπο δίκτυο IEEE 33. Η οµαδοποίηση των στιγµιοτύπων του δικτύου οδηγεί στη εξαγωγή αντιπροσώπων (κεντροειδών), µε σκοπό την εκπροσώπηση κάθε δείγµατος ισχύος. Εγινε χρήση των αντιπροσωπευτικών καµπυλών στον αλγόριθµο ϐελτιστοποίησης Σµήνους Σωµατιδίων (Particle Swarm Optimization,PSO) και ϐρίσκονται οι συνολικές απώλειες ενεργής ισχύος του δικτύου για διαφορετικές περιπτώσεις. Στην εργασία αυτή αναπτύσσονται δείκτες αξιολόγησης του clustering προκειµένου να ϐρε- ϑεί ο ϐέλτιστος κάθε ϕορά αλγόριθµος για τα εξεταζόµενα δείγµατα, καθώς και ο ϐέλτιστος αριθµός οµάδων. Οι δείκτες αυτοί δηµιουργούνται στο περιβάλλον MATLAB R και γίνεται σύγκριση αυτών για 4 διαφορετικούς αλγόριθµους συσταδοποίησης. Με την χρήση του λογισµικού MATPOWER R γίνεται εύρεση των απωλειών ισχύος του δικτύου, σε συνδυασµό µε την εφαρµογή του αλγορίθµου PSO, για την εύρεση της ϐέλτιστης ϑέσης και εγκατάστασης διανεµηµένης παραγωγής µε στόχο την µείωση απωλειών ενεργής ισχύος. Λέξεις Κλειδιά Συσταδοποίηση, Καταναλωτές, Καµπύλες Φορτίου, Απώλειες Ενεργής Ισχύος, Κεντροειδή, ιανεµηµένη Παραγωγή, Αλγόριθµος Σµήνους Σωµατιδίων 1

8

9 Abstract The present thesis focuses on the clustering techniques of load curves, that relate to charging data for both active and reactive power. These techniques are implemented u- sing the IEEE 33 test case network. Grouping snapshots of the network leads to export representatives (centroids) in order to represent each sample of power. Representative curves are used in collaboration with Particle Swarm Optimization algorithm (PSO) in order to find the total losses of active power for different cases. In this thesis,clustering evaluation indicators are developed in order to define the best algorithm for each test sample and the optimum number of groups. These indexes are created in the MATLAB R environment and are compared with 4 different clustering algorithms. Software MATPOWER R is being used to find the power losses of the network,combined with the PSO algorithm, finding the optimal position and installation of distributed generators in order to minimize active power losses. Keywords Clustering, Consumers, Load Curves, Active Power Losses, Centroids, Distributed Generation, Particle Swarm Optimization Algorithm 3

10

11 στους γονείς µου

12

13 Ευχαριστίες Θα ήθελα καταρχήν να ευχαριστήσω τον καθηγητή κ.λαµπρίδη ηµήτρη και τους διδάκτορα κ.μπουχουρά Άγγελο και υποψήφιο διδάκτορα κ.γκαϊδατζή Πασχάλη για την άριστη συνεργασία και καθοδήγησή τους σε όλο το χρονικό διάστηµα εκπόνησης της παρούσας διπλωµατικής εργασίας. Τέλος ϑα ήθελα να ευχαριστήσω τους γονείς µου για την καθοδήγηση και την ηθική συµπαράσταση που µου προσέφεραν όλα αυτά τα χρόνια. ΘΕΣΣΑΛΟΝΙΚΗ, ΣΕΠΤΕΜΒΡΙΟΣ 2015 ΧΑΡΑΛΑΜΠΟΣ ΛΟΥΚΑΣ 7

14

15 Περιεχόµενα Περίληψη 1 Abstract 3 Ευχαριστίες 7 1 Εισαγωγή Σκοπός ιπλωµατικής Εργασίας ιαδικασία Πραγµατοποίησης ιπλωµατικής Εργασίας οµή της ιπλωµατικής Εργασίας Θεωρητικό υπόβαθρο Αναγνώριση Προτύπων ιαδικασία Οµαδοποίησης Εφαρµογές της Οµαδοποίησης Συσταδοποίηση (clustering):βασικές έννοιες Οµάδες και κέντρα Αποστάσεις και οµοιότητες Τύποι δεδοµένων Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Αλγόριθµος k-means Ιεραρχικοί αλγόριθµοι Αλγόριθµος Fuzzy c-means Αλγόριθµος k εσωτερικών αντιπροσώπων (k-medoids) είκτες αξιολόγησης Εφαρµογή αλγορίθµων συσταδοποίησης ίκτυο 33 Ϲυγών Κανονικοποίηση δεδοµένων Εύρεση ϐέλτιστου αριθµού οµάδων Ενεργός ισχύς µε απόκλιση ϕορτίου 20% Άεργη ισχύς µε απόκλιση ϕορτίου 20% Ενεργός ισχύς µε απόκλιση ϕορτίου 50% Άεργη ισχύς µε απόκλιση ϕορτίου 50%

16 ΠΕΡΙΕΧΟΜΕΝΑ 4 Clustering και PSO Τι είναι ο PSO Ανάλυση Ροής Φορτίου Εφαρµογή του PSO Απόκλιση ϕορτίου 20% Απόκλιση ϕορτίου 50% Γενικά Συµπεράσµατα-Προτάσεις Συµπεράσµατα Προτάσεις Παραρτήµατα 89 Αʹ Στοιχεία Συστήµατος Ηλεκτρικής Ενέργειας 91 Αʹ.1 Εισαγωγή Αʹ.2 ίκτυο 33 Ϲυγών Βιβλιογραφία 97 Ευρετήριο ελληνικών όρων 99 Ευρετήριο ξενόγλωσσων όρων

17 Κατάλογος Σχηµάτων 2.1 ιαδικασία Οµαδοποίησης-Βασικά ϐήµατα ιαφορετικοί τρόποι οµαδοποίησης του ίδιου δείγµατος Παράδειγµα χρήσης k-means Συσσωρευτική και ιαιρετική συσταδοποίηση Απόσταση µεταξύ οµάδων για (a)απλή σύνδεση, (b)πλήρη σύνδεση, (c)σύνδεση µέσου όρου ενδρόγραµµα απλής σύνδεσης ενδρόγραµµα πλήρους σύνδεσης Συνάρτηση τετραγωνικού σφάλµατος για την εύρεση του ϐέλτιστου αριθµού οµάδων Ιεραρχικές µέθοδοι συσταδοποίησης-j-error-function Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη-j-error-function Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Συσταδοποίηση στιγµιοτύπων του δικτύου ενεργής ισχύος 33 Ϲυγών Αντιπρόσωποι των 4 οµάδων Εστιάσεις σε δύο περιοχές των Ϲυγών Ιεραρχικές µέθοδοι συσταδοποίησης-j-error-function Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J-Error-Function Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Συσταδοποίηση στιγµιοτύπων του δικτύου άεργης ισχύος 33 Ϲυγών

18 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ 3.26 Αντιπρόσωπος των 4 οµάδων Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη J Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR Εστίαση καµπυλών για τον δείκτη WCBCR Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR Εστίαση καµπυλών συσταδοποίησης για τον δείκτη WCBCR Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Συσταδοποίηση στιγµιοτύπων του δικτύου ενεργής ισχύος 33 Ϲυγών Αντιπρόσωποι των 3 οµάδων Εστιάσεις σε δύο περιοχές των Ϲυγών Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη J Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής Αντιπρόσωπος των 5 οµάδων Συσταδοποίηση στιγµιοτύπων του δικτύου άεργης ισχύος 33 Ϲυγών Απώλειες Ενέργειας µε απόκλιση ϕορτίου 20% Απώλειες Ενέργειας µε απόκλιση ϕορτίου 50% Αʹ.1 ίκτυο IEEE

19 Κατάλογος Πινάκων 4.1 Πίνακας Παραµέτρων PSO Αʹ.1 ίκτυο Αʹ.2 Ζυγοί ικτύου Αʹ.3 Κλάδοι ικτύου

20

21 Κεφάλαιο 1 Εισαγωγή 1.1 Σκοπός ιπλωµατικής Εργασίας Η παρούσα διπλωµατική εργασία πραγµατεύεται τις ϐασικές αρχές της ϑεωρίας Αναγνώρισης Προτύπων που αφορά το κοµµάτι της οµαδοποίησης δεδοµένων. Πραγµατοποιείται µείωση απωλειών ενέργειας µέσω ιανεµηµένης Παραγωγής µέσω προσέγγισης µείωσης απωλειών ισχύος για συγκεκριµένα στατικά προβλήµατα διαστασιολόγησης και τοποθέτησης µονάδων ιανεµηµένης Παραγωγής. Εξετάζονται αλγόριθµοι οµαδοποίησης όπως και µετρικές απόδοσης καλής συσταδοποίησης των διαθέσιµων στιγµιοτύπων δικτύου. Ακόµα γίνεται σύνδεση µε τον αλγόριθµο PSO (Particle swarm optimization) [1, 2] καθώς και συγκρίσεις απωλειών ενέργειας κάθε χρονικής στιγµής του ηλεκτρικού δικτύου για διάφορες περιπτώσεις. 1.2 ιαδικασία Πραγµατοποίησης ιπλωµατικής Εργασίας Η παρούσα διπλωµατική εργασία εκπονήθηκε σύµφωνα µε την παρακάτω διαδικασία : 1 η Φάση: Μελέτη ϐιβλιογραφικών πηγών σχετικά µε : Βασικές αρχές αναγνώρισης προτύπων. Αλγόριθµους οµαδοποίησης δεδοµένων (clustering). Μετρικές επιλογής κατάλληλου αλγορίθµου. Μελέτη αλγορίθµου PSO και εφαρµογές του. 2 η Φάση: Μελέτη του ηλεκτρικού δικτύου : Πρώτη επαφή µε το δίκτυο των 33 Ϲυγών ως πρότυπο σενάριο της IEEE και της λειτουργίας του. Επεξεργασία των διαθέσιµων δεδοµένων τόσο για την ενεργή όσο και την άεργο ισχύ. 3 η Φάση: ηµιουργία κώδικα µε την γλώσσα Matlab για : 15

22 Κεφάλαιο 1. Εισαγωγή Οµαδοποίηση των καµπυλών ϕορτίου µε τέσσερις αλγορίθµους. ηµιουργία µετρικών για επιλογή του ϐέλτιστου αλγορίθµου και εύρεση του ϐέλτιστου αριθµού οµάδων σύµφωνα µε την ϐιβλιογραφία. 4 η Φάση: Σύνδεση µε τον αλγόριθµο PSO: ηµιουργία πηγαίου κώδικα. Εκλογή ϐέλτιστων αντιπροσωπευτικών σεναρίων. Εξαγωγή απωλειών ενέργειας για διάφορες περιπτώσεις. Σύγκριση αποτελεσµάτων και συµπεράσµατα. 1.3 οµή της ιπλωµατικής Εργασίας Στο 1 o κεφάλαιο γίνεται αναφορά στο πρόβληµα που πραγµατεύεται η παρούσα διπλω- µατική εργασία καθώς επίσης και τα ϐήµατα που ακολουθήθηκαν σε κάθε στάδιο µε σκοπό την επίτευξή της. Το 2 o κεφάλαιο πραγµατεύεται το ϑεωρητικό κοµµάτι της εργασίας το οποίο είναι απα- ϱαίτητο για τον αναγνώστη. Γίνεται αναφορά στις ϐασικές έννοιες της συσταδοποίησης και παρουσιάζονται οι αλγόριθµοι και οι δείκτες αξιολόγησης. Στο 3 o κεφάλαιο γίνεται εφαρµογή των αλγορίθµων οµαδοποίησης στα δείγµατα ισχύος, ενεργής και άεργης και συγκρίνονται µε τη χρήση των δεικτών αξιολόγησης. Στο 4 o κεφάλαιο γίνεται η σύνδεση µε τον αλγόριθµο ϐελτιστοποίησης σµήνους σωµατιδίων µέσω των αντιπροσώπων, από την διαδικασία του clustering και ϐρίσκονται οι απώλειες ενεργής ισχύος για 4 διαφορετικές περιπτώσεις. Στο 5 o παρουσιάζονται τα συµπεράσµατα που προέκυψαν και παρατίθενται ορισµένες προτάσεις για περαιτέρω έρευνα. Ακολουθούν το κεφάλαιο του παραρτήµατος µε τα στοιχεία του ηλεκτρικού δικτύου, το κεφάλαιο της ϐιβλιογραφίας καθώς και το ευρετήριο ελληνικών και ξενόγλωσσων όρων. 16

23 Κεφάλαιο 2 Θεωρητικό υπόβαθρο Στο κεφάλαιο αυτό παρουσιάζονται οι ϐασικές αρχές της οµαδοποίησης (clustering) δεδοµένων ϐάσει της αναγνώρισης προτύπων, η λειτουργία των αλγορίθµων και οι µετρικές αξιολόγησης αυτών για την ϐέλτιστη επιλογή οµάδων. 2.1 Αναγνώριση Προτύπων Η Αναγνώριση Προτύπων είναι εκείνη η επιστηµονική περιοχή που έχει ώς στόχο την ταξινόµηση των δεδοµένων σε κατηγορίες ή κλάσεις [3]. Είναι ευρέως γνωστό ότι σε καθηµερινή ϐάση µεγάλο πλήθος δεδοµένων συλλέγεται µέσω µετρητικών συσκευών για διάφορα επιστηµονικά πεδία.τα δεδοµένα αυτά αναλόγως σε τι αντιστοιχούν παρουσιάζονται σε διάφορες µορφές, όπως αριθµητικά δεδοµένα, δεδοµένα κειµένου, σήµατα ήχου κ.α. Η ανάλυση αυτών των δεδοµένων είναι απαραίτητη, τόσο για την κατανόηση των ϕαινο- µένων που αφορούν όσο και για την πρόβλεψή τους σε καθηµερινή ϐάση. Ενα αναπόσπαστο κοµµάτι λοιπόν της ανάλυσης δεδοµένων είναι η οµαδοποίηση αυτών σε κατηγορίες. Αυτή η εργασία προϋποθέτει τεχνικές για την ένταξη αυτών σε οµάδες που έχει ώς στόχο την καλύτερη εποπτεία της πληροφορίας, την εξαγωγή πιο άµεσου συµπεράσµατος και αργότερα την άµεση λήψη αποφάσεων για το πρόβληµα µε το οποίο σχετίζονται. Η αναγνώριση προτύπων καλύπτει αυτή την εργασία ϐρίσκοντας οµοιότητες και πρότυπα ανάµεσα στα δεδοµένα.μέσω αυτής πραγµατοποιείται επίσης αυτόµατος σχεδιασµός και λειτουργία συστήµατος για αναγνώριση όµοιων δοµών µε σκοπό αργότερα την πρόβλεψη του αποτελέσµατος ιαδικασία Οµαδοποίησης Η επεξεργασία των δεδοµένων και η εξαγωγή προτύπων απαιτεί την υλοποίηση των πα- ϱακάτω σταδίων όπως αναφέρεται στα[4, 5, 3] και συνοψίζονται στην εικόνα 2.1: Ακριβής διατύπωση του προβλήµατος. Συλλογή δεδοµένων για το εκάστοτε πρόβληµα. 17

24 Κεφάλαιο 2. Θεωρητικό υπόβαθρο Αρχική εξέταση δεδοµένων: Ελεγχος των δεδοµένων και εξασφάλιση αρτιότητας αυτών ως προς ακραίες και ελλιπείς τιµές. Εξαγωγή στατιστικών µεγεθών και απεικόνιση αυτών για καλύτερη κατανόηση της δοµής. Επιλογή χαρακτηριστικών. Από το σύνολο δεδοµένων ϑα πρέπει να επιλεγούν εκείνες οι οντότητες που ενδια- ϕέρουν το πρόβληµά µας και πρέπει να οµαδοποιηθούν. Τα χαρακτηριστικά εκείνα που πρέπει µε τη σειρά τους να επιλεγούν είναι εκείνα που κωδικοποιούν κατάλληλα την πληροφορία. Αυτό γίνεται µε σκοπό την µείωση της διάστασης του δείγµατος καθώς και για επιτάχυνση της οµαδοποίησης.αυτά παριστάνονται ως d-διαστάσεων διανύσµατα. Επιλογή αλγορίθµου συσταδοποίησης και υλοποίηση αυτού. Ο αλγόριθµος ϑα πρέπει να ανακαλύψει στη δοµή όµοια σχήµατα υψηλής πυκνότητας και πληροφορίας. Η επιλογή του συνήθως αφήνεται στην πλευρά του µελετητή αφού λάβει υπόψη του κάποιο κριτήριο, κατάλληλο για το πρόβληµα. Αυτό ονοµάζεται µέτρο εγγύτητας και ποσοτικοποιεί την οµοιότητα µεταξύ των σχηµάτων που ϑα ανακαλυφθούν. Επίσης πρέπει να αναφερθεί ότι διαφορετικοί αλγόριθµοι για το ίδιο δείγµα µπορεί να καταλήξουν σε διαφορετικές οµάδες δηλαδή σε διαφορετικά αποτελέσµατα. Εκµάθηση χωρίς επίβλεψη (clustering). ιεξοδική και ερευνητική ανάλυση δεδοµένων για επιτυχή εξαγωγή αποτελέσµατος. Το στάδιο αυτό µπορεί να χρησιµοποιηθεί ώς το πρώτο ϐήµα για περεταίρω συσταδοποίηση µε διαφορετικό αλγόριθµο. Εκτίµηση αποτελεσµάτων και ερµηνεία. Το τελικό αποτέλεσµα αφήνεται στη κρίση του µελετητή γνωρίζοντας τα δεδοµένα που έχει στη διάθεσή του και είναι γνώστης του προβλήµατος που αντιµετωπίζει. Σχήµα 2.1: ιαδικασία Οµαδοποίησης-Βασικά ϐήµατα. 18

25 2.2 Συσταδοποίηση (clustering):βασικές έννοιες Εφαρµογές της Οµαδοποίησης Η οµαδοποίηση ϐρίσκει εφαρµογή σε ευρύ ϕάσµα. Μερικά από αυτά που µπορούµε να αναφέρουµε είναι η επεξεργασία εικόνας (image prossessing), η στατιστική ανάλυση µεγάλου όγκου δεδοµένων, η ανάκτηση πληροφοριών (data retrieval) καθώς και το κοµµάτι της επιχειρησιακής έρευνας (marketing research) -παραδείγµατος χάριν η κατηγοριοποίηση πελατών µε σκοπό τη διάθεση ϐέλτιστου προϊόντος στον κάθε πελάτη στοχευµένα [6, 7, 8]. Ακόµα αξίζει να αναφερθούν : Πρόβλεψη ϐασισµένη σε οµάδες :Η οµαδοποίηση ϑα πρέπει να εφαρµοστεί σε ένα σύνολο προτύπων και έτσι κάθε οµάδα ϑα χαρακτηρίζεται από τα χαρακτηριστικά του προτύπου στο οποίο ανήκει. Η κάθε οµάδα αποτελείται από ένα αντιπρόσωπο, συνεπώς εάν εµφανιστεί ένα καινούργιο πρότυπο ϑα πρέπει να αποφασιστεί σε ποια οµάδα ϑα ανήκει σύµφωνα µε το ϐαθµό οµοιότητας του προτύπου. Χαρακτηριστικό παράδειγµα µπορεί να αποτελεί ένα σύνολο από ασθενείς οι οποίοι έχουν νοσήσει από την ίδια αρρώστια και εφαρµόζουµε την οµαδοποίηση. Τα χαρακτηριστικά της οµαδοποίησης ϑα είναι οι αντιδράσεις των ασθενών εξαιτίας της αρρώστιας προκειµένου να χωρισθούν σε οµάδες. Άν όµως εµφανιστεί ένας νέος ασθενής ϑα πρέπει να αναγνωριστεί η πιο πιθανή οµάδα στην οποία ανήκει προκειµένου να λάβει την κατάλληλη ϕαρµακευτική αγωγή. Μείωση εδοµένων(data reduction): Οπως είναι ϕυσικό κάθε ερευνητικός τοµέας χαρακτηρίζεται από µεγάλο πλήθος δεδοµένων. Για το λόγο αυτό ϑα πρέπει τα δεδο- µένα να οργανωθούν σε οµάδες προκειµένου να είναι πιο εύχρηστη η πληροφορία και εύκολα δαχειρίσιµη. Για να γίνει αυτό όµως υπάρχει ένα κόστος.θα πρέπει να είµαστε ιδιαίτερα προσεκτικοί και να αναζητούµε εκείνη την απλοποίηση δεδοµένων που ϑα ϕέρει τη µικρότερη απώλεια πληροφορίας. Η συµπίεση των δεδοµένων πραγµατοποιείται µε τη ϐοήθεια ενός αντιπροσώπου από κάθε οµάδα που ϑα χαρακτηρίζεται από ένα κωδικό. Ετσι αντί να µεταφέρουµε κάθε ϕορά όλα εκείνα τα δεδοµένα που αντιστοιχούν στον αντιπρόσωπο µεταφέρουµε µόνο έναν κωδικό. 2.2 Συσταδοποίηση (clustering):βασικές έννοιες Οι παρακάτω έννοιες εµφανίζονται συχνά στη συσταδοποίηση δεδοµένων και είναι καλό να αναφερθούν για να έχει ο αναγνώστης µια πιο ολοκληρωµένη εικόνα Οµάδες και κέντρα Ορισµοί οµάδας Στη ϐιβλιογραφία υπάρχουν διάφοροι ορισµοί που ορίζουν την έννοια της οµάδας. Οπως γνωρίζει κανείς οµάδα είναι µια συλλογή από όµοια αντικείµενα που έχουν συγκεντρωθεί µαζί. Ωστόσο ο Everitt [9], προτείνει τους εξής ορισµούς : Οι Οµάδες µπορούν να περιγραφούν ως συνδεδεµένες περιοχές ενός πολυδιάστατου χώρου, που περιέχουν σχετικά υψηλή πυκνότητα σηµείων και που είναι χωρισµένες µεταξύ τους µε περιοχές, η πυκνότητα των οποίων είναι σχετικά µικρότερη. 19

26 Κεφάλαιο 2. Θεωρητικό υπόβαθρο Οµάδα είναι µια συσσωµάτωση σηµείων του πεδίου αναφοράς τέτοια ώστε η απόσταση κάθε δυο σηµείων της Οµάδας να είναι µικρότερη από την απόσταση µεταξύ κάθε σηµείου της Οµάδας και οποιουδήποτε άλλου σηµείου. Οµάδα είναι το σύνολο των οντοτήτων που είναι όµοιες, και οντότητες από διαφορετικά σύνολα δεν είναι όµοιες. Σηµαντικό είναι να αναφερθεί ότι οι δύο πρώτοι ορισµοί αναφέρονται σε µετρικό χώρο καθώς λαµβάνει χώρα η έννοια της απόστασης και της πυκνότητας. Κάτι τέτοιο όµως δεν είναι απαραίτητο να ισχύει σε όλες τις εφαρµογές όπως ϑα δούµε παρακάτω. Επίσης σε αρκετές εφαρµογές η έννοια της οµάδας δεν µπορεί να οριστεί εύκολα και εκεί λαµβάνει πρωτοβουλίες ο ερευνητής γνωρίζοντας το πρόβληµα και τα αποτελέσµατα που περιµένει να προκύψουν. Στο παρακάτω παράδειγµα [8] µπορεί να γίνει αντιληπτή αυτή η δυσκολία. Οπως ϕαίνεται στην εικόνα 2.2 η οποία απεικονίζει 20 σηµεία και 3 διαφορετικούς τρόπους κατηγοριοποίησης αυτών σε οµάδες. Το σχήµα των σηµείων απεικονίζει την οµάδα στην οποία ανήκουν. Το 2.2(b) και το 2.2(d) χωρίζουν το δείγµα σε 2 και 6 οµάδες αντίστοιχα.ωστόσο ο χωρισµός των δύο οµάδων σε τρεις υποοµάδες µπορεί να είναι ένα παράγωγο του οπτικού συστήµατος του ανθρώπου. Επίσης δεν είναι παράλογο να πούµε ότι το δείγµα σχηµατίζει τέσσερις οµάδες όπως ϕαίνεται στο 2.2(c). Συνεπώς µπορούµε να καταλάβουµε ότι ο ορισµός της οµάδας είναι υποκειµενικός και η καλύτερη απόφαση για τον αριθµό των οµάδων εξαρτάται από την ϕύση των δεδοµένων και τον ορισµό του προβλήµατος. Οπως έγινε κατανοητό δεν υπάρχει κοινά αποδεκτός ορισµός της οµάδας. Ωστόσο ϑα πρέπει οι οµάδες να έχουν κάποιες κοινές ιδιότητες όπως αναφέρονται στο [5]: Πυκνότητα (Density): είναι εκείνη η ιδιότητα που καθορίζει την οµάδα ως ένα σχετικά παχύ σµήνος από σηµεία σε έναν χώρο, συγκρινόµενη µε άλλες περιοχές του χώρου, που µπορεί να έχουν λιγότερα αν όχι καθόλου σηµεία. εν υπάρχει απόλυτο µέτρο πυκνότητας. ιασπορά (Variance): είναι ο ϐαθµός διασκόρπισης των σηµείων σε σχέση µε το κέντρο της οµάδας. Η ιδιότητα της οµάδας ϑα µπορούσε να ϑεωρηθεί ως η σχετική εγγύτητα των σηµείων στον χώρο. Εποµένως οι οµάδες χαρακτηρίζονται ως «σφικτές» (tight) όταν όλα τα σηµεία της οµάδας είναι συγκεντρωµένα κοντά στο κέντρο ή ως «χαλαρές» (loose) όταν τα σηµεία της οµάδας είναι διασκορπισµένα σε σχέση µε το κέντρο. ιάσταση (Dimension): είναι µια ιδιότητα αρκετά συγγενής µε την διασπορά. Αν µια οµάδα αναγνωριστεί τότε µπορεί να µετρηθεί η ακτίνα της. Αυτή η ιδιότητα χρησιµοποιείται µόνο για οµάδες που σχηµατίζουν υπερσφαίρες σε έναν πολυδιάστατο χώρο που ορίζεται από τις µεταβλητές. Σχήµα (Shape): είναι ο σχηµατισµός που έχουν τα σηµεία στον χώρο.υπάρχουν πολλών ειδών σχήµατα όπως υπερσφαιρικά, ελλειψοειδή, επιµήκη κ.α. Αν οι οµάδες σχηµατίζονται µε τέτοιον τρόπο ώστε η έννοια της διαµέτρου ή της ακτίνας να µην 20

27 2.2 Συσταδοποίηση (clustering):βασικές έννοιες Σχήµα 2.2: ιαφορετικοί τρόποι οµαδοποίησης του ίδιου δείγµατος. έχει νόηµα τότε µπορεί να υπολογιστεί η έννοια της συνεκτικότητας (connectivity) των σηµείων της οµάδας, η οποία είναι ένα σχετικό µέτρο της απόστασης µεταξύ αυτών. ιαχωρισµός (Separation): είναι ο ϐαθµός υπερκάλυψης των οµάδων.οι οµάδες µπορεί να υπερκαλύπτονται (overlap) ή να ϐρίσκονται χωριστά στον χώρο. Παραδείγ- µατος χάριν οι οµάδες µπορεί να είναι η µία κοντά στην άλλη χωρίς να έχουν πολύ ξεκάθαρα όρια ή να ϐρίσκονται σχετικά µακριά µεταξύ τους µε ευδιάκριτα όρια. Είδη συσταδοποίησης Θα αναλυθούν δύο ϐασικά είδη συσταδοποίησης. Αυτά είναι η σκληρή συσταδοποίηση (hard clustering) και η ιεραρχική (hierarchical clustering). Ακολουθεί η µαθηµατική περιγραφή : Εστω ένα σύνολο από διανύσµατα εισόδου τα οποία αποτελούν τις παρατηρήσεις του δείγµατός µας, X = { x 1,..x j,..x N } όπου xj = { x j1, x j2,...x jd } R d.το x ji αναπαριστά ένα χαρακτηριστικό της παρατήρησης-j. Αυτό µπορεί να είναι ένα µια ιδιότητα η µία µεταβλητή, αναλόγως τι αντιπροσωπεύει το δείγµα. Σκληρή συσταδοποίηση: Η σκληρή συσταδοποίηση ϑα αναζητήσει έναν ευδιάκριτο διαχωρισµό του συνόλου δεδοµένων σε K οµάδες. Η κάθε οµάδα ϑα αποτελείται από τον δικό της αντιπρόσωπο που ονοµάζεται κέντρο της συστάδας C = { C 1, C 2,...C K } όπου προφανώς (K N).Θα πρέπει να ισχύει C i, i = 1,...K K i=1 C i = X C i C j =, i, j = 1...K και i j Ιεραρχική συσταδοποίηση: Με την σειρά της η ιεραρχική συσταδοποίηση προσπαθεί να δηµιουργήσει δενδροειδή δοµή οµάδων όπου κάθε παρατήρηση αρχικά αποτελεί 21

28 Κεφάλαιο 2. Θεωρητικό υπόβαθρο µια οµάδα αυτόνοµα, όπου στο τέλος όλες οι παρατηρήσεις µε συσσωρευτικό τρόπο ϑα ανήκουν σε µία οµάδα. Ισχύει H = {H 1,...H Q } µε (Q N) έτσι ώστε : C i H m, C j H l και m > l C i C j ή C i C j = για όλα τα i, j m, l = 1...Q Ακόµα στην σκληρή συσταδοποίηση κάθε παρατήρηση του δείγµατος ανήκει αποκλειστικά και µόνο σε µία οµάδα. Ωστόσο είναι δυνατόν κάθε παρατήρηση να ανήκει σε παραπάνω από µία οµάδα ή και σε όλες τις συστάδες µε ένα ϐαθµό συµµετοχής,u i,j [0, 1] που αντιπροσωπεύει το ϐαθµό συµµετοχής του j th αντικειµένου στο i th cluster και ικανοποιεί όµως τους δύο παρακάτω περιορισµούς : K u i,j = 1, j όπου, i=1 N u i,j < N i=1 i: Το i στo cluster j: Το j στo αντικείµενο K: Το σύνολο των οµάδων όπως αναφέρονται στη ϑεωρία της ασαφούς συσταδοποίησης (fuzzy clustering) Αποστάσεις και οµοιότητες Οι δείκτες οµοιότητας, ανοµοιότητας καθώς και οι αποστάσεις χρησιµοποιούνται για να περιγράψουν ποσοτικά τον ϐαθµό οµοιότητας και ανοµοιότητας µεταξύ των παρατηρήσεων ή µεταξύ των διαφορετικών οµάδων που προκύπτουν. Στις τεχνικές της συσταδοποίησης οι έννοιες απόσταση και οµοιότητα συµπίπτουν. Συγκεκριµένα όσο πιο µικρή είναι η απόσταση ή όσο πιο µεγάλος ο δείκτης οµοιότητας τόσο πιο όµοιες είναι δύο παρατηρήσεις. Αντίστροφα όσο πιο µεγάλη είναι η απόσταση και πιο µεγάλο το µέτρο ανοµοιότητας τόσο πιο πολύ διαφέρουν δυο παρατηρήσεις. Η ευκλείδεια απόσταση ανάµεσα στο x = {x 1, x 2,..., x d } T όπου d διαφορετικά χαρακτη- ϱιστικά ή µεταβλητές της x παρατήρησης και y = {y 1, y 2,..., y d } T αντίστοιχα, ορίζεται ώς εξής : d(x, y) = ( d ( xi y j ) 2)1 2 (2.1) j=1 Οι αλγόριθµοι οµαδοποίησης και οι µετρικές αξιολόγησης ϐασίζονται στο δείκτη οµοιότητας ή ανοµοιότητας µεταξύ των παρατηρήσεων. Γι αυτό το λόγο πολύ σηµαντικό ϱόλο παίζει η ευκλείδεια απόσταση η οποία είναι η πιο διαδεδοµένη [3] Τύποι δεδοµένων Η επιλογή του αλγορίθµου συσταδοποίησης συνδέεται σε µεγάλο ϐαθµό µε τον τύπο δεδοµένων που ϑέλουµε να εξετάσουµε [3, 10]. Οι τύποι δεδοµένων συνδέονται άµεσα µε 22

29 2.2 Συσταδοποίηση (clustering):βασικές έννοιες το ϐαθµό κβαντισµού της πληροφορίας. Πολλές ϕορές όταν οι µεταβλητές είναι αριθµοί, επιλέγεται η µετατροπή αυτών σε κατηγορικά δεδοµένα µε σκοπό την ελάττωση της πλη- ϱοφορίας χωρίς να χάνουµε όµως από αυτήν. Επίσης µπορεί µια µεταβλητή να είναι διακριτή, δυαδική ή συνεχής. Είναι εύλογο να σκεφτεί κανείς ότι εφόσον µια δυαδική µεταβλητή παίρνει δύο τιµές [0, 1], τότε οι δυαδικές µεταβλητές αποτελούν µια ειδική περίπτωση των διακριτών. Ακολουθεί η περιγραφή των διαφόρων τύπων δεδοµένων : Κατηγορικά δεδοµένα : Οι κατηγορικές µεταβλητές αναφέρονται και ως ονοµαστικές, οι οποίες χρησιµοποιούνται απλά σαν ονόµατα, παραδείγµατος χάριν τα υποκαταστήµατα των τραπεζών. Τα σύνολα δεδοµένων µπορούµε να τα αντιληφθούµε ώς ένα πεπερασµένο αριθµό α- πό σηµειακά δεδοµένα. Συνεπώς µια ονοµαστική τιµή των σηµειακών δεδοµένων στο σύνολο, µπορεί να πάρει ένα πεπερασµένο αριθµό τιµών. Για αυτό το λόγο ο ονοµαστικός τύπος µεταβλητής είναι µια ειδική περίπτωση του διακριτού[10]. υαδικά δεδοµένα : Μια δυαδική µεταβλητή µπορεί να πάρει ακριβώς δύο τιµές, σωστό ή λάθος. Οι δυαδικές µεταβλητές µπορούν να χωρισθούν περεταίρω σε συµµετρικές δυαδικές και ασύµµετρες. Σε µια συµµετρική δυαδική µεταβλητή οι δύο τιµές της είναι αµοιβαία ίσης σηµασίας. Για παράδειγµα το ϕύλο :άνδρας-γυναίκα. Ενώ σε µια ασύµµετρη δυαδική µεταβλητή η µία από τις δύο τιµές που µπορεί να πάρει έχει περισσότερη σηµασία. Για παράδειγµα, το ναι αντιστοιχεί στην ύπαρξη ενός συγκεκριµένου χα- ϱακτηριστικού, ενώ το όχι στην έλλειψή του [10]. εδοµένα συναλλαγής : Τα δεδοµένα συναλλαγής µπορούν να παρασταθούν από δυαδικά διανύσµατα, στα οποία κάθε καταχώρηση δηλώνει την ύπαρξη ή απουσία του αντίστοιχου αντικειµένου. Για δοσµένο σύνολο δεδοµένων από αντικείµενα I = {I 1, I 2,...I m } µια συναλλαγή είναι ένα υποσύνολο του I. Για παράδειγµα µπορούµε να παραστήσουµε µια συναλλαγή t i ώς το δυαδικό διάνυσµα (b i1, b i2,.., b im ) όπου b ij = 1 αν I j t i και b ij = 0 άν I j t i. Για τον λόγο αυτό µπορούµε να πούµε ότι τα δεδοµένα συναλλαγής είναι µια ειδική περίπτωση των δυαδικών δεδοµένων. Το πιο τρανταχτό παράδειγµα από δεδοµένα συναλλαγής ϐρίσκεται στην αγορά προϊόντων. Οι συναλλαγές είναι οι λίστες µε αντικείµενα από ένα υποσύνολο άλλων αντικειµένων [10]. Συµβολικά δεδοµένα : Τα κατηγορικά δεδοµένα και τα δυαδικά είναι κλασική περίπτωση δεδοµένων. Τα συµβολικά δεδοµένα είναι µια επέκταση των κλασικών αυτών δύο τύπων. Τα συµ- ϐολικά δεδοµένα παρουσιάζουν υψηλό ή χαµηλό ϐαθµό οµογένειας, λόγω του ότι τα συµβολικά αυτά σύνολα είναι ενοποιηµένα µέσω σχέσεων απ ό,τι τα συµβατικά σύνολα που αντιµετωπίζονται µεµονωµένα. Οι διαφορές µεταξύ των συµβολικών και των συµβατικών δεδοµένων είναι οι εξής : Οι µεταβλητές σε ένα περίπλοκο σύνολο συµβολικών δεδοµένων µπορούν να δεχθούν τιµές που περιλαµβάνουν ένα ή περισσότερα στοιχειώδη αντικείµενα. 23

30 Κεφάλαιο 2. Θεωρητικό υπόβαθρο Οι τιµές των µεταβλητών µπορεί να ϕανερώνουν συχνότητα εµφάνισης, σχετική πιθανότητα, επίπεδο σηµασίας των τιµών κ.ο.κ. Ολα τα αντικείµενα σε ένα σύνολο συµβολικών δεδοµένων δεν µπορούν να οριστούν από τις ίδιες µεταβλητές. Η περιγραφή ενός συµβολικού αντικειµένου µπορεί να στηρίζεται σε σχέσεις που υπάρχουν µεταξύ άλλων αντικειµένων. Κάθε µεταβλητή µπορεί να δεχθεί πάνω από µία τιµή ή και ένα διάστηµα τιµών. Χρονικές σειρές : Οι χρονικές σειρές (time series) αποτελούν την πιο απλή περίπτωση προσωρινών δεδοµένων. Πιο συγκεκριµένα οι χρονικές σειρές είναι µια σειρά από πραγµατικούς αριθµούς που αναπαριστούν τις µετρήσεις µιας πραγµατικής µεταβλητής σε ίσα χρονικά διαστήµατα. Για παράδειγµα στο τοµέα της ενεργειακής κατανάλωσης και στην εξαγωγή προφίλ ϕορτίου κατανάλωσης οικιακού, εµπορικού ή ϐιοµηχανικού καταναλωτή, οι έξυπνοι µετρητές ενέργειας (smart energy meters), ενεργού ή άεργου ισχύος τροφοδοτούν τον ερευνητή µε τέτοια δεδοµένα κατανάλωσης µε στόχο τη στατιστική ανάλυση αυτών και την εξαγωγή συµπερασµάτων. Μία χρονική σειρά είναι διακριτή αν η µεταβλητή ορίζεται σε ένα πεπερασµένο σύνολο χρονικών σηµείων. Οι περισσότε- ϱες από τις χρονικές σειρές που απαντώνται στην ανάλυση σε συστάδες είναι διακριτές σειρές. Οταν µία µεταβλητή ορίζεται σε κάθε χρονικό σηµείο, τότε η χρονική σειρά χαρακτηρίζεται ώς συνεχής. Γενικά µία τέτοια χρονική σειρά µπορούµε να πούµε ότι αποτελείται από τα ακόλουθα χαρακτηριστικά : Μία εποχιακή συνιστώσα. Μία επιµέρους ή τυχαία επίδραση. Μία τάση, η µια µακροπρόθεσµη κίνηση. Οι διακυµάνσεις αυτής της τάσης, µεγαλύτερης ή µικρότερης συχνότητας[10]. 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Αλγόριθµος k-means Ο αλγόριθµος k-means [11, 12, 13, 14, 15, 16, 10, 17] ανήκει στην κατηγορία των διαµεριστικών αλγορίθµων και προτάθηκε από τον MacQeen (1967). Οι διαµεριστικοί αλγόριθµοι προκαλούν µια διαµέριση του χώρου των δεδοµένων, χωρίς να δηµιουργούν πιο πολύπλοκες δοµές που περιγράφονται µε δενδρογράµµατα και κατασκευάζουν µοναδικές ο- µαδοποιήσεις και όχι δοµές οµάδων όπως ένας Ιεραρχικός αλγόριθµος. Ανήκει στην ευρύτε- ϱη κατηγορία τεχνικών εκµάθησης χωρίς επίβλεψη. Είναι ένας από τους πιο διαδεδοµένους αλγορίθµους συσταδοποίησης λόγω της απλότητας και της ταχύτητάς που τον χαρακτηρίζει. Πρέπει να σηµειωθεί ότι ανήκει στη κατηγορία σκληρής συσταδοποίησης (hard clustering), δηλαδή κάθε παρατήρηση ανήκει αποκλειστικά σε µία οµάδα, αποτρέποντας την αλληλοεπικάλυψη µεταξύ συστάδων. 24

31 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Ο k-means απαιτεί να είναι εκ των προτέρων γνωστός ο αριθµός οµάδων που ϑα προκύψουν και ϑα είναι οι τελικές συστάδες.αυτό χαρακτηρίζεται ως ένα σοβαρό πρόβληµα όπου έχουν προταθεί διάφορα κριτήρια για την τελική επιλογή του αριθµού οµάδων, που εξαρτάται άµεσα από τα διαθέσιµα δεδοµένα και την ϕύση του προβλήµατος που µελετάµε. Η κλασική λοιπόν µορφή του αλγορίθµου απαιτεί να ορίσουµε εµείς ένα συγκεκριµένο αριθµό από k κέντρα των οµάδων (centroids) που ϑα συµβολίζουν και τον αριθµό των τελικών clusters. Στη συνέχεια ϑα πρέπει να γίνει ανάθεση κάθε παρατήρησης-προτύπου από το σύνολο δεδοµένων στο κοντινότερο centroid. Να σηµειωθεί ότι αρχικά, τα κέντρα επιλέγονται τυχαία από τον αλγόριθµο αν µιλάµε για την κλασική µορφή του k-means. Αυτό συµβαίνει επειδή διαφορετικές αρχικοποιήσεις κέντρων οδηγούν σε διαφορετικά αποτελέσµατα.αφού πραγµατοποιηθεί αυτό για όλα τα δεδοµένα τότε έχουµε πραγµατοποιήσει µια πρώτη µορ- ϕή clustering. Επειτα γίνεται επαναϋπολογισµός των centroids µε ϐάση τα clusters που έχουν προκύψει από αυτό το πρώτο ϐήµα και τοποθετούνται σε νέες ϑέσεις έτσι ώστε να αντικατοπτρίζουν το κέντρο των δεδοµένων που ανήκουν στην συγκεκριµένη συστάδα. Ετσι όταν έχουµε k καινούργια centroids επαναϋπολογίζονται οι νέες ϑέσεις των δεδοµένων και τοποθετούνται στο κοντινότερο και πιο αντιπροσωπευτικό για αυτά κέντρο. Αυτός ο ϐρόχος λειτουργίας τερµατίζεται όταν τα κέντρα δεν αλλάζουν πλέον ϑέσεις και τα πρότυπα δεν µετακινούνται σε νέες οµάδες.αυτό ϑα είναι και το ϐέλτιστο αποτέλεσµα της διαδικασίας, η οποία τερµατίζει µετά από ένα προκαθορισµένο από τον χρήστη, αριθµό επαναλήψεων ή όταν η διαφορά των τιµών της αντικειµενικής συνάρτησης µεταξύ δύο διαδοχικών επαναλήψεων να προσεγγίσει ένα προκαθορισµένο κατώφλι. Εστω ώς είσοδο στον αλγόριθµο δίνεται ένα σύνολο δεδοµένων X = {x n, n = 1...N}. Το συγκεκριµένο σύνολο ϑα χωρισθεί σε k οµάδες µε C(k) το κέντρο της k οµάδας. Ο ϐασικός στόχος του k-means είναι να ελαχιστοποιήσει την συνάρτηση τετραγωνικού σφάλµατος ή αλλιώς συνάρτηση στόχου που ορίζεται ως εξής : J = K j=1 x m S i x m C i 2 (2.2) Οπου, x m C i 2 είναι η ευκλείδεια µετρική απόσταση και χρησιµοποιείται για τον υπολογισµό της απόστασης κάθε στοιχείου x m από το κέντρο C i k, ο αριθµός των clusters, C i,το centroid όλων των στοιχείων x m S i. Για να αποφύγουµε να πέσουµε σε τοπικό ελάχιστο ϑα πρέπει ο αριθµός των επαναλήψεων του αλγορίθµου να είναι ικανός να ξεπερνάει αυτό το σφάλµα.για αυτό το λόγο ϑα πρέπει να επιλεγεί τέτοιος αριθµός επαναλήψεων που να δίνει ολικό ελάχιστο στην συνάρτηση στόχου. Η πολυπλοκότητα του αλγορίθµου αυξάνει γραµµικά σύµφωνα µε την σχέση O(I N K d) όπου l είναι ο αριθµός των επαναλήψεων, N είναι ο αριθµός των προτύπων-παρατηρήσεων του δείγµατος, K ο αριθµός των οµάδων που ϑα προκύψουν και d η διάσταση των παρατη- ϱήσεων. Συνοψίζοντας τα ϐήµατα που ακολουθεί ο k-means είναι : 25

32 Κεφάλαιο 2. Θεωρητικό υπόβαθρο 1. Επέλεξε k σηµεία ως αρχικά κέντρα. 2. Επανέλαβε : 3. Σχηµάτισε k οµάδες τοποθετώντας την κάθε παρατήρηση στο κοντινότερο κέντρο. 4. Επαναϋπολόγισε το κέντρο της κάθε οµάδας. 5. Εως ότου τα κέντρα δεν αλλάζουν. Ιδιότητες του k-means Οι ιδιότητες του k-means που πρέπει να λάβει κανείς υπόψιν του πριν την επιλογή του αλγορίθµου είναι οι παρακάτω : Πλεονεκτήµατα : Επιτυγχάνει σύγκλιση σε τοπικό ϐέλτιστο. Ο αλγόριθµος δεν εγγυάται την σύγκλιση σε ολικό ελάχιστο, για αυτό ο αριθµός των επαναλήψεων πρέπει να ληφθεί υπόψιν. Εχει µεγάλη ταχύτητα. Επιτυγχάνει σύγκλιση µέσα σε σύντοµο χρονικό διάστηµα. Εχει την τάση να δηµιουργεί σφαιρικές και ίσου µεγέθους οµάδες. Μειονεκτήµατα : Μεγάλη ευαισθησία στη αρχική ανάθεση centroids. Ο αλγόριθµος εξαρτάται σε µεγάλο ϐαθµό από την αρχική επιλογή των κέντρων, καθώς διαφορετικές επιλογές οδηγούν σε εντελώς διαφορετικό αποτέλεσµα. υσκολία προσδιορισµού των πραγµατικών clusters. Άν τα στοιχεία ενός συνόλου εισαχθούν µε διαφορετική σειρά στον k-means, το αποτέλεσµα της οµαδοποίησης ϑα είναι εντελώς διαφορετικό. Η ϑέση του κέντρου επηρεάζεται σηµαντικά από ακραίες τιµές. Αν στο σύνολο δεδο- µένων υπάρχουν παρατηρήσεις αποµακρυσµένες από τα κέντρα, ίσως να οδηγήσουν σε αποµάκρυνση των κέντρων από την πραγµατική τους ϑέση. Παράδειγµα Οµαδοποίησης k-means Θα ακολουθήσει ένα παράδειγµα συσταδοποίησης, κάνοντας χρήση του k-means, οµαδοποιώντας παρατηρήσεις σε 3 οµάδες. Στο πρώτο ϐήµα επιλέγονται από το δείγµα παρατηρήσεων, 3 παρατηρήσεις ως αρχικά κέντρα. Στο δεύτερο ϐήµα δηµιουργούνται 3 οµάδες, αντιστοιχίζοντας κάθε παρατήρηση στο κοντινότερο κέντρο. Επειτα ως νέο κέντρο της οµάδας επιλέγεται ο µέσος όρος των παρατηρήσεων που ανήκουν στην ίδια οµάδα. 26

33 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Τέλος επαναλαµβάνονται τα ϐήµατα 2 και 3 µέχρι να επιτευχθεί σύγκλιση, δηλαδή η ϑέσεις των κέντρων να µην αλλάζουν ή να ικανοποιούν ένα όριο ανοχής. Στην εικόνα 2.3 απεικονίζεται αυτή η διαδικασία[18]. (αʹ)βήµα 1 (ϐʹ)βήµα 2 (γʹ)βήµα 3 (δʹ)βήµα 4 Σχήµα 2.3: Παράδειγµα χρήσης k-means Ιεραρχικοί αλγόριθµοι Οι µεγαλύτεροι και γρηγορότεροι υπολογιστές όπως ϕαντάζεται κανείς, δεν µπορούν να εξετάσουν όλες τις πιθανές οµαδοποιήσεις ενός συνόλου δεδοµένων και αν γίνεται κάτι τέτοιο απαιτεί πάρα πολύ χρόνο. Ωστόσο για να παρακαµφθεί αυτό το πρόβληµα, υπάρχει µια πληθώρα αλγορίθµων οµαδοποίησης, όπου µπορούν να ϐρουν λογικές συστάδες χωρίς να απαιτείται πολύ µεγάλη υπολογιστική ισχύς αλλά και χωρίς να εξεταστούν όλες οι πιθανές καταστάσεις. Αυτοί οι αλγόριθµοι αποτελούν κοµµάτι των ιεραρχικών τεχνικών οµαδοποίησης. Πιο συγκεκριµένα αυτές οι τεχνικές προχωρούν είτε µε µια σειρά διαδοχικών συγχωνεύσεων, είτε µε µια σειρά διαδοχικών διαιρέσεων. Συνεπώς προκύπτουν δύο ϐασικές κατηγορίες : Συσσωρευτικές(agglomerative): Οι συγκεκριµένες τεχνικές [19, 3, 7] ξεκινούν µε τόσες οµάδες όσα και τα αντικείµεναπαρατηρήσεις του συνόλου δεδοµένων, ϑεωρώντας κάθε αντικείµενο ώς µια ξεχωριστή συστάδα (cluster). Το επόµενο ϐήµα είναι τα πιο όµοια αντικείµενα να οµαδοποιηθούν πρώτα και οι αρχικές αυτές οµάδες συγχωνεύονται στο αµέσως επόµενο επίπεδο. Το Ϲευγάρι που επιλέχθηκε για την συγχώνευση αποτελείται από δύο οµάδες µε την µικρότερη ανοµοιότητα µέσα στη νέα οµάδα. Ο στόχος είναι στο τέλος να υπάρχει µία οµάδα, αποτελούµενη από υποοµάδες όλες τις υπόλοιπες καθώς αυξάνεται ο ϐαθµός ανοµοιότητας. 27

34 Κεφάλαιο 2. Θεωρητικό υπόβαθρο ιαιρετικές(divisive): Αυτές οι τεχνικές λειτουργούν στην αντίθετη σκοπιά από τις προηγούµενες. Μια αρχική οµάδα ϑα διαιρεθεί σε δύο υποοµάδες. Η διάσπαση αυτή ϑα παράξει δύο νέες οµάδες µε την µεγαλύτερη ανοµοιότητα µεταξύ των οµάδων. Αυτές οι υποοµάδες µε την σειρά τους διαιρούνται σε περαιτέρω ανόµοιες υποοµάδες. Η διαδικασία ϑα συνεχιστεί έως ότου υπάρξουν τόσες οµάδες τελικά όσες και οι παρατηρήσεις του δείγµατος. Συνεπώς οι συσσωρευτικές τεχνικές είναι η προσέγγιση από κάτω προς τα πάνω, αφού αρχικά κάθε αντικείµενο είναι µία οµάδα και καθώς ανεβαίνουµε προς τα πάνω στην ιεραρχία των οµάδων, σχηµατίζει Ϲευγάρι µε άλλες οµάδες. Ενώ, οι διαιρετικές είναι η προσέγγιση από πάνω προς τα κάτω. Ενα κοινό σηµείο των δύο τεχνικών είναι ότι υπάρχουν N 1 επίπεδα στην ιεραρχία. Αυτό γίνεται εύκολα κατανοητό στο σχήµα 2.4 στην οµαδοποίηση των 6 clusters: a, b, c, d, e, f. Κάθε επίπεδο της ιεραρχίας, αντιπροσωπεύει µια συγκεκριµένη οµαδοποίηση των πα- ϱατηρήσεων, σε καινούργιες οµάδες. Ολόκληρη η ιεραρχία µε την σειρά της αντιπροσωπεύει µια διατεταγµένη ακολουθία τέτοιων οµαδοποιήσεων. Χαρακτηριστικό γνώρισµα των ιεραρχικών τεχνικών είναι είναι το γεγονός ότι τα αντικείµενα από την στιγµή που ϑα καταχωρη- ϑούν σε µια οµάδα ϑα παραµείνουν σε εκείνη την οµάδα µέχρι το τέλος της διαδικασίας. Αναλόγως το πρόβληµα που αντιµετωπίζει ο ερευνητής ϑα πρέπει να επιλέξει πιο επίπεδο αντιπροσωπεύει πράγµατι µια ϕυσική ὁµαδοποίηση ή πόσες οµάδες επιµέρους δεδοµένων ϑέλει να δηµιουργηθούν. Αυτό ϐέβαια εξαρτάται και από τον ϐαθµό οµοιότητας ή ανο- µοιότητας υπάρχει στο συγκεκριµένο επίπεδο ιεραρχίας που ϑα προκύψουν οι επιθυµητές οµάδες. ενδρογράµµατα Το δενδρόγραµµα ορίζεται ως ένα δυαδικό δέντρο µε ϱίζα ένα αντικείµενο αν πρόκειται για διαιρετική διαδικασία ή µε ϱίζα όλες τις παρατηρήσεις αν πρόκειται για συσσωρευτική. Οι κόµβοι ή ϕύλλα του δέντρου αναπαριστούν οµάδες. Οι N τελικοί κόµβοι ή αρχικοί αναλόγως την διαδικασία αναπαριστάνουν ο καθένας µία από τις µεµονωµένες παρατηρήσεις. Κάθε ϕύλλο (κόµβος) του δέντρου (γονέας), έχει δύο κόµβους απογόνους. Για την διαιρετική συσταδοποίηση, οι δύο απόγονοι αναπαριστούν τις οµάδες που προκύπτουν από την διάσπαση του γονέα.ωστόσο, για την συσσωρευτική συσταδοποίηση, οι απόγονοι αναπαριστούν τις δύο οµάδες που συγχωνεύονται για να σχηµατίσουν τον γονέα. Πρέπει να τονισθεί ότι όλες οι συσσωρευτικές µέθοδοι διαθέτουν µια ιδιότητα µονοτονίας. ηλαδή, η ανοµοιότητα µεταξύ συγχωνευµένων οµάδων αυξάνεται µονότονα µε το επίπεδο της συγχώνευσης. Ετσι το δυαδικό δέντρο σχεδιάζεται ώστε το ύψος κάθε ϕύλλου να είναι ανάλογο µε την τιµή της ανοµοιότητας µέσα στην οµάδα, µεταξύ των δύο απογόνων. Αυτό έχει σαν αποτέλεσµα οι τερµατικοί κόµβοι που συµβολίζουν µεµονωµένες παρατηρήσεις να σχεδιάζονται σε µηδενικό ύψος. Αυτή η διαδικασία σχηµατίζει ένα δι-διάστατο διάγραµµα που ονοµάζεται δενδρόγραµµα. Ενα δενδρόγραµµα έχει συσσωρευµένη την πληροφορία της ιεραρχικής οµαδοποίησης και είναι πιο σαφές για τον ερευνητή να ανακαλύψει ϕυσικές οµάδες. Οι ιεραρχικές µέθοδοι επιβάλλουν ιεραρχική δοµή στα δεδοµένα, µε το σκεπτικό ότι µπορούν να αποτελέσουν µια 28

35 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Σχήµα 2.4: Συσσωρευτική και ιαιρετική συσταδοποίηση. τέτοια, ανεξάρτητα αν πληρούν την τελευταία. Συνεπώς η ερµηνεία που προσφέρει αυτό το διάγραµµα ϑα πρέπει να αντιµετωπίζεται µε προσοχή, αφού διαφορετικές µέθοδοι οδηγούν σε εντελώς διαφορετικά αποτελέσµατα για το ίδιο σύνολο δεδοµένων. Αλγόριθµοι συγχωνευτικής συσταδοποίησης : Υπάρχουν 7 διαφορετικοί αλγόριθµοι συγχωνευτικής συσταδοποίησης. Η διαφορά τους έγκειται στον τρόπο υπολογισµού των αποστάσεων ανάµεσα στις οµάδες. Χρησιµοποιούν διαφορετικές µετρικές που αποτιµούν την οµοιότητα των οµάδων που ϑα συγχωνευτούν. Αυτοί ο αλγόριθµοι είναι : Κοντινότερος γείτονας ή Απλή σύνδεση (single linkage) Μακρινότερος γείτονας ή Πλήρης σύνδεση (complete linkage) Σύνδεση µέσου όρου (average linkage) Σύνδεση κεντροειδούς (centroid) Μέθοδος του ward (ward) Σύνδεση διαµέσου (median) Σταθµισµένος µέσος όρος (weighted pair group): Μέθοδος απλής σύνδεσης (single linkage): ύο µέτρα µεταξύ οµάδων είναι : d AB = min(d ij ) όπου i A και j B d AB = max(d ij ) όπου i A και j B 29

36 Κεφάλαιο 2. Θεωρητικό υπόβαθρο όπου d AB είναι η απόσταση ανάµεσα στα δύο clusters A και B και d ij είναι η απόσταση ανάµεσα στα αντικείµενα i και j.η d AB µπορεί να είναι η ευκλείδεια απόσταση ή κάποια άλλη επιθυµητή που ανταποκρίνεται καλύτερα στα δεδοµένα µας, όπως seuclidean, cityblock, minkowski, mahalanobis, cosine και άλλες. Η ελάχιστη απόσταση αποτελεί την ϐάση της απλής σύνδεσης ενώ η µέγιστη, της πλήρης. Ακόµα η οµαδοποίηση µέσω οµάδας προκύπτει από την d AB = 1 d ij,όπου n A και n a n b n B είναι ο αριθµός των παρατηρήσεων στις δύο οµάδες A και B. Αυτά τα µέτρα επεξηγούνται στο σχήµα 2.5. i A j B Σχήµα 2.5: Απόσταση µεταξύ οµάδων για (a)απλή σύνδεση, (b)πλήρη σύνδεση, (c)σύνδεση µέσου όρου. Η µέθοδος απλής σύνδεσης καλείται και η µέθοδος του κοντινότερου γείτονα. Τα ο- ϱίσµατα εισόδου σε έναν αλγόριθµο απλής σύνδεσης, µπορεί να είναι αποστάσεις ή οµοιότητες µεταξύ Ϲευγών παρατηρήσεων. Οι οµάδες σχηµατίζονται από µεµονωµένες οντότητες, συγχωνεύοντας τους κοντινότερους γείτονες, όπου ο όρος κοντινότερος γείτονας σηµαίνει την µικρότερη απόσταση ή την µεγαλύτερη οµοιότητα σε µονάδες απόστασης. Ο συγκεκριµένος τρόπος προϋποθέτει η απόσταση µεταξύ ενός cluster και του άλλου να είναι ίση µε την µικρότερη απόσταση από οποιοδήποτε µέλος του ενός cluster από του άλλου. Γίνεται κατανοητό ότι η απλή σύνδεση, δεδοµένου ότι ενώνει τις συστάδες µε την συντο- µότερη σύνδεση, µεταξύ τους, η τεχνική αυτή δεν µπορεί να εντοπίσει τις κακώς χωριζόµενες συστάδες. Τα αποτελέσµατα της οµαδοποίησης απλής σύνδεσης µπορούν να εκφραστούν µε τη µορφή ενός δενδρογράµµατος όπως αναφέρθηκε. Τα κλαδιά του δέντρου αντιπροσωπεύουν τις συστάδες και ενώνονται στους κόµβους των οποίων οι ϑέσεις κατά µήκος ενός άξονα απόστασης δείχνουν το επίπεδο, στο οποίο εµφανίζονται οι συγχωνεύσεις. 30

37 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Οµαδοποίηση µε χρήση απλής σύνδεσης Η απλή σύνδεση ϑα γίνει πιο κατανοητή µε το ακόλουθο παράδειγµα. Υποθέτουµε 5 αντικείµενα : Θεωρούµε αρχικά κάθε αντικείµενο ως µια αυτοτελή οµάδα. Η διαδικασία της οµαδοποίησης αρχίζει µε την συγχώνευση των δύο κοντινότερων στοιχείων. Αφού min i,k (d ik ) = d 53 = 2,τα αντικείµενα 5 και 3, ϑα συγχωνευτούν για να σχηµατίσουν την συστάδα (35). Το επόµενο επίπεδο οµαδοποίησης ϑα χρειαστεί τις αποστάσεις µεταξύ της συστάδας 35 και των αντικει- µένων 1,2,4. Οι αποστάσεις των κοντινότερων γειτόνων είναι : d (35)1 = min{d 31, d 51 } = min{3, 11} = 3 d (35)2 = min{d 32, d 52 } = min{7, 10} = 7 d (35)4 = min{d 34, d 54 } = min{9, 8} = 8 Επειτα διαγράφοντας τις στήλες και τις γραµµές του D που αντιστοιχούν στα αντικείµενα 3 και 5 και προσθέτοντας µια γραµµή και στήλη για την συστάδα (35), παίρνουµε τον καινούργιο πίνακα αποστάσεων : Η µικρότερη απόσταση µεταξύ των Ϲευγαριών των οµάδων είναι τώρα d (35)1 = 3 και σε αυτό το ϐήµα συγχωνεύονται οι συστάδες 1 και (35) για να εξάγουµε την επόµενη οµάδα (135). Υπολογίζοντας : d (135)2 = min{d (35)2, d 12 } = min{7, 9} = 7 d (135)4 = min{d (35)4, d 41 } = min{8, 6} = 6 Ο πίνακας αποστάσεων για το επόµενο επίπεδο οµαδοποίησης γίνεται : Η ελάχιστη απόσταση τώρα των κοντινότερων γειτόνων µεταξύ των υπάρχουσων Ϲευγαριών 31

38 Κεφάλαιο 2. Θεωρητικό υπόβαθρο Σχήµα 2.6: ενδρόγραµµα απλής σύνδεσης. είναι d 42 = 5 και συγχωνεύονται τα αντικείµενα 4 και 2 για να πάρουµε την συστάδα (24). Σε αυτό το σηµείο προκύπτουν δύο ευδιάκριτες συστάδες, οι (135) και η (24). Η απόσταση του κοντινότερου γείτονά τους είναι d (135)(24) = min{d (135)2, d (135)4 } = min{7, 6} = 6 Ο τελικός πίνακας αποστάσεων γίνεται : Συνεπώς τα clusters (135) και (24) συγχωνεύονται για να σχηµατίσουν µια νέα οµάδα,όλων των πέντε αντικειµένων, την (12345), όταν η απόσταση του κοντινότερου γείτονα γίνει 6. Το δενδρόγραµµα απεικονίζει την ιεραρχική οµαδοποίηση που πραγµατοποιήθηκε µε την τεχνική της απλής σύνδεσης στο σχήµα 2.6: Μέθοδος πλήρους σύνδεσης (complete linkage): Η οµαδοποίηση της πλήρους σύνδεσης, ακολουθεί την ίδια πορεία µε την απλή σύνδεση, µε µια σηµαντική διαφορά.σε κάθε επίπεδο, η απόσταση (οµοιότητα) ανάµεσα στις οµάδες καθορίζεται από την απόσταση ανάµεσα σε 2 αντικείµενα που είναι τα πιο απόµακρα. Αυτό έχει ως αποτέλεσµα να αποκαλείται η µέθοδος του µεγίστου ή µέθοδος του µακρινότερου γείτονα. Συνεπώς αυτή η τεχνική εξασφαλίζει ότι όλα τα στοιχεία που ϑα αποτελέσουν µία οµάδα ϐρίσκονται σε σχετική µέγιστη απόσταση µεταξύ τους. Η µέθοδος δεν συνίσταται για δεδοµένα στα οποία µπορεί να υφίσταται αρκετός ϑόρυβος, δηλαδή να υπάρχουν στο δείγµα αυτό ακραίες τιµές. Το πλεονέκτηµά της είναι ότι δηµιουργεί συµπαγείς συστάδες, σε αντίθεση µε την απλή σύνδεση που δηµιουργεί σκόρπιες και επιµήκεις οµάδες. Ακόµα ϑεωρείται χρήσιµη αν αναµένουµε ότι τα αντικείµενα της ίδιας συστάδας ϐρίσκονται σε µεγάλη απόσταση µεταξύ τους στον πολυδιάστατο χώρο. 32

39 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Οµαδοποίηση µε την χρήση πλήρους σύνδεσης : Θεωρούµε ξανά τον πίνακα αποστάσεων : Στο πρώτο στάδιο τα αντικείµενα 3 και 5 ϑα συγχωνευτούν αφού είναι τα πιο όµοια (µικρότερη απόσταση). Αυτό ϑα δώσει την οµάδα (35). Στο δεύτερο στάδιο τώρα ϕαίνεται η αλλαγή από την απλή σύνδεση αφού υπολογίζουµε την µέγιστη απόσταση µεταξύ των υπολοίπων αντικειµένων 1,2,4. Άρα έχουµε : d (35)1 = max{d 31, d 51 } = max{3, 11} = 11 d (35)2 = max{d 32, d 52 } = max{7, 10} = 10 d (35)4 = max{d 34, d 54 } = max{9, 8} = 9 και ο τροποποιηµένος πίνακας αποστάσεων ϑα γίνει : Η επόµενη συγχώνευση ϑα γίνει µεταξύ των αµέσως πιο οµοίων οµάδων 2 και 4, συγκροτώντας την οµάδα (24). Επειτα έχουµε : d (24)(35) = max{d 2(35), d 4(35) } = max{10, 9} = 10 d (24)1 = max{d 21, d 41 } = 9 και ο πίνακας αποστάσεων ϑα γίνει : Η επόµενη συγχώνευση ϑα παράξει την οµάδα (124). Στο τελευταίο στάδιο, ϑα συγχωνευτούν εποµένως οι οµάδες (35) και (124) σε µια νέα οµάδα, την (12345), αφού d (124)(35) = max{d 1(35), d 24(35) } = max{11, 10} = 11,δηλαδή : 33

40 Κεφάλαιο 2. Θεωρητικό υπόβαθρο Σχήµα 2.7: ενδρόγραµµα πλήρους σύνδεσης. Το δενδρόγραµµα πλήρους σύνδεσης ϕαίνεται στο σχήµα 2.7. Συγκρίνοντας το µε εκείνο του σχήµατος 2.6 διαφέρουν στην οµάδα που ανήκει το 1 αντικείµενο. Σύνδεση µέσου όρου (average linkage): Η σύνδεση µέσου όρου, ϑεωρεί την απόσταση µεταξύ δύο οµάδων ως την µέση απόσταση ανάµεσα σε όλα τα Ϲευγάρια των παρατηρήσεων, δηλαδή το µέσο της απόστασης των µελών του ενός cluster και του άλλου. Οι είσοδοι στον αλγόριθµο µέσου όρου σύνδεσης µπορεί να είναι αποστάσεις ή οµοιότητες. Ο αλγόριθµος ξεκινά ψάχνοντας τον πίνακα απόστασης D = {d ik } µε σκοπό να ϐρει τα πλησιέστερα αντικείµενα. Αν UV είναι µια οµάδα και W µία οποιαδήποτε άλλη, οι αποστάσεις ανάµεσα σε αυτές τις δύο είναι : d (UV)W = i k N (UV) N W d ik όπου, d ik η απόσταση ανάµεσα στο αντικείµενο i της οµάδας (UV) και στο αντικείµενο k της οµάδας W. N (UV) και N W οι πληθάριθµοι των στοιχείων στις οµάδες UV και W αντίστοιχα. Αυτή η µέθοδος απαιτεί µεγάλη υπολογιστική ισχύ, καθώς υπολογίζει την µέση απόσταση όλων των πιθανών Ϲευγών από τις δύο κάθε ϕορά συστάδες που εξετάζονται. Επίσης τα 34

41 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης αποµακρυσµένα στοιχεία (εξωκείµενες τιµές) δεν επηρεάζουν σηµαντικά αυτή την τεχνική. Τέλος η κάθε συγχώνευση πραγµατοποιείται σε απόσταση οµάδων µεγαλύτερη από αυτή του προηγούµενου σταδίου, δίνοντας έτσι την δυνατότητα τερµατισµού της διαδικασίας, είτε όταν υπάρχει ικανοποιητικά µικρός αριθµός οµάδων, είτε όταν οι συστάδες ϐρίσκονται πολύ µακριά για να συγχωνευτούν (κριτήριο απόστασης). Μέθοδος κεντροειδούς (centroid): Κύριο στοιχείο της µεθόδου αυτής είναι το κέντρο ϐάρους. Αυτό επιλέγεται ως το µέσο αντικείµενο της κάθε οµάδας. Ακολουθεί το ίδιο σκεπτικό µε τις προηγούµενες τεχνικές, έχοντας αυτή την διαφορά. Η υπολογιστική ισχύς εµφανίζεται και εδώ υψηλή. Μέθοδος σύνδεσης διαµέσου (Median): Σε αυτή τη µέθοδο η απόσταση ανάµεσα στα 2 clusters επιλέγεται να είναι η απόσταση ανάµεσα στις διαµέσους των 2 οµάδων. Οταν µικρές οµάδες συγχωνεύονται µε µεγάλες, χρησιµοποιώντας την µέθοδο centroid το κέντρο ϐάρους του αποτελέσµατος, ϑα ϐρίσκεται πολύ πιο κοντά στο πολυπληθέστερο cluster. Αυτό όπως καταλαβαίνει κανείς εµφανίζεται ως µειονέκτηµα γιατί τα χαρακτηριστικά της µικρότερης οµάδας ϑα υποβαθµιστούν σε µεγάλο ϐαθµό. Οι µέθοδοι κεντροειδούς και διαµέσου, είναι κατά µία έννοια συµπληρωµατικές. Οι διαφορές που υπάρχουν ανάµεσα στις τεχνικές, µπορεί για ένα πρόβληµα να είναι πλεονέκτηµα και για άλλο µειονέκτηµα. Μέθοδος του ward: Χαρακτηριστικό της µεθόδου αυτής είναι, ότι σχηµατίζει οµάδες µεγιστοποιώντας την οµοιογένεια στο εσωτερικό των clusters, δηλαδή δεν υπολογίζει αποστάσεις µεταξύ των ο- µάδων. Το άθροισµα των τετραγωνικών σφαλµάτων µέσα στην κάθε οµάδα, χρησιµοποιείται ως µέτρο οµοιογένειας. Η µέθοδος του ward προσπαθεί να ελαχιστοποιήσει το ολικό άθροισµα τετραγώνων µέσα στην οµάδα. Το άθροισµα τετραγωνικών σφαλµάτων (ESS) είναι η διαφορά µεταξύ του ολικού λάθους των δύο συστάδων και του ολικού λάθους, αν ενώσουµε τις δύο συστάδες σε µία. Μαθηµατικώς αυτό εκφράζεται : D r (C i, C j ) = (x r i ) 2 + (x r j ) 2 (x r ij ) 2 x C i x C j x C ij όπου, r i είναι το centroid του C i r j είναι το centroid του C j r ij είναι το centroid του C ij Το µέτρο αυτό είναι δηµοφιλές κριτήριο στην ανάλυση συστάδων και χρησιµοποιείται επίσης σαν κριτήριο στις µεθόδους ϐελτιστοποίησης. 35

42 Κεφάλαιο 2. Θεωρητικό υπόβαθρο Μέθοδος σταθµισµένου µέσου όρου : Η µέθοδος αυτή ορίζει την απόσταση µεταξύ δύο συστάδων ως τη µέση απόσταση µεταξύ όλων των προτύπων. Συγκεκριµένα χρησιµοποιεί έναν αναδροµικό ορισµό της απόστασης για να αποτυπώσει την απόσταση µεταξύ οµάδων. Εάν το cluster r δηµιουργήθηκε συγχωνεύοντας τις οµάδες p και q, η απόσταση µεταξύ του r και άλλου cluster s ορίζεται ως η µέση τιµή της απόστασης µεταξύ του p και s και της απόστασης του q και s: d(r, s) = (d(p,s)+d(q,s)) Αλγόριθµος Fuzzy c-means Οσον αφορά τον Fuzzy c-means [8, 11, 17, 12, 13, 16] αποτελεί κοµµάτι της ασαφούς συσταδοποίησης. Η ασαφής συσταδοποίηση είναι γενίκευση της σκληρής (hard clustering) και ϐρίσκει εφαρµογή σε πληθώρα εφαρµογών.πρέπει επίσης να αναφερθεί ότι η ασαφή εκδοχή του k-means ονοµάζεται fuzzy c-means. Ας υποθέσουµε ότι έχουµε ένα σύνολο δεδοµένων από παρατηρήσεις X = {x 1,..., x m } όπου κάθε αντικείµενο του συνόλου είναι n διάστασης, για παράδειγµα x i = (x i1, x i2,...x in ). Κάθε παρατήρηση ανήκει σε όλες τις οµάδες µέσω µερικής συµµετοχής-ϐαθµός συµµετοχής(membership degree). Μια συλλογή από ασαφείς οµάδες (fuzzy clusters) C 1, C 2,.., C k είναι ένα υποσύνολο όλων των πιθανών ασαφών οµάδων του συνόλου X. Οι ικανές και αναγκαίες συνθήκες για να αποτελούν οι οµάδες κοµµάτι ασαφούς συσταδοποίησης είναι : Ολα τα ϐάρη για µια παρατήρηση,x i,το άθροισµά τους να δίνει 1. k w ij = 1 j=1 Κάθε οµάδα C j, περιέχει µε µη µηδενικό ϐάρος τουλάχιστον µία παρατήρηση αλλά δεν µπορεί να έχει όλες τις παρατηρήσεις µε ϐαθµό συµµετοχής 1. m 0 < w ij < m i=1 Πιο συγκεκριµένα ο αρχικός πληθυσµός των παρατηρήσεων οµαδοποιείται σε k οµάδες µε στόχο την ελαχιστοποίηση της συνάρτησης τετραγωνικού σφάλµατος : J(C 1, C 2,..., C k ) = k m w p ij dist(x i, c j ) 2 (2.3) j=1 i=1 Οπου, c j : είναι το κέντρο της j th οµάδας. p: είναι η παράµετρος ασαφοποίησης (fuziness parameter) παίρνοντας τιµές [0, ] και ελέγχει τον ϐαθµό ασάφειας των οµάδων. dist: Η ευκλείδεια απόσταση της i οστής παρατήρησης και του j οστού κεντροειδούς. 36

43 2.3 Εποπτική παρουσίαση αλγορίθµων συσταδοποίησης Ο ορισµός του κεντροειδούς που προκύπτει από την 2.4 ϑα προκύψει από εκείνο το κεντροειδές που ελαχιστοποιεί την συνάρτηση τετραγωνικού σφάλµατος, όπως δίνεται στην 2.3. Για µια οµάδα C j το κεντροειδές c j προκύπτει από την ακόλουθη εξίσωση : c j = m m w p ij x i/ w p ij (2.4) i=1 i=1 Ο ορισµός του ασαφούς κεντροειδούς είναι παρόµοιος µε τον κλασικό ορισµό του κέντρου, µε την διαφορά ότι η συνεισφορά κάθε σηµείου στο κέντρο εξαρτάται από το ϐαθµό συµµετοχής. Η ασαφής συσταδοποίηση πραγµατοποιείται επαναληπτικά ϐελτιστοποιώντας σε κάθε ϐήµα την 2.3 ενώ σε κάθε επανάληψη ανανεώνονται η κατάσταση µέλους και τα κέντρα των κλάσεων. 1 w ij = k ( dist(x i, c j ) dist(x i, c k ) ) 2 p 1 j=1 c j = m m w p ij x i/ i=1 i=1 w p ij Η επαναληπτική διαδικασία σταµατά όταν καλύπτεται ένα κριτήριο σφάλµατος 0 < ε < 1, δηλαδή όταν max{ w (k+1) ij w (k) ij } < ε. Ο αλγόριθµος αυτός συγκλίνει σε ένα τοπικό ελάχιστο ή σε ένα σηµείο καµπής της 2.3. Στην περίπτωση της σκληρής συσταδοποίησης, των κλασικών οµάδων δηλαδή, όπου όλα τα w ij είναι είτε 0 είτε 1, τότε ο παραπάνω ορισµός συµπίπτει µε τον κλασικό ορισµό κεντροειδούς. Ακόµα στη περίπτωση που ο ϐαθµός ασαφοποίησης (p) επιλεχθεί να είναι κοντά στη τιµή 1 τότε ο fuzzy c-means συµπεριφέρεται όπως ο κλασικός kmeans. Από την άλλη µεριά όσο το p αυξάνεται, όλα τα κέντρα των οµάδων (clusters) πλησιάζουν το ολικό κέντρο όλων των σηµείων.με άλλα λόγια η διαµέριση γίνεται πιο ασαφής όσο ο ϐαθµός ασαφοποίησης αυξάνεται. Θετικά και αρνητικά : Ενα ϑετικό χαρακτηριστικό του fuzzy c-means είναι ότι η συσταδοποίηση η οποία πα- ϱάγει παρέχει µία ένδειξη του ϐαθµού στον οποίο κάθε παρατήρηση ανήκει σε κάθε οµάδα. Από την άλλη µεριά όµως εµφανίζει τις ίδιες αδυναµίες µε τον kmeans, όπως προαναφέρ- ϑηκαν, αν και απαιτεί περισσότερη υπολογιστική ισχύ Αλγόριθµος k εσωτερικών αντιπροσώπων (k-medoids) Στον αλγόριθµο αυτό [3] κάθε οµάδα αντιπροσωπεύεται από ένα διάνυσµα, το οποίο επιλέγεται µέσα από τα στοιχεία του συνόλου δεδοµένων (X). Αυτή η ιδιότητα χαρακτηρίζει και το όνοµα του αλγορίθµου. Το διάνυσµα ονοµάζεται εσωτερικός αντιπρόσωπος (medoid). Κάθε οµάδα περιέχει τα στοιχεία του X που : δεν χρησιµοποιούνται ως εσωτερικοί αντιπρόσωποι σε άλλες οµάδες και 37

44 Κεφάλαιο 2. Θεωρητικό υπόβαθρο ϐρίσκονται πιο κοντά στον εσωτερικό αντιπρόσωπό της από ότι στους εσωτερικούς α- ντιπροσώπους των άλλων οµάδων. Για να γίνουν πιο κατανοητά τα παραπάνω. Εστω Θ το σύνολο των εσωτερικών αντιπροσώπων όλων των οµάδων. Θα συµβολίζουµε µε I Θ το σύνολο των δεικτών των σηµείων του Q (ευρύτερο σύνολο) που συνιστούν το Θ και µε I Q Θ το σύνολο των δεικτών των σηµείων που δεν είναι εσωτερικοί αντιπρόσωποι. Για παράδειγµα, αν το σύνολο των εσωτερικών αντιπροσώπων για µια περίπτωση τριών οµάδων είναι Θ = {x 1, x 5, x 13 } τότε I Θ = {1, 5, 13}. Η ποιότητα της οµαδοποίησης που σχετίζεται µε ένα συγκεκριµένο σύνολο Θ εσωτερικών αντιπροσώπων, ϑα αξιολογηθεί µέσω της παρακάτω συνάρτησης στόχου : J(Θ, U) = u ij d(x i, x j ) j I Θ µε, i I X Θ u ij = 1, αν d(x i, x j ) = min q IΘ d(x i, x q ) 0, διαϕoρετικα Η αντιπροσώπευση των οµάδων µε την χρήση των εσωτερικών αντιπροσώπων παρουσιάζει δύο πλεονεκτήµατα σε σχέση µε τον αλγόριθµο k-means. Πρώτον µπορεί να χρησιµοποιη- ϑεί για σύνολα δεδοµένων που προέρχονται είτε από συνεχή, είτε από διακριτά πεδία τιµών. Αντίθετα, ο k-means είναι κατάλληλος µόνο για την περίπτωση των συνεχών πεδίων. ιότι σε µία εφαρµογή όπου έχουµε διακριτό πεδίο τιµών, το µέσο διάνυσµα ενός υποσυνόλου διανυσµάτων δεδοµένων δεν ανήκει απαραίτητα στο πεδίο. εύτερον, οι αλγόριθµοι εσωτερικών αντιπροσώπων τείνουν να είναι λιγότερο ευαίσθητοι στην ύπαρξη εξωκείµενων τιµών, σε σχέση µε τον αλγόριθµο k-means. Επίσης το µέσο διάνυσµα µίας οµάδας έχει µία ξεκάθαρη γεωµετρική και στατιστική έννοια, πράγµα το οποίο δεν ισχύει απαραίτητα µε τους εσωτερικούς αντιπροσώπους. Τέλος οι αλγόριθµοι εκτίµησης του ϐέλτιστου συνόλου εσωτερικών αντιπροσώπων είναι υπολογιστικά πιο απαιτητικοί σε σχέση µε τον k-means. 2.4 είκτες αξιολόγησης Για να εκτιµήσουµε την απόδοση των αλγορίθµων συσταδοποίησης έχουν προταθεί διάφορες µετρικές αξιολόγησης (adequacy measures). Ο δείκτης εξυπηρετεί δύο σκοπούς : Την εύρεση του ϐέλτιστου αριθµού συστάδων. Την ανάδειξη του αποδοτικότερου αλγορίθµου για το ίδιο σύνολο δεδοµένων. Οι δείκτες αξιολόγησης συνδέονται άµεσα µε µέτρα οµοιότητας ή ανοµοιότητας, που δείχνουν τον ϐαθµό της συνάφειας µεταξύ των παρατηρήσεων. Ο κύριο στόχος της συσταδοποίησης σε κάθε δείγµα, είναι να δηµιουργήσει διακριτές οµάδες µε µεγάλη πυκνότητα. ηλαδή κάθε πρότυπο ϑα πρέπει να απέχει όσο το δυνατόν λιγότερο από το κεντροειδές-αντιπρόσωπο της οµάδας στην οποία ανήκει και οι αποστάσεις µεταξύ των προτύπων να είναι µικρές σε αντίθεση µε την µεγάλη απόσταση που επιθυµούµε ανάµεσα στους αντιπροσώπους των οµάδων, για να έχουµε ευδιάκριτα clusters. 38

45 2.4 είκτες αξιολόγησης Βασικές ιδιότητες της συσταδοποίησης είναι η συνεκτικότητα και η διαχωρισιµότητα. Η συνεκτικότητα αναφέρεται στις ενδο-αποστάσεις των συστάδων, ενώ η διαχωρισιµότητα στις αποστάσεις µεταξύ των αντιπροσώπων των οµάδων. Ορισµοί αποστάσεων : Εστω δύο αντικείµενα διάστασης d του αρχικού συνόλου,x (s), x (p) X. Η γενική µορφή της απόστασης µεταξύ των αντικειµένων δίνεται από : d(x (s), x (p) ) = ( xj (s) x j (p) r ) 1 r (2.5) όπου το r ελέγχει την τάξη της απόστασης.η συνηθέστερη µορφή απόστασης είναι η ευκλείδεια η οποία λαµβάνεται για r = 2.Παρακάτω ϑα ορίσουµε κάποιες αποστάσεις που αφορούν τις οµάδες που προκύπτουν από το clustering και χρησιµοποιούνται στους δείκτες αξιολόγησης. Εστω N ο αριθµός των παρατηρήσεων που περιέχει το σύνολο δεδοµένων και M οι ο- µάδες που προκύπτουν µε την συσταδοποίηση. Το j στo cluster αντιπροσωπεύεται από το διάνυσµα w j = (w j1, w j2,..., w ji,..., w jd ) T,είναι δηλαδή το κεντροειδές της οµάδας.το υποσύνολο των διανυσµάτων (παρατηρήσεων), που ανήκουν στο j στo cluster είναι το Ω j και ο αντίστοιχος αριθµός από αντικείµενα είναι N j. Η απόσταση µεταξύ του διανύσµατος αντιπροσώπου w j του j th cluster και του υποσυνόλου Ω j η οποία υπολογίζεται ως ο γεωµετρικός µέσος των ευκλείδειων αποστάσεων d( w j, x l ) ανάµεσα στο w j και σε κάθε µέλος του x l Ω j, ορίζεται ως : d( wj,ω j ) = d 2 ( wj, x l ) x l Ω j N j και εσωτερικά του συνόλου, η µέση απόσταση ορίζεται ως, ο γεωµετρικός µέσος των ενδοαποστάσεων ανάµεσα στα µέλη του συνόλου, για παράδειγµα στο υποσύνολο Ω j : d(ω j ) = 1 2 N j d 2 ( x l, Ω j ) xl Ω j Οι δείκτες αξιολόγησης [13, 12] που χρησιµοποιήθηκαν στην παρούσα διπλωµατική εργασία ανταποκρίνονται για αξιολόγηση της διαδικασίας του clustering µε χρήση καµπυλών ϕορτίου. Ωστόσο στην ϐιβλιογραφία [17] συναντάµε και άλλους δείκτες αξιολόγησης όπως Similarity Matrix Indicator (SMI), Davies-Bouldin Index (DBI), Silhouette (Silhouette index) και άλλους.παρακάτω παρουσιάζονται οι επιλεγόµενοι αυτοί δείκτες : Ο δείκτης J ή Μέσο Τετραγωνικό Σφάλµα : Εκφράζει το µέσο άθροισµα των αποστάσεων µεταξύ των αντικειµένων και των κεντροειδών των συστάδων : J = 1 N N d 2 ( x l, wk : xl ) (2.6) Ω k l=1 39

46 Κεφάλαιο 2. Θεωρητικό υπόβαθρο Ο δείκτης Mean Index adequacy (MIA): Ορίζεται ως ο µέσος όρος των αποστάσεων µεταξύ κάθε διανύσµατος-παρατήρησης που ανήκει στο cluster και στο κέντρο του : MIA = 1 M M d 2 ( w j, Ω j ) (2.7) j=1 Ο δείκτης Clustering Dispersion Indicator (CDI) Ορίζεται ως ο λόγος του µέσου αθροίσµατος των ενδο-αποστάσεων των αντικειµένων της ίδιας οµάδας προς τις ενδο-αποστάσεις του συνόλου των κεντροειδών : CDI = M 1 M k=1 d(w) d 2 (Ω k ) (2.8) Ο δείκτης Within Cluster Sum of Squares to Between Cluster Variation (WCBCR): Ορίζεται ως ο λόγος του συνολικού αθροίσµατος των ενδοαποστάσεων των αντικειµένων του ίδιου cluster προς τις ενδο-αποστάσεις του συνόλου των κεντροειδών : WCBCR = M d 2 ( wk, x l ) xl Ω k k=1 M 1 q p d 2 ( wp, w q ) (2.9) Πρέπει να σηµειωθεί ότι, επιτυχής ϑεωρείται ένας αλγόριθµος συσταδοποίησης συγκριτικά µε έναν άλλον για την εφαρµογή που ϑα µελετήσουµε, όταν παρουσιάζει µικρότερες τιµές για τον δείκτη αξιολόγησης που µελετάµε. Πιο συγκεκριµένα, ϑα ϑεωρούµε έναν αλγόριθ- µο συσταδοποίησης καλύτερο από έναν άλλον για το ίδιο σύνολο δεδοµένων, αυξανοµένου του αριθµού των οµάδων, η καµπύλη του να ϐρίσκεται πιο κάτω από τις καµπύλες των υπολοίπων για τον ίδιο δείκτη αξιολόγησης. 40

47 Κεφάλαιο 3 Εφαρµογή αλγορίθµων συσταδοποίησης Στις παρακάτω ενότητες ϑα αναφερθούν οι εφαρµογές των αλγορίθµων συσταδοποίησης στα δεδοµένα που είχαµε στη διάθεσή µας. Η πορεία που ακολουθήθηκε είναι η εξής : Εφαρµογή και των τεσσάρων αλγορίθµων για κάθε ένα δείκτη αξιολόγησης. Για κάθε έναν δείκτη αξιολόγησης εύρεση του καλύτερου αλγορίθµου. Εύρεση του ϐέλτιστου αριθµού οµάδων σύµφωνα µε την τεχνική που ϑα περιγραφεί παρακάτω. Συσταδοποίηση των στιγµιοτύπων για τον ϐέλτιστο αριθµό οµάδων και εξαγωγή διανύσµατος αντιπροσώπου. 3.1 ίκτυο 33 Ϲυγών Οι αλγόριθµοι συσταδοποίησης ϑα πραγµατοποιηθούν σε ένα µοντέλο συστήµατος ηλεκτρικής ενέργειας 33 Ϲυγών που αποτελεί σενάριο (case) της IEEE. Πρόκειται για ένα δίκτυο διανοµής σε ακτινική διάταξη µε τον Ϲυγό 1 ως Ϲυγό αναφοράς (sluck bus) και χωρίς διανεµηµένη παραγωγή. Οι διακλαδώσεις ανάµεσα στους Ϲυγούς εµ- ϕανίζουν σύνθετη αντίσταση z s = r s + jx s και εγκάρσια επιδεκτικότητα b c. Από το υπάρχον µοντέλο δικτύου, δηµιουργήθηκαν στιγµιότυπα ϕορτίου στον αριθµό 15000, όσο αφορά την ενεργό ισχύ και την άεργο. Το κάθε δείγµα από αυτά εµφανίζει απόκλιση ϕορτίου 20% καθώς και 50%. Ετσι συνολικά προκύπτουν τέσσερα δείγµατα, δύο µε απόκλιση ϕορτίου 20% τόσο για ενεργό και άεργο ισχύ και µε απόκλιση 50% για ενεργό και άεργο ισχύ αντίστοιχα. Με αυτό τον τρόπο προσεγγίζεται η συµπεριφορά του δικτύου για µεγάλο χρονικό διάστηµα, αν λάβουµε υπόψιν,ότι κάθε στιγµιότυπο ενεργού και άεργης ισχύς αντιστοιχίζεται στη µία ώρα, ϕτάνοντας συνολικά τα Ωστόσο τα στιγµιότυπα αυτά δεν αντιστοιχούν σε συνεχόµενες ηµερολογιακές µέρες, αλλά σε χρονικές στιγµές που εµφάνισαν αυτή την απόκλιση ϕορτίου για να καλύψουν το διάστηµα του ενάµισι περίπου χρόνου. Τα στοιχεία του συστήµατος ηλεκτρικής ενέργειας των 33 Ϲυγών παρατίθενται στο Παράρτηµα. 3.2 Κανονικοποίηση δεδοµένων Τα δείγµατα των στιγµιοτύπων του δικτύου µπορούν να παρασταθούν ως P = {p (m) i, i = 1,..., N, m = 1,.., M} όπου N = 15000, το σύνολο των στιγµιοτύπων του δικτύου των 33 Ϲυγών 41

48 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης και M = 4 για τα τέσσερα διαφορετικά δείγµατα. Κάθε πρότυπο του συνόλου P µπορεί αν εκφραστεί ως, p (m) i = [p (m) i1, p(m) i2,..., p(m) id ] T (3.1) όπου η διάσταση d του διανύσµατος αντιστοιχεί στον αριθµό του Ϲυγού-κόµβου του δικτύου, δηλαδή d [2, 33] αφού ο Ϲυγός 1 αντιστοιχίζεται στο συγκεκριµένο σενάριο ως Ϲυγός αναφο- ϱάς (sluck bus). Οι τιµές στο σύνολο P είναι εκφρασµένες σε MW και σε MVar για την ενεργό και άεργο ισχύ αντίστοιχα. Στη συσταδοποίηση η οποία ακολουθεί, οι καµπύλες ϕορτίου που αναπαριστούν την συµπεριφορά του δικτύου οµαδοποιούνται ϐάσει της οµοιότητας των µορ- ϕών τους και όχι ϐάσει του µεγέθους τους. Λόγω του ότι οι αλγόριθµοι συσταδοποίησης όπως αναλύθηκε και προηγουµένως ϐασίζονται σε µέτρα εγγύτητας, δηλαδή σε αποστάσεις, εκ- ϕράζοντας τα πρότυπα σε ϕυσικές τιµές, ενδέχεται η τιµής της απόστασης λόγω του µεγέθους τους να επισκιάζουν τις υπόλοιπες, µε αποτέλεσµα την µειωµένη απόδοση των αλγορίθµων. Για αυτό το λόγο τα δεδοµένα πρέπει να κανονικοποιούνται σε κάποια κλίµακα. Στη παρούσα διπλωµατική η κανονικοποίηση έγινε µε την παρακάτω τεχνική : ιαιρείται κάθε µέλος του κάθε προτύπου από κάθε δείγµα, µε την µέγιστη τιµή που εµφανίζει το συγκεκριµένο πρότυπο, δηλαδή µε την µέγιστη ενεργή ή άεργη ισχύ αναλόγως το δείγµα, που εµφανίζει το συγκεκριµένο στιγµιότυπο του δικτύου. x (m) i = p(m) i p i,max (m) (3.2) όπου p (m) i,max είναι το µέγιστο που εµφανίζει το στιγµιότυπο του δικτύου του m-δείγµατος. Με αυτή την τεχνική τα δεδοµένα κανονικοποιούνται στην κλίµακα [0, 1]. 3.3 Εύρεση ϐέλτιστου αριθµού οµάδων Σύµφωνα µε την τεχνική που περιγράφεται στο [20] ϑα ϐρεθεί για κάθε δείγµα ο ϐέλτιστος αριθµός οµάδων (clusters). Οι δείκτες που εµφανίζουν ϕθίνουσα συµπεριφορά µπο- ϱούν να χρησιµοποιηθούν για την εύρεση του ϐέλτιστου αριθµού οµάδων. Εδώ επιλέχθηκε να χρησιµοποιηθεί ο δείκτης αξιολόγησης J. Αυξάνοντας τον αριθµό των clusters οδηγεί σε µεγαλύτερη ακρίβεια στην διαδικασία συσταδοποίησης. Αυτό σηµαίνει ότι υπάρχει µια συνεχής ϕθίνουσα µονοτονία στις τιµές του δείκτη. Στο σχήµα 3.1 ϕαίνεται η µορφή της καµπύλης J για διαφορετικό αριθµό οµάδων. Οπως παρατηρεί κανείς µετά από µία αύξηση του αριθµού των οµάδων υπάρχει µία µείωση της συνάρτησης που αντιστοιχεί στο γόνατο της καµπύλης. Ο ϐέλτιστος αριθµός οµάδων αντιστοιχίζεται σε αυτή την κορυφή του γονάτου. Ο άξονας των x αντικατοπτρίζει των αριθµό των clusters που συνεχώς αυξάνει, ενώ ο άξονας των y δείχνει τις τιµές της συνάρτησης τετραγωνικού σφάλµατος για κάθε αριθµό οµάδων. Για την εύρεση αυτού του σηµείου σχεδιάζονται δύο ευθείες. Η πρώτη ευθεία πρέπει να περνάει από τα σηµεία (x 2, y 2 ) και (x 3, y 3 ). Η δεύτερη ευθεία να περνάει από τα σηµεία (x 39, y 39 ) και (x 40, y 40 ). Το σηµείο τοµής µεταξύ αυτών των δύο ευθειών ϑα δώσει προσεγγιστικά το γόνατο της καµπύλης και τον ϐέλτιστο αριθµό οµάδων. 42 Η κλίση της ευθείας y = a + bx είναι b = y x.

49 3.4 Ενεργός ισχύς µε απόκλιση ϕορτίου 20% Σχήµα 3.1: Συνάρτηση τετραγωνικού σφάλµατος για την εύρεση του ϐέλτιστου αριθµού ο- µάδων. Για την πρώτη ευθεία έχουµε y 1 = a 1 + b 1 x 1 µε b 1 = y 1 x 1. Για την δεύτερη ευθεία y 2 = a 2 + b 2 x 2 µε b 2 = y 2 x 2. Για να ϐρούµε την τιµή του x που αντιστοιχεί στον ϐέλτιστο αριθµό οµάδων που είναι ένα από τα κυριότερα προβλήµατα στην εκµάθηση χωρίς επίβλεψη (clustering), εξισώνουµε τις εξισώσεις των δύο ευθειών. a 1 + ( y 1 x 1 )x = a 2 + ( y 2 x 2 )x και εφόσον x 1 = x 2 = 1 προκύπτει x = a 1 a 2 y 1 y 2 Εάν η τιµή του y που προκύπτει δεν αντιστοιχεί σε ακέραιο αριθµό x =οµάδες τότε επιλέγεται ο αριθµός x στον αµέσως µικρότερο ακέραιο παραµένοντας µε αυτό τον τρόπο στην ασφαλή πλευρά των αποτελεσµάτων. 3.4 Ενεργός ισχύς µε απόκλιση ϕορτίου 20% Για το δείγµα της ενεργού ισχύος δηµιουργήθηκαν οι δείκτες αξιολόγησης σε Matlab α- πό τον µαθηµατικό τους ορισµό. Εφαρµόσθηκαν εν συνέχεια οι αλγόριθµοι συσταδοποίησης για αυτούς τους δείκτες αξιολόγησης συναρτήσει κάθε ϕορά του αριθµού των οµάδων. Πολλές ϕορές ένας αλγόριθµος υστερεί για µικρό αριθµό οµάδων αλλά µπορεί να εµφανίζει ανώτερη συµπεριφορά καθώς αυξάνουν οι συστάδες. Συνεπώς εξετάζεται η γενική συµπε- ϱιφορά του δείκτη για όλους τους αριθµούς συστάδων από 2 έως 40. Τα αποτελέσµατα που προέκυψαν συνοψίζονται παρακάτω : Ο δείκτης αξιολόγησης J Ο δείκτης J εκφράζει την συνολική ευκλείδεια απόσταση µεταξύ των αντικειµένων και των κεντροειδών των οµάδων στις οποίες είναι µέλη τα αντικείµενα. Αποτελεί δηλαδή µέτρο συνεκτικότητας των συστάδων. Αρχικά ϑα παρουσιαστούν τα αποτελέσµατα των ιεραρχικών µεθόδων οµαδοποίησης καθώς υπάρχουν εφτά διαφορετικές παραλλαγές. Θα επιλεγεί εκείνη η ιεραρχική µέθοδος η οποία ϑεωρείται η πιο επιτυχηµένη από τις άλλες, δηλαδή αυτή που η καµπύλη της ϐρίσκεται πιο κάτω από τις υπόλοιπες. Οπως ϕαίνεται στο σχήµα 43

50 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης 3.2 ως καλύτερη ιεραρχική µέθοδος για τον δείκτη J προκύπτει αυτή του Ward. Αυξανο- Σχήµα 3.2: Ιεραρχικές µέθοδοι συσταδοποίησης-j-error-function. µένου των αριθµού των clusters η συνάρτηση τετραγωνικού σφάλµατος εµφανίζει όπως ήταν αναµενόµενο ϕθίνουσα µονότονη συµπεριφορά. Ωστόσο οι µέθοδοι single και centroid εµ- ϕανίζουν µη µονότονη ϕθίνουσα συµπεριφορά, δηλαδή δεν ανταποκρίνονται σωστά για το συγκεκριµένο δείγµα. Θα µπορούσαν να είχαν παραλειφθεί αλλά η σύγκρισή τους µε τις υπόλοιπες µεθόδους µας ϐοηθάει στην επιλογή της καλύτερης ιεραρχικής µεθόδου. Μετά την επιλογή της ιεραρχικής µεθόδου µπορεί να ακολουθήσει σύγκριση µε τους υπόλοιπους τρεις αλγορίθµους k-means, k-medoids, fuzzy αναφερόµενοι στα αποτελέσµατα που προέκυψαν για τον καθένα,στον δείκτη αξιολόγησης τετραγωνικού σφάλµατος, όπως ϕαίνεται στο σχήµα 3.3. Για τον δείκτη αξιολόγησης J αποδοτικότερος ανάµεσα στους τέσσερις αλγορίθµους ο- µαδοποίησης εµφανίζεται ο k-means. Ακολουθούν ο fuzzy c-means, ιεραρχικός και k- medoids. Παρακάτω ϑα ϐρεθεί ο ϐέλτιστος αριθµός οµάδων µε την διαδικασία που αναφέρ- ϑηκε παραπάνω. Ο δείκτης Mean index adequacy (MIA) Οµοίως µε τον προηγούµενο δείκτη αξιολόγησης,ο δείκτης MIA αποτελεί επίσης µέτρο συνεκτικότητας. Ξεκινάµε πάλι από τις ιεραρχικές µεθόδους ώστε να γίνει η σύγκριση µε τους υπόλοιπους αλγορίθµους. Η µέθοδος του Ward όπως ϕαίνεται στο σχήµα 3.4 ανταποκρίνεται και πάλι καλύτερα για αυτή την µετρική αξιολόγησης. Συγκρίνοντας τώρα την ιεραρχική µέθοδο µε τις υπόλοιπους αλγορίθµους συσταδοποίησης προκύπτει το σχήµα 3.5. Είναι εµφανές ότι ο αλγόριθµος k-means έχει χαµηλότερες τιµές από τους υπόλοιπους, άρα κρίνεται ως πιο επιτυχής. Ακολουθούν ο fuzzy, ιεραρχικός και k-medoids. Οπως µπορεί να διακρίνει κανείς ο αλγόριθµος 44

51 3.4 Ενεργός ισχύς µε απόκλιση ϕορτίου 20% Σχήµα 3.3: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη-j-error-function. Σχήµα 3.4: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA. ασαφούς οµαδοποίησης, για µικρό αριθµό οµάδων παρουσιάζει όµοια συµπεριφορά µε τον k-means. Ωστόσο αυξανοµένου τον αριθµό των οµάδων ο τελευταίος εµφανίζει µεγαλύτερη ϕθίνουσα συµπεριφορά. Υπενθυµίζουµε ότι κρίνεται η συµπεριφορά του αλγορίθµου για όλους τους αριθµούς συστάδων. Ο δείκτης Clustering Dispersion Indicator (CDI) Οι ιεραρχικές µέθοδοι όσον αφορά τον CDI ϕαίνονται στο σχήµα 3.6. Εδώ γίνεται εµ- 45

52 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.5: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA. Σχήµα 3.6: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI. ϕανές ότι η µέθοδος centroid κερδίζει έδαφος έναντι των υπολοίπων έξι και κρίνεται ως η καλύτερη ιεραρχική µέθοδος για τον συγκεκριµένο δείκτη. Συγκρίνοντας εν συνεχεία την συγκεκριµένη µέθοδο µε τους υπόλοιπους τρεις αλγορίθµους το αποτέλεσµα ϕαίνεται στο σχήµα 3.7. Αποδοτικότερος κρίνεται ο ιεραρχικός αλγόριθµος και η µέθοδος centroid και ακολουθούν ο k-medoids µε τον ασαφή αλγόριθµο να παρουσιάζουν σχεδόν όµοια συµπε- ϱιφορά µε λίγο καλύτερο τον k-medoids και τέλος ο k-means. Στους δύο προηγούµενους δείκτες ο k-means ήταν ο πιο αποδοτικός, ενώ αν κρίνει κάποιος το δείγµα µε τον δείκτη 46

53 3.4 Ενεργός ισχύς µε απόκλιση ϕορτίου 20% Σχήµα 3.7: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI. CDI ϑα διαπιστώσει ότι ο διαµεριστικός αλγόριθµος ήρθε τελευταίος. Ο δείκτης Within Cluster Sum of Squares to Between Cluster Variation (WCBCR) Ο δείκτης αυτός είναι µέτρο συνεκτικότητας και διαχωρισιµότητας των παραγόµενων οµάδων όπως εµφανίζεται στον µαθηµατικό του ορισµό. Πρώτη αποδοτικότερη ιεραρχική µέθοδος έρχεται η average και ακολουθούν η weighted, centroid και ward όπως ϕαίνεται στο σχήµα 3.8. Στην σύγκριση µε τους υπόλοιπους τρεις αλγορίθµους πιο αποδοτικός εµ- ϕανίζεται ο ιεραρχικός αλγόριθµος και ακολουθούν µε σχεδόν πανοµοιότυπη συµπεριφορά k-medoids, k-means και fuzzy σύµφωνα µε το σχήµα 3.9. Στους δύο πρώτους δείκτες λοιπόν πιο αποδοτικός εµφανίζεται ο k-means, ενώ στους δύο τελευταίους ο ιεραρχικός αλγόριθµος. Ο ερευνητής µπορεί να κρίνει την ευρωστία του αλγορίθµου µε τον δείκτη που ϑεωρεί πιο αξιόπιστο για το συγκεκριµένο δείγµα. Εύρεση συστάδων Για την εύρεση του ϐέλτιστου αριθµού συστάδων εφαρµόζεται η µέθοδος που αναπτύχθηκε παραπάνω. Οπως προαναφέρθηκε η εύρεση των clusters που µπορεί να χωρισθεί ένα δείγµα, είναι ένα από τα κυριότερα προβλήµατα στην εκµάθηση χωρίς επίβλεψη. Χρησιµοποιώντας τον δείκτη αξιολόγησης J και την καµπύλη που προέκυψε από τον αλγόριθµο k-means, σχεδιάζονται δύο ευθείες που περνάνε από τα σηµεία (x 2, y 2 ), (x 3, y 3 ) και (x 39, y 39 ), (x 40, y 40 ). Οι δύο αυτές ευθείες τέµνονται στο σηµείο µε τον κόκκινο αστερίσκο όπως ϕαίνεται στο σχήµα Αυτό το σηµείο τοµής στον x-άξονα ϑα δώσει τον ϐέλτιστο αριθµό οµάδων για το δείγµα της ενεργού ισχύος µε απόκλιση ϕορτίου 20%. Οπως ϕαίνεται αντιστοιχεί στο γόνατο της καµπύλης, που από εκεί και πέρα η συνάρτηση τετραγωνικού 47

54 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.8: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR. Σχήµα 3.9: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR. σφάλµατος µειώνεται έντονα καθώς αυξάνει ο αριθµός συστάδων. Οπως ϕαίνεται στο σχήµα 3.11 προκύπτει ο αριθµός 4.62 στο σηµείο τοµής. Συνεπώς ϑα κάνουµε συσταδοποίηση των στιγµιοτύπων του δικτύου για 4 οµάδες δηλαδή στον αµέσως µικρότερο ακέραιο όπως προαναφέρθηκε στο 3.3. Εφαρµόζουµε τον k-means για 4 οµάδες και 30 επαναλήψεις διότι για µικρότερο αριθµό επαναλήψεων σύγκλινε ο αλγόριθµος σε τοπικό ελάχιστο κάτι το οποίο δεν είναι επιθυµητό. Το αποτέλεσµα της συσταδοποίησης για 4 clusters ϕαίνεται στο σχήµα

55 3.4 Ενεργός ισχύς µε απόκλιση ϕορτίου 20% Σχήµα 3.10: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. Σχήµα 3.11: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. Εδώ εµφανίζονται οι καµπύλες του δικτύου, όπου το κάθε διάγραµµα απεικονίζει, µία οµάδα από τις 4 και τα στιγµιότυπα της ενεργής ισχύς του δικτύου που ανήκουν στο κάθε cluster. Ο άξονας των x αντιστοιχεί στους κόµβους του δικτύου και ο άξονας των y αντιστοιχίζει κάθε τιµή ενεργής ισχύος στον κόµβο που ϐρίσκεται. Μπορεί κανείς να παρατηρήσει τις διαφορές στο κάθε διάγραµµα, όπως αλλαγές στις κορυφές και πιο µεγάλη πυκνότητα µεταξύ κόµβων. Οι καµπύλες του δικτύου που ϐρίσκονται στην ίδια οµάδα εµφάνισαν την µεγαλύτερη οµοιότητα από τις άλλες. Κάθε cluster αντιπροσωπεύεται από έναν αντιπρόσω- 49

56 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης 50 Σχήµα 3.12: Συσταδοποίηση στιγµιοτύπων του δικτύου ενεργής ισχύος 33 Ϲυγών.

57 3.5 Άεργη ισχύς µε απόκλιση ϕορτίου 20% πο, δηλαδή µία καµπύλη ισχύος, το λεγόµενο κεντροειδές (centroid). Ο κάθε αντιπρόσωπος από τα clusters ϕαίνεται στο διάγραµµα Επίσης απεικονίζεται και µια τυχαία καµπύλη από το δείγµα της ενεργού ισχύος για να γίνει κατανοητό το µέγεθος του αντιπροσώπου. Με µια πρώτη µατιά µπορεί να ϕανεί έντονη διαφορά στους Ϲυγούς 23 και 24 οι οποίοι εµφάνι- Ϲαν την µεγαλύτερη Ϲήτηση σε ενεργή ισχύ. Είναι προφανές ότι οι αντιπρόσωποι των οµάδων επειδή δηµιουργούνται από µέσους όρους καµπυλών εµφανίζουν λείες κορυφές σε αντίθεση µε τις αρχικές καµπύλες. Αυτό ϕαίνεται από την τυχαία καµπύλη του δείγµατος. Για να γίνει ακόµα πιο κατανοητό πως διαφέρουν αυτοί οι αντιπρόσωποι µεταξύ τους ϑα εστιάσουµε σε δύο περιοχές. Το αποτέλεσµα απεικονίζεται στο Η διαφορά ανάµεσα στους αντιπροσώπους είναι πλέον εµφανής. Αυτά τα κεντροειδή αντιπροσωπεύουν το δείγµα της ενεργού ισχύος µε απόκλιση ϕορτίου 20%. Συνεπώς αντί για παρατηρήσεις µπορούµε να έχουµε µόνο 4, για να προσοµοιώσουµε την συµπεριφο- ϱά ενεργής Ϲήτησης για τον ενάµισι χρόνο περίπου. Ως ολικό αντιπρόσωπο του δείγµατος επιλέχθηκε εκείνη η καµπύλη ενεργής ισχύος που αντιστοιχεί στο cluster µε τις πιο πολλές παρατηρήσεις. Το δεύτερο cluster λοιπόν λόγω του ότι είναι το πιο πολυπληθές από αντικείµενα, ϑεωρείται ως το πιο αντιπροσωπευτικό του δείγµατος και το κεντροειδές του ως ο κύριος αντιπρόσωπος, δηλαδή η κόκκινη καµπύλη που αντιστοιχεί στο cluster Αεργη ισχύς µε απόκλιση ϕορτίου 20% Αντίστοιχα µε την ενεργή ισχύ δηµιουργήθηκαν οι δείκτες εκτίµησης του clustering και εφαρµόσθηκαν οι αλγόριθµοι συσταδοποίησης συναρτήσει του αριθµού των clusters. Τα αποτελέσµατα που προέκυψαν για 2 έως 40 οµάδες παρατίθενται παρακάτω : Ο δείκτης αξιολόγησης J Αρχικά εµφανίζονται οι 7 διαφορετικές παραλλαγές της ιεραρχικής µεθόδου συσταδοποίησης για να εκτιµηθεί η αποδοτικότερη και να ακολουθήσει σύγκριση µε τους άλλους 3 αλγορίθµους. Οπως ϕαίνεται στο σχήµα 3.15 πιο αποδοτική εµφανίζεται αυτή του Ward όπως και στο δείγµα της ενεργού ισχύος και ακολουθεί complete, average, weighted, centroid, median και single. Μή ϕθίνουσα συµπεριφορά ακολουθεί η µέθοδος single, συνεπώς δεν είναι κατάλληλη για αυτό το δείγµα. Συγκρινόµενη τώρα η ιεραρχική µέθοδος Ward µε τους υπόλοιπους αλγορίθµους προκύπτει το σχήµα Πρώτος σε απόδοση για αυτόν τον δείκτη έρχεται και πάλι ο αλγόριθµος k-means αν και στις πρώτες συστάδες εµφανίζει σχεδόν πανοµοιότυπη συµπεριφορά µε τον ασαφή αλγόριθµο. Ακολουθούν οι αλγόριθµοι fuzzy, ιεραρχικός (Ward) και k-medoids. Η σειρά απόδοσης των αλγορίθµων ταυτίζεται µε το δείγµα ενεργής ισχύος για αυτόν τον δείκτη. Ο δείκτης Mean index adequacy (MIA) Ο δείκτης αυτός αποτελεί όπως προαναφέρθηκε µέτρο συνεκτικότητας. Ξεκινώντας από τις ιεραρχικές µεθόδους προκύπτει το σχήµα Οι τρεις αλγόριθµοι median, centroid 51

58 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.13: Αντιπρόσωποι των 4 οµάδων. (αʹ)περιοχή Ϲυγών 6 και 7 (ϐʹ)περιοχή Ϲυγού 30 Σχήµα 3.14: Εστιάσεις σε δύο περιοχές των Ϲυγών και single δεν ακολουθούν ϕθίνουσα συµπεριφορά και ϑα µπορούσαν να είχαν παραλειφθεί από αυτόν τον δείκτη. Μεγαλύτερη απόδοση, αν και είναι δύσκολο να διαπιστωθεί, εµφανίζει η µέθοδος του Ward η average και η weighted. Η µέθοδος average για αριθµό συστάδων από υστερεί σε σχέση µε την weighted αλλά κρίνεται η συνολική συµπεριφορά για όλους τους αριθµούς συστάδων. 52

59 3.5 Άεργη ισχύς µε απόκλιση ϕορτίου 20% Σχήµα 3.15: Ιεραρχικές µέθοδοι συσταδοποίησης-j-error-function. Σχήµα 3.16: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J-Error-Function. Η σύγκριση µε τους άλλους αλγορίθµους ϕαίνεται στο Αρχικά η ασαφής συσταδοποίηση του fuzzy αλγορίθµου και η συσσωρευτική αυτή του k-means για µικρό αριθµό συστάδων ακολουθούν την ίδια πορεία. Καθώς αυξάνεται ο αριθµός των οµάδων ο k-means υστερεί έναντι του fuzzy εµφανίζοντας άλλοτε αυξήσεις και άλλοτε µειώσεις. Ως πιο αποδοτικός για τον δείκτη Mean index adequacy κρίνεται ο fuzzy και ακολουθούν ο k-means, ο ιεραρχικός και ο k-medoids. 53

60 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.17: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA. Σχήµα 3.18: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA. Ο δείκτης Clustering Dispersion Indicator (CDI) Οι ιεραρχικές µέθοδοι για τον δείκτη CDI απεικονίζονται στο σχήµα 3.19 Οι µέθοδοι median και centroid εµφανίζουν το ίδιο ποσοστό καλής απόδοσης και ως καλύτερη κρίνεται η median. Ακολουθούν οι single, average, weighted και ward. Με τον συγκεκριµένο δείκτη όλοι οι αλγόριθµοι ακολουθούν ϕθίνουσα µονότονη συµπεριφορά. Στο σχήµα 3.20 απεικονίζεται η σύγκριση όλων των αλγορίθµων. 54

61 3.5 Άεργη ισχύς µε απόκλιση ϕορτίου 20% Σχήµα 3.19: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI. Σχήµα 3.20: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI. Οπως και στην ενεργή ισχύ, έτσι και εδώ ο ιεραρχικός αλγόριθµος εµφανίζει την ϐέλτιστη συµπεριφορά για τον CDI ενώ είναι δύσκολο να διακριθεί ακόµα και αν εστιάσουµε ποιος έρχεται δεύτερος και τρίτος διότι οι τιµές του είναι οριακά κοντά για τα διάφορα clusters. 55

62 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Ο δείκτης Within Cluster Sum of Squares to Between Cluster Variation (WCBCR) Ο δείκτης αυτός αποτελεί ένα καλό µέτρο αξιολόγησης, για το ποιος αλγόριθµος ϑα χρησιµοποιηθεί για ένα τέτοιο δείγµα καθώς συνδέει τη διαχωρισιµότητα και τη συνοχή ανάµεσα στα clusters. Σε σειρά απόδοσης ως πρώτη ιεραρχική µέθοδος έρχεται η median και ακολουθούν weighted και centroid όπως ϕαίνεται στο σχήµα Συνολικά µε τους υπόλοιπους αλγο- Σχήµα 3.21: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR. ϱίθµους συσταδοποίησης στο σχήµα 3.22 πιο αποδοτικός ϕαίνεται ο k-medoids αν και µε τον ιεραρχικό αλγόριθµο ακολουθούν σχεδόν την ίδια ϕθίνουσα πορεία, µε µικρές διακυ- µάνσεις ο ιεραρχικός. Ωστόσο και οι άλλοι δύο αλγόριθµοι εµφανίζουν πολύ καλή απόδοση ϐασιζόµενοι σε αυτόν τον δείκτη, µιας και οι καµπύλες τους είναι πάρα πολύ κοντά. Εύρεση συστάδων Για την εύρεση του ϐέλτιστου αριθµού οµάδων χρησιµοποιείται ο δείκτης J και ο αλγόριθµος k-means που ήταν ο πιο αποδοτικός για τον συγκεκριµένο δείκτη αξιολόγησης. Θα µπορούσε κάλλιστα να είχε επιλεχτεί κάποιος από τους υπόλοιπους δείκτες αξιολόγησης εφόσον εµφανίζουν ϕθίνουσα µονότονη συµπεριφορά. Ακολουθώντας την µέθοδο που αναλύθηκε παραπάνω,σχεδιάζονται οι δύο ευθείες που περνάνε από τα σηµεία (x 2, y 2 ), (x 3, y 3 ) και (x 39, y 39 ), (x 40, y 40 ). Το σηµείο στο οποίο τέµνονται ϑα δώσει τον ϐέλτιστο αριθµό οµάδων και αντιστοιχεί στο γόνατο της καµπύλης. Σε σχέση µε την ενεργή ισχύ, εδώ η άεργος δεν ακολουθεί απότοµη ϕθίνουσα πορεία και το γόνατο εµφανίζεται λίγο αργότερα. Αυτό απεικονίζεται στο σχήµα 3.24 και στο Το σηµείο τοµής στον x άξονα δίνει 5.46 clusters ως ιδανικό αριθµό οµάδων. Άρα ϑα γίνει συσταδοποίηση των στιγµιοτύπων του δικτύου όσον αφορά την άεργη ισχύ για 5 οµάδες χρησιµοποιώντας τον k-means. Για τον ίδιο αριθµό επαναλήψεων όπως στην ενερ- 56

63 3.5 Άεργη ισχύς µε απόκλιση ϕορτίου 20% Σχήµα 3.22: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR. Σχήµα 3.23: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. γή ισχύ εφαρµόζεται ο k-means, για να µή ϐρεθεί σε τοπικό ελάχιστο. Το αποτέλεσµα της συσταδοποίησης των καµπυλών άεργης ισχύος ϕαίνεται στο σχήµα

64 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.24: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. Κάθε διάγραµµα απεικονίζει τις καµπύλες άεργης ισχύος που ανήκουν στην ίδια οµάδα. Οι τιµές στον x άξονα αντιστοιχούν στους Ϲυγούς-κόµβους του δικτύου, ενώ στο άξονα-y είναι εκφρασµένη η άεργη ισχύ σε per-unit µονάδες. Παρατηρώντας το σχήµα 3.25 ϐλέπουµε ότι υπάρχουν έντονες διαφορές στους Ϲυγούς 23 και 24 καθώς επίσης και στον αριθµό των καµπυλών που ανήκουν στην ίδια οµάδα. Ωστόσο όλες οι καµπύλες ακολουθούν ένα συγκεκριµένο µοτίβο, αυτό του αρχικού στιγµιότυπου του δικτύου. Επίσης στην απεικόνιση των καµπυλών ακολουθείται η σύµβαση της αρνητικής τιµής στην άεργη ισχύ. Κάθε οµάδα αντίστοιχα µε την ενεργή ισχύ, έχει το δικό της κεντροειδές. Το πιο αντιπροσωπευτικό κέντρο προκύπτει από το cluster µε τις πιο πολλές παρατηρήσεις που είναι το 1 o. Η καµπύλη του αντιπροσώπου συγκρινόµενη µε µια τυχαία καµπύλη άεργης ισχύος απεικονίζεται στο σχήµα Ο κύριος αντιπρόσωπος του δείγµατος έχοντας δηµιουργηθεί από µέσους όρους µεγάλου πλήθος καµπυλών παρουσιάζει πιο λεία συµπεριφορά από την τυχαία καµπύλη, ακολουθώντας ωστόσο την µορφή της. 3.6 Ενεργός ισχύς µε απόκλιση ϕορτίου 50% Αντίστοιχα µε τα προηγούµενα δείγµατα δηµιουργούνται οι 4 δείκτες αξιολόγησης και εφαρµόζονται οι αλγόριθµοι συσταδοποίησης συναρτήσει του αριθµού των clusters. Οι τιµές του συγκεκριµένου δείγµατος παρουσιάζουν απόκλιση ϕορτίου 50% σε αντίθεση µε τα δύο προηγούµενα. Τα αποτελέσµατα που προέκυψαν από την συσταδοποίηση παρατίθενται παρακάτω : 58

65 3.6 Ενεργός ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.25: Συσταδοποίηση στιγµιοτύπων του δικτύου άεργης ισχύος 33 Ϲυγών. 59

66 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.26: Αντιπρόσωπος των 4 οµάδων. Ο δείκτης αξιολόγησης J Ξεκινώντας από τις ιεραρχικές µεθόδους για την συνάρτηση τετραγωνικού σφάλµατος, η οποία αποτελεί µέτρο συνεκτικότητας των συστάδων, ϑα επιλεγεί εκείνη η ιεραρχική µέθοδος, που ϑα ανταγωνιστεί τους υπόλοιπους αλγορίθµους συσταδοποίησης ως προς την απόδοση. Στη συνέχεια µε τον δείκτη αξιολόγησης J ϑα επιλεγεί ο ϐέλτιστος αριθµός οµάδων για την συσταδοποίηση των στιγµιοτύπων του δικτύου ως προς την ενεργή ισχύ. Στο σχήµα 3.27 εµφανίζονται οι ιεραρχικές µέθοδοι. Ως πιο αποδοτική κρίνεται όπως και στα προηγούµενα δύο δείγµατα, αυτή του Ward και ακολουθεί complete, weighted, average, centroid, median, single. Το σφάλµα που εµφανίζει η συνάρτηση τετραγωνικού σφάλµατος για αυτό το δείγµα, που το χαρακτηρίζει η απόκλιση τιµών στο 50%, κυµαίνεται µεταξύ 0.34 και Ξεπερνάει δηλαδή κατά πολύ το πρώτο δείγµα ενεργής ισχύος που ο δείκτης J ϐρισκόταν ανάµεσα στις τιµές 0.15 και 0.23 αλλά και το δείγµα της άεργης ισχύς που ϐρίσκεται στο [0.05, 0.11]. Σε σύγκριση µε τους υπόλοιπους αλγορίθµους πιο αποδοτικός εµφανίζεται ο k-means µε µικρή διαφορά µε τον ασαφή (fuzzy c-means) και ακολουθεί ιεραρχικός και k-medoids. Η ίδια σειρά απόδοσης των αλγορίθµων ισχύει για για τα δύο προηγούµενα δείγµατα για αυτόν τον δείκτη όπως ϕαίνεται στα σχήµατα 3.3, 3.16, Ο δείκτης Mean index adequacy (MIA) Παραθέτονται οι ιεραρχικές µέθοδοι συσταδοποίησης στο σχήµα Οπως ϕαίνεται υπάρχει µεγάλη απόκλιση µεταξύ τους. Αποδοτικότερη εµφανίζεται αυτή του Ward και ακολουθεί η complete και η weighted. Οι υπόλοιπες ιεραρχικές µέθοδοι εµφανίζουν έντονες διακυµάνσεις µε αύξουσα και ϕθίνουσα συµπεριφορά για τον συγκεκριµένο δείκτη. Σε σύγκριση µε τους υπόλοιπους 3 αλγορίθµους που απεικονίζονται στο σχήµα 3.30, 60

67 3.6 Ενεργός ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.27: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη J. Σχήµα 3.28: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J. πρώτος έρχεται ο fuzzy c-means, ακολουθεί ο k-means µε έντονες διακυµάνσεις µετά τις 6 συστάδες. Εν συνεχεία τρίτος έρχεται ο ιεραρχικός αλγόριθµος που αναφέρθηκε και τέλος ο k-medoids. Οι έντονες διακυµάνσεις στους δείκτες αξιολόγησης που παρουσιάζονται, απορρέουν από την απόκλιση των τιµών του δείγµατος, ενώ στα δύο προηγούµενα δείγµατα οι καµπύλες χαρακτηρίζονταν από οµαλότητα ανάµεσα στα διαδοχικά clusters. 61

68 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.29: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA. Σχήµα 3.30: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA. Ο δείκτης Clustering Dispersion Indicator (CDI) Οι 7 συσσωρευτικές τεχνικές των ιεραρχικών αλγορίθµων εµφανίζονται στο σχήµα Ο δείκτης αυτός επειδή περιέχει έκτος από την πληροφορία της συνεκτικότητας και την πληροφορία της διαχωρισιµότητας µεταξύ των οµάδων εµφανίζει οµαλότερες καµπύλες που ακολουθούν ϕθίνουσα πορεία. Είναι δύσκολο να διακριθεί ποια ιεραρχική τεχνική έρχεται πρώτη για αυτό τον δείκτη. 62

69 3.6 Ενεργός ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.31: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI. Ωστόσο έπειτα από εστίαση στο κάτω µέρος του διαγράµµατος εκλέγεται ως πιο αποδοτική η single και ακολουθεί η median, weighted, ward και οι υπόλοιπες. Στη σύγκριση µε τους άλλους αλγορίθµους έρχεται πρώτος ο ιεραρχικός αλγόριθµος και ακολουθεί k-medoids, k-means και fuzzy c-means όπως ϕαίνεται στο Η ίδια σειρά απόδοσης εµφανίζεται Σχήµα 3.32: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI. και στα δύο προηγούµενα δείγµατα. 63

70 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Ο δείκτης Within Cluster Sum of Squares to Between Cluster Variation (WCBCR) Αποδοτικότερη ιεραρχική µέθοδος κρίνεται η signle. Ακολουθούν η average, weighted, median, complete και centroid σύµφωνα µε το σχήµα 3.33 και ιδιαίτερα σύµφωνα µε το 3.34 όπου είναι πιο ευδιάκριτες οι περιοχές. Οι τιµές ανάµεσα στις µεθόδους είναι πάρα πολύ κοντά, πράγµα το οποίο εξασφαλίζει ότι ο δείκτης είναι καλό µέτρο συνοχής. Συγκριτικά µε Σχήµα 3.33: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR. Σχήµα 3.34: Εστίαση καµπυλών για τον δείκτη WCBCR. τους 3 αλγορίθµους το αποτέλεσµα της συµπεριφοράς του καθενός ϕαίνεται στο 3.35 και στο 64

71 3.6 Ενεργός ισχύς µε απόκλιση ϕορτίου 50% σχήµα Μεγαλύτερη απόδοση εµφανίζει ο ιεραρχικός και ακολούθως ο k-medoids, ο Σχήµα 3.35: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR. Σχήµα 3.36: Εστίαση καµπυλών συσταδοποίησης για τον δείκτη WCBCR. k-means και ο ασαφής (fuzzy c-means). Εύρεση συστάδων Για την εύρεση του ϐέλτιστου αριθµού οµάδων ϑα χρησιµοποιηθεί ο δείκτης J και ο πιο αποδοτικός αλγόριθµος όπως προέκυψε ο k-means. Ακολουθώντας την µέθοδο που ανα- 65

72 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης λύθηκε στην αρχή σχεδιάζονται οι δύο ευθείες που περνάνε από τα σηµεία (x 2, y 2 ), (x 3, y 3 ) και (x 39, y 39 ), (x 40, y 40 ). Το σηµείο στο οποίο τέµνονται ϑα δώσει τον ϐέλτιστο αριθµό ο- Σχήµα 3.37: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. µάδων και αντιστοιχεί στο γόνατο της καµπύλης. Η δεύτερη ευθεία που περνάει από τα (x 39, y 39 ), (x 40, y 40 ) κόβει το διάγραµµα πιο ψηλά. Αυτό οφείλεται στην απότοµη κλίση της καµπύλης, η οποία ξεκινάει την ϕθίνουσα πορεία της στις πρώτες κιόλας συστάδες. Αυτή η ιδιαιτερότητα αποτυπώνεται στο σχήµα Η τιµή του σηµείου τοµής στον x άξονα ϕαίνεται στο 3.38 και είναι Θα επιλέξουµε να γίνει συσταδοποίηση των καµπυλών ενεργής ισχύος για 3 οµάδες χρησιµοποιώντας τον k-means. Οι επιλογές του k-means παραµένουν οι ίδιες για την αποφυγή της συνάρτησης στόχου J να πέσει σε τοπικό ελάχιστο. Το αποτέλεσµα της συσταδοποίησης για 3 οµάδες ϐρίσκεται στο σχήµα

73 3.7 Άεργη ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.38: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. Σε κάθε διάγραµµα από το συνολικό, οι τιµές στον y άξονα εµφανίζονται σε per unit, ενώ στον x άξονα αντιστοιχίζονται οι Ϲυγοί του δικτύου. Οι καµπύλες που αντιστοιχούν στο πρώτο cluster ανήκουν στην πιο αντιπροσωπευτική οµάδα και χαρακτηρίζονται από µεγαλύτερη οµοιογένεια και µικρότερη απόκλιση στις τιµές µεταξύ τους σε σύγκριση µε το δεύτερο cluster, που αν και λιγότερες καµπύλες (3418) εµφανίζουν µεγαλύτερη απόκλιση τιµών. Επίσης στους κόµβους εµφανίζονται έντονες διαφορές στην µορφολογία των καµπυλών ανάµεσα στις οµάδες όπως και στους αρχικούς Ϲυγούς. Αναφορικά µε τα κεντροειδή που αντιπροσωπεύουν την κάθε οµάδα απεικονίζονται στο σχήµα Επίσης απεικονίζεται και µια τυχαία καµπύλη ενεργής ισχύος για την καλύτερη εποπτεία των αντιπροσώπων. Οι κύριες διαφορές εµφανίζονται στους Ϲυγούς εκείνους του δικτύου που παίζουν κύριο ϱόλο στη Ϲήτηση ενεργής ισχύος. Αυτοί είναι όπως ϕαίνεται και στα σχήµατα 3.40, 3.41, οι 6 και 7 καθώς και ο Ϲυγός 23 και 24. Αυτά τα τρία κέντρα αντιπροσωπεύουν συνολικά το δείγµα ενεργής ισχύος µε απόκλιση ϕορτίου 50%, ενώ ως κύριος αντιπρόσωπος του δείγµατος επιλέγεται εκείνη η καµπύλη ενεργής ισχύος που αντιστοιχεί στο 1 o cluster που είναι το πιο πολυπληθές από στιγµιότυπα ενεργής ισχύος. 3.7 Αεργη ισχύς µε απόκλιση ϕορτίου 50% Παρατίθενται παρακάτω τα αποτελέσµατα των δεικτών αξιολόγησης για το τελευταίο δείγµα της άεργης ισχύς µε απόκλιση ϕορτίου 50%. Ακολουθώντας την ίδια διαδικασία όπως και µε τα προηγούµενα δείγµατα ισχύος εµφανίζονται πρώτα οι συγκρίσεις των ιεραρχικών µεθόδων και αργότερα οι συγκρίσεις µε τους υπόλοιπους αλγορίθµους. 67

74 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης 68 Σχήµα 3.39: Συσταδοποίηση στιγµιοτύπων του δικτύου ενεργής ισχύος 33 Ϲυγών.

75 3.7 Άεργη ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.40: Αντιπρόσωποι των 3 οµάδων. (αʹ)περιοχή Ϲυγών 6 και 7 (ϐʹ)περιοχή Ϲυγών 23 και 24 Σχήµα 3.41: Εστιάσεις σε δύο περιοχές των Ϲυγών Ο δείκτης αξιολόγησης J Τα αποτελέσµατα για τις ιεραρχικές µεθόδους αποτυπώνονται στο σχήµα Οπως στο προηγούµενο δείγµα ενεργής ισχύος µε απόκλιση τιµών κατά 50%, έτσι και εδώ υπάρχει έντονη διακύµανση των καµπυλών για τις ιεραρχικές µεθόδους. Αποδοτικότερη µέθοδος, όπως ακολούθησε στην έρευνα µέχρι τώρα, εξακολουθεί να εµφανίζεται η µέθοδος του Ward 69

76 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.42: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη J. και ακολουθεί η complete, average, weighted, centroid,median και single. Η µέθοδος του Ward εµφανίζει πολύ µικρότερο τετραγωνικό σφάλµα από όλες τις υπόλοιπες. Στην σύγκριση µε τους άλλους 3 αλγορίθµους που ϕαίνεται στο 3.43,3.44 πρώτος έρ- Σχήµα 3.43: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J. χεται ο ασαφής αλγόριθµος συσταδοποίησης (fuzzy c-means) που αυτό γίνεται πιο εµφανές από το 3.44 καθώς ο k-means εµφανίζει διακυµάνσεις στην συµπεριφορά του καθώς αυξάνει ο αριθµός των clusters, ενώ ο ασαφής διατηρεί σταθερή συµπεριφορά. Ακολουθεί ο 70

77 3.7 Άεργη ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.44: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη J. ιεραρχικός και τέλος ο k-medoids. Ο δείκτης Mean index adequacy (MIA) Παρατίθενται οι ιεραρχικές µέθοδοι συσταδοποίησης στο σχήµα ιακρίνεται η Σχήµα 3.45: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη MIA. µεγάλη διακύµανση στις καµπύλες, αύξουσες και ϕθίνουσες. Οι 3 τεχνικές ιεραρχικής συσταδοποίησης που ανταποκρίνονται στον δείκτη και ακολουθούν ϕθίνουσα πορεία είναι 71

78 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης ο Ward, weighted και complete. Οι υπόλοιπες µέθοδοι εµφανίζουν αύξουσα µονοτονία και δεν είναι κατάλληλες για αυτόν τον δείκτη. Η σύγκριση τώρα ανάµεσα στην ιεραρχική µέθοδο του Ward και τους υπόλοιπους αλγορίθµους ϕαίνεται στο Παρατηρώντας τις καµπύλες και κρίνοντας την συνολική τους Σχήµα 3.46: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη MIA. συµπεριφορά καθώς αυξάνει ο αριθµός των clustersεµφανίζεται ως πιο αποδοτικός ο ασα- ϕής αλγόριθµος (fuzzy) και ακολουθεί ο k-means, ο ιεραρχικός και τέλος ο k-medoids. Οπως στο δείκτη J έτσι και εδώ ο ασαφής αλγόριθµος συσταδοποίησης εµφανίζει καλύτερη συµπεριφορά από τους υπόλοιπους 3. Ο δείκτης Clustering Dispersion Indicator (CDI) Για τον δείκτη CDI που αποτελεί και µέτρο συνεκτικότητας και διαχωρισιµότητας ανάµεσα στις οµάδες του clustering αναµένουµε µικρή διακύµανση των καµπυλών και πιο όµοια συµπεριφορά. Πράγµατι στο σχήµα 3.47 επαληθεύεται αυτό. Επικρατεί ϕθίνουσα µονοτονία ανάµεσα στις ιεραρχικές µεθόδους που είναι δύσκολο να διακριθεί ποια µέθοδος κυριαρχεί έναντι των άλλων. Παρατηρώντας το σχήµα 3.48 κυριαρχεί η µέθοδος single,έπειτα η median και centroid µε σχεδόν µηδενική διαφορά και ακολουθεί η average, weighted, complete και τελευταία αυτή του Ward ενώ στους δείκτες J και MIA ήταν η πιο αποδοτική ανάµεσα στις ιεραρχικές µεθόδους. Στη σύγκριση µε τους υπόλοιπους αλγορίθµους στο 3.49 πιο αποδοτικός εµφανίζεται ο ιεραρχικός αλγόριθµος k-medoids, k-means και fuzzy c-means µε πολύ µικρή διαφορά µεταξύ των καµπυλών. 72

79 3.7 Άεργη ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.47: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI. Σχήµα 3.48: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη CDI. Ο δείκτης Within Cluster Sum of Squares to Between Cluster Variation (WCBCR) Στο σχήµα 3.50 εµφανίζονται τα αποτελέσµατα από τις συγκρίσεις των ιεραρχικών µε- ϑόδων για τον δείκτη WCBCR. Οπως ϕαίνεται όλες οι µέθοδοι και για αυτόν τον δείκτη παρουσιάζουν ϕθίνουσα µονοτονία µε πιο αποδοτική µέθοδο την median. Παρατηρώντας το σχήµα 3.51 ακολουθούν η average, centroid, weighted, ward, complete και single. Η σύγκριση τώρα µε τους υπόλοιπους αλγορίθµους δίνει πρώτο τον ιεραρχικό αλγόριθµο και 73

80 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.49: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη CDI. Σχήµα 3.50: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR ακολουθούν οι υπόλοιποι µε ελάχιστη διαφορά µεταξύ τους σύµφωνα µε το Εύρεση συστάδων Χρησιµοποιώντας τον δείκτη αξιολόγησης J και την καµπύλη που προέκυψε από τον αλγόριθµο fuzzy c-means, σχεδιάζονται δύο ευθείες που περνάνε από τα σηµεία (x 2, y 2 ), (x 3, y 3 ) και (x 39, y 39 ), (x 40, y 40 ). Η εύρεση του σηµείου τοµής αυτών των δύο ευθειών ϑα δώσει τον 74

81 3.7 Άεργη ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.51: Ιεραρχικές µέθοδοι συσταδοποίησης για τον δείκτη WCBCR Σχήµα 3.52: Σύγκριση αλγορίθµων συσταδοποίησης για τον δείκτη WCBCR. ϐέλτιστο αριθµό οµάδων.η τιµή αυτή ϕαίνεται στο σχήµα 3.54 Θα γίνει λοιπόν συσταδοποίηση των καµπυλών άεργης ισχύος για 5 clusters. Το αποτέλεσµα αυτής της συσταδοποίησης ϕαίνεται στο σχήµα Σε κάθε διάγραµµα του συνολικού διαγράµµατος οµαδοποιούνται οι καµπύλες άεργης ισχύος που εµφάνισαν την µεγαλύτερη οµοιότητα µεταξύ τους. Στον x άξονα αντιστοιχίζονται οι Ϲυγοί του δικτύου και στον y-άξονα το µέτρο της άεργης ισχύς που εµφανίζουν σε µονάδες per-unit. Εµφανίζονται έντονες διαφορές ανάµεσα στη µορφή των καµπυλών από 75

82 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης Σχήµα 3.53: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. Σχήµα 3.54: Σχεδιασµός δύο ευθειών για εύρεση σηµείου τοµής. cluster σε cluster. Σε Ϲυγούς που εµφανίζουν την µεγαλύτερη τιµή άεργης ισχύος υπάρχουν διακυµάνσεις, όπως στους 23 και 24 καθώς και στους 6 και 7. Επίσης ακολουθείται η σύµβαση της άεργης ισχύος µε αρνητικό πρόσηµο, δηλαδή ότι ο Ϲυγός παρέχει ισχύ. Το 4 o cluster περιέχει τις πιο πολλές παρατηρήσεις (στιγµιότυπα άεργης ισχύος) και το κεντροειδές αυτού του cluster ϑα ϑεωρηθεί το πιο αντιπροσωπευτικό του συνολικού δείγµατος. Η καµπύλη του κεντροειδούς απεικονίζεται στο σχήµα 3.55 µαζί µε µια τυχαία καµπύλη άεργης ισχύος του δείγµατος για να γίνει εµφανής η αντιπροσώπευση. Η αντιπρο- 76

83 3.7 Άεργη ισχύς µε απόκλιση ϕορτίου 50% Σχήµα 3.55: Αντιπρόσωπος των 5 οµάδων. σωπευτική καµπύλη της άεργης ισχύος έχει λείες κορυφές και όχι αιχµηρές όπως η τυχαία καµπύλη διότι έχει δηµιουργηθεί από µέσους όρους. Η µορφή της είναι παρόµοια µε την τυχαία καµπύλη χωρίς να εµφανίζει µεγάλες αποκλίσεις από την τελευταία. Η εξαγωγή κεντροειδών από κάθε οµάδα είναι σηµαντική, αφού πλέον το κάθε δείγµα αντιπροσωπεύεται από λιγότερες καµπύλες και µπορούν να χρησιµοποιηθούν πλέον αυτές οι καµπύλες-διανύσµατα σε περεταίρω εφαρµογές, όπως ϑα ϕανεί στην συνέχεια. 77

84 Κεφάλαιο 3. Εφαρµογή αλγορίθµων συσταδοποίησης 78 Σχήµα 3.56: Συσταδοποίηση στιγµιοτύπων του δικτύου άεργης ισχύος 33 Ϲυγών.

85 Κεφάλαιο 4 Clustering και PSO Στο παρόν κεφάλαιο ϑα πραγµατοποιηθεί η σύνδεση της διαδικασίας του clustering που προηγήθηκε, µε τον αλγόριθµο ϐελτιστοποίησης σµήνους σωµατιδίων (Particle swarm optimization, PSO) για να ϐρεθούν οι απώλειες ενέργειας που παρουσιάζει το δίκτυο για διαφορετικές περιπτώσεις. 4.1 Τι είναι ο PSO Ο PSO είναι ένας αλγόριθµος ϐελτιστοποίησης ϐασιζόµενος σε στοχαστικά ϕαινόµενα που συναντώνται στην ϕύση. Στη ϐιβλιογραφία είναι γνωστός µε το όνοµα Βελτιστοποίηση Σµήνους Σωµατιδίων (Particle swarm optimization). Οι πρώτες εκδόσεις του PSO δηµοσιεύτηκαν το 1995 από τους Eberhart και Kennedy[21]. Στο [2] αναφέρεται αναλυτικά το µαθηµατικό µοντέλο του αλγορίθµου αλλά και οι ϐελτιώσεις στη ϐασική του µορφή, για να ξεπεραστεί το πρόβληµα της Σύσφιξης Ταχύτητας, της Σύγκλισης και το πρόβληµα εγκλωβισµού σε τοπικό ελάχιστο. Η χρήση του εδώ αφορά στην µείωση των απωλειών ενεργής ισχύος σε ένα δίκτυο, όπως αυτό των 33 Ϲυγών που χρησιµοποιήθηκε στην διαδικασία της συσταδοποίησης, στοχεύοντας στην εύρεση της ϐέλτιστης ϑέσης σύνδεσης και ϐέλτιστης εγκατεστηµένης ισχύος Μονάδων ιανεµηµένης Παραγωγής (Μ..Π) στο δίκτυο. Το πρόβληµα της µείωσης απωλειών ισχύος είναι ένα πρόβληµα ϐελτιστοποίησης µε στόχο την εύρεση ολικού ελαχίστου. Ο λόγος που γίνεται ειδικά χρήση του PSO είναι για την αποφυγή της πολυπλοκότητας αλλά και του χρόνου επίλυσης[22]. Συνεπώς οι µεταβλητές του προβλήµατος αυτού είναι : Το µέγεθος µιας Μονάδας ιανεµηµένης Παραγωγής, δηλαδή η εγκατεστηµένη ισχύς, ενεργή και άεργη που ϑα έχει. Η ϑέση της µονάδας, δηλαδή µέσω ποιου Ϲυγού ϑα συνδεθεί στο Ηλεκτρικό ίκτυο. Στην ϐιβλιογραφία αυτό το πρόβληµα είναι γνωστό ως Optimal Sizing & Siting of DGs όπου DG=Distributed Generator. Ο αλγόριθµος ϐελτιστοποίησης ακολουθεί τα εξής τρία ϐήµατα[2]: Πραγµατοποιείται αρχικά Ανάλυση Ροής Φορτίου χωρίς να έχουν συνδεθεί Μ..Π στο δίκτυο, η οποία ϑα αναλυθεί παρακάτω και υπολογίζονται οι απώλειες ενεργού ισχύος. 79

86 Κεφάλαιο 4. Clustering και PSO Ενας συγκεκριµένος αριθµός από µονάδες διανεµηµένης παραγωγής µε κατάλληλη έγχυση ισχύος, τοποθετούνται µε κάποιο τρόπο στο δίκτυο. Τέλος γίνεται πάλι υπολογισµός των απωλειών ισχύος. Η διαδικασία επαναλαµβάνεται, µέχρι να ελαχιστοποιηθούν. Ως κριτήριο τερµατισµού του αλγορίθµου ορίζονται : Ο µέγιστος αριθµός επαναλήψεων T max, ο οποίος χρησιµοποιείται και για τον υπολογισµό της αδράνειας. Ενα κριτήριο σύγκλισης µεταξύ προηγούµενης και επόµενης τιµής της ολικά ελάχιστης τιµής. Σε κάθε ϐήµα ελέγχεται αν η διαφορά τους είναι µικρότερη από ένα όριο σύγκλισης. Αυτά τα δύο κριτήρια ελέγχονται από τον χρήστη στην αρχή του αλγορίθµου και προκειµένου να τερµατιστεί ο αλγόριθµος ϑα πρέπει να ικανοποιούνται ταυτόχρονα και τα δύο. Τέλος για την υλοποίηση του PSO ορίζεται ένα πλήθος παραµέτρων που εµφανίζεται στον πίνακα 4.1[2]. Οι τιµές αυτές προτείνονται ή συναντώνται στην ϐιβλιογραφία : Πίνακας 4.1: Πίνακας Παραµέτρων PSO Παράµετροι PSO Γνωστική Συνιστώσα [23],[24] C 1 = 2.05 Κοινωνική Συνιστώσα [23],[24] C 2 = 2.05 Ανω Οριο Αδράνειας [23],[24] w up = 0.9 Κάτω Οριο Αδράνειας [23],[24] w low = 0.4 Συντελεστής Ποινής ϱ=10 Μέγιστο Μέγεθος Μ..Π. Ανώφλι Ταχύτητας Μέγεθος Σµήνους [25] n p = 30 Μέγεθος Γειτονιάς r = 2 Μέγιστος Αριθµός Επαναλήψεων [26] T max = 1000 Ανοχή Σύγκλισης Επιτρεπτό Οριο Αντίστροφης Ροής Ισχύος P max =ανάλογο προβλήµατος Vel max =ανάλογο προβλήµατος Tolerance = 10 7 P Reverse Slackbus = Ανάλυση Ροής Φορτίου Προκειµένου να υπολογισθούν οι απώλειες ισχύος στο δίκτυο που έχουµε στη διάθεσή µας, πραγµατοποιείται Ανάλυση Ροής Ισχύος. Αυτό το πρόβληµα είναι γνωστό ως Ανάλυση Ροής Φορτίου(Load Flow ή Power Flow)[27]. Για να υλοποιηθεί, γίνεται χρήση του λογισµικού MATPOWER R 5.1 σε προγραµµατιστικό περιβάλλον MATLAB R 2014b. Θα ακολουθήσει µια µικρή αναφορά στο µαθηµατικό µοντέλο του MATPOWER[27] ώστε ο αναγνώστης να αποκτήσει µια πιο ευρεία εικόνα αυτού του εργαλείου. Για να γίνει η ανάλυση Ισχύος ϑα πρέπει τα στοιχεία που απαρτίζουν το δίκτυο να καταχωρη- ϑούν σε µία ενιαία δοµή µε πίνακες. Αυτή η δοµή ϑα περιλαµβάνει τα στοιχεία που αφορούν τις γραµµές, τους Ϲυγούς, τόσο αυτούς που παράγουν, όσο και αυτούς που απαιτούν ισχύ, τις γεννήτριες που είναι εγκατεστηµένες. Εν συνεχεία µοντελοποιούνται µαθηµατικά όλα 80

87 4.2 Εφαρµογή του PSO τα παραπάνω, δηλαδή οι γραµµές, οι µετασχηµατιστές ισχύος και οι µεταγωγείς ϕάσης, οι γεννήτριες του δικτύου, τα ϕορτία του καθώς και τα στοιχεία αντιστάθµισης που είναι εγκατεστηµένα. Τέλος κατασκευάζονται οι εξισώσεις ανάλυσης ϱοής ϕορτίου που για την επίλυσή τους γίνεται χρήση της επαναληπτικής µεθόδου Newton-Raphson. Οι γραµµές, οι µετασχηµατιστές ισχύος και οι µεταγωγείς ϕάσης (phase shifters) µοντελοποιούνται µε ένα π-ισοδύναµο µε σύνθετη αντίσταση εν σειρά z s = r s + jx s και εγκάρσια επιδεκτικότητα b c. Ο µετασχηµατιστής ϕάσης έχει λόγο µετασχηµατισµού µε πλάτος τ και γωνία ϕάσης θ shift και ϑεωρείται ότι είναι τοποθετηµένος στο άκρο του Ϲυγού αναχώρησης. Η γεννήτρια ϑεωρείται πηγή µιγαδικής ισχύος όπου για την i-οστή πηγή ισχύει : s i g = p i g + jq i g (4.1) Τα ϕορτία από την άλλη ϑεωρούνται καταναλώσεις µιγαδικής ισχύος όπου για το i-οστό ϕορτίο ισχύει : s i d = p i d + jq i d (4.2) Τα στοιχεία αντιστάθµισης µοντελοποιούνται µε τέτοιο τρόπο ώστε στο i-οστό στοιχείο να υπάρχει η αντιστάθµιση του Ϲυγού i: y i sh = gi sh + jbi sh (4.3) Αξίζει επίσης να αναφερθεί η συνάρτηση στόχου που λαµβάνεται υπόψιν στον αλγόριθµο για την εύρεση ολικού ελαχίστου όπως αναφέρεται στο [28]: όπου, nl F loss = min i,j=1 i j g i,j (V i 2 + V j 2 2V i V j cos(θ i θ j )) (4.4) F loss : η συνάρτηση απωλειών g i,j : η αγωγιµότητα του κλάδου i-j n l : ο αριθµός των κλάδων που απαρτίζουν το δίκτυο V i : το πλάτος τάσης του Ϲυγού i V j : το πλάτος τάσης του Ϲυγού j θ i : η γωνία της τάσης του Ϲυγού i θ j : η γωνία της τάσης του Ϲυγού j 4.2 Εφαρµογή του PSO Οπως προαναφέρθηκε η συσταδοποίηση (clustering) πραγµατοποιήθηκε σε δύο δείγ- µατα ενεργής και άεργης ισχύος µε µέγιστη απόκλιση ϕορτίου 20% και σε άλλα δύο, µε 81

88 Κεφάλαιο 4. Clustering και PSO µέγιστη απόκλιση 50%. Κάθε δείγµα αποτελείται από στιγµιότυπα και επίσης προέκυψαν αντιπρόσωποι για κάθε οµάδα όπως και συνολικοί αντιπρόσωποι για κάθε δείγµα µέσα από την διαδικασία του clustering. Αρχικά πραγµατοποιήθηκε µια επεξεργασία, προκειµένου να δηµιουργηθούν τα σενάρια (cases) που µπορεί να διαχειριστεί το MATPOWER, δηλαδή αυτές οι δοµές πινάκων που µπορεί να επεξεργαστεί. Από τα δύο δείγµατα που παρουσιάζουν ίδια απόκλιση τιµών, παίρνοντας κάθε πρότυπο (3.1) ενεργής και άεργης ισχύος διαδοχικά, δηµιουργείται το κάθε σενάριο. ηλαδή αντιστοιχίζονται τα διανύσµατα ενεργής και άεργης ισχύος στις ϑέσεις των ισχύων Ϲήτησης. Ετσι συνολικά δηµιουργούνται σενάρια µε απόκλιση 20% και µε απόκλιση 50%. Εχοντας αυτά τα σενάρια σε δαχειρίσιµη µορφή για το MATPOWER και τον PSO µπορούµε να προχωρήσουµε παρακάτω. Θα πραγµατοποιηθούν συνολικά 4 ϐήµατα για να συγκριθούν οι απώλειες ισχύος για το δίκτυο των 33 Ϲυγών, τόσο όταν παρουσιάζει απόκλιση στη Ϲήτηση συν-πλην 20% και συν-πλην 50%. 1 o Βήµα : Για κάθε ένα σενάριο από τα ϑα πραγµατοποιηθεί εύρεση των απωλειών ενεργής ισχύος µε την Ανάλυση Ροής Φορτίου χωρίς να έχουν συνδεθεί Μ..Π. µε την χρήση του MATPOWER R o Βήµα : Για κάθε σενάριο από τα παραπάνω εφαρµόζεται ο PSO και καταγράφονται για το καθένα οι µειωµένες πλέον απώλειες ενεργής ισχύος εφόσον έχει τοποθετηθεί η ϐέλτιστη διανεµηµένη παραγωγή σε ϐέλτιστες ϑέσεις Ϲυγών. 3 o Βήµα : Αυτό το ϐήµα απαιτεί την δηµιουργία των αντιπροσωπευτικών σεναρίων, όπου σε αυτά ϑα εφαρµοσθεί ο αλγόριθµος PSO. Αυτά δηµιουργούνται µε τον εξής τρόπο : για τα δύο δείγµατα που παρουσιάζουν την ίδια απόκλιση ϕορτίου,π.χ 20%, το δείγµα της ενεργής ισχύος αντιπροσωπεύεται από κεντροειδή της κάθε οµάδας όπως και το δείγµα της άεργου ισχύος. Ωστόσο ανάµεσα σε αυτά τα δύο δείγµατα δεν προέκυψε ο ίδιος αριθµός οµάδων και ούτε τα ίδια πρότυπα ανήκουν στις ίδιες οµάδες. Θέλοντας να δώσουµε µεγαλύτερη έµφαση στην ενεργή ισχύ στην οποία προέκυψαν 4 οµάδες ο κάθε αντιπρόσωπος (κεντροειδές) µαζί µε τον συνολικό αντιπρόσωπο του δείγµατος της αέργου µε απόκλιση 20% δηµιουργούν ένα αντιπροσωπευτικό σενάριο. Ετσι συνολικά δηµιουργούνται 4 αντιπροσωπευτικά σενάρια, και 3 αντιπροσωπευτικά σενάρια για τα δείγµατα µε απόκλιση 50%. Το κάθε αντιπροσωπευτικό σενάριο από αυτά α- ντιπροσωπεύει τα ίδια πρότυπα (στιγµιότυπα) που αντιπροσωπεύει και το κεντροειδές της οµάδας της ενεργής ισχύος από την οποία προήλθε. Εφαρµόζεται λοιπόν ο PSO σε κάθε αντιπροσωπευτικό σενάριο και η λύση που προκύπτει, δηλαδή σε ποιους Ϲυγούς να µπει διανεµηµένη παραγωγή και σε τί ποσό, εφαρµόζεται στα σενάρια που αντιστοιχούν σε αυτό το αντιπροσωπευτικό. Υπολογίζονται συνεπώς οι µειωµένες απώλειες ενεργής ισχύος όπου σε κάθε σενάριο έχει εφαρµοσθεί η λύση που έδωσε ο PSO στον αντιπρόσωπό του. 82

89 4.2 Εφαρµογή του PSO 4 o Βήµα : Στο τελευταίο αυτό ϐήµα ϑα εφαρµοσθεί ο PSO στο πιο αντιπροσωπευτικό σενάριο το οποίο ϑα είναι εκείνο που προέκυψε από το κεντροειδές της ενεργού ισχύος που είχε τις πιο πολλές παρατηρήσεις. Η λύση του ϑα εφαρµοσθεί σε όλα τα σενάρια που είχαν δηµιουργηθεί στο στάδιο της αρχικής επεξεργασίας και ϑα υπολογισθούν για το καθένα οι µειωµένες απώλειες ενεργής ισχύος µε την χρήση του MATPOWER. Αυτό όπως είναι ϕυσικό γίνεται δύο ϕορές, εφόσον έχουµε δύο διαφορετικές αποκλίσεις. Για το κάθε ϐήµα ξεχωριστά αθροίζονται στο τέλος οι απώλειες ώστε να προκύψουν οι συνολικές απώλειες ενέργειας για εκείνες τις χρονικές στιγµές που συγκροτούν την απόκλιση ϕορτίου στο 20% και στο 50%. Στο ϐήµα 2 είναι σηµαντικό να τονισθεί ότι η εφαρµογή του PSO σε σενάρια απαιτεί πολύ χρόνο και για αυτό τον λόγο αποφασίσθηκε να εκτελεστεί µόνο µία ϕορά. Ενώ στο ϐήµα 3 και 4 ο αριθµός επαναλήψεων του είχε ορισθεί να είναι 15. Παρακάτω παρατίθενται τα αποτελέσµατα που προέκυψαν Απόκλιση ϕορτίου 20% Στο ϱαβδόγραµµα 4.1 απεικονίζονται οι συνολικές απώλειες για κάθε ένα από τα 4 Σχήµα 4.1: Απώλειες Ενέργειας µε απόκλιση ϕορτίου 20%. ϐήµατα που περιγράφηκαν παραπάνω. Τα αποτελέσµατα αφορούν την απόκλιση ϕορτίου συν-πλην 20%. Στο πρώτο ϐήµα που καταγράφονται απλά οι απώλειες ενεργής ισχύος συνολικά, για κάθε σενάριο, χωρίς να έχει εφαρµοσθεί ο αλγόριθµος ϐελτιστοποίησης,είναι λογικό να είναι πολύ πιο αυξηµένες από τα υπόλοιπα ϐήµατα. 83

90 Κεφάλαιο 4. Clustering και PSO Οσον αφορά το δεύτερο ϐήµα ϑα έπρεπε εδώ, οι απώλειες να ήταν οι ελάχιστες σε σχέση µε τα άλλα τρία ϐήµατα, διότι ο αλγόριθµος ϐελτιστοποίησης εφαρµόζεται στο κάθε σενάριο ξεχωριστά ϐρίσκοντας την ϐέλτιστη λύση. Ωστόσο αυτό δεν συµβαίνει διότι ο PSO εφαρµόζεται µόνο µία ϕορά σε κάθε σενάριο για την εύρεση λύσης. Λόγω της στοχαστικότητας που διακρίνει τον αλγόριθµο δεν του επιτρέπει να ϐρει την ϐέλτιστη λύση. Θα έπρεπε συνεπώς να εκτελεστεί για µεγάλο αριθµό επαναλήψεων προκειµένου να πετύχει το ϐέλτιστο αποτέλεσµα. Επίσης γίνονται προσπάθειες για την υλοποίηση αυτού του στόχου, δηλαδή να ορισθεί αριθµός επαναλήψεων στον PSO τουλάχιστον 45 ϕορές για κάθε σενάριο για την εύρεση των ελάχιστων απωλειών, µε ϐέλτιστη εισαγωγή διανεµηµένης παραγωγής. Οπως ϕαντάζεται κανείς αυτό απαιτεί υπολογιστική ισχύ και πολύ χρόνο.για παράδειγµα ο συνολικός χρόνος για να τρέξει ο αλγόριθµος για κάθε σενάριο ήταν σχεδόν 72 µέρες µε το κάθε σενάριο να αντιστοιχεί σε 7 8 λεπτά, πόσο µάλλον για να τρέξει και 45 ϕορές για το καθένα ξεχωριστά. Ανάµεσα στο τρίτο και τέταρτο ϐήµα ϑα έπρεπε το τρίτο ϐήµα να εµφάνιζε µικρότερες συνολικές απώλειες από το τέταρτο. Στο προτελευταίο ϐήµα ϐρίσκει ο PSO την ϐέλτιστη λύση για 4 αντιπροσωπευτικά σενάρια µε αριθµό επαναλήψεων ίσο µε 15 και η λύση που δίνει το κάθε σενάριο εφαρµόζεται σε αυτά που αντιπροσωπεύει. Συνεπώς η απώλεια πλη- ϱοφορίας είναι µικρότερη από την περίπτωση,που εφαρµόζεται η λύση ενός µόνο σεναρίου του πιο αντιπροσωπευτικού σε όλα τα άλλα σενάρια, όπως συµβαίνει στο τελευταίο ϐήµα. Οι τιµές όπως ϕαίνεται στο ϱαβδόγραµµα είναι πάρα πολύ κοντά στα δύο τελευταία ϐήµατα µε διαφορά 18%. Αυτό συµβαίνει επειδή η διακύµανση του ϕορτίου είναι µόνο 20% και δεν παρατηρούνται µεγάλες αποκλίσεις στην ενεργή και στην άεργη ισχύ. Επίσης έχει παρατη- ϱηθεί ότι στις λύσεις που δίνει ο PSO υπάρχουν Ϲυγοί µε µεγαλύτερο ϐάρος επίδρασης από άλλους, στην µείωση των απωλειών (critical nodes). Τέτοιοι Ϲυγοί στο δίκτυο των 33 Ϲυγών είναι ο {3, 2, 4, 8, 13} και ο {30}. Οι συγκεκριµένοι Ϲυγοί προκύπτουν από την ϐέλτιστη λύση που έδωσε ο PSO µετά από 15 επαναλήψεις και έχουν την µεγαλύτερη συχνότητα εµφάνισης στις ϐέλτιστες αυτές λύσεις. Η λύση που έδωσε ο αλγόριθµος για το 2 o σενάριο που ήταν το πιο αντιπροσωπευτικό διαφέρει από τις λύσεις των υπόλοιπων αντιπροσωπευτικών σεναρίων στο ότι εισάγει διανεµηµένη παραγωγή στον Ϲυγό 2. Αυτό έχει σαν αποτέλεσµα ο Ϲυγός 2 να επιδρά στη µείωση των απωλειών ενεργής ισχύος δραστικά στο σύνολο των σενα- ϱίων έχοντας µεγαλύτερο ϐάρος στο σύνολο τελικά. Τα υπόλοιπα τρία σενάρια εµφανίζουν λύση,εισάγοντας διανεµηµένη παραγωγή στους Ϲυγούς {3, 13, 14, 30}. Εφαρµόζοντας όµως την λύση του δεύτερου σεναρίου σε όλα τα άλλα στο πρόβληµα της ανάλυσης ϱοής ισχύος ϕαίνεται πιο αποτελεσµατικό, αλλά αρκετά κοντά στο τρίτο ϐήµα. Συµπερασµατικά, το δεύτερο ϐήµα ϑα πρέπει να εµφανίζει τις µικρότερες απώλειες ενεργής ισχύος από τα υπόλοιπα, εφόσον ο PSO εφαρµόζεται σε κάθε σενάριο ξεχωριστά δίνοντας την ϐέλτιστη λύση. Κάτι τέτοιο όµως ϑα συµβεί όταν αυξηθεί ο αριθµός επαναλήψεων του αλγορίθµου, που αυτή η διαδικασία όπως προαναφέρθηκε, έχει δροµολογηθεί και σύντοµα ϑα προκύψουν τα αποτελέσµατα. Ακόµα ανάµεσα στο τρίτο και τέταρτο ϐήµα ϑα πρέπει το τρίτο να είναι αυτό µε λιγότερες απώλειες από το τελευταίο εφόσον όπως είναι λογικό η απώλεια σε πληροφορία είναι µικρότερη και τα αποτελέσµατα των λύσεων εφαρµόζονται πιο συγκεντρωµένα στα σενάρια που αντιστοιχούν. Οσον αφορά την επιτάχυνση της διαδικασίας ανάµεσα στη εφαρµογή του PSO σε µερικές αντιπροσωπευτικές λύσεις και στην εφαρµογή του σε σενάρια είναι πολύ λιγότερο χρονοβόρα. Για την εφαρµογή του σε 4 λύσεις 84

91 4.2 Εφαρµογή του PSO µε αριθµό επαναλήψεων ίσο µε 15 χρειάστηκαν 3 ώρες και 21 λεπτά. Ενώ για το τελευταίο ϐήµα που εφαρµόζεται µόνο σε µία λύση χρειάστηκε 51 λεπτά και 23 δευτερόλεπτα. Επίσης ο k-means για την συσταδοποίηση σε 4 οµάδες απαιτεί 14 δευτερόλεπτα. Συνεπώς η επιτάχυνση της διαδικασίας είναι ϑεαµατική αν αναλογιστεί κανείς ότι η εφαρµογή του PSO σε σενάρια ήθελε περίπου 1750 ώρες Απόκλιση ϕορτίου 50% Στο ϱαβδόγραµµα 4.2 εµφανίζονται οι συνολικές απώλειες για κάθε ένα από τα 4 ϐήµατα, Σχήµα 4.2: Απώλειες Ενέργειας µε απόκλιση ϕορτίου 50%. αυτή την ϕορά για τα δεδοµένα ισχύος που συγκροτούν απόκλιση ϕορτίου στο 50% Οπως και προηγουµένως στο πρώτο ϐήµα καταγράφονται οι απώλειες ενεργής ισχύος από κάθε σενάριο και στο τέλος αθροίζονται χωρίς να έχει εφαρµοσθεί ο αλγόριθµος ϐελτιστοποίησης. Είναι λογικό το αποτέλεσµα εδώ να είναι το µεγαλύτερο από τα υπόλοιπα ϕτάνοντας τα 3244MW. Στο δεύτερο ϐήµα σε αντιστοιχία µε πριν, έτσι και εδώ ϑα πρέπει να εµφάνιζε το καλύτερο αποτέλεσµα από τα υπόλοιπα εφόσον ο PSO εφαρµόζεται σε κάθε σενάριο ξεχωριστά δίνοντας την ϐέλτιστη λύση. Ωστόσο ϑα πρέπει να αυξηθεί ο αριθµός των επαναλήψεων του για να επιτευχθεί αυτό. Με µικρό αριθµό επαναλήψεων υπάρχει η πιθανότητα ο PSO να εγκλωβιστεί σε τοπικό ελάχιστο και όχι ολικό, καταλήγοντας έτσι σε µή ϐέλτιστη λύση. Ανάµεσα στο τρίτο και τέταρτο ϐήµα, το τρίτο παρουσιάζει µειωµένες απώλειες όπως ήταν αναµενόµενο. Η απώλεια πληροφορίας εµφανίζεται όταν εφαρµόζεται η λύση από ένα µόνο σενάριο σε όλα τα άλλα, ενώ όταν ο κάθε αντιπρόσωπος εφαρµόζει την λύση στα σενάρια που του ανήκουν παρατηρούνται µειωµένες απώλειες ενεργής ισχύος. Τα δείγµατα µε απόκλιση 85

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων Clustering Αλγόριθµοι Οµαδοποίησης Αντικειµένων Εισαγωγή Οµαδοποίηση (clustering): οργάνωση µιας συλλογής από αντικείµενα-στοιχεία (objects) σε οµάδες (clusters) µε βάση κάποιο µέτρο οµοιότητας. Στοιχεία

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

Ανάλυση κατά Συστάδες. Cluster analysis

Ανάλυση κατά Συστάδες. Cluster analysis Ανάλυση κατά Συστάδες Cluster analysis 1 H ανάλυση κατά συστάδες είναι µια µέθοδος που σκοπό έχει να κατατάξει σε οµάδες τις υπάρχουσες παρατηρήσεις χρησιµοποιώντας την πληροφορία που υπάρχει σε κάποιες

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Ομαδοποίηση Ι (Clustering)

Ομαδοποίηση Ι (Clustering) Ομαδοποίηση Ι (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 8: Ομαδοποίηση Μέρος B Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα,

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Ηλίας Κ. Σάββας Εξόρυξη Δεδομένων Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, Μετατροπή δεδομένων σε ΠΛΗΡΟΦΟΡΙΑ, Πολλά δεδομένα αποθηκευμένα

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Αλγόριθµοι Ευθυγράµµισης Τρισδιάστατων Αντικειµένων Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό & Καποδιστριακό Πανεπιστήµιο Αθηνών 20 Οκτωβρίου 2005 Εισαγωγή

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 9: Ομαδοποίηση Μέρος Γ Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ

ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ Σ ε λ ί δ α 0 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ Διπλωματική

Διαβάστε περισσότερα

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Αριθµητική Ανάλυση 1 εκεµβρίου / 43 Αριθµητική Ανάλυση 1 εκεµβρίου 2014 Αριθµητική Ανάλυση 1 εκεµβρίου 2014 1 / 43 Κεφ.5. Αριθµητικός Υπολογισµός Ιδιοτιµών και Ιδιοδιανυσµάτων ίνεται ένας πίνακας A C n n και Ϲητούνται να προσδιορισθούν οι

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ 20 3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ ΟΡΙΣΜΟΣ ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ Μια πολύ σηµαντική έννοια στη θεωρία πιθανοτήτων και τη στατιστική είναι η έννοια της µαθηµατικής ελπίδας ή αναµενόµενης τιµής ή µέσης τιµής µιας τυχαίας

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

Μηχανισµοί & Εισαγωγή στο Σχεδιασµό Μηχανών Ακαδηµαϊκό έτος: Ε.Μ.Π. Σχολή Μηχανολόγων Μηχανικών - Εργαστήριο υναµικής και Κατασκευών - 3.

Μηχανισµοί & Εισαγωγή στο Σχεδιασµό Μηχανών Ακαδηµαϊκό έτος: Ε.Μ.Π. Σχολή Μηχανολόγων Μηχανικών - Εργαστήριο υναµικής και Κατασκευών - 3. ΜΗΧΑΝΙΣΜΟΙ & ΕΙΣΑΓΩΓΗ ΣΤΟ ΣΧΕ ΙΑΣΜΟ ΜΗΧΑΝΩΝ - 3.1 - Cpright ΕΜΠ - Σχολή Μηχανολόγων Μηχανικών - Εργαστήριο υναµικής και Κατασκευών - 2012. Με επιφύλαξη παντός δικαιώµατος. All rights reserved. Απαγορεύεται

Διαβάστε περισσότερα

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθµοι και Πολυπλοκότητα Αλγόριθµοι και Πολυπλοκότητα Ν. Μ. Μισυρλής Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Πανεπιστήµιο Αθηνών Καθηγητής: Ν. Μ. Μισυρλής () Αλγόριθµοι και Πολυπλοκότητα 15 Ιουνίου 2009 1 / 26 Εισαγωγή Η ϑεωρία

Διαβάστε περισσότερα

11 Το ολοκλήρωµα Riemann

11 Το ολοκλήρωµα Riemann Το ολοκλήρωµα Riem Το πρόβληµα υπολογισµού του εµβαδού οποιασδήποτε επιφάνειας ( όπως κυκλικοί τοµείς, δακτύλιοι και δίσκοι, ελλειπτικοί δίσκοι, παραβολικά και υπερβολικά χωρία κτλ) είναι γνωστό από την

Διαβάστε περισσότερα

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου . Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου Σ αυτή την παράγραφο θα εξεταστεί μια παραλλαγή του προβλήματος της συντομότερης διαδρομής, το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου. Σ αυτό το πρόβλημα

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή Τεχνικές διαχωριστικής ομαδοποίησης: Ν πρότυπα k ομάδες Ν>>k Συνήθως k καθορίζεται από χρήστη Διαχωριστικές τεχνικές: επιτρέπουν πρότυπα να μετακινούνται από ομάδα σε

Διαβάστε περισσότερα

ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ)

ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ) «ΣΠ0ΥΔΑI», Τόμος 47, Τεύχος 3o-4o, Πανεπιστήμιο Πειραιώς / «SPOUDAI», Vol. 47, No 3-4, University of Piraeus ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ) Υπό Γιάννης

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

7.5 Πρωτόκολλο IP. Τεχνολογία ικτύων Επικοινωνιών ΙΙ

7.5 Πρωτόκολλο IP. Τεχνολογία ικτύων Επικοινωνιών ΙΙ Τεχνολογία ικτύων Επικοινωνιών ΙΙ 7.5 Πρωτόκολλο IP 38. Τι είναι το πρωτόκολλο ιαδικτύου (Internet Protocol, IP); Είναι το βασικό πρωτόκολλο του επιπέδου δικτύου της τεχνολογίας TCP/IP. Βασίζεται στα αυτοδύναµα

Διαβάστε περισσότερα

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6) Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Πολιτικών Μηχανικών Τοµέας Υδατικών Πόρων Μάθηµα: Τυπικά Υδραυλικά Έργα Μέρος 2: ίκτυα διανοµής Άσκηση E0: Μαθηµατική διατύπωση µοντέλου επίλυσης απλού δικτύου διανοµής

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς Παιδαγωγικό Τµήµα ηµοτικής Εκπαίδευσης ηµοκρίτειο Πανεπιστήµιο Θράκης Αλεξανδρούπολη, 2014-2015 Εµπειρικές Στατιστικές

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ Βασικές µορφές Ερωτήσεων - απαντήσεων Ανοιχτές Κλειστές Κλίµακας ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2 Ανοιχτές ερωτήσεις Ανοιχτές

Διαβάστε περισσότερα

Κεφάλαιο Η2. Ο νόµος του Gauss

Κεφάλαιο Η2. Ο νόµος του Gauss Κεφάλαιο Η2 Ο νόµος του Gauss Ο νόµος του Gauss Ο νόµος του Gauss µπορεί να χρησιµοποιηθεί ως ένας εναλλακτικός τρόπος υπολογισµού του ηλεκτρικού πεδίου. Ο νόµος του Gauss βασίζεται στο γεγονός ότι η ηλεκτρική

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Στατιστική ανάλυση του γεωχηµικού δείγµατος µας δίνει πληροφορίες για τον γεωχηµικό πληθυσµό που µελετάµε. Συνυπολογισµός σφαλµάτων Πειραµατικά

Διαβάστε περισσότερα

Πολύγωνο αθροιστικών σχετικών συχνοτήτων και διάµεσος µιας τυχαίας µεταβλητής ρ. Παναγιώτης Λ. Θεοδωρόπουλος πρώην Σχολικός Σύµβουλος ΠΕ03 e-mail@p-theodoropoulos.gr Πρόλογος Στην εργασία αυτή αναλύονται

Διαβάστε περισσότερα

Ενότητα: Πράξεις επί Συνόλων και Σώµατα Αριθµών

Ενότητα: Πράξεις επί Συνόλων και Σώµατα Αριθµών Τίτλος Μαθήματος: Γραμμική Άλγεβρα Ι Ενότητα: Πράξεις επί Συνόλων και Σώµατα Αριθµών Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης Τμήμα: Μαθηματικών Κεφάλαιο 1 Εισαγωγη : Πραξεις επι Συνολων και Σωµατα Αριθµων

Διαβάστε περισσότερα

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης Τίτλος Μαθήματος: Γραμμική Άλγεβρα ΙΙ Ενότητα: Η Ορίζουσα Gram και οι Εφαρµογές της Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης Τμήμα: Μαθηματικών 65 11 Η Ορίζουσα Gram και

Διαβάστε περισσότερα

Εργασία στο µάθηµα Ανάλυση εδοµένων

Εργασία στο µάθηµα Ανάλυση εδοµένων Μεταπτυχιακό Υπολογιστικής Φυσικής Εργασία στο µάθηµα Ανάλυση εδοµένων ηµήτρης Κουγιουµτζής E-mail: dkugiu@auth.gr 30 Ιανουαρίου 2018 Οδηγίες : Σχετικά µε την παράδοση της εργασίας ϑα πρέπει : Το κείµενο

Διαβάστε περισσότερα

5.1 Θεωρητική εισαγωγή

5.1 Θεωρητική εισαγωγή ΨΗΦΙΑΚΑ ΚΥΚΛΩΜΑΤΑ - ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 5 ΚΩ ΙΚΟΠΟΙΗΣΗ BCD Σκοπός: Η κατανόηση της µετατροπής ενός τύπου δυαδικής πληροφορίας σε άλλον (κωδικοποίηση/αποκωδικοποίηση) µε τη µελέτη της κωδικοποίησης BCD

Διαβάστε περισσότερα

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. ιπλωµατική Εργασία

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. ιπλωµατική Εργασία ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ιπλωµατική Εργασία «Μετάδοση πληροφορίας σε ασύρµατο δίκτυο αισθητήρων µε οµαδοποιηµένους κόµβους και µε χρήση διευθύνσεων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Άσκηση 5.1 Για ένα σήμα που έχει τη σ.π.π. του σχήματος να υπολογίσετε: μήκος του δυαδικού κώδικα για Ν επίπεδα κβάντισης για σταθερό μήκος λέξης;

Διαβάστε περισσότερα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα Εξαγωγή κανόνων από αριθµητικά δεδοµένα Συχνά το σύστηµα που θέλουµε να µοντελοποιήσουµε η να ελέγξουµε αντιµετωπίζεται ως µαύρο κουτί και η πληροφορία για τη λειτουργία του διατίθεται υπό µορφή ζευγών

Διαβάστε περισσότερα

Εργασία στο µάθηµα Ανάλυση εδοµένων

Εργασία στο µάθηµα Ανάλυση εδοµένων Μεταπτυχιακό Υπολογιστικής Φυσικής Εργασία στο µάθηµα Ανάλυση εδοµένων ηµήτρης Κουγιουµτζής E-mail: dkugiu@gen.auth.gr 31 Ιανουαρίου 2017 Οδηγίες : Σχετικά µε την παράδοση της εργασίας ϑα πρέπει : Το κείµενο

Διαβάστε περισσότερα

Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι

Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εξόρυξη Δεδομένων Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι 1 2 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΕΠΛ 035 - ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΓΙΑ ΗΛΕΚΤΡΟΛΟΓΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΚΑΙ ΜΗΧΑΝΙΚΟΥΣ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδηµαϊκό έτος 2017-2018 Υπεύθυνος εργαστηρίου: Γεώργιος

Διαβάστε περισσότερα

ΒΕΛΤΙΣΤΟΣ ΣΧΕΔΙΑΣΜΟΣ ΤΩΝ ΚΑΤΑΣΚΕΥΩΝ. Δρ. Πολ. Μηχ. Κόκκινος Οδυσσέας

ΒΕΛΤΙΣΤΟΣ ΣΧΕΔΙΑΣΜΟΣ ΤΩΝ ΚΑΤΑΣΚΕΥΩΝ. Δρ. Πολ. Μηχ. Κόκκινος Οδυσσέας ΒΕΛΤΙΣΤΟΣ ΣΧΕΔΙΑΣΜΟΣ ΤΩΝ ΚΑΤΑΣΚΕΥΩΝ Δρ. Πολ. Μηχ. Κόκκινος Οδυσσέας Σχεδιασμός αντικειμένων, διεργασιών, δραστηριοτήτων (π.χ. τεχνικά έργα, έπιπλα, σκεύη κτλ) ΠΡΟΚΑΤΑΡΚΤΙΚΗ ΜΕΛΕΤΗ (conceptual design) ΠΡΟΜΕΛΕΤΗ

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ Βασικός τελικός στόχος κάθε επιστηµονικής τεχνολογικής εφαρµογής είναι: H γενική βελτίωση της ποιότητας του περιβάλλοντος Η βελτίωση της ποιότητας ζωής Τα µέσα µε τα

Διαβάστε περισσότερα

Επίλυση Προβλημάτων 1

Επίλυση Προβλημάτων 1 Επίλυση Προβλημάτων 1 Επίλυση Προβλημάτων Περιγραφή Προβλημάτων Αλγόριθμοι αναζήτησης Αλγόριθμοι τυφλής αναζήτησης Αναζήτηση πρώτα σε βάθος Αναζήτηση πρώτα σε πλάτος (ΒFS) Αλγόριθμοι ευρετικής αναζήτησης

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Αριθµητική Γραµµική ΑλγεβραΚεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών 2 Απριλίου και2015 Ιδιοδιανυσµάτων 1 / 50

Αριθµητική Γραµµική ΑλγεβραΚεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών 2 Απριλίου και2015 Ιδιοδιανυσµάτων 1 / 50 Αριθµητική Γραµµική Αλγεβρα Κεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών και Ιδιοδιανυσµάτων ΕΚΠΑ 2 Απριλίου 205 Αριθµητική Γραµµική ΑλγεβραΚεφάλαιο 4. Αριθµητικός Υπολογισµός Ιδιοτιµών 2 Απριλίου και205

Διαβάστε περισσότερα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα Δύο κύριοι τρόποι παρουσίασης δεδομένων Παράδειγμα Με πίνακες Με διαγράμματα Ονομαστικά δεδομένα Εδώ τα περιγραφικά μέτρα (μέσος, διάμεσος κλπ ) δεν έχουν νόημα Πήραμε ένα δείγμα από 25 άτομα και τα ρωτήσαμε

Διαβάστε περισσότερα

Μάθηµα 3 ο. Περιγραφική Στατιστική

Μάθηµα 3 ο. Περιγραφική Στατιστική Μάθηµα 3 ο Περιγραφική Στατιστική ΗΣτατιστικήείναι Μια τυποποιηµένη σειρά αναλυτικών µεθόδων, οι οποίες χρησιµοποιούνται από τον εκάστοτε ερευνητή για την ανάλυση των διαθέσιµων δεδοµένων. Υπάρχουν δύο

Διαβάστε περισσότερα

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) Α. Ερωτήσεις πολλαπλών επιλογών.(11 βαθµοί) (1:3 βαθµοί, 2-9:8 βαθµοί) 1. ίνεται ο πίνακας: Χ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Οκτωβρίου 23 ιάρκεια: 2 ώρες Έστω το παρακάτω γραµµικώς

Διαβάστε περισσότερα

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων. ΠΕΡΙΛΗΨΗ Η τεχνική αυτή έκθεση περιλαµβάνει αναλυτική περιγραφή των εναλλακτικών µεθόδων πολυκριτηριακής ανάλυσης που εξετάσθηκαν µε στόχο να επιλεγεί η µέθοδος εκείνη η οποία είναι η πιο κατάλληλη για

Διαβάστε περισσότερα

Γ. Κορίλη Αλγόριθµοι ροµολόγησης

Γ. Κορίλη Αλγόριθµοι ροµολόγησης - Γ. Κορίλη Αλγόριθµοι ροµολόγησης http://www.seas.upenn.edu/~tcom50/lectures/lecture.pdf ροµολόγηση σε ίκτυα εδοµένων Αναπαράσταση ικτύου µε Γράφο Μη Κατευθυνόµενοι Γράφοι Εκτεταµένα έντρα Κατευθυνόµενοι

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Δ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Οπτική αντίληψη. Μετά?..

Οπτική αντίληψη. Μετά?.. Οπτική αντίληψη Πρωτογενής ερεθισµός (φυσικό φαινόµενο) Μεταφορά µηνύµατος στον εγκέφαλο (ψυχολογική αντίδραση) Μετατροπή ερεθίσµατος σε έννοια Μετά?.. ΓΙΑ ΝΑ ΚΑΤΑΝΟΗΣΟΥΜΕ ΤΗΝ ΟΡΑΣΗ ΠΡΕΠΕΙ ΝΑ ΑΝΑΛΟΓΙΣΤΟΥΜΕ

Διαβάστε περισσότερα

Κεφάλαιο 14: Διαστασιολόγηση αγωγών και έλεγχος πιέσεων δικτύων διανομής

Κεφάλαιο 14: Διαστασιολόγηση αγωγών και έλεγχος πιέσεων δικτύων διανομής Κεφάλαιο 14: Διαστασιολόγηση αγωγών και έλεγχος πιέσεων δικτύων διανομής Έλεγχος λειτουργίας δικτύων διανομής με χρήση μοντέλων υδραυλικής ανάλυσης Βασικό ζητούμενο της υδραυλικής ανάλυσης είναι ο έλεγχος

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 Χειμερινό εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Μέτρα

Διαβάστε περισσότερα

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό. Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» Κεφάλαιο : Ακολουθίες πραγµατικών αριθµών Α Οµάδα Εξετάστε αν οι παρακάτω προτάσεις είναι αληθείς ή ψευδείς αιτιολογήστε πλήρως την απάντησή σας α Κάθε

Διαβάστε περισσότερα

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Δείκτες Κεντρικής Τάσης και Διασποράς Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Εμπειρικές Στατιστικές Κατανομές Τα προβλήματα που γεννιούνται κατά την σύγκριση

Διαβάστε περισσότερα

Κεφ.11: Ευρετήρια και Κατακερματισμός

Κεφ.11: Ευρετήρια και Κατακερματισμός Κεφ.11: Ευρετήρια και Κατακερματισμός Database System Concepts, 6 th Ed. See www.db-book.com for conditions on re-use Κεφ. 11: Ευρετήρια-Βασική θεωρία Μηχανισμοί ευρετηρίου χρησιμοποιούνται για την επιτάχυνση

Διαβάστε περισσότερα

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας Κεφάλαιο 5 Οι δείκτες διασποράς 1 Ένα παράδειγµα εργασίας Ένας καθηγητής µαθηµατικών έδωσε σε δύο τµήµατα µιας τάξης του σχολείου του το ίδιο τεστ. Η επίδοση των µαθητών του κάθε τµήµατος (όπως µετρήθηκε

Διαβάστε περισσότερα

Κλασικη ιαφορικη Γεωµετρια

Κλασικη ιαφορικη Γεωµετρια Αριστοτελειο Πανεπιστηµιο Θεσσαλονικης Σχολη Θετικων Επιστηµων, Τµηµα Μαθηµατικων, Τοµεας Γεωµετριας Κλασικη ιαφορικη Γεωµετρια Πρώτη Εργασία, 2018-19 1 Προαπαιτούµενες γνώσεις και ϐασική προετοιµασία

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

ΣΕΙΣΜΟΣ & ΑΝΤΙΣΕΙΣΜΙΚΗ ΠΡΟΣΤΑΣΙΑ ΣΤΟ ΣΧΟΛΙΚΟ ΧΩΡΟ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΗΝ ΑΕΙΦΟΡΟ ΑΝΑΠΤΥΞΗ

ΣΕΙΣΜΟΣ & ΑΝΤΙΣΕΙΣΜΙΚΗ ΠΡΟΣΤΑΣΙΑ ΣΤΟ ΣΧΟΛΙΚΟ ΧΩΡΟ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΗΝ ΑΕΙΦΟΡΟ ΑΝΑΠΤΥΞΗ ΧΑΤΖΗΝΙΚΟΛΑΣ ΜΙΧΑΗΛ ΣΕΙΣΜΟΣ & ΑΝΤΙΣΕΙΣΜΙΚΗ ΠΡΟΣΤΑΣΙΑ ΣΤΟ ΣΧΟΛΙΚΟ ΧΩΡΟ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΗΝ ΑΕΙΦΟΡΟ ΑΝΑΠΤΥΞΗ ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ ΜΕ ΧΡΗΣΗ ΠΟΣΟΤΙΚΩΝ ΜΕΘΟΔΩΝ 2015 Copyright Μιχαήλ Χατζηνικόλας,

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Αναλογικά Ψηφιακά Σήματα Αναλογικό Σήμα x t, t [t min, t max ], x [x min, x max ] Δειγματοληψία t n, x t x n, n = 1,, N Κβάντιση x n x(n) 3 Αλφάβητο

Διαβάστε περισσότερα

3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ

3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ 3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ 3. Διαφορά μετρήσεων από εκτιμήσεις μετρήσεων. Όταν επιλύοµε ένα αντίστροφο πρόβληµα υπολογίζοµε ένα διάνυσµα παραµέτρων est m το οποίο αντιπροσωπεύει

Διαβάστε περισσότερα

οµή δικτύου ΣΧΗΜΑ 8.1

οµή δικτύου ΣΧΗΜΑ 8.1 8. ίκτυα Kohonen Το µοντέλο αυτό των δικτύων προτάθηκε το 1984 από τον Kοhonen, και αφορά διαδικασία εκµάθησης χωρίς επίβλεψη, δηλαδή δεν δίδεται καµία εξωτερική επέµβαση σχετικά µε τους στόχους που πρέπει

Διαβάστε περισσότερα

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex Γραµµικός Προγραµµατισµός - Μέθοδος Simplex Η πλέον γνωστή και περισσότερο χρησιµοποιηµένη µέθοδος για την επίλυση ενός γενικού προβλήµατος γραµµικού προγραµµατισµού, είναι η µέθοδος Simplex η οποία αναπτύχθηκε

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΓΡΑΦΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΣΕ MATLAB ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕΣΩ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ ISODATA

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΓΡΑΦΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΣΕ MATLAB ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕΣΩ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ ISODATA ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΑΝΑΠΤΥΞΗ ΓΡΑΦΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΣΕ MATLAB ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕΣΩ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ ISODATA Μαρκαντωνάτου Μαρία Α.Μ.: 379 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Δρ. Τσιμπίρης

Διαβάστε περισσότερα

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ν ν = 6. όταν είναι πραγµατικός αριθµός. Συνάρτηση: ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ λέγεται µια διαδικασία µε την οποία κάθε στοιχείο ενός συνόλου Α αντιστοιχίζεται σε ένα ακριβώς στοιχείο κάποιου άλλου συνόλου Β. Γνησίως αύξουσα: σε ένα διάστηµα του πεδίου

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Επιχειρησιακή Έρευνα

Επιχειρησιακή Έρευνα Επιχειρησιακή Έρευνα Ενότητα 7: Επίλυση με τη μέθοδο Simplex (1 ο μέρος) Μπεληγιάννης Γρηγόριος Σχολή Οργάνωσης και Διοίκησης Επιχειρήσεων Τμήμα Διοίκησης Επιχειρήσεων Αγροτικών Προϊόντων & Τροφίμων (Δ.Ε.Α.Π.Τ.)

Διαβάστε περισσότερα

Γραµµική Αλγεβρα Ι. Ενότητα: Εισαγωγικές Εννοιες. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

Γραµµική Αλγεβρα Ι. Ενότητα: Εισαγωγικές Εννοιες. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών Ενότητα: Εισαγωγικές Εννοιες Ευάγγελος Ράπτης Τµήµα Μαθηµατικών Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ 1 ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ 1. Ένα σηµείο Α(χ, ψ) ανήκει στη γραφική παράσταση της f αν f(ψ)=χ. 2. Αν µια συνάρτηση είναι γνησίως αύξουσα σε ένα διάστηµα A,

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση (clustering) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων

Διαβάστε περισσότερα

«ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ»

«ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ» Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ» Της σπουδάστριας ΚΑΤΣΑΡΟΥ ΧΑΡΙΚΛΕΙΑΣ Επιβλέπων Δρ. ΓΕΡΟΝΤΙΔΗΣ

Διαβάστε περισσότερα

Υπολογιστικές Μέθοδοι στις Κατασκευές

Υπολογιστικές Μέθοδοι στις Κατασκευές Γενικά Για Τη Βελτιστοποίηση Η βελτιστοποίηση µπορεί να χωριστεί σε δύο µεγάλες κατηγορίες: α) την Βελτιστοποίηση Τοπολογίας (Topological Optimization) και β) την Βελτιστοποίηση Σχεδίασης (Design Optimization).

Διαβάστε περισσότερα

Δρ. Α.Α.Δράκος,Αναπλ.Καθηγητής Χρηµατοδοτικής Διοίκησης Δρ. Β. Γ. Μπαµπαλός, ΠΔ ΣΗΜΕΙΩΣΕΙΣ ΔΙΔΑΣΚΟΝΤΩΝ ΣΤΗ ΧΡΗΜΑΤΟΔΟΤΙΚΗ ΔΙΟΙΚΗΣΗ 1

Δρ. Α.Α.Δράκος,Αναπλ.Καθηγητής Χρηµατοδοτικής Διοίκησης Δρ. Β. Γ. Μπαµπαλός, ΠΔ ΣΗΜΕΙΩΣΕΙΣ ΔΙΔΑΣΚΟΝΤΩΝ ΣΤΗ ΧΡΗΜΑΤΟΔΟΤΙΚΗ ΔΙΟΙΚΗΣΗ 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Δρ. Α.Α.Δράκος,Αναπλ.Καθηγητής Χρηµατοδοτικής Διοίκησης Δρ. Β. Γ. Μπαµπαλός, ΠΔ 407 2016-2017 ΣΗΜΕΙΩΣΕΙΣ ΔΙΔΑΣΚΟΝΤΩΝ ΣΤΗ ΧΡΗΜΑΤΟΔΟΤΙΚΗ

Διαβάστε περισσότερα

ΣΤΟΧΑΣΤΙΚΕΣ ΙΑ ΙΚΑΣΙΕΣ

ΣΤΟΧΑΣΤΙΚΕΣ ΙΑ ΙΚΑΣΙΕΣ ΣΤΟΧΑΣΤΙΚΕΣ ΙΑ ΙΚΑΣΙΕΣ Θεωρία Πιθανοτήτων και Στοχαστικές ιαδικασίες, Κ. Πετρόπουλος Τµ. Επιστήµης των Υλικών Στοχαστικές ιαδικασίες Ορισµός Μία στοχαστική διαδικασία είναι µία οικογένεια τυχαίων µεταβλητών

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 10. Μελέτη ηλεκτρικών δικτύων στην Ηµιτονική Μόνιµη Κατάσταση

ΚΕΦΑΛΑΙΟ 10. Μελέτη ηλεκτρικών δικτύων στην Ηµιτονική Μόνιµη Κατάσταση 26 ΚΕΦΑΛΑΙΟ 0 Μελέτη ηλεκτρικών δικτύων στην Ηµιτονική Μόνιµη Κατάσταση 0. ) Γενικά για την Ηµιτονική Μόνιµη Κατάσταση ( Η.Μ.Κ.) Η µελέτη ενός ηλεκτρικού δικτύου γίνεται πρώτιστα στο στο πεδίο του χρόνου.

Διαβάστε περισσότερα

Δοµές Δεδοµένων και Αλγόριθµοι - Εισαγωγή

Δοµές Δεδοµένων και Αλγόριθµοι - Εισαγωγή Δοµές Δεδοµένων και Αλγόριθµοι - Εισαγωγή Στην ενότητα αυτή θα µελετηθούν τα εξής επιµέρους θέµατα: Εισαγωγή στις έννοιες Αλγόριθµοι και Πολυπλοκότητα, Οργάνωση Δεδοµένων και Δοµές Δεδοµένων Χρήσιµοι µαθηµατικοί

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Σεπτεµβρίου 2005 5:00-8:00 Σχεδιάστε έναν αισθητήρα ercetro

Διαβάστε περισσότερα

Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ

Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ Τα τελευταία 25 χρόνια, τα προβλήµατα που σχετίζονται µε την διαχείριση της Γεωγραφικής Πληροφορίας αντιµετωπίζονται σε παγκόσµιο αλλά και εθνικό επίπεδο µε την βοήθεια των Γεωγραφικών

Διαβάστε περισσότερα