ΕΛΛΗΝΙΚΗ ΕΠΙΤΡΟΠΗ ΤΗΣ ΤΟΥ ΔΙΕΘΝΟΥΣ ΔΙΕΘΝΟΥΣ ΟΡΓΑΝΩΣΗΣ ΣΥΜΒΟΥΛΙΟΥ ΜΕΓΑΛΩΝ ΗΛΕΚΤΡΙΚΩΝ ΔΙΚΤΥΩΝ ΔΙΚΤΥΩΝ ΥΨΗΛΗΣ ΤΑΣΗΣ Πειραιώς 45, 105 53, Αθήνα, Τηλ., Fax: 210-3216851, e-mail: info@cigre.gr COMITE NATIONAL HELLENIQUE 45, rue Pireos, 105 53, Athenes, Tel.-Fax: +30210-3216851, e-mail: info@cigre.gr GREEK NATIONAL COMMITTEE GREEK NATIONAL COMMITTEE 45, Pireos Str., 105 53, Athens, Tel.-Fax: +30210-3216851, e-mail: info@cigre.gr ΤΑΞΙΝΟΜΗΣΗ ΚΥΜΑΤΟΜΟΡΦΩΝ ΡΕΥΜΑΤΟΣ ΔΙΑΡΡΟΗΣ ΜΟΝΩΤΗΡΩΝ Υ.Τ. ΜΕ ΧΡΗΣΗ ΓΕΝΕΤΙΚΩΝ ΑΛΓΟΡΙΘΜΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΩΝ ΕΠΙΛΟΓΗΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ Δ. Πυλαρινός Κ. Θεοφιλάτος Κ. Σιδεράκης Ε. Θαλασσινάκης 1 Δρ Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Υπολογιστών ΠΕΡΙΛΗΨΗ Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Σ.Τ.ΕΦ. / Τμήμα Ηλεκτρολογίας Α.Τ.Ε.Ι. Κρήτης Δνση Διαχείρισης Νησιών, ΔΕΔΔΗΕ Ένας αριθμός 387 κυματομορφών που απεικονίζουν εκκενώσεων και έχουν καταγραφεί σε 18 διαφορετικούς μονωτήρες στηρίξεως 150 kv σε δύο Υ/Σ στο Ηράκλειο Κρήτης σε πραγματικές συνθήκες, μελετώνται στην παρούσα εργασία. Ένα σύνολο 20 χαρακτηριστικών εξάγεται από κάθε κυματομορφή και εφαρμόζονται δύο αλγόριθμοι επιλογής χαρακτηριστικών (t-test και mrmr). Γενετικοί αλγόριθμοι χρησιμοποιούνται για την ταξινόμηση σε δυο κατηγορίες που σχετίζονται με τις απεικονιζόμενες εκκενώσεις. Η εφαρμογή γίνεται σε 5 ομάδες χαρακτηριστικών (σε όλα τα αρχικά 20 χαρακτηριστικά, σε 2 υποομάδες σε αντιστοιχία με το πεδίο που ανήκουν (χρόνου/συχνότητας) και σε 2 υποομάδες που προκύπτουν από την εφαρμογή των αλγόριθμων επιλογής χαρακτηριστικών). Τα αποτελέσματα συγκρίνονται και αντιπαρατίθενται με αυτά προηγούμενων υλοποιήσεων στην ίδια ομάδα δεδομένων. CLASSIFICATION OF LEAKAGE CURRENT WAVEFORMS USING GENETIC ALGORITHMS AND FEATURE SELECTION ALGORITHMS D. Pylarinos K.Theofilatos K. Siderakis E. Thalassinakis 2 Dr-Ing Electrical & Computer Engineer, Researcher/Consultant, dpylarinos@yahoo.com ABSTRACT Computer Engineering and Informatics Dpt, University of Patras, Greece theofilk@ceid.upatras.gr Electrical Engineering Dpt, TEI of Crete, Greece k.siderakis@gmail.com Islands Network Operation Dpt, Hellenic Electricity Distribution Network Operator S.A., Greece E.Thalassinakis@deddie.gr A number of 387 discharge portraying waveforms recorded on 18 different 150 kv post insulators installed at two different Substations in Crete, Greece are considered in this paper. Twenty different features are extracted from each waveform and two feature selection algorithms (t-test and mrmr) are employed. Genetic algorithms are used to classify waveforms in two different classes related with the portrayed discharges. Five different data sets are employed (1. the original 20-feature vector, 2. time domain features, 3. frequency domain features, 4. t-test selected features 5. mrmr selected features). Results are discussed and compared with previous classification implementations on this particular data group. 1 ΔΕΔΔΗΕ/ΔΔΝ, Τέρμα Καστοριάς, Κατσαμπάς, 71307, Ηράκλειο Κρήτης 2 DEDDIE, Terma Kastorias Str, Katsampas, 71307, Iraklion Crete, Greece
1. ΕΙΣΑΓΩΓΗ Η μέτρηση του ρεύματος διαρροής είναι από τις πλέον καθιερωμένες τεχνικές παρακολούθησης και διερεύνησης της συμπεριφοράς μονωτήρων υψηλής τάσης (Υ.Τ.) τόσο σε εργαστηριακές όσο και σε πραγματικές συνθήκες [1]. Σημαντικότερο της ίσως πλεονέκτημα είναι ότι επιτρέπει την μελέτη της ηλεκτρικής δραστηριότητας από τα πρώτα στάδια μέχρι την υπερπήδηση, χωρίς να επιδρά στην διαμόρφωση της επιφανειακής αγωγιμότητας, ενώ επιτρέπει την συγκριτική και ταυτόχρονη αξιολόγηση διαφορετικών δοκιμίων και μονωτήρων [1]. Χωρίς να παραγνωρίζεται ο ρόλος των εργαστηριακών δοκιμών [2-4], η παρακολούθηση και οι δοκιμές σε πραγματικές συνθήκες θεωρούνται ιδιαίτερα σημαντικές λόγω της σύνδεσης της συμπεριφοράς με τις τοπικές συνθήκες εφαρμογής καθώς και την αδυναμία πλήρους αναπαραγωγής των πραγματικών συνθηκών στο εργαστήριο. Έτσι μετρήσεις και δοκιμές λαμβάνουν χώρα σε ήδη εγκατεστημένους μονωτήρες αλλά και σε ειδικά σχεδιασμένους σταθμούς δοκιμών [1, 5]. Παρόλο όμως που είναι γενικά αποδεκτό ότι τα χαρακτηριστικά της κυματομορφής εμπεριέχουν σημαντική πληροφορία για την ηλεκτρική δραστηριότητα, η καταγραφή και μελέτη των κυματομορφών γνωρίζει μικρή εφαρμογή ειδικά σε πραγματικές συνθήκες. Η συνήθης πρακτική είναι να καταγράφονται και να εξετάζονται διάφορα εξαγόμενα μεγέθη (συνηθέστερα το φορτίο, το εύρος ή η μέγιστη τιμή και ο αριθμός κορυφών που υπερβαίνει προκαθορισμένα κατώφλια [1]) με τις κυματομορφές να καταγράφονται δειγματοληπτικά ή και καθόλου. Η έρευνα έχει δείξει όμως ότι το σχήμα της κυματομορφής είναι αυτό που συνδέεται με την δραστηριότητα [6-8] ενώ τα διάφορα εξαγόμενα μεγέθη, και ειδικά τα συνήθως χρησιμοποιούμενα, μπορεί να οδηγήσουν σε παραπλανητικά αποτελέσματα ειδικά σε πραγματικές συνθήκες, τόσο λόγω της παρουσίας του θορύβου όσο και λόγω της ποικιλομορφίας των καταγραφόμενων κυματομορφών [9-13]. Έτσι η έρευνα έχει στραφεί και προς την εφαρμογή τεχνικών επεξεργασίας σήματος και αναγνώρισης προτύπων με στόχο την αυτοματοποίηση της ταξινόμησης των κυματομορφών ρεύματος διαρροής. Η παρούσα εργασία έρχεται να συνεχίσει την προηγηθείσα έρευνα πάνω στην αυτόματη αναγνώριση και ταξινόμηση κυματομορφών ρεύματος διαρροής που έχουν καταγραφεί σε μονωτήρες Υ.Τ. σε πραγματικές συνθήκες λειτουργίας [9-13]. Με τα προβλήματα του θορύβου [11, 13] και της αναγνώρισης επιφανειακών εκκενώσεων [9] να έχουν αναλυθεί και αντιμετωπιστεί σε μεγάλο βαθμό, η έρευνα επικεντρώνεται στην περαιτέρω κατηγοριοποίηση των εκκενώσεων. Η παρακολούθηση και η διερεύνηση της συμπεριφοράς των μονωτήρων Υ.Τ. είναι ιδιαίτερα σημαντική ειδικά για την περίπτωση νησιών όπως η Κρήτη και η Ρόδος [14], καθώς το δίκτυο των νησιών αυτών υφίσταται έντονη επίδραση ρύπανσης λόγω των τοπικών συνθηκών [14-15]. Διάφορες τεχνικές αντιμετώπισης έχουν εφαρμοστεί [14-16], με την χρήση RTV SIR επικαλύψεων να είναι η κύρια σε επίπεδο υποσταθμών με σημαντικά οικονομικά οφέλη [17]. Τελευταίο βήμα προς αυτή την κατεύθυνση αποτελεί και η κατασκευή Υπαίθριου Σταθμού Δοκιμών Υψηλής Τάσης από την ΔΕΗ/ΔΕΔΔΗΕ στο Ηράκλειο Κρήτης [18-20], στην καλύτερη λειτουργία του οποίου προορίζονται να συμβάλλουν τα αποτελέσματα της παρούσας εργασίας. 2. ΜΕΤΡΗΤΙΚΟ ΣΥΣΤΗΜΑ, ΠΕΔΙΟ ΜΕΤΡΗΣΕΩΝ ΚΑΙ ΔΕΔΟΜΕΝΑ Οι κυματομορφές που εξετάζονται σε αυτήν την εργασία έχουν καταγραφεί σε 18 διαφορετικούς μονωτήρες στηρίξεως 150 kv (πορσελάνινους, επικαλυμμένους με RTV SIR και συνθετικούς) σε χρονική περίοδο που υπερβαίνει τα 6 χρόνια. Οι μονωτήρες ήταν σε κανονική λειτουργία (τοποθετημένοι στο δίκτυο) σε δύο Υ/Σ 150 kv [19]. Για την μέτρηση, ένας μεταλλικός δακτύλιος τοποθετήθηκε στην βάση κάθε μονωτήρα ώστε να οδηγήσει το ρεύμα διαρροής σε έναν αισθητήρα Hall. Τα δεδομένα καταγράφονται από μια συσκευή καταγραφής δεδομένων (DAQ), την OLCA της CTLab, από όπου στην συνέχεια μπορούν να μεταφερθούν σε Η/Υ για περαιτέρω επεξεργασία. Μια σχηματική αναπαράσταση του μετρητικού συστήματος και σχετικές φωτογραφίες απεικονίζονται στο σχήμα 1. Για την αποφυγή προβλήματος συσσώρευσης δεδομένων, χρησιμοποιείται από την συσκευή η τεχνική χρονικού παραθύρου. Καταγράφεται δηλαδή μόνο μία κυματομορφή κατά την διάρκεια ενός προκαθορισμένου χρονικού παραθύρου (π.χ. μίας ημέρας) και η κυματομορφή που επιλέγεται είναι αυτή με την μεγαλύτερη μέγιστη τιμή μέσα στο χρονικό παράθυρο [11, 13]. Συνολικά, 387 κυματομορφές που επιλέγουν εκκενώσεις έχουν επιλεγεί και εξετάζονται στην παρούσα εργασία. Για την απομόνωση των κυματομορφών ώστε αυτές να εμφανίζουν εκκενώσεις (και όχι ημιτονοειδείς ή θόρυβο), έχουν χρησιμοποιηθεί τεχνικές που περιγράφονται στα [9, 11, 13].
α Σχήμα 1: α. Το μετρητικό σύστημα β. Κάποιοι από τους παρακολουθούμενους μονωτήρες 3. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΚΑΙ ΚΑΤΗΓΟΡΙΕΣ Οι κυματομορφές έχουν προ-κατηγοριοποιηθεί σε δύο διαφορετικές κατηγορίες με βάση την διάρκεια των εκκενώσεων που καταγράφονται σε αυτές. Κυματομορφές που απεικονίζουν εκκενώσεις που διαρκούν μέχρι και τέσσερις συνεχόμενες ημιπεριόδους κατατάχθηκαν στην πρώτη κατηγορία ενώ η ύπαρξη εκκένωσης που διαρκεί πέντε ή περισσότερες συνεχόμενες ημιπεριόδους κατατάσσει την κυματομορφή στην δεύτερη κατηγορία. Από το σύνολο των 387 κυματομορφών, οι 170 ανήκουν στην πρώτη κατηγορία και οι 217 στην δεύτερη. Για την ταξινόμηση εξήχθησαν 20 διαφορετικά χαρακτηριστικά [9] από κάθε κυματομορφή, όπως φαίνεται στον Πίνακα 1. Τα χαρακτηριστικά έχουν επιλεχθεί με βάση την βιβλιογραφία [1] και εκπροσωπούν ισομερώς το πεδίο του χρόνου (χαρακτηριστικά {1-10}) και το πεδίο της συχνότητας (χαρακτηριστικά {11-20}). Όσον αφορά τα χαρακτηριστικά από το πεδίο του χρόνου, αυτά περιλαμβάνουν ευρέως χρησιμοποιούμενα μεγέθη όπως το εύρος και το φορτίο καθώς και τα κυριότερα περιγραφικά στατιστικά μέτρα θέσης και μεταβλητότητας. Για τα χαρακτηριστικά από το πεδίο της συχνότητας, έχει ληφθεί υπόψη η διασύνδεση του περιεχομένου των περιττών αρμονικών με την καταγραφή εκκενώσεων καθώς και οι λόγοι που συνήθως χρησιμοποιούνται [1]. Επίσης έχει χρησιμοποιηθεί ο λόγος παραμόρφωσης ή THD που περιγράφει τον λόγο του αθροίσματος των περιεχομένων όλων των αρμονικών πλην της θεμελιώδους προς το περιεχόμενο της θεμελιώδους και ο λόγος περιττής παραμόρφωσης HD που είναι παρόμοιος με τον λόγο παραμόρφωσης με την διαφορά ότι στον αριθμητή περιλαμβάνει μόνο τις περιττές αρμονικές. Ακόμα έχει χρησιμοποιηθεί wavelet ανάλυση και ειδικά η διάσπαση του σήματος (δηλαδή της κυματομορφής) σε διαδοχικά επίπεδα λεπτομερειών και προσεγγίσεων (εδώ σε 6) σύμφωνα με την wavelet multiresolution analysis (MRA), ώστε να υπολογιστεί το STD_MRA διάνυσμα [21-22]. Το STD_MRA διάνυσμα περιέχει την τυπική απόκλιση του διανύσματος των λεπτομερειών κάθε επιπέδου διάσπασης και χρησιμοποιείται ευρέως σε ποικιλία εφαρμογών σαν πρότυπο. Επίσης χρησιμοποιείται ο λόγος παραμόρφωσης D R που σε αντιστοιχία D ( D D D D ) D,όπου D ν η τυπική απόκλιση του διανύσματος των με τον THD είναι ο λόγος R 1 2 3 4 5 λεπτομερειών του ν-επιπέδου διάσπασης. Οι ζώνες συχνοτήτων των διάφορων επιπέδων της wavelet διάσπασης φαίνονται στον Πίνακα 2. 4. ΑΛΓΟΡΙΘΜΟΙ ΕΠΙΛΟΓΗΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ & ΧΡΗΣΙΜΟΠΟΙΟΥΜΕΝΑ ΣΥΝΟΛΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ Δύο διαφορετικοί αλγόριθμοι επιλογής χαρακτηριστικών εφαρμόστηκαν στα 387 διανύσματα των 20 χαρακτηριστικών που αντιστοιχούν στις 387 κυματομορφές: ο αλγόριθμος t-test [23-24] και ο αλγόριθμος mrmr [25]. Η βασική αρχή των δύο τεχνικών είναι ο υπολογισμός κάποιου βαθμού συνάφειας και η βάση αυτού απόρριψη χαρακτηριστικών. Ο αλγόριθμος t-test είναι από τους αρχαιότερους και απλούστερους αλγόριθμους επιλογής χαρακτηριστικών και όντας αλγόριθμος μιας μεταβλητής (univariate) προβαίνει σε κρίση για κάθε χαρακτηριστικό ξεχωριστά. Αντίθετα ο αλγόριθμος mrmr, που είναι και από τους πλέον σύγχρονους αλγόριθμους επιλογής, εξετάζει ομάδες χαρακτηριστικών και έχει ως στόχο την επιλογή του β
υποσυνόλου χαρακτηριστικών που παρουσιάζει την μέγιστη συνάφεια και τον ελάχιστο πλεονασμό, χωρίς αυτό να σημαίνει ότι το βέλτιστο υποσύνολο θα περιέχει και τα βέλτιστα χαρακτηριστικά όταν αυτά εξεταστούν μεμονωμένα. Ο αλγόριθμος t-test επέλεξε τα χαρακτηριστικά {1, 3~11, 13~17, 19~20} ενώ ο αλγόριθμος mrmr τα {3, 5, 7, 8, 11, 13, 15, 16, 18, 19}. Για την ταξινόμηση χρησιμοποιήθηκαν πέντε διαφορετικές ομάδες χαρακτηριστικών, όπως φαίνεται στον Πίνακα 3. Η πρώτη ομάδα περιλαμβάνει όλα τα χαρακτηριστικά, η δεύτερη μόνο τα χαρακτηριστικά από το πεδίο του χρόνου, η τρίτη μόνο τα χαρακτηριστικά από το πεδίο της συχνότητας ενώ οι άλλες δύο περιλαμβάνουν τα χαρακτηριστικά που επιλέγονται από τους 2 αλγόριθμους επιλογής. Πίνακας 1. Τα εξαγόμενα μεγέθη ΧΑΡΑΚΤΗΡΙΣΤΙΚΟ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟ 1 εύρος 11 λόγος περιεχομένου τρίτης προς πρώτης αρμονικής 2 μέση τιμή 12 λόγος περιεχομένου πέμπτης προς πρώτης αρμονικής 3 διάμεσος 13 λόγος περιεχομένου πέμπτης προς τρίτης αρμονικής 4 διασπορά 14 λόγος παραμόρφωσης (THD) 5 τυπική απόκλιση 15 λόγος περιττής παραμόρφωσης (HD) 6 μέση απόλυτη απόκλιση 16 λόγος στοιχείων STD_MRA: D1/D5 7 ασυμμετρία 17 λόγος στοιχείων STD_MRA: D2/D5 8 κύρτωση 18 λόγος στοιχείων STD_MRA: D3/D5 9 Ενδοτεταρτημοριακό εύρος 19 λόγος στοιχείων STD_MRA: D4/D5 10 φορτίο 20 λόγος παραμόρφωσης D R Πίνακας 2. Οι ζώνες συχνοτήτων για τα διαφορετικά επίπεδα wavelet διάσπασης (MRA) Επίπεδο διάσπασης Προσέγγιση (Hz) Λεπτομέρειες (D) (Hz) 1 0~500 500~1000 2 0~250 250~500 3 0~125 125~250 4 0~62.5 62.5~125 5 0~31.25 31.25~62.5 6 0~15.625 15.625~31.25 5. ΤΑΞΙΝΟΜΗΣΗ Στην παρούσα εργασία, χρησιμοποιήθηκαν γενετικοί αλγόριθμοι για την ταξινόμηση των διανυσμάτων των χαρακτηριστικών (και άρα των αντίστοιχων κυματομορφών) στις δυο κατηγορίες που προαναφέρθηκαν. Οι γενετικοί αλγόριθμοι είναι μια εδραιωμένη τεχνική ταξινόμησης που βασίζεται στην δημιουργία ενός αρχικού πληθυσμού υποψήφιων λύσεων, σχηματικά καλούμενων και χρωμοσώματα, και στην επαναληπτική διαφοροποίησή τους (αναπαραγωγή) χρησιμοποιώντας συντελεστές εξέλιξης, επιλογής, διασταύρωσης και μετάλλαξης, μέχρι να επιτευχθεί ένας προκαθορισμένος στόχος [26]. Οι γενετικοί αλγόριθμοι έχουν εφαρμοστεί σε πλήθος διαφορετικών εφαρμογών και έχουν αποδειχθεί ιδιαίτερα χρήσιμοι σε προβλήματα στα οποία δεν είναι διαθέσιμη μαθηματική περιγραφή, όπως είναι και το πρόβλημα που μελετάται στην παρούσα εργασία. Ένας σχετικά απλός αλγόριθμος [27] χρησιμοποιήθηκε για το παρόν πρόβλημα, για την περιγραφή των βασικών χαρακτηριστικών του οποίου βλέπε και το [28]. Ο στόχος του γενετικού αλγορίθμου που αναπτύχθηκε στην παρούσα εργασία είναι ο βέλτιστος καθορισμός των κέντρων των δύο κατηγοριών, τα οποία θα χρησιμοποιηθούν στην συνέχεια για την ταξινόμηση των κυματομορφών με κριτήριο την Ευκλείδεια απόσταση του διανύσματος χαρακτηριστικών από το κάθε κέντρο. Ο αρχικός πληθυσμός υποψήφιων λύσεων που χρησιμοποιήθηκε από τον προτεινόμενο γενετικό αλγόριθμο αποτελούταν από χρωμοσώματα (διανύσματα) 2*Ν γονιδίων (μεταβλητών προς βελτιστοποίηση) των οποίων οι τιμές κυμαίνονταν από 0 έως 1 (εφαρμόστηκε αρχικά κανονικοποίηση στις τιμές των χαρακτηριστικών). Ν είναι ο αριθμός των χαρακτηριστικών. Ο αρχικός πληθυσμός λύσεων αποτελούνταν από τυχαίες λύσεις αυτής της μορφής. Με διεξαγωγή πειραμάτων στο σύνολο εκπαίδευσης βρέθηκε πως το βέλτιστο μέγεθος του αρχικό πληθυσμού ήταν 100. Στη συνέχεια, στον προτεινόμενο γενετικό αλγόριθμο, εφαρμόζονται επαναληπτικά οι τελεστές της αξιολόγησης, της επιλογής, της διασταύρωσης και της μετάλλαξης. Για την αξιολόγηση των υποψήφιων λύσεων χρησιμοποιήθηκε η συνάρτηση καταλληλότητας της εξίσωσης: Καταλληλότητα= ΑκρίβειαΤαξινόμησης+ΓεωμετρικόςΜέσος Όπου ΓεωμετρικόςΜέσος είναι μία ποσότητα που ορίζεται ως Ευαισθησία*Ειδίκευση και
χρησιμοποιείται για να μετρήσει με μεγαλύτερη ακρίβεια την απόδοση ταξινόμησης του ταξινομητή σε μη ζυγισμένα σύνολα δεδομένων όπως αυτό που εξετάζεται στην παρούσα μελέτη. Σαν τελεστής επιλογής χρησιμοποιήθηκε ο τελεστής της εξαναγκασμένης ρουλέτας σε συνδυασμό με ένα σχήμα ελιτισμού που εξασφαλίζει ότι το καλύτερο άτομο σε κάθε γενιά θα αποτελεί μέλος και της επόμενης γενιάς. Οι τελεστές διαφοροποίησης των λύσεων που χρησιμοποιήθηκαν ήταν η διασταύρωση δύο σημείων και ο τελεστής της Γκαουσιανής μετάλλαξης. Ο τελεστής διασταύρωσης δύο σημείων εφαρμόστηκε με πιθανότητα 90% ενώ ο τελεστής της Γκαουσιανής μετάλλαξης με πιθανότητα 10%. Ο τελεστής της Γκαουσιανής μετάλλαξης απλά προσθέτει σε ένα επιλεγμένο για μετάλλαξη γονίδιο μία τυχαία τιμή από την Γκαουσιανή κατανομή με κέντρο το μηδέν και διασπορά 0.1. Ο προτεινόμενος αλγόριθμος τερματίζει όταν εκτελεστούν 1000 επαναλήψεις ή όταν ικανοποιηθεί το κριτήριο σύγκλισης. Το κριτήριο σύγκλησης ικανοποιείται αν η απόδοση του καλύτερου ατόμου του πληθυσμού απέχει λιγότερο από 5% από την μέση απόδοση του πληθυσμού. Σε αυτές τις περιπτώσεις θεωρούμε ότι ο αλγόριθμος έχει συγκλίνει σε μία λύση και ότι αν συνεχιστεί η εξελικτική διαδικασία δεν θα βρεθούν καινούργιες καλύτερες λύσεις. 6. ΑΠΟΤΕΛΕΣΜΑΤΑ ΚΑΙ ΣΥΖΗΤΗΣΗ Τα αποτελέσματα φαίνονται στον Πίνακα 3 για τις 5 ομάδες χαρακτηριστικών. Τα ποσοστά επιτυχίας είναι γενικά αρκετά χαμηλά, κυμαινόμενα από 54.97% έως 68.41%. Χαμηλότερη επίδοση παρουσιάζει η ομάδα χαρακτηριστικών από το πεδίο του χρόνου (54.97%), ενώ το ποσοστό αυτό βελτιώνεται ελαφρώς όταν χρησιμοποιηθούν όλα τα χαρακτηριστικά (56.12%). Η χρήση μόνο των χαρακτηριστικών από το πεδίο της συχνότητας προκαλεί περαιτέρω αύξηση (56.82%), ενώ οι ομάδες χαρακτηριστικών που έχουν καθοριστεί με χρήση των αλγορίθμων επιλογής βελτιώνουν και άλλο τα αποτελέσματα με πιο αξιοσημείωτη την βελτίωση που επιτυγχάνεται με τον t-test (68.41%). Η καλύτερη επίδοση του σχετικά απλού αλγόριθμου t-test συγκριτικά με τον πιο πρόσφατο και πιο περίπλοκο mrmr εξηγείται σε συνδυασμό με το γεγονός ότι ο αλγόριθμος ταξινόμησης που χρησιμοποιείται είναι γραμμικός και έτσι παρουσιάζει καλύτερα αποτελέσματα όταν η ομάδα χαρακτηριστικών που του παρέχεται έχει καθοριστεί με το κάθε χαρακτηριστικό να εξετάζεται ξεχωριστά. Εδώ πρέπει να σημειωθεί ότι προηγηθείσα ταξινόμηση με χρήση γενετικών αλγορίθμων έχει δώσει εντυπωσιακά καλύτερα αποτελέσματα (88.48%) [12], με την διαφορά όμως ότι στην συγκεκριμένη υλοποίηση οι γενετικοί αλγόριθμοι χρησιμοποιήθηκαν και για την επιλογή των χαρακτηριστικών (επιλέχθηκαν δε τα χαρακτηριστικά {2, 3, 5, 6, 7, 9, 11, 12, 15, 18, 19}). Πρέπει να σημειωθεί όμως ότι η καλύτερη επίδοση έχει καταγραφεί με συνδυασμό των χαρακτηριστικών που επιλέγει ο mrmr αλγόριθμος και ταξινόμησης με χρήση Μηχανών Διανυσμάτων Στήριξης (90.21%) [9]. Ένα σημαντικό ζήτημα που πρέπει να σημειωθεί είναι ότι τόσο οι γενετικοί αλγόριθμοι όσο και οι Μηχανές Διανυσμάτων Στήριξης είναι τεχνικές που λειτουργούν σαν «μαύρα κουτιά» χωρίς να προσφέρουν ερμηνεύσιμες πληροφορίες για την διαδικασία ταξινόμησης. Έτσι σαν επόμενο βήμα επιλέχθηκε η υλοποίηση ενός υβριδικού συστήματος που θα συνδυάζει Μηχανές Διανυσμάτων Στήριξης (για την ταξινόμηση), με γενετικούς αλγόριθμους (για την επιλογή των χαρακτηριστικών) και ασαφή λογική ώστε αφενός να πετύχει μεγαλύτερα ποσοστά επιτυχίας και αφετέρου να προσφέρει, με την μορφή κανόνων ασαφούς λογικής, περιγραφή και κατανόηση της διαδικασίας ταξινόμησης [29]. Πίνακας 3: Ποσοστά επιτυχίας για τις διαφορετικές ομάδες χαρακτηριστικών (ΓΑ) ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ {1~10} {11~20} {1~20} t-test {1, 3~11, 13~17, 19~20} mrmr {3, 5, 7, 8, 11, 13, 15, 16, 18, 19} Ποσοστό επιτυχίας 54.97% 56.82% 56.12% 68.41 60.20 7. ΣΥΜΠΕΡΑΣΜΑΤΑ Η μέτρηση του ρεύματος διαρροής είναι μια ευρέως διαδεδομένη τεχνική για την διερεύνηση, παρακολούθηση και αξιολόγηση των μονωτήρων Υ.Τ. τόσο σε εργαστηριακές όσο και σε πραγματικές συνθήκες λειτουργίας. Παρόλο που το σχήμα της κυματομορφής του ρεύματος διαρροής έχει συνδεθεί με
την υφιστάμενη ηλεκτρική δραστηριότητα, η καταγραφή αυτών καθαυτών των κυματομορφών γνωρίζει μικρή εφαρμογή, ιδιαίτερα σε πραγματικές συνθήκες, η οποία πρέπει να αποδοθεί στις τεχνικές δυσκολίες που σχετίζονται με την καταγραφή, τον χειρισμό και την ερμηνεία των δεδομένων. Πρόσφατες έρευνες έδειξαν ότι η συνήθης προσέγγιση εξαγωγής ορισμένων μεγεθών από την κυματομορφή και καταγραφής αυτών αντί της κυματομορφής, μπορεί να αποδώσει παραπλανητικά αποτελέσματα ιδιαίτερα σε πραγματικές συνθήκες. Έτσι η έρευνα στράφηκε και προς την εφαρμογή τεχνικών αναγνώρισης προτύπων για την αυτόματη ταξινόμηση των κυματομορφών σε διαφορετικές κατηγορίες που σχετίζονται με το σχήμα τους και άρα, εμμέσως, και με την υφιστάμενη δραστηριότητα. Η παρούσα εργασία παρουσιάζει μια τέτοια εφαρμογή για την ταξινόμηση κυματομορφών που απεικονίζουν εκκενώσεις σε δύο διαφορετικές κατηγορίες, που σχετίζονται με την διάρκεια των καταγραφόμενων εκκενώσεων. Η ταξινόμηση γίνεται με χρήση γενετικών αλγορίθμων σε 5 διαφορετικά σύνολα χαρακτηριστικών για τον καθορισμό των οποίων έχει ληφθεί υπόψη η φύση του προβλήματος και η σχετική βιβλιογραφία ενώ εφαρμόζονται επιπροσθέτως και δύο ευρέως χρησιμοποιούμενοι αλγόριθμοι επιλογής χαρακτηριστικών. Τα αποτελέσματα αντιπαρατίθενται με προηγούμενες υλοποιήσεις που έχουν εφαρμοστεί στην ίδια ομάδα δεδομένων. Τα αποτελέσματα δείχνουν την διασύνδεση της επιλογής των χαρακτηριστικών, και συνεπώς της χρήσης του κατάλληλου αλγόριθμου επιλογής, με την επιτυχία του εκάστοτε αλγόριθμου ταξινόμησης. Επίσης φαίνεται ότι η χρήση των συγκεκριμένων αλγόριθμων επιλογής (t-test, mrmr) οδηγεί τους γενετικούς αλγορίθμους σε χαμηλότερα ποσοστά επιτυχίας, σε σύγκριση με τα αντίστοιχα που καταγράφονται όταν γενετικοί αλγόριθμοι χρησιμοποιούνται και για την επιλογή και για την ταξινόμηση. Υπογραμμίζεται επίσης το πρόσθετο πρόβλημα της αδυναμίας κατανόησης της διαδικασίας ταξινόμησης όταν χρησιμοποιούνται τεχνικές «μαύρου κουτιού» όπως οι γενετικοί αλγόριθμοι και προτείνεται η εφαρμογή υβριδικού συστήματος που θα περιλαμβάνει και ασαφή λογική, ώστε αφενός να επιτευχθεί καλύτερη ακρίβεια στην ταξινόμηση και αφετέρου να δοθεί μια περιγραφή της διαδικασίας ταξινόμησης. ΒΙΒΛΙΟΓΡΑΦΙΑ [1] D. Pylarinos, K. Siderakis, E. Pyrgioti Measuring and analyzing leakage current for outdoor insulators and specimens, Reviews on Advanced Materials Science, Vol. 29, No. 1, pp. 31-53, 2011 [2] IEC 60507, Artificial pollution tests on high-voltage insulators to be used on a.c. systems, 1991 [3] IEC 60587, Electrical insulating materials used under severe ambient conditions-test methods for evaluating resistance to tracking and erosion, 2007) [4] IEC 62217, Polymeric insulators for indoor and outdoor use with a nominal voltage > 1000 V General definitions, test methods and acceptance criteria, 2005 [5] CIGRE WG B2.03, Guide for the establishment of naturally polluted insulator testing stations, CIGRE, 2007 [6] M. A. R. M. Fernando, S. M. Gubanski, Leakage current patterns on contaminated polymeric surfaces, IEEE Transactions on Dielectrics and Electrical Insulation, Vol. 6, No. 5, pp. 688 694, 1999 [7] T. Suda, Frequency characteristics of leakage current waveforms of an artificially polluted suspension insulator, IEEE Transactions on Dielectrics and Electrical Insulation, Vol. 8, pp. 705 709, 2001. [8] J. Li, W. Sima, C. Sun, S. A. Sebo, Use of Leakage Current of Insulators to Determine the Stage Characteristics of the Flashover Process and contamination Level Predicition, IEEE Transactions on Dielectrics and Electrical Insulation, Vol. 17, No. 2, 2010 [9] D. Pylarinos, K. Theofilatos, K. Siderakis, E. Thalassinakis, I. Vitellas, A. T. Alexandridis, E. Pyrgioti, Investigation and Classification of Field Leakage Current Waveforms, IEEE Transactions on Dielectrics and Electrical Insulation, Vol. 19, No. 6, pp. 2111-2118, 2012 [10] D. Pylarinos, K. Siderakis, E. Thalassinakis, E. Pyrgioti, I. Vitellas, Investigation of leakage current waveforms recorded in a coastal high voltage substation, Engineering, Technology & Applied Science Research, Vol. 1, No. 3, pp. 63-69, 2011 [11] D. Pylarinos, K. Siderakis, E. Pyrgioti, E. Thalassinakis, I. Vitellas, Impact of noise related waveforms on long term field leakage current measurements, IEEE Transactions on Dielectrics and Electrical Insulation, Vol. 18, No. 1, pp. 122-129, 2011 [12] D. Pylarinos, K. Theofilatos, K. Siderakis, E. Pyrgioti, T. Papazoglou, I. Vitellas, E. Thalassinakis, "Feature Selection and Classification of Field Leakage Current Waveforms using Genetic Algorithms", CIGRE Symposium 2013 Lisbon, Portugal, April 22-24, 2013 [13] D. Pylarinos, K. Siderakis, E. Thalassinakis, E. Pyrgioti, I. Vitellas, S. L. David, Online applicable techniques to evaluate field leakage current waveforms, Electric Power Systems Research, Vol. 84, No. 1, pp. 65-71, 2012
[14] K. Siderakis, D. Pylarinos, E. Thalassinakis, E. Pyrgioti, I. Vitellas, Pollution maintenance techniques in coastal high voltage installations, Engineering, Technology & Applied Science Research, Vol. 1, No. 1, pp. 1-7, 2011 [15] S. Gubanski, Greek Power Company Evaluates Alternatives to Combat Pollution in Transmission System on Crete, Insulator News & Market Report (INMR), Issue 58, Volume 10, Number 4, p. 30, 2002 [16] Greek Utility Battles Pollution Affecting Island Transmission System, Insulator News & Market Report (INMR), Issue 78, Volume 15, Number 4, p. 24, 2007 [17] E. Thalassinakis, Greek Utility Assesses Economics of RTV Silicone Coatings as Measure to Combat Pollution, Insulator News & Market Report (INMR), Issue 64, Volume 12, Number 2, p. 66, 2003 [18] Greek Utility Readies to Energize New Insulator Test Station, Insulator News & Market Report (INMR), Issue 82, Volume 16, Number 4, p. 32, 2008 [19] D. Pylarinos, K. Siderakis, E. Thalassinakis, I. Vitellas, E. Pyrgioti, Recording and managing field leakage current waveforms in Crete. Installation, measurement, software development and signal processing, ISAP 16th International Conference on Intelligent System Applications to Power Systems, Hersonissos, Crete, Greece, September 25-28, 2011 [20] TALOS High Voltage Test Station, www.talos-ts.com [21] S. G. Mallat, A Wavelet Tour Of Signal Processing, Academic Press, 1999. [22] S. G. Mallat, A Theory for Multiresolution Signal Decomposition: The Wavelet Representation, IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 11, pp. 674-693, 1989 [23] R. A. Johnson, G. K. Bhattacharyya, Statistics: Principles and Methods, John Wiley & Sons Inc, 6th Edition, 2010 [24] S. Welleck, Testing Statistical Hypothesis of Equivalence, Chapman & Hall, CRC, 2003 [25] H. Peng, F. Long, C. Ding, Feature selection based on mutual information: criteria of maxdependency, max-relevance, and min-redundancy, IEEE Trans. Pattern Anal. Mach. Intell., Vol. 27, No. 8, pp. 1226-1238, 2005. [26] J. Holland, Adaptation in natural and artificial systems : an introductory analysis with applications to biology, control, and artificial intelligence, Cambridge: Mass ;MIT Press, 1995. [27] Z. Michalewicz, Genetic Algorithms + Data Structures = Evolution Programs, Springer-Verlag, 3rd edition, 1996. [28] D. Pylarinos, K. Theofilatos, K. Siderakis, E. Thalassinakis, Discharges Classification using Genetic Algorithms and Feature Selection Algorithms on Time and Frequency Domain Data Extracted from Leakage Current Measurements, Engineering, Technology & Applied Science Research, Vol. 3, No. 6, 2013 (scheduled for publication) [29] K. Theofilatos, D. Pylarinos, S. Likothanassis, D. Melidis, K. Siderakis, E. Thalassinakis, S. Mavroudi, A Hybrid Support Vector Fuzzy Inference System for the Classification of Leakage Current Waveforms Portraying Discharges, Electric Power Components and Systems (accepted for publication)