Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 1

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 1"

Transcript

1

2

3 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 1 Εσταριζηίες Αξρηθά, ζα ήζεια λα επραξηζηήζσ φζνπο κε βνήζεζαλ ν θαζέλαο κε ην δηθφ ηνπ ηξφπν- θαηά ηε δηάξθεηα εθπφλεζεο ηεο δηπισκαηηθήο κνπ εξγαζίαο: - Σνλ θαζεγεηή κνπ, θχξην Αλδξέα πκεσλίδε γηα ηελ πξνζπκία ηνπ λα ιχζεη ηηο απνξίεο κνπ, ηελ θαζνδήγεζε θαη ηελ εξεκία ηνπ. - Σελ νηθνγέλεηα κνπ πνπ είλαη πάληα εθεί γηα κέλα. - Σνπο θίινπο κνπ γηα ηελ ππνκνλή ηνπο θαη γηαηί κνπ ζπκίδνπλ ηηο πην θαίξηεο ζηηγκέο φηη ππάξρεη θαη ην δάζνο εθηφο απφ ην δέλδξν.

4 2 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ

5 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 3 Περίληυη ηελ παξνχζα δηπισκαηηθή εξγαζία έγηλε κηα πξνζπάζεηα νκαδνπνίεζεο ησλ ειεθηξηθψλ θαηαλαισηψλ σο πξνο ηελ εηήζηα ειεθηξηθή ηνπο θαηαλάισζε. Η δηαθνξνπνίεζε ηεο ζε ζρέζε κε άιιεο κειέηεο πνπ ζηεξίδνληαη ζε δεδνκέλα ηεο εκεξήζηαο θακπχιεο θνξηίνπ, είλαη φηη ρξεζηκνπνηήζεθαλ δεδνκέλα ελεξγεηαθήο θχζεο πνπ ζρεηίδνληαη κε θαηαζθεπαζηηθά ραξαθηεξηζηηθά θαηνηθηψλ, κε ζπλήζεηεο-πξφηππα ειεθηξηθήο θαηαλάισζεο θαζψο θαη δεκνγξαθηθά ζηνηρεία ησλ θαηνίθσλ ηνπο. Με ηε ρξήζε αιγφξηζκσλ θαηεγνξηνπνίεζεο, αλαγλσξίζηεθαλ 2 δηαζηήκαηα θαηαλαιψζεσλ πνπ έδσζαλ ηα κνληέια κε ηα θαιχηεξα απνηειέζκαηα γηα αξηζκφ θιάζεσλ ίζν κε 3, γηα θαηαλαιψζεηο έσο kwh θαη θαηαλαιψζεηο έσο kwh. Οη αληίζηνηρνη θαλφλεο θαηεγνξηνπνίεζεο πνπ πξνέθπςαλ έρνπλ λφεκα θαη απνθαιχπηνπλ ελδηαθέξνληα πξφηππα γηα ηνπο θαηαλαισηέο. Γηα πςειέο ελεξγεηαθέο απαηηήζεηο άλσ ησλ πξνεγνχκελσλ νξίσλ, έγηλε δηεξεχλεζε ησλ δεδνκέλσλ ρξεζηκνπνηψληαο ηερληθέο νκαδνπνίεζεο. Γηα θαηαλαιψζεηο άλσ ησλ kwh πξνέθπςαλ 3 νκάδεο, ελψ γηα θαηαλαιψζεηο άλσ ησλ kwh αλαγλσξίζηεθαλ 2. Η εμαγφκελε γλψζε κπνξεί λα πξνζθέξεη ζηνπο πξνκεζεπηέο ειεθηξηθήο ελέξγεηαο πιεξνθνξίεο γηα ηνλ ηξφπν κε ηνλ νπνίν θαηαλαιψλεηαη ε ειεθηξηθή ελέξγεηα αλάινγα κε ηα ραξαθηεξηζηηθά θάζε νκάδαο θαηαλαισηψλ. Σν γεγνλφο απηφ κπνξεί λα νδεγήζεη ηηο εηαηξίεο ζε δηαθνξεηηθέο ρξεψζεηο ησλ θαηαλαισηψλ, ζηελ παξνρή εμαηνκηθεπκέλσλ ππεξεζηψλ κε ζθνπφ ηελ αχμεζε ηεο ηθαλνπνίεζεο ησλ πειαηψλ ηνπο θαη ζηελ πξνζέιθπζε λέσλ πειαηψλ νη νπνίνη αλαγλσξίζηεθε φηη ζα απμήζνπλ ηα θέξδε ηεο επηρείξεζεο. Σα δεδνκέλα πνπ ρξεζηκνπνηήζεθαλ πξνέξρνληαη απφ ηελ Residential Energy Consumption Survey (RECS) πνπ δηεμήρζε ην 2005 ζηηο Η.Π.Α. Ισάλλα Κακππιαπθά Ινχιηνο 2011 ΣΗΜΜΤ-ΑΠΘ Δπγαζηήπιο ΔΠΤ

6 4 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Abstract Classification of Low-Voltage Electricity Customers Through Data Mining The objective of this thesis is to classify low-voltage electricity customers upon their annual energy consumption. Data used are from the Residential Energy Consumption Survey (RECS) 2005 of U.S. and include housing unit construction characteristics, consumption patterns-practices and demographics concerning the residents. The nature of these data is, in fact, the key difference from other studies, which usually employ data derived from consumer daily load curves. Using classification algorithms, two energy consumption ranges are identified to give models with the best results; consumption up to kwh and consumption up to kwh. The resulting classification rules are rational and reveal interesting patterns for customers. Concerning consumptions higher than the consumption limits mentioned above, focused data mining was conducted using clustering techniques. For consumptions higher than kwh, 3 clusters were found whereas for consumption higher than kwh, 2 clusters. The extracted knowledge will help energy suppliers to understand in which way energy is consumed with respect to the different customer class characteristics. This could lead energy suppliers to apply different tariffs, provide personalized services in order to increase Customer Satisfaction (CS) and target new customers which are identified to yield more profits. Ioanna Kampylafka July 2011 Electrical and Computer Engineering Dept.-AUTH Information Processing Laboratory

7 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 5 Περιετόμενα ΔΤΥΑΡΙΣΙΔ... 1 ΠΔΡΙΛΗΦΗ... 3 ABSTRACT... 4 ΠΔΡΙΔΥΟΜΔΝΑ... 5 ΛΙΣΑ ΥΗΜΑΣΧΝ... 7 ΛΙΣΑ ΠΙΝΑΚΧΝ... 9 ΛΙΣΑ ΓΙΑΓΡΑΜΜΑΣΧΝ ΚΔΦΑΛΑΙΟ 1. ΔΙΑΓΧΓΗ Αντικείμενο τησ Διπλωματικήσ Σκοπόσ τησ Διπλωματικήσ Επιςκόπηςη Κεφαλαίων ΚΔΦΑΛΑΙΟ 2. ΈΝΝΟΙΔ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΔΠΙΚΟΠΗΗ Ανακάλυψη γνϊςησ ςε βάςεισ δεδομζνων Οριςμόσ Στάδια KDD διαδικαςίασ Εξόρυξη δεδομζνων Κατηγοριοποίηςη Ομαδοποίηςη ΕΔ για τη ςφςταςη προφίλ ηλεκτρικϊν καταναλωτϊν ΚΔΦΑΛΑΙΟ 3. ΑΝΑΛΤΗ ΓΔΓΟΜΔΝΧΝ ΚΑΙ ΤΠΟΘΔΔΙ Residential Energy Consumption Survey (RECS) Οργάνωςη Δεδομζνων Prior Knowledge Υποθζςεισ ωσ προσ τισ κλάςεισ Ύπαρξη και ςυχνότητα χρήςησ ενεργοβόρων ςυςκευών Αριθμόσ και ηλικία μελών νοικοκυριοφ Κλιματολογικοί παράγοντεσ Τοπικά διαθζςιμεσ πηγζσ ενζργειασ... 51

8 6 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ ΚΔΦΑΛΑΙΟ 4. ΔΞΑΓΧΓΗ ΜΟΝΣΔΛΧΝ ΚΑΣΗΓΟΡΙΟΠΟΙΗΗ ΚΑΣΑΝΑΛΧΣΧΝ Μεθοδολογία Classification Κατανάλωςη ζωσ kwh (4334 instances) Κατανάλωςη ζωσ kwh (4382 instances) Κατανάλωςη ζωσ kwh (3991 instances) Κατανάλωςη από ζωσ kwh (391 instances) Κατανάλωςη ζωσ kwh (4281 instances) Κατανάλωςη από ζωσ kwh (101 instances) Knowledge Representation Μοντζλο για κατανάλωςη εωσ kwh Μοντζλο για κατανάλωςη ζωσ kwh Χρήςη ensemble μεθόδων ΚΔΦΑΛΑΙΟ 5. ΣΟΥΔΤΜΔΝΗ ΔΞΟΡΤΞΗ ΓΔΓΟΜΔΝΧΝ (FOCUSED DATA MINING) Ομαδοποίηςη Κατανάλωςη από ζωσ kwh Κατανάλωςη από ζωσ kwh ΚΔΦΑΛΑΙΟ 6. ΤΜΠΔΡΑΜΑΣΑ ΚΑΙ ΜΔΛΛΟΝΣΙΚΗ ΔΡΓΑΙΑ Συμπεράςματα Μελλοντική εργαςία ΠΑΡΑΡΣΗΜΑ Ι ΓΔΓΟΜΔΝΑ ΠΡΟΒΛΗΜΑΣΟ ΠΑΡΑΡΣΗΜΑ ΙΙ ΣΟ ΛΟΓΙΜΙΚΟ WEKA ΒΙΒΛΙΟΓΡΑΦΙΑ

9 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 7 Λίζηα Στημάηφν Δηθφλα Γξαθηθή αλαπαξάζηαζε ηεο KDD δηαδηθαζίαο [SYM04] Δηθφλα Γεκηνπξγία κνληέινπ θαηεγνξηνπνίεζεο [TAN05] Δηθφλα Η γξαθηθή αλαπαξάζηαζε ελφο δέλδξνπ απνθάζεσλ [HAN06] Δηθφλα 2.4 Παξάδεηγκα γηα νξηζκφ ππθλφηεηαο θαη DBSCAN [SYM04] Δηθφλα 2.5 Γνκή Self-Organizing Map Δηθφλα 2.6 Παξάδεηγκα νκαδνπνίεζεο θαηαλαισηψλ [ΚΙΣ02] Δηθφλα Καηαλνκή αξηζκνχ θαηνηθηψλ σο πξνο ηελ εηήζηα θαηαλάισζε Δηθφλα 3.2 Πεξηνρέο δηεμαγσγήο RECS Δηθφλα 3.3 Πνηνηηθφο ράξηεο ζεξκνθξαζηψλ πγξαζίαο ζηηο Η.Π.Α Δηθφλα 3.4 Υάξηεο δηθηχνπ αγσγψλ θπζηθνχ αεξίνπ ζηηο Η.Π.Α Δηθφλα 4.1 Γέλδξν απνθάζεσλ γηα θαηαλάισζε έσο kwh Δηθφλα Γέλδξν απνθάζεσλ γηα θαηαλάισζε έσο kwh Δηθφλα 5.1 ΔΜ 7clusters γηα θαηαλάισζε απφ έσο kwh Δηθφλα ΔΜ kwh ζπλαξηήζεη ησλ clusters γηα θαηαλάισζε απφ έσο kwh (5 clusters) Δηθφλα Σηκέο γλσξηζκάησλ αλά νκάδα γηα γηα θαηαλάισζε απφ έσο kwh (5 clusters) Δηθφλα Σηκέο γλσξηζκάησλ αλά νκάδα γηα γηα θαηαλάισζε απφ έσο kwh (5 clusters) Δηθφλα 5.5 ΔΜ- kwh ζπλαξηήζεη ησλ clusters γηα θαηαλάισζε απφ έσο kwh (3 clusters) Δηθφλα Σηκέο γλσξηζκάησλ αλά νκάδα γηα γηα θαηαλάισζε απφ έσο kwh (3 clusters) Δηθφλα Σηκέο γλσξηζκάησλ αλά νκάδα γηα γηα θαηαλάισζε απφ έσο kwh (3 clusters) Δηθφλα 6.1 Ακθίδξνκε ξνή πιεξνθνξίαο κεηαμχ παξφρνπ ειεθηξηθήο ελέξγεηαο θαη θαηαλαισηψλ... 88

10 8 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ

11 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 9 Λίζηα Πινάκφν Πίλαθαο Υαξαθηεξηζηηθά νηθηαθψλ ειεθηξηθψλ ζπζθεπψλ Πίλαθαο Μέγεζνο θαη κέζε εηήζηα θαηαλάισζε ησλ λνηθνθπξηψλ ζηε Γεξκαλία. 48 Πίλαθαο Μέγεζνο θαη κέζε ηηκή εηήζηαο θαηαλάισζεο ησλ λνηθνθπξηψλ (RECS) 49 Πίλαθαο Απνηειέζκαηα γηα 110attr_35000.arff Πίλαθαο Απνηειέζκαηα γηα 110attr_72125.arff Πίλαθαο Απνηειέζκαηα γηα 110attr_72125_mtc_vd.arff Πίλαθαο Απνηειέζκαηα γηα 110attr_72125_BTUEL.arff Πίλαθαο Απνηειέζκαηα γηα θαηαλαιψζεηο έσο kwh - 3 bins Πίλαθαο Απνηειέζκαηα γηα θαηαλαιψζεηο απφ έσο kwh Πίλαθαο Απνηειέζκαηα γηα θαηαλαιψζεηο εσο kwh - SimpleCart Πίλαθαο Απνηειέζκαηα γηα θαηαλαιψζεηο απφ εσο kwh Simple Cart Πίλαθαο Απνηειέζκαηα ensemble methods γηα 112attr_21999_3bins _SMOTE.arff Πίλαθαο Απνηειέζκαηα ensemble methods γηα 112attr_29999_3bins _SMOTE.arff... 77

12 10 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ

13 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 11 Λίζηα Διαγραμμάηφν Γηάγξακκα 4.1 TPR αλά θιάζε γηα θαηαλαιψζεηο έσο kwh SimpleCart, 3bins Γηάγξακκα TPR αλά θιάζε γηα θαηαλαιψζεηο έσο kwh SimpleCart, 3bins Γηάγξακκα TPR αλά θιάζε γηα θαηαλαιψζεηο έσο kwh SimpleCart, 4bins Γηάγξακκα 4.4 TPR αλά θιάζε γηα ην 112attr_21999_3bins_SMOTE.arff κε ρξήζε ensemble methods Γηάγξακκα TPR αλά θιάζε γηα ην 112attr_29999_3bins_SMOTE.arff κε ρξήζε ensemble methods... 78

14 12 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ

15 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 13 Κεθάλαιο 1. Διζαγωγή 1.1. Ανηικείμενο ηηρ Διπλωμαηικήρ Σα ηειεπηαία ρξφληα ε ρξήζε ηερληθψλ εμφξπμεο δεδνκέλσλ (Data Mining DM) έρεη γίλεη αλαπφζπαζην θνκκάηη ηεο δηαδηθαζίαο Customer Relationship Management (CRM) κηαο επηρείξεζεο θαζψο ζπκβάιεη ζηελ αλαθάιπςε γλψζεο κέζα απφ ηελ αλάιπζε δεδνκέλσλ ησλ πειαηψλ. Βάζεη απηήο ηεο πιεξνθνξίαο, ε επηρείξεζε κπνξεί λα αλαγλσξίζεη ηηο νκάδεο εθείλεο ησλ πειαηψλ κε ζπγθεθξηκέλα ραξαθηεξηζηηθά- πνπ ζα ηεο απνθέξνπλ θέξδε, θαη λα ραξάμεη ζηξαηεγηθέο marketing ηφζν γηα ηελ πξνζέιθπζε λέσλ πειαηψλ φζν θαη γηα ηε βειηίσζε ησλ πξνζθεξφκελσλ πξντφλησλ/ππεξεζηψλ κε ζηφρν ηελ αχμεζε ηεο ηθαλνπνίεζεο ησλ πειαηψλ (Customer Satisfaction CS). Με ηελ απειεπζέξσζε ηεο αγνξάο ειεθηξηθήο ελέξγεηαο, ν αληαγσληζκφο ψζεζε θαη ηνπο παξφρνπο ειεθηξηθήο ελέξγεηαο ζηελ εθαξκνγή ηεο δηαδηθαζίαο CRM γηα ηνπο ειεθηξηθνχο θαηαλαισηέο κε ζθνπφ ηελ αχμεζε ησλ θεξδψλ ηνπο. Ωζηφζν, ε ηδηαηηεξφηεηα ηνπ πξντφληνο, δειαδή ηνπ ειεθηξηθνχ ξεχκαηνο, λα παξέρεηαη αλάινγα κε ηε δήηεζε αλεμαξηήησο ηεο ζπκθσλεκέλεο ηζρχνο ηνπ πειάηε, νδεγεί ζε πξνβιήκαηα ζηε ιεηηνπξγία θαη ηε ζηαζεξφηεηα ηνπ δηθηχνπ. Σν γεγνλφο απηφ εληζρχεη ηελ αλάγθε ηεο θαηαλφεζεο ησλ ραξαθηεξηζηηθψλ θαη ηεο ζπκπεξηθνξάο ησλ θαηαλαισηψλ κε ζηφρν ηνλ απνηειεζκαηηθφηεξν έιεγρν ηνπο. Δλδεηθηηθά αλαθέξεηαη φηη έλαο

16 14 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ πάξνρνο κε γλψζε ηεο εκεξήζηαο θακπχιεο θνξηίνπ θαζψο θαη ησλ ειεθηξηθψλ ζπζθεπψλ πνπ δηαζέηνπλ νη πειάηεο ηνπ, ζα κπνξνχζε λα δψζεη νηθνλνκηθά θίλεηξα ζε θαηαλαισηέο κε κεγάιε δήηεζε θαηά ηηο ψξεο αηρκήο, έηζη ψζηε λα κεηαηνπίζνπλ ρξνληθά ηε ιεηηνπξγία ησλ ζπζθεπψλ ηνπο ζε ψξεο κε θζελφηεξν θφζηνο ελέξγεηαο (Appliance Shifting). Καηά απηφλ ηνλ ηξφπν, απνκαθξχλεηαη ν θίλδπλνο black-out θαη ρξεζηκνπνηνχληαη απνηειεζκαηηθφηεξα νη δηαζέζηκνη πφξνη ηνπ ζπζηήκαηνο Σκοπόρ ηηρ Διπλωμαηικήρ θνπφο ηεο δηπισκαηηθήο είλαη ε νκαδνπνίεζε νηθηαθψλ θαηαλαισηψλ σο πξνο ηελ εηήζηα ειεθηξηθή ηνπο θαηαλάισζε ρξεζηκνπνηψληαο ηερληθέο εμφξπμεο δεδνκέλσλ. Απφ ηα κνληέια πνπ ζα εμαρζνχλ, ζα πξνθχςνπλ θαλφλεο γηα θάζε νκάδα νη νπνίνη κπνξνχλ ελ κέξεη λα νδεγήζνπλ ζε δηαθνξεηηθέο ρξεψζεηο ησλ πειαηψλ αιιά θπξίσο ζηελ θαηαλφεζε ηνπ ηξφπνπ κε ηνλ νπνίν ρξεζηκνπνηείηαη ε ειεθηξηθή ελέξγεηα ζην δίθηπν Υ.Σ. Απηφ ζα δψζεη ηε δπλαηφηεηα ζηηο εηαηξίεο ειεθηξηθήο ελέξγεηαο λα παξέρνπλ εμαηνκηθεπκέλεο ππεξεζίεο (personalized services) ζηνπο πειάηεο ηνπο αιιά θαη λα πξνζειθχζνπλ λένπο πνπ ζα ηνπο απνθέξνπλ κεγαιχηεξα θέξδε. ε αληίζεζε κε άιιεο κειέηεο πνπ επηθεληξψλνληαη ζε ζηνηρεία πξνεξρφκελα απφ ηελ εκεξήζηα θακπχιε θνξηίνπ ησλ θαηαλαισηψλ, ε παξνχζα δηπισκαηηθή εξγαζία ζηεξίδεηαη ζε δεδνκέλα ελεξγεηαθήο θχζεο πνπ ζρεηίδνληαη κε δεκνγξαθηθά ζηνηρεία γηα ηνπο πειάηεο, ζπλήζεηεο-πξφηππα ειεθηξηθήο θαηαλάισζεο πνπ εκθαλίδνπλ θαζψο θαη θαηαζθεπαζηηθά ραξαθηεξηζηηθά ησλ θαηνηθηψλ ηνπο. Πεγή ησλ δεδνκέλσλ πνπ ρξεζηκνπνηήζεθαλ απνηειεί ε έξεπλα RECS πνπ δηεμήρζε ζηηο Η.Π.Α Επιζκόπηζη Κεθαλαίων Μέρξη απηφ ην ζεκείν έγηλε κηα γεληθή εηζαγσγή γηα ηε ρξήζε ηερληθψλ εμφξπμεο δεδνκέλσλ σο θνκκάηη ηεο CRM δηαδηθαζίαο ζηελ αγνξά ειεθηξηθήο ελέξγεηαο θαζψο θαη ηνπ ζθνπνχ ηεο δηπισκαηηθήο εξγαζίαο.

17 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 15 ην 2ν Κεθάιαην δίλεηαη ην βαζηθφ ζεσξεηηθφ ππφβαζξν πνπ απαηηείηαη γηα ηελ θαηαλφεζε ησλ παξαθάησ θεθαιαίσλ. Δμεγνχληαη νη έλλνηεο ηεο KDD θαη ηεο εμφξπμεο δεδνκέλσλ δίλνληαο έκθαζε ζηηο κεζφδνπο ηεο θαηεγνξηνπνίεζεο θαη ηεο νκαδνπνίεζεο πνπ ζα ρξεζηκνπνηεζνχλ ζηε ζπλέρεηα. Δπηπιένλ, θαηαγξάθνληαη κε ζπληνκία κειέηεο πνπ έρνπλ γίλεη ζην ίδην επηζηεκνληθφ πεδίν. ην Κεθάιαην 3 παξνπζηάδεηαη ην ζχλνιν ησλ δεδνκέλσλ πνπ ρξεζηκνπνηήζεθαλ θαη γίλνληαη θάπνηεο ππνζέζεηο γηα ηνπο παξάγνληεο πνπ αλακέλεηαη λα επεξεάζνπλ ηελ νκαδνπνίεζε ησλ θαηαλαισηψλ. ην Κεθάιαην 4 θαηαγξάθεηαη ε δηαδηθαζία πνπ αθνινπζήζεθε γηα ηελ εμαγσγή ησλ κνληέισλ θαηεγνξηνπνίεζεο κε ρξήζε ηνπ ινγηζκηθνχ Weka. Αλαιχνληαη νη θαλφλεο θαηεγνξηνπνίεζεο πνπ πξνθχπηνπλ θαη ρξεζηκνπνηνχληαη ensemble κέζνδνη γηα ηελ πεξαηηέξσ βειηίσζε ησλ απνηειεζκάησλ. Σν Κεθάιαην 5 πεξηιακβάλεη ηηο ηερληθέο νκαδνπνίεζεο πνπ ρξεζηκνπνηήζεθαλ γηα πειάηεο κε πςειέο θαηαλαιψζεηο, ηα ραξαθηεξηζηηθά ησλ νπνίσλ δελ ήηαλ δπλαηφλ λα κνληεινπνηεζνχλ απφ ηνπο αιγφξηζκνπο θαηεγνξηνπνίεζεο. Η νπηηθνπνίεζε ησλ απνηειεζκάησλ έγηλε κε ρξήζε ηνπ ινγηζκηθνχ R. ην Κεθάιαην 6 θαηαγξάθνληαη ηα ζπκπεξάζκαηα πνπ πξνέθπςαλ απφ ηελ παξνχζα κειέηε θαζψο θαη κειινληηθέο επεθηάζεηο ηεο εξγαζίαο. ην Παξάξηεκα Α παξνπζηάδνληαη αλαιπηηθά ην ζχλνιν ησλ δεδνκέλσλ ηεο RECS. ην Παξάξηεκα Β γίλεηαη κηα ζχληνκε παξνπζίαζε γηα ην γξαθηθφ πεξηβάιινλ ηνπ Weka. Σέινο, αθνινπζνχλ νη αλαθνξέο ζηηο πεγέο πνπ ρξεζηκνπνηήζεθαλ ζηε δηπισκαηηθή

18 16 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ

19 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 17 Κεθάλαιο 2. Έννοιερ Βιβλιογπαθική επιζκόπηζη 2.1. Ανακάλςψη γνώζηρ ζε βάζειρ δεδομένων Σα ηειεπηαία ρξφληα παξαηεξείηαη κία εθζεηηθή αχμεζε ζην κέγεζνο ησλ Βάζεσλ Γεδνκέλσλ (ΒΓ). Ωζηφζν, παξά ηε δηαζεζηκφηεηα θαη ηελ πξφζβαζε ζηηο Απνζήθεο Γεδνκέλσλ, ν ξπζκφο εμαγσγήο ρξήζηκσλ πιεξνθνξηψλ παξακέλεη αξθεηά ρακειφο θαζψο είλαη αδχλαηε ε αλαγλψξηζε θαη αμηνιφγεζε ηεο γλψζεο ρσξίο ηε ρξήζε θαηάιιεισλ ππνινγηζηηθψλ ηερληθψλ θαη εξγαιείσλ Οπιζμόρ Πξνο ηελ θαηεχζπλζε απηή, ηεο αλαθάιπςεο πιεξνθνξηψλ, αλαπηχζζεηαη ην πεδίν ηεο αλαθάιπςεο γλψζεο ζε βάζεηο δεδνκέλσλ (Knowledge Discovery in Databases - KDD) γηα ηελ νπνία έρεη δνζεί ν παξαθάησ νξηζκφο απφ ηνπο Fayyad, Piatetsky, &Smyth [1996]: Η ανακάλςτη γνώζηρ ζε βάζειρ δεδομένυν (KDD) είναι η μη αζήμανηη διαδικαζία ηηρ εξαγυγήρ πποηύπυν (μονηέλυν ή δομών) πος ενςπάπσοςν ζηα δεδομένα μίαρ βάζηρ ηα ππόηςπα αςηά είναι καινούπγια, πιθανόν σπήζιμα και απόλςηα καηανοηηά (ίζυρ έπειηα από κάποια επεξεπγαζία).

20 18 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Σηάδια KDD διαδικαζίαρ Απφ ηελ Δηθφλα 2-1. είλαη εκθαλέο φηη κεηαμχ ησλ κε επεμεξγαζκέλσλ δεδνκέλσλ (είζνδνο) θαη ηεο εμαγσγήο γλψζεο (έμνδνο) κεζνιαβεί ε KDD δηαδηθαζία ε νπνία απνηειείηαη απφ ηα παξαθάησ ζηάδηα φπσο απηά δηαηππψλνληαη ζην [FAY96]: 1. Καηανόηζη ηος πεδίος ηηρ εθαπμογήρ (Task Understanding) Αλάινγα κε ηελ εθαξκνγή, ππάξρνπλ ζπγθεθξηκέλεο ηδηαηηεξφηεηεο πνπ πξέπεη λα ιεθζνχλ ππφςηλ ζηνλ θαζνξηζκφ ηνπ ζθνπνχ ηεο KDD δηαδηθαζίαο ν νπνίνο πξέπεη λα είλαη ζαθήο εμαξρήο. 2. Δπιλογή ζςνόλος δεδομένων ωρ είζοδο ζηην KDD (Data Selection) Πξνζδηνξηζκφο ησλ δεδνκέλσλ πνπ είλαη ζρεηηθά κε ηελ εθαξκνγή (taskrelevant data). Πεξηιακβάλνληαη είηε ηδηφηεηεο (attributes) ηεο ΒΓ είηε δηαζηάζεηο (dimensions) ησλ Απνζεθψλ Γεδνκέλσλ ελδηαθέξνλ γηα ην ρξήζηε. πνπ παξνπζηάδνπλ 3. Καθαπιζμόρ ηων δεδομένων (Data Cleaning) Ο θαζαξηζκφο ησλ δεδνκέλσλ πνπ έρνπλ επηιερζεί είλαη απαξαίηεηνο γηα ηνλ ρεηξηζκφ ησλ ειιηπψλ θαη αλαθξηβψλ ηηκψλ. Γηα ηηο ειιηπείο ηηκέο κπνξεί λα γίλεη πξνζέγγηζε κε θάπνηα κέζνδν (Fuzzy Logic, Neural Networks), λα ζεκαλζνχλ θαηάιιεια εθφζνλ ε απνπζία ηνπο ππνδειψλεη θάπνην γεγνλφο ή αθφκε κπνξνχλ θαη λα αγλνεζνχλ ηειείσο νη εγγξαθέο πνπ ηηο πεξηέρνπλ. Αθφκε, πξέπεη λα αθαηξεζνχλ νη δηπιν-εγγξαθέο απφ ηε ΒΓ δηφηη ε επαλάιεςε θάπνηνπ ζηηγκηφηππνπ ηνπ δίλεη κεγαιχηεξε βαξχηεηα ζηνλ θαζνξηζκφ ηνπ απνηειέζκαηνο. 4. Δνοποίηζη και Μεηαζσημαηιζμόρ ηων δεδομένων (Data Integration and Transformation) Σα πιενλάδνληα δεδνκέλα νθείινληαη θπξίσο ζηελ έλσζε δεδνκέλσλ πνπ πξνέξρνληαη απφ δηαθνξεηηθέο πεγέο θαη γηα ην ιφγν απηφ απαηηείηαη ελνπνίεζε ηνπο. Με κεηαζρεκαηηζκφ ηα δεδνκέλα κεηαηξέπνληαη ζε κνξθέο θαηάιιειεο γηα ην έθην ζηάδην ηεο KDD, ηελ Δμφξπμε Γεδνκέλσλ (ΔΓ). Πεξηιακβάλνληαη νη εμήο δηαδηθαζίεο γηα ηα δεδνκέλα: εμνκάιπλζε (smoothing), ζπζζψξεπζε

21 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 19 (aggregation), γελίθεπζε (generalization), θαλνληθνπνίεζε (normalization) θαη θαηαζθεπή ηδηνηήησλ (feature construction). Δικόνα Γπαθική αναπαπάζηαζη ηηρ KDD διαδικαζίαρ [SYM04] 5. Μείωζη ηων δεδομένων (Data Reduction) Η αλαπαξάζηαζε ηνπ ζπλφινπ ησλ δεδνκέλσλ απφ έλα άιιν κηθξφηεξν, κπνξεί λα επηηαρχλεη ηελ ΔΓ σζηφζν πξέπεη λα δηαηεξείηαη ε αθεξαηφηεηα ηνπ αξρηθνχ ζπλφινπ. Γηα ην ζθνπφ απηφ ρξεζηκνπνηνχληαη ηερληθέο φπσο ε αλάιπζε θχξησλ ζπληζησζψλ (Principal Component Analysis - PCA), ε αλάιπζε θαλνληθήο ζπζρέηηζεο (Canonical Correlation Analysis - CCA) θαη ν ράξηεο Sammon (Sammon map). 6. Δξόπςξη Γεδομένων (Data Mining) Έπεηηα απφ ηελ πξν-επεμεξγαζία ησλ δεδνκέλσλ, πξνθχπηεη ην ηειηθφ ζχλνιν δεδνκέλσλ ζην νπνίν εθαξκφδνληαη ηερληθέο Δμφξπμεο Γεδνκέλσλ (αλαιπηηθά ζηελ ελφηεηα 2.2) γηα ηελ αλαθάιπςε ρξήζηκσλ θαη ελδηαθεξνπζψλ δνκψλ ή κνληέισλ (κνηίβσλ) πνπ δηέπνπλ ηα δεδνκέλα.

22 20 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ 7. Αξιολόγηζη και Οπηικοποίηζη ηων αποηελεζμάηων (Pattern Evaluation and Visualization) Η αμηνιφγεζε ησλ κνηίβσλ πνπ εμνξχρζεθαλ είλαη απαξαίηεηε γηα ηελ εχξεζε απηψλ πνπ είλαη πην ελδηαθέξνληα θαη βαζίδεηαη ζε θξηηήξηα ελδηαθέξνληνο (interestingness measures). Η νπηηθνπνίεζε κπνξεί λα αθνξά είηε ηα κνηίβα/κνληέια πνπ έρνπλ εμαρζεί είηε ηα δεδνκέλα απφ ηα νπνία εμήρζεζαλ ηα κνηίβα. 8. Υπήζη ηηρ γνώζηρ Δθκεηάιιεπζε ηεο γλψζεο πνπ έρεη εμαρζεί κε ηελ εθαξκνγή ηεο ζε θάπνην άιιν ζχζηεκα κε ζθνπφ ηελ πεξαηηέξσ αλάιπζε ηεο Εξόπςξη δεδομένων Η Δμφξπμε Γεδνκέλσλ (Data Mining - DM) είλαη ην νπζηαζηηθφηεξν απφ ηα ζηάδηα ηεο KDD δηαδηθαζίαο θαη πεξηιακβάλεη ηελ εθαξκνγή αλάιπζεο δεδνκέλσλ θαη αιγφξηζκσλ εμεξεχλεζεο πνπ παξάγνπλ έλα ζπγθεθξηκέλν αξηζκφ κνηίβσλ απφ ηα δεδνκέλα, «ζπκβηβάδνληαο» ην ππνινγηζηηθφ θφζηνο κε ηελ απφδνζε ψζηε λα εκπίπηνπλ ζε απνδεθηά φξηα [FAY96]. Δπεηδή ν αξηζκφο ησλ κνηίβσλ πνπ πξνέθπςαλ κπνξεί λα είλαη πνιχ κεγάινο, ε έξεπλα κπνξεί λα νξηνζεηεζεί βάζεη πεξηνξηζκψλ πνπ ζέηεη ν ρξήζηεο θαη θάπνηνπ θαησθιίνπ ελδηαθέξνληνο (interestingness threshold). Οη ζεκαληηθφηεξεο κέζνδνη ΔΓ είλαη νη εμήο: Καηεγνξηνπνίεζε θαη Πξφβιεςε (Classification) Οκαδνπνίεζε (Clustering) πζρέηηζε (Association-Correlation) Υαξαθηεξηζκφο θαη δηάθξηζε (Characterization and Discrimination) ηηο επφκελεο ππν-ελφηεηεο ζα αλαιπζνχλ νη κέζνδνη ηεο νκαδνπνίεζεο θαη ηεο ηαμηλφκεζεο-πξφβιεςεο.

23 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά Καηηγοπιοποίηζη βήκαηα: Η δηαδηθαζία ηεο θαηεγνξηνπνίεζεο απνηειείηαη απφ ηα δχν παξαθάησ Δθκάζεζε (Learning) ηε θάζε απηή εμάγεηαη έλα κνληέιν πνπ κπνξεί λα πεξηγξάςεη θαη λα δηαθξίλεη ηηο δηαθνξεηηθέο θιάζεηο (γλσζηέο θαη πξνθαζνξηζκέλεο) ζηηο νπνίεο αλήθνπλ ηα δεδνκέλα ηνπ ζπλφινπ εθπαίδεπζεο (training set) δειαδή αληηθείκελα πνπ είλαη γλσζηφ ζε πνηα θιάζε αλήθνπλ βάζεη ηεο εηηθέηαο ηνπο (class label) Καηεγνξηνπνίεζε (Classification) Σν κνληέιν ιεηηνπξγεί είηε ζαλ εμεξεπλεηηθφ εξγαιείν γηα λα δηαθξίλεη αληηθείκελα πνπ αλήθνπλ ζε δηαθνξεηηθέο θιάζεηο (descriptive modeling) είηε γηα ηελ πξφβιεςε ηεο θιάζεο αληηθεηκέλσλ ησλ νπνίσλ ε εηηθέηα δελ είλαη γλσζηή (predictive modeling). Δικόνα Γημιοςπγία μονηέλος καηηγοπιοποίηζηρ [TAN05]. Υξεζηκνπνηείηαη θπξίσο ζε δπαδηθά ή αξηζκεηηθά δεδνκέλα. Μεξηθέο απφ ηηο ηερληθέο θαηεγνξηνπνίεζεο είλαη: δέλδξα απνθάζεσλ (decision trees), λεπξσληθά δίθηπα (neural networks), κεραλέο δηαλπζκάησλ ππνζηήξημεο

24 22 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ (support vector machine), θαηεγνξηνπνηεηέο θαλφλσλ (rule-based classifiers) θαη απινί θαηεγνξηνπνηεηέο Bayes (naïve Bayes classifiers). Κάζε ηερληθή ρξεζηκνπνηεί έλαλ αιγφξηζκν εθκάζεζεο (learning algorithm) κε ζθνπφ λα αλαγλσξίζεη ην κνληέιν πνπ πξνζνκνηψλεη θαιχηεξα ηε ζρέζε κεηαμχ ησλ δεδνκέλσλ ηνπ ζεη εθπαίδεπζεο θαη ησλ θιάζεσλ ηνπο. Αθφκε είλαη απαξαίηεην ν αιγφξηζκνο εθκάζεζεο λα δεκηνπξγεί κνληέια κε θαιή ηθαλφηεηα γελίθεπζεο δηφηη,φπσο αλαθέξζεθε θαη πξνεγνπκέλσο, ην κνληέιν ζα πξέπεη λα πξνβιέπεη ζσζηά ηηο θιάζεηο αληηθεηκέλσλ πνπ δελ έρεη επεμεξγαζηεί παιαηφηεξα [TAN05]. ηε ζπλέρεηα, αλαιχεηαη ε κέζνδνο ησλ δέλδξσλ απνθάζεσλ, κηα απφ ηηο πην δηαδεδνκέλεο κεζφδνπο θαηεγνξηνπνίεζεο ιφγσ ηηο ηθαλφηεηαο ρεηξηζκνχ ζπλφισλ δεδνκέλσλ κεγάισλ δηαζηάζεσλ, ηεο θαιήο αθξίβεηαο θαη ηεο θαηαλνεηήο δνκήο ηνπο γηα ηελ αλαπαξάζηαζε ηεο γλψζεο πνπ έρεη εμαρζεί απφ απηά. Decision Trees Σα βαζηθά ραξαθηεξηζηηθά ελφο δέλδξνπ απνθάζεσλ είλαη: 1. Ρίδα (root node): Σν γλψξηζκα πνπ επηιέγεηαη αξρηθά γηα ην δηαρσξηζκφ ησλ δεδνκέλσλ θαη ρξεζηκνπνηείηαη ζαλ βάζε γηα ηελ θαηαζθεπή ηνπ δέλδξνπ. 2. Δζσηεξηθφο θφκβνο (internal node): Έλα γλψξηζκα ην νπνίν βξίζθεηαη ζην εζσηεξηθφ ηνπ δέλδξνπ θαη πεξηιακβάλεη ζπλζήθεο ειέγρνπ γηα ην δηαρσξηζκφ ησλ ζηηγκηνηχπσλ κε δηαθνξεηηθά ραξαθηεξηζηηθά. 3. Φχιιν (leaf ή terminal node): Μηα απφ ηηο θαζνξηζκέλεο θιάζεηο. ηελ Δηθφλα 2-3, παξνπζηάδεηαη έλα δέλδξν απνθάζεσλ πνπ θαζνξίδεη αλ έλαο πειάηεο θαηαζηήκαηνο ειεθηξνληθψλ ζπζθεπψλ ζα αγνξάζεη έλαλ Η/Τ ή φρη. Οη αιγφξηζκνη απηήο ηεο θαηεγνξίαο ρξεζηκνπνηνχλ ζπλήζσο άπιεζηε ζηξαηεγηθή ζηελ θαηαζθεπή ηνπ δέλδξνπ κε ηελ έλλνηα φηη ιακβάλνληαη κηα ζεηξά απφ ηνπηθά βέιηηζηεο απνθάζεηο ζρεηηθά κε ην πνηα γλσξίζκαηα ζα ρξεζηκνπνηεζνχλ γηα ην δηαρσξηζκφ ησλ δεδνκέλσλ. ε απηή ηε ινγηθή ζηεξίδεηαη θαη ν αιγφξηζκνο Hunt πνπ απνηειεί ηε βάζε γηα αιγφξηζκνπο φπσο

25 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 23 νη ID3, C4.5 θαη CART. Αλ D t είλαη ην ζχλνιν ησλ ζηηγκηνηχπσλ πξνο εθπαίδεπζε ηα νπνία ζπλδένληαη κε έλα θφκβν t θαη y={y 1,y 2,,y n } Σα βήκαηα ηνπ Hunt s algorithm παξαηίζεληαη ζηε ζπλέρεηα φπσο παξνπζηάδνληαη ζην [ΣΑΝ06]: Βήκα 1: Αλ φια ηα ζηηγκηφηππα ηνπ ζπλφινπ D t αλήθνπλ ζηελ ίδηα θιάζε y t, ηφηε ν θφκβνο t είλαη θχιιν θαη ηνπ δίδεηαη ε εηηθέηα y t. Βήκα 2: Αλ ην ζχλνιν D t πεξηέρεη ζηηγκηφηππα πνπ αλήθνπλ ζε δηαθνξεηηθέο θιάζεηο, ηφηε επηιέγεηαη κηα ζπλζήθε ειέγρνπ γηα ην ζπγθεθξηκέλν γλψξηζκα κε ζθνπφ ην δηαρσξηζκφ ησλ ζηηγκηνηχπσλ ζε κηθξφηεξα ππνζχλνια. Γηα θάζε απνηέιεζκα ηεο ζπλζήθεο ειέγρνπ πξνθχπηεη θαη έλαο θφκβνο θαη ηα ζηηγκηφηππα ηνπ D t θαηαλέκνληαη ζηνπο λένπο θφκβνπο βάζεη ησλ απνηειεζκάησλ. Έπεηηα ν αιγφξηζκνο εθαξκφδνληαη αλαδξνκηθά γηα θάζε θφκβν πνπ πξνέθπςε. Δικόνα Η γπαθική αναπαπάζηαζη ενόρ δένδπος αποθάζεων [HAN06] Σέινο, κεηά ηελ θαηαζθεπή ηνπ δέλδξνπ απνθάζεσλ, είλαη πηζαλφλ λα αθνινπζήζεη έλα βήκα θιαδέκαηνο ηνπ δέλδξνπ (post tree-pruning) γηα λα απνθεπρζεί ην overfitting ηνπ δέλδξνπ. Με απηφλ ηνλ ηξφπν, απμάλεηαη ε ηθαλφηεηα γελίθεπζεο ηνπ δέλδξνπ ρσξίο λα επεξεάδεηαη ζεκαληηθά ε αθξίβεηα ηνπ.

26 24 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Ομαδοποίηζη Η Οκαδνπνίεζε (Clustering) είλαη κηα δηαδηθαζία ε νπνία δηαρσξίδεη ηα δεδνκέλα ζε έλα πεπεξαζκέλν ζχλνιν νκάδσλ-θιάζεσλ (clusters) νη νπνίεο είλαη ρξήζηκεο ή/θαη έρνπλ λφεκα, έηζη ψζηε: αληηθείκελα πνπ αλήθνπλ ζηελ ίδηα νκάδα λα έρνπλ πςειφ βαζκφ νκνηφηεηαο ή πςειή ελδν-νκαδηθή νκνηφηεηα (intra-cluster similarity). αληηθείκελα πνπ αλήθνπλ ζε δηαθνξεηηθέο νκάδεο λα έρνπλ ρακειφ βαζκφ νκνηφηεηαο ή ρακειή δηα-νκαδηθή νκνηφηεηα (inter-cluster similarity). Δάλ ζθνπφο ηεο νκαδνπνίεζεο είλαη ε θαηαλφεζε ησλ δεδνκέλσλ απφ ηνλ άλζξσπν θαη ε εμαγσγή ζπκπεξαζκάησλ απφ απηά, ηφηε νη θιάζεηο πνπ δεκηνπξγνχληαη ζα πξέπεη λα έρνπλ λφεκα θαη λα απνηππψλνπλ ηε θπζηθή δνκή ησλ δεδνκέλσλ. Αληίζεηα, αλ ε νκαδνπνίεζε είλαη έλα βήκα γηα πεξαηηέξσ αλάιπζε ή επεμεξγαζία ησλ δεδνκέλσλ φπσο ε δεκηνπξγία ζπλνπηηθήο πιεξνθνξίαο-πεξίιεςεο (summarization) θαη ε ζπκπίεζε δεδνκέλσλ (data compression), ηφηε νη νκάδεο ζα πξέπεη λα ιεηηνπξγνχλ αθαηξεηηθά αθνχ ηα αληηθείκελα θάζε θιάζεο ζα αληηπξνζσπεχνληαη απφ έλα αληηθείκελν πνπ ζα είλαη ραξαθηεξηζηηθφ ηεο θιάζεο ζηελ νπνία αλήθνπλ. χκθσλα κε ην [ΗΑΝ06] νη κέζνδνη νκαδνπνίεζεο κπνξνχλ λα θαηεγνξηνπνηεζνχλ αλάινγα κε ην πψο δεκηνπξγνχλ ηηο νκάδεο σο εμήο: 1. Μέθοδοι διασωπιζμού (Partitioning Methods) Γεδνκέλνπ κίαο βάζεο δεδνκέλσλ πνπ απνηειείηαη απφ n αληηθείκελα, ε κέζνδνο δεκηνπξγεί k δηακεξηζκνχο ησλ δεδνκέλσλ φπνπ θάζε δηακέξηζε αληηπξνζσπεχεη κία νκάδα (κε k n). Ιζρχεη φηη θάζε νκάδα πξέπεη λα πεξηέρεη ηνπιάρηζηνλ έλα αληηθείκελν θαη θάζε αληηθείκελν αλήθεη ζε αθξηβψο κία νκάδα. Αληηπξνζσπεπηηθνί αιγφξηζκνη είλαη ν k-means θαη ν k-medoids. K-means Ο αιγφξηζκνο K-means αλήθεη ζηηο κεζφδνπο δηαρσξηζκνχ. Γέρεηαη ζαλ παξάκεηξν εηζφδνπ έλαλ αθέξαην K πνπ θαζνξίδεηαη απφ ηνλ ρξήζηε θαη ζθνπφο είλαη λα δηαρσξίζεη έλα ζχλνιν N αληηθεηκέλσλ ζε K θιάζεηο.

27 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 25 Αξρηθά, επηιέγεη ηπραία K αληηθείκελα ηα νπνία νξίδεη σο ηα θέληξα ησλ θιάζεσλ (cluster s centroid ή center of gravity). Κάζε έλα απφ ηα ππφινηπα N K αληηθείκελα, αλαηίζεηαη ζηελ θνληηλφηεξε νκάδα βάζεη ηεο απφζηαζεο ηνπ αληηθεηκέλνπ απφ ηε κέζε ηηκή ηεο νκάδαο. ηε ζπλέρεηα, δεδνκέλνπ ησλ λέσλ αληηθεηκέλσλ πνπ έρνπλ αλαηεζεί ζε θάζε θιάζε, επαλαυπνινγίδεηαη ε λέα κέζε ηηκή γηα θάζε νκάδα. Η δηαδηθαζία επαλαιακβάλεηαη έσο φηνπ θαλέλα αληηθείκελν δελ αιιάδεη νκάδα ή ζπγθιίλεη βάζεη κηαο ζπλάξηεζεο θξηηεξίνπ. πλήζσο ρξεζηκνπνηείηαη ην θξηηήξην αζξνίζκαηνο ηεηξαγσληθνχ ζθάικαηνο (Sum Squared Error - SSE) ην νπνίν νξίδεηαη σο εμήο: (2-1) φπνπ SSE είλαη ην άζξνηζκα ηνπ ηεηξαγσληθνχ ζθάικαηνο γηα θάζε αληηθείκελν ηνπ ζπλφινπ, p είλαη ην ζεκείν πνπ αληηπξνζσπεχεη έλα αληηθείκελν θαη m i είλαη ε κέζε ηηκή ηεο θιάζεο C i.. Ο K-means έρεη δχν ζεκαληηθά πιενλεθηήκαηα πνπ εληζρχνπλ ηε ρξήζε ηνπ: έρεη θαιή απφδνζε θαη κηθξή ππνινγηζηηθή πνιππινθφηεηα. Απφ ηελ άιιε, παξνπζηάδεη επαηζζεζία ζε δεδνκέλα πνιχ δηαθνξεηηθά απφ ηα ππφινηπα κε ηελ έλλνηα φηη έλα αληηθείκελν κε πνιχ κεγάιε ηηκή κπνξεί λα επεξεάζεη ηε δεκηνπξγία ησλ νκάδσλ πξνο ην ρεηξφηεξν γεγνλφο πνπ επηδεηλψλεηαη απφ ην θξηηήξην SSE. 2. Ιεπαπσικοί μέθοδοι (Hierarchical Methods) Υσξίδνληαη ζε ζπζζσξεπηηθνχο (agglomerative) θαη δηαηξεηηθνχο (divisive). Οη ζπζζσξεπηηθέο κέζνδνη μεθηλνχλ κε θάζε αληηθείκελν λα απνηειεί κία νκάδα. ηε ζπλέρεηα, ηα αληηθείκελα (ή νη νκάδεο) ζπγρσλεχνληαη δηαδνρηθά έσο φηνπ φιεο νη νκάδεο ζπγρσλεπηνχλ ζε κηα ή πξνθχςεη ζπλζήθε ηεξκαηηζκνχ (bottom-up). Οη δηαηξεηηθνί εθηεινχλ ηελ αληίζηξνθε δηαδηθαζία. Ξεθηλνχλ απφ κία νκάδα πνπ πεξηιακβάλεη φια ηα αληηθείκελα θαη δηαδνρηθά δηαζπψληαη έσο φηνπ θάζε αληηθείκελν απνηειεί κηα νκάδα ή πξνθχςεη ζπλζήθε ηεξκαηηζκνχ (top-down). πλήζσο ε νκαδνπνίεζε κε ηεξαξρηθνχο αιγφξηζκνπο κπνξεί λα παξαζηαζεί γξαθηθά κε ηε ρξήζε δελδξνγξακκάησλ (dendrograms) ζηα νπνία απεηθνλίδνληαη νη ζρέζεηο κεηαμχ θιάζεσλ θαη ππνθιάζεσλ θαζψο θαη ε ζεηξά

28 26 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ κε ηελ νπνία νη θιάζεηο ζπγρσλεχνληαη (merge) ή δηαρσξίδνληαη (split). Παξφιν πνπ δεκηνπξγνχλ θαιψο δηαρσξηζκέλεο θαη εχξσζηεο θιάζεηο έρνπλ ην κεηνλέθηεκα φηη απφ ηε ζηηγκή πνπ ζα γίλεη κηα ζπγρψλεπζε ή έλαο δηαρσξηζκφο δελ είλαη δπλαηφλ λα αλαηξεζεί. Ο ζπζζσξεπηηθφο αιγφξηζκνο είλαη ν πην δηαδεδνκέλνο θαη ε ιεηηνπξγία ηνπ αλαιχεηαη παξαθάησ: αξρηθά, ππνινγίδεηαη ν πίλαθαο εγγχηεηαο (proximity matrix), έπεηηα ζπγρσλεχνληαη νη δχν θνληηλφηεξεο θιάζεηο θαη επαλαυπνινγίδεηαη ν πίλαθαο ψζηε λα απεηθνλίδεη ηηο λέεο ζρέζεηο εγγχηεηαο κεηαμχ ηεο λέαο θιάζεο θαη ησλ αξρηθψλ. Η δηαδηθαζία επαλαιακβάλεηαη έσο φηνπ φιεο νη νκάδεο ζπγρσλεπηνχλ ζε κία ή πξνθχςεη ζπλζήθε ηεξκαηηζκνχ. Αλάινγα κε ηνλ ηξφπν ππνινγηζκνχ ηεο εγγχηεηαο κεηαμχ δχν νκάδσλ πξνθχπηνπλ νη εμήο ζπζζσξεπηηθέο κέζνδνη: Single Link Η εγγχηεηα δχν νκάδσλ νξίδεηαη σο ε ειάρηζηε απφζηαζε κεηαμχ δχν νπνηνλδήπνηε ζεκείσλ πνπ αλήθνπλ ζε δηαθνξεηηθέο θιάζεηο. ( ) (2-2) Complete Link Η εγγχηεηα δχν νκάδσλ νξίδεηαη σο ε κέγηζηε απφζηαζε κεηαμχ δχν νπνηνλδήπνηε ζεκείσλ πνπ αλήθνπλ ζε δηαθνξεηηθέο θιάζεηο. ( ) (2-3) Average Distance Η εγγχηεηα δχν νκάδσλ νξίδεηαη σο ε κέζε εγγχηεηα κεηαμχ φισλ ησλ δεπγψλ ζεκείσλ πνπ αλήθνπλ ζε δηαθνξεηηθέο θιάζεηο. ( ) (2-4)

29 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 27 Ward s method (ή Minimum Variance method) Η εγγχηεηα δχν νκάδσλ νξίδεηαη σο ε αχμεζε ζην ηεηξαγσληθφ ζθάικα πνπ πξνθχπηεη φηαλ δχν νκάδεο ζπγρσλεχνληαη θαηά ηέηνην ηξφπν ψζηε λα ειαρηζηνπνηεζεί ε αχμεζε απηή. 3. Πςκνωηικοί μέθοδοι (Density-based Methods) Οη νκάδεο νξίδνληαη ζαλ «γεηηνληέο» ζεκείσλ βάζεη ηεο ππθλφηεηαο ησλ αληηθεηκέλσλ ζε κηα ζπγθεθξηκέλε αθηίλα. Η νπηηθνπνίεζε ησλ απνηειεζκάησλ πνπ πξνθχπηνπλ κε ηε ρξήζε απηήο ηεο κεζφδνπ δίλεη πεξηνρέο πςειήο ππθλφηεηαο (νκάδεο) πνπ πεξηβάιινληαη απφ πεξηνρέο ρακειήο ππθλφηεηαο. Σέινο, έρνπλ ην πιενλέθηεκα φηη κπνξνχλ λα αλαθαιχςνπλ νκάδεο νπνηνπδήπνηε ζρήκαηνο έλαληη ησλ κεζφδσλ δηαρσξηζκνχ πνπ βξίζθνπλ θπξίσο ζθαηξηθέο νκάδεο. Υαξαθηεξηζηηθφο αιγφξηζκνο απηήο ηεο θαηεγνξίαο είλαη ν DBSCAN θαη παξνπζηάδεηαη ζηε ζπλέρεηα φπσο θαηαγξάθεηαη ζην [SYM04]. DBSCAN ηνλ αιγφξηζκν DBSCAN σο νκάδα νξίδεηαη ην κέγηζην ζχλνιν ζηνηρείσλ πνπ ζπλδένληαη ιφγσ ππθλφηεηαο. ε απηή ηελ πεξίπησζε ε έλλνηα ηεο ππθλφηεηαο επεμεγείηαη απφ ηνπο παξαθάησ νξηζκνχο: - Γεδνκέλνπ ελφο ζηνηρείνπ p, ηα ζηνηρεία ηα νπνία βξίζθνληαη ζε αθηίλα Eps, νλνκάδνληαη Eps-γειηονιά ηνπ p. - Δάλ ε Eps-γεηηνληά ηνπ p πεξηέρεη ηνπιάρηζηνλ MinPts ζηνηρεία, ηφηε ην p νλνκάδεηαη κενηρικό ζημείο (core point). - Γεδνκέλνπ ελφο ζπλφινπ D απφ ζηνηρεία, ην ζηνηρείν p είλαη άμεζα πυκνωηικά-προζβάζιμο απφ ην ζηνηρείν q, εάλ ην p βξίζθεηαη ζηελ Eps-γεηηνληά ηνπ q θαη ην q είλαη θεληξηθφ ζηνηρείν. - Έλα ζηνηρείν p είλαη πυκνωηικά-προζβάζιμο απφ ην ζηνηρείν q ζε έλα ζχλνιν απφ ζηνηρεία, εάλ ππάξρεη αθνινπζία απφ ζηνηρεία p 1,,p n (p 1 =q, p n =p), ηέηνηα ψζηε ην p i+1 λα είλαη άκεζα ππθλσηηθά- πξνζβάζηκν απφ ην p i, γηα 1 i n, p i D.

30 28 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ - Έλα ζηνηρείν p είλαη πυκνωηικά-ζυνδεδεμένο κε ην ζηνηρείν q, ζε ζρέζε κε ην Eps θαη ην MinPts ζε έλα ζχλνιν ζηνηρείσλ D, εάλ ππάξρεη έλα ζηνηρείν ν D ζην νπνίν ηα p θαη q είλαη ππθλσηηθά πξνζβάζηκα. - Ωο πυκνωηική ομάδα νξίδεηαη ην ζχλνιν ησλ ππθλσηηθά-ζπλδεδεκέλσλ ζηνηρείσλ ζε ζρέζε κε ηελ ππθλσηηθή-πξνζβαζηκφηεηα. Οπνηνδήπνηε ζηνηρείν δελ αλήθεη ζε θακηά νκάδα νλνκάδεηαη εμσθείκελν ζηνηρείν (outlier). ηελ Δηθφλα 2-4, γίλνληαη πεξηζζφηεξν θαηαλνεηνί νη παξαπάλσ νξηζκνί: Δικόνα 2.4 Παπάδειγμα για οπιζμό πςκνόηηηαρ και DBSCAN [SYM04] Ο DBSCAN πεξηιακβάλεη ηα εμήο βήκαηα: - Σπραία επηινγή ελφο ζηνηρείνπ p. - Αλάθηεζε φισλ ησλ ππθλσηηθά εθηθηψλ ζηνηρείσλ βάζεη ησλ Eps θαη MinPts. - Δάλ ην p είλαη θεληξηθφ ζηνηρείν δεκηνπξγείηαη νκάδα. - Γηα θάζε θεληξηθφ ζηνηρείν, εχξεζε φισλ ησλ ππθλσηηθά πξνζβάζηκσλ ζηνηρείσλ. - πγρψλεπζε ησλ νκάδσλ πνπ είλαη ππθλσηηθά-πξνζβάζηκεο. - Δάλ ην p είλαη εμσθείκελν ζηνηρείν, ν DBSCAN επηζθέπηεηαη ην επφκελν ζηνηρείν ηεο βάζεο. - Δπαλάιεςε ηεο δηαδηθαζίαο κέρξη λα κελ κπνξεί λα πξνζηεζεί θαηλνχξην ζηνηρείν ζε θακηά νκάδα.

31 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά Μέθοδοι μονηέλος (Model-based Methods). ηε βηβιηνγξαθία αλαθέξνληαη θαη σο κέζνδνη πξσηνηχπνπ (Prototypebased Methods). Γηα θάζε νκάδα ππνζέηνπλ έλα κνληέιν έηζη ψζηε ηα αληηθείκελα ηεο λα έρνπλ κεγαιχηεξε νκνηφηεηα κε ην κνληέιν πνπ νξίδεη ηελ νκάδα ζηελ νπνία αλήθνπλ απφ φηη κε ην κνληέιν άιισλ νκάδσλ. Υαξαθηεξηζηηθέο ηερληθέο είλαη νη απηφ-νξγαλνχκελνη ράξηεο (Self-Organizing Map SOM) θαη fuzzy c-means. Self-Organizing feature Maps (SOMs) Ο απην-νξγαλνχκελνο ράξηεο είλαη έλα λεπξσληθφ δίθηπν πνπ πξνβάιιεη έλα ζχλνιν δεδνκέλσλ N δηαζηάζεσλ ζε έλα ρψξν κεησκέλσλ δηαζηάζεσλ, ζπλήζσο κνλνδηάζηαην ή δηζδηάζηαην. Με απηή ηελ πξνβνιή, νπνηαδήπνηε ζρέζε εγγχηεηαο ππάξρεη κεηαμχ ησλ αληηθεηκέλσλ ηεο εηζφδνπ δηαηεξείηαη θαηά πξνζέγγηζε ζηνλ ρψξν εμφδνπ (topological preserving). Ο SOM απνηειείηαη απφ έλα πξνθαζνξηζκέλν νξζνγψλην πιέγκα X πάλσ ζην νπνίν ππάξρνπλ c n θφκβνη N-δηαζηάζεσλ πνπ αλαπαξηζηνχλ ηα θέληξα ησλ θιάζεσλ πνπ έρνπλ επηιερζεί ηπραία ζε θάζε έλα απφ απηά αληηζηνηρεί έλα δεπγάξη ζπληεηαγκέλσλ (i,j). Καζψο εθηειείηαη ε νκαδνπνίεζε, πνιινί λεπξψλεο αληαγσλίδνληαη γηα ην ηξέρνλ δείγκα. Y Ο λεπξψλαο ηνπ νπνίνπ ην δηάλπζκα βάξνπο είλαη πην θνληά ζην ηξέρνλ δείγκα ελεξγνπνηείηαη. Γηα λα κεηαθηλεζεί ν ελεξγφο λεπξψλαο πην θνληά ζην αληηθείκελν ηεο εηζφδνπ αλαπξνζαξκφδνληαη ηφζν ηα δηθά ηνπ βάξε w(i,j) φζν θαη ησλ γεηηνληθψλ ηνπ λεπξψλσλ (w(i+1,j), w(i-1,j), w(i,j+1), w(i,j-1) θηι.) αληηζηξφθσο αλάινγα ηεο κεηαμχ ηνπο απφζηαζεο φπσο θαίλεηαη ζην ρήκα 2-3. Καηά ηε δηάξθεηα ηεο δηαδηθαζίαο άιινη λεπξψλεο απιψλνληαη ζην ράξηε θαη άιινη ζπξξηθλψλνληαη, δίλνληαο ζηνλ SOM ηελ φςε κηαο «ειαζηηθήο» επηθάλεηαο [CHI04].

32 30 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Δικόνα 2.5 Γομή Self-Organizing Map Με απηφ ηνλ ηξφπν ν ράξηεο απηφ-νξγαλψλεηαη ψζηε λεπξψλεο πνπ βξίζθνληαη θνληά λα αληηζηνηρνχλ ζε κνηίβα πνπ παξνπζίαδαλ νκνηφηεηεο ζηνλ αξρηθφ ρψξν. Κάζε δείγκα επεξεάδεη έλαλ λεπξψλα ck ζχκθσλα κε ηνλ παξαθάησ ηχπν: (2.6) φπνπ (t ) είλαη ν ξπζκφο κάζεζεο, kw (t ) είλαη ε ηηκή ηεο ζπλάξηεζεο γεηηνληάο πνπ αλαθέξεηαη ζε έλαλ λεπξψλα ck θαη w δείθηεο ηεο ελεξγήο κνλάδαο ΕΔ για ηη ζύζηαζη πποθίλ ηλεκηπικών καηαναλωηών Έλα πεδίν ζην νπνίν έρνπλ βξεη εθαξκνγή νη ηερληθέο ηεο ΔΓ είλαη ζε δεδνκέλα ησλ Δηαηξηψλ Δλεξγεηαθψλ Τπεξεζηψλ (Energy Service Company ESCO) πνπ αθνξνχλ ειεθηξηθνχο θαηαλαισηέο. Σα δεδνκέλα απηά αθνξνχλ θπξίσο ηηο εκεξήζηεο θακπχιεο θνξηίνπ ηνπ θαηαλαισηή (daily load curves) νη νπνίεο πεξηιακβάλνπλ κεηξήζεηο αλά 15ιεπην, κηζάσξν ή αλά ψξα. Η νκαδνπνίεζε βάζεη ηεο θακπχιεο θνξηίνπ (κνηίβν) θάζε θαηαλαισηή κπνξεί λα ζπκβάιεη ζηε δηακφξθσζε λέσλ θιάζεσλ πεξηζζφηεξν ρξεζηηθψλ, αλαγλσξίδνληαο παξφκνηα ειεθηξηθή ζπκπεξηθνξά αλάκεζα ζηνπο θαηαλαισηέο θαη εληνπίδνληαο ζπγθεθξηκέλα ραξαθηεξηζηηθά θαηαλάισζεο. Δπηπιένλ, ε θαηεγνξηνπνίεζε είλαη απαξαίηεηε γηα ηελ έληαμε ησλ λέσλ πειαηψλ ζηελ θαηάιιειε θιάζε.

33 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 31 χκθσλα κε ην [RAM07], απηή ε γλψζε ζα ρξεζηκεχζεη ζηηο ESCOs : Να εληνπίζνπλ ηηο αηηίεο πνπ πξνθαινχλ αηρκέο θνξηίνπ θαη λα αλαπηχμνπλ ζηξαηεγηθέο ψζηε λα ηηο κεηψζνπλ. Να αλαπηχμνπλ ζπγθεθξηκέλα ζπκβφιαηα κε ηνπο θαηαλαισηέο πνπ ζα επηηξέπνπλ ηε βειηίσζε ησλ ειεθηξηθψλ δηθηχσλ θαη ηεο πνηφηεηαο ησλ παξερφκελσλ ππεξεζηψλ. ηε ζπλέρεηα, παξνπζηάδνληαη κέζνδνη θαηεγνξηνπνίεζεο θαη νκαδνπνίεζεο ειεθηξηθψλ θαηαλαισηψλ πνπ ζπλαληήζεθαλ ζηε βηβιηνγξαθία. Η ζπληξηπηηθή πιεηνςεθία ησλ άξζξσλ εζηηάδεη ηηο ηερληθέο ΔΓ ζηα δεδνκέλα πνπ αθνξνχλ ηελ ειεθηξηθή ζπκπεξηθνξά ησλ θαηαλαισηψλ. ηνηρεία πνπ αθνξνχλ ηελ νηθνγελεηαθή θαηάζηαζε, ηελ νηθία, ηηο ειεθηξηθέο ζπζθεπέο πνπ έρεη ζην ζπίηη ηνπ ν θαηαλαισηήο ή άιιεο πιεξνθνξίεο πνπ αθνξνχλ ηελ θνηλσληθή ηνπ θαηάζηαζε δελ έρνπλ δηεξεπλεζεί. ην [KIT02] πξνηείλεηαη ε ρξήζε ηερληθψλ ΔΓ σο έλα βήκα γηα ηελ εθαξκνγή ηνπ CRM ζηνλ ηνκέα ηεο ειεθηξηθήο ελέξγεηαο ζηελ Ιαπσλία. Πην ζπγθεθξηκέλα, ε έξεπλα αθνξά θαηαλαισηέο ππέξπςειήο ηάζεο (20kV θαη πάλσ) θαη κε δήηεζε βάζεη ζπκβνιαίνπ άλσ ησλ 2000kW. Αξρηθά, νη θαηαλαισηέο δηακεξίδνληαη κε βάζε δήηεζε θαη ην ζπληειεζηή θνξηίνπ φπσο παξνπζηάδεηαη ζηελ Δηθφλα 2.6. Δικόνα 2.6 Παπάδειγμα ομαδοποίηζηρ καηαναλωηών [ΚΙΣ02]

34 32 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Πξνηηκψκελνη θαηαλαισηέο είλαη εθείλνη κε πςειή δήηεζε θαη πςειφ ζπληειεζηή θφξηηζεο θαη απηνχο πξνζπαζνχλ λα πξνζειθχζνπλ νη εηαηξίεο κέζσ εηδηθψλ πξνζθνξψλ ζηηο ηηκνινγήζεηο θαη πςειήο πνηφηεηαο παξνρήο ππεξεζηψλ (face-to-face service). ηελ νκάδα 1 πξνηείλνληαη κέηξα φπσο ε αγνξά ζπζθεπψλ εμνηθνλφκεζεο ελέξγεηαο, πξνθεηκέλνπ λα κεηαθηλεζνχλ νη θαηαλαισηέο πξνο ηελ πξνηηκψκελε νκάδα. ηελ νκάδα 2 παξέρνληαη απιά ππεξεζίεο κέζσ ηειεθψλνπ θαη internet. Γηα ηελ θαηαλφεζε ησλ ραξαθηεξηζηηθψλ θάζε νκάδαο, ρξεζηκνπνηήζεθαλ δέλδξα απνθάζεσλ θαη εμεηάζηεθαλ νη θαλφλεο θαηεγνξηνπνίεζεο πνπ πξνέθπςαλ απφ απηά. Σέινο, έγηλε θαη κηα πξνζπάζεηα θαηαλφεζεο ηεο κεηαθίλεζεο ησλ θαηαλαισηψλ κεηαμχ ηεο πξνηηκψκελεο νκάδαο θαη ησλ άιισλ δχν νκάδσλ. ην [CHI03] επηρεηξείηαη λα νκαδνπνηεζνχλ νη θαηαλαισηέο κε ηε ρξήζε a priori indices θαη field indices. Οη πξψηνη αθνξνχλ ζε δεδνκέλα θχζεο ζπκβνιαίνπ, φπσο είλαη ην είδνο νηθνλνκηθήο δξαζηεξηφηεηαο ηνπ θαηαλαισηή, ε ζπκθσλεκέλε ηζρχο, ε παξερφκελε ηάζε θ.α., ελψ νη δεχηεξνη πξνέξρνληαη απφ ηα εκεξήζηα δηαγξάκκαηα θνξηίνπ. Γηα ηελ νκαδνπνίεζε ησλ θαηαλαισηψλ ρξεζηκνπνηείηαη ε κέζνδνο Modified Followthe-Leader [PAO92] γηα ηελ νπνία δελ απαηηείηαη ν πξνζδηνξηζκφο ηνπ αξηζκνχ ησλ clusters εμαξρήο. Απνδεηθλχεηαη φηη ε ρξήζε a priori δεηθηψλ δελ είλαη απνηειεζκαηηθή θαζψο απηνί νη δείθηεο δε ζρεηίδνληαη κε ηελ ελεξγεηαθή θαηαλάισζε ησλ πειαηψλ. Σέινο, δεκηνπξγήζεθαλ θαη ζχλζεηνη δείθηεο (composite indices) γηα ηελ επηινγή ησλ νπνίσλ ρξεζηκνπνηνχληαη σο κέηξα απφδνζεο νη δείθηεο Mean Index Adequacy (ΜΙΑ) θαη Clustering Dispersion Indicator (CDI). Η ρξήζε composite indices έδσζε ηα θαιχηεξα απνηειέζκαηα. Σν [CHI04] απνηειεί κηα επέθηαζε ηνπ [CHI03]. Γηα ηα πεηξάκαηα ρξεζηκνπνηήζεθαλ νη εκεξήζηεο θακπχιεο θνξηίνπ (γηα ηηο θαζεκεξηλέο κφλν) απφ 234 πειάηεο ηνπ εζληθνχ παξφρνπ ειεθηξηθήο ελέξγεηαο ηεο ινβελίαο. πγθξίλνληαο ηηο κεζφδνπο Modified Follow-the-Leader θαη SOM, πξνέθπςε φηη ν πξψηνο δίλεη θαιχηεξα απνηειέζκαηα βάζεη ησλ δεηθηψλ απφδνζεο MIA θαη CDI. ην [VER04] γίλεηαη δηαρσξηζκφο ζε time domain indices θαη ζε frequency domain indices γηα ηελ νκαδνπνίεζε ησλ ειεθηξηθψλ θαηαλαισηψλ κε ρξήζε ηεο ηερληθήο SOM. ηελ πξψηε πεξίπησζε, ρξεζηκνπνηνχληαη δχν

35 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 33 πξνζεγγίζεηο γηα ηελ νκαδνπνίεζε: είηε δείθηεο πνπ πξνέξρνληαη απφ ηελ εκεξήζηα θακπχιε θνξηίνπ είηε δηαλχζκαηα κε ηηο 24 ηηκέο πνπ αληηζηνηρνχλ ζηηο σξηαίεο θαηαλαιψζεηο. ηελ δεχηεξε πεξίπησζε, ρξεζηκνπνηείηαη ν Γηαθξηηφο Μεηαζρεκαηηζκφο Fourier γηα ηελ δεκηνπξγία ηεο ζπλερνχο θακπχιεο θνξηίνπ (απφ ηηο 24 ηηκέο) θαη ζηε ζπλέρεηα κε δεηγκαηνιεςία 96 ζεκείσλ πνπ αληηζηνηρνχλ ζηελ θαηαλάισζε αλά ηέηαξην θαηαιήγνληαο ζηε δεκηνπξγία ησλ frequency indices. Απφ ηα απνηειέζκαηα πξνθχπηεη φηη ε ρξήζε ηφζν ηεο εκεξήζηαο θακπχιεο θνξηίνπ φζν θαη ησλ frequency indices δίλνπλ εμίζνπ θαιά απνηειέζκαηα. ην [CHI06] γίλεηαη ζχγθξηζε κεηαμχ ησλ παξαθάησ ηερληθψλ : K-means, Fuzzy c-means, Modified Follow-the-Leader, SOM θαη ηεξαξρηθήο κεζφδνπ. Η ηειεπηαία εμεηάδεηαη αλαιπηηθφηεξα γηα ηα θξηηήξηα complete linkage, average distance θαη Ward linkage. Σν ζχλνιν ησλ δεδνκέλσλ πεξηιακβάλεη ηηο RLPs απφ 234 θαηαλαισηέο Μ.Σ. φπνπ θάζε RLP πεξηέρεη 96 ηηκέο (αλά 15-ιεπην) νη νπνίεο είλαη ν κέζνο φξνο ησλ κεηξήζεσλ πνπ έρνπλ ιεθζεί γηα θάζε πειάηε θαη αθνξνχλ θαζεκεξηλέο θαηά ηελ πεξίνδν ηεο άλνημεο. Γηα ηελ αμηνιφγεζε ηεο νκαδνπνίεζεο ρξεζηκνπνηνχληαη νη δείθηεο Clustering Dispersion Indicator (CDI), Modified Dunn Index (MDI), Scatter Index (SI) θαη Davies-Bouldin Index (DBI). Σα απνηειέζκαηα, γηα κεηαβαιιφκελν αξηζκφ clusters απφ 5 έσο 100, δείρλνπλ φηη ε ηεξαξρηθή κέζνδνο (κε ρξήζε ηνπ θξηηεξίνπ average distance) θαη ε Modified Followthe-Leader ππεξέρνπλ ησλ ππνινίπσλ ηερληθψλ δεδνκέλνπ φηη έρνπλ ηελ ηθαλφηεηα λα δηακνξθψλνπλ θαιψο δηαρσξηζκέλεο νκάδεο θαη λα απνκνλψλνπλ αζπλήζηζηα πξφηππα (θακπχιεο θνξηίνπ). Σέινο, ρξεζηκνπνηνχληαη νη ηερληθέο Principal Component Analysis (PCA), Canonical Correlation Analysis (CCA) θαη Sammon map νη νπνίεο πξνβάιινπλ έλα data set K δηαζηάζεσλ ζε έλα ράξηε R δηαζηάζεσλ (R<<K). ην κεησκέλν ζχλνιν δεδνκέλσλ εθαξκφζηεθε ηεξαξρηθφο αιγφξηζκνο κε ρξήζε ηνπ θξηηεξίνπ Average Distance γηα κεηαβαιιφκελν αξηζκφ θιάζεσλ απφ 10 έσο 30 θαη κεηαβαιιφκελν αξηζκφ δηαζηάζεσλ R=1 έσο R=6. Σα απνηειέζκαηα δείρλνπλ φηη ε ηερληθή Sammon map δίλεη εμίζνπ θαιά απνηειέζκαηα κε ηνλ ηεξαξρηθφ αιγφξηζκν κε θξηηεξίνπ Average Distance πνπ εθαξκφζηεθε ζην αξρηθφ ζχλνιν.

36 34 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Σν [TSE07] αθνξά ηε ρξήζε δχν ζηαδίσλ γηα ηελ θαηεγνξηνπνίεζε θαηαλαισηψλ ειεθηξηθήο ελέξγεηαο ζηελ Διιάδα. Σα δεδνκέλα πξνέξρνληαη απφ 94 θαηαλαισηέο Μ.Σ. κε κέζε ηάζε απφ 250kW έσο 10ΜW. Σν δηάζηεκα δεηγκαηνιεςίαο είλαη 15 ιεπηά θαη ε πεξίνδνο 10 κήλεο θαηά ην έηνο ην πξψην ζηάδην, γηα θάζε πειάηε μερσξηζηά ρξεζηκνπνηνχληαη νη ηερληθέο νκαδνπνίεζεο k-means (modified), Kohonen adaptive vector quantization, fuzzy C-means θαη hierarchical (SL, CL, UPGMA, WPGMA, UPGMC, WARD algorithm), κε ζθνπφ ηελ εμαγσγή θαιά νξηζκέλσλ θαη επδηάθξηησλ θιάζεσλ γηα ηνλ θάζε πειάηε. Κάζε θιάζε αληηπξνζσπεχεηαη απφ κηα ραξαθηεξηζηηθή θακπχιε θνξηίνπ πνπ δείρλεη ηελ ειεθηξηθή ζπκπεξηθνξά ηνπ θαηαλαισηή γηα ηηο θαζεκεξηλέο, ηηο δηαθνπέο, ηελ πξψηε κέξα κεηά ηηο δηαθνπέο θ.α.. Σα απνηειέζκαηα δείρλνπλ φηη ν αιγφξηζκνο k- means (modified) δίλεη ηα θαιχηεξα απνηειέζκαηα γηα ηνπο δείθηεο ΜΙΑ, CDI θαη WCBCR, ν optimized AVQ γηα ηνπο SMI θαη DBI, θαη ην κνληέιν Ward γηα ηνλ J. ην δεχηεξν ζηάδην, επηιέγνληαη εθείλεο νη ραξαθηεξηζηηθέο θακπχιεο θνξηίνπ πνπ αληηζηνηρνχλ ζε κηα ηππηθή κέξα φπσο ε κέξα κε ηε κεγαιχηεξε δήηεζε, θαη εθαξκφδνληαη εθ λένπ νη παξαπάλσ αιγφξηζκνη νκαδνπνίεζεο. Σα θαιχηεξα απνηειέζκαηα πξνθχπηνπλ βάζεη ηνπ δείθηε WCBCR απφ ηε ρξήζε ηνπ k-means (modified) θαη ηνπ ηεξαξρηθνχ αιγφξηζκνπ κε ηε κέζνδν UPGMA. ην [RAM07] γίλεηαη κηα πξνζπάζεηα θαηεγνξηνπνίεζεο 208 θαηαλαισηψλ Μ.Σ. κηαο Πνξηνγαιηθήο εηαηξίαο παξνρήο ειεθηξηθνχ ξεχκαηνο. Σα δεδνκέλα πεξηιακβάλνπλ ηηο εκεξήζηεο θακπχιεο θνξηίνπ ησλ θαηαλαισηψλ. Σν δηάζηεκα δεηγκαηνιεςίαο είλαη 15 ιεπηά θαη ε πεξίνδνο 3 κήλεο ην θαινθαίξη θαη 3 κήλεο ην ρεηκψλα (θαζεκεξηλέο θαη αββαηνθχξηαθα). Γηα θάζε θαηαλαισηή δεκηνπξγήζεθαλ 2 ραξαθηεξηζηηθέο εκεξήζηεο θακπχιεο θνξηίνπ, κηα γηα ηηο θαζεκεξηλέο θαη κηα γηα ηα αββαηνθχξηαθα, βξίζθνληαο ην κέζν φξν ησλ δηαλπζκάησλ γηα ηηο δχν απηέο πεξηπηψζεηο. Έπεηηα, ρξεζηκνπνηήζεθαλ ν Two-Step αιγφξηζκνο [ZHA96] θαη ν WEACS γηα ηελ νκαδνπνίεζε ησλ ραξαθηεξηζηηθψλ θακππιψλ φισλ ησλ θαηαλαισηψλ. Με ρξήζε ησλ δεηθηψλ ΜΙΑ θαη CDI επηιέρζεθε ν αξηζκφο ησλ clusters λα είλαη 9. Σφζν γηα ηνλ Two-step φζν θαη γηα ηνλ WEACS πξνέθπςε κηα νκάδα πνπ πεξηείρε ραξαθηεξηζηηθέο θακπχιεο θνξηίνπ κε κε ηππηθή ζπκπεξηθνξά νη νπνίεο θαη αθαηξέζεθαλ.

37 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 35 ηε ζπλέρεηα απφ ηηο αληηπξνζσπεπηηθέο θακπχιεο θνξηίνπ θάζε θιάζεο επηιέρζεθαλ 5 δείθηεο βάζεη ησλ νπνίσλ έγηλε ε θαηεγνξηνπνίεζε ησλ θαηαλαισηψλ κε ηε ρξήζε ηνπ C5.0. Οη θαλφλεο θαηεγνξηνπνίεζεο πνπ πξνέθπςαλ απφ ην δελδξν απνθάζεσλ δίλνπλ θαη ηα ραξαθηεξηζηηθά θάζε θιάζεο. ην [RAM08] αθνινπζείηαη παξφκνηα ινγηθή κε ην [RAM07]. ηε θάζε ηεο νκαδνπνίεζεο ησλ ραξαθηεξηζηηθψλ θακπχισλ ρξεζηκνπνηνχληαη ν Two- Step, o K-means θαη ν SOM. Σα θαιχηεξα απνηειέζκαηα βάζεη ησλ δεηθηψλ MIA θαη CDI ηα έδσζε ν Two-Step γηα αξηζκφ νκάδσλ ίζν κε 9. Σέινο, γηα ηε θάζε ηεο θαηεγνξηνπνίεζεο ρξεζηκνπνηήζεθε έλαο επηπιένλ δείθηεο απφ ηελ θακπχιε θνξηίνπ ρσξίο σζηφζν λα βειηηψζεη ηα απνηειέζκαηα γη απηφ θαη απνξξίθζεθε. ην [GUL09] έγηλε κηα πξνζπάζεηα νκαδνπνίεζεο θαηαλαισηψλ Υ.Σ. ηνπ ηηαιηθνχ παξφρνπ Enel. Σν δηάζηεκα δεηγκαηνιεςίαο είλαη αλά 15ιεπηά γηα ηελ πεξίνδν κεηαμχ ηεο πξψηεο εβδνκάδαο ηνπ Φεβξνπαξίνπ ηνπ 2009 έσο ηεο ηειεπηαίαο ηνπ Μαξηίνπ ηνπ ίδηνπ ρξφλνπ. Υξεζηκνπνηήζεθαλ νη αιγφξηζκνη K-means θαη TS-Part. Ο ηειεπηαίνο δελ απαηηεί ζαλ αξρηθή παξάκεηξν ηνλ αξηζκφ ησλ clusters θαη ρξεζηκνπνηεί top-down πξνζέγγηζε ζεσξψληαο αξρηθά έλα κφλν cluster. Γηα ηε ζχγθξηζε ησλ δηαλπζκάησλ (ρξνλνζεηξψλ) ρξεζηκνπνηήζεθε εθηφο απφ ηελ Δπθιείδεηα απφζηαζε θαη ηε κέζνδν Dynamic Time Warping (DTW). Σα θαιχηεξα απνηειέζκαηα πξνέθπςαλ γηα ηνλ TS-Part κε ρξήζε ηνπ DTW. Σέινο, ην [GAR09] πξνηείλεη ηελ νκαδνπνίεζε θακππιψλ θνξηίνπ ζε επίπεδν ππνζηαζκψλ αθξηβψο ιφγσ ηεο έιιεηςεο δεδνκέλσλ γηα ηνπο θαηαλαισηέο Υ.Σ.. Υξεζηκνπνηείηαη ν ηεξαξρηθφο αιγφξηζκνο ζε ζπλδπαζκφ κε ηε ρξήζε αζαθψλ κεηαβιεηψλ. Οξίδνληαη 2 αζαθείο ιεθηηθέο κεηαβιεηέο νη νπνίεο εθθξάδνληαη κε ηξαπεδνεηδείο ζπλαξηήζεηο ζπκκεηνρήο: ν ζπληειεζηήο θνξηίνπ (Very Small, Small, Medium) θαη ν ζπληειεζηήο ηζρχνο (Medium, High, Very High). Σα θαιχηεξα απνηειέζκαηα πξνθχπηνπλ γηα 4 clusters. Η γλψζε ησλ ζπγθεθξηκέλσλ νκάδσλ κπνξεί λα ρξεζηκεχζεη ζηελ θαιχηεξε ιεηηνπξγία θαη ην ζρεδηαζκφ ηνπ ζπζηήκαηνο δηαλνκήο.

38 36 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ

39 Κεθάλαιο 3. Ανάλςζη δεδομένων και ςποθέζειρ 3.1. Residential Energy Consumption Survey (RECS) Η RECS είλαη κία εζληθή ζηαηηζηηθή έξεπλα πνπ δηεμάγεηαη θάζε ηέζζεξα ρξφληα ζηηο Η.Π.Α. θαη θαηά ηελ νπνία ζπιιέγνληαη δεδνκέλα ελεξγεηαθήο θχζεο πνπ ζρεηίδνληαη κε θαηαζθεπαζηηθά ραξαθηεξηζηηθά θαηνηθηψλ, κε ζπλήζεηεο-πξφηππα ειεθηξηθήο θαηαλάισζεο θαζψο θαη δεκνγξαθηθά ζηνηρεία ησλ θαηνίθσλ ηνπο. ηε RECS πνπ έιαβε ρψξα ην 2005 επηιέρζεθαλ θχξηεο θαηνηθίεο, έηζη ψζηε λα αληηπξνζσπεχνπλ εθαηνκκχξηα λνηθνθπξηά. Σα ζηνηρεία πνπ πξνέθπςαλ απφ ηελ έξεπλα ζε ζπλδπαζκφ κε δεδνκέλα απφ ηνπο ηνπηθνχο παξφρνπο ειεθηξηθήο ελέξγεηαο, έρνπλ αλαξηεζεί ζηελ ηζηνζειίδα ηνπ νξγαληζκνχ δηαρείξηζεο ησλ ελεξγεηαθψλ πιεξνθνξηψλ [URL1], θαη πάλσ ζε απηά ζηεξίρζεθε ε παξνχζα δηπισκαηηθή εξγαζία Οπγάνωζη Δεδομένων Σα δεδνκέλα είλαη νξγαλσκέλα ζε 12 αξρεία ζε CSV format θαη θαζέλα ζπλνδεχεηαη απφ ην αληίζηνηρν Layout file πνπ πεξηιακβάλεη ηελ εηηθέηα θαη ηνλ ηχπν θάζε κεηαβιεηήο. Δπηπιένλ, ππάξρεη θαη ην αξρείν 2005 RECS

40 38 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Variable Response Code Labels πνπ πεξηέρεη πεξηγξαθέο ησλ θσδηθψλ ησλ κεηαβιεηψλ. Πην ζπγθεθξηκέλα, πξφθεηηαη γηα ηα παξαθάησ 12 αξρεία: FILE1 Section A: Housing Unit Characteristics ην αξρείν απηφ πεξηιακβάλνληαη κεηαβιεηέο πνπ αθνξνχλ βαζηθά ραξαθηεξηζηηθά ηεο θαηνηθίαο φπσο ν ηχπνο, ν αξηζκφο ησλ νξφθσλ, ην πιήζνο ησλ δηακεξηζκάησλ -ζηελ πεξίπησζε ηεο πνιπθαηνηθίαο κε πέληε ή πεξηζζφηεξα δηακεξίζκαηα- θαζψο θαη ν αξηζκφο ησλ δσκαηίσλ, ησλ ππλνδσκαηίσλ θαη ησλ κπάλησλ ηνπ ζπηηηνχ. Αθφκε, αλαθέξεηαη ε χπαξμε επηπξφζζεησλ ρψξσλ φπσο ππφγεην, ζνθίηα, γθαξάδ θαη ην αλ ςχρνληαη ή/θαη ζεξκαίλνληαη. Δπίζεο, θαηαγξάθνληαη παξάγνληεο πνπ επεξεάδνπλ ηε ζεξκνκφλσζε φπσο ην έηνο θαηαζθεπήο ηεο θαηνηθίαο θαη ην πιηθφ ησλ ηνίρσλ. Σέινο, αλαθέξεηαη αλ ε θαηνηθία βξίζθεηαη ζε αζηηθή δψλε ή ζηελ χπαηζξν θαη αλ ππάξρεη δίθηπν θπζηθνχ αεξίνπ ζηελ πεξηνρή. FILE2 Section B: Kitchen Appliances Πεξηιακβάλεη δεδνκέλα γηα ηηο θχξηεο ειεθηξηθέο ζπζθεπέο πνπ ζπλαληψληαη ζηελ θνπδίλα κηαο θαηνηθίαο, φπσο ην αλ δηαζέηεη ειεθηξηθή θνπδίλα ή/θαη μερσξηζηέο εζηίεο θαη θνχξλν θαζψο θαη ηα θαχζηκα πνπ ρξεζηκνπνηνχληαη γηα ηε ιεηηνπξγία ηνπο. Αθφκε, αλαθέξεηαη ε ζπρλφηεηα ιεηηνπξγίαο ηνπ θνχξλνπ θαη αλ έρεη απηφκαην ζχζηεκα θαζαξηζκνχ, πφζν ζπρλά καγεηξεχνληαη δεζηά θαγεηά θαη ην βαζηθφ θαχζηκν πνπ ρξεζηκνπνηείηαη γηα καγείξεκα. Αθφκε, θαηαγξάθεηαη ε χπαξμε ζηελ θαηνηθία ζπζθεπψλ φπσο θνχξλνο κηθξνθπκάησλ, ηνζηηέξα θαη θαθεηηέξα, ε ζπρλφηεηα θαη ν ηξφπνο ρξήζεο ηνπο (αλ γηα παξάδεηγκα ν θνχξλνο κηθξνθπκάησλ ρξεζηκνπνηείηαη ζαλ θνχξλνο ζηελ θαηνηθία). Δπηπιένλ, πφζα ςπγεία ππάξρνπλ ζην ζπίηη θαη ηη ηχπνπ (κεγάιν, κηθξφ, κε κηα ή δχν πφξηεο, πάλσ θάησ ή κηα δίπια ζηελ άιιε), αλ δηαζέηνπλ ζχζηεκα απφςπμεο ή/θαη πάγνπ ζηελ πφξηα, ε παιαηφηεηα ηνπο θαη αλ είλαη Α θιάζεο, αλ ππάξρνπλ μερσξηζηνί θαηαςχθηεο, αλ δηαζέηνπλ πφξηα κπξνζηά ή πάλσ, ην κέγεζνο ηνπο, θαη ε παιαηφηεηα ηνπο. Σέινο, αλ ππάξρεη πιπληήξην πηάησλ, πφζν ζπρλά ρξεζηκνπνηείηαη, πφζν εηψλ είλαη θαη αλ είλαη ελεξγεηαθήο θιάζεο Α.

41 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 39 FILE3 Section C: Other Appliances Καηαγξάθνληαη δεδνκέλα γηα ηηο ππφινηπεο ζπζθεπέο ζην ζπίηη, φπσο ε χπαξμε πιπληεξίνπ ξνχρσλ, ν ηχπνο ηνπ (πφξηα πάλσ ή κπξνζηά), ε εβδνκαδηαία ζπρλφηεηα ρξήζεο, ε παιαηφηεηα θαη αλ είλαη θιάζεο Α, αλ ππάξρεη ζηεγλσηήξην, κε ηη θαχζηκν ιεηηνπξγεί θαη πφζν εηψλ είλαη. Αθφκε, αλ ππάξρνπλ ζεξκαληήξεο ζηξσκάησλ λεξνχ, αλ ππάξρεη πηζίλα θαη ζηελ πεξίπησζε πνπ ζεξκαίλεηαη ηη θαχζηκν ρξεζηκνπνηείηαη, αλ ε θαηνηθία δηαζέηεη Spa ή Jacuzzi θαη ηη θαχζηκν ρξεζηκνπνηείηαη, αλ ππάξρεη κεγάιν ελπδξείν, αλ ρξεζηκνπνηείηαη ζχζηεκα απηφκαηνπ πνηίζκαηνο γηα ηνλ θήπν, αλ ππάξρεη ειεθηξηθφο αθπγξαληήξαο (γηα ην ρεηκψλα) ή πγξαληήξαο (γηα ην θαινθαίξη) θαη γηα πφζνπο κήλεο ρξεζηκνπνηήζεθε ν θαζέλαο. Δπηπιένλ, αλ ζηελ θαηνηθία ππάξρνπλ consumer electronics φπσο ηειενξάζεηο, VCRs, DVD players, ερνζπζηήκαηα θηι., θαη πνηα ε ζπρλνηεηα ιεηηνπξγίαο ηνπο. Σέινο, αλ ππάξρνπλ ICT ζπζθεπέο φπσο PCs, θηλεηφ, εθηππσηήο θηι., ε ζπρλφηεηα ρξήζεο ηνπο θαη αλ ππάξρεη πξφζβαζε ζην internet. FILE4 Section D: Space Heating Πεξηιακβάλεη κεηαβιεηέο πνπ ζρεηίδνληαη κε ηε ζέξκαλζε ηεο θαηνηθίαο, φπσο πνην είλαη ην βαζηθφ θαχζηκν πνπ ρξεζηκνπνηείηαη γηα ηε ζέξκαλζε, ην είδνο θαη ε παιαηφηεηα ηνπ θχξηνπ ζπζηήκαηνο ζέξκαλζεο, ηη πνζνζηφ ηνπ ζπηηηνχ ζεξκαίλεηαη απφ απηφ, αλ έρεη ζεξκνζηάηε, αλ είλαη πξνγξακκαηηδφκελνο θαη αλ κεηψλεη απηφκαηα ηε ζεξκνθξαζία ζέξκαλζεο ηε λχρηα θαη ηε κέξα φηαλ δελ είλαη θαλείο ζην ζπίηη, θαη αλ πξφθεηηαη γηα θεληξηθή ή απηφλνκε ζέξκαλζε. ε πεξίπησζε πνπ ππάξρεη δεπηεξεχνλ ζχζηεκα ζέξκαλζεο ηη είδνπο είλαη θαη ηη θαχζηκν ρξεζηκνπνηεί. FILE5 - Section E, F & G: Water Heating, AC and Miscellaneous Πξφθεηηαη γηα κεηαβιεηέο πνπ αθνξνχλ ηε ζέξκαλζε ηνπ λεξνχ, ην θχξην θαχζηκν πνπ ρξεζηκνπνηείηαη γηα πιχζηκν θαη κπάλην, ε παιαηφηεηα ηνπ ζπζηήκαηνο ζέξκαλζεο λεξνχ θαη αλ απηφ ρξεζηκνπνηείηαη απνθιεηζηηθά γηα ηελ θαηνηθία, πφζν ρξφλν ρξεηάδεηαη γηα λα δεζηάλεη ην λεξφ, πνην ην κέγεζνο ηεο δεμακελήο λεξνχ θαη αλ ππάξρεη δεπηεξεχνλ ζχζηεκα ζέξκαλζεο λεξνχ.

42 40 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Αθφκε, πεξηιακβάλνληαη δεδνκέλα γηα ηνλ θιηκαηηζκφ ηνπ ζπηηηνχ φπσο ην αλ ε θαηνηθία δηαζέηεη ζχζηεκα θιηκαηηζκνχ, ηη ηχπνπ (θεληξηθφ, μερσξηζηέο κνλάδεο ή θαη ηα δχν), πφζα δσκάηηα δξφζηδε θαη πφζν δνχιεςε ην ηειεπηαίν θαινθαίξη, αλ ην ζχζηεκα είλαη θεληξηθφ ή απηφλνκν, αλ δηαζέηεη πξνγξακκαηηδφκελν ζεξκνζηάηε, ε παιαηφηεηα ηεο πιένλ ρξεζηκνπνηνχκελεο θιηκαηηζηηθήο κνλάδαο, αλ είλαη θιάζεο Α θαη ε ζπρλφηεηα ιεηηνπξγίαο ηεο. Σέινο, αλαγξάθνληαη θαη θάπνηα γεληθά ζηνηρεία φπσο πφζνη ιακπηήξεο εζσηεξηθνχ ρψξνπ είλαη αλακκέλνη πάλσ απφ 12 ψξεο ην θαινθαίξη, πφζνη κεηαμχ 4 θαη 12 σξψλ, πφζνη κεηαμχ 1 θαη 4 σξψλ, πφζνη θαηά πεξίπησζε είλαη ιακπηήξεο εμνηθνλφκεζεο ελέξγεηαο, πφζα θψηα κέλνπλ αλακκέλα φιε λχρηα, πφζεο ζπξφκελεο πφξηεο θαη πφζα παξάζπξα δηαζέηεη ε θαηνηθία, ν ηχπνο ηδακηψλ ζηα παξάζπξα (κνλά, δηπιά, ηξηπιά), πφζν θαιά κνλσκέλν είλαη ην ζπίηη θαη αλ είλαη επάεξν. FILE6 Section H: Fuels Used and Fuel Payment Πεξηιακβάλεη δεδνκέλα γηα ην αλ ζηελ θαηνηθία ρξεζηκνπνηείηαη ειεθηξηθφ ξεχκα, ειηαθή ελέξγεηα ή/θαη θαχζηκα φπσο θπζηθφ αέξην, πεηξέιαην, θεξνδίλε, μχιν, θαη αλ ρξεζηκνπνηνχληαη γηα ζέξκαλζε, θιηκαηηζκφ, δέζηακα λεξνχ, καγείξεκα ή γηα θάπνην άιιν ιφγν. Αθφκε, πνηνο πιεξψλεη ηνπο ινγαξηαζκνχο γηα ηα πξνεγνχκελα (ν έλνηθνο/θάηνρνο ηεο θαηνηθίαο, αλ πεξηιακβάλνληαη ζην ελνίθην ή αλ πιεξψλνληαη απφ θάπνηνλ ηξίην). Σέινο, πφζεο δηαλνκέο θαπζίκσλ έγηλαλ, απφ πφζεο εηαηξίεο θαη ζε ηη πνζφηεηεο. FILE7 Section I: Fuel Bills and Non-Residential Uses ην αξρείν απηφ θαηαγξάθνληαη ζηνηρεία γηα ηνπο πξνκεζεπηέο ησλ θαπζίκσλ, ζηνηρεία ηνπ αηφκνπ πνπ πιεξψλεη ηνπο ινγαξηαζκνχο ησλ θαπζίκσλ (ηδηνθηήηεο, ελνηθηαζηήο, ηδηνθηήηεο αθηλήηνπ αλ ζην ελνίθην ζπκπεξηιακβάλνληαη ηα έμνδα απηά). Δπηπιένλ, αλαθέξεηαη αλ ζηνπο ινγαξηαζκνχο ζπκπεξηιακβάλνληαη ρξεψζεηο πνπ δε αθνξνχλ απνθιεηζηηθά ηελ ελεξγεηαθή θαηαλάισζε ηεο θαηνηθίαο θαη ηη πνζνζηφ ηεο ζπλνιηθήο ρξέσζεο απνηεινχλ.

43 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 41 FILE8 Section J: Household Characteristics Πξφθεηηαη γηα κεηαβιεηέο πνπ αθνξνχλ θπξίσο ζε δεκνγξαθηθά ραξαθηεξηζηηθά φπσο ε ειηθία, ην θχιν, ε απαζρφιεζε (πιήξεο, κεξηθή) ηνπ λνηθνθχξε, αλ δεη κφλνο ή κε ζχδπγν/ζχληξνθν, αλ είλαη Ιζπαλφθσλνο ή Λαηίλνο, ε θπιή ηνπ, ν αξηζκφο ησλ αηφκσλ πνπ κέλνπλ απνθιεηζηηθά ζην ζπίηη, ε ειηθία ηνπ κεγαιχηεξνπ κέινπο εθηφο απφ ηνλ λνηθνθχξε, ε ειηθία ηνπ κηθξφηεξνπ, ε πεγή εζφδσλ ηνπ λνηθνθπξηνχ (εξγαζία κειψλ ηνπ, ζχληαμε, θξαηηθή βνήζεηα) θαη πνην ην ζπλνιηθφ εηζφδεκα ηνπ λνηθνθπξηνχ ην ηειεπηαίν έηνο. Αθφκε, αλ ζηελ θαηνηθία ζηεγάδεηαη θάπνηα επηρείξεζε ή ιακβάλεη ρψξα θάπνηα δξαζηεξηφηεηα πνπ θαηαλαιψλεη πνιχ ελέξγεηα. FILE9 - Section K & L: Energy Assistance and Housing Unit Square Footage Σα δεδνκέλα ζην Section Κ αθνξνχλ λνηθνθπξηά πνπ ρξήδνπλ νηθνλνκηθήο βνήζεηαο απφ ην Low Income Home Energy Assistance (LIHEAP). Αλαθέξεηαη πφζν ζπρλά αλεζπρνχζαλ φηη δε ζα κπνξέζνπλ λα πιεξψζνπλ ηνπο ινγαξηαζκνχο ελέξγεηαο, αλ πιεξψζαλε φιν ή ηκήκα ηνπ ινγαξηαζκνχ, αλ ρξεηάζηεθε λα δαλεηζηνχλ γη απηφ, αλ δέρηεθαλ απεηιή γηα δηαθνπή ηεο παξνρήο ηνπ ειεθηξηθνχ ξεχκαηνο ή ηεο δηαλνκήο θαπζίκνπ, αλ έγηλε δηαθνπή ηνπ ειεθηξηθνχ ξεχκαηνο, πφζεο θνξέο, πνηνπο κήλεο θαη πφζεο κέξεο ζπλνιηθά. ην Section L, πεξηιακβάλνληαη κεηαβιεηέο πνπ αθνξνχλ ζην ζεξκαηλφκελν ρψξν ηεο θαηνηθίαο (ζε feet 2 ), ην ζρήκα θαη ην κέγεζνο θάζε νξφθνπ, θαζψο θαη ηεο ζνθίηαο θαη ηνπ ππνγείνπ. FILE10 - Characteristics of Energy Supplier Data Πεξηέρεη ζηνηρεία ησλ παξφρσλ ειεθηξηθήο ελέξγεηαο θαη ησλ πξνκεζεπηψλ θαπζίκσλ. FILE11 Energy Consumptions Πεξηιακβάλεη ηηο πνζφηεηεο ηεο ειεθηξηθήο ελέξγεηαο θαη ησλ θαπζίκσλ πνπ θαηαλαιψζεθαλ γηα ην έηνο 2005.

44 42 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ FILE12 Energy Expenditures Αθνξά ζηα πνζά πνπ δαπαλήζεθαλ αλά θαηεγνξία θαπζίκνπ γηα ρξήζεηο φπσο ζέξκαλζε, θιηκαηηζκφο θαη ειεθηξηθέο ζπζθεπέο. Α. Αλαιπηηθφηεξα, ην ζχλνιν ησλ κεηαβιεηψλ παξνπζηάδεηαη ζην Παξάξηεκα 3.3. Prior Knowledge ηα δεδνκέλα ηεο RECS 2005 ζηεξίρζεθε ε δηπισκαηηθή ηεο Μπξζίλεο Κνκλελνχ [KOM10] πνπ ζαλ ζηφρν είρε ηελ εμαγσγή ηνπ βέιηηζηνπ δπλαηνχ κνληέινπ γηα ηελ πξφβιεςε θνξηίνπ κε ηελ εθαξκνγή ηερληθψλ Δμφξπμεο Γεδνκέλσλ. Υξεζηκνπνηψληαο ην παξαθάησ ζχλνιν δεδνκέλσλ θαηέιεμε κε ρξήζε ηνπ Bagging ζε correlation coefficient ηεο ηάμεο ηνπ 0,79 γηα εηήζηα θαηαλάισζε έσο kwh. Variable Variable Label 1 LRGSTATE Four largest states 2 TYPEHUQ Type of housing unit 3 HD65 Heat Deg-Days: Base65 01 to CD65 Cool Deg-Days: Base65 01 to WALLTYPE Exterior wall construction Material 6 BEDROOMS Number of bedrooms 7 TOTROOMS Total number of rooms in house 8 BASEHEAT Portion of basement heated 9 BASECOOL Portion of basement air-conditioned 10 ATTCHEAT Portion of attic heated 11 ATTCCOOL Portion of attic air-conditioned 12 GARGHEAT Garage heated 13 GARGCOOL Garage air-conditioned 14 KOWNRENT Housing unit owned or rented 15 YEARMADE Construction Year of the housing unit 16 URBRUR Home located at an urban or rural area 17 STOVEN Stove with both burners and one or two ovens 18 STOVE Separate built-in range top or burners 19 OVEN Separate built-in oven 20 STOVENFU Same fuel used for both burners and oven 21 STOVENAB Fuel used for the burners 22 STOVENAO Fuel used for the oven 23 OVENA Fuel used for the separate built-in oven

45 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 43 Variable Variable Label 24 OVENUSE Frequency of oven operation 25 STOVEA Fuel used for the separate built-in range top 26 TOPGRILL Built-in or stove-top grill 27 STGRILA Fuel used for built-in or stove-top grill 28 MICRO Microwave oven used for cooking 29 AMTMICRO Portion of food cooked in the microwave 30 TOASTER Electric toaster ovens 31 TSTRFRQ Frequency of toaster oven usage 32 FUELFOOD Fuel used most for cooking 33 COFFEE Electric coffee makers 34 NUMFRIG Number of refrigerators 35 SIZRFRI1 Size of 1 st refrigerator 36 AGERFRI1 Age of 1 st refrigerator 37 SIZRFRI2 Size of 2 nd refrigerator 38 AGERFRI2 Age of 2 nd refrigerator 39 NUMFREEZ Number of freezers 40 SIZFREEZ Size of freezer 41 AGEFRZR Age of freezer 42 DISHWASH Presence of automatic dishwasher 43 DWASHUSE Frequency of dishwasher weekly usage 44 AGEDW Age of dishwasher 45 CWASHER Clothes washer 46 WASHLOAD Loads of laundry per week 47 AGECWASH Age of clothes washer 48 DRYER Dryer 49 DRYRFUEL Fuel used for dryer 50 DRYRUSE Frequency of dryer usage 51 AGECDRYER Age of dryer 52 NUMCFAN Number of ceiling fans 53 USECFAN Frequency of most-used ceiling fan operation 54 SWIMPOOL Swimming pool with filtering system 55 FUELPOOL Fuel used to heat the swimming pool 56 RECBATH Heated hot tub spa 57 FUELTUB Fuel used for hot tub spa 58 TVCOLOR Number of TV sets 59 VCR Number of VCRs 60 DVD Number of DVD players 61 PLAYSTA Television-based game systems 62 PLYSTAHRS Weekly hours game systems are used 63 TVONWD Daily hours of TV operation during weekdays 64 TVONWE Daily hours of TV operation during weekends 65 NOTMOIST Electric dehumidifier (during summer) 66 USENOTMOIS Number of months dehumidifier used per year 67 MOISTURE Electric humidifier (during winter) 68 USEMOISTURE Number of months humidifier used per year 69 COMPUTER Personal computer 70 NUMPC Number of PCs

46 44 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Variable Variable Label 71 TIMEON1 Hours per week PC is ON 72 EQUIPAGE Age of household s heating system 73 TEMPHOME Thermostat setting/someone home during day 74 TEMPGONE Thermostat setting/no one home during day 75 TEMPNITE Thermostat setting during sleeping hours 76 HEATOFF Frequency of heating system operation 77 FUELHEAT Main fuel used for heating home 78 WHEATSIZ Size of main water heater tank 79 WHEATAGE Age of main water heater 80 AIRCOND Air-conditioning equipment 81 ACROOMS Number of rooms air-conditioned 82 AGECENAC Age of central AC equipment 83 USECENAC Frequency of central AC system operation 84 TEMPHOMEAC AC temperature/someone home during day 85 TEMPGONEAC AC temperature/ no one home during day 86 TEMPNITEAC AC temperature during sleeping hours 87 NUMBERAC Number of window or wall AC units 88 WWACAGE Age of most used window or wall unit 89 USEWWAC Frequency of window/wall AC during summer 90 LGT12 Lights turned on more than 12h/day 91 LGT12EE Energy efficient bulbs on more than 12h/day 92 NOUTLGTNT Number of outdoor lights on all night 93 DOOR1SUM Number of sliding glass doors 94 WINDOWS Number of windows 95 TYPEGLASS Type of window glass 96 FUELH2O Fuel used for heating water/washing/bathing 97 ELWARM Electricity used for space heating 98 ELFOOD Electricity used for cooking 99 ELWATER Electricity used for heating water 100 ELCOOL Electricity used for space cooling 101 HBUSNESS Home-based business or service at home 102 SDESCENT Householder Hispanic or Latino 103 ORIGIN1 Householder s race 104 NHSLDMEM Number of household members 105 AGEHHMEM1 Householder s age 106 AGEHHMEM2 Age of the next oldest household member 107 AGEHHMEMY Age of the youngest household member 108 MONEYPY Annually combined income 109 SQFTEST Estimate of heated square footage 110 KWH Annually used kwh

47 Αξηζκφο θαηνηθηψλ Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά Υποθέζειρ ωρ ππορ ηιρ κλάζειρ Σν κνληέιν πνπ ζα πξνθχςεη απφ ηνλ αιγφξηζκν εθκάζεζεο, ζα πξέπεη λα θαηεγνξηνπνηεί ηνπο θαηαλαισηέο θαηά ηέηνην ηξφπν ψζηε ηα ραξαθηεξηζηηθά θάζε νκάδαο θαηαλαισηψλ λα δηαηεξνχλ ηελ πνζνηηθή δηαθνξά κεηαμχ ησλ θιάζεσλ θαη λα έρνπλ λφεκα. ηελ Δηθφλα 3-1, παξνπζηάδεηαη ε θαηαλνκή ηνπ αξηζκνχ ησλ θαηνηθηψλ σο πξνο ην εηήζην θνξηίν ηνπο ζην δηάζηεκα ηηκψλ [48, 72125]. Δμεηάδνληαο ην ζχλνιν ησλ δεδνκέλσλ, θαηαιήγνπκε φηη νη θιάζεηο ζα δηαθνξνπνηνχληαη αλάινγα κε ηελ χπαξμε θαη ηε ζπρλφηεηα ρξήζεο ελεξγνβφξσλ ζπζθεπψλ ζηηο θαηνηθίεο, ηνλ αξηζκφ θαη ηελ ειηθία ησλ κειψλ θάζε λνηθνθπξηνχ, ηηο θιηκαηηθέο ηδηαηηεξφηεηεο πνπ πξνθχπηνπλ απφ ηε γεσγξαθηθή ζέζε θαη ηηο δηαζέζηκεο πεγέο ελέξγεηαο ζε θάζε πεξηνρή Δηήζηα ειεθηξηθή θαηαλάισζε (kwh) Δικόνα Καηανομή απιθμού καηοικιών ωρ ππορ ηην εηήζια καηανάλωζη

48 46 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Ύπαπξη και ζςσνόηηηα σπήζηρ ενεπγοβόπων ζςζκεςών Δθφζνλ θάζε θιάζε ζα αληηζηνηρεί ζε δηαθνξεηηθφ εχξνο ηηκψλ ειεθηξηθήο θαηαλάισζεο, αλακέλεηαη φηη θαζψο νη kwh κεηαβάιινληαη απφ 48 ζε 72125, ζα πιεζαίλνπλ νη ελεξγνβφξεο ζπζθεπέο πνπ δηαζέηεη ην λνηθνθπξηφ ή/θαη ζα απμάλεηαη ν αξηζκφο θαη ε ρξήζε ησλ ππνινίπσλ ειεθηξηθψλ ζπζθεπψλ. ην Γεληθφ Μνληέιν Οηθηαθψλ πζθεπψλ, ζην Power TAC Wiki [URL2], παξνπζηάδνληαη νξηζκέλα ραξαθηεξηζηηθά πνπ ζπλαληψληαη ζηηο ειεθηξηθέο ζπζθεπέο κεηαμχ ησλ νπνίσλ θαη ηα παξαθάησ: Saturation Πξφθεηηαη γηα έλα ζηαηηζηηθφ κέηξν θαη δίλεη ηελ πηζαλφηεηα λα είλαη εγθαηεζηεκέλε κηα ειεθηξηθή ζπζθεπή ζε κία θαηνηθία. Παίξλεη ηηκέο ζην δηάζηεκα [0,1]. Consumption Share Γίλεη ην πνζνζηφ επί ηνπ εηήζηνπ ειεθηξηθνχ θνξηίνπ ελφο λνηθνθπξηνχ πνπ θαηαλαιψλεη κηα ζπζθεπή. Παίξλεη ηηκέο ζην δηάζηεκα [0,1] θαη ην άζξνηζκα ησλ πνζνζηψλ φισλ ησλ ειεθηξηθψλ ζπζθεπψλ κίαο θαηνηθίαο ηζνχηαη κε 1. Base Load Share Δίλαη κεηαβιεηή θαη δειψλεη ην πνζνζηφ κηαο ζπζθεπήο ζε stand-by mode επί ηνπ κέζνπ ζπλνιηθνχ θνξηίνπ ελφο λνηθνθπξηνχ ζε stand-by mode. Παίξλεη ηηκέο ζην δηάζηεκα [0,1] θαη ην άζξνηζκα ησλ πνζνζηψλ φισλ ησλ ειεθηξηθψλ ζπζθεπψλ κίαο θαηνηθίαο ηζνχηαη κε 1. Average Power Load Η ζπγθεθξηκέλε κεηαβιεηή αληηπξνζσπεχεη ηε κέζε θαηαλάισζε ηζρχνο κηαο ζπζθεπήο θαηά ηε δηάξθεηα ιεηηνπξγίαο ηεο. ηνλ Πίλαθα 3-1, θαηαγξάθνληαη νη ηηκέο ησλ παξαπάλσ ραξαθηεξηζηηθψλ γηα ηηο θπξηφηεξεο ειεθηξηθέο ζπζθεπέο κηαο θαηνηθίαο. Απφ ηα ζηνηρεία απηά κπνξνχκε λα ππνζέζνπκε γηα παξάδεηγκα φηη ηα λνηθνθπξηά ζηηο ρακειφηεξεο ελεξγεηαθέο θιάζεηο πιπληήξην πηάησλ. πηζαλφλ λα κε δηαζέηνπλ ζηεγλσηήξην ξνχρσλ θαη

49 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 47 Πίνακαρ Υαπακηηπιζηικά οικιακών ηλεκηπικών ζςζκεςών Appliance Saturation [%] Consumption Share [%] Base Load Share [%] Average Power Load [W] Space Heater Storage Water Heater Dryer 42 2,5 1, Freezer 54 7, Dishwasher 66 3, Stove 85 8, Washing Machine 97 3, ICT Consumer Electronics Refrigerator Αθφκε, απφ ηα δεδνκέλα ηεο RECS πξνθχπηεη φηη ζε φιεο ζρεδφλ ηηο θαηνηθίεο ππάξρεη ειεθηξηθή ζπζθεπή γηα ηελ παξαζθεπή θαγεηνχ θαη ςπγείν. ηελ πξψηε πεξίπησζε, είηε πξφθεηηαη γηα ειεθηξηθή θνπδίλα είηε γηα μερσξηζηέο εζηίεο θαη θνχξλν, αλακέλνπκε φηη ε ζπρλφηεηα ρξήζεο ηεο ζπζθεπήο είλαη πνπ επεξεάδεη ηε ζπλνιηθή θαηαλάισζε ηνπ λνηθνθπξηνχ. ηε δεχηεξε πεξίπησζε, ζεκαληηθφ ξφιν αλακέλεηαη λα παίδεη ε παιαηφηεηα πνπ ζπλδέεηαη άκεζα κε ηελ απνδνηηθφηεηα ηεο ζπζθεπήο. Δλδεηθηηθά, απφ ηηο 4382 θαηνηθίεο κφιηο ην 37% δηαζέηεη ςπγείν ηεο ηειεπηαίαο ηεηξαεηίαο, εθ ηνλ νπνίσλ ην 58% αλήθνπλ ζηελ ελεξγεηαθή θιάζε Α. Δπίζεο, ζην 75% ησλ λνηθνθπξηψλ πνπ έρνπλ θαη δεχηεξν ςπγείν ε παιαηφηεηα ηνπ μεπεξλάεη ηα 5 έηε. Δπηπιένλ, ζπζθεπέο φπσο ην πιπληήξην ξνχρσλ θαη ην πιπληήξην πηάησλ θαηαλαιψλνπλ κεγάια πνζά ειεθηξηθήο ηζρχνο ηα νπνία απμάλνληαη κε ηε ζπρλφηεξε ρξήζε θαη κε ηελ παιαηφηεηα ηεο ζπζθεπήο.

50 48 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Σέινο, εηδηθά ηα ηειεπηαία δέθα ρξφληα, ε ζπλνιηθή θαηαλάισζε κεηαηνπίδεηαη ζεκαληηθά αλάινγα κε ηνλ αξηζκφ ησλ ICT ζπζθεπψλ (pc, θηλεηά ηειέθσλα, fax θηι) θαζψο θαη ησλ consumer electronics (VCR, DVD, DVR, PlayStation θηι). Απφ θνηλνχ νη δχν απηέο θαηεγνξίεο ζπζθεπψλ επζχλνληαη γηα ην 95% πεξίπνπ ηνπ ζπλνιηθνχ θνξηίνπ φισλ ησλ ζπζθεπψλ κηαο θαηνηθίαο ζε stand-by mode Απιθμόρ και ηλικία μελών νοικοκςπιού ην [GOT10] παξαηίζεηαη ν Πίλαθαο 3.2 (πεγή Statistisches Bundesampt 2009) πνπ δίλεη ηε κέζε εηήζηα θαηαλάισζε ζηε Γεξκαλία γηα δηαθνξεηηθφ αξηζκφ κειψλ ελφο λνηθνθπξηνχ. Καζψο απμάλεηαη ν αξηζκφο ησλ αηφκσλ ζε κηα θαηνηθία, παξαηεξείηαη αλάινγε ζπκπεξηθνξά ζηηο εηήζηεο kwh πνπ θαηαλαιψλνληαη. Αθφκε, ην 73% ησλ λνηθνθπξηψλ θαηνηθείηαη απφ 1 ή 2 άηνκα θαη φζν απμάλεηαη ν αξηζκφο ησλ κειψλ ηνπ λνηθνθπξηνχ κεηψλεηαη ε ελέξγεηα αλά θάηνηθν. Πίνακαρ Μέγεθορ και μέζη εηήζια καηανάλωζη ηων νοικοκςπιών ζηη Γεπμανία Household size Share [%] Average annual consumption [kwh] 1 person persons persons persons >4 persons ηνλ Πίλαθα 3.3 παξνπζηάδνληαη ηα αληίζηνηρα δεδνκέλα απφ ηε RECS. Οη θαηαλαιψζεηο είλαη αξθεηά απμεκέλεο θαη απηφ κπνξεί λα νθείιεηαη ζην γεγνλφο φηη νη θαηνηθίεο ζηηο H.Π.Α. (64% ηνπ δείγκαηνο ήηαλ θαηνηθίεο singlefamily detached) είλαη θαηά κέζν φξν κεγαιχηεξεο ζε ζρέζε κε ηελ Δπξψπε, άξα ζα απαηηείηαη πεξηζζφηεξε ελέξγεηα γηα ζέξκαλζε, θιηκαηηζκφ θαη ειεθηξηθέο ζπζθεπέο. Αθφκε, αλ ζηα κέιε ηνπ λνηθνθπξηνχ ζπκπεξηιακβάλνληαη παηδηά ή έθεβνη, ηφηε είλαη πηζαλφ λα καγεηξεχνληαη δεζηά γεχκαηα ηνπιάρηζηνλ κηα θνξά ηελ εκέξα θαη λα ρξεζηκνπνηνχληαη ζπρλφηεξα ζπζθεπέο φπσο ην πιπληήξην ξνχρσλ θαη ην ζηεγλσηήξην. Δηδηθφηεξα, αλ ην παηδί είλαη θάησ ησλ

51 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 49 6 εηψλ, ππάξρεη πηζαλφηεηα λα επηβιέπεηαη ζην ζπίηη απφ θάπνηνλ ελήιηθα, γεγνλφο πνπ ζα δηαθνξνπνηεί ηηο ξπζκίζεηο ηνπ ζεξκνζηάηε είηε πξφθεηηαη γηα ηε ζέξκαλζε είηε γηα ηελ ςχμε ηεο θαηνηθίαο. Σέινο, ε θαηάζηαζε εξγαζίαο (πιήξεο απαζρφιεζε, εκηαπαζρφιεζε, κε απαζρφιεζε) ησλ ελειίθσλ κειψλ ηνπ λνηθνθπξηνχ επεξεάδεη ηελ παξνπζία ηνπο ζηελ θαηνηθία θαη ζπλεπψο ηελ ειεθηξηθή θαηαλάισζε. Πίνακαρ Μέγεθορ και μέζη ηιμή εηήζιαρ καηανάλωζηρ ηων νοικοκςπιών (RECS) Household size Share [%] Mean annual consumption [kwh] 1 person 23, persons 32, persons 17, persons 15, >4 persons 11, Κλιμαηολογικοί παπάγονηερ Η γεσγξαθηθή ζέζε κηαο πεξηνρήο ζπλδέεηαη άκεζα κε θιηκαηνινγηθνχο παξάγνληεο φπσο ε ζεξκνθξαζία, ε ειηνθάλεηα θαη ε πγξαζία, νη νπνίνη κε ηε ζεηξά ηνπο επεξεάδνπλ ηελ ειεθηξηθή θαηαλάισζε αλά πεξηνρή. ηελ Δηθφλα 3.2, παξνπζηάδνληαη νη πεξηνρέο πνπ έιαβε ρψξα ε RECS. Απφ ηα δεδνκέλα πξνθχπηεη φηη νη λφηηεο πεξηθέξεηεο έρνπλ κέζε ηηκή ειεθηξηθήο θαηαλάισζεο ηηο 15164,41 kwh, ηηκή πνπ ππεξβαίλεη θαηά πνιχ ηηο αληίζηνηρεο θαηαλαιψζεηο απφ ηηο άιιεο πεξηθέξεηεο. Απηφ νθείιεηαη ζην γεγνλφο φηη ζηηο ζπγθεθξηκέλεο πεξηνρέο ρξεζηκνπνηείηαη ζε κεγάιν πνζνζηφ ειεθηξηθφ ξεχκα γηα ηε ζέξκαλζε ησλ θαηνηθηψλ ζε αληίζεζε κε ηελ ηάζε πνπ ππάξρεη ζηα λνηθνθπξηά ησλ Η.Π.Α. λα ρξεζηκνπνηνχλ θπζηθφ αέξην γηα ην ζθνπφ απηφ. Δπηπιένλ, ην θαινθαίξη ρξεζηκνπνηείηαη ειεθηξηζκφο γηα ηνλ θιηκαηηζκφ ησλ θαηνηθηψλ. Παξφκνηα ζπκπεξηθνξά παξαηεξείηαη θαη ζηηο πεξηνρέο ηεο Νφηηαο Διιάδαο φπνπ ε ειεθηξηθή θαηαλάισζε παξνπζηάδεη peaks, ηνπο θαινθαηξηλνχο κήλεο ιφγσ ηεο ρξήζεο θιηκαηηζηηθψλ θαη ηνπο ρεηκεξηλνχο ιφγσ ηεο ιεηηνπξγίαο ειεθηξηθψλ ζσκάησλ ή ζεξκνπνκπψλ. Δπηπιένλ, ην γεσγξαθηθφ πιάηνο θαζνξίδεη θαη ηελ ειηνθάλεηα κηαο πεξηνρήο, παξάγνληαο πνπ κεηαβάιιεη ηηο αλάγθεο γηα θσηηζκφ θαζψο θαη ηηο

52 50 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ ξπζκίζεηο ηνπ ζεξκνζηάηε. Σέινο, ην πνζνζηφ πγξαζίαο ζε κία πεξηνρή κπνξεί λα επεξεάζεη ηνλ ηχπν ζπζθεπψλ κηαο θαηνηθίαο, γηα παξάδεηγκα ρξήζε ειεθηξηθνχ αθπγξαληήξα/πγξαληήξα. Δικόνα 3.2 Πεπιοσέρ διεξαγωγήρ RECS 1 Δικόνα 3.3 Ποιοηικόρ σάπηηρ θεπμοκπαζιών ςγπαζίαρ ζηιρ Η.Π.Α

53 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά Τοπικά διαθέζιμερ πηγέρ ενέπγειαρ Η θαηαλάισζε ειεθηξηθήο ελέξγεηαο αλακέλεηαη λα επεξεάδεηαη απφ ηελ χπαξμε δηθηχνπ θπζηθνχ αεξίνπ θαη Α.Π.Δ. ζηελ πεξηνρή. Απφ ηα δεδνκέλα ηεο RECS πξνθχπηεη φηη ζην 72% ησλ θαηνηθηψλ πνπ εμεηάδνληαη ππάξρεη δίθηπν θπζηθνχ αεξίνπ -φπσο θαίλεηαη θαη απφ ηελ Δηθφλα ελψ κφιηο ην 0,2% ρξεζηκνπνηεί ειηαθή ελέξγεηα. Αλαιπηηθφηεξα, ζηηο πεξηνρέο πνπ ππάξρεη δίθηπν, ην θπζηθφ αέξην ρξεζηκνπνηείηαη ζε πνζνζηφ 72% γηα ζέξκαλζε θαη 71% γηα δέζηακα λεξνχ. Αληίζεηα, ζηηο πεξηνρέο πνπ δελ ππάξρεη πξφζβαζε ζε παξνρή θπζηθνχ αεξίνπ κέζσ ζσιήλσλ (ην 62% ησλ θαηνηθηψλ ρσξίο δίθηπν βξίζθεηαη ζε πξνάζηην ή ζηελ χπαηζξν), ην 54% ρξεζηκνπνηεί ειεθηξηθφ ξεχκα γηα ζέξκαλζε θαη ην 79% γηα δέζηακα ηνπ λεξνχ. Δικόνα 3.4 Υάπηηρ δικηύος αγωγών θςζικού αεπίος ζηιρ Η.Π.Α. 3 3 Source: EIA, Office of Oil and Gas, Natural Gas Division, Gas Transportation InformationSystem,http://www.eia.gov/pub/oil_gas/natural_gas/analysis_publications /ngpipeline/ngpipelines_map.html

54 52 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ

55 Κεθάλαιο 4. Δξαγωγή μονηέλων καηηγοπιοποίηζηρ καηαναλωηών 4.1. Μεθοδολογία ην παξφλ θεθάιαην παξνπζηάδεηαη ε δηαδηθαζία πνπ αθνινπζήζεθε γηα ηελ εμαγσγή ησλ κνληέισλ θαηεγνξηνπνίεζεο κε ρξήζε ηνπ ινγηζκηθνχ Weka [HAL09] (ζπλνπηηθή πεξηγξαθή δίλεηαη ζην Παξάξηεκα ΙΙ). Αξρηθά, παξνπζηάδνληαη ηα απνηειέζκαηα πνπ πξνέθπςαλ απφ ηελ εθαξκνγή αιγφξηζκσλ θαηεγνξηνπνίεζεο ηνπ Weka γηα ηα δηάθνξα datasets πνπ δεκηνπξγήζεθαλ. Ιδηαίηεξε έκθαζε δφζεθε ζηελ θάιπςε φζν ην δπλαηφλ κεγαιχηεξνπ εχξνπο ηηκψλ θαηαλάισζεο θαη ζηελ αληηκεηψπηζε ηνπ class imbalance problem πνπ πξνθαιείηαη απφ ηελ άληζε θαηαλνκή ζηηγκηνηχπσλ ζηηο θιάζεηο. Έπεηηα, παξνπζηάδνληαη ηα κνληέια πνπ πξνέθπςαλ, θαηαγξάθνληαη νη θαλφλεο θαηεγνξηνπνίεζεο πνπ απνξξένπλ απφ απηά θαη εξκελεχνληαη ηα ραξαθηεξηζηηθά πνπ αληηζηνηρνχλ ζε θάζε θιάζε. Σέινο, ρξεζηκνπνηνχληαη meta-classifiers θαη ensemble methods γηα ηελ πεξαηηέξσ βειηίσζε ησλ απνηειεζκάησλ.

56 54 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ 4.2. Classification ηα πεηξάκαηα πνπ αθνινπζνχλ σο class attribute νξίζηεθε ε κεηαβιεηή- KWh ε νπνία δηαθξηηνπνηήζεθε κε κεηαβαιιφκελε παξάκεηξν ηνλ αξηζκφ ησλ bins. ην Equal-interval binning, ην εχξνο ηηκψλ ηεο κεηαβιεηήο πνπ νξίδεηαη σο θιάζε, ρσξίδεηαη ζε ίζα δηαζηήκαηα αλάινγα κε ηνλ αξηζκφ ησλ bins πνπ έρεη επηιέμεη ν ρξήζηεο. ην Equal-frequency binning, ηα ζηηγκηφηππα ρσξίδνληαη ζε bins κε ηέηνην ηξφπν ψζηε θάζε θιάζε λα πεξηέρεη ίζν αξηζκφ ζηηγκηνηχπσλ. Η ηειεπηαία κέζνδνο παξφηη δνθηκάζηεθε δελ έδσζε ηθαλνπνηεηηθά απνηειέζκαηα γη απηφ θαη δελ παξνπζηάδεηαη παξαθάησ. Γηα ηελ εθηίκεζε ηεο απφδνζεο ηνπ κνληέινπ θαηεγνξηνπνίεζεο, ρξεζηκνπνηήζεθε ε ηερληθή 10-fold cross-validation θαηά ηελ νπνία ηα δεδνκέλα ρσξίδνληαη ζε 10 ίζα ζχλνια θαη ζε θάζε επαλάιεςε επηιέγεηαη έλα γηα testing θαη ηα ππφινηπα 9 γηα training. ην ηέινο, θάζε ζηηγκηφηππν έρεη ρξεζηκνπνηεζεί αθξηβψο κία θνξά γηα testing θαη ην ζπλνιηθφ ζθάικα βξίζθεηαη αζξνίδνληαο ηα επηκέξνπο ζθάικαηα πνπ πξνέθπςαλ ζε θάζε επαλάιεςε. Αθφκε, γηα ηελ αληηκεηψπηζε ηνπ class imbalance problem ρξεζηκνπνηήζεθε ε ηερληθή SMOTE (Synthetic Minority Oversampling Technique) [CHA02] θαηά ηελ νπνία ζπλζέηνληαη ζηηγκηφηππα κε ηε ρξήζε ηνπ αιγφξηζκνπ k-nn γηα ηελ θιάζε κε ηα ιηγφηεξα ζηηγκηφηππα. Σέινο, ζηα επφκελα πεηξάκαηα φπνπ αλαθέξεηαη ε κεηαβιεηή NHSLDΜΔΜ πνπ αληηπξνζσπεχεη ηνλ αξηζκφ ησλ κειψλ ελφο λνηθνθπξηνχ, ρξεζηκνπνηείηαη ε νκαδνπνίεζε πνπ πεξηγξάθεθε ζην Κεθάιαην Καηανάλωζη έωρ kwh (4334 instances) Αξρηθά, δεκηνπξγήζεθε ην 110attr_35000.arff, ην βέιηηζην dataset ζχκθσλα κε ην [KOM10]. Σα απνηειέζκαηα παξνπζηάδνληαη ζηνλ Πίλαθα 4.1. Ωζηφζν, αλ θαη ηα πνζνζηά επηηπρίαο είλαη θαιά, απφ ηηο ηηκέο TPR γηα θάζε θιάζε πξνέθπςε φηη ζηηγκηφηππα πνπ αληηζηνηρνχλ ζε θιάζεηο κε θαηαλαιψζεηο άλσ ησλ kwh απνηπγράλνπλ λα θαηεγνξηνπνηεζνχλ ζσζηά. Αθφκε, ρξεζηκνπνηήζεθε ε νκαδνπνίεζε NHSLDMEM πξνθχςνπλ θαιχηεξα απνηειέζκαηα. ρσξίο λα

57 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 55 Πίνακαρ Αποηελέζμαηα για 110attr_35000.arff Αλγόπιθμοι BFTree DecisionStump FT J48 J48graft LADTree NBTree RandomTree REPTree SimpleCart SMO Multilayer Perceptron IB1 Απιθμόρ bins Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error Σέινο, νη αιγφξηζκνη SMO θαη LADTree φπσο θαίλεηαη απφ ηνλ Πίλαθα 1.1 έδσζαλ ηα θαιχηεξα απνηειέζκαηα. Δληνχηνηο δε ρξεζηκνπνηήζεθαλ ζηε ζπλέρεηα γηα ηνπο εμήο ιφγνπο: Η θάζε εθπαίδεπζεο κε ηε ρξήζε ηνπ SMO έρεη κεγάιε ρξνληθή δηάξθεηα. Αθφκε, ηα κε γξακκηθά φξηα πνπ βξίζθεη ν αιγφξηζκνο γηα ην δηαρσξηζκφ ησλ θιάζεσλ, δελ έρνπλ θπζηθή ζεκαζία γηα ην ζπγθεθξηκέλν πξφβιεκα.

58 56 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Δπεηδή ν LADTree αλήθεη ζηα alternating δέλδξα απφθαζεο, νη θαλφλεο πνπ εμάγνληαη απφ ην δέλδξν δελ είλαη ακνηβαίσο απνθιεηφκελνη κε ηελ έλλνηα φηη θάζε ζηηγκηφηππν κπνξεί λα θαηαιήμεη ζε δχν δηαθνξεηηθά θχιια ηνπ δέλδξνπ κε δηαθνξεηηθή θαηεγνξηνπνίεζε Καηανάλωζη έωρ kwh (4382 instances) αλ δεχηεξε πξνζέγγηζε, επηιέρζεθε λα δηεξεπλεζεί φιν ην εχξνο ησλ θαηαλαιψζεσλ απφ 48 έσο kwh. Αξρηθά, δεκηνπξγήζεθε ην 110attr_72125.arff κε 10 θιάζεηο θαη ζηε ζπλέρεηα ειαηηψζεθε ζηαδηαθά ν αξηζκφο ηνπο, έηζη ψζηε θάζε θιάζε λα πεξηέρεη αξθεηά ζηηγκηφηππα κε ζθνπφ ηελ νξζφηεξε θαηεγνξηνπνίεζε ησλ θαηαλαισηψλ. Σα απνηειέζκαηα παξνπζηάδνληαη ζηνλ Πίλαθα 4.2. Πίνακαρ Αποηελέζμαηα για 110attr_72125.arff Αλγόπιθμοι Απιθμόρ bins Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error REPTree SimpleCart ηε ζπλέρεηα, έγηλε κηα πξνζπάζεηα νκαδνπνίεζεο ησλ ειεθηξηθψλ ζπζθεπψλ πνπ παξνπζηάδνπλ παξφκνηα πξφηππα ρξήζεο κε ζθνπφ ηελ εμαγσγή aggregate πιεξνθνξίαο. Πην ζπγθεθξηκέλα: Οη κεηαβιεηέο MICRO, TOASTER θαη COFFEE αληηθαηαζηάζεθαλ απφ ηελ M/T/C ε νπνία παίξλεη ηηκή 1 φηαλ ππάξρεη έζησ θαη ε κία απφ ηηο ηξεηο ζπζθεπέο ζε κία θαηνηθία. Οη ηηκέο ησλ κεηαβιεηψλ VCR θαη DVD αζξνίζηεθαλ δεκηνπξγψληαο ηε κεηαβιεηή V/D θαζψο νη δχν απηέο ειεθηξνληθέο ζπζθεπέο έρνπλ παξφκνηα ιεηηνπξγία (5% Active, 54% Stand-by, 41% Idle).

59 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 57 Απφ ηνλ Πίλαθα 4.3 πνπ αθνξά ην 110attr_72125_mtc_vd.arff, γίλεηαη αληηιεπηφ φηη ε ζπγθεθξηκέλε νκαδνπνίεζε ειεθηξηθψλ ζπζθεπψλ δε βειηηψλεη ηα απνηειέζκαηα. Πίνακαρ Αποηελέζμαηα για 110attr_72125_mtc_vd.arff Αλγόπιθμοι Απιθμόρ bins Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error REPTree SimpleCart ην αξρηθφ dataset πξνζηέζεθαλ νη 8 κεηαβιεηέο BTUELx απφ ην FILE11 πνπ αληηπξνζσπεχνπλ ηελ εθηηκψκελε εηήζηα ειεθηξηθή ρξήζε ζε BTUs γηα ηε ζέξκαλζε ηεο θαηνηθίαο (BTUELSPH), ηε ιεηηνπξγία ηνπ θιηκαηηζηηθνχ (BTUELCOL), ηε ζέξκαλζε ηνπ λεξνχ (BTUELWTH), ηε ιεηηνπξγία ηνπ ςπγείνπ θαη ηνπ θαηαςχθηε (BTUELRFG θαη BTUELFZZ), ηνπ πιπληεξίνπ πηάησλ (BTUELDWH), ηνπ ζηεγλσηεξίνπ ξνχρσλ (BTUELCDR) θαη ηέινο ησλ ινηπψλ ειεθηξηθψλ ζπζθεπψλ (BTUELAPL). ε απηή ηελ πεξίπησζε ηα απνηειέζκαηα παξνπζηάδνληαη ζηνλ Πίλαθα 4.4. Πίνακαρ Αποηελέζμαηα για 110attr_72125_BTUEL.arff Αλγόπιθμοι Απιθμόρ bins Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error REPTree SimpleCart

60 58 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Αθφκε, γηα δηαθξηηνπνίεζε ησλ HD65 θαη CD65 κε Equal-interval binning έδσζαλ ρεηξφηεξα απνηειέζκαηα πεξίπνπ θαηά 1%. Ωζηφζν, ηα κνληέια πνπ πξνέθπςαλ εκθαλίδνπλ ην πξφβιεκα ηεο επαλάιεςεο (repetition) δειαδή έλα γλψξηζκα ειέγρεηαη ζπλερψο θαηά κήθνο ελφο δνζκέλνπ θιάδνπ ηνπ δέλδξνπ. ηε ζπγθεθξηκέλε πεξίπησζε, ηα γλσξίζκαηα απηά είλαη θπξίσο ηα BTUELAPL, BTUELCOL θαη BTUELSPH θαη απηφ ζπκβαίλεη γηαηί ε θιάζε-kwh εμαξηάηαη άκεζα απφ ηηο ηηκέο ησλ κεηαβιεηψλ BTUEL. Σέινο, γηα ηηο θιάζεηο πνπ αληηζηνηρνχλ ζε θαηαλάισζε άλσ ησλ kwh, ην TPR έπαηξλε ηηκέο αξθεηά κηθξφηεξεο ηνπ 0,5. Γηα ην ιφγν απηφ, πξνέθπςε ε αλάγθε δεκηνπξγίαο δχν δηαθνξεηηθψλ κνληέισλ γηα ηελ νξζφηεξε θαηεγνξηνπνίεζε ηνπ ζπλφινπ ησλ θαηαλαισηψλ. Όπσο παξνπζηάδεηαη ζηηο επφκελεο ππνελφηεηεο επηιέρζεθαλ δχν ζεκεία δηαρσξηζκνχ (δνθηκάζηεθαλ επηπιένλ νη θαη kwh): kwh kwh Καηανάλωζη έωρ kwh (3991 instances) ηε ζπγθεθξηκέλε ππνελφηεηα, εθαξκφδνληαη νη αιγφξηζκνη REPTree θαη SimpleCart ζε δηαθνξεηηθά datasets γηα θαηαλαιψζεηο έσο kwh. Σα θαιχηεξα απνηειέζκαηα πξνέθπςαλ γηα δηαθξηηνπνίεζε ηνπ class-attribute kwh κε 3 bins, νξίδνληαο ηηο εμήο θιάζεηο: [ ] ( ] ( ] Αξρηθά, δεκηνπξγήζεθε ην 110attr_21999.arff θαη έπεηηα, ειέγρζεθε αλ ε νκαδνπνίεζε σο πξνο ην attribute NHSLDMEM (110attr_21999_ NHSLDMEM.arff) πνπ αληηπξνζσπεχεη 5 δηαθνξεηηθά ζελάξηα ειεθηξηθήο θαηαλάισζεο, βειηηψλεη ηελ θαηεγνξηνπνίεζε. Απφ ηνλ Πίλαθα 1.5 αληηιεπηφ φηη δελ έδσζε θαιχηεξα απνηειέζκαηα. γίλεηαη

61 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 59 ηε ζπλέρεηα, ζεσξήζεθε απαξαίηεην λα ζπκπεξηιεθζνχλ ζην αξρηθφ dataset 2 επηπιένλ attributes (112attr_21999.arff), ηα παξαθάησ: UGASHERE Αθνξά ηελ χπαξμε δηθηχνπ θπζηθνχ αεξίνπ ζηελ πεξηνρή πνπ βξίζθεηαη ε θαηνηθία. Πεξίπνπ ην 50% ησλ λνηθνθπξηψλ ρξεζηκνπνηεί ην θπζηθφ αέξην σο θαχζηκν γηα ζέξκαλζε ή/θαη καγείξεκα. Άξα, είλαη πηζαλφ εληφο θιάζεσλ ρακειφηεξεο θαηαλάισζεο λα ππάξρνπλ νκάδεο λνηθνθπξηψλ κε δηαθνξεηηθά ραξαθηεξηζηηθά. Γηα παξάδεηγκα, ζε κία θαηνηθία πνπ δηακέλεη έλα άηνκν ρξεζηκνπνηείηαη απνθιεηζηηθά ειεθηξηθφ ξεχκα γηα ηε ιεηηνπξγία ησλ ζπζθεπψλ, ζε κηα άιιε δηακέλνπλ 3 άηνκα αιιά ρξεζηκνπνηείηαη επηπιένλ θπζηθφ αέξην ζαλ απνηέιεζκα θαη νη δχν θαηνηθίεο εκπίπηνπλ ζηελ ίδηα θιάζε. ATHOME Πξνζδηνξίδεη ηελ παξνπζία ή φρη αηφκνπ ζε κηα θαηνηθία θαηά ηε δηάξθεηα ηεο εκέξαο. Απφ απηφ ην γλψξηζκα επεξεάδνληαη άκεζα νη ξπζκίζεηο ηνπ ζεξκνζηάηε είηε πξφθεηηαη γηα ζέξκαλζε είηε γηα θιηκαηηζκφ. Αθφκε, ζε πεξίπησζε πνπ ζηελ νηθνγέλεηα ππάξρεη παηδί θάησ ησλ 6 εηψλ κπνξεί λα ππνδειψλεη ηελ επίβιεςε ηνπ απφ θάπνηνλ ελήιηθα. Όπσο θαίλεηαη απφ ην Γηάγξακκα 4.1, ν SimpleCart αδπλαηεί λα θαηεγνξηνπνηήζεη ηθαλνπνηεηηθά ζηηγκηφηππα πνπ αλήθνπλ ζηελ 3 ε θιάζε ηφζν γηα ην 110attr_21999.arff φζν θαη γηα ην 112attr_21999.arff. Απηφ ζπκβαίλεη γηαηί ε ηξίηε θιάζε ( ] παξνπζηάδεη ηε κηθξφηεξε θαηαλνκή ζηηγκηνηχπσλ ζε ζρέζε κε ηηο άιιεο δχν. Σν ζπγθεθξηκέλν πξφβιεκα επηιχζεθε κε ηε ρξήζε ηεο ηερληθήο oversampling SMOTE (έγηλε πξνζπάζεηα θαη κε subsampling ησλ δχν πξψησλ θιάζεσλ ρσξίο λα επηηεπρζεί παξφκνηα βειηίσζε) νπφηε πξνέθπςε ην 112attr_21999_ SMOTE.arff κε 4755 instances. Απφ ηνλ Πίλαθα 4.5, θαίλεηαη φηη ην πνζνζηφ ησλ Correctly Classified Instances βειηηψζεθε θαηά πεξίπνπ 6.5% κε ηε ρξήζε ηνπ SMOTE. Δπηπιένλ, φπσο έρεη αλαθεξζεί πξνεγνπκέλσο, ζηελ ηερληθή SMOTE ρξεζηκνπνηείηαη ν k-nn γηα ηε ζχλζεζε ζηηγκηνηχπσλ. Ωζηφζν, ζην ζπγθεθξηκέλν πξφβιεκα ηα πεξηζζφηεξα attributes (numeric) παίξλνπλ δηαθξηηέο ηηκέο απφ έλα πξνθαζνξηζκέλν ζχλνιν ηηκψλ (απαληήζεηο εξσηεκαηνινγίνπ RECS), πξφηππν πνπ πξέπεη λα δηαηεξεζεί θαη ζηα

62 60 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ «ζπλζεηηθά» ζηηγκηφηππα. Γηα παξάδεηγκα, ην attribute STOVEN παίξλεη ηηκέο 0 ή 1 θαη δειψλεη αληίζηνηρα ηελ απνπζία ή χπαξμε ειεθηξηθήο θνπδίλαο ζε κηα θαηνηθία. Η απφδνζε ηεο ηηκήο STOVEN=0,5 απφ ηνλ SMOTE ζε έλα ζηηγκηφηππν εθηφο ηνπ φηη δε ζα είρε θακηά θπζηθή ζεκαζία, ζα αιινίσλε θαη ηα απνηειέζκαηα ηεο θαηεγνξηνπνίεζεο. Γηα ην ζθνπφ απηφ, πξηλ ηελ εθαξκνγή ηνπ SMOTE, νη κεηαβιεηέο πνπ παίξλνπλ πξνθαζνξηζκέλεο ηηκέο κεηαηξάπεθαλ ζε nominal. Οη ππφινηπεο κεηαβιεηέο ησλ νπνίσλ νη ηηκέο θαζνξίδνληαη απφ ην εθάζηνηε λνηθνθπξηφ δηαηεξήζεθαλ numeric (HD65, CD65, BEDROOMS, TOTROOMS, NUMCFAN, TVCOLOR, VCR, DVD, PLYSTAHRS, TVONWD, TVONWE, NUMPC, TEMPHOME, TEMPGONE, TEMPNITE, ACROOMS, TEMPHOMEAC, TEMPGONEAC, TEMPNITEAC, NUMBERAC, LGT12, LGT12EE, NOUTLGTNT, DOOR1SUM, NHSLDMEM, AGEHHMEM1, AGEHHMEM2, AGEHHMEMY θαη SQFTEST). Σέινο, κεηά ηελ εθαξκνγή ηνπ SMOTE, νη numeric κεηαβιεηέο ζηξνγγπινπνηήζεθαλ ζηνλ πην θνληηλφ αθέξαην έηζη ψζηε λα είλαη δηαθξηηέο θαη νη nominal κεηαηξάπεθαλ μαλά ζε numeric. Πίνακαρ Αποηελέζμαηα για καηαναλώζειρ έωρ kwh - 3 bins Dataset Αλγόπιθμοι Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error 110attr_ arff 110attr_21999 _NHSLDMEM.arff 112attr_ 21999_arff 112attr_21999 _SMOTE.arff REPTree SimpleCart REPTree SimpleCart REPTree SimpleCart REPTree SimpleCart Αθφκε, ζην Γηάγξακκα 4.1, απνηππψλεηαη ε αχμεζε ηνπ TPR γηα ηελ 3 ε θιάζε φπσο πξνθχπηεη απφ ηελ εθαξκνγή ηνπ SimpleCart ζην dataset 112attr_21999_SMOTE.arff.

63 True Positive Rate (TPR) Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 61 0,8 0,7 110attr_21999.arff 112attr_21999.arff 112attr_21999_SMOTE.arff 0,6 0,5 0,4 0,3 0,2 0,1 0 Κιάζε 1 - [ ] Κιάζε 2 - ( ] Κιάζε 3 - ( ] Γιάγπαμμα 4.1 TPR ανά κλάζη για καηαναλώζειρ έωρ kwh SimpleCart, 3bins Καηανάλωζη από έωρ kwh (391 instances) Γηα ηε δηεξεχλεζε ησλ ζηηγκηνηχπσλ κε θαηαλαιψζεηο απφ έσο kwh ρξεζηκνπνηήζεθε Unequal-Interval binning θαζψο ην Equal- Interval binning δελ έδσζε ηθαλνπνηεηηθά απνηειέζκαηα. Γεκηνπξγήζεθαλ ηα δχν παξαθάησ datasets: 112attr_22000_72125_UI_3bins.arff κε 3 θιάζεηο: [ ], ( ] θαη ( ] 112attr_22000_35000_UI_2bins.arff κε 2 θιάζεηο: [ ] θαη ( ) Σα απνηειέζκαηα παξνπζηάδνληαη ζηνλ Πίλαθα 4.6. Αλ θαη ηα πνζνζηά επηηπρίαο εκθαλίδνληαη ηθαλνπνηεηηθά, επηζεκαίλεηαη φηη ην TPR γηα ηηο δχν ηειεπηαίεο θιάζεηο ηνπ 112attr_22000_72125_UI_3bins.arff φπσο θαη γηα ηελ ηειεπηαία ηνπ 112attr_22000_35000_UI_2bins.arff είλαη ζρεδφλ 0. Γηα ην ιφγν απηφ απνξξίπηεηαη ε ρξήζε SMOTE ζε απηή ηελ πεξίπησζε.

64 62 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Πίνακαρ Αποηελέζμαηα για καηαναλώζειρ από έωρ kwh Dataset Αλγόπιθμοι Correctly Classified Instances [%] 112attr_22000 Mean Absolute Error Root Mean Squared Error REPTree _UI_3bins.arff 112attr_22000 _35000_UI_2bins.arff SimpleCart REPTree SimpleCart Καηανάλωζη έωρ kwh (4281 instances) Γηα θαηαλαιψζεηο έσο kwh, εθαξκφζηεθε ν SimpleCart ζε δηαθνξεηηθά datasets πνπ δεκηνπξγήζεθαλ αθνινπζψληαο παξφκνηα ινγηθή κε ηελ ππνελφηεηα Καζψο, ην εχξνο ηηκψλ είλαη κεγάιν δνθηκάζηεθε δηαθξηηνπνίεζε ηνπ class-attribute kwh γηα: 3 bins Κιάζεηο: [ ], ( ] θαη ( ] 4 bins Κιάζεηο: [ ], ( ], ( ] θαη ( ] Απφ ηνλ Πίλαθα 4.7 παξαηεξνχκε φηη ηα θαιχηεξα απνηειέζκαηα δίλνληαη γηα ην dataset 112attr_29999_SMOTE.arff. Αθφκε, ζην Γηάγξακκα 4.2 παξνπζηάδεηαη ην TPR αλά θιάζε γηα δηαθξηηνπνίεζε κε 3 bins. Σέινο, γηα ην Γηάγξακκα 4.3, ην νπνίν δίλεη ην TPR αλά θιάζε γηα 4 bins, γίλεηαη αληηιεπηφ φηη ζε απηή ηελ πεξίπησζε ρξεζηκνπνηήζεθε ν SMOTE γηα oversampling ηεο ηξίηεο ( ] θαη ηεο ηέηαξηεο θιάζεο ( ]. ηελ ηειεπηαία πεξίπησζε αθξηβψο ιφγσ ηεο ρξήζεο ηνπ SMOTE ζηηο δχν ηειεπηαίεο θιάζεηο, ζεσξήζεθε φηη ην κνληέιν θαη νη θαλφλεο πνπ ζα πξνθχςνπλ ρξεζηκνπνηψληαο απηφ ην dataset, κπνξεί λα έρνπλ αιινησζεί νη δνκέο θαη νη ζπζρεηίζεηο κεηαμχ ησλ αξρηθψλ δεδνκέλσλ. Γηα ην ιφγν απηφ δελ εμεηάδεηαη ζηε ζπλέρεηα.

65 True Positive Rate (TPR) Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 63 Πίνακαρ Αποηελέζμαηα για καηαναλώζειρ εωρ kwh - SimpleCart Dataset 110attr_ arff 110attr_29999 _NHSLDMEM.arff 112attr_ 29999_arff 112attr_29999 _SMOTE.arff Απιθμόρ bins Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error ,9 0,8 110attr_29999.arff 112attr_29999.arff 112attr_29999_SMOTE.arff 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Κιάζε 1 [ ,333333] Κιάζε 2 (10031, ,666667] Κιάζε 3 (20014, ] Γιάγπαμμα TPR ανά κλάζη για καηαναλώζειρ έωρ kwh SimpleCart, 3bins

66 True Positive Rate (TPR) 64 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ 0,8 0,7 110attr_29999.arff 112attr_29999.arff 112attr_29999_SMOTE.arff 0,6 0,5 0,4 0,3 0,2 0,1 0 Κιάζε 1 [ ,5] Κιάζε 2 (7535, ] Κιάζε 3 ( ,5] Κιάζε 4 (22510, ] Γιάγπαμμα TPR ανά κλάζη για καηαναλώζειρ έωρ kwh SimpleCart, 4bins Καηανάλωζη από έωρ kwh (101 instances) Γηα ηε δηεξεχλεζε ηνπ εχξνπο θαηαλαιψζεσλ απφ έσο kwh δεκηνπξγήζεθαλ ηα παξαθάησ δχν datasets κε Unequal-Interval binning: 112attr_30000_72125_UI_3bins.arff κε 3 θιάζεηο: [ ], ( ] θαη ( ] 112attr_30000_40000_UI_2bins.arff κε 2 θιάζεηο: [ ] θαη ( ) Σα απνηειέζκαηα απφ ηελ εθαξκνγή ηνπ SimpleCart παξνπζηάδνληαη ζηνλ Πίλαθα 4.6. Καη ζηηο δχν πεξηπηψζεηο ηα κνληέια πνπ πξνθχπηνπλ απνηπγράλνπλ λα θαηεγνξηνπνηήζνπλ ηνπο θαηαλαισηέο.

67 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 65 Πίνακαρ Αποηελέζμαηα για καηαναλώζειρ από εωρ kwh Simple Cart Dataset 112attr_30000_72125_UI_ 3bins.arff 112attr_20000_40000_UI_ 2bins.arff Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error Knowledge Representation Απφ ηα πεηξάκαηα πνπ πξνεγήζεθαλ απνδεηθλχεηαη φηη ε εχξεζε κνληέισλ πνπ λα θαηεγνξηνπνηνχλ ηθαλνπνηεηηθά ηνπο θαηαλαισηέο είλαη εθηθηή γηα ηα δηαζηήκαηα ηηκψλ [ ] θαη [ ]. ηε ζπλέρεηα, παξνπζηάδνληαη ηα δέλδξα απφθαζεο πνπ πξνέθπςαλ απφ ηελ εθαξκνγή ηνπ SimpleCart ζηα datasets 112attr_21999_SMOTE.arff θαη 112attr_29999_SMOTE.arff, θαη αλαιχνληαη νη ζεκαληηθφηεξνη θαλφλεο θαηεγνξηνπνίεζεο πνπ πξνθχπηνπλ βάζεη ησλ παξαθάησ δχν κέηξσλ: Coverage(r) Δίλαη ην πνζνζηφ ησλ ζηηγκηνηχπσλ πνπ ηθαλνπνηνχλ ηνλ θαλφλα σο πξνο ην ζχλνιν ησλ ζηηγκηνηχπσλ. Accuracy(r) Δίλαη ην πνζνζηφ ησλ ζηηγκηνηχπσλ πνπ θαηεγνξηνπνηνχληαη νξζά απφ ηνλ θαλφλα σο πξνο ην ζπλνιηθφ αξηζκφ ησλ ζηηγκηνηχπσλ πνπ ηθαλνπνηνχλ ηνλ θαλφλα.

68 66 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Μονηέλο για καηανάλωζη εωρ kwh ACROOMS < 0.5 DRYER < 0.5: [ ](521.0/167.0) DRYER >= 0.5 USEWWAC < 0.5 AIRCOND < 0.5: [ ](37.86/30.03) AIRCOND >= 0.5: ( ](95.99/8.25) USEWWAC >= 0.5 ELWATER < 0.5 NHSLDMEM < 2.5: [ ](280.18/110.33) NHSLDMEM >= 2.5 LRGSTATE < 1.5: ( ](194.41/142.04) LRGSTATE >= 1.5: [ ](50.06/31.97) ELWATER >= 0.5: ( ](209.53/173.29) ACROOMS >= 0.5 YEARMADE < 2.5 AGECENAC < 1.5 WALLTYPE < 1.5: ( ](671.8/6.41) WALLTYPE >= 1.5: ( ](17.83/14.61) AGECENAC >= 1.5: ( ](92.55/78.77) YEARMADE >= 2.5 NHSLDMEM < 1.5 HD65 < TYPEHUQ < 3.5: ( ](101.0/68.0) TYPEHUQ >= 3.5: [ ](59.0/37.0) HD65 >= : [ ](100.0/47.0) NHSLDMEM >= 1.5 ELWATER < 0.5 BEDROOMS < 2.5 NUMFREEZ < 0.5: [ ](67.0/52.0) NUMFREEZ >= 0.5: ( ](28.0/16.0) BEDROOMS >= 2.5 CD65 < : ( ](335.0/251.0) CD65 >= TOTROOMS < 6.5: ( ](47.0/42.0) TOTROOMS >= 6.5: ( ](40.0/18.0) ELWATER >= 0.5 BEDROOMS < 2.5: ( ](92.0/77.0) BEDROOMS >= 2.5: ( ](230.0/114.0) Δικόνα 4.1 Γένδπο αποθάζεων για καηανάλωζη έωρ kwh Γηα ην παξαπάλσ κνληέιν επηζεκαίλεηαη φηη ν πξψηνο αξηζκφο ζηηο παξελζέζεηο πνπ βξίζθνληαη κεηά ην leaf label αληηπξνζσπεχεη ηνλ αξηζκφ ησλ νξζά θαηεγνξηνπνηεκέλσλ ζηηγκηνηχπσλ θαη ν δεχηεξνο ησλ ιαλζαζκέλσλ.

69 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 67 Η κεηαβιεηή ACROOMS ε νπνία απνηειεί ην πξψην splitting point, παίξλεη ηηκέο κεγαιχηεξεο ηνπ 0 θαη αληίζηνηρεο ηνπ αξηζκνχ ησλ δσκαηίσλ πνπ ςχρνληαη, φηαλ θιηκαηίδεηαη κφλν έλα κέξνο ηεο θαηνηθίαο πνπ δηαζέηεη θεληξηθφ ζχζηεκα θιηκαηηζκνχ θαη πηζαλφλ επηπιένλ αλεμάξηεηεο κνλάδεο. R1: IF ACROOMS<0.5 AND DRYER<0.5 THEN KWH: [ ] Coverage (R1) = 14.47% Accuracy (R1) = 75.73% Όηαλ ε θαηνηθία δηαζέηεη κφλν αλεμάξηεηεο κνλάδεο θιηκαηηζκνχ θαη δελ έρεη ζηεγλσηήξην αλήθεη ζηελ θιάζε κε ηε κηθξφηεξε θαηαλάισζε. Ο θαλφλαο απηφο έρεη λφεκα δεδνκέλνπ φηη ε απνπζία ζηεγλσηεξίνπ κεηψλεη αξθεηά ηελ θαηαλάισζε φπσο θαη ε ιεηηνπξγία κεκνλσκέλσλ AC κνλάδσλ ζπγθξηηηθά κε ηελ χπαξμε θεληξηθνχ ζπζηήκαηνο θιηκαηηζκνχ. Η ρξήζε κνλάδσλ AC πηζαλφλ λα ζρεηίδεηαη κε ηνλ ηχπν ηεο θαηνηθίαο θαζψο θαη ην αλ ελνηθηάδεηαη. ε δηακεξίζκαηα ή/θαη ζε θαηνηθίεο πνπ ελνηθηάδνληαη, ζπλεζίδνληαη νη κεκνλσκέλεο κνλάδεο AC. R2: IF ACROOMS>=0.5 AND YEARMADE<2.5 AND AGECEAC<1.5 AND WALLTYPE<1.5 THEN KWH: ( ] Coverage (R2) = 14.26% Accuracy (R2) = 99.05% Όηαλ ε θαηνηθία δηαζέηεη θεληξηθφ ζχζηεκα θιηκαηηζκνχ παιαηφηεηαο κηθξφηεξεο ησλ 2 εηψλ γηα ηνλ θιηκαηηζκφ νξηζκέλσλ κφλν δσκαηίσλ, έρεη θαηαζθεπαζηεί πξηλ ην 1950 θαη ην πιηθφ ησλ ηνίρσλ είλαη ην ηνχβιν, ηφηε αλήθεη ζηελ θιάζε κε ηε κεγαιχηεξε ειεθηξηθή θαηαλάισζε. Πξνθαλψο, ε παιαηφηεηα ηεο θαηνηθίαο νδεγεί ζε κεγάιεο απψιεηεο ζεξκφηεηαο ηφζν θαηά ηνλ θιηκαηηζκφ φζν θαη ηε ζέξκαλζε, θαζψο ηα θαηαζθεπαζηηθά πιηθά πξηλ ην 1950, έρνπλ πνιχ πεξηνξηζκέλεο ζεξκνκνλσηηθέο ηθαλφηεηεο ζε ζρέζε κε ηα ζχγρξνλα.

70 68 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ R3: IF ACROOMS>=0.5 AND YEARMADE>=2.5 AND NHSLDMEM>= 1.5 AND ELWATER<0.5 AND BEDROOMS>=2.5 AND CD65< THEN KWH: ( ] Coverage (R3) = 12.32% Accuracy (R3) = 57.16% Όηαλ ε θαηνηθία δηαζέηεη θεληξηθφ ζχζηεκα θιηκαηηζκνχ γηα ηνλ θιηκαηηζκφ νξηζκέλσλ κφλν δσκαηίσλ, θαηαζθεπάζηεθε κεηά ην 1950, ηα κέιε ηνπ λνηθνθπξηνχ είλαη παξαπάλσ απφ έλα, δηαζέηεη παξαπάλσ απφ δχν ππλνδσκάηηα, δε ρξεζηκνπνηείηαη ειεθηξηθφ ξεχκα γηα ηε ζέξκαλζε ηνπ λεξνχ, θαη ηα cooling degrees ηεο πεξηνρήο είλαη έσο 2130, ηφηε αλήθεη ζηελ θιάζε κε θαηαλάισζε ζην δηάζηεκα ( ]. Η χπαξμε 2 ή πεξηζζφηεξσλ αηφκσλ ζηελ νηθνγέλεηα απμάλεη ηηο ελεξγεηαθέο αλάγθεο ηνπ λνηθνθπξηνχ. Ωζηφζν, ε ειεθηξηθή θαηαλάισζε ηεο θαηνηθίαο κεηξηάδεηαη απφ ηε κε ρξήζε ειεθηξηθνχ ξεχκαηνο γηα ην δέζηακα ηνπ λεξνχ θαη ηελ ήπηα ρξήζε ηνπ ζπζηήκαηνο θιηκαηηζκνχ δηφηη δελ αλήθεη ζηηο λφηηεο πεξηθέξεηεο ησλ Η.Π.Α. (CD65<2130.5). R4: IF ACROOMS>=0.5 AND YEARMADE>=2.5 AND NHSLDMEM>= 1.5 AND ELWATER>=0.5 AND BEDROOMS>=2.5 THEN KWH: ( ] Coverage (R4) = 9.63% Accuracy (R4) = 58.73% Όηαλ ε θαηνηθία δηαζέηεη θεληξηθφ ζχζηεκα θιηκαηηζκνχ γηα ηνλ θιηκαηηζκφ νξηζκέλσλ κφλν δσκαηίσλ, θαηαζθεπάζηεθε κεηά ην 1950, ηα κέιε ηνπ λνηθνθπξηνχ είλαη παξαπάλσ απφ έλα, δηαζέηεη παξαπάλσ απφ δχν ππλνδσκάηηα θαη ρξεζηκνπνηείηαη ειεθηξηθφ ξεχκα γηα ηε ζέξκαλζε ηνπ λεξνχ, ηφηε αλήθεη ζηελ θιάζε πςειφηεξεο θαηαλάισζεο. πγθξίλνληαο ηνλ θαλφλα R4 κε ηνλ R3 παξαηεξνχκε φηη ε ρξήζε ηνπ ειεθηξηθνχ ξεχκαηνο γηα ην δέζηακα ηνπ λεξνχ είλαη ε εηδνπνηφο δηαθνξά.

71 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 69 R5: IF ACROOMS<0.5 AND DRYER>=0.5 AND USEWWAC>=0.5 AND ELWATER<0.5 AND NHSLDMEM<2.5 THEN KWH: [ ] Coverage (R5) = 8.2% Accuracy (R5) = 71.7% Όηαλ ε θαηνηθία δηαζέηεη κφλν αλεμάξηεηεο κνλάδεο θιηκαηηζκνχ ηηο νπνίεο ηηο ιεηηνπξγεί θαηά ηε δηάξθεηα ηνπ θαινθαηξηνχ, έρεη ζηεγλσηήξην, δε ρξεζηκνπνηεί ειεθηξηθφ ξεχκα γηα ηε ζέξκαλζε ηνπ λεξνχ θαη ηα κέιε ηεο είλαη ην πνιχ δχν, ηφηε αλήθεη ζηελ θιάζε κε ηε κηθξφηεξε θαηαλάισζε. πγθξίλνληαο ηνλ R5 κε ηνλ R1, παξαηεξνχκε φηη ν R5 θαιχπηεη ηηο πεξηπηψζεηο πνπ θάπνηα θαηνηθία ηεο ζπγθεθξηκέλεο θιάζεο δηαζέηεη ζηεγλσηήξην. Οη πεξηνξηζκνί γηα λα αλήθεη κηα θαηνηθία ζηελ θιάζε ρακειφηεξεο θαηαλάισζεο παξά ην ζηεγλσηήξην- είλαη ν αξηζκφο ησλ κειψλ ηνπ λνηθνθπξηνχ λα είλαη κηθξφηεξνο ή ίζνο ηνπ 2 θαη λα κε ρξεζηκνπνηεί ειεθηξηθφ ξεχκα γηα ηε ζέξκαλζε ηνπ λεξνχ. R6: IF ACROOMS>=0.5 AND YEARMADE>=2.5 AND NHSLDMEM<1.5 AND HD65<4797 AND TYPEHUQ<3.5 THEN KWH: ( ] Coverage (R6) = 3.5% Accuracy (R6) = 59.76% Όηαλ ε θαηνηθία δηαζέηεη θεληξηθφ ζχζηεκα θιηκαηηζκνχ γηα ηνλ θιηκαηηζκφ νξηζκέλσλ κφλν δσκαηίσλ, θαηαζθεπάζηεθε κεηά ην 1950, κφλν έλα άηνκν δηακέλεη ζην ζπίηη, ηα heating degrees ηεο πεξηνρήο ζηελ νπνία βξίζθεηαη ε θαηνηθία είλαη έσο 4797 θαη ν ηχπνο ηεο θαηνηθίαο είλαη singlefamily detached ή attached, ηφηε αλήθεη ζηελ θιάζε κε θαηαλάισζε ζην δηάζηεκα ( ]. Όπσο παξαηεξνχκε ν θαλφλαο απηφο είλαη ζπκπιεξσκαηηθφο κε ηνπ R3 απφ ην NHLDMEM θαη έπεηηα. Πξνζδηνξίδεη ηα ραξαθηεξηζηηθά κηαο θαηνηθίαο -κε θεληξηθφ ζχζηεκα θιηκαηηζκνχ γηα ηνλ θιηκαηηζκφ νξηζκέλσλ κφλν δσκαηίσλ, θαηαζθεπήο κεηά ην 1950 πνπ θαηνηθείηαη απφ έλα άηνκν- έηζη ψζηε λα αλήθεη ζηελ θιάζε ( ]. Πξψηνλ, ε θαηνηθία δε ζα πξέπεη λα βξίζθεηαη ζηηο βνξεηφηεξεο πεξηθέξεηεο ησλ

72 70 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Η.Π.Α. (HD65) attached. θαη δεχηεξνλ ν ηχπνο ηεο ζα πξέπεη λα είλαη detached ή R7: IF ACROOMS>=0.5 AND YEARMADE>=2.5 AND NHSLDMEM<1.5 AND HD65<4797 AND TYPEHUQ>=3.5 THEN KWH: [ ] Coverage (R7) = 2% Accuracy (R7) = 61.45% Όηαλ ε θαηνηθία δηαζέηεη θεληξηθφ ζχζηεκα θιηκαηηζκνχ γηα ηνλ θιηκαηηζκφ νξηζκέλσλ κφλν δσκαηίσλ, θαηαζθεπάζηεθε κεηά ην 1950, κφλν έλα άηνκν δηακέλεη ζην ζπίηη, ηα heating degrees ηεο πεξηνρήο ζηελ νπνία βξίζθεηαη ε θαηνηθία είλαη έσο 4797 θαη ν ηχπνο ηεο θαηνηθίαο είλαη δηακέξηζκα, ηφηε αλήθεη ζηελ θιάζε κε θαηαλάισζε ζην δηάζηεκα [ ]. Γηαπηζηψλνπκε φηη ν R7 είλαη ακνηβαίσο απνθιεηφκελνο κε ηνλ R6, δειαδή κηα θαηνηθία κε θεληξηθφ ζχζηεκα θιηκαηηζκνχ γηα ηνλ θιηκαηηζκφ νξηζκέλσλ κφλν δσκαηίσλ, θαηαζθεπήο κεηά ην 1950, κε κφλν έλα θάηνηθν θαη κε heating degrees έσο 4797, είηε αλήθεη ζηελ θιάζε [ ] αλ είλαη δηακέξηζκα είηε ζηελ θιάζε ( ] αλ είλαη ηχπνπ detached ή attached.

73 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά Μονηέλο για καηανάλωζη έωρ kwh

74 72 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ FUELHEAT < 4.5 AGEHHMEM1 < 73.5 TOTROOMS < 8.5 NUMFREEZ < 0.5 CD65 < FUELH2O < 3.0: [ ](35.0/10.0) FUELH2O >= 3.0: ( ](8.0/1.0) CD65 >= : ( ](149.0/95.0) NUMFREEZ >= 0.5: ( ](164.0/56.0) TOTROOMS >= 8.5 CD65 < SQFTEST < : ( ](53.88/28.52) SQFTEST >= : ( ](10.47/5.11) CD65 >= : ( ](13.0/3.0) AGEHHMEM1 >= 73.5: [ ](34.0/17.0) FUELHEAT >= 4.5 ELWATER < 0.5 MONEYPY < 9.5: [ ](11.0/7.0) MONEYPY >= 9.5: ( ](31.0/17.0) ELWATER >= 0.5 WASHLOAD < 3.5 RECBATH < 0.5 CD65 < : ( ](41.78/27.0) CD65 >= : ( ](9.78/2.0) RECBATH >= 0.5: ( ](9.0/1.0) WASHLOAD >= 3.5: ( ](19.21/5.21) TYPEHUQ >= 2.5 FUELH2O < 2.5 LGT12 < 1.5: [ ](75.65/28.0) LGT12 >= 1.5: ( ](12.0/5.0) FUELH2O >= 2.5: ( ](35.0/28.34) Δικόνα Γένδπο αποθάζεων για καηανάλωζη έωρ kwh Η κεηαβιεηή ELCOOL, ε νπνία απνηειεί ην πξψην splitting attribute, έρεη ηελ ηηκή 1 φηαλ ζηελ θαηνηθία ππάξρεη είηε θεληξηθφ ζχζηεκα θιηκαηηζκνχ είηε αλεμάξηεηεο κνλάδεο AC (window/wall units) πνπ δηαζέηνπλ κνλάδα ςχμεο ε νπνία ιεηηνπξγεί κε ειεθηξηθφ ξεχκα. R1: IF ELCOOL<0.5 AND ELWATER<0.5 THEN KWH: [ ] Coverage (R1) = 28.41% Accuracy (R1) =83.47% Όηαλ ζε κηα θαηνηθία δε ρξεζηκνπνηείηαη ειεθηξηθφ ξεχκα γηα ηνλ θιηκαηηζκφ θαη ην δέζηακα λεξνχ, ηφηε αλήθεη ζηελ θιάζε ρακειφηεξεο

75 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 73 ελεξγεηαθήο θαηαλάισζεο. Ο θαλφλαο απηφο είλαη πνιχ ηζρπξφο θαη δείρλεη αθξηβψο πφζν πνιχ απμάλνπλ ηηο ελεξγεηαθέο αλάγθεο κηαο θαηνηθίαο ν θιηκαηηζκφο θαη ε ρξήζε ειεθηξηθνχ ζεξκνζίθσλα. R2: IF ELCOOL>=0.5 AND UGASHERE>=0.5 AND NHSLDMEM>=1.5 AND USECENAC>= 1.5 AND TYPEHUQ <2.5 AND FUELHEAT<4.5 THEN KWH: ( ] Coverage (R2) = 14.45% Accuracy (R2) = 59.4% Όηαλ κηα θαηνηθία δηαζέηεη ζχζηεκα θεληξηθνχ θιηκαηηζκνχ ή/θαη κνλάδεο AC πνπ ιεηηνπξγνχλ αξθεηά ζπρλά θαηά ηε δηάξθεηα ηνπ θαινθαηξηνχ, βξίζθεηαη ζε πεξηνρή ε νπνία δηαζέηεη δίθηπν θπζηθνχ αεξίνπ, ν ηχπνο ηεο είλαη detached, δε ρξεζηκνπνηείηαη ειεθηξηθφ ξεχκα γηα ηε ζέξκαλζε θαη ηα κέιε ηνπ λνηθνθπξηνχ είλαη 2 ή πεξηζζφηεξα, ηφηε αλήθεη ζηελ θιάζε ( ]. Η ζπρλή ςχμε ησλ ρψξσλ κηαο detached θαηνηθίαο ζηελ νπνία κέλνπλ 2 ή πεξηζζφηεξα άηνκα απμάλεη ηελ ειεθηξηθή θαηαλάισζε. Ωζηφζν, ε ρξήζε άιινπ θαπζίκνπ πιελ ηνπ ειεθηξηθνχ ξεχκαηνο θαη ε χπαξμε δηθηχνπ θπζηθνχ αεξίνπ κε ην νπνίν κπνξεί λα ιεηηνπξγνχλ θάπνηεο ειεθηξηθέο ζπζθεπέο ζηελ θαηνηθία, πεξηνξίδεη ηηο ελεξγεηαθέο αλάγθεο ηνπ λνηθνθπξηνχ θαηεγνξηνπνηψληαο ην ζηελ θιάζε ( ] θαη φρη ζηελ ( ]. R3: IF ELCOOL>=0.5 AND UGASHERE<0.5 AND MONEYPY>=22.5 THEN KWH: ( ] Coverage (R3) = 9.2% Accuracy (R3) = 91.95% Όηαλ κηα θαηνηθία δηαζέηεη ζχζηεκα θεληξηθνχ θιηκαηηζκνχ ή/θαη κνλάδεο AC, βξίζθεηαη ζε πεξηνρή πνπ δε δηαζέηεη δίθηπν θπζηθνχ αεξίνπ θαη ην εηήζην εηζφδεκα ηνπ λνηθνθπξηνχ είλαη 95000$ ή παξαπάλσ, ηφηε αλήθεη ζηελ θιάζε κε ηελ πςειφηεξε θαηαλάισζε. Απηφ είλαη αλακελφκελν εθφζνλ

76 74 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ ρξεζηκνπνηείηαη ξεχκα γηα ηελ ςχμε ησλ ρψξσλ ηνπ ζπηηηνχ θαη επηπιένλ ε απνπζία δηθηχνπ θπζηθνχ αεξίνπ κπνξεί λα ππνδειψλεη ηε ρξήζε ειεθηξηζκνχ γηα ην δέζηακα ηνπ λεξνχ ή/θαη ηε ζέξκαλζε ηνπ λεξνχ θαζψο θαη άιισλ ειεθηξηθψλ ζπζθεπψλ φπσο ην ζηεγλσηήξην. Σέινο, ε πνιχ θαιή νηθνλνκηθή θαηάζηαζε ησλ κειψλ ηνπ λνηθνθπξηνχ επεξεάδεη άκεζα ηνλ ηχπν θαη ηνλ αξηζκφ ησλ ειεθηξηθψλ ζπζθεπψλ πνπ ππάξρνπλ ζηελ θαηνηθία, θαη πηζαλφλ ηε ζπρλφηεηα ιεηηνπξγία ηνπο. R4: IF ELCOOL>=0.5 AND UGASHERE>=0.5 AND NHSLDMEM<=1.5 THEN KWH: [ ] Coverage (R4) = 7.02% Accuracy (R4) = 74.1% Όηαλ κηα θαηνηθία ζηελ νπνία δηακέλεη έλα άηνκν, δηαζέηεη ζχζηεκα θεληξηθνχ θιηκαηηζκνχ ή/θαη κνλάδεο AC θαη βξίζθεηαη ζε πεξηνρή κε δίθηπν θπζηθνχ αεξίνπ, ηφηε αλήθεη ζηελ θιάζε κε ηε ρακειφηεξε ειεθηξηθή θαηαλάισζε. Ο θαλφλαο απηφο κπνξεί λα αλαιπζεί ζπγθξηηηθά κε ηνλ R2. R5: IF ELCOOL<0.5 AND ELWATER>=0.5 AND DRYER>=0.5 AND ELWARM>=0.5 THEN KWH: ( ] Coverage (R5) = 5.1% Accuracy (R5) = 62.24% Όηαλ ζε κηα θαηνηθία ρξεζηκνπνηείηαη ειεθηξηθφ ξεχκα γηα ηε ζέξκαλζε ησλ ρψξσλ θαη ην δέζηακα ηνπ λεξνχ αιιά φρη γηα ηνλ θιηκαηηζκφ, ηφηε αλήθεη ζηελ θιάζε ( ]. πγθξηηηθά κε ηνλ θαλφλα R1, παξαηεξνχκε φηη ε θαηνηθία δε κπνξεί λα αλήθεη ζηελ πξψηε θιάζε θαζψο ρξεζηκνπνηεί ειεθηξηζκφ γηα ηε ζέξκαλζε λεξνχ. Αθφκε, ε ρξήζε άιινπ θαπζίκνπ πιελ ηνπ ειεθηξηθνχ ξεχκαηνο γηα θιηκαηηζκφ πεξηνξίδεη ηελ ειεθηξηθή θαηαλάισζε. Πηζαλφλ, ην ηειεπηαίν λα απνθηά κεγαιχηεξν λφεκα αλ ε θαηνηθία βξίζθεηαη ζηηο λφηηεο πεξηνρέο ησλ Η.Π.Α. φπνπ νη θιηκαηνινγηθέο ζπλζήθεο επηβάιινπλ απμεκέλε ρξήζε ηνπ θιηκαηηζηηθνχ θαη πεξηνξηζκέλε αληίζηνηρα ηνπ ζπζηήκαηνο ζέξκαλζεο.

77 Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 75 R6: IF ELCOOL>=0.5 AND UGASHERE>=0.5 AND NHSLDMEM>=1.5 AND USECENAC<1.5 AND TVCOLOR<3.5 THEN KWH: [ ] Coverage (R6) =4.5% Accuracy (R6) = 75.23% Όηαλ κηα θαηνηθία δηαζέηεη ζχζηεκα θεληξηθνχ θιηκαηηζκνχ ή/θαη κνλάδεο AC πνπ ιεηηνπξγνχλ ιίγν ή θαζφινπ θαηά ηε δηάξθεηα ηνπ θαινθαηξηνχ, βξίζθεηαη ζε πεξηνρή κε δίθηπν θπζηθνχ αεξίνπ, δηαζέηεη ην πνιχ 3 ηειενξάζεηο θαη ηα κέιε ηνπ λνηθνθπξηνχ είλαη 2 ή πεξηζζφηεξα, ηφηε αλήθεη ζηελ θιάζε [ ]. πγθξίλνληαο ηνλ R4 κε ηνλ R6, ν ηειεπηαίνο δίλεη ηνπο πεξηνξηζκνχο έηζη ψζηε κηα θαηνηθία κε θιηκαηηζκφ θαη δίθηπν θπζηθνχ αεξίνπ αιιά αξηζκφ κειψλ κεγαιχηεξν ή ίζν ηνπ 2, λα εκπίπηεη ζηελ θιάζε [ ]. R7: IF ELCOOL>=0.5 AND UGASHERE<0.5 AND MONEYPY<22.5 AND NHSLDMEM<2.5 AND BEDROOMS>=2.5 THEN KWH: ( ] Coverage (R7) = 4.1% Accuracy (R7) = 52.55% Όηαλ κηα θαηνηθία δηαζέηεη ζχζηεκα θεληξηθνχ θιηκαηηζκνχ ή/θαη κνλάδεο AC, βξίζθεηαη ζε πεξηνρή πνπ δε δηαζέηεη δίθηπν θπζηθνχ αεξίνπ, ην εηήζην εηζφδεκα ηνπ λνηθνθπξηνχ είλαη ιηγφηεξν απφ 95000$, ηα κέιε ηνπ λνηθνθπξηνχ είλαη ην πνιχ δχν θαη ν αξηζκφο ησλ ππλνδσκαηίσλ είλαη 3 ή πεξηζζφηεξα, ηφηε αλήθεη ζηελ θιάζε ( ]. Η αθξίβεηα ηνπ ζπγθεθξηκέλνπ θαλφλα δελ είλαη ηθαλνπνηεηηθή θαη ίζσο ζα έπξεπε λα πξνζηεζεί θάπνηα εμαίξεζε (exception). R8: IF ELCOOL<0.5 AND ELWATER>=0.5 AND DRYER>=0.5 AND ELWARM<0.5 THEN KWH: [ ] Coverage (R8) = 4% Accuracy (R8) = 58.82%

78 76 Δθαπμογή Τεσνικών ΔΓ για ηην Ομαδοποίηζη και ηο Χαπακηηπιζμό Καηαναλωηών Ηλεκηπικήρ Δνέπγειαρ Όηαλ ζε κηα θαηνηθία ρξεζηκνπνηείηαη ειεθηξηθφ ξεχκα γηα ην δέζηακα ηνπ λεξνχ αιιά φρη γηα ηνλ θιηκαηηζκφ θαη ηε ζέξκαλζε ησλ ρψξσλ θαη δηαζέηεη ζηεγλσηήξην, ηφηε αλήθεη ζηελ θιάζε [ ]. Αλακελφκελν δεδνκέλνπ φηη νη δχν πην ελεξγνβφξεο ζπζθεπέο ελφο λνηθνθπξηνχ φπσο ην θεληξηθφ ζχζηεκα θιηκαηηζκνχ θαη ην αληίζηνηρν ζέξκαλζεο δε ρξεζηκνπνηνχλ ειεθηξηθφ ξεχκα. ε ζρέζε κε ηνλ R5, παξαηεξνχκε φηη ε ρξήζε άιινπ θαπζίκνπ γηα ηε ζέξκαλζε απνηειεί ηελ εηδνπνηφ δηαθνξά γηα ην δηαρσξηζκφ ησλ δχν θιάζεσλ Χπήζη ensemble μεθόδων Γηα ηελ πεξαηηέξσ βειηίσζε ησλ κνληέισλ πνπ πξνέθπςαλ, ρξεζηκνπνηήζεθαλ ensemble κέζνδνη ζηα datasets 112attr_21999_3bins _SMOTE.arff θαη 112attr_29999_3bins_SMOTE.arff. αλ base classifier ρξεζηκνπνηήζεθε απνθιεηζηηθά ν SimpleCart Απφ ηνπο Πίλαθεο 4.9 θαη 4.10 παξαηεξνχκε φηη ν Bagging δίλεη ηα θαιχηεξα απνηειέζκαηα. ηα Γηαγξάκκαηα 4.4 θαη 4.5 δίλεηαη ην TPR αλά θιάζε γηα ηνπο ensemble αιγφξηζκνπο πνπ ρξεζηκνπνηήζεθαλ ζε ζχγθξηζε κε ηνλ SimpleCart. Πίνακαρ Αποηελέζμαηα ensemble methods για 112attr_21999_3bins _SMOTE.arff Αλγόπιθμοι Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error AdaBoostM Bagging MultiClassClassifier

79 True Positive Rate (TPR) Γιπλωμαηική Δπγαζία Ιωάνναρ Καμπςλαςκά 77 Πίνακαρ Αποηελέζμαηα ensemble methods για 112attr_29999_3bins _SMOTE.arff Αλγόπιθμοι Correctly Classified Instances [%] Mean Absolute Error Root Mean Squared Error AdaBoostM Bagging MultiClassClassifier SimpleCart AdaBoostM1 Bagging MultiClassClassifier 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Κιάζε 1 [ ] Κιάζε 2 ( ] Κιάζε 3 ( ] Γιάγπαμμα 4.4 TPR ανά κλάζη για ηο 112attr_21999_3bins_SMOTE.arff με σπήζη ensemble methods

ΑΛΔΞΑΝΓΡΔΗΟ ΣΔΥΝΟΛΟΓΗΚΟ ΔΚΠΑΗΓΔΤΣΗΚΟ ΗΓΡΤΜΑ ΘΔΑΛΟΝΗΚΖ ΥΟΛΖ ΣΔΥΝΟΛΟΓΗΚΧΝ ΔΦΑΡΜΟΓΧΝ ΣΜΖΜΑ ΠΛΖΡΟΦΟΡΗΚΖ. Πηπρηαθή εξγαζία BIG DATA SECURITY

ΑΛΔΞΑΝΓΡΔΗΟ ΣΔΥΝΟΛΟΓΗΚΟ ΔΚΠΑΗΓΔΤΣΗΚΟ ΗΓΡΤΜΑ ΘΔΑΛΟΝΗΚΖ ΥΟΛΖ ΣΔΥΝΟΛΟΓΗΚΧΝ ΔΦΑΡΜΟΓΧΝ ΣΜΖΜΑ ΠΛΖΡΟΦΟΡΗΚΖ. Πηπρηαθή εξγαζία BIG DATA SECURITY ΑΛΔΞΑΝΓΡΔΗΟ ΣΔΥΝΟΛΟΓΗΚΟ ΔΚΠΑΗΓΔΤΣΗΚΟ ΗΓΡΤΜΑ ΘΔΑΛΟΝΗΚΖ ΥΟΛΖ ΣΔΥΝΟΛΟΓΗΚΧΝ ΔΦΑΡΜΟΓΧΝ ΣΜΖΜΑ ΠΛΖΡΟΦΟΡΗΚΖ Πηπρηαθή εξγαζία BIG DATA SECURITY Γνιηθίδεο Μάξηνο νπιετκάλεο Μαλψιεο Θεζζαλονίκη 2015 χκβνπινο θαζεγεηήο

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΚΑΣΗΓΟΡΙΟΠΟΙΗΗ ΚΑΙ ΣΑΞΙΝΟΜΗΗ ΕΓΓΡΑΦΩΝ

ΑΛΓΟΡΙΘΜΟΙ ΚΑΣΗΓΟΡΙΟΠΟΙΗΗ ΚΑΙ ΣΑΞΙΝΟΜΗΗ ΕΓΓΡΑΦΩΝ ΑΛΓΟΡΙΘΜΟΙ ΚΑΣΗΓΟΡΙΟΠΟΙΗΗ ΚΑΙ ΣΑΞΙΝΟΜΗΗ ΕΓΓΡΑΦΩΝ ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ΝΣΙΝΑΚΗ Κ. ΑΠΟΣΟΛΟ ΔΠΙΒΛΔΠΩΝ ΚΑΘΗΓΗΣΗ: ΣΔΦΑΝΙΓΗ ΓΔΩΡΓΙΟ ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΣΜΗΜΑ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ ΜΔΣΑΠΣΤΥΙΑΚΗ ΚΑΣΔΤΘΤΝΗ ΔΠΙΥΔΙΡΗΑΜΑΣΙΚΗ

Διαβάστε περισσότερα

Παλεπηζηήκην Πεηξαηψο Σκήκα Πιεξνθνξηθήο Πξφγξακκα Μεηαπηπρηαθψλ πνπδψλ «Πξνεγκέλα πζηήκαηα Πιεξνθνξηθήο»

Παλεπηζηήκην Πεηξαηψο Σκήκα Πιεξνθνξηθήο Πξφγξακκα Μεηαπηπρηαθψλ πνπδψλ «Πξνεγκέλα πζηήκαηα Πιεξνθνξηθήο» Παλεπηζηήκην Πεηξαηψο Σκήκα Πιεξνθνξηθήο Πξφγξακκα Μεηαπηπρηαθψλ πνπδψλ «Πξνεγκέλα πζηήκαηα Πιεξνθνξηθήο» Μεηαπηπρηαθή Γηαηξηβή Σίηινο Γηαηξηβήο Ολνκαηεπψλπκν Φνηηεηή Αξηζκφο Μεηξψνπ Καηεχζπλζε Δπηβιέπνληεο

Διαβάστε περισσότερα

Ανάλυζη Συζηάδων (Cluster Analysis)

Ανάλυζη Συζηάδων (Cluster Analysis) ΠΑΝΕΠΙΣΗΜΙΟ ΠΑΣΡΩΝ ΣΜΗΜΑ ΜΑΘΗΜΑΣΙΚΩΝ ΜΗΦΑΝΙΚΩΝ Η/Τ & ΠΛΗΡΟΥΟΡΙΚΗ ΜΕΣΑΠΣΤΦΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΠΟΤΔΩΝ «ΜΑΘΗΜΑΣΙΚΑ ΣΩΝ ΤΠΟΛΟΓΙΣΩΝ ΚΑΙ ΣΩΝ ΑΠΟΥΑΕΩΝ» Ανάλυζη Συζηάδων (Cluster Analysis) ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ Καράγεωργα

Διαβάστε περισσότερα

ΓΙΓΑΚΣΟΡΙΚΗ ΓΙΑΣΡΙΒΗ

ΓΙΓΑΚΣΟΡΙΚΗ ΓΙΑΣΡΙΒΗ ΔΘΝΙΚΟ ΜΔΣΟΒΙΟ ΠΟΛΤΣΔΥΝΔΙΟ ΥΟΛΗ ΗΛΔΚΣΡΟΛΟΓΧΝ ΜΗΥΑΝΙΚΧΝ ΚΑΙ ΜΗΥΑΝΙΚΧΝ ΤΠΟΛΟΓΙΣΧΝ ΣΟΜΔΑ ΔΠΙΚΟΙΝΧΝΙΧΝ ΗΛΔΚΣΡΟΝΙΚΗ ΚΑΙ ΤΣΗΜΑΣΧΝ ΠΛΗΡΟΦΟΡΙΚΗ Αιγνξηζκηθέο κέζνδνη επεμεξγαζίαο/αλάιπζεο πνιπκεζηθήο πιεξνθνξίαο

Διαβάστε περισσότερα

ΠΑΝΔΠΙΣΗΜΙΟ ΠΑΣΡΧΝ ΣΜΗΜΑ ΜΗΥΑΝΙΚΧΝ Η/Τ & ΠΛΗΡΟΦΟΡΙΚΗ ΔΡΓΑΣΗΡΙΟ ΑΝΑΓΝΧΡΙΗ ΠΡΟΣΤΠΧΝ

ΠΑΝΔΠΙΣΗΜΙΟ ΠΑΣΡΧΝ ΣΜΗΜΑ ΜΗΥΑΝΙΚΧΝ Η/Τ & ΠΛΗΡΟΦΟΡΙΚΗ ΔΡΓΑΣΗΡΙΟ ΑΝΑΓΝΧΡΙΗ ΠΡΟΣΤΠΧΝ ΠΑΝΔΠΙΣΗΜΙΟ ΠΑΣΡΧΝ ΣΜΗΜΑ ΜΗΥΑΝΙΚΧΝ Η/Τ & ΠΛΗΡΟΦΟΡΙΚΗ ΔΡΓΑΣΗΡΙΟ ΑΝΑΓΝΧΡΙΗ ΠΡΟΣΤΠΧΝ Υπήζη γενεηικού αλγόπιθμος για βεληιζηοποίηζη δομήρ, παπαμέηπων ηεσνηηών νεςπωνικών δικηύων και εθαπμογή ηηρ ςβπιδικήρ

Διαβάστε περισσότερα

ΑΞΗΟΛΟΓΖΖ ΣΖ ΠΗΣΟΛΖΠΣΗΚΖ ΑΞΗΑ ΣΧΝ ΓΑΝΔΗΕΟΜΔΝΧΝ

ΑΞΗΟΛΟΓΖΖ ΣΖ ΠΗΣΟΛΖΠΣΗΚΖ ΑΞΗΑ ΣΧΝ ΓΑΝΔΗΕΟΜΔΝΧΝ 1 Σ.Δ.Η ΑΝΑΣΟΛΗΚΖ ΜΑΚΔΓΟΝΗΑ & ΘΡΑΚΖ ΥΟΛΖ ΓΗΟΗΚΖΖ ΚΑΗ ΟΗΚΟΝΟΜΗΑ ΣΜΖΜΑ ΓΗΑΥΔΗΡΗΖ ΠΛΖΡΟΦΟΡΗΧΝ ΑΞΗΟΛΟΓΖΖ ΣΖ ΠΗΣΟΛΖΠΣΗΚΖ ΑΞΗΑ ΣΧΝ ΓΑΝΔΗΕΟΜΔΝΧΝ Μνπηδίθεο Αλαζηάζηνο Μνπδίθαο Αλαζηάζηνο ΑΠΡΗΛΗΟ 2015 ΔΠΗΒΛΔΠΧΝ

Διαβάστε περισσότερα

ΑΝΑΛΤΗ ΓΙΑΚΤΜΑΝΗ ΚΑΙ ΤΝΓΙΑΚΤΜΑΝΗ Δ ΓΔΓΟΜΔΝΑ ΑΠΟ ΔΡΔΤΝΑ ΑΓΟΡΑ

ΑΝΑΛΤΗ ΓΙΑΚΤΜΑΝΗ ΚΑΙ ΤΝΓΙΑΚΤΜΑΝΗ Δ ΓΔΓΟΜΔΝΑ ΑΠΟ ΔΡΔΤΝΑ ΑΓΟΡΑ Σ.Δ.Ι ΑΝΑΣΟΛΙΚΗ ΜΑΚΔΓΟΝΙΑ & ΘΡΑΚΗ ΥΟΛΗ ΓΙΟΙΚΗΗ ΚΑΙ ΟΙΚΟΝΟΜΙΑ ΣΜΗΜΑ ΓΙΑΥΔΙΡΙΗ ΠΛΗΡΟΦΟΡΙΩΝ ΑΝΑΛΤΗ ΓΙΑΚΤΜΑΝΗ ΚΑΙ ΤΝΓΙΑΚΤΜΑΝΗ Δ ΓΔΓΟΜΔΝΑ ΑΠΟ ΔΡΔΤΝΑ ΑΓΟΡΑ Μεξζίλα Υξηζηίλα ΑΠΡΙΛΙΟ 2015 ΔΠΙΒΛΔΠΩΝ ΚΑΘΗΓΗΣΗ Γεξνληίδεο

Διαβάστε περισσότερα

ΠΟΛΤΣΔΥΝΔΙΟ ΚΡΗΣΗ ΣΜΗΜΑ ΗΛΔΚΣΡΟΝΙΚΩΝ ΜΗΥΑΝΙΚΩΝ ΚΑΙ ΜΗΥΑΝΙΚΩΝ ΤΠΟΛΟΓΙΣΩΝ

ΠΟΛΤΣΔΥΝΔΙΟ ΚΡΗΣΗ ΣΜΗΜΑ ΗΛΔΚΣΡΟΝΙΚΩΝ ΜΗΥΑΝΙΚΩΝ ΚΑΙ ΜΗΥΑΝΙΚΩΝ ΤΠΟΛΟΓΙΣΩΝ ΠΟΛΤΣΔΥΝΔΙΟ ΚΡΗΣΗ ΣΜΗΜΑ ΗΛΔΚΣΡΟΝΙΚΩΝ ΜΗΥΑΝΙΚΩΝ ΚΑΙ ΜΗΥΑΝΙΚΩΝ ΤΠΟΛΟΓΙΣΩΝ ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ΜΔ ΘΔΜΑ Αλάπηπμε ζπζηήκαηνο ζπζηάζεσλ βαζηδόκελνπ ζηε κνληεινπνίεζε ηνπ πξνθίι ησλ ρξεζηώλ κε ζηόρν ηελ πξνζσπνπνηεκέλε

Διαβάστε περισσότερα

Τπνινγηζηηθέο Γηαδηθαζίεο ζην ρεδηαζκό ηξαηεγηθώλ Άκεζνπ Μάξθεηηλγθ

Τπνινγηζηηθέο Γηαδηθαζίεο ζην ρεδηαζκό ηξαηεγηθώλ Άκεζνπ Μάξθεηηλγθ ΠΟΛΤΣΔ ΥΝΔ ΗΟ ΚΡΖΣΖ ΣΜΖΜΑ ΜΖΥΑΝΗΚΩΝ ΠΑΡΑΓΩΓΖ ΚΑΗ ΓΗΟΗΚΖΖ Τπνινγηζηηθέο Γηαδηθαζίεο ζην ρεδηαζκό ηξαηεγηθώλ Άκεζνπ Μάξθεηηλγθ Γιαηπιβή πος ςπεβλήθη για ηη μεπική ικανοποίηζη ηυν απαιηήζευν για ηην απόκηηζη

Διαβάστε περισσότερα

Τμήμα Τεσνών Ήσος και Δικόναρ. Ιόνιο Πανεπιζηήμιο

Τμήμα Τεσνών Ήσος και Δικόναρ. Ιόνιο Πανεπιζηήμιο Τμήμα Τεσνών Ήσος και Δικόναρ Ιόνιο Πανεπιζηήμιο isee Γηαδξαζηηθή Δγθαηάζηαζε γηα ηελ Δθηέιεζε Φπρναθνπζηηθψλ Πεηξακάησλ Υξήζηνο Μνπζάο Δπηβιέπσλ: Δπίθνπξνο Καζεγεηήο Αλδξέαο Φιψξνο Πηπρηαθή Δξγαζία Κέξθπξα,

Διαβάστε περισσότερα

Μειέηε Γηαρείξηζεο Απνζεκάησλ ε Καηάζηεκα Starbucks

Μειέηε Γηαρείξηζεο Απνζεκάησλ ε Καηάζηεκα Starbucks ΑΡΗΣΟΣΔΛΔΗΟ ΠΑΝΔΠΗΣΖΜΗΟ ΘΔΑΛΟΝΗΚΖ ΣΜΖΜΑ ΟΗΚΟΝΟΜΗΚΧΝ ΔΠΗΣΖΜΧΝ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΗΑΚΧΝ ΠΟΤΓΧΝ ΣΖ «ΓΗΟΗΚΖΖ ΚΑΗ ΟΗΚΟΝΟΜΗΑ» ΚΑΣΔΤΘΤΝΖ: ΓΗΟΗΚΖΖ ΤΠΖΡΔΗΧΝ ΔΞΔΗΓΗΚΔΤΖ: ΓΗΟΗΚΖΖ LOGISTICS Μειέηε Γηαρείξηζεο Απνζεκάησλ

Διαβάστε περισσότερα

ΠΟΛΤΣΕΥΝΕΙΟ ΚΡΗΣΗ Σκήκα Μεραληθώλ Παξάγσγεο θαη Δηνίθεζεο

ΠΟΛΤΣΕΥΝΕΙΟ ΚΡΗΣΗ Σκήκα Μεραληθώλ Παξάγσγεο θαη Δηνίθεζεο ΠΟΛΤΣΕΥΝΕΙΟ ΚΡΗΣΗ Σκήκα Μεραληθώλ Παξάγσγεο θαη Δηνίθεζεο ΜΕΘΟΔΟΛΟΓΙΕ ΑΝΑΓΝΩΡΙΗ ΑΠΑΣΗ: ΤΓΚΡΙΣΙΚΗ ΑΞΙΟΛΟΓΗΗ ΣΟ ΥΩΡΟ ΣΩΝ ΑΦΑΛΕΙΩΝ Διαηριβή ποσ σπεβλήθη για ηη μερική ικανοποίηζη ηων απαιηήζεων για ηην απόκηηζη

Διαβάστε περισσότερα

πλδπαζκόο ηεο Πεξηβάιινπζαο Αλάιπζεο Γεδνκέλωλ κε ηε κεζνδνινγία QFD ζηνλ ζρεδηαζκό ππεξεζηώλ

πλδπαζκόο ηεο Πεξηβάιινπζαο Αλάιπζεο Γεδνκέλωλ κε ηε κεζνδνινγία QFD ζηνλ ζρεδηαζκό ππεξεζηώλ ΠΑΝΔΠΙΣΗΜΙΟ ΠΑΣΡΩΝ ΣΜΗΜΑ ΓΙΟΙΚΗΗ ΔΠΙΥΔΙΡΗΔΩΝ ΜΔΣΑΠΣΤΥΙΑΚΟ ΠΡΟΓΡΑΜΜΑ MBA πλδπαζκόο ηεο Πεξηβάιινπζαο Αλάιπζεο Γεδνκέλωλ κε ηε κεζνδνινγία QFD ζηνλ ζρεδηαζκό ππεξεζηώλ ΓΗΠΛΧΜΑΣΗΚΖ ΔΡΓΑΗΑ ΣΑΣΖ ΑΜΑΛΗΑ, Α.Μ.:231

Διαβάστε περισσότερα

ΠΣΤΥΙΑΚΗ ΔΡΓΑΙΑ. Δθαπμογή ςζηήμαηορ Ηλεκηπονικήρ Γιασείπιζηρ Πελαηειακών σέζεων (CRM) ζηην εηαιπεία Staff- Jeans & Co

ΠΣΤΥΙΑΚΗ ΔΡΓΑΙΑ. Δθαπμογή ςζηήμαηορ Ηλεκηπονικήρ Γιασείπιζηρ Πελαηειακών σέζεων (CRM) ζηην εηαιπεία Staff- Jeans & Co ΑΣΔΙ ΘΔΑΛΟΝΙΚΗ ΥΟΛΗ ΓΙΟΙΚΗΗ ΚΑΙ ΟΙΚΟΝΟΜΙΑ ΣΜΗΜΑ ΔΜΠΟΡΙΑ ΚΑΙ ΓΙΑΦΗΜΙΗ ΠΣΤΥΙΑΚΗ ΔΡΓΑΙΑ Δθαπμογή ςζηήμαηορ Ηλεκηπονικήρ Γιασείπιζηρ Πελαηειακών σέζεων (CRM) ζηην εηαιπεία Staff- Jeans & Co Υοιτήτρια: Αρβανιτίδου

Διαβάστε περισσότερα

Δπεξεπγαζία δεδομένυν εμπειπικήρ κοινυνικήρ έπεςναρ

Δπεξεπγαζία δεδομένυν εμπειπικήρ κοινυνικήρ έπεςναρ ΠΑΝΔΠΗΣΖΜΗΟ ΠΑΣΡΧΝ ΓΗΑΣΜΖΜΑΣΗΚΟ ΜΔΣΑΠΣΤΥΗΑΚΟ ΣΜΖΜΑ ΜΑΘΖΜΑΣΗΚΧΝ ΜΖΥΑΝΗΚΧΝ Ζ/Τ&ΠΛΖΡΟΦΟΡΗΚΖ «Μαζεκαηηθά ησλ Τπνινγηζηψλ θαη ησλ Απνθάζεσλ» Δπεξεπγαζία δεδομένυν εμπειπικήρ κοινυνικήρ έπεςναρ ΜΔΣΑΠΣΤΥΗΑΚΖ

Διαβάστε περισσότερα

Παλεπηζηήκην Πεηξαηψο Σκήκα Πιεξνθνξηθήο Πξφγξακκα Μεηαπηπρηαθψλ πνπδψλ «Πξνεγκέλα πζηήκαηα Πιεξνθνξηθήο»

Παλεπηζηήκην Πεηξαηψο Σκήκα Πιεξνθνξηθήο Πξφγξακκα Μεηαπηπρηαθψλ πνπδψλ «Πξνεγκέλα πζηήκαηα Πιεξνθνξηθήο» Παλεπηζηήκην Πεηξαηψο Σκήκα Πιεξνθνξηθήο Πξφγξακκα Μεηαπηπρηαθψλ πνπδψλ «Πξνεγκέλα πζηήκαηα Πιεξνθνξηθήο» Μεηαπηπρηαθή Γηαηξηβή Σίηινο Γηαηξηβήο Ολνκαηεπψλπκν Φνηηεηή Αξηζκφο Μεηξψνπ Καηεχζπλζε Δπηβιέπσλ

Διαβάστε περισσότερα

ΓΕΩΛΟΓΙΚΕ ΚΑΙ ΓΕΩΜΟΡΦΟΛΟΓΙΚΕ ΠΑΡΑΣΗΡΗΕΙ ΣΗ ΝΗΟ ΠΑΡΟ ΜΕ ΣΗ ΧΡΗΙΜΟΠΟΙΗΗ ΜΕΘΟΔΩΝ ΦΩΣΟΕΡΜΗΝΕΙΑ ΚΑΙ GIS

ΓΕΩΛΟΓΙΚΕ ΚΑΙ ΓΕΩΜΟΡΦΟΛΟΓΙΚΕ ΠΑΡΑΣΗΡΗΕΙ ΣΗ ΝΗΟ ΠΑΡΟ ΜΕ ΣΗ ΧΡΗΙΜΟΠΟΙΗΗ ΜΕΘΟΔΩΝ ΦΩΣΟΕΡΜΗΝΕΙΑ ΚΑΙ GIS ΔΘΝΙΚΟ ΚΑΙ ΚΑΠΟΓΙΣΡΙΑΚΟ ΠΑΝΔΠΙΣΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΩΝ ΠΟΤΓΩΝ ΣΟΤ ΣΜΗΜΑΣΟ ΓΔΩΛΟΓΙΑ ΔΙΓΙΚΔΤΗ: ΓΔΩΓΡΑΦΙΑ ΚΑΙ ΠΔΡΙΒΑΛΛΟΝ ΓΕΩΛΟΓΙΚΕ ΚΑΙ ΓΕΩΜΟΡΦΟΛΟΓΙΚΕ ΠΑΡΑΣΗΡΗΕΙ ΣΗ ΝΗΟ ΠΑΡΟ ΜΕ ΣΗ ΧΡΗΙΜΟΠΟΙΗΗ ΜΕΘΟΔΩΝ

Διαβάστε περισσότερα

COMPUTER ENGINEERING AND INFORMATICS DEPARTMENT

COMPUTER ENGINEERING AND INFORMATICS DEPARTMENT ΠΑΝΔΠΙΣΗΜΙΟ ΠΑΣΡΩΝ ΣΜΗΜΑ ΜΗΥΑΝΙΚΩΝ Η/Τ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗ Αλάπηπμε κεζόδνπ κε ζθνπό ηελ αλαγλώξηζε θαη εμαγωγή ζεκαηηθώλ ιέμεωλ θιεηδηώλ από δηεπζύλζεηο ηζηνζειίδωλ ηνπ ειιεληθνύ Γηαδηθηύνπ Βνληηζάλνπ Μαξία-Αιεμάλδξα

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ. Νέεσ τάςεισ έρευνασ ςτο μάρκετινγκ των υπηρεςιών.

ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ. Νέεσ τάςεισ έρευνασ ςτο μάρκετινγκ των υπηρεςιών. ΑΡΙΣΟΣΔΛΔΙΟ ΠΑΝΔΠΙΣΗΜΙΟ ΘΔΑΛΟΝΙΚΗ ΣΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΔΠΙΣΗΜΩΝ ΜΔΣΑΠΣΤΥΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΠΟΤΓΩΝ ΣΗΝ ΓΙΟΙΚΗΗ ΚΑΙ ΟΙΚΟΝΟΜΙΑ, ΚΑΣΔΤΘΤΝΗ ΣΗ ΓΙΟΙΚΗΗ ΤΠΗΡΔΙΩΝ, ΔΞΔΙΓΙΚΔΤΗ LOGISTICS, ΑΛΤΙΓΑ ΠΡΟΣΙΘΔΜΔΝΗ ΑΞΙΑ ΔΙΠΛΩΜΑΣΙΚΗ

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΔΠΙΣΗΜΙΟ ΑΘΗΝΧΝ ΣΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗ ΜΔΣΑΠΣΤΥΙΑΚΟ ΓΙΠΛΧΜΑ ΔΙΓΙΚΔΤΗ (MSc) ζηα ΠΛΗΡΟΦΟΡΙΑΚΑ ΤΣΗΜΑΣΑ ΓΙΠΛΩΜΑΣΙKH ΔΡΓΑΙΑ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΔΠΙΣΗΜΙΟ ΑΘΗΝΧΝ ΣΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗ ΜΔΣΑΠΣΤΥΙΑΚΟ ΓΙΠΛΧΜΑ ΔΙΓΙΚΔΤΗ (MSc) ζηα ΠΛΗΡΟΦΟΡΙΑΚΑ ΤΣΗΜΑΣΑ ΓΙΠΛΩΜΑΣΙKH ΔΡΓΑΙΑ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΔΠΙΣΗΜΙΟ ΑΘΗΝΧΝ ΣΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗ ΜΔΣΑΠΣΤΥΙΑΚΟ ΓΙΠΛΧΜΑ ΔΙΓΙΚΔΤΗ (MSc) ζηα ΠΛΗΡΟΦΟΡΙΑΚΑ ΤΣΗΜΑΣΑ ΓΙΠΛΩΜΑΣΙKH ΔΡΓΑΙΑ «Γίθηπα Φεκηνθπςειώλ: Δπηρεηξεκαηηθέο Δπηινγέο θαη Γηαρείξηζε Παξεκβνιώλ»

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΣΟ ΠΑΝΕΠΙΣΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΠΟΤΓΩΝ ΜΔΣΑΠΣΤΥΙΑΚΔ ΠΟΤΓΔ ΣΑ ΜΑΘΗΜΑΣΙΚΑ ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ ΝΕΤΡΩΝΙΚΑ ΔΙΚΣΤΑ ΠΡΟΟΜΟΙΩΗ ΣΟΤ ΑΝΘΡΩΠΙΝΟΤ ΕΓΚΕΦΑΛΟΤ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΣΟ ΠΑΝΕΠΙΣΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΠΟΤΓΩΝ ΜΔΣΑΠΣΤΥΙΑΚΔ ΠΟΤΓΔ ΣΑ ΜΑΘΗΜΑΣΙΚΑ ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ ΝΕΤΡΩΝΙΚΑ ΔΙΚΣΤΑ ΠΡΟΟΜΟΙΩΗ ΣΟΤ ΑΝΘΡΩΠΙΝΟΤ ΕΓΚΕΦΑΛΟΤ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΣΟ ΠΑΝΕΠΙΣΗΜΙΟ ΥΟΛΗ ΘΕΣΙΚΩΝ ΕΠΙΣΗΜΩΝ ΚΑΙ ΣΕΥΝΟΛΟΓΙΑ ΠΡΟΓΡΑΜΜΑ ΠΟΤΓΩΝ ΜΔΣΑΠΣΤΥΙΑΚΔ ΠΟΤΓΔ ΣΑ ΜΑΘΗΜΑΣΙΚΑ ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ ΝΕΤΡΩΝΙΚΑ ΔΙΚΣΤΑ ΠΡΟΟΜΟΙΩΗ ΣΟΤ ΑΝΘΡΩΠΙΝΟΤ ΕΓΚΕΦΑΛΟΤ ΠΛΔΡΟΤ ΑΝΣΩΝΙΑ

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ ΘΕΜΑ: ΔΙΑΧΕΙΡΙΗ ΑΕΡΟΠΟΡΙΚΟΤ ΤΛΙΚΟΤ

ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ ΘΕΜΑ: ΔΙΑΧΕΙΡΙΗ ΑΕΡΟΠΟΡΙΚΟΤ ΤΛΙΚΟΤ ΔΙΠΛΩΜΑΣΙΚΗ ΕΡΓΑΙΑ ΘΕΜΑ: ΔΙΑΧΕΙΡΙΗ ΑΕΡΟΠΟΡΙΚΟΤ ΤΛΙΚΟΤ Επιμέλεια: Ευαγγελία Δολαψάκη Επιβλέπων: Ιωάννης Μαρινάκης ΧΑΝΙΑ 2010 ΠΔΡΗΛΖΦΖ... 3 ΔΗΑΓΧΓΖ... 4 ΚΔΦΑΛΑΗΟ 1: ΒΑΗΚΔ ΓΗΑΓΗΚΑΗΔ ΔΦΟΓΗΑΣΗΚΖ ΑΛΤΗΓΑ ΔΝΟ

Διαβάστε περισσότερα

Παλεπηζηήκην Πεηξαηψο Τκήκα Πιεξνθνξηθήο

Παλεπηζηήκην Πεηξαηψο Τκήκα Πιεξνθνξηθήο Παλεπηζηήκην Πεηξαηψο Τκήκα Πιεξνθνξηθήο Πξφγξακκα Μεηαπηπρηαθψλ Σπνπδψλ «Πξνεγκέλα Σπζηήκαηα Πιεξνθνξηθήο» Μεηαπηπρηαθή Γηαηξηβή Τίηινο Γηαηξηβήο Μοντελοποίηση Χρηστών και Στερεότυπα για Προσαρμοστικότητα

Διαβάστε περισσότερα

Η ΤΜΒΟΛΗ ΣΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΤΣΗΜΑΣΩΝ ΣΗ ΓΙΟΙΚΗΗ ΠΑΡΑΓΩΓΗ

Η ΤΜΒΟΛΗ ΣΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΤΣΗΜΑΣΩΝ ΣΗ ΓΙΟΙΚΗΗ ΠΑΡΑΓΩΓΗ ΓΙΑΣΜΗΜΑΣΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΩΝ ΠΟΤΓΩΝ ΣΗ ΓΙΟΙΚΗΗ ΔΠΙΥΔΙΡΗΔΩΝ ΓΙΑ ΣΔΛΔΥΗ ΔΠΙΥΔΙΡΗΔΩΝ EXECUTIVE MBA ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ Η ΤΜΒΟΛΗ ΣΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΤΣΗΜΑΣΩΝ ΣΗ ΓΙΟΙΚΗΗ ΠΑΡΑΓΩΓΗ ΙΓΗΡΟΠΟΤΛΟΤ ΔΤΣΤΥΙΑ Δπηβιέπνπζα

Διαβάστε περισσότερα

Δθαξκνγή Σερληθώλ Σαηξηάζκαηνο Οληνινγηώλ γηα Απηόκαηεο Οληόηεηεο Ηιεθηξνληθώλ Αγνξώλ (Shopbots)

Δθαξκνγή Σερληθώλ Σαηξηάζκαηνο Οληνινγηώλ γηα Απηόκαηεο Οληόηεηεο Ηιεθηξνληθώλ Αγνξώλ (Shopbots) ΔΘΝΙΚΟ ΚΑΙ ΚΑΠΟΓΙΣΡΙΑΚΟ ΠΑΝΔΠΙΣΗΜΙΟ ΑΘΗΝΧΝ ΧΟΛΗ ΘΕΣΙΚΩΝ ΕΠΙΣΗΜΩΝ ΣΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΣΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΠΣΤΥΙΑΚΗ ΔΡΓΑΙΑ Δθαξκνγή Σερληθώλ Σαηξηάζκαηνο Οληνινγηώλ γηα Απηόκαηεο

Διαβάστε περισσότερα

Μέζνδνη Αμηνιόγεζεο Δθπαηδεπηηθνύ Λνγηζκηθνύ ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ

Μέζνδνη Αμηνιόγεζεο Δθπαηδεπηηθνύ Λνγηζκηθνύ ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ΔΘΝΙΚΟ ΜΔΣΟΒΙΟ ΠΟΛΤΣΔΥΝΔΙΟ ΥΟΛΗ ΔΦΑΡΜΟΜΔΝΩΝ ΜΑΘΗΜΑΣΙΚΩΝ ΚΑΙ ΦΤΙΚΩΝ ΔΠΙΣΗΜΩΝ ΣΟΜΔΑ ΑΝΘΡΩΠΙΣΙΚΩΝ, ΚΟΙΝΩΝΙΚΩΝ ΔΠΙΣΗΜΩΝ ΚΑΙ ΓΙΚΑΙΟΤ Μέζνδνη Αμηνιόγεζεο Δθπαηδεπηηθνύ Λνγηζκηθνύ ΓΙΠΛΩΜΑΣΙΚΗ ΔΡΓΑΙΑ ηεο ΡΑΛΛΙΑ

Διαβάστε περισσότερα

Παλεπηζηήκην Γπηηθήο Μαθεδνλίαο Σκήκα Μεραληθψλ Πιεξνθνξηθήο θαη Σειεπηθνηλσληψλ. Always Best Connected

Παλεπηζηήκην Γπηηθήο Μαθεδνλίαο Σκήκα Μεραληθψλ Πιεξνθνξηθήο θαη Σειεπηθνηλσληψλ. Always Best Connected Παλεπηζηήκην Γπηηθήο Μαθεδνλίαο Σκήκα Μεραληθψλ Πιεξνθνξηθήο θαη Σειεπηθνηλσληψλ Always Best Connected Τινπνίεζε κεραληζκψλ επηινγήο δηθηχνπ πξφζβαζεο ζε πεξηβάιινληα θηλεηψλ επηθνηλσληψλ 4 εο Γεληάο Καλτςάσ

Διαβάστε περισσότερα

Αλάπηπμε έμππλνπ ζπζηήκαηνο γηα ηελ θαηεγνξηνπνίεζε θαξθίλνπ ηνπ πξνζηάηε κε ρξήζε ηερληθώλ αλάιπζεο πθήο θαηά Haralick ΓΙΠΛΧΜΑΣΙΚΗ ΔΡΓΑΙΑ

Αλάπηπμε έμππλνπ ζπζηήκαηνο γηα ηελ θαηεγνξηνπνίεζε θαξθίλνπ ηνπ πξνζηάηε κε ρξήζε ηερληθώλ αλάιπζεο πθήο θαηά Haralick ΓΙΠΛΧΜΑΣΙΚΗ ΔΡΓΑΙΑ ΔΘΝΙΚΟ ΜΔΣΟΒΙΟ ΠΟΛΤΣΔΥΝΔΙΟ ΥΟΛΗ ΗΛΔΚΣΡΟΛΟΓΩΝ ΜΗΥΑΝΙΚΩΝ ΚΑΙ ΜΗΥΑΝΙΚΩΝ ΤΠΟΛΟΓΙΣΩΝ ΣΟΜΔΑ ΗΛΔΚΣΡΟΜΑΓΝΗΣΙΚΧΝ ΔΦΑΡΜΟΓΧΝ, ΗΛΔΚΣΡΟΟΠΣΙΚΗ ΚΑΙ ΗΛΔΚΣΡΟΝΙΚΧΝ ΤΛΙΚΧΝ Αλάπηπμε έμππλνπ ζπζηήκαηνο γηα ηελ θαηεγνξηνπνίεζε

Διαβάστε περισσότερα

Κεθάιαην 1: Δηζαγσγή. 4. 1.1 Γεληθά... 4. 1.2 Υαξαθηεξηζηηθά ππεξεζηψλ. 8. 1.3 Οξηζκφο θαη δηαζηάζεηο πνηφηεηαο... 18. 1.4 Πνηφηεηα ππεξεζηψλ.

Κεθάιαην 1: Δηζαγσγή. 4. 1.1 Γεληθά... 4. 1.2 Υαξαθηεξηζηηθά ππεξεζηψλ. 8. 1.3 Οξηζκφο θαη δηαζηάζεηο πνηφηεηαο... 18. 1.4 Πνηφηεηα ππεξεζηψλ. Πεξηερφκελα Κεθάιαην 1: Δηζαγσγή. 4 1.1 Γεληθά... 4 1.2 Υαξαθηεξηζηηθά ππεξεζηψλ. 8 1.3 Οξηζκφο θαη δηαζηάζεηο πνηφηεηαο... 18 1.4 Πνηφηεηα ππεξεζηψλ. 24 Κεθάιαην 2: Έιεγρνο δηαδηθαζηψλ ζηηο ππεξεζίεο...

Διαβάστε περισσότερα