ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ

Σχετικά έγγραφα
Περιεχόμενα. Πρόλογος... 15

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Εισαγωγή στη Στατιστική

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αναγνώριση Προτύπων Ι

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

Ομαδοποίηση ΙΙ (Clustering)

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Βιοστατιστική ΒΙΟ-309

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Ευφυής Προγραμματισμός

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Τεχνικές Εξόρυξης Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

Βιοστατιστική ΒΙΟ-309

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Έρευνα Μάρκετινγκ Ενότητα 5

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ

Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

3η Ενότητα Προβλέψεις

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος

Στατιστική Επιχειρήσεων Ι

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11

Εισόδημα Κατανάλωση

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017


Βιοστατιστική ΒΙΟ-309

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων.

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

ιαµέριση - Partitioning

ΑΝΤΙΚΕΙΜΕΝΟ Ι. ΓΙΑΝΝΑΤΣΗΣ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

Συνοπτικά περιεχόμενα

Ζητήματα ηήμ με τα δεδομένα

Ομαδοποίηση Ι (Clustering)

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ «Η χρήση των Analytics ως εργαλείο εξόρυξης και ανάλυσης δεδομένων για την εξαγωγή ποσοτικών δεικτών μέτρησης απόδοσης και τη δημιουργία αξίας σε μεγάλους οργανισμούς» Ασημακόπουλος Αλέξιος Αριθμός Μητρώου: ΜΜ4110003 Επιβλέπων Καθηγητής: κ. Καπουτσής Ηλίας ΑΘΗΝΑ, ΔΕΚΕΜΒΡΙΟΣ 2013

ΕΥΧΑΡΙΣΤΙΕΣ Αισθάνομαι την υποχρέωση να εκφράσω τις ευχαριστίες μου σε ορισμένα άτομα των οποίων οι συμβουλές υπήρξαν καθοριστικές στην ολοκλήρωση της παρούσας Διπλωματικής Εργασίας. Πρώτα απ όλους θα ήθελα να ευχαριστήσω τον υπεύθυνο καθηγητή μου κ. Ηλία Καπουτσή, για την εμπιστοσύνη που μου επέδειξε αναθέτοντας μου αυτή την εργασία, τον χρόνο που διέθεσε για την ανάπτυξη των ιδεών, την καθοδήγηση του και την υπομονή που έδειξε κατά τη διάρκεια της υλοποίησης αυτής. Παράλληλα η υποστήριξη και η συνεργασία με πολλούς από τους συναδέλφους μου κατά την υλοποίηση της παρούσας εργασίας υπήρξε μια σημαντική εμπειρία και τα οφέλη που αποκόμισα είναι αναρίθμητα. Το ίδιο ισχύει και για τους συμφοιτητές μου, στο μεταπτυχιακό πρόγραμμα από τους οποίους αποκόμισα σημαντικές εμπειρίες και γνώσεις. Τέλος, ως ελάχιστη ένδειξη ευγνωμοσύνης, θα ήθελα να αφιερώσω την προσπάθεια αυτή στην μητέρα μου Βασιλική Ασημακοπούλου, στον πατέρα μου Γρηγόριο Ασημακόπουλο και στον αδερφό μου Γεώργιο Ασημακόπουλο για την στήριξη και την συμπαράσταση που μου παρείχαν τα τελευταία 2 χρόνια της παρακολούθησης του μεταπτυχιακού προγράμματος στα Πληροφοριακά Συστήματα.

ΠΕΡΙΛΗΨΗ Στη παρούσα διπλωματική εργασία επιχειρείται να αναλυθεί ένα από τα βασικά προβλήματα που αντιμετωπίζουν οι σύγχρονοι οργανισμοί με τη διαχείριση, την ανάλυση και την αξιοποίηση μεγάλου όγκου δεδομένων. Παρουσιάζονται τρόποι διαχείρισης και ποσοτικής ανάλυσης δεδομένων, τεχνικές εξόρυξης δεδομένων, οι μεθοδολογίες ανάλυσης παραγόντων και επιλογής μεταβλητών καθώς και οι αλγόριθμοι τμηματοποίησης. Αναλύεται ο τρόπος δημιουργίας και η παρακολούθηση δεικτών μέτρησης απόδοσης (KPIs) και παρουσιάζονται μια σειρά από ενδεικτικούς δείκτες ανά επιχειρησιακά κλάδο, που θεωρούνται σημαντικοί για την δημιουργία αξίας και γνώσης για τους οργανισμούς. Οι εταιρείες πώλησης προϊόντων λιανικής (Retail), οι εταιρείες τηλεπικοινωνιών (Telecommunications) και οι τραπεζικοί οργανισμοί (Banking) επιλέχθηκαν ως οι τρεις επιχειρησιακοί κλάδοι για τους οποίους θα υλοποιηθεί η ανάλυση των δεδομένων για τρεις επιλεγμένους οργανισμούς. Χρησιμοποιήθηκε το εργαλείο SPSS Statistics, στο οποίο εφαρμόστηκαν αρκετές διαθέσιμες τεχνικές εξόρυξης και ποσοτικής ανάλυσης δεδομένων για τη δημιουργία αξίας και γνώσης των οργανισμών. Η παρούσα εργασία καταλήγει με συγκεκριμένα συμπεράσματα σχετικά με τον τρόπο επιλογής των κατάλληλων δεικτών KPIs και την αξιοποίηση αυτών για τη δημιουργία ανταγωνιστικού πλεονεκτήματος. 1

ABSTRACT In this thesis we analyze one of the main problems faced by modern organizations regarding the management, analysis and usage of large scale data. It is presented advanced data management and quantitative analysis methods, data mining techniques, factor analysis methodologies, feature and variables selection techniques and clustering algorithms. The way of creating and monitoring key performance indicators (KPIs) is analyzed and a number of illustrative indicators by business industry are presented. These KPIs are used from organization for value creation and knowledge development. Retail, Telecommunications and Banking institutions were selected as the three major industries in order to implement data analysis for three selected leading organizations. SPSS Statistics tool is used in order to implement several available data mining techniques and quantitative data analysis in order to create additional value and knowledge for the organizations. This thesis concludes to ways of selecting the appropriate key performance indicators (KPIs) and how to use and leverage them so as to create business competitive advantage. 2

ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή... 7 1.1 Επισκόπηση Περιεχομένων... 9 2. Τεχνικές ανάλυσης και εξόρυξης δεδομένων (Data Analytics & Mining)... 11 2.1 Κατηγοριοποίηση (Classification)... 12 2.2 Παλινδρόμηση (Regression)... 13 2.3 Ανάλυση Χρονοσειρών (Time Series Analysis)... 14 2.4 Πρόβλεψη (Prediction)... 14 2.5 Συσταδοποίηση (Clustering)... 14 2.6 Παρουσίαση Συνόψεων (Summarization)... 15 2.7 Ανάλυση Κανόνων Συσχετίσεων (Association Rules)... 15 2.8 Ανακάλυψη Ακολουθιών (Sequential Pattern Discovery)... 16 2.9 Είδη Δομών: Μοντέλα και Πρότυπα... 16 2.9.1 Κριτήρια Αξιολόγησης... 17 2.9.2 Βελτιστοποίηση και Αναζήτηση... 18 2.9.3 Διαχείριση των Δεδομένων... 18 2.10 Διαχείριση Ποιότητας Δεδομένων (Data QA)... 19 2.10.1 Προ-επεξεργασία Δεδομένων (Data Cleansing)... 21 2.10.2 Εντοπισμός των μη φυσιολογικών τιμών (Abnormal Values)... 21 2.10.3 Εντοπισμός των ελλιπών παρατηρήσεων (Missing Values)... 21 2.11 Επιλογή Μεταβλητών (Variables Selection)... 23 2.11.1 Ανάλυση Συσχετίσεων (Correlation Matrix)... 23 2.11.2 Ανάλυση Κύριων Συνιστωσών (Principal Components Analysis - PCA)... 24 2.12 Διαθέσιμες Μεθοδολογίες Τμηματοποίησης (Clustering Techniques)... 25 2.12.1 K Means... 26 2.12.2 Hierarchical... 27 2.12.3 Αξιολόγηση μεθόδων Συσταδοποίησης (Clustering Evaluation)... 29 2.13 Ανάλυση Παραγόντων (Factor Analysis)... 30 2.13.1 Εξαγωγή Παραγόντων (Factor Extraction)... 31 2.13.2 Ιδιοτιμή (Eigenvalue)... 31 2.13.3 Οι ιδιοτιμές και το πρόβλημα της επιλογής του αριθμού των παραγόντων... 32 2.13.4 Διάγραμμα Scree (Scree Plot)... 33 2.13.5 Επιλογή κατάλληλου κριτηρίου... 33 3. Διαχείριση Απόδοσης και Δείκτες Μέτρησης Απόδοσης (KPIs)... 34 3

3.1 Επιχειρησιακό περιβάλλον (Business Context)... 35 3.2 Δείκτες Μέτρησης Απόδοσης (Key Performance Indicators KPIs)... 37 3.3 Πρόσθετα χαρακτηριστικά Δεικτών Μέτρησης Απόδοσης... 38 3.4 Δημιουργία κατάλληλων Δεικτών (KPIs Creation)... 39 3.5 Παραδείγματα KPIs ανά επιχειρησιακό κλάδο... 45 3.5.1 Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail)... 45 3.5.2 Εταιρεία Τηλεπικοινωνιών (Telecommunications)... 49 3.5.3 Τραπεζικός Οργανισμός (Banking)... 54 4. Δημιουργία Αξίας (Value Creation from Analytics)... 59 5. Ανάλυση Δεδομένων Οργανισμών... 62 5.1 Τραπεζικός Οργανισμός (Banking)... 63 5.1.1 Ανάλυση μεταβλητών Τραπεζικού Οργανισμού... 63 5.1.2 Ανάλυσης συχνοτήτων μεταβλητών Τραπεζικού Οργανισμού... 64 5.1.3 Ανάλυση συσχετίσεων μεταβλητών Τραπεζικού Οργανισμού... 67 5.1.4 Ανάλυση παραγόντων μεταβλητών Τραπεζικού Οργανισμού... 68 5.1.5 Scree Plot μεταβλητών Τραπεζικού Οργανισμού... 70 5.1.6 Ιεραρχική τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs... 71 5.2 Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail)... 73 5.2.1 Ανάλυση περιεχόμενου καλαθιού (Basket analysis)... 73 5.2.2 Ανάλυση Συμπεριφοράς (Behavioral analysis)... 80 5.3 Εταιρεία Τηλεπικοινωνιών (Telecommunications)... 86 5.3.1 Ανάλυσης συχνοτήτων μεταβλητών Εταιρείας Τηλεπικοινωνιών... 87 5.3.2 Ανάλυση συσχετίσεων μεταβλητών Εταιρείας Τηλεπικοινωνιών... 88 5.3.3 Ανάλυση παραγόντων μεταβλητών Εταιρείας Τηλεπικοινωνιών... 89 5.3.4 Scree Plot μεταβλητών Εταιρείας Τηλεπικοινωνιών... 93 5.3.5 K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs... 94 6. Συμπεράσματα και Προτάσεις... 95 7. Βιβλιογραφία... 99 4

ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ Πίνακας 1. Διαστάσεις διαχείρισης δεδομένων... 19 Πίνακας 2. Πίνακας Συχνοτήτων... 20 Πίνακας 3. Χαρακτηριστικά αριθμητικών μεταβλητών ως προς την ποιότητα δεδομένων... 20 Πίνακας 4. Ενδεικτικός Πίνακας Συσχετίσεων... 23 Πίνακας 5. Παραγόμενος πίνακας ανάλυσης παραγόντων... 31 Πίνακας 6. Πίνακας ιδιοτιμών ανάλυσης παραγόντων... 32 Πίνακας 7. Παραδείγματα δεικτών μέτρησης για Χρηματοοικονομικά... 40 Πίνακας 8. Ενδεικτικά KPIs Εταιρειών Πώλησης Προϊόντων Λιανικής... 48 Πίνακας 9. Ενδεικτικά KPIs Εταιρείας Τηλεπικοινωνιών... 53 Πίνακας 10. Ενδεικτικά KPIs Τραπεζικού Οργανισμού... 58 Πίνακας 11. Πίνακας KPIs Τραπεζικών Οργανισμών (Banking)... 64 Πίνακας 12. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 1/3... 65 Πίνακας 13. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 2/3... 65 Πίνακας 14. Πίνακας κατανομής συχνοτήτων όγκου πωλήσεων... 66 Πίνακας 15. Πίνακας κατανομής συχνοτήτων επιπέδου ικανοποίησης με τη τράπεζα... 66 Πίνακας 16. Πίνακας κατανομής συχνοτήτων επιθυμίας για αλλαγή τράπεζας... 66 Πίνακας 17. Πίνακας κατανομής συχνοτήτων χρήσης account officer... 66 Πίνακας 18. Πίνακας κατανομής συχνοτήτων χρήσης βοηθού account officer... 66 Πίνακας 19. Πίνακας ανάλυσης συσχετίσεων KPIs τραπεζικού οργανισμού... 68 Πίνακας 20. Πίνακας ανάλυσης παραγόντων KPIs τραπεζικού οργανισμού... 69 Πίνακας 21. Πίνακας ανάλυσης βαρών KPIs τραπεζικού οργανισμού... 69 Πίνακας 22. Συντελεστές για κάθε KPI τραπεζικού οργανισμού στους νέους factors... 70 Πίνακας 23. Πίνακας ανάλυσης περιεχόμενου καλαθιού (Basket analysis)... 74 Πίνακας 24. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού... 74 Πίνακας 25. Πίνακας ανάλυσης συσχετίσεων μεταβλητών περιεχόμενου καλαθιού... 75 Πίνακας 26. Πίνακας ανάλυσης παραγόντων μεταβλητών περιεχόμενου καλαθιού... 76 Πίνακας 27. Πίνακας ανάλυσης βαρών μεταβλητών περιεχόμενου καλαθιού... 76 Πίνακας 28. Πίνακας συντελεστών για κάθε KPI στους νέους factors... 77 Πίνακας 29. Αποστάσεις μεταξύ των κέντρων των clusters της k-means... 78 Πίνακας 30. Πίνακας ανάλυσης συμπεριφοράς (Behavioral analysis)... 80 Πίνακας 31. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού... 81 Πίνακας 32. Πίνακας ανάλυσης συσχετίσεων μεταβλητών ανάλυσης συμπεριφοράς... 81 Πίνακας 33. Πίνακας ανάλυσης παραγόντων μεταβλητών ανάλυσης συμπεριφοράς... 82 Πίνακας 34. Πίνακας ανάλυσης βαρών μεταβλητών συμπεριφοράς... 83 Πίνακας 35. Πίνακας συντελεστών για κάθε KPI συμπεριφοράς στους νέους factors... 83 Πίνακας 36. Αποστάσεις μεταξύ των κέντρων των clusters (k-means)... 85 Πίνακας 37. Πίνακας εταιρείας τηλεπικοινωνιών (Telecommunications)... 87 Πίνακας 38. Πίνακας ανάλυσης συχνοτήτων μεταβλητών εταιρείας τηλεπικοινωνιών... 88 Πίνακας 39. Πίνακας ανάλυσης συσχετίσεων μεταβλητών εταιρείας τηλεπικοινωνιών... 89 Πίνακας 40. Πίνακας ανάλυσης παραγόντων μεταβλητών εταιρείας τηλεπικοινωνιών... 90 Πίνακας 41. Πίνακας ανάλυσης βαρών μεταβλητών εταιρείας τηλεπικοινωνιών... 91 Πίνακας 42. Συντελεστές για κάθε KPI εταιρείας τηλεπικοινωνιών στους νέους factors... 92 Πίνακας 43. Αποστάσεις μεταξύ των κέντρων των clusters (k-means)... 94 5

ΚΑΤΑΛΟΓΟΣ ΓΡΑΦΗΜΑΤΩΝ Γράφημα 1. Διαδικασία υλοποίησης ποσοτικής ανάλυσης δημιουργία αξίας... 8 Γράφημα 2. Μία συγκεντρωτική εικόνα των κυριότερων εργασιών εξόρυξης δεδομένων... 12 Γράφημα 3. Ενδεικτικά γραφήματα συχνοτήτων... 22 Γράφημα 4. Γραφική απεικόνιση μεθόδων συσταδοποίησης (Clustering)... 25 Γράφημα 5. Γραφική απεικόνιση αλγορίθμου K-Means... 26 Γράφημα 6. Γραφική απεικόνιση K-Means... 26 Γράφημα 7. Γραφική απεικόνιση μεθόδων Ιεραρχικής συσταδοποίησης... 28 Γράφημα 8. Μέθοδοι σύνδεσης (Linkage Methods)... 28 Γράφημα 9. Ενδεικτικό δενδρόγραμμα... 29 Γράφημα 10. Γραφική απεικόνιση αξιολόγηση μιας μη ιεραρχικής συσταδοποίησης... 29 Γράφημα 11. Ενδεικτικό διάγραμμα Scree Plot... 33 Γράφημα 12. Η βασική δομή της διαχείρισης απόδοσης... 34 Γράφημα 13. Πυραμίδα στρατηγικής δημιουργίας KPIs... 43 Γράφημα 14. Διαδικασία δημιουργία αξίας για την λήψη αποφάσεων... 61 Γράφημα 16. Γράφημα κατανομής συχνοτήτων όγκου πωλήσεων... 67 Γράφημα 16. Scree Plot μεταβλητών τραπεζικού οργανισμού... 71 Γράφημα 17. Αποτελέσματα ιεραρχικής τμηματοποίησης τραπεζικών δεδομένων... 72 Γράφημα 18. Scree Plot μεταβλητών περιεχόμενου καλαθιού... 78 Γράφημα 19. Αποτελέσματα k-means τμηματοποίησης περιεχόμενου καλαθιού... 79 Γράφημα 20. Scree Plot μεταβλητών ανάλυσης συμπεριφοράς... 84 Γράφημα 21. Γράφημα αποτελεσμάτων k-means τμηματοποίησης ανάλυσης συμπεριφοράς 85 Γράφημα 22. Scree Plot μεταβλητών εταιρείας τηλεπικοινωνιών... 93 Γράφημα 23. Αποτελέσματα k-means τμηματοποίησης εταιρείας τηλεπικοινωνιών... 94 6

1. Εισαγωγή Η αλματώδης ανάπτυξη της τεχνολογίας τα τελευταία χρόνια, έχει βοηθήσει τους οργανισμούς να αποθηκεύουν και να διαχειρίζονται ένα τεράστιο όγκο δεδομένων. Τα ερωτήματα που δημιουργούνται από την εξέλιξη αυτή είναι πολλά, με το κυριότερο από αυτά να αναφέρεται στο τρόπο που αυτά τα δεδομένα μπορούν να αξιοποιηθούν, να μετατραπούν σε κατάλληλους δείκτες μέτρησης και τέλος να δημιουργηθεί αξία και νέα γνώση. Ο μεγάλος όγκος δεδομένων που συλλέγεται από τους σύγχρονους οργανισμούς, θα μπορούσε να ξεπεράσει την ικανότητα διαχείρισης και αξιοποίησης τους αν δεν υπήρχε η βελτίωση της ικανότητας του ανθρώπου να κατανοήσει και να αξιοποιήσει τις αποθηκευμένες πληροφορίες. Οι τεχνικές εξόρυξης δεδομένων αξιοποιούν μεθόδους και εργαλεία τα οποία προέρχονται από τεχνικές μάθησης και τα οποία αυτοματοποιούν σύνθετες διαδικασίες δημιουργίας δεικτών μέτρησης και δημιουργίας αξίας, γνώσης και συμπερασμάτων από μεγάλο όγκο δεδομένων. Το βασικό ερευνητικό ερώτημα της παρούσας εργασίας είναι να εφαρμοστούν τεχνικές εξόρυξης (Data mining) και ποσοτικής ανάλυσης δεδομένων (Analytics) για τη δημιουργία και την επιλογή των κατάλληλων δεικτών (Metrics) που είναι αντιπροσωπευτικοί για την δημιουργία προστιθέμενης αξίας και γνώσης σε βασικές κατηγορίες επιχειρήσεων (Industries) όπως είναι οι Εταιρείες Τηλεπικοινωνιών (Telecommunications), οι Τραπεζικοί Οργανισμοί (Banking) και οι Εταιρείες Πώλησης Προϊόντων Λιανικής (Retail). Το ερώτημα αυτό θα απαντηθεί με την εφαρμογή των κατάλληλων τεχνικών εξόρυξης δεδομένων, τη δημιουργία και την επιλογή των κατάλληλων δεικτών (KPIs & Feature Selection) με τη χρήση των απαραίτητων ποσοτικών τεχνικών (Correlation and Factor Analysis). Το αποτέλεσμα των αναλύσεων που θα υλοποιηθούν θα είναι η επιλογή των αντιπροσωπευτικών δεικτών ανά κλάδο που θα δημιουργούν αξία και γνώση από τα διαθέσιμα δεδομένα της εκάστοτε επιχείρησης. Η βασικά βήματα της διαδικασίας που θα ακολουθηθεί παρουσιάζονται στο ακόλουθο διάγραμμα: 7

Γράφημα 1. Διαδικασία υλοποίησης ποσοτικής ανάλυσης δημιουργία αξίας Στη παρούσα εργασία θα γίνει χρήση μιας σειρά από βασικές έννοιες, οι οποίες θα χρησιμοποιηθούν σε μεγάλο βαθμό για την υλοποίηση των αναλύσεων και την εξαγωγή των κατάλληλων δεικτών ανά επιχειρησιακό οργανισμό. Εισάγεται η έννοια της ποσοτικής ανάλυσης δεδομένων (data analytics), η οποία θα χρησιμοποιηθεί σε μεγάλο βαθμό για την υλοποίηση των αναλύσεων στους τρεις επιλεγμένες οργανισμούς. Θα γίνει χρήση διάφορων στατιστικών τεχνικών και αλγορίθμων τμηματοποίησης των δεδομένων. Θα πραγματοποιηθεί μια εκτενής περιγραφή των μεθόδων εξόρυξης δεδομένων (data mining) και διαχείρισης δεδομένων (data management) από βάσεις δεδομένων μεγάλης κλίμακας (large scale databases). Περιγράφονται οι τρόποι οι οποίοι μπορούν να εφαρμοστούν για να προκύψει αξιοποιήσιμη πληροφορία από την επεξεργασία πρωτογενών δεδομένων. Περιγράφεται ο τρόπος της δημιουργίας και της παρακολούθησης των κατάλληλων δεικτών μέτρησης KPIs για τον εκάστοτε επιχειρησιακό κλάδο και οι μέθοδοι επιλογής των κατάλληλων δεικτών που μπορούν να δημιουργήσουν προστιθέμενη αξία. 8

Στη παρούσα εργασία, εφαρμόστηκαν όλοι οι μέθοδοι και οι τεχνικές που περιγράψαμε επιγραμματικά στο εισαγωγικό αυτό κομμάτι και θα αναπτυχθούν λεπτομερώς στη συνέχεια. Επιλέχθηκαν τρεις οργανισμοί διαφορετικών επιχειρησιακών κλάδων όπου θα ήταν δυνατό να αποκτηθούν πρωτογενή δεδομένα που θα μπορέσουν να βοηθήσουν στην υλοποίηση των αναλύσεων της παρούσας εργασίας. Στη συνέχεια, και με τη χρήση του στατιστικού πακέτου SPSS αναπτύχθηκε ο κατάλληλος κώδικας για την εξόρυξη και τη διαχείριση των δεδομένων αυτών, της ποσοτικής ανάλυσης και της εφαρμογής των κατάλληλων τεχνικών για τον προσδιορισμό των κατάλληλων δεικτών KPIs που θα βοηθήσουν στην κατανόηση της λειτουργία του εκάστοτε οργανισμού και της τμηματοποίησης του πελατολογίου του. Η διαδικασία που θα ακολουθηθεί στη παρούσα εργασία συμβάλει στη δημιουργία μιας μεθόδου για την ποσοτική ανάλυση δεδομένων οργανισμών, στην οποία θα είναι δυνατή η δημιουργία αριθμού δεικτών KPIs, από τους οποίους με τις κατάλληλες στατιστικές τεχνικές θα επιλέγονται οι κατάλληλοι για την αξιοποίηση της διαθέσιμης πληροφορίας. Η συγκεκριμένη διαδικασία θα περιγραφεί αναλυτικά στα επόμενα κεφάλαια και θα εφαρμοστεί στη πράξη σε πραγματικά δεδομένα τριών οργανισμών διαφορετικών επιχειρησιακών κλάδων. 1.1 Επισκόπηση Περιεχομένων Η παρούσα εργασία περιλαμβάνει τα ακόλουθα κεφάλαια τα οποία αναφέρονται επιγραμματικά στη συνέχεια. Στο 1 ο κεφάλαιο γίνεται μια εισαγωγή στα βασικά προβλήματα που αντιμετωπίζουν οι σύγχρονοι οργανισμοί από τη διατήρηση και διαχείριση μεγάλου όγκου δεδομένων. Εισάγεται το πρόβλημα το οποίο θα επιχειρηθεί να λυθεί και παρουσιάζεται ο τρόπος και τα εργαλεία που θα υλοποιηθεί αυτό. Στο 2 ο κεφάλαιο παρουσιάζονται οι τεχνικές εξόρυξης δεδομένων, οι τρόποι διαχείρισης και ποσοτικής ανάλυσης των δεδομένων, οι μεθοδολογίες ανάλυσης παραγόντων και επιλογής μεταβλητών καθώς και οι αλγόριθμοι τμηματοποίησης. 9

Στο 3 ο κεφάλαιο παρουσιάζεται η αξία της δημιουργίας δεικτών μέτρησης απόδοσης καθώς και ο τρόπος δημιουργίας τους. Επίσης, παρατίθεται μια σειρά από ενδεικτικούς δείκτες ανά επιχειρησιακά κλάδο, που θεωρούνται σημαντικοί για την δημιουργία αξίας. Στο 4 ο κεφάλαιο αναδεικνύεται η βαρύτητα της κατανόησης των δεδομένων ενός οργανισμού και η αξιοποίηση τους για τη δημιουργία γνώσης και αξίας για να βελτιώσουν το ανταγωνιστικό τους πλεονέκτημα. Στο 5 ο κεφάλαιο πραγματοποιείται η ποσοτική ανάλυση των δεδομένων από τρεις εταιρείες διαφορετικών κλάδων με τη χρήση του στατιστικού πακέτου SPSS, όπου θα επιλεγούν εκείνες οι μεταβλητές που μπορούν να δημιουργήσουν προστιθέμενη αξία στους εκάστοτε οργανισμούς. Στο 6 ο και τελευταίο κεφάλαιο της εργασίας παρουσιάζονται τα συμπεράσματα από την ανάλυση των δεδομένων των τριών επιχειρησιακών κλάδων και παρουσιάζονται ενδεικτικές προτάσεις για μελλοντική έρευνα. 10

2. Τεχνικές ανάλυσης και εξόρυξης δεδομένων (Data Analytics & Mining) Κατά την διαδικασία εξόρυξης δεδομένων (Data Mining) υπάρχουν τρία βασικά βήματα: a. αναζήτηση μοντέλου b. παράσταση μοντέλου c. αξιολόγηση μοντέλου Οι βασικές μέθοδοι αναζήτησης μοντέλου ψάχνουν και για παραμέτρους και για μοντέλα (Fayyad et al., 1996). Στην αναζήτηση παραμέτρων ο αλγόριθμος ψάχνει τις ελεύθερες παραμέτρους που βελτιστοποιούν την απόδοση ενός τελικού μοντέλου. Για απλά προβλήματα η αναζήτηση είναι εύκολη, αλλά για γενικά μοντέλα μία κλειστή λύση δεν είναι εφικτή, και χρησιμοποιούνται μέθοδοι όπως η συζυγής κατάβαση δυναμικού στον αλγόριθμο back-propagation για τα νευρωνικά δίκτυα. Η αναζήτηση μοντέλου από την άλλη ψάχνει για το κατάλληλο μοντέλο ή την οικογένεια μοντέλων και για κάθε μία τέτοια δομή μοντέλου που βρίσκει εφαρμόζει έπειτα την αναζήτηση για τις κατάλληλες παραμέτρους του. Αυτές οι δύο αναζητήσεις είναι χρονοβόρες όταν το μέγεθος του χώρου αναζήτησης είναι μεγάλο και οι υλοποιήσεις τους επωφελούνται ιδιαίτερα από τις τεχνικές παραλληλισμού. Ένα προβλεπτικό μοντέλο (predictive model) κάνει μια πρόβλεψη για τις τιμές των δεδομένων, χρησιμοποιώντας γνωστά αποτελέσματα που έχει βρει από άλλα δεδομένα. Η μοντελοποίηση πρόβλεψης μπορεί να γίνει με βάση τη χρήση ιστορικών δεδομένων. Οι εργασίες εξόρυξης γνώσης από δεδομένα για το χτίσιμο ενός προβλεπτικού μοντέλου περιλαμβάνουν Κατηγοριοποίηση ή ταξινόμηση (Classification) Παλινδρόμηση (Regression) Ανάλυση χρονολογικών σειρών (Time Series Analysis) Πρόβλεψη (Prediction - Forecast) 11

Ένα περιγραφικό μοντέλο (descriptive model) αναγνωρίζει πρότυπα ή συσχετίσεις στα δεδομένα. Αντίθετα από το προβλεπτικό, το περιγραφικό μοντέλο λειτουργεί σαν ένα μέσο που διερευνά τις ιδιότητες των δεδομένων που εξετάζονται, όχι να προβλέπει νέες ιδιότητες. Οι εργασίες εξόρυξης γνώσης από δεδομένα για το χτίσιμο ενός περιγραφικού μοντέλου περιλαμβάνουν Συσταδοποίηση (Clustering) Παρουσίαση συνόψεων (Summarization) Κανόνες συσχετίσεων (Association Rules) Ανακάλυψη ακολουθιών (Sequential Pattern Discovery) Γράφημα 2. Μία συγκεντρωτική εικόνα των κυριότερων εργασιών εξόρυξης δεδομένων 2.1 Κατηγοριοποίηση (Classification) Η κατηγοριοποίηση (Dunham, 2004), (classification, Supervised learning, Pattern recognition) αντιστοιχίζει τα δεδομένα σε προκαθορισμένες κατηγορίες ή κλάσεις. Αναφέρεται συχνά σαν εποπτευόμενη μάθηση (Haykin, 1999), επειδή οι κατηγορίες κλάσεις καθορίζονται πριν ακόμη εξεταστούν τα δεδομένα. Οι αλγόριθμοι κατηγοριοποίησης, οι γνωστοί ταξινομητές, απαιτούν οι κατηγορίες να ορίζονται με 12

βάση τις τιμές των γνωρισμάτων των δεδομένων, και περιγράφουν αυτές τις κατηγορίες εξετάζοντας τα γνωρίσματα αυτά (Berry 1996, Holte 1993). Οι τεχνικές κατηγοριοποίησης χρησιμοποιούν δένδρα αποφάσεων, παλινδρόμηση, λογικούς κανόνες, νευρωνικά δίκτυα, στατιστικές μεθόδους διάκρισης ή κοντινότερους γείτονες ή τεχνικές Bayes. Με τη χρήση νευρωνικών δικτύων (Bishop 1995, Haykin 1999, Ripley 1994) σαν ταξινομητές η κατηγοριοποίηση ανάγεται σε ένα πρόβλημα density estimation ή discrimination ή και regression. 2.2 Παλινδρόμηση (Regression) Η Παλινδρόμηση (Regression) είναι μια ευρέως χρησιμοποιημένη στατιστική τεχνική μοντελοποίησης για την έρευνα της συσχέτισης μεταξύ μίας εξαρτώμενης μεταβλητής και μιας ή περισσότερων ανεξάρτητων μεταβλητών. Έτσι η παλινδρόμηση μπορεί να απεικονίζει ένα στοιχειώδες δεδομένο x σε μια πραγματική μεταβλητή πρόβλεψης y. Η παλινδρόμηση περιλαμβάνει την εκμάθηση μιας συνάρτησης y=f(x) που κάνει αυτή την απεικόνιση (Dunham 2004, Han & Kamber 2006, Bishop 1995). Η παλινδρόμηση προϋποθέτει ότι τα σχετικά δεδομένα ταιριάζουν με μερικά γνωστά είδη συνάρτησης (γραμμική, μη-γραμμική, πολυωνυμική κλπ.) και μετά καθορίζει την καλύτερη συνάρτηση αυτού του είδους που μοντελοποιεί τα δεδομένα. Όταν χρησιμοποιείται για παρεμβολή (interpolation) σημείων σε ενδιάμεσα τμήματα μπορεί να κάνει και κατηγοριοποίηση. Η συνάρτηση παλινδρόμησης προβλέπει την συνάρτηση συμμετοχής του ανύσματος x στην κλάση με τιμή y. Η γραμμική παλινδρόμηση y=c 0 +c 1 x 1 + +c n x n υποθέτει γραμμικές συσχετίσεις και μπορεί να βρει έτσι μία διαχωριστική συνάρτηση που διαχωρίζει έναν υποχώρο σε δύο περιοχές κλάσεων. Και αυτή επίσης εμφανίζεται συχνά και στην κατηγοριοποίηση δεδομένων. Τα Τεχνητά νευρωνικά δίκτυα χρησιμοποιούνται ευρύτατα για εκτίμηση σημείων, ή εκτίμηση συνάρτησης, ή παλινδρόμηση, ή πρόβλεψη ή κατηγοριοποίηση. Στην αξιολόγηση μοντέλων υπάρχει το standard mean squared error και η cross entropy loss function για την παλινδρόμηση και κατηγοριοποίηση αντίστοιχα (Haykin 1999, Ripley 1994, Geman et al. 1992). Δένδρα παλινδρόμησης, κανόνες και regression splines χρησιμοποιούνται επίσης στην προβλεπτική μοντελοποίηση (predictive 13

modelling) αν και μπορούν επίσης να εφαρμοστούν και στην περιγραφική μοντελοποίηση. 2.3 Ανάλυση Χρονοσειρών (Time Series Analysis) Με την ανάλυση χρονολογικών σειρών ή χρονοσειρών (time series analysis), μελετάται η τιμή ενός γνωρίσματος καθώς μεταβάλλεται στο χρόνο (Dunham 2004, Han & Kamber 2006). Οι τιμές λαμβάνονται σε ίσα χρονικά διαστήματα (ημερήσια, εβδομαδιαία, ωριαία, κοκ). Για να παρασταθούν οπτικά οι χρονοσειρές χρησιμοποιείται ένα διάγραμμα χρονοσειρών. Υπάρχουν τρεις βασικές λειτουργίες που πραγματοποιούνται στην ανάλυση χρονοσειρών. Στη μια περίπτωση, χρησιμοποιούνται μονάδες μέτρησης απόστασης για να καθορίσουν την ομοιότητα ανάμεσα σε διαφορετικές χρονοσειρές. Στη δεύτερη περίπτωση, εξετάζεται η δομή της χρονοσειράς για να καθορίσει (ίσως και να κατηγοριοποιήσει) τη συμπεριφορά της. Μια τρίτη περίπτωση είναι η χρήση διαγραμμάτων χρονοσειρών για την πρόβλεψη μελλοντικών τιμών. Μία άλλη πρόσφατη λειτουργία είναι η εύρεση των ίδιων των κατηγοριών των χρονοσειρών. 2.4 Πρόβλεψη (Prediction) Πολλές από τις πρακτικές εφαρμογές εξόρυξης γνώσης μπορούν να θεωρηθούν σαν πρόβλεψη μελλοντικών καταστάσεων (Dunham, 2004) με γνώση των προηγούμενων και των σημερινών δεδομένων. Η πρόβλεψη (prediction - Forecasting) μπορεί να θεωρηθεί σαν ένα είδος κατηγοριοποίησης. Αυτή η εργασία εξόρυξης γνώσης είναι διαφορετική από το μοντέλο πρόβλεψης, παρόλο που η διαδικασία πρόβλεψης αποτελεί ένα τύπο μοντέλου πρόβλεψης. Η διαφορά είναι ότι ως πρόβλεψη θεωρείται περισσότερο το να δίνεται τιμή σε μια μελλοντική κατάσταση (Zhang et al., 2005) παρά σε μια τρέχουσα. Έτσι εδώ αναφερόμαστε σε ένα είδος εφαρμογής παρά σε μια προσέγγιση μοντελοποίησης. 2.5 Συσταδοποίηση (Clustering) Η Συσταδοποίηση (clustering, Unsupervised learning, Segmentation, Partitioning) είναι η διαδικασία ομαδοποίησης αντικειμένων με όμοια χαρακτηριστικά και η κατάταξη σε κλάσεις ή συστάδες ή συμπλέγματα. Στην Συσταδοποίηση (Dunham 2004, Han & Kamber 2006, Zaïane2005). οι συστάδες δεν είναι προκαθορισμένες 14

αλλά προσδιορίζονται από τα δεδομένα. Η συσταδοποίηση αναφέρεται εναλλακτικά και σαν μη εποπτευόμενη μάθηση. Μπορεί να θεωρηθεί σαν μια διαμέριση ή τμηματοποίηση των δεδομένων σε ομάδες που μπορεί να είναι ή να μην είναι διακριτές μεταξύ τους. Η συσταδοποίηση συνήθως επιτυγχάνεται με τον καθορισμό της ομοιότητας, ως προς προκαθορισμένα γνωρίσματα, ανάμεσα στα δεδομένα. Τα πιο σχετικά δεδομένα ομαδοποιούνται σε ίδιες ομάδες. 2.6 Παρουσίαση Συνόψεων (Summarization) Η παρουσίαση συνόψεων (summarization, characterization) ή συνοπτικών μοντέλων αφορά μεθόδους που βρίσκουν και απεικονίζουν τα δεδομένα σε υποσύνολα τους που συνοδεύονται με απλές και συνοπτικές περιγραφές. Η σύνοψη χαρακτηρίζει τα δεδομένα και παράγει αντιπροσωπευτικές πληροφορίες σχετικά με τις βάσεις δεδομένων. Αυτό είναι χρήσιμο και βοηθά στην κατανόηση της σημαντικότητας μερικών γνωρισμάτων έναντι άλλων (Fayyad, 1996). Βασικές έννοιες της στατιστικής όπως ο μέσος, η διακύμανση, η τυπική απόκλιση αποτελούν απλά μοντέλα ενός πληθυσμού. Το ταίριασμα ενός πληθυσμού σε μία κατανομή παρέχει ένα καλύτερο μοντέλο δεδομένων. Το ιστόγραμμα είναι επίσης μία πολύ κατατοπιστική τεχνική που δείχνει συνοπτικά πιθανά απλά μοντέλα για την κατανομή των δεδομένων. Το διάγραμμα διασποράς είναι μία άλλη τεχνική για την παρουσίαση δεδομένων. 2.7 Ανάλυση Κανόνων Συσχετίσεων (Association Rules) Ένας κανόνας συσχέτισης (association rule) είναι ένα μοντέλο (Dunham 2004, Han & Kamber 2006) που αναγνωρίζει ειδικούς τύπους συσχέτισης μεταξύ δεδομένων. Η ανάλυση κανόνων συσχετίσεων (association rules), αναφέρεται στην διαδικασία εκείνη της εξαγωγής γνώσης από βάσεις δεδομένων που αποκαλύπτει συγκεκριμένο τρόπο με τον οποίο τα δεδομένα είναι δυνατόν να συνδέονται. Το ευρύτερα γνωστό παράδειγμα αυτού του είδους εφαρμογής είναι ο προσδιορισμός κανόνων συσχέτισης από την ανάλυση δεδομένων συναλλαγών. Για παράδειγμα ο κανόνας Α {Β,Γ} δηλαδή οι πελάτες που αγοράζουν το Α, αγοράζουν ταυτόχρονα και τα Β και Γ είναι ένας κανόνας συσχέτισης. Η ανάλυση κανόνων συσχέτισης είναι γνωστή και σαν Dependency Modelling, που γίνεται σε δύο επίπεδα: στο δομικό επίπεδο του μοντέλου (συνήθως σε γραφική μορφή) καθορίζεται ποιες μεταβλητές είναι εξαρτημένες τοπικά με ποιες, ενώ στο ποσοτικό 15

επίπεδο του μοντέλου προσδιορίζεται η δύναμη αυτών των εξαρτήσεων με χρήση κάποιας αριθμητικής κλίμακας. Η ανάλυση κανόνων συσχετίσεων είναι ένα ενεργό πεδίο έρευνας και εκτός από το market basket analysis, χρησιμοποιείται σε πληθώρα άλλων εφαρμογών, από το Web usage mining, τη συσχέτιση υπόπτων εγκληματικών ενεργειών, την πρόβλεψη αποτυχίας της λειτουργίας τηλεπικοινωνιακών διακόπτων, το network intrusion detection καθώς και σε άλλες τεχνικές όπως graph mining, clustering with links, και bioinformatics. 2.8 Ανακάλυψη Ακολουθιών (Sequential Pattern Discovery) Η ανακάλυψη προτύπων ακολουθιών (sequential pattern discovery) ή αλλιώς ακολουθιακή ανάλυση (sequential analysis) (Dunham 2004) χρησιμοποιείται για να καθοριστούν σειριακά πρότυπα στα δεδομένα. Αυτά τα πρότυπα βασίζονται σε μια χρονική ακολουθία ενεργειών και είναι παρόμοια με τις συσχετίσεις στο ότι συσχετίζονται τα δεδομένα (ή τα γεγονότα) που εξάγονται, με την διαφορά ότι η συσχέτιση τους βασίζεται στον χρόνο (Bishop 2006). Οι παραπάνω μέθοδοι και αλγόριθμοι μπορούν και να συνδυάζονται. Οι βασικές συνιστώσες από τις οποίες αποτελείται ένας αλγόριθμος εξόρυξης γνώσης σύμφωνα με τους Hand και την ομάδα του (Hand et al., 2000) είναι: 1. Η δομή που θα αναζητηθεί 2. Το κριτήριο αξιολόγησης 3. Η μέθοδος βελτιστοποίησης και αναζήτησης 4. Μια στρατηγική διαχείρισης δεδομένων 2.9 Είδη Δομών: Μοντέλα και Πρότυπα Υπάρχουν διάφοροι τρόποι για να χαρακτηρίσει κανείς τις δομές που εμφανίζονται κατά την αναζήτηση μέσα στα δεδομένα. Μια τέτοια περίπτωση είναι ο χωρισμός τους σε μοντέλα (models) και σε πρότυπα (patterns). 16

Με τον όρο μοντέλο εννοούμε μια σύνοψη που αφορά σε όλα τα δεδομένα. Πρόκειται για μια γενική περιγραφή του συνόλου δεδομένων, μέσω της οποίας έχουμε προτάσεις για κάθε σημείο του χώρου. Μια επιπλέον διάκριση που κάνουμε ανάμεσα στα μοντέλα είναι σε γραμμικά και μη-γραμμικά. Αναφέρουμε ως γραμμικά τα μοντέλα που είναι γραμμικός συνδυασμός των παραμέτρων τους. Σε αντίθεση με τα μοντέλα, τα πρότυπα αφορούν και περιγράφουν μια σχετικά μικρή περιοχή των δεδομένων. Ένα απλό παράδειγμα είναι ο παρακάτω κανόνας συσχέτισης: αν ο πελάτης αγοράσει ένα συνδυασμό αντικειμένων τότε θα αγοράσει και ένα άλλο με κάποια πιθανότητα p. Βλέπουμε ότι εδώ έχουμε να κάνουμε με έναν υποχώρο των δεδομένων. Επίσης, μέσω των προτύπων μπορούμε να αναγνωρίσουμε ποια στοιχεία αποκλίνουν από την πλειοψηφία, εμφανίζοντας ασυνήθιστη συμπεριφορά. Βέβαια για να χαρακτηρίσουμε μια συμπεριφορά ασυνήθιστη χρειάζεται να έχουμε περιγράψει ποια είναι η συνηθισμένη. Έτσι μπορούμε να θεωρούμε τα μοντέλα και τα πρότυπα ως τις δύο όψεις του ίδιου νομίσματος μιας και μερικές φορές δεν είναι σαφές αν μια συγκεκριμένη δομή πρέπει να αναφέρεται ως πρότυπο ή ως μοντέλο. Υπάρχει η τάση οι αναλυτές να μην σκέφτονται μοντέλα ή πρότυπα αλλά μόνο εξειδικευμένους αλγορίθμους για την εύρεση μιας συγκεκριμένης δομής (Hand et al., 2000). 2.9.1 Κριτήρια Αξιολόγησης Τα κριτήρια αξιολόγησης (score functions) χρησιμοποιούνται με σκοπό να αποτελέσουν ένα μέτρο του πόσο κοντά ή μακριά βρίσκεται μια συγκεκριμένη προσαρμοσμένη δομή από το συνολικό στόχο της διαδικασίας εξόρυξης. Συνιστούν δηλαδή μια προσπάθεια να ποσοτικοποιήσουμε την επιτυχία σχετικά με την προσαρμοσμένη δομή. Χωρίς τα κριτήρια αξιολόγησης δεν μπορούμε να συγκρίνουμε δύο μοντέλα ή να επιλέξουμε εκείνες τις τιμές των παραμέτρων που αποδίδουν τις επιθυμητές για εμάς ιδιότητες. Τα κριτήρια με τα οποία μπορούμε να αξιολογήσουμε ένα μοντέλο ποικίλουν, όπως η γνωστή συνάρτηση του αθροίσματος σφαλμάτων σε ένα μοντέλο πρόβλεψης ή το ποσοστό των λανθασμένων ταξινομήσεων σε προβλήματα κατηγοριοποίησης. Η αξιολόγηση μπορεί να γίνει ως 17

προς την ακρίβεια στην πρόβλεψη, ως προς την πολυπλοκότητα, τη χρησιμότητα ή την καινοτομία. Σε κάθε περίπτωση όμως πρέπει να λαμβάνονται υπόψη και πρακτικά ζητήματα που δημιουργούνται ανάλογα πάντα με το πεδίο εφαρμογής. Η επιλογή ενός κριτηρίου αξιολόγησης που επηρεάζεται από μικρές αλλαγές στα δεδομένα, ανάλογα και με τους στόχους της έρευνας, μπορεί να μην είναι επιθυμητή οπότε να χρειάζονται πιο ανθεκτικές μέθοδοι (σε θόρυβο ή έκτοπα). 2.9.2 Βελτιστοποίηση και Αναζήτηση Μετά την επιλογή της δομής και την επιλογή ενός κριτηρίου αξιολόγησης, απομένει η εύρεση των κατάλληλων τιμών των παραμέτρων ή του μοντέλου ώστε να ελαχιστοποιηθεί (ή μεγιστοποιηθεί, ανάλογα με την περίπτωση) το κριτήριο αξιολόγησης. Στην περίπτωση των μοντέλων πρόκειται για ένα πρόβλημα βελτιστοποίησης που μπορεί να λυθεί με τη χρήση αλγεβρικών υπολογισμών και διαφορικού λογισμού, ενώ στην περίπτωση των προτύπων γίνεται ένα πρόβλημα συνδυαστικής αναζήτησης για το καλύτερο πρότυπο. Επειδή συχνά στόχος είναι να γενικεύσουμε τα συμπεράσματα και για νέα δεδομένα μια πολύ καλή προσαρμογή μπορεί να μην προβλέπει με ακρίβεια στην περίπτωση νέων δεδομένων, απαιτείται προσοχή και αυτό είναι ένα θέμα που απασχολεί την εξόρυξη γνώσης από δεδομένα. 2.9.3 Διαχείριση των Δεδομένων Τέλος, κάθε αλγόριθμος εξόρυξης γνώσης από δεδομένα οφείλει να περιέχει και μια στρατηγική για τον τρόπο διαχείρισης των δεδομένων. Πρέπει δηλαδή να συμπεριλαμβάνει σαφείς οδηγίες για τον τρόπο με τον οποίο τα δεδομένα θα αποθηκευτούν, θα αριθμηθούν και προσπελασθούν. Πολλοί αλγόριθμοι υποθέτουν ότι τα δεδομένα της ανάλυσης μπορούν να χωρέσουν στη μνήμη RAM του υπολογιστή, όμως αυτό πολύ συχνά δεν συμβαίνει στα ογκώδη σύνολα δεδομένων. Αυτό συνεπάγεται ότι δεν μπορούμε να έχουμε ταυτόχρονα όλα τα δεδομένα στη διάθεση του επεξεργαστή, με αποτέλεσμα πολλοί αλγόριθμοι, όπως π.χ. αλγόριθμοι δέντρων ταξινόμησης, να μην κλιμακώνονται με αποτελεσματικό τρόπο σε τέτοια μαζικά σύνολα δεδομένων. 18

2.10 Διαχείριση Ποιότητας Δεδομένων (Data QA) Κατά την διάρκεια της διαχείρισης ποιότητας των δεδομένων, θα πρέπει να εντοπιστούν και να ελεγχθούν μια σειρά από διαστάσεις όπως είναι η σαφήνεια των δεδομένων, η πληρότητα, η συμμόρφωση, η συνοχή, η ορθότητα και η μοναδικότητα τους. Ένας ενδεικτικός πίνακας με αυτές τις διαστάσεις είναι ο ακόλουθος: Κατηγορία Ενδεικτικός δείκτης / Key Performance Indicator (KPI) Σαφήνεια Πληρότητα Συνοχή Ορθότητα Μοναδικότητα Ύπαρξη λεξικού δεδομένων (data dictionary) % των μεταβλητών που υπάρχουν στο λεξικό δεδομένων % των προσδιορισμένων μεταβλητών που είναι διαθέσιμοι % των πεδίων με αναντιστοιχίες δεδομένων % των εγγραφών με προβλήματα ακεραιότητας % των εγγραφών με μη ελλιπή γεωγραφικά στοιχεία % των εγγραφών με μη αρνητικά υπόλοιπα % ακραίων τιμών σε κάθε μεταβλητή % διπλο-εγγραφών % μοναδικών εγγραφών Πίνακας 1. Διαστάσεις διαχείρισης δεδομένων Ένα σημαντικό βήμα που προηγείται του υπολογισμού των δεικτών (KPIs) όταν μια μεταβλητή εξάγεται από την βάση δεδομένων, είναι να υπολογιστούν συγκεκριμένα χαρακτηριστικά της μεταβλητής. Αυτό αποτελεί μια τυπική διαδικασία αξιολόγησης της ποιότητας των δεδομένων και πρέπει να εφαρμόζεται σε όλα τα δεδομένα. Για τις αριθμητικές μεταβλητές, υπολογίζονται συγκεντρωτικοί στατιστικοί δείκτες (min, max, average, blank, median) και για τις κατηγορικές μεταβλητές προσδιορίζεται η ποσότητα των κενών τιμών. Ένα τέτοιο παράδειγμα σχετικών υπολογισμών, τόσο για αριθμητικές όσο και για κατηγορικές μεταβλητές παρουσιάζεται στον επόμενο πίνακα: 19

Τράπεζα Συχνότητα Ποσοστό Συχνότητας Αθροιστική Συχνότητα Αθροιστικό Ποσοστό Συχνότητας Τράπεζα1 43.049.515 80,6% 43.049.515 81% Τράπεζα2 36.049 0,1% 43.085.564 81% Τράπεζα3 336.222 0,6% 43.421.786 81% Τράπεζα4 411.744 0,8% 43.833.530 82% Τράπεζα5 2.921.139 5,5% 46.754.669 88% Τράπεζα6 1.148 0,0% 46.755.817 88% Τράπεζα7 1.022.856 1,9% 47.778.673 89% Τράπεζα8 4.010.910 7,5% 51.789.583 97% Τράπεζα9 1.614.796 3,0% 53.404.379 100% Πίνακας 2. Πίνακας Συχνοτήτων Όνομα πεδίου Αριθμός Μέσος Τυπική Ελάχιστη Μέγιστη Συχνότητα Παρατηρήσεων όρος απόκλιση τιμή τιμή ελλιπών τιμών Τραπεζικές καταθέσεις 53.317.949 7.809 3.545.178 (42.287) 12.837.425 5,6% Πιστωτικά προϊόντα 53.317.949 269,3 3.568,8 (95.479) 4.848.509 5,6% Επενδυτικά προϊόντα 53.317.949 205,5 3.316,1 (95.479) 4.848.509 5,6% Πίνακας 3. Χαρακτηριστικά αριθμητικών μεταβλητών ως προς την ποιότητα δεδομένων 20

2.10.1 Προ-επεξεργασία Δεδομένων (Data Cleansing) Μετά τον έλεγχο ποιότητας των διαθέσιμων δεδομένων, το επόμενο στάδιο είναι ο καθαρισμός των δεδομένων αυτών και η διατήρηση των κατάλληλων μεταβλητών. Κατά τη διάρκεια αυτής της φάσης, και εφόσον η ακριβής επεξήγηση και οι ακριβείς τιμές όλων των μεταβλητών είναι γνωστά, είναι εφικτός ο εντοπισμός των μη φυσιολογικών τιμών και των ελλιπών παρατηρήσεων. 2.10.2 Εντοπισμός των μη φυσιολογικών τιμών (Abnormal Values) Η διαδικασία του καθαρισμού των δεδομένων μπορεί να περιέχει τυπογραφικά λάθη τα οποία μπορούν να διορθωθούν με βάση μια διαθέσιμη λίστα από όλες τις πιθανές τιμές της μεταβλητής. Υπάρχει επίσης η περίπτωση των δεδομένων με λανθασμένα ονόματα μεταβλητών, τα οποία μπορούν να συμπληρωθούν και ονομαστούν σωστά. Μια επιπλέον περίπτωση είναι η ύπαρξη διπλο-εγγραφών οι οποίες πρέπει να εξαιρεθούν προσεκτικά. 2.10.3 Εντοπισμός των ελλιπών παρατηρήσεων (Missing Values) Ο εντοπισμός των ελλιπών παρατηρήσεων είναι ένα σημαντικό βήμα, και μπορεί αντιμετωπιστεί είτε με την απομάκρυνση τέτοιων μεταβλητών ή με την αντικατάσταση τους με το μέσο όρο των υπόλοιπων τιμών. Εναλλακτικά μπορεί να υπάρχουν μερικές μεταβλητές που μπορεί να έχει περισσότερο νόημα να θέσουμε τις ελλιπείς παρατηρήσεις ίσες με το 0. Επίσης στην περίπτωση που υπάρχουν σημαντικά ελλιπείς κατηγορικές μεταβλητές, μπορούν να εξαιρεθούν από την ανάλυση (Kim 1977). Επίσης, επιτρέπεται να απομακρύνονται μεταβλητές που έχουν τιμές εκτός ενός καθορισμένου ορίου. Αυτό μπορεί να πραγματοποιηθεί με την τοποθέτηση συγκεκριμένων διαστημάτων όπως είναι η τυπική απόκλιση από το μέσο, η μέση απόλυτη απόκλιση και τα ακραία εκατοστημόρια τιμών. 21

Ενδεικτικά αποτελέσματα συχνοτήτων μεταβλητών με ελλιπείς τιμές: Γράφημα 3. Ενδεικτικά γραφήματα συχνοτήτων Υπάρχουν δύο βασικές στρατηγικές για τον χειρισμό των ελλιπών μεταβλητών: 1) Αντικατάσταση των ελλιπών μεταβλητών στο παραγόμενο αρχείο δεδομένων. Η βασική μέθοδος για την υλοποίηση αυτή είναι η αντικατάσταση των ελλιπών παρατηρήσεων ενός τμήματος με τις τιμές του τμήματος που είναι πιο κοντά του. 2) Αντικατάσταση των παρατηρήσεων με ελλιπείς τιμές κατά τη διάρκεια της αρχικοποίησης της ανάλυσης. Σε κάθε περίπτωση, είναι απαραίτητο να μην περιλαμβάνονται μεταβλητές με κυρίαρχο ποσοστό ελλιπών παρατηρήσεων (π.χ. μεγαλύτερο από 80%) στο τελικό αρχείο δεδομένων που θα χρησιμοποιηθεί για την τμηματοποίηση του πελατολογίου, για να αποφθεχθεί η αλλοίωση του τελικού αποτελέσματος. Μετά την ολοκλήρωση της προ-επεξεργασίας των δεδομένων, το αρχείο των δεδομένων μπορεί να θεωρηθεί ότι είναι σύμφωνο με τις αναμενόμενες τιμές που εντοπίστηκαν κατά την διάρκεια του ελέγχου ποιότητας των δεδομένων. Με την ολοκλήρωση αυτής της διαδικασίας, τα δεδομένα είναι έτοιμα, ακριβή, ακέραια, σωστά, ολοκληρωμένα και σύμφωνα με τις προδιαγραφές μοντελοποίησης. Αν αυτά τα χαρακτηριστικά ικανοποιούνται από το τελικό αρχείο των δεδομένων, τότε η διαχείριση των δεδομένων (data management) μπορεί να ξεκινήσει και συνεπώς η ανάλυση. 22

2.11 Επιλογή Μεταβλητών (Variables Selection) Για την επιλογή των κατάλληλων μεταβλητών υπάρχουν μια σειρά από διαθέσιμες τεχνικές, οι οποίες περιγράφονται στη συνέχεια. 2.11.1 Ανάλυση Συσχετίσεων (Correlation Matrix) Η τμηματοποίηση προϋποθέτει ότι δεν υπάρχουν ισχυρές συσχετίσεις μεταξύ των μεταβλητών, επομένως πρέπει να γίνει έλεγχος για να βρεθεί ο βαθμός συσχέτισης μεταξύ των μεταβλητών. Συσχέτιση είναι ένας όρος που αναφέρεται στην σχέση μεταξύ δύο μεταβλητών. Ισχυρή, ή υψηλή, συσχέτιση σημαίνει ότι δύο ή περισσότερες μεταβλητές έχουν μια ισχυρή σχέση με το άλλο, ενώ αδύναμη, ή χαμηλή, συσχέτιση σημαίνει ότι οι μεταβλητές δεν σχετίζονται πολύ. Ο συντελεστής συσχέτισης κυμαίνεται από το -1 (τέλεια αρνητική συσχέτιση) έως το 1 (τέλεια θετική συσχέτιση) ενώ η τιμή 0 αντιπροσωπεύει ότι δεν υπάρχει καμία συσχέτιση μεταξύ των 2 μεταβλητών. Var1 Var2 Var3 Var4 Var5 Var6 Var7 Var8 Var1 1,00-0,79 0,12 0,72 0,55 0,49 0,23-0,77 Var2-0,79 1,00 0,82 0,77 0,5 0,79 0,89 0,55 Var3 0,12 0,82 1,00 0,31-0,41 0,26 0,87 0,7 Var4 0,72 0,77 0,31 1,00 0,23 0,32 0,5 0,63 Var5 0,55 0,5-0,41 0,23 1,00 0,86 0,83 0,63 Var6 0,49 0,79 0,26 0,32 0,86 1,00 0,53 0,63 Var7 0,23 0,89 0,87 0,5 0,83 0,53 1,00 0,22 Var8-0,77 0,55 0,7 0,63 0,63 0,63 0,22 1,00 Πίνακας 4. Ενδεικτικός Πίνακας Συσχετίσεων Παραπάνω παρουσιάζεται ενδεικτικά ένας πίνακας συσχέτισης (correlation matrix), στον οποίο παρουσιάζονται οι συντελεστές συσχέτισης μεταξύ των μεταβλητών (με κόκκινο φόντο έχουν σημειωθεί οι συντελεστές συσχέτισης που είναι πάνω από 0.7. 23

2.11.2 Ανάλυση Κύριων Συνιστωσών (Principal Components Analysis - PCA) Ανάλυση Κύριων Συνιστωσών (PCA) είναι μια πολυμεταβλητή στατιστική τεχνική μείωσης δεδομένων, η οποία συνοψίζει μια σειρά από μεταβλητές σε ένα μικρότερο σύνολο των σύνθετων διαστάσεων. Τεχνικά, μία Κύρια Συνιστώσα (PC) μπορεί να οριστεί ως γραμμικός συνδυασμός των παρατηρούμενων μεταβλητών και ουσιαστικά η Ανάλυση Κύριων Συνιστωσών μειώνει ένα σύνολο μεταβλητών σε ένα μικρότερο αριθμό, ενώ εξακολουθούν να αντιπροσωπεύουν το μέγιστο της διακύμανσης και, επομένως, εξηγεί τις σημαντικές διαστάσεις της μεταβλητότητας. Όπως περιγράφεται στο κεφάλαιο Correlation Analysis, οι μεταβλητές που έχουν μεγάλη συσχέτιση μεταξύ τους, θα δημιουργήσουν προβλήματα στην δημιουργία του μοντέλου τμηματοποίησης. Η Ανάλυση Κύριων Συνιστωσών θα χρησιμοποιηθεί για να αντικατασταθεί ένα σύνολο μεταβλητών οι οποίες έχουν υψηλή συσχέτιση, με λιγότερες Κύριες Συνιστώσες (PCs) οι οποίες θα εξηγούν το κυρίαρχο ποσοστό μεταβλητότητας. Για παράδειγμα, στην περίπτωση που βρεθούνε 4 KPIs τα οποία έχουν σημαντική συσχέτιση μεταξύ τους (θα φαίνεται από τον πίνακα συσχέτισης) και είναι σημαντικοί παράγοντες για να μπούνε στον αλγόριθμο τμηματοποίησης τότε η Ανάλυση Κύριων Συνιστωσών θα δημιουργήσει (ανεξάρτητες μεταξύ τους) Κύριες Συνιστώσες οι οποίες θα εξηγούν το μεγαλύτερο ποσοστό μεταβλητότητας από τις 4 μεταβλητές. 24

2.12 Διαθέσιμες Μεθοδολογίες Τμηματοποίησης (Clustering Techniques) Οι τεχνικές συσταδοποίησης (Clustering techniques) μπορούν να χωριστούν σε Ιεραρχικές (Hierarchical) και Διαχωρισμού (Partitioning) όπως φαίνεται και στο ακόλουθο διάγραμμα. Οι τεχνικές Διαχωρισμού, όπως είναι ο αλγόριθμος K-means, έχουν το πλεονέκτημα της σχετικής μικρής υπολογιστικής πολυπλοκότητας και για αυτό το λόγο εμφανίζει συχνή επιλογή και χρήση. Παρόλα αυτά, η Ιεραρχική διαδικασία, μπορεί να καταλήξει σε περισσότερες πληροφορίες και γνώση και να αξιοποιήσει προηγμένες μεθόδους συνδέσεων (Xu 2005). Γράφημα 4. Γραφική απεικόνιση μεθόδων συσταδοποίησης (Clustering) Η υλοποίηση της τμηματοποίησης των πρακτορείων με την χρήση του πακέτου SPSS, μπορεί να πραγματοποιηθεί με τρεις διαθέσιμες μεθόδους: 1. K-means 2. Hierarchical 3. Two-Step Οι δύο πρώτοι μέθοδοι που αποτελούν αυτόνομες τεχνικές, ενώ αντίθετα η τρίτη αποτελεί ένα συνδυασμό των δύο πρώτων. Οι δύο αυτοί βασικοί μέθοδοι θα παρουσιαστούν αναλυτικά στη συνέχεια. 25

2.12.1 K Means Στον αλγόριθμο K-Means τα αντικείμενα διατίθενται σε ένα προ-καθορισμένο αριθμό των ομάδων με τέτοιο τρόπο ώστε να βελτιστοποιήσουν ένα μέτρο της αποτελεσματικότητας. Βασικά βήματα για την ομαδοποίηση K-means είναι: 1. Επιλέγεται τυχαία Κ αριθμό seeds που θα είναι οι σπόροι για τις Κ ομάδες 2. Τοποθέτηση των αντικειμένων στο πιο κοντινό seed για αυτά 3. Υπολογισμός του νέου κέντρου βάρους (centroid) της κάθε ομάδας και με την τοποθέτηση ή αφαίρεση ενός seed 4. Επανάληψη των βημάτων 2 και 3 μέχρι να μην αλλάζουν τα κέντρα βάρους (centroids). Στο παρακάτω σχήμα παρουσιάζεται μια διαδικασία τμηματοποίησης χρησιμοποιώντας τον αλγόριθμο K-means: Γράφημα 5. Γραφική απεικόνιση αλγορίθμου K-Means Φυσικά η παραπάνω διαδικασία τμηματοποίησης θα ήταν διαφορετική αν επιλέγονταν διαφορετικά seeds: Γράφημα 6. Γραφική απεικόνιση K-Means 26

Αν και η μέθοδος είναι γρήγορη και επιτρέπει στα αντικείμενα να αλλάξουν ευέλικτα ομάδες, δύο από τις βασικές αδυναμίες του είναι ότι η τελική κατανομή εξαρτάται από την αρχική επιλογή των seeds και του προκαθορισμού του αριθμού Κ (αριθμός των ομάδων). Συνήθως αυτά τα προβλήματα αντιμετωπίζονται τρέχοντας πολλές φορές τον αλγόριθμο K-Means - αλλάζοντας τον αριθμό των ομάδων Κ - μέχρι να βρεθεί η βέλτιστη λύση. 2.12.2 Hierarchical Σε αντίθεση με τον αλγόριθμο K-means, στο Hierarchical δεν είναι απαραίτητος ο ορισμός του αριθμού των clusters τόσο για την έναρξη όσο και την ολοκλήρωση του αλγορίθμου. Στον Ιεραρχικό αλγόριθμο, είναι απαραίτητο ο χρήστης να ορίσει ένα μέτρο ανομοιομορφίας μεταξύ των ομάδων παρατηρήσεων που θα βασίζεται σε ζεύγη ανομοιομορφίας ανάμεσα στις παρατηρήσεις των ομάδων. Όπως υποδηλώνει και το όνομα του, δημιουργεί ιεραρχικές αναπαραστάσεις των clusters σε κάθε επίπεδο της ιεραρχίας θα δημιουργηθούν με την ένωση των κατάλληλων clusters από αμέσως επόμενο ιεραρχικό επίπεδο. Στο χαμηλότερο επίπεδο, κάθε cluster περιέχει μια μοναδική παρατήρηση. Στο ψηλότερο επίπεδο υπάρχει μόνο ένα cluster που περιέχει όλες τις παρατηρήσεις. Η Ιεραρχική συσταδοποίηση περιλαμβάνει την ομαδοποίηση των παρατηρήσεων που βασίζεται στην απόσταση μεταξύ τους. Η απόσταση μπορεί να προσδιοριστεί με τη χρήση διαφορετικών κριτηρίων όπως είναι η «από κάτω προς τα πάνω» μέθοδος (agglomerative bottom-up) ή η «από πάνω προς τα κάτω» μέθοδος (divisive topdown) όπως φαίνεται και στο ακόλουθο διάγραμμα. Βήματα μεθόδου «Bottom-up»: 1. Κάθε παρατήρηση σχηματίζει το δικό της cluster 2. Ενώνονται οι δύο κοντινότερες παρατηρήσεις ή clusters, σύμφωνα με τις αρχικές υπολογισμένες αποστάσεις 3. Επιστροφή στο βήμα 1 μέχρι όλες οι παρατηρήσεις βρεθούν στο ίδιο cluster. 27

Βήματα μεθόδου «Top-down»: 1. Κατασκευή ενός μοναδικού cluster που περιέχει όλες τις παρατηρήσεις 2. Διαχωρισμός του cluster έτσι ώστε να οδηγεί σε στοιχεία που έχουν τη μεγαλύτερη απόσταση μεταξύ των clusters. Γράφημα 7. Γραφική απεικόνιση μεθόδων Ιεραρχικής συσταδοποίησης Η πιο διαδεδομένη μέθοδος που χρησιμοποιείται είναι η μέθοδος agglomerative (bottom-up), όπου τα clusters σχηματίζονται από κάτω προς τα πάνω με βάση τη δομή ενός ιεραρχικού δενδρογράμματος. Καθώς ο αλγόριθμος δημιουργεί το δένδρο αυτό, τα clusters ενώνονται με βάση μια επιλεγμένη μέθοδο σύνδεσης (linkage method). Όλες οι πιθανές μέθοδοι σύνδεσης εμφανίζονται στο ακόλουθο διάγραμμα: Γράφημα 8. Μέθοδοι σύνδεσης (Linkage Methods) 28

2.12.3 Αξιολόγηση μεθόδων Συσταδοποίησης (Clustering Evaluation) Στην ιεραρχική συσταδοποίηση (hierarchical), οι αποστάσεις στις οποίες οι συστάδες συνδυάζονται και ενοποιούνται μπορεί να χρησιμοποιηθεί σαν κριτήριο επιλογής. Αυτή η πληροφορία μπορεί να προκύψει με την αποτύπωση ενός δενδρογράμματος (dendrogram) όπως φαίνεται στην παρακάτω εικόνα: Γράφημα 9. Ενδεικτικό δενδρόγραμμα Στην μη-ιεραρχική συσταδοποίηση (non-hierarchical), ο λόγος της συνολικής διακύμανσης εντός της συστάδας και της διακύμανσης μεταξύ των συστάδων μπορεί να σχεδιαστεί σε σχέση με τον αριθμό των συστάδων (clusters). Το σημείο στο οποίο εμφανίζεται μια απότομη πτώση του δείκτη αυτού, οδηγεί στην επιλογή του κατάλληλου αριθμού συστάδων. Γράφημα 10. Γραφική απεικόνιση αξιολόγηση μιας μη ιεραρχικής συσταδοποίησης Πρέπει να εξασφαλιστεί ότι το μέγεθος των συστάδων που προκύπτει από την προηγούμενη διαδικασία έχει νόημα για την εκάστοτε επιχείρηση. Αν και δεν υπάρχει μια μοναδική και απόλυτα δεκτή μέθοδος για να υλοποιηθεί η διαδικασία της συσταδοποίησης, το εκάστοτε αποτέλεσμα εξαρτάται από τα παρακάτω: 29

1. Οι μεταβλητές (KPIs) που θα επιλεχθούν για να υλοποιηθεί ο αλγόριθμος συσταδοποίησης, θα πρέπει να επιλεχθούν προσεκτικά με μεθόδους ανάλυσης παραγόντων και ανάλυσης συσχετίσεων για να εξασφαλίσουν τη βέλτιστη ερμηνευτική επιλογή των αποτελεσμάτων 2. Η μέθοδος συσταδοποίησης που θα επιλεγεί 3. Η μέθοδος μέτρησης των αποστάσεων που θα υλοποιηθεί. 2.13 Ανάλυση Παραγόντων (Factor Analysis) Η ανάλυση παραγόντων (Factor Analysis) είναι μια τεχνική μείωσης μεταβλητών (variables reduction technique) σε μεγάλου όγκου δεδομένα με μεγάλο αριθμό μεταβλητών. Η τεχνική Factor Analysis ομαδοποιεί τις μεταβλητές με παρόμοια χαρακτηριστικά. Με τη τεχνική αυτή, μπορεί να παραχθεί ένας μικρότερος αριθμός από παράγοντες (σε σχέση με το σύνολο των μεταβλητών), ο οποίος είναι ικανός να εξηγήσει την παρατηρούμενη απόκλιση στο μεγαλύτερο αριθμό μεταβλητών. Αποτελεί μια στατιστική μέθοδο, που χρησιμοποιείται για να περιγράψει την μεταβλητότητα ανάμεσα στις συσχετιζόμενες μεταβλητές, σε όρους δυνητικά χαμηλότερου αριθμού μη παρατηρούμενων μεταβλητών (factors). Οι πληροφορίες που προκύπτουν από αλληλεξαρτήσεις μεταξύ των παρατηρούμενων μεταβλητών μπορούν να χρησιμοποιηθούν για την μείωση του συνόλου των μεταβλητών σε ένα σύνολο δεδομένων. Βασικές προϋποθέσεις για να υλοποιηθεί μια ανάλυση παραγόντων είναι: Οι μεταβλητές να είναι συνεχείς Οι μεταβλητές θα πρέπει να σχετίζονται μεταξύ τους Ο αριθμός των μεταβλητών θα πρέπει να είναι αρκετά μεγάλος ώστε να περιλαμβάνονται τουλάχιστον 3 μεταβλητές σε κάθε παράγοντα Το μέγεθος του δείγματος θα πρέπει να είναι τουλάχιστον ίσο με το τριπλάσιο του αριθμού των μεταβλητών (ιδανικά θα πρέπει να περιλαμβάνει περισσότερες από 100 παρατηρήσεις). 30

Τα βασικά βήματα της υλοποίησης μιας Factor Analysis είναι τα παρακάτω: 1. Υπολογισμός του πίνακα συσχετίσεων (Correlation matrix) 2. Εξαγωγή παραγόντων (Factor extraction) 3. Περιστροφή παραγόντων (Factor rotation) προκειμένου να επιτευχθεί μια απλή δομή (simple structure) 4. Ερμηνεία παραγοντικών αξόνων (Interpretation of factor axes). 2.13.1 Εξαγωγή Παραγόντων (Factor Extraction) Με τη χρήση του πακέτου SPSS, και την εφαρμογή της τεχνικής Factor Analysis καταλήγουμε σε ένα πίνακα αποτελεσμάτων όπως αυτά που εμφανίζονται στον παρακάτω πίνακα. Πίνακας 5. Παραγόμενος πίνακας ανάλυσης παραγόντων 2.13.2 Ιδιοτιμή (Eigenvalue) Μια ιδιοτιμή είναι η κανονικοποιημένη απόκλιση που σχετίζεται με ένα συγκεκριμένο παράγοντα. Η ιδιοτιμή ενός γραμμικού μετασχηματισμού Α είναι η μεταβολή στο μέτρο (πιθανόν και στη φορά) ενός διανύσματος που μένει αναλλοίωτο ως προς τη διεύθυνση, κάτω από τον μετασχηματισμό Α. Ιδιοτιμή ενός τετραγωνικού πίνακα είναι ο αριθμός µε τον οποίο πολλαπλασιάζεται ένα συγκεκριμένο µη-μηδενικό διάνυσμα (που αντιστοιχεί στην ιδιοτιμή ), αν εφαρμοστεί πάνω του ο γραμμικός μετασχηματισμός που εκφράζει ο πίνακας. Το 31

άθροισμα των ιδιοτιμών, δεν μπορεί να υπερβαίνει τον αριθμό των στοιχείων που λαμβάνονται υπόψη στην ανάλυση, δεδομένου ότι κάθε στοιχείο συνεισφέρει μια ιδιοτιμή στο άθροισμα των αποκλίσεων. Πίνακας 6. Πίνακας ιδιοτιμών ανάλυσης παραγόντων Στο προηγούμενο ενδεικτικό πίνακα, στην δεύτερη στήλη παρουσιάζεται η απόκλιση των νέων παραγόντων που προέκυψαν. Στην τρίτη στήλη, αυτές οι τιμές παρουσιάζονται σαν ποσοστό τις συνολικής απόκλισης. Για παράδειγμα, ο παράγοντας 1 αποτελεί το 61% της συνολικής απόκλισης και ο παράγοντας 2 το 18%. Παρατηρείται επίσης ότι το άθροισμα των ιδιοτιμών είναι ίσο με τον αριθμό των μεταβλητών. 2.13.3 Οι ιδιοτιμές και το πρόβλημα της επιλογής του αριθμού των παραγόντων Μετά τον υπολογισμό των ιδιοτιμών για την απόκλιση των παραγόντων που προκύπτουν από την ανάλυση, μπορεί να αποφασιστεί ο αριθμός των παραγόντων που θα επιλεχθεί. Παρά το γεγονός ότι η επιλογή αυτή μπορεί να γίνει και με καθαρά επιχειρησιακά κριτήρια, υπάρχουν κάποιες κατευθυντήριες γραμμές που χρησιμοποιούνται ευρέως και στην πράξη φαίνεται να δίνουν καλύτερα αποτελέσματα. 32

2.13.4 Διάγραμμα Scree (Scree Plot) Το διάγραμμα Scree είναι ένα γράφημα απεικόνισης των ιδιοτιμών σε σχέση με όλους τους παράγοντες. Είναι το βασικό διάγραμμα που προκύπτει από την ανάλυση παραγόντων και διευκολύνει στην γραφική επιλογή του κατάλληλου αριθμού των παραγόντων που θα επιλεχθούν (Cattell 1966). Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα, για παράδειγμα, φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 7. Επομένως, με τη χρήση αυτού του κανόνα στη περίπτωση αυτή θα διατηρηθούν 6 παράγοντες. Γράφημα 11. Ενδεικτικό διάγραμμα Scree Plot 2.13.5 Επιλογή κατάλληλου κριτηρίου Και τα δύο κριτήρια έχουν μελετηθεί σε βάθος (Cattell & Jaspers 1967, Hakstian Rogers & Cattell 1982, Linn 1968, Tucker Koopman & Linn 1969). 33

3. Διαχείριση Απόδοσης και Δείκτες Μέτρησης Απόδοσης (KPIs) Η μεθοδολογία της Διαχείρισης Απόδοσης (Performance Management) αναφέρεται σε όλο τον οργανισμό και υποστηρίζει ένα ευρύ φάσμα επιχειρηματικών δραστηριοτήτων. Οι εφαρμογές της χειρίζονται χρονικά δεδομένα για την υποστήριξη αποφάσεων τόσο για την επιχειρησιακή λειτουργία (Operational Decision Making) όσο και των στρατηγικών αποφάσεων (Strategic decision Making). Οι επιχειρήσεις, μέσα από τις διαδικασίες της στρατηγικής διοίκησης και της διαχείρισης της συνολικής απόδοσης, πρέπει να καθορίζουν συγκεκριμένους σκοπούς και στόχους, κατά τέτοιον τρόπο που να δίνεται η δυνατότητα στα στελέχη να κατανοούν, όσο περισσότερο και καλύτερα μπορούν, τον τρόπο που λειτουργεί το σύστημα της επιχείρησης τους, πού μπορούν να το βελτιώσουν, και πότε το σύστημα αυτό ελέγχεται ή είναι εκτός ελέγχου. Η βασική δομή μίας εφαρμογής διαχείρισης απόδοσης συνοψίζεται στα τέσσερα παρακάτω γενικά βήματα: 1. Καθορισμός στρατηγικής 2. Σχεδιασμός 3. Παρακολούθηση & ανάλυση 4. Διορθωτικές ενέργειες Γράφημα 12. Η βασική δομή της διαχείρισης απόδοσης 34

Αρχικά καθορίζονται οι στόχοι του οργανισμού, περιγράφεται η σειρά ενεργειών μέσω των οποίων θα εφαρμοστεί η στρατηγική, διερευνώνται σημαντικοί παράγοντες και μέθοδοι που θα χρησιμοποιηθούν για την υλοποίηση της στρατηγικής, και καθορίζονται οι βασικοί δείκτες (metrics) με τους οποίους θα μετράται και θα παρακολουθείται η απόδοση. Ως παράδειγμα μπορεί να αναφερθεί μία επιχείρηση παροχής υπηρεσιών, όπου η ικανοποίηση των πελατών αποτελεί μία καθοριστική ένδειξη απόδοσης, και κατά συνέπεια ένας δείκτης ικανοποίησης πελατών θα αποτελούσε ένα χαρακτηριστικό δείκτη. Αυτό το βήμα είναι από τα πιο σημαντικά στην φιλοσοφία της διαχείρισης απόδοσης (performance management), καθώς είναι αυτό που συνδέει τους γενικούς στρατηγικούς στόχους σε μετρήσιμα μεγέθη, μέσω των δεικτών αυτών. Η κατασκευή αυτών των δεικτών (metrics) ώστε να είναι αντιπροσωπευτικά των αντίστοιχων στόχων, μπορεί και είναι δύσκολη και προβληματική διαδικασία, γεγονός που δημιουργεί δυσκολίες στον προσδιορισμό τους. Η συνηθέστερη μορφή δεικτών είναι τα KPIs ή Key Performance Indicators, τα οποία χρησιμοποιούνται για την όσο το δυνατόν ακριβέστερη απεικόνιση των στρατηγικών στόχων. Η μέτρηση της απόδοσης αποτελεί ένα τρόπο αξιολόγησης της πορείας μιας επιχείρησης για την επίτευξη των στόχων της, προσφέροντας μια εκτίμηση σχετικά με το πόσο κοντά στους στρατηγικούς της στόχους βρίσκεται. Είναι σύνηθες πολλά από τα μεγέθη που παρακολουθούνται να δίνουν μία ελλιπή εικόνα της κατάστασης του οργανισμού, καθώς δεν αντικατοπτρίζουν πάντα την πραγματική του κατάσταση. Υπάρχουν έρευνες που αναφέρουν ότι ένα μεγάλο ποσοστό στελεχών επιχειρήσεων τείνει να μη δίνει μεγάλο βάρος στις εν λόγω μετρήσεις λόγω της ασάφειας στους στόχους που ορίσθηκαν και η οποία οδηγεί σε παρακολούθηση μη σημαντικών δραστηριοτήτων και μέτρηση ακατάλληλων μεγεθών (Neely, Adams & Crowe, 2001). 3.1 Επιχειρησιακό περιβάλλον (Business Context) Οι δείκτες μέτρησης της απόδοσης (KPIs) βοηθούν ένα οργανισμό να προσδιορίσει και να μετρήσει την απόδοση σε σχέση με τους στόχους που έχει θέσει. Μόλις οργανισμός αναλύσει και προσδιορίσει τους στόχους του, θα πρέπει να μετρήσει την απόδοση του σε σχέση με τους στόχους αυτούς. Τα KPIs αποτελούν ένα τέτοιο 35

εργαλείο μέτρησης. Οι στρατηγικοί δείκτες μέτρησης απόδοσης μετατρέπονται σε μια σειρά από επιχειρησιακούς δείκτες σε όλο τον οργανισμό. Τα KPIs βοηθούν έναν οργανισμό να προσδιορίσει αν βρίσκεται μέσα στα όρια που έχει θέσει και ότι εργάζεται προς την κατεύθυνση και την επίτευξη ενός ουσιαστικού αποτελέσματος. Οι δείκτες μέτρησης αποτελεσμάτων (performance indicators) αποτελούν κρίσιμη έννοια στη διαδικασία της στοχοθεσίας, καθώς ο σαφής και εκ των προτέρων προσδιορισμός των επιδιωκόμενων στόχων οφείλει να περιλαμβάνει περιγραφή των αποτελεσμάτων και ασφαλή κριτήρια ή δείκτες επαλήθευσης. Χρησιμοποιούνται για να προσδιορίσουν ή να πιστοποιήσουν κάτι που δεν είναι άμεσα ορατό ή κατανοητό μέχρι την πλήρη ολοκλήρωσή του. Οι δείκτες συνήθως μεταφράζουν δεδομένα και στατιστικές σε σύντομη, περιεκτική πληροφόρηση που είναι κατανοητή και διαχέεται σε διαφορετικές ομάδες χρηστών. Κατά τη διαδικασία αυτή λοιπόν, αναγνωρίζονται και κατασκευάζονται δείκτες μέτρησης που παρέχουν τη δυνατότητα στο όργανο διοίκησης να παρακολουθεί την πρόοδο της εκάστοτε επιχείρησης σε σχέση με την επίτευξη των στόχων που έχουν τεθεί. Αποτελούν εργαλεία μέτρησης της οργανωτικής απόδοσης και διακρίνονται σε ποσοτικούς δείκτες, όταν με ποσοτικούς όρους εκτιμούν τις παρεχόμενες υπηρεσίες και τα προϊόντα της εκάστοτε οργάνωσης και σε ποιοτικούς, όταν εκτιμούν τις διαδικασίες παραγωγής των υπηρεσιών και προϊόντων και τα συνακόλουθα χαρακτηριστικά τους. Οι ποιοτικοί δείκτες εκφράζουν την ποιότητα των εργασιών που μετρώνται και η αποτύπωσή τους γίνεται με ποιοτικές διαβαθμίσεις (π.χ. καλά, μέτρια) και οι ποσοτικοί εκφράζουν το ποσοστό των ορθώς εκτελεσθέντων εργασιών και η αποτύπωσή τους γίνεται με αριθμούς. Στην πράξη, ωστόσο, δεν υφίσταται απόλυτη διάκριση μεταξύ ποσοτικών και ποιοτικών δεικτών, διότι μπορούν να χρησιμοποιηθούν ποσοτικοί δείκτες για ποιοτικού χαρακτήρα μετρήσεις (λ.χ. μονάδες παροχής υπηρεσιών υγείας). Καθώς οι ποσοτικοί δείκτες παρέχουν μια συνολικότερη εικόνα και παρέχουν τη δυνατότητα σύγκρισης με άλλους φορείς ή δράσεις του παρελθόντος, προτιμώνται σε σχέση με τους ποιοτικούς, οι οποίοι αποδεικνύονται πιο χρονοβόροι στη διαδικασία συλλογής, μέτρησης και ανάλυσης της πληροφορίας, ιδιαίτερα στα αρχικά στάδια και διακρίνονται για τον υποκειμενικό τους χαρακτήρα. 36

3.2 Δείκτες Μέτρησης Απόδοσης (Key Performance Indicators KPIs) Οι δείκτες μέτρησης απόδοσης είναι τόσο ποιοτικοί όσο και ποσοτικοί δείκτες που αναφέρονται στην απόδοση του οργανισμού σε σχέση με τους στρατηγικούς και λειτουργικούς στόχους που έχει θέσει. Αυτοί οι δείκτες αναλύονται σε βάθος και επιμερίζονται σε κάθε τμήμα και εργαζόμενο μιας εταιρείας ώστε να τεθούν οι κατάλληλοι στόχοι και να παρακολουθείτε η επίτευξη τους ανά τακτά χρονικά διαστήματα. Τα KPIs χρησιμοποιούνται για την παρακολούθηση των επιδόσεων μια επιχείρησης, ενός τμήματος, μιας υπηρεσίας όπως και μιας μεμονωμένης μηχανής. Βοηθούν επίσης στη διαμόρφωση της συμπεριφοράς των εργαζομένων στο εσωτερικό της εταιρείας. Πρέπει να είναι ευέλικτοι και να αντιπροσωπεύουν τους μεταβαλλόμενους στόχους του οργανισμού και να συνδέονται άμεσα με την κουλτούρα και την αξία του οργανισμού. Τα KPIs είναι ποσοτικοί και ποιοτικοί δείκτες που χρησιμοποιούνται για την αξιολόγηση της απόδοσης και της προόδου ενός οργανισμού σε σχέση με τους στόχους που έχει θέσει. Αυτά αναλύονται και καθορίζονται σαν στόχος απόδοσης στα τμήματα και τους εργαζόμενους ενός οργανισμού και αναθεωρούνται ανά τακτά χρονικά διαστήματα. Η προσέγγιση SMART αποτελεί ένα σύνολο κανόνων και κριτηρίων για το σχεδιασμό και θέσπιση στόχων. Ο όρος αρχικά αναφέρθηκε το 1981 από τον Doran. Η έννοια των κριτηρίων SMART μπορεί να συνοψιστεί σε ένα αρκτικόλεξο το οποίο έχει εξελιχθεί και προσαρμοστεί με την πάροδο του χρόνου. Οι δείκτες μέτρησης απόδοσης πρέπει να είναι «έξυπνοι» ή «smart» όπως φαίνεται από το παρακάτω ακρώνυμο: Specific Συγκεκριμένοι Measurable - Μετρήσιμοι Achievable Εφικτοί Relevant Σχετικοί Timely Χρονικά ορισμένοι 37

Specific Συγκεκριμένοι: Οι δείκτες μέτρησης πρέπει να είναι συγκεκριμένοι για την ατομική εργασία και να εκφράζονται σαν πραγματικές συμπεριφορές της πραγματικής εργασίας. Measurable Μετρήσιμοι: Οι δείκτες μέτρησης πρέπει να είναι μετρήσιμοι, να βασίζονται στη συμπεριφορά που μπορεί να παρατηρηθεί και να τεκμηριωθεί και να είναι σχετικοί με την εργασία που στοχεύει να μετρήσει. Achievable Εφικτοί: Η διαχείριση της απόδοσης ενός οργανισμού πρέπει να είναι μια ανοικτή, συνεργατική και επικοινωνιακή διαδικασία. Οι δείκτες πρέπει να είναι ρεαλιστικοί και εφικτοί. Relevant Σχετικοί: Είναι σημαντικό να είναι σχετικοί με το στόχο που έχουν σχεδιαστεί να μετρήσουν και να κατανοούνται πλήρως από κάθε ενδιαφερόμενο. Timely Χρονικά ορισμένοι: Πρέπει να έχουν ένα συγκεκριμένο χρονικό πλαίσιο μέτρησης και αναφοράς. Όπως είναι προφανές, οι κανόνες SMART αποτελούν ένα γενικό τρόπο σχεδιασμού κριτηρίων και όχι ένα στρατηγικό μοντέλο και γι αυτό στη μέγιστη πλειοψηφία των περιπτώσεων χρησιμοποιείται σε συνδυασμό με άλλες στρατηγικές μεθόδους και προσεγγίσεις όπως το Balanced Scorecard (Kaplan 1996). 3.3 Πρόσθετα χαρακτηριστικά Δεικτών Μέτρησης Απόδοσης Σύμφωνα με τη βιβλιογραφία υπάρχουν μερικά επιπρόσθετα χαρακτηριστικά που αφορούν τους δείκτες μέτρησης απόδοσης. Δεν είναι πάντα απαραίτητο να ικανοποιούνται όλα τα ακόλουθα χαρακτηριστικά για να είναι οι δείκτες χρήσιμοι και λειτουργικοί για τον οργανισμό. Με αυτό τον τρόπο ένα KPI μπορεί να είναι: Επικεντρωμένο σε μια υπηρεσία μεγάλης στρατηγικής σημασίας και αξίας αντί για μια μη κρίσιμη δραστηριότητα. Η επιλογή ενός λανθασμένου δείκτη μπορεί να οδηγήσει σε μια αντιπαραγωγική συμπεριφορά του οργανισμού. Αντιπροσωπευτικό και κατάλληλο για τον οργανισμό και τις επιχειρησιακές του επιδόσεις. 38

Ρεαλιστικό για να μπορεί να ταιριάζει με τους πιθανούς επιχειρησιακούς περιορισμούς και την αποδοτικότητα. Χρησιμοποιείται για τον προσδιορισμό τάσεων. Μπορεί να συγκριθεί με περισσότερα δεδομένα σε μεγάλο χρονικό διάστημα ώστε να εντοπιστούν επαναλαμβανόμενων τάσεων. Κατανοητό ώστε ο κάθε ενδιαφερόμενος εργαζόμενος να καταλάβει πως η συμπεριφορά και οι ενέργειες του μπορεί να επηρεάσουν την απόδοση του οργανισμού. Εγκεκριμένο ώστε όλοι οι ενδιαφερόμενοι να μοιράζονται την ευθύνη στην καθημερινή λειτουργία της επιχείρησης. Παρουσιάζεται σε επίσημη αναφορά για να είναι διαθέσιμοι σε όλους τους ενδιαφερόμενους. Αξιολογήσιμοι για να διασφαλίζεται ότι παραμένουν επίκαιροι. 3.4 Δημιουργία κατάλληλων Δεικτών (KPIs Creation) Οι δείκτες μέτρησης πρέπει να σχεδιάζονται με τέτοιο τρόπο ώστε: να υπάρχει μια βασική μέτρηση για τη δημιουργία ενός προτύπου αποδόσεων να υπάρχουν οι κατάλληλοι δείκτες για την παρακολούθηση της απόδοσης να υπάρχουν δείκτες που μπορούν να τονίσουν κάθε μεταβλητότητα Βασικός στόχος είναι να δημιουργηθεί ένα εύκολο στη χρήση αλλά ταυτόχρονα ακριβές σύστημα μέτρησης, που να περιέχει όσο το δυνατόν λιγότερους δείκτες. Πριν τη συλλογή των κατάλληλων δεδομένων για τη δημιουργία των δεικτών πρέπει να απαντηθούν τρεις βασικές ερωτήσεις: 1. Ποιος είναι ο σκοπός της συλλογής των συγκεκριμένων δεδομένων; 2. Μπορούν τα συγκεκριμένα δεδομένα να μας δώσουν αυτό που θέλουμε να μάθουμε; 3. Μπορούμε να ενεργήσουμε πάνω στα συγκεκριμένα δεδομένα που συλλέγουμε; 39

Στη συνέχεια παρουσιάζονται ενδεικτικά μερικά παραδείγματα δεικτών μέτρησης (KPIs) που αναφέρονται σε μια βιομηχανική επιχείρηση: Χρηματοοικονομικά Κόστος Έσοδα Παραδείγματα Δεικτών Μέτρησης Κόστος Υλικών Εργατικό Κόστος Λειτουργικό Κόστος Κόστος αποθέματος Κόστος υπερωριών Κόστος εγγυήσεων Κόστος Πωλήσεων Επιτόκιο προϊόντος Υπερανάληψης Αριθμός έργων που παραδόθηκαν μέσα σε συγκεκριμένα χρονικά όρια και κόστος Πωλήσεις Μεικτά κέρδη Απόδοση επένδυσης Κερδοφορία προϊόντος Πίνακας 7. Παραδείγματα δεικτών μέτρησης για Χρηματοοικονομικά Στο χώρο των επιχειρήσεων, το να διαλέξει κάποιος μια οπτική αναπαράσταση της απόδοσης μιας επιχείρησης, εξαρτάται σε πολύ μεγάλο βαθμό από την αποτελεσματικότητα των διαθέσιμων εργαλείων για τη διαχείριση της επιχειρησιακής απόδοσης. Για να είναι εφικτό κάτι τέτοιο, στη «καρδιά» όλων των εργαλείων αυτών βρίσκονται οι κατάλληλοι δείκτες μέτρησης απόδοσης (KPIs). Οι δείκτες αυτοί, αποτυπώνουν τόσο τη συνολική λειτουργία της εκάστοτε επιχείρησης όσο και την απόδοση και αποτελεσματικότητα των ξεχωριστών μονάδων μέσα στον οργανισμό, έτσι ώστε να βαδίζουν όλοι μαζί κάτω από τους ίδιους στόχους και στρατηγικές. Οι δείκτες αυτοί εμφανίζονται πάντα σαν το επίκεντρο για την επιχειρησιακή ολοκλήρωση, το συντονισμό και τη λειτουργική τυποποίηση. 40

Η επιλογή και ο ορισμός του κατάλληλου δείκτη μέτρησης απόδοσης (KPI) είναι μια δύσκολη διαδικασία που απαιτεί τη αξιοποίηση δεδομένων και πληροφοριών από πολλά πληροφοριακά συστήματα συνδυαστικά (π.χ. ERP, CRM, BPM). Είναι βέβαιο ότι πάντα θα υπάρχει το δίλλημα της επιλογής ενός συγκεκριμένου αριθμού δεικτών από τους εκατοντάδες ή ακόμα και χιλιάδες σε πολλές περιπτώσεις που βρίσκονται διαθέσιμοι στα συστήματα αυτά. Είναι δύσκολο να διαχωριστούν οι δείκτες μέτρησης απόδοσης μια επιχείρησης από τις απλές μεταβλητές που είναι καταχωρημένες στα συστήματα τους. Επίσης θεωρείται ιδιαίτερα κρίσιμο να διασφαλιστεί ότι υπάρχουν τα διαθέσιμα δεδομένα για να υποστηριχτούν τέτοιοι δείκτες και ότι οι δείκτες που θα επιλεχθούν θα αποτελούν σημαντικούς επιχειρησιακούς παράγοντες. Οι κύριοι δείκτες απόδοσης (KPI) είναι σημαντικά στοιχεία που χρησιμοποιούνται για την παρακολούθηση της απόδοσης με βάση τους επιχειρησιακούς στόχους. Οι δείκτες μετρούν την βελτίωση ή την επιδείνωση της απόδοσης μιας δραστηριότητας που παίζει σημαντικό ρόλο για την επιτυχημένη λειτουργία μιας επιχείρησης και διαφέρουν ανάλογα με την επιχείρηση. Για παράδειγμα, σε ένα κέντρο τηλεφωνικής εξυπηρέτησης, η έγκαιρη απάντηση στις κλήσεις των πελατών είναι μια σημαντική επιχειρησιακή δραστηριότητα. Σε αυτή τη περίπτωση, ένας δείκτης μπορεί να είναι ο «μέσος χρόνος απάντησης σε κλήσεις πελατών» με στόχο λιγότερο από ένα λεπτό. Οι δείκτες βασίζονται στους επιχειρησιακούς στόχους. Ο επιχειρηματικός στόχος είναι ποσοτικοποιήσιμος, μετρήσιμος και προσανατολισμένος στο αποτέλεσμα. Ο στόχος μετατρέπεται σε έναν δείκτη με τον οποίο ο οργανισμός είναι σε θέση να μετρήσει κάποια διάσταση της διεργασίας ως προς το στόχο που έχει τεθεί και το σύνολο των ευρών. Είναι αποδεκτό ότι κάθε επιχείρηση λειτουργεί με βασικό στόχο την επίτευξη κέρδους μέσα από την παροχή προϊόντων και υπηρεσιών. Για την επίτευξη αυτού του βασικού στόχου απαιτείται η ολοκλήρωση μιας σειράς διαδικασιών και δραστηριοτήτων που περιλαμβάνουν μεταξύ άλλων την παραγωγή, την μετατροπή, την μεταφορά και την πώληση των προϊόντων της. Για την υλοποίηση των διαδικασιών αυτών, είναι απαραίτητο να υπάρχουν τα κατάλληλα συστήματα τα οποία θα συνεισφέρουν στην αποδοτικότερη οργάνωση και λειτουργία τους. Σε αυτό το σημείο εισάγεται η έννοια της μέτρησης της απόδοσης η οποία συμβάλει στην 41

διαρκή εσωτερική ανασκόπηση και αναθεώρηση των επιχειρήσεων για τη βελτίωση της ανταγωνιστικότητας τους. Από τη στιγμή που μια επιχείρηση έχει καθορίσει το στρατηγικό πλάνο λειτουργίας της, του βασικούς στόχους της και έχει προσδιορίσει τους μετόχους, πελάτες και προμηθευτές με τους οποίους θα συνεργάζεται κρίνεται απαραίτητο να εφαρμόσει ένα σύστημα για την μέτρηση και την παρακολούθηση της πορείας της ως προς την υλοποίηση των στόχων και την μέτρηση της απόδοσης της. Οι βασικοί δείκτες μέτρησης απόδοσης είναι ένας τρόπος αποτελεσματικής μέτρησης της επίτευξης στόχων μιας επιχείρησης. Η συντριπτική πλειοψηφία των επιχειρήσεων χρησιμοποιεί μια μεγάλη ποικιλία από δείκτες που μπορούν να προσδιορίσουν ποσοτικά την αποδοτικότητα και την υλοποίηση της στρατηγικής του οργανισμού. Υπάρχει μια βασική ανάγκη να διασφαλιστεί ότι τα KPIs ορίζονται σαν διεπιχειρησιακά πρότυπα και για αυτό το λόγο θα πρέπει να απαντηθούν βασικά ερωτήματα, όπως είναι: 1. Τι θα πρέπει να μετρηθεί; 2. Πόσους δείκτες θα πρέπει να παρακολουθεί ένας οργανισμός; 3. Πόσο συχνά θα πρέπει να μετράει τους δείκτες ο οργανισμός; 4. Ποιος είναι υπεύθυνος για το κάθε δείκτη; 5. Πόσο σύνθετος θα πρέπει να είναι ο κάθε δείκτης; Είναι σημαντικό να διαβεβαιωθεί ότι οι δείκτες μέτρησης απόδοσης που θα επιλεχθούν θα πρέπει να αντικατοπτρίζουν τη στρατηγική και να είναι σύμφωνοι με το όραμα και τους στόχους του οργανισμού. Με άλλα λόγια, τα KPIs θα πρέπει να ξεκινούν από το επίπεδο του οράματος (vision) του οργανισμού και να ακολουθούν τη διαδρομή μέσα στον οργανισμό. Στην πυραμίδα στρατηγικής προσέγγισης που φαίνεται στο παρακάτω διάγραμμα, φαίνεται ο τρόπος που μεταφράζεται το επιχειρησιακό όραμα σε διάφορα KPIs μέσα από τα ενδιάμεσα στάδια της δημιουργίας στρατηγικής (strategy), στόχων (objectives) και κρίσιμων παραγόντων επιτυχίας (critical success factors), τους κρίσιμους δείκτες μέτρησης απόδοσης (key performance indicators) και των ενεργειών δράσης (action plan initiatives). 42

Γράφημα 13. Πυραμίδα στρατηγικής δημιουργίας KPIs Σε ένα τόσο δύσκολο και απαιτητικό περιβάλλον, πρέπει να γίνει κατανοητό ότι τα στελέχη και η διοίκηση της εκάστοτε επιχείρησης χρειάζονται μια ολοκληρωμένη και πρακτική αναφορά για τους δείκτες μέτρησης απόδοσης και την ποσοτικοποίηση των αποτελεσμάτων τους. Ένας δείκτης μέτρησης απόδοσης είναι ένα σύστημα μέτρησης που ποσοτικοποιεί μια τάση ή ένα χαρακτηριστικό (Abela et.al, 2004). Σε όλους τους κλάδους, οι επιχειρήσεις χρησιμοποιούν δείκτες για να εξηγήσουν επαναλαμβανόμενα μοτίβα και πρότυπα απόδοσης, να μοιραστούν διάφορα ευρήματα, να καταλάβουν τις αιτίες εμφάνισης διαφόρων φαινομένων και για να προβλέψουν την εμφάνιση μελλοντικών γεγονότων. Σε όλους τους τομείς των επιστημών και των επιχειρήσεων οι δείκτες μέτρησης απόδοσης βασίζονται στην αυστηρότητα και την αντικειμενικότητα. Καθιστούν δυνατή τη σύγκριση των παρατηρήσεων για όλες τις δυνατές περιοχές μελέτης και τις χρονικές περιόδους. Βασικό τους χαρακτηριστικό είναι Σύμφωνα με τους Ambler και Styles (1995) «Όταν κάποιος μπορεί να μετρήσει ποσοτικά αυτό για το οποίο μιλάει και να το εκφράσει με αριθμούς, τότε μπορεί να γνωρίζει κάτι για αυτό. Όταν όμως δεν μπορεί να το μετρήσει ποσοτικά, και δεν μπορεί να το εκφράσει με αριθμούς, τότε η γνώση είναι μη ικανοποιητική». 43

Ο βρετανός φυσικός, λόρδος Kelviν, που ήταν υπεύθυνος για την εγκατάσταση του πρώτου υπερατλαντικού καλωδίου ήταν ένας από τους μεγαλύτερους υποστηρικτές της ποσοτικής έρευνας. Στην εποχή του, η μαθηματική ακρίβεια δεν είχε διαδοθεί ευρέως πέρα από τον χώρο των επιστημών, της μηχανικής και των οικονομικών. Στη σημερινή εποχή, αντίθετα, η αριθμητική και υπολογιστική ικανότητα αποτελεί ένα σημαντικό προσόν για κάθε επιχειρησιακό στέλεχος. Οι επιχειρήσεις θα πρέπει να ποσοτικοποιούν τις ευκαιρίες της αγοράς και τις απειλές του ανταγωνισμού. Θα πρέπει να αιτιολογούν ποσοτικά τα χρηματοοικονομικά ρίσκα, όπως και τα οφέλη από την υλοποίηση των αποφάσεων τους. Τα στελέχη των επιχειρήσεων θα πρέπει με τους κατάλληλους αριθμητικούς υπολογισμούς να αξιολογούν τα πιθανά σχέδια, να εξηγούν τις αποκλίσεις που μπορεί να προκύπτουν, να κρίνουν την επιχειρησιακή απόδοση και να μπορούν να εντοπίζουν πιθανά σημεία προς βελτίωση. Αυτές οι υπευθυνότητες απαιτούν ισχυρή ικανότητα ελέγχου των υπολογισμών, των συστημάτων και των μαθηματικών τύπων που τους παράγουν. Στο χώρο των επιχειρήσεων, τα στελέχη επιλέγουν, υπολογίζουν και εξηγούν τα αποτελέσματα βασικών δεικτών μέτρησης. Πρέπει να καταλαβαίνουν με πιο τρόπο είναι κατασκευασμένο το καθένα από αυτά και πως μπορεί να χρησιμοποιηθεί στη διαδικασία λήψης μιας απόφασης. Δυο από τις βασικότερες απόψεις στελεχών επιχειρήσεων αναφέρουν ότι: α) «κάθε δείκτης μέτρησης είτε χρησιμοποιείται ρητά για να επηρεάσει τη συμπεριφορά, είτε για να αξιολογήσει μελλοντικές αποφάσεις ή για να γίνει ένας απολογισμός στο τέλος θα επηρεάσει τις δράσεις και τις αποφάσεις της επιχείρησης (Barwise & Farley 2003)» και β) «αν δεν μπορείς να μετρήσεις κάτι, δεν μπορείς ούτε να το διαχειριστείς (Clark et al., 2004)». Οι αριθμητικοί υπολογισμοί αντιπροσωπεύουν και μια πρόκληση για τις σύγχρονες επιχειρήσεις, καθώς πολλοί δείκτες μετρήσεις είναι δύσκολο και πολύπλοκο να διαχειριστούν. Μερικοί δείκτες είναι πολύ εξειδικευμένοι και ταιριάζουν καλύτερα σε συγκεκριμένες αναλύσεις και άλλοι απαιτούν προσεγγιστικούς υπολογισμούς καθώς μπορεί να είναι ελλιπής ή μη διαθέσιμοι. Σε τέτοιες συνθήκες, είναι πιθανό να μη είναι τέλειοι όλοι οι δείκτες μέτρησης. Με τη χρήση πολλαπλών δεικτών μέτρησης, πρέπει να υπολογίζονται οι σχέσεις μεταξύ τους και οι περιορισμοί που συνδέονται με τον κάθε ένα χωριστά. Οι δείκτες 44

μέτρησης που ορίζονται μαθηματικά και διαδίδονται ευρέως μπορούν να γίνουν μέρος μιας ακριβής και λειτουργικής γλώσσας επικοινωνίας μέσα στα πλαίσια ενός οργανισμού. Μια μεγάλη πρόκληση που αφορά τους δείκτες μέτρησης αφορά τις μεγάλες διακυμάνσεις στη διαθεσιμότητα των δεδομένων μεταξύ των επιχειρησιακών κλάδων και των γεωγραφικών περιοχών. 3.5 Παραδείγματα KPIs ανά επιχειρησιακό κλάδο Μετά από σχετική έρευνα σε τρεις βασικούς κλάδους της οικονομίας, εντοπίστηκαν και καταγράφηκαν οι βασικότεροι δείκτες που παρακολουθούνται από τους εκάστοτε οργανισμούς. Συνήθως πολλοί από τους δείκτες είναι αποτέλεσμα αθροισμάτων (sum), μέσων όρων (average), ποσοστών (ratios), διαφορών (delta) και ποσοστιαίων μεταβολών (% variance) μεταβλητών μέσα σε συγκεκριμένα χρονικά διαστήματα. Οι κλάδοι που επιλέχθηκαν είναι οι Εταιρείες Πώλησης Προϊόντων Λιανικής, οι Εταιρείες Τηλεπικοινωνιών και οι Τραπεζικοί Οργανισμοί. 3.5.1 Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail) Σε μια Εταιρεία Πώλησης Προϊόντων Λιανικής είναι πολύ σημαντικό να καταγράφονται όλες οι συναλλαγές που πραγματοποιούν οι πελάτες στο σημείο πώλησης (Point of Sale - POS) με τέτοιο τρόπο ώστε να μπορούν να απαντηθούν τα παρακάτω ερωτήματα: Τι αγοράστηκε; Αναφέρεται στο μοναδικό κωδικό πώλησης του εκάστοτε προϊόντος (Universal Product Code - UPC). Πότε αγοράστηκε; Ακριβής ημερομηνία και ώρα της εκάστοτε συναλλαγής. Που αγοράστηκε; Αναφέρεται στο κατάλληλο κανάλι πώλησης ενός προϊόντος (π.χ. κατάστημα, τμήμα καταστήματος, ηλεκτρονικό κατάστημα). Πως αγοράστηκε; Αναφέρεται στο τρόπο πληρωμής του προϊόντος που αγοράστηκε (π.χ. με μετρητά, πιστωτική κάρτα, εκπτωτικά κουπόνια). 45

Το σύνολο της πληροφορίας που περιέχεται στις βάσεις δεδομένων κάθε εταιρείας πώλησης προϊόντων λιανικής, θα πρέπει να μπορεί να προσδιορίσει την κάθε συναλλαγή που έχει πραγματοποιηθεί σε βάθος ενός αξιόλογου χρονικού διαστήματος και θα πρέπει να περιέχει, το λιγότερο, τις ακόλουθες διαστάσεις: Κοινωνικό δημογραφικά χαρακτηριστικά του κάθε πελάτη που συλλέγονται κατά τη διάρκεια της εγγραφής του στο πρόγραμμα επιβράβευσης συναλλαγών. Η αξία της κάθε συναλλαγής Αξία αγορών ανά κατηγορία και υποκατηγορία προϊόντος Ημερομηνία τελευταίας συναλλαγής κάθε πελάτη Προτιμώμενα καταστήματα / τμήματα καταστημάτων για αγορές Αριθμός συναλλαγών σε συγκεκριμένη χρονική περίοδο Αριθμός ημερών με συναλλαγή σε συγκεκριμένη χρονική περίοδο Τρόπος πληρωμής (π.χ. μετρητά, πιστωτική κάρτα) και κανάλι πληρωμής (π.χ. στο κατάστημα, μέσω διαδικτύου) της εκάστοτε συναλλαγής Χρήση προσφοράς από προσωπική καμπάνια Ημερομηνίες και ώρες εκάστοτε συναλλαγής Χρήση εκπτωτικών κουπονιών και πόντων ανταμοιβής συναλλαγών Καταγεγραμμένα παράπονα και το αποτέλεσμα του χειρισμού αυτών Στη συνέχεια παρουσιάζεται μια αναλυτική λίστα με συγκεκριμένους δείκτες που ενδιαφέρουν μια Εταιρεία Πώλησης Προϊόντων Λιανικής. KPI Συνολικός αριθμός πληρωμών με πιστωτική κάρτα τη τελευταία χρονιά για κάθε πελάτη Συνολικός αριθμός πληρωμών με εκπτωτικά κουπόνια τη τελευταία χρονιά για κάθε πελάτη Συνολικός αριθμός πληρωμών με μετρητά τη τελευταία χρονιά για κάθε πελάτη Συνολικός αριθμός επισκέψεων κάθε πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά KPI Συνολικό ετήσιο ποσό αγορών με μετρητά Συνολικό ετήσιο ποσό αγορών με πιστωτική κάρτα Συνολικό ετήσιο ποσό αγορών με εκπτωτικά κουπόνια Συνολικό ετήσιο ποσό αγορών με εξαργύρωση πόντων ανταμοιβής 46

Συνολικός αριθμός προϊόντων που αποκτήθηκαν από πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά Συνολικό ποσό που δαπανήθηκε για αγορές προϊόντων για κάθε πελάτη τη τελευταία χρονιά Ημερομηνία τελευταίας συναλλαγής πελάτη από οποιοδήποτε κατάστημα Κάτοχος κάρτας μέλους Μέσος μηνιαίος αριθμός επισκέψεων κάθε πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός προϊόντων που αποκτήθηκαν από πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά Μέσος μηνιαίο ποσό που δαπανήθηκε για αγορές προϊόντων για κάθε πελάτη τη τελευταία χρονιά Κατασκευαστής προϊόντος Ιεραρχική ομάδα που ανήκει το προϊόν Ιεραρχική υποομάδα που ανήκει το προϊόν Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν τις πρωινές ώρες 08:00-12:00 την τελευταία χρονιά Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν μέσα σε σαββατοκύριακο την τελευταία χρονιά Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν τηλεφωνικά την τελευταία χρονιά Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν από το διαδίκτυο την τελευταία χρονιά Συνολικό ποσό συναλλαγών που Συνολική ετήσιο ποσό αγορών ανά πελάτη Συνολικός ετήσιος αριθμός αγορών ανά πελάτη Συνολικό ετήσιο ποσό αγορών σε επώνυμα προϊόντα Συνολικό ετήσιο ποσό αγορών σε προϊόντα ιδιωτικής ετικέτας Συνολικός ετήσιος αριθμός αγορών σε επώνυμα προϊόντα Συνολικός ετήσιος αριθμός αγορών σε προϊόντα ιδιωτικής ετικέτας Ποσό πληρωτέο για είδη ένδυσης Ποσό πληρωτέο για είδη υπόδησης Ποσό πληρωτέο για είδη υπόδησης Ποσό πληρωτέο για κοσμήματα Ποσό πληρωτέο για βρεφικά είδη Ποσό πληρωτέο για ηλεκτρονικά είδη Ποσό πληρωτέο για ηλεκτρονικού υπολογιστές Ποσό πληρωτέο για προϊόντα σίτισης Ποσό πληρωτέο για προϊόντα κρασιού 47

πραγματοποιήθηκαν στα καταστήματα την τελευταία χρονιά Τελευταία ημερομηνία επίσκεψης πελάτη σε οποιοδήποτε κατάστημα Συνολικός αριθμός συναλλαγών σε όλα τα καταστήματα την τελευταία χρονιά Συνολικός αριθμός καταστημάτων που επισκέφτηκε τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν τις πρωινές ώρες 08:00-12:00 την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν μέσα σε σαββατοκύριακο την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν τηλεφωνικά την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν από το διαδίκτυο την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν στα καταστήματα την τελευταία χρονιά Μέσος αριθμός προϊόντων που αγοράζονται ανά επίσκεψη Μέσο ποσό που ξοδεύεται ανά επίσκεψη Μέσο ποσό που ξοδεύεται σε προϊόντα προσφοράς ανά επίσκεψη Ποσό πληρωτέο για προϊόντα ομορφιάς Ποσό πληρωτέο για προϊόντα υγείας Ποσό πληρωτέο για φαρμακευτικά προϊόντα Ποσό πληρωτέο για αθλητικά προϊόντα Ποσό πληρωτέο για βιβλία Ποσό πληρωτέο για εφημερίδες Ποσό πληρωτέο για περιοδικά Ποσό πληρωτέο για μουσική Ποσό πληρωτέο για ταινίες Ποσό πληρωτέο για παιχνίδια Ποσό πληρωτέο για οικιακά προϊόντα Ποσό πληρωτέο για βιντεοπαιχνίδια Πίνακας 8. Ενδεικτικά KPIs Εταιρειών Πώλησης Προϊόντων Λιανικής Στη συνέχεια παρουσιάζεται μια ενδεικτική λίστα με μερικά παραδείγματα σύνθετων KPIs που αναφέρονται σε Εταιρείες Πώλησης Προϊόντων Λιανικής: 48

Μέσο ποσό συναλλαγής σε κάθε επίσκεψη σε κατάστημα τη τελευταία χρονιά Μέσος αριθμός αγοράς προϊόντων σε κάθε επίσκεψη σε κατάστημα τη τελευταία χρονιά Ποσοστό του συνολικού ποσού αγορών που αφορά προϊόντα ιδιωτικής ετικέτας Ποσοστό του συνολικού ποσού αγορών που αφορά προϊόντα επώνυμης ετικέτας Μέσος χρόνος που μεσολαβεί μεταξύ δύο συνεχόμενων επισκέψεων σε κατάστημα για αγορά ανά πελάτη Ποσοστό ποσού αγορών για κάθε κατηγορία προϊόντων το τελευταίο μήνα Μέσος μηνιαίος αριθμός επισκέψεων σε κατάστημα τη τελευταία χρονιά Μέσος αριθμός μοναδικών προϊόντων/κατηγοριών προϊόντων που αγοράστηκαν Ένδειξη αγοράς προϊόντων με τη χρήση του διαδικτύου 3.5.2 Εταιρεία Τηλεπικοινωνιών (Telecommunications) Οι βασικοί δείκτες απόδοσης που χρησιμοποιούνται στις Εταιρείες Τηλεπικοινωνιών βασίζονται στους παρακάτω βασικούς άξονες χαρακτηριστικών: Πληροφορίες σχετικά με την κίνηση των συμβολαίων, τον αριθμό και τη διάρκεια των κλήσεων ανά κατηγορία κλήσεων, δίκτυο επικοινωνίας και πηγή επικοινωνίας Κοινωνικό δημογραφικά χαρακτηριστικά του κάθε πελάτη Πληροφορίες σχετικά με το είδος των συνδέσεων του κάθε πελάτη Εξερχόμενες κλήσεις για την αναγνώριση εξερχόμενων προτύπων επικοινωνίας Εισερχόμενες κλήσεις για την αναγνώριση εισερχόμενων προτύπων επικοινωνίας Κάτοχος προπληρωμένης κάρτας ή συμβολαίου (περιλαμβανομένου και αλλαγές μεταξύ αυτών) 49

Χρεώσεις, πληρωμές και πιστωτικό ιστορικό πελάτη Οικονομικές πληροφορίες σχετικές με κερδοφορία από τη χρήση κάθε πελάτη καθώς και κόστος χρήσης Αγορά περιφερειακών προϊόντων σχετικά με τα κινητά (π.χ. hands free, Bluetooth) Χρήση επιπρόσθετων υπηρεσιών (π.χ. νέα, μουσική, παιχνίδια) Ανταπόκριση σε καμπάνιες και προσφορές Αριθμός παραπόνων και επίλυση αυτών Στη συνέχεια παρουσιάζεται μια αναλυτική λίστα με συγκεκριμένους δείκτες που ενδιαφέρουν μια Εταιρεία Τηλεπικοινωνιών. KPI Μέση διάρκεια εξερχόμενων κλήσεων τη τελευταία χρονιά Ποσό το οποίο χρεώθηκε στο λογαριασμό για κάθε υπηρεσία χρήσης Αποτέλεσμα εξερχόμενης κλήσης (π.χ. απασχολημένο, απάντηση κλήσης) Λόγος τερματισμού συμβολαίου (π.χ. οικειοθελής αποχώρηση, μεταφορά, κόστος υπηρεσιών) Μηνιαίο κόστος προγράμματος χρήσης Μηνιαία λεπτά χρήσης που προσφέρονται από το πρόγραμμα Μηνιαίος αριθμός μηνυμάτων (SMS) που KPI Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων 50

προσφέρονται από το πρόγραμμα Μηνιαίος αριθμός εικονογραφημένων μηνυμάτων (MMS) που προσφέρονται από το πρόγραμμα Μηνιαία χρήση δεδομένων (data) που προσφέρονται από το πρόγραμμα Διάρκεια συνεργασίας πελάτη με εταιρεία Πληρωμή λογαριασμών με μετρητά Πληρωμή λογαριασμών με πιστωτική κάρτα Είδος προγράμματος χρήσης (προπληρωμένη κάρτα, συμβόλαιο) Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων τη τελευταία χρονιά Μέσος μηνιαίος αριθμός αποστολής μηνυμάτων (SMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός αποστολής εικονογραφημένων μηνυμάτων (MMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός χρήσης διαδικτύου τη τελευταία χρονιά Μέσος μηνιαίος αριθμός χρήσης ηλεκτρονικού ταχυδρομείου τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων στο τμήμα εξυπηρέτησης πελατών τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων τη κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων 51

τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων τη τελευταία χρονιά Μέσος μηνιαίος αριθμός λήψης μηνυμάτων (SMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός λήψης εικονογραφημένων μηνυμάτων (MMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός ημερών με εισερχόμενες κλήσεις τη τελευταία χρονιά Μέσος μηνιαίος αριθμός ημερών με εξερχόμενες κλήσεις τη τελευταία χρονιά Συνολικός αριθμός εξερχόμενων εικονογραφημένων μηνυμάτων τη τελευταία χρονιά Συνολικός αριθμός εξερχόμενης αποστολής δεδομένων GPRS τη τελευταία χρονιά Συνολική διάρκεια εισερχόμενων κλήσεων τη τελευταία χρονιά Συνολική διάρκεια εξερχόμενων κλήσεων τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων τη τελευταία χρονιά κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία 52

χρονιά Συνολικά έσοδα από εξερχόμενη χρήση τη τελευταία χρονιά Συνολικά έσοδα από εξερχόμενη χρήση τη τελευταία χρονιά Οριακό μέσο έσοδο για κάθε χρήστη τη τελευταία χρονιά (MARPU) Μέσο έσοδο για κάθε χρήστη τη τελευταία χρονιά (ARPU) Δείκτης αξίας πελάτη Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Πίνακας 9. Ενδεικτικά KPIs Εταιρείας Τηλεπικοινωνιών Στη συνέχεια παρουσιάζεται μια ενδεικτική λίστα με μερικά παραδείγματα σύνθετων KPIs που αναφέρονται σε Εταιρείες Τηλεπικοινωνιών: Ποσοστό αριθμού αποστολής μηνυμάτων σε σχέση με τον αριθμό εξερχόμενων κλήσεων Ποσοστό εξερχόμενων κλήσεων στο ίδιο δίκτυο Ποσοστό εξερχόμενων κλήσεων σε ανταγωνιστικό δίκτυο Ποσοστό εξερχόμενων τηλεφωνημάτων σε εργάσιμη μέρα 53

Ποσοστό συνολικών εξερχόμενων κλήσεων που πραγματοποιήθηκαν στους τρεις πιο συχνά καλούμενου αριθμούς Ποσοστό συνόλου εξερχόμενων κλήσεων με διάρκεια μικρότερης του ενός λεπτού Ποσοστιαία μεταβολή αριθμού εξερχόμενων κλήσεων του τελευταίου τριμήνου σε σχέση με το προηγούμενο τρίμηνο Ποσοστιαία μεταβολή αριθμού εξερχόμενων μηνυμάτων του τελευταίου τριμήνου σε σχέση με το προηγούμενο τρίμηνο Δείκτης συνολικών εξερχόμενων κλήσεων προς εισερχόμενες Αριθμός μηνών που πραγματοποιήθηκαν συνομιλίες με περιαγωγή το τελευταίο χρόνο Αριθμός διαφορετικών ειδών υπηρεσιών που χρησιμοποιούνται Ένδειξη χρήσης διαδικτύου Ποσοστό αριθμού συμβολαίων που έχει αλλάξει ο πελάτης σε σχέση με τη διάρκεια που συνεργάζεται με την εταιρεία 3.5.3 Τραπεζικός Οργανισμός (Banking) Οι βασικοί δείκτες απόδοσης που χρησιμοποιούνται στους Τραπεζικούς Οργανισμούς βασίζονται στους παρακάτω βασικούς άξονες χαρακτηριστικών: Κοινωνικό δημογραφικά χαρακτηριστικά του κάθε πελάτη. Μείγμα προϊόντων και χρήση προϊόντων μα βάση το υπόλοιπο του χαρτοφυλακίου του κάθε πελάτη μέσα σε κάποια χρονική περίοδο. Συχνότητα και ποσό συναλλαγών ανά κατηγορία προϊόντος (π.χ. πιστωτική κάρτα, χρεωστική) και κανάλι χρήσης των προϊόντων (π.χ. ATM, Κατάστημα). Πιστωτικό σκορ κάθε πελάτη και ιστορικό καθυστέρησης πληρωμών. Αριθμός επαφών και ανταποκρίσεων σε προσφερόμενες καμπάνιες. Καταγεγραμμένα παράπονα ανά πελάτη. Ενεργή και ιστορική κατάσταση κάθε πελάτη (π.χ. ενεργός, ανενεργός). Η συχνότητα και η ποσότητα των αγορών για κάθε είδος προϊόντος. 54

Πληροφορία σχετική με την κερδοφορία του εκάστοτε πελάτη από το επενδυμένο κεφάλαιο του. Κατηγοριοποίηση πελάτη και ιστορική μετάβαση μεταξύ των κατηγοριών (π.χ. επιχειρηματίας, άνεργος, δημόσιος υπάλληλος). Επίπεδο ικανοποίησης πελάτη από παρεχόμενες υπηρεσίες. Επίπεδο ικανοποίησης από συνεργασία με τραπεζικούς υπαλλήλους. Ένδειξη ρύθμισης οφειλών κατά τη διάρκεια της τελευταίας χρονιάς. Στη συνέχεια παρουσιάζεται μια αναλυτική λίστα με συγκεκριμένους δείκτες που ενδιαφέρουν ένα Τραπεζικό Οργανισμό. KPI Τρέχων αριθμός λογαριασμών αποταμίευσης Τρέχων αριθμός λογαριασμών αποταμίευσης Τρέχων αριθμός προθεσμιακών καταθέσεων Τρέχων αριθμός μετοχικών αμοιβαίων κεφαλαίων Τρέχων αριθμός ομολογιακών αμοιβαίων κεφαλαίων Τρέχων αριθμός αμοιβαίων κεφαλαίων διαχείρισης διαθεσίμων Τρέχων αριθμός ομολόγων Τρέχων αριθμός μετοχών Τρέχων αριθμός ασφαλιστικών προϊόντων Τρέχων αριθμός συνταξιοδοτικών προϊόντων Τρέχων αριθμός προϊόντων KPI Αριθμός καταθέσεων σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Αριθμός καταθέσεων σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Αριθμός αναλήψεων χρημάτων κατά την τελευταία χρονιά Αριθμός πληρωμών σε πιστωτικές κάρτες κατά την τελευταία χρονιά Αριθμός πληρωμών σε καταναλωτικά δάνεια κατά την τελευταία χρονιά Αριθμός πληρωμών σε στεγαστικά δάνεια κατά την τελευταία χρονιά Αριθμός πληρωμών σε επιχειρηματικά δάνεια κατά την τελευταία χρονιά Αριθμός πληρωμών σε ασφαλιστικά προϊόντα κατά την τελευταία χρονιά Αριθμός πληρωμών σε δημόσιες υπηρεσίες κατά την τελευταία χρονιά Αριθμός πληρωμών σε τηλεπικοινωνιακούς παρόχους κατά την τελευταία χρονιά Αριθμός πληρωμών σε παρόχους διαδικτύου κατά 55

ασφάλισης υγείας Τρέχων αριθμός προϊόντων γενικής ασφάλισης Τρέχων αριθμός επιχειρηματικών δανείων Τρέχων αριθμός επιχειρηματικών λογαριασμών Τρέχων αριθμός επιχειρηματικών προϊόντων Τρέχων αριθμός στεγαστικών δανείων Τρέχων αριθμός δανείων εξασφάλισης κατοικίας Τρέχων αριθμός δανείων αυτοκινήτων Τρέχων αριθμός προσωπικών δανείων Τρέχων αριθμός φοιτητικών δανείων Τρέχων αριθμός δανείων ρύθμισης οφειλών Τρέχων αριθμός χρεωστικών καρτών Τρέχων αριθμός πιστωτικών καρτών Τρέχων αριθμός προπληρωμένων καρτών Τρέχων ποσό λογαριασμών αποταμίευσης Τρέχων ποσό λογαριασμών αποταμίευσης Τρέχων ποσό προθεσμιακών την τελευταία χρονιά Αριθμός μεταφορών χρημάτων σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Αριθμός μεταφορών χρημάτων σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Ποσό μεταφορών σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Ποσό μεταφορών σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Ποσό καταθέσεων σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Ποσό καταθέσεων σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Ποσό αναλήψεων χρημάτων κατά την τελευταία χρονιά Ποσό πληρωμών σε πιστωτικές κάρτες κατά την τελευταία χρονιά Ποσό πληρωμών σε καταναλωτικά δάνεια κατά την τελευταία χρονιά Ποσό πληρωμών σε στεγαστικά δάνεια κατά την τελευταία χρονιά Ποσό πληρωμών σε επιχειρηματικά δάνεια κατά την τελευταία χρονιά Ποσό πληρωμών σε ασφαλιστικά προϊόντα κατά την τελευταία χρονιά Ποσό πληρωμών σε δημόσιες υπηρεσίες κατά την τελευταία χρονιά Ποσό πληρωμών σε τηλεπικοινωνιακούς παρόχους κατά την τελευταία χρονιά Ποσό πληρωμών σε παρόχους διαδικτύου κατά την τελευταία χρονιά Συνολικό ποσό μεταφοράς σε λογαριασμούς της 56

καταθέσεων Τρέχων ποσό μετοχικών αμοιβαίων κεφαλαίων Τρέχων ποσό ομολογιακών αμοιβαίων κεφαλαίων Τρέχων ποσό αμοιβαίων κεφαλαίων διαχείρισης διαθεσίμων Τρέχων ποσό ομολόγων Τρέχων ποσό μετοχών Τρέχων ποσό ασφαλιστικών προϊόντων Τρέχων ποσό συνταξιοδοτικών προϊόντων Τρέχων ποσό προϊόντων ασφάλισης υγείας Τρέχων ποσό προϊόντων γενικής ασφάλισης Τρέχων ποσό επιχειρηματικών δανείων Τρέχων ποσό επιχειρηματικών λογαριασμών Τρέχων ποσό επιχειρηματικών προϊόντων Τρέχων ποσό στεγαστικών δανείων Τρέχων ποσό δανείων εξασφάλισης κατοικίας Τρέχων ποσό δανείων αυτοκινήτων Τρέχων ποσό προσωπικών δανείων Τρέχων ποσό φοιτητικών δανείων ίδιας τράπεζας την τελευταία χρονιά Συνολικό ποσό μεταφοράς σε λογαριασμούς άλλων τραπεζών την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών σε κατάστημα κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών σε ΑΤΜ κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών μέσω e- banking κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών μέσω phonebanking κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών μέσω SMS κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών σε κατάστημα κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών σε ΑΤΜ κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών μέσω e-banking κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών μέσω phonebanking κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών μέσω SMS κατά την τελευταία χρονιά Ετήσια συνολικά έσοδα που προκύπτουν για κάθε πελάτη Ετήσιο συνολικό κόστος που προκύπτει για κάθε πελάτη Μεγαλύτερος αριθμός μηνών καθυστέρησης για το σύνολο των πιστωτικών προϊόντων του πελάτη Συνολικό υπόλοιπο σε χρεωστικές κάρτες Συνολικό υπόλοιπο σε πιστωτικές κάρτες Συνολικό υπόλοιπο σε προπληρωμένες κάρτες 57

Τρέχων ποσό δανείων ρύθμισης οφειλών Τρέχων ποσό χρεωστικών καρτών Τρέχων ποσό πιστωτικών καρτών Διαθέσιμος λογαριασμός μισθοδοσίας Τρέχων ποσό προπληρωμένων καρτών Πίνακας 10. Ενδεικτικά KPIs Τραπεζικού Οργανισμού Στη συνέχεια παρουσιάζεται μια ενδεικτική λίστα με μερικά παραδείγματα σύνθετων KPIs που αναφέρονται σε Τραπεζικούς Οργανισμούς: Ποσοστό συνολικών αποταμιεύσεων σε σχέση με το συνολικό ποσού δανεισμού. Ποσοστό επενδυμένου κεφαλαίου σε προϊόντα υψηλού κινδύνου. Ποσοστό πληρωμών πιστωτικών καρτών σε σχέση με το συνολικό υπόλοιπο πιστωτικών καρτών. Ποσοστό χρησιμοποιημένου ποσού σε σχέση με το πιστωτικό όριο. Αριθμός μηνών που βρίσκεται ένα πιστωτικό προϊόν σε καθυστέρηση πληρωμής μιας δόσης. Μέγιστος αριθμός καθυστερημένων δόσεων σε όλα τα πιστωτικά προϊόντα κάθε πελάτη. Δείκτης χρήσης εναλλακτικών καναλιών (π.χ. Phone-banking, e-banking). Αριθμός διαφορετικών καναλιών που χρησιμοποιούνται από κάθε πελάτη. Αριθμός διαφορετικών κατηγοριών προϊόντων που κατέχει κάθε πελάτης. Μεταβολή ικανοποίησης προσφερόμενων υπηρεσιών σε σχέση με προηγούμενη χρονιά. Μήνες με υπόλοιπο λογαριασμού μικρότερο από συγκεκριμένο ποσό. Μεταβολή συνολικού ποσού αποταμίευσης του τελευταίου εξαμήνου σε σχέση με το προηγούμενο. 58

4. Δημιουργία Αξίας (Value Creation from Analytics) Σε κάθε επιχειρηματικό κλάδο, τα ανώτερα στελέχη προσπαθούν να εξασφαλίσουν ότι λαμβάνουν και αξιοποιούν την μέγιστη αξία που θα μπορούσαν από τις τεράστιες ποσότητες δεδομένων που έχουν διαθέσιμες μέσα στους οργανισμούς τους. Παρά το γεγονός ότι η χρήση νέων τεχνολογιών έχει συμβάλει καθοριστικά στη συλλογή περισσότερων δεδομένων, οι οργανισμοί ρίχνουν μεγάλο βάρος στην εξεύρεση καλύτερων τρόπων για να αποκτήσουν γνώση και αξία από τη διαχείριση των δεδομένων τους έτσι ώστε να μπορέσουν να αποκτήσουν ανταγωνιστικό πλεονέκτημα στην αγορά (Cherkassky 2007). Στην άκρως απαιτητική αγορά που δραστηριοποιούνται οι περισσότεροι οργανισμοί, όλο και περισσότεροι επιδιώκουν την άμεση, έγκαιρη και ακριβέστερη πληροφόρηση με τη κατάλληλη επιχειρησιακή γνώση. Οι οργανισμοί αυτοί έχουν αντιληφθεί ότι πρέπει να ερμηνεύσουν τις όποιες ενδείξεις από την οικονομία, την αγορά, τους πελάτες και τους συνεργάτες τους. Δεν αρκεί πλέον να μπορούν να αξιολογήσουν το παρελθόν, αλλά θα πρέπει να αξιοποιήσουν όλα τα διαθέσιμα δεδομένα και τις πηγές πληροφόρησης για να μπορέσουν να καταλάβουν την παρούσα κατάσταση τους και να μπορέσουν να υπολογίσουν τι είναι πιθανό να συμβεί στο άμεσο μέλλον και τι ενέργειες θα πρέπει να κάνουν για να αποκτήσουν τα βέλτιστα αποτελέσματα. Για να αντιληφθούν οι οργανισμοί την δυνατότητα χρήσης της πληροφόρησης και των προχωρημένων τεχνικών ποσοτικών αναλύσεων, το MIT σε συνεργασία με την IBM διεξήγαγε μια έρευνα σε περίπου 3,000 ανώτερα και μεσαία στελέχη οργανισμών και κατέληξε σε μερικά πολύ σημαντικά συμπεράσματα (MIT and IBM 2010). Το πιο σημαντικό από αυτά είναι ότι οι οργανισμοί με τη μεγαλύτερη απόδοση (top performers) χρησιμοποιούν μεθόδους αναλύσεων δεδομένων (analytics) 5 φορές περισσότερο από τους οργανισμούς με μικρότερη απόδοση (lower performers). Συνολικά, από τη συγκεκριμένη μελέτη έγινε αντιληπτό το πόσο σημαντικό γεγονός είναι η δημιουργία αξίας από την ποσοτική ανάλυση δεδομένων (analytics) και πως η βελτίωση της πληροφόρησης και η ενσωμάτωση προηγμένων μεθόδων διοικητικής πληροφόρησης αποτελεί μια σημαντικότερη προτεραιότητα στους οργανισμούς. 59

Σύμφωνα με τη συγκεκριμένη μελέτη, πραγματοποιείται μια ξεκάθαρη σύνδεση της απόδοσης ενός οργανισμού με την ανταγωνιστική αξία των analytics. Οι οργανισμοί που αξιοποιούν τέτοιες μεθόδους για την αξιοποίηση της επιχειρησιακής πληροφόρησης διαφοροποιούνται από τον ανταγωνισμό και έχουν επιπλέον εργαλεία για την αξιολόγηση μελλοντικών στρατηγικών και την καλύτερη κατανόηση των καθημερινών λειτουργιών. Είναι σημαντικό να τονιστεί ότι ο όγκος των δεδομένων δεν είναι πάντα το μεγαλύτερο εμπόδιο και πρόκληση που αντιμετωπίζει ένας οργανισμός, αλλά η έλλειψη κατανόησης σχετικά με το πώς η χρήση των analytics μπορεί να βελτιώσει την επιχειρησιακή απόδοση. Τα στελέχη των οργανισμών αναζητούν συνέχεια καλύτερους τρόπους για να εντοπίσουν και να επικοινωνήσουν σύνθετη γνώση που προκύπτει από τα την ερμηνεία των δεδομένων ώστε να υλοποιηθούν οι κατάλληλες ενέργειες. Οι μεγάλοι οργανισμοί ήδη έχουν υιοθετήσει τεχνικές για την ανάλυση δεδομένων σχετικά με κείμενα (text analytics), φωνής (voice analytics), κοινωνικών δικτύων (social media analytics) και άλλων προχωρημένων τεχνικών πρόβλεψης όπως η πρόβλεψη κάποιας απάτης (fraud analytics) ή ενός πιστωτικού κινδύνου (risk analytics). Η χρήση τέτοιων προηγμένων τεχνικών ανάλυσης δεδομένων σε συνδυασμό με εξελιγμένων υπολογιστικά εργαλεία μπορούν να βοηθήσουν τους οργανισμούς να δημιουργήσουν την κατάλληλη γνώση από τα δεδομένα τους και να μετατρέψουν αριθμούς και δεδομένα (data) σε γνώση και αξία (value). Στη συνέχεια παρουσιάζεται ένα διάγραμμα σχετικό με την χρήση προηγμένων τεχνικών ανάλυσης δεδομένων για την δημιουργία αξίας και την λήψη των κατάλληλων επιχειρηματικών αποφάσεων και ενεργειών: 60

Γράφημα 14. Διαδικασία δημιουργία αξίας για την λήψη αποφάσεων Η όλο και αυξανόμενη τάση στον επιχειρησιακό κόσμο σχετικά με τη χρήση των analytics είναι η ανάγκη και η ικανότητα της χρήσης των δεδομένων όχι μόνο για τη δημιουργία αξίας αλλά και για τη δημιουργία ανταγωνιστικού πλεονεκτήματος. Οι οργανισμοί που έχουν αποκτήσει εμπειρία στην ενσωμάτωση και τη χρήση των analytics, βασίζονται σε αυτό για τον καθορισμό της στρατηγικής τους αλλά και για τις καθημερινές τους δραστηριότητες σχετικές με το μάρκετινγκ και τις λειτουργίες για την αύξηση της αποδοτικότητας τους. Τέτοιοι οργανισμοί χρησιμοποιούν ένα ολοκληρωμένο χαρτοφυλάκιο με τα κατάλληλα υπολογιστικά εργαλεία για την υποστήριξη της μοντελοποίησης προηγμένων αναλυτικών μεθόδων. Για την αξιοποίηση των δεδομένων και τη δημιουργία αξίας από αυτά, δεν αρκούν μόνο τα κατάλληλα εργαλεία και τα κατάλληλα στελέχη που έχουν αναλυτικό προσανατολισμό. Οι οργανωτικοί παράγοντες παίζουν εξίσου σημαντικό ρόλο για να επιτευχθεί ανταγωνιστικό πλεονέκτημα από τη χρήση των analytics. Είναι απαραίτητο να υπάρχει διοικητική υποστήριξη για τα analytics μέσα σε όλο το οργανισμό, να ενσωματώνονται εύκολο πιθανές αλλαγές και νέες ιδέες. Για ένα μεγάλο οργανισμό, η βασική ερώτηση που πρέπει να απαντηθεί δεν είναι το κόστος που έχει η χρήση των analytics, αλλά πόση αξία δημιουργείται από την αξιοποίηση των δεδομένων και των τεχνικών ποσοτικής ανάλυσης αυτών. 61

5. Ανάλυση Δεδομένων Οργανισμών Στο κεφάλαιο αυτό, πραγματοποιείται η ποσοτική ανάλυση σε πραγματικά δεδομένα μεγάλων εταιρειών που δραστηριοποιούνται στη παγκόσμια αγορά και αφορούν τρεις διαφορετικούς επιχειρησιακούς κλάδους. Η επιλογή των συγκεκριμένων κλάδων πραγματοποιήθηκε με βάση προσωπικό ενδιαφέρον καθώς και το ιδιαίτερα ανταγωνιστικό περιβάλλον που δημιουργούν για τους οργανισμούς που συμμετέχουν σε αυτούς. Οι κλάδοι προς μελέτη και ανάλυση είναι οι εξής: Τραπεζικοί Οργανισμοί Εταιρείες Τηλεπικοινωνιών Εταιρείες Πώλησης Προϊόντων Λιανικής Για να είναι δυνατό να αναλυθούν ποσοτικά οι αντιπροσωπευτικές εταιρείες που δραστηριοποιούνται στους κλάδους αυτούς έπρεπε να ολοκληρωθούν μια σειρά από βήματα. Αρχικά έπρεπε να ερευνηθεί η δυνατότητα εύρεσης πρωτογενών δεδομένων από αξιόπιστες και διαθέσιμες πηγές που να αφορούν στοιχεία απόδοσης των οργανισμών. Στη συνέχεια, αξιολογήθηκαν τα διαθέσιμα δεδομένα και πραγματοποιήθηκε ένας αρχικός ποιοτικός έλεγχος για να γίνει αντιληπτό κατά πόσο είναι δυνατό να χρησιμοποιηθούν αυτά για μια εκτενή ποσοτική ανάλυση. Με βάση τη ποικιλία της πληροφορίας που περιείχαν, τη πληρότητά τους και το μέγεθος των οργανισμών που αφορούσαν επιλέχθηκαν αυτά που θα χρησιμοποιηθούν στο κεφάλαιο αυτό. Οι ποσοτικές αναλύσεις θα υλοποιηθούν με τη χρήση των κατάλληλων τεχνικών και αλγορίθμων και θα αφορούν τη δημιουργία και την επιλογή των κατάλληλων δεικτών μέτρησης (KPIs) με τη χρήση μεθόδων περιορισμού και επιλογής μεταβλητών όπως είναι η ανάλυση συσχετίσεων (correlation analysis) και η ανάλυση παραγόντων (factory analysis). Μέσα από τις επιλογές αυτές, θα εφαρμοστούν τεχνικές τμηματοποίησης των διαθέσιμων δεδομένων για να μπορέσει να δημιουργηθεί προστιθέμενη αξία για τους οργανισμούς που θα τους βοηθήσουν στην ανάπτυξη κάποιου ανταγωνιστικού πλεονεκτήματος. 62

5.1 Τραπεζικός Οργανισμός (Banking) Για την πραγματοποίηση της ποσοτικής ανάλυσης που αφορά Τραπεζικούς Οργανισμούς χρησιμοποιήθηκαν τα αποτελέσματα από μια έρευνα που πραγματοποιήθηκε στις ΗΠΑ και αφορούσε την ικανοποίηση ενός αριθμού μικρομεσαίων και μεσαίων επιχειρήσεων από την εξυπηρέτηση που δέχθηκαν σε ένα συγκεκριμένο χρονικό διάστημα καθώς και τις υπηρεσίες που παρείχαν οι τράπεζες προς αυτές. Οι οργανισμοί αυτοί έχουν άμεση συνεργασία με την πλειοψηφία των τραπεζικών οργανισμών που δραστηριοποιούνται στη χώρα. Τα δεδομένα από τις απαντήσεις του συγκεκριμένου ερωτηματολογίου αφορούσαν περίπου 12.000 οργανισμούς, μια χρονική περίοδο μιας δεκαετίας (2000-2011) και μια σειρά από σημαντικά ζητήματα που ενδιαφέρουν τους οργανισμούς και τη σχέση που έχουν με τις συνεργαζόμενες τράπεζες. 5.1.1 Ανάλυση μεταβλητών Τραπεζικού Οργανισμού Για να γίνει εφικτή η ανάλυση της ικανοποίησης από τη συνεργασία των μικρομεσαίων επιχειρήσεων με τους Τραπεζικούς Οργανισμούς χρησιμοποιήθηκαν μια σειρά από δείκτες όπως φαίνονται στον παρακάτω πίνακα και με βάση αυτούς πραγματοποιήθηκε η ανάλυση στη συγκεκριμένη διάσταση. Η πλήρης λίστα των KPIs παρατίθεται στο παράρτημα της εργασίας. KPIs Τραπεζικού Οργανισμού Ο οργανισμός σχεδιάζει να αλλάξει την κύρια τράπεζα συνεργασία τους επόμενους 12 μήνες Είναι εύκολο να συνεργαστείς με τη τράπεζα Η τράπεζα κάνει τα πράγματα σωστά από τη πρώτη φορά Η τράπεζα έχει σε εκτίμηση τον οργανισμό μας Η τράπεζα ανταποκρίνεται στα αιτήματα του οργανισμού μας Η τράπεζα θα σταθεί δίπλα στον οργανισμό μας σε δύσκολες στιγμές Η τράπεζα καλύπτει επαρκώς τις πιστωτικές ανάγκες του οργανισμού μας Η τράπεζα γνωρίζει και καταλαβαίνει τον οργανισμό KPIs Banking changebank easybusiness getright appreciatesbusiness responsive standby meetcredit understandbusiness 63

Η τράπεζα έχει επικοινωνήσει τις αλλαγές στη πιστωτική της πολιτική που σχετίζονται με τον οργανισμό μας Τράπεζα είναι χρηματοοικονομικά σταθερή Τράπεζα είναι ανταγωνιστικές τιμές υπηρεσιών Τράπεζα είναι ανταγωνιστικές τιμές και επιτόκια δανείων Σύσταση για συνεργασία νέας εταιρείας με παρόμοιες ανάγκες στη τράπεζα Επίπεδο τρέχουσας απόδοσης σχετικά με τη κατανόηση των στόχων του οργανισμού μας από τη τράπεζα Επίπεδο τρέχουσας απόδοσης σχετικά με τη ολοκλήρωση των αιτημάτων του οργανισμού μας από τη τράπεζα Επίπεδο ικανοποίησης από την κύρια τράπεζα Επίπεδο ικανοποίησης από τον Account Officer τη τελευταία χρονιά Επίπεδο ικανοποίησης από το βοηθό του Account Officer τη τελευταία χρονιά Επίπεδο ικανοποίησης από κάποιον ειδικό τη τελευταία χρονιά Επίπεδο ικανοποίησης από το κατάστημα συνεργασίας τη τελευταία χρονιά Επίπεδο ικανοποίησης από τη χρήση των ATM τη τελευταία χρονιά Επίπεδο ικανοποίησης από τη χρήση του τηλεφωνικού κέντρου τη τελευταία χρονιά Λάθη που σχετίζονται με τη μισθοδοσία Λάθη που σχετίζονται με θετική πληρωμή Λάθη που σχετίζονται με τις αμοιβές Λάθη που σχετίζονται με τις Υπηρεσίες communicatepolicy financiallystable competitiveservicecharges competitiverates/feesonloans referbank PRCPunderstand PRCPprompt banksat Officersat Assistantsat Specialistsat branchsat ATMsat 1800sat payrollerror positivepayerror feeserror serviceerror Πίνακας 11. Πίνακας KPIs Τραπεζικών Οργανισμών (Banking) 5.1.2 Ανάλυσης συχνοτήτων μεταβλητών Τραπεζικού Οργανισμού Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των KPIs που χρησιμοποιήθηκαν για την ανάλυση των Τραπεζικών Οργανισμών. 64

N of valid Missing % Missing Mean Std. Error of Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile Percentile Median Variance Min Max Sum Mean Deviation 1% 5% 10% 25% 50% 75% 90% 99% SMSA3 1193 10674 90% 137.15 5.74162 0 198.31468 39328.713 0 666 163620 0 0 0 0 0 265 466 637 SMSA4 8617 3250 27% 214.33 5.297 34 491.737 241805.422 0 6585 1846855 0 0 0 0 34 370 511 2343.84 County 11642 225 2% 77.87 0.801 59 86.416 7467.742 1 840 906533 1 3 9 27 59 103 157 495.56 banks used 11171 696 6% 1.98 0.014 2 1.518 2.304 1 25 22109 1 1 1 1 2 2 3 8 bank sat 11770 97 1% 1.67 0.009 1 0.996 0.992 1 5 19687 1 1 1 1 1 2 3 5 change bank 11786 81 1% 2.06 0.004 2 0.434 0.189 1 3 24242 1 1 2 2 2 2 3 3 Officer use 11608 259 2% 1.17 0.003 1 0.372 0.138 1 2 13535 1 1 1 1 1 1 2 2 Assistant use 10960 907 8% 1.45 0.005 1 0.498 0.248 1 2 15938 1 1 1 1 1 2 2 2 Specialist use 10899 968 8% 1.67 0.004 2 0.469 0.22 1 2 18241 1 1 1 1 2 2 2 2 branch use 11363 504 4% 1.15 0.003 1 0.357 0.127 1 2 13061 1 1 1 1 1 1 2 2 ATM use 10924 943 8% 1.84 0.004 2 0.369 0.136 1 2 20076 1 1 1 2 2 2 2 2 touchtone use 10967 900 8% 1.87 0.003 2 0.331 0.11 1 2 20558 1 1 1 2 2 2 2 2 1800 use 10929 938 8% 1.78 0.004 2 0.411 0.169 1 2 19507 1 1 1 2 2 2 2 2 webtransac use 11348 519 4% 1.25 0.004 1 0.433 0.187 1 2 14175 1 1 1 1 1 1 2 2 webinfo use 11083 784 7% 1.59 0.005 2 0.493 0.243 1 2 17576 1 1 1 1 2 2 2 2 webtranpc use 8521 3346 28% 1 0 1 0 0 1 1 8521 1 1 1 1 1 1 1 1 Officer contact 5493 6374 54% 2.04 0.036 1 2.639 6.965 0 30 11195 0 0 1 1 1 2 4 15 Assistant contact 3153 8714 73% 2.262 0.0582 1 3.2676 10.678 0 30 7133 0 0 0.5 1 1 2 5 20 Specialist contact 1929 9938 84% 1.7315 0.0664 1 2.91618 8.504 0 30 3340 0 0 0 1 1 2 3 20 branch contact 5307 6560 55% 9.974 0.1287 6 9.3767 87.923 0 60 52929.5 0 0 0.5 3 6 20 22 30 webtransac contact 4927 6940 58% 13.581 0.1802 10 12.6522 160.077 0 100 66914.5 0 0 0 3 10 20 30 51.44 webinfo contact 2328 9539 80% 7.762 0.2075 2 10.014 100.281 0 60 18070.5 0 0 0 1 2 12 25 31 webtranpc contact 4927 6940 58% 13.581 0.1802 10 12.6522 160.077 0 100 66914.5 0 0 0 3 10 20 30 51.44 Πίνακας 12. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 1/3 N of valid Missing % Missing Mean Std. Error of Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile Percentile Median Variance Min Max Sum Mean Deviation 1% 5% 10% 25% 50% 75% 90% 99% Officer sat 9302 2565 22% 1.49 0.009 1 0.9 0.811 1 5 13894 1 1 1 1 1 2 3 5 Assistant sat 5665 6202 52% 1.43 0.011 1 0.817 0.668 1 5 8090 1 1 1 1 1 2 2 5 Specialist sat 3327 8540 72% 1.609 0.0162 1 0.93445 0.873 1 5 5353 1 1 1 1 1 2 3 5 branch sat 9028 2839 24% 1.4 0.008 1 0.752 0.566 1 5 12633 1 1 1 1 1 2 2 4 ATM sat 1596 10271 87% 1.4204 0.01999 1 0.79847 0.638 1 5 2267 1 1 1 1 1 2 2 5 1800 sat 2144 9723 82% 1.819 0.02367 1 1.09591 1.201 1 5 3900 1 1 1 1 1 2 4 5 webtransac sat 7870 3997 34% 1.43 0.008 1 0.74 0.548 1 5 11226 1 1 1 1 1 2 2 4 webinfo sat 4139 7728 65% 1.5 0.012 1 0.792 0.628 1 5 6203 1 1 1 1 1 2 3 4 webtranpc sat 7870 3997 34% 1.43 0.008 1 0.74 0.548 1 5 11226 1 1 1 1 1 2 2 4 other bank1 2009 9858 83% 315.6013 5.08379 289 227.86519 51922.546 12 818 634043 19 19 24 97 289 600 603 734 otherbank1 asset modified 2009 9858 83% 3.0204 0.05902 1 2.64558 6.999 1 9 6068 1 1 1 1 1 5 9 9 easy business 11773 94 1% 1.54 0.007 1 0.791 0.626 1 5 18104 1 1 1 1 1 2 2 4 get right 11781 86 1% 1.61 0.007 1 0.78 0.609 1 5 18930 1 1 1 1 1 2 2.8 4 appreciates business 11785 82 1% 1.63 0.009 1 0.953 0.909 1 5 19216 1 1 1 1 1 2 3 5 responsive 11328 539 5% 1.52 0.008 1 0.833 0.694 1 5 17255 1 1 1 1 1 2 3 5 stand by 11732 135 1% 2.25 0.013 2 1.383 1.913 1 5 26417 1 1 1 1 2 3 5 5 meet credit 11706 161 1% 2.14 0.013 2 1.386 1.921 1 5 25030 1 1 1 1 2 3 5 5 communicate policy 3493 8374 71% 2.0263 0.02272 2 1.34292 1.803 1 5 7078 1 1 1 1 2 2 5 5 financially stable 11713 154 1% 1.59 0.009 1 1.023 1.047 1 5 18615 1 1 1 1 1 2 3 5 competitive service charges 10432 1435 12% 1.9303 0.01065 2 1.08785 1.183 1 5 20137 1 1 1 1 2 2 3 5 competitive rates/fees on loans 10373 1494 13% 2.2402 0.01364 2 1.38929 1.93 1 5 23238 1 1 1 1 2 3 5 5 refer bank 11704 163 1% 1.88 0.011 1 1.193 1.423 1 5 21970 1 1 1 1 1 2 4 5 primary contact 7958 3909 33% 2.67 0.016 3 1.384 1.917 1 8 21269 1 1 1 2 3 4 5 6 PRCI understand 8095 3772 32% 2.03 0.01 2 0.887 0.787 1 4 16446 1 1 1 1 2 3 3 4 PRCI prompt 8085 3782 32% 1.64 0.007 2 0.634 0.401 1 4 13242 1 1 1 1 2 2 2 4 PRCI solution 8016 3851 32% 2.14 0.01 2 0.9 0.809 1 4 17174 1 1 1 1 2 3 3 4 PRCI respect 8101 3766 32% 1.67 0.008 2 0.689 0.475 1 4 13548 1 1 1 1 2 2 3 3 PRCI accessible 8090 3777 32% 1.59 0.007 2 0.618 0.382 1 4 12898 1 1 1 1 2 2 2 3 Πίνακας 13. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 2/3 Στη συνέχεια παρουσιάζονται μερικοί πίνακες κατανομής συχνοτήτων για μερικά σημαντικά KPIs που χρησιμοποιήθηκαν στην ανάλυση. 65

Όγκος Πωλήσεων Frequency Percent Valid Percent Cumulative Percent $100k 499k 1890 15.9 15.9 15.9 $500k- 999k 1798 15.2 15.2 31.1 $1 mil - 2.4 mil 1665 14.0 14.0 45.1 $2.5 mil - 4.9 mil 1531 12.9 12.9 58.0 $5 mil 10 mil 1435 12.1 12.1 70.1 $10 mil - 24.9 mil 1161 9.8 9.8 79.9 $25 mil - 49.9 mil 1032 8.7 8.7 88.6 $50 mil - 99.9 mil 773 6.5 6.5 95.1 $100 mil 500 mil 582 4.9 4.9 100.0 Total 11867 100.0 100.0 Πίνακας 14. Πίνακας κατανομής συχνοτήτων όγκου πωλήσεων Επίπεδο ικανόποίησης από την Τράπεζα Frequency Percent Valid Percent Cumulative Percent Very Satisfied 6852 57.7 58.2 58.2 Somewhat Satisfied 3140 26.5 26.7 84.9 Neutral 878 7.4 7.5 92.4 Somewhat Dissatisfied 579 4.9 4.9 97.3 Very Dissatisfied 321 2.7 2.7 100.0 Total 11770 99.2 100.0 Πίνακας 15. Πίνακας κατανομής συχνοτήτων επιπέδου ικανοποίησης με τη τράπεζα Αλλαγή Τράπεζας Frequency Percent Valid Percent Cumulative Percent Yes 796 6.7 6.8 6.8 No 9524 80.3 80.8 87.6 Not sure 1466 12.4 12.4 100.0 Total 11786 99.3 100.0 Πίνακας 16. Πίνακας κατανομής συχνοτήτων επιθυμίας για αλλαγή τράπεζας Χρήση Account Officer Frequency Percent Valid Percent Cumulative Percent Yes 9681 81.6 83.4 83.4 No 1927 16.2 16.6 100.0 Total 11608 97.8 100.0 Πίνακας 17. Πίνακας κατανομής συχνοτήτων χρήσης account officer Χρήση βοηθού Account Officer Frequency Percent Valid Percent Cumulative Percent Yes 5982 50.4 54.6 54.6 No 4978 41.9 45.4 100.0 Total 10960 92.4 100.0 Πίνακας 18. Πίνακας κατανομής συχνοτήτων χρήσης βοηθού account officer 66

Γράφημα 15. Γράφημα κατανομής συχνοτήτων όγκου πωλήσεων 5.1.3 Ανάλυση συσχετίσεων μεταβλητών Τραπεζικού Οργανισμού Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των KPIs που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση των τραπεζικών οργανισμών. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα εντοπίζεται μερικοί συνδυασμοί KPIs που έχουν μεγάλη συσχέτιση (>75%), επομένως θα εξαιρεθούν από τη συνέχεια της ανάλυσης. 67

Sales Region State SIC2 SIC4 SIC6 SIC8 Selected Correlation >75% Volume Code Code Code Code Code Code SMSA 3 SMSA 4 Weig ht Count y Barlow County Code Quarter Year / Year Segme nt primary bank primar banks asset y bank used modifie d bank sat chang Office Assista Speciali branc e bank r use nt use st use h use ATM use touchton 1800 e use use webtran webinf webtran sac use o use PC use Office r conta ct Assista nt contact Speciali st contact branc h conta ct ATM 1800 conta conta ct ct webtran sac contact webinf o contac t webtran PC contact Officer sat Assista nt sat Speciali st sat branc h sat ATM sat touchton e sat 1800 sat otherban webtran webinf webtran other k1 asset sac sat o sat PC sat bank1 modified Sales Volume 100% -1% 2% -5% -5% -5% -5% -51% -10% -60% 2% -2% 4% -2% 84% -10% -12% 19% -5% -1% -26% -21% -36% 14% 20% 2% -2% -22% -10% 0% 8% 7% 8% 11% -1% 10% 22% 14% 22% -3% -5% -4% 1% 6% -10% -8% 0% -1% 0% -9% -5% Region Code -1% 100% -23% 4% 4% 4% 4% 8% 4% 14% -8% -22% -1% 2% 0% -8% -13% 0% 5% 1% 3% 0% 1% -9% -6% -3% -7% -3% -2% 0% 3% 4% 2% -4% 0% 1% -1% 3% -1% 5% 3% 5% 4% -1% 10% 5% 2% 2% 2% -3% -3% State Code 2% -23% 100% -2% -2% -2% -2% 5% 3% -4% 16% 96% 0% 1% 1% 0% 2% 1% -4% -1% -2% -3% -4% 0% 4% 1% 4% 0% 0% 0% 0% -6% -5% 4% -4% -3% 2% 1% 2% -2% -2% -4% -2% 2% -10% -3% 0% -2% 0% -1% -2% SIC2 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 2% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SIC4 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 1% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SIC6 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 1% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SIC8 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 1% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SMSA3-51% 8% 5% 0% 0% 0% 0% 100% 0% 22% 2% 5% 61% -61% -61% -9% -8% -9% 4% 3% 20% 11% 20% -16% -11% 0% -1% 5% 1% 0% -5% -5% -5% -6% 6% -15% -20% -18% -20% 3% 5% 5% 4% -7% 15% 8% 0% 4% 0% 0% 0% SMSA4-10% 4% 3% -3% -3% -3% -3% 0% 100% 4% -3% 3% 16% -38% -15% -3% -4% -3% 1% 0% 1% 0% 2% -6% -2% -3% 0% 1% 0% 0% -1% 0% -5% -3% -1% -2% -3% -5% -3% 1% 2% -1% -1% -2% -2% 1% -1% 1% -1% 1% -1% Weight -60% 14% -4% 10% 10% 10% 10% 22% 4% 100% 2% -2% -3% 2% -33% 3% 5% -10% 0% 0% 19% 15% 18% -5% -19% -3% -1% 11% 4% 0% -6% -3% -4% -13% -3% -4% -12% -10% -12% 1% 3% 1% 0% -5% 4% 2% -1% -1% -1% 6% 2% County 2% -8% 16% -1% -1% -1% -1% 2% -3% 2% 100% 16% -1% 0% 1% 4% 5% 0% -3% 0% -3% -3% -2% 2% 4% 0% 1% -1% -1% 0% 2% 2% 2% 1% 4% 1% 1% 0% 1% -2% -3% -3% -2% -4% -5% -2% -1% -2% -1% 1% -1% Barlow County Code -2% -22% 96% -3% -3% -3% -3% 5% 3% -2% 16% 100% 2% 2% -4% 1% 3% 0% -3% -1% -2% -2% -1% 0% 3% 1% 4% 1% 0% 0% 0% -6% -4% 4% -4% -2% 1% 0% 1% -2% -2% -4% -2% 2% -9% -3% -1% -2% -1% -2% -1% Quarter / Year 4% -1% 0% -1% -1% -1% -1% 61% 16% -3% -1% 2% 100% -47% 5% 0% 0% 1% -1% 1% 0% 0% -1% 1% 2% 0% 0% -1% -1% 0% -1% -1% 2% -1% 2% -2% 4% 2% 4% 0% 0% 0% 0% 4% -4% -2% 1% 1% 1% 0% -2% Year -2% 2% 1% 3% 3% 3% 3% -61% -38% 2% 0% 2% -47% 100% -1% 0% 1% -1% -1% -1% -1% 1% 2% -1% -2% 0% 0% -2% 0% 0% 0% 0% 1% -1% -8% 3% -2% 1% -2% -2% -2% -3% -1% -1% 4% -2% 0% -2% 0% 4% 7% Segment 84% 0% 1% -2% -2% -2% -2% -61% -15% -33% 1% -4% 5% -1% 100% -11% -11% 15% -6% -2% -20% -17% -34% 13% 14% 2% -3% -18% -8% 0% 7% 6% 8% 7% -3% 10% 20% 13% 20% -3% -3% -4% 1% 4% -7% -6% 0% -1% 0% 0% 0% primary bank -10% -8% 0% -7% -7% -7% -7% -9% -3% 3% 4% 1% 0% 0% -11% 100% 79% 0% -17% -3% -3% 0% 10% 9% 8% 6% 15% 6% 1% 0% 4% 8% 4% 4% -1% 1% -4% -2% -4% -13% -14% -14% -15% -10% -19% -21% -7% -11% -7% 12% 13% primary bank asset modified -12% -13% 2% -7% -7% -7% -7% -8% -4% 5% 5% 3% 0% 1% -11% 79% 100% 0% -19% -3% -1% 1% 13% 9% 6% 5% 15% 6% 0% 0% 3% 8% 3% 6% -3% 4% -3% -3% -3% -15% -16% -18% -18% -11% -18% -22% -10% -14% -10% 12% 11% banks used 19% 0% 1% 5% 5% 5% 5% -9% -3% -10% 0% 0% 1% -1% 15% 0% 0% 100% 5% -1% -8% -7% -11% 2% 4% -1% -1% -6% -5% 0% 8% 7% 0% 9% 1% 1% 6% 3% 6% 4% 6% 1% 6% 5% 4% 2% 4% 3% 4% -2% -3% bank sat -5% 5% -4% -2% -2% -2% -2% 4% 1% 0% -3% -3% -1% -1% -6% -17% -19% 5% 100% -4% 6% 6% 8% -1% -6% -3% -7% 1% 2% 0% -1% 0% 0% -2% 4% 1% -3% -1% -3% 75% 67% 64% 57% 46% 55% 59% 49% 51% 49% -2% -2% change bank -1% 1% -1% 0% 0% 0% 0% 3% 0% 0% 0% -1% 1% -1% -2% -3% -3% -1% -4% 100% 2% 2% 2% -2% 0% -1% -2% 1% 2% 0% -3% -2% -3% -1% 0% -5% -1% -4% -1% -7% -5% -3% -1% -1% -3% -2% 0% 0% 0% 1% 2% Officer use -26% 3% -2% 4% 4% 4% 4% 20% 1% 19% -3% -2% 0% -1% -20% -3% -1% -8% 6% 2% 100% 38% 23% 1% -6% 1% 2% 15% 8% 0% 0% -5% -1% -5% 7% -2% -7% 0% -7% 0% 5% 7% 6% 2% 9% 6% 2% 3% 2% 5% 5% Assistant use -21% 0% -3% 5% 5% 5% 5% 11% 0% 15% -3% -2% 0% 1% -17% 0% 1% -7% 6% 2% 38% 100% 25% 4% -2% 7% 9% 13% 12% 0% -12% 0% -4% -8% 2% -2% -8% -5% -8% 5% 0% 4% 4% 0% 5% 2% 3% 4% 3% 1% 4% Specialist use -36% 1% -4% -2% -2% -2% -2% 20% 2% 18% -2% -1% -1% 2% -34% 10% 13% -11% 8% 2% 23% 25% 100% -2% -2% 6% 12% 18% 16% 0% -10% -5% 0% -5% 3% -2% -16% -8% -16% 5% 5% 0% 0% -2% 5% 7% 0% 1% 0% 11% 9% branch use 14% -9% 0% -4% -4% -4% -4% -16% -6% -5% 2% 0% 1% -1% 13% 9% 9% 2% -1% -2% 1% 4% -2% 100% 10% 6% 9% 6% 5% 0% 2% 2% 4% 0% -6% -4% 2% 2% 2% -1% -4% -1% 0% 2% -5% -6% -2% -4% -2% -6% -8% ATM use 20% -6% 4% -6% -6% -6% -6% -11% -2% -19% 4% 3% 2% -2% 14% 8% 6% 4% -6% 0% -6% -2% -2% 10% 100% 14% 14% 9% 11% 0% 1% -1% -2% 8% 0% -1% 3% -2% 3% -3% -5% -6% -4% 0% -6% -7% -1% -4% -1% 0% -1% touchtone use 2% -3% 1% -1% -1% -1% -1% 0% -3% -3% 0% 1% 0% 0% 2% 6% 5% -1% -3% -1% 1% 7% 6% 6% 14% 100% 27% 3% 9% 0% -5% -1% -4% 0% 2% -11% 5% 1% 5% -4% -5% 0% -3% -7% 0% 2% -1% 0% -1% -1% -1% 1800 use -2% -7% 4% -6% -6% -6% -6% -1% 0% -1% 1% 4% 0% 0% -3% 15% 15% -1% -7% -2% 2% 9% 12% 9% 14% 27% 100% 13% 17% 0% -2% -1% -1% 1% -7% 0% -7% -2% -7% -7% -10% -5% -10% -9% -14% 0% -7% -7% -7% 5% 2% webtransac use -22% -3% 0% -6% -6% -6% -6% 5% 1% 11% -1% 1% -1% -2% -18% 6% 6% -6% 1% 1% 15% 13% 18% 6% 9% 3% 13% 100% 36% 0% 0% 1% -1% -6% 1% 6% 0% -2% 0% -1% 1% 3% -3% 0% -3% 1% 0% 2% 0% 5% 2% webinfo use -10% -2% 0% -4% -4% -4% -4% 1% 0% 4% -1% 0% -1% 0% -8% 1% 0% -5% 2% 2% 8% 12% 16% 5% 11% 9% 17% 36% 100% 0% -6% -4% -3% -3% -1% 0% -2% 0% -2% 1% 0% 2% -1% -2% -3% 5% 1% 0% 1% 2% 2% webtranpc use 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% Officer contact 8% 3% 0% -1% -1% -1% -1% -5% -1% -6% 2% 0% -1% 0% 7% 4% 3% 8% -1% -3% 0% -12% -10% 2% 1% -5% -2% 0% -6% 0% 100% 59% 22% 12% 9% 35% 8% 10% 8% -2% -1% -2% 1% 2% 4% -3% 0% -2% 0% 1% -2% Assistant contact 7% 4% -6% -1% -1% -1% -1% -5% 0% -3% 2% -6% -1% 0% 6% 8% 8% 7% 0% -2% -5% 0% -5% 2% -1% -1% -1% 1% -4% 0% 59% 100% 32% 16% 7% 44% 8% 14% 8% 0% -3% -2% 1% -4% 5% -6% -3% -3% -3% 3% 2% Specialist contact 8% 2% -5% 2% 1% 1% 1% -5% -5% -4% 2% -4% 2% 1% 8% 4% 3% 0% 0% -3% -1% -4% 0% 4% -2% -4% -1% -1% -3% 0% 22% 32% 100% 7% 0% 27% 10% 14% 10% -2% -4% -8% -4% -7% -1% -3% -5% -6% -5% 5% 2% branch contact 11% -4% 4% 3% 3% 3% 3% -6% -3% -13% 1% 4% -1% -1% 7% 4% 6% 9% -2% -1% -5% -8% -5% 0% 8% 0% 1% -6% -3% 0% 12% 16% 7% 100% 21% 15% 26% 25% 26% -1% 1% -3% -5% 0% -1% -2% -3% -8% -3% 6% 6% ATM contact -1% 0% -4% -1% -1% -1% -1% 6% -1% -3% 4% -4% 2% -8% -3% -1% -3% 1% 4% 0% 7% 2% 3% -6% 0% 2% -7% 1% -1% 0% 9% 7% 0% 21% 100% 8% 25% 22% 25% 3% 5% 0% 2% 0% 5% 5% 1% 8% 1% -4% 4% 1800 contact 10% 1% -3% 2% 2% 2% 2% -15% -2% -4% 1% -2% -2% 3% 10% 1% 4% 1% 1% -5% -2% -2% -2% -4% -1% -11% 0% 6% 0% 0% 35% 44% 27% 15% 8% 100% 14% 23% 14% 3% 3% 6% 3% -1% 10% -3% 4% 3% 4% 22% 30% webtransac contact 22% -1% 2% -2% -2% -2% -2% -20% -3% -12% 1% 1% 4% -2% 20% -4% -3% 6% -3% -1% -7% -8% -16% 2% 3% 5% -7% 0% -2% 0% 8% 8% 10% 26% 25% 14% 100% 37% 100% -1% -1% -6% 1% -6% 14% -4% -5% -2% -5% 0% 1% webinfo contact 14% 3% 1% 1% 1% 1% 1% -18% -5% -10% 0% 0% 2% 1% 13% -2% -3% 3% -1% -4% 0% -5% -8% 2% -2% 1% -2% -2% 0% 0% 10% 14% 14% 25% 22% 23% 37% 100% 37% -2% 0% 3% 2% 0% 10% -2% -4% -12% -4% 7% 6% webtranpc contact 22% -1% 2% -2% -2% -2% -2% -20% -3% -12% 1% 1% 4% -2% 20% -4% -3% 6% -3% -1% -7% -8% -16% 2% 3% 5% -7% 0% -2% 0% 8% 8% 10% 26% 25% 14% 100% 37% 100% -1% -1% -6% 1% -6% 14% -4% -5% -2% -5% 0% 1% Officer sat -3% 5% -2% -3% -3% -3% -3% 3% 1% 1% -2% -2% 0% -2% -3% -13% -15% 4% 75% -7% 0% 5% 5% -1% -3% -4% -7% -1% 1% 0% -2% 0% -2% -1% 3% 3% -1% -2% -1% 100% 76% 64% 54% 46% 54% 56% 45% 48% 45% -3% -3% Assistant sat -5% 3% -2% 0% 0% 0% 0% 5% 2% 3% -3% -2% 0% -2% -3% -14% -16% 6% 67% -5% 5% 0% 5% -4% -5% -5% -10% 1% 0% 0% -1% -3% -4% 1% 5% 3% -1% 0% -1% 76% 100% 67% 56% 42% 64% 59% 44% 49% 44% -1% -1% Specialist sat -4% 5% -4% 2% 2% 2% 2% 5% -1% 1% -3% -4% 0% -3% -4% -14% -18% 1% 64% -3% 7% 4% 0% -1% -6% 0% -5% 3% 2% 0% -2% -2% -8% -3% 0% 6% -6% 3% -6% 64% 67% 100% 51% 37% 59% 57% 46% 52% 46% -2% -2% branch sat 1% 4% -2% 0% 0% 0% 0% 4% -1% 0% -2% -2% 0% -1% 1% -15% -18% 6% 57% -1% 6% 4% 0% 0% -4% -3% -10% -3% -1% 0% 1% 1% -4% -5% 2% 3% 1% 2% 1% 54% 56% 51% 100% 55% 55% 53% 47% 51% 47% -8% -10% ATM sat 6% -1% 2% 3% 3% 3% 3% -7% -2% -5% -4% 2% 4% -1% 4% -10% -11% 5% 46% -1% 2% 0% -2% 2% 0% -7% -9% 0% -2% 0% 2% -4% -7% 0% 0% -1% -6% 0% -6% 46% 42% 37% 55% 100% 52% 44% 49% 49% 49% -9% -9% touchtone sat -10% 10% -10% 6% 6% 6% 6% 15% -2% 4% -5% -9% -4% 4% -7% -19% -18% 4% 55% -3% 9% 5% 5% -5% -6% 0% -14% -3% -3% 0% 4% 5% -1% -1% 5% 10% 14% 10% 14% 54% 64% 59% 55% 52% 100% 81% 59% 65% 59% -3% -9% 1800 sat -8% 5% -3% 0% 0% 0% 0% 8% 1% 2% -2% -3% -2% -2% -6% -21% -22% 2% 59% -2% 6% 2% 7% -6% -7% 2% 0% 1% 5% 0% -3% -6% -3% -2% 5% -3% -4% -2% -4% 56% 59% 57% 53% 44% 81% 100% 54% 61% 54% -12% -11% webtransac sat 0% 2% 0% -2% -2% -2% -2% 0% -1% -1% -1% -1% 1% 0% 0% -7% -10% 4% 49% 0% 2% 3% 0% -2% -1% -1% -7% 0% 1% 0% 0% -3% -5% -3% 1% 4% -5% -4% -5% 45% 44% 46% 47% 49% 59% 54% 100% 82% 100% -7% -6% webinfo sat -1% 2% -2% 0% 0% 0% 0% 4% 1% -1% -2% -2% 1% -2% -1% -11% -14% 3% 51% 0% 3% 4% 1% -4% -4% 0% -7% 2% 0% 0% -2% -3% -6% -8% 8% 3% -2% -12% -2% 48% 49% 52% 51% 49% 65% 61% 82% 100% 82% -11% -12% webtranpc sat 0% 2% 0% -2% -2% -2% -2% 0% -1% -1% -1% -1% 1% 0% 0% -7% -10% 4% 49% 0% 2% 3% 0% -2% -1% -1% -7% 0% 1% 0% 0% -3% -5% -3% 1% 4% -5% -4% -5% 45% 44% 46% 47% 49% 59% 54% 100% 82% 100% -7% -6% other bank1-9% -3% -1% -1% -1% -1% -1% 0% 1% 6% 1% -2% 0% 4% 0% 12% 12% -2% -2% 1% 5% 1% 11% -6% 0% -1% 5% 5% 2% 0% 1% 3% 5% 6% -4% 22% 0% 7% 0% -3% -1% -2% -8% -9% -3% -12% -7% -11% -7% 100% 76% otherbank1 asset modified -5% -3% -2% -1% -1% -1% -1% 0% -1% 2% -1% -1% -2% 7% 0% 13% 11% -3% -2% 2% 5% 4% 9% -8% -1% -1% 2% 2% 2% 0% -2% 2% 2% 6% 4% 30% 1% 6% 1% -3% -1% -2% -10% -9% -9% -11% -6% -12% -6% 76% 100% Πίνακας 19. Πίνακας ανάλυσης συσχετίσεων KPIs τραπεζικού οργανισμού 5.1.4 Ανάλυση παραγόντων μεταβλητών Τραπεζικού Οργανισμού Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα, με τη πρώτη να είναι σχεδόν διπλάσια από τη δεύτερη. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 8 παράγοντες που εξηγούν περίπου το 79% της μεταβλητότητας όλων των μεταβλητών. 68

Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared Component % of Cumulative % of Cumulative % of Cumulative Total Total Total Variance % Variance % Variance % 1 7.664 28.385 28.385 7.664 28.385 28.385 5.702 21.118 21.118 2 3.315 12.277 40.662 3.315 12.277 40.662 3.299 12.220 33.338 3 2.578 9.549 50.210 2.578 9.549 50.210 2.725 10.092 43.430 4 2.246 8.318 58.529 2.246 8.318 58.529 2.530 9.372 52.802 5 1.683 6.233 64.761 1.683 6.233 64.761 2.075 7.684 60.486 6 1.457 5.395 70.156 1.457 5.395 70.156 1.724 6.386 66.872 7 1.205 4.463 74.619 1.205 4.463 74.619 1.711 6.337 73.209 8 1.095 4.056 78.675 1.095 4.056 78.675 1.476 5.466 78.675 9.975 3.610 82.285 10.932 3.453 85.738 11.687 2.546 88.284 12.612 2.268 90.552 13.416 1.542 92.094 14.357 1.320 93.414 15.332 1.230 94.644 16.273 1.010 95.653 17.252.933 96.587 18.213.788 97.374 19.189.700 98.074 20.129.477 98.551 21.120.446 98.997 22.112.416 99.414 23.092.340 99.754 24.044.163 99.917 25.022.083 100.000 26.000.000 100.000 27.000.000 100.000 Πίνακας 20. Πίνακας ανάλυσης παραγόντων KPIs τραπεζικού οργανισμού Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Component Transformation Matrix Component 1 2 3 4 5 6 7 8 1.816.525.203.030 -.003 -.068.110.000 2 -.273.269.374.668 -.094.354.082.354 3.136 -.014 -.761.483.181 -.215.201.225 4.047 -.253.368.060.856 -.196.073.134 5.033 -.145 -.037 -.276.002.421.847.081 6 -.224.585 -.301 -.336.432.397 -.222.105 7.419 -.453 -.109.140.070.662 -.379 -.035 8 -.107.140 -.023.327.186.116.160 -.888 Πίνακας 21. Πίνακας ανάλυσης βαρών KPIs τραπεζικού οργανισμού Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική 69

τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων μικρομεσαίων και μεσαίων επιχειρήσεων που συνεργάζονται με τους τραπεζικούς οργανισμούς ανάλογα με τις ανάγκες τους, το επίπεδο ικανοποίησης του και τα προϊόντα που προσφέρουν. Component Score Coefficient Matrix Component 1 2 3 4 5 6 7 8 Sales Volume.047 -.079 -.026.158.057.093.006 -.032 State Code -.045.095 -.039.069 -.011.130 -.142 -.260 SIC8 Code.010 -.053.055.160 -.010.053.072 -.623 bank sat.071.086.018 -.001.008.032.056 -.014 webtransac contact -.013.031 -.010.011.486.037 -.013 -.023 webtranpc contact -.013.031 -.010.011.486.037 -.013 -.023 Officer sat.078.097 -.023.022.040.010.020 -.002 Assistant sat.061.092.032.061.092.008.001 -.079 webtransac sat -.114.376 -.039 -.049 -.008 -.020 -.001 -.001 webinfo sat -.074.317 -.030 -.049.044 -.018 -.043.010 webtranpc sat -.114.376 -.039 -.049 -.008 -.020 -.001 -.001 PRCP understand.232 -.146.004 -.004 -.022.013 -.046.053 PRCP prompt.200 -.088 -.017.017 -.014.046.011 -.023 PRCP solution.217 -.135.016.005 -.054.002 -.062.031 PRCP respect.218 -.110 -.029.003 -.031.047 -.063.037 PRCP accessible.236 -.133 -.065.008.002.087 -.033.033 actual AOvisit -.013 -.009 -.022.427 -.011 -.092 -.015 -.168 prefer AOvisit.008.004.007.424 -.001 -.060 -.034 -.179 actual AOcall.012 -.082.021.105 -.061.020.012.390 prefer AOcall.041 -.024.049.144 -.055.080 -.030.314 actual AOyear.034 -.057 -.039.010.033.520.000 -.061 prefer AOyear.067.000 -.031 -.027.044.563 -.035 -.032 actual approval -.026.031 -.035.014 -.031 -.030.515 -.092 prefer approval -.064 -.014.032 -.029.003.000.558 -.009 CRE building use -.018 -.044.360.002.006 -.051.036 -.009 CRE investment use -.017 -.028.327 -.022 -.025.017 -.023 -.038 NetCRE use -.028 -.040.380 -.009 -.006 -.079.010.012 Πίνακας 22. Συντελεστές για κάθε KPI τραπεζικού οργανισμού στους νέους factors 5.1.5 Scree Plot μεταβλητών Τραπεζικού Οργανισμού Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλες τις μεταβλητές που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα των Τραπεζικών Οργανισμών. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 8 όπου και οι τιμές των 70

ιδιοτιμών παίρνουν τιμές μικρότερες της μονάδας. Στην περίπτωση αυτή δηλαδή θα επιλεγούν 8 παράγοντες. Γράφημα 16. Scree Plot μεταβλητών τραπεζικού οργανισμού 5.1.6 Ιεραρχική τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 8 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον ιεραρχικό αλγόριθμο τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. 71

Γράφημα 17. Αποτελέσματα ιεραρχικής τμηματοποίησης τραπεζικών δεδομένων Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια επιχειρησιακή απόφαση για συγκεκριμένα τμήματα των πελατών του τραπεζικού οργανισμού. 72

5.2 Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail) Για την πραγματοποίηση της ποσοτικής ανάλυσης που αφορά τις Εταιρείες Πώλησης Προϊόντων Λιανικής χρησιμοποιήθηκε ένα δείγμα από τα πρωτογενή δεδομένα σχετικά με πωλήσεις προϊόντων και συμπεριφοράς πελατών (150.000 πελάτες) μιας μεγάλης αλυσίδας που δραστηριοποιείται κατά κύριο λόγο στις ΗΠΑ κατά τη διάρκεια της τελευταίας χρονιάς. Στη περίπτωση του οργανισμού αυτού, θα μελετήσουμε την απόδοση του σε δύο διαστάσεις: α) τα τμήματα του καταστημάτων που προτιμούν να ψωνίζουν οι πελάτες (ανάλυση περιεχόμενου καλαθιού basket analysis) και β) τη αγοραστική συμπεριφορά των πελατών σε σχέση με διαθέσιμες προσφορές (ανάλυση συμπεριφοράς -behavioral analysis). 5.2.1 Ανάλυση περιεχόμενου καλαθιού (Basket analysis) Για να γίνει εφικτή η ανάλυση του περιεχομένου του καλαθιού που ψωνίζει ο εκάστοτε πελάτης χρησιμοποιήθηκαν μια σειρά συγκεκριμένων δεικτών όπως φαίνονται στον παρακάτω πίνακα και με βάση αυτούς πραγματοποιήθηκε η ανάλυση στη συγκεκριμένη διάσταση. KPIs Ανάλυσης Περιεχόμενου Καλαθιού Ποσοστό Πωλήσεων στο τμήμα αρτοποιίας Ποσοστό Πωλήσεων στο τμήμα αισθητικής Ποσοστό Πωλήσεων στο παιδικό τμήμα Ποσοστό Πωλήσεων στο τμήμα διακόσμησης σπιτιού Ποσοστό Πωλήσεων στο τμήμα εκλεκτών τροφίμων Ποσοστό Πωλήσεων στο τμήμα οπωροκηπευτικών Ποσοστό Πωλήσεων στο τμήμα κατεψυγμένων Ποσοστό Πωλήσεων στο τμήμα ηλεκτρονικών Ποσοστό Πωλήσεων στο τμήμα διασκέδασης Ποσοστό Πωλήσεων στο τμήμα τροφίμων Ποσοστό Πωλήσεων στο υγειονομικό τμήμα Ποσοστό Πωλήσεων στο τμήμα οικιακών ειδών Ποσοστό Πωλήσεων στο παιδικό τμήμα Ποσοστό Πωλήσεων στο τμήμα καθαριότητας KPIs Basket analysis PCT_SL_BAKERY PCT_SL_BEAUTY PCT_SL_BOYS_AND_GIRLS PCT_SL_DEC_HOME PCT_SL_DELI PCT_SL_DOMESTICS PCT_SL_DRY_DAIRY_FRZN PCT_SL_ELECTRONICS PCT_SL_ENTERTAINMENT PCT_SL_FOOD_SERVICE PCT_SL_HEALTHCARE PCT_SL_HOUSEWARES PCT_SL_HSHLD_PAPR_BABY PCT_SL_INT_HOS_PERF 73

Ποσοστό Πωλήσεων στο τμήμα αξεσουάρ PCT_SL_JEWELRY_ACCESS Ποσοστό Πωλήσεων στο τμήμα κρεάτων PCT_SL_MEAT Ποσοστό Πωλήσεων στο αντρικό τμήμα PCT_SL_MENS Ποσοστό Πωλήσεων στο τμήμα μη καταναλωτικών προϊόντων PCT_SL_NON_RETAIL Ποσοστό Πωλήσεων στο τμήμα ενδυμάτων PCT_SL_READY_TO_WEAR Ποσοστό Πωλήσεων στο τμήμα υποδημάτων PCT_SL_SHOES Ποσοστό Πωλήσεων στο τμήμα μικρογευμάτων PCT_SL_SNX_BEV_PET_CNDY Ποσοστό Πωλήσεων στο τμήμα αθλητικών ειδών PCT_SL_SPORTING_GOODS Ποσοστό Πωλήσεων στο τμήμα εποχικών ειδών PCT_SL_STAT_SEASONAL Ποσοστό Πωλήσεων στο τμήμα συστημάτων υπηρεσιών PCT_SL_SYSTEMS_SERVICES Ποσοστό Πωλήσεων στο τμήμα παιχνιδιών PCT_SL_TOYS Ποσοστό Πωλήσεων στο τμήμα ειδικών κατασκευών PCT_SL_SPECIAL PROJECT Πίνακας 23. Πίνακας ανάλυσης περιεχόμενου καλαθιού (Basket analysis) 5.2.2.1 Ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των μεταβλητών που αναφέρονται στην ανάλυση περιεχομένου καλαθιού. Παρουσιάζεται βασικές στατιστικές μετρικές όπως είναι ο μέσος όρος, η ελάχιστη και η μέγιστη τιμή, η τυπική απόκλιση και τα βασικά εκατοστημόρια. Με βάση αυτό το πρώτο πίνακα μπορούμε να αποκτήσουμε μια πρώτη εικόνα για τη ποιότητα και το είδος των δεδομένων. N of valid Missing Mean Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile Median Variance Min Max Sum Deviation 1% 10% 25% 50% 75% 90% 99% PCT_SL_NON_RETAIL 150,000 0 0.001 0.000 0.0053 2.84E-05 0 0.0444 151.5 0.000 0.000 0.000 0.000 0.000 0.000 0.042 PCT_SL_INT_HOS_PERF 150,000 0 0.029 0.000 0.0751 5.64E-03 0 0.4879 4279.3 0.000 0.000 0.000 0.000 0.017 0.087 0.473 PCT_SL_JEWELRY_ACCESS 150,000 0 0.014 0.000 0.0453 2.05E-03 0 0.3166 2082.7 0.000 0.000 0.000 0.000 0.000 0.037 0.310 PCT_SL_READY_TO_WEAR 150,000 0 0.049 0.000 0.1216 1.48E-02 0 0.7308 7386.8 0.000 0.000 0.000 0.000 0.033 0.160 0.719 PCT_SL_SHOES 150,000 0 0.019 0.000 0.0613 3.76E-03 0 0.4333 2820.4 0.000 0.000 0.000 0.000 0.000 0.049 0.420 PCT_SL_SPORTING_GOODS 150,000 0 0.027 0.000 0.0826 6.83E-03 0 0.5831 4026.1 0.000 0.000 0.000 0.000 0.010 0.069 0.564 PCT_SL_HSHLD_PAPR_BABY 150,000 0 0.061 0.012 0.1055 1.11E-02 0 0.5848 9156.1 0.000 0.000 0.000 0.012 0.078 0.181 0.585 PCT_SL_DRY_SNX_CNDY 150,000 0 0.069 0.031 0.0986 9.72E-03 0 0.5522 10283.1 0.000 0.000 0.000 0.031 0.098 0.185 0.546 PCT_SL_HEALTHCARE 150,000 0 0.046 0.000 0.1075 1.15E-02 0 0.7204 6879.7 0.000 0.000 0.000 0.000 0.044 0.119 0.707 PCT_SL_ENTERTAINMENT 150,000 0 0.037 0.000 0.0958 9.17E-03 0 0.6381 5530.6 0.000 0.000 0.000 0.000 0.027 0.106 0.614 PCT_SL_DEC_HOME 150,000 0 0.028 0.000 0.0917 8.41E-03 0 0.6543 4212.9 0.000 0.000 0.000 0.000 0.007 0.067 0.643 PCT_SL_DOMESTICS 150,000 0 0.044 0.000 0.1141 1.30E-02 0 0.7247 6534.1 0.000 0.000 0.000 0.000 0.028 0.127 0.723 PCT_SL_HOUSEWARES 150,000 0 0.070 0.004 0.1537 2.36E-02 0 0.9438 10536.2 0.000 0.000 0.000 0.004 0.068 0.194 0.944 PCT_SL_STAT_SEASONAL 150,000 0 0.067 0.025 0.1227 1.50E-02 0 0.8091 9987.9 0.000 0.000 0.000 0.025 0.079 0.167 0.809 PCT_SL_BOYS_AND_GIRLS 150,000 0 0.027 0.000 0.0794 6.30E-03 0 0.5154 4011.9 0.000 0.000 0.000 0.000 0.000 0.082 0.503 PCT_SL_BEAUTY 150,000 0 0.083 0.033 0.1343 1.80E-02 0 0.7863 12524.6 0.000 0.000 0.000 0.033 0.111 0.226 0.785 PCT_SL_PETS_BEVERAGE 150,000 0 0.039 0.004 0.0790 6.24E-03 0 0.4923 5833.3 0.000 0.000 0.000 0.004 0.043 0.112 0.481 PCT_SL_MEAT_FRZN_DAIRY 150,000 0 0.031 0.000 0.0629 3.95E-03 0 0.3522 4640.2 0.000 0.000 0.000 0.000 0.033 0.102 0.343 PCT_SL_PRODUCE 150,000 0 0.008 0.000 0.0208 4.31E-04 0 0.1295 1167.8 0.000 0.000 0.000 0.000 0.003 0.025 0.130 PCT_SL_ELECTRONICS 150,000 0 0.070 0.000 0.1765 3.11E-02 0 1.0000 10557.8 0.000 0.000 0.000 0.000 0.044 0.212 1.000 PCT_SL_SYSTEMS_SERVICES 150,000 0 0.000 0.000 0.0021 4.51E-06 0 0.0208 33.8 0.000 0.000 0.000 0.000 0.000 0.000 0.019 PCT_SL_DELI 150,000 0 0.001 0.000 0.0055 3.07E-05 0 0.0409 178.9 0.000 0.000 0.000 0.000 0.000 0.000 0.041 PCT_SL_BAKERY 150,000 0 0.000 0.000 0.0017 3.02E-06 0 0.0132 52.3 0.000 0.000 0.000 0.000 0.000 0.000 0.013 PCT_SL_MENS 150,000 0 0.035 0.000 0.1097 1.20E-02 0 0.7330 5304.7 0.000 0.000 0.000 0.000 0.007 0.092 0.733 PCT_SL_FOOD_SERVICE 150,000 0 0.007 0.000 0.0309 9.58E-04 0 0.2549 1053.8 0.000 0.000 0.000 0.000 0.000 0.011 0.232 PCT_SL_NWBRN_INF_TOD 150,000 0 0.039 0.000 0.1125 1.27E-02 0 0.7302 5837.2 0.000 0.000 0.000 0.000 0.008 0.117 0.724 PCT_SL_TOYS 150,000 0 0.043 0.000 0.1116 1.25E-02 0 0.7163 6451.2 0.000 0.000 0.000 0.000 0.027 0.132 0.699 PCT_SL_UNIDENTIFIED 150,000 0 0.001 0.000 0.0085 7.23E-05 0 0.0852 138.0 0.000 0.000 0.000 0.000 0.000 0.000 0.056 PCT_SL_SPECIAL_PROJECT 150,000 0 0.00004 0.000 0.0003 1.09E-07 0 0.0034 5.4 0.000 0.000 0.000 0.000 0.000 0.000 0.002 Πίνακας 24. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού 74

5.2.2.2 Ανάλυση συσχετίσεων μεταβλητών περιεχόμενου καλαθιού Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των μεταβλητών που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Η διαγώνιος κάθε φορά παίρνει τη τιμή 1. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα δεν εντοπίζεται κανένας συνδυασμός KPIs που να έχει μεγάλη συσχέτιση (>75%), επομένως δε θα εξαιρεθεί κανένα. Selected Correlation >75% PCT_SL_N PCT_SL_I PCT_SL_J PCT_SL_R PCT_SL_S PCT_SL_H PCT_SL_D PCT_SL_H PCT_SL_E PCT_SL PCT_SL_ PCT_SL_H PCT_SL_S PCT_SL_ PCT_SL PCT_SL_P PCT_SL_M PCT_SL PCT_SL_ PCT_SL_S PCT_SL PCT_SL PCT_S ON_RETAI NT_HOS_P EWELRY_A EADY_TO_ PORTING_ SHLD_PAP RY_SNX_C EALTHCAR NTERTAIN _DEC_H DOMESTI OUSEWAR TAT_SEAS BOYS_AN _BEAUT ETS_BEVE EAT_FRZN _PROD ELECTRO YSTEMS_S _BAKER _SHOES L_DELI L ERF CCESS WEAR GOODS R_BABY NDY E MENT OME CS ES ONAL D_GIRLS Y RAGE _DAIRY UCE NICS ERVICES Y PCT_SL_ MENS PCT_SL_F PCT_SL_N PCT_SL_U PCT_SL_S PCT_S OOD_SER WBRN_INF NIDENTIFI PECIAL_P L_TOYS VICE _TOD ED ROJECT PCT_SL_NON_RETAIL 100.0% -2.5% -1.7% -3.0% -2.0% -2.0% -1.1% 6.6% -1.0% -2.2% -2.0% -2.4% -2.4% -2.9% -2.1% -2.9% 1.9% 15.4% 18.8% -1.3% 1.1% 19.8% 15.0% -2.0% -0.8% -2.2% -2.4% 1.0% 1.0% PCT_SL_INT_HOS_PERF -2.5% 100.0% 6.7% 11.5% 2.6% -3.6% -7.3% -7.3% -5.1% -3.7% -3.7% -3.2% -6.5% -4.5% -1.4% -1.7% -5.5% -7.0% -3.8% -7.7% -0.7% -2.0% -1.7% -2.8% -2.3% -3.0% -6.2% -0.9% -0.3% PCT_SL_JEWELRY_ACCESS -1.7% 6.7% 100.0% 9.5% 4.9% -2.9% -7.1% -5.8% -4.6% -1.8% -2.3% -2.5% -4.7% -2.0% -1.2% -0.9% -4.5% -5.4% -3.1% -5.9% -0.7% -1.6% -1.4% -1.7% -1.2% -3.5% -4.1% -2.0% 0.0% PCT_SL_READY_TO_WEAR -3.0% 11.5% 9.5% 100.0% 7.5% -5.6% -10.2% -10.9% -8.1% -5.8% -4.6% -5.0% -9.4% -6.9% -1.8% -5.2% -8.0% -8.7% -5.4% -9.5% -1.1% -2.6% -1.8% -4.5% -2.5% -3.5% -7.6% -1.6% -0.4% PCT_SL_SHOES -2.0% 2.6% 4.9% 7.5% 100.0% -2.7% -6.7% -8.2% -6.1% -4.0% -3.6% -3.9% -7.0% -4.9% 6.8% -5.3% -6.1% -6.4% -4.7% -6.1% -1.1% -2.3% -1.5% -1.1% -1.1% 0.2% -2.9% -1.5% -0.4% PCT_SL_SPORTING_GOODS -2.0% -3.6% -2.9% -5.6% -2.7% 100.0% -6.0% -5.8% -5.4% -2.6% -3.8% -4.0% -5.0% -2.7% 0.3% -6.6% -5.0% -5.8% -3.5% -4.4% -0.7% -2.1% -1.4% -2.4% -2.4% -3.8% 1.1% -1.6% -0.2% PCT_SL_HSHLD_PAPR_BABY -1.1% -7.3% -7.1% -10.2% -6.7% -6.0% 100.0% 4.7% 0.9% -7.7% -7.1% -6.6% -5.5% -6.5% -6.3% 3.8% 4.0% 6.5% 3.1% -11.2% 0.1% 0.3% 2.4% -8.2% -3.9% 3.2% -7.3% -0.2% 0.0% PCT_SL_DRY_SNX_CNDY 6.6% -7.3% -5.8% -10.9% -8.2% -5.8% 4.7% 100.0% 0.9% -4.1% -8.1% -10.0% -9.0% -2.4% -6.7% -0.7% 13.7% 34.5% 24.3% -11.7% 0.2% 12.8% 10.8% -8.1% -2.1% -10.9% -7.2% -4.4% 0.7% PCT_SL_HEALTHCARE -1.0% -5.1% -4.6% -8.1% -6.1% -5.4% 0.9% 0.9% 100.0% -5.7% -6.3% -7.5% -7.2% -7.0% -7.0% 3.9% 0.4% 2.1% 1.5% -8.2% -0.6% 0.6% 1.0% -5.8% -2.3% -7.7% -8.2% -2.7% -0.1% PCT_SL_ENTERTAINMENT -2.2% -3.7% -1.8% -5.8% -4.0% -2.6% -7.7% -4.1% -5.7% 100.0% -4.4% -5.5% -6.5% -2.2% -3.2% -6.8% -3.9% -6.1% -4.7% -3.0% 0.3% -2.2% -1.4% -3.2% -2.1% -5.3% 0.0% -2.5% 1.1% PCT_SL_DEC_HOME -2.0% -3.7% -2.3% -4.6% -3.6% -3.8% -7.1% -8.1% -6.3% -4.4% 100.0% 3.3% -0.6% -3.3% -4.8% -7.3% -5.6% -6.7% -3.6% -5.9% -0.9% -1.8% -1.8% -4.5% -3.4% -4.7% -5.0% -0.7% -0.6% PCT_SL_DOMESTICS -2.4% -3.2% -2.5% -5.0% -3.9% -4.0% -6.6% -10.0% -7.5% -5.5% 3.3% 100.0% 0.0% -5.1% -4.4% -7.5% -6.6% -7.7% -5.2% -7.5% -1.1% -2.6% -2.0% -4.3% -4.1% -5.2% -5.8% -1.6% -0.7% PCT_SL_HOUSEWARES -2.4% -6.5% -4.7% -9.4% -7.0% -5.0% -5.5% -9.0% -7.2% -6.5% 0.0% -0.9% 100.0% -6.7% -8.1% -8.6% -6.1% -7.1% -4.8% -8.2% -1.3% -2.8% -2.6% -5.7% -5.1% -8.1% -8.1% -2.5% -1.0% PCT_SL_STAT_SEASONAL -2.9% -4.5% -2.0% -6.9% -4.9% -2.7% -6.5% -2.4% -7.0% -2.2% -3.3% -5.1% -6.7% 100.0% -1.8% -7.3% -4.9% -7.6% -4.3% -9.3% -0.5% -3.0% -1.6% -6.9% -2.8% -4.5% -1.4% -3.4% -0.6% PCT_SL_BOYS_AND_GIRLS -2.1% -1.4% -1.2% -1.8% 6.8% 0.3% -6.3% -6.7% -7.0% -3.2% -4.8% -4.4% -8.1% -1.8% 100.0% -7.5% -7.2% -6.5% -4.6% -5.8% -0.4% -2.9% -0.6% -3.2% -1.7% 0.4% 4.3% -2.2% 0.0% PCT_SL_BEAUTY -2.9% -1.7% -0.9% -5.2% -5.3% -6.6% 3.8% -0.7% 3.9% -6.8% -7.3% -7.5% -8.6% -7.3% -7.5% 100.0% -1.8% -1.8% -0.7% -11.4% -1.1% -0.9% -0.1% -6.6% -2.8% -10.3% -10.3% -4.0% -0.6% PCT_SL_PETS_BEVERAGE 1.9% -5.5% -4.5% -8.0% -6.1% -5.0% 4.0% 13.7% 0.4% -3.9% -5.6% -6.6% -6.1% -4.9% -7.2% -1.8% 100.0% 14.1% 8.2% -8.2% 0.1% 5.9% 4.5% -4.8% -0.7% -8.4% -7.6% -3.5% 0.3% PCT_SL_MEAT_FRZN_DAIRY 15.4% -7.0% -5.4% -8.7% -6.4% -5.8% 6.5% 34.5% 2.1% -6.1% -6.7% -7.7% -7.1% -7.6% -6.5% -1.8% 14.1% 100.0% 43.6% -8.8% 1.2% 24.6% 18.7% -6.8% -1.5% -8.0% -7.6% -2.8% 1.6% PCT_SL_PRODUCE 18.8% -3.8% -3.1% -5.4% -4.7% -3.5% 3.1% 24.3% 1.5% -4.7% -3.6% -5.2% -4.8% -4.3% -4.6% -0.7% 8.2% 43.6% 100.0% -7.0% 1.6% 30.0% 17.6% -5.2% -1.4% -5.9% -5.9% -1.9% 1.5% PCT_SL_ELECTRONICS -1.3% -7.7% -5.9% -9.5% -6.1% -4.4% -11.2% -11.7% -8.2% -3.0% -5.9% -7.5% -8.2% -9.3% -5.8% -11.4% -8.2% -8.8% -7.0% 100.0% -0.7% -3.5% -2.8% -4.9% -3.5% -8.7% -4.8% -2.7% -0.8% PCT_SL_SYSTEMS_SERVICES 1.1% -0.7% -0.7% -1.1% -1.1% -0.7% 0.1% 0.2% 0.0% 0.3% -0.9% -1.1% -1.3% -0.5% -0.4% -1.1% 0.1% 1.2% 1.6% -0.7% 100.0% 1.8% 2.2% -1.0% -0.7% -1.1% 0.0% -0.1% 1.1% PCT_SL_DELI 19.8% -2.0% -1.6% -2.6% -2.3% -2.1% 0.3% 12.8% 0.0% -2.2% -1.8% -2.6% -2.8% -3.0% -2.9% -0.9% 5.9% 24.6% 30.0% -3.5% 1.8% 100.0% 15.1% -2.5% 0.7% -3.5% -3.2% -1.0% 1.1% PCT_SL_BAKERY 15.0% -1.7% -1.4% -1.8% -1.5% -1.4% 2.4% 10.8% 1.0% -1.4% -1.8% -2.0% -2.6% -1.6% -0.6% -0.1% 4.5% 18.7% 17.6% -2.8% 2.2% 15.1% 100.0% -2.3% -0.4% -2.5% -1.6% -1.1% 2.1% PCT_SL_MENS -2.0% -2.8% -1.7% -4.5% -1.1% -2.4% -8.2% -8.1% -5.8% -3.2% -4.5% -4.3% -5.7% -6.9% -3.2% -6.6% -4.8% -6.8% -5.2% -4.9% -1.0% -2.5% -2.3% 100.0% -2.1% -6.2% -5.5% -2.5% -1.1% PCT_SL_FOOD_SERVICE -0.8% -2.3% -1.2% -2.5% -1.1% -2.4% -3.9% -2.1% -2.3% -2.1% -3.4% -4.1% -5.1% -2.8% -1.7% -2.8% -0.7% -1.5% -1.4% -3.5% -0.7% 0.7% -0.4% -2.1% 100.0% -2.3% -2.2% -1.6% -0.3% PCT_SL_NWBRN_INF_TOD -2.2% -3.0% -3.5% -3.5% 0.2% -3.8% 3.2% -10.9% -7.7% -5.3% -4.7% -5.2% -8.1% -4.5% 0.4% -10.3% -8.4% -8.0% -5.9% -8.7% -1.1% -3.5% -2.5% -6.2% -2.3% 100.0% 0.0% 10.2% -0.1% PCT_SL_TOYS -2.4% -6.2% -4.1% -7.6% -2.9% 1.1% -7.3% -7.2% -8.2% 0.0% -5.0% -5.8% -8.1% -1.4% 4.3% -10.3% -7.6% -7.6% -5.9% -4.8% -0.7% -3.2% -1.6% -5.5% -2.2% 0.0% 100.0% -1.6% 0.0% PCT_SL_UNIDENTIFIED 1.0% -0.9% -2.0% -1.6% -1.5% -1.6% -0.2% -4.4% -2.7% -2.5% -0.7% -1.6% -2.5% -3.4% -2.2% -4.0% -3.5% -2.8% -1.9% -2.7% -0.1% -1.0% -1.1% -2.5% -1.6% 10.2% -1.6% 100.0% 1.5% PCT_SL_SPECIAL_PROJECT 1.0% -0.3% 0.0% -0.4% -0.4% -0.2% 0.0% 0.7% -0.1% 1.1% -0.6% -0.7% -1.0% -0.6% 0.0% -0.6% 0.3% 1.6% 1.5% -0.8% 1.1% 1.1% 2.1% -1.1% -0.3% -0.1% 0.0% 1.5% 100.0% Πίνακας 25. Πίνακας ανάλυσης συσχετίσεων μεταβλητών περιεχόμενου καλαθιού 5.2.2.3 Ανάλυση παραγόντων μεταβλητών περιεχόμενου καλαθιού Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι 75

σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα, με τη πρώτη να είναι σχεδόν διπλάσια από τη δεύτερη. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 13 παράγοντες που εξηγούν περίπου το 54% της μεταβλητότητας όλων των μεταβλητών. Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared Component Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % 1 2.286 7.883 7.883 2.286 7.883 7.883 1.832 6.319 6.319 2 1.381 4.761 12.645 1.381 4.761 12.645 1.528 5.270 11.588 3 1.316 4.539 17.183 1.316 4.539 17.183 1.345 4.637 16.225 4 1.240 4.276 21.459 1.240 4.276 21.459 1.226 4.228 20.454 5 1.202 4.145 25.604 1.202 4.145 25.604 1.202 4.145 24.599 6 1.131 3.899 29.503 1.131 3.899 29.503 1.156 3.985 28.584 7 1.071 3.693 33.196 1.071 3.693 33.196 1.130 3.896 32.480 8 1.053 3.632 36.828 1.053 3.632 36.828 1.091 3.762 36.242 9 1.033 3.561 40.389 1.033 3.561 40.389 1.087 3.749 39.991 10 1.025 3.533 43.922 1.025 3.533 43.922 1.056 3.642 43.633 11 1.017 3.506 47.428 1.017 3.506 47.428 1.054 3.635 47.268 12 1.010 3.481 50.909 1.010 3.481 50.909 1.042 3.593 50.861 13 1.008 3.475 54.385 1.008 3.475 54.385 1.022 3.523 54.385 14.998 3.441 57.825 15.988 3.408 61.233 16.976 3.365 64.598 17.961 3.313 67.911 18.958 3.302 71.213 19.937 3.229 74.443 20.928 3.200 77.643 21.908 3.131 80.773 22.902 3.110 83.883 23.870 2.999 86.882 24.864 2.978 89.859 25.849 2.926 92.785 26.796 2.744 95.529 27.692 2.385 97.914 28.538 1.857 99.771 29.066.229 100.000 Πίνακας 26. Πίνακας ανάλυσης παραγόντων μεταβλητών περιεχόμενου καλαθιού Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Όλοι οι συνδυασμοί KPIs και παραγόντων εμφανίζουν και θετικά και αρνητικά βάρη που αντιπροσωπεύουν τις διαφορές μεταξύ των διαφόρων τμημάτων που έχουν πραγματοποιηθεί αγορές. Component Transformation Matrix Component 1 2 3 4 5 6 7 8 9 10 11 12 13 1.757.595 -.157.136 -.052 -.111 -.091.025.013 -.058 -.046 -.008 -.016 2.347 -.114.805 -.190.010.382 -.030.042.155.082 -.016 -.006.062 3.328 -.314 -.416 -.721.010.117.059 -.066.099 -.047.225.132.016 4 -.122.152 -.149.131.627.422 -.429 -.167.290 -.169.147.067.031 5.157 -.084.038 -.017.690 -.059.484.124 -.398 -.083 -.153 -.173 -.133 6.115 -.305 -.088.049.160 -.254 -.360.715.265.173 -.221 -.053.018 7 -.025 -.016.246 -.180.167 -.575 -.095 -.291.200 -.385 -.295.422.007 8.300 -.535 -.058.542 -.143.076.104 -.066.093 -.440.191.091 -.198 9.121 -.104.062.195.192 -.213 -.036 -.152 -.130.637.394.491 -.080 10.073 -.079 -.127.185.083 -.035.433 -.203.502.236 -.162 -.115.594 11 -.125.210 -.096.026 -.075.354.381.355.166 -.030 -.238.641 -.178 12.129 -.225 -.135.087 -.058.254 -.288 -.152 -.509.049 -.505.240.398 13 -.065.114.112.003.024 -.095.043.368 -.221 -.341.486.187.622 Πίνακας 27. Πίνακας ανάλυσης βαρών μεταβλητών περιεχόμενου καλαθιού 76

Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων πελατών με διαφορετικές συνήθειες σχετικά με την αγορά προϊόντων λιανικής. Component Score Coefficient Matrix Component 1 2 3 4 5 6 7 8 9 10 11 12 13 PCT_SL_NON_RETAIL.403 -.247 -.014.005.043 -.038 -.024 -.018 -.014.037 -.024 -.006.008 PCT_SL_INT_HOS_PERF -.001.005.457.006.026 -.096 -.028.011.026 -.036.078 -.005 -.054 PCT_SL_JEWELRY_ACCESS.013 -.010.381 -.011 -.065 -.018 -.042 -.066 -.019 -.012 -.022.037.010 PCT_SL_READY_TO_WEAR.001.005.494 -.057.014.033 -.029.073.027 -.061 -.042 -.042 -.004 PCT_SL_SHOES -.004.015.128 -.061 -.036.483 -.029.131 -.007.060 -.166 -.063.011 PCT_SL_SPORTING_GOODS -.009 -.014.013 -.013 -.031 -.094 -.046.092.012.012.843 -.106 -.058 PCT_SL_HSHLD_PAPR_BABY -.120.210 -.143.207.290.071 -.075.049 -.089 -.073 -.109 -.053 -.186 PCT_SL_DRY_SNX_CNDY.009.407 -.022 -.063 -.075 -.013 -.052 -.070.050 -.046.014 -.014 -.030 PCT_SL_HEALTHCARE.032 -.115 -.103.510 -.061 -.054 -.028.063.085 -.009.003.005.083 PCT_SL_ENTERTAINMENT -.068.017.000 -.130 -.086 -.163 -.103 -.085.094.041 -.042.640.049 PCT_SL_DEC_HOME.009 -.018 -.037 -.053 -.024 -.076.598 -.030.090 -.063 -.046 -.034.045 PCT_SL_DOMESTICS -.004 -.001 -.053 -.006 -.032.035.649.069.023.012 -.001.014 -.066 PCT_SL_HOUSEWARES.008 -.098 -.066 -.129 -.101 -.082 -.113.062 -.866 -.066 -.049 -.024 -.011 PCT_SL_STAT_SEASONAL.003 -.062 -.019 -.072 -.053 -.103 -.060 -.815.064 -.044 -.095 -.121 -.047 PCT_SL_BOYS_AND_GIRLS.017 -.048 -.128 -.027 -.080.618 -.029 -.001.041 -.054.021 -.008 -.038 PCT_SL_BEAUTY -.005 -.093.045.597 -.085 -.034 -.046 -.021.029 -.032 -.017 -.003 -.055 PCT_SL_PETS_BEVERAGE -.196.494 -.011 -.126 -.050 -.059 -.001.093.042.032 -.036.004.048 PCT_SL_MEAT_FRZN_DAIRY.208.277 -.014 -.061 -.017.009 -.015.053.021 -.028.002 -.035 -.023 PCT_SL_PRODUCE.314.116.021 -.042 -.009 -.002.011.009.003 -.018.025 -.038 -.019 PCT_SL_ELECTRONICS -.013 -.239 -.172 -.256 -.223 -.253 -.225.365.336 -.227 -.249 -.197 -.151 PCT_SL_SYSTEMS_SERVICES.068 -.073 -.041.057 -.010.077 -.007 -.012 -.030.037 -.172.377 -.163 PCT_SL_DELI.373 -.083.023 -.014.002 -.018.017 -.003 -.008.021.011 -.009.051 PCT_SL_BAKERY.308 -.104 -.010.053.000.061.007 -.022 -.005 -.002 -.015.076 -.031 PCT_SL_MENS.008 -.029 -.089 -.046 -.020 -.007 -.060.019.047.904 -.012 -.024 -.029 PCT_SL_FOOD_SERVICE -.002 -.005 -.046.020.006 -.005 -.031.032 -.005 -.027 -.049 -.050.925 PCT_SL_NWBRN_INF_TOD.000 -.048 -.050 -.096.612.055 -.062 -.026.037 -.026 -.063 -.043.007 PCT_SL_TOYS.003 -.090 -.186 -.093 -.024.236 -.079 -.104.084 -.191.266.158.041 PCT_SL_UNIDENTIFIED.052 -.073.032 -.066.514 -.220.000.058.059.025.041.035.024 PCT_SL_SPECIAL_PROJECT.014.029.037.047.065.017.066.174 -.048 -.079.080.542.033 Πίνακας 28. Πίνακας συντελεστών για κάθε KPI στους νέους factors 5.2.2.4 Scree Plot μεταβλητών περιεχόμενου καλαθιού Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλα τα KPIs που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα του περιεχομένου του καλαθιού στις Εταιρείες Πώλησης Προϊόντων Λιανικής. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον 77

παράγοντα 8 όπου και οι τιμές των ιδιοτιμών παίρνουν τιμές μικρότερες της μονάδας. Στην περίπτωση αυτή δηλαδή θα επιλεγούν 8 παράγοντες. Γράφημα 18. Scree Plot μεταβλητών περιεχόμενου καλαθιού 5.2.2.5 K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 8 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον αλγόριθμο k-means τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. Distances between Final Cluster Centers Cluster 1 2 3 4 5 6 7 8 Cluster 1 4.569 3.500 3.968 3.937 3.643 3.671 5.195 Cluster 2 4.569 3.472 4.021 4.005 3.698 3.754 5.165 Cluster 3 3.500 3.472 2.789 2.761 2.214 2.313 4.237 Cluster 4 3.968 4.021 2.789 3.280 2.999 2.934 4.710 Cluster 5 3.937 4.005 2.761 3.280 2.856 2.932 4.618 Cluster 6 3.643 3.698 2.214 2.999 2.856 2.541 4.533 Cluster 7 3.671 3.754 2.313 2.934 2.932 2.541 4.475 Cluster 8 5.195 5.165 4.237 4.710 4.618 4.533 4.475 Πίνακας 29. Αποστάσεις μεταξύ των κέντρων των clusters της k-means 78

Γράφημα 19. Αποτελέσματα k-means τμηματοποίησης περιεχόμενου καλαθιού Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια απόφαση με συγκεκριμένα τμήματα του πελατολογίου. 79

5.2.2 Ανάλυση Συμπεριφοράς (Behavioral analysis) Για να γίνει εφικτή η ανάλυση της αγοραστικής συμπεριφοράς του εκάστοτε πελάτη χρησιμοποιήθηκαν μια σειρά συγκεκριμένων KPIs όπως φαίνονται στον παρακάτω πίνακα και με βάση αυτούς πραγματοποιήθηκε η ανάλυση στη συγκεκριμένη διάσταση. KPIs Ανάλυσης Συμπεριφοράς KPIs Behavioral analysis Ποσοστό πωλήσεων προϊόντων που είναι σε έκπτωση PCT_PRM_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε εκποίηση PCT_CLEARANCE_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε κυκλικές προσφορές PCT_CIRCULAR_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε προσωρινή μείωση τιμής PCT_TPC_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε άλλο είδος προσφοράς PCT_OTHER_SALES Ποσοστό πωλήσεων προϊόντων που έγιναν με εκπτωτικά κουπόνια PCT_COUPON_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Α PCT_TENDER_TYPE1_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Β PCT_TENDER_TYPE2_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Γ PCT_TENDER_TYPE3_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Δ PCT_TENDER_TYPE4_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Ε PCT_TENDER_TYPE5_SALES Μέση ευαισθησία τιμής προϊόντων PRICE_SENSITIVITY Βαθμός πίστης σε συγκεκριμένη μάρκα προϊόντων (Brand) BRAND_LOYALTY Ποσοστό πωλήσεων προϊόντων ιδιωτικής ετικέτας BR_PRIVATE_LABEL Ποσοστό πωλήσεων προϊόντων αποκλειστικής ετικέτας BR_EXCLUSIVE Ποσοστό πωλήσεων προϊόντων εθνικής ετικέτας BR_NATIONAL Πίνακας 30. Πίνακας ανάλυσης συμπεριφοράς (Behavioral analysis) 5.2.2.6 Ανάλυσης συχνοτήτων μεταβλητών ανάλυσης συμπεριφοράς Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των μεταβλητών που αναφέρονται στην ανάλυση συμπεριφοράς. Παρουσιάζεται βασικές στατιστικές μετρικές όπως είναι ο μέσος όρος, η ελάχιστη και η μέγιστη τιμή, η τυπική απόκλιση και τα βασικά εκατοστημόρια. Με το πίνακα αυτό σχηματίζουμε μια πρώτη εικόνα για τη ποιότητα και το είδος των δεδομένων που θα χρησιμοποιηθούν στην ανάλυση. 80

Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile N of valid Missing Mean Median Variance Min Max Sum Deviation 1% 10% 25% 50% 75% 90% 99% Perc_prm_sales 150,000 0 0.292 0.257 0.23794 0.05662 0.00 1.00 43774 0.00 0.00 0.12 0.26 0.40 0.61 1.00 Perc_clearance_sales 150,000 0 0.052 0.004 0.10770 0.01160 0.00 0.67 7736 0.00 0.00 0.00 0.00 0.05 0.15 0.67 Perc_circ_sales 150,000 0 0.129 0.085 0.16932 0.02867 0.00 0.94 19319 0.00 0.00 0.00 0.08 0.17 0.31 0.94 Perc_tpc_sales 150,000 0 0.087 0.057 0.11804 0.01393 0.00 0.71 13045 0.00 0.00 0.00 0.06 0.12 0.20 0.70 Perc_coupon_sales 150,000 0 0.001 0.000 0.00516 0.00003 0.00 0.04 154 0.00 0.00 0.00 0.00 0.00 0.00 0.04 Perc_oth_sales 150,000 0 0.010 0.000 0.05838 0.00341 0.00 0.48 1522 0.00 0.00 0.00 0.00 0.00 0.00 0.47 Perc_oth2_sales 150,000 0 0.004 0.000 0.01557 0.00024 0.00 0.12 547 0.00 0.00 0.00 0.00 0.00 0.00 0.11 PCT_SL_TGT_Owned 150,000 0 0.165 0.124 0.18399 0.03385 0.00 1.00 24745 0.00 0.00 0.03 0.12 0.22 0.37 1.00 PCT_SL_NTL_National 150,000 0 0.533 0.553 0.27933 0.07802 0.00 1.00 79941 0.00 0.10 0.35 0.55 0.73 0.92 1.00 PCT_SL_MKT_Market 150,000 0 0.025 0.000 0.07679 0.00590 0.00 0.56 3719 0.00 0.00 0.00 0.00 0.01 0.05 0.56 PCT_SL_NTL_Exclusive 150,000 0 0.035 0.000 0.07940 0.00630 0.00 0.52 5276 0.00 0.00 0.00 0.00 0.03 0.10 0.50 PCT_SL_TGT_Exclusive 150,000 0 0.040 0.000 0.08959 0.00803 0.00 0.54 5955 0.00 0.00 0.00 0.00 0.04 0.12 0.54 PCT_SL_Unknown 150,000 0 0.189 0.127 0.22325 0.04984 0.00 1.00 28379 0.00 0.00 0.02 0.13 0.25 0.46 1.00 PCT_SL_TGT_Designer 150,000 0 0.004 0.000 0.01715 0.00029 0.00 0.13 567 0.00 0.00 0.00 0.00 0.00 0.00 0.13 Brand_Loyalty 150,000 0 0.870 0.870 0.10160 0.01032 0.25 1.00 130491 0.58 0.75 0.80 0.87 0.96 1.00 1.00 Price_Sensitivity 150,000 0 1.153 0.939 0.89476 0.80059 0.33 7.37 172885 0.34 0.63 0.77 0.94 1.19 1.68 6.62 PCT_SL_CC 150,000 0 0.390 0.011 0.45616 0.20808 0.00 1.00 58525 0.00 0.00 0.00 0.01 1.00 1.00 1.00 PCT_SL_Debit 150,000 0 0.410 0.000 0.46282 0.21420 0.00 1.00 61501 0.00 0.00 0.00 0.00 1.00 1.00 1.00 PCT_SL_OtherTT 150,000 0 0.092 0.000 0.26598 0.07075 0.00 1.00 13779 0.00 0.00 0.00 0.00 0.00 0.30 1.00 PCT_SL_Target_Card 150,000 0 0.096 0.000 0.27911 0.07790 0.00 1.00 14387 0.00 0.00 0.00 0.00 0.00 0.48 1.00 PCT_SL_Banking_Accts 150,000 0 0.012 0.000 0.10074 0.01015 0.00 0.97 1763 0.00 0.00 0.00 0.00 0.00 0.00 0.82 Πίνακας 31. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού 5.2.2.7 Ανάλυση συσχετίσεων μεταβλητών ανάλυσης συμπεριφοράς Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των μεταβλητών που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση συμπεριφοράς των πελατών. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα δεν εντοπίζεται κανένας συνδυασμός KPIs που να έχει μεγάλη συσχέτιση (>75%), επομένως δε θα εξαιρεθεί κανένα. Selected Correlation >75% Perc_cle Perc_pr Perc_cir arance_ m_sales c_sales sales Perc_tpc _sales Perc_co upon_sa les Perc_oth _sales PCT_SL Perc_oth 2_sales _TGT_O wned PCT_SL PCT_SL PCT_SL PCT_SL PCT_SL _NTL_N _MKT_M _NTL_E _TGT_Ex _Unkno ational arket xclusive clusive wn PCT_SL Brand_l _TGT_D oyalty esigner price_se PCT_SL PCT_SL nsitivity _CC _Debit PCT_SL PCT_SL PCT_SL _OtherT _Target Bankin T Card g_accts Perc_prm_sales 100% 40% 61% 40% 8% 25% 11% 1% 4% -9% -2% 3% -2% 0% -3% -1% 0% -3% -2% 8% 2% Perc_clearance_sales 40% 100% -8% -7% 1% -3% 1% 11% -17% -3% 6% 17% 3% 6% -7% -10% -3% 1% 1% 2% 0% Perc_circ_sales 61% -8% 100% -7% 3% -8% -1% -3% 11% -6% -2% -2% -7% -2% -1% -2% 4% 0% -14% 6% 2% Perc_tpc_sales 40% -7% -7% 100% 4% -7% 0% -5% 16% -4% -5% -5% -8% -2% -5% -5% 1% 0% -9% 6% 1% Perc_coupon_sales 8% 1% 3% 4% 100% -1% 2% 0% 5% 1% -2% -3% -4% 0% -10% -5% 0% -5% -3% 12% 0% Perc_oth_sales 25% -3% -8% -7% -1% 100% -2% -3% -9% -2% -2% 0% 15% 0% 4% 17% -9% -10% 35% -2% -1% Perc_oth2_sales 11% 1% -1% 0% 2% -2% 100% 5% -3% -2% 0% 3% -1% 0% -7% -5% -1% 2% -4% 2% -1% PCT_SL_TGT_Owned 1% 11% -3% -5% 0% -3% 5% 100% -43% -8% -6% 1% -21% -1% -10% -12% 2% 3% -7% -1% 0% PCT_SL_NTL_National 4% -17% 11% 16% 5% -9% -3% -43% 100% -16% -22% -31% -56% -9% 12% -4% 5% 3% -18% 4% 1% PCT_SL_MKT_Market -9% -3% -6% -4% 1% -2% -2% -8% -16% 100% -5% -6% -11% -2% -4% 4% 3% -3% -1% 0% 0% PCT_SL_NTL_Exclusive -2% 6% -2% -5% -2% -2% 0% -6% -22% -5% 100% 2% -9% 1% -9% -6% 2% 1% -4% -2% 0% PCT_SL_TGT_Exclusive 3% 17% -2% -5% -3% 0% 3% 1% -31% -6% 2% 100% -6% 4% -10% -8% -2% 4% -1% -1% 0% PCT_SL_Unknown -2% 3% -7% -8% -4% 15% -1% -21% -56% -11% -9% -6% 100% -3% -1% 17% -8% -7% 28% -2% -2% PCT_SL_TGT_Designer 0% 6% -2% -2% 0% 0% 0% -1% -9% -2% 1% 4% -3% 100% -9% -2% 0% 0% 0% 1% 0% Brand_loyalty -3% -7% -1% -5% -10% 4% -7% -10% 12% -4% -9% -10% -1% -9% 100% 19% 1% 2% 9% -15% 1% price_sensitivity -1% -10% -2% -5% -5% 17% -5% -12% -4% 4% -6% -8% 17% -2% 19% 100% -3% -11% 30% -5% 0% PCT_SL_CC 0% -3% 4% 1% 0% -9% -1% 2% 5% 3% 2% -2% -8% 0% 1% -3% 100% -66% -25% -27% -9% PCT_SL_Debit -3% 1% 0% 0% -5% -10% 2% 3% 3% -3% 1% 4% -7% 0% 2% -11% -66% 100% -27% -28% -10% PCT_SL_OtherTT -2% 1% -14% -9% -3% 35% -4% -7% -18% -1% -4% -1% 28% 0% 9% 30% -25% -27% 100% -9% -4% PCT_SL_Target_Card 8% 2% 6% 6% 12% -2% 2% -1% 4% 0% -2% -1% -2% 1% -15% -5% -27% -28% -9% 100% -3% PCT_SL_Banking_Accts 2% 0% 2% 1% 0% -1% -1% 0% 1% 0% 0% 0% -2% 0% 1% 0% -9% -10% -4% -3% 100% Πίνακας 32. Πίνακας ανάλυσης συσχετίσεων μεταβλητών ανάλυσης συμπεριφοράς 81

5.2.2.8 Ανάλυση παραγόντων μεταβλητών ανάλυσης συμπεριφοράς Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 10 παράγοντες που εξηγούν περίπου το 67% της μεταβλητότητας όλων των μεταβλητών. Component Total Total Variance Explained Initial Eigenvalues Extraction Sums of Rotation Sums of Squared % of Variance Cumulative % Total % of Cumulative Variance % Total % of Variance Cumulative % 1 2.15 10.23 10.23 2.15 10.23 10.23 1.81 8.61 8.61 2 1.87 8.88 19.12 1.87 8.88 19.12 1.67 7.93 16.55 3 1.81 8.64 27.75 1.81 8.64 27.75 1.62 7.69 24.24 4 1.65 7.84 35.59 1.65 7.84 35.59 1.56 7.43 31.67 5 1.31 6.24 41.84 1.31 6.24 41.84 1.46 6.97 38.64 6 1.09 5.21 47.04 1.09 5.21 47.04 1.36 6.48 45.12 7 1.08 5.13 52.18 1.08 5.13 52.18 1.24 5.92 51.05 8 1.05 4.98 57.16 1.05 4.98 57.16 1.23 5.87 56.92 9 1.03 4.89 62.05 1.03 4.89 62.05 1.06 5.06 61.98 10 1.02 4.84 66.89 1.02 4.84 66.89 1.03 4.91 66.89 11.99 4.70 71.59 12.98 4.66 76.25 13.96 4.59 80.84 14.93 4.43 85.27 15.88 4.21 89.48 16.83 3.95 93.43 17.71 3.38 96.81 18.63 3.00 99.81 19.03.12 99.94 20.01.06 100.00 21.00.00 100.00 Πίνακας 33. Πίνακας ανάλυσης παραγόντων μεταβλητών ανάλυσης συμπεριφοράς Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Όλοι οι συνδυασμοί KPIs και παραγόντων εμφανίζουν και θετικά και αρνητικά βάρη που αντιπροσωπεύουν τις διαφορές μεταξύ των συμπεριφορών των πελατών όταν χρησιμοποιούν κάποιο είδος προφοράς για τις αγορές τους. 82

Component Transformation Matrix Component 1 2 3 4 5 6 7 8 9 10 1.635 -.013 -.352.595.101 -.154 -.280.036.069.011 2 -.181 -.179.345.382.675.236.127.375 -.051 -.008 3.579.336.609 -.018 -.094.162.323 -.159 -.113.048 4.234 -.916.150 -.093 -.136 -.069.128 -.139 -.122 -.003 5 -.052.079.328 -.038.120 -.913 -.082.122 -.097 -.058 6.100 -.046.111 -.040 -.477.057 -.037.832.214.067 7.233.057 -.483 -.301.257 -.132.646.266 -.177 -.125 8.241 -.035.002 -.502.398.017 -.285.033.305.595 9 -.071 -.048.038.163 -.004 -.142.405 -.182.862 -.067 10 -.209.015 -.089.344 -.201 -.124.337 -.047 -.207.784 Πίνακας 34. Πίνακας ανάλυσης βαρών μεταβλητών συμπεριφοράς Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων πελατών με διαφορετικές συμπεριφορές αγοράς προϊόντων λιανικής ανάλογα το είδος της προσφοράς που υπάρχει ή ανεξαρτήτου αυτής. Component Score Coefficient Matrix Component 1 2 3 4 5 6 7 8 9 10 Perc_prm_sales.112 -.004.452.000.133 -.012.277.032.027 -.014 Perc_clearance_sales.094 -.003.067 -.092.460 -.058.106.087.050.018 Perc_circ_sales -.088 -.005.634.054 -.132.023 -.290 -.051.012.003 Perc_tpc_sales -.039.011 -.118.047 -.038 -.027.758 -.054.035.053 Perc_coupon_sales.012.008.010 -.029 -.053.359.007.043.058 -.097 Perc_oth_sales.410 -.010.027 -.098.112.025.034.064 -.026 -.069 Perc_oth2_sales -.101 -.010 -.008.188 -.140.075.181.156 -.175 -.202 PCT_SL_TGT_Owned -.012.019 -.012 -.033 -.034.006 -.079.748 -.053.037 PCT_SL_NTL_National.033 -.011 -.018 -.473 -.101.037.054 -.191 -.162 -.034 PCT_SL_MKT_Market -.001 -.019.026.000 -.030.045.037 -.022.918 -.017 PCT_SL_NTL_Exclusive -.185.043.023.152.274 -.048 -.140 -.372 -.056.080 PCT_SL_TGT_Exclusive -.012 -.012 -.029 -.019.412 -.069 -.039 -.029 -.014.038 PCT_SL_Unknown.027 -.010.036.594 -.182 -.015.080 -.176 -.119 -.023 PCT_SL_TGT_Designer.062.020 -.096 -.152.358.095 -.087 -.159 -.043 -.098 Brand_Loyalty.178 -.015.066 -.182 -.129 -.341 -.081.066 -.041.057 Price_Sensitivity.291.014.064.003 -.120 -.087 -.076 -.062.110.026 PCT_SL_CC -.127.563.023.008 -.001 -.187.036.011.017 -.130 PCT_SL_Debit -.138 -.529.038.006 -.003 -.203.026 -.005.045 -.134 PCT_SL_OtherTT.429 -.007 -.101.004.056.035 -.010.006 -.038 -.001 PCT_SL_Target_Card.045 -.033 -.002 -.034 -.038.622 -.111 -.024 -.058.096 PCT_SL_Banking_Accts -.045 -.006 -.005.021 -.025 -.036.047.025 -.019.919 Πίνακας 35. Πίνακας συντελεστών για κάθε KPI συμπεριφοράς στους νέους factors 83

5.2.2.9 Scree Plot μεταβλητών ανάλυσης συμπεριφοράς Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλες τις μεταβλητές που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα της ανάλυσης συμπεριφοράς των πελατών των εταιρειών πώλησης προϊόντων λιανικής. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 6 όπου και οι τιμές των ιδιοτιμών παίρνουν τιμές λίγο μεγαλύτερες από τη μονάδα. Στην περίπτωση αυτή θα επιλεγούν 6 παράγοντες. Ανάλογα βέβαια με την επιχειρησιακή ερμηνεία των συγκεκριμένων KPIs ο οργανισμός μπορεί να αποφασίσει να επιλέξει και τη λύση των 10 KPIs, όπου ουσιαστικά είναι το τελευταίο σημείο όπου οι τιμές των ιδιοτιμών βρίσκονται οριακά πάνω από τη μονάδα. Γράφημα 20. Scree Plot μεταβλητών ανάλυσης συμπεριφοράς 84

5.2.2.10 K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 6 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον αλγόριθμο k-means τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. Distances between Final Cluster Centers Cluster 1 2 3 4 5 6 Cluster 1 2.953 4.022 3.766 3.006 3.698 Cluster 2 2.953 3.330 2.832 2.142 3.185 Cluster 3 4.022 3.330 4.149 3.335 4.390 Cluster 4 3.766 2.832 4.149 2.916 3.734 Cluster 5 3.006 2.142 3.335 2.916 3.198 Cluster 6 3.698 3.185 4.390 3.734 3.198 Πίνακας 36. Αποστάσεις μεταξύ των κέντρων των clusters (k-means) Γράφημα 21. Γράφημα αποτελεσμάτων k-means τμηματοποίησης ανάλυσης συμπεριφοράς Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια απόφαση με συγκεκριμένα τμήματα του πελατολογίου. 85

5.3 Εταιρεία Τηλεπικοινωνιών (Telecommunications) Για την πραγματοποίηση της ποσοτικής ανάλυσης που αφορά τις Εταιρείες Τηλεπικοινωνιών χρησιμοποιήθηκε ένα δείγμα από τα πρωτογενή δεδομένα σχετικά με συμβόλαια κινητής τηλεφωνίας, χρήση υπηρεσιών, κατοχή συσκευών και εξειδικευμένες υπηρεσίες που παρέχονται σε πελάτες (7.500 πελάτες) μιας μεγάλης εταιρείας Τηλεπικοινωνιών που δραστηριοποιείται στην Ελλάδα. Για να γίνει εφικτή η ανάλυση της επιλεγμένης εταιρείας τηλεπικοινωνιών χρησιμοποιήθηκαν μια σειρά συγκεκριμένων δεικτών όπως φαίνονται στον παρακάτω πίνακα. Η πλήρης λίστα των KPIs παρατίθεται στο παράρτημα της εργασίας. KPIs Telecommunications TTL_ACT_INACT_SIMS STATUS_ACTIVE_CNT STATUS_INACTIVE_CNT CNTRCT_Fixed_CNT CNTRCT_PostPay_CNT DURATION_12_CNT DURATION_18_CNT DURATION_24_CNT MI_FLAG_0_CNT MI_FLAG_1_CNT PCT_STATUS_ACTIVE_CNT PCT_STATUS_INACTIVE_CNT AVG_SUBSIDY CUSTOMER_AGE_MONTHS ACT_MIN_START_DATE TTL_BR TTL_ARPU TTL_MARPU TAVG_BR KPIs Εταιρείας Τηλεπικοινωνιών Συνολικός αριθμός συνδέσεων πελάτη Αριθμός ενεργών συνδέσεων Αριθμός ανενεργών συνδέσεων Αριθμός συνδέσεων καρτοσυμβολαίου Αριθμός συνδέσεων συμβολαίου Αριθμός συνδέσεων συμβολαίου 12μηνης διάρκειας Αριθμός συνδέσεων συμβολαίου 18μηνης διάρκειας Αριθμός συνδέσεων συμβολαίου 24μηνης διάρκειας Αριθμός πελατών που δεν είναι χρήστες mobile internet Αριθμός πελατών που είναι χρήστες mobile internet Ποσοστό ενεργών συνδέσεων πελάτη Ποσοστό ανενεργών συνδέσεων πελάτη Μέση επιδότηση ανά σύνδεση Μήνες με την εταιρεία Πρώτη ημερομηνία έναρξης όλων των ενεργών συνδέσεων του πελάτη Συνολικό τιμολογημένο έσοδο πελάτη τα τελευταία δύο χρόνια Συνολικό μέσο έσοδο πελάτη τα τελευταία δύο χρόνια Συνολικό οριακό έσοδο πελάτη τα τελευταία δύο χρόνια Μέσο τιμολογημένο έσοδο πελάτη ανά μήνα 86

TAVG_ARPU TAVG_MARPU SIXM_DLT_BR SIXM_DLT_ARPU SIXM_DLT_MARPU DEVICE_25G_CNT DEVICE_ANDROID_CNT DEVICE_APPLE_CNT DEVICE_BLACKBER_CNT DEVICE_SYMBIAN_CNT DEVICE_TABLET_CNT DEVICE_WINDOWS_CNT TTL_VOICE_TOTAL_CNT_LM TTL_VOICE_INC_CNT_LM TTL_VOICE_OUTG_CNT_LM TTL_VOICE_OUTG_COMP_CNT_L M TTL_VOICE_OUTG_INTRN_CNT_L M TTL_SMS_INC_CNT_LM Μέσο συνολικό έσοδο πελάτη ανά μήνα Μέσο οριακό έσοδο πελάτη ανά μήνα Ποσοστιαία μεταβολή τιμολογημένου εσόδου των 2 τελευταίων εξαμήνων Ποσοστιαία μεταβολή συνολικού εσόδου των 2 τελευταίων εξαμήνων Ποσοστιαία μεταβολή οριακού εσόδου των 2 τελευταίων εξαμήνων Αριθμός συσκευών 2-3-4-5G Αριθμός συσκευών Android Αριθμός συσκευών Apple Αριθμός συσκευών Blackberry Αριθμός συσκευών Symbian Αριθμός συσκευών tablets Αριθμός συσκευών Windows Συνολικός αριθμός κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εισερχόμενων κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων κλήσεων σε άλλο δίκτυο ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων διεθνών κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εισερχόμενων μηνυμάτων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων μηνυμάτων ανά πελάτη το τελευταίο μήνα Πίνακας 37. Πίνακας εταιρείας τηλεπικοινωνιών (Telecommunications) TTL_SMS_OUTG_CNT_LM 5.3.1 Ανάλυσης συχνοτήτων μεταβλητών Εταιρείας Τηλεπικοινωνιών Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των μεταβλητών που αναφέρονται στην ανάλυση συμπεριφοράς. Παρουσιάζεται βασικές στατιστικές μετρικές όπως είναι ο μέσος όρος, η ελάχιστη και η μέγιστη τιμή, η τυπική απόκλιση και τα βασικά εκατοστημόρια. Με το πίνακα αυτό σχηματίζουμε μια πρώτη εικόνα για τη ποιότητα και το είδος των δεδομένων που θα χρησιμοποιηθούν στην ανάλυση. 87

N Missing Mean Median Std. Deviation Variance Min Max Sum Perc 50% Perc 75% TTL_ACT_INACT_SIMS 7361 0 50.047 18.223 149.880 22463.971 1 5352 368399 18.223 34.633 STATUS_ACTIVE_CNT 7361 0 36.375 13.059 104.358 10890.490 1 2717 267758 13.059 24.946 STATUS_INACTIVE_CNT 7361 0 13.672 3.022 82.237 6762.951 0 5350 100641 3.022 9.049 CNTRCT_BPOS_CNT 7361 0 0.028 0.023 0.193 0.037 0 4 205 0.023 0.525 CNTRCT_DataFax_CNT 7361 0 0.184 0.013 5.507 30.322 0 356 1353 0.013 0.517 CNTRCT_EasyContract_CNT 7361 0 0.392 0.098 2.655 7.048 0 100 2887 0.098 0.625 CNTRCT_Fixed_CNT 7361 0 5.983 0.194 41.617 1732.000 0 1100 44042 0.194 0.788 CNTRCT_GPDAT_CNT 7361 0 6.740 0.995 37.386 1397.732 0 1533 49614 0.995 3.210 CNTRCT_NonGSMOwn_CNT 7361 0 0.494 0.057 15.123 228.710 0 1017 3640 0.057 0.579 CNTRCT_PostPay_CNT 7361 0 36.194 14.634 124.305 15451.842 0 5351 266423 14.634 27.052 CNTRCT_WebEx_CNT 7361 0 0.032 0.006 0.980 0.961 0 78 235 0.006 0.509 DURATION_12_CNT 7361 0 38.804 14.756 131.815 17375.320 0 5352 285634 14.756 28.637 DURATION_18_CNT 7361 0 1.422 0.211 14.655 214.771 0 1055 10471 0.211 0.778 DURATION_24_CNT 7361 0 1.038 0.122 13.847 191.735 0 613 7644 0.122 0.651 DURATION_MISS_CNT 7361 0 8.783 0.745 45.272 2049.576 0 1169 64650 0.745 3.251 SEG_HVSME_CNT 7361 0 18.425 11.887 43.038 1852.239 0 2006 135624 11.887 21.905 SEG_MAJOR_ACCOUNT_CNT 7361 0 31.623 0.438 147.571 21777.167 0 5352 232775 0.438 4.886 MI_FLAG_0_CNT 7361 0 36.897 10.632 132.089 17447.415 0 5352 271602 10.632 22.901 MI_FLAG_1_CNT 7361 0 13.150 6.138 37.866 1433.845 0 904 96797 6.138 12.090 M2M_FLAG_0_CNT 7361 0 47.571 17.709 144.524 20887.200 0 5352 350171 17.709 33.265 M2M_FLAG_1_CNT 7361 0 2.476 0.132 28.914 835.998 0 1646 18228 0.132 0.678 TARF_Adsl_CNT 7361 0 0.002 0.001 0.062 0.004 0 3 16 0.001 0.502 TARF_Data_CNT 7361 0 8.449 1.169 46.258 2139.760 0 1712 62194 1.169 3.732 TARF_Employee_CNT 7361 0 0.008 0.002 0.324 0.105 0 25 56 0.002 0.502 TARF_Fixed_Solu_CNT 7361 0 0.495 0.057 15.121 228.646 0 1015 3646 0.057 0.579 TARF_Kartopro_CNT 7361 0 0.398 0.099 2.858 8.170 0 135 2929 0.099 0.625 TARF_Office_Hom_CNT 7361 0 0.096 0.042 0.901 0.811 0 47 705 0.042 0.550 TARF_Prepay_CNT 7361 0 0.000 0.000 0.012 0.000 0 1 1 0.000 0.500 TARF_Sms_CNT 7361 0 0.002 0.001 0.044 0.002 0 2 12 0.001 0.502 TARF_Vbc_CNT 7361 0 5.983 0.194 41.617 1732.000 0 1100 44038 0.194 0.788 TARF_Voice_CNT 7361 0 34.415 14.269 120.840 14602.373 0 5351 253329 14.269 26.291 TARF_Vshop_CNT 7361 0 0.000 0.000 0.012 0.000 0 1 1 0.000 0.500 TARF_MISS_CNT 7361 0 0.200 0.056 3.697 13.667 0 282 1472 0.056 0.567 TARF_TYPE_Business_CNT 7361 0 49.287 17.746 148.935 22181.773 0 5352 362800 17.746 33.941 TARF_TYPE_Consumer_CNT 7361 0 0.431 0.176 1.889 3.570 0 47 3175 0.176 0.713 Πίνακας 38. Πίνακας ανάλυσης συχνοτήτων μεταβλητών εταιρείας τηλεπικοινωνιών 5.3.2 Ανάλυση συσχετίσεων μεταβλητών Εταιρείας Τηλεπικοινωνιών Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των μεταβλητών που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση της εταιρείας τηλεπικοινωνιών. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα εντοπίζονται αρκετοί συνδυασμοί KPIs που έχουν μεγάλη συσχέτιση (>75%), επομένως θα εξαιρεθούν από τη συνέχεια της ανάλυσης. 88

Correlation >75% STATUS_ DURATIO DURATIO DURATI ACTIVE_ N_18_CN N_24_CN ON_MIS CNT T T S_CNT TARF_Da ta_cnt TARF_E TARF_Off TARF_Pr TARF_S mployee_ ice_hom epay_cn ms_cnt CNT _CNT T AVG_SU BSIDY CUSTOM CUSTOM ER_AGE ER_AGE _MONTH _YEARS S TTL_BR TTL_AR PU TTL_MA RPU AVG_BR _LY AVG_AR PU_LY PCT_DE PCT_DE PCT_DE PCT_DE PCT_DE PCT_DEV PCT_DEV AVG_INV TTL_SIM AVG_INV AVG_MA VICE_AN VICE_BL VICE_SY VICE_TA VICE_WI ICE_25G_ ICE_APP D_VALU S_INV_L D_VALU RPU_LY DROID_C ACKBER MBIAN_C BLET_CN NDOWS_ CNT LE_CNT E_CY Y E_LY NT _CNT NT T CNT STATUS_ACTIVE_CNT 100% 14% 20% 52% 57% 0% 0% 0% 7% -3% 15% 15% 67% 68% 69% -5% -5% -6% -9% -4% -9% 0% -4% 0% 2% -13% 73% -6% 64% DURATION_18_CNT 14% 100% 0% 3% 3% 0% 2% 0% 0% 0% 1% 1% 11% 12% 11% -3% -3% -3% 0% 0% 1% 1% -1% 0% -1% -3% 20% -3% 9% DURATION_24_CNT 20% 0% 100% 8% 26% 0% 0% 0% 0% 9% 3% 3% 27% 27% 28% -1% -1% -1% -3% -1% 0% 1% -2% 12% 0% -1% 15% -1% 12% DURATION_MISS_CNT 52% 3% 8% 100% 10% 0% -1% 1% 2% -18% 11% 11% 23% 23% 23% 4% 4% 3% -14% -8% -8% -2% -6% -2% -2% -11% 19% 3% 18% TARF_Data_CNT 57% 3% 26% 10% 100% 2% 0% 0% 6% -4% 10% 10% 35% 35% 36% -6% -6% -7% -10% -6% -7% 0% -5% 5% 5% -9% 46% -7% 20% TARF_Employee_CNT 0% 0% 0% 0% 2% 100% 1% 0% 0% -3% 0% 0% -1% -1% -1% -2% -2% -2% -2% 1% 2% -1% -1% 0% 0% -2% 0% -2% 0% TARF_Office_Hom_CNT 0% 2% 0% -1% 0% 1% 100% 0% 0% -5% 0% 0% 0% 0% 0% -3% -3% -3% -3% -2% -3% -2% -2% -1% -2% -4% 1% -3% 1% TARF_Prepay_CNT 0% 0% 0% 1% 0% 0% 0% 100% 0% -1% 1% 1% 1% 1% 1% -1% -1% -1% 1% 0% -1% 0% 0% 0% 0% -1% 1% -1% 1% TARF_Sms_CNT 7% 0% 0% 2% 6% 0% 0% 0% 100% -1% 3% 3% 11% 11% 12% 3% 3% 4% -4% -1% 0% -1% -1% -1% 3% -2% 26% 7% 4% AVG_SUBSIDY -3% 0% 9% -18% -4% -3% -5% -1% -1% 100% 4% 4% 15% 15% 15% 10% 11% 10% 8% 8% 17% 14% 10% -2% 5% 19% 2% 11% 7% CUSTOMER_AGE_MONTHS 15% 1% 3% 11% 10% 0% 0% 1% 3% 4% 100% 100% 23% 23% 24% 15% 15% 15% -6% -5% 4% 3% 6% 1% 2% 7% 14% 13% 16% CUSTOMER_AGE_YEARS 15% 1% 3% 11% 10% 0% 0% 1% 3% 4% 100% 100% 23% 23% 24% 15% 15% 15% -6% -5% 4% 3% 6% 1% 2% 7% 14% 13% 16% TTL_BR 67% 11% 27% 23% 35% -1% 0% 1% 11% 15% 23% 23% 100% 100% 99% 14% 14% 13% -8% 0% -2% 12% 0% 4% 1% 10% 65% 15% 66% TTL_ARPU 68% 12% 27% 23% 35% -1% 0% 1% 11% 15% 23% 23% 100% 100% 100% 14% 13% 12% -7% 0% -2% 12% 1% 3% 1% 9% 66% 14% 67% TTL_MARPU 69% 11% 28% 23% 36% -1% 0% 1% 12% 15% 24% 24% 99% 100% 100% 13% 13% 12% -7% 0% -2% 11% 1% 4% 1% 8% 68% 14% 68% AVG_BR_LY -5% -3% -1% 4% -6% -2% -3% -1% 3% 10% 15% 15% 14% 14% 13% 100% 100% 98% -11% -3% 20% 22% 2% 7% -1% 54% -6% 92% 1% AVG_ARPU_LY -5% -3% -1% 4% -6% -2% -3% -1% 3% 11% 15% 15% 14% 13% 13% 100% 100% 98% -10% -2% 21% 21% 3% 7% -1% 55% -6% 92% 1% AVG_MARPU_LY -6% -3% -1% 3% -7% -2% -3% -1% 4% 10% 15% 15% 13% 12% 12% 98% 98% 100% -10% -2% 21% 21% 1% 7% -1% 53% -7% 91% 0% PCT_DEVICE_25G_CNT -9% 0% -3% -14% -10% -2% -3% 1% -4% 8% -6% -6% -8% -7% -7% -11% -10% -10% 100% -8% -23% -23% 0% -16% -6% -12% -5% -13% -4% PCT_DEVICE_ANDROID_CNT -4% 0% -1% -8% -6% 1% -2% 0% -1% 8% -5% -5% 0% 0% 0% -3% -2% -2% -8% 100% -10% -11% -1% -7% 1% 2% -3% -3% 4% PCT_DEVICE_APPLE_CNT -9% 1% 0% -8% -7% 2% -3% -1% 0% 17% 4% 4% -2% -2% -2% 20% 21% 21% -23% -10% 100% -4% -8% 11% -4% 31% -7% 23% -1% PCT_DEVICE_BLACKBER_CNT 0% 1% 1% -2% 0% -1% -2% 0% -1% 14% 3% 3% 12% 12% 11% 22% 21% 21% -23% -11% -4% 100% -8% 4% -5% 29% 0% 23% 5% PCT_DEVICE_SYMBIAN_CNT -4% -1% -2% -6% -5% -1% -2% 0% -1% 10% 6% 6% 0% 1% 1% 2% 3% 1% 0% -1% -8% -8% 100% -6% 4% 1% -1% 1% 2% PCT_DEVICE_TABLET_CNT 0% 0% 12% -2% 5% 0% -1% 0% -1% -2% 1% 1% 4% 3% 4% 7% 7% 7% -16% -7% 11% 4% -6% 100% -3% 10% -1% 9% 1% PCT_DEVICE_WINDOWS_CNT 2% -1% 0% -2% 5% 0% -2% 0% 3% 5% 2% 2% 1% 1% 1% -1% -1% -1% -6% 1% -4% -5% 4% -3% 100% 2% 2% -1% 1% AVG_INVD_VALUE_CY -13% -3% -1% -11% -9% -2% -4% -1% -2% 19% 7% 7% 10% 9% 8% 54% 55% 53% -12% 2% 31% 29% 1% 10% 2% 100% -10% 64% -2% TTL_SIMS_INV_LY 73% 20% 15% 19% 46% 0% 1% 1% 26% 2% 14% 14% 65% 66% 68% -6% -6% -7% -5% -3% -7% 0% -1% -1% 2% -10% 100% -7% 58% AVG_INVD_VALUE_LY -6% -3% -1% 3% -7% -2% -3% -1% 7% 11% 13% 13% 15% 14% 14% 92% 92% 91% -13% -3% 23% 23% 1% 9% -1% 64% -7% 100% 1% TROUBLE_CNT 64% 9% 12% 18% 20% 0% 1% 1% 4% 7% 16% 16% 66% 67% 68% 1% 1% 0% -4% 4% -1% 5% 2% 1% 1% -2% 58% 1% 100% TROUBL E_CNT Πίνακας 39. Πίνακας ανάλυσης συσχετίσεων μεταβλητών εταιρείας τηλεπικοινωνιών 5.3.3 Ανάλυση παραγόντων μεταβλητών Εταιρείας Τηλεπικοινωνιών Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 16 παράγοντες που εξηγούν περίπου το 71% της μεταβλητότητας όλων των μεταβλητών. 89

Component Total Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % 1 12.848 21.413 21.413 12.848 21.413 21.413 7.927 13.212 13.212 2 5.784 9.640 31.053 5.784 9.640 31.053 5.189 8.648 21.860 3 4.170 6.950 38.002 4.170 6.950 38.002 4.853 8.088 29.948 4 2.412 4.019 42.022 2.412 4.019 42.022 4.446 7.410 37.358 5 2.241 3.736 45.757 2.241 3.736 45.757 2.511 4.185 41.543 6 1.931 3.219 48.976 1.931 3.219 48.976 2.446 4.077 45.620 7 1.859 3.099 52.074 1.859 3.099 52.074 2.094 3.490 49.110 8 1.657 2.762 54.837 1.657 2.762 54.837 2.024 3.374 52.484 9 1.598 2.663 57.499 1.598 2.663 57.499 1.887 3.145 55.629 10 1.391 2.318 59.817 1.391 2.318 59.817 1.578 2.630 58.260 11 1.266 2.111 61.927 1.266 2.111 61.927 1.514 2.524 60.783 12 1.140 1.900 63.827 1.140 1.900 63.827 1.461 2.436 63.219 13 1.102 1.837 65.664 1.102 1.837 65.664 1.371 2.285 65.504 14 1.087 1.812 67.476 1.087 1.812 67.476 1.089 1.815 67.319 15 1.052 1.754 69.230 1.052 1.754 69.230 1.089 1.814 69.133 16 1.031 1.718 70.948 1.031 1.718 70.948 1.089 1.814 70.948 17.999 1.665 72.612 18.997 1.662 74.275 19.996 1.660 75.935 20.964 1.607 77.542 21.945 1.575 79.116 22.912 1.520 80.636 23.890 1.483 82.120 24.867 1.444 83.564 25.807 1.345 84.909 26.783 1.306 86.214 27.750 1.250 87.464 28.736 1.227 88.691 29.704 1.174 89.864 30.656 1.093 90.957 31.635 1.058 92.015 32.565.942 92.957 33.441.736 93.693 34.429.715 94.408 35.418.696 95.104 36.361.602 95.706 37.319.532 96.238 38.304.506 96.744 39.267.445 97.188 40.246.410 97.598 41.223.371 97.969 42.207.345 98.314 43.188.313 98.627 44.164.273 98.900 45.114.191 99.091 46.094.156 99.247 47.080.133 99.380 48.075.126 99.506 49.074.123 99.629 50.066.111 99.740 51.055.092 99.832 52.043.071 99.903 53.038.063 99.965 54.018.030 99.996 55.001.002 99.998 56.001.002 100.000 57.000.000 100.000 58.000.000 100.000 59.000.000 100.000 60.000.000 100.000 Πίνακας 40. Πίνακας ανάλυσης παραγόντων μεταβλητών εταιρείας τηλεπικοινωνιών 90

Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Component Transformation Matrix Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1.721.520.311.160.072.227.074.106.079.018.008 -.016.076 -.001.005.028 2.047 -.350 -.040.735.351 -.151.135.047.330 -.023.145.103.143.002 -.025.069 3 -.347 -.031.907.157 -.108 -.080 -.037 -.003 -.087 -.016 -.028 -.014 -.049.006 -.001 -.024 4 -.330.326 -.227.450 -.474.286.337.256 -.147.015.093 -.091 -.072.014.008 -.046 5 -.310.141.087 -.303.423.397.480 -.187.233.084.305.013.161 -.021.019.034 6 -.237.190 -.035 -.042.422.022 -.380.690.007.231 -.022 -.198.034.071 -.082.007 7.082 -.042.051 -.247 -.007 -.466.600.480 -.068 -.188 -.167.169.145.013.034 -.030 8 -.010.233 -.044.085.080 -.485.217 -.298 -.087.617 -.076 -.389 -.080 -.022 -.040.070 9.210 -.374.104 -.191 -.398.046.013.270.238.441.519 -.055 -.051.023.016.086 10 -.102.124 -.019.024 -.110.042 -.087 -.039.119.493 -.286.727.240.124.029 -.094 11.158 -.450.045.060.131.409.172.054 -.558.263 -.290 -.131.209 -.144 -.057 -.039 12.090 -.051.005.036.265.039.133.035 -.220.088.134.291 -.783.220 -.010 -.279 13.006 -.145.020 -.017 -.043.173.091.025.363.029 -.446 -.295 -.128.455.542 -.043 14.017.068 -.023.052.082 -.140 -.107 -.068 -.464 -.037.425.061.328.431.504.019 15 -.027.045 -.010.027.064 -.031 -.053.076.008.068.022.095 -.140 -.716.659 -.042 16 -.031.007.001 -.003.031.061.032.035 -.112 -.004 -.094.171 -.226.053.046.941 Πίνακας 41. Πίνακας ανάλυσης βαρών μεταβλητών εταιρείας τηλεπικοινωνιών Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων πελατών με διαφορετικό τρόπο χρήσης των κινητών συσκευών, των συμβολαίων και των υπηρεσιών που χρησιμοποιούν. 91

Component Score Coefficient Matrix Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 STATUS_ACTIVE_CNT -.078.233 -.035.015.014 -.038 -.039 -.030.049.014 -.001 -.176.040.047 -.048 -.040 DURATION_18_CNT -.054.191 -.028.005.028 -.164 -.060 -.022 -.050 -.036.160.118.007 -.329.056.086 DURATION_24_CNT.002 -.102.003.006.012.342.005 -.012 -.072.012 -.021.040 -.015.107 -.108.092 DURATION_MISS_CNT -.019.056 -.021.036 -.006 -.034.013.008.035 -.057 -.031 -.483.090.067 -.011 -.108 TARF_Data_CNT -.062.125 -.019.001.020.070 -.058 -.017.016.065.065 -.083 -.025.189 -.187.074 TARF_Employee_CNT.001 -.004.001 -.002.017 -.011 -.002.016 -.025.002.046 -.041 -.013 -.051.225.038 TARF_Office_Hom_CNT -.015 -.043.006 -.011.031.078.105.061.029.017 -.205 -.029 -.249 -.253.227.511 TARF_Prepay_CNT.003.001 -.001.000 -.007 -.011 -.008.005.069 -.002 -.017 -.061.030 -.030.006 -.262 TARF_Sms_CNT -.033.026.163 -.045.016 -.083 -.019 -.005.022 -.012.096.026 -.002.070 -.066.003 AVG_SUBSIDY -.015.067 -.014.000 -.020.007 -.018.000 -.015 -.001.023.510.006.097 -.052.083 CUSTOMER_AGE_MONTHS -.012 -.029 -.003 -.022 -.001 -.007 -.008.504 -.001.000.013.001 -.020 -.002.007 -.009 CUSTOMER_AGE_YEARS -.012 -.029 -.003 -.022 -.001 -.007 -.008.504 -.001.000.013.001 -.020 -.002.007 -.009 TTL_BR.043.105 -.009.011 -.014 -.029 -.016 -.001 -.004 -.012 -.006.063 -.017 -.010 -.012 -.003 TTL_ARPU.038.113 -.011.011 -.013 -.030 -.015.000 -.003 -.013 -.009.067 -.015 -.014 -.007 -.005 TTL_MARPU.021.126 -.007.013 -.012 -.023 -.017.002.007 -.011 -.013.066 -.009 -.013 -.006 -.004 AVG_BR_LY -.030.027 -.023.251 -.030.014 -.027 -.013 -.042.006 -.030 -.010.009 -.010.002 -.005 AVG_ARPU_LY -.031.029 -.024.250 -.029.013 -.021 -.010 -.043.006 -.030.000.011 -.008.004 -.009 AVG_MARPU_LY -.036.027 -.017.247 -.045.018 -.018 -.003 -.028.007 -.027.001 -.001 -.019.008 -.008 PCT_DEVICE_25G_CNT.009 -.037 -.003.017.017.076.035 -.006.032.006 -.357.171 -.090 -.278 -.334 -.351 PCT_DEVICE_ANDROID_CNT -.007.020 -.011.027 -.009 -.017 -.062 -.034.037.015 -.064.091.048.099.747 -.138 PCT_DEVICE_APPLE_CNT -.004.048.000 -.006 -.010 -.100.115.023 -.086.018.421.179.036 -.086 -.015 -.088 PCT_DEVICE_BLACKBER_CNT -.018.040 -.009 -.003 -.067 -.039 -.098 -.028.105 -.030.003.019.141.009 -.156.573 PCT_DEVICE_SYMBIAN_CNT -.002 -.007 -.009.023.056.039.005.051 -.087 -.011 -.129.186 -.040.308.012 -.037 PCT_DEVICE_TABLET_CNT.007 -.052.007 -.011.001.128 -.033.012 -.055 -.022.301 -.012 -.017 -.066 -.047.110 PCT_DEVICE_WINDOWS_CNT -.007.017.005 -.014 -.011 -.009.031 -.025.031 -.013 -.015.019 -.019.665 -.011.063 AVG_INVD_VALUE_CY -.041.044 -.013.038 -.005 -.022.049 -.015.315 -.009 -.014.083.020.024 -.025 -.017 TTL_SIMS_INV_LY -.095.286 -.016 -.001.031 -.107 -.059 -.026.034.019.058.039 -.010 -.007 -.057.000 AVG_INVD_VALUE_LY -.031.004.017.208 -.028.020 -.009 -.015.026.008 -.038 -.007.034 -.022.007 -.004 TROUBLE_CNT -.063.210 -.037.015.008 -.036 -.025.002.047 -.024 -.023.059.018 -.062.113 -.050 TTL_VOICE_OUTG_INTRN_CNT.184 -.054 -.026.049.011 -.092 -.008 -.036 -.188 -.015.127 -.014 -.179.050 -.030 -.034 TTL_VOICE_OUTG_ROAM_CNT.161 -.104 -.008 -.032 -.038.001 -.013.008.034.009 -.042 -.010.070 -.005 -.025.002 TTL_SMS_TOTAL_CNT -.018 -.034.222 -.031.007 -.017.001 -.004.013.000.021.001 -.010.020 -.020.000 TTL_SMS_INC_CNT.128 -.054 -.010 -.034.021.014 -.016 -.006.003.046 -.041.024.059 -.031 -.002.000 TTL_SMS_OUTG_CNT -.022 -.032.223 -.030.007 -.018.002 -.004.013 -.002.022.000 -.012.021 -.020.000 TTL_SMS_OUTG_ROAM_CNT.165 -.118.001 -.041.013.019 -.015.006.000.011 -.011.002.042 -.005 -.006.031 TTL_DATA_CNT -.001 -.002 -.003.012 -.002 -.001.005.001 -.011.557 -.053.029 -.002 -.009 -.001 -.027 TTL_TOTAL_VOICE_SMS_CNT -.011.127.088.003.022 -.086.005 -.025 -.055 -.027.045.072 -.080 -.001 -.018 -.014 TTL_VOICE_TOTAL_CHR.084.075 -.017.007 -.008 -.072.002 -.016 -.048 -.022.025.051 -.076 -.013 -.010 -.007 TTL_DATA_VOL -.047.001 -.017.018.013.359 -.034 -.003.003 -.015.037.022 -.010 -.031.039 -.051 TTL_SMS_TOTAL_CHR_CY.018 -.052.177 -.018 -.013.047.009.001 -.007.006 -.038 -.009.071 -.035.040.005 TTL_SMS_INC_CHR_CY.056 -.018 -.013 -.015 -.051.024 -.018 -.001 -.066 -.003 -.033 -.022.413 -.046.038.006 TTL_SMS_OUTG_CHR_CY.010 -.052.189 -.017 -.006.046.013.002.003.007 -.035 -.006.011 -.030.036.005 TTL_SMS_OUTG_ROAM_CHR_CY.172 -.136.003 -.046.013 -.004 -.030 -.004.029.009 -.012 -.030.090 -.006.000.025 TTL_DATA_CHR_CY.150 -.100.004 -.069 -.074 -.001.007 -.002.222.013.002 -.046 -.110.004.008 -.102 TTL_OTHER_CHR_CY -.003.083 -.024 -.010 -.018.050.195 -.004.016 -.022 -.142 -.031 -.002 -.012.059.034 TTL_DATA_VOL_CY -.042 -.026 -.014.016.011.389 -.039 -.004 -.003 -.011.048.019 -.002 -.027.031 -.047 TTL_VOICE_OUTG_INTRN_DUR_CY.201 -.088 -.023.043.006 -.070.007 -.041 -.178 -.012.114 -.057 -.191.063 -.019 -.031 TTL_OTHER_DUR_CY.000.053 -.020 -.013 -.012.069.238 -.005.014 -.014 -.158 -.025 -.045 -.019.086.076 AVG_SMS_INC_CNT_CY -.016.011.001 -.022.301.010 -.008 -.013 -.021.020 -.041.000.006 -.008 -.014 -.012 AVG_SMS_OUTG_ROAM_CNT_CY -.026.026.003 -.025.443.012.006.009 -.119 -.015.005.001 -.090.002.047 -.027 AVG_DATA_CNT_CY.006 -.026.004.005 -.003.000.016 -.002 -.013.560.008.034 -.007 -.023.031.006 AVG_OTHER_CNT_CY.000 -.016.006 -.023.002 -.045.400 -.004 -.040.015.110.021 -.008.044 -.058 -.043 AVG_VOICE_OUTG_INTRN_CHR_CY.047 -.018 -.030.167.048 -.001 -.018 -.052 -.185.003.049 -.058 -.207.051.019 -.005 AVG_VOICE_OUTG_ROAM_CHR_CY -.028.036 -.007 -.001.035 -.012 -.043 -.006.359 -.017 -.124 -.033 -.025.019 -.082.013 AVG_SMS_INC_CHR_CY -.009 -.020 -.003 -.003.017 -.025.011 -.021 -.116 -.001.033 -.050.587 -.014.005 -.063 AVG_SMS_OUTG_ROAM_CHR_CY -.022.021.003 -.025.408.006.000.001 -.059 -.016.001 -.011 -.059.002.034 -.009 AVG_DATA_CHR_CY.004.013.008 -.059 -.054 -.033 -.002.000.481 -.003.074 -.044 -.160.003.039 -.122 AVG_TOTAL_VOICE_SMS_CHR_CY.002 -.113.175.054 -.006.059.009.002 -.013.022 -.075 -.061 -.030 -.050.048 -.008 AVG_OTHER_CHR_CY -.003 -.039.005 -.022 -.003 -.003.442 -.016 -.010.003 -.064 -.062 -.018.048 -.048.024 AVG_DATA_VOL_CY -.006 -.029.007 -.018 -.017.117 -.017.003.093 -.013.289 -.027 -.064 -.104.082 -.165 Πίνακας 42. Συντελεστές για κάθε KPI εταιρείας τηλεπικοινωνιών στους νέους factors 92

5.3.4 Scree Plot μεταβλητών Εταιρείας Τηλεπικοινωνιών Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλα τα KPIs που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα της ανάλυσης συμπεριφοράς και χρήσης υπηρεσιών των πελατών κινητής τηλεφωνίας. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 16 όπου και οι τιμές των ιδιοτιμών παίρνουν τιμές μεγαλύτερες από τη μονάδα. Στην περίπτωση αυτή θα επιλεγούν 16 παράγοντες. Γράφημα 22. Scree Plot μεταβλητών εταιρείας τηλεπικοινωνιών 93

5.3.5 K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 16 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον αλγόριθμο k-means τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. Distances between Final Cluster Centers Cluster 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 64.972 13.590 40.498 16.087 20.349 33.728 22.025 71.373 13.636 13.572 42.960 50.372 61.691 51.172 45.479 2 64.972 62.154 72.756 62.698 63.520 66.881 64.972 94.776 62.101 61.978 73.782 77.423 86.969 77.637 71.890 3 13.590 62.154 35.584 8.631 15.001 29.333 17.496 69.852 1.810 3.113 40.221 48.074 60.027 49.777 41.992 4 40.498 72.756 35.584 35.659 38.489 46.166 39.602 73.858 35.617 35.495 54.805 59.283 69.411 65.601 55.292 5 16.087 62.698 8.631 35.659 16.344 30.745 19.469 70.616 8.648 9.081 41.140 50.144 60.595 50.254 42.250 6 20.349 63.520 15.001 38.489 16.344 32.460 23.115 70.855 15.010 15.332 40.574 35.791 61.948 53.039 47.291 7 33.728 66.881 29.333 46.166 30.745 32.460 33.731 73.286 29.295 28.993 33.591 56.721 66.268 61.212 47.601 8 22.025 64.972 17.496 39.602 19.469 23.115 33.731 71.694 17.533 17.761 44.321 51.552 42.667 52.993 46.449 9 71.373 94.776 69.852 73.858 70.616 70.855 73.286 71.694 69.865 69.934 80.083 82.247 91.235 45.421 86.842 10 13.636 62.101 1.810 35.617 8.648 15.010 29.295 17.533 69.865 3.276 40.315 48.152 60.018 49.799 42.043 11 13.572 61.978 3.113 35.495 9.081 15.332 28.993 17.761 69.934 3.276 40.706 48.205 60.137 49.916 41.784 12 42.960 73.782 40.221 54.805 41.140 40.574 33.591 44.321 80.083 40.315 40.706 64.163 72.810 68.991 62.364 13 50.372 77.423 48.074 59.283 50.144 35.791 56.721 51.552 82.247 48.152 48.205 64.163 77.978 73.748 71.813 14 61.691 86.969 60.027 69.411 60.595 61.948 66.268 42.667 91.235 60.018 60.137 72.810 77.978 79.419 75.072 15 51.172 77.637 49.777 65.601 50.254 53.039 61.212 52.993 45.421 49.799 49.916 68.991 73.748 79.419 61.291 16 45.479 71.890 41.992 55.292 42.250 47.291 47.601 46.449 86.842 42.043 41.784 62.364 71.813 75.072 61.291 Πίνακας 43. Αποστάσεις μεταξύ των κέντρων των clusters (k-means) Γράφημα 23. Αποτελέσματα k-means τμηματοποίησης εταιρείας τηλεπικοινωνιών Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια απόφαση με συγκεκριμένα τμήματα του πελατολογίου. 94