ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ"

Transcript

1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ «Η χρήση των Analytics ως εργαλείο εξόρυξης και ανάλυσης δεδομένων για την εξαγωγή ποσοτικών δεικτών μέτρησης απόδοσης και τη δημιουργία αξίας σε μεγάλους οργανισμούς» Ασημακόπουλος Αλέξιος Αριθμός Μητρώου: ΜΜ Επιβλέπων Καθηγητής: κ. Καπουτσής Ηλίας ΑΘΗΝΑ, ΔΕΚΕΜΒΡΙΟΣ 2013

2

3 ΕΥΧΑΡΙΣΤΙΕΣ Αισθάνομαι την υποχρέωση να εκφράσω τις ευχαριστίες μου σε ορισμένα άτομα των οποίων οι συμβουλές υπήρξαν καθοριστικές στην ολοκλήρωση της παρούσας Διπλωματικής Εργασίας. Πρώτα απ όλους θα ήθελα να ευχαριστήσω τον υπεύθυνο καθηγητή μου κ. Ηλία Καπουτσή, για την εμπιστοσύνη που μου επέδειξε αναθέτοντας μου αυτή την εργασία, τον χρόνο που διέθεσε για την ανάπτυξη των ιδεών, την καθοδήγηση του και την υπομονή που έδειξε κατά τη διάρκεια της υλοποίησης αυτής. Παράλληλα η υποστήριξη και η συνεργασία με πολλούς από τους συναδέλφους μου κατά την υλοποίηση της παρούσας εργασίας υπήρξε μια σημαντική εμπειρία και τα οφέλη που αποκόμισα είναι αναρίθμητα. Το ίδιο ισχύει και για τους συμφοιτητές μου, στο μεταπτυχιακό πρόγραμμα από τους οποίους αποκόμισα σημαντικές εμπειρίες και γνώσεις. Τέλος, ως ελάχιστη ένδειξη ευγνωμοσύνης, θα ήθελα να αφιερώσω την προσπάθεια αυτή στην μητέρα μου Βασιλική Ασημακοπούλου, στον πατέρα μου Γρηγόριο Ασημακόπουλο και στον αδερφό μου Γεώργιο Ασημακόπουλο για την στήριξη και την συμπαράσταση που μου παρείχαν τα τελευταία 2 χρόνια της παρακολούθησης του μεταπτυχιακού προγράμματος στα Πληροφοριακά Συστήματα.

4 ΠΕΡΙΛΗΨΗ Στη παρούσα διπλωματική εργασία επιχειρείται να αναλυθεί ένα από τα βασικά προβλήματα που αντιμετωπίζουν οι σύγχρονοι οργανισμοί με τη διαχείριση, την ανάλυση και την αξιοποίηση μεγάλου όγκου δεδομένων. Παρουσιάζονται τρόποι διαχείρισης και ποσοτικής ανάλυσης δεδομένων, τεχνικές εξόρυξης δεδομένων, οι μεθοδολογίες ανάλυσης παραγόντων και επιλογής μεταβλητών καθώς και οι αλγόριθμοι τμηματοποίησης. Αναλύεται ο τρόπος δημιουργίας και η παρακολούθηση δεικτών μέτρησης απόδοσης (KPIs) και παρουσιάζονται μια σειρά από ενδεικτικούς δείκτες ανά επιχειρησιακά κλάδο, που θεωρούνται σημαντικοί για την δημιουργία αξίας και γνώσης για τους οργανισμούς. Οι εταιρείες πώλησης προϊόντων λιανικής (Retail), οι εταιρείες τηλεπικοινωνιών (Telecommunications) και οι τραπεζικοί οργανισμοί (Banking) επιλέχθηκαν ως οι τρεις επιχειρησιακοί κλάδοι για τους οποίους θα υλοποιηθεί η ανάλυση των δεδομένων για τρεις επιλεγμένους οργανισμούς. Χρησιμοποιήθηκε το εργαλείο SPSS Statistics, στο οποίο εφαρμόστηκαν αρκετές διαθέσιμες τεχνικές εξόρυξης και ποσοτικής ανάλυσης δεδομένων για τη δημιουργία αξίας και γνώσης των οργανισμών. Η παρούσα εργασία καταλήγει με συγκεκριμένα συμπεράσματα σχετικά με τον τρόπο επιλογής των κατάλληλων δεικτών KPIs και την αξιοποίηση αυτών για τη δημιουργία ανταγωνιστικού πλεονεκτήματος. 1

5 ABSTRACT In this thesis we analyze one of the main problems faced by modern organizations regarding the management, analysis and usage of large scale data. It is presented advanced data management and quantitative analysis methods, data mining techniques, factor analysis methodologies, feature and variables selection techniques and clustering algorithms. The way of creating and monitoring key performance indicators (KPIs) is analyzed and a number of illustrative indicators by business industry are presented. These KPIs are used from organization for value creation and knowledge development. Retail, Telecommunications and Banking institutions were selected as the three major industries in order to implement data analysis for three selected leading organizations. SPSS Statistics tool is used in order to implement several available data mining techniques and quantitative data analysis in order to create additional value and knowledge for the organizations. This thesis concludes to ways of selecting the appropriate key performance indicators (KPIs) and how to use and leverage them so as to create business competitive advantage. 2

6 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή Επισκόπηση Περιεχομένων Τεχνικές ανάλυσης και εξόρυξης δεδομένων (Data Analytics & Mining) Κατηγοριοποίηση (Classification) Παλινδρόμηση (Regression) Ανάλυση Χρονοσειρών (Time Series Analysis) Πρόβλεψη (Prediction) Συσταδοποίηση (Clustering) Παρουσίαση Συνόψεων (Summarization) Ανάλυση Κανόνων Συσχετίσεων (Association Rules) Ανακάλυψη Ακολουθιών (Sequential Pattern Discovery) Είδη Δομών: Μοντέλα και Πρότυπα Κριτήρια Αξιολόγησης Βελτιστοποίηση και Αναζήτηση Διαχείριση των Δεδομένων Διαχείριση Ποιότητας Δεδομένων (Data QA) Προ-επεξεργασία Δεδομένων (Data Cleansing) Εντοπισμός των μη φυσιολογικών τιμών (Abnormal Values) Εντοπισμός των ελλιπών παρατηρήσεων (Missing Values) Επιλογή Μεταβλητών (Variables Selection) Ανάλυση Συσχετίσεων (Correlation Matrix) Ανάλυση Κύριων Συνιστωσών (Principal Components Analysis - PCA) Διαθέσιμες Μεθοδολογίες Τμηματοποίησης (Clustering Techniques) K Means Hierarchical Αξιολόγηση μεθόδων Συσταδοποίησης (Clustering Evaluation) Ανάλυση Παραγόντων (Factor Analysis) Εξαγωγή Παραγόντων (Factor Extraction) Ιδιοτιμή (Eigenvalue) Οι ιδιοτιμές και το πρόβλημα της επιλογής του αριθμού των παραγόντων Διάγραμμα Scree (Scree Plot) Επιλογή κατάλληλου κριτηρίου Διαχείριση Απόδοσης και Δείκτες Μέτρησης Απόδοσης (KPIs)

7 3.1 Επιχειρησιακό περιβάλλον (Business Context) Δείκτες Μέτρησης Απόδοσης (Key Performance Indicators KPIs) Πρόσθετα χαρακτηριστικά Δεικτών Μέτρησης Απόδοσης Δημιουργία κατάλληλων Δεικτών (KPIs Creation) Παραδείγματα KPIs ανά επιχειρησιακό κλάδο Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail) Εταιρεία Τηλεπικοινωνιών (Telecommunications) Τραπεζικός Οργανισμός (Banking) Δημιουργία Αξίας (Value Creation from Analytics) Ανάλυση Δεδομένων Οργανισμών Τραπεζικός Οργανισμός (Banking) Ανάλυση μεταβλητών Τραπεζικού Οργανισμού Ανάλυσης συχνοτήτων μεταβλητών Τραπεζικού Οργανισμού Ανάλυση συσχετίσεων μεταβλητών Τραπεζικού Οργανισμού Ανάλυση παραγόντων μεταβλητών Τραπεζικού Οργανισμού Scree Plot μεταβλητών Τραπεζικού Οργανισμού Ιεραρχική τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail) Ανάλυση περιεχόμενου καλαθιού (Basket analysis) Ανάλυση Συμπεριφοράς (Behavioral analysis) Εταιρεία Τηλεπικοινωνιών (Telecommunications) Ανάλυσης συχνοτήτων μεταβλητών Εταιρείας Τηλεπικοινωνιών Ανάλυση συσχετίσεων μεταβλητών Εταιρείας Τηλεπικοινωνιών Ανάλυση παραγόντων μεταβλητών Εταιρείας Τηλεπικοινωνιών Scree Plot μεταβλητών Εταιρείας Τηλεπικοινωνιών K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Συμπεράσματα και Προτάσεις Βιβλιογραφία

8 ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ Πίνακας 1. Διαστάσεις διαχείρισης δεδομένων Πίνακας 2. Πίνακας Συχνοτήτων Πίνακας 3. Χαρακτηριστικά αριθμητικών μεταβλητών ως προς την ποιότητα δεδομένων Πίνακας 4. Ενδεικτικός Πίνακας Συσχετίσεων Πίνακας 5. Παραγόμενος πίνακας ανάλυσης παραγόντων Πίνακας 6. Πίνακας ιδιοτιμών ανάλυσης παραγόντων Πίνακας 7. Παραδείγματα δεικτών μέτρησης για Χρηματοοικονομικά Πίνακας 8. Ενδεικτικά KPIs Εταιρειών Πώλησης Προϊόντων Λιανικής Πίνακας 9. Ενδεικτικά KPIs Εταιρείας Τηλεπικοινωνιών Πίνακας 10. Ενδεικτικά KPIs Τραπεζικού Οργανισμού Πίνακας 11. Πίνακας KPIs Τραπεζικών Οργανισμών (Banking) Πίνακας 12. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 1/ Πίνακας 13. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 2/ Πίνακας 14. Πίνακας κατανομής συχνοτήτων όγκου πωλήσεων Πίνακας 15. Πίνακας κατανομής συχνοτήτων επιπέδου ικανοποίησης με τη τράπεζα Πίνακας 16. Πίνακας κατανομής συχνοτήτων επιθυμίας για αλλαγή τράπεζας Πίνακας 17. Πίνακας κατανομής συχνοτήτων χρήσης account officer Πίνακας 18. Πίνακας κατανομής συχνοτήτων χρήσης βοηθού account officer Πίνακας 19. Πίνακας ανάλυσης συσχετίσεων KPIs τραπεζικού οργανισμού Πίνακας 20. Πίνακας ανάλυσης παραγόντων KPIs τραπεζικού οργανισμού Πίνακας 21. Πίνακας ανάλυσης βαρών KPIs τραπεζικού οργανισμού Πίνακας 22. Συντελεστές για κάθε KPI τραπεζικού οργανισμού στους νέους factors Πίνακας 23. Πίνακας ανάλυσης περιεχόμενου καλαθιού (Basket analysis) Πίνακας 24. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού Πίνακας 25. Πίνακας ανάλυσης συσχετίσεων μεταβλητών περιεχόμενου καλαθιού Πίνακας 26. Πίνακας ανάλυσης παραγόντων μεταβλητών περιεχόμενου καλαθιού Πίνακας 27. Πίνακας ανάλυσης βαρών μεταβλητών περιεχόμενου καλαθιού Πίνακας 28. Πίνακας συντελεστών για κάθε KPI στους νέους factors Πίνακας 29. Αποστάσεις μεταξύ των κέντρων των clusters της k-means Πίνακας 30. Πίνακας ανάλυσης συμπεριφοράς (Behavioral analysis) Πίνακας 31. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού Πίνακας 32. Πίνακας ανάλυσης συσχετίσεων μεταβλητών ανάλυσης συμπεριφοράς Πίνακας 33. Πίνακας ανάλυσης παραγόντων μεταβλητών ανάλυσης συμπεριφοράς Πίνακας 34. Πίνακας ανάλυσης βαρών μεταβλητών συμπεριφοράς Πίνακας 35. Πίνακας συντελεστών για κάθε KPI συμπεριφοράς στους νέους factors Πίνακας 36. Αποστάσεις μεταξύ των κέντρων των clusters (k-means) Πίνακας 37. Πίνακας εταιρείας τηλεπικοινωνιών (Telecommunications) Πίνακας 38. Πίνακας ανάλυσης συχνοτήτων μεταβλητών εταιρείας τηλεπικοινωνιών Πίνακας 39. Πίνακας ανάλυσης συσχετίσεων μεταβλητών εταιρείας τηλεπικοινωνιών Πίνακας 40. Πίνακας ανάλυσης παραγόντων μεταβλητών εταιρείας τηλεπικοινωνιών Πίνακας 41. Πίνακας ανάλυσης βαρών μεταβλητών εταιρείας τηλεπικοινωνιών Πίνακας 42. Συντελεστές για κάθε KPI εταιρείας τηλεπικοινωνιών στους νέους factors Πίνακας 43. Αποστάσεις μεταξύ των κέντρων των clusters (k-means)

9 ΚΑΤΑΛΟΓΟΣ ΓΡΑΦΗΜΑΤΩΝ Γράφημα 1. Διαδικασία υλοποίησης ποσοτικής ανάλυσης δημιουργία αξίας... 8 Γράφημα 2. Μία συγκεντρωτική εικόνα των κυριότερων εργασιών εξόρυξης δεδομένων Γράφημα 3. Ενδεικτικά γραφήματα συχνοτήτων Γράφημα 4. Γραφική απεικόνιση μεθόδων συσταδοποίησης (Clustering) Γράφημα 5. Γραφική απεικόνιση αλγορίθμου K-Means Γράφημα 6. Γραφική απεικόνιση K-Means Γράφημα 7. Γραφική απεικόνιση μεθόδων Ιεραρχικής συσταδοποίησης Γράφημα 8. Μέθοδοι σύνδεσης (Linkage Methods) Γράφημα 9. Ενδεικτικό δενδρόγραμμα Γράφημα 10. Γραφική απεικόνιση αξιολόγηση μιας μη ιεραρχικής συσταδοποίησης Γράφημα 11. Ενδεικτικό διάγραμμα Scree Plot Γράφημα 12. Η βασική δομή της διαχείρισης απόδοσης Γράφημα 13. Πυραμίδα στρατηγικής δημιουργίας KPIs Γράφημα 14. Διαδικασία δημιουργία αξίας για την λήψη αποφάσεων Γράφημα 16. Γράφημα κατανομής συχνοτήτων όγκου πωλήσεων Γράφημα 16. Scree Plot μεταβλητών τραπεζικού οργανισμού Γράφημα 17. Αποτελέσματα ιεραρχικής τμηματοποίησης τραπεζικών δεδομένων Γράφημα 18. Scree Plot μεταβλητών περιεχόμενου καλαθιού Γράφημα 19. Αποτελέσματα k-means τμηματοποίησης περιεχόμενου καλαθιού Γράφημα 20. Scree Plot μεταβλητών ανάλυσης συμπεριφοράς Γράφημα 21. Γράφημα αποτελεσμάτων k-means τμηματοποίησης ανάλυσης συμπεριφοράς 85 Γράφημα 22. Scree Plot μεταβλητών εταιρείας τηλεπικοινωνιών Γράφημα 23. Αποτελέσματα k-means τμηματοποίησης εταιρείας τηλεπικοινωνιών

10 1. Εισαγωγή Η αλματώδης ανάπτυξη της τεχνολογίας τα τελευταία χρόνια, έχει βοηθήσει τους οργανισμούς να αποθηκεύουν και να διαχειρίζονται ένα τεράστιο όγκο δεδομένων. Τα ερωτήματα που δημιουργούνται από την εξέλιξη αυτή είναι πολλά, με το κυριότερο από αυτά να αναφέρεται στο τρόπο που αυτά τα δεδομένα μπορούν να αξιοποιηθούν, να μετατραπούν σε κατάλληλους δείκτες μέτρησης και τέλος να δημιουργηθεί αξία και νέα γνώση. Ο μεγάλος όγκος δεδομένων που συλλέγεται από τους σύγχρονους οργανισμούς, θα μπορούσε να ξεπεράσει την ικανότητα διαχείρισης και αξιοποίησης τους αν δεν υπήρχε η βελτίωση της ικανότητας του ανθρώπου να κατανοήσει και να αξιοποιήσει τις αποθηκευμένες πληροφορίες. Οι τεχνικές εξόρυξης δεδομένων αξιοποιούν μεθόδους και εργαλεία τα οποία προέρχονται από τεχνικές μάθησης και τα οποία αυτοματοποιούν σύνθετες διαδικασίες δημιουργίας δεικτών μέτρησης και δημιουργίας αξίας, γνώσης και συμπερασμάτων από μεγάλο όγκο δεδομένων. Το βασικό ερευνητικό ερώτημα της παρούσας εργασίας είναι να εφαρμοστούν τεχνικές εξόρυξης (Data mining) και ποσοτικής ανάλυσης δεδομένων (Analytics) για τη δημιουργία και την επιλογή των κατάλληλων δεικτών (Metrics) που είναι αντιπροσωπευτικοί για την δημιουργία προστιθέμενης αξίας και γνώσης σε βασικές κατηγορίες επιχειρήσεων (Industries) όπως είναι οι Εταιρείες Τηλεπικοινωνιών (Telecommunications), οι Τραπεζικοί Οργανισμοί (Banking) και οι Εταιρείες Πώλησης Προϊόντων Λιανικής (Retail). Το ερώτημα αυτό θα απαντηθεί με την εφαρμογή των κατάλληλων τεχνικών εξόρυξης δεδομένων, τη δημιουργία και την επιλογή των κατάλληλων δεικτών (KPIs & Feature Selection) με τη χρήση των απαραίτητων ποσοτικών τεχνικών (Correlation and Factor Analysis). Το αποτέλεσμα των αναλύσεων που θα υλοποιηθούν θα είναι η επιλογή των αντιπροσωπευτικών δεικτών ανά κλάδο που θα δημιουργούν αξία και γνώση από τα διαθέσιμα δεδομένα της εκάστοτε επιχείρησης. Η βασικά βήματα της διαδικασίας που θα ακολουθηθεί παρουσιάζονται στο ακόλουθο διάγραμμα: 7

11 Γράφημα 1. Διαδικασία υλοποίησης ποσοτικής ανάλυσης δημιουργία αξίας Στη παρούσα εργασία θα γίνει χρήση μιας σειρά από βασικές έννοιες, οι οποίες θα χρησιμοποιηθούν σε μεγάλο βαθμό για την υλοποίηση των αναλύσεων και την εξαγωγή των κατάλληλων δεικτών ανά επιχειρησιακό οργανισμό. Εισάγεται η έννοια της ποσοτικής ανάλυσης δεδομένων (data analytics), η οποία θα χρησιμοποιηθεί σε μεγάλο βαθμό για την υλοποίηση των αναλύσεων στους τρεις επιλεγμένες οργανισμούς. Θα γίνει χρήση διάφορων στατιστικών τεχνικών και αλγορίθμων τμηματοποίησης των δεδομένων. Θα πραγματοποιηθεί μια εκτενής περιγραφή των μεθόδων εξόρυξης δεδομένων (data mining) και διαχείρισης δεδομένων (data management) από βάσεις δεδομένων μεγάλης κλίμακας (large scale databases). Περιγράφονται οι τρόποι οι οποίοι μπορούν να εφαρμοστούν για να προκύψει αξιοποιήσιμη πληροφορία από την επεξεργασία πρωτογενών δεδομένων. Περιγράφεται ο τρόπος της δημιουργίας και της παρακολούθησης των κατάλληλων δεικτών μέτρησης KPIs για τον εκάστοτε επιχειρησιακό κλάδο και οι μέθοδοι επιλογής των κατάλληλων δεικτών που μπορούν να δημιουργήσουν προστιθέμενη αξία. 8

12 Στη παρούσα εργασία, εφαρμόστηκαν όλοι οι μέθοδοι και οι τεχνικές που περιγράψαμε επιγραμματικά στο εισαγωγικό αυτό κομμάτι και θα αναπτυχθούν λεπτομερώς στη συνέχεια. Επιλέχθηκαν τρεις οργανισμοί διαφορετικών επιχειρησιακών κλάδων όπου θα ήταν δυνατό να αποκτηθούν πρωτογενή δεδομένα που θα μπορέσουν να βοηθήσουν στην υλοποίηση των αναλύσεων της παρούσας εργασίας. Στη συνέχεια, και με τη χρήση του στατιστικού πακέτου SPSS αναπτύχθηκε ο κατάλληλος κώδικας για την εξόρυξη και τη διαχείριση των δεδομένων αυτών, της ποσοτικής ανάλυσης και της εφαρμογής των κατάλληλων τεχνικών για τον προσδιορισμό των κατάλληλων δεικτών KPIs που θα βοηθήσουν στην κατανόηση της λειτουργία του εκάστοτε οργανισμού και της τμηματοποίησης του πελατολογίου του. Η διαδικασία που θα ακολουθηθεί στη παρούσα εργασία συμβάλει στη δημιουργία μιας μεθόδου για την ποσοτική ανάλυση δεδομένων οργανισμών, στην οποία θα είναι δυνατή η δημιουργία αριθμού δεικτών KPIs, από τους οποίους με τις κατάλληλες στατιστικές τεχνικές θα επιλέγονται οι κατάλληλοι για την αξιοποίηση της διαθέσιμης πληροφορίας. Η συγκεκριμένη διαδικασία θα περιγραφεί αναλυτικά στα επόμενα κεφάλαια και θα εφαρμοστεί στη πράξη σε πραγματικά δεδομένα τριών οργανισμών διαφορετικών επιχειρησιακών κλάδων. 1.1 Επισκόπηση Περιεχομένων Η παρούσα εργασία περιλαμβάνει τα ακόλουθα κεφάλαια τα οποία αναφέρονται επιγραμματικά στη συνέχεια. Στο 1 ο κεφάλαιο γίνεται μια εισαγωγή στα βασικά προβλήματα που αντιμετωπίζουν οι σύγχρονοι οργανισμοί από τη διατήρηση και διαχείριση μεγάλου όγκου δεδομένων. Εισάγεται το πρόβλημα το οποίο θα επιχειρηθεί να λυθεί και παρουσιάζεται ο τρόπος και τα εργαλεία που θα υλοποιηθεί αυτό. Στο 2 ο κεφάλαιο παρουσιάζονται οι τεχνικές εξόρυξης δεδομένων, οι τρόποι διαχείρισης και ποσοτικής ανάλυσης των δεδομένων, οι μεθοδολογίες ανάλυσης παραγόντων και επιλογής μεταβλητών καθώς και οι αλγόριθμοι τμηματοποίησης. 9

13 Στο 3 ο κεφάλαιο παρουσιάζεται η αξία της δημιουργίας δεικτών μέτρησης απόδοσης καθώς και ο τρόπος δημιουργίας τους. Επίσης, παρατίθεται μια σειρά από ενδεικτικούς δείκτες ανά επιχειρησιακά κλάδο, που θεωρούνται σημαντικοί για την δημιουργία αξίας. Στο 4 ο κεφάλαιο αναδεικνύεται η βαρύτητα της κατανόησης των δεδομένων ενός οργανισμού και η αξιοποίηση τους για τη δημιουργία γνώσης και αξίας για να βελτιώσουν το ανταγωνιστικό τους πλεονέκτημα. Στο 5 ο κεφάλαιο πραγματοποιείται η ποσοτική ανάλυση των δεδομένων από τρεις εταιρείες διαφορετικών κλάδων με τη χρήση του στατιστικού πακέτου SPSS, όπου θα επιλεγούν εκείνες οι μεταβλητές που μπορούν να δημιουργήσουν προστιθέμενη αξία στους εκάστοτε οργανισμούς. Στο 6 ο και τελευταίο κεφάλαιο της εργασίας παρουσιάζονται τα συμπεράσματα από την ανάλυση των δεδομένων των τριών επιχειρησιακών κλάδων και παρουσιάζονται ενδεικτικές προτάσεις για μελλοντική έρευνα. 10

14 2. Τεχνικές ανάλυσης και εξόρυξης δεδομένων (Data Analytics & Mining) Κατά την διαδικασία εξόρυξης δεδομένων (Data Mining) υπάρχουν τρία βασικά βήματα: a. αναζήτηση μοντέλου b. παράσταση μοντέλου c. αξιολόγηση μοντέλου Οι βασικές μέθοδοι αναζήτησης μοντέλου ψάχνουν και για παραμέτρους και για μοντέλα (Fayyad et al., 1996). Στην αναζήτηση παραμέτρων ο αλγόριθμος ψάχνει τις ελεύθερες παραμέτρους που βελτιστοποιούν την απόδοση ενός τελικού μοντέλου. Για απλά προβλήματα η αναζήτηση είναι εύκολη, αλλά για γενικά μοντέλα μία κλειστή λύση δεν είναι εφικτή, και χρησιμοποιούνται μέθοδοι όπως η συζυγής κατάβαση δυναμικού στον αλγόριθμο back-propagation για τα νευρωνικά δίκτυα. Η αναζήτηση μοντέλου από την άλλη ψάχνει για το κατάλληλο μοντέλο ή την οικογένεια μοντέλων και για κάθε μία τέτοια δομή μοντέλου που βρίσκει εφαρμόζει έπειτα την αναζήτηση για τις κατάλληλες παραμέτρους του. Αυτές οι δύο αναζητήσεις είναι χρονοβόρες όταν το μέγεθος του χώρου αναζήτησης είναι μεγάλο και οι υλοποιήσεις τους επωφελούνται ιδιαίτερα από τις τεχνικές παραλληλισμού. Ένα προβλεπτικό μοντέλο (predictive model) κάνει μια πρόβλεψη για τις τιμές των δεδομένων, χρησιμοποιώντας γνωστά αποτελέσματα που έχει βρει από άλλα δεδομένα. Η μοντελοποίηση πρόβλεψης μπορεί να γίνει με βάση τη χρήση ιστορικών δεδομένων. Οι εργασίες εξόρυξης γνώσης από δεδομένα για το χτίσιμο ενός προβλεπτικού μοντέλου περιλαμβάνουν Κατηγοριοποίηση ή ταξινόμηση (Classification) Παλινδρόμηση (Regression) Ανάλυση χρονολογικών σειρών (Time Series Analysis) Πρόβλεψη (Prediction - Forecast) 11

15 Ένα περιγραφικό μοντέλο (descriptive model) αναγνωρίζει πρότυπα ή συσχετίσεις στα δεδομένα. Αντίθετα από το προβλεπτικό, το περιγραφικό μοντέλο λειτουργεί σαν ένα μέσο που διερευνά τις ιδιότητες των δεδομένων που εξετάζονται, όχι να προβλέπει νέες ιδιότητες. Οι εργασίες εξόρυξης γνώσης από δεδομένα για το χτίσιμο ενός περιγραφικού μοντέλου περιλαμβάνουν Συσταδοποίηση (Clustering) Παρουσίαση συνόψεων (Summarization) Κανόνες συσχετίσεων (Association Rules) Ανακάλυψη ακολουθιών (Sequential Pattern Discovery) Γράφημα 2. Μία συγκεντρωτική εικόνα των κυριότερων εργασιών εξόρυξης δεδομένων 2.1 Κατηγοριοποίηση (Classification) Η κατηγοριοποίηση (Dunham, 2004), (classification, Supervised learning, Pattern recognition) αντιστοιχίζει τα δεδομένα σε προκαθορισμένες κατηγορίες ή κλάσεις. Αναφέρεται συχνά σαν εποπτευόμενη μάθηση (Haykin, 1999), επειδή οι κατηγορίες κλάσεις καθορίζονται πριν ακόμη εξεταστούν τα δεδομένα. Οι αλγόριθμοι κατηγοριοποίησης, οι γνωστοί ταξινομητές, απαιτούν οι κατηγορίες να ορίζονται με 12

16 βάση τις τιμές των γνωρισμάτων των δεδομένων, και περιγράφουν αυτές τις κατηγορίες εξετάζοντας τα γνωρίσματα αυτά (Berry 1996, Holte 1993). Οι τεχνικές κατηγοριοποίησης χρησιμοποιούν δένδρα αποφάσεων, παλινδρόμηση, λογικούς κανόνες, νευρωνικά δίκτυα, στατιστικές μεθόδους διάκρισης ή κοντινότερους γείτονες ή τεχνικές Bayes. Με τη χρήση νευρωνικών δικτύων (Bishop 1995, Haykin 1999, Ripley 1994) σαν ταξινομητές η κατηγοριοποίηση ανάγεται σε ένα πρόβλημα density estimation ή discrimination ή και regression. 2.2 Παλινδρόμηση (Regression) Η Παλινδρόμηση (Regression) είναι μια ευρέως χρησιμοποιημένη στατιστική τεχνική μοντελοποίησης για την έρευνα της συσχέτισης μεταξύ μίας εξαρτώμενης μεταβλητής και μιας ή περισσότερων ανεξάρτητων μεταβλητών. Έτσι η παλινδρόμηση μπορεί να απεικονίζει ένα στοιχειώδες δεδομένο x σε μια πραγματική μεταβλητή πρόβλεψης y. Η παλινδρόμηση περιλαμβάνει την εκμάθηση μιας συνάρτησης y=f(x) που κάνει αυτή την απεικόνιση (Dunham 2004, Han & Kamber 2006, Bishop 1995). Η παλινδρόμηση προϋποθέτει ότι τα σχετικά δεδομένα ταιριάζουν με μερικά γνωστά είδη συνάρτησης (γραμμική, μη-γραμμική, πολυωνυμική κλπ.) και μετά καθορίζει την καλύτερη συνάρτηση αυτού του είδους που μοντελοποιεί τα δεδομένα. Όταν χρησιμοποιείται για παρεμβολή (interpolation) σημείων σε ενδιάμεσα τμήματα μπορεί να κάνει και κατηγοριοποίηση. Η συνάρτηση παλινδρόμησης προβλέπει την συνάρτηση συμμετοχής του ανύσματος x στην κλάση με τιμή y. Η γραμμική παλινδρόμηση y=c 0 +c 1 x 1 + +c n x n υποθέτει γραμμικές συσχετίσεις και μπορεί να βρει έτσι μία διαχωριστική συνάρτηση που διαχωρίζει έναν υποχώρο σε δύο περιοχές κλάσεων. Και αυτή επίσης εμφανίζεται συχνά και στην κατηγοριοποίηση δεδομένων. Τα Τεχνητά νευρωνικά δίκτυα χρησιμοποιούνται ευρύτατα για εκτίμηση σημείων, ή εκτίμηση συνάρτησης, ή παλινδρόμηση, ή πρόβλεψη ή κατηγοριοποίηση. Στην αξιολόγηση μοντέλων υπάρχει το standard mean squared error και η cross entropy loss function για την παλινδρόμηση και κατηγοριοποίηση αντίστοιχα (Haykin 1999, Ripley 1994, Geman et al. 1992). Δένδρα παλινδρόμησης, κανόνες και regression splines χρησιμοποιούνται επίσης στην προβλεπτική μοντελοποίηση (predictive 13

17 modelling) αν και μπορούν επίσης να εφαρμοστούν και στην περιγραφική μοντελοποίηση. 2.3 Ανάλυση Χρονοσειρών (Time Series Analysis) Με την ανάλυση χρονολογικών σειρών ή χρονοσειρών (time series analysis), μελετάται η τιμή ενός γνωρίσματος καθώς μεταβάλλεται στο χρόνο (Dunham 2004, Han & Kamber 2006). Οι τιμές λαμβάνονται σε ίσα χρονικά διαστήματα (ημερήσια, εβδομαδιαία, ωριαία, κοκ). Για να παρασταθούν οπτικά οι χρονοσειρές χρησιμοποιείται ένα διάγραμμα χρονοσειρών. Υπάρχουν τρεις βασικές λειτουργίες που πραγματοποιούνται στην ανάλυση χρονοσειρών. Στη μια περίπτωση, χρησιμοποιούνται μονάδες μέτρησης απόστασης για να καθορίσουν την ομοιότητα ανάμεσα σε διαφορετικές χρονοσειρές. Στη δεύτερη περίπτωση, εξετάζεται η δομή της χρονοσειράς για να καθορίσει (ίσως και να κατηγοριοποιήσει) τη συμπεριφορά της. Μια τρίτη περίπτωση είναι η χρήση διαγραμμάτων χρονοσειρών για την πρόβλεψη μελλοντικών τιμών. Μία άλλη πρόσφατη λειτουργία είναι η εύρεση των ίδιων των κατηγοριών των χρονοσειρών. 2.4 Πρόβλεψη (Prediction) Πολλές από τις πρακτικές εφαρμογές εξόρυξης γνώσης μπορούν να θεωρηθούν σαν πρόβλεψη μελλοντικών καταστάσεων (Dunham, 2004) με γνώση των προηγούμενων και των σημερινών δεδομένων. Η πρόβλεψη (prediction - Forecasting) μπορεί να θεωρηθεί σαν ένα είδος κατηγοριοποίησης. Αυτή η εργασία εξόρυξης γνώσης είναι διαφορετική από το μοντέλο πρόβλεψης, παρόλο που η διαδικασία πρόβλεψης αποτελεί ένα τύπο μοντέλου πρόβλεψης. Η διαφορά είναι ότι ως πρόβλεψη θεωρείται περισσότερο το να δίνεται τιμή σε μια μελλοντική κατάσταση (Zhang et al., 2005) παρά σε μια τρέχουσα. Έτσι εδώ αναφερόμαστε σε ένα είδος εφαρμογής παρά σε μια προσέγγιση μοντελοποίησης. 2.5 Συσταδοποίηση (Clustering) Η Συσταδοποίηση (clustering, Unsupervised learning, Segmentation, Partitioning) είναι η διαδικασία ομαδοποίησης αντικειμένων με όμοια χαρακτηριστικά και η κατάταξη σε κλάσεις ή συστάδες ή συμπλέγματα. Στην Συσταδοποίηση (Dunham 2004, Han & Kamber 2006, Zaïane2005). οι συστάδες δεν είναι προκαθορισμένες 14

18 αλλά προσδιορίζονται από τα δεδομένα. Η συσταδοποίηση αναφέρεται εναλλακτικά και σαν μη εποπτευόμενη μάθηση. Μπορεί να θεωρηθεί σαν μια διαμέριση ή τμηματοποίηση των δεδομένων σε ομάδες που μπορεί να είναι ή να μην είναι διακριτές μεταξύ τους. Η συσταδοποίηση συνήθως επιτυγχάνεται με τον καθορισμό της ομοιότητας, ως προς προκαθορισμένα γνωρίσματα, ανάμεσα στα δεδομένα. Τα πιο σχετικά δεδομένα ομαδοποιούνται σε ίδιες ομάδες. 2.6 Παρουσίαση Συνόψεων (Summarization) Η παρουσίαση συνόψεων (summarization, characterization) ή συνοπτικών μοντέλων αφορά μεθόδους που βρίσκουν και απεικονίζουν τα δεδομένα σε υποσύνολα τους που συνοδεύονται με απλές και συνοπτικές περιγραφές. Η σύνοψη χαρακτηρίζει τα δεδομένα και παράγει αντιπροσωπευτικές πληροφορίες σχετικά με τις βάσεις δεδομένων. Αυτό είναι χρήσιμο και βοηθά στην κατανόηση της σημαντικότητας μερικών γνωρισμάτων έναντι άλλων (Fayyad, 1996). Βασικές έννοιες της στατιστικής όπως ο μέσος, η διακύμανση, η τυπική απόκλιση αποτελούν απλά μοντέλα ενός πληθυσμού. Το ταίριασμα ενός πληθυσμού σε μία κατανομή παρέχει ένα καλύτερο μοντέλο δεδομένων. Το ιστόγραμμα είναι επίσης μία πολύ κατατοπιστική τεχνική που δείχνει συνοπτικά πιθανά απλά μοντέλα για την κατανομή των δεδομένων. Το διάγραμμα διασποράς είναι μία άλλη τεχνική για την παρουσίαση δεδομένων. 2.7 Ανάλυση Κανόνων Συσχετίσεων (Association Rules) Ένας κανόνας συσχέτισης (association rule) είναι ένα μοντέλο (Dunham 2004, Han & Kamber 2006) που αναγνωρίζει ειδικούς τύπους συσχέτισης μεταξύ δεδομένων. Η ανάλυση κανόνων συσχετίσεων (association rules), αναφέρεται στην διαδικασία εκείνη της εξαγωγής γνώσης από βάσεις δεδομένων που αποκαλύπτει συγκεκριμένο τρόπο με τον οποίο τα δεδομένα είναι δυνατόν να συνδέονται. Το ευρύτερα γνωστό παράδειγμα αυτού του είδους εφαρμογής είναι ο προσδιορισμός κανόνων συσχέτισης από την ανάλυση δεδομένων συναλλαγών. Για παράδειγμα ο κανόνας Α {Β,Γ} δηλαδή οι πελάτες που αγοράζουν το Α, αγοράζουν ταυτόχρονα και τα Β και Γ είναι ένας κανόνας συσχέτισης. Η ανάλυση κανόνων συσχέτισης είναι γνωστή και σαν Dependency Modelling, που γίνεται σε δύο επίπεδα: στο δομικό επίπεδο του μοντέλου (συνήθως σε γραφική μορφή) καθορίζεται ποιες μεταβλητές είναι εξαρτημένες τοπικά με ποιες, ενώ στο ποσοτικό 15

19 επίπεδο του μοντέλου προσδιορίζεται η δύναμη αυτών των εξαρτήσεων με χρήση κάποιας αριθμητικής κλίμακας. Η ανάλυση κανόνων συσχετίσεων είναι ένα ενεργό πεδίο έρευνας και εκτός από το market basket analysis, χρησιμοποιείται σε πληθώρα άλλων εφαρμογών, από το Web usage mining, τη συσχέτιση υπόπτων εγκληματικών ενεργειών, την πρόβλεψη αποτυχίας της λειτουργίας τηλεπικοινωνιακών διακόπτων, το network intrusion detection καθώς και σε άλλες τεχνικές όπως graph mining, clustering with links, και bioinformatics. 2.8 Ανακάλυψη Ακολουθιών (Sequential Pattern Discovery) Η ανακάλυψη προτύπων ακολουθιών (sequential pattern discovery) ή αλλιώς ακολουθιακή ανάλυση (sequential analysis) (Dunham 2004) χρησιμοποιείται για να καθοριστούν σειριακά πρότυπα στα δεδομένα. Αυτά τα πρότυπα βασίζονται σε μια χρονική ακολουθία ενεργειών και είναι παρόμοια με τις συσχετίσεις στο ότι συσχετίζονται τα δεδομένα (ή τα γεγονότα) που εξάγονται, με την διαφορά ότι η συσχέτιση τους βασίζεται στον χρόνο (Bishop 2006). Οι παραπάνω μέθοδοι και αλγόριθμοι μπορούν και να συνδυάζονται. Οι βασικές συνιστώσες από τις οποίες αποτελείται ένας αλγόριθμος εξόρυξης γνώσης σύμφωνα με τους Hand και την ομάδα του (Hand et al., 2000) είναι: 1. Η δομή που θα αναζητηθεί 2. Το κριτήριο αξιολόγησης 3. Η μέθοδος βελτιστοποίησης και αναζήτησης 4. Μια στρατηγική διαχείρισης δεδομένων 2.9 Είδη Δομών: Μοντέλα και Πρότυπα Υπάρχουν διάφοροι τρόποι για να χαρακτηρίσει κανείς τις δομές που εμφανίζονται κατά την αναζήτηση μέσα στα δεδομένα. Μια τέτοια περίπτωση είναι ο χωρισμός τους σε μοντέλα (models) και σε πρότυπα (patterns). 16

20 Με τον όρο μοντέλο εννοούμε μια σύνοψη που αφορά σε όλα τα δεδομένα. Πρόκειται για μια γενική περιγραφή του συνόλου δεδομένων, μέσω της οποίας έχουμε προτάσεις για κάθε σημείο του χώρου. Μια επιπλέον διάκριση που κάνουμε ανάμεσα στα μοντέλα είναι σε γραμμικά και μη-γραμμικά. Αναφέρουμε ως γραμμικά τα μοντέλα που είναι γραμμικός συνδυασμός των παραμέτρων τους. Σε αντίθεση με τα μοντέλα, τα πρότυπα αφορούν και περιγράφουν μια σχετικά μικρή περιοχή των δεδομένων. Ένα απλό παράδειγμα είναι ο παρακάτω κανόνας συσχέτισης: αν ο πελάτης αγοράσει ένα συνδυασμό αντικειμένων τότε θα αγοράσει και ένα άλλο με κάποια πιθανότητα p. Βλέπουμε ότι εδώ έχουμε να κάνουμε με έναν υποχώρο των δεδομένων. Επίσης, μέσω των προτύπων μπορούμε να αναγνωρίσουμε ποια στοιχεία αποκλίνουν από την πλειοψηφία, εμφανίζοντας ασυνήθιστη συμπεριφορά. Βέβαια για να χαρακτηρίσουμε μια συμπεριφορά ασυνήθιστη χρειάζεται να έχουμε περιγράψει ποια είναι η συνηθισμένη. Έτσι μπορούμε να θεωρούμε τα μοντέλα και τα πρότυπα ως τις δύο όψεις του ίδιου νομίσματος μιας και μερικές φορές δεν είναι σαφές αν μια συγκεκριμένη δομή πρέπει να αναφέρεται ως πρότυπο ή ως μοντέλο. Υπάρχει η τάση οι αναλυτές να μην σκέφτονται μοντέλα ή πρότυπα αλλά μόνο εξειδικευμένους αλγορίθμους για την εύρεση μιας συγκεκριμένης δομής (Hand et al., 2000) Κριτήρια Αξιολόγησης Τα κριτήρια αξιολόγησης (score functions) χρησιμοποιούνται με σκοπό να αποτελέσουν ένα μέτρο του πόσο κοντά ή μακριά βρίσκεται μια συγκεκριμένη προσαρμοσμένη δομή από το συνολικό στόχο της διαδικασίας εξόρυξης. Συνιστούν δηλαδή μια προσπάθεια να ποσοτικοποιήσουμε την επιτυχία σχετικά με την προσαρμοσμένη δομή. Χωρίς τα κριτήρια αξιολόγησης δεν μπορούμε να συγκρίνουμε δύο μοντέλα ή να επιλέξουμε εκείνες τις τιμές των παραμέτρων που αποδίδουν τις επιθυμητές για εμάς ιδιότητες. Τα κριτήρια με τα οποία μπορούμε να αξιολογήσουμε ένα μοντέλο ποικίλουν, όπως η γνωστή συνάρτηση του αθροίσματος σφαλμάτων σε ένα μοντέλο πρόβλεψης ή το ποσοστό των λανθασμένων ταξινομήσεων σε προβλήματα κατηγοριοποίησης. Η αξιολόγηση μπορεί να γίνει ως 17

21 προς την ακρίβεια στην πρόβλεψη, ως προς την πολυπλοκότητα, τη χρησιμότητα ή την καινοτομία. Σε κάθε περίπτωση όμως πρέπει να λαμβάνονται υπόψη και πρακτικά ζητήματα που δημιουργούνται ανάλογα πάντα με το πεδίο εφαρμογής. Η επιλογή ενός κριτηρίου αξιολόγησης που επηρεάζεται από μικρές αλλαγές στα δεδομένα, ανάλογα και με τους στόχους της έρευνας, μπορεί να μην είναι επιθυμητή οπότε να χρειάζονται πιο ανθεκτικές μέθοδοι (σε θόρυβο ή έκτοπα) Βελτιστοποίηση και Αναζήτηση Μετά την επιλογή της δομής και την επιλογή ενός κριτηρίου αξιολόγησης, απομένει η εύρεση των κατάλληλων τιμών των παραμέτρων ή του μοντέλου ώστε να ελαχιστοποιηθεί (ή μεγιστοποιηθεί, ανάλογα με την περίπτωση) το κριτήριο αξιολόγησης. Στην περίπτωση των μοντέλων πρόκειται για ένα πρόβλημα βελτιστοποίησης που μπορεί να λυθεί με τη χρήση αλγεβρικών υπολογισμών και διαφορικού λογισμού, ενώ στην περίπτωση των προτύπων γίνεται ένα πρόβλημα συνδυαστικής αναζήτησης για το καλύτερο πρότυπο. Επειδή συχνά στόχος είναι να γενικεύσουμε τα συμπεράσματα και για νέα δεδομένα μια πολύ καλή προσαρμογή μπορεί να μην προβλέπει με ακρίβεια στην περίπτωση νέων δεδομένων, απαιτείται προσοχή και αυτό είναι ένα θέμα που απασχολεί την εξόρυξη γνώσης από δεδομένα Διαχείριση των Δεδομένων Τέλος, κάθε αλγόριθμος εξόρυξης γνώσης από δεδομένα οφείλει να περιέχει και μια στρατηγική για τον τρόπο διαχείρισης των δεδομένων. Πρέπει δηλαδή να συμπεριλαμβάνει σαφείς οδηγίες για τον τρόπο με τον οποίο τα δεδομένα θα αποθηκευτούν, θα αριθμηθούν και προσπελασθούν. Πολλοί αλγόριθμοι υποθέτουν ότι τα δεδομένα της ανάλυσης μπορούν να χωρέσουν στη μνήμη RAM του υπολογιστή, όμως αυτό πολύ συχνά δεν συμβαίνει στα ογκώδη σύνολα δεδομένων. Αυτό συνεπάγεται ότι δεν μπορούμε να έχουμε ταυτόχρονα όλα τα δεδομένα στη διάθεση του επεξεργαστή, με αποτέλεσμα πολλοί αλγόριθμοι, όπως π.χ. αλγόριθμοι δέντρων ταξινόμησης, να μην κλιμακώνονται με αποτελεσματικό τρόπο σε τέτοια μαζικά σύνολα δεδομένων. 18

22 2.10 Διαχείριση Ποιότητας Δεδομένων (Data QA) Κατά την διάρκεια της διαχείρισης ποιότητας των δεδομένων, θα πρέπει να εντοπιστούν και να ελεγχθούν μια σειρά από διαστάσεις όπως είναι η σαφήνεια των δεδομένων, η πληρότητα, η συμμόρφωση, η συνοχή, η ορθότητα και η μοναδικότητα τους. Ένας ενδεικτικός πίνακας με αυτές τις διαστάσεις είναι ο ακόλουθος: Κατηγορία Ενδεικτικός δείκτης / Key Performance Indicator (KPI) Σαφήνεια Πληρότητα Συνοχή Ορθότητα Μοναδικότητα Ύπαρξη λεξικού δεδομένων (data dictionary) % των μεταβλητών που υπάρχουν στο λεξικό δεδομένων % των προσδιορισμένων μεταβλητών που είναι διαθέσιμοι % των πεδίων με αναντιστοιχίες δεδομένων % των εγγραφών με προβλήματα ακεραιότητας % των εγγραφών με μη ελλιπή γεωγραφικά στοιχεία % των εγγραφών με μη αρνητικά υπόλοιπα % ακραίων τιμών σε κάθε μεταβλητή % διπλο-εγγραφών % μοναδικών εγγραφών Πίνακας 1. Διαστάσεις διαχείρισης δεδομένων Ένα σημαντικό βήμα που προηγείται του υπολογισμού των δεικτών (KPIs) όταν μια μεταβλητή εξάγεται από την βάση δεδομένων, είναι να υπολογιστούν συγκεκριμένα χαρακτηριστικά της μεταβλητής. Αυτό αποτελεί μια τυπική διαδικασία αξιολόγησης της ποιότητας των δεδομένων και πρέπει να εφαρμόζεται σε όλα τα δεδομένα. Για τις αριθμητικές μεταβλητές, υπολογίζονται συγκεντρωτικοί στατιστικοί δείκτες (min, max, average, blank, median) και για τις κατηγορικές μεταβλητές προσδιορίζεται η ποσότητα των κενών τιμών. Ένα τέτοιο παράδειγμα σχετικών υπολογισμών, τόσο για αριθμητικές όσο και για κατηγορικές μεταβλητές παρουσιάζεται στον επόμενο πίνακα: 19

23 Τράπεζα Συχνότητα Ποσοστό Συχνότητας Αθροιστική Συχνότητα Αθροιστικό Ποσοστό Συχνότητας Τράπεζα ,6% % Τράπεζα ,1% % Τράπεζα ,6% % Τράπεζα ,8% % Τράπεζα ,5% % Τράπεζα ,0% % Τράπεζα ,9% % Τράπεζα ,5% % Τράπεζα ,0% % Πίνακας 2. Πίνακας Συχνοτήτων Όνομα πεδίου Αριθμός Μέσος Τυπική Ελάχιστη Μέγιστη Συχνότητα Παρατηρήσεων όρος απόκλιση τιμή τιμή ελλιπών τιμών Τραπεζικές καταθέσεις (42.287) ,6% Πιστωτικά προϊόντα , ,8 (95.479) ,6% Επενδυτικά προϊόντα , ,1 (95.479) ,6% Πίνακας 3. Χαρακτηριστικά αριθμητικών μεταβλητών ως προς την ποιότητα δεδομένων 20

24 Προ-επεξεργασία Δεδομένων (Data Cleansing) Μετά τον έλεγχο ποιότητας των διαθέσιμων δεδομένων, το επόμενο στάδιο είναι ο καθαρισμός των δεδομένων αυτών και η διατήρηση των κατάλληλων μεταβλητών. Κατά τη διάρκεια αυτής της φάσης, και εφόσον η ακριβής επεξήγηση και οι ακριβείς τιμές όλων των μεταβλητών είναι γνωστά, είναι εφικτός ο εντοπισμός των μη φυσιολογικών τιμών και των ελλιπών παρατηρήσεων Εντοπισμός των μη φυσιολογικών τιμών (Abnormal Values) Η διαδικασία του καθαρισμού των δεδομένων μπορεί να περιέχει τυπογραφικά λάθη τα οποία μπορούν να διορθωθούν με βάση μια διαθέσιμη λίστα από όλες τις πιθανές τιμές της μεταβλητής. Υπάρχει επίσης η περίπτωση των δεδομένων με λανθασμένα ονόματα μεταβλητών, τα οποία μπορούν να συμπληρωθούν και ονομαστούν σωστά. Μια επιπλέον περίπτωση είναι η ύπαρξη διπλο-εγγραφών οι οποίες πρέπει να εξαιρεθούν προσεκτικά Εντοπισμός των ελλιπών παρατηρήσεων (Missing Values) Ο εντοπισμός των ελλιπών παρατηρήσεων είναι ένα σημαντικό βήμα, και μπορεί αντιμετωπιστεί είτε με την απομάκρυνση τέτοιων μεταβλητών ή με την αντικατάσταση τους με το μέσο όρο των υπόλοιπων τιμών. Εναλλακτικά μπορεί να υπάρχουν μερικές μεταβλητές που μπορεί να έχει περισσότερο νόημα να θέσουμε τις ελλιπείς παρατηρήσεις ίσες με το 0. Επίσης στην περίπτωση που υπάρχουν σημαντικά ελλιπείς κατηγορικές μεταβλητές, μπορούν να εξαιρεθούν από την ανάλυση (Kim 1977). Επίσης, επιτρέπεται να απομακρύνονται μεταβλητές που έχουν τιμές εκτός ενός καθορισμένου ορίου. Αυτό μπορεί να πραγματοποιηθεί με την τοποθέτηση συγκεκριμένων διαστημάτων όπως είναι η τυπική απόκλιση από το μέσο, η μέση απόλυτη απόκλιση και τα ακραία εκατοστημόρια τιμών. 21

25 Ενδεικτικά αποτελέσματα συχνοτήτων μεταβλητών με ελλιπείς τιμές: Γράφημα 3. Ενδεικτικά γραφήματα συχνοτήτων Υπάρχουν δύο βασικές στρατηγικές για τον χειρισμό των ελλιπών μεταβλητών: 1) Αντικατάσταση των ελλιπών μεταβλητών στο παραγόμενο αρχείο δεδομένων. Η βασική μέθοδος για την υλοποίηση αυτή είναι η αντικατάσταση των ελλιπών παρατηρήσεων ενός τμήματος με τις τιμές του τμήματος που είναι πιο κοντά του. 2) Αντικατάσταση των παρατηρήσεων με ελλιπείς τιμές κατά τη διάρκεια της αρχικοποίησης της ανάλυσης. Σε κάθε περίπτωση, είναι απαραίτητο να μην περιλαμβάνονται μεταβλητές με κυρίαρχο ποσοστό ελλιπών παρατηρήσεων (π.χ. μεγαλύτερο από 80%) στο τελικό αρχείο δεδομένων που θα χρησιμοποιηθεί για την τμηματοποίηση του πελατολογίου, για να αποφθεχθεί η αλλοίωση του τελικού αποτελέσματος. Μετά την ολοκλήρωση της προ-επεξεργασίας των δεδομένων, το αρχείο των δεδομένων μπορεί να θεωρηθεί ότι είναι σύμφωνο με τις αναμενόμενες τιμές που εντοπίστηκαν κατά την διάρκεια του ελέγχου ποιότητας των δεδομένων. Με την ολοκλήρωση αυτής της διαδικασίας, τα δεδομένα είναι έτοιμα, ακριβή, ακέραια, σωστά, ολοκληρωμένα και σύμφωνα με τις προδιαγραφές μοντελοποίησης. Αν αυτά τα χαρακτηριστικά ικανοποιούνται από το τελικό αρχείο των δεδομένων, τότε η διαχείριση των δεδομένων (data management) μπορεί να ξεκινήσει και συνεπώς η ανάλυση. 22

26 2.11 Επιλογή Μεταβλητών (Variables Selection) Για την επιλογή των κατάλληλων μεταβλητών υπάρχουν μια σειρά από διαθέσιμες τεχνικές, οι οποίες περιγράφονται στη συνέχεια Ανάλυση Συσχετίσεων (Correlation Matrix) Η τμηματοποίηση προϋποθέτει ότι δεν υπάρχουν ισχυρές συσχετίσεις μεταξύ των μεταβλητών, επομένως πρέπει να γίνει έλεγχος για να βρεθεί ο βαθμός συσχέτισης μεταξύ των μεταβλητών. Συσχέτιση είναι ένας όρος που αναφέρεται στην σχέση μεταξύ δύο μεταβλητών. Ισχυρή, ή υψηλή, συσχέτιση σημαίνει ότι δύο ή περισσότερες μεταβλητές έχουν μια ισχυρή σχέση με το άλλο, ενώ αδύναμη, ή χαμηλή, συσχέτιση σημαίνει ότι οι μεταβλητές δεν σχετίζονται πολύ. Ο συντελεστής συσχέτισης κυμαίνεται από το -1 (τέλεια αρνητική συσχέτιση) έως το 1 (τέλεια θετική συσχέτιση) ενώ η τιμή 0 αντιπροσωπεύει ότι δεν υπάρχει καμία συσχέτιση μεταξύ των 2 μεταβλητών. Var1 Var2 Var3 Var4 Var5 Var6 Var7 Var8 Var1 1,00-0,79 0,12 0,72 0,55 0,49 0,23-0,77 Var2-0,79 1,00 0,82 0,77 0,5 0,79 0,89 0,55 Var3 0,12 0,82 1,00 0,31-0,41 0,26 0,87 0,7 Var4 0,72 0,77 0,31 1,00 0,23 0,32 0,5 0,63 Var5 0,55 0,5-0,41 0,23 1,00 0,86 0,83 0,63 Var6 0,49 0,79 0,26 0,32 0,86 1,00 0,53 0,63 Var7 0,23 0,89 0,87 0,5 0,83 0,53 1,00 0,22 Var8-0,77 0,55 0,7 0,63 0,63 0,63 0,22 1,00 Πίνακας 4. Ενδεικτικός Πίνακας Συσχετίσεων Παραπάνω παρουσιάζεται ενδεικτικά ένας πίνακας συσχέτισης (correlation matrix), στον οποίο παρουσιάζονται οι συντελεστές συσχέτισης μεταξύ των μεταβλητών (με κόκκινο φόντο έχουν σημειωθεί οι συντελεστές συσχέτισης που είναι πάνω από

27 Ανάλυση Κύριων Συνιστωσών (Principal Components Analysis - PCA) Ανάλυση Κύριων Συνιστωσών (PCA) είναι μια πολυμεταβλητή στατιστική τεχνική μείωσης δεδομένων, η οποία συνοψίζει μια σειρά από μεταβλητές σε ένα μικρότερο σύνολο των σύνθετων διαστάσεων. Τεχνικά, μία Κύρια Συνιστώσα (PC) μπορεί να οριστεί ως γραμμικός συνδυασμός των παρατηρούμενων μεταβλητών και ουσιαστικά η Ανάλυση Κύριων Συνιστωσών μειώνει ένα σύνολο μεταβλητών σε ένα μικρότερο αριθμό, ενώ εξακολουθούν να αντιπροσωπεύουν το μέγιστο της διακύμανσης και, επομένως, εξηγεί τις σημαντικές διαστάσεις της μεταβλητότητας. Όπως περιγράφεται στο κεφάλαιο Correlation Analysis, οι μεταβλητές που έχουν μεγάλη συσχέτιση μεταξύ τους, θα δημιουργήσουν προβλήματα στην δημιουργία του μοντέλου τμηματοποίησης. Η Ανάλυση Κύριων Συνιστωσών θα χρησιμοποιηθεί για να αντικατασταθεί ένα σύνολο μεταβλητών οι οποίες έχουν υψηλή συσχέτιση, με λιγότερες Κύριες Συνιστώσες (PCs) οι οποίες θα εξηγούν το κυρίαρχο ποσοστό μεταβλητότητας. Για παράδειγμα, στην περίπτωση που βρεθούνε 4 KPIs τα οποία έχουν σημαντική συσχέτιση μεταξύ τους (θα φαίνεται από τον πίνακα συσχέτισης) και είναι σημαντικοί παράγοντες για να μπούνε στον αλγόριθμο τμηματοποίησης τότε η Ανάλυση Κύριων Συνιστωσών θα δημιουργήσει (ανεξάρτητες μεταξύ τους) Κύριες Συνιστώσες οι οποίες θα εξηγούν το μεγαλύτερο ποσοστό μεταβλητότητας από τις 4 μεταβλητές. 24

28 2.12 Διαθέσιμες Μεθοδολογίες Τμηματοποίησης (Clustering Techniques) Οι τεχνικές συσταδοποίησης (Clustering techniques) μπορούν να χωριστούν σε Ιεραρχικές (Hierarchical) και Διαχωρισμού (Partitioning) όπως φαίνεται και στο ακόλουθο διάγραμμα. Οι τεχνικές Διαχωρισμού, όπως είναι ο αλγόριθμος K-means, έχουν το πλεονέκτημα της σχετικής μικρής υπολογιστικής πολυπλοκότητας και για αυτό το λόγο εμφανίζει συχνή επιλογή και χρήση. Παρόλα αυτά, η Ιεραρχική διαδικασία, μπορεί να καταλήξει σε περισσότερες πληροφορίες και γνώση και να αξιοποιήσει προηγμένες μεθόδους συνδέσεων (Xu 2005). Γράφημα 4. Γραφική απεικόνιση μεθόδων συσταδοποίησης (Clustering) Η υλοποίηση της τμηματοποίησης των πρακτορείων με την χρήση του πακέτου SPSS, μπορεί να πραγματοποιηθεί με τρεις διαθέσιμες μεθόδους: 1. K-means 2. Hierarchical 3. Two-Step Οι δύο πρώτοι μέθοδοι που αποτελούν αυτόνομες τεχνικές, ενώ αντίθετα η τρίτη αποτελεί ένα συνδυασμό των δύο πρώτων. Οι δύο αυτοί βασικοί μέθοδοι θα παρουσιαστούν αναλυτικά στη συνέχεια. 25

29 K Means Στον αλγόριθμο K-Means τα αντικείμενα διατίθενται σε ένα προ-καθορισμένο αριθμό των ομάδων με τέτοιο τρόπο ώστε να βελτιστοποιήσουν ένα μέτρο της αποτελεσματικότητας. Βασικά βήματα για την ομαδοποίηση K-means είναι: 1. Επιλέγεται τυχαία Κ αριθμό seeds που θα είναι οι σπόροι για τις Κ ομάδες 2. Τοποθέτηση των αντικειμένων στο πιο κοντινό seed για αυτά 3. Υπολογισμός του νέου κέντρου βάρους (centroid) της κάθε ομάδας και με την τοποθέτηση ή αφαίρεση ενός seed 4. Επανάληψη των βημάτων 2 και 3 μέχρι να μην αλλάζουν τα κέντρα βάρους (centroids). Στο παρακάτω σχήμα παρουσιάζεται μια διαδικασία τμηματοποίησης χρησιμοποιώντας τον αλγόριθμο K-means: Γράφημα 5. Γραφική απεικόνιση αλγορίθμου K-Means Φυσικά η παραπάνω διαδικασία τμηματοποίησης θα ήταν διαφορετική αν επιλέγονταν διαφορετικά seeds: Γράφημα 6. Γραφική απεικόνιση K-Means 26

30 Αν και η μέθοδος είναι γρήγορη και επιτρέπει στα αντικείμενα να αλλάξουν ευέλικτα ομάδες, δύο από τις βασικές αδυναμίες του είναι ότι η τελική κατανομή εξαρτάται από την αρχική επιλογή των seeds και του προκαθορισμού του αριθμού Κ (αριθμός των ομάδων). Συνήθως αυτά τα προβλήματα αντιμετωπίζονται τρέχοντας πολλές φορές τον αλγόριθμο K-Means - αλλάζοντας τον αριθμό των ομάδων Κ - μέχρι να βρεθεί η βέλτιστη λύση Hierarchical Σε αντίθεση με τον αλγόριθμο K-means, στο Hierarchical δεν είναι απαραίτητος ο ορισμός του αριθμού των clusters τόσο για την έναρξη όσο και την ολοκλήρωση του αλγορίθμου. Στον Ιεραρχικό αλγόριθμο, είναι απαραίτητο ο χρήστης να ορίσει ένα μέτρο ανομοιομορφίας μεταξύ των ομάδων παρατηρήσεων που θα βασίζεται σε ζεύγη ανομοιομορφίας ανάμεσα στις παρατηρήσεις των ομάδων. Όπως υποδηλώνει και το όνομα του, δημιουργεί ιεραρχικές αναπαραστάσεις των clusters σε κάθε επίπεδο της ιεραρχίας θα δημιουργηθούν με την ένωση των κατάλληλων clusters από αμέσως επόμενο ιεραρχικό επίπεδο. Στο χαμηλότερο επίπεδο, κάθε cluster περιέχει μια μοναδική παρατήρηση. Στο ψηλότερο επίπεδο υπάρχει μόνο ένα cluster που περιέχει όλες τις παρατηρήσεις. Η Ιεραρχική συσταδοποίηση περιλαμβάνει την ομαδοποίηση των παρατηρήσεων που βασίζεται στην απόσταση μεταξύ τους. Η απόσταση μπορεί να προσδιοριστεί με τη χρήση διαφορετικών κριτηρίων όπως είναι η «από κάτω προς τα πάνω» μέθοδος (agglomerative bottom-up) ή η «από πάνω προς τα κάτω» μέθοδος (divisive topdown) όπως φαίνεται και στο ακόλουθο διάγραμμα. Βήματα μεθόδου «Bottom-up»: 1. Κάθε παρατήρηση σχηματίζει το δικό της cluster 2. Ενώνονται οι δύο κοντινότερες παρατηρήσεις ή clusters, σύμφωνα με τις αρχικές υπολογισμένες αποστάσεις 3. Επιστροφή στο βήμα 1 μέχρι όλες οι παρατηρήσεις βρεθούν στο ίδιο cluster. 27

31 Βήματα μεθόδου «Top-down»: 1. Κατασκευή ενός μοναδικού cluster που περιέχει όλες τις παρατηρήσεις 2. Διαχωρισμός του cluster έτσι ώστε να οδηγεί σε στοιχεία που έχουν τη μεγαλύτερη απόσταση μεταξύ των clusters. Γράφημα 7. Γραφική απεικόνιση μεθόδων Ιεραρχικής συσταδοποίησης Η πιο διαδεδομένη μέθοδος που χρησιμοποιείται είναι η μέθοδος agglomerative (bottom-up), όπου τα clusters σχηματίζονται από κάτω προς τα πάνω με βάση τη δομή ενός ιεραρχικού δενδρογράμματος. Καθώς ο αλγόριθμος δημιουργεί το δένδρο αυτό, τα clusters ενώνονται με βάση μια επιλεγμένη μέθοδο σύνδεσης (linkage method). Όλες οι πιθανές μέθοδοι σύνδεσης εμφανίζονται στο ακόλουθο διάγραμμα: Γράφημα 8. Μέθοδοι σύνδεσης (Linkage Methods) 28

32 Αξιολόγηση μεθόδων Συσταδοποίησης (Clustering Evaluation) Στην ιεραρχική συσταδοποίηση (hierarchical), οι αποστάσεις στις οποίες οι συστάδες συνδυάζονται και ενοποιούνται μπορεί να χρησιμοποιηθεί σαν κριτήριο επιλογής. Αυτή η πληροφορία μπορεί να προκύψει με την αποτύπωση ενός δενδρογράμματος (dendrogram) όπως φαίνεται στην παρακάτω εικόνα: Γράφημα 9. Ενδεικτικό δενδρόγραμμα Στην μη-ιεραρχική συσταδοποίηση (non-hierarchical), ο λόγος της συνολικής διακύμανσης εντός της συστάδας και της διακύμανσης μεταξύ των συστάδων μπορεί να σχεδιαστεί σε σχέση με τον αριθμό των συστάδων (clusters). Το σημείο στο οποίο εμφανίζεται μια απότομη πτώση του δείκτη αυτού, οδηγεί στην επιλογή του κατάλληλου αριθμού συστάδων. Γράφημα 10. Γραφική απεικόνιση αξιολόγηση μιας μη ιεραρχικής συσταδοποίησης Πρέπει να εξασφαλιστεί ότι το μέγεθος των συστάδων που προκύπτει από την προηγούμενη διαδικασία έχει νόημα για την εκάστοτε επιχείρηση. Αν και δεν υπάρχει μια μοναδική και απόλυτα δεκτή μέθοδος για να υλοποιηθεί η διαδικασία της συσταδοποίησης, το εκάστοτε αποτέλεσμα εξαρτάται από τα παρακάτω: 29

33 1. Οι μεταβλητές (KPIs) που θα επιλεχθούν για να υλοποιηθεί ο αλγόριθμος συσταδοποίησης, θα πρέπει να επιλεχθούν προσεκτικά με μεθόδους ανάλυσης παραγόντων και ανάλυσης συσχετίσεων για να εξασφαλίσουν τη βέλτιστη ερμηνευτική επιλογή των αποτελεσμάτων 2. Η μέθοδος συσταδοποίησης που θα επιλεγεί 3. Η μέθοδος μέτρησης των αποστάσεων που θα υλοποιηθεί Ανάλυση Παραγόντων (Factor Analysis) Η ανάλυση παραγόντων (Factor Analysis) είναι μια τεχνική μείωσης μεταβλητών (variables reduction technique) σε μεγάλου όγκου δεδομένα με μεγάλο αριθμό μεταβλητών. Η τεχνική Factor Analysis ομαδοποιεί τις μεταβλητές με παρόμοια χαρακτηριστικά. Με τη τεχνική αυτή, μπορεί να παραχθεί ένας μικρότερος αριθμός από παράγοντες (σε σχέση με το σύνολο των μεταβλητών), ο οποίος είναι ικανός να εξηγήσει την παρατηρούμενη απόκλιση στο μεγαλύτερο αριθμό μεταβλητών. Αποτελεί μια στατιστική μέθοδο, που χρησιμοποιείται για να περιγράψει την μεταβλητότητα ανάμεσα στις συσχετιζόμενες μεταβλητές, σε όρους δυνητικά χαμηλότερου αριθμού μη παρατηρούμενων μεταβλητών (factors). Οι πληροφορίες που προκύπτουν από αλληλεξαρτήσεις μεταξύ των παρατηρούμενων μεταβλητών μπορούν να χρησιμοποιηθούν για την μείωση του συνόλου των μεταβλητών σε ένα σύνολο δεδομένων. Βασικές προϋποθέσεις για να υλοποιηθεί μια ανάλυση παραγόντων είναι: Οι μεταβλητές να είναι συνεχείς Οι μεταβλητές θα πρέπει να σχετίζονται μεταξύ τους Ο αριθμός των μεταβλητών θα πρέπει να είναι αρκετά μεγάλος ώστε να περιλαμβάνονται τουλάχιστον 3 μεταβλητές σε κάθε παράγοντα Το μέγεθος του δείγματος θα πρέπει να είναι τουλάχιστον ίσο με το τριπλάσιο του αριθμού των μεταβλητών (ιδανικά θα πρέπει να περιλαμβάνει περισσότερες από 100 παρατηρήσεις). 30

34 Τα βασικά βήματα της υλοποίησης μιας Factor Analysis είναι τα παρακάτω: 1. Υπολογισμός του πίνακα συσχετίσεων (Correlation matrix) 2. Εξαγωγή παραγόντων (Factor extraction) 3. Περιστροφή παραγόντων (Factor rotation) προκειμένου να επιτευχθεί μια απλή δομή (simple structure) 4. Ερμηνεία παραγοντικών αξόνων (Interpretation of factor axes) Εξαγωγή Παραγόντων (Factor Extraction) Με τη χρήση του πακέτου SPSS, και την εφαρμογή της τεχνικής Factor Analysis καταλήγουμε σε ένα πίνακα αποτελεσμάτων όπως αυτά που εμφανίζονται στον παρακάτω πίνακα. Πίνακας 5. Παραγόμενος πίνακας ανάλυσης παραγόντων Ιδιοτιμή (Eigenvalue) Μια ιδιοτιμή είναι η κανονικοποιημένη απόκλιση που σχετίζεται με ένα συγκεκριμένο παράγοντα. Η ιδιοτιμή ενός γραμμικού μετασχηματισμού Α είναι η μεταβολή στο μέτρο (πιθανόν και στη φορά) ενός διανύσματος που μένει αναλλοίωτο ως προς τη διεύθυνση, κάτω από τον μετασχηματισμό Α. Ιδιοτιμή ενός τετραγωνικού πίνακα είναι ο αριθμός µε τον οποίο πολλαπλασιάζεται ένα συγκεκριμένο µη-μηδενικό διάνυσμα (που αντιστοιχεί στην ιδιοτιμή ), αν εφαρμοστεί πάνω του ο γραμμικός μετασχηματισμός που εκφράζει ο πίνακας. Το 31

35 άθροισμα των ιδιοτιμών, δεν μπορεί να υπερβαίνει τον αριθμό των στοιχείων που λαμβάνονται υπόψη στην ανάλυση, δεδομένου ότι κάθε στοιχείο συνεισφέρει μια ιδιοτιμή στο άθροισμα των αποκλίσεων. Πίνακας 6. Πίνακας ιδιοτιμών ανάλυσης παραγόντων Στο προηγούμενο ενδεικτικό πίνακα, στην δεύτερη στήλη παρουσιάζεται η απόκλιση των νέων παραγόντων που προέκυψαν. Στην τρίτη στήλη, αυτές οι τιμές παρουσιάζονται σαν ποσοστό τις συνολικής απόκλισης. Για παράδειγμα, ο παράγοντας 1 αποτελεί το 61% της συνολικής απόκλισης και ο παράγοντας 2 το 18%. Παρατηρείται επίσης ότι το άθροισμα των ιδιοτιμών είναι ίσο με τον αριθμό των μεταβλητών Οι ιδιοτιμές και το πρόβλημα της επιλογής του αριθμού των παραγόντων Μετά τον υπολογισμό των ιδιοτιμών για την απόκλιση των παραγόντων που προκύπτουν από την ανάλυση, μπορεί να αποφασιστεί ο αριθμός των παραγόντων που θα επιλεχθεί. Παρά το γεγονός ότι η επιλογή αυτή μπορεί να γίνει και με καθαρά επιχειρησιακά κριτήρια, υπάρχουν κάποιες κατευθυντήριες γραμμές που χρησιμοποιούνται ευρέως και στην πράξη φαίνεται να δίνουν καλύτερα αποτελέσματα. 32

36 Διάγραμμα Scree (Scree Plot) Το διάγραμμα Scree είναι ένα γράφημα απεικόνισης των ιδιοτιμών σε σχέση με όλους τους παράγοντες. Είναι το βασικό διάγραμμα που προκύπτει από την ανάλυση παραγόντων και διευκολύνει στην γραφική επιλογή του κατάλληλου αριθμού των παραγόντων που θα επιλεχθούν (Cattell 1966). Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα, για παράδειγμα, φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 7. Επομένως, με τη χρήση αυτού του κανόνα στη περίπτωση αυτή θα διατηρηθούν 6 παράγοντες. Γράφημα 11. Ενδεικτικό διάγραμμα Scree Plot Επιλογή κατάλληλου κριτηρίου Και τα δύο κριτήρια έχουν μελετηθεί σε βάθος (Cattell & Jaspers 1967, Hakstian Rogers & Cattell 1982, Linn 1968, Tucker Koopman & Linn 1969). 33

37 3. Διαχείριση Απόδοσης και Δείκτες Μέτρησης Απόδοσης (KPIs) Η μεθοδολογία της Διαχείρισης Απόδοσης (Performance Management) αναφέρεται σε όλο τον οργανισμό και υποστηρίζει ένα ευρύ φάσμα επιχειρηματικών δραστηριοτήτων. Οι εφαρμογές της χειρίζονται χρονικά δεδομένα για την υποστήριξη αποφάσεων τόσο για την επιχειρησιακή λειτουργία (Operational Decision Making) όσο και των στρατηγικών αποφάσεων (Strategic decision Making). Οι επιχειρήσεις, μέσα από τις διαδικασίες της στρατηγικής διοίκησης και της διαχείρισης της συνολικής απόδοσης, πρέπει να καθορίζουν συγκεκριμένους σκοπούς και στόχους, κατά τέτοιον τρόπο που να δίνεται η δυνατότητα στα στελέχη να κατανοούν, όσο περισσότερο και καλύτερα μπορούν, τον τρόπο που λειτουργεί το σύστημα της επιχείρησης τους, πού μπορούν να το βελτιώσουν, και πότε το σύστημα αυτό ελέγχεται ή είναι εκτός ελέγχου. Η βασική δομή μίας εφαρμογής διαχείρισης απόδοσης συνοψίζεται στα τέσσερα παρακάτω γενικά βήματα: 1. Καθορισμός στρατηγικής 2. Σχεδιασμός 3. Παρακολούθηση & ανάλυση 4. Διορθωτικές ενέργειες Γράφημα 12. Η βασική δομή της διαχείρισης απόδοσης 34

38 Αρχικά καθορίζονται οι στόχοι του οργανισμού, περιγράφεται η σειρά ενεργειών μέσω των οποίων θα εφαρμοστεί η στρατηγική, διερευνώνται σημαντικοί παράγοντες και μέθοδοι που θα χρησιμοποιηθούν για την υλοποίηση της στρατηγικής, και καθορίζονται οι βασικοί δείκτες (metrics) με τους οποίους θα μετράται και θα παρακολουθείται η απόδοση. Ως παράδειγμα μπορεί να αναφερθεί μία επιχείρηση παροχής υπηρεσιών, όπου η ικανοποίηση των πελατών αποτελεί μία καθοριστική ένδειξη απόδοσης, και κατά συνέπεια ένας δείκτης ικανοποίησης πελατών θα αποτελούσε ένα χαρακτηριστικό δείκτη. Αυτό το βήμα είναι από τα πιο σημαντικά στην φιλοσοφία της διαχείρισης απόδοσης (performance management), καθώς είναι αυτό που συνδέει τους γενικούς στρατηγικούς στόχους σε μετρήσιμα μεγέθη, μέσω των δεικτών αυτών. Η κατασκευή αυτών των δεικτών (metrics) ώστε να είναι αντιπροσωπευτικά των αντίστοιχων στόχων, μπορεί και είναι δύσκολη και προβληματική διαδικασία, γεγονός που δημιουργεί δυσκολίες στον προσδιορισμό τους. Η συνηθέστερη μορφή δεικτών είναι τα KPIs ή Key Performance Indicators, τα οποία χρησιμοποιούνται για την όσο το δυνατόν ακριβέστερη απεικόνιση των στρατηγικών στόχων. Η μέτρηση της απόδοσης αποτελεί ένα τρόπο αξιολόγησης της πορείας μιας επιχείρησης για την επίτευξη των στόχων της, προσφέροντας μια εκτίμηση σχετικά με το πόσο κοντά στους στρατηγικούς της στόχους βρίσκεται. Είναι σύνηθες πολλά από τα μεγέθη που παρακολουθούνται να δίνουν μία ελλιπή εικόνα της κατάστασης του οργανισμού, καθώς δεν αντικατοπτρίζουν πάντα την πραγματική του κατάσταση. Υπάρχουν έρευνες που αναφέρουν ότι ένα μεγάλο ποσοστό στελεχών επιχειρήσεων τείνει να μη δίνει μεγάλο βάρος στις εν λόγω μετρήσεις λόγω της ασάφειας στους στόχους που ορίσθηκαν και η οποία οδηγεί σε παρακολούθηση μη σημαντικών δραστηριοτήτων και μέτρηση ακατάλληλων μεγεθών (Neely, Adams & Crowe, 2001). 3.1 Επιχειρησιακό περιβάλλον (Business Context) Οι δείκτες μέτρησης της απόδοσης (KPIs) βοηθούν ένα οργανισμό να προσδιορίσει και να μετρήσει την απόδοση σε σχέση με τους στόχους που έχει θέσει. Μόλις οργανισμός αναλύσει και προσδιορίσει τους στόχους του, θα πρέπει να μετρήσει την απόδοση του σε σχέση με τους στόχους αυτούς. Τα KPIs αποτελούν ένα τέτοιο 35

39 εργαλείο μέτρησης. Οι στρατηγικοί δείκτες μέτρησης απόδοσης μετατρέπονται σε μια σειρά από επιχειρησιακούς δείκτες σε όλο τον οργανισμό. Τα KPIs βοηθούν έναν οργανισμό να προσδιορίσει αν βρίσκεται μέσα στα όρια που έχει θέσει και ότι εργάζεται προς την κατεύθυνση και την επίτευξη ενός ουσιαστικού αποτελέσματος. Οι δείκτες μέτρησης αποτελεσμάτων (performance indicators) αποτελούν κρίσιμη έννοια στη διαδικασία της στοχοθεσίας, καθώς ο σαφής και εκ των προτέρων προσδιορισμός των επιδιωκόμενων στόχων οφείλει να περιλαμβάνει περιγραφή των αποτελεσμάτων και ασφαλή κριτήρια ή δείκτες επαλήθευσης. Χρησιμοποιούνται για να προσδιορίσουν ή να πιστοποιήσουν κάτι που δεν είναι άμεσα ορατό ή κατανοητό μέχρι την πλήρη ολοκλήρωσή του. Οι δείκτες συνήθως μεταφράζουν δεδομένα και στατιστικές σε σύντομη, περιεκτική πληροφόρηση που είναι κατανοητή και διαχέεται σε διαφορετικές ομάδες χρηστών. Κατά τη διαδικασία αυτή λοιπόν, αναγνωρίζονται και κατασκευάζονται δείκτες μέτρησης που παρέχουν τη δυνατότητα στο όργανο διοίκησης να παρακολουθεί την πρόοδο της εκάστοτε επιχείρησης σε σχέση με την επίτευξη των στόχων που έχουν τεθεί. Αποτελούν εργαλεία μέτρησης της οργανωτικής απόδοσης και διακρίνονται σε ποσοτικούς δείκτες, όταν με ποσοτικούς όρους εκτιμούν τις παρεχόμενες υπηρεσίες και τα προϊόντα της εκάστοτε οργάνωσης και σε ποιοτικούς, όταν εκτιμούν τις διαδικασίες παραγωγής των υπηρεσιών και προϊόντων και τα συνακόλουθα χαρακτηριστικά τους. Οι ποιοτικοί δείκτες εκφράζουν την ποιότητα των εργασιών που μετρώνται και η αποτύπωσή τους γίνεται με ποιοτικές διαβαθμίσεις (π.χ. καλά, μέτρια) και οι ποσοτικοί εκφράζουν το ποσοστό των ορθώς εκτελεσθέντων εργασιών και η αποτύπωσή τους γίνεται με αριθμούς. Στην πράξη, ωστόσο, δεν υφίσταται απόλυτη διάκριση μεταξύ ποσοτικών και ποιοτικών δεικτών, διότι μπορούν να χρησιμοποιηθούν ποσοτικοί δείκτες για ποιοτικού χαρακτήρα μετρήσεις (λ.χ. μονάδες παροχής υπηρεσιών υγείας). Καθώς οι ποσοτικοί δείκτες παρέχουν μια συνολικότερη εικόνα και παρέχουν τη δυνατότητα σύγκρισης με άλλους φορείς ή δράσεις του παρελθόντος, προτιμώνται σε σχέση με τους ποιοτικούς, οι οποίοι αποδεικνύονται πιο χρονοβόροι στη διαδικασία συλλογής, μέτρησης και ανάλυσης της πληροφορίας, ιδιαίτερα στα αρχικά στάδια και διακρίνονται για τον υποκειμενικό τους χαρακτήρα. 36

40 3.2 Δείκτες Μέτρησης Απόδοσης (Key Performance Indicators KPIs) Οι δείκτες μέτρησης απόδοσης είναι τόσο ποιοτικοί όσο και ποσοτικοί δείκτες που αναφέρονται στην απόδοση του οργανισμού σε σχέση με τους στρατηγικούς και λειτουργικούς στόχους που έχει θέσει. Αυτοί οι δείκτες αναλύονται σε βάθος και επιμερίζονται σε κάθε τμήμα και εργαζόμενο μιας εταιρείας ώστε να τεθούν οι κατάλληλοι στόχοι και να παρακολουθείτε η επίτευξη τους ανά τακτά χρονικά διαστήματα. Τα KPIs χρησιμοποιούνται για την παρακολούθηση των επιδόσεων μια επιχείρησης, ενός τμήματος, μιας υπηρεσίας όπως και μιας μεμονωμένης μηχανής. Βοηθούν επίσης στη διαμόρφωση της συμπεριφοράς των εργαζομένων στο εσωτερικό της εταιρείας. Πρέπει να είναι ευέλικτοι και να αντιπροσωπεύουν τους μεταβαλλόμενους στόχους του οργανισμού και να συνδέονται άμεσα με την κουλτούρα και την αξία του οργανισμού. Τα KPIs είναι ποσοτικοί και ποιοτικοί δείκτες που χρησιμοποιούνται για την αξιολόγηση της απόδοσης και της προόδου ενός οργανισμού σε σχέση με τους στόχους που έχει θέσει. Αυτά αναλύονται και καθορίζονται σαν στόχος απόδοσης στα τμήματα και τους εργαζόμενους ενός οργανισμού και αναθεωρούνται ανά τακτά χρονικά διαστήματα. Η προσέγγιση SMART αποτελεί ένα σύνολο κανόνων και κριτηρίων για το σχεδιασμό και θέσπιση στόχων. Ο όρος αρχικά αναφέρθηκε το 1981 από τον Doran. Η έννοια των κριτηρίων SMART μπορεί να συνοψιστεί σε ένα αρκτικόλεξο το οποίο έχει εξελιχθεί και προσαρμοστεί με την πάροδο του χρόνου. Οι δείκτες μέτρησης απόδοσης πρέπει να είναι «έξυπνοι» ή «smart» όπως φαίνεται από το παρακάτω ακρώνυμο: Specific Συγκεκριμένοι Measurable - Μετρήσιμοι Achievable Εφικτοί Relevant Σχετικοί Timely Χρονικά ορισμένοι 37

41 Specific Συγκεκριμένοι: Οι δείκτες μέτρησης πρέπει να είναι συγκεκριμένοι για την ατομική εργασία και να εκφράζονται σαν πραγματικές συμπεριφορές της πραγματικής εργασίας. Measurable Μετρήσιμοι: Οι δείκτες μέτρησης πρέπει να είναι μετρήσιμοι, να βασίζονται στη συμπεριφορά που μπορεί να παρατηρηθεί και να τεκμηριωθεί και να είναι σχετικοί με την εργασία που στοχεύει να μετρήσει. Achievable Εφικτοί: Η διαχείριση της απόδοσης ενός οργανισμού πρέπει να είναι μια ανοικτή, συνεργατική και επικοινωνιακή διαδικασία. Οι δείκτες πρέπει να είναι ρεαλιστικοί και εφικτοί. Relevant Σχετικοί: Είναι σημαντικό να είναι σχετικοί με το στόχο που έχουν σχεδιαστεί να μετρήσουν και να κατανοούνται πλήρως από κάθε ενδιαφερόμενο. Timely Χρονικά ορισμένοι: Πρέπει να έχουν ένα συγκεκριμένο χρονικό πλαίσιο μέτρησης και αναφοράς. Όπως είναι προφανές, οι κανόνες SMART αποτελούν ένα γενικό τρόπο σχεδιασμού κριτηρίων και όχι ένα στρατηγικό μοντέλο και γι αυτό στη μέγιστη πλειοψηφία των περιπτώσεων χρησιμοποιείται σε συνδυασμό με άλλες στρατηγικές μεθόδους και προσεγγίσεις όπως το Balanced Scorecard (Kaplan 1996). 3.3 Πρόσθετα χαρακτηριστικά Δεικτών Μέτρησης Απόδοσης Σύμφωνα με τη βιβλιογραφία υπάρχουν μερικά επιπρόσθετα χαρακτηριστικά που αφορούν τους δείκτες μέτρησης απόδοσης. Δεν είναι πάντα απαραίτητο να ικανοποιούνται όλα τα ακόλουθα χαρακτηριστικά για να είναι οι δείκτες χρήσιμοι και λειτουργικοί για τον οργανισμό. Με αυτό τον τρόπο ένα KPI μπορεί να είναι: Επικεντρωμένο σε μια υπηρεσία μεγάλης στρατηγικής σημασίας και αξίας αντί για μια μη κρίσιμη δραστηριότητα. Η επιλογή ενός λανθασμένου δείκτη μπορεί να οδηγήσει σε μια αντιπαραγωγική συμπεριφορά του οργανισμού. Αντιπροσωπευτικό και κατάλληλο για τον οργανισμό και τις επιχειρησιακές του επιδόσεις. 38

42 Ρεαλιστικό για να μπορεί να ταιριάζει με τους πιθανούς επιχειρησιακούς περιορισμούς και την αποδοτικότητα. Χρησιμοποιείται για τον προσδιορισμό τάσεων. Μπορεί να συγκριθεί με περισσότερα δεδομένα σε μεγάλο χρονικό διάστημα ώστε να εντοπιστούν επαναλαμβανόμενων τάσεων. Κατανοητό ώστε ο κάθε ενδιαφερόμενος εργαζόμενος να καταλάβει πως η συμπεριφορά και οι ενέργειες του μπορεί να επηρεάσουν την απόδοση του οργανισμού. Εγκεκριμένο ώστε όλοι οι ενδιαφερόμενοι να μοιράζονται την ευθύνη στην καθημερινή λειτουργία της επιχείρησης. Παρουσιάζεται σε επίσημη αναφορά για να είναι διαθέσιμοι σε όλους τους ενδιαφερόμενους. Αξιολογήσιμοι για να διασφαλίζεται ότι παραμένουν επίκαιροι. 3.4 Δημιουργία κατάλληλων Δεικτών (KPIs Creation) Οι δείκτες μέτρησης πρέπει να σχεδιάζονται με τέτοιο τρόπο ώστε: να υπάρχει μια βασική μέτρηση για τη δημιουργία ενός προτύπου αποδόσεων να υπάρχουν οι κατάλληλοι δείκτες για την παρακολούθηση της απόδοσης να υπάρχουν δείκτες που μπορούν να τονίσουν κάθε μεταβλητότητα Βασικός στόχος είναι να δημιουργηθεί ένα εύκολο στη χρήση αλλά ταυτόχρονα ακριβές σύστημα μέτρησης, που να περιέχει όσο το δυνατόν λιγότερους δείκτες. Πριν τη συλλογή των κατάλληλων δεδομένων για τη δημιουργία των δεικτών πρέπει να απαντηθούν τρεις βασικές ερωτήσεις: 1. Ποιος είναι ο σκοπός της συλλογής των συγκεκριμένων δεδομένων; 2. Μπορούν τα συγκεκριμένα δεδομένα να μας δώσουν αυτό που θέλουμε να μάθουμε; 3. Μπορούμε να ενεργήσουμε πάνω στα συγκεκριμένα δεδομένα που συλλέγουμε; 39

43 Στη συνέχεια παρουσιάζονται ενδεικτικά μερικά παραδείγματα δεικτών μέτρησης (KPIs) που αναφέρονται σε μια βιομηχανική επιχείρηση: Χρηματοοικονομικά Κόστος Έσοδα Παραδείγματα Δεικτών Μέτρησης Κόστος Υλικών Εργατικό Κόστος Λειτουργικό Κόστος Κόστος αποθέματος Κόστος υπερωριών Κόστος εγγυήσεων Κόστος Πωλήσεων Επιτόκιο προϊόντος Υπερανάληψης Αριθμός έργων που παραδόθηκαν μέσα σε συγκεκριμένα χρονικά όρια και κόστος Πωλήσεις Μεικτά κέρδη Απόδοση επένδυσης Κερδοφορία προϊόντος Πίνακας 7. Παραδείγματα δεικτών μέτρησης για Χρηματοοικονομικά Στο χώρο των επιχειρήσεων, το να διαλέξει κάποιος μια οπτική αναπαράσταση της απόδοσης μιας επιχείρησης, εξαρτάται σε πολύ μεγάλο βαθμό από την αποτελεσματικότητα των διαθέσιμων εργαλείων για τη διαχείριση της επιχειρησιακής απόδοσης. Για να είναι εφικτό κάτι τέτοιο, στη «καρδιά» όλων των εργαλείων αυτών βρίσκονται οι κατάλληλοι δείκτες μέτρησης απόδοσης (KPIs). Οι δείκτες αυτοί, αποτυπώνουν τόσο τη συνολική λειτουργία της εκάστοτε επιχείρησης όσο και την απόδοση και αποτελεσματικότητα των ξεχωριστών μονάδων μέσα στον οργανισμό, έτσι ώστε να βαδίζουν όλοι μαζί κάτω από τους ίδιους στόχους και στρατηγικές. Οι δείκτες αυτοί εμφανίζονται πάντα σαν το επίκεντρο για την επιχειρησιακή ολοκλήρωση, το συντονισμό και τη λειτουργική τυποποίηση. 40

44 Η επιλογή και ο ορισμός του κατάλληλου δείκτη μέτρησης απόδοσης (KPI) είναι μια δύσκολη διαδικασία που απαιτεί τη αξιοποίηση δεδομένων και πληροφοριών από πολλά πληροφοριακά συστήματα συνδυαστικά (π.χ. ERP, CRM, BPM). Είναι βέβαιο ότι πάντα θα υπάρχει το δίλλημα της επιλογής ενός συγκεκριμένου αριθμού δεικτών από τους εκατοντάδες ή ακόμα και χιλιάδες σε πολλές περιπτώσεις που βρίσκονται διαθέσιμοι στα συστήματα αυτά. Είναι δύσκολο να διαχωριστούν οι δείκτες μέτρησης απόδοσης μια επιχείρησης από τις απλές μεταβλητές που είναι καταχωρημένες στα συστήματα τους. Επίσης θεωρείται ιδιαίτερα κρίσιμο να διασφαλιστεί ότι υπάρχουν τα διαθέσιμα δεδομένα για να υποστηριχτούν τέτοιοι δείκτες και ότι οι δείκτες που θα επιλεχθούν θα αποτελούν σημαντικούς επιχειρησιακούς παράγοντες. Οι κύριοι δείκτες απόδοσης (KPI) είναι σημαντικά στοιχεία που χρησιμοποιούνται για την παρακολούθηση της απόδοσης με βάση τους επιχειρησιακούς στόχους. Οι δείκτες μετρούν την βελτίωση ή την επιδείνωση της απόδοσης μιας δραστηριότητας που παίζει σημαντικό ρόλο για την επιτυχημένη λειτουργία μιας επιχείρησης και διαφέρουν ανάλογα με την επιχείρηση. Για παράδειγμα, σε ένα κέντρο τηλεφωνικής εξυπηρέτησης, η έγκαιρη απάντηση στις κλήσεις των πελατών είναι μια σημαντική επιχειρησιακή δραστηριότητα. Σε αυτή τη περίπτωση, ένας δείκτης μπορεί να είναι ο «μέσος χρόνος απάντησης σε κλήσεις πελατών» με στόχο λιγότερο από ένα λεπτό. Οι δείκτες βασίζονται στους επιχειρησιακούς στόχους. Ο επιχειρηματικός στόχος είναι ποσοτικοποιήσιμος, μετρήσιμος και προσανατολισμένος στο αποτέλεσμα. Ο στόχος μετατρέπεται σε έναν δείκτη με τον οποίο ο οργανισμός είναι σε θέση να μετρήσει κάποια διάσταση της διεργασίας ως προς το στόχο που έχει τεθεί και το σύνολο των ευρών. Είναι αποδεκτό ότι κάθε επιχείρηση λειτουργεί με βασικό στόχο την επίτευξη κέρδους μέσα από την παροχή προϊόντων και υπηρεσιών. Για την επίτευξη αυτού του βασικού στόχου απαιτείται η ολοκλήρωση μιας σειράς διαδικασιών και δραστηριοτήτων που περιλαμβάνουν μεταξύ άλλων την παραγωγή, την μετατροπή, την μεταφορά και την πώληση των προϊόντων της. Για την υλοποίηση των διαδικασιών αυτών, είναι απαραίτητο να υπάρχουν τα κατάλληλα συστήματα τα οποία θα συνεισφέρουν στην αποδοτικότερη οργάνωση και λειτουργία τους. Σε αυτό το σημείο εισάγεται η έννοια της μέτρησης της απόδοσης η οποία συμβάλει στην 41

45 διαρκή εσωτερική ανασκόπηση και αναθεώρηση των επιχειρήσεων για τη βελτίωση της ανταγωνιστικότητας τους. Από τη στιγμή που μια επιχείρηση έχει καθορίσει το στρατηγικό πλάνο λειτουργίας της, του βασικούς στόχους της και έχει προσδιορίσει τους μετόχους, πελάτες και προμηθευτές με τους οποίους θα συνεργάζεται κρίνεται απαραίτητο να εφαρμόσει ένα σύστημα για την μέτρηση και την παρακολούθηση της πορείας της ως προς την υλοποίηση των στόχων και την μέτρηση της απόδοσης της. Οι βασικοί δείκτες μέτρησης απόδοσης είναι ένας τρόπος αποτελεσματικής μέτρησης της επίτευξης στόχων μιας επιχείρησης. Η συντριπτική πλειοψηφία των επιχειρήσεων χρησιμοποιεί μια μεγάλη ποικιλία από δείκτες που μπορούν να προσδιορίσουν ποσοτικά την αποδοτικότητα και την υλοποίηση της στρατηγικής του οργανισμού. Υπάρχει μια βασική ανάγκη να διασφαλιστεί ότι τα KPIs ορίζονται σαν διεπιχειρησιακά πρότυπα και για αυτό το λόγο θα πρέπει να απαντηθούν βασικά ερωτήματα, όπως είναι: 1. Τι θα πρέπει να μετρηθεί; 2. Πόσους δείκτες θα πρέπει να παρακολουθεί ένας οργανισμός; 3. Πόσο συχνά θα πρέπει να μετράει τους δείκτες ο οργανισμός; 4. Ποιος είναι υπεύθυνος για το κάθε δείκτη; 5. Πόσο σύνθετος θα πρέπει να είναι ο κάθε δείκτης; Είναι σημαντικό να διαβεβαιωθεί ότι οι δείκτες μέτρησης απόδοσης που θα επιλεχθούν θα πρέπει να αντικατοπτρίζουν τη στρατηγική και να είναι σύμφωνοι με το όραμα και τους στόχους του οργανισμού. Με άλλα λόγια, τα KPIs θα πρέπει να ξεκινούν από το επίπεδο του οράματος (vision) του οργανισμού και να ακολουθούν τη διαδρομή μέσα στον οργανισμό. Στην πυραμίδα στρατηγικής προσέγγισης που φαίνεται στο παρακάτω διάγραμμα, φαίνεται ο τρόπος που μεταφράζεται το επιχειρησιακό όραμα σε διάφορα KPIs μέσα από τα ενδιάμεσα στάδια της δημιουργίας στρατηγικής (strategy), στόχων (objectives) και κρίσιμων παραγόντων επιτυχίας (critical success factors), τους κρίσιμους δείκτες μέτρησης απόδοσης (key performance indicators) και των ενεργειών δράσης (action plan initiatives). 42

46 Γράφημα 13. Πυραμίδα στρατηγικής δημιουργίας KPIs Σε ένα τόσο δύσκολο και απαιτητικό περιβάλλον, πρέπει να γίνει κατανοητό ότι τα στελέχη και η διοίκηση της εκάστοτε επιχείρησης χρειάζονται μια ολοκληρωμένη και πρακτική αναφορά για τους δείκτες μέτρησης απόδοσης και την ποσοτικοποίηση των αποτελεσμάτων τους. Ένας δείκτης μέτρησης απόδοσης είναι ένα σύστημα μέτρησης που ποσοτικοποιεί μια τάση ή ένα χαρακτηριστικό (Abela et.al, 2004). Σε όλους τους κλάδους, οι επιχειρήσεις χρησιμοποιούν δείκτες για να εξηγήσουν επαναλαμβανόμενα μοτίβα και πρότυπα απόδοσης, να μοιραστούν διάφορα ευρήματα, να καταλάβουν τις αιτίες εμφάνισης διαφόρων φαινομένων και για να προβλέψουν την εμφάνιση μελλοντικών γεγονότων. Σε όλους τους τομείς των επιστημών και των επιχειρήσεων οι δείκτες μέτρησης απόδοσης βασίζονται στην αυστηρότητα και την αντικειμενικότητα. Καθιστούν δυνατή τη σύγκριση των παρατηρήσεων για όλες τις δυνατές περιοχές μελέτης και τις χρονικές περιόδους. Βασικό τους χαρακτηριστικό είναι Σύμφωνα με τους Ambler και Styles (1995) «Όταν κάποιος μπορεί να μετρήσει ποσοτικά αυτό για το οποίο μιλάει και να το εκφράσει με αριθμούς, τότε μπορεί να γνωρίζει κάτι για αυτό. Όταν όμως δεν μπορεί να το μετρήσει ποσοτικά, και δεν μπορεί να το εκφράσει με αριθμούς, τότε η γνώση είναι μη ικανοποιητική». 43

47 Ο βρετανός φυσικός, λόρδος Kelviν, που ήταν υπεύθυνος για την εγκατάσταση του πρώτου υπερατλαντικού καλωδίου ήταν ένας από τους μεγαλύτερους υποστηρικτές της ποσοτικής έρευνας. Στην εποχή του, η μαθηματική ακρίβεια δεν είχε διαδοθεί ευρέως πέρα από τον χώρο των επιστημών, της μηχανικής και των οικονομικών. Στη σημερινή εποχή, αντίθετα, η αριθμητική και υπολογιστική ικανότητα αποτελεί ένα σημαντικό προσόν για κάθε επιχειρησιακό στέλεχος. Οι επιχειρήσεις θα πρέπει να ποσοτικοποιούν τις ευκαιρίες της αγοράς και τις απειλές του ανταγωνισμού. Θα πρέπει να αιτιολογούν ποσοτικά τα χρηματοοικονομικά ρίσκα, όπως και τα οφέλη από την υλοποίηση των αποφάσεων τους. Τα στελέχη των επιχειρήσεων θα πρέπει με τους κατάλληλους αριθμητικούς υπολογισμούς να αξιολογούν τα πιθανά σχέδια, να εξηγούν τις αποκλίσεις που μπορεί να προκύπτουν, να κρίνουν την επιχειρησιακή απόδοση και να μπορούν να εντοπίζουν πιθανά σημεία προς βελτίωση. Αυτές οι υπευθυνότητες απαιτούν ισχυρή ικανότητα ελέγχου των υπολογισμών, των συστημάτων και των μαθηματικών τύπων που τους παράγουν. Στο χώρο των επιχειρήσεων, τα στελέχη επιλέγουν, υπολογίζουν και εξηγούν τα αποτελέσματα βασικών δεικτών μέτρησης. Πρέπει να καταλαβαίνουν με πιο τρόπο είναι κατασκευασμένο το καθένα από αυτά και πως μπορεί να χρησιμοποιηθεί στη διαδικασία λήψης μιας απόφασης. Δυο από τις βασικότερες απόψεις στελεχών επιχειρήσεων αναφέρουν ότι: α) «κάθε δείκτης μέτρησης είτε χρησιμοποιείται ρητά για να επηρεάσει τη συμπεριφορά, είτε για να αξιολογήσει μελλοντικές αποφάσεις ή για να γίνει ένας απολογισμός στο τέλος θα επηρεάσει τις δράσεις και τις αποφάσεις της επιχείρησης (Barwise & Farley 2003)» και β) «αν δεν μπορείς να μετρήσεις κάτι, δεν μπορείς ούτε να το διαχειριστείς (Clark et al., 2004)». Οι αριθμητικοί υπολογισμοί αντιπροσωπεύουν και μια πρόκληση για τις σύγχρονες επιχειρήσεις, καθώς πολλοί δείκτες μετρήσεις είναι δύσκολο και πολύπλοκο να διαχειριστούν. Μερικοί δείκτες είναι πολύ εξειδικευμένοι και ταιριάζουν καλύτερα σε συγκεκριμένες αναλύσεις και άλλοι απαιτούν προσεγγιστικούς υπολογισμούς καθώς μπορεί να είναι ελλιπής ή μη διαθέσιμοι. Σε τέτοιες συνθήκες, είναι πιθανό να μη είναι τέλειοι όλοι οι δείκτες μέτρησης. Με τη χρήση πολλαπλών δεικτών μέτρησης, πρέπει να υπολογίζονται οι σχέσεις μεταξύ τους και οι περιορισμοί που συνδέονται με τον κάθε ένα χωριστά. Οι δείκτες 44

48 μέτρησης που ορίζονται μαθηματικά και διαδίδονται ευρέως μπορούν να γίνουν μέρος μιας ακριβής και λειτουργικής γλώσσας επικοινωνίας μέσα στα πλαίσια ενός οργανισμού. Μια μεγάλη πρόκληση που αφορά τους δείκτες μέτρησης αφορά τις μεγάλες διακυμάνσεις στη διαθεσιμότητα των δεδομένων μεταξύ των επιχειρησιακών κλάδων και των γεωγραφικών περιοχών. 3.5 Παραδείγματα KPIs ανά επιχειρησιακό κλάδο Μετά από σχετική έρευνα σε τρεις βασικούς κλάδους της οικονομίας, εντοπίστηκαν και καταγράφηκαν οι βασικότεροι δείκτες που παρακολουθούνται από τους εκάστοτε οργανισμούς. Συνήθως πολλοί από τους δείκτες είναι αποτέλεσμα αθροισμάτων (sum), μέσων όρων (average), ποσοστών (ratios), διαφορών (delta) και ποσοστιαίων μεταβολών (% variance) μεταβλητών μέσα σε συγκεκριμένα χρονικά διαστήματα. Οι κλάδοι που επιλέχθηκαν είναι οι Εταιρείες Πώλησης Προϊόντων Λιανικής, οι Εταιρείες Τηλεπικοινωνιών και οι Τραπεζικοί Οργανισμοί Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail) Σε μια Εταιρεία Πώλησης Προϊόντων Λιανικής είναι πολύ σημαντικό να καταγράφονται όλες οι συναλλαγές που πραγματοποιούν οι πελάτες στο σημείο πώλησης (Point of Sale - POS) με τέτοιο τρόπο ώστε να μπορούν να απαντηθούν τα παρακάτω ερωτήματα: Τι αγοράστηκε; Αναφέρεται στο μοναδικό κωδικό πώλησης του εκάστοτε προϊόντος (Universal Product Code - UPC). Πότε αγοράστηκε; Ακριβής ημερομηνία και ώρα της εκάστοτε συναλλαγής. Που αγοράστηκε; Αναφέρεται στο κατάλληλο κανάλι πώλησης ενός προϊόντος (π.χ. κατάστημα, τμήμα καταστήματος, ηλεκτρονικό κατάστημα). Πως αγοράστηκε; Αναφέρεται στο τρόπο πληρωμής του προϊόντος που αγοράστηκε (π.χ. με μετρητά, πιστωτική κάρτα, εκπτωτικά κουπόνια). 45

49 Το σύνολο της πληροφορίας που περιέχεται στις βάσεις δεδομένων κάθε εταιρείας πώλησης προϊόντων λιανικής, θα πρέπει να μπορεί να προσδιορίσει την κάθε συναλλαγή που έχει πραγματοποιηθεί σε βάθος ενός αξιόλογου χρονικού διαστήματος και θα πρέπει να περιέχει, το λιγότερο, τις ακόλουθες διαστάσεις: Κοινωνικό δημογραφικά χαρακτηριστικά του κάθε πελάτη που συλλέγονται κατά τη διάρκεια της εγγραφής του στο πρόγραμμα επιβράβευσης συναλλαγών. Η αξία της κάθε συναλλαγής Αξία αγορών ανά κατηγορία και υποκατηγορία προϊόντος Ημερομηνία τελευταίας συναλλαγής κάθε πελάτη Προτιμώμενα καταστήματα / τμήματα καταστημάτων για αγορές Αριθμός συναλλαγών σε συγκεκριμένη χρονική περίοδο Αριθμός ημερών με συναλλαγή σε συγκεκριμένη χρονική περίοδο Τρόπος πληρωμής (π.χ. μετρητά, πιστωτική κάρτα) και κανάλι πληρωμής (π.χ. στο κατάστημα, μέσω διαδικτύου) της εκάστοτε συναλλαγής Χρήση προσφοράς από προσωπική καμπάνια Ημερομηνίες και ώρες εκάστοτε συναλλαγής Χρήση εκπτωτικών κουπονιών και πόντων ανταμοιβής συναλλαγών Καταγεγραμμένα παράπονα και το αποτέλεσμα του χειρισμού αυτών Στη συνέχεια παρουσιάζεται μια αναλυτική λίστα με συγκεκριμένους δείκτες που ενδιαφέρουν μια Εταιρεία Πώλησης Προϊόντων Λιανικής. KPI Συνολικός αριθμός πληρωμών με πιστωτική κάρτα τη τελευταία χρονιά για κάθε πελάτη Συνολικός αριθμός πληρωμών με εκπτωτικά κουπόνια τη τελευταία χρονιά για κάθε πελάτη Συνολικός αριθμός πληρωμών με μετρητά τη τελευταία χρονιά για κάθε πελάτη Συνολικός αριθμός επισκέψεων κάθε πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά KPI Συνολικό ετήσιο ποσό αγορών με μετρητά Συνολικό ετήσιο ποσό αγορών με πιστωτική κάρτα Συνολικό ετήσιο ποσό αγορών με εκπτωτικά κουπόνια Συνολικό ετήσιο ποσό αγορών με εξαργύρωση πόντων ανταμοιβής 46

50 Συνολικός αριθμός προϊόντων που αποκτήθηκαν από πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά Συνολικό ποσό που δαπανήθηκε για αγορές προϊόντων για κάθε πελάτη τη τελευταία χρονιά Ημερομηνία τελευταίας συναλλαγής πελάτη από οποιοδήποτε κατάστημα Κάτοχος κάρτας μέλους Μέσος μηνιαίος αριθμός επισκέψεων κάθε πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός προϊόντων που αποκτήθηκαν από πελάτη σε όλα τα καταστήματα τη τελευταία χρονιά Μέσος μηνιαίο ποσό που δαπανήθηκε για αγορές προϊόντων για κάθε πελάτη τη τελευταία χρονιά Κατασκευαστής προϊόντος Ιεραρχική ομάδα που ανήκει το προϊόν Ιεραρχική υποομάδα που ανήκει το προϊόν Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν τις πρωινές ώρες 08:00-12:00 την τελευταία χρονιά Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν μέσα σε σαββατοκύριακο την τελευταία χρονιά Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν τηλεφωνικά την τελευταία χρονιά Συνολικό ποσό συναλλαγών που πραγματοποιήθηκαν από το διαδίκτυο την τελευταία χρονιά Συνολικό ποσό συναλλαγών που Συνολική ετήσιο ποσό αγορών ανά πελάτη Συνολικός ετήσιος αριθμός αγορών ανά πελάτη Συνολικό ετήσιο ποσό αγορών σε επώνυμα προϊόντα Συνολικό ετήσιο ποσό αγορών σε προϊόντα ιδιωτικής ετικέτας Συνολικός ετήσιος αριθμός αγορών σε επώνυμα προϊόντα Συνολικός ετήσιος αριθμός αγορών σε προϊόντα ιδιωτικής ετικέτας Ποσό πληρωτέο για είδη ένδυσης Ποσό πληρωτέο για είδη υπόδησης Ποσό πληρωτέο για είδη υπόδησης Ποσό πληρωτέο για κοσμήματα Ποσό πληρωτέο για βρεφικά είδη Ποσό πληρωτέο για ηλεκτρονικά είδη Ποσό πληρωτέο για ηλεκτρονικού υπολογιστές Ποσό πληρωτέο για προϊόντα σίτισης Ποσό πληρωτέο για προϊόντα κρασιού 47

51 πραγματοποιήθηκαν στα καταστήματα την τελευταία χρονιά Τελευταία ημερομηνία επίσκεψης πελάτη σε οποιοδήποτε κατάστημα Συνολικός αριθμός συναλλαγών σε όλα τα καταστήματα την τελευταία χρονιά Συνολικός αριθμός καταστημάτων που επισκέφτηκε τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν τις πρωινές ώρες 08:00-12:00 την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν μέσα σε σαββατοκύριακο την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν τηλεφωνικά την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν από το διαδίκτυο την τελευταία χρονιά Συνολικός αριθμός συναλλαγών που πραγματοποιήθηκαν στα καταστήματα την τελευταία χρονιά Μέσος αριθμός προϊόντων που αγοράζονται ανά επίσκεψη Μέσο ποσό που ξοδεύεται ανά επίσκεψη Μέσο ποσό που ξοδεύεται σε προϊόντα προσφοράς ανά επίσκεψη Ποσό πληρωτέο για προϊόντα ομορφιάς Ποσό πληρωτέο για προϊόντα υγείας Ποσό πληρωτέο για φαρμακευτικά προϊόντα Ποσό πληρωτέο για αθλητικά προϊόντα Ποσό πληρωτέο για βιβλία Ποσό πληρωτέο για εφημερίδες Ποσό πληρωτέο για περιοδικά Ποσό πληρωτέο για μουσική Ποσό πληρωτέο για ταινίες Ποσό πληρωτέο για παιχνίδια Ποσό πληρωτέο για οικιακά προϊόντα Ποσό πληρωτέο για βιντεοπαιχνίδια Πίνακας 8. Ενδεικτικά KPIs Εταιρειών Πώλησης Προϊόντων Λιανικής Στη συνέχεια παρουσιάζεται μια ενδεικτική λίστα με μερικά παραδείγματα σύνθετων KPIs που αναφέρονται σε Εταιρείες Πώλησης Προϊόντων Λιανικής: 48

52 Μέσο ποσό συναλλαγής σε κάθε επίσκεψη σε κατάστημα τη τελευταία χρονιά Μέσος αριθμός αγοράς προϊόντων σε κάθε επίσκεψη σε κατάστημα τη τελευταία χρονιά Ποσοστό του συνολικού ποσού αγορών που αφορά προϊόντα ιδιωτικής ετικέτας Ποσοστό του συνολικού ποσού αγορών που αφορά προϊόντα επώνυμης ετικέτας Μέσος χρόνος που μεσολαβεί μεταξύ δύο συνεχόμενων επισκέψεων σε κατάστημα για αγορά ανά πελάτη Ποσοστό ποσού αγορών για κάθε κατηγορία προϊόντων το τελευταίο μήνα Μέσος μηνιαίος αριθμός επισκέψεων σε κατάστημα τη τελευταία χρονιά Μέσος αριθμός μοναδικών προϊόντων/κατηγοριών προϊόντων που αγοράστηκαν Ένδειξη αγοράς προϊόντων με τη χρήση του διαδικτύου Εταιρεία Τηλεπικοινωνιών (Telecommunications) Οι βασικοί δείκτες απόδοσης που χρησιμοποιούνται στις Εταιρείες Τηλεπικοινωνιών βασίζονται στους παρακάτω βασικούς άξονες χαρακτηριστικών: Πληροφορίες σχετικά με την κίνηση των συμβολαίων, τον αριθμό και τη διάρκεια των κλήσεων ανά κατηγορία κλήσεων, δίκτυο επικοινωνίας και πηγή επικοινωνίας Κοινωνικό δημογραφικά χαρακτηριστικά του κάθε πελάτη Πληροφορίες σχετικά με το είδος των συνδέσεων του κάθε πελάτη Εξερχόμενες κλήσεις για την αναγνώριση εξερχόμενων προτύπων επικοινωνίας Εισερχόμενες κλήσεις για την αναγνώριση εισερχόμενων προτύπων επικοινωνίας Κάτοχος προπληρωμένης κάρτας ή συμβολαίου (περιλαμβανομένου και αλλαγές μεταξύ αυτών) 49

53 Χρεώσεις, πληρωμές και πιστωτικό ιστορικό πελάτη Οικονομικές πληροφορίες σχετικές με κερδοφορία από τη χρήση κάθε πελάτη καθώς και κόστος χρήσης Αγορά περιφερειακών προϊόντων σχετικά με τα κινητά (π.χ. hands free, Bluetooth) Χρήση επιπρόσθετων υπηρεσιών (π.χ. νέα, μουσική, παιχνίδια) Ανταπόκριση σε καμπάνιες και προσφορές Αριθμός παραπόνων και επίλυση αυτών Στη συνέχεια παρουσιάζεται μια αναλυτική λίστα με συγκεκριμένους δείκτες που ενδιαφέρουν μια Εταιρεία Τηλεπικοινωνιών. KPI Μέση διάρκεια εξερχόμενων κλήσεων τη τελευταία χρονιά Ποσό το οποίο χρεώθηκε στο λογαριασμό για κάθε υπηρεσία χρήσης Αποτέλεσμα εξερχόμενης κλήσης (π.χ. απασχολημένο, απάντηση κλήσης) Λόγος τερματισμού συμβολαίου (π.χ. οικειοθελής αποχώρηση, μεταφορά, κόστος υπηρεσιών) Μηνιαίο κόστος προγράμματος χρήσης Μηνιαία λεπτά χρήσης που προσφέρονται από το πρόγραμμα Μηνιαίος αριθμός μηνυμάτων (SMS) που KPI Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων 50

54 προσφέρονται από το πρόγραμμα Μηνιαίος αριθμός εικονογραφημένων μηνυμάτων (MMS) που προσφέρονται από το πρόγραμμα Μηνιαία χρήση δεδομένων (data) που προσφέρονται από το πρόγραμμα Διάρκεια συνεργασίας πελάτη με εταιρεία Πληρωμή λογαριασμών με μετρητά Πληρωμή λογαριασμών με πιστωτική κάρτα Είδος προγράμματος χρήσης (προπληρωμένη κάρτα, συμβόλαιο) Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων τη τελευταία χρονιά Μέσος μηνιαίος αριθμός αποστολής μηνυμάτων (SMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός αποστολής εικονογραφημένων μηνυμάτων (MMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός χρήσης διαδικτύου τη τελευταία χρονιά Μέσος μηνιαίος αριθμός χρήσης ηλεκτρονικού ταχυδρομείου τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων στο τμήμα εξυπηρέτησης πελατών τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων τη κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων 51

55 τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων τη τελευταία χρονιά Μέσος μηνιαίος αριθμός λήψης μηνυμάτων (SMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός λήψης εικονογραφημένων μηνυμάτων (MMS) τη τελευταία χρονιά Μέσος μηνιαίος αριθμός ημερών με εισερχόμενες κλήσεις τη τελευταία χρονιά Μέσος μηνιαίος αριθμός ημερών με εξερχόμενες κλήσεις τη τελευταία χρονιά Συνολικός αριθμός εξερχόμενων εικονογραφημένων μηνυμάτων τη τελευταία χρονιά Συνολικός αριθμός εξερχόμενης αποστολής δεδομένων GPRS τη τελευταία χρονιά Συνολική διάρκεια εισερχόμενων κλήσεων τη τελευταία χρονιά Συνολική διάρκεια εξερχόμενων κλήσεων τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων τη τελευταία χρονιά κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον το ίδιο δίκτυο τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον ανταγωνιστή Α τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον ανταγωνιστή Β τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από τον ανταγωνιστή Γ τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από σταθερές γραμμές τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από διεθνή δίκτυα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων από δίκτυα περιαγωγής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία 52

56 χρονιά Συνολικά έσοδα από εξερχόμενη χρήση τη τελευταία χρονιά Συνολικά έσοδα από εξερχόμενη χρήση τη τελευταία χρονιά Οριακό μέσο έσοδο για κάθε χρήστη τη τελευταία χρονιά (MARPU) Μέσο έσοδο για κάθε χρήστη τη τελευταία χρονιά (ARPU) Δείκτης αξίας πελάτη Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εισερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εξερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία χρονιά Μέσος μηνιαίος αριθμός εισερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε ώρες αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε ώρες μη αιχμής τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε εργάσιμη μέρα τη τελευταία χρονιά Μέση μηνιαία διάρκεια εξερχόμενων κλήσεων σε μη εργάσιμη μέρα τη τελευταία χρονιά Πίνακας 9. Ενδεικτικά KPIs Εταιρείας Τηλεπικοινωνιών Στη συνέχεια παρουσιάζεται μια ενδεικτική λίστα με μερικά παραδείγματα σύνθετων KPIs που αναφέρονται σε Εταιρείες Τηλεπικοινωνιών: Ποσοστό αριθμού αποστολής μηνυμάτων σε σχέση με τον αριθμό εξερχόμενων κλήσεων Ποσοστό εξερχόμενων κλήσεων στο ίδιο δίκτυο Ποσοστό εξερχόμενων κλήσεων σε ανταγωνιστικό δίκτυο Ποσοστό εξερχόμενων τηλεφωνημάτων σε εργάσιμη μέρα 53

57 Ποσοστό συνολικών εξερχόμενων κλήσεων που πραγματοποιήθηκαν στους τρεις πιο συχνά καλούμενου αριθμούς Ποσοστό συνόλου εξερχόμενων κλήσεων με διάρκεια μικρότερης του ενός λεπτού Ποσοστιαία μεταβολή αριθμού εξερχόμενων κλήσεων του τελευταίου τριμήνου σε σχέση με το προηγούμενο τρίμηνο Ποσοστιαία μεταβολή αριθμού εξερχόμενων μηνυμάτων του τελευταίου τριμήνου σε σχέση με το προηγούμενο τρίμηνο Δείκτης συνολικών εξερχόμενων κλήσεων προς εισερχόμενες Αριθμός μηνών που πραγματοποιήθηκαν συνομιλίες με περιαγωγή το τελευταίο χρόνο Αριθμός διαφορετικών ειδών υπηρεσιών που χρησιμοποιούνται Ένδειξη χρήσης διαδικτύου Ποσοστό αριθμού συμβολαίων που έχει αλλάξει ο πελάτης σε σχέση με τη διάρκεια που συνεργάζεται με την εταιρεία Τραπεζικός Οργανισμός (Banking) Οι βασικοί δείκτες απόδοσης που χρησιμοποιούνται στους Τραπεζικούς Οργανισμούς βασίζονται στους παρακάτω βασικούς άξονες χαρακτηριστικών: Κοινωνικό δημογραφικά χαρακτηριστικά του κάθε πελάτη. Μείγμα προϊόντων και χρήση προϊόντων μα βάση το υπόλοιπο του χαρτοφυλακίου του κάθε πελάτη μέσα σε κάποια χρονική περίοδο. Συχνότητα και ποσό συναλλαγών ανά κατηγορία προϊόντος (π.χ. πιστωτική κάρτα, χρεωστική) και κανάλι χρήσης των προϊόντων (π.χ. ATM, Κατάστημα). Πιστωτικό σκορ κάθε πελάτη και ιστορικό καθυστέρησης πληρωμών. Αριθμός επαφών και ανταποκρίσεων σε προσφερόμενες καμπάνιες. Καταγεγραμμένα παράπονα ανά πελάτη. Ενεργή και ιστορική κατάσταση κάθε πελάτη (π.χ. ενεργός, ανενεργός). Η συχνότητα και η ποσότητα των αγορών για κάθε είδος προϊόντος. 54

58 Πληροφορία σχετική με την κερδοφορία του εκάστοτε πελάτη από το επενδυμένο κεφάλαιο του. Κατηγοριοποίηση πελάτη και ιστορική μετάβαση μεταξύ των κατηγοριών (π.χ. επιχειρηματίας, άνεργος, δημόσιος υπάλληλος). Επίπεδο ικανοποίησης πελάτη από παρεχόμενες υπηρεσίες. Επίπεδο ικανοποίησης από συνεργασία με τραπεζικούς υπαλλήλους. Ένδειξη ρύθμισης οφειλών κατά τη διάρκεια της τελευταίας χρονιάς. Στη συνέχεια παρουσιάζεται μια αναλυτική λίστα με συγκεκριμένους δείκτες που ενδιαφέρουν ένα Τραπεζικό Οργανισμό. KPI Τρέχων αριθμός λογαριασμών αποταμίευσης Τρέχων αριθμός λογαριασμών αποταμίευσης Τρέχων αριθμός προθεσμιακών καταθέσεων Τρέχων αριθμός μετοχικών αμοιβαίων κεφαλαίων Τρέχων αριθμός ομολογιακών αμοιβαίων κεφαλαίων Τρέχων αριθμός αμοιβαίων κεφαλαίων διαχείρισης διαθεσίμων Τρέχων αριθμός ομολόγων Τρέχων αριθμός μετοχών Τρέχων αριθμός ασφαλιστικών προϊόντων Τρέχων αριθμός συνταξιοδοτικών προϊόντων Τρέχων αριθμός προϊόντων KPI Αριθμός καταθέσεων σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Αριθμός καταθέσεων σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Αριθμός αναλήψεων χρημάτων κατά την τελευταία χρονιά Αριθμός πληρωμών σε πιστωτικές κάρτες κατά την τελευταία χρονιά Αριθμός πληρωμών σε καταναλωτικά δάνεια κατά την τελευταία χρονιά Αριθμός πληρωμών σε στεγαστικά δάνεια κατά την τελευταία χρονιά Αριθμός πληρωμών σε επιχειρηματικά δάνεια κατά την τελευταία χρονιά Αριθμός πληρωμών σε ασφαλιστικά προϊόντα κατά την τελευταία χρονιά Αριθμός πληρωμών σε δημόσιες υπηρεσίες κατά την τελευταία χρονιά Αριθμός πληρωμών σε τηλεπικοινωνιακούς παρόχους κατά την τελευταία χρονιά Αριθμός πληρωμών σε παρόχους διαδικτύου κατά 55

59 ασφάλισης υγείας Τρέχων αριθμός προϊόντων γενικής ασφάλισης Τρέχων αριθμός επιχειρηματικών δανείων Τρέχων αριθμός επιχειρηματικών λογαριασμών Τρέχων αριθμός επιχειρηματικών προϊόντων Τρέχων αριθμός στεγαστικών δανείων Τρέχων αριθμός δανείων εξασφάλισης κατοικίας Τρέχων αριθμός δανείων αυτοκινήτων Τρέχων αριθμός προσωπικών δανείων Τρέχων αριθμός φοιτητικών δανείων Τρέχων αριθμός δανείων ρύθμισης οφειλών Τρέχων αριθμός χρεωστικών καρτών Τρέχων αριθμός πιστωτικών καρτών Τρέχων αριθμός προπληρωμένων καρτών Τρέχων ποσό λογαριασμών αποταμίευσης Τρέχων ποσό λογαριασμών αποταμίευσης Τρέχων ποσό προθεσμιακών την τελευταία χρονιά Αριθμός μεταφορών χρημάτων σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Αριθμός μεταφορών χρημάτων σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Ποσό μεταφορών σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Ποσό μεταφορών σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Ποσό καταθέσεων σε λογαριασμούς του ίδιου πελάτη κατά την τελευταία χρονιά Ποσό καταθέσεων σε λογαριασμούς άλλου πελάτη κατά την τελευταία χρονιά Ποσό αναλήψεων χρημάτων κατά την τελευταία χρονιά Ποσό πληρωμών σε πιστωτικές κάρτες κατά την τελευταία χρονιά Ποσό πληρωμών σε καταναλωτικά δάνεια κατά την τελευταία χρονιά Ποσό πληρωμών σε στεγαστικά δάνεια κατά την τελευταία χρονιά Ποσό πληρωμών σε επιχειρηματικά δάνεια κατά την τελευταία χρονιά Ποσό πληρωμών σε ασφαλιστικά προϊόντα κατά την τελευταία χρονιά Ποσό πληρωμών σε δημόσιες υπηρεσίες κατά την τελευταία χρονιά Ποσό πληρωμών σε τηλεπικοινωνιακούς παρόχους κατά την τελευταία χρονιά Ποσό πληρωμών σε παρόχους διαδικτύου κατά την τελευταία χρονιά Συνολικό ποσό μεταφοράς σε λογαριασμούς της 56

60 καταθέσεων Τρέχων ποσό μετοχικών αμοιβαίων κεφαλαίων Τρέχων ποσό ομολογιακών αμοιβαίων κεφαλαίων Τρέχων ποσό αμοιβαίων κεφαλαίων διαχείρισης διαθεσίμων Τρέχων ποσό ομολόγων Τρέχων ποσό μετοχών Τρέχων ποσό ασφαλιστικών προϊόντων Τρέχων ποσό συνταξιοδοτικών προϊόντων Τρέχων ποσό προϊόντων ασφάλισης υγείας Τρέχων ποσό προϊόντων γενικής ασφάλισης Τρέχων ποσό επιχειρηματικών δανείων Τρέχων ποσό επιχειρηματικών λογαριασμών Τρέχων ποσό επιχειρηματικών προϊόντων Τρέχων ποσό στεγαστικών δανείων Τρέχων ποσό δανείων εξασφάλισης κατοικίας Τρέχων ποσό δανείων αυτοκινήτων Τρέχων ποσό προσωπικών δανείων Τρέχων ποσό φοιτητικών δανείων ίδιας τράπεζας την τελευταία χρονιά Συνολικό ποσό μεταφοράς σε λογαριασμούς άλλων τραπεζών την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών σε κατάστημα κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών σε ΑΤΜ κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών μέσω e- banking κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών μέσω phonebanking κατά την τελευταία χρονιά Μέσος μηνιαίος αριθμός συναλλαγών μέσω SMS κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών σε κατάστημα κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών σε ΑΤΜ κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών μέσω e-banking κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών μέσω phonebanking κατά την τελευταία χρονιά Μέσο μηναίο ποσό συναλλαγών μέσω SMS κατά την τελευταία χρονιά Ετήσια συνολικά έσοδα που προκύπτουν για κάθε πελάτη Ετήσιο συνολικό κόστος που προκύπτει για κάθε πελάτη Μεγαλύτερος αριθμός μηνών καθυστέρησης για το σύνολο των πιστωτικών προϊόντων του πελάτη Συνολικό υπόλοιπο σε χρεωστικές κάρτες Συνολικό υπόλοιπο σε πιστωτικές κάρτες Συνολικό υπόλοιπο σε προπληρωμένες κάρτες 57

61 Τρέχων ποσό δανείων ρύθμισης οφειλών Τρέχων ποσό χρεωστικών καρτών Τρέχων ποσό πιστωτικών καρτών Διαθέσιμος λογαριασμός μισθοδοσίας Τρέχων ποσό προπληρωμένων καρτών Πίνακας 10. Ενδεικτικά KPIs Τραπεζικού Οργανισμού Στη συνέχεια παρουσιάζεται μια ενδεικτική λίστα με μερικά παραδείγματα σύνθετων KPIs που αναφέρονται σε Τραπεζικούς Οργανισμούς: Ποσοστό συνολικών αποταμιεύσεων σε σχέση με το συνολικό ποσού δανεισμού. Ποσοστό επενδυμένου κεφαλαίου σε προϊόντα υψηλού κινδύνου. Ποσοστό πληρωμών πιστωτικών καρτών σε σχέση με το συνολικό υπόλοιπο πιστωτικών καρτών. Ποσοστό χρησιμοποιημένου ποσού σε σχέση με το πιστωτικό όριο. Αριθμός μηνών που βρίσκεται ένα πιστωτικό προϊόν σε καθυστέρηση πληρωμής μιας δόσης. Μέγιστος αριθμός καθυστερημένων δόσεων σε όλα τα πιστωτικά προϊόντα κάθε πελάτη. Δείκτης χρήσης εναλλακτικών καναλιών (π.χ. Phone-banking, e-banking). Αριθμός διαφορετικών καναλιών που χρησιμοποιούνται από κάθε πελάτη. Αριθμός διαφορετικών κατηγοριών προϊόντων που κατέχει κάθε πελάτης. Μεταβολή ικανοποίησης προσφερόμενων υπηρεσιών σε σχέση με προηγούμενη χρονιά. Μήνες με υπόλοιπο λογαριασμού μικρότερο από συγκεκριμένο ποσό. Μεταβολή συνολικού ποσού αποταμίευσης του τελευταίου εξαμήνου σε σχέση με το προηγούμενο. 58

62 4. Δημιουργία Αξίας (Value Creation from Analytics) Σε κάθε επιχειρηματικό κλάδο, τα ανώτερα στελέχη προσπαθούν να εξασφαλίσουν ότι λαμβάνουν και αξιοποιούν την μέγιστη αξία που θα μπορούσαν από τις τεράστιες ποσότητες δεδομένων που έχουν διαθέσιμες μέσα στους οργανισμούς τους. Παρά το γεγονός ότι η χρήση νέων τεχνολογιών έχει συμβάλει καθοριστικά στη συλλογή περισσότερων δεδομένων, οι οργανισμοί ρίχνουν μεγάλο βάρος στην εξεύρεση καλύτερων τρόπων για να αποκτήσουν γνώση και αξία από τη διαχείριση των δεδομένων τους έτσι ώστε να μπορέσουν να αποκτήσουν ανταγωνιστικό πλεονέκτημα στην αγορά (Cherkassky 2007). Στην άκρως απαιτητική αγορά που δραστηριοποιούνται οι περισσότεροι οργανισμοί, όλο και περισσότεροι επιδιώκουν την άμεση, έγκαιρη και ακριβέστερη πληροφόρηση με τη κατάλληλη επιχειρησιακή γνώση. Οι οργανισμοί αυτοί έχουν αντιληφθεί ότι πρέπει να ερμηνεύσουν τις όποιες ενδείξεις από την οικονομία, την αγορά, τους πελάτες και τους συνεργάτες τους. Δεν αρκεί πλέον να μπορούν να αξιολογήσουν το παρελθόν, αλλά θα πρέπει να αξιοποιήσουν όλα τα διαθέσιμα δεδομένα και τις πηγές πληροφόρησης για να μπορέσουν να καταλάβουν την παρούσα κατάσταση τους και να μπορέσουν να υπολογίσουν τι είναι πιθανό να συμβεί στο άμεσο μέλλον και τι ενέργειες θα πρέπει να κάνουν για να αποκτήσουν τα βέλτιστα αποτελέσματα. Για να αντιληφθούν οι οργανισμοί την δυνατότητα χρήσης της πληροφόρησης και των προχωρημένων τεχνικών ποσοτικών αναλύσεων, το MIT σε συνεργασία με την IBM διεξήγαγε μια έρευνα σε περίπου 3,000 ανώτερα και μεσαία στελέχη οργανισμών και κατέληξε σε μερικά πολύ σημαντικά συμπεράσματα (MIT and IBM 2010). Το πιο σημαντικό από αυτά είναι ότι οι οργανισμοί με τη μεγαλύτερη απόδοση (top performers) χρησιμοποιούν μεθόδους αναλύσεων δεδομένων (analytics) 5 φορές περισσότερο από τους οργανισμούς με μικρότερη απόδοση (lower performers). Συνολικά, από τη συγκεκριμένη μελέτη έγινε αντιληπτό το πόσο σημαντικό γεγονός είναι η δημιουργία αξίας από την ποσοτική ανάλυση δεδομένων (analytics) και πως η βελτίωση της πληροφόρησης και η ενσωμάτωση προηγμένων μεθόδων διοικητικής πληροφόρησης αποτελεί μια σημαντικότερη προτεραιότητα στους οργανισμούς. 59

63 Σύμφωνα με τη συγκεκριμένη μελέτη, πραγματοποιείται μια ξεκάθαρη σύνδεση της απόδοσης ενός οργανισμού με την ανταγωνιστική αξία των analytics. Οι οργανισμοί που αξιοποιούν τέτοιες μεθόδους για την αξιοποίηση της επιχειρησιακής πληροφόρησης διαφοροποιούνται από τον ανταγωνισμό και έχουν επιπλέον εργαλεία για την αξιολόγηση μελλοντικών στρατηγικών και την καλύτερη κατανόηση των καθημερινών λειτουργιών. Είναι σημαντικό να τονιστεί ότι ο όγκος των δεδομένων δεν είναι πάντα το μεγαλύτερο εμπόδιο και πρόκληση που αντιμετωπίζει ένας οργανισμός, αλλά η έλλειψη κατανόησης σχετικά με το πώς η χρήση των analytics μπορεί να βελτιώσει την επιχειρησιακή απόδοση. Τα στελέχη των οργανισμών αναζητούν συνέχεια καλύτερους τρόπους για να εντοπίσουν και να επικοινωνήσουν σύνθετη γνώση που προκύπτει από τα την ερμηνεία των δεδομένων ώστε να υλοποιηθούν οι κατάλληλες ενέργειες. Οι μεγάλοι οργανισμοί ήδη έχουν υιοθετήσει τεχνικές για την ανάλυση δεδομένων σχετικά με κείμενα (text analytics), φωνής (voice analytics), κοινωνικών δικτύων (social media analytics) και άλλων προχωρημένων τεχνικών πρόβλεψης όπως η πρόβλεψη κάποιας απάτης (fraud analytics) ή ενός πιστωτικού κινδύνου (risk analytics). Η χρήση τέτοιων προηγμένων τεχνικών ανάλυσης δεδομένων σε συνδυασμό με εξελιγμένων υπολογιστικά εργαλεία μπορούν να βοηθήσουν τους οργανισμούς να δημιουργήσουν την κατάλληλη γνώση από τα δεδομένα τους και να μετατρέψουν αριθμούς και δεδομένα (data) σε γνώση και αξία (value). Στη συνέχεια παρουσιάζεται ένα διάγραμμα σχετικό με την χρήση προηγμένων τεχνικών ανάλυσης δεδομένων για την δημιουργία αξίας και την λήψη των κατάλληλων επιχειρηματικών αποφάσεων και ενεργειών: 60

64 Γράφημα 14. Διαδικασία δημιουργία αξίας για την λήψη αποφάσεων Η όλο και αυξανόμενη τάση στον επιχειρησιακό κόσμο σχετικά με τη χρήση των analytics είναι η ανάγκη και η ικανότητα της χρήσης των δεδομένων όχι μόνο για τη δημιουργία αξίας αλλά και για τη δημιουργία ανταγωνιστικού πλεονεκτήματος. Οι οργανισμοί που έχουν αποκτήσει εμπειρία στην ενσωμάτωση και τη χρήση των analytics, βασίζονται σε αυτό για τον καθορισμό της στρατηγικής τους αλλά και για τις καθημερινές τους δραστηριότητες σχετικές με το μάρκετινγκ και τις λειτουργίες για την αύξηση της αποδοτικότητας τους. Τέτοιοι οργανισμοί χρησιμοποιούν ένα ολοκληρωμένο χαρτοφυλάκιο με τα κατάλληλα υπολογιστικά εργαλεία για την υποστήριξη της μοντελοποίησης προηγμένων αναλυτικών μεθόδων. Για την αξιοποίηση των δεδομένων και τη δημιουργία αξίας από αυτά, δεν αρκούν μόνο τα κατάλληλα εργαλεία και τα κατάλληλα στελέχη που έχουν αναλυτικό προσανατολισμό. Οι οργανωτικοί παράγοντες παίζουν εξίσου σημαντικό ρόλο για να επιτευχθεί ανταγωνιστικό πλεονέκτημα από τη χρήση των analytics. Είναι απαραίτητο να υπάρχει διοικητική υποστήριξη για τα analytics μέσα σε όλο το οργανισμό, να ενσωματώνονται εύκολο πιθανές αλλαγές και νέες ιδέες. Για ένα μεγάλο οργανισμό, η βασική ερώτηση που πρέπει να απαντηθεί δεν είναι το κόστος που έχει η χρήση των analytics, αλλά πόση αξία δημιουργείται από την αξιοποίηση των δεδομένων και των τεχνικών ποσοτικής ανάλυσης αυτών. 61

65 5. Ανάλυση Δεδομένων Οργανισμών Στο κεφάλαιο αυτό, πραγματοποιείται η ποσοτική ανάλυση σε πραγματικά δεδομένα μεγάλων εταιρειών που δραστηριοποιούνται στη παγκόσμια αγορά και αφορούν τρεις διαφορετικούς επιχειρησιακούς κλάδους. Η επιλογή των συγκεκριμένων κλάδων πραγματοποιήθηκε με βάση προσωπικό ενδιαφέρον καθώς και το ιδιαίτερα ανταγωνιστικό περιβάλλον που δημιουργούν για τους οργανισμούς που συμμετέχουν σε αυτούς. Οι κλάδοι προς μελέτη και ανάλυση είναι οι εξής: Τραπεζικοί Οργανισμοί Εταιρείες Τηλεπικοινωνιών Εταιρείες Πώλησης Προϊόντων Λιανικής Για να είναι δυνατό να αναλυθούν ποσοτικά οι αντιπροσωπευτικές εταιρείες που δραστηριοποιούνται στους κλάδους αυτούς έπρεπε να ολοκληρωθούν μια σειρά από βήματα. Αρχικά έπρεπε να ερευνηθεί η δυνατότητα εύρεσης πρωτογενών δεδομένων από αξιόπιστες και διαθέσιμες πηγές που να αφορούν στοιχεία απόδοσης των οργανισμών. Στη συνέχεια, αξιολογήθηκαν τα διαθέσιμα δεδομένα και πραγματοποιήθηκε ένας αρχικός ποιοτικός έλεγχος για να γίνει αντιληπτό κατά πόσο είναι δυνατό να χρησιμοποιηθούν αυτά για μια εκτενή ποσοτική ανάλυση. Με βάση τη ποικιλία της πληροφορίας που περιείχαν, τη πληρότητά τους και το μέγεθος των οργανισμών που αφορούσαν επιλέχθηκαν αυτά που θα χρησιμοποιηθούν στο κεφάλαιο αυτό. Οι ποσοτικές αναλύσεις θα υλοποιηθούν με τη χρήση των κατάλληλων τεχνικών και αλγορίθμων και θα αφορούν τη δημιουργία και την επιλογή των κατάλληλων δεικτών μέτρησης (KPIs) με τη χρήση μεθόδων περιορισμού και επιλογής μεταβλητών όπως είναι η ανάλυση συσχετίσεων (correlation analysis) και η ανάλυση παραγόντων (factory analysis). Μέσα από τις επιλογές αυτές, θα εφαρμοστούν τεχνικές τμηματοποίησης των διαθέσιμων δεδομένων για να μπορέσει να δημιουργηθεί προστιθέμενη αξία για τους οργανισμούς που θα τους βοηθήσουν στην ανάπτυξη κάποιου ανταγωνιστικού πλεονεκτήματος. 62

66 5.1 Τραπεζικός Οργανισμός (Banking) Για την πραγματοποίηση της ποσοτικής ανάλυσης που αφορά Τραπεζικούς Οργανισμούς χρησιμοποιήθηκαν τα αποτελέσματα από μια έρευνα που πραγματοποιήθηκε στις ΗΠΑ και αφορούσε την ικανοποίηση ενός αριθμού μικρομεσαίων και μεσαίων επιχειρήσεων από την εξυπηρέτηση που δέχθηκαν σε ένα συγκεκριμένο χρονικό διάστημα καθώς και τις υπηρεσίες που παρείχαν οι τράπεζες προς αυτές. Οι οργανισμοί αυτοί έχουν άμεση συνεργασία με την πλειοψηφία των τραπεζικών οργανισμών που δραστηριοποιούνται στη χώρα. Τα δεδομένα από τις απαντήσεις του συγκεκριμένου ερωτηματολογίου αφορούσαν περίπου οργανισμούς, μια χρονική περίοδο μιας δεκαετίας ( ) και μια σειρά από σημαντικά ζητήματα που ενδιαφέρουν τους οργανισμούς και τη σχέση που έχουν με τις συνεργαζόμενες τράπεζες Ανάλυση μεταβλητών Τραπεζικού Οργανισμού Για να γίνει εφικτή η ανάλυση της ικανοποίησης από τη συνεργασία των μικρομεσαίων επιχειρήσεων με τους Τραπεζικούς Οργανισμούς χρησιμοποιήθηκαν μια σειρά από δείκτες όπως φαίνονται στον παρακάτω πίνακα και με βάση αυτούς πραγματοποιήθηκε η ανάλυση στη συγκεκριμένη διάσταση. Η πλήρης λίστα των KPIs παρατίθεται στο παράρτημα της εργασίας. KPIs Τραπεζικού Οργανισμού Ο οργανισμός σχεδιάζει να αλλάξει την κύρια τράπεζα συνεργασία τους επόμενους 12 μήνες Είναι εύκολο να συνεργαστείς με τη τράπεζα Η τράπεζα κάνει τα πράγματα σωστά από τη πρώτη φορά Η τράπεζα έχει σε εκτίμηση τον οργανισμό μας Η τράπεζα ανταποκρίνεται στα αιτήματα του οργανισμού μας Η τράπεζα θα σταθεί δίπλα στον οργανισμό μας σε δύσκολες στιγμές Η τράπεζα καλύπτει επαρκώς τις πιστωτικές ανάγκες του οργανισμού μας Η τράπεζα γνωρίζει και καταλαβαίνει τον οργανισμό KPIs Banking changebank easybusiness getright appreciatesbusiness responsive standby meetcredit understandbusiness 63

67 Η τράπεζα έχει επικοινωνήσει τις αλλαγές στη πιστωτική της πολιτική που σχετίζονται με τον οργανισμό μας Τράπεζα είναι χρηματοοικονομικά σταθερή Τράπεζα είναι ανταγωνιστικές τιμές υπηρεσιών Τράπεζα είναι ανταγωνιστικές τιμές και επιτόκια δανείων Σύσταση για συνεργασία νέας εταιρείας με παρόμοιες ανάγκες στη τράπεζα Επίπεδο τρέχουσας απόδοσης σχετικά με τη κατανόηση των στόχων του οργανισμού μας από τη τράπεζα Επίπεδο τρέχουσας απόδοσης σχετικά με τη ολοκλήρωση των αιτημάτων του οργανισμού μας από τη τράπεζα Επίπεδο ικανοποίησης από την κύρια τράπεζα Επίπεδο ικανοποίησης από τον Account Officer τη τελευταία χρονιά Επίπεδο ικανοποίησης από το βοηθό του Account Officer τη τελευταία χρονιά Επίπεδο ικανοποίησης από κάποιον ειδικό τη τελευταία χρονιά Επίπεδο ικανοποίησης από το κατάστημα συνεργασίας τη τελευταία χρονιά Επίπεδο ικανοποίησης από τη χρήση των ATM τη τελευταία χρονιά Επίπεδο ικανοποίησης από τη χρήση του τηλεφωνικού κέντρου τη τελευταία χρονιά Λάθη που σχετίζονται με τη μισθοδοσία Λάθη που σχετίζονται με θετική πληρωμή Λάθη που σχετίζονται με τις αμοιβές Λάθη που σχετίζονται με τις Υπηρεσίες communicatepolicy financiallystable competitiveservicecharges competitiverates/feesonloans referbank PRCPunderstand PRCPprompt banksat Officersat Assistantsat Specialistsat branchsat ATMsat 1800sat payrollerror positivepayerror feeserror serviceerror Πίνακας 11. Πίνακας KPIs Τραπεζικών Οργανισμών (Banking) Ανάλυσης συχνοτήτων μεταβλητών Τραπεζικού Οργανισμού Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των KPIs που χρησιμοποιήθηκαν για την ανάλυση των Τραπεζικών Οργανισμών. 64

68 N of valid Missing % Missing Mean Std. Error of Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile Percentile Median Variance Min Max Sum Mean Deviation 1% 5% 10% 25% 50% 75% 90% 99% SMSA % SMSA % County % banks used % bank sat % change bank % Officer use % Assistant use % Specialist use % branch use % ATM use % touchtone use % use % webtransac use % webinfo use % webtranpc use % Officer contact % Assistant contact % Specialist contact % branch contact % webtransac contact % webinfo contact % webtranpc contact % Πίνακας 12. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 1/3 N of valid Missing % Missing Mean Std. Error of Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile Percentile Median Variance Min Max Sum Mean Deviation 1% 5% 10% 25% 50% 75% 90% 99% Officer sat % Assistant sat % Specialist sat % branch sat % ATM sat % sat % webtransac sat % webinfo sat % webtranpc sat % other bank % otherbank1 asset modified % easy business % get right % appreciates business % responsive % stand by % meet credit % communicate policy % financially stable % competitive service charges % competitive rates/fees on loans % refer bank % primary contact % PRCI understand % PRCI prompt % PRCI solution % PRCI respect % PRCI accessible % Πίνακας 13. Ανάλυσης συχνοτήτων KPIs Τραπεζικών Οργανισμών 2/3 Στη συνέχεια παρουσιάζονται μερικοί πίνακες κατανομής συχνοτήτων για μερικά σημαντικά KPIs που χρησιμοποιήθηκαν στην ανάλυση. 65

69 Όγκος Πωλήσεων Frequency Percent Valid Percent Cumulative Percent $100k 499k $500k- 999k $1 mil mil $2.5 mil mil $5 mil 10 mil $10 mil mil $25 mil mil $50 mil mil $100 mil 500 mil Total Πίνακας 14. Πίνακας κατανομής συχνοτήτων όγκου πωλήσεων Επίπεδο ικανόποίησης από την Τράπεζα Frequency Percent Valid Percent Cumulative Percent Very Satisfied Somewhat Satisfied Neutral Somewhat Dissatisfied Very Dissatisfied Total Πίνακας 15. Πίνακας κατανομής συχνοτήτων επιπέδου ικανοποίησης με τη τράπεζα Αλλαγή Τράπεζας Frequency Percent Valid Percent Cumulative Percent Yes No Not sure Total Πίνακας 16. Πίνακας κατανομής συχνοτήτων επιθυμίας για αλλαγή τράπεζας Χρήση Account Officer Frequency Percent Valid Percent Cumulative Percent Yes No Total Πίνακας 17. Πίνακας κατανομής συχνοτήτων χρήσης account officer Χρήση βοηθού Account Officer Frequency Percent Valid Percent Cumulative Percent Yes No Total Πίνακας 18. Πίνακας κατανομής συχνοτήτων χρήσης βοηθού account officer 66

70 Γράφημα 15. Γράφημα κατανομής συχνοτήτων όγκου πωλήσεων Ανάλυση συσχετίσεων μεταβλητών Τραπεζικού Οργανισμού Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των KPIs που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση των τραπεζικών οργανισμών. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα εντοπίζεται μερικοί συνδυασμοί KPIs που έχουν μεγάλη συσχέτιση (>75%), επομένως θα εξαιρεθούν από τη συνέχεια της ανάλυσης. 67

71 Sales Region State SIC2 SIC4 SIC6 SIC8 Selected Correlation >75% Volume Code Code Code Code Code Code SMSA 3 SMSA 4 Weig ht Count y Barlow County Code Quarter Year / Year Segme nt primary bank primar banks asset y bank used modifie d bank sat chang Office Assista Speciali branc e bank r use nt use st use h use ATM use touchton 1800 e use use webtran webinf webtran sac use o use PC use Office r conta ct Assista nt contact Speciali st contact branc h conta ct ATM 1800 conta conta ct ct webtran sac contact webinf o contac t webtran PC contact Officer sat Assista nt sat Speciali st sat branc h sat ATM sat touchton e sat 1800 sat otherban webtran webinf webtran other k1 asset sac sat o sat PC sat bank1 modified Sales Volume 100% -1% 2% -5% -5% -5% -5% -51% -10% -60% 2% -2% 4% -2% 84% -10% -12% 19% -5% -1% -26% -21% -36% 14% 20% 2% -2% -22% -10% 0% 8% 7% 8% 11% -1% 10% 22% 14% 22% -3% -5% -4% 1% 6% -10% -8% 0% -1% 0% -9% -5% Region Code -1% 100% -23% 4% 4% 4% 4% 8% 4% 14% -8% -22% -1% 2% 0% -8% -13% 0% 5% 1% 3% 0% 1% -9% -6% -3% -7% -3% -2% 0% 3% 4% 2% -4% 0% 1% -1% 3% -1% 5% 3% 5% 4% -1% 10% 5% 2% 2% 2% -3% -3% State Code 2% -23% 100% -2% -2% -2% -2% 5% 3% -4% 16% 96% 0% 1% 1% 0% 2% 1% -4% -1% -2% -3% -4% 0% 4% 1% 4% 0% 0% 0% 0% -6% -5% 4% -4% -3% 2% 1% 2% -2% -2% -4% -2% 2% -10% -3% 0% -2% 0% -1% -2% SIC2 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 2% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SIC4 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 1% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SIC6 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 1% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SIC8 Code -5% 4% -2% 100% 100% 100% 100% 0% -3% 10% -1% -3% -1% 3% -2% -7% -7% 5% -2% 0% 4% 5% -2% -4% -6% -1% -6% -6% -4% 0% -1% -1% 1% 3% -1% 2% -2% 1% -2% -3% 0% 2% 0% 3% 6% 0% -2% 0% -2% -1% -1% SMSA3-51% 8% 5% 0% 0% 0% 0% 100% 0% 22% 2% 5% 61% -61% -61% -9% -8% -9% 4% 3% 20% 11% 20% -16% -11% 0% -1% 5% 1% 0% -5% -5% -5% -6% 6% -15% -20% -18% -20% 3% 5% 5% 4% -7% 15% 8% 0% 4% 0% 0% 0% SMSA4-10% 4% 3% -3% -3% -3% -3% 0% 100% 4% -3% 3% 16% -38% -15% -3% -4% -3% 1% 0% 1% 0% 2% -6% -2% -3% 0% 1% 0% 0% -1% 0% -5% -3% -1% -2% -3% -5% -3% 1% 2% -1% -1% -2% -2% 1% -1% 1% -1% 1% -1% Weight -60% 14% -4% 10% 10% 10% 10% 22% 4% 100% 2% -2% -3% 2% -33% 3% 5% -10% 0% 0% 19% 15% 18% -5% -19% -3% -1% 11% 4% 0% -6% -3% -4% -13% -3% -4% -12% -10% -12% 1% 3% 1% 0% -5% 4% 2% -1% -1% -1% 6% 2% County 2% -8% 16% -1% -1% -1% -1% 2% -3% 2% 100% 16% -1% 0% 1% 4% 5% 0% -3% 0% -3% -3% -2% 2% 4% 0% 1% -1% -1% 0% 2% 2% 2% 1% 4% 1% 1% 0% 1% -2% -3% -3% -2% -4% -5% -2% -1% -2% -1% 1% -1% Barlow County Code -2% -22% 96% -3% -3% -3% -3% 5% 3% -2% 16% 100% 2% 2% -4% 1% 3% 0% -3% -1% -2% -2% -1% 0% 3% 1% 4% 1% 0% 0% 0% -6% -4% 4% -4% -2% 1% 0% 1% -2% -2% -4% -2% 2% -9% -3% -1% -2% -1% -2% -1% Quarter / Year 4% -1% 0% -1% -1% -1% -1% 61% 16% -3% -1% 2% 100% -47% 5% 0% 0% 1% -1% 1% 0% 0% -1% 1% 2% 0% 0% -1% -1% 0% -1% -1% 2% -1% 2% -2% 4% 2% 4% 0% 0% 0% 0% 4% -4% -2% 1% 1% 1% 0% -2% Year -2% 2% 1% 3% 3% 3% 3% -61% -38% 2% 0% 2% -47% 100% -1% 0% 1% -1% -1% -1% -1% 1% 2% -1% -2% 0% 0% -2% 0% 0% 0% 0% 1% -1% -8% 3% -2% 1% -2% -2% -2% -3% -1% -1% 4% -2% 0% -2% 0% 4% 7% Segment 84% 0% 1% -2% -2% -2% -2% -61% -15% -33% 1% -4% 5% -1% 100% -11% -11% 15% -6% -2% -20% -17% -34% 13% 14% 2% -3% -18% -8% 0% 7% 6% 8% 7% -3% 10% 20% 13% 20% -3% -3% -4% 1% 4% -7% -6% 0% -1% 0% 0% 0% primary bank -10% -8% 0% -7% -7% -7% -7% -9% -3% 3% 4% 1% 0% 0% -11% 100% 79% 0% -17% -3% -3% 0% 10% 9% 8% 6% 15% 6% 1% 0% 4% 8% 4% 4% -1% 1% -4% -2% -4% -13% -14% -14% -15% -10% -19% -21% -7% -11% -7% 12% 13% primary bank asset modified -12% -13% 2% -7% -7% -7% -7% -8% -4% 5% 5% 3% 0% 1% -11% 79% 100% 0% -19% -3% -1% 1% 13% 9% 6% 5% 15% 6% 0% 0% 3% 8% 3% 6% -3% 4% -3% -3% -3% -15% -16% -18% -18% -11% -18% -22% -10% -14% -10% 12% 11% banks used 19% 0% 1% 5% 5% 5% 5% -9% -3% -10% 0% 0% 1% -1% 15% 0% 0% 100% 5% -1% -8% -7% -11% 2% 4% -1% -1% -6% -5% 0% 8% 7% 0% 9% 1% 1% 6% 3% 6% 4% 6% 1% 6% 5% 4% 2% 4% 3% 4% -2% -3% bank sat -5% 5% -4% -2% -2% -2% -2% 4% 1% 0% -3% -3% -1% -1% -6% -17% -19% 5% 100% -4% 6% 6% 8% -1% -6% -3% -7% 1% 2% 0% -1% 0% 0% -2% 4% 1% -3% -1% -3% 75% 67% 64% 57% 46% 55% 59% 49% 51% 49% -2% -2% change bank -1% 1% -1% 0% 0% 0% 0% 3% 0% 0% 0% -1% 1% -1% -2% -3% -3% -1% -4% 100% 2% 2% 2% -2% 0% -1% -2% 1% 2% 0% -3% -2% -3% -1% 0% -5% -1% -4% -1% -7% -5% -3% -1% -1% -3% -2% 0% 0% 0% 1% 2% Officer use -26% 3% -2% 4% 4% 4% 4% 20% 1% 19% -3% -2% 0% -1% -20% -3% -1% -8% 6% 2% 100% 38% 23% 1% -6% 1% 2% 15% 8% 0% 0% -5% -1% -5% 7% -2% -7% 0% -7% 0% 5% 7% 6% 2% 9% 6% 2% 3% 2% 5% 5% Assistant use -21% 0% -3% 5% 5% 5% 5% 11% 0% 15% -3% -2% 0% 1% -17% 0% 1% -7% 6% 2% 38% 100% 25% 4% -2% 7% 9% 13% 12% 0% -12% 0% -4% -8% 2% -2% -8% -5% -8% 5% 0% 4% 4% 0% 5% 2% 3% 4% 3% 1% 4% Specialist use -36% 1% -4% -2% -2% -2% -2% 20% 2% 18% -2% -1% -1% 2% -34% 10% 13% -11% 8% 2% 23% 25% 100% -2% -2% 6% 12% 18% 16% 0% -10% -5% 0% -5% 3% -2% -16% -8% -16% 5% 5% 0% 0% -2% 5% 7% 0% 1% 0% 11% 9% branch use 14% -9% 0% -4% -4% -4% -4% -16% -6% -5% 2% 0% 1% -1% 13% 9% 9% 2% -1% -2% 1% 4% -2% 100% 10% 6% 9% 6% 5% 0% 2% 2% 4% 0% -6% -4% 2% 2% 2% -1% -4% -1% 0% 2% -5% -6% -2% -4% -2% -6% -8% ATM use 20% -6% 4% -6% -6% -6% -6% -11% -2% -19% 4% 3% 2% -2% 14% 8% 6% 4% -6% 0% -6% -2% -2% 10% 100% 14% 14% 9% 11% 0% 1% -1% -2% 8% 0% -1% 3% -2% 3% -3% -5% -6% -4% 0% -6% -7% -1% -4% -1% 0% -1% touchtone use 2% -3% 1% -1% -1% -1% -1% 0% -3% -3% 0% 1% 0% 0% 2% 6% 5% -1% -3% -1% 1% 7% 6% 6% 14% 100% 27% 3% 9% 0% -5% -1% -4% 0% 2% -11% 5% 1% 5% -4% -5% 0% -3% -7% 0% 2% -1% 0% -1% -1% -1% 1800 use -2% -7% 4% -6% -6% -6% -6% -1% 0% -1% 1% 4% 0% 0% -3% 15% 15% -1% -7% -2% 2% 9% 12% 9% 14% 27% 100% 13% 17% 0% -2% -1% -1% 1% -7% 0% -7% -2% -7% -7% -10% -5% -10% -9% -14% 0% -7% -7% -7% 5% 2% webtransac use -22% -3% 0% -6% -6% -6% -6% 5% 1% 11% -1% 1% -1% -2% -18% 6% 6% -6% 1% 1% 15% 13% 18% 6% 9% 3% 13% 100% 36% 0% 0% 1% -1% -6% 1% 6% 0% -2% 0% -1% 1% 3% -3% 0% -3% 1% 0% 2% 0% 5% 2% webinfo use -10% -2% 0% -4% -4% -4% -4% 1% 0% 4% -1% 0% -1% 0% -8% 1% 0% -5% 2% 2% 8% 12% 16% 5% 11% 9% 17% 36% 100% 0% -6% -4% -3% -3% -1% 0% -2% 0% -2% 1% 0% 2% -1% -2% -3% 5% 1% 0% 1% 2% 2% webtranpc use 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% Officer contact 8% 3% 0% -1% -1% -1% -1% -5% -1% -6% 2% 0% -1% 0% 7% 4% 3% 8% -1% -3% 0% -12% -10% 2% 1% -5% -2% 0% -6% 0% 100% 59% 22% 12% 9% 35% 8% 10% 8% -2% -1% -2% 1% 2% 4% -3% 0% -2% 0% 1% -2% Assistant contact 7% 4% -6% -1% -1% -1% -1% -5% 0% -3% 2% -6% -1% 0% 6% 8% 8% 7% 0% -2% -5% 0% -5% 2% -1% -1% -1% 1% -4% 0% 59% 100% 32% 16% 7% 44% 8% 14% 8% 0% -3% -2% 1% -4% 5% -6% -3% -3% -3% 3% 2% Specialist contact 8% 2% -5% 2% 1% 1% 1% -5% -5% -4% 2% -4% 2% 1% 8% 4% 3% 0% 0% -3% -1% -4% 0% 4% -2% -4% -1% -1% -3% 0% 22% 32% 100% 7% 0% 27% 10% 14% 10% -2% -4% -8% -4% -7% -1% -3% -5% -6% -5% 5% 2% branch contact 11% -4% 4% 3% 3% 3% 3% -6% -3% -13% 1% 4% -1% -1% 7% 4% 6% 9% -2% -1% -5% -8% -5% 0% 8% 0% 1% -6% -3% 0% 12% 16% 7% 100% 21% 15% 26% 25% 26% -1% 1% -3% -5% 0% -1% -2% -3% -8% -3% 6% 6% ATM contact -1% 0% -4% -1% -1% -1% -1% 6% -1% -3% 4% -4% 2% -8% -3% -1% -3% 1% 4% 0% 7% 2% 3% -6% 0% 2% -7% 1% -1% 0% 9% 7% 0% 21% 100% 8% 25% 22% 25% 3% 5% 0% 2% 0% 5% 5% 1% 8% 1% -4% 4% 1800 contact 10% 1% -3% 2% 2% 2% 2% -15% -2% -4% 1% -2% -2% 3% 10% 1% 4% 1% 1% -5% -2% -2% -2% -4% -1% -11% 0% 6% 0% 0% 35% 44% 27% 15% 8% 100% 14% 23% 14% 3% 3% 6% 3% -1% 10% -3% 4% 3% 4% 22% 30% webtransac contact 22% -1% 2% -2% -2% -2% -2% -20% -3% -12% 1% 1% 4% -2% 20% -4% -3% 6% -3% -1% -7% -8% -16% 2% 3% 5% -7% 0% -2% 0% 8% 8% 10% 26% 25% 14% 100% 37% 100% -1% -1% -6% 1% -6% 14% -4% -5% -2% -5% 0% 1% webinfo contact 14% 3% 1% 1% 1% 1% 1% -18% -5% -10% 0% 0% 2% 1% 13% -2% -3% 3% -1% -4% 0% -5% -8% 2% -2% 1% -2% -2% 0% 0% 10% 14% 14% 25% 22% 23% 37% 100% 37% -2% 0% 3% 2% 0% 10% -2% -4% -12% -4% 7% 6% webtranpc contact 22% -1% 2% -2% -2% -2% -2% -20% -3% -12% 1% 1% 4% -2% 20% -4% -3% 6% -3% -1% -7% -8% -16% 2% 3% 5% -7% 0% -2% 0% 8% 8% 10% 26% 25% 14% 100% 37% 100% -1% -1% -6% 1% -6% 14% -4% -5% -2% -5% 0% 1% Officer sat -3% 5% -2% -3% -3% -3% -3% 3% 1% 1% -2% -2% 0% -2% -3% -13% -15% 4% 75% -7% 0% 5% 5% -1% -3% -4% -7% -1% 1% 0% -2% 0% -2% -1% 3% 3% -1% -2% -1% 100% 76% 64% 54% 46% 54% 56% 45% 48% 45% -3% -3% Assistant sat -5% 3% -2% 0% 0% 0% 0% 5% 2% 3% -3% -2% 0% -2% -3% -14% -16% 6% 67% -5% 5% 0% 5% -4% -5% -5% -10% 1% 0% 0% -1% -3% -4% 1% 5% 3% -1% 0% -1% 76% 100% 67% 56% 42% 64% 59% 44% 49% 44% -1% -1% Specialist sat -4% 5% -4% 2% 2% 2% 2% 5% -1% 1% -3% -4% 0% -3% -4% -14% -18% 1% 64% -3% 7% 4% 0% -1% -6% 0% -5% 3% 2% 0% -2% -2% -8% -3% 0% 6% -6% 3% -6% 64% 67% 100% 51% 37% 59% 57% 46% 52% 46% -2% -2% branch sat 1% 4% -2% 0% 0% 0% 0% 4% -1% 0% -2% -2% 0% -1% 1% -15% -18% 6% 57% -1% 6% 4% 0% 0% -4% -3% -10% -3% -1% 0% 1% 1% -4% -5% 2% 3% 1% 2% 1% 54% 56% 51% 100% 55% 55% 53% 47% 51% 47% -8% -10% ATM sat 6% -1% 2% 3% 3% 3% 3% -7% -2% -5% -4% 2% 4% -1% 4% -10% -11% 5% 46% -1% 2% 0% -2% 2% 0% -7% -9% 0% -2% 0% 2% -4% -7% 0% 0% -1% -6% 0% -6% 46% 42% 37% 55% 100% 52% 44% 49% 49% 49% -9% -9% touchtone sat -10% 10% -10% 6% 6% 6% 6% 15% -2% 4% -5% -9% -4% 4% -7% -19% -18% 4% 55% -3% 9% 5% 5% -5% -6% 0% -14% -3% -3% 0% 4% 5% -1% -1% 5% 10% 14% 10% 14% 54% 64% 59% 55% 52% 100% 81% 59% 65% 59% -3% -9% 1800 sat -8% 5% -3% 0% 0% 0% 0% 8% 1% 2% -2% -3% -2% -2% -6% -21% -22% 2% 59% -2% 6% 2% 7% -6% -7% 2% 0% 1% 5% 0% -3% -6% -3% -2% 5% -3% -4% -2% -4% 56% 59% 57% 53% 44% 81% 100% 54% 61% 54% -12% -11% webtransac sat 0% 2% 0% -2% -2% -2% -2% 0% -1% -1% -1% -1% 1% 0% 0% -7% -10% 4% 49% 0% 2% 3% 0% -2% -1% -1% -7% 0% 1% 0% 0% -3% -5% -3% 1% 4% -5% -4% -5% 45% 44% 46% 47% 49% 59% 54% 100% 82% 100% -7% -6% webinfo sat -1% 2% -2% 0% 0% 0% 0% 4% 1% -1% -2% -2% 1% -2% -1% -11% -14% 3% 51% 0% 3% 4% 1% -4% -4% 0% -7% 2% 0% 0% -2% -3% -6% -8% 8% 3% -2% -12% -2% 48% 49% 52% 51% 49% 65% 61% 82% 100% 82% -11% -12% webtranpc sat 0% 2% 0% -2% -2% -2% -2% 0% -1% -1% -1% -1% 1% 0% 0% -7% -10% 4% 49% 0% 2% 3% 0% -2% -1% -1% -7% 0% 1% 0% 0% -3% -5% -3% 1% 4% -5% -4% -5% 45% 44% 46% 47% 49% 59% 54% 100% 82% 100% -7% -6% other bank1-9% -3% -1% -1% -1% -1% -1% 0% 1% 6% 1% -2% 0% 4% 0% 12% 12% -2% -2% 1% 5% 1% 11% -6% 0% -1% 5% 5% 2% 0% 1% 3% 5% 6% -4% 22% 0% 7% 0% -3% -1% -2% -8% -9% -3% -12% -7% -11% -7% 100% 76% otherbank1 asset modified -5% -3% -2% -1% -1% -1% -1% 0% -1% 2% -1% -1% -2% 7% 0% 13% 11% -3% -2% 2% 5% 4% 9% -8% -1% -1% 2% 2% 2% 0% -2% 2% 2% 6% 4% 30% 1% 6% 1% -3% -1% -2% -10% -9% -9% -11% -6% -12% -6% 76% 100% Πίνακας 19. Πίνακας ανάλυσης συσχετίσεων KPIs τραπεζικού οργανισμού Ανάλυση παραγόντων μεταβλητών Τραπεζικού Οργανισμού Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα, με τη πρώτη να είναι σχεδόν διπλάσια από τη δεύτερη. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 8 παράγοντες που εξηγούν περίπου το 79% της μεταβλητότητας όλων των μεταβλητών. 68

72 Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared Component % of Cumulative % of Cumulative % of Cumulative Total Total Total Variance % Variance % Variance % Πίνακας 20. Πίνακας ανάλυσης παραγόντων KPIs τραπεζικού οργανισμού Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Component Transformation Matrix Component Πίνακας 21. Πίνακας ανάλυσης βαρών KPIs τραπεζικού οργανισμού Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική 69

73 τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων μικρομεσαίων και μεσαίων επιχειρήσεων που συνεργάζονται με τους τραπεζικούς οργανισμούς ανάλογα με τις ανάγκες τους, το επίπεδο ικανοποίησης του και τα προϊόντα που προσφέρουν. Component Score Coefficient Matrix Component Sales Volume State Code SIC8 Code bank sat webtransac contact webtranpc contact Officer sat Assistant sat webtransac sat webinfo sat webtranpc sat PRCP understand PRCP prompt PRCP solution PRCP respect PRCP accessible actual AOvisit prefer AOvisit actual AOcall prefer AOcall actual AOyear prefer AOyear actual approval prefer approval CRE building use CRE investment use NetCRE use Πίνακας 22. Συντελεστές για κάθε KPI τραπεζικού οργανισμού στους νέους factors Scree Plot μεταβλητών Τραπεζικού Οργανισμού Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλες τις μεταβλητές που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα των Τραπεζικών Οργανισμών. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 8 όπου και οι τιμές των 70

74 ιδιοτιμών παίρνουν τιμές μικρότερες της μονάδας. Στην περίπτωση αυτή δηλαδή θα επιλεγούν 8 παράγοντες. Γράφημα 16. Scree Plot μεταβλητών τραπεζικού οργανισμού Ιεραρχική τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 8 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον ιεραρχικό αλγόριθμο τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. 71

75 Γράφημα 17. Αποτελέσματα ιεραρχικής τμηματοποίησης τραπεζικών δεδομένων Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια επιχειρησιακή απόφαση για συγκεκριμένα τμήματα των πελατών του τραπεζικού οργανισμού. 72

76 5.2 Εταιρεία Πώλησης Προϊόντων Λιανικής (Retail) Για την πραγματοποίηση της ποσοτικής ανάλυσης που αφορά τις Εταιρείες Πώλησης Προϊόντων Λιανικής χρησιμοποιήθηκε ένα δείγμα από τα πρωτογενή δεδομένα σχετικά με πωλήσεις προϊόντων και συμπεριφοράς πελατών ( πελάτες) μιας μεγάλης αλυσίδας που δραστηριοποιείται κατά κύριο λόγο στις ΗΠΑ κατά τη διάρκεια της τελευταίας χρονιάς. Στη περίπτωση του οργανισμού αυτού, θα μελετήσουμε την απόδοση του σε δύο διαστάσεις: α) τα τμήματα του καταστημάτων που προτιμούν να ψωνίζουν οι πελάτες (ανάλυση περιεχόμενου καλαθιού basket analysis) και β) τη αγοραστική συμπεριφορά των πελατών σε σχέση με διαθέσιμες προσφορές (ανάλυση συμπεριφοράς -behavioral analysis) Ανάλυση περιεχόμενου καλαθιού (Basket analysis) Για να γίνει εφικτή η ανάλυση του περιεχομένου του καλαθιού που ψωνίζει ο εκάστοτε πελάτης χρησιμοποιήθηκαν μια σειρά συγκεκριμένων δεικτών όπως φαίνονται στον παρακάτω πίνακα και με βάση αυτούς πραγματοποιήθηκε η ανάλυση στη συγκεκριμένη διάσταση. KPIs Ανάλυσης Περιεχόμενου Καλαθιού Ποσοστό Πωλήσεων στο τμήμα αρτοποιίας Ποσοστό Πωλήσεων στο τμήμα αισθητικής Ποσοστό Πωλήσεων στο παιδικό τμήμα Ποσοστό Πωλήσεων στο τμήμα διακόσμησης σπιτιού Ποσοστό Πωλήσεων στο τμήμα εκλεκτών τροφίμων Ποσοστό Πωλήσεων στο τμήμα οπωροκηπευτικών Ποσοστό Πωλήσεων στο τμήμα κατεψυγμένων Ποσοστό Πωλήσεων στο τμήμα ηλεκτρονικών Ποσοστό Πωλήσεων στο τμήμα διασκέδασης Ποσοστό Πωλήσεων στο τμήμα τροφίμων Ποσοστό Πωλήσεων στο υγειονομικό τμήμα Ποσοστό Πωλήσεων στο τμήμα οικιακών ειδών Ποσοστό Πωλήσεων στο παιδικό τμήμα Ποσοστό Πωλήσεων στο τμήμα καθαριότητας KPIs Basket analysis PCT_SL_BAKERY PCT_SL_BEAUTY PCT_SL_BOYS_AND_GIRLS PCT_SL_DEC_HOME PCT_SL_DELI PCT_SL_DOMESTICS PCT_SL_DRY_DAIRY_FRZN PCT_SL_ELECTRONICS PCT_SL_ENTERTAINMENT PCT_SL_FOOD_SERVICE PCT_SL_HEALTHCARE PCT_SL_HOUSEWARES PCT_SL_HSHLD_PAPR_BABY PCT_SL_INT_HOS_PERF 73

77 Ποσοστό Πωλήσεων στο τμήμα αξεσουάρ PCT_SL_JEWELRY_ACCESS Ποσοστό Πωλήσεων στο τμήμα κρεάτων PCT_SL_MEAT Ποσοστό Πωλήσεων στο αντρικό τμήμα PCT_SL_MENS Ποσοστό Πωλήσεων στο τμήμα μη καταναλωτικών προϊόντων PCT_SL_NON_RETAIL Ποσοστό Πωλήσεων στο τμήμα ενδυμάτων PCT_SL_READY_TO_WEAR Ποσοστό Πωλήσεων στο τμήμα υποδημάτων PCT_SL_SHOES Ποσοστό Πωλήσεων στο τμήμα μικρογευμάτων PCT_SL_SNX_BEV_PET_CNDY Ποσοστό Πωλήσεων στο τμήμα αθλητικών ειδών PCT_SL_SPORTING_GOODS Ποσοστό Πωλήσεων στο τμήμα εποχικών ειδών PCT_SL_STAT_SEASONAL Ποσοστό Πωλήσεων στο τμήμα συστημάτων υπηρεσιών PCT_SL_SYSTEMS_SERVICES Ποσοστό Πωλήσεων στο τμήμα παιχνιδιών PCT_SL_TOYS Ποσοστό Πωλήσεων στο τμήμα ειδικών κατασκευών PCT_SL_SPECIAL PROJECT Πίνακας 23. Πίνακας ανάλυσης περιεχόμενου καλαθιού (Basket analysis) Ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των μεταβλητών που αναφέρονται στην ανάλυση περιεχομένου καλαθιού. Παρουσιάζεται βασικές στατιστικές μετρικές όπως είναι ο μέσος όρος, η ελάχιστη και η μέγιστη τιμή, η τυπική απόκλιση και τα βασικά εκατοστημόρια. Με βάση αυτό το πρώτο πίνακα μπορούμε να αποκτήσουμε μια πρώτη εικόνα για τη ποιότητα και το είδος των δεδομένων. N of valid Missing Mean Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile Median Variance Min Max Sum Deviation 1% 10% 25% 50% 75% 90% 99% PCT_SL_NON_RETAIL 150, E PCT_SL_INT_HOS_PERF 150, E PCT_SL_JEWELRY_ACCESS 150, E PCT_SL_READY_TO_WEAR 150, E PCT_SL_SHOES 150, E PCT_SL_SPORTING_GOODS 150, E PCT_SL_HSHLD_PAPR_BABY 150, E PCT_SL_DRY_SNX_CNDY 150, E PCT_SL_HEALTHCARE 150, E PCT_SL_ENTERTAINMENT 150, E PCT_SL_DEC_HOME 150, E PCT_SL_DOMESTICS 150, E PCT_SL_HOUSEWARES 150, E PCT_SL_STAT_SEASONAL 150, E PCT_SL_BOYS_AND_GIRLS 150, E PCT_SL_BEAUTY 150, E PCT_SL_PETS_BEVERAGE 150, E PCT_SL_MEAT_FRZN_DAIRY 150, E PCT_SL_PRODUCE 150, E PCT_SL_ELECTRONICS 150, E PCT_SL_SYSTEMS_SERVICES 150, E PCT_SL_DELI 150, E PCT_SL_BAKERY 150, E PCT_SL_MENS 150, E PCT_SL_FOOD_SERVICE 150, E PCT_SL_NWBRN_INF_TOD 150, E PCT_SL_TOYS 150, E PCT_SL_UNIDENTIFIED 150, E PCT_SL_SPECIAL_PROJECT 150, E Πίνακας 24. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού 74

78 Ανάλυση συσχετίσεων μεταβλητών περιεχόμενου καλαθιού Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των μεταβλητών που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Η διαγώνιος κάθε φορά παίρνει τη τιμή 1. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα δεν εντοπίζεται κανένας συνδυασμός KPIs που να έχει μεγάλη συσχέτιση (>75%), επομένως δε θα εξαιρεθεί κανένα. Selected Correlation >75% PCT_SL_N PCT_SL_I PCT_SL_J PCT_SL_R PCT_SL_S PCT_SL_H PCT_SL_D PCT_SL_H PCT_SL_E PCT_SL PCT_SL_ PCT_SL_H PCT_SL_S PCT_SL_ PCT_SL PCT_SL_P PCT_SL_M PCT_SL PCT_SL_ PCT_SL_S PCT_SL PCT_SL PCT_S ON_RETAI NT_HOS_P EWELRY_A EADY_TO_ PORTING_ SHLD_PAP RY_SNX_C EALTHCAR NTERTAIN _DEC_H DOMESTI OUSEWAR TAT_SEAS BOYS_AN _BEAUT ETS_BEVE EAT_FRZN _PROD ELECTRO YSTEMS_S _BAKER _SHOES L_DELI L ERF CCESS WEAR GOODS R_BABY NDY E MENT OME CS ES ONAL D_GIRLS Y RAGE _DAIRY UCE NICS ERVICES Y PCT_SL_ MENS PCT_SL_F PCT_SL_N PCT_SL_U PCT_SL_S PCT_S OOD_SER WBRN_INF NIDENTIFI PECIAL_P L_TOYS VICE _TOD ED ROJECT PCT_SL_NON_RETAIL 100.0% -2.5% -1.7% -3.0% -2.0% -2.0% -1.1% 6.6% -1.0% -2.2% -2.0% -2.4% -2.4% -2.9% -2.1% -2.9% 1.9% 15.4% 18.8% -1.3% 1.1% 19.8% 15.0% -2.0% -0.8% -2.2% -2.4% 1.0% 1.0% PCT_SL_INT_HOS_PERF -2.5% 100.0% 6.7% 11.5% 2.6% -3.6% -7.3% -7.3% -5.1% -3.7% -3.7% -3.2% -6.5% -4.5% -1.4% -1.7% -5.5% -7.0% -3.8% -7.7% -0.7% -2.0% -1.7% -2.8% -2.3% -3.0% -6.2% -0.9% -0.3% PCT_SL_JEWELRY_ACCESS -1.7% 6.7% 100.0% 9.5% 4.9% -2.9% -7.1% -5.8% -4.6% -1.8% -2.3% -2.5% -4.7% -2.0% -1.2% -0.9% -4.5% -5.4% -3.1% -5.9% -0.7% -1.6% -1.4% -1.7% -1.2% -3.5% -4.1% -2.0% 0.0% PCT_SL_READY_TO_WEAR -3.0% 11.5% 9.5% 100.0% 7.5% -5.6% -10.2% -10.9% -8.1% -5.8% -4.6% -5.0% -9.4% -6.9% -1.8% -5.2% -8.0% -8.7% -5.4% -9.5% -1.1% -2.6% -1.8% -4.5% -2.5% -3.5% -7.6% -1.6% -0.4% PCT_SL_SHOES -2.0% 2.6% 4.9% 7.5% 100.0% -2.7% -6.7% -8.2% -6.1% -4.0% -3.6% -3.9% -7.0% -4.9% 6.8% -5.3% -6.1% -6.4% -4.7% -6.1% -1.1% -2.3% -1.5% -1.1% -1.1% 0.2% -2.9% -1.5% -0.4% PCT_SL_SPORTING_GOODS -2.0% -3.6% -2.9% -5.6% -2.7% 100.0% -6.0% -5.8% -5.4% -2.6% -3.8% -4.0% -5.0% -2.7% 0.3% -6.6% -5.0% -5.8% -3.5% -4.4% -0.7% -2.1% -1.4% -2.4% -2.4% -3.8% 1.1% -1.6% -0.2% PCT_SL_HSHLD_PAPR_BABY -1.1% -7.3% -7.1% -10.2% -6.7% -6.0% 100.0% 4.7% 0.9% -7.7% -7.1% -6.6% -5.5% -6.5% -6.3% 3.8% 4.0% 6.5% 3.1% -11.2% 0.1% 0.3% 2.4% -8.2% -3.9% 3.2% -7.3% -0.2% 0.0% PCT_SL_DRY_SNX_CNDY 6.6% -7.3% -5.8% -10.9% -8.2% -5.8% 4.7% 100.0% 0.9% -4.1% -8.1% -10.0% -9.0% -2.4% -6.7% -0.7% 13.7% 34.5% 24.3% -11.7% 0.2% 12.8% 10.8% -8.1% -2.1% -10.9% -7.2% -4.4% 0.7% PCT_SL_HEALTHCARE -1.0% -5.1% -4.6% -8.1% -6.1% -5.4% 0.9% 0.9% 100.0% -5.7% -6.3% -7.5% -7.2% -7.0% -7.0% 3.9% 0.4% 2.1% 1.5% -8.2% -0.6% 0.6% 1.0% -5.8% -2.3% -7.7% -8.2% -2.7% -0.1% PCT_SL_ENTERTAINMENT -2.2% -3.7% -1.8% -5.8% -4.0% -2.6% -7.7% -4.1% -5.7% 100.0% -4.4% -5.5% -6.5% -2.2% -3.2% -6.8% -3.9% -6.1% -4.7% -3.0% 0.3% -2.2% -1.4% -3.2% -2.1% -5.3% 0.0% -2.5% 1.1% PCT_SL_DEC_HOME -2.0% -3.7% -2.3% -4.6% -3.6% -3.8% -7.1% -8.1% -6.3% -4.4% 100.0% 3.3% -0.6% -3.3% -4.8% -7.3% -5.6% -6.7% -3.6% -5.9% -0.9% -1.8% -1.8% -4.5% -3.4% -4.7% -5.0% -0.7% -0.6% PCT_SL_DOMESTICS -2.4% -3.2% -2.5% -5.0% -3.9% -4.0% -6.6% -10.0% -7.5% -5.5% 3.3% 100.0% 0.0% -5.1% -4.4% -7.5% -6.6% -7.7% -5.2% -7.5% -1.1% -2.6% -2.0% -4.3% -4.1% -5.2% -5.8% -1.6% -0.7% PCT_SL_HOUSEWARES -2.4% -6.5% -4.7% -9.4% -7.0% -5.0% -5.5% -9.0% -7.2% -6.5% 0.0% -0.9% 100.0% -6.7% -8.1% -8.6% -6.1% -7.1% -4.8% -8.2% -1.3% -2.8% -2.6% -5.7% -5.1% -8.1% -8.1% -2.5% -1.0% PCT_SL_STAT_SEASONAL -2.9% -4.5% -2.0% -6.9% -4.9% -2.7% -6.5% -2.4% -7.0% -2.2% -3.3% -5.1% -6.7% 100.0% -1.8% -7.3% -4.9% -7.6% -4.3% -9.3% -0.5% -3.0% -1.6% -6.9% -2.8% -4.5% -1.4% -3.4% -0.6% PCT_SL_BOYS_AND_GIRLS -2.1% -1.4% -1.2% -1.8% 6.8% 0.3% -6.3% -6.7% -7.0% -3.2% -4.8% -4.4% -8.1% -1.8% 100.0% -7.5% -7.2% -6.5% -4.6% -5.8% -0.4% -2.9% -0.6% -3.2% -1.7% 0.4% 4.3% -2.2% 0.0% PCT_SL_BEAUTY -2.9% -1.7% -0.9% -5.2% -5.3% -6.6% 3.8% -0.7% 3.9% -6.8% -7.3% -7.5% -8.6% -7.3% -7.5% 100.0% -1.8% -1.8% -0.7% -11.4% -1.1% -0.9% -0.1% -6.6% -2.8% -10.3% -10.3% -4.0% -0.6% PCT_SL_PETS_BEVERAGE 1.9% -5.5% -4.5% -8.0% -6.1% -5.0% 4.0% 13.7% 0.4% -3.9% -5.6% -6.6% -6.1% -4.9% -7.2% -1.8% 100.0% 14.1% 8.2% -8.2% 0.1% 5.9% 4.5% -4.8% -0.7% -8.4% -7.6% -3.5% 0.3% PCT_SL_MEAT_FRZN_DAIRY 15.4% -7.0% -5.4% -8.7% -6.4% -5.8% 6.5% 34.5% 2.1% -6.1% -6.7% -7.7% -7.1% -7.6% -6.5% -1.8% 14.1% 100.0% 43.6% -8.8% 1.2% 24.6% 18.7% -6.8% -1.5% -8.0% -7.6% -2.8% 1.6% PCT_SL_PRODUCE 18.8% -3.8% -3.1% -5.4% -4.7% -3.5% 3.1% 24.3% 1.5% -4.7% -3.6% -5.2% -4.8% -4.3% -4.6% -0.7% 8.2% 43.6% 100.0% -7.0% 1.6% 30.0% 17.6% -5.2% -1.4% -5.9% -5.9% -1.9% 1.5% PCT_SL_ELECTRONICS -1.3% -7.7% -5.9% -9.5% -6.1% -4.4% -11.2% -11.7% -8.2% -3.0% -5.9% -7.5% -8.2% -9.3% -5.8% -11.4% -8.2% -8.8% -7.0% 100.0% -0.7% -3.5% -2.8% -4.9% -3.5% -8.7% -4.8% -2.7% -0.8% PCT_SL_SYSTEMS_SERVICES 1.1% -0.7% -0.7% -1.1% -1.1% -0.7% 0.1% 0.2% 0.0% 0.3% -0.9% -1.1% -1.3% -0.5% -0.4% -1.1% 0.1% 1.2% 1.6% -0.7% 100.0% 1.8% 2.2% -1.0% -0.7% -1.1% 0.0% -0.1% 1.1% PCT_SL_DELI 19.8% -2.0% -1.6% -2.6% -2.3% -2.1% 0.3% 12.8% 0.0% -2.2% -1.8% -2.6% -2.8% -3.0% -2.9% -0.9% 5.9% 24.6% 30.0% -3.5% 1.8% 100.0% 15.1% -2.5% 0.7% -3.5% -3.2% -1.0% 1.1% PCT_SL_BAKERY 15.0% -1.7% -1.4% -1.8% -1.5% -1.4% 2.4% 10.8% 1.0% -1.4% -1.8% -2.0% -2.6% -1.6% -0.6% -0.1% 4.5% 18.7% 17.6% -2.8% 2.2% 15.1% 100.0% -2.3% -0.4% -2.5% -1.6% -1.1% 2.1% PCT_SL_MENS -2.0% -2.8% -1.7% -4.5% -1.1% -2.4% -8.2% -8.1% -5.8% -3.2% -4.5% -4.3% -5.7% -6.9% -3.2% -6.6% -4.8% -6.8% -5.2% -4.9% -1.0% -2.5% -2.3% 100.0% -2.1% -6.2% -5.5% -2.5% -1.1% PCT_SL_FOOD_SERVICE -0.8% -2.3% -1.2% -2.5% -1.1% -2.4% -3.9% -2.1% -2.3% -2.1% -3.4% -4.1% -5.1% -2.8% -1.7% -2.8% -0.7% -1.5% -1.4% -3.5% -0.7% 0.7% -0.4% -2.1% 100.0% -2.3% -2.2% -1.6% -0.3% PCT_SL_NWBRN_INF_TOD -2.2% -3.0% -3.5% -3.5% 0.2% -3.8% 3.2% -10.9% -7.7% -5.3% -4.7% -5.2% -8.1% -4.5% 0.4% -10.3% -8.4% -8.0% -5.9% -8.7% -1.1% -3.5% -2.5% -6.2% -2.3% 100.0% 0.0% 10.2% -0.1% PCT_SL_TOYS -2.4% -6.2% -4.1% -7.6% -2.9% 1.1% -7.3% -7.2% -8.2% 0.0% -5.0% -5.8% -8.1% -1.4% 4.3% -10.3% -7.6% -7.6% -5.9% -4.8% -0.7% -3.2% -1.6% -5.5% -2.2% 0.0% 100.0% -1.6% 0.0% PCT_SL_UNIDENTIFIED 1.0% -0.9% -2.0% -1.6% -1.5% -1.6% -0.2% -4.4% -2.7% -2.5% -0.7% -1.6% -2.5% -3.4% -2.2% -4.0% -3.5% -2.8% -1.9% -2.7% -0.1% -1.0% -1.1% -2.5% -1.6% 10.2% -1.6% 100.0% 1.5% PCT_SL_SPECIAL_PROJECT 1.0% -0.3% 0.0% -0.4% -0.4% -0.2% 0.0% 0.7% -0.1% 1.1% -0.6% -0.7% -1.0% -0.6% 0.0% -0.6% 0.3% 1.6% 1.5% -0.8% 1.1% 1.1% 2.1% -1.1% -0.3% -0.1% 0.0% 1.5% 100.0% Πίνακας 25. Πίνακας ανάλυσης συσχετίσεων μεταβλητών περιεχόμενου καλαθιού Ανάλυση παραγόντων μεταβλητών περιεχόμενου καλαθιού Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι 75

79 σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα, με τη πρώτη να είναι σχεδόν διπλάσια από τη δεύτερη. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 13 παράγοντες που εξηγούν περίπου το 54% της μεταβλητότητας όλων των μεταβλητών. Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared Component Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % Πίνακας 26. Πίνακας ανάλυσης παραγόντων μεταβλητών περιεχόμενου καλαθιού Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Όλοι οι συνδυασμοί KPIs και παραγόντων εμφανίζουν και θετικά και αρνητικά βάρη που αντιπροσωπεύουν τις διαφορές μεταξύ των διαφόρων τμημάτων που έχουν πραγματοποιηθεί αγορές. Component Transformation Matrix Component Πίνακας 27. Πίνακας ανάλυσης βαρών μεταβλητών περιεχόμενου καλαθιού 76

80 Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων πελατών με διαφορετικές συνήθειες σχετικά με την αγορά προϊόντων λιανικής. Component Score Coefficient Matrix Component PCT_SL_NON_RETAIL PCT_SL_INT_HOS_PERF PCT_SL_JEWELRY_ACCESS PCT_SL_READY_TO_WEAR PCT_SL_SHOES PCT_SL_SPORTING_GOODS PCT_SL_HSHLD_PAPR_BABY PCT_SL_DRY_SNX_CNDY PCT_SL_HEALTHCARE PCT_SL_ENTERTAINMENT PCT_SL_DEC_HOME PCT_SL_DOMESTICS PCT_SL_HOUSEWARES PCT_SL_STAT_SEASONAL PCT_SL_BOYS_AND_GIRLS PCT_SL_BEAUTY PCT_SL_PETS_BEVERAGE PCT_SL_MEAT_FRZN_DAIRY PCT_SL_PRODUCE PCT_SL_ELECTRONICS PCT_SL_SYSTEMS_SERVICES PCT_SL_DELI PCT_SL_BAKERY PCT_SL_MENS PCT_SL_FOOD_SERVICE PCT_SL_NWBRN_INF_TOD PCT_SL_TOYS PCT_SL_UNIDENTIFIED PCT_SL_SPECIAL_PROJECT Πίνακας 28. Πίνακας συντελεστών για κάθε KPI στους νέους factors Scree Plot μεταβλητών περιεχόμενου καλαθιού Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλα τα KPIs που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα του περιεχομένου του καλαθιού στις Εταιρείες Πώλησης Προϊόντων Λιανικής. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον 77

81 παράγοντα 8 όπου και οι τιμές των ιδιοτιμών παίρνουν τιμές μικρότερες της μονάδας. Στην περίπτωση αυτή δηλαδή θα επιλεγούν 8 παράγοντες. Γράφημα 18. Scree Plot μεταβλητών περιεχόμενου καλαθιού K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 8 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον αλγόριθμο k-means τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. Distances between Final Cluster Centers Cluster Cluster Cluster Cluster Cluster Cluster Cluster Cluster Cluster Πίνακας 29. Αποστάσεις μεταξύ των κέντρων των clusters της k-means 78

82 Γράφημα 19. Αποτελέσματα k-means τμηματοποίησης περιεχόμενου καλαθιού Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια απόφαση με συγκεκριμένα τμήματα του πελατολογίου. 79

83 5.2.2 Ανάλυση Συμπεριφοράς (Behavioral analysis) Για να γίνει εφικτή η ανάλυση της αγοραστικής συμπεριφοράς του εκάστοτε πελάτη χρησιμοποιήθηκαν μια σειρά συγκεκριμένων KPIs όπως φαίνονται στον παρακάτω πίνακα και με βάση αυτούς πραγματοποιήθηκε η ανάλυση στη συγκεκριμένη διάσταση. KPIs Ανάλυσης Συμπεριφοράς KPIs Behavioral analysis Ποσοστό πωλήσεων προϊόντων που είναι σε έκπτωση PCT_PRM_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε εκποίηση PCT_CLEARANCE_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε κυκλικές προσφορές PCT_CIRCULAR_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε προσωρινή μείωση τιμής PCT_TPC_SALES Ποσοστό πωλήσεων προϊόντων που είναι σε άλλο είδος προσφοράς PCT_OTHER_SALES Ποσοστό πωλήσεων προϊόντων που έγιναν με εκπτωτικά κουπόνια PCT_COUPON_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Α PCT_TENDER_TYPE1_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Β PCT_TENDER_TYPE2_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Γ PCT_TENDER_TYPE3_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Δ PCT_TENDER_TYPE4_SALES Ποσοστό πωλήσεων προϊόντων που βρίσκονται στη προσφορά Ε PCT_TENDER_TYPE5_SALES Μέση ευαισθησία τιμής προϊόντων PRICE_SENSITIVITY Βαθμός πίστης σε συγκεκριμένη μάρκα προϊόντων (Brand) BRAND_LOYALTY Ποσοστό πωλήσεων προϊόντων ιδιωτικής ετικέτας BR_PRIVATE_LABEL Ποσοστό πωλήσεων προϊόντων αποκλειστικής ετικέτας BR_EXCLUSIVE Ποσοστό πωλήσεων προϊόντων εθνικής ετικέτας BR_NATIONAL Πίνακας 30. Πίνακας ανάλυσης συμπεριφοράς (Behavioral analysis) Ανάλυσης συχνοτήτων μεταβλητών ανάλυσης συμπεριφοράς Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των μεταβλητών που αναφέρονται στην ανάλυση συμπεριφοράς. Παρουσιάζεται βασικές στατιστικές μετρικές όπως είναι ο μέσος όρος, η ελάχιστη και η μέγιστη τιμή, η τυπική απόκλιση και τα βασικά εκατοστημόρια. Με το πίνακα αυτό σχηματίζουμε μια πρώτη εικόνα για τη ποιότητα και το είδος των δεδομένων που θα χρησιμοποιηθούν στην ανάλυση. 80

84 Std. Percentile Percentile Percentile Percentile Percentile Percentile Percentile N of valid Missing Mean Median Variance Min Max Sum Deviation 1% 10% 25% 50% 75% 90% 99% Perc_prm_sales 150, Perc_clearance_sales 150, Perc_circ_sales 150, Perc_tpc_sales 150, Perc_coupon_sales 150, Perc_oth_sales 150, Perc_oth2_sales 150, PCT_SL_TGT_Owned 150, PCT_SL_NTL_National 150, PCT_SL_MKT_Market 150, PCT_SL_NTL_Exclusive 150, PCT_SL_TGT_Exclusive 150, PCT_SL_Unknown 150, PCT_SL_TGT_Designer 150, Brand_Loyalty 150, Price_Sensitivity 150, PCT_SL_CC 150, PCT_SL_Debit 150, PCT_SL_OtherTT 150, PCT_SL_Target_Card 150, PCT_SL_Banking_Accts 150, Πίνακας 31. Πίνακας ανάλυσης συχνοτήτων μεταβλητών περιεχόμενου καλαθιού Ανάλυση συσχετίσεων μεταβλητών ανάλυσης συμπεριφοράς Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των μεταβλητών που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση συμπεριφοράς των πελατών. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα δεν εντοπίζεται κανένας συνδυασμός KPIs που να έχει μεγάλη συσχέτιση (>75%), επομένως δε θα εξαιρεθεί κανένα. Selected Correlation >75% Perc_cle Perc_pr Perc_cir arance_ m_sales c_sales sales Perc_tpc _sales Perc_co upon_sa les Perc_oth _sales PCT_SL Perc_oth 2_sales _TGT_O wned PCT_SL PCT_SL PCT_SL PCT_SL PCT_SL _NTL_N _MKT_M _NTL_E _TGT_Ex _Unkno ational arket xclusive clusive wn PCT_SL Brand_l _TGT_D oyalty esigner price_se PCT_SL PCT_SL nsitivity _CC _Debit PCT_SL PCT_SL PCT_SL _OtherT _Target Bankin T Card g_accts Perc_prm_sales 100% 40% 61% 40% 8% 25% 11% 1% 4% -9% -2% 3% -2% 0% -3% -1% 0% -3% -2% 8% 2% Perc_clearance_sales 40% 100% -8% -7% 1% -3% 1% 11% -17% -3% 6% 17% 3% 6% -7% -10% -3% 1% 1% 2% 0% Perc_circ_sales 61% -8% 100% -7% 3% -8% -1% -3% 11% -6% -2% -2% -7% -2% -1% -2% 4% 0% -14% 6% 2% Perc_tpc_sales 40% -7% -7% 100% 4% -7% 0% -5% 16% -4% -5% -5% -8% -2% -5% -5% 1% 0% -9% 6% 1% Perc_coupon_sales 8% 1% 3% 4% 100% -1% 2% 0% 5% 1% -2% -3% -4% 0% -10% -5% 0% -5% -3% 12% 0% Perc_oth_sales 25% -3% -8% -7% -1% 100% -2% -3% -9% -2% -2% 0% 15% 0% 4% 17% -9% -10% 35% -2% -1% Perc_oth2_sales 11% 1% -1% 0% 2% -2% 100% 5% -3% -2% 0% 3% -1% 0% -7% -5% -1% 2% -4% 2% -1% PCT_SL_TGT_Owned 1% 11% -3% -5% 0% -3% 5% 100% -43% -8% -6% 1% -21% -1% -10% -12% 2% 3% -7% -1% 0% PCT_SL_NTL_National 4% -17% 11% 16% 5% -9% -3% -43% 100% -16% -22% -31% -56% -9% 12% -4% 5% 3% -18% 4% 1% PCT_SL_MKT_Market -9% -3% -6% -4% 1% -2% -2% -8% -16% 100% -5% -6% -11% -2% -4% 4% 3% -3% -1% 0% 0% PCT_SL_NTL_Exclusive -2% 6% -2% -5% -2% -2% 0% -6% -22% -5% 100% 2% -9% 1% -9% -6% 2% 1% -4% -2% 0% PCT_SL_TGT_Exclusive 3% 17% -2% -5% -3% 0% 3% 1% -31% -6% 2% 100% -6% 4% -10% -8% -2% 4% -1% -1% 0% PCT_SL_Unknown -2% 3% -7% -8% -4% 15% -1% -21% -56% -11% -9% -6% 100% -3% -1% 17% -8% -7% 28% -2% -2% PCT_SL_TGT_Designer 0% 6% -2% -2% 0% 0% 0% -1% -9% -2% 1% 4% -3% 100% -9% -2% 0% 0% 0% 1% 0% Brand_loyalty -3% -7% -1% -5% -10% 4% -7% -10% 12% -4% -9% -10% -1% -9% 100% 19% 1% 2% 9% -15% 1% price_sensitivity -1% -10% -2% -5% -5% 17% -5% -12% -4% 4% -6% -8% 17% -2% 19% 100% -3% -11% 30% -5% 0% PCT_SL_CC 0% -3% 4% 1% 0% -9% -1% 2% 5% 3% 2% -2% -8% 0% 1% -3% 100% -66% -25% -27% -9% PCT_SL_Debit -3% 1% 0% 0% -5% -10% 2% 3% 3% -3% 1% 4% -7% 0% 2% -11% -66% 100% -27% -28% -10% PCT_SL_OtherTT -2% 1% -14% -9% -3% 35% -4% -7% -18% -1% -4% -1% 28% 0% 9% 30% -25% -27% 100% -9% -4% PCT_SL_Target_Card 8% 2% 6% 6% 12% -2% 2% -1% 4% 0% -2% -1% -2% 1% -15% -5% -27% -28% -9% 100% -3% PCT_SL_Banking_Accts 2% 0% 2% 1% 0% -1% -1% 0% 1% 0% 0% 0% -2% 0% 1% 0% -9% -10% -4% -3% 100% Πίνακας 32. Πίνακας ανάλυσης συσχετίσεων μεταβλητών ανάλυσης συμπεριφοράς 81

85 Ανάλυση παραγόντων μεταβλητών ανάλυσης συμπεριφοράς Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 10 παράγοντες που εξηγούν περίπου το 67% της μεταβλητότητας όλων των μεταβλητών. Component Total Total Variance Explained Initial Eigenvalues Extraction Sums of Rotation Sums of Squared % of Variance Cumulative % Total % of Cumulative Variance % Total % of Variance Cumulative % Πίνακας 33. Πίνακας ανάλυσης παραγόντων μεταβλητών ανάλυσης συμπεριφοράς Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Όλοι οι συνδυασμοί KPIs και παραγόντων εμφανίζουν και θετικά και αρνητικά βάρη που αντιπροσωπεύουν τις διαφορές μεταξύ των συμπεριφορών των πελατών όταν χρησιμοποιούν κάποιο είδος προφοράς για τις αγορές τους. 82

86 Component Transformation Matrix Component Πίνακας 34. Πίνακας ανάλυσης βαρών μεταβλητών συμπεριφοράς Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων πελατών με διαφορετικές συμπεριφορές αγοράς προϊόντων λιανικής ανάλογα το είδος της προσφοράς που υπάρχει ή ανεξαρτήτου αυτής. Component Score Coefficient Matrix Component Perc_prm_sales Perc_clearance_sales Perc_circ_sales Perc_tpc_sales Perc_coupon_sales Perc_oth_sales Perc_oth2_sales PCT_SL_TGT_Owned PCT_SL_NTL_National PCT_SL_MKT_Market PCT_SL_NTL_Exclusive PCT_SL_TGT_Exclusive PCT_SL_Unknown PCT_SL_TGT_Designer Brand_Loyalty Price_Sensitivity PCT_SL_CC PCT_SL_Debit PCT_SL_OtherTT PCT_SL_Target_Card PCT_SL_Banking_Accts Πίνακας 35. Πίνακας συντελεστών για κάθε KPI συμπεριφοράς στους νέους factors 83

87 Scree Plot μεταβλητών ανάλυσης συμπεριφοράς Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλες τις μεταβλητές που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα της ανάλυσης συμπεριφοράς των πελατών των εταιρειών πώλησης προϊόντων λιανικής. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 6 όπου και οι τιμές των ιδιοτιμών παίρνουν τιμές λίγο μεγαλύτερες από τη μονάδα. Στην περίπτωση αυτή θα επιλεγούν 6 παράγοντες. Ανάλογα βέβαια με την επιχειρησιακή ερμηνεία των συγκεκριμένων KPIs ο οργανισμός μπορεί να αποφασίσει να επιλέξει και τη λύση των 10 KPIs, όπου ουσιαστικά είναι το τελευταίο σημείο όπου οι τιμές των ιδιοτιμών βρίσκονται οριακά πάνω από τη μονάδα. Γράφημα 20. Scree Plot μεταβλητών ανάλυσης συμπεριφοράς 84

88 K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 6 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον αλγόριθμο k-means τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. Distances between Final Cluster Centers Cluster Cluster Cluster Cluster Cluster Cluster Cluster Πίνακας 36. Αποστάσεις μεταξύ των κέντρων των clusters (k-means) Γράφημα 21. Γράφημα αποτελεσμάτων k-means τμηματοποίησης ανάλυσης συμπεριφοράς Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια απόφαση με συγκεκριμένα τμήματα του πελατολογίου. 85

89 5.3 Εταιρεία Τηλεπικοινωνιών (Telecommunications) Για την πραγματοποίηση της ποσοτικής ανάλυσης που αφορά τις Εταιρείες Τηλεπικοινωνιών χρησιμοποιήθηκε ένα δείγμα από τα πρωτογενή δεδομένα σχετικά με συμβόλαια κινητής τηλεφωνίας, χρήση υπηρεσιών, κατοχή συσκευών και εξειδικευμένες υπηρεσίες που παρέχονται σε πελάτες (7.500 πελάτες) μιας μεγάλης εταιρείας Τηλεπικοινωνιών που δραστηριοποιείται στην Ελλάδα. Για να γίνει εφικτή η ανάλυση της επιλεγμένης εταιρείας τηλεπικοινωνιών χρησιμοποιήθηκαν μια σειρά συγκεκριμένων δεικτών όπως φαίνονται στον παρακάτω πίνακα. Η πλήρης λίστα των KPIs παρατίθεται στο παράρτημα της εργασίας. KPIs Telecommunications TTL_ACT_INACT_SIMS STATUS_ACTIVE_CNT STATUS_INACTIVE_CNT CNTRCT_Fixed_CNT CNTRCT_PostPay_CNT DURATION_12_CNT DURATION_18_CNT DURATION_24_CNT MI_FLAG_0_CNT MI_FLAG_1_CNT PCT_STATUS_ACTIVE_CNT PCT_STATUS_INACTIVE_CNT AVG_SUBSIDY CUSTOMER_AGE_MONTHS ACT_MIN_START_DATE TTL_BR TTL_ARPU TTL_MARPU TAVG_BR KPIs Εταιρείας Τηλεπικοινωνιών Συνολικός αριθμός συνδέσεων πελάτη Αριθμός ενεργών συνδέσεων Αριθμός ανενεργών συνδέσεων Αριθμός συνδέσεων καρτοσυμβολαίου Αριθμός συνδέσεων συμβολαίου Αριθμός συνδέσεων συμβολαίου 12μηνης διάρκειας Αριθμός συνδέσεων συμβολαίου 18μηνης διάρκειας Αριθμός συνδέσεων συμβολαίου 24μηνης διάρκειας Αριθμός πελατών που δεν είναι χρήστες mobile internet Αριθμός πελατών που είναι χρήστες mobile internet Ποσοστό ενεργών συνδέσεων πελάτη Ποσοστό ανενεργών συνδέσεων πελάτη Μέση επιδότηση ανά σύνδεση Μήνες με την εταιρεία Πρώτη ημερομηνία έναρξης όλων των ενεργών συνδέσεων του πελάτη Συνολικό τιμολογημένο έσοδο πελάτη τα τελευταία δύο χρόνια Συνολικό μέσο έσοδο πελάτη τα τελευταία δύο χρόνια Συνολικό οριακό έσοδο πελάτη τα τελευταία δύο χρόνια Μέσο τιμολογημένο έσοδο πελάτη ανά μήνα 86

90 TAVG_ARPU TAVG_MARPU SIXM_DLT_BR SIXM_DLT_ARPU SIXM_DLT_MARPU DEVICE_25G_CNT DEVICE_ANDROID_CNT DEVICE_APPLE_CNT DEVICE_BLACKBER_CNT DEVICE_SYMBIAN_CNT DEVICE_TABLET_CNT DEVICE_WINDOWS_CNT TTL_VOICE_TOTAL_CNT_LM TTL_VOICE_INC_CNT_LM TTL_VOICE_OUTG_CNT_LM TTL_VOICE_OUTG_COMP_CNT_L M TTL_VOICE_OUTG_INTRN_CNT_L M TTL_SMS_INC_CNT_LM Μέσο συνολικό έσοδο πελάτη ανά μήνα Μέσο οριακό έσοδο πελάτη ανά μήνα Ποσοστιαία μεταβολή τιμολογημένου εσόδου των 2 τελευταίων εξαμήνων Ποσοστιαία μεταβολή συνολικού εσόδου των 2 τελευταίων εξαμήνων Ποσοστιαία μεταβολή οριακού εσόδου των 2 τελευταίων εξαμήνων Αριθμός συσκευών G Αριθμός συσκευών Android Αριθμός συσκευών Apple Αριθμός συσκευών Blackberry Αριθμός συσκευών Symbian Αριθμός συσκευών tablets Αριθμός συσκευών Windows Συνολικός αριθμός κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εισερχόμενων κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων κλήσεων σε άλλο δίκτυο ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων διεθνών κλήσεων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εισερχόμενων μηνυμάτων ανά πελάτη το τελευταίο μήνα Συνολικός αριθμός εξερχόμενων μηνυμάτων ανά πελάτη το τελευταίο μήνα Πίνακας 37. Πίνακας εταιρείας τηλεπικοινωνιών (Telecommunications) TTL_SMS_OUTG_CNT_LM Ανάλυσης συχνοτήτων μεταβλητών Εταιρείας Τηλεπικοινωνιών Στο σημείο αυτό παρουσιάζεται η ανάλυση των συχνοτήτων των μεταβλητών που αναφέρονται στην ανάλυση συμπεριφοράς. Παρουσιάζεται βασικές στατιστικές μετρικές όπως είναι ο μέσος όρος, η ελάχιστη και η μέγιστη τιμή, η τυπική απόκλιση και τα βασικά εκατοστημόρια. Με το πίνακα αυτό σχηματίζουμε μια πρώτη εικόνα για τη ποιότητα και το είδος των δεδομένων που θα χρησιμοποιηθούν στην ανάλυση. 87

91 N Missing Mean Median Std. Deviation Variance Min Max Sum Perc 50% Perc 75% TTL_ACT_INACT_SIMS STATUS_ACTIVE_CNT STATUS_INACTIVE_CNT CNTRCT_BPOS_CNT CNTRCT_DataFax_CNT CNTRCT_EasyContract_CNT CNTRCT_Fixed_CNT CNTRCT_GPDAT_CNT CNTRCT_NonGSMOwn_CNT CNTRCT_PostPay_CNT CNTRCT_WebEx_CNT DURATION_12_CNT DURATION_18_CNT DURATION_24_CNT DURATION_MISS_CNT SEG_HVSME_CNT SEG_MAJOR_ACCOUNT_CNT MI_FLAG_0_CNT MI_FLAG_1_CNT M2M_FLAG_0_CNT M2M_FLAG_1_CNT TARF_Adsl_CNT TARF_Data_CNT TARF_Employee_CNT TARF_Fixed_Solu_CNT TARF_Kartopro_CNT TARF_Office_Hom_CNT TARF_Prepay_CNT TARF_Sms_CNT TARF_Vbc_CNT TARF_Voice_CNT TARF_Vshop_CNT TARF_MISS_CNT TARF_TYPE_Business_CNT TARF_TYPE_Consumer_CNT Πίνακας 38. Πίνακας ανάλυσης συχνοτήτων μεταβλητών εταιρείας τηλεπικοινωνιών Ανάλυση συσχετίσεων μεταβλητών Εταιρείας Τηλεπικοινωνιών Στη συνέχεια παρουσιάζεται ο πίνακας ανάλυσης συσχετίσεων μεταξύ όλων των μεταβλητών που περιέχονται στο αρχείο των δεδομένων για τη συγκεκριμένη ανάλυση της εταιρείας τηλεπικοινωνιών. Με βάση αυτό το πίνακα μπορεί να προσδιοριστεί ο βαθμός της συσχέτισης κάθε KPI με όλα τα άλλα KPIs. Όσο μεγαλύτερη είναι η τιμή της συσχέτισης μεταξύ δύο μεταβλητών, τόσο μεγαλύτερη εξάρτηση υπάρχει ανάμεσα σε αυτά τα KPIs. Σε αυτό το πίνακα μπορούμε να εντοπίσουμε τα KPIs που δεν έχουν μεγάλη συσχέτιση μεταξύ τους για να χρησιμοποιηθούν στη συνέχεια. Στο συγκεκριμένο παράδειγμα εντοπίζονται αρκετοί συνδυασμοί KPIs που έχουν μεγάλη συσχέτιση (>75%), επομένως θα εξαιρεθούν από τη συνέχεια της ανάλυσης. 88

92 Correlation >75% STATUS_ DURATIO DURATIO DURATI ACTIVE_ N_18_CN N_24_CN ON_MIS CNT T T S_CNT TARF_Da ta_cnt TARF_E TARF_Off TARF_Pr TARF_S mployee_ ice_hom epay_cn ms_cnt CNT _CNT T AVG_SU BSIDY CUSTOM CUSTOM ER_AGE ER_AGE _MONTH _YEARS S TTL_BR TTL_AR PU TTL_MA RPU AVG_BR _LY AVG_AR PU_LY PCT_DE PCT_DE PCT_DE PCT_DE PCT_DE PCT_DEV PCT_DEV AVG_INV TTL_SIM AVG_INV AVG_MA VICE_AN VICE_BL VICE_SY VICE_TA VICE_WI ICE_25G_ ICE_APP D_VALU S_INV_L D_VALU RPU_LY DROID_C ACKBER MBIAN_C BLET_CN NDOWS_ CNT LE_CNT E_CY Y E_LY NT _CNT NT T CNT STATUS_ACTIVE_CNT 100% 14% 20% 52% 57% 0% 0% 0% 7% -3% 15% 15% 67% 68% 69% -5% -5% -6% -9% -4% -9% 0% -4% 0% 2% -13% 73% -6% 64% DURATION_18_CNT 14% 100% 0% 3% 3% 0% 2% 0% 0% 0% 1% 1% 11% 12% 11% -3% -3% -3% 0% 0% 1% 1% -1% 0% -1% -3% 20% -3% 9% DURATION_24_CNT 20% 0% 100% 8% 26% 0% 0% 0% 0% 9% 3% 3% 27% 27% 28% -1% -1% -1% -3% -1% 0% 1% -2% 12% 0% -1% 15% -1% 12% DURATION_MISS_CNT 52% 3% 8% 100% 10% 0% -1% 1% 2% -18% 11% 11% 23% 23% 23% 4% 4% 3% -14% -8% -8% -2% -6% -2% -2% -11% 19% 3% 18% TARF_Data_CNT 57% 3% 26% 10% 100% 2% 0% 0% 6% -4% 10% 10% 35% 35% 36% -6% -6% -7% -10% -6% -7% 0% -5% 5% 5% -9% 46% -7% 20% TARF_Employee_CNT 0% 0% 0% 0% 2% 100% 1% 0% 0% -3% 0% 0% -1% -1% -1% -2% -2% -2% -2% 1% 2% -1% -1% 0% 0% -2% 0% -2% 0% TARF_Office_Hom_CNT 0% 2% 0% -1% 0% 1% 100% 0% 0% -5% 0% 0% 0% 0% 0% -3% -3% -3% -3% -2% -3% -2% -2% -1% -2% -4% 1% -3% 1% TARF_Prepay_CNT 0% 0% 0% 1% 0% 0% 0% 100% 0% -1% 1% 1% 1% 1% 1% -1% -1% -1% 1% 0% -1% 0% 0% 0% 0% -1% 1% -1% 1% TARF_Sms_CNT 7% 0% 0% 2% 6% 0% 0% 0% 100% -1% 3% 3% 11% 11% 12% 3% 3% 4% -4% -1% 0% -1% -1% -1% 3% -2% 26% 7% 4% AVG_SUBSIDY -3% 0% 9% -18% -4% -3% -5% -1% -1% 100% 4% 4% 15% 15% 15% 10% 11% 10% 8% 8% 17% 14% 10% -2% 5% 19% 2% 11% 7% CUSTOMER_AGE_MONTHS 15% 1% 3% 11% 10% 0% 0% 1% 3% 4% 100% 100% 23% 23% 24% 15% 15% 15% -6% -5% 4% 3% 6% 1% 2% 7% 14% 13% 16% CUSTOMER_AGE_YEARS 15% 1% 3% 11% 10% 0% 0% 1% 3% 4% 100% 100% 23% 23% 24% 15% 15% 15% -6% -5% 4% 3% 6% 1% 2% 7% 14% 13% 16% TTL_BR 67% 11% 27% 23% 35% -1% 0% 1% 11% 15% 23% 23% 100% 100% 99% 14% 14% 13% -8% 0% -2% 12% 0% 4% 1% 10% 65% 15% 66% TTL_ARPU 68% 12% 27% 23% 35% -1% 0% 1% 11% 15% 23% 23% 100% 100% 100% 14% 13% 12% -7% 0% -2% 12% 1% 3% 1% 9% 66% 14% 67% TTL_MARPU 69% 11% 28% 23% 36% -1% 0% 1% 12% 15% 24% 24% 99% 100% 100% 13% 13% 12% -7% 0% -2% 11% 1% 4% 1% 8% 68% 14% 68% AVG_BR_LY -5% -3% -1% 4% -6% -2% -3% -1% 3% 10% 15% 15% 14% 14% 13% 100% 100% 98% -11% -3% 20% 22% 2% 7% -1% 54% -6% 92% 1% AVG_ARPU_LY -5% -3% -1% 4% -6% -2% -3% -1% 3% 11% 15% 15% 14% 13% 13% 100% 100% 98% -10% -2% 21% 21% 3% 7% -1% 55% -6% 92% 1% AVG_MARPU_LY -6% -3% -1% 3% -7% -2% -3% -1% 4% 10% 15% 15% 13% 12% 12% 98% 98% 100% -10% -2% 21% 21% 1% 7% -1% 53% -7% 91% 0% PCT_DEVICE_25G_CNT -9% 0% -3% -14% -10% -2% -3% 1% -4% 8% -6% -6% -8% -7% -7% -11% -10% -10% 100% -8% -23% -23% 0% -16% -6% -12% -5% -13% -4% PCT_DEVICE_ANDROID_CNT -4% 0% -1% -8% -6% 1% -2% 0% -1% 8% -5% -5% 0% 0% 0% -3% -2% -2% -8% 100% -10% -11% -1% -7% 1% 2% -3% -3% 4% PCT_DEVICE_APPLE_CNT -9% 1% 0% -8% -7% 2% -3% -1% 0% 17% 4% 4% -2% -2% -2% 20% 21% 21% -23% -10% 100% -4% -8% 11% -4% 31% -7% 23% -1% PCT_DEVICE_BLACKBER_CNT 0% 1% 1% -2% 0% -1% -2% 0% -1% 14% 3% 3% 12% 12% 11% 22% 21% 21% -23% -11% -4% 100% -8% 4% -5% 29% 0% 23% 5% PCT_DEVICE_SYMBIAN_CNT -4% -1% -2% -6% -5% -1% -2% 0% -1% 10% 6% 6% 0% 1% 1% 2% 3% 1% 0% -1% -8% -8% 100% -6% 4% 1% -1% 1% 2% PCT_DEVICE_TABLET_CNT 0% 0% 12% -2% 5% 0% -1% 0% -1% -2% 1% 1% 4% 3% 4% 7% 7% 7% -16% -7% 11% 4% -6% 100% -3% 10% -1% 9% 1% PCT_DEVICE_WINDOWS_CNT 2% -1% 0% -2% 5% 0% -2% 0% 3% 5% 2% 2% 1% 1% 1% -1% -1% -1% -6% 1% -4% -5% 4% -3% 100% 2% 2% -1% 1% AVG_INVD_VALUE_CY -13% -3% -1% -11% -9% -2% -4% -1% -2% 19% 7% 7% 10% 9% 8% 54% 55% 53% -12% 2% 31% 29% 1% 10% 2% 100% -10% 64% -2% TTL_SIMS_INV_LY 73% 20% 15% 19% 46% 0% 1% 1% 26% 2% 14% 14% 65% 66% 68% -6% -6% -7% -5% -3% -7% 0% -1% -1% 2% -10% 100% -7% 58% AVG_INVD_VALUE_LY -6% -3% -1% 3% -7% -2% -3% -1% 7% 11% 13% 13% 15% 14% 14% 92% 92% 91% -13% -3% 23% 23% 1% 9% -1% 64% -7% 100% 1% TROUBLE_CNT 64% 9% 12% 18% 20% 0% 1% 1% 4% 7% 16% 16% 66% 67% 68% 1% 1% 0% -4% 4% -1% 5% 2% 1% 1% -2% 58% 1% 100% TROUBL E_CNT Πίνακας 39. Πίνακας ανάλυσης συσχετίσεων μεταβλητών εταιρείας τηλεπικοινωνιών Ανάλυση παραγόντων μεταβλητών Εταιρείας Τηλεπικοινωνιών Στο σημείο αυτό εφαρμόζουμε τη μέθοδο ανάλυσης παραγόντων (factor analysis) χρησιμοποιώντας τη τεχνική ανάλυσης κυρίων συνιστωσών (principal component analysis). Με την εκτέλεση της συγκεκριμένης ανάλυσης προκύπτει μια σειρά από εξερχόμενους πίνακες που αναφέρονται σε συγκεκριμένους σημαντικούς παράγοντες που δημιουργούνται. Στο πρώτο πίνακα που εμφανίζει τις ιδιοτιμές των παραγόμενων παραγόντων καθώς και το ποσοστό που ερμηνεύει η κάθε μια. Στο πλαίσιο που είναι σημειωμένο με πορτοκαλί χρώμα, φαίνονται όλοι οι παράγοντες που έχουν ιδιοτιμή πάνω από τη μονάδα. Σε εαυτή τη περίπτωση έχουν δημιουργηθεί 16 παράγοντες που εξηγούν περίπου το 71% της μεταβλητότητας όλων των μεταβλητών. 89

93 Component Total Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % Πίνακας 40. Πίνακας ανάλυσης παραγόντων μεταβλητών εταιρείας τηλεπικοινωνιών 90

94 Στο παρακάτω πίνακα εμφανίζονται οι ανεξάρτητες μεταβλητές στις γραμμές και οι παράγοντες στις στήλες. Οι τιμές που βλέπουμε αποτελούν τα βάρη/loadings. Component Transformation Matrix Component Πίνακας 41. Πίνακας ανάλυσης βαρών μεταβλητών εταιρείας τηλεπικοινωνιών Προχωρώντας παρακάτω βλέπουμε το πίνακα με τους συντελεστές και το βάρος που έχει κάθε αρχικό KPI στους νέους παράγοντες που έχουν δημιουργηθεί. Ουσιαστικά ο κάθε νέος παράγοντας που δημιουργείται αποτελείται από τα KPIs πολλαπλασιασμένα με τον κατάλληλο συντελεστή (coefficient). Με αυτό τον τρόπο δημιουργούνται οι factors που θα χρησιμοποιηθούν στη συνέχεια στη τεχνική τμηματοποίησης του πελατολογίου για τη δημιουργία τμημάτων πελατών με διαφορετικό τρόπο χρήσης των κινητών συσκευών, των συμβολαίων και των υπηρεσιών που χρησιμοποιούν. 91

95 Component Score Coefficient Matrix Component STATUS_ACTIVE_CNT DURATION_18_CNT DURATION_24_CNT DURATION_MISS_CNT TARF_Data_CNT TARF_Employee_CNT TARF_Office_Hom_CNT TARF_Prepay_CNT TARF_Sms_CNT AVG_SUBSIDY CUSTOMER_AGE_MONTHS CUSTOMER_AGE_YEARS TTL_BR TTL_ARPU TTL_MARPU AVG_BR_LY AVG_ARPU_LY AVG_MARPU_LY PCT_DEVICE_25G_CNT PCT_DEVICE_ANDROID_CNT PCT_DEVICE_APPLE_CNT PCT_DEVICE_BLACKBER_CNT PCT_DEVICE_SYMBIAN_CNT PCT_DEVICE_TABLET_CNT PCT_DEVICE_WINDOWS_CNT AVG_INVD_VALUE_CY TTL_SIMS_INV_LY AVG_INVD_VALUE_LY TROUBLE_CNT TTL_VOICE_OUTG_INTRN_CNT TTL_VOICE_OUTG_ROAM_CNT TTL_SMS_TOTAL_CNT TTL_SMS_INC_CNT TTL_SMS_OUTG_CNT TTL_SMS_OUTG_ROAM_CNT TTL_DATA_CNT TTL_TOTAL_VOICE_SMS_CNT TTL_VOICE_TOTAL_CHR TTL_DATA_VOL TTL_SMS_TOTAL_CHR_CY TTL_SMS_INC_CHR_CY TTL_SMS_OUTG_CHR_CY TTL_SMS_OUTG_ROAM_CHR_CY TTL_DATA_CHR_CY TTL_OTHER_CHR_CY TTL_DATA_VOL_CY TTL_VOICE_OUTG_INTRN_DUR_CY TTL_OTHER_DUR_CY AVG_SMS_INC_CNT_CY AVG_SMS_OUTG_ROAM_CNT_CY AVG_DATA_CNT_CY AVG_OTHER_CNT_CY AVG_VOICE_OUTG_INTRN_CHR_CY AVG_VOICE_OUTG_ROAM_CHR_CY AVG_SMS_INC_CHR_CY AVG_SMS_OUTG_ROAM_CHR_CY AVG_DATA_CHR_CY AVG_TOTAL_VOICE_SMS_CHR_CY AVG_OTHER_CHR_CY AVG_DATA_VOL_CY Πίνακας 42. Συντελεστές για κάθε KPI εταιρείας τηλεπικοινωνιών στους νέους factors 92

96 5.3.4 Scree Plot μεταβλητών Εταιρείας Τηλεπικοινωνιών Το διάγραμμα Scree που παρουσιάζεται στη συνέχεια, δείχνει το αποτέλεσμα της ανάλυσης συσχετίσεων για όλα τα KPIs που χρησιμοποιήθηκαν κατά την ανάλυση και επιλογή των κατάλληλων δεικτών KPIs για το παράδειγμα της ανάλυσης συμπεριφοράς και χρήσης υπηρεσιών των πελατών κινητής τηλεφωνίας. Το σημείο πάνω στο διάγραμμα που έχει την μεγαλύτερη αξία για την επιλογή των κατάλληλων KPIs είναι το σημείο που η καμπύλη αρχίζει να εμφανίζει ομαλή μείωση των ιδιοτιμών και φαίνεται να σταθεροποιείται στα δεξιά του σημείου αυτού. Στο παρακάτω διάγραμμα φαίνεται ότι η καμπύλη αρχίζει να εμφανίζει ομαλή πτώση των ιδιοτιμών μετά τον παράγοντα 16 όπου και οι τιμές των ιδιοτιμών παίρνουν τιμές μεγαλύτερες από τη μονάδα. Στην περίπτωση αυτή θα επιλεγούν 16 παράγοντες. Γράφημα 22. Scree Plot μεταβλητών εταιρείας τηλεπικοινωνιών 93

97 5.3.5 K-Means τμηματοποίηση αποτελεσμάτων με βάση τα επιλεγμένα KPIs Με βάση το προηγούμενο διάγραμμα συμπεραίνουμε ότι τα 16 KPIs είναι οι κατάλληλοι δείκτες για να χρησιμοποιηθούν στον αλγόριθμο k-means τμηματοποίησης του πελατολογίου του οργανισμού. Χρησιμοποιώντας τους δείκτες αυτούς καταλήγουμε στο ακόλουθο αποτέλεσμα τμηματοποίησης. Distances between Final Cluster Centers Cluster Πίνακας 43. Αποστάσεις μεταξύ των κέντρων των clusters (k-means) Γράφημα 23. Αποτελέσματα k-means τμηματοποίησης εταιρείας τηλεπικοινωνιών Με βάση αυτό το αποτέλεσμα της τμηματοποίησης του πελατολογίου του συγκεκριμένου οργανισμού, μπορεί να υλοποιηθεί μια ανάλυση του προφίλ (profiling) των συγκεκριμένων τμημάτων με βάση δημογραφικά, οικονομικά, γεωγραφικά και άλλα κριτήρια και να παρουσιαστούν αναλυτικά χαρακτηριστικά για κάθε cluster που έχει δημιουργηθεί, έτσι ώστε να μπορέσει να ληφθεί όποια απόφαση με συγκεκριμένα τμήματα του πελατολογίου. 94

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ

Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ Βασίλης Γ. Αγγέλης Δρ. Μηχανικός Η/Υ και Πληροφορικής Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ Μετατρέψτε τα δεδομένα σας σε κέρδος Αθήνα Κάθε γνήσιο αντίγραφο έχει την υπογραφή του συγγραφέα Έκδοση 1 η, Copyright 2007

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Δ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Ενότητα 5: Ανάλυση στοιχείων. Θεόδωρος Χατζηπαντελής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής Data Mining: Στοχεύοντας στους σωστούς πελάτες To CRM front-office πελατών Οι Προμηθευτές Οι Πελάτες ΟΟργανισμός Τροφοδότηση ενεργειών Μάρκετινγκ ΒΙ Απόταδεδομέναστηγνώση Επιχειρηματική Γνώση Επιχειρηματικοί

Διαβάστε περισσότερα

Έρευνα Μάρκετινγκ Ενότητα 5

Έρευνα Μάρκετινγκ Ενότητα 5 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5 : Μέθοδοι Στατιστικής Ανάλυσης Χριστίνα Μπουτσούκη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ Δομή παρουσίασης Εισαγωγή Βασικές Έννοιες Σχετικές μελέτες Εφαρμογή Δεδομένων Συμπεράσματα Εισαγωγή Μελέτη και προσαρμογή των διάφορων

Διαβάστε περισσότερα

Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας

Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας Περίληψη (τυπική έκταση: 2-3 παράγραφοι) Η Περίληψη συνοψίζει την εργασία και τα κύρια ευρήματα αυτής με τέτοιον τρόπο, ώστε

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 7: Παρουσίαση δεδομένων-περιγραφική στατιστική Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 8: Ομαδοποίηση Μέρος B Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική ΕΕΟ 11 Η χρήση στατιστικών εργαλείων στην εκτιμητική 1. Εισαγωγή 2. Προϋποθέσεις χρήσης των Αυτοματοποιημένων Εκτιμητικών Μοντέλων (ΑΕΜ) 3. Περιορισμοί στη χρήση των ΑΕΜ εφόσον έχουν πληρωθεί οι προϋποθέσεις

Διαβάστε περισσότερα

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11 Πίνακας περιεχομένων Πρόλογος... 11 Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων...13 1.1 Εισαγωγή... 13 1.2 Δημιουργία βάσης δεδομένων... 14 1.3 Ταξινόμηση βάσης δεδομένων... 16 1.4 Μερικά αθροίσματα... 20

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ... ΠΕΡΙΕΧΟΜΕΝΑ ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...................................... 11 ΠΡΟΛΟΓΟΣ..........................................................15 1. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΝΑΛΥΤΙΚΗ, ΣΤΑ ΠΟΣΟΤΙΚΑ

Διαβάστε περισσότερα

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων Clustering Αλγόριθµοι Οµαδοποίησης Αντικειµένων Εισαγωγή Οµαδοποίηση (clustering): οργάνωση µιας συλλογής από αντικείµενα-στοιχεία (objects) σε οµάδες (clusters) µε βάση κάποιο µέτρο οµοιότητας. Στοιχεία

Διαβάστε περισσότερα

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ ΑΝΑΛΥΣΗ ΠΑΡΑΓΟΝΤΩΝ (FACTOR ANALYSIS) ΜΕ ΤΟ SPSS Ρ ΚΟΡΡΕΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΑΝΑΛΥΣΗ ΠΑΡΑΓΟΝΤΩΝ (FACTOR ANALYSIS) Η ανάλυση παραγόντων (Fact) είναι ουσιαστικά µία τεχνική µείωσης

Διαβάστε περισσότερα

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA) ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα 005 - Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Coponent Analysis, PCA) καθ. Βασίλης Μάγκλαρης aglaris@netode.ntua.gr www.netode.ntua.gr

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ Κ. Ποϊραζίδης Η ταξινόμηση εικόνας αναφέρεται στην ερμηνεία με χρήση υπολογιστή των τηλεπισκοπικών εικόνων. Παρόλο που ορισμένες διαδικασίες έχουν τη δυνατότητα να συμπεριλάβουν πληροφορίες

Διαβάστε περισσότερα

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων Γένεση Μετακινήσεων Παναγιώτης Παπαντωνίου Δρ. Πολιτικός Μηχανικός, Συγκοινωνιολόγος ppapant@upatras.gr Πάτρα, 2017 Εισαγωγή Αθροιστικά μοντέλα (Aggregate models) Ανάλυση κατά ζώνη πόσες μετακινήσεις ξεκινούν

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2013-2014 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητή: ένα χαρακτηριστικό ή ιδιότητα που μπορεί να πάρει διαφορετικές τιμές

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή Τεχνικές διαχωριστικής ομαδοποίησης: Ν πρότυπα k ομάδες Ν>>k Συνήθως k καθορίζεται από χρήστη Διαχωριστικές τεχνικές: επιτρέπουν πρότυπα να μετακινούνται από ομάδα σε

Διαβάστε περισσότερα

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ 8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ Στόχος του εργαστηρίου αυτού είναι να δείξει πώς τα εργαστήρια με τα δεδομένα της ICAP μπορούν να υλοποιηθούν χωρίς τη χρήση SQL Server, χρησιμοποιώντας μόνον Excel και Rapid

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος στη δεύτερη έκδοση........................................... 13 Πρόλογος στην πρώτη έκδοση............................................ 17 Εισαγωγή................................................................

Διαβάστε περισσότερα

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων.

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων. Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων. Στην προηγούμενη Εκπαιδευτική Μονάδα παρουσιάστηκαν ορισμένα χρήσιμα παραδείγματα διαδεδομένων εργαλείων για τον χρονοπρογραμματισμό

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: βελτιστοποίηση χωρίς περιορισμούς Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 7-8 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

ιαµέριση - Partitioning

ιαµέριση - Partitioning ιαµέριση - Partitioning ιαµέριση ιαµέριση είναι η διαµοίραση αντικειµένων σε οµάδες µε στόχο την βελτιστοποίηση κάποιας συνάρτησης. Στην σύνθεση η διαµέριση χρησιµοποιείται ως εξής: Οµαδοποίηση µεταβλητών

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟ Ι. ΓΙΑΝΝΑΤΣΗΣ

ΑΝΤΙΚΕΙΜΕΝΟ Ι. ΓΙΑΝΝΑΤΣΗΣ ΣΧΕΔΙΑΣΜΟΣ ΣΥΣΤΗΜΑΤΩΝ ΠΑΡΑΓΩΓΗΣ ΜΕΤΡΗΣΗ ΕΡΓΑΣΙΑΣ Ι. ΓΙΑΝΝΑΤΣΗΣ ΑΝΤΙΚΕΙΜΕΝΟ Η Μέτρηση Εργασίας (Work Measurement ή Time Study) έχει ως αντικείμενο τον προσδιορισμό του χρόνου που απαιτείται από ένα ειδικευμένο

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) 5 H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) Περίληψη Σκοπός του κεφαλαίου είναι η εφαρμογή της ανάλυσης συσχέτισης (Pearson r) μέσω του PASW. H ανάλυση συσχέτισης Pearson r χρησιμοποιείται για να εξεταστεί η

Διαβάστε περισσότερα

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ Φεβρουάριος 2015 1 Table of Contents ΔΙΟΙΚΗΤΙΚΗ ΠΕΡΙΛΗΨΗ... 3 1. ΕΙΣΑΓΩΓΗ... 4 2. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΜΟΝΤΕΛΩΝ... 4 2.1 ΔΕΔΟΜΕΝΑ... 4 2.1.1

Διαβάστε περισσότερα

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΙΑΤΡΙΚΗ ΣΧΟΛΗ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΦΑΡΜΟΣΜΕΝΗ ΝΕΥΡΟΑΝΑΤΟΜΙΑ» «Βιοστατιστική, Μεθοδολογία και Συγγραφή Επιστημονικής Μελέτης» Ενότητα 1: Πληθυσμός

Διαβάστε περισσότερα

Συνοπτικά περιεχόμενα

Συνοπτικά περιεχόμενα b Συνοπτικά περιεχόμενα 1 Τι είναι η στατιστική;... 25 2 Περιγραφικές τεχνικές... 37 3 Επιστήμη και τέχνη των διαγραμματικών παρουσιάσεων... 119 4 Αριθμητικές μέθοδοι της περιγραφικής στατιστικής... 141

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

Ομαδοποίηση Ι (Clustering)

Ομαδοποίηση Ι (Clustering) Ομαδοποίηση Ι (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. Μ-Ν ΝΤΥΚΕΝ Ορισμός Σκοπός της Α.Κ.Σ. Η Α.Κ.Σ. εντάσσεται στις μεθόδους διερευνητικής ανάλυσης (exploratory) συνθετικών φαινόμενων (Παραγοντικές μεθόδοι).

Διαβάστε περισσότερα