Μεθοδολογία Έρευνας- Ανακάλυψη γνώσης α ό δεδοµένα ρ.. Πα ακυριακό ουλος, Ε ιστηµονικός Συνεργάτης Τµήµα ιοίκησης Ε ιχειρήσεων, ΤΕΙ Αθήνας ρ. Σ. Μ ινιώρης Καθηγητής Τµήµα ιοίκησης Ε ιχειρήσεων, ΤΕΙ Αθήνας
Το ρόβληµα ΣΤΟΧΟΣ ηµιουργία(διοικητικού) µηχανισµού για τον εντο ισµό των ελλείψεων στα ράφια των Supermarket. ΕΡΕΥΝΗΤΙΚΑ ΚΙΝΗΤΡΟ Πρόβληµα εφοδιαστικής αλυσίδας Αυξηµένη ολυ λοκότητα. Συνδέει υνάµεις ροσφοράς( αραδόσεις) στο κατάστηµα Ικανότητα ανα λήρωσης καταστήµατος Ζήτηση καταναλωτή Συνδέεται µε Bullwhip effect(lee et al, 1997) Σχετικές εργασίες αναφέρονται στην αντίδραση του καταναλωτή (Fitzimons et al,, Anderson et al.,) Το οθετείται ψηλά στα ροβλήµατα του λιανεµ ορίου Ορυθµόςελλείψεωνείναιάνωτου8% (Gruenet al, 2007) Ηα ώλειαεσόδουείναι
Εναλλακτικές ροσεγγίσεις 1. Αναλυτικές ροσεγγίσεις Top Down Προβλέψεις Ζήτησης Συµ έρασµα: Το 2% των ροϊόντων αρουσιάζουν χαρακτηριστικά εργοδικής ζήτησης ιαχείριση Α οθεµάτων Συµ έρασµα: Το 54% των ροϊόντων αρουσιάζουν αξιό ιστες εγγραφές α οθέµατος. Πρόβληµα µείωσης του α οθέµατος (Inventory Shrinkage) 2. Ευρετικές ροσεγγίσεις Bottom Up Ανακάλυψη Γνώσης α ό τα εδοµένα η εξεύρεση µιας(ενδιαφέρουσας, αυτονόητης, µη ροφανής και ιθανόν χρήσιµης) ληροφορίας ή ροτύ ων α ό µεγάλες βάσεις δεδοµένων µε χρήση αλγορίθµων Ο κλάδος διαθέτει σηµαντικές και αναξιό οίητες ηγές δεδοµένων
Αντίληψητου ροβλήµατος Πωλήσεις Πωλήσεις 3 Καθυστέρηση Παραγγελίας 2 5 Καθυστέρηση Παραγγελίας :OOS :EXISTS ΕΑΝ Καθυστέρηση Παραγγελίας > 5 ΤΟΤΕ EXISTS ΕΑΝ Πωλήσεις > 3 ΤΟΤΕ EXISTS ΕΑΝX > 2 ΤΟΤΕOOS ΓΙΑ ΤΑ ΥΠΟΛΟΙΠΑEXISTS
ΕρευνητικήΜεθοδολογία Ποια καταστήµατα; Ποια ροϊόντα; Για όσο διάστηµα; Όλα τα δεδοµένα; Τα διαθέτει ο κλάδος; Είναι ορθά; ❶ Φυσικές Καταγραφές ❶ Ε ιλογή δεδοµένων Α ό Πληρ. Συστήµατα Ποιες είναι οι ασυνέ ειες των δεδοµένων; Τι κάνω µε µη-έγκυρες καταχωρήσεις; Ποια είναι η οιότητα των δεδοµένων; ❷ Καθαρισµός εδοµένων Ποιες είναι οι ε εξηγηµατικές µεταβλητές; Τι κάνω µε τις ά-τιµες µεταβλητές; Έµφαση σε συνεχή ή διακριτές τιµές; Ποιο είναι το καλύτερο µοντέλο; Πως η ασθενής κλάση µ ορεί να ενδυναµωθεί; Υ άρχει µεροληψία ή διακύµανση; ❸ Μετασχηµατισµός εδοµένων ❹Εξόρυξη εδοµένων Γενικεύονται τα α οτελέσµατα; Εσωτερική ή εξωτερική εγκυρότητα; Μ ορούν να ανα αρασταθούν; ❺Ανακάλυψη Γνώσης
ΕφαρµογήΜεθοδολογίας Προφίλ Έρευνα εδίου(δεν ελέγχουµε όλες τις µεταβλητές) Τέσσερις αλυσίδες λιανικής Τρία αντι ροσω ευτικά καταστήµατα α ό κάθε αλυσίδα Ε ιλογή 12 κύριων ροϊοντικών κατηγοριών Στρωµατο οιηµένη δειγµατοληψία για 10 ροϊόντα α ό κάθε κατηγορία(ταχύτητακίνησηςκαι ιακύµανσηζήτησης) + 15 ροϊόντα ου θα είναι σε ροώθηση κατά την διάρκεια των Φυσικών α ογραφών Τα ροϊόντα αραδίδονται α ό κεντρικής α οθήκης λιανέµ ορου ιάρκεια4εβδοµάδεςµε1ε ίσκεψητηνηµέρα( ρωία όγευµα) Σύνολο µάθησης 19.400 ερί ου εγγραφών
Ε ιλογήδεδοµένων Φάση Ι Σύνολα δεδοµένων για την ε ιλογή ροϊόντων και καταστηµάτων ου θα εξετασθούν Ορίσθηκαν οι βασικές ροδιαγραφές των ειραµάτων Φάση ΙΙ Ιστορικά στοιχεία ωλήσεων και αραγγελιών καταστήµατος(6 µήνες εώς 1 χρόνος ανάλογα µε την αλυσίδα)
Καθαρισµόςδεδοµένων Οι αλυσίδες έχουν διαφορετικά ροβλήµατα µε τα δεδοµένα ου χρησιµο οιούν Μείγµα καταστήµατος Backordered αραγγελίες ιαφορές Παραγγελίας Παράδοση Προβλήµατα στην κατηγοριο οίηση Κατά την διαδικασία της φυσικής α ογραφής έ ρε ε να ε ιβεβαιωθεί το καρτελάκι στο ράφι Προϊόντα σε διαφορετικές θέσεις( ροωθητικά) Μη-ε ικαιρο οιηµένο καρτελάκι στο ράφι Το 60% της ερευνητικής ροσ άθειας Συνε ές σύνολο δεδοµένων
Μετασχηµατισµός εδοµένων Όγκος Πωλήσεων Ηµερήσιος µέσος όρος και τυ ική α όκλιση Συχνότητα όγκου ώλησης και τυ ική α όκλιση Εύρος εριόδων χωρίς ώληση είκτηςταχυκινησίας[0..1] Μερίδιο κατηγορίας Α όθεµα Τελευταία αραγγελία Τελευταία αράδοση Εκτίµηση ε ι έδου α οθέµατος Τάσεις ζήτησης Προωθητικό ροϊόν Ε οχικότητα Κατάστηµα Μέγεθος καταστήµατος Μέγεθος α οθήκης Αριθµός εργαζοµένων στη βάρδια Ηµέρα Ώρατηςηµέρας Εφαρµογή κριτηρίων Info Gain καιx 2
Εξόρυξη εδοµένων(1/2) Ε ιλογή τεχνικών εξόρυξης διαφορετικής ροσέγγισης Στατιστικές τεχνικές( χ Naïve Bayes) έντρα Α όφασης( χ C4.5) Νευρωνικά ίκτυα( χ Multilayer Perceptron) Αξιο οίηση Συνόλου Μάθησης µε δυο τρό ους Εκ αίδευση(training) Έλεγχος(testing) Εξετάσθηκαν 21 διαφορετικές τεχνικές εξόρυξης Κάθε τεχνική έχει διαφορετικές αραµέτρους Υ άρχει η ανάγκη καθορισµού των βέλτιστων τιµών Μελέτη ροβλε τικήςικανότηταςαλγορίθµων. Χρήση 10-Fold Cross Validation Analysis of Variance Τα δέντρα α όφασης είναι η α οτελεσµατικότερη ροσέγγιση
If zero_average >=31.25 then Result = OOS Ifzero_average>=1.755 AND zero_average >=3.47 AND zero_average >=15.857 AND zero_average >=31.25 Then Result = OOS
ΑνακάλυψηΓνώσης Class Length Supp. Conf. 1IF store_type= 1 AND zero_avg>= 31.25 AND zero_seq< 4 THEN RES = 0 exists 0 100.0% 84.9% oos 1 oos 3 3.7% 91.3% 2IF store_type= 2 THEN RES = exists 3IF store_type= 3 AND zero_avg>= 31.25 AND zero_seq< 7 THEN RES = 2 exists 1 22.3% 84.9% oos 3 oos 3 1.4% 89.4% 4IF zero_avg>= 31.25 THEN RES = oos 4 oos 1 13.7% 64.5% 5IF store_type= 1 AND zero_avg>= 31.25 AND zero_seq< 7 AND zero_seq >= 4 THEN RES = exists 5 exists 4 0.6% 66.7% 6IF store_type= 2 AND zero_avg>= 31.25 AND zero_seq< 23 AND zero_seq 6 oos 4 0.1% 100.0% >= 14 THEN RES = oos 7 exists 3 1.9% 96.4% 7IF store_type= 3 AND zero_seq< 12 AND zero_seq>= 7 THEN RES = exists 8IF zero_avg>= 63 AND zero_seq< 3 THEN RES = oos 8 oos 2 3.8% 55.8% 9IF zero_avg< 1.230769 THEN RES = exists 9 exists 1 3.2% 96.3% 10IF zero_avg< 1.583333 THEN RES = exists 10 exists 1 21.6% 97.7% 11IF store_type= 3 AND zero_avg< 1.775 THEN RES = exists 11 exists 2 9.4% 99.1% 12IF store_type= 1 AND zero_avg< 31.25 THEN RES = exists 13IF avg>= 1.384615 THEN RES = exists 12 exists 2 16.3% 96.5% 14IF zero_seq>= 4 THEN RES = exists 13 exists 1 29.0% 96.0% 15IF zero_avg< 31.25 AND zero_avg>= 21 AND zero_seq>= 42 THEN RES = 14 exists 1 25.3% 72.3% exists 15 exists 3 0.5% 93.8% 16IF zero_avg< 31.25 AND zero_avg>= 15.85714 THEN RES = exists 17IF store_type= 4 AND zero_avg< 5.823529 AND zero_avg>= 3.470588 16 exists 2 2.7% 81.5% THEN RES = exists 17 exists 3 3.6% 99.1% 18IF store_type= 4 AND zero_avg< 31.25 AND zero_avg< 6.052631 AND 18 oos 5 0.1% 100.0% zero_avg>= 5.823529 AND zero_seq>= 4 THEN RES = oos 19 IF store_type= 1 AND zero_avg>= 31.25 THEN RES = oos 19 oos 2 5.9% 82.6% 20IF store_type= 2 AND zero_avg< 51.5 THEN RES = exists 20 exists 2 17.7% 89.9%
Εξωτερικήεγκυρότητα Εφαρµογήτωνκανόνωνσενέοκαιάγνωστο σύνολο δεδοµένων. Καθηµερινή και αυτοµατο οιηµένη διασύνδεση µε τις αλυσίδες λιανικής Η ταυτόχρονη εφαρµογή των κανόνων δηµιουργεί αναφορές Καθηµερινή λίστα ροϊόντων σε έλλειψη Καθηµερινή αναφορά σε λιανέµ ορους και ροµηθευτές
ΜέτραΑξιολόγησης Ακρίβεια:ΟΟS True Predicted/ ΣύνολοΟΟS ου εντο ίσθηκαν Κάλυψη: ΟΟS True Predicted/ Σύνολο των ελλείψεων στο κατάστηµα Πρόβλεψη Το σύνολο των ελλείψεων Ακρίβεια= 4/8= 50% Κάλυψη= 4/10 = 40% Λάθος ρόβλεψη Σωστή ρόβλεψη Περι τώσεις ου δεν καλύ τονται
Α οτελέσµαταανάκατάστηµα Store 3 Store 4 Store 5 Store 6 Store 7 Store 8 Store 9 Store 10 Store 11Store 12
Συµ εράσµατα Η χρήση της διαδικασίας ανακάλυψης γνώσης α ό τα δεδοµένα είναι εφικτή. Σε κάθε βήµα της διαδικασίας υ άρχει λήθος ερευνητικών υ οθέσεων και α οφάσεων ου ρέ ει να ληφθούν Η γνώση ου δηµιουργείται α οτυ ώνεται µε την µορφή κανόνων Κάθε αλυσίδα λιανικής έχεις διαφορετικούς κανόνες Κάθε κατάστηµα έχει διαφορετικούς κανόνες Σε κάθε ροϊοντική κατηγορία είναι δυνατό να υ άρχουν διαφορετικοί κανόνες Πολυ λοκότητα vs Α λότητα της ευρετικής λύσης Η ρόταση α αιτεί συστηµατική ε ένδυση α ό τη λευρά της ε ιχείρησης Παράγοντες ου ε ιδρούν στις µετρήσεις Ανθρώ ινη συµ εριφορά Μετρήσεις ελλείψεων γίνονται ταυτόχρονα µε την ανα λήρωση των ροϊόντων