Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 0 ου Πανελληνίου Συνεδρίου Στατιστικής (007), σελ 5-3 ΕΝΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΟ ΔΙΑΓΡΑΜΜΑ ΕΛΕΓΧΟΥ ΜΕ ΧΡΗΣΗ ΔΙΑΤΕΤΑΓΜΕΝΩΝ ΔΕΙΓΜΑΤΩΝ Μ. Β. Κούτρας, Ι. Σ. Τριανταφύλλου, N. Balakrsha Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης, Πανεπιστήμιο Πειραιώς Departet of Matheatcs a Statstcs, McMaster Uversty, Caaa koutras@up.gr, tratal@up.gr, bala@caster.ca ΠΕΡΙΛΗΨΗ Τα μη παραμετρικά διαγράμματα ελέγχου είναι ιδιαίτερα χρήσιμα σε διεργασίες στατιστικού ελέγχου για τις οποίες η φύση του υπό μελέτη χαρακτηριστικού δε δικαιολογεί την υπόθεση της κανονικότητας (ή κάποιας άλλης συγκεκριμένης κατανομής). Οι Chakrabort, va er Laa a va er Wel (004) πρότειναν ένα μη παραμετρικό διάγραμμα ελέγχου που βασίζεται, για τον υπολογισμό των ορίων ελέγχου, σε ένα δείγμα αναφοράς X, X,..., X που προέρχεται από μια άγνωστη συνεχή κατανομή. Με βάση το δείγμα αυτό, υπολογίζονται συγκεκριμένες διατεταγμένες παρατηρήσεις (όρια ελέγχου), και η απόφαση για το αν η διεργασία βρίσκεται εντός ελέγχου ή όχι κρίνεται από το αν, παίρνοντας διαδοχικά τυχαία δείγματα Y, Y,..., Y από τη διεργασία, η διάμεσός τους βρίσκεται μεταξύ των ορίων. Ωστόσο, μπορεί συχνά η διάμεσος του δείγματος να είναι εντός των ορίων ελέγχου, ενώ ταυτόχρονα μεγάλο πλήθος των παρατηρήσεων του δείγματος να βρίσκονται εκτός. Αυτό θα είχε ως συνέπεια η διεργασία να θεωρείται ότι είναι εντός ελέγχου, ενώ στην πραγματικότητα δεν είναι. Για να βελτιώσουμε τη μέθοδο των Chakrabort, va er Laa a va er Wel, προτείνουμε στην παρούσα εργασία, την προσθήκη μιας δεύτερης συνθήκης που απαιτεί, να βρίσκονται εντός των ορίων ελέγχου, τουλάχιστον r από τις παρατηρήσεις του δείγματος Y, Y,..., Y. Για τη μελέτη του νέου κανόνα, υπολογίζεται η ακριβής τιμή της πιθανότητας σφάλματος τύπου Ι και γίνεται αριθμητική σύγκριση του μέσου μήκους ροής (ARL) των δύο κανόνων.. ΕΙΣΑΓΩΓΗ Όταν μία παραγωγική διαδικασία υποβάλλεται σε στατιστικό έλεγχο ποιότητας, το πρώτο βήμα είναι η κατασκευή ενός διαγράμματος ελέγχου προκειμένου να αναγνωρισθούν και να εξαλειφθούν τυχόν ειδικά αίτια μεταβλητότητας του υπό μελέτη χαρακτηριστικού. Κύριος σκοπός ενός διαγράμματος ελέγχου είναι να εντοπίσει όσο το δυνατόν γρηγορότερα τυχόν μεταβολές στην παραγωγή και να δώσει σήμα ότι η διεργασία βρίσκεται εκτός ελέγχου. Η απόδοση ενός διαγράμματος κρίνεται συνήθως από το μέσο χρόνο που χρειάζεται το διάγραμμα να δώσει το σήμα αυτό (average ru legth, ARL). - 5 -
Ένα τυπικό διάγραμμα ελέγχου είναι το διάγραμμα τύπου Shewhart (93), στο οποίο την κεντρική γραμμή (ceter le, CL) παριστάνει η μέση τιμή του υπό μελέτη χαρακτηριστικού, και το άνω και κάτω όριο ελέγχου οι ακραίες τιμές του(upper a lower cotrol lt, UCL a LCL). Μόλις αυτά καθορισθούν κατάλληλα, λαμβάνεται τυχαίο δείγμα από τη διαδικασία που ελέγχεται, υπολογίζεται η στατιστική συνάρτηση που έχει επιλεχθεί ως εκτίμηση του υπό μελέτη χαρακτηριστικού και η τιμή της τοποθετείται πάνω στο διάγραμμα, ώστε να αποφασισθεί αν η διεργασία είναι εντός ή εκτός ελέγχου. Αν και τα διαγράμματα τύπου Shewhart είναι ιδιαίτερα δημοφιλή μεταξύ των ασχολούμενων με πρακτικά προβλήματα του ελέγχου ποιότητας λόγω της απλής εφαρμογής τους, παρουσιάζουν και σημαντικά μειονεκτήματα, όπως η χρήση πληροφορίας που σχετίζεται μόνο με το πλέον πρόσφατο δείγμα και η αναγκαιότητα να ακολουθεί το υπό μελέτη χαρακτηριστικό την κανονική κατανομή. Για την αντιμετώπιση του πρώτου προβλήματος έχουν προταθεί εναλλακτικά διαγράμματα (π.χ. EWMA), ενώ για τη λύση του δεύτερου απαιτείται χρήση τεχνικών απαραμετρικής στατιστικής. Τα μη παραμετρικά διαγράμματα ελέγχου σχεδιάζονται χωρίς την υπόθεση συγκεκριμένης κατανομής του υπό μελέτη χαρακτηριστικού και, κατά συνέπεια, είναι πιο αποτελεσματικά για περιπτώσεις μη κανονικών κατανομών (π.χ. κατανομών με βαριές ουρές ή μη συμμετρικών κατανομών) και πιο ανθεκτικά σε περιπτώσεις που υπεισέρχονται outlers. Για την κατασκευή ενός μη παραμετρικού διαγράμματος ελέγχου λαμβάνεται δείγμα αναφοράς (referece saple) που προέρχεται από μια άγνωστη συνεχή κατανομή (διεργασία εντός ελέγχου) και καθορίζονται τα όρια ελέγχου με χρήση συγκεκριμένων διατεταγμένων παρατηρήσεων του δείγματος αυτού. Στη συνέχεια λαμβάνονται διαδοχικά τυχαία δείγματα από τη διεργασία και ελέγχεται αν συγκεκριμένη διατεταγμένη παρατήρηση (π.χ. η διάμεσος) από τα τελευταία δείγματα βρίσκεται εντός των ορίων ελέγχου. Οι Jaacek & Mekle (997) πρότειναν αρχικά ένα δίπλευρο (τύπου Shewhart) διάγραμμα ελέγχου που βασίζεται στη διάμεσο των τυχαίων δειγμάτων, ενώ οι Chakrabort, va er Laa a va er Wel (004) γενίκευσαν την παραπάνω ιδέα, κατασκευάζοντας ένα μη παραμετρικό διάγραμμα που χρησιμοποιεί τα τεταρτημόρια (συμπεριλαμβανομένης της διαμέσου). Συγκεκριμένα αν X, X,..., X και X, X,..., X είναι οι παρατηρήσεις του δείγματος αναφοράς και του διατεταγμένου δείγματος αναφοράς αντίστοιχα, τότε το κάτω και άνω όριο ελέγχου ορίζονται ως εξής LCL = X a, UCL X b =, a < b. Στη συνέχεια λαμβάνεται τυχαίο δείγμα Y, Y,..., Y από τη διεργασία και υπολογίζεται η στατιστική συνάρτηση Y j (συνήθης επιλογή η διάμεσος). Η διαδικασία θεωρείται εντός ελέγχου αν ισχύει Y X, X ). Ο καθορισμός των j ( a b παραμέτρων a,b απαιτεί τον προσδιορισμό της πιθανότητας λανθασμένου συναγερμού (false alar rate, f ) και ο σχεδιασμός της διαδικασίας ελέγχου προκύπτει από την επίλυση(ως προς a και b) της ακόλουθης ανίσωσης - 6 -
b w= a j + w + j w w w f. + Ωστόσο, μπορεί συχνά η διάμεσος του δείγματος να είναι εντός των ορίων ελέγχου, ενώ ταυτόχρονα μεγάλο πλήθος των παρατηρήσεων του δείγματος να βρίσκονται εκτός. Αυτό θα είχε ως συνέπεια η διεργασία να θεωρείται ότι είναι εντός ελέγχου, ενώ στην πραγματικότητα δεν είναι. Για να βελτιώσουμε τη μέθοδο των Chakrabort, va er Laa και va er Wel, προτείνουμε στην επόμενη παράγραφο, την προσθήκη μιας δεύτερης συνθήκης που απαιτεί, να βρίσκονται εντός των ορίων ελέγχου, τουλάχιστον r από τις παρατηρήσεις του δείγματος Y, Y,..., Y.. ΤΟ ΝΕΟ ΜΗ ΠΑΡΑΜΕΤΡΙΚΟ ΔΙΑΓΡΑΜΜΑ ΕΛΕΓΧΟΥ Έστω X, X,..., X δείγμα αναφοράς με αθροιστική συνάρτηση κατανομής (x), Y, Y,..., Y τυχαίο δείγμα από τη διεργασία με αθροιστική συνάρτηση κατανομής x) και N ο αριθμός δειγμάτων μέχρι να πάρουμε σήμα ότι η διαδικασία είναι εκτός ελέγχου. Για δεδομένες τιμές των X a = x, X b = y, η τυχαία μεταβλητή Ν ακολουθεί γεωμετρική κατανομή με συνάρτηση πιθανότητας και μέση τιμή P( N = k X k k a = x, X b = y) = p ( p) = p p k όπου p = P k E( N X a = x, X b = y) = P( N > k X a = x, X b = y) = p =, p βρίσκονται στο διάστημα ( x, y)) = p( x, y) k= 0 k= 0 ( x Y j y και τουλάχιστον r από τις παρατηρήσεις Y, Y,... Y (.) Συνεπώς η συνάρτηση πιθανότητας του N θα δίνεται από τον τύπο k k P( N = k) = E X, {( p( X, X )) ( p( X, X )) }, k =,,... a X b a b a b ενώ η πιθανότητα να θεωρηθεί η διαδικασία εντός ελέγχου κατά την εξέταση του δείγματος Y, Y,..., Y είναι ίση με P = E p( X, X )]. (.) X [ a, X b a b Το μέσο μήκος ροής του κανόνα θα δίνεται από την ακόλουθη σχέση - 7 -
ARL = E( N) = E( k= 0 P( N > k)) = k= 0 E X a, X b {[ p( X a, X b k )] }. Στην ακόλουθη πρόταση, θα παρουσιάσουμε μια σχέση με την οποία μπορούμε να υπολογίσουμε την πιθανότητα P και κατά συνέπεια την πιθανότητα λανθασμένου συναγερμού f. Η απόδειξη της πρότασης στηρίζεται στο ακόλουθο αποτέλεσμα. Λήμμα. Έστω U, U,..., U ένα δείγμα από την ομοιόμορφη κατανομή στο διάστημα (0,) και η j-διατεταγμένη παρατήρηση. Για δεδομένες τιμές U j U a = s, U b = t με s t, ισχύει η ακόλουθη σχέση όπου ( ( s), ( t)) = pc, c+ r p ( x, y), (.3) y! j c c j pc ( x, y) = x ( u x) ( y u) ( y) u., x ( j c )! c!!( j )! (.4) Απόδειξη. Ξεκινώντας από τη σχέση (.) μπορούμε να γράψουμε την πιθανότητα p( ( s), ( t)) ως εξής P( ( s) Y j βρίσκονται στο διάστημα ( = P( Y ), Y = P( ( s)) Y U, U,... U ),... Y ( s)) U ( t) και τουλάχιστον r από τις παρατηρήσεις Y, Y,... Y j j ) ( s), ( t))) = ( t)) και τουλάχιστον r από τις παρατηρήσεις ) βρίσκονται στο διάστημα ( βρίσκονται στο διάστημα ( ( s)), ( s)), ( t)))). ( t)))) = ( t)) και τουλάχιστον r από τις παρατηρήσεις Το ενδεχόμενο που υπάρχει στο δεξί μέλος της τελευταίας ισότητας περιγράφεται ισοδύναμα με το ακόλουθο διάγραμμα j c c j 0 x= ( s)) U j ( t)) = y Συγκεκριμένα για ( j c ) από τα U θα πρέπει να ισχύει ότι ( )), για ( c + ) s από τα U να ισχύει ( s)) < U < ( t)) και για ( j ) από τα U να ισχύει ότι G ( ). Επισημαίνουμε ακόμη ότι το c αντιστοιχεί στο U t πλήθος των U τα οποία βρίσκονται ανάμεσα στα G ( s) και, ενώ το στο - 8 - U U j
πλήθος των U που βρίσκονται μεταξύ των U και G ( t). Επομένως θα πρέπει να ισχύει c + +. Από τα παραπάνω προκύπτει άμεσα η σχέση (.4) για την ποσότητα ( x, ), ενώ αθροίζοντας για όλες τις δυνατές τιμές των c, εξάγεται p c, y για τη ζητούμενη πιθανότητα η σχέση (.3). Πρόταση. Έστω X, X,..., X ένα δείγμα αναφοράς με αθροιστική συνάρτηση κατανομής (x), Y, Y,..., Y ένα τυχαίο δείγμα με αθροιστική συνάρτηση κατανομής x) και U, U,..., U ένα δείγμα από την ομοιόμορφη κατανομή στο διάστημα (0,). Η πιθανότητα σήματος για εκτός ελέγχου διαδικασία ενώ αυτή είναι εντός ελέγχου είναι ίση με όπου j, P = P c, c+ r P c, = ( ) ( ) t 0 0 j+ t s s j b b c a!( j )! j c+ a ( u s) c ( t u) ( t s) b a ( t) + b j ust Απόδειξη. Από τη σχέση (.) χρησιμοποιώντας το γεγονός ότι, όταν η διαδικασία είναι εντός ελέγχου έχουμε = G, προκύπτει άμεσα η ακόλουθη σχέση t P = p( ( s), ( t)) f ( s, t) st, 0 0 όπου a b a f s t =! (, ) s ( t s) ( t ( a )!( b a )!( b)! ) είναι η από κοινού συνάρτηση πιθανότητας των διατεταγμένων παρατηρήσεων U a, U b. Αντικαθιστώντας την πιθανότητα p( ( s), ( t)) από τις σχέσεις (.3) και (.4) και μετά από αλγεβρικές πράξεις καταλήγουμε στη ζητούμενη σχέση. b 3. ΑΡΙΘΜΗΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ Στην παράγραφο αυτή θα παρουσιάσουμε αριθμητικές συγκρίσεις ανάμεσα στο νέο κανόνα, το διάγραμμα των Chakrabort, va er Laa a va er Wel (ea chart) αλλά και το τυπικό διάγραμμα τύπου Shewhart. Συγκεκριμένα ο ακόλουθος - 9 -
πίνακας περιλαμβάνει, για προκαθορισμένη τιμή του ARL ίση με 500, τις παραμέτρους των διαγραμμάτων, τα ARL και όπως αυτά υπολογίσθηκαν με μεθόδους προσομοίωσης χρησιμοποιώντας αντιστοίχως την τυποποιημένη κανονική κατανομή και την κανονική κατανομή N(0.,). Πίνακας. Διαγράμματα ελέγχου για καθορισμένο ARL ίσο με 500 Mea chart ARL ( LCL, UCL) ARL ARL ( LCL, UCL) out New r ARL 500 00 5 (0,9) 50. 55.6 (,90) 477.0 349.9 (6,75) 460.5 40.7 (7,44) 46.4 338.7 5 (45,56) 47.5 337. (46,55) 47. 3.4 500 5 (4,477) 50.3 506.6 (5,476) 48.7 4. (63,438) 497. 4. (64,437) 3 48. 379. 5 (,390) 480. 95.3 (,389) 497. 43.6 Το συμπέρασμα που εξάγεται από τα παραπάνω αποτελέσματα είναι ότι, για ίδιες (ή περίπου ίδιες) τιμές του εντός ελέγχου ARL, ο προτεινόμενος κανόνας παρουσιάζει τις μικρότερες τιμές του εκτός ελέγχου ARL, γεγονός που τον καθιστά γρηγορότερο στον εντοπισμό μετατοπίσεων της παραμέτρου της διεργασίας. Οι δύο επόμενες γραφικές παραστάσεις, που δίνονται στα Σχήματα και, παρουσιάζουν την απόδοση ως προς το εκτός ελέγχου ARL, του νέου διαγράμματος, του ea chart και του X διαγράμματος Shewhart έναντι διαφορετικών μετατοπίσεων της παραμέτρου της κάθε κατανομής που εφαρμόζεται. Να επισημανθεί ότι για την κατασκευή των διαγραμμάτων χρησιμοποιήθηκε δείγμα αναφοράς μεγέθους = 000 και τυχαία δείγματα από τη διεργασία μεγέθους = 5, ενώ οι παράμετροι των διαγραμμάτων καθορίσθηκαν με τέτοιο τρόπο ώστε το εντός ελέγχου ARL κάθε διαγράμματος να είναι ίσο περίπου με 500. Οι Πίνακες και 3 δίνουν ορισμένα ενδεικτικά σημεία των γραφημάτων, που παρουσιάζονται στα Σχήματα και αντίστοιχα. - 30 -
Σχήμα. Κατανομή Stuet Πίνακας. Κατανομή Stuet 500 400 300 00 00 ARL out Mea chart Newchart X chart shft Mea chart X chart New 0. 567.0 456.86 43.57 0. 47.60 433.53 40.99 0.3 395.0 379.4 348.0 0.4 86.3 3.0 68.0 0.5 9.75 65. 07.98 38.0 7.49 36.53.5 8.5 6. 7.5.88 3.6.69.5 0.43 0.85 0.40 0.5.5.5 shft ARL Σχήμα. Κανονική κατανομή out ARL out out ARL 400 300 00 00 Newchart Meachart X chart Πίνακας 3. Κανονική κατανομή shft Mea chart X chart New 0. 47.05 380. 43.57 0. 35.70 3.5 30.4 0.3 96.8 8.45 89.3 0.4 7.57 65.94 3.80 0.5 7.4 38.5 66.73 8.84 3.9 8.70.5.7 0.6.66 0.37 0.09 0.36.5 0.07 0.0 0.06 0.5.5.5 shft Είναι φανερό από τα παραπάνω γραφήματα ότι το προτεινόμενο διάγραμμα ελέγχου υπερέχει του αντίστοιχου ea chart ανεξαρτήτως της κατανομής που εφαρμόζεται σε κάθε περίπτωση, καθώς πετυχαίνει να εντοπίσει τη μετατόπιση της παραμέτρου της κατανομής γρηγορότερα. Στο ίδιο συμπέρασμα καταλήγουμε και με τη σύγκριση του νέου κανόνα με το X διάγραμμα Shewhart στην περίπτωση της κατανομής - 3 -
Stuet (και γενικότερα κατανομών με βαριές ουρές), ενώ στην περίπτωση της κανονικής κατανομής το X διάγραμμα Shewhart δείχνει ελάχιστα πιο αποτελεσματικό από τα δύο μη παραμετρικά διαγράμματα ελέγχου. Εν κατακλείδι, μπορούμε να ισχυριστούμε ότι ο νέος μη παραμετρικός κανόνας ελέγχου διεργασιών που προτείνεται στην παρούσα εργασία παρουσιάζει μεγαλύτερη αποτελεσματικότητα στον εντοπισμό μετατόπισης της διεργασίας ιδιαίτερα σε περιπτώσεις όπου η υπόθεση της κανονικότητας δε δικαιολογείται από τα δεδομένα. ABSTRACT I the preset artcle we trouce a ew oparaetrc cotrol chart a prove a forula for the false alar rate of the chart. ally, coparsos betwee the ew chart a the classcal X Shewhart a ea chart are establshe by fxg the cotrol ARL a lookg upo the respectve out-of-cotrol uer certa out-of-cotrol alteratves. ΑΝΑΦΟΡΕΣ Arol, B.C., Balakrsha, N. & Nagaraja, H.N. (99). A rst Course Orer Statstcs, Joh Wley & Sos, New York. Chakrabort, S. (000). Ru legth, average ru legth a false alar rate of Shewhart X-bar chart exact ervatos by cotog, Coucatos Statstcs-Sulato a Coputato, 9, 6-8. Chakrabort, S. & va er Laa, P. (996). Preceece tests a cofece bous for coplete ata a overvew a soe results, The Statstca, 45(3), 35-369. Chakrabort, S., va er Laa, P. & Bakr, S.T. (00). Noparaetrc cotrol charts a overvew a soe results, Joural of Qualty Techology, 33(3), 304-35. Chakrabort, S., va er Laa, P. & va er Wel, M.A. (004). A class of strbuto-free cotrol charts, Joural of Apple Statstcs, 53(3), 443-46. Jaacek, G.J. & Mekle, S.E. (997). Cotrol charts base o eas, The Statstca, 46, 9-3. Mathse, H.C. (943). A etho of testg the hypothess that two saples are fro the sae populato, Aals of Matheatcal Statstcs, 4, 88-94. Motgoery, D.C. (00). Itroucto to Statstcal Qualty Cotrol, 4 th Eto, Joh Wley & Sos, New York. - 3 -