ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 50], 2012-13 Άσκηση 1 ΕΡΓΑΣΙΑ 4 Ενδεικτική Λύση (α-1.5) Σωστό. Το διάγραμμα στελέχους φύλλου, ως ειδική περίπτωση ιστογράμματος, ερμηνεύεται με τον ίδιο τρόπο όπως το ιστόγραμμα (σελ. 27, 28 Τόμος Δ) και άρα μας δίνει μια αίσθηση του πόσο διεσπαρμένες είναι οι μετρήσεις γύρω από τη μέση τιμή. (β-1.5) Λάθος. Σε κάθε βήμα όπου εισέρχεται μια μεταβλητή στο πρότυπο, μπορεί με ελέγχους F να απαλειφθούν μεταβλητές που είχαν εισέλθει νωρίτερα (σελ. 66, Τευχίδιο Β). (γ-1.5) Λάθος. Στην Άσκηση 2(α) έχουμε ένα αντιπαράδειγμα για αυτό. Η παλινδρόμηση είναι σημαντική στο 0.01 ε.σ. αλλά η μηδενική υπόθεση για την μεταβλητή Χ1 δεν απορρίπτεται στο ίδιο ε.σ. Γενκά, για να είναι η παλινδρόμηση σημαντική αρκεί ένας τουλάχιστον από τους συντελεστές, = 1,2,, να είναι σημαντικός, αλλά δεν χρειάζεται να είναι όλοι σημαντικοί (σελ. 184, Τόμος Β). (δ-1.5) Λάθος. Κάθε εργαλείο δεν μπορεί να εφαρμοστεί σε οποιοδήποτε πρόβλημα (σελ. 14, Τόμος Δ). (ε-1.5) Λάθος. Χρειάζεται να γνωρίζουμε επιπλέον και την τιμή ενός μόνο εκ των SST, SSR ή SSE. Όλα τα υπόλοιπα στοιχεία του Πίνακα 9.10 (σ ελ. 185, Τόμος Β) θα ήταν δυνατό στην συνέχεια να συμπληρωθούν. (στ-1.5) Σωστό. Έχουμε ότι: = = που είναι ακριβώς το μέρος της μεταβλητότητας που ερμηνεύεται με την εισαγωγή των επιπρόσθετων όρων του πλήρους προτύπου (βλέπε και σελ. 188, Τόμος Β). (ζ-1.5) Λάθος. Στο κανονικό διάγραμμα πιθανότητας των υπολοίπων πρέπει τα σημεία να πέφτουν κοντά σε ευθεία γραμμή (σελ. 194, Τόμος Β). (η-1.5) Λάθος. Το διάγραμμα Pareto έχει σκοπό να διαχωρίσει τις σημαντικές πλευρές ενός προβλήματος από τις λιγότερο σημαντικές (σελ. 31 Τόμος Δ). Ένα κατάλληλο εργαλείο για την διαπίστωση της ύπαρξης ή όχι λοξότητας στην κατανομή ενός χαρακτηριστικού είναι το ιστόγραμμα (σελ. 20-21, Τόμος Δ).
Άσκηση 2 (α-3.5) Εισάγουμε τα δεδομένα στις στήλες C1-C4 ενός κενού φύλλου εργασίας στο Minitab και τις ονομάζουμε Y, X1, X2 και Χ3 αντίστοιχα. Το αποτέλεσμα είναι το ακόλουθο: Στην συνέχεια επιλέγουμε την διαδοχή: Stat > Regression > Regression Στο πλαίσιο διαλόγου που ανοίγει, τοποθετούμε την μεταβλητή Y στο πεδίο Response και τις μεταβλητές X1, X2 και X3 στο πεδίο Predictors. Στην συνέχεια ανοίγουμε το μενού Options και εισάγουμε στο πεδίο: Prediction intervals for new observations: τις τιμές 5,1 8,3 και 1,7 (αφήνουμε απλά κενό ανάμεσα στις τιμές). Τέλος, αλλάζουμε την ένδειξη Confidence level από 95 (που είναι η προεπιλεγμένη τιμή) σε 98 και πατάμε ΟΚ και ξανά ΟΚ. (Η τελευταία αυτή αλλαγή χρειάζεται για το ερώτημα β). Το αποτέλεσμα που παίρνουμε στο Session του Minitab είναι το ακόλουθο: Regression Analysis: Y versus X1; X2; X3 The regression equation is Y = - 13,7-2,71 X1 + 4,16 X2 + 18,4 X3 Predictor Coef SE Coef T P Constant -13,66 19,57-0,70 0,493 X1-2,715 4,360-0,62 0,541 X2 4,160 1,064 3,91 0,001 X3 18,375 7,646 2,40 0,026 S = 8,29922 R-Sq = 72,0% R-Sq(adj) = 67,8% Analysis of Variance Source DF SS MS F P Regression 3 3544,8 1181,6 17,16 0,000 Residual Error 20 1377,5 68,9 Total 23 4922,3 Source DF Seq SS X1 1 1288,7 X2 1 1858,3 X3 1 397,8 Predicted Values for New Observations New Obs Fit SE Fit 98% CI 98% PI 1 38,26 4,02 (28,11; 48,42) (14,95; 61,57)
Values of Predictors for New Observations New Obs X1 X2 X3 1 5,10 8,30 1,70 Η τιμή του R-Sq είναι 72,0%. Αυτό σημαίνει ότι το ποσοστό της εξαρτημένης μεταβλητής που ερμηνεύεται με την προσαρμογή του προτύπου πολλαπλής γραμμικής παλινδρόμησης της εξαρτημένης μεταβλητής ως προς τις τρεις ανεξάρτητες μεταβλητές είναι ίσο με 72%. Από τις τιμές του του πρώτου πίνακα βλέπουμε ότι μόνο οι μεταβλητές Χ2 και Χ3 έχουν σημαντική επίδραση στην απόκριση, στο 5% επίπεδο σημαντικότητας ( < 0.05), όταν το πρότυπο περιλαμβάνει και τις τρεις μεταβλητές (Χ1, Χ2, Χ3). Η τιμή του πίνακα Analysis of Variance αντιστοιχεί στην μηδενική υπόθεση: : = = = 0. Η τιμή αυτή είναι μηδέν (0) με ακρίβεια τριών δεκαδικών, που σημαίνει ότι η παλινδρόμηση της ως προς τις 3 προβλέπουσες μεταβλητές Χ1, Χ2 και Χ3 είναι στατιστικά σημαντική σε οποιοδήποτε λογικό επίπεδο σημαντικότητας. Ειδικότερα, επειδή < 0.01, συμπεραίνουμε ότι η παλινδρόμηση είναι στατιστικά σημαντική στο 0.01 επίπεδο σημαντικότητας. (β-3.5) Στον παραπάνω πίνακα βλέπουμε ότι το Minitab βρίσκει ότι = 38,26 για τις δεδομένες τιμές των Χ1, Χ2 και Χ3 και ότι τα ζητούμενα διαστήματα είναι τα εξής: Το 98% διάστημα εμπιστοσύνης (98% CI) για την μέση εκτίμηση της γεύσης είναι το (28,11; 48,42), το οποίο έχει την ακόλουθη ερμηνεία. Έχουμε 98% εμπιστοσύνη ότι 28,11 <, ;, ;, < 48,42, δηλαδή ότι η μέση εκτίμηση της γεύσης θα είναι μεταξύ 28,11 και 48,42 όταν η περιεκτικότητα σε οξικό οξύ (Χ1) είναι 5,1, σε υδρόθειο (Χ2) 8,3 και σε γαλακτικό οξύ (Χ3) 1,7. Το 98% διάστημα πρόβλεψης (98% PI) για την εκτίμηση της γεύσης είναι το: (14,95; 61,57), το οποίο έχει την ακόλουθη ερμηνεία. Έχουμε 98% εμπιστοσύνη ότι: 14,95 < < 61,57, δηλαδή ότι η εκτίμηση της γεύσης θα είναι μεταξύ 14,95 και 61,57 όταν η περιεκτικότητα σε οξικό οξύ (Χ1) είναι 5,1, σε υδρόθειο (Χ2) 8,3 και σε γαλακτικό οξύ (Χ3) 1,7.
Παρατηρούμε ότι το 98% διάστημα πρόβλεψης για την ιδιαίτερη τιμή της είναι πλατύτερο από το αντίστοιχο διάστημα εμπιστοσύνης για την μέση τιμή της. (γ-4) Το περιορισμένο (restricted) πρότυπο είναι το: = + + +, ενώ το πλήρες (full) πρότυπο είναι το: = + + + +. Θα κάνουμε τον έλεγχο της μηδενικής υπόθεσης: : = 0 έναντι της εναλλακτικής υπόθεσης: : 0, με χρήση της στατιστικής συνάρτησης του τύπου (9.91) για = 3, = 2, = 24: = ( ) ( 1) που ακολουθεί την κατανομή, =,. Έτσι, από τον Πίνακα Π4 βρίσκουμε ότι η κριτική τιμή είναι η.,, = 8,10. Από το προηγούμενο output του Minitab βρίσκουμε ότι = 3544,8. Για να υπολογίσουμε το προσαρμόζουμε το περιορισμένο πρότυπο με την διαδοχή: Stat > Regression > Regression Στο πλαίσιο διαλόγου που ανοίγει, τοποθετούμε την μεταβλητή Y στο πεδίο Response και τις μεταβλητές X1, και X2 στο πεδίο Predictors. (Σβήνουμε επίσης ότι γράψει στο μενού Options από το ερώτημα (α)! ) Πατάμε ΟΚ και παίρνουμε το ακόλουθο αποτέλεσμα στο Session του Minitab: Regression Analysis: Y versus X2; X3 The regression equation is Y = - 24,6 + 3,87 X2 + 16,9 X3 Predictor Coef SE Coef T P Constant -24,586 8,525-2,88 0,009 X2 3,8694 0,9415 4,11 0,000 X3 16,926 7,176 2,36 0,028 S = 8,17732 R-Sq = 71,5% R-Sq(adj) = 68,8% Analysis of Variance Source DF SS MS F P Regression 2 3518,1 1759,0 26,31 0,000 Residual Error 21 1404,2 66,9 Total 23 4922,3 από όπου βλέπουμε ότι = 3518,1. Αντικαθιστώντας, βρίσκουμε ότι η παρατηρούμενη τιμή της στατιστικής συνάρτησης ελέγχου είναι: = ( 3544,8 3518,1) (3 2) 1377,5 20 = 0.388.
Επειδή = 0.388 < 8,10 =.,,, δεν απορρίπτουμε τη μηδενική υπόθεση και συμπεραίνουμε ότι το περιορισμένο πρότυπο είναι το προτιμότερο. Επομένως, είναι λογική η απόφαση του ερευνητή.
Άσκηση 3 (α-6.5) Εισάγουμε τα δεδομένα στις στήλες C1 C9 ενός κενού φύλλου εργασίας του Minitab. Το αποτέλεσμα είναι το ακόλουθο: Στην συνέχεια επιλέγουμε την διαδοχή: Stat > Regression > Stepwise Στο πλαίσιο διαλόγου που ανοίγει, τοποθετούμε την μεταβλητή C1 Πωλήσεις στο πεδίο Response και τις μεταβλητές C2 έως C9 ( Χρόνος Αξιολόγηση ) στο πεδίο Predictors. Στην συνέχεια ανοίγουμε το μενού Methods, ενεργοποιούμε την επιλογή Backward elimination και αλλάζουμε την ένδειξη στο αντίστοιχο πεδίο Alpha to remove από την προεπιλεγμένη τιμή 0,1 στην τιμή 0,05. Πατάμε ΟΚ και ξανά ΟΚ και το αποτέλεσμα που παίρνουμε στο Session του Minitab είναι το ακόλουθο: 19/2/2013 6:53:21 μμ Welcome to Minitab, press F1 for help. Stepwise Regression: Πωλήσεις versus Χρόνος; Κλάδος;... Backward elimination. Alpha-to-Remove: 0,05 Response is Πωλήσεις on 8 predictors, with N = 25 Step 1 2 3 4 5 Constant -1508-1486 -1166-1114 -1312 Χρόνος 2,0 2,0 2,3 3,6 3,8 T-Value 1,04 1,10 1,34 3,06 3,01 P-Value 0,313 0,287 0,198 0,006 0,007 Κλάδος 0,0372 0,0373 0,0383 0,0421 0,0444 T-Value 4,54 4,75 5,07 6,25 6,20 P-Value 0,000 0,000 0,000 0,000 0,000 Διαφήμιση 0,151 0,152 0,141 0,129 0,152 T-Value 3,21 3,51 3,66 3,48 4,01 P-Value 0,006 0,003 0,002 0,003 0,001 Μερίδιο 199 198 222 257 259 T-Value 2,97 3,09 4,38 6,57 6,15 P-Value 0,009 0,007 0,000 0,000 0,000 Μεταβολή 291 296 285 325 T-Value 1,56 1,80 1,78 2,06 P-Value 0,139 0,090 0,093 0,053 Πελάτης 5,5 5,6 4,4 T-Value 1,16 1,23 1,09
P-Value 0,262 0,234 0,288 Φόρτος 20 20 T-Value 0,59 0,61 P-Value 0,565 0,550 Αξιολόγηση 8 T-Value 0,06 P-Value 0,950 S 449 436 428 430 464 R-Sq 92,20 92,20 92,03 91,50 89,60 R-Sq(adj) 88,31 88,99 89,38 89,27 87,52 Mallows Cp 9,0 7,0 5,4 4,4 6,4 Σύμφωνα με το παραπάνω output παρατηρούμε ότι έγιναν 5 βήματα κατά την εφαρμογή της μεθόδου. Οι έλεγχοι αρχίζουν από την μεταβλητή που αντιστοιχεί στη μικρότερη τιμή της στατιστικής συνάρτησης του τύπου (9.84) και συνεχίζουν μέχρι να μην υπάρχει κάποια τιμή > 0.05. Συμβολίζοντας με Υ την μεταβλητή «Πωλήσεις» και με X1,, X8 τις μεταβλητές Χρόνος,, Αξιολόγηση αντίστοιχα, έχουμε αναλυτικά ότι: Βήμα 1 (Step 1). Το περιορισμένο πρότυπο είναι το: = + + + + +, ενώ το πλήρες πρότυπο είναι το: = + + + + + +. Γίνεται ο έλεγχος της υπόθεσης: : = 0 έναντι της εναλλακτικής: : 0 με χρήση της στατιστικής συνάρτησης τύπος (9.84). Επειδή = 0,95 > 0.05 =, η μηδενική υπόθεση γίνεται δεκτή και έτσι η μεταβλητή Αξιολόγηση εξέρχεται από το πρότυπο. Αντίστοιχα γίνονται τα υπόλοιπα βήματα, τα στοιχεία των οποίων συνοψίζονται στον ακόλουθο πίνακα: Βήμα 1 Πρότυπα Περιορισμένο Πλήρες Υποθέσεις Μηδενική = + + + +, = + + + + +. : = 0, : 0. Εναλλακτική Τιμή P 0,950 Απόφαση H γίνεται δεκτή και άρα η μεταβλητή Χ8 Αξιολόγηση εξέρχεται από το πρότυπο. Βήμα 2 Πρότυπα Περιορισμένο Πλήρες = + + + +, = + + + + +.
Υποθέσεις Μηδενική : = 0, Εναλλακτική : 0. Τιμή P 0,550 Απόφαση H γίνεται δεκτή και άρα η μεταβλητή Χ7 Φόρτος εξέρχεται από το πρότυπο. Βήμα 3 Πρότυπα Περιορισμένο Πλήρες Υποθέσεις Μηδενική = + + + +, = + + + + +. : = 0, : 0. Εναλλακτική Τιμή P 0,288 Απόφαση H γίνεται δεκτή και άρα η μεταβλητή Χ6 Πελάτης εξέρχεται από το πρότυπο. Βήμα 4 Πρότυπα Περιορισμένο Πλήρες Υποθέσεις Μηδενική = + + + +, = + + + + +. : = 0, : 0. Εναλλακτική Τιμή P 0,053 Απόφαση H γίνεται δεκτή και άρα η μεταβλητή Χ5 Μεταβολή εξέρχεται από το πρότυπο. Βήμα 5 Πρότυπα Περιορισμένο Πλήρες Υποθέσεις Μηδενική = + + + +, = + + + + +. : = 0, : 0. Εναλλακτική Τιμή P 0,007 Απόφαση H απορρίπτεται και άρα η μεταβλητή Χ1 Χρόνος παραμένει στο πρότυπο. Η διαδικασία σταματάει εδώ. Το τελικό πρότυπο που προσαρμόζει το Minitab στα δεδομένα με την μέθοδο της πίσω απαλοιφής είναι το:,,, = 1312 + 3,8 + 0,0444 + 0,152 + 259
Από του output του Minitab βλέπουμε ακόμα ότι το R-Sq του τελικού μοντέλου είναι 89,60%. Δηλαδή με το πρότυπο αυτό ερμηνεύεται το 89,60 της μεταβλητότητας των δεδομένων της απόκρισης, δηλαδή των Πωλήσεων. (β-1.5) Στο ίδιο φύλλο εργασίας του Minitab εφαρμόζουμε την διαδοχή: Stat > Regression > Stepwise Στην συνέχεια ανοίγουμε το μενού Methods, ενεργοποιούμε την επιλογή Stepwise (forward and backward) και αλλάζουμε την ένδειξη στα αντίστοιχα πεδία Alpha to remove και Alpha to enter, από την προεπιλεγμένη τιμή 0,15 στην τιμή 0,05. Πατάμε ΟΚ και ξανά ΟΚ και το αποτέλεσμα που παίρνουμε στο Session του Minitab είναι το ακόλουθο: Stepwise Regression: Πωλήσεις versus Χρόνος; Κλάδος;... Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is Πωλήσεις on 8 predictors, with N = 25 Step 1 2 3 4 5 Constant 709,32 50,29-327,24-1441,93-1285,94 Πελάτης 21,7 19,0 15,6 9,2 8,2 T-Value 5,50 6,41 5,19 3,22 2,92 P-Value 0,000 0,000 0,000 0,004 0,009 Διαφήμιση 0,227 0,216 0,175 0,154 T-Value 4,50 4,77 4,74 4,09 P-Value 0,000 0,000 0,000 0,001 Κλάδος 0,0219 0,0382 0,0376 T-Value 2,53 4,79 4,90 P-Value 0,019 0,000 0,000 Μερίδιο 190 197 T-Value 3,82 4,10 P-Value 0,001 0,001 Μεταβολή 263 T-Value 1,61 P-Value 0,124 S 881 650 583 454 437 R-Sq 56,85 77,51 82,77 90,04 91,24 R-Sq(adj) 54,97 75,47 80,31 88,05 88,94 Mallows Cp 67,6 27,2 18,4 5,4 5,0 Το τελικό πρότυπο που προσαρμόζει το Minitab στα δεδομένα με την μέθοδο της βήμα προς βήμα παλινδρόμησης είναι το:,,,, = 1285,94 + 0,0376 + 0,154 + 197 + 263 + 8,2
και με αυτό ερμηνεύεται το 91,24% της μεταβλητότητας των δεδομένων των Πωλήσεων. (γ-3) Παρατηρούμε ότι με τις δύο μεθόδους καταλήξαμε σε διαφορετικά πρότυπα. Το πρότυπο που προέκυψε με την μέθοδο της πίσω απαλοιφής περιλαμβάνει τις μεταβλητές Χ1 Χ4, ενώ το πρότυπο που προέκυψε με την μέθοδο της βήμα προς βήμα παλινδρόμησης περιλαμβάνει τις μεταβλητές Χ2 Χ6. Επισημαίνουμε, ωστόσο, ότι η απόφαση για την εξαγωγή της μεταβλητής Χ5 στην μέθοδο της πίσω απαλοιφής ήταν οριακή ( = 0,053 > 0,05 = ). Αντίθετα, οι μεταβλητές Χ6 Πελάτης και Χ1 Χρόνος παρουσιάζουν τελείως διαφορετικές τιμές P με τις δύο μεθόδους. Για να ερμηνεύσουμε τις διαφορές αυτές πρέπει να γνωρίζουμε τις συσχετίσεις μεταξύ των προβλεπουσών μεταβλητών. Εφαρμόζοντας στο Minitab την διαδοχή: Stat > Basic Statistics > Correlation με τις μεταβλητές Χ2-Χ9 ( Χρόνος Αξιολόγηση ) παίρνουμε το ακόλουθο output στο Session του Minitab: Correlations: X1; X2; X3; X4; X5; X6; X7; X8 X1 X2 X3 X4 X5 X6 X7 X2 0,454 0,023 X3 0,249 0,174 0,230 0,405 X4 0,106-0,211 0,264 0,614 0,312 0,201 X5 0,251 0,268 0,377 0,085 0,225 0,195 0,064 0,685 X6 0,758 0,479 0,200 0,403 0,327 0,000 0,016 0,338 0,046 0,110 X7-0,179-0,259-0,272 0,349-0,288-0,199 0,391 0,212 0,188 0,087 0,163 0,341 X8 0,101 0,359 0,411-0,024 0,549 0,229-0,277 0,630 0,078 0,041 0,911 0,004 0,272 0,180 Cell Contents: Pearson correlation P-Value στο οποίο έχουμε επισημάνει τις συσχετίσεις που είναι σημαντικές στο 0.05 επίπεδο σημαντικότητας. Για παράδειγμα φαίνεται να υπάρχει πολύ ισχυρή θετική συσχέτιση ανάμεσα στις μεταβλητές Χ6 Πελάτης και Χ1 Χρόνος. Επίσης, σημαντικές είναι οι συσχετίσεις μεταξύ των μεταβλητών:
Χ1 Χρόνος και Χ2 Κλάδος, Χ6 Πελάτης και Χ1 Χρόνος, Χ2 Κλάδος και Χ4 Μερίδιο, και τέλος Χ8 Αξιολόγηση και Χ3 Διαφήμιση, Χ5 Μεταβολή. οι οποίες είναι όλες θετικές. Συνεπώς έχουμε πρόβλημα συγγραμικότητας. Σε αυτό οφείλεται και η μεγάλη αλλαγή στις τιμές P της μεταβλητής Χ1 κατά την εφαρμογή της μεθόδου της πίσω απαλοιφής. Παρατηρούμε ότι μόλις εξέρχεται από το πρότυπο η μεταβλητή Χ6 Πελάτης με την οποία υπάρχει συσχέτιση η τιμή P αλλάζει από 0,198 (μη σημαντική ) σε 0,006 (σημαντική). Αυτό σημαίνει ότι η μεταβλητή Χ1 δεν χρειάζεται σε ένα πρότυπο που υπάρχει η Χ6 (λόγω της συσχέτισης μεταξύ των δύο μεταβλητών), αλλά ότι χρειάζεται μόλις η Χ6 βγει από το πρότυπο. Στην περίπτωση αυτή που υπάρχει, δηλαδή, συγγραμικότητα οι μέθοδοι της πίσω απαλοιφής και της βήμα προς βήμα παλινδρόμησης μπορούν να οδηγήσουν σε μη ικανοποιητικά πρότυπα και συνίσταται και η χρήση άλλων διαδικασιών για την εύρεση του κατάλληλου προτύπου (Τευχίδιο Β, σελ. 71).
Άσκηση 4 (α-3) (i) Λάθος. Οφείλεται στις δύο αυτές κατηγορίες αλλά και στην ατελή διόρθωση των γνωστών συστηματικών σφαλμάτων (σελ. 135, Τόμος Γ). (ii) Σωστό. (σελ. 135, Τόμος Γ). (iii) Λάθος. Οφείλεται στις δύο αυτές κατηγορίες αλλά και στα άγνωστα συστηματικά σφάλματα (σελ. 135, Τόμος Γ). (iv) Λάθος. Δεν μπορούμε να μιλάμε για τυχαία και συστηματική αβεβαιότητα, αλλά μόνο για συστατικό της αβεβαιότητας που απορρέει από τυχαία επίδραση και για συστατικό που απορρέει από συστηματική επίδραση (σελ. 136, Τόμος Γ). (β-3) (i) Λάθος. Οφείλεται στις δύο αυτές κατηγορίες, αλλά και στην διαφορές μεταξύ των κομματιών του ίδιου προϊόντος (σελ. 108, Τευχίδιο Β). (ii) Λάθος. Από την αληθή τιμή του μετρούμενου χαρακτηριστικού εξαρτάται το συστηματικό και όχι το τυχαίο σφάλμα (τύπος (10.1), Τευχίδιο Β). (iii) Λάθος. Στις κατηγορίες αυτές αναλύονται τα συστηματικά σφάλματα (σελ. 45, Τόμος Γ). (iv) Σωστό. (σελ. 108, Τευχίδιο Β). (γ-3) Βασιζόμενοι στον Πίνακα 9.10 του Τόμου Β: (i) Λάθος. Το άθροισμα τετραγώνων SSR που οφείλεται στην παλινδρόμηση είναι ίσο με: = = 5949.46 2825.63 = 3123.83. Η τιμή 520.64 αντιστοιχεί στο μέσο άθροισμα MSR από το οποίο το SSR προκύπτει ως εξής: = = 6 520.64 = 3123.83. (ii) Σωστό. Οι βαθμοί ελευθερίας που αντιστοιχούν στο συνολικό άθροισμα τετραγώνων (SS Total) είναι ίσοι με 1 = 99. Συνεπώς, το μέγεθος του δείγματος είναι ίσο με: = 99 + 1 = 100. (iii) Λάθος. Παρατηρούμε ότι R-Sq= 52.5%, που σημαίνει ότι με την προσαρμογή του προτύπου ερμηνεύεται το 52.5% της ολικής μεταβλητότητας των δεδομένων της εξαρτημένης μεταβλητής. (iv) Λάθος. Η διασπορά των σφαλμάτων εκτιμάται ότι είναι: = = 30.38. Άρα, η τυπική απόκλιση εκτιμάται ότι είναι ίση με: = = 5.51. (δ-3) (i) Λάθος. Πίνακας 1.4, Τόμος Γ.
(ii) Λάθος. Πίνακας 1.4, Τόμος Γ. (iii) Λάθος. Πίνακας 1.4, Τόμος Γ. (iv) Σωστό. Πίνακας 1.4, Τόμος Γ. (ε-3) (i) Σωστό. (σελ. 65-66, Τόμος Γ). (ii) Λάθος. Για να είχε κάνει επαλήθευση της ζυγαριάς θα έπρεπε να την είχε συγκρίνει με άλλες ζυγαριές ίδιας ακρίβειας κάτω από συγκεκριμένες και ορισμένες συνθήκες. (σελ. 65-66, Τόμος Γ). (iii) Λάθος. Η βαθμονόμηση έγινε στο δεύτερο βήμα και η διακρίβωση αφορά ρύθμιση σε όλο το εύρος τιμών και όχι μόνο σε μία θέση, όπως έγινε εδώ. (σελ. 65-66, Τόμος Γ). (iv) Λάθος. Δεν υπήρχε υστέρηση καθώς δεν υπήρχε τίποτα πάνω στην ζυγαριά, την ώρα που εμφανίστηκε το σφάλμα στην μέτρηση (σελ. 32, Τόμος Γ).
Άσκηση 5 (α-1) Σύμφωνα με τον Πίνακα 9.10 γνωρίζουμε ότι οι βαθμοί ελευθερίας που αντιστοιχούν στο συνολικό άθροισμα τετραγώνων ( SS Total) είναι ίσοι με το μέγεθος του δείγματος μείον 1, δηλαδή ίσοι με 1. Έτσι, από τον Πίνακα Analysis of Variance του output παρατηρούμε ότι: 1 = 19 = 20, δηλαδή συγκεντρώθηκαν πληρο- Συνεπώς, το μέγεθος του δείγματος είναι φορίες από 20 πελάτες. (β-2) Παρατηρούμε ότι η τιμή του R-Sq είναι ίση με 80.1%. Αυτό σημαίνει ότι το ποσοστό της μεταβλητότητας των δεδομένων που ερμηνεύεται με την προσαρμογή του προτύπου είναι 80.1%. Άρα, αυτό που μένει ανερμήνευτο είναι το: 100% 80.1% = 19.9%. (γ-2) Η τιμή του πίνακα Analysis of Variance αντιστοιχεί στην μηδενική υπόθεση: : = = = 0. Η τιμή αυτή είναι μηδέν (0) με ακρίβεια τριών δεκαδικών, που σημαίνει ότι η παλινδρόμηση της ως προς τις 3 προβλέπουσες μεταβλητές Α, Β και Γ είναι στατιστικά σημαντική σε οποιοδήποτε λογικό επίπεδο σημαντικότητας. Ειδικότερα, επειδή < 0.01, συμπεραίνουμε ότι η παλινδρόμηση είναι στατιστικά σημαντική στο 0.01 επίπεδο σημαντικότητας. (δ-2) Εδώ θέλουμε να ελέγξουμε την : = 0 έναντι της : 0 σε ένα πρότυπο πολλαπλής γραμμικής παλινδρόμησης με = 20 και = 3. Aπό τον πίνακα των συντελεστών βρίσκουμε ότι η τιμή που αντιστοιχεί σε αυτήν την είναι = 0.170. Επειδή = 0.170 > 0.01, η απάντηση στο ερώτημα είναι αρνητική (δεν είναι σημαντική). (ε-4) Το περιορισμένο πρότυπο είναι το: = + (απλό πρότυπο θέσης) και το πλήρες πρότυπο είναι το: = + +. Θα κάνουμε τον έλεγχο της : = 0 έναντι της : 0 με χρήση της στατιστικής συνάρτησης της σχέσης (9.91), με = 1, = 0, που ακολουθεί την κατανομή, =,. Έτσι, από τον Πίνακα Π4 βρίσκουμε ότι η κριτική τιμή είναι η.,, = 8,29. Εξ ορισμού είναι: = 0. Από τον πίνακα του Minitab με τα Seq SS βρίσκουμε ότι: = 352.27 και από τον πίνακα Analysis of Variance ότι: = 495.39. Συνεπώς, η παρατηρούμενη τιμή της είναι:
= ( ) ( 1) = 18 = 352.27 18 (495.39 352.27) = 44.3 Επειδή = 44.3 > 8,29 =.,,, απορρίπτουμε τη μηδενική υπόθεση και συμπεραίνουμε ότι το πλήρες πρότυπο είναι το προτιμότερο. Επομένως, δίνουμε καταφατική απάντηση στο ερώτημα, δηλαδή είναι σημαντική. (στ-4) Το περιορισμένο πρότυπο είναι το: = + + και το πλήρες πρότυπο είναι το: = + + +. Θα κάνουμε τον έλεγχο της : = 0 έναντι της : 0 με χρήση της στατιστικής συνάρτησης της σχέσης (9.91), με = 2, = 1, που ακολουθεί την κατανομή, =,. Έτσι, από τον Πίνακα Π4 βρίσκουμε ότι η κριτική τιμή είναι η.,, = 8,40. Από τον πίνακα του Minitab με τα Seq SS βρίσκουμε ότι: = 35.27 και ότι = 352.27 + 33.17 = 385.44, και από τον πίνακα Analysis of Variance ότι: = 495.39. Η παρατηρούμενη τιμή της είναι: = ( ) ( 1) = ( 385.44 352.27) = 5.13. (495.39 385.44) 17 (Μπορούμε να συμπεράνουμε και άμεσα τον αριθμητή του στατιστικού από τον Πίνακα Seq SS: είναι ακριβώς το άθροισμα τετραγώνων που «συνεισφέρει» η μεταβλητή Β όταν εισέρχεται σε ένα πρότυπο που υπάρχει ήδη η Α!) Επειδή = 5.13 < 8,40 =.,,, δεν απορρίπτουμε τη μηδενική υπόθεση και συμπεραίνουμε ότι το περιορισμένο πρότυπο είναι το προτιμότερο. Επομένως, δίνουμε αρνητική απάντηση στο ερώτημα, δηλαδή δεν είναι σημαντική.
Άσκηση 6 (α-2) Πρώτα εκφράζουμε όλες τις τιμές που δίνονται στην ίδια μονάδα μέτρησης μήκους, δηλαδή σε mm. Έτσι, έχουμε: = 3 10 ± 0.05 10 Ωm = 3 10 10 ± 0.05 10 10 Ωm = 3 10 ± 0.05 10 Ωmm, και = 1 ± 0.01m = 1 10 ± 0.01 10 mm = 1000 ± 10mm. Αντικαθιστώντας τις τιμές στην δοσμένη σχέση βρίσκουμε ότι: = 3 10 Ωmm 1000mm 3mm = 10 Ω, δηλαδή ότι η ηλεκτρική αντίσταση στην περίπτωση αυτή είναι: = 0.01 Ω. (β-6) Θα χρησιμοποιήσουμε τον τύπο (1.15) του Τόμου Γ. Είναι: όπου: = + + = = 1000 3 (0.05 10 ) = 2.77 10 Ω. = 1 = 3 10 3 10 = 1 10 Ω. 3 10 1000 = = 3 0.1 = 1.1 10 Ω. Αντικαθιστώντας βρίσκουμε ότι: = 2.77 10 Ω + 1 10 Ω + 1.1 10 Ω = 3.86 10 Ω. Δηλαδή το σύνθετο πιθανό σφάλμα υπολογισμού της ηλεκτρικής αντίστασης του μεταλλικού αγωγού είναι ίσο με: = 3.86 10 Ω. (γ-2) Θα χρησιμοποιήσουμε τον τύπο (1.11) του Τόμου Γ. Αντικαθιστώντας τις τιμές που βρήκαμε στα ερωτήματα α (στον παρονομαστή) και β (στον αριθμητή) υπολογίζουμε ότι σχετικό σύνθετο σφάλμα υπολογισμού της ηλεκτρικής αντίστασης του μεταλλικού αγωγού είναι ίσο με: = = 3.86 10 Ω 0.01Ω = 0.0386
ή 3.86%.
Άσκηση 7 (α-9) Σύμφωνα με την διαδικασία που περιγράφεται στην σελίδα 142 του Τόμου Γ, η μέτρηση μπορεί να μοντελοποιηθεί ως εξής: όπου: = + είναι η ένδειξη της μετροταινίας είναι το πραγματικό μήκος του συρματόσχοινου και είναι το σφάλμα (ή η διόρθωση που πρέπει να γίνει) Η συνδυασμένη τυπική αβεβαιότητα υπολογίζεται από τον τύπο (2.9): = + ( ) και από την συνεισφορά των εξής παραγόντων: Αβεβαιότητα τύπου Α Επαναληψιμότητα μετροταινίας Σύμφωνα με την παράγραφο 2.3.2β, σελ. 138, η τυπική αβεβαιότητα τύπου Α, δίνεται από τον τύπο: = ( ) = ( ) όπου ( ) η τυπική απόκλιση των μετρήσεων, δηλαδή: ( ) = 1 1 ( ) = 1 10 1 ( ) Υπολογίζουμε την μέση τιμή: και αντικαθιστούμε: = 1 10 = 1 50.171 = 5.0171 10 ( ) = 1 9 [( 5,018 5,0171) + + (5,015 5,0171) ] = 0.002079 Άρα, η τυπική αβεβαιότητα που οφείλεται στην επαναληψιμότητα της μετροταινίας είναι:
και έχει = 0.002079 10 = 10 1 = 9 βαθμούς ελευθερίας. = 0.000657m = 0.657mm Αβεβαιότητες τύπου Β 1. Αβεβαιότητα που προκύπτει από την βαθμονόμηση της μετροταινίας Η αβεβαιότητα λόγω της βαθμονόμησης της μετροταινίας είναι αβεβαιότητα τύπου Β, που αντιστοιχεί σύμφωνα με την εκφώνηση σε ομοιόμορφη κατανομή. Άρα, με βάση την παράγραφο 2.3.2γ, σελ 139, έχουμε ότι: με βαθμούς ελευθερίας. = 0.005m 2 3 = 0.001443m = 1.443mm, 2. Αβεβαιότητα που προκύπτει λόγω πιθανής μη ευθυγράμμισης του συρματόσχοινου κατά τη διενέργεια των μετρήσεων Η αβεβαιότητα λόγω πιθανής μη ευθυγράμμισης του συρματόσχοινου κατά τη διενέργεια των μετρήσεων είναι αβεβαιότητα τύπου Β, που αντιστοιχεί σύμφωνα με την εκφώνηση σε τριγωνική κατανομή. Άρα, με βάση την παράγραφο 2.3.2γ, σελ 139, έχουμε ότι: = 2mm 6 = 0.816mm, με βαθμούς ελευθερίας. Ο υπολογισμός της συνδυασμένης τυπικής αβεβαιότητας δίνεται από τον τύπο: = + + = (0.657mm) + (1.443mm) + (0.816mm) = = 1.784mm (β-2) Η εκτεταμένη τυπική αβεβαιότητα δίνεται από τον τύπο: = = 1.784mm, όπου είναι ο συντελεστή κάλυψης. Άρα, για την δεδομένη τιμή: = 3.956mm, βρίσκουμε ότι: = 3.956mm 1.784mm = 2.22
Από τον Πίνακα 2.8 και για 50 αποτελεσματικούς βαθμούς ελευθερίας, βρίσκουμε ότι η τιμή αυτή αντιστοιχεί σε κάποιο επίπεδο εμπιστοσύνης ανάμεσα στο 95,45% και στο 99,00%. Με την μέθοδο της γραμμικής παρεμβολής, βρίσκουμε ότι, το ζητούμενο επίπεδο εμπιστοσύνης είναι το: = 95,45% + (99,00% 95,45%) 2,22 2,05 2,68 2,05 = 96.41%.
Άσκηση 8 (α-6) Θα κάνουμε ανάλυση Pareto, σύμφωνα με την παράγραφο 1.3 του Τόμου Δ. Εισάγουμε τα δεδομένα στις στήλες C1-C3 ενός κενού φύλλου εργασίας του Minitab. Στην συνέχεια ονομάζουμε την στήλη C4 «Έσοδα» και υπολογίζουμε τα συνολικά έσοδα από κάθε είδος αλλαντικού ως το γινόμενο της (μέσης) τιμής ανά κιλό και των ποσοτήτων (σε κιλά) που πωλούνται. Αυτό γίνεται επιλέγοντας με αριστερό κλικ την στήλη C4, κάνοντας δεξί κλικ και εφαρμόζοντας την διαδοχή: Formulas > Assign Formula to Column. Στο πεδίο Expression του πλαισίου διαλόγου που ανοίγει, εισάγουμε την παρακάτω έκφραση: και πατάμε ΟΚ. Στην συνέχεια, για να κατασκευάσουμε το διάγραμμα Pareto, εφαρμόζουμε την διαδοχή: Stat > Quality Tools > Pareto Chart. Στο πλαίσιο διαλόγου που ανοίγει, ενεργοποιούμε την ένδειξη Chart defects table και εισάγουμε την μεταβλητή C1 Τύπος στο πεδίο Labels in και την μεταβλητή C4 Έσοδα στο πεδίο Frequencies in και πατάμε ΟΚ. Το αποτέλεσμα που παίρνουμε είναι το ακόλουθο διάγραμμα Pareto: 6 0 0 0 0 0 P a r e to C h a r t o f Τ ύ π ο ς 5 0 0 0 0 0 1 0 0 4 0 0 0 0 0 8 0 Έσ οδα 3 0 0 0 0 0 6 0 Percent 2 0 0 0 0 0 4 0 1 0 0 0 0 0 2 0 0 Τ ύ π ο ς Ζ α μ π ό ν Π α ρ ιζά κι Γ α λο π ο ύ λα Σ α λά μ ι Μ π έ ικο ν Έ σ ο δ α 1 5 4 0 8 6 1 4 1 9 8 6 1 2 2 5 3 6 6 1 7 1 4 5 1 7 5 4 P e r c e n t 2 9,0 2 6,7 2 3,0 1 1,6 9,7 C u m % 2 9,0 5 5,6 7 8,7 9 0,3 1 0 0,0 0 Όπως φαίνεται από το παραπάνω διάγραμμα τα έσοδα από το Ζαμπόν μπούτι, το Παριζάκι και την Γαλοπούλα, αποτελούν το 78,7% δηλαδή σχεδόν το 80% των συνολικών εσόδων των σούπερ μάρκετ. Άρα, αυτά οι τρεις τύποι αλλαντικών πρέπει
να επιλεγούν προς διάθεση στους πελάτες ώστε να αυξηθεί η κερδοφορία των σούπερ μάρκετ. (β-9) Προσθέτουμε τα δεδομένα του δεύτερου Πίνακα στις στήλες C5-C7 του ίδιου φύλλου εργασίας του Minitab και στην συνέχεια υπολογίζουμε στην στήλη C8 τα συνολικά έσοδα από το δείγμα της υπόλοιπης Ελλάδας όπως και προηγουμένως. Τώρα, όμως πολλαπλασιάζουμε και με τον συντελεστή 7.5/3.5 προκειμένου να βρούμε τα συνολικά έσοδα της υπόλοιπης Ελλάδας και όχι μόνο του δείγματος (το οποία αφορά 3.5 από τα 7.5 εκατ.). Τέλος, αθροίζουμε τα στοιχεία των στηλών C4 και C7 στην στήλη C9, την οποία και ονομάζουμε «Συνολικά Έσοδα». Το φύλλο εργασίας του Minitab θα πρέπει να έχει την ακόλουθη μορφή: Η στήλη C7 προκύπτει από τον τύπο: 'Πωλήσεις_2' * 'Τιμή_2' * 7,5/3,5 Η στήλη C9 προκύπτει από τον τύπο: Έσοδα + 'Έσοδα_2' Στην συνέχεια, για να κατασκευάσουμε το διάγραμμα Pareto, εφαρμόζουμε την διαδοχή: Stat > Quality Tools > Pareto Chart. Στο πλαίσιο διαλόγου που ανοίγει, ενεργοποιούμε την ένδειξη Chart defects table και εισάγουμε την μεταβλητή C1 Τύπος στο πεδίο Labels in και την μεταβλητή C9 Συνολικά Έσοδα στο πεδίο Frequencies in και πατάμε ΟΚ. Το αποτέλεσμα που παίρνουμε είναι το ακόλουθο διάγραμμα Pareto:
2 0 0 0 0 0 0 P a r e t o C h a r t o f Τ ύ π ο ς 1 0 0 1 5 0 0 0 0 0 8 0 Συνολικά Έσοδα 1 0 0 0 0 0 0 6 0 4 0 Pe rce nt 5 0 0 0 0 0 2 0 0 Τ ύ π ο ς Ζ α μ π ό ν Π α ρ ιζ ά κ ι Γ α λ ο π ο ύ λ α Σ α λ ά μ ι Μ π έ ικ ο ν Σ υ ν ο λ ικ ά Έ σ ο δ α 4 7 3 8 6 3 4 2 1 2 0 9 3 9 1 8 6 8 3 1 9 6 3 6 2 5 8 6 9 7 P e r c e n t 2 5,4 2 2,6 2 1,0 1 7,1 1 3,9 C u m % 2 5,4 4 8,0 6 9,0 8 6,1 1 0 0,0 0 Σύμφωνα με αυτό το διάγραμμα, τα αλλαντικά τα οποία θα πρέπει να διαθέσουν τα σούπερ μάρκετ προς πώληση για αύξηση της κερδοφορίας τους είναι κατά σειρά το Ζαμπόν μπούτι, το Παριζάκι, η Γαλοπούλα αλλά και το Σαλάμι αέρος, καθώς τα 3 πρώτα αφορούν μόνο το 69,0% των πωλήσεων. Η κρίσιμή τιμή του 80% ξεπερνιέται όταν διατεθεί και το τέταρτο κατά σειρά αλλαντικό που είναι το Σαλάμι αέρος. Καλή Επιτυχία!