ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΠΟ ΤΟ ΕΓΧΕΙΡΙ ΙΟ ΤΟΥ ΜΑΘΗΜΑΤΟΣ INFORMATION MANAGEMENT

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΠΟ ΤΟ ΕΓΧΕΙΡΙ ΙΟ ΤΟΥ ΜΑΘΗΜΑΤΟΣ INFORMATION MANAGEMENT"

Transcript

1 KINGSTON UNIVERSITY ICBS Business College ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΠΟ ΤΟ ΕΓΧΕΙΡΙ ΙΟ ΤΟΥ ΜΑΘΗΜΑΤΟΣ INFORMATION MANAGEMENT ΕΙΣΗΓΗΤΗΣ : ΑΘΑΝΑΣΙΟΣ Ν. ΣΤΑΜΟΥΛΗΣ

2 Ανάλυση δεδοµένων και βασικές έννοιες Για τον σκοπό της κατανόησης των βασικών εννοιών της στατιστικής ανάλυσης δεδοµένων, θα χρησιµοποιηθεί το παρακάτω παράδειγµα. Τα δεδοµένα προέρχονται από µια θεωρητική έρευνα σχετική µε τα εστιατόρια µιας περιοχής. Ο βασικός στόχος είναι : Να περιγραφούν οι ιδιότητες και τα βασικά χαρακτηριστικά των εστιατορίων της περιοχής. Να εκτιµηθεί η κατάσταση του τοµέα των επιχειρήσεων εστίασης, και να προσδιοριστούν προβλήµατα που τυχόν υπάρχουν. Να δηµιουργηθούν πληροφορίες χρήσιµες για την ανάπτυξη των µικρών επιχειρήσεων σε ότι αφορά τον σχεδιασµό και την λειτουργία τους. Η υποθετική έρευνα έγινε µέσω ταχυδροµικής αποστολής ερωτηµατολογίου σε ένα τυχαίο δείγµα (από τον ταχυδροµικό κατάλογο και χρυσό οδηγό) χιλίων εστιατορίων. Από αυτά επεστράφησαν 279 ερωτηµατολόγια κατάλληλα για χρήση. Οι µεταβλητές που περιείχε κάθε ερωτηµατολόγιο και ο τρόπος µέτρησης τους δίνεται παρακάτω. OUTLOOK Προοπτική της επιχείρησης. 1 έως 7. 1=πολύ αρνητική, 7=πολύ θετική (ευνοϊκή) SALES Μεικτές πωλήσεις (εισπράξεις) NEWCAP Νέες επενδύσεις σε χιλιάδες ευρώ VALUE Αξία σε χιλιάδες ευρώ COSTGOOD Κόστος προϊόντων σε χιλιάδες ευρώ WAGES Μισθοί σε χιλιάδες ευρώ ADS Έξοδα διαφήµισης σε χιλιάδες ευρώ TYPEFOOD Τύπος φαγητού που σερβίρουν. 1=Fast Food, 2= Private diner, 3= Business diner SEATS Πλήθος καθισµάτων OWNER Καθεστώς ιδιοκτησίας. 1=Ένας ιδιοκτήτης, 2=Πολλοί ιδιοκτήτες, 3=Εταιρία. FTEMPL Πλήθος υπαλλήλων πλήρους απασχόλησης. PTEMPL Πλήθος υπαλλήλων µερικής απασχόλησης. SIZE Μέγεθος του εστιατορίου, µετρηµένο ως προς το πλήθος των πλήρως Απασχολούµενων υπαλλήλων. 1=Μικρό (<10), 2=Μεσαίο (10-20), 3=Μεγάλο (>20) 2

3 Η στατιστική Πολλοί αντιλαµβάνονται την στατιστική σαν µια δύσκολη διαδικασία, που απαιτεί ιδιαίτερες γνώσεις µαθηµατικών. Και οι δύο θεωρήσεις είναι λανθασµένες. Η διαδικασία βασίζεται σε καθαρές λογικές και οι αριθµητικές πράξεις, πέρα από τα περίεργα σύµβολα, βασίζονται στις τέσσερις βασικές, που όλοι έχουµε την ικανότητα να εκτελούµε. Από τον απλό µέσο όρο µέχρι την χρήση πολύπλοκων διαδικασιών, η στατιστική βοηθά στην µετατροπή των δεδοµένων σε πληροφορίες. Η απόδειξη της επίδρασης του αλκοόλ στα τροχαία ατυχήµατα επήλθε από ιδιαίτερα λεπτοµερείς στατιστικές αναλύσεις. Το ίδιο έγινε και για την απόδειξη της πολυτιµότητας των Customer Relationship Management συστηµάτων. Έτσι δεν είναι περίεργο που στους παρακάτω τοµείς της επιχειρηµατικής δραστηριότητας, η στατιστική παίζει κεντρικό ρόλο. Έρευνα Αγοράς. Χρησιµοποιείται σε πολλές εφαρµογές, συµπεριλαµβανοµένης της περιγραφής και ανάλυσης της συµπεριφοράς των καταναλωτών. Οικονοµικές αναφορές. Παροχή πληροφοριών για την απόδοση της επιχείρησης προς το management. Προγραµµατισµός παραγωγής. Όπου χρειάζεται λεπτοµερής πληροφόρηση, για τον προσδιορισµό της τάσης π.χ. να ληφθούν αποφάσεις για την λειτουργία της αποθήκης. Ποιοτικός έλεγχος. Όπου τα στατιστικά µπορούν να εξασφαλίσουν την διατήρηση των ποιοτικών χαρακτηριστικών της παραγωγής. ιαχείριση προσωπικού. Σε πολλές περιοχές όπως η διαπίστωση διακρίσεων, η µέτρηση της παραγωγικότητας κ. ά. µπορούν να υποστηριχθούν µε στατιστικές αναλύσεις. Προβλέψεις. Η πρόβλεψη επιχειρηµατικών µεγεθών µε διάφορα επίπεδα ακρίβειας µπορεί να επιτευχθεί µε διάφορα στατιστικά µοντέλα. Βλέπουµε, ότι όλες οι παραπάνω χρήσης της στατιστικής έχουν ένα κοινό παράγοντα κλειδί. Την χρήση ιστορικών στοιχείων για την παραγωγή πληροφοριών που µπορούν να βοηθήσουν στην κατανόηση της επίκαιρης λειτουργίας µιας επιχείρησης και κάποιο έλεγχο για την µελλοντική λειτουργία της. ίνει δηλαδή την δυνατότητα να 3

4 αντιδράσουµε πριν είναι αργά. Όπως όλα τα εργαλεία πρέπει να χρησιµοποιείται µε προσοχή και κατανόηση των διαδικασιών και των προϋποθέσεων. Πάρτε υπόψη Σε όλες τις διαδικασίες υπάρχουν κανόνες που αν δεν τηρούνται τα αποτελέσµατα είναι άχρηστα. Τεχνικές Υπάρχει πληθώρα στατιστικών τεχνικών, που µπορούν να χρησιµοποιηθούν για να εξαχθούν χρήσιµες πληροφορίες από δεδοµένα, που διαφορετικά δεν θα έλεγαν τίποτα. Πολλές όµως από αυτές έχουν αναπτυχθεί για να καλύψουν κάποιες πολύ ιδιαίτερες καταστάσεις, που συνήθως σχετίζονται µε την φύση των δεδοµένων. Π.χ. αν στο δείγµα υπάρχουν ακραίες τιµές θα πρέπει να προσεχθούν. εδοµένα Η ποιότητα των δεδοµένων είναι καταλυτική. Όσο καλή και να είναι η στατιστική µέθοδος, αν επεξεργάζεται επισφαλή δεδοµένα δεν πρόκειται να δώσει κάποια χρήσιµη πληροφορία. Αν θέλετε να συλλέξετε δεδοµένα για αθλητικά προϊόντα και ρωτήσετε µόνο λίγα άτοµα από τον µικρό αθλητικό όµιλο της περιοχής σας, δεν είναι δυνατόν να µπορέσετε να βγάλετε κάποιο χρήσιµο αποτέλεσµα. Σφάλµατα Σφάλµατα µπορούν να υπάρξουν για πολλούς λόγους. Πχ. από την αρχική στρατηγική συλλογής του δείγµατος, από την επιλογή των πεδίων συλλογής του δείγµατος, από την καταχώρηση των δεδοµένων, από τους περιορισµούς της τεχνικής που θα χρησιµοποιηθεί. Το θέµα είναι τα λάθη αυτά να ελαχιστοποιούνται ενώ αυτά που εµφανίζονται δυναµικά να εκτιµώνται και να αξιολογούνται. Βασικές Αρχές Πληθυσµός και δείγµα (Population and Sample) Πληθυσµός θεωρείται το σύνολο των στοιχείων του φαινόµενου προς µελέτη. Όλα τα εστιατόρια της περιοχής. Όλοι οι ψηφοφόροι της χώρας. Στην ουσία όταν µιλάµε για πληθυσµό µιλάµε για απογραφή (census) Τις περισσότερες φορές ο πληθυσµός είναι πολύ µεγάλος και είναι αδύνατο ή πολύ ακριβό το να συλλέξουµε πληροφορίες για ολόκληρο των πληθυσµό. Έτσι καταφεύγουµε σε ένα δείγµα δηλ. ένα αντιπροσωπευτικό υποσύνολο ή ποσοστό του πληθυσµού, το οποίο µπορεί να χρησιµοποιηθεί για να προβλεφθεί η συµπεριφορά, τα χαρακτηριστικά κλπ. του πληθυσµού. Όταν κάνουµε κάποια πράξη πάνω στα δεδοµένα του δείγµατος όπως π.χ. τον µέσο όρο των τιµών του, δηµιουργούµε ένα στατιστικό. Η αντίστοιχη τιµή του πληθυσµού, δηλ. ο µέσος όρος του καλείται παράµετρος. Αν το δείγµα είναι ένα πραγµατικά τυχαίο δείγµα, δηλ. κάθε µέλος του πληθυσµού έχει την ίδια πιθανότητα (µη µηδενική) να επιλεχθεί για το δείγµα, όχι µόνο µπορούµε να εκτιµήσουµε τις παραµέτρους του πληθυσµού µέσω του 4

5 δείγµατος, αλλά να έχουµε και µια πολύ καλή άποψη, για την ακρίβεια της εκτίµησης. Επαγωγές. Όταν χρησιµοποιούµε το δείγµα µας τις περισσότερες φορές θέλουµε να κάνουµε επαγωγές στον πληθυσµό. Στις περισσότερες περιπτώσεις δεν θέλουµε απλά να βρούµε µια παράµετρο, όπως ο µέσος όρος του πληθυσµού, αλλά κύρια ενδιαφερόµαστε να βρούµε αν είναι µεγαλύτερος ή µικρότερος από κάποιο άλλο µέσο όρο, πχ. ποιος είναι ο µέσος όρος ζωής ενός νέου προϊόντος της εταιρίας µας συγκρινόµενος µε τον αντίστοιχο του ανταγωνισµού. Έτσι τα επαγωγικά στατιστικά σε πολλές περιπτώσεις είναι η εκτίµηση παραµέτρων δύο ή περισσοτέρων πληθυσµών µε στόχο την σύγκρισή τους. Σηµασιολογία Για τα στατιστικά που αναφέρονται στον πληθυσµό χρησιµοποιούνται Ελληνικά σύµβολα. Ενώ για αυτά που αναφέρονται στο δείγµα χρησιµοποιούνται Λατινικοί χαρακτήρες. Μέσος όρος µ x Τυπική απόκλιση σ s Μέγεθος δείγµατος Ν n Είναι πολύ συνηθισµένη η χρήση του συµβόλου της άθροισης για κάποιο σύνολο τιµών. N x i i 1 10 i 1 x i = x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + Κατηγορίες δεδοµένων x 10 = =52 Τα δεδοµένα που συλλέγονται και αποτελούν την πρώτη ύλη της στατιστικής, χωρίζονται σε τέσσερις κλίµακες µέτρησης. Ονοµαστική κλίµακα (Nominal scale) Στην κλίµακα αυτή οι αριθµοί χρησιµοποιούνται σαν ετικέτες για την κατηγοριοποίηση των δεδοµένων. Πχ. 1=Άνδρας, 2=Γυναίκα Τακτική κλίµακα (Ordinal scale) Τα δεδοµένα της κλίµακας αυτής αντιπροσωπεύουν και αυτά κατηγορίες µε πρόσθετο χαρακτηριστικό ότι οι κατηγορίες είναι ταξινοµηµένες και παρουσιάζουν µια διαφορά 5

6 που δεν προσδιορίζεται µε ακρίβεια. Π.χ. το σέρβις που προσφέρεται από τα εστιατόρια µπορεί να κατηγοριοποιηθεί σε Άψογο, Καλό, Μέτριο, Κακό. Κλίµακες ιαστηµάτων (Interval scale) Εδώ τα αριθµητικά δεδοµένα έχουν την ιδιότητα η διαφορά µεταξύ δύο αριθµών της κλίµακας (απόσταση) να αντιπροσωπεύει ίση διαφορά στην µέτρηση του χαρακτηριστικού, ενώ το µηδέν επιλέγεται αυθαίρετα. Κλασικό παράδειγµα είναι οι κλίµακες θερµοκρασιών Fahrenheit και Celsius. Το µηδέν σε Fahrenheit είναι οι 32 βαθµοί. Και στις δύο κλίµακες µπορούµε να πούµε ότι οι 35 βαθµοί είναι κατά 10 βαθµούς θερµότεροι από τους 25. Η ένδειξη όµως της θερµοκρασίας που δίνει µια µεταβλητή έχει διαφορετική ερµηνεία στις 2 κλίµακες. Αναλογική κλίµακα Εδώ τα δεδοµένα µετρώνται σε κλίµακα που είναι έτσι κατασκευασµένη ώστε ίσες αποστάσεις µεταξύ των αριθµών, αντιστοιχούν σε όµοιες αποστάσεις στην µετρούµενη µεταβλητή, ενώ η µηδενική τιµή έχει όντως την µηδενική σηµασία. Στην ηλικία των ανθρώπων η τιµή 0 είναι η στιγµή της γέννησης. Κατηγορίες µεταβλητών Όταν µια µεταβλητή µπορεί να λάβει συγκεκριµένες τιµές περιορισµένου φάσµατος ονοµάζεται διακριτή (discrete). Περιγράφουν συνήθως κατηγορίες ή τιµές όπως π.χ. το πλήθος των ελαττωµατικών µονάδων που βρέθηκαν σε µια παρτίδα παραγωγής ενός προϊόντος. Όταν η µεταβλητή µπορεί να λάβει οποιαδήποτε τιµή σε κάποιο διάστηµα ονοµάζεται συνεχής (continuous). Π.χ. ύψος, βάρος, χρόνος, ποσοστό αλλαγής, κατανάλωση βενζίνης. Συµπερασµατικά Μπορούµε τελικά να πούµε ότι τα δεδοµένα χωρίζονται σε 2 βασικές κατηγορίες Ποσοτικά (µεγέθη) Ποιοτικά (κατηγορίες) Στο SPSS οι µεταβλητές µπορούν να χαρακτηριστούν ως προς την µέτρηση (Measure) σε : Scale (Ποσοτική) Nominal (Ποιοτική: 1=Άνδρας, 2=Γυναίκα) Ordinal (Ποιοτική ιεράρχησης ή έντασης γνώµης: 1=Κακός, 2=Μέτριος, 3=Κακός) 6

7 Βασικά στατιστικά ανάλογα µε τον τύπο δεδοµένων και την ερώτηση 7

8 Παρουσίαση εδοµένων και περιγραφική στατιστική Πολλοί άνθρωποι διάκεινται αρνητικά προς τους µεγάλους πίνακες αριθµητικών δεδοµένων ενώ βλέπουν µε θετικό µάτι την παρουσίασή τους σε κάποια µορφή γραφήµατος. Η γραφική παρουσίαση των δεδοµένων δίνει την δυνατότητα σε πολύπλοκες πληροφορίες να παρουσιαστούν µε παραστατικό και χρήσιµο τρόπο. Υπάρχουν πολλοί τρόποι γραφικής παρουσίασης πληροφοριών. Κατανοµή συχνοτήτων Η κατανοµή συχνοτήτων συνίσταται στο να µετρήσει κανείς για κάθε τιµή µιας µεταβλητής, πόσες φορές εµφανίζεται στο δείγµα. Π.χ. Ποια ήταν η συχνότητα για κάθε κατηγορία στην ερώτηση Προοπτική της επιχείρησης στην έρευνα των εστιατορίων? 80 OUTLOOK Frequency ,00 2,00 3,00 4,00 5,00 6,00 7,00 OUTLOOK 8

9 Από το ραυδόγραµµα διαπιστώνουµε ότι ελάχιστοι επιχειρηµατίες βλέπουν την προοπτική της επιχείρησής τους πολύ θετικά. Υπάρχει µια τάση προς το µέσο της κλίµακας 4 (από τον πίνακα 26,2%) ακολουθούµενο από την τιµή 3 (23,7%) Οµαδοποιήσεις Η παραπάνω µεταβλητή ήταν διακριτή. Μπορούσε να πάρει µια ακέραια τιµή µεταξύ 1 και 7. Στις περιπτώσεις αυτές τα ραυδογράµµατα είναι ιδιαίτερα κατάλληλα για την παρουσίαση συχνοτήτων. Αν η µεταβλητή είναι συνεχής, οι τιµές πρέπει να χωριστούν σε διαστήµατα και οι συχνότητες µετρούνται ανάλογα µε το διάστηµα που πέφτουν οι τιµές. Στις περιπτώσεις αυτές καταλληλότερο γράφηµα είναι το Ιστόγραµµα. Περιγραφικά στατιστικά Η Κεντρική τάση, βοηθά στον προσδιορισµό της µεσαίας τιµής του δείγµατος και της συχνότερης τιµής του. Η διασπορά προσδιορίζει πόσο αποκλίνουν η τιµές από την κεντρική τάση. Η µορφή (shape) προσδιορίζει αν τα δεδοµένα είναι συµµετρικά ή µη. Μέτρα Κεντρικής Τάσης Mode, Κεντρική τιµή Είναι η συχνότερη τιµή που εµφανίζεται στο δείγµα. Μπορεί να είναι και bimodal, trimodal, κ.ο.κ αν υπάρχουν δύο τιµές που εµφανίζονται ίσο πλήθος φορών, κ.ο.κ. Median, ιάµεσος Είναι η τιµή που βρίσκεται στο µέσο και χωρίζει τις τιµές του δείγµατος σε δύο ίσα σύνολα, αν θεωρήσουµε ότι οι τιµές του δείγµατος ταξινοµηθούν. Αν το πλήθος είναι άρτιο, είναι η µέση τιµή των δύο διαµέσων. Mean, Μέσος όρος Η µέση τιµή είναι το κύριο µέτρο της κεντρικής τάσης, γιατί παίρνει υπόψη όλες τις περιπτώσεις και µπορεί να τη διαχειριστεί κανείς αλγεβρικά, δίνοντας την δυνατότητα χρήσης της σε πληθώρα υπολογισµών. Το µειονέκτηµά της είναι ότι επηρεάζεται έντονα από ακραίες τιµές πράµα που δεν συµβαίνει στα άλλα δύο µέτρα. n x = i 1 xi n = x 1 + x + x x 2 n 3 n 9

10 Η σχετική θέση των τριών αυτών µέτρων µεταξύ τους, εξαρτάται από την κατανοµή των τιµών του δείγµατος. Συµµετρική κατανοµή. Όλα τα µέτρα κεντρικής τάσης είναι ίσα. Οι µικρές τιµές είναι περισσότερες (δεξιά ασυµµετρία), µέσος όρος, το µεγαλύτερο µέτρο και η κεντρική τιµή το µικρότερο. 10

11 Σε αριστερή ασυµµετρία τα µέτρα κατατάσσονται αντίστροφα. Μέτρα ιασποράς εδοµένα µε διαφορετικά χαρακτηριστικά µπορούν να έχουν τον ίδιο µέσο όρο. Τα µέτρα διασποράς βοηθούν στην διαφοροποίηση µεταξύ αυτών των δειγµάτων. Η διασπορά δείχνει το µέτρο της τάσης των τιµών να διασκορπίζονται (scatter) γύρω από τον µέσο όρο. Όσο µεγαλύτερη είναι η διασπορά τόσο λιγότερο αντιπροσωπευτική είναι η µέση τιµή. 11

12 Βασικά µέτρα διασποράς Range (Εύρος) Είναι µέτρο απόστασης (Max-Min). Χρησιµοποιείται συνήθως σε µετρήσεις διαχείρισης αποθεµάτων. Υποφέρει από πιθανές ακραίες τιµές. Mean absolute deviation (MAD Απόλυτη απόσταση από τον µέσο όρο) Τα µέτρα διασποράς αναζητούν τον ορισµό της µεταβλητότητας των δεδοµένων. Ένα τέτοιο µέτρο είναι η MAD που είναι ο µέσος όρος των n τιµών που προκύπτουν από την απόλυτη διαφορά κάθε τιµής από τον µέσο όρο ( x ) του δείγµατος. Είναι ένα µέτρο που δεν χρησιµοποιείται συχνά. MAD n i= = 1 x x i n _ Variance (µέση διακύµανση s 2 ) Η µέτρηση της διακύµανσης µοιάζει πολύ µε την MAD, αλλά παίρνει υπόψη τις θετικές και αρνητικές αποκλίσεις που µπορεί να αλληλοαναιρούνται. Αντί να πάρει την απόλυτη τιµή των διαφορών, εκµεταλλεύεται το γεγονός ότι το τετράγωνο ενός αρνητικού αριθµού είναι θετικό και αθροίζει τα τετράγωνα των αποκλίσεων αντί των καθαρών αποκλίσεων. Η διαίρεση γίνεται µε n-1(degrees of freedom) για µαθηµατικά διορθωτικούς λόγους που έχουν σηµασία στα µικρά δείγµατα. n _ 2 ( xi x ) 2 i= 1 s = n 1 Επειδή ο υπολογισµός της µέσης διακύµανσης περιέχει το άθροισµα των τετραγώνων των διαφορών, είναι ένα µέτρο που είναι άνευ συγκριτικής ουσίας, γιατί δεν µπορεί να συσχετιστεί µε τον αντίστοιχο µέσο όρο. Για να υπερβούµε αυτό το µειονέκτηµα χρειαζόµαστε ένα τρόπο να µετρήσουµε µε βάση τα αρχικά δεδοµένα και όχι τα τετράγωνα. Την λύση δίνει η τετραγωνική ρίζα. Standard Deviation (SD s Τυπική απόκλιση) Είναι η τετραγωνική ρίζα της µέσης διακύµανσης και σαν τέτοια είναι πιο κοντά στο µέτρο της µέσης τιµής. Αν η τυπική απόκλιση είναι 270 και ο µέσος όρος 380 λέµε ότι έχουµε µια τυπική απόκλιση περίπου 270 ευρώ γύρω από τον µέσο όρο πωλήσεων 380 ευρώ. s = n i= 1 ( x i x ) n 1 _ 2 12

13 Συντελεστής της διακύµανσης (coefficient of variation) Υπάρχουν περιπτώσεις που ενδιαφέρει η συσχέτιση της διασποράς µεταξύ δύο συνόλων δεδοµένων. Χρησιµοποιώντας την ίδια µέθοδο µέτρησης, αν πχ. µετράµε το ύψος ατόµων, µια τυπική απόκλιση 20cm µπορεί να θεωρηθεί µεγάλη, ενώ αν µετράµε το ύψος δένδρων µπορεί να θεωρηθεί πολύ µικρή. Το ίδιο συµβαίνει και αν τα δεδοµένα της µέτρησης έχουν συλλεχθεί µε διαφορετική κλίµακα (Εισόδηµα ατόµων στην Ελλάδα και στην Τουρκία). Οι δύο διασπορές δεν µπορούν να συγκριθούν. Ένα µέτρο της απόκλισης που µας επιτρέπει να κάνουµε συγκρίσεις αποκλίσεων είναι ο συντελεστής της µέσης διακύµανσης, που µετατρέπει βάσει ποσοστού την διαφορά από την µέση τιµή. (covariance) CV = s 100% _ x Στο restaurant µπορεί να θέλετε να ερευνήσετε αν υπάρχει µεγαλύτερη διασπορά στο πλήθος των πλήρως απασχολούµενων υπαλλήλων, από το πλήθος θέσεων των εστιατορίων. Τα περιγραφικά στατιστικά δίνονται παρακάτω. Εφαρµόζοντας τον τύπο του συντελεστή διακύµανσης CV CV(FTEMPL)=5,51/11,04*100=50% CV(SEATS)=62,15/71,54*100=87% Μπορούµε να πούµε ότι υπάρχει µικρότερη διασπορά στην µεταβλητή των υπαλλήλων από αυτή των θέσεων. Όψη της κατανοµής Η όψη της κατανοµής χαρακτηρίζεται από την ασυµµετρία (skewness) (αριστερήδεξιά) και από την κύρτωση. Platykurtic-Leptokurtic 13

14 Κατανοµές πιθανοτήτων. Μια κατανοµή συχνοτήτων ενός δείγµατος, δίνει µια εκτίµηση της κατανοµής συχνοτήτων του αντίστοιχου πληθυσµού. Αν το δείγµα είναι µεγάλο, τότε και η εκτίµηση µπορεί να είναι αξιόπιστη. Η κατανοµή πιθανοτήτων είναι ένα µαθηµατικό µοντέλο, που παρουσιάζει την επίκαιρη κατανοµή συχνοτήτων. Ο υπολογισµός αυτών των πιθανοτήτων, είναι εκτός ύλης και θα αναφερθούµε στους πίνακες πιθανοτήτων συγκεκριµένων κατανοµών. Κατανοµή πιθανοτήτων διακριτών µεταβλητών. ιωνυµική κατανοµή Η κατανοµή πιθανοτήτων των διακριτών τιµών µιας (ποιοτικής) µεταβλητής, είναι ένας πίνακας, που ορίζει για κάθε διακριτή τιµή της µεταβλητής, την πιθανότητα p(x) να έρθει (συµβεί). Κορώνα γράµµατα, ζαριά, κλπ. Προφανώς το άθροισµα των p(x) είναι 1 και κάθε p(x) είναι µια τιµή µεταξύ 0 και 1. Από τις διάφορες διακριτές κατανοµές θα ασχοληθούµε µε την διωνυµική. Στο παράδειγµα έχουµε 2 νοµίσµατα, και Χ είναι το πλήθος των Κορωνών που έρχονται. ΣΥΜΒΑΝ ΝΟΜΙΣΜΑ1 ΝΟΜΙΣΜΑ2 p(χ) Χ Σ1 Κ Κ 0,25 2 Σ2 Κ Γ 0,25 1 Σ3 Γ Κ 0,25 2 Σ4 Γ Γ 0,25 0 Εποµένως η κατανοµή πιθανοτήτων του Χ (πλήθος κορωνών) είναι Χ p(χ) 0 0,25 1 0,50 (Σ2, Σ3) 2 0,25 Το παραπάνω παράδειγµα αντιπροσωπεύει µια διωνυµική τυχαία µεταβλητή. Οι συνθήκες για µια διωνυµική τυχαία µεταβλητή είναι: 1 Το πείραµα αποτελείται από n όµοιες επαναλήψεις (ρίψεις). 2 Κάθε προσπάθεια καταλήγει σε ένα (µεταξύ δύο) αποτέλεσµα. Κορόνα ή Γράµµατα. Είναι σύνηθες να καλείται η µία από τις δύο Επιτυχία και η δεύτερη Αποτυχία. 14

15 3 Η πιθανότητα επιτυχίας, σε πια προσπάθεια, είναι ίση µε p και παραµένει ίδια σε όλες τις προσπάθειες. Η πιθανότητα αποτυχίας είναι (1-p) και ονοµάζεται q. 4 Οι προσπάθειες είναι ανεξάρτητες µεταξύ τους. 5 Ενδιαφερόµαστε για το πλήθος των επιτυχιών στις n προσπάθειες. Από την έρευνα των εστιατορίων γνωρίζουµε ότι περίπου το 40% είναι Fast food. Αν θα διαλέγαµε 10 τυχαία εστιατόρια ποια είναι η πιθανότητα τα 3 να είναι Fast food? Η ερώτηση εκπληρώνει τις συνθήκες της διωνυµικής κατανοµής. Υπάρχουν n=10 προσπάθειες. Υπάρχουν 2 πιθανά αποτελέσµατα. Επιτυχία= Fast food Αποτυχία= Κανονικό εστιατόριο Οι προσπάθειες είναι ανεξάρτητες µιας και το εστιατόριο επιλέγεται τυχαία Η πιθανότητα επιτυχίας p είναι 0,40 Η τυχαία µεταβλητή είναι η Χ Από τον πίνακα των διωνυµικών πιθανοτήτων για p=0,40, n=10 και Χ=3 βρίσκουµε 0,215 Μπορούµε λοιπόν να συµπεράνουµε ότι η πιθανότητα να πέσουµε σε ακριβώς 3 fast food είναι 21,5% 15

16 Συνεχείς µεταβλητές. Κανονική κατανοµή. Όταν µια µεταβλητή µπορεί να πάρει οποιαδήποτε τιµή, σε ένα ορισµένο διάστηµα τιµών, λέγεται συνεχής. Στις διακριτές µεταβλητές υπάρχουν κενά µεταξύ των πιθανών τιµών, ενώ στις συνεχείς δεν υπάρχουν. Εδώ, η πιθανότητα, η τιµή της µεταβλητής να πάρει µια συγκεκριµένη τιµή είναι σχεδόν µηδενική. Για τον λόγο αυτό, προτιµάται η εκτίµηση της πιθανότητας, η τιµή να βρίσκεται σε ένα συγκεκριµένο εύρος. εν ερευνούµε λοιπόν την πιθανότητα το ύψος ενός σπουδαστή να είναι 1,85 αλλά την πιθανότητα πχ. το ύψος να είναι µεταξύ 1,70 και 1,90. 16

17 Για συνεχείς µεταβλητές, η κανονική κατανοµή πιθανοτήτων είναι η δηµοφιλέστερη για τους παρακάτω κυρίως λόγους. Ένα µεγάλο πλήθος µεταβλητών που αφορούν επιχειρησιακά στατιστικά ακολουθούν την κανονική κατανοµή. Αν µπορέσουµε να υποθέσουµε, ότι οι πιθανότητες µιας µεταβλητής είναι περίπου κανονικά κατανεµηµένες, µπορούµε να βγάλουµε πολλά επαγωγικά συµπεράσµατα. Η κατανοµή των µέσων όρων όλων των πιθανών δειγµάτων ενός πληθυσµού, στις περισσότερες περιπτώσεις, µπορεί να θεωρηθεί ως κανονική κατανοµή. Στην κανονική κατανοµή, η τιµή του µέσου όρου προσδιορίζει την θέση της κορυφής του κώδωνα στον άξονα Χ και η τυπική απόκλιση το εύρος του κώδωνα. Ο άξονας των Y ονοµάζεται Πυκνότητα και παρουσιάζει την συχνότητα ή πιθανότητα f(x), εµφάνισης του Χ. Η µορφή µιας κανονικής κατανοµής εξαρτάται από την µέση τιµή και την τυπική απόκλιση. Μεταβάλλοντας τις τιµές αυτές, παίρνουµε µια διαφορετική κατανοµή πιθανοτήτων. Παραπάνω οι κατανοµές Α και Β έχουν ίδιους µέσους όρους αλλά διαφορετική τυπική απόκλιση ενώ οι Β και C έχουν ίδια τυπική απόκλιση αλλά διαφορετικούς µέσους όρους 17

18 Τυπική κανονική κατανοµή Από την στιγµή που γνωρίζουµε την εξίσωση f(x) της κανονικής κατανοµής, µπορούµε να βρούµε συγκεκριµένες πιθανότητες που η τιµή της µεταβλητής Χ θα πέσει στο διάστηµα µεταξύ δύο τιµών. Ο ευκολότερος τρόπος είναι να χρησιµοποιήσουµε κατάλληλους πίνακες κατανοµής πιθανοτήτων. Επειδή η κατανοµή εξαρτάται από τον µέσο όρο και την τυπική απόκλιση, θα έπρεπε να έχουµε διαφορετικό πίνακα για κάθε πιθανή τιµή των µ και σ. Μπορούµε να λύσουµε το πρόβληµα αυτό µετατρέποντας τα δεδοµένα σε τυπικές τιµές, µέσω του τύπου µετατροπής Ζ: Z µ = X σ χ χ Αυτό έχει σαν αποτέλεσµα την µετατροπή οποιασδήποτε τυχαίας µεταβλητής Χ σε µια τυπική κανονική µεταβλητή Ζ. Η τιµή της Ζ θα είναι θετική όταν η Χ θα βρίσκεται πάνω από τον µέσο όρο του πληθυσµού και αρνητική όταν θα βρίσκεται κάτω από τον µέσο όρο του πληθυσµού. Η κατανοµή πιθανοτήτων της Ζ καλείται τυπική κανονική κατανοµή. Η Τυπική κανονική κατανοµή έχει µ=0 και σ=1. Η χρησιµότητα της κατανοµής αυτής έγκειται στο ότι µια περιοχή κάτω από οποιαδήποτε κανονική κατανοµή, µπορεί να υπολογιστεί βρίσκοντας την αντίστοιχη περιοχή στην καµπύλη της κανονικής κατανοµής. Οι τιµές στον παρακάτω πίνακα, είναι οι πιθανότητες µιας τυχαίας τυπικής κανονικής µεταβλητής να έχει τιµή που βρίσκεται στο διάστηµα 0 έως z (η µαυρισµένη περιοχή). 18

19 Εµπειρικός κανόνας Ο εµπειρικός κανόνας για δεδοµένα που ακολουθούν κανονική κατανοµή (χρησιµοποιείται στα διαστήµατα εµπιστοσύνης) υποστηρίζει ότι: 1 Περίπου 68% των δεδοµένων βρίσκεται στο διάστηµα ± 1*s της µ 2 Περίπου 95% των δεδοµένων βρίσκεται στο διάστηµα ± 1,96*s της µ 3 Περίπου 99% των δεδοµένων βρίσκεται στο διάστηµα ± 2,58*s της µ 19

20 Ας υποθέσουµε ότι οι πωλήσεις των εστιατορίων έχουν περίπου κανονική κατανοµή πιθανοτήτων µε µέσο όρο και τυπική απόκλιση Θέλουµε να βρούµε την πιθανότητα οι πωλήσεις να υπερβούν τα Ζ=( )/120=1,108 Από τον πίνακα βρίσκουµε ότι για Ζ=1,11 η περιοχή είναι 0,3665. Αυτό αναφέρεται στην περιοχή µεταξύ της Ζ και της µέσης τιµής. Με δεδοµένο ότι η περιοχή δεξιά από την µέση τιµή είναι 0,5 το εµβαδόν της περιοχής που εκτείνεται πάνω από αυτή την τιµή είναι 0,5-0,3665=0,1335. Η πιθανότητα λοιπόν οι πωλήσεις να υπερβούν τα είναι 13,3%. Ας ελέγξουµε τώρα την πιθανότητα να υπερβούν οι πωλήσεις τα 300. Ζ=( )/120=-0,14 20

21 Η αρνητική τιµή δείχνει ότι η τιµή βρίσκεται αριστερά του µέσου όρου. Από τον πίνακα βρίσκουµε πιθανότητα 0,0557. Η περιοχή που ενδιαφέρει είναι >300 άρα προσθέτουµε 0,5 και βρίσκουµε 0,5557 δηλ. 55,6% Ας ελέγξουµε τώρα την πιθανότητα, οι πωλήσεις να κυµαίνονται µεταξύ 250 και 400 ευρώ. Ζ µεταξύ -0,56 και 1,52 µε αντίστοιχες πιθανότητες 0,2123 και 0,4357. Επειδή ενδιαφερόµαστε για την περιοχή µεταξύ των δύο τιµών προσθέτουµε τις 2 πιθανότητες. 0,2123+0,4357=0,6480 δηλ. 64,8% 21

22 ειγµατοληψία και επαγωγή. Το δείγµα πρέπει πάντα να δηµιουργείται µε απόλυτα τυχαίο τρόπο. Κάθε τιµή πρέπει να έχει την ίδια (µη µηδενική) πιθανότητα να επιλεχθεί. Μέσος όρος δείγµατος ( x ). Είναι σαφές ότι αναζητούµε µέσω δείγµατος, επαγωγικά, τον µέσο όρο του πληθυσµού, όπως είναι σαφές ότι αν πάρουµε περισσότερα από ένα δείγµατα, οι µέσοι όροι τους θα διαφέρουν έστω και λίγο. Το ερώτηµα είναι, αν παίρναµε τους µέσους όρους πολλών δειγµάτων, ποια θα ήταν η κατανοµή τους. Αν θεωρήσουµε ότι τα στοιχεία που έχουµε για τα εστιατόρια αφορούν ΟΛΑ τα εστιατόρια της περιοχής (πληθυσµός), τότε έχουµε µ= και σ= Παίρνοντας 25 δείγµατα, που το καθένα περιείχε τυχαίες τιµές από περίπου το 20% του πληθυσµού και υπολογίζοντας τον µέσο όρο του κάθε δείγµατος, πήραµε τον παρακάτω πίνακα. 22

23 Παρατηρούµε ότι κανένας µέσος ( x ) δεν είναι ακριβώς ίσος µε αλλά κοντά. Ο µέσος των µέσων των δειγµάτων είναι πολύ κοντά στον µ. Η τυπική απόκλιση των µέσων των δειγµάτων είναι πολύ µικρότερη της σ. Η κατανοµή είναι κανονική κωδωνοειδής. Η αθροιστικός µέσος όρος (το 349,56 είναι ο µέσος όρος των δύο πρώτων x, το 342,44 των 3 ων πρώτων κλπ.) όσο αυξάνουν τα δείγµατα πλησιάζει στον µ Θεώρηµα κεντρικού ορίου (Central limit theorem) Επιλέγοντας απλά τυχαία δείγµατα, µεγέθους n, από ένα πληθυσµό ο οποίος έχει µέσο όρο µ και τυπική απόκλιση σ, η κατανοµή των µέσων των δειγµάτων είναι κανονική κατανοµή πιθανοτήτων µε µέσο όρο µ και τυπική απόκλιση σ/ n σ µ _ = µ (συµβολίζεται κα x ) σ _ = x x n Ας εξετάσουµε το ίδιο παράδειγµα. Υποθέτουµε ότι οι ηµερήσιες πωλήσεις των εστιατορίων της έρευνας έχουν µια κατανοµή πιθανοτήτων περίπου κανονική µε µ= και σ= Θέλουµε απαντήσεις στις 2 παρακάτω ερωτήσεις. 23

24 1. Ποια είναι η πιθανότητα οι πωλήσεις να υπερβούν τις µια οποιαδήποτε ηµέρα? 2. Ποια είναι η πιθανότητα οι µέσες πωλήσεις 45 τέτοιων εστιατορίων να υπερβούν τις µια οποιαδήποτε ηµέρα? X µ x Z = = = 0, 275 σ 120 x Από τον πίνακα βρίσκουµε εµβαδό 0,1084 (µέσος των Ζ 0,27 και 0,28 δηλ. των 0,1064 και 0,1103). Η περιοχή αυτή είναι µεταξύ της Ζ και της µέσης οπότε η περιοχή ενδιαφέροντος είναι 0,5-0,1084=0,3916. Εποµένως η πιθανότητα οι πωλήσεις να υπερβούν τις είναι 39,2% 2. εν µπορούµε να χρησιµοποιήσουµε την παραπάνω έκφραση, γιατί δεν µιλάµε για τον µέσο όρο πωλήσεων όλων των εστιατορίων, αλλά µόνο 45 απ αυτά. Με βάση το θεώρηµα του κεντρικού ορίου κάνουµε την παρακάτω υπόθεση. µ x =µ = 317 σ σ = n 120 _ = = x 45 17,888 Z = X µ σ x x = 17,888 = 1,84 Από τον πίνακα βρίσκουµε εµβαδό 0,4671 που δίνει περιοχή ενδιαφέροντος 0,5-0,4671 =0,0329 δηλ. 3,3%. Είναι καθαρό ότι η πιθανότητα οι πωλήσεις ενός τυχαίου δείγµατος 45 εστιατορίων να υπερβούν τις 350,000 είναι πολύ µικρότερη από αυτήν για όλο τον πληθυσµό. Αυτό είναι αρκετά λογικό γιατί επιλέγοντας 45 τυχαία εστιατόρια έχουµε πάντα τον κίνδυνο να διαλέξουµε κάποια µε χαµηλό τζίρο ή µε αντίστροφη λογική η πιθανότητα να διαλέξουµε 45 εστιατόρια που ο τζίρος τους ξεπερνά τις 350,000 είναι πολύ µικρότερη από το να είχαµε όλο τον πληθυσµό. ιαστήµατα εµπιστοσύνης Η στατιστική επαγωγή είναι η διαδικασία µε την οποία χρησιµοποιώντας µετρήσεις σε ένα δείγµα, βγάζουµε συµπεράσµατα για τον πληθυσµό. Υπάρχουν δύο ειδών εκτιµήσεις. Η εκτίµηση σηµείου και η εκτίµηση διαστήµατος. Η µέτρηση της x του δείγµατος, είναι µια εκτίµηση της µ του πληθυσµού και είναι εκτίµηση σηµείου. 24

25 Είναι γνωστό ότι η x διαφέρει από δείγµα σε δείγµα, οπότε χρειάζεται ένας δείκτης της ορθότητας της εκτίµησης. Αυτό εξαρτάται από το µέγεθος του δείγµατος και µπορεί να µετρηθεί δηµιουργώντας ένα διάστηµα εκτίµησης του µέσου πληθυσµού παίρνοντας υπόψη την κατανοµή των µέσων δείγµατος. Τα διαστήµατα αυτά ονοµάζονται διαστήµατα εµπιστοσύνης και µας δίνουν την δυνατότητα να κάνουµε διατυπώσεις όπως: Για ένα δείγµα µεγέθους n είµαστε 95% σίγουροι ότι ο µέσος όρος του πληθυσµού βρίσκεται µεταξύ των τιµών Α και Β. Γνωστή τυπική απόκλιση πληθυσµού Η x είναι µεταβλητή κανονικής κατανοµής µε: σ µ = µ και σ _ = x x n Μετασχηµατίζοντας σε κανονικές τιµές έχουµε Z = X µ σ n άρα σ µ = X Ζ n Η εκτίµηση αυτή δείχνει ότι η µ πέφτει κάτω από την µέση τιµή του δείγµατος, η υπόθεση να πέφτει πάνω από την x είναι επίσης ασφαλής. µ = X ± Ζ σ n Χ Z σ n µ Χ+ Z σ n Η τιµή του Ζ δίνει την πιθανότητα του τυπικού σφάλµατος και ορίζει το επίπεδο εµπιστοσύνης της εκτίµησης της µ. Αν πχ. θέλουµε 95% εµπιστοσύνη, από τον εµπειρικό κανόνα της κανονικής κατανοµής βρίσκουµε Ζ=1,96 Εδώ έχουµε τρία σηµαντικά θέµατα. Όσο το n µεγαλώνει τόσο το τυπικό σφάλµα, που παίρνει µέρος στους υπολογισµούς, µικραίνει και το περίπου ίση µε µ. Z σ µικραίνει µε αποτέλεσµα η X να γίνει n Αν η σ είναι µικρή, σχεδόν µηδενική, πάλι η Xτείνει να γίνει περίπου ίση µε µ. 25

26 Όσο περισσότερο σίγουροι θέλουµε να είµαστε στην εκτίµησή µας, τόσο µεγαλύτερο γίνεται το διάστηµα εµπιστοσύνης. Ο λόγος είναι ότι το 95% επίπεδο της Ζ είναι 1,96 ενώ το 99% επίπεδο είναι 2,58. Για τον λόγο αυτό πρέπει να γνωρίζουµε τι είναι σηµαντικό, η ασφάλεια ή η χρησιµότητα πχ. Είµαι 95% σίγουρος ότι οι πωλήσεις βρίσκονται µεταξύ και Είµαι 99% σίγουρος ότι οι πωλήσεις βρίσκονται µεταξύ και Έχει κανένα νόηµα η τελευταία δήλωση? Μεγάλη σιγουριά αλλά τεράστιο διάστηµα. Άλλο παράδειγµα Ας υποθέσουµε ότι από προηγούµενες µελέτες γνωρίζουµε ότι η τυπική απόκλιση στην κατανοµή των πωλήσεων των εστιατορίων είναι σ= Παίρνουµε ένα δείγµα 254 εστιατορίων, µε X =332,56. Θέλουµε να κατασκευάσουµε ένα 95% διάστηµα εµπιστοσύνης για την µ. Η Ζ για το διάστηµα αυτό είναι εµπειρικά 1,96 και έτσι έχουµε 278,45<=µ<=386,67 Άγνωστη τυπική απόκλιση πληθυσµού Αν η τυπική απόκλιση του πληθυσµού είναι άγνωστη, που είναι το συνηθέστερο, ο µόνος τρόπος να κτιστεί ένα διάστηµα εµπιστοσύνης στον υπολογισµό της µ είναι τα στοιχεία X και s. Έτσι δεν µπορούµε να χρησιµοποιήσουµε την κατανοµή Ζ και χρησιµοποιούµε µια κατανοµή που καλείται student s t κατανοµή ή κατανοµή t. Αν η τυχαία µεταβλητή X είναι κανονικά κατανεµηµένη, το στατιστικό X µ S n ακολουθεί µια κατανοµή t µε n-1 βαθµούς ελευθερίας. Όπως φαίνεται στο σχήµα η κατανοµή t µοιάζει πολύ µε την τυπική κανονική κατανοµή. Η διαφορά τους βρίσκεται κυρίως στο ότι η t έχει µεγαλύτερο εµβαδόν στις ουρές και µικρότερο στο κέντρο της καµπύλης. 26

27 Για µεγάλα δείγµατα (n>30) οι t και η z κατανοµή σχεδόν συµπίπτουν οπότε δεν έχει σηµασία αν είναι γνωστή ή άγνωστη η τυπική απόκλιση του πληθυσµού. µ = Ή X t S n S Χ t µ Χ+ t n S n Όπου t τιµή από τον παρακάτω πίνακα µε n-1 βαθµούς ελευθερίας και 95% διάστηµα εµπιστοσύνης. 27

28 Ας υποθέσουµε ότι θέλουµε να υπολογίσουµε ένα 95% (α=0,05) διάστηµα εµπιστοσύνης για το µέσο ποσό διαφήµισης που δαπανήθηκε από τους ιδιοκτήτες οι οποίοι πίστευαν προοπτική της επιχείρησής τους ήταν πολύ θετική (6). Η εκτίµηση σηµείου του δείγµατος είναι ο µέσος όρος του ποσού δαπάνης για διαφήµιση µε τυπική απόκλιση για 12 εστιατόρια. Από τον πίνακα, για 11 βαθµούς ελευθερίας και 95% διάστηµα εµπιστοσύνης, βρίσκουµε µια τιµή t =2,201 και συνεπώς 4,67<=µ<=14,04 Έτσι µπορούµε να πούµε ότι είµαστε 95% σίγουροι ότι το ποσό που δαπανήθηκε από τους ιδιοκτήτες που πιστεύουν ότι έχουν µια επιχείρηση µε πλεονεκτική προοπτική, είναι µεταξύ και

29 ιαστήµατα εµπιστοσύνης για ποσοστά (κατηγορίες) του πληθυσµού Στην περίπτωση αυτή µιλάµε για συχνότητες των µεταβλητών και όχι για τις επί µέρους τιµές τους. Ο µέσος όρος κατηγοριών είναι άχρηστος. Το ποσοστό όµως είναι χρήσιµο όπως το 60% ήταν γυναίκες και το 40% άνδρες. Για να έχουµε εκτίµηση των ποσοστών του πληθυσµού, χρειαζόµαστε τυπικό σφάλµα των ποσοστών. Βάσει των ίδιων αρχών, ότι τα διάφορα τυχαία δείγµατα δηµιουργούν διάφορες εκτιµήσεις σηµείου p του αντίστοιχου τµήµατος π του πληθυσµού και χρησιµοποιώντας το θεώρηµα κεντρικού ορίου έχουµε. σ π ( 1 π ) π p =π και σ p = = n n και επειδή χρησιµοποιούµε εκτιµήσεις σηµείου δείγµατος p, p( 1 p) π = p± Z ή π = n p± p( 1 p) n p( 1 p) p(1 p) p π p+ n n Στο σετ δεδοµένων των εστιατορίων υπάρχουν 106 από τα 269, που έχουν ένα µόνο ιδιοκτήτη. ηλ. 39,4%. Θέλουµε να υπολογίσουµε ένα 99% διάστηµα εµπιστοσύνης για το ποσοστό των ίδιων (µε ένα ιδιοκτήτη) εστιατορίων σε επίπεδο χώρας. Επειδή δεν έχουµε πληροφορίες για τον πληθυσµό πρέπει να χρησιµοποιήσουµε την εκτίµηση σηµείου και στην συνέχεια τις τιµές από την κατανοµή t. Από τον αντίστοιχο πίνακα για n-1 =268 και α/2 =0,005 παίρνουµε t=2,576 και στην συνέχεια: 0,394(1 0,394) 0,394 t π 0,394+ t 269 0,394(1 0,394) 269 Όπου t =2,576 0,317<=π<=0,471 Μπορούµε να πούµε ότι είµαστε κατά 99% σίγουροι ότι το ποσοστό των εστιατορίων που ανήκουν σε µονό ιδιοκτήτη είναι περίπου µεταξύ 31 και 47%. Εκτίµηση του µεγέθους ενός δείγµατος Πόσο µεγάλο πρέπει να είναι ένα δείγµα? Όσο µεγαλύτερο είναι τόσο καλύτερη είναι η εκτίµηση και τόσο µεγαλύτερο είναι το κόστος του. Ένα ικανό δείγµα είναι αυτό που ανταποκρίνεται στα επιθυµητά επίπεδα ακρίβειας. Για τον υπολογισµό µέσων 29

30 Z * σ n = Ε 2 Για τον υπολογισµό ποσοστών (κατηγοριών) n = Z 2 * π *(1 π ) 2 Ε Όπου: Ε= Σφάλµα µεταξύ εκτίµησης δείγµατος και τιµής πληθυσµού Ζ= ιάστηµα εµπιστοσύνης σ= τυπική απόκλιση πληθυσµού π= ποσοστό πληθυσµού της έρευνας Αν δεν είναι γνωστή η τυπική απόκλιση µπορεί να εκτιµηθεί πχ. Από προηγούµενες έρευνες. Μια µικρή πιλοτική έρευνα (30 περιπτώσεις) Μια άλλη εµπειρική εκτίµηση είναι ότι σε ένα κανονικά κατανεµηµένο πληθυσµό, το 95% των τιµών βρίσκονται στο διάστηµα µ-2σ και µ+2σ και επειδή (µ+2σ)-( µ-2σ)=4σ, µπορούµε να ρωτήσουµε κάποιον που έχει εµπειρία µε τον πληθυσµό σχετικά µε την µεγαλύτερη και µικρότερη τιµή που µπορούν να πάρουν τα δεδοµένα και να πούµε ότι περίπου ισχύει σ=(η-l)/4. Στην περίπτωση κατηγοριών µπορούµε να υποθέσουµε ότι οι εµφανίσεις έχουν ίδια πιθανότητα και να θέσουµε το p σε 0,5 οπότε η τυπική απόκλιση θα είναι περίπου p ( 1 P) = 0,5* 0,5 = 0,5 Ας υποθέσουµε ότι ένας ερευνητή θέλει να ελέγξει το µηνιαίο έξοδο σε κατεψυγµένα τρόφιµα των νοικοκυριών. Από προηγούµενες έρευνες είναι γνωστό ότι τα δεδοµένα ακολουθούν κανονική κατανοµή µε σ=37,6. Ο ερευνητής θέλει να είναι 95% σίγουρος ότι η εκτίµηση (µέσος όρος δείγµατος εξόδων σε κατεψυγµένα) κείται στο διάστηµα +-1,8 της αντίστοιχης του πληθυσµού (σφάλµα 1,8). Πόσο µεγάλο πρέπει να είναι το δείγµα? n= (1,96*37,6/1,8) 2 =1,676 Το 1,96 προέρχεται εµπειρικά. Άρα πρέπει να ερωτηθούν 1676 νοικοκυριά. 30

31 Υποθέστε ότι ένας ερευνητής θέλει να εκτιµήσει το ποσοστό των νοικοκυριών που διαθέτουν πιστωτική κάρτα. Από δευτερεύοντα δεδοµένα ξέρει ότι το 64% των νοικοκυριών µιας περιοχής έχει πιστωτική κάρτα.(π=0,64) Ποιο πρέπει να είναι το µέγεθος του δείγµατος ώστε µε 95% σιγουριά να µπορεί να εκτιµήσει ότι θα απέχει ±5% από την πραγµατική εκτίµηση. 1,96 n = 2 * 0,64 *(1 0,64) 2 0,05 =

32 Έλεγχοι υπόθεσης Η συλλογή δεδοµένων από ένα πληθυσµό µας βοηθά για να εκτιµήσουµε τις παραµέτρους του πληθυσµού ή να πάρουµε αποφάσεις για τις παραµέτρους του. Ας υποθέσουµε ότι σε ένα περιοδικό διαβάσαµε ότι ο µέσος όρος των πωλήσεων των εστιατορίων σε εθνικό επίπεδο είναι και θέλουµε να ελέγξουµε αν αυτό είναι ορθό ή όχι. Από το δείγµα µας ξέρουµε ότι ο µέσος όρος είναι Θέλουµε να γνωρίζουµε αν ο µέσος του δείγµατος είναι σηµαντικά διαφορετικός από αυτόν του περιοδικού και για τον λόγο αυτό θέλουµε να βγάλουµε συµπεράσµατα για την ορθότητα του περιοδικού. Αφού η διαφορά είναι ορατή γιατί να την ερευνήσουµε? Οι λόγοι που κάνουµε τέτοιες υποθέσεις είναι πολλοί. Κυριότεροι είναι: Από την στιγµή που τα στατιστικά µας προήλθαν από µόνο ένα δείγµα µιας περιοχής, ένα άλλο δείγµα θα έδινε διαφορετικό µέσο όρο και εποµένως, πόσο σίγουροι είµαστε για τον µέσο όρο; Είναι η διαφορά µεταξύ και σηµαντική και πως µπορούµε να το κρίνουµε, δηλ. αν ο µέσος του δείγµατος ήταν τι θα λέγαµε? Για να φτάσουµε σε κάποιο συµπέρασµα πρέπει να έχουµε κάποια ιδέα για την πιθανότητα να πάρουµε σε κάποιο δείγµα, µεσο= και ο πληθυσµός να έχει µ= Βήµα 1 Ορισµός της µηδενικής υπόθεσης Η Η 0 γενικά υποστηρίζει ότι δεν υπάρχει σηµαντική διαφορά. Στο παράδειγµά µας Ο εθνικός µέσος όρος είναι 317 Η 0 : µ=317 Βήµα2 Ορισµός της εναλλακτικής υπόθεσης Η δουλειά όλων των ελέγχων υπόθεσης είναι να αποδεχτείτε τη µηδενική υπόθεση ή να την απορρίψετε. Η εναλλακτική υπόθεση είναι Ο εθνικός µέσος όρος δεν είναι 317 Η Α : µ 317 Αυτό καλείται έλεγχος δύο ουρών γιατί είµαστε το ίδιο ενδιαφερόµενοι στο αν ο µέσος του πληθυσµού είναι µεγαλύτερος ή µικρότερος του

33 Αυτός δεν είναι ο µοναδικός τρόπος να εκφράσουµε την εναλλακτική υπόθεση. Επειδή γνωρίζουµε ότι ο µέσος του δείγµατος είναι 332,560 θα ήταν καλύτερα να την θέσουµε σαν: ο εθνικός µέσος είναι µεγαλύτερος του 317 Η Α : µ>317 Έλεγχος µιας ουράς. Βήµα3 Ορισµός του επιθυµητού επιπέδου σηµαντικότητας-τύποι σφαλµάτων Όταν χρησιµοποιείται δείγµα για να βγουν συµπεράσµατα για τον πληθυσµό υπάρχει πάντα ο κίνδυνος σφαλµάτων. Υπάρχουν 2 είδη σφαλµάτων. Τύπου Ι Αυτό συµβαίνει αν απορρίψουµε την µηδενική υπόθεση ενώ είναι ορθή. Η πιθανότητα αυτή σηµειώνεται άλφα (α) και καλείται επίπεδο σηµαντικότητας. Τύπου ΙΙ Αυτό συµβαίνει αν αποδεχτούµε την µηδενική υπόθεση ενώ είναι λανθασµένη. Η πιθανότητα αυτή σηµειώνεται βήτα (β). 33

34 Στα στατιστικά των επιχειρήσεων επικεντρωνόµαστε συνήθως στα σφάλµατα τύπου Ι. Ας υποθέσουµε ότι ένας παραγωγός τροφίµων θέλει να ελέγξει την αποτελεσµατικότητα της νέας διαφήµισης έναντι της παλαιάς. Η µηδενική υπόθεση είναι Η 0 : Η νέα διαφήµιση είναι το ίδιο αποτελεσµατική ενώ η Η Α : Η νέα είναι περισσότερο αποτελεσµατική Σφάλµα Τύπου Ι Η νέα είναι περισσότερο αποτελεσµατική ενώ δεν είναι και θα οδηγήσει στην απώλεια µεριδίου αγοράς. Σφάλµα Τύπου ΙΙ Η νέα διαφήµιση είναι το ίδιο αποτελεσµατική ενώ δεν είναι. Είναι καλύτερη. Ο επιχειρηµατίας δεν θα αλλάξει την παλαιά µε την νέα και θα χάσει µια ευκαιρία να αυξήσει το µερίδιο της αγοράς. Από τα δύο σφάλµατα είναι σαφές ότι το πρώτο είναι και το πιο επικίνδυνο. Για τον λόγο αυτό προσπαθούµε να κοντρολάρουµε το α που είναι το περιθώριο σφάλµατος τύπου Ι που είµαστε προετοιµασµένοι να ανεχτούµε σε µια απόφαση. Έστω ότι α είναι 5% η 0,05. Αυτό σηµαίνει ότι είµαστε προετοιµασµένοι να κάνουµε σφάλµα τύπου Ι σε πολύ 5 από τις 100 αποφάσεις Στα στατιστικά των επιχειρήσεων αποδεκτές τιµές για το α είναι οι 0,10, 0,05 και 0,01 Αν ενεργούµε ένα έλεγχο 2 ουρών το επίπεδο σηµαντικότητας α µοιράζεται σε α/2 στα δύο άκρα, ενώ αν ενεργούµε ένα έλεγχο µιας ουράς το επίπεδο σηµαντικότητας α αποδίδεται στην ουρά ενδιαφέροντος της κατανοµής. Βήµα4 Ορισµός του κατάλληλου στατιστικού ελέγχου Η επιλογή του στατιστικού ελέγχου εξαρτάται από την υπόθεση της κατανοµής που ακολουθεί το στατιστικό (µέσος) του δείγµατος. Υπάρχουν πολλά στατιστικά ελέγχου όπως το t το F το χ 2 κλπ. Βήµα5 Ορισµός της κρίσιµης τιµής Οι κρίσιµες τιµές είναι αυτές που ορίζουν το όριο των περιοχών απόρριψης και συχνά καλούνται περιοχές σηµαντικότητας. Οι τιµές αυτές εξαρτώνται από το επιλεχθέν επίπεδο σηµαντικότητας και βρίσκονται από τους πίνακες που αντιπροσωπεύουν τα συγκεκριµένα στατιστικά ελέγχου. Το εµβαδόν των ουρών ισούται µε α. 34

35 Βήµα6 Υπολογισµός του στατιστικού ελέγχου Συνήθως µε κάποιο Software Βήµα7 Έκδοση συµπεράσµατος Μπορούµε να αποφασίσουµε αν θα αποδεχτούµε ή θα απορρίψουµε την µηδενική υπόθεση, συγκρίνοντας τα στατιστικά ελέγχου µε την κρίσιµη τιµή. Απορρίπτουµε την µηδενική υπόθεση αν η απόλυτη τιµή του στατιστικού ελέγχου είναι µεγαλύτερη της απόλυτης κρίσιµης τιµής. 35

36 Παράδειγµα έλεγχος µέσων Θα χρησιµοποιήσουµε t-test γιατί είναι συνηθέστερο να µη γνωρίζουµε την τυπική απόκλιση του πληθυσµού και γιατί το t-test παίρνει υπόψη το µέγεθος του δείγµατος (βαθµοί ελευθερίας) και επιπλέον όταν το µέγεθος του δείγµατος µεγαλώνει, το t είναι όµοιο µε το z. Υπάρχουν περιπτώσεις που θέλουµε να ελέγξουµε την υπόθεση ο µέσος ενός πληθυσµού να έχει µια συγκεκριµένη τιµή. Για να προχωρήσουµε υποθέτουµε ότι η κατανοµή του πληθυσµού είναι κανονική. Επειδή είναι δύσκολο να γνωρίζουµε την τυπική απόκλιση σ του πληθυσµού χρησιµοποιούµε την τυπική απόκλιση δείγµατος s σαν εκτίµηση της σ. Το στατιστικό υπολογίζεται σαν: t = X µ s n Στο παράδειγµά µας θα ελέγξουµε αν ο µέσος όρος πωλήσεων των εστιατορίων σε εθνικό επίπεδο είναι

37 Βήµα 1. Μηδενική υπόθεση Η 0 : µ=317 Βήµα 2. Εναλλακτική υπόθεση Η Α1 : µ 317 έλεγχος 2 ουρών Η Α : µ>317 έλεγχος 1ας ουράς Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε t-test Βήµα 5. Κρίσιµη τιµή Έχει αποδειχτεί ότι αν υποθέσουµε ότι ο πληθυσµός είναι κανονικά κατανεµηµένος, η κατανοµή του µέσου του δείγµατος θα ακολουθεί µια κατανοµή t µε n-1 βαθµούς ελευθερίας (254-1=253). Για να ορίσουµε την κρίσιµη τιµή που διαφοροποιεί τις περιοχές αποδοχής από την απόρριψης, πρέπει να ανατρέξουµε στον πίνακα των t Έλεγχος 2 ουρών: Επειδή πρέπει να αποδώσουµε το επίπεδο σηµαντικότητας σε 2 ουρές, ψάχνουµε στον πίνακα t α/2 =0,025 και df=253. Επειδή το 253 δεν υπάρχει στον πίνακα µε παρεµβολή µπορούµε να υποθέσουµε ότι η κρίσιµη τιµή είναι περίπου ± 1,96 Έλεγχος1ας ουράς: Επειδή πρέπει να αποδώσουµε το επίπεδο σηµαντικότητας σε µία ουρά, ψάχνουµε στον πίνακα t α =0,05 και df=253. Επειδή το 253 δεν υπάρχει στον πίνακα µε παρεµβολή µπορούµε να υποθέσουµε ότι η κρίσιµη τιµή είναι περίπου 1,645 37

38 Βήµα 6. Στατιστικό ελέγχου 332, t = 650, = 0,38 Βήµα 7. Εξαγωγή συµπεράσµατος. Έλεγχος 2 ουρών: Επειδή το στατιστικό ελέγχου (0,38) βρίσκεται στην περιοχή µη απόρριψης της µηδενικής υπόθεσης, αποδεχόµαστε την µηδενική υπόθεση και συµπεραίνουµε ότι ο µέσος όρος του δείγµατός µας δεν είναι σηµαντικά διαφορετικός από τον µέσο όρο σε εθνικό επίπεδο. Έλεγχος µιας ουράς: Επειδή το στατιστικό ελέγχου (0,38) είναι µικρότερο της κρίσιµης τιµής 1,645 εξάγουµε το ίδιο συµπέρασµα. ΜΕ SPSS (p=α) Η χρήση του SPSS επιταχύνει τους υπολογισµούς ιδιαίτερα όταν έχουµε πολλά δεδοµένα. 38

39 Τα βήµατα 1 έως 4 πρέπει να τεθούν από τον ερευνητή ώστε να είναι καθαρός ο ορισµός της υπόθεσης και το τεστ που θα εφαρµοστεί. Επιλέξτε Analyze/Compare means/one-sample T Test και στο παράθυρο επιλογής µεταβλητών της t-test επιλέξτε Sales και Test Value 317. Από το κουµπί Options θα µπορούσατε να αλλάξετε το διάστηµα εµπιστοσύνης. Η έξοδος µας δίνει άµεσα όλες τις απαραίτητες πληροφορίες. Η τιµή ελέγχου, έναντι της οποίας ελέγχεται ο µέσος του δείγµατος αναφέρεται όπως και οι βαθµοί ελευθερίας και το είδος του στατιστικού. Εφαρµόζοντας τα δεδοµένα το SPSS υπολογίζει την ακριβή πιθανότητα να έχουµε σφάλµα τύπου Ι (απόρριψη της µηδενικής υπόθεσης ενώ είναι ορθή). Η πιθανότητα αυτή είναι η τιµή p (συχνά καλείται παρατηρηθέν α ή παρατηρηθέν επίπεδο σηµαντικότητας) και σηµειώνεται Sig (2-tailed) που στο παράδειγµά µας είναι 0,703. Η τιµή p είναι η τιµή του α στην οποία ο έλεγχος υπόθεσης αλλάζει απόφαση. Αντιπροσωπεύει την ακριβή πιθανότητα ακραία δεδοµένα, όσο αυτά που παρατηρήσαµε, να παρουσιαστούν αν η µηδενική υπόθεση ισχύει. Ο παρακάτω εµπειρικός κανόνας δίνεται για την ερµηνεία του p. Απορρίπτουµε την µηδενική υπόθεση, αν η τιµή p είναι µικρότερη του επιλεχθέντος α. ιατηρούµε την µηδενική υπόθεση, αν η τιµή p είναι µεγαλύτερη του επιλεχθέντος α. Μια πολύ µικρή τιµή p δείχνει ότι αν απορρίψουµε την Η 0 ο κίνδυνος να έχουµε λάθος απόφαση είναι πολύ µικρός. Αντίστροφα αν η p είναι πολύ µεγάλη και απορρίψουµε την Η 0 υπάρχει πολύ µεγάλος κίνδυνος να σφάλαµε. Για τον λόγο αυτό την διατηρούµε. 39

40 Πριν αποφασίσουµε για το συγκεκριµένο παράδειγµα βλέπουµε στον πίνακα, ότι το p (sig) αφορά έλεγχο 2 ουρών. Έλεγχος µιας ουράς. Μπορούµε να διαιρέσουµε το p δια δύο γιατί η κατανοµή t είναι συµµετρική, άρα p=0,35, που είναι µεγαλύτερο του α=0,05 και έτσι διατηρούµε την µηδενική υπόθεση. Για 2 ουρές απλά συγκρίνουµε την p=0,703 µε την α=0,05 που είναι σαφώς µεγαλύτερη και έτσι διατηρούµε την µηδενική υπόθεση. Έχουµε το ίδιο αποτέλεσµα (απόφαση) µε τους χειροκίνητους υπολογισµούς. ύο µέσοι όροι Στο προηγούµενο παράδειγµα είχαµε µόνο ένα µέσο όρο δείγµατος και θέλαµε να συµπεράνουµε αν ήταν ορθό να έχουµε αυτόν τον µέσο όρο δείγµατος από έναν πληθυσµό µε δεδοµένο µέσο όρο µ. Εδώ θα ασχοληθούµε µε δύο δείγµατα για να βγάλουµε συµπεράσµατα για τους αντίστοιχους πληθυσµούς τους. Πρώτα πρέπει να κάνουµε ένα διαχωρισµό µεταξύ ανεξάρτητων και συσχετισµένων δειγµάτων (σε ζεύγη). Αν θα θέλαµε να συγκρίνουµε τον µέσο όρο πωλήσεων των εστιατορίων fast food µε αυτόν των εστιατορίων οργάνωσης γευµάτων, είναι προφανές ότι τα δύο δείγµατα δεν σχετίζονται µεταξύ τους (τελείως διαφορετικές επιχειρήσεις, δεν επικαλύπτονται). Αν όµως θέλαµε να συγκρίνουµε τον µέσο όρο των υπαλλήλων πλήρους απασχόλησης µε αυτόν των µερικής απασχόλησης τότε τα δύο δείγµατα είναι εξαρτηµένα και έχουν σχέση (υπάρχουν και τα 2 είδη σε όλες τις επιχειρήσεις, ζεύγη-match). Ανεξάρτητοι πληθυσµοί Υποθέτουµε ότι οι πληθυσµοί απ όπου τραβάµε τα δείγµατα έχουν κανονική κατανοµή. Αν δεν είναι έτσι πρέπει να χρησιµοποιηθούν άλλοι έλεγχοι. Ας υποθέσουµε ότι θέλουµε να συγκρίνουµε τον µέσο όρο πωλήσεων µεταξύ των µικρών και των µεσαίων εστιατορίων που όµως έχουν εκφράσει την άποψη ότι η προοπτική της επιχείρησης είναι πολύ καλή (outlook>=5) Αυτό δίνει ένα δείγµα 26 µικρών και 16 µεσαίων εστιατορίων. Βήµα 1. Μηδενική υπόθεση Η 0 : µ small =µ medium ή Η 0 : µ small - µ medium =0 Βήµα 2. Εναλλακτική υπόθεση Αν δεν έχουµε προηγούµενη γνώση για τις πωλήσεις µεταξύ των δύο κατηγοριών, πρέπει να εφαρµόσουµε έλεγχο 2 ουρών. 40

41 Η Α1 : µ small µ medium έλεγχος 2 ουρών ή µ small - µ medium 0 Αν όµως γνωρίζουµε από, πχ. δηµοσιεύµατα ότι οι πωλήσεις των µεσαίων εστιατορίων είναι µεγαλύτερες από αυτές των µικρών, είναι καλύτερο να γίνει έλεγχος µιας ουράς. Η Α2 : µ small < µ medium έλεγχος µιας ουράς ή µ small - µ medium < 0 Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε t-test Εδώ πρέπει να αποφασιστεί αν οι δύο πληθυσµοί έχουν ίδιες διακυµάνσεις. Αυτό θα έχει επίπτωση στον υπολογισµό του τυπικού σφάλµατος, του βαθµού ελευθερίας και της κρίσιµης τιµής. Την περίπτωση των άνισων διακυµάνσεων θα την εξετάσουµε µε το SPSS. Βήµα 5. Κρίσιµη τιµή Για ίσες διασπορές ο βαθµός ελευθερίας είναι ( )=40 Έλεγχος 2 ουρών: α/2=0,025 κρίσιµη τιµή ± 2,021 Έλεγχος µιας ουράς: α=0,05 κρίσιµη τιµή 1,684 Βήµα 6. Στατιστικό ελέγχου Αν οι διακυµάνσεις είναι ίσες η παρακάτω έκφραση χρησιµοποιείται στους υπολογισµούς του τυπικού σφάλµατος. Το αντίστοιχο στατιστικό ελέγχου είναι Με δεδοµένο ότι οι µέσοι όροι των πληθυσµών είναι ίσοι: µ 1 -µ 2 =0 Έτσι έχουµε: 41

42 42

43 Βήµα 7. Εξαγωγή συµπεράσµατος Έλεγχος 2 ουρών: Επειδή το στατιστικό ελέγχου (-4,46) βρίσκεται αριστερά από την κρίσιµη τιµή (-2,201) απορρίπτουµε την µηδενική υπόθεση και συµπεραίνουµε ότι σε επίπεδο σηµαντικότητας 5% υπάρχει απόδειξη για σηµαντική διαφορά στον µέσο όρο πωλήσεων των µικρών και των µεσαίων εστιατορίων. Έλεγχος µιας ουράς: Επειδή το στατιστικό ελέγχου (-4,46) είναι µικρότερο της κρίσιµης τιµής -1,68, πέφτει στην περιοχή απόρριψης. Έτσι µπορούµε να πούµε ότι σε επίπεδο σηµαντικότητας 5% ο µέσος όρος πωλήσεων των µεσαίων εστιατορίων είναι µεγαλύτερος από αυτόν των µικρών εστιατορίων. 43

44 ΜΕ SPSS (p=α) Τα βήµατα 1 έως 3 είναι ίδια. Βήµα 4. Κατάλληλο στατιστικό Όπως αναφέρθηκε, πριν εφαρµοστεί το t-test ανεξάρτητων πληθυσµών, πρέπει να ελέγξουµε αν οι διακυµάνσεις των πληθυσµών είναι ίσες. Το τεστ Levenes δίνει πληροφορίες για τις διακυµάνσεις και η σχετική υπόθεση µε α=0,05 είναι: Η 0 : Οι διακυµάνσεις των 2 πληθυσµών είναι ίσες σ 1 2 =σ 2 2 Η Α : Οι διακυµάνσεις των 2 πληθυσµών δεν είναι ίσες σ 1 2 σ 2 2 Το τεστ είναι 2 ουρών. Πρώτα θα πρέπει να αναζητήσετε τις περιπτώσεις που το Outlook είναι µεγαλύτερο ή ίσο του 5. Επιλέξτε Data/Select Cases και στην θυρίδα επιλέξτε if condition is satisfied και πατήστε στο κουµπί If Στην νέα θυρίδα θέστε την συνθήκη outlook>=5. Πατήστε Continue και µετά OK για να επιλεγούν οι ζητούµενες περιπτώσεις. Στην συνέχεια, επιλέξτε Analyze/Compare Means/Independent Samples T Test Στο Grouping Variable επιλέξτε size και πατήστε στο Define Groups για να ερίσετε τις οµάδες ενδιαφέροντος. 44

45 Ορίστε 1 (µικρές) και 2 (µεσαίες) και πατήστε Continue. Πατήστε OK για το αποτέλεσµα. Για να φτάσουµε σε µια απόφαση, το στατιστικό που βγήκε, δηλ. το 1.783, θα πρέπει να συγκριθεί µε την κατάλληλη κρίσιµη τιµή του πίνακα F, ο οποίος δεν είναι διαθέσιµος αυτή τη στιγµή, και έτσι θα χρησιµοποιήσουµε την τιµή p για έλεγχο της υπόθεσης. Η 0,189 είναι µεγαλύτερη του επιπέδου σηµαντικότητας 0,05 και έτσι διατηρούµε την µηδενική υπόθεση και συµπεραίνουµε ότι οι διακυµάνσεις των δύο πληθυσµών δεν είναι σηµαντικά διαφορετικές. Βήµα 5. προσδιορισµός κρίσιµης τιµής εν χρειάζεται κάτι ιδιαίτερο µιας και το SPSS µας έδωσε την p. Βήµα 6. Υπολογισµός του στατιστικού προς έλεγχο. Επειδή το Levene s test έδειξε ίσες διακυµάνσεις θα χρησιµοποιήσουµε την γραµµή Equal variances assumed και το στατιστικό ελέγχου θα είναι το -4,46 (ίδιο µε αυτό που υπολογίσαµε µε το χέρι). Βήµα 7. Εξαγωγή συµπεράσµατος 45

46 Έλεγχος 2 ουρών: Επειδή το Sig (2-tail) =0,000 είναι µικρότερο του α=0,05 απορρίπτουµε την µηδενική υπόθεση και συµπεραίνουµε ότι σε επίπεδο σηµαντικότητας 5% υπάρχει απόδειξη για σηµαντική διαφορά στον µέσο όρο πωλήσεων των µικρών και των µεσαίων εστιατορίων. Έλεγχος µιας ουράς: ιαιρώντας το Sig (2-tail) µε το 2 έχοµε πάλι p=0,000, που είναι µικρότερο του α=0,05. Έτσι µπορούµε να πούµε ότι σε επίπεδο σηµαντικότητας 5% ο µέσος όρος πωλήσεων των µεσαίων εστιατορίων είναι µεγαλύτερος από αυτόν των µικρών εστιατορίων. Συσχετισµένοι πληθυσµοί Υποθέτουµε ότι οι πληθυσµοί απ όπου τραβάµε τα δείγµατα έχουν κανονική κατανοµή. Αν δεν είναι έτσι πρέπει να χρησιµοποιηθούν άλλοι έλεγχοι. Επειδή και τα δύο δείγµατα έχουν προέλθει από τους ίδιους ερωτηθέντες, δεν χρειάζεται έλεγχος ισότητας της διασποράς των 2 πληθυσµών. Ο έλεγχος υπόθεσης παραµένει ο ίδιος και το στατιστικό ελέγχου υπολογίζεται σαν: t = d 0 S d n όπου d είναι ο µέσος των διαφορών (Χ1-Χ2), S d η τυπική απόκλιση των n διαφορών και df=n-1. Έτσι αντί να έχουµε δεδοµένα από 2 δείγµατα, έχουµε τις διαφορές σε ένα σύνολο δεδοµένων. Η υπόθεση που εξετάζουµε είναι ο µέσος των διαφορών να είναι 0. Ας υποθέσουµε ότι θέλουµε να ελέγξουµε αν υπάρχει σηµαντική διαφορά στο πλήθος των υπαλλήλων πλήρους απασχόλησης από αυτούς της µερικής απασχόλησης, για τα εστιατόρια που έχουν εκφράσει την άποψη ότι η προοπτική της επιχείρησης είναι πολύ καλή (outlook>=6) Αυτό δίνει ένα δείγµα 12 περιπτώσεων. Βήµα 1. Μηδενική υπόθεση εν υπάρχει σηµαντική διαφορά µεταξύ του µέσου πλήθους των δύο κατηγοριών υπαλλήλων. Η 0 : µ part-time =µ full-time ή Η 0 : µ part-time - µ full-time =0 ή Η 0 : µ difference = 0 Βήµα 2. Εναλλακτική υπόθεση Επειδή δεν έχουµε προηγούµενη γνώση για τους αντίστοιχους µέσους, ίσως αποφασίσουµε να εφαρµόσουµε έλεγχο 2 ουρών και να αποφασίσουµε απλά αν υπάρχει διαφορά ή όχι. 46

47 Η Α1 : µ part-time µ full-time ή µ part-time - µ full-time 0 ή µ difference 0 Αν όµως θέλουµε να ελέγξουµε αν υπάρχουν περισσότερου υπάλληλοι µερικής απασχόλησης από αυτούς της πλήρους απασχόλησης η εναλλακτική υπόθεση γίνεται: Η Α2 : µ part-time > µ full-time ή µ part-time - µ full-time > 0 ή µ difference > 0 Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε t-test Βήµα 5. Κρίσιµη τιµή Ο βαθµός ελευθερίας είναι (12-1)=11 Έλεγχος 2 ουρών: α/2=0,025 κρίσιµη τιµή ± 2,201 Έλεγχος µιας ουράς: α/2=0,05 κρίσιµη τιµή 1,796 Βήµα 6. Στατιστικό ελέγχου Για τα 12 εστιατόρια που αντιστοιχούν στη ερώτησή µας έχουµε: 47

48 48

49 Βήµα 7. Εξαγωγή συµπεράσµατος Έλεγχος 2 ουρών: Επειδή το στατιστικό ελέγχου (1,164) βρίσκεται στο διάστηµα αποδοχής της µηδενικής υπόθεσης, την αποδεχόµαστε και συµπεραίνουµε ότι σε επίπεδο εµπιστοσύνης 5% δεν υπάρχει σηµαντική διαφορά στον µέσο όρο των υπαλλήλων πλήρους απασχόλησης µε τον µέσο όρο των υπαλλήλων µερικής απασχόλησης. Έλεγχος µιας ουράς: Εδώ το στατιστικό ελέγχου είναι επίσης µικρότερο της κρίσιµης τιµής. Συµπεραίνουµε ότι σε επίπεδο εµπιστοσύνης 5% ο µέσος όρος των υπαλλήλων µερικής απασχόλησης δεν είναι σηµαντικά µεγαλύτερος από τον µέσο όρο των υπαλλήλων πλήρους απασχόλησης. ΜΕ SPSS (p=α) Επειδή αν αναζητήσουµε τις περιπτώσεις για outlook>=6, βρίσκουµε 13 περιπτώσεις και όχι 12, για λόγους συµβατότητας µε τον χειροκίνητο υπολογισµό θα χρησιµοποιήσουµε το αρχείο PandF_timeEmployees. Analyze/Compare means/paired sample T Test και επιλογή των 2 µεταβλητών από το αρχείο PandF_timeEmployees. 49

50 Μπορούµε να χρησιµοποιήσουµε την παρακάτω έξοδο πληροφοριών από το SPSS. Χρειάζεται προσοχή γιατί οι πληροφορίες δεν είναι άµεσα σχετικές µε την υπόθεσή µας. Βλέποντας την 2-tail Sig της t=1,16 που είναι 0,269>α, διατηρούµε την µηδενική υπόθεση και συµπεραίνουµε ότι δεν υπάρχει σηµαντική διαφορά στο πλήθος των υπαλλήλων πλήρους και µερικής απασχόλησης για τα εστιατόρια που έχουν διατυπώσει ότι η προοπτική της επιχείρησης τους είναι πολύ καλή. Έλεγχος ποσοστών. Ποιοτικές µεταβλητές. Κάποια δεδοµένα στην στατιστική των επιχειρήσεων είναι ποιοτικές µεταβλητές και ακολουθούν διωνυµική κατανοµή. Στις περιπτώσεις αυτές ενδιαφερόµαστε για το ποσοστό του πληθυσµού που έχει συγκεκριµένα χαρακτηριστικά και όχι για τους µέσους όρους. ηλ. ενδιαφερόµαστε για την παράµετρο p (καµία σχέση µε την p του SPSS για αποδοχή ή µη, υποθέσεων συνεχών µεταβλητών). Τα στατιστικά πακέτα δεν έχουν υπολογισµούς για ποσοστά για τον λόγο αυτό πρέπει να γίνονται µε το χέρι. Όπως έχουµε αναφέρει το τυπικό σφάλµα είναι σ π = π ( 1 π ) n Παράδειγµα για απλό ποσοστό. Ίσως θα ενδιέφερε να εξετάσουµε την περίπτωση τα εστιατόρια fast food να είναι 38% στην επικράτεια. Το δείγµα µας έχει δείξει 42,3% 50

51 Βήµα 1. Μηδενική υπόθεση Η 0 : π=38% Βήµα 2. Εναλλακτική υπόθεση Επειδή ήδη γνωρίζουµε ότι το ποσοστό από το δείγµα είναι µεγαλύτερο αυτού της επικρατείας, προτιµάµε ένα τεστ µιας ουράς. Η Α : π>38% Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε t-test Βήµα 5. Κρίσιµη τιµή Οι περιπτώσεις του δείγµατος είναι 267 άρα df=266 και συνεπώς από τους πίνακες t βρίσκουµε την κρίσιµη τιµή περίπου 1,645. Βήµα 6. Στατιστικό ελέγχου Χρησιµοποιώντας τον τύπο t : Βήµα 7. Εξαγωγή συµπεράσµατος Επειδή το στατιστικό ελέγχου (1,44) βρίσκεται στην περιοχή µη απόρριψης της Η 0, αποδεχόµαστε την µηδενική υπόθεση και συµπεραίνουµε ότι το ποσοστό των εστιατορίων fast food είναι 38%. 51

52 Παράδειγµα για 2 ποσοστά. Υποθέστε ότι για λόγους σύγκρισης, µια όµοια έρευνα έγινε σε άλλη περιοχή και ότι το αντικείµενο της ερώτησής µας είναι αν υπάρχει σηµαντική διαφορά στο ποσοστό των επιχειρήσεων, που ανήκουν σε ένα ιδιοκτήτη, µεταξύ των 2 περιοχών. Ενδιαφερόµαστε για τις απαντήσεις που είχαν outlook 5 ή 6. Στο δείγµα µας υπάρχουν 61 τέτοιες επιχειρήσεις και 16 από αυτές ανήκουν σε µονό ιδιοκτήτη. p servey =16/61=0,28 (εδώ διαπιστώθηκε εκ των υστέρων ένα µικρό λάθος 0,26, οι υπολογισµοί όµως που ακολουθούν έγιναν µε το λανθασµένο 0,28). Στο δείγµα της άλλης περιοχής έστω ότι τα αντίστοιχα νούµερα ήταν 54 και 24. p other =24/54=0,44 Βήµα 1. Μηδενική υπόθεση Το ποσοστά στις 2 περιοχές είναι ίσα Η 0 : π servey = π other Βήµα 2. Εναλλακτική υπόθεση Εδώ ενδιαφερόµαστε αν υπάρχουν διαφορές. εν µας ενδιαφέρει προς πια κατεύθυνση. (2 ουρές) Η Α π servey π other Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε t-test Βήµα 5. Κρίσιµη τιµή df= =113 και συνεπώς από τους πίνακες t βρίσκουµε την κρίσιµη τιµή περίπου +-1,985 (interpolate µεταξύ df 60 και 120). Βήµα 6. Στατιστικό ελέγχου Χρησιµοποιώντας τον τύπο t : 52

53 Βήµα 7. Εξαγωγή συµπεράσµατος Επειδή το στατιστικό ελέγχου (-1,798) βρίσκεται στην περιοχή απόρριψης της Η 0, απορρίπτουµε την µηδενική υπόθεση και συµπεραίνουµε ότι από τους απαντήσαντες, οι οποίοι πιστεύουν ότι οι επιχείρηση τους έχει αρκετά έως πολύ καλή προοπτική, το ποσοστό των µονών ιδιοκτητών δεν είναι ίδιο στις 2 περιοχές. 53

54 Ανάλυση διακύµανσης Analysis of variance (ANOVA) Μέχρι τώρα χρησιµοποιήσαµε t-test, για να ελέγξουµε την διαφορά µεταξύ των µέσων 2 πληθυσµών, βασισµένοι στην διαφορά των µέσων των δειγµάτων. Υπάρχουν όµως περιπτώσεις που θέλουµε να συγκρίνουµε τους µέσους περισσότερων πληθυσµών, πχ. τον µέσω όρο πωλήσεων τριών ειδών εστιατορίων. Στις περιπτώσεις αυτές το κατάλληλο στατιστικό τεστ είναι η ANOVA. Η ANOVA µας επιτρέπει να ασχοληθούµε µε δύο ή περισσότερες µεταβλητές συγχρόνως και επιπλέον δίνει πληροφορίες όχι µόνο για κάθε µια µεταβλητή ξεχωριστά αλλά και για την µεταξύ τους αλληλεπίδραση. Προϋποθέσεις και σκεπτικό της ANOVA Υπάρχουν τρεις προϋποθέσεις στην ANOVA. Μοιάζουν πολύ µε αυτές του t-test για δύο µέσους. 1. Τα δεδοµένα τραβιούνται ανεξάρτητα και τυχαία από τους αντίστοιχους πληθυσµούς τους. ηλ. η τιµή µιας παρατήρησης δεν επηρεάζει ούτε επηρεάζεται από την τιµή άλλων παρατηρήσεων. 2. Οι παρατηρήσεις που συλλέγονται από κάθε πληθυσµό, ακολουθούν περίπου κανονική κατανοµή. Όπως και στο t, αυτή η προϋπόθεση αφορά την κατανοµή του µέσου του δείγµατος και όχι των ίδιων των παρατηρήσεων. 3. Οι πληθυσµοί απ όπου συλλέχθηκαν τα δεδοµένα έχουν κοινή διασπορά. Λογική της ANOVA Ας υποθέσουµε ότι θέλουµε να εξετάσουµε αν υπάρχουν σηµαντικές διαφορές στον µέσο όρο πωλήσεων των τριών τύπων εστιατορίων (Fast food, Private diner, Business diner). Η µεταβλητή που προσδιορίζει τον τύπο των εστιατορίων καλείται ανεξάρτητη µεταβλητή ή παράγων, που αποτελείται από τρία επίπεδα ή πειραµατικές περιπτώσεις. Για τον λόγο αυτό µπορούµε να θεωρήσουµε ότι το σύνολο των δεδοµένων µας περιλαµβάνει τρεις οµάδες παρατηρήσεων. Ο όρος ANOVA προέρχεται από τον τρόπο που η διαδικασία προσπαθεί να διαχωρίσει την ολική ποσότητα της διακύµανσης του συνόλου των δεδοµένων. Το σύνολο της διακύµανσης των δεδοµένων µπορεί να υπολογιστεί αθροίζοντας τα τετράγωνα των διαφορών κάθε παρατήρησης από τον ολικό µέσο. Αυτό καλείται ολικό σύνολο τετραγώνων, συµβολίζεται SS(total) και µπορεί να διαχωριστεί σε 2 συνιστώσες. ιακύµανση που εξαρτάται από τις διαφορές των δειγµάτων, που καλείται παράγων αθροίσµατος τετραγώνων και συµβολίζεται SS(factor). Η απόκλιση αυτή µπορεί να ελεγχθεί ή να µετρηθεί. Στο παράδειγµά µας µπορούµε να πούµε ότι εξαρτάται από τον διαφορετικό τύπο των εστιατορίων. ιακύµανση µέσα σε κάθε δείγµα, που καλείται σφάλµα αθροίσµατος τετραγώνων και σηµειώνεται SS(error). Εδώ δεν µπορούµε να ελέγξουµε την απόκλιση γιατί δεν γνωρίζουµε τον λόγο ύπαρξής της. Πχ. ξέρουµε ότι υπάρχει απόκλιση στο δείγµα των εστιατορίων fast food, αλλά δεν ξέρουµε γιατί. 54

55 Μπορούµε να πούµε ότι SS(total)= SS(factor) + SS(error) Η βασική ιδέα της ANOVA είναι να ελέγξει αν οι αποκλίσεις που εξαρτώνται από τις ελεγχόµενες µεταβλητές δηλ. τους παράγοντες, είναι αρκετά µεγάλες ώστε να συνιστούν σηµαντική διαφορά µεταξύ τους. Αυτό γίνεται συγκρίνοντας τον µέσο SS(factor) που καλείται µέσο άθροισµα τετραγώνων παράγοντα και συµβολίζεται MS(factor), µε τον µέσο SS(error) που συµβολίζεται MS(error). Ο λόγος MS(factor)/ MS(error) ονοµάζεται λόγος F. Όσο µεγαλύτερος είναι ο λόγος F, τόσο µεγαλύτερη είναι η ένδειξη ότι η ολική απόκλιση οφείλεται στους παράγοντες και όχι στο σφάλµα. Τα παραπάνω οδηγούν στον παρακάτω πίνακα ANOVA. Ο λόγος F είναι το στατιστικό ελέγχου σε ότι αφορά τον έλεγχο υπόθεσης. Συγκρίνεται µε την κρίσιµη τιµή που προκύπτει από τους πίνακες F για δεδοµένο df(factor) και df(error) σε δεδοµένο επίπεδο σηµαντικότητας α. Μοντέλο απλού παράγοντα One-way ANOVA Η απλούστερη περίπτωση ANOVA είναι όταν εµπλέκεται µόνο ένας παράγοντας. Ας υποθέσουµε ότι ενδιαφερόµαστε για την σύγκριση των µέσων πωλήσεων των τριών ειδών εστιατορίων της έρευνάς µας και µόνο για αυτούς που απάντησαν µε >=5 στην µεταβλητή outlook. Τα δεδοµένα είναι τα παρακάτω 55

56 Επειδή θέλουµε να ελέγξουµε συγχρόνως 3 µέσους, εφαρµόζουµε ANOVA. Βήµα 1. Μηδενική υπόθεση εν υπάρχει σηµαντική διαφορά στις µέσες πωλήσεις των τριών κατηγοριών. Η 0 : µ fast food = µ private diner = µ business diner Βήµα 2. Εναλλακτική υπόθεση Η Α εν είναι όλοι οι µ ίσοι ή τουλάχιστον 2 µ είναι άνισοι. Αυτό σηµαίνει ότι αρκεί να αποδείξουµε ότι 2 µέσοι είναι σηµαντικά διαφορετικοί για να απορρίψουµε την µηδενική υπόθεση. Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε ANOVA Βήµα 5. Κρίσιµη τιµή Όπως και στα t-tests οι κρίσιµη τιµή θα αναζητηθεί στους πίνακες F. Η κατανοµή F, δεν είναι συµµετρική και για τον λόγο αυτό η εναλλακτική υπόθεση είναι συνήθως έλεγχος µιας ουράς. Για να βρούµε την κρίσιµη τιµή πρέπει πρώτα να διαλέξουµε τον κατάλληλο πίνακα F. Υπάρχουν πολλοί ανάλογα µε την τιµή α. Παρακάτω δίνεται 56

57 αυτός για α=0,05. Οι στήλες είναι ο df(factor) και οι γραµµές ο df(error). Στο παράδειγµά µας οι αντίστοιχοι βαθµοί ελευθερίας είναι οι 2 και 51 (επειδή ο 51 δεν υπάρχει στον πίνακα κάνουµε προβολή) και δίνει κρίσιµη τιµή 3,18. Βήµα 6. Στατιστικό ελέγχου Πρέπει να κάνουµε τους υπολογισµούς του πίνακα ANOVA. Επειδή το σύνολο των παρατηρήσεων είναι 54 df(total)=54-1=53 Επειδή το σύνολο των παραγόντων (κατηγοριών είναι 3 df(factor)=3-1=2 df(error)= df(total)- df(factor)=53-2=51 Η SS(total) επειδή αντιπροσωπεύει την απόκλιση για όλες τις παρατηρήσεις µπορούµε να θεωρήσουµε ένα ολικό δείγµα και να πάρουµε το άθροισµα των τετραγώνων των διαφορών όλων των τιµών από τον ολικό µέσο. SS(total)=( ,06) 2 + +( ,06) 2 + +( ,06) 2 + +(54-461,06) 2 =

58 Η SS(error) επειδή αντιπροσωπεύει την απόκλιση µέσα σε κάθε κατηγορία µπορεί να υπολογιστεί σαν το άθροισµα των τριών αθροισµάτων που προκύπτουν από το άθροισµα των τετραγώνων των διαφορών µέσα σε κάθε κατηγορία SS(error)=[( ,41) 2 + +( ,41) 2 ]+[( ,57) 2 + +( ,57) 2 ]+[( ,55) 2 + +(54-283,55) 2 ]= SS(factor)= SS(total)- SS(error)= = MS(factor)= SS(factor)/ df(factor)= /2= MS(error)= SS(error)/ df(error)= /51= F-ratio=MS(factor)/MS(error)= / =0,7386 Βήµα 7. Εξαγωγή συµπεράσµατος Επειδή το στατιστικό ελέγχου (0,7386) είναι µικρότερο από την αντίστοιχη κρίσιµη τιµή (3,18) πέφτει στην περιοχή αποδοχής (µη απόρριψης) της µηδενικής υπόθεσης. Συνεπώς συµπεραίνουµε ότι σε επίπεδο σηµαντικότητας 5% δεν υπάρχει απόδειξη ότι υπάρχει σηµαντική διαφορά στον µέσο όρο πωλήσεων των τριών ειδών εστιατορίων. Με το SPSS Αφού φροντήσετε να επιλεγούν οι περιπτώσεις για τις οποίες ισχύει outlook>=5, επιλέξτε: Analyze/Compare Means/One Way ANOVA Στην θυρίδα που εµφανίζεται επιλέξτε τις µεταβλητές ενδιαφέροντος και πατήστε OK. 58

59 Επειδή η sig F (0,483) είναι µεγαλύτερη της α=0,05, δεν υπάρχει σηµαντική διαφορά στις πωλήσεις των τριών τύπων εστιατορίων. 59

60 Συσχέτιση και απλή παλινδρόµηση Έως τώρα ασχοληθήκαµε µε ελέγχους σχετικά µε τις διαφορές µεταξύ των µέσων πληθυσµών, βασισµένων στις διαφορές κατανοµής των δεδοµένων των δειγµάτων. Τώρα θα ασχοληθούµε µε διαφορετικού τύπου ερωτήσεις και προβλήµατα, που εµπεριέχουν εσωτερικές συσχετίσεις των δεδοµένων και προβλέψεις. Αρχικά θα ασχοληθούµε µε προβλήµατα βασισµένα σε δύο µεταβλητές (bivariate). Συσχέτιση Correlation Η συσχέτιση εµφανίζεται όταν ενδιαφερόµαστε για την γραµµική σχέση, που µπορεί να υπάρχει µεταξύ δύο µεταβλητών πχ. πωλήσεις και διαφήµιση. Η δυναµική µιας τέτοιας συσχέτισης προσδιορίζεται από τον συντελεστή συσχέτισης. Ανάλογα µε την φύση των δεδοµένων και τις προϋποθέσεις, που κάνουµε, υπάρχουν και αντίστοιχοι correlation coefficients. Εδώ θα ασχοληθούµε µε συντελεστές συσχέτισης που αφορούν συνεχόµενες µεταβλητές και ειδικά µε τον συντελεστή Pearson (Pearson product-moment correlation coefficient (r)) Για να έχουµε µια αρχική εικόνα της συσχέτισης δύο µεταβλητών είναι πολύ χρήσιµο να πάρουµε το διάγραµµα διασποράς τους (scatter diagram) 60

61 Στην περίπτωση Α έχουµε µια τέλεια γραµµική θετική συσχέτιση των δύο µεταβλητών, όπου κάθε αύξηση της τιµή της Χ αντιστοιχεί σε µια απόλυτα ανάλογη αύξηση της Υ. Στο Β αν και η συσχέτιση είναι θετική (αύξηση της Χ φέρνει αύξηση της Υ) δεν είναι τέλεια. Στο C και D έχουµε αρνητική συσχέτιση. Κάθε αύξηση της Χ φέρνει µείωση της Υ. Στο Ε και F έχουµε έλλειψη συσχέτισης µεταξύ των δύο µεταβλητών. Μια αύξηση στην Χ δεν επιφέρει κάποια αλλαγή στην Υ ή οι αλλαγές στην Χ δεν έχουν κάποια συγκεκριµένη επίδραση στην Υ. Συντελεστής Pearson Είναι αρκετά δύσκολο µέσω µιας οπτικής απεικόνισης να αποφανθεί κανείς για τον βαθµό συσχέτισης που υπάρχει µεταξύ δύο µεταβλητών. Έτσι και εδώ χρειάζεται µια στατιστική διαδικασία για τον έλεγχο του βαθµού συσχέτισης. Θα εφαρµόζουµε τον συντελεστή Pearson ο οποίος υπολογίζεται βάσει του τύπου: Ιδιότητες του r r παίρνει τιµές µεταξύ -1,00 και +1,00 Όσο µεγαλύτερη είναι η απόλυτη τιµή του r τόσο ισχυρότερη είναι η γραµµική σχέση µεταξύ των µεταβλητών. Θετικές τιµές του r δείχνουν θετική συσχέτιση, αρνητικές τιµές δείχνουν αρνητική συσχέτιση, ενώ τιµές κοντά στο µηδέν δείχνουν ανυπαρξία συσχέτισης. Έλεγχος σηµαντικότητας του r. Το γεγονός ότι µπορεί να υπολογίσουµε µια τιµή r µεγαλύτερη του µηδενός δεν συνεπάγεται αυτόµατα και την ύπαρξη µιας θετικής συσχέτισης µεταξύ των δύο µεταβλητών. Θα πρέπει, όπως και µε τους ελέγχους των µέσων, να κάνουµε ένα έλεγχο υπόθεσης του συντελεστή συσχέτισης. Μπορούµε να ελέγξουµε την µηδενική υπόθεση µέσω ενός r, που βρήκαµε µέσω δείγµατος. ηλ. να ελέγξουµε αν ο r δείγµατος, είναι αριθµητικά αρκετά µεγάλος ώστε να µας δώσει την δυνατότατα να απορρίψουµε την δήλωση ότι οι δύο µεταβλητές είναι µη συσχετισµένες, που µε τη σειρά του σηµαίνει ότι ο ρ του πληθυσµού, από τον οποίον προήλθε το δείγµα (και ο r), είναι µηδενικός. Για να ελέγξουµε την σηµαντικότητα του r, χρησιµοποιούµε την µεταλλαγµένη έκδοση του t-test για απλούς µέσους (ελέγχουµε τον r έναντι της τιµής 0) 61

62 Η τιµή του στατιστικού αυτού, συγκρίνεται µε µια κρίσιµη τιµή από τους πίνακες t, για συγκεκριµένο διάστηµα εµπιστοσύνης α και βαθµούς ελευθερίας df=n-2. Αποκωδικοποίηση του r Το ότι ένα µέγεθος αυξάνει όταν αυξάνει ένα άλλο, δεν σηµαίνει πάντα ότι τα δύο µεγέθη συσχετίζονται. Πχ. η αύξηση στις πωλήσεις ρούχων µε την αύξηση στις ληστείες τραπεζών είναι αρκετά δύσκολο να συσχετίζονται (ίσως η αύξηση ρευστότητας από τις ληστείες να επιδρά, αλλά είναι αδύνατο να αποδειχτεί). Η χρήση λοιπόν της συσχέτισης θα πρέπει να συνδέεται µε τη εξέταση δεδοµένων, που υπάρχει πιθανότητα να συσχετίζονται και για τα οποία υπάρχει προηγούµενη εµπειρία Από την άλλη πλευρά η αποδοχή της ρ=0 είναι αρκετά εύκολη. Απλά λέµε ότι δεν υπάρχει σχέση µεταξύ των δύο µεταβλητών. Στην περίπτωση όµως της απόρριψης της ανυπαρξίας σχέσης, δεν έχουµε µια στατιστική διαδικασία για να µας υποστηρίξει στην απόφαση ότι υπάρχει σχέση. Λέµε ότι υπάρχει πιθανότητα σχέσης αλλά δεν µπορούµε να πούµε πόσο ισχυρή είναι αυτή. Η εκτίµηση µέσω του µεγέθους του r είναι υποκειµενική και εξαρτάται από την φύση του προβλήµατος και των µεταβλητών που εξετάζονται. Κάποιος κανόνας δίνεται παρακάτω. r<0,20 0,20<r<0,40 0,40<r<0,70 0,70<r<0,90 r>0,90 Ελαφριά συσχέτιση, σχεδόν ανύπαρκτη σχέση Μικρή συσχέτιση, µικρή σχέση Μέτρια συσχέτιση, ουσιώδης σχέση Μεγάλη συσχέτιση, ουσιώδης σχέση Πολύ Μεγάλη συσχέτιση, πολύ εξαρτώµενη σχέση Η τιµή του r είναι ένας δείκτης και όχι ένα µέτρο σχέσης µεταξύ των 2 µεταβλητών. Αν σε µια περίπτωση ο r είναι 0,25 και σε µια άλλη 0,50 δεν σηµαίνει ότι στην δεύτερη περίπτωση είναι δύο φορές πιο ισχυρή από την πρώτη. Παράδειγµα Έστω ότι µέσω των δεδοµένων, που διαθέτουµε για τα εστιατόρια, θέλουµε να ελέγξουµε την σχέση που υπάρχει µεταξύ των πωλήσεων και του ποσού που δαπανάται για διαφήµιση. Για την απλότητα των υπολογισµών παίρνουµε µόνο τα 10 πρώτα εστιατόρια. 62

63 Η τιµή 160 δεν συµµετέχει στα αθροίσµατα γιατί δεν έχει αντίστοιχο ποσό διαφήµισης και η περίπτωση αυτή δεν συµµετέχει στον υπολογισµό του r (9 περιπτώσεις). Ο συντελεστής συσχέτισης υπολογίζεται σαν: Με το SPSS αν πρώτα επιλέξουµε τις 10 πρώτες περιπτώσεις και στη συνέχεια Analyze/Corelate/Bivariate και στη συνέχεια τις µεταβλητές sales και ads παίρνουµε: Βήµα 1. Μηδενική υπόθεση εν υπάρχει συσχέτιση µεταξύ του ποσού πωλήσεων και του ποσού που δαπανάται για διαφήµιση. Η 0 : ρ Sales & Adv =0 Βήµα 2. Εναλλακτική υπόθεση Έλεγχος 2 ουρών. Το ποσό πωλήσεων και το ποσό που δαπανάται για διαφήµιση συσχετίζονται. Η Α1 : ρ Sales & Adv 0 63

64 Έλεγχος µιας ουράς. Γνωρίζοντας εµπειρικά ότι η αύξηση στο ποσό που δαπανάται για διαφήµιση φέρνει αύξηση στο ποσό πωλήσεων. Η εναλλακτική υπόθεση µπορεί να είναι : Υπάρχει θετική συσχέτιση µεταξύ των 2 µεταβλητών. Η Α2 : ρ Sales & Adv >0 Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε t-test Βήµα 5. Κρίσιµη τιµή Από τους πίνακες t για df=9-2=7, για έλεγχο 2 ουρών βρίσκουµε κρίσιµη τιµή 2,365 και για µία ουρά 1,895 Βήµα 6. Στατιστικό ελέγχου Βήµα 7. Εξαγωγή συµπεράσµατος Ο r=0,779, που δείχνει ότι υπάρχει θετική συσχέτιση µεταξύ των δύο µεταβλητών και ουσιώδης σχέση. Και για τα 2 τεστ η t είναι µεγαλύτερη της κρίσιµης τιµής και κατά συνέπεια απορρίπτουµε την µηδενική υπόθεση και συµπεραίνουµε ότι οι πωλήσεις και η διαφήµιση είναι θετικά συσχετισµένες. Με SPSS Με το παραπάνω παράδειγµα διαπιστώνουµε ότι αν και οι υπολογισµοί είναι απλοί, για µεγάλο πλήθος δεδοµένων είναι επίπονοι. Η χρήση στατιστικού πακέτου επιβάλετε. Ας υποθέσουµε ότι θέλουµε να εξετάσουµε την πιθανή σχέση των πωλήσεων µε το νέο κεφάλαιο επένδυσης. Ο συντελεστής συσχέτισης r, που υπολογίζεται από το σύστηµα, είναι 0,

65 Βήµα 1. Μηδενική υπόθεση εν υπάρχει συσχέτιση µεταξύ του ποσού πωλήσεων και του ποσού νέας επένδυσης. Η 0 : ρ Sales & New_Capital =0 Βήµα 2. Εναλλακτική υπόθεση Έλεγχος 2 ουρών. Το ποσό πωλήσεων και το ποσό νέας επένδυσης συσχετίζονται. Η Α1 : ρ Sales & New_Capital 0 Έλεγχος µιας ουράς. Γνωρίζοντας εµπειρικά ότι η αύξηση στο ποσό νέου κεφαλαίου φέρνει αύξηση στο ποσό πωλήσεων. Η εναλλακτική υπόθεση µπορεί να είναι : Υπάρχει θετική συσχέτιση µεταξύ των 2 µεταβλητών. Η Α2 : ρ Sales & New_Capital >0 Βήµα 3. Επίπεδο σηµαντικότητας. α=0,05 Βήµα 4. Στατιστικό τεστ Θα εφαρµόσουµε t-test Βήµα 5. Κρίσιµη τιµή Τα βρίσκει το SPSS Βήµα 6. Στατιστικό ελέγχου Η έξοδος του SPSS δίνει πληροφορίες για τις περιπτώσεις που χρησιµοποίησε στον υπολογισµό της r και την σχετική τιµή p. Βήµα 7. Εξαγωγή συµπεράσµατος 65

66 Πριν ασχοληθούµε µε την µηδενική υπόθεση ας δούµε λίγο τα στοιχεία εξόδου του SPSS. Η συσχέτιση των µεταβλητών µε τον εαυτό τους είναι 1 (τέλεια) και δεν υπάρχει p. Οι υπόλοιπες τιµές αφορούν την σχέση των µεταβλητών µεταξύ τους. Τεστ 2 ουρών: p=0,00<α και απορρίπτουµε την Η 0 και συµπεραίνουµε ότι η συσχέτιση µεταξύ πωλήσεων και νέου κεφαλαίου δεν είναι µηδενική. Τεστ 1ας ουράς: p=0,00<α και απορρίπτουµε την Η 0 και συµπεραίνουµε ότι υπάρχει µια θετική συσχέτιση µεταξύ πωλήσεων και νέου κεφαλαίου. Απλή γραµµική παλινδρόµηση. Πολλές φορές θέλουµε να εκµεταλλευτούµε την σχέση που υπάρχει µεταξύ 2 µεταβλητών και να την χρησιµοποιήσουµε σαν βάση για προβλέψεις. εδοµένης δηλαδή της γνώσης για την Χ (Predictor Ανεξάρτητη µεταβλητή), και της σχέσης της µε την Υ (εξαρτηµένη µεταβλητή), πως µπορούµε, για περιστασιακές τιµές της Χ, να προβλέψουµε τις αντίστοιχες τιµές της Υ. Η βασική στατιστική τεχνική που εφαρµόζεται για απαντήσεις σε τέτοιες ερωτήσεις είναι η παλινδρόµηση. Εδώ θα δούµε την απλή γραµµική παλινδρόµηση, όπου θα χρησιµοποιηθεί µόνο µια ανεξάρτητη µεταβλητή, για να προβλέψει την γραµµική συµπεριφορά µιας ανεξάρτητης µεταβλητής. Από το προηγούµενο παράδειγµα γνωρίζουµε ότι ο συντελεστής συσχέτισης µεταξύ των πωλήσεων και του ποσού διαφήµισης είναι αρκετά υψηλός (0,779) και θέλουµε να ερευνήσουµε αν µπορούµε να κάνουµε ένα µοντέλο, που θα µας δώσει την δυνατότητα να προβλέψουµε τις πωλήσεις, για δεδοµένα ποσά δαπάνης σε διαφήµιση. 1. Οπτική διερεύνηση Ας το ελέγξουµε πρώτα οπτικά. Το διάγραµµα διασποράς δείχνει ότι οι πωλήσεις (Υ) αυξάνουν όταν αυξάνουν τα ποσά για διαφήµιση. Για τον λόγο αυτό ίσως να υπάρχει µια συναρτησιακή σχέση µεταξύ των 2 µεταβλητών. 66

67 SALES ADS 2. Ορισµός µοντέλου παλινδρόµησης Η επόµενη δουλειά είναι να ορίσουµε τον τύπο του γραµµικού µοντέλου ή της γραµµής παλινδρόµησης. Η εξίσωση της ευθείας γραµµής που µοντελοποιεί την σχέση των δύο µεταβλητών είναι: Y i = β 0 + β 1 Χ i + ε i Όπου β 0 η σταθερά της ευθείας γραµµής, δηλ. η τοµή της µε τον Υ όταν Χ=0 β 1 η κλίση της γραµµής δηλ. η µεταβολή της Υ για µιας µονάδας µεταβολή της Χ ε τυχαίο σφάλµα. Οι β 0 και β 1 ονοµάζονται συντελεστές της γραµµής παλινδρόµησης. Τα γραµµικά µοντέλα, που δεν περιέχουν τυχαίο σφάλµα, λέγονται deterministic ενώ αυτά που περιέχουν σφάλµα λέγονται probabilistic. Τα τελευταία θεωρούν ότι η τιµή πρόβλεψης Υ είναι µια αντιπροσωπευτική τιµή, δηλ. αντιπροσωπεύει τον µέσο όρο όλων των Υ που σχετίζονται µε την συγκεκριµένη Χ. Το πρώτο τµήµα του µοντέλου αναφέρεται στην ευθεία γραµµή του πληθυσµού και σαν τέτοιο παραµένει άγνωστο. Εποµένως χρησιµοποιούµε κάποιο δείγµα για να εκτιµήσουµε τις άγνωστες παραµέτρους β 0 και β 1. Y i = b 0 + b 1 Χ i όπου b 0 και b 1 είναι οι εκτιµήσεις των β 0 και β 1. 67

68 3. Εκτίµηση των συντελεστών της παλινδρόµησης Για να έχουµε µια γραµµή παλινδρόµησης θα πρέπει να προσδιοριστούν οι συντελεστές β 0 και β 1 έτσι ώστε να παραχθεί η βέλτιστη γραµµική συνάρτηση. Με άλλα λόγια θέλουµε να χρησιµοποιήσουµε τα δεδοµένα του δείγµατος για να δηµιουργήσουµε τιµές παραµέτρων τέτοιες, που η δηµιουργουµένη γραµµή να δίνει τιµές πρόβλεψης, που να είναι όσο πιο κοντά γίνεται µε τις επίκαιρες. Οι τιµές πρόβλεψης της Υ συµβολίζονται Ŷ και η διαφορά µεταξύ επίκαιρων και προβλεπόµενων τιµών (Υ- Ŷ) καλείται κατάλοιπο (residual) και συµβολίζεται e. Η µέθοδος που χρησιµοποιείται για τον ορισµό των παραµέτρων που δηµιουργούν το µοντέλο για την καλύτερη γραµµή, δηλ. αυτή που ελαχιστοποιεί το άθροισµα των τετραγώνων των καταλοίπων, είναι η µέθοδος των ελαχίστων τετραγώνων. Η µέθοδος αυτή ορίζει τους παρακάτω τύπους για τον υπολογισµό των εκτιµήσεων των β 0 και β 1. 68

69 4. Επαγωγές που αφορούν την κλίση β 1 Όπως και µε τον συντελεστή συσχέτισης έτσι και εδώ µπορούµε να ελέγξουµε αν υπάρχει µια σηµαντική γραµµική σχέση µεταξύ Χ και Υ, ελέγχοντας αν η κλίση του πληθυσµού (β 1 ) είναι διαφορετική του µηδενός. Αν είναι µηδέν, τότε η γραµµή του πληθυσµού είναι οριζόντια και τα δεδοµένα διασπαρµένα τυχαία. Η παραλλαγή του t- test δίνει: Και εδώ η κρίσιµη τιµή προκύπτει από τους πίνακες t, για n-2 βαθµούς ελευθερίας. 5. Αποτίµηση του µοντέλου. Το ότι θέτουµε µια γραµµή παλινδρόµησης σε ένα σύνολο δεδοµένων, δεν σηµαίνει ότι έχουµε και το καλύτερο µοντέλο. Πρέπει να αναφερθούµε στα µέτρα, που θα µας επιτρέψουν να αποτιµήσουµε πόσο καλό είναι το µοντέλο και αν η παλινδρόµηση είναι η κατάλληλη µέθοδος για τα δεδοµένα που διαθέτουµε, δηλ. αν οι προϋποθέσεις της παλινδρόµησης τηρούνται. Βέλτιστη προσαρµογή Ο Συντελεστής προσδιορισµού (coefficient of determination R 2 ), είναι ένα µέτρο της βέλτιστης προσαρµογής της γραµµής παλινδρόµησης. Όπως και στην ANOVA θέλουµε να διαχωρίσουµε το συνολικό άθροισµα των τετραγώνων (την απόκλιση των τιµών Υ από τον µέσο όρο τους) σε 2 συστατικά. (Μιλάµε πάντα για το άθροισµα των τετραγώνων των διαφορών). 1 Τις εξηγήσιµες διακυµάνσεις που είναι οι διαφορές µεταξύ των προβλεπόµενων τιµών και του µέσου όρου των Υ. 2 Τις ανεξήγητες διακυµάνσεις (σφάλµατα), που είναι οι διαφορές µεταξύ των επίκαιρων τιµών της Υ και των αντίστοιχων προβλεπόµενων τιµών Υ. 69

70 Ο Συντελεστής προσδιορισµού (coefficient of determination R 2 ) υπολογίζεται σύµφωνα µε τον τύπο. Ο R 2 δίνει ένα µέτρο της διακύµανσης, που εξηγείται από την γραµµή παλινδρόµησης.. Επίσης είναι το τετράγωνο αντίστοιχου συντελεστή συσχέτισης r µεταξύ Χ και Υ δηλ. R 2 =(r) 2. Άρα παίρνει τιµές από 0 µέχρι +1,0. Όταν εκφράζεται σαν ποσοστό, είναι το ποσοστό της µεταβολής της Υ, που ερµηνεύεται από την γραµµή παλινδρόµησης. Κάνοντας προβλέψεις. Από την στιγµή που οι παράµετροι της γραµµής παλινδρόµησης έχουν βρεθεί και είµαστε ικανοποιηµένοι µε την λύση, µπορούµε να χρησιµοποιήσουµε το µοντέλο για να κάνουµε προβλέψεις δίνοντας απλά στο Χ κάποιες τιµές. Εδώ χρειάζονται κάποιες παρατηρήσεις σε ότι αφορά τις τιµές που θα δώσουµε στην Χ σαν είσοδο στο µοντέλο παλινδρόµησης. Η πρόβλεψη µιας τιµής Υ από µια τιµή Χ η οποία βρίσκεται µέσα στο διάστηµα τιµών βάσει των οποίων δηµιουργήθηκε το µοντέλο ονοµάζεται παρεµβολή (interpolation), ενώ αν η Χ είναι έξω απ αυτά τα όρια ονοµάζεται συµπερασµατική εξαγωγή (extrapolation). Στην δεύτερη περίπτωση θα πρέπει να είµαστε προσεκτικοί γιατί τα δεδοµένα εκτός διαστήµατος µπορεί να µην τηρούν τις ίδιες παραµέτρους. Παράδειγµα Για τα ίδια δεδοµένα (10 πρώτα εστιατόρια) που χρησιµοποιήθηκαν στην συσχέτιση των πωλήσεων και του ποσού διαφήµισης, η ερώτηση, που τώρα τίθεται, είναι αν µπορούµε να δηµιουργήσουµε ένα µοντέλο παλινδρόµησης, που θα µας βοηθήσει να προβλέψουµε τις πωλήσεις για συγκεκριµένα επίπεδα δαπάνης σε διαφήµιση. 70

71 Παρακάτω δίνονται οι υπολογισµοί. Οπτική παρουσίαση Το διάγραµµα διασποράς δίνεται παρακάτω. Περιµένουµε λοιπόν να δηµιουργήσουµε µια αξιόπιστη γραµµή παλινδρόµησης. Ορισµός του µοντέλου Sales= b 0 +b 1 * Adv 71

72 Εκτίµηση των παραµέτρων παλινδρόµησης Και το µοντέλο είναι: Sales= 101,90 +19,07* Adv Η γραµµή παλινδρόµησης φαίνεται στο διάγραµµα. Οι τιµές των παραµέτρων δείχνουν ότι : Αν το ποσό διαφήµισης είναι µηδενικό, οι πωλήσεις θα είναι στα 101,900 Για κάθε επιπρόσθετο χιλιάρικο διαφήµισης, η αύξηση των πωλήσεων θα είναι 19,070 Επαγωγές για την κλίση Εδώ θα εκτελέσουµε ένα έλεγχο υπόθεσης για την κλίση της γραµµής. 1. Η 0 : β 1 = 0 2. Η Α1 : β 1 0 Η Α2 : β 1 >0 3. α=0,05 4. t-test 5. Από τους πίνακες t για α=0,05 και df=9-2=7 για 2 ουρές η κρίσιµη τιµή είναι 2,365 ενώ για µία 1, Το SPSS δίνει τον κατάλληλο υπολογισµό t=3,4 7. Και για τα 2 τεστ η t είναι µεγαλύτερη της κρίσιµης τιµής και συνεπώς απορρίπτουµε την µηδενική υπόθεση και συµπεραίνουµε ότι υπάρχει σηµαντική και θετική γραµµική σχέση µεταξύ των πωλήσεων και της διαφήµισης. 72

73 Αποτίµηση του µοντέλου Όπως είδαµε προηγούµενα το µέτρο της βέλτιστης προσαρµογής R 2 = (r) 2 = 0,607 δείχνει ότι το 60% της αύξησης της Υ δικαιολογείται από την αύξηση της Χ (καλούτσικο µοντέλο) Αποδεχόµενοι το µοντέλο µπορούµε να κάνουµε προβλέψεις. Ας υποθέσουµε ότι θέλουµε να προβλέψουµε το ποσό των πωλήσεων που θα έφερνε µια δαπάνη σε διαφήµιση της τάξης των Με αντικατάσταση των τιµών στο µοντέλο, έχουµε: Sales= 101,90 +19,07* 13 =349,81 Με SPSS Θα προσπαθήσουµε να απαντήσουµε στην ίδια ερώτηση µε το SPSS, αλλά λόγω της δυνατότητας του πακέτου, θα πάρουµε το σύνολο των δεδοµένων µας. Χρειάζεται λίγη προσοχή γιατί το πακέτο βγάζει πολλές πληροφορίες, που αφορούν επιπλέον δυνατότητες της στατιστικής. 73

74 Από την έξοδο βλέπουµε ότι ο b 0 είναι 29,220 και ο b 1 =24,88 Sales=29, ,88 * Adv Τα στατιστικά ελέγχου T και p (Sig t) αφορούν και την σταθερά b 0 και την κλίση b 1, οπότε για τον έλεγχο σηµαντικότητας των παραµέτρων της γραµµής παλινδρόµησης αρκεί να αναφερθούµε στην τιµή p. 1. Σε ότι αφορά την κλίση, η p=0,000 και προϋποθέτοντας έλεγχο µιας ουράς και α=0,05 απορρίπτουµε την Η 0 (p<α) και συµπεραίνουµε ότι η κλίση είναι σηµαντική. Για τον λόγο αυτό µπορούµε να συµπεράνουµε ότι η δαπάνη διαφήµισης έχει µεγάλη επίδραση στις πωλήσεις.. Για κάθε διαφήµισης ένα εστιατόριο πρέπει να περιµένει αύξηση πωλήσεων. 2. Σε ότι αφορά την σταθερά, η p=0,164 > α και συνεπώς διατηρούµε την Η 0 (p>α) και συµπεραίνουµε ότι δεν έχει σηµαντική διαφορά από το 0. Αυτό σηµαίνει ότι αν δεν δαπανηθεί κάποιο ποσό στην διαφήµιση οι πωλήσεις θα είναι σχεδόν µηδενικές και ότι η γραµµή παλινδρόµησης περνάει από το 0. Σε ότι αφορά την βέλτιστη προσαρµογή το R 2 είναι 0,82 και είναι πολύ ικανοποιητικό δείχνοντας ότι η γραµµή παλινδρόµησης δικαιολογεί το 82% της αύξησης των πωλήσεων. Αν µέσω του κουµπιού Plots επιλέγατε διαγράµµατα, µπορούσατε να έχετε επιπλέον πληροφόρηση. 74

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ- ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Εργασία για το σεµινάριο «Στατιστική περιγραφική εφαρµοσµένη στην ψυχοπαιδαγωγική(β06σ03)» ΤΙΤΛΟΣ: «ΜΕΛΕΤΗ ΠΕΡΙΓΡΑΦΙΚΗΣ

Διαβάστε περισσότερα

2.3. Ασκήσεις σχ. βιβλίου σελίδας 100 104 Α ΟΜΑ ΑΣ

2.3. Ασκήσεις σχ. βιβλίου σελίδας 100 104 Α ΟΜΑ ΑΣ .3 Ασκήσεις σχ. βιβλίου σελίδας 00 04 Α ΟΜΑ ΑΣ. Έξι διαδοχικοί άρτιοι αριθµοί έχουν µέση τιµή. Να βρείτε τους αριθµούς και τη διάµεσό τους. Αν είναι ο ποιο µικρός άρτιος τότε οι ζητούµενοι αριθµοί θα είναι

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Στα πλαίσια της ΣΤΑΤΙΣΤΙΚΗΣ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑΣ προσπαθούµε να προσεγγίσουµε τα χαρακτηριστικά ενός συνόλου (πληθυσµός) δια της µελέτης των χαρακτηριστικών αυτών επί ενός µικρού

Διαβάστε περισσότερα

Μάθηµα 3 ο. Περιγραφική Στατιστική

Μάθηµα 3 ο. Περιγραφική Στατιστική Μάθηµα 3 ο Περιγραφική Στατιστική ΗΣτατιστικήείναι Μια τυποποιηµένη σειρά αναλυτικών µεθόδων, οι οποίες χρησιµοποιούνται από τον εκάστοτε ερευνητή για την ανάλυση των διαθέσιµων δεδοµένων. Υπάρχουν δύο

Διαβάστε περισσότερα

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: Κατανοµές ειγµατοληψίας 1.Εισαγωγή Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: 1. Στατιστικής και 2. Κατανοµής ειγµατοληψίας

Διαβάστε περισσότερα

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας Κεφάλαιο 5 Οι δείκτες διασποράς 1 Ένα παράδειγµα εργασίας Ένας καθηγητής µαθηµατικών έδωσε σε δύο τµήµατα µιας τάξης του σχολείου του το ίδιο τεστ. Η επίδοση των µαθητών του κάθε τµήµατος (όπως µετρήθηκε

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ν ν = 6. όταν είναι πραγµατικός αριθµός. Συνάρτηση: ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ λέγεται µια διαδικασία µε την οποία κάθε στοιχείο ενός συνόλου Α αντιστοιχίζεται σε ένα ακριβώς στοιχείο κάποιου άλλου συνόλου Β. Γνησίως αύξουσα: σε ένα διάστηµα του πεδίου

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής. 2.6 ΟΡΙΑ ΑΝΟΧΗΣ Το διάστηµα εµπιστοσύνης παρέχει µία εκτίµηση µιας άγνωστης παραµέτρου µε την µορφή διαστήµατος και ένα συγκεκριµένο βαθµό εµπιστοσύνης ότι το διάστηµα αυτό, µε τον τρόπο που κατασκευάσθηκε,

Διαβάστε περισσότερα

Κεφάλαιο 7. Έλεγχος Υποθέσεων. Ένα παράδειγµα

Κεφάλαιο 7. Έλεγχος Υποθέσεων. Ένα παράδειγµα Κεφάλαιο 7 Έλεγχος Υποθέσεων 1 Ένα παράδειγµα Ένας ερευνητής θέλησε να διαπιστώσει κατά πόσο η από απόσταση εκπαίδευση είναι καλύτερη από τη δια ζώσης εκπαίδευση. Για το σκοπό αυτό, επέλεξε δύο οµάδες

Διαβάστε περισσότερα

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ 20 3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ ΟΡΙΣΜΟΣ ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ Μια πολύ σηµαντική έννοια στη θεωρία πιθανοτήτων και τη στατιστική είναι η έννοια της µαθηµατικής ελπίδας ή αναµενόµενης τιµής ή µέσης τιµής µιας τυχαίας

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου Διαφορικός Λογισμός 1. Ισχύει f (g())) ) f ( = f (g())g () όπου f,g παραγωγίσιµες συναρτήσεις 2. Αν µια συνάρτηση f είναι παραγωγίσιµη σε ένα διάστηµα

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 8 ο 8.1 Συντελεστές συσχέτισης: 8.1.1 Συσχέτιση Pearson, και ρ του Spearman 8.1.2 Υπολογισµός του συντελεστή

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 2. Περιγραφική Στατιστική Βασικά είδη στατιστικής ανάλυσης 1. Περιγραφική στατιστική: περιγραφή του συνόλου των δεδοµένων (δείγµατος) 2. Συµπερασµατολογία: Παραγωγή συµπερασµάτων για τα

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 9 ο 9.1 ηµιουργία µοντέλων πρόβλεψης 9.2 Απλή Γραµµική Παλινδρόµηση 9.3 Αναλυτικά για το ιάγραµµα ιασποράς

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Κεφάλαιο 3 ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Σε πολλά προβλήµατα της µηχανικής δεν ενδιαφερόµαστε να εκτιµήσουµε την τιµή της παραµέτρου αλλά να διαπιστώσουµε αν η παραµέτρος είναι µικρότερη ή µεγαλύτερη από

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

Κεφάλαιο 6 Παράγωγος

Κεφάλαιο 6 Παράγωγος Σελίδα από 5 Κεφάλαιο 6 Παράγωγος Στο κεφάλαιο αυτό στόχος µας είναι να συνδέσουµε µία συγκεκριµένη συνάρτηση f ( ) µε µία δεύτερη συνάρτηση f ( ), την οποία και θα ονοµάζουµε παράγωγο της f. Η τιµή της

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ Βασικές µορφές Ερωτήσεων - απαντήσεων Ανοιχτές Κλειστές Κλίµακας ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2 Ανοιχτές ερωτήσεις Ανοιχτές

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ .Φουσκάκης- Περιγραφική Στατιστική ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Οι µεταβλητές µιας στατιστικής έρευνας αποτελούνται συνήθως από ένα µεγάλο πλήθος στοιχείων που αφορούν τον πληθυσµό που µας ενδιαφέρει. Για να

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΣΤΑΤΙΣΤΙΚΗ ΙΙ Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς Διασπορά Μέτρηση Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς ομάδες έχουν μέση βαθμολογία 6. συνέχεια

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Πληροφοριακά Συστήµατα ιοίκησης Τµήµα Χρηµατοοικονοµικής και Ελεγκτικής Management Information Systems Εργαστήριο 4 ΤΕΙ Ηπείρου (Παράρτηµα Πρέβεζας)

Πληροφοριακά Συστήµατα ιοίκησης Τµήµα Χρηµατοοικονοµικής και Ελεγκτικής Management Information Systems Εργαστήριο 4 ΤΕΙ Ηπείρου (Παράρτηµα Πρέβεζας) Πληροφοριακά Συστήµατα ιοίκησης Τµήµα Χρηµατοοικονοµικής και Ελεγκτικής Management Information Systems Εργαστήριο 4 ΤΕΙ Ηπείρου (Παράρτηµα Πρέβεζας) ΑΝΤΙΚΕΙΜΕΝΟ: Προσοµοίωση (Simulation) και Τυχαίες µεταβλητές

Διαβάστε περισσότερα

Πίνακας κατανοµής συχνοτήτων και αθροιστικών συχνοτήτων. Σχετ.

Πίνακας κατανοµής συχνοτήτων και αθροιστικών συχνοτήτων. Σχετ. Λυµένη Άσκηση στην οµαδοποιηµένη κατανοµή Στην Γ τάξη του Ενιαίου Λυκείου µιας περιοχής φοιτούν 4 µαθητές των οποίων τα ύψη τους σε εκατοστά φαίνονται στον ακόλουθο πίνακα. 7 4 76 7 6 7 3 77 77 7 6 7 6

Διαβάστε περισσότερα

Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Ανάλυση ιακύµανσης Μονής Κατεύθυνσης 24 Μεθοδολογία Επιστηµονικής Έρευνας & Στατιστική Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Όπως ακριβώς συνέβη και στο κριτήριο t, τα δεδοµένα µας θα πρέπει να έχουν οµαδοποιηθεί χρησιµοποιώντας µια αντίστοιχη

Διαβάστε περισσότερα

ρ. Ευστρατία Μούρτου

ρ. Ευστρατία Μούρτου ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΠΑΤΡΩΝ ΣΧΟΛΗ ΕΠΑΓΓΕΛΜΑΤΩΝ ΥΓΕΙΑΣ ΚΑΙ ΠΡΟΝΟΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΕΞΑΜΗΝΟ : Ε ΑΚΑ ΗΜΑΪΚΟ ΕΤΟΣ : - ΜΑΘΗΜΑ «ΒΙΟΣΤΑΤΙΣΤΙΚΗ» ΚΕΦ. ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ρ. Ευστρατία Μούρτου

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ Χρήση τυχαίων µεταβλητών για την απεικόνιση εκβάσεων τυχαίου πειράµατος Κατανόηση της έννοιας κατανοµής πιθανοτήτων τυχαίας µεταβλητής Υπολογισµός της συνάρτηση κατανοµής πιθανοτήτων

Διαβάστε περισσότερα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα Δύο κύριοι τρόποι παρουσίασης δεδομένων Παράδειγμα Με πίνακες Με διαγράμματα Ονομαστικά δεδομένα Εδώ τα περιγραφικά μέτρα (μέσος, διάμεσος κλπ ) δεν έχουν νόημα Πήραμε ένα δείγμα από 25 άτομα και τα ρωτήσαμε

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας Επικοινωνία: Πτέρυγα 4, Τοµέας Κοινωνικής Ιατρικής Εργαστήριο Βιοστατιστικής Τηλ. 4613 e-mail: biostats@med.uoc.gr thalegak@med.uoc.gr

Διαβάστε περισσότερα

Σ Ε Μ Ι Ν Α Ρ Ι Ο ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ: ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: ΧΡΗΣΤΟΥ ΚΩΝΣΤΑΝΙΝΟΣ. Υπεύθυνες Εκπόνησης Εργασίας ΟΝΟΜΑ: ΦΩΤΕΙΝΗ ΕΠΩΝΥΜΟ: ΛΙΟΣΗ Α.

Σ Ε Μ Ι Ν Α Ρ Ι Ο ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ: ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: ΧΡΗΣΤΟΥ ΚΩΝΣΤΑΝΙΝΟΣ. Υπεύθυνες Εκπόνησης Εργασίας ΟΝΟΜΑ: ΦΩΤΕΙΝΗ ΕΠΩΝΥΜΟ: ΛΙΟΣΗ Α. Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Κ Ρ Η Τ Η Σ Π Α Ι Δ Α Γ Ω Γ Ι Κ Ο Τ Μ Η Μ Α Δ Η Μ Ο Τ Ι Κ Η Σ Ε Κ Π Α Ι Δ Ε Υ Σ Η Σ Σ Ε Μ Ι Ν Α Ρ Ι Ο ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΕΦΑΡΜΟΡΜΟΣΜΕΝΗ ΣΤΗΝ ΨΥΧΟΠΑΙΔΑΓΩΓΙΚΗ (Β06Σ03) ΤΙΤΛΟΣ

Διαβάστε περισσότερα

Ορισµένοι ερευνητές υποστηρίζουν ότι χρειαζόµαστε µίνιµουµ 30 περιπτώσεις για να προβούµε σε κάποιας µορφής ανάλυσης των δεδοµένων.

Ορισµένοι ερευνητές υποστηρίζουν ότι χρειαζόµαστε µίνιµουµ 30 περιπτώσεις για να προβούµε σε κάποιας µορφής ανάλυσης των δεδοµένων. ειγµατοληψία Καθώς δεν είναι εφικτό να παίρνουµε δεδοµένα από ολόκληρο τον πληθυσµό που µας ενδιαφέρει, διαλέγουµε µια µικρότερη οµάδα που θεωρούµε ότι είναι αντιπροσωπευτική ολόκληρου του πληθυσµού. Τέσσερις

Διαβάστε περισσότερα

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Εισαγωγή στην Κανονική Κατανομή Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Ένα πρόβλημα Πρόβλημα: Ένας μαθητής είχε επίδοση στο τεστ Μαθηματικών 18 και στο τεστ

Διαβάστε περισσότερα

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Θεματικές

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

µηδενικό πολυώνυµο; Τι ονοµάζουµε βαθµό του πολυωνύµου; Πότε δύο πολυώνυµα είναι ίσα;

µηδενικό πολυώνυµο; Τι ονοµάζουµε βαθµό του πολυωνύµου; Πότε δύο πολυώνυµα είναι ίσα; ΘΕΩΡΙΑ ΠΟΛΥΩΝΥΜΩΝ 1. Τι ονοµάζουµε µονώνυµο Μονώνυµο ονοµάζεται κάθε γινόµενο το οποίο αποτελείται από γνωστούς και αγνώστους (µεταβλητές ) πραγµατικούς αριθµούς. Ο γνωστός πραγµατικός αριθµός ονοµάζεται

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2010 ΕΚΦΩΝΗΣΕΙΣ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2010 ΕΚΦΩΝΗΣΕΙΣ ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 00 ΕΚΦΩΝΗΣΕΙΣ ΘΕΜΑ Α Α. Έστω t, t,..., t ν οι παρατηρήσεις µιας ποσοτικής µεταβλητής Χ ενός δείγµατος µεγέθους ν, που έχουν µέση τιµή x. Σχηµατίζουµε

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j όπου x j x i για j i. P i =

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j όπου x j x i για j i. P i = Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Σ αυτό το κεφάλαιο ϑα δούµε πρώτα τρόπους να παρουσιάσουµε τα δεδοµένα µε στατιστικούς πίνακες και διαγράµµατα και µετά να συνοψίσουµε τα δεδοµένα υπολογίζοντας συνοπτικά

Διαβάστε περισσότερα

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής: ΣΕΙΡΕΣ TAYLOR Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων Πολυώνυµο είναι κάθε συνάρτηση της µορφής: p( ) = a + a + a + a + + a, όπου οι συντελεστές α i θα θεωρούνται

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 7: Παρουσίαση δεδομένων-περιγραφική στατιστική Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ. ΣΤ. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (ANALYSIS OF VARIANCE - ANOVA) ΣΤ 1. Ανάλυση ιασποράς κατά µία κατεύθυνση. Όπως έχουµε δει στη παράγραφο Β 2, όταν θέλουµε να ελέγξουµε, αν η µέση τιµή µιας ποσοτικής µεταβλητής διαφέρει

Διαβάστε περισσότερα

Στατιστικό κριτήριο χ 2

Στατιστικό κριτήριο χ 2 18 Μεθοδολογία Επιστηµονικής Έρευνας & Στατιστική Στατιστικό κριτήριο χ 2 Ο υπολογισµός του κριτηρίου χ 2 γίνεται µέσω του µενού [Statistics => Summarize => Crosstabs...]. Κατά τη συγκεκριµένη διαδικασία

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ Τμήμα Λογιστικής & Χρηματοοικονομικής Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου Περιεχόμενα-Ύλη του Μαθήματος Περιγραφική Στατιστική: Είδη δεδομένων, Μετασχηματισμοί,

Διαβάστε περισσότερα

T-tests One Way Anova

T-tests One Way Anova William S. Gosset Student s t Sir Ronald Fisher T-tests One Way Anova ΣΤΑΤΙΣΤΙΚΗ Νίκος Ζουρμπάνος Ρούσσος, Π.Λ., & Τσαούσης, Γ. (2002). Στατιστική εφαρμοσμένη στις κοινωνικές επιστήμες. Αθήνα: Ελληνικά

Διαβάστε περισσότερα

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Στατιστική Ι Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Παρασκευή, 30 Νοεμβρίου 2012 Στατιστική Ι Έννοιες - Κλειδιά Μεταβλητότητα Εύρος (range) Εκατοστημόρια

Διαβάστε περισσότερα

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ 9 ο ΜΑΘΗΜΑ ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ Πότε κάνουμε ομαδοποίηση των παρατηρήσεων; Όταν το πλήθος των τιμών μιας μεταβλητής είναι αρκετά μεγάλο κάνουμε ομαδοποίηση των παρατηρήσεων. Αυτό συμβαίνει είτε

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Περιγραφικοί παράµετροι ή περιγραφικά µέτρα Τα περιγραφικά µέτρα διακρίνονται σε: µέτρα θέσης των στατιστικών δεδο- µένων ή παράµετροι κεντρικής τάσης µέτρα διασποράς µέτρα ή συντελεστές

Διαβάστε περισσότερα

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Πως μπορούμε να συγκρίνουμε μεταβλητές μεταξύ τους? Διαφορά συγκρίνοντας το μέσο μιας μεταβλητής (λόγος ή διάστημα) στις ομάδες πχ. t-test

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΕΦΑΛΑΙΟ 19 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΑΝΟΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Όταν ενδιαφερόμαστε να συγκρίνουμε δύο πληθυσμούς, η φυσιολογική προσέγγιση είναι να προσπαθήσουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2 1 Π Ε Ρ Ι Ε Χ Ο Μ Ε Ν Α ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2 Β. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΕΥΝΑ 1. Γενικά Έννοιες.. 2 2. Πρακτικός Οδηγός Ανάλυσης εδοµένων.. 4 α. Οδηγός Λύσεων στο πλαίσιο

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2012

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2012 Ε_3.Μλ3Γ(ε) ΤΑΞΗ: ΜΑΘΗΜΑ: ΘΕΜΑ Α Γ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ / ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Ηµεροµηνία: Κυριακή 1 Απριλίου 01 ΕΚΦΩΝΗΣΕΙΣ Α1. Για δύο ενδεχόµενα Α και Β ενός δειγµατικού χώρου

Διαβάστε περισσότερα

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό ΗΜΥ 429 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό 1 (i) Βασική στατιστική 2 Στατιστική Vs Πιθανότητες Στατιστική: επιτρέπει μέτρηση και αναγνώριση θορύβου και

Διαβάστε περισσότερα

Οικονοµικό Πανεπιστήµιο Αθηνών Τµήµα Στατιστικής Σηµειώσεις για το µάθηµα : Ανάλυση ιακύµανσης και Σχεδιασµός Πειραµάτων

Οικονοµικό Πανεπιστήµιο Αθηνών Τµήµα Στατιστικής Σηµειώσεις για το µάθηµα : Ανάλυση ιακύµανσης και Σχεδιασµός Πειραµάτων Οικονοµικό Πανεπιστήµιο Αθηνών Τµήµα Στατιστικής Σηµειώσεις για το µάθηµα : Ανάλυση ιακύµανσης και Σχεδιασµός Πειραµάτων Βασίλης Βασδέκης - Στέλιος Ψαράκης Αθήνα 005 Πείραµα Είναι µια δοκιµή ή ένα σύνολο

Διαβάστε περισσότερα

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραµµα Σπουδών: ΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεµατική Ενότητα: ΕΟ-3 Ποσοτικές Μέθοδοι Ακαδηµαϊκό Έτος: 003- ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΘΜΗΤΙΚΗ ΠΕΡΙΓΡΑΦΗ Ε ΟΜΕΝΩΝ ΑΤΑΞΙΝΟΜΗΤΑ

Διαβάστε περισσότερα

1.1 ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ

1.1 ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ : ΠΙΘΑΝΟΤΗΤΕΣ. ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ Αιτιοκρατικό πείραμα ονομάζουμε κάθε πείραμα για το οποίο, όταν ξέρουμε τις συνθήκες κάτω από τις οποίες πραγματοποιείται, μπορούμε να προβλέψουμε με

Διαβάστε περισσότερα

Κεφάλαιο 2: ιατάξεις και Συνδυασµοί.

Κεφάλαιο 2: ιατάξεις και Συνδυασµοί. Κεφάλαιο : ιατάξεις και Συνδυασµοί. Περιεχόµενα Εισαγωγή Βασική αρχή απαρίθµησης ιατάξεις µε και χωρίς επανατοποθέτηση Συνδυασµοί Ασκήσεις Εισαγωγή Μέχρι το τέλος αυτού του κεφαλαίου ϑα ϑεωρούµε πειράµατα

Διαβάστε περισσότερα

22 Στατιστικές Μέθοδοι Ανάλυσης Πειραµατικών εδοµένων Συνεργασίας

22 Στατιστικές Μέθοδοι Ανάλυσης Πειραµατικών εδοµένων Συνεργασίας Στατιστικές Μέθοδοι Ανάλυσης Πειραµατικών εδοµένων Συνεργασίας Χρήστος Κατσάνος και Νικόλαος Αβούρης Πανεπιστήµιο Πατρών Σκοπός Το παρόν κεφάλαιο, συµπληρωµατικό του κυρίως υλικού του βιβλίου, περιλαµβάνει

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ' ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2006 ΕΚΦΩΝΗΣΕΙΣ

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ' ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2006 ΕΚΦΩΝΗΣΕΙΣ ΘΕΜΑ o ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ' ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 006 ΕΚΦΩΝΗΣΕΙΣ A. Η συνάρτηση f είναι παραγωγίσιµη στο ΙR. και c πραγµατική σταθερά. Να αποδείξετε ότι (c f(x)) =c f (x), x ΙR. Μονάδες

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ» ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) TEΛΙΚΕΣ ΕΞΕΤΑΣΕΙΣ 4 Ιουνίου 7 Από τα κάτωθι Θέµατα καλείστε να λύσετε το ο που περιλαµβάνει ερωτήµατα από όλη την ύλη

Διαβάστε περισσότερα

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ Σφάλµατα και στατιστική επεξεργασία πειραµατικών µετρήσεων

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ Σφάλµατα και στατιστική επεξεργασία πειραµατικών µετρήσεων ΘΕ1 ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ Σφάλµατα και στατιστική επεξεργασία πειραµατικών µετρήσεων 1. Σκοπός Πρόκειται για θεωρητική άσκηση που σκοπό έχει την περιληπτική αναφορά σε θεµατολογίες όπως : σφάλµατα, στατιστική

Διαβάστε περισσότερα

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις 2 ΕΡΩΤΗΣΕΙΙΣ ΘΕΩΡΙΙΑΣ ΑΠΟ ΤΗΝ ΥΛΗ ΤΗΣ Β ΤΑΞΗΣ ΜΕΡΟΣ Α -- ΑΛΓΕΒΡΑ Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις Α. 1 1 1. Τι ονομάζεται Αριθμητική και τι Αλγεβρική παράσταση; Ονομάζεται Αριθμητική παράσταση μια παράσταση

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,, e-mail: kyritsis@ist.edu.gr

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,, e-mail: kyritsis@ist.edu.gr Ποσοτικές Μέθοδοι Εισηγητής: Ν.Κυρίτσης MBA Ph.D. Candidate e-mail: kyritsis@ist.edu.gr Εισαγωγή στη Στατιστική Διδακτικοί Στόχοι Μέτρα Σχετικής Διασποράς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή Η Τυποποιημένες

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ-13 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 2010-11 Τρίτη Γραπτή Εργασία στη Στατιστική Γενικές οδηγίες

Διαβάστε περισσότερα

Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις

Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις ΚΕΦΑΛΑΙΟ 2 Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις 2.1 ΕΙΣΑΓΩΓΗ Όπως έχουµε δει, για να προσδιορίσουµε τις αποκρίσεις ενός κυκλώµατος, πρέπει να λύσουµε ένα σύνολο διαφορικών

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα