ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΔΡ. ΙΩΑΝΝΗΣ Σ. ΤΡΙΑΝΤΑΦΥΛΛΟΥ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΔΡ. ΙΩΑΝΝΗΣ Σ. ΤΡΙΑΝΤΑΦΥΛΛΟΥ"

Transcript

1 ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΔΡ. ΙΩΑΝΝΗΣ Σ. ΤΡΙΑΝΤΑΦΥΛΛΟΥ ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ -3 Ακαδημαϊκό Έτος -3

2 . ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ..... Καταγραφή δεδομένων και επιλογή κατάλληλων ρυθμίσεων των μεταβλητών..... Διαχωρισμός αρχείου βάση ενός ποιοτικού χαρακτηριστικού Διαγραφή περιπτώσεων από το σύνολο των δεδομένων Ταξινόμηση δεδομένων βάση κάποιου ποσοτικού χαρακτηριστικού Υπολογισμός μίας νέας μεταβλητής με τη βοήθεια κάποιας ήδη υπάρχουσας 9. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ..... Μέση Τιμή, Διακύμανση, Τυπική Απόκλιση & Συντελεστής Μεταβλητότητας..... Πίνακας Συχνοτήτων και Ραβδόγραμμα (Bar Chart) Διάμεσος, Επικρατούσα Τιμή, Τεταρτημόρια & Ποστημόρια..... Ιστόγραμμα Θηκόγραμμα (Box Plot) Κυκλικό Διάγραμμα (Pie Chart) Κύρτωση και Ασυμμετρία Διαχείριση / Μετασχηματισμοί Δεδομένων (Εντολές Select Cases, Compute Variable & Recode Variable) Περιγραφικά Στατιστικά με χρήση της εντολής «Explore» ΣΤΑΤΙΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Έλεγχος Κανονικότητας Kolmogorov-Smirnov & Έλεγχος t του Student για ένα δείγμα Έλεχγος t για Ανεξάρτητα Δείγματα Έλεγχος Ανεξαρτησίας χ του Pearson ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Διάγραμμα Διασποράς (Scatterplot) Προσαρμογή Ευθείας Γραμμικής Παλινδρόμησης... 3 Ακαδημαϊκό Έτος -3

3 .3. Έλεγχος Κανονικότητας και Ανεξαρτησίας Σφαλμάτων Έλεγχοι Υποθέσεων για τις Τιμές των Παραμέτρων της Γραμμικής Παλινδρόμησης Σημειακή Εκτίμηση Εφαρμογές / Παρουσίαση Αποτελεσμάτων Γραμμικής Παλινδρόμησης ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ Ακαδημαϊκό Έτος -3

4 . ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ.. Καταγραφή δεδομένων και επιλογή κατάλληλων ρυθμίσεων των μεταβλητών Η βασική οθόνη του στατιστικού πακέτου SPSS έχει την ακόλουθη μορφή: Στον παραπάνω πίνακα, γίνεται η καταγραφή των δεδομένων που επιθυμούμε να αναλυθούν. Κάθε στήλη του πίνακα αποτελεί και ένα διαφορετικό χαρακτηριστικό (δηλαδή μία διαφορετική μεταβλητή (variable)), ενώ κάθε οριζόντια γραμμή αντιπροσωπεύει ένα διαφορετικό άτομο (ή παρατήρηση) του δείγματος που έχουμε στη διάθεση μας. Προκειμένου να διαμορφώσουμε κατάλληλα τις ρυθμίσεις που αφορούν την κάθε μεταβλητή (δηλαδή το κάθε διαφορετικό χαρακτηριστικό), επιλέγουμε το Variable View (βρίσκεται στην κάτω αριστερή γωνία της οθόνης) και εμφανίζεται μία άλλη οθόνη, όπως φαίνεται παρακάτω: Ακαδημαϊκό Έτος -3

5 Οι ρυθμίσεις που πρέπει να διαμορφωθούν για κάθε μία μεταβλητή χωριστά, είναι οι εξής: Name: εδώ δίνεται η ονομασία της κάθε μεταβλητής Type: εδώ δηλώνεται το είδος της πληροφορίας που θα εισαχθεί σε κάθε μεταβλητή (δηλαδή σε κάθε στήλη του πίνακα δεδομένων). Για παράδειγμα, αν η πληροφορία είναι ποσοτική, τότε ο κατάλληλος τύπος μεταβλητής που πρέπει να επιλεγεί είναι το Numeric, ενώ αν πρόκειται να εισάγουμε στη συγκεκριμένη στήλη λέξεις (γράμματα), τότε θα επιλέξουμε τον τύπο String. Width: εδώ προσδιορίζεται το μέγιστο πλήθος ψηφίων (αν πρόκειται για αριθμό) ή γραμμάτων (αν πρόκειται για λέξη) που θα επιτρέπεται να εισαχθεί στη συγκεκριμένη στήλη Decimals: εδώ δηλώνεται ο αριθμός δεκαδικών ψηφίων που θέλουμε να εμφανίζονται στα αριθμητικά δεδομένα της κάθε στήλης (προφανώς αν πρόκειται για πληροφορία τύπου String, τότε η συγκεκριμένη επιλογή γίνεται αυτόματα. Measure: εδώ δηλώνεται το αν το χαρακτηριστικό που μελετάμε είναι ποσοτική μεταβλητή (Scale), ονομαστική ποιοτική μεταβλητή (Nominal) ή διατάξιμη ποιοτική μεταβλητή (Ordinal). 5 Ακαδημαϊκό Έτος -3

6 Αφού γίνουν οι κατάλληλες ρυθμίσεις στο Variable View, επιστρέφουμε στην αρχική οθόνη (επιλέγοντας το Data View), ώστε να εισάγουμε τα δεδομένα. Για καλύτερη κατανόηση, ας θεωρήσουμε ένα παράδειγμα στο οποίο το αντικείμενο μελέτης είναι η ταχύτητα επεξεργασίας μίας σειράς ηλεκτρονικών υπολογιστών (εκ των οποίων οι πρώτοι 7 χρησιμοποιούν τον επεξεργαστή Α, ενώ οι υπόλοιποι τον επεξεργαστή Β). Η ποσοτική μεταβλητή (Scale) που θα χρησιμοποιηθεί για την καταγραφή των ταχυτήτων επεξεργασίας ονομάζεται SPEED και μετριέται σε μονάδες GHz με ένα δεκαδικό ψηφίο, ενώ η ποιοτική μεταβλητή (Nominal) που θα χρησιμοποιηθεί για την καταγραφή του επεξεργαστή που χρησιμοποιεί ο κάθε υπολογιστής ονομάζεται PROCESSOR και είναι τύπου String. Ρυθμίζοντας κατάλληλα τις επιλογές στο Variable View, στη συνέχεια καταγράφουμε τις παρατηρειθείσες ταχύτητες των υπολογιστών καθώς και το είδος επεξεργαστή που χρησιμοποιούν στον πίνακα Data View, όπως φαίνεται ακολούθως:.. Διαχωρισμός αρχείου βάση ενός ποιοτικού χαρακτηριστικού Σε περίπτωση που ενδιαφερόμαστε να αναλύσουμε ξεχωριστά τα δεδομένα που αφορούν τους υπολογιστές που χρησιμοποιούν τον επεξεργαστή Α και τον επεξεργαστή Β, τότε ακολουθώντας τη διαδικασία Data / Split File, επιλέγουμε τη 6 Ακαδημαϊκό Έτος -3

7 μεταβλητή PROCESSOR ως μεταβλητή ομαδοποίησης (grouping variable), όπως φαίνεται και παρακάτω:.3. Διαγραφή περιπτώσεων από το σύνολο των δεδομένων Σε περίπτωση που επιθυμούμε να διαγράψουμε προσωρινά μία ή περισσότερες περιπτώσεις (παρατηρήσεις) από τον πίνακα των δεδομένων, τότε ακολουθώντας τη διαδικασία Data / Select Cases, προσδιορίζουμε τη συνθήκη που θέλουμε να ισχύει ότι μία παρατήρηση να παραμένει ενεργή στο δείγμα. Σε διαφορετική περίπτωση, δηλαδή σε περίπτωση που μία ή περισσότερες παρατηρήσεις δεν ικανοποιούν τη συνθήκη που εμείς θα δηλώσουμε, τότε εκείνη (ή εκείνες) η παρατήρηση διαγράφεται προσωρινά από το δείγμα και δεν λαμβάνεται υπόψιν στη συνέχεια της ανάλυσης. Για παράδειγμα αν επιθυμούμε να αναλύσουμε μόνο εκείνα τα δεδομένα που αφορούν ηλεκτρονικούς υπολογιστές οι οποίοι παρουσιάζουν ταχύτητες που υπερβαίνουν τα GHz, τότε ακολουθώντας τη διαδικασία Data / Select Cases, επιλέγουμε το πλήκτρο If Condition is satisfied και διατυπώνουμε τη συνθήκη: SPEED >, όπως φαίνεται στην ακόλουθη οθόνη: 7 Ακαδημαϊκό Έτος -3

8 .. Ταξινόμηση δεδομένων βάση κάποιου ποσοτικού χαρακτηριστικού Σε περίπτωση που επιθυμούμε να τοποθετήσουμε σε αύξουσα ή φθίνουσα σειρά τα δεδομένα βάση κάποιας συγκεκριμένης μέτρησης (ποσοτικής μεταβλητής), τότε ακολουθούμε τη διαδικασία Data / Sort Cases. Για παράδειγμα, αν θέλουμε να τοποθετήσουμε σε αύξουσα σειρά τους υπολογιστές βάση της ταχύτητας επεξεργασίας που παρουσιάζουν, τότε ακολουθώντας τη διαδικασία Data / Sort Cases, επιλέγουμε τη μεταβλητή SPEED να πάρει τη θέση κάτω από την έκφραση Sort By, ενώ ταυτόχρονα επιλέγουμε ως Sort Order (Τρόπος ταξινόμησης) το Ascending, δεδομένου ότι επιθυμούμε να ταξινομήσουμε τα δεδομένα σε αύξουσα σειρά. Η παρακάτω οθόνη δείχνει τις προαναφερθείσες επιλογές: 8 Ακαδημαϊκό Έτος -3

9 .5. Υπολογισμός μίας νέας μεταβλητής με τη βοήθεια κάποιας ήδη υπάρχουσας Σε περίπτωση που επιθυμούμε να δημιουργήσουμε μία νέα μεταβλητή, χρησιμοποιώντας κάποια ήδη υπάρχουσα, τότε ακολουθούμε τη διαδικασία Transform / Compute Variable. Για παράδειγμα, αν θέλουμε να μετατρέψουμε τις ταχύτητες επεξεργασίας σε διαφορετικές μονάδες μέτρησης (από GHz σε MHz), τότε ακολουθώντας τη διαδικασία Transform / Compute Variable, αρχικά δηλώνουμε το όνομα της νέας μεταβλητής κάτω από την έκφραση Target Variable, στη συνέχεια κάτω από την έκφραση Numeric Expression διατυπώνουμε τη σχέση βάση της οποίας θα υπολογιστεί η νέα μεταβλητή, όπως φαίνεται ακολούθως: 9 Ακαδημαϊκό Έτος -3

10 Αξίζει να σημειωθεί ότι, κατά τη διαδικασία υπολογισμού μίας νέας μεταβλητής (Transform / Compute Variable), υπάρχει δυνατότητα χρήσης πληθώρας μαθηματικών και στατιστικών συναρτήσεων για τον κατάλληλο μετασχηματισμό των δεδομένων. Ακαδημαϊκό Έτος -3

11 . ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Στις εξετάσεις του μαθήματος της Στατιστικής του τμήματος Πληροφορικής του Πανεπιστημίου Πειραιώς (κατά τη χειμερινή εξεταστική περίοδο) προσήλθαν συνολικά φοιτητές και φοιτήτριες. Ο εξεταστής βαθμολόγησε τα γραπτά χρησιμοποιώντας την κλίμακα -3 (: λευκή κόλλα, 3: άριστα) και τα αποτελέσματα δίνονται στους ακόλουθους πίνακες. ΦΟΙΤΗΤΕΣ ο έτος ο έτος ο έτος ο έτος ο έτος 9 ο έτος 3 ο έτος ΦΟΙΤΗΤΡΙΕΣ ο έτος ο έτος ο έτος ο έτος ο έτος ο έτος 9 9 ο έτος Εισάγουμε τα παραπάνω δεδομένα στο SPSS. Ακαδημαϊκό Έτος -3

12 .. Μέση Τιμή, Διακύμανση, Τυπική Απόκλιση & Συντελεστής Μεταβλητότητας Η μέση τιμή, η τυπική απόκλιση, η μεγαλύτερη και η μικρότερη τιμή των παραπάνω βαθμολογιών, ακολουθώντας τη διαδικασία: Analyze/Descriptive Statistics/Descriptives: grade Έτσι προκύπτει ο ακόλουθος πίνακας: Descriptive Statistics N Minimum Maximum Mean Std. Deviation grade 9,37 7,8 Valid N (listwise) Παρατηρούμε ότι η μέση τιμή είναι ίση με.37. Αυτό πρακτικά σημαίνει ότι η κεντρική τάση των φοιτητών και των φοιτητριών που συμμετείχαν στις εξετάσεις είναι λάβουν βαθμό γύρω στο.37. Πρόσθετα, η ελάχιστη και μέγιστη βαθμολογία είναι και 9 αντίστοιχα, ενώ η τυπική απόκλιση του δείγματος των γραπτών ισούται με 7.8. Η τυπική απόκλιση εκφράζει το βαθμό διασποράς των βαθμολογιών, δηλαδή περιγράφει το αν το δείγμα των βαθμολογιών αποτελείται από παρατηρήσεις που έχουν κοντινές ή μακρινές αποστάσεις μεταξύ τους. Ωστόσο, δεν υπάρχει κάποιο απόλυτο κριτήριο που να διαχωρίζει πότε ένα δείγμα θεωρείται ότι παρουσιάζει ομοιογένεια ή όχι. Για το λόγο αυτό, χρειάζεται να ορίσουμε μία ποσότητα που να έχει τη δυνατότητα να χαρακτηρίζει το εκάστοτε δείγμα ως ομοιογενές ή ετερογενές. Η ποσότητα αυτή ονομάζεται συντελεστής μεταβλητότητας και υπολογίζεται ως ακολούθως: s CV, x όπου s είναι η τυπική απόκλιση και x η μέση τιμή του δείγματος. Για το συγκεκριμένο παράδειγμα, έχουμε τα εξής: 7.8 CV Δεδομένου ότι CV.7., το δείγμα των βαθμολογιών κρίνεται ετερογενές, δηλαδή οι βαθμολογίες δεν είναι κοντινές (παρουσιάζουν μεγάλο βαθμό μεταβλητότητας). Ακαδημαϊκό Έτος -3

13 .. Πίνακας Συχνοτήτων και Ραβδόγραμμα (Bar Chart) O πίνακας συχνοτήτων και το αντίστοιχο ραβδόγραμμα (bar-chart) δίνονται ακολουθώντας τη διαδικασία: Analyze/Descriptive Statistics/Frequencies: grade Grade Frequency Percent Valid Percent Cumulative Percent Valid 6 6, 6, 6,,,,,,, 3,,, 3 3, 3, 7, 5,, 8, 6 3 3, 3, 3, 7,, 3, 8 8 8, 8,, 9,,,,, 5, 7 7, 7, 5, 6 6, 6, 58, 3 8 8, 8, 66, 6 6, 6, 7, 5 3 3, 3, 75, 6 9 9, 9, 8, 7,, 85, 8 3 3, 3, 88, 9,, 89,,, 9,,, 9,,, 93, 3,, 97,,, 98, 5,, 99, 9,,, Total,, Παρατηρούμε ότι το ποσοστό των φοιτητών/φοιτητριών που έχουν βαθμολογηθεί πάνω από τη βάση είναι ίσο με (-7)%=8%. Το ζητούμενο ραβδόγραμμα δίνεται ακολούθως 3 Ακαδημαϊκό Έτος -3

14 5 C o u n t grade.3. Διάμεσος, Επικρατούσα Τιμή, Τεταρτημόρια & Ποστημόρια Η διάμεσος, τα τεταρτημόρια, το 3% ποσοστημόριο και η επικρατούσα τιμή των βαθμολογιών υπολογίζονται ακολουθώντας τη διαδικασία: Analyze/Descriptive Statistics/Frequencies: grade και επιλέγοντας στο Statistics τα ακόλουθα: Median, Mode, Quartiles, Percentile 3% Έτσι προκύπτει ο επόμενος πίνακας: Statistics grade N Median Mode Percentiles Valid Missing ,, 6,, 5,75 Ακαδημαϊκό Έτος -3

15 Παρατηρούμε ότι η διάμεσος (median) είναι ίση με (αυτό πρακτικά σημαίνει ότι 5 άτομα έχουν βαθμολογηθεί μέχρι και 5 άτομα πάνω από ), η επικρατούσα τιμή (mode) των παρατηρήσεων είναι ίση με (αυτό πρακτικά σημαίνει ότι η «δημοφιλέστερη» βαθμολογία είναι το ), το πρώτο τεταρτημόριο (Percentile 5%) είναι ίσο με (αυτό πρακτικά σημαίνει ότι 5 άτομα έχουν βαθμολογηθεί μέχρι και τα υπόλοιπα άτομα πάνω από ), το τρίτο τεταρτημόριο (Percentile 75%) είναι ίσο με 5.75, ενώ το ποσοστημόριο 3% (Percentile 3%) ισούται με 6... Ιστόγραμμα Το ιστόγραμμα (histogram) συχνοτήτων των βαθμολογιών. δίνεται ακολουθώντας τη διαδικασία: Graphs/Legacy Dialogs/Histogram: grade grade Mean =,37 Std. Dev. = 7,8 N = Παρατηρούμε ότι η βαθμολογία μηδέν παρουσιάζει τη μεγαλύτερη συχνότητα, ενώ βαθμολογίες από 8 έως 8, παρουσιάζουν σχετικά υψηλές συχνότητες, σε αντίθεση με τις βαθμολογίες άνω του. 5 Ακαδημαϊκό Έτος -3

16 .5. Θηκόγραμμα (Box Plot) Το θηκόγραμμα (box-plot) των βαθμολογιών προκύπτει ακολουθώντας Graphs/Legacy Dialogs/Boxplot: grade (με επιλογή στο category axis τη μεταβλητή gender) Έτσι προκύπτει το ακόλουθο θηκόγραμμα για τα δύο φύλα gender Παρατηρούμε ότι για τους φοιτητές (gender=) οι βαθμολογίες έχουν μεγαλύτερη διασπορά σε σχέση με τις βαθμολογίες των φοιτητριών (gender=), καθώς όπως φαίνεται και παραπάνω το 5% των γραπτών των φοιτητριών έχει συγκεντρωθεί σε μια μικρή σχετικά περιοχή σε αντίθεση με το τι συμβαίνει με τα γραπτά των φοιτητών..6. Κυκλικό Διάγραμμα (Pie Chart). To κυκλικό διάγραμμα (pie-chart) προκύπτει ακολουθώντας τη διαδικασία: Graphs/Legacy Dialogs/Pie επιλέγουμε τη μεταβλητή gender προκειμένου να διαχωριστούν τα τμήματα του κυκλικού διαγράμματος (define slices by) 6 Ακαδημαϊκό Έτος -3

17 gender 53,% 7,% Επομένως οι φοιτητές αντιπροσωπεύουν το 53% των εξεταζομένων και οι φοιτήτριες το 7% των εξεταζομένων..7. Κύρτωση και Ασυμμετρία Για να εξετασθεί το δείγμα των βαθμολογιών ως προς το βαθμό κύρτωσης και ασυμμετρίας που παρουσιάζει, ακολουθούμε τη διαδικασία: Analyze/Descriptive Statistics/Frequencies «κλικάρουμε» τις επιλογές Skewness και Kurtosis και τα αποτελέσματα δίνονται ως ακολούθως: Statistics grade N Valid Missing Skewness,5 Std. Error of Skewness, Kurtosis -,69 Std. Error of Kurtosis,78 7 Ακαδημαϊκό Έτος -3

18 Όπως φαίνεται από τον παραπάνω πίνακα, η ασυμμετρία (skewness) είναι ίση με,5. Προκειμένου να αξιολογήσουμε το δείγμα ως έντονα ασύμμετρο, θα πρέπει να υπολογίσουμε το ακόλουθο πηλίκο: Skewness,5,6 std. error of Skewness, και να εξετάσουμε αν η τιμή που προέκυψε (δηλαδή ο αριθμός,6) είναι μεγαλύτερος από το ή όχι (οπότε αντίστοιχα θα χαρακτηρίσουμε το δείγμα ως έντονα θετικά ασύμμετρο ή όχι). Στο παράδειγμα μας, δεδομένου ότι,6 <, συμπεραίνουμε ότι το δείγμα των βαθμολογιών, αν και παρουσίασε μία θετική τιμή του δείκτη ασυμμετρίας, ωστόσο ο βαθμός θετικής ασυμμετρίας του δεν αξιολογείται ως έντονος. Αξίζει να σημειωθεί ότι η ασυμμετρία εξετάζει σε ποια μεριά ως προς τη μέση του δείγματος, είναι κατανεμημένες οι περισσότερες παρατηρήσεις του. Πιο συγκεκριμένα, αν σε ένα δείγμα οι περισσότερες παρατηρήσεις είναι μικρότερες από τη δειγματική μέση τιμή, τότε λέμε ότι το δείγμα παρουσιάζει θετική ασυμμετρία, ενώ σε αντίθετη περίπτωση αρνητική ασυμμετρία. Σχετικά με το βαθμό κύρτωσης που παρουσιάζει το δείγμα, φαίνεται από τον παραπάνω πίνακα ότι ο συντελεστής κύρτωσης είναι ίσος με -,69. Γενικά, αν σε ένα δείγμα ο βαθμός συγκέντρωσης των παρατηρήσεων γύρω από την κορυφή του είναι μεγάλος, τότε λέμε ότι το δείγμα είναι λεπτόκυρτο (ή ισοδύναμα ο συντελεστής κύρτωσης είναι αρνητικός), ενώ σε αντίθετη περίπτωση πλατύκυρτο (ή ισοδύναμα ο συντελεστής κύρτωσης είναι θετικός). Στο παράδειγμα μας, ο συντελεστής κύρτωσης είναι αρνητικός και ίσος με -,69. Ωστόσο για να δούμε αν ο βαθμός κύρτωσης είναι αμελητέος ή όχι, θα πρέπει να εξετάσουμε αν το διάστημα που κατασκευάζεται μέσω του ακόλουθου τύπου: ( kurtosis Std. error of Kurtosis, kurtosis Std. error of Kurtosis) περιλαμβάνει το μηδέν ή όχι. Σύμφωνα με τον παραπάνω πίνακα, έχουμε: (.69.78,.69.78) (.65,.7). Δεδομένου ότι το παραπάνω διάστημα περιλαμβάνει το μηδέν, αυτό σημαίνει ότι ο βαθμός κύρτωσης είναι αμελητέος (για να αξιολογούσαμε το βαθμό κύρτωσης ως σημαντικό (έντονο), θα έπρεπε το παραπάνω διάστημα να μην περιελάμβανε το μηδέν). 8 Ακαδημαϊκό Έτος -3

19 .8. Διαχείριση / Μετασχηματισμοί Δεδομένων (Εντολές Select Cases, Compute Variable & Recode Variable) Για τα προηγούμενα δεδομένα α) Να ορισθεί κατάλληλα μια νέα μεταβλητή, η οποία να εκφράζει τον τελικό βαθμό κάθε φοιτητή / φοιτήτριας στην κλίμακα έως. Στη συνέχεια, να δοθεί ο πίνακας συχνοτήτων της νέας αυτής μεταβλητής. Πόσα γραπτά έχουν περάσει τη βάση με βαθμό πέντε (5); Να υπολογισθεί η μέση τιμή της νέας μεταβλητής, εξαιρώντας τα γραπτά που έχουν βαθμολογηθεί με μηδέν (). Απάντηση. Ακολουθώντας τη διαδικασία: Transform/Compute Variable μετασχηματίζουμε τη μεταβλητή grade σε μια νέα μεταβλητή fgrade χρησιμοποιώντας την ακόλουθη αριθμητική έκφραση (numeric expression) Trunc[grade/3+.5]. Για τη νέα μεταβλητή fgrade, που εκφράζει τις βαθμολογίες σε κλίμακα έως, ο πίνακας συχνοτήτων είναι ο ακόλουθος fgrade Valid,,, 3,, 5, 6, 7, 8,, Total Cumulative Frequency Percent Valid Percent Percent,,, 7 7, 7, 7, 5 5, 5, 3, 3 3, 3, 5,,, 66, 8 8, 8, 8, 5 5, 5, 89,,, 93, 6 6, 6, 99,,,,,, Όπως φαίνεται από τον παραπάνω πίνακα, υπάρχουν 8 γραπτά που έχουν περάσει τη βάση με βαθμό 5. Για να εξαιρέσουμε τις βαθμολογίες που είναι μηδενικές, ακολουθούμε τη διαδικασία Data/Select Cases και στην επιλογή If condition is satisfied συμπληρώνουμε την έκφραση fgrade>. 9 Ακαδημαϊκό Έτος -3

20 Στη συνέχεια, ακολουθώντας τη διαδικασία Analyze/Descriptive Statistics/Descriptives: fgrade υπολογίζουμε ότι η μέση βαθμολογία για τα μη μηδενικά γραπτά είναι ίση με 3.6. β) Χρησιμοποιώντας τη μεταβλητή που εκφράζει το έτος φοίτησης (με τιμές,3,...,) να ορισθεί κατάλληλα μια νέα μεταβλητή, η οποία θα δείχνει αν ο φοιτητής / φοιτήτρια βρίσκεται στο ο έτος, 3 ο έτος, ο έτος ή επί πτυχίω (5 ο έτος και άνω). Ποιο είναι το ποσοστό των εξεταζόμενων φοιτητών που βρίσκονται στο ο έτος, 3 ο έτος, ο έτος ή επί πτυχίω; Να κατασκευαστεί το αντίστοιχο κυκλικό διάγραμμα. Απάντηση. Με βάση τη μεταβλητή year δημιουργούμε μια νέα μεταβλητή fyear ακολουθώντας τη διαδικασία: Transform/Recode Into Different Variables. Για τις τιμές,3, της μεταβλητής year η νέα μεταβλητή fyear θα λαμβάνει αντίστοιχα τις τιμές,3,. Αντίθετα, για όλες τις τιμές 5 και άνω της μεταβλητής year η νέα μεταβλητή fyear θα λαμβάνει την τιμή 5. Το κυκλικό διάγραμμα που χρησιμοποιεί τη νέα μεταβλητή fyear δίνεται ακολούθως fyear, 3,, 5,,% 33,%,% 9,%.9. Περιγραφικά Στατιστικά με χρήση της εντολής «Explore» Για τα παραπάνω δεδομένα να υπολογισθεί η μέση τιμή και να δημιουργηθούν ιστόγραμμα, θηκόγραμμα των βαθμών - ανά φύλο. Ακαδημαϊκό Έτος -3

21 Προκειμένου να υπολογίσουμε περιγραφικά μέτρα στατιστικής ή διαγράμματα για κάθε φύλο χωριστά (και όχι για όλα τα γραπτά μαζί, όπως πράξαμε σε προηγούμενα ερωτήματα) ακολουθούμε την ακόλουθη διαδικασία Analyze/Descriptive Statistics/Explore. Στη συνέχεια, επιλέγουμε ως εξαρτημένη μεταβλητή (στο πεδίο Dependent List) τη μεταβλητή fgrade και ως παράγοντα διαχωρισμού των γραπτών (στο πεδίο Factor List) τη μεταβλητή gender. Τελικά το ιστόγραμμα προκύπτει επιλέγοντας στα Plots το Histogram Histogram 5 for gender= Mean =,957 Std. Dev. = N 6868 = 7, 5,, fgrade Histogram for gender= 8 y c n e u q 6 re F, 5, fgrade Mean = 3,957 Std. Dev. =,75 N = 53 Το θηκόγραμμα δίνεται ακολουθώντας την ίδια διαδικασία, όπως φαίνεται παρακάτω: Ακαδημαϊκό Έτος -3

22 , 8, 6,,,, gender Αξίζει να σημειωθεί ότι η έντονη μαύρη γραμμή που φαίνεται στα δύο θηκογράμματα, εκφράζει τη διάμεσο του κάθε φύλου, ενώ το κάτω και άνω φράγμα (εκτός του κεντρικού παραλληλογράμμου) συμβολίζονται ως c,c αντιστοίχως και υπολογίζονται ως εξής: c P,5 ( P P ) Q,5 ( Q ), Q c,5 ( P ),5 ( ) 75 P5 Q3 Q3 P75 Q Ακαδημαϊκό Έτος -3

23 3. ΣΤΑΤΙΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ 3.. Έλεγχος Κανονικότητας Kolmogorov-Smirnov & Έλεγχος t του Student για ένα δείγμα Σε τυχαίο δείγμα 3 εργασιών που εκπονούνται από ηλεκτρονικούς υπολογιστές του Πανεπιστημίου Πειραιώς, καταγράφεται ο χρόνος περαίωσης τους (σε λεπτά), όπως φαίνεται στον ακόλουθο Πίνακα. Εργασία Χρόνος Να εξετασθεί σε επίπεδο σημαντικότητας 5% αν ο μέσος χρόνος περαίωσης μίας εργασίας σε ηλεκτρονικό υπολογιστή του Πανεπιστημίου Πειραιώς: (i) είναι ίσος ή διαφορετικός από 3 λεπτά, (ii) είναι ίσος ή υπερβαίνει τα 3 λεπτά. (i) Οι δύο υποθέσεις που έρχονται σε αντιπαράθεση σύμφωνα με την εκφώνηση της άσκησης είναι οι ακόλουθες: H : έναντι H :, όπου 3 και είναι η άγνωστη πληθυσμιακή μέση τιμή των χρόνων περάτωσης των εργασιών. Προκειμένου να εφαρμόσουμε παραμετρικό έλεγχο για τη μέση τιμή του παραπάνω πληθυσμού, θα πρέπει πρώτα να εξετάσουμε αν τα δεδομένα που διαθέτουμε προσαρμόζονται ικανοποιητικά στην Κανονική κατανομή. Ακολουθώντας τη διαδικασία Analyze/ Nonparametric tests / Sample K-S, λαμβάνουμε τον ακόλουθο πίνακα: One-Sample Kolmogorov-Smirnov Test N Normal Parameters a,b Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (-tailed) a. Test distribution is Normal. b. Calculated from data. Mean Std. Deviation Absolute Positive Negative TIME 3 3,38,7,9,9 -,3,539,933 Όπως φαίνεται από τον παραπάνω πίνακα, η τιμή p-value για τον έλεγχο της κανονικότητας των δεδομένων είναι ίση με,933 >,5. Συνεπώς αποδεχόμαστε τη 3 Ακαδημαϊκό Έτος -3

24 μηδενική υπόθεση της καλής προσαρμογής των δεδομένων στην Κανονική κατανομή. Στη συνέχεια, ακολουθώντας τη διαδικασία Analyze/compare means/one sample T- test, κατασκευάζουμε τον ακόλουθο πίνακα One-Sample Test TIME Test Value = 3 95% Confidence Interval of the Mean Difference t df Sig. (-tailed) Difference Lower Upper,57,656,377 -,59,775 όπου παρατηρούμε ότι το p-value του παραπάνω ελέγχου για τη μέση τιμή των χρόνων περάτωσης των εργασιών στο Πανεπιστήμιο Πειραιώς είναι ίσο με.656, συνεπώς (σε επίπεδο σημαντικότητας 5%) δεν απορρίπτουμε τη μηδενική υπόθεση, γεγονός που σημαίνει ότι οι εργασίες στους Η/Υ του Πανεπιστημίου Πειραιώς απαιτούν κατά μέσο όρο 3 λεπτά προκειμένου να ολοκληρωθούν. (ii) Οι δύο υποθέσεις που έρχονται σε αντιπαράθεση σύμφωνα με την εκφώνηση του δεύτερου ερωτήματος της άσκησης είναι οι ακόλουθες: H : 3 έναντι H : 3. Χρησιμοποιώντας τα αποτελέσματα του προηγούμενου ερωτήματος, παρατηρούμε ότι η τιμή της στατιστικής συνάρτησης που χρησιμοποιήθηκε για τον παραπάνω έλεγχο είναι ίση με,57. Αυτό σημαίνει ότι, δεδομένου ότι το πρόσημο της συνάρτησης είναι θετικό και ταυτόχρονα η εναλλακτική υπόθεση του μονόπλευρου ελέγχου που διεξάγουμε είναι η H : 3, η τιμή p-value του ζητούμενου ελέγχου είναι ίση με το μισό του p-value το αντίστοιχου δίπλευρου ελέγχου που διεξήχθη στο ερώτημα (i). Με άλλα λόγια, η τιμή p-value του ζητούμενου ελέγχου είναι ίση με.656/ =.38, που σημαίνει ότι αποδεχόμαστε τη μηδενική υπόθεση. Συνεπώς συμπεραίνουμε ότι (σε επίπεδο σημαντικότητας 5%) είναι ορθότερο να πούμε ότι ο απαιτούμενος μέσος χρόνος περάτωσης μίας εργασίας σε έναν Η/Υ του Πανεπιστήμιου Πειραιά είναι στατιστικά ίσος με 3 λεπτά (δηλαδή ότι δεν διαφέρει σημαντικά από 3 λεπτά), παρά να διατυπώσουμε το συμπέρασμα ότι ο απαιτούμενος μέσος χρόνος υπερβαίνει σε σημαντικό βαθμό τα 3 λεπτά. 3.. Έλεχγος t για Ανεξάρτητα Δείγματα Ακαδημαϊκό Έτος -3

25 Προκειμένου να συγκριθεί η απόδοση δύο διαφορετικών τύπων επεξεργαστή δεδομένων Α και Β που χρησιμοποιεί μία συγκεκριμένη εταιρία φορητών ηλεκτρονικών υπολογιστών (Φ/Η/Υ), λαμβάνονται δύο τυχαία ανεξάρτητα δείγματα μεγέθους 5 Φ/Η/Υ που χρησιμοποιούν τον επεξεργαστή Α και Φ/Η/Υ που χρησιμοποιούν τον επεξεργαστή Β. Για τα δύο δείγματα Φ/Η/Υ (με τον επεξεργαστή Α και Β αντίστοιχα) έχουν καταγραφεί οι ταχύτητες επεξεργασίας δεδομένων (σε GHz) όπως φαίνεται στον ακόλουθο πίνακα. Δείγμα Δείγμα (i) (ii) Να εξετασθεί σε επίπεδο σημαντικότητας % αν η μέση ταχύτητα επεξεργασίας των δύο επεξεργαστών Α και Β είναι ίδια ή όχι. Να εξετασθεί σε επίπεδο σημαντικότητας % αν η μέση ταχύτητα επεξεργασίας του επεξεργαστή Α υπερβαίνει την ταχύτητα επεξεργασίας του επεξεργαστή Β. (i) Οι δύο υποθέσεις που έρχονται σε αντιπαράθεση σύμφωνα με την εκφώνηση της άσκησης είναι οι ακόλουθες: όπου A B H : A B έναντι H :, A B, είναι οι πληθυσμιακές μέσες ταχύτητες επεξεργασίας δεδομένων των Η/Υ με επεξεργαστή Α και Β αντίστοιχα. Τοποθετούμε τις ταχύτητες επεξεργασίας και των δύο τύπων επεξεργαστή σε μία στήλη (μεταβλητή Samples) και σε μία δεύτερη στήλη (μεταβλητή Type) τις τιμές και για τον επεξεργαστή Α και τον επεξεργαστή Β αντίστοιχα. Προκειμένου να εφαρμόσουμε παραμετρικό έλεγχο για τη σύγκριση των μέσων ταχυτήτων των δύο επεξεργαστών, θα πρέπει πρώτα να εξετάσουμε αν τα δεδομένα που διαθέτουμε προσαρμόζονται ικανοποιητικά στην Κανονική κατανομή. Ακολουθώντας τη διαδικασία Analyze/ Nonparametric tests / Sample K-S, λαμβάνουμε τον ακόλουθο πίνακα: 5 Ακαδημαϊκό Έτος -3

26 One-Sample Kolmogorov-Smirnov Test N Normal Parameters a,b Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (-tailed) a. Test distribution is Normal. b. Calculated from data. Mean Std. Deviation Absolute Positive Negative SAMPLES 6,777,83,, -,83,6,89 Όπως φαίνεται από τον παραπάνω πίνακα, η τιμή p-value για τον έλεγχο της κανονικότητας των δεδομένων είναι ίση με,89 >,5. Συνεπώς αποδεχόμαστε τη μηδενική υπόθεση της καλής προσαρμογής των δεδομένων στην Κανονική κατανομή. Στη συνέχεια, ακολουθούμε τη διαδικασία Analyze/compare means/independent samples T-test και κατασκευάζουμε τον ακόλουθο πίνακα: Independent Samples Test SAMPLES Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,57,83 -,,38 -,88,898 -,3968 -,9 -,3,3,37 -,88,88 -,3866 -,3 Από τον παραπάνω πίνακα, παρατηρούμε ότι p-value =.38, συνεπώς (σε επίπεδο σημαντικότητας 5%) απορρίπτουμε τη μηδενική υπόθεση, που σημαίνει ότι οι μέσες ταχύτητες επεξεργασίας των δύο επεξεργαστών διαφέρει στατιστικά σημαντικά. Αξίζει να σημειωθεί ότι διαλέξαμε το p-value της ης οριζόντιας γραμμής του πίνακα, καθώς ο έλεγχος ισότητας διακυμάνσεων (Levene s test) βγάζει ως αποτέλεσμα ότι οι διακυμάνσεις των δύο δειγμάτων από τους δύο επεξεργαστές είναι στατιστικά ίσες (equal variances assumed). (ii) Οι δύο υποθέσεις που έρχονται σε αντιπαράθεση σύμφωνα με την εκφώνηση του δεύτερου ερωτήματος της άσκησης είναι οι ακόλουθες: H : A B έναντι H :, A B Χρησιμοποιώντας τα αποτελέσματα του προηγούμενου ερωτήματος, παρατηρούμε ότι η τιμή της στατιστικής συνάρτησης που χρησιμοποιήθηκε για τον παραπάνω έλεγχο είναι ίση με,. Αυτό σημαίνει ότι, δεδομένου ότι το πρόσημο της συνάρτησης είναι αρνητικό και ταυτόχρονα η εναλλακτική υπόθεση του 6 Ακαδημαϊκό Έτος -3

27 μονόπλευρου ελέγχου που διεξάγουμε είναι η H :, η τιμή p-value του ζητούμενου ελέγχου είναι ίση με τη συμπληρωματική πιθανότητα από το μισό του p- value του αντίστοιχου δίπλευρου ελέγχου που διεξήχθη στο ερώτημα (i). Με άλλα λόγια, η τιμή p-value του ζητούμενου ελέγχου είναι ίση με (-.38)/ =.8, που σημαίνει ότι αποδεχόμαστε τη μηδενική υπόθεση. Συνεπώς συμπεραίνουμε ότι (σε επίπεδο σημαντικότητας 5%) είναι ορθότερο να πούμε ότι οι μέσες ταχύτητες επεξεργασίας των επεξεργαστών Α και Β είναι στατιστικά ίσος (δηλαδή ότι δεν διαφέρουν σημαντικά), παρά να διατυπώσουμε το συμπέρασμα ότι η μέση ταχύτητα επεξεργασίας του επεξεργαστή Α υπερβαίνει σε σημαντικό βαθμό τη μέση ταχύτητα επεξεργασίας του επεξεργαστή Β. A B 3.3. Έλεγχος Ανεξαρτησίας χ του Pearson Προκειμένου να ελεγχθεί η πιθανή εξάρτηση της εύρυθμης λειτουργίας ενός Η/Υ με το επίπεδο θερμοκρασίας που αναπτύσσεται στο εσωτερικό του, έγινε σε Η/Υ καταγραφή τόσο του επιπέδου θερμοκρασίας του όσο και του αν η λειτουργία του παρουσίασε προβλήματα. Πιο συγκεκριμένα, για κάθε έναν Η/Υ γνωρίζουμε τα εξής: αν η θερμοκρασία στο εσωτερικό του ανέβηκε πάνω από ένα ανώτατο όριο (μεταβλητή Temp που για κάθε Η/Υ λαμβάνει την τιμή αν η θερμοκρασία στο εσωτερικό του δεν υπερέβη το ανώτατο όριο, και την τιμή σε διαφορετική περίπτωση) αν η λειτουργία του παρουσίασε δυσκολίες (μεταβλητή Status που για κάθε Η/Υ λαμβάνει την τιμή αν η λειτουργία του δεν παρουσίασε δυσκολίες, και την τιμή σε διαφορετική περίπτωση). Να ελεγχθεί σε επίπεδο σημαντικότητας 5% αν η εύρυθμη λειτουργία ενός Η/Υ επηρεάζεται ή όχι από το επίπεδο θερμοκρασίας που αναπτύσσεται στο εσωτερικό του. Οι δύο υποθέσεις που έρχονται σε αντιπαράθεση σύμφωνα με την εκφώνηση της άσκησης είναι οι ακόλουθες: H : Η εύρυθμη λειτουργία του Η/Υ είναι ανεξάρτητη από τη θερμοκρασία έναντι H : Η εύρυθμη λειτουργία του Η/Υ εξαρτάται από τη θερμοκρασία. 7 Ακαδημαϊκό Έτος -3

28 Πρόκειται για έλεγχο ανεξαρτησίας δύο κατηγορικών μεταβλητών. Ακολουθώντας τη διαδικασία Analyze / Descriptive Statistics / Crosstabs, λαμβάνουμε τους ακόλουθους πίνακες: TEMP * STATUS Crosstabulation TEMP Total Count Expected Count % within TEMP % within STATUS Count Expected Count % within TEMP % within STATUS Count Expected Count % within TEMP % within STATUS STATUS Total 9 5 7,5 6,5, 6,3% 35,7%,% 6,3%,7% 53,8% 5 7 6,5 5,5,,7% 58,3%,% 35,7% 58,3% 6,% 6,, 6, 53,8% 6,%,%,%,%,% Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (-sided),33 b,9,576,8,3,7,79,58 6 a. Computed only for a x table Exact Sig. (-sided) Exact Sig. (-sided),3, b. cells (,%) have expected count less than 5. The minimum expected count is 5,5. Όπως φαίνεται από τον παραπάνω πίνακα, η τιμή p-value =.9, συνεπώς (σε επίπεδο σημαντικότητας 5%) δεν απορρίπτουμε τη μηδενική υπόθεση, που σημαίνει ότι η εύρυθμη λειτουργία ενός Η/Υ δεν εξαρτάται από το επίπεδο θερμοκρασίας που αναπτύσσεται στο εσωτερικό του. 8 Ακαδημαϊκό Έτος -3

29 . ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Εταιρεία στατιστικών μελετών διεξήγαγε έρευνα για τη χρήση του κινητού τηλεφώνου σε πληθυσμό 5 ατόμων. Συγκεκριμένα κατέγραψε το μηνιαίο χρόνο ομιλίας του κάθε ατόμου στο κινητό τηλέφωνο (εξαρτημένη μεταβλητή Υ ), την ηλικία του (ανεξάρτητη μεταβλητή Χ ), το ετήσιο οικογενειακό εισόδημα του (ανεξάρτητη μεταβλητή Χ ) και τον αριθμό κλήσεων από το σταθερό του τηλέφωνο (ανεξάρτητη μεταβλητή Χ 3 ). Τα αποτελέσματα της έρευνας δίνονται στον ακόλουθο πίνακα. Χρόνος Υ Ηλικία Χ Εισόδημα (σε Ευρώ) Χ Κλήσεις Χ Δίνονται : Y.39, 587, 87.35,. i i i i 5 i i 5 i i3.. Διάγραμμα Διασποράς (Scatterplot) Να γίνει το διάγραμμα διασποράς (scatterplot) μεταξύ των (Χ, Υ), (Χ, Υ) και (Χ 3, Υ). Για κάθε ένα από τα διαγράμματα, να προσαρμοσθεί η ευθεία των ελαχίστων τετραγώνων. Σχολιάστε τα αποτελέσματα. 9 Ακαδημαϊκό Έτος -3

30 Ξεκινώντας τη μελέτη των δεδομένων μιας έρευνας, η γραφική απεικόνιση της εξαρτημένης μεταβλητής Υ συναρτήσει των ερμηνευτικών, μας παρέχει μια πρώτη ένδειξη για την καταλληλότητα τους. Ακολουθώντας τη διαδικασία Graphs/ Scatter/Dot / Simple και τοποθετώντας τη μεταβλητή Υ στον κατακόρυφο άξονα (Y axis) και κάθε μία από τις μεταβλητές Χ, Χ, Χ 3 διαδοχικά στον οριζόντιο άξονα ( axis), κατασκευάζουμε τα ζητούμενα γραφήματα... Προσαρμογή Ευθείας Γραμμικής Παλινδρόμησης Να βρεθεί το καλύτερο γραμμικό μοντέλο (με βάση την αρχή ελαχίστων τετραγώνων) για την πρόβλεψη του χρόνου ομιλίας στο κινητό τηλέφωνο, χρησιμοποιώντας κάθε μία από τις ερμηνευτικές μεταβλητές Χ, Χ και Χ 3 χωριστά. Ποια από τις τρεις μεταβλητές (Χ, Χ ή Χ 3 ) είναι καλύτερη; Μετονομάστε την σε Χ. Ως καλύτερο γραμμικό μοντέλο κρίνεται εκείνο, στο οποίο ερμηνεύεται μεγαλύτερο ποσοστό της συνολικής μεταβλητότητας. Ακολουθώντας τη διαδικασία Analyze/ Regression / Linear και επιλέγοντας τη μεταβλητή Υ ως εξαρτημένη (Dependent) και κάθε μία από τις μεταβλητές Χ, Χ, Χ 3 διαδοχικά ως ανεξάρτητη μεταβλητή του μοντέλου (Independent), λαμβάνουμε τους συντελεστές προσδιορισμού των τριών μοντέλων, με βάση τους οποίους καταλήγουμε στο καλύτερο μοντέλο..3. Έλεγχος Κανονικότητας και Ανεξαρτησίας Σφαλμάτων Να κατασκευάσετε κατάλληλα διαγράμματα, ώστε να διαπιστώσετε γραφικά αν παραβιάζεται (i) η κανονικότητα των σφαλμάτων και (ii) η ανεξαρτησία των σφαλμάτων. (i) Είναι γνωστό ότι μία από τις βασικές προϋποθέσεις του γραμμικού μοντέλου παλινδρόμησης είναι τα σφάλματα να ακολουθούν την κανονική κατανομή. Για να ελέγξουμε γραφικά τη συγκεκριμένη υπόθεση, υπολογίζουμε τα τυποποιημένα σφάλματα (studentized residuals), ακολουθώντας τη διαδικασία Analyze/ Regression / Linear και στην επιλογή Save διαλέγουμε τα studentized residuals. Στη συνέχεια ακολουθώντας τη διαδικασία Analyze/ Descriptive Statistics / P-P Plot (Q-Q Plot) κατασκευάζουμε το P-P Plot(Q-Q Plot) επιλέγοντας ως μεταβλητή τη στήλη με τα studentized residuals και ως test distribution την κανονική κατανομή (Normal). Επιπροσθέτως, ο έλεγχος κανονικότητας των σφαλμάτων μπορεί να γίνει και με το στατιστικό τεστ Kolmogorov-Smirnov, 3 Ακαδημαϊκό Έτος -3

31 ακολουθώντας τη διαδικασία Analyze/ Nonparametric Tests/ -Sample K-S χρησιμοποιώντας ως μεταβλητή (test variable) τη στήλη με τα studentized residuals. (ii) Για να εξετάσουμε αν παραβιάζεται η ανεξαρτησία των σφαλμάτων κατασκευάζουμε διαγράμματα διασποράς, ακολουθώντας τη διαδικασία Graphs/ Scatter/Dot / Simple και τοποθετώντας τη στήλη με τα studentized residuals στον κατακόρυφο άξονα (Y axis) και κάθε μία από τις μεταβλητές Χ, Yˆ, i διαδοχικά στον οριζόντιο άξονα ( axis), όπου Yˆ είναι η στήλη με τις προβλεπόμενες τιμές της εξαρτημένης μεταβλητής Υ και i ο αύξοντας αριθμός των παρατηρήσεων... Έλεγχοι Υποθέσεων για τις Τιμές των Παραμέτρων της Γραμμικής Παλινδρόμησης Να ελεγχθεί η ύπαρξη γραμμικής σχέσης ανάμεσα στην εξαρτημένη μεταβλητή Υ και την ανεξάρτητη μεταβλητή Χ σε επίπεδο σημαντικότητας α=5%. Ο έλεγχος για ύπαρξη γραμμικής σχέσης ανάμεσα στις μεταβλητές Χ, Υ ισοδυναμεί με τον ακόλουθο στατιστικό έλεγχο Η : β =, Η : β. Η απόρριψη ή αποδοχή της μηδενικής υπόθεσης θα βασιστεί στο p-value του ελέγχου ή ισοδύναμα στην τιμή της στατιστικής συνάρτησης ˆ T ( x) ή s( ˆ ) ισοδύναμα στο διάστημα εμπιστοσύνης για την παράμετρο β. Όλα τα παραπάνω υπολογίζονται ακολουθώντας τη διαδικασία Analyze/Regression/Linear στον πίνακα Coefficients..5. Σημειακή Εκτίμηση Πόσος μηνιαίος χρόνος ομιλίας Υ αναμένεται για ένα άτομο ηλικίας 5 ετών; (να γίνει σημειακή εκτίμηση και να δοθεί το διάστημα εμπιστοσύνης με συντελεστή 99%). Στο ερώτημα πρέπει να υπολογίσουμε τις προβλεπόμενες τιμές και το διάστημα εμπιστοσύνης 99% μέσης πρόβλεψης για την εξαρτημένη μεταβλητή Υ που δίνει το γραμμικό μοντέλο, ακολουθώντας τη διαδικασία Analyze/ Regression/Linear και 3 Ακαδημαϊκό Έτος -3

32 στην επιλογή Save διαλέγοντας τα unstandardized predicted values και Mean prediction Intervals αντίστοιχα..6. Εφαρμογές / Παρουσίαση Αποτελεσμάτων Γραμμικής Παλινδρόμησης Για τα δεδομένα της ενότητας: (α) Ποια είναι περίπου η ηλικία ενός ατόμου, το οποίο χρησιμοποιεί 5 λεπτά μηνιαίως το κινητό του τηλέφωνο; Για να δώσουμε τη συγκεκριμένη απάντηση, θα εφαρμόσουμε αντίστροφη παλινδρόμηση. Το μοντέλο που έχουμε επιλέξει είναι το ακόλουθο Y ˆ ˆ και θέτοντας Y 5, λύνουμε ως προς τη μεταβλητή Χ. (β) Να γίνουν οι παρακάτω έλεγχοι σε επίπεδο σημαντικότητας α=% Η : β =, Η : β >, Η : β =., Η : β.. Για τον έλεγχο Η : β =, Η : β >, στηριζόμενοι στον πίνακα Coefficients (ο οποίος λαμβάνεται ακολουθώντας τη διαδικασία Analyze/Regression/ Linear), αποφασίζουμε για την απόρριψη ή την αποδοχή της μηδενική υπόθεσης Η με βάση το p-value του μονόπλευρου ελέγχου ή τη στατιστική ˆ συνάρτηση T ( x). s( ˆ ) Για τον έλεγχο Η : β =., Η : β., θέτω., συνεπώς ο ζητούμενος έλεγχος ισοδυναμεί με τον ακόλουθο Εφαρμόζουμε το γραμμικό μοντέλο δημιουργήσει τη μεταβλητή ελέγχου. Η :, Η :. Y. ˆ (έχοντας προηγουμένως Y. ) και παίρνουμε το p-value του παραπάνω (γ) Σε ποιο σημείο Χ (μεταξύ των 5 δοθέντων) βρίσκουμε το χειρότερο διάστημα εμπιστοσύνης για την απλή πρόβλεψη και σε ποιο σημείο Χ (μεταξύ των 5 δοθέντων) 3 Ακαδημαϊκό Έτος -3

33 βρίσκουμε το καλύτερο διάστημα εμπιστοσύνης για τη μέση πρόβλεψη; Να αιτιολογήσετε τις απαντήσεις σας και να δώσετε τα συγκεκριμένα διαστήματα. Μελετώντας τους τύπους που δίνουν τα διαστήματα εμπιστοσύνης για απλή και μέση πρόβλεψη, παρατηρούμε ότι, όσο περισσότερο απέχει η τιμή της μεταβλητής Χ από το μέσο όρο, τόσο αυξάνεται το εύρος του διαστήματος, που μεταφράζεται σε μείωση της ποιότητας (ακρίβειας) του. Συνεπώς το χειρότερο διάστημα για απλή πρόβλεψη παρατηρείται στην τιμή Χ=7 (πιο μακρινή από ), ενώ το καλύτερο για μέση πρόβλεψη στο Χ= (πιο κοντινό στο ) και τα λαμβάνουμε ακολουθώντας τη διαδικασία Analyze/ Regression / Linear, όπου στην επιλογή Save διαλέγουμε τα Mean (για τη μέση πρόβλεψη) και Individual (για την ατομική πρόβλεψη) Prediction Intervals διαμορφώνοντας τον κατάλληλο συντελεστή εμπιστοσύνης. (δ) Για τις μεταβλητές Χ, Υ που χρησιμοποιήθηκαν παραπάνω, εξετάστε ποιο από τα επόμενα μη γραμμικά μοντέλα είναι το καλύτερο. (i) Y ln, (ii) Y, (iii) Y Με βάση το μοντέλο που επιλέξατε, να δοθεί διάστημα εμπιστοσύνης 9% για το μηνιαίο χρόνο ομιλίας για ένα άτομο ηλικίας ετών. Σε κάθε ένα από τα τρία μη γραμμικά μοντέλα, πραγματοποιούμε τους κατάλληλους μετασχηματισμούς ώστε να καταλήξουμε σε γραμμικό μοντέλο (Ακολουθούμε τη διαδικασία Transform/Compute και επιλέγοντας το όνομα της νέας μεταβλητής (target variable) δηλώνουμε τον τρόπο υπολογισμού της (Numeric Expression)). (i) Y, ln Y (ii) Y ln Y,, ln, ln (iii) Εκτελώντας γραμμική παλινδρόμηση για κάθε ένα από τα τρία νέα γραμμικά μοντέλα (Διαδικασία Analyze/Regression/Linear) συγκρίνουμε τις τιμές των συντελεστών προσδιορισμού τους. 33 Ακαδημαϊκό Έτος -3

34 Για το μοντέλο που κρίνεται ως καλύτερο για πρόβλεψη της εξαρτημένης μεταβλητής Υ, υπολογίζουμε το διάστημα εμπιστοσύνης 9% για το μηνιαίο χρόνο ομιλίας για ένα άτομο ηλικίας ετών Analyze/Regression/Linear/Save/Individual Prediction Interval 9%). (ε) Για τα άτομα ηλικίας έως και 5 ετών, να υπολογισθεί το διάστημα εμπιστοσύνης 95% για τον αναμενόμενο χρόνο ομιλίας στο κινητό. Για να μπορέσουμε να απαντήσουμε στο ερώτημα αυτό, θα πρέπει να απομονώσουμε από το δείγμα που διαθέτουμε, τα άτομα με ηλικία έως 5 ετών. Για να το πετύχουμε αυτό, ακολουθούμε τη διαδικασία Data/Select Cases/If Condition is satisfied και πληκτρολογώντας το κουμπί If, δηλώνουμε τη συνθήκη με βάση την οποία θα γίνει η επιλογή των παρατηρήσεων (cases) που θα παραμείνουν ενεργές στο δείγμα. Συγκεκριμένα στο ερώτημα αυτό, εισάγουμε τη συνθήκη 5, οπότε διαγράφονται από το δείγμα οι παρατηρήσεις στις οποίες η ηλικία είναι μεγαλύτερη από 5, ή ισοδύναμα παραμένουν στο δείγμα οι παρατηρήσεις με ηλικία έως και 5 ετών. Στη συνέχεια για να υπολογίσουμε το διάστημα εμπιστοσύνης 95% μέσης πρόβλεψης για την εξαρτημένη μεταβλητή Υ που δίνει το γραμμικό μοντέλο, ακολουθούμε τη διαδικασία Analyze/ Regression/Linear και στην επιλογή Save διαλέγουμε τα Mean prediction Intervals. 3 Ακαδημαϊκό Έτος -3

35 5. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Εταιρεία στατιστικών μελετών διεξήγαγε έρευνα για την κατανάλωση καυσίμου σε αυτοκίνητα. Συγκεκριμένα κατέγραψε πόσα μίλια διανύει ένα αυτοκίνητο με την κατανάλωση ενός λίτρου καυσίμου (εξαρτημένη μεταβλητή Υ), τον κυβισμό (σε κυβικές ίντσες) της μηχανής του κάθε αυτοκινήτου (ανεξάρτητη μεταβλητή Χ ), την ιπποδύναμη (ανεξάρτητη μεταβλητή Χ ), το βάρος του σε Lbs (ανεξάρτητη μεταβλητή Χ 3 ) και το χρόνο (σε δευτερόλεπτα) που χρειάζεται το αυτοκίνητο για να αποκτήσει ταχύτητα ίση με 6 μίλια/ώρα (ανεξάρτητη μεταβλητή Χ ). Τα αποτελέσματα της έρευνας δίνονται στον ακόλουθο πίνακα. Υ Χ Χ Χ 3 Χ Χ , , , , , , , , ,5 Δίνονται : i Y 35, i i i 6, i i 335, i i3 688, i i 3,5. (α) Να εξεταστούν όλα τα δυνατά γραμμικά μοντέλα που έχουν ως ερμηνευτικές μεταβλητές κάποιες από τις,, 3, και ως εξαρτημένη μεταβλητή την Y. Να βρεθεί το καλύτερο με βάση: i) το R, ii) το R adj, iii) το MSE p. 35 Ακαδημαϊκό Έτος -3

36 (β) Να βρεθεί το καλύτερο μοντέλο με βάση τη διαδικασία Stepwise regression και να περιγραφούν όλα τα ενδιάμεσα βήματα. (γ) Χρησιμοποιώντας τα κατάλληλα γραμμικά μοντέλα, i) να υπολογισθούν οι συντελεστές προσδιορισμού R, ii) να δοθεί η ερμηνεία τους Y., RY., RY., RY. (δ) Χρησιμοποιώντας το πλήρες μοντέλο, (i) να βρεθούν διαστήματα εμπιστοσύνης 95% για κάθε ένα από τα β, β, β, β 3, β, (ii) να δοθεί από κοινού δ.ε. (τουλάχιστον) 95% για τα β, β με τη μέθοδο Bonferroni (ε) Χρησιμοποιώντας το γραμμικό μοντέλο που αξιολογήθηκε ως το καλύτερο με βάση το R (adj), να γίνουν οι παρακάτω έλεγχοι σε επίπεδο σημαντικότητας α=% (i) Η : β = και β =3, Η : β ή β 3, (ii) Η : 3β =β, Η : 3β β. (στ) Χρησιμοποιώντας το πλήρες μοντέλο, να βρεθούν διαστήματα εμπιστοσύνης 95% για τη μέση και ατομική πρόβλεψη του Υ, όταν Χ =3, Χ =5, Χ 3 =, Χ =9. (ζ) Θεωρούμε τη δείκτρια μεταβλητή Χ 5 που λαμβάνει την τιμή, αν το αυτοκίνητο καταναλώνει βενζίνη και την τιμή, αν καταναλώνει πετρέλαιο. Χρησιμοποιώντας το γραμμικό μοντέλο που αξιολογήθηκε ως το καλύτερο με βάση τη διαδικασία Stepwise regression, (i) να βρεθεί δ.ε 95% για τον αναμενόμενο επιπρόσθετο αριθμό μιλίων Υ, που που θα διανύσει ένα βενζινοκίνητο αυτοκίνητο με κυβισμό 3 ίντσες, έναντι ενός πετρελαιοκίνητου με τον ίδιο κυβισμό, (ii) να εξετασθεί σε επίπεδο σημαντικότητας % αν ο αριθμός των μιλίων που θα διανύσει ένα αυτοκίνητο επηρεάζεται από το αν είναι βενζινοκίνητο ή πετρελαιοκίνητο. (η) Θεωρούμε ότι η δείκτρια Χ 5 αλληλεπιδρά με τις ήδη υπάρχουσες μεταβλητές του μοντέλου, το οποίο επιλέχτηκε από τη διαδικασία Stepwise regression. Να εξετασθεί σε επίπεδο σημαντικότητας 5% αν ο αριθμός των μιλίων Υ που διανύει ένα αυτοκίνητο (με κυβισμό 39 ίντσες) με την κατανάλωση ενός λίτρου καυσίμου εξαρτάται από το αν το αυτοκίνητο καταναλώνει βενζίνη ή πετρέλαιο. Απαντήσεις (α) (i) Υπολογίζουμε το συντελεστή προσδιορισμού R για όλα τα δυνατά μοντέλα. Για να μειώσουμε το πλήθος των μοντέλων που θα μελετήσουμε, χρησιμοποιούμε τη 36 Ακαδημαϊκό Έτος -3

37 διορθωτική παρέμβαση t και προκύπτει ότι το βέλτιστο μοντέλο περιέχει τουλάχιστον τη μεταβλητή Χ. R,885,899 3,885,887,9 3,9,887 3,9 3 Βέλτιστο μοντέλο με βάση το R είναι το ακόλουθο Y. (ii) Υπολογίζουμε το συντελεστή προσδιορισμού R adj για όλα τα δυνατά μοντέλα. Για να μειώσουμε το πλήθος των μοντέλων που θα μελετήσουμε, χρησιμοποιούμε τη διορθωτική παρέμβαση t και προκύπτει ότι το βέλτιστο περιέχει τουλάχιστον τη μεταβλητή Χ. R adj,878,888 3,87,87,88 3,886,866 3, Ακαδημαϊκό Έτος -3

38 Βέλτιστο μοντέλο με βάση το R adj είναι το ακόλουθο Y. (iii) Υπολογίζουμε το συντελεστή προσδιορισμού MSE P για όλα τα δυνατά μοντέλα. Για να μειώσουμε το πλήθος των μοντέλων που θα μελετήσουμε, χρησιμοποιούμε τη διορθωτική παρέμβαση t και προκύπτει ότι το βέλτιστο περιέχει τουλάχιστον τη μεταβλητή Χ. MSE p,3,87 3,5,3,98 3,97,3 3,3 3 Βέλτιστο μοντέλο με βάση το MSE p είναι το ακόλουθο Y. (β) Βήμα. Προσαρμόζουμε όλα τα απλά γραμμικά μοντέλα Y i i, i,,3,, και υπολογίζουμε για κάθε ένα από αυτά, την ποσότητα * MSR( i ) F. MSE( i ) Συγκεκριμένα παίρνουμε τα αποτελέσματα * MSR( ) * MSR( ) F 38,39 F, (,5), F 7,888 F, (,5) MSE( ) MSE( ) * MSR( 3 ) * MSR( ) F 3 8, F, (,5), F 5,6 F, (,5) MSE( ) MSE( ) 3 Επιλέγουμε τη μεταβλητή που μεγιστοποιεί την παραπάνω ποσότητα, δηλαδή τη μεταβλητή Χ, οπότε και την εισάγουμε στο μοντέλο. 38 Ακαδημαϊκό Έτος -3

39 Βήμα. Ξεκινώντας με το μοντέλο Y, προσαρμόζουμε όλα τα γραμμικά μοντέλα Y ένα από αυτά, την ποσότητα, i,3, και υπολογίζουμε για κάθε i * MSR( i / ) Fi,. MSE( / ) Παρατηρούμε ότι για καμιά μεταβλητή η παραπάνω ποσότητα δεν υπερβαίνει την τιμή F,3(,5), συνεπώς δεν μπορούμε να εισάγουμε στο μοντέλο άλλη μεταβλητή, με αποτέλεσμα με τη διαδικασία Stepwise Regression να καταλήγουμε στο συμπέρασμα ότι βέλτιστο μοντέλο είναι το εξής Y. i Η παραπάνω διαδικασία συνοψίζεται στον ακόλουθο πίνακα Variables Entered/Removed a i Model Variables Entered Variables Removed ENGINE, a. Dependent Variable: MPG Method Stepwise (Criteria: Probabilit y-of-f-to-e nter <=,5, Probabilit y-of-f-to-r emove >=,). SSR( / ) SSR(, ) SSR( ) 8,98 3,59 (γ) R Y., 566. SSE( ) SSE( ) 8,9 Αυτό σημαίνει ότι το ποσοστό της μεταβλητότητας που ερμηνεύει επιπλέον η μεταβλητή Χ, δεδομένου ότι στο μοντέλο υπάρχει η μεταβλητή Χ, είναι το 56,6% της μεταβλητότητας που δεν έχει ερμηνευθεί από τη Χ. SSR( / SSE( ) ) SSR(, ) SSR( SSE( ) ) 8,98 8,388 36,56 R Y., Αυτό σημαίνει ότι το ποσοστό της μεταβλητότητας που ερμηνεύει επιπλέον η μεταβλητή Χ, δεδομένου ότι στο μοντέλο υπάρχει η μεταβλητή Χ, είναι το,% της μεταβλητότητας που δεν έχει ερμηνευθεί από τη Χ. 39 Ακαδημαϊκό Έτος -3

40 Ο συντελεστής προσδιορισμού SSR( ) SSR( ) 8,388 R Y.,886. SSE SST 36,95 R Y. εκφράζει το ποσοστό της ανερμήνευτης μεταβλητότητας που ερμηνεύει η μεταβλητή Χ, δεδομένου ότι στο μοντέλο δεν υπάρχει άλλη μεταβλητή. Στη συγκεκριμένη περίπτωση το ποσοστό αυτό είναι 88,6%. SSR( ) SSR( ) 3,59 R Y.,7. SSE SST 36,95 Ο συντελεστής προσδιορισμού R Y. εκφράζει το ποσοστό της ανερμήνευτης μεταβλητότητας που ερμηνεύει η μεταβλητή Χ, δεδομένου ότι στο μοντέλο δεν υπάρχει άλλη μεταβλητή. Στη συγκεκριμένη περίπτωση το ποσοστό αυτό είναι 7%. Οι εκτιμήσεις ˆ ˆ, που λαμβάνουμε για τις παραμέτρους, προσαρμόζοντας τα γραμμικά μοντέλα Y, Y, Y δίνονται αντίστοιχα στους ακόλουθους πίνακες Model (Constant) ENGINE ACCEL a. Dependent Variable: MPG Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig.,65,77 5,6, -,85E-,6 -,8 -,7,,56,5,,6,53 Model (Constant) ENGINE a. Dependent Variable: MPG Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig. 7,76,93 3,3, -3,8E-,3 -,9 -,79, Ακαδημαϊκό Έτος -3

41 Model (Constant) ACCEL a. Dependent Variable: MPG Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig. 3,35,3,637,9,,69,86 7,53, Η εκτίμηση για την παράμετρο που παίρνουμε από το πρώτο μοντέλο είναι ˆ,85, ενώ από το δεύτερο είναι ˆ, 38. Αντίστοιχα η εκτίμηση για την παράμετρο που παίρνουμε από το πρώτο μοντέλο είναι ˆ, 56, ενώ από το τρίτο είναι ˆ,. Οι εκτιμήσεις αυτές διαφέρουν σημαντικά για την κάθε παράμετρο χωριστά, διότι οι μεταβλητές Χ, Χ είναι ισχυρά συσχετισμένες. (δ) (i) Τα διαστήματα εμπιστοσύνης 95% για κάθε μία από τις παράμετρους β, β, β, β 3, β χωριστά, δίνονται στον ακόλουθο πίνακα Model Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts 95% Confidence Interval for B B Std. Error Beta t Sig. Lower Bound Upper Bound (Constant) 3,6 5,39,87,,68 3,59 ENGINE -3,97E-, -,73-3,687, -,63 -,7 HORSEPOW3,356E-,,6,66,9 -,,78 WEIGHT -,7E-, -,9 -,58,876 -,3, ACCEL,99,5,,79, -,335,73 a. Dependent Variable: MPG (ii) Για να κατασκευάσουμε από κοινού δ.ε (τουλάχιστον) 95% a 5% για τις παραμέτρους,, χρειαζόμαστε διαστήματα εμπιστοσύνης για κάθε μία από a τις δύο παράμετρους με πιθανότητα σφάλματος %,5. Συνεπώς τα 97,5% δ.ε για τις παραμέτρους, δίνονται ακολούθως I ( ˆ s( ˆ ) t ( 3,97 5 (,5 / ), ˆ s( ˆ ) t,,, 3,97 5 (,5 / )),,) (,66,,) Ακαδημαϊκό Έτος -3

42 I ( ˆ ˆ ) (,5 / ), ˆ ( ˆ s ( t 5 s ) t 5 (,5 / )) (,99,5,,,99,5, ) (,,,8 ). Άρα το από κοινού 95% δ.ε για τις δύο παράμετρους είναι το εξής I I (,66,. ) (,,,8). (ε) Βέλτιστο μοντέλο με βάση το R adj είναι το ακόλουθο Y. Προσαρμόζοντας το παραπάνω μοντέλο, παίρνουμε τον ακόλουθο πίνακα Model (Constant) ENGINE HORSEPOW a. Dependent Variable: MPG Coefficients a Unstandardized Coefficients Standardi zed Coefficien ts B Std. Error Beta t Sig. 6,5,63,937, -,E-,8 -,3-5,3, 3,5E-,,38,583,3 Για τον παρακάτω έλεγχο σε ε.σ. % Η : β = και β =3, Η : β ή β 3, εφαρμόζοντας κατάλληλο μετασχηματισμό 3, προσαρμόζουμε το μοντέλο Y ( 3) Y 3 και παίρνουμε τους ακόλουθους πίνακες Model Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 3696,3 873,67 655,, a 3,866 7, , 9 a. Predictors: (Constant), HORSEPOW, ENGINE b. Dependent Variable: YY Ακαδημαϊκό Έτος -3

43 Model (Constant) ENGINE HORSEPOW a. Dependent Variable: YY Coefficients a Unstandardized Coefficients Standardi zed Coefficien ts B Std. Error Beta t Sig. 6,5,63,937, -,E-,8 -,35-5,3, -,968, -,967-8,97, F * SSR(, ) 3696, , F,7 (,) άρα απορρίπτουμε τη SSE(, ) 3, μηδενική υπόθεση Η. Για τον παρακάτω έλεγχο σε ε.σ. % Η : 3β =β, Η : 3β β, εφαρμόζοντας κατάλληλο μετασχηματισμό 3, προσαρμόζουμε το μοντέλο Y 3 ) ( ), ( και απορρίπτουμε τη μηδενική υπόθεση (από τους αντίστοιχους πίνακες). (στ) Το δ.ε 95% για μέση πρόβλεψη είναι το εξής (.6,.5 ), ενώ το αντίστοιχο για ατομική πρόβλεψη δίνεται ακολούθως (3.37,.83 ). (ζ) (i) Προσαρμόζουμε το μοντέλο Y 5 5 και λαμβάνουμε τον ακόλουθο πίνακα Model (Constant) ENGINE 5 Unstandardized Coefficients a. Dependent Variable: MPG Coefficients a Standardi zed Coefficien ts 95% Confidence Interval for B B Std. Error Beta t Sig. Lower Bound Upper Bound 7,739,86 3,, 5,97 9,56-3,E-,3 -,9 -,, -,36 -,5 -,55,6 -, -,85,89 -,55,95 3 Ακαδημαϊκό Έτος -3

44 Για 5 έχουμε E ( Y ) 5. Για 5 έχουμε E ( Y ). Αφαιρώντας τις δύο σχέσεις κατά μέλη, λαμβάνουμε την ακόλουθη ισότητα 5 E( Y ) E ( Y ), συνεπώς το ζητούμενο δ.ε ταυτίζεται με το δ.ε για την παράμετρο β 5, το οποίο δίνεται στον παραπάνω πίνακα και είναι το ακόλουθο,55,,95. (ii) Στο ερώτημα αυτό ζητείται ο ακόλουθος έλεγχος Η : β 5 = έναντι Η : β 5. Από τον πίνακα του ερωτήματος (i), λαμβάνουμε ότι το p-value του συγκεκριμένου ελέγχου είναι ίσο με,89, συνεπώς σε επίπεδο σημαντικότητας % δεν απορρίπτουμε τη μηδενική υπόθεση και συμπεραίνουμε ότι ο αριθμός των μιλίων που θα διανύσει ένα αυτοκίνητο δεν επηρεάζεται από το αν είναι βενζινοκίνητο ή πετρελαιοκίνητο. (η) Προσαρμόζουμε το μοντέλο Y και λαμβάνουμε τον ακόλουθο πίνακα Model Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts 95% Confidence Interval for B B Std. Error Beta t Sig. Lower Bound Upper Bound (Constant) 8,88,865 33,38, 6,98 3,65 ENGINE -3,E-,3 -,8 -,6, -, -,8 5-5,66,683 -,636-3,7,7-8,733 -,599 INTERACT,6E-,5,56,57,,,3 a. Dependent Variable: MPG Σε επίπεδο σημαντικότητας 5% η μεταβλητή Χ 5 και η αλληλεπίδραση 5 είναι στατιστικά σημαντικές, συνεπώς ο αριθμός των μιλίων Υ που διανύει ένα αυτοκίνητο με την κατανάλωση ενός λίτρου καυσίμου εξαρτάται από το αν το αυτοκίνητο καταναλώνει βενζίνη ή πετρέλαιο. Ακαδημαϊκό Έτος -3

45 6. ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ Πέντε διαφορετικές εταιρίες κατασκευάζουν δίσκους αποθήκευσης για ηλεκτρονικούς υπολογιστές. Προκειμένου να διερευνηθεί το αν ο δίσκος αποθήκευσης λειτουργεί σε ικανοποιητικό επίπεδο για χρονικό διάστημα πέραν της εγγύησης ή όχι εξαρτάται από το ποια εταιρεία τον έχει παρασκευάσει, λαμβάνουμε τυχαίο δείγμα δίσκων αποθήκευσης που έχουν παρασκευασθεί από τις παραπάνω πέντε εταιρίες και καταγράφεται για κάθε έναν από αυτούς το αν ο χρόνος ικανοποιητικής λειτουργίας τους υπερβαίνει την εγγύηση του ή όχι. Τα αποτελέσματα της έρευνας συνοψίζονται στον ακόλουθο πίνακα. ΥΠΕΡΒΑΙΝΕΙ ΤΗΝ ΕΓΓΥΗΣΗ ΕΤΑΙΡΙΑ 3 5 ΝΑΙ ΟΧΙ Να εξετασθεί σε επίπεδο σημαντικότητας 5% η ορθότητα του παραπάνω ισχυρισμού. Ακολουθώντας τη διαδικασία Analyze / Data / Weight cases δηλώνουμε ότι οι συνδυασμοί των επιπέδων των δύο παραγόντων «βαραίνουν» ανάλογα με τις συχνότητες που αυτοί παρουσιάζουν. Στη συνέχεια ακολουθώντας τη διαδικασία Analyze / Descriptive Statistics / Crosstabs καταλήγουμε στον ακόλουθο πίνακα: Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (-sided),66 a,3,797, 3,569,59 a. cells (,%) have expected count less than 5. The minimum expected count is 6,. 5 Ακαδημαϊκό Έτος -3

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

Ανάλυση εδοµένων - Χρήση του στατιστικού πακέτου SPSS. 1 η ΕΝΟΤΗΤΑ ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ

Ανάλυση εδοµένων - Χρήση του στατιστικού πακέτου SPSS. 1 η ΕΝΟΤΗΤΑ ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ Ανάλυση εδοµένων - Χρήση του στατιστικού πακέτου SPSS η ΕΝΟΤΗΤΑ ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ (Α) Καταγραφή δεδοµένων και επιλογή κατάλληλων ρυθµίσεων των µεταβλητών Η βασική οθόνη του στατιστικού

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Περιεχόμενα 1. ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ...

Διαβάστε περισσότερα

Λυμένες Ασκήσεις για το μάθημα:

Λυμένες Ασκήσεις για το μάθημα: Λυμένες Ασκήσεις για το μάθημα: ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ ΚΩΝΣΤΑΝΤΙΝΟΣ ΖΑΦΕΙΡΟΠΟΥΛΟΣ Τμήμα: ΔΙΕΘΝΩΝ ΚΑΙ ΕΥΡΩΠΑΪΚΩΝ ΣΠΟΥΔΩΝ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις: Άσκηση. Δίνονται οι παρακάτω παρατηρήσεις: X X X X Y 7 50 6 7 6 6 96 7 0 5 55 9 5 59 6 8 8 5 0 59 7 7 8 8 5 5 0 7 69 9 6 6 7 6 9 5 7 6 8 5 6 69 8 0 50 66 0 0 50 8 59 76 8 7 60 7 87 6 5 7 88 9 8 50 0 5

Διαβάστε περισσότερα

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα: ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, 6-5-0 Άσκηση 8. Δίνονται οι παρακάτω 0 παρατηρήσεις (πίνακας Α) με βάση τις οποίες θέλουμε να δημιουργήσουμε ένα γραμμικό μοντέλο για την πρόβλεψη της Υ μέσω των ανεξάρτητων μεταβλητών

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Άσκηση 1 η Ένας παραγωγός σταφυλιών ισχυρίζεται ότι τα κιβώτια σταφυλιών που συσκευάζει

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ,

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, -- Άσκηση. Δίνονται τα παρακάτω δεδομένα 5 7 8 9 5 X 8 5 5 5 9 7 Y. 5.. 7..7.7.9.. 5.... 8.. α) Να γίνει το διάγραμμα διασποράς β) εξετάστε τα μοντέλα Υ = β + β Χ + ε, (linear),

Διαβάστε περισσότερα

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά 1. Ιστόγραμμα Δεδομένα από το αρχείο Data_for_SPSS.xls Αλλαγή σε Variable View (Κάτω αριστερά) και μετονομασία της μεταβλητής σε NormData, Type: numeric και Measure: scale Αλλαγή πάλι σε Data View. Graphs

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο Παράδειγμα 1 Ο παρακάτω πίνακας δίνει τις πωλήσεις (ζήτηση) ενός προϊόντος Υ (σε κιλά) από το delicatessen μιας περιοχής και τις αντίστοιχες τιμές Χ του προϊόντος (σε ευρώ ανά κιλό) για μια ορισμένη χρονική

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΙΧ Οικονομετρικά Πρότυπα Διαφάνεια 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Διαβάστε περισσότερα

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ. ΣΤ. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (ANALYSIS OF VARIANCE - ANOVA) ΣΤ 1. Ανάλυση ιασποράς κατά µία κατεύθυνση. Όπως έχουµε δει στη παράγραφο Β 2, όταν θέλουµε να ελέγξουµε, αν η µέση τιµή µιας ποσοτικής µεταβλητής διαφέρει

Διαβάστε περισσότερα

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία. . ΣΤΑΤΙΣΤΙΚΗ ΣΥΣΧΕΤΙΣΗ. Υπολογισµός συντελεστών συσχέτισης Προκειµένου να ελέγξουµε την ύπαρξη γραµµικής σχέσης µεταξύ δύο ποσοτικών µεταβλητών, χρησιµοποιούµε συνήθως τον παραµετρικό συντελεστή συσχέτισης

Διαβάστε περισσότερα

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Περιλαμβάνει ένα σύνολο αριθμητικών και γραφικών μεθόδων, που μας επιτρέπουν να αποκτήσουμε μια πρώτη εικόνα για την κατανομή των τιμών της μεταβλητής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Σύνολα Δεδομένων - Είδη Ποσοτικής Έρευνας: Παράλογες Ιδέες Γονέων (Δειγματοληπτική)

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα ΚΕΦΑΛΑΙΟ ΕΚΤΟ Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Στο κεφάλαιο αυτό θα ασχοληθούμε με τον έλεγχο της υπόθεσης της ισότητα δύο μέσων τιμών με εξαρτημένα δείγματα. Εξαρτημένα

Διαβάστε περισσότερα

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής Κεφάλαιο 3: Ανάλυση μιας μεταβλητής Γενικά Στο Κεφάλαιο αυτό θα παρουσιάσουμε κάποιες μεθόδους της Περιγραφικής Στατιστικής και της Στατιστικής Συμπερασματολογίας που αφορούν στην ανάλυση μιας μεταβλητής.

Διαβάστε περισσότερα

ΕΝ ΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΗΣ 2 (Εργαστήρια µαθήµατος «Στατιστικά Προγράµµατα», τµ. Στατ. & Ασφ. Επιστ., 04-05) (Επιµέλεια: Ελευθεράκη Αναστασία)

ΕΝ ΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΗΣ 2 (Εργαστήρια µαθήµατος «Στατιστικά Προγράµµατα», τµ. Στατ. & Ασφ. Επιστ., 04-05) (Επιµέλεια: Ελευθεράκη Αναστασία) ΕΝ ΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΗΣ (Εργαστήρια µαθήµατος «Στατιστικά Προγράµµατα», τµ. Στατ. & Ασφ. Επιστ., -) (Επιµέλεια: Ελευθεράκη Αναστασία) Άσκηση (Εργαστήριο #) Στις εξετάσεις Φεβρουαρίου του µαθήµατος

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Περιεχόμενα Εισαγωγή Το πρόβλημα - Συντελεστής συσχέτισης Μοντέλο απλής γραμμικής παλινδρόμησης

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ ΕΚΤΟ

Διαβάστε περισσότερα

Άσκηση 2. i β. 1 ου έτους (Υ i )

Άσκηση 2. i β. 1 ου έτους (Υ i ) Άσκηση Ο επόμενος πίνακας δίνει τους βαθμούς φοιτητών (Χ i ) στις εισαγωγικές εξετάσεις ενός κολεγίου και τους αντίστοιχους βαθμούς τους (Υ i ) στο τέλος της πρώτης χρονιάς φοίτησης στο συγκεκριμένο κολέγιο.

Διαβάστε περισσότερα

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική ΚΕΦΑΛΑΙΟ ΔΕΥΤΕΡΟ Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική Το πρώτο βήμα στην ανάλυση ενός συνόλου δεδομένων, που αποτελούν μετρήσεις ενός δείγματος είναι η παρουσίαση και σύνοψη των πληροφοριών

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S.

Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S. Σημειώσεις για το μάθημα Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S. Παπάνα Αγγελική E mail: papanagel@yahoo.gr, agpapana@gen.auth.gr Α.Τ.Ε.Ι. Θεσσαλονίκης ΠΑΡΑΡΤΗΜΑ ΚΑΤΕΡΙΝΗΣ Τμήμα Τυποποίησης και

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α εξάμηνο 2010-2011 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Ποιοτικές και Ποσοτικές μέθοδοι και προσεγγίσεις για την επιστημονική έρευνα users.sch.gr/abouras

Διαβάστε περισσότερα

1991 US Social Survey.sav

1991 US Social Survey.sav Παραδείγµατα στατιστικής συµπερασµατολογίας µε ένα δείγµα Στα παραδείγµατα χρησιµοποιείται απλό τυχαίο δείγµα µεγέθους 1 από το αρχείο δεδοµένων 1991 US Social Survey.sav Το δείγµα λαµβάνεται µε την διαδικασία

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 7: Παρουσίαση δεδομένων-περιγραφική στατιστική Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας Επικοινωνία: Πτέρυγα 4, Τοµέας Κοινωνικής Ιατρικής Εργαστήριο Βιοστατιστικής Τηλ. 4613 e-mail: biostats@med.uoc.gr thalegak@med.uoc.gr

Διαβάστε περισσότερα

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Στόχοι του κεφαλαίου Εξοικείωση με το περιβάλλον του SPSS Εξοικείωση με τις διαδικασίες περιγραφικής ανάλυσης μιας μεταβλητής Εξοικείωση με τη

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Μηχανικών Πληροφορικής (ΤΕ) Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

Διαβάστε περισσότερα

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 4ο Κατανομές Στατιστικών Συναρτήσεων Δείγμα από κανονική κατανομή Έστω Χ= Χ Χ Χ τ.δ. από Ν µσ τότε ( 1,,..., n) (, ) Τ Χ Χ Ν Τ Χ σ σ Χ Τ Χ n Χ S µ S µ 1( ) = (0,1), ( ) = ( n 1)

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ Στόχοι: (a) να δοθεί µια εισαγωγή στη θεωρία της στατιστικής συµπερασµατολογίας ελέγχων υποθέσεων, (b) να παρουσιάσει τις βασικές εφαρµογές αυτών των ελέγχων: µέσης τιµής, ποσοστού

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4Β: Έλεγχοι Κανονικότητας Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Άδειες

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ ΔΕΥΤΕΡΟ Εξερευνώντας τα

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 2. Περιγραφική Στατιστική Βασικά είδη στατιστικής ανάλυσης 1. Περιγραφική στατιστική: περιγραφή του συνόλου των δεδοµένων (δείγµατος) 2. Συµπερασµατολογία: Παραγωγή συµπερασµάτων για τα

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Πολλαπλή Παλινδρόμηση Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια

Διαβάστε περισσότερα

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές Στάθης Κλωνάρης 1. Εισαγωγή 2. Εισαγωγή Δεδομένων Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές 2. Διαχείριση μεταβλητών (Τύπος Ετικέτα, κωδικοποίηση

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΤΟΥ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

2. ΕΠΙΛΟΓΗ ΤΟΥ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ 1. ΕΙΣΑΓΩΓΗ ΣΤΟ SPSS Το SPSS είναι ένα στατιστικό πρόγραμμα γενικής στατιστικής ανάλυσης αρκετά εύκολο στη λειτουργία του. Για να πραγματοποιηθεί ανάλυση χρονοσειρών με τη βοήθεια του SPSS θα πρέπει απαραίτητα

Διαβάστε περισσότερα

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων Ενότητα: Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή Διδάσκων: Επίκ. Καθ. Απόστολος Μπατσίδης Τμήμα: Μαθηματικών ΚΕΦΑΛΑΙΟ

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο Εαρινό εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr

Διαβάστε περισσότερα

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ Κωνσταντίνος Ζαφειρόπουλος Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Μακεδονίας Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης ιαστήµατα εµπιστοσύνης και έλεγχοι υποθέσεων για τη µέση τιµή Για µια ποσοτική µεταβλητή

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 7. Παλινδρόµηση Γενικά Επέκταση της έννοιας της συσχέτισης: Πώς µπορούµε να προβλέπουµε τη µια µεταβλητή από την άλλη; Απλή παλινδρόµηση (simple regression): Κατασκευή µοντέλου πρόβλεψης

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΕΦΑΛΑΙΟ 19 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΑΝΟΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Όταν ενδιαφερόμαστε να συγκρίνουμε δύο πληθυσμούς, η φυσιολογική προσέγγιση είναι να προσπαθήσουμε να συγκρίνουμε

Διαβάστε περισσότερα

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 205-206 ΔΙΔΑΣΚΟΝΤΕΣ ΔΗΜΗΤΡΗΣ ΚΑΛΛΙΒΩΚΑΣ, ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ ) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ ΑΣΚΗΣΗ Τα παρακάτω δεδομένα αναφέρονται στη

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας Viola adorata Σκηνή Πρώτη Ερωτήσεις Σωστού-Λάθους (µέρος Ι). Ο µέσος όρος

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

6.4. LOGLINEAR 90 8.5 (MANOVA) 121

6.4. LOGLINEAR 90 8.5 (MANOVA) 121 Φ Γ SPSS Dr. υ υ α α Θ α 2012 2 1. Γ SPSS 19.0 1.1 Φ Γ SPSS 4 1.2 Φ Γ 7 1.3 9 1.4 Φ 10 1.5 Pτ ΘHKH IAΓPAΦH 16 1.6 16 1.7 17 1.8 20 1.9 22 1.10 Γ 23 1.11 Γ Φ 25 1.12 Γ 27 1.13 Θ 28 2. Γ Φ 2.1 Θ, Γ, Γ 29

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Άσκηση 1: Μια τράπεζα ενδιαφέρεται να μελετήσει την αποταμιευτική συμπεριφορά των πελατών της. Θεωρείται ως δεδομένο ότι η ετήσια αποταμίευση των πελατών της

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Περιεχόμενα Έλεγχος κανονικότητας P-P Plot και Q-Q Plot Τεστ Κανονικότητας Τεστ Κανονικότητας

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Χειμερινό εξάμηνο 2010-2011 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 Περιγραφική Στατιστική Ι users.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική Επεξεργασία Δεδομένων με το SPSS for Windows

Εισαγωγή στη Στατιστική Επεξεργασία Δεδομένων με το SPSS for Windows Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Φιλοσοφίας, Παιδαγωγικής και Ψυχολογίας Τομέας Ψυχολογίας Εισαγωγή στη Στατιστική Επεξεργασία Δεδομένων με το SPSS for Windows Επιμέλεια: Λέκτορας Βασίλης

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ-ΠΕΜΠΤΟ ΘΕΩΡΙΑΣ- ΠΟΛΛΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Σηµειώσεις: Θωµόπουλος Γιώργος Ρογκάκος Γιώργος Καθηγητής: Κουνετάς

Διαβάστε περισσότερα

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

έρευνας και στατιστική» παραμετρικές συγκρίσεις» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ & ΑΘΛΗΤΙΣΜΟΥ «Μεθοδολογία έρευνας και στατιστική» Μάθημα μεταπτυχιακού κύκλου σπουδών Διάλεξη: «Μη παραμετρικές συγκρίσεις» ΔΙΔΑΣΚΩΝ: Δρ. Αθανάσιος

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... v

Περιεχόμενα. Πρόλογος... v Περιεχόμενα Πρόλογος... v 1 Χρήση της έκδοσης 10 του SPSS για Windows και καταχώριση δεδομένων... 1 2 Περιγραφή μεταβλητών: πίνακες και γραφήματα... 19 3 Περιγραφή μεταβλητών αριθμητικά: μέσοι όροι, διακύμανση,

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ ΚΕΦΑΛΑΙO 5 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΙΣΟΤΗΤΑ ΔΥΟ ΚΑΤΑΝΟΜΩΝ Στο προηγούμενο κεφάλαιο εξετάσαμε διάφορες μορφές ελέγχου της υπόθεσης ότι ένα δείγμα παρατηρήσεων προέρχεται από κάποια συγκεκριμένη κατανομή. Στην

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011 Εργαστήριο Μαθηματικών & Στατιστικής Γραπτή Εξέταση Περιόδου Φεβρουαρίου για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 5//. [] Η ποσότητα, έστω Χ, ενός συντηρητικού που περιέχεται σε φιάλες αναψυκτικού

Διαβάστε περισσότερα

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p ΑΣΚΗΣΗ 1 ΣΕΜΦΕ 14-15 i. Έστω yi ο αριθμός των προσπαθειών κάθε μαθητή μέχρι να πετύχει τρίποντο. Ο αριθμός των προσπαθειών πριν ο μαθητής να πετύχει τρίποντο θα είναι xi = yi - 1, i = 1,,18. 2 2 3 2 1

Διαβάστε περισσότερα

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Ο παρακάτω πίνακας παρουσιάζει θανάτους από καρδιακή ανεπάρκεια ανάμεσα σε άνδρες γιατρούς οι οποίοι έχουν κατηγοριοποιηθεί κατά ηλικία

Διαβάστε περισσότερα

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F Άσκηση 0, σελ. 9 από το βιβλίο «Μοντέλα Αξιοπιστίας και Επιβίωσης» της Χ. Καρώνη (i) Αρχικά, εισάγουμε τα δεδομένα στο minitab δημιουργώντας δύο μεταβλητές: τη x για τον άτυπο όγκο και την y για τον τυπικό

Διαβάστε περισσότερα

Δείγμα πριν τις διορθώσεις

Δείγμα πριν τις διορθώσεις Εισαγωγή Α ΜΕΡΟΣ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ 1 ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Εισαγωγή 1.1.1 Περιγραφική Στατιστική (Descriptive Statistics) 1.1.2 Επαγωγική ή Αναλυτική Στατιστική (Inferential or Αnalytical Statistics)

Διαβάστε περισσότερα

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ Να δοθούν οι βασικές αρχές των µη παραµετρικών ελέγχων (non-parametric tests). Να παρουσιασθούν και να αναλυθούν οι γνωστότεροι µη παραµετρικοί έλεγχοι Να αναπτυχθεί η µεθοδολογία των

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση. Κεφάλαιο 16 Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 1 Προϋποθέσεις για τη χρήση του τεστ ιαφορές ή συσχέτιση Κλίµακα µέτρησης Σχεδιασµός Σηµείωση ιαφορές Κατηγορική Ανεξάρτητα δείγµατα

Διαβάστε περισσότερα

Labels Values Missing Values Columns, Align Measure

Labels Values Missing Values Columns, Align Measure Εισαγωγή στο SPSS Oι οριζόντιες γραμμές αντιστοιχούν στις Ν περιπτώσεις-πειραματικές μονάδες, ενώ οι κατακόρυφες στήλες στις p υπό μελέτη μεταβλητές. ΠΟΣΟΤΙΚΕΣ-ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΠΑΡΑ ΕΙΓΜΑ ΓΙΑ ΕΙΣΑΓΩΓΗ

Διαβάστε περισσότερα

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Εισαγωγή Βασικές έννοιες Επαγωγική Στατιστική Πως μπορούμε να συγκρίνουμε μεταβλητές μεταξύ τους? Διαφορά συγκρίνοντας το μέσο μιας μεταβλητής (λόγος ή διάστημα) στις ομάδες πχ. t-test

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

Απλή Ευθύγραµµη Συµµεταβολή

Απλή Ευθύγραµµη Συµµεταβολή Απλή Ευθύγραµµη Συµµεταβολή Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας, Εργαστήριο Γεωργίας Viola adorata Εισαγωγή Ανάλυση Παλινδρόµησης και Συσχέτιση Απλή

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 7 (ΛΥΣΗ) Στο αρχείο του SPSS θα υπάρχουν οι µεταβλητές,

ΑΣΚΗΣΗ 7 (ΛΥΣΗ) Στο αρχείο του SPSS θα υπάρχουν οι µεταβλητές, ΑΣΚΗΣΗ 7 (ΛΥΣΗ) Στο αρχείο του SPSS θα υπάρχουν οι µεταβλητές, Time: η ώρα γέννησης (4 ψηφία, τα δύο πρώτα είναι ώρες και τα άλλα δυο λεπτά), Sex: το φύλο (:κορίτσι, :αγόρι), Weight: το βάρος του νεογέννητου

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 5 ο 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES 5000 Daily calorie

Διαβάστε περισσότερα

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ ΔΕΟ 13 ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ 3 η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΘΕΜΑΤΑ ΘΕΜΑ 1 ο Τα δεδομένα της στήλης Grade (Αρχείο Excel, Φύλλο Ask1) αναφέρονται στη βαθμολογία 63 φοιτητών που έλαβαν μέρος σε

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11 ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 34 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: 17 Οικονομετρικά Εργαστήριο 15/5/11 ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ 7 ΕΡΓΑΣΤΗΡΙΟ ΜΗ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ Σκοπός του παρόντος µαθήµατος είναι η

Διαβάστε περισσότερα

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Θεματικές

Διαβάστε περισσότερα

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Copyright 2009 Cengage Learning 4.1 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Δείκτες Κεντρικής Θέσης [Αριθμητικός] Μέσος, Διάμεσος, Επικρατούσα

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 6: Συσχέτιση και παλινδρόμηση εμπειρική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης

Διαβάστε περισσότερα

Lampiran 1 Output SPSS MODEL I

Lampiran 1 Output SPSS MODEL I 67 Variables Entered/Removed(b) Lampiran 1 Output SPSS MODEL I Model Variables Entered Variables Removed Method 1 CFO, ACCOTHER, ACCPAID, ACCDEPAMOR,. Enter ACCREC, ACCINV(a) a All requested variables

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΟ ΠΡΟΓΡΑΜΜΑ SPSS FOR WINDOWS

ΕΙΣΑΓΩΓΗ ΣΤΟ ΠΡΟΓΡΑΜΜΑ SPSS FOR WINDOWS ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΤΟΜΕΑΣ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟ ΠΡΟΓΡΑΜΜΑ SPSS FOR WINDOWS ΦΑΧΙΡΙΔΗΣ ΓΕΩΡΓΙΟΣ ΤΟ ΠΡΟΓΡΑΜΜΑ

Διαβάστε περισσότερα