(i) Περιγραφική ανάλυση των μεταβλητών PRICE

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "(i) Περιγραφική ανάλυση των μεταβλητών PRICE"

Transcript

1 Με τις εντολές > data <- matrix(scan(file=" na.strings="*"), ncol=5, byrow=t) Read 585 items > fdata<-as.data.frame(data) > names(fdata)=c("price", "SQFT", "AGE", "NE", "COR") αρχικά εισάγονται τα δεδομένα του αρχείου που έχει οριστεί στην παράμετρο 'file' ανά γραμμή (byrow=t) σε έναν πίνακα 5 στηλών (ncol=5) και καταχωρούνται στη μεταβλητή 'data'. Παράλληλα, ο χαρακτήρας '*' που στο αρχείο συμβολίζει τις αγνοούμενες τιμές αντικαθίσταται από το αλφαριθμητικό 'ΝΑ', διότι με αυτή τη συμβολοσειρά «αναγνωρίζει» η R την ύπαρξη αγνοούμενης τιμής (na.strings="*"). H R, μετά την διεκπαιρέωση αυτής της διαδικασίας, ενημερώνει τον χρήστη εμφανίζοντας στην οθόνη ένα μήνυμα για το πλήθος των στοιχείων που «διαβάστηκαν». Έπειτα, σε μια νέα μεταβλητή με το όνομα 'fdata' καταχωρούνται τα ίδια δεδομένα, αλλά σε μορφή πλαισίου δεδομένων και όχι πίνακα. Τέλος, θέλοντας να δώσουμε όνομα σε κάθε στήλη του πλαισίου, χρησιμοποιούμε την εντολή 'names'. (i) Περιγραφική ανάλυση των μεταβλητών PRICE Με μία εντολή η R μπορεί να μας εμφανίσει διάφορα μέτρα θέσης και μεταβλητότητας του δείγματός μας. > summary(fdata['price']) PRICE Min. : 540 1st Qu. : 780 Median : 960 Mean :1063 3rd Qu. :1200 Max. :2150 Έχουμε στη σειρά την ελάχιστη τιμή, το πρώτο τεταρτημόριο, τη διάμεσο, τον μέσο, το τρίτο τεταρτημόριο και τη μέγιστη τιμή του δείγματός μας. Η δειγματική τυπική απόκλιση είναι > sd(fdata['price']) PRICE Για τον σχεδιασμό του ιστογράμματος της μεταβλητής PRICE, στην πρώτη παράμετρο της παρακάτω εντολής χρησιμοποιούμε την πρώτη στήλη του πλαισίου δεδομένων fdata, επειδή σ'αυτήν αντιστοιχεί η συγκεκριμένη μεταβλητή. > hist(fdata[,1], labels=t,xlab="pirce ($)", ylab="frequency", main="histogram of PRICE") Οι παράμετροι xlab, ylab και main καθορίζουν τους τίτλους του γραφήματος, ενώ με την λογική παράμετρο labels μπορούμε να καθορίσουμε αν στο γράφημα θα φαίνεται η

2 συχνότητα για κάθε κλάση του ιστογράμματος. Από τον δειγματικό μέσο, τη δειγματική διάμεσο και το ιστόγραμμα, μπορούμε να συμπεράνουμε χονδρικά ότι περισσότερα σπίτια είναι φθηνά παρά ακριβά, σε σχέση με τις τιμές του δείγματος. SQFT Εκτελούμε τις ίδιες αριθμητικές και γραφικές μεθόδους για τη μεταβλητή SQFT. > summary(fdata['sqft']) SQFT Min. : 837 1st Qu. :1280 Median :1549 Mean :1654 3rd Qu. :1894 Max. :3750 > sd(fdata['sqft']) SQFT > hist(fdata[,2], labels=t, xlab="sqare feet of houses", ylab="frequency", main="histogram of square feet") Στην εντολή hist για τον σχεδιασμό του ιστογράμματος χρησιμοποιούμε τη δεύτερη στήλη του πλαισίου δεδομένων fdata, αφού σ'αυτήν αντιστοιχούν οι τιμές της SQFT. Αν και η τυπική απόκλιση είναι μεγάλη *, βλέπουμε ότι το 77,8% των σπιτιών του δείγματός μας κυμαίνεται μεταξύ 1000 και 2000 τετραγωνικών ποδιών. Κάτι που σημαίνει ότι το μεγαλύτερο μέρος των τιμών στο δείγμα μας είναι συγκεντρωμένο στο συγκεκριμένο διάστημα και λίγα σπίτια είναι αυτά που ξεφεύγουν έξω από τα όριά του. Επίσης, παρατηρούμε ότι η δειγματική διάμεσος και ο δειγματικός μέσος βρίσκονται αρκετά κοντά στο μέσο του διαστήματος αυτού. * Ίσως ένας διαισθητικός τρόπος εκτίμησης του μεγέθους της δειγματικής τυπικής απόκλισης είναι η σύκρισή του με το εύρος του δείγματος. Στην περίπτωσή μας, η δειγματική τυπική απόκλιση αποτελεί περίπου το ένα πέμπτο του εύρους του δείγματος.

3 AGE Στη μεταβλητή αυτή αντιστοιχεί η τρίτη στήλη του πλαισίου δεδομένων 'fdata'. Να επισημάνουμε, ότι η μεταβλητή αυτή περιέχει αγνοούμενες τιμές. > summary(fdata['age']) AGE Min. : st Qu. : 5.75 Median :13.00 Mean : rd Qu. :19.25 Max. :53.00 NA's :49.00 > sd(fdata['age'], na.rm=t) AGE Στα αποτελέσματα της εντολής summary, εμφανίζεται άλλο ένα πεδίο, το 'NAs', το οποίο δείχνει το πλήθος των αγνοούμενων τιμών. Επίσης σε αντίθεση με τις υπόλοιπες μεταβλητές, στην εντολή sd για τον υπολογισμό της δειγματικής τυπικής απόκλισης, χρειάστηκε να καθοριστεί ως 'Αληθής' η λογική παράμετρος na.rm (της οποίας η προεπιλεγμένη τιμή είναι 'Ψευδής') ώστε η R να μην λάβει υπόψη της τις αγνοούμενες τιμές. Διαφορετικά, δεν θα μπορούσε να υπολογιστεί η δειγματική τυπική απόκλιση. Η εντολή για τον σχεδιασμό του θηκογραφήματος είναι η παρακάτω και το θηκογράφημα φαίνεται στο σχήμα. > boxplot(fdata['age'], main="boxplot for AGE") Παρατηρούμε ότι υπάρχουν περισσότερα σπίτια εώς 20 ετών, παρά παλαιότερα. Μάλιστα, μέχρι και το τρίτο τεταρτημόριο του δείγματος έχει τιμή μικρότερη του 20. Επίσης, ο δειγματικός μέσος, όπως φαίνεται από τα αποτελέσματα της εντολής summary, έχει χαμηλή τιμή, μικρότερη του 20. Έτσι, το μεγαλύτερο μέρος των τιμών της μεταβλητής είναι συγκεντρωμένο στο διάστημα [1,20]. Από προεπιλογή, οι αγνοούμενες τιμές δεν λαμβάνονται υπόψη. ΝΕ Οι τιμές αυτής της μεταβλητής βρίσκονται στην τέταρτη στήλη του πλαισίου δεδομένων fdata. Επειδή πρόκεται για κατηγορική μεταβλητή, δεν έχουν νόημα οι αριθμητικές και γραφικές μέθοδοι που χρησιμοποιήθηκαν για τις προηγούμενες μεταβλητές. Έχει νόημα, όμως, ο υπολογισμός του πίνακα συχνοτήτων και σχετικών συχνοτήτων, καθώς και ο σχεδιασμός του τομεογράμματος. Αυτά στην R γίνονται μέσω τον εντολών table (συχνότητες), prop.table

4 (σχετικές συχνότητες) και pie (τομεόγραμμα), όπως φαίνεται στις επόμενες γραμμές. > table(fdata['ne']) > prop.table(table(fdata['ne'])) Οι πληροφορίες του πίνακα σχετικών συχνοτήτων μπορούν να παρουσιαστούν γραφικά με το τομεόγραμμα, όπως αναφέρθηκε παραπάνω. > pie(table(fdata['ne']), main="pie for NE", labels=c("not NE", "NE"), col=c("thistle", "thistle4"), radius=1) Ο πίνακας σχετικών συχνοτήτων και το τομεόγραμμα μας δείχνουν ότι το 66.7% των σπιτιών του δείγματος βρίσκονται στη Βορειοδυτική πλευρά της πόλης. Με την παράμετρο labels δίνονται ταμπέλες-ονόματα για κάθε κυκλικό τομέα του γραφήματος και με την col καθορίζονται τα χρώματά του. Η παράμετρος radius χρησιμοποιήθηκε για καθαρά αισθητικούς λόγους, ώστε οι διαστάσεις του να μεγαλώσουν. COR Η πέμπτη στήλη του πλαισίου δεδομένων fdata αντιστοιχεί στη κατηγορική μεταβλητή COR, η οποία περιγράφει αν το σπίτι είναι γωνιακό (1) ή όχι (0). Θα χρησιμοποιηθούν οι ίδιες αριθμητικές και γραφικές μέθοδοι που χρησιμοποιήθηκαν και στην προηγούμενη μεταβλητή (NE). > table(fdata['cor']) > prop.table(table(fdata['cor'])) Βλέπουμε ότι μόνο το 18.8% των σπιτιών είναι γωνιακά. Η γραφική αναπαράσταση της πληροφορίας αυτής μπορεί να γίνει με τομεόγραμμα, όπως φαίνεται δεξιά. Στην εντολή της R για τον σχεδιασμό του γραφήματος, χρησιμοποιούνται οι ίδιες παράμετροι. > pie(table(fdata['cor']), main="pie for COR", col=c("wheat3", "wheat"), labels=c("not COR", "COR"), radius=1) (ii) Τυχαία επιλογή δείγματος από το πλαίσιο δεδομένων fdata Στην R, υπάρχει η δυνατότητα να διαγράψουμε από το πλαίσιο δεδομένων fdata όλες τις γραμμές που ένα τουλάχιστον στοιχείο τους είναι αγνοούμενη τιμή. Kαταχωρούμε το νέο αυτό πλαίσιο δεδομένων σε μια νέα μεταβλητή, την fdata1, ώστε να μην «χαθεί» το αρχικό μας πλαίσιο δεδομένων.

5 > fdata1<-na.omit(fdata) Για την τυχαία επιλογή γραμμών από το νέο πλαίσιο δεδομένων fdata1, δίνουμε σε κάθε γραμμή έναν αύξοντα αριθμό. Από το διάνυσμα αυτό που περιέχει τους αύξοντες αριθμούς, η sample «διαλέγει» 65, με την παρακάτω εντολή. > inc<-sample(1:nrow(fdata1),65) Η εντολή nrow επιστρέφει τον αριθμό των γραμμών της fdata1. Έτσι, με την εντολή sample επιλέχθηκαν τυχαία 65 στοιχεία από το διάνυσμα που περιέχει τους αύξοντες αριθμούς των γραμμών του fdata1. Μένει τώρα να κατασκευάσουμε έναν πίνακα ο οποίος θα περιέχει τα στοιχεία του fdata1 εκείνα που αντοιστοιχούν στις γραμμές που «επιλέχθηκαν» από την R μέσω της sample και καταχωρήθηκαν στο διάνυσμα inc. Ο κώδικας για την υλοποίηση αυτής της διαδικασίας είναι ο παρακάτω. > samp<-matrix(ncol=5, nrow=65) > for (k in 1:length(inc)){ + for (j in 1:5){ + samp[k,j]<-fdata1[inc[k],j] + } + } Αρχικά, δημιουργεί έναν πίνακα 5 στηλών (ncol=5) και 65 γραμμών (nrow=65), όλα τα στοιχεία του οποίου είναι αγνοούμενες τιμές (έχουν τιμή NA) από προεπιλογή. Έπειτα, ξεκινάει βρόγχος for, ο οποίος επαναλαμβάνεται τόσες φορές όσα είναι τα στοιχεία του διανύσματος inc, δηλαδή 65 φορές. Μέσα στον βρόγχο αυτό, έχουμε άλλον έναν βρόγχο for ο οποίος αντικαθιστά κάθε γραμμή του αρχικοποιημένου πίνακα samp με τα στοιχεία της γραμμής του fdata που αντιστοιχεί στον αύξοντα αριθμό που περιέχεται στο k-οστό στοιχείο του inc. Έτσι, ο πίνακας samp αποτελεί το δείγμα πάνω στο οποίο θα εργαστούμε από εδώ και στο εξής. Κατά την αρχικοποίηση του πίνακα samp, θα μπορούσαμε να δώσουμε οποιαδήποτε άλλη τιμή στα στοιχεία του (για παράδειγμα, το μηδέν). Σε κάθε περίπτωση, το αποτέλεσμα θα ήταν το ίδιο, αφού όλα τα στοιχεία στο τέλος αντικαθίστανται και παίρνουν συγκεκριμένες τιμές. (iii-iv) Προσαρμογή απλού γραμμικού μοντέλου στις μεταβλητές 'PRICE' (μεταβλητή απόκρισης) και 'SQFT' (επεξηγηματική μεταβλητή) Για λόγους ευκολίας, ας δημιουργήσουμε δύο νέα διανύσματα price και sqft στα οποία θα καταχωρηθούν τα δεδομένα του δείγματός μας για τις μεταβλητές PRICE και SQFT, όπου η πρώτη αντιστοιχεί στην πρώτη στήλη και η δεύτερη στη δεύτερη στήλη του πίνακα samp. > price<- samp[,1] > sqft<- samp[,2] Προσαρμόζουμε τα απλό γραμμικό μοντέλο στα δεδομένα αυτά και καταχωρούμε τα αποτελέσματα σε μια μεταβλητή με όνομα 'res'. > res <- lm(price~sqft) Το διάγραμμα διασποράς και η ευθεία ελαχίστων τετραγώνων σχεδιάζονται με τις παρακάτω εντολές και φαίνονται στο επόμενο σχήμα. > plot(sqft, price, xlab="square Feet", ylab="price ($)", main="plot for PRICE and SQFT and Least Sqare Line") > abline(res) Από το διάγραμμα, η χρήση του απλού γραμμικού μοντέλου ως μοντέλου παλινδρόμησης για τις μεταβλητές αυτές φαίνεται να ευσταθεί.

6 Πληκτρολογώντας 'res' στη γραμμή εντολών του R, εμφανίζονται επιγραμματικά τα αποτελέσματα της προσαρμογής του απλού γραμμικού μοντέλου στα δεδομένα μας. > res Call: lm(formula = price ~ sqft) Coefficients: (Intercept) sqft Οι εκτιμήτριες a και b των συντελεστών του μοντέλου, όπου Y = a b X, είναι a= και b=0.71. Αυτό σημαίνει ότι η αναμενόμενη τιμή αυξάνεται κατά περίπου 0.71 χιλιάδες δολάρια, όταν η τιμή Y του Χ αυξάνεται κατά ένα τετραγωνικό πόδι (square foot). Ενώ, ο μέσος όρος του είναι περίπου -82 χιλιάδες δολάρια, όταν Χ=0. Προφανώς, Y η ερμηνεία της στην περίπτωσή μας είναι καθαρά θεωρητική, αφού a δεν υπάρχει σπίτι μηδενικής έκτασης, δηλαδή δεν γίνεται η τυχαία μεταβλητή Χ να πάρει τιμή 0. Η κατασκευή 95% διαστημάτων εμπιστοσύνης για τις εκτιμήτριές μας γίνεται ως εξής. > confint(res) 2.5 % 97.5 % (Intercept) sqft Στην εντολή αυτή δεν χρειάστηκε να δοθεί κάποια παράμετρος για τον συντελεστή εμπιστοσύνης, καθώς από προεπιλογή είναι 95%. Το διάστημα εμπιστοσύνης για την παράμετρο a είναι [ , ], ενώ για την παράμετρο b είναι [0.6167, ]. Μια αναλυτικότερη παρουσίαση των αποτελεσμάτων της προσαρμογής του απλού γραμμικού μοντέλου στα δεδομένα μας γίνεται με την παρακάτω εντολή. > summary(res) Call: lm(formula = price ~ sqft) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) sqft <2e-16 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 63 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 63 DF, p-value: < 2.2e-16 Το πεδίο «Call» δείχνει ότι το δείγμα από το οποίο αντλήθηκαν πληροφορίες για τον

7 προσδιορισμό των συντελεστών του μοντέλου και γενικότερα για την προσαρμογή του απλού γραμμικού μοντέλου είναι τα ζεύγη (PRICE i, SQFT i ), i=1,2,...,65. Το πεδίο «Residuals» αναφέρεται στα υπόλοιπα που προέκυψαν από τη διαδικασία προσαρμογής του μοντέλου πάνω στο δείγμα. Στη σειρά, δείχνει το ελάχιστο, το πρώτο τεταρτημόριο, τη διάμεσο, το τρίτο τεταρτημόριο και το μέγιστο των υπολοίπων. Το πεδίο «Coefficients» δίνει τα αποτελέσματα για την εκτίμηση των συντελεστών μας, το τυπικό τους σφάλμα, τα στατιστικά ελέγχου για το καθένα και την Ρ-τιμή τους για τους ελέγχους υποθέσεων (i) H a0 : a=0 με εναλλακτική H a1 : a 0 και (ii) H b0 : b=0 με εναλλακτική H b1 : b 0. Βλέπουμε ότι η Ρ-τιμή της (i) δεν μας επιτρέπει να απορρίψουμε τη μηδενική υπόθεση ότι η a=0, ενώ με την Ρ-τιμή της (ii) αποδεχόμαστε την εναλλακτική ότι η b είναι διάφορη του μηδενός. Τα αποτελέσματα αυτά επαληθεύονται και από τα διαστήματα εμπιστοσύνης που κατασκευάστηκαν προηγουμένως, όπου το διάστημα εμπιστοσύνης για την a περιέχει το μηδέν, ενώ αυτό για την b δεν περιέχει το μηδέν. Το πεδίο «Signif. codes» δίνει μια επεξήγηση των αστεριών που φαίνονται δεξιά από τις Ρ- τιμές του προηγούμενου πεδίου, τα οποία αστέρια αποτελούν μια γραφική αναπαράσταση του επιπέδου σημαντικότητας του κάθε ελέγχου. Στα πεδία που ακολουθούν το «Signif. codes», βλέπουμε ότι το τυπικό σφάλμα της παλινδρόμησης είναι χιλιάδες δολάρια και ακολουθεί κατανομή Student με 63 βαθμούς ελευθερίας. Ο συντελεστής προσδιορισμού είναι 0.79, ενώ ο διορθωμένος συντελεστής προσδιορισμού είναι Οι τρεις αυτές τιμές, αποτελούν μέτρα για το κατά πόσο καλή προσαρμογή του γραμμικού μοντέλου έχουμε στα δεδομένα μας. Στην τελευταία γραμμή εμφανίζονται τα αποτελέσματα του F ελέγχου για τον έλεγχο της υπόθεσης (ii), όπου βλέπουμε ότι το στατιστικό ελέγχου έχει τιμή και ακολουθεί Snedecor με 1 και 63 βαθμούς ελευθερίας και η Ρ-τιμή είναι , αρκετά μικρή, ώστε για ακόμα μια φορά να απορριφθεί η μηδενική υπόθεση ότι b=0. (v) Έλεγχος προϋποθέσεων του απλού γραμμικού μοντέλου που προσαρμόσαμε παραπάνω Γραμμικότητα Η προϋπόθεση της γραμμικότητας ελέγχθηκε παραπάνω με τον σχεδιασμό του διαγράμματος διασποράς και της ευθείας ελαχίστων τετραγώνων. Ομοσκεδαστικότητα Από τα παρακάτω διαγράμματα, όπου το αριστερό δείχνει την τιμή της επεξηγηματικής μεταβλητής και το δεξί τις προβλεπόμενες τιμές και τα δύο συναρτήσει των υπολοίπων, βλέπουμε ότι η υπόθεση της ομοσκεδαστικότητας ισχύει, αφού τα σημεία δεν ακολουθούν κάποιον συστηματικό τρόπο συμπεριφοράς. > par(mfrow=c(1,2)) > plot(res$res, res$fitted, main="(res, fitted)") > plot(res$res, sqft, main="(res, sqft)") Με την πρώτη εντολή, ανοίγει ένα παράθυρο με δύο «θέσεις» για γραφήματα. Με τη δεύτερη εντολή κατασκευάζεται το διάγραμμα των υπολοίπων συναρτήσει των προβλεπόμενων τιμών και αυτομάτως μπαίνει στην «πρώτη θέση» (δεξιά) του παραθύρου και με την τρίτη εντολή κατασκευάζεται το διάγραμμα των υπολοίπων συναρτήσει των τιμών της επεξηγηματικής μεταβλητής και μπαίνει στη «δεύτερη θέση» (αριστερά). Και στις δύο εντολές plot, η παράμετρος main ορίζει τον τίτλο του γραφήματος.

8 Διαγράμματα της επεξηγηματικής μεταβλητής και το δεξί τις προβλεπόμενες τιμές και τα δύο συναρτήσει των υπολοίπων Ανεξαρτησία των σφαλμάτων Η προϋπόθεση αυτή ελέγχεται με το παρακάτω γράφημα, όπου εμφανίζονται τα υπόλοιπα με τη σειρά των δεδομένων μας. Η τυχαιότητα των σημείων του γραφήματος είναι φανερή και έτσι εξασφαλίζεται η ισχύς της υπόθεσης της ανεξαρτησίας των σφαλμάτων. > plot(res$res, main="plot for residuals", ylab="residuals")

9 Κανονικότητα των σφαλμάτων Μένει να ελέγξουμε την κανονικότητα των σφαλμάτων. Για τον σκοπό αυτό σχεδιάζουμε το γράφημα των δειγματικών ποσοστημορίων των σφαλμάτων σε σύγκριση με τα θεωρητικά ποσοστημόρια της Κανονικής Κατανομής. > qqnorm(res$res) > qqline(res$res) Οι αποκλίσεις των δειγματικών ποσοστημορίων από τα θεωρητικά δεν είναι μεγάλες. Έτσι μπορεί να υποτεθεί η κανονικότητα των σφαλμάτων. Όλες οι προϋποθέσεις, λοιπόν, για την χρήση του απλού γραμμικού μοντέλου στα δεδομένα μας ικανοποιούνται. (vi-vii) Προσαρμογή γενικού γραμμικού μοντέλου στο δείγμα Η μεταβλητή απόκρισης είναι η PRICE, ενώ οι υπόλοιπες είναι επεξηγηματικές. Εκτός από τις PRICE και SQFT, για τις οποίες ήδη υπάρχουν διανύσματα, δημιουργούμε, για δική μας διευκόλυνση, διανύσματα και για τις άλλες τρεις μεταβλητές, όπου η κάθε μια αντιστοιχεί σε μια στήλη της samp. > age <- samp[,3] > ne <- samp[,4] > cor <- samp[,5] Οι μεταβλητές ΝΕ και COR είναι κατηγορικές με δύο κατηγορίες η κάθε μία. Επομένως, σε κάθε κατηγορική μεταβλητή αντιστοιχεί μία μόνο εικονική μεταβλητή. Αν θεωρήσουμε ότι η κατηγορία αναφοράς για τη ne είναι «το σπίτι δεν βρίσκεται στην βορειοδυτική πλευρά της πόλης», που αντιστοιχεί στην τιμή 0, και ότι για την cor είναι «δεν είναι γωνιακό σπίτι», που αντιστοιχεί πάλι στη τιμή 0, τότε δεν υπάρχει ουσιαστικός λόγος να δημιουργηθούν οι εικονικές μεταβλητές. H R θα βγάλει τα ίδια αποτελέσματα. Η εντολή της R που θα προσαρμόσει το γενικό γραμμικό μοντέλο στα δεδομένα μας είναι > mod <- lm(price ~ sqft + age + ne + cor) Έτσι, εκτιμώνται οι παράμετροι a,b sqft,b age,b ne και b cor, του μοντέλου PRICE=a b sqft SQFT b age AGE b ne NE b cor COR. Η παράμετρος a, εκφράζει το μέσο της τιμής των σπιτιών, αν είναι μηδενικών τετραγωνικών μέτρων, νεόχτιστα (μηδενικής ηλικίας), εκτός βορειοδυτικής πλευράς της πόλης και μη γωνιακά. Φυσικά, η ερμηνεία της παραμέτρου αυτής μένει στο θεωρητικό επίπεδο μόνο, αφού πρακτικά δεν μπορούν να υπάρξουν σπίτια μηδενικής έκτασης. Η παράμετρος b sqft εκφράζει τη μεταβολή της τιμής ενός σπιτιού, αν μεταβληθεί η SQFT κατά μία μονάδα και όλες οι υπόλοιπες μεταβλητές παραμείνουν σταθερές. Αντίστοιχα, η b age εκφράζει τη μεταβολή της τιμής ενός σπιτιού, αν η AGE μεταβληθεί κατά μία

10 μονάδα και οι υπόλοιπες μεταβλητές μείνουν ίδιες. Η b ne (αντίστοιχα, b cor )εκφράζει τη μεταβολή της τιμής ενός σπιτιού αν η μεταβλητή ΝΕ (αντίστοιχα, COR) αλλάξει τιμή (από 0 γίνει 1 ή αντίστροφα) και όλες οι υπόλοιπες μείνουν ίδιες. Επειδή η κατηγορία αναφοράς είναι η 0, μια αλλαγή της τιμής της κατηγορικής μεταβλητής από το 0 στο 1, έχει ως αποτέλεσμα μεταβολή της τιμής του σπιτιού, PRICE, κατά b ne ή b cor (ανάλογα σε ποια μεταβλητή αναφερόμαστε), ενώ μια μεταβολή από το 1 στο 0, μεταβάλλει την PRICE κατά b ne ή b cor. Η κατασκευή 95% διαστημάτων εμπιστοσύνης για τις εκτιμήτριες των παραμέτρων γίνεται με την εντολή > confint(mod) 2.5 % 97.5 % (Intercept) sqft age ne cor Βλέπουμε, ότι τα διαστήματα εμπιστοσύνης για την εκτίμηση των παραμέτρων a,b age,b ne και b cor περιέχουν το 0, που σημαίνει ότι σε έναν έλεγχο για κάθε μία από αυτές τις παραμέτρους (ξεχωριστά από τις υπόλοιπες) της υπόθεσης να είναι μηδενική με εναλλακτική να μην είναι, δεν θα μπορούμε να απορρίψουμε τη μηδενική. Με την εντολή summary η R παρουσιάζει λεπτομέρειες για την προσαρμογή του γενικού γραμμικού μοντέλου στα δεδομένα μας. > summary(mod) Call: lm(formula = price ~ sqft + age + ne + cor) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) sqft <2e-16 *** age ne cor Signif. codes: 0 *** ** 0.01 * Residual standard error: on 60 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 4 and 60 DF, p-value: < 2.2e-16 Στο πεδίο «Call» εμφανίζονται βασικά στοιχεία του μοντέλου που εφαρμόσαμε. Με μεταβλητή απόκρισης την price και επεξηγηματικές όλες τις υπόλοιπες, εφαρμόσαμε το γενικό γραμμικό μοντέλο. Στο πεδίο «Residuals» εμφανίζονται μέτρα θέσης και μεταβλητότητας για τα υπόλοιπα του μοντέλου. Στη σειρά είναι το ελάχιστο, το πρώτο τεταρτημόριο, η διάμεσος, το τρίτο τεταρτημόριο και το μέγιστο των υπολοίπων. Στο πεδίο «Coefficients» εμφανίζεται ένας πίνακας που στην κάθε του γραμμή δείχνει την εκτίμηση, το τυπικό της σφάλμα, την τιμή του στατιστικού ελέγχου και την Ρ-τιμή της εκτίμησης της κάθε παραμέτρου. Στην πρώτη γραμμή (Intercept) είναι τα στοιχεία της εκτίμησης a της παραμέτρου a, στις επόμενες γραμμές έχουμε στη σειρά τα στοιχεία για την εκτίμηση των b sqft,b age,b ne και b cor. Στο τέλος του πεδίου αυτού, η γραμμή «Signif. codes» επεξηγεί τον συμβολισμό (αστεράκια ή τελείες) που υπάρχει δεξιά από την Ρ-τιμή κάθε εκτιμώμενης

11 παραμέτρου. Στις τελευταίες τρεις γραμμές παίρνουμε πληροφορίες για το τυπικό σφάλμα των υπολοίπων, τον συντελεστή προσδιορισμού, τον διορθωμένο συντελεστή προσδιορισμού και τον F-έλεγχο της υπόθεσης H 0 : b sqft =b age =b ne =b cor =0 με εναλλακτική ότι τουλάχιστον μία παράμετρος είναι μη μηδενική. Το τυπικό σφάλμα των υπολοίπων έχει τιμή και ακολουθεί κατανομή Student με 60 βαθμούς ελευθερίας. Ο συντελεστής προσδιορισμού είναι 0.81 και ο διορθωμένος είναι Αρκετά υψηλές τιμές που μας δείχνουν ότι η προσαρμογή του μοντέλου είναι καλή. Στον έλεγχο της υπόθεσης H 0 μέσω του F-ελέγχου, το στατιστικό ελέγχου έχει τιμή και ακολουθεί κατανομή Snedecor με 4 και 60 βαθμούς ελευθερίας, ενώ η Ρ-τιμή είναι , κάτι που δεν μας επιτρέπει να αποδεχτούμε την μηδενική υπόθεση. (viii) Έλεγχος προϋποθέσεων για την προσαρμογή του γενικού γραμμικού μοντέλου Γραμμικότητα Στην περίπτωση που οι επεξηγηματικές μεταβλητές είναι μεταξύ τους ασυσχέτιστες, ο έλεγχος της γραμμικότητας στο γενικό γραμμικό μοντέλο παλινδρόμησης μπορεί να γίνει όπως και στο απλό γραμμικό μοντέλο, για κάθε επεξηγηματική μεταβλητή. Αν όμως οι επεξηγηματικές μεταβλητές συσχετίζονται, τότε ελέγχουμε τη γραμμικότητα των μερικών υπολοίπων της κάθε μιας επεξηγηματικής μεταβλητής σε σχέση με τις τιμές της μεταβλητής αυτής. Αυτό επιτυγχάνεται με τον σχεδιασμό, σε ένα γράφημα, των ζευγών (x i, p i ), όπου x i οι τιμές της επεξηγηματικής μεταβλητής και p i τα μερικά της υπόλοιπα. Βέβαια, ο έλεγχος της γραμμικότητας μεταξύ μιας ποσοτικής (είτε πρόκειται για μερικό υπόλοιπο, είτε για μεταβλητή απόκρισης) και μιας κατηγορικής μεταβλητής δεν έχει νόημα, αφού η μία παίρνει τιμές από ένα συνεχές πεδίο άπειρων σημείων, ενώ η άλλη παίρνει τιμές από ένα διακριτό πεδίο πεπερασμένου πλήθους σημείων. Άλλωστε, αυτό φαίνεται και με τον σχεδιασμό ενός γραφήματος (x i, p i ) από το γεγονός ότι το γράφημα θα έχει σημεία μόνο πάνω στις ευθείες x=0 και x=1. Συμπερασματικά, ο έλεγχος της γραμμικότητας έχει κάποια ουσία μόνο για τις SQFT και AGE που είναι οι ποσοτικές επεξηγηματικές μεταβλητές του δείγματός μας. Όπως φαίνεται παρακάτω, οι μεταβλητές αυτές δεν είναι ασυσχέτιστες, αφού ο συντελεστής συσχέτισής τους δεν είναι μηδενικός. > cor(sqft, age) [1] Επομένως, προχωράμε με τον έλεγχο γραμμικότητας των μερικών τους υπολοίπων, πληκτρολογώντας τις παρακάτω εντολές, και τα αποτελέσματα φαίνονται στα επόμενα γραφήματα, στα οποία παρατηρούμε ότι και για τις δύο μεταβλητές η υπόθεση της γραμμικότητας είναι εύλογη. > par(mfrow=c(1,2)) > plot(sqft,residuals(mod, "partial")[,1], xlab="sqft", ylab="partial residuals", main="linearity Check for SQFT") > plot(age,residuals(mod, "partial")[,2], xlab="age", ylab="partial residuals", main="linearity check for AGE") Τα σημεία των παρακάτω δύο διαγραμμάτων ακολουθούν στατιστικά γραμμική συμπεριφορά, επομένως η προϋπόθεση της γραμμικότητας ισχύει.

12 Κανονικότητα των σφαλμάτων Η προϋπόθεση αυτή μπορεί να ελεγχθεί με το γράφημα των δειγματικών ποσοστημορίων των σφαλμάτων σε σύγκριση με τα θεωρητικά ποσοστημόρια της Κανονικής Κατανομής, αλλά και με την εντολή density. Ο πρώτος τρόπος μας δίνει τα αποτελέσματα που φαίνονται στο σχήμα αριστερά. > qqnorm(mod$res) > qqline(mod$res) Τα αποτελέσματα του δεύτερου τρόπου φαίνονται στο επόμενο σχήμα δεξιά. > plot(density(mod$res), main="density of errors")

13 Παρατηρούμε ότι η συνάρτηση κατανομής που ακολουθούν τα σφάλματα μοιάζει πολύ με την Κανονική Συνάρτηση Κατανομής. Επίσης, τα δειγματικά ποσοστημόρια του προηγούμενου γραφήματος δεν αποκλίνουν πολύ από τα θεωρητικά. Και με τους δύο τρόπους γίνεται φανερό ότι τα σφάλματα που προέκυψαν από την προσαρμογή του γενικού γραμμικού μοντέλου στα δεδομένα μας ακολουθούν με πολύ καλή προσέγγιση την Κανονική Κατανομή. Ομοσκεδαστικότητα Η ομοσκεδαστικότητα των σφαλμάτων ικανοποιείται όταν η διασπορά τους είναι σταθερή και ανεξάρτητη της τιμής της επεξηγηματικής μεταβλητής. Αυτό μπορεί να φανεί μέσω ενός γραφήματος των σφαλμάτων σε συνάρτηση με τις αναμενόμενες τιμές της PRICE για τις επεξηγηματικές μεταβλητές που παρατηρήθηκαν. Βλέπουμε ότι τα σημεία του γραφήματος είναι ακανόνιστα και δεν ακολουθούν κάποια συγκεκριμένη συμπεριφορά, άρα η προϋπόθεση ικανοποείται. > plot(mod$fitted, mod$res, main="(fitted, residuals)", xlab="fitted", ylab="residuals")

14 Ανεξαρτησία των σφαλμάτων Το ίδιο τυχαία και ακανόνιστα είναι και τα σημεία του δεξιά γραφήματος, όπου απεικονίζει τα σφάλματα σε σχέση με τη σειρά των δεδομένων. Έτσι και η υπόθεση της ανεξαρτησίας των σφαλμάτων ικανοποιείται. > plot(mod$res, main="residuals in the order of our data", ylab="residuals") Όλες, λοιπόν, οι προϋποθέσεις για την προσαρμογή του γενικού γραμμικού μοντέλου στα δεδομένα μας ισχύουν. (ix) Πρόβλεψη τιμής πάνω στο γενικό γραμμικό μοντέλο που προσαρμόσαμε Θέλουμε να προβλέψουμε την τιμή ενός σπιτιού μη γωνιακού, 2500 τετραγωνικών ποδιών, ηλικίας 5 ετών, που βρίσκεται στη βορειοδυτική πλευρά της πόλης. Αυτό σημαίνει, ότι δίνουμε τις τιμές αυτές στις επεξηγηματικές μεταβλητές και, με βάση τις εκτιμήσεις των συντελεστών του μοντέλου που έχουμε κάνει, υπολογίζουμε την αναμενόμενη τιμή της μεταβλητής απόκρισης PRICE. Συγκεκριμένα, θέτουμε SQFT=2500, AGE=5, COR=0 και NE=1. Παράλληλα, θέλουμε να υπολογίσουμε και ένα 95% διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή. Η διαδικασία αυτή μπορεί να γίνει με την εντολή predict της R, η οποία, εκτός από την αναμενόμενη τιμή, μας δίνει και ένα διάστημα εμπιστοσύνης με το επίπεδο σημαντικότητας που ορίζουμε εμείς. Η εντολή που δίνουμε στην R είναι η παρακάτω. Στην πρώτη παράμετρο θέτουμε το προσαρμοσμένο γενικό γραμμικό μοντέλο, δηλαδή, λέμε στην R σύμφωνα με ποιες παραμέτρους που έχει εκτιμήσει να υπολογίσει την αναμενόμενη τιμή. Στη δεύτερη παράμετρο δίνουμε τις τιμές των επεξηγηματικών μεταβλητών για τις οποίες θέλουμε να γίνει η πρόβλεψη. Στη τρίτη παράμετρο δηλώνουμε ότι, μαζί με την προβλεπόμενη τιμή, θέλουμε να υπολογιστεί κι ένα διάστημα εμπιστοσύνης με το επιθυμητό επίπεδο σημαντικότητας. Εδώ, το επίπεδο σημαντικότητας είναι 0.05, αλλά δεν χρειάζεται να το ορίσουμε σε κάποια παράμετρο, αφού τόσο είναι από προεπιλογή. > predict(mod, list(sqft=2500, age=5, ne=1, cor=0), int="c") fit lwr upr Σύμφωνα με τα αποτελέσματα της R, η τιμή ενός τέτοιου σπιτιού είναι 1732 χιλιάδες δολάρια και το 95% διάστημα εμπιστοσύνης για την πρόβλεψη αυτή είναι [1640.5, ]. (x) Προσαρμογή γενικού γραμμικού μοντέλου με νέα επεξηγηματική μεταβλητή AGE_NEW αντί της AGE Για την δημιουργία της νέας κατηγορικής μεταβλητής AGE_NEW εκτελούμε τον παρακάτω κώδικα στην R.

15 > age_new<-c() > for (i in 1:length(age)){ + if (age[i]<=10) + age_new[i]<-0 + else{ + if (age[i]>10 && age[i]<=20) + age_new[i]<-1 + else + age_new[i]<-2 + } + } Στην πρώτη γραμμή δημιουργείται το διάνυσμα age_new στο οποίο θα καταχωρηθούν ως στοιχεία οι τιμές της νέας μεταβλητής. Στην επόμενη γραμμή, δημιουργείται βρόγχος for κατά τον οποίο, ανάλογα την εκάστοτε τιμή της μεταβλητής AGE, που ελέγχεται μέσω των εκφράσεων if else, παίρνει την αντίστοιχη τιμή η μεταβλητή AGE_NEW και αυτή καταχωρείται στην αντίστοιχη θέση του διανύσματος age_new. Προφανώς, η επανάληψη γίνεται τόσες φορές όσα είναι τα στοιχεία του διανύσματος age που περιέχει τις τιμές της AGE. Αφού έχουμε δημιουργήσει το διάνυσμα που περιέχει τις τιμές της νέας μεταβλητής, δίνουμε την παρακάτω εντολή, ώστε η R όντως να την «αντιληφθεί» ως κατηγορική μεταβλητή και όχι απλά ως ένα διάνυσμα που περιέχει ακέραιους αριθμούς. > age_new <- as.factor(age_new) Μπορούμε πλέον να εφαρμόσουμε το γενικό γραμμικό μοντέλο στα δεδομένα μας και να δούμε τις εκτιμήσεις των συντελεστών του. > mod_new<-lm(price ~ sqft + age_new + ne + cor) > mod_new Call: lm(formula = price ~ sqft + age_new + ne + cor) Coefficients: (Intercept) sqft age_new1 age_new2 ne cor Το γενικό γραμμικό μοντέλο προσαρμοσμένο στα νέα μας δεδομένα έχει 6 συντελεστές αντί για 5 που είχε το γενικό γραμμικό μοντέλο που είχαμε προσαρμόσει στα προηγούμενα δεδομένα. Αυτό συμβαίνει επειδή η μεταβλητή AGE_NEW είναι κατηγορική με τρεις κατηγορίες. Επομένως, για να γίνει σωστά η προσαρμογή του μοντέλου δημιουργούνται δύο εικονικές μεταβλητές, η AGE_NEW1 και η AGE_NEW2 οι οποίες έχουν δύο κατηγορίες. Γι'αυτό άλλωστε ήταν απαραίτητο να επεξεργαστούμε το διάνυσμα new_age, ώστε να το «αντιλαμβάνεται» η R ως κατηγορική μεταβλητή. Η AGE_NEW1 παίρνει την τιμή 1 όταν το σπίτι είναι από 10 έως και 20 ετών και τιμή 0 για κάθε άλλη περίπτωση, ενώ η AGE_NEW2 παίρνει τιμή 1 όταν το σπίτι είναι άνω των 20 ετών. Όταν και οι δύο αυτές εικονικές μεταβλητές έχουν τιμή 0, τότε το σπίτι είναι, προφανώς, έως και 10 ετών. Οι εικονικές μεταβλητές που έχουν δημιουργηθεί αφορούν τις κατηγορίες 1 και 2 της μεταβλητής AGE_NEW. Επομένως, η κατηγορία αναφοράς είναι η κατηγορία 0 της AGE_NEW, για την οποία δεν υπάρχει αντίστοιχη εικονική μεταβλητή, και αυτή είναι που αντιστοιχεί στην κατάσταση «το σπίτι είναι το πολύ 10 ετών». Το γενικό γραμμικό μοντέλο παλινδρόμησης είναι της μορφής PRICE =a b sqft SQFT b age1 AGE _ NEW1 b age2 AGE _ NEW2 b ne NE b cor COR Η παράμετρος a εκφράζει τη μέση τιμή της τυχαίας μεταβλητής PRICE όταν όλες οι υπόλοιπες έχουν τιμή μηδέν, δηλαδή όταν το σπίτι δεν είναι γωνιακό, ούτε βρίσκεται στη βορειοδυτική πλευρά της πόλης, έχει μηδενική έκταση και ηλικιακά δεν είναι ούτε μεγαλύτερο των 10 ετών, ούτε μεγαλύτερο των 20 ετών, άρα είναι έως και 10 ετών. Κάθε μία από τις

16 υπόλοιπες παραμέτρους εκφράζει τη μεταβολή της PRICE όταν μεταβάλλεται η αντίστοιχη επεξηγηματική μεταβλητή κατά μία μονάδα, ενώ όλες οι άλλες παραμένουν ίδιες. Οι συντελεστές του μοντέλου εκτιμώνται όπως φαίνεται παραπάνω, στα αποτελέσματα της προσαρμογής του γενικού γραμμικού μοντέλου στα δεδομένα αυτά. Η κατασκευή 95% διαστημάτων εμπιστοσύνης για τις παραμέτρους γίνεται με την εξής εντολή. > confint(mod_new) 2.5 % 97.5 % (Intercept) sqft age_new age_new ne cor Όπως και στις προηγούμενες περιπτώσεις, δεν χρειάστηκε στις παραμέτρους της εντολής να ορίσουμε το επίπεδο σημαντικότητας, γιατί από προεπιλογή είναι (xi) Αναλυτική παρουσίαση του γενικού γραμμικού μοντέλου που προσαρμόσαμε και έλεγχος προϋποθέσεων Με την εντολή summary μπορούμε να δούμε με λεπτομέρειες τα αποτελέσματα της προσαρμογής του γενικού γραμμικού μοντέλου στα δεδομένα μας. > summary(mod_new) Call: lm(formula = price ~ sqft + age_new + ne + cor) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) sqft <2e-16 *** age_new age_new ne cor Signif. codes: 0 *** ** 0.01 * Residual standard error: on 59 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 5 and 59 DF, p-value: < 2.2e-16 Από το πεδίο «Call» βλέπουμε ότι χρησιμοποιήθηκαν τα δεδομένα του διανύσματος price ως στοιχεία για την μεταβλητή απόκρισης PRICE και τα διανύσματα sqft, age_new, ne και cor για τις αντίστοιχες επεξηγηματικές μεταβλητές. Στο πεδίο «Residuals» βλέπουμε μερικά μέτρα θέσης και μεταβλητότητας για τα υπόλοιπα του μοντέλου. Στο πεδίο «Coefficients» φαίνονται οι εκτιμήσεις των συντελεστών του μοντέλου, το τυπικό σφάλμα της κάθε εκτίμησης, η τιμή του στατιστικού ελέγχου και η P-τιμή για κάθε έλεγχο της υπόθεσης η εκάστοτε παράμετρος να είναι μηδενική, με εναλλακτική να μην είναι. Οι αστερίσκοι και οι τελείες δεξιά από τις Ρ-τιμές αποτελούν μια γραφική αναπαράσταση της κάθε Ρ-τιμής και επεξηγούνται στο πεδίο «Signif. codes». Στις επόμενες γραμμές εμφανίζονται αποτελέσματα για το τυπικό σφάλμα των υπολοίπων, το οποίο στην περίπτωσή μας έχει τιμή και ακολουθεί κατανομή Student με 59 βαθμούς ελευθερίας, για τον συντελεστή προσδιορισμού και τον διορθωμένο συντελεστή

17 προσδιορισμού, όπου ο πρώτος είναι 0.82 και ο δεύτερος 0.80, κάτι που δείχνει καλή προσαρμογή του μοντέλου στα δεδομένα μας, και για τον F-έλεγχο της υπόθεσης όλοι οι συντελεστές του μοντέλου που εκφράζουν τη μεταβολή της αναμενόμενης τιμής σε σχέση με τη μεταβολή μιας επεξηγηματικής μεταβλητής (δηλαδή, όλοι οι συντελεστές εκτός από τον a ) να είναι μηδενικοί, με εναλλακτική ότι τουλάχιστον ένας δεν είναι. Η Ρ-τιμή για τον έλεγχο αυτό είναι πολύ μικρή για να αποδεχτούμε τη μηδενική υπόθεση. Το στατιστικό ελέγχου έχει τιμή και ακολουθεί κατανομή Snedecor με 5 και 59 βαθμούς ελευθερίας. Τα παραπάνω σκοπεύουν κυρίως στην εξήγηση των αποτελεσμάτων που εμφανίζει η R μέσω της εντολής summary. Παρατηρούμε ότι στο προσαρμοσμένο μοντέλο mod, αυτό που είχε ως επεξηγηματική μεταβλητή την AGE και όχι την AGE_NEW, οι εκτιμήσεις των συντελεστών b sqft και b cor βρίσκονται πολύ κοντά στις εκτιμήσεις των ίδιων συντελεστών του νέου προσαρμοσμένου μοντέλου mod_new. Ο συντελεστής b ne, όμως, χάνει σημαντικά την επίδρασή του στη μεταβλητή απόκρισης PRICE στο mod_new και παράλληλα η μεταβολή των μεταβλητών AGE_NEW1 και AGE_NEW2 αποκτά πολύ μεγαλύτερη σημασία από ότι είχε η μεταβλητή AGE στο μοντέλο mod. Μάλιστα, βλέπουμε ότι η Ρ-τιμή για τον έλεγχο της μηδενικής υπόθεσης H 0 : b ne =0, με εναλλακτική την H 1 :b ne 0, είναι πολύ μεγαλύτερη στο νέο μοντέλο mod_new απ'ότι στο mod, που σημαίνει ότι στο νέο μοντέλο γίνεται αποδεκτή η μηδενική υπόθεση. Αυτές οι αποστάσεις στην εκτίμηση των συντελεστών μεταξύ των δύο μοντέλων υποδεικνύουν μια σχέση μεταξύ της μεταβλητής NE με την AGE ή της NE με τις εικονικές μεταβλητές AGE_NEW1 και AGE_NEW2, η οποία σχέση προφανώς δεν μπορεί να είναι γραμμική αφού οι ΝΕ, AGE_NEW1 και AGE_NEW2 είναι κατηγορικές. Για τον έλεγχο των προϋποθέσεων του νέου γενικού γραμμικού μοντέλου ακολουθούμε τις ίδιες διαδικασίες με αυτές του μοντέλου mod. Γραμμικότητα Η μόνη ποσοτική επεξηγηματική μεταβλητή είναι η SQFT, επομένως μόνο γι'αυτήν έχει νόημα ο έλεγχος της γραμμικότητας. Το παρακάτω γράφημα δείχνει ότι η υπόθεση της γραμμικότητας είναι εύλογη. > plot(sqft, residuals(mod_new, "partial")[,1], xlab="sqft", ylab="sqft's partial residuals", main="plot for linearity check") Κανονικότητα σφαλμάτων Ο έλεγχος αυτός μπορεί να γίνει με την εντολή density. > plot(density(mod_new$res), main="density plot for errors") Η συνάρτηση κατανομής των σφαλμάτων μοιάζει πολύ στην Κανονική συνάρτηση κατανομής, κάτι που μας δείχνει ότι τα σφάλματα του μοντέλου προέρχονται με πολύ καλή προσέγγιση από την Κανονική Κατανομή.

18 Ομοσκεδαστικότητα Από το παρακάτω διάγραμμα είναι φανερό ότι η υπόθεση της ομοσκεδαστικότητας ισχύει. > plot(mod_new$fitted, mod_new$res, main="(fitted, residuals)", xlab="fitted", ylab="residuals") Ανεξαρτησία σφαλμάτων Στο παρακάτω διάγραμμα απεικονίζονται τα σφάλματα με τη σειρά των δεδομένων μας. Όπως φαίνεται, τα σφάλματα ακολουθούν τυχαία συμπεριφορά, επομένως η υπόθεση της ανεξαρτησίας των σφαλμάτων ισχύει. > plot(mod_new$res, main="residuals in the order of our data", ylab="residuals") Τα σημεία του διαγράμματος δεν ακολουθούν συγκεκριμένη συμπεριφορά. (xii) Προσαρμογή γενικού γραμμικού μοντέλου παλινδρόμησης, με κατηγορία αναφοράς της AGE_NEW την τιμή 2 Για να θέσουμε ως κατηγορία αναφοράς την τιμή 2 της AGE_NEW, η οποία αντιστοιχεί στην κατάσταση «το σπίτι είναι άνω των 20 ετών», δίνουμε την παρακάτω εντολή στην R. > age_new <- factor(age_new, levels=c(2, 0, 1)) Η κατηγορία αναφοράς είναι η πρώτη που δηλώνεται στην παράμετρο levels της εντολής factor. Αν δεν δηλωθεί η παράμετρος levels, τότε η κατηγορία αναφοράς είναι η μικρότερη αριθμητικά ή αλφαβητικά (σε περίπτωση που η μεταβλητή είναι ποιοτική). Μπορούμε τώρα να προσαρμόσουμε το γενικό γραμμικό μοντέλο με τη νέα αυτή κατηγορία αναφοράς. > mod_new2<-lm(price ~ sqft + age_new + ne + cor) > mod_new2 Call: lm(formula = price ~ sqft + age_new + ne + cor) Coefficients: (Intercept) sqft age_new0 age_new1 ne cor Σο μοντέλο PRICE =a b sqft SQFT b age0 AGE _ NEW0 b age1 AGE _ NEW1 b ne NE b cor COR, η παράμετρος a εκφράζει τη μέση τιμή της μεταβλητής απόκρισης PRICE όταν όλες οι επεξηγηματικές μεταβλητές έχουν τιμή 0, δηλαδή όταν το σπίτι είναι μηδενικής έκτασης, μη γωνιακό, εκτός βορειοδυτικής πλευράς της πόλης, όχι νεότερο των 10 ετών και όχι νεότερο των 20 ετών, άρα άνω των 20 ετών. Η παράμετρος b sqft εκφράζει τη μεταβολή της PRICE όταν η μεταβλητή SQFT αυξάνεται κατά μία μονάδα, δηλαδή, όταν το σπίτι είναι κατά ένα τετραγωνικό πόδι μεγαλύτερο, ενώ όλες οι υπόλοιπες μεταβλητές μένουν σταθερές. Η παράμετρος b age0 εκφράζει τη μεταβολή της PRICE

19 όταν όλες οι επεξηγηματικές μεταβλητές παραμένουν σταθερές, αλλά η εικονική μεταβλητή AGE_NEW0 παίρνει την τιμή 1. Το ίδιο εκφράζει και η παράμετρος b age1 όταν παίρνει τιμή 1 η εικονική μεταβλητή AGE_NEW1. Όταν κάποια από τις δύο αυτές μεταβλητές από 1 παίρνει τιμή 0 και οι υπόλοιπες μένουν σταθερές, τότε η PRICE μεταβάλλεται κατά b age0 ή b age1. H b ne δίνει τη διαφορά της τιμής δύο σπιτιών όταν όλα τους τα χαρακτηριστικά είναι ίδια, εκτός από την τοποθεσία τους, όπου το ένα είναι εντός της βορειοδυτικής πλευράς της πόλης, ενώ το άλλο εκτός. Αντίστοιχα, η b cor εκφράζει τη διαφορά της τιμής δύο σπιτιών που έχουν ίδια χαρακτηριστικά, με μόνη διαφορά ότι το ένα είναι γωνιακό ενώ το άλλο όχι.

20 ΠΑΡΑΡΤΗΜΑ Παρακάτω, παρατίθεται το τυχαίο δείγμα που πήραμε από το αρχικό πλαίσιο δεδομένων fdata μέσω της sample, πάνω στο οποίο εργαστήκαμε για την προσαρμογή των γραμμικών μοντέλων παλινδρόμησης. ΑΑ * PRICE SQFT AGE NE COR ΑΑ PRICE SQFT AGE NE COR * Αύξων Αριθμός

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ ΜΕΜ264: Εφαρμοσμένη Στατιστική 1 ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ 1. Σε μελέτη της επίδρασης γεωργικών χημικών στην προσρόφηση ιζημάτων και εδάφους, δίνονται στον πιο κάτω πίνακα 13 δεδομένα για το δείκτη

Διαβάστε περισσότερα

= p 20 1 p 18. 1 p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

= p 20 1 p 18. 1 p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι Άσκηση 1 i) Σε κάθε παρατήρηση περιλαμβάνεται ένας έλεγχος (ο τελευταίος) κατά τον οποίο εμφανίστηκε το πρώτο ελαττωματικό της παραγωγικής διαδικασίας. Επομένως, ο αριθμός ελέγχων που έγιναν πριν εμφανιστεί

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Εφαρμογών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στη

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Γραµµική Παλινδρόµηση

Γραµµική Παλινδρόµηση Κεφάλαιο 8 Γραµµική Παλινδρόµηση Η γραµµική παλινδρόµηση είναι ένα από τα πιο σηµαντικά ϑέµατα της Στατιστική ϑεωρείας. Στη συνέχεια αυτή η πολύ γνωστή µεθοδολογία ϑα αναπτυχθεί στην R µέσω των τύπων για

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Γνωριμία με τον προγραμματισμό μέσω της γλώσσας R Στοιχεία Περιγραφικής Στατιστικής

Γνωριμία με τον προγραμματισμό μέσω της γλώσσας R Στοιχεία Περιγραφικής Στατιστικής Γνωριμία με τον προγραμματισμό μέσω της γλώσσας R Στοιχεία Περιγραφικής Στατιστικής Περιγραφική Στατιστική Ποσοτικές Μεταβλητές (1) Ποσοτικές Μεταβλητές Αριθμητικές Μέθοδοι (1) 1. Μέτρα Θέσης: 1. Δειγματικός

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Ανάλυση της ιακύµανσης

Ανάλυση της ιακύµανσης Κεφάλαιο 9 Ανάλυση της ιακύµανσης Η ανάλυση της διακύµανσης είναι µια από τις πλέον σηµαντικές µεθόδους για ανάλυση δεδοµένων. Η µέθοδος αυτή αναφέρετε στη διαµέριση του συνολικού αθροίσµατος τετραγώνων

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Λογιστική Παλινδρόµηση

Λογιστική Παλινδρόµηση Κεφάλαιο 10 Λογιστική Παλινδρόµηση Στο κεφάλαιο αυτό ϑα δούµε την µέθοδο της λογιστικής παλινδρόµησης η οποία χρησιµεύει στο να αναπτύξουµε σχέση µίας δίτιµης ανεξάρτητης τυχαίας µετα- ϐλητής και συνεχών

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

Στατιστική, Άσκηση 2. (Κανονική κατανομή)

Στατιστική, Άσκηση 2. (Κανονική κατανομή) Στατιστική, Άσκηση 2 (Κανονική κατανομή) Στον πίνακα που ακολουθεί δίνονται οι μέσες παροχές όπως προέκυψαν από μετρήσεις πεδίου σε μια διατομή ενός ποταμού. Ζητείται: 1. Να αποδειχθεί ότι το δείγμα προσαρμόζεται

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p ΑΣΚΗΣΗ 1 ΣΕΜΦΕ 14-15 i. Έστω yi ο αριθμός των προσπαθειών κάθε μαθητή μέχρι να πετύχει τρίποντο. Ο αριθμός των προσπαθειών πριν ο μαθητής να πετύχει τρίποντο θα είναι xi = yi - 1, i = 1,,18. 2 2 3 2 1

Διαβάστε περισσότερα

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α) Τμήμα Διοίκησης Επιχειρήσεων (Αγ. Νικόλαος), Τ.Ε.Ι. Κρήτης Σελίδα 1 από 13 5η Εργαστηριακή Άσκηση Σκοπός: Η παρούσα εργαστηριακή άσκηση στοχεύει στην εκμάθηση κατασκευής γραφημάτων που θα παρουσιάζουν

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α) Τμήμα Διοίκησης Επιχειρήσεων (Αγ. Νικόλαος), Τ.Ε.Ι. Κρήτης Σελίδα 1 από 13 5η Εργαστηριακή Άσκηση Σκοπός: Η παρούσα εργαστηριακή άσκηση στοχεύει στην εκμάθηση κατασκευής γραφημάτων που θα παρουσιάζουν

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο Παράδειγμα 1 Ο παρακάτω πίνακας δίνει τις πωλήσεις (ζήτηση) ενός προϊόντος Υ (σε κιλά) από το delicatessen μιας περιοχής και τις αντίστοιχες τιμές Χ του προϊόντος (σε ευρώ ανά κιλό) για μια ορισμένη χρονική

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 30 Μαρτίου 2017 1/32 Ανάλυση Παλινδρόμησης: Γενικά. Με την ανάλυση παλινδρόμησης εξετάζουμε

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 11 Μαρτίου 2017 1/24 Εισαγωγή. Εστω ότι X 1, X 2,..., X n είναι ένα τυχαίο δείγμα παρατηρήσεων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ). Δισδιάστατη ανάλυση Πίνακες διπλής εισόδου Σε πολλές περιπτώσεις μελετάμε περισσότερες από μία μεταβλητές ταυτόχρονα. Π.χ. μία έρευνα που έγινε σε ένα δείγμα 58 ατόμων περιείχε τις ερωτήσεις «ποια είναι

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ... ΚΕΦΑΛΑΙΟ 0 Ένα Πρόβλημα Δεδομένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Απλή Γραμμική Παλινδρόμηση Μωυσιάδης Χρόνης 6 o Εξάμηνο Μαθηματικών Έχει σχέση το με το ; Ειδικότερα

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα Εργασία στα Γενικευμένα Γραμμικά Μοντέλα Μ. Παρζακώνης ΜΕΣ/ 06015 Ο παρακάτω πίνακας δίνει τα αποτελέσματα 800 αιτήσεων για δάνειο σε μία τράπεζα. Ο πίνακας παρουσιάζει τον αριθμό των δανείων που εγκρίθηκαν,

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου 4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου Για την εκτίμηση των παραμέτρων ενός πληθυσμού (όπως η μέση τιμή ή η διασπορά), χρησιμοποιούνται συνήθως δύο μέθοδοι εκτίμησης. Η πρώτη ονομάζεται σημειακή εκτίμηση.

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Εισαγωγή Οικονοµετρία (Econometrics) είναι ο τοµέας της Οικονοµικής επιστήµης που περιγράφει και αναλύει

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Αναπληρωτής Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Εφαρμογών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 9/10/009 ΤΕΙ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 3o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Emal: gasl@math.auth.gr Ιστοσελίδα Μαθήματος: users.auth.gr/gasl

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι

8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι 8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι Απλή γραμμική παλινδρόμηση είναι μία στατιστική μέθοδος που χρησιμοποιείται για τη μελέτη της σχέσης μεταξύ δύο ποσοτικών μεταβλητών εκ των οποίων μία είναι η ανεξάρτητη

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Δημήτρης Ιωαννίδης. Τμήμα Οικονομικών Επιστημών.

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Δημήτρης Ιωαννίδης. Τμήμα Οικονομικών Επιστημών. Μεθοδολογία Έρευνας: Μάθημα 3 ο ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Δημήτρης Ιωαννίδης Τμήμα Οικονομικών Επιστημών Email: dimioan@uom.gr Εμπιστευτικό Σελίδα 1 Μάθημα 5 ο Ελέγχοντας την Θεωρία ΙΙ: Στατιστικοί Έλεγχοι για

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) 1. Έχοντας στη διάθεσή μας ένα δείγμα, προκύπτει ότι το 95% διάστημα εμπιστοσύνης για το μέσο μ ενός κανονικού

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Άσκηση 1: Μια τράπεζα ενδιαφέρεται να μελετήσει την αποταμιευτική συμπεριφορά των πελατών της. Θεωρείται ως δεδομένο ότι η ετήσια αποταμίευση των πελατών της

Διαβάστε περισσότερα

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics Στόχοι του κεφαλαίου Εξοικείωση με το περιβάλλον του SPSS Εξοικείωση με τις διαδικασίες περιγραφικής ανάλυσης μιας μεταβλητής Εξοικείωση με τη

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2013-2014 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητή: ένα χαρακτηριστικό ή ιδιότητα που μπορεί να πάρει διαφορετικές τιμές

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

R & R- Studio. Πασχάλης Θρήσκος PhD Λάρισα

R & R- Studio. Πασχάλης Θρήσκος PhD Λάρισα R & R- Studio Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Εισαγωγή στο R Διαχείριση Δεδομένων R Project Περιγραφή του περιβάλλοντος του GNU προγράμματος R Project for Statistical Analysis Γραφήματα

Διαβάστε περισσότερα