«ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΚΑΤΕΥΘΥΝΣΗ : ΣΤΑΤΙΣΤΙΚΗ ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ & ΕΦΑΡΜΟΓΕΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "«ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΚΑΤΕΥΘΥΝΣΗ : ΣΤΑΤΙΣΤΙΚΗ ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ & ΕΦΑΡΜΟΓΕΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΚΑΤΕΥΘΥΝΣΗ : ΣΤΑΤΙΣΤΙΚΗ ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ & ΕΦΑΡΜΟΓΕΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΙΕΡΕΥΝΗΣΗ ΠΑΡΑΓΟΝΤΩΝ ΠΟΥ ΕΠΗΡΕΑΖΟΥΝ ΤΗΝ Ι ΡΥΣΗ ΜΙΑΣ ΜΙΚΡΟΜΕΣΑΙΑΣ ΕΠΙΧΕΙΡΗΣΗΣ ΓΚΟΓΚΑΣ ΓΕΩΡΓΙΟΣ ΤΡΙΜΕΛΗΣ ΕΠΙΤΡΟΠΗ Σ. ΓΟΥΤΣΟΣ (Επιβλέπων) Μ. ΒΡΑΧΑΤΗΣ Φ. ΑΛΕΒΙΖΟΣ ΠΑΤΡΑ ΜΑΡΤΙΟΣ 009

2 Θα ήθελα να ευχαριστήσω τον επιβλέπων καθηγητή µου κ. Σ. Γούτσο για την πολύτιµη βοήθεια του σε ολόκληρη την πορεία αυτής της εργασίας. Επίσης θα ήθελα να ευχαριστήσω τους κ. Μ. Βραχάτη και Φ. Αλεβίζο για την συµµετοχή τους στην τριµελή επιτροπή.

3 ΕΙΣΑΓΩΓΗ Σκοπός της εργασίας αυτής είναι να αναλύσουµε τους πιο σηµαντικούς λόγους για τους οποίους ιδρύεται µια µικροµεσαία επιχείρηση µε την χρήση του στατιστικού προγράµµατος SPSS. Η δοµή της εργασίας είναι χωρισµένη σε δυο µέρη. Το πρώτο µέρος αποτελεί το θεωρητικό κοµµάτι των µεθόδων που χρησιµοποιούµε και το δεύτερο είναι το πρακτικό δηλαδή η εφαρµογή των µεθόδων που αναλύσαµε σε πραγµατικά δεδοµένα. Το θεωρητικό µέρος είναι χωρισµένο σε τέσσερα κεφάλαια. Στο πρώτο κεφάλαιο αναφέρουµε τις δυνατότητες του SPSS για την στατιστική ανάλυση µιας και δυο µεταβλητών ενός ή περισσοτέρων δειγµάτων καθώς επίσης και για το πώς µπορούµε να καθορίσουµε τη σχέση (αν υπάρχει ή όχι ) µεταξύ τους. Πριν την αναφορά µας γύρω από τις µεταβλητές τονίζουµε κάποια σηµεία στα οποία πρέπει να δίνουµε ιδιαίτερη βαρύτητα, και τα οποία είναι απαραίτητα στο αρχικό στάδιο επεξεργασίας των δεδοµένων µας (καθορισµός µεταβλητής κτλ.) Στο δεύτερο κεφάλαιο κάνουµε µια πρώτη αναφορά γύρω από την Πολυδιάστατη Ανάλυση εδοµένων τονίζοντας τη χρησιµότητα τους στις διάφορες επιστήµες, τον τρόπο µε τον οποίο η ανάλυση αυτή λειτουργεί και τα κύρια χαρακτηριστικά της. Γενικά είναι ένα σύνολο µεθόδων οι οποίες ξεκινώντας από τα ίδια τα δεδοµένα και χωρίς καµία υπόθεση ερευνούν τις τάσεις, τις σχέσεις και τις οµαδοποιήσεις τους. Στη συνέχεια αναλύουµε µια σηµαντική µέθοδο την ανάλυση των κύριων συνεκτικών συνιστωσών. Είναι µια τεχνική που έχει ως στόχο τη µείωση της διάστασης των δεδοµένων διατηρώντας σχεδόν όλη την ολική µεταβλητότητα των αρχικών µεταβλητών.η ανάλυση γίνεται µε τη βοήθεια των µαθηµατικών σχέσεων και βασίζεται στους πίνακες ( δειγµατικής ) συσχέτισης, (δειγµατικής ) συνδιασποράς κτλ. Στο τρίτο κεφάλαιο κάνουµε µια προσπάθεια ερµηνείας της Παραγοντικής Ανάλυσης µε δυο τρόπους.ο ένας τρόπος είναι µε τη βοήθεια της Γραµµικής Άλγεβρας, της Ανάλυσης και των πινάκων και ο άλλος µε τη βοήθεια των γραφικών απεικονίσεων των σχέσεων των στοιχείων του πίνακα που αναλύουµε. Σκοπός της παραπάνω µεθόδου είναι να οµαδοποιήσει ένα µεγάλο αριθµό µεταβλητών σε ένα µικρότερο αριθµό σηµαντικών µη παρατηρήσιµων τυχαίων µεταβλητών που καλούνται παράγοντες. Στο τελευταίο κεφάλαιο του θεωρητικού µέρους αναφέρουµε και αναλύουµε την Cluster Analysis η οποία είναι µια µέθοδος µε την οποία επιδιώκουµε τη δηµιουργία οµάδων, συνήθως ατόµων ή αντικειµένων µε οµοειδή χαρακτηριστικά, οµάδες τις οποίες µπορούµε να αποκαλούµε και τάξεις. Και σ αυτή τη µέθοδο κάνουµε δύό ειδών αναλύσεις. Το πρακτικό µέρος της παρούσας εργασίας διερευνά τους παράγοντες οι οποίοι επηρεάζουν την ίδρυση µιας µικροµεσαίας επιχείρησης (ΜΜΕ). ιεξήχθη εµπειρική έρευνα, ο δειγµατικός χώρος της οποίας περιλαµβάνει 40 µικροµεσαίες επιχειρήσεις του νοµού Σερρών. Τα αποτελέσµατα αναδεικνύουν τη συµβολή και τη βαρύτητα µεταβλητών που σχετίζονται µε: το προφίλ του επιχειρηµατία (δηµογραφικά χαρακτηριστικά, προηγούµενη εργασιακή και επιχειρηµατική εµπειρία κ.α.), τη διαδικασία ίδρυσης της επιχείρησης (πηγές άντλησης πληροφοριών, λήψη απόφαση, αρχική επένδυση, προβλήµατα που παρουσιάσθηκαν κ.α.), τα χαρακτηριστικά της νεοϊδρυθείσας επιχείρησης (αντικείµενο, νοµικό καθεστώς, αριθµός απασχολούµενων κ.α.) και τον ο χρόνο λειτουργίας (κύκλος εργασιών, πωλήσεις κ.α.). Πιο συγκεκριµένα στο κεφάλαιο 5 αναλύουµε σχεδόν όλες τις µεταβλητές µε τη βοήθεια της περιγραφικής στατιστικής και επιµένουµε λίγο περισσότερο σε εκείνες που αποτελούν τους παράγοντες ίδρυσης µικροµεσαίας επιχείρησης. Στο κεφάλαιο 6 περνάµε στο επόµενο στάδιο εντοπίζοντας σχέσεις ανάµεσα σε δυο µεταβλητές του ερωτηµατολογίου.το κριτήριο µε το οποίο γίνεται ο έλεγχος είναι ο Χ έλεγχος ανεξαρτησίας και αναφέρουµε µόνο όσα παρουσιάζουν ενδιαφέρον (δηλαδή εκεί που υπάρχει κάποια σχέση ). Προχωρώντας στο κεφάλαιο 7 εισχωρούµε κατά κάποιο τρόπο στην Πολυδιάστατη Ανάλυση.Εφαρµόζουµε την Παραγοντική Ανάλυση µε τη χρήση της 3

4 µεθόδου των ισχυρών συνεκτικών συνιστωσών. Η εφαρµογή γίνεται πάνω στους λόγους ίδρυσης γενικά,µιας επιχείρησης.αναφέρουµε αναλυτικά όλα τα βήµατα και όλο το συλλογισµό µέχρι να καταλήξουµε στο τελικό στάδιο από το οποίο βγάζουµε συµπεράσµατα. Και στο τελευταίο κεφάλαιο (8) πραγµατοποιούµε την Cluster Analysis των 40 cases ώστε να µπορέσουµε να καταλήξουµε σε κάποια προφίλ επιχειρηµατιών µε συγκεκριµένα χαρακτηριστικά. ηλαδή από την Παραγοντική Ανάλυση παίρνουµε κάποιες κατευθύνσεις, µε τις οποίες σε συνδυασµό µε την Cluster Αnalysis εντοπίζουµε συγκεκριµένους λόγους ίδρυσης µιας επιχείρησης για συγκεκριµένα προφίλ επιχειρηµατιών. Τέλος, λόγω της εφαρµογής όλων των παραπάνω µεθόδων, προκύπτει ένας πολύ µεγάλος αριθµός πινάκων, ο οποίος ήτανε αδύνατο να καταχωρηθεί στην εργασία.για το λόγο αυτό στο Παράρτηµα έχουµε βάλει όλους τους πίνακες που χρησιµοποιήσαµε στο πρακτικό µέρος της εργασίας. 4

5 ΜΕΡΟΣ Α 6

6 ΚΕΦΑΛΑΙΟ ΣΤΑΤΙΣΤΙΚΗ - SPSS.) ΕΙΣΑΓΩΓΗ Στο κεφάλαιο αυτό θα αναφέρουµε τις δυνατότητες τις οποίες έχουµε από την πλευρά της στατιστικής (περιγραφικής και συµπερασµατολογίας µίας και δυο µεταβλητών) µε τη βοήθεια του στατιστικού πακέτου SPSS. Θα επικεντρωθούµε περισσότερο στις σχέσεις µεταξύ δύο ή και περισσότέρων µεταβλητών όσο και στην στατιστική ανάλυση της µιας µεταβλητής. Τα υποκείµενα ενός πληθυσµού έχουν διάφορα χαρακτηριστικά κάποια από τα οποία ενδιαφερόµαστε να µελετήσουµε. Τα χαρακτηριστικά αυτά, τα οποία πιθανότατα µεταβάλλονται από υποκείµενο σε υποκείµενο τα ονοµάζουµε µεταβλητή. Οι διακρίσεις που µπορούµε να κάνουµε µεταξύ της ίδιας πληροφορίας που παίρνουµε για δυο ή περισσότερα υποκείµενα µε τη διαδικασία της µέτρησης µπορεί να αφορούν ποιότητα ή ποσότητα. Για τον προσδιορισµό τους είναι απαραίτητη η ύπαρξη µιας κλίµακας µέτρησης. Οι κλίµακες που χρησιµοποιούνται είναι: κατηγορίας, διάταξης, διαστήµατος και αναλογίας και η σχέση τους φαίνεται στο παρακάτω σχήµα ΜΕΤΑΒΛΗΤΗ ΠΟΙΟΤΙΚΗ ΠΟΣΟΤΙΚΗ ΚΑΤΗΓΟΡΙΑΣ ΙΑΤΑΞΗΣ ΙΑΣΤΗΜΑΤΟΣ ΑΝΑΛΟΓΙΑ (nominal) (ordinal) (interval) (ratio) SCALE Σαν µεταβλητές κατηγορίας, ορίζουµε τις µεταβλητές εκείνες που το σύνολο τιµών της δεν έχει καµία ιδιότητα (τόπος γέννησης, φύλο, οικογενειακή κατάσταση). Σαν µεταβλητές διάταξης, ορίζουµε εκείνες που για το σύνολο τιµών µπορούµε να ορίσουµε µια σχέση διάταξης (επίπεδο εκπαίδευσης, η στάση σε κάποιο ζήτηµα) και σαν µεταβλητές scale ορίζουµε εκείνες των οποίων οι τιµές είναι αριθµοί και διακρίνονται ι) Σε διακριτές µεταβλητές, που παίρνουν µόνο 7

7 «µεµονωµένες» τιµές και ιι) σε συνεχείς µεταβλητές που µπορούν να πάρουν οποιαδήποτε τιµή ενός διαστήµατος πραγµατικών αριθµών (α,β). Σε µια Στατιστική Ανάλυση εδοµένων θα πρέπει να απαντάµε πάντα στις παρακάτω ερωτήσεις πριν επιλέξουµε την κατάλληλη τεχνική.. Σε ποια κλίµακα µέτρησης ανήκουν οι µεταβλητές που µελετάµε;. Ισχύουν οι προϋποθέσεις της µεθόδου; 3. Έχουµε ανεξάρτητα ή εξαρτηµένα δείγµατα; 4. Ποιες από τις µεταβλητές µπορούν να θεωρηθούν ανεξάρτητες και ποιες εξαρτηµένες; Το ο βήµα που κάνουµε πάντα είναι η µελέτη και η παρουσίαση χωριστά κάθε µιας των µεταβλητών που περιλαµβάνονται σ αυτό. Λέγοντας µελέτη των µεταβλητών εννοούµε: Α) τον υπολογισµό των στατιστικών µέτρων στο δείγµα. Β) τον σχηµατισµό του πίνακα συχνοτήτων για τις ποιοτικές µεταβλητές ή του οµαδοποιηµένου πίνακα συχνοτήτων για τις ποσοτικές. Για τις ποιοτικές µεταβλητές αν είναι κατηγορίας τότε για τον σχηµατισµό του πίνακα συχνοτήτων υπολογίζουµε τη σχετική συχνότητα και την επικρατούσα τιµή (µέση τιµή και διασπορά δεν έχουν νόηµα), ενώ αν είναι διάταξης οι µεταβλητές υπολογίζουµε διάµεσο, επικρατούσα τιµή (µέση τιµή και διασπορά όχι απαραίτητα). Αντιθέτως τώρα στις ποσοτικές µεταβλητές υπολογίζουµε επιπλέον το µέσο όρο και τη διασπορά. Γ) τον έλεγχο της προσαρµογής της κατανοµής του δείγµατος σε κάποια κατανοµή όπου γίνεται ως εξής: ι) για ποιοτικές µεταβλητές (κλίµακα κατηγορίας ή διάταξης) χρησιµοποιούµε το X test (ελέγχουµε αν ο πίνακας συχνοτήτων µοιάζει µε τον θεωρητικό πίνακα συχνοτήτων που θα προέκυπτε αν η µεταβλητή είχε στον πληθυσµό κάποια γνωστή εκ των προτέρων κατανοµή). ιι) για ποσοτικές µεταβλητές (κλίµακας διαστήµατος ή αναλογίας) χρησιµοποιούµε τον έλεγχο του Kolmogorov Smirnov (ελέγχουµε αν η αθροιστική συχνότητα της µεταβλητής στο δείγµα µοιάζει µε τον πίνακα συχνοτήτων που θα προέκυπτε αν η µεταβλητή ακολουθούσε στον πληθυσµό κάποια γνωστή κατανοµή). ) τον υπολογισµό ποσοστιαίων σηµείων, διαστηµάτων εµπιστοσύνης για τις παραµέτρους..) ΑΝΑΛΥΣΗ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ Οι δυνατότητες που έχουµε να κάνουµε σε µια µεταβλητή από τη µεριά της στατιστικής είναι να εφαρµόσουµε όλους τους τύπους της 8

8 περιγραφικής στατιστικής και της στατιστικής συµπερασµατολογίας (αναζήτηση της κατανοµής του πληθυσµού του δείγµατος). Το SPSS ενσωµατώνει στατιστικούς ελέγχους αλλά και γραφικές διαδικασίες για την αναζήτηση της κατανοµής µιας µεταβλητής µε αποτέλεσµα να επιχειρείται να διαπιστωθεί. Α) Αν οι παρατηρούµενες συχνότητες διαφέρουν σηµαντικά από τις αντίστοιχες αναµενόµενες µιας γνωστής κατανοµής και αυτό πραγµατοποιείται µε τον X -έλεγχο καλής προσαρµογής. Β) Αν οι παρατηρούµενες συχνότητες µιας δίτιµης µεταβλητής απέχουν πολύ από τις αντίστοιχες αναµενόµενες µιας διωνυµικής κατανοµής µε δοσµένη πιθανότητα επιτυχίας (Binomial test) Γ) Αν η παρατηρούµενη συνάρτηση αθροιστικής κατανοµής συµπίπτει µε κάποια εκ των Poisson, οµοιόµορφη, κανονική κατανοµή και αυτό επιτυγχάνεται µε το test Kolmogorov Smirnov το οποίο έχει βελτιωθεί για κανονική κατανοµή από το κριτήριο Lilliefors στην περίπτωση που µ, S εκτιµώνται από δείγµα. ) Αν οι παρατηρήσεις µιας µεταβλητής είναι τυχαίες. Ε) Αν υπάρχει αυτοσυσχέτιση µεταξύ των παρατηρήσεων. Όλοι οι παραπάνω έλεγχοι εκτός του τελευταίου είναι µη παραµετρικοί. Με τα γραφήµατα P-P και Q-Q προσπαθούµε να διαπιστώσουµε πόσο κοντά σε κάποια κατανοµή που προσδιορίζουµε είναι τα δεδοµένα που επεξεργαζόµαστε. Όσο πιο έντονα φαίνεται ότι τα σηµεία είναι συγκεντρωµένα γύρω από µια ευθεία (συνήθως στη διχοτόµο της γωνίας των αξόνων x-y) τόσο περισσότερο ενισχύεται η υπόθεση ότι τα δεδοµένα ακολουθούν την κατανοµή που έχει υποτεθεί. Γράφηµα P-P: παριστάνουν σε σύστηµα οριζοντίων και καθέτων αξόνων τις τιµές της παρατηρούµενης αθροιστικής συχνότητας της υποτιθέµενης κατανοµής που ακολουθεί η µεταβλητή που εξετάζεται. Γράφηµα Q-Q: παριστάνουν τα εκατοστηµόρια (ποσοστιαία σηµεία) της παρατηρούµενης ως προς την αναµενόµενη κατανοµή..3) ΠΑΡΑΜΕΤΡΙΚΕΣ ΚΑΙ ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟ ΟΙ Πολλά κριτήρια ελέγχων βασίζονται στην υπόθεση ότι τα δείγµατα προέρχονται από κανονική κατανοµή και αποτελούν τα παραµετρικά κριτήρια. Οι παραµετρικές τεχνικές απαιτούν την ύπαρξη συγκεκριµένων συνθηκών για τα µεγέθη των δειγµάτων ή τον πληθυσµό από τον οποίο προέρχονται. Ο έλεγχος που πραγµατοποιούν αφορά παραµέτρους του πληθυσµού και όχι τον πληθυσµό καθ αυτόν. Ένα µεγάλο πρόβληµα όµως της καθηµερινής πραγµατικότητας είναι κατά πόσο µπορούµε να εφαρµόσουµε στην πράξη αυτά τα παραµετρικά κριτήρια, όταν οι προϋποθέσεις τους δεν ισχύουν, είτε γιατί το δείγµα δεν 9

9 προέρχεται από κανονική κατανοµή είτε γιατί το δείγµα είναι µικρό και δεν µπορούµε να εφαρµόσουµε το κεντρικό οριακό θεώρηµα. Επίσης έχουµε περιπτώσεις που οι µεταβλητές είναι κατηγορίας ή διάταξης οπότε απαιτούνται άλλες µέθοδοι στατιστικής συµπερασµατολογίας που να λύνουν τέτοιου είδους προβλήµατα. Η στατιστική που ασχολείται µε αυτά τα προβλήµατα ονοµάζεται µη παραµετρική ή ελεύθερη κατανοµών. Ένα σηµαντικό πλεονέκτηµα των µη παραµετρικών µεθόδων είναι ότι στηρίζονται στη διάταξη των δεδοµένων, ενώ οι παραµετρικές µέθοδοι στηρίζονται στις ίδιες τις µετρήσεις. Tα µη παραµετρικά κριτήρια εφαρµόζονται σε προβλήµατα µε δεδοµένα κατά κατηγορίες, δηλαδή οι παρατηρήσεις είτε ποσοτικές είτε ποιοτικές δεν υπάρχουνε ξεχωριστά, αλλά δίνονται µόνο µε τη µορφή των συχνοτήτων που αντιστοιχούν σε κατηγορίες. Τέλος οι µη παραµετρικές µέθοδοι µπορούν να χρησιµοποιηθούν σαν προπαρασκευαστικές για αντίστοιχες παραµετρικές. Το κριτήριο του X, το κριτήριο του Mc-Nemar είναι µερικά Kolomogorov-Smirnov, το από τα κριτήρια που χρησιµοποιούµε στις µη παραµετρικές µεθόδους. ηλαδή οι µη παραµετρικές τεχνικές δεν απαιτούν υποθέσεις για τους πληθυσµούς από τους οποίους προέρχονται τα δείγµατα και ούτε έχουν περιορισµούς για τα µεγέθη τους. Η υπόθεση που ελέγχεται είναι Ηο : τα δυο δείγµατα προέρχονται από τον ίδιο πληθυσµό Η : τα δυο δείγµατα προέρχονται από διαφορετικούς πληθυσµούς.4) ΣΥΓΚΡΙΣΗ ΥΟ ΕΙΓΜΑΤΩΝ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ Μεταβλητή κατηγορίας είγµατα ανεξάρτητα X test καλής προσαρµογής. Προϋπόθεση: Όλες οι θεωρητικές τιµές από τον πίνακα συνάφειας να είναι µεγαλύτερες του και το 80% µεγαλύτερες από 5. ΤΕΣΤ X - ΚΑΛΗΣ ΠΡΟΣΑΡΜΟΓΗΣ Ηο : p = p,..., p = p (ελέγχει αν κάποια δεδοµένα προσαρµόζονται 0 k k0 σε κάποια θεωρητική) όπουp δοσµένες πιθανότητες τέτοιες ώστε i0 p + p p =, ενώ η εναλλακτική υπόθεση είναι Η: p p 0 0 k0 i i0 για κάποιο ι Στατιστικό : k ( n θ ) k n X = i i = i n i= θ i i= θ i ονοµάζεται «σταθµισµένο άθροισµα τετραγώνων των αποκλίσεων» και ελέγχει τις αποκλίσεις. Το n είναι η i παρατηρούµενη συχνότητα της ι-κατηγορίας και ονοµάζεται 0

10 παρατηρούµενο µέγεθος και το θ είναι η αναµενόµενη συχνότητα της ι- i κατηγορίας η οποία ονοµάζεται θεωρητικό ή αναµενόµενο µέγεθος. Απορριπτική περιοχή : R= { X X } όπου κ- είναι οι βαθµοί k, a ελευθερίας οι οποίοι ορίζονται ως εξής : βαθµοί ελευθερίας = πλήθος κατηγοριών πλήθος εκτιµώµενων παραµέτρων - Περιορισµός : θ 5, ι =,,...κ i Μεταβλητή κατηγορίας είγµατα εξαρτηµένα test Mc- Nemar (ελέγχει αν είναι σηµαντικές οι αλλαγές που έγιναν µε την επίδραση κάποιου γεγονότος). Μεταβλητή διάταξης είγµατα ανεξάρτητα test των Mann- Whitney (ελέγχει συγκρίνοντας τις διάµεσους των δειγµάτων αν µπορεί να θεωρηθούν ίσες οι µέσες τιµές στους πληθυσµούς). Τest προσήµου Μεταβλητή διάταξης είγµατα εξαρτηµένα (ποιοτικό ερώτηµα ) Test του Wilcoxon (ποσοτικό ερώτηµα ) Μεταβλητή ποσοτική είγµατα ανεξάρτητα t test (Προϋπόθεση : τα δυο δείγµατα τιµών προέρχονται από κανονική κατανοµή ) Αν δεν µπορούµε να θεωρήσουµε ότι η µεταβλητή ακολουθεί κανονική κατανοµή τότε χρησιµοποιούµε το test των Mann-Whitney. Μεταβλητή ποσοτική είγµατα εξαρτηµένα t test ζευγαρωτών παρατηρήσεων ( αν ισχύει η κανονικότητα ). ιαφορετικά χρησιµοποιούµε τον test του Wilcoxon..5) ΑΝΑΛΥΣΗ ΥΟ ΜΕΤΑΒΛΗΤΩΝ Απαραίτητη προϋπόθεση για την ανάλυση αυτή των µεταβλητών είναι η διάκριση τους σε ποιοτικές ή ποσοτικές. Οι µεταβλητές αυτές θα πρέπει να είναι ή και οι δυο ποιοτικές ή και δυο ποσοτικές.εµφανίζονται στα δεδοµένα µε την εξής δοµή: Παρατήρηση Χ-µεταβλητή Υ-µεταβλητή x y x y

11 n Αν οι µεταβλητές Χ,Υ είναι ποσοτικές, τα x και i αν όµως οι µεταβλητές Χ,Υ είναι ποιοτικές τότε τα ονόµατα των κατηγοριών στις οποίες αντιστοιχούν. x n y n y ορίζουν ποσότητες, i x και i y είναι τα i.5 Α )Για τα ποιοτικά χαρακτηριστικά : Οι µέθοδοι που εφαρµόζονται είναι οι πίνακες συνάφειας και οι γραφικές παραστάσεις. Με τη διαδικασία «Crosstabs» του SPSS µπορούµε να πετύχουµε όχι µόνο την άµεση κατασκευή του, αλλά επιπλέον να προχωρήσουµε και στην αναζήτηση της έντασης και της X έλεγχο ανεξαρτησίας και συσχετίσεις). φύσης της σχέση τους ( Αν και οι δύο µεταβλητές είναι ποιοτικές κατηγορίας τότε έχει νόηµα µόνο η ένταση των δύο µεταβλητών. Υπάρχουν µέτρα αναλογικής µείωσης του σφάλµατος πρόβλεψης τα οποία επιτυγχάνονται µε τους συντελεστές Lambda (λ) και τους συντελεστές αβεβαιότητας. Για την εφαρµογή τους απαραίτητο να θεωρήσουµε τη µια µεταβλητή ως ανεξάρτητη και την άλλη ως εξαρτηµένη χωρίς βέβαια ο χαρακτηρισµός αυτός να ορίζει την σχέση αιτίας και αποτελέσµατος. Oι Lambda (λ) στηρίζονται στο εξής: αν ξέρουµε τις τιµές για τη µια µεταβλητή (ανεξάρτητη) η καλύτερη πολιτική για να προβλέψουµε τις τιµές της άλλης (εξαρτηµένη) είναι να επιλέξουµε εκείνη µε τη µεγαλύτερη συχνότητα και έτσι ελαχιστοποιούµε τον αριθµό των λαθεµένων προβλέψεων 0 λ. Για λ= έχουµε πλήρη σχέση µεταξύ των µεταβλητών και εποµένως µπορούµε να προβλέψουµε ακριβώς την τιµή της εξαρτηµένης µεταβλητής. Για λ=0 οι δύο µεταβλητές είναι ανεξάρτητες µια και οι συχνότητες των κατηγοριών της εξαρτηµένης είναι ίδιες για κάθε τιµή της ανεξάρτητης. Οι συντελεστές αβεβαιότητας έχουν την ίδια λογική µε το Lambda αλλά είναι πιο αξιόπιστοι γιατί δεν χρησιµοποιούν για τον υπολογισµό τους µόνο την επικρατούσα τιµή αλλά όλες τις τιµές. Αν οι µεταβλητές είναι διάταξης (ordinal) χρησιµοποιούµε µέτρα τα οποία θα προσδιορίσουν και την ένταση αλλά και την φύση της συνάφειας (θετική ή αρνητική) όπου το λογισµικό τα χωρίζει σε κατηγορίες. Στην η ανήκουν εκείνα που απαιτούν το χαρακτηρισµό µιας µεταβλητής ως ανεξάρτητη και της άλλης ως εξαρτηµένης. Βασίζονται στην ιδέα ότι ο βαθµός της σχέσης που συνδέει δυο µεταβλητές µπορεί να µετρηθεί µε το βαθµό στον οποίο η γνώση των τιµών της µιας µεταβλητής βελτιώνει τις προβλέψεις µας για την άλλη. Τέτοια µέτρα είναι ο συντελεστής gamma (γ), οι συντελεστές Tau-b και Tau-c, οι συντελεστές του Kendall και του Somers. Όλοι αυτοί οι συντελεστές παίρνουν την µεγαλύτερη τιµή όταν υπάρχει πλήρης

12 σχέση µεταξύ των µεταβλητών και την τιµή 0 όταν οι µεταβλητές είναι ανεξάρτητες. Για τον υπολογισµό τους θα πρέπει να αναφέρουµε κάποια πράγµατα για τις έννοιες συµφωνία, ασυµφωνία, ισοπαλία. Θέλουµε να συγκρίνουµε το πλήθος Α των ζευγών που είναι σε συµφωνία µε το πλήθος Β αυτών που είναι σε ασυµφωνία. (Ένα ζευγάρι περιπτώσεων λέµε ότι είναι σε συµφωνία όταν οι τιµές και των µεταβλητών της µιας περίπτωσης είναι µεγαλύτερες από τις αντίστοιχες τιµές των µεταβλητών της άλλης περίπτωσης. Αντίθετα ένα ζευγάρι περιπτώσεων λέµε ότι είναι σε ασυµφωνία όταν η τιµή για τη µια µεταβλητή της µιας περίπτωσης είναι µεγαλύτερη από την αντίστοιχη τιµή της µεταβλητής της άλλης περίπτωσης, ενώ για τις τιµές της άλλης µεταβλητής ισχύει το αντίθετο). Αν το Α είναι πολύ µεγαλύτερο του Β τότε υπάρχει σχέση µεταξύ των µεταβλητών και µάλιστα όταν αυξάνεται η µια αυξάνεται και η άλλη. Εδώ έχουµε θετική συσχέτιση. Οµοίως όταν το Β είναι πολύ µεγαλύτερο του Α έχουµε αρνητικά συσχετισµένες µεταβλητές. Αν όµως Α Β τότε οι µεταβλητές είναι ασυσχέτιστες. Επειδή θέλουµε το µέτρο που θα κατασκευάσουµε να παίρνει τιµές στο [-, ] η διαφορά Α-Β θα πρέπει να τυποποιηθεί. Ο τρόπος µε τον οποίο επιχειρείται κάτι τέτοιο είναι η διαφορά των προαναφερθέντων µέτρων συνάφειας. Ο συντελεστής Τau-b είναι κατάλληλος για συµµετρικούς πίνακες ενώ ο Tau-c για µη συµµετρικούς. Στο συντελεστή gamma (γ) λαµβάνονται υπόψιν οι ισοπαλίες κάτι που δεν ισχύει για τους προηγούµενους συντελεστές. Τέλος µε τον συντελεστή d του Somers µπορούµε να κάνουµε υπολογισµούς θεωρώντας τη µια µεταβλητή εξαρτηµένη και την άλλη ανεξάρτητη. Στην περίπτωση που η µια µεταβλητή είναι κατηγορίας (nominal) και η άλλη διαστηµική (interval) θα χρησιµοποιούµε το συντελεστή eta (n) (0 n ). Στο 0 έχουµε πλήρη συµφωνία και στο πλήρη ασυµφωνία. Όπου n εκφράζει το ποσοστό της διασποράς της εξαρτηµένης µεταβλητής που εξηγείται από την ανεξάρτητη..5 Β) Για τα ποιοτικά χαρακτηριστικά: Οι δυνατότητες που έχουµε σε ποσοτικά χαρακτηριστικά είναι: Ι) να παρουσιάσουµε τα στατιστικά µέτρα µιας ποσοτικής µεταβλητής µέσα στις διάφορες κατηγορίες κάποιας ποιοτικής. ΙΙ) να παρουσιάσουµε (αλγεβρικά ή και γραφικά) τη µεταβολή µιας ποσοτικής µεταβλητής σε σχέση µε τη µεταβολή κάποιας άλλης ποσοτικής και αναζήτηση της µεταξύ τους σχέσης. Σε ένα διάγραµµα διασποράς ενδιαφερόµαστε να ανακαλύψουµε αν υπάρχουν περιπτώσεις στο δείγµα µας οι οποίες εµφανίζουν ασυνήθιστους συνδυασµούς τιµών µεταβλητών. Επιβεβαίωση µπορούµε να έχουµε από τα αντίστοιχα θηκογράµµατα και φυλλογραφήµατα (αναζητούµε τα παράτυπα και τα ακραία σηµεία της κάθε εµπλεκόµενης µεταβλητής). Επίσης η µελέτη ενός διαγράµµατος διασποράς φέρνει στην επιφάνεια πληροφορίες οι οποίες δεν είναι προσιτές από τον συντελεστή συσχέτισης (το στατιστικό µέτρο δηλαδή 3

13 που χρησιµοποιείται για την αναζήτηση της έντασης και της φύσης της σχέσης µεταξύ ποσοτικών µεταβλητών). Ο συντελεστής συσχέτισης του Pearson r µετρά την ένταση της γραµµικής συµµεταβολής ποσοτικών µεταβλητών των δεδοµένων µας. Όλα τα ( x, y ) βρίσκονται πάνω σε µια ευθεία µε αρνητική ή θετική i i κλίση. Παίρνει τιµές στο [-,]. Όσο πιο κοντά βρίσκεται ο συντελεστής συσχέτισης τόσο πιο έντονη είναι η γραµµική συµµεταβολή, ενώ µια τιµή ίση ή πολύ κοντά στο 0 δηλώνει απουσία γραµµικής σχέσης µόνο και όχι οποιασδήποτε άλλης σχέσης όπως π.χ. ανεξαρτησίας. Στο ( ] ορίζουν µια «ασθενή» γραµµική σχέση. Στο ( ] ορίζουν µια «µέτρια» γραµµική σχέση. Στο ( ) ορίζουν µια «ισχυρή» γραµµική σχέση. Το πρόσηµο δηλώνει τη φύση της σχέσης (θετική ή αρνητική). Η συσχέτιση τέλος δεν σηµαίνει αιτιότητα π.χ. ο υψηλός αρνητικός συντελεστής συσχέτισης ανάµεσα στα τροχαία ατυχήµατα και στον αριθµό των γεννήσεων δεν σηµαίνει τίποτα. Το SPSS πραγµατοποιεί τον εντοπισµό της έντασης και της φύσης µεταξύ µεταβλητών ποσοτικών µέσα από την εντολή Correlate. Ο έλεγχος υποθέσεων για το r του Pearson αποτιµά αν υπάρχει γραµµική σχέση µεταξύ των δυο µεταβλητών. Για να είναι αξιόπιστος θα πρέπει η από κοινού κατανοµή να είναι δισδιάστατη κανονική. Αν οι µεταβλητές είναι ποσοτικές και το διάγραµµα διασποράς έδειξε στοιχεία γραµµικής συµµεταβλητότητας τότε χρησιµοποιούµε τον συντελεστή συσχέτισης του Pearson. Αν οι µεταβλητές είναι διάταξης και οι ενδείξεις µας είναι µη γραµµικές τότε χρησιµοποιούµε τον συντελεστή συσχέτισης του Spearman ή τους συντελεστές Tau-b και Kendall. Επίσης θα πρέπει να προσέχουµε στην περίπτωση του υπολογισµού του συντελεστή συσχέτισης πολλών µεταβλητών ταυτόχρονα το χειρισµό µας στις ελλείπουσες τιµές. Τέλος θα ήτανε χρήσιµο να κάνουµε µια αναφορά για τον συντελεστή µερικής συσχέτισης r. Καταρχήν προσδιορίζει την ένταση p της γραµµικής σχέσης µεταξύ των δυο µεταβλητών του δείγµατος κάτω από την επίδραση µιας ή περισσοτέρων µεταβλητών ελέγχου. ηλαδή θεωρούµε ότι όλες οι περιπτώσεις του δείγµατος έχουν την ίδια τιµή ως προς τη µεταβλητή ελέγχου για την περίπτωση της γραµµικής συµµεταβλητότητας.για να µπορέσουµε να ερµηνεύσουµε το µερικό συντελεστή συσχέτισης r µεταξύ των µεταβλητών χρειαζόµαστε και p την τιµή του συντελεστή συσχέτισης. Αν r 0 και r = 0 τότε η p µεταβλητή ελέγχου επηρεάζει τη σχέση µεταξύ των µεταβλητών µας. Το SPSS το αντιµετωπίζει πάλι µε την εντολή Correlate Partial. Οι µερικές συσχετίσεις µπορεί να αποδειχθούν χρήσιµες στον εντοπισµό «ψεύτικων» σχέσεων (η σχέση µεταξύ των µεταβλητών Χ και Υ είναι «ψεύτικη» αν εµφανίζεται µόνο επειδή η Χ σχετίζεται µε τη Ζ η οποία µπορεί να χρησιµοποιηθεί για την πρόβλεψη της Υ). 4

14 Ο έλεγχος υποθέσεων για τον καθένα από τους µερικούς συντελεστές συσχέτισης r αποτιµά αν υπάρχει γραµµική σχέση µεταξύ p µεταβλητών. Για να είναι αξιόπιστος θα πρέπει η από κοινού κατανοµή όλων των εµπλεκοµένων µεταβλητών να είναι η πολυδιάστατος κανονική κατανοµή..6 ) ΣΧΕΣΗ ΣΥΓΚΡΙΣΗ ΜΕΤΑΒΛΗΤΩΝ ΤΟΥ Ι ΙΟΥ ΕΙΓΜΑΤΟΣ Όταν θέλουµε να βγάλουµε συµπεράσµατα για τη σύνδεση µεταβλητών τον πληθυσµό από τον οποίο έχει επιλεγεί το δείγµα χρησιµοποιούµε τους συντελεστές συσχέτισης. Οι συντελεστές αυτοί διαφοροποιούνται ανάλογα µε την κλίµακα µέτρησης των µεταβλητών και το ποια θεωρούµε ανεξάρτητη και εξαρτηµένη µεταβλητή. Πρέπει να αναφέρουµε επίσης ότι η αριθµητική συσχέτιση δυο δειγµάτων δεν σηµαίνει αναγκαστικά σχέση των µεταβλητών. Οι στατιστικοί έλεγχοι της σχέσης µεταβλητών απαντούν στο εξής ερώτηµα: Υπάρχει σχέση; (ελέγχουµε την υπόθεση της ανεξαρτησίας). Αν ναι υπολογίζουµε τη µαθηµατική σχέση που συνδέει τις µεταβλητές, τον κατάλληλο συντελεστή συσχέτισης και ποια είναι η κατεύθυνση της (αν έχουµε µεταβλητές διάταξης ή συνεχείς µπορούµε να υπολογίσουµε αν η αύξηση των τιµών της µιας συνδυάζεται µε αύξηση οπότε έχουµε θετική συσχέτιση). Οι γενικοί µέθοδοι που υπάρχουν για τον έλεγχο της σχέσης µεταβλητών είναι: ι) Παλινδρόµηση (όταν η εξαρτηµένη µεταβλητή είναι συνεχής) π.χ. µερικά χαρακτηριστικά παραδείγµατα είναι η ανάλυση διασποράς και η γραµµική παλινδρόµηση. ιι) Μέθοδοι που στηρίζονται στην απόσταση X (όταν η X test εξαρτηµένη µεταβλητή είναι ποιοτική ). Π.χ. το X ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ανεξαρτησίας. H : Τα δύο χαρακτηριστικά είναι ανεξάρτητα. 0 H : Τα δύο χαρακτηριστικά είναι εξαρτηµένα. s k ( n θ ) s k n ij ij ij Στατιστικό : X = = n i= j= θ ij i= j= θ ij Απορριπτική περιοχή : R= { X X ( s )( k ), a} Περιορισµός : θ 5 ι, j i Οι περιπτώσεις που µπορούµε να συναντήσουµε, θα αναφερθούν αναλυτικά παρακάτω: Εξαρτηµένη Μεταβλητή: Συνεχής 5

15 Ανεξάρτητη Μεταβλητή: Συνεχής Η µέθοδος που χρησιµοποιούµε είναι η γραµµική παλινδρόµηση όπου η σχέση των µεταβλητών εκφράζεται µε τη χρήση µιας ευθείας γραµµής και ο κατάλληλος συντελεστής είναι ο συντελεστής γραµµικής συσχέτισης του Pearson. O συντελεστής του Pearson µετρά την ένταση της γραµµικής σχέσης δύο ποσοτικών µεταβλητών ορίζοντας παράλληλα και τη φύση της. Εξαρτηµένη µεταβλητή: Συνεχής (ποσοτική ) / ιάταξης / ιάταξης Ανεξάρτητη µεταβλητή: ιάταξης (ποιοτική ) / Συνεχής / ιάταξης Χρησιµοποιούµε µη παραµετρική παλινδρόµηση µε τη χρήση του συντελεστή Spearman ο οποίος υπολογίζεται αντικαθιστώντας τις τιµές των παρατηρήσεων µε τις τάξεις τους και δεν έχει προϋποθέσεις κατανοµής στον πληθυσµό. Ο συντελεστής συσχέτισης του Spearman υπολογίζεται σαν ένα µέτρο έντασης της σχέσης µεταξύ των δύο µεταβλητών στην περίπτωση που και οι δύο είναι διάταξης (ordinal). Το διάγραµµα διασποράς δεν έχει νόηµα. Εξαρτηµένη µεταβλητή: Συνεχής (ποσοτική) Ανεξάρτητη µεταβλητή: Κατηγορίας (ποιοτική) Χρησιµοποιούµε την ανάλυση διασποράς. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ Η µέθοδος της ανάλυσης διασποράς δε διαφέρει ουσιαστικά από τη µέθοδο της παλινδρόµησης αλλά είναι απλούστερη γιατί χρησιµοποιεί αθροίσµατα τετραγώνων. Έχουµε µια εξαρτηµένη ποσοτική µεταβλητή Υ η οποία µπορεί να εξαρτάται από έναν παράγοντα Α ή από δυο ή περισσότερους παράγοντες Α και Β (που να επηρεάζουν ο ένας τον άλλον ή όχι). Οι τιµές που παίρνει ο παράγοντας λέγονται στάθµες. Η µέθοδος της ανάλυσης διασποράς στηρίζεται στην σύγκριση της µεταβλητότητας των τιµών y µέσα σε κάθε δείγµα. Η υπόθεση που ελέγχεται µε την ανάλυση διασποράς είναι: H µ = µ = µ =... = µ που σηµαίνει ότι τα κ-δείγµατα 0 3 k προέρχονται από τον ίδιο πληθυσµό. Ανάλογα µε το αν η εξαρτηµένη µεταβλητή ακολουθεί κανονική κατανοµή χρησιµοποιούµε παραµετρικό ή µη παραµετρικό test. Ο συντελεστής συσχέτισης που χρησιµοποιούµε είναι το eta. Εξαρτηµένη µεταβλητή: ιάταξης (ποιοτική )/ Κατηγορίας / Κατηγορίας Ανεξάρτητη µεταβλητή: Κατηγορίας (ποιοτική ) / ιάταξης / Κατηγορίας 6

16 Χρησιµοποιούµε το X test του πίνακα συνάφειας. Η υπόθεση της ανεξαρτησίας των µεταβλητών ελέγχεται από τον υπολογισµό της µη παραµετρικής απόστασης X του παρατηρούµενου πίνακα συνάφειας από τον θεωρητικό. Το µέγεθος της σχέσης σ ένα πίνακα συνάφειας δηλαδή πόσο δυνατή είναι η σχέση που υπάρχει ανάµεσα στις µεταβλητές και στον πίνακα συνάφειας ερµηνεύεται παρακάτω από τα µέτρα συνάφειας. ) Για πίνακες συνάφειας x ως µέτρο της σχέσης ορίζεται το X ϕ = n Τιµές του φ κοντά στο 0 µας δίνει ελάχιστη σχέση. Ενώ τιµές του φ κοντά στο έχουµε ταύτιση των χαρακτηριστικών. ) Για πίνακες sxk ως µέτρο της σχέσης δίνεται ο συντελεστής συνάφειας του Cramer που ορίζεται ως εξής: X V = όπου V [0,] n min{ s, k }.Το 0 είναι για πλήρη ανεξαρτησία και το V = είναι για πλήρη εξάρτηση, ή ο συντελεστής συνάφειας του Pearson που δίνεται από X q τη σχέση C= και 0 C όπου q = min {s,k} X + n q.7) ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ (ΣΧΕΣΗ ΜΕΤΑΞΥ ΜΕΤΑΒΛΗΤΩΝ) Οι µέθοδοι ταυτόχρονης παρουσίασης δύο τουλάχιστον ποιοτικών χαρακτηριστικών περιορίζονται στους πίνακες συνάφειας και τις γραφικές παραστάσεις. Με την εντολή Crosstabs βρίσκουµε όχι µόνο την άµεση κατασκευή τους αλλά επιπλέον την ένταση και τη φύση της (πιθανής) σχέσης τους πραγµατοποιώντας τους ανάλογους στατιστικούς ελέγχους. Ο έλεγχος ανεξαρτησίας γίνεται µε το ι) X test ανεξαρτησίας ιι) πιθανότητα σφάλµατος τύπου Ι ιιι) X λόγου πιθανοφάνειας (likelihood ratio chi-square) που χρησιµοποιείται µερικές φορές σαν εναλλακτική λύση του X test ανεξαρτησίας. Όταν έχουµε ποσοτικές και τις δύο µεταβλητές έχει νόηµα το linear-bylinear association chi-square στατιστικό, µια συνάρτηση του συντελεστή συσχέτισης του Pearson. Σε περίπτωση ενός x πίνακα συνάφειας θα χρησιµοποιήσουµε έναν έλεγχο κατάλληλο για τις περιπτώσεις που η αναµενόµενη τιµή ενός ή 7

17 και περισσοτέρων κελιών του πίνακα είναι µικρή. Η µέτρηση της έντασης και ο προσδιορισµός της φύσης της σχέσης των δύο µεταβλητών δε γίνεται από το X στατιστικό γιατί η τιµή του εξαρτάται από το µέγεθος του δείγµατος και έτσι δηµιουργούµε τα µέτρα συνάφειας τα οποία έχουν αναφερθεί παραπάνω. Για ποσοτικά χαρακτηριστικά: Η µελέτη της σχέσης ποσοτικών µεταβλητών γίνεται για: ι) πρόβλεψη και γι αυτό ψάχνουµε µια µαθηµατική σχέση που να περιγράφει τη σχέση των µεταβλητών. ιι) συσχέτιση Το γράφηµα δυο ποσοτικών µεταβλητών δηλαδή το διάγραµµα διασποράς αποτελεί το ο βήµα στην προσπάθεια εύρεσης σχέσης µεταξύ τους. Μπορούµε να διαπιστώσουµε αν οι µεταβλητές είναι τυχαία κατανεµηµένες ή υπάρχει κάποια σχέση µεταξύ των τιµών. ΠΑΛΙΝ ΡΟΜΗΣΗ Παλινδρόµηση είναι η προσπάθεια που κάνουµε για να περιγράψουµε πως µια µεταβλητή (Υ) εξαρτάται από κάποια άλλη (Χ) χρησιµοποιώντας το µεταξύ τους συντελεστή συσχέτισης. Η πιο απλή περίπτωση είναι η Y = b bx 0 + που είναι η γραµµική παλινδρόµηση. Για να εκτιµήσουµε τις παραµέτρους b και b χρησιµοποιούµε τη µέθοδο 0 των ελαχίστων τετραγώνων. Στην παλινδρόµηση ο έλεγχος υποθέσεων για τις παραµέτρους b, b καθώς και των καταλοίπων 0 (διαφορά παρατηρούµενων και προβλεπόµενων τιµών) είναι σηµαντικός. π.χ. Ηο : b =0. Αν η µηδενική υπόθεση είναι αληθής, οι τιµές της Υ δεν εξαρτώνται από εκείνες της Χ και άρα δεν υπάρχει κάποια στατιστική σχέση µεταξύ Χ και Υ. Αν όµως η Ηο απορριφθεί η σχέση µεταξύ Χ και Υ επιβεβαιώνεται. Το SPSS πραγµατοποιεί την γραµµική παλινδρόµηση µέσω της εντολής Regression. Mε τον όρο κατάλοιπο χαρακτηρίζουµε τη διαφορά µεταξύ της παρατηρούµενης και εκτιµούµενης τιµής της εξαρτηµένης µεταβλητής ψ. Το πρόσηµο ενός καταλοίπου απλά µας πληροφορεί αν η αντίστοιχη περίπτωση είναι άνω ή κάτω από την ευθεία ελαχίστων τετραγώνων. Επίσης η ευθεία ελαχίστων τετραγώνων Y = b b 0 + X µπορεί να χρησιµοποιηθεί και για την πρόβλεψη της µέσης τιµής της εξαρτηµένης µεταβλητής. Τέλος, αλλά µε ιδιαίτερη σηµασία, άλλη µια υπόθεση που πρέπει να ελέγχεται στην παλινδρόµηση είναι εκείνη της ανεξαρτησίας των παρατηρήσεων. Αυτό γίνεται µε τη βοήθεια του διαγράµµατος διασποράς των t-καταλοίπων προς µια µεταβλητή που παριστά τη σειρά µε την οποία έγιναν οι παρατηρήσεις. 8

18 Τέλος αναφέρουµε και κάποιους ορισµούς σχετικά µε την συσχέτιση και οι οποίοι είναι σηµαντικό να αναφερθούν: Συντελεστής προσδιορισµού r : Η ποσότητα r καλείται συντελεστής προσδιορισµού και η ποσότητα -r παριστάνει το ποσοστό της συνολικής µεταβλητότητας που οφείλεται στο συνολικό σφάλµα. Στην περίπτωση που οι µεταβλητές Χ κα Υ είναι και οι τυχαίες µεταβλητές τότε σαν µέτρο συσχέτισης των, ορίζεται η ποσότητα Cov ( X, Y ) ρ = µε Cov ( X, Y ) = E( X X )( Y Y ) που καλείται VarXVarY συντελεστής θεωρητικής συσχέτισης. Επειδή όµως είναι δύσκολο να S υπολογισθεί εκτιµάται από την ποσότητα r= XY όπου S S X Y = n ( y nx ) i y n S x και S = ( ) XY n i x i nx, οµοίως για το X i= n i= S. Y Ο r καλείται συντελεστής εµπειρικής συσχέτισης ή απλά συντελεστής συσχέτισης και ο οποίος είναι συµµετρικός ως προς Χ και Υ και παίρνει τιµές στο [-,]. 9

19 ΚΕΦΑΛΑΙΟ ΠΟΛΥ ΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ.) ΕΙΣΑΓΩΓΗ Γενικά µιλώντας για Ανάλυση εδοµένων, εννοούµε ένα σύνολο µεθόδων οι οποίες ξεκινώντας από τα ίδια τα δεδοµένα και χωρίς να κάνουν καµία υπόθεση ερευνούν τις τάσεις τις σχέσεις και τις οµαδοποιήσεις τους. Παρουσιάζουν τα δεδοµένα και τις µεταξύ τους σχέσεις, µε όσο γίνεται εποπτικότερο τρόπο και επιµένουν κυρίως στη γραφική αναπαράστασή τους, ώστε να µπορούν να ερµηνεύουν τα αποτελέσµατα πολύ εύκολα. ιαφέρει από τις υπόλοιπες στατιστικές µεθόδους, στην απουσία των αρχικών υποθέσεων και κανόνων που θα πρέπει να πληρούν τα δεδοµένα και εντοπίζει τις σχέσεις κατευθείαν από τα αρχικά δεδοµένα.ξεκινώντας από τα αρχικά δεδοµένα συνήθως ποιοτικά και ετερογενή χρειάζεται η εύρεση των µεταξύ τους σχέσεων καθώς και η µέτρηση της έντασης της σχέσης αυτής ώστε να ξεχωρίσουν οι κυρίαρχες τάσεις των δεδοµένων και να αναδειχθούν από το µεγάλο τους όγκο µόνο σηµαντικά συµπεράσµατα.(µε εφαρµογή κατάλληλων κριτηρίων οµοιότητας ή απόστασης ). Όταν µιλάµε για δεδοµένα εννοούµε ότι πρόκειται για ένα µεγάλο σύνολο χαρακτηριστικών (τόσο ποσοτικών όσο και ποιοτικών ) που αναφέρονται σ ένα πλήθος ατόµων ή αντικειµένων.αν όλα τα χαρακτηριστικά είναι ποσοτικά, έχουνε προταθεί διάφορες µέθοδοι τόσο της Ανάλυσης εδοµένων, όσο και της υπόλοιπης Στατιστικής.Ιδιαίτερη αντιµετώπιση απαιτείται, όταν υπάρχουν ποιοτικά χαρακτηριστικά ή συνδυασµός ποσοτικών και ποιοτικών χαρακτηριστικών ή ακόµη και αντικείµενα σε διάταξη. Η Πολυδιάστατη Ανάλυση εδοµένων εµφανίστηκε ως επαγωγική αναζήτηση κρυµµένων διαστάσεων που ορίζονται από συνδυασµούς πρωτογενών µετρήσεων, εµφανίστηκε στις αρχές του αιώνα, χάρη στην ψυχοµετρία και ιδιαίτερα χάρη στις εργασίες του Αµερικάνου ψυχολόγου Ch.Spearman και αποτελεί µια νέα µεθοδολογία που η στατιστική προσφέρει στις επιστήµες του ανθρώπου και της κοινωνίας. Όπως επισηµαίνει ο J-R-Benzecri η βιοµετρία και η ψυχοµετρία δώσανε ιδέες για την εξέλιξη των πολυδιάστατων µεθόδων, αλλά µόνο η αναγκαιότητα επεξεργασίας µη µετρικών δεδοµένων έφερε την ολοκλήρωση των µεθόδων αυτών. Μη µετρικά δεδοµένα είναι αυτά που προέρχονται από ένα σύνολο µεταβλητών, οι οποίες παίρνουν τιµές που δεν είναι αριθµοί αλλά είναι τα στοιχεία ενός πεπερασµένου συνόλου.(π.χ. τα δεδοµένα που προέρχονται από ερωτήσεις κλειστού τύπου ) Παρολαυτά δεν είναι µέθοδοι χωρίς µαθηµατική θεµελίωση.η βασική τους θεµελίωση βασίζεται κυρίως στα µαθηµατικά και κυρίως στην εύρεση µετρικών αποστάσεων µεταξύ των δεδοµένων αλλά και 0

20 οµάδων δεδοµένων και στην ποσοτική αντιστοίχηση και µέτρηση των οµάδων. Η Πολυδιάστατη Ανάλυση εδοµένων προσφέρεται στην περίπτωση που οι πληροφορίες τις οποίες διαθέτουµε για ένα φαινόµενο και οι οποίες βρίσκονται µε µορφή ενός αριθµητικού πίνακα δεδοµένων αφορούν πολλές µεταβλητές.η ανάλυση δεδοµένων αποτελεί ένα όργανο παρατήρησης και έρευνας µε το οποίο µπορούµε να διερευνήσουµε την κρυµµένη πολυδιάστατη πραγµατικότητα. Οι Πολυδιάστατες Στατιστικές Μέθοδοι έχουν µερικά βασικά χαρακτηριστικά τα οποία θα αναφερθούν παρακάτω ) Ο πολυδιάστατος χαρακτήρας των δεδοµένων.περιλαµβάνει πλήθος διαστάσεων.με την εφαρµογή των πολυδιάστατων στατιστικών µεθόδων το όφελος είναι τόσο ποιοτικό όσο και ποσοτικό.είναι ποιοτικά διαφορετικό να µελετούµε κάθε µεταβλητή ξεχωριστά ή τις µεταβλητές ανά-δύο από το να µελετούµε κάθε µεταβλητή ως προς το σύνολο των διασυνδέσεων της µε όλες τις υπόλοιπες µεταβλητές. ) Μια πολύπλοκη πληροφορία µπορεί να απεικονιστεί στα παραγοντικά διαγράµµατα που προκύπτουν από τις παραγοντικές µεθόδους 3) Οι πολυδιάστατες µέθοδοι δε βασίζονται σε οποιαδήποτε θεωρητική κατανοµή και εφαρµόζονται χωρίς παρόµοιες τεχνικές προϋποθέσεις 4) Υπάρχει αξιοπιστία αποτελεσµάτων και σταθερότητα διότι στην πολυδιάστατη στατιστική το καλύτερο κριτήριο της αξιολόγησης των αποτελεσµάτων δεν ανάγεται σε ελέγχους υποθέσεων αλλά σε ελέγχους της σταθερότητας των δοµών που προκύπτουν από την ανάλυση ( οι τεχνικές επαναδειγµατοληψίας οι καλύτερες για τον έλεγχο της αξιοπιστίας. Έτσι αξιολογούµε τη µεταβλητότητα µιας δοµής ή µιας παραµέτρου, µε βάση τη µεταβλητότητα που παρουσιάζει η δοµή ή η παράµετρος για το σύνολο δεδοµένων Οι δύο βασικές οικογένειες µεθόδων που πληρούν τα προηγούµενα κριτήρια είναι α) οι Παραγοντικές Μέθοδοι και β) οι µέθοδοι Αυτόµατης Ταξινόµησης. Οι Παραγοντικές Μέθοδοι περιλαµβάνουν την Παραγοντική Ανάλυση, την Ανάλυση Πολλαπλών Αντιστοιχιών (Correspodence Analysis) και βασίζονται στην κατασκευή αξόνων και στη γραφική απεικόνιση των σχέσεων των στοιχείων του πίνακα που αναλύουµε.οι µέθοδοι Αυτόµατης Ταξινόµησης (Cluster Analysis ) δηµιουργούν οµοιογενείς οµάδες ατόµων στη βάση της οµοιότητας των χαρακτηριστικών των ατόµων αυτών. Θα εξετάσουµε την Παραγοντική Ανάλυση µε τη βοήθεια των ισχυρών συνεκτικών συνιστωσών παρακάτω, οπότε για να κατανοήσουµε καλύτερα τη µέθοδο αµέσως παρακάτω θα µελετήσουµε τις ισχυρές συνεκτικές συνιστώσες ως προς τι σκοπό έχουνε,πως ορίζονται και τι εκφράζουν.

21 .) ΚΥΡΙΕΣ ΣΥΝΕΚΤΙΚΕΣ ΣΥΝΙΣΤΩΣΕΣ Τις κύριες συνεκτικές συνιστώσες θα τις αναλύσουµε µε δύο τρόπους : α) Από µαθηµατικής πλευράς και β) από την ερµηνεία των αξόνων, των γραφικών απεικονίσεων των σχέσεων που προκύπτουν κάνοντας διάφορες αντιστοιχίσεις µε τον πίνακα δεδοµένων που αναλύουµε. Η ανάλυση πολυµεταβλητών δεδοµένων είναι δύσκολη όταν το πλήθος των µεταβλητών (κ) είναι µεγάλο και όταν οι µεταβλητές είναι υψηλά συσχετισµένες µεταξύ των. Το κ αναφέρεται ως η διάσταση των δεδοµένων.η ανάλυση κύριων συνιστωσών είναι µια τεχνική που έχει ως στόχο την µείωση της διάστασης των δεδοµένων διατηρώντας σχεδόν όλη k την ολική µεταβλητότητα Var( X ) των αρχικών µεταβλητών i i= X X.Συγκεκριµένα επιδιώκεται µε την τεχνική αυτή η ανεύρεση,..., k πιο λίγων µεταβλητών, p k που είναι γραµµικοί Y,....,Y p συνδυασµοί των X X,είναι ασυσχέτιστες µεταξύ των,και έχουν,..., k p ολική µεταβλητότητα, Var( Y ),ίση σχεδόν µε αυτήν των X X i,..., k i= k p,δηλ Var( X ) i Var( Y ).Οι µεταβλητές Y,...,Y, p k i p i= i= λέγονται κύριες συνιστώσες (principal components).οι κύριες συνιστώσες στη συνέχεια µπορούν να αντικαταστήσουν τις αρχικές µεταβλητές και το αρχικό σύνολο δεδοµένων να µειωθεί σε σύνολο δεδοµένων µε ρ µετρήσεις σε καθένα από τα n άτοµα, όπου οι µετρήσεις τώρα γίνονται επί των κυρίων συνιστωσών. Έτσι η ανάλυση δεδοµένων γίνεται από τον R k p στον R µια και η αρχική διάσταση κ µειώνεται σε ρ.τέλος σηµαντικό είναι να αναφέρουµε ότι η τεχνική των κύριων συνιστωσών δεν επιτυγχάνει πάντοτε τη µείωση της διάστασης ( π.χ. αυτό συµβαίνει όταν οι αρχικές µεταβλητές είναι ασυσχέτιστες )και ότι είναι ένα ενδιάµεσο στάδιο ευρύτερης ανάλυσης.οι κύριες συνιστώσες µπορούν να ληφθούν και να ερµηνευθούν από τον πίνακα συνδιακύµανσης, τον πίνακα συσχέτισης, από τον πίνακα δειγµατικής συνδιασποράς και δειγµατικής συνδιακύµανσης.ο τρόπος µε τον οποίο συνδυάζονται και οι σχέσεις οι οποίες εφαρµόζονται αναπτύσσονται παρακάτω αναλυτικά.

22 .3) ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ ΑΠΟ ΤΟΝ ΠΙΝΑΚΑ ΣΥΝ ΙΑΚΥΜΑΝΣΗΣ Έστω X,..., X, κ τυχαίες µεταβλητές και X ένα διάνυσµα k τέτοιο ώστε X = ( X,..., X ) ', Cov ( X ) =Σ 0 ο πίνακας συνδιακύµανσης, k και λ λ... λ 0 οι ιδιοτιµές του Σ τότε ισχύει k λ ' 0 λ.. QΣ Q=Λ= λk πίνακας µε Q= ( q,..., q ) όπου k όπου Q είναι ένας κxκ ορθογώνιος q R k είναι ορθογώνια διανύσµατα i του Σ µε µοναδιαίο µήκος που αντιστοιχούν στις ιδιοτιµές λ.θέτουµε i Y = ( Y,..., Y ) ' = Q ' X.Τότε Cov (Y ) = Λ και οι τυχαίες µεταβλητές k Y q ' X =, Y q ' = X,..., Y = q ' k k X είναι ασυσχέτιστες γραµµικές συναρτήσεις των X,..., X k η διακύµανση της είναι η µεγαλύτερη ιδιοτιµή.η Y λέγεται πρώτη κύρια συνιστώσα και λ του Σ. Η Y λέγεται δεύτερη κύρια συνιστώσα και η διακύµανση της είναι η δεύτερη µεγαλύτερη ιδιοτιµή λ του Σ. Όµοια ορίζονται και οι υπόλοιπες κύριες συνιστώσες.επίσης από τον ορισµό έχουµε ότι Var( Y ) Var( Y )... Var( Y ) και επιπλέον k k k k Var( Y ) = λ = trσ= Var( X ) () και εποµένως η ολική i i i i= i= i= µεταβλητότητα των κυρίων συνιστωσών είναι ίση προς την ολική µεταβλητότητα των αρχικών µεταβλητών. Από τη σχέση () µπορούµε να λ πούµε ότι i πολλαπλασιαζόµενο µε 00 είναι το ποσοστό k λ j j= συνεισφοράς της ι κύριας συνιστώσας στην ολική µεταβλητότητα των αρχικών µεταβλητών (δεδοµένων) ή το ποσοστό της ολικής µεταβλητότητας των αρχικών µεταβλητών που εξηγείται από την ι-κύρια συνιστώσα Αν τώρα για κάποιο ρ< κ το ποσοστό αυτό είναι κοντά στο 00% τότε οι πρώτες κύριες συνιστώσες εξηγούν το µεγαλύτερο ποσοστό της ολικής µεταβλητότητας και οι υπόλοιπες κ-ρ µπορούν να αγνοηθούν στη 3

23 περαιτέρω ανάλυση.σηµειώνουµε ότι µικρές τιµές του ρ είναι επιθυµητές και τέτοιες τιµές σηµαίνουν ότι δεν χρειάζονται πολλές από τις αρχικές τιµές µεταβλητές που ουσιαστικά µετρούν παρόµοια πράγµατα Μια άλλη ιδιότητα που έχουν οι κύριες συνιστώσες είναι : Η πρώτη κύρια συνιστώσα Y q ' X = έχει τη µεγαλύτερη διακύµανση, λ, µεταξύ όλων των γραµµικών συνδυασµών της µορφής είναι ασυσχέτιστοι µε την Y, η κύρια συνιστώσα a ' X µε a ' a= που Y = q ' X έχει τη µεγαλύτερη διακύµανση, λ.γενικά µεταξύ όλων των γραµµικών συνδυασµών a ' X µε a ' a= που είναι ασυσχέτιστοι µε τις Y,..., Y, η m κύρια συνιστώσα Y = q ' X έχει τη µεγαλύτερη m m m διακύµανση, λ. Τέλος αξίζει να αναφέρουµε ότι η γραµµική m συνάρτηση a ' X έχει διακύµανση Var( a ' X ) = aσ ' a και η συνθήκη να είναι η a ' X ασυσχέτιστη µε την ι κύρια συνιστώσα Y = q ' X σηµαίνει i i 0= Cov( a ' X, q ' ix ) = a ' Σq = λ a ' q επειδή i i i Σ q = q i λ.εποµένως πρέπει i i a ' q = 0.Η ιδιότητα αυτή των κύριων συνιστωσών µπορεί να i χρησιµοποιηθεί και σαν άλλος τρόπος ορισµού των κυρίων συνιστωσών και έχει ευνόητη ερµηνεία από στατιστικής πλευράς αναφορικά µε τη µέγιστη δυνατή µείωση της διάστασης των δεδοµένων..4) ΚΥΡΙΕΣ ΣΥΝΕΚΤΙΚΕΣ ΣΥΝΙΣΤΩΣΕΣ ΣΥΣΧΕΤΙΣΕΙΣ Ένας τρόπος ερµηνείας των κύριων συνιστωσών ο οποίος είναι και αξιόπιστος είναι µέσω των συσχετίσεων αποφεύγοντας έτσι και παρερµηνείες που µπορεί να προκληθούν εάν οι αρχικές µεταβλητές µετρούνται σε διαφορετικές µονάδες µέτρησης Γενικά η συσχέτιση µιας µεταβλητής Y µε τη X δίνεται άπω τη σχέση j i λ j p = q όπου Q= ( q ) είναι τα ιδιοδιανύσµατα, Y, X ij j i σ ij ii ιδιοτιµές του Σ και σ ( X ) ii =Var i λ οι j ΓΕΩΜΕΤΡΙΚΗ ΕΡΜΗΝΕΙΑ Επίσης µπορούµε να δούµε και τη γεωµετρική ερµηνεία των κυρίων συνιστωσών.καταρχήν η κατασκευή των κυρίων συνιστωσών έχει 4

24 να κάνει µόνο µε τον πίνακα συνδιασποράς Σ του X και όχι µε την κατανοµή του X. Οι κύριες συνιστώσες του X είναι οι συντεταγµένες του X σε ένα σύστηµα ορθογωνίων αξόνων που προκύπτει από το αρχικό µε στροφή µέχρι οι άξονες οι αρχικοί να συµπέσουν µε τις διευθύνσεις των ιδιοδιανυσµάτων q,..., q k.5 ) ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ ΑΠΟ ΤΟΝ ΠΙΝΑΚΑ ΣΥΣΧΕΤΙΣΗΣ Οι κύριες συνιστώσες επηρεάζονται πολύ από τις µεταβλητές που παρουσιάζουν µεγάλη διασπορά όταν οι µεταβλητές αυτές µετρούνται σε διαφορετικές µονάδες µέτρησης ή είναι πολύ διαφορετικά τα πεδία τιµών των και το εύρος µεγάλο. Σε αυτές τις περιπτώσεις είναι προτιµότερο να τυποποιούνται οι µεταβλητές και στη συνέχεια να εφαρµόζεται η τεχνική των κύριων συνιστωσών στον πίνακα συνδιασποράς των τυποποιηµένων µεταβλητών που δεν είναι άλλος από τον πίνακα συσχέτισης των αρχικών µεταβλητών X µ Οι τυποποιηµένες µεταβλητές είναι Z = i i όπου ι=,..., κ i σ ii ή συνοπτικά Z = ( X µ ) όπου = diag( σ,..., σ ) kk.εποµένως Cov ( Z) = Σ = P( p ) = πίνακας συσχέτισης των ij X,..., X. Οι κύριες συνιστώσες του κ θα ληφθούν από τα k ιδιοδιανύσµατα του πίνακα συσχέτισης (correlation matrix).σηµειώνουµε ότι οι διασπορές των Z, δηλαδή τα διαγώνια στοιχεία του i Ρ είναι και συνεπώς η ολική µεταβλητότητα των Z είναι κ(= το πλήθος i των µεταβλητών ) Συµβολίζουµε λ λ... λ 0 τις ιδιοτιµές του Ρ και k Q= ( q, q,..., q ) τα αντίστοιχα ορθογώνια διανύσµατα. Τότε οι κύριες κ συνεκτικές συνιστώσες που προκύπτουν από το Ρ ορίζονται µε παρόµοιο τρόπο και έχουν ανάλογες ιδιότητες όπως αυτές ορίζονται από τον Σ. Η j κύρια συνιστώσα είναι ' ' Y = q K = q ( X µ ), j =,...,κ και j j j ισχύει k k Var ( Y ) = Var( Z ) = k.οι j j j= j= Y είναι µεταξύ τους j 5

25 ασυσχέτιστες και το ποσοστό συνεισφοράς της λ j µεταβλητότητα είναι 00* k % Y στην ολική j Ακόµη p = q λ.τέλος πρέπει να τονιστεί ότι οι ποσότητες Y, K ij j j i ( q, ) i λ i που προκύπτουν από το Σ είναι διαφορετικές από τις αντίστοιχες ( q, ) i λ i που προκύπτουν από τον Ρ.6) ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ ΑΠΟ ΤΟΝ ΠΙΝΑΚΑ ΕΙΓΜΑΤΙΚΗΣ ΣΥΝ ΙΑΣΠΟΡΑΣ ΚΑΙ ΤΟΝ ΠΙΝΑΚΑ ΕΙΓΜΑΤΙΚΗΣ ΣΥΣΧΕΤΙΣΗΣ Στα περισσότερα προβλήµατα που συναντούµε ο πίνακας Σ ( ή ο πίνακας Ρ )είναι άγνωστος και συνεπώς το ίδιο είναι οι ιδιοτιµές του λ και τα αντίστοιχα ιδιοδιανύσµατα z αλλά και τις κύριες i i συνιστώσες Y = q ' X Στην πράξη αυτό που έχουµε στην διάθεσή µας j j είναι ένας πίνακας δεδοµένων µε στοιχεία τις µετρήσεις κ µεταβλητών.αυτά τα δεδοµένα έχουν δειγµατικό µέσο X πίνακα δειγµατικής συνδιασποράς S και πίνακα δειγµατικής συσχέτισης R Εφόσον τα λ και q που αντιστοιχούν στον Σ είναι άγνωστα,εκτιµώνται i i από τις αντίστοιχες ποσότητες του S = ( )( ) ' X X X X n i (που είναι i ο εκτιµητής του Σ )και στη συνέχεια εκτιµώνται οι κύριες συνιστώσες Υj Έστω Q= ˆ ( qˆ,..., qˆ ) ορθογώνιος κxκ πίνακας τέτοιος ώστε κ ˆ λ 0 0 Q ˆ ' SQ=Λ= ˆ ˆ [... ] όπου ˆ λ... λˆ 0 είναι οι ιδιοτιµές του S.Tότε k 0 0 ˆ λ κ οι Yˆ = qˆ ' X, j =,..., κ λέγονται δειγµατικές κύριες συνιστώσες j j Οι Yˆ που είναι εκτιµητές των Υj έχει ανάλογες ιδιότητες δηλαδή j Ι) ειγµατική ιασπορά της ΙΙ) ειγµατική Συνδιασπορά Yˆ = j λˆ j Yˆ και Yˆ = 0 j m 6

26 ΙΙΙ) Ολική ειγµατική ιασπορά των ΙV) ειγµατικός συντελεστής συσχέτισης Yˆ = trs = j Yˆ και j ˆ λ + ˆ λ +... ˆ λ + k X i qˆ ij = Όταν οι µεταβλητές µετρούνται σε διαφορετικές µονάδες µέτρησης είναι προτιµότερο τα δεδοµένα να τυποποιούνται και να εφαρµόζεται ανάλυση κύριων συνιστωσών επί του πίνακα δειγµατικής συσχέτισης R.Αν συµβολίσουµε µε ˆ λ... λˆ 0 και qˆ,..., qˆ τις k k ιδιοτιµές και ιδιοδιανύσµατα του R, οι κύριες συνιστώσες είναι τότε X X Yˆ = qˆ ' Z, όπου Z = ( z ) ' και Z = i i,ι =,...,κ j j i i s ii Τέλος όταν οι κύριες συνιστώσες υπολογίζονται από τον Ρ ή R ένας εµπειρικός κανόνας είναι να κρατήσουµε εκείνες τις κύριες συνιστώσες για τις οποίες οι αντίστοιχες ιδιοτιµές είναι µεγαλύτερες της µονάδας και έτσι αυτές εξηγούν το /κ της ολικής µεταβλητότητας s ii λˆ j 7

27 ΚΕΦΑΛΑΙΟ 3 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ 3.) ΕΙΣΑΓΩΓΗ Ο Βασικός σκοπός της Παραγοντικής Ανάλυσης είναι να περιγράψει τη σχέση συνδιασποράς ανάµεσα σε πολλές µεταβλητές µη παρατηρήσιµων τυχαίων µεταβλητών που καλούνται παράγοντες. Έστω ότι οι τυχαίες µεταβλητές µπορούν να οµαδοποιηθούν µε βάση τις συσχετίσεις τους. Αυτό σηµαίνει ότι κάθε µεταβλητή που ανήκει σε µια οµάδα έχει µεγάλη συσχέτιση µε τις υπόλοιπες τυχαίες µεταβλητές που ανήκουν στην ίδια οµάδα αλλά έχει σχετικά µικρή συσχέτιση µε τυχαίες µεταβλητές που ανήκουν σε άλλες οµάδες.εποµένως κάθε τέτοια οµάδα τυχαίων µεταβλητών αναπαριστά από µόνη της ένα βαθύτερο παράγοντα που είναι υπεύθυνος για τις παρατηρηθείσες συσχετίσεις. Η Παραγοντική Ανάλυση µπορεί να θεωρηθεί ως µια προέκταση της ανάλυσης των κυρίων συνιστωσών. Και οι δύο αυτές µέθοδοι χρησιµοποιούνται για να προσεγγίσουν τον πίνακα συνδιασποράς Σ. 3.) ΤΟ ΟΡΘΟΓΩΝΙΟ ΠΑΡΑΓΟΝΤΙΚΟ ΜΟΝΤΕΛΟ Έστω ότι έχουµε το παρατηρηθέν τυχαίο διάνυσµα Χ που έχει ρ συνιστώσες µέση τιµή µ και πίνακα συνδιασποράς Σ.Το Χ είναι γραµµικά ανεξάρτητο µε κάποιες µη παρατηρήσιµες τυχαίες µεταβλητές F, F,..., F που καλούνται κοινοί παράγοντες ( common m factors ). To µοντέλο είναι : X µ = l F + l F l F +ε m m X µ = l F + l F l F +ε m m.. ().. X µ = l F + l F l F + ε p p p p pm m p 8

28 ή µε µορφή πινάκων έχουµε X µ = L F + ε. () px px pxm mx px Ο συντελεστής l αναπαριστά το βάρος της ι µεταβλητής στον j ij παράγοντα, έτσι ο πίνακας L είναι ο πίνακας των παραγοντικών βαρών. Για να ορίσουµε το παραγοντικό µοντέλο X, X,..., X από τις p παρατηρήσεις λόγω του ότι ο αριθµός των αγνώστων ποσοτήτων είναι µεγάλος κάνουµε τους εξής ισχυρισµούς : ) ( F) E = 0, mx Cov ( F) = E( FF ' ) = I mxm ) E ( ε ) = 0, px Cov( ε ) = E( εε ' ) = Ψ = pxp ψ ψ ψ p F ' ) 3 ) Τα F, ε είναι ασυσχέτιστα, δηλαδή Cov( ε, F) = E( ε, = 0 pxm 4) Από τη σχέση () προκύπτει ότι όταν είναι γραµµική η σχέση µεταξύ των βασικών παραγόντων και των ρ συνιστωσών έχουµε Σ= Cov ( X ) = E( X µ )( X µ )' =... = LL ' + Ψ. Επίσης παρατηρούµε ότι Cov ( X, F) = L, Cov ( X) = LL ' + Ψ ή Var( X ) = l l + ψ και Cov ( X, X ) = l l l l. i i im i i k ik imkm Τέλος για να ολοκληρώσουµε την παρουσίαση του µοντέλου ορίζουµε και µια άλλη παράµετρο h : communality, που δίνεται από την i εξίσωση h = l l αφού σ = l l + ψ = h + ψ, ι = i i im ii i im i i i,,...,ρ δηλαδή η ι-οστή communality είναι το άθροισµα των τετραγώνων των βαρών της ι-οστής µεταβλητής στους m κοινούς παράγοντες. Το παραγοντικό µοντέλο υποθέτει ότι οι p(p+)/ διασπορές και συνδιασπορές για τον Χ µπορούν να αναπαρασταθούν από τα mp παραγοντικά βάρη l και τις ρ συγκεκριµένες διασπορές ψ. Όταν m=p ij i κάθε πίνακας συνδιασποράς Σ µπορεί να αναπαρασταθεί από το γινόµενο LL '. Παρολαυτά στην περίπτωση που το m είναι αρκετά µικρότερο από το ρ, η µέθοδος της παραγοντικής ανάλυσης αποδεικνύεται να είναι πιο χρήσιµη. Στην περίπτωση αυτή το παραγοντικό µοντέλο παρέχει µια «απλή» περιγραφή των συνδιασπορών 9

29 του Χ µε λιγότερες από ρ(ρ+)/ άγνωστες παραµέτρους που είχαµε στον Σ. υστυχώς όµως πολλοί πίνακες συνδιασποράς Σ δεν µπορούν να γραφτούν σύµφωνα µε την µορφή LL ' + Ψ, όταν ο αριθµός των κοινών παραγόντων m είναι πολύ µικρότερος από τον αριθµό των αρχικών µεταβλητών ρ. Η ανάλυση του παραγοντικού µοντέλου συνεχίζεται θεωρώντας συνθήκες που επιτρέπουν τη µοναδική εκτίµηση των L, Ψ. Χρειαζόµαστε εποµένως εκτιµητές για τους παράγοντες. 3.3) ΜΕΘΟ ΟΙ ΕΚΤΙΜΗΣΗΣ Το ερώτηµα που τίθεται είναι αν το παραγοντικό µοντέλο Χ = µ + LF + ε µε µικρό αριθµό κοινών παραγόντων µπορεί να αναπαραστήσει επαρκώς τα δεδοµένα. ηλ προσπαθούµε να επαληθεύσουµε τη συνθήκη διασποράς Cov ( X) = LL ' + Ψ και συνδιασποράς Cov ( X, F) = L. Έστω ο S o εκτιµητής του Σ. Αν τα εκτός διαγωνίου στοιχεία είναι µικρά ή τα αντίστοιχα στοιχεία στον δειγµατικό πίνακα συσχέτισης R είναι ουσιαστικά µηδέν, οι µεταβλητές είναι ασυσχέτιστες οπότε η µέθοδος είναι άχρηστη. Κάτω από αυτές τις συνθήκες οι συγκεκριµένοι παράγοντες ε παίζουν σηµαντικό ρόλο αφού ο σκοπός της παραγοντικής ανάλυσης είναι να προσδιορίσει λίγους βασικούς κοινούς παράγοντες. Αν ο Σ διαφέρει σηµαντικά από ένα διαγώνιο πίνακα, τότε το παραγοντικό µοντέλο µπορεί να αναπροσδιορισθεί και το αρχικό πρόβληµα να είναι ουσιαστικά ένα πρόβληµα εκτίµησης των παραγοντικών βαρών l και των συγκεκριµένων διασπορών ψ. υο ij i βασικές µέθοδοι θα χρησιµοποιήσουµε για να επιτύχουµε την εκτίµηση παραµέτρων. Αυτές είναι η µέθοδος των κυρίων συνιστωσών και η µέθοδος µέγιστης πιθανοφάνειας. 3.4) ΜΕΘΟ ΟΣ ΚΥΡΙΩΝ ΣΥΝΙΣΤΩΣΩΝ (βασισµένη στον Σ ) Έστω λ λ... λ 0 οι ιδιοτιµές του πίνακα Σ και p e,...,e τα ιδιοδιανύσµατα το πίνακα Σ τότε p Σ = λ ee ' + λ e e ' λ e e ' = p p p 30

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

Στατιστική ανάλυση αποτελεσμάτων

Στατιστική ανάλυση αποτελεσμάτων HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Επιβλέπων καθηγητής: κ.γούτσος Σταύρος

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Επιβλέπων καθηγητής: κ.γούτσος Σταύρος ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ Η/Υ &ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Προγράμματα Κατάρτισης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ 20 3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ ΟΡΙΣΜΟΣ ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ Μια πολύ σηµαντική έννοια στη θεωρία πιθανοτήτων και τη στατιστική είναι η έννοια της µαθηµατικής ελπίδας ή αναµενόµενης τιµής ή µέσης τιµής µιας τυχαίας

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Π E Ρ IEXOMENA Πρόλογος... xiii ΜΕΡΟΣ ΠΡΩΤΟ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΣΤΑΤΙΣΤΙΚΩΝ Ε ΟΜΕΝΩΝ 1.1 Εισαγωγή... 3 1.2 Ορισµός και αντικείµενο της στατιστικής... 3

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2

ΠΕΡΙΕΧΟΜΕΝΑ. Πιθανότητες. Τυχαίες μεταβλητές - Κατανομές ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 ΚΕΦΑΛΑΙΟ 2 ΠΕΡΙΕΧΟΜΕΝΑ ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 1 Πιθανότητες 1.1 Πιθανότητες και Στατιστική... 5 1.2 ειγματικός χώρος Ενδεχόμενα... 7 1.3 Ορισμοί και νόμοι των πιθανοτήτων... 10 1.4 εσμευμένη πιθανότητα Ολική

Διαβάστε περισσότερα

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ ΔΥΟ ΠΟΙΟΤΙΚΕΣ ΠΙΝΑΚΕΣ ΣΥΝΑΦΕΙΑΣ ΕΞΕΤΑΣΗ ΤΗΣ ΥΠΑΡΞΗΣ Ή ΟΧΙ ΣΧΕΣΗΣ ΕΝΤΑΣΗ ΚΑΙ ΦΥΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΠΟΙΟΤΙΚΕΣ ΔΙΑΔΙΚΑΣΙΑ CROSSTABS ΠΙΝΑΚΑΣ ΣΥΝΑΦΕΙΑΣ Ο πίνακας συνάφειας είναι

Διαβάστε περισσότερα

(p 1) (p m) (m 1) (p 1)

(p 1) (p m) (m 1) (p 1) ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ Σκοπός της παραγοντικής ανάλυσης είναι να περιγράψει την συνδιασπορά μεταξύ των μεταβλητών με την βοήθεια τυχαίων άγνωστων ποσοτήτων που ονομάζονται παράγοντες. Το μοντέλο είναι το

Διαβάστε περισσότερα

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ] Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών ΗΥ-317: Εφαρµοσµένες Στοχαστικές ιαδικασίες-εαρινό Εξάµηνο 2016 ιδάσκων : Π. Τσακαλίδης Συνδιασπορά - Συσχέτιση Τυχαίων Μεταβλητών Επιµέλεια : Κωνσταντίνα

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ 1 ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ 1. Ένα σηµείο Α(χ, ψ) ανήκει στη γραφική παράσταση της f αν f(ψ)=χ. 2. Αν µια συνάρτηση είναι γνησίως αύξουσα σε ένα διάστηµα A,

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 9 ο 9.1 ηµιουργία µοντέλων πρόβλεψης 9.2 Απλή Γραµµική Παλινδρόµηση 9.3 Αναλυτικά για το ιάγραµµα ιασποράς

Διαβάστε περισσότερα

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) Α. Ερωτήσεις πολλαπλών επιλογών.(11 βαθµοί) (1:3 βαθµοί, 2-9:8 βαθµοί) 1. ίνεται ο πίνακας: Χ

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ν ν = 6. όταν είναι πραγµατικός αριθµός. Συνάρτηση: ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ λέγεται µια διαδικασία µε την οποία κάθε στοιχείο ενός συνόλου Α αντιστοιχίζεται σε ένα ακριβώς στοιχείο κάποιου άλλου συνόλου Β. Γνησίως αύξουσα: σε ένα διάστηµα του πεδίου

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ν ν = 6. όταν είναι πραγµατικός αριθµός. Συνάρτηση: ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ λέγεται µια διαδικασία µε την οποία κάθε στοιχείο ενός συνόλου Α αντιστοιχίζεται σε ένα ακριβώς στοιχείο κάποιου άλλου συνόλου Β. Γνησίως αύξουσα: σε ένα διάστηµα του πεδίου

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ Μετά από την εκτίµηση των παραµέτρων ενός προσοµοιώµατος, πρέπει να ελέγχουµε την αλήθεια της υποθέσεως που κάναµε. Είναι ορθή η υπόθεση που κάναµε? Βεβαίως συνήθως υπάρχουν

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 ΣΥΝΔΥΑΣΤΙΚΗ 1.1 ΒΑΣΙΚΗ ΑΡΧΗ ΑΠΑΡΙΘΜΗΣΗΣ... 13 1.2 ΠΡΟΣΘΕΤΙΚΗ ΑΡΧΗ ΑΠΑΡΙΘΜΗΣΗΣ... 15 1.3 ΔΙΑΤΑΞΕΙΣ..... 16 1.4 ΜΕΤΑΘΕΣΕΙΣ... 18 1.5 ΣΥΝΔΥΑΣΜΟΙ... 20 1.6 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΤΑΘΕΣΕΙΣ......

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 4 Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

x y max(x))

x y max(x)) ΚΕΦΑΛΑΙΟ 0 Απλή Γραµµική Παλινδρόµηση Μωυσιάδης Χρόνης 6 o Εξάµηνο Μαθηµατικών Ένα Πρόβληµα εδοµένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 y 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Έχει σχέση το yµε το ; Ειδικότερα

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Στα πλαίσια της ΣΤΑΤΙΣΤΙΚΗΣ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑΣ προσπαθούµε να προσεγγίσουµε τα χαρακτηριστικά ενός συνόλου (πληθυσµός) δια της µελέτης των χαρακτηριστικών αυτών επί ενός µικρού

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

( ) = inf { (, Ρ) : Ρ διαµέριση του [, ]}

( ) = inf { (, Ρ) : Ρ διαµέριση του [, ]} 7 ΙΙΙ Ολοκληρωτικός Λογισµός πολλών µεταβλητών Βασικές έννοιες στη µια µεταβλητή Έστω f :[ ] φραγµένη συνάρτηση ( Ρ = { t = < < t = } είναι διαµέριση του [ ] 0 ( Ρ ) = Μ ( ) όπου sup f ( t) : t [ t t]

Διαβάστε περισσότερα

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ-ΕΙΣΑΓΩΓΙΚΟ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ρ. Κουνετάς Η Κωνσταντίνος Ακαδηµαϊκό Έτος 01-013 ΕΠΙΧ Οικονοµετρικά

Διαβάστε περισσότερα

Πρακτική µε στοιχεία στατιστικής ανάλυσης

Πρακτική µε στοιχεία στατιστικής ανάλυσης Πρακτική µε στοιχεία στατιστικής ανάλυσης 1. Για να υπολογίσουµε µια ποσότητα q = x 2 y xy 2, µετρήσαµε τα µεγέθη x και y και βρήκαµε x = 3.0 ± 0.1και y = 2.0 ± 0.1. Να βρεθεί η ποσότητα q και η αβεβαιότητά

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων ) Περιγραφή ιακριτών Ποσοτικών εδοµένων Για να περιγράψουµε διακριτά ποσοτικά δεδοµένα µε λίγες τιµές ( σε περίπτωση πολλών τιµών τα θεωρούµε ως συνεχή) κάνουµε: Πίνακας συχνοτήτων Ραβδόγραµµα, Κυκλικό

Διαβάστε περισσότερα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή Ανάλυση Συνδιακύµανσης Alsis of Covrice Η ανάλυση συνδιακύµανσης είναι µία άλλη τεχνική για να βελτιώσουµε την ακρίβεια της προσέγγισης του µοντέλου µας στο πείραµα. Ας υποθέσουµε ότι σ ένα πείραµα εκτός

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Κεϕάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεϕάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους.

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους. Μάθηµα 1 Κεφάλαιο 1o: Συστήµατα Θεµατικές Ενότητες: A. Συστήµατα Γραµµικών Εξισώσεων B. Συστήµατα 3x3 Α. ΣΥΣΤΗΜΑΤΑ ΓΡΑΜΜΙΚΩΝ ΕΞΙΣΩΣΕΩΝ Ορισµοί Κάθε εξίσωση της µορφής α x+β =γ, µε α, β, γ R παριστάνει

Διαβάστε περισσότερα

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου Διαφορικός Λογισμός 1. Ισχύει f (g())) ) f ( = f (g())g () όπου f,g παραγωγίσιµες συναρτήσεις 2. Αν µια συνάρτηση f είναι παραγωγίσιµη σε ένα διάστηµα

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής. 2.6 ΟΡΙΑ ΑΝΟΧΗΣ Το διάστηµα εµπιστοσύνης παρέχει µία εκτίµηση µιας άγνωστης παραµέτρου µε την µορφή διαστήµατος και ένα συγκεκριµένο βαθµό εµπιστοσύνης ότι το διάστηµα αυτό, µε τον τρόπο που κατασκευάσθηκε,

Διαβάστε περισσότερα

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x). Νίκος Σούρµπης - - Γιώργος Βαρβαδούκας ΘΕΜΑ ο Α. α) ίνεται η συνάρτηση F()=f()+g(). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F ()=f ()+g (). β)να γράψετε στο τετράδιό σας τις παραγώγους

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

Συνοπτικά περιεχόμενα

Συνοπτικά περιεχόμενα b Συνοπτικά περιεχόμενα 1 Τι είναι η στατιστική;... 25 2 Περιγραφικές τεχνικές... 37 3 Επιστήμη και τέχνη των διαγραμματικών παρουσιάσεων... 119 4 Αριθμητικές μέθοδοι της περιγραφικής στατιστικής... 141

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ. 4.1 Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα

ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ. 4.1 Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ 4. Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα Εστω R είναι ο γνωστός -διάστατος πραγµατικός διανυσµατικός χώρος. Μία απεικόνιση L :

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών. ιαφόριση συναρτήσεων πολλών µεταβλητών

ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών. ιαφόριση συναρτήσεων πολλών µεταβλητών 54 ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών ιαφόριση συναρτήσεων πολλών µεταβλητών Ένας στέρεος ορισµός της παραγώγισης για συναρτήσεις πολλών µεταβλητών ανάλογος µε τον ορισµό για συναρτήσεις µιας µεταβλητής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ- ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Εργασία για το σεµινάριο «Στατιστική περιγραφική εφαρµοσµένη στην ψυχοπαιδαγωγική(β06σ03)» ΤΙΤΛΟΣ: «ΜΕΛΕΤΗ ΠΕΡΙΓΡΑΦΙΚΗΣ

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση Οι επιδόσεις δέκα μαθητών σε τέσσερα μαθήματα Μαθητής Άλγεβρα Φυσική Νέα Ελληνικά Μουσική Α 65 63 35 61 Β 60 58 38 35 Γ 60 60 40 46

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) Ενδεικτικές Λύσεις ΕΡΓΑΣΙΑ η Ηµεροµηνία Αποστολής στον Φοιτητή: Ιανουαρίου 6 Ηµεροµηνία Παράδοσης της Εργασίας από

Διαβάστε περισσότερα

αx αx αx αx 2 αx = α e } 2 x x x dx καλείται η παραβολική συνάρτηση η οποία στο x

αx αx αx αx 2 αx = α e } 2 x x x dx καλείται η παραβολική συνάρτηση η οποία στο x A3. ΕΥΤΕΡΗ ΠΑΡΑΓΩΓΟΣ-ΚΥΡΤΟΤΗΤΑ. εύτερη παράγωγος.παραβολική προσέγγιση ή επέκταση 3.Κυρτή 4.Κοίλη 5.Ιδιότητες κυρτών/κοίλων συναρτήσεων 6.Σηµεία καµπής ΠΑΡΑΡΤΗΜΑ 7. εύτερη πλεγµένη παραγώγιση 8.Χαρακτηρισµός

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα

Σηµειώσεις Οικονοµετρίας Ι.. ικαίος Τσερκέζος

Σηµειώσεις Οικονοµετρίας Ι.. ικαίος Τσερκέζος Ο ΚΕΦΑΛΑΙΙΟ 33 Η ΣΣΥΜΜΕΕΤΤΑΒΛΗΤΤΟΤΤΗΤΤΑ ΤΤΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΜΕΕΓΓΕΕΘΩΝ.. (ΣΣΥΣΣΧΕΕΤΤΙ ( ΙΣΣΗ) ) Γραµµική και Μη Γραµµική Συσχέτιση. Συντελεστής Αυτοσυσχέτισης. Μνήµη Χρονοσειρών. 8 7 6 F F F3 F4 F5 F6 F7

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Τυχαίο Δείγμα

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: Κατανοµές ειγµατοληψίας 1.Εισαγωγή Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: 1. Στατιστικής και 2. Κατανοµής ειγµατοληψίας

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

Πολύγωνο αθροιστικών σχετικών συχνοτήτων και διάµεσος µιας τυχαίας µεταβλητής ρ. Παναγιώτης Λ. Θεοδωρόπουλος πρώην Σχολικός Σύµβουλος ΠΕ03 e-mail@p-theodoropoulos.gr Πρόλογος Στην εργασία αυτή αναλύονται

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

Ποσοτική & Ποιοτική Ανάλυση εδομένων Συσχέτιση. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη,

Ποσοτική & Ποιοτική Ανάλυση εδομένων Συσχέτιση. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη, Ποσοτική & Ποιοτική Ανάλυση εδομένων Συσχέτιση Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη, 2013-2014 Οι επιδόσεις δέκα μαθητών σε τέσσερα μαθήματα Μαθητής Άλγεβρα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΙΕΘΝΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΣΧΕΣΕΩΝ ΚΑΙ ΑΝΑΠΤΥΞΗΣ ΜΑΘΗΜΑ: ΣΤΑΤΙΣΤΙΚΗ IΙ ΕΙΣΗΓΗΤΡΙΑ: ΣΑΒΒΑΣ ΠΑΠΑ ΟΠΟΥΛΟΣ ΠΑΛΑΙΑ ΘΕΜΑΤΑ ********************************************************************

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

Στατιστική Εισαγωγικές Έννοιες

Στατιστική Εισαγωγικές Έννοιες Στατιστική Εισαγωγικές Έννοιες Στατιστική: η επιστήµη που παρέχει µεθόδους και εργαλεία για την οργάνωση, συστηµατική περιγραφή και περιληπτική παρουσίαση δεδοµένων, καθώς και για την ανάλυση της πληροφορίας

Διαβάστε περισσότερα