Ευφυή Συστήματα και Εξόρυξη Δεδομένων. Προεπεξεργασία Δεδομένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ευφυή Συστήματα και Εξόρυξη Δεδομένων. Προεπεξεργασία Δεδομένων"

Transcript

1 Ευφυή Συστήματα και Εξόρυξη Δεδομένων Προεπεξεργασία Δεδομένων 1

2 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 2 Σύνοψη

3 3 Τι είναι η Προ-επεξεργασία Δεδομένων; Σημαντικότερες Ενέργειες Καθαρισμός Δεδομένων Χειρισμός δεδομένων που λείπουν, εξομάλυνση θορύβου, εντοπισμός ή απομάκρυνση ακραίων τιμών και επίλυση ασυνεπειών Ενσωμάτωση Δεδομένων Ενσωμάτωση από πολλές ΒΔ, κύβους δεδομένων ή αρχεία Περιορισμός Δεδομένων Περιορισμός Διαστάσεων Μείωση αριθμητικότητας Συμπίεση δεδομένων Μετασχηματισμός και Διακριτοποίηση Δεδομένων Κανονικοποίηση Δημιουργία ιεραρχίας εννοιών

4 4 Γιατί Προ-επεξεργασία Δεδομένων; Προβλήματα Ποιότητας Δεδομένων Μέτρα για την ποιότητα των δεδομένων: Μια πολυδιάστατη άποψη Ακρίβεια (accuracy): σωστό ή λάθος, ακριβές ή μη Πληρότητα (completeness): μη καταγεγραμμένο, μη διαθέσιμο,... Συνέπεια (consistency): κάποια τροποποιημένα και κάποια όχι, Επικαιρότητα (timeliness): έγκαιρη ενημέρωση; Πιστότητα (believability): Πόσο αξιόπιστα είναι τα δεδομένα; Ερμηνεία (interpretability): πόσο εύκολα μπορούν να κατανοηθούν τα δεδομένα;

5 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 5 Σύνοψη

6 6 Καθαρισμός Δεδομένων Τα δεδομένα στον πραγματικό κόσμο είναι «βρώμικα»: Πολλά δυνητικά εσφαλμένα δεδομένα, π.χ. σφάλματα οργάνων, ανθρώπινα σφάλματα ή υπολογιστικά και σφάλματα μετάδοσης Ατελή: λείπουν τιμές χαρακτηριστικών, λείπουν ορισμένες ιδιότητες που ενδιαφέρουν ή περιλαμβάνουν μόνο συγκεντρωτικά δεδομένα Π.χ., Επάγγελμα = (ελλιπή δεδομένα) Θορυβώδη: περιέχουν θόρυβο, λάθη, και ακραίες τιμές Π.χ., Μισθός = 10 (λάθος) Ασύμβατα: περιέχουν αποκλίσεις σε κωδικούς ή ονόματα, π.χ., Ηλικία = 42, Γέννηση = 03/07/2010 Αρχική κλίμακα βαθμολογίας 1, 2, 3, τρέχουσα κλίμακα A, B, C διαφορά μεταξύ διπλών εγγραφών Προσωρινά (π.χ., συγκεκαλυμμένα ελλιπή δεδομένα) 1 Ιανουαρίου ως ημερομηνία γέννησης όλων;

7 7 Ατελή (Ελλιπή) Δεδομένα Τα δεδομένα δεν είναι πάντοτε διαθέσιμα Π.χ., πολλές εγγραφές δεν έχουν καταγεγραμμένη τιμή για διάφορα χαρακτηριστικά, όπως το εισόδημα των πελατών στα δεδομένα πωλήσεων Ελλιπή δεδομένα μπορεί να οφείλονται σε Εσφαλμένη λειτουργία εξοπλισμού Ασύμβατα με άλλα καταγεγραμμένα δεδομένα και έτσι διαγεγραμμένα Τα δεδομένα δεν καταχωρήθηκαν λόγω παρεξήγησης Ορισμένα δεδομένα ενδέχεται να μην θεωρούνται σημαντικά κατά τη στιγμή της καταχώρησης Δεν καταχωρείται το ιστορικό ή οι αλλαγές των δεδομένων Τα δεδομένα που λείπουν μπορεί να χρειάζεται να υπολογιστούν

8 Χειρισμός Δεδομένων που Λείπουν 8 Παράβλεψη εγγραφής: συνήθως γίνεται όταν λείπει η ετικέτα της κλάσης (κατά την κατηγοριοποίηση) δεν είναι αποτελεσματική όταν το % των τιμών που λείπουν ανά χαρακτηριστικό ποικίλλει σημαντικά Συμπλήρωση των τιμών που λείπουν χειροκίνητα: κουραστική + μη εφικτή Συμπλήρωση των τιμών αυτόματα με Μια γενική σταθερά : π.χ., unknown, μια νέα τάξη;! το μέσο όρο των χαρακτηριστικών το μέσο όρο των χαρακτηριστικών για όλα τα δείγματα που ανήκουν στην ίδια κατηγορία: πιο έξυπνο τη πιο πιθανή τιμή: συμπέρασμα που προκύπτει από κάποιο Bayesian τύπο ή δέντρο απόφασης

9 9 Δεδομένα με Θόρυβο Θόρυβος: τυχαίο σφάλμα ή διακύμανση σε μια μετρούμενη μεταβλητή Οι εσφαλμένες τιμές ιδιοτήτων μπορεί να οφείλονται σε Ελαττωματικά μέσα συλλογής δεδομένων Προβλήματα εισαγωγής δεδομένων Προβλήματα μετάδοσης δεδομένων Περιορισμούς της τεχνολογίας Ανακολουθία στην ονομασία των δεδομένων Άλλα προβλήματα δεδομένων Διπλότυπες εγγραφές Ελλιπή δεδομένα Μη συμβατά δεδομένα

10 10 Χειρισμός Δεδομένων με Θόρυβο Μέθοδος καλαθιού (Binning) Ταξινόμηση δεδομένων και χωρισμός σε τμήματα (ίσων συχνοτήτων) Στη συνέχεια, εξομάλυνση με το μέσο του τμήματος, εξομάλυνση με το διάμεσο του τμήματος, εξομάλυνση με τα όρια του τμήματος, κλπ. Παλινδρόμηση Εξομάλυνση με την τοποθέτηση των δεδομένων σε συναρτήσεις παλινδρόμησης Ομαδοποίηση Εντοπισμός και αφαίρεση των ακραίων τιμών Ημι-εποπτεύομενη: Συνδυασμένος υπολογιστικός και ανθρώπινος έλεγχος Ανίχνευση ύποπτων τιμών και ανθρώπινος έλεγχος (π.χ. αντιμετώπιση πιθανών ακραίων τιμών)

11 11 Διαδικασία Καθαρισμού Δεδομένων Ανίχνευση αποκλίσεων Χρήση μεταδεδομένων (π.χ. πεδίο ορισμού, εύρος, εξάρτηση, κατανομή) Έλεγχος υπερφόρτωσης πεδίου Έλεγχος του κανόνα μοναδικότητας, του κανόνα διαδοχικότητας και του κανόνα μη ύπαρξης τιμής (null) Χρήση εμπορικών εργαλείων Καθαρισμός δεδομένων: Απλή χρήση της γνώσης του πεδίου τιμών (π.χ. ταχυδρομικός κώδικας, ορθογραφικός έλεγχος) για ανίχνευση σφαλμάτων και διορθώσεων Έλεγχος δεδομένων: ανάλυση δεδομένων για την ανίχνευση κανόνων και σχέσεων για την ανίχνευση παραβάσεων (π.χ. συσχέτιση και ομαδοποίηση για την εξεύρεση ακραίων τιμών) Μεταφορά και ενσωμάτωση δεδομένων Εργαλεία μεταφοράς δεδομένων: επιτρέπουν τον ορισμό μετασχηματισμών Εργαλεία ETL (Extraction / Transformation / Loading): επιτρέπουν στους χρήστες να καθορίζουν μετασχηματισμούς μέσω ενός γραφικού περιβάλλοντος

12 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 12 Σύνοψη

13 Ενσωμάτωση Δεδομένων Ενσωμάτωση Δεδομένων Συνδυασμός δεδομένων από πολλές πηγές σε ένα συνεκτικό χώρο αποθήκευσης Ενσωμάτωση σχήματος: π.χ., A.cust-id B.cust-# Ενσωμάτωση μεταδεδομένων από διαφορετικές πηγές Ταυτοποίηση οντότητας Ταυτοποίηση οντοτήτων πραγματικού κόσμου από πολλαπλές πηγές δεδομένων, π.χ. Bill Clinton = William Clinton Ανίχνευση και επίλυση συγκρούσεων στις τιμές δεδομένων Για την ίδια οντότητα του πραγματικού κόσμου, οι τιμές χαρακτηριστικών από διαφορετικές πηγές είναι διαφορετικές Πιθανοί λόγοι: διαφορετικές αναπαραστάσεις, διαφορετικές κλίμακες, π.χ. διαφορετικές μονάδες μέτρησης μήκους 13

14 Χειρισμός Πλεονασμού στην Ενσωμάτωση Δεδομένων Τα πλεονασματικά δεδομένα εμφανίζονται συχνά όταν γίνεται ενσωμάτωση πολλαπλών βάσεων δεδομένων Ταυτοποίηση αντικειμένου: Το ίδιο χαρακτηριστικό ή αντικείμενο μπορεί να έχει διαφορετικά ονόματα σε διαφορετικές βάσεις δεδομένων Παράγωγα δεδομένα: Ένα χαρακτηριστικό μπορεί να υπολογίζεται σε έναν άλλο πίνακα, π.χ. ετήσια έσοδα Τα πλεονάζοντα χαρακτηριστικά μπορούν να ανιχνευθούν με ανάλυση συσχέτισης (correlation) και ανάλυση συνδιακύμανσης (covariance) Η προσεκτική ενσωμάτωση των δεδομένων από πολλαπλές πηγές μπορεί να συμβάλει στη μείωση / αποφυγή πλεονασμών και ασυνεπειών και στη βελτίωση της ταχύτητας και της ποιότητας της εξόρυξης 14

15 15 Ανάλυση Συσχέτισης (για Κατηγορικά Δεδομένα) Χ 2 (chi-square) test: Μηδενική υπόθεση: Οι δύο κατανομές είναι ανεξάρτητες Οι τιμές που συμβάλλουν περισσότερο στην τιμή Χ 2 είναι εκείνες των οποίων η πραγματική τιμή είναι πολύ διαφορετική από την αναμενόμενη Όσο μεγαλύτερη είναι η τιμή Χ 2, τόσο πιο πιθανό είναι να σχετίζονται οι μεταβλητές Σημείωση: Η συσχέτιση δεν συνεπάγεται αιτιώδη συνάφεια # νοσοκομείων και # κλοπών-αυτοκινήτων σε μια πόλη συσχετίζονται Και οι δύο συνδέονται αιτιωδώς με την τρίτη μεταβλητή: πληθυσμός

16 16 Υπολογισμός Chi-Square: Παράδειγμα Play chess Not play chess Sum (row) Like science fiction 250 (90) 200 (360) 450 Not like science fiction 50 (210) 1000 (840) 1050 Υπολογισμός 90? 450/1500 * 300 = 90 Υπολογισμός Χ 2 (chi-square) (οι αριθμοί σε παρένθεση είναι οι αναμενόμενες τιμές που υπολογίζονται βάσει της κατανομής των δεδομένων στις δύο κατηγορίες) 2 Sum(col.) (250 90) = 90 2 (50 210) = Δείχνει ότι like_science_fiction και play_chess είναι συσχετισμένες 2 ( ) ( ) Μπορούμε να απορρίψουμε τη μηδενική υπόθεση της ανεξαρτησίας στο επίπεδο εμπιστοσύνης 0.001

17 Διακύμανση Μιας Μεταβλητής 17 Η διακύμανση μιας τυχαίας μεταβλητής X παρέχει ένα μέτρο για το πόσο η τιμή του Χ αποκλίνει από τη μέση ή την αναμενόμενη τιμή του X: x = var( X) = E[(X ) ] = 2 2 όπου σ 2 η διακύμανση του X, το σ καλείται τυπική απόκλιση (standard deviation) µ η μέση τιμή, και µ = E[X] η αναμενόμενη τιμή του X Έτσι, διακύμανση είναι η αναμενόμενη τιμή της τετραγωνικής απόκλισης από τη μέση τιμή Μπορεί, επίσης να γραφτεί ως: 2 ( x ) f ( x) if X is discrete 2 ( x ) f ( x) dx if X is continuous = var( X ) = E[(X ) ] = E[X ] = E[X ] [ E( x)] Η διακύμανση δείγματος είναι η μέση τετραγωνική απόκλιση των τιμών x i από το μέσο του δείγματος n ˆ ˆ ˆ = ( xi ) n i= 1

18 18 Συνδιακύμανση Δύο Μεταβλητών Συνδιακύμανση μεταξύ δύο μεταβλητών X 1 και X 2 = E[( X )( X )] = E[ X X ] = E[ X X ] E[ X ] E[ X ] όπου µ 1 = E[X 1 ] η αντίστοιχη μέση ή αναμενόμενη τιμή του X 1 ; παρόμοια το µ 2 n 1 Συνδιακύμανση δείγματος μεταξύ X 1 και X 2 : ˆ 12 = ( x ˆ ˆ i1 1)( xi2 2) n i= 1 Η συνδιακύμανση δείγματος είναι μια γενίκευση της διακύμανσης δείγματος: Θετική συνδιακύμανση: Αν σ 12 > 0 Αρνητική συνδιακύμανση : Αν σ 12 < 0 Ανεξαρτησία: Αν X 1 και X 2 είναι ανεξάρτητες, σ 12 = 0, το αντίστροφο δεν ισχύει ˆ ˆ ˆ ˆ ˆ n n = ( xi 1 1)( xi 1 1) = ( xi 1 1) = 1 n i= 1 n i= 1 Μερικά ζεύγη τυχαίων μεταβλητών μπορεί να έχουν συνδιακύμανση 0 αλλά δεν είναι ανεξάρτητα Μόνο κάτω από κάποιες πρόσθετες υποθέσεις (π.χ., τα δεδομένα ακολουθούν πολυμεταβλητές κανονικές κατανομές) η συνδιακύμανση 0 συνεπάγεται την ανεξαρτησία

19 19 Παράδειγμα: Υπολογισμός Συνδιακύμανσης Ας υποθέσουμε δύο αποθέματα X 1 και X 2 έχουν τις ακόλουθες τιμές σε μια βδομάδα: (2, 5), (3, 8), (5, 10), (4, 11), (6, 14) Τύπος Συνδιακύμανσης = E[( X )( X )] = E[ X X ] = E[ X X ] E[ X ] E[ X ] Ο υπολογισμός μπορεί να απλοποιηθεί ως: E(X 1 ) = ( )/ 5 = 20/5 = 4 E(X 2 ) = ( ) /5 = 48/5 = 9.6 σ 12 = ( )/ = 4 Έτσι, X 1 και X 2 αυξάνοντα μαζί αφού σ 12 > 0 = E[ X X ] E[ X ] E[ X ]

20 Συσχέτιση Δύο Μεταβλητών Συσχέτιση μεταξύ δύο μεταβλητών X 1 και X 2 είναι η τυπική συνδιακύμανση που προκύπτει από την κανονικοποίηση της συνδιακύμανσης με την τυπική απόκλιση κάθε μεταβλητής Συσχέτιση Δείγματος για δύο μεταβλητές X 1 και X 2 : 12 = = ˆ 12 ˆ n ( x ˆ )( x ˆ ) i1 1 i i= 1 = = ˆ ˆ n n ( x ˆ ˆ i1 1) ( xi2 2) i= 1 i= 1 20 όπου n το πλήθος των τιμών, µ 1 και µ 2 οι αντίστοιχες μέσες τιμές των X 1 και X 2, σ 1 και σ 2 οι αντίστοιχες τυπικές αποκλίσεις των X 1 και X 2 Αν ρ 12 > 0: A και B θετικά συσχετισμένα (οι τιμές X 1 αυξάνουν όπως οι X 2 ) Όσο πιο μεγάλη η τιμή, τόσο πιο ισχυρή η συσχέτιση Αν ρ 12 = 0: ανεξάρτητα (κάτω από τις ίδιες προϋποθέσεις με τη συνδιακύμανση) Αν ρ 12 < 0: αρνητικά συσχετισμένα

21 21 Οπτικοποίηση Μεταβολών Συντελεστή Συσχέτισης Εύρος τιμής συντελεστή συσχέτισης: [ 1, 1] Ένα σύνολο γραφημάτων διασποράς δείχνει τα σύνολα σημείων όταν οι συντελεστές συσχέτισης τους αλλάζουν από 1 μέχρι 1

22 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 22 Σύνοψη

23 Μείωση Δεδομένων Μείωση δεδομένων: Μειωμένη αναπαράσταση του συνόλου δεδομένων πολύ μικρότερος όγκος αλλά σχεδόν τα ίδια αναλυτικά αποτελέσματα 23 Γιατί μείωση των δεδομένων; - Μια βάση δεδομένων / αποθήκη δεδομένων μπορεί να αποθηκεύει terabyte δεδομένων Μια πολύπλοκη ανάλυση ενδέχεται να διαρκέσει πολύ μεγάλο χρονικό διάστημα για να εκτελεστεί στο πλήρες σύνολο δεδομένων Μέθοδοι για τη μείωση των δεδομένων (μείωση μεγέθους δεδομένων ή μείωση αριθμητικότητας) Παλινδρόμηση Ιστογράμματα, ομαδοποίηση, δειγματοληψία Συσσώρευση κύβου δεδομένων Συμπίεση δεδομένων

24 24 Μείωση Δεδομένων: Παραμετρικές και Μη-Παραμετρικές Μέθοδοι Περιορισμός του όγκου δεδομένων με την επιλογή εναλλακτικών μικρότερων μορφών αναπαράστασης των δεδομένων Παραμετρικές μέθοδοι (π.χ., παλινδρόμηση) Με την υπόθεση ότι τα δεδομένα ακολουθούν κάποιο μοντέλο, γίνεται εκτίμηση των παραμέτρων, αποθηκεύονται οι παράμετροι και απορρίπτονται τα δεδομένα (εκτός ίσως από τις ακραίες τιμές) Μη-Παραμετρικές μέθοδοι Δεν προϋποθέτουν μοντέλα Κύριες κατηγορίες: ιστογράμματα, ομαδοποίηση, δειγματοληψία, Ιστόγραμμα Φιλοδώρημα και Λογαριασμός Ομαδοποίηση στα αρχικά δεδομένα Στρωματοποιημένη δειγματοληψία

25 25 Παραμετρική Μείωση Δεδομένων: Ανάλυση Παλινδρόμησης Ανάλυση Παλινδρόμησης: Μια Συλλογική ονομασία για τεχνικές μοντελοποίησης και ανάλυσης αριθμητικών δεδομένων με μια εξαρτημένη μεταβλητή και μια ή περισσότερες ανεξάρτητες μεταβλητές (γνωστές και ως επεξηγηματικές μεταβλητές ή προγνωστικοί δείκτες) Οι παράμετροι εκτιμώνται έτσι ώστε να δίνουν την "καλύτερη προσαρμογή" των δεδομένων Πιο συχνά η καλύτερη προσαρμογή αξιολογείται με τη χρήση της μεθόδου των ελαχίστων τετραγώνων, αλλά χρησιμοποιούνται και άλλα κριτήρια y Y 1 Y 1 X 1 y = x + 1 Χρησιμοποιείται για πρόβλεψη (συμπεριλαμβανομένης της πρόβλεψης δεδομένων χρονολογικών σειρών), εξαγωγή συμπερασμάτων, έλεγχο υποθέσεων και μοντελοποίηση αιτιακών σχέσεων x

26 Γραμμική και Πολλαπλή Παλινδρόμηση Γραμμική Παλινδρόμηση: Y = w X + b Τα δεδομένα προσαρμόζονται σε μια ευθεία γραμμή Συχνά χρησιμοποιεί τη μέθοδο ελαχίστων τετραγώνων για τη προσαρμογή της γραμμής Δύο συντελεστές παλινδρόμησης, w και b, προσδιορίζουν τη γραμμή και πρέπει να εκτιμηθούν με τη χρήση των δεδομένων Χρησιμοποιώντας το κριτήριο των ελάχιστων τετραγώνων στις γνωστές τιμές του Y 1, Y 2,, X 1, X 2,. Μη-Γραμμική Παλινδρόμηση: Τα δεδομένα μοντελοποιούνται από μια συνάρτηση η οποία είναι ένας μη γραμμικός συνδυασμός των παραμέτρων του μοντέλου και εξαρτάται από μία ή περισσότερες ανεξάρτητες μεταβλητές Τα δεδομένα προσαρμόζονται με μια μέθοδο διαδοχικών προσεγγίσεων 26

27 27 Πολλαπλή Παλινδρόμηση και Μοντέλα Log-Linear Πολλαπλή Παλινδρόμηση: Y = b 0 + b 1 X 1 + b 2 X 2 Επιτρέπει μια μεταβλητή Υ να διαμορφώνεται ως γραμμική συνάρτηση ενός πολυδιάστατου διανύσματος χαρακτηριστικών Log-linear μοντέλο: Ένα μαθηματικό μοντέλο που παίρνει τη μορφή μίας συνάρτησης της οποίας ο λογάριθμος είναι ένας γραμμικός συνδυασμός των παραμέτρων του μοντέλου, που καθιστά δυνατή την εφαρμογή (πιθανώς πολυπαραμετρική) γραμμικής παλινδρόμησης Εκτίμηση της πιθανότητας κάθε σημείου σε ένα πολυδιάστατο χώρο για ένα σύνολο διακριτοποιημένων χαρακτηριστικών, με βάση ένα μικρότερο υποσύνολο διαστάσεων Χρήσιμο για τη μείωση των διαστάσεων και την εξομάλυνση των δεδομένων

28 Ανάλυση Ιστογράμματος Διαχωρισμός των δεδομένων σε καλάθια και αποθήκευση του μέσου όρου (άθροισμα) για κάθε καλάθι Κανόνες διαχωρισμού: Ίσο πλάτος: ίσο εύρος καλαθιού Ίση συχνότητα (ή ίσο βάθος)

29 Ομαδοποίηση (Clustering) Διαχωρισμός δεδομένων σε συστάδες βασισμένες στην ομοιότητα, και αποθήκευση των στοιχείων που αντιπροσωπεύουν τη συστάδα (π.χ., κεντρική τάση και διάμετρος) Μπορεί να είναι πολύ αποτελεσματική εάν τα δεδομένα είναι ομαδοποιημένα αλλά όχι εάν τα δεδομένα είναι μπλεγμένα Μπορεί να έχει ιεραρχική ομαδοποίηση και μπορεί να αποθηκευτεί σε πολυδιάστατες δεντρικές δομές Υπάρχουν πολλές επιλογές ορισμών και αλγόριθμων ομαδοποίησης 29

30 Δειγματοληψία Δειγματοληψία: λήψη ενός μικρού δείγματος s αντιπροσωπευτικού ολόκληρου του συνόλου δεδομένων N Επιτρέπει σε έναν αλγόριθμο εξόρυξης να λειτουργεί σε πολυπλοκότητα που είναι δυνητικά υπο-γραμμική ως προς το μέγεθος των δεδομένων Βασική αρχή: Επιλέξτε ένα αντιπροσωπευτικό υποσύνολο των δεδομένων Η απλή τυχαία δειγματοληψία μπορεί να έχει πολύ χαμηλή επίδοση όταν υπάρχει κυρτότητα Ανάπτυξη προσαρμοστικών μεθόδων δειγματοληψίας, π.χ., στρωματοποιημένη δειγματοληψία: Σημείωση: Η δειγματοληψία ενδέχεται να μην μειώνει τα I/O της βάσης δεδομένων (μια σελίδα κάθε φορά) 30

31 Είδη Δειγματοληψίας Απλή τυχαία δειγματοληψία: Ίση πιθανότητα επιλογής συγκεκριμένου στοιχείου Δειγματοληψία χωρίς αντικατάσταση Μόλις επιλεγεί ένα αντικείμενο, αφαιρείται από τον πληθυσμό Δειγματοληψία με αντικατάσταση Ένα επιλεγμένο αντικείμενο δεν αφαιρείται από τον πληθυσμό Στρωματοποιημένη δειγματοληψία Διαχωρισμός (ή ομαδοποίηση) του συνόλου δεδομένων, και λήψη δείγματος από κάθε τμήμα (αναλογικά) Αρχικά Δεδομένα Στρωματοποιημένη δειγματοληψία 31

32 Συνάθροιση Κύβου Δεδομένων Το χαμηλότερο επίπεδο ενός κύβου δεδομένων (βασικός κύβος) Τα συγκεντρωτικά στοιχεία για μια μεμονωμένη οντότητα Πολλαπλά επίπεδα συσσωμάτωσης σε κύβους δεδομένων Περαιτέρω μείωση του μεγέθους των δεδομένων Αναφορά στο κατάλληλο επίπεδο Χρήση της μικρότερης παράστασης που αρκεί για τη λύση του προβλήματος Ερωτήματα που αφορούν συγκεντρωτικές πληροφορίες απαντώνται χρησιμοποιώντας κύβους δεδομένων, όταν είναι δυνατόν 32

33 Συμπίεση συμβολοσειράς Συμπίεση Δεδομένων 33 Υπάρχουν εκτεταμένες θεωρίες και καλά συντονισμένοι αλγόριθμοι Συνήθως χωρίς απώλειες Συμπίεση ήχου / βίντεο Συμπίεση με απώλειες, με προοδευτική βελτίωση Μερικές φορές μικρά κομμάτια σήματος μπορούν να ανακατασκευαστούν χωρίς να ανακατασκευάζεται το σύνολο Η χρονική ακολουθία δεν είναι ηχητική Συνήθως είναι σύντομες και διαφοροποιούνται αργά με το χρόνο Η μείωση των δεδομένων και η μείωση των διαστάσεων μπορούν επίσης να θεωρηθούν ως μορφές συμπίεσης δεδομένων Αρχικά Δεδομένα Αρχικά Δεδομένα κατά προσέγγιση Συμπιεσμένα Δεδομένα Χωρίς απώλειες Με απώλειες και χωρίς απώλειες συμπίεση

34 Μετασχηματισμός Δεδομένων 34 Μια συνάρτηση που απεικονίζει το σύνολο των τιμών μιας δεδομένης ιδιότητας σε ένα νέο σύνολο τιμών (κάθε παλιά τιμή μπορεί να αντιστοιχηθεί με μία από τις νέες τιμές) Μέθοδοι Ομαλοποίηση: Αφαίρεση θορύβου από τα δεδομένα Δημιουργία χαρακτηριστικών Νέες ιδιότητες κατασκευάζονται από τις αρχικές Συνάθροιση: Σύνοψη, κατασκευή κύβου δεδομένων Κανονικοποίηση: Κλιμάκωση ώστε να εμπίπτει σε μικρότερο, καθορισμένο εύρος Κανονικοποίηση min-max Κανονικοποίηση z-score Κανονικοποίηση σε δεκαδική κλίμακα Διακριτοποίηση: Αναρρίχηση στην ιεραρχίας εννοιών

35 Κανονικοποίηση (Normalization) Min-max κανονικοποίηση : σε [new_min A, new_max A ] v min maxa min Π.χ. Έστω εισόδημα με εύρος $12,000 έως $98,000 κανονικοποιείται στο [0.0, 1.0] Τότε $73,000 απεικονίζεται στο v A ' = ( new _ maxa new _ mina) + 73,600 12,000 (1.0 0) + 0 = ,000 12,000 Z-score κανονικοποίηση (μ: μέσος, σ: τυπική απόκλιση): A new _ min A 35 v' = A A Π.χ. Έστω μ = 54,000, σ = 16,000. Τότε v Z-score: Η απόσταση μεταξύ της αρχικής τιμής και του μέσου του πληθυσμού στη μονάδα της τυπικής απόκλισης 73,600 54,000 = ,000 Κανονικοποίηση με δεκαδική κλίμακα v v'= Όπου j ο μικρότερος ακέραιος ώστε Max( ν ) < 1 j 10

36 Διακριτοποίηση (Discretization ) Τρεις τύποι χαρακτηριστικών Ονομαστικά τιμές από ένα μη ταξινομημένο σύνολο, π.χ. χρώμα, επάγγελμα Τακτικά τιμές από ένα ταξινομημένο σύνολο, π.χ. στρατιωτική ή ακαδημαϊκή κατάταξη Αριθμητικά πραγματικοί αριθμοί, π.χ., ακέραιοι ή πραγματικοί αριθμοί Διακριτοποίηση: Διαχωρίζει το εύρος ενός συνεχούς χαρακτηριστικού σε διαστήματα Οι ετικέτες διαστήματος μπορούν στη συνέχεια να χρησιμοποιηθούν για να αντικαταστήσουν τις πραγματικές τιμές δεδομένων Μείωση του μεγέθους των δεδομένων Με ή χωρίς επιτήρηση Διαίρεση (από πάνω προς τα κάτω) έναντι συγχώνευσης (από κάτω προς τα πάνω) Η διακριτοποίηση μπορεί να εφαρμοστεί αναδρομικά σε ένα χαρακτηριστικό Προετοιμασία για περαιτέρω ανάλυση, π.χ. κατηγοριοποίηση 36

37 Μέθοδοι Διακριτοποίησης Δεδομένων Μέθοδος καλαθιού (Binning) Διαχωρισμός από πάνω προς τα κάτω, χωρίς επίβλεψη Ανάλυση ιστογράμματος Διαχωρισμός από πάνω προς τα κάτω, χωρίς επίβλεψη Ανάλυση συστάδων Μη επιτηρούμενη, διαχωρισμός από πάνω προς τα κάτω ή από κάτω προς τα πάνω συγχώνευση Ανάλυση δέντρων απόφασης Επιτηρούμενη, διαχωρισμός από πάνω προς τα κάτω Ανάλυση συσχέτισης (π.χ., 2 ) Μη επιτηρούμενη, συγχώνευση από κάτω προς τα πάνω Σημείωση: Όλες οι μέθοδοι μπορούν να εφαρμοστούν αναδρομικά 37

38 38 Απλή Διακριτοποίηση: Μέθοδος Καλαθιού (Binning) Διαχωρισμός ίσου πλάτους (απόστασης) Διαιρεί το εύρος σε N διαστήματα ίσου μεγέθους: ομοιόμορφο πλέγμα Αν A και B είναι η ελάχιστη και η μέγιστη του χαρακτηριστικού, το πλάτος των διαστημάτων θα είναι: W = (B A)/N. Οι πιο απλές, αλλά οι ακραίες τιμές μπορεί να κυριαρχούν στην παρουσίαση Τα κυρτά δεδομένα δεν αντιμετωπίζονται καλά Διαχωρισμός ίσου βάθους (συχνότητας) Διαχωρίζει το εύρος σε N διαστήματα, το καθένα από τα οποία περιέχει περίπου τον ίδιο αριθμό δειγμάτων Καλή κλιμάκωση δεδομένων Η διαχείριση κατηγορικών χαρακτηριστικών μπορεί να είναι δύσκολη

39 Παράδειγμα: Μέθοδοι Καλαθιού για Εξομάλυνση Δεδομένων 39 Ταξινόμηση ως προς τη τιμή: 4, 8, 9, 15, 21, 21, 24, 25, 26, 28, 29, 34 * Διαχωρισμός σε καλάθια με ίση συχνότητα (equi-depth): - Bin 1: 4, 8, 9, 15 - Bin 2: 21, 21, 24, 25 - Bin 3: 26, 28, 29, 34 * Εξομάλυνση με το μέσο του καλαθιού: - Bin 1: 9, 9, 9, 9 - Bin 2: 23, 23, 23, 23 - Bin 3: 29, 29, 29, 29 * Εξομάλυνση με τα όρια του καλαθιού: - Bin 1: 4, 4, 4, 15 - Bin 2: 21, 21, 25, 25 - Bin 3: 26, 26, 26, 34

40 Διακριτοποίηση Χωρίς Επίβλεψη: Binning vs. Clustering Δεδομένα Ίσο πλάτος (απόσταση) καλαθιού 40 Ίσο βάθος (συχνότητα) καλαθιού Η ομαδοποίηση K-μέσων οδηγεί σε καλύτερα αποτελέσματα

41 41 Διακριτοποίηση με Κατηγοριοποίηση & Ανάλυση Συσχέτισης Κατηγοριοποίηση (π.χ., decision tree analysis) Εποπτευόμενη: Δεδομένων των ετικετών κατηγορίας, π.χ., καρκινικές ή καλοήθεις Χρησιμοποιώντας την εντροπία (entropy) για τον προσδιορισμό του σημείου διαχωρισμού (σημείο διακριτοποίησης) Από την κορυφή προς τα κάτω, αναδρομικός διαχωρισμός Ανάλυση Συσχέτισης (π.χ., Chi-merge: Διακριτοποίηση βασισμένη στη χ 2 ) Εποπτευόμενη: χρήση πληροφοριών κλάσης Συγχώνευση από κάτω προς τα πάνω: Εύρεση των καλύτερων γειτονικών διαστημάτων (αυτά που έχουν παρόμοιες κατανομές των κλάσεων, π.χ., χαμηλές χ 2 τιμές) για συγχώνευση Η συγχώνευση εφαρμόζεται αναδρομικά, μέχρι να ικανοποιηθεί μια προκαθορισμένη συνθήκη τερματισμού

42 Δημιουργία Ιεραρχίας Εννοιών Η Ιεραρχία εννοιών (concept hierarchy) οργανώνει τις έννοιες (δηλ., τις τιμές γνωρισμάτων) ιεραρχικά και συνήθως συσχετίζεται με τις διαστάσεις στην αποθήκη δεδομένων Η ιεραρχία εννοιών διευκολύνει την εμβάθυνση (drilling) και την συσσώρευση (rolling) στην αποθήκη δεδομένων ώστε να ιδωθούν τα δεδομένα υπό διάφορες πληθικότητες Δημιουργία ιεραρχίας εννοιών: Αναδρομικός περιορισμός των δεδομένων με συλλογή και αντικατάσταση έννοιών χαμηλού επιπέδου (όπως αριθμητικές τιμές για την ηλικία) με έννοιες υψηλότερου επιπέδου (όπως οι νέοι, οι ενήλικοι ή οι ηλικιωμένοι) Οι ιεραρχίες των εννοιών μπορούν να καθοριστούν ρητά από τους ειδικούς του τομέα εφαρμογής και/ή τους σχεδιαστές της αποθήκης δεδομένων Η ιεραρχία εννοιών μπορεί να διαμορφωθεί αυτόματα τόσο για αριθμητικά όσο και για ονομαστικά δεδομένα - Για αριθμητικά δεδομένα, χρησιμοποιούνται οι μεθόδοι διακριτοποίησης 42

43 43 Δημιουργία Ιεραρχίας Εννοιών για Ονομαστικά Δεδομένα Καθορισμός μερικής / ολικής διάταξης χαρακτηριστικών ρητά στο επίπεδο του σχήματος από τους χρήστες ή εμπειρογνώμονες street < city < state < country Καθορισμός ιεραρχίας για ένα σύνολο τιμών μέσω ρητής ομαδοποίησης δεδομένων {Αθήνα, Σπάτα, Λούτσα} < Αττική Καθορισμός μόνο ενός μερικού συνόλου χαρακτηριστικών Π.χ., μόνο street < city, όχι τα άλλα Αυτόματη δημιουργία ιεραρχιών (ή επιπέδων χαρακτηριστικών) με την ανάλυση του αριθμού διακριτών τιμών Π.χ., για ένα σύνολο χαρακτηριστικών: {street, city, state, country}

44 44 Αυτόματη Δημιουργία Ιεραρχίας Εννοιών Κάποιες ιεραρχίες μπορούν να δημιουργηθούν αυτόματα με την ανάλυση του αριθμού των διαφορετικών τιμών ανά χαρακτηριστικό στο σύνολο δεδομένων Το χαρακτηριστικό με τις περισσότερο διακριτές τιμές τοποθετείται στο χαμηλότερο επίπεδο της ιεραρχίας Εξαιρέσεις, π.χ., ημέρα της εβδομάδας, μήνας, τρίμηνο, έτος country province_or_ state city street 15 διαφορετικές τιμές 365 διαφορετικές τιμές 3567 διαφορετικές τιμές 674,339 διαφορετικές τιμές

45 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 45 Σύνοψη

46 Μείωση Διαστάσεων 46 Η κατάρα των πολλών συνιστωσών Όταν αυξάνονται οι διαστάσεις, τα δεδομένα γίνονται ολοένα και πιο αραιά Η πυκνότητα και η απόσταση μεταξύ των σημείων, η οποία είναι κρίσιμη για την ομαδοποίηση, την ανάλυση ακραίων τιμών, γίνεται λιγότερο σημαντική Οι πιθανοί συνδυασμοί υποπεριοχών αυξάνονται εκθετικά Μείωση Διαστάσεων Μείωση του αριθμού των τυχαίων μεταβλητών υπό εξέταση, μέσω της λήψης ενός συνόλου κύριων μεταβλητών Πλεονεκτήματα της μείωσης των διαστάσεων Αποφυγή της κατάρας των διαστάσεων Βοηθά στην εξάλειψη άσχετων χαρακτηριστικών και στη μείωση του θορύβου Μείωση του απαιτούμενου χρόνου και χώρου για την εξόρυξη δεδομένων Επιτρέπει την ευκολότερη οπτικοποίηση

47 47 Τεχνικές Μείωσης Διαστάσεων Μεθοδολογίες μείωσης διαστάσεων Επιλογή χαρακτηριστικών: Εύρεση ενός υποσυνόλου των αρχικών μεταβλητών Εξαγωγή χαρακτηριστικών: Μετασχηματισμός των δεδομένων από ένα χώρο πολλών διαστάσεων σε ένα χώρο με λιγότερες διαστάσεις Μερικές τυπικές μέθοδοι μείωσης διαστάσεων Ανάλυση κυρίων συνιστωσών (Principal Component Analysis) Εποπτευόμενες και μη γραμμικές τεχνικές Επιλογή υποσυνόλου χαρακτηριστικών Δημιουργία χαρακτηριστικών

48 Ανάλυση Κυρίων Συνιστωσών (PCA) PCA: Μια στατιστική διαδικασία που χρησιμοποιεί έναν μετασχηματισμό για τη μετατροπή ενός συνόλου παρατηρήσεων πιθανώς συσχετισμένων μεταβλητών σε ένα σύνολο τιμών γραμμικά μη συσχετισμένων μεταβλητών που ονομάζονται κύριες συνιστώσες (principal components) Τα αρχικά δεδομένα προβάλλονται σε ένα πολύ μικρότερο χώρο, με αποτέλεσμα τη μείωση των διαστάσεων 48 Έχει εφαρμογή μόνο για αριθμητικά δεδομένα Η μπάλα ταξιδεύει σε ευθεία γραμμή. Τα δεδομένα από τις τρεις κάμερες περιέχουν μεγάλο πλεονασμό

49 49 Επιλογή Υποσυνόλου Χαρακτηριστικών Ένας άλλος τρόπος να μειωθούν οι πολλές διαστάσεις των δεδομένων Πλεονάζοντα χαρακτηριστικά Διπλασιάζουν πολλές ή όλες τις πληροφορίες που περιέχονται σε ένα ή περισσότερα από τα άλλα χαρακτηριστικά Π.χ., η τιμή αγοράς ενός προϊόντος και το ποσό του φόρου επί των πωλήσεων που καταβλήθηκε Άσχετα χαρακτηριστικά Δεν περιέχουν πληροφορίες που είναι χρήσιμες για την εξόρυξη δεδομένων που επιχειρείται Π.χ. Το αναγνωριστικό ενός φοιτητή είναι άσχετο με την πρόβλεψη της τελικής του βαθμολογίας

50 50 Δημιουργία Χαρακτηριστικών Δημιουργία νέων χαρακτηριστικών που μπορούν να καταγράψουν τις σημαντικές πληροφορίες σε ένα σύνολο δεδομένων πιο αποτελεσματικά από τα αρχικά Τρεις γενικές μεθοδολογίες Εξαγωγή χαρακτηριστικών Εξειδικευμένο για κάθε τομέα Απεικόνιση δεδομένων σε νέο χώρο Π.χ. μετασχηματισμός Fourier, κυματοειδής μετασχηματισμός, Κατασκευή χαρακτηριστικών Συνδυασμός χαρακτηριστικών Διακριτοποίηση δεδομένων

51 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 51 Σύνοψη

52 52 Σύνοψη Ποιότητα δεδομένων: ακρίβεια, πληρότητα, συνέπεια, επικαιρότητα, πιστότητα, ερμηνεία Καθαρισμός δεδομένων: π.χ. Ελλιπείς / θορυβώδεις τιμές, ακραίες τιμές Ενσωμάτωση δεδομένων από πολλαπλές πηγές: Πρόβλημα ταυτοποίησης οντότητας. Αφαίρεση πλεονασμού. Εντοπισμός ασυνεπειών Μείωση δεδομένων, μετασχηματισμός δεδομένων και διακριτοποίηση δεδομένων Μείωση αριθμητικότητας. Συμπίεση δεδομένων Κανονικοποίηση. Δημιουργία ιεραρχίας εννοιών Μείωση διαστάσεων

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Προεπεξεργασία εδοµένων

Προεπεξεργασία εδοµένων Προεπεξεργασία εδοµένων Αποθήκες και Εξόρυξη εδοµένων 2 ο Μάθηµα ιδάσκων: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδοµένων- πυρήνας της διαδικασίας

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής

Διαβάστε περισσότερα

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8 ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ Άλγεβρα 1 ο Κεφάλαιο 1. Τι ονομάζουμε αριθμητική και τι αλγεβρική παράσταση; Να δώσετε από ένα παράδειγμα. Μια παράσταση που περιέχει πράξεις με αριθμούς, καλείται αριθμητική παράσταση,

Διαβάστε περισσότερα

Συνοπτικά περιεχόμενα

Συνοπτικά περιεχόμενα b Συνοπτικά περιεχόμενα 1 Τι είναι η στατιστική;... 25 2 Περιγραφικές τεχνικές... 37 3 Επιστήμη και τέχνη των διαγραμματικών παρουσιάσεων... 119 4 Αριθμητικές μέθοδοι της περιγραφικής στατιστικής... 141

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Αναλογικά Ψηφιακά Σήματα Αναλογικό Σήμα x t, t [t min, t max ], x [x min, x max ] Δειγματοληψία t n, x t x n, n = 1,, N Κβάντιση x n x(n) 3 Αλφάβητο

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών

Διαβάστε περισσότερα

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού 3 ο Εξάμηνο του Ακαδημαϊκού Έτους 2013-2014 ΟΔ 034 ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Δευτέρα 10:00-13:00 Ώρες διδασκαλίας (3)

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να

ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να N161 _ (262) Στατιστική στη Φυσική Αγωγή Βιβλία ή 1 ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

Στατιστική ανάλυση αποτελεσμάτων

Στατιστική ανάλυση αποτελεσμάτων HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ Μέτρα Περιγραφικής Στατιστικής Πληθυσμιακοί παράμετροι: τα αριθμητικά μεγέθη που εκφράζουν τις στατιστικές ιδιότητες ενός πληθυσμού (που προσδιορίζουν / περιγράφουν τη φυσιογνωμία και τη δομή του) Στατιστικά

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2013-2014 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητή: ένα χαρακτηριστικό ή ιδιότητα που μπορεί να πάρει διαφορετικές τιμές

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics) Μέρος V. Στατιστική Εισαγωγή: Βασικές έννοιες και ορισμοί Περιγραφική Στατιστική (Descriptive Statistics) Σημαντικές κατανομές δειγματοληψίας (Sampling distributions) Διαστήματα Εμπιστοσύνης (Confidence

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2 HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Εισαγωγή στην κοινωνική έρευνα. Earl Babbie. Κεφάλαιο 6. Δειγματοληψία 6-1

Εισαγωγή στην κοινωνική έρευνα. Earl Babbie. Κεφάλαιο 6. Δειγματοληψία 6-1 Εισαγωγή στην κοινωνική έρευνα Earl Babbie Κεφάλαιο 6 Δειγματοληψία 6-1 Σύνοψη κεφαλαίου Σύντομη ιστορία της δειγματοληψίας Μη πιθανοτική δειγματοληψία Θεωρία και λογική της πιθανοτικής Δειγματοληψίας

Διαβάστε περισσότερα

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους. 1 Κεφάλαιο. ΣΤΑΤΙΣΤΙΚΗ Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Στατιστική: ένα σύνολο αρχών και μεθοδολογιών για: το σχεδιασμό της διαδικασίας συλλογής δεδομένων τη συνοπτική και αποτελεσματική παρουσίασή τους την ανάλυση

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2013-2014 JPEG 2000 Δρ. Ν. Π. Σγούρος 2 JPEG 2000 Βασικά χαρακτηριστικά Επιτρέπει συμπίεση σε εξαιρετικά χαμηλούς ρυθμούς όπου η συμπίεση με το JPEG εισάγει μεγάλες παραμορφώσεις Ενσωμάτωση

Διαβάστε περισσότερα

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη, 2013-2014 Εμπειρικές Στατιστικές Κατανομές Τα προβλήματα που

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου Σχηματική παρουσίαση της ερευνητικής διαδικασίας ΣΚΟΠΟΣ-ΣΤΟΧΟΣ ΘΕΩΡΙΑ ΥΠΟΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ Ερευνητικά

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Περιεχόμενα. 1. Ειδικές συναρτήσεις. 2. Μιγαδικές Συναρτήσεις. 3. Η Έννοια του Τελεστή. Κεφάλαιο - Ενότητα

Περιεχόμενα. 1. Ειδικές συναρτήσεις. 2. Μιγαδικές Συναρτήσεις. 3. Η Έννοια του Τελεστή. Κεφάλαιο - Ενότητα Περιεχόμενα Κεφάλαιο - Ενότητα σελ 1. Ειδικές συναρτήσεις 1.0 Εισαγωγή 1.1 Εξίσωση του Laplace Συστήματα συντεταγμένων 1.2 Συνάρτηση δ του Dirac 1.3 Συνάρτηση του Heaviside 1.4 Οι συναρτήσεις Β, Γ και

Διαβάστε περισσότερα

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς Διασπορά Μέτρηση Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς ομάδες έχουν μέση βαθμολογία 6. συνέχεια

Διαβάστε περισσότερα

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ - - ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ3 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 009-0 ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ - - ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΥΝΟΨΗΣ

Διαβάστε περισσότερα

E [ -x ^2 z] = E[x z]

E [ -x ^2 z] = E[x z] 1 1.ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτήν την διάλεξη θα πάμε στο φίλτρο με περισσότερες λεπτομέρειες, και θα παράσχουμε μια νέα παραγωγή για το φίλτρο Kalman, αυτή τη φορά βασισμένο στην ιδέα της γραμμικής

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Τμηματοποίηση εικόνας Τμηματοποίηση εικόνας Γενικά Διαμερισμός μιας εικόνας σε διακριτές περιοχές

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Χωρικά φίλτρα Χωρικά φίλτρα Γενικά Σε αντίθεση με τις σημειακές πράξεις και μετασχηματισμούς, στα

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 7: Παρουσίαση δεδομένων-περιγραφική στατιστική Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

Ιδιότητες της ευθείας παλινδρόµησης

Ιδιότητες της ευθείας παλινδρόµησης Ιδιότητες της ευθείας παλινδρόµησης Ηευθεία παλινδρόµησης περνάει από το σηµείο αφού a b, a b ( b ) b b ( + + + ) ( ) + b u u a b a b Αυτό όµως προϋποθέτει την ύπαρξη του a. Αν δηλαδή υποχρεώσουµε την

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ Τμήμα Λογιστικής & Χρηματοοικονομικής Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου Περιεχόμενα-Ύλη του Μαθήματος Περιγραφική Στατιστική: Είδη δεδομένων, Μετασχηματισμοί,

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα