Ευφυή Συστήματα και Εξόρυξη Δεδομένων. Προεπεξεργασία Δεδομένων
|
|
- Ἐλιακείμ Αλαφούζος
- 5 χρόνια πριν
- Προβολές:
Transcript
1 Ευφυή Συστήματα και Εξόρυξη Δεδομένων Προεπεξεργασία Δεδομένων 1
2 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 2 Σύνοψη
3 3 Τι είναι η Προ-επεξεργασία Δεδομένων; Σημαντικότερες Ενέργειες Καθαρισμός Δεδομένων Χειρισμός δεδομένων που λείπουν, εξομάλυνση θορύβου, εντοπισμός ή απομάκρυνση ακραίων τιμών και επίλυση ασυνεπειών Ενσωμάτωση Δεδομένων Ενσωμάτωση από πολλές ΒΔ, κύβους δεδομένων ή αρχεία Περιορισμός Δεδομένων Περιορισμός Διαστάσεων Μείωση αριθμητικότητας Συμπίεση δεδομένων Μετασχηματισμός και Διακριτοποίηση Δεδομένων Κανονικοποίηση Δημιουργία ιεραρχίας εννοιών
4 4 Γιατί Προ-επεξεργασία Δεδομένων; Προβλήματα Ποιότητας Δεδομένων Μέτρα για την ποιότητα των δεδομένων: Μια πολυδιάστατη άποψη Ακρίβεια (accuracy): σωστό ή λάθος, ακριβές ή μη Πληρότητα (completeness): μη καταγεγραμμένο, μη διαθέσιμο,... Συνέπεια (consistency): κάποια τροποποιημένα και κάποια όχι, Επικαιρότητα (timeliness): έγκαιρη ενημέρωση; Πιστότητα (believability): Πόσο αξιόπιστα είναι τα δεδομένα; Ερμηνεία (interpretability): πόσο εύκολα μπορούν να κατανοηθούν τα δεδομένα;
5 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 5 Σύνοψη
6 6 Καθαρισμός Δεδομένων Τα δεδομένα στον πραγματικό κόσμο είναι «βρώμικα»: Πολλά δυνητικά εσφαλμένα δεδομένα, π.χ. σφάλματα οργάνων, ανθρώπινα σφάλματα ή υπολογιστικά και σφάλματα μετάδοσης Ατελή: λείπουν τιμές χαρακτηριστικών, λείπουν ορισμένες ιδιότητες που ενδιαφέρουν ή περιλαμβάνουν μόνο συγκεντρωτικά δεδομένα Π.χ., Επάγγελμα = (ελλιπή δεδομένα) Θορυβώδη: περιέχουν θόρυβο, λάθη, και ακραίες τιμές Π.χ., Μισθός = 10 (λάθος) Ασύμβατα: περιέχουν αποκλίσεις σε κωδικούς ή ονόματα, π.χ., Ηλικία = 42, Γέννηση = 03/07/2010 Αρχική κλίμακα βαθμολογίας 1, 2, 3, τρέχουσα κλίμακα A, B, C διαφορά μεταξύ διπλών εγγραφών Προσωρινά (π.χ., συγκεκαλυμμένα ελλιπή δεδομένα) 1 Ιανουαρίου ως ημερομηνία γέννησης όλων;
7 7 Ατελή (Ελλιπή) Δεδομένα Τα δεδομένα δεν είναι πάντοτε διαθέσιμα Π.χ., πολλές εγγραφές δεν έχουν καταγεγραμμένη τιμή για διάφορα χαρακτηριστικά, όπως το εισόδημα των πελατών στα δεδομένα πωλήσεων Ελλιπή δεδομένα μπορεί να οφείλονται σε Εσφαλμένη λειτουργία εξοπλισμού Ασύμβατα με άλλα καταγεγραμμένα δεδομένα και έτσι διαγεγραμμένα Τα δεδομένα δεν καταχωρήθηκαν λόγω παρεξήγησης Ορισμένα δεδομένα ενδέχεται να μην θεωρούνται σημαντικά κατά τη στιγμή της καταχώρησης Δεν καταχωρείται το ιστορικό ή οι αλλαγές των δεδομένων Τα δεδομένα που λείπουν μπορεί να χρειάζεται να υπολογιστούν
8 Χειρισμός Δεδομένων που Λείπουν 8 Παράβλεψη εγγραφής: συνήθως γίνεται όταν λείπει η ετικέτα της κλάσης (κατά την κατηγοριοποίηση) δεν είναι αποτελεσματική όταν το % των τιμών που λείπουν ανά χαρακτηριστικό ποικίλλει σημαντικά Συμπλήρωση των τιμών που λείπουν χειροκίνητα: κουραστική + μη εφικτή Συμπλήρωση των τιμών αυτόματα με Μια γενική σταθερά : π.χ., unknown, μια νέα τάξη;! το μέσο όρο των χαρακτηριστικών το μέσο όρο των χαρακτηριστικών για όλα τα δείγματα που ανήκουν στην ίδια κατηγορία: πιο έξυπνο τη πιο πιθανή τιμή: συμπέρασμα που προκύπτει από κάποιο Bayesian τύπο ή δέντρο απόφασης
9 9 Δεδομένα με Θόρυβο Θόρυβος: τυχαίο σφάλμα ή διακύμανση σε μια μετρούμενη μεταβλητή Οι εσφαλμένες τιμές ιδιοτήτων μπορεί να οφείλονται σε Ελαττωματικά μέσα συλλογής δεδομένων Προβλήματα εισαγωγής δεδομένων Προβλήματα μετάδοσης δεδομένων Περιορισμούς της τεχνολογίας Ανακολουθία στην ονομασία των δεδομένων Άλλα προβλήματα δεδομένων Διπλότυπες εγγραφές Ελλιπή δεδομένα Μη συμβατά δεδομένα
10 10 Χειρισμός Δεδομένων με Θόρυβο Μέθοδος καλαθιού (Binning) Ταξινόμηση δεδομένων και χωρισμός σε τμήματα (ίσων συχνοτήτων) Στη συνέχεια, εξομάλυνση με το μέσο του τμήματος, εξομάλυνση με το διάμεσο του τμήματος, εξομάλυνση με τα όρια του τμήματος, κλπ. Παλινδρόμηση Εξομάλυνση με την τοποθέτηση των δεδομένων σε συναρτήσεις παλινδρόμησης Ομαδοποίηση Εντοπισμός και αφαίρεση των ακραίων τιμών Ημι-εποπτεύομενη: Συνδυασμένος υπολογιστικός και ανθρώπινος έλεγχος Ανίχνευση ύποπτων τιμών και ανθρώπινος έλεγχος (π.χ. αντιμετώπιση πιθανών ακραίων τιμών)
11 11 Διαδικασία Καθαρισμού Δεδομένων Ανίχνευση αποκλίσεων Χρήση μεταδεδομένων (π.χ. πεδίο ορισμού, εύρος, εξάρτηση, κατανομή) Έλεγχος υπερφόρτωσης πεδίου Έλεγχος του κανόνα μοναδικότητας, του κανόνα διαδοχικότητας και του κανόνα μη ύπαρξης τιμής (null) Χρήση εμπορικών εργαλείων Καθαρισμός δεδομένων: Απλή χρήση της γνώσης του πεδίου τιμών (π.χ. ταχυδρομικός κώδικας, ορθογραφικός έλεγχος) για ανίχνευση σφαλμάτων και διορθώσεων Έλεγχος δεδομένων: ανάλυση δεδομένων για την ανίχνευση κανόνων και σχέσεων για την ανίχνευση παραβάσεων (π.χ. συσχέτιση και ομαδοποίηση για την εξεύρεση ακραίων τιμών) Μεταφορά και ενσωμάτωση δεδομένων Εργαλεία μεταφοράς δεδομένων: επιτρέπουν τον ορισμό μετασχηματισμών Εργαλεία ETL (Extraction / Transformation / Loading): επιτρέπουν στους χρήστες να καθορίζουν μετασχηματισμούς μέσω ενός γραφικού περιβάλλοντος
12 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 12 Σύνοψη
13 Ενσωμάτωση Δεδομένων Ενσωμάτωση Δεδομένων Συνδυασμός δεδομένων από πολλές πηγές σε ένα συνεκτικό χώρο αποθήκευσης Ενσωμάτωση σχήματος: π.χ., A.cust-id B.cust-# Ενσωμάτωση μεταδεδομένων από διαφορετικές πηγές Ταυτοποίηση οντότητας Ταυτοποίηση οντοτήτων πραγματικού κόσμου από πολλαπλές πηγές δεδομένων, π.χ. Bill Clinton = William Clinton Ανίχνευση και επίλυση συγκρούσεων στις τιμές δεδομένων Για την ίδια οντότητα του πραγματικού κόσμου, οι τιμές χαρακτηριστικών από διαφορετικές πηγές είναι διαφορετικές Πιθανοί λόγοι: διαφορετικές αναπαραστάσεις, διαφορετικές κλίμακες, π.χ. διαφορετικές μονάδες μέτρησης μήκους 13
14 Χειρισμός Πλεονασμού στην Ενσωμάτωση Δεδομένων Τα πλεονασματικά δεδομένα εμφανίζονται συχνά όταν γίνεται ενσωμάτωση πολλαπλών βάσεων δεδομένων Ταυτοποίηση αντικειμένου: Το ίδιο χαρακτηριστικό ή αντικείμενο μπορεί να έχει διαφορετικά ονόματα σε διαφορετικές βάσεις δεδομένων Παράγωγα δεδομένα: Ένα χαρακτηριστικό μπορεί να υπολογίζεται σε έναν άλλο πίνακα, π.χ. ετήσια έσοδα Τα πλεονάζοντα χαρακτηριστικά μπορούν να ανιχνευθούν με ανάλυση συσχέτισης (correlation) και ανάλυση συνδιακύμανσης (covariance) Η προσεκτική ενσωμάτωση των δεδομένων από πολλαπλές πηγές μπορεί να συμβάλει στη μείωση / αποφυγή πλεονασμών και ασυνεπειών και στη βελτίωση της ταχύτητας και της ποιότητας της εξόρυξης 14
15 15 Ανάλυση Συσχέτισης (για Κατηγορικά Δεδομένα) Χ 2 (chi-square) test: Μηδενική υπόθεση: Οι δύο κατανομές είναι ανεξάρτητες Οι τιμές που συμβάλλουν περισσότερο στην τιμή Χ 2 είναι εκείνες των οποίων η πραγματική τιμή είναι πολύ διαφορετική από την αναμενόμενη Όσο μεγαλύτερη είναι η τιμή Χ 2, τόσο πιο πιθανό είναι να σχετίζονται οι μεταβλητές Σημείωση: Η συσχέτιση δεν συνεπάγεται αιτιώδη συνάφεια # νοσοκομείων και # κλοπών-αυτοκινήτων σε μια πόλη συσχετίζονται Και οι δύο συνδέονται αιτιωδώς με την τρίτη μεταβλητή: πληθυσμός
16 16 Υπολογισμός Chi-Square: Παράδειγμα Play chess Not play chess Sum (row) Like science fiction 250 (90) 200 (360) 450 Not like science fiction 50 (210) 1000 (840) 1050 Υπολογισμός 90? 450/1500 * 300 = 90 Υπολογισμός Χ 2 (chi-square) (οι αριθμοί σε παρένθεση είναι οι αναμενόμενες τιμές που υπολογίζονται βάσει της κατανομής των δεδομένων στις δύο κατηγορίες) 2 Sum(col.) (250 90) = 90 2 (50 210) = Δείχνει ότι like_science_fiction και play_chess είναι συσχετισμένες 2 ( ) ( ) Μπορούμε να απορρίψουμε τη μηδενική υπόθεση της ανεξαρτησίας στο επίπεδο εμπιστοσύνης 0.001
17 Διακύμανση Μιας Μεταβλητής 17 Η διακύμανση μιας τυχαίας μεταβλητής X παρέχει ένα μέτρο για το πόσο η τιμή του Χ αποκλίνει από τη μέση ή την αναμενόμενη τιμή του X: x = var( X) = E[(X ) ] = 2 2 όπου σ 2 η διακύμανση του X, το σ καλείται τυπική απόκλιση (standard deviation) µ η μέση τιμή, και µ = E[X] η αναμενόμενη τιμή του X Έτσι, διακύμανση είναι η αναμενόμενη τιμή της τετραγωνικής απόκλισης από τη μέση τιμή Μπορεί, επίσης να γραφτεί ως: 2 ( x ) f ( x) if X is discrete 2 ( x ) f ( x) dx if X is continuous = var( X ) = E[(X ) ] = E[X ] = E[X ] [ E( x)] Η διακύμανση δείγματος είναι η μέση τετραγωνική απόκλιση των τιμών x i από το μέσο του δείγματος n ˆ ˆ ˆ = ( xi ) n i= 1
18 18 Συνδιακύμανση Δύο Μεταβλητών Συνδιακύμανση μεταξύ δύο μεταβλητών X 1 και X 2 = E[( X )( X )] = E[ X X ] = E[ X X ] E[ X ] E[ X ] όπου µ 1 = E[X 1 ] η αντίστοιχη μέση ή αναμενόμενη τιμή του X 1 ; παρόμοια το µ 2 n 1 Συνδιακύμανση δείγματος μεταξύ X 1 και X 2 : ˆ 12 = ( x ˆ ˆ i1 1)( xi2 2) n i= 1 Η συνδιακύμανση δείγματος είναι μια γενίκευση της διακύμανσης δείγματος: Θετική συνδιακύμανση: Αν σ 12 > 0 Αρνητική συνδιακύμανση : Αν σ 12 < 0 Ανεξαρτησία: Αν X 1 και X 2 είναι ανεξάρτητες, σ 12 = 0, το αντίστροφο δεν ισχύει ˆ ˆ ˆ ˆ ˆ n n = ( xi 1 1)( xi 1 1) = ( xi 1 1) = 1 n i= 1 n i= 1 Μερικά ζεύγη τυχαίων μεταβλητών μπορεί να έχουν συνδιακύμανση 0 αλλά δεν είναι ανεξάρτητα Μόνο κάτω από κάποιες πρόσθετες υποθέσεις (π.χ., τα δεδομένα ακολουθούν πολυμεταβλητές κανονικές κατανομές) η συνδιακύμανση 0 συνεπάγεται την ανεξαρτησία
19 19 Παράδειγμα: Υπολογισμός Συνδιακύμανσης Ας υποθέσουμε δύο αποθέματα X 1 και X 2 έχουν τις ακόλουθες τιμές σε μια βδομάδα: (2, 5), (3, 8), (5, 10), (4, 11), (6, 14) Τύπος Συνδιακύμανσης = E[( X )( X )] = E[ X X ] = E[ X X ] E[ X ] E[ X ] Ο υπολογισμός μπορεί να απλοποιηθεί ως: E(X 1 ) = ( )/ 5 = 20/5 = 4 E(X 2 ) = ( ) /5 = 48/5 = 9.6 σ 12 = ( )/ = 4 Έτσι, X 1 και X 2 αυξάνοντα μαζί αφού σ 12 > 0 = E[ X X ] E[ X ] E[ X ]
20 Συσχέτιση Δύο Μεταβλητών Συσχέτιση μεταξύ δύο μεταβλητών X 1 και X 2 είναι η τυπική συνδιακύμανση που προκύπτει από την κανονικοποίηση της συνδιακύμανσης με την τυπική απόκλιση κάθε μεταβλητής Συσχέτιση Δείγματος για δύο μεταβλητές X 1 και X 2 : 12 = = ˆ 12 ˆ n ( x ˆ )( x ˆ ) i1 1 i i= 1 = = ˆ ˆ n n ( x ˆ ˆ i1 1) ( xi2 2) i= 1 i= 1 20 όπου n το πλήθος των τιμών, µ 1 και µ 2 οι αντίστοιχες μέσες τιμές των X 1 και X 2, σ 1 και σ 2 οι αντίστοιχες τυπικές αποκλίσεις των X 1 και X 2 Αν ρ 12 > 0: A και B θετικά συσχετισμένα (οι τιμές X 1 αυξάνουν όπως οι X 2 ) Όσο πιο μεγάλη η τιμή, τόσο πιο ισχυρή η συσχέτιση Αν ρ 12 = 0: ανεξάρτητα (κάτω από τις ίδιες προϋποθέσεις με τη συνδιακύμανση) Αν ρ 12 < 0: αρνητικά συσχετισμένα
21 21 Οπτικοποίηση Μεταβολών Συντελεστή Συσχέτισης Εύρος τιμής συντελεστή συσχέτισης: [ 1, 1] Ένα σύνολο γραφημάτων διασποράς δείχνει τα σύνολα σημείων όταν οι συντελεστές συσχέτισης τους αλλάζουν από 1 μέχρι 1
22 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 22 Σύνοψη
23 Μείωση Δεδομένων Μείωση δεδομένων: Μειωμένη αναπαράσταση του συνόλου δεδομένων πολύ μικρότερος όγκος αλλά σχεδόν τα ίδια αναλυτικά αποτελέσματα 23 Γιατί μείωση των δεδομένων; - Μια βάση δεδομένων / αποθήκη δεδομένων μπορεί να αποθηκεύει terabyte δεδομένων Μια πολύπλοκη ανάλυση ενδέχεται να διαρκέσει πολύ μεγάλο χρονικό διάστημα για να εκτελεστεί στο πλήρες σύνολο δεδομένων Μέθοδοι για τη μείωση των δεδομένων (μείωση μεγέθους δεδομένων ή μείωση αριθμητικότητας) Παλινδρόμηση Ιστογράμματα, ομαδοποίηση, δειγματοληψία Συσσώρευση κύβου δεδομένων Συμπίεση δεδομένων
24 24 Μείωση Δεδομένων: Παραμετρικές και Μη-Παραμετρικές Μέθοδοι Περιορισμός του όγκου δεδομένων με την επιλογή εναλλακτικών μικρότερων μορφών αναπαράστασης των δεδομένων Παραμετρικές μέθοδοι (π.χ., παλινδρόμηση) Με την υπόθεση ότι τα δεδομένα ακολουθούν κάποιο μοντέλο, γίνεται εκτίμηση των παραμέτρων, αποθηκεύονται οι παράμετροι και απορρίπτονται τα δεδομένα (εκτός ίσως από τις ακραίες τιμές) Μη-Παραμετρικές μέθοδοι Δεν προϋποθέτουν μοντέλα Κύριες κατηγορίες: ιστογράμματα, ομαδοποίηση, δειγματοληψία, Ιστόγραμμα Φιλοδώρημα και Λογαριασμός Ομαδοποίηση στα αρχικά δεδομένα Στρωματοποιημένη δειγματοληψία
25 25 Παραμετρική Μείωση Δεδομένων: Ανάλυση Παλινδρόμησης Ανάλυση Παλινδρόμησης: Μια Συλλογική ονομασία για τεχνικές μοντελοποίησης και ανάλυσης αριθμητικών δεδομένων με μια εξαρτημένη μεταβλητή και μια ή περισσότερες ανεξάρτητες μεταβλητές (γνωστές και ως επεξηγηματικές μεταβλητές ή προγνωστικοί δείκτες) Οι παράμετροι εκτιμώνται έτσι ώστε να δίνουν την "καλύτερη προσαρμογή" των δεδομένων Πιο συχνά η καλύτερη προσαρμογή αξιολογείται με τη χρήση της μεθόδου των ελαχίστων τετραγώνων, αλλά χρησιμοποιούνται και άλλα κριτήρια y Y 1 Y 1 X 1 y = x + 1 Χρησιμοποιείται για πρόβλεψη (συμπεριλαμβανομένης της πρόβλεψης δεδομένων χρονολογικών σειρών), εξαγωγή συμπερασμάτων, έλεγχο υποθέσεων και μοντελοποίηση αιτιακών σχέσεων x
26 Γραμμική και Πολλαπλή Παλινδρόμηση Γραμμική Παλινδρόμηση: Y = w X + b Τα δεδομένα προσαρμόζονται σε μια ευθεία γραμμή Συχνά χρησιμοποιεί τη μέθοδο ελαχίστων τετραγώνων για τη προσαρμογή της γραμμής Δύο συντελεστές παλινδρόμησης, w και b, προσδιορίζουν τη γραμμή και πρέπει να εκτιμηθούν με τη χρήση των δεδομένων Χρησιμοποιώντας το κριτήριο των ελάχιστων τετραγώνων στις γνωστές τιμές του Y 1, Y 2,, X 1, X 2,. Μη-Γραμμική Παλινδρόμηση: Τα δεδομένα μοντελοποιούνται από μια συνάρτηση η οποία είναι ένας μη γραμμικός συνδυασμός των παραμέτρων του μοντέλου και εξαρτάται από μία ή περισσότερες ανεξάρτητες μεταβλητές Τα δεδομένα προσαρμόζονται με μια μέθοδο διαδοχικών προσεγγίσεων 26
27 27 Πολλαπλή Παλινδρόμηση και Μοντέλα Log-Linear Πολλαπλή Παλινδρόμηση: Y = b 0 + b 1 X 1 + b 2 X 2 Επιτρέπει μια μεταβλητή Υ να διαμορφώνεται ως γραμμική συνάρτηση ενός πολυδιάστατου διανύσματος χαρακτηριστικών Log-linear μοντέλο: Ένα μαθηματικό μοντέλο που παίρνει τη μορφή μίας συνάρτησης της οποίας ο λογάριθμος είναι ένας γραμμικός συνδυασμός των παραμέτρων του μοντέλου, που καθιστά δυνατή την εφαρμογή (πιθανώς πολυπαραμετρική) γραμμικής παλινδρόμησης Εκτίμηση της πιθανότητας κάθε σημείου σε ένα πολυδιάστατο χώρο για ένα σύνολο διακριτοποιημένων χαρακτηριστικών, με βάση ένα μικρότερο υποσύνολο διαστάσεων Χρήσιμο για τη μείωση των διαστάσεων και την εξομάλυνση των δεδομένων
28 Ανάλυση Ιστογράμματος Διαχωρισμός των δεδομένων σε καλάθια και αποθήκευση του μέσου όρου (άθροισμα) για κάθε καλάθι Κανόνες διαχωρισμού: Ίσο πλάτος: ίσο εύρος καλαθιού Ίση συχνότητα (ή ίσο βάθος)
29 Ομαδοποίηση (Clustering) Διαχωρισμός δεδομένων σε συστάδες βασισμένες στην ομοιότητα, και αποθήκευση των στοιχείων που αντιπροσωπεύουν τη συστάδα (π.χ., κεντρική τάση και διάμετρος) Μπορεί να είναι πολύ αποτελεσματική εάν τα δεδομένα είναι ομαδοποιημένα αλλά όχι εάν τα δεδομένα είναι μπλεγμένα Μπορεί να έχει ιεραρχική ομαδοποίηση και μπορεί να αποθηκευτεί σε πολυδιάστατες δεντρικές δομές Υπάρχουν πολλές επιλογές ορισμών και αλγόριθμων ομαδοποίησης 29
30 Δειγματοληψία Δειγματοληψία: λήψη ενός μικρού δείγματος s αντιπροσωπευτικού ολόκληρου του συνόλου δεδομένων N Επιτρέπει σε έναν αλγόριθμο εξόρυξης να λειτουργεί σε πολυπλοκότητα που είναι δυνητικά υπο-γραμμική ως προς το μέγεθος των δεδομένων Βασική αρχή: Επιλέξτε ένα αντιπροσωπευτικό υποσύνολο των δεδομένων Η απλή τυχαία δειγματοληψία μπορεί να έχει πολύ χαμηλή επίδοση όταν υπάρχει κυρτότητα Ανάπτυξη προσαρμοστικών μεθόδων δειγματοληψίας, π.χ., στρωματοποιημένη δειγματοληψία: Σημείωση: Η δειγματοληψία ενδέχεται να μην μειώνει τα I/O της βάσης δεδομένων (μια σελίδα κάθε φορά) 30
31 Είδη Δειγματοληψίας Απλή τυχαία δειγματοληψία: Ίση πιθανότητα επιλογής συγκεκριμένου στοιχείου Δειγματοληψία χωρίς αντικατάσταση Μόλις επιλεγεί ένα αντικείμενο, αφαιρείται από τον πληθυσμό Δειγματοληψία με αντικατάσταση Ένα επιλεγμένο αντικείμενο δεν αφαιρείται από τον πληθυσμό Στρωματοποιημένη δειγματοληψία Διαχωρισμός (ή ομαδοποίηση) του συνόλου δεδομένων, και λήψη δείγματος από κάθε τμήμα (αναλογικά) Αρχικά Δεδομένα Στρωματοποιημένη δειγματοληψία 31
32 Συνάθροιση Κύβου Δεδομένων Το χαμηλότερο επίπεδο ενός κύβου δεδομένων (βασικός κύβος) Τα συγκεντρωτικά στοιχεία για μια μεμονωμένη οντότητα Πολλαπλά επίπεδα συσσωμάτωσης σε κύβους δεδομένων Περαιτέρω μείωση του μεγέθους των δεδομένων Αναφορά στο κατάλληλο επίπεδο Χρήση της μικρότερης παράστασης που αρκεί για τη λύση του προβλήματος Ερωτήματα που αφορούν συγκεντρωτικές πληροφορίες απαντώνται χρησιμοποιώντας κύβους δεδομένων, όταν είναι δυνατόν 32
33 Συμπίεση συμβολοσειράς Συμπίεση Δεδομένων 33 Υπάρχουν εκτεταμένες θεωρίες και καλά συντονισμένοι αλγόριθμοι Συνήθως χωρίς απώλειες Συμπίεση ήχου / βίντεο Συμπίεση με απώλειες, με προοδευτική βελτίωση Μερικές φορές μικρά κομμάτια σήματος μπορούν να ανακατασκευαστούν χωρίς να ανακατασκευάζεται το σύνολο Η χρονική ακολουθία δεν είναι ηχητική Συνήθως είναι σύντομες και διαφοροποιούνται αργά με το χρόνο Η μείωση των δεδομένων και η μείωση των διαστάσεων μπορούν επίσης να θεωρηθούν ως μορφές συμπίεσης δεδομένων Αρχικά Δεδομένα Αρχικά Δεδομένα κατά προσέγγιση Συμπιεσμένα Δεδομένα Χωρίς απώλειες Με απώλειες και χωρίς απώλειες συμπίεση
34 Μετασχηματισμός Δεδομένων 34 Μια συνάρτηση που απεικονίζει το σύνολο των τιμών μιας δεδομένης ιδιότητας σε ένα νέο σύνολο τιμών (κάθε παλιά τιμή μπορεί να αντιστοιχηθεί με μία από τις νέες τιμές) Μέθοδοι Ομαλοποίηση: Αφαίρεση θορύβου από τα δεδομένα Δημιουργία χαρακτηριστικών Νέες ιδιότητες κατασκευάζονται από τις αρχικές Συνάθροιση: Σύνοψη, κατασκευή κύβου δεδομένων Κανονικοποίηση: Κλιμάκωση ώστε να εμπίπτει σε μικρότερο, καθορισμένο εύρος Κανονικοποίηση min-max Κανονικοποίηση z-score Κανονικοποίηση σε δεκαδική κλίμακα Διακριτοποίηση: Αναρρίχηση στην ιεραρχίας εννοιών
35 Κανονικοποίηση (Normalization) Min-max κανονικοποίηση : σε [new_min A, new_max A ] v min maxa min Π.χ. Έστω εισόδημα με εύρος $12,000 έως $98,000 κανονικοποιείται στο [0.0, 1.0] Τότε $73,000 απεικονίζεται στο v A ' = ( new _ maxa new _ mina) + 73,600 12,000 (1.0 0) + 0 = ,000 12,000 Z-score κανονικοποίηση (μ: μέσος, σ: τυπική απόκλιση): A new _ min A 35 v' = A A Π.χ. Έστω μ = 54,000, σ = 16,000. Τότε v Z-score: Η απόσταση μεταξύ της αρχικής τιμής και του μέσου του πληθυσμού στη μονάδα της τυπικής απόκλισης 73,600 54,000 = ,000 Κανονικοποίηση με δεκαδική κλίμακα v v'= Όπου j ο μικρότερος ακέραιος ώστε Max( ν ) < 1 j 10
36 Διακριτοποίηση (Discretization ) Τρεις τύποι χαρακτηριστικών Ονομαστικά τιμές από ένα μη ταξινομημένο σύνολο, π.χ. χρώμα, επάγγελμα Τακτικά τιμές από ένα ταξινομημένο σύνολο, π.χ. στρατιωτική ή ακαδημαϊκή κατάταξη Αριθμητικά πραγματικοί αριθμοί, π.χ., ακέραιοι ή πραγματικοί αριθμοί Διακριτοποίηση: Διαχωρίζει το εύρος ενός συνεχούς χαρακτηριστικού σε διαστήματα Οι ετικέτες διαστήματος μπορούν στη συνέχεια να χρησιμοποιηθούν για να αντικαταστήσουν τις πραγματικές τιμές δεδομένων Μείωση του μεγέθους των δεδομένων Με ή χωρίς επιτήρηση Διαίρεση (από πάνω προς τα κάτω) έναντι συγχώνευσης (από κάτω προς τα πάνω) Η διακριτοποίηση μπορεί να εφαρμοστεί αναδρομικά σε ένα χαρακτηριστικό Προετοιμασία για περαιτέρω ανάλυση, π.χ. κατηγοριοποίηση 36
37 Μέθοδοι Διακριτοποίησης Δεδομένων Μέθοδος καλαθιού (Binning) Διαχωρισμός από πάνω προς τα κάτω, χωρίς επίβλεψη Ανάλυση ιστογράμματος Διαχωρισμός από πάνω προς τα κάτω, χωρίς επίβλεψη Ανάλυση συστάδων Μη επιτηρούμενη, διαχωρισμός από πάνω προς τα κάτω ή από κάτω προς τα πάνω συγχώνευση Ανάλυση δέντρων απόφασης Επιτηρούμενη, διαχωρισμός από πάνω προς τα κάτω Ανάλυση συσχέτισης (π.χ., 2 ) Μη επιτηρούμενη, συγχώνευση από κάτω προς τα πάνω Σημείωση: Όλες οι μέθοδοι μπορούν να εφαρμοστούν αναδρομικά 37
38 38 Απλή Διακριτοποίηση: Μέθοδος Καλαθιού (Binning) Διαχωρισμός ίσου πλάτους (απόστασης) Διαιρεί το εύρος σε N διαστήματα ίσου μεγέθους: ομοιόμορφο πλέγμα Αν A και B είναι η ελάχιστη και η μέγιστη του χαρακτηριστικού, το πλάτος των διαστημάτων θα είναι: W = (B A)/N. Οι πιο απλές, αλλά οι ακραίες τιμές μπορεί να κυριαρχούν στην παρουσίαση Τα κυρτά δεδομένα δεν αντιμετωπίζονται καλά Διαχωρισμός ίσου βάθους (συχνότητας) Διαχωρίζει το εύρος σε N διαστήματα, το καθένα από τα οποία περιέχει περίπου τον ίδιο αριθμό δειγμάτων Καλή κλιμάκωση δεδομένων Η διαχείριση κατηγορικών χαρακτηριστικών μπορεί να είναι δύσκολη
39 Παράδειγμα: Μέθοδοι Καλαθιού για Εξομάλυνση Δεδομένων 39 Ταξινόμηση ως προς τη τιμή: 4, 8, 9, 15, 21, 21, 24, 25, 26, 28, 29, 34 * Διαχωρισμός σε καλάθια με ίση συχνότητα (equi-depth): - Bin 1: 4, 8, 9, 15 - Bin 2: 21, 21, 24, 25 - Bin 3: 26, 28, 29, 34 * Εξομάλυνση με το μέσο του καλαθιού: - Bin 1: 9, 9, 9, 9 - Bin 2: 23, 23, 23, 23 - Bin 3: 29, 29, 29, 29 * Εξομάλυνση με τα όρια του καλαθιού: - Bin 1: 4, 4, 4, 15 - Bin 2: 21, 21, 25, 25 - Bin 3: 26, 26, 26, 34
40 Διακριτοποίηση Χωρίς Επίβλεψη: Binning vs. Clustering Δεδομένα Ίσο πλάτος (απόσταση) καλαθιού 40 Ίσο βάθος (συχνότητα) καλαθιού Η ομαδοποίηση K-μέσων οδηγεί σε καλύτερα αποτελέσματα
41 41 Διακριτοποίηση με Κατηγοριοποίηση & Ανάλυση Συσχέτισης Κατηγοριοποίηση (π.χ., decision tree analysis) Εποπτευόμενη: Δεδομένων των ετικετών κατηγορίας, π.χ., καρκινικές ή καλοήθεις Χρησιμοποιώντας την εντροπία (entropy) για τον προσδιορισμό του σημείου διαχωρισμού (σημείο διακριτοποίησης) Από την κορυφή προς τα κάτω, αναδρομικός διαχωρισμός Ανάλυση Συσχέτισης (π.χ., Chi-merge: Διακριτοποίηση βασισμένη στη χ 2 ) Εποπτευόμενη: χρήση πληροφοριών κλάσης Συγχώνευση από κάτω προς τα πάνω: Εύρεση των καλύτερων γειτονικών διαστημάτων (αυτά που έχουν παρόμοιες κατανομές των κλάσεων, π.χ., χαμηλές χ 2 τιμές) για συγχώνευση Η συγχώνευση εφαρμόζεται αναδρομικά, μέχρι να ικανοποιηθεί μια προκαθορισμένη συνθήκη τερματισμού
42 Δημιουργία Ιεραρχίας Εννοιών Η Ιεραρχία εννοιών (concept hierarchy) οργανώνει τις έννοιες (δηλ., τις τιμές γνωρισμάτων) ιεραρχικά και συνήθως συσχετίζεται με τις διαστάσεις στην αποθήκη δεδομένων Η ιεραρχία εννοιών διευκολύνει την εμβάθυνση (drilling) και την συσσώρευση (rolling) στην αποθήκη δεδομένων ώστε να ιδωθούν τα δεδομένα υπό διάφορες πληθικότητες Δημιουργία ιεραρχίας εννοιών: Αναδρομικός περιορισμός των δεδομένων με συλλογή και αντικατάσταση έννοιών χαμηλού επιπέδου (όπως αριθμητικές τιμές για την ηλικία) με έννοιες υψηλότερου επιπέδου (όπως οι νέοι, οι ενήλικοι ή οι ηλικιωμένοι) Οι ιεραρχίες των εννοιών μπορούν να καθοριστούν ρητά από τους ειδικούς του τομέα εφαρμογής και/ή τους σχεδιαστές της αποθήκης δεδομένων Η ιεραρχία εννοιών μπορεί να διαμορφωθεί αυτόματα τόσο για αριθμητικά όσο και για ονομαστικά δεδομένα - Για αριθμητικά δεδομένα, χρησιμοποιούνται οι μεθόδοι διακριτοποίησης 42
43 43 Δημιουργία Ιεραρχίας Εννοιών για Ονομαστικά Δεδομένα Καθορισμός μερικής / ολικής διάταξης χαρακτηριστικών ρητά στο επίπεδο του σχήματος από τους χρήστες ή εμπειρογνώμονες street < city < state < country Καθορισμός ιεραρχίας για ένα σύνολο τιμών μέσω ρητής ομαδοποίησης δεδομένων {Αθήνα, Σπάτα, Λούτσα} < Αττική Καθορισμός μόνο ενός μερικού συνόλου χαρακτηριστικών Π.χ., μόνο street < city, όχι τα άλλα Αυτόματη δημιουργία ιεραρχιών (ή επιπέδων χαρακτηριστικών) με την ανάλυση του αριθμού διακριτών τιμών Π.χ., για ένα σύνολο χαρακτηριστικών: {street, city, state, country}
44 44 Αυτόματη Δημιουργία Ιεραρχίας Εννοιών Κάποιες ιεραρχίες μπορούν να δημιουργηθούν αυτόματα με την ανάλυση του αριθμού των διαφορετικών τιμών ανά χαρακτηριστικό στο σύνολο δεδομένων Το χαρακτηριστικό με τις περισσότερο διακριτές τιμές τοποθετείται στο χαμηλότερο επίπεδο της ιεραρχίας Εξαιρέσεις, π.χ., ημέρα της εβδομάδας, μήνας, τρίμηνο, έτος country province_or_ state city street 15 διαφορετικές τιμές 365 διαφορετικές τιμές 3567 διαφορετικές τιμές 674,339 διαφορετικές τιμές
45 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 45 Σύνοψη
46 Μείωση Διαστάσεων 46 Η κατάρα των πολλών συνιστωσών Όταν αυξάνονται οι διαστάσεις, τα δεδομένα γίνονται ολοένα και πιο αραιά Η πυκνότητα και η απόσταση μεταξύ των σημείων, η οποία είναι κρίσιμη για την ομαδοποίηση, την ανάλυση ακραίων τιμών, γίνεται λιγότερο σημαντική Οι πιθανοί συνδυασμοί υποπεριοχών αυξάνονται εκθετικά Μείωση Διαστάσεων Μείωση του αριθμού των τυχαίων μεταβλητών υπό εξέταση, μέσω της λήψης ενός συνόλου κύριων μεταβλητών Πλεονεκτήματα της μείωσης των διαστάσεων Αποφυγή της κατάρας των διαστάσεων Βοηθά στην εξάλειψη άσχετων χαρακτηριστικών και στη μείωση του θορύβου Μείωση του απαιτούμενου χρόνου και χώρου για την εξόρυξη δεδομένων Επιτρέπει την ευκολότερη οπτικοποίηση
47 47 Τεχνικές Μείωσης Διαστάσεων Μεθοδολογίες μείωσης διαστάσεων Επιλογή χαρακτηριστικών: Εύρεση ενός υποσυνόλου των αρχικών μεταβλητών Εξαγωγή χαρακτηριστικών: Μετασχηματισμός των δεδομένων από ένα χώρο πολλών διαστάσεων σε ένα χώρο με λιγότερες διαστάσεις Μερικές τυπικές μέθοδοι μείωσης διαστάσεων Ανάλυση κυρίων συνιστωσών (Principal Component Analysis) Εποπτευόμενες και μη γραμμικές τεχνικές Επιλογή υποσυνόλου χαρακτηριστικών Δημιουργία χαρακτηριστικών
48 Ανάλυση Κυρίων Συνιστωσών (PCA) PCA: Μια στατιστική διαδικασία που χρησιμοποιεί έναν μετασχηματισμό για τη μετατροπή ενός συνόλου παρατηρήσεων πιθανώς συσχετισμένων μεταβλητών σε ένα σύνολο τιμών γραμμικά μη συσχετισμένων μεταβλητών που ονομάζονται κύριες συνιστώσες (principal components) Τα αρχικά δεδομένα προβάλλονται σε ένα πολύ μικρότερο χώρο, με αποτέλεσμα τη μείωση των διαστάσεων 48 Έχει εφαρμογή μόνο για αριθμητικά δεδομένα Η μπάλα ταξιδεύει σε ευθεία γραμμή. Τα δεδομένα από τις τρεις κάμερες περιέχουν μεγάλο πλεονασμό
49 49 Επιλογή Υποσυνόλου Χαρακτηριστικών Ένας άλλος τρόπος να μειωθούν οι πολλές διαστάσεις των δεδομένων Πλεονάζοντα χαρακτηριστικά Διπλασιάζουν πολλές ή όλες τις πληροφορίες που περιέχονται σε ένα ή περισσότερα από τα άλλα χαρακτηριστικά Π.χ., η τιμή αγοράς ενός προϊόντος και το ποσό του φόρου επί των πωλήσεων που καταβλήθηκε Άσχετα χαρακτηριστικά Δεν περιέχουν πληροφορίες που είναι χρήσιμες για την εξόρυξη δεδομένων που επιχειρείται Π.χ. Το αναγνωριστικό ενός φοιτητή είναι άσχετο με την πρόβλεψη της τελικής του βαθμολογίας
50 50 Δημιουργία Χαρακτηριστικών Δημιουργία νέων χαρακτηριστικών που μπορούν να καταγράψουν τις σημαντικές πληροφορίες σε ένα σύνολο δεδομένων πιο αποτελεσματικά από τα αρχικά Τρεις γενικές μεθοδολογίες Εξαγωγή χαρακτηριστικών Εξειδικευμένο για κάθε τομέα Απεικόνιση δεδομένων σε νέο χώρο Π.χ. μετασχηματισμός Fourier, κυματοειδής μετασχηματισμός, Κατασκευή χαρακτηριστικών Συνδυασμός χαρακτηριστικών Διακριτοποίηση δεδομένων
51 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός Δεδομένων Περιορισμός Διαστάσεων 51 Σύνοψη
52 52 Σύνοψη Ποιότητα δεδομένων: ακρίβεια, πληρότητα, συνέπεια, επικαιρότητα, πιστότητα, ερμηνεία Καθαρισμός δεδομένων: π.χ. Ελλιπείς / θορυβώδεις τιμές, ακραίες τιμές Ενσωμάτωση δεδομένων από πολλαπλές πηγές: Πρόβλημα ταυτοποίησης οντότητας. Αφαίρεση πλεονασμού. Εντοπισμός ασυνεπειών Μείωση δεδομένων, μετασχηματισμός δεδομένων και διακριτοποίηση δεδομένων Μείωση αριθμητικότητας. Συμπίεση δεδομένων Κανονικοποίηση. Δημιουργία ιεραρχίας εννοιών Μείωση διαστάσεων
Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη
Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης
Διαβάστε περισσότεραΔιπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»
Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία
Διαβάστε περισσότεραΖητήματα ηήμ με τα δεδομένα
Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών
Διαβάστε περισσότεραΠεριεχόμενα. Πρόλογος... 15
Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...
Διαβάστε περισσότεραΣτατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών
(ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ
Διαβάστε περισσότεραΕυφυής Προγραμματισμός
Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων
Διαβάστε περισσότεραΕισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης
ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε
Διαβάστε περισσότεραΑναλυτική Στατιστική
Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων
Διαβάστε περισσότεραΑπλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017
Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης
Διαβάστε περισσότεραΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ
ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται
Διαβάστε περισσότεραΠρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1
Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές
Διαβάστε περισσότεραΠροεπεξεργασία εδοµένων
Προεπεξεργασία εδοµένων Αποθήκες και Εξόρυξη εδοµένων 2 ο Μάθηµα ιδάσκων: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδοµένων- πυρήνας της διαδικασίας
Διαβάστε περισσότεραΛίγα λόγια για τους συγγραφείς 16 Πρόλογος 17
Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε
Διαβάστε περισσότεραΕίδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ
ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό
Διαβάστε περισσότεραΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13
ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα
Διαβάστε περισσότεραKruskal-Wallis H... 176
Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................
Διαβάστε περισσότεραΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη
ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.
Διαβάστε περισσότεραΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13
ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...
Διαβάστε περισσότεραΔρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική
Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR
Διαβάστε περισσότεραΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13
ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα
Διαβάστε περισσότεραΑντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης
Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να
Διαβάστε περισσότεραΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον
Διαβάστε περισσότεραΕλλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων
Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί
Διαβάστε περισσότεραΣτατιστική Ι (ΨΥΧ-1202) ιάλεξη 3
(ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,
Διαβάστε περισσότεραΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71
ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα
Διαβάστε περισσότεραΕίδη Μεταβλητών. κλίµακα µέτρησης
ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό
Διαβάστε περισσότεραΠοσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος
Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότεραΣτατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία
Διαβάστε περισσότεραΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ
ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3
Διαβάστε περισσότεραΤεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας
Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.
Διαβάστε περισσότεραΣτατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες
Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού
Διαβάστε περισσότεραΣτατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o
ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής
Διαβάστε περισσότεραΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8
ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ Άλγεβρα 1 ο Κεφάλαιο 1. Τι ονομάζουμε αριθμητική και τι αλγεβρική παράσταση; Να δώσετε από ένα παράδειγμα. Μια παράσταση που περιέχει πράξεις με αριθμούς, καλείται αριθμητική παράσταση,
Διαβάστε περισσότεραΣυνοπτικά περιεχόμενα
b Συνοπτικά περιεχόμενα 1 Τι είναι η στατιστική;... 25 2 Περιγραφικές τεχνικές... 37 3 Επιστήμη και τέχνη των διαγραμματικών παρουσιάσεων... 119 4 Αριθμητικές μέθοδοι της περιγραφικής στατιστικής... 141
Διαβάστε περισσότεραΣυμπίεση Δεδομένων
Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Αναλογικά Ψηφιακά Σήματα Αναλογικό Σήμα x t, t [t min, t max ], x [x min, x max ] Δειγματοληψία t n, x t x n, n = 1,, N Κβάντιση x n x(n) 3 Αλφάβητο
Διαβάστε περισσότεραΓ. Πειραματισμός - Βιομετρία
Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται
Διαβάστε περισσότεραΤμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα
Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση
Διαβάστε περισσότεραΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία
ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση
Διαβάστε περισσότεραΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά
Διαβάστε περισσότεραΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19
ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα
Διαβάστε περισσότεραΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών
Διαβάστε περισσότεραΤμήμα Οργάνωσης και Διαχείρισης Αθλητισμού
Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού 3 ο Εξάμηνο του Ακαδημαϊκού Έτους 2013-2014 ΟΔ 034 ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Δευτέρα 10:00-13:00 Ώρες διδασκαλίας (3)
Διαβάστε περισσότεραΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική
ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana
Διαβάστε περισσότεραΒιοστατιστική ΒΙΟ-309
Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό
Διαβάστε περισσότεραΔιαχείριση Υδατικών Πόρων
Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική
Διαβάστε περισσότεραΣτατιστική Επιχειρήσεων ΙΙ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν
Διαβάστε περισσότεραΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ
. ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )
Διαβάστε περισσότεραΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να
N161 _ (262) Στατιστική στη Φυσική Αγωγή Βιβλία ή 1 ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να
Διαβάστε περισσότεραΑπλή Παλινδρόμηση και Συσχέτιση
Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989
Διαβάστε περισσότεραΣτατιστική ανάλυση αποτελεσμάτων
HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια
Διαβάστε περισσότεραΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ
ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,
Διαβάστε περισσότερα9. Παλινδρόμηση και Συσχέτιση
9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε
Διαβάστε περισσότεραHMY 795: Αναγνώριση Προτύπων
HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις
Διαβάστε περισσότεραΒιοστατιστική ΒΙΟ-309
Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό
Διαβάστε περισσότεραΣ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,
Διαβάστε περισσότεραiii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος
iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων
Διαβάστε περισσότεραΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ
Μέτρα Περιγραφικής Στατιστικής Πληθυσμιακοί παράμετροι: τα αριθμητικά μεγέθη που εκφράζουν τις στατιστικές ιδιότητες ενός πληθυσμού (που προσδιορίζουν / περιγράφουν τη φυσιογνωμία και τη δομή του) Στατιστικά
Διαβάστε περισσότεραΒιοστατιστική ΒΙΟ-309
Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2013-2014 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητή: ένα χαρακτηριστικό ή ιδιότητα που μπορεί να πάρει διαφορετικές τιμές
Διαβάστε περισσότερα4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER
4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι
Διαβάστε περισσότεραΑναγνώριση Προτύπων Ι
Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται
Διαβάστε περισσότεραΜέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)
Μέρος V. Στατιστική Εισαγωγή: Βασικές έννοιες και ορισμοί Περιγραφική Στατιστική (Descriptive Statistics) Σημαντικές κατανομές δειγματοληψίας (Sampling distributions) Διαστήματα Εμπιστοσύνης (Confidence
Διαβάστε περισσότεραHMY 795: Αναγνώριση Προτύπων. Διάλεξη 2
HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)
Διαβάστε περισσότεραΤμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση
Διαβάστε περισσότεραΣυσχέτιση μεταξύ δύο συνόλων δεδομένων
Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,
Διαβάστε περισσότεραΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο
Διαβάστε περισσότεραΥπερπροσαρμογή (Overfitting) (1)
Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης
Διαβάστε περισσότεραΔιάστημα εμπιστοσύνης της μέσης τιμής
Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:
Διαβάστε περισσότεραΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )
Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.
Διαβάστε περισσότεραΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ
Διαβάστε περισσότεραΕισαγωγή στην κοινωνική έρευνα. Earl Babbie. Κεφάλαιο 6. Δειγματοληψία 6-1
Εισαγωγή στην κοινωνική έρευνα Earl Babbie Κεφάλαιο 6 Δειγματοληψία 6-1 Σύνοψη κεφαλαίου Σύντομη ιστορία της δειγματοληψίας Μη πιθανοτική δειγματοληψία Θεωρία και λογική της πιθανοτικής Δειγματοληψίας
Διαβάστε περισσότεραΑ. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.
1 Κεφάλαιο. ΣΤΑΤΙΣΤΙΚΗ Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Στατιστική: ένα σύνολο αρχών και μεθοδολογιών για: το σχεδιασμό της διαδικασίας συλλογής δεδομένων τη συνοπτική και αποτελεσματική παρουσίασή τους την ανάλυση
Διαβάστε περισσότεραΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες
Διαβάστε περισσότεραΣ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν
Διαβάστε περισσότεραΔειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας
Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα
Διαβάστε περισσότεραΚεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ
ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα
Διαβάστε περισσότεραΣυμπίεση Δεδομένων
Συμπίεση Δεδομένων 2013-2014 JPEG 2000 Δρ. Ν. Π. Σγούρος 2 JPEG 2000 Βασικά χαρακτηριστικά Επιτρέπει συμπίεση σε εξαιρετικά χαμηλούς ρυθμούς όπου η συμπίεση με το JPEG εισάγει μεγάλες παραμορφώσεις Ενσωμάτωση
Διαβάστε περισσότεραΠοιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η
Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη, 2013-2014 Εμπειρικές Στατιστικές Κατανομές Τα προβλήματα που
Διαβάστε περισσότεραΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29
ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...
Διαβάστε περισσότεραΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου
ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου Σχηματική παρουσίαση της ερευνητικής διαδικασίας ΣΚΟΠΟΣ-ΣΤΟΧΟΣ ΘΕΩΡΙΑ ΥΠΟΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ Ερευνητικά
Διαβάστε περισσότεραΣ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ
Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες
Διαβάστε περισσότεραΠεριεχόμενα. 1. Ειδικές συναρτήσεις. 2. Μιγαδικές Συναρτήσεις. 3. Η Έννοια του Τελεστή. Κεφάλαιο - Ενότητα
Περιεχόμενα Κεφάλαιο - Ενότητα σελ 1. Ειδικές συναρτήσεις 1.0 Εισαγωγή 1.1 Εξίσωση του Laplace Συστήματα συντεταγμένων 1.2 Συνάρτηση δ του Dirac 1.3 Συνάρτηση του Heaviside 1.4 Οι συναρτήσεις Β, Γ και
Διαβάστε περισσότεραΈστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς
Διασπορά Μέτρηση Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς ομάδες έχουν μέση βαθμολογία 6. συνέχεια
Διαβάστε περισσότεραΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ
- - ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ3 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 009-0 ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ - - ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΥΝΟΨΗΣ
Διαβάστε περισσότεραE [ -x ^2 z] = E[x z]
1 1.ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτήν την διάλεξη θα πάμε στο φίλτρο με περισσότερες λεπτομέρειες, και θα παράσχουμε μια νέα παραγωγή για το φίλτρο Kalman, αυτή τη φορά βασισμένο στην ιδέα της γραμμικής
Διαβάστε περισσότεραΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική
ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr
Διαβάστε περισσότερα1.4 Λύσεις αντιστρόφων προβλημάτων.
.4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης
Διαβάστε περισσότεραΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική
ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana
Διαβάστε περισσότεραΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική
ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana
Διαβάστε περισσότεραΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που
Διαβάστε περισσότεραΜεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης
Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Τμηματοποίηση εικόνας Τμηματοποίηση εικόνας Γενικά Διαμερισμός μιας εικόνας σε διακριτές περιοχές
Διαβάστε περισσότεραΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών
Διαβάστε περισσότεραΜεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης
Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Χωρικά φίλτρα Χωρικά φίλτρα Γενικά Σε αντίθεση με τις σημειακές πράξεις και μετασχηματισμούς, στα
Διαβάστε περισσότεραΣτατιστική Επιχειρήσεων Ι
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 7: Παρουσίαση δεδομένων-περιγραφική στατιστική Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων
Διαβάστε περισσότεραΙδιότητες της ευθείας παλινδρόµησης
Ιδιότητες της ευθείας παλινδρόµησης Ηευθεία παλινδρόµησης περνάει από το σηµείο αφού a b, a b ( b ) b b ( + + + ) ( ) + b u u a b a b Αυτό όµως προϋποθέτει την ύπαρξη του a. Αν δηλαδή υποχρεώσουµε την
Διαβάστε περισσότεραΑ Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο
Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%
Διαβάστε περισσότεραΣτατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ Τμήμα Λογιστικής & Χρηματοοικονομικής Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου Περιεχόμενα-Ύλη του Μαθήματος Περιγραφική Στατιστική: Είδη δεδομένων, Μετασχηματισμοί,
Διαβάστε περισσότεραΑνάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R
Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο
Διαβάστε περισσότερα