Ανάλυση Δεδομένων. Καθηγητής Ιωάννης Κ. Δημητρίου Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Σχετικά έγγραφα
Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών. κλίµακα µέτρησης

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Βιοστατιστική ΒΙΟ-309

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Βιοστατιστική ΒΙΟ-309

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Βιοστατιστική ΒΙΟ-309

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Εισαγωγή στη Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Περιεχόμενα. Πρόλογος... 15

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

Ενότητα 2: Μέθοδοι δειγματοληψίας & Εισαγωγή στην Περιγραφική Στατιστική

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Στατιστική Επιχειρήσεων Ι

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Περιγραφική Στατιστική

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

E-Class.

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

Εφαρμοσμένη Στατιστική

Η ΘΕΩΡΙΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΑΡΤΗΣΕΙΣ ΓΝΗΣΙΩΣ ΑΥΞΟΥΣΑ ΣΥΝΑΡΤΗΣΗ ΓΝΗΣΙΩΣ ΦΘΙΝΟΥΣΑΣΥΝΑΡΤΗΣΗ ΤΟΠΙΚΟ ΜΕΓΙΣΤΟ ΤΟΠΙΚΟ ΕΛΑΧΙΣΤΟ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

επ. Κωνσταντίνος Π. Χρήστου

Εισαγωγή στη Στατιστική

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Σ ΤΑΤ Ι Σ Τ Ι Κ Η MBA I

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Έτος : Διάλεξη 2 η Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική

Στατιστική Ι Ασκήσεις 3

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

i Σύνολα w = = = i v v i=

Διάλεξη 1 Βασικές έννοιες

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ & ΕΚΠΑΙΔΕΥΣΗ

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

f , Σύνολο 40 4) Να συμπληρώστε τον παρακάτω πίνακα f , , Σύνολο 5) Να συμπληρώστε τον παρακάτω πίνακα

Κεφάλαιο 5. Οι δείκτες διασποράς

Ενότητα: Περιγραφική Στατιστική 2: Αριθμητικά Μεγέθη

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Transcript:

Ανάλυση Δεδομένων Καθηγητής Ιωάννης Κ. Δημητρίου Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών demetri@econ.uoa.gr Οικονομικά, Διοικητικά και Πληροφοριακά Συστήματα Επιχειρήσεων 2

Business Statistics Καθηγητής Ιωάννης Κ. Δημητρίου Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών demetri@econ.uoa.gr Οικονομικά, Διοικητικά και Πληροφοριακά Συστήματα Επιχειρήσεων 3

Βιβλιογραφία Ι. Χαλικιά, Στατιστική. Μέθοδοι Ανάλυσης για Επιχειρηματικές Αποφάσεις, 3 η Έκδοση, εκδ. Rosili 2010, Κεφάλαια 1 5 Ι. Κ. Δημητρίου, Διαφάνειες, Οδηγίες Μελέτης, Σημειώσεις για χρήση του Excel (περιγραφική στατιστική, ανάλυση δεδομένων, πίνακες κανονικής κατανομής)

Για καλύτερη ανάλυση και κατανόηση των εννοιών συνιστώνται: Economic and Business Modelling, Curwin J. & R. Slater, Quantitative Methods for Business Decisions, Cenage Learning, Sixth edition, 2007 Statistics for management and economics, Keller & Warrack, Thomson, 2003. Επίσης μεταφρασμένο στα Ελληνικά, έκδοση Επίκεντρο: Στατιστική για Οικονομικά & Διοίκηση Επιχειρήσεων Καθηγητής Ι. Κ. Δημητρίου 7

Διαφάνειες: είναι γραμμένες έτσι ώστε να αποτελούν εγκόλπιο του μαθήματος έρχονται σε συνδυασμό με τη διάλεξη στα Πληροφοριακά Συστήματα (Διοίκηση και Αποφάσεις) Καθηγητής Ι. Κ. Δημητρίου 11

Οργάνωση διάλεξης Ανάλυση δεδομένων για βελτιωμένη λήψη αποφάσεων Στόχος διάλεξης Περιγραφή μονοδιάστατων δεδομένων (Το Excel είναι εξαιρετικό γι αυτή τη δουλειά) Καθηγητής Ι. Κ. Δημητρίου 13

στη συνέχεια των διαλέξεων Ανάλυση δεδομένων για βελτιωμένη λήψη αποφάσεων Στόχος διάλεξης 1. Περιγραφή μονοδιάστατων δεδομένων 2. Στοιχεία Πιθανοτήτων 3. Δειγματοληψία και κατανομές δειγματοληψίας 4. Η Κανονική Κατανομή N(μ,σ 2 ), Δυωνυμική, Poisson Καθηγητής Ι. Κ. Δημητρίου 14

Συστατικά της επιτυχίας επιχείρησης και ατόμου: Η επίλυση προβλημάτων και Η ταχεία λήψη αποφάσεων Καθηγητής Ι. Κ. Δημητρίου 16

1. Ανάλυση δεδομένων για βελτιωμένη λήψη αποφάσεων Ο μάνατζερ μιας επιχείρησης είναι πολυάσχολος. Ο χρόνος του επιβαρύνεται μεταξύ σημαντικών και επειγόντων έως ασήμαντων και τετριμμένων δραστηριοτήτων. Ο μάνατζερ πρέπει να μάθει να οργανώνει, συνοψίζει και διερμηνεύει τα δεδομένα του γρήγορα και με ακρίβεια. Δηλ. πρέπει να μάθει την τέχνη και την επιστήμη της ανάλυσης δεδομένων. Καθηγητής Ι. Κ. Δημητρίου 17

Η Ανάλυση Δεδομένων προσφέρει συνεκτικό ιστό σε δεδομένα που προέρχονται από μη καλά ορισμένες θεωρίες.

Τύποι προβλημάτων Οι μάνατζερς αντιμετωπίζουν δύο ειδών προβλήματα: Πρώτον, το οικονομικό πρόβλημα, απόσταση μεταξύ του αναμενόμενου και του πραγματικού επίπεδου επίδοσης. Δεύτερον, το διοικητικό πρόβλημα, μεταξύ του παρόντος και ενός υψηλότερου επιθυμητού επιπέδου επίδοσης. Καθηγητής Ι. Κ. Δημητρίου 19

Προβλήματα ισοδύναμα προς ερωτήσεις «πώς να αποκαταστήσομε την επίδοση στο προηγούμενο επίπεδο;» «πώς να βελτιώσομε την επίδοση στο επιθυμητό επίπεδο;» Καθηγητής Ι. Κ. Δημητρίου 20

Οι απαντήσεις απαιτούν νοητικά υποδείγματα Η ανάλυση δεδομένων έχει ουσιαστικό ρόλο στην κατασκευή νοητικών υποδειγμάτων (απλό, ρητό ή οπτικό vs μαθηματικό, σύνθετο). Μεταβολές Έμμεσα η κατασκευή υποδειγμάτων ορίζει δύο σπουδαίες έννοιες της ανάλυσης δεδομένων: τις τυχαίες μεταβολές και τις προσδιοριζόμενες μεταβολές. Καθηγητής Ι. Κ. Δημητρίου 21

Τυχαίες μεταβολές (+) Προσδιοριζόμενες μεταβολές (η τάση των ο) Καθηγητής Ι. Κ. Δημητρίου 22

Τυχαίες μεταβολές ( ) 70.00 60.00 50.00 40.00 30.00 20.00 10.00 0.00 0 10 20 30 40 50 60 10.00 20.00 30.00 Καθηγητής Ι. Κ. Δημητρίου 23

Δεδομένα Οι μεταβολές απεικονίζονται στα δεδομένα μιας επιχείρησης. Τα δεδομένα είναι ιατομεακά (cross-sectional), σε μια χρονοπερίοδο και χρονολογικά (χρονοσειρές) είτε με μία είτε με πολλές μεταβλητές και περιγράφονται με τέσσερεις κλίμακες που υπό σειράν ακριβείας είναι 1. ονοματική (κατηγορικά ή ποιοτικά δεδομένα) [πχ επάγγελμα, κλάδος οικονομίας, φύλο] 2. τακτική (κατηγορικά ή ποιοτικά) [πχ βαθμολογία, τάξη, φτώχεια] 3. διαστηματική (ποσοτικά) [πχ θερμοκρασία, τεστ GMAT, IQ] 4. κλασματική (ποσοτικά) [πχ αξία, όγκος, ταχύτητα, χρόνος] 24

ΔΙΑΤΟΜΕΑΚΑ Καθηγητής Ι. Κ. Δημητρίου 25

ΧΡΟΝΟΛΟΓΙΚΑ Συντελεστής Gini (+) 1947 1996 στις ΗΠΑ 1947 1957 1967 1977 1987 1996 Καθηγητής Ι. Κ. Δημητρίου 26

Πηγές δεδομένων (Από που λαμβάνουν δεδομένα οι μάνατζερ;) 1. Εσωτερικώς από τον ίδιο τον οργανισμό (το MIS /management information system του οργανισμού είναι πηγή δεδομένων) 2. Διά παραγωγής (οι δημοσκοπήσεις /surveys παράγουν δεδομένα για έναν οργανισμό) 3. Με αγορά από εταιρείες που ειδικεύονται στην πώληση δεδομένων (ειδικευμένες βάσεις δεδομένων, πχ ICAP). Καθηγητής Ι. Κ. Δημητρίου 27

Συλλογή δεδομένων από δημοσκοπήσεις Όρισε τον πληθυσμό Προσδιόρισε το πλαίσιο δειγματοληψίας Σχεδιασμός δειγματοληψίας (απλή τυχαία δειγματοληψία, διαστρωματική, κλπ) Μέθοδος δημοσκόπησης (συνέντευξη, τηλέφωνο, ερωτηματολόγιο, email, ιστοσελίδες) Σχεδιασμός δειγματοληψίας Με κάποιον rnd γεννήτορα λαμβάνομε αριθμούς τους οποίους στη συνέχεια αντιστοιχούμε σε τηλεφωνικό κατάλογο, λίστα δανείων σε μια τράπεζα, κοκ. Καθηγητής Ι. Κ. Δημητρίου 28

Ανάλυση δεδομένων \ γεννήτρια τυχαίων αριθμών Ένας μικρός πίνακας τυχαίων αριθμών Καθηγητής Ι. Κ. Δημητρίου 29

Βλπ ebook στο eclass του μαθήματος: Τι είναι Επισκόπηση Εκδ. American Statistical Association (μτφρ Α. Φιλίππου και Γ. Φιλίππου) Καθηγητής Ι. Κ. Δημητρίου 30

Έχοντας τα δεδομένα, οι μάνατζερ αναζητούν τρόπους βελτίωσης του οργανισμού ή της απόδοσής του με ελεγχόμενες μελέτες και ανάλυση των αποτελεσμάτων. Ο μάνατζερ Βελτίωση της λήψης αποφάσεων σχεδιάζει (επανασχεδιάζει) μια διαδικασία, κάνει μια μελέτη και έπειτα συγκρίνει τα αποτελέσματα της μελέτης του με το τρέχον επίπεδο επίδοσης. Η διερεύνηση και η ανάλυση των δεδομένων είναι ισχυρές έννοιες. Καθηγητής Ι. Κ. Δημητρίου 31

Πλεονεκτήματα από την ανάλυση δεδομένων Με την ανάλυση δεδομένων ο μάνατζερ μπορεί να ξεχωρίζει απόψεις από γεγονότα διαγιγνώσκει την αιτιότητα των προβλημάτων (αποφεύγει την τάση να σπεύδει από τα συμπτώματα σε λάθος συμπεράσματα) αναπτύσσει νοητικά υποδείγματα από τα συμβάντα για να εντοπίζει εγκαίρως τα προβλήματα πριν δημιουργήσουν κρίσεις προλαμβάνει υπερβολικές αντιδράσεις σε κοινότοπες μεταβολές Θυμήσου, η κοινή λογική σπάνια αποκαλύπτει, Φύσις κρύπτεσθαι φιλεί (Ηράκλειτος) Καθηγητής Ι. Κ. Δημητρίου 32

Συνοπτικά, η στατιστική ανάλυση είναι ένας τρόπος συλλογιστικής και βελτίωσης της επίλυσης επιχειρησιακών προβλημάτων που μπορεί να αποβεί κρίσιμος στη λήψη καλύτερων αποφάσεων. Καθηγητής Ι. Κ. Δημητρίου 33

Στόχος Διαλέξεων Το αντικείμενο «Ανάλυση Δεδομένων» καλύπτει την περιγραφική και την επαγωγική στατιστική με στόχο την παροχή γνώσεων, την ανάλυση πρακτικών και την ανάπτυξη δεξιοτήτων στους σπουδαστές, ώστε να είναι σε θέση να αναλάβουν εμπειρικές μελέτες ανάλυσης δεδομένων. Καθηγητής Ι. Κ. Δημητρίου 35

Στις Διαλέξεις Θα παρουσιάσομε τρόπους εξαγωγής συνοπτικής πληροφορίας από δεδομένα (περιγραφή συνόλων παρατηρήσεων ή δειγμάτων) (Διάλεξη 1) Θα εξετάσομε πώς το δείγμα σχετίζεται με τον πληθυσμό (γενίκευση) (Διάλεξη 1) Θα χρησιμοποιήσομε τη δειγματική πληροφορία για πληθυσμιακά συμπεράσματα και εκτίμηση των παραμέτρων (Διάλεξη 2) Θα περιγράψομε συναρτησιακές σχέσεις μεταξύ ζευγών παρατηρήσεων (Διάλεξη 3) Θα παρουσιάσομε την πολυδιάστατη ανάλυση και την ανάλυση διακύμανσης (Διάλεξη 4) Συγκεκριμένα Καθηγητής Ι. Κ. Δημητρίου 36

Στην 1η Διάλεξη θα γίνει Επισκόπηση της περιγραφικής στατιστικής με ενοποιημένο τρόπο και ερμηνεία Επίδειξη παραδειγμάτων στο Excel Επίλυση ασκήσεων και θα δοθεί χρήσιμο υλικό. Καθηγητής Ι. Κ. Δημητρίου 38

2. Περιγραφή μονοδιάστατων δεδομένων Σκοπός Πώς να συλλάβεις ενδεχόμενα προβλήματα ή ευκαιρίες οργανώνοντας, συνοψίζοντας και διερμηνεύοντας ένα συγκεκριμένο δείγμα μονοδιάστατων δεδομένων. Ενδιαφερόμαστε για την εξαγωγή συμπερασμάτων που αφορούν μόνον στο συγκεκριμένο δείγμα δεδομένων. Καθηγητής Ι. Κ. Δημητρίου 41

Σενάρια και Σύνολα Δεδομένων Τύπος Δεδομένων Σύνολο Δεδομένων Τυπικές Ερωτήσεις Διατομεακά Δεδομένα για Ποσοτικές Μεταβλητές Διατομεακά Δεδομένα για Ποιοτικές Μεταβλητές Χρονολογικά Δεδομένα για Ποσοτικές Μεταβλητές Παραγωγικότητα και χρόνος μη λειτουργίας για 36 εργαζόμενους σε μία εγκατάσταση Κατάταξη ποιότητας επιχείρησης και τύπος χρηματοοικονομικού οργανισμού Ποιος είναι ο μέσος και το άνοιγμα στην παραγωγικότητα των εργαζόμενων ή τις ώρες αποχής; Πόσες επιχειρήσεις στο δείγμα ήταν εμπορικές τράπεζες; Ποια αναλογία επιχειρήσεων είναι στις δύο υψηλότερες κατηγορίες ποιότητας; Προσωπικές ώρες (%) Τι έχει συμβεί στο ποσοστό εργασίας ανά μήνα σε ωρών εργασίας τα τελευταία μία βιομηχανία επί 4 χρόνια; Υπήρξαν τέσσερα χρόνια προσωπικές ώρες ασύνηθα χαμηλές ή υψηλές και γιατί; Καθηγητής Ι. Κ. Δημητρίου 42

Τρία παραδείγματα (από τα σενάρια) Παραγωγικότητα και χρόνος μη λειτουργίας (μετρώνται από επιχείρηση) Κατάταξη ποιότητας επιχείρησης και τύπος χρηματοοικονομικού οργανισμού Προσωπικές ώρες (%) εργασίας σε 48 μήνες Καθηγητής Ι. Κ. Δημητρίου 45

Παράδειγμα 1 Παραγωγικότητα και χρόνος μη λειτουργίας (μετρώνται από επιχείρηση) Productivity and Downtime Hour Data Worker 1 2 3 4 5 6 7 8 9 10 Productivity 106 95 103 91 94 92 95 93 102 89 Downtime Hrs 6.41 8.12 5.36 3.51 5.05 5.15 6.77 5.45 6.14 7.02 Worker 11 12 13 14 15 16 17 18 19 20 Productivity 95 98 107 100 95 101 97 93 92 123 Downtime Ηrs 5.84 6.42 6.50 7.86 5.56 6.10 4.40 4.42 6.47 4.42 Worker 21 22 23 24 25 26 27 28 29 30 Productivity 92 93 94 92 97 94 94 102 106 93 Downtime Hrs 6.10 5.81 4.71 5.03 5.35 2.34 5.05 4.21 5.00 5.46 Worker 31 32 33 34 35 36 Productivity 114 101 95 91 95 95 Downtime Hrs 5.28 5.71 4.24 6.07 5.34 3.74 Καθηγητής Ι. Κ. Δημητρίου 46

Παράδειγμα 2 Κατάταξη ποιότητας επιχείρησης και τύπος χρηματοοικονομικού οργανισμού Επιχείρηση 1 2 3 4 5 6 7 8 9 10 Τύπος Bank Other Bank Bank Bank Other Other Bank Bank Other Κατάταξη Ποιότ 4 2 5 4 5 1 2 4 5 3 Επιχείρηση 11 12 13 14 15 16 17 18 19 20 Τύπος Other Other Other Bank Bank Bank Other Bank Bank Bank Κατάταξη Ποιότ 1 1 3 4 4 5 2 5 4 3 Επιχείρηση 21 22 23 24 25 26 27 28 29 30 Τύπος Other Other Bank Bank Bank Other Other Other Bank Bank Κατάταξη Ποιότ 2 3 4 4 3 1 1 2 5 5 Επιχείρηση 31 32 33 34 35 36 37 38 39 40 Τύπος Bank Other Bank Other Bank Other Other Bank Bank Bank Κατάταξη Ποιότ 4 2 3 3 1 2 2 3 4 4 Επιχείρηση 41 42 43 44 45 46 47 48 49 50 Τύπος Bank Other Bank Other Other Other Other Bank Bank Bank Κατάταξη Ποιότ 5 3 3 2 1 1 2 3 4 5 47

Παράδειγμα 3 Προσωπικές ώρες (%) εργασίας σε 48 μήνες Μήνες 1 2 3 4 5 6 7 8 9 10 11 12 % 0.5 1.2 0.6 1.5 0.8 1.8 0.5 1.2 2.5 1.3 1.9 3.9 Μήνες 13 14 15 16 17 18 19 20 21 22 23 24 % 1.2 2.0 2.7 1.5 2.8 2.9 2.0 3.5 3.0 3.1 4.0 3.5 Μήνες 25 26 27 28 29 30 31 32 33 34 35 36 % 3.0 3.7 2.5 3.5 2.0 1.5 2.5 1.4 1.0 1.9 1.7 1.5 Μήνες 37 38 39 40 41 42 43 44 45 46 47 48 % 2.5 2.0 1.5 1.7 2.7 2.0 3.0 1.5 2.5 2.5 2.5 2.0 Καθηγητής Ι. Κ. Δημητρίου 48

Οδηγία: Χρησιμοποίησε πίνακες συχνοτήτων και ιστογράμματα για να παρουσιάσεις μεγάλα σύνολα διατομεακών δεδομένων για ποσοτικές μεταβλητές. Καθηγητής Ι. Κ. Δημητρίου 51

Τύπος Δεδομένων Σύνολο Δεδομένων Τυπικές Ερωτήσεις Διατομεακά Δεδομένα για Ποσοτικές Μεταβλητές Παραγωγικότητα και χρόνος μη λειτουργίας για 36 εργαζόμενους σε μία εγκατάσταση Ποιος είναι ο μέσος και το άνοιγμα στην παραγωγικότητα των εργαζόμενων ή τις ώρες αποχής; Productivity and Downtime Hour Data Worker 1 2 3 4 5 6 7 8 9 10 Productivity 106 95 103 91 94 92 95 93 102 89 Downtime Hrs 6.41 8.12 5.36 3.51 5.05 5.15 6.77 5.45 6.14 7.02 Worker 11 12 13 14 15 16 17 18 19 20 Productivity 95 98 107 100 95 101 97 93 92 123 Downtime Ηrs 5.84 6.42 6.50 7.86 4.56 6.10 4.40 4.42 6.47 4.42 25 20 15 10 5 0 21 1 4 5 3 1 0 1 90 95 100 105 110 115 120 125 15 13 10 8 9 Worker 21 22 23 24 25 26 27 28 29 30 Productivity 92 93 94 92 97 94 94 102 106 93 Downtime Hrs 6.10 5.81 4.71 5.03 5.35 2.34 5.05 4.21 5.00 5.46 8 9 10 Worker 31 32 33 34 35 36 Προσέξτε τη 5 Productivity 114 101 95 91 94 95 συνεχή γραμμή 1 2 2 1 Downtime Hrs 5.28 5.71 4.24 6.07 5.34 3.74 0 Καθηγητής Ι. Κ. Δημητρίου 3 4 5 6 7 852 9 5 0 15 1 2 3 4 5 6 7 8 9 13 2 1

Παραγωγικότητα για 36 εργαζόμενους σε μία εγκατάσταση Συχνότητα 25 20 15 10 5 0 21 4 5 3 1 1 0 1 90 95 100 105 110 115 120 125 <90 90 95 95 100 100 105 105 110 110 115 115 120 120 125 Παραγωγικότητα Κλάσεις < 90 90 95 95 100 100 105 105 110 110 115 115 120 120 125 53

Χρόνος μη λειτουργίας για 36 εργαζόμενους σε μία εγκατάσταση 14 12 13 Συχνότητα 10 8 8 9 6 4 2 0 1 2 2 1 3 4 5 6 7 8 9 Ώρες μη λειτουργίας 54

Παράδειγμα Καθηγητής Ι. Κ. Δημητρίου 56

Πίνακας 1: Δεδομένα 48 58 26 49 54 50 38 30 53 45 47 32 47 31 41 49 57 52 26 29 Πίνακας 2: Πίνακας Συχνοτήτων (Ομαδοποιημένος) Κλάσεις Μέτρηση Συχνότητα 20-30 4 Σφάλμα 30-40 3 Προσέγγισης 40-50 8 5 50-60 5 Πίνακας 3 Κλάσεις και συχνότητες Κλάσεις Συχνότητα 25-30 4 30-35 2 35-40 1 40-45 2 45-50 6 50-55 3 55-60 2 σφάλμα προσέγγισης 2,5 Καθηγητής Ι. Κ. Δημητρίου 57

Πίνακας 4 Συχνότητες (ομαδοποιημένος πίνακας) ΚΛΑΣΕΙΣ ΣΥΧΝΟΤΗΤΑ ΣΧΕΤΙΚΗ ΣΥΧΝΟΤΗΤΑ ΕΠΙ ΤΟΙΣ 100 20-30 4 0,20 20% 30-40 3 0,15 15% 40-50 8 0,40 40% 50-60 5 0,25 25% N = 20 ΙΣΤΟΓΡΑΜΜΑ 1 ( Ε ΟΜΕΝΑ ΠΙΝΑΚΑ 1) ΣΥΧΝΟΤΗΤΕΣ 9 8 7 6 5 4 3 2 1 0 20-30 30-40 40-50 50-60 ΚΛΑΣΕΙΣ ΣΥΧΝΟΤΗΤΕΣ Καθηγητής Ι. Κ. Δημητρίου 58 9 8 7 6 5 4 3 2 1 0 4 ΠΟΛΥΓΩΝΟ ΣΥΧΝΟΤΗΤΩΝ ( Ε ΟΜΕΝΑ ΠΙΝΑΚΑ 1) 3 20-30 30-40 40-50 50-60 ΚΛΑΣΕΙΣ 8 5

Πίνακας 5 Συχνότητες (ομαδοποιημένος πίνακας) ΚΛΑΣΕΙΣ ΣΥΧΝΟΤΗΤΑ ΣΧΕΤΙΚΗ ΣΥΧΝΟΤΗΤΑ ΕΠΙ ΤΟΙΣ 100 25-30 4 0,20 20% 30-35 2 0,10 10% 35-40 1 0,05 5% 40-45 2 0,10 10% 45-50 6 0,30 30% 50-55 3 0,15 15% 55-60 2 0,10 10% Καθηγητής Ι. Κ. Δημητρίου 59

Κλάση Συχνότητα Αθροιστική συχνότητα Σχετική αθροιστική συχνότητα Σχετική αθροιστική συχνότητα % 25-30 4 4 0,20 20,00% 30-35 2 6 0,30 30,00% 35-40 1 7 0,35 35,00% 40-45 2 9 0,45 45,00% 45-50 6 15 0,75 75,00% 50-55 3 18 0,90 90,00% Μεγαλύτερο 55 2 20 1,00 100,00% Cumulative: "how much so far συσσωρευτικός Accumulate: "to gather together Καθηγητής Ι. Κ. Δημητρίου 60

Μέτρα θέσης ΜΕΣΟΣ ή μέση τιμή ΔΙΑΜΕΣΟΣ (διατεταγμένα δεδομένα) ΓΕΩΜΕΤΡΙΚΟΣ ΜΕΣΟΣ ΜODE (επικρατούσα τιμή) Καθηγητής Ι. Κ. Δημητρίου 61

Μέτρα διασποράς Επιθυμητές ποιότητες α. μικρό για πυκνές κατανομές, μεγάλο για διεσπαρμένες β. ανεπηρέαστο ακραίων τιμών γ. διατήρηση μονάδων (πχ, $) δ. εύκολο να υπολογισθεί Μέση απόκλιση Διακύμανση Τυπική απόκλιση Τυπική απόκλιση ομαδοποιημένων δεδομένων Εύρος (highest lowest value) Τεταρτημόρια Συντελεστής μεταβλητότητας (ομοιογένεια) Καθηγητής Ι. Κ. Δημητρίου 62

Τύπος Δεδομένων Σύνολο Δεδομένων Τυπικές Ερωτήσεις Διατομεακά Δεδομένα για Ποσοτικές Μεταβλητές Παραγωγικότητα και χρόνος μη λειτουργίας για 36 εργαζόμενους σε μία εγκατάσταση Ποιος είναι ο μέσος και το άνοιγμα στην παραγωγικότητα των εργαζόμενων ή τις ώρες αποχής; Productivity and Downtime Hour Data Worker 1 2 3 4 5 6 7 8 9 10 Productivity 106 95 103 91 94 92 95 93 102 89 Downtime Hrs 6.41 8.12 5.36 3.51 5.05 5.15 6.77 5.45 6.14 7.02 Worker 11 12 13 14 15 16 17 18 19 20 Productivity 95 98 107 100 95 101 97 93 92 123 Downtime Ηrs 5.84 6.42 6.50 7.86 4.56 6.10 4.40 4.42 6.47 4.42 Worker 21 22 23 24 25 26 27 28 29 30 Productivity 92 93 94 92 97 94 94 102 106 93 Downtime Hrs 6.10 5.81 4.71 5.03 5.35 2.34 5.05 4.21 5.00 5.46 25 20 15 10 5 0 1 21 4 5 3 1 0 1 90 95 100 105 110 115 120 125 Μέσος = 5.428 Min = 2.340 Max = 8.120 Range = 5.780 = max min Worker 31 32 33 34 35 36 Productivity 114 101 95 91 94 95 Var = 48.000 St Dev = 1.171 Downtime Hrs 5.28 5.71 4.24 6.07 5.34 3.74 Καθηγητής Ι. Κ. Δημητρίου 63 = SQRT(Var/(36 1))

Λοξότητα δεδομένων (Data skewness) Η μέση τιμή και η τυπική απόκλιση είναι εξαιρετικά μέτρα του κέντρου και του ανοίγματος των δεδομένων όταν είναι σχεδόν συμμετρικά. Λοξό (σχήμα ιστογράμματος) λοξή δεξιά (αριστερή ουρά) Skew < 1 1 < Skew < 1 περίπου συμμετρική Skew > 1 λοξή αριστερά (δεξιά ουρά) Μερικές φορές αυτό είναι παραπλανητικό. Εξετάζομε και άλλα μέτρα συμπεριφοράς Καθηγητής Ι. Κ. Δημητρίου 64

Διάμεσος και Εύρος μεσαίων (Interquartile) Διάμεσος αντί για μέσο Διατεταγμένα δεδομένα Μέσος = 97.44 Διάμεσος = 95 Range = 34 Min = 89 Max = 123 Λοξότητα = 1.88 (θετική λοξότητα) Βλπ επόμενη διαφάνεια για υπολογισμούς Καθηγητής Ι. Κ. Δημητρίου 65

ΠΑΡΑΔΕΙΓΜΑ παραγωγικότητας n=36 Διάμεσος = 95: (n+1)/2 = 18.5 = RankMedian Q1 Q2 Q3 Rank Q1: (1+RankMedian) / 2 = 9.75 Rank Q3: (RankMedian+n) / 2 = 27.25 IQR = εύρος μεσαίου 50% = 101 93, ήτοι καθώς IQR μικραίνει, το 50% των διατεταγμένων δεδομένων συμμαζεύεται το διάγραμμα συχνοτήτων δείχνει μια αιχμή. Το Excel δίνει σχετική συνάρτηση Καθηγητής Ι. Κ. Δημητρίου 66

Median είναι το (6+1)/2 = 3.5 διατεταγμένο δεδομένο, ήτοι = (60+65) / 2 = 62.5 Διατεταγμένα Διάταξη δεδομένα 1 1 2 4 3 60 4 65 5 100 6 300 n=6 Q1: τάξη= (1+3.5)/2=2.25, ήτοι 1/4 μεταξύ 4 και 60: Q1=4+(1/4)(60 4)=18 Q3: τάξη= (3.5+6)/2=4.75, ήτοι 3/4 μεταξύ 65 και 100: Q3= 65+(3/4)(100 65)=91.25 Καθηγητής Ι. Κ. Δημητρίου 67

box and whisker plots (5 αριθμοί) Αν και το Excel δεν τα παρέχει, γίνονται εύκολα με το Quartile: Να βρεις τα x_min, Q1, median, Q3 και x_max 89 93 95 101 123 25% των δεδομένων Λοξά δεξιά δεδομένα Σύγκρινε > Λοξά δεξιά δεδομένα 68

25% των δεδομένων Λοξά δεξιά δεδομένα Σύγκρινε > Λοξά δεξιά δεδομένα Καθηγητής Ι. Κ. Δημητρίου 69

Περιγραφές ιστογραμμάτων, σχήμα Συμμετρικό Ομοιόμορφο Μονοκόρυφο Λοξό (σχήμα ιστογράμματος) λοξή δεξιά (αριστερή ουρά) Skew < 1 1 < Skew < 1 περίπου συμμετρική Skew > 1 λοξή αριστερά (δεξιά ουρά) Κυρτό Kurt < 3 Kurt = 3 Kurt > 3 πλατύκυρτη μεσόκυρτη λεπτόκυρτη) Κωδωνοειδές (ένδειξη: 1<Skew<1 και 1<Kurt<1) Δικόρυφο Έκτοπα Σημεία (από λάθος, έως μεταβολή, έως ευκαιρία. Ως Ε/Σ ορίζεται το δεδομένο όπου 1.5*ΙQR <Q1 ή > του Q3) Καθηγητής Ι. Κ. Δημητρίου 70

Skew > 1 λοξή αριστερά (δεξιά ουρά) Στο Excel Skew < 1 λοξή δεξιά (αριστερή ουρά) Καθηγητής Ι. Κ. Δημητρίου 71