Περί γραφημάτων Ι Ηλίας Νοσοκομείο Ε Βενιζέλου, Αθήνα
Παραπλανητικά γραφήματα =διαστρεβλωμένα γραφήματα Παραποίηση στοιχείων κατάχρηση των στατιστικών στοιχείων αποτέλεσμα = λανθασμένο συμπέρασμα
Παραπλανητικά γραφήματα Ένα γράφημα μπορεί να είναι παραπλανητικό μέσω υπερβολικά περίπλοκης ή πλημμελούς κατασκευής
Παραπλανητικά γραφήματα Ακόμα και καλά κατασκευασμένα και ακριβή γραφήματα μπορούν να υπόκεινται σε διαφορετική ερμηνεία
Παραπλανητικά γραφήματα Παραπλανητικά γραφήματα μπορεί να δημιουργηθούν σκόπιμα για να εμποδίσουν την ορθή ερμηνεία των δδ δεδομένων
Παραπλανητικά γραφήματα Μπορεί επίσης να δημιουργηθούν κατά λάθος από τους χρήστες για διάφορους λόγους: μη εξοικείωση με το λογισμικό γραφικών παραστάσεων παρερμηνεία δεδομένων αδυναμία μεταφοράς των δεδομένων με ακρίβεια
Παραπλανητικές μέθοδοι
Υπερβολική χρήση γραφημάτων Η χρήση των γραφημάτων, εφόσον δεν απαιτούνται μπορεί να οδηγήσει σε άσκοπη σύγχυση / ερμηνεία Σε γενικές γραμμές, όσο περισσότερο εξήγηση χρειάζεται ένα γράφημα, το λιγότερο το ίδιο το γράφημα είναι απαραίτητο Οι γραφικές παραστάσεις δεν μεταφέρουν πάντα πληροφορίες καλύτερα από τους πίνακες
Μεροληπτική επισήμανση Μεροληπτική χρήση λέξεων ή η φόρτωση με λέξεις στον τίτλο του γραφήματος, τις ετικέτες του άξονα ή τη λεζάντα
Γράφημα πίτας
Γράφημα πίτας Σύγκριση διαγραμμάτων πίτας διαφόρων μεγεθών θα μπορούσε να είναι παραπλανητική δεδομένου δ ότι οι άνθρωποι δεν μπορούν να διαβάσουν με ακρίβεια τη συγκριτική περιοχή των κύκλων
Γράφημα πίτας Η χρήση λεπτών τομέων που είναι δύσκολο να διακρίνει κανείς μπορεί να είναι δύσκολο να ερμηνευθεί Η χρήση των ποσοστών ως ετικέτες σε ένα γράφημα πίτας μπορεί να είναι παραπλανητική, όταν το μέγεθος του δείγματος είναι μικρό
Γράφημα πίτας 3D γράφημα πίτας ή προσθήκη κλίσης δυσχεραίνει την ερμηνεία λόγω στρεβλής επίδρασης της προοπτικής Η τρίτη διάσταση δεν βελτιώνει την ανάγνωση των δεδομένων. 3D γράφημα πίτας = οι φέτες που είναι πιο κοντά στον αναγνώστη φαίνεται να είναι μεγαλύτερες από εκείνες πιο πίσω λόγω της γωνίας στην οποία παρουσιάζονται.
Κλίμακα
Κλίμακα 1 3 1 3 1 9!
Κλίμακα 1 4 9!
Περικομμένο γράφημα Με άξονα y που δεν ξεκινά από το 0. Αυτά τα γραφήματα μπορούν να δημιουργήσουν την εντύπωση σημαντικής μεταβολής, όπου υπάρχει σχετικά μικρή αλλαγή.
Κολοβωμένα γραφήματα είναι χρήσιμα για την αποτύπωση μικρών διαφορών
Απουσία κλίμακας Παραπλανητικό ραβδόγραμμα χωρίς κλίμακα Χωρίς κλίμακα, η οπτική διαφορά μεταξύ των ράβδων μπορεί να = εύκολα διαχειρήσιμη!
Απουσία κλίμακας (x)
Μεροληψία στον άξονα x
Η χρήση μιας περιττής τρίτης διάστασης η οποία δεν περιέχει πληροφορίες δεν συνιστάται διότι μπορεί να μπερδέψει το κοινό
Παράδειγμα από ιατρικό περιοδικό #1
K Roeder (1994) DNA fingerprinting: A review of the controversy (with discussion). Statistical ti ti Science 9(2):222-278278
Καμπύλες που απεικονίζονται ως κορδέλες Η τρισδιάστατη απόδοση των καμπυλών είναι εντελώς άχρηστη! Αν το χρώμα δεν επιτρέπεται, τότε 4 διαφορετικοί τύποι γραμμών (στερεά, διακεκομμένη, διάστικτη, διακεκομμένη) θα μπορούσε = ΟΚ
Γραφήματα με υπερβολική πολυπλοκότητα μπορεί να θολώνουν τα δεδομένα και να δυσχεραίνουν χρ την ερμηνεία.
Απλοποίηση!
Μέτρηση της παραμόρφωσης
Μέτρηση της παραμόρφωσης Αρκετές μέθοδοι έχουν αναπτυχθεί για να διαπιστωθεί αν τα γραφήματα έχουν διαστρεβλωθεί και να ποσοτικοποιηθεί ο ο αυτή η στρέβλωση
Παράγοντας ψεύδους
Παράγοντας ψεύδους Ένα γράφημα με υψηλό συντελεστή ψεύδους (> 1) επιδείνωνε την αλλαγή των δεδομένων που αντιπροσωπεύει, ενώ το ένα με ένα μικρό παράγοντα ψεύδους (> 0, <1) θα επισκίαζε την αλλαγή στα δεδομένα Το τέλεια ακριβές ρβ ςγρ γράφημα παρουσιάζει παράγοντα ψεύδους 1,0.
Lie factor = 2,8!
Λόγος Δεδομένων/ μελάνι
Λόγος Δεδομένων/ μελάνι Η αναλογία των δεδομένων/μελάνι πρέπει να είναι σχετικά υψηλή, αλλιώς το διάγραμμα μπορεί να έχει περιττά γραφικά
Παράδειγμα από ιατρικό περιοδικό #2
Hummer BT, Li XL, Hassel BA (2001) Role for p53 in gene induction by double- stranded RNA. J Virol 75:7774-7777
Οι ράβδοι και οι μικρές κεραίες αντιπροσωπεύουν μόλις τρία σημεία η καθεμιά Με μόλις τρείς τιμές δεδομένων σε κάθε ομάδα, γιατί δεν δείχνουν μόνο τα δεδομένα ως κουκίδες; Θα μπορούσε επίσης να περιληφθούν MO & CI... όλα αυτά στον ίδιο χώρο και με λιγότερο μελάνι.
Παράδειγμα από ιατρικό περιοδικό #3
Cotter DJ, et al. (2004) Hematocrit was not validated as a surrogate endpoint for survival amoung epoetin-treated treated hemodialysis patients. Journal of Clinical Epidemiology 57 :1086-10951095
Η προοπτική καθιστά δύσκολο να συγκριθούν τα ύψη των κυλίνδρων, όπως οι κάθετες αλλαγές κλίμακας από εμπρός προς τα πίσω. Όλα αυτά καταλαμβάνουν πολύ χώρο (μελάνι) για να μεταφέρουν πολύ λίγες πληροφορίες. Τι πρέπει να γίνει; Θα μπορούσε κανείς να προσπαθήσει τέσσερις επάλληλες σειρές.
Αναντιστοιχία μεγεθών (& προοπτική!)
Πυκνότητα των δεδομένων
Πυκνότητα των δεδομένων Η πυκνότητα των δεδομένων θα πρέπει να είναι σχετικά υψηλή, αλλιώς ένας πίνακας μπορεί να είναι καταλληλότερος για την εμφάνιση των δεδομένων
Edward Tufte = εξέχων Αμερικανός στατιστικολόγος = ο guru των γραφημάτων
Edward Tufte Πίνακες = να προτιμώνται από τα διαγράμματα στην απόδοση των ποσοτικών πληροφοριών
Παράδειγμα από ιατρικό περιοδικό #4
Paik MC (2004) Nonignorable missingness in matched case-control control data analyses.biom etrics 60:306-314
Υπάρχουν πάρα πολλά ψηφία Λείπουν μηδενικά! Αν ο αριθμός 0.02229 = ουσιαστικός τότε θα πρέπει να αποδοθεί το 0.021 021 ως 0.02100. 02100 Τι πρέπει να γίνει; Πρέπει πάντα να αναφέρονται τα τυπικά σφάλματα (SE) και όχι η διακύμανση (variance) Μην αποκλείετε μηδενικά, όταν έχουν νόημα.
Τελικά
Βασική αρχή του σχεδιασμού πληροφορίας 11 + 1 = 3 ή και περισσότερο ρ 22 γραμμές ή 3?
Μοτίβο μουαρέ (ψάθα)
Δυσδιάκριτες γραμμές!
Αισθητική To Powerpoint διαθέτει πατρόν (templates) αμφίβολης αισθητικής