Η «επανάσταση» της Γεωμετρικής Μορφομετρίας Σίνος Γκιώκας Τμήμα Βιολογίας Πανεπιστήμιο Πατρών 2014 1
Η σημασία της μορφολογίας Μορφολογία: βασικό συστατικό του φαινότυπου των οργανισμών Σύγκριση μορφολογίας για: Την ταξινόμηση των οργανισμών Κατανόηση της ποικιλότητας της ζωής στο χώρο και στο χρόνο 2
Η Μορφομετρία Η μορφομετρία είναι η ανάλυση της ποικιλότητας του σχήματος (μορφής) και της συμμεταβολής της με άλλες μεταβλητές (παράγοντες) (Bookstein, 1991; Dryden and Mardia, 1998) Ποσοτική εκτίμηση της μορφολογικής ομοιότητας και διαφοράς των οργανισμών Συσχέτιση με άλλες παραμέτρους 3
Η εξέλιξη της μορφομετρίας Από περιγραφική σε «ποσοτική» επιστήμη Ποσοτικά δεδομένα για μετρήσιμα μορφολογικά χαρακτηριστικά και σύνοψή τους (π.χ. μέσες τιμές, Bumpus, 1898) Ανάπτυξη στατιστικών μεθόδων: correlation coefficient (Pearson, 1895), analysis of variance (Fisher, 1935), principal components analysis (Pearson, 1901; Hotelling, 1933) 4
Η παραδοσιακή (κλασική) μορφομετρία 1960 s & 1970 s Τι μετριέται; Συνήθως γραμμικές αποστάσεις μεταξύ σημείων (π.χ. μήκος, πλάτος, ύψος) Αλλά και: αναλογίες και γωνίες. Στατιστική Ανάλυση των δεδομένων: Πολυμεταβλητές στατιστικές αναλύσεις σε ομάδες μορφολογικών μεταβλητών. Ανάλυση Κύριων Συνιστωσών (Principal Components Analysis, PCA), Παραγοντική Ανάλυση (Factor Analysis, FA), Ανάλυση Κανονικών Μεταβλητών (Canonical Variates Analysis, CVA), Ανάλυση Διάκρισης (Discriminant Analysis, DA). Πλεονέκτημα: απλή 5
Αποστάσεις... 6
Προβλήματα με την παραδοσιακή μορφομετρία Μέγεθος Ομολογία Περιγραφή σχήματος Απεικόνιση 7
Προβλήματα με την παραδοσιακή μορφομετρία Μέγεθος - Το μεγαλύτερο μειονέκτημα: Οι γραμμικές αποστάσεις έχουν άμεση σχέση με τον παράγοντα μέγεθος Προσπάθεια για την ανάπτυξη μεθόδων για τη διόρθωση μεγέθους, έτσι ώστε να μπορούν να εξαχθούν μεταβλητές που να επηρεάζονται μόνο από το σχήμα και όχι από το μέγεθος και να μπορούν να επεξηγηθούν τα σχηματικά πρότυπα. Πολλές μέθοδοι διόρθωσης μεγέθους μικρή συμφωνία διαφορετικά αποτελέσματα 8
Προβλήματα με την παραδοσιακή μορφομετρία Ομολογία: Είναι δύσκολο να εκτιμηθεί η ομολογία των γραμμικών αποστάσεων Πολλές γραμμικές αποστάσεις (όπως το μέγιστο πλάτος) δεν καθορίζονται από ομόλογα σημεία 9
Προβλήματα με την παραδοσιακή μορφομετρία Περιγραφή σχήματος Συχνά οι μετρήσεις που παίρνονται από δύο διαφορετικά σχήματα δίνουν τα ίδια αποτελέσματα, επειδή τα δεδομένα δεν περιέχουν την ακριβή θέση από την οποία λήφθηκαν οι μετρήσεις. Δύο διαφορετικά σε σχήμα δείγματα εμφανίζονται ως ίδια επειδή έχουν ίδιο μέγιστο μήκος και πλάτος Π.χ.: αν το μέγιστο μήκος και το μέγιστο πλάτος έπρεπε να μετρηθούν σε ένα οβάλ σχήμα και ένα δάκρυ, τα δύο αυτά αντικείμενα θα μπορούσαν να έχουν ίδια μέγιστα, παρόλα αυτά όμως είναι εμφανώς διαφορετικά από πλευράς σχήματος Επομένως, η στατιστική ισχύς για τη διάκριση των σχημάτων είναι πολύ χαμηλότερη από ό, τι θα έπρεπε να είναι 10
Προβλήματα με την παραδοσιακή μορφομετρία Απεικόνιση: Δεν είναι δυνατόν να δημιουργήσει κανείς τη γραφική αναπαράσταση του σχήματος από τις μετρήσεις που έχουν ληφθεί, δηλαδή απλά και μόνο από τις γραμμικές αποστάσεις Γιατί; Διότι οι γεωμετρικές σχέσεις μεταξύ των μεταβλητών δεν διατηρούνταν (ένα σύνολο από γραμμικές αποστάσεις είναι συνήθως ανεπαρκές για να συλλάβει την γεωμετρία του αρχικού αντικειμένου). Έτσι, ορισμένες πτυχές του σχήματος χάνονται 11
Η «επανάσταση» της Γεωμετρικής Μορφομετρίας Αναζήτηση εναλλακτικών μεθόδων ποσοτικοποίησης και ανάλυσης της μορφολογίας του σχήματος. Νέου τύπου δεδομένα: δεδομένα που θα περιείχαν τη γεωμετρία της μορφολογικής δομής Νέες μέθοδοι για την ανάλυση τέτοιων δεδομένων Οι μέθοδοι αυτές έχουν τη δυνατότητα να αναλύσουν δεδομένα τοπόσημων (landmarks) αλλά και δεδομένα που αφορούν το περίγραμμα (outline) μιας δομής. Aυστηρή στατιστική θεωρία για την ανάλυση σχήματος που καθιστούσε δυνατή τη συνδυασμένη χρήση πολυμεταβλητών στατιστικών μεθόδων και μεθόδων για την άμεση οπτικοποίηση μιας βιολογικής μορφής 12
Τοπόσημα 13
Και άλλα τοπόσημα... 14
Περιγράμματα, ημιτοπόσημα & κυλιόμενα τοπόσημα... 15
Τρισδιάστατες επιφάνειες... 16
Μέθοδοι περιγράμματος (outline methods) Οι πρώτες μέθοδοι Γεωμετρικής Μορφομετρίας Ψηφιοποίηση σημείων κατά μήκος ενός περιγράμματος Συνταίριασμα των σημείων μέσω μαθηματικής εξίσωσης (Fourier analysis) Σύγκριση καμπυλών χρησιμοποιώντας τους συντελεστές της εξίσωσης ως παραμέτρους σχήματος σε πολυμεταβλητές αναλύσεις Τα σημεία στον πολυμεταβλητό χώρο των παραμέτρων μπορεί να μετασχηματιστούν ξανά στο φυσικό χώρο του οργανισμού και να απεικονιστούν ως περιγράμματα Διάφορες μέθοδοι παραγωγής περιγραμμάτων Πρόβλημα: οι στατιστικές αναλύσεις έδιναν διαφορετικά αποτελέσματα ανάλογα με τη μέθοδο 17
Μέθοδοι τοπόσημων (landmark methods) Ξεκινούν με τη συλλογή 2- ή 3- διάστατων συντεταγμένων βιολογικά καθορισμένων τοπόσημων ΩΣΤΟΣΟ: Η άμεση ανάλυση αυτών των συντεταγμένων είναι ακατάλληλη Η επίδραση της ποικιλότητας στη θέση, στον προσανατολισμό και στην κλίμακα των δειγμάτων παραμένει Επομένως: πρέπει να «αφαιρεθεί» η ποικιλότητα «μησχήματος» Αφού περιοριστεί η ποικιλότητα «μη-σχήματος» οι μεταβλητές γίνονται μεταβλητές σχήματος και μπορούν να χρησιμοποιηθούν για τη στατιστική σύγκριση δειγμάτων και τη γραφική αναπαράσταση του σχήματος 18
Μέθοδοι τοπόσημων (landmark methods) Μέθοδοι υπέρθεσης: εξουδετερώνουν τη μη οφειλόμενη στο σχήμα μεταβολή Υπερθέτουν μεταξύ τους τα τοπόσημα σύμφωνα με κάποια κριτήρια βελτιστοποίησης Κύριες μέθοδοι: Γενικευμένη Ανάλυση Προκρούστη (Generalized Procrustes Analysis, GPA), Μέθοδος Thin-Plate Spline (TPS) Και άλλες εναλλακτικές: Euclidean Distance Matrix Analysis (EDMA), Finite Element Scaling Analysis (FESA) 19
Μέθοδοι τοπόσημων (landmark methods) 20
Μέθοδοι τοπόσημων (landmark methods) Μετά την υπέρθεση: Οι διαφορές στο σχήμα μπορούν να περιγραφούν από τις διαφορές των συντεταγμένων στα αντίστοιχα τοπόσημα μεταξύ των αντικειμένων που μελετάμε (π.χ. των ατόμων ή των δομών) Αυτές οι διαφορές μπορούν να χρησιμοποιηθούν ως δεδομένα σε πολυπαραγοντικές αναλύσεις της ποικιλότητας του σχήματος 21
Η «ωρίμανση» της Γεωμετρικής Μορφομετρίας Αλλαγή στον τρόπο που γίνονται οι μορφολογικές αναλύσεις Βελτίωση της κατανόησης των μεθόδων Αύξηση της χρήσης της Γεωμετρικής Μορφομετρίας για τη διερεύνηση υποθέσεων 22
Η «ωρίμανση» της Γεωμετρικής Μορφομετρίας 23
Η «ωρίμανση» της Γεωμετρικής Μορφομετρίας Σημαντικές πρόοδοι στη θεωρία Σαφέστερα κριτήρια επιλογής της πιο κατάλληλης μεθόδου ανάλυσης των τοπόσημων Νέες μέθοδοι π.χ. sliding semi-landmarks (κυλιόμενα ημιτοπόσημα) που επιτρέπουν το συνδυασμό δεδομένων από περιγράμματα και τοπόσημα στην ίδια ανάλυση, και παρέχουν πιο πλούσια περιγραφή του σχήματος Νέα βιολογικά ερωτήματα & νέες εφαρμογές 24
Ανάλυση των δεδομένων τοπόσημων Σήμερα, σχεδόν όλες οι αναλύσεις που βασίζονται σε τοπόσημα αναλύουν το σχήμα με μεθόδους που βασίζονται στο Χώρο του Σχήματος Kendall (Kendall s shape space), υπολογίζοντας την Απόσταση Προκρούστη (ή προσεγγίσεις του εφαπτόμενού τους χώρου). Γιατί; Έχουν τη μεγαλύτερη στατιστική ισχύ Το μικρότερο σφάλμα του μέσου τετραγώνου Λιγότερους περιορισμούς στα πρότυπα ποικιλότητας που μπορούν να εντοπιστούν 25
Ανάλυση των δεδομένων τοπόσημων Κεντροειδές: το κέντρο του σχήματος Κεντροειδές Μέγεθος: η τετραγωνική ρίζα του αθροίσματος των τετραγώνων των διαφορών των αποστάσεων κάθε τοπόσημου από το κεντροειδές Απόσταση Προκρούστη: η ελάχιστη τετραγωνική ρίζα του αθροίσματος των τετραγώνων των διαφορών των αποστάσεων μεταξύ των θέσεων των ομόλογων τοποσήμων, σε δύο σύνολα τοποσήμων (σε δείγματα) που έχουν τη βέλτιστη ταύτιση μεταξύ τους με βάση το κεντροειδές τους μέγεθος (Bookstein, 1997) Η Απόσταση Προκρούστη βασίζεται στην ιδέα της επικάλυψης των εικόνων δύο ή περισσότερων δειγμάτων, με τέτοιο τρόπο ώστε τα ομόλογα τοπόσημα να ταιριάξουν όσο το δυνατόν περισσότερο (Rohlf & Marcus, 1993) 26
Τα στάδια της Μεθόδου Απόστασης Προκρούστη (Β) Αρχικά τα σχήματα διαμορφώνονται με τέτοιο τρόπο ώστε να μοιράζονται το ίδιο κεντροειδές. (Γ) Στη συνέχεια διαμορφώνονται ώστε να έχουν το ίδιο μέγεθος κεντροειδούς (centroid size) (Δ) Tέλος, το ένα από αυτά περιστρέφεται γύρω από το κεντροειδές του, ώστε να ελαχιστοποιηθεί η απόσταση μεταξύ των ομόλογων τοποσήμων Οι τελικές συντεταγμένες των οροσήμων που προκύπτουν με αυτή τη μέθοδο ονομάζονται Προκρούστειες Συντεταγμένες Σχήματος (Procrustes Shape Coordinates) 27
Τα 4 βήματα του πρωτοκόλλου της Γεωμετρικής Μορφομετρίας A: Ποσοτικοποίηση των πρώτων δεδομένων (τοπόσημα καταγράφονται στο σώμα των ψαριών) Β: Απομάκρυνση της διακύμανσης που δεν οφείλεται στο σχήμα (ορόσημα από 412 δείγματα πριν και μετά την GPA) C: Στατιστική ανάλυση (CVA) και γραφική παρουσίαση των αποτελεσμάτων Πλέγματα παραμόρφωσης δειγμάτων για τα είδη Eretmodus cyanostictus (δεξιά) και Spathodus erythrodon (αριστερά) 28
Το μέλλον... Τρισδιάστατα δεδομένα Δεν υπάρχει εγγενής περιορισμός των μορφομετρικών μεθόδων στην ανάλυση τρισδιάστατων δεδομένων Πρακτικό πρόβλημα: η απόκτηση δεδομένων. Οι τρισδιάστατοι ψηφιοποιητές εξακολουθούν να είναι πολύ ακριβοί Δυσκολία δημοσίευσης Οι επιστημονικές εργασίες εξακολουθούν να γράφονται σε κομμάτια χαρτιού δύο διαστάσεων. Μπορούμε να εκτιμήσουμε αλλά όχι να κατανοήσουμε πλήρως τις διαφορές που εμφανίζονται στον όγκο Στο μέλλον: διαδραστικά γραφικά σε ηλεκτρονικά περιοδικά 29
Μειονεκτήματα της Γεωμετρικής Μορφομετρίας Το μέγεθος απουσιάζει Ωστόσο το μέγεθος έχει συχνά βιολογική σημασία 30
Μειονεκτήματα της Γεωμετρικής Μορφομετρίας Μέγεθος & σχήμα δίνουν διαφορετικές πληροφορίες 31
Μειονεκτήματα της Γεωμετρικής Μορφομετρίας Μόνο διακριτές δομές μπορούν να απεικονιστούν και να αναλυθούν με τη Γεωμετρική Μορφομετρία 32
Τα βήματα πάλι... Σχεδιασμός της μελέτης Συλλογή δεδομένων Στάθμιση των δεδομένων Ανάλυση Ερμηνεία των αποτελεσμάτων 33
Πώς επιλέγουμε τοπόσημα (περιγράμματα ή επιφάνειες); Τα δεδομένα πρέπει να σχετίζονται με κάποια υπόθεση Τα δεδομένα πρέπει να περιγράφουν ικανοποιητικά το σχήμα Τα τοπόσημα πρέπει να υπάρχουν σε όλα τα δείγματα 34
Σφάλμα μετρήσεων και μέγεθος δείγματος Το σφάλμα μέτρησης υπάρχει σε όλες τις μετρήσεις Δεν έχει μεγάλη σημασία εάν είναι ουσιαστικά μικρότερο από τις διαφορές που θέλουμε να μετρήσουμε Το μέγεθος του δείγματος που απαιτείται εξαρτάται από την ποικιλότητα εντός των ομάδων σε σχέση με την ποικιλότητα μεταξύ των ομάδων 35
Πόσα δείγματα (άτομα) χρειαζόμαστε; Εξαρτάται από το ερώτημα Εξαρτάται από το σφάλμα στα δεδομένα 36
Τι δεν μας λέει η μορφομετρία Το τι σημαίνουν το «μεγάλο», η «διαφορά» ή το σχήμα Αυτό το καθορίζουμε εμείς Εάν έχουμε 2 (ή περισσότερες) ομάδες σε ένα δείγμα Μπορεί να βοηθήσει η σύγκριση με άλλες ήδη γνωστές ομάδες 37
Ένα παράδειγμα Giokas S, Páll-Gergely B, Mettouris O 2014. Nonrandom variation of morphological traits across environmental gradients in a land snail. Evolutionary Ecology 28: 323-340 38
Ένα παράδειγμα 39
Ένα παράδειγμα 40
Και ένα άλλο παράδειγμα... Wiley et al 2005. Evolutionary Morphing, in: Proceedings of IEEE Visualization 41
Λογισμικό Ψηφιοποίηση τοποσήμων και περιγραμμάτων: tpsdig, ImageJ Υπέρθεση: MorphoJ, Morpheus Ανάλυση περιγραμμάτων: Eigenshape, PAST MANOVA: MorphoJ, PAST Discriminant functions, CVA: MorphoJ, PAST Principal components analysis of landmarks: tpsrelw, PΑST, MorphoJ Κατασκευή δέντρων: PHYLIP, PAUP, NTSYSpc, PAST Simulations: Mathematica, R http://life.bio.sunysb.edu/morph/ 42
Εξοπλισμός 43
Βιβλία & άλλα Hammer, Ø. and D.A.T. Harper. 2006. Palaeontological Data Analysis. Blackwell Publishing, Oxford, United Kingdom. Zelditch, M.L., D.L. Swiderski, H.D. Sheets, and W.L. Fink. 2004. Geometric Morphometrics for Biologists: a Primer. Elsevier Academic Press, San Diego, California. MacLeod, N. 2012. Palaeo Math 101. A series of essays published in the Palaeontological Association Newsletter. http://www.palass.org/modules.php? name=palaeo_math 44