Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής Ιωάννης Δράκος Μηχανικός Η\Υ & Πληροφορικής
|
|
- Ίησους Ζέρβας
- 8 χρόνια πριν
- Προβολές:
Transcript
1 ΠΑΤΡΑ 2009 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΕΙΔΙΚΟ ΑΙΜΑΤΟΛΟΓΙΚΟ ΕΡΓΑΣΤΗΡΙΟ ΚΑΘΗΓΗΤΗΣ: ΝΙΚΟΛΑΟΣ ΖΟΥΜΠΟΣ ΕΡΓΑΣΤΗΡΙΟ ΙΑΤΡΙΚΗΣ ΦΥΣΙΚΗΣ ΚΑΘΗΓΗΤΗΣ: ΓΕΩΡΓΙΟΣ ΝΙΚΗΦΟΡΙΔΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΙΣ "ΚΛΙΝΙΚΕΣ ΚΑΙ ΚΛΙΝΙΚΟΕΡΓΑΣΤΗΡΙΑΚΕΣ ΙΑΤΡΙΚΕΣ ΕΙΔΙΚΟΤΗΤΕΣ" ΔΙΑΓΝΩΣΗ, ΠΡΟΓΝΩΣΗ ΚΑΙ ΥΠΟΣΤΗΡΙΞΗ ΘΕΡΑΠΕΥΤΙΚΗΣ ΑΓΩΓΗΣ ΚΑΚΟΗΘΩΝ ΛΕΜΦΩΜΑΤΩΝ ΜΕ ΧΡΗΣΗ ΤΕΧΝΗΤΗΣ ΝΟΗΜΟΣΥΝΗΣ ΙΩΑΝΝΗΣ Μ. ΔΡΑΚΟΣ ΜΗΧΑΝΙΚΟΣ Η\Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ
2 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 2
3 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΤΡΙΜΕΛΗΣ ΣΥΜΒΟΥΛΕΥΤΙΚΗ ΕΠΙΤΡΟΠΗ ΝΙΚΟΛΑΟΣ ΖΟΥΜΠΟΣ, ΚΑΘΗΓΗΤΗΣ 1 ΓΕΩΡΓΙΟΣ ΝΙΚΗΦΟΡΙΔΗΣ, ΚΑΘΗΓΗΤΗΣ 1 ΣΠΥΡΙΔΩΝ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ 2 (ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ) (ΜΕΛΟΣ ΤΡΙΜΕΛΟΥΣ ΕΠΙΤΡΟΠΗΣ) (ΜΕΛΟΣ ΤΡΙΜΕΛΟΥΣ ΕΠΙΤΡΟΠΗΣ) ΕΠΤΑΜΕΛΗΣ ΕΞΕΤΑΣΤΙΚΗ ΕΠΙΤΡΟΠΗ ΝΙΚΟΛΑΟΣ ΖΟΥΜΠΟΣ, ΚΑΘΗΓΗΤΗΣ 1 (ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ) ΓΕΩΡΓΙΟΣ ΝΙΚΗΦΟΡΙΔΗΣ, ΚΑΘΗΓΗΤΗΣ 1 (ΜΕΛΟΣ ΤΡΙΜΕΛΟΥΣ ΕΠΙΤΡΟΠΗΣ) ΣΠΥΡΙΔΩΝ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ 2 (ΜΕΛΟΣ ΤΡΙΜΕΛΟΥΣ ΕΠΙΤΡΟΠΗΣ) ΜΕΓΑΛΟΟΙΚΟΝΟΜΟΥ ΒΑΣΙΛΕΙΟΣ, ΑΝΑΠΛΗΡΩΤΗΣ ΚΑΘΗΓΗΤΗΣ 2 (ΜΕΛΟΣ ΕΠΤΑΜΕΛΟΥΣ ΕΞΕΤΑΣΤΙΚΗΣ ΕΠΙΤΡΟΠΗΣ) ΚΑΡΑΚΑΝΤΖΑ ΜΑΡΙΝΑ, ΕΠΙΚΟΥΡΗ ΚΑΘΗΓΗΤΡΙΑ 1 (ΜΕΛΟΣ ΕΠΤΑΜΕΛΟΥΣ ΕΞΕΤΑΣΤΙΚΗΣ ΕΠΙΤΡΟΠΗΣ) ΣΑΚΕΛΛΑΡΟΠΟΥΛΟΣ ΓΕΩΡΓΙΟΣ, ΕΠΙΚΟΥΡΟΣ ΚΑΘΗΓΗΤΗΣ 1 (ΜΕΛΟΣ ΕΠΤΑΜΕΛΟΥΣ ΕΞΕΤΑΣΤΙΚΗΣ ΕΠΙΤΡΟΠΗΣ) ΣΥΜΕΩΝΙΔΗΣ ΑΝΑΡΓΥΡΟΣ, ΕΠΙΚΟΥΡΟΣ ΚΑΘΗΓΗΤΗΣ 1 (ΜΕΛΟΣ ΕΠΤΑΜΕΛΟΥΣ ΕΞΕΤΑΣΤΙΚΗΣ ΕΠΙΤΡΟΠΗΣ) 1 : ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ 2 : ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ 3 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
4 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 4
5 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Η παρούσα εργασία είναι αφιερωμένη στον Καθηγητή Νικόλαο Αρτεμιάδη και τη γυναίκα του Ζαφειρία (Πυρλίδου) Αρτεμιάδου. 5 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
6 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 6
7 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΗ ΓΕΝΙΚΟ ΜΕΡΟΣ Β-ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ ΕΙΣΑΓΩΓΗ... ERROR! BOOKMARK NOT DEFINED. ΠΑΘΟΓΕΝΕΙΑ... ERROR! BOOKMARK NOT DEFINED. ΚΛΙΝΙΚΗ ΕΙΚΟΝΑ... ERROR! BOOKMARK NOT DEFINED. ΕΡΓΑΣΤΗΡΙΑΚΑ ΕΥΡΗΜΑΤΑ... ERROR! BOOKMARK NOT DEFINED. ΔΙΑΓΝΩΣΗ ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΔΙΑΓΝΩΣΗERROR! BOOKMARK NOT DEFINED. ΣΤΑΔΙΟΠΟΙΗΣΗ... ERROR! BOOKMARK NOT DEFINED. ΠΡΟΓΝΩΣΗ... ERROR! BOOKMARK NOT DEFINED. ΘΕΡΑΠΕΙΑ... ERROR! BOOKMARK NOT DEFINED. ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ ΕΙΣΑΓΩΓΗ Ο ΚΥΤΤΑΡΟΜΕΤΡΗΤΗΣ ΡΟΗΣ ΤΟ ΟΠΤΙΚΟ ΣΥΣΤΗΜΑ ΤΟ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ ΠΑΡΑΓΩΓΗ ΣΚΕΔΑΣΗΣ ΦΩΤΟΣ ΚΑΙ ΦΘΟΡΙΣΜΟΥ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΕΙΣΑΓΩΓΗ ΙΣΤΟΡΙΑ ΤΑ ΔΙΑΘΕΣΙΜΑ ΜΟΝΤΕΛΑ ΔΕΔΟΜΕΝΩΝ ΤΟ ΔΙΚΤΥΑΚΟ ΜΟΝΤΕΛΟ ΤΟ ΣΧΕΣΙΑΚΟ ΜΟΝΤΕΛΟ ΤΟ ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΑΦΕΣ ΜΟΝΤΕΛΟ Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
8 Η ΜΗΧΑΝΙΚΗ ΤΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΑΠΟΘΗΚΕΥΤΙΚΟΙ ΧΩΡΟΙ ΚΑΙ ΦΥΣΙΚΗ ΔΟΜΗ ΔΕΙΚΤΟΔΟΤΗΣΗ (INDEXING) ΣΥΝΑΛΛΑΓΕΣ & ΠΑΡΑΛΛΗΛΙΣΜΟΣ (TRANSACTIONS & CONCURRENCY) ΠΑΡΑΔΕΙΓΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΤΕΧΝΙΚΕΣ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΕΙΣΑΓΩΓΗ ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ ΑΛΓΟΡΙΘΜΟΙ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΕΠΙΛΟΓΗ ΓΝΩΡΙΣΜΑΤΩΝ ΚΑΙ ΑΠΟΤΙΜΗΣΗ BAYESIAN ΠΡΟΣΕΓΓΙΣΕΙΣ ΓΙΑ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ ΕΙΔΙΚΟ ΜΕΡΟΣ ΥΛΙΚΟ ΣΥΝΟΠΤΙΚΗ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΓΝΩΡΙΣΜΑΤΩΝ ΚΥΤΤΑΡΟΜΕΤΡΙΑΣ ΡΟΗΣ ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝΤΑΙ ΣΤΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ΤΑ ΚΛΙΝΙΚΑ ΚΑΙ ΕΡΓΑΣΤΗΡΙΑΚΑ ΑΙΜΑΤΟΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ ΜΕΘΟΔΟΣ ΤΟ FLOW CYTOMETRY STANDARD (FCS) ΛΕΙΤΟΥΡΓΙΚΟΣ ΣΥΝΔΥΑΣΜΟΣ ΔΕΔΟΜΕΝΩΝ ΚΥΤΤΑΡΟΜΕΤΡΙΑΣ ΡΟΗΣ (INTRA DOMAIN INTEGRATION) ΛΕΙΤΟΥΡΓΙΚΟΣ ΣΥΝΔΥΑΣΜΟΣ ΜΕ ΚΛΙΝΙΚΟΕΡΓΑΣΤΗΡΙΑΚΑ ΑΙΜΑΤΟΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ (INTER DOMAIN INTEGRATION) ΑΠΟΤΕΛΕΣΜΑΤΑ ΤΟ ΠΡΟΤΕΙΝΟΜΕΝΟ ΣΧΗΜΑ ΤΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ ΠΡΟ-ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ ΠΟΣΟΤΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΤΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΤΟΥ ΛΕΙΤΟΥΡΓΙΚΟΥ ΣΥΝΔΥΑΣΜΟΥ Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 8
9 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΣΥΖΗΤΗΣΗ ΣΥΜΠΕΡΑΣΜΑΤΑ ΒΙΒΛΙΟΓΡΑΦΙΑ Β-ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΤΕΧΝΙΚΕΣ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΛΕΙΤΟΥΡΓΙΚΟΣ ΣΥΝΔΥΑΣΜΟΣ ΒΙΟ-ΙΑΤΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
10 ΕΙΣΑΓΩΓΗ Ο Λειτουργικός Συνδυασμός (integration) των βιοϊατρικών πληροφοριών αποτελεί πλέον μία ουσιώδη εργασία και επιδίωξη για τους επαγγελματίες ερευνητές των ιατρικών επιστημών. Οι επιστήμονες των ιατρικών επιστημών κατανοούν πλέον την ανάγκη διαφύλαξης του συνόλου των πληροφοριών που αφορούν μία συγκεκριμένη ιατρική οντότητα και δεν είναι λίγες οι περιπτώσεις σχετικών επιτυχών προσπαθειών [Int1]. Τα συμβατικά μοντέλα που χρησιμοποιούνται σήμερα για τη δημιουργία ιατρικών βάσεων δεδομένων και καθορίζονται σύμφωνα με συγκεκριμένα, μη ψηφιακά, πρότυπα διαχείρισης ιατρικών πληροφοριών δεν λαμβάνουν υπόψη τους περιορισμούς που υποβάλλει η διαδικασία συλλογής των πρωταρχικών δεδομένων στον ψηφιακό κόσμο. Αυτό έχει ως αποτέλεσμα τη δημιουργία λαθών και προβλημάτων τα οποία διαιωνίζονται καθ όλη τη διάρκεια της ανάλυσης, από τη συλλογή έως και την επεξεργασία των δεδομένων. Ειδικότερα, παρά το γεγονός ότι τα συγκεκριμένα μοντέλα είναι κατάλληλα για το σκοπό τον οποίο σχεδιάστηκαν, η αυτούσια μεταφορά τους στον ηλεκτρονικό υπολογιστή κρίνεται πλέον ακατάλληλη και ανεπαρκής. Τα προβλήματα δημιουργούνται σε σχέση με τις ανάγκες που επιβάλλει ο νέος τρόπος ανάλυσης και οι σχετικές διαδικασίες που αφορούν την μαζική και συλλογική επεξεργασία δεδομένων που προέρχονται από διαφορετικές πηγές. Τις περισσότερες φορές τα σημερινά μοντέλα επεξεργασίας ιατρικών δεδομένων συμπεριλαμβάνουν βήματα μείωσης των πληροφοριών, περιορίζοντας έτσι το εύρος των μελλοντικών αναλύσεων. Η ύπαρξη των πρωτογενών δεδομένων στην αρχική τους μορφή παρέχει δυνατότητες ανάλυσης των δεδομένων εκ νέου, χωρίς να έχουν προβλεφθεί κατά την αρχική συλλογή οι υποθέσεις που τέθηκαν υπό εξέταση. Ο λειτουργικός συνδυασμός ιατρικών δεδομένων[int2] είναι απαραίτητος για τη συστηματική αντιμετώπιση των σύνθετων ιατρικών προβλημάτων. Η παρούσα διατριβή εισάγει ένα νέο μοντέλο σχεδιασμού σχεσιακών βάσεων δεδομένων το οποίο επιτρέπει την αποδοτική μαζική διαχείριση και ανάλυση ετερογενών ιατρικών δεδομένων. Χρησιμοποιώντας ως παράδειγμα την ερευνητική περιοχή της Κυτταρομετρίας Ροής (FC) παρουσιάζει ένα λειτουργικό μοντέλο Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 10
11 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ολοκλήρωσης Αιματολογικών κλινικών και εργαστηριακών δεδομένων για τη νόσο της Β Χρόνιας Λεμφοκυτταρικής Λευχαιμίας. Ο λειτουργικός συνδυασμός των δεδομένων επιτυγχάνεται μέσω ενός καινοτόμου δομικού μετασχηματισμού του Προτύπου Κυτταρομετρίας Ροής (Flow Cytometry Standard - FCS) και του τρόπου αποθήκευσης Αιματολογικών δεδομένων σε σχήμα (schema) σχεσιακών βάσεων δεδομένων. Το προτεινόμενο σχήμα διευκολύνει τους επιστήμονες της ιατρικής στην εμβάθυνση της έρευνά τους παρέχοντας δυνατότητες και λεπτομερή ανάλυση που μέχρι σήμερα δεν ήταν διαθέσιμες. Το μοντέλο λειτουργικού συνδυασμού που παρουσιάζεται στην παρούσα εργασία δεν περιορίζεται σε κανένα επίπεδο, προσφέροντας λύσεις για δεδομένα που προέρχονται από ετερογενή ιατρικό εξοπλισμό, διαφορετικές κλινικές, εργαστήρια ή νοσοκομεία και για δεδομένα που προέρχονται από εντελώς διαφορετικά ιατρικά πεδία. Η ουσία του λειτουργικού συνδυασμού βασίζεται σε ένα ευέλικτο σχήμα οργάνωσης της πληροφορίας που επιτρέπει στους χρήστες να θέσουν συντακτικά απλές ερωτήσεις, οι οποίες επιστρέφουν αποτελέσματα σημαντικά ταχύτερα και σε πραγματικό χρόνο από τις παραδοσιακές υλοποιήσεις των βάσεων δεδομένων. Το προτεινόμενο σχήμα μπορεί να επιτύχει μείωση της πολυπλοκότητας των ερωτήσεων της τάξης του 8 και μείωση του χρόνου απόκρισης των απαντήσεων της τάξης του 2 όταν εφαρμόζεται σε δεδομένα FC που έχουν αποτυπωθεί χρησιμοποιώντας 256 χρώματα. Τα αποτελέσματα αυτά έχουν επιτευχθεί με τη χρήση ενός συγκεκριμένου και σταθερού αριθμού διαδικασιών εξόρυξης δεδομένων (data mining) ανεξαρτήτως του όγκου και της πολυπλοκότητας των αποθηκευμένων δεδομένων. Από τα αποτελέσματα της διατριβής προκύπτει σαφώς ότι τα πρότυπα που χρησιμοποιούν δεδομένα στη μορφή απλών αρχείων για το σχεδιασμό βάσεων δεδομένων, χωρίς να λαμβάνουν υπόψη τους το σχεδιασμό και τη χρήση δομικών μετασχηματισμών, περιορίζουν σημαντικά την αποτελεσματικότητα των ιατρικών βάσεων δεδομένων. Η ανάλυση των κλινικών και εργαστηριακών απαιτήσεων της Αιματολογίας και ο σχεδιασμός ενός ιατρικού πληροφοριακού συστήματος με σκοπό την κάλυψη των ερευνητικών και καθημερινών αναγκών του ιατρού οδήγησαν στην 11 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
12 ουσιαστική λειτουργική αναβάθμιση των ιατρικών δεδομένων και προσέφεραν ένα ισχυρό εργαλείο ανάλυσης και εξόρυξης ιατρικής γνώσης [Int3]. Η παρούσα διδακτορική διατριβή έχει ως στόχο τη δημιουργία ενός αποδοτικού μοντέλου για το Λειτουργικό Συνδυασμό Βιο-Ιατρικών δεδομένων (BioMedical data integration). Ξεκινώντας από τη σχεδιαστική ανάλυση της ιατρικής γνώσης και των προβλημάτων που προκύπτουν από τον τρόπο παραγωγής των ιατρικών δεδομένων, προχωρεί στην επίλυση των επιμέρους θεμάτων Λειτουργικού Συνδυασμού εντός ενός συγκεκριμένου ιατρικού πεδίου και καταλήγει στον ολοκληρωμένο Λειτουργικό Συνδυασμό ιατρικών δεδομένων προερχόμενων από διαφορετικές πηγές και πεδία γνώσης. Συνεχίζει με τη σχεδίαση ενός μοντέλου βάσεων δεδομένων που ακολουθεί «οριζόντια» λογική και είναι αρκετά αποδοτικό ώστε να αποκρίνεται σε πολύπλοκα και ευρείας κλίμακας ερωτήματα σε πραγματικό χρόνο. Καταλήγει με την παρουσίαση μίας ολοκληρωμένης εφαρμογής η οποία εκμεταλλευόμενη τα πλεονεκτήματα του Λειτουργικού Συνδυασμού και της οριζόντιας δομής των δεδομένων είναι σε θέση να διαχειριστεί εξετάσεις προερχόμενες από κάθε κυτταρομετρητή ροής, εφαρμόζει το πρότυπο FCS και συνδυάζοντάς αυτές με τις υπόλοιπες αιματολογικές κλινικοεργαστηριακές εξετάσεις να απαντά σε καθημερινά και σύνθετα ερευνητικά, ιατρικά ερωτήματα. Τα πρωτότυπα ερευνητικά αποτελέσματα που προέκυψαν στα πλαίσια της παρούσης εργασίας δημοσιεύτηκαν σε έγκυρα διεθνή περιοδικά και σε διεθνή και ελληνικά συνέδρια με κριτές. Lakoumentas J, Drakos J, Karakantza M, Nikiforidis GC, Sakellaropoulos GC, "Bayesian clustering of flow cytometry data for the diagnosis of B- Chronic Lymphocytic Leukemia", J Biomed Inform 2008 Dec 6 (doi: /j.jbi ). Ι. Δράκος. Μεθοδολογία Ολοκλήρωσης Ετερογενών Ιατρικών Δεδομένων με Στόχο τη Δημιουργία «Έξυπνου» Αρχείου Εξετάσεων. 5ο Πανελλήνιο Συνέδριο Κυτταρομετρίας με Διεθνή Συμμετοχή. Ολυμπία, 4-7 Ιουνίου Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 12
13 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Drakos I, Lakoumentas I, Karakantza M, Zoumbos N, Nikiforidis G, Sakellaropoulos G, A perspective for biomedical data integration: design of databases for flow cytometry, BMC Bioinformatics 2008, 9:99. Ι. Δράκος, Κωνσταντίνα Ντεϊμεντέ, Μαρίνα Καρακάντζα, Γ. Νικηφορίδης, Γ. Χ. Σακελλαρόπουλος. «Μεθοδολογία ομογενοποίησης δεδομένων Κυτταρομετρίας Ροής». 4ο Πανελλήνιο Συνέδριο Κυτταρομετρίας, Σαντορίνη, 8-11 Ιουνίου Lakoumentas J, Drakos J, Karakantza M, Zoumbos N, Nikiforidis G, Sa kellaropoulos G. The Probabilities Mixture Model f or Clustering Flow- Cytometric Data: An Application to Gating Lymphocytes in Peripheral Blood. Biological and Medical Data Analysis (Proceedings, ISBMDA 2006), pp , Lecture Notes in Computer Science, Vol 4345, Springer (2006). Ολοκληρώνοντας την εισαγωγή θέλω να ευχαριστήσω θερμά τον Καθηγητή Νικόλαο Ζούμπο, διευθυντή του Ειδικού Αιματολογικού Εργαστηρίου, για την στήριξη που μου παρείχε καθ όλη τη διάρκεια της συνεργασίας μας. Από το 1997 μέχρι και σήμερα ο κύριος Ζούμπος με βοήθησε τόσο στην επαγγελματική όσο και στην ερευνητική μου πορεία, σε βαθμό σημαντικά υψηλότερο από αυτό που θα μπορούσα να φανταστώ. Ουσιαστική και καθοριστική είναι επίσης η βοήθεια του Καθηγητή Γεώργιου Νικηφορίδη και του Εργαστηρίου Ιατρικής Φυσικής, το οποίο διευθύνει, στην εκπόνηση της παρούσης διατριβής, καθώς εξ αντικειμένου είναι ο επιστημονικός χώρος με τον οποίο κατάφερα να συνεργαστώ στενότερα. 13 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
14 ΓΕΝΙΚΟ ΜΕΡΟΣ Β-ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ ΕΙΣΑΓΩΓΗ Η Β-χρονία λεμφοκυτταρική λευχαιμία (ΧΛΛ) [BCLL ] χαρακτηρίζεται από την προοδευτική μονοκλωνική αύξηση του αριθμού των Β-λεμφοκυττάρων, τα οποία αθροίζονται στους λεμφικούς ιστούς, στο μυελό και στο αίμα. Πρόκειται για το συνηθέστερο τύπο λευχαιμίας στο δυτικό κόσμο καλύπτοντας περίπου το 30% του συνόλου των λευχαιμιών, ενώ είναι σπάνια στην Ασία και την Ιαπωνία [BCLL174, BCLL175]. Η επίπτωσή της στις ΗΠΑ ανέρχεται σε 3,35 3,69/ για τους άνδρες και 1,61 1,92 για τις γυναίκες. Το 80% των ασθενών είναι μεγαλύτεροι των 60 ετών, με μέσο όρο ηλικίας προσβολής τα 69,6 έτη [BCLL2]. Η διάγνωση της ΧΛΛ είναι βασισμένη στα ακόλουθα κριτήρια που προτείνονται από το Εθνικό Ίδρυμα Καρκίνου (NCI) [BCLL179]: Απόλυτη λεμφοκυττάρωση στο αίμα (>5r10 9 /l) με υπεροχή των ώριμων μικρών λεμφοκυττάρων και ποσοστό προλεμφοκυττάρων < 55%. έκφραση τουλάχιστον ενός δείκτη β-κυττάρων (CD19, CD20 και CD23) σε συνδυασμό με CD5, αλλά απουσία άλλων δεικτών της Τ κυτταρικής σειράς, και μονοκλωνική ασθενή έκφραση ανοσοσφαιρινών επιφάνειας. Η βιοψία μυελού των οστών (BM) είναι ενδεδειγμένη προκειμένου να αξιολογηθεί η έκταση της νόσου [BCLL179-BCLL181]. Περιβαλλοντικοί παράγοντες όπως η ακτινοβολία ιονισμού, οι χημικές ουσίες ή οι ιοί δεν φαίνονται να συνδέονται με την παθογένεια της ασθένειας [BCLL176- BCLL178]. Αντίθετα, το οικογενειακό ιστορικό ΧΛΛ ή άλλης λεμφοϋπερπλαστικής νόσου αποτελεί ισχυρό παράγοντα κινδύνου και ισχύει στο 10% των περιπτώσεων, αυξάνοντας έτσι τον κίνδυνο για τους πρώτου βαθμού συγγενείς νοσούντων κατά 30 φορές [BCLL3]. Ασθενείς με την οικογενή μορφή είναι κατά Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 14
15 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής μέσο όρο 10 χρόνια νεότεροι από εκείνους με τη σποραδική, ενώ τα προσβληθέντα παιδιά τους νοσούν χρόνια νωρίτερα από τους γονείς [BCLL4-6]. Επίσης, έχει περιγραφεί υποκλινική μορφή της νόσου σε ποσοστό 13,5% μεταξύ των συγγενών ασθενών πρώτου και δεύτερου βαθμού (μονοκλωνική Β-λεμφοκυττάρωση), δηλαδή ανίχνευση λεμφοκυττάρων στο αίμα με τον τυπικό ανοσοφαινότυπο, χωρίς να μπορεί να γίνει πρόβλεψη για την εξέλιξη αυτών των κυττάρων σε νόσο. [BCLL7,8]. ΠΑΘΟΓΕΝΕΙΑ Η πλέον σημαντική πληροφορία των τελευταίων ετών σχετικά με τη βιολογία της νόσου είναι η διάκρισή της σε δύο υποτύπους, με διαφορές μεταξύ τους τόσο καθοριστικές, ώστε να ορίζουν σχεδόν δύο νοσολογικές οντότητες. Η διάκριση γίνεται ανάλογα με την ύπαρξη ή την απουσία μεταλλάξεων στην υπερμεταβλητή περιοχή του γονιδίου της ανοσοσφαιρίνης (IGVH), που αφορά στο τμήμα εκείνο στο γονιδίωμα του λεμφοκυττάρου από το οποίο συντίθεται η περιοχή του ειδικού αντισώματος που έρχεται σε άμεση επαφή με το αντιγόνο. Ο ανασυνδυασμός αυτού του γονιδίου είναι που δημιουργεί μοναδικά αντισώματα και, επομένως, μοναδικούς κλώνους ενεργοποιημένων Β-λεμφοκυττάρων. Όταν λοιπόν η αλληλουχία βάσεων του γονιδίου αυτού στα κύτταρα της νόσου διαφέρει >2% σε σύγκριση με το αντίστοιχο γονίδιο των κυττάρων του βλαστικού κέντρου(πρώιμα κύτταρα), το γονίδιο θεωρείται μεταλλαγμένο [BCLL9]. Οι διαφορές μεταξύ των δύο υποτύπων καλύπτουν όλη την πορεία της νόσου, αρχίζοντας από την προέλευση του κακοήθους κυττάρου και την παθογένεια, μέχρι τη συμπεριφορά του κυττάρου και τα μετρήσιμα βιολογικά του παράγωγα. Η πλέον χαρακτηριστική διαφορά είναι η σημαντικά χειρότερη πρόγνωση του μη μεταλλαγμένου τύπου, διαπίστωση η οποία καθιέρωσε έκτοτε τη μελέτη των βιολογικών παραμέτρων της νόσου χωριστά και συγκριτικά για τους δύο τύπους [BCLL10]. ΠΡΟΕΛΕΥΣΗ ΤΟΥ ΠΑΘΟΛΟΓΙΚΟΥ ΚΥΤΤΑΡΟΥ Στην επιφάνεια των παθολογικών Β-κυττάρων εκφράζεται το μόριο CD5, το οποίο μόνο σ ένα ποσοστό περίπου 20% εκφράζεται στα φυσιολογικά Β- λεμφοκύτταρα των δευτερογενών λεμφικών οργάνων των ενηλίκων (π.χ. 15 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
16 λεμφαδένες). Αυτό οδήγησε στη σκέψη, μήπως τα κύτταρα της ΧΛΛ προκύπτουν από τα παραπάνω. Η μελέτη των CD5+ φυσιολογικών Β-λεμφοκυττάρων αποκαλύπτει ότι πρόκειται για κύτταρα του μανδύα που παράγουν χαμηλής συγγένειας (πολυαντιδρώντα) μη ειδικά αντισώματα, όπως και IgM αυτοαντισώματα. Τα τελευταία είναι ανιχνεύσιμα και σε φυσιολογικά άτομα, καθώς και σε ασθενείς με αυτοάνοσες διαταραχές (όπως ρευματοειδή αρθρίτιδα, συστηματικό ερυθηματώδη λύκο) ή με ΧΛΛ [BCLL11]. Τα κύτταρα της ΧΛΛ όμως δεν είναι δυνατόν να προέρχονται από τα παραπάνω, επειδή οι πρόγονοί τους έχουν έλθει σε επαφή με ειδικά αντιγόνα. Όταν συγκρίνονται τα παθολογικά κύτταρα με άωρα Β-κύτταρα, δηλαδή κύτταρα του βλαστικού κέντρου, CD5+ Β-κύτταρα και κύτταρα μνήμης, ομοιάζουν περισσότερο στα τελευταία, εξού και ο κοινός δείκτης CD27.12 Επομένως, η έκφραση του CD5 είναι δευτερογενής αλλαγή, που μάλλον οφείλεται στην κακοήθη εξεργασία ή σε κυτταρική ενεργοποίηση. Από αυτό το κύτταρο μνήμης προκύπτουν οι δύο τύποι ΧΛΛ, μια ομάδα δηλαδή με μεταλλάξεις στο γονίδιο της IgV και μια χωρίς. Παρότι παλαιότερα είχε θεωρηθεί ότι οι κλώνοι χωρίς μεταλλάξεις προέρχονται από άωρο κύτταρο, γεγονός που θα εξηγούσε και την κακοηθέστερη εξέλιξη αυτού του τύπου[bcll10], έχει πλέον φανεί ότι τα κύτταρα ΧΛΛ όλων των ασθενών, ανεξάρτητα από μεταλλάξεις, επιδεικνύουν στοιχεία ενεργοποίησης και επαφής με αντιγόνα[bcll13]. Η μεταξύ τους διαφορά έγκειται μάλλον στη χρονική στιγμή επαφής με το αντιγόνο στην πορεία εξέλιξης του παθογενετικού μηχανισμού της νόσου. ΑΝΤΙΓΟΝΙΚΟΣ ΕΡΕΘΙΣΜΟΣ Οι υποδοχείς των Β-κυττάρων σε πολλούς ασθενείς έχουν συχνά δομικές ομοιότητες μεταξύ τους [BCLL14]. Αυτό σημαίνει ότι συνδέουν και όμοια αντιγόνα, τα οποία παίζουν ρόλο στην παθογένεια. Έτσι, σε κάποιες περιπτώσεις η ομοιότητα εντοπίζεται στη μεταβλητή περιοχή της βαριάς αλυσίδας[bcll15] και σε άλλες στις μεταβλητές περιοχές της βαριάς και της ελαφράς αλυσίδας, στα σημεία υποδοχής του αντιγόνου. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 16
17 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Περίπου το 10% όλων των περιπτώσεων νόσου μπορεί να ταξινομηθεί σε κατηγορία κοινών υποδοχέων, αλλά αυτό το φαινόμενο αφορά πολύ περισσότερο στο μη μεταλλαγμένο τύπο, όπου το ποσοστό ανέρχεται στο 20% [BCLL16]. Γι αυτές τις περιπτώσεις μπορεί να λεχθεί ότι συγκεκριμένα αντιγόνα επάγουν τον πολλαπλασιασμό των λευχαιμικών κυττάρων, χωρίς να έχει διευκρινιστεί ακόμα αν πρόκειται για ιούς, βακτήρια, περιβαλλοντικά αντιγόνα ή και αυτοαντιγόνα. ΣΥΣΣΩΡΕΥΣΗ ΚΑΙ ΠΟΛΛΑΠΛΑΣΙΑΣΜΟΣ Η κακοήθεια της νόσου έχει αποδοθεί παραδοσιακά στη συσσώρευση των παθολογικών κυττάρων. Ο μέχρι πρόσφατα προτεινόμενος μηχανισμός συσσώρευσης, ότι δηλαδή ο ενδογενής μηχανισμός απόπτωσης είναι ελαττωματικός, δεν υποστηρίζεται από τα σύγχρονα δεδομένα, επειδή τα ίδια κύτταρα in vitro υφίστανται αυτόματη απόπτωση [BCLL17]. Υπεύθυνο πλέον για τη συσσώρευση θεωρείται το εξωτερικό μικροπεριβάλλον, του οποίου οι επιδράσεις συντηρούν τα κύτταρα εν ζωή. Τα στοιχεία του εξωτερικού μικροπεριβάλλοντος που ενοχοποιούνται γι αυτή τη λειτουργία είναι: Γειτονικά κύτταρα: Τα κύτταρα της ΧΛΛ έρχονται σε επαφή με διάφορα άλλα κύτταρα κατά την κυκλοφορία τους στο λεμφικό σύστημα. Στρωματικά κύτταρα του μυελού μπορούν να συντηρήσουν καλλιέργειες κυττάρων ΧΛΛ, χωρίς τη χρήση εξωγενών αυξητικών παραγόντων [BCLL18]. Ειδικά μονοκύτταρα αλληλεπιδρούν με τα κύτταρα της ΧΛΛ, καθώς τα πρώτα προϋποθέτουν τα δεύτερα για να εξελιχθούν στην ειδική μορφή των nurse-like cells, και με τη σειρά τους προστατεύουν τα λευχαιμικά κύτταρα από την αυτόματη απόπτωση στην καλλιέργεια [BCLL19]. Επίσης, η ανακατανομή των πληθυσμών των Τ-λεμφοκυττάρων στους ασθενείς με ΧΛΛ και η παραγωγή σημάτων επιβίωσης από αυτά δημιουργεί ένα προστατευτικό περιβάλλον για τα Β-κύτταρα στο μυελό και τους λεμφαδένες [BCLL20,21]. Οι αλλαγές αυτές στα Τ-λεμφοκύτταρα φαίνεται να προκαλούνται από την άμεση επαφή τους με τα παθολογικά Β- λεμφοκύτταρα [BCLL22]. Σήματα επιβίωσης (survival signals): Ενεργοποιούν υποδοχείς της κυτταρικής μεμβράνης. Τέτοια είναι κυτταροκίνες, όπως ΙL-4, INF-α, INF-γ, που εκκρίνονται από τα Τ-κύτταρα [BCLL23]. Σημαντική είναι η οικογένεια 17 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
18 κυτταροκινών TNF (παράγοντες νέκρωσης όγκων), που εκκρίνονται επίσης από τα Τ-κύτταρα και επιδρούν στον κυτταρικό υποδοχέα CD40 [BCLL24]. Xημειοκίνες, όπως ο SDF-1, εκκρίνονται από τα στρωματικά κύτταρα [BCLL25]. Τα nurse-like cells εκκρίνουν APRIL/BAFF, ένα ομόλογο του BlyS/BAFF, που προάγει την επιβίωση [BCLL26]. Κάποια από αυτά τα μόρια όμως παράγονται από τα ίδια τα Β-κύτταρα, δημιουργώντας ένα αυτόνομο αυτοκρινές σύστημα, όπως συμβαίνει με την έκφραση από έναν κλώνο Β- κυττάρων ταυτόχρονα του υποδοχέα CD40 και του CD40L [BCLL27]. Τελικά, τα παραπάνω μεταξύ άλλων ευοδώνουν τα αντι-αποπτωτικά γονίδια BCL-2 [BCLL28], survivin [BCLL29] και MCL-1 [BCLL30]. Ρόλο στην κακοήθεια της νόσου παίζει όμως και ο υπέρμετρος πολλαπλασιασμός ορισμένων κλώνων. Τα κύτταρα της ΧΛΛ έχουν αρκετά έντονο ρυθμό πολλαπλασιασμού, ο οποίος κυμαίνεται από 0,1 έως >1% του κλώνου ανά ημέρα [BCLL31]. Στους ασθενείς εκείνους που έχουν απολέσει την ευαισθησία στον αντιπολλαπλασιαστικό (anti-proliferative) παράγοντα TGF-β, ο ρυθμός πολλαπλασιασμού είναι ακόμα μεγαλύτερος [BCLL32,33]. Με δεδομένο ότι ο μέσος αριθμός κυττάρων σ έναν ασθενή είναι 10 12, καθημερινά παράγονται νέα λευχαιμικά κύτταρα. Σε αυτό το έδαφος προκύπτουν νέες μεταλλάξεις, που μπορούν να προσδώσουν στη νόσο επιθετικότερο χαρακτήρα. Κατ επέκταση, υποστηρίζεται ότι η αυξημένη αναλογία νέων λευχαιμικών κυττάρων δείχνει την επιθετικότητα της νόσου καλύτερα από τον απόλυτο αριθμό λεμφοκυττάρων ή το μέγεθος των λεμφαδένων, καθώς τα τελευταία δείχνουν περισσότερο την ισορροπία μεταξύ κυτταρικού πολλαπλασιασμού και θανάτου, απ ό,τι τη δυνατότητα νέων επικίνδυνων μεταλλάξεων. Σ αυτό συνηγορεί και το ότι τα τελομερή, τα οποία ως γνωστόν βραχύνονται με κάθε κυτταρική διαίρεση, είναι μικρότερα στο DNA των ασθενών με επιθετικότερη νόσο [BCLL34]. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 18
19 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΚΛΙΝΙΚΗ ΕΙΚΟΝΑ Η ΧΛΛ απαντάται συχνότερα στους ηλικιωμένους ασθενείς. Η διάμεσος ηλικία διάγνωσης είναι τα 60 έτη και οι άντρες νοσούν συχνότερα από τις γυναίκες, με μια αναλογία 2 έως 3 προς ένα [BCLL182-BCLL185]. Είναι μάλλον σπάνια σε άτομα κάτω των 50 ετών, τα οποία αντιπροσωπεύουν περίπου το 10% ολόκληρου του πληθυσμού με ΧΛΛ [BCLL186-BCLL191]. Στο 50% των περιπτώσεων δεν υπάρχει κανένα σύμπτωμα κατά την αρχική διάγνωση με το περίπου το 30-40% των ασθενών να μην εμφανίζουν κανένα παθολογικό κλινικό εύρημα κατά την διάγνωσης [BCLL183]. Η υποψία τίθεται με τυχαία ανεύρεση μεμονωμένης λεμφοκυττάρωσης στο αίμα ή διαπίστωση λεμφαδενοπάθειας ή και σπληνομεγαλίας κατά την κλινική εξέταση. Όταν υπάρχει συμπτωματολογία, αυτή αφορά καταβολή, λεμφαδενοπάθεια, λοιμώξεις (βακτηριακή πνευμονία) και σπάνια πυρετό ή απώλεια βάρους. Σημαντικές είναι οι όψιμες κλινικές εκδηλώσεις της νόσου, οι οποίες οφείλονται στην ανοσοανεπάρκεια λόγω υπογαμμασφαιριναιμίας. Επίσης, παρατηρούνται διαταραχές στη λειτουργία των Τ-λεμφοκυττάρων, του συμπληρώματος και των ουδετεροφίλων. Το αποτέλεσμα όλων αυτών των μεταβολών μαζί με την επιβάρυνση που προκαλεί η θεραπεία (χημειοθεραπεία) έχει ως συνέπεια την ευπάθεια σε τυπικές βακτηριακές και ευκαιριακές λοιμώξεις, οι οποίες υποτροπιάζουν σ ένα ποσοστό 80%. Τελικά, η σήψη είναι η κύρια αιτία θανάτου. Συχνή είναι και η εμφάνιση αυτοάνοσων διαταραχών, ειδικά του αιμοποιητικού, και η επίπτωση είναι υψηλότερη σε αυτούς που έχουν υποβληθεί σε θεραπεία. Τα αυτοαντισώματα που παράγονται κατευθύνονται συνήθως εναντίον DNA, ιστονών, κυτταροσκελετικών πρωτεϊνών, ερυθρών κυττάρων, αιμοπεταλίων και άλλων κυτταρικών στόχων [BCLL35]. Εχουν περιγραφεί καθαρές σπληνικές μορφές της ΧΛΛ που τείνουν να έχουν μια καλύτερη εξέλιξη [BCLL193]. Delete [BCLL192, BCLL194-BCLL196]. Εξωαδενικές εντοπίσεις, όπως το γαστρεντερικό, οι πνεύμονες, τα πλευρά, το ΚΝΣ, τα νεφρά, κ.λπ., εμφανίζονται πολύ σπάνια (<1%). Οι περιπτώσεις αυτές πρέπει να διαφοροδιαγνωσθούν από λοιμώξεις, παρενέργειες της θεραπείας, εκτροπή σε επιθετικότερη λεμφική κακοήθεια ή δευτεροπαθείς νεοπλασίες [BCLL184]. 19 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
20 Κατά τη διάγνωση της ΧΛΛ ανευρίσκεται Coombs(+) αυτοάνοση αιμολυτική αναιμία στο 2% των ασθενών. Τελικά, ένα ποσοστό μεταξύ 7,7 35% θα αναπτύξει αυτοάνοση αιμολυτική αναιμία κατά την εξέλιξη της νόσου [BCLL36]. Περίπου το 90% των ασθενών αυτών έχει IgG αντι-ερυθροκυτταρικά αντισώματα, ενώ οι υπόλοιποι έχουν IgM. Τα αντι-ερυθροκυτταρικά αντισώματα είναι συνήθως θερμά, πολυκλωνικά IgG, τα οποία παράγονται πιθανότατα από μη κακοήθη Β-λεμφοκύτταρα [BCLL35,36] αν και έχουν περιγραφεί και ΙgG αντισώματα με σύσταση ελαφρών αλύσεων αντίστοιχη του λευχαιμικού κλώνου [BCLL37], γεγονός το οποίο υποδηλώνει εκτεταμένη διαταραχή του ανοσιακού συστήματος. Ως πιθανός παθογενετικός μηχανισμός προτείνεται η διαταραχή του συστήματος Fas, το οποίο φυσιολογικά παίζει ρόλο στην απομάκρυνση των αυτοαντιδρώντων Β-λεμφοκυττάρων. Όντως, έχει περιγραφεί για τη ΧΛΛ αρνητική ή ασθενής έκφραση του υποδοχέα Fas [BCLL38] και αντίσταση στην κυτταροτοξική οδό όπου διαμεσολαβεί το Fas [BCLL39]. Η αναιμία που εμφανίζεται στη ΧΛΛ μπορεί να οφείλεται και σε άλλους παθογενετικούς μηχανισμούς, όπως η διήθηση του μυελού, ο υπερσπληνισμός, η ανεπάρκεια αιμοποιητικών παραγόντων, η απώλεια αίματος, ή να έχει και τη μορφή αναιμίας χρονίας νόσου. Πιο σπάνιες αυτοάνοσες εκδηλώσεις είναι η αυτοάνοση θρομβοπενία και η απλασία της ερυθράς σειράς, ενώ μπορεί να εμφανιστεί νεφρωσικό σύνδρομο, αγγειοοίδημα και παρανεοπλασματική πέμφιγα αυτοάνοσης αιτιολογίας [BCLL40]. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 20
21 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΕΡΓΑΣΤΗΡΙΑΚΑ ΕΥΡΗΜΑΤΑ ΛΕΜΦΟΚΥΤΤΑΡΑ Ο ελάχιστος αριθμός λεμφοκυττάρων που απαιτείται για τη διάγνωση είναι /L. Η μέση τιμή κατά τη διάγνωση είναι /L και ο αριθμός αυτός μπορεί να αυξηθεί κατά την εξέλιξη της νόσου έως και /L. Στις μισές περιπτώσεις, ο αριθμός των λεμφοκυττάρων διπλασιάζεται μέσα σε ένα έτος. Σε κάποιες περιπτώσεις εμφανίζονται κυκλικές μεταβολές του αριθμού, ενώ σε άλλες ο αριθμός των λεμφοκυττάρων μένει σταθερός για χρόνια. delete[bcll41]. Εκτός από αυτά τα τυπικά κύτταρα της ΧΛΛ, μπορεί να παρατηρηθούν και μορφολογικές παραλλαγές, που είναι τα προλεμφοκύτταρα, τα κύτταρα με εντομή και μεγάλα κύτταρα με άφθονο κυτταρόπλασμα. Η ύπαρξη μορφολογικών παραλλαγών κατέστησε απαραίτητη την ταξινόμηση της ΧΛΛ σε υποκατηγορίες [BCLL42]: Κλασική ΧΛΛ: Μικρά κύτταρα συνιστούν περισσότερο από το 90% του πληθυσμού. Ο κλασικός τύπος καλύπτει το 80% της ΧΛΛ. ΧΛΛ/ΠΛ (προλεμφοκυτταρική λευχαιμία): Ποσοστό από 11 έως 54% του πληθυσμού είναι προλεμφοκύτταρα. Άτυπη ΧΛΛ: Υπάρχουν περισσότερα από 5% κύτταρα με εντομή και προλεμφοκύτταρα σε ποσοστό μεγαλύτερο του 10%. Τα κριτήρια για τη μορφολογία της άτυπης ΧΛΛ είναι ακόμα υπό συζήτηση. Delete Στη διάγνωση, ο απόλυτος αριθμός ουδετερόφιλων είναι φυσιολογικός. Η αναιμία, με αιμοσφαιρίνη <11 g/dl, βρίσκεται στο 10-15% των ασθενών και θρομβοπενία (<100x10 9 /l) σε λιγότερο από 10%. Η αναιμία και η θρομβοπενία μπορούν να οφείλονται σε εκτεταμένη προσβολή του νωτιαίου μυελού από τη νόσο, σε αυτοάνοσο μηχανισμό, υπερσπληνισμό ή μπορεί να έχουν χαρακτηριστικά αναιμίας χρόνιας νόσου [BCLL198]. Η μορφολογία των λεμφοκυττάρων μοιάζει με εκείνη των φυσιολογικών. Έχουν μικρό ή μεσαίο μέγεθος, συμπυκνωμένη χρωματίνη, δυσδιάκριτους πυρηνίσκους και αυξημένη αναλογία πυρήνα προς κυτταρόπλασμα. 21 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
22 ΜΥΕΛΟΣ ΚΑΙ ΛΕΜΦΑΔΕΝΕΣ Ο μυελός των οστών (BM) διηθείται στη ΧΛΛ. Όσο πιο προχωρημένη είναι η νόσος τόσο υψηλότερος είναι ο βαθμός προσβολής του ΜΟ αν και αυτό δεν ισχύει πάντα. Η βιοψία μυελού δείχνει τον τύπο της διήθησης. Μπορεί να είναι διάμεση, σπάνια οζώδης, συχνότερα μικτή (διάμεση και οζώδης) ή διάχυτη, που έχει και τη χειρότερη πρόγνωση. Η μορφολογία των λεμφοκυττάρων στη βιοψία του νωτιαίου μυελού είναι παρόμοια με αυτήν που ανευρίσκεται στο αίμα. Η ιστολογική εικόνα των λεμφαδενών αποκαλύπτει συνήθως μια διάχυτη διήθηση από μικρά ώριμα λεμφοκύτταρα [BCLL199, BCLL43]. Η ιστολογική εικόνα της ΧΛΛ δεν διαφέρει από αυτή του μικρού λεμφοκυτταρικού λεμφώματος (SLL). Κατά συνέπεια, αυτές οι δύο οντότητες διακρίνονται μόνο βάσει των αιματολογικών ευρημάτων [BCLL182, BCLL183, BCLL199, BCLL203, BCLL204]. ΣΠΛΗΝΑ ΚΑΙ ΉΠΑΡ Η ιστολογική εικόνα του σπληνός στην Β-ΧΛΛ χαρακτηρίζεται από επέκταση του λευκού πολφού. Σε κάποιες περιπτώσεις παρατηρείται και αύξηση του ερυθρού πολφού. Σε με4ρικές από αυτές τις περιπτώσεις κλινικά παρατηρείται υπερσπληνισμός [BCLL206]. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 22
23 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΑΝΟΣΟΦΑΙΝΟΤΥΠΟΣ Ο προσδιορισμός του ανοσοφαινότυπου είναι καθοριστικός για τον χαρακτηρισμό των λεμφοκυττάρων, άρα για τη διάγνωση, και σε ορισμένες περιπτώσεις και για την πρόγνωση της νόσου. delete[bcll44]. Ο χαρακτηριστικός ανοσοφαινότυπος των Β-κυττάρων είναι CD5+, CD19+, CD23+, FMC7-, ενώ οι δείκτες CD20, CD79b/CD22 και οι επιφανειακές ανοσοσφαιρίνες ανευρίσκονται σε χαμηλά επίπεδα με ασθενή έκφραση. Σε περισσότερο από το 90% των περιπτώσεων, τα λευχαιμικά β- λεμφοκύτταρα εκφράζουν το δείκτη CD5 (της Τ κυτταρικής σειράς) και αποτελεί ένα διαγνωστικό κριτήριο για ΧΛΛ [BCLL208, BCLL210]. Οι δείκτες CD19 και CD20 είναι τυπικοί για Β-λεμφοκύτταρα, όχι όμως και ο CD5, όπως συζητείται στο κεφάλαιο προέλευσης του κυττάρου. Ο CD23 είναι δείκτης ενεργοποίησης και, καθώς υφίσταται αυτόματη πρωτεόλυση, παράγει αυξημένα επίπεδα CD23 στον ορό, τα οποία είναι ενδεικτικά της εξέλιξης της νόσου [BCLL45]. To CD79b είναι συστατικό του συμπλέγματος αντιγόνου-υποδοχέα στην επιφάνεια των Β-λεμφοκυττάρων. To FMC7 ανευρίσκεται αρνητικός στο 84% των ασθενών και είναι δείκτης προλεμφοκυτταρικής λευχαιμίας και λευχαιμίας εκ τριχωτών κυττάρων [BCLL46]. To CD38 είναι μια ακόμη σημαντική επιφανειακή πρωτεΐνη και συνδυάζεται με δυσμενή πρόγνωση, όπως συζητείται στη σχετική ενότητα. Η συχνότητα παρουσίασης CD25 και CD22 ποικίλλει μεταξύ των μελετών (25-70 και 40% αντίστοιχα) [BCLL210, BCLL212] και το FMC7 [BCLL209,BCLL211- BCLL213] είτε εκφράζεται ασθενώς είτε δεν εκφράζεται καθόλου. Το CD38 είναι [BCLL210, BCLL212] εκφράζεται στο 20% των περιπτώσεων. Το CD79b εκφράζεται ασθενώς 95% των περιπτώσεων. Οι ασθενείς με τρισωμία 12 ή/και την άτυπη μορφολογία έχουν μια ισχυρότερη έκφραση του slg και μια υψηλότερη συχνότητα FMC7 και CD38 23 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
24 έκφρασης [BCLL197]. Πρόσφατα, το CD38 συνδέθηκε με τις σπάνιες μεταλλαγές στη μεταβλητή περιοχή του γονιδίου της βαριάς αλυσίδας [BCLL207]. Αν και η ΧΛΛ είναι συνήθως διακριτή από άλλες λευχαιμικές β-χρόνιες διαταραχές σε ανοσοφαινοτυπικό επίπεδο, υπάρχουν και αδιευκρίνιστες περιπτώσεις. Η Matutes και οι συνεργάτες της [BCLL209] έχουν αναπτύξει ένα σύστημα για να διευκολύνουν αυτήν την διάκριση, λαμβάνοντας υπόψη την έκφραση CD5, CD23 και FMC7 καθώς επίσης και της έντασης του slg και CD22. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 24
25 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΔΙΑΓΝΩΣΗ ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΔΙΑΓΝΩΣΗ Για τη διάγνωση ασθενών με ΧΛΛ χρησιμοποιούνται τα εξής κριτήρια: Λεμφοκύτταρα στο περιφερικό αίμα /L. Χαρακτηριστικός ανοσοφαινότυπος. Το κριτήριο αυτό πληρούται όταν, σύμφωνα με τον πίνακα 1 επιτυγχάνεται score 4 ή 5. Μυελός οστών: Διήθηση με λεμφοκύτταρα > 30%. Δείκτης Ένταση Δείκτη Score Επιφανειακή Ανοσοσφαιρίνη Εντονη 0 Ασθενής 1 CD5 (-) 0 (+) 1 CD23 (-) 0 (+) 1 CD22/CD79b εντονη 0 Ασθενής 1 FMC7 (+) 0 (-) 1 [BCLL Πίνακας 1] - Σύστημα βαθμολόγησης (scoring system) Η διάγνωση συνήθως τίθεται εύκολα μετά από μικροσκοπική εξέταση αίματος και καθορισμό του ανοσοφαινότυπου. Η διαφορική διάγνωση γίνεται από καλοήθεις καταστάσεις που συνοδεύονται από αντιδραστική λεμφοκυττάρωση, κυρίως λοιμώξεις, και από άλλες αιματολογικές διαταραχές. 25 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
26 Η ΧΛΛ πρέπει να διαφοροποιείται από άλλες χρόνιες λεμφοπολλαπλασιαστικές διαταραχές, οι οποίες μπορούν να είναι είτε εξ ορισμού λευχαιμικές είτε να περιπλέκονται από μία λευχαιμική εικόνα [BCLL183, BCLL215, BCLL216]. Αυτές οι διαταραχές περιλαμβάνουν: καλοήθη πολυκλωνική λεμφοκυττάρωση β-κυττάρων, προλεμφοκυτταρική λευχαιμία, λευχαιμία από τριχωτά κύτταρα σπληνικό λέμφωμα οριακής ζώνης με ή χωρίς λαχνωτά λεμφοκύτταρα, λέμφωμα μανδύα λεμφοπλασμοκυτταρικό λέμφωμα, διάχυτο οζώδες λέμφωμα, κομβικό λέμφωμα β-κυττάρων (monocytoid)???? δερματικό λέμφωμα Τ-κυττάρων (σύνδρομο- Sezary ή σπογγώδης μυκητίαση). Τα κλινικά ευρήματα, οι αιματολογικές παράμετροι, η μορφολογία των κυττάρων, η ιστολογική εικόνα, ο ανοσοφαινότυπος, οι εκδηλώσεις της διαταραγμένης ανοσίας, της κυτταρογενετικής ανάλυσης και των μοριακών δεικτών συμβάλλουν στη διαφορική διάγνωση της ΧΛΛ από άλλες χρόνιες λεμφουπερπλαστικές διαταραχές. Οι χαρακτηριστικές περιπτώσεις ΧΛΛ διακρίνονται εύκολα από άλλες χρόνιες λεμφουπερπλαστικές διαταραχές. Εντούτοις, η άτυπη ΧΛΛ μπορεί να είναι δύσκολο να διακριθεί στο μορφολογικό αλλά και στο ανσοφαινοτυπικό επίπεδο από άλλα λεμφουπερπλαστικά σύνδρομα. [BCLL209]. Η διαφορική διάγνωση της ΧΛΛ από άλλες αιματολογικές κακοήθειες με βάση τη μελέτη του ανοσοφαινότυπου φαίνεται στον πίνακα 2. Νόσος smlg CD5 CD23 CD79b FMC7 Score ΧΛΛ Ασθενής Β-ΠΛΛ Λευχαιμία από τριχωτά κύτταρα Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 26
27 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Λέμφωμα μανδύα Οζώδες Λέμφωμα Λέμφωμα οριακής ζώνης σπληνός Μακροσφαιριναμία : απουσία εκφραση, +:έκφραση, + έως +++: Βαθμός έκφρασης, smig: Επιφανειακή ανοσοσφαιρίνη [BCLL Πίνακας 2] - Ανοσοφαινότυποι της χρονίας λεμφοκυτταρικής λευχαιμίας (ΧΛΛ) και άλλων διαταραχών Β-κυττάρων. Η συντριπτική πλειψηφία των περιπτώσεων ΧΛΛ διαγιγνώσκεται στα πρώιμα στάδια. Για την διάγνωση της Β-ΧΛΛ δεν αρκεί η ανίχνευση Β μονοκλωνικής λεμφοκυττάρωσης. Σε ποσοστό 3,5% των φυσιολογικών ατόμων ηλικίας άνω των 40 ετών παρατηρείται Β μονοκλωνική λεμφοκυττάρωση (monoclinal B lymphocytosis, MBL). [BCLL108]. με τα ανοσοφαινοτυπικά χαρακτηριστικά των κυττάρων της Β ΧΛΛ. Η απόλυτη τιμή των λεμφοκυττάρων στις περιπτώσεις αυτές είναι < 3,5 x 10 9 /L στο αίμα τους [BCLL109]. Σε συγγενείς πρώτου βαθμού ασθενών με οικογενειακό ιστορικό ΧΛΛ η συχνότητα της MBL κυμαίνεται μεταξύ 13,5% και 18% [BCLL110- BCLL111]. Δεν είναι γνωστό αν οι περιπτώσεις MBL εξελίσσονται σε ΧΛΛ. Για τον αιματολόγο οι δύο αυτές οντότητες διακρίνονται βάση τον απόλυτο αριθμό λεμφοκυττάρων. Η σταδιοποίηση της νόσου γίνεται με δύο συστήματα, του Rai και Binet ( ). Κατά βάση τόσο το σύστημα του Rai όσο και του Binet είναι μετρήσεις της ολικής μάζας του όγκου. Εχουν γίνει πολλές προσπάθειες αντικατάστασης αυτών των συστημάτων από μετρήσεις διαλυτών μορίων στον ορό. Όμως καμία από τις πολλές μετρήσεις που έχουν προταθεί π.χ. CD23, β 2 -μικροσφαιρίνη, θρομβοποιητίνη, ιντερλευκίνη 6 (IL-6), IL-8 και ο παράγοντας νέκρωσης α (TNF-α) [BCLL113-BCLL117]) δεν αποδείχθηκε ότι μπορεί να αντικαταστήσει τα συστήματα σταδιοποίησης. [BCLL112], ( Παλιότερα η βιοψία μυελού των οστών κατά την διάγνωση θεωρούνταν επιβεβλημένη διότι ο τρόπος διήθησης του μυελού έχει προγνωστική σημασία για την εξέλιξη της νόσου. Σήμερα θεωρείται αρκετά επεμβατική μέθοδος για τις 27 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
28 προγνωστικές πληροφορίες που παρέχει και δεν περιλαμβάνεται στις απαραίτητες εξετάσεις κατά την διάγνωση. Όλες οι παραπάνω εξετάσεις ταυτοποιούν το <20% των ασθενών με ΧΛΛ που πρέπει να αρχίσουν θεραπεία άμεσα. Δεν συμβάλλουν όμως στην πρόγνωση του υπόλοιπου 80% των ασθενών που έχουν τη νόσο σε πρώιμο στάδιο. Για το λόγο αυτό το NCI εισήγαγε μια δυναμική μέτρηση ως ένδειξη για θεραπεία, το χρόνο διπλασιασμού των λεμφοκυττάρων (lymphocyte double time). ΧΡΟΝΟΣ ΔΙΠΛΑΣΙΑΣΜΟΥ ΤΩΝ ΛΕΜΦΟΚΥΤΤΑΡΩΝ ΚΑΙ ΟΡΟΣ ΘΥΜΙΔΙΝΗΣ ΚΙΝΑΣΗΣ Οι Montserrat και συνεργάτες ανέλυσαν το LDT (ο χρόνος που χρειάζεται για να διπλασιαστεί ο αριθμός των λεμφοκυττάρων) σε 100 ασθενείς με ΧΛΛ που δεν έχουν λάβει θεραπεία. Αν και υπήρχε κάποια συσχέτιση με το κλινικό στάδιο και τον τρόπο διήθησης του μυελού, το LTD αποδείχθηκε ότι έχει ανεξάρτητη προγνωστική σημασία [BCLL118].. Ο Galton και ο Dameshek [[BCLL119]BCLL120-BCLL121] ανεξάρτητα διαπίστωσαν ότι η ΧΛΛ είναι ασθένεια που χαρακτηρίζεται από τη συγκέντρωση και όχι με τον πολλαπλασιασμό των λεμφοκυττάρων. Οι δοκιμασίες όμως που μετρούν το ρυθμό πολλαπλασιασμού in vitro [BCLL122- BCLL125] των λεμφοκυττάρων έχουν προγνωστική σημασία. delete[bcll126]. Η ιδέα ότι τα κύτταρα με ΧΛΛ έχουν μειωμένη κυτταρική διαίρεση επιβεβαιώθηκε από πειράματα των Messmer και συνεργατών [BCLL127] που έκαναν χρήση μιας τεχνικής ιχνηθέτησης με ισότοπα. Χορήγησαν βαρύ νερό ( 2 H 2 O) από το στόμα για 84 μέρες με στόχο να ενσωματώσουν δευτέριο στο DNA των προσφάτως διαιρεμένων κυττάρων ΧΛΛ και το οποίο θα μπορούσε στη συνέχεια να μετρηθεί με φασματοσκοπία μάζας/χρωματογραφία αερίων. Απεδειξαν ότι τα κύτταρα ΧΛΛ είχαν ένα ρυθμό παραγωγής από 0.1% μέχρι >1% του ολικού λευχαιμικού φορτίου καθημερινά. Οι ασθενείς που είχαν ρυθμό παραγωγής των κυττάρων >0.35% ημερησίως είχαν πιο ενεργό και επιθετική νόσο σε σχέση με τους υπόλοιπους. Το LDT είναι μια απλή μέθοδος για τη μέτρηση του ρυθμού πολλαπλασιασμού που επιβεβαιώθηκε ως ένας χρήσιμος προγνωστικός δείκτης [BCLL128]. Έχει ενσωματωθεί στις οδηγίες του NCI [BCLL107] όπου απαιτείται LDT <6 μηνών για την έναρξη της θεραπείας. Τα μειονεκτήματά του είναι ότι δεν είναι διαθέσιμο κατά την διάγνωση, ότι υπάρχει η πιθανότητα να είναι εσφαλμένη Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 28
29 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής η μέτρηση στην περίπτωση χορήγησης κορτικοστεροειδών και ότι το σύνολο των λεμφοκυττάρων μπορεί να έχει φτάσει σε πλατό μετά από την αρχική αύξηση [BCLL119]. Για το λόγο αυτό το LDT θα πρέπει να αξιολογείται με βάση τη συνολική εικόνα του ασθενή. H κινάση θυμιδίνης (TK) είναι ένα κυτταρικό ένζυμο το οποίο εμπλέκεται στο μονοπάτι της σύνθεσης του DNA. Το ΤΚ1 απαντάται στην φάση G1/S των διαιρούμενων κυττάρων αλλά όχι στα κύτταρα σε φάση ηρεμίας. Η ΤΚ πιθανότατα να σχετίζεται με τον αριθμό των διαιρούμενων νεοπλαστικών κυττάρων και για το λόγο αυτό αποτελεί δείκτη πολλαπλασιασμού. Η μέτρηση των επιπέδων της ΤΚ έχει αποδειχτεί χρήσιμη για την πρόγνωση ασθενών με πρώιμο στάδιο ΧΛΛ [BCLL129- BCLL130]. Delete Δεν είναι γνωστό αν κάθε ασθενής με Β-ΧΛΛ μπορεί να εκτραπεί σε επιθετικότερο λέμφωμα. Πιθανώς ο ρυθμός πολλαπλασιασμού των λευχαιμικών κυττάρων να σχετίζεται με εκτροπή σε επιθετικότερη νόσο. Σε αντίθεση ασθενείς σταδίου Α, με Hb>13g/dl, αριθμό λεμφοκυττάρων<30*10 9 /L, μη διάχυτη ιστολογία μυελού και LDT>12 μήνεςέχουν μικρότερο κίνδυνο εκτροπής. Ισπανοί ερευνητές [BCLL131] χαρακτήρισαν αυτές τις περιπτώσεις «υποβόσκουσας» ΧΛΛ. ΣΤΑΔΙΟΠΟΙΗΣΗ Η σταδιοποίηση της νόσου γίνεται σύμφωνα με τα συστήματα Rai [BCLL47] (πίνακας 3) και Binet [BCLL48] (πίνακας 4) για περισσότερο από 25 χρόνια. Τα συστήματα αυτά, παρότι ωφέλιμα και ευρέως χρησιμοποιούμενα, αδυνατούν να κάνουν επιτυχή πρόγνωση για ασθενείς πρώτου σταδίου. Η επιβίωση των ασθενών αυτών ποικίλλει σημαντικά, με κάποιους να μην αποκλίνουν σημαντικά από το αναμενόμενο προσδόκιμο για υγιείς και κάποιους να πεθαίνουν σύντομα μετά από τη διάγνωση. Αυτή η διαφοροποίηση υποδηλώνει την ετερογένεια της νόσου και, συνεπώς, την ανάγκη για εξατομικευμένη θεραπεία. Ως εκ τούτου, η σύγχρονη έρευνα έχει επικεντρωθεί στην κατανόηση του παθοφυσιολογικού μηχανισμού, με στόχο αφενός την ακριβέστερη πρόγνωση και αφετέρου την καλύτερη θεραπευτική προσέγγιση για κάθε τύπο της νόσου. 29 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
30 Στάδιο Περιγραφή Επιβίωση (έτη) 0 Λεμφοκυττάρωση (Επίπεδα λεμφοκυττάρων > /L για >4 εβδομάδες) > 10 I + λεμφαδενοπάθεια 9 II III + σπληνομεγαλία +- λεμφαδενοπάθεια + αναιμία (Επίπεδα αιμοσφαιρίνης <11 g/dl) +- λεμφαδενοπάθεια ή σπληνομεγαλία 7 5 IV + θρομβοπενία (Αιμοπετάλια < /L) +- αναιμία +- λεμφαδενοπάθεια +- σπληνομεγαλία 5 [BCLL Πίνακας 3] - Σταδιοποίηση χρόνιας λεμφοκυτταρικής λευχαιμίας κατά Rai. Η αναιμία ή θρομβοπενία που οφείλονται σε αίτια διαφορετικά από την ανεπάρκεια μυελού θα πρέπει να αγνοούνται στην σταδιοποίηση. Παρότι οι φυσιολογικές τιμές της αιμοσφαιρίνης για τα δυο φύλα διαφοροποιούνται, στο σύστημα αυτό θεωρούνταιταυτόσημες. Η λεμφαδενοπάθεια και ηπατοσπληνομεγαλία γίνεται με βάση την κλινική εξέταση και την χρήση υπολογιστικής τομογραφίας (CT). Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 30
31 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Στάδιο Μετρήσεις Αίματος Προσβεβλημένες Περιοχές Επιβίωση (έτη) A B Hb > 10 g/dl Αιμοπετάλια > /L Hb > 10 g/dl Αιμοπετάλια > /L <3 >10 >3 7 C Hb < 10 g/dl ή/και Αιμοπετάλια > /L Οποιοσδήποτε αριθμός 5 [BCLL Πίνακας 4] - Σταδιοποίηση χρονίας λεμφοκυτταρικής λευχαιμίας κατά Binet. Το πιο σημαντικό αποτέλεσμα της σταδιοποίησης στη ΧΛΛ ήταν το γεγονός ότι τα πρώιμα στάδια της ΧΛΛ δεν χρειάζονται θεραπεία. Μια μετα-ανάλυση κλινικών μελετών απέδειξε ότι η θεραπεία στο πρώιμο στάδιο της ΧΛΛ δεν προσφέρει καλύτερη επιβίωση σε σχέση με την καθυστέρηση της θεραπείας μέχρι να εξελιχθεί η νόσος [BCLL106]. 31 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
32 ΠΡΟΓΝΩΣΗ Όπως αναφέρθηκε, τα υπάρχοντα συστήματα ταξινόμησης της νόσου, Rai και Binet, δεν εξασφαλίζουν επιτυχή πρόγνωση για ασθενείς πρώτου σταδίου. Η κλινική εικόνα και τα εργαστηριακά ευρήματα είναι αμβληχρά στα πρώτα στάδια και, επομένως, δεν μπορούν να εκφράσουν τη δυνητικά επιθετική νόσο. Έτσι, απαιτούνται επιπρόσθετοι δείκτες. ΧΡΩΜΟΣΩΜΙΚΕΣ ΑΝΩΜΑΛΙΕΣ Οι χρωμοσωμικές ανωμαλίες ανευρίσκονταν σε περισσότερους από τους μισούς ασθενείς με την κλασική κυτταρογενετική [BCLL49], ενώ με τη μέθοδο FISH (fluorescence in situ hybridization) ανευρίσκονται σε >80% των περιπτώσεων [BCLL50]. Καθεμιά από αυτές, αλλά και ο συνδυασμός τους, έχει συσχετιστεί με διαφορετική πρόγνωση, χειρότερη πάντως απ ό,τι στο φυσιολογικό καρυότυπο [BCLL51]. Οι συχνότερες χρωμοσωμικές ανωμαλίες που παρατηρούνται σε ΧΛΛ είναι 13q14 deletions (μέχρι 55%), 11q deletions (18%) και τρισωμίες 12 (16%). Οι λιγότερο συχνές ανωμαλίες είναι 17p deletions που περιλαμβάνουν το p53 γονίδιο (6%), και οι 6q deletions (6%) [BCLL214]. Μεταξύ των ασθενών με τις χρωμοσωμικές ανωμαλίες, 65% έχουν μία 25% έχουν δύο και 10% τρεις ή περισσότερες ανωμαλίες [BCLL214]. Ελλεψη 13q14 είναι η καλοηθέστερη ανωμαλία, καθώς δεν μεταβάλλει την επιβίωση σε σύγκριση με την πλήρη απουσία ανωμαλιών και συνδυάζεται συχνότερα με το μεταλλαγμένο τύπο ΧΛΛ. Ελλειψη 11q22-23: Περιλαμβάνει το γονίδιο αταξίας-τηλεαγγειεκτασίας (ΑΤΜ) [BCLL53]. Οι ελλείψεις στο 11q23 εμφανίζονται σε 10% με 20% των περιπτώσεων [BCLL162] και συνδέονται με δυσμενή πρόγνωση. Συνήθως οι ασθενείς είναι άνδρες με διογκωμένους τους κοιλιακούς λεμφαδένες. Με τις νεότερες θεραπείες τα ποσοστά ύφεσης είναι υψηλά, αλλά οι ασθενείς υποτροπιάζουν πρόωρα Ελλειψη 17p13: Οι ελλείψεις αυτές είναι συχνές στο μη μεταλλαγμένο τύπο ΧΛΛ με τη δυσμενέστερη πρόγνωση, ενώ συχνά οι εν λόγω ασθενείς παρουσιάζουν έντονη συμπτωματολογία, με εκσεσημασμένη σπληνομεγαλία και λεμφαδενοπάθεια, νυκτερινές εφιδρώσεις και απώλεια Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 32
33 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής βάρους. Χαρακτηριστικά ασθενείς που είναι ανθεκτικοί στις σύγχρονες θεραπείες φέρουν ελλείψεις στην περιοχή αυτή. Συχνά οι ελλείψεις αυτές εμφανίζονται κατά την εξέλιξη της νόσου και αποτελούν την αιτία για την ανάπτυξη αντοχής στην θεραπεία στο 30% των ασθενών. [BCLL168 Στους ασθενείς αυτούς η επιβίωση είναι μικρότερη από 2 έτη. Τρισωμία 12: Η Τρισωμία 12 είναι η πιο κοινή ανωμαλία και εμφανίζεται στο 25% περίπου των περιπτώσεων. Η τρισωμία 12 ανευρίσκεται συχνότερα στις παραλλαγές της νόσου και, συγκεκριμένα, στη ΧΛΛ/ΠΛ, όπου εκτός των τυπικών μικρών κυττάρων υπάρχει και πληθυσμός προλεμφοκυττάρων σε ποσοστό 11 54%, και στην «άτυπη» ΧΛΛ, όπου υπάρχει ποσοστό >15% κυττάρων με εντομή και <10% προλεμφοκυττάρων. [BCLL161]. Οι εκάστοτε χρωμοσωμικές ανωμαλίες τείνουν να συνδυάζονται με τον έναν ή τον άλλο τύπο ΧΛΛ και ταυτόχρονα αποτελούν ανεξάρτητο προγνωστικό παράγοντα. Καθώς οι ελλείψεις των συγκεκριμένων γονιδίων φέρουν μεταβολές σε μόρια που επηρεάζουν τον κυτταρικό κύκλο, την απόπτωση και τη μεταφορά μηνυμάτων μέσω του υποδοχέα των Β-κυττάρων, φαίνεται ότι παίζουν ρόλο στην παθογένεια της νόσου [BCLL59]. ZAP-70 Η διαφορά στην επιβίωση μεταξύ των ασθενών που φέρουν μεταλλαγμένο ή μη το γονίδιο IgVH ανέδειξε το ερώτημα αν η ΧΛΛ είναι δύο παρόμοιες ασθένειες που προκύπτουν σε διαφορετικά στάδια της ωρίμανσης των β- κυττάρων. Η χαρτογράφηση των γονιδίων κατέδειξε ότι η ΧΛΛ είναι ένα ενιαίο λέμφωμα, ευδιάκριτο από άλλους τύπους κακοήθειας της σειράς των β- κυττάρων [BCLL140- BCLL141]. Εντούτοις, υπάρχουν μικρές διαφορές στα γονίδια που εκφράζονται στις περιπτώσεις ΧΛΛ με μεταλλαγμένο ή μη το γονίδιο IgVH. Μια ομάδα προσδιόρισε τα 240 γονίδια που εκφράστηκαν διαφορετικά σε ασθενείς με Β-ΧΛΛ με ή μη μεταλλαγμένο γονίδιο IgVH από τα γονίδια που εξετάστηκαν. Το γονίδιο που πιο ευδιάκριτα διαχωρίζει 33 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
34 μεταξύ των δύο υποομάδων είναι αυτό που κωδικοποιεί τη ζήτα-σχετιζόμενη πρωτεΐνη με μοριακό βάρος kd 70 (Zap-70). Το Zap-70 είναι ένα μόριο το οποίο μεταβιβάζει ένα σήμα από τον υποδοχέα των Τ κυττάρων σε επόμενα μονοπάτια. Τα περισσότερα Β-κύτταρα στερούνται Zap-70 και χρησιμοποιούν αντ' αυτού μια κινάση της τυροσίνης (Syk), για τη μεταφορά του μηνύματος [BCLL131]. Στις περισσότερες περιπτώσεις ΧΛΛ με μεταλλαγμένα γονίδια IgVH, η δέσμευση του BCR με αντι- IgM αποτυγχάνει να προκαλέσει τη φωσφορυλίωση της Syk, ενώ στις περισσότερες περιπτώσεις με μη μεταλλαγμένο IgVH γονίδια η δέσμευση του BCR προκαλεί φωσφορυλίωση [BCLL142- BCLL143]. Μια πιθανή εξήγηση είναι ότι τα κύτταρα ΧΛΛ έχουν μια παραλλαγή CD79b που στερείται τα τμήματα Cys που είναι απαραίτητα για να διαμορφώσουν τα σταθερά ετεροδιμερή με CD79a στο BCR σύμπλεγμα [BCLL144]. Η παρουσία των Zap-70 υπερνικά αυτό το φραγμό [BCLL145]. Εντούτοις, η Β-κύτταρο διαμεσολαβούμενη ενεργοποίηση της Zap-70 είναι αμελητέα όταν συγκρίνεται με την ενεργοποίηση της Syk. Φαίνεται πιθανό ότι η Zap-70 εμποδίζει την αποσύνθεση των προς τα κάτω παραγόντων, οι οποίοι θα τερμάτιζαν τη σηματοδότηση αντίδρασης [BCLL146]. Έχει αποδειχτεί ότι η έκφραση της Zap-70 προβλέπει σωστά την κατάσταση μετάλλαξης του IgVH στο 93% των περιπτώσεων ΧΛΛ. Τέσσερις ασθενείς με μεταλλαγμένα γονίδια IgVH είχαν υψηλή έκφραση της Zap-70, και τρεις με μη μεταλλαγμένα γονίδια IgVH είχαν χαμηλή έκφραση της Zap-70. Η έκφραση της Zap-70 και οι μεταλλάξεις της IgVH είναι εξίσου ικανές να προβλέψουν το χρόνο που απαιτείται για θεραπεία [BCLL148]. Για τον έλεγχο της Zap-70, απαιτείται κυτταρομετρία ροής. Η πρωτύπωση των μεθόδων έχει αποδειχθεί δύσκολη. Υπάρχουν 3 τεχνικές κυτταρομετρίας οι δύο από τις [BCLL149], [BCLL150] και [BCLL151] συμφωνούν με τις μεταλλαγές γονιδίων IgVH πάνω από 90%, ενώ η συμφωνία της τρίτης και πιο εύκολης στην εκτέλεση μεθόδου ήταν μόνο 77%. Η έκφραση της Zap-70 φάνηκε ότι έχει ανεξάρτητη προγνωστική σημασία από την παρουσία μεταλλάξεων του IgVH γονιδίου. [BCLL151]. Η διαφορά αυτή στην προγνωστική σημασία οφείλεται στην διαφορετική βιολογική σημασία της ZAP-70 και των μεταλλάξεων του γονιδίου IgVH Όλες οι θετικές για Zap-70 περιπτώσεις με μεταλλαγμένα γονίδια IgVH χρησιμοποιούν το γονίδιο V3-21, το οποίο είναι υπεύθυνο για πτωχή πρόγνωση είτε υπάρχει μετάλλαξη είτε όχι [BCLL152]. Αντίθετα οι Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 34
35 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής περισσότεροι ασθενείς με μη μεταλλαγμένα γονίδια IgVH οι οποίοι ήταν Zap- 70 αρνητικοί εμφάνιζαν επιπλέον χρωμοσωμικό δείκτη με τη χρήση της FISH [BCLL152]. Η έρευνα των Rassenti et al [BCLL62] προχώρησε ένα βήμα πιο πέρα, δείχνοντας ότι, παρά τη συσχέτιση της πρωτεΐνης με το μη μεταλλαγμένο τύπο, η πρώτη αποτελεί ισχυρότερο προγνωστικό παράγοντα από εκείνον. Σύμφωνα με την παραπάνω μελέτη, σε 164 ασθενείς με μη μεταλλαγμένο τύπο ZAP-70-θετικοί ήταν το 71%, ενώ σε 143 με μεταλλαγμένο τύπο ZAP-70-θετικοί ήταν το 17%. Συγκρίνοντας τις ομάδες κατά τον τύπο, η διαφορά στην επιδείνωση της νόσου δεν ήταν στατιστικά σημαντική (Ρ=0,07): 2,8 χρόνια κατά μέσο όρο έναντι 4,2 χρόνια από τη διάγνωση στην έναρξη θεραπείας. Συγκρίνοντας όμως κατά το ΖΑΡ-70, ανευρίσκεται στατιστικά πολύ σημαντική διαφορά (Ρ<0,001) μεταξύ των 11 και 7,1 ετών. Προκειμένου να επιλυθούν τα αντικρουόμενα ευρήματα των διάφορων τεχνικών κυτταρομετρίας για τη Zap-70, έγινε προσπάθεια συνεργασίας εργαστηρίων, εμπορικών επιχειρήσεων και εργαστηρίων διασφάλισης ποιότητας [BCLL153]. Δεν είναι απολύτως σαφές ότι τα επίπεδα Zap-70 είναι σταθερά με την πάροδο του χρόνου. Τα επίπεδα είναι πιο υψηλά στα Τ κύτταρα του μυελού από ότι του αίματος [BCLL159]. Ωστόσο, υψηλά επίπεδα ZAP-70 εκκρίνονται από Β-κύτταρα του μη μεταλλαγμένου τύπου ΧΛΛ και σχετίζονται με επιθετικότερη νόσο και μικρότερο χρόνο επιβίωσης [BCLL60,61]. Με δεδομένο μάλιστα ότι η μέτρηση της πρωτεΐνης στον ορό είναι πιο εύκολη και οικονομική διαδικασία από την αναγνώριση του γονιδίου IGVH, το ZAP-70 αποκτά πλέον πρωτεύοντα ρόλο στο σχεδιασμό θεραπευτικής προσέγγισης για τον ασθενή. CD38 Η έκφραση του CD38 στην επιφάνεια των Β-λεμφοκυττάρων αποτελεί ανεξάρτητο αρνητικό προγνωστικό παράγοντα, και συνήθως συνδυάζεται με μη μεταλλαγμένο τύπο και υψηλές τιμές ΖΑΡ Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
36 Η θετικότητα του δείκτη ορίζεται ως έκφραση σε >30% των κυττάρων [BCLL63]. Πολλοί ερευνητές προτείνουν το συνδυασμό των δεικτών CD38 και ΖΑΡ-70 ως τον ιδανικότερο [BCLL64]. Επειδή η ανίχνευση της αλληλουχία των γονιδίων IgVH είναι πέρα από τις ικανότητες των περιφερικών εργαστηρίων, έγιναν προσπάθειες αναζήτησης μιας αναπληρωματικής μέτρησης που θα είχε την ίδια προγνωστική αξία. Σε μία από τις αρχικές δημοσιεύσεις οι Damle και συνεργάτες ισχυρίσθηκαν ότι η έκφραση CD38, που ανιχνεύεται εύκολα από την κυτταρομετρία ροής, ήταν μια τέτοια περίπτωση [BCLL132]. Δυστυχώς, έγινε σύντομα σαφές ότι, ενώ το CD38 είναι ένας χρήσιμος προγνωστικός δείκτης, οι μεμονωμένοι ασθενείς παρουσιάζουν συχνά ασυμφωνίες μεταξύ έκφρασης του CD38 και των IgVH μεταλλάξεων [BCLL133- BCLL134]. LPL/ADAM29 Σε πρόσφατη μελέτη αναγνωρίστηκε υπερέκφραση των LPL (lipoprotein lipase) και ADAM29 (a disintegrin and metalloproteinase domain 29) γονιδίων στο μη μεταλλαγμένο και το μεταλλαγμένο τύπο ΧΛΛ, αντίστοιχα. Η διερεύνηση της προγνωστικής αξίας του λόγου των mrnas τους, L/A, έδειξε ότι αποτελεί ανεξάρτητο προγνωστικό παράγοντα. Στο 80% των ασθενών, όπου βρέθηκαν ταυτόχρονα θετικά ή αρνητικά τα L/A και ΖΑΡ-70, αυτά επέτρεπαν σχεδόν απόλυτη εκτίμηση (99%) του τύπου της νόσου, μη μεταλλαγμένου ή μεταλλαγμένου, αντίστοιχα [BCLL65]. ΛΟΙΠΟΙ ΠΡΟΓΝΩΣΤΙΚΟΙ ΠΑΡΑΓΟΝΤΕΣ Άλλοι γνωστοί προγνωστικοί παράγοντες είναι ο χρόνος διπλασιασμού των λεμφοκυττάρων [BCLL66], ο τύπος διήθησης του μυελού (ο διάχυτος έχει τη χειρότερη πρόγνωση) [BCLL67], καθώς και εργαστηριακές παράμετροι, όπως τα επίπεδα στον ορό β2-μικροσφαιρίνης [BCLL68], διαλυτού CD23 (scd23) [BCLL69], κινάσης θυμιδίνης [BCLL70]. Μένει λοιπόν να εξακριβωθεί ποιος συνδυασμός εξετάσεων θα δίνει το ακριβέστερο αποτέλεσμα πρόγνωσης, με τη δυνατότητα, βέβαια, της ευρείας χρησιμοποίησης. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 36
37 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΘΕΡΑΠΕΙΑ Παρά την πρόοδο που έχει συντελεστεί στην κατανόηση των παθοφυσιολογικών μηχανισμών της νόσου και στην αναγνώριση προγνωστικών παραγόντων, η ΧΛΛ παραμένει νόσος χωρίς ίαση. Θεραπευτικός στόχος προς το παρόν είναι η υποστροφή της νόσου, πλήρης και μακροχρόνια κατά το δυνατόν. Στην κλινική πράξη, ο θεράπων ιατρός καλείται να επιλέξει μεταξύ των διαθέσιμων θεραπευτικών δυνατοτήτων λαμβάνοντας υπόψη τη φυσική κατάσταση του ασθενούς, τους επιβαρυντικούς παράγοντες και το στάδιο Rai ή Binet (BCLL Εικόνα 1). 37 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
38 Ασθενείς με σταθερή, χαμηλού κινδύνου ή σταδίου Α κατά Binet νόσο δεν λαμβάνουν θεραπεία, καθώς η επιβίωση μπορεί και να μειωθεί με τη χημειοθεραπεία, λόγω των επιπλοκών. Για τη θεραπεία 1ης γραμμής συνιστάται φλουδαραβίνη ή χλωραμβουκίλη. Η μονοθεραπεία με φλουδαραβίνη, ανάλογο πουρίνης, έχει αποδειχθεί αποτελεσματικότερη από άλλα συμβατικά χημειοθεραπευτικά σχήματα, όπως το CHOP (κυκλοφωσφαμίδη, δοξορουβικίνη, βινκριστίνη, πρεδνιζόνη) [BCLL71] και το CAP (κυκλοφωσφαμίδη, δοξορουβικίνη, πρεδνιζόνη) [BCLL72]. Στη σύγκρισή της με τη χλωραμβουκίλη επιτυγχάνει καλύτερη ανταπόκριση βραχυπρόθεσμα, δεν αποδεικνύεται όμως βελτίωση στην επιβίωση [BCLL73]. Έτσι, η χλωραμβουκίλη παραμένει χρήσιμη, ειδικά για ασθενείς που δεν έχουν καλή φυσική κατάσταση (performance status), όπως αυτή ορίζεται με βάση την κάθαρση της κρεατινίνης και άλλους δείκτες, όπως το cumulative illness rating scale score (CIRS score) [BCLL74]. Για ασθενείς σε καλή φυσική κατάσταση δικαιολογείται και η χρήση των σχημάτων FC (φλουδαραβίνη, κυκλοφωσφαμίδη) [BCLL75] ή FCR (φλουδαραβίνη, κυκλοφωσφαμίδη, rituximab) [BCLL76-78], τουλάχιστον σε ερευνητικά πρωτόκολλα, καθώς έχουν ήδη πολύ ενθαρρυντικά αποτελέσματα. To rituximab είναι μονοκλωνικό αντίσωμα έναντι του CD20 και, ενώ όταν χορηγείται μόνο του δεν έχει σημαντική δράση, σε συγχορήγηση με χημειοθεραπεία δρα συνεργικά. Ένα ακόμη μονοκλωνικό αντίσωμα, το alemtuzumab (ή Campath-1H, ανασυνδυασμένο αντίσωμα έναντι του CD52), έχει δραστικότητα σε ασθενείς με επιβαρυντικούς γενετικούς παράγοντες, όπως εξαλείψεις στα χρωμοσώματα 11 και 17 και μεταλλάξεις του p53 [BCLL79,80]. Έχει ήδη εγκριθεί για θεραπεία 2ης γραμμής, αλλά μελετάται επιπρόσθετα η ωφέλεια χορήγησής του εξαρχής σε ασθενείς με τους παραπάνω γενετικούς χαρακτήρες. Για θεραπεία 2ης γραμμής συνιστάται η φλουδαραβίνη, μόνη ή σε σχήμα με κυκλοφωσφαμίδη και μονοκλωνικό αντίσωμα. Οι ασθενείς αναπτύσσουν σταδιακά αντίσταση στη φλουδαραβίνη και όταν συμβεί αυτό, η μέση επιβίωση υπολογίζεται σε <1 έτος. Σε περιπτώσεις αντίστασης στη φλουδαραβίνη, το σχήμα FCR (φλουδαραβίνη, κυκλοφωσφαμίδη, rituximab) είχε ποσοστά ανταπόκρισης και πλήρους ύφεσης Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 38
39 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής 58% και 6%, αντίστοιχα [BCLL76], το alemtuzumab είχε αντίστοιχα ποσοστά 33% και 2% [BCLL81], ενώ υπάρχουν και ενδείξεις για ακόμα καλύτερη δράση του alemtuzumab σε συνδυασμό με φλουδαραβίνη [BCLL82,83]. Η θεραπευτική αντιμετώπιση σε ασθενείς με υπογαμμασφαιριναιμία και συχνά επεισόδια σήψης συμπληρώνεται με προφυλακτική χορήγηση γ-σφαιρίνης και αντιβιωτικών.?? Η αντιμετώπιση των αυτοάνοσων εκδηλώσεων της νόσου γίνεται με πρεδνιζόνη, 1 2 mg/kg/ημέρα. Σχετική μελέτη έδειξε μερική ανταπόκριση (δηλαδή αύξηση της Hb >12 g/dl) στο 84% των ασθενών και πλήρη ανταπόκριση (δηλαδή μη ανιχνεύσιμο αντιερυθροκυτταρικό αντίσωμα) στο 70% [BCLL84]. Καθώς η μακροχρόνια θεραπεία με στεροειδή προκαλεί τα γνωστά προβλήματα των ευκαιριακών λοιμώξεων, των γαστρεντερικών διαταραχών, του φαρμακογενούς σακχαρώδους διαβήτη και της οστεοπόρωσης, οι ασθενείς χρήζουν κατά περίπτωση προφυλακτικής αντιβίωσης, Η2 ανταγωνιστών, υπογλυκαιμικής αγωγής και διφωσφονικών. Γι αυτό, είναι σημαντική η προσπάθεια σταδιακής μείωσης των στεροειδών έως διακοπής τους σε 2 3 μήνες. Σε υποτροπή ή μη απόκριση στα στεροειδή χορηγείται ενδοφλεβίως ανοσοσφαιρίνη και εναλλακτικά έχουν δοκιμαστεί η κυκλοσπορίνη και το rituximab [BCLL86]. Η σπληνική ακτινοβόληση ή η σπληνεκτομή έχει θέση σε επώδυνη σπληνομεγαλία ή επίμονη κυτταροπενία που δεν απαντά στη χημειοθεραπεία. Η αναιμία των ασθενών αντιμετωπίζεται παραδοσιακά με τη χημειοθεραπεία. Στην περίπτωση όμως που η αναιμία οφείλεται σε διήθηση του μυελού ή πρόκειται για αναιμία χρονίας νόσου, η χορήγηση ερυθροποιητίνης επιτυγχάνει την αύξηση του αιματοκρίτη [BCLL87]. Έχει βρεθεί ότι η χορήγηση r-huepo (recombinant human erythropoietin) σε ασθενείς σταδίου Binet C ή Rai III μπορεί να μειώσει το στάδιο λόγω διόρθωσης της αναιμίας, με συνέπεια τη χρονική παράταση της έναρξης της χημειοθεραπείας [BCLL88]. Η μεταμόσχευση μυελού δεν προβλέπεται ως καθιερωμένη θεραπευτική προσέγγιση, προσφέρει όμως δυνητικά ίαση και έτσι μελετάται για τους νεότερους ασθενείς που έχουν επιβαρυντικούς προγνωστικούς παράγοντες (δηλαδή μη μεταλλαγμένο τύπο ΧΛΛ και ελλείψεις στα χρωμοσώματα 17 και 11), οι οποίοι δεν αναμένεται να ωφεληθούν από την κλασική χημειοθεραπεία και ταυτόχρονα μπορούν να υπομείνουν μια τέτοια επιθετική θεραπεία. Η αυτόλογη μεταμόσχευση έχει χαμηλή θνητότητα (~10%) και πετυχαίνει μακροχρόνια 39 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
40 ύφεση, αλλά όχι ίαση. Συνοδεύεται όμως από υψηλή επίπτωση ευκαιριακών λοιμώξεων και δευτεροπαθών κακοηθειών, όπως μυελοδυσπλαστικό σύνδρομο και οξεία μυελογενή λευχαιμία [BCLL89]. Στην επιτυχία της μεταμόσχευσης παίζει ρόλο η πρώιμη παρέμβαση και το χαμηλό φορτίο νόσου, ενώ ορισμένοι ασθενείς ίσως ωφελούνται στη φάση εδραίωσης μετά από την πρώτη πλήρη ή μερική υποστροφή. Ζητήματα όπως η επιλογή των ασθενών και η κατάλληλη στιγμή συλλογής των προγονικών αιμοποιητικών κυττάρων δεν είναι ακόμα διασαφηνισμένα. Πάντως, οι ασθενείς με μη μεταλλαγμένο IgVH έχουν χειρότερη πρόγνωση και με την αυτόλογη μεταμόσχευση [BCLL90], όχι όμως με την αλλογενή [BCLL91]. Η αλλογενής μεταμόσχευση έχει καλύτερη ανταπόκριση από την αυτόλογη μεταμόσχευση, αλλά και μεγαλύτερη τοξικότητα, με θνητότητα ~40%, που αποδίδεται κατά το ήμισυ περίπου στη νόσο μοσχεύματος κατά ξενιστή (GVHD) [BCLL92]. delete Τελευταία, δοκιμάζονται παραλλαγές της μεταμόσχευσης μυελού, όπως η μη μυελοαφανιστική (non-myeloablative) τεχνική, με υψηλές προσδοκίες. Με τη μέθοδο αυτή, χρησιμοποιούνται μικρότερες δόσεις των μυελοκατασταλτικών φαρμάκων και ακολουθεί η αλλογενής μεταμόσχευση, ώστε να δράσει το μόσχευμα κατά των λευχαιμικών κυττάρων. Αναμένεται να βρει εφαρμογή σε ασθενείς μεγαλύτερης ηλικίας, που αποτελούν και την πλειονότητα [BCLL93 95]. Νέα φάρμακα σχεδιάζονται και δοκιμάζονται, τα οποία έχουν διαφορετικούς μοριακούς στόχους. Τέτοια είναι η φλαβοπιριδόλη (αναστολέας κινάσης) [BCLL96], το Ontak (IL-2 receptor ligand immunotoxin denileukin diftitox) [BCLL97,98] πολλά μονοκλωνικά αντισώματα (έναντι των HLA-DR [BCLL99], του υποδοχέα TRAIL100 κ.ά.) και ο αναστολέας του Hsp90 (heat shock protein 90, μόριο-συνοδός της πρωτεΐνης ZAP) [BCLL101]. Με την εξαίρεση του Ontak, που βρίσκεται στη φάση 2 των κλινικών δοκιμών, τα υπόλοιπα βρίσκονται σε πολύ πρώιμα στάδια δοκιμών. Εναλλακτική θεραπευτική προσέγγιση αποτελεί η γονιδιακή θεραπεία, με στόχο την ενεργοποίηση του CD40 [BCLL102] υποδοχέα, που είναι θεραπευτικός στόχος σε αρκετές αιματολογικές κακοήθειες [BCLL103]. Ενδιαφέρον έχει και η μελέτη εμβολιασμού με λευχαιμικά κύτταρα ή συστατικά τους για τη θεραπεία ασθενών που έχουν ανοσιακή επάρκεια, γεγονός που Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 40
41 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής προϋποθέτει να μην έχουν λάβει ακόμη σχήμα φλουδαραβίνης ή alemtuzumab, ή τουλάχιστον να έχει παρέλθει ικανό χρονικό διάστημα από τη θεραπεία [BCLL104,105]. 41 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
42 ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ ΕΙΣΑΓΩΓΗ Οι ρίζες της κυτταρομετρίας ροής (flow cytometry) εντοπίζονται στα μέσα του 20ου αιώνα και η εκτενής χρήση της αρχίζει στη δεκαετία του 1970, με την εμφάνιση και των πρώτων εμπορικών συστημάτων. Στο κλινικό εργαστήριο αποκτά σημαντική θέση στα μέσα της δεκαετίας του 1980 λόγω της εξάπλωσης του AIDS και ταυτόχρονα της βελτίωσης των τεχνικών συστημάτων (ρευστοδυναμικών και οπτικών), των ηλεκτρονικών υπολογιστών και της τεχνολογίας παρασκευής και σήμανσης μονοκλωνικών αντισωμάτων. Το αποτέλεσμα είναι ότι σήμερα έχουν εγκατασταθεί περισσότεροι από κυτταρομετρητές ροής (Flow Cytometers) αλλά και κυτταροδιαχωριστές ροής (Cell Sorters) διεθνώς. Η κυτταρομετρία ροής αποτελεί μία τεχνική γρήγορη, ποσοτική, δυναμική και πολυπαραμετρική. Βασίζεται στην ανάλυση του κάθε κυττάρου ξεχωριστά. Σχεδιάστηκε για να ενισχύσει τη μικροσκοπική ανάλυση των κυττάρων με χρήση φθοριζόντων ιχνηθετών και υποστρωμάτων. Αν και αρχικά αναπτύχτηκε με κύριο σκοπό τον κυτταροδιαχωρισμό, σήμερα αποτελεί ένα διαγνωστικό εργαλείο στα κλινικά εργαστήρια αλλά και εξαιρετικά χρήσιμη τεχνική στα ερευνητικά εργαστήρια. Η κυτταρομετρία ροής αποτελεί μια ραγδαία εξελιγμένη τεχνική, που χρησιμοποιείται για να μετράει ταυτόχρονα και κατόπιν να αναλύει πολλαπλά φυσικά ή/και χημικά χαρακτηριστικά μικροσκοπικών σωματιδίων, συνήθως κυττάρων. Τις τελευταίες δεκαετίες, η χρηστική της αξία έχει εκτιμηθεί σημαντικά σε ποικίλες βιολογικές και ιατρικές εφαρμογές. Μια βασική εφαρμογή της αφορά την αιματολογία, στην οποία χρησιμοποιείται για το χαρακτηρισμό του ανοσοφαινότυπου δειγμάτων αίματος και συμβάλλει έτσι στη διάγνωση αιματολογικών κακοηθειών. Οι ιδιότητες που μετρούνται, σε μία εξέταση κυτταρομετρίας ροής, περιλαμβάνουν το σχετικό μέγεθος του κάθε σωματιδίου, τη σχετική εσωτερική πολυπλοκότητά του, καθώς και τη σχετική ένταση φθορισμού (fluorescence) του. Το φαινόμενο του φθορισμού μπορεί να προέλθει εξαιτίας των εκ φύσεως Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 42
43 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής φθοριζουσών συστατικών ενός σωματιδίου ή την επισύναψη σε αυτό κατάλληλων φθοριζουσών ουσιών. Η μέτρηση του φθορισμού χρησιμοποιείται, με κατάλληλη προεπεξεργασία του εκάστοτε εξεταζόμενου δείγματος και ανάλογα με τον τύπο των σωματιδίων, για την εξαγωγή ποιοτικών και ποσοτικών χαρακτηριστικών χρωμοσωμάτων, πρωτεϊνών (ενδοκυτταρικών ή δεσμευμένων στην κυτταρική μεμβράνη), αντιγόνων (ενδοκυτταρικών ή επί της κυτταρικής περιφέρειας), περιεχομένου DNA ή RNA, ενζυματικής δραστηριότητας και ph, μεταξύ άλλων. Κάθε σωματίδιο μεγέθους μm θεωρείται κατάλληλο για κυτταρομετρική ανάλυση. Στον κυτταρομετρητή ροής, τα σωματίδια βρίσκονται αιωρούμενα σε ένα υδροδυναμικά κατευθυνόμενο ρεύμα υγρού, το οποίο διέρχεται μέσω μιας δέσμης φωτός, συνήθως φωτός laser, ενός συγκεκριμένου μήκους κύματος. Όταν μια ακτίνα φωτός προσπίπτει σε ένα σωματίδιο, το φως σκεδάζεται ή απορροφάται. Στη δεύτερη περίπτωση, το απορροφημένο φως ενδέχεται να επανεκπεμφθεί με τη μορφή φθορισμού σε κάποιο άλλο μήκος κύματος. Ένα πλήθος από κατάλληλα τοποθετημένους φακούς στρέφονται προς το σημείο που το ρεύμα υγρού διέρχεται μέσω της δέσμης φωτός: ένας φακός κατά μήκος της κατεύθυνσης της δέσμης, που συλλέγει την πρόσθια σκέδαση φωτός (forward scatter - FS), και οι υπόλοιποι κάθετα σε αυτήν, εκ των οποίων ένας συλλέγει την πλάγια σκέδαση φωτός (side scatter - SS) και οι υπόλοιποι συλλέγουν φθορισμό σε διάφορα μήκη κύματος. Η ένταση της FS αντιστοιχεί στο σχετικό μέγεθος του σωματιδίου, ενώ η ένταση της SS εξαρτάται από τη σχετική εσωτερική πολυπλοκότητά του (όταν πρόκειται για κύτταρο, από το σχήμα του πυρήνα, το πλήθος των κυτταροπλασματικών κόκκων, την τραχύτητα της μεμβράνης, κλπ). Αφού συλλεχθούν το σκεδασμένο φως και ο φθορισμός, ανακατευθύνονται προς κατάλληλους ανιχνευτές, οι οποίοι παράγουν ηλεκτρονικά σήματα έντασης ανάλογης αυτής των οπτικών σημάτων που δέχονται. Στη συνέχεια, τα παραγόμενα ηλεκτρονικά σήματα υφίστανται επεξεργασία από μια ακολουθία από γραμμικούς και λογαριθμικούς ενισχυτές. Η λογαριθμική ενίσχυση πιο συχνά χρησιμοποιείται στη μέτρηση του φθορισμού, αλλά κάποιες φορές και για την επεξεργασία της SS. Αυτός ο τύπος ενίσχυσης διευρύνει την κλίμακα των χαμηλών σημάτων και συμπιέζει αυτή των υψηλών. Τα δεδομένα που προκύπτουν, αποθηκεύονται ως αρχεία υπολογιστή και μπορούν να 43 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
44 απεικονιστούν με τη μορφή διαγραμμάτων μίας ή πολλαπλών διαστάσεων, ώστε στη συνέχεια να αναλυθούν [FC1]. Ο ΚΥΤΤΑΡΟΜΕΤΡΗΤΗΣ ΡΟΗΣ Ένας κυτταρομετρητής ροής απαρτίζεται από τρία βασικά υποσυστήματα [FC2]: το σύστημα ρευστοδυναμικής, το οπτικό σύστημα και το ηλεκτρονικό σύστημα. Το σύστημα ρευστοδυναμικής μεταφέρει τα σωματίδια με τη μορφή ρεύματος υγρού προς τη δέσμη laser για ανάλυση. Το οπτικό σύστημα αποτελείται από lasers που εκπέμπουν φως προς τα σωματίδια και από οπτικά φίλτρα που κατευθύνουν τα προκύπτοντα σήματα φωτός προς τους κατάλληλους ανιχνευτές. Το ηλεκτρονικό σύστημα μετατρέπει τα σήματα φωτός σε ηλεκτρονικά σήματα, τα οποία μπορούν να υποστούν επεξεργασία σε έναν υπολογιστή. [flc Εικόνα 1] - Ο κυτταρομετρητής ροής. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 44
45 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΤΟ ΣΥΣΤΗΜΑ ΡΕΥΣΤΟΔΥΝΑΜΙΚΗΣ Για μία μέτρηση κυτταρομετρίας ροής απαιτείται αρχικά είναι το δείγμα (συνήθως ολικό αίμα) να βρίσκεται σε μορφή κυτταρικου εναιωρήματος. Στη συνέχεια προστίθενται το ή τα μονοκλωνικά αντισώματα που έχουν σημανθεί με τις κατάλληλες φθορίζουσες χρωστικές και το δείγμα υφίσταται κατεργασία, ανάλογα με τον προσδιορισμό, λεπτά συνήθως. Στόχος είναι τα αντισώματα να συνδεθούν στην επιφάνεια ή στο εσωτερικό των κυττάρων με τα αντίστοιχα αντιγόνα. Προϋπόθεση είναι τα κύτταρα να διέρχονται ένα-ένα μέσα από την κυψελίδα ροής και κατά συνέπεια και από το σημείο που συναντώνται με την προσπίπτουσα ακτινοβολία, γεγονός που επιτυγχάνεται μέσω της υδροδυναμικής εστίασης. Στην εικόνα 2, βλέπουμε την κυψελίδα ροής όπου υπάρχουν δυο ρεύματα: η κεντρική ροή του δείγματος, που ρυθμίζεται έτσι ώστε να είναι στρωτή και νηματική και η περιβάλλουσα ροή (sheath flow) που δεν αναμιγνύεται με το δείγμα. [flc Εικόνα 2] Το φαινόμενο της υδροδυναμικής εστίασης. 45 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
46 Αρχικά το δείγμα εισέρχεται υπό πίεση στο μικρό κανάλι, το οποίο βρίσκεται στο κέντρο ενός μεγαλύτερου κωνικού σωλήνα, τον οποίο διατρέχει ουδέτερο υγρό χαμηλότερης πίεσης. Η πίεση του δείγματος είναι πάντα μεγαλύτερη από την πίεση του υγρού. Ένας ρυθμιστής πίεσης ελέγχει το ρυθμό ροής του δείγματος με το να μεταβάλλει την πίεση του δείγματος σε σχέση με την πίεση του υγρού. Αύξηση της πίεσης του δείγματος προκαλεί αύξηση στο ρυθμό ροής. Αυτό επιτρέπει σε περισσότερα σωματίδια να διέρχονται μέσω του μικρού σωλήνα ανά μονάδα χρόνου. Οι υψηλότεροι ρυθμοί ροής είναι πιο κατάλληλοι για την παροχή μετρήσεων, οι οποίες θεωρούνται επαρκείς για το χαρακτηρισμό του ανοσοφαινότυπου δειγμάτων αίματος. Η ανάλυση των δεδομένων σε αυτές τις περιπτώσεις δεν είναι βέλτιστη, αλλά τα δεδομένα προκύπτουν με μεγάλη ταχύτητα. Οι χαμηλότεροι ρυθμοί είναι πιο κατάλληλοι για εφαρμογές στις οποίες απαιτείται μεγαλύτερη ακρίβεια, όπως στην ανάλυση DNA. Η διαφορά πίεσης και ταχύτητας ανάμεσα στα υγρά των δύο σωλήνων αναγκάζουν τα κύτταρα που εξέρχονται του μικρού σωλήνα να διαταχθούν σε σειρά (φαινόμενο υδροδυναμικής εστίασης). Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 46
47 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΤΟ ΟΠΤΙΚΟ ΣΥΣΤΗΜΑ [flc Εικόνα 3] Το σύστημα υδροδυναμικής εστίασης και η προσπίπτουσα ακτινοβολία. Το οπτικό σύστημα ενός κυτταρομετρητή ροής αποτελείται από το οπτικό σύστημα διέγερσης και το οπτικό σύστημα συλλογής. Το σύστημα διέγερσης περιλαμβάνει το laser και ένα πλήθος φακών, που χρησιμοποιούνται για να σχηματίσουν και να στοχεύσουν τη δέσμη laser. Το σύστημα συλλογής περιλαμβάνει φακούς συλλογής, οι οποίοι συλλέγουν το φως που εκπέμπεται από την αλληλεπίδραση των σωματιδίων με τη δέσμη laser, και ένα σύστημα από οπτικά φίλτρα, τα οποία χρησιμοποιούνται για να δρομολογήσουν συγκεκριμένα μήκη κύματος σε καθορισμένους οπτικούς ανιχνευτές. Οι παραπάνω λειτουργίες μπορούν και πραγματοποιούνται επιτυχώς χάρη στην ύπαρξη ενός οπτικού πάγκου, ο οποίος παρέχει μια ευσταθή επιφάνεια και διατηρεί την πηγή φωτός και τα συστήματα διέγερσης και συλλογής σε σταθερές θέσεις. 47 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
48 Εφόσον ένα σωματίδιο διέρχεται μέσω της δέσμης φωτός, η πλάγια σκέδαση φωτός και τα σήματα φθορισμού εκτρέπονται προς ένα σύνολο από λυχνίες φωτοπολλαπλασιασμού, ενώ μια φωτοδίοδος συλλέγει την πρόσθια σκέδαση φωτός. Η φωτοδίοδος αποτελεί μια συσκευή λιγότερο ευαίσθητη στα σήματα φωτός σε σχέση με τη λυχνία, οπότε και χρησιμοποιείται για τη συλλογή του ισχυρότερου από όλα τα προκύπτοντα οπτικά σήματα. Αντίθετα, οι λυχνίες συλλέγουν σήματα φθορισμού, τα οποία συνήθως είναι ασθενή. Όλα τα σήματα δρομολογούνται προς τους ανιχνευτές τους μέσω ενός συστήματος οπτικών φίλτρων. Η εξειδίκευση ενός ανιχνευτή ως προς ένα συγκεκριμένο μήκος κύματος βελτιστοποιείται με την τοποθέτηση ενός φίλτρου μπροστά από τη λυχνία, το οποίο επιτρέπει μόνο σε ένα στενό εύρος μηκών κύματος να φθάνει στον ανιχνευτή. Τέτοια φίλτρα καλούνται ζωνοπερατά φίλτρα. Άλλοι τύποι φίλτρων που χρησιμοποιούνται είναι τα βραχυπερατά φίλτρα, που επιτρέπουν μόνο τη διέλευση μηκών κύματος ίσων ή μικρότερων μιας συγκεκριμένης τιμής, και τα μακρυπερατά φίλτρα, τα οποία επιτρέπουν τη διέλευση μηκών κύματος τουλάχιστον ίσων μιας συγκεκριμένης τιμής. Ένας άλλος τύπος συσκευών που χρησιμοποιείται είναι οι διαχωριστές δέσμης, οι οποίοι διευθύνουν ακτίνες φωτός διαφορετικών μηκών κύματος προς διαφορετικές κατευθύνσεις. Οι διχρωματικοί καθρέφτες είναι τέτοιου τύπου συσκευές. ΤΟ ΗΛΕΚΤΡΟΝΙΚΟ ΣΥΣΤΗΜΑ Όταν τα οπτικά σήματα (σκέδασης φωτός ή φθορισμού) φθάνουν στους ανιχνευτές, μετατρέπονται σε έναν αριθμό ηλεκτρονίων ανάλογο της έντασής τους, τα οποία πολλαπλασιάζονται και παράγουν έτσι ένα ακόμα μεγαλύτερης έντασης ηλεκτρονικό ρεύμα. Το ρεύμα αυτό ταξιδεύει ως τον ενισχυτή και μετατρέπεται σε παλμό τάσης. Το υψηλότερο σημείο του παλμού συμβαίνει όταν το σωματίδιο βρίσκεται στο κέντρο της δέσμης φωτός, οπότε και επιτυγχάνεται και το μέγιστο ποσό σκέδασης φωτός ή φθορισμού. Καθώς το σωματίδιο απομακρύνεται από τη δέσμη φωτός, ο παλμός επιστρέφει στη χαμηλότερη τιμή του. Το μέγεθος της τάσης εξαρτάται από το πλήθος των φωτονίων που ανιχνεύτηκαν, την τάση της λυχνίας που τα ανίχνευσε και το κέρδος του ενισχυτή. Οι ρυθμίσεις του ενισχυτή μπορεί να είναι γραμμικές ή λογαριθμικές. Συνήθως, η λογαριθμική ενίσχυση εφαρμόζεται στις εντάσεις φθορισμού ή καμιά φορά και στην ένταση της πλάγιας σκέδασης. Πολλές φορές, ένα ηλεκτρονικό κατώφλι χρησιμοποιείται για να περιορίζει το πλήθος των Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 48
49 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής δεδομένων που καταγράφονται και να αποκλείει μη αποδεκτά δεδομένα. Τότε, οι ιδιότητες ενός σωματιδίου καταγράφονται, μόνο αν κάθε μία από τις προκύπτουσες τιμές τους είναι ίση ή μεγαλύτερη από την αντίστοιχη καθορισμένη τιμή κατωφλιού. [flc - Εικόνα 4] - Φακός Συλλογής 49 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
50 ΠΑΡΑΓΩΓΗ ΣΚΕΔΑΣΗΣ ΦΩΤΟΣ ΚΑΙ ΦΘΟΡΙΣΜΟΥ ΣΚΕΔΑΣΗ ΦΩΤΟΣ Η σκέδαση φωτός πραγματοποιείται όταν ένα σωματίδιο εκτρέπει μια προσπίπτουσα ακτίνα φωτός. Η έκταση στην οποία συμβαίνει αυτό εξαρτάται από κάποια φυσικά χαρακτηριστικά του σωματιδίου, συγκεκριμένα από το μέγεθος και την εσωτερική του πολυπλοκότητα. Παράγοντες που επηρεάζουν τη σκέδαση φωτός σε ένα κύτταρο είναι η μεμβράνη του, ο πυρήνας του, καθώς και κάθε κοκκώδες υλικό στο εσωτερικό του. Το σχήμα και η τοπογραφία του κυττάρου επίσης συμβάλλουν στη συνολική σκέδαση φωτός. Το φως που σκεδάζεται προς τα μπρος (forward scatter - FS) είναι ανάλογο με το εμβαδόν της επιφάνειας του κυττάρου ή το μέγεθός του. Η FS είναι μια μέτρηση που προκύπτει περισσότερο από το περιθλασμένο φως και ανιχνεύεται από μια φωτοδίοδο ακριβώς πάνω στον άξονα της πρόσθιας κατεύθυνσης της εισερχόμενης ακτίνας laser. Το φως που σκεδάζεται προς τα πλάγια (side scatter - SS) είναι ανάλογο της εσωτερικής πολυπλοκότητας του κυττάρου. Η SS αποτελεί μια μέτρηση που προκύπτει περισσότερο από το διαθλασμένο φως, το οποίο παράγεται σε οποιαδήποτε επιφάνεια στο εσωτερικό του κυττάρου που παρουσιάζει μεταβολή στο δείκτη διάθλασης. Μπορεί να συλλεχθεί από κατάλληλους φακούς τοποθετημένους περίπου κάθετα στον άξονα της πρόσθιας κατεύθυνσης της εισερχόμενης ακτίνας laser και να ανακατευθυνθεί στον κατάλληλο ανιχνευτή. [flc Εικόνα 5] - Ιδιότητες σκέδασης φωτός ενός κυττάρου. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 50
51 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Η ταυτόχρονη μέτρηση των FS και SS συχνά επιτρέπει τη διάκριση κυτταρικών τύπων σε έναν ετερογενή κυτταρικό πληθυσμό. Για παράδειγμα, οι βασικοί λευκοκυτταρικοί υποπληθυσμοί μπορούν να αναγνωριστούν με τη χρήση ενός διαγράμματος FS-SS. [flc Εικόνα 6] - Διάκριση βασικών υποπληθυσμών των λευκών αιμοσφαιρίων με βάση τις FS και SS. 51 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Αιματολογική Κλινική
52 ΦΘΟΡΙΣΜΟΣ Κάθε φθορίζουσα χημική ένωση, που αποκαλείται και φθορόχρωμα (fluorochrome), απορροφά φωτεινή ενέργεια σε κάποιο εύρος μηκών κύματος, το οποίο είναι χαρακτηριστικό για την ένωση αυτή. Η απορρόφηση αυτή αναγκάζει ένα ηλεκτρόνιο να ανυψωθεί σε κάποιο ανώτερο ενεργειακό επίπεδο. Το διεγερμένο ηλεκτρόνιο γρήγορα επανέρχεται στην αρχική του ενεργειακή κατάσταση, εκπέμποντας την ενέργεια διέγερσής του με τη μορφή φωτονίου. Αυτή η ενεργειακή μετάβαση καλείται φθορισμός. Το εύρος μηκών κύματος στο οποίο η φθορίζουσα ένωση διεγείρεται ονομάζεται φάσμα διέγερσης. Εφόσον περισσότερη ενέργεια καταναλώνεται στις μεταβάσεις διέγερσης από ότι εκπέμπεται στις μεταβάσεις εκπομπής, τα μήκη κύματος εκπομπής είναι μεγαλύτερα σε σχέση με τα μήκη κύματος διέγερσης. Το εύρος των μηκών κύματος εκπομπής μιας φθορίζουσας ένωσης καλείται φάσμα εκπομπής. Το laser ιόντος αργού (argon ion laser) χρησιμοποιείται συχνά στην κυτταρομετρία ροής, γιατί το φως των 488 nm που εκπέμπει μπορεί να διεγείρει περισσότερα από ένα φθοροχρώματα. Ένα από αυτά είναι η φθορίζουσα ισοθειοκυανίνη (fluorescein isothiocyanate - FITC). Στο φάσμα διέγερσης της FITC, η γραμμή των 488 nm είναι κοντά στο μέγιστο της απορρόφησης της FITC. Συνεπώς, η διέγερση σε αυτό το μήκος κύματος έχει ως αποτέλεσμα υψηλή εκπομπή από την FITC. Αν η FITC διεγερθεί σε ένα άλλο μήκος κύματος του φάσματος διέγερσής της, θα υπάρξει εκπομπή φωτός του ίδιου φάσματος, αλλά μικρότερης έντασης. Μπορούν να χρησιμοποιηθούν περισσότερα από ένα φθοροχρώματα ταυτόχρονα, αρκεί και τα υπόλοιπα να μπορούν να διεγερθούν στα 488 nm, αλλά τα μήκη κύματος μέγιστης εκπομπής τους να μην είναι πολύ κοντά το ένα στο άλλο. Η φυκοερυθρίνη (phycoerythrin - PE) σε συνδυασμό με την FITC ικανοποιεί αυτά τα κριτήρια. Παρά το γεγονός ότι η μέγιστη διέγερση της PE δεν επιτυγχάνεται στα 488 nm, η PE μπορεί να διεγερθεί επαρκώς στο μήκος κύματος αυτό, ώστε να προκύψει επαρκής ένταση φθορισμού προς ανίχνευση. Το κυριότερο όμως, το μήκος κύματος μέγιστης εκπομπής είναι 530 nm για την FITC και 570 nm για την PE. Αυτά τα μήκη κύματος είναι αρκετά απόμακρα μεταξύ τους, ώστε το κάθε σήμα φθορισμού να μπορεί να ανιχνευτεί από ξεχωριστό φακό. Η ποσότητα του σήματος φθορισμού που ανιχνεύεται είναι ανάλογη με το πλήθος των φθοροχρωματικών μορίων στο σωματίδιο. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 52
53 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής [flc Εικόνα 7] - Φάσματα φθορισμού (διέγερσης και εκπομπής) κοινά χρησιμοποιούμενων φθοροχρωμάτων. Μια φθορίζουσα χημική ένωση μπορεί να συνενωθεί με ένα μονοκλωνικό αντίσωμα και να χρησιμοποιηθεί για την ανίχνευση ενός συγκεκριμένου κυτταρικού τύπου, με βάση τους αντιγονικούς δείκτες επιφάνειας του κυττάρου. Σε έναν ετερογενή κυτταρικό πληθυσμό, πολλαπλά αντισώματα συνενωμένα με διαφορετικά φθοροχρώματα μπορούν να χρησιμοποιηθούν, για να διακριθούν οι επιμέρους υποπληθυσμοί. 53 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
54 [flc Εικόνα 8] - Σύνδεση φθοροχρωματισμένων αντισωμάτων με αντιγόνα κυτταρικής επιφάνειας. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 54
55 ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΕΙΣΑΓΩΓΗ Με τον όρο Βάση Δεδομένων στην Πληροφορική αναφερόμαστε σε μία δομημένη συλλογή από εγγραφές (records) ή δεδομένα (data) τα οποία βρίσκονται αποθηκευμένα σε ένα ηλεκτρονικό υπολογιστή [DB1]. Κάθε Βάση Δεδομένων βασίζεται σε συγκεκριμένο λογισμικό για την οργάνωση και αποθήκευση των δεδομένων. Η αρχιτεκτονική με την οποία κτίζεται μία Βάση Δεδομένων χαρακτηρίζει τη δομή της ή αλλιώς το «μοντέλο δεδομένων». Το πιο γνωστό και συχνά χρησιμοποιούμενο μοντέλο δεδομένων είναι το Σχεσιακό (relational model). Τα λογισμικά διαχείρισης Βάσεων Δεδομένων είναι γνωστά ως DBMS, Data Base Management Systems και κατηγοριοποιούνται ανάλογα με το μοντέλο δεδομένων που υποστηρίζουν. Για παράδειγμα τα λογισμικά που διαχειρίζονται σχεσιακές Βάσεις Δεδομένων ονομάζονται RDBMS, Relational Data Base Management Systems. Το μοντέλο των δεδομένων συνήθως προσδιορίζει και τη «γλώσσα ερωτημάτων» (query language) μέσω της οποίας επιτυγχάνεται η πρόσβαση στα δεδομένα. Αν και οι όροι «Βάση Δεδομένων» και «DBMS» αναφέρονται σε διαφορετικές έννοιες χρησιμοποιούνται καταχρηστικά, ακόμα και στη σχετική βιβλιογραφία, ο ένας στη θέση του άλλου. Ένα παράδειγμα DBMS είναι η εφαρμογή MS Access, ενώ ένα παράδειγμα Βάσης Δεδομένων είναι ο Ιατρικός Φάκελος. ΙΣΤΟΡΙΑ Ο όρος Βάση Δεδομένων (Data Base) χρησιμοποιήθηκε για πρώτη φορά τον Νοέμβριο του 1963 όταν η SDC (System Development Corporation, η πρώτη ουσιαστικά εταιρεία παραγωγής λογισμικού, με έδρα τη Σάντα Μόνικα της Καλιφόρνια) προώθησε τη διεξαγωγή ενός συμποσίου με τίτλο «Development and Management of a Computer-centered Data Base» [DB7]. Το πρώτο DBMS αναπτύχθηκε τη δεκαετία του Πρωτοπόρος στον χώρο ήταν ο Charles Bachman ο οποίος ξεκίνησε να ερευνά την πιο αποδοτική χρήση των νέων αποθηκευτικών μέσων, άμεσης πρόσβασης, που άρχισαν να Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 55
56 εμφανίζονται στις αρχές του Μέχρι τότε η διαχείριση των δεδομένων γίνονταν με διάτρητες κάρτες ή μαγνητικές ταινίες, με αποτέλεσμα η σειριακή ανάγνωση των δεδομένων να είναι μονόδρομος. Δύο βασικά μοντέλα δεδομένων δημιουργήθηκαν το 1960: Το δικτυακό μοντέλο (network model), βασισμένο στις ιδέες του Bachman, που ανάπτυξε η CODASYL και το ιεραρχικό μοντέλο (hierarchical model) το οποίο δημιουργήθηκε από την North American Rockwell και σύντομα υιοθετήθηκε από την IBM [DB11]. Οι δύο μεγαλύτερες Βάσεις Δεδομένων, ή πιο σωστά DBMS, που κυριάρχησαν τη δεκαετία του 1960, ήταν η IMS (Information Management System, που ανέπτυξε η IBM και βασίζεται στο ιεραρχικό μοντέλο) και η IDMS (Integrated Database Management System, που ανέπτυξε η CODASYL και ακολουθεί το δικτυακό μοντέλο). Αρκετές ακόμα Βάσεις Δεδομένων γεννήθηκαν την ίδια δεκαετία και εξακολουθούν να χρησιμοποιούνται ακόμα και σήμερα. Άξιες αναφοράς είναι η PICK και MUMPS, οι οποίες αρχικά αναπτύχθηκαν ως λειτουργικά συστήματα με ενσωματωμένα DBMS και αργότερα μετεξελίχθησαν σε πλατφόρμες ανάπτυξης για Βάσεις Δεδομένων με προσανατολισμό στον χώρο της Υγείας. Το σχεσιακά μοντέλο προτάθηκε από τον E. F. Codd το Η βασική κριτική του Codd στα υπάρχοντα μοντέλα ήταν ότι προκαλούν σύγχυση ανάμεσα στην ουσιαστική αναπαράσταση της πληροφορίας και την φυσική μορφή αποθήκευσης των δεδομένων. Για αρκετό διάστημα το σχεσιακό μοντέλο κινούσε μόνο το ακαδημαϊκό ενδιαφέρον, λόγω των απαιτήσεων που είχε για τεχνολογίες υλικού (hardware) και λογισμικού (software) και οι οποίες δεν ήταν διαθέσιμες στις αρχές της δεκαετίας του Παρά ταύτα τα συγκριτικά πλεονεκτήματα του σχεσιακού μοντέλου κράτησαν ζωντανή την θεωρητική ανάπτυξή του, με την ελπίδα ότι οι μελλοντικές τεχνολογικές εξελίξεις θα επιτρέψουν τη χρήση του σε περιβάλλοντα παραγωγής. Ανάμεσα στις πρώτες υλοποιήσεις του σχεσιακού μοντέλου συγκαταλέγεται η Ingres, που αναπτύχθηκε από τον Michael Stonebraker στο Πανεπιστήμιο του Berkeley και το έργο System R της IBM. Και οι δύο προσπάθειες αποτέλεσαν πρωτότυπες ερευνητικές εργασίες οι οποίες παρουσιάστηκαν το Τα πρώτα εμπορικά προϊόντα, βασισμένα στο σχεσιακό μοντέλο, με τις ονομασίες Oracle (Software Development Laboratories) και DB2 (IBM) εμφανίστηκαν στην αγορά το 1980 και αφορούσαν υπολογιστικά συστήματα μεγάλη ισχύος. Το πρώτο DBMS για προσωπικούς υπολογιστές (PC), διαθέσιμο στο ευρύ κοινό, ήταν η dbase για τα λειτουργικά συστήματα CP/M και PC-DOS/MS-DOS. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 56
57 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Τη δεκαετία του 1980 η ερευνητική δραστηριότητα επικεντρώθηκε στις κατανεμημένες Βάσεις Δεδομένων. Ένα σημαντικό θεωρητικό επίτευγμα της εποχής ήταν το λειτουργικό μοντέλο δεδομένων (Functional Data Model), αλλά η εφαρμογή του περιορίστηκε σε συγκεκριμένους τομείς της γενετικής, της μοριακής βιολογίας και την διερεύνηση οικονομικών εγκλημάτων με αποτέλεσμα να μην γίνει ποτέ ευρέως γνωστό. Τη δεκαετία 1990 το ερευνητικό ενδιαφέρον μετατοπίστηκε στις αντικειμενοστραφείς Βάσεις Δεδομένων (object-oriented databases). Οι αντικειμενοστραφείς Βάσεις είχαν μερική επιτυχία σε πεδία ενδιαφέροντος όπου υπήρχε η απαίτηση για ενασχόληση με πιο σύνθετα δεδομένα από αυτά που εύκολα μπορούσαν να διαχειριστούν οι σχεσιακές Βάσεις Δεδομένων. Παραδείγματα χώρων που επωφελήθηκαν από τις αντικειμενοστραφείς Βάσεις είναι τα γεωγραφικά πληροφοριακά συστήματα (GIS, spatial databases), οι εφαρμογές μηχανικής (π.χ. software repositories) και οι πολυμεσικές εφαρμογές. Ορισμένες από τις ιδέες που εισήγαγαν οι αντικειμενοστραφείς Βάσεις στη διαχείριση των δεδομένων υιοθετήθηκαν από τους κατασκευαστές των σχεσιακών Βάσεων και ενσωματώθηκαν στα προϊόντα τους. Τη δεκαετία του 1990 εμφανίστηκαν για πρώτη φορά DBMS ανοιχτού κώδικα όπως η PostgreSQL και MySQL. Τη δεκαετία του 2000 η «μόδα» στην καινοτομία της διαχείρισης δεδομένων είναι οι XML Βάσεις Δεδομένων (XML databases). Όπως συνέβη και με τα βασικά χαρακτηριστικά των αντικειμενοστραφών Βάσεων, οι εταιρείες ανάπτυξης σχεσιακών Βάσεων Δεδομένων υιοθέτησαν τις ιδέες κλειδιά του XML μοντέλου. 57 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
58 ΤΑ ΔΙΑΘΕΣΙΜΑ ΜΟΝΤΕΛΑ ΔΕΔΟΜΕΝΩΝ Υπάρχουν αρκετές μεθοδολογίες που χρησιμοποιούνται στη δόμηση των μοντέλων δεδομένων [DB10, DB14]. Τα περισσότερα συστήματα διαχείρισης Βάσεων Δεδομένων (DBMS) υποστηρίζουν ένα συγκεκριμένο μοντέλο, αν και συνεχώς αυξάνονται τα συστήματα που παρέχουν υποστήριξη για περισσότερα από ένα μοντέλα [DB6]. ΤΟ ΙΕΡΑΡΧΙΚΟ ΜΟΝΤΕΛΟ Σε ένα ιεραρχικό μοντέλο οι εγγραφές (records) οργανώνονται σε μία δενδρικού τύπου δομή, η οποία συνεπάγεται ένα μοναδικό προς τα επάνω σύνδεσμο (upward link) για κάθε κόμβο δεδομένων. Δηλαδή κάθε κόμβος μπορεί να έχει πολλά «παιδιά» (cοεπd nodes), αλλά μόνο ένα «γονέα» (parent node). Επιπλέον πληροφορίες αποθηκεύονται στους κόμβους κάθε επιπέδου με σκοπό την ταξινόμηση των εγγραφών. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 58
59 Ασθενείς Πανεπιστημιακό Νοσοκομείο Άγιος Ανδρέας Κατερίνα Γιώργος Γιώργος Μυρτώ Θεραπεί α Α Διεύθ. Α ΙKA Θεραπεί α B Διεύθ. Α TEBE Θεραπεί α B Διεύθ. Α TEB E Θεραπεί α Γ Διεύθ. Γ IKA Διάγραμμα σχεσιακού μοντέλου. Παρατηρείστε την επανάληψη της πληροφορίας (Ο κοινός ασθενής των δύο νοσοκομείων «Γιώργος», η «Διεύθυνση Α» που είναι κοινή με το συγγενικό του πρόσωπο «Κατερίνα» και οι φορείς ασφάλισης Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 59
60 ΤΟ ΔΙΚΤΥΑΚΟ ΜΟΝΤΕΛΟ Το δικτυακό μοντέλο αποθηκεύει τις εγγραφές σε κόμβους οι οποίοι διατηρούν συνδέσμους με όσους κόμβους σχετίζονται άμεσα. Δηλαδή κάθε κόμβος μπορεί να έχει πολλαπλά «παιδία» και «γονείς». Ασθενείς Πανεπιστ ημιακ ό Νοσοκομείο Άγιος Ανδρέας Γιώργος Θεραπεία Α Κατερίνα Διεύθ. Α Θεραπεία B IKA TEBE Θεραπεία Γ Μυρτώ Διεύθ. Γ Διάγραμμα δικτυακού μοντέλου. Παρατηρείστε ότι η επανάληψη της πληροφορίας μπορεί να αποφευχθεί σε σχέση με το ιεραρχικό μοντέλο, αλλά η πολυπλοκότητα των σχέσεων και η δυσκολία ανάγνωσης του γραφήματος αυξάνεται. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 60
61 Σύγκριση δικτυακού (αριστερά) και ιεραρχικού (δεξιά) μοντέλου 61 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
62 ΤΟ ΣΧΕΣΙΑΚΟ ΜΟΝΤΕΛΟ Η βασική δομή του σχεσιακού μοντέλου δεδομένων αναπαριστάται με ένα πίνακα στον οποίο αποθηκεύονται δεδομένα, σε στήλες και γραμμές, τα οποία αφορούν μία συγκεκριμένη οντότητα (π.χ. δημογραφικά στοιχεία ασθενών). Οι στήλες κάθε πίνακα απαριθμούν τα διαφορετικά χαρακτηριστικά της εκάστοτε οντότητας (π.χ. Αρ. Φακέλου, Ονοματεπώνυμο, Διεύθυνση, Τηλέφωνο, Φύλο, Ηλικία, Συνήθειες, κ.λ.), ενώ η κάθε γραμμή αποτυπώνει ένα συγκεκριμένο στιγμιότυπο της οντότητας (π.χ. 1524, Γιάννης Φαντομάς, Παναχαϊκού 28, , Άρρεν, 32, Μη καπνιστής). Με άλλα λόγια κάθε γραμμή του πίνακα των «δημογραφικών στοιχείων ασθενών» αντιπροσωπεύει διάφορα χαρακτηριστικά ενός συγκεκριμένου ασθενή. Όλοι οι πίνακες σε μία σχεσιακή Βάση Δεδομένων πρέπει να ακολουθούν ορισμένους βασικούς κανόνες, αξιώματα της μαθηματικής θεωρίας του σχεσιακού μοντέλου [DB8]: Πρώτον, η σειρά διάταξης των στηλών και γραμμών δεν επηρεάζει την περιγραφόμενη οντότητα. Δεύτερον, κάθε στήλη περιέχει ένα ενιαίο τύπο δεδομένων. Τρίτον, δεν πρέπει να υπάρχουν δύο πανομοιότυπες γραμμές σε ένα πινάκα. Και τέταρτον, κάθε γραμμή πρέπει να περιέχει μοναδικές τιμές για κάθε χαρακτηριστικό (στήλη) της. Το κάθε κελί, δηλαδή, δεν πρέπει να αποθηκεύει παρά μόνο μία τιμή. Οι παραπάνω κανόνες αν και δεν αποτελούν αναγκαίες συνθήκες, όσον αφορά τους περιορισμούς του εκάστοτε RDBMS, αυξάνουν δραματικά την απόδοση και στοιχειοθετούν τον ορισμό μίας σχεσιακής Βάσης Δεδομένων. Ως επί το πλείστον, κάθε Βάση περιέχει περισσότερους του ενός πίνακες, καθένας από τους οποίους ακολουθεί επίπεδη ιεραρχία (η σειρά των στηλών και γραμμών του δεν επηρεάζει την ποιότητα της πληροφορίας που αναπαριστούν τα δεδομένα του). Το δυνατό σημείο του σχεσιακού μοντέλου, εφόσον τηρούνται οι τέσσερις βασικοί κανόνες, είναι ότι οι τιμές που περιέχουν δύο διαφορετικές εγγραφές (γραμμές), του ιδίου ή διαφορετικών πινάκων, δημιουργούν και τη σχέση ανάμεσα στις δύο εγγραφές. Για παράδειγμα οι πίνακες των «δημογραφικών στοιχείων ασθενών» και των αναλυτικών αιματολογικών εξετάσεων: Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 62
63 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Αρ. Φ. Ονοματεπώνυμο Διεύθυνση Τηλέφωνο Φύλο Ημ. Γεν. Συνήθειες 1524 Γιάννης Φαντομάς Παναχαϊκού Άρρεν 1/1/1970 Μη καπνιστής 1525 Ελένη Ανυπάρχτου Πτολεμαίου Θήλυ 2/2/1954 Καπνιστής Αναστασία Ρίου Πάρου Θήλυ 3/3/1981 Καπνιστής Αρ. Φ. Ημ. HCT WBCC LDH PLT TKE /1/ /1/ /1/ /2/ /3/ είναι εμφανές ότι συνδέονται μέσω της στήλης «Αριθμός Φακέλου» και διαβάζοντας τον αριθμό φακέλου μίας αιματολογικές εξέτασης μπορούμε να ανατρέξουμε στα δημογραφικά στοιχεία ώστε να πληροφορηθούμε για τα στοιχεία του συγκεκριμένου ασθενή. Εν τούτοις, είναι δυνατόν να προκύψουν αρκετά προβλήματα ακεραιότητας δεδομένων (data integrity) όπως η δημιουργία πολλαπλών ασθενών με τον ίδιο αριθμό φακέλου και η καταχώρηση εξετάσεων σε ανύπαρκτους αριθμούς φακέλων. Αξίζει να σημειωθεί ότι κανένα από τα δύο προβλήματα που αναφέρονται ως παράδειγμα δεν παραβιάζουν τους βασικούς κανόνες του σχεσιακού μοντέλου δεδομένων. Για να είναι δυνατή η καλύτερη τήρηση της ακεραιότητας των δεδομένων οι σχεσιακές Βάσεις επιτρέπουν τη δημιουργία κανόνων οι οποίοι επιβάλουν αυστηρότερες σχέσεις ανάμεσα στους πίνακες. Η πρώτη κατηγορία κανόνων είναι τα πρωτοβάθμια κλειδιά (primary keys), όπου μία στήλη ή μία ομάδα στηλών αποτελούν το μοναδικό χαρακτηριστικό κάθε γραμμής και δεν επιτρέπουν τη δημιουργία δύο γραμμών με πανομοιότυπες τιμές στις στήλες κλειδιά. Στον πίνακα με τα «δημογραφικά στοιχεία ασθενών» η στήλη κλειδί είναι ο «αριθμός φακέλου», δεδομένου ότι δεν θέλουμε να επιτρέψουμε σε καμία περίπτωση την καταχώρηση δύο ασθενών με τον ίδιο αριθμό φακέλου. Στον πίνακα με τις αναλυτικές αιματολογικές εξετάσεις το ρόλο του κλειδιού θα μπορούσαν να παίξουν, συνδυαστικά, οι στήλες «αριθμός φακέλου» και «ημερομηνία» (στην περίπτωση που δεν θέλουμε να 63 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
64 δημιουργηθούν πολλαπλές εγγραφές για τον ίδιο ασθενή σε συγκεκριμένη ημερομηνία). Η δεύτερη κατηγορία κανόνων είναι οι συγγένειες τύπου «γονέα - παιδιού» (parent-cοεπd relations) μεταξύ στηλών δύο πινάκων. Οι στήλες που συμμετέχουν σε μία σχέση «γονέα - παιδιού» πρέπει να αποθηκεύουν ακριβώς τον ίδιο τύπο δεδομένων. Αν ο κανόνας συγγένειας περιλαμβάνει μόνο το πρωτοβάθμιο κλειδί του γονικού πίνακα και την αντίστοιχη στήλη ή στήλες του πίνακα παιδιού ονομάζεται σχέση «πρωτοβάθμιου δευτεροβαθμίου κλειδιού» (primary foreign key relation). Η στήλη ή στήλες που συμμετέχουν στον κανόνα από τη πλευρά του πινάκα παιδιού χαρακτηρίζονται ως δευτεροβάθμιο κλειδί (foreign key) και για να αποκτήσουν μία τιμή πρέπει αυτή να προϋπάρχει στην αντίστοιχη στήλη ή στήλες του γονικού πίνακα. Οι σχέσεις συγγένειας αναλυτικά: Ένα προς ένα (1:1), δηλαδή κάθε γραμμή του γονικού πίνακα μπορεί να αντιστοιχισθεί σε μία και μόνο μία γραμμή του πίνακα παιδιού και αντιστρόφως. Για παράδειγμα ο πίνακας δημογραφικών στοιχείων ασθενών και ο πίνακας που αποθηκεύει διαχρονικά τη μέση τιμή των αιματολογικών εξετάσεων. Και οι δύο πίνακες περιέχουν το πολύ μια γραμμή για κάθε ασθενή και συνδέονται μέσω της στήλης «Αριθμός Φακέλου». Γονικός πίνακας είναι τα «δημογραφικά στοιχεία ασθενών» με αποτέλεσμα να μην είναι δυνατή η συμπλήρωση αριθμού φακέλου στον πίνακα μέσων τιμών αν ο αριθμός αυτός δεν προϋπάρχει στον πίνακα δημογραφικών στοιχείων. Αρ. Φ. HCT WBCC LDH PLT TKE , , ,7 33, Πίνακας μέσων τιμών αιματολογικών εξετάσεων Ένα προς πολλά (1:Μ), δηλαδή κάθε γραμμή του γονικού πίνακα μπορεί να αντιστοιχισθεί σε πολλές γραμμές του πίνακα παιδιού, αλλά μία γραμμή του πίνακα παιδιού αντιστοιχεί σε μόνο μία γραμμή του γονικού πίνακα. Για παράδειγμα ο πίνακας «δημογραφικών στοιχείων ασθενών» και ο πίνακας που αποθηκεύει τις αναλυτικές τιμές των «αιματολογικών εξετάσεων». Ο Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 64
65 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής πρώτος πίνακας περιέχει μία, μοναδική, γραμμή για κάθε ασθενή, ενώ ο δεύτερος μία γραμμή για κάθε εξέταση του ασθενή. Η σύνδεση γίνεται πάλι μέσω της στήλης «Αριθμός Φακέλου». Γονικός πίνακας είναι τα «δημογραφικά στοιχεία ασθενών» με αποτέλεσμα να μην είναι δυνατή η καταχώρηση αιματολογικής εξέτασης σε ασθενή με ανύπαρκτο φάκελο. Πολλά προς πολλά (Μ:Μ), δηλαδή κάθε γραμμή του γονικού πίνακα μπορεί να αντιστοιχισθεί σε πολλές γραμμές του πίνακα παιδιού και αντιστρόφως. Παράδειγμα αποτελούν οι αναλυτικοί πίνακες των αιματολογικών και ουρολογικών εξετάσεων. Οι σχέσεις των πινάκων, είτε πηγάζουν από τη δομή των δεδομένων είτε επιβάλλονται από κανόνες [DB5]. Περιγράφουν τον τρόπο σύνδεσης διαφορετικών οντοτήτων, οι οποίες συνδυαστικά δημιουργούν λογικούς πίνακες που με τη σειρά τους περιγράφουν πιο σύνθετες οντότητες. Π.χ. ο πίνακας των δημογραφικών στοιχείων σε συνδυασμό με τον πίνακα των αιματολογικών εξετάσεων και τον πίνακα των ουρολογικών εξετάσεων περιγράφουν, εν μέρει, την κατάσταση του ασθενούς. Οδηγούν δε σε συμπεράσματα που κανείς από τους τρεις πίνακες δεν μπορεί να περιγράψει αυτόνομα. ΣΧΕΣΙΑΚΕΣ ΠΡΑΞΕΙΣ Η αναζήτηση δεδομένων σε μία σχεσιακή Βάση πραγματοποιείται με την αποστολή ερωτημάτων [DB9, DB12]]. Τα ερωτήματα αυτά είναι γραμμένα σε μία ειδική γλώσσα η οποία αρχικά ονομάστηκε SeQuel Language και στη συνέχεια Structured Query Language (SQL). Αν και η SQL απευθυνόταν αρχικά στους τελικούς χρήστες όλο και πιο συχνά αντικαθίσταται από υψηλού επιπέδου εφαρμογές οι οποίες αναλαμβάνουν τη σύνταξη των SQL ερωτημάτων για λογαριασμό του χρήστη. Οι περισσότερες web εφαρμογές εκτελούν ερωτήματα SQL για να δημιουργήσουν το περιεχόμενο των σελίδων τους, ανάλογα με τις επιλογές των επισκεπτών τους. Όταν ο επισκέπτης της Wikipedia αναζητήσει ένα άρθρο, χρησιμοποιώντας λέξεις-κλειδιά, το πληροφοριακό σύστημα του οργανισμού αναλαμβάνει να συντάξει το σχετικό ερώτημα, να το αποστείλει στη βάση δεδομένων, να μορφοποιήσει και να εμφανίσει τα αποτελέσματα στην οθόνη. Η βασική εντολή της SQL είναι η «SELECT» (επιλογή) με την οποίο κτίζονται όλα τα ερωτήματα ανάκτησης δεδομένων [DB4]. Η σύνταξη της εντολής «SELECT», στην απλή της μορφή, έχει ως εξής: 65 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
66 SELECT Στήλη1, Στήλη5, Στήλη3, (ονόματα στηλών χωρισμένα με κόμμα ή το σύμβολο * για εμφάνιση όλων των στηλών) FROM Πίνακας1 (το όνομα του πίνακα που περιέχεις τις εγγραφές που αναζητούμε) WHERE Στήλη1 = 1528 and Στήλη3 > 1/1/1980 and... (οι συνθήκες που πρέπει να ικανοποιούν οι προς ανάκτηση εγγραφές) ORDER BY Στήλη1 ASC (η στήλη βάσει της οποίας θα ταξινομηθούν τα αποτελέσματα, με αύξουσα ASC ή φθίνουσα DESC σειρά). Παραδείγματα ερωτημάτων με χρήση της εντολής SELECT: Επιλογή όλων των πεδίων (στηλών) και όλων των εγγραφών (γραμμών) του πίνακα «Ασθενείς» SELECT * FROM Ασθενείς; Επιλογή όλων των πεδίων, των ασθενών που γεννήθηκαν μετά το 1979 SELECT * FROM Ασθενείς WHERE [Ημ. Γεν.] > 31/12/1979 Επιλογή «αριθμού φακέλου», «ονοματεπώνυμου» και «ηλικίας» των ασθενών που γεννήθηκαν μετά το 1979 και ταξινόμηση των εγγραφών βάσει του «ονοματεπώνυμου» SELECT [Αρ. Φ.], Ονοματεπώνυμο, [Ημ. Γεν.] FROM Ασθενείς WHERE [Ημ. Γεν.] > 31/12/1979 ORDER BY Ονοματεπώνυμο ASC Επιλογή «αριθμού φακέλου», «ονοματεπώνυμου» και «ηλικίας» των ασθενών το «ονοματεπώνυμο» των οποίων περιέχει τον όρο «Γιάννης», γεννήθηκαν μετά το 1979 και ταξινόμηση των εγγραφών βάσει του «ονοματεπώνυμου», με φθίνουσα σειρά SELECT [Αρ. Φ.], Ονοματεπώνυμο, [Ημ. Γεν.] FROM Ασθενείς WHERE [Ημ. Γεν.] > 31/12/1979 AND Ονοματεπώνυμο LIKE *Γιάννης* ORDER BY Ονοματεπώνυμο DESC Σημείωση ο χαρακτήρας *, στη σύνταξη της πράξης LIKE, χρησιμοποιείτε για την αναζήτηση κείμενου που δεν είναι εκ των προτέρων γνωστό. *Γιάννης * = εμπεριέχει τον όρο «Γιάννης», Γιάννης * = αρχίζει με τον όρο «Γιάννης» και *Γιάννης = τελειώνει με τον όρο «Γιάννης». Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 66
67 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΤΟ ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΑΦΕΣ ΜΟΝΤΕΛΟ Σχετικά πρόσφατα το αντικειμενοστραφές μοντέλο εφαρμόστηκε στο πεδίο των Βάσεων Δεδομένων. Οι αντικειμενοστραφείς Βάσεις προσπαθούν να μειώσουν την απόσταση που χωρίζει τον χώρο των εφαρμογών από αυτόν των Βάσεων Δεδομένων. Συγκεκριμένα ενοποιούν τους τύπους των δεδομένων που αποθηκεύονται σε μία Βάση με τους τύπους των δεδομένων που απεικονίζουν οι εφαρμογές, οι οποίες αντλούν πληροφορίες από τη Βάση. Με τον τρόπο αυτό αποφεύγεται το επιπρόσθετο κόστος της μετατροπής της αποθηκευμένης πληροφορίας (γραμμές πίνακα) στα αντικείμενα που απεικονίζουν οι εφαρμογές. Με άλλα λόγια μία ιατρική εικόνα αποθηκεύεται σε μία αντικειμενοστραφή Βάση Δεδομένων με την ίδια μορφοποίηση (π.χ. TIFF ή DICOM) που απαιτεί η εφαρμογή μέσω της οποίας θα προβάλουμε την εικόνα. Τέλος οι αντικειμενοστραφείς Βάσεις εισάγουν τις βασικές ιδέες του αντικειμενοστραφούς προγραμματισμού, όπως η ενθυλάκωση και ο πολυμορφισμός. 67 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
68 Η ΜΗΧΑΝΙΚΗ ΤΩΝ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΑΠΟΘΗΚΕΥΤΙΚΟΙ ΧΩΡΟΙ ΚΑΙ ΦΥΣΙΚΗ ΔΟΜΗ Οι πίνακες και γενικότερα τα στοιχεία των Βάσεων Δεδομένων συνήθως αποθηκεύονται σε σκληρούς δίσκους και καταλαμβάνουν μεγάλο τμήμα της κύριας μνήμης κατά τη διάρκεια λειτουργίας τους. Οι συνήθεις φυσικές δομές που ακολουθούν τα αρχεία αποθήκευσης δεδομένων μίας Βάσης είναι: ταξινομημένα ή μη αρχεία επίπεδης ιεραρχίας, ISAM, Σοροί (Heaps), Hash Buckets και B+ Trees. Η επιλογή της εκάστοτε δομής γίνεται από το DBMS με πιο διαδεδομένες τα Β+ δέντρα και τη μέθοδο ISAM (Indexed Sequential Access Method) [DB2]. Άλλες σημαντικές σχεδιαστικές επιλογές που αφορούν στη φυσική δομή μίας Βάσης Δεδομένων είναι η ομαδοποίηση συναφών δεδομένων (clustering), η δημιουργία προ-επεξεργασμένων προβολών (views) και η τμηματοποίηση δεδομένων βάσει εύρους τιμών (partitioning) [DB3]. Όλες οι τεχνικές που περιγράφονται στις προηγούμενες δύο παραγράφους αφορούν «εσωτερικές» λειτουργίες των Βάσεων Δεδομένων, για την βελτιστοποίηση των λειτουργιών τους και σε καμία περίπτωση δεν έχουν αλληλεπίδραση με τον τελικό χρήστη. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 68
69 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΔΕΙΚΤΟΔΟΤΗΣΗ (INDEXING) Κάθε Βάση Δεδομένων, ασχέτως του μοντέλου με το οποίο έχει δομηθεί, χρησιμοποιεί τεχνικές δεικτοδότησης για να αυξήσει την απόδοσή της. Η ανάγκη ύπαρξης δεικτών πηγάζει από τον τρόπο με τον οποίο αποθηκεύονται οι εγγραφές σε μία Βάση Δεδομένων. Για να είναι σε θέση να δέχονται μεγάλο αριθμό νέων εγγραφών και τροποποιήσεων σε σύντομο χρονικό διάστημα (το ρεκόρ εξυπηρέτησης αιτημάτων είναι αιτήματα το λεπτό) τα περισσότερα DBMS δεν δαπανούν πόρους κατά τη δημιουργία νέων εγγραφών και αποθηκεύουν τα δεδομένα με σειριακό τρόπο: Αρ. Φ. Ονοματεπώνυμο Διεύθυνση Τηλέφωνο Φύλο Ημ. Γεν. Συνήθειες 1524 Γιάννης Φαντομάς Παναχαϊκού Άρρεν 1/1/1970 Μη καπνιστής 1525 Ελένη Ανυπάρχτου Πτολεμαίου Θήλυ 2/2/1954 Καπνιστής 1522 Βράχος Γιαλός Πάρου Άρρεν 3/3/1981 Καπνιστής 1411 Πέτρος Βουνός Νάξου Άρρεν 4/4/1964 Μη καπνιστής 2480 Αναστασία Ρίου Σύρου Θήλυ 5/5/1990 Καπνιστής Στη συνέχεια για να επιταχύνουν τη διαδικασία αναζήτησης και ανάκτησης δεδομένων δημιουργούν «δείκτες», με τις στήλες που χρησιμοποιούνται συχνότερα στις αναζητήσεις. 69 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
70 Αρ. Φ. Αρ. Γραμμής Ονοματεπώνυμο Αρ. Γραμμής Αναστασία Ρίου Βράχος Γιαλός Γιάννης Φαντομάς Ελένη Ανυπάρχτου Πέτρος Βουνός 4 Παράδειγμα «δείκτη» για τη στήλη «Αρ. Φ.» Παράδειγμα «δείκτη» για τη στήλη «Ονοματεπώνυμο» Στο παραπάνω παράδειγμα η αναζήτηση για το «Φάκελο» 1522 θα γίνει στο «δείκτη» με τους ταξινομημένους αριθμούς φακέλων και όχι στα πραγματικά δεδομένα. Στο δεύτερο βήμα της αναζήτησης θα βρεθεί η θέση του φακέλου (γραμμή 3) και στη συνέχεια θα ανακτηθούν τα δεδομένα από το φυσικό χώρο αποθήκευσης. Με την ίδια λογική η αναζήτηση του ονόματος «Αβραάμ» θα γίνει στο «δείκτη» της στήλης «Ονοματεπώνυμο» και δεδομένου ότι είναι ταξινομημένη αλφαβητικά θα τερματίσει (χωρίς αποτέλεσμα) μετά το πρώτο βήμα (αφού Αβραάμ < Αναστασία). Η μέθοδος δεικτοδότησης της ταξινομημένης στήλης, που μόλις περιγράψαμε, είναι η πιο γνώστη, αλλά έχει πλέον ξεπεραστεί τεχνολογικά από μεθόδους δεικτοδότησης που επιτυγχάνουν σαφώς ταχύτερες αναζητήσεις. Οι πιο συχνά χρησιμοποιούμενες μεθοδολογίες «δεικτών» είναι τα δυαδικά δέντρα (B-Trees) και οι πίνακες Hash. Συνοψίζοντας, οι δείκτες αποτελούν ευέλικτες δομές οι οποίες δημιουργούνται για τις στήλες βάσει των οποίον αναζητάμε συνήθως τις εγγραφές ενός πίνακα και δεικτοδοτούν την φυσική θέση (συνήθως ο αριθμός της γραμμής) στην οποία βρίσκονται αποθηκευμένες οι εκάστοτε εγγραφές. Τα μειονεκτήματα της χρήσης «δεικτών» για τη βελτίωση της απόδοσης μίας Βάσης Δεδομένων είναι τρία: Η αύξηση του αποθηκευτικού χώρου για την ίδια ποσότητα δεδομένων (χώρος αποθήκευσης πίνακα + χώρος αποθήκευσης «δείκτη»). Η μείωση της ελεύθερης μνήμης του συστήματος, δεδομένου ότι κατά την λειτουργία μίας Βάσης μεγάλο μέρος των «δεικτών» της μεταφέρονται στην κύρια μνήμη. Τέλος η καθυστέρηση που επιφέρει ο συνυπολογισμός του «δείκτη» όταν δημιουργείται μία νέα εγγραφή ή τροποποιείται μία παλιά. Οι συνέπειες της υπερβολικής χρήσης «δεικτών» οδηγούν σε μείωση, αντί για αύξηση, της απόδοσης μίας Βάσης Δεδομένων και για το λόγο αυτό πρέπει να Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 70
71 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής χρησιμοποιούνται κατόπιν ανάλυσης και για την κάλυψη συγκεκριμένων αναγκών. Τα «πρωτοβάθμια Κλειδιά», εκτός των λειτουργιών που περιγράφηκαν σε προηγούμενη ενότητα, αποτελούν και «δείκτη» για την στήλη ή τις στήλες με τις οποίες δημιουργήθηκαν («πρωτοβάθμιο κλειδί» = δείκτης + περιορισμός για μοναδικές εγγραφές). ΣΥΝΑΛΛΑΓΕΣ & ΠΑΡΑΛΛΗΛΙΣΜΟΣ (TRANSACTIONS & CONCURRENCY) Με τον όρο «συναλλαγή» αναφερόμαστε σε μία δέσμη από εντολές, οι οποίες επελέγησαν αυθαίρετα από το χρήστη και πρέπει να αντιμετωπιστούν σαν μία ενιαία διεργασία. Για παράδειγμα η ακολουθία των εντολών: Διέγραψε τους ασθενείς με ημερομηνία γέννησης νεότερη της «1/1/1980»; Εμφάνισε τη μέση ηλικία των ασθενών; αποτελεί μία συναλλαγή. Συναλλαγή θα μπορούσε να αποτελέσει, επίσης, κάθε εντολή από μόνη της ή μία μεγαλύτερη ακολουθία εντολών. Εναπόκειται αποκλειστικά στην ομαδοποίηση που θα ορίσει ο χρήστης για να σημάνει τον τρόπο με τον οποίο θα εκτελεστούν οι εντολές. Οι περισσότερες συναλλακτικές Βάσεις Δεδομένων (transactional databases) προσπαθούν να επιβάλουν τους κανόνες του μοντέλου ACID (Atomicity, Consistency, Isolation, Durability) στις εντολές των χρηστών και στον τρόπο με τον οποίο αυτές εκτελούνται. Ακολουθούν οι κανόνες του μοντέλου ACID που διέπουν τις συναλλαγές στις Βάσεις Δεδομένων: ΑΤΟΜΙΚΟΤΗΤΑ (ATOMICITY) Είτε όλες οι εντολές μίας συναλλαγής (transaction) πρέπει να εκτελεστούν με επιτυχία είτε δεν πρέπει να εκτελεστεί καμία εντολή. Σε περίπτωση που κάποια από τις εντολές μίας συναλλαγής αποτύχει πρέπει να υπάρχει η δυνατότητα επαναφοράς (rollback) της Βάσης στην κατάσταση την οποία βρισκόταν πριν από την εκτέλεση της συναλλαγής. Σε αντίθετη περίπτωση τα δεδομένα θα βρεθούν σε τυχαία κατάσταση (π.χ. η μερική ολοκλήρωση μίας εντολής διαγραφής). 71 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
72 ΣΥΝΕΠΕΙΑ (CONSISTENCY) Κάθε συναλλαγή πρέπει να τηρεί όλους τους κανόνες και περιορισμούς που έχουν τεθεί κατά τη δημιουργία των πινάκων και των μεταξύ τους σχέσεων (πρωτοβάθμια δευτεροβάθμια κλειδιά, μήκη πεδίων, τύποι δεδομένων, μοναδικές ή όχι τιμές κ.λ.). ΑΠΟΜΟΝΩΣΗ (ISOLATION) Δύο συναλλαγές που εκτελούνται ταυτόχρονα δεν πρέπει να παρεμβαίνουν, με κανένα τρόπο, η μία στην άλλη (π.χ. να τροποποιούν κοινά δεδομένα). Τα ενδιάμεσα αποτελέσματα μίας συναλλαγής δεν είναι ορατά στις υπόλοιπες συναλλαγές. ΑΝΤΟΧΗ (DURABILITY) Οι συναλλαγές που ολοκληρώνονται επιτυχώς δεν είναι δυνατό να ακυρωθούν. Τα αποτελέσματα των επιτυχών συναλλαγών πρέπει να διατηρούνται ακόμα και στην περίπτωση θεμιτής ή αθέμιτης επανεκκίνησης του DBMS. Στην πράξη τα περισσότερα DBMS επιτρέπουν την επιλεκτική χαλάρωση των κανόνων ACID με σκοπό την αύξηση της απόδοσης. ΠΑΡΑΛΛΗΛΙΣΜΟΣ Ο έλεγχος των παράλληλων πράξεων που εκτελούνται σε μία Βάση Δεδομένων αποσκοπεί στην ασφαλή εκτέλεση των συναλλαγών και την τήρηση των κανόνων ACID [DB13]. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 72
73 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΠΑΡΑΔΕΙΓΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ 4D ADABAS Alpha Five Apache Derby (Java, also known as IBM Cloudscape and Sun Java DB) BerkeleyDB CSQL dbase FileMaker Firebird (database server) Hsqldb (Java) IBM DB2 IBM IMS (Information Management System) IBM UniVerse Informix Ingres Interbase MaxDB (formerly SapDB) Microsoft Access Microsoft SQL Server Model 204 MySQL Nomad Objectivity/DB OpenLink Virtuoso OpenOffice.org Base Oracle Database Paradox (database) PostgreSQL Progress 4GL RDM Embedded ScimoreDB SQLite Superbase Sybase Teradata Visual FoxPro 73 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
74 ΤΕΧΝΙΚΕΣ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΕΙΣΑΓΩΓΗ Εξόρυξη δεδομένων (data mining) [DM21], γενικά, καλείται η διαδικασία της αυτόματης εξαγωγής χρήσιμης, μα όχι τόσο προφανούς, γνώσης από τεράστια σύνολα δεδομένων. Η σημασία της όλο και αυξάνεται, καθώς το πλήθος των δεδομένων που παράγονται συνεχώς μεγαλώνει. Με τη χρήση τεχνικών εξόρυξης δεδομένων μπορεί να προσδιοριστεί η δομή των δεδομένων, με αποτέλεσμα την αναγνώριση ενδιαφερόντων, χρήσιμων και προηγουμένως άγνωστων προτύπων, στατιστικών ή προγνωστικών μοντέλων και συσχετίσεων ανάμεσα στα συστατικά των δεδομένων. Επιπλέον, η παρεχόμενη πληροφορία μπορεί να χρησιμοποιηθεί για μελλοντικές προβλέψεις. Συγκεκριμένα, οι διαδικασίες της εξόρυξης δεδομένων κατηγοριοποιούνται σε περιγραφικές και προγνωστικές. Οι περιγραφικές διαδικασίες εξόρυξης χαρακτηρίζουν τις γενικές ιδιότητες των δεδομένων. Τέτοιες διαδικασίες είναι η εξερεύνηση κανόνων συσχετίσεων (association rule discovery), η ακολουθιακή ανακάλυψη προτύπων (sequential pattern discovery) και η συσταδοποίηση (clustering). Οι προγνωστικές διαδικασίες εξόρυξης εξάγουν συμπεράσματα με βάση τα τρέχοντα δεδομένα για μελλοντικές προβλέψεις. Τέτοιες διαδικασίες είναι η ταξινόμηση (classification), η παλινδρόμηση (regression) και η ανίχνευση απόκλισης (deviation detection). Τεχνικές εξόρυξης δεδομένων έχουν εφαρμοστεί επιτυχώς σε πολλές περιοχές, από τις επιχειρήσεις και την επιστήμη ως τον αθλητισμό. Ποικίλες εφαρμογές αφορούν την ιατρική, τη μοριακή βιολογία, την αστρονομία, τη γεωλογία και άλλα επιστημονικά πεδία. Στο κεφάλαιο αυτό περιγράφονται οι βασικές αρχές δύο συχνά χρησιμοποιούμενων διαδικασιών εξόρυξης δεδομένων, της ταξινόμησης και της συσταδοποίησης. Η ταξινόμηση είναι ένα πρόβλημα ανάλυσης δεδομένων που εφαρμόζεται άμεσα στα δεδομένα που πραγματεύεται η παρούσα διατριβή. Ζητείται να εκπαιδευθεί μοντέλο, το οποίο να απεικονίζει ένα σύνολο γνωρισμάτων (για παράδειγμα, τις τιμές των κλινικών μεταβλητών) της κάθε οντότητας (για παράδειγμα, του κάθε ασθενή Β-ΧΛΛ) που περιγράφεται στα δεδομένα, σε μια τιμή ενός ειδικού γνωρίσματος, που καλείται κλάση και χρησιμοποιείται για να κατηγοριοποιεί τις οντότητες αυτές (για παράδειγμα, τη μεταβλητή επιβίωσης ή το στάδιο στη διάγνωση). Το μοντέλο αυτό θα είναι εν συνεχεία σε θέση να προβλέπει την κλάση μιας νέας οντότητας με γνωστά Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 74
75 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής γνωρίσματα. Η συσταδοποίηση αποτελεί ένα αντίστοιχο πρόβλημα ανάλυσης δεδομένων, στο οποίο όμως οι τιμές του γνωρίσματος κλάσης δεν είναι εκ των προτέρων γνωστές. Στην περίπτωση αυτή, οι οντότητες κατηγοριοποιούνται με φυσικό τρόπο από τα γνωρίσματά τους σε συστάδες. Εν συνεχεία, παρουσιάζονται οι βασικές αρχές μιας χρήσιμης μεθόδου προεπεξεργασίας δεδομένων, που καλείται επιλογή γνωρισμάτων. Η τεχνική αυτή μπορεί να εφαρμοστεί πριν από κάθε διαδικασία εξόρυξης δεδομένων για να απομακρύνει τυχόν πλεονάζοντα, άσχετα ή θορυβώδη γνωρίσματα, βελτιώνοντας έτσι την απόδοση και την ταχύτητα της διαδικασίας. Τέλος, για κάθε μία από αυτές τις διαδικασίες, δίνεται έμφαση σε τεχνικές που αξιοποιούν το νόμο του Bayes και στηρίζονται στη Bayesian φιλοσοφία. Αυτού του τύπου οι τεχνικές θεωρείται παραδοσιακά ότι παρέχουν με βέλτιστο τρόπο τη δυνατότητα ενσωμάτωσης έμπειρης γνώσης σε αυτοματοποιημένες αλγοριθμικές διαδικασίες. Ως συνέπεια, βρίσκουν εξαιρετικά πεδία εφαρμογής στη εξόρυξη ιατρικών δεδομένων, όπου η έμπειρη γνώση του εκάστοτε ειδικού διαδραματίζει εξίσου σημαντικό ρόλο με αυτή των υπαρχόντων δεδομένων στην εκμάθηση μοντέλων πρόγνωσης και διάγνωσης. Στην ανάλυση των δεδομένων που πραγματεύεται η παρούσα διατριβή, τεχνικές που βασίζονται στη Bayesian λογική αναμένεται να διαδραματίσουν κυρίαρχο ρόλο. 75 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
76 ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ ΤΑΞΙΝΟΜΗΣΗ Τα δεδομένα εισόδου ενός προβλήματος ταξινόμησης (classification) περιγράφουν ένα σύνολο από οντότητες (entities). Κάθε οντότητα i χαρακτηρίζεται από ένα διάνυσμα γνωρισμάτων (attributes) x i = ( xi 1, xi 2,..., xin) και από την τιμή ενός ειδικού γνωρίσματος ci, που καλείται κατηγορία ή κλάση (class). Οι τιμές των γνωρισμάτων της κάθε οντότητας μπορεί να είναι είτε συνεχείς είτε διακριτές. Οι τιμές του γνωρίσματος κλάσης, όμως, πρέπει απαραίτητα να είναι διακριτές. Ταξινόμηση καλείται η διαδικασία μάθησης μιας συνάρτησης f, η οποία για κάθε οντότητα εισόδου να απεικονίζει το διάνυσμα γνωρισμάτων της στην τιμή της κλάσης της. Η συνάρτηση αυτή ονομάζεται και μοντέλο ταξινόμησης. Ένα μοντέλο ταξινόμησης είναι χρήσιμο, γιατί αποτελεί ένα εργαλείο επεξήγησης του τρόπου με τον οποίο οι οντότητες διαχωρίζονται σε διαφορετικές κατηγορίες. Ωστόσο, η πιο σημαντική συνεισφορά του είναι προγνωστικής φύσεως. Ένα μοντέλο ταξινόμησης εφαρμόζεται για να ταξινομήσει νέες οντότητες, των οποίων η τιμή κλάσης είναι άγνωστη. Το γεγονός ότι στο αρχικό σύνολο δεδομένων οι κλάσεις των οντοτήτων είναι γνωστές, κατατάσσει την ταξινόμηση στην κατηγορία των προβλημάτων επιβλεπόμενης (supervised) μάθησης. Αυτό το χαρακτηριστικό είναι που τη διαφοροποιεί από το πρόβλημα της συσταδοποίησης (clustering), που περιγράφεται στην επόμενη υποενότητα. Επίσης, η ταξινόμηση διαφέρει από το πρόβλημα της παλινδρόμησης (regression), στο χαρακτηριστικό ότι στην πρώτη περίπτωση η μεταβλητή πρόβλεψης οφείλει να είναι διακριτή (κλάση), ενώ στη δεύτερη συνεχής. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 76
77 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής [DM Εικόνα 1] Η γενική προσέγγιση για την κατασκευή ενός μοντέλου ταξινόμησης. Ένας αλγόριθμος ταξινόμησης ή ταξινομητής αποτελεί μια συστηματική προσέγγιση κατασκευής μοντέλων ταξινόμησης από σύνολα δεδομένων εισόδου. Κάθε αλγόριθμος εφαρμόζει μια τεχνική μάθησης, για να αναγνωρίσει το μοντέλο που προσαρμόζεται καλύτερα στις συσχετίσεις μεταξύ των γνωρισμάτων και των τιμών κλάσης των οντοτήτων εισόδου. Το μοντέλο που παράγεται από τον αλγόριθμο ταξινόμησης πρέπει να προσαρμόζεται καλά στα υπάρχοντα δεδομένα, αλλά και να μπορεί να προβλέπει τις κλάσεις οντοτήτων από δεδομένα που εμφανίζονται για πρώτη φορά. Άρα ένας βασικός στόχος του αλγόριθμου ταξινόμησης είναι να κατασκευάζει μοντέλα, τα οποία να διαθέτουν καλές ιδιότητες γενίκευσης. Η επίλυση ενός γενικού προβλήματος ταξινόμησης απαιτεί τα ακόλουθα βήματα. Αρχικά, παρέχεται ένα σύνολο εκπαίδευσης (training set) με οντότητες των οποίων οι κλάσεις είναι γνωστές. Το σύνολο εκπαίδευσης χρησιμοποιείται για την εκπαίδευση του μοντέλου ταξινόμησης με βάση κάποιον αλγόριθμο εκπαίδευσης. Στη συνέχεια, το εκπαιδευμένο μοντέλο εφαρμόζεται για να ταξινομήσει τις οντότητες ενός συνόλου δοκιμής (test set), στο οποίο οι τιμές κλάσης είναι άγνωστες. 77 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
78 ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Ο ταξινομητής δένδρων απόφασης (decision tree classifier) αποτελεί μια εξαιρετικά απλή, αλλά ευρέως χρησιμοποιούμενη τεχνική ταξινόμησης. Βασίζεται σε μια σειρά από ερωτήματα που τίθενται σε κάθε εισερχόμενη οντότητα, για κάθε ένα από τα γνωρίσματά της. Τα ερωτήματα αυτά και οι πιθανές απαντήσεις οργανώνονται στη μορφή ενός δένδρου. Το δένδρο αποτελεί μια ιεραρχική δομή με κόμβους και διευθυνόμενες ακμές. Κάθε κόμβος αντιστοιχεί σε ένα ερώτημα για ένα γνώρισμα και κάθε ακμή που εξέρχεται από τον κόμβο αυτό αντιστοιχεί σε μια πιθανή απάντηση του ερωτήματος. Σε κάθε τελικό κόμβο, που καλείται και φύλλο, αντιστοιχεί μια τιμή κλάσης. Εφόσον ένα δένδρο απόφασης κατασκευαστεί, η διαδικασία ταξινόμησης μιας οντότητας είναι απλή. Αρχίζοντας από τον πρώτο κόμβο, που καλείται και ρίζα, τίθεται ένα ερώτημα για κάποιο γνώρισμα της οντότητας. Ανάλογα με την απάντηση ακολουθείται και μια ακμή, η οποία οδηγεί σε ένα νέο κόμβο. Στο νέο κόμβο τίθεται ένα νέο ερώτημα για κάποιο γνώρισμα της οντότητας και ακολουθείται η αντίστοιχη ακμή, ανάλογα με τη νέα απάντηση. Καταλήγοντας σε κάποιο φύλλο, λαμβάνεται η αντίστοιχη απόφαση για την τιμή κλάσης της οντότητας. Υπάρχει ένα εκθετικό πλήθος από διαφορετικές δομές δένδρων απόφασης, που να προκύπτουν από το ίδιο σύνολο γνωρισμάτων. Ενώ κάποιες από αυτές είναι πιο ακριβείς από τις άλλες, το να βρεθεί η βέλτιστη δομή αποτελεί μια υπολογιστικά μη πρακτική διαδικασία, λόγω του εκθετικού χώρου ψαξίματος. Ωστόσο, έχουν σχεδιαστεί διάφοροι αποδοτικοί αλγόριθμοι, οι οποίοι κατασκευάζουν αρκετά ακριβή και σχεδόν βέλτιστα δένδρα απόφασης σε λογικά χρονικά πλαίσια. Οι αλγόριθμοι αυτοί εφαρμόζουν συνήθως μια άπληστη (greedy) στρατηγική, δηλαδή κατασκευάζουν δένδρα λαμβάνοντας μια σειρά από τοπικά βέλτιστες αποφάσεις, ως προς τη χρήση του γνωρίσματος που θα διαμερίσει τις οντότητες. Ένας τέτοιος αλγόριθμος είναι ο αλγόριθμος του Hunt, ο οποίος αποτελεί τη βάση για πολλούς υπάρχοντες αλγόριθμους κατασκευής δένδρων απόφασης, όπως του ID3, του C4.5 και του πιο γνωστού από όλους CART [DM2]. Πρόκειται για έναν αναδρομικό αλγόριθμο, του οποίου τα βασικά βήματα έχουν ως ακολούθως: Άρχισε με έναν κόμβο, που θα αποτελεί τη ρίζα του δένδρου, και αντιστοίχισέ του όλο το σύνολο οντοτήτων εισόδου. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 78
79 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Αν όλες οι οντότητες που αντιστοιχούν στο θεωρούμενο κόμβο ανήκουν στην ίδια κλάση, θέσε τον κόμβο ως φύλλο με τιμή την τιμή της κλάσης αυτής. Αν όλες οι οντότητες που αντιστοιχούν στο θεωρούμενο κόμβο δεν ανήκουν στην ίδια κλάση, αντιστοίχισε στον κόμβο ένα ερώτημα για ένα γνώρισμα, με σκοπό τη διαμέριση των οντοτήτων. Δημιούργησε μια ακμή για κάθε πιθανή απάντηση του ερωτήματος και κατένειμε τις οντότητες στους κόμβους που δημιουργούνται ανάλογα με την απάντηση. Επανέλαβε τα βήματα 2 και 3 αναδρομικά σε κάθε δημιουργούμενο κόμβο. Ένα ζήτημα που υπεισέρχεται, είναι το πώς διαμερίζονται οι οντότητες με βάση κάποιο συνεχές γνώρισμά τους. Μια πολύ συχνά χρησιμοποιούμενη μέθοδος βέλτιστης διακριτοποίησης συνεχών γνωρισμάτων είναι αυτή που χρησιμοποιεί το δείκτη gini, όπως γίνεται στον αλγόριθμο CART. Τα δένδρα απόφασης, πάντως, τείνουν να αποδίδουν καλύτερα με διακριτά γνωρίσματα. ΤΑΞΙΝΟΜΗΣΗ ΒΑΣΕΙ ΚΑΝΟΝΩΝ Ένα δένδρο απόφασης μπορεί να μετατραπεί σε ένα σύνολο λογικών κανόνων, παράγοντας έναν κανόνα για κάθε μονοπάτι του δένδρου από τη ρίζα μέχρι κάθε φύλλο. Ωστόσο, τέτοιοι κανόνες μπορούν να προκύψουν και απευθείας από τα δεδομένα, με τη χρήση αλγόριθμων βασισμένων σε κανόνες. Το αποτέλεσμα που προκύπτει είναι ένας ταξινομητής βασισμένος σε κανόνες (rule-based classifier). Οι κανόνες ταξινόμησης αντιστοιχούν κάθε σύζευξη απαντήσεων από ερωτήματα που αφορούν γνωρίσματα των οντοτήτων σε μια τιμή της κλάσης. Ο στόχος είναι να κατασκευαστεί το ελάχιστο σύνολο κανόνων, που να είναι συνεπές με τα δεδομένα εκπαίδευσης. Ένα μεγάλο πλήθος κανόνων συνήθως υποδηλώνει, πως ο αλγόριθμος προσπαθεί να θυμάται τα δεδομένα, αντί να ανακαλύπτει τις συσχετίσεις που τα διέπουν. Ο πιο απλός αλγόριθμος εκπαίδευσης ενός συνόλου κανόνων για ταξινόμηση είναι ο ακόλουθος: Άρχισε με το κενό σύνολο κανόνων και με ολόκληρο το σύνολο οντοτήτων εισόδου. Βρες τον καλύτερο κανόνα, αυτόν που να αναθέτει τις περισσότερες οντότητες σε σωστή κλάση. Πρόσθεσέ τον στο σύνολο κανόνων. Διατήρησε μόνο τις οντότητες που ο κανόνας αυτός δεν ταξινομεί σωστά. 79 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
80 Επανέλαβε τα βήματα 2 και 3, μέχρι να μη βρίσκεται άλλος κανόνας. Η διαφορά ανάμεσα στις ευρετικές τεχνικές για την εκπαίδευση συνόλων κανόνων και αυτές για την κατασκευή δένδρων απόφασης είναι, ότι ενώ οι δεύτερες αποτιμούν τη μέση ποιότητα ενός πλήθους από σύνολα ταξινομήσεων (ένα σύνολο για κάθε πιθανή απάντηση ενός ερωτήματος), οι πρώτες αποτιμούν την ποιότητα ταξινόμησης μόνο για το σύνολο οντοτήτων που καλύπτει ο υποψήφιος κανόνας. Αυτή είναι και η βασική διαφορά φιλοσοφίας ανάμεσα στον διαχώρισε και βασίλευε (separate and conquer) αλγόριθμο που περιγράφεται εδώ και στον αναδρομικό ή διαίρει και βασίλευε (divide and conquer) αλγόριθμο για την κατασκευή δένδρων απόφασης. Ως φυσικό επακόλουθο, όμως, οι αλγόριθμοι του δεύτερου τύπου είναι πιο αποδοτικοί από άποψη χρόνου. Οι κανόνες ταξινόμησης αποδίδουν καλύτερα με διακριτά γνωρίσματα απ ότι με συνεχή. Επιπλέον, εφαρμόζονται καλύτερα απ ότι τα δένδρα απόφασης σε δυαδικά γνωρίσματα. Το πιο σημαντικό χαρακτηριστικό, πάντως, τόσο των κανόνων ταξινόμησης όσο και των δένδρων απόφασης είναι η αντιληπτικότητά τους. Δηλαδή, μπορεί κανείς να καταλάβει ξεκάθαρα τον τρόπο με τον οποίο μια οντότητα ταξινομείται σε μια συγκεκριμένη κλάση. ΤΑΞΙΝΟΜΗΣΗ ΒΑΣΕΙ ΤΩΝ ΣΤΙΓΜΙΟΤΥΠΩΝ Μια άλλη κατηγορία απλών και κοινά χρησιμοποιούμενων μοντέλων ταξινόμησης είναι αυτών που βασίζονται στα στιγμιότυπα (instance-based classifiers). Οι ταξινομητές αυτοί χαρακτηρίζονται από την ιδιότητα να εκπαιδεύονται την ίδια στιγμή που ταξινομούν τις οντότητες εισόδου. Συχνά, η διαδικασία ταξινόμησης είναι πιο χρονοβόρα από τη διαδικασία εκπαίδευσής τους. Η γενική ιδέα στην οποία βασίζονται είναι, ότι οι οντότητες αποτελούν σημεία του n-διάστατου Ευκλείδειου χώρου, με κάθε μία από τις διαστάσεις να αντιστοιχεί και σε ένα γνώρισμα των οντοτήτων. Η απόσταση των οντοτήτων στο χώρο αυτό αποτελεί μια μετρική ομοιότητας ή συσχέτισής τους. Δηλαδή, πλησιέστερες οντότητες είναι πιο πιθανό να ανήκουν στην ίδια κλάση. Ο πιο γνωστός αλγόριθμος βασισμένος στα στιγμιότυπα, που εφαρμόζει την παραπάνω λογική, είναι ο αλγόριθμος των k πλησιέστερων γειτόνων (k nearest neighbors): Για κάθε οντότητα του συνόλου δοκιμής, βρες στο σύνολο εκπαίδευσης τις k πλησιέστερες οντότητές της στον Ευκλείδειο χώρο των κοινών γνωρισμάτων τους. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 80
81 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Ανάθεσέ της την πιο συχνά εμφανιζόμενη τιμή κλάσης στις γειτονικές οντότητες. ΤΕΧΝΗΤΑ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τα τεχνητά νευρωνικά δίκτυα (artificial neural networks) αποτελούν μια ευρέως χρησιμοποιούμενη μεθοδολογία, με ποικίλες εφαρμογές σε προβλήματα επιβλεπόμενης μάθησης στην αναγνώριση προτύπων. Μια πολύ κοινή χρήση τους αφορά το πρόβλημα της ταξινόμησης [DM23]. Το μοντέλο νευρωνικών δικτύων που εξειδικεύεται στην εφαρμογή αυτή καλείται perceptron. Το perceptron ενός επιπέδου υπολογίζει ένα σύνολο από συνδετικά βάρη w1,,wn, με κάθε ένα από αυτά να αντιστοιχεί σε κάθε ένα γνώρισμα της οντότητας εισόδου και να αποκτά τυπικά μια πραγματική τιμή ανάμεσα στο -1 και το 1. Στη συνέχεια, για κάθε οντότητα εισόδου i υπολογίζεται ως έξοδος η ποσότητα n w x att = 1 att i, att, από την οποία αποφασίζεται με βάση κάποιες προκαθορισμένες τιμές κατωφλίου σε ποια κλάση ανήκει η οντότητα. Η πιο κοινή μέθοδος εκπαίδευσης του perceptron είναι η επαναληπτική εκτέλεση ενός αλγόριθμου στο σύνολο οντοτήτων εισόδου, μέχρι να βρεθεί ένα διάνυσμα συνδετικών βαρών που να προβλέπει σωστά τις κλάσεις όλων των οντοτήτων. Το απλό perceptron που περιγράφεται παραπάνω, μπορεί να ταξινομήσει σωστά μόνο γραμμικά διαχωρίσιμα σύνολα οντοτήτων. Αν οι οντότητες δεν είναι γραμμικά διαχωρίσιμες, το perceptron δε θα μπορέσει ποτέ να φτάσει σε ένα σημείο που να ταξινομεί σωστά όλες τις οντότητες εισόδου. Για το λόγο αυτό, έχει προταθεί το perceptron πολλαπλών επιπέδων (multilayered perceptron). Το μοντέλο αυτό αποτελείται από ένα πλήθος μονάδων, τα νευρώνια, που συνδέονται μεταξύ τους με βάση μια πρότυπη τοπολογία. Τα νευρώνια εντάσσονται σε τρεις κατηγορίες: τα νευρώνια εισόδου, που δέχονται πληροφορία από τις οντότητες εισόδου, τα νευρώνια εξόδου, που παράγουν τις τιμές εξόδου, και τα κρυμμένα νευρώνια, που υπάρχουν ενδιάμεσα και επεξεργάζονται την πληροφορία. Κατά την εκπαίδευση του δικτύου, σε κάθε συνδεδεμένο ζεύγος νευρωνίων ανατίθεται και μια τιμή συνδετικού βάρους. Κατά τη διάρκεια της ταξινόμησης, η πληροφορία διαδίδεται από τα νευρώνια εισόδου προς όλο το δίκτυο, για τον καθορισμό των τιμών ενεργοποίησης στα νευρώνια εξόδου. Κάθε μονάδα εισόδου αποκτά μια τιμή ενεργοποίησης, η οποία αναπαριστά μια πληροφορία που παρέχει η οντότητα εισόδου. Στη συνέχεια, η μονάδα εισόδου στέλνει την τιμή 81 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
82 αυτή στα κρυμμένα νευρώνια. Κάθε ένα από τα κρυμμένα νευρώνια υπολογίζει τη δική του τιμή ενεργοποίησης και τη στέλνει στα νευρώνια εξόδου. Η τιμή ενεργοποίησης ενός νευρωνίου υπολογίζεται με τη χρήση μιας απλής συνάρτησης ενεργοποίησης. Η συνάρτηση ενεργοποίησης συναθροίζει τις συνεισφορές όλων των εισερχόμενων πληροφοριών, δηλαδή όλων των εισερχόμενων τιμών ενεργοποίησης πολλαπλασιασμένων με τα αντίστοιχα συνδετικά βάρη. Το άθροισμα αυτό, στη συνέχεια, συνήθως είτε κανονικοποιείται (ανάμεσα στο 0 και το 1) ή/και τροποποιείται, πχ με το να αποκτά την τιμή 0 όταν είναι μικρότερο από ένα προκαθορισμένο κατώφλι. Η διαδικασία εκπαίδευσης του perceptron πολλαπλών επιπέδων περιλαμβάνει τον υπολογισμό των συνδετικών βαρών. Στα βάρη αυτά αρχικά ανατίθενται αυθαίρετες τιμές. Εν συνεχεία, οι οντότητες εισέρχονται διαδοχικά στο δίκτυο, με τις τιμές γνωρισμάτων τους να τοποθετούνται στα νευρώνια εισόδου και την τιμή κλάσης να συγκρίνεται με την τιμή ενεργοποίησης του νευρωνίου εξόδου. Με βάση αυτή τη σύγκριση, οι τιμές των συνδετικών βαρών του δικτύου μετατοπίζονται ελαφρά, ώστε οι τιμές ενεργοποίησης του νευρωνίου εξόδου να προσεγγίζουν τις επιθυμητές. Ο πιο κοινός αλγόριθμος εκπαίδευσης που λειτουργεί ως παραπάνω, είναι ο αλγόριθμος όπισθεν διάδοσης (back propagation): Θέσε μία οντότητα στο δίκτυο. Σύγκρινε την έξοδο του δικτύου με την κλάση της οντότητας. Σε κάθε νευρώνιο εξόδου υπολόγισε το τοπικό σφάλμα, δηλαδή τη διαφορά της πραγματικής με την επιθυμητή έξοδό του. Μετέβαλλε τα συνδετικά βάρη ώστε να μειωθεί το κάθε τοπικό σφάλμα. Ανάθεσε μια ευθύνη για το τοπικό σφάλμα στα νευρώνια του προηγούμενου επιπέδου, αποδίδοντας μεγαλύτερη ευθύνη στα μεγαλύτερα συνδετικά βάρη. Επανέλαβε τα παραπάνω βήματα στα νευρώνια του προηγούμενου επιπέδου, με την ευθύνη του καθενός να αποτελεί το τοπικό του σφάλμα. Ο παραπάνω αλγόριθμος πραγματοποιεί ένα πλήθος μετατροπών των συνδετικών βαρών, μέχρι να πάρουν αυτά τις τελικές τους τιμές. Αν είναι w το πλήθος των βαρών του δικτύου, κάθε επανάληψη του αλγόριθμου για ολόκληρο το σύνολο οντοτήτων εισόδου πραγματοποιεί O(mw) Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 82
83 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής τροποποιήσεις. Ωστόσο, ενδέχεται να απαιτείται εκθετικό πλήθος τέτοιων επαναλήψεων του αλγόριθμου. Για το λόγο αυτό, συνήθως τίθεται κάποιο κριτήριο τερματισμού. Το κριτήριο αυτό μπορεί να ορίζεται σαν ένα μέγιστο πλήθος επαναλήψεων, σαν μια ελάχιστη τιμή σφάλματος ή σαν ένα μέγιστο πλήθος επαναλήψεων χωρίς μεγάλη βελτίωση του σφάλματος. SUPPORT VECTOR MACHINES Τα Support Vector Machines (SVMs) [DM3] αποτελούν την πιο σύγχρονη τεχνική ταξινόμησης. Αν οι οντότητες εισόδου είναι γραμμικά διαχωρίσιμες, τότε υπάρχει ένα διάνυσμα βαρών w και ένας πραγματικός αριθμός b, τέτοια ώστε wx i +b 1 και wx i +b 1, για κάθε x i. Συνεπώς, ο κανόνας ταξινόμησης για μια οντότητα i προκύπτει από το αν η ποσότητα wx i + b είναι αρνητική ή θετική. Η βέλτιστη διαμέριση των οντοτήτων προκύπτει με την επίλυση ενός προβλήματος κυρτού τετραγωνικού προγραμματισμού (curve quadratic programming): ζητείται να βρεθεί το διάνυσμα w με την ελάχιστη τετραγωνική νόρμα, που να υπόκειται στο παραπάνω σύνολο ανισοτήτων. Στην περίπτωση που βρεθεί το υπερεπίπεδο διαμέρισης, τα σημεία στα όριά του καλούνται support vector σημεία και η λύση μπορεί να αναπαρασταθεί ως ένας γραμμικός συνδυασμός αποκλειστικά και μόνο των σημείων αυτών. Κατά συνέπεια, η πολυπλοκότητα ταξινόμησης ενός SVM είναι ανεξάρτητη του πλήθους των οντοτήτων εισόδου και του πλήθους των γνωρισμάτων τους. Από την άλλη, η πολυπλοκότητα εκπαίδευσής του κυριαρχείται από το χρόνο επίλυσης του επαγόμενου τετραγωνικού προγράμματος, ο οποίος δε θεωρείται αποδοτικός για τεράστια δεδομένα εισόδου. Η επίλυση του τετραγωνικού προγράμματος καταλήγει εγγυημένα σε μια βέλτιστη λύση, δηλαδή δεν υπάρχει κίνδυνος σύγκλισής της σε τοπικά βέλτιστα, όπως συμβαίνει με την εκπαίδευση άλλων αλγόριθμων ταξινόμησης. Δυστυχώς, τα προβλήματα ταξινόμησης στην πράξη σπανίως περιλαμβάνουν οντότητες που να διαχωρίζονται με τόσο απλό τρόπο. Μια λύση είναι τα SVMs να επιτρέπουν ένα μικρό περιθώριο για κάποιες λανθασμένες ταξινομήσεις. Το περιθώριο αυτό ορίζεται ως ένας πραγματικός αριθμός ξ και οι περιορισμοί για την ταξινόμηση χαλαρώνονται σε wx i + b 1 ξ και wx i + b 1 ξ. Μια άλλη λύση είναι να απεικονιστούν οι οντότητες σε ένα χώρο περισσότερων διαστάσεων και να βρεθεί εκεί ένα υπερεπίπεδο διαμέρισης. Ο νέος αυτός χώρος καλείται μετασχηματισμένος χώρος 83 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
84 γνωρισμάτων. Σε έναν κατάλληλα μετασχηματισμένο χώρο γνωρισμάτων με ένα επαρκώς μεγάλο πλήθος διαστάσεων, κάθε συνεπές σύνολο οντοτήτων μπορεί να γίνει γραμμικά διαχωρίσιμο. Ο μετασχηματισμός αυτός δε γίνεται απευθείας, αλλά με τη χρήση μιας συνάρτησης πυρήνα (kernel function), η οποία μετασχηματίζει το εσωτερικό γινόμενο όλων των δυνατών ζευγών οντοτήτων στο νέο χώρο. Η κατάλληλη επιλογή της συνάρτησης πυρήνα διαδραματίζει σημαντικότατο ρόλο στην ποιότητα της ταξινόμησης. Έστω x 1 και x 2 τα διανύσματα γνωρισμάτων δυο οντοτήτων στον πραγματικό (Ευκλείδειο) χώρο. Από τις πιο δημοφιλείς συναρτήσεις πυρήνα είναι η p πολυωνυμική βαθμού p: K x, x ) = ( xx 1), υποπερίπτωση της οποίας ( αποτελεί η γραμμική (όταν p=1), η RBF: K ( x, x p σιγμοειδής βαθμού p: K x, x ) = tanh( κxx ). ( δ 1 2 ) 2 x1 x 2 2 = e και η σ 2 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 84
85 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΑΛΓΟΡΙΘΜΟΙ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗ Στη μη επιβλεπόμενη ταξινόμηση (unsupervised classification) δεν υπάρχουν διαθέσιμα δεδομένα για μάθηση, δηλαδή αρχικές τιμές της μεταβλητής κλάσης. Το πρόβλημα αυτό είναι γνωστό και ως συσταδοποίηση (clustering) [DM22]. Ο στόχος της συσταδοποίησης είναι να διαχωριστεί ένα πεπερασμένο και μη ταξινομημένο σύνολο οντοτήτων σε ένα πεπερασμένο και διακριτό σύνολο από φυσικές, κρυφές δομές δεδομένων, αποκαλούμενες και ως συστάδες (clusters). Συνεπώς, η έννοια της συστάδας υποκαθιστά την έννοια της κλάσης. Σε αντίθεση με την (επιβλεπόμενη) ταξινόμηση, σκοπός της συσταδοποίησης δεν είναι να παρέχει έναν ακριβή χαρακτηρισμό σε μη παρατηρούμενα δεδομένα που παράγονται από κοινές πιθανοτικές κατανομές. Πιο συγκεκριμένα, στη συσταδοποίηση ένα σύνολο από αντικείμενα διαχωρίζεται σε έναν αριθμό από περισσότερο ή λιγότερο ομοιογενείς συστάδες, με βάση ένα συχνά υποκειμενικά επιλεγμένο μέτρο ομοιότητας, τέτοιο ώστε η ομοιότητα μεταξύ των αντικειμένων της ίδιας συστάδας να είναι μεγαλύτερη από την ομοιότητα αντικειμένων που ανήκουν σε διαφορετικές συστάδες. Οι περισσότεροι ερευνητές περιγράφουν τη συστάδα λαμβάνοντας υπόψη την εσωτερική ομοιογένειά της και τον εξωτερικό διαχωρισμό της από τις άλλες συστάδες. Τόσο η έννοια της ομοιότητας όσο και αυτή της ανομοιότητας θα πρέπει να ορίζονται με σαφή και ξεκάθαρο τρόπο. [DM Εικόνα 2] - Η διαδικασία της συσταδοποίησης. 85 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
86 Έστω X { x1, x2,..., x m } m οντοτήτων που περιγράφονται στα δεδομένα, δηλαδή x ( x x,..., x ) = το σύνολο των n-διανυσμάτων των γνωρισμάτων των i = i1, i2 in. Η συσταδοποίηση στοχεύει να παράγει μια k-διαμέριση του X ( k m ), τη C= C, C,..., C }, τέτοια ώστε (1) C Ø για κάθε j=1,,k, (2) U k C j = X { 1 2 k j και (3) Cj I C l = Ø για κάθε j,l=1,,k και j l. Η μέτρηση της απόστασης (ανομοιότητας) ή της ομοιότητας μεταξύ δυο οντοτήτων, δυο συστάδων ή μιας οντότητας και μιας συστάδας πραγματοποιείται με τη χρήση αντίστοιχων μετρικών. Μια μετρική απόστασης D ορίζεται ώστε να ικανοποιεί τις ακόλουθες ιδιότητες: (1) να είναι συμμετρική, δηλαδή η απόσταση μιας οντότητας από μια άλλη να ισούται με την απόσταση της δεύτερης από την πρώτη, (2) να είναι μη αρνητική, (3) να ικανοποιεί την τριγωνική ανισότητα και (4) να είναι ανακλαστική, δηλαδή η απόσταση μιας οντότητας από τον εαυτό της να ισούται με 0. Για ένα σύνολο δεδομένων έτσι ορίζεται ένας συμμετρικός πίνακας, που καλείται πίνακας εγγύτητας, του οποίου το στοιχείο (p,q) αναπαριστά την D(p,q)=Dpq. Το πρόβλημα της εύρεσης της καλύτερης συσταδοποίησης, βάσει ενός κριτηρίου βελτιστοποίησης που αποτελεί συνάρτηση των τιμών του πίνακα αυτού, είναι NP-hard. j=1 [DM Εικόνα 3] - Μετρικές απόστασης για οντότητες με ποσοτικά γνωρίσματα. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 86
87 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΙΕΡΑΡΧΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ Η ιεραρχική συσταδοποίηση (hierarchical clustering - HC) οργανώνει τα δεδομένα σε μια ιεραρχική δομή, σύμφωνα με τον πίνακα εγγύτητας. Τα αποτελέσματα της HC απεικονίζονται συνήθως ως ένα δυαδικό δένδρο ή δενδρόγραμμα. Η ρίζα του δενδρογράμματος αναπαριστά ολόκληρο το σύνολο των δεδομένων και κάθε φύλλο εκλαμβάνεται ως μια ξεχωριστή οντότητα. Οι ενδιάμεσοι κόμβοι, συνεπώς, περιγράφουν το βαθμό εγγύτητας των οντοτήτων και το ύψος του δενδρογράμματος εκφράζει την απόσταση ανάμεσα σε κάθε ζεύγος οντοτήτων, κάθε ζεύγος συστάδων ή κάθε οντότητας και κάθε συστάδας. Τα τελικά αποτελέσματα συσταδοποίησης προκύπτουν κόβοντας το δενδρόγραμμα σε διάφορα επίπεδα. Οι HC αλγόριθμοι συνήθως κατηγοριοποιούνται ως συσσωρευτικοί ή διαιρετικοί. Η συσσωρευτική συσταδοποίηση αρχικά αναθέτει μια οντότητα ανά συστάδα. Μια ακολουθία από λειτουργίες συνένωσης τελικά οδηγεί όλες τις οντότητες στην ίδια συστάδα. Η διαιρετική συσταδοποίηση πραγματοποιεί την αντίστροφη πορεία. Αρχικά, ολόκληρο το σύνολο των δεδομένων ανήκει σε μια συστάδα. Μια ακολουθία από λειτουργίες διάσπασης οδηγεί την κάθε οντότητα σε m διαφορετική συστάδα. Για μια συστάδα m οντοτήτων, υπάρχουν πιθανές διχοτομήσεις σε υποσύνολα, το οποίο οδηγεί σε έναν πολύ χρονοβόρο υπολογισμό. Συνεπώς, οι διαιρετικοί αλγόριθμοι σπάνια χρησιμοποιούνται στην πράξη. Ένας γενικός αλγόριθμος συσσώρευσης περιγράφεται από την ακόλουθη διαδικασία: Άρχισε με μοναδιαίες συστάδες. Υπολόγισε τον πίνακα εγγύτητας για τις συστάδες. Βρες την ελάχιστη απόσταση στον πίνακα εγγύτητας και συνδύασε τις δύο πλησιέστερες συστάδες σε μία καινούρια. Ανανέωσε τον πίνακα εγγύτητας, ο οποίος περιέχει μια συστάδα λιγότερη. Επανέλαβε τα βήματα 2 και 3, μέχρι όλες οι οντότητες να ανήκουν σε μια συστάδα. Η συνηθέστερη κριτική για τους κλασσικούς HC αλγόριθμους είναι ότι στερούνται ευρωστίας και, συνεπώς, είναι ευαίσθητοι στο θόρυβο και τις απομονωμένες οντότητες (outliers). Εφόσον μια οντότητα ανατεθεί σε μια συστάδα, παραμένει σε αυτή ως το τέλος, που σημαίνει πως δε γίνεται να διορθωθούν έτσι προηγούμενες λανθασμένες αναθέσεις. Η υπολογιστική 87 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
88 2 πολυπλοκότητα ενός HC αλγόριθμου είναι τουλάχιστον O ( m ) και αυτό το υψηλό κόστος αποτρέπει την εφαρμογή τους σε μεγάλου μεγέθους δεδομένα. Ένα επιπλέον μειονέκτημα των HC αλγόριθμων είναι ότι τείνουν να παράγουν συστάδες σφαιρικού σχήματος. ΑΛΓΟΡΙΘΜΟΙ ΒΑΣΕΙ ΤΗΣ ΑΠΟΣΤΑΣΗΣ Σε αντιδιαστολή με την ιεραρχική συσταδοποίηση, η διαμεριστική συσταδοποίηση αναθέτει ένα σύνολο οντοτήτων σε συστάδες χωρίς να χρησιμοποιεί κάποια ιεραρχική δομή. Προσπαθεί να βρει την καλύτερη συσταδοποίηση βελτιστοποιώντας κάποια συνάρτηση κριτηρίου. Συνήθως ζητείται η ελαχιστοποίηση του αθροίσματος του τετραγωνικού σφάλματος συστάδας. Έστω mj μια εικονική οντότητα, με τιμές γνωρισμάτων τις μέσες τιμές των γνωρισμάτων των οντοτήτων που ανήκουν στη συστάδα Cj. Η οντότητα mj καλείται κεντροειδές (centroid) της συστάδας Cj. Έστω, ακόμα μια δεικνύουσα μεταβλητή γij, που ισούται με 1 αν η οντότητα xi ανήκει στη συστάδα Cj, αλλιώς ισούται με 0. Το άθροισμα τετραγωνικού σφάλματος τότε ισούται με k m j= 1 i= 1 γ ij x i m j 2. Εξ ορισμού, η βέλτιστη διαμέριση μπορεί να βρεθεί αποτιμώντας όλες τις πιθανές διαμερίσεις. Αλλά αυτή η εξαντλητική μέθοδος είναι ανέφικτη στην πράξη. Συνεπώς, ευρετικές τεχνικές πρέπει να χρησιμοποιηθούν για τον υπολογισμό προσεγγιστικά βέλτιστων λύσεων. Ο πιο γνωστός ευρετικός αλγόριθμος για την εύρεση του ελάχιστου αθροίσματος τετραγωνικού σφάλματος είναι ο αλγόριθμος k-means: Άρχισε με μια αυθαίρετη συσταδοποίηση. Υπολόγισε τα αρχικά κεντροειδή. Ανάθεσε κάθε οντότητα στη συστάδα του πλησιέστερου κεντροειδούς. Υπολόγισε τα νέα κεντροειδή. Επανέλαβε τα βήματα 2 και 3, μέχρι να μην υπάρχει κάποια αλλαγή στη συσταδοποίηση. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 88
89 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Ο αλγόριθμος k-means είναι πολύ απλός και μπορεί εύκολα να υλοποιηθεί για την επίλυση πολλών πρακτικών προβλημάτων. Αποδίδει καλά κυρίως για συμπαγείς και σφαιρικές συστάδες. Για την αναγνώριση μη σφαιρικών συστάδων, μπορεί εναλλακτικά να χρησιμοποιηθεί μια διαφορετική μετρική απόστασης έναντι της Ευκλείδειας, όπως η Mahalanobis απόσταση. Η πολυπλοκότητα χρόνου του k-means είναι της τάξης του O(mkd). Καθώς τα k και d είναι συνήθως πολύ μικρότερα από το m, ο k-means θεωρείται αποδοτικός και για πολύ μεγάλου μεγέθους σύνολα δεδομένων. Τα τελευταία χρόνια έχουν αναπτυχθεί τεχνικές, που έχουν βελτιώσει και επιταχύνει τον k- means σε τεράστιο βαθμό [DM6, DM19, DM20]. Ένα βασικό μειονέκτημα του k-means είναι η ευαισθησία του στην αρχική επιλογή των κεντροειδών. Δεδομένου όμως ότι πρόκειται για έναν ταχύτατο αλγόριθμο, πολλαπλές εκτελέσεις του με διαφορετικές αρχικοποιήσεις του κάθε φορά μπορούν να εγγυηθούν μεγάλη πιθανότητα στο να μην υπάρξει σύγκλιση σε κάποιο τοπικό βέλτιστο της συνάρτησης κριτηρίου. Ένα άλλο μειονέκτημα του k-means είναι η ευαισθησία του στο θόρυβο και τους outliers. Η αντιμετώπιση των outliers πραγματοποιείται με τη χρήση μιας παραλλαγής του k-means, που καλείται k- medians [DM7], όπου τα γνωρίσματα των κεντροειδών υπολογίζονται από τις ενδιάμεσες και όχι τις μέσες τιμές των γνωρισμάτων των υπόλοιπων οντοτήτων. ΑΣΑΦΗΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗ Οι αλγόριθμοι που έχουν περιγραφεί ως τώρα αναφέρονται σε ξεκάθαρη συσταδοποίηση. Δηλαδή, κάθε οντότητα ανατίθεται σε μία μόνο συστάδα. Στην ασαφή συσταδοποίηση (fuzzy clustering) [DM13], αυτός ο περιορισμός χαλαρώνεται και η οντότητα μπορεί να ανήκει σε όλες τις συστάδες με κάποιο βαθμό συμμετοχής. Αυτό είναι χρήσιμο, όταν τα όρια ανάμεσα στις συστάδες δεν είναι εμφανώς καθορισμένα. Επιπλέον, με τη χρήση του βαθμού συμμετοχής μπορούν να αποκαλυφθούν βαθύτερες συσχετίσεις ανάμεσα στις οντότητες και τις σχηματιζόμενες συστάδες. Ο fuzzy c-means (FCM) είναι ο πιο γνωστός ασαφής αλγόριθμος για συσταδοποίηση. Προσπαθεί να εντοπίσει μια διαμέριση (c ασαφείς συστάδες) ελαχιστοποιώντας τη συνάρτηση κριτηρίου c m 2 f uij xi mj j= 1 i= 1, 89 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
90 όπου uij είναι ο βαθμός συμμετοχής της οντότητας xi στη συστάδα Cj (με τιμή μεταξύ του 0 και του 1) και f είναι η παράμετρος ασάφειας, συνήθως ίση με 2 (σε κάθε περίπτωση μεγαλύτερη του 1). Οι υπόλοιποι συμβολισμοί είναι όπως στην περίπτωση του k-means. Ο κοινός FCM λειτουργεί ως ακολούθως: Επέλεξε κατάλληλη τιμή της f και θέσε αυθαίρετα τα αρχικά κεντροειδή. Υπολόγισε (στο πρώτο βήμα) ή ανανέωσε (σε κάθε άλλο βήμα) τους βαθμούς c 1 ( 1 f ) συμμετοχής: u ij 1 xl mj xi mj. j= 1 Ανανέωσε τα κεντροειδή: m j m i= 1 u f ij x i m i= 1 u f ij. Επανέλαβε τα βήματα 2 και 3, μέχρι τα κεντροειδή να διατηρούνται σχεδόν σταθερά. Όπως και ο k-means, ο FCM χαρακτηρίζεται από ευαισθησία στο θόρυβο και τους outliers, καθώς και από τη δυσκολία να αναγνωρίσει τις αρχικές διαμερίσεις. Πολλαπλές παραλλαγές του κοινού FCM έχουν προταθεί πρόσφατα, που εστιάζουν στη χρήση διαφορετικών μετρικών απόστασης και μελετούν την επίδραση ποικίλων παραμέτρων ασάφειας, για να βελτιώσουν τα προαναφερθέντα μειονεκτήματα. ΤΕΧΝΗΤΑ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ Τα τεχνητά νευρωνικά δίκτυα (artificial neural networks) μπορούν με τη χρήση κατάλληλων παραλλαγών να εφαρμοστούν και σε προβλήματα μη επιβλεπόμενης μάθησης. Η συσταδοποίηση που βασίζεται σε νευρωνικά δίκτυα, κυριαρχείται από δύο τύπους προσεγγίσεων, αυτής των selforganizing maps (SOMs) [DM14] και αυτής της artificial resonance theory (ART) [DM4,DM5]. Παρακάτω περιγράφεται η πιο συχνά χρησιμοποιούμενη αρχιτεκτονική νευρωνικών δικτύων για συσταδοποίηση, αυτή των SOMs, καθώς και ο αλγόριθμος εκπαίδευσής τους. Στόχος ενός SOM είναι η αναπαράσταση των οντοτήτων με τη χρήση πρωτότυπων διανυσμάτων, τα οποία συνήθως απεικονίζονται ως μια δισδιάστατη δομή δικτυωτού πλέγματος (lattice). Κάθε πρωτότυπο διάνυσμα έχει διάσταση m, ίση με το πλήθος γνωρισμάτων της κάθε οντότητας. Κάθε μονάδα στο πλέγμα αντιστοιχεί σε ένα πρωτότυπο διάνυσμα και καλείται Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 90
91 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής νευρώνιο. Τα γειτονικά νευρώνια συνδέονται μεταξύ τους, σχηματίζοντας έτσι μια ξεκάθαρη τοπολογία με την οποία το SOM αυτοπροσαρμόζεται στο χώρο των οντοτήτων εισόδου. Οι οντότητες συνδέονται πλήρως με όλα τα νευρώνια με τη χρήση προσαρμοστικών βαρών και κατά τη διάρκεια της εκπαίδευσης, οι γειτονικές οντότητες προβάλλονται στο πλέγμα, αντιστοιχώντας σε γειτονικά νευρώνια. Για την εκπαίδευση ορίζεται μια συνάρτηση γειτνίασης hij και ένας ρυθμός μάθησης α και οι δύο αυτές συναρτήσεις φθίνουν με την πάροδο των βημάτων εκπαίδευσης. Ο ακολουθιακός (sequential) αλγόριθμος για την εκπαίδευση ενός SOM έχει ως εξής: Όρισε την τοπολογία του πλέγματος και θέσε αυθαίρετα τα αρχικά πρωτότυπα διανύσματα. Πρόβαλε μια οντότητα xi στο πλέγμα. Αντιστοίχισέ την στο πλησιέστερο πρωτότυπο διάνυσμα vj. Ανανέωσε τα πρωτότυπα διανύσματα: v v + h ( x v ) j. j ij i j Επανέλαβε τα βήματα 2 και 3, μέχρι τα πρωτότυπα διανύσματα να διατηρούνται σχεδόν σταθερά. Εκτός από τον ακολουθιακό υπάρχει και ο batch αλγόριθμος εκπαίδευσης. Και αυτός ο αλγόριθμος είναι βηματικός, μόνο που στο δεύτερο βήμα προβάλλονται όλες οι οντότητες ταυτόχρονα στο πλέγμα, ενώ στο τρίτο βήμα η ανανέωση γίνεται ως εξής: v j m h x ij i ij i= 1 i= 1. m h Σε κάθε περίπτωση, κυρίαρχο ρόλο στην απόδοση της εκπαίδευσης διαδραματίζει η επιλογή των παραμέτρων. Αυτό αποτελεί ένα βασικό μειονέκτημα της μεθόδου, καθώς αυτές οι παράμετροι πρέπει να ορίζονται από το χρήστη σε εφαρμογές πραγματικών δεδομένων. Ένας συνήθης ορισμός της συνάρτησης γειτνίασης είναι αυτή να ισούται με το ρυθμό μάθησης, αν η xi αντιστοιχεί σε γειτονικό νευρώνιο του νευρωνίου με πρωτότυπο διάνυσμα vj, αλλιώς να ισούται με 0. Ένα άλλο μειονέκτημα των SOM, είναι ότι η πυκνότητα του χώρου οντοτήτων μπορεί να μην αναπαρίσταται αποδοτικά, δηλαδή ενδέχεται περιοχές χαμηλής πυκνότητας σε οντότητες να υπεραναπαριστώνται, ενώ αντίστοιχα μπορεί περιοχές υψηλής πυκνότητας να 91 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
92 υποαναπαριστώνται. Υπάρχουν ποικίλες παραλλαγές, που βελτιώνουν τα μειονεκτήματα της μεθόδου και διευρύνουν τις εφαρμογές της. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 92
93 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΕΠΙΛΟΓΗ ΓΝΩΡΙΣΜΑΤΩΝ ΚΑΙ ΑΠΟΤΙΜΗΣΗ ΕΠΙΛΟΓΗ ΓΝΩΡΙΣΜΑΤΩΝ Η επιλογή γνωρισμάτων (feature selection) [DM15] αποτελεί μια διαδικασία, η οποία έχει στόχο να εξάγει το βέλτιστο υποσύνολο των αρχικών γνωρισμάτων ενός συνόλου οντοτήτων εισόδου, με βάση κάποιο κριτήριο αξιολόγησης, που να οδηγεί σε καλύτερα αποτελέσματα ταξινόμησης και συσταδοποίησης. Λόγω του εκθετικού πλήθους των δυνατών υποσυνόλων γνωρισμάτων, η εύρεση του βέλτιστου υποσυνόλου είναι συνήθως μη βατή διαδικασία και πολλά προβλήματα σχετικά με την επιλογή γνωρισμάτων έχουν αποδειχθεί ότι είναι NP-hard. Μια χαρακτηριστική διαδικασία επιλογής γνωρισμάτων αποτελείται από τέσσερα βασικά βήματα: την παραγωγή υποσυνόλων, την αποτίμηση υποσυνόλων, το κριτήριο τερματισμού και την αποτίμηση του τελικού αποτελέσματος. Η παραγωγή υποσυνόλων είναι μια διαδικασία εύρεσης που παράγει τα υποψήφια υποσύνολα γνωρισμάτων για αποτίμηση και βασίζεται σε μια συγκεκριμένη στρατηγική ψαξίματος. Κάθε υποψήφιο υποσύνολο αποτιμάται και συγκρίνεται με το αμέσως προηγούμενο καλύτερο σύμφωνα με ένα προκαθορισμένο κριτήριο αξιολόγησης. Αν το νέο υποσύνολο αποδεικνύεται καλύτερο, αντικαθιστά το προηγούμενο καλύτερο υποσύνολο. Η διαδικασία αυτή επαναλαμβάνεται έως ότου ικανοποιηθεί ένα δεδομένο κριτήριο διακοπής. Κατόπιν, το βέλτιστο υποσύνολο πρέπει συνήθως να επικυρωθεί από την προγενέστερη γνώση ή αλγοριθμικά, με τη χρήση πραγματικών δεδομένων. Έχει καταστεί ξεκάθαρο από την εμπειρία, ότι η εφαρμογή μιας τεχνικής επιλογής γνωρισμάτων των οντοτήτων πριν την εκτέλεση μιας διαδικασίας εξόρυξης δεδομένων, όπως μιας ταξινόμησης ή μιας συσταδοποίησης, βελτιώνει την απόδοση και την ταχύτητα της διαδικασίας. 93 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
94 [DM Εικόνα 4] - Τα βασικά βήματα μιας διαδικασίας επιλογής γνωρισμάτων. Οι αλγόριθμοι επιλογής γνωρισμάτων υποδιαιρούνται σε τρεις βασικές κατηγορίες: σε αυτές του filter μοντέλου, του wrapper μοντέλου και του υβριδικού (hybrid) μοντέλου. Το filter μοντέλο στηρίζεται στα γενικά χαρακτηριστικά των δεδομένων για να αξιολογήσει και να επιλέξει τα υποσύνολα γνωρισμάτων, χωρίς την ανάμειξη οποιουδήποτε αλγόριθμου εξόρυξης. Το wrapper μοντέλο απαιτεί έναν προκαθορισμένο αλγόριθμο εξόρυξης και χρησιμοποιεί την απόδοσή του ως κριτήριο αξιολόγησης. Ψάχνει για τα χαρακτηριστικά γνωρίσματα που ταιριάζουν καλύτερα στον αλγόριθμο εξόρυξης, στοχεύοντας να βελτιώσει την απόδοση της εξόρυξης, αλλά τείνει επίσης να είναι και πιο ακριβό υπολογιστικά σε σχέση με το filter μοντέλο. Το υβριδικό μοντέλο προσπαθεί να συνδυάσει τα πλεονεκτήματα των δύο μοντέλων, εκμεταλλευόμενο τα διαφορετικά κριτήρια αξιολόγησής τους σε διαφορετικά στάδια ψαξίματος. Οι αλγόριθμοι του filter μοντέλου μπορούν να περιγραφούν γενικά ως ακολούθως. Έστω S 0 ένα αρχικά επιλεγμένο υποσύνολο γνωρισμάτων, που μπορεί να είναι το κενό σύνολο, το πλήρες σύνολο γνωρισμάτων ή ένα οποιοδήποτε τυχαία επιλεγμένο υποσύνολο. Άρχισε με το υποσύνολο S0, δηλαδή θέσε S best S0 και αποτίμησέ το. Παρήγαγε ένα νέο υποσύνολο S και αποτίμησέ το. Αν το S είναι καλύτερο από το Sbest, θέσε αποτίμηση. S best S και κράτα τη νέα Επανέλαβε τα βήματα 2 και 3, μέχρι να ικανοποιηθεί κάποιο προκαθορισμένο κριτήριο τερματισμού. Το αποτέλεσμα του αλγόριθμου για το τελευταίο υποσύνολο θεωρείται ως το τελικό αποτέλεσμα. Με τη μεγάλη ποικιλία που υπάρχει σε στρατηγικές ψαξίματος και μετρικές αξιολόγησης, μπορούν να σχεδιαστούν διαφορετικοί μεμονωμένοι αλγόριθμοι του filter μοντέλου. Δεδομένου ότι το filter μοντέλο εφαρμόζει ανεξάρτητα κριτήρια αξιολόγησης, δηλαδή δε χρησιμοποιεί κάποιον αλγόριθμο εξόρυξης, δε μεταφέρει στην όλη διαδικασία την πόλωση την οποία ενδέχεται αυτός να επιφέρει και είναι επίσης υπολογιστικά αποδοτικό. Ένας γενικευμένος wrapper αλγόριθμος περιγράφεται πανομοιότυπα με το γενικευμένο filter αλγόριθμο. Η διαφορά είναι ότι η αποτίμηση γίνεται με τη χρήση ενός προκαθορισμένου αλγόριθμου εξόρυξης Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 94
95 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής και όχι κάποιας ανεξάρτητης μετρικής. Διαφορετικές στρατηγικές ψαξίματος και διαφορετικοί αλγόριθμοι εξόρυξης παράγουν επιμέρους αλγόριθμους επιλογής γνωρισμάτων του wrapper μοντέλου. Το wrapper μοντέλο προσφέρει την ανώτερη απόδοση, δεδομένου ότι τα υποσύνολα γνωρισμάτων που παράγονται ταιριάζουν καλύτερα στον προκαθορισμένο αλγόριθμο εξόρυξης. Είναι, όμως, πιο ακριβό υπολογιστικά από το filter μοντέλο. Το υβριδικό μοντέλο συνδυάζει τα πλεονεκτήματα των παραπάνω δύο μοντέλων και αποφεύγει τον προκαθορισμό ενός κριτηρίου διακοπής. Ένας γενικός υβριδικός αλγόριθμος κάνει χρήση και ενός ανεξάρτητου μέτρου και ενός αλγόριθμου εξόρυξης, για να αξιολογήσει τα υποσύνολα των γνωρισμάτων. Χρησιμοποιεί το ανεξάρτητο μέτρο για να αναγνωριστούν τα καλύτερα υποσύνολα ενός συγκεκριμένου μεγέθους και χρησιμοποιεί τον αλγόριθμο εξόρυξης για να επιλέξει το τελικό καλύτερο υποσύνολο μεταξύ των καλύτερων υποσυνόλων στις διαφορετικά μεγέθη. Η ποιότητα του αποτελέσματος του αλγόριθμου εξόρυξης αποτελεί ένα φυσικό κριτήριο τερματισμού στο υβριδικό μοντέλο. ΠΑΡΑΓΩΓΗ ΥΠΟΣΥΝΟΛΩΝ Η παραγωγή υποσυνόλων είναι ουσιαστικά μια διαδικασία ευρετικού ψαξίματος στο χώρο όλων των δυνατών υποσυνόλων γνωρισμάτων. Η φύση αυτής της διαδικασίας καθορίζεται από δύο βασικά ζητήματα. Αρχικά, κάποιος πρέπει να αποφασίσει την αφετηρία αναζήτησης. Η αναζήτηση μπορεί να αρχίσει με το κενό σύνολο και να προσθέτει διαδοχικά τα γνωρίσματα ή να αρχίσει με το πλήρες σύνολο και να αφαιρεί διαδοχικά τα γνωρίσματα ή να αρχίσει και με τα δύο άκρα και να προσθέτει και να αφαιρεί τα γνωρίσματα ταυτόχρονα. Η αναζήτηση μπορεί επίσης να αρχίσει με ένα τυχαία επιλεγμένο υποσύνολο προκειμένου να αποφευχθεί πιθανή σύγκλισή της σε τοπικά βέλτιστα. Δεύτερον, κάποιος πρέπει να αποφασίσει μια στρατηγική αναζήτησης. Για ένα σύνολο n γνωρισμάτων υπάρχουν υποψήφια υποσύνολα, με αποτέλεσμα η εξαντλητική αποτίμησή τους να καθίσταται απαγορευτική. Επομένως, διάφορες ευρετικές στρατηγικές έχουν προταθεί, που κατηγοριοποιούνται σε στρατηγικές πλήρους, ακολουθιακής και τυχαίας αναζήτησης. Η πλήρης αναζήτηση εγγυάται να βρει το βέλτιστο αποτέλεσμα σύμφωνα με το χρησιμοποιούμενο κριτήριο αξιολόγησης. Ενώ μια εξαντλητική αναζήτηση είναι πλήρης, μια αναζήτηση δεν είναι απαραίτητο να είναι εξαντλητική 95 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο n 2
96 προκειμένου να εγγυάται πληρότητα. Διάφορες τεχνικές μπορούν να χρησιμοποιηθούν για να μειώσουν το διάστημα αναζήτησης, χωρίς να διακινδυνεύονται οι πιθανότητες να βρεθεί το βέλτιστο αποτέλεσμα. Ως εκ n O 2, ένας τούτου, αν και η τάξη του διαστήματος αναζήτησης είναι ( ) μικρότερος αριθμός υποσυνόλων αποτιμάται. Μερικά παραδείγματα τέτοιων τεχνικών είναι οι branch and bound και beam search. Η ακολουθιακή αναζήτηση δεν είναι πλήρης και διακινδυνεύεται έτσι να χαθούν βέλτιστα υποσύνολα. Υπάρχουν πολλές παραλλαγές της προσέγγισης άπληστης αναζήτησης, όπως αυτή της ακολουθιακής προς τα μπρος επιλογής (sequential forward selection), της ακολουθιακής προς τα πίσω απαλοιφής (sequential backward elimination) και της διδιευθυνόμενης επιλογής (bidirectional selection). Όλες αυτές οι προσεγγίσεις προσθέτουν ή αφαιρούν τα γνωρίσματα κατά ένα κάθε φορά. Μια άλλη εναλλακτική λύση είναι να προστίθενται ή να αφαιρούνται p γνωρίσματα κάθε φορά και να αφαιρούνται ή να προστίθενται q γνωρίσματα στο επόμενο βήμα, με p > q. Οι αλγόριθμοι ακολουθιακής αναζήτησης είναι απλοί στην εφαρμογή και ταχύτατοι στην παραγωγή αποτελεσμάτων, καθώς μειώνουν την τάξη του διαστήματος 2 O n. Η τυχαία αναζήτηση επιλέγει αρχικά ένα τυχαίο αναζήτησης σε ( ) υποσύνολο γνωρισμάτων και συνεχίζει με δύο πιθανούς τρόπους. Ο ένας τρόπος είναι να πραγματοποιηθεί ακολουθιακή αναζήτηση. Λόγω της εμφάνισης τυχαιότητας στο πρώτο βήμα, η μέθοδος αυτή συνολικά καλείται άπληστη αναζήτηση με τυχαία αρχικοποίηση. Ο άλλος είναι να παραχθεί το επόμενο υποσύνολο απολύτως τυχαία. Η μέθοδος αυτή συνολικά καλείται αλγόριθμος Las Vegas. Για του τελευταίου τύπου προσεγγίσεις, η χρήση της τυχαιότητας βοηθά στο να δραπετεύουν από τα τοπικά βέλτιστα του διαστήματος αναζήτησης. ΑΠΟΤΙΜΗΣΗ Όπως προαναφέρθηκε, κάθε υποσύνολο γνωρισμάτων που παράγεται πρέπει να αποτιμάται με βάση κάποιο επιλεγμένο κριτήριο αξιολόγησης. Τα κριτήρια μιας αποτίμησης κατηγοριοποιούνται ανάλογα με το αν εξαρτώνται από τον αλγόριθμο εξόρυξης, ο οποίος τελικά θα εφαρμοστεί στο επιλεγμένο υποσύνολο γνωρισμάτων. Κατά συνέπεια, υπάρχουν τα ανεξάρτητα και τα εξαρτημένα κριτήρια αποτίμησης. Τα δεύτερα αποτελούν και γενικότερα κριτήρια αποτίμησης αλγόριθμων εξόρυξης, όπως είναι οι αλγόριθμοι ταξινόμησης και οι αλγόριθμοι συσταδοποίησης. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 96
97 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Τυπικά, ένα ανεξάρτητο κριτήριο αποτίμησης χρησιμοποιείται στο filter μοντέλο. Προσπαθεί να αξιολογήσει πόσο καλό είναι ένα γνώρισμα ή ένα υποσύνολο γνωρισμάτων με την εκμετάλλευση των εγγενών χαρακτηριστικών των δεδομένων, χωρίς την ανάμειξη οποιουδήποτε αλγόριθμου εξόρυξης. Τέτοια κριτήρια είναι οι μετρικές απόστασης, οι μετρικές πληροφορίας, οι μετρικές εξάρτησης και οι μετρικές συνέπειας. Μια μετρική απόστασης σε ένα πρόβλημα ταξινόμησης προσπαθεί να διαχωρίσει τις κλάσεις όσο καλύτερα μπορεί. Συνεπώς, ένα γνώρισμά προτιμάται από ένα άλλο, αν προκαλεί μεγαλύτερη διαφορά στις υπό συνθήκη πιθανότητες δεδομένων των επιμέρους κλάσεων. Μια μετρική πληροφορίας καθορίζει το κέρδος πληροφορίας που προσφέρει ένα γνώρισμα. Το κέρδος αυτό ορίζεται ως η διαφορά μεταξύ της εκ των προτέρων αβεβαιότητας και της αναμενόμενης εκ των υστέρων αβεβαιότητας, δεδομένου του γνωρίσματος. Μια μετρική εξάρτησης καλείται και μετρική συσχέτισης ή ομοιότητας. Μετρά τη δυνατότητα να προβλεφθεί η τιμή μιας μεταβλητής από την τιμή μιας άλλης μεταβλητής. Για την ταξινόμηση, υπολογίζεται η εξάρτηση του εκάστοτε γνωρίσματος από τη μεταβλητή κλάσης. Για τη συσταδοποίηση, μετριέται η ομοιότητα μεταξύ δύο οποιωνδήποτε γνωρισμάτων. Μια μετρική συνέπειας, τέλος, προσπαθεί να υπολογίσει το ελάχιστο υποσύνολο γνωρισμάτων, το οποίο διαχωρίζει τις οντότητες με συνέπεια ίση με αυτής του πλήρους συνόλου γνωρισμάτων. Ως ασυνέπεια χαρακτηρίζεται το να διαθέτουν δύο οντότητες τις ίδιες τιμές γνωρισμάτων, αλλά να ταξινομούνται διαφορετικά. Αυτές οι μετρικές διαφέρουν από τις υπόλοιπες, στο ότι βασίζονται αρκετά στην πληροφορία της κλάσης. Τυπικά, ένα εξαρτημένο κριτήριο χρησιμοποιείται στο wrapper μοντέλο. Απαιτεί έναν αλγόριθμο εξόρυξης, του οποίου την απόδοση χρησιμοποιεί για την αποτίμηση του εκάστοτε υποσυνόλου γνωρισμάτων. Συνήθως προσφέρει την ανώτερη απόδοση, δεδομένου ότι βρίσκει τα γνωρίσματα που ταιριάζουν καλύτερα στον προκαθορισμένο αλγόριθμο εξόρυξης, αλλά τείνει να είναι ακριβό υπολογιστικά και μπορεί να μην είναι κατάλληλο για άλλους αλγορίθμους εξόρυξης. Για την αποτίμηση μιας ταξινόμησης συνήθως χρησιμοποιείται το ποσοστό των επιτυχώς ταξινομημένων οντοτήτων. Επειδή στο σύνολο δοκιμής οι κλάσεις δεν είναι γνωστές, χρησιμοποιείται ως σύνολο δοκιμής ένα υποσύνολο των οντοτήτων του συνόλου εκπαίδευσης. Πιο συχνά, οι οντότητες διαμερίζονται σε 10 ισομεγέθη υποσύνολα και κάθε φορά 9 από αυτά χρησιμοποιούνται για την εκπαίδευση, ενώ ένα από αυτά για τη δοκιμή. Η μέθοδος αποτίμησης αυτή καλείται 10-fold cross validation και η απόδοση 97 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
98 της ταξινόμησης προκύπτει από το μέσο ποσοστό των επιτυχώς ταξινομημένων οντοτήτων στις 10 επαναλήψεις. Δεδομένου ότι τα γνωρίσματα επιλέγονται από τον ταξινομητή που τα χρησιμοποιεί αργότερα για την τελική ταξινόμηση, η ακρίβεια αναμένεται να είναι υψηλή, αλλά είναι υπολογιστικά εξαιρετικά δαπανηρό η αποτίμηση αυτή να γίνει σε κάθε δυνατό υποσύνολο γνωρισμάτων. Όταν δεν υπάρχουν δεδομένα κλάσης, το wrapper μοντέλο επιλέγει μη επιβλεπόμενα το βέλτιστο υποσύνολο γνωρισμάτων, με τη χρήση ενός αλγόριθμου συσταδοποίησης. Η αξιολόγηση ενός αλγόριθμου συσταδοποίησης για ένα υποσύνολο γνωρισμάτων πραγματοποιείται με τη χρήση κάποιας ευρετικής μετρικής, από αυτές που έχουν αναπτυχθεί για τη αξιολόγηση της ποιότητας των αποτελεσμάτων συσταδοποίησης [DM11]. Τέτοιες μετρικές υπολογίζουν την εσωτερική ομοιογένεια (compactness) των συστάδων, τη συνδεσιμότητά τους (connectedness), και τη διαχωριστικότητά τους στο χώρο (spatial separation). Η εσωτερική ομοιογένεια εκφράζεται από το άθροισμα του τετραγωνικού σφάλματος συστάδας, δηλαδή το κριτήριο βελτιστοποίησης το οποίο χρησιμοποιεί ο αλγόριθμος k-means. Η εσωτερική ομοιογένεια γίνεται μικρή (βέλτιστη), όταν οι συστάδες είναι σφαιρικού σχήματος και πυκνές, δηλαδή συμπαγείς. Οι μετρικές συνδεσιμότητας ελέγχουν ένα πλήθος k πλησιέστερων γειτόνων για κάθε οντότητα και εξετάζουν αν αυτοί ανήκουν στην ίδια συστάδα. Το κριτήριο αυτό είναι πιο εύρωστο όταν αντιμετωπίζονται μη σφαιρικές συστάδες, αλλά αρκετά παραπλανητικό όταν οι συστάδες δε διαχωρίζονται ξεκάθαρα. Οι μετρικές διαχωρισμού, τέλος, εξετάζουν το πόσο καλά διαχωρισμένες είναι οι παραγόμενες συστάδες. Ωστόσο, αυτό από μόνο του αποτελεί ένα κριτήριο που ικανοποιείται και από πολύ προφανείς λύσεις και παρέχει ελάχιστη συγκριτική πληροφορία για επιμέρους συσταδοποιήσεις. Γι αυτό, συνήθως, συνδυάζεται με άλλα κριτήρια, όπως αυτό της εσωτερικής ομοιογένειας και της εξισορρόπησης των μεγεθών των σχηματιζόμενων συστάδων. ΚΡΙΤΗΡΙΑ ΤΕΡΜΑΤΙΣΜΟΥ ΚΑΙ ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΑΠΟΤΕΛΕΣΜΑΤΟΣ Ένα κριτήριο τερματισμού καθορίζει πότε η διαδικασία επιλογής γνωρισμάτων σταματάει. Μερικά κριτήρια διακοπής που χρησιμοποιούνται συχνά είναι: Όταν η αναζήτηση ολοκληρώνεται. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 98
99 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Όταν κάποια προκαθορισμένα φράγματα επιτυγχάνονται, για παράδειγμα το ελάχιστο μέγεθος υποσυνόλου γνωρισμάτων ή ο μέγιστος αριθμός επαναλήψεων του αλγόριθμου. Όταν μια επανάληψη του αλγόριθμου δεν επιφέρει καλύτερο αποτέλεσμα από την προηγούμενη. Όταν ένα επαρκώς καλό υποσύνολο γνωρισμάτων επιλέγεται, με βάση κάποιο προκαθορισμένο κατώφλι απόδοσης. Ένας τρόπος για την αποτίμηση του τελικού αποτελέσματος είναι η άμεση σύγκρισή του με την προγενέστερη γνώση που υπάρχει για τα δεδομένα. Αν είναι γνωστά τα σχετικά γνωρίσματα εκ των προτέρων, όπως στην περίπτωση των συνθετικών δεδομένων, μπορούμε να συγκρίνουμε αυτό το γνωστό σύνολο γνωρισμάτων με τα επιλεγμένα γνωρίσματα. Η γνώση των ασυσχέτιστων ή περιττών γνωρισμάτων μπορεί επίσης να βοηθήσει. Στις πραγματικές εφαρμογές, όμως, συνήθως δεν υπάρχει τέτοια προγενέστερη γνώση. Ως εκ τούτου, πρέπει να εφαρμοστούν έμμεσες μέθοδοι, που να ελέγχουν την αλλαγή της απόδοσης της εξόρυξης καθώς μεταβάλλεται το υποσύνολο των γνωρισμάτων. Για παράδειγμα, εάν χρησιμοποιείται το ποσοστό λαθών ταξινόμησης ως δείκτης απόδοσης, για ένα επιλεγμένο υποσύνολο γνωρισμάτων, μπορεί απλά η τιμή του δείκτη αυτού να συγκριθεί με την τιμή του ίδιου δείκτη, όταν το πλήρες σύνολο γνωρισμάτων χρησιμοποιείται για το αντίστοιχο πρόβλημα ταξινόμησης. 99 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
100 BAYESIAN ΠΡΟΣΕΓΓΙΣΕΙΣ ΓΙΑ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ BAYESIAN ΔΙΚΤΥΑ Τα Bayesian δίκτυα (Bayesian networks - BNs) ή δίκτυα πεποίθησης (belief networks) [DM18] αποτελούν πιθανοτικές γραφικές δομές, που αναπαριστούν γνώση γύρω από κάποιο αβέβαιο πεδίο. Στα δίκτυα αυτά, ο κάθε κόμβος αναπαριστά μια τυχαία μεταβλητή, η οποία αντιστοιχεί σε κάποιο γνώρισμα μιας οντότητας. Οι ακμές ανάμεσα στους κόμβους αναπαριστούν πιθανοτικές εξαρτήσεις ανάμεσα στις τυχαίες μεταβλητές. Οι πιθανοτικές εξαρτήσεις αυτές εκτιμώνται συχνά με τη χρήση γνωστών στατιστικών και υπολογιστικών μεθόδων, και χρησιμοποιούνται στην εξαγωγή εύλογης συμπερασματολογίας (inference) για τις αναπαριστώμενες μεταβλητές. Για παράδειγμα, μπορούν να προβλεφθούν οι άγνωστες τιμές ενός συνόλου μη παρατηρούμενων μεταβλητών, δεδομένων των γνωστών τιμών ενός συνόλου παρατηρούμενων μεταβλητών. Αν το ενδιαφέρον επικεντρωθεί σε μία μόνο μη παρατηρούμενη μεταβλητή, το πρόβλημα της inference σε ένα δοθέν BN ανάγεται με προφανή τρόπο σε πρόβλημα ταξινόμησης ή συσταδοποίησης, ανάλογα με το αν είναι εκ των προτέρων διαθέσιμα ή όχι τα δεδομένα της μεταβλητής αυτής. Η μεταβλητή αυτή αναπαριστά το γνώρισμα κλάσης ή συστάδας, αντίστοιχα. Πιο αναλυτικά, ένα BN κωδικοποιεί την κοινή κατανομή πιθανότητας ενός συνόλου από n τυχαίες μεταβλητές: X 1,, X. Οι κόμβοι, δηλαδή οι τυχαίες μεταβλητές, του BN οργανώνονται στη δομή ενός διευθυνόμενου ακυκλικού γραφήματος (directed acyclic graph - DAG). Αυτό σημαίνει ότι, (1) κάθε ακμή του δικτύου έχει μια διεύθυνση από έναν κόμβο προς έναν άλλο και (2) δεν υπάρχει καμία ακολουθία διευθυνόμενων ακμών στο δίκτυο, που να οδηγεί από οποιονδήποτε κόμβο προς τον εαυτό του. Μια ακμή από έναν κόμβο προς έναν άλλο αναπαριστά μια στατιστική εξάρτηση ανάμεσα στις αντίστοιχες μεταβλητές. Η διεύθυνση υποδεικνύει, ότι η τιμή της μεταβλητής του δεύτερου κόμβου εξαρτάται από την τιμή της μεταβλητής του πρώτου κόμβου. Δηλαδή, η πρώτη μεταβλητή θεωρείται πως επηρεάζει τη δεύτερη μεταβλητή. Ο πρώτος κόμβος αναφέρεται και ως γονέας του δεύτερου κόμβου, ενώ ο δεύτερος αναφέρεται και ως παιδί του πρώτου. Κατ επέκταση, ένας κόμβος θεωρείται πρόγονος ενός άλλου, αν υπάρχει ακολουθία διευθυνόμενων ακμών που να οδηγεί από τον πρώτο στο δεύτερο. Ο δεύτερος κόμβος θεωρείται απόγονος του πρώτου. Η δομή του DAG εξασφαλίζει, ότι κανένας κόμβος δεν μπορεί να είναι ταυτόχρονα πρόγονος n Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 100
101 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής και απόγονος ενός άλλου. Με βάση τους παραπάνω ορισμούς, ένα BN αναπαριστά την ακόλουθη απλή ιδιότητα των υπό συνθήκη εξαρτήσεων των αναπαριστώμενων μεταβλητών: κάθε μεταβλητή στο δίκτυο είναι ανεξάρτητη από όλες τις μη απογόνους μεταβλητές της, δεδομένων των τιμών του συνόλου των γονέων μεταβλητών της. Η ιδιότητα αυτή καλείται ιδιότητα Markov. Επιπρόσθετα με τη δομή του DAG, η οποία χαρακτηρίζεται ως η ποιοτική περιγραφή ενός BN, το BN περιγράφεται και ποσοτικά, με τη χρήση ενός συνόλου συναρτήσεων υπό συνθήκη κατανομών πιθανότητας. Οι συναρτήσεις αυτές περιγράφονται με τρόπο συνεπή με την ιδιότητα Markov: κάθε συνάρτηση υπό συνθήκη κατανομής πιθανότητας για ένα κόμβο εξαρτάται αποκλειστικά από τους γονείς του κόμβου. Η ιδιότητα αυτή χρησιμοποιείται, για να μειώσει το πλήθος των παραμέτρων που απαιτεί ο υπολογισμός της κοινής κατανομής πιθανότητας του συνόλου των αναπαριστώμενων μεταβλητών. Έστω Π att το σύνολο των γονέων μεταβλητών της μεταβλητής X. Η συνάρτηση κοινής κατανομής πιθανότητας του συνόλου των att αναπαριστώμενων μεταβλητών σε ένα BN μπορεί να προκύψει από τον ακόλουθο απλοποιημένο τύπο: P n ( X 1,..., Xn) = P( X att Πatt) att= 1. Αυτή η απλοποίηση παρέχει έναν πιο αποδοτικό τρόπο για τον υπολογισμό των εκ των υστέρων κατανομών πιθανοτήτων, όταν γίνονται γνωστές οι τιμές των παρατηρούμενων μεταβλητών. Αυτό θα φανεί καλύτερα με το ακόλουθο παράδειγμα. Έστω ένα σύνολο από 5 δυαδικές μεταβλητές, οι οποίες εξαρτώνται μεταξύ τους με τον τρόπο που αναπαριστά το BN της ακόλουθης φιγούρας. Αν δεν ήταν γνωστή μια τέτοια δομή των εξαρτήσεων των μεταβλητών, ο υπολογισμός της κοινής κατανομής πιθανότητας θα γινόταν με βάση το γνωστό κανόνα αλυσίδας: ( X X, X, X, X ) P( X ) P( X X ) P( X X, X ) P( X X, X, X ) P( X X, X, X, ). P = 1, X 1 Ο κανόνας αυτός απαιτεί τον υπολογισμό ενός πλήθους από = 31 παραμέτρους. Με χρήση του απλοποιημένου κανόνα που προκύπτει από την εφαρμογή της ιδιότητας Markov στο BN της φιγούρας, 101 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
102 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 102 ( ) ( ) ( ) ( ) ( ) ( ) ,,,,, X X P X X X P X X P X P X P X X X X X P =, απαιτείται ο υπολογισμός ενός πλήθους μόνο από = παραμέτρους. [DM Εικόνα 5] - Παράδειγμα ενός Bayesian δικτύου. Δοθέντος ενός BN, υπάρχουν δύο κατηγορίες πιθανών ερωτημάτων inference. Η πρώτη κατηγορία αφορά προγνωστικά ερωτήματα, δηλαδή ζητείται να προβλεφθεί η τιμή μιας μεταβλητής από τις τιμές ενός συνόλου παρατηρούμενων απόγονων μεταβλητών της. Η δεύτερη κατηγορία αφορά διαγνωστικά ερωτήματα, δηλαδή ζητείται να προβλεφθεί η τιμή μιας μεταβλητής από τις τιμές ενός συνόλου παρατηρούμενων πρόγονων μεταβλητών της. Ένα παράδειγμα διαγνωστικού ερωτήματος στο παραπάνω BN είναι να υπολογιστεί η πιθανότητα του T X = 1, δεδομένου ότι T X = 5. Αυτή προκύπτει από την εφαρμογή του απλοποιημένου κανόνα ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) { } ( ) ( ) ( ) ( ) ( ) { }.,,,,,,,,,,,,,, ,,, = = = = = = = = = = = = = = = = = = = = = = = = = F T F T X T X P X X X P X X P X P X P X T X P T X X X P T X X P X P T X P T X X X X X P T X X X X T X P T X T X P ν µ λ κ ν µ λ ν κ λ ν κ µ λ κ ν λ ν µ λ
103 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Το πλήθος των παραμέτρων που απαιτούνται για τον παραπάνω υπολογισμό είναι πολύ μικρότερο από αυτό που θα χρειαζόταν αν η δομή των συσχετίσεων των μεταβλητών ήταν άγνωστη. Ωστόσο και πάλι, ακόμα και σε αυτή την πολύ απλή περίπτωση των δυαδικών μεταβλητών, το νούμερο που n O 2. Έχει αποδειχθεί, πως προκύπτει είναι εκθετικό, δηλαδή της τάξης του ( ) η ακριβής επίλυση ενός ερωτήματος inference σε μια αυθαίρετη τοπολογία BN αποτελεί NP-hard πρόβλημα. Γι αυτό έχουν προταθεί διάφοροι αποδοτικοί αλγόριθμοι, όπως είναι ο αλγόριθμος διαβίβασης μηνυμάτων (message passing algorithm) του Pearl, που πραγματοποιούν ακριβές inference σε απλοποιημένες κατηγορίες δομών BN, όπως σε δενδροειδείς δομές. Επίσης, υπάρχει μια ποικιλία από αλγόριθμους προσεγγιστικού inference σε αυθαίρετες δομές BN. Τέτοιος είναι ο αλγόριθμος διάδοσης των πεποιθήσεων σε βρόχους (loopy belief propagation), καθώς και διάφορες παραλλαγές της κοινής μεθόδου Markov chain Monte Carlo (MCMC). Σε πολλές πρακτικές εφαρμογές, το BN είναι άγνωστο και πρέπει να εκτιμηθεί από τα υπάρχοντα δεδομένα. Το πρόβλημα αυτό καλείται εκμάθηση ενός BN [DM12]. Συγκεκριμένα, δοθέντος ενός συνόλου δεδομένων εκπαίδευσης και βάσει της υπάρχουσας εκ των προτέρων πληροφορίας (για παράδειγμα, έμπειρης γνώσης), ζητείται να εκτιμηθεί η τοπολογία του γραφήματος του BN και να υπολογιστούν οι άγνωστες εκ των προτέρων κατανομές πιθανότητας. Η εκμάθηση της δομής του BN αποτελεί δυσκολότερο πρόβλημα από την εκμάθηση των πιθανοτικών παραμέτρων του. Όταν, επιπλέον, υπάρχει μερική παρατηρησιμότητα των δεδομένων, δηλαδή όταν κάποιες τιμές κάποιων εκ των μεταβλητών είναι άγνωστες, το πρόβλημα της εκμάθησης ενός BN καθίσταται ακόμα πιο δύσκολο. Έστω x 1, x2,..., xm το σύνολο των n- διανυσμάτων των γνωρισμάτων των m οντοτήτων των δεδομένων, με x i = ( xi 1, xi 2,..., xin). Στην απλούστερη των περιπτώσεων, όπου δηλαδή η δομή του BN είναι γνωστή και υπάρχει πλήρης παρατηρησιμότητα στα δεδομένα, ζητείται να εκτιμηθεί το σύνολο των πιθανοτικών παραμέτρων του BN, έτσι ώστε να μεγιστοποιείται ο λογάριθμος της πιθανοφάνειας (log-likelihood) των δεδομένων, δηλαδή της πιθανότητας τα δεδομένα να εξάγονται από τη συγκεκριμένη δομή BN και τις προκύπτουσες πιθανοτικές παραμέτρους. Η m n ποσότητα αυτή ορίζεται ως P( x i, att i, att) i= 1att= 1 log π, όπου π i, att είναι τα δεδομένα της οντότητας i για το σύνολο των μεταβλητών Π att. Όταν υπάρχει μερική παρατηρησιμότητα των δεδομένων, το πρόβλημα του βέλτιστου υπολογισμού των πιθανοτικών παραμέτρων καθίσταται NP-hard. Κοινοί 103 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
104 προσεγγιστικοί αλγόριθμοι που χρησιμοποιούνται, είναι συνήθως ο αλγόριθμος μεγιστοποίησης της μέσης τιμής (Expectation Maximization - EM) ή, εναλλακτικά, MCMC τεχνικές. Η εκμάθηση μιας δομής BN που να εξηγεί βέλτιστα τα δεδομένα, αποτελεί σε κάθε περίπτωση NP-hard πρόβλημα. Αυτό οφείλεται στο γεγονός, ότι το πλήθος των δυνατών DAG που αντιστοιχούν σε ένα σύνολο n μεταβλητών είναι υπερεκθετικό ως προς το n. Μια απλουστευμένη προσέγγιση είναι να θεωρηθεί, πως όλες οι μεταβλητές πλην μίας είναι στατιστικά ανεξάρτητες μεταξύ τους, δεδομένης της τιμής αυτής της ειδικής μεταβλητής. Ένα τέτοιο BN καλείται naïve-bn και η δομή του αντιστοιχεί σε ένα δένδρο, με μοναδικό πατέρα (ρίζα) την ειδική αυτή μεταβλητή και παιδιά του (φύλλα) όλες τις υπόλοιπες. Αν και το απλοϊκό αυτό μοντέλο βασίζεται σε μια υπόθεση που είναι σπάνια ρεαλιστική, έχει αποδειχθεί στην πράξη ότι παρέχει εκπληκτικά καλά αποτελέσματα σε κάποιες εξειδικευμένες εφαρμογές των BN, όπως είναι η ταξινόμηση και η συσταδοποίηση. Η ειδική μεταβλητή στις εφαρμογές αυτές προφανώς αναπαριστά το γνώρισμα κλάσης ή συστάδας, αντίστοιχα. Για την εκμάθηση σύνθετων δομών υπάρχει ένα σύνολο από ευρετικούς αλγόριθμους, όπως ο αλγόριθμος K2 ή ο κοινός άπληστος αλγόριθμος, οι οποίοι ψάχνουν το χώρο των πιθανών δομών με μη εξαντλητικό τρόπο, και συνεπώς με ανοιχτό το ενδεχόμενο να μην εντοπίσουν την ολικά βέλτιστη λύση. Εναλλακτικά, υπάρχουν αλγόριθμοι οι οποίοι δε βασίζονται στα δεδομένα, αλλά σε ένα εκ των προτέρων γνωστό σύνολο από στατιστικές εξαρτήσεις των αναπαριστώμενων μεταβλητών. Αυτό το σύνολο μπορεί να προκύψει είτε από τα δεδομένα, με τη χρήση στατιστικών δοκιμασιών ανάμεσα στις μεταβλητές, είτε με βάση την υπάρχουσα έμπειρη γνώση. Οι αλγόριθμοι αυτοί καλούνται αλγόριθμοι βάσει των περιορισμών (constraint based) και ένας τέτοιος είναι ο IC αλγόριθμος. Όταν υπάρχει μερική παρατηρησιμότητα των δεδομένων, η εκμάθηση της δομής του BN πραγματοποιείται με το δομικό EM αλγόριθμο. Ο δομικός EM συνδυάζει τον κλασσικό EM αλγόριθμο με ταυτόχρονο ψάξιμο στο χώρο των πιθανών δομών. Σκοπός είναι η μεγιστοποίηση της τιμής του BIC κριτηρίου (Bayesian information criterion), το οποίο αποτελεί μια ασυμπτωτική προσέγγιση της λογαριθμικής πιθανοφάνειας των δεδομένων. Έστω #G η διάσταση του μοντέλου, δηλαδή το πλήθος των παραμέτρων του, το οποίο μπορεί να είναι μικρότερο όταν απουσιάζουν κάποια δεδομένα μεταβλητών. Το BIC κριτήριο, που συχνά αναφέρεται στη βιβλιογραφία και ως MDL αρχή (minimum description length principle), παρέχει trade-offs ανάμεσα στην πιθανοφάνεια Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 104
105 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής των δεδομένων και την πολυπλοκότητα της επιλεγμένης δομής του BN, ως ακολούθως: BIC m n = i= 1 att= 1 logp logm 2 ( x π ) G i, att i, att #. ΤΑΞΙΝΟΜΗΣΗ ΚΑΙ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕ ΤΟ NAIVE-BAYES ΜΟΝΤΕΛΟ Τα naïve-bayes μοντέλα [DM16] ονομάζονται έτσι, λόγω της απλούστατης παραδοχής την οποία πρεσβεύουν, ότι όλες οι μεταβλητές Xatt είναι αμοιβαία στατιστικά ανεξάρτητες, δοθείσης της τιμής μιας ειδικής μεταβλητής C. Η κοινή κατανομή πιθανότητας, τότε, αποδίδεται απλοποιημένα από την n ισότητα P( C X 1,..., X n) = P( C) = P( X ) att att C 1 πιθανότητας ( X C),. Οι υπό συνθήκη κατανομές P att μπορεί να είναι είτε διακριτές είτε συνεχείς, ανάλογα με τα διαθέσιμα δεδομένα. Στη δεύτερη περίπτωση, οι υπό συνθήκη πιθανότητες θεωρείται πως υπακούουν στην κανονική (Gaussian) κατανομή. Για το λόγο αυτό, τα naïve-bayes μοντέλα συχνά αναφέρονται και ως μοντέλα ανάμειξης κανονικών κατανομών (Gaussian mixture models). Αν και η εφαρμογή του naïve-bayes μοντέλου για την επίλυση οποιουδήποτε ερωτήματος inference θα μπορούσε να φανεί εξαιρετικά χρήσιμη, συνήθως το μοντέλο αυτό εφαρμόζεται για inference στην ειδική μεταβλητή C. Όταν η μεταβλητή C είναι παρατηρούμενη, δηλαδή όταν είναι εκ των προτέρων γνωστές οι τιμές της, οι παράμετροι του naïve-bayes μοντέλου μπορούν να εκπαιδευτούν και στη συνέχεια να χρησιμοποιηθούν για ταξινόμηση. Σε κάθε οντότητα του συνόλου προς ταξινόμηση, ανατίθεται η τιμή κλάσης c που P C= c X,..., [DM10]. Όταν η μεταβλητή 1 X n μεγιστοποιεί την πιθανότητα ( ) C είναι μη παρατηρούμενη, δηλαδή όταν δεν είναι γνωστές οι τιμές της, οι οντότητες μπορούν να συσταδοποιηθούν με εφαρμογή του EM αλγόριθμου και με τη μεταβλητή C να αναπαριστά την εκλιπούσα πληροφορία για τις συστάδες. Κάθε τιμή της C αντιστοιχεί σε μια συστάδα c και η πιθανότητα P C= c X,..., ισοδυναμεί με το βαθμό συμμετοχής μιας οντότητας στη ( ) 1 X n συστάδα αυτή [DM8]. Σε κάθε περίπτωση, οι υπόλοιπες μεταβλητές αντιστοιχούν στα γνωρίσματα των οντοτήτων ταξινόμησης ή συσταδοποίησης, αντίστοιχα. 105 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
106 [DM Εικόνα 6] - Η δομή ενός naïve-bayes δικτύου. Το naïve-bayes μοντέλο αντιστοιχεί σε ένα BN, στο οποίο η μεταβλητή C αποτελεί το μοναδικό πατέρα όλων των υπόλοιπων μεταβλητών. Είναι εύκολο να αποδειχθεί, ότι οποιοδήποτε ερώτημα inference που αφορά τη μεταβλητή C απαιτεί γραμμικό χρόνο ως προς το πλήθος των μεταβλητών των γνωρισμάτων, σε αντιδιαστολή με τον εκθετικό χρόνο που θα απαιτείτο σε ένα BN αυθαίρετης τοπολογίας. Κατά συνέπεια, η χρήση του naïve-bayes μοντέλου για ταξινόμηση ή συσταδοποίηση είναι εξαιρετικά αποδοτική από άποψη χρόνου, τόσο στο στάδιο της εκπαίδευσης του μοντέλου, όσο και σε αυτό της εφαρμογής του στο σύνολο δοκιμής. Άλλα σημαντικά πλεονεκτήματα του naïve-bayes μοντέλου είναι η εξαιρετική του απλότητα και αντιληπτικότητα, η ευρωστία του στο θόρυβο και τους outliers και η ανοχή του στην ύπαρξη εκλιπόντων δεδομένων. Από την άλλη, οι απλουστευμένες παραδοχές στις οποίες βασίζεται το naïve-bayes, αναπόφευκτα του προσάπτουν ορισμένες αδυναμίες. Καταρχήν, η ακρίβεια του μοντέλου μειώνεται αισθητά, όταν οι μεταβλητές των γνωρισμάτων δεν είναι ανεξάρτητες μεταξύ τους. Σε συνδυασμό με το ότι κάποιες μεταβλητές μπορεί να είναι και περιττές ή άσχετες υπό τους όρους του αποτελέσματος της ταξινόμησης ή της συσταδοποίησης, καθίσταται αναγκαία η εφαρμογή μιας διαδικασίας επιλογής των γνωρισμάτων πριν από τη χρήση του μοντέλου. Μια άλλη παραδοχή που δεν είναι πάντα ρεαλιστική, είναι το ότι οι αναπαριστώμενες συνεχείς μεταβλητές ακολουθούν την κανονική κατανομή. Έχει αποδειχθεί, πράγματι, πως το naïve-bayes μοντέλο δεν αποδίδει εξίσου καλά σε μη παραμετρικά δεδομένα, αν αυτά νωρίτερα δεν έχουν διακριτοποιηθεί κατάλληλα. Κάποιες πρόσφατες εργασίες στοχεύουν στο σχεδιασμό βέλτιστων naïve-bayes μοντέλων, συνδυάζοντάς τα με τεχνικές προεπεξεργασίας των δεδομένων σαν αυτές που περιγράφονται παραπάνω [DM9,DM1,DM17]. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 106
107 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΕΙΔΙΚΟ ΜΕΡΟΣ ΥΛΙΚΟ ΣΥΝΟΠΤΙΚΗ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΓΝΩΡΙΣΜΑΤΩΝ ΚΥΤΤΑΡΟΜΕΤΡΙΑΣ ΡΟΗΣ ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝΤΑΙ ΣΤΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ Ακολουθεί η λίστα των αντιγόνων που περιέχονταν στα αρχεία κυτταρομετρίας ροής που χρησιμοποιήθηκαν στον παράδειγμά μας. Σε παρένθεση μετά το όνομα κάθε αντιγόνου παρατίθενται οι διαφορετικοί τρόποι γραφείς τους οποίους συναντήσαμε. CD10 (CD10, CD-10, CD 10) - Η ανάλυση της έκφρασης του αντιγόνου CD10 αποδεικνύεται χρήσιµη, σε συνδυασµό µε άλλους δείκτες, στο χαρακτηρισµό των διάφορων λευχαιµιών. Η ταυτόχρονη ανάλυση των αντιγόνων CD20, CD10 και CD19 συνδράµει στον χαρακτηρισµό των διαφορετικών νεοπλασιών τύπου B όπως οι χρόνιες λεµφοειδείς λευχαιµίες Β (CD10-, CD19+ και CD20+ασθενής). CD103 (CD103, CD 103) Η μη ανίχνευση του αντιγόνου CD103 αποτελεί ένδειξη για την ύπαρξη Β-ΧΛΛ. CD11c (CD11c, CD11 C, CD-11c) H ανάλυση της έκφρασης του αντιγόνου CD11c είναι χρήσιµη για την αναγνώριση και το χαραχτηρισµό των αιµατολογικών δυσλειτουργιών. O CD11c είναι χρήσιµo για την διάγνωση των λευχαιµιών Β, τριχολευκοκυτταρικών λευχαιµιών και ορισµένων λεµφωµάτων Hodgkin. Χρησιµοποιείται στον φαινοτυπικό χαρακτηρισµό των υποοµάδων δενδριτικών κυττάρων περιφερικού αίµατος, όπως χαρακτηρίστηκε από µία µελέτη ασθενών µυελώδους λευχαιµίας. Η ασθενής ανίχνευση καθώς και η ασθενής μη ανίχνευση του αντιγόνου CD11c αποτελεί ένδειξη για την ύπαρξη Β-ΧΛΛ. CD13 (CD13, CD 13, CD/13, CD-13) - Το αντιγόνο CD13 βρίσκεται στα κύτταρα µευελοειδούς προέλευσης και ορισµένα από τα αιµατοποιητικά τους πρόδροµα. Ο δείκτης αυτός συνιστάται για τον φαινοτυπικό προσδιορισµό των οξείων µυελοειδών λευχαιµιών (ΟΜΛ). Η χρήση του παράλληλα µε άλλους µυελοειδής δείκτες (µυελοπεροξειδάση και CD33), 107 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
108 σειράς B (CD79 και CD19) και σειράς T (CD3 και CD7) επιτρέπει την ταυτοποίηση 98% των οξείων λευχαιµιών. Έγινε πρόταση χρήσης βαθµολογιών για την ταξινόµηση των ΟΜΛ. Σε αυτή την περίπτωση, συνιστάται η ταυτόχρονη χρήση άλλων µυελοειδών δεικτών (όπως των CD65, CD117, ή ακόµη των CD14, CD15, CD41, CD61, CD64 και Γλυκοφορίνης A). CD18 (CD18, CD 18) CD19 (CD19, CD 19, CD-19) - Το αντιγόνο CD19 χρησιμεύει στο χαρακτηρισμός και αρίθμηση των πληθυσμών των Β λεμφοκυττάρων κατά τη διάρκεια παθολογικών καταστάσεων του ανοσοποιητικού συστήματος: ανοσοανεπάρκειες, αυτοάνοσες ασθένειες, υπερευαισθησία, ιογενείς λοιμώξεις, ανοσοποιητική αποκατάσταση μετά από μεταμόσχευση μυελού ή/και οργάνου. Κατά τη διάρκεια κακοηθών αιμοπαθειών όπως οι λευχαιμίες και τα λεμφώματα, επιτρέπει την παρακολούθηση και τη φαινοτυπική ανάλυση των πληθυσμών CD19+. CD20 (CD20, CD-20, CD 20, CD/20, CD\20) - Το αντιγόνο CD20 είναι ένας χρήσιµος δείκτης για την ταυτοποίηση ορισµένων λεµφοκυτταρικών συνδρόµων B όταν χρησιµοποιείται σε ένα ευρύ πάνελ φαινοτυπικού προσδιορισµού. Έτσι, η ταυτόχρονη ανάλυση των αντιγόνων CD20 και CD10 συνδράµει στον χαρακτηρισµό των διαφορετικών νεοπλασιών B όπως οι χρόνιες λεµφοειδείς λευχαιµίες Β (ΧΛΛ-Β). CD22 (CD22, CD 22, CD-22) - Το αντίγονο CD22 ανιχνεύεται στο κυτταρόπλασµα νωρίς κατά την οντογένεση των κυττάρων Β (ύστερο στάδιο προ-β), εµφανίζεται στην επιφάνεια των κυττάρων ταυτόχρονα µε την έκφραση του µεµβρανώδους IgD, και βρίσκεται στα περισσότερο ώριµα λεµφοκύτταρα Β. Το αντίγονο CD22 χάνεται κατά τα τερµατικά στάδια διαφοροποίησης πριν το στάδιο πλάσµατος κυττάρου. Στο περιφερικό υγιές αίµα, η έκφραση του αντιγόνου CD22 περιορίζεται από τα λεµφοκύτταρα Β. Το αντίγονο CD22 είναι χρήσιµο στον καθορισµό φαινοτύπου στις περισσότερες λευχαιµίες κυττάρων-β και σχεδόν σε όλα τα λεµφώµατα κυττάρων-β σε συνδυασµό µε άλλους δείκτες. CD23 (CD23, CD 23, CD-23) Η μελέτη των εκφραστικών κυττάρων CD23 με κυτταρομετρία ροής, συμπεριλαμβανομένων των εκφραστικών κυττάρων CD23 κατά την αιμοτοποίηση, συμβάλει στην ταυτοποίηση της χρόνιας λεμφοκυτταρικής λευχαιμίας Β-γενιάς. CD25 (CD25, CD 25) - Το αντιγόνο CD25 ορίζεται γενικά ως ένας ένας δείκτης ενεργοποίησης και διαφοροποίησης. Η ανάλυσή του επιτρέπει Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 108
109 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής τον χαρακτηρισµό και την καταµέτρηση των λευκοκυτταρικών πληθυσµών CD25+ (το συχνότερο τα λεµφοκύτταρα T) κατά τη διάρκεια παθήσεων του ανοσοποιητικού συστήµατος (πχ: ανοσοανεπάρκειες, ιογενείς λοιµώξεις). Η χρήση του CD25 επιτρέπει την παρακολούθηση και τον φαινοτυπικό προσδιορισµό των λευκοκυτταρικών πληθυσµών στις κακοήθεις αιµατοπάθειες (πχ. CD25+ για τις τριχολευκοκυτταρικές λευχαιµίες). CD3 (CD3, CD 3, CD-3) - Το αντιγόνο CD3 είναι ένα πρωτεϊνικό σύµπλεγµα που συµπεριλαµβάνει πέντε πολυπεπτιδικές αλυσίδες (γ, δ, ε, ζ, η) συνδεδεµένες µε TCR (1, 2). Το αντιγόνο CD3 εκφράζεται στα ώριµα T λευκοκύτταρα και σε ένα υποπληθυσµό θυµοκυττάρων (3). Στο περιφερικό αίµα, περίπου 67 µε 76 % των λεµφοκυττάρων είναι CD3+, αλλά το ποσοσστό αυτό είναι κατώτερο στα µικρά παιδιά και εξαρτάται από την ηλικία (4). Το αντιδραστήριο αυτό επιτρέπει το χαρακτηρισµό και την καταµέτρηση των T λεµφοκυττάρων κατά τη διάρκεια παθήσεων του ανοσοποιητικού συστήµατος. CD38 (CD38, CD3 8, CD 38, CD-38) - Χαρακτηρισµός και καταταµέτρηση των λευκοκυτταρικών πληθυσµών που εκφράζουν το µόριο CD38 κατά τη διάρκεια παθήσεων του ανοσοποιητικού συστήµατος οι οποίες προκαλούν την υπερέκφραση του µορίου CD38: ανοσοανεπάρκειες, ιογενείς λοιµώξεις. Παρακολούθηση και φαινοτυποποίηση των λευκοκυτταρικών πληθυσµών CD38+ στις κακοήθεις αιµατοπάθειες. CD4 (CD4, CD 4, CD-4) - Το CD4 είναι αντιδραστήριο φθορίζοντος μονοκλωνικού αντισώματος που χρησιμοποιείται για την ταυτοποίηση και τη μέτρηση του ποσοστού των CD4+ (βοηθητικών) λεμφοκυττάρων στο ολικό αίμα με κυτταρομετρία ροής. CD43 (CD43, CD 43, CD/43) CD5 (CD5, CD 5, CD-5, CD/5, CD\5) Το αντιγόνο CD5 είναι τις χρήσιµος δείκτης για την ταυτοποίηση οριςµένων υπερπλαστικών συνδρόµων όταν χρησιµοποιείται σε ένα ευρύ πάνελ ανοσοφαινοτυποποίησης. Έτσι, η συνέκφραση των CD5 και CD19 επιτρέπει το διαχωριςµό µεταξύ χρόνιων λεµφοειδών λευχαιµιών B (ΧΛΛ-B: CD5+ CD19+) και υπερπλαστικών συνδρόµων T (CD5+ CD19 ). Η ταυτόχρονη ανάλυση των αντιγόνων CD5, CD19 και CD23 επιτρέπει τη λεπτότερη διαφοροποίηση των διάφορων υπερπλασιών B τις µεταξύ των χρόνιων λεµφοειδών λευχαιµιών B (ΧΛΛ-B) και των µικροκυτταρικών λεµφωµάτων που χαρακτηρίζονται CD5+ CD23+ CD19+ από τα λεµφώµατα του µανδύα που είναι CD5+ CD23 CD19+. Η 109 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
110 ταυτόχρονη ανάλυση των αντιγόνων CD5, CD19 και CD10 συνδράµει στον χαρακτηριςµό των διαφορετικών νεοπλασιών τύπου B τις οι ΧΛΛ-B και τα µικροκυτταρικά λεµφώµατα, που χαρακτηρίζονται CD5+ CD10 CD19+ και τα θυλακοειδή λεµφώµατα που χαρακτηρίζονται CD5 CD10+ CD19+. Η ανάλυση αυτή επιτρέπει τις τη διαφοροποίηση των οξείων λεµφοβλαστικών λευχαιµιών B (ΟΛΛ-Β) και των οξείων λεµφοβλαστικών λευχαιµιών προ-b, που χαρακτηρίζονται CD5 CD10+ CD19+, από τις προλεµφοκυτταρικές λευχαιµίες που χαρακτηρίζονται CD5 CD10 CD19+. CD62L (CD62L, CD62 L, CD 62L) CD79b (CD79b, CD 79b, CD-79b) - Η ανάλυση κυτταροµετρίας ροής της έκφρασης του CD79b είναι χρήσιµη κατά τον χαρακτηρισµό των διαταραχών λεµφο-υπερπλασίας κυττάρων Β. Είναι επίσης χρήσιµο για την διαφορική διάγνωση των νεοπλασµατικών κυττάρων Β από τα νεοπλασµατικά κύτταρα Τ ή από τα νεοπλασµατικά µυελώδη κύτταρα. Επιπλέον, το CD79b χρησιµοποιείται στην διάγνωση προγονικής οξείας λεµφοβλαστικής λευχαιµίας Β (pre-b-all) λόγων του ότι πολλοί από αυτούς τους όγκους είναι αρνητικού για άλλα κύτταρα δείκτες Β. CD8 (CD8, CD 8) - To CD8 είναι ένα φθορίζον μονοκλωνικό αντίσωμα που χρησιμοποιείται για την ταυτοποίηση και την καταμέτρηση του ποσοστού των CD8+ (κατασταλτικών/ κυτταροτοξικών) λεμφοκυττάρων σε ολικό αίμα με κυτταρομετρία ροής. CD95 (CD95) FMC7 (FMC7, FMC 7, FMC-7) - ανευρίσκεται αρνητικός στο 84% των ασθενών και είναι δείκτης προλεμφοκυτταρικής λευχαιμίας και λευχαιμίας εκ τριχωτών κυττάρων KAPPA (KAPPA, KAPA, K) LAMDA (LAMDA, L) ΤΑ ΚΛΙΝΙΚΑ ΚΑΙ ΕΡΓΑΣΤΗΡΙΑΚΑ ΑΙΜΑΤΟΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ HOSP το νοσοκομείο στο οποίο έγιναν οι εξετάσεις του ασθενούς, Ρίο-1 και Αγ. Ανδρέας-2. SUBGR το στάδιο στη διάγνωση (χαμηλού-1, ενδιάμεσου-2 ή υψηλού-3 ρίσκου), βάσει ενός εκ των δύο προταθέντων κυτταρολογικών συστημάτων κατηγοριοποίησης, κατά Rai ή κατά Binet. Με βάση την κατηγοριοποίηση κατά Binet, ελέγχονται ως προς το αν έχουν διογκωθεί Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 110
111 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής πέντε περιοχές λεμφοειδών ιστών: ο σπλήνας, το συκώτι και τρεις περιοχές λεμφαδένων (τραχηλικοί, βουβωνικοί και μασχαλιαίοι). Αν έχουν διογκωθεί έως και δύο περιοχές, ο ασθενής θεωρείται χαμηλού ρίσκου, ενώ αν έχουν διογκωθεί περισσότερες, ο ασθενής θεωρείται ενδιάμεσου ρίσκου. Αν επιπλέον (και ανεξάρτητα από το πλήθος των διογκωμένων περιοχών) ο ασθενής εμφανίζει αναιμία (επίπεδα αιμοσφαιρίνης μικρότερα των 10g/dl) ή/και θρομβοκυτοπενία (πλήθος αιμοπεταλίων μικρότερο από 100x10^9/l), κατατάσσεται ως υψηλού ρίσκου. Η κατηγοριοποίηση κατά Rai περιλαμβάνει πέντε στάδια. Τα στάδια 0, I, II, III και IV περιλαμβάνουν αντίστοιχα ασθενείς που δεν παρουσιάζουν κανένα από τα ακόλουθα συμπτώματα (παρά μόνο λεμφοκυττάρωση), που παρουσιάζουν λεμφαδενοπάθεια (έχουν διογκωμένο κάποιον από τους λεμφαδένες), που έχουν διογκωμένο σπλήνα ή συκώτι (σπανιότερα), που χαρακτηρίζονται από αναιμία και που πάσχουν από θρομβοκυτοπενία. Τα στάδια 0 και I χαρακτηρίζονται ως χαμηλού ρίσκου, το στάδιο II χαρακτηρίζεται ως ενδιάμεσου ρίσκου, ενώ τα στάδια III και IV χαρακτηρίζονται ως υψηλού ρίσκου. Η αναλογία εμφάνισης των τριών σταδίων στην πραγματικότητα είναι περίπου 3:1:1. SEX το φύλο του ασθενούς (άνδρας-1 ή γυναίκα-2). Παρατηρείται πως οι άνδρες προσβάλλονται συχνότερα σε σχέση με τις γυναίκες, σε αναλογία 2-3:1. SCORE το επιμέρους score που προκύπτει αποκλειστικά από την ανάλυση δεδομένων κυτταρομετρίας ροής (τιμές από 1 έως 7). Για κάθε ανίχνευση έκφρασης αντιγόνου ή συνδυασμού αντιγόνων που έρχεται σε ταύτιση με κάποιο αντιγονικό πρότυπο ανοσοφαινότυπου της Β-ΧΛΛ, προστίθεται στο score και 1 μονάδα. Score ίσο με 1 (που αποτελεί την πλειοψηφία των περιπτώσεων, γύρω στο 80%) αντιστοιχεί σε τυπική Β- ΧΛΛ, ενώ κάθε μεγαλύτερο score αντιστοιχεί σε ατυπική Β-ΧΛΛ. B-SYM αν ο ασθενής έχει παρουσιάσει συστηματικά συμπτώματα (όχι-1 ή ναι-2). Σχεδόν όλοι οι ασθενείς είναι ασυμπτωματικοί τη στιγμή της διάγνωσης. SPLEEN αν ο ασθενής εμφανίζει σπληνομεγαλία (όχι-1 ή ναι-2). Συμβαίνει περίπου στο 50% των περιπτώσεων των ασθενών. Η παράμετρος αυτή λαμβάνεται υπόψη στον καθορισμό του σταδίου διάγνωσης (γνώρισμα SUBGR). 111 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
112 AUTO αν ο ασθενής παρουσιάζει αυτοανοσία (όχι-1 ή ναι-2), δηλαδή αν εμφανίζει αυτοάνοσες διαταραχές όπως αυτοάνοση αιμολυτική αναιμία ή αυτοάνοση θρομβοκυτοπενία. 1st LINE TX - Θεραπεία πρώτης γραμμής. Έχουμε μη δομημένες τιμές όπως οι: END-MED, END, FLUDARA, M, L, L-M, L-P, LEUKERAN, EM, CHOP, ENDOXAN, Leukeran medrol, Leukeran 5 mg, x 4d, Medrol 16 mg x 5d, Leukeran 6 mg,/d, Medrol 32 mg /d,... RESP1 αν ο ασθενής ανταποκρίθηκε στη θεραπεία πρώτης γραμμής (όχι-1 ή ναι-2). Στη δεύτερη κατηγορία ανήκει και η υποπερίπτωση της μερικής ανταπόκρισης, η οποία εμφανίζεται σπάνια. DOUBLING ο χρόνος διπλασιασμού των λεμφοκυττάρων του ασθενούς. Πρόκειται ουσιαστικά για ένα συνεχές γνώρισμα, το οποίο έχει εξαρχής διακριτοποιηθεί ως ακολούθως: χρόνοι μεγαλύτεροι του ενός έτους (1), χρόνοι μεταξύ των έξι μηνών και του ενός έτους (2) και χρόνοι μικρότεροι των έξι μηνών (3). Οι δύο τελευταίες περιπτώσεις αποτελούν αρνητικά προγνωστικά σημεία για την πορεία της ασθένειας. BIOPSY ο τρόπος διήθησης μυελού των οστών του ασθενούς (διάμεσο- 1, διάχυτο-2, οζώδες-3 ή μεικτό-4). Το γνώρισμα αυτό έχει αναφερθεί πως διαθέτει προγνωστική αξία, με τη διάχυτο διήθηση να αντιστοιχεί στη δυσμενέστερη πρόγνωση. GLOBULINS - Δεν έχει-1, έχει λίγο-2 και έχει πολύ-3 Πρωτεϊνόγραμμα - Έχουμε μη δομημένες τιμές όπως οι: αύξηση των α1, α2, β και γ σφαιρινών, Αύξηση α1 σφαιρίνης και υπογαμμασφαιριναιμία, Αυζηση α2 σφαιρινων, Αύξηση α2-σφαιρινών, υπο-γ-σφαιριναιμία, 2 M- ζώνες, A/D Ένδειξη για το αν ο ασθενής βρίσκεται εν ζωή ή όχι (Ναι-1, Όχι-2). AGE η ηλικία του ασθενούς. Μέση ηλικία εμφάνισης της Β-ΧΛΛ είναι τα 60 χρόνια, ενώ είναι ασυνήθιστο να παρουσιάζονται ασθενείς κάτω των 50 χρόνων, που αποτελούν περίπου το 10% επί του συνόλου. HCT ο αιματοκρίτης του ασθενούς, δηλαδή το ποσοστό των ερυθρών κυττάρων του επί του συνολικού όγκου αίματος. Φυσιολογικές τιμές του αιματοκρίτη θεωρούνται οι 42-52% στους άνδρες και οι 36-48% στις γυναίκες. Ποσοστά κάτω του 30% αναφέρονται ως χαμηλός αιματοκρίτης. HB η τιμή της αιμοσφαιρίνης του ασθενούς σε g/dl. Φυσιολογικές τιμές της θεωρούνται τα g/dl στους άνδρες και τα g/dl στις γυναίκες. Επίπεδα αιμοσφαιρίνης μικρότερα των 10 g/dl χαρακτηρίζουν Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 112
113 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής τον ασθενή ως αναιμικό. Η τιμή της αιμοσφαιρίνης λαμβάνεται υπόψη στον καθορισμό του σταδίου διάγνωσης (γνώρισμα SUBGR). WBCC το πλήθος των λευκοκυττάρων του ασθενούς ανά λίτρο αίματος. Στους φυσιολογικούς ενήλικες υπάρχουν από 5 έως 10 δισεκατομμύρια λευκοκύτταρα ανά λίτρο αίματος. NEUT το πλήθος των πολυμορφοπύρηνων λευκοκυττάρων (κοκκιοκυττάρων) του ασθενούς ανά λίτρο αίματος. Εναλλακτικά, το ποσοστό τους επί του συνολικού πλήθους των λευκοκυττάρων. Τα φυσιολογικά ποσοστά τους κυμαίνονται μεταξύ του 50% και του 62% (3 ως 7 δισεκατομμύρια ανά λίτρο αίματος σε απόλυτο αριθμό). LYMPH - το πλήθος των λεμφοκυττάρων του ασθενούς ανά λίτρο αίματος. Εναλλακτικά, το ποσοστό τους επί του πλήθους των λευκοκυττάρων. Τα φυσιολογικά τους ποσοστά κυμαίνονται μεταξύ του 25% και του 40%. Αναγκαία συνθήκη για τη διάγνωση λευχαιμίας αποτελεί η παρουσία λεμφοκυττάρωσης, δηλαδή η ύπαρξη περισσότερων από 5 δισεκατομμυρίων λεμφοκυττάρων ανά λίτρο αίματος. MONO - το πλήθος των μονοπύρηνων λευκοκυττάρων του ασθενούς ανά λίτρο αίματος. Εναλλακτικά, το ποσοστό τους επί του συνολικού πλήθους των λευκοκυττάρων. Τα φυσιολογικά ποσοστά τους κυμαίνονται μεταξύ του 3% και του 7% (0.1 ως 0.6 δισεκατομμύρια ανά λίτρο αίματος σε απόλυτο αριθμό). PLT το πλήθος των αιμοπεταλίων του ασθενούς ανά λίτρο αίματος. Στους φυσιολογικούς ενήλικες υπάρχουν από 140 έως 400 δισεκατομμύρια αιμοπετάλια ανά λίτρο αίματος. Η παρουσία λιγότερων των 100 δισεκατομμυρίων αιμοπεταλίων ανά λίτρο αίματος χαρακτηρίζεται ως θρομβοκυτοπενία και λαμβάνεται υπόψη στον καθορισμό του σταδίου διάγνωσης του ασθενούς (γνώρισμα SUBGR). Ουρικό η τιμή του ουρικού οξέος του ασθενούς σε mmol/24ωρο, όπως προκύπτει από μια ποσοτική εξέταση 24ώρου. Φυσιολογικές τιμές του θεωρούνται αυτές μεταξύ του 1.5 και του 6. Μεγαλύτερες τιμές του σχετίζονται συνήθως με την παρουσία μυελογενών (παρά λεμφοκυτταρικών) λευχαιμιών. LDH η τιμή της γαλακτικής δεϋδρογενάσης του ασθενούς. Φυσιολογικοί ενήλικες παρουσιάζουν τιμές από 313 ως 618, αν και οι αναφερόμενες τιμές ποικίλουν. Alb η τιμή της αλβουμίνης του ασθενούς σε g/dl. Τόσο η εξέταση της παραμέτρου αυτής όσο και των ακόλουθων δύο πραγματοποιείται για 113 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
114 την ανίχνευση ανοσοανεπάρκειας, αυτοάνοσων νοσημάτων και άλλων διαταραχών του ανοσοποιητικού συστήματος. Φυσιολογικές τιμές σε ενήλικες: g/dl. α2-σφ η τιμή της άλφα2-σφαιρίνης του ασθενούς σε g/dl. Φυσιολογικές τιμές: g/dl. γ-σφ - η τιμή της γάμα-σφαιρίνης του ασθενούς σε g/dl. Φυσιολογικές τιμές: g/dl. β2-μίκρο η τιμή της Β2-μικροσφαιρίνης ούρων του ασθενούς. Η Β2- μικροσφαιρίνη εμφανίζει μη ειδική αύξηση σε ενεργό χρόνια λεμφογενή λευχαιμία. Μυελός το ποσοστό διήθησης μυελού των οστών του ασθενούς. Στο μυελόγραμμα, η διήθηση του μυελικού οργάνου από τα λευχαιμικά κύτταρα κυμαίνεται ευρέως από 30% έως και 100%. SURV οι ημέρες επιβίωσης του ασθενούς. Αν ο ασθενής έχει αποβιώσει, πρόκειται για το χρονικό διάστημα ανάμεσα στην ημερομηνία διάγνωσης της ασθένειας και την ημερομηνία θανάτου του. Αλλιώς, πρόκειται για το χρονικό διάστημα ανάμεσα στην ημερομηνία διάγνωσης της ασθένειας και την ημερομηνία τελευταίας εξέτασης. Ταχύτητα Καθίζησης Ερυθρών η ταχύτητα καθίζησης των ερυθρών αιμοσφαιρίων σε χιλιοστά ανά ώρα. Abs-T ο απόλυτος αριθμός των Τ- λεμφοκυττάρων. HLA-DR - Το ποσοστό των Τ- λεμφοκυττάρων στα οποία ανιχνευτικέ το αντιγόνο HLA-DR. DDIAGN - η ημερομηνία διάγνωσης. LCON - η ημερομηνία της τελευταίας εξέτασης. Ημερομηνία Θανάτου η ημερομηνία θανάτου. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 114
115 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΜΕΘΟΔΟΣ ΤΟ FLOW CYTOMETRY STANDARD (FCS) Τα οπτικά σήματα (της σκέδασης φωτός και του φθορισμού για κάθε σωματίδιο) που προκύπτουν μετατρέπονται σε ηλεκτρονικά σήματα στους ανιχνευτές, οι εντάσεις τους διακριτοποιούνται, δηλαδή αντιστοιχίζονται σε ένα σύνολο από διακριτά κανάλια, τυπικά αριθμημένα από το 0 ως το Συνήθως, οι εντάσεις φθορισμού (και ενίοτε και η SS) διακριτοποιούνται με χρήση της λογαριθμικής κλίμακας. Τα δεδομένα που προκύπτουν αποθηκεύονται ως αρχεία υπολογιστή, βάσει ενός σταθερού προτύπου, του flow cytometry standard (FCS) 3.0, το οποίο έχει προταθεί από την International Society for Analytical Cytometry (ISAC), με σκοπό να παρέχει έναν ξεκάθαρο τρόπο αποθήκευσης δεδομένων από τους κυτταρομετρητές ροής [FC4]. Τα αρχεία που δημιουργούνται με βάση το FCS περιέχουν τρία υποχρεωτικά πεδία, με ονόματα HEADER, TEXT και DATA, τα οποία ενδέχεται να ακολουθούνται από το προαιρετικό πεδίο ANALYSIS, καθώς και περαιτέρω προαιρετικά πεδία, ορισμένα από τον κατασκευαστή. Το πεδίο TEXT υποδιαιρείται σε δύο υποπεδία, με ονόματα primary και supplemental, και περιέχει μια σειρά από λέξεις-κλειδιά με τις τιμές τους, κωδικοποιημένες με τη χρήση κώδικα ASCII, οι οποίες περιγράφουν διάφορα χαρακτηριστικά των δεδομένων. Το υποπεδίο primary περιέχει ένα σταθερό και υποχρεωτικό σύνολο λέξεων-κλειδιά, ενώ το υποπεδίο supplemental είναι προαιρετικό και περιέχει ένα μεταβλητό πλήθος από λέξεις-κλειδιά, ανάλογα με το επίπεδο της λεπτομέρειας που επιθυμεί ο εκάστοτε σχεδιαστής hardware σε έναν κυτταρομετρητή ροής. Εκτός από την περιγραφή των δεδομένων που προκύπτουν από ένα πείραμα (μετρήσεις του κυτταρομετρητή ροής), ενδέχεται να καταγράφονται και οι συνθήκες κάτω από τις οποίες εκτελέστηκε το πείραμα αυτό. Το τμήμα DATA περιέχει τα raw δεδομένα σε μία εκ τριών πιθανών μορφών: σε λίστα, συσχετισμένα ή ασυσχέτιστα. Η πλειοψηφία των κυτταρομετρητών ροής αποθηκεύουν τα δεδομένα τους σε μορφή λίστας (list-mode data). Αυτό σημαίνει πως οι εγγραφές (τα δεδομένα για κάθε ξεχωριστό σωματίδιο) είναι αποθηκευμένες σε μια λίστα, η μία μετά την άλλη [FC3]. 115 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
116 FCS3.0 HEADER (91-205), ( ), ( ), TEXT SEGMENT $MODE;$BYTEORD;$DATATYPE;$PnN;$PnS;$PnB;$PnE;$PnR;...;$TOT FS SS FL1 FL2 FL3 FL4 FL $CSMODE;$CSnNAME;$CSVBITS;$CSVnFLAG;$CSDATE;$CSDEFFILE; DATA SEGMENT (Listmode) ANALYSIS SEGMENT [Int - Εικόνα 1] - Η δομή των FCS αρχείων: Κάθε αρχείο ξεκινάει με το τμήμα HEADER το οποίο έχει σταθερό μέγεθος 58, περιέχει απλό κείμενο και είναι κωδικοποιημένο βάσει του προτύπου ASCII. Τα πρώτα 6 bytes κάθε header περιέχουν την έκδοση του FCS (πχ "FCS3.0"). Το υπόλοιπο μέρος του header περιγράφει τις τοποθεσίες που καταλαμβάνουν τα άλλα τμήματα ενός FCS αρχείου ('text seg. begin', 'text seg. end', 'data seg. begin', 'data seg. end', 'analysis seg begin' and 'analysis seg. end'). Το τμήμα TEXT χωρίζεται σε δύο υπο-τμήματα το 'primary' και το 'supplemental'. Και τα δύο υπο-τμήματα του TEXT περιέχουν μία σειρά από μεταβλητές κειμένου Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 116
117 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής οι οποίες περιγράφουν τη μορφή των δεδομένων που ακολουθούν καθώς και τα τεχνικά χαρακτηριστικά του κυτταρομετρητή ροής που παρήγαγε τα δεδομένα. Το τμήμα DATA περιέχει τις μετρήσεις σε μία από τις ακόλουθες μορφές: Integer Floating point Double precision floting point ASCII text ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΚΥΤΤΑΡΟΜΕΤΡΙΑΣ ΡΟΗΣ Τα δεδομένα Κυτταρομετρίας Ροής μπορούν να απεικονιστούν στον υπολογιστή με τη χρήση γραφικών παραστάσεων. Η απλούστερη μορφή γραφικής αναπαράστασής τους είναι το ιστόγραμμα. Ένα ιστόγραμμα απεικονίζει τα δεδομένα μίας παραμέτρου: ο οριζόντιος άξονας αντιστοιχεί στις τιμές της παραμέτρου, ενώ ο κάθετος άξονας αντιστοιχεί στο πλήθος των σωματιδίων ανά τιμή της παραμέτρου. Δύο παράμετροι μπορούν να απεικονιστούν ταυτόχρονα σε ένα 2-διάστατο διάγραμμα: κάθε μία διάσταση περιέχει και τις τιμές μιας ξεχωριστής παραμέτρου. Ένα ιστόγραμμα δύο παραμέτρων αποτελεί μια 3-διάστατη γραφική παράσταση, στην οποία οι δύο από τους άξονες περιέχουν τις τιμές των δύο παραμέτρων, ενώ ο επιπρόσθετος άξονας αντιστοιχεί στο πλήθος των σωματιδίων ανά ζεύγος τιμών των παραμέτρων αυτών. Μια ποιοτική παραλλαγή αυτής της μεθόδου αναπαράστασης αποτελεί το χρωματισμένο 2-διάστατο διάγραμμα, στο οποίο ο επιπρόσθετος άξονας του πλήθους σωματιδίων αντικαθίσταται από τη χρήση χρώματος: η φωτεινότητα του χρώματος που χρησιμοποιείται είναι ανάλογη του πλήθους των σωματιδίων ανά ζεύγος τιμών των απεικονισμένων παραμέτρων. Τέλος, τα πιο σύγχρονα λογισμικά αναπαράστασης κυτταρομετρικών δεδομένων προσφέρουν και 3-διάστατα διαγράμματα, δηλαδή γραφικές απεικονίσεις τριών ταυτόχρονα διαφορετικών παραμέτρων. 117 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
118 [Int - Εικόνα 2] - Γραφικές αναπαραστάσεις κυτταρομετρικών δεδομένων. Η πιο βασική διαδικασία που λαμβάνει χώρα στην ανάλυση κυτταρομετρικών δεδομένων είναι η διάκριση των σωματιδίων ενός ετερογενούς δείγματος σε υποπληθυσμούς (για παράδειγμα, κυτταρικούς τύπους) και στη συνέχεια η εξαγωγή επιμέρους στατιστικών δεδομένων για τους υποπληθυσμούς που ενδιαφέρουν. Η διαδικασία με την οποία υλοποιείται αυτή η διάκριση καλείται gating: σε κάποιο κατάλληλο διάγραμμα από διαθέσιμες κυτταρομετρικές παραμέτρους, ο υπεύθυνος της μελέτης σχηματίζει γραφικά τα όρια μιας περιοχής, στην οποία περικλείει (απομονώνει) το υποσύνολο εκείνο των σωματιδίων που χρήζουν περαιτέρω ανάλυσης. Παραδείγματος χάριν, ένας εργαστηριακός υπεύθυνος στο χώρο της αιματολογίας ενδέχεται να επιθυμεί να αναλύσει από ένα δείγμα λευκών αιμοσφαιρίων μόνο τα κύτταρα του λεμφοκυτταρικού υποπληθυσμού. Απεικονίζοντας όλα τα λευκά κύτταρα στο διάγραμμα των παραμέτρων FS και SS, σχεδιάζει τα όρια της περιοχής στην οποία γνωρίζει πως ανήκουν μόνο τα λεμφοκύτταρα. Εν συνεχεία, με το υποσύνολο των επιλεγμένων κύτταρων και τις τιμές των παραμέτρων τους μπορεί να προχωρήσει σε περαιτέρω ανάλυση, η οποία να σχετίζεται για παράδειγμα με τις παραμέτρους φθορισμού τους. Ένα διάγραμμα με παραμέτρους φθορισμού που αφορά μόνο το λεμφοκυτταρικό Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 118
119 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής υποπληθυσμό αναμένεται να έχει διαφορετική μορφή σε σχέση με αυτή που αφορά όλα τα λευκά αιμοσφαίρια [FC5]. [Int - Εικόνα 3] - Χρήση του gating για περιορισμό της ανάλυσης σε έναν υποπληθυσμό. Μια διαδικασία αντίστοιχης φιλοσοφίας με αυτής του gating αποτελεί ο ορισμός των markers. Ένας marker ταυτίζεται με μια επιλεγμένη τιμή μιας παραμέτρου, η οποία θεωρείται κατωφλική για την παράμετρο αυτή. Δηλαδή, ανάλογα με το αν η τιμή της παραμέτρου ενός σωματιδίου είναι μεγαλύτερη ή μικρότερη του επιλεγμένου marker, το σωματίδιο κατηγοριοποιείται ως θετικό ή αρνητικό, αντίστοιχα, ως προς την παράμετρο αυτή. Σε ένα ιστόγραμμα, ένας marker αποτελεί μια νοητή κάθετη γραμμή σε ένα ενδιάμεσο σημείο της εικόνας (για παράδειγμα, σε κάποιο τοπικό ελάχιστο του ιστογράμματος) και διακρίνει τα σωματίδια σε αυτά που βρίσκονται δεξιά του και αριστερά του. Σε ένα 2-διάστατο διάγραμμα, δύο markers τοποθετούνται ώστε να διαιρούν την εικόνα σε τέσσερα νοητά τεταρτημόρια. Κατά συνέπεια, τα σωματίδια διακρίνονται σε τέσσερις υποπληθυσμούς: πρόκειται για αυτά που είναι θετικά και ως προς τις δύο παραμέτρους, αυτά που είναι αρνητικά και ως προς τις δύο παραμέτρους, αυτά που είναι θετικά 119 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
120 μόνο ως προς την πρώτη παράμετρο και αυτά που είναι θετικά μόνο ως προς τη δεύτερη παράμετρο. Τόσο η διαδικασία του gating όσο και αυτή του ορισμού markers δεν πραγματοποιούνται με αυτοματοποιημένο τρόπο. Ο εργαστηριακός υπεύθυνος τις εκτελεί χειρονακτικά, βασιζόμενος στην εμπειρία και στην εξειδικευμένη γνώση του πάνω στο υπό μελέτη πρόβλημα, καθώς και στη μορφή και στην τοπολογία των εξεταζόμενων δειγμάτων. Για τους υποπληθυσμούς σωματιδίων που προκύπτουν σε κάθε περίπτωση, εξάγονται επιμέρους στατιστικά δεδομένα, όπως πλήθος σωματιδίων και ποσοστό τους επί του συνολικού πληθυσμού, μέσες τιμές και διασπορές των τιμών των παραμέτρων τους, κλπ, τα οποία ενδέχεται να αφορούν την εκάστοτε μελέτη. [Int - Εικόνα 4] - Ορισμός markers και εξαγωγή επιμέρους στατιστικών δεδομένων. ΚΥΤΤΑΡΟΜΕΤΡΙΚΗ ΑΝΑΛΥΣΗ ΓΙΑ ΤΗ ΔΙΑΓΝΩΣΗ ΑΣΘΕΝΩΝ Β-ΧΛΛ Η κατανεμημένη φύση του αίματος, το οποίο απαρτίζεται από ένα πλήθος κυττάρων διαφόρων τύπων, το καθιστά πρόσφορο για κυτταρομετρική ανάλυση. Μια από τις σημαντικότερες εφαρμογές της κυτταρομετρίας ροής αποτελεί η αναγνώριση και ποσοτικοποίηση αντιγόνων κυτταρικής περιφέρειας με τη χρήση φθοροχρωματισμένων μονοκλωνικών αντισωμάτων. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 120
121 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Μια πολύ μεγάλη ποικιλία από αντιγόνα ερυθροκυττάρων, λευκοκυττάρων και αιμοπεταλίων έχουν μελετηθεί εκτενώς στο πρόσφατο παρελθόν και η διαθεσιμότητα των αντίστοιχων αντισωμάτων επιτρέπει την κυτταρομετρική ανάλυση σε όλους τους παραπάνω κυτταρικούς τύπους. Η διαδικασία αυτή καλείται ανίχνευση ανοσοφαινότυπου ή ανοσοφαινοτύπηση και διαδραματίζει κυρίαρχο ρόλο στην αρχική διάγνωση και κατηγοριοποίηση αιματολογικών ασθενειών, όπως για παράδειγμα οξειών λευχαιμιών, χρόνιων λεμφοπολλαπλασιαστικών διαταραχών και κακοηθών λεμφωμάτων. Οι διάφορες κατηγορίες λευχαιμιών και λεμφωμάτων συχνά παρουσιάζουν προφανείς διαφορές στα αντιγονικά τους πρότυπα, με αποτέλεσμα να αποτελούν ιδανικά πεδία μελέτης και ανάλυσης με κυτταρομετρία ροής [FC6]. Ακόμα και οι στρατηγικές θεραπείας τέτοιων ασθενειών βασίζονται σε αντιγονικά πρότυπα. Η ανοσοφαινοτύπηση δειγμάτων αίματος παρέχει πληροφορία, η οποία δεν είναι διαθέσιμη από άλλες υπάρχουσες τεχνικές. Επιπροσθέτως, αποτελεί ένα ευέλικτο μέσο για την παρακολούθηση της πορείας ασθενών, οι οποίοι έχουν υποβληθεί σε χημειοθεραπεία ή μεταμόσχευση μυελού οστών και αρκετά συχνά επιτρέπει την ανίχνευση ελάχιστα υπολειμματικών ασθενειών. Οι διαγνωστικές ερμηνείες με χρήση κυτταρομετρίας ροής βασίζονται σε ένα συνδυασμό από αντιγονικά πρότυπα και εντάσεις φθορισμού. Η κυτταρομετρική ανάλυση αποτελεί αναπόσπαστο κομμάτι της διαδικασίας διάγνωσης ασθενών με Β-χρόνια λεμφογενή λευχαιμία ή Β-ΧΛΛ (B-chronic lymphocytic leukemia B-CLL), καθώς και οι Β-κυτταρικές λεμφοπολλαπλασιαστικές διαταραχές εκφράζουν συγκεκριμένα αντιγονικά πρότυπα. Η χρήση ενός ευρέως φάσματος από μονοκλωνικά αντισώματα επιτρέπει στους κλινικούς να πραγματοποιούν συγκεκριμένες διαγνώσεις, με βάση αντίστοιχα πρότυπα αντιγονικής έκφρασης: κοινοί φαινότυποι της παραπάνω κατηγορίας διαταραχών εκφράζουν ένα σύνολο από χαρακτηριστικά αντιγόνα, όπως τα CD19, CD20 και CD22. Δεδομένου ότι οι συνήθεις φαινότυποι των αντίστοιχων Τ-κυτταρικών διαταραχών αντιστοιχούν σε τελείως διαφορετικά αντιγονικά πρότυπα, τα οποία χαρακτηρίζονται από έκφραση των αντιγόνων CD2, CD3, CD4 ή/και CD7, αρκεί μια απλή σύγκριση των δύο αντιγονικών προτύπων με αυτό του διαθέσιμου δείγματος λεμφοκυττάρων, ώστε να αποφασιστεί ο ακριβώς τύπος λεμφοκυτταρικής λευχαιμίας. Κατά τη διαδικασία της ανοσοφαινοτύπησης, δε λαμβάνεται υπόψη μόνο η παρουσία ή η απουσία του εκάστοτε χρήσιμου αντιγόνου, αλλά και η ένταση με την οποία αυτό εκφράζεται, δηλαδή αν εκφράζεται 121 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
122 ασθενά ή ισχυρά (μια πληροφορία που μπορεί να δίνεται για παράδειγμα με τη μορφή ποσοστού επί του συνόλου των λεμφοκυττάρων του δείγματος). Πιο συγκεκριμένα, η διάγνωση της Β-ΧΛΛ τίθεται από την ανίχνευση στο περιφερικό αίμα αλλά και σε κάθε άλλο διηθημένο ιστό του νεοπλασματικού Β-λεμφοκυτταρικού πληθυσμού, που χαρακτηρίζεται από ασθενή έκφραση των αντιγόνων της Β σειράς CD20 και CD19 με ταυτόχρονη άτυπη έκφραση του αντιγόνου CD5, την ασθενή έκφραση του υποδοχέα του συμπληρώματος CD23, την έλλειψη των αντιγόνων του BCR υποδοχέα CD79b και FMC-7 και την κλωνική έκφραση της κάππα ή λάμδα ελαφράς αλύσου της ανοσοσφαιρίνης επιφανείας του κυττάρου. Στην πράξη, ο εργαστηριακός υπεύθυνος για τη διάγνωση Β-ΧΛΛ αναλαμβάνει πρώτα να απομονώσει το λεμφοκυτταρικό πληθυσμό στο διαθέσιμο δείγμα περιφερικού αίματος. Αυτό το επιτυγχάνει χρησιμοποιώντας gating στο διάγραμμα των παραμέτρων FS και SS. Τα λεμφοκύτταρα είναι συνήθως μικρότερου μεγέθους από τα υπόλοιπα κύτταρα του περιφερικού αίματος, δηλαδή από τα μονοκύτταρα και τα πολυμορφοπύρηνα. Επιπλέον, χαρακτηρίζονται από μικρή εσωτερική πολυπλοκότητα, ειδικά συγκρινόμενα με τα πολυμορφοπύρηνα, τα οποία αποτελούν εξαιρετικά κοκκώδη κύτταρα. Συνεπώς, μπορούν να ανιχνευθούν στο διάγραμμα των FS και SS με τη μορφή μιας πυκνής συστάδας κυττάρων, που βρίσκεται πλησιέστερα στην τομή των δύο αξόνων. Με τη χρήση gating απομακρύνονται από την επακόλουθη ανάλυση και κάποια απομονωμένα σημεία, τα οποία αντιστοιχούν σε νεκρά κύτταρα. Πιο πρόσφατες τεχνικές gating για την επιλογή των λεμφοκυττάρων περιλαμβάνουν και τη χρησιμοποίηση φθοριζουσών παραμέτρων, όπως αυτής του αντιγόνου CD45, το οποίο εκφράζεται στην πλειοψηφία των λεμφοκυττάρων, και αυτής του αντιγόνου CD14, το οποίο αποτελεί αναγνωριστικό αντιγόνο των μονοκυττάρων. Στη συνέχεια, τα επιλεγμένα λεμφοκύτταρα αναλύονται περαιτέρω, σε διαγράμματα που απεικονίζουν τις τιμές των φθοριζουσών παραμέτρων τους. Η παρουσία ή απουσία κριτικών αντιγόνων σε αυτά, καθώς και η ένταση της πιθανής έκφρασής τους, ανιχνεύεται με τη χρήση gating και την τοποθέτηση markers. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 122
123 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής [Int - Εικόνα 5] - Ανίχνευση των Τ-λεμφοκυττάρων (θετικά στο CD3). 123 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
124 [Int - Εικόνα 6] - Ανίχνευση των λεμφοκυττάρων που συνεκφράζουν τα CD20 και CD5. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 124
125 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Η ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΗ ΔΙΑΔΙΚΑΣΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗΣ Για την αυτοματοποίηση της διαδικασίας συσταδοποίησης (επιλογής) των χαρακτηριστικών κυτταρικών πληθυσμών που συμμετέχουν στη διάγνωση και πρόγνωση ασθενών με ΧΛΛ ακολουθήσαμε τη συστηματική αλγοριθμική διαδικασία που περιγράφεται αναλυτικά στο επιστημονικό άρθρο: "Bayesian clustering of flow cytometry data for the diagnosis of B-Chronic Lymphocytic Leukemia". Lakoumentas J, Drakos J, Karakantza M, Nikiforidis GC, Sakellaropoulos GC. Journal of Biomedical Informatics 2008 Dec 6 (doi: /j.jbi ). Η αλγοριθμική διαδικασία επιλογής περιλαμβάνει σαν πρώτο βήμα την απομόνωση του υποπληθυσμού των λεμφοκυττάρων στο περιφερικό αίμα. Σαν δεύτερο βήμα, περιλαμβάνει την ανίχνευση του καθενός υποπληθυσμού εκφραζόμενων αντιγόνων εντός των επιλεχθέντων λεμφοκυττάρων. Κάθε βήμα επιλογής υποπληθυσμού υλοποιείται χρησιμοποιώντας τη μεθοδολογία της κατά Bayes συσταδοποίησης (Bayesian clustering), η οποία λαμβάνει ως ορίσματα τα εκάστοτε ένα ή δύο αντιγονικά γνωρίσματα, ανάλογα με το αν αναζητούμε εκφράσεις ή συνεκφράσεις αντιγόνων. Για το διαχωρισμό των λεμφοκυττάρων συνδυάζονται τα επιμέρους αποτελέσματα της συσταδοποίησης που διαχωρίζουν τα Β-κύτταρα (CD20) και τα Τ-κύτταρα (CD3): ο συνδυασμός αυτός πραγματοποιείται στον κοινό χώρο των γνωρισμάτων FS και SS των κυττάρων, σε αντιστοιχία με τη διαδικασία που χρησιμοποιούν οι ειδικοί της κυτταρομετρίας ροής, όταν επιλέγουν τον λεμφοκυτταρικό υποπληθυσμό με το χέρι. 125 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
126 ΛΕΙΤΟΥΡΓΙΚΟΣ ΣΥΝΔΥΑΣΜΟΣ ΔΕΔΟΜΕΝΩΝ ΚΥΤΤΑΡΟΜΕΤΡΙΑΣ ΡΟΗΣ (INTRA DOMAIN INTEGRATION) Τα πρότυπα αποθήκευσης δεδομένων δίνουν μεγάλη βαρύτητα στην πιστότητα των δεδομένων: με σκοπό την παροχή των συνθηκών ώστε τα δεδομένα που εξάγονται από τις συσκευές συλλογής να ακολουθούν ένα ενιαίο τρόπο ώστε να δημιουργούν αναπαραγόμενες εικόνες των εξετάσεων που εκτελούνται. Δεν λαμβάνουν καμία μέριμνα για την ολοκλήρωση των δεδομένων με συναφή δεδομένα τα οποία συλλέγονται από διαφορετική συσκευή συλλογής ή από διαφορετική εγκατάσταση. Παρά ταύτα, σε πολλές περιπτώσεις η αποτελεσματική διαχείριση των δεδομένων επιβάλει μη-διαισθητικές μορφές των δομών δεδομένων, δηλαδή όταν υπάρχει η απαίτηση για ολοκλήρωση των δεδομένων, οι τεχνολογίες πληροφοριών θέτουν τις αρχές για τα κριτήρια βελτιστοποίησης. ΟΡΙΖΟΝΤΙΟ ΕΠΙΠΕΔΟ ΠΛΗΡΟΦΟΡΙΩΝ Στο πλαίσιο της διατριβής ορίζεται η έννοια Οριζόντιο Επίπεδο Πληροφοριών ('Horizontal Information Level', ΟΕΠ) ως τα δεδομένα μίας εγγραφής ενός πίνακα μίας βάσης δεδομένων ή της εγγραφής που δημιουργείτε από τη σύνδεση (join) σε ένα βήμα των πινάκων μίας βάσης δεδομένων σε μοναδικές εγγραφές. Με άλλα λόγια, οι συμμετέχοντες πίνακες θα πρέπει να συσχετίζονται μέσω σχέσης πρωτεύοντος-ξένου κλειδιού. Ο όρος Οριζόντιο επιλέχθηκε με σκοπό την οπτικοποίηση του γεγονότος ότι το μοντέλο ΟΕΠ προσπαθεί να ακολουθήσει τη μορφή της γραμμής (row) ενός πίνακα βάσης δεδομένων. Η εγγραφή ΟΕΠ μπορεί να αντιστοιχηθεί σε οποιαδήποτε έννοια της πραγματικότητας. Στην περίπτωση των πειραμάτων Κυττατογραφίας Ροής, η έννοια της εγγραφής ενός πίνακα που αποθηκεύει την επικεφαλίδα σύμφωνα με το Πρότυπο Κυτταρομετρίας Ροής (FCS) αποτελεί μία οντότητα ΟΕΠ, που ονομάζεται ΟΕΠ τύπου επικεφαλίδας (header ΟΕΠ) και αναπαριστά τις πληροφορίες που σχετίζονται με ένα πείραμα ή ένα ασθενή. Η οντότητα ΟΕΠ τύπου κύτταρο (cell ΟΕΠ) είναι η εγγραφή ενός πίνακα που αποθηκεύει το τμήμα των δεδομένων ( DATA ) σύμφωνα με το πρότυπο FCS και αναπαριστά τις μετρήσεις για ένα και μόνο κύτταρο. Ο συσχετισμός των ΟΕΠ τύπου επικεφαλίδα με τα ΟΕΠ τύπου κύτταρο δημιουργεί μία εγγραφή νέου τύπου, η οποία αναπαριστά τις τιμές αντιγόνων που μετρήθηκαν για ένα
127 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής συγκεκριμένο κύτταρο ενός συγκεκριμένου ασθενή σε μία συγκεκριμένη εξέταση και ονομάζεται ΟΕΠ τύπου μέτρησης (measurement ΟΕΠ). Η ομάδα των ΟΕΠ τύπου μέτρησης από όλες τις εγγραφές που έχουν το ίδιο αναγνωριστικό εξέτασης (experiment ID) αναπαριστούν μία συγκεκριμένη εξέταση και ονομάζεται ΟΕΠ τύπου εξέτασης (experiment ΟΕΠ). Η ομάδα των ΟΕΠ τύπου πειράματος που έχουν το ίδιο αναγνωριστικό ασθενή (patient ID) αναπαριστούν το ιστορικό του ασθενούς. Η έννοια αυτή μπορεί να διευρυνθεί σε κάθε σχετική ομαδοποίηση. ΚΑΘΕΤΟ ΣΧΗΜΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Με τον όρο Κάθετο Σχήμα Βάσεων Δεδομένων ορίζουμε το σχεδιασμό μίας βάσης δεδομένων στον οποίο η ανάκτηση δεδομένων που προέρχονται από την ίδια εγγραφή ΟΕΠ δεν είναι αρκετή ώστε να καταστήσει τα δεδομένα αυτά χρήσιμα για τον ερευνητή. Η αξιοποίηση των δεδομένων αυτών απαιτεί τη χρήση ενεργειών εξόρυξης/ανάκτησης δεδομένων (data-mining) σε ένα ή περισσότερα πεδία μίας εγγραφής ΟΕΠ. Καθώς οι ενέργειες αυτές είναι συγκεκριμένες για κάθε πεδίο που πρέπει να ανακτηθεί και κοινές για όλα τα δεδομένα, που αν τα οπτικοποιήσουμε αποτελούν μία στήλη, χαρακτηρίζουμε αυτές τις ενέργειες ως κάθετες. Mία βάση δεδομένων που αποθηκεύει δεδομένα Κυτταρομετρίας Ροής σύμφωνα με το πρότυπο FCS, η οποία έχει σχεδιαστεί με ένα σχήμα βάσης που είναι ακριβές αντίγραφο της πρότυπης μορφής (Εικόνες 7 & 8), αποτελεί ένα παράδειγμα ενός Κάθετου σχήματος βάσης δεδομένων, όπως αυτό ορίστηκε προηγουμένως. Στην περίπτωση αυτή, για παράδειγμα, μία εγγραφή ΟΕΠ τύπου μέτρησης δεν μπορεί να αξιοποιηθεί από τους ερευνητές χωρίς την εφαρμογή ενεργειών εξόρυξης δεδομένων. Αναλυτικότερα και με βάση τα δεδομένα που παρουσιάζονται στην Εικόνα 7 για την ανάκτηση των μετρήσεων για ένα κύτταρο (δηλαδή των τιμών των πεδίων P1, P2, κλπ) θα πρέπει να προηγηθεί ένας έλεγχος για τον αριθμό της παραμέτρου που αφορούν οι τιμές των μετρήσεων. Στη συνέχεια, οι τιμές της συγκεκριμένης παραμέτρου (δηλαδή οι τιμές των πεδίων P1S, P2S) πρέπει να χρησιμοποιηθούν για την αναγνώριση του αντιγόνου που η παράμετρος αναπαριστά στο συγκεκριμένο πείραμα. Η γνώση ότι το πεδίο P1 έχει την τιμή 512 δεν έχει κανένα απολύτως νόημα και δεν προσφέρει κάποια γνώση στον 127 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
128 ερευνητή πριν την αναγνώριση ότι το πεδίο P1 αντιστοιχεί στη μέτρηση side scatter ή log of side scatter ή CD20. Επίσης, για την ανάκτηση δεδομένων από διαφορετικά ΟΕΠ τύπου πειράματος δύο νέες ενέργειες ανάκτησης δεδομένων θα πρέπει να εφαρμοστούν. Η πρώτη ενέργεια θα πρέπει να αναγνωρίσει τις διαφορετικές μορφές ονομάτων όταν διαφορετικές πηγές έχουν χρησιμοποιηθεί για το ίδιο αντιγόνο (π.χ. CD20, CD-20, CD/20, κλπ.) και να τις καταστήσει μοναδικές σε ένα όνομα (όπως για παράδειγμα CD20). Η δεύτερη σχετίζεται με τον έλεγχο για το αν διαφορετικά πεδία από διαφορετικά πειράματα, περιέχουν μετρήσεις για το ίδιο αντιγόνο (π.χ. μετρήσεις CD20 περιέχονται στο πεδίο P3 στο πείραμα 1 και στο πεδίο P6 στο πείραμα 9). Στις περιπτώσεις αυτές περισσότερες ενέργειες ανάκτησης δεδομένων πρέπει να εκτελεστούν για την ευθυγράμμιση των δεδομένων για το ίδιο αντιγόνο σε ένα μοναδικό πεδίο. Δεν έχει νόημα να ανακτηθούν τα αρχεία που εμπεριέχουν από κοινού P2/P3 όταν δεν έχει ξεκαθαριστεί τι σημαίνει το P2 και το P3. Στο συγκεκριμένο σημείο είναι σημαντικό να ξεκαθαρίσουμε ότι, τα προβλήματα του Κάθετου Σχήματος Βάσης Δεδομένων που ακολουθεί τη δομή ενός αρχείου δεδομένων σύμφωνα με το πρότυπο FCS, προέρχονται από το σχεδιασμό της βάσης δεδομένων και όχι από το ίδιο του πρότυπο FCS. Η χρήση ενός προτύπου, το οποίο έχει δημιουργηθεί για την αποθήκευση δεδομένων σε ένα και μοναδικό αρχείο δεδομένων, ως βάση για τη δημιουργία ενός ολοκληρωμένου κόμβου δεδομένων που προέρχονται από διαφορετικές πηγές, αποτελεί μία προβληματική προσέγγιση. Στην περίπτωση ενός αρχείου δεδομένων κανένα από τα προβλήματα που αναφέρθηκαν προηγουμένως δεν θα είχε συμβεί.
129 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Many to One Η δομή το πίνακα TEXT (PRIMARY sub-segment) EXPERIMENT-ID (Primary Key) Experiment s unique ID $BEGINANALYSIS Byte-offset to the beginning of the ANALYSIS segment. $BEGINDATA Byte-offset to the beginning of the DATA segment. $BEGINSTEXT Byte-offset to the beginning of a supplemental TEXT segment. $BYTEORD Byte order for data acquisition computer. $DATATYPE Type of data in DATA segment (ASCII, integer, floating point). $ENDANALYSIS Byte-offset to the end of the ANALYSIS segment. $ENDDATA Byte-offset to the end of the DATA segment. $ENDSTEXT Byte-offset to the end of a supplemental TEXT segment. $MODE Data mode (list mode, histogram). $NEXTDATA Byte offset to next data set in the file. $PAR Number of parameters in an event. $PnB Number of bits reserved for parameter number n. $PnE Amplification type for parameter n. $PnR Range for parameter number n. $TOT Total number of events in the data set. Many to One Η δομή του πίνακα TEXT (SUPPLEMENTAL sub-segment) EXPERIMENT-ID (Foreign Key) KEYWORD-NAME KEYWORD-VALUE Experiment s unique ID Name of the optional or custom keyword Value of the optional or custom keyword EXPERIMENT-ID (Foreign Key) P1 P2 P3 Η δομή του πίνακα DATA Experiment s unique ID Value measured for parameter one (usually forward scatter) Value measured for parameter two (usually side scatter) Value measured for parameter three (usually fluorescence one) [Int Εικόνα 7] Μία πρώτη προσέγγιση για ένα αποδοτικό συμβατικό σχήμα. 129 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
130 Το πρότυπο FCS περιέχει προαιρετικές και επιτρέπει τη χρήση προσωπικών (cuσtom) μεταβλητών με αποτέλεσμα την ανομοιογένεια ανάμεσα στις δομές διαφορετικών αρχείων δεδομένων. Για να αποθηκεύσουμε τις προσωπικές μεταβλητές δημιουργούμε τον πίνακα «CUSTOM» ο οποίος συνδέεται με τους πίνακες 'TEXT' και 'DATA' μέσω της σχέσης primary foreign key του πεδίου «ExpID». Οι τιμές των μετρήσεων αποθηκεύονται στις γενικές στήλες P1, P2, κλ με αποτέλεσμα για κάθε ανάκτηση δεδομένων να απαιτούνται επιπλέον πράξεις ώστε να προσδιοριστεί το εκάστοτε αντιγόνο που αντιπροσωπεύεται από τα P1, P2, κλ.
131 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Η δομή του πίνακα TEXT (joint sub-segments) EXPERIMENT-ID (Primary Key) Experiment s unique ID Many to One $BEGINANALYSIS Byte-offset to the beginning of the ANALYSIS segment. $BEGINDATA Byte-offset to the beginning of the DATA segment. $BEGINSTEXT Byte-offset to the beginning of a supplemental TEXT segment. $BYTEORD Byte order for data acquisition computer. $DATATYPE Type of data in DATA segment (ASCII, integer, floating point). $ENDANALYSIS Byte-offset to the end of the ANALYSIS segment. $ENDDATA Byte-offset to the end of the DATA segment. $ENDSTEXT Byte-offset to the end of a supplemental TEXT segment. $MODE Data mode (list mode, histogram). $NEXTDATA Byte offset to next data set in the file. $PAR Number of parameters in an event. $PnB Number of bits reserved for parameter number n. $PnE Amplification type for parameter n. $PnR Range for parameter number n. $TOT Total number of events in the data set. $ABRT Events lost due to data acquisition electronic coincidence. $BTIM Clock time at beginning of data acquisition. $CELLS Description of objects measured. $COM Comment. $COMP Fluorescence compensation matrix. $PnS Name used for parameter n. CUSTOM1 Custom keyword one. CUSTOM2 Custom keyword two. EXPERIMENT-ID (Foreign Key) EVENT number P1 P2 P3 Η δομή του πίνακα DATA Experiment s unique ID Serial number of each event measured in experiment Value measured for FS Channel number of FS measurement Value measured for SS [Int Εικόνα 8] Η βέλτιστη λύση για το συμβατικό σχήμα. Μετά από την ανάλυση των FCS αρχείων ώστε να αποκαλυφθεί όλο το φάσμα των προαιρετικών και προσωπικών μεταβλητών που περιλαμβάνονται στα 131 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
132 συγκεκριμένα αρχεία, μπορούμε να αποθηκεύσουμε όλη την πληροφορία του τμήματος TEXT σε ένα ενιαίο πίνακα. Η διαδικασία της ανάλυσης των προαιρετικών και προσωπικών μεταβλητών πρέπει να επαναληφθεί πριν από κάθε προσθήκη αρχείων στη βάση δεδομένων. ΟΡΙΖΟΝΤΙΟ ΣΧΗΜΑ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Ο όρος Οριζόντιο Σχήμα Βάσης Δεδομένων χρησιμοποιείται για τον ορισμό του ενός σχήματος βάσης δεδομένων με βάση το οποίο η ανάκτηση όλων των δεδομένων που προέρχονται από την ίδια εγγραφή ΟΕΠ αρκεί στο να τα καταστήσει χρήσιμα. Δεν απαιτείται καμία επιπλέον ενέργεια ανάκτησης/εξόρυξης δεδομένων (Εικόνες 7 & 8) ώστε η ανακτώμενη πληροφορία να καταστεί χρήσιμη. Η χρήση των οριζόντιων σχημάτων βάσεων δεδομένων είναι ζωτικής σημασίας στην περίπτωση που η ολοκλήρωση των πληροφοριών αποτελεί τον πρωταρχικό σκοπό του πληροφοριακού συστήματος. Ακολουθούν ορισμένα συγκριτικά παραδείγματα ανάμεσα σε ΟΕΠ αποθηκευμένα σε συμβατική και προτεινόμενη βάση δεδομένων: ΟΕΠ HEADER (κάθετο σχήμα): ΟΕΠ HEADER (οριζόντιο σχήμα): ExpID P1S P2S P3S P4S ExpID P1S P2S P3S P4S 001 FS SS CD5 CD FS SS CD5 CD20 Τα ΟΕΠ του HEADER είναι παρόμοια και για τα 2 σχήματα ΟΕΠ κυττάρου (κάθετο σχήμα): ΟΕΠ κυττάρου (οριζόντιο σχήμα): P1 P2 P3 P4 P5 P6 FS SS CD5 CD20 CD19 CD Το ΟΕΠ κυττάρου του προτεινόμενου σχήματος έχει ξεκάθαρη δομή (FS, SS, CD5, κλ), ενώ του κάθετου σχήματος δεν είναι χρηστικό αν δεν συνδυαστεί πρώτα με την πληροφορία του HEADER που φανερώνει πιο αντιγόνο μετρήθηκε σε κάθε κανάλι. ΟΕΠ μέτρησης (κάθετο σχήμα): ExpID P1S P2S P3S P4S P1 P2 P3 P4 001 FS SS CD5 CD ΟΕΠ μέτρησης (οριζόντιο σχήμα):
133 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ExpID P1S P2S P3S P4S FS SS CD5 CD FS SS CD5 CD Στο οριζόντιο παράδειγμα οι μετρήσεις των κυττάρων παραμένουν ξεκάθαρες και το ΟΕΠ της μέτρησης αποκτά επιπλέον αξία με την επιπρόσθετη πληροφορία του HEADER. Στην κάθετη περίπτωση αν και η αναγκαία πληροφορία για την αποκάλυψη των ονομάτων των αντιγόνων είναι αποθηκευμένη στο ΟΕΠ, επιπλέων βήματα απαιτούνται ώστε οι επίμαχες πληροφορίες να γίνουν ξεκάθαρες στο χρήστη. Παρότι και το δύο ΟΕΠ περιέχουν τα ίδια δεδομένα, οι διαθέσιμες πληροφορίες στην οριζόντια περίπτωση είναι σαφώς περισσότερες. ΟΕΠ πειράματος (κάθετο σχήμα): ΟΕΠ Header ΟΕΠ Κυττάρου ExpID P1S P2S P3S P4S P1 P2 P3 P4 001 FS SS CD5 CD Measurement 01 FS SS CD5 CD ΟΕΠ 002 FS SS CD20 CD Measurement 002 FS SS CD20 CD ΟΕΠ 003 CD-5 CD-20 FS SS Measurement 003 CD-5 CD-20 FS SS ΟΕΠ ΟΕΠ πειράματος (οριζόντιο σχήμα): ΟΕΠ Header ΟΕΠ Κυττάρου ExpID P1S P2S P3S P4S FS SS CD5 CD FS SS CD5 CD Measurement 001 FS SS CD5 CD ΟΕΠ 002 FS SS CD20 CD Measurement 002 FS SS CD20 CD ΟΕΠ 003 CD-5 CD-20 FS SS Measurement 003 CD-5 CD-20 FS SS ΟΕΠ Το οριζόντιο ΟΕΠ (πείραμα) παραμένει απλό και άμεσα κατανοητό (όλα τα πεδία έχουν ξεκάθαρο νόημα και τα δεδομένα είναι απολύτως 133 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
134 ευθυγραμμισμένα ανάμεσα στις διαφορετικές εγγραφές), παρά το γεγονός ότι ο όγκος της πληροφορίας έχει αυξηθεί σημαντικά. Το κάθετο ΟΕΠ δεν είναι σε θέση να παρέχει πληροφορίες χωρίς την εκτέλεση απαραιτήτων πράξεων εξόρυξης δεδομένων (εύρεση των ονομάτων των αντιγόνων που μετρήθηκαν σε κάθε κανάλι, ευθυγράμμιση των δεδομένων ώστε κάθε στήλη να αναφέρεται στο ίδιο αντιγόνο, κλ). Στη συνέχεια αξιολογούμε τις σημαντικές αντιξοότητες του Κάθετου Σχήματος Βάσης Δεδομένων όταν ο στόχος βρίσκεται στην ολοκλήρωση στο επίπεδο ενός συγκεκριμένου αντιγόνου, ασθενούς ή μίας ομάδας ασθενών. Το σχήμα της βάσης δεδομένων που προτείνεται στο πλαίσιο της διατριβής εξουδετερώνει/ελαχιστοποιεί τα μειονεκτήματα παρέχοντας τη δυνατότητα αποθήκευσης των δεδομένων σε οριζόντιο τρόπο, ο οποίος επιτρέπει την ολοκλήρωση και ανάλυση των δεδομένων.
135 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΤΟ ΣΥΜΒΑΤΙΚΟ (ΚΑΘΕΤΟ) ΣΧΗΜΑ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Ο συμβατικός τρόπος για την αποθήκευση δεδομένων σύμφωνα με το πρότυπο FCS σε μία βάση δεδομένων είναι να αναπαράγουμε τη δομή του προτύπου σε πίνακες της βάσης δεδομένων και να αποθηκεύσουμε σε αυτούς τις τιμές χωρίς προηγούμενο μετασχηματισμό της δομής. Ένας πρώτος τρόπος υλοποίησης του συγκεκριμένου σχήματος αποτελεί η δημιουργία μίας βάσης δεδομένων που αποτελείται από δύο πίνακες. Τα πεδία του πίνακα ΤΕΧΤ θα τα αποτελέσουν οι λέξεις/κλειδιά που παρουσιάζονται στο τμήμα ΤΕΧΤ του αρχείου FCS. Κάθε εγγραφή του συγκεκριμένου πίνακα θα αντιστοιχηθεί σε ένα πείραμα και θα απαιτηθεί το πεδίο ExpID ως το πρωτεύον κλειδί για την αναγνώριση των διακριτών πειραμάτων. Ο πίνακας DATA θα χρησιμοποιηθεί για την αποθήκευση των πραγματικών τιμών και τα πεδία του θα αναπαραστήσουν τις μετρήσιμες παραμέτρους, με τη χρήση των γενικών ονομάτων (P2, P3, κλπ). Τα σύγχρονα κυτταρόμετρα καταγράφουν μετρήσεις που αφορούν έως 256 παραμέτρους (σε κάποιες ακραίες περιπτώσεις) για κάθε γεγονός. Μία εγγραφή θα αντιστοιχεί σε ένα συγκεκριμένο κύτταρο που μετράτε στο συγκεκριμένο πείραμα. Το πεδίο ExpID θα χρησιμοποιηθεί και στην περίπτωση αυτή, ως ένα ξένο παιδί στο αντίστοιχο πεδίο του πίνακα TEXT. Στο πλαίσιο του κάθε πειράματος, κάθε κύτταρο θα αναγνωρίζεται με τη χρήση ενός σειριακού αριθμού και κατά συνέπεια θα απαιτηθεί ένα επιπλέον πεδίο ExpID. Ο συνδυασμός των πεδίων ExpID και EventID θα λειτουργεί ως το πρωτεύον κλειδί στο πεδίο DATA. Ο προβληματικός χαρακτήρας της συγκεκριμένης προσέγγισης προέρχεται απευθείας από το γεγονός ότι το πρότυπο FCS επιτρέπει τη χρήση προαιρετικών και προσαρμοζόμενων (custom) λέξεων-κλειδιών, τα οποία διαφέρουν από το ένα αρχείο στο άλλο. Παρά το γεγονός ότι θα μπορούσαμε να συμπεριλάβουμε όλα τα προαιρετικά πεδία του προτύπου FCS στη δομή του πίνακα ΤEXT, γνωρίζοντας ότι στην πλειοψηφία τους θα παραμείνουν κενά, δεν είναι δυνατόν να γνωρίζουμε εκ των προτέρων την ποικιλία των προαιρετικών πεδίων. Θα μπορούσαμε να προτείνουμε δύο εναλλακτικές προσπάθειες για την ελαχιστοποίηση των συγκεκριμένων προβλημάτων. Ο πρώτος τρόπος που παρουσιάζεται και στην Εικόνα 7 είναι να προτείνουμε τη χρήση ενός επιπλέον πίνακα CUSTOM, στον οποίο να αποθηκεύονται τα ζεύγη λέξη-κλειδί/τιμή της λέξης-κλειδί όλων των προαιρετικών παραμέτρων που συναντάμε στο πρότυπο 135 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
136 FCS. Η δεύτερη προσέγγιση (Εικόνα 8) βασίζεται στην προ-ανάλυση όλων των αρχείων FCS ώστε να αναγνωριστούν όλες οι προσαρμοζόμενες παράμετροι που χρησιμοποιήθηκαν. Στην περίπτωση που είχαμε στη διάθεσή μας τα ονόματα των λέξεων-κλειδιών θα μπορούσαμε να τα περιλάβουμε στη δομή του πίνακα TEXT όπως συνέβη και με τις επιλεγόμενες λέξεις-κλειδιά. Η διαδικασία της ανάλυσης του τμήματος TEXT θα πρέπει να επαναληφθεί πριν την μετάβαση οποιονδήποτε δεδομένων στη βάση. Η τελευταία προσέγγιση που παρουσιάστηκε στην Εικόνα 8 αναπαριστά το παραδοσιακό σχήμα ως σχήμα αναφοράς και συγκρίσεων. Παρά το γεγονός ότι το συγκεκριμένο σχήμα θα ήταν ικανοποιητικό για την απλή καταγραφή δεδομένων σύμφωνα με το πρότυπο FCS, δεν μπορεί να κριθεί κατάλληλη για ερωτήσεις ανάκτησης δεδομένων. Η ανάγκη ενός ιατρού ή ενός ερευνητή καλύπτεται από τη δυνατότητας της βάσης δεδομένων κυτταρομετρίας ροής να επιτρέπει την εκτέλεση επερωτήσεων που απαντούν σε ερωτήματα της πραγματικής ζωής. Θα πρέπει να είναι σε θέση να απαντήσει ερωτήματα του τύπου «ποιοι ασθενείς παρουσιάζουν το συγκεκριμένο αντιγόνο σε τιμές πάνω από ένα συγκεκριμένο επίπεδο» ή «ποια είναι η κατανομή ενός συγκεκριμένου αντιγόνου σε μία συγκεκριμένη ομάδα ασθενών, ανεξαρτήτως του περιβάλλοντος υλικού και λογισμικού που χρησιμοποιήθηκε για το συγκεκριμένο πείραμα. Δυστυχώς το παραδοσιακό σχήμα βάσης δεδομένων που παρουσιάστηκε προηγουμένως δεν είναι σε θέση να παράγει αποτελέσματα σε τέτοια ερωτήματα, καθώς εκ σχεδιασμού, παραμένει σε μία κάθετη λογική.
137 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΛΕΙΤΟΥΡΓΙΚΟΣ ΣΥΝΔΥΑΣΜΟΣ ΜΕ ΚΛΙΝΙΚΟΕΡΓΑΣΤΗΡΙΑΚΑ ΑΙΜΑΤΟΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ (INTER DOMAIN INTEGRATION) Η οριζόντια λογική που ακολουθεί το προτεινόμενο σχήμα της βάσης δεδομένων κυτταρομετρίας ροής μπορεί εύκολα να εφαρμοστεί και σε δεδομένα από διαφορετικά ιατρικά πεδία. Στο πλαίσιο της εξεταζόμενης νόσου (ΧΛΛ) ο λειτουργικός συνδυασμός επεκτάθηκε στο πεδίο της Αιματολογίας (Σχήμα 11). ΠΕΔΙΟ ΚΥΤΤΑΡΟΜΕΤΡΙΑΣ ΡΟΗΣ TEXT ExpID PatID... ΠΕΔΙΟ ΑΙΜΑΤΟΛΟΓΙΑΣ BLOOD ExpID PatID... DATA ExpID EventID... INFO ExpID... DATA2 ExpID EventID... INFO2 ExpID... [Int Σχήμα 11] 137 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Αιματολογική Κλινική
138 Ένας επιπλέον πίνακας «BLOOD» προστέθηκε στη βάση δεδομένων για την αποθήκευση των αιματολογικών εξετάσεων. Η δομή του πίνακα BLOOD παραμένει οριζόντια και κάθε εξέταση αποθηκεύεται σε μία γραμμή του πίνακα. Για να υποστηρίζει η βάση δεδομένων αιματολογικές μετρήσεις οι οποίες δεν είναι μονοδιάστατες (π.χ. αριθμός λεμφαδένων), αλλά πολυδιάστατες (π.χ. τα ειδικά χαρακτηριστικά του κάθε λεμφαδένα) ένας ακόμη πίνακας πρέπει να προστεθεί στη βάση, ώστε να αποθηκευτεί η επιπλέον πληροφορία και να διατηρηθεί η οριζόντια λογική του σχήματος. Ακολουθώντας το παράδειγμα των πινάκων TEXT και DATA της κυτταρομετρίας ροής, δημιουργήσαμε τους πίνακες BLOOD και DATA2. Ο πίνακας BLOOD αποθηκεύει τις αιματολογικές μετρήσεις μίας διάστασης (π.χ. SEX, SCORE, WBC, κλπ) και ο πίνακας DATA2 τις πολυδιάστατες. Για να βελτιωθεί περεταίρω η οριζόντια δομή των αιματολογικών δεδομένων δημιουργήσαμε ένα πίνακα επιτάχυνσης INFO2, σε αντιστοιχία με τον πίνακα INFO των κυτταρομετρικών δεδομένων. Ο κωδικός ταυτοποίησης κάθε ασθενούς, Patient ID, ένα μοναδικός αριθμός που αντιστοιχείται σε κάθε ασθενή από το νοσοκομείο παρέχει τη συνδετική σχέση ανάμεσα στα δεδομένα της αιματολογίας και της κυτταρομετρίας ροής. Η χρήση του ονόματος του ασθενούς, ως μέσο σύνδεσης, θα δημιουργούσε αρκετές λανθασμένες σχέσεις ανάμεσα σε ασθενείς με συνωνυμίες η ανομοιογένειες στον τρόπο γραφής των ονομάτων τους. Τα αρχεία κυτταρομετρίας ροής εμπεριέχουν στο τμήμα TEXT των σχετικό κωδικό κάθε ασθενούς. Με τη χρήση του μοναδικού κωδικού ταυτοποίησης και διατηρώντας τα δεδομένα και των δύο πεδίων σε οριζόντιες δομές τα πλεονεκτήματα της οριζόντιας δομής μεταφέρονται και στις συνενώσεις των δύο πεδίων. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 138
139 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΑΠΟΤΕΛΕΣΜΑΤΑ Η σχεδίαση του νέου μοντέλου σχεσιακής βάσης δεδομένων βασίστηκε στις απαιτήσεις των τελικών χρηστών, των κλινικών ιατρών και των ερευνητών στην περιοχή της Αιματολογίας και της Κυτταρομετρίας Ροής. Για το λόγο αυτό απαιτήθηκε η στενή συνεργασία μεταξύ ιατρών, επιστημόνων πληροφορικής και επιστημόνων φυσικής ιατρικής. Οι επικεφαλείς της αιματολογικής κλινικής και του εργαστηρίου κυτταρομετρίας ροής του Πανεπιστημιακού Νοσοκομείου Πατρών αποτίμησαν τις εργασίες των ιατρών αιματολόγων που εμπλέκονται σε θέματα κυτταρομετρίας ροής και κατέγραψαν μεγάλο φάσμα των ερευνητικών και καθημερινών απαιτήσεων που θα μπορούσε να έχει ένας ιατρός από ένα πληροφοριακό σύστημα διαχείρισης κυτταρομετρικών και αιματολογικών δεδομένων. Η μελέτη δεν ακολούθησε μία συστηματική προσέγγιση αλλά προσπάθησε να καλύψει όλες τις τρέχουσες ερευνητικές και καθημερινές ανάγκες του προσωπικού. Τα αποτελέσματα της καταγραφής των απαιτήσεων του τελικού χρήστη έδειξαν ότι μία «έξυπνη» βάση δεδομένων πρέπει να παρέχει τις δυνατότητες για: Την εκτέλεση συντακτικά απλών και διαισθητικών ερωτημάτων σχετικών με επιστημονικές ερωτήσεις που ανακύπτουν κατά την κλινική καθημερινότητα καθώς και κατά την έρευνα. Άμεση συσχέτιση των ερωτημάτων που απευθύνονται στη βάση δεδομένων με τα κλινικά, εργαστηριακά και ερευνητικά ερωτήματα της πραγματικής ζωής. Απαντήσεις στα ερωτήματα σε πραγματικό χρόνο (real time query response). Αποθήκευση των δεδομένων χωρίς απόλυα πληροφοριών, όπως συμβαίνει όταν αποθηκεύεται η μέση τιμή ενός αντιγόνου αντί των μεμονωμένων τιμών κάθε κυττάρου. 139 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
140 Διατήρηση των δεδομένων σε τέτοια μορφή ώστε η διασύνδεσή τους με δεδομένα προερχόμενα από διαφορετικούς εργαστηριακούς ή κλινικούς χώρους να απαιτεί την ελάχιστη δυνατή προσπάθεια. Δυνατότητα, εκτός από την εξέταση μεμονωμένων περιστατικών εξετάσεων, μαζικής επεξεργασίας μέρους ή του συνόλου των δεδομένων. ΤΟ ΠΡΟΤΕΙΝΟΜΕΝΟ ΣΧΗΜΑ ΤΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Το προτεινόμενο σχήμα της βάσης δεομένων (Figure 5) είναι ικανό να καλύπτει τις συγκεκριμένες απαιτήσεις λόγω της σαφούς οριζόντιας δομής του. Κατά τη διάρκεια των εξαντλητικών μας δοκιμών, κανένα ερώτημα ή εγγραφή ΟΕΠ οποιουδήποτε τύπου δεν απαιτούσε κάποια επιπλέον επεξεργασία ώστε να καταστεί άμεσα αξιοποιήσιμη από τους ερευνητές. Το σχήμα της βάσης δεδομένων αποτελείται από τους ακόλουθες πίνακες: Τον πίνακα TEXT, ο οποίος περιέχει όλα τα ζεύγη λέξεων-κλειδί και τιμή κάθε κύριου και συμπληρωματικού τμήματος του προτύπου FCS. Ένα επιπλέον αριθμητικό πεδίο ExpID αποτελεί το πρωτεύον κλειδί του συγκεκριμένου πίνακα. Τον πίνακα DATA, ο οποίος περιέχει τις πραγματικές τιμές των μετρήσεων. Το πεδίο ExpID χρησιμοποιείται επίσης ως ξένο κλειδί στην περίπτωση του συγκεκριμένου πίνακα, χωρίς να περιέχει μοναδικές τιμές. Ένα νέο πεδίο EventID έχει προστεθεί για να χαρακτηρίσει κάθε ξεχωριστό γεγονός, το κύτταρο, το οποίος καταγράφεται από το κυτταρόμετρο. Ο συνδυασμός των πεδίων ExpID και EventID χρησιμοποιείται ως το πρωτεύον κλειδί του πίνακα DATA για τη διάκριση μεταξύ διαφορετικών κυττάρων και πειραμάτων. Ο πίνακας DATA περιέχει ένα πεδίο για κάθε ποσότητα που μετράται σε όλη τη βάση δεδομένων. Για παράδειγμα, όλες οι μετρήσεις που αφορούν το αντιγόνο CD23 αποθηκεύονται σε ένα πεδίο. Κενές τιμές (blank) αναπαριστούν την έλλειψη μέτρησης για την συγκεκριμένη ποσότητα στο συγκεκριμένο γεγονός-κύτταρο. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 140
141 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Τον πίνακα DATA_INFO, ο οποίος περιέχει τον αριθμό του καναλιού μέσω του οποίου μία συγκεκριμένη παράμετρος μετρήθηκε για το συγκεκριμένο πείραμα. Έχει ακριβώς την ίδια δομή με τον πίνακα DATA και, καθώς αναφέρεται σε πειράματα αντί σε κύτταρα, το πεδίο eventid δεν απαιτείται. Το πεδίο expid είναι επίσης ξένο κλειδί στο αντίστοιχο πεδίο του πίνακα TEXT, αλλά στην περίπτωση αυτή είναι μοναδικό. Ο πίνακας DATA_INFO δρα ως επιταχυντής στην αναγνώριση των πειραμάτων που μετρούν συγκεκριμένες παραμέτρους (αντιγόνα) και σε ποιο μήκος κύματος. Αν, για παράδειγμα η τιμή CD20 μετρήθηκε για ένα συγκεκριμένο πείραμα στο κανάλι 8 (P8), τότε η εγγραφή για το συγκεκριμένο πείραμα θα περιείχε την τιμή 8 στο πεδίο CD20. Με τον τρόπο αυτό, ακόμα και αν όλες οι μετρήσεις που αναφέρονται στο αντιγόνο CD20 αποθηκευτούν στο ίδιο πεδίο του πίνακα DATA, ο χρήστης έχει τη δυνατότητα να αναγνωρίσει διαφορετικές τιμές εκφάνσεων του αντιγόνου (FITC, PE, Cy5, κλπ.). Στο μέλλον ο πίνακας, DATA_INFO θα μπορούσε επίσης να περιέχει μεταδεδομένα των πειραμάτων, για παράδειγμα την μέση τιμή ενός αντιγόνου. Στο πεδίο expid έχει τοποθετηθεί ευρετήριο σε κάθε πίνακα για να επιταχύνει τα σχετικά ερωτήματα. Το προτεινόμενο σχήμα μπορεί να υλοποιηθεί σε οποιαδήποτε σχεσιακή βάση δεδομένων που υποστηρίζει βασικές συσχετίσεις μεταξύ πινάκων (Πρωτεύοντα-ξένα κλειδιά). Καθώς τα δεδομένα που ενσωματώνονται στη βάση δεδομένων αριθμούν εκατομμύρια γραμμές δεδομένων δεν προτείνεται η αποθήκευση δεδομένων με βάση το πρότυπο FCS σε βάσεις δεδομένων χωρίς δυνατότητα ευρετηρίασης. 141 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
142 Many to one relation Η δομή του πίνακα TEXT EXPERIMENT-ID One to One Experiment s unique ID (Primary Key) relation $BEGINANALYSIS Byte-offset to the beginning of the ANALYSIS segment. $BEGINDATA Byte-offset to the beginning of the DATA segment. $BEGINSTEXT Byte-offset to the beginning of a supplemental TEXT segment. $BYTEORD Byte order for data acquisition computer. $DATATYPE Type of data in DATA segment (ASCII, integer, floating point). $ENDANALYSIS Byte-offset to the end of the ANALYSIS segment. $ENDDATA Byte-offset to the end of the DATA segment. $ENDSTEXT Byte-offset to the end of a supplemental TEXT segment. $MODE Data mode (list mode, histogram). $NEXTDATA Byte offset to next data set in the file. $PAR Number of parameters in an event. $PnB Number of bits reserved for parameter number n. $PnE Amplification type for parameter n. $PnR Range for parameter number n. $TOT Total number of events in the data set. $ABRT Events lost due to data acquisition electronic coincidence. $BTIM Clock time at beginning of data acquisition. $CELLS Description of objects measured. $COM Comment. $COMP Fluorescence compensation matrix. $PnS Name used for parameter n. CUSTOM1 Custom keyword one. CUSTOM2 Custom keyword two. Η δομή του πίνακα DATA EXPERIMENT-ID (Foreign Key) Experiment s unique ID EVENT number Serial number of each event measured in experiment FS Value measured for FS SS Value measured for SS CD20 Value measured for CD20 KAPPA Value measured for KAPPA Η δομή του πίνακα DATA_INFO EXPERIMENT-ID (Foreign Key) Experiment s unique ID FS Channel number for FS SS Channel number for SS CD20 Channel number CD20 KAPPA Channel number KAPPA [Int Εικόνα 9] Το προτεινόμενο (οριζόντιο) σχήμα βάσεων δεδομένων περιλαμβάνει τρεις βασικούς πίνακες, κάθε συνδυασμός των οποίων παράγει ΟΕΠ χωρίς την ανάγκη επιπλέον πράξεων. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 142
143 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΠΡΟ-ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ Για την απλοποίηση και επιτάχυνση της εισαγωγής των δεδομένων στο προτεινόμενο σχήμα, αναπτύχθηκε μία ειδικά σχεδιασμένη εφαρμογή (FCSvibes). Η εφαρμογή αυτή έχει τη δυνατότητα να εισάγει και ενσωματώνει στη βάση δεδομένων μεγάλου μεγέθους δεδομένα κυτταρομετρίας ροής που ακολουθούν το πρότυπο FCS, ανεξαρτήτως προδιαγραφών του υλικού και του κατασκευαστή του κυτταρομετρητή. Η κύρια προδιαγραφή της εφαρμογής αφορά την ομογενοποίηση των ονομάτων των μεταβλητών, καθώς το πρότυπο FCS επιτρέπει στους χρήστες να δίνουν οποιαδήποτε τιμή στις μετρούμενες παραμέτρους. Η ομογενοποίηση διεξάγεται μέσω του γραφικού περιβάλλοντος της εφαρμογής ή μέσω ενός συνόλου κανόνων που καθορίζει ο χρήσης με τη μορφή κανονικών εκφράσεων (regular expressions). Επιπλέον στην περίπτωση όπου ο χειριστής του εξοπλισμού κυτταρομετρίας ροής δεν καθορίσει το όνομα των σχετικών παραμέτρων και η παράμετρος λάβει τα προκαθορισμένα ονόματα (π.χ. FL1), η εφαρμογή μπορεί να ανακτήσει το όνομα της παραμέτρου από τα εναλλακτικά πεδία του τμήματος TEXT (π.χ. τον τίτλο της εξέτασης, αν υπάρχει) με τη χρήση των ίδιων κανονικών εκφράσεων (π.χ. αναζήτησε την τιμή CD5 σε ένα τίτλο της μορφής "CD20/CD5 test"). Ο κύριος αλγόριθμος αναπτύχθηκε έχοντας υπόψη τον ευρύτερο δυνατό σκοπό της εφαρμογής και την ευελιξία της. Αντί να χρησιμοποιεί ενσωματωμένες και αμετάβλητες (hard-wired) εκφράσεις, και να είναι κατά συνέπεια δεσμευμένη με τις τρέχουσες υλοποιήσεις κυτταρομετρίας ροής, ο προτεινόμενος αλγόριθμος αναλύει γραμματικά και μεταφράζει την επικεφαλίδα κάθε αρχείου που ακολουθεί το πρότυπο FCS στις εκδόσεις 3.0, 2.0 και 1.0. Κατά συνέπεια, δεσμεύει δυναμικά τα απαραίτητα πεδία για τη διαδικασία εξαγωγής, ανάλογα με τις προδιαγραφές που διαβάζει από το τμήμα TEXT ενός αρχείου. Το αποτέλεσμα είναι ότι η εφαρμογή είναι ικανή να διαβάζει κάθε αρχείο σύμφωνα με το πρότυπο FCS, χωρίς να περιορίζεται από τις προδιαγραφές του υλικού του κυτταρομετρητή, σε σχέση με το επίπεδο ψηφιοποίησης, το μέγεθος της λέξης, την σειρά των bytes, την ενίσχυση, τον αριθμό των καναλιών, κλπ. 143 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
144 FCS LAB 1 DATABASE FCSvibes TEXT WEKA XLS MAT- LAB FCS LAB 2 FCS LAB N TEXT WEKA XLS MAT- LAB FCSvibes TEXT WEKA XLS MAT- LAB FCSvibes [Int Εικόνα 10] Η εφαρμογή (FCSvibes) αναλύει τα αρχεία FCS και στη συνέχεια εφαρμόζει κανόνες ομογενοποίησης ώστε τα δεδομένα να εισαχθούν στη βάση με ενιαία ονοματολογία. Επιπροσθέτως το FCSvibes είναι σε θέση να εξάγει τα δεδομένα με διάφορες μορφοποιήσεις (αρχεία κειμένου, WEKA, Excel και Matlab). Ακολουθούν τα βασικά διαγράμματος ροής και οι βασικές οθόνες της εφαρμογής. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 144
145 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής BEGIN CheckSettings() (File or folder selection, File extensions, Filters) DB EXPORT SETTINGS EXCEL TXT OUTPUT FILE TYPE (TAB, WEKA, MATLAB) SEGMENT SELECTION SEGMENT SELECTION SEGMENT SELECTION DB TABLE NAMES OUTPUT FOLDER SENSITIVE DATA NO YES VARIABLE SELECTION USE TEST TITLE TO VALIDATE NO YES VARIABLE SELECTION P# NAMES ANALYSIS UNIFORMITY OF P.NAMES NO YES DEFINE RULES FOR NAME UNIFORMITY WRITE OUTPUT END 145 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
146 BEGIN (WRITE OUTPUT Check if files or folders Folder MakeFileList() Files <= 64 END NO Check if next file exists. YES Check file size > 64 ValidateHead Read Header NO Header OK? YES Read Text Segment ValidateText() NO Variable s OK? ValidateObligatoryFCSvariables() YES Text OK? NO YES Export Header? NO YES Export Text Segment Export Data? NO YES Check if user wants P. NO YES PUnification() Export Data Segment ConvertBin2Text() Read Data Segment Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 146
147 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Check if files or folders selected: Η αρχική ρουτίνα εισόδου χρησιμοποιεί μία ταξινομημένη λίστα με τα FCS αρχεία προς επεξεργασία. Αν ο χρήστης έχει επιλέξει μεμονωμένα αρχεία τότε αυτά ταξινομούνται. Αν ο χρήστης επιλέξει κάποιον κατάλογο τότε η συνάρτηση MakeFileList() θα δημιουργήσει την ταξινομημένη λίστα των αρχείων, ανάλογα με τα κριτήρια επιλογής του χρήστη (π.χ. *.lmd. *.fcs, *.dat, ). Check if next file exists: Έλεγχος για την ύπαρξη ή μη κάθε αρχείου της ταξινομημένης λίστας. Check file size: Έλεγχος για το ελάχιστο επιτρεπτό μέγεθος ενός FCS αρχείου (64 bytes). Read Header: Ανάγνωση των αρχικών 64 bytes κάθε αρχείου. Validate Header: Έλεγχος για τη δομική συνοχή του τμήματος HEADER κάθε αρχείου, σύμφωνα με τις οδηγίες του προτύπου FCS. Read Text Segment: Ανάγνωση του τμήματος TEXT των αρχείων, βάσει των δηλωθέντων, στο τμήμα HEADER, συντεταγμένων. Validate Text Segment: Έλεγχος για τη δομική συνοχή του τμήματος DATA κάθε αρχείου, σύμφωνα με τις οδηγίες του προτύπου FCS. Validate Obligatory FCS Variables: Έλεγχος για την ύπαρξη και τη δομική συνοχή των υποχρεωτικών FCS μεταβλητών. Export Header: Εξαγωγή του επιβεβαιωμένου τμήματος HEADER σε αρχεία κειμένου, Excel ή Βάσεις δεδομένων. Export Data: Εξαγωγή του τμήματος DATA σε αρχεία κειμένου, Excel ή Βάσεις δεδομένων. Check if user wants P. Unification: Αν ο χρήστης επιλέξει την ομογενοποίηση της ονοματολογίας των αντιγόνων οι σχετικοί στατικοί κανόνες ή οι κανονικές εκφράσεις θα εφαρμοστούν στα εξαγόμενα δεδομένα ώστε αυτά να αποκτήσουν ενιαίο τρόπο γραφής. Read Data Segment: Ανάγνωση του τμήματος DATA των αρχείων, βάσει των δηλωθέντων, στο τμήμα HEADER, συντεταγμένων. Convert Binary to Text: Η συνάρτηση αναλύεται στην επόμενη σελίδα και μετατρέπει τα δυαδικά δεδομένα των FCS αρχείων σε αναγνώσιμη μορφή. 147 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
148 BEGIN (Export Data Segment) GetByteOrder() MakeOrderMatrix() FC byte order GetParamNumber() MakeParamMatrix() GetParamBitSize() MakeBitMaskMatrix() Parameter bit size P. Combine Order Matrix Parameter Matrix Bit Mask Matrix Next data word exists Read binary word Apply Conversion Matrix to word END Write numeric value binary Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 148
149 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Get Byte Order: Το τμήμα TEXT κάθε FCS αρχείου περιέχει τη μεταβλητή $BYTEORD, η οποία προσδιορίζει την ιεραρχία των bytes όπως αυτή ορίστηκε από το υλικό του κυτταρομετρητή ροής. Αν η ιεραρχία του FCS αρχείου είναι διαφορετική από αυτή του υπολογιστή στον οποίο αποκωδικοποιείται το αρχείο, τότε δημιουργείται ένας πίνακας μετασχηματισμού ώστε να κανονικοποιηθούν τα δυαδικά δεδομένα σύμφωνα με την ιεραρχία του υπολογιστή. Get Parameter Number: Η μεταβλητή $PAR προσδιορίζει τον αριθμό των παραμέτρων (χρωμάτων) που χρησιμοποιήθηκαν στο πείραμα που παρήγαγε το αρχείο. Make Parameter Matrix: Ένας νέος πίνακας δημιουργείται σύμφωνα με τον αριθμό των παραμέτρων που δηλώθηκαν στη μεταβλητή $PAR. Οι γραμμές του συγκεκριμένου πίνακα θα αποθηκεύσουν τις τιμές των μετρήσεων του πειράματος. Get Parameter Bit Size: Η μεταβλητή $PnB δηλώνει το μέγεθος, σε bits, κάθε παραμέτρου του πειράματος και η μεταβλητή $PnR δηλώνει το βάθος της ανάλυσης (αριθμός κβάντων) κάθε παραμέτρου. Στην πλειοψηφία των περιπτώσεων δεν υπάρχει 1:1 αντιστοιχία ανάμεσα στις τιμές των δύο μεταβλητών (π.χ. βάθος ανάλυσης 1024 και μέγεθος bits 16) με αποτέλεσμα ορισμένα από τα bits κάθε παραμέτρου να μην χρησιμοποιούνται. Για τον λόγο αυτό ένας επιπλέον πίνακας με τις κατάλληλες μάσκες αποκοπής των μη χρησιμοποιούμενων bits πρέπει να ορισθεί. Combine Order, Parameter and Bit Mask Matrices: Δημιουργία ενός πολυδιάστατου πίνακα, ο οποίος θα περιέχει όλα τα απαραίτητα δεδομένα για την αποκωδικοποίηση των 2 δυαδικών δεδομένων του τμήματος DATA P1 P2 Byte Order Bit Mask P3 P4 149 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
150 Η βασική οθόνη με τις παρεχόμενες δυνατότητες για την επεξεργασία FCS αρχείων Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 150
151 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής 1. SQL Server Address: DNS ή διεύθυνση IP της βάσης δεδοµένων. 2. Database Name: Το όνοµα της βάσης δεδοµένων. 3. Username: Το όνοµα χρήστη µε πλήρη πρόσβαση (select, insert, update, delete) στη βάση δεδοµένων που δηλώθηκε στο βήµα Password: Ο κωδικός πρόσβασης του χρήστη που δηλώθηκε στο βήµα Test Connection: Επιβεβαίωση της ορθότητας των στοιχείων σύνδεσης που δηλώθηκαν στα βήµατα 1 έως Write imported segments into Excel: Ο χρήστης µπορεί να επιλέξει αν θα αποθηκευτούν σε αρχεία Excel τα τµήµατα TEXT και DATA των FCS αρχείων. 7. Write imported text/data segments into text files: Ο χρήστης µπορεί να επιλέξει αν θα αποθηκευτούν σε αρχεία κειµένου τα τµήµατα TEXT και DATA των FCS αρχείων και να προσδιορίσει τη µορφοποίηση την οποία θα ακολουθούν τα αρχεία κειµένου. 8. Write imported text/data segments into DB Tables: Ο χρήστης µπορεί να επιλέξει αν θα αποθηκευτούν σε βάση δεδοµένων τα τµήµατα TEXT και DATA των FCS αρχείων. 9. FCS Folder and Files: Το πεδίο αυτό εµφανίζει το φάκελο που έχει επιλεγεί στο βήµα 10 και τη λίστα µε τα FCS αρχεία. 151 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
152 10. Select option for FCS Folder and Files: Ο χρήστης µπορεί να επιλέξει ένα φάκελο και να δουλέψει µε όλα τα FCS αρχεία που αυτός περιέχει ή να επιλέξει µεµονωµένα αρχεία. 11. Include Sub Folders: Επιλογή ή εξαίρεση των υποφακέλων από την αναζήτηση για FCS αρχεία. 12. P# Names Analysis: Εµφανίζει σε ένα νέο φύλλο εργασίας τις διαφορετικές µορφές ονοµατολογίας των αντιγόνων που συµµετέχουν στα FCS αρχεία. 13. Output Folder: Εµφανίζει τον φάκελο στον οποίο θα δηµιουργηθούν τα αρχεία εξόδου. 14. Select Folder: Επιλογή του φακέλου στον οποίο θα δηµιουργηθούν τα αρχεία εξόδου. 15. FCS File Extensions: υνατότητα επιλογής των επιθυµητών καταλήξεων αρχείων τα οποία θα συµµετέχουν στην αναζήτηση. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 152
153 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής 16. Excluded Text Variables: υνατότητα αποκλεισµού των µεταβλητών που περιέχουν προσωπικά δεδοµένα από τα αρχεία εξόδου. 17. If a legal name pattern is not found in variable $P#S look for a valid name in title variable: Ο χρήστης µπορεί να δηλώσει στο πεδίο 19 τα έγκυρα ονόµατα των αντιγόνων που επιθυµεί να συµµετάσχουν στην αναζήτηση. Στην περίπτωση που η ονοµασία ενός αντιγόνου δεν είναι έγκυρη ο χρήστης µπορεί να δηλώσει στο πεδίο 17 την αναζήτηση έγκυρων ονοµάτων στην ονοµασία του πάνελ ή σε άλλες µεταβλητές του FCS. Για παράδειγµα αν η ονοµασία του CD20 δεν έχει δηλωθεί κατά τη δηµιουργία του πειράµατος και η µεταβλητή $P3S έχει την τιµή FL3 (αντί για CD20) είναι δυνατό το όνοµα του CD20 να επικυρωθεί από τη µεταβλητή «test title» η οποία περιέχει την τιµή CD5/CD Check that legal name patterns also exit in variable above: Ταυτόχρονη ενεργοποίηση των πεδίων 17 και Valid P# Names: Στο πεδίο 19 ο χρήστης µπορεί να δηλώσει τους κανόνες οµογενοποίησης των ονοµάτων των αντιγόνων. Η περιγραφή της σχετικής ονοµατολογίας γίνεται µε χρήση κανονικών εκφράσεων (regular expressions) και έχουν τη µορφή: 153 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
154 Η βασική οθόνη σύνθετης αναζήτησης στα Αιματολογικά και Κυτταρομετρικά δεδομένα. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 154
155 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ΠΟΣΟΤΙΚΕΣ ΜΕΤΡΗΣΕΙΣ Για την αξιολόγηση του συμβατικού και του προτεινόμενου σχήματος βάσεων δεδομένων καθώς και των εφαρμογών ομογενοποίησης και στατιστικής διερεύνησης χρησιμοποιήθηκαν: αρχεία κυτταρομετρίας ροής, τα οποία αντιστοιχούν σε περίπου εξετάσεις, προερχόμενα από εξοπλισμό συγκεκριμένων προδιαγραφών αρχεία κυτταρομετρίας ροής, προερχόμενα από τυχαίο εξοπλισμό ώστε να καλυφθεί όλο το φάσμα των εμπορικά διαθέσιμων κυτταρομετρητών ροής. Τα αποτελέσματα χαρακτηριστικών κλινικών και εργαστηριακών αιματολογικών εξετάσεων 464 ασθενών με ΒΧΛΛ. Τα αρχεία κυτταρομετρίας ροής προέρχονται από το αντίστοιχο εργαστήριο του Πανεπιστημιακού Νοσοκομείου Πατρών και αντιπροσωπεύουν το σύνολο των εξετάσεων που πραγματοποιήθηκαν κατά την περίοδο Οι χαρακτηριστικές αιματολογικές εξετάσεις προέρχονται από το Πανεπιστημιακό Νοσοκομείο Πατρών και το Γενικό Νοσοκομείο Πατρών «Ο Άγιος Ανδρέας». Όλα τα δεδομένα αποθηκεύτηκαν σε δύο βάσεις δεδομένων, οι οποίες δομήθηκαν βάσει του παραδοσιακού [Int Εικόνα 3] και του προτεινόμενου σχήματος [Int Εικόνα 5]. Τα περισσότερα από τα προκαταρκτικά ερωτήματα ανέδειξαν ότι το παραδοσιακό σχήμα αδυνατούσε να απαντήσει σε λογικά αποδεκτό χρόνο ή αποτύγχανε εντελώς να δώσει απάντηση. Για το λόγο αυτό αναγκαστήκαμε να περιορίσουμε το εύρος των δεδομένων που συμμετείχαν στις μετρήσεις διατηρώντας μόνο τις εξετάσεις κυτταρομετρίας ροής που αφορούσαν ασθενείς με Β-ΧΛΛ (3.741 αρχεία 534 εξετάσεις). Οι εξετάσεις αυτές καταγράφουν μετρήσεις για 41 αντιγόνα τα οποία εμφανίζονται με 164 διαφορετικούς τρόπους γραφής. Κανάλι Μέτρησης Αριθμός Ονομάτων Αριθμός Μοναδικών % Μείωσης Εύρους 155 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
156 Ονομάτων Ονοματολογίας $P1S $P2S $P3S $P4S $P5S $P6S [Int Πίνακας 1] Συνολικά ο πίνακας TEXT, στον οποίο αποθηκεύονται οι κεφαλίδες των FCS αρχείων, περιέχει εγγραφές. Ο πίνακας DATA, στον οποίο αποθηκεύονται οι μεμονωμένες μετρήσεις κάθε κυττάρου περιέχει εγγραφές και συνεπώς μετρήσεις για κύτταρα. Ο αριθμός των εγγραφών είναι κοινώς και για τις δύο βάσεις δεδομένων, αφού το προτεινόμενο σχήμα επιφέρει μόνο δομικούς μετασχηματισμούς, αφήνοντας τις τιμές των μετρήσεων στην αρχική τους μορφή. Τα βήματα της διαδικασίας αξιολόγησης περιγράφονται ως εξής: Αρχικά, λαμβάνοντας υπόψη τις βασικές εργασίες των κλινικών ιατρών εντός του πεδίου της Β-ΧΛΛ, αναλύσαμε την διαδικασία ανάκτησης εξετάσεων οι οποίες καταγράφουν συγκεκριμένους συνδυασμούς αντιγόνων. Για τον λόγο αυτό δημιουργήσαμε αρκετά ερωτήματα με σκοπό την ανάκτηση εξετάσεων στις οποίες συμμετέχουν ταυτόχρονα 2, 3 και 4 συγκεκριμένα αντιγόνα και σκοπό να καλύψουμε όλο το φάσμα των ιατρικών απαιτήσεων. ΑΑ Ανακτώμενες Παράμετροι Αριθμός Παραμέτρων 1 FS, SS 2, 3 or 4 2 FS, SS, CD5 2, 3 or 4 3 FS, SS, CD5, CD20 2, 3 or 4 4 FS, SS, CD5, CD20, CD19, CD34 4 [Int Πίνακας 2] - Καθημερινές ιατρικές ερωτήσεις μετατράπηκαν σε αντίστοιχα ερωτήματα για τις δύο βάσεις δεδομένων, συμβατική και προτεινόμενη. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 156
157 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Στη συνέχεια επαληθεύσαμε ότι κάθε ερώτημα ακολουθεί οριζόντια λογική και υιοθετεί τα πλεονεκτήματα των ΟΕΠ, όπως αυτά εμφανίζονται στον Πίνακα 3. Query Συμβατικό Σχήμα Προτεινόμενο Σχήμα Two colours Three colours Four colours 1 1,142 1,390 1, ,138 7,762 10, ,526 19,774 28, N/A N/A 89, [Int Πίνακας 3] Το μέγεθος σε bytes των ερωτημάτων (queries) για το συμβατικό σχήμα εξαρτάτε άμεσα από τον αριθμό των χρωμάτων του εκάστοτε κυτταρομετρητή και είναι σημαντικά μεγαλύτερο από τα ερωτήματα που απευθύνονται στο προτεινόμενο σχήμα. Η στήλη Query αντιστοιχεί στην αντίστοιχη αρίθμηση του πίνακα 2. Στο προτεινόμενο σχήμα ο μετασχηματισμός των ιατρικών ερωτήσεων σε ερωτήματα προς τη βάση δεδομένων αποτελεί μία απλή και ευθεία διαδικασία. Τα παραγόμενα ερωτήματα είναι απλά και προσεγγίζουν ικανοποιητικά τη φυσική ανθρώπινη γλώσσα. Επιπροσθέτως δεν εξαρτώνται ούτε μεταβάλλονται ανάλογα με τον αριθμό των χρωμάτων ή των λοιπών τεχνικών χαρακτηριστικών του εκάστοτε κυτταρομετρητή ροής. Για παράδειγμα το ερώτημα ανάκτησης των εξετάσεων που καταγράφουν τις τιμές της εμπρόσθιας και πλάγιας σκέδασης καθώς και τo αντιγόνοo CD5 έχει τη μορφή: SELECT ExpID, FS, SS, CD5 FROM DATA WHERE ExpID IN (SELECT ExpID FROM Data_Info WHERE CD5 IS NOT NULL) Αντιθέτως το συμβατικό σχήμα οδηγεί σε αρκετά πολύπλοκα και μακροσκελή ερωτήματα, δυσκολεύοντας το χρήστη στη σύνταξη και την κατανόησή τους. Το αντίστοιχο ερώτημα, που διατυπώθηκε στη 157 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
158 προηγούμενη παράγραφο, αν απευθύνονταν σε μία βάση δεδομένων σχεδιασμένη με τη συμβατική λογική θα είχε τη μορφή: SELECT TableA.ExpID, TableA.FS, TableB.SS, TableC.CD5 FROM ( SELECT ExpID, EventID, P1 AS FS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P1S] LIKE '%FS%' ) AND ( ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P2 AS FS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P2S] LIKE '%FS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P3 AS FS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P3S] LIKE '%FS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P4 AS FS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P4S] LIKE '%FS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 158
159 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P5 AS FS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P5S] LIKE '%FS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' O R [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' O R [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' O R [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' O R [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P6 AS FS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P6S] LIKE '%FS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) ) TableA INNER JOIN ( SELECT ExpID, EventID, P1 AS SS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P1S] LIKE '%SS%' ) AND ( ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P2 AS SS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P2S] LIKE '%SS%' ) AND 159 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
160 ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P3 AS SS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P3S] LIKE '%SS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P4 AS SS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P4S] LIKE '%SS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P5 AS SS FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( [$P5S] LIKE '%SS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%') AND ( [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) UNION ALL SELECT ExpID, EventID, P6 AS SS FROM LData WHERE ExpID IN Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 160
161 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής ( SELECT ExpID FROM LText WHERE ( [$P6S] LIKE '%SS%' ) AND ( ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%') AND ( [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%') AND ( [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%') AND ( [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%') AND ( [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%') ) OR ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%') AND ( [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%') ) ) ) ) TableB ON TableA.ExpID = TableB.ExpID AND TableA.EventID = TableB.EventID INNER JOIN ( SELECT ExpID, EventID, P1 AS CD5 FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( ( [$P1S] LIKE '%CD5%' OR [$P1S] LIKE '%CD[- /\]5%' ) AND [$P1S] NOT LIKE '%CD5[0-9]%' AND [$P1S] NOT LIKE '%CD[- /\]5[0-9]%' ) ) UNION ALL SELECT ExpID, EventID, P2 AS CD5 FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( ( [$P2S] LIKE '%CD5%' OR [$P2S] LIKE '%CD[- /\]5%' ) AND [$P2S] NOT LIKE '%CD5[0-9]%' AND [$P2S] NOT LIKE '%CD[- /\]5[0-9]%' ) ) UNION ALL SELECT ExpID, EventID, P3 AS CD5 FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( ( [$P3S] LIKE '%CD5%' OR [$P3S] LIKE '%CD[- /\]5%' ) AND [$P3S] NOT LIKE '%CD5[0-9]%' AND [$P3S] NOT LIKE '%CD[- /\]5[0-9]%' ) ) UNION ALL SELECT ExpID, EventID, P4 AS CD5 FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( ( [$P4S] LIKE '%CD5%' OR [$P4S] LIKE '%CD[- /\]5%' ) AND [$P4S] NOT LIKE '%CD5[0-9]%' AND [$P4S] NOT LIKE '%CD[- /\]5[0-9]%' ) ) UNION ALL SELECT ExpID, EventID, P5 AS CD5 FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( ( [$P5S] LIKE '%CD5%' OR [$P5S] LIKE '%CD[- /\]5%' ) AND [$P5S] NOT LIKE '%CD5[0-9]%' AND [$P5S] NOT LIKE '%CD[- /\]5[0-9]%' ) ) UNION ALL SELECT ExpID, EventID, P6 AS CD5 FROM LData WHERE ExpID IN ( SELECT ExpID FROM LText WHERE ( ( [$P6S] LIKE '%CD5%' OR [$P6S] LIKE '%CD[- /\]5%' ) AND [$P6S] NOT LIKE '%CD5[0-9]%' AND [$P6S] NOT LIKE '%CD[- /\]5[0-9]%' ) ) ) TableC ON TableA.ExpID = TableC.ExpID AND TableA.EventID = TableC.EventID ORDER BY TableA.ExpID Η αύξηση της πολυπλοκότητας των ερωτημάτων τα οποία απευθύνονται σε μία συμβατική βάση δεδομένων εξαρτάται άμεσα από τις προδιαγραφές του κυτταρομετρητή ροής που πραγματοποίησε τις μετρήσεις. 161 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
162 Στο Σχήμα 6 παρουσιάζεται η σχεδόν εκθετική αύξηση του μεγέθους των ερωτημάτων, προς μία συμβατική βάση δεδομένων, συναρτήσει του αριθμού των αντιγόνων που συμμετέχουν, ταυτόχρονα, σε κάθε μέτρηση. [Int Σχήμα 7] Η πολυπλοκότητα του ερωτήματος 3 (Πίνακας 2) συναρτήσει του συνολικού αριθµού χρωµάτων που καταγράφει σε κάθε πείραµα ο κυτταροµετρητής ροής. Το µέγεθος των ερωτηµάτων που απευθύνονται στο προτεινόµενο σχήµα παραµένει σταθερό και ανεξάρτητο των υποστηριζόµενων χρωµάτων, ενώ το µέγεθος των ερωτηµάτων που απευθύνονται στο συµβατικό σχήµα αυξάνεται εκθετικά, αρκετές τάξεις µεγέθους (7) από το προτεινόµενο. Αντιθέτως, το προτεινόμενο σχήμα, παράγει ερωτήματα σταθερού μεγέθους, 150 χαρακτήρων ακόμα και για ταυτόχρονες μετρήσεις 256 αντιγόνων, όπου το συμβατικό σχήμα απαιτεί ερωτήματα περίπου χαρακτήρων. Για να διερευνήσουμε περαιτέρω το μέγεθος της διαφοροποίησης ανάμεσα στις πολυπλοκότητες των ερωτημάτων προτεινόμενου και συμβατικού χαρακτήρα, υπολογίσαμε όλα τα πιθανά μεγέθη ερωτημάτων για τη αναζήτηση εξετάσεων που καταγράφουν μετρήσεις Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 162
163 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής k αντιγόνων σε κυτταρομετρητές με δυνατότητα ταυτόχρονης καταγραφής k αντιγόνων. Στο Σχήμα 7 παρουσιάζονται τα γραφήματα των αποτελεσμάτων αυτής της προσπάθειας και αναδεικνύουν την υπεροχή του προτεινόμενου σχήματος, το οποίο δεν ξεπερνά τους χαρακτήρες για αναζήτηση 256 αντιγόνων, τη στιγμή που το συμβατικό σχήμα από την αρχή σχεδόν του γραφήματος βγαίνει εκτός των ορίων πολυπλοκότητας ακόμα και τον πιο ισχυρών υπερυπολογιστών. [Int Σχήμα 8] Το μέγεθος των ερωτημάτων συναρτήσει του αριθμού των χρωμάτων που συμμετέχουν στο ερώτημα. Για ένα δεδομένο αριθμό χρωμάτων (k), αναζητούµε τις τιµές έντασης των αντιγόνων που αντιστοιχούν στα συγκεκριµένα χρώµατα. Ενδεικτικές τιµές: Αριθµός Χρωµάτων (k) Συµβατικό Σχήµα (αριθµός χαρακτήρων) Προτεινόµενο Σχήµα (αριθµός χαρακτήρων) Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
164 Τρεις, απομακρυσμένοι, χρήστες υπέβαλαν ταυτόχρονα ερωτήματα στη βάση δεδομένων. Από τα αρχεία καταγραφής του συστήματος μετρήσαμε την υπολογιστική ισχύ που απαιτήθηκε για κάθε ερώτημα καθώς και το συνολικό χρόνο που μεσολάβησε από την υποβολή του ερωτήματος μέχρι την εμφάνιση των σχετικών αποτελεσμάτων στην οθόνη. Δεδομένου ότι ο αριθμός των ερωτημάτων ήταν αρκετά μεγάλος, ώστε να καλυφτεί όλο το φάσμα των πιθανών αναγκών ενός σύγχρονου αιματολογικού εργαστηρίου και οι αντίστοιχες απαντήσεις αφορούσαν διαφορετικό αριθμό εγγραφών κάθε φόρα κοινωνικοποιήσαμε τα αποτελέσματα των μετρήσεων ανά εκατομμύριο επιστρεφόμενων εγγραφών. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 164
165 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής [Int Σχήμα 9] Καταναλισκόμενος χρόνος CPU, διαφορετικών ερωτημάτων από βάσεις δεδομένων με το προτεινόμενο και το συμβατικό σχήμα. 165 Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εδικό Αιματολογικό Εργαστήριο
166 [Int Σχήμα 10] Χρόνοι απόκρισης, διαφορετικών ερωτημάτων από βάσεις δεδομένων με το προτεινόμενο και το συμβατικό σχήμα. Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Εργαστήριο Ιατρικής Φυσικής 166
Λεμφοϋπερπλαστικά νοσήματα με έκφραση στο αίμα. Χρόνια Λεμφογενής Λευχαιμία και άλλες λεμφοκυτταρώσεις
Λεμφοϋπερπλαστικά νοσήματα με έκφραση στο αίμα Χρόνια Λεμφογενής Λευχαιμία και άλλες λεμφοκυτταρώσεις Διαγνωστική προσέγγιση και διαφορική διάγνωση λεμφοκυττάρωσης Ορισμός λεμφοκυττάρωσης: Aπόλυτη λεμφοκυττάρωση:
Λεμφοϋπερπλαστικά νοσήματα με έκφραση στο αίμα. Χρόνια Λεμφογενής Λευχαιμία και άλλες λεμφοκυτταρώσεις
Λεμφοϋπερπλαστικά νοσήματα με έκφραση στο αίμα Χρόνια Λεμφογενής Λευχαιμία και άλλες λεμφοκυτταρώσεις Διαγνωστική προσέγγιση και διαφορική διάγνωση λεμφοκυττάρωσης Ορισμός λεμφοκυττάρωσης: Aπόλυτη λεμφοκυττάρωση:
Λεμφοϋπερπλαστικά νοσήματα με έκφραση στο αίμα. Χρόνια Λεμφογενής Λευχαιμία και άλλες λεμφοκυτταρώσεις
Λεμφοϋπερπλαστικά νοσήματα με έκφραση στο αίμα Χρόνια Λεμφογενής Λευχαιμία και άλλες λεμφοκυτταρώσεις Διαγνωστική προσέγγιση και διαφορική διάγνωση λεμφοκυττάρωσης Ορισμός λεμφοκυττάρωσης: > 4000 /mm 3
Ιδιαίτερες νοσολογικές οντότητες στα λεμφώματα υψηλού βαθμού κακοηθείας
Ιδιαίτερες νοσολογικές οντότητες στα λεμφώματα υψηλού βαθμού κακοηθείας Απαρτιωμένη διδασκαλία στην Αιματολογία 2015 Αργύρης Σ. Συμεωνίδης Οντότητες μη Hodgkin λεμφωμάτων που θα αναφερθούν Πρωτοπαθές Β-λέμφωμα
Σύνοψη της προσέγγισης ασθενούς με πανκυτταροπενία. Ιατρικό Τμήμα Πανεπιστημίου Πατρών Απαρτιωμένη διδασκαλία στην Αιματολογία Αργύρης Συμεωνίδης
Σύνοψη της προσέγγισης ασθενούς με πανκυτταροπενία Ιατρικό Τμήμα Πανεπιστημίου Πατρών Απαρτιωμένη διδασκαλία στην Αιματολογία Αργύρης Συμεωνίδης Αρχική κλινική προσέγγιση Συμπτωματικός ή μη συμπτωματικός
Συστηματικός ερυθηματώδης λύκος: το πρότυπο των αυτόάνοσων ρευματικών νοσημάτων
Συστηματικός ερυθηματώδης λύκος: το πρότυπο των αυτόάνοσων ρευματικών νοσημάτων Φ.Ν. Σκοπούλη Καθηγήτρια τον Χαροκόπειου Πανεπιστημίου Αθηνών συστηματικός ερυθηματώδης λύκος θεωρείται η κορωνίδα των αυτοάνοσων
Οξεία μυελογενής λευχαιμία
Οξεία μυελογενής λευχαιμία Γενικά στοιχεία Ταξινόμηση και τύποι Ενδείξεις και συμπτώματα Αίτια πρόκλησης Διάγνωση Παρουσίαση και επαναστόχευση από Βικιπαίδεια Οξεία μυελογενής λευχαιμία : Ζήσου Ιωάννης
ΕΙΔΙΚΗ ΠΑΘΟΛΟΓΙΚΗ ΑΝΑΤΟΜΙΚΗ
ΕΙΔΙΚΗ ΠΑΘΟΛΟΓΙΚΗ ΑΝΑΤΟΜΙΚΗ Εργαστήριο Γεν. Παθολογίας και Παθολογικής Ανατομικής Α.Π.Θ. 5o ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΕΜΦΟΠΟΙΗΤΙΚΟ ΣΥΣΤΗΜΑ Διδάσκοντες: Αγγελική Χέβα Παθολογοανατόμος, ΠΓΝΘ «Γ. Παπανικολάου» Επιστημονικός
Η κυτταρομετρία ροής στα Β λεμφοϋπερπλαστικά νοσήματα. Ελένη Καψάλη Επίκουρη Καθηγήτρια Αιματολογίας
Η κυτταρομετρία ροής στα Β λεμφοϋπερπλαστικά νοσήματα Ελένη Καψάλη Επίκουρη Καθηγήτρια Αιματολογίας Κατάταξη λεμφικών νεοπλασμάτων Τα νεοπλάσματα των Β, Τ, ΝΚ λεμφοκυττάρων είναι όγκοι από ανώριμα και
Ιδιαίτερες νοσολογικές οντότητες στα λεμφώματα υψηλού βαθμού κακοηθείας
Ιδιαίτερες νοσολογικές οντότητες στα λεμφώματα υψηλού βαθμού κακοηθείας Απαρτιωμένη διδασκαλία στην Αιματολογία 2013 Αργύρης Σ. Συμεωνίδης Οντότητες μη Hodgkin λεμφωμάτων που θα αναφερθούν Πρωτοπαθές Β-λέμφωμα
ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ FLOW CYTOMETRY
ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ FLOW CYTOMETRY ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ Γενικά χαρακτηριστικά Απεικόνιση των κυτταρικών πληθυσμών με βάση: το μέγεθος την κοκκίωση το φθορισμό ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ Υδροδυναμική ροή Πρόσθιος
ΛΕΜΦΑ ΕΝΙΚΟ ΛΕΜΦΩΜΑ ΟΡΙΑΚΗΣ ΖΩΝΗΣ ΙΣΤΟΛΟΓΙΚΗ ΕΙΚΟΝΑ
ΛΕΜΦΑ ΕΝΙΚΟ ΛΕΜΦΩΜΑ ΟΡΙΑΚΗΣ ΖΩΝΗΣ ΙΣΤΟΛΟΓΙΚΗ ΕΙΚΟΝΑ Μικρά ή µεσαίου µεγέθους λεµφοειδή κύτταρα Πυρήνες στρογγυλοί ή ανωµάλου σχήµατος (µονοκυτταροειδείς ή σαν κεντροκύτταρα) ιαυγές κυτταρόπλασµα ΛΕΜΦΑ
ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ FLOW CYTOMETRY
ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ FLOW CYTOMETRY Κυτταρομετρία Ροής Η Κυτταρομετρία Ροής είναι μια τεχνική που εκμεταλλεύεται την μέτρηση ορισμένων βιοχημικών και βιοφυσικών παραμέτρων των κυττάρων μεμονωμένα, όταν αυτά
ΘΕΩΡΙΑ 3 η ΠΑΡΟΥΣΙΑΣΗ. ΚΥΤΤΑΡΟΚΙΝΕΣ ή ΚΥΤΤΟΚΙΝΕΣ Dr ΠΑΠΑΓΙΑΝΝΗΣ ΔΗΜΗΤΡΗΣ ΤΜΗΜΑ ΙΑΤΡΙΚΩΝ ΕΡΓΑΣΤΗΡΙΩΝ ΤΕΙ ΘΕΣΣΑΛΙΑΣ
ΘΕΩΡΙΑ 3 η ΠΑΡΟΥΣΙΑΣΗ ΚΥΤΤΑΡΟΚΙΝΕΣ ή ΚΥΤΤΟΚΙΝΕΣ Dr ΠΑΠΑΓΙΑΝΝΗΣ ΔΗΜΗΤΡΗΣ ΤΜΗΜΑ ΙΑΤΡΙΚΩΝ ΕΡΓΑΣΤΗΡΙΩΝ ΤΕΙ ΘΕΣΣΑΛΙΑΣ Είδαμε ότι οι ΜΗΧΑΝΙΣΜΟΙ ΜΗ ΕΙΔΙΚΗΣ ΑΝΟΣΙΑΣ είναι 1. Ανατομικοί φραγμοί - Δέρμα - Βλεννώδεις
Β ΟΞΕΙΑ ΛΕΜΦΟΒΛΑΣΤΙΚΗ ΛΕΥΧΑΙΜΙΑ (B ΟΛΛ) ΕΛΑΧΙΣΤΗ ΥΠΟΛΕΙΜΜΑΤΙΚΗ ΝΟΣΟΣ (MRD)
ΕΛΛΗΝΙΚΗ ΕΤΑΙΡΕΙΑ ΚΥΤΤΑΡΟΜΕΤΡΙΑΣ ΕΚΠΑΙΔΕΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ - Γ ΜΕΡΟΣ «Η ΚΥΤΤΑΡΟΜΕΤΡΙΑ ΡΟΗΣ ΣΤΗΝ ΑΙΜΑΤΟΛΟΓΙΑ» Β ΟΞΕΙΑ ΛΕΜΦΟΒΛΑΣΤΙΚΗ ΛΕΥΧΑΙΜΙΑ (B ΟΛΛ) ΕΛΑΧΙΣΤΗ ΥΠΟΛΕΙΜΜΑΤΙΚΗ ΝΟΣΟΣ (MRD) ΓΡΗΓΟΡΙΟΥ ΕΙΡΗΝΗ ΑΙΜΑΤΟΛΟΓΟΣ
ΑΡΙΆΔΝΗ ΟΜΆΔΑ ΥΠΟΣΤΉΡΙΞΗΣ ΑΣΘΕΝΏΝ ΜΕ ΧΛΛ. Εισαγωγή στην αιματολογία
ΑΡΙΆΔΝΗ ΟΜΆΔΑ ΥΠΟΣΤΉΡΙΞΗΣ ΑΣΘΕΝΏΝ ΜΕ ΧΛΛ Εισαγωγή στην αιματολογία Αιματολογία Κλινική και εργαστηριακή Διαγνωστική και θεραπευτική Αυτόνομη και συνεργατική Αίμα-Λειτουργίες Μεταφορά οξυγόνου Απομάκρυνση
ΥΠΟΠΛΗΘΥΣΜΟΙ Τ ΛΕΜΦΟΚΥΤΤΑΡΩΝ. Αλεξάνδρα Φλέβα Ph.D Βιολόγος Τμήμα Ανοσολογίας-Ιστοσυμβατότητας Γ.Ν. «Παπαγεωργίου»
ΥΠΟΠΛΗΘΥΣΜΟΙ Τ ΛΕΜΦΟΚΥΤΤΑΡΩΝ Αλεξάνδρα Φλέβα Ph.D Βιολόγος Τμήμα Ανοσολογίας-Ιστοσυμβατότητας Γ.Ν. «Παπαγεωργίου» Η αξιοποίηση του εύρους των δυνατοτήτων της κυτταρομετρίας ροής στην Ανοσολογία προσφέρει
ΠΑΡΟΞΥΣΜΙΚΗ ΝΥΚΤΕΡΙΝΗ ΑΙΜΟΣΦΑΙΡΙΝΟΥΡΙΑ (PNH) Αχιλλέας Θ. Καραμούτσιος Μονάδα Μοριακής Βιολογίας, Αιματολογικό Εργαστήριο ΠΓΝ Ιωαννίνων
ΠΑΡΟΞΥΣΜΙΚΗ ΝΥΚΤΕΡΙΝΗ ΑΙΜΟΣΦΑΙΡΙΝΟΥΡΙΑ (PNH) Αχιλλέας Θ. Καραμούτσιος Μονάδα Μοριακής Βιολογίας, Αιματολογικό Εργαστήριο ΠΓΝ Ιωαννίνων Ιωάννινα, Σεπτέμβριος 2013 PNH Σπάνια διαταραχή του αρχέγονου αιμοποιητικού
Επίκτητη Ανοσιακή Απάντηση (χυμικό σκέλος) Β λεμφοκύτταρα
Επίκτητη Ανοσιακή Απάντηση (χυμικό σκέλος) Β λεμφοκύτταρα φυσική ή μη ειδική ανοσία δεν απαιτεί προηγούμενη έκθεση στο παθογόνο και δεν διαθέτει μνήμη. σε επίκτητη ή ειδική ανοσία χυμική ανοσία με παραγωγή
ΚΕΦΑΛΑΙΟ 5 ΑΝΟΣΟΑΙΜΑΤΟΛΟΓΙΑ ΑΜΕΣΗ COOMBS
ΚΕΦΑΛΑΙΟ 5 ΑΝΟΣΟΑΙΜΑΤΟΛΟΓΙΑ ΑΜΕΣΗ COOMBS ΑΜΕΣΗ COOMBS Θεμελιώδες γνώρισμα του κάθε οργανισμού είναι ότι αναγνωρίζει τα κύτταρα των άλλων οργανισμών ως ξένα Αντιδρά με σκοπό την καταστροφή ΑΝΟΣΟΑΙΜΑΤΟΛΟΓΙΑ
οµή Ανοσιακού Συστήµατος Ελένη Φωτιάδου-Παππά Τµήµα Ανοσολογίας Γ.Ν. Νίκαιας-Πειραιά
οµή Ανοσιακού Συστήµατος Ελένη Φωτιάδου-Παππά Τµήµα Ανοσολογίας Γ.Ν. Νίκαιας-Πειραιά Ανοσολογικό σύστηµα Βασικό σύστηµα του οργανισµού Λειτουργικές µονάδες του ανοσολογικού συστήµατος Οργανωµένος λεµφικός
Περιγραφή Χρηματοδοτούμενων Ερευνητικών Έργων 1η Προκήρυξη Ερευνητικών Έργων ΕΛ.ΙΔ.Ε.Κ. για την ενίσχυση Μεταδιδακτόρων Ερευνητών/Τριών
Περιγραφή Χρηματοδοτούμενων Ερευνητικών Έργων 1η Προκήρυξη Ερευνητικών Έργων ΕΛ.ΙΔ.Ε.Κ. για την ενίσχυση Μεταδιδακτόρων Ερευνητών/Τριών Τίτλος Ερευνητικού Έργου «CLLon Ανοσογενετική και λειτουργική ανάλυση
DEPARTMENT OF IMMUNOLOGY & HISTOCOMPATIBILITY UNIVERSITY OF THESSALY
Μαμάρα Α. (1), Καλαλά Φ. (1), Λιαδάκη Κ. (1), Παπαδούλης Ν. (2), Μανδαλά Ε. (3), Παπαδάκης Ε. (4), Γιαννακούλας N. (5), Παλασοπούλου M. (5), Λαφιωνιάτης Σ. (6), Κιουμή A. (4), Κοραντζής I. (4), Καρτάσης
ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΒΙΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΒΙΟΧΗΜΕΙΑΣ ΚΑΙ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ
ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΒΙΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΒΙΟΧΗΜΕΙΑΣ ΚΑΙ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ ΚΛΙΝΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΜΕΛΕΤΗ ΙΣΟΜΟΡΦΩΝ ΤΗΣ L-DOPA ΑΠΟΚΑΡΒΟΞΥΛΑΣΗΣ ΚΑΙ ΤΟΥ
ΑΝΟΣΟΒΙΟΛΟΓΙΑ. Εξεταστική Ιανουαρίου 2010
Εξεταστική Ιανουαρίου 2010 Ποιες είναι οι διαφορές μιας πρωτογενούς από μια δευτερογενή χυμική ανοσολογική απόκριση; Περιγράψετε τους μηχανισμούς ενεργοποίησης στις δυο περιπτώσεις. ΘΕΜΑ 2 (1 μονάδα) Περιγράψετε
ITP Ιδιοπαθής/ αυτοάνοση θρομβοπενική πορφύρα
ITP Ιδιοπαθής/ αυτοάνοση θρομβοπενική πορφύρα Αθανασία Μουζάκη, Καθηγήτρια Εργαστηριακής Αιματολογίας-Αιμοδοσίας, Αιματολογικό Τμήμα, Παθολογική Κλινική, Τμήμα Ιατρικής, Παν/ο Πατρών Τα είδη της ITP είναι:
ΛΕΜΦΩΜΑ ΗΟDGKIN. Αλεξάνδρα Κουράκλη-Συμεωνίδου Απαρτιωμένη διδασκαλία 2015
ΛΕΜΦΩΜΑ ΗΟDGKIN Αλεξάνδρα Κουράκλη-Συμεωνίδου Απαρτιωμένη διδασκαλία 2015 ΛΕΜΦΩΜΑ ΗΟDGKIN Επιδημιολογία - Αιτιοπαθογένεια Δικόρυφη καμπύλη εμφάνισης κορυφές: 15-40 έτη, >60 έτη : = Μικρή υπεροχή (1.5-2.0/1)
ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΣΤΗΝ ΙΑΤΡΙΚΗ
ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΣΤΗΝ ΙΑΤΡΙΚΗ Καθώς η επιστημονική γνώση και κατανόηση αναπτύσσονται, ο μελλοντικός σχεδιασμός βιοτεχνολογικών προϊόντων περιορίζεται μόνο από τη φαντασία μας Βιοτεχνολογία
Γυμνάσιο Κερατέας ΚΑΡΚΙΝΟΣ & ΜΕΤΑΛΛΑΞΕΙΣ. Αναστασία Σουλαχάκη Κωνσταντίνα Πρίφτη
Γυμνάσιο Κερατέας ΚΑΡΚΙΝΟΣ & ΜΕΤΑΛΛΑΞΕΙΣ Αναστασία Σουλαχάκη Κωνσταντίνα Πρίφτη 2013 ΠΕΡΙΕΧΟΜΕΝΑ : Ορολογία και λίγα λόγια για τον καρκίνο Χαρακτηριστικά του καρκίνου Μεταλλάξεις Μεταλλάξεις και καρκίνος
ΜΙΚΡΟΒΙΟΛΟΓΙΚΟ ΤΜΗΜΑ Π.Γ.Ν.Θ.ΑΧΕΠΑ ΙΑΤΡΟΣ ΒΙΟΠΑΘΟΛΟΓΟΣ ΑΡΤΕΜΙΣ ΚΟΛΥΝΟΥ
ΜΙΚΡΟΒΙΟΛΟΓΙΚΟ ΤΜΗΜΑ Π.Γ.Ν.Θ.ΑΧΕΠΑ ΙΑΤΡΟΣ ΒΙΟΠΑΘΟΛΟΓΟΣ ΑΡΤΕΜΙΣ ΚΟΛΥΝΟΥ Τα λεμφοκύτταρα προέρχονται από την λεμφική σειρά, ενώ τα μονοπύρηνα, τα πολυμορφοπύρηνα λευκοκύτταρα (κοκκιοκύτταρα) και τα βασεόφιλα
ΦΡΟΝΤΙΣΤΗΡΙΑ ΠΡΟΟΠΤΙΚΗ
Απαντήσεις του κριτηρίου αξιολόγησης στη βιολογία γενικής παιδείας 1 ο ΚΕΦΑΛΑΙΟ ΘΕΜΑ 1 ο Να γράψετε τον αριθμό καθεμίας από τις ημιτελείς προτάσεις 1 έως και 5, και δίπλα σε αυτόν το γράμμα που αντιστοιχεί
-Αναστολή της οργανικής σύνδεσης του ιωδίου που προσλαμβάνεται από το θυρεοειδή αδένα -Ανοσοκατασταλτική δράση με αποτέλεσμα τη μείωση της παραγωγής
Άννα Ναξάκη Επιμελήτρια Α Γ Παθολογική Κλινική ΠΑΡΑΓΩΓΑ ΘΕΙΟΥΡΙΑΣ(ΠΡΟΠΥΛΟ ΚΑΙ ΜΕΘΥΛΟΘΕΙΟΥΡΑΚΙΛΗ) ΠΑΡΑΓΩΓΑ ΙΜΙΔΑΖΟΛΗΣ(ΚΑΡΒΙΜΑΖΟΛΗ ΚΑΙ ΘΕΙΑΜΑΖΟΛΗ) -Αναστολή της οργανικής σύνδεσης του ιωδίου που προσλαμβάνεται
ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΕΛΕΥΘΕΡΩΝ ΕΛΑΦΡΩΝ ΑΛΥΣΕΩΝ ΣΤΟΝ ΟΡΟ ΚΑΙ ΣΤΑ ΟΥΡΑ. Χρυσούλα Νικολάου
ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΕΛΕΥΘΕΡΩΝ ΕΛΑΦΡΩΝ ΑΛΥΣΕΩΝ ΣΤΟΝ ΟΡΟ ΚΑΙ ΣΤΑ ΟΥΡΑ Χρυσούλα Νικολάου Μονοκλωνικές ελεύθερες ελαφρές αλύσεις Οι μονοκλωνικές ελεύθερες ελαφρές αλύσεις οι οποίες είναι γνωστές ως πρωτεΐνη Bence
Αρχές μοριακής παθολογίας. Α. Αρμακόλας Αν. Καθηγητής Ιατρική Σχολή ΕΚΠΑ
Αρχές μοριακής παθολογίας Α. Αρμακόλας Αν. Καθηγητής Ιατρική Σχολή ΕΚΠΑ Μοριακή Παθολογία Ανερχόμενος κλάδος της Παθολογίας Επικεντρώνεται στην μελέτη και τη διάγνωση νοσημάτων Στον καθορισμό και την πιστοποίηση
Εισαγωγή. Οι β-θαλασσαιμίες αποτελούν μία ετερογενή ομάδα κληρονομικών νοσημάτων που χαρακτηρίζονται από μειωμένη σύνθεση των β-αλυσίδων της αιμοσφαιρ
03 εδbοτχ 155 Εισαγωγή. Οι β-θαλασσαιμίες αποτελούν μία ετερογενή ομάδα κληρονομικών νοσημάτων που χαρακτηρίζονται από μειωμένη σύνθεση των β-αλυσίδων της αιμοσφαιρίνης. Στην ομόζυγη κατάσταση προκαλούν
ΣΥΝΗΘΕΙΣ ΠΑΘΗΣΕΙΣ ΘΥΡΕΟΕΙΔΟΥΣ
Οι όζοι του θυρεοειδούς είναι συχνοί και αποτελούν το συχνότερο ενδοκρινολογικό πρόβλημα σε πολλές χώρες. Οι πιθανότητες ότι κάποιος θα ανακαλύψει έναν τουλάχιστον όζο θυρεοειδούς είναι 1 στις 10 ενώ σε
Γενική αίµατος. Καταµέτρηση των έµµορφων στοιχείων του αίµατος
Γενική αίµατος Αθανασία Μουζάκη, Καθηγήτρια Εργαστηριακής Αιµατολογίας-Αιµοδοσίας, Εργαστήριο Αιµατολογίας, Αιµατολογικό Τµήµα, Παθολογική Κλινική, Τµήµα Ιατρικής, Παν/ο Πατρών Γενική αίµατος Καταµέτρηση
ΕΥΡΗΜΑΤΑ ΑΠΟ ΤΗ ΔΟΚΙΜΑΣΙΑ ΤΙΤΛΟΠΟΙΗΣΗΣ ΨΥΧΡΟΣΥΓΚΟΛΛΗΤIΝΩΝ ΣΤΟΝ ΟΡΟ ΑΣΘΕΝΩΝ ΚΑΤΑ ΤΗΝ ΠΕΝΤΑΕΤΙΑ
ΕΥΡΗΜΑΤΑ ΑΠΟ ΤΗ ΔΟΚΙΜΑΣΙΑ ΤΙΤΛΟΠΟΙΗΣΗΣ ΨΥΧΡΟΣΥΓΚΟΛΛΗΤIΝΩΝ ΣΤΟΝ ΟΡΟ ΑΣΘΕΝΩΝ ΚΑΤΑ ΤΗΝ ΠΕΝΤΑΕΤΙΑ 2013-2017 Σπαθαράκη Παρασκευή επιμ. Α Αιματολογικό Εργαστήριο ΠΑΓΝΗ Απρίλιος 2018 1 Εισαγωγή Η νόσος των ψυχροσυγκολλητινών
ΚΛΙΝΙΚΑ ΚΑΙ ΕΡΓΑΣΤΗΡΙΑΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΑΣΘΕΝΩΝ ΜΕ ΘΕΤΙΚΟ ΑΝΤΙΠΗΚΤΙΚΟ ΤΟΥ ΛΥΚΟΥ (LA)
ΚΛΙΝΙΚΑ ΚΑΙ ΕΡΓΑΣΤΗΡΙΑΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΑΣΘΕΝΩΝ ΜΕ ΘΕΤΙΚΟ ΑΝΤΙΠΗΚΤΙΚΟ ΤΟΥ ΛΥΚΟΥ (LA) Νιώτη Ελένη, Ανδρουλάκης Νικόλαος, Σπαθαράκη Παρασκευή, Παπαδάκης Ιωάννης, Παπαδοπούλου Αναστασία, Νότας Γεώργιος Εργαστήριο
όλοι αναπνευστική οδός στομάχι στόμα
κεράτινη στιβάδα περιέχει σμήγμα λιπαρά οξέα Μηχανισμοί που παρεμποδίζουν την είσοδο Δέρμα περιέχει ιδρώτας φυσιολογική μικροχλωρίδα λυσοζύμη γαλακτικό οξύ μικροοργανισμών Βλεννογόνοι όλοι αναπνευστική
7. Χυµικές ανοσοαπαντήσεις. Ενεργοποίηση των Β λεµφοκυττάρων και παραγωγή αντισωµάτων
7. Χυµικές ανοσοαπαντήσεις. Ενεργοποίηση των Β λεµφοκυττάρων και παραγωγή αντισωµάτων Οι φάσεις και οι τύποι των χυµικών ανοσοαπαντήσεων Η διέγερση των Β λεµφοκυττάρων από το αντιγόνο Ο ρόλος των βοηθητικών
13. Ηωσινόφιλο κύτταρο στα επιχρίσματα περιφερικού αίματος και μυελού των οστών
13. Ηωσινόφιλο κύτταρο στα επιχρίσματα περιφερικού αίματος και μυελού των οστών Γ.Χρ. Μελέτης 1, Α. Σαραντόπουλος 1, Σ. Μασουρίδη 1, Ε. Βαριάμη 1, Ε. Τέρπος 2 Τα ηωσινόφιλα παράγονται όπως όλα τα κύτταρα
αμινοξύ. Η αλλαγή αυτή έχει ελάχιστη επίδραση στη στερεοδιάταξη και τη λειτουργικότητα της πρωτεϊνης. Επιβλαβής
Κεφάλαιο 6: ΜΕΤΑΛΛΑΞΕΙΣ -ΘΕΩΡΙΑ- Μεταλλάξεις είναι οι αλλαγές που συμβαίνουν στο γενετικό υλικό ενός οργανισμού, τόσο σε γονιδιακό επίπεδο (γονιδιακές μεταλλάξεις) όσο και σε χρωμοσωμικό επίπεδο (χρωμοσωμικές
ΙΕΡΕΥΝΗΣΗ ΤΟΥ ΑΞΟΝΑ ΤΕΛΟΜΕΡΑΣΗΣ/ΤΕΛΟΜΕΡΩΝ ΣΕ ΜΕΣΕΓΧΥΜΑΤΙΚΑ ΚΥΤΤΑΡΑ ΜΥΕΛΟΥ ΤΩΝ ΟΣΤΩΝ ΑΣΘΕΝΩΝ ΜΕ ΡΕΥΜΑΤΟΕΙ Η ΠΝΕΥΜΟΝΑ
ΙΕΡΕΥΝΗΣΗ ΤΟΥ ΑΞΟΝΑ ΤΕΛΟΜΕΡΑΣΗΣ/ΤΕΛΟΜΕΡΩΝ ΣΕ ΜΕΣΕΓΧΥΜΑΤΙΚΑ ΚΥΤΤΑΡΑ ΜΥΕΛΟΥ ΤΩΝ ΟΣΤΩΝ ΑΣΘΕΝΩΝ ΜΕ ΡΕΥΜΑΤΟΕΙ Η ΠΝΕΥΜΟΝΑ ΓΙΩΡΓΟΣ Α. ΜΑΡΓΑΡΙΤΟΠΟΥΛΟΣ 1,2, ΑΘΑΝΑΣΙΑ ΠΡΟΚΛΟΥ 1,2, ΚΩΣΤΑΣ ΚΑΡΑΓΙΑΝΝΗΣ 2, ΙΣΜΗΝΙ ΛΑΣΗΘΙΩΤΑΚΗ
Ερωτήµατα προς απάντηση
Κεφ. 9. Ανοσιακή ανοχή και αυτοανοσία: Η διάκριση εαυτού-ξένου και οι διαταραχές της Ερωτήµατα προς απάντηση Πως διατηρεί το ανοσοποιητικό σύστηµα τηµη απαντητικότητα σε εαυτά αντιγόνα (=ανοχή); Ποιοι
ΑΝΟΣΟΛΟΓΙΑ. 1. Εισαγωγή (κυρίως στην επίκτητη ανοσία) 2. Φυσική ανοσία ΕΠΙΚΤΗΤΗ ΑΝΟΣΙΑ
ΑΝΟΣΟΛΟΓΙΑ 1. Εισαγωγή (κυρίως στην επίκτητη ανοσία) 2. Φυσική ανοσία ΕΠΙΚΤΗΤΗ ΑΝΟΣΙΑ ΑΝΤΙΓΟΝΟ 3. Η πρόσληψη του αντιγόνου και η παρουσίασή του στα λεμφοκύτταρα 4. Η αναγνώριση του αντιγόνου. Αντιγονικοί
Φλεγμονωδης πολυσυστηματικη αυτόάνοση νοσος που αφορα συχνοτερα νεες γυναικες αναπαραγωγικης ηλικιας.
Φλεγμονωδης πολυσυστηματικη αυτόάνοση νοσος που αφορα συχνοτερα νεες γυναικες αναπαραγωγικης ηλικιας. Ηλίας Κουρής - Ρευματολόγος Η κλινική εικόνα της πάθησης περιλαμβάνει την παρουσια γενικων συμπτωματων
Εισαγωγή στην Ανοσολογία Επίκτητη Ανοσία I. Σωτήρης Ζαρογιάννης Επίκ. Καθηγητής Φυσιολογίας Εργαστήριο Φυσιολογίας Τμήμα Ιατρικής Π.Θ.
Εισαγωγή στην Ανοσολογία Επίκτητη Ανοσία I Σωτήρης Ζαρογιάννης Επίκ. Καθηγητής Φυσιολογίας Εργαστήριο Φυσιολογίας Τμήμα Ιατρικής Π.Θ. 14/10/2016 Φυσιολογία Συστημάτων Ακαδημαϊκό Ετος 2016-2017 Γενικά στοιχεία
Βασικές αρχές κυτταροµετρίας ροής
Βασικές αρχές κυτταροµετρίας ροής Κυτταροµετρία ροής Πρόκειται για πολυπαραμετρική μέθοδο ανίχνευσης 2-20 διαφορετικών παραμέτρων σε εναιώρημα κυττάρων Η κυτταροµετρία ροής (flow cytometry ) είναι µέθοδος
Προβλήματα σχετιζόμενα με την τυποποίηση αντιγόνων Ι
Β Προβλήματα Φαινότυπος Β(Α): ασθενής αντίδραση με αντι-α, έντονη αντίδραση με αντι-β, και ο ορός αντιδρά με ερυθρά Α₁. Ο αντιορός Α περιέχει τον κλώνο ΜΗΟ4? Επίκτητος Β φαινότυπος: έντονη αντίδραση με
ΑΝΟΣΟΠΟΙΗΤΙΚΟ ΣΥΣΤΗΜΑ ΜΟΝΟΚΛΩΝΙΚΑ ΑΝΤΙΣΩΜΑΤΑ ΕΜΒΟΛΙΑ. Εργαστήριο Γενετικής, ΓΠΑ
ΑΝΟΣΟΠΟΙΗΤΙΚΟ ΣΥΣΤΗΜΑ ΜΟΝΟΚΛΩΝΙΚΑ ΑΝΤΙΣΩΜΑΤΑ ΕΜΒΟΛΙΑ Στάδια μικροβιακής λοίμωξης δημιουργία αποικίας σε εξωτερική επιφάνεια διείσδυση στον οργανισμό τοπική μόλυνση συστηματική (γενικευμένη) μόλυνση H σημασία
Μήπως έχω Σκληρόδερµα;
Μήπως έχω Σκληρόδερµα; Για να πληροφορηθώ µýëïò ôçò Σπάνιος ναι... Μόνος όχι Η Πανελλήνια Ένωση Σπανίων Παθήσεων (Π.Ε.Σ.ΠΑ) είναι ο μόνος φορέας, μη κερδοσκοπικό σωματείο, συλλόγων ασθενών σπανίων παθήσεων
ΜΕΛΕΤΗ ΚΑΙ ΚΛΙΝΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΝΕΟΥ ΑΠΟΠΤΩΤΙΚΟΥ ΓΟΝΙΔΙΟΥ BCL2L12 ΚΑΙ ΤΗΣ L-DOPA ΑΠΟΚΑΡΒΟΞΥΛΑΣΗΣ ΣΤΟΝ ΚΑΡΚΙΝΟ ΤΟΥ ΠΑΧΕΟΣ ΕΝΤΕΡΟΥ
ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΒΙΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΒΙΟΧΗΜΕΙΑΣ ΚΑΙ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ ΜΕΛΕΤΗ ΚΑΙ ΚΛΙΝΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΝΕΟΥ ΑΠΟΠΤΩΤΙΚΟΥ ΓΟΝΙΔΙΟΥ BCL2L12 ΚΑΙ ΤΗΣ
Aιμοφαγοκυτταρικό Σύνδρομο ή Αιμοφαγοκυτταρική Λεμφοϊστιοκυττάρωση HLH
Aιμοφαγοκυτταρικό Σύνδρομο ή Αιμοφαγοκυτταρική Λεμφοϊστιοκυττάρωση HLH Aιμοφαγοκυτταρικό Σύνδρομο ή Αιμοφαγοκυτταρική Λεμφοϊστιοκυττάρωση HLH Υπερφλεγμονώδες σύνδρομο Aιμοφαγοκυτταρικό Σύνδρομο ή Αιμοφαγοκυτταρική
Ενότητα 2011: Λεμφώματα
Κλινικοεργαστηριακή Εκπαίδευση στην Αιματολογία Ενότητα 2011: Λεμφώματα 23-24 Σεπτεμβρίου 2011 Ηράκλειο, Κρήτη Διοργάνωση Ίδρυμα Ελληνικής Αιματολογικής Εταιρείας και Αιματολογική Κλινική Ιατρικής Σχολής
Prolaris : Ο Νέος Εξατομικευμένος Υπολογισμός της Επιθετικότητας του Καρκίνου του Προστάτη
Prolaris : Ο Νέος Εξατομικευμένος Υπολογισμός της Επιθετικότητας του Καρκίνου του Προστάτη Τηλεφωνικό Κέντρο 210 69 66 000 Prolaris : Ο Νέος Εξατομικευμένος Υπολογισμός της Επιθετικότητας του Καρκίνου
ΚΑΤΑΛΟΓΟΣ ΑΣΘΕΝΕΙΩΝ ΠΟΥ ΑΝΑΦΕΡΟΝΤΑΙ ΣΤΟ ΣΧΟΛΙΚΟ ΕΓΧΕΙΡΙΔΙΟ
ΑΣΘΕΝΕΙΕΣ ΚΑΤΑΛΟΓΟΣ ΑΣΘΕΝΕΙΩΝ ΠΟΥ ΑΝΑΦΕΡΟΝΤΑΙ ΣΤΟ ΣΧΟΛΙΚΟ ΕΓΧΕΙΡΙΔΙΟ ΤΡΟΠΟΣ ΚΛΗΡΟΝΟΜΙΚΟΤΗΤΑΣ ΣΥΝΕΠΕΙΕΣ ΕΙΔΟΣ ΜΕΤΑΛΛΑΞΗΣ Οικογενή υπερχοληστερολαιμία Αυτοσωμική επικρατής κληρονομικότητα Σχετίζεται με αυξημένο
ΥΠΟΛΕΙΜΜΑΤΙΚΗ ΝΟΣΟΣ ΣΤΗ Β-ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ
ΥΠΟΛΕΙΜΜΑΤΙΚΗ ΝΟΣΟΣ ΣΤΗ Β-ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ ΛΕΥΚΟΘΕΑ Σ. ΝΤΟΒΑ Βιοχημικός, Msc, PhD Επιστημονικός συνεργάτης Μονάδας Μοριακής Βιολογίας- Αιματολογικό Εργαστηρίο, Πανεπιστημιακό Γενικό Νοσοκομείο
ΕΝΗΜΕΡΩΤΙΚΟ ΓΟΝΕΩΝ ΟΜΦΑΛΟΠΛΑΚΟΥΝΤΙΑΚΑ ΜΟΣΧΕΥΜΑΤΑ ΒΛΑΣΤΟΚΥΤΤΑΡΑ
ΕΝΗΜΕΡΩΤΙΚΟ ΓΟΝΕΩΝ ΟΜΦΑΛΟΠΛΑΚΟΥΝΤΙΑΚΑ ΜΟΣΧΕΥΜΑΤΑ ΒΛΑΣΤΟΚΥΤΤΑΡΑ Η μεταμόσχευση αίματος από ομφάλιο λώρο και πλακούντα σε ασθενείς με Λευχαιμία και άλλες παθήσεις είναι μια νέα μέθοδος θεραπείας που άρχισε
Αρχική εμπειρία από την χορήγηση anakinra σε δέκα ενήλικες ασθενείς με ανθεκτική ιδιοπαθή υποτροπιάζουσα περικαρδίτιδα
Αρχική εμπειρία από την χορήγηση anakinra σε δέκα ενήλικες ασθενείς με ανθεκτική ιδιοπαθή υποτροπιάζουσα περικαρδίτιδα Γ. Λάζαρος, Π. Βασιλείου, Κ. Αντωνάτου, Χ. Κουτσιανάς, Γ. Γεωργιόπουλος, Δ. Βασιλόπουλος,
Αρχές μοριακής παθολογίας. Α. Αρμακόλας Αν. Καθηγητής Ιατρική Σχολή ΕΚΠΑ
Αρχές μοριακής παθολογίας Α. Αρμακόλας Αν. Καθηγητής Ιατρική Σχολή ΕΚΠΑ Μοριακή Παθολογία Ανερχόμενος κλάδος της Παθολογίας Επικεντρώνεται στην μελέτη και τη διάγνωση νοσημάτων Στον καθορισμό και την πιστοποίηση
ΛΕΜΦΩΜΑ HODGKIN. Τριανταφυλλιά Κολέτσα Λέκτορας Εργαστήριο Γενικής Παθολογίας και Παθολογικής Ανατομικής, ΑΠΘ
ΛΕΜΦΩΜΑ HODGKIN Τριανταφυλλιά Κολέτσα Λέκτορας Εργαστήριο Γενικής Παθολογίας και Παθολογικής Ανατομικής, ΑΠΘ Ταξινόμηση λεμφωμάτων- Βασικές αρχές Στην ταξινόμηση WHO: Λαμβάνονται υπόψη μορφολογικά, ανοσοϊστοχημικά,
ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 11 ΙΟΥΝΙΟΥ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ
1 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 11 ΙΟΥΝΙΟΥ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Α1. β Α2. γ Α3. α Α4. γ Α5. δ ΘΕΜΑ Β Β1.
«β-μεσογειακή αναιμία: το πιο συχνό μονογονιδιακό νόσημα στη χώρα μας»
Εργαστήριο Κυτταρογενετικής ΕΚΕΦΕ «Δημόκριτος» «β-μεσογειακή αναιμία: το πιο συχνό μονογονιδιακό νόσημα στη χώρα μας» Ζαχάκη Σοφία - Ουρανία Βιολόγος, MSc, PhD β μεσογειακή αναιμία Η θαλασσαιμία ή νόσος
Παναγιώτα Κουτσογιάννη Αιµατολόγος ΝΥ Αιµοδοσίας Γ.Ν.Α. «Ο Ευαγγελισµός»
ΑΙΜΟΘΕΡΑΠΕΙΑ ΣΕ ΜΑΚ ΜΕ ΜΙΚΤΗ ΑΣΥΜΒΑΤΟΤΗΤΑ ΑΒΟ Παναγιώτα Κουτσογιάννη Αιµατολόγος ΝΥ Αιµοδοσίας Γ.Ν.Α. «Ο Ευαγγελισµός» ΜΕΤΑΜΟΣΧΕΥΣΗ ΑΙΜΟΠΟΙΗΤΙΚΩΝ ΚΥΤΤΑΡΩΝ (ΜΑΚ) Αποδεκτή θεραπεία για ασθενείς µε: συγγενείς
Ανι χνευση μεταλλα ξεων στον καρκι νο και εξατομικευμε νη θεραπει α
Ανι χνευση μεταλλα ξεων στον καρκι νο και εξατομικευμε νη θεραπει α Περικλής Μακρυθανα σης, MD, PhD, FMH, PD Κλινικός γενετιστής Κύριος Ερευνητής Ίδρυμα Ιατροβιολογικών Ερευνών της Ακαδημι ας Αθηνών 4o
Κεφάλαιο 6: Μεταλλάξεις
Κεφάλαιο 6: Μεταλλάξεις ΕΛΕΓΧΟΣ ΓΝΩΣΕΩΝ 1. Τι ονομάζονται μεταλλάξεις και ποια τα κυριότερα είδη τους; 2. Ποιες οι διαφορές μεταξύ γονιδιακών και χρωμοσωμικών μεταλλάξεων; 3. Οι μεταλλάξεις στα σωματικά
Η Κυτταρογενετική στις αιματολογικές κακοήθειες
Εργαστήριο Υγειοφυσικής & Περιβαλλοντικής Υγείας, ΙΠΤ-Α, Ε.Κ.Ε.Φ.Ε. «Δημόκριτος» Η Κυτταρογενετική στις αιματολογικές κακοήθειες Μανωλά Καλλιόπη, Ph.D Ερευνήτρια Γ Κυτταρογενετική Κλάδος της Γενετικής
ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ
ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ 1 ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ ΕΝΗΜΕΡΩΤΙΚΟ ΦΥΛΛΑΔΙΟ ΓΙΑ ΤΟΥΣ ΑΣΘΕΝΕΙΣ Έκδοση του IΔPYMAΤΟΣ EΛΛHNIKHΣ AIMATOΛOΓIKHΣ ETAIPEIAΣ Οκτώβριος 2016 ΧΡΟΝΙΑ ΛΕΜΦΟΚΥΤΤΑΡΙΚΗ ΛΕΥΧΑΙΜΙΑ
ΜΗΧΑΝΙΣΜΟΙ ΑΜΥΝΑΣ ΤΟΥ ΑΝΘΡΩΠΙΝΟΥ ΟΡΓΑΝΙΣΜΟΥ
ΜΗΧΑΝΙΣΜΟΙ ΑΜΥΝΑΣ ΤΟΥ ΑΝΘΡΩΠΙΝΟΥ ΟΡΓΑΝΙΣΜΟΥ Η πρώτη γραπτή αναφορά στο φαινόμενο της ανοσίας μπορεί να αναζητηθεί στον Θουκυδίδη, τον μεγάλο ιστορικό του Πελοποννησιακού Πολέμου Ανάπτυξη και επιβίωση o
ΑΝΙΧΝΕΥΣΗ ΟΛΙΓΟΚΛΩΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Β-ΚΥΤΤΑΡΩΝ ΣΤΟΝ ΝΕΦΡΙΚΟ ΙΣΤΟ ΑΣΘΕΝΩΝ ΜΕ ΣΠΕΙΡΑΜΑΤΙΚΕΣ ΠΑΘΗΣΕΙΣ ΑΝΟΣΟΛΟΓΙΚΗΣ ΑΙΤΙΟΛΟΓΙΑΣ
ΑΝΙΧΝΕΥΣΗ ΟΛΙΓΟΚΛΩΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Β-ΚΥΤΤΑΡΩΝ ΣΤΟΝ ΝΕΦΡΙΚΟ ΙΣΤΟ ΑΣΘΕΝΩΝ ΜΕ ΣΠΕΙΡΑΜΑΤΙΚΕΣ ΠΑΘΗΣΕΙΣ ΑΝΟΣΟΛΟΓΙΚΗΣ ΑΙΤΙΟΛΟΓΙΑΣ Νεφρολογική Κλινική & Μονάδα Μεταμόσχευσης Νεφρού, Ιατρική Σχολή, ΕΚΠΑ,ΓΝΑ Λαϊκό
ΡΑΔΙΟΒΙΟΛΟΓΙΑ. Εξάμηνο Υ/Ε Ώρες Θεωρίας Ώρες Ασκήσης Διδακτικές μονάδες ECTS Ζ Ε Διδάσκων
ΡΑΔΙΟΒΙΟΛΟΓΙΑ Εξάμηνο Υ/Ε Ώρες Θεωρίας Ώρες Ασκήσης Διδακτικές μονάδες ECTS Ζ Ε 2 0 2 2 Διδάσκων Α. Ζησιμόπουλος, Επίκουρος Καθηγητής Πυρηνικής Ιατρικής, Τμήμα Ιατρικής ΔΠΘ. Aντικειμενικοί στόχοι του μαθήματος
Το γόνατο ως στόχος ρευματικών νοσημάτων
Το γόνατο ως στόχος ρευματικών νοσημάτων Χ. Μ. ΜουτσόπουΛος Αντεπιστέλλον μέλος της Ακαδημίας Αθηνών, Καθηγητής Ιατρικής Σχολής Πανεπιστημίου Αθηνών α ρευματικά νοσήματα είναι ασθένειες που προσβάλλουν
ΛΕΜΦΩΜΑΤΑ. Σταυρούλα Β. Αλεξιά. Διευθύντρια Αιματολογικού Τμήματος Ε.Α.Ν.Π. «ΜΕΤΑΞΑ»
ΛΕΜΦΩΜΑΤΑ Σταυρούλα Β. Αλεξιά Διευθύντρια Αιματολογικού Τμήματος Ε.Α.Ν.Π. «ΜΕΤΑΞΑ» ΛΕΜΦΩΜΑΤΑ Τα λεμφώματα είναι νεοπλάσματα του λεμφικού ιστού. Έως τις αρχές της δεκαετίας του 1990 οι ταξινομήσεις των
Υποψήφιος διδάκτορας: Καββαδάς Παναγιώτης. Έτος ολοκλήρωσης διδακτορικής διατριβής: 2010
ΠΕΡΙΛΗΨΗ Υποψήφιος διδάκτορας: Καββαδάς Παναγιώτης Έτος ολοκλήρωσης διδακτορικής διατριβής: 2010 Μελέτη τοπ ρόλοπ της ιντεγκρινοσπνδεόμενης κινάσης στην πνεπμονική ίνσση, Διδακτορική Διατριβή, Πανεπιστήμιο
Αλλογενής Μεταµόσχευση Αρχέγονων Αιµοποιητικών Κυττάρων:βασικές αρχές, ενδείξεις και διαδικασία. Επιλεγόµενο Μάθηµα Αιµατολογίας
Αλλογενής Μεταµόσχευση Αρχέγονων Αιµοποιητικών Κυττάρων:βασικές αρχές, ενδείξεις και διαδικασία Επιλεγόµενο Μάθηµα Αιµατολογίας Βασικές αρχές Η µεταµόσχευση αρχέγονων αιµοποιητικών κυττάρων αποτελεί σηµαντική
ΗPV και Καρκίνος Δέρµατος. Ηλέκτρα Νικολαΐδου Επ. Καθηγήτρια Δερµατολογίας ΕΚΠΑ Νοσ. «Α. Συγγρός»
ΗPV και Καρκίνος Δέρµατος Ηλέκτρα Νικολαΐδου Επ. Καθηγήτρια Δερµατολογίας ΕΚΠΑ Νοσ. «Α. Συγγρός» ΓΕΝΗ HPV Α γένος: βλεννογόνοι αιτιολογική συσχέτιση µε καρκίνο τραχήλου µήτρας, πρωκτού, αιδοίου, πέους
Ποικιλίες RhD - Σύγχρονη προσέγγιση κατά τις μεταγγίσεις. M. Ξημέρη, ειδικ. Αιματολογίας
Ποικιλίες RhD - Σύγχρονη προσέγγιση κατά τις μεταγγίσεις M. Ξημέρη, ειδικ. Αιματολογίας Εισαγωγή Σύστημα RhD : - αναγνωρίστηκε το 1939 - το πιο σημαντικό κλινικά σύστημα μετά το ΑΒΟ - προκαλεί αιμολυτικές
Μήπως έχω λέμφωμα; Πώς θα το καταλάβω;
Πώς θα το καταλάβω; Το λέμφωμα είναι δυνητικά ιάσιμη νόσος Μήπως έχω λέμφωμα; Η έγκαιρη διάγνωση, σώζει ζωές Ο οδηγός αυτός έχει γραφτεί για να σας εφοδιάσει με πληροφορίες και συμβουλές, ώστε να αξιολογήσετε
Αυτοάνοσα νοσήματα. Χ.Μ. Μουτσόπουλος
Αυτοάνοσα νοσήματα Χ.Μ. Μουτσόπουλος Καθηγητής Παθολογίας στην Ιατρική Σχολή Πανεπιστημίου Αθηνών Η έγκαιρη αντιμετώπιση αποτελεί «κλειδί» για τον έλεγχο των αυτοάνοσων ασθενειών- της μεγάλης αυτής κατηγορίας
Μάθημα Βιολογίας: Βλαστοκύτταρα και η χρήση τους στη θεραπεία ασθενειών. Ζωή Σελά
Μάθημα Βιολογίας: Βλαστοκύτταρα και η χρήση τους στη θεραπεία ασθενειών Ζωή Σελά Τα βλαστοκύτταρα είναι ένα νέο θεραπευτικό εργαλείο στην Ιατρική διαφορετικό από τα φάρμακα που μέχρι σήμερα είχαμε συνηθίσει.
2 Ο ΜΑΘΗΜΑ ΣΥΣΤΗΜΑ ΣΥΜΠΛΗΡΩΜΑΤΟΣ ΠΑΠΑΓΙΑΝΝΗΣ ΔΗΜΗΤΡΗΣ ΤΜΗΜΑ ΙΑΤΡΙΚΩΝ ΕΡΓΑΣΤΗΡΙΩΝ ΤΕΙ ΘΕΣΣΑΛΙΑΣ
2 Ο ΜΑΘΗΜΑ ΣΥΣΤΗΜΑ ΣΥΜΠΛΗΡΩΜΑΤΟΣ ΠΑΠΑΓΙΑΝΝΗΣ ΔΗΜΗΤΡΗΣ ΤΜΗΜΑ ΙΑΤΡΙΚΩΝ ΕΡΓΑΣΤΗΡΙΩΝ ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΜΗΧΑΝΙΣΜΟΙ ΜΗ ΕΙΔΙΚΗΣ ΑΝΟΣΙΑΣ 1. Ανατομικοί φραγμοί - Δέρμα - Βλεννώδεις μεμβράνες 2. Φυσιολογικοί φραγμοί
ΕΡΑΣΜΕΙΟΣ ΕΛΛΗΝΟΓΕΡΜΑΝΙΚΗ ΣΧΟΛΗ
ΕΡΑΣΜΕΙΟΣ ΕΛΛΗΝΟΓΕΡΜΑΝΙΚΗ ΣΧΟΛΗ Ιδιωτικό Γενικό Λύκειο Όνομα: Ημερομηνία:./04/2014 ΤΑΞΗ : A Λυκείου ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ 1 ο ΘΕΜΑ ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΕΡΩΤΗΣΕΙΣ ΚΕΦΑΛΑΙΟ 11: Ενδοκρινείς αδένες ΒΙΟΛΟΓΙΑ Α ΛΥΚΕΙΟΥ
Περιγραφή Χρηματοδοτούμενων Ερευνητικών Έργων 1η Προκήρυξη Ερευνητικών Έργων ΕΛ.ΙΔ.Ε.Κ. για την ενίσχυση Μεταδιδακτόρων Ερευνητών/Τριών
Περιγραφή Χρηματοδοτούμενων Ερευνητικών Έργων 1η Προκήρυξη Ερευνητικών Έργων ΕΛ.ΙΔ.Ε.Κ. για την ενίσχυση Μεταδιδακτόρων Ερευνητών/Τριών Τίτλος Ερευνητικού Έργου «Διερεύνηση των μηχανισμών δυσλειτουργίας
Μαριάνθη Γεωργίτση Επίκουρη Καθηγήτρια Ιατρικής Βιολογίας-Γενετικής
Μαριάνθη Γεωργίτση Επίκουρη Καθηγήτρια Ιατρικής Βιολογίας-Γενετικής Τομέας Βιολογικών Επιστημών και Προληπτικής Ιατρικής Σχολή Επιστημών Υγείας Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης E-mail: margeorgitsi@auth.gr
Σακχαρώδης διαβήτης και οστεοπόρωση - Ο Δρόμος για την Θεραπεία Τρίτη, 23 Νοέμβριος :22
Δημήτρης Ι. Χατζηδάκης, Αναπληρωτής Καθηγητής Παθολογίας - Ενδοκρινολογίας, Υπεύθυνος Ενδοκρινολογικής Mονάδας Β' Προπαιδευτικής Παθολογικής Κλινικής Πανεπιστημίου Αθηνών, Πανεπιστημιακό Γενικό Νοσοκομείο
Έλεγχος κυτταρικού κύκλου-απόπτωση Πεφάνη Δάφνη Επίκουρη καθηγήτρια, Ιατρική σχολή ΕΚΠΑ Μιχαλακοπούλου 176, 1 ος όροφος
Έλεγχος κυτταρικού κύκλου-απόπτωση Πεφάνη Δάφνη Επίκουρη καθηγήτρια, Ιατρική σχολή ΕΚΠΑ Μιχαλακοπούλου 176, 1 ος όροφος Κυτταρικός κύκλος Φάσεις του κυτταρικού κύκλου G1:Αύξηση του κυττάρου και προετοιμασία
ΓΥΜΝΑΣΙΟ ΚΕΡΑΤΕΑΣ ΕΤΟΣ ΚΑΡΚΙΝΟΣ ΚΑΙ ΜΕΤΑΛΛΑΞΕΙΣ
ΓΥΜΝΑΣΙΟ ΚΕΡΑΤΕΑΣ ΕΤΟΣ 2012-2013 ΚΑΡΚΙΝΟΣ ΚΑΙ ΜΕΤΑΛΛΑΞΕΙΣ Τι είναι ο καρκίνος ; Ο Καρκίνος είναι ένα από τα σοβαρότερα προβλήματα υγείας που παρατηρούνται σήμερα στις αναπτυγμένες χώρες. Οι στατιστικές
Επιστηµονικό Πρόγραµµα
Επιστηµονικό Πρόγραµµα Υπεύθυνοι διοργάνωσης κ.κ.: Π. Παναγιωτίδης Αναπληρωτής Καθηγητής Αιματολογίας Ιατρικής Σχολής Ε.Κ.Π.Α., Α Προπαιδευτική Παθολογική Κλινική Γ.Ν.Α. «Λαϊκό» Κ. Σταματόπουλος Ιατρός
ΠΑΝΕΠ. ΕΤΟΣ Αριθμ.: 2787 ΑΝΙΧΝΕΥΣΗ ΤΗΣ ΣΥΓΧΡΟΝΗΣ ΕΚΦΡΑΣΗΣ ΤΩΝ ΑΝΤΙΓΟΝΩΝ CD5 KAI CD19 ΣΤΑ ΛΕMΦΟΚΥΤΤΑΡΑ ΦΥΣΙΟΛΟΓΙΚΩΝ ΑΤOΜΩΝ
AΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΤΟΜΕΑΣ ΠΑΘΟΛΟΓΙΑΣ Α ΠΡΟΠΑΙΔΕΥΤΙΚΗ ΠΑΘΟΛΟΓΙΚΗ ΚΛΙΝΙΚΗ ΔΙΕΥΘΥΝΤΗΣ : Ο ΚΑΘΗΓΗΤΗΣ ΑΠΟΣΤΟΛΟΣ I. ΧΑΤΖΗΤΟΛΙΟΣ ΠΑΝΕΠ. ΕΤΟΣ 2014-2015
Κυτταρική Βιολογία. Ενότητα 12 : Απόπτωση ή Προγραμματισμένος κυτταρικός θάνατος. Παναγιωτίδης Χρήστος Τμήμα Φαρμακευτικής ΑΠΘ
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Κυτταρική Βιολογία Ενότητα 12 : Απόπτωση ή Προγραμματισμένος κυτταρικός θάνατος Παναγιωτίδης Χρήστος ΑΠΘ Άδειες Χρήσης Το παρόν εκπαιδευτικό
Δημήτριος Κουτσούρης, Καθηγητής ΕΜΠ Ηλιοπούλου Δήμητρα, Δρ. Βιοϊατρικής Τεχνολογίας, Ηλεκτρολόγος Μηχ. και Μηχ. Υπολογιστών, ΕΜΠ
Ο ΡΟΛΟΣ ΤΗΣ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΣΤΗΝ ΕΞΑΤΟΜΙΚΕΥΜΕΝΗ ΔΙΑΧΕΙΡΙΣΗ ΓΥΝΑΙΚΩΝ ΜΕ ΠΑΘΟΛΟΓΙΚΟ ΤΕΣΤ ΠΑΠΑΝΙΚΟΛΑΟΥ Δημήτριος Κουτσούρης, Καθηγητής ΕΜΠ Ηλιοπούλου Δήμητρα, Δρ. Βιοϊατρικής Τεχνολογίας, Ηλεκτρολόγος
Λόγοι έκδοσης γνώμης για τον χαρακτηρισμό φαρμακευτικού προϊόντος ως ορφανού
Παράρτημα 1 Λόγοι έκδοσης γνώμης για τον χαρακτηρισμό φαρμακευτικού προϊόντος ως ορφανού Η Επιτροπή Ορφανών Φαρμάκων (COMP), έχοντας εξετάσει την αίτηση, κατέληξε στα ακόλουθα: Σύμφωνα με το άρθρο 3 παράγραφος
Φάσμα group προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι.
σύγχρονο Φάσμα group προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι. µαθητικό φροντιστήριο Γραβιάς 85 ΚΗΠΟΥΠΟΛΗ 50.51.557 50.56.296 25ης Μαρτίου 74 ΠΛ.ΠΕΤΡΟΥΠΟΛΗΣ 50.50.658 50.60.845 25ης Μαρτίου 111 ΠΕΤΡΟΥΠΟΛΗ 50.27.990
9. Ενδογενείς ηωσινοφιλίες Νοσήματα με ηωσινοφιλία που ευθύνονται τα ίδια τα ηωσινόφιλα
9. Ενδογενείς ηωσινοφιλίες Νοσήματα με ηωσινοφιλία που ευθύνονται τα ίδια τα ηωσινόφιλα Γ.Χρ. Μελέτης 1, Α. Σαραντόπουλος 1, Σ. Μασουρίδη 1, Ε. Βαριάμη 1, Ε. Τέρπος 2 ΚΥΡΙΑ ΣΗΜΕΙΑ Ενδογενείς ηωσινοφιλίες
ΜΗΠΩΣ ΕΧΩ ΛΕΜΦΩΜΑ; ΠΩΣ ΘΑ ΤΟ ΚΑΤΑΛΑΒΩ;
ΜΗΠΩΣ ΕΧΩ ΛΕΜΦΩΜΑ; ΠΩΣ ΘΑ ΤΟ ΚΑΤΑΛΑΒΩ; Με την επιστημονική συνεργασία της Αιματολογικής Μονάδας, Γ Πανεπιστημιακή Παθολογική Κλινική, Ιατρική Σχολή Πανεπιστημίου Αθηνών Με την ευγενική χορηγία της Roche
ΟΜΟΣΠΟΝΔΙΑ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑΔΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2018 Β ΦΑΣΗ
ΤΑΞΗ: Γ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΣ: ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ Ημερομηνία: Τετάρτη 4 Απριλίου 2018 Διάρκεια Εξέτασης: 3 ώρες ΕΚΦΩΝΗΣΕΙΣ ΘΕΜΑ Α Να γράψετε στο τετράδιό σας τον αριθμό καθεμιάς
ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ
ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΘΕΜΑ 1ο Να γράψετε στο τετράδιό σας τον αριθμό καθεμιάς από τις παρακάτω ημιτελείς προτάσεις 1 έως 5 και δίπλα το γράμμα που αντιστοιχεί στη λέξη ή τη φράση, η οποία
Αιμοσφαιρίνες. Αιμοσφαιρίνη Συμβολισμός Σύσταση A HbA α 2 β 2 F HbF α 2 γ 2 A 2 HbA 2 α 2 δ 2 s. Σύγκριση γονιδιακών και χρωμοσωμικών μεταλλάξεων
A. ΔΙΑΓΡΑΜΜΑ Αιμοσφαιρίνες Αιμοσφαιρίνη Συμβολισμός Σύσταση A HbA α 2 β 2 F HbF α 2 γ 2 A 2 HbA 2 α 2 δ 2 S HbS s α 2 β 2 Σύγκριση γονιδιακών και χρωμοσωμικών μεταλλάξεων ΓΟΝΙΔΙΑΚΕΣ Αλλαγή σε αζωτούχες
Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις:
ΜΑΘΗΜΑ / ΤΑΞΗ : ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΗΜΕΡΟΜΗΝΙΑ: 2/12/2016 ΕΠΙΜΕΛΕΙΑ ΔΙΑΓΩΝΙΣΜΑΤΟΣ: ΛΑΖΑΡΑΚΗ ΝΟΤΑ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες