Έκθεση συγκριτικής μελέτης σύγχρονων μεθόδων επεξεργασίας εικόνων πηκτωμάτων
Στα πλαίσια της διδακτορικής έρευνας με Κ.Α. 70/3/11039 μελετήθηκαν και υλοποιήθηκαν σύγχρονες μέθοδοι επεξεργασίας εικόνων πηκτωμάτων. Οι μέθοδοι στοχεύουν στην ανίχνευση και κατάτμηση πρωτεϊνικών κηλίδων με σκοπό τον εντοπισμό εκείνων που έχουν υποστεί τροποποιήσεις στην έκφραση κατά την διάρκεια μίας νόσου. Η ποσοτική ανάλυση των εν λόγω πρωτεϊνών οδηγεί στην ανάπτυξη εφαρμογών σε επίπεδο διάγνωσης καθώς και σε επίπεδο θεραπείας ασθενειών με την παραγωγή νέων φαρμάκων. Οι εικόνες πηκτωμάτων προκύπτουν ως αποτέλεσμα μίας προηγμένης τεχνικής απεικόνισης που ονομάζεται δυσδιάστατη ηλεκτροφόρηση πηκτωμάτων [1]. Απεικονίζουν πρωτεΐνες οι οποίες εμφανίζονται ως λευκές κηλίδες σε σκοτεινό ανομοιογενές υπόβαθρο και αντίστροφα. Τα χρώματα του πηκτώματος μετατρέπονται σε έντασεις διαβαθμίσεων του γκρι (Εικόνα 1).
Εικόνα 1: Εικόνα πηκτώματος η οποία περιλαμβάνει: α) αχνές κηλίδες (faint spots), β) επικαλυπτόμενες κηλίδες (overlapping spots), γ) κάθετες γραμμές (streaks) και δ) τεχνουργήματα (artefacts).
Οι προκλήσεις των εικόνων επικεντρώνονται κυρίως σε δύο περιοχές: 1. Χαμηλής συγκέντρωσης πρωτεϊνών (faint spots) όπως απεικονίζεται στην Εικόνα 1 στην περιοχή (α) 2. Υψηλής συγκέντρωσης πρωτεϊνών (overlapping spots) όπως απεικονίζεται στην Εικόνα 2 στην περιοχή (β). Στην περιοχή (α) οι πρωτεΐνες είναι δυσδιάκριτες ενώ στην περιοχή (β) παρόλο που είναι ευδιάκριτες, δημιουργούνται συστάδες από επικαλυπτόμενες πρωτεΐνες που είναι δύσκολο να διαχωριστούν. Επίσης, παράγοντες οι οποίοι επηρεάζουν αρνητικά την ποιότητα των εικόνων είναι οι οριζόντιες και κάθετες γραμμές (streaks) οι οποίες περιέχουν υπολείμματα πρωτεϊνών όπως απεικονίζεται στην Εικόνα 1 στην περιοχή (γ), καθώς και τεχνουργήματα (artefacts) όπως απεικονίζεται στην Εικόνα 1 στην περιοχή (δ). Η χειροκίνητη διαδικασία ανάλυσης των εικόνων από τους βιολόγους είναι αρκετά χρονοβόρα και υποκειμενική, οδηγώντας σε λανθασμένη εκτίμηση των αποτελεσμάτων. Οι σύγχρονες μέθοδοι ανάλυσης εικόνων πηκτωμάτων αντιμετωπίζουν σε κάποιο βαθμό τα παραπάνω προβλήματα συμβάλλοντας καίρια στο έργο του βιολόγου-ερευνητή.
Μέθοδοι ΑνίχνευσηςΤα σφάλματα που υπεισέρχονται στο στάδιο της ανίχνευσης περιλαμβάνουν κυρίως: α) την μη ανίχνευση πρωτεϊνικών κηλίδων όταν η ένταση της κηλίδας είναι χαμηλότερη από αυτήν του ανομοιογενούς υποβάθρου, β) την λανθασμένη ανίχνευση τεχνουργημάτων ή κορυφών του υποβάθρου ως κηλίδες και γ) την μη ανίχνευση πρωτεϊνικών κηλίδων όταν είναι επικαλυπτόμενες και το τοπικό μέγιστο της μίας επικαλύπτει το τοπικό μέγιστο της άλλης. Η μέθοδος πυραμίδας [2] είναι μία σύγχρονη μέθοδος ανίχνευσης πρωτεϊνικών κηλίδων. Αρχικά, υπολογίζεται ο μέσος όρος των εντάσεων των εικονοστοιχείων στις εικόνες του δείγματος. Εκτελείται ανίχνευση των τοπικών μεγίστων της έντασης στην εικόνα που περιέχει τους μέσους όρους και οι συντεταγμένες τους αποτελούν τις θέσεις όπου εφαρμόζονται οι πυραμίδες. Εάν δύο ή περισσότερες πυραμίδες βρεθούν στις ίδιες συντεταγμένες, τότε επικρατεί εκείνη με την υψηλότερη ένταση. Με τον τρόπο αυτό αφαιρούνται οι διπλές κορυφές και μειώνεται το πρόβλημα της επικάλυψης. Εντούτοις, πριν την ανίχνευση των τοπικών μεγίστων αφαιρούνται οι οριζόντιες και κάθετες γραμμές από την εικόνα γιατί οδηγούν σε λανθασμένη εκτίμηση των αποτελεσμάτων. Ακόμη, η παρουσία θορύβου δυσχεραίνει τον σωστό εντοπισμό των συντεταγμένων των κηλίδων αφού έχει ως αποτέλεσμα την λανθασμένη ανίχνευση των κορυφών του ανομοιογενούς υποβάθρου ως πρωτεΐνες. Η μέθοδος των ενεργών περιγραμμάτων [3] παρουσιάζει αρκετά πλεονεκτήματα στην ανίχνευση καθώς και στην κατάτμηση εικόνων πηκτωμάτων. Αποτελείται από συνεχείς ανοιχτές ή κλειστές καμπύλες που εξελίσσονται σύμφωνα με την ελαχιστοποίηση μίας κατάλληλα επιλεγμένης συνάρτησης ενέργειας χωρίς να απαιτούν πρόσθετες λειτουργίες συνένωσης ακμών και επαρκή αντίθεση δομής ενδιαφέροντος σε σχέση με το υπόβαθρο. Επίσης, παραμένουν ανεπηρέαστα στην ανομοιογένεια του υποβάθρου και ελαττώνουν τις συνέπειες του θορύβου. Επιπλέον, υιοθετούν τοπολογική προσαρμοστικότητα, πράγμα που είναι σημαντικό προτέρημα διότι μία εικόνα πηκτώματος περιέχει περίπου χίλιες πρωτεϊνικές κηλίδες. Στα πλαίσια της διδακτορικής έρευνας αναπτύχθηκε και υλοποιήθηκε μία πρωτότυπη μέθοδος ανίχνευσης κηλίδων και κυρίως επικαλυπτόμενων που καταλαμβάνουν ένα μεγάλο μέρος στις εικόνες πηκτωμάτων. Η μέθοδος στηρίζεται στο μοντέλο των ενεργών περιγραμμάτων το οποίο εφαρμόζεται στην αρχική εικόνα πηκτώματος και σε δεύτερο στάδιο, στις περιοχές που εσωκλείονται της αρχικής καμπύλης οι οποίες έχουν μεγάλη πιθανότητα να εμπεριέχουν επικαλυπτόμενες κηλίδες. Η μέθοδος κρίθηκε αξιόπιστη και επιτυχής σε σύγκριση με υπάρχον λογισμικό πακέτο [4] και υπάρχουσες μεθόδους εντοπισμού πρωτεϊνικών κηλίδων [3],[5] και δημοσιεύθηκε σε διεθνή έγκυρα επιστημονικά συνέδρια [6], [7]. Στην Εικόνα 2 απεικονίζονται τα αποτελέσματα ανίχνευσης τα οποία προέρχονται από: (α1)-(δ1) το μοντέλο των Chan-Vese, (α2)-(δ2) το λογισμικό πακέτο PDQuest 8.0.1 και (α3)-(δ3) την πρωτότυπη τεχνική μας [6]. Είναι εμφανές ότι το μοντέλο των Chan-Vese εντοπίζει τα όρια μίας συστάδας πρωτεϊνών αλλά δεν είναι ικανό να ανιχνεύσει τις επικαλυπτόμενες κηλίδες που περιλαμβάνονται. Επίσης, το λογισμικό πακέτο PDQuest 8.0.1 παράγει ελλειπτικά περιγράμματα τα οποία εσωκλείουν εκτός από εικονοστοιχεία πρωτεΐνης και εικονοστοιχεία υποβάθρου. Ακόμη, οδηγεί σε λανθασμένα αποτελέσματα διότι: 1) δεν ανιχνεύει κάποιες κηλίδες (Εικόνα 2(β2),(γ2)) και 2) ανιχνεύει λανθασμένα δύο κηλίδες ως μία (Εικόνα 2(δ2)). Ωστόσο, η πρωτότυπη τεχνική μας ανιχνεύει σωστά τις επικαλυπτόμενες κηλίδες και συνεπώς μπορεί να ενσωματωθεί σε ένα ολοκληρωμένο σύστημα ανίχνευσης εικόνων πρωτεομικής.
Εικόνα 2: Αποτελέσματα ανίχνευσης πρωτεϊνικών κηλίδων τα οποία προέρχονται από: (α1)-(δ1) το μοντέλο των Chan-Vese, (α2)-(δ2) το λογισμικό πακέτο PDQuest 8.0.1 και (α3)-(δ3) την πρωτότυπη τεχνική μας [6].
Στην Εικόνα 3 απεικονίζονται: (α)-(δ) δείγματα εικόνας πρωτεομικής με αυξημένη αρκετά την παρουσία θορύβου, όπου οι πρωτεΐνες εμφανίζονται ως μαύρες κηλίδες σε ανοιχτό υπόβαθρο καθώς και (α1)-(δ1) τα αντίστοιχα δείγματα εικόνων ground-truth. Επίσης, απεικονίζονται αποτελέσματα ανίχνευσης τα οποία προέρχονται από: (α2)-(δ2) το μοντέλο των Tsakanikas-Manolakos, και (α3)-(δ3) την πρωτότυπη τεχνική μας [7]. Είναι εμφανές ότι το μοντέλο των Tsakanikas-Manolakos δεν είναι ικανό να ανιχνεύσει κάθε μεμονωμένη κηλίδα ξεχωριστά. Εντούτοις, η πρωτότυπη τεχνική μας ανιχνεύει σωστά τις επικαλυπτόμενες κηλίδες σύμφωνα με τις εικόνες ground truth και δεν επηρεάζεται από την παρουσία θορύβου. Εικόνα 3: (α)-(δ) Δείγματα εικόνας πρωτεομικής, (α1)-(δ1) αντίστοιχα δείγματα εικόνων ground truth, αποτελέσματα ανίχνευσης πρωτεϊνικών κηλίδων τα οποία προέρχονται από: (α2)-(δ2) το μοντέλο των Tsakanikas-Manolakos, (α3)-(δ3) την πρωτότυπη τεχνική μας [7].
Επίσης, η μέθοδος της μαθηματικής μορφολογίας [8] παρουσιάζει αρκετά πλεονεκτήματα στην ανίχνευση των πρωτεϊνικών κηλίδων. Έτσι, αναπτύχθηκε και υλοποιήθηκε μία πρωτότυπη τεχνική ανίχνευσης που βασίζεται στην μαθηματική μορφολογία. Αρχικά, εφαρμόζεται τελεστής διαστολής στην εικόνα με σκοπό τον εντοπισμό των περιφερειακών μεγίστων της έντασης που σχετίζονται με κηλίδες. Χρησιμοποιείται κυκλικός δίσκος ως δομικό στοιχείο διότι το σχήμα των κηλίδων πλησιάζει το κυκλικό. Επίσης, λόγω του σχήματός του, διευκολύνει αρκετά την αποφυγή εντοπισμού μεγίστων στις οριζόντιες και κάθετες γραμμές καθώς και σε μη πρωτεϊνικά αντικείμενα που έχουν ακανόνιστο σχήμα. Στη συνέχεια, εφαρμόζονται κριτήρια επιλογής των περιφερειακών μεγίστων που σχετίζονται με πρωτεϊνικές κηλίδες. Η τεχνική κρίθηκε αξιόπιστη και επιτυχής σε σύγκριση με υπάρχον λογισμικό πακέτο [9] και δημοσιεύθηκε σε διεθνές έγκυρο επιστημονικό περιοδικό [10]. Στην Εικόνα 4 απεικονίζονται τα αποτελέσματα ανίχνευσης τα οποία προέρχονται από: (α1),(β1) το λογισμικό πακέτο Melanie 7, (α2),(β2) την πρωτότυπη τεχνική μας. Είναι εμφανές ότι το λογισμικό πακέτο Melanie 7, συγκριτικά με την πρωτότυπη τεχνική μας, ανιχνεύει λανθασμένα κορυφές του υποβάθρου ως πρωτεϊνικές κηλίδες και έτσι οδηγεί σε μη έγκυρα συμπεράσματα όσον αφορά τον πραγματικό αριθμό των πρωτεϊνών. Εικόνα 4: Αποτελέσματα ανίχνευσης πρωτεϊνικών κηλίδων τα οποία προέρχονται από: (α1),(β1) το λογισμικό πακέτο Melanie 7, (α2),(β2) την πρωτότυπη τεχνική μας.
Μέθοδοι ΚατάτμησηςΚατά την διαδικασία της κατάτμησης η εικόνα χωρίζεται σε μη επικαλυπτόμενα τμήματα, κατηγοριοποιώντας τα εικονοστοιχεία σε αυτά που ανήκουν σε πρωτεϊνικές κηλίδες και σε αυτά που ανήκουν στο ανομοιογενές υπόβαθρο. Οι κηλίδες διαχωρίζονται με περιγράμματα στις ακμές τους έτσι ώστε να είναι εφικτός ο υπολογισμός της ποσότητας της κάθε πρωτεΐνης που περικλείεται στο περίγραμμα. Ιδανικά, κάθε περίγραμμα περικλείει μία και μοναδική πρωτεΐνη. Για την ποσοτικοποίηση της πρωτεΐνης απαιτείται ο υπολογισμός του όγκου της, δηλαδή το άθροισμα των εντάσεων όλων των εικονοστοιχείων που περιλαμβάνονται στο περίγραμμά της. Οι πιο διαδεδομένες μέθοδοι κατάτμησης είναι η μέθοδος κατωφλίωσης [11], ανίχνευσης ακμών [12] και υδροκριτικών γραμμών (watersheds) [13]. Οι μέθοδοι αυτές μελετήθηκαν και αξιολογήθηκαν με βάση τις αρχές λειτουργίας τους καθώς και τα αποτελέσματά τους. Σύμφωνα με την μέθοδο κατωφλίωσης, αρχικά εφαρμόζεται στην εικόνα ένα κατώφλι το οποίο σχετίζεται με μία πρωτεϊνική κηλίδα. Ο αλγόριθμος επαναλαμβάνεται με αυξανόμενο κατώφλι έτσι ώστε να διαχωριστούν όλες οι συνδεδεμένες περιοχές και τερματίζεται όταν επιπλέον διαχωρισμοί είναι ανέφικτοι. Ιδανικά, το αποτέλεσμα της κατάτμησης θα αποτελείται από συνδεδεμένες περιοχές οι οποίες θα αντιπροσωπεύουν μεμονωμένες κηλίδες. Η μέθοδος Otsu [14],[15] είναι μία από τις πιο διαδεδομένες μεθόδους κατωφλίωσης. Αρχικά, υπολογίζεται το ιστόγραμμα της εικόνας και γίνεται επιλογή του κατωφλίου για τον διαχωρισμό δύο κλάσεων. Ακολουθεί υπολογισμός των μέσων τιμών των κλάσεων καθώς και της διακύμανσης μεταξύ των κλάσεων. Το βέλτιστο κατώφλι είναι εκείνο για το οποίο η διακύμανση μεταξύ των κλάσεων μεγιστοποιείται. Η μέθοδος είναι ιδιαίτερα ευαίσθητη στην παρουσία θορύβου και μη πρωτεϊνικών αντικειμένων καθώς και στην ανομοιογένεια του υποβάθρου. Η μέθοδος ανίχνευσης ακμών βασίζεται στο γεγονός ότι η μεταβολή της φωτεινότητας στις περιοχές των ακμών είναι πολύ πιο έντονη από ότι στην υπόλοιπη εικόνα. Ιδιαίτερα στις ακμές παρατηρούνται οι υψηλότερες συχνότητες. Αυτό σημαίνει ότι κατά μήκος των ακμών η παράγωγος της φωτεινότητας είναι αυξημένη σημαντικά. Κατά συνέπεια, υπολογίζοντας την παράγωγο σε όλα τα σημεία της εικόνας και κρατώντας εκείνα για τα οποία η παράγωγος παρουσιάζει μεγάλες τιμές, είναι δυνατός ο εντοπισμός της θέσης τους. Εντούτοις, η παρουσία θορύβου καθώς και διάφορες ανωμαλίες στις ακμές δυσχεραίνουν την εκτίμηση της παραγώγου. Για τον λόγο αυτό, συνήθως προηγείται της παραγώγισης ένα φιλτράρισμα του θορύβου. Η μέθοδος των υδροκριτικών γραμμών είναι ίσως η πιο διαδεδομένη μέθοδος στην κατάτμηση εικόνων πηκτωμάτων [16]. Σύμφωνα με την μέθοδο αυτή, η εικόνα θεωρείται ως τοπίο το οποίο περιέχει κοιλάδες και κάθε κοιλάδα αντιπροσωπεύει μία μεμονωμένη κηλίδα. Η εφαρμογή του αλγορίθμου έγκειται στον εντοπισμό των τοπικών ελαχίστων της εικόνας, δηλαδή των κέντρων των κοιλάδων του τοπίου. Εάν θεωρήσουμε ότι στο τοπίο αρχίζει να βρέχει, το νερό θα γεμίσει αργά όλες τις κοιλάδες. Τα φράγματα που τοποθετούνται ανάμεσα στις κοιλάδες, ούτως ώστε να αποφύγουμε την διαρροή, ονομάζονται υδροκριτικές γραμμές. O αλγόριθμος των υδροκριτικών γραμμών οδηγεί σε υπερ-κατάτμηση της εικόνας λόγω του εντοπισμού τοπικών ελάχιστων που σχετίζονται με τεχνουργήματα καθώς και με θόρυβο υποβάθρου. Συνεπώς, απαιτείται επεξεργασία με σημαδευτές οι οποίοι αρχικοποιούν τον αλγόριθμο σε συγκεκριμένα σημεία ενδιαφέροντος επάνω στην εικόνα [17]. Ωστόσο, σύμφωνα με την μέθοδο αυτή υπάρχει ανθρώπινη παρέμβαση η οποία οδηγεί σε μη αντικειμενικά και αμφιλεγόμενα αποτελέσματα. Η μέθοδος των ενεργών περιγραμμάτων [3] παρουσιάζει αρκετά πλεονεκτήματα στην κατάτμηση εικόνων πηκτωμάτων. Στα πλαίσια της διδακτορικής έρευνας αναπτύχθηκε και υλοποιήθηκε μία πρωτότυπη μέθοδος που στοχεύει στην κατάτμηση κηλίδων αχνών και επικαλυπτόμενων ενσωματώνοντας την μέθοδο ενεργών περιγραμμάτων. Αρχικά, η εικόνα σαρώνεται σε διαφορετικές κατευθύνσεις έτσι ώστε να εντοπιστούν τα τοπικά ελάχιστα τα οποία σχετίζονται με όρια επικάλυψης σε περιοχές πρωτεϊνικών κηλίδων. Εφαρμόζονται κριτήρια επιλογής των τοπικών ελαχίστων για αποφυγή εκείνων που αφορούν ελάχιστα υποβάθρου και τα τελευταία σημαδεύονται. Στη συνέχεια, ακολουθεί προσαρμοσμένη εξισορρόπηση ιστογράμματος έτσι ώστε να ενισχυθεί η αντίθεση των αχνών κηλίδων σε σχέση με το υπόβαθρο. Τέλος, εφαρμόζεται το μοντέλο του ενεργού περιγράμματος το οποίο εξελίσσεται σύμφωνα με τις πληροφορίες έντασης της αρχικής εικόνας καθώς και εκείνης που ενσωματώνει τις πληροφορίες των διαχωριζόμενων επικαλυπτόμενων κηλίδων και των ενισχυμένων αχνών κηλίδων. Η μέθοδος κρίθηκε αξιόπιστη και επιτυχής σε σύγκριση με υπάρχοντα λογισμικά πακέτα [4],[9] και δημοσιεύτηκε σε διεθνές έγκυρο επιστημονικό συνέδριο με κριτές [18]. Επίσης, η μέθοδος αυτή αυτοματοποιήθηκε με την αρχικοποίηση του ενεργού περιγράμματος στα τοπικά μέγιστα τα οποία σχετίζονται με πρωτεϊνικές κηλίδες και δημοσιεύτηκε σε διεθνές έγκυρο επιστημονικό συνέδριο με κριτές [19]. Στην Εικόνα 5(α) απεικονίζεται συνθετική εικόνα πρωτεομικής καθώς και αποτελέσματα κατάτμησης τα οποία προέρχονται από: (β) το λογισμικό πακέτο Melanie 7, (γ) το λογισμικό πακέτο PDQuest 8.0.1 και (δ) την πρωτότυπη μέθοδο που υλοποιήσαμε. Είναι εμφανές ότι το λογισμικό πακέτο Melanie 7 κατατμεί κορυφές του υποβάθρου ως κηλίδες ενώ το λογισμικό πακέτο PDQuest 8.0.1 παράγει ελλειπτικά περιγράμματα τα οποία περικλείουν εικονοστοιχεία υποβάθρου οδηγώντας έτσι σε λανθασμένη ποσοτική ανάλυση του όγκου της κάθε πρωτεΐνης. Εικόνα 5: (α) Συνθετική εικόνα πηκτώματος, αποτελέσματα κατάτμησης τα οποία προέρχονται από: (β) το λογισμικό πακέτο Melanie 7, (γ) το λογισμικό πακέτο PDQuest 8.0.1 και (δ) την πρωτότυπη μέθοδο που υλοποιήσαμε.
|