Περίληψη
Η διατριβή αυτή στοχεύει στην ανάπτυξη πρωτότυπων μεθόδων ανάλυσης εικόνας για τη βελτίωση της ακρίβειας ανίχνευσης και ποσοτικοποίησης πρωτεϊνικών κηλίδων σε πρωτεομικές εικόνες δισδιάστατης ηλεκτροφόρησης (2DGE). Η ανάλυση εικόνων πρωτεομικής παραμένει δύσκολη λόγω της μεγάλης ποικιλίας του προφίλ έκφρασης των κηλίδων που αυτές απεικονίζουν. Σήμερα για να παραχθούν αποδεκτά αποτελέσματα χρειάζονται ώρες χειρωνακτικής εργασίας ανά εικόνα. Ξεκινώντας με την υποβάθμιση του θορύβου, που επηρεάζει πολύ τα επόμενα στάδια της ανάλυσης, αναπτύχθηκε πρωτότυπη μέθοδος αποθορυβοποίησης (denoising) με χρήση του μετασχηματισμού Contourlet. Τα αποτελέσματα της αξιολόγησης έδειξαν ότι βελτιώνει σημαντικά τη σηματοθορυβική σχέση (SNR) και μειώνει τις παραμορφώσεις σε σχέση με προηγούμενες μεθόδους βασισμένες σε τεχνικές βασισμένες στα κυματίδια (wavelets). Στην συνέχεια αναπτύχθηκε πρωτότυπη μέθοδος, βασισμένη στα ενεργά περιγράμματα χωρίς ακμές (Active Contours without Edges), για τον διαχωρι ...
Η διατριβή αυτή στοχεύει στην ανάπτυξη πρωτότυπων μεθόδων ανάλυσης εικόνας για τη βελτίωση της ακρίβειας ανίχνευσης και ποσοτικοποίησης πρωτεϊνικών κηλίδων σε πρωτεομικές εικόνες δισδιάστατης ηλεκτροφόρησης (2DGE). Η ανάλυση εικόνων πρωτεομικής παραμένει δύσκολη λόγω της μεγάλης ποικιλίας του προφίλ έκφρασης των κηλίδων που αυτές απεικονίζουν. Σήμερα για να παραχθούν αποδεκτά αποτελέσματα χρειάζονται ώρες χειρωνακτικής εργασίας ανά εικόνα. Ξεκινώντας με την υποβάθμιση του θορύβου, που επηρεάζει πολύ τα επόμενα στάδια της ανάλυσης, αναπτύχθηκε πρωτότυπη μέθοδος αποθορυβοποίησης (denoising) με χρήση του μετασχηματισμού Contourlet. Τα αποτελέσματα της αξιολόγησης έδειξαν ότι βελτιώνει σημαντικά τη σηματοθορυβική σχέση (SNR) και μειώνει τις παραμορφώσεις σε σχέση με προηγούμενες μεθόδους βασισμένες σε τεχνικές βασισμένες στα κυματίδια (wavelets). Στην συνέχεια αναπτύχθηκε πρωτότυπη μέθοδος, βασισμένη στα ενεργά περιγράμματα χωρίς ακμές (Active Contours without Edges), για τον διαχωρισμό περιοχών που περιέχουν κηλίδες από αυτές του φόντου. Η απομόνωση περιοχών ενδιαφέροντος αποδείχθηκε ότι είναι πολύ αξιόπιστη ακόμα και σε περιοχές με κηλίδες χαμηλής έντασης (faint spots). Τέλος, με χρήση κατάλληλα τροποποιημένων, μη επιτηρήσιμων μεθόδων μηχανικής μάθησης ανιχνεύονται οι επιμέρους κηλίδες και εκτιμάται ο όγκος τους. Αρχικά εφαρμόζονται μίξεις μονο-διάστατων μοντέλων Gauss στα ιστογράμματα των εντάσεων των εικονοστοιχείων, ώστε να απομακρυνθεί το παραμένον τοπικό φόντο. Τα εναπομείναντα εικονοστοιχεία θεωρούνται κατόπιν ως γεννήτριες μοριακών δεδομένων, μια διαδικασία ανάστροφης μηχανικής (από τα εικονοστοιχεία πίσω στις κατανομές των μορίων των πρωτεϊνών). Αυτές τις κατανομές προσπαθούμε κατόπιν να απο-μείξουμε (unmix) με αυτόματη προσαρμογή δισδιάστατων Gaussian μοντέλων. Αυτή η πρωτοποριακή τεχνική (που δεν έχει χρησιμοποιηθεί για την ανάλυση εικόνας στη βιβλιογραφία) είναι πλήρως συμβατή με την φυσική σημασία της «δημιουργίας» τοπικών συγκεντρώσεων μορίων των πρωτεϊνών, όπως ακριβώς γίνεται με τη χωροθέτηση των πρωτεϊνών στα πηκτώματα κατά τη δισδιάστατη ηλεκτροφόρηση, και πριν αυτά σκαναριστούν για να προκύψουν οι προς ανάλυση εικόνες. Αποδεικνύεται (με χρήση πολλών πραγματικών και συνθετικών εικόνων) ότι η μέθοδος βελτιώνει σημαντικά την ακρίβεια ανίχνευσης και ποσοτικοποίησης των κηλίδων. Τέλος, η όλη αναπτυχθείσα μέθοδος είναι απολύτως αυτοματοποιημένη και δεν απαιτεί επαναπροσδιορισμό παραμέτρων κάθε φορά που αναλύεται μια νέα εικόνα.
περισσότερα
Περίληψη σε άλλη γλώσσα
The main goal of this doctoral dissertation is the development of new methods for improving the accuracy and efficiency of the spot detection and quantification processes when analyzing 2-DGE images. Image analysis is still considered the bottleneck of a differential expression proteomics analysis workflow due of the large variability in the expression profiles of the spots present on the 2DGE images. There are several commercial software packages that promise automation of the whole spot detection and quantification process, but the hard reality today is that they achieve acceptable performance only after a lot of manual spor editing. A first limitation to be addressed is the lack of sophisticated methods for effective denoising. To this end, a novel methodology was developed, based on the Contourlet Transform. An extensive evaluation of its denoising capabilities has been performed using both synthetic and real gel images. It is demonstrated that it leads to improved SNR, and less di ...
The main goal of this doctoral dissertation is the development of new methods for improving the accuracy and efficiency of the spot detection and quantification processes when analyzing 2-DGE images. Image analysis is still considered the bottleneck of a differential expression proteomics analysis workflow due of the large variability in the expression profiles of the spots present on the 2DGE images. There are several commercial software packages that promise automation of the whole spot detection and quantification process, but the hard reality today is that they achieve acceptable performance only after a lot of manual spor editing. A first limitation to be addressed is the lack of sophisticated methods for effective denoising. To this end, a novel methodology was developed, based on the Contourlet Transform. An extensive evaluation of its denoising capabilities has been performed using both synthetic and real gel images. It is demonstrated that it leads to improved SNR, and less distortions, relatively to spatial filtering and wavelet based methods developed recently. Since denoising comes early in the image analysis pipeline, the realized benefits are shown to have a very positive effect on downstream analysis operations. For isolating the image background from areas that include protein spots, a new method was introduced, based on Active Contours without Edges, which is shown to be successful, even in areas with faint and/or saturated spots. Finally, individual spots are located within these areas and their volumes are estimated, using a pipeline of unsupervised machine learning operations: 1D mixture modeling of the intensities histogram is applied first to eliminate background pixels. The surviving pixels are then treated as “molecule generators”, to reveal the distribution of the underlying protein species, manifested as spots on the gel image. This reverse engineering approach constitutes a unique innovation of this work has not been applied in biomedical image analysis before. Finally, by fitting 2D Gaussian models on the generated (by random sampling) “molecules” dataset the individual spots boundaries and their quantities are estimated. It is shown that the developed methodology achieves more precise spot detection and more accurate spot quantification than commercially available software tools. Furthermore, it can be fully automated, not requiring any re-calibration every time a new image is analyzed.
περισσότερα