Περίληψη
Η βαθύτερη κατανόηση της παθολογίας ενός οργανισμού είναι σημαντική για την ανάπτυξη θεραπειών. Κατά τη διάρκεια αιώνων συστηματικής έρευνας, οι κλινικοί ερευνητές έχουν δείξει ότι όσο περισσότερες πληροφορίες αποκτούν σχετικά με τα χαρακτηριστικά των κυττάρων και την οργάνωσή τους στον ιστό, τόσο καλύτερα μπορούν να κατανοήσουν τη λειτουργικότητα ενός οργανισμού και την εξέλιξη της νόσου. Τα τελευταία χρόνια, η εμφάνιση τεχνικών απεικόνισης υψηλής ανάλυσης παρείχε στους ερευνητές νέες πληροφορίες για μεμονωμένα κύτταρα, επιτρέποντάς τους να τα χαρακτηρίζουν με ακρίβεια και να μελετούν την κατανομή τους στον ιστό. Ωστόσο, η εξαγωγή χρήσιμων βιολογικών συμπερασμάτων από την ανάλυση τέτοιων νέων και σύνθετων δεδομένων, όπου οι ειδικοί δεν γνωρίζουν εκ των προτέρων τα εγγενή χαρακτηριστικά των δεδομένων ούτε τα πρότυπα που επιθυμούν να εντοπίσουν, απαιτεί μια προσέγγιση διερευνητικής ανάλυσης δεδομένων. Σκοπός της παρούσας διατριβής είναι η ανάπτυξη μιας ολοκληρωμένης (end-to-end) ροής ερ ...
Η βαθύτερη κατανόηση της παθολογίας ενός οργανισμού είναι σημαντική για την ανάπτυξη θεραπειών. Κατά τη διάρκεια αιώνων συστηματικής έρευνας, οι κλινικοί ερευνητές έχουν δείξει ότι όσο περισσότερες πληροφορίες αποκτούν σχετικά με τα χαρακτηριστικά των κυττάρων και την οργάνωσή τους στον ιστό, τόσο καλύτερα μπορούν να κατανοήσουν τη λειτουργικότητα ενός οργανισμού και την εξέλιξη της νόσου. Τα τελευταία χρόνια, η εμφάνιση τεχνικών απεικόνισης υψηλής ανάλυσης παρείχε στους ερευνητές νέες πληροφορίες για μεμονωμένα κύτταρα, επιτρέποντάς τους να τα χαρακτηρίζουν με ακρίβεια και να μελετούν την κατανομή τους στον ιστό. Ωστόσο, η εξαγωγή χρήσιμων βιολογικών συμπερασμάτων από την ανάλυση τέτοιων νέων και σύνθετων δεδομένων, όπου οι ειδικοί δεν γνωρίζουν εκ των προτέρων τα εγγενή χαρακτηριστικά των δεδομένων ούτε τα πρότυπα που επιθυμούν να εντοπίσουν, απαιτεί μια προσέγγιση διερευνητικής ανάλυσης δεδομένων. Σκοπός της παρούσας διατριβής είναι η ανάπτυξη μιας ολοκληρωμένης (end-to-end) ροής εργασίας για την ανάλυση αυτών των υψηλοδιάστατων κυτταρικών εικόνων· από την προεπεξεργασία των ακατέργαστων δεδομένων έως τη διερεύνηση κυτταρικών προτύπων και τη συσχέτισή τους με κλινικά χαρακτηριστικά. Στο Κεφάλαιο 1 τεκμηριώνεται η σημασία και η αναγκαιότητα της μελέτης, παρουσιάζονται τα βασικά χαρακτηριστικά των δεδομένων, συζητούνται οι αλγόριθμοι προεπεξεργασίας και εισάγεται η προσέγγιση της οπτικής αναλυτικής (visual analytics) για τη διερευνητική ανάλυση σύνθετων δεδομένων. Στη συνέχεια περιγράφεται μια νέα μεθοδολογία για την προεπεξεργασία αυτών των υψηλοδιάστατων κυτταρικών εικόνων (Κεφάλαιο 2). Στο Κεφάλαιο 2.1 παρουσιάζεται η ημι-επιβλεπόμενη ροή εργασίας που αναπτύχθηκε για την κανονικοποίηση δεδομένων Imaging Mass Cytometry μεταξύ διαφορετικών δειγμάτων και διαστάσεων. Επιπλέον, δείχνεται πώς η δυαδική ταξινόμηση ενός εικονοστοιχείου σε προσκήνιο και υπόβαθρο μπορεί να εξαλείψει μη βιολογικές διαφοροποιήσεις μεταξύ δειγμάτων ιστών και να βελτιώσει την ανίχνευση κυττάρων με χαμηλή έκφραση πρωτεϊνών. Στο Κεφάλαιο 2.2 παρουσιάζεται ένας αλγόριθμος τμηματοποίησης για τον ακριβή εντοπισμό μικρογλοίας, όπως αυτή καταγράφεται με τη μέθοδο πολλαπλής ανοσοφθορίζουσας απεικόνισης Vectra. Συγκεκριμένα, χρησιμοποιείται συνδυασμός παραδοσιακών αλγορίθμων τμηματοποίησης (Level-Set, Watershed) και μορφολογικών πράξεων για τη δημιουργία ενός αυτοματοποιημένου αλγορίθμου ακριβούς προσδιορισμού των κυτταρικών ορίων της μικρογλοίας. Στα Κεφάλαια 3 και 4 προτείνεται μια προσέγγιση οπτικής αναλυτικής για την ανάλυση αυτών των ιδιαίτερα σύνθετων χωρικών κυτταρικών δεδομένων, η οποία περιλαμβάνει δύο διαδραστικά εργαλεία βασισμένα στα δεδομένα, τα ImaCytE και SpaCeCo. Το ImaCytE (Κεφάλαιο 3) επιτρέπει στους ειδικούς να εξετάζουν πολλαπλά δείγματα ιστών και να εντοπίζουν νέους τύπους κυττάρων, να μελετούν σε πολλαπλά επίπεδα τα χωρικά πρότυπα που σχηματίζουν και να κατηγοριοποιούν συγκεκριμένους κυτταρικούς τύπους με βάση τα χαρακτηριστικά του μικροπεριβάλλοντός τους. Το SpaCeCo (Κεφάλαιο 4) συμπληρώνει το ImaCytE και επιτρέπει στους ειδικούς να καθορίζουν ποια κυτταρικά χαρακτηριστικά διαφοροποιούν δύο ομάδες δειγμάτων με διαφορετικά κλινικά χαρακτηριστικά. Η ροή εργασίας σύγκρισης χωρίζεται σε δύο στάδια: το πρώτο αφορά τη σύγκριση των ομάδων με βάση την αφθονία των διαφορετικών κυτταρικών τύπων και το δεύτερο με βάση τα χωρικά πρότυπα που σχηματίζουν. Η σύγκριση πραγματοποιείται σε δύο επίπεδα, το επίπεδο της ομάδας και το επίπεδο του δείγματος, ώστε να είναι δυνατός ο εντοπισμός τυχόν ακραίων τιμών σε κάθε ομάδα. Τόσο στο ImaCytE όσο και στο SpaCeCo, ο χρήστης μπορεί να εντοπίσει κάθε εύρημα πάνω στον ιστό για επαλήθευση και τοποθέτησή του στο βιολογικό του πλαίσιο. Στο Κεφάλαιο 5 παρουσιάζεται πώς μέρη της προτεινόμενης ροής εργασίας χρησιμοποιήθηκαν σε μελέτη για τη νόσο Alzheimer. Συγκεκριμένα, χρησιμοποιήθηκαν ο αλγόριθμος τμηματοποίησης για την αποτελεσματική αναγνώριση μικρογλοίας, τα μοτίβα-glyphs που παρουσιάστηκαν αρχικά στο ImaCytE για τη διερεύνηση κυτταρικών προτύπων στον ιστό, καθώς και το SpaCeCo για τη σύγκριση ασθενών με Alzheimer με υγιή άτομα. Τέλος, αναπτύχθηκαν λύσεις οπτικής αναλυτικής που επιτρέπουν στους ειδικούς να διερευνούν σε βάθος χωρικά κυτταρικά δεδομένα και να διατυπώνουν υποθέσεις σχετικά με την προέλευση της λειτουργικότητας του ιστού σε υγιή ή νοσούντα κατάσταση. Πέρα από τις βασικές λειτουργίες διερεύνησης, οι ειδικοί έχουν τη δυνατότητα να προεπεξεργάζονται τα δεδομένα τους, δημιουργώντας μια ολοκληρωμένη ροή ανάλυσης για απεικονίσεις ιστών πολλαπλών δεικτών σε κυτταρική ανάλυση. Συνολικά, το έργο αυτής της διατριβής θέτει τα θεμέλια για μια προσέγγιση οπτικής αναλυτικής στην ανάλυση υψηλοδιάστατης απεικόνισης, με στόχο τη λεπτομερή μελέτη κυττάρων και ιστών.
περισσότερα
Περίληψη σε άλλη γλώσσα
A deeper understanding of an organism’s pathology is essential for the development of treatments. Over centuries of systematic research, clinical researchers have demonstrated that the more information they acquire about cellular properties and their organization within tissue, the better they can understand the functionality of an organism and disease progression. In recent years, the advent of high-resolution imaging techniques has provided researchers with new information at the single-cell level, enabling precise characterization of cells and the study of their spatial distribution in tissue. However, extracting meaningful biological insights from such new and complex data—where experts do not know the intrinsic characteristics of the data nor the patterns they aim to identify—requires an exploratory data analysis approach. The aim of this dissertation is therefore the development of an end-to-end pipeline for the analysis of these high-dimensional cellular images, from raw data pr ...
A deeper understanding of an organism’s pathology is essential for the development of treatments. Over centuries of systematic research, clinical researchers have demonstrated that the more information they acquire about cellular properties and their organization within tissue, the better they can understand the functionality of an organism and disease progression. In recent years, the advent of high-resolution imaging techniques has provided researchers with new information at the single-cell level, enabling precise characterization of cells and the study of their spatial distribution in tissue. However, extracting meaningful biological insights from such new and complex data—where experts do not know the intrinsic characteristics of the data nor the patterns they aim to identify—requires an exploratory data analysis approach. The aim of this dissertation is therefore the development of an end-to-end pipeline for the analysis of these high-dimensional cellular images, from raw data preprocessing to the exploration of cellular patterns and their association with clinical characteristics. In Chapter 1, we motivate the importance and necessity of our study, present the main characteristics of the data, discuss preprocessing algorithms, and introduce a visual analytics approach for the exploratory analysis of complex data. Then, we describe a new methodology for preprocessing these high-dimensional cellular images (Chapter 2). In Chapter 2.1, we present the semi-supervised workflow developed for normalizing Imaging Mass Cytometry data across different samples and dimensions. Additionally, we show how binary classification of image pixels into foreground and background can eliminate non-biological variation between tissue samples and improve the traceability of cells with low protein expression levels. In Chapter 2.2, we present a segmentation algorithm aimed at the precise identification of microglia cells, as captured through the Vectra multiplexed immunofluorescence modality. Specifically, a combination of traditional segmentation algorithms (Level-Set, Watershed) and morphological operations is used to create an automated algorithm for accurately identifying microglial cellular boundaries. In Chapters 3 and 4, we propose a visual analytics approach for the analysis of highly complex spatial cellular data, incorporating two data-driven interactive tools, ImaCytE and SpaCeCo. ImaCytE (Chapter 3) enables experts to examine multiple tissue samples and identify new cell types, explore the spatial patterns they form at multiple levels, and stratify specific cell types based on their microenvironmental characteristics. SpaCeCo (Chapter 4) complements ImaCytE and allows experts to determine which cellular features distinguish two cohorts of samples with different clinical characteristics. The comparison workflow is divided into two steps: first, cohorts are compared based on the abundance of different cell types, and second, based on the spatial patterns formed by these cell types. The comparison is performed at both the cohort and sample levels, allowing experts to identify potential outliers within each cohort. In both ImaCytE and SpaCeCo, users can localize each finding within the tissue to verify it and place it in its biological context. In Chapter 5, we demonstrate how parts of our pipeline were applied in a study on Alzheimer’s disease. Specifically, the segmentation algorithm for efficient identification of microglia, the motif glyphs first introduced in ImaCytE for exploring cellular patterns in tissue, and SpaCeCo for comparing Alzheimer’s patients with healthy individuals were utilized. Finally, we developed visual analytics solutions enabling experts to explore in depth spatial cellular data and generate hypotheses about the origins of tissue functionality in diseased and healthy states. Beyond core exploratory tasks, experts are also enabled to preprocess their data, creating an end-to-end pipeline for the analysis of multiplexed tissue images at cellular resolution. Overall, the work presented in this dissertation lays the foundation for a visual analytics approach to high-dimensional imaging analysis, enabling detailed study of cells and tissues.
περισσότερα