Περίληψη
Η παρούσα διδακτορική διατριβή επικεντρώνεται στην ανάπτυξη μεθοδολογιών τεχνητής νοημοσύνης (ΤΝ) για την παρακολούθηση του καρκίνου του προστάτη (ΠΑ) περιλαμβάνοντας (α) την ενίσχυση της εικόνας μαγνητικής τομογραφίας (MRI) μέσω τεχνικών προεπεξεργασίας εικόνας και βαθιάς μάθησης (ΒΜ), (β) την αυτοματοποιημένη τμηματοποίηση της περιφερικής ζώνης του ΠΑ μέσω μοντέλων ΒΜ, (γ) την ανίχνευση του καρκίνου του προστάτη μέσω πολυτροπικής μάθησης συνδυάζοντας εικόνες MRI, χαρακτηριστικά ραδιομικής και κλινικά χαρακτηριστικά, (δ) την αυτοματοποιημένη τμηματοποίηση προστατικών όγκων μέσω μοντέλων ΒΜ και (ε) τον χαρακτηρισμό αυτών των όγκων σε κλινικά σημαντικούς με την χρήση ραδιομικών χαρακτηριστικών, εξαγόμενα από εικόνες MRI. Στο πρώτο κεφάλαιο γίνεται μία παρουσίαση της ανατομίας του ΠΑ και των ανατομικών ζωνών που τον αποτελούν με την κλινική σημασία της καθεμίας. Εν συνεχεία, δίδεται εκτενής αναφορά στον καρκίνο του ΠΑ, παρουσιάζοντας μία αναφορά για τις φυλετικές ομάδες στις οποίες εμφα ...
Η παρούσα διδακτορική διατριβή επικεντρώνεται στην ανάπτυξη μεθοδολογιών τεχνητής νοημοσύνης (ΤΝ) για την παρακολούθηση του καρκίνου του προστάτη (ΠΑ) περιλαμβάνοντας (α) την ενίσχυση της εικόνας μαγνητικής τομογραφίας (MRI) μέσω τεχνικών προεπεξεργασίας εικόνας και βαθιάς μάθησης (ΒΜ), (β) την αυτοματοποιημένη τμηματοποίηση της περιφερικής ζώνης του ΠΑ μέσω μοντέλων ΒΜ, (γ) την ανίχνευση του καρκίνου του προστάτη μέσω πολυτροπικής μάθησης συνδυάζοντας εικόνες MRI, χαρακτηριστικά ραδιομικής και κλινικά χαρακτηριστικά, (δ) την αυτοματοποιημένη τμηματοποίηση προστατικών όγκων μέσω μοντέλων ΒΜ και (ε) τον χαρακτηρισμό αυτών των όγκων σε κλινικά σημαντικούς με την χρήση ραδιομικών χαρακτηριστικών, εξαγόμενα από εικόνες MRI. Στο πρώτο κεφάλαιο γίνεται μία παρουσίαση της ανατομίας του ΠΑ και των ανατομικών ζωνών που τον αποτελούν με την κλινική σημασία της καθεμίας. Εν συνεχεία, δίδεται εκτενής αναφορά στον καρκίνο του ΠΑ, παρουσιάζοντας μία αναφορά για τις φυλετικές ομάδες στις οποίες εμφανίζεται καθώς επίσης και για τους παράγοντες κινδύνου της νόσου. Στη συνέχεια αναφέρονται οι διαγνωστικές μέθοδοι για την ανίχνευση της, ενώ παρουσιάζεται ενδελεχώς ο ρόλος της μαγνητικής τομογραφίας στην ανίχνευση του καρκίνου του ΠΑ αλλά και ο ρόλος της ΤΝ για τον ίδιο σκοπό. Μετέπειτα παρουσιάζονται τα μοντέλα ΒΜ για την επεξεργασία εικόνας και συγκεκριμένα, πραγματοποιείται μία εισαγωγή στα νευρωνικά δίκτυα, τον τρόπο εκπαίδευσης τους, τα συνελικτικά νευρωνικά δίκτυα και τους μετασχηματιστές υπολογιστικής όρασης. Τέλος, παρουσιάζεται η δομή των μεθοδολογικών κεφαλαίων της διατριβής καθώς επίσης και το μοτίβο που ακολουθούν στις υποενότητές τους. Στο δεύτερο κεφάλαιο, παρουσιάζεται η μεθοδολογία RACLAHE η οποία σχεδιάστηκε με σκοπό να βελτιώνει την απεικόνιση MRI και να ενισχύει τα αυτοματοποιημένα μοντέλα τμηματοποίησης του ΠΑ και των επιμέρους ζωνών του. Η μεθοδολογία RACLAHE, συνεκρίθη με άλλα τέσσερα φίλτρα βελτίωσης εικόνας για τρεις διαφορετικές εργασίες τμηματοποίησης (ΠΑ, Περιφερικής ζώνης - ΠΖ, Μεταβατικής ζώνης - ΜΖ). Η συγκεκριμένη μεθοδολογία επεκτείνει την υπάρχουσα βιβλιογραφία εκσυγχρονίζοντας την εφαρμογή των φίλτρων εικόνας, όπως η ισοστάθμιση ιστογράμματος, εισάγοντας και ένα μοντέλο ΒΜ για την έξυπνη εφαρμογή πάνω σε κατάλληλες περιοχές της εικόνας, ούτως ώστε να βελτιώνεται στοχευμένα η περιοχή ενδιαφέροντος. Παράλληλα, αναπτύσσεται μια μεθοδολογία για την επεξήγηση των αποτελεσμάτων, μέσω της οποίας αποδεικνύεται ότι η RACLAHE όχι μόνο βελτιώνει την απόδοση των μοντέλων αυτόματης τμηματοποίησης του ΠΑ και των ζωνών του, αλλά επιπλέον ενισχύει την επεξηγησιμότητα τους. Συγκεκριμένα, συμβάλλει επικουρικά ώστε τα μοντέλα ΒΜ να εστιάζουν στα πλέον σημαντικά χαρακτηριστικά της εικόνας. Η μέθοδος αυτή εφαρμόστηκε επίσης σε κάθε φίλτρο της βιβλιογραφίας που αναπαράχθηκε και συνεκρίθη με την RACLAHE και για κάθε ζώνη του ΠΑ. Συνοπτικά, στο συγκεκριμένο κεφάλαιο παρουσιάζεται μια μεθοδολογία βελτίωσης της εικόνας MRI, βασιζόμενη σε μοντέλο ΒΜ & μία μεθοδολογία βελτίωσης ιστογράμματος εικόνας, ενώ ταυτόχρονα παρουσιάζεται και μία μεθοδολογία για την μέτρηση του βαθμού επεξηγησιμότητας των τεχνικών προεπεξεργασίας εικόνας και μοντέλων ΒΜ. Το τρίτο κεφάλαιο εστιάζει στην αυτόματη τμηματοποίηση της ΠΖ, της ανατομικής περιοχής όπου εμφανίζεται το 70% των καρκίνων του προστάτη. Για τον σκοπό αυτό, προτείνεται το μοντέλο ResQu-Net, μια αρχιτεκτονική που ενσωματώνει μηχανισμούς χωρικής προσοχής και επίπεδα συμπίεσης-διέγερσης. Η σύγκρισή του με έξι άλλα μοντέλα της βιβλιογραφίας σε τρία διαφορετικά σύνολα δεδομένων, ανέδειξε την βελτίωση που αυτό επιφέρει στην ακριβή οριοθέτηση της πολύπλοκης μορφολογίας της ΠΖ, αποδεικνύοντας ταυτόχρονα, μέσω ποιοτικής ανάλυσης, ότι είναι περισσότερο επεξηγήσιμο από τα υπάρχοντα μοντέλα. Μετέπειτα το τέταρτο κεφάλαιο σχετίζεται με την ανίχνευση του καρκίνου του προστάτη από εικόνες MRI, ραδιομικά και κλινικά χαρακτηριστικά. Στα πλαίσια αυτού του κεφαλαίου αναπτύχθηκε ένα πολυτροπικό μοντέλο ΒΜ το οποίο συνδυάζει συνεργατικά χαρακτηριστικά εικόνας, ραδιομικής και κλινικών δεδομένων, μέσω ενός ιεραρχικού μηχανισμού διασταυρούμενης προσοχής. Για την επιλογή του βέλτιστου μοντέλου ΒΜ εικόνας, προτείνεται μια μεθοδολογία για την ανάλυση της εκφραστικότητας των χαρακτηριστικών ΒΜ, με την προτεινόμενη Σταθμισμένη Μετρική Εκφραστικότητας (WES) να καθοδηγεί την επιλογή της πλέον αξιόπιστης αρχιτεκτονικής. Η εκτενής αξιολόγηση σε ένα μεγάλης κλίμακας, πολυκεντρικό σύνολο δεδομένων (ProstateNET) με αναδρομικά και προοπτικά δεδομένα, κατέδειξε ότι το προτεινόμενο τριτροπικό μοντέλο υπερέχει συστηματικά έναντι των μονοτροπικών και διτροπικών προσεγγίσεων και άλλων μοντέλων της βιβλιογραφίας, ενισχύοντας την ακρίβεια και τη γενικευσιμότητα της διάγνωσης του καρκίνου του ΠΑ σε επίπεδο ασθενούς. Προχωρώντας, το πέμπτο κεφάλαιο αναφέρεται στην τμηματοποίηση των ίδιων των καρκινικών βλαβών, καθώς εκεί αναπτύσσεται το τρισδιάστατο, πολλαπλών καναλιών μοντέλο ProLesA-Net. Η αρχιτεκτονική του εισάγει δύο νέα επίπεδα προσοχής πολλαπλής κλίμακας, το MSSE (Επίπεδο συμπίεσης και διέγερσης πολλαπλής κλίμακας) και το MSAG (επίπεδο χωρικής προσοχής πολλαπλής κλίμακας), τα οποία επιτρέπουν στο μοντέλο να ανιχνεύει και να οριοθετεί με υψηλή ακρίβεια προστατικούς όγκους διαφορετικών μεγεθών, δίνοντας ιδιαίτερη έμφαση στις μικρές και μεσαίες βλάβες που αποτελούν σημαντική πρόκληση στην κλινική πράξη. Η αποτελεσματικότητά του επιβεβαιώθηκε μέσω εκτεταμένης αξιολόγησης έναντι έξι άλλων τρισδιάστατων μοντέλων της βιβλιογραφίας καθώς επίσης μελετήθηκε και η απόδοση του για όγκους διαφορετικών μεγεθών άλλα και η επίδραση των μηχανισμών προσοχής MSSE & MSAG και κατά πόσο αυτοί βελτιώνουν τις ήδη υπάρχουσες αρχιτεκτονικές ΒΜ. Τέλος, το έκτο κεφάλαιο ολοκληρώνει τη διαγνωστική πορεία στη παρακολούθηση της νόσου, με τον μη επεμβατικό χαρακτηρισμό των όγκων σε κλινικά σημαντικούς, παρουσιάζοντας το Simplatab. Πρόκειται για ένα ολοκληρωμένο σύστημα αυτοματοποιημένης μηχανικής μάθησης που αξιοποιεί ποσοτικά ραδιομικά χαρακτηριστικά από εικόνες bpMRI. Το Simplatab δεν περιορίζεται στην ανάπτυξη μοντέλων υψηλής διαγνωστικής ακρίβειας, αλλά ενσωματώνει και προηγμένες λειτουργίες ανάλυσης μεροληψίας των δεδομένων, αξιολόγησης της ευαλωτότητας των μοντέλων και εξηγήσιμης ΤΝ μέσω ανάλυσης Shapley, ενισχύοντας έτσι την αξιοπιστία και τη διαφάνεια που απαιτούνται για την κλινική υιοθέτηση τέτοιων συστημάτων. Συμπερασματικά, η παρούσα διατριβή αναφέρεται στη παρακολούθηση του καρκίνου του ΠΑ από την σκοπιά της ΤΝ και των αυτοματοποιημένων μεθόδων για την επίλυση καίριων ζητημάτων. Ξεκινώντας από την επεξεργασία της εικόνας MRI προτείνεται η μεθοδολογία RACLAHE που συστηματικά βελτιώνει την απόδοση των μοντέλων ΒΜ στη τμηματοποίηση των ζωνών του ΠΑ και στον ίδιο. Στο επόμενο βήμα προτείνεται ένα μοντέλο ΒΜ, το ResQu-Net, για την τμηματοποίηση της ΠΖ του προστάτη, η οποία είναι και η κρισιμότερη μιας και το 70% των καρκινικών όγκων εμφανίζεται σε αυτήν. Εν συνεχεία προτείνεται ένα πολυτροπικό μοντέλο ιεραρχικής διασταυρούμενης προσοχής για την ανίχνευση της νόσου σε επίπεδο ασθενούς ενώ ως επόμενο βήμα προτείνεται ένα μοντέλο ΒΜ, το ProLesA-Net, για την τμηματοποίηση των καρκινικών όγκων εντός του ΠΑ. Το τελευταίο μεθοδολογικό κεφάλαιο οδηγεί στο μείζον κλινικό αποτέλεσμα της διατριβής που είναι ο χαρακτηρισμός του καρκίνου σε κλινικά σημαντικό. Σε αυτό προτείνεται ένας αλγόριθμο αυτοματοποιημένης μηχανικής μάθησης, το Simplatab που περιέχει πέραν των μοντέλων μηχανικής μάθησης και μεθόδους για την ανίχνευση της μεροληψίας, της ευαλωτότητας και την εξήγηση των μοντέλων μηχανικής μάθησης.
περισσότερα
Περίληψη σε άλλη γλώσσα
This PhD Thesis focuses on the development of Artificial Intelligence (AI) methodologies across the prostate cancer (PCa) continuum, including (a) the improvement of Magnetic Resonance Imaging (MRI) through image preprocessing techniques, (b) the automated segmentation of the prostate’s peripheral zone via Deep Learning (DL) models, (c) the detection of PCa with multimodal DL models, (d) the automated segmentation of prostatic lesions employing DL models, and (e) the characterization of these lesions as clinically significant utilizing quantitative radiomics features extracted from MRI scans.More specifically, the second chapter introduces the RACLAHE methodology, which was designed to improve MRI visualization and enhance the performance of automated segmentation models for the prostate gland and its prostatic zones (Peripheral Zone - PZ, Transitional Zone - TZ). This methodology extends the existing literature by modernizing the application of image filters, such as histogram equaliz ...
This PhD Thesis focuses on the development of Artificial Intelligence (AI) methodologies across the prostate cancer (PCa) continuum, including (a) the improvement of Magnetic Resonance Imaging (MRI) through image preprocessing techniques, (b) the automated segmentation of the prostate’s peripheral zone via Deep Learning (DL) models, (c) the detection of PCa with multimodal DL models, (d) the automated segmentation of prostatic lesions employing DL models, and (e) the characterization of these lesions as clinically significant utilizing quantitative radiomics features extracted from MRI scans.More specifically, the second chapter introduces the RACLAHE methodology, which was designed to improve MRI visualization and enhance the performance of automated segmentation models for the prostate gland and its prostatic zones (Peripheral Zone - PZ, Transitional Zone - TZ). This methodology extends the existing literature by modernizing the application of image filters, such as histogram equalization, and introducing a DL model for the intelligent application onto appropriate image regions to selectively refine the region of interest. Concurrently, a methodology for the explainability of the results is developed, through which it is demonstrated that RACLAHE not only improves the performance of automated segmentation models for the prostate and its zones but also improves their interpretability. Specifically, it assists DL models in focusing on the most salient image features.The third chapter focuses on the automated segmentation of the PZ, the anatomical region where 70% of prostate cancers occur. For this purpose, the ResQu-Net model is proposed, an architecture that integrates proposed spatial attention mechanisms and squeeze-and-excitation blocks. Its comparison with six other state-of-the-art models across three different datasets highlighted its better performance in the precise delineation of the complex morphology of the PZ, while also proving, through qualitative analysis, to be more explainable than existing models, by drawing its outcomes based on the most relevant regions that constitutes the PZ. Subsequently, the fourth chapter addresses the detection of prostate cancer from MRI images, radiomic, and clinical features. Within this chapter, a multimodal Deep Learning (DL) model was developed that synergistically combines imaging, radiomic, and clinical features through a hierarchical cross-attention mechanism. To select the optimal imaging model for integration, a methodology for analyzing the expressiveness of DL features was introduced, with the proposed Weighted Expressiveness Score (WES) guiding the selection of the most robust architecture. The evaluation on a large-scale, multi-center dataset (ProstateNET) with retrospective and prospective data demonstrated that the proposed trimodal model systematically outperforms unimodal, bimodal approaches and other models present in the literature, improving the diagnostic accuracy and generalizability for prostate cancer detection. Furthermore, the fifth chapter addresses the segmentation of the cancerous lesions themselves by developing the 3D, multi-channel ProLesA-Net model. Its architecture introduces two novel multi-scale attention layers, the MSSE (Multi-Scale Squeeze and Excitation) and MSAG (Multi-Scale Attention Gate), which enable the model to detect and delineate prostatic tumors of varying sizes with high precision, placing particular emphasis on the small and medium-sized lesions that pose a significant clinical challenge. Its efficacy was confirmed through extensive evaluation against six other 3D state-of-the-art models, while an ablation study performed to prove the improvement of those attention layers (MSSE & MSAG) not only in the ProLesA-Net backbone but also in a vanilla model (U-Net). The sixth chapter completes the diagnostic pathway with the non-invasive characterization of tumors as clinically significant, presenting Simplatab. This is a comprehensive automated machine learning (AutoML) framework that leverages quantitative radiomics features from MRI scans. Simplatab is not limited to developing models with high diagnostic accuracy but also integrates advanced functionalities for data bias analysis, model vulnerability assessment, and explainable AI (XAI) through Shapley analysis, thereby improving the reliability and transparency required for the clinical adoption of such systems. Future work involves the creation of AI agents based on Large Language Models (LLMs). These agents will utilize the methodologies proposed in the dissertation as tools to establish a holistic clinical assistant in the form of a conversational agent (ChatBot). Clinicians will be able to actively interact with this agent, providing patient data and receiving responses generated by the techniques developed. In summary, a clinician could receive an enhanced image (RACLAHE), the automated segmentation of the PZ (ResQu-Net), whether a patient suffers from PCa (Multimodal Hierarchical cross-attention model), the delineation of prostatic lesions (ProLesA-Net), and a diagnosis regarding their clinical significance in a single, streamlined interaction (Simplatab).
περισσότερα