Περίληψη
Τα βιολογικά συστήματα είναι σύνθετα συστήματα που αποτελούνται από πολλαπλά αλληλοσυνδεόμενα στοιχεία, τα οποία συνεργάζονται για να διατηρήσουν τη φυσιολογική λειτουργία του δικτύου υπό ποικίλες φυσιολογικές συνθήκες. Η εγγενώς πολυδιάστατη φύση αυτών των συστημάτων καθιστά απαραίτητη τη μελέτη τους μέσω ολοκληρωτικών προσεγγίσεων που συλλαμβάνουν αυτήν την πολυπλοκότητα. Η κατανόηση των περίπλοκων ρυθμιστικών μηχανισμών που καθορίζουν την έκφραση των γονιδίων είναι θεμελιώδης για τη διαλεύκανση της βιολογικής λειτουργίας και της παθολογίας των ασθενειών. Η παρούσα διατριβή παρουσιάζει ένα ολοκληρωμένο υπολογιστικό πλαίσιο για τη μελέτη των ρυθμιστικών λειτουργιών των μεταγραφών, αξιοποιώντας δεδομένα που προέρχονται από αλληλούχιση υψηλής απόδοσης, όπως παραλλαγές αλληλουχιών, ρυθμιστικές αλληλεπιδράσεις και προφίλ γονιδιακής έκφρασης στο πλαίσιο κλινικών εφαρμογών.Το πρώτο μέρος αυτής της εργασίας περιγράφει μία αυτοματοποιημένη βιοπληροφορική ροή εργασίας που αναπτύχθηκε στη γλώσσ ...
Τα βιολογικά συστήματα είναι σύνθετα συστήματα που αποτελούνται από πολλαπλά αλληλοσυνδεόμενα στοιχεία, τα οποία συνεργάζονται για να διατηρήσουν τη φυσιολογική λειτουργία του δικτύου υπό ποικίλες φυσιολογικές συνθήκες. Η εγγενώς πολυδιάστατη φύση αυτών των συστημάτων καθιστά απαραίτητη τη μελέτη τους μέσω ολοκληρωτικών προσεγγίσεων που συλλαμβάνουν αυτήν την πολυπλοκότητα. Η κατανόηση των περίπλοκων ρυθμιστικών μηχανισμών που καθορίζουν την έκφραση των γονιδίων είναι θεμελιώδης για τη διαλεύκανση της βιολογικής λειτουργίας και της παθολογίας των ασθενειών. Η παρούσα διατριβή παρουσιάζει ένα ολοκληρωμένο υπολογιστικό πλαίσιο για τη μελέτη των ρυθμιστικών λειτουργιών των μεταγραφών, αξιοποιώντας δεδομένα που προέρχονται από αλληλούχιση υψηλής απόδοσης, όπως παραλλαγές αλληλουχιών, ρυθμιστικές αλληλεπιδράσεις και προφίλ γονιδιακής έκφρασης στο πλαίσιο κλινικών εφαρμογών.Το πρώτο μέρος αυτής της εργασίας περιγράφει μία αυτοματοποιημένη βιοπληροφορική ροή εργασίας που αναπτύχθηκε στη γλώσσα προγραμματισμού R, με στόχο την αξιολόγηση της δυνητικής επίδρασης γενετικών παραλλαγών σε στοιχεία αναγνώρισης microRNA (MREs), θέσεις ματίσματος και ανοικτά πλαίσια ανάγνωσης (ORFs). Ενσωματώνοντας καθιερωμένα υπολογιστικά εργαλεία όπως το microT-CNN για την πρόβλεψη στόχων microRNA, το SpliceAI για την εκτίμηση επιπτώσεων στο μάτισμα και το ORFfinder για την αναγνώριση κωδικών περιοχών, η ροή εργασίας επιτρέπει τον αποτελεσματικό χαρακτηρισμό των επιδράσεων παραλλαγών σε μη-κωδικές και κωδικές περιοχές. Το πλαίσιο αυτό διευκολύνει την αναπαραγώγιμη ανάλυση μεγάλης κλίμακας και συμβάλλει στις συνεχιζόμενες προσπάθειες για εξατομικευμένη γονιδιωματική ιατρική, βελτιώνοντας την ερμηνευσιμότητα των κωδικών και μη-κωδικών γενετικών παραλλαγών. Το δεύτερο μέρος επικεντρώνεται στην ανάπτυξη αλγοριθμικών ροών εργασίας για την κατασκευή και την ανάλυση σύνθετων γονιδιακών ρυθμιστικών δικτύων που περιλαμβάνουν microRNAs, μεταγραφικούς παράγοντες (TFs) και τα γονίδια στόχους τους. Τα δίκτυα αυτά προσαρμόζονται στο εκάστοτε βιολογικό πλαίσιο και αναλύονται με σκοπό τον εντοπισμό βιολογικά σημαντικών τριμερών υποδικτύων, τα οποία συμμορφώνονται με καθιερωμένες ρυθμιστικές αρχές, όπως την καταστολή γονιδίων μέσω της δράσης των microRNAs ή τη ρύθμιση της έκφρασης γονιδίων από TFs. Η προσέγγιση αυτή προσφέρει βαθύτερη κατανόηση των φαινομένων απορρύθμισης που σχετίζονται με ασθένειες και υποστηρίζει τη συστηματική ιεράρχηση υποψήφιων ρυθμιστικών μηχανισμών για περαιτέρω διερεύνηση. Το τρίτο και τελευταίο μέρος αξιοποιεί μια πολυ-ομική προσέγγιση για την ανακάλυψη συνδυαστικών προγνωστικών βιοδεικτών. Συγκεκριμένα, συνδυάζει προφίλ έκφρασης microRNA που κυκλοφορούν στον ορό αίματος, αποτελέσματα εργαστηριακών αιματολογικών εξετάσεων ρουτίνας και δημογραφικά στοιχεία, προκειμένου να προβλέψει τη σοβαρότητα της νόσου COVID-19, την εισαγωγή σε ΜΕΘ και τον κίνδυνο θνησιμότητας. Μέσω στατιστικής μοντελοποίησης και εφαρμογής τεχνικών μηχανικής μάθησης, η μελέτη αναδεικνύει τη χρησιμότητα της πολυδιάστατης ενσωμάτωσης δεδομένων για τη βελτίωση της κλινικής λήψης αποφάσεων και τη βελτιστοποίηση της κατανομής πόρων στα νοσοκομεία κατά τη διάρκεια επιδημιών λοιμωδών νόσων. Συνολικά, αυτή η διατριβή προσφέρει καινοτόμα υπολογιστικά εργαλεία και αναλυτικές στρατηγικές για την αποκωδικοποίηση του ρυθμιστικού τοπίου του ανθρώπινου μεταγραφώματος. Αναδεικνύει την αξία της ολοκληρωτικής βιοπληροφορικής για την κατανόηση της ρύθμισης των γονιδίων, της λειτουργικότητας γενετικών παραλλαγών και της ανακάλυψης κλινικά σημαντικών βιοδεικτών. Στόχος της είναι να συνθέσει τα ετερογενή στοιχεία της βιολογικής ρύθμισης σε μια ενιαία και πιο ολοκληρωμένη εικόνα της κυτταρικής λειτουργίας και της νοσηρότητας.
περισσότερα
Περίληψη σε άλλη γλώσσα
Biological systems are complex systems composed of multiple interconnected components that collectively strive to maintain normal function across diverse physiological conditions. The inherently multi-modal nature of these systems necessitates their study through integrative approaches that capture this complexity. Understanding the intricate regulatory mechanisms that govern gene expression is essential in order to elucidate biological function and disease pathology. This dissertation presents an integrated computational framework to investigate transcript regulatory functions by leveraging data generated through high-throughput sequencing, such as sequence variants, regulatory interactions, and expression profiles within clinical contexts. The first part of this work outlines an automated bioinformatics pipeline developed in R, designed to assess the potential impact of genetic variants on microRNA recognition elements (MREs), splicing sites, and open reading frames (ORFs). By integr ...
Biological systems are complex systems composed of multiple interconnected components that collectively strive to maintain normal function across diverse physiological conditions. The inherently multi-modal nature of these systems necessitates their study through integrative approaches that capture this complexity. Understanding the intricate regulatory mechanisms that govern gene expression is essential in order to elucidate biological function and disease pathology. This dissertation presents an integrated computational framework to investigate transcript regulatory functions by leveraging data generated through high-throughput sequencing, such as sequence variants, regulatory interactions, and expression profiles within clinical contexts. The first part of this work outlines an automated bioinformatics pipeline developed in R, designed to assess the potential impact of genetic variants on microRNA recognition elements (MREs), splicing sites, and open reading frames (ORFs). By integrating established computational tools such as microT-CNN for target prediction, SpliceAI for splicing impact estimation, and ORFfinder for coding sequence identification, the pipeline enables efficient annotation of variant effects in non-coding and coding regions. This framework facilitates reproducible, high-throughput analysis and contributes to ongoing efforts in personalized genomic medicine by enhancing the interpretability of coding and non-coding variants. The second part focuses on the development of algorithmic workflows for constructing and analyzing complex gene regulatory networks involving microRNAs, transcription factors (TFs), and their target genes. These networks are tailored to the specific biological context under investigation and subsequently analyzed to identify biologically meaningful tripartite subnetworks that conform to established regulatory principles, such as miRNA-mediated repression of gene targets or TF-driven regulation of expression. This framework offers insights into disease-associated regulatory dysregulation and supports the systematic prioritization of candidate regulatory motifs for further investigation. The third and final project deploys a multi-omic approach to the discovery of integrated prognostic biomarkers. Specifically, it integrates serum microRNA expression profiles, routine clinical laboratory measurements, and demographic variables to predict COVID-19 disease severity, ICU admission, and mortality risk. Through the application of statistical modeling and machine learning techniques, the study highlights the predictive utility of multi-modal data integration for improving clinical decision-making and optimizing resource allocation in hospitals during infectious disease outbreaks. Collectively, this dissertation offers novel computational tools and analytical strategies for deciphering the regulatory landscape of the human transcriptome. It underscores the value of integrative bioinformatics in advancing our understanding of gene regulation, variant functionality, and clinically relevant biomarker discovery. By doing so, it aims to assemble heterogeneous elements of biological regulation into a more unified and comprehensive picture of cellular function and disease.
περισσότερα