Περίληψη
Το κεντρικό δόγμα της Βιολογίας συνοψίζει τη ροή της γενετικής πληροφορίας από το δεοξυριβονουκλεϊκό οξύ (DNA) προς το ριβονουκλεϊκό οξύ (RNA) προς τις πρωτεΐνες. Αρχικές εκτιμήσεις ανέφεραν πως μόλις 1% του ανθρώπινου γονιδιώματος κωδικοποιεί πρωτεΐνες ενώ το υπόλοιπο χαρακτηρίζεται ως «άχρηστο» DNA. Κατά τη διάρκεια της τελευταίας δεκαετίας, η εμφάνιση καινοτόμων πειραματικών μεθοδολογιών επέτρεψε τη συνεχόμενη αύξηση του αριθμού των μελετών που αποκαλύπτουν νέα στοιχεία και αποσαφηνίζουν σκοτεινά σημεία γύρω από το κεντρικό δόγμα της Βιολογίας. Πρόσφατες εκτιμήσεις υπολογίζουν πως 3% του ανθρώπινου γονιδιώματος κωδικοποιεί πρωτεΐνες, 62% μεταγράφει μη-κωδικά RNA ενώ το 80% συμμετέχει σε μία τουλάχιστον βιοχημική διεργασία. Τα παραπάνω ευρήματα υποδεικνύουν ότι το RNA και ειδικότερα τα μη-κωδικά RNA αποτελούν αναπόσπαστο κομμάτι της κυτταρικής λειτουργίας και ο ρόλος τους μένει να αποσαφηνιστεί. Παραδοσιακά, η έννοια μη-κωδικό RNA χρησιμοποιείται σαν όρος ομπρέλα για πληθώρα μορίων π ...
Το κεντρικό δόγμα της Βιολογίας συνοψίζει τη ροή της γενετικής πληροφορίας από το δεοξυριβονουκλεϊκό οξύ (DNA) προς το ριβονουκλεϊκό οξύ (RNA) προς τις πρωτεΐνες. Αρχικές εκτιμήσεις ανέφεραν πως μόλις 1% του ανθρώπινου γονιδιώματος κωδικοποιεί πρωτεΐνες ενώ το υπόλοιπο χαρακτηρίζεται ως «άχρηστο» DNA. Κατά τη διάρκεια της τελευταίας δεκαετίας, η εμφάνιση καινοτόμων πειραματικών μεθοδολογιών επέτρεψε τη συνεχόμενη αύξηση του αριθμού των μελετών που αποκαλύπτουν νέα στοιχεία και αποσαφηνίζουν σκοτεινά σημεία γύρω από το κεντρικό δόγμα της Βιολογίας. Πρόσφατες εκτιμήσεις υπολογίζουν πως 3% του ανθρώπινου γονιδιώματος κωδικοποιεί πρωτεΐνες, 62% μεταγράφει μη-κωδικά RNA ενώ το 80% συμμετέχει σε μία τουλάχιστον βιοχημική διεργασία. Τα παραπάνω ευρήματα υποδεικνύουν ότι το RNA και ειδικότερα τα μη-κωδικά RNA αποτελούν αναπόσπαστο κομμάτι της κυτταρικής λειτουργίας και ο ρόλος τους μένει να αποσαφηνιστεί. Παραδοσιακά, η έννοια μη-κωδικό RNA χρησιμοποιείται σαν όρος ομπρέλα για πληθώρα μορίων που κατηγοριοποιούνται σε υποοικογένειες με βάση το μήκος τους. Μη-κωδικά RNA μικρότερα των 200 νουκλεοτιδίων γενικά ονομάζονται μικρά RNAs ενώ τα υπόλοιπα αποτελούν το υποείδος των μακρών μη-κωδικών RNA. Τα microRNA (miRNA), τα οποία ανακαλύφθηκαν το 1993 και στα οποία εστιάζει η παρούσα διδακτορική διατριβή, είναι μικρά μόρια RNA, μήκους περίπου 22 νουκλεοτιδίων, που ρυθμίζουν μετά-μεταφραστικά την έκφραση των γονιδίων είτε εμποδίζοντας τη σύνθεση των πρωτεϊνών ή οδηγώντας το αγγελιοφόρο RNA σε αποδόμηση. Από το 2001 που επιβεβαιώθηκε η ευρύτητα της έκφρασής τους στα κύτταρα και έπειτα, σημειώθηκε έκρηξη στον αριθμό (περισσότερες από 40,000 – Σεπτέμβρης 2015) των δημοσιεύσεων που σχετίζονται με την έρευνα των miRNAs. Αυτό οδήγησε σε σημαντικές ανακαλύψεις σχετικά με τον μηχανισμό ωρίμανσης και δράσης των miRNAs καθώς και στον τρόπο που εμπλέκονται στις ασθένειες. Παρόλα αυτά, υπάρχουν ακόμα ανοικτά ερωτήματα που σχετίζονται με τις διεργασίες και τους παράγοντες που ελέγχουν την έκφρασή τους. Αυτό οφείλεται στο ένζυμο Drosha το οποίο προκαλεί ταχύτατη αποδόμηση των πρώιμων μετάγραφων RNA, από τα οποία παράγονται τα miRNA, εμποδίζοντας την ανίχνευση των γονιδίων τους με συμβατικές πειραματικές τεχνολογίες. Στόχος της παρούσας Διδακτορικής διατριβής αποτελεί η σχεδίαση ενός αλγορίθμου κατάλληλου για τη δημιουργία ενός ακριβούς και υψηλής ανάλυσης χάρτη θέσεων έναρξης μεταγραφής miRNA γονιδίων. Ο στόχος αυτός επετεύχθη με την υλοποίηση του microTSS, ενός αλγορίθμου που συνδυάζει Μηχανική Μάθηση και δεδομένα Αλληλούχισης Επόμενης Γενιάς και παρέχει ακριβείς και υψηλής ανάλυσης προβλέψεις θέσεων έναρξης μεταγραφής miRNA γονιδίων. Η αξιολόγηση του αλγορίθμου επετεύχθη με την αξιοποίηση ενός ζωικού μοντέλου (μυς) από το οποίο αφαιρέθηκε το γονίδιο Drosha επιτρέποντας την ανίχνευση των πρώιμων μετάγραφων των miRNA γονιδίων με τεχνικές αλληλούχισης RNA. Κατά τη διάρκεια των Διδακτορικών μου σπουδών, συμμετείχα σε έξι ακόμα δημοσιεύσεις μελετών που περιγράφουν εργαλεία και υπολογιστικές τεχνικές που δρουν συμπληρωματικά στον αλγόριθμο microTSS και διευκολύνουν με πολύπλευρο τρόπο την έρευνα που σχετίζεται με τα miRNA. Όλες οι μέθοδοι είναι εφαρμόσιμοι σε πληθώρα ιστών, κυτταρικών σειρών και οργανισμών και μπορούν να αξιοποιηθούν μεμονωμένα ή συνδυαστικά ανάλογα με το πλαίσιο της εκάστοτε μελέτης. Η ανίχνευση διαφορών, ανάμεσα σε φυσιολογικές και παθολογικές καταστάσεις, που αφορούν στη ρύθμιση της έκφρασης των miRNA και των στόχων τους δύναται να εγκαινιάσει μια νέα εποχή στην Βιολογία επαναπροσδιορίζοντας το ρόλο των σημαντικών αυτών μορίων στο ευρύτερο πλαίσιο των δικτύων γονιδιακής έκφρασης.
περισσότερα
Περίληψη σε άλλη γλώσσα
The central dogma of Biology summarizes the flow of genetic information from deoxyribonucleic acid (DNA) to ribonucleic acid (RNA) to proteins. Early estimations considered that only 1% of the human genome encodes proteins while the rest constitutes “junk” DNA. During the last decade and due to the invention of novel experimental methodologies and platforms there has been an increasing number of publications that continuously remove the obscurity surrounding the central dogma of Biology. Recent estimations consider that 3% of the human genome encodes proteins, 62% transcribes functional non-coding RNA (ncRNA) elements and approximately 80% participates in at least one biochemical event. These findings suggest that RNA and especially the class of ncRNAs constitutes an integral part of every cellular process and its “elusive” role remains to be unveiled. Traditionally, the concept of ncRNAs has been utilized as a blanket term for a wide range of molecules which have initially been catego ...
The central dogma of Biology summarizes the flow of genetic information from deoxyribonucleic acid (DNA) to ribonucleic acid (RNA) to proteins. Early estimations considered that only 1% of the human genome encodes proteins while the rest constitutes “junk” DNA. During the last decade and due to the invention of novel experimental methodologies and platforms there has been an increasing number of publications that continuously remove the obscurity surrounding the central dogma of Biology. Recent estimations consider that 3% of the human genome encodes proteins, 62% transcribes functional non-coding RNA (ncRNA) elements and approximately 80% participates in at least one biochemical event. These findings suggest that RNA and especially the class of ncRNAs constitutes an integral part of every cellular process and its “elusive” role remains to be unveiled. Traditionally, the concept of ncRNAs has been utilized as a blanket term for a wide range of molecules which have initially been categorized into subfamilies based on their size. NcRNAs shorter than 200 nucleotides (nts) are generally termed small RNAs while the rest constitute the long non-coding RNA (lncRNA) subspecies. MicroRNAs (miRNAs), which were first discovered in 1993 and are the main focus of this dissertation, are single stranded RNA (ssRNA) molecules (~22 nts) that post-transcriptionally regulate gene expression by translation suppression and/or messenger RNA (mRNA) degradation. Since the discovery of their abundant transcription in 2001 there has been an explosion of miRNA-related publications, estimated to exceed 40,000 (Sep 2015). Even though there have been substantial breakthroughs in research related to miRNA biogenesis, function and disease implication, there are still open questions regarding their expression regulation due to the rapid processing and degradation of their primary transcripts (pri-miRNAs) in the nucleus by Drosha enzyme. Aim of my Doctoral studies was to design an algorithm and implement it into a robust computational framework that would facilitate the assembly of a genome-wide, accurate and high-resolution map of miRNA transcription start sites (TSS). This goal has been achieved by developing microTSS, an algorithm that combines Machine Learning andNext Generation Sequencing (NGS) data in order to provide highly accurate, single nucleotide resolution predictions for miRNA gene TSSs. MicroTSS integrates RNA Sequencing data with active transcription marks derived from chromatin immunoprecipitation (ChIP) and DNase Sequencing and enables the characterization of tissue-specific miRNA TSSs. MicroTSS was validated with RNA Sequencing data derived from a Drosha null/conditional-null mouse model specifically designed for this purpose and generated using the conditional by inversion (COIN) methodology. During the course of my Doctoral studies, I participated in six publications that provide robust computational methods, able to complement microTSS and facilitate every aspect of miRNA-related research. The implemented algorithms are readily applicable to a variety of cell lines or organisms and they can be utilized separately or combined, depending on the study setting. The identification of differences in miRNA expression regulation as well as the target repertoire between pathological and physiological conditions, cell types and species, could inaugurate a new era for the elucidation of miRNA expression and function, redefining their role into the wider context of biological networks and pathways.
περισσότερα