Pattern recognition for non-coding RNA promoters

Το κεντρικό δόγμα της Βιολογίας συνοψίζει τη ροή της γενετικής πληροφορίας από το δεοξυριβονουκλεϊκό οξύ (DNA) προς το ριβονουκλεϊκό οξύ (RNA) προς τις πρωτεΐνες. Αρχικές εκτιμήσεις ανέφεραν πως μόλις 1% του ανθρώπινου γονιδιώματος κωδικοποιεί πρωτεΐνες ενώ το υπόλοιπο χαρακτηρίζεται ως «άχρηστο» DNA. Κατά τη διάρκεια της τελευταίας δεκαετίας, η εμφάνιση καινοτόμων πειραματικών μεθοδολογιών επέτρεψε τη συνεχόμενη αύξηση του αριθμού των μελετών που αποκαλύπτουν νέα στοιχεία και αποσαφηνίζουν σκοτεινά σημεία γύρω από το κεντρικό δόγμα της Βιολογίας. Πρόσφατες εκτιμήσεις υπολογίζουν πως 3% του ανθρώπινου γονιδιώματος κωδικοποιεί πρωτεΐνες, 62% μεταγράφει μη-κωδικά RNA ενώ το 80% συμμετέχει σε μία τουλάχιστον βιοχημική διεργασία. Τα παραπάνω ευρήματα υποδεικνύουν ότι το RNA και ειδικότερα τα μη-κωδικά RNA αποτελούν αναπόσπαστο κομμάτι της κυτταρικής λειτουργίας και ο ρόλος τους μένει να αποσαφηνιστεί. Παραδοσιακά, η έννοια μη-κωδικό RNA χρησιμοποιείται σαν όρος ομπρέλα για πληθώρα μορίων που κατηγοριοποιούνται σε υποοικογένειες με βάση το μήκος τους. Μη-κωδικά RNA μικρότερα των 200 νουκλεοτιδίων γενικά ονομάζονται μικρά RNAs ενώ τα υπόλοιπα αποτελούν το υποείδος των μακρών μη-κωδικών RNA. Τα microRNA (miRNA), τα οποία ανακαλύφθηκαν το 1993 και στα οποία εστιάζει η παρούσα διδακτορική διατριβή, είναι μικρά μόρια RNA, μήκους περίπου 22 νουκλεοτιδίων, που ρυθμίζουν μετά-μεταφραστικά την έκφραση των γονιδίων είτε εμποδίζοντας τη σύνθεση των πρωτεϊνών ή οδηγώντας το αγγελιοφόρο RNA σε αποδόμηση. Από το 2001 που επιβεβαιώθηκε η ευρύτητα της έκφρασής τους στα κύτταρα και έπειτα, σημειώθηκε έκρηξη στον αριθμό (περισσότερες από 40,000 – Σεπτέμβρης 2015) των δημοσιεύσεων που σχετίζονται με την έρευνα των miRNAs. Αυτό οδήγησε σε σημαντικές ανακαλύψεις σχετικά με τον μηχανισμό ωρίμανσης και δράσης των miRNAs καθώς και στον τρόπο που εμπλέκονται στις ασθένειες. Παρόλα αυτά, υπάρχουν ακόμα ανοικτά ερωτήματα που σχετίζονται με τις διεργασίες και τους παράγοντες που ελέγχουν την έκφρασή τους. Αυτό οφείλεται στο ένζυμο Drosha το οποίο προκαλεί ταχύτατη αποδόμηση των πρώιμων μετάγραφων RNA, από τα οποία παράγονται τα miRNA, εμποδίζοντας την ανίχνευση των γονιδίων τους με συμβατικές πειραματικές τεχνολογίες. Στόχος της παρούσας Διδακτορικής διατριβής αποτελεί η σχεδίαση ενός αλγορίθμου κατάλληλου για τη δημιουργία ενός ακριβούς και υψηλής ανάλυσης χάρτη θέσεων έναρξης μεταγραφής miRNA γονιδίων. Ο στόχος αυτός επετεύχθη με την υλοποίηση του microTSS, ενός αλγορίθμου που συνδυάζει Μηχανική Μάθηση και δεδομένα Αλληλούχισης Επόμενης Γενιάς και παρέχει ακριβείς και υψηλής ανάλυσης προβλέψεις θέσεων έναρξης μεταγραφής miRNA γονιδίων. Η αξιολόγηση του αλγορίθμου επετεύχθη με την αξιοποίηση ενός ζωικού μοντέλου (μυς) από το οποίο αφαιρέθηκε το γονίδιο Drosha επιτρέποντας την ανίχνευση των πρώιμων μετάγραφων των miRNA γονιδίων με τεχνικές αλληλούχισης RNA. Κατά τη διάρκεια των Διδακτορικών μου σπουδών, συμμετείχα σε έξι ακόμα δημοσιεύσεις μελετών που περιγράφουν εργαλεία και υπολογιστικές τεχνικές που δρουν συμπληρωματικά στον αλγόριθμο microTSS και διευκολύνουν με πολύπλευρο τρόπο την έρευνα που σχετίζεται με τα miRNA. Όλες οι μέθοδοι είναι εφαρμόσιμοι σε πληθώρα ιστών, κυτταρικών σειρών και οργανισμών και μπορούν να αξιοποιηθούν μεμονωμένα ή συνδυαστικά ανάλογα με το πλαίσιο της εκάστοτε μελέτης. Η ανίχνευση διαφορών, ανάμεσα σε φυσιολογικές και παθολογικές καταστάσεις, που αφορούν στη ρύθμιση της έκφρασης των miRNA και των στόχων τους δύναται να εγκαινιάσει μια νέα εποχή στην Βιολογία επαναπροσδιορίζοντας το ρόλο των σημαντικών αυτών μορίων στο ευρύτερο πλαίσιο των δικτύων γονιδιακής έκφρασης.

περισσότερα

Περίληψη σε άλλη γλώσσα

The central dogma of Biology summarizes the flow of genetic information from deoxyribonucleic acid (DNA) to ribonucleic acid (RNA) to proteins. Early estimations considered that only 1% of the human genome encodes proteins while the rest constitutes “junk” DNA. During the last decade and due to the invention of novel experimental methodologies and platforms there has been an increasing number of publications that continuously remove the obscurity surrounding the central dogma of Biology. Recent estimations consider that 3% of the human genome encodes proteins, 62% transcribes functional non-coding RNA (ncRNA) elements and approximately 80% participates in at least one biochemical event. These findings suggest that RNA and especially the class of ncRNAs constitutes an integral part of every cellular process and its “elusive” role remains to be unveiled. Traditionally, the concept of ncRNAs has been utilized as a blanket term for a wide range of molecules which have initially been categorized into subfamilies based on their size. NcRNAs shorter than 200 nucleotides (nts) are generally termed small RNAs while the rest constitute the long non-coding RNA (lncRNA) subspecies. MicroRNAs (miRNAs), which were first discovered in 1993 and are the main focus of this dissertation, are single stranded RNA (ssRNA) molecules (~22 nts) that post-transcriptionally regulate gene expression by translation suppression and/or messenger RNA (mRNA) degradation. Since the discovery of their abundant transcription in 2001 there has been an explosion of miRNA-related publications, estimated to exceed 40,000 (Sep 2015). Even though there have been substantial breakthroughs in research related to miRNA biogenesis, function and disease implication, there are still open questions regarding their expression regulation due to the rapid processing and degradation of their primary transcripts (pri-miRNAs) in the nucleus by Drosha enzyme. Aim of my Doctoral studies was to design an algorithm and implement it into a robust computational framework that would facilitate the assembly of a genome-wide, accurate and high-resolution map of miRNA transcription start sites (TSS). This goal has been achieved by developing microTSS, an algorithm that combines Machine Learning andNext Generation Sequencing (NGS) data in order to provide highly accurate, single nucleotide resolution predictions for miRNA gene TSSs. MicroTSS integrates RNA Sequencing data with active transcription marks derived from chromatin immunoprecipitation (ChIP) and DNase Sequencing and enables the characterization of tissue-specific miRNA TSSs. MicroTSS was validated with RNA Sequencing data derived from a Drosha null/conditional-null mouse model specifically designed for this purpose and generated using the conditional by inversion (COIN) methodology. During the course of my Doctoral studies, I participated in six publications that provide robust computational methods, able to complement microTSS and facilitate every aspect of miRNA-related research. The implemented algorithms are readily applicable to a variety of cell lines or organisms and they can be utilized separately or combined, depending on the study setting. The identification of differences in miRNA expression regulation as well as the target repertoire between pathological and physiological conditions, cell types and species, could inaugurate a new era for the elucidation of miRNA expression and function, redefining their role into the wider context of biological networks and pathways.

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (4.06 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/38245
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/38245
ND	38245
Εναλλακτικός τίτλος	Pattern recognition for non-coding RNA promoters
Συγγραφέας	Γεωργακίλας, Γεώργιος (Πατρώνυμο: Κωνσταντίνος)
Ημερομηνία	2015
Ίδρυμα	Πανεπιστήμιο Θεσσαλίας. Σχολή Πολυτεχνική. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Ηλεκτρονικών Υπολογιστών
Εξεταστική επιτροπή	Χατζηγεωργίου Άρτεμις Χούστης Ηλίας Χούστη Αικατερίνη Βάβαλης Εμμανουήλ Σταμούλης Γεώργιος Ποταμιάνος Γεράσιμος Μούντανος Ιωάννης
Επιστημονικό πεδίο	Επιστήμες Μηχανικού και Τεχνολογία ➨ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά	Υποκινητές μη-κωδικών RNA; Μικρά RNA; Μηχανική μάθηση; Αλληλούχιση επόμενης γενιάς; Υποκινητές
Χώρα	Ελλάδα
Γλώσσα	Αγγλικά
Άλλα στοιχεία	137 σ., πιν., σχημ., γραφ.

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

Ανακάλυψη γνώσης από ακολουθίες και δεδομένα συναλλαγών

Statistical methodology for the analysis of genomic data

Μηχανική μάθηση για την ανάλυση μεγάλων βιολογικών δεδομένων

Μέθοδοι βιοπληροφορικής, υπολογιστικής συστημικής βιολογίας και μηχανικής μάθησης, εφαρμοσμένες στην in silico ογκολογία

Ανακάλυψη γνώσης απο βιολογικά δεδομένα

Ανάπτυξη ενοποιημένων τεχνικών διαχείρισης και επεξεργασίας βιολογικών δεδομένων με εφαρμογές στη μελέτη της γονιδιακής έκφρασης

Ανάλυση, σχεδιασμός και υλοποίηση αλγορίθμων υπολογιστικής νοημοσύνης στη βιοϊατρική και τη βιοπληροφορική

Modeling brain disorders using neuroinformatics in cellular physiology

Η ΕΓΚΑΙΡΗ ΔΙΑΓΝΩΣΗ ΤΗΣ ΕΓΚΕΦΑΛΙΚΗΣ ΑΙΜΟΡΡΑΓΙΑΣ ΣΕ ΠΡΟΩΡΑ ΝΕΟΓΝΑ ΜΕ ΥΠΕΡΗΧΟΥΣ

Ανάπτυξη συστημάτων τεχνητής νοημοσύνης για την υποβοήθηση διαφορικής διάγνωσης νόσων εγκεφάλου με χρήση μαγνητικής φασματοσκοπίας και τεχνικών διάχυσης και αιμάτωσης σε υψηλό πεδίο 3T

"Αναγνώριση μοτίβων για υποκινητές μη-κωδικών RNA"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της .