Περίληψη
Η ακριβής ‘αντιστοίχιση ζευγών βάσεων’ σε μόρια RNA, που οδηγεί στην πρόβλεψητων δευτεροταγών δομών του RNA, είναι ζωτικής σημασίας για την εξήγηση άγνωστων βιολογικών λειτουργιών. Πρόσφατα, ο COVID-19, μια ευρέως διαδεδομένη ασθένεια, προκάλεσε πολλούς θανάτους, επηρεάζοντας την ανθρωπότητα με ασύλληπτο τρόπο. Ο SARS-CoV-2, ένας ιός μονόκλωνου RNA, απέδειξε τη σπουδαιότητα της ανάλυσης αυτών των μορίων και των δομών τους. Αυτή η διατριβή στοχεύει στο να δημιουργήσει ένα σύνολο σύγχρονων εργαλείων στην κατεύθυνση της πρόβλεψης συγκεκριμένων δομών RNA, με χρήση τεχνικών συντακτικής αναγνώρισης προτύπων. Πιο συγκεκριμένα, στοχεύει να συμβάλει σε αυτό το πεδίο εισάγοντας ένα σύνολο καινοτόμων συστημάτων που αποσκοπούν στην πρόβλεψη μοτίβων δευτεροταγούς δομής RNA γνωστών ως ψευδοκόμβων RNA, με τη χρήση τεχνικών συντακτικής αναγνώρισης προτύπων και των έννοιων του μέγιστου πλήθους ζευγών βάσεων και της ελάχιστης ελεύθερης ενέργειας. Έχοντας επικεντρωθεί στις προβλέψεις ψευδοκόμβων, οι προτ ...
Η ακριβής ‘αντιστοίχιση ζευγών βάσεων’ σε μόρια RNA, που οδηγεί στην πρόβλεψητων δευτεροταγών δομών του RNA, είναι ζωτικής σημασίας για την εξήγηση άγνωστων βιολογικών λειτουργιών. Πρόσφατα, ο COVID-19, μια ευρέως διαδεδομένη ασθένεια, προκάλεσε πολλούς θανάτους, επηρεάζοντας την ανθρωπότητα με ασύλληπτο τρόπο. Ο SARS-CoV-2, ένας ιός μονόκλωνου RNA, απέδειξε τη σπουδαιότητα της ανάλυσης αυτών των μορίων και των δομών τους. Αυτή η διατριβή στοχεύει στο να δημιουργήσει ένα σύνολο σύγχρονων εργαλείων στην κατεύθυνση της πρόβλεψης συγκεκριμένων δομών RNA, με χρήση τεχνικών συντακτικής αναγνώρισης προτύπων. Πιο συγκεκριμένα, στοχεύει να συμβάλει σε αυτό το πεδίο εισάγοντας ένα σύνολο καινοτόμων συστημάτων που αποσκοπούν στην πρόβλεψη μοτίβων δευτεροταγούς δομής RNA γνωστών ως ψευδοκόμβων RNA, με τη χρήση τεχνικών συντακτικής αναγνώρισης προτύπων και των έννοιων του μέγιστου πλήθους ζευγών βάσεων και της ελάχιστης ελεύθερης ενέργειας. Έχοντας επικεντρωθεί στις προβλέψεις ψευδοκόμβων, οι προτεινόμενες μεθοδολογίες διαμορφώνουν την πρόβλεψη της δευτεροταγούς δομής του RNA ως ένα πρόβλημα ανάλυσης και, δευτερευόντως, ως ένα πρόβλημα βελτιστοποίησης. Το πρώτο σύστημα που αναπτύχθηκε, το Knotify, αντιμετωπίζειτο πρόβλημα της πρόβλεψης ψευδοκόμβων πρώτης τάξης (τύπου Η). Εισάγει μια γραμματική χωρίς συμφραζόμενα (CFG) που επιτρέπει την αναγνώριση πιθανών προτύπων ψευδοκόμβων. Το Knotify παρουσιάζει μια παρόμοια ικανότητα πρόβλεψης με τα πιο σύγχρονα συστήματα αναγνώρισης της δευτεροταγούς δομής του RNA, αλλά είναι πολύ πιο αποδοτικό όσον αφορά τον χρόνο εκτέλεσης. Στη συνέχεια, παρουσιάζεται μια βελτιστοποιημένη έκδοση αυτού, κατά την οποία χρησιμοποιείται μια τεχνική κλαδέματος συντακτικών δένδρων, για περαιτέρω περιορισμό του χρόνου εκτέλεσης. Για την πρόβλεψη πιο περίπλοκων προτύπων ψευδοκόμβων τύπου Η, αναπτύχθηκε το σύστημα Knotify+, το οποίο αντιμετωπίζει το πρόβλημα της πρόβλεψης ψευδοκόμβων τύπου Η, συμπεριλαμβάνοντας ασύμμετρους βρόχους/εξογκώματα (bulges) και εσωτερικούς βρόχους (internal loops), εκμεταλλευόμενο τη δύναμη της γραμματικής χωρίς συμφραζόμενα (CFG). Βασίζεται στο Knotify, αλλά ενισχύει την εκφραστικότητά του αναζητώντας πιο πολύπλοκα πρότυπα στους βρόχους του ψευδοκόμβου. Τέλος, μεστόχο την πρόβλεψη ενός σπάνιου, αλλά περίπλοκου τύπου ψευδοκόμβου, του ψευδοκόμβου τύπου L, παρουσιάζεται επίσης ένα νέο σύστημα βασισμένο σε γραμματική χωρίς συμφραζόμενα που αποδεικνύεται αποτελεσματικό στην πρόβλεψη και τον χρόνο εκτέλεσης σε σύγκριση με άλλα σύγχρονα συστήματα. Αυτά τα καινοτόμα συστήματα και οι ανάλογες αρχιτεκτονικές στοχεύουν στην ενίσχυση των δυνατοτήτων των βιολόγων στην πρόβλεψη μοτίβων RNA, με έμφαση στις διαφορετικές κατηγορίες ψευδοκόμβων. Έχουν τη δυνατότητα εφαρμογής σε διάφορους βιολογικούς τομείς, όπως η γονιδιακή θεραπεία, η σχεδίαση φαρμάκων και η κατανόηση της λειτουργίας του RNA. Επιπλέον, αυτές οι προσεγγίσεις μπορούν να συνδυαστούν με άλλες μεθοδολογίες για να βελτιώσουν την ακρίβεια της πρόβλεψης της δομής του RNA. Οι πηγαίοι κώδικες του Knotify, Knotify+, του συστήματος πρόβλεψης τύπου L και οι λεπτομέρειες υλοποίησης είναι διαθέσιμοι στο διαδίκτυο σε αποθετήρια του GitHub για την αξιοποίησή τους από την κοινότητα, με σκοπό την υποστήριξη και την ενθάρρυνση αυτής της πρωτοβουλίας.
περισσότερα
Περίληψη σε άλλη γλώσσα
Accurate "base pairing" in RNA molecules, which is an essential task in order to predict RNA secondary structures, plays a crucial role in explaining unknown biological processes. The COVID-19 pandemic, a widespread disease, has had a devastating impact on humanity in recent years. This extreme condition enhances the significance of analyzing RNA molecules, and their structures have been highlighted by SARS-CoV-2, a single-stranded RNA virus that causes COVID-19 disease. This thesis aims to develop a pioneering set of frameworks that leverage syntactic pattern recognition to predict specific RNA structures. Specifically, it focuses on introducing novel systems for predicting RNA secondary structure patterns including pseudoknots, utilizing syntactic pattern-recognition strategies, and concepts such as maximum base pairing and minimum free energy. By primarily treating pseudoknot predictions as parsing and optimization problems, the proposed methodologies formalize the prediction of RNA ...
Accurate "base pairing" in RNA molecules, which is an essential task in order to predict RNA secondary structures, plays a crucial role in explaining unknown biological processes. The COVID-19 pandemic, a widespread disease, has had a devastating impact on humanity in recent years. This extreme condition enhances the significance of analyzing RNA molecules, and their structures have been highlighted by SARS-CoV-2, a single-stranded RNA virus that causes COVID-19 disease. This thesis aims to develop a pioneering set of frameworks that leverage syntactic pattern recognition to predict specific RNA structures. Specifically, it focuses on introducing novel systems for predicting RNA secondary structure patterns including pseudoknots, utilizing syntactic pattern-recognition strategies, and concepts such as maximum base pairing and minimum free energy. By primarily treating pseudoknot predictions as parsing and optimization problems, the proposed methodologies formalize the prediction of RNA secondary structures. The first developed framework, called Knotify, addresses the prediction of first-order pseudoknots (H-type). It introduces a context-free grammar (CFG) capable of recognizing potential pseudoknot patterns. Knotify exhibits prediction capabilities similar to state-of-the-art frameworks but significantly outperforms them in terms of execution time efficiency. An optimized version of Knotify is also presented, utilizing pruning techniques for further efficiency gains. To predict more complex patterns of H-type pseudoknots, Knotify+ introduced, which extends the power of CFG by searching for intricate patterns in the pseudoknot’s loops such as bulges and internal loops, while incorporating the advantages of maximum base pairing and minimum free energy. Knotify+ demonstrates superior accuracy in predicting core stems compared to existing frameworks. It performs exceptionally well in small sequences and maintains a comparable accuracy rate in larger ones, all while requiring shorter execution times than well-known platforms. Finally, a new grammar-based system is presented to address the prediction of a rare but complex type of pseudoknot, the L-type pseudoknot, that proves effective in prediction and execution time when compared to other novel systems. These innovative systems and architectures aim to improve the ability of biologists to predict RNA motifs, including pseudoknots. They hold the potential for application in various biological domains, such as gene therapy, drug design, and understanding RNA functionality. Moreover, these approaches can be combined with other methodologies to improve the precision of RNA structure prediction. To support this initiative, the Knotify, Knotify+, L-type prediction framework source codes and implementation details are available online as public repositories on GitHub.
περισσότερα