Περίληψη
Οι ιοί αποτελούν τις πιο άφθονες και ποικιλόμορφες βιολογικές οντότητες στη Γη, ακροβατώντας στα όρια μεταξύ του έμβιου και του άβιου, ενώ λειτουργούν ως βαθιές κινητήριες δυνάμεις της εξέλιξης, αλλά και ως υπαίτιοι παράγοντες παγκόσμιων ασθενειών. Ενώ η παραδοσιακή ιολογία περιοριζόταν για μεγάλο χρονικό διάστημα από μεθόδους που εξαρτώνταν σε κυτταροκαλλιέργειες ιών, η εμφάνιση της Αλληλούχισης Επόμενης Γενιάς (Next-Generation Sequencing - NGS) στις αρχές του 21ου αιώνα έφερε επανάσταση στον τομέα μέσω της ιικής μεταγονιδιωματικής. Αυτή η αμερόληπτη ολιστική προσέγγιση, ανεξάρτητη από δοκιμές κυτταροκαλλιέργειας ιών, επιτρέπει την ανάκτηση του συνολικού ιικού φορτίου—του ιώματος (virome)— απευθείας από βιολογικά δείγματα. Εντός αυτού του ευρύτερου πλαισίου, η μεταγονιδιωματική των RNA ιών (ή μετα-μεταγραφωματική) έχει καταστεί ολοένα και πιο κρίσιμη και συχνά προτιμάται έναντι στρατηγικών που βασίζονται στο DNA, καθώς οι RNA ιοί αποτελούν τα κυρίαρχα παθογόνα και συμβιωτικά στοιχεία ...
Οι ιοί αποτελούν τις πιο άφθονες και ποικιλόμορφες βιολογικές οντότητες στη Γη, ακροβατώντας στα όρια μεταξύ του έμβιου και του άβιου, ενώ λειτουργούν ως βαθιές κινητήριες δυνάμεις της εξέλιξης, αλλά και ως υπαίτιοι παράγοντες παγκόσμιων ασθενειών. Ενώ η παραδοσιακή ιολογία περιοριζόταν για μεγάλο χρονικό διάστημα από μεθόδους που εξαρτώνταν σε κυτταροκαλλιέργειες ιών, η εμφάνιση της Αλληλούχισης Επόμενης Γενιάς (Next-Generation Sequencing - NGS) στις αρχές του 21ου αιώνα έφερε επανάσταση στον τομέα μέσω της ιικής μεταγονιδιωματικής. Αυτή η αμερόληπτη ολιστική προσέγγιση, ανεξάρτητη από δοκιμές κυτταροκαλλιέργειας ιών, επιτρέπει την ανάκτηση του συνολικού ιικού φορτίου—του ιώματος (virome)— απευθείας από βιολογικά δείγματα. Εντός αυτού του ευρύτερου πλαισίου, η μεταγονιδιωματική των RNA ιών (ή μετα-μεταγραφωματική) έχει καταστεί ολοένα και πιο κρίσιμη και συχνά προτιμάται έναντι στρατηγικών που βασίζονται στο DNA, καθώς οι RNA ιοί αποτελούν τα κυρίαρχα παθογόνα και συμβιωτικά στοιχεία των ευκαρυωτικών ξενιστών, οδηγώντας την ταχεία εξέλιξη, τη ρύθμιση των οικοσυστημάτων και τη δυναμική των παγκόσμιων ασθενειών. Δεδομένου ότι τα αιματοφάγα αρθρόποδα έντομα λειτουργούν ως πρωταρχικές δεξαμενές και φορείς για την πλειονότητα αυτών των RNA ιών, ο χαρακτηρισμός του ιώματός τους είναι απαραίτητος για την πρόβλεψη αναδυόμενων απειλών. Ωστόσο, οι τρέχουσες προσεγγίσεις —που συχνά περιορίζονται σε μελέτες ενός είδους ή σε δεξαμενές μικτών ταξινομικών ομάδων— στερούνται της διακριτικής ικανότητας να καθορίσουν με σαφήνεια το πολύπλοκο δίκτυο αλληλεπίδρασης ιών-φορέων ενός εξεταζόμενου οικοσυστήματος. Αντιμετωπίζοντας αυτόν τον περιορισμό υπό το πλαίσιο της «Ενιαίας Υγείας» (One Health), η παρούσα μελέτη προτείνει και θέτει σε εφαρμογή μια ολιστική προσέγγιση επιτήρησης για την αναγνώριση της ζωτικής διασύνδεσης μεταξύ της ανθρώπινης, ζωικής και περιβαλλοντικής υγείας. Πραγματοποιήσαμε έναν ολοκληρωμένο χαρακτηρισμό των RNA ιωμάτων που καλύπτουν 24 είδη κουνουπιών και 10 είδη σκνιπών (Culicoides) από το οικοσύστημα Ανατολικής Μακεδονίας και Θράκης της Ελλάδας — μια στρατηγική βιογεωγραφική πύλη για την ανταλλαγή ιών μεταξύ Ασίας και Ευρώπης. Η έρευνα αυτή ταυτοποίησε συνολικά 48 ιικά είδη, εκ των οποίων τα 29 είναι νέα, και απέδειξε ότι οι πληθυσμοί ξενιστών διατηρούν ποιοτικά και ποσοτικά σταθερούς «ιικούς πυρήνες» (core viromes), χαρτογραφώντας έτσι με επιτυχία το προηγουμένως ασαφές γεωχωρικό δίκτυο αλληλεπιδράσεων ιών-φορέων. Αν και οι προσεγγίσεις NGS έχουν φέρει επανάσταση στην ιολογία, η μεταγονιδιωματική των RNA ιών παραμένει σε μεγάλο βαθμό εξαρτώμενη από τη λεγόμενη Δεύτερη Γενιά ή Αλληλούχιση Μικρών Αναγνώσεων (Short-Read Sequencing - SRS) λόγω της καθιερωμένης ακρίβειας και της οικονομικής αποδοτικότητάς της. Παρ' όλα αυτά, η απόπειρα ανάλυσης του συνολικού RNA ιικού φορτίου των εξεταζόμενων αιματοφάγων εντόμων της παρούσας μελέτης, αποκάλυψε ένα συστημικό τεχνικό εμπόδιο, εγγενές σε αυτή την ευρέως διαδεδομένη τεχνολογία. Αναμφίβολα, οι ροές εργασίας SRS εξαρτώνται από πρωτόκολλα πολλών σταδίων που περιλαμβάνουν Αντίστροφη Μεταγραφή (Reverse Transcription) ή ενίσχυση μέσω Αλυσιδωτής Αντίδρασης Πολυμεράσης (Polymerase Chain Reaction - PCR), τα οποία αποτελούν κύριες πηγές τεχνητών χιμαιρικών αναγνώσεων (chimeric reads). Αυτά τα τεχνουργήματα, συγκεκριμένα οι λανθασμένες συντήξεις μεταξύ ιικών και μη ιικών αλληλουχιών, ιδιαίτερα βακτηριακού ή ριβοσωμικού RNA (rRNA) του ξενιστή, επιμένουν ακόμη και μετά από τυπικά πρωτόκολλα απομάκρυνσης και καταλήγουν να απορρίπτονται από τα υπάρχοντα βιοπληροφορικά εργαλεία, οδηγώντας στην απώλεια ανεκτίμητης ιικής πληροφορίας. Για την αντιμετώπιση αυτού του ζητήματος, αναπτύξαμε το υπολογιστικό εργαλείο Viral Reads Assembly Enhancer (ViRAE), μια εξελιγμένη και αναθεωρημένη έκδοση του πιλοτικού αλγορίθμου «Zero-Waste Algorithm» (ZWA) του εργαστηρίου μας. Διαχωρίζοντας τη θέση του από τις τρέχουσες βιοπληροφορικές μεθόδους αιχμής, το ViRAE χρησιμοποιεί έναν επιλεκτικό μηχανισμό εκτομής βάσει νουκλεοτιδικής στοίχισης, ώστε να αφαιρεί «χειρουργικά» μόνο τα μη ιικά τμήματα. Αυτή η καινοτόμος προσέγγιση επιτρέπει την «ανακύκλωση» των υπόλοιπων ιικών τμημάτων για βελτιστοποιημένη de novo συναρμολόγηση καθοδικά. Μέσω μιας διεξοδικής συγκριτικής ανάλυσης μεγάλης κλίμακας σε 528 δημοσιευμένα δεδομένα RNA-seq από εμπλουτισμένες πηγές, τα οποία σχετίζονταν με καθιερωμένα στελέχη ιών αναφοράς που χρησιμοποιούνται ως «χρυσός κανόνας» στο πεδίο, το ViRAE επέδειξε στατιστικά σημαντική ανώτερη απόδοση στην ποιότητα και τη συνοχή της de novo συναρμολόγησης (p < 0.0001) σε σύγκριση τόσο με μεθόδους χειρισμού ακατέργαστων αναγνώσεων όσο και με τυπικές τεχνικές φιλτραρίσματος μη ιικών αναγνώσεων. Πέρα από τις στατιστικές μετρήσεις, αυτή η βελτίωση απέδωσε πραγματικά βαθιά βιολογική σημασία, καθώς σε μια πιλοτική εφαρμογή του ViRAE σε πιο απαιτητικά μεταγονιδιωματικά δεδομένα RNA-seq χαμηλής αφθονίας που συνδέονται με δημοσιευμένα de novo συναρμολογημένα ιικά μεταγονιδιώματα, καταφέραμε να γεφυρώσουμε με επιτυχία γονιδιωματικά κενά και να αποκαταστήσουμε κρίσιμους φυλογενετικούς δείκτες που προηγουμένως ήταν κατακερματισμένοι ή χαμένοι σε συνολικά 107 ιικά μεταγονιδιώματα. Συνεπώς, η παρούσα διατριβή εκπληρώνει έναν διπλό στόχο: τον καθορισμό ενός ολιστικού παραδείγματος για την έρευνα της ιικής μεταγονιδιωματικής και τη μηχανική των ισχυρών βιοπληροφορικών εργαλείων που απαιτούνται για την υποστήριξή της. Ενσωματώνοντας την οικολογική ανακάλυψη με την ισχυρή βιοπληροφορική καινοτομία, η εργασία αυτή καθιερώνει ένα ολοκληρωμένο πλαίσιο που διασφαλίζει την ακεραιότητα των ιικών γονιδιωματικών πόρων.
περισσότερα
Περίληψη σε άλλη γλώσσα
Viruses are the most abundant and diverse biological entities on Earth, straddling the boundary between the living and the non-living while serving as profound drivers of evolution and agents of global disease. While traditional virology was long restricted by cultivation-dependent methods, the emergence of Next-Generation Sequencing (NGS) in the early 21st century has revolutionized the field through viral metagenomics. This holistic, culture-independent approach allows for the recovery of total viral assemblages—the virome—directly from biological samples. Within this broader framework, RNA viral metagenomics (or meta-transcriptomics) has become increasingly critical and often prioritized over DNA-based strategies as RNA viruses constitute the predominant pathogens and symbionts of eukaryotic hosts, driving rapid evolution, ecosystem regulation, and global disease dynamics. Given that hematophagous arthropods serve as primary reservoirs and vectors for the majority of these RNA viral ...
Viruses are the most abundant and diverse biological entities on Earth, straddling the boundary between the living and the non-living while serving as profound drivers of evolution and agents of global disease. While traditional virology was long restricted by cultivation-dependent methods, the emergence of Next-Generation Sequencing (NGS) in the early 21st century has revolutionized the field through viral metagenomics. This holistic, culture-independent approach allows for the recovery of total viral assemblages—the virome—directly from biological samples. Within this broader framework, RNA viral metagenomics (or meta-transcriptomics) has become increasingly critical and often prioritized over DNA-based strategies as RNA viruses constitute the predominant pathogens and symbionts of eukaryotic hosts, driving rapid evolution, ecosystem regulation, and global disease dynamics. Given that hematophagous arthropods serve as primary reservoirs and vectors for the majority of these RNA viral agents, characterizing their viromes is essential for predicting emerging threats. Yet, current approaches—often restricted to single-species studies or mixed-taxon pools—lack the resolution to clearly define the complex virus-carrier network of an examined ecosystem. Addressing this limitation under the One Health framework, this study operationalizes a holistic surveillance approach to recognize the vital interconnectedness between human, animal, and environmental health. We performed a comprehensive characterization of the RNA viromes spanning 24 mosquito and 10 Culicoides biting midge species in Eastern Macedonia and Thrace, Greece—a strategic biogeographical gateway for viral exchange between Asia and Europe. This investigation identified a total of 48 viral species, 29 of them being novel, and demonstrated that host populations maintain resilient, quality- and quantity-stable “core viromes”, thereby successfully mapping the previously obscured geospatial network of virus-carrier interactions. Although culture-independent approaches have revolutionized virology, RNA viral metagenomics remains heavily reliant on the so-called Second-Generation or Short-Read Sequencing (SRS) for its established accuracy and cost-effectiveness. Nevertheless, the execution of our holistic insect RNA virome profiling exposed a systemic technical bottleneck inherent to this widely adopted technology. Undoubtedly, SRS workflows depend on multi-stage protocols involving Reverse Transcription or Polymerase Chain Reaction (PCR) amplification, which are major sources of artificial chimeric reads. These artifacts, specifically the erroneous fusions between viral and non‑viral sequences, particularly bacterial or host ribosomal RNA (rRNA), persist even after standard depletion protocols and are routinely discarded by existing bioinformatic tools, leading to the loss of invaluable viral sequence information. To address this, we developed the Viral Reads Assembly Enhancer (ViRAE), an evolved and overhauled version of our lab’s pilot Zero-Waste Algorithm (ZWA). Distinguishing itself from state-of-the-art methods, ViRAE utilizes a selective, context-based trimming mechanism to surgically excise only the non-viral moieties. This innovative approach allows for the 'recycling' of the remaining viral segments for optimized downstream de novo assembly. Through a rigorous large-scale comparative analysis on 528 published RNA-seq data from enriched sources, which were associated with established virus reference strains used as gold-standards in RNA virology, ViRAE demonstrated statistically significant superior performance in de novo assembly quality and contiguity (p < 0.0001) compared to both raw unprocessed read handling methods and typical non-viral read filtering techniques. Beyond statistical metrics, this enhancement truly delivered profound biological significance, as in a pilot implementation of ViRAE on more challenging, low-abundance metagenomic RNA-seq data linked to authored de novo assembled viral metagenomes, we managed to successfully bridge genomic gaps and restore critical phylogenetic markers that were previously fragmented or lost in a total of 107 viral metagenomes. Consequently, this thesis fulfills a dual objective: defining a holistic paradigm for viral metagenomic research and engineering the robust bioinformatic tools necessary to support it. By integrating ecological discovery with robust bioinformatic innovation, this work establishes a comprehensive framework that safeguards the integrity of viral genomic resources.
περισσότερα