Simple Science

La science de pointe expliquée simplement

# Biologie# Bioinformatique

Nouveau truc pour étudier l'ARN du virus de l'hépatite B

Bolero aide à quantifier l'ARN du VHB, révélant des infos sur l'infection.

― 9 min lire


Boléro : Analyse de l'ARNBoléro : Analyse de l'ARNdu VHBefficacement l'ARN du VHB.Une nouvelle méthode pour quantifier
Table des matières

Environ 290 millions de personnes à travers le monde ont une infection à long terme par le virus de l'Hépatite B (VHB). Ce virus peut causer de graves problèmes de foie, comme la cirrhose et le cancer du foie. Depuis 1981, des vaccins sont disponibles pour prévenir l'infection par le VHB et sa propagation. Cependant, les traitements actuels ne guérissent pas la plupart des patients. Une grande raison de cela est la capacité du VHB à se cacher dans l'ADN du foie sous une forme connue sous le nom d'ADN circulaire fermé de manière covalente, ou cccDNA. Donc, trouver de nouveaux traitements pour réduire l'activité du cccDNA est super important.

Pour aider à développer ces nouveaux traitements, il est nécessaire d'avoir de bons marqueurs qui montrent combien de VHB est présent dans le foie. Des études récentes suggèrent que mesurer l'ARN du VHB dans le sang peut être un moyen utile d'indiquer à quel point le cccDNA est actif. Cependant, étudier ces molécules d'ARN est compliqué à cause de la structure unique du VHB.

Comprendre le VHB et son ARN

Le VHB a un petit morceau d'ADN circulaire d'environ 3,2 kilobases de long. Cet ADN peut créer huit types principaux de molécules d'ARN : preCore, pgRNA, preS1, preS2, HBs, L-HBx, M-HBx, et S-HBx. Les deux types d'ARN les plus longs, pgRNA et preCore, sont même plus longs que l'ADN du virus lui-même. Ces ARN ont des parties supplémentaires à leurs extrémités à cause de leur fabrication par une enzyme appelée ARN polymérase II. En plus, des ARN VHB plus petits peuvent se chevaucher dans leurs séquences, ce qui rend leur étude séparée difficile.

Les chercheurs ont identifié 22 variantes épissées de ces types d'ARN, nommées SP01 à SP22. Certaines de ces variantes épissées proviennent du pgRNA, tandis que d'autres viennent du préS2/HBs RNA. Comme les variantes épissées partagent beaucoup de similitudes avec les ARN VHB principaux, savoir qui est qui nécessite de savoir où elles commencent à faire de nouveaux ARN et où elles se connectent.

Une nouvelle méthode pour capter l'ARN du VHB

Récemment, une méthode connue sous le nom d'amplification rapide des extrémités de l'ADN complémentaire 5', ou 5’RACE, a été développée. Cette technique aide à capturer les ARN VHB de longueur complète. Elle utilise des amorces spéciales qui se fixent au début de l'ARN pour isoler ces molécules et ensuite faire des copies d'elles. Quand elle est combinée avec une technologie de Séquençage à long tirage, la Technologie Oxford Nanopore (ONT), les chercheurs peuvent lire les séquences de longueur complète des molécules d'ARN VHB.

Cependant, analyser les données produites par ce séquençage nécessite un ensemble d'outils spécifiques qui ne sont pas largement disponibles. Pour répondre à ce besoin, un nouvel outil appelé Bolero a été créé. Bolero est conçu pour évaluer les niveaux de différents ARN VHB et leurs variantes épissées. Cet outil est nommé d'après une pièce de musique connue pour ses parties qui se chevauchent, similaire à la façon dont les transcrits du VHB sont structurés. Avec Bolero, les chercheurs peuvent déterminer les quantités de différents types d'ARN VHB dans un échantillon et éventuellement identifier de nouvelles variantes épissées.

Flux de travail de Bolero

Le système Bolero fonctionne comme une série d'étapes pour traiter les données de séquençage ARN. Au début, il peut traiter des fichiers de données bruts générés par ONT ou des fichiers prétraités. Le flux de travail de Bolero comprend plusieurs étapes importantes, comme filtrer les lectures de mauvaise qualité, aligner les séquences ARN sur un génome de référence, et identifier les positions de départ des différents types d'ARN VHB.

En utilisant des ensembles de données synthétiques, Bolero a montré des résultats impressionnants en filtrant et en mappant les lectures avec précision. Cela signifie que les chercheurs peuvent faire confiance aux données produites par cet outil pour donner une image claire des niveaux d'ARN VHB.

Étapes de filtrage dans le flux de travail

Pour garantir que seules des données de haute qualité sont utilisées, Bolero inclut des étapes de filtrage. Au départ, il vérifie la présence de séquences spécifiques qui sont attendues dans l'ARN VHB. Cela contribue à éliminer les lectures qui ne représentent pas des ARN VHB complets. Dans une simulation, seulement un petit pourcentage de lectures synthétiques a passé ces étapes de filtrage, montrant l'importance de ce processus.

Une fois les données filtrées, elles sont ensuite mappées à une séquence de référence de l'ARN VHB. Comme le génome du VHB est circulaire et que les molécules d'ARN les plus longues sont plus longues que l'ADN réel du virus, la séquence de référence doit être choisie avec soin. L'ARN preCore, qui inclut tous les types d'ARN VHB connus, sert de référence pour l'alignement. Bolero utilise un outil d'alignement appelé Minimap2 qui peut reconnaître les événements d'épissage et identifier les types d'ARN avec précision.

Déterminer la position de départ des ARN VHB

Chaque type d'ARN VHB a une position de départ spécifique où il commence. Cette position est cruciale pour catégoriser et comprendre les différents types d'ARN. En analysant les ensembles de données, les chercheurs peuvent identifier les coordonnées de départ pour chaque type d'ARN. Le défi se présente lorsque certains ARN, comme preS2 et HBs, ont des positions de départ qui se chevauchent, rendant plus difficile leur distinction.

Pour y remédier, Bolero regroupe les lectures qui tombent dans certaines plages de positions de départ ensemble. Cela permet une classification plus large tout en fournissant une compréhension claire des types d'ARN présents. En combinant toutes ces informations, les chercheurs peuvent voir combien de chaque ARN VHB est présent dans un échantillon.

Variantes épissées et leur identification

En plus des ARN VHB principaux, il y a aussi des variantes épissées que les chercheurs veulent suivre. Ces variantes ont des caractéristiques uniques qui les distinguent de leurs types d'ARN parents. En utilisant un outil logiciel appelé Nanosplicer, Bolero peut identifier les jonctions d'épissage au sein des lectures. Cela signifie que les lectures contenant des jonctions d'épissage sont attribuées à des variantes épissées spécifiques, tandis que d'autres restent catégorisées sous leurs types d'ARN principaux.

Comprendre l'épissage est crucial pour avoir une image complète du paysage de l'ARN VHB. Certaines variantes épissées sont plus abondantes que d'autres, et connaître ces variantes peut aider dans l'étude de l'infection par le VHB et de ses effets sur le corps.

Validation de Bolero avec des échantillons réels

Après des tests réussis avec des données simulées, Bolero a également été appliqué à des échantillons réels prélevés sur des cellules infectées par le VHB. Les résultats ont montré que Bolero peut analyser et quantifier efficacement l'ARN VHB à partir d'échantillons biologiques. Plus précisément, l'étude a trouvé que différentes espèces d'ARN VHB étaient présentes en quantités cohérentes à travers plusieurs échantillons. Cela montre que la méthode est fiable pour identifier et mesurer les types d'ARN VHB dans de réelles infections.

Défis dans l'analyse de l'ARN VHB

Étudier l'ARN VHB peut être difficile à cause de la structure complexe du génome du virus. Tous les types d'ARN VHB partagent certaines caractéristiques communes, ce qui signifie que les chercheurs rencontrent souvent des problèmes pour identifier des transcrits spécifiques. Les méthodes traditionnelles comme la PCR quantitative ne sont pas efficaces car elles ont du mal à distinguer les types d'ARN qui se chevauchent.

Pour relever ces défis, les chercheurs se tournent de plus en plus vers les technologies de séquençage à long tirage. Celles-ci ont la capacité de fournir une vue plus complète du transcriptome du VHB en capturant et en identifiant avec précision les différentes molécules d'ARN impliquées, y compris toutes les variantes épissées.

Comparaison avec d'autres études

D'autres études ont examiné l'ARN VHB en utilisant différentes méthodes et technologies. Par exemple, certains chercheurs ont utilisé des techniques pour enrichir les ARN VHB à partir d'échantillons d'ARN total chez des patients. D'autres ont détecté des ARN VHB dans le sérum des patients mais ont eu du mal à les quantifier avec précision. Ces différences de méthodologie peuvent mener à des résultats variés, même en examinant des types d'ARN VHB similaires.

La méthode Bolero se démarque car elle utilise des ensembles de données synthétiques pour valider son efficacité avant de l'appliquer à des échantillons biologiques. Elle offre également des avantages pour comprendre le spectre complet des ARN VHB et leurs niveaux.

Conclusion

Bolero est un outil innovant pour identifier et quantifier les espèces d'ARN VHB. En intégrant diverses techniques avancées et en analysant ses données de manière complète, Bolero aide à améliorer notre compréhension du VHB et de son comportement chez les individus infectés. Cette connaissance est essentielle pour développer des thérapies efficaces et comprendre les complexités de cette infection virale persistante.

Source originale

Titre: Bolero: a dedicated workflow to decipher Hepatitis B virus transcriptome from long-reads sequencing method coupled to 5RACE amplification of transcripts

Résumé: Hepatitis B virus (HBV) represents a major health burden, as it affects close to 290 million people worldwide. Although prophylactic vaccines are available, current therapeutic compounds do not usually achieve HBV eradication due to the persistence of the covalently closed circular (ccc)DNA that serves as viral reservoir. Thus, novel biomarkers that reliably reflect intrahepatic cccDNA transcriptional activity would be highly relevant for the monitoring of infected individuals, as well as the evaluation of new treatments targeting HBV. In this context, the development of 5 rapid amplification of complementary DNA ends (5RACE) as a strategy to capture and amplify full-length HBV RNAs, coupled with long-read and full-length sequencing approaches (e.g., Oxford Nanopore Technology), has recently enabled the detailed characterization of these molecules. The analysis of such data requires a dedicated bioinformatics pipeline due to the highly condensed nature of the HBV genome, which is characterized by the production of multiple transcripts and spliced variants that overlap each other. Here, we present Bolero, a computational method and built-in workflow designed to handle HBV sequencing data and evaluate the relative expression of viral RNAs and their spliced variants. The analysis of HBV-infected cell lines demonstrates that our bioinformatics pipeline is efficient for the identification and quantification of individual HBV mRNAs. Thus, Bolero represents a useful tool to study cccDNA transcriptional activity and the heterogeneity of HBV RNA spliced variants. Author summaryTranscriptomic analyses have brought comprehensive insights in the mechanisms controlling gene expression. Moreover, with the recent advances in sequencing technologies and computational methods, researchers can nowadays not only quantify gene expression, but also study alternative splicing, polyadenylation, transcription initiation, and even rare phenomena such as distant gene fusions. However, conventional analysis tools still rely heavily on the assumption of linear genomes with minimal overlap between open reading frames, rendering them insufficient for studying complex viruses such as hepatitis B virus (HBV). Unlike typical linear genomes, HBV genome consists in a circular DNA molecule, which results in an extensive sequence overlap between its transcripts. To tackle these challenges, we developed an innovative approach coupling 5 rapid amplification of complementary DNA ends (5RACE) and long-read sequencing to comprehensively explore the HBV transcriptome. Furthermore, we developed Bolero, a computational method designed to handle the peculiarities of HBV sequencing data, which allows a detailed characterization of the HBV transcriptome.

Auteurs: Xavier Grand, G. Giraud, A. Rifki, A. Paturel, D. Bousquet, A. A. Roca Suarez, C. Bourgeois, M. Levrero, F. Zoulim, B. Testoni

Dernière mise à jour: 2024-09-21 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.09.17.613398

Source PDF: https://www.biorxiv.org/content/10.1101/2024.09.17.613398.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires