L'avenir du matériel génétique : XNAs
Les XNAs offrent de nouvelles possibilités dans la recherche génétique et la biotechnologie.
Mauricio Lisboa Perez, Michiko Kimoto, Priscilla Rajakumar, Chayaporn Suphavilai, Rafael Peres da Silva, Hui Pen Tan, Nicholas Ting Xun Ong, Hannah Nicholas, Ichiro Hirao, Chew Wei Leong, Niranjan Nagarajan
― 7 min lire
Table des matières
- Les Merveilles des Bases Artificielles
- Séquençage des XNAs Synthétiques : Un Nouveau Défi
- Séquençage de Nouvelle Génération : L’Avenir est Là
- Une Percée avec une Plateforme de Séquençage par Nanopore
- Créer une Bibliothèque de XNAs
- Analyser les Signaux du Séquençage
- Construire un Modèle de Basecaller
- Augmentation des Données : Améliorer la Performance
- Tester le Modèle et Résultats
- Conclusions et Directions Futures
- Source originale
Les acides xéno-nucléiques synthétiques, ou XNAs pour les intimes, sont un nouveau type de matériel génétique qui va au-delà des briques de construction habituelles qu'on trouve dans l'ADN et l'ARN humains. Alors que notre ADN est constitué de quatre bases principales (A, T, C et G), les XNAs incluent des bases artificielles qui n'existent pas dans la nature. Cette expansion offre des opportunités excitantes pour créer de nouvelles formes de vie et développer des technologies de pointe.
Imagine un terrain de jeux où les gamins peuvent inventer toutes sortes de nouveaux jeux au lieu de juste jouer à cache-cache ou au loup. Les XNAs, c'est comme ces nouveaux jeux, permettant aux scientifiques de sortir des règles traditionnelles de la biologie.
Les Merveilles des Bases Artificielles
Les bases artificielles dans les XNAs se comportent différemment des bases d’ADN habituelles. Cette propriété unique aide les scientifiques à créer de nouveaux outils et méthodes dans divers domaines, comme la biologie synthétique et la biotechnologie. Par exemple, des chercheurs ont créé des XNAs avec des bases appelées P et Z, ainsi que d'autres comme d5SICS et dNaM. Ils bossent sur ces nouvelles bases pour fabriquer des mini-machines, des capteurs, et même des organismes synthétiques qui pourraient un jour aider à résoudre de gros problèmes en médecine et en science environnementale.
Si tu penses à l'ADN traditionnel comme une vieille voiture fiable, les XNAs sont plutôt comme un cool scooter électrique : différents, plus rapides et capables d’aller là où la voiture ne peut pas.
Séquençage des XNAs Synthétiques : Un Nouveau Défi
Pour étudier et comprendre les XNAs, les chercheurs doivent les séquencer, un peu comme un bibliothécaire qui catalogue des livres. Cependant, le séquençage des XNAs pose des défis car les méthodes actuelles ont été conçues pour l'ADN traditionnel. Une approche courante consiste à utiliser des techniques comme le séquençage Sanger, qui peut manquer d'identifier les positions des bases artificielles à cause de lacunes dans les résultats.
Une autre méthode essaie de remplacer les bases artificielles par des bases traditionnelles avant le séquençage, mais ça peut introduire des erreurs. C’est comme assembler un puzzle et se rendre compte que certaines pièces viennent d'un autre jeu ; frustrant !
Séquençage de Nouvelle Génération : L’Avenir est Là
Les scientifiques sont excités par le séquençage de nouvelle génération parce que c'est beaucoup plus rapide que les anciennes méthodes. Mais ça a encore du mal avec la détection des bases artificielles. Il y a de l'intérêt pour des technologies plus modernes qui pourraient séquencer directement les XNAs sans avoir besoin de manœuvres compliquées. Ces avancées, c'est comme passer d'un téléphone à clapet à un smartphone : tellement plus capable !
Une Percée avec une Plateforme de Séquençage par Nanopore
Dans des développements récents, les chercheurs ont réussi à utiliser une plateforme de séquençage par nanopore pour séquencer directement les XNAs. Cet appareil fonctionne un peu comme un filtre à eau, où différents matériaux passent et peuvent être analysés. Les résultats ont indiqué que les méthodes précédentes pouvaient produire plus de 2 millions de lectures sans problèmes notables, prouvant que les XNAs pourraient s'intégrer facilement dans les technologies de séquençage existantes.
Pense-y comme à trouver un nouveau moyen de faire passer un cube dans un trou rond : finalement, ça marche après tout !
Créer une Bibliothèque de XNAs
Pour explorer ça plus en profondeur, les chercheurs ont conçu une bibliothèque de modèles de XNA, qui a servi de coffre au trésor de séquences génétiques pour les tests. En utilisant différentes combinaisons de bases artificielles et traditionnelles, ils ont créé une collection variée de XNAs.
Avec une approche maligne, ils ont pu générer des modèles avec jusqu'à 1 024 combinaisons différentes. Cette bibliothèque a permis un séquençage à haut débit et a ouvert la voie à un développement plus efficace des techniques de séquençage adaptées aux XNAs.
Analyser les Signaux du Séquençage
Quand les chercheurs ont séquencé ces XNAs, ils ont observé que les signaux électriques générés par le séquenceur à Nanopores étaient uniques, surtout aux alentours des bases artificielles. Les motifs des signaux ont donné des indices sur l’emplacement des bases artificielles, comme des miettes de pain menant les scientifiques à travers la forêt d'informations génétiques.
Il est important de noter que les lectures prises près de ces bases artificielles montraient une forte différence par rapport à l'ADN de contrôle, les signaux se comportant différemment. Cette différenciation signifie que les scientifiques pouvaient non seulement identifier où étaient les bases artificielles mais aussi comment elles pouvaient interagir avec d'autres matériaux génétiques.
Construire un Modèle de Basecaller
Créer un modèle de basecaller est essentiel pour interpréter les signaux produits lors du séquençage. Ce modèle agit comme un traducteur, transformant les signaux électriques en codes génétiques reconnaissables. L'équipe de recherche a développé un modèle d'apprentissage profond spécialisé, conçu pour gérer à la fois les bases naturelles et artificielles.
Pense à ça comme entraîner un chien à comprendre les ordres “assis” et “reste”. Après quelques tours d'entraînement avec des exemples variés, le modèle a atteint des taux de succès impressionnants, dépassant les 80 % de précision.
Augmentation des Données : Améliorer la Performance
Les chercheurs ont réalisé qu'ils devaient élargir leurs données d'entraînement pour améliorer la capacité générale du modèle. En utilisant des techniques d'augmentation des données, ils ont pu créer des séquences simulées qui reflétaient divers contextes de séquence.
Cette approche leur a permis de générer des lectures artificielles qui ont aidé à booster la performance du modèle. Tout comme introduire un nouvel ingrédient dans une recette peut changer tout le plat, varier les entrées de données a encore affiné le modèle.
Tester le Modèle et Résultats
Après l'entraînement, le modèle a été testé de manière intensive sur la bibliothèque de preuve de concept et la collection plus complexe de XNA. Les résultats ont montré un haut niveau de précision pour identifier les bases artificielles et les bases naturelles à proximité.
Bien que le modèle ait bien fonctionné en général, il a aussi rencontré des obstacles courants liés à la précision du basecalling, notamment près des bases artificielles. Mais, il a montré une capacité remarquable à traiter même des données difficiles sans baisse significative de performance globale.
Conclusions et Directions Futures
Le séquençage direct réussi des XNAs représente un grand pas en avant dans la recherche génétique. Avec la puissance de la technologie des nanopores, les chercheurs ont hâte d'explorer d'autres bases artificielles qui pourraient être intégrées dans de futurs projets de biologie synthétique.
Cette exploration pourrait mener à des percées dans de nombreux domaines, comme le développement de nouveaux médicaments ou la création d'organismes capables de répondre à des défis environnementaux. Tout comme l'invention de la roue a changé le cours des voyages, le séquençage des XNAs a le potentiel de changer la direction de la science biologique.
En conclusion, alors que les scientifiques continuent de repousser les limites de ce qui est possible avec les XNAs, l'avenir s'annonce radieux. L'objectif est de continuer à trouver des solutions innovantes qui peuvent bénéficier à l'humanité et à l'environnement tout en s'assurant de s'amuser en cours de route - parce que qu'est-ce que la science sans un peu d'excitation ?
Titre: Direct high-throughput deconvolution of unnatural bases via nanopore sequencing and bootstrapped learning
Résumé: The discovery of synthetic xeno-nucleic acids (XNAs) that can basepair as unnatural bases (UBs) to expand the genetic alphabet has spawned interest in many applications, from synthetic biology to DNA storage. However, the inability to read XNAs in a direct, high-throughput manner has been a significant limitation for xenobiology. Here we demonstrate that XNA-containing templates can be directly and robustly sequenced (>2.3 million reads/flowcell, similar to DNA controls) on a MinION sequencer from Oxford Nanopore Technologies to obtain signal data that is significantly distinct from DNA controls (median fold-change >6x). To enable training of machine learning models that deconvolve these signals and basecall XNAs along with natural bases, we developed a framework to synthesize a complex pool of 1,024 UB-containing oligonucleotides with diverse 6-mer sequence contexts and high XNA purity (>90% UB-insertion on average). Bootstrapped models to enable data preparation, and data augmentation with spliced XNA reads to provide high context diversity, enabled learning of a generalizable model to call natural as well as unnatural bases with high accuracy (>80%) and specificity (99%). These results highlight the versatility of nanopore sequencing as a platform for interrogating nucleic acids for xenobiology applications, and the potential to transform the study of genetic material beyond those that use canonical bases.
Auteurs: Mauricio Lisboa Perez, Michiko Kimoto, Priscilla Rajakumar, Chayaporn Suphavilai, Rafael Peres da Silva, Hui Pen Tan, Nicholas Ting Xun Ong, Hannah Nicholas, Ichiro Hirao, Chew Wei Leong, Niranjan Nagarajan
Dernière mise à jour: 2024-12-02 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.12.02.625113
Source PDF: https://www.biorxiv.org/content/10.1101/2024.12.02.625113.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.