Génomes réduits et leur impact sur la fonctionnalité bactérienne
Des recherches montrent comment des génomes réduits peuvent améliorer l'efficacité et la productivité des bactéries.
Chris P Barnes, D. Buchan, A. Shcherbakova
― 7 min lire
Table des matières
La recherche sur les génomes réduits aide les scientifiques à comprendre les fonctions de base de la vie. Ça montre quels gènes sont nécessaires pour qu'une cellule survive et comment ils peuvent utiliser ces connaissances pour l'industrie.
En créant des bactéries avec moins de gènes, les chercheurs ont observé des résultats vraiment intéressants. Ces bactéries modifiées poussent souvent plus vite et produisent plus de biomasse. Elles ont aussi des rendements plus élevés de certains produits et semblent plus stables. Une découverte intéressante a montré que les bactéries avec seulement les gènes essentiels peuvent évoluer plus vite que celles ayant un jeu complet de gènes. Ça suggère qu'avoir moins de gènes peut aider les bactéries à mieux s'adapter avec le temps, ce qui est super pour la recherche et pour les applications industrielles.
Méthodes pour créer des génomes minimaux
Il y a deux principales méthodes pour créer des bactéries avec des génomes réduits. La première s'appelle l'approche ascendante. Cette méthode part de zéro, où les scientifiques conçoivent un génome artificiel complètement nouveau. Ça permet un renouvellement total du génome bactérien. Cependant, il reste encore plein d'inconnues sur comment bien concevoir ces génomes.
La deuxième méthode est l'approche descendante, qui consiste à réduire les génomes bactériens existants. Ça implique de retirer les gènes non essentiels des bactéries de type sauvage. Bien qu'on ait vu du succès avec les deux méthodes, il reste des défis à relever.
De nombreuses souches de génomes réduits par approche descendante ont été développées à partir d'une bactérie commune appelée Escherichia coli, chacune ciblant des usages industriels spécifiques. Une de ces souches, connue sous le nom de Minimal Genome Factory (MGF-01), a été conçue pour ne contenir que les gènes nécessaires à la fermentation. Cette souche a perdu environ 22% de sa taille de génome d'origine tout en maintenant de nombreuses fonctions comme la souche sauvage. Notamment, MGF-01 a produit des niveaux plus élevés de L-thréonine, suggérant que réduire le génome peut réellement améliorer la productivité.
Un autre développement significatif est la Multiple Deletion Series (MDS), qui se concentre sur la stabilité génétique et l'efficacité pour insérer des gènes étrangers. La série MDS a été créée en retirant des éléments inutiles de la souche MG1655. Certaines de ces nouvelles souches ont montré des taux de croissance similaires à la souche sauvage, tandis que d'autres, bien que plus lentes, produisaient des rendements beaucoup plus élevés de certains composés.
Le rôle de l'informatique dans la conception de génomes
Ces dernières années, les scientifiques ont commencé à utiliser la modélisation informatique et l'apprentissage automatique pour aider à concevoir des génomes minimaux. Une méthode s'appelle les autoencodeurs variationnels (VAE), qui combinent l'apprentissage profond avec la modélisation statistique. Ces outils ont été utilisés pour étudier les génomes humains et concevoir de nouveaux génomes bactériens.
Dans une étude, les chercheurs ont entraîné un VAE en utilisant des génomes bactériens de haute qualité. Ils ont représenté chaque génome dans un format binaire qui montrait si des gènes spécifiques étaient présents ou absents. Les chercheurs ont ensuite corrompu ces génomes pour enseigner au modèle et l'ont utilisé par la suite pour recréer les génomes originaux non corrompus. Bien que cette méthode ait montré du potentiel, elle a rencontré des défis à cause d'un petit ensemble de données.
Pour surmonter ces défis, l'accent a été mis strictement sur E. coli. Les chercheurs ont utilisé une grande collection de génomes, étudiant la présence et l'absence de gènes. Ils ont suivi les variations de taille de génome, les fréquences de gènes et les gènes essentiels pour entraîner efficacement le VAE.
Investiguer la diversité des génomes
Pour mieux comprendre la diversité dans l'ensemble de données, les chercheurs ont effectué une Analyse en composantes principales (ACP). Cette méthode visuelle aide à séparer différents groupes basés sur leurs similarités et différences génétiques. L'ACP a montré des groupes distincts, indiquant des niveaux variés d'évolution génétique parmi les lignées d'E. coli.
En étudiant un échantillon de 1 000 génomes, les chercheurs ont pu créer un arbre phylogénétique qui représente visuellement les relations génétiques. Cet arbre a révélé des déséquilibres parmi les lignées, suggérant que certains groupes ont évolué plus rapidement que d'autres.
Explorer les fonctions de perte pour la génération de génomes
Les chercheurs ont développé différentes versions du VAE, modifiant la façon dont il apprend des données. Une version a utilisé une fonction de perte standard tandis que d'autres ont inclus des termes supplémentaires pour aider à se concentrer sur la réduction de la taille du génome. Chaque version a été évaluée pour voir à quel point elle capturait bien les variations nécessaires pour concevoir des génomes minimaux.
Les résultats ont montré qu'une version modifiée a conduit à un espace latent plus concentré, avec des groupes différents se regroupant ensemble. Cet ajustement a aussi considérablement réduit les tailles de génome.
Dans le modèle final, les chercheurs ont réussi à minimiser les génomes, produisant des tailles plus petites que les génomes E. coli minimaux existants. Le résultat final a montré un compromis clair entre la taille du génome et le nombre de gènes essentiels.
Le chemin à suivre pour la minimisation du génome
Les résultats des expériences ont posé les bases pour développer de nouveaux algorithmes afin de minimiser encore plus les génomes. Un défi majeur est de s'assurer que les génomes modifiés sont toujours viables après les suppressions de gènes. Les études futures peuvent se baser là-dessus pour créer des arbres phylogénétiques pour les génomes générés et estimer quels gènes peuvent être retirés en toute sécurité.
Le processus implique aussi de vérifier la viabilité de chaque nouveau génome par expérimentation. Bien que le processus actuel prenne du temps et coûte de l'argent, de nouvelles méthodes pour modifier le génome d'E. coli ont été créées, ouvrant la voie à des approches plus efficaces.
Il y a certaines limites à considérer. Les gènes essentiels peuvent être difficiles à définir avec précision, et il reste un besoin de modèles cellulaires complets pour valider les résultats. De plus, l'ensemble de données utilisé montrait une diversité génétique limitée, ce qui pourrait être amélioré en utilisant des données de espèces bactériennes étroitement liées.
À l'avenir, les chercheurs pourraient explorer divers paramètres et configurations pour les modèles afin d'obtenir de meilleurs résultats. Cela pourrait impliquer de tester différents taux d'apprentissage et dimensions pour affiner davantage le modèle.
Conclusion
En conclusion, cette recherche illustre la capacité des modèles génératifs à capturer les variations dans les génomes bactériens. Ça montre que les VAE peuvent générer efficacement des génomes minimisés avec des gènes cruciaux inclus. Avec les avancées continues, il y a un potentiel excitant pour des applications dans le traitement industriel et une meilleure compréhension de la vie bactérienne.
Titre: Designing minimal E. coli genomes using variational autoencoders
Résumé: Designing minimal bacterial genomes remains a key challenge in synthetic biology. There is currently a lack of efficient tools for the rapid generation of streamlined bacterial genomes, limiting research in this area. Here, using a pangenome dataset for Escherichia coli, we explore how generation of minimal genomes can be achieved using variational autoencoders. Our results show that variational autoencoders can successfully create minimised genomes retaining the essential genes identified in the literature. This study proposes a rapid, machine learning-based approach for bacterial sequence generation, that could accelerate the genomic design process.
Auteurs: Chris P Barnes, D. Buchan, A. Shcherbakova
Dernière mise à jour: 2024-10-23 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.10.22.619620
Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.22.619620.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.