Un nouvel éclairage sur le contrôle des gènes chez les bactéries
Cette étude révèle de nouvelles infos sur comment les bactéries régulent l'expression des gènes avec des σ-facteurs.
Rahmi Lale, E. A. Khan, C. Rückert-Reed, G. S. Dahiya, L. Tietze, M. Fages-Lartaud, T. Busche, J. Kalinowski, V. Shingler
― 9 min lire
Table des matières
- Le rôle des facteurs σ
- Limites des méthodes traditionnelles
- Une nouvelle approche
- Application à Pseudomonas putida
- Création d'une bibliothèque de séquences régulatrices
- Séquençage de la bibliothèque
- Investigation de l'activité de transcription
- Analyse des transcrits d'ARN
- Identification des motifs de liaison
- Validation fonctionnelle des séquences
- Prédiction des motifs dans les génomes bactériens
- Conclusion
- Source originale
Les bactéries ont une façon unique de contrôler comment leurs gènes fonctionnent. Ce contrôle est essentiel pour leur survie car il les aide à réagir aux changements de leur environnement. Un acteur clé dans ce processus, c'est ce qu'on appelle le Facteur σ. Ce facteur aide les bactéries à commencer le processus de fabrication d'ARN, ce qui est une étape vers la production de protéines qui exécutent diverses fonctions dans la cellule.
Malgré beaucoup de progrès dans la compréhension des gènes bactériens, on a encore beaucoup à apprendre sur la façon dont ces gènes sont contrôlés, surtout au niveau de l'ADN. Par exemple, même chez la célèbre bactérie Escherichia coli, beaucoup de gènes ont encore des mécanismes de régulation peu clairs. Ce manque de connaissances s'étend à de nombreux autres types de bactéries, montrant le besoin d'une approche complète pour étudier la régulation des gènes dans toutes les bactéries.
Le rôle des facteurs σ
Le processus de démarrage de la Transcription, qui est le moment où l'ARN est fabriqué à partir de l'ADN, est étroitement contrôlé par les facteurs σ. Dans les bactéries, une protéine appelée ARN polymérase (RNAP) utilise les facteurs σ pour trouver des séquences d'ADN spécifiques appelées Promoteurs. Ces promoteurs signalent où le processus de transcription devrait commencer. Des facteurs σ différents préfèrent différentes séquences de promoteurs, permettant aux bactéries d'ajuster leur expression génétique en fonction de ce qui se passe dans leur environnement. Cependant, trouver toutes les séquences auxquelles les facteurs σ se lient reste un défi. Ce manque de connaissances rend difficile pour les scientifiques de prédire et de comprendre comment fonctionne réellement la régulation des gènes.
Limites des méthodes traditionnelles
Les scientifiques ont utilisé plusieurs méthodes traditionnelles pour étudier la liaison des facteurs σ, comme le "footprinting" de l'ADN et divers types de tests comme les essais de mobilité électrophorétique (EMSAs), la précipitation d'immunochromatine (ChIP) et l'évolution systématique des ligands par enrichissement exponentiel (SELEX). Bien que ces méthodes aient fourni des informations précieuses sur les préférences des facteurs σ, elles ont des limites. Par exemple, elles se concentrent souvent trop sur la force de liaison d'un facteur σ et ne ciblent pas spécifiquement les séquences de liaison exactes dans les promoteurs. Parfois, elles passent également à côté de séquences importantes parce qu'elles reposent sur des bibliothèques de séquences d'ADN prédéfinies.
Une nouvelle approche
Dans cette étude, nous avons introduit une nouvelle méthode basée sur les données pour traiter ces lacunes. Notre approche combine une bibliothèque complète de promoteurs artificiels avec des essais de transcription in vitro. Cette méthode a plusieurs avantages. D'abord, elle permet une mesure directe de l'activité des promoteurs plutôt que de simplement se fier à la force de liaison. En observant l'ARN produit lors de la transcription, nous pouvons identifier les vraies séquences de liaison qui mènent à une transcription active.
De plus, nous avons utilisé une grande bibliothèque de séquences d'ADN et des techniques de séquençage avancées pour découvrir une large gamme de Motifs de liaison des facteurs σ, fournissant des données quantitatives précieuses. Cet ensemble de données extensif nous aide non seulement à comprendre comment différentes séquences fonctionnent mais aussi à entraîner des modèles d'apprentissage automatique pour mieux prédire et décrire l'activité des promoteurs.
Application à Pseudomonas putida
Pour démontrer l'efficacité de notre approche, nous avons étudié un type de bactérie appelé Pseudomonas putida. Notre travail expérimental a abouti à l'identification d'un nombre considérable de séquences distinctes de liaison à l'ADN σ54, élargissant considérablement ce que nous savons sur ce facteur σ spécifique. Ces informations détaillées nous donnent non seulement des aperçus sur le fonctionnement des promoteurs dépendants de σ54 dans Pseudomonas putida mais aussi préparent le terrain pour de futurs développements en biologie synthétique, y compris la création de meilleurs outils pour prédire et concevoir des promoteurs.
Création d'une bibliothèque de séquences régulatrices
Une partie importante de notre approche était de construire une grande bibliothèque de séquences d'ADN ayant des fonctions régulatrices. Nous avons utilisé un outil que nous avons développé appelé Gene Expression Engineering (GeneEE) pour créer une variété de séquences régulatrices artificielles. Ces séquences pourraient servir de promoteurs et de régions non traduites, totalisant environ 1,54 million de modèles d'ADN uniques.
Pour garantir l'exactitude de la construction de cette bibliothèque, nous avons cloné un segment d'ADN aléatoire dans un vecteur qui incluait également un aptamère d'ARN connu sous le nom de dBroccoli, qui sert de rapporteur pour l'activité de transcription. Cet aptamère se lie à un colorant spécifique qui s'illumine, facilitant la détection de l'ARN lors de la transcription.
Séquençage de la bibliothèque
Pour savoir exactement quelles séquences d'ADN nous avions dans notre bibliothèque, nous avons utilisé le séquençage de nouvelle génération (NGS). Cette technologie nous a permis de générer des millions de lectures de nos séquences d'ADN, que nous avons ensuite analysées pour confirmer la présence et la variété de nos modèles d'ADN. Après traitement des données, nous avons obtenu plus de six millions de lectures uniques de notre bibliothèque.
Investigation de l'activité de transcription
Ensuite, nous avons utilisé notre bibliothèque dans des essais de transcription in vitro pour déterminer quelles séquences étaient fonctionnelles. Nous avons préparé les composants nécessaires au processus de transcription, y compris l'ARN polymérase et le facteur σ54 de Pseudomonas putida. En examinant l'ARN produit lors de ces réactions, nous avons pu lier des séquences d'ADN spécifiques avec l'activité de transcription, nous permettant d'identifier des sites de démarrage de transcription potentiels.
Analyse des transcrits d'ARN
Après les réactions de transcription, nous avons séquencé l'ARN résultant pour voir comment il correspondait à nos séquences d'ADN originales. Cette étape était cruciale pour établir quelles parties de notre bibliothèque produisaient activement de l'ARN. Après une analyse minutieuse, nous avons identifié un grand nombre de sites de démarrage de transcription potentiels basés sur les séquences d'ARN cartographiées de nouveau aux modèles d'ADN.
Identification des motifs de liaison
Pour mieux comprendre comment le facteur σ54 interagit avec l'ADN, nous avons cherché des motifs spécifiques dans les séquences en amont de nos sites de démarrage de transcription. En utilisant des outils computationnels, nous avons pu découvrir des séquences consensuelles-des séquences spécifiques qui apparaissaient fréquemment et jouaient un rôle dans la liaison du σ54. Notre analyse a révélé plusieurs motifs importants, éclairant comment le facteur σ54 reconnaît et interagit avec les promoteurs dans Pseudomonas putida.
Validation fonctionnelle des séquences
Pour confirmer que nos séquences identifiées étaient réellement fonctionnelles, nous avons effectué d'autres essais de transcription avec des séquences sélectionnées. Nous nous sommes concentrés sur la vérification des sorties de transcription avec un aptamère d'ARN modifié appelé Mango III, qui fournit de meilleurs signaux. Les résultats ont montré que nos séquences identifiées produisaient des transcrits d'ARN significatifs, validant nos conclusions des essais précédents.
Prédiction des motifs dans les génomes bactériens
En nous appuyant sur nos découvertes, nous avons exploré à quel point nos résultats pouvaient aider à annoter le génome de Pseudomonas putida KT2440. Nous avons découvert que les bases de données existantes offraient des informations limitées sur les promoteurs σ54, ce qui nous a poussés à rechercher les motifs que nous avions identifiés dans le génome lui-même. En utilisant des logiciels sophistiqués, nous avons identifié de nombreux sites de liaison σ54 potentiels à travers différents gènes, indiquant que notre méthode pourrait aider à améliorer de manière significative l'annotation des génomes bactériens.
Conclusion
En résumé, notre étude met en avant une nouvelle approche pour comprendre la régulation des gènes bactériens à travers l'identification des séquences de liaison des facteurs σ. En créant une immense bibliothèque de séquences régulatrices artificielles et en utilisant des technologies de séquençage modernes, nous avons pu obtenir des aperçus plus profonds sur la façon dont les bactéries contrôlent leurs gènes. Nos résultats ouvrent la voie à de futurs avancements en biologie synthétique, dans les applications d'apprentissage automatique et dans des annotations plus précises des génomes bactériens.
Alors que la recherche dans ce domaine continue de croître, il y a un besoin pressant d'améliorer les outils disponibles pour l'annotation des génomes, particulièrement pour les séquences régulatrices. Notre méthode représente un pas vers cet objectif, offrant un moyen fiable de découvrir et de comprendre les paysages régulatoires complexes qui gouvernent l'expression des gènes chez les bactéries.
Ce travail jette les bases pour de futures études qui s'appuieront sur nos conclusions et exploreront davantage les détails complexes de la manière dont les bactéries parviennent à s'adapter et à prospérer dans leurs environnements.
Titre: High-resolution mapping of Sigma Factor DNA Binding Sequences using Artificial Promoters, RNA Aptamers and Deep Sequencing
Résumé: The variable sigma ({sigma}) subunit of the bacterial RNA polymerase holoenzyme determines promoter specificity and facilitate open complex formation during transcription initiation. Understanding {sigma}-factor binding sequences is therefore crucial for deciphering bacterial gene regulation. Here, we present a data-driven high-throughput approach that utilizes an extensive library of 1.54 million DNA templates providing artificial promoters and 5' UTR sequences for {sigma}-factor DNA binding motif discovery. This method combines the generation of extensive DNA libraries, in vitro transcription, RNA aptamer selection, and deep DNA and RNA sequencing. It allows direct assessment of promoter activity, identification of transcription start sites, and quantification of promoter strength based on mRNA production levels. We applied this approach to map {sigma}54 DNA binding sequences in Pseudomonas putida. Deep sequencing of the enriched RNA pool revealed 64,966 distinct {sigma}54 binding motifs, significantly expanding the known repertoire. This data-driven approach surpasses traditional methods by directly evaluating promoter function and avoiding selection bias based solely on binding affinity. This comprehensive dataset enhances our understanding of {sigma}-factor binding sequences and their regulatory roles, opening avenues for new research in biology and biotechnology.
Auteurs: Rahmi Lale, E. A. Khan, C. Rückert-Reed, G. S. Dahiya, L. Tietze, M. Fages-Lartaud, T. Busche, J. Kalinowski, V. Shingler
Dernière mise à jour: 2024-10-19 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.10.18.619134
Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.18.619134.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.