Approches innovantes dans les études de génotypage
Un aperçu du séquençage à faible couverture et de son impact sur la recherche génétique.
― 7 min lire
Table des matières
- Qu'est-ce que le séquençage à faible couverture ?
- Méthodes de Préparation de la bibliothèque
- Évaluation des kits de préparation de bibliothèque
- Séquençage et analyse des données
- Performance de l'imputation
- Succès de la miniaturisation
- Facilité d'utilisation et opérations du laboratoire
- Conclusion
- Source originale
Les études de génotypage aident les scientifiques à comprendre les variations génétiques chez les individus. Traditionnellement, ces études utilisaient des méthodes comme les arrays pour analyser l'ADN. Cependant, les avancées récentes montrent que le séquençage à faible couverture, combiné à l'Imputation, peut être une méthode plus abordable et efficace.
Qu'est-ce que le séquençage à faible couverture ?
Le séquençage à faible couverture est une technique où seule une petite partie d'un échantillon d'ADN est analysée. Cette méthode utilise moins de données que le séquençage standard, ce qui signifie que c'est moins cher et plus rapide. Elle peut aussi détecter des marqueurs génétiques que les arrays pourraient manquer. De plus, ça peut améliorer la puissance des études sur l'impact des gènes sur les maladies et les traits.
Méthodes de Préparation de la bibliothèque
Une étape clé du séquençage est la préparation de l'ADN, connue sous le nom de préparation de la bibliothèque. Cela peut avoir un grand impact sur la qualité des résultats. Plusieurs méthodes existent pour la préparation de la bibliothèque, mais de nombreux chercheurs manquent de directives pour les configurations à faible couverture, rendant le choix difficile.
En choisissant une méthode, les scientifiques prennent en compte des facteurs comme le coût, le temps et la qualité des données produites. Plusieurs méthodes ont été comparées dans cette étude, y compris un workflow KAPA HyperPlus miniaturisé, un workflow Illumina DNA Prep et des kits IDT, tant miniaturisés que de taille normale.
Différences entre les kits
Le kit Illumina DNA Prep utilise une méthode de tagmentation, qui peut introduire un certain biais selon le contenu en GC de l'ADN. Pourtant, il a montré moins de biais comparé à d'autres méthodes de tagmentation. Les autres kits utilisent des méthodes de ligation, qui sont similaires à bien des égards mais qui diffèrent dans certains détails.
Miniaturiser les réactions de préparation de bibliothèque peut réduire les coûts sans diminuer la qualité des bibliothèques produites. Cela implique souvent d'automatiser le processus pour minimiser les erreurs et augmenter l'efficacité. Cependant, la miniaturisation n'est pas toujours possible selon l'équipement de manipulation des liquides disponible.
Évaluation des kits de préparation de bibliothèque
Dans cette étude, 96 échantillons d'ADN humain ont été obtenus pour évaluer différents kits de préparation de bibliothèque. Les échantillons ont été dilués et préparés en utilisant trois méthodes miniaturisées, tandis qu'une a été préparée en taille normale.
Les kits de bibliothèque miniaturisés ont été ajustés pour utiliser de plus petits volumes de réaction, permettant ainsi des économies de coût. Chaque méthode suivait des instructions spécifiques, avec quelques ajustements faits pour éviter la sur-fragmentation.
Principaux indicateurs de performance
Ces kits de bibliothèque ont été évalués sur plusieurs indicateurs importants, y compris la quantité totale d'ADN séquencé, la couverture, les Taux de duplication et la précision des Appels de génotypes.
La quantité moyenne d'ADN séquencé à partir de chaque échantillon variait parmi les kits impliqués, certains montrant une meilleure sortie que d'autres. La performance en termes de couverture variait aussi, avec les bibliothèques IDT mini et les bibliothèques IDT de taille normale montrant des résultats différents.
Séquençage et analyse des données
Après la préparation de la bibliothèque, les échantillons ont été regroupés et séquencés. L'objectif était d'atteindre environ 0,5X de couverture pour chaque échantillon. Les données séquencées ont ensuite été alignées avec un génome de référence pour aider à analyser les variations génétiques.
Pour évaluer la performance de chaque kit de préparation de bibliothèque, des indicateurs comme le total de bases séquencées, la couverture brute, la couverture effective, les taux de duplication et la précision de l'imputation ont été mesurés. La couverture effective fait référence à la manière dont les données de séquençage sont réparties de manière uniforme selon les directives pour obtenir des appels de génotypes précis.
Observations
Les échantillons IDT avaient une sortie moyenne plus basse comparée aux autres. Cette différence était probablement due à la manière dont les bibliothèques étaient quantifiées et regroupées. Pour le séquençage à faible couverture, des taux de duplication élevés peuvent entraîner des efforts gaspillés, car les mêmes zones d'ADN sont séquencées plusieurs fois.
Les taux de duplication variaient aussi entre les kits. Les kits IDT avaient les taux les plus élevés, tandis que le kit Roche mini avait les plus bas. Ces différences dans les taux de duplication peuvent affecter l'efficacité de l'imputation, ce qui est crucial pour prédire précisément les génotypes.
Performance de l'imputation
L'imputation est le processus de prédiction des génotypes manquants basés sur les données disponibles. Dans cette étude, une haute précision a été observée à travers tous les kits de bibliothèque. La corrélation entre les génotypes imputés et réels était constante, avec des corrélations s'améliorant à mesure que la fréquence des allèles mineurs augmentait.
Les échantillons mini d'Illumina ont généralement mieux performé en précision d'imputation à travers différentes catégories, tandis que les bibliothèques mini IDT avaient la précision la plus basse. Cette baisse de performance est probablement liée aux taux de duplication plus élevés et aux tailles d'insertion plus petites observées pendant le séquençage.
Succès de la miniaturisation
L'effort pour miniaturiser le kit de préparation de bibliothèque IDT a été un succès, bien que certaines différences de performance aient été notées par rapport au kit de taille normale. Plus particulièrement, la version miniaturisée n'a eu besoin d'aucuns échantillons répétés pendant la préparation, tandis que les autres kits miniaturisés en nécessitaient.
Les bibliothèques miniaturisées ont entraîné des économies de coût significatives, bien que les investissements dans l'équipement d'automatisation puissent influencer le coût global.
Facilité d'utilisation et opérations du laboratoire
Préparer ces kits de bibliothèque est simple, le processus entier prenant généralement moins de trois heures. La méthode mini d'Illumina était la plus rapide, nécessitant seulement environ deux heures, tandis que les autres méthodes prenaient environ trois heures.
Différentes méthodes nécessitaient aussi des quantités variées de manipulation manuelle. Les méthodes basées sur la tagmentation impliquaient plus d'étapes comparées aux kits basés sur la ligation. Les chercheurs doivent considérer l'équipement existant en décidant quelle méthode utiliser, car les setups de laboratoire existants peuvent impacter l'efficacité.
Conclusion
Le séquençage du génome entier à faible couverture avec imputation offre une alternative valable aux arrays de génotypage traditionnel à haute densité. Cette méthode fournit des informations supplémentaires sur les données génétiques et peut considérablement améliorer les études axées sur les traits complexes.
Choisir la bonne méthode de préparation de bibliothèque est crucial pour maximiser la sortie tout en contrôlant les coûts. Tous les kits évalués ont montré de solides performances, mais les différences en couverture effective et en taux de duplication ont mis en lumière l'importance d'une sélection minutieuse selon les besoins de recherche spécifiques.
En résumé, le choix du kit de préparation de bibliothèque dépendra de divers facteurs, y compris l'automatisation, le temps, le coût et les exigences spécifiques de chaque étude. Des améliorations futures dans la miniaturisation des méthodes de préparation de bibliothèque devraient continuer à réduire les coûts et à améliorer l'efficacité des études génomiques.
Titre: A comparison between low-cost library preparation kits for low coverage sequencing
Résumé: In the fields of human health and agricultural research, low coverage whole-genome sequencing followed by imputation to a large haplotype reference panel has emerged as a cost-effective alternative to genotyping arrays for assaying large numbers of samples. However, a systematic comparison of library preparation methods tailored for low coverage sequencing remains absent in the existing literature. In this study, we evaluated one full sized kit from IDT and miniaturized and evaluated three Illumina-compatible library preparation kits--the KAPA HyperPlus kit (Roche), the DNA Prep kit (Illumina), and an IDT kit--using 96 human DNA samples. Metrics evaluated included imputation concordance with high-depth genotypes, coverage, duplication rates, time for library preparation, and additional optimization requirements. Despite slightly elevated duplication rates in IDT kits, we find that all four kits perform well in terms of imputation accuracy, with IDT kits being only marginally less performant than Illumina and Roche kits. Laboratory handling of the kits was similar: thus, the choice of a kit will largely depend on (1) existing or planned infrastructure, such as liquid handling capabilities, (2) whether a specific characteristic is desired, such as the use of full-length adapters, shorter processing times, or (3) use case, for instance, long vs short read sequencing. Our findings offer a comprehensive resource for both commercial and research workflows of low-cost library preparation methods suitable for high-throughput low coverage whole genome sequencing.
Auteurs: Jeremiah H Li, C. M. Stewart, M. J. Gibson, J.-Y. Parsa
Dernière mise à jour: 2024-01-31 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.01.30.578044
Source PDF: https://www.biorxiv.org/content/10.1101/2024.01.30.578044.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.