Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Gesundheitswissenschaften# Genetische und genomische Medizin

Fortschritte in der Analyse von Tandemwiederholungen

Neue Tools verbessern das Studium von DNA-Tandemwiederholungen, die mit Krankheiten verbunden sind.

― 7 min Lesedauer


ForschungsfortschritteForschungsfortschrittebei TandemwiederholungenKrankheiten.der Zusammenhänge genetischerNeue Tools verbessern das Verständnis
Inhaltsverzeichnis

Tandem-Wiederholungen sind Sequenzen in unserem DNA, wo ein bestimmtes Muster mehrfach wiederholt wird. Diese Muster können genau wiederholt, von anderen Sequenzen unterbrochen oder in ihrer Zusammensetzung verändert sein. Die Untersuchung dieser Wiederholungen ist wichtig, weil sie mit verschiedenen Eigenschaften und Krankheiten bei Menschen verknüpft sein können.

Frühe Methoden zur Analyse von Tandem-Wiederholungen

Früher haben Wissenschaftler spezielle Methoden verwendet, um Tandem-Wiederholungen zu analysieren. Techniken wie repeat-primed PCR, Sanger-Sequenzierung und Southern Blotting waren gängig. Diese Methoden waren jedoch langsam und erforderten viel manuelle Arbeit. Ausserdem gaben sie kein vollständiges Bild der Eigenschaften der Wiederholungen.

Fortschritte in der Sequenzierungstechnologie

Mit dem Aufkommen moderner Kurzlesesequenzierungstechnologien standen Wissenschaftler vor Herausforderungen, wenn sie mit längeren Tandem-Wiederholungen arbeiteten. Wenn eine Wiederholung länger ist als die Grösse der Sequenzierung, wird es schwierig, ihre genaue Grösse zu bestimmen. Dennoch sind spezialisierte Methoden entstanden, die es ermöglichen, Populationen zu untersuchen, um Tandem-Wiederholungen zu identifizieren, die mit bestimmten Eigenschaften und Krankheiten verbunden sind.

Mit dem Fortschritt der Technologie wurde die Langlesesequenzierung verfügbar. Techniken wie Nanopore- und PacBio-Sequenzierung ermöglichen es Forschern, die Länge, Zusammensetzung und sogar den Methylierungsstatus dieser Wiederholungen direkt zu beobachten. Die Wissenschaft rund um Tandem-Wiederholungen entwickelt sich weiterhin, und neue Tools zur Genotypisierung und zum Vergleich von Ergebnissen wurden eingeführt.

Entdeckungen zu Tandem-Wiederholungen

Jüngste Fortschritte in der Sequenzierungstechnologie haben zu neuen Erkenntnissen über Tandem-Wiederholungen und ihre Verbindungen zu menschlichen Krankheiten geführt. Derzeit wurden 68 verschiedene Wiederholungen identifiziert, die mit verschiedenen Krankheiten in Verbindung stehen, obwohl nicht alle von ihnen als schädlich bestätigt sind. Diese Sammlung von Tandem-Wiederholungen wird als entscheidend für das Verständnis medizinischer Implikationen angesehen.

Die Länge und Zusammensetzung dieser Wiederholungen sind wichtige Faktoren zur Bestimmung, ob sie möglicherweise eine bestimmte Krankheit verursachen. Eine Datenbank von Genotypen von Tandem-Wiederholungen hilft dabei, einzuschätzen, ob eine bestimmte Wiederholung wahrscheinlich schädlich oder nur eine häufige Variation in der Allgemeinbevölkerung ist.

Die Rolle der Populationssequenzierung

Langlesesequenzierungstechnologien haben sich verfeinert und sind jetzt für grossangelegte Bevölkerungsstudien anwendbar. Die Genomik-Community legt Wert darauf, Daten kostenlos verfügbar zu machen. Diese Offenheit ist vorteilhaft für die Interpretation genetischer Varianten, insbesondere bei seltenen Krankheiten.

In diesem Zusammenhang wurde eine neue Webanwendung namens pathSTR entwickelt, um die Längen und Sequenzen von medizinisch relevanten Tandem-Wiederholungen zu visualisieren. Nutzer können ihre eigenen genetischen Daten mit einer Kontrollgruppe vergleichen. Aktuell enthält die Datenbank Informationen von 878 Individuen, die mit fortschrittlicher Technologie sequenziert wurden.

Wie pathSTR funktioniert

Die pathSTR-Web-App ermöglicht es Nutzern, zu sehen, wie die Längen und Sequenzen von Tandem-Wiederholungen unter einer grossen Gruppe von Individuen variieren. Nutzer können die Gesamtlänge jeder Wiederholung visualisieren, sehen, wie sie sich mit einem Referenzgenom vergleicht, und krankheitsspezifische Cut-Off-Längen bewerten. Die Anwendung unterstützt auch verschiedene Visualisierungsformate, um die Daten leichter interpretierbar zu machen.

In pathSTR werden die genetischen Details mit einem Tool namens STRdust analysiert. Dieses Tool identifiziert die Grössen und Zusammensetzungen von Tandem-Wiederholungen effektiv, selbst wenn die Sequenzdaten nicht die erforderliche Tiefe und Abdeckung aufweisen.

Visualisierung von Wiederholungslängen

Die App bietet verschiedene Möglichkeiten zur Visualisierung der Wiederholungslängen. Nutzer können Scatter-Plots sehen, die die Längen der verschiedenen Allele für spezifische Wiederholungen darstellen. Violin-Plots können veranschaulichen, wie die Wiederholungslängen unter verschiedenen Bevölkerungsgruppen und Geschlechtern variieren. Jede dieser Visualisierungen hilft zu verstehen, wie bestimmte Wiederholungen mit bekannten pathogenen Längen zusammenhängen.

Visualisierung von Wiederholungssequenzen

Neben den Längen bietet pathSTR Visualisierungen für die Zusammensetzung von Tandem-Wiederholungen. Nutzer können die rohen Frequenzen von Motiven einsehen, ähnliche Proben gruppieren oder individuelle Sequenzen häufig beobachteter Motive entlang der Wiederholungslänge sehen. Diese Informationen sind wertvoll für die Bewertung der genetischen Zusammensetzung von Wiederholungen.

Bewertung von pathogenen Wiederholungen

Einige Tandem-Wiederholungen haben unsichere Verbindungen zu Krankheiten. Zum Beispiel hat eine spezifische Wiederholung, die mit der Duchenne-Muskeldystrophie assoziiert ist, Fragen zu ihrer Pathogenität aufgeworfen. Die Bewertung der Frequenz bestimmter erweiterter Allele mit pathSTR kann helfen, diese Unklarheiten zu klären.

In einer Studie wurde klar, dass die Anwesenheit erweiterter Allele in der Allgemeinbevölkerung zu hoch war, um mit der Krankheit in Verbindung gebracht zu werden. Die Anwendung ermöglichte klarere Einblicke in diese komplexe Beziehung, was darauf hindeutet, dass diese Wiederholungen möglicherweise nicht die direkte Ursache der Erkrankung sind.

Hochladen persönlicher Daten

Nutzer können auch ihre eigenen Genotypen von Tandem-Wiederholungen in die pathSTR-Anwendung hochladen zur Analyse. Zum Beispiel wurde bei einem Patienten mit Myotoner Dystrophie Typ 1 die Länge seiner Wiederholungen angezeigt und mit der Kontrollgruppe verglichen. Die Ergebnisse zeigten, dass die Wiederholungsänge dieses Patienten tatsächlich über dem vorab festgelegten pathogenen Schwellenwert lagen.

Sensitivität in der Genotypisierung

PathSTR legt grossen Wert auf Sensitivität bei der Erkennung von langen Allelen, trotz der Herausforderungen, die die Sequierungstiefe in den Kontrolldaten mit sich bringt. Die Anwendung hebt die Bedeutung der Verwendung fortschrittlicher Tools wie STRdust hervor, die zuverlässige Genotypisierungsergebnisse für Tandem-Wiederholungen liefern können.

Wichtigkeit der Vorsicht bei der Interpretation

Obwohl pathSTR erheblich bei der Interpretation von Tandem-Wiederholungen hilft, ist es wichtig, die Ergebnisse mit Bedacht zu betrachten. Die pathogenen Längen aus anderen Datenbanken sollten zusammen mit den neuesten Daten berücksichtigt werden. Wenn mehr Patienten und Kontrollen sequenziert werden, könnten Überprüfungen der bestehenden pathogenen Längen notwendig sein, um die Genauigkeit sicherzustellen.

Wiederholte Sequenzen, die in der Nähe von Tandem-Wiederholungen existieren, können den Interpretationsprozess komplizierter machen. In einigen Fällen werden mehrere Wiederholungen gleichzeitig bewertet, was es schwierig macht, die wahre pathogene Natur einer Tandem-Wiederholung zu bestimmen.

Die Rolle der Sequenzzusammensetzung

Die Zusammensetzung der Sequenz spielt ebenfalls eine Schlüsselrolle bei der Bewertung des pathogenen Potenzials von Tandem-Wiederholungen. In einigen Fällen werden nur bestimmte Zusammensetzungen als schädlich angesehen, während ähnliche Sequenzen ohne diese besonderen Motive in gesunden Individuen gefunden werden können. Daher ist es entscheidend, die Zusammensetzung zusammen mit der Länge zu prüfen, um eine genaue Interpretation zu gewährleisten.

Zukünftige Entwicklungen und Forschung

Der aktuelle pathSTR-Datensatz bietet keine Informationen über DNA-Methylierung, einen wichtigen Aspekt, der das Verhalten von Tandem-Wiederholungen beeinflussen kann. Zukünftige Updates könnten diese Daten integrieren und einen umfassenderen Blick darauf geben, wie diese Sequenzen die Gesundheit beeinflussen.

Mit dem Fortschritt der Sequierungstechnologien wird die pathSTR-Datenbank weiterhin mit neuen Bevölkerungssequenzierungsbemühungen und zusätzlichen Tandem-Wiederholungen, die als medizinisch relevant identifiziert wurden, erweitert. Dies wird unser Verständnis von Tandem-Wiederholungen und ihren Verbindungen zu menschlichen Krankheiten verbessern.

Qualitätskontrollmassnahmen

Um die Zuverlässigkeit der in pathSTR verwendeten Daten sicherzustellen, wurden Qualitätskontrollmassnahmen implementiert. Werkzeuge wurden eingesetzt, um wichtige Kennzahlen, einschliesslich Bibliotheksausbeute und Abdeckung pro Chromosom, zu bestimmen. Proben mit niedriger Abdeckung wurden von der Analyse ausgeschlossen, um hochwertige Ergebnisse zu gewährleisten.

Genotypisierungs-Methoden im Detail

Die Genotypisierung von Tandem-Wiederholungen für pathSTR wurde mit einem spezialisierten Tool durchgeführt, das mithilfe fortschrittlicher Programmiertechniken arbeitet. Dieser Ansatz ermöglicht es Forschern, genomische Daten zu analysieren, ohne sie lokal speichern zu müssen, was es effizienter macht.

Das System zur Genotypisierung von Tandem-Wiederholungen ist benutzerfreundlich gestaltet, sodass Forscher sich auf die Spezifika medizinisch relevanter Sequenzen konzentrieren können. Die Software wurde mit anderen Tools verglichen, um Genauigkeit und Effektivität in der Genotypisierung sicherzustellen.

Technische Aspekte der pathSTR-Web-App

Die pathSTR-Web-App verwendet benutzerfreundliche Programmierung, um komplexe Daten in einem zugänglichen Format darzustellen. Sie nutzt moderne Bibliotheken zur Datenmanipulation und -visualisierung, um Nutzern zu helfen, Tandem-Wiederholungssequenzen effektiv zu erkunden.

Die Infrastruktur der Anwendung sorgt für schnellen Zugang zu den Daten und effiziente Visualisierung. Durch die Aufschlüsselung komplexer Ergebnisse in interaktive Plots können Nutzer die Resultate zu Tandem-Wiederholungen leicht interpretieren.

Fazit

Die Studie und Analyse von Tandem-Wiederholungen spielen eine kritische Rolle beim Verständnis genetischer Variationen, die mit menschlichen Krankheiten in Verbindung stehen. Tools wie pathSTR ermöglichen eine fortschrittliche Visualisierung und den Vergleich dieser Wiederholungen, was Forschern und Klinikern erheblich bei ihren Untersuchungen hilft.

Während die Technologie weiterhin verbessert wird und mehr Daten verfügbar werden, werden die Erkenntnisse aus der Untersuchung von Tandem-Wiederholungen wahrscheinlich zu besseren Diagnosen und therapeutischen Strategien führen. Die kontinuierliche Zusammenarbeit innerhalb der Genomik-Community und die Nutzung offener Daten werden unser Verständnis dieser wichtigen genetischen Elemente weiter verbessern.

Originalquelle

Titel: Medically relevant tandem repeats in nanopore sequencing of control cohorts

Zusammenfassung: Research and diagnostics for medically relevant tandem repeats and repeat expansions are hampered by the lack of population-scale databases. We attempt to fill this gap using our pathSTR web tool, which leverages long-read sequencing of large cohorts to determine repeat length and sequence composition in the general population. The current version includes 878 individuals of the 1000 Genomes Project cohort sequenced on the Oxford Nanopore Technologies PromethION. A comprehensive set of medically relevant tandem repeats were genotyped using STRdust to determine the tandem repeat length and sequence composition. PathSTR provides rich visualizations of this dataset, as well as the feature to upload ones own data for comparison along the control cohort. We demonstrate the implementation of this application using data from targeted nanopore sequencing of a patient with Myotonic Dystrophy type 1. This resource will empower the genetics community to get a more complete overview of normal variation in tandem repeat length and sequence composition, and enable a better assessment of the pathogenic impact of tandem repeats observed in patients. PathSTR is available at https://pathstr.bioinf.be

Autoren: Wouter De Coster, I. Hoijer, I. Bruggeman, S. D'Hert, M. Melin, A. Ameur, R. Rademakers

Letzte Aktualisierung: 2024-03-14 00:00:00

Sprache: English

Quell-URL: https://www.medrxiv.org/content/10.1101/2024.03.06.24303700

Quell-PDF: https://www.medrxiv.org/content/10.1101/2024.03.06.24303700.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel