Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Gesundheitswissenschaften# Genetische und genomische Medizin

Die Auswirkungen von Tandemwiederholungen auf die Gesundheit verstehen

Tandem-Wiederholungen in DNA hängen mit verschiedenen genetischen Erkrankungen und Problemen bei der Entdeckung zusammen.

― 7 min Lesedauer


Tandem-Wiederholungen undTandem-Wiederholungen undgenetische StörungenDiagnostik von Krankheiten dar.Herausforderungen in der Genetik undTandem-Wiederholungen stellen
Inhaltsverzeichnis

Tandem-Wiederholungen (TRs) sind Muster in unserer DNA, wo kleine Segmente immer wieder wiederholt werden. Die können kurz sein, nennt man kurze Tandem-Wiederholungen (STRs), die sind 1 bis 6 Basenpaare lang, oder längere, die variable Anzahl Tandem-Wiederholungen (VNTRs) heissen, und die sind 7 oder mehr Basenpaare lang. Zusammen machen diese TRs etwa 3% des menschlichen Genoms aus. Leider sind sie mit vielen Krankheiten beim Menschen verbunden. STRs allein tragen zu einer Vielzahl genetischer Störungen bei, mit über 60 Krankheiten, die mit der Ausweitung dieser Wiederholungen verknüpft sind. Etwa 1 von 3.000 Menschen wird geschätzt, dass sie von diesen STR-Bedingungen betroffen sind, und viele von denen bleiben undiagnostiziert.

Herausforderungen bei der Entdeckung von Tandem-Wiederholungen

Ein Grund, warum TR-bezogene Krankheiten oft unentdeckt bleiben, ist die Schwierigkeit, diese Varianten zu erkennen und zu interpretieren. Im Gegensatz zu einzelnen Nukleotidvarianten (SNVs), die leichter zu untersuchen sind, sind TRs komplex und nicht gut verstanden. Forscher hatten erhebliche Schwierigkeiten, diese repetitiven Sequenzen zu analysieren, da es Probleme gab, sie genau im Genom zu kartieren. Wegen dieser technischen Probleme wurden TRs oft ignoriert, selbst mit den Fortschritten in der Sequenzierungstechnologie der nächsten Generation.

Die Kurzlesesequenzierung hat Probleme mit TRs, weil die Länge der Wiederholungen ähnlich oder sogar länger sein kann als die Sequenzlesungen selbst. Die Langlesesequenzierung hat einige Vorteile, weil sie längere DNA-Stücke lesen kann, aber sie hat auch ihre eigenen Herausforderungen, wie Rauschen durch den Sequenzierungsprozess und geringe Abdeckung der Wiederholungen. Daher werden TRs häufig in genetischen Studien ausgeschlossen oder nur bekanntere untersucht. Diese mangelnde Aufmerksamkeit ist eine erhebliche Lücke, besonders da TRs einige der "fehlenden Heritabilität" in genetischen Krankheiten erklären könnten.

Die Komplexität der Interpretation von TR-Varianten

Wenn Forscher TRs in genetische Tests einbeziehen, bleibt die Interpretation der gefundenen Varianten kompliziert. Gängige Methoden zur Filterung genetischer Daten, wie das Betrachten von Vererbungsmustern oder Sequenzierungstiefe, können einige Einblicke geben, aber TRs fügen zusätzliche Komplexitätsschichten hinzu. Zum Beispiel, während die meisten TRs in kodierenden Regionen des Genoms liegen, können einige wichtige Rollen in nicht-kodierenden Bereichen spielen. Daten zur Populationsfrequenz aus umfassenden Studien, die Tausende von Individuen einbeziehen, können helfen, seltene Varianten zu identifizieren, die mit Krankheiten verbunden sind, aber die normalen Wiederholungsbereiche für TRs basieren oft auf viel kleineren Studien.

TRs mutieren auch in viel höheren Raten als nicht-repetitive Bereiche des Genoms. Diese hohe Mutabilität kann je nach Abstammung erheblich variieren, was es noch schwieriger macht, diese Varianten zu verstehen und zu interpretieren. Viele TR-bezogene Krankheiten sind bekannt dafür, dass sie unklare pathogenetische Schwellenwerte haben - der Punkt, an dem eine Wiederholungs-länge schädlich wird - was ein Thema ongoing Forschung ist.

Der Bedarf an Katalogisierung von TR-Funktionen

Wegen der Komplexität, die mit TR-Krankheiten verbunden ist, gibt es einen klaren Bedarf, die Merkmale dieser Loci sowohl für diagnostische als auch für Forschungszwecke zu katalogisieren. Einige TR-Krankheiten sind in verschiedenen Ressourcen dokumentiert, aber das Informationsniveau kann inkonsistent sein. Online genetische Ressourcen bieten wertvolle Informationen, aber sie konzentrieren sich nicht immer speziell auf TRs und könnten prägnante, umsetzbare Daten vermissen.

STRchive ist eine dynamische Ressource, die Informationen über TR-Krankheitsloci beim Menschen bündelt, indem sie aktuelle Literatur, Forschungsergebnisse und grossangelegte genomische Datenbanken nutzt. Diese Ressource zielt darauf ab, den Prozess der Identifizierung und des Verständnisses von TR-Varianten zu vereinfachen. Durch die Kombination von automatisierten Systemen und Expertenaufsicht sorgt STRchive für die Genauigkeit und Aktualität seiner Inhalte.

Beitrag zum Verständnis von TR-Krankheitsloci

STRchive enthält derzeit Informationen zu 68 krankheitsassoziierten Loci, die aus Literatur, klinischen Berichten und grossen genomischen Datenbanken stammen. Die Auswahl der TR-Loci basiert auf mehreren Beweisen, um Zuverlässigkeit zu gewährleisten. Jeder Locus enthält wichtige Daten wie genomische Lage, Wiederholungsmotive und die Bereiche von Allelen, die als normal oder pathogen betrachtet werden.

Ein automatisiertes System aktualisiert regelmässig die Datenbank mit neuer Literatur. Dies wird durch manuelle Kuratierung und Beiträge von Experten auf diesem Gebiet ergänzt. Infolgedessen kann STRchive detaillierte Informationen für jeden krankheitsassoziierten Locus bereitstellen, von dem DNA-Sequenzkontext bis hin zu spezifischen allelischen Grössenbereichen, die für die Pathogenität relevant sind.

Bewertung der Auswirkungen von TR-Krankheiten

Forschungen haben gezeigt, dass viele TR-Krankheiten bereits in der Kindheit auftreten können, was der allgemeinen Annahme widerspricht, dass sie hauptsächlich Erwachsene betreffen. Tatsächlich können 82% der dokumentierten TR-Bedingungen Kinder betreffen, und über ein Drittel kann Symptome im ersten Lebensjahr zeigen. Diese Erkenntnis unterstreicht die Notwendigkeit, mehr Bewusstsein für TR-Krankheiten in jüngeren Bevölkerungsgruppen zu schaffen, insbesondere da einige dieser Bedingungen zu schweren gesundheitlichen Folgen führen können.

Die Beziehung zwischen Allelgrösse, klinischen Ergebnissen und Alter des Auftretens ist auch entscheidend für das Verständnis von TR-Krankheiten. Grössere Wiederholungserweiterungen sind oft mit einem früheren Auftreten und schwereren Symptomen verbunden. Zum Beispiel tritt die Huntington-Krankheit typischerweise im Erwachsenenalter auf, aber grössere Erweiterungen können bei jüngeren Personen Symptome hervorrufen.

Motif-Komplexität und Varianteninterpretation

STRchive dokumentiert die verschiedenen Motive, die an jedem Locus identifiziert wurden, die nach ihrer Bedeutung in Bezug auf die Gesundheit klassifiziert sind. In vielen Fällen ist das Referenzmotiv im Genom das pathogenetische, was bedeutet, dass die Pathogenität hauptsächlich durch die Grösse der Wiederholung bestimmt wird. Allerdings haben einige Loci mehrere Motive mit unterschiedlichen pathogenetischen Bedeutungen. Daher ist es eine ständige Herausforderung, die biologischen Konsequenzen dieser Motive zu bestimmen.

Die Informationen, die in STRchive verfügbar sind, können helfen zu verstehen, wie verschiedene Sequenzen die Gesundheit beeinflussen, was für genaue Diagnosen entscheidend ist. Während die Allelgrösse wichtig ist, um mögliche gesundheitliche Ergebnisse zu bestimmen, können die Sequenzen selbst und alle Unterbrechungen darin ebenfalls eine wichtige Rolle spielen.

Nutzung von Populationsdaten für die TR-Analyse

Die Analyse von Bevölkerungsdaten kann unser Verständnis von TR-Loci erheblich verbessern. Die Genome Aggregation Database (gnomAD) bietet Genotypisierungsdaten aus einer grossen Bevölkerung, die es Forschern ermöglicht, die Verteilung der Wiederholungsgrössen mit der bekannten Krankheitsprävalenz zu vergleichen. Dadurch kann geschätzt werden, wie verbreitet bestimmte pathogene Genotypen in einer scheinbar unbetroffenen Bevölkerung sind.

Durch den Vergleich dieser Ergebnisse mit Prävalenzschätzungen können Forscher besser verstehen, welchen potenziellen Einfluss spezifische genetische Variationen haben. Allerdings betonen aktuelle Einschränkungen bei den Bevölkerungsdaten die Notwendigkeit umfassenderer Studien, um das gesamte Spektrum der Variationen und deren gesundheitliche Auswirkungen zu erfassen.

Die Rolle von STRchive in Diagnostik und Forschung

STRchive dient als Werkzeugkoffer für Forscher und Kliniker und bietet eine Roadmap zur Bewertung von TR-Varianten im Kontext von Krankheiten. Durch die Synthese bestehender Literatur und Daten sowie die Bereitstellung kuratierter Informationen kann STRchive helfen, zu priorisieren, welche Varianten in klinischen Settings einer genaueren Untersuchung wert sind.

Die Bewertung jeder Variante basierend auf Allelgrösse, Sequenzzusammensetzung und dem assoziierten Phänotyp ermöglicht es Kliniken, informierte Erwartungen für die Ergebnisse von Patienten zu erstellen. Das kann zu genaueren Diagnosen und besserem Patientenmanagement führen.

Zusätzlich können die Ressourcen von STRchive laufende und zukünftige Forschungen zu TR-Krankheiten unterstützen. Die darin enthaltenen Informationen können die Entdeckung neuer Loci unterstützen sowie die Verfeinerung pathogenetischer Schwellenwerte für bekannte Wiederholungserweiterungen.

Fazit

Tandem-Wiederholungen stellen einen bedeutenden, aber oft übersehenen Bereich der menschlichen Genetik dar. Während wir ein umfassenderes Verständnis ihrer Auswirkungen auf die Gesundheit gewinnen, werden Ressourcen wie STRchive entscheidend sein, um Wissenslücken zu schliessen und diagnostische Bemühungen zu verbessern. Angesichts der komplexen Natur von TR-Krankheiten ist die Arbeit zur Katalogisierung und Interpretation dieser Varianten ongoing, aber kritisch für die Verbesserung der Patientenergebnisse, insbesondere in unterrepräsentierten Bevölkerungsgruppen wie Kindern. Fortlaufende Forschung und Fortschritte in der Sequenzierungstechnologie werden helfen, die Rätsel rund um Tandem-Wiederholungen zu entschlüsseln und letztlich unsere Fähigkeit zu verbessern, die damit verbundenen Störungen zu diagnostizieren und zu behandeln.

Originalquelle

Titel: STRchive: a dynamic resource detailing population-level and locus-specific insights at tandem repeat disease loci

Zusammenfassung: Approximately 3% of the human genome consists of repetitive elements called tandem repeats (TRs), which include short tandem repeats (STRs) of 1-6bp motifs and variable number tandem repeats (VNTRs) of 7+bp motifs. TR variants contribute to several dozen mono- and polygenic diseases but remain understudied and "enigmatic," particularly relative to single nucleotide variants. It remains comparatively challenging to interpret the clinical significance of TR variants. Although existing resources provide portions of necessary data for interpretation at disease-associated loci, it is currently difficult or impossible to efficiently invoke the additional details critical to proper interpretation, such as motif pathogenicity, disease penetrance, and age of onset distributions. It is also often unclear how to apply population information to analyses. We present STRchive (S-T-archive, http://strchive.org/), a dynamic resource consolidating information on TR disease loci in humans from research literature, up-to-date clinical resources, and large-scale genomic databases, with the goal of streamlining TR variant interpretation at disease-associated loci. We apply STRchive --including pathogenic thresholds, motif classification, and clinical phenotypes--to a gnomAD cohort of [~]18.5k individuals genotyped at 60 disease-associated loci. Through detailed literature curation, we demonstrate that the majority of TR diseases affect children despite being thought of as adult diseases. Additionally, we show that pathogenic genotypes can be found within gnomAD which do not necessarily overlap with known disease prevalence, and leverage STRchive to interpret locus-specific findings therein. We apply a diagnostic blueprint empowered by STRchive to relevant clinical vignettes, highlighting possible pitfalls in TR variant interpretation. As a living resource, STRchive is maintained by experts, takes community contributions, and will evolve as understanding of TR diseases progresses.

Autoren: Harriet Dashnow, L. Hiatt, B. Weisburd, E. Dolzhenko, G. E. VanNoy, E. N. Kurtas, H. L. Rehm, A. Quinlan

Letzte Aktualisierung: 2024-05-21 00:00:00

Sprache: English

Quell-URL: https://www.medrxiv.org/content/10.1101/2024.05.21.24307682

Quell-PDF: https://www.medrxiv.org/content/10.1101/2024.05.21.24307682.full.pdf

Lizenz: https://creativecommons.org/licenses/by-nc/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel