popDMS: Ein neuer Ansatz zur Analyse von Proteinmutatione
popDMS verbessert die Analyse von Mutationswirkungen in Proteinen durch fortschrittliche Techniken.
― 4 min Lesedauer
Inhaltsverzeichnis
Die Beziehung zwischen der Sequenz eines Proteins und seinen Eigenschaften ist eine zentrale Frage in der Biologie und Technik. In den letzten Jahren sind neue Methoden entstanden, um zu untersuchen, wie Veränderungen in Proteinsequenzen deren Funktionen beeinflussen. Eine dieser Methoden nennt sich Deep Mutational Scanning (DMS), die es Wissenschaftlern ermöglicht, viele Mutationen gleichzeitig zu testen. Diese Methode beginnt mit der Erstellung einer grossen Bibliothek von Proteinvarianten. Diese Varianten werden dann getestet, um herauszufinden, welche funktional sind und welche nicht. Indem man die Anzahl jeder Variante vor und nach den Tests vergleicht, können Forscher abschätzen, wie die Mutationen die Funktion des Proteins beeinflusst haben.
DMS wurde in vielen Bereichen eingesetzt, wie zum Beispiel bei der Untersuchung von Enzymen und den Proteinen von Viren wie Influenza und HIV. Trotz des Erfolgs kann die Analyse der Ergebnisse von DMS-Experimenten inkonsistent sein. Verschiedene Methoden zur Interpretation der Daten führen oft nur zu schwachen Verbindungen zwischen den Ergebnissen wiederholter Experimente. Das lässt viele unerklärte Unterschiede in den Ergebnissen zurück.
Probleme mit aktuellen Analyse-Methoden
Einige der gängigen Methoden zur Analyse von DMS-Daten bestehen darin, das Verhältnis der Variantenhäufigkeiten vor und nach der Selektion zu betrachten. Allerdings können diese Verhältnis-Methoden stark von zufälligem Rauschen beeinflusst werden, besonders wenn es nur wenige Instanzen einer Variante gibt. Andere Methoden, die statistische Modelle verwenden, scheinen besser abzuschneiden, lassen aber immer noch viel Unsicherheit hinsichtlich der Auswirkungen verschiedener Mutationen.
Einführung einer neuen Methode: popDMS
Um diese Herausforderungen anzugehen, wurde eine neue Methode namens popDMS entwickelt. Diese Methode nutzt Ideen aus der Populationsgenetik, um die Auswirkungen von Mutationen abzuschätzen. In diesem Ansatz wird der Prozess der Auswahl funktioneller Proteinvarianten als ähnlich zu der Funktionsweise der natürlichen Selektion in lebenden Organismen betrachtet. Die Methode weist jedem Mutation einen Selektionskoeffizienten zu, der angibt, wie sehr diese Mutation die Funktionalität des Proteins unterstützt oder behindert.
Durch die Verwendung fortschrittlicher statistischer Methoden kann popDMS berechnen, wie wahrscheinlich es ist, spezifische Änderungen in der Häufigkeit von Varianten zu beobachten, je nach ihren Selektionskoeffizienten. Die Methode nutzt dann Bayessche Inferenz, um die Selektionskoeffizienten zu finden, die am besten mit den experimentellen Daten übereinstimmen.
Stärken von popDMS
popDMS hat mehrere Vorteile. Erstens verhindert es, durch die Verwendung vorheriger Verteilungen für die Selektionskoeffizienten, dass die Methode starke Effekte beansprucht, wenn die Daten sie nicht stützen. Dieser Bayessche Ansatz ermöglicht es, Informationen aus verschiedenen experimentellen Wiederholungen zu kombinieren, was zu zuverlässigeren Schätzungen der Mutationswirkungen führt. Wenn Informationen über Sequenzierungsfehler vorliegen, kann popDMS auch diese Fehler in den Variantenhäufigkeitsdaten korrigieren.
Tests haben gezeigt, dass popDMS weniger empfindlich auf zufälliges Rauschen reagiert und stärkere Korrelationen zwischen den analysierten Effekten über verschiedene Experimente hinweg bietet als gängige Methoden.
Analyse von DMS-Datensätzen
Die Leistung von popDMS wurde an 25 verschiedenen DMS-Datensätzen getestet, die mit verschiedenen experimentellen Techniken erstellt wurden. Die Ergebnisse zeigten, dass die von popDMS geschätzten Selektionskoeffizienten konsistenter über verschiedene Experimente hinweg waren im Vergleich zu früheren Methoden. Die Methode lieferte auch sinnvolle Visualisierungen, die halfen, die funktionalen Effekte der Mutationen besser zu verstehen.
Im Vergleich der Mutationswirkungen, die von popDMS und früheren Methoden bestimmt wurden, zeigte sich ein gutes Mass an Übereinstimmung. Allerdings wurden einige Unterschiede festgestellt, insbesondere darin, wie popDMS Mutationen mit hohen Anfangshäufigkeiten im Vergleich zu solchen mit niedrigen Frequenzen behandelt. Dieser Unterschied entsteht, weil andere Methoden typischerweise häufige und seltene Varianten unterschiedlich analysieren.
Inferring Epistatic Interactions
Neben der Bewertung individueller Mutationen kann popDMS auch Interaktionen zwischen Mutationenpaaren, bekannt als epistatische Interaktionen, schätzen. Forscher testeten diese Fähigkeit an einem spezifischen Datensatz und fanden, dass die Ergebnisse mit früheren Erkenntnissen übereinstimmten. Allerdings identifizierte popDMS weniger epistatische Interaktionen als frühere Methoden, was darauf hindeutet, dass es sich mehr auf die relevantesten Interaktionen konzentrieren könnte. Dieser selektive Ansatz kann Forschern helfen, sich auf die biologisch signifikantesten Ergebnisse zu konzentrieren.
Fazit
Zusammenfassend bietet popDMS eine zuverlässige und effiziente Möglichkeit, die Mutationswirkungen aus DMS-Daten zu interpretieren, basierend auf den Prinzipien der Evolution. In verschiedenen Tests und Datensätzen lieferte popDMS konsistentere Ergebnisse im Vergleich zu traditionellen Analysemethoden. Seine Fähigkeit, Daten aus wiederholten Experimenten zu kombinieren und Interaktionen zwischen Mutationen zu analysieren, macht es zu einem wertvollen Werkzeug für Forscher, die sich mit Proteinfunktionen beschäftigen. Die Methode ist in Python und C++ implementiert und kann mit verschiedenen Datenformaten arbeiten, was sie für Wissenschaftler, die ihre Ergebnisse analysieren möchten, zugänglich macht.
Titel: popDMS infers mutation effects from deep mutational scanning data
Zusammenfassung: Deep mutational scanning (DMS) experiments provide a powerful method to measure the functional effects of genetic mutations at massive scales. However, the data generated from these experiments can be difficult to analyze, with significant variation between experimental replicates. To overcome this challenge, we developed popDMS, a computational method based on population genetics theory, to infer the functional effects of mutations from DMS data. Through extensive tests, we found that the functional effects of single mutations and epistasis inferred by popDMS are highly consistent across replicates, comparing favorably with existing methods. Our approach is flexible and can be widely applied to DMS data that includes multiple time points, multiple replicates, and different experimental conditions.
Autoren: John P Barton, Z. Hong
Letzte Aktualisierung: 2024-01-31 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.01.29.577759
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.01.29.577759.full.pdf
Lizenz: https://creativecommons.org/licenses/by-nc/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.