Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Gesundheitswissenschaften# Gesundheitsinformatik

Neue Bluttestmethode zur COVID-19-Erkennung

Forschung zeigt vielversprechende Ergebnisse bei der Verwendung von Bluttests für schnelle COVID-19-Screenings.

― 6 min Lesedauer


Bluttests zurBluttests zurCOVID-19-Screeningschnellen COVID-19-Erkennung.Studie zeigt effektive Modelle zur
Inhaltsverzeichnis

COVID-19 war ne grosse Gesundheitsbedrohung für Leute weltweit im 21. Jahrhundert. Das Virus hat nicht nur zu vielen Infektionen geführt, sondern sich auch in verschiedene Varianten entwickelt, wie alpha, beta, gamma, delta, lambda und omicron. Diese Varianten können sich leicht verbreiten und stellen weiterhin Risiken dar, besonders neben anderen Krankheiten wie der Grippe. Da sich das Virus weiterentwickelt, ist es wichtig, es schnell zu erkennen. Die Hauptmethode zur Erkennung ist ein Test namens quantitative Real-Time Polymerase-Chain-Reaction (qRT-PCR), aber diese Methode hat auch ihre Nachteile. Zum Beispiel können Fehler beim Entnehmen von Proben von Patienten auftreten, und das Testen kann lange dauern. Ausserdem kann es in Regionen mit einer grossen Bevölkerung schwierig sein, genug Testkits zu bekommen. Daher ist es wichtig, schnellere und günstigere Methoden zu finden, um Leute auf COVID-19 zu testen, besonders in Ländern wie Indien, die eine sehr grosse Bevölkerung haben.

Symptome von COVID-19

Die schwerwiegendsten COVID-19-Fälle betreffen oft eine Lungenentzündung, die eine Reihe von Symptomen verursachen kann, wie Fieber, Husten, Müdigkeit, Kopfschmerzen und Atembeschwerden. Die omicron-Variante verursacht in der Regel mildere Symptome im Vergleich zu früheren Varianten und beeinträchtigt die unteren Teile der Lungen weniger stark. Bei milden Fällen zeigt eine Person möglicherweise gar keine Symptome oder hat nur leichte Lungenentzündung. Moderate Fälle können zu Atemproblemen und niedrigen Sauerstoffwerten führen, während schwere Fälle ernsthafte Gesundheitsprobleme in verschiedenen Organen zur Folge haben können. Patienten mit COVID-19 können auch verschiedene Veränderungen im Blut zeigen, die anzeigen könnten, wie schwer ihre Erkrankung ist. Zum Beispiel können sich Veränderungen in den weissen Blutkörperchen und in der Anzahl der Blutplättchen einstellen. Das bedeutet, dass ein vollständiges Blutbild (CBC) möglicherweise als Möglichkeit genutzt werden könnte, COVID-19 zu identifizieren.

Forschung zu Bluttests und maschinellem Lernen

Verschiedene Forschungsteams haben untersucht, wie CBC-Ergebnisse genutzt werden können, um COVID-19 vorherzusagen. Einige dieser Teams haben maschinelles Lernen (ML) verwendet, um CBC-Daten aus verschiedenen Personengruppen zu analysieren. Die Effektivität dieser Modelle wurde gemessen, und die Ergebnisse zeigten Genauigkeitslevels von 84% bis 87%. Allerdings haben viele dieser Studien nicht getestet, wie gut ihre Vorhersagen in unterschiedlichen ethnischen Gruppen oder Populationen funktionieren. Es wurde festgestellt, dass die Variationen in Blutparametern je nach Ethnie unterschiedlich sein können, aber einige Veränderungen, wie niedrige Lymphozytenzahlen, sind bei COVID-19-Patienten üblich.

In dieser Studie haben wir verschiedene Bluttestergebnisse aus verschiedenen Bevölkerungsgruppen kombiniert, um bessere ML-Modelle zu erstellen und sie an separaten Datensätzen unterschiedlicher Gruppen zu testen. Die beste Leistung wurde mit einem speziellen ML-Ansatz namens eXtreme Gradient Boost (XGBoost) erreicht. Zum ersten Mal haben wir berichtet, wie gut diese Vorhersagemodelle in verschiedenen Populationen funktionierten. Die Modelle schnitten am besten ab, wenn sie mit Daten aus denselben Gruppen trainiert und getestet wurden, aber mit unterschiedlichen Datensätzen.

Beschreibung der Datensätze

Für die Forschung wurden mehrere klinische Datensätze gesammelt. Ein Datensatz (Datensatz 1) kam aus einem Krankenhaus in Brasilien und enthielt Informationen von Patienten zwischen Februar und März 2020, einschliesslich positiver und negativer COVID-19-Fälle. Nach der Verarbeitung des Datensatzes zur Entfernung unvollständiger Aufzeichnungen blieben 2004 Einträge übrig, darunter 558 positive und 1446 negative Fälle. Weitere Datensätze wurden speziell erstellt, um bestimmte Merkmale wie Alter und Bluttestergebnisse zu betrachten.

Datensatz 2 stammte aus einem Krankenhaus in Italien mit 1736 Patienteneinträgen, von denen 52% positiv auf COVID-19 getestet wurden. Dieser Datensatz wurde ebenfalls bereinigt, um Einträge mit fehlenden Daten zu behandeln. Insgesamt blieben nach der Verarbeitung in Datensatz 2a 1388 Einträge übrig. Datensatz 3 war grösser und kam aus mehreren Krankenhäusern in Brasilien und enthielt 189.227 Einträge mit Daten zu vielen klinischen Merkmalen.

Analysemethoden

Maschinelles Lernen wurde verwendet, um zu bestimmen, welche Modelle am besten die COVID-19-Ergebnisse basierend auf Bluttestergebnissen vorhersagen würden. Verschiedene Algorithmen wurden getestet, wobei XGBoost als der effektivste herausstach. Andere Methoden umfassten logistische Regression und Entscheidungsbäume. Jeder Algorithmus hatte seine Vorteile und wurde mit verschiedenen Leistungskennzahlen bewertet, um zu sehen, wie genau sie die Anwesenheit von COVID-19 vorhersagen konnten.

XGBoost hatte ein spezielles Merkmal, das half, das Ungleichgewicht zwischen positiven und negativen Fällen in den Daten auszugleichen, was es für Vorhersagen zuverlässiger machte. Für andere Modelle, die fehlende Daten nicht gut verarbeiten konnten, wurden zusätzliche Schritte unternommen, um diese Lücken zu füllen.

Leistungskennzahlen

Verschiedene Leistungskennzahlen wurden verwendet, um zu messen, wie gut die Modelle funktionierten. Dazu gehörten Genauigkeit, Spezifität, Sensitivität und eine weitere Kennzahl namens Area Under Curve (AUC), die hilft, zu visualisieren, wie gut ein Modell zwischen positiven und negativen Ergebnissen unterscheiden kann. AUC-Werte reichen von 0 bis 1, wobei höhere Werte eine bessere Leistung anzeigen.

Ergebnisse der Studie

Die Studie verwendete mehrere Datensätze, um verschiedene ML-Modelle hinsichtlich ihrer Fähigkeit zu bewerten, COVID-19 basierend auf Bluttestergebnissen vorherzusagen. Das XGBoost-Modell schnitt in allen relevanten Datensätzen konstant besser ab als die anderen Methoden. Es wurde beobachtet, dass kleinere Datensätze tendenziell eine höhere Sensitivität zeigten, jedoch das Risiko einer Überanpassung der Daten mit sich brachten. Die Studie fand heraus, dass die Nutzung eines Modells mit vier Merkmalen und einem Modell mit vierzehn Merkmalen vielversprechende Ergebnisse lieferte, besonders wenn sie an verschiedenen Patientengruppen getestet wurden.

Externe Validierung der Modelle

Das XGBoost-Modell, das mit Daten einer Gruppe trainiert wurde, wurde auch an anderen Datensätzen aus verschiedenen Populationen getestet. Diese Tests zeigten, dass Modelle, die auf einer ethnischen Gruppe trainiert wurden, auch dann noch angemessen gut abschneiden konnten, wenn sie auf eine andere Gruppe angewendet wurden, allerdings mit einem gewissen Rückgang der Genauigkeit. Die Leistung der Modelle deutet darauf hin, dass sie nützlich sein könnten, um COVID-19 schnell basierend auf Blutparametern zu screeen, bevor umfangreichere Diagnosetests wie qRT-PCR durchgeführt werden.

Webserver zur COVID-19-Vorhersage

Um die Modelle zugänglicher zu machen, wurde ein Webserver erstellt, auf dem Nutzer ihre Bluttestergebnisse eingeben können, um Vorhersagen über COVID-19 zu erhalten. Es stehen zwei Modelle zur Verfügung, eines mit vier Blutparametern und ein anderes mit vierzehn. Der Server verarbeitet die Eingaben und gibt Ergebnisse darüber, ob eine Person wahrscheinlich positiv oder negativ auf COVID-19 getestet wird, zusammen mit der Wahrscheinlichkeit dieses Ergebnisses.

Fazit und zukünftige Richtungen

Die Forschung hebt das Potenzial hervor, Bluttests in Verbindung mit maschinellem Lernen zu nutzen, um schnelle und kosteneffektive Methoden zur Erkennung von COVID-19 zu schaffen. Die internen Tests zeigten, dass die Modelle die Ergebnisse effizient vorhersagen konnten, und der externe Validierungsprozess demonstrierte ihre Anwendbarkeit in verschiedenen Populationen. Letztendlich könnte diese Arbeit zu neuen, schnelleren Möglichkeiten führen, COVID-19 zu screenen, besonders in Bereichen wie Indien, wo der Zugang zu traditionellen Tests möglicherweise eingeschränkt ist. Zukünftige Forschungen werden sich darauf konzentrieren, diese Modelle mit Daten von indischen Populationen weiter zu trainieren und zu testen, um ihren Nutzen in unterschiedlichen Gesundheitssystemen zu verbessern.

Originalquelle

Titel: The external validity of machine learning-based prediction scores from hematological parameters of COVID-19: A study using hospital records from Brazil, Italy, and Western Europe

Zusammenfassung: BackgroundThe COVID-19 pandemic is the deadliest threat to humankind caused by the SARS-COV-2 virus in recent times. The gold standard for its detection, quantitative Real-Time Polymerase Chain Reaction (qRT-PCR), has several limitations regarding experimental handling, expense, and time. While the hematochemical values of routine blood tests have been reported as a faster and cheaper alternative, the external validity of the model on a diverse population has yet to be thoroughly investigated. Here we studied the external validity of machine learning-based prediction scores from hematological parameters recorded in Brazil, Italy, and Western Europe. Methods and FindingsThe publicly available hematological records (raw sample size (n) = 195554) from hospitals of three different territories, Brazil, Italy, and Western Europe, were preprocessed to develop the training, testing, and prediction cohorts for ML models. A total of eight (sub)datasets were trained on seven different ML classifiers. The XGBoost classifier performed consistently better on all the datasets producing eight different models. The working models include a set of either four or fourteen hematological parameters. The internal performances of the XGBoost models (AUC scores range from 84% to 97%) were superior to the ML models reported in the literature for a few datasets (AUC scores range from 84% to 87%). The external performance (AUC score) was 86% when the model was trained and tested on fourteen hematological parameters obtained from the same country (Brazil) but on independent datasets. However, the external performances were reduced when tested across the populations; 69% when trained on datasets from Italy (n=1736) and tested on datasets from Brazil (n=602)) and 65%, when trained on datasets from Italy and tested on datasets from Western Europe (n=1587)) respectively. ConclusionFor the first time, this report showed that the models trained and tested on the same population but on separate records produced reasonably accurate results. The study promises the confidence of these models trained and tested within the same populations and has the potential application to extend those to other demographic locations. Both four- and fourteen-parameter models are publicly available; https://covipred.bits-hyderabad.ac.in/home Author SummaryCOVID-19 has posed the deadliest threat to the human population in the 21st century. Timely detection of the disease could save more lives. The RT-PCR test is considered the gold standard for COVID-19 detection. However, there are several limitations of the technique that suggests developing an alternate detection protocol that would be efficient, fast, and cheap. Among several other alternate detection techniques, hematology based Machine-Learning (ML) prediction is one. All the hematology-based predictions reported so far in the literature were only internally validated. Considering the need to develop an alternate protocol for rapid, near-accurate, and cheaper COVID-19 detection techniques, we aim to externally validate the hematology-based ML prediction. Here external validation indicates use of two independent datasets for model training and testing, in contrast to internal validation where the same dataset splits into train and test sets. We have integrated published clinical records from Brazil, Italy, and West Europe hospitals. Internal ML model performances are superior compared to those reported in literature. The external model performances were equivalent to the internal performances when trained and tested on the same population. However, the external performances were inferior when train and test sets were from different populations. The results promise the utility of these models on the same populations. However, it also warns to train the model on one population and test it on another. The outcome of this work has the potential for an initial screen of COVID-19 based on hematological parameters before qRT-PCR tests.

Autoren: Debashree Bandyopadhyay

Letzte Aktualisierung: 2023-03-08 00:00:00

Sprache: English

Quell-URL: https://www.medrxiv.org/content/10.1101/2023.03.07.23286949

Quell-PDF: https://www.medrxiv.org/content/10.1101/2023.03.07.23286949.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel