Bewertung von tragbaren Geräten für Vorhofflimmern-Warnungen
Diese Studie bewertet die Leistung von tragbaren Geräten bei der Erkennung von AF-Alarmen.
― 6 min Lesedauer
In letzter Zeit sind Geräte zur Gesundheitsüberwachung, wie Smartwatches und Fitness-Tracker, echt beliebt geworden. Diese Gadgets können Nutzer über mögliche Herzprobleme, wie Vorhofflimmern (AF), informieren, indem sie Herzdaten analysieren. Obwohl diese tragbaren Geräte vorher verkauft werden, um sicherzustellen, dass sie richtig funktionieren, gibt es immer noch wenig Infos darüber, wie gut sie im echten Leben laufen, wenn die Leute sie benutzen.
Ein grosses Problem ist, dass die aktuellen medizinischen Kodierungssysteme keine Begriffe für tragbare Geräte enthalten. Die meisten medizinischen Forschungen basieren auf Diagnoseschlüsseln, die für die Abrechnung verwendet werden, aber diese Systeme erwähnen nicht, wie Wearables eingesetzt werden. Das bedeutet, dass wichtige Informationen oft in elektronischen Gesundheitsakten (EHRs) fehlen und viele Daten aus unstrukturierten Quellen wie Arztberichten stammen, was die Analyse erschwert.
Dank neuer Methoden im Deep Learning und Natural Language Processing (NLP) konnten Forscher die Klassifizierung klinischer Notizen verbessern. Diese Methoden haben bessere Ergebnisse geliefert als ältere Techniken, die auf spezifischen Regeln basierten. Allerdings braucht man für die Einrichtung von Deep Learning-Systemen eine Menge Daten, was Zeit und Geld kostet. Es muss eine bessere Möglichkeit gefunden werden, um diese Infos effizient zu sammeln und zu analysieren.
Studienziele
Die Studie hatte das Ziel, eine Methode zu entwickeln, um zu beobachten, wie tragbare Geräte bei der Überwachung von AF-Warnungen abschneiden. Das erste Ziel war, zwei Ansätze zu testen, um ein Trainingsset zur Klassifizierung klinischer Notizen zu erstellen: einen, der auf bestehenden Codes basierte, und einen anderen, der Aufforderungen für grosse Sprachmodelle (LLMs) nutzte. Ein Labeling-Modell wurde entwickelt, um festzustellen, ob in einer Notiz erwähnt wird, dass ein tragbares Gerät des Patienten AF-Warnungen gibt.
Das zweite Ziel war, dieses Labeling-Modell zu verwenden, um einen Klassifizierer zu trainieren, der AF-Erwähnungen in klinischen Notizen erkennt. Zuletzt wollte die Studie die Merkmale der Patienten zusammenfassen, die von diesem Klassifizierer identifiziert wurden, und sie mit denen vergleichen, die keine Warnungen über AF erhielten.
Methoden
Kohortenidentifikation
Um geeignete Patientendaten zu finden, nutzten die Forscher das Stanford Medicine Research Data Repository, das elektronische Akten von verschiedenen Besuchen bei Stanford Health Care beinhaltet. Sie suchten nach Notizen, die tragbare Geräte erwähnten, was zu Tausenden von Notizen von vielen Patienten führte. Um die FDA-Richtlinien zu befolgen, schlossen sie jüngere Patienten aus und reduzierten die Anzahl auf über sechundfünftausend Notizen von etwa einundzwanzigtausend Personen.
Manuelles Labeling
Aus diesen Notizen wurden sechshundert manuell gekennzeichnet, um das Labeling-Modell und den Klassifizierer zu testen. Die Forscher wollten Vielfalt und Abdeckung sicherstellen, indem sie eine Notiz von zufällig ausgewählten Personen auswählten. Zwei Datenwissenschaftler überprüften und etikettierten diese Notizen unabhängig, wobei Unterschiede von Ärzten geklärt wurden. Eine Notiz wurde als positiv markiert, wenn eindeutig angegeben war, dass der Patient eine AF-Warnung von seinem tragbaren Gerät erhalten hatte oder wenn eine Messung durchgeführt wurde, die zu einer Diagnose führte.
Zusätzlich wurden sechshundert Notizen zur Entwicklung des Labeling-Modells gemäss spezifischen Richtlinien, die während der Vorbereitung des Testsets erstellt wurden, kategorisiert.
Entwicklung des Labeling-Modells
Die Forscher entwickelten zwei Strategien zur Erstellung des Labeling-Modells zur Klassifizierung der Notizen.
Code-basiertes Labeling: Diese Methode nutzte Programmierung, um Regeln basierend auf der Sprache in den Notizen zu erstellen. Die Labeling-Funktionen, die verschiedene Möglichkeiten zur Erwähnung von AF-Benachrichtigungen beschrieben, wurden über ein paar Wochen entwickelt. Die Effektivität des Modells wurde anhand der Ergebnisse bei Ausführung auf dem Datensatz bewertet.
Prompt-basiertes Labeling: In dieser Methode verwendeten die Forscher LLMs und präsentierten Notizen in natürlichen Sprachaufforderungen. Diese Herangehensweise ermöglichte es dem Modell, den Inhalt einer Notiz zu verstehen und entsprechend Labels zuzuweisen. Obwohl dieses Modell nur einen Tag zur Erstellung benötigte, erzielte es eine ähnliche Leistung wie das code-basierte Modell.
Die Modelle wurden getestet, um sicherzustellen, dass sie genau waren, wobei Anpassungen basierend auf Leistungskennzahlen vorgenommen wurden.
Klassifizierers
Entwicklung desMit den vom Labeling-Modell gekennzeichneten Notizen trainierten die Forscher einen Klassifizierer namens Clinical-Longformer. Dieser Klassifizierer wurde feinabgestimmt, um Notizen zu identifizieren, die AF-Warnungen basierend auf ihrem Inhalt erwähnten. Die Forscher evaluierten verschiedene Grössen des Trainingssets und fanden heraus, dass die Leistung des Klassifizierers signifikant besser wurde, je grösser das Trainingsset war.
Der am besten abschneidende Klassifizierer identifizierte eine grosse Anzahl von Notizen als solche, die AF-Prädiagnoseereignisse enthielten.
Retrospektive Kohortenstudie
Mit den Ergebnissen des Klassifizierers identifizierten die Forscher Patienten, die AF-Prädiagnose-Warnungen erhielten, und führten eine Studie durch, in der diese Patienten mit denen verglichen wurden, die keine erhielten. Sie schauten sich Faktoren wie Alter, medizinische Vorgeschichte und demografische Daten an. Der Fokus lag auf Patienten, die zuvor keine AF-Diagnose hatten.
Die Forscher stellten die Merkmale der Patienten zum Zeitpunkt der Indexnotiz fest. Unter denjenigen, die Warnungen erhielten, hatte ein bemerkenswerter Prozentsatz Werte, die auf einen Bedarf an Antikoagulationstherapie hindeuteten, was darauf hindeutet, dass eine frühzeitige Erkennung zu einer besseren Behandlungsplanung führen könnte.
Zusammenfassung der Ergebnisse
Die Ergebnisse zeigten, dass Patienten, die AF-Warnungen erhielten, tendenziell älter waren und mehr gesundheitliche Probleme hatten als diejenigen, die keine Warnungen erhielten. Es gab Unterschiede in Rasse und Geschlecht unter den Patienten, die Warnungen von Wearables erhielten.
Zusätzlich war es wahrscheinlicher, dass viele Patienten, die eine Warnung von einem tragbaren Gerät erhielten, kurz danach eine tatsächliche Diagnose von einem Arzt bekam, was auf den potenziellen Einfluss von tragbarer Technologie auf medizinische Interventionen hinweist.
Diskussion
Die Studie hebt das Potenzial tragbarer Geräte zur Verbesserung der frühen Diagnose von AF hervor. Indem man effizient überwacht, wie diese Geräte abschneiden, können Gesundheitsdienstleister besser verstehen, welchen Einfluss sie auf die Patientenergebnisse haben. Der Einsatz von schwacher Überwachung zur Entwicklung eines Systems, das tragbare Geräte überwacht, ist ein wichtiger Schritt zur Verbesserung der Patientenversorgung.
Aktuelle Publikationen konzentrieren sich hauptsächlich darauf, wie gut diese Geräte Gesundheitsprobleme erkennen, bevor sie auf den Markt kommen, während diese Forschung die Notwendigkeit einer fortlaufenden Bewertung ihrer tatsächlichen Verwendung und Wirksamkeit betont.
Mit der zunehmenden Nutzung tragbarer Geräte ist ein strukturiertes Framework zur Überwachung ihrer Leistung unerlässlich. Frühe Warnungen von Wearables könnten zu zeitnaheren medizinischen Interventionen und besseren Gesundheitsergebnissen für Patienten führen.
Fazit
Zusammenfassend hat diese Studie erfolgreich gezeigt, wie eine neue Methode genutzt werden kann, um die Leistung tragbarer Geräte zu überwachen, die frühe Warnungen für Vorhofflimmern abgeben. Der Ansatz, code-basierte und prompt-basierte Strategien zu kombinieren, zeigt vielversprechende Ansätze zur Verbesserung der Patientenversorgung, indem die Identifizierung und Analyse relevanter klinischer Notizen erleichtert wird. Fortlaufende Forschung und die Implementierung solcher Systeme könnten potenziell transformieren, wie Gesundheitsdaten überwacht und im täglichen medizinischen Betrieb genutzt werden.
Titel: Scalable Approach to Medical Wearable Post-Market Surveillance
Zusammenfassung: ObjectiveWe sought to develop a weak supervision-based approach to demonstrate feasibility of post-market surveillance of wearable devices that render AF pre-diagnosis. Materials and MethodsTwo approaches were evaluated to reduce clinical note labeling overhead for creating a training set for a classifier: one using programmatic codes, and the other using prompts to large language models (LLMs). Probabilistically labeled notes were then used to fine-tune a classifier, which identified patients with AF pre-diagnosis mentions in a note. A retrospective cohort study was conducted, where the baseline characteristics and subsequent care patterns of patients identified by the classifier were compared against those who did not receive pre-diagnosis. ResultsLabel model derived from prompt-based labeling heuristics using LLMs (precision = 0.67, recall = 0.83, F1 = 0.74) nearly achieved the performance of code-based heuristics (precision = 0.84, recall = 0.72, F1 = 0.77), while cutting down the cost to create a labeled training set. The classifier learned on the labeled notes accurately identified patients with AF pre-diagnosis (precision = 0.85, recall = 0.81, F1 = 0.83). Those patients who received pre-diagnosis exhibited different demographic and comorbidity characteristics, and were enriched for anticoagulation and eventual diagnosis of AF. At the index diagnosis, existence of pre-diagnosis did not stratify patients on clinical characteristics, but did correlate with anticoagulant prescription. Discussion and ConclusionOur work establishes the feasibility of an EHR-based surveillance system for wearable devices that render AF pre-diagnosis. Further work is necessary to generalize these findings for patient populations at other sites.
Autoren: Richard M Yoo, B. T. Viggiano, K. N. Pundi, J. A. Fries, A. Zahedivash, T. Podchiyska, N. Din, N. H. Shah
Letzte Aktualisierung: 2023-11-15 00:00:00
Sprache: English
Quell-URL: https://www.medrxiv.org/content/10.1101/2023.11.14.23298488
Quell-PDF: https://www.medrxiv.org/content/10.1101/2023.11.14.23298488.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.