Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Statistik# Methodik# Anwendungen

Umgang mit fehlenden Daten in Beschleunigungsmessungsstudien

Methoden zur Handhabung fehlender Accelerometerdaten in klinischen Studien.

― 8 min Lesedauer


Fehlende Daten in StudienFehlende Daten in StudienbehebenStudien.Beschleunigungsdaten in klinischenMethoden zur Bewältigung fehlender
Inhaltsverzeichnis

In den letzten Jahren sind tragbare Geräte wie Beschleunigungsmesser immer beliebter geworden, um körperliche Aktivität in klinischen Studien zu verfolgen. Diese Geräte helfen Forschern zu verstehen, wie verschiedene Behandlungen die Schrittzahlen der Teilnehmer im Laufe der Zeit beeinflussen können. Ein Problem bei der Verwendung von Beschleunigungsmessern ist jedoch der Umgang mit fehlenden Daten. Das kann passieren, wenn Teilnehmer vergessen, das Gerät zu tragen, es aus verschiedenen Gründen abnehmen oder technische Probleme haben.

Zu verstehen, wie man mit fehlenden Daten umgeht, ist wichtig, da es die Ergebnisse einer Studie beeinflussen kann. In diesem Artikel werden Methoden zur Behandlung fehlender Daten in Studien mit Beschleunigungsmessern besprochen, wobei der Fokus auf den Details der multiplen Imputation (MI) liegt, einem gängigen Ansatz zur Auffüllung fehlender Werte. Wir schauen uns zwei Arten von MI-Methoden an: parametrisch und Nicht-parametrisch.

Die Bedeutung von Beschleunigungsmesser-Daten

Beschleunigungsmesser sind Geräte, die am Körper getragen werden und Bewegungen in Echtzeit messen. Sie bieten eine objektive Möglichkeit, Daten über die körperliche Aktivität zu sammeln, was sie zu einem wertvollen Instrument in der Forschung macht. Diese Geräte zeichnen Daten normalerweise in kurzen Intervallen auf, oft alle 5 Sekunden. Das ermöglicht einen detaillierten Blick darauf, wie aktiv die Teilnehmer über den Tag sind.

In klinischen Studien verwenden Forscher oft Beschleunigungsmesser, um Schrittzahlen und andere Aktivitätslevel zu messen. Die Teilnehmer tragen das Gerät normalerweise eine Woche lang, um ein umfassendes Bild ihrer täglichen Aktivität zu liefern. Diese Daten können analysiert werden, um die Wirksamkeit verschiedener Interventionen zur Steigerung der körperlichen Aktivität zu bewerten.

Herausforderungen bei fehlenden Daten

Fehlende Daten sind ein häufiges Problem in Studien, die Beschleunigungsmesser verwenden. Teilnehmer tragen die Geräte möglicherweise nicht wie vorgeschrieben, indem sie sie abnehmen oder aufgrund von Problemen wie leeren Batterien. Traditionelle Ansätze zur Verwaltung fehlender Daten definieren oft einen Tag als „fehlend“, wenn das Gerät nur für eine bestimmte Zeit getragen wurde. Zum Beispiel, wenn jemand das Gerät an einem Tag weniger als 540 Minuten trägt, kann die Daten dieses Tages ignoriert werden. Das kann zu einem Verlust wertvoller Informationen führen, denn manchmal können Teilnehmer nützliche Daten liefern, auch wenn sie den Tragezeitraum nicht erfüllen.

Ein nuancierterer Ansatz ist erforderlich, um fehlende Daten auf einer feineren Ebene zu behandeln, speziell auf der Epoch-Ebene. Das bedeutet, spezifische Zeitintervalle zu betrachten, anstatt nur tägliche Gesamtwerte. Dadurch können Forscher mehr Informationen erhalten und die verfügbaren Daten besser nutzen.

Klassifizierung fehlender Daten

Bevor Methoden zur multiplen Imputation angewendet werden, müssen Forscher fehlende Daten genau identifizieren und klassifizieren. Im Kontext von Beschleunigungsmesser-Daten kann Fehlendes verschiedene Formen annehmen. Zum Beispiel könnte ein Teilnehmer das Gerät während des Schlafs abnehmen, was zu einer langen Phase ohne aufgezeichnete Bewegung führt. Diese Zeit sollte nicht als fehlende Daten betrachtet werden, da sie mit dem Studienprotokoll übereinstimmt.

Um diese Zeiträume effektiv zu klassifizieren, können Forscher sie in mehrere Typen einteilen:

  1. Inaktive Perioden: Kurze Zeiträume, in denen der Teilnehmer wahrscheinlich das Gerät trägt, aber sich nicht bewegt. Diese können zwischen 1 und 3 Stunden dauern.

  2. Nicht-Trage-Perioden: Längere Zeiträume ohne Bewegung, was darauf hindeutet, dass das Gerät abgenommen wurde. Diese können zwischen 1 und 5 Stunden dauern.

  3. Schlafperioden: Lange Intervalle (zwischen 5 und 15 Stunden), wahrscheinlich aufgrund von Schlaf, in denen das Gerät nicht getragen wird, aber erwartet wird.

  4. Schlaf-extra-Perioden: Extrem lange Perioden (über 15 Stunden), die darauf hinweisen, dass das Gerät spät angelegt oder früh abgenommen wurde, was zu fehlenden Daten führt.

Durch die effektive Kategorisierung dieser fehlenden Intervalle können Forscher besser verstehen, wie sie mit fehlenden Daten bei der Anwendung von MI-Methoden umgehen können.

Überblick über multiple Imputation

Multiple Imputation (MI) ist eine Methode, die verwendet wird, um fehlende Daten mit vernünftigen Schätzungen basierend auf den beobachteten Daten zu füllen. Das Ziel von MI ist es, eine Reihe plausibler Werte für die fehlenden Einträge bereitzustellen. So können Forscher Analysen durchführen, als ob sie vollständige Daten hätten.

MI beinhaltet die Erstellung mehrerer verschiedener vollständiger Datensätze, indem die fehlenden Einträge durch vorhergesagte Werte ersetzt werden. Diese Datensätze werden dann separat analysiert, und die Ergebnisse werden gemittelt, um endgültige Schätzungen zu erhalten. Dieser Ansatz berücksichtigt die Unsicherheit in Bezug auf die fehlenden Daten, was zu zuverlässigereren Ergebnissen führt.

Es gibt zwei Hauptansätze zur MI: parametrisch und nicht-parametrisch.

Parametrische multiple Imputation

Der parametrische Ansatz zur MI geht davon aus, dass die Daten einer bestimmten statistischen Verteilung folgen. Im Kontext von Beschleunigungsmesser-Daten könnten Forscher ein Modell wie die Tobit-Regressionsanalyse anwenden, das hilft, Probleme mit zensierten Daten (Daten, die Grenzen haben, wie Schrittzahlen, die nicht unter null fallen können) zu beheben.

Bei der Anwendung des parametrischen Ansatzes aggregieren Forscher zuerst die Daten auf Tagesebene. Auch wenn dies einige Verzerrungen einführen kann, können sie durch die log-transformierung der Schrittzahlen die Normalitätsannahme wahrscheinlicher machen. Dadurch können sie die für die Imputation erforderlichen Parameter definieren.

Ein grosser Vorteil des parametrischen Ansatzes ist, dass er es Forschern ermöglicht, obere und untere Grenzen für die Daten basierend auf den beobachteten Werten festzulegen. Zum Beispiel, wenn ein Tag als teilweise beobachtet gilt aufgrund von Nicht-Trage-Perioden, kann die Imputation dies berücksichtigen, indem realistische Grenzen für die entsprechenden Schrittzahlen gesetzt werden.

Nicht-parametrische multiple Imputation

Der nicht-parametrische Ansatz zur MI stützt sich nicht auf spezifische statistische Verteilungen. Anstatt ein Parametrisches Modell zu verwenden, füllt diese Methode fehlende Daten mit beobachteten Daten von ähnlichen Teilnehmern auf. Die Idee ist, "Spender" zu finden, die ähnliche Merkmale aufweisen, und deren Daten zu nutzen, um die fehlenden Werte zu schätzen.

In der Praxis kann der nicht-parametrische Ansatz vorteilhaft sein, da er keine strengen Annahmen über die Verteilung der Daten erfordert. Er ist tendenziell flexibler und kann sich an komplexe Datenmuster anpassen, wodurch er eine geeignete Wahl für Beschleunigungsmesser-Datensätze ist.

Bei der Umsetzung des nicht-parametrischen Ansatzes identifizieren Forscher zuerst die fehlenden Perioden für jeden Teilnehmer. Sie suchen dann nach geeigneten Spenderdaten entweder vom gleichen Teilnehmer an anderen Tagen oder von anderen ähnlichen Teilnehmern. Durch das Matching basierend auf Faktoren wie Alter, Geschlecht und Ausgangsniveaus der Aktivität können Forscher zuverlässige Imputationen für die fehlenden Daten erstellen.

Simulationsstudien

Um die Effektivität beider MI-Ansätze zu bewerten, führen Forscher Simulationsstudien durch. Diese Studien bewerten, wie genau jede Methode die wahren Werte aus Datensätzen mit hinzugefügten Fehlungen wiederherstellen kann.

In einer Simulation könnten Forscher Muster fehlender Daten in einen Datensatz mit Beschleunigungsmessern einführen, indem sie Fälle von Nicht-Tragen und Schlaf-extra-Perioden simulieren. Dann wenden sie sowohl den parametrischen als auch den nicht-parametrischen Ansatz an, um ihre Leistung bei der Schätzung der durchschnittlichen Schrittzahl der Teilnehmer zu bewerten.

Die Ergebnisse zeigen, dass der nicht-parametrische Ansatz im Allgemeinen zu weniger Verzerrungen und kleineren Standardfehlern im Vergleich zur parametrischen Methode führt. In Fällen, in denen Wochen an Daten fehlen, kann der nicht-parametrische Ansatz jedoch weniger effektiv sein, da es an Spenderdaten mangelt.

Anwendung der PACE-UP-Studie

Um die Wirksamkeit dieser Methoden zu veranschaulichen, wenden Forscher sie auf eine echte klinische Studie namens PACE-UP an. Diese Studie untersuchte Interventionen zur Steigerung der körperlichen Aktivität bei Teilnehmern im Alter von 45 bis 75 Jahren.

Die Teilnehmer erhielten Beschleunigungsmesser, die sie über mehrere Wochen zu verschiedenen Zeitpunkten tragen sollten. Wie erwartet, traten Fälle von fehlenden Daten auf. Durch die Anwendung beider MI-Ansätze konnten die Forscher bewerten, wie sich jede Methode auf die geschätzten Effekte der Interventionen auf die Schrittzahl auswirkte.

Beide Methoden führten zu unterschiedlichen Punkteschätzungen und Standardfehlern, was zeigt, wie Annahmen über fehlende Daten die Ergebnisse einer Studie drastisch verändern können. Besonders der nicht-parametrische Ansatz lieferte Schätzungen, die mit denen aus der ursprünglichen Studie vergleichbar waren.

Diskussion

Beide Ansätze zur MI, parametrisch und nicht-parametrisch, haben ihre Stärken und Schwächen. Während der parametrische Ansatz einen strukturierten Weg zur Handhabung fehlender Daten bietet, passt er möglicherweise nicht immer zur Komplexität, die in realen Datensätzen vorliegt. Auf der anderen Seite bietet der nicht-parametrische Ansatz mehr Flexibilität, ist jedoch auf die Verfügbarkeit geeigneter Spenderdaten angewiesen.

Da die Verwendung tragbarer Geräte weiter zunimmt, werden die Herausforderungen im Zusammenhang mit fehlenden Daten wahrscheinlich weiterhin bestehen. Daher wird die Entwicklung verbesserter Methoden zur Handhabung von Fehlungen in feingranularen Datensätzen entscheidend sein, um genaue Ergebnisse in der klinischen Forschung zu erzielen.

Zukünftige Arbeiten können hybride Ansätze erkunden, die die Stärken beider Methoden kombinieren. Solche Fortschritte würden die Qualität der Datenanalyse in klinischen Studien weiter verbessern und letztendlich zu besseren Erkenntnissen über Interventionen führen, die darauf abzielen, die körperliche Aktivität der Teilnehmer zu steigern.

Originalquelle

Titel: Multiple Imputation Approaches for Epoch-level Accelerometer data in Trials

Zusammenfassung: Clinical trials that investigate interventions on physical activity often use accelerometers to measure step count at a very granular level, often in 5-second epochs. Participants typically wear the accelerometer for a week-long period at baseline, and for one or more week-long follow-up periods after the intervention. The data is usually aggregated to provide daily or weekly step counts for the primary analysis. Missing data are common as participants may not wear the device as per protocol. Approaches to handling missing data in the literature have largely defined missingness on the day level using a threshold on daily wear time, which leads to loss of information on the time of day when data are missing. We propose an approach to identifying and classifying missingness at the finer epoch-level, and then present two approaches to handling missingness. Firstly, we present a parametric approach which takes into account the number of missing epochs per day. Secondly, we describe a non-parametric approach to Multiple Imputation (MI) where missing periods during the day are replaced by donor data from the same person where possible, or data from a different person who is matched on demographic and physical activity-related variables. Our simulation studies comparing these approaches in a number of settings show that the non-parametric approach leads to estimates of the effect of treatment that are least biased while maintaining small standard errors. We illustrate the application of these different MI strategies to the analysis of the 2017 PACE-UP Trial. The proposed framework of classifying missingness and applying MI at the epoch-level is likely to be applicable to a number of different outcomes and data from other wearable devices.

Autoren: Mia S. Tackney, Elizabeth Williamson, Derek G. Cook, Elizabeth Limb, Tess Harris, James Carpenter

Letzte Aktualisierung: 2023-03-30 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2303.17331

Quell-PDF: https://arxiv.org/pdf/2303.17331

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel