Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Gesundheitswissenschaften# Gesundheitsinformatik

Verbesserung der Kohortenauswahl für biomedizinische Forschung

Eine Plattform, die den Datenzugang für Forscher in der Krebsforschung vereinfacht.

― 6 min Lesedauer


Vereinfachung desVereinfachung desZugriffs aufForschungsdatendie Effizienz bei der Kohortenauswahl.Ein Selbstbedienungs-Tool verbessert
Inhaltsverzeichnis

Beobachtungsforschung mit echten Daten ist super wichtig für die biomedizinische Forschung. Grosse Studien mit vielen Freiwilligen, die als Kohortenstudien bekannt sind, sind besonders wertvoll. Diese Studien sammeln über viele Jahre Daten von Teilnehmern und können zahlreiche Forschungsprojekte unterstützen. Zu den grössten Kohorten gehören Programme wie das NIH All of Us Research Program, UK Biobank und das Million Veteran Program. Dabei können Hunderte von Tausenden Teilnehmern involviert sein und eine Fülle von Informationen für zukünftige Forschungen bereitstellen.

Auswahl der richtigen Daten für die Forschung

Forscher brauchen selten alle Daten, die aus diesen grossen Kohorten gesammelt wurden. Der Begriff "Kohortenauswahl" bezieht sich auf den Prozess, spezifische Datensätze für Forschungsprojekte zu erstellen, während die persönlichen Informationen der Teilnehmer geschützt bleiben. Das beinhaltet, das Studiendesign festzulegen, Kriterien für die Teilnahme zu setzen und bestimmte Datenpunkte auszuwählen, die analysiert werden sollen. Die zunehmende Nutzung elektronischer Gesundheitsakten und Forschungsdatenbanken beruht stark auf einer effektiven Kohortenauswahl. Richtlinien empfehlen, dass die Studienergebnisse klar erklären, wie die Kohortenauswahl durchgeführt wurde.

Wenn Daten sensibel oder proprietär sind, müssen Datenanbieter oft viel Zeit aufwenden, um Forschern zu helfen, die Daten zu verstehen, ihre Anfragen zu optimieren und die Kohortenauswahl durchzuführen. Trotz technischer Fortschritte dauert viele Prozesse der Kohortenauswahl immer noch zu lange und kann ein grosses Hindernis in der Forschung sein, selbst mit neuen cloud-basierten Systemen.

Selbstbedienungs-Tools für Forscher

Andere Projekte haben Selbstbedienungs-Tools entwickelt, um Forschern den direkten Zugang zu Daten zu ermöglichen. Das Ziel war, dass Forscher ihre Kohorten einfach selbst auswählen und Daten erhalten können, ohne auf Datenmanager angewiesen zu sein. Dieser Bericht beschreibt die Erstellung der CTS Researcher Platform, die es Forschern ermöglicht, zu fragen, auszuwählen, zu prüfen und schnell die spezifischen Daten zu erhalten, die sie für ihre Projekte benötigen.

Überblick über die California Teachers Study (CTS)

Die California Teachers Study ist eine multizentrische Krebsforschungsstudie, die 1995 begann und bei der über 133.000 erwachsene Frauen teilgenommen haben. Diese Teilnehmerinnen haben Umfragen ausgefüllt und ihre Daten für die Forschung zur Verfügung gestellt. Sie haben über die Jahre mehrere Folgebefragungen gemacht, die wertvolle Informationen über Gesundheit und Lebensstil liefern. Regelmässige Updates von Gesundheitsregistern haben dazu geführt, dass viele Teilnehmerinnen mit gesundheitlichen Problemen, einschliesslich Krebs, identifiziert wurden.

Die Daten der CTS werden privat gehalten, um die Teilnehmer zu schützen. Die ersten Umfragen wurden von 1995 bis 1999 gesammelt, und die Daten werden heute weiterhin in verschiedenen Studien verwendet.

Frühere Methoden zur Kohortenauswahl

Vor 2015 war die Kohortenauswahl bei der CTS vollständig manuell. Datenmanager haben die Anfragen von Forschern bearbeitet und die benötigten Datensätze erstellt. 2016 wurde ein Datencenter eingeführt, das alle Daten und Tools in einer sicheren Umgebung zentralisierte. Trotz dieser Verbesserung war die manuelle Kohortenauswahl weiterhin notwendig. Forscher mussten spezifische Details darüber angeben, welche Daten sie wollten, und das Datenteam musste diese manuell zusammenstellen.

Der Bedarf an skalierbarer Kohortenauswahl

Das Ziel war, die Notwendigkeit der manuellen Auswahl vollständig zu eliminieren. Forscher sollten unabhängig mit den Daten interagieren und ihre eigenen Ergebnisse erhalten können. Die frühere Einrichtung erforderte drei wesentliche Komponenten zur Erleichterung: benutzerfreundliche Workflows für die Kohortenauswahl, eine Webanwendung für den Datenzugang und Prozesse zur automatischen Erstellung der benötigten Ergebnisse wie Datensätze und Analyse-Skripte.

Benutzerfreundliche Workflows

Da die CTS sich hauptsächlich auf das Krebsrisiko konzentriert, musste das Design des Kohortenauswahl-Tools dies widerspiegeln. Der erste Schritt war, potenzielle Studiendesigns, Ergebnisse und Datentypen basierend auf den Umfragen und Gesundheitsakten der Teilnehmer zu identifizieren. Durch die Erfassung detaillierter Benutzeranforderungen wollten sie einen intuitiven Prozess zur Datenauswahl schaffen. Die Benutzer sollten verschiedene Parameter auswählen können und die Möglichkeit haben, ihre Auswahlen zu ändern, ohne von vorne anfangen zu müssen.

Datenmanagement und Auswahl-Workflow

Um das Datenmanagement zu verbessern, verband die CTS Krebs-, Krankenhausaufenthalts- und Umfragedaten in einer einzigen, effizienten Datenbank. Das erlaubte es Forschern, Daten leicht abzurufen und zu analysieren, ohne mit komplexen traditionellen Datenbankabfragen umgehen zu müssen. Die Architektur half, ein reibungsloses Benutzererlebnis zu gewährleisten und gleichzeitig Sicherheit und Datenschutz zu wahren.

Daten- und Codeverfügbarkeit

Alle Daten und Codes, die mit der CTS zusammenhängen, sind über die Researcher Platform zugänglich, die Forscher nutzen können, wenn sie zustimmen, die Daten verantwortungsbewusst zu behandeln. Während die Daten aufgrund von Datenschutzbedenken nicht öffentlich verfügbar sind, stellt die Plattform sicher, dass jeder, der die Daten für Forschungszwecke nutzen möchte, Zugang hat.

Aufbau einer benutzerfreundlichen Webanwendung

Die Entwicklung der Webanwendung konzentrierte sich auf Benutzerfreundlichkeit, insbesondere für Forscher, die möglicherweise nicht viel Erfahrung mit Datenanalysen haben. Die Anwendung führt die Benutzer durch den Auswahlprozess und bietet klare Schritte und Optionen zur Auswahl ihrer Kohorten und Daten. Jeder Schritt des Prozesses ist unkompliziert, sodass Benutzer Endpunkte auswählen, Regeln festlegen und ihre Auswahl in Echtzeit überprüfen können.

Sofortiger Zugang zu Forschungsdaten

Sobald Forscher ihre Auswahl getroffen haben, kann die Anwendung schnell die benötigten Ergebnisse generieren, einschliesslich massgeschneiderter Datensätze und Analyse-Skripte. Diese Funktion ermöglicht es Forschern, ihre Analysen fast sofort zu starten, wobei die Ergebnisse normalerweise in weniger als 30 Sekunden bereit sind.

Verfolgung von Projekten und Benutzerkonten

Forscher können sich auf der CTS-Website für Konten anmelden, die die Projektinformationen während des Fortschritts verfolgen. Dieses System ermöglicht es Forschern, den Status ihrer Projekte zu überwachen und Zugang zum Kohortenauswahl-Tool zu erhalten, sobald ihre Vorschläge genehmigt sind. Die Integration mit einem Projektmanagement-Tool hilft zudem, projektbezogene Informationen zu verfolgen.

Der Umfang des Datenzugangs

Alle generierten Datensätze enthalten essentielle Kovariaten, um die Analyse zu unterstützen. Anstatt von den Benutzern zu verlangen, Entscheidungen von Grund auf zu treffen, bietet die Anwendung Standardoptionen für gängige Auswahlmöglichkeiten und lässt Raum für Anpassungen.

Kontinuierliche Verbesserungen der Plattform

Die Researcher Platform wurde im März 2021 nach monatelangen Tests und Verfeinerungen vollständig gestartet. Zunächst unterstützte sie Studien, die sich auf Krebsendpunkte konzentrierten, hat aber inzwischen auch Endpunkte für Krankenhausaufenthalte und Sterblichkeit erweitert. Diese Anpassungsfähigkeit ermöglicht es Forschern, verschiedene Datenpunkte zu untersuchen, ohne umfangreiche Hilfe vom Forschungsteam zu benötigen.

Fazit zum Kohortenauswahlprozess

Die Kohortenauswahl ist eine bedeutende Herausforderung in verschiedenen Forschungsbereichen. Sowohl Datenanbieter als auch Forscher brauchen einen effizienten Weg, um die richtigen Daten für ihre Studien zu identifizieren und zuzugreifen. Traditionelle Methoden können arbeitsintensiv und langsam sein, was es schwierig macht, den Anforderungen der modernen Forschung gerecht zu werden.

Durch die Entwicklung einer Selbstbedienungs-Kohortenauswahlplattform hat die CTS Fortschritte gemacht, um die Engpässe im Zusammenhang mit dem Datenzugang zu reduzieren. Dieser automatisierte, benutzerfreundliche Ansatz hat sich als effektiv erwiesen, selbst bei komplexen Datensätzen. Das Design der Plattform betont die Bedeutung robuster, klarer Workflows, auf die Forscher sich verlassen können, um ihre Arbeit zu erleichtern.

Der Erfolg dieses Tools zeigt das Potential automatisierter Prozesse, die Effizienz der Forschung zu steigern und gleichzeitig Datenschutz und Sicherheit zu gewährleisten. Während mehr Forscher diese Plattform nutzen, wird fortlaufendes Feedback helfen, weitere Verbesserungen und Anpassungen zu gestalten, um den sich entwickelnden Bedürfnissen der Forschungscommunity gerecht zu werden.

Originalquelle

Titel: Automated self-service cohort selection for large-scale population sciences and observational research: The California Teachers Study Researcher Platform

Zusammenfassung: ObjectiveCohort selection is ubiquitous and essential, but manual and ad hoc approaches are time-consuming, labor-intense, and difficult to scale. We sought to automate the task of cohort selection by building self-service tools that enable researchers to independently generate datasets for population sciences research. Materials and MethodsThe California Teachers Study (CTS) is a prospective observational study of 133,477 women who have been followed continuously since 1995. The CTS includes extensive survey-based and real-world data from cancer, hospitalization, and mortality linkages. We curated data from our data warehouse into a column-oriented database and developed a researcher-facing web application that guides researchers through the project lifecycle; captures researchers inputs; and automatically generates custom and analysis-ready data, code, dictionaries, and documentation. ResultsResearchers can register, access data, and propose projects on the CTS Researcher Platform via our CTS website. The Platform supports cohort and cross-sectional study designs for cancer, mortality, and any other ICD-based phenotypes or endpoints. User-friendly prompts and menus capture analytic design, inclusion/exclusion criteria, endpoint definitions, censoring rules, and covariate selection. Our platform empowers researchers everywhere to query, choose, review, and automatically and quickly receive custom data, analytic scripts, and documentation for their research projects. Research teams can review, revise, and update their choices anytime. DiscussionWe replaced inefficient traditional cohort-selection processes with an integrated self-service approach that simplifies and improves cohort selection for all stakeholders. Compared with manual methods, our solution is faster and more scalable, user-friendly, and collaborative. Other studies could re-configure our individual database, project-tracking, website, and data-delivery components for their own specific needs, or they could utilize other widely available solutions (e.g., alternative database or project-tracking tools) to enable similarly automated cohort-selection in their own settings. Our comprehensive and flexible framework could be adopted to improve cohort selection in other population sciences and observational research settings.

Autoren: James V Lacey, E. S. Spielfogel, J. L. Benbow, K. E. Savage, K. Lin, C. A. M. Anderson, J. Clague-DeHart, C. N. Duffy, M. E. Martinez, H. L. Park, C. A. Thompson, S. S. Wang, S. Chandra

Letzte Aktualisierung: 2023-12-26 00:00:00

Sprache: English

Quell-URL: https://www.medrxiv.org/content/10.1101/2023.12.22.23300461

Quell-PDF: https://www.medrxiv.org/content/10.1101/2023.12.22.23300461.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel