Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Oncologie

Améliorer la collecte de données dans la recherche sur le cancer

Une étude sur l'organisation des données de traitement pour les patients atteints de cancer au cerveau en utilisant des non-cliniciens formés.

― 8 min lire


Techniques de donnéesTechniques de donnéesdans le traitement ducancerdu cancer.récolter des données sur le traitementUtiliser des non-cliniciens pour mieux
Table des matières

Un gros défi dans la recherche sur le cancer, c'est de rassembler des infos à partir de documents cliniques qui ne sont pas bien structurés. Ces sources de données non structurées incluent des notes en texte libre que les médecins écrivent dans les dossiers de santé électroniques (DSE). Des détails importants, comme quand un patient a été diagnostiqué, le type de traitement reçu, et les changements de son état, apparaissent souvent seulement dans ces notes non structurées.

Pour obtenir ces infos, les chercheurs lisent généralement les DSE et notent les détails pertinents. Ce processus manuel peut prendre beaucoup de temps et coûter cher. En plus, sans suivre les meilleures pratiques, la Qualité des données collectées peut en pâtir, entraînant du temps perdu. Bien qu’il existe des technologies conçues pour aider à automatiser cette tâche, elles peinent souvent en termes de précision et peuvent ne pas bien s'appliquer à toutes les situations. À cause de ces problèmes, la Collecte de données manuelles va probablement continuer à jouer un grand rôle dans la recherche pendant un certain temps. Donc, trouver de meilleures méthodes pour accélérer ce processus est essentiel.

Importance des Dossiers Médicamenteux

Les dossiers médicamenteux dans les DSE sont cruciaux pour la recherche clinique, surtout dans le traitement du cancer. Suivre le timing des médicaments et la façon dont les patients y répondent est vital pour prendre des décisions de traitement éclairées. Cette chronologie de traitement est appelée une "ligne de thérapie" (LOT). Elle indique le traitement spécifique qu'un patient a reçu durant certaines périodes.

Cependant, déterminer les dates de début et de fin de ces lignes de traitement peut être compliqué. Les dossiers peuvent ne pas indiquer clairement ces dates, et les chercheurs pourraient devoir prendre des décisions sur la manière de gérer des situations complexes, comme lorsqu'un médicament est ajouté ou retiré d'un plan de traitement. Ce manque de documentation claire rend difficile les analyses approfondies des traitements.

Pour relever ces défis, on a créé un système flexible pour organiser les données médicamenteuses des patients avec un type de cancer du cerveau appelé glioblastome multiforme (GBM) en LOTs. Le GBM est courant et a un faible taux de survie, rendant un traitement efficace crucial. Donc, il est important de trouver des moyens efficaces de rassembler les infos sur les LOTs dans les DSE des patients atteints de GBM.

Processus de Collecte de Données

Pour notre étude, nous avons examiné les données de patients traités dans un hôpital sur plusieurs années. Nous avons obtenu l'approbation pour analyser ces données de manière éthique. On a identifié les patients diagnostiqués avec un GBM en utilisant à la fois la collecte de données manuelle et des techniques d'apprentissage automatique. Parmi près de 1 200 patients notés initialement, on a confirmé qu'environ 700 avaient un GBM grâce à une collecte de données attentive.

Pour collecter ces données, on a formé des étudiants qui ne sont pas des professionnels de santé à rassembler des informations sur les patients GBM. Cette formation incluait des éléments clés sur les termes médicaux et comment revoir efficacement les dossiers. En fournissant des instructions détaillées et des exemples de pratique, on voulait voir si leur collecte de données pouvait égaler celle des cliniciens expérimentés.

Étapes d’Abstraction des Données

La première étape a consisté à revoir les dossiers des patients soupçonnés d'avoir un GBM. Une équipe d'étudiants en médecine a travaillé avec des cliniciens pour comprendre les nuances des données qu'ils étudiaient. Ils ont développé un ensemble d'instructions pour guider les non-professionnels dans leurs revues de dossiers.

Un outil structuré a été créé pour la collecte de données, où les étudiants pouvaient répondre à des questions oui ou non et sélectionner des options dans des menus déroulants. Cette méthode a aidé à garder les données organisées et facilement exploitables pour de futures études.

Tester ce processus nous a permis d'affiner nos instructions en fonction des retours et de repérer les domaines nécessitant des améliorations. Par exemple, on a appris que les dates pouvaient être trompeuses si une mauvaise entrée était utilisée. Grâce à ce test pilote, on a amélioré à la fois le processus de collecte de données et la formation des étudiants.

Algorithme pour Organiser les Données de Traitement

Après avoir collecté les données, on a conçu un algorithme pour convertir les données d'administration de médicaments en LOTs définis. Ce système automatisé aide à organiser l’information sur les traitements qui peut souvent être en désordre quand on la regarde sous sa forme brute.

On a inclus divers types de traitements anticancéreux dans cette analyse, comme la chimiothérapie et les thérapies ciblées. Les règles pour définir les LOTs aident à déterminer les dates de début et de fin selon quand les médicaments sont administrés aux patients. Par exemple, s'il y a un écart de traitement de 90 jours, cela indiquerait le début d'une nouvelle ligne de traitement.

Une fois qu’on a généré les données LOT, un neuro-oncologue a passé en revue les résultats pour s’assurer qu'ils correspondaient aux pratiques de traitement attendues pour le GBM.

Évaluation de la Qualité de la Collecte des Données

On a vérifié à quel point les étudiants ont collecté les données avec précision en comparant leurs résultats à ceux des cliniciens. Cette comparaison a impliqué de regarder les dossiers qui avaient été examinés par les deux groupes. L'analyse de fiabilité a montré que les étudiants avaient bien performé par rapport aux cliniciens.

En fait, les non-professionnels ont obtenu des résultats similaires en qualité à ceux fournis par les professionnels médicaux. Cela indique qu'il est possible de former des personnes sans expertise médicale à collecter des données de haute qualité, ce qui pourrait réduire les coûts liés à l'abstraction des données.

Analyse des Modèles de Traitement

Grâce à nos données LOT organisées, on a pu analyser les modèles de traitement parmi les patients atteints de GBM. On a trouvé qu'un traitement de première ligne courant était le témozolomide, beaucoup de patients progressant ensuite vers un traitement de seconde ligne.

En examinant comment les patients passaient d'une ligne de thérapie à l'autre, on a obtenu des informations sur les parcours de traitement typiques. Par exemple, la plupart des patients qui ont commencé avec le témozolomide n’ont pas continué ce traitement longtemps, tandis que ceux qui recevaient une combinaison de témozolomide et d'un autre médicament avaient des durées de traitement plus longues.

On a aussi regardé combien de temps les patients attendaient avant de commencer leur prochain traitement après avoir terminé le premier. Cette analyse a montré que ceux sous thérapies combinées avaient de meilleurs délais de suivi par rapport à d'autres. Comprendre ces modèles peut aider les médecins à prendre de meilleures décisions de traitement à l'avenir.

Limitations et Directions Futures

Bien que notre étude ait produit des informations précieuses, il y avait quelques limitations. Par exemple, l'identification initiale des patients GBM reposait en partie sur un modèle d'apprentissage automatique, ce qui a pu entraîner des cas mal classés. De plus, la taille de l'échantillon pour l'analyse des LOT était petite en raison des dossiers de traitement limités dans les DSE.

Notre algorithme, bien qu'efficace, est encore basé sur des règles de base et peut ne pas prendre en compte tous les détails cliniques. Les travaux futurs pourraient se concentrer sur le raffinement de ces règles et la validation des résultats avec des ensembles de données plus importants.

Conclusion

En conclusion, rassembler des données significatives à partir de documents cliniques non structurés est un défi mais crucial pour la recherche sur le cancer. Notre étude met en évidence une façon d'exploiter les non-cliniciens pour l'abstraction des données et de créer un système organisé pour analyser les modèles de traitement chez les patients GBM.

Cette approche ouvre non seulement des portes pour une collecte de données plus efficace, mais soutient aussi le développement de meilleurs traitements en révélant des informations précieuses sur les soins aux patients. Dans l'ensemble, les méthodes que nous avons explorées peuvent être appliquées à divers scénarios de recherche clinique, contribuant finalement à améliorer les normes de soins pour les patients atteints de cancer.

Source originale

Titre: Data-driven extraction of unstructured electronic health records to evaluate glioblastoma treatment patterns

Résumé: BackgroundData on lines of therapy (LOTs) for cancer treatment is important for clinical oncology research, but LOTs are not explicitly recorded in EHRs. We present an efficient approach for clinical data abstraction and a flexible algorithm to derive LOTs from EHR-based medication data on patients with glioblastoma (GBM). MethodsNon-clinicians were trained to abstract the diagnosis of GBM from EHRs, and their accuracy was compared to abstraction performed by clinicians. The resulting data was used to build a cohort of patients with confirmed GBM diagnosis. An algorithm was developed to derive LOTs using structured medication data, accounting for the addition and discontinuation of therapies and drug class. Descriptive statistics were calculated and time-to-next-treatment analysis was performed using the Kaplan-Meier method. ResultsTreating clinicians as the gold standard, non-clinicians abstracted GBM diagnosis with sensitivity 0.98, specificity 1.00, PPV 1.00, and NPV 0.90, suggesting that non-clinician abstraction of GBM diagnosis was comparable to clinician abstraction. Out of 693 patients with a confirmed diagnosis of GBM, 246 patients contained structured information about the types of medications received. Of those, 165 (67.1%) received a first-line therapy (1L) of temozolomide, and the median time-to-next-treatment from the start of 1L was 179 days. ConclusionsWe also developed a flexible, interpretable, and easy-to-implement algorithm to derive LOTs given EHR data on medication orders and administrations that can be used to create high-quality datasets for outcomes research. We also showed that the cost of chart abstraction can be reduced by training non-clinicians instead of clinicians. Importance of the studyThis study proposes an efficient and accurate method to extract unstructured data from electronic health records (EHRs) for cancer outcomes research. The study addresses the limitations of manual abstraction of unstructured clinical data and presents a reproducible, low-cost workflow for clinical data abstraction and a flexible algorithm to derive lines of therapy (LOTs) from EHR-based structured medication data. The LOT data was used to conduct a descriptive treatment pattern analysis and a time-to-next-treatment analysis to demonstrate how EHR-derived unstructured data can be transformed to answer diverse clinical research questions. The study also investigates the feasibility of training non-clinicians to perform abstraction of GBM data, demonstrating that with detailed explanations of clinical documentation, best practices for chart review, and quantitative evaluation of abstraction performance, similar data quality to abstraction performed by clinicians can be achieved. The findings of this study have important implications for improving cancer outcomes research and facilitating the analysis of EHR-derived treatment data.

Auteurs: Akshay Swaminathan, A. Ren, J. Y. Wu, A. Bhargava-Shah, I. Lopez, U. Srivastava, V. Alexopoulos, R. Pizzitola, B. Bui, L. Alkhani, S. Lee, N. Mohit, N. Seo, N. Macedo, W. Cheng, W. Wang, E. Tran, R. Thomas, O. Gevaert

Dernière mise à jour: 2023-04-28 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2023.04.25.23289047

Source PDF: https://www.medrxiv.org/content/10.1101/2023.04.25.23289047.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires