Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Ciencias de la Salud# Informática sanitaria

Avances en la Detección del Cáncer de Pulmón Usando EHRs

Nuevos métodos buscan mejorar la detección temprana del cáncer de pulmón a través de los registros de salud electrónicos.

― 8 minilectura


Innovaciones en laInnovaciones en laDetección del Cáncer dePulmóncáncer de pulmón.detección temprana para los riesgos deLos EHR mejoran los métodos de
Tabla de contenidos

Los Modelos Predictivos son herramientas que ayudan a los doctores a tomar mejores decisiones sobre el diagnóstico y tratamiento de enfermedades. Una área donde estos modelos son especialmente útiles es en la detección temprana del cáncer de pulmón, sobre todo cuando los doctores encuentran pequeñas manchas en los pulmones llamadas nódulos pulmonares. Los investigadores están trabajando arduamente para crear modelos que ayuden a identificar con precisión quién está en riesgo de cáncer de pulmón basado en estos nódulos.

Construir modelos predictivos confiables requiere estudiar grandes grupos de personas. Cuantos más datos tengan los investigadores, mejor podrán asegurarse de que sus modelos funcionen bien para una amplia gama de personas. Los ensayos clínicos prospectivos, que implican seguir a los participantes a lo largo del tiempo, han proporcionado algunos datos útiles. Sin embargo, estos ensayos pueden ser costosos y a menudo se enfocan solo en personas con alto riesgo de cáncer de pulmón. Por eso, los investigadores están recurriendo a los registros de salud electrónicos (EHR) como una valiosa fuente de información sobre una población más amplia.

Recolectando Datos de Registros de Salud Electrónicos

Usar EHR implica un proceso de dos pasos. Primero, los investigadores deben definir condiciones de salud específicas para distinguir entre pacientes con cáncer de pulmón y aquellos sin él. Este proceso requiere una selección cuidadosa de pacientes basada en su historial médico. El segundo paso es filtrar los datos para recopilar información relevante sobre estos pacientes a lo largo del tiempo.

Un reto al usar EHR es que no todos los pacientes con nódulos pulmonares sospechosos tienen un historial de cáncer. A menudo, los doctores se enfrentan a dificultades para determinar qué tan probable es que estos nódulos sean cancerosos en pacientes sin historial de cáncer. Por otro lado, los pacientes con un diagnóstico reciente de cáncer suelen someterse a pruebas más exhaustivas, ya que tienen una mayor probabilidad de tener nódulos malignos. Para mejorar los modelos predictivos, los investigadores se enfocan en individuos con nódulos pulmonares indeterminados que no tienen un historial reciente de cáncer.

El Papel de los Códigos ICD

Los códigos de Clasificación Internacional de Enfermedades (ICD) ayudan a identificar diversas condiciones médicas y son comúnmente usados para fines de facturación en los EE. UU. Sin embargo, uno de los problemas que enfrentan los investigadores es la falta de acuerdo sobre qué códigos ICD usar para definir un problema de salud específico, como el cáncer de pulmón. Algunos datos sobre si un nódulo es canceroso pueden encontrarse solo en datos no estructurados, como notas clínicas e informes de biopsias.

Para abordar esto, los investigadores proponen usar un conjunto específico de términos médicos conocidos como SNOMED-CT para definir el cáncer de pulmón y nódulos relacionados. Al analizar la temporalidad de los diagnósticos y relacionarlos con los casos identificados, los investigadores pueden crear categorías más claras de pacientes.

Una vez que los pacientes están agrupados en casos (pacientes con cáncer de pulmón) y controles (pacientes sin cáncer de pulmón), el siguiente paso es extraer datos relevantes. Estos datos suelen obtenerse de diversos estudios de imagen, principalmente tomografías computarizadas de tórax. Idealmente, los investigadores evaluarían múltiples tomografías a lo largo del tiempo para ver cómo cambian los nódulos.

Desafíos en la Recolección de Datos

Recoger los datos necesarios suele ser costoso y lleva tiempo. Las revisiones manuales de imágenes y notas clínicas pueden requerir un gran esfuerzo. Por eso, los investigadores están explorando métodos automatizados para recolectar información sobre las imágenes médicas de los pacientes y datos clínicos para hacer el proceso más eficiente.

Desarrollar métodos estandarizados para recopilar datos ayuda a asegurar que los grupos de pacientes estudiados puedan compararse entre diferentes instituciones y áreas geográficas. Sin embargo, los EHR varían según la institución, creando desafíos únicos para la extracción de datos. Los investigadores pretenden crear métodos que funcionen sin importar las diferencias en las estructuras de datos, permitiéndoles enfocarse únicamente en los códigos ICD relevantes para su estudio.

Cohortes Definidas por Nódulos Pulmonares Solitarios

En esta investigación, el objetivo era curar cohortes de pacientes que tienen nódulos pulmonares solitarios (SPNs) sin un diagnóstico previo de cáncer. Una cohorte es simplemente un grupo de individuos usados para un estudio. Los investigadores identificaron individuos con SPNs a través de códigos ICD específicos y establecieron criterios para su inclusión en el estudio. Esto implicó identificar casos de cáncer de pulmón que se desarrollaron dentro de un marco temporal específico después de encontrar los SPNs.

Para separar los casos de los controles, los investigadores usaron marcos temporales específicos. Por ejemplo, si un SPN se mantuvo estable durante tres años, probablemente no era maligno. Esta información ayudó a crear definiciones más claras sobre qué pacientes debían ser incluidos en el estudio.

Extracción de Datos y Aseguramiento de Calidad

Los investigadores recopilaron información demográfica, resultados de laboratorio y órdenes de medicamentos para pacientes que caían dentro de sus ventanas de observación definidas. También realizaron controles de calidad de las tomografías para asegurarse de que las imágenes representaran con precisión las condiciones médicas relevantes. Al hacerlo, pretendían asegurarse de que los datos recopilados fueran tanto de alta calidad como relevantes para el estudio.

Una parte crítica del proceso implicó clasificar imágenes según su temporalidad en relación con los eventos de cáncer de pulmón de los pacientes. Los investigadores querían asegurarse de incluir imágenes que proporcionaran la información más útil para entender la progresión de la enfermedad.

Validando las Cohortes

Para validar sus grupos de pacientes, los investigadores compararon sus hallazgos con información de un registro de cáncer. Este registro recoge datos sobre pacientes diagnosticados con cáncer y proporciona a los investigadores un punto de referencia más confiable. Al revisar una muestra de pacientes tanto en su estudio como en el registro, los investigadores pretendían evaluar cuán bien habían identificado los casos y controles.

A través de este proceso de revisión, descubrieron que su método era efectivo para identificar pacientes con y sin cáncer de pulmón. Encontraron que su enfoque propuesto tenía una baja tasa de falsos positivos, lo que significa que la mayoría de los pacientes etiquetados como teniendo cáncer de pulmón realmente lo tenían.

Resultados y Hallazgos

Los investigadores encontraron un número significativo de sujetos únicos que cumplían con sus criterios para inclusión en el estudio. Muchos de estos participantes no tenían un historial de cáncer antes de desarrollar SPNs. Al aplicar sus criterios de inclusión, los investigadores identificaron con éxito tanto casos de cáncer de pulmón como controles entre los participantes.

En las cohortes de imagen, los investigadores recopilaron miles de tomografías computarizadas y verificaron su calidad. También categorizaron las tomografías para asegurarse de incluir imágenes más relevantes para el diagnóstico de cáncer de pulmón. Este esfuerzo involucró revisar cuidadosamente los datos de imagen disponibles y seleccionar solo aquellos que cumplieran con sus estándares.

Conclusión

El estudio enfatizó la importancia de usar reglas bien definidas sobre los códigos ICD para curar grupos de pacientes para la investigación del cáncer de pulmón. Al enfocarse en pacientes con SPNs y asegurarse de la identificación precisa de casos y controles, los investigadores pretendían contribuir con ideas valiosas sobre el diagnóstico y la evaluación del riesgo de cáncer de pulmón.

De cara al futuro, los investigadores subrayaron la necesidad de considerar datos más allá de las ventanas de observación inmediatas al generar hipótesis o desarrollar modelos predictivos. Si bien el enfoque tenía limitaciones, ofreció un método prometedor para vincular los registros de salud electrónicos con resultados reales de pacientes.

En resumen, al utilizar registros de salud electrónicos y sistemas de codificación estandarizados, los investigadores esperan mejorar la comprensión y detección del cáncer de pulmón. Su trabajo es un paso importante para asegurar que los profesionales médicos puedan identificar y manejar mejor a los pacientes en riesgo de esta grave enfermedad.

Fuente original

Título: Curating Retrospective Multimodal and Longitudinal Data for Community Cohorts at Risk for Lung Cancer.

Resumen: Large community cohorts are useful for lung cancer research, allowing for the development and validation of predictive models. A robust methodology for (1) identifying lung cancer and pulmonary nodules from electronic health record (EHRs) as well as (2) associating longitudinal data with these conditions is needed to optimally curate cohorts at scale from clinical data. Both objectives present the challenge of labeling noisy multimodal data while minimizing assumptions about the data structure specific to any institution. In this study, we leveraged (1) SNOMED concepts to develop ICD-based decision rules for building a cohort that captured lung cancer and pulmonary nodules and (2) clinical knowledge to define time windows for collecting longitudinal imaging and clinical concepts. We curated three cohorts with clinical concepts and repeated imaging for subjects with pulmonary nodules from our Vanderbilt University Medical Center. Our approach achieved an estimated sensitivity 0.930 (95% CI: [0.879, 0.969]), specificity of 0.996 (95% CI: [0.989, 1.00]), positive predictive value of 0.979 (95% CI: [0.959, 1.000]), and negative predictive value of 0.987 (95% CI: [0.976, 0.994]). for distinguishing lung cancer from subjects with SPNs. This work represents a strategy for high-throughput curation of multi-modal longitudinal cohorts at risk for lung cancer from routinely collected EHRs.

Autores: Thomas Z Li, K. Xu, N. C. Chada, H. Chen, M. Knight, S. Antic, K. L. Sandler, F. Maldonado, B. Landman, T. A. Lasko

Última actualización: 2023-11-04 00:00:00

Idioma: English

Fuente URL: https://www.medrxiv.org/content/10.1101/2023.11.03.23298020

Fuente PDF: https://www.medrxiv.org/content/10.1101/2023.11.03.23298020.full.pdf

Licencia: https://creativecommons.org/licenses/by-nc/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares