El aprendizaje profundo ayuda en el análisis de radiografías de pecho
Un estudio muestra que las herramientas de aprendizaje profundo pueden mejorar las evaluaciones de radiografías de tórax.
― 6 minilectura
Tabla de contenidos
- Propósito del Estudio
- Antecedentes
- Algoritmo de Aprendizaje Profundo
- Diseño del Estudio
- Resultados
- Impacto en la Carga de Trabajo
- Entendiendo la Normalidad
- Proceso de Revisión del Auditor
- Rendimiento del Modelo en Diferentes Trusts
- Tipos de Discrepancias
- Altos Niveles de Servicio
- Combinando Tecnología con Experiencia Humana
- Equidad en Diferentes Entornos
- Direcciones Futuras
- Conclusión
- Fuente original
- Enlaces de referencia
Las radiografías de tórax (CXRs) son una prueba médica común usada para revisar problemas de salud en el área del pecho. En el Reino Unido, el número de CXRs realizados ha ido en aumento, lo que está estresando a los departamentos de radiología. Se necesita encontrar formas eficientes de manejar esta creciente demanda. Los avances recientes en tecnología, especialmente en aprendizaje profundo (DL), han mostrado potencial para ayudar a reducir la carga de trabajo de los radiólogos.
Propósito del Estudio
Este estudio busca evaluar qué tan bien funciona un programa de aprendizaje profundo para identificar radiografías de tórax normales dentro de los NHS Trusts. El software está diseñado para apoyar a los doctores, clasificando rápidamente ciertas CXRs como normales, lo que puede ayudar a disminuir la carga sobre los radiólogos.
Antecedentes
Entre abril de 2021 y abril de 2022, se realizaron más de 7.9 millones de radiografías de tórax en el NHS, marcando un aumento significativo en comparación con años anteriores. Los departamentos de radiología están bajo una presión considerable, ya que más pacientes esperan tratamiento. Hasta marzo de 2023, había 7.3 millones de pacientes en listas de espera del NHS, el doble de la cifra anterior a la pandemia.
Además, hay una escasez de radiólogos, lo que plantea un reto en la gestión de la atención al paciente. El Royal College of Radiologists ha pedido más inversión en tecnología para ayudar en diagnósticos y tratamientos.
Algoritmo de Aprendizaje Profundo
El algoritmo de aprendizaje profundo utilizado en este estudio es un programa informático que analiza las radiografías de tórax. Se ha implementado en dos NHS trusts para ayudar a identificar CXRs que probablemente sean normales. El software asigna puntuaciones a cada radiografía, ayudando a clasificarlas. Si una puntuación indica alta confianza de que la radiografía es normal, se etiqueta en consecuencia.
Este programa específico ha estado en funcionamiento en Somerset NHS Foundation Trust desde diciembre de 2022 y en Calderdale Huddersfield NHS Foundation Trust desde marzo de 2023.
Diseño del Estudio
El estudio involucró 4,654 radiografías de tórax procesadas por el algoritmo de aprendizaje profundo durante seis semanas. El objetivo era ver cuán efectivamente podía el programa señalar CXRs normales con una baja tasa de errores. Se emplearon radiólogos auditores para revisar las radiografías identificadas como normales por la herramienta de aprendizaje profundo.
Resultados
El algoritmo de aprendizaje profundo clasificó el 20% de las radiografías evaluadas como normales con alta confianza (HCN). Logró un Valor Predictivo Negativo (NPV) de 0.96, indicando que era bastante preciso. De todos los exámenes señalados como HCN, solo una pequeña fracción (0.77%) resultó ser incorrectamente clasificada.
El tiempo promedio para recibir resultados del algoritmo fue de solo 7.1 segundos, mostrando su capacidad de respuesta rápida y eficiencia.
Impacto en la Carga de Trabajo
Al identificar con precisión las CXRs normales, el algoritmo de aprendizaje profundo ayuda a reducir el número de radiografías que los radiólogos necesitan revisar. Esto les permite enfocarse más en los casos que pueden requerir más examen o intervención.
Entendiendo la Normalidad
Para asegurar que el algoritmo funcione de manera efectiva, se usó una definición específica de cómo se ve una Radiografía de tórax normal. Una radiografía normal muestra imágenes claras de los pulmones y el corazón sin signos de anormalidades. Si una radiografía no cumplía con estos criterios, se clasificaba como anormal, incluso si no se encontraban problemas significativos.
Proceso de Revisión del Auditor
Después de que el algoritmo procesara las radiografías, radiólogos independientes revisaron los resultados. Su objetivo era confirmar los hallazgos del algoritmo e identificar cualquier posible error. El ciclo de retroalimentación de revisar y verificar ayuda a generar confianza en el desempeño del sistema.
Rendimiento del Modelo en Diferentes Trusts
El rendimiento del algoritmo de aprendizaje profundo fue consistente en ambos NHS Trusts involucrados en el estudio. En Somerset NHS Foundation Trust, el NPV fue de 0.96 con una tasa de discrepancia del 0.79%. En Calderdale Huddersfield NHS Trust, los resultados fueron comparables, con una tasa de discrepancia del 0.76%. Esto sugiere que el algoritmo funciona bien, sin importar la ubicación o el equipo específico utilizado.
Tipos de Discrepancias
Aunque el rendimiento general fue fuerte, se notaron algunas discrepancias. El problema más común involucró anormalidades óseas crónicas, como variaciones benignas de costillas o fracturas antiguas. Algunas radiografías fueron clasificadas como subóptimas, lo que significa que su calidad no era suficiente para determinar claramente la normalidad.
Altos Niveles de Servicio
A lo largo del estudio, el sistema mantuvo altos niveles de servicio. La gran mayoría de las radiografías fueron auditadas en 24 horas, asegurando respuestas oportunas para los clínicos. Este corto tiempo de respuesta contribuye a la eficiencia del proceso de atención médica y ayuda en la toma de decisiones.
Combinando Tecnología con Experiencia Humana
El estudio ilustra la importancia de la tecnología y la experiencia humana en el diagnóstico médico. El algoritmo de aprendizaje profundo manejó efectivamente una parte de la carga de trabajo, pero contar con radiólogos revisando los resultados fue crucial. Resalta la idea de que la tecnología debe complementar las habilidades humanas en lugar de reemplazarlas.
Equidad en Diferentes Entornos
El rendimiento similar del algoritmo en distintas ubicaciones indica que se puede implementar efectivamente en varios entornos de atención médica. Esto es crítico, ya que muestra que pacientes de diversas procedencias pueden beneficiarse del mismo nivel de apoyo diagnóstico.
Direcciones Futuras
Para recopilar más datos, los investigadores podrían querer revisar todas las radiografías procesadas, no solo las clasificadas como HCN. Esto podría proporcionar métricas de rendimiento adicionales y ayudar a comparar la precisión del algoritmo frente a radiólogos humanos de manera más completa.
Conclusión
Este estudio demuestra el prometedor papel de un algoritmo de aprendizaje profundo en la identificación de radiografías de tórax normales en un entorno del mundo real. Reduce efectivamente la carga de trabajo para los radiólogos, manteniendo una alta tasa de precisión. El programa se implementó con éxito en vías clínicas activas, sugiriendo que tecnologías como esta pueden ayudar a satisfacer las crecientes demandas de los sistemas de salud.
En general, los hallazgos apoyan la integración de tecnología avanzada en las prácticas médicas rutinarias, allanando el camino para una atención al paciente más eficiente sin comprometer la calidad. El estudio muestra que, con las herramientas y procesos adecuados, la atención médica puede adaptarse a los retos mientras optimiza los recursos.
Título: Real-World Performance of Autonomously Reporting Normal Chest Radiographs in NHS Trusts Using a Deep-Learning Algorithm on the GP Pathway
Resumen: AIM To analyse the performance of a deep-learning (DL) algorithm currently deployed as diagnostic decision support software in two NHS Trusts used to identify normal chest x-rays in active clinical pathways. MATERIALS AND METHODS A DL algorithm has been deployed in Somerset NHS Foundation Trust (SFT) since December 2022, and at Calderdale & Huddersfield NHS Foundation Trust (CHFT) since March 2023. The algorithm was developed and trained prior to deployment, and is used to assign abnormality scores to each GP-requested chest x-ray (CXR). The algorithm classifies a subset of examinations with the lowest abnormality scores as High Confidence Normal (HCN), and displays this result to the Trust. This two-site study includes 4,654 CXR continuous examinations processed by the algorithm over a six-week period. RESULTS When classifying 20.0% of assessed examinations (930) as HCN, the model classified exams with a negative predictive value (NPV) of 0.96. There were 0.77% of examinations (36) classified incorrectly as HCN, with none of the abnormalities considered clinically significant by auditing radiologists. The DL software maintained fast levels of service to clinicians, with results returned to Trusts in a mean time of 7.1 seconds. CONCLUSION The DL algorithm performs with a low rate of error and is highly effective as an automated diagnostic decision support tool, used to autonomously report a subset of CXRs as normal with high confidence. Removing 20% of all CXRs reduces workload for reporters and allows radiology departments to focus resources elsewhere.
Autores: Jordan Smith, Tom Naunton Morgan, Paul Williams, Qaiser Malik, Simon Rasalingham
Última actualización: 2023-06-28 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2306.16115
Fuente PDF: https://arxiv.org/pdf/2306.16115
Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.