Diagnóstico Asistido por IA de Insuficiencia Cardíaca Usando Radiografías de Tórax
Un estudio muestra que la IA puede mejorar la precisión del diagnóstico de insuficiencia cardíaca.
― 8 minilectura
Tabla de contenidos
La Insuficiencia Cardíaca es un tema de salud importante que hace que muchas personas vayan al hospital. A medida que la población envejece, el número de casos de insuficiencia cardíaca va en aumento. Este problema puede ser difícil de diagnosticar porque los síntomas varían mucho, sobre todo en pacientes con otros problemas de salud. Los médicos no siempre reconocen estas señales, especialmente si no están familiarizados con las condiciones del corazón.
Hay varias pruebas que pueden ayudar a diagnosticar la insuficiencia cardíaca. Las radiografías de tórax son comunes y rápidas de obtener, pero interpretar estas imágenes requiere habilidad. Además, no siempre muestran con Precisión la insuficiencia cardíaca. Otra prueba mide los niveles de péptido natriurético, una sustancia que ayuda en el diagnóstico y manejo de la insuficiencia cardíaca. Sin embargo, la prueba de péptido natriurético requiere equipos especiales que podrían no estar disponibles todo el tiempo, especialmente de noche o los fines de semana.
Esperamos crear herramientas automatizadas para ayudar a los proveedores de salud a diagnosticar la insuficiencia cardíaca de manera rápida y asequible. Con los avances en inteligencia artificial (IA) y tecnología informática, podemos explorar nuevas formas para mejorar este proceso. Los algoritmos de IA, particularmente los modelos de aprendizaje profundo, han mostrado promesas en el reconocimiento de patrones en imágenes. Nuestro estudio tuvo como objetivo usar imágenes de radiografías de tórax junto con un modelo de IA para ayudar a diagnosticar la insuficiencia cardíaca y comparar su precisión con la de cardiólogos experimentados.
Pacientes del estudio y recolección de datos
Llevamos a cabo nuestro estudio en dos hospitales en Hiroshima, Japón, durante un año. Seleccionamos a pacientes que tuvieron tanto radiografías de tórax como pruebas de péptido natriurético el mismo día. Nos centramos en los niveles de péptido natriurético, específicamente la prueba BNP, ya que es la opción preferida para evaluar la insuficiencia cardíaca en esos hospitales.
Revisamos los registros médicos de los pacientes elegibles para recolectar datos. Consideramos diversas condiciones que podrían afectar las imágenes de radiografías de tórax. Por ejemplo, incluimos imágenes desde diferentes ángulos y posiciones del paciente, ya sea de pie, sentado o acostado. No incluimos vistas laterales en este estudio.
Nuestro objetivo principal era usar un nivel de BNP de 200 pg/mL para clasificar las imágenes en la parte principal del estudio y 100 pg/mL para un sub-estudio. Etiquetamos cada imagen de Radiografía de tórax con un resultado binario basado en estos valores de corte. Los datos usados para entrenar y validar nuestros modelos de IA provinieron de un hospital, mientras que el otro hospital proporcionó un conjunto de datos de prueba externa.
Desarrollo del modelo de IA
Diseñamos cuidadosamente nuestro modelo de IA, que incluía 31 modelos de reconocimiento de imágenes preentrenados modificados. Estos modelos se usaron como aprendices débiles para predecir altos niveles de BNP a partir de imágenes de radiografías de tórax. Combinamos sus predicciones para crear un modelo en conjunto final. Esto significa que promediamos los resultados de los diferentes modelos para aumentar la precisión.
Para probar el rendimiento de nuestros modelos, calculamos varias métricas, incluyendo precisión, exactitud, sensibilidad y especificidad. Creamos curvas de característica operativa del receptor (ROC) para visualizar cuán eficazmente nuestro modelo de IA podía identificar niveles elevados de BNP.
Evaluando el rendimiento humano
También queríamos ver cómo se desempeñaban los doctores humanos en predecir los niveles de BNP a partir de imágenes de radiografías de tórax. Invitamos a voluntarios del personal del hospital a participar en nuestras pruebas. Recibieron capacitación sobre cómo identificar signos de insuficiencia cardíaca en las imágenes y se les mostraron ejemplos con sus niveles de BNP correspondientes.
Los participantes evaluaron 100 imágenes de radiografías de tórax de nuestro conjunto de datos de prueba. Las imágenes incluían cantidades iguales de aquellas con niveles de BNP por encima y por debajo del valor de corte. Después de su evaluación inicial, les mostramos las predicciones hechas por nuestro modelo de IA y les pedimos que evaluaran las imágenes de nuevo.
Nuestro modelo de IA mostró una precisión del 86%, superando a los participantes humanos por un margen del 10 al 20%. Los participantes humanos incluían doctores con diferentes niveles de experiencia, y notamos diferencias significativas en precisión según sus antecedentes.
Análisis estadístico
Analizamos nuestros datos usando software y métodos estadísticos para determinar la precisión y significancia de nuestros hallazgos. Mostramos los resultados en formatos fáciles de leer e incluimos estadísticas resumidas para variables tanto continuas como categóricas.
Características iniciales
El estudio involucró a 1,607 pacientes, con diversos diagnósticos como insuficiencia cardíaca, enfermedad arterial coronaria, entre otros. Recolectamos más de 10,000 imágenes de radiografías de tórax divididas entre conjuntos de datos de entrenamiento, validación y prueba.
Rendimiento del modelo de IA
El rendimiento de nuestros modelos de IA fue alentador. El modelo en conjunto final alcanzó alta precisión y exactitud al predecir niveles elevados de BNP a partir de imágenes de radiografías de tórax. El modelo no solo se desempeñó bien en tareas de reconocimiento, sino que también identificó características cruciales relacionadas con la insuficiencia cardíaca.
Resultados del rendimiento humano
De los 35 participantes en nuestra prueba humana, muchos eran doctores con alta experiencia. El rendimiento del modelo de IA fue superior en comparación con los participantes, incluso después de que recibieron ayuda de IA. Encontramos que, aunque los médicos tenían mejor precisión que los no doctores sin ayuda de IA, la brecha se redujo cuando se introdujeron las predicciones de IA.
Curiosamente, algunos participantes inexperimentados superaron a expertos con experiencia al usar la asistencia de IA. Esto mostró cuán valiosa podría ser la IA para ayudar a los practicantes menos experimentados a hacer diagnósticos precisos.
Discusión de hallazgos
Nuestro estudio resalta el gran potencial de la IA para ayudar en el diagnóstico de la insuficiencia cardíaca a través de imágenes de radiografías de tórax. Los resultados mostraron que los modelos de IA podrían superar incluso a cardiólogos experimentados en la predicción de niveles elevados de BNP.
Los modelos utilizados capturaron características relevantes en las imágenes de radiografías de tórax que previamente se habían asociado con la insuficiencia cardíaca. Aunque la IA no puede reemplazar a los médicos, puede servir como una herramienta útil para mejorar la precisión diagnóstica.
Un hallazgo crítico fue que la aceptación y el uso adecuado de las herramientas de IA pueden variar entre diferentes niveles de experiencia. Mientras que los individuos menos experimentados mostraron disposición para adaptarse a las sugerencias de IA, los expertos pueden dudar, posiblemente debido a la confianza excesiva en sus habilidades.
Limitaciones del estudio
Es importante señalar algunas limitaciones en nuestro estudio. Nos enfocamos principalmente en predicciones binarias de valores de BNP, lo que podría no captar todos los aspectos del diagnóstico de insuficiencia cardíaca. Los valores de corte seleccionados deberían ser ajustables dependiendo de la situación específica.
Usar radiografías torácicas para diagnosticar insuficiencia cardíaca es solo una parte de los muchos factores en juego. Por lo tanto, aunque nuestro modelo de IA muestra promesas, debería ser usado junto con otros métodos para lograr los mejores resultados.
Conclusión
Nuestros hallazgos sugieren que la IA puede predecir de manera efectiva niveles elevados de BNP a partir de imágenes de radiografías de tórax, ofreciendo una asistencia valiosa a los proveedores de salud en el diagnóstico de insuficiencia cardíaca. La brecha en el uso de nuevas tecnologías señala la necesidad de capacitación y aceptación de herramientas de IA entre los profesionales médicos.
A medida que la IA continúa evolucionando, tiene el potencial de cambiar nuestra forma de abordar la salud de una manera que mejore la precisión diagnóstica y conduzca a mejores resultados para los pacientes a nivel mundial.
Título: Predicting elevated natriuretic peptide in chest radiography: emerging utilization gap for artificial intelligence
Resumen: AimsThis study assessed an artificial intelligence (AI) models performance in predicting elevated brain natriuretic peptide (BNP) levels from chest radiograms and its effect on human diagnostic performance. Methods and resultsPatients who underwent chest radiography and BNP testing on the same day were included. Data were sourced from two hospitals: one for model development, and the other for external testing. Two final ensemble models were developed to predict elevated BNP levels of >= 200 pg/mL and >= 100 pg/mL, respectively. Humans were evaluated to predict elevated BNP levels, followed by the same test, referring to the AI models predictions. The 8390 images from 1334 patients were collected for model creation, and 1713 images from 273 patients for tests. The AI model achieved an accuracy of 0.855, precision of 0.873, sensitivity of 0.827, specificity of 0.882, f1 score of 0.850, and receiver-operating-characteristics area-under-curve of 0.929. The accuracy of the testing with the 100 images by 35 participants significantly improved from 0.708{+/-}0.049 to 0.829{+/-}0.069 (P < 0.001) with the AI assistance (an accuracy of 0.920). Without the AI assistance, the accuracy of the experts was higher than that of non-experts (0.728{+/-}0.051 vs. 0.692{+/-}0.042, P = 0.030); however, with the AI assistance, the accuracy of the non-experts was rather higher than that of the experts (0.851{+/-}0.074 vs. 0.803{+/-}0.054, P = 0.033). ConclusionThe AI model can predict elevated BNP levels from chest radiograms and has the potential to improve human performance. The gap in utilizing new tools represents one of the emerging issues. Graphical Abstract O_FIG O_LINKSMALLFIG WIDTH=157 HEIGHT=200 SRC="FIGDIR/small/23286205v9_ufig1.gif" ALT="Figure 1"> View larger version (38K): [email protected]@1f1e77dorg.highwire.dtl.DTLVardef@94e88corg.highwire.dtl.DTLVardef@2f48db_HPS_FORMAT_FIGEXP M_FIG We developed AI models using an ensemble method to predict elevated BNP levels. The AI model achieved a higher accuracy rate than any individual participant. While the accuracy of experts was higher in the non-assisted test, with the AI assistance, the accuracy of non-experts surpassed that of the experts. AI, artificial intelligence; AUC, area-under-curve; BNP, brain natriuretic peptide; GPU, graphic processing unit; PR, precision-recall; ROC, receiver-operating-characteristics. C_FIG
Autores: Eisuke Kagawa, M. Kato, N. Oda, E. Kunita, M. Nagai, A. Yamane, S. Matsui, Y. Yoshitomi, H. Shimajiri, T. Hirokawa, S. Ishida, G. Kurimoto, K. Dote
Última actualización: 2024-01-22 00:00:00
Idioma: English
Fuente URL: https://www.medrxiv.org/content/10.1101/2023.02.22.23286205
Fuente PDF: https://www.medrxiv.org/content/10.1101/2023.02.22.23286205.full.pdf
Licencia: https://creativecommons.org/licenses/by-nc/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.