Simple Science

Ciência de ponta explicada de forma simples

# Biologia Quantitativa# Processamento de Imagem e Vídeo# Métodos Quantitativos

Impacto das Diferenças de Coloração no Aprendizado de Máquina em Câncer de Pulmão

Estudo mostra que variações de manchas atrapalham redes neurais profundas na previsão de câncer.

Siyu, Lin, Haowen Zhou, Richard J. Cote, Mark Watson, Ramaswamy Govindan, Changhuei Yang

― 5 min ler


Problemas de Manchas emProblemas de Manchas emModelos de Aprendizado deMáquinanas avaliações de câncer de pulmão.Diferenças de coloração desafiam DNNs
Índice

Nos últimos anos, modelos de aprendizado profundo, especialmente redes neurais profundas (DNNS), têm sido usados em testes e diagnósticos médicos. Esses modelos conseguem aprender com muitas imagens pra reconhecer padrões que talvez passem despercebidos por especialistas humanos. Mas um desafio que surge é a diferença em como as amostras de tecido são coradas, o que pode impactar o desempenho do modelo. Este estudo foca em como essas diferenças de coloração afetam a capacidade de uma DNN de prever os resultados dos pacientes em casos de câncer de pulmão.

O Problema com as Diferenças de Coloração

Quando os patologistas examinam amostras de tecido, eles usam um processo chamado coloração pra destacar diferentes tipos de células e estruturas. Porém, a coloração pode variar de uma amostra pra outra, mesmo que venham do mesmo paciente. Essa variação pode surgir de lotes de coloração diferentes, técnicas distintas, ou até mesmo diferenças no tempo de processamento. Essas diferenças podem confundir as DNNs que aprendem com imagens, tornando-as menos confiáveis na previsão das condições dos pacientes.

Neste estudo, os pesquisadores usaram um conjunto de dados de amostras de câncer de pulmão de não pequenas células (NSCLC). Eles treinaram uma DNN com amostras que foram coradas e processadas ao mesmo tempo, conseguindo alta Precisão em prever quais tumores iriam se espalhar. Mas, quando testaram com amostras coradas em um momento diferente, o desempenho da DNN caiu drasticamente.

Métodos Usados no Estudo

Pra investigar essa questão, os pesquisadores utilizaram amostras de pacientes diagnosticados com NSCLC. Eles obtiveram novas lâminas de tecido do mesmo tipo de tumores, mas prepararam-nas em momentos diferentes. A DNN foi treinada pra prever se o câncer se espalharia com base nas imagens do primeiro conjunto de lâminas. Quando testaram com imagens do segundo conjunto, a DNN teve dificuldades. Esse resultado destacou o impacto das diferenças de coloração na generalização do modelo.

O estudo envolveu dois métodos diferentes de Normalização de cores pra minimizar a variação de coloração:

  1. Normalização de Cores Tradicional: Esse método ajustou as cores com base em um conjunto de imagens de referência. A intenção era deixar as imagens mais parecidas, mas mesmo assim não conseguiu cobrir totalmente a diferença entre os lotes das amostras.
  2. Normalização de Cores CycleGAN: Essa técnica mais nova envolveu o uso de um modelo de aprendizado de máquina pra transformar imagens em um espaço de cor comum, fazendo-as parecer mais parecidas. Infelizmente, até esse método avançado não conseguiu eliminar completamente as diferenças.

Resultados da Análise

Os resultados do estudo foram reveladores. Quando a DNN foi treinada e testada no mesmo lote de imagens, ela teve um bom desempenho. No entanto, quando foi testada com imagens de um lote diferente, sua precisão caiu drasticamente. Ambos os métodos de normalização tentaram reduzir as diferenças de coloração, mas nenhum conseguiu tornar a DNN confiável entre os lotes.

A normalização tradicional mostrou alguma melhora nos testes de mesmo lote, mas não ajudou nos testes em lotes diferentes. A normalização CycleGAN também não conseguiu melhorar o desempenho da DNN nos testes inter-lotes. Em essência, a incapacidade desses métodos de lidar com a variabilidade das colorações destaca uma barreira significativa para as DNNs na patologia.

Aprendendo com as Descobertas

Essa pesquisa aponta algumas coisas importantes. Primeiro, enquanto as DNNs podem ser ferramentas poderosas no diagnóstico médico, seu desempenho depende muito da qualidade e consistência dos dados de treino. Se os dados variam demais, até os modelos mais sofisticados podem falhar.

Além disso, o estudo enfatiza a necessidade de métodos melhores pra padronizar o processo de coloração. Quando as amostras de tecido são coradas de maneira diferente, fica difícil usar modelos treinados com um conjunto de imagens pra previsões em outro, mesmo que sejam do mesmo paciente.

Olhando pra Frente

Pra melhorar a confiabilidade das DNNs em imagens médicas, os pesquisadores podem precisar se concentrar em duas áreas principais:

  1. Técnicas Avançadas de Normalização de Cores: É necessário desenvolver novos métodos que consigam lidar efetivamente com as diferenças nas colorações. Os métodos existentes não são suficientes, como mostrado neste estudo.
  2. Abordagens Inovadoras de Imagem: Os cientistas podem querer explorar alternativas à coloração tradicional, como técnicas de imagem que não dependam de cor. Por exemplo, métodos de imagem sem rótulos poderiam fornecer dados consistentes sem as complicações introduzidas pela coloração.

Conclusão

O estudo ressalta os desafios que a variabilidade da coloração apresenta para o desenvolvimento e aplicação de DNNs na patologia. Enquanto esses modelos têm um grande potencial pra melhorar o cuidado com os pacientes e os resultados, sua eficácia depende da habilidade de preparar e processar consistentemente as amostras de tecido. Avançando, uma combinação de melhor manuseio de dados e técnicas de imagem inovadoras pode abrir caminho para aplicações mais robustas do aprendizado profundo no diagnóstico de câncer e outras doenças.

Com mais pesquisa e ajustes na forma como as amostras são preparadas, é possível melhorar o desempenho das DNNs, tornando-as mais confiáveis na previsão dos resultados dos pacientes. Isso, em última análise, levará a um melhor cuidado com os pacientes e diagnósticos mais precisos na área de patologia.

Fonte original

Título: Impact of Stain Variation and Color Normalization for Prognostic Predictions in Pathology

Resumo: In recent years, deep neural networks (DNNs) have demonstrated remarkable performance in pathology applications, potentially even outperforming expert pathologists due to their ability to learn subtle features from large datasets. One complication in preparing digital pathology datasets for DNN tasks is variation in tinctorial qualities. A common way to address this is to perform stain normalization on the images. In this study, we show that a well-trained DNN model trained on one batch of histological slides failed to generalize to another batch prepared at a different time from the same tissue blocks, even when stain normalization methods were applied. This study used sample data from a previously reported DNN that was able to identify patients with early stage non-small cell lung cancer (NSCLC) whose tumors did and did not metastasize, with high accuracy, based on training and then testing of digital images from H&E stained primary tumor tissue sections processed at the same time. In this study we obtained a new series of histologic slides from the adjacent recuts of same tissue blocks processed in the same lab but at a different time. We found that the DNN trained on the either batch of slides/images was unable to generalize and failed to predict progression in the other batch of slides/images (AUC_cross-batch = 0.52 - 0.53 compared to AUC_same-batch = 0.74 - 0.81). The failure to generalize did not improve even when the tinctorial difference correction were made through either traditional color-tuning or stain normalization with the help of a Cycle Generative Adversarial Network (CycleGAN) process. This highlights the need to develop an entirely new way to process and collect consistent microscopy images from histologic slides that can be used to both train and allow for the general application of predictive DNN algorithms.

Autores: Siyu, Lin, Haowen Zhou, Richard J. Cote, Mark Watson, Ramaswamy Govindan, Changhuei Yang

Última atualização: 2024-09-12 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2409.08338

Fonte PDF: https://arxiv.org/pdf/2409.08338

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes