Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Radiologia e diagnostica per immagini

Avanços na Segmentação de Imagens Médicas Usando Aprendizado de Máquina

Novas técnicas melhoram a precisão da segmentação em radiografias de tórax.

― 8 min ler


Avanço em Segmentação deAvanço em Segmentação deImagem com IAimagens nos diagnósticos médicos.Novos métodos melhoram a precisão das
Índice

Desenvolvimentos recentes em inteligência artificial, especialmente em deep learning, melhoraram muito a forma como analisamos imagens médicas. Esse progresso tem sido especialmente impactante em tarefas como Segmentação de imagens, que envolve identificar partes diferentes de uma imagem. Por exemplo, a IA pode ajudar a segmentar lesões mamárias, classificar diferentes estágios de câncer de pulmão, caracterizar tipos de tecido e detectar aumento do coração.

Na radiologia, a segmentação é crucial para diagnosticar e tratar doenças. No entanto, as técnicas de deep learning precisam de muitos dados de treinamento para funcionarem bem. Essa necessidade por uma quantidade enorme de dados resultou na criação de novos métodos para segmentação de imagens. Uma grande inovação nessa área é a rede neural convolucional totalmente convolucional (FCN), que permite uma segmentação semântica detalhada tratando as imagens como um todo em vez de pedaços menores. Uma versão aprimorada da FCN, o modelo U-Net, captura mais contexto nas imagens com menos amostras de treinamento, tornando-se uma escolha popular para segmentar imagens médicas de várias fontes como raios-X, MRI e tomografias.

Antes das técnicas de deep learning se tornarem comuns, a melhoria de imagem desempenhava um papel vital na análise de imagens médicas. Uma técnica popular de melhoria é a equalização de histograma adaptativa, que funciona dividindo imagens em seções menores para aumentar o contraste local. Uma versão mais avançada chamada equalização de histograma adaptativa com limite de contraste (CLAHE) foi desenvolvida para controlar o contraste e reduzir o ruído. Estudos recentes mostraram que o CLAHE pode beneficiar significativamente tarefas de deep learning, como prever estágios de doenças oculares diabéticas e classificar infecções como COVID-19.

Na nossa pesquisa, introduzimos um novo método chamado ps-KDE para pré-processamento de imagens. Essa técnica visa melhorar os resultados de segmentação em imagens de raios-X do tórax. O ps-KDE oferece três benefícios principais: 1) uma forma simples e adaptável de aumentar os dados de treinamento, 2) eficácia na segmentação precisa de órgãos importantes em raios-X do tórax e 3) ajuda a avaliar algoritmos de segmentação usando heatmaps gerados.

Dados e Métodos

Usamos um banco de dados publicamente disponível composto por 247 radiografias do tórax, coletadas de várias instituições no Japão e nos Estados Unidos. As imagens foram fornecidas por uma organização radiológica e incluíam anotações manuais destacando estruturas anatômicas específicas. Cada imagem está no formato em escala de cinza e possui cinco máscaras binárias ressaltando o coração, pulmão esquerdo, pulmão direito, clavícula esquerda e clavícula direita.

O conjunto de dados incluía uma mistura de indivíduos com e sem nódulos pulmonares. A distribuição de gênero mostrou 68 homens e 86 mulheres entre os pacientes com nódulos, enquanto 51 homens e 42 mulheres não tinham nódulos pulmonares. A idade média dos pacientes com nódulos era de 60 anos.

Nosso estudo seguiu padrões éticos, pois usamos apenas dados disponíveis publicamente, que não exigiam revisão de comitês éticos. Garantimos que não tínhamos informações que identificassem os participantes.

Aumento de Dados

Para treinar modelos de deep learning de forma eficaz, grandes conjuntos de dados são cruciais. Quando grandes conjuntos de dados não estão disponíveis, o aumento de dados se torna essencial para evitar overfitting. No nosso estudo, cinco tipos de aumento foram aplicados tanto nas imagens originais quanto em suas máscaras correspondentes para garantir que as estruturas anatômicas fossem representadas com precisão. Os aumentos incluíam rotações, inversões, zooms e redimensionamentos.

Todas as imagens foram redimensionadas para 256x256 pixels e alteradas para um intervalo de 0 a 1 para ajudar os modelos a treinar mais rapidamente e de forma consistente.

Pré-processamento de Imagem

Equalização de Histograma Adaptativa com Limite de Contraste (CLAHE)

A equalização de histograma é um método comum usado para melhorar o contraste da imagem. Ele redistribui os valores dos pixels para criar uma aparência mais uniforme. No entanto, como a maioria das imagens já usa uma ampla gama de intensidade, a eficácia desse método pode ser limitada. Para superar esse problema, a equalização de histograma adaptativa (AHE) divide uma imagem em seções menores para uma melhoria independente.

O CLAHE melhora o AHE limitando o contraste em certas áreas, o que ajuda a reduzir o ruído enquanto melhora os detalhes locais. Esse método foi aplicado com sucesso em vários estudos, mostrando benefícios significativos.

Substituição de Pixel por Estimativa de Densidade de Kernel (ps-KDE)

Durante nossa análise inicial dos dados, descobrimos que as distribuições dos valores de pixel eram diferentes entre os órgãos. Usamos a estimativa de densidade de kernel (KDE) para criar uma função de densidade de probabilidade (PDF) para os valores de pixel em cada órgão. Ao substituir os valores de pixel originais por suas respectivas densidades, buscamos alcançar um método de pré-processamento mais uniforme e eficaz.

Esse método nos permitiu substituir os valores dos pixels por frequências, dando valores mais significativos aos valores de pixels que ocorriam com mais frequência dentro de cada órgão.

Desenvolvimento do Modelo

Para realizar a segmentação de radiografias do tórax, utilizamos a arquitetura U-Net, que é bem adequada para tarefas de segmentação. A rede segue uma estrutura com um caminho de contração e um caminho expansivo. O caminho de contração ajuda a extrair características, enquanto o caminho expansivo restaura o tamanho original da entrada.

Implementamos o modelo usando um pacote Python que incorpora o design U-Net com uma base ResNet34, conhecida por suas capacidades em deep learning. A combinação desses dois modelos visa melhorar o desempenho da segmentação.

Para treinar o modelo de forma eficaz, usamos várias funções de perda que ajudam o modelo a aprender com suas previsões. Essas funções medem quão bem a saída do modelo corresponde aos dados reais, guiando-o a melhorar seu desempenho ao longo do tempo.

Avaliação e Interpretabilidade do Modelo

Para avaliar o desempenho do nosso modelo, usamos métricas como interseção sobre união (IoU) e o coeficiente de Dice, que nos ajudam a medir quão de perto os segmentos previstos se alinham com os dados reais.

Após o treinamento, examinamos o desempenho do modelo usando as imagens originais, imagens processadas com CLAHE e imagens processadas com nosso novo método ps-KDE. Essa análise nos ajudou a comparar a eficácia das diferentes técnicas de pré-processamento e entender seu impacto nas tarefas de segmentação.

Os resultados indicaram que modelos treinados com CLAHE apresentaram melhor desempenho geral em comparação com os que usaram ps-KDE. No entanto, o ps-KDE mostrou força em áreas específicas, destacando o potencial para abordagens combinadas em estudos futuros.

Os heatmaps gerados ofereceram insights sobre a confiança do modelo e áreas que precisavam de mais exame. Notamos que os modelos exibiram padrões consistentes, indicando segmentação confiável, especialmente em torno de estruturas maiores como os pulmões e o coração.

Direções Futuras

Embora nossas descobertas sejam promissoras, algumas limitações foram notadas. Nosso conjunto de dados era relativamente pequeno para aplicações de deep learning, e só treinamos por um número limitado de épocas devido a restrições de recursos. Portanto, aumentar o tamanho do conjunto de dados e o número de épocas de treinamento pode resultar em melhores resultados no futuro.

Além disso, nosso estudo usou imagens PNG, enquanto práticas clínicas normalmente dependem do formato DICOM. Para aumentar a aplicabilidade de nossas descobertas em configurações do mundo real, é necessário fazer mais adaptações em nossos modelos para acomodar dados DICOM. Abordar essas lacunas ajudará a unir pesquisa e aplicação em fluxos de trabalho clínicos.

Em conclusão, nosso trabalho enfatiza o potencial da abordagem ps-KDE para melhorar a precisão da segmentação em radiografias do tórax. Embora tenhamos feito progressos significativos na melhoria das capacidades de segmentação, mais exploração e validação são necessárias para perceber totalmente os benefícios dessa nova técnica.

Fonte original

Título: Enhancing Semantic Segmentation in Chest X-Ray Images through Image Preprocessing: ps-KDE for Pixel-wise Substitution by Kernel Density Estimation

Resumo: BackgroundDeep-learning-based semantic segmentation algorithms, in combination with image preprocessing techniques, can reduce the need for human annotation and advance disease classification. Among established preprocessing techniques, CLAHE has demonstrated efficacy in enhancing the segmentations algorithms across various modalities. MethodThis study proposes a novel preprocessing technique, ps-KDE, to investigate its impact on deep learning algorithms to segment major organs in posterior-anterior chest X-rays. Ps-KDE augments image contrast by substituting pixel values based on their normalized frequency across all images. Our approach employs a U-Net architecture with ResNet34 (pre-trained on ImageNet) serving as the decoder. Five separate models are trained to segment the heart, left lung, right lung, left clavicle, and right clavicle. ResultsThe model trained to segment the left lung using ps-KDE achieved a Dice score of 0.780 (SD=0.13), while that trained on CLAHE achieved a Dice score of 0.717 (SD=0.19), p

Autores: Zifan Gu, Y. Wang, Y. Guo, Z. Wang, L. Yu, Y. Yan

Última atualização: 2024-02-17 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2024.02.15.24302871

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.02.15.24302871.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes