Simple Science

Ciência de ponta explicada de forma simples

# Engenharia Eletrotécnica e Ciência dos Sistemas# Processamento de Imagem e Vídeo# Visão computacional e reconhecimento de padrões

Avanços na Segmentação de Órgãos com Aprendizado Profundo

Um novo modelo melhora a segmentação de órgãos em imagens de TC usando aprendizado profundo.

― 6 min ler


Aprendizado Profundo paraAprendizado Profundo paraSegmentação de Órgãos emTCórgãos em tomografias.Um modelo melhora os contornos dos
Índice

Segmentar órgãos em risco em imagens médicas é uma tarefa importante, mas complicada. Isso é especialmente verdade para tomografias, que são comuns no planejamento de radioterapia. Identificar esses órgãos corretamente pode ajudar a evitar exposição desnecessária à radiação. Métodos tradicionais de Segmentação podem ser lentos e variar de médico pra médico, o que pode levar a diferenças no tratamento.

Nos últimos anos, a tecnologia de deep learning fez avanços na automação desse processo. No entanto, ainda existem desafios devido a variações nas formas dos órgãos, baixa visibilidade de tecidos moles e inconsistências nos dados usados para treinar os algoritmos. Enquanto modelos de deep learning geralmente se saem bem com órgãos maiores e mais nítidos, órgãos menores com formas variáveis são mais difíceis de segmentar com precisão.

O Desafio

Um problema é que diferentes médicos podem ter opiniões diferentes sobre onde um órgão termina e outros tecidos começam, o que traz incerteza para os dados de treinamento. Funções de perda comuns usadas para treinar modelos focam principalmente na forma dos órgãos e em quão bem as formas preditas e reais se sobrepõem. Muitas vezes, elas não levam em conta o contraste dos tecidos, que é crucial para contornar limites, especialmente em situações de baixo contraste.

Pra enfrentar esses desafios, um novo modelo U-Net com múltiplos decodificadores foi desenvolvido. Esse modelo utiliza as diferenças nos resultados da segmentação de dois decodificadores para avaliar a incerteza. Essa incerteza é então usada para criar um mecanismo de atenção que ajuda a refinar o processo de segmentação. Além disso, um método que combina informações da intensidade da tomografia com outros cálculos de perda é introduzido pra ajudar o modelo a entender melhor o contraste dos tecidos.

Visão Geral do Método

O modelo proposto consiste em uma arquitetura U-net equipada com dois decodificadores. O decodificador principal processa a imagem, enquanto o decodificador auxiliar ajuda a avaliar a incerteza através de ruído aleatório. A combinação das saídas de ambos os decodificadores gera dois tipos de máscaras: uma que mostra onde eles concordam e outra que mostra onde eles discordam. Essas informações são usadas para criar um mapa de múltipla confiança que destaca as áreas mais confiáveis para segmentação.

O mecanismo de atenção é então aplicado às características identificadas como importantes para uma segmentação precisa. Usando essa atenção focada, o modelo pode melhorar seu desempenho ao identificar órgãos em imagens de tomografia. Além disso, o método leva em conta as diferentes intensidades de luz encontradas nos tecidos para ajudar na segmentação.

Configuração Experimental

Pra testar o novo modelo, dois conjuntos de dados disponíveis publicamente foram usados. O primeiro conjunto, SegThor, é composto por imagens coletadas de pacientes com linfoma de Hodgkin. O segundo conjunto, LCTSC, inclui várias imagens de tomografia com anotações de órgãos. O modelo foi treinado e testado nesses conjuntos de dados usando várias métricas pra avaliar seu desempenho.

O treinamento envolveu dividir o conjunto de dados SegThor em conjuntos de treinamento e teste separados, já que apenas um número limitado de imagens de treinamento estava disponível. Para o conjunto de dados LCTSC, uma validação cruzada em cinco vezes foi empregada pra combater o sobreajuste. Ambos os conjuntos passaram pelos mesmos passos de pré-processamento, incluindo extração de fatias 2D de volumes 3D e aprimoramento de contraste pra melhorar a visibilidade.

Resultados

Conjunto de Dados SegThor

O desempenho do modelo foi comparado com outras variantes do U-net. Os resultados mostraram que o método que incorpora atenção guiada por incerteza teve um desempenho excepcional em várias métricas. Por exemplo, o método obteve a maior precisão para o coração, enquanto outros modelos se saíram melhor para diferentes órgãos como o esôfago e aorta.

Conjunto de Dados LCTSC

Resultados semelhantes foram notados no conjunto de dados LCTSC, onde o modelo proposto mostrou um desempenho forte em vários órgãos. Ele se destacou particularmente em áreas como esôfago, coluna vertebral e coração. Outros modelos populares, como Unet++ e Attention U-net, também se saíram bem, mas geralmente, o novo modelo se destacou.

Estudo de Ablation

Um estudo de ablação foi realizado pra avaliar a eficácia dos diferentes componentes do modelo. Várias combinações de funções de perda e do mecanismo de atenção foram testadas. Os resultados indicaram que a inclusão do módulo de atenção guiada por incerteza levou consistentemente a uma maior precisão de segmentação em vários órgãos e combinações de perda.

Discussão

Os achados sugerem que usar diferentes saídas de rede pode ajudar a estimar Incertezas de forma eficaz. Essa incerteza pode ser utilizada como uma forma de atenção que ajuda a refinar os resultados da segmentação. O design do modelo é relativamente simples, focando apenas na arquitetura 2D do U-net treinada exclusivamente em visões axiais.

Introduzir uma nova perda de regularização baseada na intensidade de tomografia ajuda ainda mais o modelo a aprender com mais precisão sobre as texturas e formas dos órgãos. Os resultados confirmam que entender o contraste dos tecidos é vital pra segmentar órgãos, especialmente aqueles que são difíceis de identificar.

Direções Futuras

A pesquisa abre possibilidades para melhorias futuras. Há potencial pra aumentar a precisão do regularizador, especialmente nas bordas de órgãos que estão próximos um do outro. A exploração contínua nessa área pode levar a melhores resultados no planejamento de radioterapia.

Considerações Éticas

Esse estudo utilizou conjuntos de dados existentes disponíveis para acesso público. Como envolveu análise retrospectiva de dados, não houve necessidade de aprovação ética. Toda a pesquisa está em conformidade com os padrões éticos.

Conclusão

A abordagem discutida oferece uma solução promissora pra automação da segmentação de órgãos em imagens de tomografia. Ao empregar um U-net com múltiplos decodificadores junto com a atenção guiada por incerteza, o modelo aborda efetivamente os desafios frequentemente presentes nessa área. A incorporação de informações de intensidade de tomografia fortalece ainda mais a capacidade do modelo de distinguir com precisão entre diferentes tipos de tecidos.

No geral, os resultados destacam o potencial do modelo pra melhorar a precisão da segmentação de órgãos, contribuindo em última análise pra melhores planejamentos de tratamento na radioterapia. À medida que a pesquisa avança nesse campo, os avanços nas técnicas de deep learning podem aprimorar ainda mais os métodos de segmentação automatizada em imagens médicas.

Fonte original

Título: Uncertainty Driven Bottleneck Attention U-net for Organ at Risk Segmentation

Resumo: Organ at risk (OAR) segmentation in computed tomography (CT) imagery is a difficult task for automated segmentation methods and can be crucial for downstream radiation treatment planning. U-net has become a de-facto standard for medical image segmentation and is frequently used as a common baseline in medical image segmentation tasks. In this paper, we propose a multiple decoder U-net architecture and use the segmentation disagreement between the decoders as attention to the bottleneck of the network for segmentation refinement. While feature correlation is considered as attention in most cases, in our case it is the uncertainty from the network used as attention. For accurate segmentation, we also proposed a CT intensity integrated regularization loss. Proposed regularisation helps model understand the intensity distribution of low contrast tissues. We tested our model on two publicly available OAR challenge datasets. We also conducted the ablation on each datasets with the proposed attention module and regularization loss. Experimental results demonstrate a clear accuracy improvement on both datasets.

Autores: Abdullah Nazib, Riad Hassan, Zahidul Islam, Clinton Fookes

Última atualização: 2024-02-26 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2303.10796

Fonte PDF: https://arxiv.org/pdf/2303.10796

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes