Simple Science

Ciência de ponta explicada de forma simples

# Biologia Quantitativa# Visão computacional e reconhecimento de padrões# Métodos Quantitativos

MUSTANG: Avanço da Análise WSI na Medicina

Um método novo pra analisar Imagens de Lâmina Inteira pra melhorar a classificação de doenças.

― 7 min ler


MUSTANG TransformaMUSTANG TransformaAnálise WSIdiagnóstico de imagens médicas.Abordagem movida por IA melhora o
Índice

Imagens de Lâmina Inteira (WSIs) são imagens digitais grandes usadas em ambientes médicos, especialmente para examinar amostras de tecido. Elas fornecem visões detalhadas necessárias para diagnosticar doenças, principalmente câncer. Mas essas imagens têm seus próprios desafios. Podem ser incrivelmente grandes, frequentemente contendo bilhões de pixels, o que torna a análise difícil. Além disso, podem ter defeitos ou artefatos que complicam o processo de interpretação.

Apesar desses obstáculos, as WSIs são essenciais, pois são consideradas o padrão ouro para diagnosticar condições e decidir opções de tratamento. Elas contêm informações valiosas sobre a saúde do paciente, mas a maioria dos conjuntos de dados clínicos vinculados a elas costuma carecer de anotações detalhadas. Isso atrapalha a capacidade dos programas de computador de interpretar efetivamente as informações nessas imagens.

O Problema com as WSIs

Analisar WSIs requer um conjunto de habilidades especializadas, geralmente possuídas por profissionais médicos qualificados. O processo manual de examinar essas lâminas pode ser demorado e sujeito a erro humano. A ascensão da análise automatizada por meio de inteligência artificial (IA) e aprendizado de máquina oferece uma solução potencial. No entanto, um desafio significativo é que muitos métodos de IA existentes têm dificuldade em lidar com o tamanho e a complexidade das WSIs.

Para resolver esses problemas, os pesquisadores têm trabalhado em técnicas que permitem que os computadores aprendam com essas imagens sem exigir rótulos detalhados para cada parte. Esse tipo de aprendizado é conhecido como aprendizado com supervisão fraca. Mesmo com supervisão fraca, muitos modelos lutam para reconhecer recursos importantes quando eles estão localizados longe uns dos outros na imagem.

Solução Proposta

Uma nova abordagem combina mecanismos de autoatenção com representações em grafo para analisar melhor as WSIs. Esse método, chamado MUSTANG, tem como objetivo classificar imagens com base em informações a nível de paciente, sem precisar de anotações para cada lâmina.

O MUSTANG funciona ao primeiro quebrar toda a imagem em pequenos pedaços. Esses pedaços, que podem representar pequenas áreas do tecido, são então incorporados como vetores que descrevem suas características. Em seguida, estabelece conexões entre esses pedaços com base em suas semelhanças usando um método especial conhecido como Grafo de Vizinhos Mais Próximos. Esse grafo é esparso, o que significa que inclui apenas as conexões mais relevantes, tornando os cálculos mais eficientes.

Ao empregar autoatenção, o modelo pode se concentrar nos pedaços mais importantes, mesmo que estejam localizados longe uns dos outros na imagem. Isso ajuda a capturar padrões pequenos e grandes necessários para uma classificação precisa. O design do MUSTANG também permite que ele trabalhe com diferentes conjuntos de dados sem exigir um pré-processamento extenso.

Aplicação à Artrite reumatoide

Uma das aplicações práticas do pipeline MUSTANG é analisar amostras de tecido de pacientes com Artrite Reumatoide. Em um ensaio clínico, pesquisadores usaram WSIs de vários pacientes para avaliar amostras de tecido retiradas de articulações. Os pacientes foram então classificados em diferentes grupos com base em seu subtipo de doença.

Cada amostra de tecido foi corada usando corantes específicos para ajudar a visualizar diferentes tipos de células e estruturas. Por exemplo, a coloração Hematoxilina e Eosina (H&E) fornece uma visão geral da estrutura do tecido, enquanto a imuno-histoquímica (IHC) permite identificar células imunes específicas. Essa abordagem de multi-coloração oferece uma visão abrangente dos processos de doença subjacentes.

Patologistas avaliaram essas amostras coradas e agruparam pacientes em subtipos com base em suas características. No entanto, como cada paciente pode ter várias lâminas, isso adicionou complexidade à análise. O MUSTANG enfrentou esse desafio criando um modelo capaz de aprender a partir das informações coletivas dessas WSIs, em vez de depender de lâminas individuais.

Etapas do Pipeline MUSTANG

O pipeline MUSTANG consiste em várias etapas:

  1. Segmentação: A primeira etapa envolve identificar as áreas relevantes de tecido dentro das WSIs. Isso foi feito usando um modelo de aprendizado profundo chamado UNet, que segmenta o tecido dos elementos de fundo.

  2. Patching: Assim que o tecido é identificado, a área relevante é dividida em pedaços menores. O tamanho desses pedaços pode variar com base na preferência do usuário, permitindo flexibilidade na análise.

  3. Extração de Recursos: Cada pedaço é então processado através de um extrator de recursos baseado em um modelo de aprendizado profundo, que transforma as imagens em vetores numéricos que resumem suas características importantes.

  4. Criando o Grafo: Os vetores de características são usados para construir o Grafo de Vizinhos Mais Próximos, onde cada pedaço está conectado aos seus pedaços mais próximos com base em suas características. Essa estrutura de grafo é crucial para permitir uma análise eficiente.

  5. Classificação do Grafo: A representação em grafo é processada através de camadas de uma rede neural especial projetada para grafos, conhecida como Redes de Atenção em Grafos. Isso permite que o modelo pese a importância de diferentes pedaços antes de fazer uma classificação final.

  6. Previsão: Finalmente, o modelo prevê o subtipo da doença para o paciente com base nas informações coletivas de suas lâminas.

Resultados e Desempenho

Os resultados da abordagem MUSTANG mostraram que ela supera modelos existentes em termos de precisão quando aplicada ao conjunto de dados de Artrite Reumatoide. Provou ser eficaz em identificar padrões relevantes e relações dentro das imagens multi-coloreadas. O modelo teve um desempenho comparável em termos de tempo de processamento, apesar de suas operações mais complexas.

Ao avaliar o quão bem o modelo funcionou, os pesquisadores descobriram que ele era particularmente bom em detectar tanto positivos verdadeiros quanto falsos. Essa sensibilidade é essencial quando aplicada em ambientes clínicos, onde um diagnóstico preciso pode impactar significativamente os resultados dos pacientes.

Além disso, ao ser testado contra WSIs de coloração única, o MUSTANG ainda entregou resultados impressionantes, mostrando que pôde integrar informações de diferentes colorações com sucesso. Isso é especialmente valioso, já que conjuntos de dados clínicos muitas vezes não contêm indicações claras de quais colorações fornecem as informações mais críticas.

Limitações

Embora o pipeline MUSTANG introduza um método promissor para analisar WSIs, ele enfrenta algumas limitações. Há uma necessidade de conjuntos de dados públicos que possam ser usados para comparação e validação de resultados. Infelizmente, conjuntos de dados com WSIs multi-coloridas rotuladas a nível de paciente estão atualmente em falta.

Outro aspecto importante é a ausência de ferramentas de visualização para ilustrar as áreas de foco do modelo. A visualização melhoraria muito a credibilidade e a usabilidade do modelo em um ambiente clínico real, permitindo que patologistas entendam como o modelo chegou às suas conclusões.

Conclusão

O MUSTANG é uma abordagem inovadora para analisar imagens médicas complexas, especialmente aquelas relacionadas à histopatologia. Ao combinar efetivamente mecanismos de autoatenção com representações baseadas em grafo, oferece uma solução robusta para classificar WSIs sem precisar de anotações extensas. À medida que mais conjuntos de dados clínicos se tornam disponíveis, essa tecnologia tem o potencial de melhorar a precisão diagnóstica e agilizar o fluxo de trabalho em histopatologia, levando, em última análise, a um melhor cuidado ao paciente.

A modularidade e flexibilidade do MUSTANG o tornam adequado para uma variedade de aplicações clínicas, abrindo caminho para um uso extensivo na área médica. Essa pesquisa destaca a importância da IA e do aprendizado de máquina em transformar como os profissionais médicos analisam e interpretam informações de saúde importantes.

Fonte original

Título: MUSTANG: Multi-Stain Self-Attention Graph Multiple Instance Learning Pipeline for Histopathology Whole Slide Images

Resumo: Whole Slide Images (WSIs) present a challenging computer vision task due to their gigapixel size and presence of numerous artefacts. Yet they are a valuable resource for patient diagnosis and stratification, often representing the gold standard for diagnostic tasks. Real-world clinical datasets tend to come as sets of heterogeneous WSIs with labels present at the patient-level, with poor to no annotations. Weakly supervised attention-based multiple instance learning approaches have been developed in recent years to address these challenges, but can fail to resolve both long and short-range dependencies. Here we propose an end-to-end multi-stain self-attention graph (MUSTANG) multiple instance learning pipeline, which is designed to solve a weakly-supervised gigapixel multi-image classification task, where the label is assigned at the patient-level, but no slide-level labels or region annotations are available. The pipeline uses a self-attention based approach by restricting the operations to a highly sparse k-Nearest Neighbour Graph of embedded WSI patches based on the Euclidean distance. We show this approach achieves a state-of-the-art F1-score/AUC of 0.89/0.92, outperforming the widely used CLAM model. Our approach is highly modular and can easily be modified to suit different clinical datasets, as it only requires a patient-level label without annotations and accepts WSI sets of different sizes, as the graphs can be of varying sizes and structures. The source code can be found at https://github.com/AmayaGS/MUSTANG.

Autores: Amaya Gallagher-Syed, Luca Rossi, Felice Rivellese, Costantino Pitzalis, Myles Lewis, Michael Barnes, Gregory Slabaugh

Última atualização: 2023-10-04 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2309.10650

Fonte PDF: https://arxiv.org/pdf/2309.10650

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes