Avanços na Detecção de Artefatos para Patologia Computacional
Nova abordagem melhora a detecção de artefatos em diagnósticos de câncer, aumentando a precisão e eficiência.
― 8 min ler
Índice
- Entendendo a Patologia Computacional
- Como o CPATH Funciona
- Abordagem Proposta para Detecção de Artefatos
- Materiais de Dados
- Dados de Treinamento e Desenvolvimento
- Dados de Validação Externa
- Metodologia
- Resultados Experimentais
- Desempenho de Validação
- Testes de Generalização e Robustez
- Avaliação Qualitativa
- Conclusão e Direções Futuras
- Fonte original
O câncer surge em órgãos quando mudanças genéticas em células normais fazem com que elas se transformem em células tumorais. Essa mudança pode acontecer por exposição regular a substâncias nocivas ou outros fatores que podem causar câncer. Diagnosticar o câncer com precisão e rapidez é essencial para um tratamento eficaz e para reduzir o número de pessoas que morrem da doença. O câncer é uma das doenças mais letais do mundo, com uma estimativa de 29 milhões de mortes previstas até 2040.
A histopatologia é comumente usada para identificar células cancerígenas. Esse processo envolve examinar amostras de tecido sob um microscópio em lâminas de vidro especiais. No entanto, essa inspeção manual pode ser lenta, subjetiva e variar entre diferentes observadores. Além disso, com o número crescente de casos de câncer e a falta de patologistas treinados, há desafios significativos no diagnóstico e tratamento em tempo hábil, o que pode prejudicar a tomada de decisões clínicas. Para melhorar a velocidade e a precisão, é preciso modernizar o processo de diagnóstico por meio de meios digitais.
A patologia digital (DP) pode ajudar a enfrentar esses desafios, permitindo diagnósticos mais rápidos e facilitando o compartilhamento de opiniões de diferentes especialistas. Nos últimos anos, a pesquisa e o desenvolvimento em patologia digital cresceram bastante, permitindo a análise de lâminas histológicas digitalizadas, frequentemente chamadas de Imagens de Lâmina Inteira (WSIs).
Patologia Computacional
Entendendo aOs sistemas de patologia computacional (CPATH) podem extrair informações valiosas de imagens de lâmina inteira usando ferramentas automatizadas alimentadas por inteligência artificial (IA) e processamento de imagem. Ao integrar CPATH com patologia digital, podemos melhorar os métodos diagnósticos e economizar tempo para os patologistas. No entanto, surgem problemas durante a preparação das lâminas, que podem criar Artefatos - áreas na imagem que não fornecem dados úteis. Os patologistas normalmente ignoram esses artefatos durante as inspeções manuais, mas eles podem interferir no desempenho dos sistemas automatizados de CPATH.
Para combater esse problema, é crucial equipar os sistemas de CPATH com um processo de detecção de artefatos. Ao identificar e remover artefatos, podemos garantir que apenas o tecido relevante seja analisado, levando a previsões mais confiáveis e controle de qualidade nos procedimentos laboratoriais.
Como o CPATH Funciona
As imagens de lâmina inteira são divididas em seções menores, ou patches, para facilitar o processamento para modelos de Aprendizado Profundo. Esses patches são então analisados usando uma mistura de modelos especialistas ou modelos multiclasses, que usam estruturas avançadas de aprendizado profundo para várias tarefas de classificação. Apenas patches contendo tecido relevante são usados para análise posterior. No final, esse processo gera diferentes resultados, como um mapa mostrando onde os artefatos estão localizados, um relatório sobre a qualidade da amostra de tecido e uma WSI refinada que está livre de artefatos.
Os avanços recentes com técnicas de aprendizado profundo ganharam atenção no campo do CPATH devido à sua capacidade de identificar padrões complexos em dados histológicos. Redes neurais convolucionais profundas (DCNNs) e transformadores de visão (ViTs) são estruturas populares usadas para diferenciar padrões de tecido para vários tipos de câncer.
Embora algumas pesquisas mostrem que DCNNs funcionam bem com conjuntos de dados menores, outros argumentam que ViTs são melhores para estrutura geral e robustez. No entanto, ambos os tipos de modelos podem enfrentar desafios, como o sobreajuste, que significa que o modelo pode ter um desempenho ruim em novos dados, resultando em previsões incorretas. Para resolver isso, os pesquisadores podem usar conjuntos de modelos de aprendizado profundo, onde múltiplos modelos trabalham juntos para melhorar a precisão.
Um modelo de Mistura de Especialistas (MoE) pode ser particularmente útil nesse contexto. Ele combina modelos especializados para sub-tarefas específicas, levando a um melhor desempenho geral. Em nosso trabalho, focamos em construir uma abordagem eficaz de detecção de artefatos usando MoEs, equilibrando desempenho e complexidade.
Abordagem Proposta para Detecção de Artefatos
Neste estudo, introduzimos uma abordagem de aprendizado profundo baseada em MoE para detectar vários tipos de artefatos em imagens de lâmina inteira histológica. Criamos vários modelos por meio de MoE, onde cada modelo se especializa em detectar um tipo específico de artefato, como áreas borradas, tecido dobrado, bolhas de ar e outras características irrelevantes do ponto de vista diagnóstico.
Os pipelines de aprendizado profundo que desenvolvemos podem gerar quatro resultados chave:
- Um mapa de segmentação de artefatos.
- Um relatório sobre artefatos para controle de qualidade, categorizado em seis classes (cinco tipos de artefatos e uma categoria sem artefatos).
- Uma máscara livre de artefatos que destaca áreas de potencial relevância diagnóstica.
- Uma WSI refinada para análise computacional adicional.
Materiais de Dados
Dados de Treinamento e Desenvolvimento
Para nossos experimentos, usamos amostras de tecido de pacientes com câncer de bexiga. As lâminas foram coradas para destacar características específicas e digitalizadas para criar imagens de alta resolução. Um indivíduo treinado anotou essas imagens para identificar a presença de vários artefatos e marcou áreas livres de artefatos. Esse conjunto de dados serve como base para treinar e validar nossos modelos de aprendizado profundo.
Dados de Validação Externa
Para avaliar quão bem nossos modelos se generalizam para diferentes tipos de dados, utilizamos vários conjuntos de dados externos. Esses conjuntos de dados incluíram imagens de câncer de bexiga de alto risco e amostras de pacientes com câncer de mama e pele. Os conjuntos de dados externos foram coletados de diferentes hospitais e representam uma variedade de tipos de tecido e procedimentos de coloração.
Metodologia
Nosso processo de detecção de artefatos segue dois passos principais:
- Treinamos modelos para classificar patches de imagem com base na presença de artefatos.
- Usamos esses modelos treinados para criar um MoE para fazer previsões e realizar pós-processamento.
O primeiro passo envolve dividir imagens de lâmina inteira em patches e aplicar várias arquiteturas de aprendizado profundo para treinamento. Utilizamos tanto DCNNs quanto ViTs como extratores de características. No segundo passo, integramos as previsões baseadas em patches usando um mecanismo de controle para combinar a saída dos modelos treinados.
Para otimizar a sensibilidade da nossa detecção de artefatos, aplicamos um limite probabilístico, permitindo aumentar a precisão na identificação de regiões livres de artefatos. Esse processo em duas etapas culmina na geração de previsões sobre a presença de artefatos na WSI.
Resultados Experimentais
Para avaliar o desempenho de nossos pipelines de aprendizado profundo, realizamos vários testes nos conjuntos de dados de treinamento, validação e externos.
Desempenho de Validação
Nossos achados mostram que os modelos baseados em MoE superaram os modelos multiclasses tradicionais na detecção de patches livres de artefatos. Os pipelines de MoE minimizaram efetivamente os falsos negativos enquanto mantinham alta sensibilidade na classificação de tecido relevante. Embora ambos os modelos mostrem vantagens, os modelos MoE se mostraram superiores na detecção de artefatos, embora com maiores demandas computacionais.
Testes de Generalização e Robustez
Para testar quão bem nossos modelos se saem em dados não vistos, avaliamos eles em conjuntos de dados externos. Mesmo que os modelos MoE tenham enfrentado uma redução na sensibilidade ao lidar com esses diferentes tipos de tecidos, eles ainda conseguiram manter um alto nível de especificidade. Isso significa que eles identificaram corretamente a maioria dos artefatos reais presentes nas imagens externas, indicando boa capacidade de generalização.
Avaliação Qualitativa
Especialistas avaliaram os mapas de segmentação produzidos por nossos modelos, analisando como os artefatos foram detectados e como as regiões livres de artefatos foram preservadas. Embora o feedback geral tenha sido positivo, casos de classificação incorreta demonstraram que ainda há áreas para melhorar. Essa avaliação qualitativa reforça a necessidade de revisão por especialistas, além de medidas quantitativas, para avaliar com precisão o desempenho do modelo.
Conclusão e Direções Futuras
Em resumo, desenvolvemos pipelines de aprendizado profundo inovadores capazes de refinar imagens de lâmina inteira por meio de um abrangente processo de detecção de artefatos. A abordagem MoE captura as nuances de várias morfologias de artefatos e combina efetivamente previsões de diferentes modelos. Por meio de testes rigorosos, estabelecemos que o modelo MoE utilizando DCNNs supera modelos multiclasses em desempenho, apesar de exigir mais recursos computacionais.
O trabalho apresentado aqui estabelece as bases para melhorar os sistemas de patologia computacional, equipando-os com a capacidade de filtrar ruídos e melhorar os processos diagnósticos. No futuro, pretendemos ampliar nossos conjuntos de dados de treinamento incorporando amostras de múltiplos grupos e implementando estratégias adaptativas para otimizar o desempenho do modelo com base em tipos específicos de câncer. Assim, esperamos refinar ainda mais a eficácia dos pipelines de processamento de artefatos e sua aplicabilidade em ambientes clínicos.
Título: Equipping Computational Pathology Systems with Artifact Processing Pipelines: A Showcase for Computation and Performance Trade-offs
Resumo: BackgroundHistopathology is a gold standard for cancer diagnosis. It involves extracting tissue specimens from suspicious areas to prepare a glass slide for a microscopic examination. However, histological tissue processing procedures result in the introduction of artifacts, which are ultimately transferred to the digitized version of glass slides, known as whole slide images (WSIs). Artifacts are diagnostically irrelevant areas and may result in wrong predictions from deep learning (DL) algorithms. Therefore, detecting and excluding artifacts in the computational pathology (CPATH) system is essential for reliable automated diagnosis. MethodsIn this paper, we propose a mixture of experts (MoE) scheme for detecting five notable artifacts, including damaged tissue, blur, folded tissue, air bubbles, and histologically irrelevant blood from WSIs. First, we train independent binary DL models as experts to capture particular artifact morphology. Then, we ensemble their predictions using a fusion mechanism. We apply probabilistic thresholding over the final probability distribution to improve the sensitivity of the MoE. We developed four DL pipelines to evaluate computational and performance trade-offs. These include two MoEs and two multiclass models of state-of-the-art deep convolutional neural networks (DCNNs) and vision transformers (ViTs). These DL pipelines are quantitatively and qualitatively evaluated on external and out-of-distribution (OoD) data to assess generalizability and robustness for artifact detection application. ResultsWe extensively evaluated the proposed MoE and multiclass models. DCNNs-based MoE and ViTs-based MoE schemes outperformed simpler multiclass models and were tested on datasets from different hospitals and cancer types, where MoE using (MobiletNet) DCNNs yielded the best results. The proposed MoE yields 86.15 % F1 and 97.93% sensitivity scores on unseen data, retaining less computational cost for inference than MoE using ViTs. This best performance of MoEs comes with relatively higher computational trade-offs than multiclass models. Furthermore, we apply post-processing to create an artifact segmentation mask, a potential artifact-free RoI map, a quality report, and an artifact-refined WSI for further computational analysis. During the qualitative evaluation, pathologists assessed the predictive performance of MoEs over OoD WSIs. They rated artifact detection and artifact-free area preservation, where the highest agreement translated to the Cohen kappa of 0.82, indicating substantial agreement for the overall diagnostic usability of the DCNN-based MoE scheme. ConclusionsThe proposed artifact detection pipeline will not only ensure reliable CPATH predictions but may also provide quality control. In this work, the best-performing pipeline for artifact detection is MoE with DCNNs. Our detailed experiments show that there is always a trade-off between performance and computational complexity, and no straightforward DL solution equally suits all types of data and applications. The code and dataset for training and development can be found online at Github and Zenodo, respectively.
Autores: Neel Kanwal, F. Khoraminia, U. Kiraz, A. Mosquera-Zamudio, C. Monteagudo, E. A. M. Janssen, T. C. M. Zuiverloon, C. Rong, K. Engan
Última atualização: 2024-03-13 00:00:00
Idioma: English
Fonte URL: https://www.medrxiv.org/content/10.1101/2024.03.11.24304119
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.03.11.24304119.full.pdf
Licença: https://creativecommons.org/licenses/by-nc/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.