Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Informatica sanitaria

Avançando a Saúde Ocular com Aprendizado de Máquina

Esse estudo desenvolve um modelo pra identificar doenças da retina usando dados de imagem do Brasil.

― 7 min ler


Modelo de IA paraModelo de IA paraDetecção de DoençasOcularesIA.doenças da retina com ferramentas deDesenvolvendo um modelo pra identificar
Índice

A imagem médica tá ficando cada vez mais avançada, gerando um monte de dados que os médicos precisam entender. Infelizmente, não tem profissional treinado suficiente pra interpretar essas imagens, o que pode atrasar o diagnóstico e tratamento dos pacientes. Aprendizado de Máquina e inteligência artificial são ferramentas que podem ajudar a melhorar o atendimento médico, tornando mais rápido e barato, especialmente em áreas como saúde ocular.

Na área de cuidados com os olhos, vários tipos de imagens são coletados pra ajudar a identificar e monitorar doenças. Essas imagens incluem fotos do fundo do olho, tomografia de coerência óptica e mais. Embora essas ferramentas de imagem estejam amplamente disponíveis, ainda falta especialista pra interpretar as fotos e direcionar os pacientes pro tratamento certo. Esse problema tá ficando mais urgente à medida que mais pessoas são diagnosticadas com doenças oculares sérias, e a imagem de retina é uma ferramenta chave pra avaliação.

Países com mais recursos tendem a ter mais profissionais treinados e tecnologia pra gerenciar grandes quantidades de dados de imagem. No entanto, países de baixa e média renda geralmente não têm essa expertise, criando uma lacuna nos cuidados oculares. Na verdade, a maioria dos oftalmologistas trabalha em apenas alguns países, deixando muitas áreas com acesso limitado a especialistas.

Os dados disponíveis pra treinar modelos de aprendizado de máquina vêm, na sua maioria, de países mais ricos. Isso significa que os dados podem não representar com precisão populações diversas ou incluir uma variedade de doenças oculares, o que pode levar a problemas na aplicação desses modelos em diferentes contextos.

A imagem do fundo do olho é uma forma econômica de diagnosticar doenças oculares. Integrar IA nesse processo mostrou potencial, com muitos projetos existentes focando em identificar algumas condições específicas. Neste estudo, estamos trabalhando pra desenvolver um modelo que consiga identificar automaticamente uma variedade de doenças de retina a partir de imagens coletadas no Brasil, uma área que ainda não foi muito estudada.

Métodos

Usamos um conjunto de dados chamado Conjunto de Dados Oftalmológicos Multitarefa Brasileiro, que inclui mais de 16.000 imagens de milhares de pacientes. Esse conjunto foi coletado de três centros de cuidados oculares diferentes no Brasil. Pra cada paciente, foi incluída apenas uma imagem focando na mácula. As imagens foram tiradas com câmeras específicas por pessoal treinado.

Pra preparar o conjunto de dados, removemos qualquer informação pessoal e sensível das imagens. Além disso, excluímos imagens que não focavam nas partes relevantes do olho. Só mantivemos imagens que mostravam claramente certos recursos da retina. Isso garante que nosso conjunto de dados seja consistente e útil pra treinar nosso modelo.

Junto com as imagens, também coletamos algumas informações básicas sobre os pacientes, como idade e histórico médico. Porém, decidimos não usar essas informações extras pra treinar nosso modelo. Queríamos ver como o modelo se sairia apenas com as imagens.

O conjunto de dados contém imagens de diferentes qualidades. Cada imagem é avaliada como satisfatória ou insatisfatória com base em foco, clareza e outros fatores. Apesar de ter algumas imagens rotuladas como insatisfatórias, as incluímos no nosso treinamento pra tornar o modelo adaptável a cenários do mundo real, onde a qualidade da imagem pode variar.

Cada imagem foi rotulada por um oftalmologista que identificou várias condições presentes na imagem. Esse processo de rotulagem foi cuidadosamente estabelecido pra garantir precisão. Resumimos quantas vezes cada condição apareceu no conjunto de dados.

Desenvolvimento do Modelo

Padronizamos as imagens pra ter um tamanho consistente pra processamento. Durante o treinamento, usamos várias técnicas pra aumentar artificialmente a variedade de imagens, como rotacioná-las ou virá-las. Isso ajuda o modelo a aprender melhor ao ver diferentes perspectivas da mesma imagem.

O conjunto de dados tinha um grande desequilíbrio entre o número de imagens mostrando olhos saudáveis e aqueles mostrando doenças. Pra resolver isso, tentamos vários métodos, incluindo subamostragem da classe majoritária pra equilibrar melhor o conjunto de dados.

Contamos com uma técnica de Aprendizado Profundo usando um tipo especial de rede neural chamada rede neural convolucional (CNN). O modelo ResNet-50 foi escolhido por sua eficácia em lidar com dados de imagem. Esse modelo tem várias camadas que ajudam a aprender características importantes das imagens.

Pra treinar nosso modelo, fizemos uma divisão de 60-20-20 para treinamento, validação e teste. Usamos um processo pra determinar os melhores limiares pra prever doenças com base nas saídas do modelo.

Além disso, testamos o quão bem nosso modelo funcionaria quando treinado com imagens de um tipo de câmera e depois testado com imagens de uma câmera diferente. Isso nos ajudou a entender como nosso modelo é adaptável a diferentes fontes de dados.

Resultados

Depois de passar por várias rodadas de treinamento, estabelecemos os melhores parâmetros pro nosso modelo. Ele teve um desempenho forte em identificar várias condições oculares. O modelo se saiu particularmente bem com condições que tinham mais imagens no nosso conjunto de dados. Por exemplo, doenças como retinopatia diabética e edema macular foram mais fáceis de identificar pelo modelo.

Por outro lado, algumas condições foram difíceis de detectar pelo modelo, principalmente porque tinham menos instâncias no conjunto de dados. Exemplos incluem descolamento de retina, que só teve algumas imagens, resultando em resultados de identificação piores.

Percebemos também que o modelo teve dificuldades com a categoria "Outros", que incluía várias doenças. A diversidade dessa categoria provavelmente confundiu o modelo, dificultando a distinção entre diferentes condições representadas ali. No futuro, pode ser útil rotular essas imagens com condições mais específicas pra melhorar a precisão do modelo.

Pra lidar melhor com o desequilíbrio no nosso conjunto de dados, realizamos várias experiências. Em um caso, removemos um número significativo de imagens saudáveis pra ver se isso melhorava o desempenho do modelo. Remover essas imagens realmente resultou em uma leve melhora.

Tentamos também combinar algumas das condições menos frequentemente representadas em uma categoria mais ampla de "Outros". No entanto, essa abordagem não levou a melhorias significativas no desempenho.

Por último, exploramos usar um método de ensemble, combinando as saídas de diferentes modelos pra ver se isso melhorava a precisão. Embora tenhamos visto alguns pequenos ganhos, a complexidade adicional pode não justificar os benefícios no cenário de saúde.

Conclusão

Esse estudo teve como objetivo desenvolver um modelo pra identificar uma variedade de doenças de retina usando imagens coletadas no Brasil. Demonstramos que um modelo ResNet-50, com as técnicas certas, pode classificar essas doenças de forma eficaz. Nosso trabalho destaca o potencial do uso de ferramentas de IA nos cuidados oculares, especialmente em lugares onde há falta de especialistas treinados.

Aprendemos que o desempenho do modelo varia com base em quantos exemplos de cada doença estão disponíveis nos dados de treinamento. No geral, nosso modelo se sai bem com condições mais comuns, mas enfrenta dificuldades com as mais raras.

No futuro, há potencial pra construir sobre esse modelo básico, experimentando com modelos mais complexos e utilizando diferentes conjuntos de dados. Esses avanços poderiam levar a ferramentas ainda mais eficazes pra diagnosticar doenças oculares, melhorando o acesso ao tratamento e, em última análise, aprimorando os resultados para os pacientes.

Combinar nosso modelo com outros treinados em diferentes doenças poderia criar uma ferramenta de diagnóstico mais robusta. Isso poderia ser especialmente benéfico em ambientes com poucos recursos, onde a triagem e o tratamento rápidos são essenciais. Continuando esse trabalho, esperamos contribuir pra melhores resultados de saúde ocular ao redor do mundo.

Fonte original

Título: Deep Learning for Multi-Label Disease Classification of Retinal Images: Insights from Brazilian Data for AI Development in Lower-Middle Income Countries

Resumo: Retinal fundus imaging is a powerful tool for disease screening and diagnosis in opthalmology. With the advent of machine learning and artificial intelligence, in particular modern computer vision classification algorithms, there is broad scope for technology to improve accuracy, increase accessibility and reduce cost in these processes. In this paper we present the first deep learning model trained on the first Brazilian multi-label opthalmological datatset. We train a multi-label classifier using over 16,000 clinically-labelled fundus images. Across a range of 13 retinal diseases, we obtain frequency-weighted AUC and F1 scores of 0.92 and 0.70 respectively. Our work establishes a baseline model on this new dataset and furthermore demonstrates the applicability and power of artificial intelligence approaches to retinal fundus disease diagnosis in under-represented populations.

Autores: Dewi S.W. Gould, J. Yang, D. A. Clifton

Última atualização: 2024-02-13 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2024.02.12.24302676

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.02.12.24302676.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes