Simple Science

Ciência de ponta explicada de forma simples

# Informática# Aprendizagem de máquinas# Inteligência Artificial# Visão computacional e reconhecimento de padrões

Viés racial em modelos de IA para imagem de câncer de mama

Analisando preconceito racial nas previsões de IA usando dados de MRI de câncer de mama.

― 7 min ler


Viés racial da IA emViés racial da IA emmodelos de câncer de mamaprevisões de IA para câncer de mama.Estudo revela um grande viés racial nas
Índice

A inteligência artificial (IA) tá se tornando cada vez mais comum em áreas como a medicina. Mas, estudos recentes mostram que a IA pode ter um desempenho diferente pra grupos de pessoas diferentes, dependendo de características como raça. Isso é um problema que os pesquisadores tão tentando entender. A maior parte dos trabalhos anteriores focou em métodos de aprendizado profundo. Mas, métodos tradicionais de IA, que usam características escolhidas com cuidado, também podem mostrar viés. Esse artigo investiga o viés racial em modelos de floresta aleatória que usam características derivadas de exames de ressonância magnética da mama.

Contexto

Modelos de IA podem mostrar viés por várias razões. Uma razão principal é quando os dados de treinamento não representam diferentes grupos de forma justa. Por exemplo, se um modelo de IA é treinado principalmente com dados de uma raça, ele pode não funcionar bem para outras. Essa questão já foi observada em várias tarefas de imagem médica, onde modelos de IA têm um desempenho melhor em alguns grupos demográficos do que em outros.

Em muitos casos, os pesquisadores focaram em modelos de aprendizado profundo que aprendem as características durante o treinamento. Isso pode levar a viés se houver diferenças nos dados entre os grupos. No entanto, abordagens tradicionais que dependem de características fixas, como radiômica, foram menos estudadas nesse aspecto.

Foco do Estudo

Neste estudo, os pesquisadores queriam descobrir se modelos de floresta aleatória treinados com características de radiômica de exames de ressonância magnética da mama poderiam mostrar viés racial. Eles focaram especificamente na previsão dos tipos moleculares de tumores em pacientes com Câncer de mama. Essa é uma tarefa importante porque a forma como os tumores são tratados pode depender do seu subtipo molecular. Normalmente, esse subtipo é determinado por uma biópsia com agulha, que é invasiva. Se a IA puder Prever isso a partir de imagens, pode evitar a necessidade de tais procedimentos.

Coleta de Dados

Os pesquisadores usaram dados de 922 mulheres com câncer de mama, que fizeram exames de ressonância magnética pré-operatórios. Esses dados incluíam não só as imagens de ressonância, mas também informações demográficas e clínicas. Eles derivaram mais de 500 características de radiômica das ressonâncias, divididas em três categorias: mama inteira, tecido fibroglandular (FGT) e apenas tumor. A população do estudo era principalmente branca (70%), com pacientes negras representando cerca de 22%.

Metodologia

Pra investigar o potencial viés racial, os pesquisadores primeiro checaram se as características de radiômica poderiam prever a raça. Eles treinaram classificadores de floresta aleatória usando diferentes conjuntos de características e garantiram uma representação equilibrada de ambas as Raças nos conjuntos de dados de treinamento e teste. O objetivo era medir se a precisão da previsão variava conforme a raça.

Depois, os pesquisadores analisaram como o treinamento em conjuntos de dados desequilibrados poderia afetar a precisão dos modelos na previsão do subtipo do tumor. Eles criaram conjuntos de treinamento que incluíam apenas pacientes brancos ou negros pra ver se isso mudaria o desempenho do modelo.

Resultados da Classificação Racial

Os resultados mostraram que os modelos podiam prever a raça com uma precisão de 60-70%. Isso indica que as características de radiômica continham alguma informação que identifica a raça. Tanto os sujeitos brancos quanto os negros tiveram taxas de previsão semelhantes, o que sugere que o viés racial é uma preocupação real no treinamento de IA.

Resultados da Análise de Viés

Em seguida, os pesquisadores avaliaram como os dados de treinamento desequilibrados impactaram o viés. Eles dividiram seu conjunto de dados em conjuntos de treinamento e teste, mantendo a distribuição racial e do subtipo do tumor. Treinaram modelos usando vários subconjuntos de características e observaram como cada modelo se saiu baseado na raça dos sujeitos envolvidos.

Os resultados indicaram que modelos treinados com dados que incluíam ambas as raças se saíram melhor em pacientes brancos do que em pacientes negros. A diferença de desempenho variou de 3% a 11%, dependendo dos modelos usados. Isso sugere que a forma como os dados de treinamento são equilibrados pode influenciar os resultados dos modelos de IA, destacando um possível viés.

Análise de Covariáveis

Pra entender melhor o viés observado, os pesquisadores examinaram vários fatores que poderiam afetar a raça e o desempenho do modelo. Eles analisaram características dos pacientes como idade e tipos de tratamento. A análise revelou diferenças significativas nessas características entre os dois grupos de pacientes. Por exemplo, pacientes negros eram mais propensos a ter determinados tipos de tumores que geralmente são tratados de forma diferente em comparação com pacientes brancos.

Discussão

Esse estudo destaca a possibilidade de viés racial em modelos de IA que usam características de radiômica de exames de ressonância magnética da mama. Mostra que mesmo métodos tradicionais, que se pensam menos suscetíveis ao viés, ainda podem apresentar injustiças baseadas na raça. As descobertas sugerem que o método de seleção de características e o equilíbrio dos dados de treinamento podem impactar significativamente o desempenho dos modelos de IA.

Curiosamente, outros estudos usando o mesmo tipo de dado não encontraram diferenças de desempenho significativas baseadas na raça. Isso pode ser devido a diferenças na forma como os conjuntos de treinamento foram criados. Diferentemente desses estudos, essa pesquisa criou intencionalmente conjuntos de dados desequilibrados, o que pode ter revelado mais sobre os riscos de viés.

Conclusão

O principal recado dessa pesquisa é a importância de considerar possíveis viéses em modelos de IA usados na saúde. A presença de informações que identificam a raça nas características de radiômica mostra que até métodos tradicionais podem ser influenciados pelos dados com que são treinados. Isso ressalta a necessidade de investigação mais aprofundada sobre as causas do viés, incluindo olhar para fatores de confusão e interações entre várias características dos pacientes.

À medida que a IA continua a desempenhar um papel maior na saúde, abordar esses viéses será crucial. Os pesquisadores devem garantir que os sistemas de IA sejam justos e eficazes para todos os grupos, não apenas para aqueles que dominam os dados de treinamento. Estudos futuros precisarão explorar maneiras de reduzir o viés e promover uma performance equitativa da IA em ambientes médicos.

Em resumo, a presença de viés racial em modelos de IA treinados com imagens médicas destaca a necessidade de consideração cuidadosa da representação de dados e estratégias de treinamento de modelos. A partir de agora, será importante buscar soluções que ajudem a eliminar viéses enquanto mantêm a eficácia e precisão nas aplicações da IA.

Fonte original

Título: An Investigation Into Race Bias in Random Forest Models Based on Breast DCE-MRI Derived Radiomics Features

Resumo: Recent research has shown that artificial intelligence (AI) models can exhibit bias in performance when trained using data that are imbalanced by protected attribute(s). Most work to date has focused on deep learning models, but classical AI techniques that make use of hand-crafted features may also be susceptible to such bias. In this paper we investigate the potential for race bias in random forest (RF) models trained using radiomics features. Our application is prediction of tumour molecular subtype from dynamic contrast enhanced magnetic resonance imaging (DCE-MRI) of breast cancer patients. Our results show that radiomics features derived from DCE-MRI data do contain race-identifiable information, and that RF models can be trained to predict White and Black race from these data with 60-70% accuracy, depending on the subset of features used. Furthermore, RF models trained to predict tumour molecular subtype using race-imbalanced data seem to produce biased behaviour, exhibiting better performance on test data from the race on which they were trained.

Autores: Mohamed Huti, Tiarna Lee, Elinor Sawyer, Andrew P. King

Última atualização: 2023-09-29 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2309.17197

Fonte PDF: https://arxiv.org/pdf/2309.17197

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes