Nova ferramenta prevê risco de câncer de pulmão
Ferramenta de aprendizado de máquina avalia risco de câncer de pulmão em cinco anos.
― 6 min ler
Índice
O Câncer de Pulmão é uma das principais causas de morte no mundo todo. A Detecção Precoce é super importante porque pode aumentar as chances de sobrevivência. Este artigo fala sobre uma nova ferramenta que usa aprendizado de máquina para prever as chances de alguém desenvolver câncer de pulmão em até cinco anos. Essa ferramenta foi treinada com dados de um grande estudo de triagem de câncer e foi testada quanto à precisão.
Dados Utilizados
Conjuntos de Dados
A ferramenta é baseada em dois conjuntos de dados principais. O primeiro vem do Estudo de Triagem de Câncer de Próstata, Pulmão, Colorretal e Ovariano (PLCO), que envolveu um número grande de pacientes e coletou informações detalhadas sobre vários Fatores de Risco e resultados relacionados ao câncer de pulmão. O segundo conjunto de dados é do Estudo Nacional de Triagem do Pulmão (NLST), que focou no uso de tomografia computadorizada de baixa dose para detectar câncer de pulmão em pessoas de alto risco.
Fatores de Risco
Para identificar quem pode estar em alto risco de câncer de pulmão, o estudo se concentrou em fumantes antigos e atuais. Fumar é a principal causa de câncer de pulmão devido às substâncias nocivas na fumaça do tabaco que podem danificar as células pulmonares. Outros fatores de risco incluem exposição à fumaça de cigarro de outras pessoas, certos perigos no trabalho e poluição do ar. Idade, gênero e histórico familiar de câncer de pulmão também aumentam o risco.
Desenvolvimento do Modelo
O modelo de aprendizado de máquina foi construído usando uma técnica chamada XGBoost, que é bem eficaz para lidar com conjuntos de dados complexos. O modelo foi treinado com dados do estudo PLCO e depois testado com os dados do NLST. Um passo importante antes de treinar o modelo foi limpar os dados para remover participantes que nunca tinham fumado ou que morreram de causas não relacionadas ao câncer de pulmão. Isso garantiu que o modelo focasse somente em quem estava em maior risco.
Seleção de Recursos
Na construção do modelo, alguns recursos ou características foram escolhidos para ajudar nas previsões. Os recursos incluíam informações como a idade do participante, histórico de tabagismo e histórico familiar de câncer de pulmão. O objetivo foi manter o modelo simples enquanto ainda fazia previsões precisas.
Desempenho do Modelo
Depois que o modelo foi treinado, ele foi testado no conjunto de dados NLST para ver como ele se saiu. O modelo mostrou boa precisão, com uma pontuação de 82% no conjunto de dados PLCO e 70% no conjunto de dados NLST. Essas pontuações mostraram que o modelo conseguia identificar de forma eficaz indivíduos em alto risco de câncer de pulmão. Além disso, seu desempenho foi comparado com as diretrizes existentes, mostrando que ele poderia identificar mais pessoas em alto risco do que as recomendações atuais de triagem.
Aplicativo Web
Uma ferramenta online foi desenvolvida com base nesse modelo para permitir que os usuários estimem seu próprio risco de desenvolver câncer de pulmão nos próximos cinco anos. Essa ferramenta consiste em um questionário simples que os usuários podem preencher, facilitando a avaliação do próprio risco sem precisar de muito conhecimento médico.
Importância da Detecção Precoce
O câncer de pulmão pode ser muito mais tratável quando detectado precocemente. A taxa de sobrevivência em cinco anos para câncer de pulmão é significativamente maior para indivíduos diagnosticados nos estágios iniciais em comparação com aqueles diagnosticados mais tarde, quando a doença já se espalhou. As diretrizes atuais recomendam triagem para quem tem entre 55 e 80 anos e um histórico significativo de tabagismo. No entanto, o novo modelo de risco oferece uma avaliação mais personalizada, permitindo uma detecção precoce em mais indivíduos que, de outra forma, não seriam triados.
Comparação com Diretrizes Atuais
O modelo foi comparado com as recomendações atuais do Task Force de Serviços Preventivos dos EUA (USPSTF). Enquanto as diretrizes eram eficazes para algumas pessoas, o novo modelo conseguiu identificar mais quem poderia se beneficiar da triagem. O modelo alcançou taxas de recall semelhantes, mas com maior precisão, tornando-se uma opção potencialmente melhor para reduzir mortes por câncer de pulmão por meio de uma intervenção precoce.
Limitações
Apesar de suas forças, o modelo tem limitações. Os dados usados para treinamento e teste foram coletados apenas nos Estados Unidos, então os resultados podem não se aplicar a outras populações. Além disso, a eficácia do modelo pode ser afetada por dados ausentes dos estudos. Futuras pesquisas podem buscar melhorar o modelo, especialmente em termos de aplicação a populações diversas.
Direções Futuras
O objetivo é refinar ainda mais o modelo para que ele possa ser integrado efetivamente nas práticas de saúde de rotina. A ferramenta web fácil de usar pode ajudar na tomada de decisões compartilhadas sobre a triagem do câncer de pulmão, promovendo a detecção precoce e melhorando os resultados dos pacientes.
Conclusão
Essa ferramenta de estimativa de risco de câncer de pulmão representa um avanço significativo na previsão do câncer de pulmão para quem está em risco. Com um aplicativo web amigável, as pessoas podem avaliar seu próprio risco e tomar decisões informadas sobre a triagem. Focando em fatores de risco personalizados em vez de diretrizes generalizadas, essa ferramenta pode levar a uma detecção mais precoce e, no final, salvar vidas.
A detecção precoce do câncer de pulmão continua sendo fundamental para melhorar as taxas de sobrevivência. Ao aprimorar nossa compreensão dos fatores de risco e usar técnicas de aprendizado de máquina, podemos trabalhar em direção a um futuro onde o câncer de pulmão seja identificado e tratado de forma mais eficaz.
Com o desenvolvimento contínuo de ferramentas de avaliação de risco, podemos nos aproximar da redução da mortalidade por câncer de pulmão enquanto garantimos que os indivíduos recebam o cuidado e a atenção que precisam com base em suas circunstâncias únicas. O modelo e sua aplicação oferecem uma avenida promissora para melhores resultados de saúde por meio de intervenção precoce e avaliação prática de risco.
Título: Development and external validation of a lung cancer risk estimation tool using gradient-boosting
Resumo: Lung cancer is a significant cause of mortality worldwide, emphasizing the importance of early detection for improved survival rates. In this study, we propose a machine learning (ML) tool trained on data from the PLCO Cancer Screening Trial and validated on the NLST to estimate the likelihood of lung cancer occurrence within five years. The study utilized two datasets, the PLCO (n=55,161) and NLST (n=48,595), consisting of comprehensive information on risk factors, clinical measurements, and outcomes related to lung cancer. Data preprocessing involved removing patients who were not current or former smokers and those who had died of causes unrelated to lung cancer. Additionally, a focus was placed on mitigating bias caused by censored data. Feature selection, hyper-parameter optimization, and model calibration were performed using XGBoost, an ensemble learning algorithm that combines gradient boosting and decision trees. The ML model was trained on the pre-processed PLCO dataset and tested on the NLST dataset. The model incorporated features such as age, gender, smoking history, medical diagnoses, and family history of lung cancer. The model was well-calibrated (Brier score=0.044). ROC-AUC was 82% on the PLCO dataset and 70% on the NLST dataset. PR-AUC was 29% and 11% respectively. When compared to the USPSTF guidelines for lung cancer screening, our model provided the same recall with a precision of 13.1% vs. 9.3% on the PLCO dataset and 3.2% vs. 3.1% on the NLST dataset. The developed ML tool provides a freely available web application for estimating the likelihood of developing lung cancer within five years. By utilizing risk factors and clinical data, individuals can assess their risk and make informed decisions regarding lung cancer screening. This research contributes to the efforts in early detection and prevention strategies, aiming to reduce lung cancer-related mortality rates.
Autores: Pierre-Louis Benveniste, Julie Alberge, Lei Xing, Jean-Emmanuel Bibault
Última atualização: 2023-08-23 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2308.12188
Fonte PDF: https://arxiv.org/pdf/2308.12188
Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.