Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Oftalmologia

Avanços em Dados de Cuidado Ocular na América Latina

Novo conjunto de dados melhora a compreensão das doenças oculares na América Latina.

― 6 min ler


Avanço nos Dados de SaúdeAvanço nos Dados de SaúdeOcularAmérica Latina.informações sobre cuidados oculares naNovo conjunto de dados melhora as
Índice

Na área de saúde ocular, a imagem é super importante pra diagnosticar e acompanhar várias condições dos olhos. Técnicas como fotos da parte de trás do olho (fotos de fundo de retina), fotos da parte da frente do olho e testes de campo de visão são bem comuns. Novas tecnologias, principalmente a inteligência artificial (IA), têm potencial de melhorar o cuidado com doenças oculares. A IA pode ajudar nas triagens e diagnósticos, especialmente em lugares onde faltam recursos. Isso é crucial pra condições como Retinopatia Diabética, degeneração macular relacionada à idade e glaucoma. Mas rolam preocupações de que a IA pode ser injusta se depender de dados não representativos.

Falta de Dados Abertos na América Latina

O movimento de ciência aberta, que incentiva o compartilhamento de dados e pesquisas, não avançou muito na América Latina, especialmente na saúde ocular. A maioria dos conjuntos de dados disponíveis vem de países ricos, o que não reflete a situação em áreas de baixa renda. Esses conjuntos de dados costumam faltar informações demográficas e de saúde importantes, tornando-os menos úteis pra entender doenças oculares em diferentes populações. Em muitos desses países, não tem médicos de olhos suficientes pra quantidade de pessoas que precisam de atendimento. Embora sistemas automatizados pudessem ajudar a alcançar mais pacientes e reduzir a cegueira evitável, é crucial ter dados que representem com precisão aqueles mais afetados por essas doenças.

O Conjunto de Dados BRSET

Um esforço importante pra lidar com esses problemas é a criação do conjunto de dados BRSET, que é o primeiro conjunto de dados oftalmológicos de acesso aberto da América Latina. Esse conjunto inclui várias informações sobre doenças oculares e diferentes contextos sociais. O conjunto foi aprovado por um comitê de ética em pesquisa e inclui fotos da parte de trás do olho junto com dados clínicos. Todas as informações identificáveis sobre os pacientes foram removidas pra manter a privacidade.

Fontes de Dados

Os dados foram coletados de três centros de atenção ambulatorial em saúde ocular em São Paulo, Brasil, ao longo do período de 2010 a 2020. As fotos foram tiradas com várias câmeras de retina por funcionários treinados.

Coleta de Dados

As fotos no conjunto foram capturadas com diferentes tipos de câmeras de retina. Os membros da equipe tiraram essas fotos depois de usar medicação pra dilatar as pupilas, garantindo imagens mais claras. Cada foto foi verificada pra garantir que nenhuma informação privada fosse incluída.

Preparação do Conjunto de Dados

Cada foto é rotulada com detalhes sobre a câmera usada, o centro da imagem, a nacionalidade do paciente, idade, sexo, condições de saúde, uso de insulina e há quanto tempo têm diabetes. Esses detalhes foram coletados dos registros eletrônicos de saúde dos pacientes. Um médico especialista em olhos rotulou as imagens com base em critérios acordados.

Controle de Qualidade

Pra garantir alta qualidade, fatores como foco, iluminação, área da imagem e quaisquer artefatos incomuns nas imagens foram avaliados. Se a qualidade não estava satisfatória, isso foi anotado e classificado de acordo.

Classificação das Condições Oculares

O conjunto de dados também inclui classificações de várias doenças oculares como retinopatia diabética, Edema Macular e outras. A retinopatia diabética foi classificada usando sistemas de graduação padrão.

Registros de Dados

O conjunto de dados BRSET contém 16.266 imagens de 8.524 pacientes no Brasil, além de um arquivo descrevendo todos os rótulos e detalhes.

Armazenamento de Dados

As imagens e seus rótulos estão armazenados em um repositório público pra que outros possam acessar.

Análise Descritiva

No conjunto de dados BRSET, a maioria das imagens (cerca de 65%) foi tirada com um tipo de câmera de retina. Uma parte maior dos pacientes no conjunto são mulheres. A idade média dos pacientes é em torno de 57 anos.

Dentre os pacientes, um número específico foi diagnosticado com diabetes. A maioria não tinha sinais de retinopatia diabética, enquanto outros tinham diferentes estágios da doença. Também tem imagens mostrando diferenças na anatomia ocular entre os pacientes.

Avaliação da Qualidade

Em relação à qualidade das imagens, uma pequena porcentagem apresentou problemas com foco, iluminação ou outros fatores de qualidade. Os metadados associados às imagens também tinham dados mínimos faltando, o que garante a confiabilidade do conjunto de dados.

Aplicações de Pesquisa

O conjunto de dados BRSET pode ser usado pra desenvolver modelos de visão computacional. Esses modelos podem identificar características dos pacientes e classificar doenças. O conjunto apoia várias tarefas, incluindo diagnosticar diabetes e classificar sexo com base nas imagens.

Métricas de Desempenho

Três tarefas principais foram realizadas usando esse conjunto: descobrir se o paciente tem diabetes, determinar seu sexo e avaliar a retinopatia diabética. Diferentes modelos foram usados pra essas tarefas e foram avaliados com base em seu desempenho.

Direções Futuras

O conjunto de dados BRSET é uma contribuição significativa pro campo da oftalmologia no Brasil e na América Latina. Ele visa melhorar como os dados são representados e criar um modelo pra desenvolver mais conjuntos de dados no futuro. O conjunto também destaca a necessidade de examinar se os algoritmos usados em ambientes médicos são justos entre diferentes grupos demográficos.

Conclusão

O conjunto de dados BRSET abre novas possibilidades pra pesquisa e cuidado na saúde ocular. Ele permite uma melhor compreensão das doenças que afetam muitas pessoas, especialmente na América Latina. Com um conjunto de dados que representa populações diversas, se torna possível criar sistemas de IA mais eficientes e justos pra cuidados oculares.

Fonte original

Título: BRSET: A Brazilian Multilabel Ophthalmological Dataset of Retina Fundus Photos

Resumo: IntroductionThe Brazilian Multilabel Ophthalmological Dataset (BRSET) addresses the scarcity of publicly available ophthalmological datasets in Latin America. BRSET comprises 16,266 color fundus retinal photos from 8,524 Brazilian patients, aiming to enhance data representativeness, serving as a research and teaching tool. It contains sociodemographic information, enabling investigations into differential model performance across demographic groups. MethodsData from three Sao Paulo outpatient centers yielded demographic and medical information from electronic records, including nationality, age, sex, clinical history, insulin use, and duration of diabetes diagnosis. A retinal specialist labeled images for anatomical features (optic disc, blood vessels, macula), quality control (focus, illumination, image field, artifacts), and pathologies (e.g., diabetic retinopathy). Diabetic retinopathy was graded using International Clinic Diabetic Retinopathy and Scottish Diabetic Retinopathy Grading. Validation used Dino V2 Base for feature extraction, with 70% training and 30% testing subsets. Support Vector Machines (SVM) and Logistic Regression (LR) were employed with weighted training. Performance metrics included area under the receiver operating curve (AUC) and Macro F1-score. ResultsBRSET comprises 65.1% Canon CR2 and 34.9% Nikon NF5050 images. 61.8% of the patients are female, and the average age is 57.6 years. Diabetic retinopathy affected 15.8% of patients, across a spectrum of disease severity. Anatomically, 20.2% showed abnormal optic discs, 4.9% abnormal blood vessels, and 28.8% abnormal macula. Models were trained on BRSET in three prediction tasks: "diabetes diagnosis"; "sex classification"; and "diabetic retinopathy diagnosis". DiscussionBRSET is the first multilabel ophthalmological dataset in Brazil and Latin America. It provides an opportunity for investigating model biases by evaluating performance across demographic groups. The model performance of three prediction tasks demonstrates the value of the dataset for external validation and for teaching medical computer vision to learners in Latin America using locally relevant data sources. Author SummaryIn low-resource settings, access to open medical datasets is crucial for research. Regions such as Latin America often face underrepresentation, resulting in health biases and inequities. To face the scarcity of diverse ophthalmological datasets in these areas, especially in Brazil and Latin America, we introduce the Brazilian Multilabel Ophthalmological Dataset (BRSET) as a means to alleviate biases in medical AI research. Comprising 16,266 color fundus retinal photos from 8,524 Brazilian patients, BRSET integrates sociodemographic information, empowering researchers to investigate biases across demographic groups and diseases. BRSET was extracted from Sao Paulo outpatient centers, and includes demographics, clinical history, and retinal images labeled for anatomical features, quality control, and pathologies like diabetic retinopathy. Validation was performed in a set of selected prediction tasks, such as diabetes diagnosis, sex classification, and diabetic retinopathy diagnosis. BRSETs inclusion of sociodemographic data and experiment metrics underscores its potential efficacy across diverse classification objectives and patient groups, providing crucial insights for medical AI in underrepresented regions.

Autores: Luis Filipe Nakayama, D. Restrepo, J. Matos, L. Z. Ribeiro, F. K. Malerbi, L. A. Celi, C. S. Regatieri

Última atualização: 2024-01-23 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2024.01.23.24301660

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.01.23.24301660.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes