Novos Conjuntos de Dados para Estimativa Precisa da Ingestão Dietética
Apresentando os conjuntos de dados do NutritionVerse pra melhorar os métodos de avaliação da ingestão alimentar.
― 5 min ler
Índice
- Importância da Estimativa de Ingestão Alimentar
- Desafios nos Métodos Atuais de Avaliação Dietética
- NutritionVerse-Synth e NutritionVerse-Real
- Métodos de Estimativa de Ingestão Alimentar
- Benefícios de Usar Informação de Profundidade
- Principais Descobertas da Nossa Pesquisa
- Conclusão
- Fonte original
- Ligações de referência
Estimar quanto as pessoas comem é super importante pra promover uma alimentação saudável. A desnutrição pode piorar a qualidade de vida, então é preciso ter uma boa estimativa da dieta pra guiar políticas e programas. Mas os métodos tradicionais, tipo diários alimentares, muitas vezes têm viés porque dependem da memória da galera sobre o que comeram. Outros métodos comuns, como apps, tomam muito tempo e podem precisar de pessoal treinado pra ajudar. Recentemente, alguns pesquisadores tentaram usar visão computacional e aprendizado de máquina pra estimar a ingestão de comida analisando imagens. Mas a eficácia desses métodos é limitada porque não tem imagens de qualidade suficiente de diferentes ângulos ou tipos de comida.
Pra melhorar isso, apresentamos um novo conjunto de dados chamado NutritionVerse-Synth, que contém 84.984 imagens sintéticas de comida junto com informações importantes sobre dieta e várias anotações. Também criamos um conjunto de dados real, o NutritionVerse-Real, que inclui 889 imagens de pratos reais pra ver quão realista é nosso dado sintético. Usando esses conjuntos de dados, investigamos diferentes maneiras de estimar quanto as pessoas comem, incluindo técnicas que segmentam a comida nas imagens e outras que preveem diretamente a ingestão alimentar.
Importância da Estimativa de Ingestão Alimentar
Entender a ingestão alimentar é crucial porque a desnutrição afeta a vida de muita gente. Os métodos atuais, tipo diários ou questionários, muitas vezes falham por causa de viés. Novos métodos com tecnologia podem ajudar a estimar melhor a ingestão, especialmente aproveitando imagens. Porém, muitos métodos existentes têm dificuldades porque dependem de conjuntos de dados limitados que não capturam a diversidade das situações de alimentação do mundo real.
Desafios nos Métodos Atuais de Avaliação Dietética
- Viés de Auto-relato: Métodos tradicionais exigem que as pessoas relatem o que comeram, o que nem sempre é preciso.
- Altos Custos de Tempo: Alguns métodos novos, como os apps, demandam bastante tempo.
- Necessidade de Pessoal Treinado: Muitas abordagens precisam de treinamento pra garantir resultados precisos.
- Conjuntos de Dados Limitados: Muitos conjuntos de dados existentes de imagens de comida são pequenos e pouco diversos.
NutritionVerse-Synth e NutritionVerse-Real
Pra resolver os problemas nos métodos atuais de avaliação dietética, criamos dois conjuntos de dados:
NutritionVerse-Synth
Esse conjunto de dados tem 84.984 imagens sintéticas de comida. As imagens são geradas por simulações avançadas pra garantir que pareçam realistas. Cada imagem vem com informações dietéticas como calorias, proteínas, gorduras e carboidratos. Usando modelos 3D de comida, conseguimos criar uma variedade grande de cenas com diferentes itens alimentares dispostos de várias maneiras.
NutritionVerse-Real
Esse conjunto contém 889 imagens de pratos de comida reais. Capturamos essas imagens usando um smartphone, garantindo que reflitam a diversidade encontrada na vida real. Os pratos são limitados aos que estão no conjunto sintético pra facilitar a comparação.
Métodos de Estimativa de Ingestão Alimentar
Exploramos duas abordagens principais pra estimar a ingestão alimentar: previsão indireta e previsão direta.
Previsão Indireta
Esse método envolve contar os pixels de itens alimentares nas imagens pra determinar a ingestão. Usamos modelos de segmentação pra identificar quais pixels pertencem a quais itens, permitindo estimar a ingestão com base na quantidade de pixels associados a cada item.
Previsão Direta
Nessa técnica, usamos modelos de aprendizado profundo pra prever diretamente as informações dietéticas a partir das imagens de comida sem depender da contagem de pixels. Esse método pode ser mais direto e às vezes dá resultados melhores.
Benefícios de Usar Informação de Profundidade
Também examinamos o impacto de usar informação de profundidade, que se refere a dados sobre a distância dos objetos na imagem. A profundidade pode ajudar a determinar o volume e os tamanhos das porções de comida, potencialmente melhorando a precisão. No entanto, nossos achados sugerem que a informação de profundidade pode não melhorar sempre o desempenho dos modelos, especialmente em tarefas de previsão direta.
Principais Descobertas da Nossa Pesquisa
- Melhor Abordagem: O método mais eficaz pra estimar a ingestão alimentar foi encontrado na previsão direta usando um conjunto específico de pesos pré-treinados. Esse método geralmente teve um desempenho melhor do que os métodos indiretos.
- Efeito da Informação de Profundidade: Embora adicionar informação de profundidade tenha ajudado a melhorar alguns modelos, afetou negativamente a precisão da previsão direta. Assim, a informação de profundidade pode ser mais útil em abordagens indiretas.
- Impacto dos Dados Sintéticos: Quando treinamos modelos apenas com dados sintéticos, eles se saíram bem, mas a precisão caiu quando testados com dados reais. Afinar esses modelos com dados reais geralmente melhorou sua precisão.
Conclusão
Resumindo, estimar a ingestão alimentar com precisão é essencial pra promover uma alimentação saudável. Embora os métodos tradicionais tenham limitações, o uso de visão computacional e aprendizado de máquina oferece alternativas promissoras. Nossos conjuntos de dados NutritionVerse são recursos valiosos pra pesquisadores, permitindo o desenvolvimento de melhores métodos de estimativa dietética. Usando dados sintéticos de maneira eficaz, podemos potencialmente superar alguns dos desafios das avaliações dietéticas do mundo real. O trabalho futuro vai focar em expandir o conjunto de dados sintéticos e aplicar esses métodos a situações alimentares mais diversas.
Título: NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches
Resumo: Accurate dietary intake estimation is critical for informing policies and programs to support healthy eating, as malnutrition has been directly linked to decreased quality of life. However self-reporting methods such as food diaries suffer from substantial bias. Other conventional dietary assessment techniques and emerging alternative approaches such as mobile applications incur high time costs and may necessitate trained personnel. Recent work has focused on using computer vision and machine learning to automatically estimate dietary intake from food images, but the lack of comprehensive datasets with diverse viewpoints, modalities and food annotations hinders the accuracy and realism of such methods. To address this limitation, we introduce NutritionVerse-Synth, the first large-scale dataset of 84,984 photorealistic synthetic 2D food images with associated dietary information and multimodal annotations (including depth images, instance masks, and semantic masks). Additionally, we collect a real image dataset, NutritionVerse-Real, containing 889 images of 251 dishes to evaluate realism. Leveraging these novel datasets, we develop and benchmark NutritionVerse, an empirical study of various dietary intake estimation approaches, including indirect segmentation-based and direct prediction networks. We further fine-tune models pretrained on synthetic data with real images to provide insights into the fusion of synthetic and real data. Finally, we release both datasets (NutritionVerse-Synth, NutritionVerse-Real) on https://www.kaggle.com/nutritionverse/datasets as part of an open initiative to accelerate machine learning for dietary sensing.
Autores: Chi-en Amy Tai, Matthew Keller, Saeejith Nair, Yuhao Chen, Yifan Wu, Olivia Markham, Krish Parmar, Pengcheng Xi, Heather Keller, Sharon Kirkpatrick, Alexander Wong
Última atualização: 2024-09-01 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2309.07704
Fonte PDF: https://arxiv.org/pdf/2309.07704
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.