Nuevos conjuntos de datos para estimar con precisión la ingesta dietética
Presentamos los conjuntos de datos de NutritionVerse para mejorar los métodos de evaluación de la ingesta de alimentos.
― 6 minilectura
Tabla de contenidos
- Importancia de la Estimación de la Ingesta Dietética
- Desafíos en los Métodos Actuales de Evaluación Dietética
- NutritionVerse-Synth y NutritionVerse-Real
- Métodos de Estimación de la Ingesta Dietética
- Beneficios de Usar Información de Profundidad
- Hallazgos Clave de Nuestra Investigación
- Conclusión
- Fuente original
- Enlaces de referencia
Estimar cuánto comen las personas es super importante para promover una alimentación saludable. La mala nutrición puede afectar mucho la calidad de vida, así que se necesita una estimación precisa de la Ingesta Dietética para guiar políticas y programas. Sin embargo, los métodos tradicionales como los diarios de comida suelen tener sesgos porque dependen de que la gente recuerde lo que comió. Otras formas comunes, como las aplicaciones móviles, requieren mucho tiempo y a veces necesitan personal capacitado para ayudar. Últimamente, algunos investigadores han intentado usar visión por computadora y aprendizaje automático para estimar la ingesta de alimentos analizando imágenes de comida. Pero, la efectividad de estos métodos es limitada porque no hay suficientes imágenes de calidad de comida desde diferentes ángulos o tipos de alimentos.
Para mejorar esta situación, presentamos un nuevo conjunto de datos llamado NutritionVerse-Synth, que contiene 84,984 imágenes sintéticas de comida junto con información dietética importante y varias anotaciones. También creamos un conjunto de datos real, NutritionVerse-Real, que incluye 889 imágenes de platos reales para comprobar cuán realista es nuestro dato sintético. Usando estos conjuntos de datos, investigamos diferentes formas de estimar cuánto comen las personas, incluyendo técnicas que segmentan la comida en las imágenes y otras que predicen directamente la ingesta de alimentos.
Importancia de la Estimación de la Ingesta Dietética
Entender la ingesta dietética es clave porque la malnutrición afecta la vida de mucha gente. Los métodos actuales, como los diarios de comida o los cuestionarios, a menudo fallan debido a sesgos. Nuevos métodos usando tecnología pueden ayudar a estimar mejor la ingesta de alimentos, especialmente aprovechando imágenes. Sin embargo, muchos métodos existentes tienen problemas porque dependen de conjuntos de datos limitados que no capturan la diversidad de las situaciones de alimentación en el mundo real.
Desafíos en los Métodos Actuales de Evaluación Dietética
- Sesgo de Autoinforme: Los métodos tradicionales requieren que las personas informen su ingesta de alimentos, lo cual no siempre es preciso.
- Altos Costos de Tiempo: Algunos métodos nuevos, como las apps, requieren una inversión de tiempo significativa.
- Necesidad de Personal Capacitado: Muchos enfoques requieren entrenamiento para asegurar resultados precisos.
- Conjuntos de Datos Limitados: Muchos conjuntos de datos existentes de imágenes de alimentos son limitados en tamaño y diversidad de alimentos.
NutritionVerse-Synth y NutritionVerse-Real
Para abordar los problemas en los métodos actuales de evaluación dietética, creamos dos conjuntos de datos:
NutritionVerse-Synth
Este conjunto de datos contiene 84,984 imágenes sintéticas de comida. Estas imágenes se generan usando simulaciones avanzadas para asegurarnos de que se vean realistas. Cada imagen viene con información dietética como calorías, proteínas, grasas y carbohidratos. Usando modelos 3D de comida, podemos crear una amplia variedad de escenas con diferentes alimentos.
NutritionVerse-Real
Este conjunto de datos consiste en 889 imágenes de platos reales. Capturamos estas imágenes usando un smartphone, asegurándonos de que reflejen la diversidad que se encuentra en la vida real. Los platos están limitados a los del conjunto de datos sintético para facilitar la comparación.
Métodos de Estimación de la Ingesta Dietética
Exploramos dos enfoques principales para la estimación de la ingesta dietética: predicción indirecta y directa.
Predicción Indirecta
Este método implica contar los píxeles de los alimentos en las imágenes para determinar la ingesta dietética. Usamos modelos de segmentación para identificar qué píxeles pertenecen a qué alimentos, lo que nos permite estimar la ingesta según el número de píxeles asociados con cada alimento.
Predicción Directa
En esta técnica, usamos modelos de aprendizaje profundo para predecir directamente la información dietética a partir de imágenes de alimentos sin depender del conteo de píxeles. Este método puede ser más directo y a veces da mejores resultados.
Beneficios de Usar Información de Profundidad
También examinamos el impacto de usar información de profundidad, que se refiere a datos sobre la distancia de los objetos en una imagen. La profundidad puede ayudar a determinar el volumen y los tamaños de porciones de comida, mejorando potencialmente la precisión. Sin embargo, nuestros hallazgos sugieren que la información de profundidad puede no mejorar siempre el rendimiento de los modelos, especialmente en tareas de predicción directa.
Hallazgos Clave de Nuestra Investigación
- Mejor Enfoque: El método más efectivo para estimar la ingesta dietética resultó ser el enfoque de predicción directa usando un conjunto específico de pesos preentrenados. Este método generalmente tuvo un mejor rendimiento que los métodos indirectos.
- Efecto de la Información de Profundidad: Aunque añadir información de profundidad ayudó a mejorar algunos modelos, afectó negativamente la precisión de la predicción directa. Por lo tanto, la información de profundidad puede ser más útil en enfoques indirectos.
- Impacto de los Datos Sintéticos: Cuando entrenamos modelos solo con datos sintéticos, funcionaron bien, pero su precisión disminuyó al probarlos con datos reales. Ajustar finamente estos modelos con datos reales generalmente mejoró su precisión.
Conclusión
En resumen, estimar la ingesta dietética con precisión es esencial para promover una alimentación saludable. Si bien los métodos tradicionales tienen limitaciones, el uso de visión por computadora y aprendizaje automático ofrece alternativas prometedoras. Nuestros conjuntos de datos NutritionVerse proporcionan recursos valiosos para investigadores, permitiendo el desarrollo de mejores métodos de estimación dietética. Al usar datos sintéticos de manera efectiva, podemos superar algunos de los desafíos que presentan las evaluaciones dietéticas en el mundo real. El trabajo futuro se centrará en ampliar el conjunto de datos sintético y aplicar estos métodos a situaciones de alimentos más diversas.
Título: NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches
Resumen: Accurate dietary intake estimation is critical for informing policies and programs to support healthy eating, as malnutrition has been directly linked to decreased quality of life. However self-reporting methods such as food diaries suffer from substantial bias. Other conventional dietary assessment techniques and emerging alternative approaches such as mobile applications incur high time costs and may necessitate trained personnel. Recent work has focused on using computer vision and machine learning to automatically estimate dietary intake from food images, but the lack of comprehensive datasets with diverse viewpoints, modalities and food annotations hinders the accuracy and realism of such methods. To address this limitation, we introduce NutritionVerse-Synth, the first large-scale dataset of 84,984 photorealistic synthetic 2D food images with associated dietary information and multimodal annotations (including depth images, instance masks, and semantic masks). Additionally, we collect a real image dataset, NutritionVerse-Real, containing 889 images of 251 dishes to evaluate realism. Leveraging these novel datasets, we develop and benchmark NutritionVerse, an empirical study of various dietary intake estimation approaches, including indirect segmentation-based and direct prediction networks. We further fine-tune models pretrained on synthetic data with real images to provide insights into the fusion of synthetic and real data. Finally, we release both datasets (NutritionVerse-Synth, NutritionVerse-Real) on https://www.kaggle.com/nutritionverse/datasets as part of an open initiative to accelerate machine learning for dietary sensing.
Autores: Chi-en Amy Tai, Matthew Keller, Saeejith Nair, Yuhao Chen, Yifan Wu, Olivia Markham, Krish Parmar, Pengcheng Xi, Heather Keller, Sharon Kirkpatrick, Alexander Wong
Última actualización: 2024-09-01 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2309.07704
Fuente PDF: https://arxiv.org/pdf/2309.07704
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.