Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones

MammalNet: Un Nuevo Conjunto de Datos para la Investigación de Vida Silvestre

MammalNet ofrece un montón de videos sobre el comportamiento de los mamíferos para la investigación de la vida salvaje.

― 7 minilectura


El conjunto de datosEl conjunto de datosMammalNet revoluciona elestudio de la vidaanálisis de comportamiento.reconocimiento de animales y elNuevo conjunto de datos mejora el
Tabla de contenidos

Estudiar cómo se comportan los Animales es clave para proteger la vida salvaje y mantener los ecosistemas sanos. El Reconocimiento automático de animales y sus acciones puede ayudar a los científicos y conservacionistas a analizar rápidamente los datos recogidos de videos. Sin embargo, no hay muchos Conjuntos de datos de videos etiquetados disponibles que se puedan usar para este tipo de trabajo.

La Necesidad de Mejores Datos

Los conjuntos de datos de video actuales tienen varios problemas. A menudo no siguen clasificaciones científicas establecidas, son demasiado pequeños para ser útiles al estudiar Comportamientos en diferentes especies, y no brindan anotaciones detalladas que ayuden a identificar acciones específicas dentro de videos más largos. Debido a estas limitaciones, a los investigadores les cuesta crear sistemas automatizados que reconozcan animales y sus comportamientos.

Para abordar estos problemas, se ha creado un nuevo conjunto de datos llamado MammalNet. Este conjunto es mucho más grande que los existentes y proporciona información detallada sobre varios mamíferos y sus comportamientos comunes.

¿Qué es MammalNet?

MammalNet consiste en más de 18,000 videos, totalizando más de 539 horas de grabación. Esto es diez veces más grande que el conjunto de datos existente de comportamiento animal más grande. Incluye una amplia gama de mamíferos, cubriendo 17 órdenes diferentes, 69 familias y 173 categorías. El conjunto de datos también se centra en 12 comportamientos específicos que son importantes para entender cómo interactúan estos animales con su entorno.

El conjunto de datos permite a los investigadores realizar tres tareas principales: reconocer animales y sus comportamientos, reconocer animales y comportamientos con menos ejemplos, y detectar comportamientos en grabaciones de video sin editar.

Importancia del Comportamiento Animal

Los animales juegan un papel esencial en el medio ambiente. Sus acciones pueden afectar el crecimiento de plantas, la salud de los ecosistemas y la dinámica de sus poblaciones. Al monitorear cómo se comportan los animales y cómo interactúan con su entorno, los científicos pueden obtener valiosos conocimientos para abordar la actual crisis de biodiversidad.

La tecnología moderna, como las cámaras trampa y los drones, ha facilitado la recolección de grandes cantidades de grabaciones de vida salvaje. Sin embargo, revisar manualmente estas grabaciones es tedioso e ineficiente. Crear sistemas automatizados para analizar los comportamientos animales puede ahorrar tiempo y proporcionar resultados más rápidos, lo cual es crucial para una gestión y conservación efectiva de la vida silvestre.

Desafíos en el Desarrollo de Sistemas de Reconocimiento

El primer paso para construir sistemas efectivos para reconocer animales y sus comportamientos es tener un conjunto de datos bien estructurado. Muchos conjuntos de datos existentes tienen limitaciones, como cubrir solo algunas especies o carecer de anotaciones conductuales específicas. Uno de los conjuntos de datos más grandes hasta ahora, llamado "Reino Animal", contiene solo alrededor de 4,310 videos, lo que no es suficiente para estudios más grandes. Se centra en acciones básicas, como bostezar o nadar, en lugar de los comportamientos más complejos que son cruciales para la gestión de la vida silvestre.

MammalNet, en contraste, enfatiza una comprensión más amplia de los comportamientos animales. Clasifica a los animales utilizando taxonomías científicas y proporciona anotaciones detalladas para comportamientos que los investigadores han estudiado antes.

Cómo se Construye MammalNet

MammalNet ofrece una mirada completa a los mamíferos asegurando el reconocimiento preciso de especies y sus acciones. Para lograr esto, se creó una lista diversa y científicamente relevante de mamíferos a partir de información de fuentes confiables.

El conjunto de datos se centra en 12 comportamientos clave que son relevantes para entender las acciones de los mamíferos. Estos comportamientos incluyen buscar comida, apareamiento, acicalamiento, peleas y más. Cada comportamiento se define como una actividad central compuesta de varias acciones más pequeñas.

Recoger videos de calidad es esencial. Los videos se obtuvieron de plataformas como YouTube usando búsquedas por palabras clave para cada mamífero y sus acciones correspondientes. Después de reunir un gran número de videos, se aplicó un riguroso proceso de filtrado para asegurarse de que cumplieran con los estándares de calidad del conjunto de datos. Trabajadores externos ayudaron a verificar el contenido de estos videos, asegurando que representaran con precisión a los animales y comportamientos de interés.

Análisis y Clasificación de Videos

Los videos en MammalNet están anotados para resaltar cuándo ocurren ciertos comportamientos, permitiendo a los investigadores analizar segmentos de video de manera eficiente. Cada video está etiquetado con marcas de tiempo específicas que indican el inicio y el final del comportamiento observado. Esto permite que los científicos se concentren en las partes relevantes de cada video sin tener que revisar horas de grabaciones innecesarias.

MammalNet categoriza a los animales según el nivel taxonómico más bajo y confiable en lugar de solo al nivel de especie. Esto se debe a que identificar animales a un nivel preciso puede ser complicado, incluso para expertos, así que una clasificación más amplia ayuda a asegurar la precisión en el reconocimiento de especies.

El conjunto de datos final consiste en 18,346 videos que representan 173 categorías de mamíferos y 12 comportamientos distintos. Los videos varían en longitud, con una duración promedio de 77 segundos después de recortarlos. Más de la mitad de los videos son en alta definición, lo que hace que los datos sean aún más útiles para la investigación.

Hallazgos Experimentales

MammalNet permite a los investigadores abordar varias tareas relacionadas con el reconocimiento animal y la comprensión del comportamiento. Se utilizó el conjunto de datos para evaluar varios modelos avanzados que han sido efectivos en el reconocimiento de acciones humanas, adaptándolos para trabajar con el comportamiento animal.

Los experimentos mostraron que reconocer animales y sus comportamientos sigue siendo un gran desafío en el campo. Incluso con los modelos más avanzados, lograr un reconocimiento preciso para animales que se observan con menos frecuencia es difícil. Sin embargo, los investigadores encontraron que el conocimiento adquirido al observar animales familiares puede ayudar a predecir las acciones de especies no vistas, especialmente si comparten rasgos similares.

Conclusión

MammalNet llena un vacío crítico en el panorama actual de la investigación del comportamiento animal. Al proporcionar un conjunto de datos a gran escala y bien estructurado, sienta las bases para mejorar el reconocimiento automático de mamíferos y sus comportamientos. Este avance tiene el potencial de mejorar significativamente los esfuerzos de conservación y la investigación ecológica, especialmente en un momento en que la biodiversidad está en peligro.

Al hacer que el conjunto de datos esté disponible para la comunidad de investigación, se fomenta una mayor innovación y estudio sobre los comportamientos animales, beneficiando en última instancia las prácticas de gestión de vida silvestre y nuestra comprensión de los ecosistemas. Esta base puede conducir a decisiones más informadas que ayudarán a proteger y conservar la diversa vida animal en nuestro planeta.

Fuente original

Título: MammalNet: A Large-scale Video Benchmark for Mammal Recognition and Behavior Understanding

Resumen: Monitoring animal behavior can facilitate conservation efforts by providing key insights into wildlife health, population status, and ecosystem function. Automatic recognition of animals and their behaviors is critical for capitalizing on the large unlabeled datasets generated by modern video devices and for accelerating monitoring efforts at scale. However, the development of automated recognition systems is currently hindered by a lack of appropriately labeled datasets. Existing video datasets 1) do not classify animals according to established biological taxonomies; 2) are too small to facilitate large-scale behavioral studies and are often limited to a single species; and 3) do not feature temporally localized annotations and therefore do not facilitate localization of targeted behaviors within longer video sequences. Thus, we propose MammalNet, a new large-scale animal behavior dataset with taxonomy-guided annotations of mammals and their common behaviors. MammalNet contains over 18K videos totaling 539 hours, which is ~10 times larger than the largest existing animal behavior dataset. It covers 17 orders, 69 families, and 173 mammal categories for animal categorization and captures 12 high-level animal behaviors that received focus in previous animal behavior studies. We establish three benchmarks on MammalNet: standard animal and behavior recognition, compositional low-shot animal and behavior recognition, and behavior detection. Our dataset and code have been made available at: https://mammal-net.github.io.

Autores: Jun Chen, Ming Hu, Darren J. Coker, Michael L. Berumen, Blair Costelloe, Sara Beery, Anna Rohrbach, Mohamed Elhoseiny

Última actualización: 2023-06-01 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2306.00576

Fuente PDF: https://arxiv.org/pdf/2306.00576

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares