Mejorando las estimaciones de poblaciones de peces con machine learning
Un nuevo modelo mejora la predicción de las poblaciones de peces utilizando técnicas de aprendizaje automático.
― 7 minilectura
Tabla de contenidos
Evaluar las poblaciones de peces es súper importante para manejar la pesca de manera sostenible. Ahora mismo, hay Modelos estadísticos que se usan para estimar varios detalles sobre las poblaciones de peces, como cuántos peces jóvenes entran a la población o el peso total de los peces en reproducción. Sin embargo, estos modelos a veces no funcionan bien, especialmente cuando los ambientes de los peces están cambiando por el calentamiento global y otras actividades humanas.
Este artículo analiza cómo el Aprendizaje automático puede ayudar a mejorar las estimaciones de los detalles de las poblaciones de peces. Sugerimos un nuevo modelo que combina métodos estadísticos tradicionales con técnicas de aprendizaje automático, específicamente un método llamado árboles de gradiente mejorados. Este nuevo modelo toma las estimaciones iniciales del método tradicional y mejora su precisión con el aprendizaje automático. Probamos este modelo en cinco poblaciones de peces diferentes y encontramos que normalmente proporciona mejores pronósticos para parámetros importantes de las poblaciones.
Antecedentes
Conocer el estado de las poblaciones de peces es vital para tomar decisiones informadas sobre cuánto pez se puede pescar sin dañar las poblaciones futuras. Los mejores modelos para evaluar las poblaciones de peces se llaman modelos de estado-espacio estructurados por edad. Estos modelos consideran las edades de los peces, su crecimiento y cuántos sobreviven o reproducen cada año.
Estos modelos usan datos diversos como encuestas y registros de captura para hacer sus estimaciones. Sin embargo, tienen limitaciones porque a menudo dependen de suposiciones que pueden no ser siempre precisas, especialmente cuando las condiciones ambientales cambian. Por ejemplo, ha habido casos donde los modelos tradicionales han tenido problemas. Un ejemplo notable es el bacalao del Báltico oriental, donde las evaluaciones cuantitativas no han sido posibles desde 2014 debido a condiciones ambientales cambiantes que los modelos no podían tener en cuenta.
Con los cambios actuales en los ecosistemas debido al cambio climático, hay una necesidad de modelos que sean flexibles y que puedan adaptarse a nueva información. Ahí es donde entra el aprendizaje automático. El aprendizaje automático puede identificar patrones complejos en los datos que los modelos tradicionales podrían pasar por alto. Los modelos actuales a menudo se enfocan en cómo los Datos Ambientales impactan los parámetros de las poblaciones, pero lo hacen usando información que no está disponible en el momento de hacer pronósticos.
Enfoque Propuesto
Proponemos un nuevo método que solo usa datos disponibles en el momento en que se hacen los pronósticos, lo que lo hace útil en situaciones prácticas. Nuestro enfoque consiste en dos pasos. Primero, ajustamos un modelo estadístico tradicional a los datos disponibles. Esto proporciona una estimación inicial de los parámetros de la población. Luego, aplicamos un modelo de aprendizaje automático a esta estimación inicial para hacer una corrección.
Este método es beneficioso porque combina el conocimiento del dominio del modelo estadístico tradicional con las capacidades basadas en datos del aprendizaje automático.
Probamos este nuevo modelo en cinco poblaciones de peces de diferentes regiones, incluyendo el Mar Báltico y el Mar del Norte. Nuestro objetivo es ver si este enfoque puede reducir errores en los pronósticos de las poblaciones de peces.
Evaluación Experimental
Realizamos experimentos en cinco poblaciones de peces diferentes, que varían en cuanto a su estado y los desafíos que enfrentan. Estas poblaciones incluyen:
- Bacalao del Báltico occidental
- Merluza del Mar del Norte
- Lenguado en el Mar Céltico
- Eglefino en aguas de las Islas Feroe
- Bacalao en el Mar de Noruega y Barents.
Los principales parámetros en los que nos enfocamos son el Reclutamiento (el número de peces nuevos que entran a la población) y la biomasa de reproductores (el peso total de los peces en reproducción). Evaluamos nuestro método comparándolo con el modelo estadístico tradicional.
Para evaluar el rendimiento, observamos el error cuadrático medio (RMSE) y el coeficiente de determinación (R²), que nos dicen qué tan bien nuestras predicciones coinciden con los datos reales.
En nuestras pruebas, el modelo de aprendizaje automático mejoró los pronósticos de reclutamiento y biomasa de reproductores en la mayoría de los casos en comparación con el modelo tradicional. Aunque predecir el reclutamiento sigue siendo una tarea difícil, nuestros resultados muestran mejoras prometedoras, especialmente en la estimación de la biomasa de reproductores.
Resultados
Las comparaciones para la predicción del reclutamiento revelan que nuestro modelo superó al método tradicional en términos de errores, aunque todavía hay una correlación baja entre los números de reclutamiento predicciones y reales para todas las poblaciones. Por otro lado, los pronósticos de biomasa de reproductores mostraron mejores resultados en general, con mejoras consistentes entre las poblaciones.
Nuestro modelo de aprendizaje automático destacó particularmente con el bacalao del Báltico occidental, mejorando significativamente la capacidad de pronóstico desde una situación donde no se explicaba ninguna variación hasta cierto grado de explicación. Aunque las mejoras en otras poblaciones no fueron tan dramáticas, todavía fueron consistentemente positivas.
Al observar las estimaciones del año actual, que suelen ser más fáciles porque dependen de datos más relevantes directamente, el modelo de aprendizaje automático mejoró el rendimiento en la estimación de reclutamiento y biomasa de reproductores para varias poblaciones.
Importancia de las Características
Para entender las razones detrás del rendimiento del modelo, examinamos cuáles inputs fueron más importantes. Encontramos que para estimar el reclutamiento, las observaciones y las abundancias estimadas de peces jóvenes fueron los inputs más significativos. Esto tiene sentido porque el reclutamiento se relaciona directamente con el número de peces jóvenes.
Por otro lado, para estimar la biomasa de reproductores, el modelo dependió en gran medida de la evaluación SAM de la biomasa de reproductores en sí. Esto indica que el modelo tradicional proporcionó un input confiable para esta tarea específica.
Trabajo Relacionado
El aprendizaje automático se está aplicando cada vez más en el modelado ecológico, especialmente para entender sistemas complejos como las poblaciones de peces. Aunque muchos estudios han utilizado el aprendizaje automático para analizar cómo diferentes factores ambientales afectan a las poblaciones de peces, a menudo trabajan con datos que solo están disponibles después de que ocurren los eventos.
Nuestro enfoque se destaca porque nos enfocamos en usar solo los datos que están disponibles en el momento de la evaluación, haciéndolo práctico para necesidades de pronóstico en el mundo real. A diferencia de investigaciones previas, no nos involucramos en la optimización de hiperparámetros para ajustar nuestro modelo a datos históricos, lo que puede producir evaluaciones demasiado optimistas.
Discusión y Conclusión
En resumen, hemos introducido un nuevo método que combina modelos estadísticos tradicionales con aprendizaje automático para pronosticar parámetros de poblaciones de peces. Si bien nuestro enfoque ha mostrado una mejor precisión sobre los métodos tradicionales, hay limitaciones. La escasez de datos y la ausencia de mediciones reales de las poblaciones hacen complicado sacar conclusiones firmes.
Los estudios futuros deberían explorar si nuestro modelo sigue funcionando bien bajo diferentes condiciones o para diferentes poblaciones, particularmente a medida que los ecosistemas continúan cambiando. También debemos investigar métodos que puedan cuantificar y gestionar la incertidumbre alrededor de estos pronósticos, ya que esto es crucial para una gestión efectiva de las pesquerías.
Al integrar datos ambientales y mejorar el enfoque actual con nuevas características, podemos aumentar aún más la precisión de las predicciones y contribuir a una mejor gestión de las poblaciones de peces.
Título: Towards Machine Learning-based Fish Stock Assessment
Resumen: The accurate assessment of fish stocks is crucial for sustainable fisheries management. However, existing statistical stock assessment models can have low forecast performance of relevant stock parameters like recruitment or spawning stock biomass, especially in ecosystems that are changing due to global warming and other anthropogenic stressors. In this paper, we investigate the use of machine learning models to improve the estimation and forecast of such stock parameters. We propose a hybrid model that combines classical statistical stock assessment models with supervised ML, specifically gradient boosted trees. Our hybrid model leverages the initial estimate provided by the classical model and uses the ML model to make a post-hoc correction to improve accuracy. We experiment with five different stocks and find that the forecast accuracy of recruitment and spawning stock biomass improves considerably in most cases.
Autores: Stefan Lüdtke, Maria E. Pierce
Última actualización: 2023-08-07 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2308.03403
Fuente PDF: https://arxiv.org/pdf/2308.03403
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.