Migliorare le stime delle risorse ittiche con il machine learning
Un nuovo modello migliora le previsioni delle scorte di pesce usando tecniche di apprendimento automatico.
― 6 leggere min
Indice
Valutare gli stock di pesci è davvero importante per gestire la pesca in modo da mantenerla sostenibile. Adesso ci sono Modelli Statistici usati per stimare vari dettagli sugli stock di pesci, come il numero di giovani pesci che entrano nella popolazione o il peso totale dei pesci in riproduzione. Però, a volte questi modelli non funzionano bene, specialmente quando gli ambienti dei pesci cambiano a causa del riscaldamento globale e di altre attività umane.
Questo articolo esplora come il machine learning può migliorare le stime sui dettagli degli stock di pesci. Proponiamo un nuovo modello che unisce i metodi statistici tradizionali con tecniche di machine learning, in particolare un metodo chiamato gradient boosted trees. Questo nuovo modello prende le stime iniziali dal metodo tradizionale e ne migliora l'accuratezza con il machine learning. Testiamo questo modello su cinque differenti stock di pesci e scopriamo che di solito fornisce previsioni migliori per parametri di stock importanti.
Contesto
Sapere lo stato degli stock di pesci è fondamentale per prendere decisioni informate su quanto pesce possa essere pescato senza danneggiare le popolazioni future. I migliori modelli per valutare gli stock di pesci sono chiamati modelli di stato spaziale strutturati per età. Questi modelli considerano le età dei pesci, la loro crescita e quanti sopravvivono o si riproducono ogni anno.
Usano vari dati come sondaggi e registri di cattura per fare le loro stime. Però, hanno delle limitazioni perché spesso si basano su assunzioni che non sempre possono risultare accurate, specialmente quando le condizioni ambientali cambiano. Per esempio, ci sono stati casi in cui i modelli tradizionali hanno avuto difficoltà. Un esempio noto è il merluzzo del Baltico orientale, dove le valutazioni quantitative non sono state possibili dal 2014 a causa di condizioni ambientali che i modelli non riuscivano a considerare.
Con i cambiamenti degli ecosistemi dovuti ai cambiamenti climatici, c'è bisogno di modelli che siano flessibili e possano adattarsi a nuove informazioni. Qui entra in gioco il machine learning. Questo tipo di apprendimento può identificare schemi complessi nei dati che i modelli tradizionali potrebbero perdere. I modelli attuali spesso si concentrano su come i Dati ambientali influenzano i parametri degli stock, ma lo fanno usando informazioni che non sono disponibili al momento della previsione.
Approccio Proposto
Proponiamo un nuovo metodo che usa solo dati disponibili al momento in cui si fanno le previsioni, rendendolo utile in situazioni pratiche. Il nostro approccio consiste in due fasi. Prima adattiamo un modello statistico tradizionale ai dati disponibili. Questo fornisce un stima iniziale dei parametri di stock. Poi, applichiamo un modello di machine learning a questa stima iniziale per fare una correzione.
Questo metodo è utile perché combina la conoscenza del settore dal modello statistico tradizionale con le capacità basate sui dati del machine learning.
Testiamo questo nuovo modello su cinque diversi stock di pesci provenienti da varie regioni, inclusi il Mar Baltico e il Mare del Nord. Il nostro obiettivo è vedere se questo approccio può ridurre gli errori nelle previsioni degli stock di pesci.
Valutazione Sperimentale
Abbiamo condotto esperimenti su cinque diversi stock di pesci, ognuno con uno stato e delle sfide diverse. Questi stock includono:
- Merluzzo del Baltico occidentale
- Pescatrice del Mare del Nord
- Sollievo nel Mare Celtico
- Lingua nelle acque delle Fær Øer
- Merluzzo nel Mare di Norvegia e nel Mare di Barents.
I principali parametri su cui ci concentriamo sono il Reclutamento (il numero di nuovi pesci che entrano nella popolazione) e la biomassa dello stock di riproduzione (il peso totale dei pesci in riproduzione). Valutiamo il nostro metodo confrontandolo con il modello statistico tradizionale.
Per valutare le prestazioni, guardiamo all'errore quadratico medio (RMSE) e al coefficiente di determinazione (R²), che ci dicono quanto bene le nostre previsioni corrispondono ai dati effettivi.
Nei nostri test, il modello di machine learning ha migliorato le previsioni per il reclutamento e la biomassa dello stock di riproduzione nella maggior parte dei casi rispetto al modello tradizionale. Anche se prevedere il reclutamento è ancora un compito difficile, i nostri risultati mostrano miglioramenti promettenti, specialmente nella stima della biomassa dello stock di riproduzione.
Risultati
I confronti per le previsioni di reclutamento rivelano che il nostro modello ha superato il metodo tradizionale in termini di errore, anche se c'è ancora una bassa correlazione tra i numeri di reclutamento previsti e quelli effettivi per tutti gli stock. Al contrario, le previsioni della biomassa dello stock di riproduzione hanno mostrato risultati migliori in generale, con miglioramenti costanti tra gli stock.
Il nostro modello di machine learning ha particolarmente brillato con il merluzzo del Baltico occidentale, migliorando significativamente la capacità di previsione da una situazione in cui non veniva spiegata alcuna variazione a un certo grado di spiegazione. Anche se i miglioramenti in altri stock non erano così drammatici, erano comunque costantemente positivi.
Guardando alle stime dell'anno corrente, che sono tipicamente più facili perché si basano su dati più direttamente rilevanti, il modello di machine learning ha migliorato le prestazioni nella stima del reclutamento e della biomassa dello stock di riproduzione per diversi stock.
Importanza delle Caratteristiche
Per capire le ragioni dietro le prestazioni del modello, abbiamo esaminato quali input erano più importanti. Abbiamo scoperto che per stimare il reclutamento, le osservazioni e le abbondanze stimate di giovani pesci erano gli input più significativi. Ha senso perché il reclutamento è direttamente correlato al numero di giovani pesci.
Al contrario, per stimare la biomassa dello stock di riproduzione, il modello si è basato molto sulla valutazione SAM della biomassa dello stock di riproduzione stessa. Questo indica che il modello tradizionale forniva un input affidabile per questo specifico compito.
Lavoro Correlato
Il machine learning viene sempre più applicato nel modeling ecologico, specialmente per comprendere sistemi complessi come gli stock di pesci. Anche se molti studi hanno utilizzato il machine learning per analizzare come diversi fattori ambientali influenzino le popolazioni di pesci, spesso lavorano con dati disponibili solo ex post.
Il nostro approccio si distingue perché ci concentriamo sull'uso solo dei dati disponibili al momento della valutazione, rendendolo pratico per le esigenze di previsione nel mondo reale. A differenza della ricerca precedente, non ci impegniamo nell'ottimizzazione dei parametri per adattare il nostro modello a dati storici, il che può produrre valutazioni eccessivamente ottimistiche.
Discussione e Conclusione
In sintesi, abbiamo introdotto un nuovo metodo che combina modelli statistici tradizionali con machine learning per prevedere i parametri degli stock di pesci. Anche se il nostro approccio ha mostrato maggiore accuratezza rispetto ai metodi tradizionali, ci sono delle limitazioni. La scarsità di dati e l'assenza di misurazioni veritiere degli stock rendono difficile trarre conclusioni ferme.
I futuri studi dovrebbero esplorare se il nostro modello continua a funzionare bene in diverse condizioni o per diversi stock, specialmente man mano che gli ecosistemi continuano a cambiare. Dobbiamo anche esaminare metodi che possano quantificare e gestire l'incertezza attorno a queste previsioni, poiché questo è cruciale per una gestione efficace della pesca.
Integrando i dati ambientali e migliorando l'approccio attuale con nuove caratteristiche, possiamo ulteriormente migliorare l'accuratezza delle previsioni e contribuire a una migliore gestione degli stock di pesci.
Titolo: Towards Machine Learning-based Fish Stock Assessment
Estratto: The accurate assessment of fish stocks is crucial for sustainable fisheries management. However, existing statistical stock assessment models can have low forecast performance of relevant stock parameters like recruitment or spawning stock biomass, especially in ecosystems that are changing due to global warming and other anthropogenic stressors. In this paper, we investigate the use of machine learning models to improve the estimation and forecast of such stock parameters. We propose a hybrid model that combines classical statistical stock assessment models with supervised ML, specifically gradient boosted trees. Our hybrid model leverages the initial estimate provided by the classical model and uses the ML model to make a post-hoc correction to improve accuracy. We experiment with five different stocks and find that the forecast accuracy of recruitment and spawning stock biomass improves considerably in most cases.
Autori: Stefan Lüdtke, Maria E. Pierce
Ultimo aggiornamento: 2023-08-07 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2308.03403
Fonte PDF: https://arxiv.org/pdf/2308.03403
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.