Automazione nella prima selezione dei dati sismici
Uno studio rivela i benefici del deep learning nell'analisi sismica.
― 6 leggere min
La scelta dei primi break è un passaggio importante nell'analisi dei dati sismici. Aiuta a individuare il primo arrivo delle onde sismiche, che può fornire informazioni preziose sul sottosuolo terrestre. Però, identificare manualmente questi primi break può essere lento e soggettivo, spesso portando a risultati diversi a seconda dell'esperienza e delle abilità dell'operatore. Con il miglioramento della tecnologia sismica, la quantità di dati raccolti cresce, rendendo le soluzioni automatizzate essenziali per stare al passo con le esigenze di elaborazione.
La Necessità di Automazione
Tradizionalmente, la scelta dei primi break coinvolge un esperto formato che analizza i dati sismici a mano. Questo processo può richiedere molto tempo e può occupare fino al trenta percento del tempo totale di elaborazione. Inoltre, essendo questo compito soggetto all'interpretazione umana, diversi esperti possono arrivare a conclusioni diverse. Per affrontare queste sfide, i ricercatori hanno introdotto diversi metodi per automatizzare il processo di scelta dei primi break. In generale, questi possono essere suddivisi in tre categorie principali: metodi basati sulla cross-correlazione, metodi basati su rapporti di energia e metodi che usano reti neurali.
Metodi Attuali di Scelta dei Primi Break
Metodi Basati sulla Cross-Correlazione: Questa tecnica guarda ai tracciati adiacenti per trovare somiglianze e determinare quando si verifica il primo break. Anche se efficace, ha difficoltà con dati che presentano lacune o tracciati morti.
Metodi Basati sull’Energia: Un approccio popolare è il metodo STA-LTA (short-term average over long-term average). Analizza l'energia del segnale in diverse finestre temporali. Tuttavia, la sua precisione tende a calare in ambienti rumorosi.
Metodi Basati su Reti Neurali: Con i progressi nella tecnologia, le reti neurali, in particolare le reti neurali convoluzionali (CNN), hanno cominciato a mostrare promesse. Queste reti vengono addestrate per identificare schemi nei dati sismici, facilitando così una rilevazione più accurata dei primi break. Tuttavia, creare un set di addestramento efficace per queste reti può essere anch'esso difficile e richiedere tempo.
Il Ruolo del Deep Learning
Le tecniche di deep learning, in particolare l'Architettura U-Net, sono state utilizzate per affrontare il problema della scelta dei primi break. Considerando il compito come un problema di segmentazione, i ricercatori possono progettare sistemi per differenziare tra aree con e senza primi break. U-Net, con la sua capacità di analizzare dati spaziali, si presenta come un'opzione forte per questo.
Migliorare l'Efficienza dell'Addestramento
L'efficacia dei metodi di deep learning dipende significativamente dalla dimensione e dalla qualità del dataset di addestramento. Per migliorare la precisione riducendo la quantità di dati richiesti, i ricercatori hanno esplorato l'uso del transfer learning. Questa tecnica prende un modello che è stato addestrato su un dataset e lo adatta per un nuovo compito, ma correlato. Per far funzionare questo per la scelta dei primi break, modelli pre-addestrati su grandi dataset possono fornire un ottimo punto di partenza, consentendo ai ricercatori di affinare il modello con dataset più piccoli e specifici.
Flusso di Lavoro per la Scelta Automatica dei Primi Break
Nel flusso di lavoro proposto, il processo inizia selezionando una piccola percentuale di scatti sismici che verranno scelti manualmente da un esperto. Questo piccolo set di addestramento può consistere di circa 5-10 percento degli scatti totali. Una volta identificati questi break, la Rete Neurale viene affinata in base a questi dati. Successivamente, il modello può essere utilizzato per scegliere automaticamente i primi break per i restanti dati sismici, riducendo significativamente il tempo e lo sforzo richiesti.
Preparazione dei Dati
Preparare i dati per l'addestramento è un passaggio cruciale. Include il ritaglio degli scatti sismici per garantire una distribuzione uniforme tra segmenti con primi break e quelli senza. Questo aiuta a bilanciare i dati e assicura che il modello apprenda in modo efficace. Tecniche di aumento dei dati, come il ridimensionamento e la suddivisione degli scatti in piccole porzioni, possono anch'esse essere impiegate per creare un dataset più diversificato per l'addestramento.
Architettura della Rete
La rete neurale utilizzata in questo flusso di lavoro è basata sull'architettura U-Net. Questa rete completamente convoluzionale struttura i dati attraverso un framework encoder-decoder, utilizzando lunghe connessioni skip per mantenere caratteristiche importanti durante il processo di addestramento. L'encoder cattura caratteristiche di alto livello mentre il decoder le ricostruisce in una segmentazione finale.
Funzione di Perdita e Ottimizzazione
Per addestrare la rete, una funzione di perdita cross-entropy valuta quanto bene le previsioni della rete corrispondono alle effettive posizioni dei primi break. Il metodo di ottimizzazione Adam viene applicato per regolare i parametri della rete, migliorando la sua capacità di prevedere i primi break con precisione.
Strategie di Inizializzazione
Quando si addestra una rete neurale, il modo in cui il modello è inizializzato può influenzare notevolmente le performance. In questo studio, sono state testate due diverse strategie: utilizzare valori assegnati casualmente e utilizzare pesi da una rete pre-addestrata. Quest'ultimo approccio porta spesso a risultati migliori, specialmente in compiti complessi come la scelta dei primi break.
Sperimentazione con Diversi Dataset
Sono stati condotti vari esperimenti utilizzando diversi dataset per valutare le performance del modello affinato in diverse condizioni. Il primo dataset conteneva dati puliti con un alto rapporto segnale-rumore (SNR), mentre il secondo set includeva livelli più elevati di rumore. I risultati hanno mostrato che il modello pre-addestrato ha costantemente superato i modelli inizializzati casualmente, specialmente in dataset rumorosi.
Il terzo dataset ha creato un dataset generale più ampio combinando dati provenienti da diversi progetti. Sebbene questo approccio abbia offerto più esempi di addestramento, ha evidenziato l'importanza della qualità del dataset. Combinare dataset diversi può portare a una diminuzione della precisione se non fatto con attenzione.
Risultati della Stima del Modello di Velocità
Una volta identificati i primi break, sono stati utilizzati per creare modelli di velocità del sottosuolo attraverso un processo chiamato inversione del tempo di viaggio. L'accuratezza di questi modelli è stata valutata in base a quanto bene si allineavano con i modelli creati da break identificati manualmente. I risultati hanno rivelato che i modelli derivati dalle previsioni della rete pre-addestrata erano più accurati di quelli provenienti da reti inizializzate casualmente, in particolare in contesti geologici complessi.
Questo dimostra che i metodi automatizzati di scelta dei primi break possono portare a notevoli miglioramenti nel risparmio di tempo e nella precisione, specialmente quando vengono impiegati dataset di addestramento ben preparati.
Conclusione
Questo studio ha dimostrato che l'impiego di tecniche di deep learning per la scelta automatica dei primi break è non solo pratico, ma può risultare in miglioramenti misurabili nell'efficienza. La combinazione di transfer learning con una strategia di preparazione dei dati intelligente consente un'analisi sismica accurata riducendo al minimo la dipendenza da dataset estesi.
Con l'evoluzione della tecnologia dietro la raccolta di dati sismici, tecniche come quelle descritte qui giocheranno un ruolo fondamentale nel rendere l'elaborazione dei dati più rapida, più economica e più precisa. Automatizzare il processo di scelta dei primi break aiuta i geofisici e altri esperti a concentrarsi sull'interpretazione dei risultati piuttosto che a impantanarsi nell'analisi manuale dei dati.
In sintesi, integrare l'intelligenza artificiale con pratiche sismiche consolidate porta a innovazioni che possono migliorare significativamente la nostra comprensione della terra sotto i nostri piedi, consentendo una migliore gestione delle risorse, valutazioni ambientali e esplorazioni geologiche.
Titolo: A fine-tuning workflow for automatic first-break picking with deep learning
Estratto: First-break picking is an essential step in seismic data processing. First arrivals should be picked by an expert. This is a time-consuming procedure and subjective to a certain degree, leading to different results for different operators. In this study, we used a U-Net architecture with residual blocks to perform automatic first-break picking based on deep learning. Focusing on the effects of weight initialization on this process, we conduct this research by using the weights of a pretrained network that is used for object detection on the ImageNet dataset. The efficiency of the proposed method is tested on two real datasets. For both datasets, we pick manually the first breaks for less than 10% of the seismic shots. The pretrained network is fine-tuned on the picked shots and the rest of the shots are automatically picked by the neural network. It is shown that this strategy allows to reduce the size of the training set, requiring fine tuning with only a few picked shots per survey. Using random weights and more training epochs can lead to a lower training loss, but such a strategy leads to overfitting as the test error is higher than the one of the pretrained network. We also assess the possibility of using a general dataset by training a network with data from three different projects that are acquired with different equipment and at different locations. This study shows that if the general dataset is created carefully it can lead to more accurate first-break picking, otherwise the general dataset can decrease the accuracy. Focusing on near-surface geophysics, we perform traveltime tomography and compare the inverted velocity models based on different first-break picking methodologies. The results of the inversion show that the first breaks obtained by the pretrained network lead to a velocity model that is closer to the one obtained from the inversion of expert-picked first breaks.
Autori: Amir Mardan, Martin Blouin, Gabriel Fabien-Ouellet, Bernard-Giroux, Christophe Vergniault, Jeremy Gendreau
Ultimo aggiornamento: 2024-04-10 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2404.07400
Fonte PDF: https://arxiv.org/pdf/2404.07400
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.