Modelizzare la Visione dei Topi: Idee dall'Apprendimento Profondo
Uno studio mostra come diversi ambienti influenzano i modelli di elaborazione visiva nei topi.
Bryan P Tripp, P. Torabian, Y. Chen, C. Ng, S. Mihalas, M. Buice, S. Bakhtiari
― 8 leggere min
Indice
Le Reti Neurali Convoluzionali Profonde (CNN) sono strumenti usati in informatica che possono simulare come il cervello elabora le informazioni visive. Queste reti hanno strutture simili alla Corteccia visiva negli animali, che è la parte del cervello responsabile della vista. I ricercatori puntano a creare modelli accurati della funzione cerebrale capendo come diverse caratteristiche della rete possano migliorare queste previsioni.
Due aspetti principali da considerare sono la struttura della rete e gli obiettivi fissati durante l'addestramento. Le reti possono essere adattate per riflettere meglio le proprietà dell'attività cerebrale. Alcuni ricercatori hanno modificato le reti per imitare i processi presenti nelle neuroscienze e per rendere le risposte di queste reti più realistiche.
Anche il tipo di input visivo fornito durante l'addestramento gioca un ruolo importante. Ad esempio, quando le reti vengono addestrate con video di oggetti in movimento, riescono a corrispondere meglio all'attività in specifiche parti del cervello responsabili della rilevazione del movimento. Inoltre, quando l'input ha dettagli che corrispondono alle capacità visive dell'animale in studio – come usare risoluzioni video adatte ai topi piuttosto che agli umani – la rete si comporta meglio nel simulare l'attività del cervello del topo.
In questo studio, i ricercatori hanno usato un modello chiamato MouseNet, costruito per assomigliare alla corteccia visiva del topo. Hanno addestrato questo modello usando un metodo di apprendimento auto-supervisionato. Il team ha variato diversi aspetti dei video utilizzati per l'addestramento e ha osservato come queste variazioni influenzassero quanto bene il modello corrispondesse all'attività cerebrale reale. Hanno creato video mostrando la prospettiva di un topo in ambienti naturali (come prati) e in ambienti artificiali (come astronavi) e hanno studiato come queste differenze impattassero sulle performance del modello.
Panoramica della Metodologia
Per portare avanti questo studio, i ricercatori hanno creato un agente topo virtuale in un motore di sviluppo di giochi chiamato Unity. Questo agente aveva due telecamere impostate in modo simile agli occhi di un topo, permettendogli di catturare un campo visivo e una risoluzione che corrispondessero a ciò che un topo vedrebbe. Il team ha registrato video che l'agente produceva mentre navigava in vari ambienti, usando queste registrazioni per addestrare la loro rete neurale profonda, MouseNet.
Hanno generato otto diversi set di dati per l'addestramento. Ogni set di dati era o naturalistico o non-naturalistico basato su tre categorie: l'ambiente, le proprietà ottiche degli occhi del topo e come il topo si muoveva attraverso l'ambiente. Lo studio ha trovato che queste differenze influenzavano significativamente quanto bene l'attività del modello corrispondesse a quella del cervello del topo.
Tra i tre fattori studiati, l'ambiente ha avuto l'influenza più grande e costante. L'attività cerebrale più simile è stata osservata quando tutte e tre le condizioni (ambiente, ottica e movimento) erano naturalistiche. Interessante notare che, mentre il movimento naturalistico generalmente riduceva la somiglianza complessiva con il cervello, migliorava la somiglianza per una specifica area cerebrale nota per elaborare il movimento.
I ricercatori cercavano di capire quali differenze specifiche tra ambienti naturali e non naturali contribuissero a varie somiglianze nell'attività cerebrale. Inizialmente pensavano che proprietà statistiche più semplici come frequenza, colore, orientamento e correlazioni temporali potessero spiegare le differenze. Tuttavia, test usando ambienti più astratti hanno mostrato che quelle proprietà non spiegavano completamente le differenze di somiglianza cerebrale osservate tra i due tipi di ambienti.
Modello della Corteccia Visiva
Il modello MouseNet è progettato per riflettere da vicino l'anatomia della corteccia visiva del topo. Include diversi strati che corrispondono a parti specifiche della corteccia visiva. Il design del modello si basa su dati neuroanatomici disponibili, assicurando che la struttura della rete assomigli ai veri percorsi di elaborazione visiva trovati nei topi.
Set di Dati per l'Addestramento
Utilizzando Unity, i ricercatori hanno creato un agente topo che poteva raccogliere registrazioni video in vari ambienti. Hanno progettato due telecamere, che assomigliavano agli occhi dei topi, per catturare video. I video sono stati registrati a una risoluzione che corrispondeva alla visione del topo e a una frequenza di fotogrammi specifica.
Il team ha prodotto versioni sia naturali che non naturali di tre fattori che influenzano gli stimoli visivi: l'ambiente, l'ottica degli occhi del topo, e i modelli di movimento del topo. Sperimentando con varie combinazioni, hanno creato otto dataset unici che rappresentano diverse condizioni di addestramento.
L'ambiente naturale includeva elementi come erba, alberi e rocce, mentre l'impostazione artificiale assomigliava a un'astronave con muri metallici e luci brillanti. Le proprietà visive di come ciascun ambiente era rappresentato sono state analizzate criticamente per capire il loro impatto sulla performance del modello.
Movimento del Topo
I ricercatori hanno sviluppato due modelli di movimento distinti per l'agente topo. Il modello artificiale includeva movimenti generali in avanti e curve semplici, mentre il modello naturalistico si basava sui dati di movimento reali di un topo in movimento libero. Questi dati sono stati raccolti in un ambiente controllato e fornivano rappresentazioni più realistiche del movimento del topo, consentendo ai ricercatori di creare traiettorie diversificate e complesse.
Il team ha utilizzato un approccio di modellazione specifico per generare traiettorie di movimento che assomigliassero a come i topi normalmente navigano nei loro ambienti. Assicurandosi che il modello catturasse schemi di movimento più naturali e complessi, i ricercatori puntavano a migliorare la capacità del modello di simulare l'attività cerebrale reale.
Ambienti Sintetici
Per indagare ulteriormente le differenze osservate nella somiglianza cerebrale, i ricercatori hanno creato ambienti sintetici composti interamente da forme geometriche semplici. Puntavano a far corrispondere questi ambienti sintetici agli ambienti naturali e artificiali basati su proprietà statistiche chiave.
Utilizzando questo approccio controllato, i ricercatori sono stati in grado di analizzare sistematicamente come diverse caratteristiche visive influenzassero la somiglianza dell'attività cerebrale. Questa indagine mirava a chiarire se caratteristiche come la frequenza spaziale, la distribuzione del colore e l'orientamento potessero aiutare a spiegare perché l'ambiente naturale si comportasse meglio nell'allinearsi all'attività cerebrale.
Procedura di Addestramento
L'addestramento di MouseNet è avvenuto utilizzando una tecnica nota come apprendimento auto-supervisionato. Fondamentalmente, la rete impara a prevedere i fotogrammi video futuri basandosi sui fotogrammi precedenti che ha visto. Questo metodo permette al modello di sviluppare una comprensione profonda delle strutture nascoste all'interno dei dati di input.
Il processo di addestramento ha comportato la suddivisione dei set di dati video in clip più piccole e l'organizzazione di queste clip in lotti per l'analisi della rete. Il modello è stato addestrato ripetutamente su ciascun set di dati per migliorare il suo apprendimento e adattare le sue previsioni in base alle performance della rete.
Dopo un ampio addestramento, i ricercatori hanno confrontato le uscite della rete con dati reali di attività cerebrale raccolti dalle corteccia visive dei topi. Hanno utilizzato tecniche per calcolare quanto bene l'attività del modello si allineasse con i dati cerebrali registrati. Questo confronto mirava a misurare il successo del modello nel mimare il vero processamento visivo nel cervello del topo.
Impatto delle Proprietà degli Stimoli
I risultati dell'addestramento hanno mostrato che i modelli si comportavano bene, superando il caso casuale in accuratezza predittiva. Tuttavia, i tipi di ambienti e modelli di movimento utilizzati durante l'addestramento influenzavano quanto accuratamente il modello rispecchiasse l'attività cerebrale reale.
Le condizioni con ambienti naturali hanno portato ai punteggi di somiglianza più alti rispetto a quelli artificiali. Questo implica che le caratteristiche degli stimoli di addestramento hanno un impatto significativo su quanto bene il modello si allinei con l'attività cerebrale. I risultati hanno mostrato che non solo l'ambiente naturale migliorava la somiglianza, ma c'erano anche interazioni sfumate tra i vari fattori che influenzavano le performance complessive.
Corso Temporale durante l'Addestramento
Durante il processo di addestramento, sono state osservate variazioni sia nell'accuratezza predittiva che nell'allineamento del modello con l'attività cerebrale. I modelli mostrano una diminuzione della perdita di previsione nel tempo, indicando un miglioramento delle performance. Tuttavia, le somiglianze con il cervello non seguivano sempre una chiara tendenza. Alcune aree mostrano cambiamenti rapidi inizialmente, seguiti da una stabilizzazione, mentre altre hanno dimostrato fluttuazioni per tutto il periodo di addestramento.
Questo ha portato alla comprensione che la connessione tra perdita e somiglianza è intricata, dipendente da una varietà di fattori, incluse le condizioni di addestramento. Il corso temporale dello sviluppo della somiglianza cerebrale variava tra diverse popolazioni cellulari, evidenziando la complessità di allineare le uscite del modello con la reale funzione cerebrale.
Conclusione
In sintesi, questa ricerca ha investigato gli effetti di varie condizioni di addestramento sulla capacità di una rete neurale profonda di modellare l'elaborazione visiva nei topi. Attraverso l'uso di ambienti naturalistici e non, insieme a statistiche di movimento realistiche, lo studio ha rivelato che l'ambiente gioca un ruolo significativo nel migliorare l'allineamento con l'attività cerebrale del topo.
I risultati indicano che creare una rete profonda con caratteristiche che riflettono esperienze naturalistiche può migliorare le sue performance e la comprensione della funzione cerebrale. Le future ricerche mirano a esplorare più a fondo le proprietà degli ambienti che potrebbero ottimizzare ulteriormente la somiglianza cerebrale, consentendo modelli migliori di elaborazione visiva nel cervello. I risultati aiuteranno a plasmare la nostra comprensione sia dell'intelligenza artificiale che delle neuroscienze, fornendo spunti su come sviluppare modelli che imitino meglio i sistemi di elaborazione visiva reali trovati negli animali.
Titolo: Complex Properties of Training Stimuli Affect Brain Alignment in a Deep Network Model of Mouse Visual Cortex
Estratto: Deep convolutional neural networks are important models of the visual cortex that ac-count relatively well for brain activity and are able to perform ethologically relevant functions. However, it is unknown which combination of factors, such as network ar-chitecture, training objectives, and data best align this family of models with the brain. Here we investigate the statistics of training data. We hypothesized that stimuli that are naturalistic for mice would lead to higher similarity between deep network models and activity in mouse visual cortex. We used a video-game engine to create training datasets in which we varied the naturalism of the environment, the movement statis-tics, and the optics of the modelled eye. The naturalistic environment substantially and consistently led to greater brain similarity, while the other factors had more subtle and area-specific effects. We then hypothesized that differences in brain similarity between the two environments arose due to differences in spatial frequency spectra, distribu-tions of color and orientation, and/or temporal autocorrelations. To test this, we created abstract environments, composed of cubes and spheres, that resembled the naturalis-tic and non-naturalistic environments in these respects. Contrary to our expectations, these factors accounted poorly for differences in brain similarity due to the naturalis-tic and non-naturalistic environments. This suggests that the higher brain similarities we observed after training with the naturalistic environment were due to more complex factors.
Autori: Bryan P Tripp, P. Torabian, Y. Chen, C. Ng, S. Mihalas, M. Buice, S. Bakhtiari
Ultimo aggiornamento: 2024-10-27 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.10.24.620142
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.10.24.620142.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.