Como a Aglomeração Afeta o Reconhecimento Visual
Pesquisas mostram como a multidão afeta nossa capacidade de reconhecer objetos.
― 5 min ler
Índice
O reconhecimento visual é como a gente identifica e entende o que vê. Esse processo pode ser influenciado por dois fatores principais: o tamanho dos objetos que queremos Reconhecer e a distância entre eles. Embora saibamos que tem um limite de quão pequenos os objetos podem ser pra gente reconhecê-los (isso muitas vezes é por causa dos olhos e da quantidade de células retinais que temos), não está tão claro por que objetos que estão muito perto um do outro podem causar problemas de reconhecimento, mesmo que sejam maiores que o limite de tamanho.
O Conceito de Confusão
Quando os objetos estão muito próximos, a gente tem dificuldade pra reconhecê-los. Esse problema é conhecido como "confusão." A confusão pode atrapalhar tarefas do dia a dia, como ler e procurar itens. Embora saibamos que a confusão acontece em nossos cérebros, os detalhes biológicos exatos ainda estão nebulosos. Um ponto chave é que a confusão continua sendo um problema, seja quando vemos o alvo e os objetos ao redor com um olho só ou com os dois.
Pra medir a confusão, os cientistas olham a distância entre os objetos, especificamente, o menor espaçamento necessário pra reconhecer o objeto alvo. As pessoas mostram uma grande variedade de diferenças em como esse espaçamento as afeta, mesmo entre aquelas que têm boa visão.
Investigando a Base Cerebral da Confusão
As grandes diferenças na confusão podem ajudar a gente a entender como nossos cérebros processam informações visuais. Pensamos que a confusão pode ser causada por recursos limitados do cérebro em uma certa fase de processamento, muito parecido com como nossa capacidade de ver detalhes finos é limitada pela quantidade de células retinais.
Áreas do cérebro que mapeiam informações visuais, conhecidas como Mapas Retinotópicos, podem desempenhar um papel significativo na confusão. Nosso objetivo é descobrir se o tamanho desses mapas em diferentes indivíduos pode explicar por que a confusão pode variar bastante entre as pessoas.
Pra testar essa ideia, observamos 49 pessoas, medindo o tamanho dos seus mapas retinotópicos usando uma técnica chamada fMRI. Ao mesmo tempo, testamos o quão bem elas conseguem reconhecer letras em uma tarefa que mostra os efeitos da confusão. Com isso, conseguimos estimar quantas letras cada indivíduo consegue reconhecer sem que a confusão atrapalhe. Acreditamos que se alguém tem mapas retinotópicos maiores, consegue reconhecer mais letras sem problemas.
A Relação Entre Tamanho do Mapa e Confusão
Baseado em nossos testes, se a distância de confusão ficar a mesma pra todo mundo, então o número de letras que conseguem reconhecer deve depender diretamente do tamanho dos seus mapas. Nossas descobertas mostraram que podemos ver essa relação com o mapa V4, que é um dos mapas retinotópicos. No entanto, não observamos tal relação com os mapas anteriores (V1 a V3).
A distância necessária pra reconhecer letras pode ser medida em mm na superfície do cérebro. Ao olhar nossos dados, encontramos que pra um dos observadores, que consegue reconhecer muitas letras, a área do V4 também é maior que a de outro observador que reconhece menos letras.
Nós também nos certificamos de que nossas medições eram confiáveis. Quando repetimos nossos testes, vimos uma forte correlação tanto na quantidade de letras que as pessoas conseguiam reconhecer quanto no tamanho dos seus mapas. Isso significa que nossa abordagem pode revelar consistentemente as diferenças entre os indivíduos.
Entendendo a Confusão nos Mapas Corticais Visuais
Pra descobrir a confusão e os tamanhos dos mapas, plotamos os dados que coletamos. No V4, encontramos uma conexão forte entre o tamanho do mapa e o número de letras que uma pessoa podia reconhecer. Mas para o V1 ao V3, a conexão foi bem mais fraca.
Nossa análise mostrou que a distância de confusão é geralmente consistente no mapa V4 entre diferentes indivíduos, ao contrário dos mapas anteriores. Isso significa que, apesar das diferenças nas experiências individuais e tamanhos de cérebro, a forma como a confusão atua no mapa V4 continua estável.
Por Que Isso Importa?
O ponto chave é que, mesmo que as pessoas possam ter experiências super diferentes com a confusão e os mapas, a medição da distância de confusão se mantém consistente em cerca de 1.4 mm entre as pessoas no mapa V4. Essa descoberta sugere que existe um certo número de Neurônios que precisam ser acionados pra isolar e reconhecer um objeto de forma eficaz. Essa medição consistente pode ajudar a explicar por que algumas pessoas têm dificuldades com a leitura ou o reconhecimento de letras, como visto em condições como dislexia ou discalculia.
Diferenças Individuais e Seu Impacto
Ao olhar pras diferenças individuais, conseguimos entender melhor como a confusão impacta as tarefas visuais. Quando a confusão se torna extrema pra alguém, pode levar a desafios no dia a dia e pode ser classificada como um transtorno. A relação entre o tamanho do mapa V4 e a confusão poderia nos ajudar a entender melhor esses transtornos.
Conclusão
O estudo do reconhecimento visual, da confusão e dos mapas cerebrais fornece insights sobre como vemos e reconhecemos objetos. Entender a relação entre a estrutura cerebral de um indivíduo e suas capacidades visuais ajuda a iluminar diferenças chave em como processamos o mundo ao nosso redor. A consistência encontrada no mapa V4 sugere que existem mecanismos neurais subjacentes que governam nossa habilidade de perceber e reconhecer objetos, mesmo quando nossas experiências diferem bastante.
Título: Human V4 size predicts crowding distance
Resumo: Visual recognition is limited by both object size (acuity) and spacing. The spacing limit, called "crowding", is the failure to recognize an object in the presence of other objects. Here, we take advantage of individual differences in crowding behavior to investigate its biological basis. Crowding distance, the minimum object spacing needed for recognition, varies 2-fold among healthy adults. We test the conjecture that this variation in psychophysical crowding distance is due to variation in cortical map size. To test this, we made paired measurements of brain and behavior in 50 observers. We used psychophysics to measure crowding distance and calculate{lambda} , the number of letters that fit into each observers visual field without crowding. In the same observers, we used fMRI to measure the surface area A (mm{superscript 2}) of retinotopic maps V1, V2, V3, and V4. Across observers,{lambda} is proportional to the surface area of V4 but is uncorrelated with the surface area of V1 to V3. The proportional relationship of{lambda} to area of V4 indicates conservation of cortical crowding distance across individuals: letters can be recognized if they are spaced by at least 1.4 mm on the V4 map, irrespective of map size and psychophysical crowding distance. We conclude that the size of V4 predicts the spacing limit of visual perception.
Autores: Jonathan Winawer, J. W. Kurzawski, B. S. Qiu, N. J. Majaj, N. C. Benson, D. Pelli
Última atualização: 2024-07-29 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.03.587977
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.03.587977.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.