Novo Conjunto de Dados Avança Pesquisa sobre Diâmetro da Pupila
Pesquisadores criam um conjunto de dados baseado em webcam pra medir o tamanho da pupila.
― 7 min ler
Índice
- A Importância do Diâmetro da Pupila
- Desafios em Medir o Diâmetro da Pupila
- 1. Coletando Dados Precisos
- 2. Variedade nos Dados
- 3. Predizendo o Diâmetro da Pupila
- O Conjunto de Dados
- Processo de Coleta de Dados
- Etapas de Pré-processamento dos Dados
- Analisando os Dados
- Melhorias Futuras e Sugestões
- Conclusão
- Fonte original
- Ligações de referência
Nos últimos anos, tem rolado um interesse crescente em entender como o tamanho da pupila pode refletir vários estados mentais e físicos nas pessoas. O diâmetro da pupila pode indicar níveis de estresse, atenção ou esforço cognitivo. Mas, reunir dados precisos sobre o tamanho das pupilas tem sido desafiador, já que a galera costuma usar equipamentos caros pra isso.
Um esforço de pesquisa resultou na criação de um novo conjunto de dados com o objetivo de estimar o diâmetro da pupila usando imagens de webcams comuns. Esse conjunto de dados preenche uma lacuna significativa nas recursos existentes e é feito pra ajudar pesquisadores na área de monitoramento ocular.
A Importância do Diâmetro da Pupila
O tamanho da pupila tá ligado a vários estados cognitivos e emocionais. Por exemplo, quando alguém tá estressado ou concentrado, as pupilas geralmente se dilatam. Por outro lado, relaxar pode fazer as pupilas ficarem menores. Muitos estudos mostraram que monitorar o tamanho da pupila pode dar insights valiosos sobre como a pessoa tá se sentindo ou quão concentrada está.
Tradicionalmente, equipamentos especializados como rastreadores oculares da Tobii eram usados pra medir o diâmetro da pupila com precisão. Esses dispositivos podem ser caros e não tão fáceis de achar, limitando o uso em situações cotidianas. Usando webcams comuns pra medir a pupila, os pesquisadores querem deixar esse tipo de análise mais acessível.
Desafios em Medir o Diâmetro da Pupila
Os pesquisadores identificaram três desafios principais na estimativa do diâmetro da pupila a partir das imagens das webcams.
1. Coletando Dados Precisos
Um dos primeiros obstáculos é coletar medições precisas do diâmetro da pupila. Métodos anteriores muitas vezes envolviam rastreadores oculares de alto nível e a medição manual dos tamanhos das pupilas, o que dá muito trabalho. Pra simplificar isso, os pesquisadores usaram o rastreador ocular da Tobii, que captura valores precisos de diâmetro da pupila de forma eficiente.
2. Variedade nos Dados
Outro desafio é a diversidade dos dados coletados. Muitos estudos anteriores focaram nas condições de iluminação variáveis, que podem afetar o tamanho da pupila. A equipe de pesquisa optou por uma abordagem diferente, variando as cores da tela do computador durante a coleta de dados. Esse método permitiu que os Participantes escolhessem sua posição e distância em relação à tela, criando um cenário mais realista pra coleta de dados.
3. Predizendo o Diâmetro da Pupila
O último desafio é desenvolver um método pra prever o diâmetro da pupila com precisão a partir de imagens de webcams. Estudos anteriores descobriram que estimar posições de olhar envolve analisar imagens de alta resolução. Estimar o diâmetro da pupila requer analisar imagens menores, tornando essa tarefa mais complexa.
O Conjunto de Dados
Pra lidar com esses desafios, os pesquisadores criaram um conjunto de dados que inclui milhares de imagens dos olhos dos participantes junto com suas medições de diâmetro da pupila correspondentes. O conjunto de dados contém imagens tiradas sob várias condições e representa uma ampla gama de tamanhos de pupila.
Os participantes do estudo gravaram enquanto uma webcam capturava o vídeo de seus rostos e o rastreador ocular da Tobii coletava dados sobre o diâmetro da pupila. No total, o conjunto de dados inclui mais de 200.000 imagens dos olhos dos participantes, depois de filtrar quadros borrados ou indesejados.
Processo de Coleta de Dados
Na coleta de dados, os participantes precisaram preencher um formulário de consentimento e fornecer informações de fundo. Depois, foram calibrados com o rastreador ocular antes de começar as gravações. Cada sessão de gravação durou três segundos, durante os quais os participantes olharam pra uma tela que mostrava várias cores.
Os pesquisadores criaram um aplicativo web pra facilitar o processo de coleta de dados. Esse aplicativo fez com que os participantes pudessem iniciar gravações de vídeo simplesmente clicando em um botão. O aplicativo registrou o tempo de cada sessão e garantiu a sincronização entre o vídeo da webcam e os dados do rastreador ocular.
Etapas de Pré-processamento dos Dados
Depois de coletar as gravações de vídeo brutas, a equipe passou pra uma etapa de pré-processamento pra preparar os dados pra análise. Isso envolveu alinhar as gravações do rastreador ocular com os vídeos da webcam. Cada gravação tinha três segundos de duração e capturava um número específico de quadros individuais.
As imagens da webcam precisavam ser analisadas pra detectar piscadas. Os pesquisadores usaram técnicas pra detectar piscadas com base em mudanças nas dimensões dos olhos. Quaisquer quadros capturados enquanto o participante piscava foram removidos do conjunto de dados pra manter a qualidade.
Depois de remover os quadros indesejados, os pesquisadores recortaram as imagens dos olhos pra focar nos olhos esquerdo e direito separadamente. Eles usaram software pra identificar as localizações exatas dos olhos nas gravações, garantindo um método de recorte consistente.
Analisando os Dados
Os pesquisadores realizaram testes iniciais pra estimar o diâmetro da pupila usando várias arquiteturas de modelo. Eles avaliaram especificamente dois modelos, ResNet-18 e ResNet-50, pra ver quão bem eles conseguiam estimar o tamanho da pupila a partir das imagens recortadas.
Os resultados mostraram que o ResNet-18 teve um desempenho melhor que o ResNet-50 em termos de precisão na previsão. Esse modelo alcançou um erro absoluto médio menor ao estimar o diâmetro da pupila tanto do olho esquerdo quanto do direito. As descobertas sugerem que o ResNet-18 pode ser uma opção confiável pra pesquisas futuras em estimativa de diâmetro da pupila.
Melhorias Futuras e Sugestões
Embora o conjunto de dados represente um avanço significativo na área de monitoramento ocular, existem algumas áreas pra melhoria. Uma limitação é depender de um único tipo de câmera. Diferentes webcams podem dar resultados variados, e estudos futuros deveriam testar os modelos em imagens capturadas com vários dispositivos pra confirmar sua confiabilidade.
Outro ponto a considerar é a exclusão de participantes que usam óculos. Essa limitação afeta a aplicabilidade do conjunto de dados, já que muita gente usa óculos diariamente. Trabalhos futuros deveriam contar com um grupo de participantes mais diversificado.
Conclusão
O desenvolvimento desse novo conjunto de dados mostra potencial pra avançar a pesquisa sobre estimativa do diâmetro da pupila usando imagens de webcams comuns. Isso abre oportunidades pra entender melhor os estados cognitivos e emocionais humanos através de métodos mais acessíveis. Ao lidar com as limitações dos métodos atuais, esse conjunto de dados ajuda a democratizar a pesquisa sobre o tamanho da pupila e suporta várias aplicações em saúde e interação humano-computador.
Com pesquisas contínuas, os insights obtidos desse conjunto de dados podem levar a aplicações e ferramentas inovadoras que ajudam a monitorar estados emocionais e cognitivos de forma mais eficaz. Os pesquisadores esperam que seu trabalho inspire mais estudos, ajudando a avançar os campos de rastreamento ocular e psicologia.
Título: EyeDentify: A Dataset for Pupil Diameter Estimation based on Webcam Images
Resumo: In this work, we introduce EyeDentify, a dataset specifically designed for pupil diameter estimation based on webcam images. EyeDentify addresses the lack of available datasets for pupil diameter estimation, a crucial domain for understanding physiological and psychological states traditionally dominated by highly specialized sensor systems such as Tobii. Unlike these advanced sensor systems and associated costs, webcam images are more commonly found in practice. Yet, deep learning models that can estimate pupil diameters using standard webcam data are scarce. By providing a dataset of cropped eye images alongside corresponding pupil diameter information, EyeDentify enables the development and refinement of models designed specifically for less-equipped environments, democratizing pupil diameter estimation by making it more accessible and broadly applicable, which in turn contributes to multiple domains of understanding human activity and supporting healthcare. Our dataset is available at https://vijulshah.github.io/eyedentify/.
Autores: Vijul Shah, Ko Watanabe, Brian B. Moser, Andreas Dengel
Última atualização: 2024-07-15 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.11204
Fonte PDF: https://arxiv.org/pdf/2407.11204
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.