Novo Conjunto de Dados Revela Insights sobre Pedidos de Prova Wi-Fi
Um conjunto de dados bem completo joga luz sobre os pedidos de pesquisa Wi-Fi e a privacidade do usuário.
― 7 min ler
Índice
- O que são Requisições de Probe?
- Importância de Dados Atualizados
- Criação do Conjunto de Dados
- Ambiente de Escritório
- Descrição dos Dados
- Tendências de Análise
- Endereços MAC e SSIDs
- Elementos de Informação
- Informações de Rádio
- Casos de Uso para o Conjunto de Dados
- Considerações Éticas
- Conclusão
- Fonte original
- Ligações de referência
Esse artigo fala sobre um novo conjunto de dados relacionado a Requisições de Probe em redes Wi-Fi. Requisições de probe são sinais enviados por dispositivos pra encontrar redes Wi-Fi próximas. Essa informação é vital já que a tecnologia continua mudando. O conjunto de dados foi capturado ao longo de um mês em um ambiente de escritório, e inclui mais de 1,4 milhão de requisições de probe. O objetivo desse trabalho é fornecer dados atualizados pra pesquisadores e desenvolvedores estudarem vários aspectos da comunicação Wi-Fi e da privacidade dos usuários.
O que são Requisições de Probe?
Requisições de probe fazem parte do processo de comunicação Wi-Fi. Quando um dispositivo quer se conectar a uma rede Wi-Fi, ele manda requisições de probe pra encontrar pontos de acesso (APs) por perto. Os APs são dispositivos que permitem que os dispositivos se conectem a uma rede Wi-Fi. As requisições de probe não são criptografadas, o que significa que qualquer um com o equipamento certo pode capturá-las. Essa falta de segurança levanta preocupações sobre a privacidade do usuário, já que as requisições de probe podem revelar a localização e o comportamento dos usuários.
Importância de Dados Atualizados
À medida que a tecnologia avança, a forma como os dispositivos se comunicam também muda. Os dados coletados sobre requisições de probe precisam estar atualizados pra serem relevantes. Analisando dados recentes, os pesquisadores podem identificar tendências e entender como os dispositivos interagem com as redes em diferentes condições, como em dias de semana ou finais de semana.
Criação do Conjunto de Dados
O conjunto de dados foi coletado em março de 2023 na Universidade Jaume I na Espanha. Um sniffer ESP32 foi usado pra capturar as requisições de probe. Esse dispositivo captura dados brutos e os salva em um formato que pode ser analisado usando ferramentas de rede populares. O sniffer foi configurado pra coletar informações de vários canais Wi-Fi pra garantir uma captura abrangente das requisições de probe.
Ambiente de Escritório
A captura aconteceu em um escritório open space com dimensões de cerca de 16,71 metros por 10,76 metros. Esse escritório normalmente tem entre 14 e 20 pessoas trabalhando lá. O layout foi desenhado pra facilitar a colaboração, o que é essencial pra estudar requisições de probe durante dias úteis e feriados.
Descrição dos Dados
O conjunto de dados inclui requisições de probe registradas ao longo do mês. Um aspecto notável é a inclusão de um feriado local, que afeta o número de pessoas no escritório. O conjunto de dados mostra um fluxo consistente de requisições de probe, mesmo durante a noite, quando menos pessoas estão presentes. Essa atividade consistente pode ser atribuída a dispositivos que permanecem conectados a redes ou aplicativos que precisam de acesso à internet.
Tendências de Análise
Durante o período de coleta de dados, várias tendências foram identificadas. Primeiro, houve um fluxo constante de requisições de probe. Isso indica que os dispositivos estão continuamente buscando conexões. Segundo, tem um pico notável nas requisições de probe no começo da manhã, provavelmente porque os dispositivos estão reconectando depois de um período de inatividade. Além disso, houve um período curto sem requisições capturadas, coincidindo com uma mudança de horário, destacando como fatores externos podem influenciar o comportamento dos dispositivos.
Endereços MAC e SSIDs
Os endereços MAC são identificadores únicos para dispositivos em uma rede. Entender se os dispositivos usam endereços MAC aleatórios ou fixos é crucial pra analisar a privacidade. Dispositivos que não randomizam seus endereços MAC são mais fáceis de rastrear. O conjunto de dados capturou ambos os tipos, oferecendo uma visão sobre o comportamento dos usuários. Um fator importante adicional é a Lista de Redes Preferidas (PNL), que contém as redes Wi-Fi que os dispositivos normalmente se conectam. Quando os dispositivos mandam requisições de probe pra redes específicas, eles podem compartilhar acidentalmente sua PNL, impactando ainda mais a privacidade do usuário.
Elementos de Informação
As requisições de probe podem conter informações adicionais que são úteis pra analisar os dispositivos. Essas informações incluem as capacidades dos dispositivos, como padrões Wi-Fi suportados e detalhes do fabricante. Esses dados podem ser usados pra identificar tipos de dispositivos e entender os hábitos dos usuários. No entanto, isso também apresenta riscos de privacidade, já que informações sensíveis podem estar embutidas nessas requisições.
Informações de Rádio
Os dados coletados incluem valores do indicador de força de sinal recebido (RSSI), que mostram quão forte é o sinal Wi-Fi no momento de cada requisição de probe. Entender o RSSI é essencial pra analisar a qualidade da conexão e a usabilidade do ambiente da rede. O conjunto de dados revelou que a maioria das requisições de probe tinha valores de RSSI em uma determinada faixa, com algumas vindo de dispositivos em escritórios vizinhos. Essa informação pode ajudar a avaliar a qualidade do ambiente Wi-Fi.
Casos de Uso para o Conjunto de Dados
Vários possíveis aplicativos para o conjunto de dados surgem. Um exemplo é a avaliação da estabilidade do sinal Wi-Fi, permitindo que pesquisadores estudem como a força do sinal muda ao longo do tempo. Outro uso é a detecção de presença. Analisando os padrões de atividade das requisições de probe, é possível determinar quando as pessoas estão presentes no escritório. Isso pode ajudar a estimar a ocupação das salas com base no tráfego de rede.
Além disso, o conjunto de dados pode ser usado pra analisar a exploração da privacidade dos usuários. Estudando os dados, os pesquisadores podem identificar vulnerabilidades nos protocolos de gerenciamento da rede, expondo riscos potenciais associados às requisições de probe. Por último, o conjunto de dados permite investigações mais profundas sobre o comportamento de endereços MAC randomizados, oferecendo insights sobre possíveis métodos de rastreamento.
Considerações Éticas
Ao coletar dados, é essencial considerar as implicações éticas. A captura de requisições de probe pode expor inadvertidamente informações sensíveis. Pra lidar com isso, o conjunto de dados foi anonimizado usando técnicas de hashing, garantindo que identificadores originais não sejam ligados diretamente a indivíduos. Essa abordagem permite que pesquisadores analisem os dados sem comprometer a privacidade dos usuários.
Conclusão
Esse artigo apresenta um novo conjunto de dados de requisições de probe que reflete os padrões atuais de comunicação Wi-Fi. Ao oferecer dados atualizados, ele melhora a compreensão de como os dispositivos interagem com as redes e aumenta a conscientização sobre questões de privacidade associadas a requisições não criptografadas. Pesquisadores podem usar esse conjunto de dados pra explorar várias aplicações, incluindo estabilidade do sinal, detecção de presença e proteção da privacidade. No geral, esse trabalho prepara o terreno pra uma exploração mais profunda da tecnologia Wi-Fi e do comportamento dos usuários.
Título: UJI Probes: Dataset of Wi-Fi Probe Requests
Resumo: This paper focuses on the creation of a new, publicly available Wi-Fi probe request dataset. Probe requests belong to the family of management frames used by the 802.11 (Wi-Fi) protocol. As the situation changes year by year, and technology improves probe request studies are necessary to be done on up-to-date data. We provide a month-long probe request capture in an office environment, including work days, weekends, and holidays consisting of over 1 400 000 probe requests. We provide a description of all the important aspects of the dataset. Apart from the raw packet capture we also provide a Radio Map (RM) of the office to ensure the users of the dataset have all the possible information about the environment. To protect privacy, user information in the dataset is anonymized. This anonymization is done in a way that protects the privacy of users while preserving the ability to analyze the dataset to almost the same level as raw data. Furthermore, we showcase several possible use cases for the dataset, like presence detection, temporal Received Signal Strength Indicator (RSSI) stability, and privacy protection evaluation.
Autores: Tomáš Bravenec, Joaquín Torres-Sospedra, Michael Gould, Tomas Fryza
Última atualização: 2023-12-08 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2308.04435
Fonte PDF: https://arxiv.org/pdf/2308.04435
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.