Assistentes de Voz e Perfilamento de Usuário: Um Olhar Mais Próximo
Um estudo sobre como assistentes de voz perfilam usuários e as preocupações de privacidade que isso envolve.
Tina Khezresmaeilzadeh, Elaine Zhu, Kiersten Grieco, Daniel J. Dubois, Konstantinos Psounis, David Choffnes
― 10 min ler
Índice
- Introdução
- Trabalhos Relacionados
- Privacidade e Assistentes de Voz
- Perfilamento Baseado em Persona
- Metodologia
- Definindo Assistentes de Voz
- Rótulos de Perfilamento
- Perguntas de Treinamento
- Modalidades de Interação
- Perguntas de Pesquisa
- Preparação do Experimento
- Abordagem Experimental
- Coleta de Dados
- Resultados
- Rótulos Pré-preenchidos
- Precisão e Tempo do Perfilamento
- Impacto da Modalidade de Interação
- Ferramentas de Mitigação
- Discussão
- Implicações dos Rótulos Pré-preenchidos
- Precisão do Perfilamento e Riscos
- Desafios no Tempo de Perfilamento
- Controle sobre Perfis
- Conclusão
- Fonte original
- Ligações de referência
Muitas empresas, como Google, Amazon e Apple, oferecem assistentes de voz pra ajudar os usuários a encontrar informações e acessar seus serviços rapidinho. Esses assistentes de voz estão super na moda, aparecendo em smartphones, alto-falantes inteligentes, smartwatches e mais. Mas, usar esses assistentes levanta preocupações importantes sobre privacidade.
Enquanto as empresas dizem que podem usar interações de voz para perfilar os usuários nas suas políticas de privacidade, geralmente é bem vago e não dá pra saber exatamente o quanto desse perfil de fato acontece. É complicado saber se usar assistentes de voz traz mais riscos de privacidade do que outras formas de interação, tipo navegar na web.
Nesse estudo, analisamos como os três principais assistentes de voz-Google Assistant, Amazon Alexa e Apple Siri-perfilam os usuários através de diferentes tipos de perguntas e personas ao longo de vários meses. Observamos como os usuários são rotulados, a precisão desses rótulos, o tempo que leva pra mudá-los e como diferentes formas de interação afetam o processo de perfilamento. Também verificamos as ferramentas oferecidas por esses assistentes pra ajudar os usuários a controlarem seus perfis.
Nossa pesquisa mostra que o perfilamento pode acontecer até sem interação e que, às vezes, pode estar errado ou ser inconsistente. Mudanças nos perfis podem levar dias ou semanas. Além disso, a forma como se interage com os assistentes pode influenciar como os usuários são perfilados.
Introdução
Assistentes de voz, como Amazon Alexa, Google Assistant e Apple Siri, estão se tornando ferramentas importantes pra acessar informações e serviços. Eles ajudam os usuários a fazer tarefas sem precisar de interfaces físicas, tornando-se bem populares, especialmente nos Estados Unidos.
Apesar dos benefícios, tem questões de privacidade que são bem relevantes ao usar assistentes de voz, parecidas com as preocupações que surgem ao navegar na web. Pesquisas anteriores indicam que serviços online costumam usar dados dos usuários pra perfilamento, que visa personalizar o conteúdo. Além disso, tem evidências de que algumas interações dos usuários com skills de terceiros da Alexa também são usadas pra perfilamento.
Porém, não tá claro quanto os assistentes de voz em si se envolvem no perfilamento sem aplicativos de terceiros, e como seus métodos se comparam com interações na web. Essa incerteza ressalta a necessidade de mais pesquisas sobre como assistentes de voz perfilam usuários e os riscos de privacidade envolvidos.
Entender o perfilamento é importante porque impacta a experiência do usuário-perfis errados podem levar a anúncios irrelevantes e influenciar estratégias de marketing. Também tem o risco de que informações incorretas possam ser compartilhadas com terceiros, ressaltando a necessidade de entender melhor o perfilamento do usuário.
A gente quer investigar as implicações de privacidade ao interagir com assistentes de voz, focando no que é perfilado, quão precisos esses perfis são e quanto tempo leva pra atualizá-los. Vamos também comparar o perfilamento de usuários através de comandos de voz e buscas na web, analisando se e como esses métodos diferem.
Por fim, vamos avaliar a eficácia das ferramentas disponíveis pra ajudar os usuários a gerenciar seus perfis, como opções de sair fora ou corrigir rótulos.
Trabalhos Relacionados
Privacidade e Assistentes de Voz
Desde que foram lançados, assistentes de voz e seus dispositivos (como alto-falantes inteligentes) levantaram preocupações sobre privacidade e segurança. A maioria dos estudos existentes foca nos riscos devido a falhas tecnológicas, tipo ativações acidentais de alto-falantes inteligentes e bugs que podem levar ao compartilhamento não autorizado de gravações. Além disso, é possível inferir características dos usuários a partir das gravações, não só do que foi dito, criando mais chances de perfilamento.
Perfilamento Baseado em Persona
A gente usa uma metodologia baseada em personas pra criar rótulos no contexto de assistentes de voz. Essa abordagem já foi usada pra estudar como dados são compartilhados com terceiros em outros contextos, como a navegação na web. Embora alguns estudos tenham analisado personas no contexto de assistentes de voz, geralmente focam em aplicativos de terceiros ao invés dos assistentes em si.
Metodologia
Esse estudo foca nas práticas de perfilamento dos assistentes de voz. Nossa pesquisa envolve criar contas de usuário, estabelecer personas através de perguntas específicas de voz e analisar os rótulos de perfilamento resultantes.
Definindo Assistentes de Voz
A gente define assistentes de voz como software projetado pra processar comandos de voz e realizar uma variedade de tarefas. Os assistentes de voz que investigamos-Google Assistant, Alexa e Siri-são todos baseados em nuvem, ou seja, operam processando dados do usuário externamente, e não no dispositivo do usuário.
Rótulos de Perfilamento
Rótulos de perfilamento são elementos essenciais dentro do perfil de um usuário que resultam de dados coletados através de interações. A gente classifica os rótulos em rótulos demográficos, que se relacionam a características pessoais, e rótulos de inferência, que refletem interesses do usuário.
Perguntas de Treinamento
As perguntas de treinamento são questões desenhadas especificamente para moldar a persona de um usuário dentro da estrutura do assistente de voz. Essas perguntas são essenciais pra guiar o assistente a reconhecer rótulos de perfilamento específicos.
Modalidades de Interação
Modalidades de interação se referem às diferentes maneiras que os usuários podem se comunicar com assistentes de voz, incluindo entradas de voz ou consultas baseadas em texto. Nossos estudos comparam essas modalidades pra ver como elas influenciam o perfilamento do usuário.
Perguntas de Pesquisa
Os assistentes de voz começam com rótulos pré-preenchidos?
- A gente examina se contas recém-criadas têm algum rótulo atribuído antes de qualquer interação.
O perfilamento ocorre, e até que ponto?
- Medimos a precisão e a consistência dos perfis de usuários após interações baseadas em personas.
A forma de interação influencia o perfilamento?
- A gente explora se diferentes métodos de interação (voz versus web) afetam como os usuários são perfilados.
Quão eficazes são as ferramentas fornecidas pra mitigar o perfilamento?
- Investigamos se os usuários conseguem remover ou alterar seus rótulos de perfilamento com sucesso.
Preparação do Experimento
Controlamos cuidadosamente nossos experimentos pra evitar interferências, garantindo resultados consistentes entre diferentes contas e consultas. Criamos novas contas de usuário e monitoramos diretamente os rótulos de perfilamento gerados durante nossos experimentos.
Abordagem Experimental
- Criação de Conta: Criamos contas novas para cada persona, garantindo que todas as contas permanecessem independentes.
- Pedidos de Divulgação de Dados: Utilizamos meios legais pra solicitar informações sobre rótulos de perfilamento atribuídos a usuários.
- Interações de Voz Baseadas em Persona: Facilitamos consultas baseadas em personas adaptadas especificamente pros assistentes de voz, observando como isso afetou a rotulagem.
- Experimentos de Modalidade Web: Replicamos consultas de persona através de interfaces web pra comparar os resultados do perfilamento.
- Teste de Mitigação: Avaliamos as ferramentas disponíveis pra gerenciar ou alterar rótulos de perfilamento de forma eficaz.
Coleta de Dados
Pra cada assistente, preparamos um conjunto detalhado de consultas que guiariam o processo de perfilamento, garantindo que nossas perguntas refletissem com precisão as personas que criamos. As consultas foram adaptadas a cada persona, focando em características chave que influenciariam o perfilamento.
Resultados
Rótulos Pré-preenchidos
Nossas descobertas revelaram que o Google Assistant atribui certos rótulos a usuários antes de qualquer interação. Esses rótulos incluíam "Proprietários de Casa" e "Não Pais". Para Alexa e Siri, não houve sinais de rótulos pré-preenchidos.
Precisão e Tempo do Perfilamento
Avaliações da precisão do perfilamento dos usuários após interações mostraram diferenças significativas em quão rápido e eficazmente diferentes plataformas atualizaram os perfis.
- Google Assistant: Comandos falados levaram a resultados mais variados na precisão do perfilamento e muito mais tempo pra mudanças de rótulos em comparação com consultas na web.
- Amazon Alexa: O assistente mostrou alta precisão quando comandos relacionados diretamente aos seus produtos foram usados, alcançando resultados consistentes através de interações de voz e web.
- Apple Siri: Nossa avaliação não mostrou evidências de perfilamento através da Siri, sugerindo que ela possa ser mais focada em privacidade.
Impacto da Modalidade de Interação
Encontramos distinções claras entre como o perfilamento variou entre interações de voz e web. O Google Assistant teve taxas de precisão mais altas e atualizações mais rápidas usando métodos web comparados a comandos de voz.
Ferramentas de Mitigação
Testamos a eficácia das funcionalidades oferecidas por cada plataforma pra gerenciar perfis de usuários. O Google Assistant permitiu que os usuários alterassem e confirmassem rótulos demográficos de forma eficaz, enquanto a Amazon ofereceu menos flexibilidade na modificação de rótulos de interesse sem a opção de sair completamente.
Discussão
Implicações dos Rótulos Pré-preenchidos
A presença de rótulos pré-preenchidos no Google Assistant levanta preocupações de privacidade potenciais, pois eles podem não refletir com precisão as características reais do usuário. Rótulos enganosos podem resultar em conteúdo ou anúncios irrelevantes sendo exibidos.
Precisão do Perfilamento e Riscos
As descobertas mostraram que, enquanto o perfilamento da Amazon é determinístico, levando a resultados consistentes de interações dos usuários, a abordagem do Google envolve um método probabilístico que pode levar a erros. As implicações de tais imprecisões podem afetar a confiança dos usuários e a eficácia da publicidade direcionada.
Desafios no Tempo de Perfilamento
Processos de perfilamento que levam vários dias podem enganar os usuários sobre seu status de perfilamento, especialmente se pedirem dados muito cedo. Os usuários podem achar que não estão sendo perfilados ou que foram rotulados incorretamente.
Controle sobre Perfis
Embora tanto o Google quanto a Amazon ofereçam opções de sair do perfilamento, é crucial que os usuários tenham mais controle sobre seus próprios perfis, permitindo que eles alterem ou removam rótulos de forma seletiva.
Conclusão
Nosso estudo revela que assistentes de voz exibem comportamentos de perfilamento distintos, com o Google Assistant usando um método mais flexível que pode levar a imprecisões, enquanto o método da Amazon é mais confiável, mas menos ajustável a mudanças, alinhando-se mais ao seu ecossistema de produtos. A Apple Siri, por outro lado, mostra um compromisso com a privacidade ao limitar as atividades de perfilamento.
No geral, nossas descobertas incentivam as empresas de assistentes de voz a aumentar a transparência sobre suas práticas de perfilamento e desenvolver ferramentas que capacitem os usuários a gerenciar seus perfis de forma eficaz.
Título: Echoes of Privacy: Uncovering the Profiling Practices of Voice Assistants
Resumo: Many companies, including Google, Amazon, and Apple, offer voice assistants as a convenient solution for answering general voice queries and accessing their services. These voice assistants have gained popularity and can be easily accessed through various smart devices such as smartphones, smart speakers, smartwatches, and an increasing array of other devices. However, this convenience comes with potential privacy risks. For instance, while companies vaguely mention in their privacy policies that they may use voice interactions for user profiling, it remains unclear to what extent this profiling occurs and whether voice interactions pose greater privacy risks compared to other interaction modalities. In this paper, we conduct 1171 experiments involving a total of 24530 queries with different personas and interaction modalities over the course of 20 months to characterize how the three most popular voice assistants profile their users. We analyze factors such as the labels assigned to users, their accuracy, the time taken to assign these labels, differences between voice and web interactions, and the effectiveness of profiling remediation tools offered by each voice assistant. Our findings reveal that profiling can happen without interaction, can be incorrect and inconsistent at times, may take several days to weeks for changes to occur, and can be influenced by the interaction modality.
Autores: Tina Khezresmaeilzadeh, Elaine Zhu, Kiersten Grieco, Daniel J. Dubois, Konstantinos Psounis, David Choffnes
Última atualização: 2024-09-13 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2409.07444
Fonte PDF: https://arxiv.org/pdf/2409.07444
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.