Simple Science

Ciência de ponta explicada de forma simples

# Informática# Inteligência Artificial# Interação Homem-Computador

Avaliação das Experiências de XAI com a Escala XEQ

Uma nova escala ajuda a medir as experiências dos usuários em sistemas de IA explicável.

― 6 min ler


Escala XEQ Avalia aEscala XEQ Avalia aExperiência do Usuário emXAIIA.interações dos usuários com sistemas deNova escala melhora a compreensão das
Índice

A Inteligência Artificial Explicável (XAI) é um campo que busca tornar os sistemas de IA mais compreensíveis para os usuários. Esses sistemas costumam tomar decisões com base em grandes volumes de dados, e a XAI procura fornecer explicações claras de como e por que essas decisões são tomadas. Isso é especialmente importante em aplicações onde confiança e clareza são essenciais, como em saúde, finanças e direito.

A Importância da Experiência do Usuário na XAI

À medida que os sistemas de IA se tornam mais comuns, os usuários querem cada vez mais estar envolvidos em como esses sistemas funcionam. Eles preferem explicações completas que permitam que eles interajam de forma eficaz com os sistemas de XAI. Essa interação centrada no usuário é chamada de Experiência XAI. Ela enfatiza a necessidade de explicações que não apenas informem, mas também engajem os usuários de um jeito que pareça pessoal e relevante para suas necessidades.

Desafios na Avaliação de Experiências XAI

Embora já tenha havido avanços na criação de melhores experiências XAI, avaliar a qualidade delas do ponto de vista do usuário tem se mostrado difícil. Muitos métodos de avaliação existentes focam apenas em explicações únicas ou medidas técnicas, que podem não capturar a experiência completa de interação com um sistema de IA. Para preencher essa lacuna, foi desenvolvido uma nova ferramenta chamada Escala de Qualidade da Experiência XAI (XEQ). Essa ferramenta tem como objetivo avaliar a qualidade das experiências XAI em vários aspectos importantes para os usuários.

O que é a Escala XEQ?

A Escala XEQ, pronunciada "Seek", foi projetada para medir o quanto um sistema XAI atende às necessidades dos seus usuários. Ela analisa quatro áreas-chave:

  1. Aprendizado: Quanto os usuários conseguem aprender com as explicações fornecidas.
  2. Utilidade: O valor prático das informações dadas aos usuários.
  3. Satisfação: Como os usuários se sentem após interagir com o sistema.
  4. Engajamento: Como os usuários se sentem envolvidos e conectados durante a experiência.

Essas dimensões ajudam a proporcionar uma visão mais completa do que torna uma experiência XAI valiosa.

Desenvolvimento da Escala XEQ

Para criar a Escala XEQ, os pesquisadores realizaram uma revisão minuciosa da literatura existente sobre avaliação de XAI. Eles coletaram itens preliminares que eram essenciais para medir a experiência do usuário. Depois, especialistas da área foram convidados a avaliar esses itens quanto à sua relevância. Essa etapa foi crucial para garantir que a escala resultante medisse com precisão os aspectos centrados no usuário das experiências XAI.

A lista inicial de perguntas foi refinada através do feedback de especialistas, resultando em uma lista de 32 afirmações projetadas para avaliar vários elementos das experiências XAI. Cada uma dessas perguntas é avaliada em uma escala, permitindo que os usuários expressem seu grau de concordância ou discordância.

Realizando Estudos Piloto

Depois que a Escala XEQ foi criada, ela foi testada em estudos piloto para ver como funcionava em cenários do mundo real. Esses estudos envolveram participantes interagindo com diferentes sistemas XAI. Por exemplo, um grupo poderia usar um chatbot que ajuda alunos a escolher cursos, enquanto outro grupo interagia com um sistema que ajuda candidatos a benefícios sociais.

Os participantes avaliaram suas experiências após interagir com esses sistemas. O feedback forneceu insights sobre como a Escala XEQ capturava a qualidade de suas experiências.

Consistência Interna e Validade

Um aspecto importante de qualquer ferramenta de avaliação é a consistência interna, que garante que os itens da escala medem o mesmo conceito subjacente. Nesse caso, isso confirma que todos os itens avaliam efetivamente a qualidade das experiências XAI. Os resultados do estudo piloto indicaram que a Escala XEQ tem forte consistência interna, o que significa que a escala mede de forma confiável o que se propõe a medir.

Compreendendo Validade Discriminante e de Construto

A validade discriminante verifica se a escala consegue diferenciar entre diferentes tipos de experiências, como interações positivas e negativas. Os estudos mostraram que a Escala XEQ pode distinguir efetivamente entre essas experiências, confirmando sua capacidade de fornecer feedback significativo sobre as interações dos usuários com os sistemas XAI.

A validade de construto, por outro lado, avalia se a escala realmente mede a qualidade da experiência XAI como pretendido. Através de várias análises estatísticas, os pesquisadores descobriram que os itens da Escala XEQ refletem de fato o conceito de experiências XAI centradas no usuário.

Implicações para Profissionais

A introdução da Escala XEQ oferece aos profissionais da área de XAI um recurso valioso. Ao aplicar essa escala, eles podem obter insights sobre o desempenho de seus sistemas sob a perspectiva do usuário. Compreender como os usuários percebem suas interações com a XAI pode levar a melhorias no design do sistema, tornando a IA mais acessível e confiável para todos.

Direções Futuras para a Escala XEQ

O desenvolvimento da Escala XEQ é apenas o começo. Pesquisas futuras visam ampliar suas aplicações em vários domínios além dos testados inicialmente. Isso inclui potenciais aplicações em saúde, onde entender as decisões da IA pode impactar o cuidado ao paciente, ou em finanças, onde a transparência é crucial para a confiança do cliente.

Além disso, os pesquisadores planejam criar um benchmark para experiências XAI usando a Escala XEQ. Esse benchmark categorizará sistemas XAI com base na qualidade das experiências que oferecem, ajudando os desenvolvedores a identificar áreas para melhoria. Ao atualizar regularmente esse benchmark, os profissionais terão uma ferramenta dinâmica para aprimorar continuamente a qualidade de seus sistemas.

Conclusão

A Escala XEQ representa um avanço significativo na avaliação das experiências XAI. Ela preenche uma lacuna importante ao se concentrar na perspectiva do usuário, permitindo uma compreensão mais rica de como esses sistemas funcionam. À medida que a IA continua a evoluir, ferramentas como a Escala XEQ desempenharão um papel crucial em garantir que essas tecnologias permaneçam centradas no usuário, transparentes e eficazes.

Considerações Éticas

Os estudos que guiaram o desenvolvimento da Escala XEQ seguiram diretrizes éticas, garantindo que todos os participantes fornecessem consentimento informado antes de participar. Esse compromisso com a ética é vital na pesquisa, especialmente em campos que afetam diretamente a vida das pessoas.

Resumindo, o trabalho na Escala XEQ não apenas contribui para a literatura acadêmica, mas também oferece ferramentas práticas para melhorar as interações dos usuários com sistemas de IA. O futuro da IA depende de esforços como esses para tornar a tecnologia mais inclusiva e compreensível.

Fonte original

Título: XEQ Scale for Evaluating XAI Experience Quality Grounded in Psychometric Theory

Resumo: Explainable Artificial Intelligence (XAI) aims to improve the transparency of autonomous decision-making through explanations. Recent literature has emphasised users' need for holistic "multi-shot" explanations and the ability to personalise their engagement with XAI systems. We refer to this user-centred interaction as an XAI Experience. Despite advances in creating XAI experiences, evaluating them in a user-centred manner has remained challenging. To address this, we introduce the XAI Experience Quality (XEQ) Scale (pronounced "Seek" Scale), for evaluating the user-centred quality of XAI experiences. Furthermore, XEQ quantifies the quality of experiences across four evaluation dimensions: learning, utility, fulfilment and engagement. These contributions extend the state-of-the-art of XAI evaluation, moving beyond the one-dimensional metrics frequently developed to assess single-shot explanations. In this paper, we present the XEQ scale development and validation process, including content validation with XAI experts as well as discriminant and construct validation through a large-scale pilot study. Out pilot study results offer strong evidence that establishes the XEQ Scale as a comprehensive framework for evaluating user-centred XAI experiences.

Autores: Anjana Wijekoon, Nirmalie Wiratunga, David Corsar, Kyle Martin, Ikechukwu Nkisi-Orji, Belen Díaz-Agudo, Derek Bridge

Última atualização: 2024-08-23 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2407.10662

Fonte PDF: https://arxiv.org/pdf/2407.10662

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes