Simple Science

La science de pointe expliquée simplement

# Informatique# Intelligence artificielle# Interaction homme-machine

Évaluer les expériences XAI avec l'échelle XEQ

Une nouvelle échelle aide à mesurer les expériences des utilisateurs dans les systèmes d'IA explicables.

― 7 min lire


L'échelle XEQ évalueL'échelle XEQ évaluel'expérience utilisateurde l'IA explicable.utilisateurs avec les systèmes d'IA.compréhension des interactions desUne nouvelle échelle améliore la
Table des matières

L'Intelligence Artificielle Explicable (XAI) est un domaine qui vise à rendre les systèmes d'IA plus compréhensibles pour les utilisateurs. Ces systèmes prennent souvent des décisions basées sur de grandes quantités de données, et la XAI cherche à fournir des explications claires sur comment et pourquoi ces décisions sont prises. C’est super important dans des domaines où la confiance et la clarté sont essentielles, comme la santé, la finance et le droit.

L'Importance de l'Expérience Utilisateur dans la XAI

Avec la montée des systèmes d'IA, les utilisateurs veulent de plus en plus s'impliquer dans leur fonctionnement. Ils préfèrent des explications complètes qui leur permettent d'interagir efficacement avec les systèmes de XAI. Cette interaction centrée sur l'utilisateur est appelée l'expérience XAI. Ça met en avant le besoin d'explications qui non seulement informent mais aussi engagent les utilisateurs d'une manière personnelle et pertinente pour leurs besoins.

Défis d'Évaluation des Expériences XAI

Bien qu'il y ait eu des avancées dans la création de meilleures expériences XAI, évaluer leur qualité du point de vue de l'utilisateur s'est avéré difficile. Beaucoup de méthodes d'évaluation existantes se concentrent uniquement sur des explications uniques ou des mesures techniques, ce qui ne reflète pas la pleine expérience d'interaction avec un système d'IA. Pour combler cette lacune, un nouvel outil appelé l'Échelle de Qualité d'Expérience XAI (XEQ) a été développé. Cet outil vise à évaluer la qualité des expériences XAI sur divers aspects importants pour les utilisateurs.

Qu'est-ce que l'Échelle XEQ ?

L'Échelle XEQ, prononcée "Seek", est conçue pour mesurer dans quelle mesure un système XAI répond aux besoins de ses utilisateurs. Elle examine quatre domaines clés :

  1. Apprentissage : À quel point les utilisateurs peuvent acquérir des connaissances grâce aux explications fournies.
  2. Utilité : La valeur pratique des informations données aux utilisateurs.
  3. Satisfaction : À quel point les utilisateurs se sentent satisfaits après avoir interagi avec le système.
  4. Engagement : À quel point les utilisateurs se sentent impliqués et connectés durant leur expérience.

Ces dimensions aident à donner une vue plus complète de ce qui rend une expérience XAI précieuse.

Développement de l'Échelle XEQ

Pour créer l'Échelle XEQ, les chercheurs ont effectué une revue approfondie de la littérature existante sur l'évaluation de la XAI. Ils ont rassemblé des éléments préliminaires essentiels pour mesurer l'expérience utilisateur. Ensuite, des experts du domaine ont été invités à évaluer la pertinence de ces éléments. Cette étape était cruciale pour s'assurer que l'échelle résultante mesurerait avec précision les aspects centrés sur l'utilisateur des expériences XAI.

La liste initiale de questions a été affinée grâce aux retours des experts, aboutissant à une liste de 32 affirmations conçues pour évaluer divers éléments des expériences XAI. Chacune de ces questions est notée sur une échelle, permettant aux utilisateurs d'exprimer leur accord ou désaccord.

Réalisation d'Études Pilotes

Une fois l'Échelle XEQ créée, elle a été testée dans des études pilotes pour voir comment elle fonctionnait dans des scénarios réels. Ces études impliquaient des participants interagissant avec différents systèmes XAI. Par exemple, un groupe pourrait utiliser un chatbot qui aide les étudiants à choisir des cours, tandis qu'un autre groupe interagit avec un système qui aide les candidats à l'aide sociale.

Les participants ont noté leurs expériences après avoir interagi avec ces systèmes. Les retours ont fourni des informations sur la manière dont l'Échelle XEQ capturait la qualité de leurs expériences.

Cohérence Interne et Validité

Un aspect important de tout outil d'évaluation est la cohérence interne, qui garantit que les éléments de l'échelle mesurent le même concept sous-jacent. Dans ce cas, ça confirme que tous les éléments évaluent efficacement la qualité des expériences XAI. Les résultats des études pilotes ont indiqué que l'Échelle XEQ a une forte cohérence interne, ce qui signifie que l'échelle mesure de manière fiable ce qu'elle vise.

Comprendre la Validité Discriminante et de Construct

La validité discriminante vérifie si l'échelle peut faire la différence entre différents types d'expériences, comme les interactions positives et négatives. Les études ont démontré que l'Échelle XEQ pouvait effectivement distinguer ces expériences, confirmant sa capacité à fournir des retours significatifs sur les interactions des utilisateurs avec les systèmes XAI.

La validité de construct, de son côté, évalue si l'échelle mesure réellement la qualité de l'expérience XAI comme prévu. À travers diverses analyses statistiques, les chercheurs ont trouvé que les éléments de l'Échelle XEQ reflètent bien le concept des expériences XAI centrées sur l'utilisateur.

Implications pour les Praticiens

L'introduction de l'Échelle XEQ offre aux praticiens dans le domaine de la XAI un outil précieux. En appliquant cette échelle, ils peuvent obtenir des informations sur la performance de leurs systèmes du point de vue de l'utilisateur. Comprendre comment les utilisateurs perçoivent leurs interactions avec la XAI peut mener à des améliorations dans la conception des systèmes, rendant l'IA plus accessible et fiable pour tous.

Directions Futures pour l'Échelle XEQ

Le développement de l'Échelle XEQ n'est que le début. Les recherches futures visent à élargir ses applications dans divers domaines au-delà de ceux testés initialement. Cela inclut des applications potentielles dans la santé, où comprendre les décisions d'IA peut impacter les soins aux patients, ou dans la finance, où la transparence est cruciale pour la confiance des clients.

De plus, les chercheurs prévoient de créer un référentiel pour les expériences XAI en utilisant l'Échelle XEQ. Ce référentiel classera les systèmes XAI en fonction de la qualité des expériences qu'ils offrent, aidant les développeurs à identifier les domaines à améliorer. En mettant régulièrement à jour ce référentiel, les praticiens disposeront d'un outil dynamique pour améliorer continuellement la qualité de leurs systèmes.

Conclusion

L'Échelle XEQ représente une avancée significative dans l'évaluation des expériences XAI. Elle comble une lacune importante en se concentrant sur la perspective de l'utilisateur, permettant une compréhension plus riche du fonctionnement de ces systèmes. À mesure que l'IA continue d'évoluer, des outils comme l'Échelle XEQ joueront un rôle crucial pour garantir que ces technologies restent centrées sur l'utilisateur, transparentes et efficaces.

Considérations Éthiques

Les études guidant le développement de l'Échelle XEQ ont respecté des directives éthiques, garantissant que tous les participants ont donné leur consentement éclairé avant de participer. Cet engagement envers l'éthique est vital dans la recherche, notamment dans des domaines qui affectent directement la vie des gens.

En résumé, le travail sur l'Échelle XEQ contribue non seulement à la littérature académique mais aussi offre des outils pratiques pour améliorer les interactions des utilisateurs avec les systèmes d'IA. L'avenir de l'IA repose sur de tels efforts pour rendre la technologie plus inclusive et compréhensible.

Source originale

Titre: XEQ Scale for Evaluating XAI Experience Quality Grounded in Psychometric Theory

Résumé: Explainable Artificial Intelligence (XAI) aims to improve the transparency of autonomous decision-making through explanations. Recent literature has emphasised users' need for holistic "multi-shot" explanations and the ability to personalise their engagement with XAI systems. We refer to this user-centred interaction as an XAI Experience. Despite advances in creating XAI experiences, evaluating them in a user-centred manner has remained challenging. To address this, we introduce the XAI Experience Quality (XEQ) Scale (pronounced "Seek" Scale), for evaluating the user-centred quality of XAI experiences. Furthermore, XEQ quantifies the quality of experiences across four evaluation dimensions: learning, utility, fulfilment and engagement. These contributions extend the state-of-the-art of XAI evaluation, moving beyond the one-dimensional metrics frequently developed to assess single-shot explanations. In this paper, we present the XEQ scale development and validation process, including content validation with XAI experts as well as discriminant and construct validation through a large-scale pilot study. Out pilot study results offer strong evidence that establishes the XEQ Scale as a comprehensive framework for evaluating user-centred XAI experiences.

Auteurs: Anjana Wijekoon, Nirmalie Wiratunga, David Corsar, Kyle Martin, Ikechukwu Nkisi-Orji, Belen Díaz-Agudo, Derek Bridge

Dernière mise à jour: 2024-08-23 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.10662

Source PDF: https://arxiv.org/pdf/2407.10662

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires