Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Inteligencia artificial# Interacción Persona-Ordenador

Evaluando experiencias de XAI con la escala XEQ

Una nueva escala ayuda a medir las experiencias de los usuarios en sistemas de IA explicable.

― 7 minilectura


La escala XEQ evalúa laLa escala XEQ evalúa laexperiencia del usuarioen XAI.los sistemas de IA.las interacciones de los usuarios conNueva escala mejora la comprensión de
Tabla de contenidos

La Inteligencia Artificial Explicable (XAI) es un campo que busca hacer que los sistemas de IA sean más comprensibles para los usuarios. Estos sistemas a menudo toman decisiones basadas en grandes cantidades de datos, y XAI busca ofrecer explicaciones claras de cómo y por qué se toman esas decisiones. Esto es particularmente importante en aplicaciones donde la confianza y la claridad son vitales, como en la salud, las finanzas y el derecho.

La Importancia de la Experiencia del usuario en XAI

A medida que los sistemas de IA se vuelven más comunes, los usuarios quieren involucrarse más en cómo funcionan. Prefieren explicaciones completas que les permitan interactuar con los sistemas de XAI de manera efectiva. Esta interacción centrada en el usuario se llama la Experiencia XAI. Destaca la necesidad de explicaciones que no solo informen, sino que también involucren a los usuarios de una manera que se sienta personal y relevante para sus necesidades.

Desafíos en la Evaluación de las Experiencias de XAI

Aunque se han hecho avances en la creación de mejores experiencias de XAI, evaluar su calidad desde la perspectiva del usuario ha sido complicado. Muchos métodos de evaluación existentes se centran solo en explicaciones únicas o medidas técnicas, que podrían no capturar la experiencia completa de interactuar con un sistema de IA. Para llenar este vacío, se desarrolló una nueva herramienta llamada la Escala de Calidad de la Experiencia XAI (XEQ). Esta herramienta busca evaluar la calidad de las experiencias de XAI a través de varios aspectos importantes para los usuarios.

¿Qué es la Escala XEQ?

La Escala XEQ, pronunciada "Seek", está diseñada para medir qué tan bien un sistema de XAI satisface las necesidades de sus usuarios. Se centra en cuatro áreas clave:

  1. Aprendizaje: Cuánto conocimiento pueden obtener los usuarios de las explicaciones proporcionadas.
  2. Utilidad: El valor práctico de la información dada a los usuarios.
  3. Satisfacción: Qué tan satisfechos se sienten los usuarios después de interactuar con el sistema.
  4. Compromiso: Qué tan involucrados y conectados se sienten los usuarios durante su experiencia.

Estas dimensiones ayudan a proporcionar una visión más completa de lo que hace valiosa una experiencia de XAI.

Desarrollo de la Escala XEQ

Para crear la Escala XEQ, los investigadores llevaron a cabo una revisión exhaustiva de la literatura existente sobre la evaluación de XAI. Reunieron elementos preliminares que eran esenciales para medir la experiencia del usuario. Luego, se invitó a expertos en el campo a evaluar estos elementos por su relevancia. Este paso fue crucial para garantizar que la escala resultante midiera de manera precisa los aspectos centrados en el usuario de las experiencias de XAI.

La lista inicial de preguntas se refinó a través de la retroalimentación de expertos, lo que llevó a una lista de 32 afirmaciones diseñadas para evaluar varios elementos de las experiencias de XAI. Cada una de estas preguntas se califica en una escala, lo que permite a los usuarios expresar su acuerdo o desacuerdo.

Realización de Estudios Piloto

Una vez creada la Escala XEQ, se puso a prueba en estudios piloto para ver qué tan bien funcionaba en escenarios del mundo real. Estos estudios involucraron a participantes interactuando con diferentes sistemas de XAI. Por ejemplo, un grupo podría usar un chatbot que ayuda a los estudiantes a elegir cursos, mientras que otro grupo interactúa con un sistema que ayuda a los solicitantes de asistencia social.

Los participantes calificaron sus experiencias después de interactuar con estos sistemas. La retroalimentación proporcionó información sobre qué tan bien la Escala XEQ capturó la calidad de sus experiencias.

Consistencia Interna y Validez

Un aspecto importante de cualquier herramienta de evaluación es la consistencia interna, que asegura que los elementos de la escala midan el mismo concepto subyacente. En este caso, confirma que todos los elementos evalúan efectivamente la calidad de las experiencias de XAI. Los resultados del estudio piloto indicaron que la Escala XEQ tiene una fuerte consistencia interna, lo que significa que la escala mide de manera confiable lo que pretende.

Entendiendo la Validez Discriminante y de Construcción

La validez discriminante verifica si la escala puede diferenciar entre diferentes tipos de experiencias, como interacciones positivas y negativas. Los estudios demostraron que la Escala XEQ podía distinguir efectivamente entre estas experiencias, confirmando su capacidad para proporcionar retroalimentación significativa sobre las interacciones de los usuarios con los sistemas de XAI.

La validez de construcción, por otro lado, evalúa si la escala realmente mide la calidad de la experiencia de XAI como se pretendía. A través de varios análisis estadísticos, los investigadores encontraron que los elementos de la Escala XEQ reflejan de hecho el concepto de experiencias de XAI centradas en el usuario.

Implicaciones para los Profesionales

La introducción de la Escala XEQ proporciona a los profesionales en el campo de XAI un recurso valioso. Al aplicar esta escala, pueden obtener información sobre cómo están funcionando sus sistemas desde la perspectiva del usuario. Entender cómo los usuarios perciben sus interacciones con XAI puede llevar a mejoras en el diseño del sistema, haciendo que la IA sea más accesible y confiable para todos.

Direcciones Futuras para la Escala XEQ

El desarrollo de la Escala XEQ es solo el comienzo. La investigación futura tiene como objetivo ampliar sus aplicaciones a diversos dominios más allá de los inicialmente probados. Esto incluye aplicaciones potenciales en salud, donde entender las decisiones de IA puede impactar el cuidado del paciente, o en finanzas, donde la transparencia es crucial para la confianza del cliente.

Además, los investigadores planean crear un estándar para las experiencias de XAI usando la Escala XEQ. Este estándar clasificaría los sistemas de XAI en función de la calidad de las experiencias que ofrecen, ayudando a los desarrolladores a identificar áreas de mejora. Al actualizar regularmente este estándar, los profesionales tendrán una herramienta dinámica para mejorar continuamente la calidad de sus sistemas.

Conclusión

La Escala XEQ representa un avance significativo en la evaluación de experiencias de XAI. Llena un vacío importante al enfocarse en la perspectiva del usuario, permitiendo una comprensión más rica de cómo funcionan estos sistemas. A medida que la IA continúa evolucionando, herramientas como la Escala XEQ jugarán un papel crucial en asegurar que estas tecnologías sigan siendo centradas en el usuario, transparentes y efectivas.

Consideraciones Éticas

Los estudios que guiaron el desarrollo de la Escala XEQ se adhirieron a las directrices éticas, asegurando que todos los participantes dieran su consentimiento informado antes de participar. Este compromiso con la ética es vital en la investigación, especialmente en campos que afectan directamente la vida de las personas.

En resumen, el trabajo en la Escala XEQ no solo contribuye a la literatura académica, sino que también ofrece herramientas prácticas para mejorar las interacciones de los usuarios con los sistemas de IA. El futuro de la IA depende de tales esfuerzos para hacer la tecnología más inclusiva y comprensible.

Fuente original

Título: XEQ Scale for Evaluating XAI Experience Quality Grounded in Psychometric Theory

Resumen: Explainable Artificial Intelligence (XAI) aims to improve the transparency of autonomous decision-making through explanations. Recent literature has emphasised users' need for holistic "multi-shot" explanations and the ability to personalise their engagement with XAI systems. We refer to this user-centred interaction as an XAI Experience. Despite advances in creating XAI experiences, evaluating them in a user-centred manner has remained challenging. To address this, we introduce the XAI Experience Quality (XEQ) Scale (pronounced "Seek" Scale), for evaluating the user-centred quality of XAI experiences. Furthermore, XEQ quantifies the quality of experiences across four evaluation dimensions: learning, utility, fulfilment and engagement. These contributions extend the state-of-the-art of XAI evaluation, moving beyond the one-dimensional metrics frequently developed to assess single-shot explanations. In this paper, we present the XEQ scale development and validation process, including content validation with XAI experts as well as discriminant and construct validation through a large-scale pilot study. Out pilot study results offer strong evidence that establishes the XEQ Scale as a comprehensive framework for evaluating user-centred XAI experiences.

Autores: Anjana Wijekoon, Nirmalie Wiratunga, David Corsar, Kyle Martin, Ikechukwu Nkisi-Orji, Belen Díaz-Agudo, Derek Bridge

Última actualización: 2024-08-23 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2407.10662

Fuente PDF: https://arxiv.org/pdf/2407.10662

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares