Abordando la desinformación con FACTIFY 3M
Un conjunto de datos diseñado para mejorar la verificación de hechos al combinar texto e imágenes.
― 6 minilectura
Tabla de contenidos
La desinformación es un problema serio en la sociedad de hoy. Mucha gente cree que causa confusión y puede llevar a daños reales. Por ejemplo, puede afectar elecciones, causar pánico en los mercados e incluso llevar a situaciones peligrosas durante crisis. Con la cantidad de contenido que se comparte en línea cada día, es crucial encontrar formas efectivas de identificar y manejar la desinformación.
Nuestro enfoque está en crear una herramienta para ayudar a verificar información en diferentes formatos como texto e imágenes, conocida como verificación de hechos multimodal. Desarrollamos el conjunto de datos FACTIFY 3M, que incluye tres millones de muestras diseñadas para mejorar la verificación de afirmaciones que pueden ser apoyadas o refutadas.
¿Qué es FACTIFY 3M?
FACTIFY 3M es un conjunto de datos grande que ayuda a los investigadores a trabajar en el problema de verificar hechos en una gama de formatos. El conjunto de datos viene con varias características, incluyendo:
- Afirmaciones de Texto: Declaraciones o afirmaciones que necesitan verificación.
- Afirmaciones Para fraseadas: Variaciones de las mismas afirmaciones generadas usando herramientas de IA.
- Imágenes Asociadas: Imágenes que vienen con las afirmaciones.
- Imágenes Generadas: Imágenes adicionales creadas por IA para ilustrar mejor las afirmaciones.
- Mapas de Calor de Imágenes: Visuales que destacan áreas importantes en las imágenes que se relacionan con las afirmaciones.
- Pares de Pregunta-Respuesta 5W: Preguntas estructuradas que ayudan a desglosar las afirmaciones para una mejor verificación.
- Historias de Noticias Falsas: Artículos falsos creados para probar el proceso de verificación.
Importancia de la Verificación Multimodal de Hechos
Internet está lleno de tres mil millones de imágenes y una gran cantidad de contenido en video que se comparte a diario. Esto hace que sea fácil que la desinformación se propague rápidamente. La verificación de hechos tradicional se ha centrado principalmente en texto, pero hay una necesidad de incorporar datos visuales también. FACTIFY 3M cierra esta brecha al combinar texto e imágenes para dar un enfoque de verificación más completo.
Cómo Funciona FACTIFY 3M
El conjunto de datos ayuda a los investigadores a abordar el desafío de verificar la veracidad de las afirmaciones proporcionando tanto la afirmación misma como varios elementos de apoyo. Al incluir diferentes tipos de contenido, fomenta un examen más exhaustivo de la información.
Para fraseando Afirmaciones
Para crear un conjunto de datos rico, usamos herramientas de IA para parafrasear afirmaciones. Esto significa que generamos diferentes formas de expresar la misma idea. Hacer esto aumenta la variedad de ejemplos que tenemos para análisis y pruebas.
Por ejemplo, una afirmación sobre una celebridad podría tener varias versiones, cada una con ligeros cambios en las palabras pero el mismo mensaje general. Esta diversidad ayuda a desarrollar herramientas de verificación más robustas.
Generación de Imágenes
Junto con el texto, las imágenes juegan un papel importante en cómo se perciben las afirmaciones. Para mejorar el conjunto de datos, usamos IA para crear imágenes adicionales que puedan apoyar o contradecir visualmente las afirmaciones. Esto le da a los investigadores un contexto visual que puede ser crucial para determinar la veracidad de una declaración.
Análisis de Imágenes con Mapas de Calor
Para explicar mejor cómo las imágenes se relacionan con las afirmaciones, desarrollamos mapas de calor. Estos visuales destacan partes de las imágenes que son relevantes para el texto, facilitando la comprensión de las conexiones entre ambos.
Preguntas 5W para Claridad
Para asegurar un examen completo, creamos pares de pregunta-respuesta basados en la afirmación. Estas preguntas siguen las 5W: Quién, Qué, Cuándo, Dónde y Por Qué. Este enfoque estructurado descompone la afirmación en partes manejables y hace que la verificación sea más clara.
Por ejemplo, si una afirmación dice que alguien visitó un hospital, las preguntas podrían incluir:
- ¿Quién visitó el hospital?
- ¿Cuándo visitó?
- ¿Cuál fue la razón de la visita?
Estas preguntas ayudan a guiar el proceso de verificación de hechos y proporcionan un marco para las respuestas necesarias para verificar la afirmación.
El Papel de las Noticias Falsas Adversariales
Como parte de nuestro trabajo, también nos enfocamos en lo que se conoce como noticias falsas adversariales. Esto se refiere a historias falsas diseñadas para confundir los sistemas de verificación. Al incluir estas en nuestro conjunto de datos, desafiamos a los investigadores a construir sistemas que puedan identificar y manejar información engañosa de manera efectiva.
Generando Historias Adversariales
Usando modelos de lenguaje avanzados, creamos artículos de noticias falsas que imitan los informes de noticias reales. Esta variabilidad asegura que las herramientas de verificación de hechos desarrolladas utilizando FACTIFY 3M serán más resistentes y adaptables a los tipos de contenido que encontrarán en línea.
Evaluando la Calidad de la Generación de Imágenes
Hemos puesto un esfuerzo significativo en evaluar la calidad de las imágenes generadas por IA. Se utilizan dos enfoques principales:
- Fréchet Inception Distance (FID): Esta métrica ayuda a comparar la calidad de las imágenes generadas midiendo su similitud con imágenes reales.
- Mean Opinion Score (MOS): En este método, evaluadores humanos valoran las imágenes generadas según su alineación con las expectativas de calidad.
Estas evaluaciones aseguran que las imágenes añadidas al conjunto de datos mantengan un alto estándar y sean relevantes para las afirmaciones que se están verificando.
Conclusión
En resumen, FACTIFY 3M es una herramienta integral diseñada para abordar el complejo problema de la verificación de información en un mundo donde la desinformación puede propagarse rápidamente. Al integrar varios formatos de información, incluyendo texto e imágenes, y aprovechar la IA para la parafrasear y la generación de imágenes, FACTIFY 3M busca mejorar la capacidad de los investigadores y verificadores de hechos para discernir la verdad de la falsedad de manera efectiva.
A través del enfoque estructurado de preguntas y respuestas 5W y la adición de escenarios de noticias falsas adversariales, esperamos que este conjunto de datos facilite avances significativos en el campo de la verificación multimodal de hechos. A medida que avanzamos, FACTIFY 3M estará disponible públicamente para fines de investigación, invitando a la colaboración y la innovación en esta área crítica de estudio.
Título: FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering
Resumen: Combating disinformation is one of the burning societal crises -- about 67% of the American population believes that disinformation produces a lot of uncertainty, and 10% of them knowingly propagate disinformation. Evidence shows that disinformation can manipulate democratic processes and public opinion, causing disruption in the share market, panic and anxiety in society, and even death during crises. Therefore, disinformation should be identified promptly and, if possible, mitigated. With approximately 3.2 billion images and 720,000 hours of video shared online daily on social media platforms, scalable detection of multimodal disinformation requires efficient fact verification. Despite progress in automatic text-based fact verification (e.g., FEVER, LIAR), the research community lacks substantial effort in multimodal fact verification. To address this gap, we introduce FACTIFY 3M, a dataset of 3 million samples that pushes the boundaries of the domain of fact verification via a multimodal fake news dataset, in addition to offering explainability through the concept of 5W question-answering. Salient features of the dataset include: (i) textual claims, (ii) ChatGPT-generated paraphrased claims, (iii) associated images, (iv) stable diffusion-generated additional images (i.e., visual paraphrases), (v) pixel-level image heatmap to foster image-text explainability of the claim, (vi) 5W QA pairs, and (vii) adversarial fake news stories.
Autores: Megha Chakraborty, Khushbu Pahwa, Anku Rani, Shreyas Chatterjee, Dwip Dalal, Harshit Dave, Ritvik G, Preethi Gurumurthy, Adarsh Mahor, Samahriti Mukherjee, Aditya Pakala, Ishan Paul, Janvita Reddy, Arghya Sarkar, Kinjal Sensharma, Aman Chadha, Amit P. Sheth, Amitava Das
Última actualización: 2023-10-30 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2306.05523
Fuente PDF: https://arxiv.org/pdf/2306.05523
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.