Comprendre la désinformation basée sur les médias : une plongée approfondie
Cette étude met en lumière comment les médias alimentent la désinformation en ligne.
― 6 min lire
Table des matières
- L'Importance des Médias dans la Désinformation
- Aperçu de l'Étude
- Collecte et Analyse des Données
- Types de Médias Utilisés dans la Désinformation
- Techniques de Manipulation dans la Désinformation
- Le Rôle du Texte dans les Images de Désinformation
- Tendances de la Désinformation au Fil du Temps
- L'Impact des Événements Mondiaux sur la Désinformation
- Conclusion
- Source originale
- Liens de référence
La Désinformation est devenue un gros problème dans notre monde en ligne. Ça fait référence à des infos fausses ou trompeuses qui se propagent rapidement, surtout sur les réseaux sociaux. Cette étude se concentre sur la désinformation basée sur les Médias, qui inclut des Images, des Vidéos et d'autres formes de médias qui soutiennent des affirmations trompeuses. Un nouveau jeu de données appelé AMMeBa a été créé pour mieux comprendre ce problème. AMMeBa veut dire Mésinformation Annotée, Basée sur les Médias, et ça contient une grande collection d'exemples de désinformation avec leurs caractéristiques.
L'Importance des Médias dans la Désinformation
Avec la multiplication des médias, comme les images et les vidéos, la désinformation utilise souvent ces formats pour créer un impact. En fait, environ 80 % des affirmations de désinformation qui ont été vérifiées incluent un type de média. Ce média peut rendre les fausses affirmations plus crédibles et persuasives, changeant la façon dont les gens perçoivent l'info. L'utilisation d'images et de vidéos augmente l'engagement, les rendant puissants pour ceux qui propagent la désinformation.
Aperçu de l'Étude
La recherche menée sur deux ans visait à examiner et à catégoriser la désinformation basée sur les médias. En utilisant des évaluateurs humains, l'étude a recueilli des infos sur les images utilisées dans des affirmations trompeuses. Cela incluait l'examen des types d'images, des Manipulations impliquées et comment ces éléments affectent les affirmations de désinformation. Les résultats offrent un aperçu du paysage de la désinformation à notre époque numérique.
Collecte et Analyse des Données
L'étude a analysé un total de 135 838 affirmations vérifiées depuis 1995, se concentrant principalement sur celles d'après 2016, quand ClaimReview a été introduit. Les affirmations ont été évaluées pour la présence de média, avec une majorité étant reliée à des images. Historiquement, les images dominaient le paysage médiatique de la désinformation, mais les vidéos sont devenues de plus en plus courantes depuis 2022.
La montée des outils d'IA générative qui créent des médias réalistes a intensifié les inquiétudes sur la désinformation. Cependant, le contenu généré par l'IA était rare jusqu'au début de 2023, quand ça a rapidement augmenté aux côtés des manipulations d'images traditionnelles, qui nécessitaient souvent moins de compétences techniques.
Types de Médias Utilisés dans la Désinformation
Les images peuvent être classées en deux types principaux : basiques et complexes. Les images basiques ressemblent à des photos sans superpositions significatives. Les images complexes incluent des éléments supplémentaires comme du texte, des composants graphiques ou plusieurs images combinées. La recherche a montré que les images complexes sont plus courantes, car elles apparaissent souvent quand le contenu est partagé à nouveau ou modifié pour plus d'engagement.
Screenshots et Leur Rôle
Les screenshots ont leur propre sous-catégorie au sein des images complexes. Ils capturent souvent du contenu des plateformes de réseaux sociaux et peuvent inclure divers éléments d'interface utilisateur. Ces images peuvent obscurcir le contexte original de l'information, faisant d'elles un puissant véhicule pour la désinformation.
Techniques de Manipulation dans la Désinformation
La désinformation peut être manipulée de différentes façons. Il y a deux grandes catégories de manipulation : les manipulations de contenu et de contexte.
Manipulations de Contenu
Les manipulations de contenu consistent à altérer l'image réelle ou à en créer une toute nouvelle pour soutenir une fausse affirmation. Les méthodes courantes incluent :
- Manipulations Générales : Édits simples utilisant des outils de photo.
- Texte Manipulé : Changer ou ajouter du texte qui semble faire partie de l'image originale.
- Images Générées par IA : Images créées par des outils d'IA générative qui peuvent sembler très réalistes.
Manipulations de Contexte
Les manipulations de contexte se concentrent sur la fourniture de fausses infos sur l'image elle-même. Ça peut inclure des affirmations trompeuses sur quand ou où l'image a été prise ou ce qu'elle représente. Dans de nombreux cas, l'image reste inchangée, mais l'affirmation qui l'accompagne est fausse.
Le Rôle du Texte dans les Images de Désinformation
Le texte accompagne souvent les images, clarifiant ou amplifiant la désinformation. Environ 80 % des images contenant de la désinformation présentent également du texte. Ce texte peut soit renforcer la fausse affirmation, soit être complètement trompeur.
Tendances de la Désinformation au Fil du Temps
L'étude a révélé des tendances au fil des ans concernant l'utilisation des médias dans la désinformation. Avec la montée en popularité de plateformes comme YouTube et TikTok, l'utilisation de contenu vidéo dans la désinformation a considérablement augmenté. Bien que les images demeurent une partie cruciale de la désinformation, les vidéos ont commencé à jouer un rôle plus central, indiquant un changement dans la façon dont l'information trompeuse est partagée.
L'Impact des Événements Mondiaux sur la Désinformation
Des événements mondiaux significatifs peuvent entraîner une augmentation des volumes de désinformation. Par exemple, la pandémie de COVID-19 a vu une montée rapide des activités de vérification des faits, car la désinformation liée à la santé a largement émergé pendant cette période. Cependant, bien que la quantité d'affirmations de désinformation puisse exploser avec des événements, les types de médias utilisés ne changent pas toujours de manière significative en réponse.
Conclusion
La désinformation est un problème complexe qui continue d'évoluer avec la technologie et l'utilisation des médias. Comprendre comment les médias, en particulier les images et les vidéos, sont employés dans les affirmations de désinformation est crucial pour lutter contre sa propagation. Le jeu de données AMMeBa fournit des insights précieux sur ces dynamiques, soulignant la nécessité d'une recherche continue et de stratégies efficaces pour atténuer l'impact des infos trompeuses en ligne. À mesure que les tactiques de désinformation deviennent plus sophistiquées, nos efforts pour identifier et traiter ces affirmations nuisibles doivent également s'adapter.
Titre: AMMeBa: A Large-Scale Survey and Dataset of Media-Based Misinformation In-The-Wild
Résumé: The prevalence and harms of online misinformation is a perennial concern for internet platforms, institutions and society at large. Over time, information shared online has become more media-heavy and misinformation has readily adapted to these new modalities. The rise of generative AI-based tools, which provide widely-accessible methods for synthesizing realistic audio, images, video and human-like text, have amplified these concerns. Despite intense public interest and significant press coverage, quantitative information on the prevalence and modality of media-based misinformation remains scarce. Here, we present the results of a two-year study using human raters to annotate online media-based misinformation, mostly focusing on images, based on claims assessed in a large sample of publicly-accessible fact checks with the ClaimReview markup. We present an image typology, designed to capture aspects of the image and manipulation relevant to the image's role in the misinformation claim. We visualize the distribution of these types over time. We show the rise of generative AI-based content in misinformation claims, and that its commonality is a relatively recent phenomenon, occurring significantly after heavy press coverage. We also show "simple" methods dominated historically, particularly context manipulations, and continued to hold a majority as of the end of data collection in November 2023. The dataset, Annotated Misinformation, Media-Based (AMMeBa), is publicly-available, and we hope that these data will serve as both a means of evaluating mitigation methods in a realistic setting and as a first-of-its-kind census of the types and modalities of online misinformation.
Auteurs: Nicholas Dufour, Arkanath Pathak, Pouya Samangouei, Nikki Hariri, Shashi Deshetti, Andrew Dudfield, Christopher Guess, Pablo Hernández Escayola, Bobby Tran, Mevan Babakar, Christoph Bregler
Dernière mise à jour: 2024-05-21 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2405.11697
Source PDF: https://arxiv.org/pdf/2405.11697
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.reddit.com/
- https://www.youtube.com/
- https://www.tiktok.com/en/
- https://www.claimreviewproject.com/
- https://www.kaggle.com/datasets/googleai/in-the-wild-misinformation-media/
- https://discord.com/
- https://www.midjourney.com/home
- https://stability.ai/
- https://twitter.com/
- https://www.reddit.com/r/photoshopbattles/
- https://www.facebook.com/