Simple Science

La science de pointe expliquée simplement

# Informatique# Recherche d'informations

S'attaquer à la désinformation dans les captures d'écran

Un outil pour vérifier l'authenticité des captures d'écran de réseaux sociaux.

― 6 min lire


Vérification des capturesVérification des capturesd'écran des réseauxsociauxoutils d'analyse avancés.Combattez la désinformation avec des
Table des matières

Les Captures d'écran sont super répandues sur les réseaux sociaux pour partager des infos. Beaucoup de gens partagent ces images sans vérifier si le post original est vrai ou faux. Partager de fausses captures peut balancer un max de désinformations et de confusion en ligne. Notre but, c'est de créer un outil qui peut analyser une capture d'écran d'un tweet et calculer les chances qu'elle soit authentique, en utilisant des infos de sites en temps réel et de pages archivées.

Importance des Captures d'Écran

Les captures d'écran permettent aux utilisateurs de partager des posts facilement sur différentes plateformes. Par exemple, quelqu'un peut partager son tweet sur Facebook sous forme de capture pour toucher plus de monde. Elles servent aussi de preuve quand on craint qu'un post soit supprimé. Par exemple, un utilisateur a partagé une capture d'écran d'un tweet sur un événement tragique qui a ensuite été enlevé.

Défis avec les Tweets Falsifiés

C'est facile de créer de faux tweets avec des outils en ligne. Une fois qu'un faux tweet est transformé en capture d'écran, c'est galère de dire si c'est vrai ou pas. Actuellement, il n'existe pas d'outils qui peuvent automatiquement vérifier si une capture d'écran est authentique. Les gens cherchent souvent en ligne ou consultent des sites de fact-checking pour vérifier le contenu, mais ça peut prendre un temps fou. Par exemple, un tweet inventé a été vérifié par un site de fact-checking juste après avoir été partagé.

Validation des Captures d'Écran

Pour vérifier si une capture d'écran est réelle, les gens peuvent checker sur les moteurs de recherche ou des sites de fact-checking. Ils peuvent aussi fouiller dans les archives web pour retrouver des posts supprimés. Des outils automatisés pourraient simplifier ce processus. On vise à créer un outil qui aidera les utilisateurs à confirmer si le contenu d'une capture d'écran est authentique ou faux.

Extraction d'Informations des Captures d'Écran

Avant de vérifier l'authenticité d'une capture d'écran, il faut d'abord extraire des infos importantes. Ça inclut le texte du tweet, l'heure et le pseudo Twitter de l'utilisateur. On développe des méthodes pour faire ça efficacement.

Aperçu de la Méthodologie

Le processus implique de rassembler des images de captures d'écran, de définir des stratégies de recherche et de vérifier si le contenu original peut être trouvé en ligne. Si le contenu peut être vérifié, c'est réel ; sinon, on évaluera les chances que ce soit faux.

Création de Jeu de Données

On a rassemblé un jeu de données contenant 200 images de tweets, avec des exemples vrais et faux. Ce jeu de données va nous aider à créer et tester notre outil de manière efficace.

Retour à Contenu Original

Une étape importante est de trouver le lien original du tweet montré dans la capture d'écran. Le texte du tweet et le pseudo Twitter peuvent servir de mots-clés dans un moteur de recherche. Ainsi, si le tweet est réel, le lien original peut être trouvé.

Utilisation des Moteurs de Recherche

On peut utiliser une partie du texte du tweet avec le pseudo Twitter pour chercher sur des plateformes comme Google. Ça mène souvent à l'URL du tweet original, prouvant que le contenu est authentique.

Utilisation des Sites de Fact-Checking

Une autre méthode consiste à utiliser le timestamp et le texte sur un site de fact-checking pour vérifier si le contenu a déjà été posté par l'auteur prétendu. Par exemple, un tweet contenant de fausses infos a été démenti par un de ces sites.

Recherche dans les Archives Web

Les archives web, comme la Wayback Machine, peuvent aider à retrouver des tweets supprimés. Ces archives stockent des anciennes pages web et peuvent être fouillées en utilisant le pseudo Twitter et la date du tweet. C'est super utile pour retrouver du contenu qui n'est peut-être plus visible sur Twitter.

Reconnaissance Optique de Caractères (OCR)

Pour extraire du texte d'une capture d'écran, on va utiliser un outil appelé Reconnaissance Optique de Caractères (OCR). Cette technologie lit le texte des images et le convertit en texte modifiable. Ça nous permet de sortir le texte du tweet, le pseudo et le timestamp de la capture d'écran.

Évaluation des Méthodes d'Extraction de Timestamp

On a testé deux méthodes pour extraire les timestamps des captures d'écran. La première utilise un outil Python spécial pour trouver des chaînes de dates, tandis que la seconde cherche des patterns numériques dans le texte. Nos résultats ont montré que la seconde méthode est plus précise pour extraire le bon timestamp.

Défis dans l'Extraction de Timestamp

Certaines captures d'écran n'ont pas de timestamps dans un format standard, ce qui rend l'extraction difficile. Par exemple, si un timestamp est présenté comme "27m," on ne peut pas l'utiliser pour générer une date complète.

Extraction des Pseudos Twitter

Extraire le pseudo Twitter d'une capture d'écran demande une attention particulière. Les pseudos Twitter commencent par "@" et il peut y avoir plus d'un pseudo dans un tweet. Donc, on extrait seulement le premier pseudo qui apparaît dans une capture d'écran.

Performance de la Méthode d'Extraction de Pseudo

On a testé notre méthode pour extraire les pseudos Twitter. Les résultats ont montré que notre approche pour identifier les pseudos était plutôt réussie, même s'il peut y avoir des cas où le pseudo est incomplet.

Conclusion

Les captures d'écran sont devenues un moyen courant de partager du contenu sur les réseaux sociaux. Cependant, le risque de diffuser des désinformations via de fausses captures est réel. Ce travail vise à relever le défi de vérifier l'authenticité des captures d'écran. Le jeu de données qu'on a collecté et l'outil automatisé qu'on développe seront précieux pour lutter contre la désinformation et garantir que le contenu partagé en ligne est fiable.

Plus d'auteurs

Articles similaires