Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage# Recherche d'informations

Analyser le biais médiatique dans la représentation des figures publiques

Une méthode pour évaluer comment les médias décrivent les personnalités publiques.

― 5 min lire


Analyse de laAnalyse de lareprésentation médiatiquepubliques.les perceptions des personnalitésÉvaluer comment les médias façonnent
Table des matières

Les médias ont souvent leurs propres opinions qui peuvent influencer la façon dont ils parlent des personnalités publiques. Comprendre ces points de vue est super important pour mieux interpréter les infos. Cet article propose une méthode pour analyser comment différentes sources d’infos décrivent les gens.

Le Problème du Biais dans les Médias

Le Biais médiatique peut influencer la représentation d'individus, d’organisations ou de pays. Ce biais n’est pas toujours évident mais peut changer notre compréhension des nouvelles. Pour y voir plus clair, il faut explorer comment divers médias caractérisent certaines personnes.

Les méthodes traditionnelles extraient souvent des caractéristiques spécifiques des articles pour classifier les descriptions. Cependant, cette approche est limitée à cause du nombre énorme de personnes et de sujets que les médias couvrent. Donc, créer des catégories fixes pour classifier les descriptions, c'est pas vraiment pratique.

C'est Quoi la Caractérisation des Entités ?

La caractérisation des entités, ça consiste à capturer les qualités uniques d'une personne ou d'une chose en une phrase courte. Contrairement à la résumé qui vise à être objectif et à coller à des caractéristiques spécifiques, la caractérisation des entités révèle les biais de celui qui rédige la description.

Cet article propose une nouvelle manière de créer ces caractérisations sans extraire de phrases spécifiques. Au lieu de ça, on se concentre sur la génération de descriptions d'une phrase pour les individus. Cette méthode utilise un modèle de langage avancé appelé GPT-2, qui peut produire du texte à partir de prompts donnés.

Utiliser GPT-2 pour la Caractérisation

L'approche consiste à affiner le modèle GPT-2 deux fois. La première phase d'affinement prépare le modèle en utilisant des articles où des individus spécifiques sont décrits, tandis que la deuxième phase se concentre sur des exemples de descriptions générées à partir du premier modèle affiné.

Pour générer une description d’une personne que le modèle n’a pas encore vue, on lui donne un prompt avec le nom de la personne. Le modèle crée alors une phrase simple décrivant cette personne.

Le Processus de Caractérisation

  1. Collecte de Données : On récolte des articles de médias connus. Ces articles contiennent divers exemples de comment des individus sont représentés.

  2. Affinement du Modèle : Le modèle GPT-2 est d’abord ajusté pour comprendre comment les individus sont décrits dans les articles recueillis. Il apprend à reconnaître les motifs dans ces descriptions.

  3. Génération de Descriptions : Après l'affinement, le modèle génère de nouvelles descriptions pour des individus qu’il n’a pas encore vus, en utilisant des prompts issus des données d’entraînement.

Importance des Prompts Diversifiés

Utiliser des phrases naturelles et courantes peut guider efficacement le modèle linguistique pour générer des descriptions précises. Par exemple, commencer un prompt par "John est décrit comme..." a plus de chances de donner une réponse pertinente que d'autres types de prompts. Cette méthode s'assure que le modèle génère des caractérisations compréhensibles et cohérentes des individus.

Gestion des Références et Co-références

Pour améliorer l'exactitude des descriptions, il faut clarifier qui est décrit. On remplace donc les références courtes par les noms complets des individus dans les articles. S'assurer que chaque mention d’une personne est claire aide le modèle à produire de meilleures descriptions.

Validation des Descriptions Générées

Après avoir généré les descriptions, il est crucial de les valider par rapport aux articles originaux. Ce processus consiste à vérifier à quel point les descriptions générées ressemblent aux phrases dans les données d'entraînement. Un bon match indique que la description générée est probablement précise.

Résultats Clés

Les résultats montrent que la nouvelle approche produit efficacement des caractérisations pertinentes et précises. En utilisant des prompts spécifiques et en générant des phrases concises, le modèle capte diverses perspectives des différents médias.

En gros, les descriptions créées par le modèle reflètent les biais et points de vue des sources médiatiques. Ça peut être utile pour comprendre comment différents médias peuvent influencer la perception publique de certaines personnes.

Conclusion

Cet article souligne l'importance d'analyser les représentations médiatiques des personnalités publiques. En développant une méthode pour générer des caractérisations sans se baser sur des classifications prédéfinies, on peut mieux comprendre les biais présents dans les récits médiatiques. L’approche discutée ici peut ouvrir la voie à une analyse plus approfondie de comment les individus sont dépeints dans différents médias.

Directions Futures

Les recherches futures peuvent encore affiner ces méthodes pour améliorer la précision et la fiabilité. De plus, explorer des ensembles de données plus divers peut aider à comprendre des implications sociales plus larges et comment des récits spécifiques façonnent l’opinion publique.

Les avancées continues dans les modèles de langage comme GPT-2 offrent des opportunités passionnantes pour étudier la représentation médiatique. Ce travail peut contribuer à une plus grande sensibilisation aux biais dans les médias et à leur impact sur la vision de la société sur les personnalités publiques.

Source originale

Titre: Characterizing Latent Perspectives of Media Houses Towards Public Figures

Résumé: Media houses reporting on public figures, often come with their own biases stemming from their respective worldviews. A characterization of these underlying patterns helps us in better understanding and interpreting news stories. For this, we need diverse or subjective summarizations, which may not be amenable for classifying into predefined class labels. This work proposes a zero-shot approach for non-extractive or generative characterizations of person entities from a corpus using GPT-2. We use well-articulated articles from several well-known news media houses as a corpus to build a sound argument for this approach. First, we fine-tune a GPT-2 pre-trained language model with a corpus where specific person entities are characterized. Second, we further fine-tune this with demonstrations of person entity characterizations, created from a corpus of programmatically constructed characterizations. This twice fine-tuned model is primed with manual prompts consisting of entity names that were not previously encountered in the second fine-tuning, to generate a simple sentence about the entity. The results were encouraging, when compared against actual characterizations from the corpus.

Auteurs: Sharath Srivatsa, Srinath Srinivasa

Dernière mise à jour: 2023-09-12 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.06112

Source PDF: https://arxiv.org/pdf/2309.06112

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires