Simple Science

Scienza all'avanguardia spiegata semplicemente

# Ingegneria elettrica e scienze dei sistemi# Calcolo e linguaggio# Elaborazione dell'audio e del parlato

Rappresentazione di genere nelle notizie diffuse in Francia

Questo articolo analizza l'equilibrio di genere nei notiziari francesi su diversi argomenti.

― 6 leggere min


Pregiudizio di generePregiudizio di generenelle notizie francesie donne nelle trasmissioni.Esaminando il tempo di parola di uomini
Indice

Questo articolo analizza come il Genere è rappresentato nelle notizie trasmesse in Francia. Si concentra sui temi discussi nei programmi TV e radio e verifica se parlano di più gli uomini o le donne su certi Argomenti. Lo studio utilizza un grande volume di dati per capire se ci sono pregiudizi su quanto spesso uomini e donne vengono ascoltati su vari temi.

Contesto

Negli ultimi anni, molte organizzazioni hanno lavorato per migliorare l'uguaglianza di genere nei media. In Francia, i rapporti hanno mostrato che le donne spesso hanno meno tempo di parola nei programmi di notizie rispetto agli uomini. Questo articolo mira a valutare queste differenze e fornire dati chiari su come si gioca la rappresentazione di genere nei contenuti informativi.

Per svolgere questa analisi, i ricercatori hanno utilizzato un dataset di oltre 11.000 ore di notizie trasmesse raccolte da 21 canali francesi nel 2023. Volevano vedere se le donne sono sottorappresentate in temi chiave come sport, politica e conflitti, mentre potrebbero parlare di più in aree come meteo e salute.

Raccolta Dati

I ricercatori hanno iniziato trascrivendo le Trasmissioni di notizie in testo. Hanno usato tecnologia avanzata per trasformare il linguaggio parlato in testo e creare un database analizzabile. Il dataset include una vasta gamma di programmi categorizzati per tipo di argomento.

Per approfondire i dati, hanno anche creato un sottoinsieme più piccolo di dialoghi. Questo sottoinsieme è stato annotato, il che significa che ogni dialogo è stato esaminato e etichettato in base al suo argomento. Questo ha comportato un processo manuale in cui i ricercatori hanno esaminato estratti delle trasmissioni e li hanno catalogati secondo un insieme di linee guida.

Classificazione degli Argomenti

La categorizzazione degli argomenti si basava su un elenco predefinito di 18 categorie creato dai ricercatori. Tra queste categorie c'erano argomenti come sport, politica, salute e meteo. Organizzando i contenuti in questo modo, i ricercatori potrebbero analizzare meglio come diversi generi sono rappresentati in vari temi.

Dopo aver elaborato le trascrizioni, i ricercatori hanno utilizzato diversi metodi per classificare gli argomenti. Hanno esplorato sia tecniche tradizionali di machine learning che approcci più recenti che utilizzano modelli di linguaggio di grandi dimensioni per la classificazione. L'obiettivo era identificare quale approccio fornisse i risultati migliori.

Risultati sulla Rappresentazione di Genere

L'analisi ha rivelato che le donne rappresentavano solo il 34% del tempo totale di parola nelle trasmissioni studiate. Questo numero è notevolmente inferiore alla popolazione femminile media in Francia, che si attesta attorno al 51,6%. I risultati mostrano che c'è un significativo divario tra la rappresentazione attesa e quella reale delle donne nelle notizie trasmesse.

Guardando a temi specifici, i dati mostrano che le donne hanno parlato meno frequentemente in categorie come sport, dove la loro rappresentazione era notevolmente bassa. Tuttavia, in argomenti più tradizionalmente "soft" come meteo e salute, il tempo di parola delle donne era superiore alla loro media complessiva.

Differenze nei Tipi di Canali

Lo studio ha anche esaminato se ci fossero differenze nella rappresentazione a seconda del tipo di canale. I canali pubblici hanno mostrato una proporzione più alta di tempo di parola femminile, al 40,5%, rispetto ai canali privati, dove il dato era solo del 34,1%. Questo suggerisce che le politiche e le scelte editoriali dei diversi canali possono influenzare la rappresentazione di genere.

Processo di Annotazione Umana

Per verificare la classificazione degli argomenti, un gruppo di ricercatori ha annotato manualmente una parte dei dati. Questo è stato fatto per garantire l'accuratezza nel processo di categorizzazione e per fornire un benchmark per valutare le prestazioni dei modelli automatizzati. I ricercatori hanno notato che alcuni argomenti potevano essere ambigui e che c'era variabilità nel modo in cui diversi annotatori classificavano lo stesso dialogo.

Valutazioni dei Modelli

I ricercatori hanno utilizzato diversi modelli per classificare automaticamente gli argomenti. Hanno confrontato l'accuratezza di questi modelli esaminando metriche come precisione e richiamo. Alcuni modelli hanno performato meglio di altri e i risultati hanno aiutato a capire quale metodo fosse più efficace nella classificazione accurata dei dialoghi.

L'analisi ha mostrato che i modelli addestrati su dati annotati sono stati in grado di migliorare rispetto ai modelli di riferimento. Questo suggerisce che l'uso di una combinazione di sforzi umani e tecnologici potrebbe portare a risultati di classificazione migliori.

Esplorare il Pregiudizio di Genere negli Argomenti

Dopo aver classificato i dialoghi, i ricercatori hanno confrontato i risultati per vedere come i diversi generi fossero rappresentati nei vari argomenti. Hanno trovato che certi argomenti erano dominati dagli uomini, come sport e politica. Al contrario, le donne erano più comunemente associate a temi legati alla salute e alla cultura.

Visualizzando queste tendenze, i ricercatori hanno evidenziato disparità significative nel modo in cui gli argomenti vengono discussi dai diversi generi. La ricerca indica che alcuni soggetti rimangono fortemente dominati dagli uomini, il che potrebbe influenzare il modo in cui il pubblico percepisce le questioni di genere nei media.

Direzioni Future

I ricercatori incoraggiano ulteriori studi che potrebbero offrire approfondimenti più profondi sulla rappresentazione di genere nei media. Ad esempio, esaminare come i diversi tipi di canale influenzano la copertura degli argomenti di genere fornirebbe un contesto prezioso. Hanno anche espresso interesse nell'esplorare il significato degli argomenti per diversi pubblici, come le prospettive locali rispetto a quelle nazionali.

Un'altra area che necessita di attenzione è la rappresentazione delle persone non binarie, dato che gli attuali strumenti si concentrano principalmente su una comprensione binaria del genere. Questa lacuna nella ricerca sottolinea la necessità di un approccio più inclusivo negli studi futuri.

Conclusione

Questo studio rappresenta un passo importante per comprendere la rappresentazione di genere nelle notizie trasmesse in Francia. Analizzando un volume sostanzioso di dati, i ricercatori hanno fatto luce su come diversi argomenti sono più inclini a una rappresentazione maschile o femminile. I risultati rivelano una chiara necessità di un'analisi continua e di azioni per garantire una rappresentazione equilibrata di genere nei media, sottolineando l'importanza di continuare gli sforzi per migliorare l'uguaglianza in tutte le forme di comunicazione.

I ricercatori sperano che il loro lavoro non solo informerà studi futuri, ma contribuirà anche a modifiche nelle politiche e nelle pratiche all'interno dell'industria dei media per promuovere una rappresentazione di genere più equa nella copertura delle notizie.

Fonte originale

Titolo: Automatic Classification of News Subjects in Broadcast News: Application to a Gender Bias Representation Analysis

Estratto: This paper introduces a computational framework designed to delineate gender distribution biases in topics covered by French TV and radio news. We transcribe a dataset of 11.7k hours, broadcasted in 2023 on 21 French channels. A Large Language Model (LLM) is used in few-shot conversation mode to obtain a topic classification on those transcriptions. Using the generated LLM annotations, we explore the finetuning of a specialized smaller classification model, to reduce the computational cost. To evaluate the performances of these models, we construct and annotate a dataset of 804 dialogues. This dataset is made available free of charge for research purposes. We show that women are notably underrepresented in subjects such as sports, politics and conflicts. Conversely, on topics such as weather, commercials and health, women have more speaking time than their overall average across all subjects. We also observe representations differences between private and public service channels.

Autori: Valentin Pelloin, Lena Dodson, Émile Chapuis, Nicolas Hervé, David Doukhan

Ultimo aggiornamento: 2024-07-19 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2407.14180

Fonte PDF: https://arxiv.org/pdf/2407.14180

Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili