Representação de Gênero nas Notícias da TV Francesa
Esse artigo examina o equilíbrio de gênero nas transmissões de notícias francesas em diferentes temas.
― 6 min ler
Índice
Este artigo analisa como o gênero é representado nas notícias transmitidas na França. Foca nos Tópicos discutidos em programas de TV e rádio e vê se homens ou mulheres falam mais sobre certos assuntos. O estudo usa uma grande quantidade de dados para entender se existem preconceitos sobre a frequência com que homens e mulheres são ouvidos em vários tópicos.
Contexto
Nos últimos anos, muitas organizações têm trabalhado para melhorar a igualdade de gênero na mídia. Na França, relatórios mostraram que as mulheres costumam ter menos tempo de fala em programas de notícias em comparação com os homens. Este artigo tem o objetivo de avaliar essas diferenças e fornecer dados claros sobre como a representação de gênero se manifesta no conteúdo das notícias.
Para fazer essa análise, os pesquisadores usaram um conjunto de dados com mais de 11.000 horas de notícias coletadas de 21 canais franceses em 2023. Eles queriam ver se as mulheres estão sub-representadas em assuntos-chave como esportes, política e conflitos, enquanto talvez falem mais em áreas como clima e saúde.
Coleta de Dados
Os pesquisadores começaram transcrevendo as Transmissões de notícias para texto. Eles usaram tecnologia avançada para transformar a linguagem falada em texto e criar um banco de dados que pudesse ser analisado. O conjunto de dados inclui uma ampla gama de programas categorizados por tipo de assunto.
Para aprofundar a análise, eles também criaram um subconjunto menor de diálogos. Esse subconjunto foi anotado, ou seja, cada diálogo foi examinado e rotulado com base em seu tópico. Isso envolveu um processo manual onde os pesquisadores analisaram trechos das transmissões e os categorizaram de acordo com um conjunto de diretrizes.
Classificação de Tópicos
A categorização dos tópicos foi baseada em uma lista pré-definida de 18 categorias que os pesquisadores criaram. Entre essas categorias estavam assuntos como esportes, política, saúde e clima. Ao organizar o conteúdo dessa forma, os pesquisadores puderam analisar melhor como diferentes Gêneros são representados em vários tópicos.
Depois de processar as transcrições, os pesquisadores usaram diferentes métodos para classificar os tópicos. Eles exploraram tanto técnicas tradicionais de aprendizado de máquina quanto abordagens mais novas que usam grandes modelos de linguagem para classificação. O objetivo era identificar qual abordagem fornecia os melhores resultados.
Descobertas sobre Representação de Gênero
A análise revelou que as mulheres representavam apenas 34% do tempo total de fala nas transmissões estudadas. Esse número é consideravelmente menor que a média da população feminina na França, que é de cerca de 51,6%. Os achados mostram que há uma lacuna significativa entre a representação esperada e a real das mulheres nas notícias transmitidas.
Quando olhamos para assuntos específicos, os dados mostram que as mulheres falaram com menos frequência em categorias como esportes, onde sua representação foi notavelmente baixa. No entanto, em assuntos mais "suaves", como clima e saúde, o tempo de fala das mulheres foi maior que a média geral.
Diferenças entre Tipos de Canal
O estudo também examinou se havia diferenças na representação com base no tipo de canal. Canais públicos mostraram uma maior proporção de tempo de fala feminina, com 40,5%, em comparação com canais privados, onde a cifra era de apenas 34,1%. Isso sugere que diferentes políticas de canal e escolhas editoriais podem influenciar a representação de gênero.
Processo de Anotação Humana
Para verificar a classificação dos tópicos, um grupo de pesquisadores anotou manualmente uma parte dos dados. Isso foi feito para garantir precisão no processo de categorização e fornecer um parâmetro para avaliar o desempenho dos modelos automatizados. Os pesquisadores notaram que alguns assuntos podiam ser ambíguos e que havia variabilidade em como diferentes anotadores classificavam o mesmo diálogo.
Avaliações de Modelos
Os pesquisadores usaram vários modelos para classificar os tópicos automaticamente. Eles compararam a precisão desses modelos analisando métricas como precisão e revocação. Alguns modelos se saíram melhor que outros, e os resultados ajudaram a entender qual método era mais eficaz na classificação precisa dos diálogos.
A análise mostrou que modelos treinados em dados anotados conseguiram melhorar em relação aos modelos básicos. Isso sugere que usar uma combinação de esforços humanos e máquinas pode levar a melhores resultados de classificação.
Explorando o Preconceito de Gênero em Tópicos
Após classificar os diálogos, os pesquisadores compararam os resultados para ver como diferentes gêneros eram representados nos vários tópicos. Eles descobriram que certos tópicos eram dominados predominantemente por homens, como esportes e política. Por outro lado, as mulheres estavam mais associadas a assuntos relacionados à saúde e cultura.
Ao visualizar essas tendências, os pesquisadores destacaram disparidades significativas em como os tópicos são discutidos por diferentes gêneros. A pesquisa indica que alguns assuntos continuam sendo altamente dominados por homens, o que pode impactar a forma como o público percebe questões de gênero na mídia.
Direções Futuras
Os pesquisadores incentivam estudos adicionais que possam oferecer insights mais profundos sobre a representação de gênero na mídia. Por exemplo, examinar como diferentes tipos de canais influenciam a cobertura de tópicos de gênero forneceria um contexto valioso. Eles também expressaram interesse em explorar a importância dos tópicos para diferentes públicos, como perspectivas locais versus nacionais.
Outra área que precisa de atenção é a representação de indivíduos não-binários, dado que as ferramentas atuais se concentram principalmente em uma compreensão binária de gênero. Essa lacuna na pesquisa destaca a necessidade de uma abordagem mais inclusiva em estudos futuros.
Conclusão
Este estudo é um passo importante para entender a representação de gênero nas notícias transmitidas na França. Ao analisar uma quantidade substancial de dados, os pesquisadores lançaram luz sobre como diferentes assuntos têm mais propensão à representação masculina ou feminina. Os achados revelam uma clara necessidade de análises e ações contínuas para garantir uma representação de gênero equilibrada na mídia, destacando a importância de continuar os esforços para melhorar a igualdade em todas as formas de comunicação.
Os pesquisadores esperam que seu trabalho não só informe estudos futuros, mas também promova mudanças em políticas e práticas dentro da indústria da mídia para promover uma representação mais equitativa de gênero na cobertura de notícias.
Título: Automatic Classification of News Subjects in Broadcast News: Application to a Gender Bias Representation Analysis
Resumo: This paper introduces a computational framework designed to delineate gender distribution biases in topics covered by French TV and radio news. We transcribe a dataset of 11.7k hours, broadcasted in 2023 on 21 French channels. A Large Language Model (LLM) is used in few-shot conversation mode to obtain a topic classification on those transcriptions. Using the generated LLM annotations, we explore the finetuning of a specialized smaller classification model, to reduce the computational cost. To evaluate the performances of these models, we construct and annotate a dataset of 804 dialogues. This dataset is made available free of charge for research purposes. We show that women are notably underrepresented in subjects such as sports, politics and conflicts. Conversely, on topics such as weather, commercials and health, women have more speaking time than their overall average across all subjects. We also observe representations differences between private and public service channels.
Autores: Valentin Pelloin, Lena Dodson, Émile Chapuis, Nicolas Hervé, David Doukhan
Última atualização: 2024-07-19 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.14180
Fonte PDF: https://arxiv.org/pdf/2407.14180
Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.