Examiner la représentation des personnes non-cisgenres dans la génération d'images
Cet article analyse comment les identités non-cisgenres sont représentées dans les technologies de génération d'images.
― 10 min lire
Table des matières
- Aperçu du Problème
- Design de l'Étude
- Résultats
- Recommandations pour l'Amélioration
- Conclusion
- Travaux Connexes
- Analyse des Résultats de Génération
- Résultats : Observations et Statistiques
- Aperçus des Enquêtes : Réponses et Thèmes
- Recommandations pour le Développement Futur
- Conclusion
- Directions Futures
- Source originale
- Liens de référence
Les récentes avancées dans la technologie de génération d'images ont impressionné plein de monde avec leur capacité à créer des images de haute qualité à partir de texte. Cependant, ces technologies peuvent aussi faire du mal en reflétant et en renforçant des stéréotypes culturels. Cet article se penche sur la manière dont ces modèles représentent différentes identités de genre, en mettant particulièrement l'accent sur les identités non cisgenres, comme les personnes transgenres et non binaires.
Aperçu du Problème
Les modèles de génération d'images peuvent parfois produire des résultats nuisibles. Ça arrive quand les images qu'ils créent montrent des personnes d'une manière qui renforce des stéréotypes négatifs ou ne reflète pas la diversité des identités réelles. Notre objectif est d'analyser comment ces modèles se comportent quand on leur donne des incitations liées aux identités cisgenres (celles qui s'identifient au sexe qui leur a été assigné à la naissance) et non cisgenres.
Design de l'Étude
L'étude a impliqué de comparer les sorties de trois modèles populaires de génération d'images. On a regardé comment ils ont réagi à des incitations qui contenaient des termes d'identité cisgenre et non cisgenre. De plus, on a mené des enquêtes et des interviews avec des personnes non cisgenres pour recueillir leur avis sur la façon dont elles étaient représentées et les dangers potentiels que ces technologies peuvent engendrer.
Résultats
Mauvaise Représentation des Identités Non-Cisgenres
Notre analyse a révélé que les identités non cisgenres étaient souvent dépeintes de manière moins humaine par rapport à leurs homologues cisgenres. Par exemple, certaines images montraient des personnes non cisgenres de façon plus caricaturale ou avec des traits exagérés. En plus, il y avait une tendance notable à la sexualisation, où les individus non cisgenres étaient représentés d'une manière qui mettait l'accent sur leur sexualité plutôt que sur leur humanité.
Aperçus des Enquêtes
Pour mieux comprendre l'impact de ces technologies, on a interrogé des personnes non cisgenres. Les principales inquiétudes mises en avant par les répondants étaient :
- Mauvaise Représentation : Beaucoup pensaient que les images générées ne représentaient souvent pas fidèlement leurs identités.
- Renforcement de Stéréotypes Négatifs : Les répondants exprimaient des inquiétudes que les Représentations biaisées puissent mener à des croyances et des comportements sociaux nuisibles.
- Désir d'Implication Communautaire : Les participants ont appelé à plus de contributions de la part de la communauté non cisgenre sur la façon dont ils sont représentés dans ces modèles.
Observations Qualitatives
Dans notre examen de certaines incitations, certaines identités étaient fréquemment dépeintes avec des stéréotypes. Par exemple, les images générées pour le terme "Deux-esprits" comportaient souvent plusieurs individus en vêtements traditionnels, ce qui ne reflète pas la complexité de l'identité. De même, les femmes transgenres étaient souvent montrées avec des traits masculins, ce qui peut ne pas correspondre à leur auto-identification.
Implications pour le Développement Futur des Modèles
Les répondants étaient globalement insatisfaits des règles simples ou des heuristiques visant à prévenir les préjudices. Au lieu de ça, ils ont exprimé une forte préférence pour des données d'entraînement mieux diversifiées qui incluent une large gamme d'identités. Cela aiderait les modèles à créer des représentations plus précises et authentiques des individus non cisgenres.
Recommandations pour l'Amélioration
- Augmentation de l'Implication Communautaire : Engager des personnes non cisgenres dans la création et le développement de ces modèles peut aider à s'assurer que leurs perspectives sont prises en compte.
- Données d'Entraînement Curées : Les modèles devraient être formés sur un ensemble de données large et représentatif qui inclut diverses identités non cisgenres.
- Options de Personnalisation : Permettre aux utilisateurs d'ajuster les représentations peut offrir un moyen pour les individus de refléter leur identité plus précisément.
- Processus de Développement Transparent : Clarifier les processus derrière l'entraînement des modèles et la collecte des données peut aider à atténuer les préjudices potentiels.
Conclusion
L'état actuel des modèles de génération d'images montre un potentiel significatif de préjudice concernant la représentation des individus non cisgenres. En comprenant ces problèmes et en mettant en œuvre des changements qui priorisent les voix communautaires et des données d'entraînement diversifiées, on peut travailler vers un avenir où la technologie sert à dépeindre avec précision et positivement la richesse des identités humaines.
Travaux Connexes
L'exploration de la représentation des identités de genre dans la technologie n'est pas nouvelle ; cependant, l'accent spécifique sur les modèles de génération d'images est encore en développement. Les recherches passées en traitement du langage naturel (NLP) ont noté des biais similaires. Elles ont montré que la façon dont le langage est utilisé peut influencer les perceptions de genre et d'identité. Il y a un besoin pressant de recherche qui comble le fossé entre le NLP et la génération d'images pour créer des technologies plus inclusives.
NLP Inclusif pour l'Identité
Les efforts en NLP ont commencé à aborder les biais contre les identités non cisgenres, mais il reste beaucoup à faire. Certaines recherches ont exploré l'utilisation de pronoms neutres et identifié des domaines dans lesquels les modèles linguistiques peuvent s'améliorer en termes d'inclusivité. Ces résultats peuvent servir de base pour de meilleures pratiques en matière de génération d'images.
Analyse des Biais dans la Génération d'Images
Bien qu'il y ait eu un travail considérable sur l'identification des biais dans la génération de langage, le domaine de la génération d'images reste moins exploré. Des études initiales ont montré que les modèles peuvent favoriser certains démographies, dépeignant couramment de jeunes individus blancs. Cela met en évidence un déséquilibre important dans la représentation qui doit être rectifié.
Analyse des Résultats de Génération
Dans notre étude, nous nous sommes concentrés sur la façon dont les modèles réagissent aux incitations qui incorporent diverses identités de genre. En insérant différents termes d'identité dans des modèles fixes, nous avons généré des images et évalué leur qualité selon plusieurs critères.
Méthodologie
Nous avons sélectionné des ensembles de termes d'identité qui englobent une gamme d'identités non cisgenres, ainsi que des pronoms et des descripteurs typiques. Les modèles ont permis de maintenir la cohérence tout en explorant les variations à travers les identités. Certains modèles étaient conçus pour des scénarios d'utilisation commerciale, basés sur des ensembles de données existants.
Processus de Génération d'Images
Des images ont été générées en utilisant des modèles populaires accessibles au public. Chaque incitation a donné lieu à plusieurs images, ce qui nous a permis de comparer et d'analyser la qualité et la représentation des résultats.
Résultats : Observations et Statistiques
Présentation des Images
Les images générées reflétaient une gamme de caractéristiques. Nous avons évalué le degré de photoréalisme et noté la présence de caractéristiques telles que la nudité implicite et la diversité ethnique. Les résultats montraient des contrastes marqués entre les images produites pour des incitations d'identités cisgenres et celles pour des incitations non cisgenres.
Tendances Notables
- Photoréalisme : Les images générées pour les identités non cisgenres avaient souvent des scores plus bas en photoréalisme, indiquant un manque de représentation réaliste.
- Nudité : Un pourcentage plus élevé de nudité était présent dans les images liées aux identités non cisgenres, suggérant une tendance à la sexualisation.
- Représentation Ethnique : La majorité des images générées montraient des individus qui semblaient blancs, mettant en évidence un manque de diversité.
Aperçus des Enquêtes : Réponses et Thèmes
Démographie des Répondants
L'enquête a attiré un groupe diversifié d'individus non cisgenres, fournissant une variété de perspectives sur la représentation. La majorité s'identifiait comme non-binaire et exprimait une familiarité avec les technologies d'IA.
Perspectives sur la Représentation
Les répondants ont souligné l'importance de représenter fidèlement leurs identités dans la technologie. Beaucoup ont partagé leurs expériences personnelles illustrant l'impact de la mauvaise représentation. Des thèmes clés ont émergé de leurs retours, notamment :
- Désir de Représentation Authentique : Les personnes non cisgenres souhaitent se voir représentées de manière précise, avec place pour la diversité dans l'expression de genre.
- Inquiétudes concernant l'Objectification : Les participants s'inquiétaient de la possibilité que leurs identités soient réduites à de simples stéréotypes ou à des images sexualisées.
Recommandations pour le Développement Futur
Basé sur les résultats de notre analyse, des enquêtes et des interviews, plusieurs recommandations peuvent être faites pour améliorer la façon dont les modèles de génération d'images traitent les identités non cisgenres :
- Rassembler des Données d'Entraînement Diversifiées : Un focus sur la diversité dans les ensembles de données d'entraînement peut aider à créer des sorties plus représentatives.
- Encourager les Retours de la Communauté : Impliquer les individus non cisgenres dans la phase de conception et de développement est crucial. Leurs insights peuvent guider la création de meilleurs modèles.
- Créer des Fonctions de Personnalisation : Les utilisateurs devraient avoir des options pour modifier les images générées afin de s'assurer qu'ils puissent se représenter correctement.
- Assurer la Transparence dans le Développement : Une communication claire sur la façon dont les données sont collectées et les modèles sont formés peut établir la confiance avec les Communautés touchées par ces technologies.
Conclusion
Cette exploration des mauvaises représentations et des stéréotypes entourant les identités non cisgenres dans la génération d'images met en lumière un besoin pressant de changement dans la façon dont ces technologies fonctionnent. En abordant ces problèmes grâce à l'implication communautaire, de meilleures pratiques d'entraînement et des fonctionnalités de modèles améliorées, nous pouvons favoriser un environnement plus inclusif dans les espaces numériques.
Directions Futures
Les problèmes identifiés dans cette étude montrent un besoin urgent de recherche continue au croisement de la technologie, de l'identité et de la représentation. Les travaux futurs devraient tenir compte de la nature évolutive des identités de genre et de la façon dont ces avancées peuvent soit aider, soit nuire à l'inclusivité.
Implications Plus Larges
- Impact sur la Société : La mauvaise représentation dans les médias, y compris l'imagerie numérique, peut influencer la perception publique et renforcer des stéréotypes nuisibles concernant les identités non cisgenres.
- Sensibilité Culturelle : Les développeurs et les chercheurs doivent aborder la représentation des identités avec une conscience culturelle et une sensibilité aux expériences vécues des groupes marginalisés.
En continuant cette conversation et en poussant pour des pratiques de développement plus responsables, nous pouvons travailler vers des technologies qui élèvent et reflètent avec précision la riche tapisserie de l'identité humaine.
Titre: Stereotypes and Smut: The (Mis)representation of Non-cisgender Identities by Text-to-Image Models
Résumé: Cutting-edge image generation has been praised for producing high-quality images, suggesting a ubiquitous future in a variety of applications. However, initial studies have pointed to the potential for harm due to predictive bias, reflecting and potentially reinforcing cultural stereotypes. In this work, we are the first to investigate how multimodal models handle diverse gender identities. Concretely, we conduct a thorough analysis in which we compare the output of three image generation models for prompts containing cisgender vs. non-cisgender identity terms. Our findings demonstrate that certain non-cisgender identities are consistently (mis)represented as less human, more stereotyped and more sexualised. We complement our experimental analysis with (a)~a survey among non-cisgender individuals and (b) a series of interviews, to establish which harms affected individuals anticipate, and how they would like to be represented. We find respondents are particularly concerned about misrepresentation, and the potential to drive harmful behaviours and beliefs. Simple heuristics to limit offensive content are widely rejected, and instead respondents call for community involvement, curated training data and the ability to customise. These improvements could pave the way for a future where change is led by the affected community, and technology is used to positively ``[portray] queerness in ways that we haven't even thought of'' rather than reproducing stale, offensive stereotypes.
Auteurs: Eddie L. Ungless, Björn Ross, Anne Lauscher
Dernière mise à jour: 2023-05-26 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2305.17072
Source PDF: https://arxiv.org/pdf/2305.17072
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://twitter.com/jose_falanga/status/1537953980633911297
- https://twitter.com/ScientistRik/status/1553151218050125826
- https://twitter.com/NannaInie/status/1536276032319279106
- https://huggingface.co/runwayml/stable-diffusion-v1-5
- https://github.com/openai/dalle-2-preview/blob/main/system-card.md
- https://dallery.gallery/the-dalle-2-prompt-book/
- https://colab.research.google.com/github/borisdayma/dalle-mini/blob/main/tools/inference/inference_pipeline.ipynb
- https://github.com/openai/openai-python
- https://www.craiyon.com/
- https://openai.com/blog/dall-e-introducing-outpainting/
- https://huggingface.co/dalle-mini/dalle-mega
- https://www.gendercensus.com/results/2022-worldwide/
- https://www.nativeyouthsexualhealth.com/two-spirit-mentors-support-circle