Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Calcolo e linguaggio# Computer e società

Esaminando la rappresentazione non cisgender nella generazione di immagini

Quest'articolo analizza come vengono rappresentate le identità non cisgender nelle tecnologie di generazione delle immagini.

― 8 leggere min


Pregiudizio nei ModelliPregiudizio nei Modellidi Immaginigenerazione di immagini.delle identità non cisgender nellaScomporre la cattiva rappresentazione
Indice

I recenti progressi nella tecnologia di generazione di immagini hanno impressionato molti grazie alla loro capacità di creare immagini di alta qualità a partire da testo. Tuttavia, queste tecnologie possono anche causare danni riflettendo e rinforzando stereotipi culturali. Questo articolo indaga come questi modelli rappresentano diverse identità di genere, concentrandosi in particolare sulle identità non cisgender, come quelle transgender e non-binario.

Panoramica del Problema

I modelli di generazione di immagini a volte possono produrre risultati dannosi. Questo accade quando le immagini create mostrano persone in modi che si allineano con stereotipi negativi o non riflettono la diversità delle identità reali. Il nostro obiettivo è analizzare come questi modelli si comportano quando ricevono spunti relativi sia a identità cisgender (coloro che si identificano con il sesso assegnato alla nascita) che non cisgender.

Design dello Studio

Lo studio ha coinvolto il confronto tra i risultati di tre modelli di generazione di immagini popolari. Abbiamo esaminato come hanno risposto a spunti che includevano sia termini di identità cisgender che non cisgender. Inoltre, abbiamo condotto sondaggi e interviste con persone non cisgender per raccogliere le loro opinioni su come vengono rappresentati e i potenziali danni che possono derivare da queste tecnologie.

Risultati

Misinformazione delle Identità Non-Cisgender

La nostra analisi ha rivelato che le identità non cisgender erano spesso rappresentate in modi meno umani rispetto ai loro omologhi cisgender. Ad esempio, alcune immagini rappresentavano persone non cisgender in modo più cartoonistico o con caratteristiche esagerate. Inoltre, c'era una tendenza evidente alla sessualizzazione, in cui le persone non cisgender erano rappresentate in un modo che enfatizzava la loro sessualità piuttosto che la loro umanità.

Risultati dei Sondaggi

Per comprendere meglio l'impatto di queste tecnologie, abbiamo intervistato persone non cisgender. Le principali preoccupazioni evidenziate dai rispondenti erano:

  • Misinformazione: Molti sentivano che le immagini generate spesso non rappresentavano accuratamente le loro identità.
  • Rafforzamento di Stereotipi Negativi: I rispondenti si preoccupavano che le Rappresentazioni di parte potessero portare a credenze e comportamenti sociali dannosi.
  • Desiderio di Coinvolgimento della Comunità: I partecipanti chiedevano più input dalla comunità non cisgender per plasmare come vengono rappresentati in questi modelli.

Osservazioni Qualitative

Nella nostra analisi di spunti specifici, certe identità erano frequentemente rappresentate insieme a stereotipi. Ad esempio, le immagini generate per il termine "Due spiriti" spesso includevano più individui in abiti tradizionali, il che non riflette la complessità dell'identità. Allo stesso modo, le donne transgender venivano spesso mostrate con caratteristiche maschili, il che potrebbe non allinearsi con la loro autoidentità.

Implicazioni per lo Sviluppo Futuro dei Modelli

I rispondenti erano per lo più insoddisfatti di regole semplici o euristiche mirate a prevenire danni. Invece, hanno espresso una forte preferenza per Dati di addestramento migliori che includano una gamma diversificata di identità. Questo aiuterebbe i modelli a imparare a creare rappresentazioni più accurate e autentiche di individui non cisgender.

Raccomandazioni per il Miglioramento

  1. Maggiore Coinvolgimento della Comunità: Coinvolgere le persone non cisgender nella creazione e nello sviluppo di questi modelli può aiutare a garantire che le loro prospettive siano incluse.
  2. Dati di Addestramento Selezionati: I modelli dovrebbero essere addestrati su un dataset ampio e rappresentativo che includa varie identità non cisgender.
  3. Opzioni di Personalizzazione: Consentire agli utenti di modificare le rappresentazioni può fornire un modo per riflettere le proprie identità in modo più accurato.
  4. Processi di Sviluppo Trasparenti: Rendere chiari i processi dietro l'addestramento dei modelli e la raccolta dei dati può aiutare a mitigare i potenziali danni.

Conclusione

Lo stato attuale dei modelli di generazione di immagini mostra un potenziale significativo per danni riguardo alla rappresentazione di individui non cisgender. Comprendendo questi problemi e implementando cambiamenti che diano priorità alle voci della comunità e a dati di addestramento diversificati, possiamo lavorare verso un futuro in cui la tecnologia serve a rappresentare accuratamente e positivamente la ricchezza delle identità umane.


Lavori Correlati

L'esplorazione della rappresentazione delle identità di genere nella tecnologia non è una novità; tuttavia, il focus specifico sui modelli di generazione di immagini è ancora in sviluppo. Ricerche precedenti nel processamento del linguaggio naturale (NLP) hanno notato bias simili. Hanno mostrato che l'uso del linguaggio può influenzare le percezioni di genere e identità. C'è un urgente bisogno di ricerca che colmi il divario tra NLP e generazione di immagini per creare tecnologie più inclusive.

NLP Inclusivo per l'Identità

Gli sforzi in NLP hanno iniziato a affrontare i bias contro le identità non cisgender, ma c'è ancora molto lavoro da fare. Alcune ricerche hanno esplorato l'uso di pronomi di genere neutro e hanno identificato aree in cui i modelli linguistici possono migliorare in termini di inclusività. Questi risultati possono servire da base per pratiche migliori nella generazione di immagini.

Analisi dei Bias nella Generazione di Immagini

Sebbene ci sia stato un considerevole lavoro sull'identificazione dei bias nella generazione di linguaggio, il campo della generazione di immagini rimane meno esplorato. Studi iniziali hanno mostrato che i modelli possono favorire alcuni gruppi demografici, rappresentando comunemente giovani bianchi. Questo evidenzia un significativo squilibrio nella rappresentazione che deve essere rettificato.

Analisi dei Risultati di Generazione

Nel nostro studio, ci siamo concentrati su come i modelli rispondono a spunti che incorporano varie identità di genere. Inserendo diversi termini di identità in template prestabiliti, abbiamo generato immagini e valutato la loro qualità in base a diversi criteri.

Metodologia

Abbiamo selezionato set di termini di identità che abbracciano una gamma di identità non cisgender, insieme a pronomi e descrittori tipici. I template ci hanno consentito di mantenere coerenza mentre esploravamo variazioni tra identità. Alcuni template erano progettati per scenari di uso commerciale, basati su dataset esistenti.

Processo di Generazione delle Immagini

Le immagini sono state generate utilizzando modelli popolari accessibili al pubblico. Ogni spunto ha prodotto più immagini, consentendoci di confrontare e analizzare la qualità e la rappresentazione degli output.

Risultati: Osservazioni e Statistiche

Presentazione delle Immagini

Le immagini generate riflettevano una gamma di caratteristiche. Abbiamo valutato il grado di fotorealismo e annotato la presenza di caratteristiche come nudità implicita e diversità etnica. I risultati mostrano contrasti netti tra le immagini prodotte per spunti di identità cisgender e quelle per spunti non cisgender.

Modelli Notabili

  1. Fotorealismo: Le immagini generate per identità non cisgender avevano spesso punteggi più bassi per il fotorealismo, indicando una mancanza di rappresentazione realistica.
  2. Nudità: Una percentuale più alta di nudità era presente nelle immagini correlate a identità non cisgender, suggerendo una tendenza verso la sessualizzazione.
  3. Rappresentazione Etnica: La maggior parte delle immagini generate presentava individui che apparivano bianchi, evidenziando una mancanza di diversità.

Risultati del Sondaggio: Risposte e Temi

Demografia dei Rispondenti

Il sondaggio ha attratto un gruppo diversificato di individui non cisgender, fornendo una varietà di prospettive sulla rappresentazione. La maggioranza si identificava come non-binaria e ha espresso familiarità con le tecnologie AI.

Prospettive sulla Rappresentazione

I rispondenti hanno sottolineato l'importanza di rappresentare accuratamente le loro identità nella tecnologia. Molti hanno condiviso esperienze personali che illustrano l'impatto della misrepresentazione. Sono emersi temi chiave dai loro feedback, tra cui:

  • Desiderio di Rappresentazione Autentica: Le persone non cisgender desiderano essere rappresentate accuratamente, con spazio per la diversità nell'espressione di genere.
  • Preoccupazioni per l'oggettificazione: I partecipanti si sono detti preoccupati che le loro identità possano essere ridotte a semplici stereotipi o immagini sessualizzate.

Raccomandazioni per lo Sviluppo Futuro

Sulla base dei risultati della nostra analisi, sondaggi e interviste, si possono formulare diverse raccomandazioni per migliorare il modo in cui i modelli di generazione di immagini gestiscono le identità non cisgender:

  1. Raccogliere Dati di Addestramento Diversificati: Un focus sulla diversità nei dataset di addestramento può aiutare a creare output più rappresentativi.
  2. Incoraggiare il Feedback della Comunità: Coinvolgere individui non cisgender nella fase di design e sviluppo è cruciale. I loro suggerimenti possono guidare la creazione di modelli migliori.
  3. Creare Funzionalità di Personalizzazione: Gli utenti dovrebbero avere opzioni per modificare le immagini generate per assicurarsi di poter rappresentare accuratamente se stessi.
  4. Assicurare Trasparenza nello Sviluppo: Una comunicazione chiara su come vengono raccolti i dati e come vengono addestrati i modelli può costruire fiducia con le comunità colpite da queste tecnologie.

Conclusione

Questa esplorazione sulla misrepresentazione e gli stereotipi riguardanti le identità non cisgender nella generazione di immagini evidenzia un urgente bisogno di cambiamento nel modo in cui queste tecnologie operano. Affrontando questi problemi attraverso il coinvolgimento della comunità, pratiche di addestramento migliori e funzionalità migliorate dei modelli, possiamo promuovere un ambiente più inclusivo negli spazi digitali.


Direzioni Future

I problemi identificati in questo studio indicano un urgente bisogno di ricerca continua nell'intersezione tra tecnologia, identità e rappresentazione. I lavori futuri dovrebbero considerare la natura in evoluzione delle identità di genere e come questi progressi possano aiutare o ostacolare l'inclusività.

Implicazioni più ampie

  1. Impatto sulla Società: La misrepresentazione nei media, comprese le immagini digitali, può influenzare la percezione pubblica e rinforzare stereotipi dannosi sulle identità non cisgender.
  2. Sensibilità Culturale: Sviluppatori e ricercatori devono affrontare la rappresentazione dell'identità con consapevolezza culturale e sensibilità rispetto alle esperienze vissute dei gruppi marginalizzati.

Continuando questa conversazione e spingendo per pratiche di sviluppo più responsabili, possiamo lavorare verso tecnologie che elevano e riflettono accuratamente il ricco arazzo dell'identità umana.

Fonte originale

Titolo: Stereotypes and Smut: The (Mis)representation of Non-cisgender Identities by Text-to-Image Models

Estratto: Cutting-edge image generation has been praised for producing high-quality images, suggesting a ubiquitous future in a variety of applications. However, initial studies have pointed to the potential for harm due to predictive bias, reflecting and potentially reinforcing cultural stereotypes. In this work, we are the first to investigate how multimodal models handle diverse gender identities. Concretely, we conduct a thorough analysis in which we compare the output of three image generation models for prompts containing cisgender vs. non-cisgender identity terms. Our findings demonstrate that certain non-cisgender identities are consistently (mis)represented as less human, more stereotyped and more sexualised. We complement our experimental analysis with (a)~a survey among non-cisgender individuals and (b) a series of interviews, to establish which harms affected individuals anticipate, and how they would like to be represented. We find respondents are particularly concerned about misrepresentation, and the potential to drive harmful behaviours and beliefs. Simple heuristics to limit offensive content are widely rejected, and instead respondents call for community involvement, curated training data and the ability to customise. These improvements could pave the way for a future where change is led by the affected community, and technology is used to positively ``[portray] queerness in ways that we haven't even thought of'' rather than reproducing stale, offensive stereotypes.

Autori: Eddie L. Ungless, Björn Ross, Anne Lauscher

Ultimo aggiornamento: 2023-05-26 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2305.17072

Fonte PDF: https://arxiv.org/pdf/2305.17072

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili