Riconoscere fatti e opinioni nei media
Uno sguardo agli strumenti che aiutano a identificare il linguaggio vago e soggettivo nei testi.
― 5 leggere min
Nella nostra vita quotidiana, ci imbattiamo spesso in affermazioni che si dichiarano fatti o esprimono opinioni. Ma come facciamo a distinguere quando non abbiamo conoscenze pregresse? Questa domanda è importante, soprattutto quando cerchiamo di valutare la qualità delle informazioni che troviamo online o in altri media.
Un recente sondaggio condotto da un gruppo di ricerca mirava a vedere quanto bene le persone riescono a riconoscere affermazioni fattuali rispetto a opinioni. Il sondaggio ha mostrato che mentre molti partecipanti riuscivano a classificare correttamente le affermazioni, un gran numero faticava a identificare tutte le affermazioni fattuali con precisione. Questo indica che riconoscere cosa sia un'opinione e cosa sia un fatto può essere complicato e spesso dipende dal linguaggio usato nelle affermazioni.
Per affrontare questo problema, i ricercatori hanno sviluppato uno strumento progettato per misurare l'ambiguità e la Soggettività nei testi. Questo strumento analizza quanto è preciso o vago un'affermazione e se comunica un'opinione soggettiva o un fatto oggettivo. Ad esempio, se un Testo usa parole come "circa" o "alcuni," potrebbe essere meno preciso e più vago. Allo stesso modo, termini che esprimono sentimenti o convinzioni personali possono indicare soggettività.
Lo strumento ha utilizzato un approccio metodico, creando un database di termini vaghi. Questo database ha categorizzato parole e frasi vaghe in diversi tipi, come vaghezza approssimativa, vaghezza generale, vaghezza di grado e vaghezza combinatoria. Ogni categoria include esempi di parole che vi rientrano.
Ad esempio, parole come "quasi" potrebbero indicare approssimazione, mentre "la maggior parte" può rappresentare generalità. Alcune espressioni come "grande" o "buono" possono mostrare gradi variabili di una qualità. L'obiettivo era identificare e misurare quanto spesso queste parole vaghe appaiono in un testo per determinare la sua vaghezza complessiva e soggettività.
In pratica, lo strumento viene applicato a vari testi per valutare quanto spesso appaiono parole vaghe o soggettive. Se un testo ha diverse parole vaghe, avrà un punteggio alto sulla scala di vaghezza. D'altra parte, se ha un linguaggio chiaro e specifico, avrà un punteggio più basso per la vaghezza. Lo stesso principio si applica alla soggettività. Se un testo contiene molti termini soggettivi, avrà un punteggio alto per soggettività, riflettendo un'opinione piuttosto che un fatto.
Testando questo strumento usando un database di articoli di notizie, sono emersi risultati interessanti. Gli articoli etichettati come satirici tendevano a essere più vaghi e più soggettivi rispetto agli articoli di notizie normali. Questo è in linea con le aspettative comuni, poiché la scrittura satirica spesso comporta esagerazioni e opinioni anziché reportage chiari.
Per rendere i risultati ancora più solidi, è stata creata una versione neurale dello strumento originale. Questa nuova versione utilizza tecnologie avanzate per analizzare i testi e prevedere automaticamente i punteggi di vaghezza e soggettività. È stata addestrata sui dati precedentemente raccolti, rendendola capace di valutare i testi con alta precisione.
La performance dello strumento neurale è stata misurata rispetto ai metodi tradizionali, e ha mostrato risultati forti. I ricercatori hanno scoperto che la versione neurale identificava termini vaghi e soggettivi in modo simile allo strumento originale, confermando che poteva replicare efficacemente il sistema di punteggio.
Un aspetto interessante di questa ricerca è l'uso di Strumenti di spiegabilità. Questi strumenti aiutano a chiarire come sono state prese le decisioni dal sistema neurale. Analizzando quali parole in un testo hanno contribuito di più ai punteggi di vaghezza e soggettività, i ricercatori potevano vedere se lo strumento neurale si basava sugli stessi indicatori del metodo originale. Questo tipo di intuizione è prezioso per comprendere l'efficacia dello strumento.
Inoltre, lo studio ha dimostrato che questo approccio potrebbe estendersi oltre le lingue francese e inglese. Traducendo un insieme di testi in altre lingue e applicando lo stesso sistema di punteggio, i ricercatori potrebbero sviluppare strumenti simili per culture e lingue diverse mantenendo i principi fondamentali della misurazione dell'ambiguità e della soggettività.
L'obiettivo di questa ricerca è aiutare a migliorare la qualità delle informazioni disponibili al pubblico e assistere gli utenti nell'analizzare l'oggettività o la soggettività nei testi che incontrano. Fornendo una comprensione più chiara di come il linguaggio possa trasmettere fatti o opinioni, questo strumento mira ad aiutare gli utenti a impegnarsi criticamente con le informazioni.
Mentre i ricercatori continuano a perfezionare questo strumento, mirano a incorporare ulteriori caratteristiche che possono catturare aspetti più sfumati del linguaggio, come pronomi personali o espressioni emotive. La speranza è di aggiornare ulteriormente questo strumento per fornire una rappresentazione ancora più accurata di come il linguaggio possa mostrare oggettività o soggettività nei media.
In conclusione, misurare l'ambiguità e la soggettività nei testi è cruciale nell'attuale ambiente ricco di informazioni. Poiché le persone faticano a distinguere tra fatti e opinioni, strumenti come quello descritto possono fungere da risorse preziose. Catturando le sottigliezze del linguaggio, questi strumenti non solo migliorano la nostra comprensione dei testi, ma anche la qualità delle informazioni con cui interagiamo ogni giorno. Lo sviluppo continuo di questi approcci promette di creare una società più informata, capace di navigare il complesso mondo delle informazioni in modo più efficace.
Titolo: Measuring vagueness and subjectivity in texts: from symbolic to neural VAGO
Estratto: We present a hybrid approach to the automated measurement of vagueness and subjectivity in texts. We first introduce the expert system VAGO, we illustrate it on a small benchmark of fact vs. opinion sentences, and then test it on the larger French press corpus FreSaDa to confirm the higher prevalence of subjective markers in satirical vs. regular texts. We then build a neural clone of VAGO, based on a BERT-like architecture, trained on the symbolic VAGO scores obtained on FreSaDa. Using explainability tools (LIME), we show the interest of this neural version for the enrichment of the lexicons of the symbolic version, and for the production of versions in other languages.
Autori: Benjamin Icard, Vincent Claveau, Ghislain Atemezing, Paul Égré
Ultimo aggiornamento: 2023-10-23 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2309.06132
Fonte PDF: https://arxiv.org/pdf/2309.06132
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.