Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Biblioteche digitali# Calcolo e linguaggio

Graph di Conoscenza della Letteratura Mondiale: Una Nuova Risorsa

Una risorsa che collega autori e opere di tutto il mondo, concentrandosi su voci poco rappresentate.

― 8 leggere min


Nuova Risorsa per laNuova Risorsa per laLetteratura Globaleattraverso i dati.Collegare autori e lettori diversi
Indice

I media digitali hanno cambiato il modo in cui accediamo alle informazioni sulla letteratura. Autori, lettori e studiosi possono ora trovare e condividere una grande quantità di dati su libri e i loro scrittori. Tuttavia, queste informazioni spesso mancano di connessione e non rappresentano equamente gli scrittori dei paesi non occidentali. Questo lavoro presenta il World Literature Knowledge Graph (WL-KG), una risorsa che raccoglie dettagli su scrittori e le loro opere da tutto il mondo. Mira a fornire fatti utili su questi autori e la loro letteratura, concentrandosi specialmente su quelli che potrebbero non ricevere abbastanza attenzione.

Il WL-KG include informazioni su come diversi lettori ricevono le opere letterarie. Questi dati provengono da varie comunità di lettori e sono organizzati in un formato coerente. Gli utenti possono accedere a questa risorsa attraverso una piattaforma online, permettendo un'esplorazione chiara e interattiva della conoscenza letteraria.

L'impatto dei media digitali ha portato a cambiamenti nel modo in cui le persone leggono e studiano la letteratura. Le piattaforme digitali fungono da finestre su diverse culture e offrono punti di vista unici su come diverse comunità interagiscono con le opere letterarie. Anche se questi strumenti offrono nuove opportunità di ricerca, devono affrontare anche delle sfide. La vastità delle informazioni disponibili è spesso disgiunta e molti scrittori e le loro opere non sono adeguatamente rappresentati. Inoltre, risorse come Wikipedia e Wikidata tendono a trascurare gli autori provenienti da contesti non occidentali.

Il World Literature Knowledge Graph affronta queste problematiche creando una base di conoscenza completa. Compila dati su scrittori e le loro opere da tre fonti principali: Wikidata, Open Library e Goodreads. Questa raccolta si basa su un framework condiviso che evidenzia le origini etniche degli autori e riflette le risposte dei lettori alle loro opere.

Il WL-KG ha due scopi principali: (i) analizzare quanto siano sottorappresentati gli scrittori non occidentali; e (ii) esaminare come diverse comunità di lettori rispondano a varie opere. Questi obiettivi possono supportare lo sviluppo di strumenti per raccomandare libri e scoprire contenuti letterari, beneficiando utenti in ambienti multiculturali come educatori e ricercatori.

Questa risorsa è ospitata su una piattaforma di visualizzazione, che consente agli utenti di esplorare visivamente le informazioni. Sia la piattaforma che il WL-KG sono stati testati da vari esperti del settore che li hanno trovati utili per il loro lavoro. I feedback ricevuti hanno mostrato che la risorsa potrebbe migliorare le loro prestazioni lavorative e portare a risultati positivi.

Contesto e Lavori Correlati

La Letteratura Mondiale è un approccio moderno per studiare la letteratura che si concentra su come le opere si connettano oltre i confini. Questa prospettiva incoraggia a guardare oltre i confini nazionali e storici e ad analizzare come la letteratura venga ricevuta a livello mondiale. Recentemente, i social media hanno fornito una quantità senza precedenti di informazioni su scrittori e le loro opere, aprendo la strada a nuovi metodi di ricerca.

Le caratteristiche principali di questa teoria utilizzate per sviluppare il WL-KG sono il focus sulla ricezione da parte dei lettori e la prospettiva non occidentale. Questa risorsa consente agli utenti di apprendere sugli autori e le loro opere a livello globale, analizzando le questioni di rappresentanza in specifiche comunità di lettori.

Molte risorse digitali forniscono informazioni sulla letteratura. Ad esempio, Wikidata è una base di conoscenza generale, mentre Goodreads e Open Library si concentrano specificamente sui libri. Il WL-KG si distingue perché è la prima risorsa a studiare l'intersezione tra produzione letteraria e origini etniche degli autori. Anche se alcune ricerche guardano alla letteratura attraverso la lente di Wikipedia, il WL-KG mira a fornire una piattaforma che promuova le scienze umane digitali e gli studi letterari affrontando le lacune nella conoscenza sugli autori.

Tecnologie Semantiche per Studi Letterari

Numerose piattaforme online forniscono informazioni letterarie, ognuna con scopi diversi. Alcuni database sono curati da esperti, mentre altri si basano su contenuti generati dagli utenti. Ad esempio, la European Literary Text Collection si concentra su romanzi dal 1848 al 1920, e DraCor raccoglie diverse opere teatrali in più lingue.

Il WL-KG è unico perché studia specificamente la relazione tra letteratura e le origini etniche degli scrittori. Gli archivi esistenti spesso trascurano questo aspetto, il che può portare a rappresentazioni diseguali. Mentre piattaforme come Wikidata sono collegate ai dati aperti legati, Open Library offre interfacce di programmazione delle applicazioni (API), e Goodreads ha meno opzioni per l'integrazione dei dati.

Il modello semantico del WL-KG collega le informazioni letterarie da diverse fonti in modo coerente, permettendo agli utenti di analizzare le opere letterarie attraverso una lente etnica e culturale.

Il Modello Semantico

Il modello semantico utilizzato nel WL-KG aiuta a rappresentare la sottorappresentazione etnica e a comprendere la storia editoriale delle opere letterarie. L'Under-Represented Ontology Network è fondamentale per questo modello e si compone di due parti: l'Under-Represented Writers Ontology e l'Ontologia dei Libri Sottorappresentati.

Questo modello si collega a ontologie consolidate per migliorarne l'efficacia. Ad esempio, il modello Functional Requirements for Bibliographic Records (FRBR) chiarisce le relazioni tra un'opera, le sue espressioni e le loro forme fisiche. L'ontologia PROV traccia come viene raccolta l'informazione e chi è coinvolto in specifiche edizioni, mentre il modello DOLCE fornisce un framework per rappresentare eventi significativi della vita degli scrittori.

Per valutare la sottorappresentazione, il WL-KG si basa su due criteri basati sugli studi post-coloniali. Un autore può essere considerato sottorappresentato se è nato in una ex colonia non occidentale o appartiene a una minoranza etnica in un paese occidentale. Tuttavia, usare solo il luogo di nascita può portare a inesattezze poiché molti autori noti sono nati in ex colonie. Pertanto, il termine "Transnazionale" viene utilizzato per ampliare la definizione e catturare quegli scrittori che hanno lavorato oltre i confini della loro nazione.

Processo di Raccolta Dati

La creazione del WL-KG è iniziata raccogliendo informazioni da Wikidata relative a entità identificate come scrittori. I dati includevano il loro background etnico, genere, opere prodotte, nonché il luogo di nascita e di morte.

Per arricchire questa base di conoscenza, il progetto si è concentrato su identificatori esterni per collegare gli scrittori a Open Library e Goodreads. È stato utilizzato un programma software per abbinare i nomi degli scrittori e gli anni di nascita su diverse piattaforme. Questo approccio ha coinvolto anche lo scraping dei dati da Goodreads per raccogliere ulteriori informazioni.

Dopo questa mappatura iniziale, è stata condotta una valutazione della qualità per garantire che le connessioni tra scrittori e le loro opere fossero accurate. Questo ha comportato un confronto dei nomi tra le piattaforme e controlli manuali di campioni per garantirne l'affidabilità.

Raccolta Dati e Statistiche

Una volta stabiliti gli identificatori esterni, il progetto ha raccolto opere dagli autori identificati. Open Library ha fornito accesso a tutte le opere, mentre i dati di Goodreads sono stati ottenuti tramite web scraping. L'attenzione è stata posta su opere che avevano ricevuto un certo coinvolgimento da parte dei lettori.

Le statistiche mostrano che sia Open Library che Goodreads includevano più opere e scrittori rispetto a Wikidata, con una rappresentazione più alta per gli autori "Transnazionali". L'analisi di come i lettori interagiscono con queste opere ha rivelato differenze significative tra le due piattaforme, con Goodreads che ospitava miliardi di valutazioni rispetto al numero più ridotto di Open Library.

Piattaforma di Visualizzazione

Il WL-KG supporta l'interazione degli utenti attraverso un'interfaccia facile da navigare chiamata SKATEBOARD, che consente agli utenti di esplorare visivamente le connessioni letterarie. Gli utenti possono cercare autori e opere, trascinando elementi su una bacheca centrale per vedere le relazioni. Questa funzionalità di drag-and-drop semplifica l'esplorazione e incoraggia gli utenti a scoprire nuove connessioni nella letteratura.

La piattaforma consente anche ricerche basate su vari fattori, come il paese di nascita dello scrittore, la cittadinanza o specifici gruppi minoritari. Gli utenti possono visualizzare una panoramica di tutte le opere relative a un tema o argomento specifico.

Valutazione della Risorsa

Per comprendere quanto bene il WL-KG soddisfi le esigenze degli utenti, sono state condotte interviste con professionisti diversi. Ai partecipanti è stato chiesto di cercare scrittori sottorappresentati e fornire feedback sulla loro esperienza con la piattaforma. La facilità d'uso è stata un focus, e molti utenti hanno trovato difficile navigare nella risorsa a causa di una mancanza di familiarità con interfacce basate su grafi.

La maggior parte dei partecipanti ha riconosciuto il potenziale del WL-KG per scoprire nuovi autori, mentre alcuni hanno menzionato che era meno utile per esplorare nuove opere. I partecipanti utilizzavano spesso risorse online generali per le ricerche letterarie, indicando che il WL-KG potrebbe colmare una lacuna nell'esplorazione letteraria specializzata.

Sono stati fatti suggerimenti per migliorare l'esperienza dell'utente. Alcuni utenti hanno fatto notare che avere un elenco indicizzato di autori in base al loro paese di nascita potrebbe semplificare le ricerche. Altri hanno sottolineato che ulteriori informazioni sulle associazioni mancanti nelle opere migliorerebbero la completezza della risorsa.

Conclusione e Lavori Futuri

Il WL-KG è uno strumento prezioso per scoprire fatti su scrittori e le loro opere a livello globale. Sottolinea la mancanza di rappresentanza per gli autori non occidentali permettendo, al contempo, l'esplorazione di come diverse comunità interagiscono con la letteratura. La risorsa è accessibile al pubblico e offre un'esperienza user-friendly, anche se gli utenti potrebbero aver bisogno di orientamento a causa della loro poca familiarità con risorse basate su grafi.

Andando avanti, il WL-KG espanderà la sua base di conoscenza, arricchendola con input da nuove comunità di lettori e piattaforme tematiche. Inoltre, la piattaforma di visualizzazione subirà miglioramenti basati sui feedback degli utenti, concentrandosi su come renderla più intuitiva per gli utenti non esperti. Il progetto prevede anche di implementare un sistema di raccomandazione per testare la sua efficacia nel fornire suggerimenti letterari più equi.

Fonte originale

Titolo: The World Literature Knowledge Graph

Estratto: Digital media have enabled the access to unprecedented literary knowledge. Authors, readers, and scholars are now able to discover and share an increasing amount of information about books and their authors. However, these sources of knowledge are fragmented and do not adequately represent non-Western writers and their works. In this paper we present The World Literature Knowledge Graph, a semantic resource containing 194,346 writers and 965,210 works, specifically designed for exploring facts about literary works and authors from different parts of the world. The knowledge graph integrates information about the reception of literary works gathered from 3 different communities of readers, aligned according to a single semantic model. The resource is accessible through an online visualization platform, which can be found at the following URL: https://literaturegraph.di.unito.it/. This platform has been rigorously tested and validated by $3$ distinct categories of experts who have found it to be highly beneficial for their respective work domains. These categories include teachers, researchers in the humanities, and professionals in the publishing industry. The feedback received from these experts confirms that they can effectively utilize the platform to enhance their work processes and achieve valuable outcomes.

Autori: Marco Antonio Stranisci, Eleonora Bernasconi, Viviana Patti, Stefano Ferilli, Miguel Ceriani, Rossana Damiano

Ultimo aggiornamento: 2023-07-31 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2307.16659

Fonte PDF: https://arxiv.org/pdf/2307.16659

Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili