Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Calcolo e linguaggio# Intelligenza artificiale# Computer e società# Recupero delle informazioni# Apprendimento automatico# Reti sociali e informative

Sforzi di Rimpatrio per Resti Ancestrali Indigeni

La ricerca unisce l'apprendimento automatico e la conoscenza degli esperti per supportare il rimpatrio.

― 6 leggere min


Resti Indigeni: UnResti Indigeni: UnAppello all'Azioneritorno ancestrale.Unendo tecnologia e tradizione per un
Indice

Il rimpatrio dei resti ancestrali degli Indigeni è un argomento importante per i popoli delle Prime Nazioni in Australia e oltre. Molti di questi resti sono attualmente custoditi in istituzioni scientifiche occidentali e il loro ritorno alle comunità per la riesumazione è fondamentale. Questo processo è complicato dalla necessità di trovare documentazione sugli anni dal 1790 al 1970 che segua come i resti siano stati presi, donati, venduti o scambiati tra le istituzioni.

La Sfida di Trovare Documentazione Storica

Diverse organizzazioni e ricercatori stanno collaborando per affrontare questa sfida. Si concentrano sull'utilizzo di tecniche di text mining per localizzare informazioni cruciali in vari testi. I data scientist e i social scientist puntano a creare soluzioni automatizzate per analizzare queste informazioni in modo efficiente. Hanno sviluppato metodi che applicano l'apprendimento automatico per aiutare a trovare e analizzare documenti pertinenti.

Uno dei principali compiti in questo sforzo è migliorare la precisione nel rilevare testi rilevanti. I Modelli di Classificazione tradizionali spesso fanno fatica quando vengono addestrati con piccole quantità di documenti etichettati, che sono essenziali per insegnare al modello cosa cercare. Per affrontare questo problema, i ricercatori stanno esplorando un nuovo tipo di modello chiamato Informed Neural Network (INN). Questo modello utilizza intuizioni da esperti nel campo per descrivere il contenuto dei documenti in modo più accurato.

L'Importanza della Conoscenza degli Esperti

Il modello INN si basa su pochi documenti etichettati e incorpora conoscenze di esperti nella ricerca di provenienza. Questi esperti forniscono Parole chiave che è probabile che compaiano nei documenti pertinenti, migliorando la capacità del modello di rilevare le informazioni giuste. I risultati indicano che utilizzare questo approccio informato migliora notevolmente l'identificazione dei documenti legati al commercio e alla gestione dei resti umani indigeni.

Biblioteche Digitali e Risorse Online

Negli ultimi anni, varie iniziative di biblioteche digitali hanno reso più facile la ricerca di documenti storici. Molti libri, riviste scientifiche e articoli di giornale sono ora disponibili online in formati digitali. Tuttavia, trovare informazioni rilevanti sul furto e l'uso dei resti ancestrali presenta delle sfide. I ricercatori devono fare affidamento sui motori di ricerca, che possono produrre risultati distorti. Questi risultati potrebbero non riflettere tutti i documenti necessari a causa del modo in cui sono indicizzati.

I ricercatori che lavorano con le comunità delle Prime Nazioni devono confermare l'identità e la posizione dei resti ancestrali per assistere nella loro corretta riesumazione. Questo processo spesso richiede sforzi intensivi per rintracciare i movimenti dei resti attraverso diversi collezionisti e istituzioni. Sfortunatamente, i cataloghi dei musei attuali offrono dati limitati, di solito mostrando solo le posizioni finali dei resti, il che può portare a errori nell'identificazione.

La Varietà delle Fonti Storiche

Molte fonti storiche che potrebbero fornire informazioni preziose sono sparse su diverse piattaforme online. Queste possono includere articoli di giornale che documentano donazioni e vendite nei musei, annunci per aste e rapporti sulla vendita di collezioni private. Nonostante la loro potenziale utilità, localizzare e indagare su queste fonti può essere un compito arduo. I progetti di biblioteche digitali hanno cercato di raccogliere e organizzare questi documenti, ma navigare in queste collezioni rimane difficile per i ricercatori.

Il Ruolo dell'Apprendimento Automatico

L'apprendimento automatico offre una soluzione promettente per automatizzare l'identificazione dei documenti rilevanti. Questo approccio è particolarmente utile a causa del contesto storico dei documenti, che può variare nel linguaggio e nel contenuto rispetto ai testi moderni. Molti documenti storici sono scannerizzati e resi disponibili tramite Riconoscimento Ottico dei Caratteri (OCR), ma questo processo può introdurre errori, rendendo difficile riprodurre accuratamente il testo.

I modelli di linguaggio esistenti, come quelli utilizzati nelle recenti applicazioni di apprendimento automatico, spesso non riescono a catturare le sfumature e il contesto dei documenti storici. Inoltre, questi modelli di solito richiedono una quantità significativa di dati etichettati per un addestramento efficace, che spesso non è disponibile nelle scienze umane e sociali.

Sviluppare un Modello di Classificazione

Per affrontare questi problemi, i ricercatori stanno lavorando per progettare un modello di apprendimento supervisionato che utilizza l'approccio INN. Questo modello integra la conoscenza degli esperti con l'apprendimento automatico per migliorare il rilevamento dei documenti pertinenti. La conoscenza fornita dagli esperti include parole chiave e il contesto in cui queste parole chiave è probabile che appaiano. Questa integrazione è cruciale, poiché aiuta a migliorare le prestazioni del modello, riducendo al contempo il numero di documenti etichettati necessari per l'addestramento.

L'Importanza delle Parole Chiave

Le parole chiave scelte aiutano il modello a imparare gli argomenti specifici legati ai resti indigeni. Comprendere come queste parole chiave interagiscono all'interno dei documenti fornisce il contesto necessario per identificare informazioni pertinenti. I ricercatori hanno identificato diverse misure di centralità che aiutano ad analizzare queste interazioni, affinando ulteriormente la capacità del modello di segnalare quando un documento è pertinente.

Valutare le Prestazioni del Modello

I ricercatori stanno conducendo esperimenti per valutare l'accuratezza e l'efficacia del modello. Vengono utilizzate diverse metriche per valutare quanto bene il modello identifica i documenti pertinenti. Due set di dati sono impiegati a questo scopo: uno relativo ai Resti Umani Indigeni e un altro da un corpus di notizie standard.

Attraverso questi esperimenti, il modello INN ha dimostrato la capacità di superare i modelli di classificazione tradizionali. L'uso combinato di conoscenza informata dagli esperti e metodi basati sui dati consente a questo modello di rimanere efficace anche con set di dati più piccoli. I risultati suggeriscono miglioramenti notevoli nelle metriche di prestazione come accuratezza, precisione e richiamo.

L'Impatto della Dimensione del Set di Dati di Addestramento

Negli esperimenti, i ricercatori hanno anche esaminato come la dimensione del set di dati di addestramento influenzi le prestazioni del modello. I risultati hanno mostrato che il modello INN può comunque raggiungere un'accuratezza ragionevole con campioni di addestramento molto piccoli. Man mano che diventano disponibili più dati di addestramento, le prestazioni del modello migliorano costantemente, evidenziando il valore di combinare il contributo degli esperti con approcci basati sui dati.

Direzioni Future

Andando avanti, ci sono piani per affinare ulteriormente il modello INN ed esplorare l'integrazione di ulteriori tipi di conoscenza esperta, come i grafi di conoscenza. Questo potrebbe migliorare le capacità del modello e offrire una comprensione più profonda del contesto che circonda le parole chiave utilizzate nell'identificazione dei documenti.

Inoltre, i ricercatori mirano ad applicare le intuizioni ottenute da questo lavoro a benefici più ampi, inclusa l'analisi delle reti sociali. Comprendere il significato delle connessioni tra le parole chiave può avere implicazioni di vasta portata oltre l'attuale focus sui resti umani indigeni.

Conclusione

Gli sforzi intorno al rimpatrio dei resti ancestrali degli Indigeni sottolineano l'importanza della collaborazione e dell'innovazione nella ricerca. Combinando la conoscenza degli esperti con l'apprendimento automatico, i ricercatori stanno aprendo la strada a un'identificazione e un'analisi più efficaci dei documenti storici. Questo lavoro non solo aiuta nel ritorno dei resti ancestrali, ma contribuisce anche a una maggiore comprensione delle storie e delle eredità dei popoli delle Prime Nazioni. Con i progressi continui, c'è speranza per risultati migliori negli sforzi di rimpatrio e nella preservazione del patrimonio culturale.

Fonte originale

Titolo: Informed Machine Learning, Centrality, CNN, Relevant Document Detection, Repatriation of Indigenous Human Remains

Estratto: Among the pressing issues facing Australian and other First Nations peoples is the repatriation of the bodily remains of their ancestors, which are currently held in Western scientific institutions. The success of securing the return of these remains to their communities for reburial depends largely on locating information within scientific and other literature published between 1790 and 1970 documenting their theft, donation, sale, or exchange between institutions. This article reports on collaborative research by data scientists and social science researchers in the Research, Reconcile, Renew Network (RRR) to develop and apply text mining techniques to identify this vital information. We describe our work to date on developing a machine learning-based solution to automate the process of finding and semantically analysing relevant texts. Classification models, particularly deep learning-based models, are known to have low accuracy when trained with small amounts of labelled (i.e. relevant/non-relevant) documents. To improve the accuracy of our detection model, we explore the use of an Informed Neural Network (INN) model that describes documentary content using expert-informed contextual knowledge. Only a few labelled documents are used to provide specificity to the model, using conceptually related keywords identified by RRR experts in provenance research. The results confirm the value of using an INN network model for identifying relevant documents related to the investigation of the global commercial trade in Indigenous human remains. Empirical analysis suggests that this INN model can be generalized for use by other researchers in the social sciences and humanities who want to extract relevant information from large textual corpora.

Autori: Md Abul Bashar, Richi Nayak, Gareth Knapman, Paul Turnbull, Cressida Fforde

Ultimo aggiornamento: 2023-03-25 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2303.14475

Fonte PDF: https://arxiv.org/pdf/2303.14475

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili