Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Rechnen und Sprache# Künstliche Intelligenz# Computer und Gesellschaft# Informationsbeschaffung# Maschinelles Lernen# Soziale und Informationsnetzwerke

Rückführungsbemühungen für indigene Ahnenreste

Forschung kombiniert maschinelles Lernen und Expertenwissen, um die Rückführung zu unterstützen.

― 6 min Lesedauer


Ureinwohnerüberreste: EinUreinwohnerüberreste: EinAufruf zum HandelnRückkehr zu unseren Wurzeln.Technik und Tradition vereinen für die
Inhaltsverzeichnis

Die Rückführung von indigenen Ahnenresten ist ein wichtiges Thema für die First Nations in Australien und darüber hinaus. Viele dieser Überreste befinden sich aktuell in westlichen wissenschaftlichen Institutionen, und ihre Rückgabe an die Gemeinschaften für eine Wiederbegräbnis ist unerlässlich. Dieser Prozess wird durch die Notwendigkeit erschwert, Dokumente aus den Jahren 1790 bis 1970 zu finden, die zeigen, wie die Überreste entnommen, gespendet, verkauft oder zwischen Institutionen ausgetauscht wurden.

Die Herausforderung, historische Dokumente zu finden

Mehrere Organisationen und Forscher arbeiten zusammen, um diese Herausforderung anzugehen. Sie konzentrieren sich darauf, Text Mining-Techniken zu nutzen, um wichtige Informationen in verschiedenen Texten zu finden. Die Daten- und Sozialwissenschaftler wollen automatisierte Lösungen entwickeln, um diese Informationen effizient zu analysieren. Sie haben Methoden entwickelt, die maschinelles Lernen anwenden, um relevante Dokumente zu finden und zu analysieren.

Eine der Hauptaufgaben in diesem Bemühen ist es, die Genauigkeit bei der Erkennung relevanter Texte zu verbessern. Traditionelle Klassifikationsmodelle haben oft Schwierigkeiten, wenn sie mit kleinen Mengen an beschrifteten Dokumenten trainiert werden, die unerlässlich sind, um dem Modell beizubringen, wonach es suchen soll. Um dieses Problem zu lösen, erkunden die Forscher einen neuen Modelltyp namens Informed Neural Network (INN). Dieses Modell nutzt Erkenntnisse von Experten auf dem Gebiet, um den Inhalt von Dokumenten genauer zu beschreiben.

Die Bedeutung von Expertenwissen

Das INN-Modell basiert auf wenigen beschrifteten Dokumenten und integriert Wissen von Experten in der Provenienzforschung. Diese Experten liefern Schlüsselwörter, die wahrscheinlich in relevanten Dokumenten erscheinen, was die Fähigkeit des Modells erhöht, die richtigen Informationen zu erkennen. Die Ergebnisse zeigen, dass dieser informierte Ansatz die Identifikation von Dokumenten, die mit dem Handel und der Handhabung indigener menschlicher Überreste verbunden sind, erheblich verbessert.

Digitale Bibliotheken und Online-Ressourcen

In den letzten Jahren haben verschiedene Initiativen digitaler Bibliotheken die Suche nach historischen Dokumenten erleichtert. Viele Bücher, wissenschaftliche Zeitschriften und Zeitungsartikel sind jetzt online in digitalen Formaten verfügbar. Allerdings stellt die Suche nach relevanten Informationen über den Diebstahl und die Nutzung von Ahnenüberresten Herausforderungen dar. Die Forscher müssen auf Suchmaschinen angewiesen sein, die möglicherweise verzerrte Ergebnisse liefern. Diese Ergebnisse spiegeln möglicherweise nicht alle notwendigen Dokumente wider, aufgrund der Art und Weise, wie sie indiziert sind.

Forscher, die mit First Nation-Gemeinschaften arbeiten, stehen vor der Herausforderung, die Identität und den Standort von Ahnenüberresten zu bestätigen, um ein richtiges Wiederbegräbnis zu unterstützen. Dieser Prozess erfordert oft umfangreiche Bemühungen, um die Bewegungen der Überreste durch verschiedene Sammler und Institutionen nachzuvollziehen. Leider bieten die aktuellen Museums-kataloge nur begrenzte Daten und zeigen meist nur die endgültigen Standorte der Überreste, was zu Fehlern bei der Identifizierung führen kann.

Die Vielfalt historischer Quellen

Viele historische Quellen, die wertvolle Informationen bieten könnten, sind über verschiedene Online-Plattformen verstreut. Dazu gehören Zeitungsartikel, die Museums-spenden und -verkäufe dokumentieren, Anzeigen für Auktionen und Berichte über den Verkauf privater Sammlungen. Trotz ihres potenziellen Nutzens kann die Auffindung und Untersuchung dieser Quellen eine gewaltige Aufgabe sein. Digitale Bibliotheksprojekte haben versucht, diese Dokumente zu sammeln und zu organisieren, aber das Navigieren durch diese Sammlungen bleibt für die Forscher schwierig.

Die Rolle des maschinellen Lernens

Maschinelles Lernen bietet eine vielversprechende Lösung zur Automatisierung der Identifikation relevanter Dokumente. Dieser Ansatz ist besonders nützlich aufgrund des historischen Kontexts der Dokumente, der in Sprache und Inhalt von modernen Texten abweichen kann. Viele historische Dokumente werden gescannt und durch optische Zeichenerkennung (OCR) verfügbar gemacht, aber dieser Prozess kann Fehler einführen, was es schwer macht, den Text genau wiederzugeben.

Vorhandene Sprachmodelle, wie sie in aktuellen Anwendungen des maschinellen Lernens verwendet werden, schaffen es oft nicht, die Nuancen und den Kontext historischer Dokumente zu erfassen. Darüber hinaus benötigen diese Modelle normalerweise eine erhebliche Menge an beschrifteten Daten für ein effektives Training, was in den Geistes- und Sozialwissenschaften oft nicht verfügbar ist.

Entwicklung eines Klassifikationsmodells

Um diese Probleme anzugehen, arbeiten Forscher daran, ein überwachtes Lernmodell zu entwerfen, das den INN-Ansatz nutzt. Dieses Modell kombiniert Expertenwissen mit maschinellem Lernen, um die Erkennung relevanter Dokumente zu verbessern. Das von den Experten bereitgestellte Wissen umfasst Schlüsselwörter und den Kontext, in dem diese Schlüsselwörter wahrscheinlich erscheinen. Diese Integration ist entscheidend, da sie hilft, die Leistung des Modells zu verbessern, während die Anzahl der benötigten beschrifteten Dokumente für das Training minimiert wird.

Die Bedeutung von Schlüsselwörtern

Die gewählten Schlüsselwörter helfen dem Modell, über die spezifischen Themen im Zusammenhang mit indigenen Überresten zu lernen. Zu verstehen, wie diese Schlüsselwörter in Dokumenten interagieren, liefert den notwendigen Kontext zur Identifizierung relevanter Informationen. Forscher haben mehrere Zentralitätsmasse identifiziert, die dabei helfen, diese Interaktionen zu analysieren und die Fähigkeit des Modells weiter zu verfeinern, wenn ein Dokument relevant ist.

Bewertung der Modellleistung

Die Forscher führen Experimente durch, um die Genauigkeit und Effektivität des Modells zu bewerten. Verschiedene Kennzahlen werden verwendet, um zu beurteilen, wie gut das Modell relevante Dokumente identifiziert. Zwei Datensätze werden zu diesem Zweck verwendet: einer zu indigenen menschlichen Überresten und ein anderer aus einem Standard-Nachrichtenkorpus.

Durch diese Experimente zeigte das INN-Modell die Fähigkeit, traditionelle Klassifikationsmodelle zu übertreffen. Die kombinierte Verwendung von expertengestütztem Wissen und datengestützten Methoden ermöglicht es diesem Modell, auch mit kleineren Datensätzen effektiv zu bleiben. Die Ergebnisse deuten auf bemerkenswerte Verbesserungen in Leistungskennzahlen wie Genauigkeit, Präzision und Rückruf hin.

Der Einfluss der Grösse des Trainingsdatensatzes

In den Experimenten haben die Forscher auch untersucht, wie die Grösse des Trainingsdatensatzes die Leistung des Modells beeinflusst. Die Ergebnisse zeigten, dass das INN-Modell auch mit sehr kleinen Trainingsproben eine angemessene Genauigkeit erreichen konnte. Je mehr Trainingsdaten verfügbar werden, desto besser wird die Leistung des Modells, was den Wert der Kombination von Experteninput mit datengestützten Ansätzen hervorhebt.

Zukünftige Richtungen

In Zukunft gibt es Pläne, das INN-Modell weiter zu verfeinern und die Integration zusätzlicher Arten von Expertenwissen, wie Wissensgraphen, zu erkunden. Dies könnte die Fähigkeiten des Modells verbessern und ein tieferes Verständnis des Kontexts rund um die in der Dokumentenidentifikation verwendeten Schlüsselwörter bieten.

Darüber hinaus beabsichtigen die Forscher, die Erkenntnisse aus dieser Arbeit auf breitere Bereiche anzuwenden, einschliesslich der Analyse sozialer Netzwerke. Zu verstehen, wie bedeutend die Verbindungen zwischen Schlüsselwörtern sind, kann weitreichende Auswirkungen über den aktuellen Fokus auf indigene menschliche Überreste hinaus haben.

Fazit

Die Bemühungen um die Rückführung indigener Ahnenreste unterstreichen die Bedeutung von Zusammenarbeit und Innovation in der Forschung. Durch die Kombination von Expertenwissen mit maschinellem Lernen ebnen die Forscher den Weg für eine effektivere Identifikation und Analyse historischer Dokumente. Diese Arbeit hilft nicht nur bei der Rückgabe von Ahnenüberresten, sondern trägt auch zu einem besseren Verständnis der Geschichten und Erbschaften der First Nations bei. Durch fortlaufende Fortschritte gibt es Hoffnung auf verbesserte Ergebnisse bei Rückführungsbemühungen und der Erhaltung kulturellen Erbes.

Originalquelle

Titel: Informed Machine Learning, Centrality, CNN, Relevant Document Detection, Repatriation of Indigenous Human Remains

Zusammenfassung: Among the pressing issues facing Australian and other First Nations peoples is the repatriation of the bodily remains of their ancestors, which are currently held in Western scientific institutions. The success of securing the return of these remains to their communities for reburial depends largely on locating information within scientific and other literature published between 1790 and 1970 documenting their theft, donation, sale, or exchange between institutions. This article reports on collaborative research by data scientists and social science researchers in the Research, Reconcile, Renew Network (RRR) to develop and apply text mining techniques to identify this vital information. We describe our work to date on developing a machine learning-based solution to automate the process of finding and semantically analysing relevant texts. Classification models, particularly deep learning-based models, are known to have low accuracy when trained with small amounts of labelled (i.e. relevant/non-relevant) documents. To improve the accuracy of our detection model, we explore the use of an Informed Neural Network (INN) model that describes documentary content using expert-informed contextual knowledge. Only a few labelled documents are used to provide specificity to the model, using conceptually related keywords identified by RRR experts in provenance research. The results confirm the value of using an INN network model for identifying relevant documents related to the investigation of the global commercial trade in Indigenous human remains. Empirical analysis suggests that this INN model can be generalized for use by other researchers in the social sciences and humanities who want to extract relevant information from large textual corpora.

Autoren: Md Abul Bashar, Richi Nayak, Gareth Knapman, Paul Turnbull, Cressida Fforde

Letzte Aktualisierung: 2023-03-25 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2303.14475

Quell-PDF: https://arxiv.org/pdf/2303.14475

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel