Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Computer Vision und Mustererkennung# Maschinelles Lernen

Die Wiederbelebung der Herculaneum-Papyri

Neue Techniken zielen darauf ab, alte Texte beschädigungsfrei zu lesen.

― 6 min Lesedauer


Wiederherstellung derWiederherstellung derHerculaneum-PapyriTexte aus der Asche.Revolutionäre Techniken holen alte
Inhaltsverzeichnis

Im Jahr 79 n. Chr. brach der Vesuv aus und begrub die römischen Städte Pompeji und Herculaneum unter dicken Schichten aus Asche und Trümmern. Durch dieses katastrophale Ereignis wurden viele antike Artefakte erhalten, aber auch beschädigt. Eine der wichtigsten Entdeckungen war eine Sammlung von Papyrusrollen, die in einer Villa in Herculaneum gefunden wurden. Trotz ihres zerbrechlichen Zustands sind sie die einzige erhaltene Bibliothek aus der Antike, was das Interesse an der Wiederherstellung und dem Verständnis ihres Inhalts weiter anheizt.

Die Herculaneum-Papyri

Die Herculaneum-Rollen zählen über 900, von denen viele stark verbrannt und spröde sind. Die intense Hitze und der Sauerstoffmangel während des Vulkanausbruchs führten dazu, dass das Papyrus karbonisierte und zu zerbrechlichen Überresten wurde. Traditionelle Methoden, diese Rollen zu lesen, die versuchen, sie physisch zu entrollen, führten oft zu weiterer Zerstörung. Dadurch gibt es Wissenslücken und fehlende Textteile.

Fortschrittliche Bildgebungstechnologien

In den letzten Jahren sind neue Bildgebungstechnologien aufgetaucht, die als mögliche Lösungen für das zerstörungsfreie Lesen der Herculaneum-Rollen dienen. Techniken wie die Mikro-Computertomographie (Mikro-CT) ermöglichen es Forschern, detaillierte innere Strukturen der Rollen zu erfassen, ohne sie zu beschädigen. Allerdings gibt es mehrere Herausforderungen, die den Fortschritt behindern.

Die Tinte, die in den Rollen verwendet wird, besteht fast vollständig aus Kohlenstoff, was es schwierig macht, sie von dem kohlenstoffbasierten Papyrus im Röntgenbild zu unterscheiden. Daher führen traditionelle Methoden oft zu Bildern, die leer erscheinen, obwohl verborgener Text vorhanden ist.

Die Herausforderungen beim Lesen der Rollen

Mehrere bedeutende Herausforderungen erschweren das Wiederfinden des Textes aus den Herculaneum-Rollen. Erstens fehlt der Tinte der starke Kontrast zum Papyrus im Röntgenbild, was das Erkennen erschwert. Zweitens ist die Struktur der Rollen komplex und besteht aus mehreren komprimierten Schichten, die gewickelt und zerknittert sind.

Diese Faktoren verursachen Komplikationen beim Versuch, die Bilder so zu segmentieren, dass die Tintentextstellen identifiziert werden können.

Ein neuer Ansatz: EduceLab-Scrolls

EduceLab-Scrolls stellt einen neuen Datensatz vor, der darauf abzielt, diese Herausforderungen zu überwinden. Dieser Datensatz kombiniert hochauflösende Mikro-CT-Bilder der Rollen mit fortschrittlichen Techniken des maschinellen Lernens. Er repräsentiert über zwanzig Jahre Forschung, die sich auf das Aufdecken der verborgenen Texte der Herculaneum-Papyri konzentriert.

Der Datensatz umfasst sowohl intakte Rollen als auch kleine Fragmente, die es Forschern ermöglichen, ein vollständigeres Bild davon zu erstellen, was die Texte möglicherweise sagen. Darüber hinaus bietet er eine Ausrichtung zwischen verschiedenen Bildgebungsmodalitäten, die 3D-Röntgen-CT-Daten mit 2D-Oberflächenbildern verbindet, die zeigen, wo sich die Tinte befindet.

Wie der Datensatz funktioniert

EduceLab-Scrolls enthält nicht nur Bilder, sondern auch Beschriftungen, die angeben, wo die Tinte wahrscheinlich zu finden ist. Durch die Ausrichtung dieser Beschriftungen mit den Röntgen-CT-Bildern kann ein Modell für Maschinelles Lernen trainiert werden, um die Präsenz von Tinte selbst unter schwierigen Bildgebungsbedingungen zu erkennen.

Dieser Ansatz ermöglicht eine Methode, die lernt, Tintenstandorte allein anhand der Muster in den Bildern zu identifizieren.

Training der Modelle

Um das Modell für maschinelles Lernen zu trainieren, werden beschriftete Bilder von Rollenfragmenten mit bekannten Tintenstandorten verwendet. Das Modell konzentriert sich darauf, Muster zu erkennen, die auf die Anwesenheit von Tinte hinweisen. Es stützt sich nicht auf Vorwissen über Sprache, Zeichen oder Schreibstile. Stattdessen sucht es nach spezifischen Merkmalen in den Pixeln der Bilder.

Sobald das Modell trainiert ist, kann es dieses Wissen dann auf kleinere Teile der Rollen anwenden, selbst wenn der Text zuvor nie entschlüsselt wurde.

Erste Ergebnisse

Die ersten Ergebnisse aus der Anwendung dieses Modells auf die Rollenfragmente sind vielversprechend. Das Modell hat erfolgreich Zeilen von Text identifiziert und enthüllt, die fast zweitausend Jahre lang nicht gesehen wurden. Forscher validieren diese Ergebnisse, indem sie die Vorhersagen des Modells mit den bekannten Tintenstandorten auf den Rollen vergleichen.

Bewertungsmetriken

Um die Leistung des Tintentzerkennungsmodells zu bewerten, verwenden die Forscher visuelle und quantitative Metriken. Dazu gehört das Überprüfen, wie viel des echten Textes wiederhergestellt werden kann und wie viele falsche Ablesungen das Modell erzeugt. Es wird angestrebt, ein ausgewogenes Verhältnis zwischen der Erkennung echter Tinte und der Vermeidung irreführender Ausgaben zu finden.

Visuelle Bestätigungen helfen sicherzustellen, dass das, was das Modell produziert, genau ist und mit den bekannten Fakten übereinstimmt. Dieser Feedback-Zyklus ermöglicht eine kontinuierliche Verbesserung der Vorhersagen des Modells.

Anwendungsbereiche in der Praxis

Der Erfolg von EduceLab-Scrolls hebt nicht nur das Potenzial hervor, Herculaneum-Texte zu lesen, sondern deutet auch auf breitere Anwendungen hin. Die Techniken, die durch dieses Projekt entwickelt wurden, könnten auch für andere Bereiche angepasst werden, wie z. B. die medizinische Bildgebung, wo subtile Signale oft übersehen werden.

Für medizinische Fachleute könnte die Fähigkeit, verborgene Merkmale in Scans zu erkennen, zu besseren Diagnosen und Behandlungsplänen führen.

Zusammenarbeit

Die Erstellung von EduceLab-Scrolls ist das Ergebnis umfangreicher Zusammenarbeit in verschiedenen Bereichen. Historiker, Technologen und Wissenschaftler haben alle eine entscheidende Rolle bei der Förderung dieser Forschung gespielt. Ihr gebündeltes Fachwissen hat zu einem umfassenderen Verständnis der Rollen und neuen Methoden zur Wiedergewinnung von Texten geführt.

Zukünftige Richtungen

Obwohl die bisher erzielten Fortschritte ermutigend sind, gibt es noch viel zu tun. Mit der Verbesserung der Bildgebungstechnologien und dem Zugang zu mehr Daten wird erwartet, dass die Genauigkeit der Textwiederherstellung aus den Herculaneum-Rollen zunimmt.

Darüber hinaus eröffnet das Potenzial für die Kombination verschiedener Bildgebungsmodalitäten und Methoden des maschinellen Lernens neue Wege für Entdeckungen, nicht nur für die Rollen, sondern auch für andere antike Artefakte.

Fazit

EduceLab-Scrolls stellt einen bedeutenden Fortschritt im Bestreben dar, die verlorenen Texte von Herculaneum wiederzufinden. Durch die Kombination innovativer Bildgebungstechniken mit maschinellem Lernen haben die Forscher einen gewaltigen Schritt nach vorn gemacht, um diese alten Rollen zu lesen, ohne weiteren Schaden anzurichten.

Das Projekt ist ein Beweis dafür, was durch Zusammenarbeit und technologische Fortschritte möglich ist, und es markiert ein neues Kapitel in der Studie antiker Literatur. Während die Methoden weiter verfeinert und mehr Daten gesammelt werden, werden die Geheimnisse der Herculaneum-Papyri allmählich enthüllt und neue Einsichten in die Gedanken und Ideen der antiken Welt bringen.

Originalquelle

Titel: EduceLab-Scrolls: Verifiable Recovery of Text from Herculaneum Papyri using X-ray CT

Zusammenfassung: We present a complete software pipeline for revealing the hidden texts of the Herculaneum papyri using X-ray CT images. This enhanced virtual unwrapping pipeline combines machine learning with a novel geometric framework linking 3D and 2D images. We also present EduceLab-Scrolls, a comprehensive open dataset representing two decades of research effort on this problem. EduceLab-Scrolls contains a set of volumetric X-ray CT images of both small fragments and intact, rolled scrolls. The dataset also contains 2D image labels that are used in the supervised training of an ink detection model. Labeling is enabled by aligning spectral photography of scroll fragments with X-ray CT images of the same fragments, thus creating a machine-learnable mapping between image spaces and modalities. This alignment permits supervised learning for the detection of "invisible" carbon ink in X-ray CT, a task that is "impossible" even for human expert labelers. To our knowledge, this is the first aligned dataset of its kind and is the largest dataset ever released in the heritage domain. Our method is capable of revealing accurate lines of text on scroll fragments with known ground truth. Revealed text is verified using visual confirmation, quantitative image metrics, and scholarly review. EduceLab-Scrolls has also enabled the discovery, for the first time, of hidden texts from the Herculaneum papyri, which we present here. We anticipate that the EduceLab-Scrolls dataset will generate more textual discovery as research continues.

Autoren: Stephen Parsons, C. Seth Parker, Christy Chapman, Mami Hayashida, W. Brent Seales

Letzte Aktualisierung: 2024-05-20 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2304.02084

Quell-PDF: https://arxiv.org/pdf/2304.02084

Lizenz: https://creativecommons.org/licenses/by-nc-sa/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel