Rendre l'annotation des chartes plus efficace en diplomatique
Une nouvelle méthode améliore l'efficacité de l'annotation des chartes médiévales grâce à l'automatisation.
― 7 min lire
Table des matières
- L'Importance de la Diplomatique et de la Paléographie
- Le Défi des Grands Archives
- Utilisation Efficace du Temps des Experts
- Analyse de Mise en Page et Création de Dataset
- Présentation de l'Outil d'Annotation FRAT
- Prédiction de la Résolution des Images
- Résultats et Insights
- Conclusion
- Source originale
- Liens de référence
La diplomatique, c'est l'étude des documents médiévaux, surtout des chartes, qui étaient des documents légaux de l'époque. Ce domaine demande souvent une analyse détaillée des aspects visuels et écrits de ces documents. Quand des gens qui ne sont pas des experts essayent de commenter ces documents, leur travail doit être vérifié et corrigé par des pros.
Dans notre travail, on présente une nouvelle méthode pour annoter les chartes de manière plus efficace. On se concentre sur la décomposition des tâches pour segmenter ces documents en zones d'intérêt, un peu comme on détecte des objets dans des images. Cette méthode peut faire gagner du temps aux experts et produire des résultats parfois meilleurs que les techniques traditionnelles.
On explore aussi comment créer une structure claire pour les différents types d'annotations afin de maximiser le temps et l'effort de ceux qui annotent les documents. En utilisant des cartes d'étalonnage dans les images, on ajoute des infos sur la taille réelle des objets en pixels et on entraîne des modèles pour faire des prédictions basées sur ces images.
L'Importance de la Diplomatique et de la Paléographie
L'étude des chartes, ce n'est pas juste le texte ; ça implique aussi plein d'aspects visuels. Ça inclut l'examen des sceaux, la détection de faux, l'identification des documents et leur datation. Analyser ces éléments visuels est super important et demande des outils d'analyse d'image spéciaux. Même si les données obtenues par la diplomatique ont été incluses dans des ensembles de données historiques plus larges, l'analyse spécifique des chartes n'a pas été largement réalisée.
Des études récentes ont montré que reconnaître directement des entités nommées dans les images peut donner de meilleurs résultats que d'utiliser un processus plus complexe en deux étapes. Notre focus sur l'analyse d'un grand nombre de chartes, surtout de l'archive en ligne monasterium.net, met en avant la nécessité d'automatiser cette analyse à cause du volume énorme de documents.
Le Défi des Grands Archives
Monasterium.net est une ressource importante qui contient une vaste collection de chartes européennes, surtout d'Europe centrale. Avec des milliers de documents provenant de divers pays, la nature des données est très variée, et beaucoup de détails sur la collecte des documents sont indisponibles. Cela signifie qu'il est essentiel de faire une analyse d'image automatisée pour mieux comprendre ces collections.
Traditionnellement, beaucoup de travail en diplomatique exige une attention individuelle significative pour chaque document. Cependant, les chartes de la fin du Moyen Âge se comptent par centaines de milliers. Ça rend impraticable pour un chercheur d'analyser chacune d'elles en profondeur. Donc, il est clair qu'il y a un besoin d'assistance par une analyse automatique.
Le concept de "lecture à distance" est utilisé pour décrire une analyse automatique des textes sans avoir besoin d'inspecter chaque document individuellement, et "vision à distance" étend cela à l'analyse visuelle. Ces méthodes peuvent être difficiles à tester et à valider, ce qui requiert une connaissance plus approfondie des données impliquées et des biais potentiels dans les outils utilisés.
Utilisation Efficace du Temps des Experts
Notre objectif principal est de réduire le temps que les experts doivent consacrer aux tâches d'annotation tout en s'assurant qu'on obtienne toujours des résultats valables. L'idée, c'est de créer un processus qui minimise le temps passé sur chaque image tout en maximisant le travail utile accompli.
Pour atteindre ça, on a introduit un outil appelé FRAT (Fast Rectangle Annotation Tool). Cet outil permet aux utilisateurs de marquer des rectangles autour des zones d'intérêt dans les images de charte. Les utilisateurs peuvent aussi ajouter des descriptions et des commentaires à chaque rectangle. L'outil est conçu pour être facile à utiliser, permettant des annotations rapides avec un minimum d'effort.
Analyse de Mise en Page et Création de Dataset
Pour mieux comprendre les images disponibles sur monasterium.net, on a sélectionné un échantillon aléatoire de 1 000 chartes. On a regardé divers attributs, comme la largeur, la hauteur et si des sceaux étaient présents. En analysant ce dataset, on visait à obtenir des infos sur la qualité et les caractéristiques des documents.
Les chartes ont souvent une mise en page standard. En général, elles ont un bloc de texte dominant avec des infos supplémentaires autour. Notre approche consiste à définir des rectangles autour des zones pertinentes, qui peuvent ensuite être classées en différentes catégories, comme les sceaux ou les zones de texte.
En utilisant une méthode de détection d'objet, on a entraîné un modèle pour reconnaître ces zones basées sur les images annotées. Les résultats ont montré une précision élevée pour la plupart des classes, indiquant que le système fonctionne bien pour identifier les zones d'intérêt dans les chartes.
Présentation de l'Outil d'Annotation FRAT
FRAT est un outil léger créé pour annoter rapidement et efficacement les images de documents. Les utilisateurs peuvent marquer des objets dans les images en sélectionnant deux points pour définir des rectangles. Cet outil permet aussi d'ajouter des transcriptions et des commentaires pour mieux contextualiser.
FRAT est conçu pour être convivial, facilitant la navigation et l'utilisation. Il s'adapte à différentes tâches d'annotation et permet d'exporter les données dans des formats populaires utilisés en analyse d'image.
Dans FRAT, il y a deux modes principaux : un pour étiqueter des objets et un autre pour transcrire du texte. Ces modes aident les utilisateurs à passer de l'annotation d'éléments visuels au travail avec le texte présent dans les documents.
Prédiction de la Résolution des Images
Beaucoup des images de chartes incluent des cartes d'étalonnage, ce qui peut aider à estimer la résolution des images. C'est important quand on évalue la qualité des documents et qu'on relie des objets visuels aux tailles réelles.
En analysant les cartes d'étalonnage, on peut inférer la taille des pixels et relier ça à des mesures physiques. Ce processus nous permet d'estimer la résolution même quand les conditions d'acquisition originales ne sont pas connues.
On a développé un réseau appelé ResResNet qui prédit la résolution basée sur des segments d'image. Ce modèle peut analyser des images de différentes tailles et utiliser des segments recadrés pour faire des prédictions efficacement.
Résultats et Insights
Nos résultats montrent que nos méthodes de prédiction sont efficaces. On a analysé les estimations de résolution et les a comparées à la vérité terrain, trouvant une forte corrélation. Même si la méthode de base utilisant des cartes d'étalonnage a bien fonctionné, notre modèle ResResNet était plus fiable dans l'ensemble.
L'analyse a montré que notre approche pourrait gérer efficacement les images qui manquent de cartes d'étalonnage, démontrant le potentiel de nos méthodes dans divers scénarios. Le succès de notre analyse basée sur la texture suggère que les documents historiques contiennent des informations sensibles à l'échelle, indiquant comment divers facteurs peuvent être utilisés pour prédire la résolution.
Conclusion
Cette étude met en avant l'importance des pratiques d'annotation efficaces dans le domaine de la diplomatique. En se concentrant sur l'optimisation de l'utilisation du temps et des ressources des experts, on vise à simplifier l'analyse d'un grand nombre de chartes médiévales.
Les outils et méthodes développés ici sont conçus pour répondre aux défis posés par les grands ensembles de données. Nos résultats montrent que l'analyse d'image automatique peut compléter l'expertise des chercheurs, menant à une plus grande efficacité et effectivité dans l'étude des documents historiques. Les recherches futures exploreront encore le potentiel de ces outils pour améliorer notre compréhension des techniques d'analyse de documents.
Titre: Efficient Annotation of Medieval Charters
Résumé: Diplomatics, the analysis of medieval charters, is a major field of research in which paleography is applied. Annotating data, if performed by laymen, needs validation and correction by experts. In this paper, we propose an effective and efficient annotation approach for charter segmentation, essentially reducing it to object detection. This approach allows for a much more efficient use of the paleographer's time and produces results that can compete and even outperform pixel-level segmentation in some use cases. Further experiments shed light on how to design a class ontology in order to make the best use of annotators' time and effort. Exploiting the presence of calibration cards in the image, we further annotate the data with the physical length in pixels and train regression neural networks to predict it from image patches.
Auteurs: Anguelos Nicolaou, Daniel Luger, Franziska Decker, Nicolas Renet, Vincent Christlein, Georg Vogeler
Dernière mise à jour: 2023-06-24 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2306.14071
Source PDF: https://arxiv.org/pdf/2306.14071
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.springer.com/gp/computer-science/lncs
- https://www.springer.com/lncs
- https://github.com/anguelos/frat
- https://pypi.org/project/frat/
- https://anonymous.4open.science/r/yolov5-2D5D/README.diplomatics.md
- https://github.com/ultralytics/yolov5
- https://github.com/anguelos/yolov5/tree/master/bin
- https://github.com/anguelos/resolution_regressor