初期近代の本の見出しを分析する
この研究は、歴史的なテキストの見出しを解析するために計算的方法を使ってるよ。
― 0 分で読む
目次
近世の本の研究は、その時代にテキストがどのように制作され、共有されたかを理解するためにますます重要になってるんだ。これらの本の重要な側面の一つが「ランニングタイトル」で、ページの上部にあるタイトルのことだよ。この記事では、ランニングタイトルを分析する新しい方法について説明していて、初期近代の本の印刷プロセスを学ぶ手助けになるんだ。
ランニングタイトルの重要性
ランニングタイトルは読者のガイドとして機能して、書籍のセクションを示すんだ。メインテキストとは違って、これらのタイトルは同じ本の複数ページにわたって一貫しているんだ。固定された配置「スケルトンフォルム」を使って印刷されるから、印刷が簡単で効率的なんだよ。ランニングタイトルの違いを調べることで、学者たちは使用された印刷技術や印刷プロセス中に起こった可能性のある変更についての洞察を得ることができるんだ。
スケルトンフォルムとは?
スケルトンフォルムは、印刷に使われるタイプを保持するための金属または木製のフレームで構成されてるんだ。フレームには境界線やランニングタイトルが含まれ、メインテキストはページごとにリセットされるんだ。初期の印刷工はこれらのフレームを再利用していたから、タイトルが本の異なるページで異なって印刷されるパターンができたんだ。この再利用は、本がどのように作られたかについての重要な手がかりを提供することがあるんだ。
分析の課題
たくさんのページにわたってランニングタイトルを手動で調べるのはすごく難しいんだ。各タイトルには微妙な違いがあって追跡が難しいし、多くのバリエーションを分析するのは手間がかかる。これらの課題を克服するために、研究者たちはランニングタイトルの分析を自動化するために計算的方法を使い始めたんだ。
新しい計算アプローチ
この記事で説明されている方法は、先進的なコンピュータ技術を使ってランニングタイトルをクラスター化することなんだ。似たようなタイトルをグループ化することで、研究者たちは印刷プロセスのパターンや不規則性を特定できるんだ。この情報は、本がどのように制作されたか、潜在的なミスや検閲についての重要な側面を明らかにしてくれるんだ。
方法の仕組み
このアプローチは二つの主なタスクに基づいてるんだ。一つは、異なるシートのランニングタイトルの間の類似性を計算すること。もう一つは、予想されるパターンからの偏差を追跡するためにこれらのタイトルをクラスター化することなんだ。研究者たちは、視覚的にどれだけ似ているかを測るためにカスタム類似度を開発したんだ。
方法の主要要素
視覚的類似性: 研究者たちは、ランニングタイトルの視覚的特徴を分析することで比較する方法を作ったんだ。これは、文字間のスペースや文字の形を見ることを含むよ。
ニューラルネットワーク: ニューラルネットワークという人工知能の一種を使って、タイトルを分類する手助けをしたんだ。このネットワークは、たくさんの例を調べることでタイトルの違いを識別する方法を学んだんだ。
クラスタリング: 類似性が確立されたら、タイトルは互いにどれだけ似ているかに基づいてグループ化できるんだ。
データ収集と注釈
この方法を試すために、研究者たちはいくつかの初期近代の本から高解像度の画像を集めたんだ。約1600ページを8冊の異なる本から集めたんだよ。タイトルは手動で注釈を付けて、コンピュータアルゴリズムの参考を作ったんだ。専門家がタイトルを調べて、視覚的類似性に基づいてどのタイトルをグループ化すべきかを決定したんだ。
アプローチの評価
彼らのクラスター化技術を開発した後、研究者たちはそれが従来の手動の方法と比べてどれだけ効果的だったかを評価したんだ。自動クラスタリングの結果を手動で注釈を付けたタイトルと比較して、アルゴリズムがどれだけ正確にグループ化したかを確認したんだ。
結果と発見
結果は、自動化された方法が確立されたクラスターに対応するランニングタイトルのパターンを特定できることを示したんだ。場合によっては、アルゴリズムが手動の識別を上回ることもあって、計算的方法を使うことの潜在的な利点を示しているんだ。
印刷慣行の理解
ランニングタイトルを分析することで、研究者たちは印刷プロセスについてのさまざまな詳細を推測できたんだ。例えば、異なる印刷プレスがいつ使用されたか、印刷中にテキストがどのように変更されたかを特定できたんだ。この情報は、これらの本の歴史的文脈を明らかにしてくれるんだ。
ケーススタディ: トマス・ホッブズの『リヴァイアサン』
この研究で分析された本の中に、トマス・ホッブズの『リヴァイアサン』があったんだ。この本のランニングタイトルを調べることで、印刷に使用された方法についてもっと知ることができたんだ。タイトルの変動を検出して、印刷プロセス中に変更があったことを示唆していて、同時に複数の印刷プレスが稼働していた可能性があるんだ。
文献学への影響
このアプローチは、歴史的なテキストを分析する新しい方法を提供することで、文献学の分野にとって大きな可能性を秘めてるんだ。ランニングタイトルの変動を追跡するために自動化された方法を使うことで、研究者たちは手動での検査だけでは見つけにくい洞察を明らかにできるんだ。この発見は、初期近代期の検閲や情報の普及についての理解を深めることにもつながるよ。
結論
初期近代の本におけるランニングタイトルの研究は、貴重な研究分野なんだ。これらのタイトルを分析するための新しい計算技術の開発は、この分野における大きな進展を示しているんだ。ランニングタイトルのクラスター化を自動化することで、研究者たちは過去に本がどのように制作され、共有されていたかについてのより包括的な理解を得ることができるんだ。この研究は、歴史的な印刷慣行についての理解を深めるだけでなく、文献学分析の未来の研究のためのツールを提供してくれるんだ。
タイトル: Clustering Running Titles to Understand the Printing of Early Modern Books
概要: We propose a novel computational approach to automatically analyze the physical process behind printing of early modern letterpress books via clustering the running titles found at the top of their pages. Specifically, we design and compare custom neural and feature-based kernels for computing pairwise visual similarity of a scanned document's running titles and cluster the titles in order to track any deviations from the expected pattern of a book's printing. Unlike body text which must be reset for every page, the running titles are one of the static type elements in a skeleton forme i.e. the frame used to print each side of a sheet of paper, and were often re-used during a book's printing. To evaluate the effectiveness of our approach, we manually annotate the running title clusters on about 1600 pages across 8 early modern books of varying size and formats. Our method can detect potential deviation from the expected patterns of such skeleton formes, which helps bibliographers understand the phenomena associated with a text's transmission, such as censorship. We also validate our results against a manual bibliographic analysis of a counterfeit early edition of Thomas Hobbes' Leviathan (1651).
著者: Nikolai Vogler, Kartik Goyal, Samuel V. Lemley, D. J. Schuldt, Christopher N. Warren, Max G'Sell, Taylor Berg-Kirkpatrick
最終更新: 2024-05-22 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2405.00752
ソースPDF: https://arxiv.org/pdf/2405.00752
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。