ティルソ・デ・モリーナの戯曲の著者を再評価する
現代の技術を使って、ティルソ・デ・モリーナに帰属する5つの戯曲の著者を分析した研究。
― 1 分で読む
自動著者帰属(AAA)は、デジタル人文学の技術を使って、特定のテキストを書いたのが誰なのかを探り出す方法だよ。この現代的なアプローチは、データ駆動型の手法を使って、さまざまな作家のスタイルを分析することで著作権を新しい視点で見ることができるんだ。この研究は、スペインの劇作家ティルソ・デ・モリーナによって書かれたと言われている五つの劇に焦点を当てているよ:La ninfa del cielo、El burlador de Sevilla、Tan largo me lo fiáis、La mujer por fuerza、El condenado por desconfiado。
著者の背景
ティルソ・デ・モリーナは、スペインの黄金時代の重要な文学者だったけど、彼の作品の多くは著作権が不明確なんだ。文学作品が出版されるとき、有名な著者に誤って帰属されることがある。この研究は、アンドレス・デ・クララモンテやアントニオ・ミラ・デ・アメスクア、ルイス・ヴェレス・デ・ゲバラなど、その時代の他の劇作家の作品と照らし合わせて、これら五つの劇の著作権を明らかにしようとしているよ。
著作権の問題
文学の歴史を通じて、誰が実際に作品を書いたのかが不明なケースは多いよ。この不確かさはいろんな理由から生じるんだ、例えば法的な問題や無断での主張、異なる作家同士のコラボレーションなど。AAAは、言語処理や文学研究の技術を使って著作権の問題に取り組んでいるんだ。伝統的な著作権研究を置き換えることが目的じゃなくて、数値データを使ってより明確な証拠を提供することなんだ。
著作権帰属のアプローチ
AAAは、テキストの特徴をその著者の他の作品と照らし合わせることでテキストを著者に帰属させるという考えに基づいているよ。この分野の人気から、著作権帰属の評価を改善するためのワークショップやコンペが行われるようになったんだ。
この研究は、現代の計算言語学のツールが著作権研究にどのように貢献できるかを示そうとしているよ。ティルソ・デ・モリーナに帰属される作品を分析することで、著作権に関する既存の文学的見解を支持したり挑戦したりしようとしているんだ。
先行研究と手法
多くの研究者が、言葉の使い方や文の長さ、句読点などのスタイル的特徴を比較することで著作権を帰属させる手法を開発してきたよ。しかし、これらの技術は異なる著者のスタイルを識別するのが難しいため、しばしば弱い結論につながってしまうんだ。
AAAの進化
AAAは数十年間発展してきたけど、適切な研究手法の欠如や不正確な統計などといった批判も受けているよ。批評家たちは、多くの研究がしっかりとした実験デザインを欠いていると主張していて、研究者たちがこれらの手法を厳密に適用する方法を学ぶ必要があるんだって。
これまで、この分野の大半の研究は英文学、特にシェイクスピアの劇に集中してきたよ。スペイン文学に対する関心は少なかったのは、デジタルテキストへのアクセスが限られていたからなんだ。いくつかの研究がスペイン文学における有名な著作権のジレンマを解決しようと試みたけれど、まだ解決されていないものが多いんだ。
現在の研究の手法
この研究は、プロフィールベースとインスタンスベースの二つの主なアプローチを使用しているよ。プロフィールベースのアプローチでは、作家の全ての既知の作品を一つのテキストにまとめて、全体的な文体を見ている。一方、インスタンスベースのアプローチは、個々の作品に焦点を当てて、スタイル的な類似点を探るんだ。
研究では、機能語の頻度―重要な文法情報を提供できる一般的な言葉―を分析の重要な特徴として使っているよ。これらの言葉がどれくらい、どんな文脈で使われているかを調べることで、作家のスタイルのより明確なイメージを構築できるんだ。
使用される技術
この研究では、テキストを分析するためにさまざまな統計的手法が使われているよ。いくつかの手法は、著者間の異なる言葉の分布を比較している。その他の手法は、新しいテキストが著者の既知の作品とどれだけフィットするかを計算している。この多面的なアプローチにより、著作権のより徹底的な検討が可能になるんだ。
劇と著作権の疑問
ティルソ・デ・モリーナの作品は彼の名前の下で出版されているけど、真の著作権については多くの疑問があるんだ。出版された作品の中には、たくさんの著者がいると考えられている劇や、誤って帰属されたものもあるよ。争点となっている劇はLa mujer por fuerzaとEl condenado por desconfiadoで、どちらも批評家たちの間で議論を呼んでいるんだ。
帰属の課題
これらの劇の著作者を特定するのは、出版の仕方によって難しくなっているよ。多くの劇は著者の直接の関与なしに印刷されていて、混乱が生じる可能性がある。例えば、ティルソの名前で発表された劇の中には、彼が自分の作品ではないと主張しているものもあった。こうした不明瞭さが、学者たちが特定の作品を彼に帰属させるのを困難にしているんだ。
分析に使ったコーパス
分析のための理想的な状況は、ティルソの全ての作品と他の関連著者の作品を完全に揃えることだったけど、デジタル化されたテキストへのアクセスが限られているため、これは難しかったんだ。その結果、研究は、利用可能であり、問題の著者のスタイルを代表する作品の小さなセレクションに焦点を当てることになったよ。
テキストの選択
研究に含まれるテキストは、その入手可能性に基づいて選ばれたんだ。選ばれた作品が著者のスタイルを効果的に表すことを確認するのが目標だったよ。スペインの黄金時代の劇は、しばしば似たようなスタイル的特徴を持つため、これは特に重要だったんだ。
実施した実験
主に二つの種類の実験が行われたよ:クラスタリング分析とテキスト間の距離の測定。クラスタリング分析は、スタイル的な類似性に基づいてテキストをグループ化する助けになるし、距離の測定は異なるテキストがどれだけ近い関係にあるかを定量化する手段を提供するんだ。
クラスタリング分析
「Stylo」と呼ばれるソフトウェアツールを使って、研究者たちはテキストを分析し、それらの類似性や違いの視覚的表現を作成したよ。この分析は、期待外れの関係を明らかにし、どの著者の著作権がもっとも可能性があるかを明らかにしたんだ。
距離の測定
クラスタリングに加えて、研究は選ばれた劇を直接比較するためにさまざまな距離の測定を実施したよ。これらの測定は、各テキストの構造や言葉の使い方を分析して、得られた証拠に基づいて最も可能性の高い著者を特定するんだ。
分析結果
結果は、伝統的にティルソに帰属されている多くの劇が彼のスタイルに一致しないことを示したよ。実際、多くの分析は、El burlador de Sevillaの可能性のある著者としてアンドレス・デ・クララモンテを支持していて、他の作品は著作権についてあいまいなままだったんだ。
クラスタリングからの結論
クラスタリングの結果は、El burlador de SevillaとTan largo me lo fiáisが一緒に配置されて、彼らの密接な関係を確認したよ。分析は、クララモンテがこれらの劇と似たスタイルを持っていることを示した一方で、ティルソの作品はしばしばそのスタイルから逸脱していることを示しているんだ。
距離測定の発見
距離の測定は、クラスタリングの結果にさらなる文脈を提供したよ。ほとんどすべてのケースで、ティルソが問題の劇の最も可能性の高い著者とは見なされなかったことが確認されて、彼の著作権に対する批判を強化したんだ。
発見の議論
この結果は、ティルソ・デ・モリーナに以前帰属されていた多くの作品を再評価すべきだを示唆しているよ。La mujer por fuerzaとEl condenado por desconfiadoは議論の余地が残っているけれど、証拠の重みはティルソを著者から遠ざけているんだ。
文学への影響
この研究は、文学批評家たちが十分な証拠なしに有名な著者への帰属を好むことが多かったことを示唆しているよ。作品が有名な名前の下で出版され、売上を増やすための17世紀の慣習は、著作権の問題を複雑にしているんだ。
今後の方向性
これらの劇の著作権をさらに調査するためには、より広範囲なテキストと著者を含む包括的な研究が必要なんだ。技術の進歩により、著作スタイルの分析においてより洗練された手法が期待できるよ。
デジタル化の必要性
この研究の重要な提言の一つは、黄金時代の劇のより良い版とデジタル化の緊急の必要性だよ。これにより、より広範な分析が可能になり、これらの発見を他のテキストや著者に拡大することができるんだ。
結論
この研究は、現代の技術を著作権帰属に関する議論に適用することの有望な結果を示しているよ。特にティルソ・デ・モリーナの作品に関して、分析は歴史的文学の著作権を再評価する必要性を指摘していて、アンドレス・デ・クララモンテのようなあまり知られていない劇作家の貢献を認めることが重要なんだ。学問がこの分野で進化するにつれて、計算的方法の統合が文学の著作権の複雑な世界に貴重な洞察を提供できるんだ。
タイトル: Automatic Authorship Attribution in the Work of Tirso de Molina
概要: Automatic Authorship Attribution (AAA) is the result of applying tools and techniques from Digital Humanities to authorship attribution studies. Through a quantitative and statistical approach this discipline can draw further conclusions about renowned authorship issues which traditional critics have been dealing with for centuries, opening a new door to style comparison. The aim of this paper is to prove the potential of these tools and techniques by testing the authorship of five comedies traditionally attributed to Spanish playwright Tirso de Molina (1579-1648): La ninfa del cielo, El burlador de Sevilla, Tan largo me lo fiais, La mujer por fuerza and El condenado por desconfiado. To accomplish this purpose some experiments concerning clustering analysis by Stylo package from R and four distance measures are carried out on a corpus built with plays by Tirso, Andres de Claramonte (c. 1560-1626), Antonio Mira de Amescua (1577-1644) and Luis Velez de Guevara (1579-1644). The results obtained point to the denial of all the attributions to Tirso except for the case of La mujer por fuerza.
著者: Miguel Cavadas, Pablo Gamallo
最終更新: 2023-04-01 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2304.00363
ソースPDF: https://arxiv.org/pdf/2304.00363
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://github.com/gamallo/Autoria
- https://www.cervantesvirtual.com/
- https://www.wordpress.comedias.org/
- https://www.revel.inf.br/files/539b2f0878d56cb6604363c111dfe116.pdf
- https://academic.oup.com/dsh/article/17/3/267/929277
- https://estilometriatso.com/
- https://journal.r-project.org/archive/2016/RJ-2016-007/index.html
- https://link.springer.com/content/pdf/10.1007
- https://linguamatica.com/index.php/linguamatica/article/view/263
- https://link.springer.com/chapter/10.1007
- https://www.fupress.net/index.php/bsfm-jems/article/view/18094/16848
- https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.440.1634&rep=rep1&type=pdf