Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage

Réévaluation de l'auteur des pièces de Tirso de Molina

Une étude utilisant des techniques modernes pour analyser l'attribution de cinq pièces de théâtre à Tirso de Molina.

― 9 min lire


L'auteur des pièces deL'auteur des pièces deTirso réexaminépièces qui lui sont attribuées.le rôle de Tirso de Molina dans cinqLa critique moderne remet en question
Table des matières

L'attribution automatique de la paternité (AAA) utilise la technologie des Humanités numériques pour déterminer qui a écrit certains textes. Cette approche moderne offre une nouvelle perspective sur la paternité en analysant les styles de différents auteurs avec des méthodes basées sur les données. Cette étude se concentre sur cinq pièces souvent considérées comme écrites par le dramaturge espagnol Tirso de Molina : La ninfa del cielo, El burlador de Sevilla, Tan largo me lo fiáis, La mujer por fuerza, et El condenado por desconfiado.

Contexte des Auteurs

Tirso de Molina était une figure marquante de la littérature espagnole du Siècle d'Or, mais de nombreuses œuvres lui sont attribuées de manière incertaine. Quand des œuvres littéraires sont publiées, parfois elles sont attribuées par erreur à des auteurs connus. Cette étude cherche à clarifier la paternité de ces cinq pièces en les comparant avec des œuvres d'autres dramaturges de l'époque, comme Andrés de Claramonte, Antonio Mira de Amescua et Luis Vélez de Guevara.

Le Problème de la Paternité

À travers l'histoire littéraire, il y a eu plein de cas où c'était flou qui avait vraiment écrit une œuvre. Cette incertitude vient de diverses raisons, comme des problèmes juridiques, des revendications non autorisées, ou des collaborations entre différents écrivains. L'AAA utilise des techniques de traitement du langage et d'études littéraires pour résoudre ces problèmes de paternité. Elle ne vise pas à remplacer les études traditionnelles sur la paternité, mais à les compléter avec des données numériques pour fournir des preuves plus claires.

Approches de l'Attribution de Paternité

L'AAA est basée sur l'idée qu'un texte peut être attribué à un auteur en comparant les caractéristiques du texte avec celles d'autres œuvres de cet auteur. La popularité de ce domaine a mené à des ateliers et des compétitions pour améliorer notre évaluation de l'attribution de paternité.

Cette étude vise à montrer comment les outils modernes de linguistique computationnelle peuvent enrichir les études sur la paternité. En analysant les œuvres attribuées à Tirso de Molina, l'étude cherche à soutenir ou contredire les opinions littéraires existantes sur la paternité.

Études Précédentes et Méthodes

Beaucoup de chercheurs ont développé des méthodes pour attribuer la paternité en comparant des caractéristiques stylistiques comme l'utilisation des mots, la longueur des phrases, et la ponctuation. Cependant, ces techniques ont souvent abouti à des conclusions peu solides à cause des difficultés à distinguer les styles d'auteurs différents.

Évolution de l'AAA

L'AAA s'est développée pendant des décennies, mais elle fait face à des critiques et à des problèmes, comme le manque de méthodes de recherche adéquates et des statistiques défaillantes. Les critiques affirment que de nombreuses études manquent d'un solide design expérimental et que les chercheurs doivent être formés pour appliquer ces méthodes de manière rigoureuse.

Jusqu'à présent, la plupart des travaux dans ce domaine se sont concentrés sur la littérature anglaise, en particulier les pièces de Shakespeare. Il y a eu moins d'attention portée à la littérature espagnole, en partie à cause d'un accès limité aux textes numériques. Certaines études ont tenté de résoudre des dilemmes de paternité célèbres dans la littérature espagnole, mais beaucoup restent non résolus.

Méthodologie de l'Étude Actuelle

Cette étude utilise deux approches principales : basée sur le profil et basée sur l'instance. L'approche basée sur le profil examine le style d'écriture global d'un auteur en combinant tous ses travaux connus en un seul texte, tandis que l'approche basée sur l'instance se concentre sur des pièces individuelles pour trouver des similitudes stylistiques.

L'étude s'appuie sur la fréquence des mots fonctionnels-des mots communs qui peuvent donner des informations grammaticales importantes-comme une caractéristique clé pour l'analyse. En examinant à quelle fréquence et dans quel contexte ces mots sont utilisés, les chercheurs peuvent dresser un tableau plus clair du style d'un écrivain.

Techniques Utilisées

L'étude utilise diverses mesures statistiques pour analyser les textes. Certaines mesures examinent comment les différentes distributions de mots se comparent entre les auteurs. D'autres calculent à quel point un nouveau texte s'accorderait avec les œuvres connues d'un auteur. Cette approche multifacette permet une examination plus approfondie de la paternité.

Les Pièces et Leurs Questions de Paternité

Les œuvres de Tirso de Molina ont été publiées sous son nom, mais il y a beaucoup de doutes sur leur véritable paternité. Certaines des œuvres publiées incluent des pièces qui sont considérées comme ayant plusieurs auteurs ou d'avoir été mal attribuées. Les pièces en question incluent La mujer por fuerza et El condenado por desconfiado, qui ont tous deux suscité des débats parmi les critiques.

Défis d'Attribution

Déterminer la paternité de ces pièces est compliqué par la manière dont elles ont été publiées. Beaucoup de pièces ont été imprimées sans l'implication directe de l'auteur, entraînant des confusions potentielles. Par exemple, l'un des blocs de pièces publiées sous le nom de Tirso contenait des œuvres qu'il avait revendiquées comme n'étant pas les siennes. Ce manque de clarté a rendu difficile pour les chercheurs d'attribuer de manière définitive certaines œuvres à lui.

Le Corpus Utilisé pour l'Analyse

L'idéal pour l'analyse serait d'avoir un ensemble complet d'œuvres de Tirso ainsi que d'autres auteurs pertinents, mais l'accès limité aux textes numérisés a rendu cela difficile. En conséquence, l'étude s'est concentrée sur une sélection plus petite d'œuvres qui étaient facilement disponibles et qui représentaient les styles des auteurs en question.

Sélection des Textes

Les textes inclus dans l'étude ont été choisis en fonction de leur disponibilité. L'objectif était de s'assurer que les œuvres sélectionnées représentaient efficacement les styles des auteurs. Cela était particulièrement important étant donné que les pièces du Siècle d'Or espagnol partagent souvent des caractéristiques stylistiques similaires.

Expériences Réalisées

Deux types principaux d'expériences ont été menés : l'analyse de clustering et la mesure de distance entre les textes. L'analyse de clustering aide à grouper les textes en fonction de leurs similitudes stylistiques, tandis que les Mesures de distance fournissent un moyen de quantifier à quel point différents textes sont liés.

Analyse de Clustering

En utilisant un outil logiciel appelé Stylo, les chercheurs ont analysé les textes pour créer une représentation visuelle de leurs similitudes et différences. Cette analyse a révélé des relations inattendues entre les textes, éclairant sur la paternité qui pourrait être plus probable.

Mesure de Distance

En plus du clustering, l'étude a mis en œuvre diverses mesures de distance pour comparer directement les pièces sélectionnées. Ces mesures analysent la structure et l'utilisation des mots de chaque texte pour déterminer son auteur le plus probable en fonction des preuves recueillies.

Résultats de l'Analyse

Les résultats ont montré que beaucoup des pièces traditionnellement attribuées à Tirso ne semblaient pas correspondre à son style. En fait, la plupart des analyses favorisaient Andrés de Claramonte comme l'auteur probable de El burlador de Sevilla, tandis que d'autres œuvres demeuraient ambiguës quant à leur paternité.

Conclusions du Clustering

Les résultats de clustering plaçaient systématiquement El burlador de Sevilla et Tan largo me lo fiáis ensemble, confirmant leur relation étroite. L'analyse indiquait que Claramonte partageait un style similaire avec ces pièces, tandis que les œuvres de Tirso divergeaient souvent de ces styles.

Résultats de Mesure de Distance

Les mesures de distance ont apporté un contexte supplémentaire aux résultats du clustering. Dans presque tous les cas, Tirso n'a pas été trouvé comme l'auteur le plus probable des pièces en question, renforçant les critiques contre sa prétendue paternité.

Discussion des Résultats

Les résultats suggèrent que de nombreuses œuvres précédemment attribuées à Tirso de Molina devraient être réévaluées. Alors que La mujer por fuerza et El condenado por desconfiado laissaient place à débats, le poids des preuves indique que Tirso n'est pas l'auteur.

Implications pour la Littérature

Cette étude suggère que les critiques littéraires ont souvent favorisé des attributions à des auteurs célèbres sans preuves suffisantes. Les pratiques du 17ème siècle, où des œuvres étaient publiées sous des noms bien connus pour augmenter les ventes, compliquent les questions de paternité.

Directions Futures

Pour enquêter davantage sur la paternité de ces pièces, des études plus complètes devraient inclure une gamme plus large de textes et d’auteurs. Avec les avancées technologiques, il y a un potentiel pour des techniques plus raffinées dans l'analyse des styles d'écriture.

Besoin de Numérisation

Une des recommandations clés de cette étude est le besoin urgent de meilleures éditions et de numérisation des pièces du Siècle d'Or. Cela permettrait une analyse plus extensive et la reproduction de ces résultats à travers plus de textes et d’auteurs.

Conclusion

Cette étude démontre les résultats prometteurs de l'application de techniques modernes aux débats en cours sur l'attribution de paternité, notamment en ce qui concerne les œuvres de Tirso de Molina. L'analyse indique qu'il est nécessaire de réévaluer la paternité dans la littérature historique, en reconnaissant les contributions de dramaturges moins connus comme Andrés de Claramonte. À mesure que la recherche dans ce domaine évolue, l'intégration des méthodes computationnelles peut fournir des perspectives précieuses sur le monde complexe de la paternité littéraire.

Source originale

Titre: Automatic Authorship Attribution in the Work of Tirso de Molina

Résumé: Automatic Authorship Attribution (AAA) is the result of applying tools and techniques from Digital Humanities to authorship attribution studies. Through a quantitative and statistical approach this discipline can draw further conclusions about renowned authorship issues which traditional critics have been dealing with for centuries, opening a new door to style comparison. The aim of this paper is to prove the potential of these tools and techniques by testing the authorship of five comedies traditionally attributed to Spanish playwright Tirso de Molina (1579-1648): La ninfa del cielo, El burlador de Sevilla, Tan largo me lo fiais, La mujer por fuerza and El condenado por desconfiado. To accomplish this purpose some experiments concerning clustering analysis by Stylo package from R and four distance measures are carried out on a corpus built with plays by Tirso, Andres de Claramonte (c. 1560-1626), Antonio Mira de Amescua (1577-1644) and Luis Velez de Guevara (1579-1644). The results obtained point to the denial of all the attributions to Tirso except for the case of La mujer por fuerza.

Auteurs: Miguel Cavadas, Pablo Gamallo

Dernière mise à jour: 2023-04-01 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2304.00363

Source PDF: https://arxiv.org/pdf/2304.00363

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires