Batik-joue-Mozart : Un dataset complet de piano
Un ensemble de données détaillé combinant les sonates de Mozart avec des performances au piano et des annotations d'experts.
― 7 min lire
Table des matières
Le dataset Batik-joue-Mozart est une collection de Performances au piano qui présentent les sonates de Mozart. Ce dataset fusionne des enregistrements de performances professionnelles avec des partitions musicales détaillées qui montrent exactement quelles notes sont jouées et comment elles se relient à la structure de la musique. Les performances viennent de Roland Batik, un pianiste viennois reconnu, qui a joué sur un piano à queue spécialement monitoré. Ces enregistrements sont disponibles au format MIDI et en fichiers audio. Chaque note de la performance est précisément associée à une version de la partition, permettant aux utilisateurs de voir comment la musique et la performance interagissent à un niveau très détaillé.
Ce dataset est unique parce qu'il ne fournit pas seulement un enregistrement de la musique, mais inclut aussi une analyse experte de la structure musicale, comme l'Harmonie et les phrases, d'une édition bien connue des partitions de Mozart. Ça veut dire que n'importe qui s'intéressant à l'étude de la performance musicale peut regarder les mêmes notes, le même tempo et les mêmes idées musicales que le performer.
Dans le dataset, il y a des enregistrements de douze sonates pour piano complètes de Mozart, qui incluent un total de 36 mouvements. En tout, ces performances capturent environ 102 400 notes individuelles jouées sur 223 minutes de musique. Sur toutes ces notes, près de 95 % sont parfaitement alignées avec les notes de la partition, ce qui signifie que la performance suit de près ce que Mozart a écrit. La petite portion qui ne correspond pas inclut quelques notes supplémentaires jouées par Batik, souvent pour la décoration ou l'expression.
Performance et Analyse
La performance musicale n'est pas juste une question de jouer les bonnes notes. Ça inclut le timing, la dynamique et comment un performer façonne la musique pour transmettre des émotions. Les Chercheurs en récupération d'informations musicales visent à comprendre et analyser ces éléments expressifs dans la performance musicale. En étudiant comment les musiciens utilisent le timing et la dynamique, ils espèrent créer des modèles capables de reconnaître ou de recréer ces expressions dans la musique.
Les études précédentes en musique classique pour piano se basaient surtout sur de grands ensembles de performances converties en données MIDI en analysant des enregistrements audio. Cependant, les enregistrements précis et de haute qualité qui montrent chaque note jouée, ainsi que la même partition musicale d'où elle provient, sont beaucoup plus rares. En général, les performances dans les datasets disponibles proviennent soit d'étudiants avancés, soit de compétitions, mais celles-ci ne fournissent pas le même niveau de détail que les performances de Batik.
En général, les datasets existants donnent une idée générale de la façon dont les performances s'alignent avec les partitions, mais ils ne proposent pas de correspondance note par note très précise. Dans de nombreux cas, ils montrent seulement des alignements au niveau des mesures, ce qui peut ignorer des détails plus fins comme la structure de la musique. Ce dataset vise à surmonter ces limites, en fournissant un ensemble de performances précises directement liées à des annotations d'experts.
Le Processus de Collecte de Données
Le dataset Batik-joue-Mozart a été créé grâce à un processus systématique. Les performances ont été enregistrées sur un piano à queue Bösendorfer, qui capture chaque frappe de touche et mouvement de pédale avec une grande précision. Le timing et l'intensité de chaque note sont enregistrés, puis ces enregistrements sont associés à une version numérique des partitions de Mozart.
Pour relier les données de performance avec les annotations musicales, les chercheurs ont passé en revue les enregistrements et les partitions, les alignant note par note. Cette tâche nécessite à la fois des outils technologiques et un contrôle manuel minutieux pour s'assurer que chaque détail est correct. Le produit final présente une carte claire de la manière dont la musique jouée se rapporte à la partition écrite et aux éléments musicaux structurels.
Vue d'Ensemble du Dataset
Le dataset inclut des performances de douze sonates pour piano distinctes de Mozart. Chaque mouvement et chaque note capturent des détails de performance étendus. Pour chaque note jouée, le dataset fournit des infos sur quand elle a été jouée, combien de temps elle a duré et avec quelle force elle a été jouée. Les partitions sont présentées dans un format qui les relie directement aux données de performance, permettant une analyse facile.
Par exemple, chaque note de la partition est identifiée par un ID unique, et ses infos de timing et de hauteur sont capturées dans le dataset. Les notes de performance sont tout aussi détaillées, permettant aux chercheurs d'analyser comment chaque note s'inscrit dans la performance globale.
L'Importance des Alignements Précis
Un des principaux avantages de ce dataset est la précision des alignements de performance. Les chercheurs peuvent maintenant explorer de nombreux aspects du jeu expressif car ils peuvent voir exactement comment la performance s'aligne avec la partition. Cette précision ouvre des portes à la compréhension de la façon dont différents éléments musicaux, comme l'harmonie et la phrasing, affectent la manière dont un morceau est joué.
Deux expériences préliminaires ont été menées en utilisant le dataset pour montrer son potentiel. La première a examiné la relation entre le tempo de la musique et sa structure harmonique, tandis que la seconde s'est concentrée sur la manière dont les performers modifient leur timing autour de parties cruciales de la musique, comme les cadences.
Dans la première étude, le but était de découvrir si la vitesse à laquelle un morceau est joué est liée à la fréquence des changements d'harmonie. Les chercheurs ont trouvé qu'il y avait effectivement un lien entre les deux. Quand l'harmonie change fréquemment, le tempo de la performance a tendance à augmenter.
La deuxième étude s'est concentrée sur la manière dont les performers ajustent le tempo avant différents types de cadences-des points spécifiques dans la musique qui signalent des transitions ou des résolutions. Les résultats ont suggéré que les pianistes ralentissent souvent avant des cadences importantes, surtout si elles signalent la fin d'une idée musicale.
Directions Futures
Pour l'avenir, les chercheurs prévoient d'élargir le dataset en incluant plus de performances des œuvres de Mozart. Ils vont se concentrer sur les six sonates restantes, les enregistrant et les alignant avec les partitions de la même manière détaillée que précédemment. Cela aidera les chercheurs à mieux comprendre à la fois les différences entre les enregistrements audio et les versions MIDI et comment ils peuvent améliorer la qualité des transcriptions.
En conclusion, le dataset Batik-joue-Mozart offre une ressource précieuse pour quiconque s'intéresse à l'étude de la performance au piano. En liant des performances professionnelles à des partitions musicales structurées et à des annotations détaillées, il permet aux chercheurs de poser de nouvelles questions sur la manière dont la musique est jouée. Ce dataset enrichit non seulement notre compréhension des pratiques de performance, mais ouvre aussi la voie à de futures études sur l'expression musicale et l'analyse.
Titre: The Batik-plays-Mozart Corpus: Linking Performance to Score to Musicological Annotations
Résumé: We present the Batik-plays-Mozart Corpus, a piano performance dataset combining professional Mozart piano sonata performances with expert-labelled scores at a note-precise level. The performances originate from a recording by Viennese pianist Roland Batik on a computer-monitored B\"osendorfer grand piano, and are available both as MIDI files and audio recordings. They have been precisely aligned, note by note, with a current standard edition of the corresponding scores (the New Mozart Edition) in such a way that they can further be connected to the musicological annotations (harmony, cadences, phrases) on these scores that were recently published by Hentschel et al. (2021). The result is a high-quality, high-precision corpus mapping scores and musical structure annotations to precise note-level professional performance information. As the first of its kind, it can serve as a valuable resource for studying various facets of expressive performance and their relationship with structural aspects. In the paper, we outline the curation process of the alignment and conduct two exploratory experiments to demonstrate its usefulness in analyzing expressive performance.
Auteurs: Patricia Hu, Gerhard Widmer
Dernière mise à jour: 2023-09-06 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2309.02399
Source PDF: https://arxiv.org/pdf/2309.02399
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://github.com/huispaty/batik
- https://musescore.com/sheetmusic
- https://www.musicxml.com/
- https://www.gramola.at/products/9003643987012
- https://dme.mozarteum.at/DME/nma/start.php?l=2
- https://www.henle.de/en/music-column/mozart-piano-sonatas/
- https://github.com/DCMLab/mozart
- https://dcmlab.github.io/mozart_piano_sonatas/10.html