Eine neuartige Methode, um Stimmen über Sprachen hinweg zu konvertieren und dabei einzigartige Merkmale zu bewahren.
Giuseppe Ruggiero, Matteo Testa, Jurgen Van de Walle
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Eine neuartige Methode, um Stimmen über Sprachen hinweg zu konvertieren und dabei einzigartige Merkmale zu bewahren.
Giuseppe Ruggiero, Matteo Testa, Jurgen Van de Walle
― 6 min Lesedauer
Neue Techniken verbessern die Ausdrucksqualität der Sprache bei verschiedenen Sprechern.
Lucas H. Ueda, Leonardo B. de M. M. Marques, Flávio O. Simões
― 6 min Lesedauer
Dieser Artikel untersucht die Rolle von Wahrnehmungsmetriken in der Klassifizierung von Musikgenres.
Tashi Namgyal, Alexander Hepburn, Raul Santos-Rodriguez
― 5 min Lesedauer
Eine neue Methode verbessert die Sprach- und Audioverarbeitung bei verschiedenen Aufgaben.
Xiaoyu Yang, Qiujia Li, Chao Zhang
― 5 min Lesedauer
Ein neues System verbessert die Sprecheridentifikation bei Gesprächen mit mehreren Teilnehmern.
Ruoyu Wang, Shutong Niu, Gaobin Yang
― 5 min Lesedauer
Ein neues Framework verbessert den emotionalen Ausdruck in TTS-Systemen.
Kun Zhou, You Zhang, Shengkui Zhao
― 6 min Lesedauer
Neueste Erkenntnisse zeigen, dass Drucksensoren zum Abhören verwendet werden können.
Yonatan Gizachew Achamyeleh, Mohamad Habib Fakih, Gabriel Garcia
― 4 min Lesedauer
Ein neuer Algorithmus verbessert die Erkennung von Klangereignissen mithilfe von selbstüberwachtem Lernen.
Pengfei Cai, Yan Song, Nan Jiang
― 5 min Lesedauer
Die Forschung konzentriert sich darauf, Methoden zur Erkennung von realistisch gefälschter Sprache zu verbessern.
Davide Salvi, Viola Negroni, Luca Bondi
― 5 min Lesedauer
Eine neue Methode vereinfacht die Erstellung von Audio und Video für bessere Synchronisation.
Masato Ishii, Akio Hayakawa, Takashi Shibuya
― 6 min Lesedauer
Steuer die Audioeffekte mit einfachen Sprachbeschreibungen für einfachere Soundanpassungen.
Annie Chu, Patrick O'Reilly, Julia Barnett
― 6 min Lesedauer
Ein neues Modell und Benchmark zur Bewertung von Multi-Audio-Aufgaben vorstellen.
Yiming Chen, Xianghu Yue, Xiaoxue Gao
― 6 min Lesedauer
Ein neues System modelliert die emotionale Intensität bei animierten Charakteren für mehr Realismus.
Jingyi Xu, Hieu Le, Zhixin Shu
― 7 min Lesedauer
OpenSep automatisiert die Audio-Trennung für klarere Klangerlebnisse ohne manuelle Eingaben.
Tanvir Mahmud, Diana Marculescu
― 6 min Lesedauer
PALM verbessert die Audioerkennung, indem es die Darstellung und Effizienz von Prompts optimiert.
Asif Hanif, Maha Tufail Agro, Mohammad Areeb Qazi
― 5 min Lesedauer
Erforscht, wie Drahtwicklungen und Stärke den Sound von Gitarren-Pickups beeinflussen.
Charles Batchelor, Jack Gooding, William Marriott
― 7 min Lesedauer
Eine neue Methode verbessert die Spracherkennung für lange Aufnahmen.
Hao Yen, Shaoshi Ling, Guoli Ye
― 5 min Lesedauer
Diese Studie untersucht, wie Audio, Video und Text zusammen in der Spracherkennung funktionieren.
Chen Chen, Xiaolou Li, Zehua Liu
― 7 min Lesedauer
Ein neues Modell verbessert die Natürlichkeit in Text-zu-Sprache-Systemen, indem es Tonhöhenmuster analysiert.
Tomilov A. A., Gromova A. Y., Svischev A. N
― 5 min Lesedauer
Ein neues Modell verbessert die Sprachdarstellung für afrikanische Sprachen und fördert die Inklusivität in der Technologie.
Jesujoba O. Alabi, Xuechen Liu, Dietrich Klakow
― 5 min Lesedauer
Ein neues Modell verbessert die Musikproduktion mit Melodien und Textbeschreibungen.
Shaopeng Wei, Manzhen Wei, Haoyu Wang
― 5 min Lesedauer
Neue Methode für Sprachmodelle verringert den Bedarf an umfangreichen Daten.
Ke-Han Lu, Zhehuai Chen, Szu-Wei Fu
― 6 min Lesedauer
Lern, wie Sprachumwandlung funktioniert und welche spannenden Anwendungen es gibt.
Arip Asadulaev, Rostislav Korst, Vitalii Shutov
― 5 min Lesedauer
Entdecke, wie CCI die Qualitätseinschätzungen von Multimedia verbessert.
Alessandro Ragano, Helard Becerra Martinez, Andrew Hines
― 7 min Lesedauer
Forscher kombinieren Audio- und visuelle Hinweise, um Lügen genauer zu erkennen.
Abdelrahman Abdelwahab, Akshaj Vishnubhatla, Ayaan Vaswani
― 6 min Lesedauer
Ein neues sprachbasiertes Netzwerk überbrückt Sprachbarrieren in Notfällen.
Majid Behravan, Elham Mohammadrezaei, Mohamed Azab
― 6 min Lesedauer
Lern, wie virtuelle Assistenten Nutzerbefehle besser verstehen.
Ognjen, Rudovic, Pranay Dighe
― 7 min Lesedauer
MACE verbessert Audio-Beschreibungen, indem es Geräusche mit genauen Textbeschreibungen verknüpft.
Satvik Dixit, Soham Deshmukh, Bhiksha Raj
― 5 min Lesedauer
Maschinelles Lernen einsetzen, um die Reaktion des Publikums auf Song-Cover vorherzusagen.
Aris J. Aristorenas
― 7 min Lesedauer
Ein neuer Ansatz zur Verbesserung der Klassifizierung durch den Verlust der Winkelentfernungverteilung.
Antonio Almudévar, Romain Serizel, Alfonso Ortega
― 7 min Lesedauer
Neue Methoden verbessern Kommunikationsmittel für Menschen mit Sprachschwierigkeiten.
Macarious Hui, Jinda Zhang, Aanchan Mohan
― 7 min Lesedauer
Forscher nutzen Schallwellen, um menschliche Posen ohne Kameras zu schätzen.
Yusuke Oumi, Yuto Shibata, Go Irie
― 8 min Lesedauer
Neue Methoden mit Sprachmodellen verbessern die Geräuscherkennung bei Hintergrundgeräuschen.
Han Yin, Yang Xiao, Jisheng Bai
― 6 min Lesedauer
Fish-Speech verbessert die Sprachtechnologie für ein natürlicheres Kommunikationserlebnis.
Shijia Liao, Yuxuan Wang, Tianyu Li
― 6 min Lesedauer
EmoSphere++ erlaubt Maschinen, Emotionen wie Menschen auszudrücken, was die Interaktionen verbessert.
Deok-Hyeon Cho, Hyung-Seok Oh, Seung-Bin Kim
― 7 min Lesedauer
U-COTANS verbessert die Erkennung von Unterwassergrenzen mithilfe von Deep-Learning-Techniken.
Toros Arikan, Luca M. Chackalackal, Fatima Ahsan
― 7 min Lesedauer
PIAST bietet eine einzigartige Sammlung von Klaviermusik für Forscher.
Hayeon Bang, Eunjin Choi, Megan Finch
― 5 min Lesedauer
Maschinen lernen, Geräusche und Bilder in 3D-Räumen zu verbinden.
Artem Sokolov, Swapnil Bhosale, Xiatian Zhu
― 8 min Lesedauer
Wie neue Methoden die Sprecheridentifizierung in Audioaufnahmen verändern.
Petr Pálka, Federico Landini, Dominik Klement
― 6 min Lesedauer
Ein Blick auf die traditionellen Klänge der Seperewa Harfen-Laute.
Kelvin L Walls, Iran R Roman, Kelsey Van Ert
― 6 min Lesedauer