Eine Studie zur Bewertung der Emotionserkennung in Sprachmodellen in sechs Sprachen.

2025-09-25T08:04:05+00:00 ― 5 min Lesedauer

Ton AffectEcho: Emotionen in KI-Sprache verbinden

Das AffectEcho-Modell verbessert den emotionalen Ausdruck in KI-generierter Sprache.

2025-09-25T07:15:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Graphem-zu-Phonem-Konversion mit neuer Sampling-Methode

Diese Studie verbessert G2P-Modelle, indem sie sich auf fehleranfällige Bereiche während des Trainings konzentriert.

2025-09-25T05:38:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei den Formant-Tracking-Techniken

Entdeck Methoden, die die Genauigkeit beim Formant-Tracking für Sprachanalysen verbessern.

2025-09-24T22:21:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Sprachanalyse zur Bewertung der Schwere von Parkinsonkrankheit

Forscher entwickeln sprachbasierte Methoden für eine genauere Bewertung von Parkinson.

2025-09-24T21:32:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Schallerkennung mit Meta-Learning-Techniken

Meta-SELD verbessert die Lokalisierung von Schallereignissen in verschiedenen Umgebungen.

2025-09-24T19:55:20+00:00 ― 6 min Lesedauer

Maschinelles Lernen Audiovisuelle Momente in der Zeit: Ein neuer Datensatz für die Aktionskennung

AVMIT gibt Forschern Einblicke, wie Sound und Vision in der Aktionserkennnung zusammenhängen.

2025-09-24T07:46:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audioqualitätsvorhersage mit GML

Ein neues KI-Modell verbessert die Vorhersage von Audioqualitätsbewertung.

2025-09-24T03:43:40+00:00 ― 6 min Lesedauer

Ton KI-Musikgenerierung: Eine Studie über Sampling-Techniken

Diese Forschung untersucht, wie Sampling-Methoden die Qualität von KI-generierter Musik beeinflussen.

2025-09-24T02:55:05+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Audio-Anti-Spoofing-Technologie

Eine neue Methode verbessert die Erkennung von gefälschtem Audio in Spracherkennungssystemen.

2025-09-23T23:40:45+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte beim Beat-Tracking für klassische Musik

Neue Methoden verbessern die Genauigkeit des Beat-Trackings in komplexer klassischer Musik.

2025-09-23T14:46:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verstehen der Rolle der Sprachdiarisierung

Ein Blick darauf, wie Sprachdiarisierung in mehrsprachigen Gesprächen hilft.

2025-09-22T23:23:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Framework zur Audio-Textur-Generierung

Ein neues Framework vereinfacht die Erstellung von Audiotexturen, indem es den Beschriftungsaufwand reduziert.

2025-09-22T22:34:40+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennung für laute Umgebungen

Ein neues System verbessert die Spracherkennung in lauten Umgebungen mit fortschrittlichen Techniken.

2025-09-22T21:46:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Leistung des VoicePrivacy Challenge Baseline B1

Die Wirksamkeit von Sprach-Anonymisierung bewerten, ohne den natürlichen Klang zu verlieren.

2025-09-22T14:28:50+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Audio-Klassifizierung mit LCANets++

Neue Modelle verbessern die Genauigkeit der Audioklassifizierung und machen sie widerstandsfähiger gegen Lärm und Angriffe.

2025-09-22T12:51:40+00:00 ― 5 min Lesedauer

Ton KI in Musik: Kreationswerkzeuge und Techniken

Eine Übersicht über KI-Tools zur Musikproduktion und ihre einzigartigen Funktionen.

2025-09-22T08:48:45+00:00 ― 12 min Lesedauer

Ton Realistische Geräusche aus stummen Videos erzeugen

Forschung untersucht Deep Learning, um Audio zu erstellen, das zu stillem Videoinhalt passt.

2025-09-22T04:45:50+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Klang und Bilder kombinieren, um die Audioqualität zu verbessern

Eine neue Methode verbessert Tonaufnahmen mit visuellen Hinweisen.

2025-09-22T03:57:15+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Sprachqualität mit XLS-R-Modellen

Ein Blick darauf, wie XLS-R Modelle die Audioqualität in Online-Meetings verbessern.

2025-09-22T01:31:30+00:00 ― 6 min Lesedauer

Ton Audio-Tagging mit dem CED-Framework verbessern

Eine neue Methode verbessert die Audio-Tagging-Leistung und Effizienz.

2025-09-22T00:42:55+00:00 ― 5 min Lesedauer

Ton Neue Studie zur Erkennung von KI-generierter Sprache

Forschung hebt Methoden zur Echtzeit-Erkennung von gefälschten Audios, die von KI erstellt wurden, hervor.

2025-09-21T19:02:50+00:00 ― 6 min Lesedauer

Ton Whombat: Ein neues Tool für bioakustische Forschung

Whombat vereinfacht die Annotation von Tonaufnahmen für die Wildtierforschung.

2025-09-21T18:14:15+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Sprachverbesserungstechniken

Neue Strategien verbessern die Sprachverständlichkeit in lauten Umgebungen für eine bessere Erkennung.

2025-09-21T17:25:40+00:00 ― 6 min Lesedauer

Multimedia Emotionen in Bildern mit Musiksuche verknüpfen

Ein neues System verbindet emotionale Bilder mit Musik für eine bessere Entdeckung.

2025-09-21T16:37:05+00:00 ― 6 min Lesedauer

Ton Die Musikqualität bei alltäglichen Aufnahmen verbessern

Ein neues System verbessert Audioaufnahmen für ein besseres Hörerlebnis.

2025-09-21T15:48:30+00:00 ― 6 min Lesedauer

Ton Bioakustik mit aktiven Lerntechniken verbessern

Ein neuer Ansatz reduziert die Datenbeschriftung und verbessert gleichzeitig die Genauigkeit der Audio-Klassifizierung.

2025-09-21T14:11:20+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Text-to-Speech-Technologie für natürliche Sprache

Ein neues System verbessert die Sprachqualität und Ausdruckskraft bei der Absatzsynthese.

2025-09-21T11:45:35+00:00 ― 5 min Lesedauer

Ton Die Qualität von KI-generierter Musik bewerten

Entdecke Methoden zur Bewertung der Qualität von KI-erstellter Musik durch subjektive und objektive Beurteilung.

2025-09-21T10:08:25+00:00 ― 5 min Lesedauer

Ton Neue Erkenntnisse über die Zungenbewegung beim Sprechen

Die Forschung konzentriert sich auf Zungenbewegungen, um Sprachtherapie und Sprachenlernen zu unterstützen.

2025-09-21T04:28:20+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Genderauswirkungen auf stimmbiometrische Systeme

Diese Studie untersucht, wie Geschlecht die Nützlichkeit, Privatsphäre und Fairness von Sprachbiometrie beeinflusst.

2025-09-20T19:33:55+00:00 ― 7 min Lesedauer

Ton Die Verbesserung der Sprachsynthese mit Pruning-Techniken

Neue Schnittmethoden verbessern die Leistung von Zero-Shot Multi-Speaker Text-to-Speech-Modellen.

2025-09-20T15:31:00+00:00 ― 7 min Lesedauer

Rechnen und Sprache Emotionen in Notfallgesprächen verstehen

Forschung zur Emotionserkennung in Notrufinteraktionen liefert wichtige Erkenntnisse.

2025-09-20T14:42:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im selbstüberwachten Lernen für Spracherkennung

Neue Methoden zur Auswahl von Sprachdaten minimieren das Labeln und verbessern gleichzeitig die Erkennungsgenauigkeit.

2025-09-20T13:53:50+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Spracherkennungs-Emotion mit Zeit-Frequenz-Transformer

Eine neue Methode verbessert die Emotionserkennung in der Sprache, indem sie Zeit und Frequenz analysiert.

2025-09-20T12:16:40+00:00 ― 5 min Lesedauer

Quantenphysik Quanten Technologie trifft Musikproduktion

Entdecke, wie Quantenwerkzeuge die Musikproduktion für Künstler verändern.

2025-09-20T08:57:42+00:00 ― 5 min Lesedauer

Ton Die Verbesserung der Spracherkennung für Stotterer

Eine Methode, um ASR-Systeme für Nutzer mit Stottern zu verbessern.

2025-09-20T06:36:35+00:00 ― 5 min Lesedauer

Ton Zugangsprobleme im Million Song Dataset

Herausforderungen beim Zugriff auf Audiodaten behindern Forschungsgelegenheiten.

2025-09-20T00:07:55+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachisolierungstechnologie

Neue Methoden verbessern die Klarheit in lauten Umgebungen durch fortschrittliche Klangverarbeitung.

2025-09-19T22:30:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der französischen Sprachsynthesetechnologie

Ein neu entwickeltes System erzeugt realistische französische Sprache für einen Wettbewerb.

2025-09-19T21:42:10+00:00 ― 6 min Lesedauer

Computerwissenschaften - Ton