Sriram Ganapathy

Die Kombination von grundlegenden und spezialisierten Modellen steigert die KI-Fähigkeiten effizient.

2025-09-18T23:14:24+00:00 ― 6 min Lesedauer

Neue Methoden kombinieren Audio und Metadaten für eine bessere Spracherkennung.

2025-09-08T07:09:30+00:00 ― 6 min Lesedauer

Lern, wie Dereverberation die Spracherkennung in lauten Umgebungen verbessert.

2025-09-05T12:45:40+00:00 ― 4 min Lesedauer

E-SHARC verbessert die Sprecheridentifikation in verschiedenen Audio-Umgebungen.

2025-08-28T06:22:45+00:00 ― 6 min Lesedauer

Dieser Artikel stellt ein Dual-Encoder-System für effektives Lernen von Sprachrepräsentationen vor.

2025-07-24T01:50:20+00:00 ― 6 min Lesedauer

Neue Methode verbessert die Handhabung von verschiedenen Akzenten in ASR-Systemen durch spezielle Codebücher.

2025-07-22T04:29:40+00:00 ― 6 min Lesedauer

Ein neuer Massstab hilft dabei, Sprach-Tokenizer für bessere Leistung zu bewerten.

2025-06-20T00:01:10+00:00 ― 6 min Lesedauer

Eine neue Methode kombiniert Bedeutung und Klang für eine verbesserte Emotionserkennung in der Sprache.

2025-06-16T16:40:00+00:00 ― 7 min Lesedauer

Neue Methoden verbessern das Verständnis der Vorhersagen von KI-Modellen.

2025-06-08T13:31:25+00:00 ― 7 min Lesedauer

Untersuchen, wie unsere Gehirne in verschiedenen Situationen mit Geräuschen und Sprache umgehen.

2025-05-10T20:35:30+00:00 ― 6 min Lesedauer