James Glass

Whisper-AT kombiniert Spracherkennung und Audio-Tagging für bessere Leistung.

2025-10-12T08:10:05+00:00 ― 6 min Lesedauer

Ein neues Modell verbessert das Verständnis von Sprache und Geräuschen gleichzeitig.

2025-09-04T18:08:15+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert die Testrobustheit von Sprachmodellen, indem sie Neuheit priorisiert.

2025-09-02T23:33:48+00:00 ― 8 min Lesedauer

ThReaD verbessert die Leistung von LLMs bei komplexen Aufgaben durch dynamisches Thread-Management.

2025-08-06T10:20:00+00:00 ― 6 min Lesedauer

Self-MoE erstellt spezialisierte Experten für eine bessere Leistung von Sprachmodellen.

2025-07-27T22:17:12+00:00 ― 6 min Lesedauer

Ein Blick auf die Ergebnisse der Codec-SUPERB-Challenge und die Leistungskennzahlen der Codecs.

2025-06-05T06:58:50+00:00 ― 5 min Lesedauer

Maschinen lernen, Objekte in Bildern mit innovativen Techniken zu erkennen.

2025-05-16T08:04:00+00:00 ― 5 min Lesedauer