Whisper-AT kombiniert Spracherkennung und Audio-Tagging für bessere Leistung.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Whisper-AT kombiniert Spracherkennung und Audio-Tagging für bessere Leistung.
― 6 min Lesedauer
Ein neues Modell verbessert das Verständnis von Sprache und Geräuschen gleichzeitig.
― 6 min Lesedauer
Eine neue Methode verbessert die Testrobustheit von Sprachmodellen, indem sie Neuheit priorisiert.
― 8 min Lesedauer
ThReaD verbessert die Leistung von LLMs bei komplexen Aufgaben durch dynamisches Thread-Management.
― 6 min Lesedauer
Self-MoE erstellt spezialisierte Experten für eine bessere Leistung von Sprachmodellen.
― 6 min Lesedauer
Ein Blick auf die Ergebnisse der Codec-SUPERB-Challenge und die Leistungskennzahlen der Codecs.
― 5 min Lesedauer
Maschinen lernen, Objekte in Bildern mit innovativen Techniken zu erkennen.
― 5 min Lesedauer