SpitzenmässigesSpitzenmässigesAudio-Visuelles Lernenredefiniert das Erkennen.Innovative Fusion von Sound und BildernMultimediaFortschritte im audio-visuellen Zero-Shot-LernenTon und Bilder kombinieren für schlauere Erkennungssysteme.2025-07-18T21:08:30+00:00 ― 7 min Lesedauer