Yike Guo

Audio- und Sprachverarbeitung FlashSpeech: Ein Sprung in die Sprachsynthese

FlashSpeech bietet schnelle, hochwertige Sprachsyntheselösungen an.

2025-08-10T03:33:30+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Hochwertige 3D-Bilderzeugung aus Einzelansichten

Eine neue Methode zur Erstellung detaillierter 3D-Bilder aus Einzelbildern mithilfe von Multiview-Diffusion.

2025-08-10T01:29:48+00:00 ― 5 min Lesedauer

Rechnen und Sprache Innovative Wachstums-Techniken für das Training von LLMs

Neue Methoden zum effizienteren Trainieren grosser Sprachmodelle tauchen auf.

2025-08-07T12:08:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Gesten-Generierung mit CoCoGesture

CoCoGesture erstellt lebensechte Gesten, die zu gesprochenen Wörtern passen und die Interaktion verbessern.

2025-08-06T05:04:00+00:00 ― 5 min Lesedauer

Künstliche Intelligenz Die Zukunft der multimodalen Generierung mit LLMs

Entdecke, wie grosse Sprachmodelle Kreativität durch Multimedia-Generierung steigern.

2025-08-04T21:12:12+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Innovative Musikgenerierung für Videos

Eine neue Methode, um Musik zu erstellen, die gut zu Videoinhalten passt.

2025-08-01T13:48:30+00:00 ― 8 min Lesedauer

Maschinelles Lernen Fortschritte bei symbolischer Regression mit parallelisiertem Baum-Suchen

Eine neue Methode verbessert die Suche nach mathematischen Ausdrücken aus Daten.

2025-07-18T12:44:30+00:00 ― 6 min Lesedauer

Computer und Gesellschaft Ein neuer Ansatz für Datenmanagement

Ehrliches Computing legt Wert auf Vertrauen und Ethik im Umgang mit Daten.

2025-07-10T08:41:24+00:00 ― 10 min Lesedauer

Computer Vision und Mustererkennung MMTrail: Ein umfassendes Video-Dataset für Sprachmodelle

MMTrail kombiniert visuelle und auditive Beschreibungen für bessere Video-Sprachmodelle.

2025-07-08T06:53:20+00:00 ― 5 min Lesedauer

Ton Bewertung grosser Sprachmodelle in der Musikkreation

Diese Studie untersucht, wie gut LLMs Musik verstehen und erzeugen können.

2025-07-07T10:38:45+00:00 ― 5 min Lesedauer

Maschinelles Lernen Effizienz in Sprachmodellen verbessern

Eine neue Methode verbessert Sprachmodelle für bessere Leistung und geringeren Ressourcenverbrauch.

2025-07-02T19:46:48+00:00 ― 5 min Lesedauer

Maschinelles Lernen NoRA: Ein neuer Ansatz zum Fein-Tuning grosser Modelle

NoRA bietet eine smarte Möglichkeit, grosse Modelle mit weniger Ressourcen anzupassen.

2025-06-26T11:10:42+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audiotechnologie: Einführung von X-Codec

X-Codec verbessert die Audioerzeugung, indem es semantisches Verständnis in die Verarbeitung integriert.

2025-06-21T15:41:45+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte bei der Vorhersage von Waldbränden mit Surrogatmodellen

Neue Modelle verbessern die Geschwindigkeit und Genauigkeit von Vorhersagen zu Waldbränden.

2025-06-19T20:31:12+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fortschrittliche 3D-Modellierung aus Einzelbildern

Eine neue Methode ermöglicht verbesserte 3D-Modellierung aus nur einem Bild, was den Realismus steigert.

2025-06-11T04:13:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Feuerprognose bekommt einen Schub mit FIDN

Neues Prädiktionswerkzeug verbessert das Management und die Reaktionsstrategien bei Waldbränden.

2025-04-23T19:22:00+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Revolutionäre Gesangs-Videogenerierung

Forscher entwickeln neues Modell für lebhafte Singvideos und verbessern Animationen.

2025-04-16T10:39:00+00:00 ― 7 min Lesedauer