Zhou Zhao

Neues Framework verbessert die Genauigkeit der Objektlokalisierung durch relative Positionierung.

2025-10-15T20:08:36+00:00 ― 6 min Lesedauer

Ein bahnbrechendes System verbindet 3D-Visuals und Sprache für bessere Interaktionen.

2025-10-08T04:20:12+00:00 ― 6 min Lesedauer

Neue Methoden in S2ST verbessern die Übersetzungsqualität und erhalten gleichzeitig die Sprecheridentität.

2025-09-11T16:07:50+00:00 ― 6 min Lesedauer

Eine Methode für intuitivere Steuerung von Gesangsstimmen mit natürlichen Sprachbefehlen.

2025-08-17T01:33:05+00:00 ― 7 min Lesedauer

ROSVOT verbessert die Genauigkeit beim Transkribieren von Gesangsstimmen, selbst in lauten Umgebungen.

2025-08-05T10:11:50+00:00 ― 6 min Lesedauer

Das Frieren-Modell verbessert die Audioqualität und den Sync für Videos.

2025-08-02T10:07:55+00:00 ― 6 min Lesedauer

Neue Methode verbessert die Umwandlung von Sprache in Gesang mithilfe von selbstüberwachtem Lernen.

2025-08-01T09:50:25+00:00 ― 7 min Lesedauer

MelodyLM macht die Musikproduktion einfacher, indem es Text- und Spracheingaben nutzt.

2025-07-23T16:55:55+00:00 ― 7 min Lesedauer

Eine neue Methode verbessert die Emotionserkennung sogar mit unvollständigen Daten.

2025-07-17T21:51:48+00:00 ― 5 min Lesedauer

Ein neues Dataset verbessert die maschinelle Sprachverarbeitung für Mandarin und zielt auf natürliche Ausdrucksweise ab.

2025-07-14T09:26:55+00:00 ― 6 min Lesedauer

Neue KI-Tools machen das Musikbearbeiten einfacher mit innovativen Techniken und besserer Präzision.

2025-07-13T18:52:25+00:00 ― 5 min Lesedauer

OmniBind integriert verschiedene Datentypen für ein besseres Verständnis und eine verbesserte Generierung von Inhalten.

2025-07-12T14:16:42+00:00 ― 5 min Lesedauer

MulliVC verwandelt Stimmen über Sprachen hinweg mit beeindruckender Genauigkeit und Klarheit.

2025-07-03T11:54:30+00:00 ― 6 min Lesedauer

Lern, wie semantische Tokenisierung Empfehlungssysteme verbessert.

2025-06-13T16:39:30+00:00 ― 5 min Lesedauer

Ein neuer Ansatz, um die Effektivität des multimodalen Lernens zu steigern.

2025-06-01T11:57:48+00:00 ― 7 min Lesedauer

Lerne, wie 3D-Modelle die Schätzung der Objektausrichtung für technische Anwendungen verbessern.

2025-01-28T07:12:27+00:00 ― 8 min Lesedauer