SPHINX-V verbessert die Fähigkeit von KI, Bilder durch Benutzerinteraktion zu interpretieren.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
SPHINX-V verbessert die Fähigkeit von KI, Bilder durch Benutzerinteraktion zu interpretieren.
― 6 min Lesedauer
Neue Methode verbessert die Kontrolle über Kamerabewegungen bei der Erstellung von Text-zu-Video.
― 6 min Lesedauer
Eine neue Methode kombiniert 3D-Layouts und Text für eine bessere Erstellung von städtischen Szenen.
― 6 min Lesedauer
Transformiere Texte nahtlos in Bilder, Videos und Audio mit Lumina-T2X.
― 7 min Lesedauer
Ein neues Framework verbessert das Verständnis von KI für 3D-Räume.
― 7 min Lesedauer
Eine neue Technik verbessert die Textgenerierung in der Verarbeitung natürlicher Sprache.
― 6 min Lesedauer
Ein neues Modell optimiert die KI-Bilder- und Videoerstellung mit besserer Geschwindigkeit und Qualität.
― 4 min Lesedauer
UniZero verbessert die Langzeitgedächtnis- und Entscheidungsfähigkeiten von KI.
― 7 min Lesedauer
MM-Instruct verbessert die Fähigkeit grosser multimodaler Modelle, unterschiedlichen Anweisungen zu folgen.
― 5 min Lesedauer
Ein neuer Ansatz verbessert das Denken in Sprachmodellen, indem kontrollierte Fehler erzeugt werden.
― 7 min Lesedauer
Das AMEX-Dataset verbessert das Verständnis von KI für mobile App-Oberflächen.
― 7 min Lesedauer
Ein neues Modell revolutioniert die Bildgenerierung aus Textbeschreibungen und verbessert verschiedene Branchen.
― 5 min Lesedauer
Eine neue Methode erstellt anpassbare 3D-Avatare aus Textbeschreibungen.
― 7 min Lesedauer
LLaVA-MoD erstellt kleinere multimodale Modelle mit Wissen von grösseren Vorbildern.
― 6 min Lesedauer
Untersuchen der Rolle von LMMs bei der Transformation von Suchfähigkeiten mit Text und Bildern.
― 7 min Lesedauer
MedViLaM integriert mehrere medizinische Datentypen für bessere Analyse und Entscheidungsfindung.
― 5 min Lesedauer
Erlebe das Altern in 3D mit der TimeWalker-Technologie!
― 6 min Lesedauer
StreamChat verändert, wie wir in Echtzeit mit Streaming-Videos interagieren.
― 7 min Lesedauer