Ein neuer Datensatz hilft Robotern, komplexe Fragen zu den Bedingungen im Haushalt zu beantworten.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neuer Datensatz hilft Robotern, komplexe Fragen zu den Bedingungen im Haushalt zu beantworten.
― 7 min Lesedauer
Eine Methode verbessert die Videoerstellung, indem sie mehrere Konzepte anpasst, um mehr Klarheit zu schaffen.
― 8 min Lesedauer
Eine neue Methode verbessert die Bildgenerierung aus mehreren Textaufforderungen.
― 7 min Lesedauer
Dieser Artikel behandelt Halluzinationen in LVLMs und schlägt Methoden vor, um sie anzugehen.
― 8 min Lesedauer
Eine neue Methode verbessert den Verkehrsfluss und die Kraftstoffeffizienz an komplexen Kreuzungen.
― 6 min Lesedauer
ABEX nutzt Abstract-and-Expand, um Trainingsdaten für Aufgaben zum Verständnis natürlicher Sprache zu verbessern.
― 8 min Lesedauer
Neues Modell generiert Musik mit Hilfe von Text und visuellen Informationen.
― 7 min Lesedauer
GAMA verbessert die Audioverarbeitung, indem es Klang- und Sprachkenntnisse zusammenführt.
― 6 min Lesedauer
Ein neues Modell kombiniert Audio- und visuelle Daten für ein besseres Verständnis.
― 6 min Lesedauer
Eine Methode zur Erstellung ausdrucksstarker digitaler Charaktere mithilfe von Audio- und Videodaten.
― 8 min Lesedauer
Zwei Roboter, die zusammenarbeiten, verbessern die Objektlokalisierung ohne vorheriges Training.
― 8 min Lesedauer
Forscher verbessern Lidar-Technologie für sicherere Roboternavigation um transparente Objekte.
― 6 min Lesedauer
ReCLAP verbessert die Audioklassifizierung mit detaillierten Aufforderungen für genauere Ergebnisse.
― 6 min Lesedauer
Kombination aus menschlichen Anweisungen und Technologie für sicherere robotische Navigation.
― 5 min Lesedauer
Neue Methode verbessert die Bewegung von vierrädrigen Robotern über anspruchsvolles Terrain.
― 5 min Lesedauer
SOAR verbessert die Genauigkeit der Aktionserkennnung in der Analyse von Drohnenaufnahmen.
― 5 min Lesedauer
Neue Methode verbessert die Fähigkeit von Robotern, sich in verschiedenen Aussenumgebungen zurechtzufinden.
― 6 min Lesedauer
Neue Methoden gehen die Herausforderungen an, Antworten in visuell reichen Dokumenten zu finden.
― 6 min Lesedauer
Neues System verwandelt die Audiosteuerung durch detaillierte Textbeschreibungen.
― 8 min Lesedauer
Das DAVE-Dataset erfasst komplexe Verkehrsszenarien für ein besseres AI-Training.
― 8 min Lesedauer
LVLMs haben Schwierigkeiten, die Realität zu erkennen, was ernsthafte Folgen haben kann.
― 5 min Lesedauer