Forscher entwickeln Benchmarks für Vision-Language-Modelle, um über unerwartete Ereignisse in Videos nachzudenken.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Forscher entwickeln Benchmarks für Vision-Language-Modelle, um über unerwartete Ereignisse in Videos nachzudenken.
― 7 min Lesedauer
Forscher bringen KI bei, einfache Befehle für Aktionen in der echten Welt zu verstehen.
― 7 min Lesedauer
Ein genauer Blick auf die aktuellen Mängel bei der Bewertung von Sprachmodellen.
― 7 min Lesedauer
Neue Methode hilft Computern, visuelle Entscheidungen klarer zu erklären.
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Fähigkeit von Sprachmodellen, lange Texte zu verarbeiten.
― 5 min Lesedauer
Erforschen, wie wir die moralischen Handlungen und Verantwortungen von KI bewerten.
― 5 min Lesedauer
Lern, wie menschliches Feedback die Antworten von KI-Sprachmodellen beeinflusst.
― 8 min Lesedauer
Die Verbesserung von Sprachmodellen für bessere Objektlokalisierung und Interaktion in 3D-Räumen.
― 8 min Lesedauer
Verwandle deine Gedanken in visuelle Darstellungen mit einem innovativen KI-System.
― 7 min Lesedauer
Ein neues Modell zur Verbesserung der Navigationsfähigkeiten von Robotern mithilfe von Videos und Sprache wird vorgestellt.
― 7 min Lesedauer
Lern, wie aktives Inferenz AIs Systeme anpassungsfähiger und intelligenter machen kann.
― 8 min Lesedauer
Diese Studie untersucht, ob das Wiederholen von Fragen die Antworten von Sprachmodellen verbessert.
― 5 min Lesedauer
Die Korrektur zur Testzeit hilft selbstfahrenden Autos, auf der Strasse zu lernen und sich anzupassen.
― 6 min Lesedauer
Verwandle gesprochene Gefühle in körperliche Empfindungen, um besser zu kommunizieren.
― 7 min Lesedauer
Entdecke, wie MAPLE Maschinen hilft, deine Vorlieben ohne Stress zu verstehen.
― 7 min Lesedauer
Die Notwendigkeit von KI-Regulierung erkunden und gleichzeitig effektive menschliche Zusammenarbeit sicherstellen.
― 8 min Lesedauer
Lern, wie TECO das Verständnis menschlicher Kommunikation über Worte hinaus verbessert.
― 7 min Lesedauer
Ein tiefgehender Blick darauf, wie Computer menschliche Aktionen mit Objekten erkennen.
― 7 min Lesedauer
Entdecke, wie visuelle Illusionen VQA-Modelle und deren Leistung beeinflussen.
― 6 min Lesedauer
Roboter können durch Gespräche lernen und ihre Fähigkeiten sowie Anpassungsfähigkeit verbessern.
― 6 min Lesedauer
Entdecke, wie GenEx Bilder in immersive virtuelle Welten verwandelt.
― 8 min Lesedauer
Erforschen, wie Maschinen Bilder wahrnehmen im Vergleich zum menschlichen Sehen.
― 7 min Lesedauer
Gaze-LLE macht die Augenverfolgung einfacher und verbessert die Genauigkeit und Effizienz beim Verstehen von menschlicher Aufmerksamkeit.
― 6 min Lesedauer
Erfahre, wie USDRL die Art und Weise verändert, wie wir menschliche Aktionen erkennen.
― 7 min Lesedauer
Lern, wie Computern beigebracht wird, menschliche Aktionen mit Gegenständen zu erkennen.
― 8 min Lesedauer
Revolutionäre MPPO-Methode verbessert KI-Antworten durch menschliches Feedback.
― 6 min Lesedauer
Erfahre, wie Forschende die KI-Ausrichtung an menschlichen Werten durch innovative Methoden verbessern.
― 6 min Lesedauer
Entdecke, wie prompt-gesteuerte Segmentierung die Bildkennungstechnologie verändert.
― 8 min Lesedauer
Eine Übersicht darüber, was grosse Sprachmodelle wirklich sind und was sie können.
― 6 min Lesedauer
Ein Tool, das die Aufgabenzuweisung durch klare Erklärungen und Nutzerinteraktion verbessert.
― 8 min Lesedauer
Lerne, wie RASP das Verständnis von menschlicher Sprache durch Maschinen verbessert.
― 9 min Lesedauer
Ein neuer Test für Maschinen, um Bild- und Textfragen zu beantworten.
― 8 min Lesedauer
Sprachmodelle haben Schwierigkeiten mit der Planung in der realen Welt, auch wenn sie gut Texte generieren können.
― 6 min Lesedauer
KI-Systeme verbessern ihr Verständnis von grafischen Benutzeroberflächen für bessere Benutzererlebnisse.
― 8 min Lesedauer
Die Manipulation des Verhaltens von KI birgt ernsthafte Risiken in fortgeschrittenen Systemen.
― 7 min Lesedauer
Ein neues System ermöglicht es Robotern, gesprochene Befehle zu verstehen und Gegenstände aufzuheben.
― 8 min Lesedauer
Entdeck, wie TTS-Systeme sich weiterentwickeln, um menschlicher zu klingen.
― 8 min Lesedauer
CG-Bench hilft Maschinen, lange Videos besser zu analysieren, indem es hinweisbasierte Fragen stellt.
― 7 min Lesedauer
Verschiedene Arten von Informationen kombinieren, um das Verständnis von künstlicher Intelligenz zu verbessern.
― 6 min Lesedauer
Ein neuer Massstab, um das Denken von LLMs über kulturelle Hintergründe hinweg zu testen.
― 7 min Lesedauer