Yu Qiao

Künstliche Intelligenz Rahmenwerk für das Training von adaptiven KI-Agenten

Eine neue Methode kombiniert Sprachmodelle mit Reinforcement Learning für das AI-Training.

2025-09-19T19:46:48+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Vlogger: Ein neues Tool zur Videoerstellung

Vlogger macht Video-Blogging einfacher und schneller für Creator.

2025-09-16T11:12:00+00:00 ― 6 min Lesedauer

Bild- und Videoverarbeitung A-Eval: Benchmarking der Segmentierungsmodelle für Bauchorgane

A-Eval bewertet Modelle zur Segmentierung von Bauchorganen über verschiedene Datensätze hinweg.

2025-09-15T17:17:50+00:00 ― 13 min Lesedauer

Rechnen und Sprache KI mit strukturierten Denkansätzen voranbringen

Eine neue Methode, um die Denk- und Erklärfähigkeiten von KI zu verbessern.

2025-09-14T14:33:54+00:00 ― 8 min Lesedauer

Robotik Fortschrittliche Robotercode-Generierung mit RobotScript

RobotScript verbessert, wie Roboter Aufgaben aus natürlicher Sprache ausführen.

2025-09-05T03:58:00+00:00 ― 7 min Lesedauer

Robotik Fortschritte in der Synthese von Roboterverhalten

Ein neues Framework verbessert die Aktionen von Robotern durch menschliche Befehle.

2025-09-04T09:55:42+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Objekterkennungsbeziehung

Das All-Seeing Project V2 verbessert das Verständnis von KI für die Beziehungen zwischen Objekten in Bildern.

2025-09-02T23:57:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache WanJuan-CC: Ein neues Dataset für Sprachmodelle

Ein hochwertiger Datensatz zum Trainieren von Sprachmodellen aus englischen Webinhalten.

2025-09-02T21:19:30+00:00 ― 4 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der KI für autonomes Fahren

KI-Modelle verbessern das Verständnis von Fahrszenen für sichereres Navigieren.

2025-08-31T12:26:42+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung AVIBench: Neues Tool zur Bewertung von LVLMs gegen adversarielle Angriffe

AVIBench testet LVLMs, um sicherzustellen, dass sie gegen feindliche visuelle Anweisungen bestehen.

2025-08-29T08:26:12+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Modellen zum Verständnis von Videos

Ein neues Modell verbessert das Videoverständnis durch innovative Trainingstechniken.

2025-08-26T20:39:36+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Neuer Datensatz erfasst Lernen durch Beobachtung

Forscher erstellen einen Datensatz, um zu untersuchen, wie Menschen lernen, indem sie andere nachahmen.

2025-08-26T05:31:06+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Fortschritte im dichten Video-Capturing mit dem DIBS-Framework

DIBS verbessert die Beschriftung von Videoereignissen, indem es Grenzen mit ungelabelten Daten verfeinert.

2025-08-22T21:35:48+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Lumina-T2X: Ein neues Zeitalter in der Medienproduktion

Transformiere Texte nahtlos in Bilder, Videos und Audio mit Lumina-T2X.

2025-08-12T05:14:30+00:00 ― 7 min Lesedauer

Robotik Selbstfahrende Autos mit menschenähnlicher Entscheidungsfindung voranbringen

Ein neuer Ansatz verbessert selbstfahrende Autos, indem er menschliche Denkweisen nachahmt.

2025-08-07T12:24:12+00:00 ― 8 min Lesedauer

Rechnen und Sprache Schwache-zu-Starke Suche: Ein neuer Weg, grosse Sprachmodelle zu leiten

Dieser Artikel beschreibt einen innovativen Ansatz zur Verbesserung von Sprachmodellen mit Hilfe von kleineren Modellen.

2025-08-05T05:45:42+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Verbesserung von Video-Untertiteln für besseres maschinelles Lernen

Ein neuer Datensatz und ein Modell verbessern die Qualität von Video-Untertiteln für Maschinen.

2025-08-01T13:56:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache Sicherheit in multimodalen Sprachmodellen bewerten

Ein Toolkit zur Bewertung der Sicherheit von fortgeschrittenen Sprachmodellen.

2025-07-30T14:40:18+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei den Trainingsmethoden für Vision-Modelle

Neuer Ansatz verbessert das Lernen aus gemischten Bild-Text-Daten.

2025-07-30T14:16:36+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung OmniCorpus-Datensatz: Eine neue Ressource für multimodales Lernen

Ein umfassender Datensatz, der Bilder und Texte zusammenführt, um maschinelles Lernen zu unterstützen.

2025-07-29T22:44:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Neues Protokoll setzt Standard für die Bewertung von Text-zu-Video

Ein strukturierter Ansatz zur Bewertung von Text-zu-Video-Modellen mit verbesserter Effizienz.

2025-07-29T03:38:54+00:00 ― 11 min Lesedauer

Rechnen und Sprache Fortschritte bei Sprachmodellen durch Selbsttrainingsmethoden

Ein neues Framework hilft Sprachmodellen, symbolische Sprache ohne menschliches Eingreifen zu lernen.

2025-07-27T19:31:18+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Vorstellung von DocGenome: Ein Datensatz für das Verständnis wissenschaftlicher Dokumente

Ein neuer Datensatz verbessert die Fähigkeit von KI, wissenschaftliche Dokumente effektiv zu verarbeiten.

2025-07-27T17:40:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei den Übersetzungskapazitäten von Sprachmodellen

Forscher verbessern die Übersetzungsfähigkeiten für über 100 Sprachen und konzentrieren sich dabei auf Sprachen mit wenig Ressourcen.

2025-07-17T07:07:00+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Eine neue Möglichkeit, Objekte mit Text zu Bildern hinzuzufügen

Diese Methode macht es einfacher, Objekte mit Textaufforderungen zu Bildern hinzuzufügen, und sorgt für natürliche Ergebnisse.

2025-07-08T14:33:24+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der Text-zu-Bild-Technologie

Ein neues Modell revolutioniert die Bildgenerierung aus Textbeschreibungen und verbessert verschiedene Branchen.

2025-07-02T04:22:30+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der 3D-Szenenrekonstruktion mit GigaGS

GigaGS packt die Herausforderungen beim Modellieren grosser 3D-Szenen mit innovativen Techniken an.

2025-06-14T10:18:06+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung von Sprachmodellen mit integriertem Werte-Feedback

Eine Methode zur Verbesserung der Ausrichtung von Sprachmodellen an menschlichen Vorlieben.

2025-06-04T22:46:54+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung des Denkens in multimodalen Modellen

Eine neue Methode verbessert die Denkfähigkeiten in Sprachmodellen durch Präferenzoptimierung.

2025-05-22T16:25:03+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung SyncVIS: Videoinstanzensegmentierung neu gedacht

SyncVIS verbessert das Tracking und die Segmentierung von Objekten in Videos für verschiedene Anwendungen.

2025-04-27T23:24:15+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Optimierung des visuellen Verständnisses in KI-Modellen

Neue Methode steigert die visuelle Aufgabenleistung von multimodalen Sprachmodellen.

2025-01-24T20:33:00+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Lerne Vinci kennen: Dein smarter Lebensassistent

Vinci macht den Alltag einfacher mit freihändigen Hilfen und Echtzeit-Anleitungen.

2025-01-18T22:30:27+00:00 ― 7 min Lesedauer