Neuste Artikel für Mensch-Computer-Interaktion

Ton Fortschritte in der Sprecherdiarisierung durch Audio-Visuelle Integration

Neue Systeme verbessern die Sprecheridentifikation mit Audio- und visuellen Daten.

2025-10-02T15:46:40+00:00 ― 5 min Lesedauer

Künstliche Intelligenz Belohnungssysteme mit menschlichem Feedback verbessern

Eine neue Methode, um Belohnungssysteme im Reinforcement Learning mithilfe von Nutzerfeedback zu verfeinern.

2025-10-02T12:11:36+00:00 ― 9 min Lesedauer

Rechnen und Sprache Fortschritte bei Dialogsystemen mit neuem Lernrahmen

Eine neue Methode zum Lernen von Dialogrichtlinien verbessert die Gesprächsantworten.

2025-10-02T04:49:12+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Evaluierung von Objektvorschlägen in vision-sprachlichen Aufgaben

Eine neue Methode zur besseren Bewertung von Objektvorschlägen in Vision- und Sprachaufgaben.

2025-10-02T04:25:30+00:00 ― 7 min Lesedauer

Künstliche Intelligenz Einschätzung der emotionalen Wahrnehmung in multimodalen Modellen

Dieser Artikel bewertet einen neuen Massstab zur Beurteilung des emotionalen Verständnisses in KI-Modellen.

2025-10-02T00:12:42+00:00 ― 5 min Lesedauer

Multimedia Fortschritte bei der Einschätzung der Engagements in Gesprächen

Forschung entwickelt ein Modell, um Engagement in Gesprächen genau zu messen.

2025-10-01T21:57:50+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Aktionsdetektion mit AAN

Ein neues Modell verbessert die Videoaktionsdetektion durch Objektattribute und Beziehungen.

2025-10-01T17:53:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritt von Sprachmodellen mit KI-Feedback

Die Rolle von RLAIF beim Verbessern des Trainings von Sprachmodellen erkunden.

2025-10-01T13:32:48+00:00 ― 4 min Lesedauer

Robotik Verbesserung der Mensch-Schwarm-Interaktion durch Erklärbarkeit

Die Forschung konzentriert sich darauf, die Kommunikation zwischen Menschen und Roboterschwärmen zu verbessern.

2025-10-01T04:59:18+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Text-zu-Sprache-Technologie

Neue Methoden verbessern die Qualität der synthetischen Sprache durch selbstüberwachtes Lernen.

2025-09-30T17:37:25+00:00 ― 5 min Lesedauer

Maschinelles Lernen HERON: Ein neuer Ansatz für das Belohnungsdesign im Reinforcement Learning

HERON vereinfacht das Belohnungsdesign und verbessert die Effizienz und Flexibilität von Reinforcement Learning.

2025-09-30T13:50:48+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei Dialogsystemen mit DaTrans

DaTrans hat das Ziel, Dialogsysteme zu verbessern, indem vortrainierte Sprachmodelle integriert werden.

2025-09-30T08:11:06+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Erkennung von Affordanzen für smarte Geräte

Neue Methoden verbessern, wie Maschinen Objektinteraktionen verstehen.

2025-09-30T06:44:12+00:00 ― 6 min Lesedauer

Maschinelles Lernen Verbesserung der OOD-Erkennung in Zeitreihendaten

Ein neues Framework verbessert die Erkennung von Ausreissern in der Zeitreihenanalyse.

2025-09-29T23:00:00+00:00 ― 7 min Lesedauer

Robotik Fortschrittliche Robotergeschicklichkeit durch Erfahrung

Eine neue Methode hilft Robotern, filigrane Aufgaben zu lernen, indem sie menschliche Fähigkeiten nachahmen.

2025-09-29T22:34:24+00:00 ― 7 min Lesedauer

Künstliche Intelligenz Programmsynthese: Entscheidungsfindung bei Agenten klären

Neue Methoden verbessern das Verständnis für das Verhalten von künstlichen Agenten durch Programmsynthese.

2025-09-29T09:16:30+00:00 ― 11 min Lesedauer

Maschinelles Lernen Künstliche Agenten lernen durch sprachliche Anweisungen

Forschung zeigt, dass künstliche Agenten Sprachaufgaben gut verstehen und darauf reagieren können.

2025-09-29T06:22:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung des Denkens in Vision-Language-Modellen

Diese Arbeit bewertet, wie gut VLMs aufgrund visueller Inhalte raisonnieren.

2025-09-29T06:14:48+00:00 ― 6 min Lesedauer

Robotik Roboterlernen durch natürliche Gespräche verbessern

Roboter können besser lernen, indem sie mit Menschen in alltäglicher Sprache interagieren.

2025-09-29T05:59:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache EmoDistill: Fortschritte bei der Spracherkennung von Emotionen

Eine neue Methode verbessert die Emotionserkennung aus Sprache nur mit Audio.

2025-09-28T23:55:36+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sprecheridentität von Sprachdaten trennen

Eine Studie zum Entwirren der Sprecheridentität aus Sprachsignalen für verbesserte Verarbeitung.

2025-09-28T19:28:10+00:00 ― 6 min Lesedauer

Robotik Vertrauen zu Robotern aufbauen: Ein neuer Ansatz

In diesem Artikel wird besprochen, wie Roboter Vertrauen gewinnen können, indem sie sich an die Vorlieben der Menschen anpassen.

2025-09-28T16:49:00+00:00 ― 4 min Lesedauer

Künstliche Intelligenz Fortschritte in der Emotionssimulation mit Sprachmodellen

Forscher verbessern die emotionalen Reaktionen von digitalen Agenten mit Hilfe von Sprachmodellen.

2025-09-28T14:58:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Erkennung von Mensch-Objekt-Interaktionen

Neue Methode verbessert die Erkennung von Aktionen zwischen Menschen und Objekten ohne aufwendiges Labeling.

2025-09-28T14:50:30+00:00 ― 4 min Lesedauer

Robotik Fortschritte in der menschlichen Robotermotion-Retargeting

Neue Methoden verbessern, wie Roboter menschliche Bewegungen nachahmen, was die Interaktion verbessert.

2025-09-28T11:09:18+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung SCD-Net: Fortschritt bei skelettbasiertem Aktionsrecognition

Ein neues Framework verbessert die Aktions-erkennung, indem es räumliche und zeitliche Hinweise trennt.

2025-09-28T08:23:24+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Rekonstruktion von 3D Hand-Objekt-Interaktionen aus Video-Clips

Ein neuer Ansatz, um Hand-Objekt-Interaktionen in 3D mit kurzen Videoclips festzuhalten.

2025-09-28T06:56:30+00:00 ― 7 min Lesedauer

Robotik Sprachemodelle nutzen, um Belohnungsfunktionen für Robotik zu entwerfen

Neuer Ansatz automatisiert das Design von Belohnungsfunktionen für Deep Reinforcement Learning bei Robotern.

2025-09-27T22:07:12+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der Aktionsvorhersage und -erkennung

Das JOADAA-Modell verbessert die Aktionsvorhersage und die Online-Erkennung in Echtzeitszenarien.

2025-09-27T15:55:54+00:00 ― 7 min Lesedauer

Rechnen und Sprache Wie der Hintergrund die Textinterpretation in NLP beeinflusst

Die Rolle des Hintergrunds bei der Interpretation von Sprachaufgaben untersuchen.

2025-09-27T12:46:18+00:00 ― 6 min Lesedauer

Ton Fortschrittliche Gesten-Generierung für digitale Menschen

Eine neue Methode erstellt realistische Gesten aus rohem Sprachaudio.

2025-09-27T08:39:05+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der 3D-Pose-Schätzung mit LInKs

LInKs verbessert die 3D-Pose-Schätzung aus 2D-Daten, selbst bei Occlusions.

2025-09-27T07:54:00+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung TransNet: Vereinfachung der Erkennung menschlicher Aktionen in Videos

TransNet bietet eine effiziente Lösung zur Erkennung menschlicher Aktionen in Videodaten.

2025-09-27T05:08:06+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Mensch-Szenen-Interaktionssystemen

Ein neues Framework verbessert die Interaktion zwischen Menschen und Objekten durch einfache Sprachbefehle.

2025-09-27T01:11:06+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung von Vision- und Sprachmodellen für komplexe Eingaben

Eine neue Methode verbessert die Leistung von Vision- und Sprachmodellen bei der Verarbeitung komplexer Daten.

2025-09-27T01:03:12+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung TEMPO: Fortschritte in der Pose-Schätzungstechnologie

TEMPO verbessert die Körperhaltungsschätzung, indem es Bewegungen in Echtzeit verfolgt und vorhersagt.

2025-09-26T20:10:54+00:00 ― 5 min Lesedauer

Maschinelles Lernen Auf dem Weg zu besserem Verständnis von KI-Entscheidungen

Ein neues Framework soll die Entscheidungsfindung von KI für Menschen klarer machen.

2025-09-26T18:59:48+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Techniken zur Kopfneigungsschätzung

Eine neue Methode verbessert die Genauigkeit bei der Schätzung der Kopfhaltung in verschiedenen Orientierungen.

2025-09-26T17:48:42+00:00 ― 6 min Lesedauer

Maschinelles Lernen O-1: Eine neue Grenze im Training für Sprachrecognition

O-1 verbessert die Spracherkennung, indem es Selbstlernmethoden optimiert.

2025-09-26T09:10:10+00:00 ― 5 min Lesedauer

Maschinelles Lernen Imitationslernen: Ein Weg zu schlauen Maschinen

Maschinen lernen von Experten, um sich an unvorhersehbare Umgebungen anzupassen.

2025-09-26T02:05:28+00:00 ― 7 min Lesedauer