Neuste Artikel für Bewertung

Rechnen und Sprache Neue Metrik Dichte verbessert die Bewertung von Dialogsystemen

DEnsity bietet einen frischen Ansatz, um Dialogsysteme basierend auf menschlichen Gesprächsmustern zu bewerten.

2025-11-19T08:03:48+00:00 ― 7 min Lesedauer

Informationsbeschaffung Empfehlungen durch Nutzerfeedback verbessern

In diesem Artikel geht's um die Vorteile von vielfältigem Nutzer-Feedback für bessere Empfehlungen.

2025-11-18T22:03:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache ArgU: Ein neues Tool zum Generieren von Argumenten

ArgU erstellt strukturierte Argumente basierend auf faktischen Informationen für effektive Diskussionen.

2025-11-18T18:06:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von GPT-3 in der medizinischen Zusammenfassung

Diese Studie bewertet, wie gut GPT-3 medizinische Literatur zusammenfassen kann.

2025-11-18T08:06:00+00:00 ― 6 min Lesedauer

Ton Die Messung von Schönheit in der Musik: Ein neuer Ansatz

Eine mathematische Methode zur Bewertung der Schönheit von Musikaufführungen.

2025-11-18T07:37:25+00:00 ― 5 min Lesedauer

Zahnmedizin und orale Medizin Zahnpflege in Brasilien verbessern: Eine Studie

Diese Studie bewertet die parodontalen Behandlungen in brasilianischen Zahnfachzentren.

2025-11-18T03:45:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von maschinen-generierten Begründungen für menschliche Nutzer

Dieser Artikel untersucht, wie effektiv KI-generierte Erklärungen für Nutzer sind.

2025-11-17T22:53:00+00:00 ― 9 min Lesedauer

Ton DCASE 2023: Fortschritte bei der automatischen Foley-Sound-Synthese

Ein Wettbewerb zur Verbesserung der automatisierten Foley-Sounderstellung für Multimedia.

2025-11-17T14:37:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Einführung von C-Eval: Ein neues Bewertungswerkzeug für chinesische Sprachmodelle

C-Eval bewertet das Denk- und Wissensvermögen von LLMs in der chinesischen Sprache.

2025-11-17T02:52:12+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte im Dokumentenverständnis: Ein neuer Datensatz

Ein neuer Datensatz verbessert, wie Maschinen Dokumente lesen und darauf reagieren.

2025-11-16T12:39:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Bewertung des RACE Leseverständnis-Datensatzes

Eine Analyse der Stärken und Schwächen des RACE-Datensatzes für das Leseverständnis.

2025-11-16T12:15:18+00:00 ― 8 min Lesedauer

Rechnen und Sprache Bewertung von Ansprüchen über übermenschliche Leistungen in NLP

Ein kritischer Blick auf Benchmarks von Sprachmodellen und deren Auswirkungen auf die menschliche Leistung.

2025-11-16T11:51:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fehlende Punktzahlen in NLP-Bewertungen ansprechen

Dieser Artikel stellt eine neue Methode vor, um fehlende Punktzahlen bei der Bewertung von NLP-Systemen zu handhaben.

2025-11-15T11:45:54+00:00 ― 7 min Lesedauer

Rechnen und Sprache Empathie in Chatbots vorantreiben

Lern, wie Chatbots trainiert werden, um empathisch zu antworten.

2025-11-15T09:00:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache mLongT5: Fortschrittliche mehrsprachige Textverarbeitung

mLongT5 verwaltet längere Texte effizient in mehreren Sprachen.

2025-11-15T00:10:42+00:00 ― 4 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der Bewertung von Text-zu-Bild-Synthese

Eine neue Methode verbessert, wie wir KI-generierte Bilder aus Textbeschreibungen bewerten.

2025-11-15T00:02:48+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der hierarchischen Skripterstellung

Eine Studie über die Erstellung strukturierter Anweisungen durch hierarchische Aufgabenzerlegung.

2025-11-14T19:26:18+00:00 ― 7 min Lesedauer

Rechnen und Sprache IKDSumm: Ein neuer Ansatz zur Zusammenfassung von Katastrophen-Tweets

IKDSumm fasst Tweets während Katastrophen effektiv mit katastrophenspezifischem Wissen zusammen.

2025-11-14T07:51:06+00:00 ― 5 min Lesedauer

Künstliche Intelligenz Verbesserung von LLMs: Die TELeR-Taxonomie

Eine neue Taxonomie, um die Leistung von LLMs bei komplexen Aufgaben zu verbessern.

2025-11-14T04:49:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache Argumente in einer Fehlinterpretierten Welt bewerten

Eine neue Methode zur Bewertung der Argumentqualität unter Berücksichtigung des Kontexts.

2025-11-14T03:46:12+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von Sprachmodellen: Ein genauerer Blick

Studie bewertet Methoden zur Bewertung von Sprachmodellen im Sprachverständnis.

2025-11-13T03:08:54+00:00 ― 6 min Lesedauer

Rechnen und Sprache Wir stellen Seahorse vor: Ein mehrsprachiger Zusammenfassungs-Datensatz

Seahorse bietet eine grosse Sammlung von mehrsprachigen Zusammenfassungen mit Bewertungen von Menschen.

2025-11-13T01:42:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Kultureller Inhalt in der maschinellen Übersetzung: Neue Erkenntnisse

Forschung über Fortschritte bei der Übersetzung von kulturellen Referenzen mit maschinellen Übersetzungssystemen.

2025-11-12T14:14:42+00:00 ― 9 min Lesedauer

Künstliche Intelligenz Verknüpfung verschiedener Datentypen mit LoReTTa

Ein neues Verfahren, um verschiedene medizinische Datentypen für eine bessere Analyse zu integrieren.

2025-11-12T13:51:00+00:00 ― 9 min Lesedauer

Rechnen und Sprache Bewertung von Sprachmodellen: Die demografische Lücke überbrücken

Die Bewertung der Leistung von Sprachmodellen über verschiedene menschliche Demografien hinweg ist entscheidend für eine effektive Nutzung.

2025-11-12T13:35:12+00:00 ― 6 min Lesedauer

Rechnen und Sprache Herausforderungen von retrieval-augmentierten Sprachmodellen

Eine Studie zeigt Einschränkungen bei retrieval-unterstützten Sprachmodellen für die Textgenerierung.

2025-11-12T08:11:18+00:00 ― 5 min Lesedauer

Rechnen und Sprache Eine neue Herangehensweise an das Nachdenken über lange Dokumente

Ein strukturiertes Framework für effektives Denken über lange Texte einführen.

2025-11-12T05:41:12+00:00 ― 5 min Lesedauer

Rechnen und Sprache Einführung von MMSMR: Ein neuer Datensatz zur Bewertung von Chatbots

Das MMSMR-Dataset hat das Ziel, die Bewertung von Chatbot-Konversationen mit vielfältigen menschlichen Antworten zu verbessern.

2025-11-12T04:38:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Kulturelle Normen: Ein Vergleich zwischen China und Amerika

Diese Studie vergleicht soziale Normen zwischen chinesischen und amerikanischen Kulturen durch Datenanalyse.

2025-11-12T03:50:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Tabellenzusammenfassung für Benutzeranfragen

Ein neuer Ansatz, um Tabellen basierend auf Nutzerfragen zusammenzufassen für bessere Einblicke.

2025-11-12T00:48:54+00:00 ― 6 min Lesedauer

Rechnen und Sprache Eine neue Möglichkeit, generierten Text zu bewerten

Wir stellen ein System vor, das die Bewertung von maschinell erzeugtem Text klar erklärt.

2025-11-12T00:17:18+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei mehrsprachigen Sprachmodellen

Ein neuer Datensatz verbessert die Fähigkeit von Sprachmodellen, Anweisungen in verschiedenen Sprachen zu verstehen.

2025-11-10T17:20:48+00:00 ― 5 min Lesedauer

Rechnen und Sprache Die Genauigkeit bei Sprachmodellen verbessern

Eine neue Methode geht die Herausforderungen an, mit denen Sprachmodelle konfrontiert sind, um genaue Antworten zu geben.

2025-11-10T09:58:24+00:00 ― 6 min Lesedauer

Maschinelles Lernen Bewertung von abstinierenden Klassifizierern mit kontrafaktischen Scores

Eine Methode, um abstinente Klassifizierer zu bewerten, indem man ihre fehlenden Vorhersagen schätzt.

2025-11-10T06:52:08+00:00 ― 8 min Lesedauer

Informationsbeschaffung Die Rolle von Klärungsfragen in Gesprächssystemen

Klärungsfragen sind wichtig für eine effektive Kommunikation in Gesprächssystemen.

2025-11-09T18:34:06+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Zusammenfassen von Gebärdensprache-Videos für bessere Kommunikation

Eine neue Methode verbessert die Videozusammenfassung für Inhalte in Gebärdensprache.

2025-11-09T12:22:48+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritt in diversen Modalitäten für Entity Linking Techniken

Die Fähigkeiten des Modells verbessern, um verschiedene Datentypen effektiv zu verknüpfen.

2025-11-09T09:44:48+00:00 ― 5 min Lesedauer

Rechnen und Sprache Chain-of-Thought Hub: Bewertung von Schlussfolgerungen in Sprachmodellen

Ein Werkzeug, um die Multi-Step-Denkfähigkeiten von grossen Sprachmodellen zu bewerten.

2025-11-09T08:41:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Ein neuer Ansatz zur Evaluierung von Zusammenfassungen

Kombination von referenzbasierten und referenzfreien Methoden für bessere Zusammenfassungsbewertung.

2025-11-09T01:11:18+00:00 ― 6 min Lesedauer

Rechnen und Sprache LLMs übertreffen traditionelle Systeme bei der Übersetzung

Eine Studie zeigt, dass LLMs natürlichere Übersetzungen liefern, besonders für idiomatische Ausdrücke.

2025-11-08T23:12:48+00:00 ― 5 min Lesedauer