Neuste Artikel für Benchmark

Computer Vision und Mustererkennung Fortschritte beim Konzeptlernen in Text-zu-Bild-Modellen

Ein neuer Massstab verbessert die Bewertung, wie Modelle visuelle Konzepte lernen.

2025-11-03T11:24:54+00:00 ― 12 min Lesedauer

Künstliche Intelligenz Verbesserung der Benchmarks für die Vervollständigung von Wissensgraphen

Eine neue Methode verbessert die Bewertung von Modellen zur Vervollständigung von Wissensgraphen.

2025-11-03T07:59:30+00:00 ― 9 min Lesedauer

Datenbanken Einführung von ScienceBenchmark: Ein neuer Standard für NL-to-SQL-Systeme

ScienceBenchmark bietet einen neuen Massstab für komplexe wissenschaftliche Datenbanken.

2025-11-03T06:16:48+00:00 ― 5 min Lesedauer

Rechnen und Sprache Bewertung der Resilienz grosser Sprachmodelle

Dieser Artikel bespricht einen Benchmark, um LLMs mit kniffligen Aufforderungen zu bewerten.

2025-11-02T21:27:30+00:00 ― 9 min Lesedauer

Computer Vision und Mustererkennung GeneCIS: Fortschritt in der bedingten Bildähnlichkeit in der Computer Vision

Ein Benchmark zur Bewertung der Ähnlichkeit von Bildern basierend auf benutzerdefinierten Bedingungen.

2025-10-31T19:09:42+00:00 ― 7 min Lesedauer

Maschinelles Lernen Fortschritte in der NetHack KI-Forschung

Neue Bibliothek verbessert KI-Training und -Bewertung in NetHack.

2025-10-31T09:01:24+00:00 ― 8 min Lesedauer

Neurowissenschaften Neuroptimus: Fortschritte bei der Optimierung neuronaler Modelle

Neue Software optimiert die Parametereinstellung für neuronale Modelle und verbessert die Forschungseffizienz.

2025-10-31T00:41:20+00:00 ― 6 min Lesedauer

Maschinelles Lernen Umgang mit lauten Labels im Föderierten Lernen

Ein neuer Benchmark namens FedNoisy hilft dabei, mit lauten Labels im föderierten Lernen umzugehen.

2025-10-29T04:53:00+00:00 ― 8 min Lesedauer

Robotik Fortschritte in der Entwicklung von Haushaltsrobotern

Neue Massstäbe verbessern die Fähigkeit von Robotern, im Haushalt zu helfen.

2025-10-29T04:21:24+00:00 ― 6 min Lesedauer

Maschinelles Lernen FLGo: Vereinfachung der Forschung zu föderiertem Lernen

Die FLGo-Plattform vereinfacht das föderierte Lernen für Forscher mit flexiblen Werkzeugen.

2025-10-28T09:08:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung von Modellen zur Beantwortung von Fragen zu Tabellen

Neue Methoden zielen darauf ab, die Robustheit von Systemen zur Beantwortung von Fragen zu Tabellen zu verbessern.

2025-10-27T10:13:24+00:00 ― 7 min Lesedauer

Rechnen und Sprache Neues Tool misst Vorurteile gegen LGBTQ+-Personen in Sprachmodellen

Dieser Artikel behandelt ein Benchmark-Tool zur Bewertung von Vorurteilen in Sprachmodellen.

2025-10-27T04:02:06+00:00 ― 5 min Lesedauer

Hochenergiephysik - Experiment HEPScore: Ein neues Benchmark für die Computerphysik

HEPScore hat sich zum Ziel gesetzt, die Bewertung der Rechenleistung in der Teilchenphysikforschung zu verbessern.

2025-10-26T15:08:03+00:00 ― 5 min Lesedauer

Robotik Bewertung dynamischer Punktentfernungstechniken in der Robotik

Ein Bewertungsrahmen, um dynamische Punktentfernungs-Methoden für Roboter zu testen.

2025-10-19T20:31:24+00:00 ― 6 min Lesedauer

Mathematische Software MindOpt Tuner: Automatisierung der Hyperparameter-Tuning

MindOpt Tuner optimiert die Leistung numerischer Software, indem es die Anpassungen der Hyperparameter automatisiert.

2025-10-19T11:34:12+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Mixed-Precision Quantisierung für effizientes Deep Learning

Eine Methode, um die Effizienz von Deep Learning auf begrenzten Geräten zu verbessern.

2025-10-18T07:15:42+00:00 ― 6 min Lesedauer

Netzwerke und Internet-Architektur Festlegung von Benchmarks für Staukontrollmethoden

Diese Arbeit schlägt Richtlinien vor, um die Leistung der Staukontrolle effektiv zu messen.

2025-10-18T02:39:12+00:00 ― 7 min Lesedauer

Rechnen und Sprache Ripple-Effekte bei der Wissensbearbeitung bewerten

Neue Forschung zeigt, wie wichtig die Wellenwirkungen beim Update von Sprachmodellen sind.

2025-10-16T11:40:48+00:00 ― 9 min Lesedauer

Computer Vision und Mustererkennung Die Lücke zwischen Skizzen und Fotos überbrücken

Eine neue Methode hilft Computern dabei, Skizzen effektiv mit echten Bildern zu verknüpfen.

2025-10-16T11:25:00+00:00 ― 6 min Lesedauer

Maschinelles Lernen Unsicherheit in Machine Learning Modellen bewerten

Die Fähigkeit von Modellen bewerten, Unsicherheit für bessere Vorhersagen zu schätzen.

2025-10-15T03:22:00+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Stärkung der Punktwolken-Erkennung gegen Angriffe

Neue Methoden zum Schutz von 3D-Erkennungssystemen vor adversarialen Beispielen.

2025-10-14T08:27:42+00:00 ― 6 min Lesedauer

Maschinelles Lernen Verstehen von Verhaltensweisen in generativen Modellen

Ein näherer Blick darauf, wie generative Modelle sich verhalten und was das für die Forschung bedeutet.

2025-10-14T01:36:54+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der Bildverarbeitungstechnologie

LISA verbessert das maschinelle Verständnis für komplexe Benutzeranweisungen.

2025-10-13T17:42:54+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Verknüpfung von Bildern und Texten

Neue Forschung verbessert das Zuordnen von Bildern mit Text, indem sie fehlerhafte Beziehungen angeht.

2025-10-13T03:37:36+00:00 ― 9 min Lesedauer

Rechnen und Sprache Neue Methode zur Bewertung von Antworten von Sprachmodellen

Ein neuer Ansatz nutzt breitere Netzwerke, um die Evaluationsqualität von Sprachmodellen zu verbessern.

2025-10-12T17:13:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Rolle von synthetischen Daten im KI-Training

Untersuchung der Auswirkungen von synthetischen Daten auf die Leistung und das Lernen von KI-Modellen.

2025-10-11T18:11:00+00:00 ― 5 min Lesedauer

Datenbanken Generative KI will die Datensuche in Unionen verändern

Neue Benchmarks mit generativer KI verbessern die Techniken zur Kombination von Datentabellen.

2025-10-11T13:34:30+00:00 ― 7 min Lesedauer

Maschinelles Lernen Fortschritte im Offline-Verstärkungslernen in StarCraft II

Ein neuer Massstab für Offline-RL verbessert Strategien in StarCraft II.

2025-10-11T09:13:48+00:00 ― 6 min Lesedauer

Software-Entwicklung Fortschrittliches Penetration Testing mit KI-Unterstützung

Automatisierte Tools verbessern Penetrationstests durch KI-Integration und Aufgabenmanagement.

2025-10-09T08:46:36+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschrittliche räumliche Denkfähigkeiten in Vision- und Sprachmodellen

Neue Methoden verbessern, wie Maschinen räumliche Beziehungen innerhalb von Bildern bewerten.

2025-10-07T09:38:24+00:00 ― 6 min Lesedauer

Quantenphysik Quantencomputing für die Planung von Satellitenbildern

Diese Studie untersucht Quantencomputing-Techniken zur Verbesserung der Planung der Satellitenbildaufnahme.

2025-10-07T03:00:45+00:00 ― 5 min Lesedauer

Verteiltes, paralleles und Cluster-Computing CXL-Speicher: Ein neuer Ansatz in HPC

Untersuchung der Rolle von CXL-Speicher zur Verbesserung von Hochleistungsrechnern.

2025-10-06T04:48:18+00:00 ― 9 min Lesedauer

Rechnen und Sprache Einführung des Biomedical Entity Linking Benchmark (BELB)

Ein standardisierter Massstab zur Verbesserung des biomedizinischen Entity Linkings und für ForschungsvVergleiche.

2025-10-05T17:28:54+00:00 ― 5 min Lesedauer

Programmiersprachen Bewertung von Programmiersprachen mit Logikregeln

Dieser Artikel bewertet Benchmarks zur Einschätzung von Sprachen, die Logikregeln integrieren.

2025-10-02T08:46:12+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Fortschritte im Few-Shot Learning mit audio-visuellen Daten

Neue Methoden verbessern die Video-Klassifizierung mit begrenzten beschrifteten Daten.

2025-09-29T11:46:36+00:00 ― 8 min Lesedauer

Maschinelles Lernen Languini Küche: Ein neuer Ansatz für Sprachmodellierung

Languini Kitchen unterstützt Forscher im Bereich Sprachmodellierung mit fairen Vergleichen und besseren Datensätzen.

2025-09-23T23:50:48+00:00 ― 6 min Lesedauer

Maschinelles Lernen SALSA-CLRS: Ein neuer Massstab für Algorithmen

Wir stellen SALSA-CLRS vor, um die Algorithmenbewertung mit spärlichen Graphen zu verbessern.

2025-09-23T14:06:12+00:00 ― 6 min Lesedauer

Verteiltes, paralleles und Cluster-Computing Fortschritte in der Cloud-Maskierung in der Atmosphärenwissenschaft

Forschung zeigt, dass KI dabei hilft, Cloud-Maskierungs-Techniken für Satellitendaten zu verbessern.

2025-09-19T20:10:30+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Few-Shot Keyword Spotting mit Lesesprechdaten

Neue Methoden verbessern die Schlüsselworterkennung mit verfügbaren Lesesprechdaten.

2025-09-19T13:36:20+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Neues Modell kombiniert 2D- und 3D-Bildanalyse

Ein neues Modell integriert effektiv 2D- und 3D-Bildverarbeitung.

2025-09-18T21:15:54+00:00 ― 6 min Lesedauer