Neuste Artikel für Modellbewertung

Rechnen und Sprache Ansprechen von Fehlkalibrierung in adversarialen NLP-Modellen

Untersuchung der Auswirkungen von Fehlkalibrierung auf die Widerstandsfähigkeit von NLP-Modellen gegenüber adversarialen Angriffen.

2025-09-03T12:04:18+00:00 ― 7 min Lesedauer

Maschinelles Lernen Sicherheit bei Sprachmodellen verbessern durch neugiergesteuertes Red Teaming

Eine neue Methode verbessert die Testrobustheit von Sprachmodellen, indem sie Neuheit priorisiert.

2025-09-02T23:33:48+00:00 ― 8 min Lesedauer

Maschinelles Lernen Ansprechen von Schwachstellen in Machine Learning-Modellen

Die Untersuchung von adversarialem Training für stärkere Machine-Learning-Modelle gegen Angriffe.

2025-09-02T23:11:08+00:00 ― 6 min Lesedauer

Rechnen und Sprache Herausforderungen bei der Relationsextraktion für Sprachmodelle

Grosse Sprachmodelle haben Schwierigkeiten, Beziehungen zwischen Entitäten genau zu erkennen.

2025-09-02T19:21:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Adressierung von Zahlenhalluzinationen in Vision-Language-Modellen

Dieser Artikel hebt die Herausforderungen hervor, die mit der Zählgenauigkeit in KI-Modellen verbunden sind.

2025-09-02T06:03:06+00:00 ― 7 min Lesedauer

Rechnen und Sprache Neuer Massstab zur Bewertung der Denkfähigkeiten von MLLMs

NPHardEval4V bewertet die Denkfähigkeiten von multimodalen grossen Sprachmodellen.

2025-09-01T13:19:48+00:00 ― 8 min Lesedauer

Rechnen und Sprache Bewertung von Sprachmodellen mit dem PARADISE-Datensatz

Ein neuer Datensatz zur Bewertung der Planungsfähigkeiten von Sprachmodellen bei realen Aufgaben.

2025-09-01T03:19:24+00:00 ― 8 min Lesedauer

Kryptographie und Sicherheit Neues Mass zur Bewertung der Resilienz von Modellen gegen Angriffe

Einführung von adversarialem Hypervolumen, um die Leistung von Deep-Learning-Modellen besser zu bewerten.

2025-08-31T03:37:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Bewertung von vereinfachten Transformers für die Zeitreihenvorhersage

Diese Arbeit analysiert die Leistung von vereinfachten Transformern bei Vorhersageaufgaben.

2025-08-30T16:44:52+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Evaluierung von multimodalen Sprachmodellen mit dem CoIN-Benchmark

Ein neuer Massstab bewertet das fortlaufende Lernen in multimodalen Sprachmodellen.

2025-08-29T17:23:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Verstehen des PAC-Bayes-Rahmens für die Modellgeneralisation

Ein Blick auf PAC-Bayes und seinen Einfluss auf die Modellleistung.

2025-08-29T13:12:40+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung AVIBench: Neues Tool zur Bewertung von LVLMs gegen adversarielle Angriffe

AVIBench testet LVLMs, um sicherzustellen, dass sie gegen feindliche visuelle Anweisungen bestehen.

2025-08-29T08:26:12+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Bewertung von VMamba: Ein neues Modell in der Computer Vision

Dieser Artikel beleuchtet die Stärken und Schwächen des VMamba-Modells.

2025-08-28T20:11:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Treue in den Erklärungen von Sprachmodellen untersuchen

Eine Studie, die die Erklärungen und die Treue von mehrsprachigen und einsprachigen Modellen vergleicht.

2025-08-27T21:16:54+00:00 ― 8 min Lesedauer

Maschinelles Lernen Bewertung von Kreativität in generativen Modellen mit dem KEN-Score

Eine neue Methode, um die Neuheit in den Ausgaben von generativer KI zu bewerten.

2025-08-25T21:35:40+00:00 ― 5 min Lesedauer

Maschinelles Lernen Methoden zur Klassifizierung von Daten und zur Schätzung von Unsicherheit

Untersuche verschiedene Modelle, die für die Datenklassifikation und Unsicherheitsabschätzung verwendet werden.

2025-08-25T04:04:16+00:00 ― 6 min Lesedauer

Rechnen und Sprache GAHD: Hassrede in deutschen Texten bekämpfen

Ein neuer Datensatz soll die Modelle zur Erkennung von Hassrede in der deutschen Sprache verbessern.

2025-08-24T16:39:06+00:00 ― 5 min Lesedauer

Rechnen und Sprache Die Bewertung von NLP-Modellen durch Datenverteilung

Dieses Paper untersucht, wie Daten die Bewertung von NLP-Modellen beeinflussen.

2025-08-23T22:13:06+00:00 ― 6 min Lesedauer

Künstliche Intelligenz IsoBench: Ein neues Tool zur Modellevaluation

IsoBench bewertet, wie Modelle mit Text und Bildern umgehen, um Stärken zu erkennen.

2025-08-23T16:57:06+00:00 ― 4 min Lesedauer

Maschinelles Lernen Adversarial Angriffe im maschinellen Lernen: Ein Überblick

Lern mal was über angreifende Attacken und ihren Einfluss auf Machine Learning Modelle.

2025-08-20T13:14:36+00:00 ― 7 min Lesedauer

Rechnen und Sprache Sicherheit in Sprachmodellen bewerten

Eine Studie, die die Sicherheitsleistung von beliebten Sprachmodellen vergleicht.

2025-08-19T13:40:30+00:00 ― 6 min Lesedauer

Maschinelles Lernen Analyse der Auswirkungen von Trainingsdaten auf KI-Modelle

Ein Rahmen, um zu bewerten, wie Trainingsdaten das Verhalten von KI-Modellen beeinflussen.

2025-08-17T09:08:24+00:00 ― 10 min Lesedauer

Rechnen und Sprache Bewertung von Sprachmodellen mit dem VISLA-Benchmark

Ein neuer Massstab bewertet, wie gut Sprachmodelle Wortbedeutungen und -beziehungen verstehen.

2025-08-16T08:07:24+00:00 ― 5 min Lesedauer

Maschinelles Lernen Bewertung der Stabilität von Machine Learning mit harmonischer Robustheit

Ein Verfahren zur Überprüfung der Zuverlässigkeit von Modellen ohne echte Labels.

2025-08-15T13:17:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung der Wissensdarstellung in Sprachmodellen

Eine Studie, die Instanz- und Neuron-Zurechnungsmethoden in Sprachmodellen vergleicht.

2025-08-15T11:50:48+00:00 ― 8 min Lesedauer

Maschinelles Lernen Transfer-Learning: Einblicke in die Modellleistung

Untersuchen, wie Transferlernen die Modell-Effektivität in verschiedenen Datenkontexten beeinflusst.

2025-08-15T11:15:40+00:00 ― 5 min Lesedauer

Kosmologie und nicht-galaktische Astrophysik Ein neuer Ansatz zum Modellvergleich in der Kosmologie

Wir stellen die FB-Methode für eine bessere Modellbewertung in der Kosmologie vor.

2025-08-15T06:15:16+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Die Bewertung des Vertrauens von KI in der Unsicherheitsabschätzung

Eine Studie zeigt, dass KI-Sprach- und Vision-Modelle Probleme mit Überconfidence haben.

2025-08-13T16:08:00+00:00 ― 6 min Lesedauer

Maschinelles Lernen Modellauswahl mit frühzeitigem Stoppen beschleunigen

Dieser Artikel bespricht Early Stopping, um die Effizienz der Modellauswahl im Machine Learning zu verbessern.

2025-08-13T09:01:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Geteilte Variablen-Embeddings im Multi-Task-Lernen

Die Vorteile und Herausforderungen von geteilten Variablen-Einbettungen im maschinellen Lernen erkunden.

2025-08-12T00:38:00+00:00 ― 8 min Lesedauer

Neuronales und evolutionäres Rechnen Genetische Programmierung mit schärfere Bewusstseinsminimierung verbessern

Neue Techniken verbessern die Zuverlässigkeit und Einfachheit in genetischen Programmierungsmodellen.

2025-08-10T15:43:00+00:00 ― 8 min Lesedauer

Maschinelles Lernen AnyLoss: Ein neuer Ansatz zur Modellauswertung

Wir präsentieren AnyLoss, das Metriken in Verlustfunktionen verwandelt für besseres Modelltraining.

2025-08-08T09:12:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Transparenz in der KI-Objekterkennung verbessern

Dieser Artikel behandelt neue Methoden, um KI-Entscheidungen bei der Objekterkennung zu erklären.

2025-08-06T11:23:12+00:00 ― 7 min Lesedauer

Maschinelles Lernen Navigieren von Schwachstellen in KI: Adversarielle Beispiele

Ein Blick darauf, wie adversarielle Beispiele KI-Modelle herausfordern.

2025-08-06T05:43:30+00:00 ― 6 min Lesedauer

Ökonometrie Auswahl von Tuning-Parametern in der Datenanalyse

Lerne wichtige Methoden zur Auswahl von Tuning-Parametern in der Datenanalyse für bessere Vorhersagen.

2025-08-04T12:24:40+00:00 ― 5 min Lesedauer

Kryptographie und Sicherheit Bewertung von grossen Sprachmodellen in der Cybersicherheit

Ein neuer Massstab zur Bewertung von LLMs bei Cybersecurity-Aufgaben.

2025-08-04T08:33:48+00:00 ― 8 min Lesedauer

Maschinelles Lernen Die Überprüfung der Entwirrung in Machine Learning-Modellen

Dieses Papier schlägt neue Methoden vor, um die Informationsfragmentierung im maschinellen Lernen zu bewerten.

2025-08-04T01:50:54+00:00 ― 8 min Lesedauer

Maschinelles Lernen Eine neue Methode für interpretierbare KI-Modelle

Dieses Papier stellt einen Ansatz vor, um leicht verständliche KI-Klassifizierer zu erstellen.

2025-08-02T21:24:30+00:00 ― 5 min Lesedauer

Maschinelles Lernen Selbstüberwachtes Lernen bei Clusteraufgaben bewerten

Diese Studie untersucht, wie gut vortrainierte Modelle unbekannte Daten gruppieren.

2025-08-02T13:14:42+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte im maschinellen Vergessen für kontrastives Lernen

Neue Methoden vorstellen, um die Vergessensprozesse in kontrastiven Lernmodellen zu verbessern.

2025-08-02T03:06:24+00:00 ― 7 min Lesedauer