Neuste Artikel für Modellbewertung

Computer Vision und Mustererkennung Die Bewertungsmethoden für multimodale Modelle neu denken

Neuer Massstab verbessert die Bewertung von multimodalen Modellen, indem er Vorurteile minimiert.

2025-07-22T12:12:00+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Evaluierung des multimodalen Lernens in Sprachmodellen

Diese Studie untersucht, wie visuelle und textuelle Daten die Leistung von Modellen beeinflussen.

2025-07-22T07:03:54+00:00 ― 8 min Lesedauer

Künstliche Intelligenz Kontextuelle Zerlegung: Eine neue Perspektive für Transformer

CD-T verbessert das Verständnis von Transformermodellen und erhöht die Interpretation und das Vertrauen.

2025-07-22T06:40:12+00:00 ― 4 min Lesedauer

Computer Vision und Mustererkennung Messung von Geschlechtervorurteilen in grossen Vision-Sprachmodellen

Neuer Benchmark bewertet Geschlechtervorurteile in KI-Modellen im Zusammenhang mit Jobrollen.

2025-07-22T01:40:00+00:00 ― 6 min Lesedauer

Maschinelles Lernen Saubere Etiketten-Hintertürangriffe in maschinellem Lernen angehen

Die Untersuchung von Schwachstellen bei Clean-Label-Backdoor-Angriffen und wie allgemeine Grenzwerte helfen können.

2025-07-21T22:58:40+00:00 ― 6 min Lesedauer

Multimedia OpenVNA: Fortschritte beim Sprachverständnis in Lärm

Ein neues Tool zum Testen von Sprachmodellen in lauten Umgebungen.

2025-07-21T05:23:24+00:00 ― 4 min Lesedauer

Maschinelles Lernen Neu Bewertung von Machine-Learning-Modellbewertungen für tabellarische Daten

Ein neuer Ansatz zur Bewertung von ML-Modellen mit Fokus auf Datenaufbereitung.

2025-07-20T15:49:42+00:00 ― 8 min Lesedauer

Maschinelles Lernen Bewertung von erklärbaren KI-Methoden für Zuverlässigkeit

Die Forschung bewertet die Stabilität von XAI-Methoden mit einem Diabetes-Datensatz.

2025-07-20T07:08:18+00:00 ― 6 min Lesedauer

Software-Entwicklung Bewertung grosser Sprachmodelle im Programmierkontext

Eine Studie darüber, wie LLMs mit Codierungsregeln und -beschränkungen umgehen.

2025-07-19T18:29:54+00:00 ― 5 min Lesedauer

Rechnen und Sprache Bewertung von grossen Sprachmodellen: Wichtige Erkenntnisse

Entdecke die Bedeutung und Herausforderungen bei der effektiven Bewertung der Leistung von LLMs.

2025-07-19T12:26:30+00:00 ― 5 min Lesedauer

Software-Entwicklung Bewertung von Foundation-Modellen: Herausforderungen und Lösungen

Ein Blick auf die Leaderboards für Foundation-Modelle und ihre Bewertungsprobleme.

2025-07-19T12:10:42+00:00 ― 7 min Lesedauer

Maschinelles Lernen Generative Modelle neu bewerten durch neue Kennzahlen

Neue Metriken bieten eine bessere Bewertung der Leistung von generativen Modellen im maschinellen Lernen.

2025-07-19T03:21:24+00:00 ― 5 min Lesedauer

Maschinelles Lernen Verstehen des Rashomon-Effekts im maschinellen Lernen

Der Rashomon-Effekt zeigt mehrere effektive Modelle im maschinellen Lernen.

2025-07-18T20:46:24+00:00 ― 9 min Lesedauer

Methodik Bewertung von Ereigniszeit-Ergebnissen: Eine kritische Überprüfung

Eine Übersicht über Methoden zur Bewertung von Zeit-bis-Ereignis-Vorhersagen in der Datenwissenschaft.

2025-07-18T17:22:28+00:00 ― 7 min Lesedauer

Maschinelles Lernen Die Rolle der Invarianz im Transfer-Lernen

Untersuchung, wie Invarianz die Modellleistung im Transferlernen beeinflusst.

2025-07-18T11:33:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache Evaluierung der Auswirkungen von Post-Training auf Sprachmodelle

Die echten Auswirkungen von Post-Training-Methoden auf die Leistung von Sprachmodellen analysieren.

2025-07-18T04:50:30+00:00 ― 6 min Lesedauer

Maschinelles Lernen Herausforderungen bei leichten One-Class-Klassifikationsmodellen

Untersuchung der Schwachstellen von leichten Modellen gegenüber adversarialen Angriffen.

2025-07-17T15:24:42+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Ansprechen von Objekt-Halluzinationen in Vision-Language-Modellen

Diese Studie bewertet, wie gut grosse Modelle mit mehreren Objekten in Bildern umgehen können.

2025-07-17T12:30:54+00:00 ― 6 min Lesedauer

Maschinelles Lernen Bewertung der Fortschritte in der unüberwachten Graphen-Domain-Adaption

Ein Blick auf die Herausforderungen und Innovationen in den Methoden der Anpassung im Diagramm-Bereich.

2025-07-16T23:13:00+00:00 ― 8 min Lesedauer

Maschinelles Lernen Verbesserung der Modellzuverlässigkeit durch Kalibrierungsanalyse

Diese Forschung verbessert die Zuverlässigkeit von Machine-Learning-Modellen durch Kalibrierungs- und Neukalibrierungstechniken.

2025-07-16T19:28:48+00:00 ― 9 min Lesedauer

Maschinelles Lernen Herausforderungen bei der Verarbeitung langer Datenfolgen

Untersuchen der Schwierigkeiten, mit denen Modelle bei langen Sequenzen in verschiedenen Anwendungen konfrontiert sind.

2025-07-16T04:15:24+00:00 ― 5 min Lesedauer

Maschinelles Lernen Umgang mit Zufälligkeit in Deep Learning-Modellen

Lern, wie die Auswahl des Zufalls-Samens die Leistung und Zuverlässigkeit von KI-Modellen beeinflusst.

2025-07-15T19:16:52+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neues Denken über Bewertungsmethoden für LLMs

Ein frischer Ansatz zur Bewertung grosser Sprachmodelle für bessere Leistungsanalysen.

2025-07-15T16:32:18+00:00 ― 5 min Lesedauer

Maschinelles Lernen HO-FMN: Ein neuer Ansatz für adversarielle Angriffe

Wir stellen HO-FMN vor, um die Bewertung der Robustheit von Maschinenlernmodellen gegen adversarielle Angriffe zu verbessern.

2025-07-15T08:54:06+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Die Verwundbarkeiten in Modellen zur semantischen Segmentierung neu bewerten

Untersuchung von adversarialen Angriffen und Modellrobustheit in der semantischen Segmentierung.

2025-07-14T09:27:54+00:00 ― 6 min Lesedauer

Maschinelles Lernen Neuer Rahmen zur Erklärung von KI-Entscheidungen

Wir stellen PACE vor, einen strukturierten Ansatz für vertrauenswürdige KI-Erklärungen.

2025-07-13T03:51:48+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fragwürdige Praktiken in der Bewertung von Machine Learning

Eine Übersicht über Praktiken, die das Vertrauen in die Bewertungen von Machine-Learning-Modellen untergraben.

2025-07-12T19:16:54+00:00 ― 7 min Lesedauer

Rechnen und Sprache Bewertung von multimodalen Modellen anhand des VALSE-Benchmarks

Dieser Artikel untersucht die Effektivität von multimodalen Modellen, die Sprach- und visuellen Daten verwenden.

2025-07-11T16:17:24+00:00 ― 8 min Lesedauer

Maschinelles Lernen Ein neuer Ansatz zur Merkmalsbewertung in KI-Modellen

Wir stellen GOAR vor, eine Methode, um die Wichtigkeit von Features in KI besser zu verstehen.

2025-07-11T13:23:36+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Behebung von Fehlkalibrierungen in Vision-Language-Modellen

Dieser Artikel behandelt Probleme mit der Fehlkalibrierung in Vision-Sprach-Modellen und bietet Lösungen an.

2025-07-11T01:08:54+00:00 ― 5 min Lesedauer

Ton Bewertung des Denkens in Audio-Sprachmodellen

Diese Studie bewertet die Denkfähigkeiten von Audio-Sprachmodellen mit einer neuen Aufgabe.

2025-07-10T09:54:05+00:00 ― 8 min Lesedauer

Maschinelles Lernen Evaluierung von Testzeit-Anpassungsmethoden im maschinellen Lernen

Eine Studie zur Verbesserung von TTA-Methoden für Variationen in echten Daten.

2025-07-10T06:03:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Bewertung von multimodalen Modellen mit MIBench

MIBench testet die Leistung von multimodalen Modellen auf mehreren Bildern.

2025-07-09T14:23:18+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der OOD-Erkennung mit Vision-Language-Modellen

Fortschritte beim Erkennen von Daten, die ausserhalb der Verteilung liegen, mithilfe neuer Techniken.

2025-07-08T10:44:18+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von Langzeit-Kontext-Sprachmodellen mit dauerhaftem ICL

Eine neue Methode, um die Lernfähigkeiten von Long-Context-Sprachmodellen durch Task Haystack zu bewerten.

2025-07-08T10:20:36+00:00 ― 8 min Lesedauer

Maschinelles Lernen Bewertung der Modellleistung bei verschiedenen Aufgaben

Dieser Artikel analysiert die Modellleistung bei verschiedenen Aufgaben und Datensätzen.

2025-07-08T02:42:24+00:00 ― 5 min Lesedauer

Statistik-Theorie Evaluierung von Machine-Learning-Modellen: Kreuzvalidierung vs. Plug-In-Ansatz

Ein Blick auf Methoden zur Modellauswertung und deren Effektivität.

2025-07-06T20:49:44+00:00 ― 6 min Lesedauer

Maschinelles Lernen Herausforderungen im Bayes’schen Deep Learning: Das epistemische Unsicherheitsloch

Die Probleme der epistemischen Unsicherheit in Bayesian Deep Learning Methoden erkunden.

2025-07-06T09:08:48+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Evaluierung grosser Sprachmodelle: Ein umfassender Ansatz

Erkunde verschiedene Frameworks und Methoden, um grosse Sprachmodelle effektiv zu bewerten.

2025-07-06T02:07:18+00:00 ― 7 min Lesedauer

Rechnen und Sprache Sprache Modellbewertung mit Metabench optimieren

Ein neues Benchmarking-Framework steigert die Effizienz bei der Bewertung von Sprachmodellen.

2025-07-05T16:27:28+00:00 ― 6 min Lesedauer