Neuste Artikel für Sprachmodelle

Rechnen und Sprache Verbesserung von LLM-Agenten mit Schritt-für-Schritt-Anleitung

Ein neues Framework verbessert, wie LLM-Agenten lernen, durch detaillierte Prozessanleitungen.

2025-07-28T09:20:48+00:00 ― 8 min Lesedauer

Rechnen und Sprache Optimierung von Aufforderungen für Sprachmodell-Agenten

Wir stellen RePrompt vor, um die Leistung von Sprachmodellen durch optimierte Aufforderungen zu verbessern.

2025-07-28T08:41:18+00:00 ― 6 min Lesedauer

Rechnen und Sprache RUPBench: Robustheit von Sprachmodellen bewerten

Ein neuer Massstab bewertet, wie Sprachmodelle mit Textänderungen umgehen.

2025-07-28T07:06:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Der Einfluss von Nutzer-Personas auf AI-Antworten

Nutzermerkmale beeinflussen die Antworten von Sprachmodellen und deren Sicherheit.

2025-07-27T23:36:12+00:00 ― 7 min Lesedauer

Rechnen und Sprache Bewertung von Retrieval-unterstützten grossen Sprachmodellen

Ein Toolkit zur Bewertung der Leistung von retrieval-unterstützten Modellen in bestimmten Bereichen.

2025-07-27T18:28:06+00:00 ― 10 min Lesedauer

Maschinelles Lernen Erkennung von Phasenwechseln in Sprachmodellen

Diese Studie zeigt, wie Sprachmodelle ihr Verhalten während des Trainings ändern.

2025-07-27T13:18:06+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung der Planungskompetenzen in Sprachmodellen

Dieser Artikel untersucht Möglichkeiten, die Planungsfähigkeiten in grossen Sprachmodellen zu verbessern.

2025-07-27T08:35:36+00:00 ― 8 min Lesedauer

Rechnen und Sprache DetectBench: Ein neuer Standard für die Nachweisführung in Sprachmodellen

DetectBench bewertet LLMs danach, wie gut sie versteckte Hinweise in Denksportaufgaben erkennen können.

2025-07-27T05:02:18+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Neuron-Aktivierung und arithmetisches Denken in LLMs

Untersuchen, wie die Aktivierung von Neuronen das arithmetische Denken in grossen Sprachmodellen verbessert.

2025-07-27T00:17:54+00:00 ― 10 min Lesedauer

Rechnen und Sprache Fortschrittliche Poesie-Generierung auf Tschechisch

Ein neues Modell erzeugt tschechische Poesie mit verbessertem Reim und Rhythmus.

2025-07-26T22:43:06+00:00 ― 7 min Lesedauer

Rechnen und Sprache Beurteilung des Denkens in Sprachmodellen

Ein neuer Massstab bewertet die Denkfähigkeiten von Sprachmodellen.

2025-07-26T22:11:30+00:00 ― 8 min Lesedauer

Rechnen und Sprache Rationale bei der Argumentbewertung durch Sprachmodelle

Eine Studie darüber, wie Sprachmodelle überzeugende Begründungen für die Bewertung von Argumenten erzeugen.

2025-07-26T20:52:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Ehrlichkeit bei grossen Sprachmodellen bewerten

Diese Studie bewertet die Ehrlichkeit von LLMs in drei wichtigen Bereichen.

2025-07-26T14:33:18+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Herausforderungen der Zusammenarbeit zwischen Sprachmodellen

Dieser Artikel untersucht, wie Gegner die Teamarbeit zwischen Sprachmodellen beeinflussen.

2025-07-26T11:00:00+00:00 ― 13 min Lesedauer

Rechnen und Sprache Bewertung von mehrsprachigen Sprachmodellen in indischen Sprachen

Eine umfassende Studie zur Leistungsfähigkeit von Sprachmodellen in 10 indischen Sprachen.

2025-07-25T17:37:12+00:00 ― 8 min Lesedauer

Maschinelles Lernen Fortschrittliche Code-Reparaturtechniken für weniger verbreitete Sprachen

Eine neue Methode verbessert die Code-Reparatur für wenig genutzte Programmiersprachen.

2025-07-25T15:07:06+00:00 ― 7 min Lesedauer

Maschinelles Lernen Aufmerksamkeit sinkt in Sprachmodellen

Erforschen, wie Aufmerksamkeitssenkungen die Leistung von Sprachmodellen beeinflussen und eine Kalibrierungstechnik vorstellen.

2025-07-25T11:02:12+00:00 ― 6 min Lesedauer

Rechnen und Sprache RankAdaptor: Eine neue Grenze in der Modellkompression

RankAdaptor optimiert das Fine-Tuning für beschnittene KI-Modelle und verbessert die Leistung effizient.

2025-07-25T10:30:36+00:00 ― 8 min Lesedauer

Rechnen und Sprache Plagiatsbekämpfung bei grossen Sprachmodellen

Eine Studie über PlagBench und seine Rolle bei der Erkennung von Plagiaten in LLM-Ausgaben.

2025-07-25T09:43:12+00:00 ― 4 min Lesedauer

Rechnen und Sprache Bewertung von mehrstufigem logischen Denken in Sprachmodellen

Neues Dataset bewertet die Fähigkeit von LLMs für komplexe logische Denkaufgaben.

2025-07-25T01:57:06+00:00 ― 7 min Lesedauer

Rechnen und Sprache Untersuchung des Sprachtransfers bei Denkaufgaben

Diese Forschung untersucht, wie Denkfähigkeiten zwischen Sprachen in Sprachmodellen übertragen werden.

2025-07-24T21:20:36+00:00 ― 9 min Lesedauer

Maschinelles Lernen Die Rolle der Selbstkorrektur in KI-Sprachmodellen

Dieser Artikel behandelt, wie KI-Modelle aus Fehlern durch Selbstkorrektur lernen.

2025-07-24T21:04:16+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung des Verständnisses von grossen Sprachmodellen in Bezug auf Himmelsrichtungen

Diese Studie bewertet, wie gut LLMs über Himmelsrichtungen nachdenken.

2025-07-24T19:53:42+00:00 ― 5 min Lesedauer

Rechnen und Sprache Evaluierung von LLMs im sequentiellen Entscheidungsprozess über die UNO-Arena

Diese Studie bewertet, wie gut LLMs Entscheidungen in einem Spielsetting treffen können.

2025-07-24T18:34:42+00:00 ― 8 min Lesedauer

Rechnen und Sprache Untersuchung der Leistung von Sprachmodellen über verschiedene Benutzergruppen hinweg

Studie zeigt, wie Benutzermerkmale die Antworten und die Genauigkeit von LLM beeinflussen.

2025-07-24T12:47:06+00:00 ― 8 min Lesedauer

Rechnen und Sprache CharED: Eine neue Methode zur Verbesserung von Sprachmodellen

CharED kombiniert Sprachmodelle für bessere Leistung ohne gemeinsame Vokabulare.

2025-07-24T05:48:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei RAG-Systemen: Ein neuer Bewertungsrahmen

RAGBench bringt ein umfangreiches Dataset zur Bewertung von Retrieval-Augmented Generation-Systemen.

2025-07-24T05:24:42+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fairness-Herausforderungen bei grossen Sprachmodellen

Die Erkundung von Fairnessproblemen in KI-Sprachmodellen und deren Auswirkungen.

2025-07-24T05:13:00+00:00 ― 9 min Lesedauer

Rechnen und Sprache Neues Moderationstool für Sprachmodelle

Ein Werkzeug zur Verbesserung der Sicherheit in Interaktionen mit Sprachmodellen.

2025-07-24T00:08:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Adressierung stiller Fehler in Sprachmodellwerkzeugen

Dieser Artikel untersucht die Erkennung von Fehlern in den von Sprachmodellen verwendeten Werkzeugen.

2025-07-23T09:39:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Untersuchung von syntaktischen Vorlagen in Sprachmodellen

Dieser Artikel analysiert sich wiederholende Strukturen in Texten, die von Sprachmodellen generiert wurden.

2025-07-23T01:29:54+00:00 ― 8 min Lesedauer

Rechnen und Sprache Evaluierung der sequentiellen Befolgung von Anweisungen in LLMs

Ein neuer Massstab bewertet, wie gut Sprachmodelle mehrere Anweisungen in Folge befolgen.

2025-07-22T21:32:54+00:00 ― 4 min Lesedauer

Rechnen und Sprache Testen grosser Sprachmodelle mit MalAlgoQA

Das MalAlgoQA-Dataset bewertet das Denken von grossen Sprachmodellen in kontrafaktischen Szenarien.

2025-07-22T07:35:30+00:00 ― 6 min Lesedauer

Künstliche Intelligenz MathCAMPS: Ein neuer Ansatz zur Bewertung von Sprachmodellen

MathCAMPS bietet eine neue Möglichkeit, mathematisches Denken in Sprachmodellen zu bewerten.

2025-07-22T06:56:00+00:00 ― 10 min Lesedauer

Rechnen und Sprache Verbesserung der numerischen Darstellung in Sprachmodellen

Diese Arbeit konzentriert sich auf bessere Zahlenrepräsentation mit Digit-Embeddings für verbesserte Vorhersagen.

2025-07-22T06:48:06+00:00 ― 8 min Lesedauer

Maschinelles Lernen Bewertung grosser Sprachmodelle in Dueling Bandits

Die Effektivität von LLMs bei Entscheidungsfindung in Dueling Bandits-Szenarien erkunden.

2025-07-21T23:41:30+00:00 ― 9 min Lesedauer

Rechnen und Sprache Bewertung von Sprachmodellen für wissenschaftliche Forschung

Ein neuer Massstab zur Bewertung grosser Sprachmodelle in der Hypothesentests.

2025-07-21T19:52:24+00:00 ― 7 min Lesedauer

Künstliche Intelligenz Einführung von CRAB: Ein neuer Benchmark für Sprachmodelle

CRAB verbessert das Testen von Sprachmodellen in realen Umgebungen.

2025-07-21T18:41:18+00:00 ― 7 min Lesedauer

Maschinelles Lernen Fortschritte bei der Feinabstimmung von Sprachmodellen auf Geräten

Feinabstimmung grosser Sprachmodelle direkt auf Smartphones, während die Nutzerdaten geschützt bleiben.

2025-07-21T08:40:54+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Dekodierung der mechanistischen Interpretierbarkeit in Transformermodellen

Eine Übersicht über mechanistische Interpretierbarkeit in transformerbasierten Sprachmodellen.

2025-07-21T02:05:54+00:00 ― 8 min Lesedauer