Ein neues Verfahren verbessert den Manipulationsschutz in offenen Sprachmodellen.
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neues Verfahren verbessert den Manipulationsschutz in offenen Sprachmodellen.
― 8 min Lesedauer
Kleinere Sprachmodelle wie MiniCPM durch effektive Feinabstimmungspraktiken verbessern.
― 6 min Lesedauer
Der Benchmark bewertet, wie gut grosse Sprachmodelle räumliche Beziehungen verstehen können.
― 5 min Lesedauer
Eine neue Methode analysiert Sprachmodelle, indem sie ihre spezifischen Eigenschaften untersucht.
― 5 min Lesedauer
Dieser Artikel untersucht, wie strukturierte Generierung das Denken und das Verstehen von Sprachmodellen beeinflusst.
― 6 min Lesedauer
OpenFactCheck bietet ein System zur Bewertung der Genauigkeit von Ausgaben von Sprachmodellen.
― 6 min Lesedauer
Innovative Methoden zur Verbesserung der Fairness in grossen Sprachmodellen.
― 8 min Lesedauer
Eine neue Methode verbessert die Qualität synthetischer Daten für eine bessere Ausrichtung von Sprachmodellen.
― 6 min Lesedauer
Ein neues System verbessert die Spracherkennung, indem es kontextuelle Schlüsselwörter für genauere Ergebnisse verwendet.
― 6 min Lesedauer
SAGE-RT erstellt synthetische Daten, um die Sicherheitsbewertungen von Sprachmodellen zu verbessern.
― 6 min Lesedauer
ArabLegalEval bewertet die Leistung von LLMs bei der Verarbeitung von arabischen Rechtsinformationen.
― 6 min Lesedauer
Eine neue Methode zur Bewertung von Ausgaben von Sprachmodellen mit mehreren LLM-Richtern.
― 7 min Lesedauer
Ein neuer Massstab bewertet Sprachmodell-Agenten beim Umgang mit der Analyse wissenschaftlicher Daten.
― 8 min Lesedauer
Neue Methoden verbessern die Genauigkeit kleiner Modelle bei der Beantwortung von Fragen in der Telekommunikation.
― 6 min Lesedauer
ConflictBank bietet Einblicke in Wissenskonflikte bei Sprachmodellen.
― 6 min Lesedauer
Dieser Artikel untersucht die Rolle der Memorierung bei der Verbesserung der ICL-Leistung.
― 6 min Lesedauer
Ein neues Modell und Benchmark für die Verarbeitung russischer Texte wird vorgestellt.
― 6 min Lesedauer
Forscher checken die Zuverlässigkeit von Metriken für die Sicherheit von Sprachmodellen.
― 6 min Lesedauer
Ein tiefer Einblick, wie die Vorhersage des nächsten Tokens das Sprachverständnis in Modellen beeinflusst.
― 6 min Lesedauer
FPDT bietet eine Lösung, um lange Kontext-LLMs effizienter zu trainieren.
― 6 min Lesedauer
MemLong verbessert die Fähigkeit von Sprachmodellen, längere Texte effektiv zu verarbeiten.
― 7 min Lesedauer
Dieser Artikel analysiert, wie Sprachmodelle realistische soziale Netzwerke und deren Vorurteile erschaffen.
― 6 min Lesedauer
Dieser Artikel bespricht einen neuen Rahmen zur Verbesserung des Denkens in KI-Modellen.
― 6 min Lesedauer
Ein Rahmen zur Erstellung von Kreativitätstestitems mit Sprachmodellen.
― 6 min Lesedauer
Eine neue Methode verbessert die Verarbeitung von langen Texten in Sprachmodellen für bessere Antworten.
― 5 min Lesedauer
LongGenBench bewertet grosse Sprachmodelle darin, qualitativ hochwertigen langen Text zu erstellen.
― 6 min Lesedauer
RAG bleibt wichtig, um die Antworten von Sprachmodellen zu optimieren, besonders bei langen Texten.
― 6 min Lesedauer
Dieser Artikel bewertet die Effektivität von spärlichen Autoencodern in der Wissensrepräsentation über Städte.
― 5 min Lesedauer
Eine Studie über den Einfluss von ICL und SFT auf die Struktur von Sprachmodellen.
― 6 min Lesedauer
Eine Studie zeigt, dass das Feintuning von LLMs mit TMs die Übersetzungsqualität für Unternehmen verbessert.
― 6 min Lesedauer
Dieser Artikel behandelt MLSAEs und ihre Rolle bei der Untersuchung von Sprachmodell-Schichten.
― 6 min Lesedauer
ECHO kombiniert verschiedene Denkweisen für besseres Problemlösen in Sprachmodellen.
― 6 min Lesedauer
Studie bewertet Sprachmodelle danach, wie gut sie Webanwendungscode generieren können.
― 6 min Lesedauer
AdaPPA verbessert Jailbreak-Angriffe auf Sprachmodelle, indem es sichere und schädliche Antworten kombiniert.
― 5 min Lesedauer
PF-PPO verbessert Sprachmodelle, indem es unzuverlässige Belohnungen filtert, um bessere Code-Antworten zu liefern.
― 5 min Lesedauer
Die Studie untersucht, wie Sprachmodelle Italienisch durch Multi-Task-Learning verarbeiten.
― 5 min Lesedauer
Untersuchen, wie Sprachmodelle die Subjekt-Verb-Übereinstimmung in verschiedenen Sprachen handhaben.
― 6 min Lesedauer
Ein neuer Ansatz, um Sprachmodelle prägnant und effektiv zu machen.
― 5 min Lesedauer
Erforschen, wie LLMs das Bearbeiten von strukturierten Dokumenten mit minimalem Aufwand erleichtern können.
― 8 min Lesedauer
LLMs nutzen, um klare Merkmale aus wissenschaftlichen Texten zu generieren für bessere Vorhersagen.
― 6 min Lesedauer