Neue Methoden verbessern die Anpassungsfähigkeit von Sprachmodellen, während sie das vergangene Wissen behalten.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Neue Methoden verbessern die Anpassungsfähigkeit von Sprachmodellen, während sie das vergangene Wissen behalten.
― 6 min Lesedauer
Die Genauigkeit von Sprachmodellen bei medizinischen Anfragen durch Modellbearbeitungstechniken verbessern.
― 5 min Lesedauer
Eine Übersicht, wie Maschinen Texte, Bilder und Audio verarbeiten.
― 7 min Lesedauer
Überprüfung der Zuverlässigkeit menschlicher Rückmeldungen zur Bewertung von Ausgaben von Sprachmodellen.
― 7 min Lesedauer
Ein neues Framework verbessert die Erkennung von schädlicher Sprache im Internet durch kontinuierliches Lernen.
― 7 min Lesedauer
Neue Methoden verbessern die maschinelle Übersetzung für ressourcenarme Sprachen.
― 4 min Lesedauer
Untersuchen, wie Vorurteile die Qualität von Bewertungen von Sprachmodellen beeinflussen.
― 6 min Lesedauer
Eine neue Methode kombiniert Sprachmodelle mit Reinforcement Learning für das AI-Training.
― 6 min Lesedauer
Neue Methoden verbessern die Sprachverarbeitung und -erzeugung in Sprachmodellen.
― 5 min Lesedauer
SelfExtend bietet einen neuen Ansatz, um die Verarbeitung von langen Texten durch LLMs zu verbessern.
― 6 min Lesedauer
Diese Arbeit untersucht Techniken zur Verringerung von Halluzinationen in Sprachmodellen für eine bessere Genauigkeit.
― 6 min Lesedauer
Ein neues Framework verbessert das visuelle Denken, indem es Sprachmodelle als Steuerungen nutzt.
― 6 min Lesedauer
Erforschen, wie Sprachmodelle sich nach Veränderungen erholen und anpassen.
― 8 min Lesedauer
Neue Methode verbessert das Lernen neuer Klassen mit weniger Daten.
― 5 min Lesedauer
Eine neue Methode zur genauen Diakritisierung von arabischem Text wird vorgestellt.
― 8 min Lesedauer
Neue Methode verbessert die Abrufeffizienz über Sprachen hinweg, ohne viel übersetzen zu müssen.
― 7 min Lesedauer
Ein neuer Datensatz zur Verbesserung der Bilder- und Texterkennung im E-Commerce.
― 7 min Lesedauer
Die Natur und Fähigkeiten von Sprachmodellen bei der Erstellung von bedeutungsvollem Text untersuchen.
― 7 min Lesedauer
Ein Datensatz testet Sprachmodelle bei selbstreferenziellen Sprachaufgaben.
― 6 min Lesedauer
QE-Fusion verbessert die Übersetzungsqualität, indem mehrere Ausgabekandidaten kombiniert werden.
― 5 min Lesedauer
Bewertung von Sprachmodellen hinsichtlich ihrer Fähigkeit, den Kontext in der Kommunikation zu verstehen.
― 7 min Lesedauer
Ein neuer Ansatz, der Multi-Agenten-Systeme nutzt, um kleinere Sprachmodelle zu verbessern.
― 7 min Lesedauer
Eine Studie zeigt, dass kleine Sprachmodelle Probleme mit Multiple-Choice-Fragen haben.
― 7 min Lesedauer
Diese Studie konzentriert sich darauf, die retrieval-augmented generation Methoden für brasilianisches Portugiesisch zu verbessern.
― 7 min Lesedauer
Ein neuer Datensatz verbessert die Verbindung zwischen Sprache und 3D-Umgebungen.
― 7 min Lesedauer
Eine neue Methode, um die Reaktionszeiten in Sprachmodellen zu verbessern, indem die Verarbeitungsphasen getrennt werden.
― 6 min Lesedauer
Diese Studie bewertet die Leistung von Sprachmodellen bei modifizierten Matheaufgaben.
― 5 min Lesedauer
Eine neue Methode verbessert, wie wir Synonyme und Antonyme identifizieren.
― 5 min Lesedauer
Die Risiken von Jailbreak-Angriffen auf grosse Sprachmodelle untersuchen.
― 6 min Lesedauer
Microsofts MuLanTTS bietet natürliche und ausdrucksstarke Text-zu-Sprache-Funktionen für Französisch.
― 5 min Lesedauer
MuMo beschleunigt die Leistung von Sprachmodellen für nicht-römische Schriften.
― 8 min Lesedauer
Die Studie untersucht universelle Neuronen in GPT-2-Modellen und deren Rollen.
― 4 min Lesedauer
Eine Studie über MLLMs und deren Leistung bei nonverbalen Denksportaufgaben.
― 7 min Lesedauer
Dieser Artikel untersucht, wie man mit Spieltheorie die Kommunikation durch Sprachmodelle verbessern kann.
― 9 min Lesedauer
Das CLAP-Modell verbindet Audio- und Textverarbeitung für verschiedene Anwendungen.
― 4 min Lesedauer
Diese Studie untersucht, wie die Sprachstruktur die Layout-Vorhersagen bei Maschinen verbessert.
― 5 min Lesedauer
Ein neues Framework beschleunigt die Informationsbeschaffung für Sprachmodelle.
― 6 min Lesedauer
Wege finden, um die Sequenzkennzeichnung in Sprachmodellen zu verbessern.
― 6 min Lesedauer
Dieser Artikel untersucht, wie Transformer-Modelle mit Mehrwortausdrücken umgehen und welche Herausforderungen damit verbunden sind.
― 8 min Lesedauer
Gradient-Based Red Teaming verbessert die Sicherheit von Sprachmodellen.
― 5 min Lesedauer