Ein neuer Benchmark zeigt Lücken im visuellen Verständnis von grossen Sprachmodellen.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neuer Benchmark zeigt Lücken im visuellen Verständnis von grossen Sprachmodellen.
― 7 min Lesedauer
Ein Blick auf die Span-Overlap-Methode für verbessertes Satzparsing.
― 6 min Lesedauer
Untersuchung, wie Namen Vorurteile in Sprachmodellen beeinflussen.
― 8 min Lesedauer
Ein robustes japanisches Korpus, das aus Common Crawl-Daten erstellt wurde, verbessert die Leistung von LLMs.
― 7 min Lesedauer
Diese Studie untersucht, wie Sprachmodelle auf sich ändernde Wortbedeutungen reagieren.
― 8 min Lesedauer
Untersuchung, wie Temperatur die Kreativität in von Sprachmodellen generierten Erzählungen beeinflusst.
― 7 min Lesedauer
Untersuchung von Positionsbias in Sprachmodellen und Möglichkeiten, ihn zu reduzieren.
― 5 min Lesedauer
Diese Studie untersucht, wie GPT-2 Dreibuchstabenabkürzungen vorhersagt.
― 8 min Lesedauer
Strategien zur Reduzierung von übermässig vorsichtigem Verhalten in Sprachmodellen.
― 8 min Lesedauer
Dieses Framework verbessert die Effizienz und Genauigkeit der Textevaluation mit Hilfe von grossen Sprachmodellen.
― 8 min Lesedauer
Neue Metriken verbessern die Effektivität von grossen Sprachmodellen in der Bildung.
― 7 min Lesedauer
Dieser Artikel untersucht, wie grosse Sprachmodelle Informationen aus den Trainingsdaten abrufen.
― 7 min Lesedauer
Die Anpassung von mehrsprachigen Modellen kann die Leistung für weniger genutzte uralische Sprachen verbessern.
― 6 min Lesedauer
Erläuter die Rolle der ordinalen Klassifikation und den Einfluss von vortrainierten Sprachmodellen.
― 7 min Lesedauer
Erkunde, wie DETAIL das Verständnis von kontextuellem Lernen in Sprachmodellen verbessert.
― 6 min Lesedauer
TPO bietet eine neue Methode, um Sprachmodelle effizient an die menschlichen Vorlieben anzupassen.
― 7 min Lesedauer
ThReaD verbessert die Leistung von LLMs bei komplexen Aufgaben durch dynamisches Thread-Management.
― 6 min Lesedauer
Dieser Artikel untersucht die Risiken des Fein-Tunings von Sprachmodellen für mehr Sicherheit.
― 4 min Lesedauer
Ein neuer Ansatz verbessert die Vielfalt der Eingabeaufforderungen für sicherere Sprachmodelle.
― 7 min Lesedauer
Forschung zeigt die Herausforderungen bei der Wasserzeichen-Erkennung in grossen Sprachmodellen.
― 8 min Lesedauer
Diese Studie präsentiert ein System, um die Genauigkeit von Sprachmodellen mithilfe von adversarialen Herausforderungen zu verbessern.
― 7 min Lesedauer
Lern, wie adaptive Teams die Aufgabenperformance mit Sprachmodell-Agenten verbessern.
― 7 min Lesedauer
MAP-Neo zielt auf Transparenz und Performance in der KI-Sprachmodellierung ab.
― 5 min Lesedauer
Die Herausforderungen und Lösungen beim Wasserzeichen von LLMs untersuchen, um Missbrauch zu verhindern.
― 6 min Lesedauer
Neue Ressourcen verbessern die Bewertung von koreanischen Sprachmodellen.
― 5 min Lesedauer
Forschung zeigt, dass vielfältige Anweisungen die Leistung von Sprachmodellen bei unbekannten Aufgaben verbessern.
― 7 min Lesedauer
Forschung stellt eine Methode vor, um die Entscheidungsfindung bei Sprachmodell-Agenten zu verbessern.
― 9 min Lesedauer
Diese Studie untersucht, wie LLMs mit dem Reasoning in abstrakten und kontextuellen Szenarien umgehen.
― 5 min Lesedauer
Der Block-Transformator verbessert die Textverarbeitungsgeschwindigkeit und Effizienz in Sprachmodellen.
― 7 min Lesedauer
Neue Tests zeigen, dass LLMs Schwächen im einfachen logischen Denken haben, trotz hoher Benchmark-Ergebnisse.
― 5 min Lesedauer
Ein Leitfaden zur Umwandlung von nicht-idiomatischem Python-Code mit modernen Techniken.
― 6 min Lesedauer
Diese Studie untersucht, wie LLMs mit Veränderungen bei Zusammenfassungsaufgaben umgehen.
― 9 min Lesedauer
Diese Studie untersucht, wie man Sätze erstellt, die bestimmte Bedeutungen mit FrameNet beibehalten.
― 9 min Lesedauer
Diese Studie bewertet die Fähigkeit von GPT-4, Daten aus der Materialwissenschaftsliteratur zu extrahieren.
― 7 min Lesedauer
Jamming-Angriffe können Retrieval-augmented Generation-Systeme stören, indem sie Antworten blockieren.
― 6 min Lesedauer
Dieser Artikel bewertet die Fähigkeit von Sprachmodellen, Spielumgebungen zu simulieren.
― 5 min Lesedauer
Ein neuer Ansatz zur Bewertung von Denkstrategien mit Fokus auf die computergestützten Kosten.
― 7 min Lesedauer
MedExQA setzt einen neuen Standard für die Bewertung von medizinischen Sprachmodellen mit Fokus auf Erklärungen.
― 7 min Lesedauer
Die Studie bewertet, wie gut LLMs über den unmittelbaren Kontext hinaus logisch denken.
― 6 min Lesedauer
Die Grenzen von Direct Preference Optimization beim Training von Sprachmodellen erkunden.
― 7 min Lesedauer