Lerne, wie du die Grösse von BERT reduzieren kannst, während du die Leistung durch Wissensdistillation beibehältst.
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Lerne, wie du die Grösse von BERT reduzieren kannst, während du die Leistung durch Wissensdistillation beibehältst.
― 5 min Lesedauer
Eine neue Methode verbessert die Zuschreibung und Richtigkeit der Ausgaben von Sprachmodellen.
― 4 min Lesedauer
Ein neuer Ansatz, um Dialogagenten durch Rollenspiel und Simulation zu verstehen.
― 19 min Lesedauer
Dieser Artikel analysiert die Fähigkeiten von GPT-4 bei abstrakten Denkaufgaben und den Einfluss der Objektdarstellung.
― 6 min Lesedauer
Ein Werkzeug, um die Multi-Step-Denkfähigkeiten von grossen Sprachmodellen zu bewerten.
― 6 min Lesedauer
Diese Forschung zeigt, wie Folgerung und Selbsttraining Sprachmodelle verbessern, ohne dass menschlich beschriftete Daten nötig sind.
― 6 min Lesedauer
Eine eingehende Analyse der Fähigkeiten von ChatGPT bei verschiedenen Aufgaben und Herausforderungen.
― 6 min Lesedauer
In diesem Artikel wird untersucht, wie Sprachmodelle die strategische Denkweise von KI in Spielen verbessern.
― 6 min Lesedauer
Forschung untersucht das Verständnis von Syntax in sprachlichen Modellen mit verschiedenen Methoden.
― 6 min Lesedauer
Wir stellen TopEx vor, einen frischen Ansatz, um die Unterschiede zwischen Sprachmodellen zu verstehen.
― 6 min Lesedauer
Wir stellen ein französisches Modell vor, das führende Benchmarks mit weniger Daten übertrifft.
― 6 min Lesedauer
Methoden erkunden, um die Sicherheit persönlicher Informationen in Sprachmodellen zu gewährleisten.
― 6 min Lesedauer
Eine Studie zur Leistung von Auto-GPT bei Entscheidungsfindungsaufgaben.
― 6 min Lesedauer
LexGPT soll Juristen dabei helfen, rechtliche Texte zu verstehen und zu erstellen.
― 5 min Lesedauer
Dieses Papier untersucht, wie Sprachmodelle die Projektplanung und -ausführung optimieren.
― 6 min Lesedauer
Diese Studie hebt hervor, wie wichtig es ist, non-binäre Pronomen in Sprachmodellen besser anzuerkennen.
― 7 min Lesedauer
Eine neue Methode verbessert die Genauigkeit des Denkens in Sprachmodellen mit strukturierten Eingabeaufforderungen.
― 8 min Lesedauer
WOGLI konzentriert sich auf die Auswirkungen der Wortstellung auf die Inferenz in der deutschen Sprache.
― 6 min Lesedauer
PandaLM automatisiert Bewertungsprozesse, um die Befolgung von Anweisungen bei grossen Sprachmodellen zu verbessern.
― 6 min Lesedauer
ToolAlpaca hat das Ziel, kleineren Modellen zu helfen, effektiv zu lernen, wie man reale Werkzeuge nutzt.
― 6 min Lesedauer
Lern, wie RETA-LLM Sprachmodelle und Abrufsysteme kombiniert, um bessere Antworten zu liefern.
― 6 min Lesedauer
Dieser Artikel befasst sich damit, wie man SVG nutzen kann, um die Bildinterpretation von Sprachmodellen zu verbessern.
― 5 min Lesedauer
TrojLLM erstellt versteckte Aufforderungen, um die Ausgaben grosser Sprachmodelle zu manipulieren.
― 4 min Lesedauer
Ein neues Modell, das entwickelt wurde, um rumänische Tweets mit fortschrittlicher Technologie zu analysieren.
― 6 min Lesedauer
Untersuchung von prompt-basierten Methoden zur Verbesserung von Sprachmodellen bei der Recherche von Datenabrufen.
― 7 min Lesedauer
Grössere Sprachmodelle können bei bestimmten Aufgaben schlecht abschneiden, was wichtige Fragen in der KI-Forschung aufwirft.
― 5 min Lesedauer
Eine neue Methode verbessert die Kontrolle über die Textgenerierung in Sprachmodellen.
― 5 min Lesedauer
Strategien zur Steigerung der Effizienz von ChatGPT bei verschiedenen Sprachaufgaben.
― 6 min Lesedauer
Neuer Datensatz zeigt AI-Performance bei kreativen Aufgaben mit Ablenkungen.
― 6 min Lesedauer
Ein neuer Ansatz, um die Qualität von generierten Texten in grossen Sprachmodellen zu bewerten.
― 6 min Lesedauer
Untersuchen, wie KI menschliches Denken und ihre Vorurteile behandelt.
― 6 min Lesedauer
Eine neue Methode verbessert Spracherkennungsmodelle, indem sie nur Textdaten für die Anpassung nutzt.
― 5 min Lesedauer
Eine Studie zur Wirksamkeit von Sprachmodellen zur Grammatikverbesserung im Brasilianischen Portugiesisch.
― 6 min Lesedauer
Dieser Artikel bewertet, wie Sprachmodelle verschiedene globale Meinungen widerspiegeln.
― 8 min Lesedauer
Eine Studie darüber, wie gut fortgeschrittene Modelle bei Aufgaben in der arabischen Sprache abschneiden.
― 7 min Lesedauer
Die Bewertung der Leistung von grossen Sprachmodellen bei der Beantwortung von biomedizinischen Fragen durch BioASQ.
― 7 min Lesedauer
Eine Studie zur Bewertung der Textgenerierungsqualität von grossen Sprachmodellen.
― 6 min Lesedauer
Studie zeigt, wie gut Modelle mit Paraphrasierung in Textentailment-Aufgaben umgehen.
― 7 min Lesedauer
Ein neuer Massstab soll Sprachmodelle für die Kommunikation in sozialen Medien verbessern.
― 8 min Lesedauer
BLUEX bietet eine umfangreiche Ressource, um Sprachmodelle in Portugiesisch mithilfe von Prüfungsfragen zu bewerten.
― 7 min Lesedauer