Neuste Artikel für Natursprachverarbeitung

Rechnen und Sprache Training von grossen Sprachmodellen verbessern

Ein neuer Ansatz verbessert den Trainingsprozess von grossen Sprachmodellen.

2025-08-09T15:21:30+00:00 ― 6 min Lesedauer

Maschinelles Lernen Echtzeitgespräche mit Sprachmodellen verbessern

Eine neue Methode verbessert Chats, indem sie Dialoge in Echtzeit simuliert.

2025-08-09T15:13:36+00:00 ― 6 min Lesedauer

Maschinelles Lernen Die Verbesserung der Effizienz von Sprachmodellen durch Cross-Layer-Attention

Cross-Layer Attention verringert den Speicherbedarf, während die Leistung des Modells bei der Sprachverarbeitung erhalten bleibt.

2025-08-09T13:23:00+00:00 ― 7 min Lesedauer

Rechnen und Sprache Vergleich von kausalen und maskierten Sprachmodellen in der Textgenerierung

Diese Studie untersucht die Leistung von CLM und MLM bei der Textgenerierung.

2025-08-09T10:05:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Das Messen von Emergenz in grossen Sprachmodellen

Eine neue Methode erforschen, um das Entstehen in Sprachmodellen zu verstehen.

2025-08-09T09:57:36+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung der Faktenprüfung durch Selbstanleitung und Feinabstimmung

Eine neue Methode verbessert die Genauigkeit und Klarheit von Faktenchecks.

2025-08-09T09:49:42+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der Schaltungsentdeckung in Sprachmodellen

Eine neue Methode verbessert die Identifizierung von Schaltkreisen in grossen Sprachmodellen.

2025-08-09T09:18:06+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Methoden zur sicheren Anpassung von Sprachmodellen

Innovative Modellbearbeitungstechniken bieten sicherere Ausgaben von Sprachmodellen, ohne umfangreiches Retraining.

2025-08-09T03:14:42+00:00 ― 6 min Lesedauer

Künstliche Intelligenz ReEvaluating ReAct: Ein genauerer Blick auf Prompt-Engineering

Diese Studie hinterfragt die Wirksamkeit von ReAct bei der Verbesserung der LLM-Leistung.

2025-08-09T03:06:48+00:00 ― 6 min Lesedauer

Maschinelles Lernen Vorstellung von Aaren: Ein neuer Ansatz für Aufmerksamkeit in neuronalen Netzen

Aaren verbessert die Effizienz in auf Aufmerksamkeit basierenden Modellen für die Analyse von sequenziellen Daten.

2025-08-09T02:51:00+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Innovative Methode für das Verständnis von Videos mit textueller Darstellung

Ein neuer Ansatz bringt Sprachmodelle mit Videoinhalten in Einklang, indem er textuelle Simulationen verwendet.

2025-08-09T01:39:54+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Die Verbesserung des Denkens von LLMs mit Wissensgraphen

Eine neue Methode kombiniert LLMs und KGs für verbesserte Schlussfolgerungsgenauigkeit.

2025-08-09T01:24:06+00:00 ― 6 min Lesedauer

Maschinelles Lernen Analyse von Schaltungen in Transformator-Modellen für bessere Leistung

Dieser Artikel untersucht Schaltanalysentechniken in Transformator-Modellen für eine verbesserte Sprachverarbeitung.

2025-08-09T01:16:12+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von Geschichten mit Sprachmodellen

Untersuchen, wie Sprachmodelle fesselnde Erzählungen bewerten und generieren.

2025-08-08T23:25:36+00:00 ― 8 min Lesedauer

Rechnen und Sprache Ansprechen der Alignment-Steuer bei Sprachmodellen

Ein neues Framework reduziert Datenverzerrungen und verbessert die Leistung von Sprachmodellen beim Befolgen von Anweisungen.

2025-08-08T19:20:42+00:00 ― 8 min Lesedauer

Maschinelles Lernen Einsatz von grossen Sprachmodellen zur Belohnungsformung im Reinforcement Learning

Diese Arbeit untersucht die Rolle von LLMs bei der Verbesserung von Reinforcement Learning durch Reward Shaping.

2025-08-08T16:19:00+00:00 ― 8 min Lesedauer

Software-Entwicklung OptLLM: Auswahl von LLMs für kosteneffiziente Leistung einfacher gemacht

OptLLM hilft Nutzern, die besten LLMs für Budgets und Aufgaben auszuwählen.

2025-08-08T15:07:54+00:00 ― 7 min Lesedauer

Rechnen und Sprache Die Verbesserung von Dialogsystemen durch das Bewusstsein für Gesprächsverläufe

Diese Forschung hebt hervor, dass es eine bessere Bewertung der Nutzung von Gesprächsverläufen in Dialogsystemen braucht.

2025-08-08T14:28:24+00:00 ― 6 min Lesedauer

Genomik LangCell: Eine neue Methode zur Analyse von Zellen

LangCell kombiniert Zell-Daten und natürliche Sprache für bessere Zell-Analyse.

2025-08-08T14:23:45+00:00 ― 7 min Lesedauer

Rechnen und Sprache Die Weiterentwicklung des Verständnisses gesprochener Sprache mit CCL

Eine neue Methode verbessert, wie Systeme mit Fehlern im Verständnis von gesprochener Sprache umgehen.

2025-08-08T14:20:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Any-Granularity Ranking: Ein neuer Ansatz zur Informationsbeschaffung

Dieser Artikel spricht über eine flexible Bewertungsmethode, die Multi-Vektor-Embedding nutzt, um bessere Suchergebnisse zu erzielen.

2025-08-08T13:25:12+00:00 ― 7 min Lesedauer

Rechnen und Sprache Herausforderungen und Strategien bei der Bewertung von Sprachmodellen

Dieser Artikel behandelt Probleme und Best Practices zur Bewertung von Sprachmodellen.

2025-08-08T10:07:42+00:00 ― 7 min Lesedauer

Maschinelles Lernen Einführung von AGILE: Ein neues Framework für LLM-Agenten

AGILE verbessert LLM-Agenten mit Gedächtnis, Expertenrat und Echtzeit-Tools.

2025-08-08T09:20:18+00:00 ― 8 min Lesedauer

Rechnen und Sprache Kontextadaptive Positionskodierung für Transformer

Eine neue Methode, um Transformator-Modelle mit anpassbaren Positionierungstechniken zu verbessern.

2025-08-08T08:48:42+00:00 ― 6 min Lesedauer

Maschinelles Lernen Implizites In-Context-Lernen: Ein neuer Ansatz für Sprachmodelle

I2CL verbessert die Effizienz und Leistung bei Aufgaben mit Sprachmodellen.

2025-08-08T07:45:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von NLG-Evaluation mit dem AdvEval-Rahmenwerk

AdvEval zeigt Schwächen in den Bewertungsmetriken für die natürliche Sprachgenerierung auf.

2025-08-08T07:29:42+00:00 ― 6 min Lesedauer

Informationsbeschaffung Dokumentenranking mit Top-Down-Partitionierung verbessern

Eine neue Methode verbessert die Effizienz bei der Dokumentenbewertung.

2025-08-08T06:26:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neues Framework bekämpft Halluzinationen in Sprachmodellen

Ein Rahmen, um falsche Behauptungen in Sprachmodellen besser zu erkennen.

2025-08-08T04:43:48+00:00 ― 4 min Lesedauer

Rechnen und Sprache Abfrage-Neuschreibung mit Ranking-Feedback verbessern

Eine neue Methode, um die Abfrageumformulierung ohne beschriftete Daten zu verbessern.

2025-08-08T03:40:36+00:00 ― 5 min Lesedauer

Rechnen und Sprache Aktivierungs-Spitzen bei der LLM-Quantisierung angehen

Neue Methoden verbessern die Modellleistung während der Quantisierung in Sprachmodellen.

2025-08-08T03:32:42+00:00 ― 7 min Lesedauer

Rechnen und Sprache Die Grenzen von Sprachmodellen verstehen

Forscher untersuchen die Herausforderungen, mit denen LLMs bei mehrdeutigen Fragen konfrontiert sind.

2025-08-08T02:37:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache MiniCache: Verbesserung von KV-Caching in Sprachmodellen

Eine neue Methode, um die Speicherauslastung in Sprachmodellen zu verbessern.

2025-08-08T02:13:42+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der ASR: Ein neuer Lernansatz

Eine zweistufige aktive Lernmethode verbessert die Spracherkennungsgenauigkeit mit weniger Daten.

2025-08-08T02:09:55+00:00 ― 5 min Lesedauer

Rechnen und Sprache EHR-SeqSQL: Medizinische Datenzugriffe neu gestalten

Ein Datensatz, der das Abfragen von elektronischen Gesundheitsakten durch natürliche Sprache vereinfacht.

2025-08-07T22:56:12+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte bei universellen Transformatoren: MoEUT

MoEUT verbessert die Effizienz und Leistung von Universal Transformers bei Sprachaufgaben.

2025-08-07T20:49:48+00:00 ― 6 min Lesedauer

Rechnen und Sprache Ansprechen von Schwachstellen in grossen Sprachmodellen

Eine Studie zur Verbesserung der Robustheit gegen Angriffe in Sprachmodellen.

2025-08-07T20:26:06+00:00 ― 7 min Lesedauer

Maschinelles Lernen Die Rolle der geometrischen Komplexität im Transferlernen

Untersuchen, wie geometrische Komplexität die Modellleistung beim Transferlernen beeinflusst.

2025-08-07T18:11:48+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Halluzinationen in Vision-Language-Modellen angehen

Dieser Artikel behandelt Halluzinationen in LVLMs und schlägt Methoden vor, um sie anzugehen.

2025-08-07T17:48:06+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Segmentierung von verallgemeinerten Bezugsausdrücken

Das HDC-Framework verbessert die Objekterkennung, indem es Sprachbeschreibungen in Bildern nutzt.

2025-08-07T17:24:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Ein neuer Ansatz zur Ausrichtung von Sprachmodellen

Vorstellung von Alignment aus Demonstrationen für sichere und effektive Sprachmodelle.

2025-08-07T16:44:54+00:00 ― 10 min Lesedauer