Tianyi Zhou

Rechnen und Sprache Verbesserung von Sprachmodellen durch das Zusammenführen von vortrainierten Adaptern

MerA vorstellen, um die Effizienz beim Training von Sprachmodellen zu steigern.

2025-10-02T12:35:18+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Adaptive Datenaugmentation für Machine Learning

MADAug verbessert die Datenaugmentation, indem es Techniken an die Bedürfnisse des Modells während des Trainings anpasst.

2025-09-28T19:58:36+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Anpassungsfähige Agenten: Morphologie und Umwelt Co-Evolution im Reinforcement Learning

Eine neue Methode ermöglicht es RL-Agenten, ihre Körperformen zu verändern, um sich besser an Aufgaben anzupassen.

2025-09-23T16:36:18+00:00 ― 8 min Lesedauer

Rechnen und Sprache NLPBench: Bewertung grosser Sprachmodelle

Ein neuer Datensatz zur Bewertung von LLMs bei Fragen zur Verarbeitung natürlicher Sprache.

2025-09-21T02:51:12+00:00 ― 7 min Lesedauer

Maschinelles Lernen Belohnungshacking in der KI-Trainings ansprechen

Die Herausforderungen und Lösungen beim Reward Hacking im Training von KI-Modellen erkunden.

2025-09-09T06:58:48+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der Text-zu-Bild-Generierung mit MuLan

MuLan verbessert die Bildgenerierung aus Text, indem es Aufgaben in einfachere Schritte unterteilt.

2025-09-05T20:49:12+00:00 ― 6 min Lesedauer

Rechnen und Sprache Revolutionierung von Satz-Embeddings mit Meta-Task-Prompting

Neue Methode verbessert Satzembeddings mit mehreren Prompts für bessere Genauigkeit.

2025-09-03T07:12:00+00:00 ― 6 min Lesedauer

Maschinelles Lernen Grosse Sprachmodelle und mathematisches Denken

Untersuchung der Fähigkeiten von LLMs, mathematische Probleme zu lösen, besonders bei modularer Arithmetik.

2025-09-01T14:38:32+00:00 ― 8 min Lesedauer

Maschinelles Lernen Transformers: Sensitivitätsbias im maschinellen Lernen

Untersuchung, wie Transformer Funktionen mit niedriger Empfindlichkeit bevorzugen, um die Leistung zu verbessern.

2025-08-22T07:38:48+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte im föderierten Lernen mit MAM

Eine neue Methode zur Verbesserung des föderierten Lernens durch Multi-Level Additive Modellierung.

2025-08-06T17:42:24+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Trigger-Patches in Diffusionsmodellen analysieren

Forschung zeigt, wie Trigger-Patches die Bildgenerierung in Diffusionsmodellen beeinflussen.

2025-08-02T07:35:00+00:00 ― 7 min Lesedauer

Maschinelles Lernen Wie grosse Sprachmodelle mit Addition umgehen

Erforsche, wie LLMs Addition mit einzigartigen mathematischen Techniken durchführen.

2025-08-02T01:47:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der mehrsprachigen Fähigkeiten in Sprachmodellen

Eine neue Methode verbessert Sprachmodelle, indem sie Wissen über verschiedene Sprachen hinweg integriert.

2025-07-26T11:23:42+00:00 ― 7 min Lesedauer

Künstliche Intelligenz Mischung aus Aufforderungen: Ein neuer Ansatz für das Aufgabenmanagement

Diese Methode verbessert die Erstellung von Prompts für grosse Sprachmodelle und steigert die Gesamtleistung.

2025-07-08T14:33:04+00:00 ― 6 min Lesedauer

Rechnen und Sprache Dynamisches Aktionsframework für KI-Agenten

Ein neues Framework ermöglicht es KI-Agenten, Aktionen dynamisch zu erstellen, um besser Probleme zu lösen.

2025-06-01T04:11:42+00:00 ― 10 min Lesedauer

Rechnen und Sprache SpecHub: Ein schnellerer Weg für Sprachmodelle

SpecHub beschleunigt die Texterstellung von Sprachmodellen mit einem neuen Ansatz.

2025-05-29T00:13:57+00:00 ― 6 min Lesedauer

Ton Feindliche Audioangriffe: Eine neue Herausforderung für Sprachmodelle

Untersuchen, wie Audio-Tricks Sprachmodelle verwirren.

2025-05-01T13:19:34+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Die Revolution der KI: Vision trifft auf Sprache

Florence-2 und DBFusion verändern, wie Maschinen Bilder und Text interpretieren.

2025-04-11T23:06:54+00:00 ― 8 min Lesedauer