Neuste Artikel für Modelloptimierung

Computer Vision und Mustererkennung Verbesserung der Generalisierung in Vision-Language-Modellen mit OGEN

OGEN verbessert die Fähigkeit von Vision-Language-Modellen, neue Klassen effektiv zu erkennen.

2025-09-13T12:21:48+00:00 ― 7 min Lesedauer

Maschinelles Lernen Verbesserung von grossen Sprachmodellen für breitere Nutzung

Dieser Artikel bespricht Techniken, um die Effizienz und Leistung von grossen Sprachmodellen zu verbessern.

2025-09-12T03:58:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Effizienzsteigerung bei Sprachmodellen durch spekulatives Decoding

Eine Methode, um grosse Sprachmodelle schneller zu machen, ohne die Output-Qualität zu opfern.

2025-09-12T02:47:18+00:00 ― 7 min Lesedauer

Maschinelles Lernen DE-BERT: Ein neuer Ansatz für frühes Beenden in Sprachmodellen

Hier ist DE-BERT, ein Framework, das die Effizienz von Sprachmodellen durch frühes Aussteigen verbessert.

2025-09-11T23:06:06+00:00 ― 7 min Lesedauer

Rechnen und Sprache Gewinnende Tickets in mehrsprachigen Sprachmodellen identifizieren

Eine Methode, um Sprachmodelle mit weniger Parametern anzupassen.

2025-09-10T23:08:18+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte bei Quantisierungstechniken für Machine-Learning-Modelle

Lerne, wie neue Techniken die Effizienz von grossen Machine-Learning-Modellen verbessern.

2025-09-10T13:31:36+00:00 ― 4 min Lesedauer

Rechnen und Sprache Eine neue Methode für effizientes Prompt-Tuning

Wir stellen BMTPT für verbessertes Prompt-Tuning in Sprachmodellen vor.

2025-09-08T14:55:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Neue Methode SLEB verbessert die Effizienz von grossen Sprachmodellen

SLEB macht LLMs schneller und effizienter, indem überflüssige Transformer-Blöcke entfernt werden.

2025-09-07T23:54:24+00:00 ― 7 min Lesedauer

Rechnen und Sprache LoRETTA: Eine neue Methode zum Feinabstimmen von Sprachmodellen

LoRETTA verbessert die Feinabstimmungseffizienz für grosse Sprachmodelle mit weniger Parametern.

2025-09-07T03:29:54+00:00 ― 6 min Lesedauer

Rechnen und Sprache Speicherbedarf bei Sprachmodellen reduzieren

Ein neuer Ansatz, um Sprachmodelle kleiner und schneller zu machen, indem man 1-Bit-Quantisierung verwendet.

2025-09-07T02:26:42+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung des In-Context-Lernens mit Einflussanalyse

Eine neue Methode zur Auswahl von Demonstrationen verbessert die Modellleistung bei Sprachaufgaben.

2025-09-06T21:02:48+00:00 ― 8 min Lesedauer

Maschinelles Lernen Die Vereinfachung von KI-Ausrichtung mit REINFORCE und RLOO

Neue Methoden versprechen bessere KI-Modell-Leistungen durch vereinfachtes Reinforcement Learning.

2025-09-05T04:29:36+00:00 ― 6 min Lesedauer

Maschinelles Lernen Effizienz von grossen Sprachmodellen verbessern

Neue Quantisierungsmethode verbessert die Leistung von grossen Sprachmodellen und verringert gleichzeitig die Grösse.

2025-09-04T18:21:18+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der Quantisierungsmethoden für Deep Learning Modelle

Neue Techniken verbessern die Quantisierung und gehen mit Ausreissern um, um die Modellleistung zu steigern.

2025-09-04T10:03:36+00:00 ― 5 min Lesedauer

Maschinelles Lernen Feinabstimmung grosser Modelle mit Low-Rank-Anpassung

Eine Studie über effiziente Methoden zur Feinabstimmung grosser Modelle durch Low-Rank-Anpassung.

2025-09-04T03:44:24+00:00 ― 5 min Lesedauer

Maschinelles Lernen Die Verbesserung der Bildgenerierung aus Textbeschreibungen

Eine neue Methode verbessert die Genauigkeit der Bilderzeugung mit Hilfe von Vision-Language-Modellen.

2025-09-03T22:44:12+00:00 ― 5 min Lesedauer

Maschinelles Lernen Fortschritte in Meta-Verstärkendes Lernen Techniken

Neue Methoden erkunden, um die Entscheidungsfindung bei Lernagenten zu verbessern.

2025-09-01T03:03:36+00:00 ― 8 min Lesedauer

Maschinelles Lernen Die Verbindung zwischen Flachheit und Verallgemeinerung im maschinellen Lernen

Forschung zeigt, wie flache Minima mit besserer Modellleistung bei unbekannten Daten zusammenhängen.

2025-08-31T11:56:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache PipeRAG: Verbesserung der retrieval-unterstützten Generierung

Eine neue Methode, um RAG schneller zu machen und die Qualität zu verbessern.

2025-08-31T07:26:30+00:00 ― 7 min Lesedauer

Maschinelles Lernen Verbesserung der Domänen-Geneeralisierung mit UDIM

Ein neuer Ansatz verbessert die Modellleistung über verschiedene Datentypen hinweg.

2025-08-29T23:58:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Die Balance zwischen Effizienz und Robustheit in Deep Learning Modellen

Untersuchung von Modellen zur Kompression, um die Effizienz zu steigern und Angriffe zu bekämpfen.

2025-08-29T09:53:06+00:00 ― 8 min Lesedauer

Maschinelles Lernen Die Effizienz von föderiertem Lernen mit FedMef steigern

FedMef verbessert federiertes Lernen für ressourcenschwache Geräte durch innovative Pruning-Techniken.

2025-08-27T06:24:12+00:00 ― 7 min Lesedauer

Maschinelles Lernen Maschinenlernen mit MetaOptimize verbessern

MetaOptimize verbessert die Modellleistung, indem es die Lernparameter dynamisch anpasst.

2025-08-25T12:07:32+00:00 ― 7 min Lesedauer

Maschinelles Lernen Fortschritte beim Feinabstimmen von Machine Learning-Modellen

Eine neue Methode für effizientes Modell-Tuning vorstellen.

2025-08-25T05:08:04+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Optimierung von Convolutional Neural Networks mit RL Pruning

Eine neue Methode nutzt Reinforcement Learning, um CNNs während des Trainings zu optimieren.

2025-08-24T16:15:24+00:00 ― 8 min Lesedauer

Maschinelles Lernen Effizienzsteigerung in Low-Precision-Neuronalen Netzwerken

In diesem Papier geht's um die Kosten und Verbesserungen von Niedrigpräzisions-Neuronalen Netzwerken.

2025-08-24T09:16:42+00:00 ― 4 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Anpassungsmethoden für maschinelles Lernen

Die allgemeine Diffusionsanpassung verbessert die Modellleistung bei Proben, die ausserhalb der Verteilung liegen.

2025-08-24T09:08:48+00:00 ― 7 min Lesedauer

Maschinelles Lernen Umgang mit unvollständigen Daten mit Variational Autoencoders

Strategien zur Verbesserung von variationalen Autoencodern im Umgang mit unvollständigen Datensätzen.

2025-08-23T21:11:48+00:00 ― 6 min Lesedauer

Rechnen und Sprache Multilingual Gehirnchirurg: Ein neuer Ansatz zur Modellkompression

Eine Methode, um die Leistung von Sprachmodellen während der Kompression über verschiedene Sprachen hinweg zu verbessern.

2025-08-21T23:52:18+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Ein neuer Ansatz zum Beschneiden von Vision-Language-Modellen

Eine Methode zum aufgabenunabhängigen Kürzen von komplexen Modellen vorstellen.

2025-08-21T10:34:24+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Verbesserung von MLLMs mit übertragbarem visuellen Prompting

Eine neue Methode verbessert multimodale Modelle mit gemeinsamen visuellen Aufforderungen.

2025-08-18T16:04:54+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Einführung in kontrastive Wissensdistillation

Eine neue Methode, um die Leistung von Modellen in der KI durch Wissensübertragung zu verbessern.

2025-08-17T10:27:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache Aufgabenwahl für Instruction Tuning vereinfachen

Eine neue Methode, InsTa, verbessert die Aufgabenwahl beim Anpassen von Anweisungen.

2025-08-16T09:10:36+00:00 ― 8 min Lesedauer

Maschinelles Lernen Grosse Sprachmodelle bewerten: Grösse und Präzision zählen

Diese Studie bewertet, wie sich die Modellgrösse und Quantisierung auf die Leistung von Sprachmodellen auswirken.

2025-08-13T18:22:18+00:00 ― 7 min Lesedauer

Maschinelles Lernen Optimierung grosser Sprachmodelle mit Student-Float-Format

Neue Techniken verbessern die Effizienz und Genauigkeit bei grossen Sprachmodellen.

2025-08-13T15:36:24+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der Bildgenerierung mit LoRA-Bedingung

Die Diffusionsmodelle verbessern, indem man LoRA zu den Aufmerksamkeits-Schichten hinzufügt, um bessere Bilder zu bekommen.

2025-08-13T14:56:54+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Effiziente Modellentwicklung mit differenzierbarem Modell-Skalieren

Eine neue Methode, um Modellstrukturen effektiver und effizienter zu verbessern.

2025-08-11T15:56:36+00:00 ― 6 min Lesedauer

Kryptographie und Sicherheit Sicherheitsrisiken bei quantisierten Deep Learning Modellen angehen

Dieses Papier präsentiert EFRAP, eine Verteidigung gegen quantisierungsbedingte Hintertürenangriffe in Deep-Learning-Modellen.

2025-08-09T11:32:24+00:00 ― 7 min Lesedauer

Maschinelles Lernen Verbesserung des Fine-Tunings mit Spektralanpassung

Eine neue Methode verbessert das Feintuning grosser Modelle mit Hilfe von spektralen Informationen.

2025-08-09T02:35:12+00:00 ― 5 min Lesedauer

Maschinelles Lernen Effiziente Anpassung grosser KI-Modelle

Eine Methode, die Low-Rank- und orthogonale Anpassungen für KI-Modelle kombiniert.

2025-08-07T20:57:42+00:00 ― 5 min Lesedauer