Articoli più recenti per Ottimizzazione del modello

Calcolo e linguaggio Aumentare l'efficienza nei modelli linguistici con WGQA

WGQA migliora l'efficienza dei modelli linguistici riducendo al contempo il bisogno di memoria.

2025-07-13T08:11:06+00:00 ― 6 leggere min

Apprendimento automatico Migliorare i Modelli Linguistici Grandi con il Framework LIAR

LIAR offre un modo nuovo per potare i modelli senza doverli riaddestrare, migliorando l'efficienza e le prestazioni.

2025-07-10T20:08:42+00:00 ― 6 leggere min

Apprendimento automatico Avanzare il trasferimento di conoscenza dai GNN agli MLP

Nuovo framework migliora la distillazione della conoscenza concentrandosi sui campioni difficili.

2025-07-09T18:12:24+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare l'efficienza dei modelli linguistici con il framework DDK

DDK migliora la distillazione della conoscenza, rendendo i modelli linguistici più piccoli più efficienti.

2025-07-09T07:32:30+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare i Vision Transformers con Riparazione di Difetti Singolari

SINDER migliora i Vision Transformers affrontando i difetti nell'analisi delle immagini.

2025-07-08T11:55:24+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare i modelli di diffusione con nuovi metodi di quantizzazione

Un nuovo framework migliora l'efficienza dei modelli di diffusione mantenendo la qualità delle immagini.

2025-07-05T23:05:36+00:00 ― 5 leggere min

Apprendimento automatico Migliorare la quantizzazione senza dati per i Vision Transformers

Un nuovo metodo migliora l'accuratezza nella quantizzazione dei Vision Transformers senza dati originali.

2025-07-05T13:05:12+00:00 ― 6 leggere min

Apprendimento automatico Ottimizzatore Filtrato per Momentum: Un Nuovo Approccio per Prevenire il Dimenticare nei LLMs

MoFO aiuta i grandi modelli di linguaggio a mantenere la conoscenza durante il fine-tuning senza perdere prestazioni.

2025-07-05T01:30:00+00:00 ― 5 leggere min

Meccanica statistica Capire i modelli di diffusione nel machine learning

Uno sguardo a come i modelli di diffusione generano dati e i loro usi pratici.

2025-07-04T20:25:52+00:00 ― 5 leggere min

Informatica neurale ed evolutiva Avanzare nella Ricerca di Architetture Neurali con Novità

Un nuovo metodo migliora la ricerca dell'architettura per i modelli di deep learning.

2025-07-04T19:02:54+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare le prestazioni nei modelli di linguaggio sparsi

Un nuovo metodo migliora l'addestramento dei modelli di linguaggio sparsi riducendo al minimo la perdita di prestazioni.

2025-07-04T17:36:00+00:00 ― 8 leggere min

Apprendimento automatico Adattamento a Basso Rango Gerarchico Bayesiano per l'Apprendimento Multi-Compito

Un nuovo metodo migliora l'apprendimento multi-task nei modelli linguistici condividendo conoscenze.

2025-07-04T02:54:28+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Approccio innovativo alla quantizzazione a bassa bit

Un nuovo framework chiamato CoRa migliora le prestazioni del modello durante la quantizzazione a bassa risoluzione.

2025-07-04T00:13:12+00:00 ― 6 leggere min

Calcolo e linguaggio Tecniche efficienti per modelli di linguaggio grandi

Impara metodi per ottimizzare i modelli di linguaggio grandi per migliorare le prestazioni e l'efficienza.

2025-07-01T10:51:48+00:00 ― 8 leggere min

Apprendimento automatico Attenzione Eigen: Un nuovo approccio all'efficienza della memoria nei LLM

Eigen Attention migliora l'efficienza della memoria per i grandi modelli linguistici che elaborano testi lunghi.

2025-06-29T16:43:48+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nei modelli vocali grazie a tecniche di potatura

La ricerca mostra come rendere i modelli di linguaggio più piccoli ed efficienti.

2025-06-29T16:24:35+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Token Compensator: Migliorare l'Efficienza nei Vision Transformers

Un nuovo metodo migliora le prestazioni dei Vision Transformers grazie a una compressione efficace dei token.

2025-06-28T10:50:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Ottimizzare i Vision Transformers per dispositivi mobili

Scopri come PQV-Mobile migliora i ViT per applicazioni mobili efficienti.

2025-06-27T14:41:48+00:00 ― 5 leggere min

Apprendimento automatico Avanzamenti nei modelli di Mixture of Experts con BAM

BAM migliora l'efficienza del MoE integrando i parametri di attenzione e FFN.

2025-06-27T12:35:24+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Comprimere i modelli di visione artificiale per un uso efficiente

Tecniche per ridurre la dimensione dei modelli per un'efficace distribuzione in ambienti a risorse limitate.

2025-06-27T12:19:36+00:00 ― 8 leggere min

Calcolo e linguaggio Migliorare i modelli linguistici con il metodo sparso-denso-sparso

Una nuova tecnica migliora l'efficienza dei modelli di linguaggio pre-addestrati.

2025-06-26T02:29:18+00:00 ― 6 leggere min

Apprendimento automatico Migliorare i modelli di stato-spazio con la conoscenza dei transformer

Usare i Transformers per migliorare i modelli a stati per una maggiore efficienza nel NLP.

2025-06-25T21:52:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare il Few-Shot Learning con gli LVLMs

Scopri strategie per migliorare l'apprendimento con pochi esempi nei grandi modelli di linguaggio visivo.

2025-06-25T11:05:00+00:00 ― 6 leggere min

Apprendimento automatico Modello Centrato sull'Utente per Migliorare le Prestazioni

Un nuovo modo per unire modelli di machine learning basati sulle preferenze degli utenti per risultati migliori.

2025-06-24T18:37:30+00:00 ― 6 leggere min

Calcolo e linguaggio Ridurre le dimensioni dei modelli linguistici mantenendo le prestazioni

Un metodo per ridurre i modelli di linguaggio senza sacrificare l'efficacia tramite potatura e distillazione.

2025-06-24T13:29:24+00:00 ― 5 leggere min

Apprendimento automatico Ottimizzazione delle politiche degli alberi decisionali per l'apprendimento per rinforzo

Un nuovo approccio per migliorare i modelli ad albero decisionale nell'apprendimento per rinforzo.

2025-06-24T08:52:54+00:00 ― 7 leggere min

Apprendimento automatico FISTAPruner: Un Nuovo Approccio per il Potatura dei Modelli

Presentiamo FISTAPruner, un metodo per potare i modelli di linguaggio in modo efficiente mantenendo alta la performance.

2025-06-24T07:31:24+00:00 ― 7 leggere min

Intelligenza artificiale Migliorare la fusione dei modelli con l'allineamento dell'ambito dei pesi

Questo articolo esplora un nuovo metodo per migliorare la fusione dei modelli di machine learning.

2025-06-23T14:26:54+00:00 ― 5 leggere min

Apprendimento automatico Sfide di LLaMA3-70B con quantizzazione a 8 bit

LLaMA3-70B ha problemi unici con la quantizzazione a 8 bit che influiscono sulle sue prestazioni.

2025-06-21T13:51:48+00:00 ― 4 leggere min

Intelligenza artificiale Mescolare Modelli per un Design di Sistema Efficiente

Unisci modelli addestrati per migliorare le prestazioni e ridurre i costi.

2025-06-19T14:51:30+00:00 ― 5 leggere min

Apprendimento automatico Rivoluzionare la compressione dei modelli con tecniche di iper-compressione

Un approccio innovativo per comprimere modelli avanzati in modo efficiente senza perdere prestazioni.

2025-06-19T08:48:06+00:00 ― 6 leggere min

Apprendimento automatico Migliorare le performance del modello attraverso l'ensamble dei pesi

Scopri come nuovi metodi migliorano l'weight-ensembling nel machine learning.

2025-06-18T02:07:24+00:00 ― 5 leggere min

Apprendimento automatico Presentiamo RoLoRA: Un Nuovo Approccio al Federated Fine-Tuning

RoLoRA migliora l'apprendimento federato con un fine-tuning robusto e comunicazione efficiente.

2025-06-18T01:59:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Semplificare i modelli di linguaggio: ridurre la complessità nei transformer

Questo articolo parla dei vantaggi di semplificare i modelli transformer per i compiti di riconoscimento vocale.

2025-06-15T14:45:20+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nei modelli Vision-Language tramite RPP

RPP migliora l'adattamento e la generalizzazione nei modelli Vision-Language usando prompt raffinati.

2025-06-15T05:47:18+00:00 ― 8 leggere min

Apprendimento automatico Migliorare la Privacy nell'Addestramento del Machine Learning

Un nuovo metodo migliora le prestazioni del modello garantendo al contempo la privacy nel deep learning.

2025-06-15T01:37:56+00:00 ― 7 leggere min

Apprendimento automatico ETAGE: Un Nuovo Approccio all'Adattamento al Tempo di Test

ETAGE migliora le prestazioni del modello durante il test con nuovi tipi di dati.

2025-06-12T18:16:30+00:00 ― 5 leggere min

Apprendimento automatico Adattare la regressione del kernel per previsioni migliori

Esaminando come la flessibilità nei modelli migliori l'accuratezza predittiva attraverso aggiustamenti dinamici.

2025-06-11T13:21:12+00:00 ― 8 leggere min

Apprendimento automatico Ridurre l'uso della memoria nei modelli di linguaggio

Una nuova tecnica riduce il fabbisogno di memoria per i grandi modelli di linguaggio mantenendo le prestazioni.

2025-06-11T10:56:18+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Ottimizzare il Remote Sensing con la Distillazione della Conoscenza

Migliorare l'efficienza dei modelli nel remote sensing usando tecniche di distillazione della conoscenza.

2025-06-10T01:37:36+00:00 ― 6 leggere min