Articoli più recenti per Ottimizzazione del modello

Calcolo e linguaggio Migliorare i Modelli di Linguaggio di Grandi Dimensioni con MRPO

Un nuovo metodo migliora l'allineamento dei modelli linguistici usando più riferimenti.

2025-08-07T06:20:48+00:00 ― 7 leggere min

Apprendimento automatico Avanzamenti nel Layer Pruning per modelli di Deep Learning

Una nuova tecnica di potatura dei layer migliora l'efficienza e la precisione dei modelli.

2025-08-06T06:54:36+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il Fine-Tuning con la Tuning dei Prompt Consapevole delle Istruzioni

Un nuovo metodo migliora il fine-tuning dei grandi modelli di linguaggio per una maggiore efficienza.

2025-08-05T10:38:00+00:00 ― 6 leggere min

Apprendimento automatico Avanzamenti nell'apprendimento online con OEBEs

Questo documento parla di Ensemi Online di Espansioni di Base per migliorare l'apprendimento automatico.

2025-08-05T02:35:48+00:00 ― 6 leggere min

Apprendimento automatico Migliorare l'apprendimento federato con FedMR per dati parzialmente disgiunti

FedMR affronta le sfide nell'apprendimento federato con dati di classi parziali, migliorando le prestazioni del modello.

2025-08-04T19:53:12+00:00 ― 6 leggere min

Apprendimento automatico Ottimizzazione Efficiente con il Metodo ETHER

ETHER introduce un modo economico per ottimizzare grandi modelli di machine learning.

2025-08-04T17:46:48+00:00 ― 7 leggere min

Apprendimento automatico Ottimizzazione del training sparso con inizializzazione ortogonale esatta

Un nuovo metodo migliora i modelli di deep learning efficienti attraverso l'ortogonalità esatta.

2025-08-03T06:05:54+00:00 ― 6 leggere min

Apprendimento automatico Migliorare il Machine Learning con Tecniche di Apprendimento Ausiliarie

Nuovi metodi migliorano le prestazioni del compito principale usando dati ausiliari senza costi di calcolo extra.

2025-08-03T01:21:52+00:00 ― 6 leggere min

Apprendimento automatico Normalizzazione a Livello e il Suo Impatto sulle Reti Neurali

Questo articolo esamina il ruolo della normalizzazione dei layer nel migliorare la classificazione delle reti neurali.

2025-08-03T00:10:24+00:00 ― 6 leggere min

Apprendimento automatico Avanzamenti nelle metriche di potatura per modelli di linguaggio grandi

Un nuovo framework migliora i metodi di potatura per i modelli di linguaggio grandi senza doverli riaddestrare.

2025-08-01T18:48:42+00:00 ― 6 leggere min

Apprendimento automatico La sfida della saturazione nella regressione a cresta del kernel

Esaminando l'effetto di saturazione nella Regressione Kernel Ridge e le sue implicazioni per le previsioni.

2025-08-01T03:28:12+00:00 ― 5 leggere min

Apprendimento automatico Transformers più piccoli: Innovazioni nella compressione dei modelli

Il metodo VTrans riduce significativamente le dimensioni dei modelli transformer senza compromettere le prestazioni.

2025-08-01T02:05:24+00:00 ― 5 leggere min

Calcolo e linguaggio Metodi di affinamento efficienti per modelli multimodali

Uno studio rivela tecniche efficaci per migliorare i modelli di linguaggio multimodali di grandi dimensioni.

2025-08-01T00:14:48+00:00 ― 6 leggere min

Calcolo e linguaggio Un Approccio Flessibile alla Personalizzazione dei Modelli Linguistici

Nuovi modelli adattabili possono soddisfare esigenze diverse senza riqualificazione.

2025-07-31T06:44:06+00:00 ― 8 leggere min

Apprendimento automatico Migliorare la regressione dei processi gaussiani: un approccio a due fasi

Un framework per migliorare le previsioni e le misure di incertezza della regressione dei processi gaussiani.

2025-07-29T10:23:00+00:00 ― 6 leggere min

Apprendimento automatico Avanzamenti nelle Tecniche di Generalizzazione del Dominio

Nuovi metodi migliorano i modelli di machine learning in diversi ambienti.

2025-07-28T15:40:00+00:00 ― 7 leggere min

Informatica distribuita, parallela e in cluster Ottimizzare la compressione degli adattatori LoRA per i modelli linguistici

La ricerca delinea tecniche per migliorare l'efficienza nel servire gli adattatori LoRA.

2025-07-28T03:17:24+00:00 ― 6 leggere min

Apprendimento automatico Introducendo gli Sparse High Rank Adapters (SHiRA)

SHiRA migliora l'efficienza nel passare da un modello all'altro nell'IA senza perdere concetti chiave.

2025-07-27T09:54:36+00:00 ― 5 leggere min

Intelligenza artificiale PruningBench: Un Nuovo Benchmark per i Metodi di Potatura Strutturale

PruningBench offre un modo standardizzato per valutare i metodi di potatura, migliorando l'efficienza dei modelli nel machine learning.

2025-07-27T00:33:42+00:00 ― 7 leggere min

Apprendimento automatico Dinamiche di Attenzione nei Modelli Transformer

Esaminare il comportamento di attenzione insolito nei modelli Transformer.

2025-07-24T04:29:24+00:00 ― 5 leggere min

Calcolo e linguaggio L'impatto della fusione dei modelli nell'IA

La fusione dei modelli unisce diversi modelli di intelligenza artificiale per migliorare le prestazioni in vari compiti.

2025-07-22T12:59:24+00:00 ― 6 leggere min

Apprendimento automatico Migliorare l'ottimizzazione degli iperparametri con algoritmi genetici

Scopri come gli algoritmi genetici possono migliorare la sintonizzazione degli iperparametri nei modelli di machine learning.

2025-07-22T02:11:36+00:00 ― 5 leggere min

Apprendimento automatico Migliorare la Capacità del Modello nel Fine-Tuning

Un nuovo framework migliora l'efficienza delle performance dei modelli grandi durante il fine-tuning.

2025-07-21T14:04:48+00:00 ― 6 leggere min

Apprendimento automatico Tuning Proxy Coerente: Un Nuovo Modo per Modelli Black-box

CPT migliora le prestazioni dei modelli black-box senza accesso diretto ai parametri interni.

2025-07-21T11:03:06+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo M IST: Un Nuovo Approccio alla Comprensione delle Espressioni di Riferimento

M IST migliora l'interazione tra modelli visivi e linguistici per una performance migliore.

2025-07-21T10:39:24+00:00 ― 6 leggere min

Apprendimento automatico Insights su Gradient Descent e Regressione Logistica

Scopri come la dimensione del passo influisce sul gradient descent nella regressione logistica.

2025-07-19T10:30:24+00:00 ― 7 leggere min

Ottimizzazione e controllo Avanzare nel Machine Learning con la Minimizzazione Continua della Somma Finità

Un nuovo metodo migliora l'accuratezza e l'efficienza del modello in ambienti di dati fluttuanti.

2025-07-19T06:34:27+00:00 ― 6 leggere min

Apprendimento automatico ISQuant: Un cambiamento di gioco nella compressione dei modelli

ISQuant offre un nuovo approccio alla quantizzazione per un'implementazione efficiente dei modelli.

2025-07-19T00:03:54+00:00 ― 5 leggere min

Apprendimento automatico Ottimizzare le prestazioni di VQ-VAE tramite quantizzazione dinamica adattiva

Scopri come la quantizzazione dinamica adattiva migliora i modelli VQ-VAE per una migliore rappresentazione dei dati.

2025-07-18T23:24:24+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Semplificare il Deep Learning: Il Caso per il Potatura Isomorfica

Un metodo per migliorare l'efficienza dei modelli nel machine learning tramite strategie di potatura efficaci.

2025-07-18T17:21:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Progressi nei Vision Transformers con Ottimizzazione Condivisa

Nuovo framework migliora l'efficienza dei Vision Transformers mantenendo la precisione.

2025-07-18T04:42:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la classificazione delle immagini con guida topologica

Un nuovo metodo migliora la classificazione delle immagini usando l'analisi topologica dei dati e la distillazione della conoscenza.

2025-07-17T20:48:36+00:00 ― 6 leggere min

Apprendimento automatico Progressi nell'apprendimento continuo attraverso la fusione dei modelli

Nuovi metodi migliorano l'apprendimento continuo e l'adattabilità dei grandi modelli pre-addestrati.

2025-07-17T13:42:00+00:00 ― 6 leggere min

Apprendimento automatico Migliorare i modelli pre-addestrati attraverso l’aritmetica dei compiti

Un nuovo metodo per migliorare i modelli pre-addestrati usando il fine-tuning selettivo.

2025-07-16T19:00:12+00:00 ― 6 leggere min

Calcolo e linguaggio Ripensare i modelli Transformer: un nuovo approccio

Un'architettura modello flessibile che migliora l'efficienza e le prestazioni del Transformer.

2025-07-16T10:42:30+00:00 ― 5 leggere min

Calcolo e linguaggio Gestione Efficiente della Memoria nei Modelli Mixture-of-Experts

Nuovi metodi riducono l'uso della memoria mantenendo le prestazioni nei LLM.

2025-07-14T15:47:06+00:00 ― 6 leggere min

Apprendimento automatico Ottimizzare l'Aumento dei Dati per l'Apprendimento delle Serie Temporali

Un nuovo metodo per scegliere le augmentation dei dati migliora le prestazioni del modello sui compiti di serie temporali.

2025-07-14T12:37:30+00:00 ― 7 leggere min

Apprendimento automatico Ottimizzare i modelli di linguaggio grandi con potatura strutturale

Presentiamo un nuovo metodo per migliorare l'efficienza nei grandi modelli di linguaggio attraverso il potenziamento.

2025-07-14T09:04:08+00:00 ― 6 leggere min

Apprendimento automatico Regolazioni Dinamiche nel Training del Machine Learning

Esaminando metodi dinamici per ottimizzare l'addestramento dei modelli di machine learning.

2025-07-14T05:32:26+00:00 ― 6 leggere min

Apprendimento automatico LeanQuant: Un Nuovo Approccio alla Quantizzazione dei Modelli

LeanQuant migliora la dimensione e la qualità del modello grazie a tecniche di quantizzazione avanzate.

2025-07-14T03:48:12+00:00 ― 5 leggere min