Articoli più recenti per Quantizzazione

Informatica distribuita, parallela e in cluster Rendere i modelli di linguaggio grandi più piccoli

Scopri come la compressione dei modelli migliora l'efficienza dei grandi modelli linguistici.

2025-06-17T20:35:36+00:00 ― 5 leggere min

Apprendimento automatico OPAL: Un Nuovo Approccio per Modelli di Linguaggio Efficienti

Un metodo per migliorare l'efficienza e le prestazioni dei modelli di linguaggio.

2025-06-16T21:56:48+00:00 ― 6 leggere min

Apprendimento automatico Tecniche di compressione efficiente delle reti neurali

Nuovi metodi migliorano le prestazioni delle reti neurali su dispositivi con risorse limitate.

2025-06-16T14:18:36+00:00 ― 6 leggere min

Apprendimento automatico Federated Learning a Vincolo di Rate: Un Nuovo Approccio per un Allenamento Efficiente dei Modelli

RC-FED riduce i costi di comunicazione mantenendo la qualità del modello nell'apprendimento federato.

2025-06-15T02:36:35+00:00 ― 5 leggere min

Apprendimento automatico Efficienza nei Reti Neurali Quantizzate

Questo studio analizza le prestazioni e le condizioni per le reti neurali quantizzate sotto aritmetica a punto fisso.

2025-06-12T03:32:20+00:00 ― 6 leggere min

Sistemi e controllo Comunicazione Efficiente nell'Ottimizzazione Distribuita

Un nuovo algoritmo migliora il coordinamento tra i nodi sotto limiti di comunicazione.

2025-06-09T13:09:41+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli DilateQuant: Un Nuovo Modo per Ottimizzare i Modelli di Diffusione

Questo articolo parla di DilateQuant per migliorare la velocità e l'accuratezza dei modelli di diffusione.

2025-06-07T22:48:12+00:00 ― 7 leggere min

Apprendimento automatico AXE: Un Framework per una Quantizzazione Post-Addestramento Efficiente

AXE migliora le prestazioni del modello riducendo al minimo il sovraccarico nella quantizzazione consapevole degli accumulatori.

2025-06-05T23:16:18+00:00 ― 5 leggere min

Intelligenza artificiale Migliorare il supporto agli studenti con un chatbot educativo

Un nuovo chatbot aiuta gli studenti con le domande a scelta multipla di STEM.

2025-06-05T16:41:18+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Introducendo P4Q: Un Nuovo Metodo per Modelli Visivo-Linguistici

P4Q combina il fine-tuning e la quantizzazione per performance efficienti dei modelli visivi-linguistici.

2025-06-04T18:02:30+00:00 ― 5 leggere min

Architettura hardware Progressi nella Quantizzazione a Potenza di Due per le DNN

Ottimizzare le DNN con quantizzazione a potenza di due per dispositivi con risorse limitate.

2025-06-03T05:42:06+00:00 ― 5 leggere min

Calcolo e linguaggio Il futuro della compressione nei modelli di linguaggio grandi

Metodi innovativi puntano a rendere i modelli di linguaggio grandi più efficienti e utilizzabili.

2025-06-02T22:35:30+00:00 ― 5 leggere min

Apprendimento automatico Reti Neurali a 1 Bit: Un Nuovo Approccio

I modelli a 1 bit mostrano un grande potenziale nell'efficienza e nelle prestazioni del machine learning.

2025-06-01T02:36:54+00:00 ― 6 leggere min

Apprendimento automatico Sicurezza dei chatbot e trucchi furbi

Scopri come piccole modifiche possono ingannare i chatbot e farli rispondere in modo inaspettato.

2025-05-31T21:44:36+00:00 ― 6 leggere min

Apprendimento automatico Rendere i modelli di linguaggio grandi più piccoli e veloci

Scopri la quantizzazione e il suo impatto sui modelli di linguaggio.

2025-05-31T14:53:48+00:00 ― 6 leggere min

Apprendimento automatico Capire la precisione nell'addestramento dei modelli di linguaggio

La precisione influisce sull'efficacia e sul costo della formazione dei modelli linguistici.

2025-05-29T19:22:21+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Capire l'equilibrio dei modelli di deep learning

Esaminare come la semplificazione dei modelli influisce sulla chiarezza delle decisioni e sulle performance.

2025-05-29T01:32:15+00:00 ― 6 leggere min

Architettura hardware MicroScopiQ: Un Passo Avanti nell'Efficienza dell'IA

MicroScopiQ migliora le performance dei modelli di intelligenza artificiale consumando meno energia.

2025-05-28T23:34:48+00:00 ― 5 leggere min

Crittografia e sicurezza QuanCrypt-FL: Un Approccio Sicuro al Federated Learning

QuanCrypt-FL migliora la sicurezza nel Federated Learning utilizzando tecniche avanzate.

2025-05-28T22:29:33+00:00 ― 6 leggere min

Basi di dati Migliorare le ricerche ad alta dimensione con un nuovo approccio

Un nuovo metodo migliora le ricerche AKNN per maggiore velocità e precisione.

2025-05-26T23:04:39+00:00 ― 5 leggere min

Apprendimento automatico Rendere i modelli linguistici grandi più piccoli e veloci

Scopri come la quantizzazione aiuta a ottimizzare i modelli di linguaggio grandi per un uso quotidiano.

2025-05-26T20:28:03+00:00 ― 5 leggere min

Calcolo e linguaggio L'impatto dei super pesi nei modelli linguistici

I super pesi sono fondamentali per le prestazioni e l'efficienza dei modelli linguistici.

2025-05-25T21:11:42+00:00 ― 5 leggere min

Calcolo e linguaggio I Rischi dei Modelli Linguistici Potenti

Questo studio esamina come i grandi modelli linguistici possano comportarsi male e essere manipolati.

2025-05-25T12:42:45+00:00 ― 5 leggere min

Apprendimento automatico Un nuovo approccio alle sfide della quantizzazione

ASER offre un modo per migliorare i modelli di linguaggio quantizzati senza perdere prestazioni.

2025-05-24T23:00:36+00:00 ― 5 leggere min

Architettura di rete e Internet Rendere l'IA Accessibile sui Dispositivi Mobili

Strategie innovative per far girare AI avanzata sui dispositivi mobili.

2025-05-24T17:08:15+00:00 ― 8 leggere min

Apprendimento automatico Rendere i modelli AI più piccoli con ZipNN

ZipNN comprime i modelli AI in modo efficiente, mantenendo intatti i dettagli essenziali.

2025-05-24T04:43:51+00:00 ― 5 leggere min

Ingegneria del software Sfide e intuizioni sui piccoli modelli linguistici per la programmazione

I LLM più piccoli possono essere utili ma hanno problemi di qualità nella generazione di codice.

2025-05-22T23:09:36+00:00 ― 5 leggere min

Apprendimento automatico Avanzamenti nella velocità dell'IA con l'attenzione a 4 bit

Un nuovo metodo accelera l'elaborazione dell'IA senza perdere precisione.

2025-05-21T20:37:30+00:00 ― 5 leggere min

Apprendimento automatico Rendendo più snelli i Neural Network con training a interi sotto gli 8 bit

Scopri come ShiftQuant e la normalizzazione L1 migliorano l'efficienza delle reti neurali.

2025-05-21T19:45:18+00:00 ― 4 leggere min

Informatica distribuita, parallela e in cluster Llama Guard: Il tuo compagno per la sicurezza in chat

Tieni al sicuro le conversazioni con l'AI in movimento con Llama Guard.

2025-05-20T23:31:39+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Rendere i grandi modelli più piccoli: un nuovo approccio

Le tecniche di compressione dei modelli permettono ai modelli pesanti di girare senza problemi su dispositivi più piccoli.

2025-05-17T17:25:20+00:00 ― 6 leggere min

Apprendimento automatico Ottimizzare i modelli linguistici con AutoMixQ

Un nuovo metodo per ottimizzare i grandi modelli linguistici in modo efficiente.

2025-05-17T03:54:40+00:00 ― 7 leggere min

Architettura hardware Avanzamenti nelle Reti Neurali Spiking con Architettura Ibrida

Uno studio che mostra un'architettura ibrida per migliorare le prestazioni delle SNN e l'efficienza energetica.

2025-05-13T10:24:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Rendere i modelli di diffusione più accessibili tramite il potatura

La ricerca mostra come comprimere i modelli di diffusione mantenendo la qualità.

2025-05-12T22:34:40+00:00 ― 6 leggere min

Architettura hardware Anda: Trasformare la Precisione di Attivazione nei Grandi Modelli Linguistici

Scopri Anda, un nuovo metodo per gestire i dati di attivazione nei LLM.

2025-05-10T14:25:20+00:00 ― 7 leggere min

Ottimizzazione e controllo Apprendimento per rinforzo: Migliorare la comunicazione e il controllo delle macchine

Scopri come l'apprendimento per rinforzo migliora la comunicazione e il processo decisionale delle macchine.

2025-05-07T10:33:04+00:00 ― 6 leggere min

Fisica delle alte energie - Lattice Capire i hadroni tramite la QCD su reticolo

Uno sguardo agli adroni e alle loro interazioni usando la cromodinamica quantistica su reticolo.

2025-05-05T07:04:16+00:00 ― 5 leggere min

Apprendimento automatico Semplificare i Dati delle Serie Temporali con QABBA

QABBA semplifica l'analisi dei dati delle serie temporali per avere intuizioni più chiare.

2025-04-30T17:25:41+00:00 ― 5 leggere min

Apprendimento automatico Navigare nel Deep Learning: Efficienza e Chiarezza si Incontrano

Scopri come i modelli di IA possono essere veloci e facili da capire.

2025-04-09T10:07:30+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Il Futuro della Compressione Senza Perdite

Scopri come la compressione senza perdita sta cambiando il modo di archiviare e gestire i dati.

2025-03-30T07:46:12+00:00 ― 7 leggere min