Uno sguardo al micro-batch clipping e ai suoi vantaggi per l'allenamento dei modelli.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Uno sguardo al micro-batch clipping e ai suoi vantaggi per l'allenamento dei modelli.
― 6 leggere min
Un nuovo metodo per aumentare la robustezza del modello contro attacchi avversari.
― 6 leggere min
Esplorare come i modelli linguistici grandi apprendono dagli esempi in vari contesti.
― 6 leggere min
Esplorando come l'apprendimento multi-task influisca sulle prestazioni e sulla generalizzazione del modello.
― 6 leggere min
Un nuovo approccio semplifica la sicurezza e l'aiuto nella formazione dei modelli linguistici.
― 10 leggere min
Un nuovo metodo semplifica l'allineamento dei modelli linguistici con le preferenze umane.
― 6 leggere min
Uno sguardo a come il transfer learning influisce sulle prestazioni del modello attraverso le leggi di scalabilità.
― 6 leggere min
Esplorare le sfide dell'apprendimento multi-task e continuo nel machine learning.
― 6 leggere min
Questo studio migliora la classificazione delle serie temporali usando tecniche di soft label smoothing per la rappresentazione.
― 5 leggere min
CoRA migliora l'efficienza nell'addestramento di grandi modelli linguistici utilizzando conoscenze condivise.
― 5 leggere min
Un nuovo framework migliora la potatura dei dati concentrandosi su modelli pre-addestrati per compiti molecolari.
― 7 leggere min
Questo articolo esplora l'impatto degli attacchi ai modelli di machine learning e le strategie difensive.
― 7 leggere min
CDSSL migliora la previsione delle proprietà dei materiali attraverso tecniche basate sui dati.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento delle grafici da parte delle macchine per una migliore accessibilità.
― 6 leggere min
RC-FED riduce i costi di comunicazione mantenendo la qualità del modello nell'apprendimento federato.
― 5 leggere min
Y-Drop migliora il dropout concentrandosi sull'importanza dei neuroni, migliorando le prestazioni del modello.
― 6 leggere min
KRDistill migliora la distillazione della conoscenza affrontando problemi di sbilanciamento dei dati.
― 6 leggere min
Esplora l'ascesa e l'impatto dei modelli di fondazione nell'intelligenza artificiale.
― 6 leggere min
Questo articolo esamina i fattori chiave nella qualità dei dataset di preferenze per un migliore addestramento dei modelli di ricompensa.
― 7 leggere min
Quest'articolo mette in evidenza come le variazioni delle etichette influenzano i modelli di machine learning.
― 7 leggere min
Un nuovo metodo migliora la selezione dei dati per l'addestramento dei modelli linguistici.
― 9 leggere min
Un approccio nuovo migliora il potatura dei dati per un training del modello migliore.
― 6 leggere min
Tecniche per bilanciare la distribuzione dei dati nel federated learning per migliorare le prestazioni del modello.
― 5 leggere min
Uno studio rivela che il bias contestuale influisce sulle prestazioni di rilevamento degli oggetti in diversi ambienti.
― 6 leggere min
Un nuovo metodo migliora la stima dell'affinità dei compiti per l'apprendimento multitask.
― 6 leggere min
Un approccio fresco migliora l'addestramento di gruppi di modelli diversi in modo efficiente senza dati OOD separati.
― 6 leggere min
Scopri come la quantizzazione a bassa bit migliora l'efficienza dei grandi modelli linguistici.
― 7 leggere min
Un nuovo approccio migliora il processo di apprendimento tra i modelli di insegnante e studente.
― 7 leggere min
Un nuovo metodo per bilanciare la conoscenza generale e l'adattamento specifico ai compiti nei modelli.
― 7 leggere min
Presentiamo TA-Cleaner, un metodo per migliorare le difese dei modelli multimodali contro il data poisoning.
― 8 leggere min
Questo studio parla di come migliorare l'accuratezza dei modelli per dati sbilanciati usando la correzione logit.
― 7 leggere min
Questo articolo parla di come l'apprendimento composizionale migliora le prestazioni dei modelli in vari compiti.
― 6 leggere min
Un nuovo metodo migliora il trasferimento di conoscenze nei modelli di machine learning.
― 6 leggere min
Questo articolo esamina come la lunghezza dell'allenamento influisce sui tassi di apprendimento nei LLM.
― 6 leggere min
Un nuovo metodo per migliorare la resilienza del Federated Learning contro gli attacchi ai dati.
― 8 leggere min
Un metodo per migliorare le prestazioni del modello nonostante etichette di dati sbagliate.
― 7 leggere min
Questo articolo esplora lo smooth boosting e i suoi vantaggi nell'addestramento dei modelli.
― 6 leggere min
Un nuovo modo per addestrare modelli di intelligenza artificiale rispettando gli standard di sicurezza.
― 7 leggere min
ClassroomKD crea modelli più intelligenti grazie a interazioni dinamiche tra mentori e studenti.
― 7 leggere min
Questo articolo parla dei vantaggi di usare PT-PEFT per modelli di apprendimento automatico intelligenti.
― 7 leggere min