Uno sguardo alle preoccupazioni per la sicurezza dei modelli di linguaggio compressi.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Uno sguardo alle preoccupazioni per la sicurezza dei modelli di linguaggio compressi.
― 6 leggere min
SBoRA migliora il fine-tuning per i modelli di linguaggio grandi, risparmiando risorse e migliorando le prestazioni.
― 5 leggere min
LoRA migliora le prestazioni dei grandi modelli di linguaggio risparmiando risorse.
― 7 leggere min
Un nuovo metodo semplifica la generazione di immagini personalizzate da testo.
― 9 leggere min
Introducendo le matrici Group-and-Shuffle per un fine-tuning efficiente dei modelli neurali.
― 6 leggere min
Un nuovo metodo per migliorare i modelli pre-addestrati usando il fine-tuning selettivo.
― 6 leggere min
Un nuovo framework controlla l'apprendimento in contesto per prevenire abusi nei modelli di intelligenza artificiale.
― 8 leggere min
Un nuovo metodo combina dati video e IMU per migliorare le tecniche di riconoscimento delle azioni.
― 5 leggere min
Un nuovo metodo che migliora le prestazioni del modello attraverso una gestione efficace degli outlier.
― 6 leggere min
Presentiamo l'Adaptazione Random Subspace per un fine-tuning efficiente dei modelli linguistici.
― 6 leggere min
Un progetto incentrato sul miglioramento della generazione di storie in arabo usando modelli avanzati.
― 7 leggere min
Strategie per migliorare i modelli di machine learning con dataset in cambiamento.
― 7 leggere min
I ricercatori sviluppano metodi per migliorare i modelli linguistici per diverse lingue.
― 5 leggere min
WeLore porta efficienza ai modelli di linguaggio grandi semplificando le matrici di pesi.
― 6 leggere min
Questo lavoro studia come l'allenamento influisce sulle previsioni dei grandi modelli di linguaggio.
― 7 leggere min
Lo studio valuta quanto i modelli linguistici siano bravi ad adattarsi nel riassumere argomenti diversi.
― 5 leggere min
Scopri come il transfer learning migliora i risultati dei modelli usando conoscenze da compiti correlati.
― 7 leggere min
Uno studio su quanto bene funzionano i LLM come basi di conoscenza affidabili.
― 5 leggere min
Uno sguardo a come i modelli open-source si confrontano con quelli commerciali nei compiti biomedici.
― 7 leggere min
Esaminando i problemi con i modelli linguistici grandi nel prevedere elementi mancanti in una lista.
― 7 leggere min
Questo documento esamina gli attacchi backdoor e le loro implicazioni sulla sicurezza nell'apprendimento automatico.
― 7 leggere min
Un nuovo metodo migliora il rilevamento degli oggetti nelle immagini di telerilevamento.
― 6 leggere min
La ricerca migliora la capacità dei modelli linguistici di elaborare informazioni temporali nelle tabelle.
― 5 leggere min
Un nuovo metodo migliora come i modelli visione-linguaggio si adattano durante il test.
― 8 leggere min
Un nuovo modo per valutare le prestazioni del modello e la retention delle conoscenze.
― 5 leggere min
Questo studio migliora la misurazione della testa fetale con l'ecografia usando tecniche di deep learning.
― 6 leggere min
Un metodo per migliorare il comportamento dei modelli linguistici contro i risultati dannosi.
― 6 leggere min
Un nuovo metodo migliora l'adattabilità degli agenti RL agli ambienti che cambiano.
― 6 leggere min
pRAGe aiuta a semplificare i termini medici per una migliore comprensione da parte dei pazienti.
― 7 leggere min
Questo studio valuta modelli di machine learning per classificare pagine web tedesche relative alle politiche.
― 9 leggere min
I ricercatori migliorano i modelli PDE neurali usando equazioni pre-addestrate a dimensione inferiore per avere prestazioni migliori.
― 6 leggere min
Esaminando come le reti neurali a credenze profonde possano imparare dai dati e creare rappresentazioni complesse.
― 6 leggere min
La ricerca migliora i sistemi ASR usando modelli linguistici per una maggiore precisione.
― 7 leggere min
XLIP migliora la diagnosi integrando immagini mediche e descrizioni testuali.
― 7 leggere min
Un nuovo metodo migliora i modelli 2D incorporando caratteristiche 3D per una performance migliore.
― 5 leggere min
Questo framework migliora l'accesso e l'efficienza dei modelli AI utilizzando lo sharding ibrido.
― 7 leggere min
MoFO aiuta i grandi modelli di linguaggio a mantenere la conoscenza durante il fine-tuning senza perdere prestazioni.
― 5 leggere min
Nuovi metodi di allenamento migliorano i LLM per suggerimenti di prodotti online più precisi.
― 6 leggere min
Gemma 2 offre alte prestazioni in un formato compatto per compiti linguistici.
― 6 leggere min
Nuovi metodi mirano a migliorare la velocità e l'efficienza dei modelli di deep learning.
― 6 leggere min