Zyda, un dataset con 1,3 trilioni di token, migliora l'addestramento dei modelli di linguaggio.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Zyda, un dataset con 1,3 trilioni di token, migliora l'addestramento dei modelli di linguaggio.
― 6 leggere min
FineWeb offre 15 trilioni di token per migliorare l'addestramento dei modelli linguistici.
― 7 leggere min
Fibottention migliora l'efficienza nella comprensione visiva delle macchine.
― 4 leggere min
I ricercatori stanno studiando metodi per proteggere informazioni sensibili nei modelli di classificazione del testo.
― 7 leggere min
Nuovo approccio TOKEN migliora la gestione di eventi di guida rari nei veicoli autonomi.
― 8 leggere min
STRIDE prevede in modo efficiente i nomi e i tipi delle variabili persi nel software decompilato.
― 7 leggere min
Le ricerche mostrano che piccole modifiche negli input possono portare a output dannosi nei LLM.
― 6 leggere min
MaskMoE migliora l'apprendimento dei token nei modelli MoE potenziando le prestazioni dei token poco frequenti.
― 6 leggere min
TokenSHAP mostra come le parole influenzano le risposte dei modelli linguistici.
― 7 leggere min
LookupViT migliora i compiti di riconoscimento visivo tramite un'elaborazione efficiente dei token.
― 6 leggere min
ChatQA 2 migliora le prestazioni nella gestione di testi lunghi e compiti di recupero.
― 6 leggere min
Un nuovo modello migliora la comprensione del linguaggio attraverso una rappresentazione dei dati strutturata.
― 6 leggere min
Un approccio economico per analizzare immagini ad alta risoluzione e testo.
― 5 leggere min
MHSSMamba migliora l'accuratezza nell'elaborazione e classificazione delle immagini iperspettrali.
― 5 leggere min
Scopri 500xCompressor, un nuovo metodo per una compressione dei prompt efficace.
― 6 leggere min
Esplorando le sfide di riordinare i token nei grafi.
― 5 leggere min
SAMSA migliora l'efficienza dell'autoattenzione per vari tipi di dati.
― 5 leggere min
Uno studio sui diversi token e i loro modelli nello spazio Web3 in evoluzione.
― 6 leggere min
Lo studio valuta l'originalità nelle immagini generate dall'AI usando la misurazione dei token.
― 7 leggere min
Un nuovo metodo migliora la precisione nel contare oggetti nelle immagini generate.
― 7 leggere min
Questo articolo esamina come la gestione dei token in ColBERT influisca sul ranking dei documenti.
― 5 leggere min
X-Codec migliora la generazione audio integrando la comprensione semantica nel processo.
― 6 leggere min
Questo articolo confronta le rappresentazioni di voce discrete e continue per un riconoscimento vocale efficace.
― 6 leggere min
Un nuovo algoritmo migliora la creazione di fattori alpha per avere migliori intuizioni sugli investimenti.
― 5 leggere min
Esaminando il ruolo dell'attenzione tra i diversi strati nei modelli di linguaggio.
― 5 leggere min
Questo articolo parla dei progressi nella protezione dei contratti smart contro le vulnerabilità e le perdite finanziarie.
― 7 leggere min
Un nuovo metodo per migliorare la risposta dei modelli di linguaggio ai comandi degli utenti.
― 2 leggere min
I modelli recenti migliorano la capacità dell'AI di generare e comprendere diversi media.
― 5 leggere min
SATA migliora la robustezza e l'efficienza dei Vision Transformers per i compiti di classificazione delle immagini.
― 5 leggere min
Esaminando le vulnerabilità nei metodi di watermarking contro attacchi di parafrasi.
― 7 leggere min
RLT riduce il tempo di allenamento per l'AI nel video processing tagliando i token inutili.
― 5 leggere min
Uno sguardo a SuffixDecoding e il suo impatto sull'efficienza dei modelli linguistici.
― 5 leggere min
Esaminando il confine tra articoli scientifici generati da AI e quelli scritti da umani.
― 4 leggere min
MDBPE ottimizza l'elaborazione delle immagini comprimendo i dati visivi in modo efficiente.
― 6 leggere min
Un metodo per migliorare la capacità dei LLM di trattenere dettagli importanti in testi lunghi.
― 6 leggere min
Presentiamo i Long Video Masked Autoencoders per una migliore comprensione dei video.
― 6 leggere min
La quantizzazione fattorizzata migliora la generazione di immagini attraverso una gestione efficiente dei token.
― 5 leggere min
I ricercatori migliorano il rilevamento vocale per ricerche vocali più veloci e precise.
― 6 leggere min
Uno sforzo globale nella formazione dell'IA porta al modello linguistico all'avanguardia INTELLECT-1.
― 5 leggere min
I ricercatori stanno migliorando le prestazioni dei LLM risparmiando risorse.
― 7 leggere min