Zyda, um conjunto de dados com 1,3 trilhão de tokens, melhora o treinamento de modelos de linguagem.
― 7 min ler
Ciência de ponta explicada de forma simples
Zyda, um conjunto de dados com 1,3 trilhão de tokens, melhora o treinamento de modelos de linguagem.
― 7 min ler
A FineWeb oferece 15 trilhões de tokens para melhorar o treinamento de modelos de linguagem.
― 8 min ler
Fibottention aumenta a eficiência na compreensão visual por máquinas.
― 5 min ler
Pesquisadores estão explorando maneiras de proteger informações sensíveis em modelos de classificação de texto.
― 8 min ler
Nova abordagem TOKEN melhora o gerenciamento de eventos raros de direção em veículos autônomos.
― 9 min ler
O STRIDE prevê nomes e tipos de variáveis perdidos em softwares decompilados de forma eficiente.
― 8 min ler
Pesquisas mostram que mudanças simples nos inputs podem levar a resultados prejudiciais em LLMs.
― 7 min ler
MaskMoE melhora o aprendizado de tokens em modelos MoE ao aumentar o desempenho de tokens pouco frequentes.
― 7 min ler
TokenSHAP mostra como as palavras impactam as respostas dos modelos de linguagem.
― 8 min ler
O LookupViT melhora as tarefas de reconhecimento visual através de um processamento de tokens eficiente.
― 7 min ler
O ChatQA 2 melhora o desempenho ao processar textos longos e em tarefas de recuperação.
― 7 min ler
Um novo modelo melhora a compreensão da linguagem através da representação de dados estruturados.
― 7 min ler
Uma abordagem econômica para analisar imagens de alta resolução e texto.
― 5 min ler
MHSSMamba melhora a precisão no processamento e classificação de imagens hiperespectrais.
― 6 min ler
Conheça o 500xCompressor, um novo método para compressão eficaz de prompts.
― 7 min ler
Explorando os desafios de rearranjar tokens em grafos.
― 6 min ler
O SAMSA melhora a eficiência de autoatenção para vários tipos de dados.
― 6 min ler
Um estudo sobre diferentes tokens e seus padrões no espaço em evolução do Web3.
― 7 min ler
O estudo avalia a originalidade em imagens geradas por IA usando medição de token.
― 8 min ler
Um novo método melhora a precisão na contagem de objetos em imagens geradas.
― 8 min ler
Este artigo analisa como a gestão de tokens no ColBERT afeta a classificação de documentos.
― 5 min ler
X-Codec melhora a geração de áudio ao integrar compreensão semântica no processamento.
― 6 min ler
Esse artigo compara representações de fala discretas e contínuas para um reconhecimento de fala eficaz.
― 6 min ler
Um novo algoritmo melhora a criação de fatores alpha para insights de investimento mais legais.
― 6 min ler
Examinando o papel da atenção em diferentes camadas nos modelos de linguagem.
― 5 min ler
Este artigo fala sobre os avanços na proteção de contratos inteligentes contra vulnerabilidades e perdas financeiras.
― 7 min ler
Um novo método pra melhorar a resposta de modelos de linguagem grande às instruções dos usuários.
― 2 min ler
Modelos recentes melhoram a capacidade da IA de gerar e entender vários tipos de mídia.
― 6 min ler
O SATA melhora a robustez e a eficiência dos Transformers de Visão para tarefas de classificação de imagens.
― 5 min ler
Analisando vulnerabilidades em métodos de marca d'água contra ataques de parafraseamento.
― 8 min ler
RLT reduz o tempo de treino pra IA em processamento de vídeo cortando tokens desnecessários.
― 6 min ler
Um olhar sobre SuffixDecoding e seu impacto na eficiência de modelos de linguagem.
― 6 min ler
Analisando a linha entre artigos científicos gerados por IA e escritos por humanos.
― 4 min ler
MDBPE otimiza o processamento de imagens comprimindo os dados visuais de forma eficiente.
― 6 min ler
Um método pra melhorar a retenção de detalhes importantes nos LLMs em textos longos.
― 6 min ler
Apresentando Autoencoders Máscara de Vídeo Longo pra uma melhor compreensão de vídeo.
― 7 min ler
A quantização fatorada melhora a geração de imagens através de uma gestão eficiente de tokens.
― 6 min ler
Pesquisadores melhoram a detecção de fala pra buscas por voz mais rápidas e precisas.
― 6 min ler
Um esforço global em treinamento de IA resulta no modelo de linguagem de ponta INTELLECT-1.
― 6 min ler
Pesquisadores estão melhorando o desempenho dos LLMs enquanto economizam recursos.
― 8 min ler