Artigos mais recentes para Tokens

Computação e linguagem Apresentando a Zyda: Um Novo Conjunto de Dados para Modelos de Linguagem

Zyda, um conjunto de dados com 1,3 trilhão de tokens, melhora o treinamento de modelos de linguagem.

2025-08-02T07:50:48+00:00 ― 7 min ler

Computação e linguagem Apresentando o FineWeb: Um Novo Conjunto de Dados para Modelos de Linguagem

A FineWeb oferece 15 trilhões de tokens para melhorar o treinamento de modelos de linguagem.

2025-07-24T10:01:12+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando o Aprendizado Visual com Fibottention

Fibottention aumenta a eficiência na compreensão visual por máquinas.

2025-07-23T12:49:18+00:00 ― 5 min ler

Computação e linguagem Proteger Dados Pessoais em Classificação de Texto

Pesquisadores estão explorando maneiras de proteger informações sensíveis em modelos de classificação de texto.

2025-07-21T14:36:24+00:00 ― 8 min ler

Inteligência Artificial Framework TOKEN Melhora o Desempenho de Carros Autônomos

Nova abordagem TOKEN melhora o gerenciamento de eventos raros de direção em veículos autônomos.

2025-07-21T07:14:00+00:00 ― 9 min ler

Criptografia e segurança STRIDE: Um Novo Método para Descompilação

O STRIDE prevê nomes e tipos de variáveis perdidos em softwares decompilados de forma eficiente.

2025-07-21T04:20:12+00:00 ― 8 min ler

Aprendizagem de máquinas Vulnerabilidades em Modelos de Linguagem: Um Olhar Mais Atento

Pesquisas mostram que mudanças simples nos inputs podem levar a resultados prejudiciais em LLMs.

2025-07-20T08:58:54+00:00 ― 7 min ler

Computação e linguagem MaskMoE: Avançando o Aprendizado em Modelos de Mistura de Especialistas

MaskMoE melhora o aprendizado de tokens em modelos MoE ao aumentar o desempenho de tokens pouco frequentes.

2025-07-14T01:02:18+00:00 ― 7 min ler

Computação e linguagem TokenSHAP: Uma Nova Ferramenta para Interpretabilidade de Modelos de Linguagem

TokenSHAP mostra como as palavras impactam as respostas dos modelos de linguagem.

2025-07-13T17:55:42+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Apresentando o LookupViT: Um Novo Método para Processamento Visual

O LookupViT melhora as tarefas de reconhecimento visual através de um processamento de tokens eficiente.

2025-07-11T20:53:54+00:00 ― 7 min ler

Computação e linguagem Avanços em Modelos de Linguagem Grandes para Textos Longos

O ChatQA 2 melhora o desempenho ao processar textos longos e em tarefas de recuperação.

2025-07-10T10:32:00+00:00 ― 7 min ler

Computação e linguagem Avanços em Modelos de Processamento de Linguagem

Um novo modelo melhora a compreensão da linguagem através da representação de dados estruturados.

2025-07-06T18:19:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando Modelos de Visão-Linguagem de Alta Resolução

Uma abordagem econômica para analisar imagens de alta resolução e texto.

2025-07-05T16:14:48+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços na Classificação de Imagens Hiperespectrais

MHSSMamba melhora a precisão no processamento e classificação de imagens hiperespectrais.

2025-07-03T04:20:18+00:00 ― 6 min ler

Computação e linguagem Introdução ao 500xCompressor: Avançando na Compressão de Prompt

Conheça o 500xCompressor, um novo método para compressão eficaz de prompts.

2025-07-01T10:04:24+00:00 ― 7 min ler

Estruturas de dados e algoritmos Token Jumping na Teoria dos Grafos

Explorando os desafios de rearranjar tokens em grafos.

2025-06-30T14:51:00+00:00 ― 6 min ler

Aprendizagem de máquinas Apresentando o SAMSA: Um Modelo de Auto-Atenção Eficiente

O SAMSA melhora a eficiência de autoatenção para vários tipos de dados.

2025-06-30T04:34:48+00:00 ― 6 min ler

Finanças estatísticas Analisando o Comportamento de Tokens nas Finanças Web3

Um estudo sobre diferentes tokens e seus padrões no espaço em evolução do Web3.

2025-06-29T02:00:39+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando a Originalidade em Modelos de Texto para Imagem

O estudo avalia a originalidade em imagens geradas por IA usando medição de token.

2025-06-27T10:36:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Contagem de Objetos na Geração de Imagens

Um novo método melhora a precisão na contagem de objetos em imagens geradas.

2025-06-24T10:59:18+00:00 ― 8 min ler

Recuperação de informação Otimizando Pontuações de Documentos com Tokens ColBERT

Este artigo analisa como a gestão de tokens no ColBERT afeta a classificação de documentos.

2025-06-22T21:04:06+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Áudio: Apresentando o X-Codec

X-Codec melhora a geração de áudio ao integrar compreensão semântica no processamento.

2025-06-21T15:41:45+00:00 ― 6 min ler

Computação e linguagem Comparando Métodos de Representação de Fala em Sistemas de Reconhecimento

Esse artigo compara representações de fala discretas e contínuas para um reconhecimento de fala eficaz.

2025-06-19T00:14:36+00:00 ― 6 min ler

Finanças computacionais Avançando Fatores Alpha com o Algoritmo QFR

Um novo algoritmo melhora a criação de fatores alpha para insights de investimento mais legais.

2025-06-16T17:21:27+00:00 ― 6 min ler

Computação e linguagem Reavaliando a Atenção em Modelos de Linguagem

Examinando o papel da atenção em diferentes camadas nos modelos de linguagem.

2025-06-16T15:45:30+00:00 ― 5 min ler

Criptografia e segurança Novas Estratégias para Proteger Contratos Inteligentes de Ataques

Este artigo fala sobre os avanços na proteção de contratos inteligentes contra vulnerabilidades e perdas financeiras.

2025-06-14T02:16:12+00:00 ― 7 min ler

Computação e linguagem Melhorando o Seguimento de Instruções em LLMs com GUIDE

Um novo método pra melhorar a resposta de modelos de linguagem grande às instruções dos usuários.

2025-06-09T17:35:42+00:00 ― 2 min ler

Visão computacional e reconhecimento de padrões Novos Modelos Transformando a IA Multimodal

Modelos recentes melhoram a capacidade da IA de gerar e entender vários tipos de mídia.

2025-06-04T08:49:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Aprimorando Transformadores de Visão com Análise Espacial

O SATA melhora a robustez e a eficiência dos Transformers de Visão para tarefas de classificação de imagens.

2025-06-03T14:47:12+00:00 ― 5 min ler

Criptografia e segurança Desafios na Marcação de Texto Gerado por IA

Analisando vulnerabilidades em métodos de marca d'água contra ataques de parafraseamento.

2025-05-28T23:21:45+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Tokenização por Comprimento de Execução: Acelerando o Aprendizado de Vídeo

RLT reduz o tempo de treino pra IA em processamento de vídeo cortando tokens desnecessários.

2025-05-28T20:58:12+00:00 ― 6 min ler

Computação e linguagem Decodificação de Sufixos: Acelerando Modelos de Linguagem

Um olhar sobre SuffixDecoding e seu impacto na eficiência de modelos de linguagem.

2025-05-28T14:13:39+00:00 ― 6 min ler

Computação e linguagem IA vs Humano: O Desafio da Escrita

Analisando a linha entre artigos científicos gerados por IA e escritos por humanos.

2025-05-26T01:45:45+00:00 ― 4 min ler

Visão computacional e reconhecimento de padrões Entendendo a Codificação de Par de Bytes Multidimensional

MDBPE otimiza o processamento de imagens comprimindo os dados visuais de forma eficiente.

2025-05-22T12:56:15+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando o Processamento de Textos Longos em Modelos de Linguagem

Um método pra melhorar a retenção de detalhes importantes nos LLMs em textos longos.

2025-05-19T01:05:20+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Máscaras de Autoencoders para Vídeos Longos: Uma Nova Abordagem

Apresentando Autoencoders Máscara de Vídeo Longo pra uma melhor compreensão de vídeo.

2025-05-16T19:28:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Tokenização Visual com Quantização Fatorizada

A quantização fatorada melhora a geração de imagens através de uma gestão eficiente de tokens.

2025-05-09T02:57:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Busca por Voz com o Método BEST-STD

Pesquisadores melhoram a detecção de fala pra buscas por voz mais rápidas e precisas.

2025-05-03T22:26:26+00:00 ― 6 min ler

Computação distribuída, paralela e em cluster INTELLECT-1: Uma Nova Era na Colaboração de IA

Um esforço global em treinamento de IA resulta no modelo de linguagem de ponta INTELLECT-1.

2025-04-22T15:41:00+00:00 ― 6 min ler

Computação e linguagem Aumentando a Eficiência em Modelos de Linguagem Grande

Pesquisadores estão melhorando o desempenho dos LLMs enquanto economizam recursos.

2025-04-19T03:39:09+00:00 ― 8 min ler