Artigos mais recentes para Modelos de Linguagem

Computação e linguagem Novos Codificadores de Sentenças para a Língua Portuguesa

Apresentando modelos feitos pra melhorar o processamento de linguagem natural em português.

2025-07-05T22:10:18+00:00 ― 7 min ler

Computação e linguagem Aumentando a Eficiência na Criação de Prompts

Aprenda como a engenharia de prompt ativa melhora as tarefas para modelos de linguagem.

2025-07-05T19:48:06+00:00 ― 5 min ler

Computação e linguagem Otimizando o Tamanho dos Blocos para Respostas de IA Mais Legais

Este artigo analisa como o tamanho dos blocos afeta as respostas geradas por IA.

2025-07-05T08:28:42+00:00 ― 6 min ler

Computação e linguagem Novo Método para Detectar Dados de Pré-treinamento em Modelos de Linguagem

Uma nova abordagem destaca tokens surpreendentes para avaliar os dados de treinamento dos modelos de linguagem.

2025-07-05T05:19:06+00:00 ― 7 min ler

Computação e linguagem Melhorando Modelos de Linguagem em Italiano para Contextos Legais e Burocráticos

Esse estudo analisa métodos pra melhorar modelos de linguagem em italiano em áreas especializadas.

2025-07-04T18:55:00+00:00 ― 10 min ler

Aprendizagem de máquinas Fortalecendo a Segurança em LLMs de Peso Aberto

Um novo método melhora a resistência a manipulações em modelos de linguagem de peso aberto.

2025-07-03T22:14:42+00:00 ― 8 min ler

Computação e linguagem Melhorando Pequenos Modelos de Linguagem com Técnicas de Ajuste Fino

Melhorando modelos de linguagem menores como o MiniCPM com práticas de fine-tuning eficazes.

2025-07-03T20:24:06+00:00 ― 7 min ler

Computação e linguagem Avaliando o Raciocínio Espacial em Modelos de Linguagem

O benchmark avalia a capacidade de modelos de linguagem grandes de entender relações espaciais.

2025-07-02T22:09:00+00:00 ― 5 min ler

Criptografia e segurança Identificando Modelos de Linguagem Grande Através de Características Únicas

Um novo método analisa modelos de linguagem examinando suas características específicas.

2025-07-02T06:36:48+00:00 ― 5 min ler

Computação e linguagem Impacto das Restrições de Formato no Desempenho de LLM

Esse artigo analisa como a geração estruturada afeta o raciocínio e a compreensão dos modelos de linguagem.

2025-07-02T00:09:42+00:00 ― 6 min ler

Computação e linguagem OpenFactCheck: Uma Nova Ferramenta para Checar Fatos em LLMs

OpenFactCheck oferece uma estrutura pra avaliar a precisão das saídas de modelos de linguagem.

2025-07-01T18:14:12+00:00 ― 7 min ler

Computação e linguagem Abordando o preconceito em modelos de linguagem com BiasKE e FAST

Métodos inovadores para aumentar a justiça em modelos de linguagem grandes.

2025-07-01T07:42:12+00:00 ― 8 min ler

Computação e linguagem Avançando Dados Sintéticos para Modelos de Linguagem

Um novo método melhora a qualidade dos dados sintéticos pra alinhar melhor os modelos de linguagem.

2025-06-30T13:24:06+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Palavras-Chave Contextuais

Um novo sistema melhora o reconhecimento de fala usando palavras-chave contextuais pra ter mais precisão.

2025-06-29T22:53:15+00:00 ― 6 min ler

Inteligência Artificial SAGE-RT: Um Novo Método para a Segurança de Modelos de Linguagem

A SAGE-RT cria dados sintéticos pra melhorar as avaliações de segurança de modelos de linguagem.

2025-06-28T06:37:42+00:00 ― 6 min ler

Computação e linguagem Novo Benchmark Avalia Conhecimento Jurídico em Modelos de Linguagem em Árabe

ArabLegalEval avalia o desempenho dos LLMs em lidar com informações legais em árabe.

2025-06-27T05:52:30+00:00 ― 7 min ler

Computação e linguagem Avaliando Modelos de Linguagem com Vários LLMs

Um novo método pra avaliar os resultados de modelos de linguagem usando vários juízes LLM.

2025-06-26T14:28:12+00:00 ― 8 min ler

Computação e linguagem Avaliação de Agentes de Modelos de Linguagem em Pesquisa Científica

Um novo benchmark avalia agentes de modelos de linguagem para lidar com análise de dados científicos.

2025-06-26T10:47:00+00:00 ― 9 min ler

Computação e linguagem Melhorando Pequenos Modelos de Linguagem em Telecomunicações

Novos métodos melhoram a precisão de modelos pequenos em perguntas e respostas de telecomunicações.

2025-06-25T02:31:30+00:00 ― 6 min ler

Computação e linguagem Abordando Conflitos de Conhecimento em LLMs com o ConflictBank

O ConflictBank oferece insights sobre conflitos de conhecimento em modelos de linguagem.

2025-06-24T17:42:12+00:00 ― 6 min ler

Computação e linguagem O Impacto da Decoreba na Aprendizagem em Contexto

Este artigo explora o papel da memorização em melhorar o desempenho do ICL.

2025-06-24T07:18:06+00:00 ― 7 min ler

Computação e linguagem Novo Modelo de Embedding de Texto para a Língua Russa

Apresentando um novo modelo e referência para processamento de texto em russo.

2025-06-23T18:55:30+00:00 ― 6 min ler

Inteligência Artificial Avaliando Métricas de Modelos de Linguagem: Um Mergulho Profundo

Pesquisadores avaliam a confiabilidade das métricas para a segurança de modelos de linguagem.

2025-06-23T14:50:36+00:00 ― 7 min ler

Computação e linguagem O Impacto da Previsão do Próximo Token em Modelos de Linguagem

Uma análise aprofundada de como a previsão do próximo token molda a compreensão de linguagem nos modelos.

2025-06-21T16:14:00+00:00 ― 7 min ler

Computação distribuída, paralela e em cluster Treinamento Eficiente de Modelos de Linguagem de Longo Contexto Usando FPDT

FPDT oferece uma solução pra treinar LLMs de contexto longo de forma mais eficiente.

2025-06-20T12:35:00+00:00 ― 6 min ler

Computação e linguagem MemLong: Transformando Modelos de Linguagem para Textos Longos

MemLong melhora a capacidade dos modelos de linguagem de lidar com textos longos de forma eficaz.

2025-06-20T12:19:12+00:00 ― 7 min ler

Computadores e sociedade Gerando Redes Sociais Usando Modelos de Linguagem

Esse artigo analisa como os modelos de linguagem criam redes sociais realistas e seus preconceitos.

2025-06-20T06:31:36+00:00 ― 7 min ler

Computação e linguagem Melhorando o Raciocínio da IA com Auto-Crítica

Este artigo fala sobre uma nova estrutura pra melhorar o raciocínio em modelos de IA.

2025-06-20T01:31:24+00:00 ― 6 min ler

Computação e linguagem Uma Nova Maneira de Medir Criatividade

Apresentando uma estrutura pra gerar itens de teste de criatividade usando modelos de linguagem.

2025-06-19T19:43:48+00:00 ― 6 min ler

Computação e linguagem Melhorando o Manuseio de Textos Longos em LLMs com a YOURA

Um novo método melhora o processamento de textos longos em modelos de linguagem pra dar respostas melhores.

2025-06-18T05:17:00+00:00 ― 5 min ler

Computação e linguagem Avaliando Geração de Texto Longo em LLMs

O LongGenBench avalia modelos de linguagem grandes na geração de textos longos de alta qualidade.

2025-06-17T21:54:36+00:00 ― 7 min ler

Computação e linguagem A Importância Contínua da Geração Aumentada por Recuperação

RAG continua sendo essencial pra otimizar as respostas de modelos de linguagem, especialmente com textos longos.

2025-06-17T14:40:06+00:00 ― 6 min ler

Aprendizagem de máquinas Avaliação de Autoencoders Espalhados em Modelos de Linguagem

Este artigo avalia a eficácia de autoencoders esparsos na representação do conhecimento sobre cidades.

2025-06-16T21:25:12+00:00 ― 5 min ler

Computação e linguagem Como os Métodos de Aprendizado Moldam Modelos de Linguagem

Um estudo sobre o impacto do ICL e SFT na estrutura de modelos de linguagem.

2025-06-16T16:25:00+00:00 ― 7 min ler

Computação e linguagem Melhorando a Tradução Automática com Técnicas de Ajuste Fino

Estudo mostra que ajustar LLMs com TMs melhora a qualidade da tradução para as organizações.

2025-06-16T11:48:30+00:00 ― 7 min ler

Aprendizagem de máquinas Entendendo Autoencoders Esparsos de Múltiplas Camadas em Modelos de Linguagem

Esse artigo fala sobre MLSAEs e o papel deles em examinar as camadas de modelos de linguagem.

2025-06-15T23:57:30+00:00 ― 6 min ler

Computação e linguagem ECHO: Uma Nova Abordagem em Técnicas de Raciocínio

ECHO combina diferentes padrões de raciocínio pra resolver problemas melhor em modelos de linguagem.

2025-06-15T21:43:12+00:00 ― 7 min ler

Engenharia de software avaliando modelos de linguagem para codificação de aplicativos web

Estudo avalia modelos de linguagem na capacidade de gerar código para aplicações web.

2025-06-15T12:06:30+00:00 ― 7 min ler

Criptografia e segurança AdaPPA: Uma Nova Abordagem para Ataques de Jailbreak em LLMs

AdaPPA aprimora ataques de jailbreak em modelos de linguagem combinando respostas seguras e prejudiciais.

2025-06-14T16:05:42+00:00 ― 5 min ler

Aprendizagem de máquinas Melhorando a Geração de Código com PF-PPO

PF-PPO melhora os modelos de linguagem filtrando recompensas não confiáveis pra ter respostas de código melhores.

2025-06-14T14:15:06+00:00 ― 5 min ler