Melhorando modelos de texto-para-SQL ao integrar diferentes maneiras de fazer perguntas.
― 5 min ler
Ciência de ponta explicada de forma simples
Melhorando modelos de texto-para-SQL ao integrar diferentes maneiras de fazer perguntas.
― 5 min ler
Apresentando o BMTPT pra melhorar a sintonia de prompts em modelos de linguagem.
― 6 min ler
Novos métodos pra melhorar a precisão factual em resumos.
― 6 min ler
Aprenda como a geração de texto a partir de dados torna informações complexas mais fáceis de entender.
― 9 min ler
Explorando como modelos de linguagem refletem traços de personalidade na recrutamento.
― 8 min ler
Uma análise dos valores em contos de fadas da Alemanha, Itália e Portugal.
― 8 min ler
Uma nova abordagem pra identificar ataques de spear-phishing usando modelos de linguagem avançados.
― 8 min ler
Um novo método protege a privacidade das decisões em modelos de linguagem enquanto mantém a performance.
― 9 min ler
Este artigo analisa as dificuldades e técnicas para atualizar o conhecimento em modelos de linguagem.
― 5 min ler
Explorando maneiras de melhorar o raciocínio dos LLMs sem feedback externo.
― 7 min ler
Analisando sistemas de Texto-para-SQL usando perguntas geradas por usuários do projeto FootballDB.
― 9 min ler
Melhorando os modelos de linguagem pra respostas precisas e baseadas em evidências.
― 8 min ler
Explorando o impacto do ClinicLLM nas previsões de readmissão hospitalar e no cuidado com os pacientes.
― 7 min ler
Um novo framework pra avaliar a compreensão de tarefas de código pelos LLMs.
― 11 min ler
Novos métodos combinam áudio e metadados pra melhorar o reconhecimento de idiomas.
― 7 min ler
Um novo método avalia a eficácia da edição de modelos na geração de textos mais longos.
― 10 min ler
Novo conjunto de dados melhora muito o desempenho de LLM em tarefas de química.
― 7 min ler
Um novo método melhora como os modelos de linguagem coletam e usam informações.
― 6 min ler
Pesquisa sobre como os Transformers melhoram a generalização para sequências mais longas em tarefas de adição.
― 8 min ler
Novos métodos melhoram a variedade nas traduções sem perder a qualidade.
― 8 min ler
Esse estudo analisa os benefícios das respostas personalizadas em modelos de linguagem.
― 5 min ler
Melhorando o reconhecimento de fala do Whisper para o vietnamita e outras línguas com poucos recursos.
― 5 min ler
Um novo método pra melhorar o comportamento de modelos de linguagem, reduzindo viés e saídas tóxicas.
― 7 min ler
O API Pack facilita a geração de chamadas de API para modelos de linguagem, ajudando muito os desenvolvedores.
― 4 min ler
Um novo conjunto de dados tem como objetivo melhorar o raciocínio dos LLMs com probabilidades.
― 7 min ler
Apresentando um novo método para melhorar previsões em ambientes caóticos.
― 6 min ler
Pesquisadores testam armadilhas de copyright pra detectar treinamento de IA em conteúdo protegido.
― 7 min ler
Uma nova abordagem para ajustar modelos melhora a eficiência e a precisão nas tarefas de machine learning.
― 8 min ler
O SyntaxShap melhora a compreensão das previsões dos modelos de linguagem através da análise sintática.
― 7 min ler
O SLEB simplifica os LLMs removendo blocos de transformador redundantes, melhorando a velocidade e a eficiência.
― 7 min ler
Uma abordagem nova garante que os modelos de linguagem produzam resultados mais precisos e confiáveis.
― 8 min ler
Usando modelos de linguagem pra identificar informações falsas em notícias.
― 7 min ler
Uma visão geral do Aprendizado em Contexto e suas aplicações práticas através da Estrutura da Sopa de Pelicano.
― 8 min ler
Este artigo fala sobre como melhorar modelos pré-treinados no domínio de grafos usando SUPT.
― 7 min ler
Pesquisadores revelam que modelos de linguagem conseguem raciocinar sem prompts explícitos.
― 9 min ler
Um olhar sobre os riscos associados aos agentes de linguagem e suas estruturas.
― 7 min ler
Um estudo sobre confiabilidade e incerteza em grandes modelos de linguagem.
― 9 min ler
Um método que junta LLMs e Modelos Aditivos Neurais pra ajudar na precisão do diagnóstico.
― 9 min ler
Este artigo discute uma nova abordagem pra melhorar modelos de geração de texto usando quantização.
― 7 min ler
Um novo padrão avalia as habilidades de modelos de IA em resolver problemas de geometria.
― 6 min ler