Aprenda como reduzir o tamanho do BERT mantendo o desempenho por meio da destilação de conhecimento.
― 5 min ler
Ciência de ponta explicada de forma simples
Aprenda como reduzir o tamanho do BERT mantendo o desempenho por meio da destilação de conhecimento.
― 5 min ler
Um novo método melhora a atribuição e a correção nas saídas dos modelos de linguagem.
― 4 min ler
Uma nova abordagem pra entender agentes de diálogo através de jogos de interpretação e simulação.
― 21 min ler
Este artigo analisa as habilidades do GPT-4 em tarefas de raciocínio abstrato e o impacto da representação de objetos.
― 6 min ler
Uma ferramenta pra avaliar as capacidades de raciocínio em várias etapas de modelos de linguagem grandes.
― 6 min ler
Essa pesquisa mostra como o envolvimento e o auto-treinamento melhoram os modelos de linguagem sem precisar de dados rotulados por humanos.
― 7 min ler
Uma análise completa das habilidades do ChatGPT em várias tarefas e desafios.
― 7 min ler
Esse artigo explora como modelos de linguagem melhoram o raciocínio estratégico da IA em jogos.
― 6 min ler
A pesquisa analisa a compreensão da sintaxe em modelos de linguagem falada usando várias metodologias.
― 7 min ler
Apresentando o TopEx, uma nova maneira de entender as diferenças entre modelos de linguagem.
― 6 min ler
Apresentando um modelo francês que supera os melhores padrões com menos dados.
― 6 min ler
Explorando maneiras de garantir a segurança das informações pessoais em modelos de linguagem.
― 6 min ler
Um estudo sobre o desempenho do Auto-GPT em tarefas de tomada de decisão.
― 7 min ler
LexGPT tem como objetivo ajudar profissionais do direito a entender e gerar textos legais.
― 6 min ler
Esse artigo explora como modelos de linguagem facilitam o planejamento e a execução de projetos.
― 7 min ler
Esse estudo destaca a necessidade de um reconhecimento melhor dos pronomes não-binários nos modelos de linguagem.
― 7 min ler
Um novo método melhora a precisão do raciocínio em modelos de linguagem usando prompts estruturados.
― 8 min ler
WOGLI foca nos impactos da ordem das palavras na inferência da língua alemã.
― 7 min ler
PandaLM automatiza os processos de avaliação pra melhorar o seguimento de instruções pelos grandes modelos de linguagem.
― 6 min ler
O ToolAlpaca tem como objetivo ajudar modelos menores a aprender a usar ferramentas do mundo real de forma eficaz.
― 6 min ler
Descubra como o RETA-LLM combina modelos de linguagem e sistemas de recuperação pra dar respostas melhores.
― 7 min ler
Este artigo fala sobre como usar SVG pra melhorar a interpretação de imagens pelos modelos de linguagem.
― 6 min ler
O TrojLLM cria prompts ocultos pra manipular os resultados de grandes modelos de linguagem.
― 4 min ler
Um novo modelo feito pra analisar tweets romenos usando tecnologia avançada.
― 6 min ler
Investigando métodos baseados em prompts pra melhorar modelos de linguagem na busca de dados de pesquisa.
― 8 min ler
Modelos de linguagem maiores podem se sair mal em certas tarefas, levantando questões críticas na pesquisa em IA.
― 5 min ler
Um novo método melhora o controle sobre a geração de texto em modelos de linguagem.
― 6 min ler
Estratégias para aumentar a eficiência do ChatGPT em várias tarefas de linguagem.
― 7 min ler
Novo conjunto de dados destaca o desempenho da IA em tarefas criativas com distrações.
― 6 min ler
Uma nova maneira de avaliar a qualidade do texto gerado em grandes modelos de linguagem.
― 7 min ler
Analisando como a IA lida com raciocínio humano e seus preconceitos.
― 6 min ler
Um novo método melhora os modelos de reconhecimento de fala usando só dados de texto para adaptação.
― 6 min ler
Um estudo sobre a eficácia de modelos de linguagem para correção gramatical em português brasileiro.
― 6 min ler
Este artigo avalia como os modelos de linguagem refletem opiniões globais diversas.
― 8 min ler
Um estudo sobre como modelos avançados se saem em tarefas de língua árabe.
― 8 min ler
Avaliando o desempenho de grandes modelos de linguagem em responder perguntas biomédicas através do BioASQ.
― 8 min ler
Um estudo sobre como avaliar a qualidade da geração de texto a partir de grandes modelos de linguagem.
― 7 min ler
Estudo mostra como os modelos lidam bem com a paráfrase em tarefas de inferência textual.
― 7 min ler
Um novo padrão tem como objetivo melhorar os modelos de linguagem para comunicação em redes sociais.
― 8 min ler
A BLUEX oferece um recurso bacana pra avaliar modelos de linguagem em português usando questões de vestibular.
― 7 min ler