Uma nova abordagem melhora os sistemas de diálogo orientados a tarefas usando chamadas de função.
― 7 min ler
Ciência de ponta explicada de forma simples
Uma nova abordagem melhora os sistemas de diálogo orientados a tarefas usando chamadas de função.
― 7 min ler
LoRETTA melhora a eficiência de ajuste fino para grandes modelos de linguagem com menos parâmetros.
― 7 min ler
Novos métodos pra melhorar o aprendizado contínuo em modelos de linguagem, mantendo o conhecimento passado.
― 7 min ler
Modelos de linguagem mandam bem com texto, mas não têm uma compreensão sensorial.
― 7 min ler
Um estudo revela que modelos de linguagem priorizam a relevância em vez da qualidade das evidências.
― 4 min ler
Um novo método ajuda os robôs a seguirem comandos complexos de forma mais eficaz.
― 8 min ler
Esse artigo examina como os modelos de linguagem podem adotar preconceitos ideológicos a partir dos dados de treinamento.
― 6 min ler
Esse artigo fala sobre um método pra melhorar modelos de linguagem usando instruções estruturadas.
― 6 min ler
Archer traz raciocínio complexo pra melhorar as tarefas de texto pra SQL em várias línguas.
― 7 min ler
Examinando a combinação de SFMs e LLMs pra melhorar a tradução de fala.
― 6 min ler
Esse estudo avalia modelos para acompanhar mudanças nos significados das palavras entre os idiomas.
― 10 min ler
Analisando as limitações dos LLMs em entender e reter informações temporais.
― 5 min ler
Uma nova abordagem melhora a eficiência em modelos de ASR multilíngues ao integrar técnicas de mascaramento adaptativo.
― 5 min ler
Um novo método melhora o alinhamento dos LLMs com feedback humano mínimo.
― 6 min ler
Investigando áudio deepfake pra melhorar modelos de transcrição pra línguas menos comuns.
― 10 min ler
Explorando como redes tensorais podem melhorar a modelagem de linguagem através de cadeias de spin de Motzkin.
― 7 min ler
Um estudo mostra que os LLMs mandam bem em responder a partir de escolhas, revelando habilidades de raciocínio inesperadas.
― 6 min ler
Explorando como a ordem das palavras influencia o processamento da linguagem e a comunicação.
― 6 min ler
Analisando como palavras novas afetam o desempenho dos modelos de linguagem.
― 7 min ler
O SiLLM melhora a tradução em tempo real integrando dois modelos diferentes.
― 8 min ler
Analisando os tamanhos de amostra necessários para modelos especializados superarem os gerais.
― 7 min ler
Este artigo analisa como modelos de reinício incremental melhoram a compreensão da linguagem em meio a ambiguidades locais.
― 8 min ler
Explorando o aprendizado em contexto e suas implicações para o desempenho de IA multilíngue.
― 5 min ler
Pesquisa sobre como misturar diferentes estilos de comunicação na geração de texto por IA.
― 6 min ler
Esse estudo analisa a eficácia de modelos multilíngues em seguir instruções em várias línguas europeias.
― 5 min ler
Um estudo sobre o papel dos Neurônios de Conhecimento Degenerado em melhorar o desempenho de modelos de linguagem.
― 7 min ler
Investigando como os métodos de tokenização afetam tarefas aritméticas em modelos de linguagem.
― 7 min ler
Este artigo explora como modelos de linguagem podem ajudar na escrita de meta-análises acadêmicas.
― 5 min ler
Uma nova estrutura melhora a detecção de discurso de ódio gerando casos de teste realistas.
― 7 min ler
Um agente adaptativo melhora o trabalho em equipe no Codenames usando vários modelos de linguagem.
― 6 min ler
Um novo método melhora a forma como os modelos de IA expressam confiança nas respostas.
― 8 min ler
Esse artigo analisa os perigos do ajuste fino prejudicial em modelos de linguagem.
― 8 min ler
Uma nova abordagem usando retrotradução tem como objetivo proteger os modelos de linguagem de comandos prejudiciais.
― 8 min ler
Um método pra melhorar a qualidade das respostas em modelos de linguagem usando feedback.
― 7 min ler
Estudo revela desafios e avanços na memória de chatbots durante diálogos longos.
― 6 min ler
Estudo avalia a capacidade dos LLMs de criar dados de perguntas e respostas culturalmente relevantes.
― 6 min ler
Esse artigo analisa a confiabilidade das opiniões políticas em modelos de linguagem grandes.
― 6 min ler
Um novo padrão pra avaliar as habilidades de conversação em coreano dos modelos de linguagem.
― 7 min ler
Descubra por que a tokenização é essencial para os computadores entenderem a linguagem humana.
― 8 min ler
Este estudo analisa o viés de gênero em modelos de linguagem grandes em várias línguas.
― 8 min ler