Pesquisas mostram as vulnerabilidades dos sistemas MNMT a ataques de backdoor.
― 9 min ler
Ciência de ponta explicada de forma simples
Pesquisas mostram as vulnerabilidades dos sistemas MNMT a ataques de backdoor.
― 9 min ler
Um estudo sobre como o T5 processa dados estruturados para consultas SQL.
― 14 min ler
O LP++ melhora a adaptação de modelos de visão-linguagem, especialmente em cenários de aprendizado com poucos exemplos.
― 6 min ler
Explore como Mixture-of-Depths melhora a eficiência do modelo de linguagem de forma sustentável.
― 8 min ler
Estudo mostra que modelos menores se saem bem com dados de treinamento simplificados.
― 7 min ler
Um novo método de treinamento melhora a composicionalidade dos modelos de visão e linguagem.
― 7 min ler
Uma nova abordagem pra melhorar a modelagem de tópicos usando relações baseadas em grafos.
― 9 min ler
Um novo conjunto de dados mede sistemas RAG para respostas precisas a perguntas.
― 6 min ler
Novos modelos melhoram as habilidades de raciocínio em várias tarefas, aprimorando o desempenho da IA.
― 8 min ler
Um novo método melhora a resolução de co-referência de eventos pra entender melhor o texto.
― 7 min ler
Uma forma estruturada de avaliar modelos de linguagem em contextos multilíngues.
― 6 min ler
Analisando a diferença entre usar e mencionar em conversas online.
― 7 min ler
Integrar o raciocínio humano no treinamento de IA melhora as explicações do modelo e cria confiança.
― 8 min ler
Combinar linguagem e navegação melhora como os robôs funcionam em vários ambientes.
― 8 min ler
Uma visão geral dos diferentes métodos de aprendizado usados por modelos de linguagem.
― 7 min ler
Uma nova estrutura melhora os modelos de linguagem ao reconhecer e responder a diferentes estilos de fala.
― 8 min ler
Um novo conjunto de dados melhora a capacidade dos LLMs de seguir instruções complexas.
― 6 min ler
AQuA mede a qualidade dos comentários usando insights de especialistas e usuários.
― 6 min ler
DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.
― 9 min ler
Este artigo analisa como ataques adversariais comprometem modelos de classificação de texto.
― 7 min ler
Analisando como a incerteza impacta a tomada de decisão em grandes modelos de linguagem.
― 8 min ler
MGFiD melhora a precisão e a eficiência na resposta a perguntas de domínio aberto.
― 5 min ler
Novos métodos melhoram o processamento de linguagem em várias línguas.
― 9 min ler
Métodos inovadores para treinar modelos usando texto comprimido.
― 6 min ler
Novos modelos de linguagem feitos pra várias línguas do Sudeste Asiático tão mostrando resultados promissores.
― 6 min ler
Esse trabalho foca em identificar cenas importantes pra melhorar os resumos de roteiros de filmes.
― 6 min ler
Este estudo analisa métodos para manter a privacidade em tarefas de processamento de linguagem.
― 8 min ler
Um novo método melhora a ligação de eventos em textos usando raciocínio gerado por IA.
― 8 min ler
O dataset KazQAD melhora as capacidades de resposta a perguntas em língua cazaque.
― 7 min ler
Um novo método melhora a segmentação de imagens usando descrições de texto e pares de imagens.
― 5 min ler
O BEAR melhora a avaliação do conhecimento relacional em modelos de linguagem.
― 9 min ler
Melhorando a precisão do modelo ao corrigir problemas nos dados de entrada.
― 7 min ler
Um conjunto de dados que analisa como as pessoas julgam a plausibilidade de eventos com base na linguagem.
― 6 min ler
Melhorando programas de computador pra resolver problemas de matemática com exemplos de dados melhores.
― 7 min ler
Este artigo explora a integração do controle PID em transformadores para melhorar a robustez e a qualidade de saída.
― 8 min ler
Este artigo analisa métodos para gerar perguntas que melhoram a extração de argumentos de eventos.
― 7 min ler
Novos modelos têm como objetivo melhorar a precisão na análise de dados de ensaios clínicos.
― 7 min ler
Esse artigo fala sobre como personalizar LLMs usando métodos de recuperação pra ter interações melhores com os usuários.
― 6 min ler
LLM2Vec melhora modelos só de decodificação pra um processamento de linguagem melhor.
― 7 min ler
Um olhar sobre a extração de menções de software em textos acadêmicos.
― 6 min ler