Um novo conjunto de dados tem como objetivo melhorar os modelos de detecção de discurso de ódio para a língua alemã.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo conjunto de dados tem como objetivo melhorar os modelos de detecção de discurso de ódio para a língua alemã.
― 6 min ler
Entendendo as discrepâncias nos métodos de explicação de modelos através da análise linguística.
― 9 min ler
Esse estudo avalia modelos de sumarização para vários sistemas jurídicos.
― 12 min ler
J-CRe3 melhora a compreensão dos robôs em relação à fala humana em tarefas do dia a dia.
― 6 min ler
Novos métodos melhoram a adaptabilidade do modelo para tarefas diferentes dos usuários.
― 8 min ler
Uma nova abordagem melhora a precisão do raciocínio em modelos de linguagem usando filtragem seletiva.
― 6 min ler
Pesquisa mostra que várias consultas melhoram sistemas para uma busca de informações mais eficiente.
― 6 min ler
Esse artigo apresenta um método pra melhorar o reconhecimento de entidades em textos biomédicos.
― 5 min ler
Focar em LayerNorm melhora a eficiência do fine-tuning para modelos BERT.
― 6 min ler
Novo parâmetro avalia o desempenho de modelos de linguagem em entender transcrições de reuniões.
― 7 min ler
Um método automatizado para alinhar relações discursivas de diferentes sistemas de rotulação.
― 7 min ler
Esse estudo analisa como diferentes idiomas afetam o desempenho de modelos multilíngues.
― 7 min ler
Esse estudo avalia o desempenho cruzado de modelos multilíngues no reconhecimento de entidades nomeadas.
― 7 min ler
Novos métodos melhoram a precisão ao responder perguntas complexas com informações atualizadas.
― 8 min ler
Analisando preocupações de privacidade e soluções para Modelos de Linguagem Grande em dados de texto.
― 4 min ler
Um corpus único melhora o reconhecimento de entidades nomeadas em seis línguas eslavas.
― 6 min ler
A pesquisa investiga o viés de gênero avaliando a justiça estatística e causal em modelos de PNL.
― 12 min ler
Um novo método melhora o alinhamento de imagem e texto reduzindo o viés de uma única tag.
― 5 min ler
Um novo método melhora a capacidade dos modelos de linguagem de responder a perguntas desconhecidas.
― 9 min ler
Uma nova abordagem melhora a confiabilidade dos modelos de linguagem através de mecanismos de auto-reparação.
― 8 min ler
Esse artigo analisa como os dados influenciam a avaliação de modelos de NLP.
― 6 min ler
Um olhar sobre técnicas de recuperação densa e generativa e seu impacto.
― 6 min ler
Este estudo analisa como a profundidade do transformador afeta as tarefas de aprendizado.
― 5 min ler
Descubra os processos por trás do treinamento de modelos de linguagem de IA avançados.
― 7 min ler
Analisa o crescimento da comunicação entre humanos e robôs usando fala natural.
― 9 min ler
Um novo método pra avaliar a precisão dos modelos de linguagem usando grafos de conhecimento.
― 8 min ler
Um novo método de treinamento melhora o desempenho dos modelos de visão-linguagem em tarefas zero-shot.
― 8 min ler
Esse estudo avalia o desempenho dos LLMs com a língua persa.
― 5 min ler
Pesquisas mostram as vulnerabilidades dos sistemas MNMT a ataques de backdoor.
― 9 min ler
Um estudo sobre como o T5 processa dados estruturados para consultas SQL.
― 14 min ler
O LP++ melhora a adaptação de modelos de visão-linguagem, especialmente em cenários de aprendizado com poucos exemplos.
― 6 min ler
Explore como Mixture-of-Depths melhora a eficiência do modelo de linguagem de forma sustentável.
― 8 min ler
Estudo mostra que modelos menores se saem bem com dados de treinamento simplificados.
― 7 min ler
Um novo método de treinamento melhora a composicionalidade dos modelos de visão e linguagem.
― 7 min ler
Uma nova abordagem pra melhorar a modelagem de tópicos usando relações baseadas em grafos.
― 9 min ler
Um novo conjunto de dados mede sistemas RAG para respostas precisas a perguntas.
― 6 min ler
Novos modelos melhoram as habilidades de raciocínio em várias tarefas, aprimorando o desempenho da IA.
― 8 min ler
Um novo método melhora a resolução de co-referência de eventos pra entender melhor o texto.
― 7 min ler
Uma forma estruturada de avaliar modelos de linguagem em contextos multilíngues.
― 6 min ler
Analisando a diferença entre usar e mencionar em conversas online.
― 7 min ler