Explore como os LLMs fazem adição usando técnicas matemáticas únicas.
― 6 min ler
Ciência de ponta explicada de forma simples
Explore como os LLMs fazem adição usando técnicas matemáticas únicas.
― 6 min ler
Este artigo examina se os modelos de linguagem têm crenças e seguem normas de coerência.
― 8 min ler
Um novo método melhora a pontuação de confiança em modelos de linguagem usando explicações estáveis.
― 11 min ler
Apresentando o IrokoBench pra melhorar a avaliação de LLM em línguas africanas.
― 8 min ler
Um projeto que tem como objetivo facilitar o acesso aos dados do governo suíço em várias línguas.
― 9 min ler
Estudo explora métodos pra adaptar texto de IA pra quem tá aprendendo idiomas.
― 4 min ler
Descobrindo os riscos que os ataques de backdoor trazem para sistemas inteligentes.
― 6 min ler
Um novo framework melhora os métodos de poda para modelos de linguagem grandes sem precisar de re-treinamento.
― 7 min ler
Um novo conjunto de dados melhora a pesquisa em conectar eventos entre documentos com uma linguagem criativa.
― 7 min ler
Um estudo sobre como o contexto afeta a geração de rankings em pesquisas de IA.
― 5 min ler
Avaliar as habilidades de raciocínio estratégico dos LLMs usando jogos variados.
― 8 min ler
Esse estudo analisa o uso de IA pra avaliar as respostas dos alunos na educação em biologia.
― 7 min ler
Examinando como os LLMs transformam o acesso e a interação com dados.
― 6 min ler
Esse artigo analisa como os modelos de linguagem se saem em tarefas de raciocínio espacial.
― 9 min ler
Um novo modelo replica a compreensão parecida com a humana em sistemas de IA.
― 9 min ler
Novos métodos como o PromptFix ajudam a proteger modelos de linguagem de ameaças ocultas.
― 6 min ler
Explorando classificação multi-rótulo pra melhorar o reconhecimento de relações de discurso.
― 10 min ler
Avaliando métodos para controle preciso das características do texto nas saídas de LLM.
― 16 min ler
Uma nova abordagem melhora o alinhamento do modelo de linguagem usando dados limitados anotados por humanos.
― 5 min ler
Um novo método melhora o alinhamento e a segurança de grandes modelos de linguagem.
― 7 min ler
Um olhar sobre como as palavras se relacionam dentro dos sistemas de linguagem ao longo do tempo.
― 6 min ler
Novo método melhora a tradução de fala em ambientes barulhentos mantendo a expressividade.
― 5 min ler
Disjuntores oferecem um jeito novo de prevenir saídas prejudiciais de IA de forma eficaz.
― 4 min ler
O VISTA melhora como a gente encontra informação ao juntar texto e imagens.
― 8 min ler
Explore as habilidades de aprendizado dos modelos de linguagem e suas aplicações.
― 9 min ler
A ABEX usa Abstract-and-Expand pra melhorar os dados de treinamento em tarefas de compreensão de linguagem natural.
― 9 min ler
Um novo método pra analisar os tons de conversa em humanos e IA.
― 7 min ler
SPAC oferece uma nova maneira de melhorar as respostas dos modelos de linguagem.
― 8 min ler
Uma análise das dificuldades dos Transformers com tarefas de contagem e cópia.
― 8 min ler
O benchmark MLVU tem o objetivo de melhorar a compreensão de máquinas sobre vídeos longos.
― 7 min ler
Um novo método pra desenvolver agentes adaptáveis usando ambientes diversos.
― 7 min ler
Um novo método pra avaliar o raciocínio de bom senso em modelos de IA através de tarefas abertas.
― 9 min ler
Novos sistemas melhoram a classificação dos valores morais nos textos.
― 6 min ler
A PredEx oferece previsões e explicações para decisões judiciais na Índia.
― 7 min ler
Destacando a necessidade de justiça em conjuntos de dados de fala sobre saúde mental.
― 7 min ler
Este estudo analisa como os LLMs lidam com mudanças nas tarefas de resumo.
― 9 min ler
As coleções da UltraMedical melhoram modelos de linguagem médica e resolvem a falta de dados.
― 7 min ler
Um olhar sobre a importância da cultura nos avanços do Processamento de Linguagem Natural.
― 7 min ler
Um conjunto de dados pra identificar propaganda em memes árabes pra melhorar a alfabetização midiática.
― 5 min ler
Uma nova abordagem melhora o reconhecimento de atividades ao combinar vários tipos de dados.
― 8 min ler