Novo parâmetro avalia o desempenho de modelos de linguagem em entender transcrições de reuniões.
― 7 min ler
Ciência de ponta explicada de forma simples
Novo parâmetro avalia o desempenho de modelos de linguagem em entender transcrições de reuniões.
― 7 min ler
Pesquisas mostram que planejar melhora a precisão e a confiabilidade dos modelos de geração de texto.
― 5 min ler
Um novo conjunto de dados melhora as capacidades de VQA para texto em vietnamita em imagens.
― 7 min ler
Este estudo avalia como os LLMs respondem a perguntas sobre código de programação.
― 7 min ler
Examinando quando LLMs devem se abster de responder perguntas.
― 5 min ler
Um app ajuda os pais a envolver as crianças durante a leitura pra melhorar as habilidades de alfabetização.
― 4 min ler
Um novo método classifica as respostas de saúde pra facilitar o acesso.
― 5 min ler
O CinePile desafia a compreensão de vídeos longos com 305.000 perguntas diversas.
― 7 min ler
Uma análise profunda de memes e seus efeitos na sociedade.
― 8 min ler
Um novo conjunto de dados analisa informações enganosas nas respostas dos LLMs.
― 8 min ler
Novos métodos melhoram a compreensão das máquinas sobre interações dinâmicas em conteúdo de vídeo.
― 8 min ler
MMLU-Pro desafia modelos de linguagem com perguntas mais difíceis e mais opções de respostas.
― 8 min ler
Um esquema claro pra avaliar a compreensão em sistemas de IA.
― 9 min ler
Novo benchmark melhora a avaliação de modelos multimodais ao minimizar preconceitos.
― 7 min ler
Um novo método melhora como os LLMs lidam com dados estruturados.
― 6 min ler
Estudo avalia se LLMs adivinham respostas ou realmente entendem as perguntas.
― 8 min ler
Este artigo avalia o desempenho de LLM em um curso de Teoria da Computação.
― 6 min ler
Um novo conjunto de dados melhora a resposta a perguntas com dados visuais de artigos científicos.
― 8 min ler
Explorando como ferramentas de IA como a Jill Watson melhoram a aprendizagem dos alunos em vários cursos.
― 7 min ler
O DocBench faz testes em sistemas baseados em LLM para ler e responder a vários formatos de documentos.
― 5 min ler
Aprenda como as perguntas melhoram a leitura e a compreensão.
― 6 min ler
Um novo benchmark melhora a compreensão dos modelos sobre vídeos longos e linguagem.
― 6 min ler
O dataset OMoS-QA oferece um suporte essencial pra quem tá chegando e enfrentando desafios de migração.
― 6 min ler
Apresentando o ScholarChemQA, um conjunto de dados pra responder perguntas sobre química e ajudar os pesquisadores.
― 7 min ler
Uma nova forma dos robôs responderem perguntas em ambientes internos 3D.
― 6 min ler
Uma nova ferramenta melhora o processo de tradução de questionários entre idiomas.
― 4 min ler
O CRQBench tem o objetivo de medir o raciocínio de código de LLMs usando comentários de revisão de código do mundo real.
― 6 min ler
A pesquisa avalia como os LLMs geram perguntas educacionais para aprendizado.
― 5 min ler
A IA pode acelerar muito a correção de provas escritas para os professores.
― 5 min ler
Uma nova estrutura melhora a precisão das respostas em modelos de IA, focando em evidências.
― 6 min ler
Melhorando como as máquinas ajudam os usuários por meio de interações e respostas mais eficazes.
― 6 min ler
Os LLMs podem simplificar as interações dos usuários em simulações, tornando-as mais acessíveis.
― 11 min ler
Um novo conjunto de dados melhora a capacidade dos robôs de entender e navegar em ambientes 3D.
― 7 min ler
Sistemas de Tutoria Inteligente usam modelos avançados pra ajudar no aprendizado personalizado.
― 6 min ler
A IA pode ajudar a criar materiais de estudo eficazes para exames médicos.
― 7 min ler
Estudo mostra que ferramentas de IA mandam bem em responder perguntas de patologia comparadas a estagiários humanos.
― 7 min ler
Novos métodos melhoram como os modelos de linguagem respondem, equilibrando conhecimento e eventos atuais.
― 7 min ler
Uma olhada nos métodos e desafios de teste de linearidade.
― 10 min ler
Novas técnicas de IA melhoram a interpretação dos dados cardíacos pra cuidar melhor dos pacientes.
― 7 min ler
O DailyMed oferece ferramentas de quiz inovadoras pra uma experiência de aprendizado médico melhor.
― 9 min ler