Aprimorando a farmacovigilância com saídas confiáveis de modelos de linguagem.
― 7 min ler
Ciência de ponta explicada de forma simples
Aprimorando a farmacovigilância com saídas confiáveis de modelos de linguagem.
― 7 min ler
Este estudo avalia como os LVLMs médicos se saem em meio a alucinações usando um novo conjunto de dados.
― 7 min ler
Uma nova estrutura tem como objetivo detectar e corrigir erros nos resultados de LVLM.
― 8 min ler
Esse estudo analisa como os LLMs avaliam seu próprio conhecimento e o risco de erros.
― 9 min ler
Uma ferramenta pra identificar respostas enganosas de grandes modelos de linguagem.
― 7 min ler
TongGu simplifica a compreensão do Chinês Clássico com técnicas especializadas.
― 6 min ler
Um novo método gera dados sintéticos pra melhorar a detecção de resultados falsos.
― 7 min ler
Esse estudo avalia como os modelos grandes lidam com vários objetos em imagens.
― 7 min ler
A pesquisa foca em melhorar a precisão e a confiabilidade dos modelos de linguagem.
― 7 min ler
GenSco melhora os sistemas de QA ao aumentar a precisão e a coerência nas respostas de múltiplas etapas.
― 6 min ler
Um novo método pra avaliar a precisão nas saídas de modelos de linguagem.
― 4 min ler
Uma visão geral do progresso em NLG, desafios e direções futuras de pesquisa.
― 7 min ler
Este artigo estuda como o treinamento influencia as previsões dos grandes modelos de linguagem.
― 8 min ler
Um modelo baseado em críticas melhora a precisão na identificação de imprecisões em textos gerados por IA.
― 6 min ler
Pesquisas destacam métodos para detectar informações falsas em IA automotiva.
― 9 min ler
Um novo marco traz à tona a alucinação em modelos de linguagem visual.
― 6 min ler
A IA generativa tá melhorando como os profissionais de dados escrevem consultas SQL.
― 5 min ler
Um novo conjunto de dados melhora a precisão da detecção de veracidade de eventos em textos.
― 9 min ler
Apresentando o DOPRA, uma forma econômica de melhorar a precisão do MLLM.
― 6 min ler
Esse artigo avalia a eficácia dos agentes da web em gerenciar tarefas online complexas.
― 7 min ler
O HaloQuest resolve problemas de alucinação em modelos de visão-linguagem com um novo conjunto de dados.
― 12 min ler
pRAGe ajuda a simplificar termos médicos pra que os pacientes entendam melhor.
― 8 min ler
Esse artigo fala sobre os desafios de detectar alucinações na tradução automática em várias línguas.
― 7 min ler
Este artigo apresenta um método pra melhorar a compreensão de contexto em modelos de linguagem.
― 6 min ler
Um novo parâmetro avalia LLMs para precisão factual.
― 7 min ler
Avaliando grandes modelos de linguagem para melhorar a segurança nas estradas em carros autônomos.
― 6 min ler
Dois métodos melhoram a forma como os modelos analisam imagens médicas pra um diagnóstico melhor.
― 6 min ler
Uma nova estrutura pretende reduzir alucinações em LVLMs através de recuperação ativa.
― 7 min ler
Um framework pra reduzir saídas falsas em modelos de linguagem-visão em várias línguas.
― 6 min ler
Uma nova estrutura melhora a avaliação de sistemas RAG em domínios especializados.
― 10 min ler
Explorando o papel dos tutores de IA em melhorar a educação em robótica com técnicas avançadas.
― 6 min ler
Um estudo sobre os desafios e soluções para alucinações em MLLMs.
― 5 min ler
Novo método melhora a precisão em modelos de visão-linguagem, reduzindo conteúdo enganoso.
― 6 min ler
Um novo método melhora a precisão em modelos de IA avançados, lidando com alucinações.
― 7 min ler
Explorando LLMs pra identificar anomalias em dados de séries temporais.
― 8 min ler
Um novo método melhora a precisão da geração de relatórios financeiros usando modelos de linguagem.
― 5 min ler
Estudo revela métodos eficazes para identificar alucinações em grandes modelos de linguagem-visual.
― 7 min ler
Esse artigo examina questões de alucinação de código em LLMs e suas implicações.
― 7 min ler
Um estudo sobre alucinações em modelos de linguagem e suas implicações no treinamento.
― 9 min ler
Novas ferramentas melhoram o treinamento cirúrgico usando dados de vídeo e texto.
― 6 min ler