Check-Eval usa listas de verificação pra melhorar a avaliação da qualidade do texto.
― 8 min ler
Ciência de ponta explicada de forma simples
Check-Eval usa listas de verificação pra melhorar a avaliação da qualidade do texto.
― 8 min ler
A ProtoDep oferece insights claros pra detectar depressão analisando redes sociais.
― 9 min ler
Esse estudo analisa o desempenho de circuitos de redes neurais e a confiabilidade deles.
― 4 min ler
Um novo framework pra criar imagens de alta qualidade com base em layouts específicos.
― 6 min ler
O HaloQuest resolve problemas de alucinação em modelos de visão-linguagem com um novo conjunto de dados.
― 12 min ler
Um novo método melhora a precisão e a eficiência do rastreamento de pontos na processaçao de vídeo.
― 6 min ler
Uma ferramenta melhora a categorização de ações, ajudando os desenvolvedores a serem mais eficientes nos fluxos de trabalho.
― 5 min ler
Um novo método melhora o design estrutural minimizando o estresse de forma eficaz.
― 6 min ler
Um novo parâmetro avalia LLMs para precisão factual.
― 7 min ler
Uma nova abordagem para avaliar conjuntos de títulos mais rápido sem referências humanas.
― 8 min ler
Uma nova forma de avaliar agentes pessoais usando modelos de linguagem.
― 7 min ler
Avaliar modelos de machine learning pra garantir justiça entre diferentes populações.
― 7 min ler
Dallah dá um suporte pra dialetos árabes, melhorando a comunicação em texto e imagens.
― 7 min ler
Um kit de ferramentas feito pra avaliar melhor as interações entre humanos e bots.
― 6 min ler
Usando marcas de relevância geradas por IA pra avaliar de forma eficiente sistemas de recuperação de informações.
― 9 min ler
Uma nova abordagem melhora as comparações de algoritmos de aprendizado por reforço em diferentes ambientes.
― 8 min ler
Um novo parâmetro pra avaliar modelos que analisam música e linguagem.
― 7 min ler
Explore diferentes frameworks e métodos para avaliar modelos de linguagem grandes de forma eficaz.
― 7 min ler
Uma nova abordagem pra avaliar a confiabilidade dos métodos que explicam a tomada de decisão da IA.
― 9 min ler
AxiomVision traz uma nova forma de analisar vídeos, melhorando o desempenho em condições que mudam.
― 7 min ler
Uma nova ferramenta pra avaliar métodos de explicabilidade em sistemas de IA.
― 10 min ler
BackdoorBench oferece uma abordagem unificada para avaliar métodos de aprendizado backdoor em redes neurais profundas.
― 9 min ler
Uma avaliação do desempenho zero-shot de LLMs multimodais em várias tarefas.
― 6 min ler
Uma nova ferramenta melhora o processo de tradução de questionários entre idiomas.
― 4 min ler
Estudo avalia as habilidades de raciocínio de modelos de linguagem grandes com perguntas complexas.
― 6 min ler
Um desafio de prever mortes em conflitos armados com foco na incerteza.
― 8 min ler
Descubra como LLMs podem facilitar a extração de dados em ciência dos materiais.
― 8 min ler
Explorando o papel e os desafios dos LLMs na engenharia do conhecimento.
― 8 min ler
Uma nova estrutura melhora os modelos de linguagem ao integrar dados externos para uma precisão melhor.
― 6 min ler
A Comidds oferece informações atualizadas sobre conjuntos de dados para pesquisa em detecção de intrusões.
― 6 min ler
Pesquisadores discutem o impacto dos LLMs na avaliação de sistemas de recuperação de informação.
― 6 min ler
Descubra como assistentes de codificação ajudam os desenvolvedores a aumentar a eficiência na programação.
― 6 min ler
Novos métodos oferecem uma avaliação melhor da compreensão de linguagem em modelos.
― 7 min ler
Um novo método pra combinar modelos de linguagem de forma mais eficiente.
― 7 min ler
Usando deep learning pra melhorar a detecção precoce do carcinoma espinocelular oral.
― 7 min ler
Essa pesquisa foca em melhorar a qualidade do software quântico híbrido por meio da analisabilidade.
― 6 min ler
MathScape melhora a avaliação de MLLMs com problemas de matemática visuais e textuais.
― 6 min ler
Explorando o uso de LLMs em programação lógica indutiva.
― 7 min ler
Um método estruturado pra criar conversas sintéticas usando modelos de linguagem.
― 7 min ler
ArabLegalEval avalia o desempenho dos LLMs em lidar com informações legais em árabe.
― 7 min ler