Os testes de benchmark do MMNeedle avaliam modelos multimodais nas capacidades de lidar com contextos longos.
― 6 min ler
Ciência de ponta explicada de forma simples
Os testes de benchmark do MMNeedle avaliam modelos multimodais nas capacidades de lidar com contextos longos.
― 6 min ler
Esse artigo analisa o verdadeiro significado da democratização na IA.
― 7 min ler
Este estudo analisa como a linguagem influencia os valores culturais em grandes modelos.
― 9 min ler
Um método pra identificar emoções e suas causas em dados não rotulados.
― 6 min ler
O L-ICV melhora a performance em perguntas visuais usando menos exemplos.
― 7 min ler
Esse artigo analisa como conceitos relacionais moldam a recuperação de conhecimento em modelos de linguagem grandes.
― 6 min ler
A APPL facilita o desenvolvimento com grandes modelos de linguagem usando uma sintaxe intuitiva, parecida com Python.
― 2 min ler
Analisando as raízes e implicações do viés na tecnologia de linguagem.
― 7 min ler
Modelos de linguagem de longo contexto facilitam tarefas complexas e melhoram a interação com a IA.
― 9 min ler
Um novo framework resolve desafios na destilação de conhecimento para dados com cauda longa.
― 9 min ler
Esse artigo examina maneiras de melhorar as habilidades de planejamento em grandes modelos de linguagem.
― 8 min ler
Um novo conjunto de dados melhora a compreensão de histórias em várias línguas.
― 8 min ler
Explorando os desafios de segurança trazidos por ataques adversariais em agentes multimodais.
― 7 min ler
Os modelos GLM-4 mostram melhorias nas capacidades de entender e gerar linguagem.
― 10 min ler
Esse artigo analisa como os LLMs respondem a perguntas complexas que envolvem múltiplos passos.
― 8 min ler
Um novo modelo combina LLMs e tradução automática pra melhorar o processamento de linguagem.
― 8 min ler
Analisando os problemas e as possíveis melhorias na revisão por pares acadêmica.
― 9 min ler
Apresentando uma nova escala pra avaliar a profundidade emocional nas histórias.
― 10 min ler
Um método pra avaliar o conhecimento do modelo através do processamento interno.
― 8 min ler
A Taxonomia de Prompting Hierárquico melhora os métodos de avaliação para modelos de linguagem.
― 7 min ler
O DetectBench avalia LLMs pela capacidade de detectar evidências ocultas em tarefas de raciocínio.
― 6 min ler
Apresentando o SeTAR, uma solução sem treinamento para detectar dados fora da distribuição em redes neurais.
― 8 min ler
Um estudo sobre como usar LLMs pra avaliar outros LLMs e suas implicações.
― 8 min ler
Explorar o impacto da pesquisa em IA no processamento de linguagem natural.
― 8 min ler
O PromptDSI melhora a busca de documentos gerenciando informações novas e existentes de forma eficiente.
― 8 min ler
Um novo método melhora a tradução automática para idiomas sub-representados.
― 7 min ler
O conjunto de dados MultiSocial ajuda a detectar textos gerados por máquinas em 22 idiomas.
― 7 min ler
P-Tailor personaliza modelos de linguagem usando os Cinco Grandes Traços de Personalidade.
― 7 min ler
Este artigo fala sobre como redes neurais profundas aprendem a linguagem através da previsão do próximo token.
― 8 min ler
O FuseGen junta vários modelos pra ter dados sintéticos de melhor qualidade em machine learning.
― 8 min ler
Dados sintéticos melhoram a precisão da detecção de posicionamento em discussões online.
― 9 min ler
Um novo método pra melhorar a estabilidade e o desempenho do modelo em ambientes com poucos recursos.
― 7 min ler
IPEval avalia a compreensão de conceitos de propriedade intelectual por modelos de linguagem.
― 6 min ler
Novos métodos tão melhorando a comunicação pra comunidade surda com um reconhecimento de linguagem de sinais mais avançado.
― 8 min ler
Snap ajuda modelos de linguagem grandes a desaprender informações específicas enquanto mantém seu desempenho.
― 9 min ler
Este artigo analisa o FS-GEN, combinando modelos grandes e pequenos para obter melhores resultados.
― 8 min ler
Um framework pra avaliar a precisão factual e a confiabilidade dos modelos de linguagem.
― 9 min ler
Esse estudo avalia terapeutas de LLM do ponto de vista dos clientes usando interações simuladas.
― 8 min ler
Os LLMs podem ajudar na proteção contra engenharia social e também trazer novos riscos.
― 7 min ler
Uma nova técnica melhora a detecção de anomalias usando aprendizado auto supervisionado.
― 9 min ler