CoAPT melhora a classificação de imagens usando palavras de atributos contextuais no ajuste de prompt.
― 10 min ler
Ciência de ponta explicada de forma simples
CoAPT melhora a classificação de imagens usando palavras de atributos contextuais no ajuste de prompt.
― 10 min ler
Pesquisadores usam sondagens pra entender as capacidades de aprendizado dos modelos de linguagem através de análises causais.
― 7 min ler
Um conjunto de dados revolucionário da Romênia melhora bastante o desenvolvimento de modelos de linguagem.
― 7 min ler
Descubra como o tamanho do vocabulário influencia o desempenho de grandes modelos de linguagem.
― 8 min ler
Este estudo compara métodos para detectar postura em tópicos chave em textos árabes.
― 7 min ler
Um estudo sobre como os LLMs funcionam como bases de conhecimento confiáveis.
― 5 min ler
Uma nova abordagem pra analisar dados não estruturados usando técnicas avançadas de consulta.
― 7 min ler
Um novo conjunto de dados pra avaliar perguntas e respostas em línguas indianas.
― 6 min ler
Um novo modelo identifica autores de forma eficaz analisando estilos de escrita.
― 6 min ler
O LIAR oferece uma nova maneira de podar modelos sem precisar retrainar, melhorando a eficiência e o desempenho.
― 7 min ler
RAG combina recuperação de dados e geração de texto pra melhorar a performance do modelo de linguagem.
― 9 min ler
Um novo método melhora a eficácia e a interpretabilidade do ajuste de prompts.
― 9 min ler
Esse estudo explora métodos pra criar modelos de linguagem menores de forma eficaz e barata.
― 5 min ler
Pesquisas mostram como comandos amistosos podem enganar sistemas de IA.
― 6 min ler
Um novo método que melhora o desempenho de LLM enquanto reduz o uso de recursos.
― 8 min ler
Um estudo sobre a confiabilidade das autoexplicações de LLM em tarefas de linguagem natural.
― 8 min ler
O ChatQA 2 melhora o desempenho ao processar textos longos e em tarefas de recuperação.
― 7 min ler
Este estudo avalia as habilidades de raciocínio de modelos de áudio-linguagem com uma nova tarefa.
― 9 min ler
Um conjunto de dados robusto para treinar sistemas de IA avançados baseados em chat.
― 6 min ler
Uma nova abordagem para modelos de espaço de estados melhora a eficiência e o desempenho em tarefas de linguagem.
― 7 min ler
Novo modelo melhora o raciocínio visual usando métodos de reconstrução 3D.
― 7 min ler
Novo método RoE aumenta a eficiência de modelos de linguagem grandes multimodais com roteamento dinâmico.
― 8 min ler
Analisando o impacto do tamanho do modelo na performance de geração de texto a partir de dados.
― 8 min ler
Descubra como sair mais cedo melhora a eficiência nos modelos de Processamento de Linguagem Natural.
― 7 min ler
Este estudo foca em gerar citações com o tamanho certo pra melhorar a qualidade.
― 6 min ler
E-LLaGNN melhora os GNNs usando modelos de linguagem de forma seletiva pra ter um desempenho melhor.
― 7 min ler
Uma abordagem modular melhora os codificadores de frases em várias línguas.
― 7 min ler
Uma nova abordagem pra melhorar os prompts dos modelos de texto pra imagem e ter resultados melhores.
― 6 min ler
Descubra como a Transferência de Estilo de Texto muda o estilo do texto mantendo o significado.
― 10 min ler
Explorando como os transformers analisam sentimentos em texto, como em críticas de filmes.
― 5 min ler
Este artigo analisa como a assistência ao usuário pode melhorar o desempenho de modelos de linguagem grandes na geração de consultas SQL.
― 6 min ler
Um método pra melhorar modelos de visão-linguagem reduzindo o overfitting.
― 8 min ler
Um novo conjunto de dados melhora a precisão da detecção de veracidade de eventos em textos.
― 9 min ler
Este artigo analisa a decodificação de múltiplos prompts para melhorar a qualidade da geração de texto.
― 7 min ler
TAGCOS otimiza o ajuste de instruções selecionando subconjuntos de dados eficazes para modelos de linguagem.
― 7 min ler
Esse estudo analisa métodos pra melhorar o alinhamento dos modelos de linguagem com as preferências humanas.
― 7 min ler
Uma nova base de conhecimento para buscas de patentes químicas tem como objetivo melhorar a extração de reações.
― 8 min ler
Um novo método combina modelos de linguagem e bancos de dados pra melhorar o acesso aos dados.
― 9 min ler
Um novo modelo melhora a eficiência em sistemas de diálogo voltados para tarefas sem muito trabalho manual.
― 7 min ler
DDK melhora a destilação de conhecimento, deixando modelos de linguagem menores mais eficientes.
― 6 min ler