O Soda-Eval estabelece novos padrões para os métodos de avaliação de chatbots.
― 7 min ler
Ciência de ponta explicada de forma simples
O Soda-Eval estabelece novos padrões para os métodos de avaliação de chatbots.
― 7 min ler
Examinando a parceria entre humanos e robôs em ambientes desafiadores.
― 6 min ler
Pesquisas mostram que as pessoas preferem caixas delimitadoras maiores na detecção de objetos.
― 7 min ler
Um olhar sobre sistemas de controle compartilhado para melhorar a interação entre robôs e usuários.
― 7 min ler
Esse framework melhora a precisão das previsões usando modelos de linguagem e dados em tempo real.
― 6 min ler
Aprendizado baseado em preferência melhora a tomada de decisões usando o feedback de especialistas.
― 7 min ler
O StyleSpeech melhora os sistemas de TTS pegando os detalhes naturais da fala.
― 6 min ler
O EMO-LLaMA melhora a IA emocional ao aprimorar o reconhecimento de expressões faciais.
― 7 min ler
Um novo sistema de AR melhora o trabalho em equipe entre humanos e robôs através do controle de olhar.
― 8 min ler
Um novo método melhora a forma como os robôs aprendem com as preferências humanas.
― 7 min ler
Um novo método automatiza a geração de conceitos pra melhorar a transparência nas decisões da IA.
― 7 min ler
A IA tá mudando a forma como a música é composta e vivida.
― 7 min ler
A pesquisa busca melhorar modelos de movimento dos dedos pra deixar o design robótico mais afiado.
― 7 min ler
Um novo método melhora o reconhecimento de emoções em conversas usando várias fontes de dados.
― 6 min ler
Uma nova abordagem pra acompanhar interações sem templates.
― 6 min ler
Essa pesquisa melhora o reconhecimento de gestos manuais usando eletromiografia pra uma acessibilidade melhor.
― 6 min ler
Novos métodos melhoram a qualidade da síntese de fala em sistemas de TTS.
― 5 min ler
Este estudo analisa como os modelos mentais dos usuários afetam suas interações com sistemas de diálogo voltados para tarefas.
― 8 min ler
Este estudo apresenta um modelo para analisar reações emocionais a conteúdos em vídeo.
― 8 min ler
Pesquisadores melhoram o reconhecimento de gestos usando técnicas de aprendizado inovadoras.
― 8 min ler
Este artigo fala sobre os benefícios de juntar sistemas de reconhecimento de voz e facial.
― 5 min ler
Um novo método facilita a adaptação de modelos de linguagem às preferências humanas.
― 6 min ler
Um novo modelo melhora o reconhecimento de fala ao combinar de forma eficaz entradas de áudio e visuais.
― 6 min ler
Avaliando como LLMs multimodais conseguem controlar jogos de Atari.
― 5 min ler
Um novo método melhora a estimativa de pose 3D em ambientes complexos.
― 7 min ler
Esse estudo melhora o reconhecimento de ações juntando mapas de profundidade com frames de vídeo RGB.
― 6 min ler
Um novo framework pra melhorar modelos de linguagem usando interações em tempo real com os usuários.
― 7 min ler
Uma nova abordagem melhora a detecção de ações em vídeos, lidando com o colapso de atenção.
― 8 min ler
Estudo revela o impacto dos sinais verbais e não verbais nas interações dos usuários com assistentes virtuais.
― 7 min ler
Um novo benchmark ajuda a avaliar os tokenizadores de fala para um desempenho melhor.
― 7 min ler
Melhorando como as máquinas ajudam os usuários por meio de interações e respostas mais eficazes.
― 6 min ler
Novos métodos melhoram o reconhecimento de expressões faciais usando técnicas de calibração de um quadro só.
― 5 min ler
A TIM oferece novas maneiras de gerar interações humanas realistas em movimento.
― 6 min ler
Uma nova abordagem melhora a precisão da estimativa de olhar usando múltiplos conjuntos de dados.
― 7 min ler
Este artigo apresenta um novo método para sistemas de diálogo realistas usando características específicas dos usuários.
― 5 min ler
Um novo método integra a ajuda humana pra melhorar o aprendizado OOD em modelos de machine learning.
― 8 min ler
Explorando a interseção entre feedback humano e sistemas multiagentes pra melhorar a colaboração.
― 7 min ler
Este estudo avalia quão bem os VLMs conseguem entender perspectivas visuais.
― 6 min ler
Um agente híbrido para o jogo Lobisomem melhora a interação e a jogabilidade.
― 7 min ler
Um novo método combina 2D e 3D pra vídeos realistas de humanos.
― 7 min ler