Um novo framework melhora o reconhecimento de ações em movimentos que não foram vistos antes, através de uma compreensão semântica mais aprofundada.
― 7 min ler
Ciência de ponta explicada de forma simples
Um novo framework melhora o reconhecimento de ações em movimentos que não foram vistos antes, através de uma compreensão semântica mais aprofundada.
― 7 min ler
Novo método melhora a criação de avatares 3D realistas a partir de gravações de vídeo.
― 6 min ler
Novos métodos melhoram a compreensão das máquinas sobre interações dinâmicas em conteúdo de vídeo.
― 8 min ler
Um método pra quantificar a incerteza na imagem médica pra melhorar o diagnóstico.
― 9 min ler
A NuNet usa dados RGB e de profundidade pra fazer estimativas de nutrição melhores.
― 7 min ler
Um novo framework melhora a eficiência dos drones em localizar alvos usando pistas diversas.
― 8 min ler
Novos métodos melhoram a estimativa da posição da cabeça pra ter mais precisão em situações do mundo real.
― 10 min ler
MoLA oferece geração de movimento humano rápida e eficiente para várias indústrias.
― 5 min ler
Uma nova abordagem melhora a precisão do diagnóstico de câncer de bexiga.
― 8 min ler
NeRAF cria som e visuais sincronizados para experiências imersivas em várias áreas.
― 7 min ler
Um método pra criar imagens panorâmicas de alta qualidade a partir de diferentes tipos de entrada.
― 7 min ler
O TransCLIP melhora as previsões ao integrar dados visuais e textuais em Modelos de Visão-Linguagem.
― 8 min ler
Este estudo avalia rastreadores de transformadores contra ataques adversariais no rastreamento de objetos.
― 6 min ler
EyeMoS melhora a detecção de doenças oculares por meio de aprendizado multimodal e estimativa de incerteza.
― 6 min ler
Apresentando um conjunto de dados pra analisar as interações nas atividades do dia a dia.
― 7 min ler
Um novo método melhora as previsões do modelo para uma adaptação melhor sem dados de origem.
― 8 min ler
O SpatialRGPT melhora a compreensão do arranjo de objetos em Modelos de Linguagem Visual.
― 8 min ler
Uma estrutura pra conectar processamento de imagem e interpretação de texto em modelos de visão.
― 7 min ler
Um método usando MCMC pra geração efetiva de amostras negativas em aprendizado contrastivo.
― 6 min ler
Um novo método melhora o alinhamento de áudio e vídeo usando modelos pré-treinados.
― 7 min ler
Um novo método melhora a fusão de imagens hiperespectrais e multiespectrais.
― 7 min ler
Um novo método melhora a classificação de plantas através de técnicas de aprendizado profundo multimodal.
― 9 min ler
A ferramenta SLANT analisa a influência do logo na precisão e viés do modelo.
― 6 min ler
Uma ferramenta que cria imagens a partir das conversas dos usuários através de múltiplos agentes.
― 8 min ler
Novos métodos revelam resiliência em circuitos de redes neurais contra manipulação.
― 7 min ler
Um novo algoritmo melhora a avaliação da qualidade de imagem para análise de dados astronômicos.
― 8 min ler
Novos métodos melhoram o desempenho da tarefa principal usando dados auxiliares sem custos extras de computação.
― 7 min ler
Um novo método oferece insights mais claros sobre as decisões dos modelos de deep learning.
― 8 min ler
Novos métodos para combinar tipos de dados melhoram o desempenho da IA em várias tarefas.
― 7 min ler
Este estudo analisa métodos de agrupamento de imagens em grandes conjuntos de dados, destacando as variações de desempenho.
― 8 min ler
Novo modelo melhora as previsões de interações de objetos usando vídeos e imagens.
― 7 min ler
Um novo sistema de imagem RF melhora o reconhecimento de objetos em ambientes desafiadores.
― 8 min ler
Novo método melhora o aprendizado federado enquanto protege a privacidade do usuário.
― 6 min ler
Este estudo explora métodos avançados para rotulagem de dados de forma eficiente usando técnicas de redes neurais.
― 8 min ler
Apresentando o CUT, uma estrutura pra gerar anomalias realistas e diversas sem precisar de treinamento extra.
― 7 min ler
Uma nova abordagem pra combinar canto e dança usando técnicas avançadas de computador.
― 6 min ler
O modelo CYCLO melhora a compreensão das interações dos objetos em vídeos de drones.
― 7 min ler
O CV-VAE melhora a eficiência e a qualidade da geração de vídeos nos modelos existentes.
― 8 min ler
O MultiEdits permite mudanças simultâneas em imagens através de comandos de texto, melhorando a eficiência e a qualidade.
― 6 min ler
Um novo modelo melhora a compreensão de imagens, focando em detalhes com eficiência.
― 9 min ler