O AniTalker cria animações super realistas usando retratos e áudio, pegando as dinâmicas faciais bem sutis.
― 8 min ler
Ciência de ponta explicada de forma simples
O AniTalker cria animações super realistas usando retratos e áudio, pegando as dinâmicas faciais bem sutis.
― 8 min ler
Artigos mais recentes
Uma visão geral dos problemas e métodos na segmentação cerebrovascular para imagens médicas.
― 10 min ler
Novas técnicas melhoram a eficiência e a precisão em grandes modelos de linguagem.
― 6 min ler
Melhorando modelos de difusão adicionando LoRA às camadas de atenção pra ter imagens melhores.
― 5 min ler
BadFusion usa dados da câmera pra lançar ataques de backdoor em sistemas de direção autônoma.
― 7 min ler
Um novo método pra ajustes rápidos de exposição da câmera usando aprendizado de reforço profundo.
― 7 min ler
Uma imersão nos Modelos de Fundamento de Vídeo e sua importância na análise de vídeo.
― 7 min ler
Um novo método melhora o reconhecimento de imagens imitando os ajustes visuais humanos.
― 8 min ler
Avaliando as capacidades e desafios dos modelos avançados de entendimento de vídeo.
― 7 min ler
Novo modelo de IA melhora a compreensão de imagens em três dimensões.
― 7 min ler
Esse framework melhora a precisão do rastreamento de objetos com menos input humano.
― 8 min ler
Explore o impacto dos modelos de mundo e das capacidades únicas da Sora.
― 8 min ler
UniAV combina localização de ações, detecção de som e localização de eventos audiovisuais pra uma melhor compreensão de vídeos.
― 9 min ler
Um novo framework avalia a eficácia dos classificadores de segurança de imagem contra conteúdo prejudicial.
― 12 min ler
Um novo método melhora o desempenho da detecção de objetos usando consultas adaptativas.
― 8 min ler
Mind-Animator reconstrói vídeos usando a atividade cerebral medida por fMRI.
― 8 min ler
Explorando as razões por trás dos problemas de precisão no treinamento de dados sintéticos e melhorias potenciais.
― 7 min ler
Entender a incerteza ajuda os robôs a funcionarem bem em ambientes imprevisíveis.
― 7 min ler
Aprenda sobre modelos de difusão de vídeo e suas possíveis aplicações.
― 8 min ler
Um novo método reduz a desfocagem em fotos causada pela turbulência atmosférica.
― 7 min ler
Esse método torna mais fácil criar novas vistas 3D com poucas imagens.
― 6 min ler
Um novo framework melhora o reconhecimento de pessoas em diferentes tipos de entrada.
― 8 min ler
Saiba como o SiD acelera a criação de imagens sem perder a qualidade.
― 6 min ler
Radar Fields transforma dados de radar em imagens 3D detalhadas para várias aplicações.
― 7 min ler
Um novo framework melhora a qualidade da imagem enquanto reduz o tempo de processamento e o uso de recursos.
― 8 min ler
Um novo conjunto de dados melhora a classificação de dados Lidar para paisagens diversas.
― 7 min ler
O DocRes simplifica a restauração de imagens de documentos com um novo modelo para várias tarefas.
― 9 min ler
A DriveWorld melhora a tecnologia de direção autônoma analisando dados espaciais e temporais.
― 8 min ler
Um novo método melhora a forma como os robôs preveem as ações humanas.
― 9 min ler
Utilizando a tecnologia NeRF pra ter visões 3D precisas em ambientes industriais.
― 8 min ler
Mamba melhora a precisão e a eficiência na detecção de mudanças na superfície da Terra.
― 7 min ler
Um método pra melhorar o aprendizado do modelo, mesmo com erros nas etiquetas dos dados.
― 7 min ler
Um novo sistema pra gerar imagens baseado em conceitos humanos.
― 7 min ler
Explorando a habilidade humana de identificar vídeos deepfake em comparação com a detecção por IA.
― 7 min ler
Explorando explicabilidade baseada em influência na IA para imagens de tumor cerebral.
― 8 min ler
Splat-MOVER ajuda robôs a interagir com objetos usando linguagem e atualizações em tempo real.
― 6 min ler
Um novo modelo melhora a recuperação de imagens para diagnóstico de histopatologia mamária.
― 12 min ler
Um método que combina dados hiperespectrais e LiDAR aumenta a precisão da classificação de uso da terra.
― 8 min ler
Um novo método pra estimar FFR virtual usando técnicas de deep learning.
― 9 min ler
Explore como explicações alterfatuais esclarecem a tomada de decisões da IA.
― 7 min ler
OpenESS melhora câmeras baseadas em eventos para uma compreensão e reconhecimento de cena precisos.
― 7 min ler