O MindEye2 permite reconstruções visuais claras a partir de dados mínimos de escaneamento cerebral.
― 7 min ler
Ciência de ponta explicada de forma simples
O MindEye2 permite reconstruções visuais claras a partir de dados mínimos de escaneamento cerebral.
― 7 min ler
Novas abordagens melhoram a análise de imagens médicas 3D usando modelos de linguagem.
― 7 min ler
Nova abordagem melhora a detecção de calçadas para veículos autônomos.
― 8 min ler
VecKM melhora a codificação da geometria local para nuvens de pontos, aumentando a eficiência e a robustez.
― 7 min ler
O TraveLER melhora a compreensão de vídeos por meio de perguntas interativas para dar respostas melhores.
― 6 min ler
Um estudo sobre métodos de IA para detecção de câncer em patologia digital.
― 10 min ler
Descubra como avatares 3D estão mudando as interações online e a expressão pessoal.
― 6 min ler
Um método pra avaliar o estilo artístico em imagens geradas.
― 9 min ler
Um novo modelo melhora o reconhecimento de ações em vídeos sem cortes, enquanto minimiza o uso de memória.
― 9 min ler
Um novo modelo melhora a análise de dados de sensoriamento remoto usando abordagens multissensor.
― 7 min ler
FireANTs melhora a velocidade e a precisão do registro de imagens, especialmente em imagens médicas.
― 6 min ler
Um novo método melhora o realismo e a editabilidade de humanos em 3D.
― 7 min ler
SurMo melhora a renderização de vídeos de humanos dinâmicos juntando aparência e movimento.
― 7 min ler
Um método que combina linguagem e propriedades físicas pra criar cenas 3D dinâmicas.
― 8 min ler
Novo método melhora a compressão de dados 3D enquanto mantém a qualidade.
― 10 min ler
Esse estudo foca em melhorar a precisão espacial na geração de imagens a partir de texto.
― 7 min ler
A BEM oferece uma solução pra melhorar modelos com classes desbalanceadas em aprendizado semi-supervisionado.
― 8 min ler
Um método novo melhora a eficiência de criar avatares humanos.
― 7 min ler
Analisando os preconceitos na geração de imagens e seus impactos na sociedade.
― 8 min ler
O TEAR alinha grandes conjuntos de pontos 3D de forma eficiente, superando outliers e problemas de memória.
― 6 min ler
Um novo método de treinamento melhora o desempenho dos modelos de visão-linguagem em tarefas zero-shot.
― 8 min ler
Uma nova estrutura transforma a interpretação de imagens através de gráficos de cena com vocabulário aberto.
― 8 min ler
Esse artigo mostra um jeito de criar gêmeos digitais de objetos em movimento.
― 6 min ler
Um novo conjunto de dados foca no raciocínio causal usando as animações do 'Tom e Jerry'.
― 8 min ler
Drones pequenos melhoram a detecção de pragas na agricultura, promovendo sustentabilidade e eficiência.
― 5 min ler
O LP++ melhora a adaptação de modelos de visão-linguagem, especialmente em cenários de aprendizado com poucos exemplos.
― 6 min ler
O SnAG melhora a precisão e eficiência de ancoragem de vídeo para vídeos mais longos.
― 7 min ler
Novos métodos melhoram a segurança prevendo os movimentos de pedestres fora da vista para veículos autônomos.
― 7 min ler
Novos conjuntos de dados melhoram as capacidades da Busca por Arquitetura Neural em aplicações do mundo real.
― 12 min ler
Métodos para melhorar a qualidade de renderização em tamanhos de cena diferentes.
― 7 min ler
Um novo método pra editar avatares 3D de forma fácil e eficaz usando só uma imagem.
― 6 min ler
Uma nova estrutura melhora a geração dinâmica de conteúdo 3D para animação e jogos.
― 6 min ler
Um novo método de treinamento melhora a composicionalidade dos modelos de visão e linguagem.
― 7 min ler
Um esquema pra alinhar imagens de objetos similares em um espaço 3D.
― 8 min ler
O framework PriViLege melhora o aprendizado em Few-Shot Class Incremental Learning com modelos grandes.
― 7 min ler
Novo método melhora o controle de movimento da câmera na criação de vídeo a partir de texto.
― 7 min ler
Uma nova abordagem para cenários de tráfego realistas nos testes de veículos autônomos.
― 7 min ler
Câmeras de visão 360 melhoram a segurança na direção, mas enfrentam desafios por causa de artefatos ópticos.
― 7 min ler
O IISAN melhora a eficiência em sistemas de recomendação multimodal, mantendo a performance.
― 9 min ler
Um novo método melhora a clareza em imagens escuras para várias aplicações.
― 6 min ler