Um método para estimar a pose do corpo em 3D que enfrenta os desafios de obstrução.
― 7 min ler
Ciência de ponta explicada de forma simples
Um método para estimar a pose do corpo em 3D que enfrenta os desafios de obstrução.
― 7 min ler
O Control Color facilita o processo de colorir imagens em preto e branco com controle do usuário.
― 5 min ler
Um novo método permite criar facilmente avatares 3D realistas usando só um vídeo.
― 6 min ler
Pesquisa revela vulnerabilidades na tecnologia de reconhecimento de marcha em smartphones.
― 7 min ler
Um estudo sobre como as miniaturas das notícias combinam com os artigos.
― 5 min ler
Examinando o viés de gênero em modelos T2I através do Teste de Estereótipos Pares.
― 7 min ler
Uma nova abordagem melhora a segurança das imagens em modelos de texto-para-imagem através da otimização de prompts.
― 8 min ler
O BioFusionNet mistura imagens de tumores, dados genéticos e informações clínicas pra fazer uma avaliação de risco melhor.
― 12 min ler
O SegmentAnyBone melhora a precisão da imagem óssea em exames de MRI para um diagnóstico melhor.
― 8 min ler
Um novo método melhora a detecção de objetos em documentos usando estruturas de grafo.
― 10 min ler
Um novo método aumenta a eficiência na busca de vizinhos mais próximos aproximados baseada em grafos.
― 7 min ler
Uma nova abordagem melhora as tarefas de reconhecimento visual através de mecanismos de atenção residual.
― 10 min ler
Esse benchmark avalia o desempenho dos modelos de linguagem médica na área da saúde.
― 9 min ler
Apresentando o FOMO, um jeito de melhorar as DNNs contra ataques adversariais através do esquecimento.
― 7 min ler
Aprenda como a invariância condicional melhora o desempenho do modelo em diferentes tipos de dados.
― 7 min ler
Uma olhada no potencial e desafios dos sensores neuromórficos para análise facial.
― 9 min ler
Um novo sistema aprende as preferências dos usuários em tempo real pra sugerir roupas.
― 7 min ler
Um novo framework de deep learning classifica imagens de tamanhos diferentes pra prever melhor a permeabilidade.
― 8 min ler
Pesquisadores melhoram a precisão na detecção de tumores usando técnicas de imagem avançadas.
― 6 min ler
MVDiffusion++ cria modelos 3D detalhados a partir de só uma ou algumas imagens.
― 6 min ler
Um estudo sobre como a IA aprende relacionamentos de objetos através de tarefas de raciocínio visual.
― 8 min ler
Câmeras baseadas em eventos melhoram a leitura de códigos de barras e sinais borrados.
― 8 min ler
Lidando com mudança de domínio e deriva de conceito em modelos de IA.
― 7 min ler
Apresentando o CAMixer, uma nova forma de detectar mudanças em imagens de radar de abertura sintética.
― 6 min ler
Usar câmeras e pontos de referência melhora o rastreamento de localização em lugares sem GPS.
― 7 min ler
Novos métodos ajudam robôs a navegar usando entrada visual sem mapas complexos.
― 11 min ler
Um novo método melhora a inferência de cenas 3D, apesar dos desafios ambientais.
― 6 min ler
Uma nova abordagem pra navegação de tropas usando pontos de referência visuais em vez de GPS.
― 7 min ler
Novo framework melhora a eficiência e qualidade da compressão de vídeo.
― 7 min ler
AnyGPT processa texto, imagens, música e fala pra várias aplicações.
― 4 min ler
A pesquisa explora o uso de câmeras de evento para monitoramento de frequência cardíaca sem contato.
― 8 min ler
Um novo método melhora a força e a precisão dos modelos de aprendizado profundo.
― 7 min ler
Esse artigo explora como a augmentação de dados melhora o aprendizado em aprendizado por reforço profundo.
― 9 min ler
Uma nova ferramenta de IA melhora a detecção precoce do câncer pancreático com imagens mais precisas.
― 7 min ler
Um método novo melhora a compreensão de conteúdos de vídeo extensos.
― 5 min ler
Uma olhada em como a Otimização de Consistência Direta melhora a geração de imagens a partir de texto.
― 8 min ler
Um novo método melhora a identificação de itens flexíveis por robôs usando processamento de texto e imagem.
― 6 min ler
SepCLR melhora a separação de características nos dados para uma análise melhor.
― 7 min ler
InMD-X melhora a tomada de decisão para médicos de Medicina Interna com modelos de linguagem especializados.
― 6 min ler
Uma nova abordagem pra detectar memes cheio de ódio usando técnicas de aprendizado com poucos exemplos.
― 7 min ler