Um novo framework melhora a representação de cenas 3D usando imagens 2D limitadas.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo framework melhora a representação de cenas 3D usando imagens 2D limitadas.
― 6 min ler
Um novo método melhora a eficiência e a qualidade na renderização de grandes cenas usando Gaussianos 3D.
― 8 min ler
Um estudo explora métodos automatizados pra medir ascite usando algoritmos de aprendizado de máquina.
― 7 min ler
APTP melhora modelos de texto-para-imagem pra mais eficiência e qualidade.
― 7 min ler
Uma nova abordagem pra melhorar a correspondência entre imagem e texto usando modelos de dois encoders e gráficos de cena.
― 7 min ler
Pesquisas mostram que sensores simples podem competir com câmeras complexas em tarefas de robôs.
― 7 min ler
Novo modelo de IA transforma raios-X de tórax 2D em tomografias 3D.
― 7 min ler
Um novo modelo que acelera a criação de imagens de alta qualidade usando técnicas inovadoras.
― 8 min ler
Analisando como o viés cultural afeta a compreensão de imagens pela IA.
― 10 min ler
Um novo conjunto de dados melhora a capacidade da IA de processar documentos científicos de forma eficaz.
― 6 min ler
Um novo método melhora a precisão e a consistência em tarefas de classificação hierárquica.
― 10 min ler
O STimage-1K4M junta imagens detalhadas e dados genéticos pra melhorar a pesquisa sobre doenças.
― 8 min ler
Descubra como os modelos virtuais de coração estão mudando o atendimento ao paciente.
― 8 min ler
Apresentando um método pra classificar vídeos rapidão com base na análise dos primeiros quadros.
― 6 min ler
O PartCLIPSeg melhora a segmentação de partes na visão computacional pra uma melhor reconhecimento de objetos.
― 6 min ler
O GUICourse tem como objetivo melhorar a interação com interfaces digitais através de conjuntos de dados específicos para agentes de GUI.
― 5 min ler
Um novo método melhora a detecção de objetos 3D usando dados de LiDAR.
― 6 min ler
A VideoVista oferece uma avaliação completa para modelos de perguntas e respostas em vídeo.
― 7 min ler
MINT-1T é o maior conjunto de dados open-source pra treinar modelos multimodais.
― 6 min ler
Um novo conjunto de dados 2D de movimento humano abre portas para animações realistas.
― 6 min ler
Novas técnicas melhoram a velocidade e a precisão em tarefas de busca de imagens.
― 10 min ler
Os testes de benchmark do MMNeedle avaliam modelos multimodais nas capacidades de lidar com contextos longos.
― 6 min ler
Novos métodos melhoram a capacidade dos robôs de detectar mudanças no ambiente sem precisar de treinamento.
― 7 min ler
Esse estudo avalia como os métodos de mapa HD se saem em condições adversas.
― 7 min ler
Apresentando soluções potenciais para tarefas de imagem complexas com clareza.
― 9 min ler
Combinar dados dos pacientes com raios-X do tórax melhora a precisão dos relatórios e o cuidado com os pacientes.
― 8 min ler
O SLOctolyzer automatiza a análise de imagens da retina, ajudando na pesquisa sobre a saúde dos olhos.
― 8 min ler
Um novo modelo melhora a inversão e edição de imagens, aumentando a qualidade e a preservação de detalhes.
― 6 min ler
Este estudo analisa o uso de Transformadores de Vídeo Gerais para melhorar a medição fisiológica remota.
― 9 min ler
Novos métodos melhoram a precisão da segmentação de vasos sanguíneos em imagens médicas.
― 7 min ler
Um novo modelo melhora a detecção de fumaça usando imagens de satélite em condições desafiadoras.
― 6 min ler
Um novo método aumenta a precisão na identificação do estresse em plantas usando aumento de dados automatizado.
― 7 min ler
Um olhar sobre redes neurais, incertezas e seu impacto na tomada de decisões da IA.
― 9 min ler
O novo modelo ChangeViT melhora a detecção de mudanças em imagens de satélite e drones.
― 9 min ler
LACPANet melhora a análise de tumores renais usando imagens de TC em múltiplas fases.
― 8 min ler
Explorando os desafios de segurança trazidos por ataques adversariais em agentes multimodais.
― 7 min ler
Um novo método melhora as previsões de localização de minerais usando aprendizado auto-supervisionado.
― 7 min ler
Pesquisas mostram como a autoatenção melhora a modelagem da resposta neural em deep learning.
― 7 min ler
Um novo método melhora o aprendizado federado usando só uma imagem para treino.
― 7 min ler
Apresentando o SeTAR, uma solução sem treinamento para detectar dados fora da distribuição em redes neurais.
― 8 min ler