Os pesquisadores querem melhorar a compreensão das máquinas sobre as atividades diárias através da análise de vídeos.
― 7 min ler
Ciência de ponta explicada de forma simples
Os pesquisadores querem melhorar a compreensão das máquinas sobre as atividades diárias através da análise de vídeos.
― 7 min ler
SimGen melhora o treinamento de carros autônomos com dados sintéticos realistas.
― 9 min ler
Explorando o papel dos VLGFMs na análise de dados geoespaciais.
― 6 min ler
Um novo método cria rapidamente modelos 3D detalhados de cabeças a partir de imagens 2D.
― 8 min ler
Novo método melhora a precisão na estimativa de profundidade usando imagens únicas.
― 8 min ler
Um novo modelo melhora os métodos de compreensão e avaliação de vídeo.
― 6 min ler
Um novo método melhora a adaptabilidade do modelo entre domínios usando aprendizado por prompt e alinhamento de gradiente.
― 7 min ler
Um método pra identificar ataques em sistemas que combinam imagens e texto.
― 7 min ler
Uma nova abordagem melhora a forma como a IA compara imagens usando instruções visuais.
― 9 min ler
Esse método ajusta os espaços de representação de objetos com base na complexidade da imagem.
― 7 min ler
Um novo método melhora a eficiência de recuperação de imagens usando amostras de texto.
― 7 min ler
Um novo conjunto de dados avalia como os LLMs raciocinam com várias imagens.
― 7 min ler
Novo conjunto de dados ajuda a avaliar a precisão e confiabilidade do texto da IA.
― 8 min ler
Um novo método melhora a restauração de imagens usando técnicas de decodificação adaptativas.
― 6 min ler
A EquiPrompt quer reduzir os preconceitos em imagens geradas por IA usando métodos inovadores.
― 8 min ler
Analisando as vulnerabilidades nos métodos de marca d'água digital e suas implicações para a proteção da mídia.
― 11 min ler
Um novo método melhora a exploração de imagens em diferentes escalas.
― 5 min ler
Um novo modelo melhora a segmentação de tumores em imagens médicas, mesmo com as limitações de dados.
― 9 min ler
Apresentando um sistema rápido e eficiente pra buscar peças de CAD usando redes neurais de grafos.
― 7 min ler
Uma abordagem estruturada pra avaliar modelos de texto pra vídeo com eficiência melhorada.
― 14 min ler
Descubra como o NeRF transforma imagens 2D em modelos 3D realistas.
― 5 min ler
Novos métodos melhoram animações faciais realistas sincronizadas com áudio.
― 7 min ler
FouRA melhora a geração de imagens, aumentando a qualidade e a diversidade.
― 6 min ler
Analisando como rótulos suaves melhoram o aprendizado de máquina através da destilação de conjuntos de dados.
― 7 min ler
Um novo conjunto de dados melhora a coerência em sequências de imagem-texto para uma criação de conteúdo mais eficaz.
― 6 min ler
Novos métodos melhoram a visualização 3D de estruturas biológicas com uma estimativa de pose mais precisa.
― 6 min ler
Um conjunto de dados único captura o dia a dia das crianças pra melhorar o aprendizado de máquina e a compreensão do aprendizado humano.
― 9 min ler
VANE-Bench melhora a detecção de anomalias em vídeos no meio do aumento de conteúdo de IA.
― 7 min ler
Examinando as nuances culturais na interpretação da arte do Rebus com trocadilhos chineses.
― 6 min ler
Novo método melhora a qualidade das imagens de satélite usando várias entradas de baixa resolução.
― 7 min ler
Um novo conjunto de dados pra melhorar a compreensão das narrativas em curtas-metragens.
― 8 min ler
Novo método melhora a qualidade da imagem de tomografia e reduz a exposição à radiação.
― 8 min ler
Explorando as dificuldades em contar objetos em imagens geradas por texto.
― 6 min ler
Novos métodos melhoram a qualidade de renderização de texto em várias línguas.
― 7 min ler
Novo método melhora a análise de vídeo de colonoscopia para detecção de pólipos.
― 8 min ler
Descubra como o YOLO melhora a eficiência e a produtividade na agricultura através de detecção de objetos avançada.
― 8 min ler
O CamTrol facilita o controle do movimento da câmera em vídeos gerados sem precisar de muito treinamento.
― 7 min ler
Um novo método melhora a detecção 3D usando dados de imagem e LiDAR.
― 10 min ler
O método ANNEAL reduz os custos de rotulagem enquanto melhora o desempenho na busca de imagens.
― 8 min ler
Esse artigo fala sobre um novo ponto de referência pra combinar imagens e texto pra encontrar eventos em vídeos.
― 9 min ler