O Face-Att melhora a legenda de imagens através de uma análise detalhada das características faciais.
― 6 min ler
Ciência de ponta explicada de forma simples
O Face-Att melhora a legenda de imagens através de uma análise detalhada das características faciais.
― 6 min ler
Um novo método oferece várias razões para classificações de imagens, melhorando a compreensão e a confiança.
― 6 min ler
SINCERE melhora o aprendizado contrastivo supervisionado com uma separação e representação de classes melhores.
― 7 min ler
Novos métodos melhoram os exames de ressonância magnética sem precisar de treinamento constante.
― 6 min ler
O MoDem-V2 permite uma manipulação de robôs mais segura e eficiente através do aprendizado visual.
― 6 min ler
Avaliando grandes modelos em tarefas visuais de baixo nível através do Q-Bench.
― 6 min ler
Um novo método melhora a qualidade da imagem enquanto economiza recursos.
― 6 min ler
O AsymFormer melhora a compreensão do ambiente pelos robôs com processamento RGB-D eficiente.
― 5 min ler
Novos métodos melhoram o aprendizado contínuo reduzindo o uso de memória e evitando a perda de conhecimento.
― 7 min ler
Estratégias pra melhorar a interpretabilidade em sistemas de IA pra entender melhor.
― 7 min ler
Um novo sistema simplifica a calibração de sensores visuais-inerciais, ajudando quem não manja muito.
― 7 min ler
A pesquisa explora o deep learning pra criar áudio que combine com conteúdo de vídeo silencioso.
― 8 min ler
Novo método melhora a detecção de objetos para veículos autônomos usando dados multimodais.
― 5 min ler
Um novo método melhora gravações de áudio usando pistas visuais.
― 7 min ler
Esse artigo examina o papel dos modelos de linguagem em responder perguntas a partir de documentos.
― 8 min ler
Um novo conjunto de dados voltado pra melhorar o reconhecimento de objetos durante o corte.
― 8 min ler
Um novo método permite que modelos reconheçam tanto objetos conhecidos quanto desconhecidos.
― 8 min ler
O SPPNet facilita a segmentação celular, melhorando a precisão e a eficiência na análise médica.
― 6 min ler
Um olhar sobre o progresso e os desafios nos sistemas de captura de movimento.
― 7 min ler
Explorando o impacto do conteúdo gerado por IA na arte de contar histórias.
― 9 min ler
Um novo método gera rótulos detalhados para segmentação semântica usando dados sintéticos.
― 12 min ler
DISGAN melhora imagens de ressonância magnética, juntando super-resolução e redução de ruído.
― 6 min ler
A pesquisa traz métodos melhores pra identificar pontos de órgão no planejamento de radioterapia.
― 7 min ler
Uma nova estrutura usa quadrics pra modelagem de forma 3D eficiente.
― 6 min ler
Novos métodos melhoram a avaliação de desempenho de pequenos objetos em WSSS.
― 7 min ler
O método BoIR melhora o rastreamento de várias pessoas em imagens, aumentando a precisão em cenas cheias.
― 6 min ler
Um olhar sobre o desensino de máquina pra melhorar modelos generativos e seus resultados.
― 6 min ler
Um novo método melhora o aprendizado de objetos 3D sem precisar de dados rotulados.
― 7 min ler
Um novo método melhora a colocação das câmeras para gerar imagens 3D de alta qualidade.
― 7 min ler
Novos métodos melhoram a eficiência de memória e a precisão na segmentação de objetos em vídeo.
― 8 min ler
Usando redes neurais gráficas pra avaliar de forma objetiva o desempenho cirúrgico.
― 5 min ler
Combinar técnicas de detecção de objetos com calibração melhora a precisão e a confiabilidade.
― 6 min ler
Um novo método melhora a estimativa de pose 3D a partir de imagens 2D de várias pessoas.
― 6 min ler
Um novo método melhora a imagem dos vasos sanguíneos a partir de exames de ressonância magnética T2.
― 7 min ler
Uma nova abordagem simplifica a adaptação para detecção de objetos em diferentes ambientes.
― 9 min ler
O GeoAgent melhora a precisão da análise de imagem ajustando os tamanhos dos patches para segmentação.
― 7 min ler
O M 3D melhora a compreensão das máquinas sobre dados visuais usando imagens e informações de profundidade.
― 6 min ler
Os robôs se adaptam a terrenos diversos usando dados que coletam sozinhos.
― 9 min ler
Um novo método melhora o ajuste fino dos transformadores de visão, reduzindo as necessidades de computação.
― 6 min ler
ObVi-SLAM melhora a localização do robô ao combinar características visuais e detecção de objetos.
― 10 min ler