Um estudo sobre confiança e incerteza nos resultados de segmentação semântica.
― 8 min ler
Ciência de ponta explicada de forma simples
Um estudo sobre confiança e incerteza nos resultados de segmentação semântica.
― 8 min ler
Um novo método melhora o reconhecimento de ações em vídeos usando linguagem contextual.
― 9 min ler
Um novo método pra melhorar a qualidade da imagem rapidinho usando modelos treinados.
― 4 min ler
DiPEx melhora as taxas de detecção de objetos usando pistas únicas e diversas.
― 7 min ler
Analisando como os transformers de visão entendem as relações entre objetos em imagens.
― 7 min ler
Explorando como os Transformers classificam dados através de informações contextuais.
― 6 min ler
Uma nova rede melhora a detecção de objetos 3D usando rótulos fracos.
― 8 min ler
Um novo modelo melhora a conexão entre compreensão visual e de linguagem.
― 6 min ler
Pesquisadores melhoram modelos de difusão com modelos de consistência mais rápidos, mantendo a qualidade.
― 8 min ler
A Previsão de Sobreposição Visual melhora a precisão e eficiência da busca por imagens em ambientes complexos.
― 7 min ler
O Diff-ID melhora o reconhecimento de pessoas gerando imagens de treino diversas.
― 8 min ler
MoMo melhora a qualidade do vídeo modelando os movimentos entre os quadros.
― 8 min ler
O POPCat acelera a rotulagem de vídeos para tarefas de visão computacional, garantindo precisão.
― 8 min ler
Abordando os preconceitos no reconhecimento facial através de conjuntos de dados de treinamento equilibrados.
― 10 min ler
Um novo método combina visão e linguagem para estimar a pose de objetos que não foram vistos.
― 6 min ler
Um novo modelo melhora o reconhecimento de ações em ambientes escuros usando tecnologia de transformadores de vídeo.
― 7 min ler
O BPA melhora como a gente representa características em várias tarefas de dados.
― 6 min ler
Esse artigo fala sobre um método pra treinar agentes generalistas usando linguagem e visão.
― 7 min ler
O Structure flow oferece insights de movimento em tempo real para robótica e veículos autônomos.
― 10 min ler
Um novo modelo melhora a precisão na segmentação 3D usando nuvens de pontos.
― 10 min ler
Um novo método que combina técnicas de geração e compreensão de imagens para uma melhor aprendizagem de máquina.
― 7 min ler
Um novo método para ajustes finos de grandes modelos de visão em dispositivos menores.
― 6 min ler
Pesquisa sobre como melhorar a transferência de conhecimento em dispositivos inteligentes com recursos limitados.
― 7 min ler
RAIL combina aprendizado contínuo com modelos de visão-linguagem para melhor adaptabilidade.
― 9 min ler
GeoHOI aprimora a detecção de interação humano-objeto utilizando características geométricas para uma precisão melhorada.
― 6 min ler
Um novo método simplifica a estimativa de pose usando dados mínimos.
― 8 min ler
Uma nova abordagem melhora a previsão de quadros de vídeo usando conhecimento de domínio.
― 7 min ler
Analisando o papel das variedades matriciais em melhorar modelos de deep learning.
― 6 min ler
O modelo SAVE melhora a segmentação áudio-visual com eficiência e precisão.
― 7 min ler
Um novo método utiliza modelos 3D para aprimorar a detecção de anomalias na fabricação.
― 8 min ler
Fibottention aumenta a eficiência na compreensão visual por máquinas.
― 5 min ler
Novas técnicas visam aprimorar a geração de grafos de cena equilibrando relacionamentos comuns e raros.
― 8 min ler
Apresentando uma nova abordagem para aprimorar a representação e eficiência dos dados de vídeo.
― 7 min ler
Explorando a combinação de tecnologia e arte na modelagem humana e estimativa de pose.
― 8 min ler
RoboUniView melhora a forma como os robôs aprendem tarefas em diferentes configurações de câmeras.
― 6 min ler
Descubra como a IA tá mudando a anotação de imagens pra mais precisão e rapidez.
― 6 min ler
Um novo método melhora a análise de imagens médicas usando imagens de histopatologia sintética.
― 6 min ler
Explore como transformadores estão mudando as técnicas de preenchimento de imagem na visão computacional.
― 9 min ler
Este estudo apresenta um novo método para detectar anomalias em diversos contextos.
― 8 min ler
Uma análise do impacto do SAM Não Supervisionado na segmentação de imagens com menos trabalho manual.
― 7 min ler