Esse estudo explora novos métodos pra detectar pedestres em condições climáticas difíceis.
― 7 min ler
Ciência de ponta explicada de forma simples
Esse estudo explora novos métodos pra detectar pedestres em condições climáticas difíceis.
― 7 min ler
DroneVis simplifica as tarefas de visão computacional para drones, melhorando a usabilidade e a funcionalidade.
― 8 min ler
Um novo método gera visualizações a partir de um único vídeo, melhorando a facilidade de uso.
― 7 min ler
E-Net melhora a eficiência e precisão da estimativa normal para modelos 3D.
― 10 min ler
Um novo método melhora o desempenho de modelos de visão-linguagem com classes conhecidas e desconhecidas.
― 7 min ler
O LayerCAM-AE melhora a detecção de atualizações maliciosas em aprendizado federado enquanto preserva a privacidade dos dados.
― 6 min ler
Um novo método resolve conflitos na classificação multivista pra melhorar a tomada de decisão.
― 7 min ler
Um estudo sobre o desempenho de modelos de Difusão em comparação com GANs para melhorar a qualidade de imagem.
― 8 min ler
Um novo método melhora a augmentação de dados para imagens de cirurgia laparoscópica.
― 7 min ler
Explorando métodos pra melhorar a precisão de localização em imagens aéreas.
― 7 min ler
A gente propõe um método pra criar gatilhos de backdoor invisíveis em modelos de difusão.
― 7 min ler
Entender como a IA toma decisões é fundamental pra ter confiança e usar de forma ética.
― 6 min ler
Uma nova estrutura melhora a detecção de falhas em trens usando técnicas avançadas de deep learning.
― 8 min ler
Diff-Tuning melhora os modelos de difusão pra gerar imagens melhores e se adaptar.
― 5 min ler
MaxLin melhora a precisão e eficiência da verificação do CNN para aplicações de IA mais seguras.
― 7 min ler
Novo modelo melhora a classificação de doenças de pele usando técnicas avançadas.
― 7 min ler
O UniCompress melhora o armazenamento e a transmissão de imagens médicas com técnicas avançadas de IA.
― 8 min ler
Novos métodos melhoram a criação de cenas 3D usando descrições de texto pra uma visualização melhor.
― 7 min ler
Apresentando o PART, um método pra aumentar a precisão e a robustez dos modelos de aprendizado de máquina.
― 6 min ler
Combinar modelos de linguagem visual com aprendizado por reforço melhora a eficiência na conclusão de tarefas.
― 7 min ler
Um novo framework melhora o reconhecimento de ações em movimentos que não foram vistos antes, através de uma compreensão semântica mais aprofundada.
― 7 min ler
Novo método melhora a criação de avatares 3D realistas a partir de gravações de vídeo.
― 6 min ler
Novos métodos melhoram a compreensão das máquinas sobre interações dinâmicas em conteúdo de vídeo.
― 8 min ler
Um método pra quantificar a incerteza na imagem médica pra melhorar o diagnóstico.
― 9 min ler
A NuNet usa dados RGB e de profundidade pra fazer estimativas de nutrição melhores.
― 7 min ler
Um novo framework melhora a eficiência dos drones em localizar alvos usando pistas diversas.
― 8 min ler
Novos métodos melhoram a estimativa da posição da cabeça pra ter mais precisão em situações do mundo real.
― 10 min ler
MoLA oferece geração de movimento humano rápida e eficiente para várias indústrias.
― 5 min ler
Uma nova abordagem melhora a precisão do diagnóstico de câncer de bexiga.
― 8 min ler
NeRAF cria som e visuais sincronizados para experiências imersivas em várias áreas.
― 7 min ler
Um método pra criar imagens panorâmicas de alta qualidade a partir de diferentes tipos de entrada.
― 7 min ler
O TransCLIP melhora as previsões ao integrar dados visuais e textuais em Modelos de Visão-Linguagem.
― 8 min ler
Este estudo avalia rastreadores de transformadores contra ataques adversariais no rastreamento de objetos.
― 6 min ler
EyeMoS melhora a detecção de doenças oculares por meio de aprendizado multimodal e estimativa de incerteza.
― 6 min ler
Apresentando um conjunto de dados pra analisar as interações nas atividades do dia a dia.
― 7 min ler
Um novo método melhora as previsões do modelo para uma adaptação melhor sem dados de origem.
― 8 min ler
O SpatialRGPT melhora a compreensão do arranjo de objetos em Modelos de Linguagem Visual.
― 8 min ler
Uma estrutura pra conectar processamento de imagem e interpretação de texto em modelos de visão.
― 7 min ler
Um método usando MCMC pra geração efetiva de amostras negativas em aprendizado contrastivo.
― 6 min ler
Um novo método melhora o alinhamento de áudio e vídeo usando modelos pré-treinados.
― 7 min ler