Esse framework permite aprender rapidinho novas categorias de objetos com pouca informação.
― 7 min ler
Ciência de ponta explicada de forma simples
Esse framework permite aprender rapidinho novas categorias de objetos com pouca informação.
― 7 min ler
Explorando como os veículos compartilham informações em tempo real pra melhorar a segurança e a eficiência.
― 7 min ler
O Playground v3 transforma textos em imagens de alta qualidade com precisão.
― 8 min ler
Um novo sistema melhora a velocidade e a precisão da rotulagem de vídeos.
― 7 min ler
KAT melhora o deep learning usando KANs avançados pra substituir MLPs.
― 7 min ler
Os desafios do SoccerNet 2024 impulsionam a inovação na compreensão de vídeos de futebol.
― 6 min ler
Uma nova estrutura melhora a compreensão das ações humanas através de dados de esqueleto.
― 7 min ler
CCT-R melhora a segmentação de imagens médicas usando aprendizado semi-supervisionado e registro espacial.
― 6 min ler
Novo método melhora a análise de imagens na saúde usando imagens contrafactuais realistas.
― 7 min ler
O FOLK melhora o aprendizado auto-supervisionado com mascaramento de frequência adaptativo e um design de professor-aluno.
― 6 min ler
Esse modelo melhora a compreensão das decisões de IA na classificação de imagens.
― 8 min ler
Um novo método aumenta a geração de dados de textura para modelos de aprendizado de máquina.
― 7 min ler
Um novo modelo melhora a análise de imagens médicas através do mapeamento anatômico 3D.
― 7 min ler
Este estudo melhora a precisão da classificação de imagens médicas usando dados sintéticos.
― 7 min ler
Um novo método que melhora o reconhecimento de fala ao mesmo tempo que garante a privacidade dos dados.
― 6 min ler
Adaptar o DINOv2 melhora a segmentação BEV para carros autônomos mais seguros.
― 6 min ler
Um novo conjunto de dados junta informações de câmeras RGB e câmeras de eventos pra melhorar a análise facial.
― 10 min ler
A GAMMA melhora as buscas de itens de moda online com uma manipulação precisa de atributos.
― 7 min ler
SteeredMarigold melhora mapas de profundidade, ajudando robôs na navegação e interação.
― 6 min ler
Um novo sistema melhora a eficiência dos drones em operações de busca e salvamento.
― 7 min ler
ExelMap melhora a precisão das atualizações de mapas HD para uma condução autônoma mais segura.
― 6 min ler
Novas técnicas melhoram as habilidades dos robôs, indo de simulações pra tarefas do mundo real.
― 6 min ler
Um novo método oferece modelagem 3D melhorada a partir de uma única imagem, aumentando o realismo.
― 8 min ler
Este estudo explora o uso de Transfer Learning para um controle de qualidade eficaz na aplicação de fita CFRP.
― 6 min ler
A MotionCom tá mudando a forma como objetos são adicionados às imagens de forma dinâmica.
― 6 min ler
Novas técnicas melhoram a modelagem urbana dinâmica para várias aplicações.
― 7 min ler
O SRIF melhora as técnicas de correspondência de formas para animação, impressão 3D e realidade virtual.
― 7 min ler
Um método novo melhora a clareza de cenas 3D usando máscaras de segmentação 2D.
― 6 min ler
Apresentando o GRIN, um novo modelo pra estimativa de profundidade usando dados esparsos.
― 8 min ler
AMD-MIL melhora a análise de tecidos pra diagnósticos de doenças mais rápidos e precisos.
― 5 min ler
Um novo método melhora a seleção de amostras em aprendizado semi-supervisionado.
― 5 min ler
DAF-Net combina imagens infravermelhas e visíveis pra dar uma visão mais clara.
― 6 min ler
Os robôs agora podem usar expressões faciais pra mostrar dor, ajudando no treinamento em saúde.
― 7 min ler
A VALO otimiza a detecção LiDAR para veículos autônomos, equilibrando velocidade e precisão.
― 6 min ler
O NVLM melhora a compreensão de linguagem e visuais da IA para várias tarefas.
― 6 min ler
Usando IA pra melhorar o diagnóstico precoce de doenças da retina com técnicas de imagem mais avançadas.
― 9 min ler
A RenderWorld usa dados visuais pra uma tecnologia de dirigibilidade autônoma mais segura.
― 6 min ler
OmniGen simplifica as tarefas de criação de imagens em um único modelo pra todo mundo.
― 6 min ler
Esse trampo melhora a precisão do CLIP resolvendo a sobreposição intra-modal com adaptadores leves.
― 6 min ler
O LPT++ melhora o reconhecimento de objetos em classes com poucos exemplos usando técnicas avançadas.
― 8 min ler