O MS-Diffusion melhora a criação de imagens personalizadas para uma ou várias pessoas.
― 7 min ler
Ciência de ponta explicada de forma simples
O MS-Diffusion melhora a criação de imagens personalizadas para uma ou várias pessoas.
― 7 min ler
Um novo método melhora a suavidade e a qualidade dos movimentos animados humanos.
― 8 min ler
Novo framework usa imagens 3D para laudos de radiologia mais precisos.
― 10 min ler
O BBQ combina dados visuais e linguagem pra melhorar a busca de objetos em 3D.
― 7 min ler
Novo modelo melhora a identificação de órgãos e tumores em tomografias.
― 7 min ler
OSEDiff oferece uma nova maneira de melhorar imagens do mundo real de forma eficiente.
― 8 min ler
Novo modelo melhora a colaboração entre plataformas de sensoriamento remoto para uma análise de dados mais eficiente.
― 7 min ler
Esse artigo explora técnicas e desafios na detecção de mídias deepfake.
― 7 min ler
Um novo método melhora a detecção de pequenos alvos em movimento em imagens de infravermelho.
― 7 min ler
Uma olhada em como o YOLO mudou a detecção de objetos em várias áreas.
― 7 min ler
BEVSpread melhora a precisão na detecção de objetos pra uma direção mais segura.
― 6 min ler
Novos métodos melhoram o reconhecimento de imagem pra identificar pessoas em diferentes ambientes.
― 7 min ler
mOSCAR oferece um conjunto de dados multilíngue pra melhorar a compreensão de texto e imagens pela IA.
― 7 min ler
Um novo padrão avalia como os LVLMs dependem do conhecimento prévio da linguagem.
― 8 min ler
Um novo método ajuda carros autônomos a prever o que tá acontecendo ao redor usando dados brutos.
― 7 min ler
Descubra como o CMC-Bench tá transformando as técnicas de compressão de imagem.
― 7 min ler
O método FSBI melhora a detecção de mídias digitais manipuladas.
― 7 min ler
PianoMotion10M oferece movimentos de mãos detalhados pra ajudar quem tá aprendendo piano.
― 7 min ler
Uma abordagem nova melhora a detecção de imagens falsas criadas por IA.
― 7 min ler
A RetiZero melhora a identificação de doenças oculares usando técnicas de IA avançadas e um monte de dados.
― 6 min ler
Um jeito de melhorar os modelos dos alunos usando insights de modelos de professores mais fortes.
― 6 min ler
Um novo sistema permite a criação de modelos 3D usando imagens únicas do mundo real.
― 7 min ler
Uma nova abordagem para segmentação de objetos em vídeo melhora a precisão ao limitar o uso de memória.
― 9 min ler
Novo método transforma imagens únicas em avatares 3D realistas.
― 5 min ler
Um novo modelo melhora a correspondência do som com as ações visuais em vídeos.
― 13 min ler
Um novo método pra reconstruir objetos complexos usando entrada visual e técnicas de codificação.
― 6 min ler
Um método novo pra criar imagens a partir de texto usando modelos especializados.
― 5 min ler
Um conjunto de dados completo que junta imagens e texto pra ajudar o aprendizado de máquina.
― 8 min ler
Um novo padrão pretende avaliar MLLMs na compreensão de vídeos sobre vários temas.
― 7 min ler
Um novo modelo gera efeitos de fonte únicos para várias línguas.
― 6 min ler
Um novo conjunto de dados melhora a avaliação da qualidade de imagem na microscopia.
― 9 min ler
ConSoR melhora a compreensão das conexões sociais através da análise do contexto visual.
― 9 min ler
Uma nova abordagem melhora a robustez dos Transformers de Visão contra ataques adversariais.
― 6 min ler
Um novo modelo melhora a precisão da estimativa de profundidade usando técnicas de aprendizado auto-supervisionado.
― 8 min ler
hGCA automatiza a criação de cenas 3D realistas usando dados LiDAR esparsos.
― 7 min ler
Novos métodos melhoram conjuntos de dados de imagem enquanto garantem privacidade e desempenho.
― 6 min ler
A pesquisa foca em melhorar a eficiência nos modelos de compreensão de documentos.
― 9 min ler
Um novo benchmark testa o raciocínio composicional em modelos avançados.
― 8 min ler
CFG++ melhora a geração e edição de imagens, proporcionando uma melhor alinhamento com os comandos de texto.
― 7 min ler
ABTrack melhora a velocidade e a eficiência do rastreamento visual em vários dispositivos.
― 7 min ler