Novos modelos melhoram a geração de imagens em várias resoluções de forma eficiente.
― 8 min ler
Ciência de ponta explicada de forma simples
Novos modelos melhoram a geração de imagens em várias resoluções de forma eficiente.
― 8 min ler
Novo método cria cenas 4D realistas a partir de descrições de texto simples.
― 7 min ler
OphNet melhora a análise do fluxo de trabalho cirúrgico com um conjunto de dados de vídeo super rico.
― 8 min ler
Drones rastreiam alvos em movimento em áreas urbanas usando modelagem ambiental avançada.
― 8 min ler
Analisando memes prejudiciais e seus efeitos na sociedade.
― 6 min ler
Estudo analisa a resistência de modelos de segmentação contra ataques adversariais na área da saúde.
― 8 min ler
Pixelsmith facilita a geração de imagens em alta resolução usando poucos recursos.
― 6 min ler
O WMAdapter facilita a marcação d'água para imagens geradas por IA, garantindo qualidade e eficácia.
― 8 min ler
O MS-Diffusion melhora a criação de imagens personalizadas para uma ou várias pessoas.
― 7 min ler
Um novo método melhora a suavidade e a qualidade dos movimentos animados humanos.
― 8 min ler
Novo framework usa imagens 3D para laudos de radiologia mais precisos.
― 10 min ler
O BBQ combina dados visuais e linguagem pra melhorar a busca de objetos em 3D.
― 7 min ler
Novo modelo melhora a identificação de órgãos e tumores em tomografias.
― 7 min ler
OSEDiff oferece uma nova maneira de melhorar imagens do mundo real de forma eficiente.
― 8 min ler
Novo modelo melhora a colaboração entre plataformas de sensoriamento remoto para uma análise de dados mais eficiente.
― 7 min ler
Esse artigo explora técnicas e desafios na detecção de mídias deepfake.
― 7 min ler
Um novo método melhora a detecção de pequenos alvos em movimento em imagens de infravermelho.
― 7 min ler
Uma olhada em como o YOLO mudou a detecção de objetos em várias áreas.
― 7 min ler
BEVSpread melhora a precisão na detecção de objetos pra uma direção mais segura.
― 6 min ler
Novos métodos melhoram o reconhecimento de imagem pra identificar pessoas em diferentes ambientes.
― 7 min ler
mOSCAR oferece um conjunto de dados multilíngue pra melhorar a compreensão de texto e imagens pela IA.
― 7 min ler
Um novo padrão avalia como os LVLMs dependem do conhecimento prévio da linguagem.
― 8 min ler
Um novo método ajuda carros autônomos a prever o que tá acontecendo ao redor usando dados brutos.
― 7 min ler
Descubra como o CMC-Bench tá transformando as técnicas de compressão de imagem.
― 7 min ler
O método FSBI melhora a detecção de mídias digitais manipuladas.
― 7 min ler
PianoMotion10M oferece movimentos de mãos detalhados pra ajudar quem tá aprendendo piano.
― 7 min ler
Uma abordagem nova melhora a detecção de imagens falsas criadas por IA.
― 7 min ler
A RetiZero melhora a identificação de doenças oculares usando técnicas de IA avançadas e um monte de dados.
― 6 min ler
Um jeito de melhorar os modelos dos alunos usando insights de modelos de professores mais fortes.
― 6 min ler
Um novo sistema permite a criação de modelos 3D usando imagens únicas do mundo real.
― 7 min ler
Uma nova abordagem para segmentação de objetos em vídeo melhora a precisão ao limitar o uso de memória.
― 9 min ler
Novo método transforma imagens únicas em avatares 3D realistas.
― 5 min ler
Um novo modelo melhora a correspondência do som com as ações visuais em vídeos.
― 13 min ler
Um novo método pra reconstruir objetos complexos usando entrada visual e técnicas de codificação.
― 6 min ler
Um método novo pra criar imagens a partir de texto usando modelos especializados.
― 5 min ler
Um conjunto de dados completo que junta imagens e texto pra ajudar o aprendizado de máquina.
― 8 min ler
Um novo padrão pretende avaliar MLLMs na compreensão de vídeos sobre vários temas.
― 7 min ler
Um novo modelo gera efeitos de fonte únicos para várias línguas.
― 6 min ler
Um novo conjunto de dados melhora a avaliação da qualidade de imagem na microscopia.
― 9 min ler
ConSoR melhora a compreensão das conexões sociais através da análise do contexto visual.
― 9 min ler