Um novo framework melhora a precisão da reprogramação visual usando máscaras personalizadas para imagens.
― 7 min ler
Ciência de ponta explicada de forma simples
Um novo framework melhora a precisão da reprogramação visual usando máscaras personalizadas para imagens.
― 7 min ler
Um novo método melhora a precisão de modelos pequenos usando dados sintéticos.
― 7 min ler
Este artigo examina os aspectos teóricos do algoritmo Plug-and-Play para processamento de imagem.
― 7 min ler
O A-Bench avalia LMMs pra checar a qualidade e a precisão das imagens geradas por IA.
― 8 min ler
O EdgeSync melhora a precisão da análise de vídeo e reduz a latência em ambientes que mudam.
― 6 min ler
BPGT melhora a precisão na previsão de mutações genéticas a partir de imagens de tecidos pra um tratamento de câncer melhor.
― 7 min ler
MIVPG melhora como os modelos interpretam imagens e texto juntos.
― 7 min ler
Um novo método melhora a velocidade e a qualidade na geração de imagens 3D.
― 7 min ler
Um novo método melhora a classificação de imagens usando descrições textuais detalhadas.
― 8 min ler
MambaDepth oferece uma nova maneira de estimar profundidade a partir de imagens únicas.
― 9 min ler
Um método pra equilibrar precisão e custo em modelos de classificação de imagens.
― 11 min ler
Um novo método cria modelos 3D detalhados a partir de imagens únicas rapidinho.
― 7 min ler
Examinando o papel dos neurônios em modelos CLIP e suas interações.
― 9 min ler
Reduzindo a necessidade de armazenamento enquanto mantém a qualidade da imagem com métodos de quantização inovadores.
― 6 min ler
Um novo método melhora a representação visual de dados usando redes tensor.
― 6 min ler
Um novo conjunto de dados e modelo melhoram a qualidade da legendagem de vídeo para máquinas.
― 6 min ler
Um novo método pra criar músicas que se encaixam bem no conteúdo de vídeo.
― 9 min ler
Disjuntores oferecem um jeito novo de prevenir saídas prejudiciais de IA de forma eficaz.
― 4 min ler
ReNO otimiza a geração de imagens a partir de texto, melhorando a qualidade e a eficiência.
― 7 min ler
Novos métodos melhoram a descoberta de biomarcadores preditivos a partir de imagens médicas.
― 8 min ler
O VISTA melhora como a gente encontra informação ao juntar texto e imagens.
― 8 min ler
O benchmark MLVU tem o objetivo de melhorar a compreensão de máquinas sobre vídeos longos.
― 7 min ler
Um olhar sobre o campo em evolução dos avatares humanos em 3D e suas aplicações.
― 8 min ler
Este artigo explora como os MLLMs armazenam e transferem informações ao responder perguntas visuais.
― 6 min ler
Apresentando um conjunto de dados pra melhorar os esforços de observação da Terra usando dados de satélites diversos.
― 8 min ler
O MASA aprende a rastrear objetos usando imagens sem rótulos, melhorando a adaptação em situações diversas.
― 6 min ler
Explorando como humanos e redes neurais profundas percebem cenas 3D através de VPT.
― 8 min ler
Um novo método melhora a privacidade e a eficiência na verificação facial usando imagem sem lente.
― 8 min ler
A EquiLoPO Network oferece novas soluções pra analisar dados volumétricos mesmo com rotações.
― 5 min ler
Este estudo usa aprendizado de máquina pra classificar formatos de tabuletas cuneiformes antigas.
― 8 min ler
Uma nova técnica expõe vulnerabilidades em sistemas de IA avançados que combinam imagens e texto.
― 6 min ler
Avanços na segmentação automática de linfonodos melhoram a precisão do tratamento do câncer.
― 8 min ler
Os modelos Mamba melhoram a precisão e a eficiência na interpretação de imagens médicas.
― 9 min ler
Um conjunto de dados pra identificar propaganda em memes árabes pra melhorar a alfabetização midiática.
― 5 min ler
Bench2Drive oferece um método de avaliação justo para tecnologias de condução autônoma.
― 8 min ler
O LLplace simplifica o design de layout 3D usando entrada em linguagem natural.
― 7 min ler
A destilação de conhecimento melhora a precisão da segmentação em imagens médicas com dados limitados.
― 12 min ler
Uma nova métrica foca em comparações de imagens que fazem sentido pra melhorar a comunicação.
― 6 min ler
Uma nova abordagem melhora o reconhecimento de atividades ao combinar vários tipos de dados.
― 8 min ler
A ReDistill oferece uma solução inovadora pra diminuir o pico de memória em redes neurais.
― 8 min ler