Integrando IA pra melhorar as estratégias de marketing e a eficácia das campanhas.
― 7 min ler
Ciência de ponta explicada de forma simples
Integrando IA pra melhorar as estratégias de marketing e a eficácia das campanhas.
― 7 min ler
X-Former melhora como os modelos juntam a compreensão de imagem e texto.
― 9 min ler
Combatendo informações enganosas com novas metodologias e tecnologias.
― 5 min ler
Um novo sistema que combina análise de texto e imagem pra combater desinformação.
― 6 min ler
Novo método RoE aumenta a eficiência de modelos de linguagem grandes multimodais com roteamento dinâmico.
― 8 min ler
Apresentando o 360VFI pra melhorar a qualidade e a experiência de vídeo 360 graus.
― 6 min ler
Um novo modelo combina áudio e vídeo pra uma melhor compreensão.
― 6 min ler
Um novo método melhora a separação de vozes em ambientes barulhentos com vários falantes.
― 6 min ler
Esse estudo analisa métodos de amostragem de quadros pra melhorar a busca de conteúdo em vídeo.
― 7 min ler
Uma nova ferramenta facilita a criação de clipes de destaque específicos para jogadores a partir de vídeos de futebol.
― 7 min ler
O HaloQuest resolve problemas de alucinação em modelos de visão-linguagem com um novo conjunto de dados.
― 12 min ler
Um novo framework melhora a recuperação de objetos 3D a partir de diferentes tipos de dados.
― 6 min ler
Analisando o processo criativo por trás da produção de vídeos de fake news.
― 7 min ler
QPT V2 melhora a pontuação visual usando modelagem de imagem mascarada e dados de alta qualidade.
― 6 min ler
O MMTrail combina descrições visuais e sonoras para melhorar os modelos de linguagem em vídeo.
― 5 min ler
Novo método fortalece a privacidade de imagens e textos compartilhados.
― 7 min ler
Um novo método melhora o desempenho do AVQA quando entradas de áudio ou visuais estão faltando.
― 5 min ler
Um método pra criar áudios que combinam com vídeos em primeira pessoa.
― 9 min ler
Uma coleção diversificada de modelos 3D para oportunidades de pesquisa melhoradas.
― 6 min ler
Este estudo analisa como os LLMs entendem e geram música.
― 6 min ler
Um novo modelo que sincroniza anotações de acordes com o áudio da música de forma perfeita.
― 7 min ler
Um modelo unificado melhora a compressão de nuvem de pontos para uma qualidade e eficiência melhores.
― 8 min ler
Método inovador adiciona mensagens escondidas pra garantir a autenticidade da imagem.
― 6 min ler
Uma ferramenta que identifica de forma eficaz conteúdo deepfake através da análise combinada de áudio e visual.
― 6 min ler
Um novo parâmetro pra avaliar modelos que analisam música e linguagem.
― 7 min ler
Uma nova abordagem junta dados de áudio, vídeo e texto pra um diagnóstico de depressão mais eficaz.
― 9 min ler
Um novo framework melhora a classificação em tarefas áudio-visuais não vistas.
― 7 min ler
Um novo modelo melhora a segmentação de silhuetas usando sinais de RF pra um melhor captura de movimento.
― 6 min ler
Novo conjunto de dados traz informações sobre discurso de ódio em várias línguas e formatos.
― 7 min ler
Novo framework melhora o processamento de imagem em modelos de linguagem grandes multimodais.
― 5 min ler
AxiomVision traz uma nova forma de analisar vídeos, melhorando o desempenho em condições que mudam.
― 7 min ler
Novos sistemas combinam áudio e vídeo pra melhorar a detecção de violência em lugares públicos.
― 6 min ler
Um novo sistema melhora as chamadas de vídeo em headsets VR acessíveis usando comandos de voz.
― 8 min ler
Um guia claro sobre tipos de manuscritos e desafios na submissão.
― 5 min ler
Um novo método melhora o reconhecimento de objetos em vídeos através de sons e dicas visuais.
― 6 min ler
Uma olhada em estratégias para lidar com dados de cauda longa em machine learning.
― 7 min ler
Um novo método melhora a detecção de outliers em conjuntos de dados multi-visão com visões faltando.
― 7 min ler
Um estudo sobre os desafios e soluções para alucinações em MLLMs.
― 5 min ler
Uma estrutura pra lidar com o barulho de dados em técnicas de recuperação cross-modal.
― 6 min ler
Um novo conjunto de dados ajuda a criar ferramentas melhores pra detectar fraudes em documentos de identidade.
― 10 min ler