Heracles combina transformadores e modelos de espaço de estados pra melhorar o processamento de dados.
― 7 min ler
Ciência de ponta explicada de forma simples
Heracles combina transformadores e modelos de espaço de estados pra melhorar o processamento de dados.
― 7 min ler
Artigos mais recentes
CIRP melhora a representação dos produtos pra fazer combos online melhores.
― 10 min ler
Explorando como o IoS pode transformar nossas experiências digitais ao envolver todos os sentidos.
― 12 min ler
DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.
― 9 min ler
Combinar imagens e texto melhora a precisão na estimativa de profundidade 3D.
― 8 min ler
WebXR transforma a maneira como a gente interage com ambientes digitais imersivos.
― 10 min ler
Novo método melhora a síntese de fala para pessoas que não conseguem falar.
― 8 min ler
AniFrame torna a programação de arte acessível para iniciantes com uma abordagem fácil de usar.
― 7 min ler
Novo conjunto de dados melhora a geração de imagens a partir de legendas de notícias complexas.
― 8 min ler
Um novo método melhora a checagem de fatos sobre as afirmações nas redes sociais.
― 8 min ler
O Shotit permite que os usuários encontrem vídeos rapidinho usando imagens, facilitando o processo de busca.
― 7 min ler
Uma nova estrutura pra melhorar recomendações sem dados prévios.
― 9 min ler
O Pegasus-1 permite que os usuários interajam com vídeos usando linguagem natural.
― 8 min ler
O GaussianTalker oferece sincronização labial natural e visuais de alta qualidade para vídeos de pessoas falando.
― 8 min ler
Uma nova abordagem permite que máquinas identifiquem personagens de quadrinhos sem treinamento prévio.
― 7 min ler
A Mimosa facilita a criação de áudio espacial pra galera que faz vídeos amadores.
― 9 min ler
O Desafio AIS 2024 busca melhorar as avaliações de qualidade de vídeo usando deep learning.
― 6 min ler
O GaussianTalker transforma a interação digital com cabeças falantes super realistas.
― 7 min ler
Legendas tão tão importantes pra melhorar a experiência de quem assiste nos serviços de streaming.
― 9 min ler
Pesquisas trazem técnicas inovadoras pra melhorar a detecção de vídeos deepfake.
― 7 min ler
Um novo conjunto de dados melhora a forma como os robôs interpretam ambientes do mundo real.
― 8 min ler
UniAV combina localização de ações, detecção de som e localização de eventos audiovisuais pra uma melhor compreensão de vídeos.
― 9 min ler
Um novo método melhora o desempenho da detecção de objetos usando consultas adaptativas.
― 8 min ler
Explorando a habilidade humana de identificar vídeos deepfake em comparação com a detecção por IA.
― 7 min ler
Explorando como a IA tá mudando os processos de produção de vídeo pra cineastas.
― 7 min ler
PEAVS analisa como o áudio e o vídeo funcionam juntos pra melhorar a experiência do espectador.
― 8 min ler
O CinePile desafia a compreensão de vídeos longos com 305.000 perguntas diversas.
― 7 min ler
Um método novo que protege imagens médicas na nuvem usando técnicas quânticas avançadas.
― 9 min ler
Um novo método melhora a precisão do rastreamento de alimentos usando modelos 3D e imagens 2D.
― 7 min ler
Esse estudo mostra como o contexto melhora a compreensão das máquinas sobre imagens e perguntas.
― 8 min ler
Um novo codec de áudio que oferece compressão de alta qualidade e conteúdo semântico rico.
― 7 min ler
Um estudo apresenta um novo método para criar vídeos de rosto falante sincronizados.
― 6 min ler
Explore como os modelos de linguagem grande aumentam a criatividade através da geração de multimídia.
― 9 min ler
Explorando os benefícios do esboço 3D imersivo para arquitetos e designers.
― 7 min ler
Apresentando um modelo que gera áudio e vídeo sincronizados com níveis de ruído mistos.
― 7 min ler
Esse artigo fala sobre um novo modelo simples pra gerar áudio a partir de imagens e vice-versa.
― 5 min ler
Novas técnicas melhoram a qualidade e o treinamento para imagens 3D.
― 8 min ler
A NuNet usa dados RGB e de profundidade pra fazer estimativas de nutrição melhores.
― 7 min ler
Um novo método melhora o alinhamento de áudio e vídeo usando modelos pré-treinados.
― 7 min ler
Um novo método pra melhorar os mecanismos de atenção em processamento de dados complexos.
― 8 min ler
Explorando como a IA melhora o streaming de vídeo enquanto promove a eficiência energética.
― 8 min ler