Esse artigo fala sobre um novo ponto de referência pra combinar imagens e texto pra encontrar eventos em vídeos.
― 9 min ler
Ciência de ponta explicada de forma simples
Esse artigo fala sobre um novo ponto de referência pra combinar imagens e texto pra encontrar eventos em vídeos.
― 9 min ler
Crie visões realistas a partir de um único vídeo em movimento com a tecnologia D-NPC.
― 11 min ler
Um novo método melhora a transparência do modelo e a confiança em áreas críticas como a saúde.
― 8 min ler
Uma nova maneira de criar imagens tau-PET a partir de exames de MRI pode melhorar a detecção do Alzheimer.
― 7 min ler
Uma nova técnica melhora a confiabilidade das previsões de redes neurais através de ajustes geométricos.
― 9 min ler
Um estudo sobre o uso de câmeras RGBD para melhorar a análise de movimento na reabilitação.
― 7 min ler
Este artigo explora questões sobre como explicar modelos de aprendizado profundo para detecção de doenças em grãos.
― 9 min ler
Esse estudo analisa como os gestos afetam o aprendizado com agentes virtuais.
― 8 min ler
Um conjunto de dados pra testar conexões entre imagem e texto mostra que os modelos têm dificuldade com tarefas de texto pra imagem.
― 7 min ler
Um olhar detalhado sobre um conjunto de dados que captura as atividades humanas do dia a dia.
― 5 min ler
Sistema automatizado melhora a avaliação de imagens de MRI e a precisão do diagnóstico.
― 4 min ler
Novo método melhora a condensação de conjuntos de dados para resultados melhores em aprendizado de máquina.
― 6 min ler
EBSeg melhora a segmentação de imagem equilibrando classes vistas e não vistas de forma eficaz.
― 7 min ler
Um novo método melhora a processação de textos longos em modelos de linguagem de forma eficiente.
― 9 min ler
Um novo benchmark junta estimativa de pose e biomecânica pra uma análise melhor dos movimentos humanos.
― 8 min ler
A LAVIB oferece um grande conjunto de dados pra melhorar as técnicas de interpolação de quadros de vídeo.
― 8 min ler
Um novo conjunto de dados gera sugestões de ação em tempo real para quem assiste a vídeos com foco em si mesmo.
― 9 min ler
Um novo método melhora a adaptabilidade de modelos de aprendizado de máquina em situações dinâmicas.
― 7 min ler
GenMM melhora a inserção realista de objetos 3D em vídeos e scans de LiDAR.
― 7 min ler
O aprendizado de máquina melhora a detecção precoce da espessura do melanoma através de imagens de dermatoscopia.
― 9 min ler
Um novo benchmark ajuda os pesquisadores a melhorar os métodos de detecção de integridade de imagem.
― 7 min ler
Estudo revela como as posições das mãos e as sombras afetam o reconhecimento das ações de lavar as mãos.
― 7 min ler
Um novo método melhora a precisão da segmentação usando técnicas de aprendizado auto-supervisionado.
― 7 min ler
Um novo método melhora a velocidade e a qualidade da geração de imagens.
― 5 min ler
O VCEval oferece uma maneira automatizada de avaliar a eficácia de cursos online.
― 6 min ler
Uma abordagem multimodal melhora como os momentos destacados são identificados em transmissões ao vivo.
― 7 min ler
Um novo método melhora a criação de imagens a partir da poesia clássica chinesa.
― 5 min ler
O WeCLIP melhora a segmentação fraca supervisionada usando o CLIP com o mínimo de esforço de rotulagem.
― 9 min ler
Um conjunto de dados pra testar a compreensão das diferenças de palavras nos modelos de linguagem.
― 6 min ler
Explorando novos métodos para reconhecimento eficiente com poucos exemplos em aprendizado de máquina.
― 9 min ler
Um olhar sobre como a detecção de linhagem neural influencia o desenvolvimento de modelos e a responsabilidade.
― 4 min ler
O FALCON identifica categorias específicas usando rótulos gerais sem precisar de supervisão detalhada.
― 9 min ler
Um novo método melhora a adaptabilidade de modelos de computador para imagens de satélite e médicas.
― 8 min ler
Um novo benchmark foca na composicionalidade na compreensão de vídeos e em modelos de linguagem.
― 7 min ler
Um novo método melhora a clareza na tomada de decisões de modelos de IA.
― 6 min ler
Pesquisadores tão usando aprendizado auto-supervisionado pra melhorar a classificação da Doença de Alzheimer por meio de exames de MRI.
― 8 min ler
Apresentando a evolução do modelo para melhorar o desempenho do modelo de linguagem sem precisar de dados de treinamento extras.
― 8 min ler
Apresentando o Codificador Universal de Cérebro para insights de imagem cerebral melhorados.
― 8 min ler
Um novo framework resolve os desafios de contar ações repetitivas em vídeos.
― 6 min ler
O método MiSuRe melhora a clareza na segmentação de imagem usando mapas de saliência.
― 9 min ler