Novo conjunto de dados UIT-OpenViIC melhora a legenda de imagens para falantes de vietnamita.
― 5 min ler
Ciência de ponta explicada de forma simples
Novo conjunto de dados UIT-OpenViIC melhora a legenda de imagens para falantes de vietnamita.
― 5 min ler
Novas ferramentas e conjuntos de dados melhoram a compreensão dos sinais fisiológicos através da análise de vídeo.
― 7 min ler
Um novo método melhora a detecção de elementos de gráfico usando contexto.
― 7 min ler
Um novo modelo melhora a classificação de doenças cardiovasculares usando dados de Raman e histórico médico.
― 7 min ler
O PointCMP enfrenta desafios para aprender de vídeos de nuvem de pontos 3D de forma eficiente.
― 6 min ler
Descubra como a redução de ruído melhora a qualidade de fotos e vídeos em várias áreas.
― 7 min ler
Uma nova abordagem combina texto e áudio pra melhorar a sincronização de vídeo.
― 7 min ler
LEO melhora a qualidade do vídeo separando movimento e aparência na síntese humana.
― 6 min ler
O MOVGAN simplifica a criação de vídeos com múltiplos objetos usando layouts de imagem única.
― 5 min ler
Novos métodos usando deep learning melhoram a avaliação de tumores em pacientes com glioblastoma pós-cirurgia.
― 7 min ler
Nova abordagem aumenta a precisão do reconhecimento facial usando imagens de profundidade mais claras.
― 6 min ler
A função de ativação TaLU melhora as tarefas de deep learning e lida com valores de entrada negativos.
― 5 min ler
Novos métodos para uma classificação de roupas melhor focam na eficiência dos dados.
― 5 min ler
Novo framework melhora a previsão de iluminação interna para aplicações de realidade aumentada.
― 7 min ler
Um novo método melhora a qualidade da imagem para cenas reflexivas em gráficos de computador.
― 5 min ler
Um novo conjunto de dados ajuda a analisar como os gatos expressam seus sentimentos.
― 4 min ler
RATs-GCN e P3S oferecem soluções eficientes de design de CNN.
― 5 min ler
Novo método revela preconceitos na precisão do software de reconhecimento de imagens.
― 5 min ler
Um novo método melhora o reconhecimento de categorias raras em imagens.
― 7 min ler
O CHATTY quer reduzir a confusão de classe em modelos de aprendizado de máquina durante a adaptação de domínio.
― 7 min ler
Um novo sistema rastreia os movimentos das pessoas dentro de casa, garantindo a privacidade.
― 7 min ler
Dois modelos quânticos melhoram a eficiência e a precisão da classificação de imagens.
― 6 min ler
Um novo modelo melhora a detecção de trincas em pavimentos de concreto asfáltico.
― 7 min ler
Este estudo avalia GANs na melhoria da classificação de raios-X do tórax por meio de aumento de dados.
― 9 min ler
Usando tecnologia pra classificar as principais culturas por meio de imagens tiradas do solo.
― 7 min ler
Aprenda como o NerfAcc melhora a renderização do NeRF com métodos de amostragem melhores.
― 7 min ler
Esse método usa dados de áudio e vídeo pra resumir vídeos de forma eficaz.
― 6 min ler
Aprenda como o Tensor PCA simplifica a análise de dados de alta dimensão de forma eficaz.
― 8 min ler
Um modelo que junta imagens e texto pra ter conversas melhores.
― 6 min ler
A pesquisa mostra como o viés de atenção gaussiana melhora a compreensão espacial em transformers de visão.
― 7 min ler
ElasticHash usa aprendizado profundo para buscas de imagem rápidas e precisas.
― 6 min ler
Um novo método ajuda modelos a aprenderem com apenas um exemplo de dado.
― 7 min ler
Um novo modelo melhora a segmentação de documentos usando técnicas avançadas de transformers.
― 6 min ler
Novos métodos expõem vulnerabilidades de privacidade em serviços de localização visual.
― 8 min ler
A aprendizagem auto-supervisionada da IA melhora a detecção de retinopatia diabética com menos imagens rotuladas.
― 6 min ler
Uma nova técnica de radar melhora a precisão do mapeamento urbano com dados limitados.
― 4 min ler
Um novo método melhora a detecção de dispositivos inteligentes em espaços internos desafiadores.
― 5 min ler
Saiba como o CrAFT melhora a compressão de modelos sem perder desempenho.
― 6 min ler
Um novo conjunto de dados melhora a precisão na correspondência de texto para imagem.
― 6 min ler
Atualizando modelos de percepção de cor para imagens complexas.
― 7 min ler