Apresentando o Otter, um modelo que melhora o seguimento de instruções usando dados visuais e textuais.
― 6 min ler
Ciência de ponta explicada de forma simples
Apresentando o Otter, um modelo que melhora o seguimento de instruções usando dados visuais e textuais.
― 6 min ler
A impressão digital de avatares ajuda a verificar o consentimento no uso de mídias sintéticas.
― 6 min ler
Esse artigo fala sobre como melhorar modelos de visão-linguagem pra combinar melhor objetos e atributos.
― 6 min ler
Novo conjunto de dados melhora a análise de texto e imagens em páginas da web.
― 8 min ler
Combinando aprendizado profundo e métodos tradicionais pra reconstrução de imagem.
― 8 min ler
HSCNet++ melhora a precisão e eficiência da localização visual usando aprendizado hierárquico e transformers.
― 7 min ler
Novos métodos melhoram a eficiência e acessibilidade do design de CNNs.
― 6 min ler
Novas abordagens pra melhorar o desempenho do modelo em classes raras no reconhecimento visual.
― 7 min ler
Métodos de reconstrução levantam questões de privacidade em aprendizado de máquina, criando a necessidade de proteções mais fortes.
― 5 min ler
Um novo conjunto de dados melhora as buscas de vídeo incluindo tanto dados de texto quanto de vídeo.
― 6 min ler
Pesquisadores melhoram a IA pra gerar padrões simétricos lindões pra artistas.
― 6 min ler
Novos métodos melhoram a precisão e a eficiência em identificar texto em vídeos.
― 6 min ler
O modelo DDMM gera imagens de raios-X e segmentações de alta qualidade usando dados rotulados e não rotulados.
― 6 min ler
Analisando o papel dos Transformers de Visão nas técnicas e aplicações de segmentação semântica.
― 8 min ler
Uma abordagem nova usando dados históricos melhora as previsões da temperatura da superfície do mar.
― 7 min ler
Um novo modelo melhora a redução de ruídos em imagens hiperespectrais para uma análise melhor.
― 6 min ler
Novo conjunto de dados UIT-OpenViIC melhora a legenda de imagens para falantes de vietnamita.
― 5 min ler
Novas ferramentas e conjuntos de dados melhoram a compreensão dos sinais fisiológicos através da análise de vídeo.
― 7 min ler
Um novo método melhora a detecção de elementos de gráfico usando contexto.
― 7 min ler
Um novo modelo melhora a classificação de doenças cardiovasculares usando dados de Raman e histórico médico.
― 7 min ler
O PointCMP enfrenta desafios para aprender de vídeos de nuvem de pontos 3D de forma eficiente.
― 6 min ler
Descubra como a redução de ruído melhora a qualidade de fotos e vídeos em várias áreas.
― 7 min ler
Uma nova abordagem combina texto e áudio pra melhorar a sincronização de vídeo.
― 7 min ler
LEO melhora a qualidade do vídeo separando movimento e aparência na síntese humana.
― 6 min ler
O MOVGAN simplifica a criação de vídeos com múltiplos objetos usando layouts de imagem única.
― 5 min ler
Novos métodos usando deep learning melhoram a avaliação de tumores em pacientes com glioblastoma pós-cirurgia.
― 7 min ler
Nova abordagem aumenta a precisão do reconhecimento facial usando imagens de profundidade mais claras.
― 6 min ler
A função de ativação TaLU melhora as tarefas de deep learning e lida com valores de entrada negativos.
― 5 min ler
Novos métodos para uma classificação de roupas melhor focam na eficiência dos dados.
― 5 min ler
Novo framework melhora a previsão de iluminação interna para aplicações de realidade aumentada.
― 7 min ler
Um novo método melhora a qualidade da imagem para cenas reflexivas em gráficos de computador.
― 5 min ler
Um novo conjunto de dados ajuda a analisar como os gatos expressam seus sentimentos.
― 4 min ler
RATs-GCN e P3S oferecem soluções eficientes de design de CNN.
― 5 min ler
Novo método revela preconceitos na precisão do software de reconhecimento de imagens.
― 5 min ler
Um novo método melhora o reconhecimento de categorias raras em imagens.
― 7 min ler
O CHATTY quer reduzir a confusão de classe em modelos de aprendizado de máquina durante a adaptação de domínio.
― 7 min ler
Um novo sistema rastreia os movimentos das pessoas dentro de casa, garantindo a privacidade.
― 7 min ler
Dois modelos quânticos melhoram a eficiência e a precisão da classificação de imagens.
― 6 min ler
Um novo modelo melhora a detecção de trincas em pavimentos de concreto asfáltico.
― 7 min ler
Este estudo avalia GANs na melhoria da classificação de raios-X do tórax por meio de aumento de dados.
― 9 min ler