A impressão digital de tarefas pode transformar o compartilhamento de conhecimento em imagem médica.
― 6 min ler
Ciência de ponta explicada de forma simples
A impressão digital de tarefas pode transformar o compartilhamento de conhecimento em imagem médica.
― 6 min ler
Um método proativo usando Modelos de Linguagem Visual tem como objetivo detectar ataques backdoor ocultos.
― 8 min ler
Pesquisas mostram um novo parâmetro pra melhorar a compreensão de geometria pela IA.
― 6 min ler
Explore o novo conjunto de dados VisionArena que melhora as interações de IA com chats de usuários reais.
― 6 min ler
O StreamChat muda a forma como a gente interage com vídeo em streaming em tempo real.
― 8 min ler
Descubra um jeito mais rápido e fácil de editar malhas 3D que aumenta a criatividade.
― 6 min ler
Saiba como a FPA melhora a geração de imagens a partir de descrições em texto de forma rápida e precisa.
― 7 min ler
Esse novo método facilita a edição de imagens usando comandos de texto.
― 7 min ler
Tecnologia avançada fecha a distância entre design e criação de roupas.
― 6 min ler
Descubra como o ASDnB melhora a detecção de falantes através da linguagem corporal e expressões faciais.
― 9 min ler
Robôs de IA aprendem a navegar assistindo vídeos de ambientes internos do mundo real pra melhorar seus movimentos.
― 8 min ler
O SAM-Mix melhora a análise de imagens médicas, diminuindo o trabalho manual e aumentando a precisão.
― 7 min ler
Veja roupas como nunca antes com imagens planas para compras online.
― 7 min ler
Descubra um novo jeito de criar programas visuais de forma rápida e barata.
― 5 min ler
Uma nova ferramenta que combina imagens de satélite e do solo pra melhorar o mapeamento de terras.
― 8 min ler
Uma nova abordagem combina campos neurais e modelos de deformação para captura de movimento 3D detalhada.
― 7 min ler
Uma mergulhada em como os computadores identificam ações humanas com objetos.
― 7 min ler
Aprenda como combinar texto e imagens melhora a análise de sentimentos.
― 6 min ler
Descubra como o aprendizado self-supervisionado muda a detecção de Alzheimer na imagem do cérebro.
― 7 min ler
Nova tecnologia gera imagens realistas de pessoas com facilidade.
― 7 min ler
Descubra como a CAT melhora o aprendizado de máquina com estratégias de dados inovadoras.
― 8 min ler
Descubra como o POINTS1.5 melhora as habilidades de processamento de imagem e texto.
― 7 min ler
WavFusion junta áudio, texto e visuais pra reconhecer emoções de forma melhor.
― 6 min ler
A LOMA junta características visuais e de linguagem pra melhorar as previsões em 3D.
― 7 min ler
Um novo framework melhora a rotulagem de dados para carros autônomos.
― 7 min ler
Novos métodos melhoram previsões de vídeo usando menos dados.
― 7 min ler
ALoRE otimiza o treinamento de modelos pra reconhecimento de imagem de forma eficiente e pra aplicações mais amplas.
― 8 min ler
Como a previsão de ocupação 3D tá moldando a tecnologia de veículos autônomos.
― 7 min ler
O framework DMIC inovador melhora o reconhecimento de pessoas em diferentes tipos de câmeras.
― 7 min ler
Um novo método pra avaliar a geração de imagens e vídeos pela IA usando gráficos de cena.
― 7 min ler
O TextRefiner melhora o desempenho dos Modelos de Linguagem e Visão, deixando eles mais rápidos e precisos.
― 7 min ler
Aprenda como evitar o colapso do modelo em modelos generativos usando dados reais.
― 7 min ler
Descubra como ilusões visuais impactam modelos de VQA e seu desempenho.
― 6 min ler
AsyncDSB oferece uma maneira mais esperta de restaurar imagens danificadas de forma criativa.
― 6 min ler
Aprenda como modelos de IA leves conseguem reter conhecimento de forma eficiente.
― 8 min ler
Descubra como modelos de linguagem visual conectam imagens e texto para máquinas mais inteligentes.
― 8 min ler
Nova tecnologia melhora a detecção precoce de derramamentos de petróleo pra proteger a vida marinha.
― 7 min ler
Modelos de Visão-Linguagem enfrentam desafios em entender a estrutura da linguagem para tarefas de imagem e texto.
― 7 min ler
Aprenda como a estrutura HIST melhora a compreensão de imagens e textos.
― 8 min ler
Um olhar sobre como o Doubly-UAP engana modelos de IA com imagens e texto.
― 6 min ler