Informática - Visão computacional e reconhecimento de padrões

RSS

Visão computacional e reconhecimento de padrões Avançando a Compreensão de Cena 3D a partir de Imagens 2D

Um novo framework melhora a representação de cenas 3D usando imagens 2D limitadas.

2025-07-27T23:44:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Renderização de Cenas 3D

Um novo método melhora a eficiência e a qualidade na renderização de grandes cenas usando Gaussianos 3D.

2025-07-27T23:12:30+00:00 ― 8 min ler

Processamento de Imagem e Vídeo Deep Learning para Detecção de Ascite em Imagens Médicas

Um estudo explora métodos automatizados pra medir ascite usando algoritmos de aprendizado de máquina.

2025-07-27T22:57:25+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Poda Personalizada Adaptativa em Geração de Imagens

APTP melhora modelos de texto-para-imagem pra mais eficiência e qualidade.

2025-07-27T22:33:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Correspondência Imagem-Texto com Grafos de Cena

Uma nova abordagem pra melhorar a correspondência entre imagem e texto usando modelos de dois encoders e gráficos de cena.

2025-07-27T20:26:36+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando a Eficácia de Sensores Visuais Básicos na Robótica

Pesquisas mostram que sensores simples podem competir com câmeras complexas em tarefas de robôs.

2025-07-27T20:02:54+00:00 ― 7 min ler

Processamento de Imagem e Vídeo Avançando a Imagem do Pulmão com Tecnologia de IA

Novo modelo de IA transforma raios-X de tórax 2D em tomografias 3D.

2025-07-27T19:43:05+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o Latent Denoising Diffusion GAN pra gerar imagens mais rápido

Um novo modelo que acelera a criação de imagens de alta qualidade usando técnicas inovadoras.

2025-07-27T18:59:42+00:00 ― 8 min ler

Computação e linguagem Viés Cultural em Modelos de Visão-Linguagem

Analisando como o viés cultural afeta a compreensão de imagens pela IA.

2025-07-27T18:12:18+00:00 ― 10 min ler

Visão computacional e reconhecimento de padrões Apresentando o DocGenome: Um Conjunto de Dados para Compreensão de Documentos Científicos

Um novo conjunto de dados melhora a capacidade da IA de processar documentos científicos de forma eficaz.

2025-07-27T17:40:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Classificação Semântica Hierárquica

Um novo método melhora a precisão e a consistência em tarefas de classificação hierárquica.

2025-07-27T17:17:00+00:00 ― 10 min ler

Visão computacional e reconhecimento de padrões Apresentando o STimage-1K4M: Um Novo Conjunto de Dados para Histopatologia

O STimage-1K4M junta imagens detalhadas e dados genéticos pra melhorar a pesquisa sobre doenças.

2025-07-27T16:51:48+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões O Papel dos Gêmeos Digitais Cardíacos na Saúde do Coração

Descubra como os modelos virtuais de coração estão mudando o atendimento ao paciente.

2025-07-27T15:50:06+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Uma Nova Estrutura para Classificação de Vídeo em Tempo Real

Apresentando um método pra classificar vídeos rapidão com base na análise dos primeiros quadros.

2025-07-27T15:42:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Segmentação de Partes de Vocabulário Aberto com o PartCLIPSeg

O PartCLIPSeg melhora a segmentação de partes na visão computacional pra uma melhor reconhecimento de objetos.

2025-07-27T14:46:54+00:00 ― 6 min ler

Inteligência Artificial Avançando Agentes GUI com Conjuntos de Dados GUICourse

O GUICourse tem como objetivo melhorar a interação com interfaces digitais através de conjuntos de dados específicos para agentes de GUI.

2025-07-27T13:51:36+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços na Detecção de Objetos 3D com TODA

Um novo método melhora a detecção de objetos 3D usando dados de LiDAR.

2025-07-27T13:43:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o VideoVista: Um Novo Padrão para QA de Vídeo

A VideoVista oferece uma avaliação completa para modelos de perguntas e respostas em vídeo.

2025-07-27T13:35:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o MINT-1T: Um Novo Conjunto de Dados para Modelos Multimodais

MINT-1T é o maior conjunto de dados open-source pra treinar modelos multimodais.

2025-07-27T13:20:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Geração de Movimento Humano em 2D

Um novo conjunto de dados 2D de movimento humano abre portas para animações realistas.

2025-07-27T13:12:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em Métodos de Recuperação de Pixel

Novas técnicas melhoram a velocidade e a precisão em tarefas de busca de imagens.

2025-07-27T12:48:24+00:00 ― 10 min ler

Aprendizagem de máquinas Avaliação de Contextos Longos em Modelos Multimodais

Os testes de benchmark do MMNeedle avaliam modelos multimodais nas capacidades de lidar com contextos longos.

2025-07-27T12:16:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Revolucionando a Detecção de Mudança de Cena para Robôs

Novos métodos melhoram a capacidade dos robôs de detectar mudanças no ambiente sem precisar de treinamento.

2025-07-27T12:01:00+00:00 ― 7 min ler

Robótica Desafios na Criação de Mapas em Alta Definição para Carros Autônomos

Esse estudo avalia como os métodos de mapa HD se saem em condições adversas.

2025-07-27T11:53:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Uma Nova Abordagem para a Imagem da Incerteza

Apresentando soluções potenciais para tarefas de imagem complexas com clareza.

2025-07-27T10:49:12+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Melhorando Relatórios de Raios-X de Tórax com Dados do Paciente

Combinar dados dos pacientes com raios-X do tórax melhora a precisão dos relatórios e o cuidado com os pacientes.

2025-07-27T10:02:30+00:00 ― 8 min ler

Processamento de Imagem e Vídeo Apresentando o SLOctolyzer: Uma Nova Ferramenta para Análise Retinal

O SLOctolyzer automatiza a análise de imagens da retina, ajudando na pesquisa sobre a saúde dos olhos.

2025-07-27T10:00:05+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões SwinStyleformer: Avançando a Inversão e Edição de Imagens

Um novo modelo melhora a inversão e edição de imagens, aumentando a qualidade e a preservação de detalhes.

2025-07-27T09:38:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Adaptando Transformadores de Vídeo para Monitoramento de Saúde Remota

Este estudo analisa o uso de Transformadores de Vídeo Gerais para melhorar a medição fisiológica remota.

2025-07-27T09:15:06+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Aprimorando Técnicas de Segmentação de Vasos Sanguíneos

Novos métodos melhoram a precisão da segmentação de vasos sanguíneos em imagens médicas.

2025-07-27T09:07:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões VTrUNet: Melhorando a Detecção de Fumaça de Satélites

Um novo modelo melhora a detecção de fumaça usando imagens de satélite em condições desafiadoras.

2025-07-27T08:43:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando a Detecção de Estresse em Plantas com Aumento de Dados

Um novo método aumenta a precisão na identificação do estresse em plantas usando aumento de dados automatizado.

2025-07-27T08:19:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Examinando Redes Neurais e Sua Confiabilidade

Um olhar sobre redes neurais, incertezas e seu impacto na tomada de decisões da IA.

2025-07-27T07:48:12+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Detecção de Mudanças Usando Transformers Visuais

O novo modelo ChangeViT melhora a detecção de mudanças em imagens de satélite e drones.

2025-07-27T07:40:18+00:00 ― 9 min ler

Processamento de Imagem e Vídeo Avanço no Diagnóstico do Câncer de Rim com LACPANet

LACPANet melhora a análise de tumores renais usando imagens de TC em múltiplas fases.

2025-07-27T07:34:20+00:00 ― 8 min ler

Aprendizagem de máquinas Os Riscos dos Agentes Multimodais: Entendendo Ataques Adversariais

Explorando os desafios de segurança trazidos por ataques adversariais em agentes multimodais.

2025-07-27T07:24:30+00:00 ― 7 min ler

Aprendizagem de máquinas Avançando o Mapeamento de Prospectividade Mineral com Aprendizado de Máquina

Um novo método melhora as previsões de localização de minerais usando aprendizado auto-supervisionado.

2025-07-27T06:37:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando as Previsões de Resposta Neural com Auto-Atenção

Pesquisas mostram como a autoatenção melhora a modelagem da resposta neural em deep learning.

2025-07-27T05:19:36+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando o Aprendizado Federado com uma Única Imagem

Um novo método melhora o aprendizado federado usando só uma imagem para treino.

2025-07-27T05:18:06+00:00 ― 7 min ler

Computação e linguagem SeTAR: Uma Nova Abordagem pra Detecção de OOD

Apresentando o SeTAR, uma solução sem treinamento para detectar dados fora da distribuição em redes neurais.

2025-07-27T04:38:36+00:00 ― 8 min ler