Yu Qiao

Visão computacional e reconhecimento de padrões Avançando a Visão Computacional com o Projeto Todo-Poderoso

Um novo projeto melhora a compreensão das máquinas sobre informações visuais através de um grande conjunto de dados.

2025-10-12T18:16:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Máscara Guiada por Movimento: Avançando o Aprendizado em Vídeo

Nova técnica de mascaramento melhora o aprendizado em vídeo usando movimento pra treinar melhor os modelos.

2025-10-06T05:35:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando a Restauração de Imagens Cegas com o DiffBIR

DiffBIR oferece uma solução poderosa pra melhorar imagens de baixa qualidade.

2025-10-03T06:45:30+00:00 ― 6 min ler

Análise de EDPs Entendendo os Operadores de Fredholm e Suas Aplicações

Uma olhada nas condições de Fredholm e operadores pseudodiferenciais em matemática e física.

2025-09-29T18:38:57+00:00 ― 7 min ler

Inteligência Artificial Estrutura para Treinamento de Agentes de IA Adaptativa

Um novo método combina modelos de linguagem com aprendizado por reforço para o treinamento de IA.

2025-09-19T19:46:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Vlogger: Uma Nova Ferramenta para Criar Vídeos

Vlogger simplifica o vídeo blog, deixando mais rápido e fácil pra galera que cria conteúdo.

2025-09-16T11:12:00+00:00 ― 7 min ler

Processamento de Imagem e Vídeo A-Eval: Avaliando Modelos de Segmentação de Órgãos Abdominais

A-Eval avalia modelos para segmentar órgãos abdominais em diversos conjuntos de dados.

2025-09-15T17:17:50+00:00 ― 14 min ler

Computação e linguagem Avanço da IA com Técnicas de Raciocínio Estruturado

Um novo método pra melhorar as habilidades de raciocínio e explicação da IA.

2025-09-14T14:33:54+00:00 ― 9 min ler

Robótica Avançando a Geração de Código de Robô com RobotScript

O RobotScript melhora como os robôs executam tarefas a partir da linguagem natural.

2025-09-05T03:58:00+00:00 ― 8 min ler

Robótica Avanços na Síntese de Comportamento de Robôs

Uma nova estrutura melhora as ações dos robôs através de comandos humanos.

2025-09-04T09:55:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços no Reconhecimento de Relações entre Objetos

O Projeto V2 Todo-Poderoso melhora a compreensão da IA sobre as relações entre objetos nas imagens.

2025-09-02T23:57:30+00:00 ― 8 min ler

Computação e linguagem WanJuan-CC: Um Novo Conjunto de Dados para Modelos de Linguagem

Um conjunto de dados de alta qualidade pra treinar modelos de linguagem a partir de conteúdo da web em inglês.

2025-09-02T21:19:30+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços em IA para Direção Autônoma

Modelos de IA melhoram a compreensão das cenas de direção para uma navegação mais segura.

2025-08-31T12:26:42+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões AVIBench: Nova Ferramenta para Avaliar LVLMs Contra Ataques Adversariais

AVIBench testa os LVLMs pra garantir que eles aguentam instruções visuais desafiadoras.

2025-08-29T08:26:12+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avanços em Modelos de Compreensão de Vídeo

Um novo modelo melhora a compreensão de vídeo através de técnicas de treinamento inovadoras.

2025-08-26T20:39:36+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Novo Conjunto de Dados Captura Aprendizado Através da Observação

Pesquisadores criam um conjunto de dados pra estudar como as pessoas aprendem imitando os outros.

2025-08-26T05:31:06+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avanços na Legendagem densa de Vídeo com o Framework DIBS

DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.

2025-08-22T21:35:48+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Lumina-T2X: Uma Nova Era na Criação de Mídia

Transforme texto em imagens, vídeos e áudio de boa com o Lumina-T2X.

2025-08-12T05:14:30+00:00 ― 7 min ler

Robótica Avançando os Carros Autônomos com Tomadas de Decisão Parecidas com as Humanas

Uma nova abordagem melhora os carros autônomos imitando os padrões de pensamento humano.

2025-08-07T12:24:12+00:00 ― 10 min ler

Computação e linguagem Busca Fraca-Para-Forte: Um Novo Jeito de Guiar Modelos de Linguagem Grandes

Este artigo detalha uma abordagem inovadora pra melhorar modelos de linguagem usando modelos menores.

2025-08-05T05:45:42+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Legendagem de Vídeos pra Aprendizado de Máquina Melhor

Um novo conjunto de dados e modelo melhoram a qualidade da legendagem de vídeo para máquinas.

2025-08-01T13:56:24+00:00 ― 6 min ler

Computação e linguagem Avaliando a Segurança em Modelos de Linguagem Multimodais

Uma ferramenta pra avaliar a segurança de modelos de linguagem avançados.

2025-07-30T14:40:18+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços nos Métodos de Treinamento de Modelos de Visão

Nova abordagem melhora o aprendizado a partir de dados intercalados de imagem e texto.

2025-07-30T14:16:36+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Conjunto de Dados OmniCorpus: Um Novo Recurso para Aprendizado Multimodal

Um conjunto de dados completo que junta imagens e texto pra ajudar o aprendizado de máquina.

2025-07-29T22:44:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Novo protocolo define padrão para avaliação de texto para vídeo

Uma abordagem estruturada pra avaliar modelos de texto pra vídeo com eficiência melhorada.

2025-07-29T03:38:54+00:00 ― 14 min ler

Computação e linguagem Avançando Modelos de Linguagem Através de Métodos de Auto-Treinamento

Um novo framework ajuda modelos de linguagem a aprenderem linguagem simbólica sem a ajuda de humanos.

2025-07-27T19:31:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Apresentando o DocGenome: Um Conjunto de Dados para Compreensão de Documentos Científicos

Um novo conjunto de dados melhora a capacidade da IA de processar documentos científicos de forma eficaz.

2025-07-27T17:40:42+00:00 ― 6 min ler

Computação e linguagem Avanços nas Capacidades de Tradução dos Modelos de Linguagem

Pesquisadores melhoram as habilidades de tradução para mais de 100 idiomas, focando em idiomas com poucos recursos.

2025-07-17T07:07:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Uma Nova Maneira de Adicionar Objetos a Imagens Usando Texto

Esse método facilita a adição de objetos em imagens com textos, garantindo resultados naturais.

2025-07-08T14:33:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Tecnologia de Texto para Imagem

Um novo modelo revoluciona a geração de imagens a partir de descrições de texto, melhorando várias indústrias.

2025-07-02T04:22:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Reconstrução de Cena 3D com GigaGS

O GigaGS enfrenta desafios na modelagem de grandes cenas 3D com técnicas inovadoras.

2025-06-14T10:18:06+00:00 ― 6 min ler

Computação e linguagem Melhorando Modelos de Linguagem com Orientação de Valor Integrada

Um método que melhora o alinhamento do modelo de linguagem com as preferências humanas.

2025-06-04T22:46:54+00:00 ― 6 min ler

Computação e linguagem Aprimorando o Raciocínio em Modelos Multimodais

Um novo método melhora as habilidades de raciocínio em modelos de linguagem usando otimização de preferências.

2025-05-22T16:25:03+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões SyncVIS: Transformando a Segmentação de Instâncias em Vídeo

O SyncVIS melhora o rastreamento e a segmentação de objetos em vídeos pra várias aplicações.

2025-04-27T23:24:15+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Otimizando a Compreensão Visual em Modelos de IA

Novo método melhora o desempenho de modelos de linguagem multimodal em tarefas visuais.

2025-01-24T20:33:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Conheça a Vinci: Seu Assistente de Vida Inteligente

A Vinci torna as tarefas do dia a dia mais fáceis com ajuda sem as mãos e orientações em tempo real.

2025-01-18T22:30:27+00:00 ― 8 min ler