Wei Xue

Computação e linguagem Apresentando o LyricWhiz: Transformando a Transcrição de Letras

LyricWhiz junta modelos avançados pra melhorar a precisão da transcrição de letras em várias línguas.

2025-10-15T09:51:10+00:00 ― 7 min ler

Computação e linguagem Avanços em Aprendizado Contínuo para Sistemas de Diálogo

Novos métodos melhoram o aprendizado de tarefas e a retenção em sistemas de diálogo.

2025-09-27T04:44:24+00:00 ― 7 min ler

Som MuPT: Avançando a Geração de Música com Notação ABC

MuPT usa a notação ABC pra gerar música com IA de jeito eficaz.

2025-08-12T09:00:00+00:00 ― 6 min ler

Processamento de Áudio e Fala FlashSpeech: Um Salto na Síntese de Fala

A FlashSpeech oferece soluções de síntese de fala rápidas e de alta qualidade.

2025-08-10T03:33:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Gestos com o CoCoGesture

CoCoGesture cria gestos realistas que combinam com as palavras faladas, melhorando a interação.

2025-08-06T05:04:00+00:00 ― 6 min ler

Inteligência Artificial O Futuro da Geração Multimodal com LLMs

Explore como os modelos de linguagem grande aumentam a criatividade através da geração de multimídia.

2025-08-04T21:12:12+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Geração de Música Inovadora para Vídeos

Um novo método pra criar músicas que se encaixam bem no conteúdo de vídeo.

2025-08-01T13:48:30+00:00 ― 9 min ler

Física de Altas Energias - Fenomenologia Produção de Partículas Durante a Inflação: Um Olhar Mais Próximo

Este estudo explora como as partículas se formam durante a fase de inflação do universo.

2025-07-29T08:20:45+00:00 ― 8 min ler

Aprendizagem de máquinas Avanços na Assimilação de Dados com VAE-Var

Um novo algoritmo melhora as previsões ao modelar os erros de fundo de forma mais precisa.

2025-07-29T00:29:45+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões MMTrail: Um Conjunto de Dados de Vídeo Completo para Modelos de Linguagem

O MMTrail combina descrições visuais e sonoras para melhorar os modelos de linguagem em vídeo.

2025-07-08T06:53:20+00:00 ― 5 min ler

Som Avaliação de Modelos de Linguagem Grandes na Criação Musical

Este estudo analisa como os LLMs entendem e geram música.

2025-07-07T10:38:45+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando a Eficiência em Modelos de Linguagem

Um novo método melhora os modelos de linguagem pra ter um desempenho melhor e usar menos recursos.

2025-07-02T19:46:48+00:00 ― 6 min ler

Aprendizagem de máquinas NoRA: Uma Nova Abordagem para Ajustar Modelos Grandes

NoRA oferece uma forma mais inteligente de adaptar grandes modelos com menos recursos.

2025-06-26T11:10:42+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Áudio: Apresentando o X-Codec

X-Codec melhora a geração de áudio ao integrar compreensão semântica no processamento.

2025-06-21T15:41:45+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Modelagem 3D a partir de Imagens Únicas

Um novo método oferece modelagem 3D melhorada a partir de uma única imagem, aumentando o realismo.

2025-06-11T04:13:24+00:00 ― 8 min ler

Som Extração de Falante Alvo: Melhorando a Clareza em Ambientes Barulhentos

Saiba como o TSE melhora o reconhecimento de fala em ambientes cheios usando dicas de texto.

2025-05-25T00:14:51+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Geração de Vídeos de Canto Revolucionários

Pesquisadores desenvolvem novo modelo para vídeos de canto animado, melhorando as animações.

2025-04-16T10:39:00+00:00 ― 7 min ler

Física de Altas Energias - Fenomenologia Axions e Cordas Cósmicas: Uma Conexão com a Matéria Escura

Explorando a conexão entre axions, cordas cósmicas e os mistérios da matéria escura.

2025-02-28T14:15:54+00:00 ― 6 min ler