Yike Guo

Computação e linguagem Apresentando o LyricWhiz: Transformando a Transcrição de Letras

LyricWhiz junta modelos avançados pra melhorar a precisão da transcrição de letras em várias línguas.

2025-10-15T09:51:10+00:00 ― 7 min ler

Som Avanços em Aprendizado Auto-supervisionado para Análise de Música

Explorando o potencial da aprendizagem auto-supervisionada em recuperação de informações musicais.

2025-10-10T10:00:50+00:00 ― 7 min ler

Aprendizagem de máquinas Uma Nova Abordagem para Prever Incêndios Florestais

Pesquisadores desenvolvem um modelo rápido para previsão de incêndios florestais em tempo real usando aprendizado de máquina.

2025-10-02T07:21:21+00:00 ― 7 min ler

Computação e linguagem Avanços em Aprendizado Contínuo para Sistemas de Diálogo

Novos métodos melhoram o aprendizado de tarefas e a retenção em sistemas de diálogo.

2025-09-27T04:44:24+00:00 ― 7 min ler

Processamento de Áudio e Fala FlashSpeech: Um Salto na Síntese de Fala

A FlashSpeech oferece soluções de síntese de fala rápidas e de alta qualidade.

2025-08-10T03:33:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Geração de Imagem 3D de Alta Qualidade a Partir de Visões Únicas

Um método novo pra criar imagens 3D detalhadas a partir de imagens únicas usando difusão multivista.

2025-08-10T01:29:48+00:00 ― 5 min ler

Computação e linguagem Técnicas de Crescimento Inovadoras para Treinamento de LLM

Novos métodos pra treinar modelos de linguagem grandes de forma mais eficiente aparecem.

2025-08-07T12:08:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Gestos com o CoCoGesture

CoCoGesture cria gestos realistas que combinam com as palavras faladas, melhorando a interação.

2025-08-06T05:04:00+00:00 ― 6 min ler

Inteligência Artificial O Futuro da Geração Multimodal com LLMs

Explore como os modelos de linguagem grande aumentam a criatividade através da geração de multimídia.

2025-08-04T21:12:12+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Geração de Música Inovadora para Vídeos

Um novo método pra criar músicas que se encaixam bem no conteúdo de vídeo.

2025-08-01T13:48:30+00:00 ― 9 min ler

Aprendizagem de máquinas Avançando a Regressão Simbólica com Busca em Árvore Paralelizada

Um novo método melhora a busca por expressões matemáticas a partir de dados.

2025-07-18T12:44:30+00:00 ― 7 min ler

Computadores e sociedade Uma Nova Abordagem para Gestão de Dados

A Honest Computing foca em confiança e ética no tratamento de dados.

2025-07-10T08:41:24+00:00 ― 11 min ler

Visão computacional e reconhecimento de padrões MMTrail: Um Conjunto de Dados de Vídeo Completo para Modelos de Linguagem

O MMTrail combina descrições visuais e sonoras para melhorar os modelos de linguagem em vídeo.

2025-07-08T06:53:20+00:00 ― 5 min ler

Som Avaliação de Modelos de Linguagem Grandes na Criação Musical

Este estudo analisa como os LLMs entendem e geram música.

2025-07-07T10:38:45+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando a Eficiência em Modelos de Linguagem

Um novo método melhora os modelos de linguagem pra ter um desempenho melhor e usar menos recursos.

2025-07-02T19:46:48+00:00 ― 6 min ler

Aprendizagem de máquinas NoRA: Uma Nova Abordagem para Ajustar Modelos Grandes

NoRA oferece uma forma mais inteligente de adaptar grandes modelos com menos recursos.

2025-06-26T11:10:42+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Áudio: Apresentando o X-Codec

X-Codec melhora a geração de áudio ao integrar compreensão semântica no processamento.

2025-06-21T15:41:45+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços na Previsão de Incêndios Florestais com Modelos Substitutos

Novos modelos melhoram a velocidade e a precisão das previsões de incêndios florestais.

2025-06-19T20:31:12+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avançando a Modelagem 3D a partir de Imagens Únicas

Um novo método oferece modelagem 3D melhorada a partir de uma única imagem, aumentando o realismo.

2025-06-11T04:13:24+00:00 ― 8 min ler

Aprendizagem de máquinas A Previsão de Incêndios ganha força com o FIDN

Nova ferramenta preditiva melhora a gestão e estratégias de resposta a incêndios florestais.

2025-04-23T19:22:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Geração de Vídeos de Canto Revolucionários

Pesquisadores desenvolvem novo modelo para vídeos de canto animado, melhorando as animações.

2025-04-16T10:39:00+00:00 ― 7 min ler