Artigos mais recentes para Multimodal

Visão computacional e reconhecimento de padrões Apresentando a Máscara de Atenção Aprendível para Tarefas Multimodais

Um novo método pra melhorar os mecanismos de atenção em processamento de dados complexos.

2025-08-02T16:00:36+00:00 ― 8 min ler

Aprendizagem de máquinas Melhorando o Reconhecimento de Atividades Humanas com Dados Multimodais

Uma nova abordagem melhora o reconhecimento de atividades ao combinar vários tipos de dados.

2025-08-01T05:30:48+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Setokim: Avançando Modelos de Linguagem Multimodais

Setokim melhora a fusão da compreensão visual e textual através de uma tokenização inovadora.

2025-08-01T00:06:54+00:00 ― 9 min ler

Computação e linguagem mOSCAR: Um Novo Conjunto de Dados para IA Multimodal

mOSCAR oferece um conjunto de dados multilíngue pra melhorar a compreensão de texto e imagens pela IA.

2025-07-30T03:13:00+00:00 ― 7 min ler

Aprendizagem de máquinas Integrando Visão e Linguagem no Cérebro

Esse estudo mostra como o cérebro junta informações visuais e de linguagem.

2025-07-22T21:29:48+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avaliando Aprendizado Multimodal em Modelos de Linguagem

Esse estudo analisa como dados visuais e textuais afetam o desempenho do modelo.

2025-07-22T07:03:54+00:00 ― 8 min ler

Computação e linguagem Uma Nova Abordagem para Previsões de Modelos

Método de conjunto inovador melhora a precisão de modelos de linguagem e visuais.

2025-07-19T17:10:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Segmentação Audiovisual Referente: Uma Nova Abordagem

Combinar áudio e informação visual melhora o reconhecimento de objetos em vídeos.

2025-07-13T10:17:30+00:00 ― 7 min ler

Computação e linguagem Melhorando a Detecção de Fake News com o Framework IMFND

Uma nova estrutura melhora a detecção de fake news usando texto e imagens.

2025-07-12T22:34:24+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços nas Técnicas de Aprendizado Multimodal

Uma nova abordagem pra melhorar a aprendizagem multimodal com dados ausentes.

2025-07-08T01:39:12+00:00 ― 6 min ler

Aprendizagem de máquinas Avançando a Saúde com Machine Learning Multimodal

Um novo framework melhora a previsão de doenças usando dados de saúde diversos.

2025-07-07T03:16:12+00:00 ― 7 min ler

Computação e linguagem Avaliando as Capacidades Zero-Shot de LLMs Multimodais

Uma avaliação do desempenho zero-shot de LLMs multimodais em várias tarefas.

2025-07-05T08:36:36+00:00 ― 6 min ler

Bibliotecas digitais HALvest: Um Novo Conjunto de Dados para Pesquisa Acadêmica

HALvest combina redes de citação e textos pra insights de pesquisa mais legais.

2025-07-04T17:51:48+00:00 ― 6 min ler

Metodologia Analisando Dados Circulares em Estudos de Migração de Aves

Explore como dados circulares impactam a análise de migração de aves e os esforços de conservação.

2025-07-03T21:54:04+00:00 ― 6 min ler

Computação e linguagem Avanço no Treinamento de Modelos de Linguagem Multimodais Grandes

Um novo sistema melhora a eficiência do treinamento de modelos de linguagem grande multimodal.

2025-07-01T16:55:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Eficiência no Treinamento de Modelos Multimodais

Um novo método aumenta a eficiência e o desempenho de modelos de linguagem multimodal grandes.

2025-06-30T21:33:54+00:00 ― 6 min ler

Aprendizagem automática Melhorando Métodos de Amostragem para Distribuições Complexas

Uma nova técnica simplifica a amostragem de distribuições de probabilidade complexas em ciência de dados e finanças.

2025-06-26T23:00:44+00:00 ― 7 min ler

Aprendizagem de máquinas Melhorando a Compreensão de Computadores Através de Métodos Focados em Texto

Este artigo fala sobre como transformar dados em texto melhora a compreensão do computador.

2025-06-25T14:22:30+00:00 ― 7 min ler

Computação e linguagem Aprendizado em Contexto: Enfrentando Desafios em Modelos de IA

Explorando como modelos de linguagem grandes aprendem com exemplos em vários contextos.

2025-06-23T02:12:12+00:00 ― 6 min ler

Aprendizagem de máquinas Inf-MLLM: Uma Nova Abordagem para Processamento Multimodal

Inf-MLLM melhora a eficiência em lidar com fluxos de dados complexos com recursos limitados.

2025-06-14T00:57:12+00:00 ― 6 min ler

Computação e linguagem Entendendo a Intenção em Postagens de Mídia Social em Bangla

Uma estrutura pra analisar conteúdo de mídia social em Bangla através de texto e imagens.

2025-06-12T03:31:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando Técnicas de Detecção de Anomalias em Vídeo

Um novo método combina vídeo, áudio e algoritmos pra detectar anomalias de forma mais eficiente.

2025-06-10T15:03:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões O Futuro dos Motores de Busca Multimodais

Analisando o papel dos LMMs na transformação das capacidades de busca com texto e imagens.

2025-06-09T12:35:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Apresentando o InfiMM-WebMath-40B: Um Novo Conjunto de Dados para Raciocínio Matemático Multimodal

Um novo conjunto de dados tem o objetivo de melhorar o raciocínio multimodal em modelos de linguagem.

2025-06-09T06:24:12+00:00 ― 8 min ler

Computação e linguagem Avaliação de Modelos de Linguagem Multimodais com o OmniBench

Uma nova ferramenta avalia o desempenho de modelos de linguagem grandes em diferentes tipos de dados.

2025-06-07T16:21:06+00:00 ― 5 min ler

Recuperação de informação Avançando Sistemas de Recomendação Multimodal com Melhores Extrações de Recursos

Um estudo sobre como melhorar sistemas de recomendação focando em técnicas de extração de características.

2025-06-06T12:02:36+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Mapeando Montículos de Rinoceronte para Melhorar os Esforços de Conservação

Um novo método rastreia rinocerontes usando os locais das fezes deles pra combater a caça furtiva.

2025-06-05T05:21:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Novos Modelos Transformando a IA Multimodal

Modelos recentes melhoram a capacidade da IA de gerar e entender vários tipos de mídia.

2025-06-04T08:49:30+00:00 ― 6 min ler

Aprendizagem de máquinas Como os robôs combinam sentidos para uma interação melhor

Robôs aprendem a combinar informações sensoriais pra melhorar a compreensão e a resposta.

2025-05-28T12:36:39+00:00 ― 8 min ler

Inteligência Artificial Combinando Números e Palavras pra Previsões Melhores

Cientistas misturam dados de séries temporais com texto pra melhorar as previsões do tempo.

2025-05-25T10:19:12+00:00 ― 8 min ler

Computação e linguagem Investigando a Consistência Cross-Modal em Modelos de IA

Analisando como modelos de IA lidam com texto e imagens juntos.

2025-05-23T05:28:03+00:00 ― 8 min ler

Computação e linguagem Aprimorando o Raciocínio em Modelos Multimodais

Um novo método melhora as habilidades de raciocínio em modelos de linguagem usando otimização de preferências.

2025-05-22T16:25:03+00:00 ― 5 min ler

Inteligência Artificial AdaptAgent: Uma Nova Maneira de Agentes Web Aprenderem

O AdaptAgent ajuda agentes da web a aprender tarefas usando menos demonstrações.

2025-05-16T13:08:00+00:00 ― 8 min ler

Computação e linguagem Como o som ajuda as máquinas a entender piadas

Sons ajudam as máquinas a entenderem melhor humor e trocadilhos.

2025-04-29T08:07:15+00:00 ― 5 min ler

Inteligência Artificial Transformando o Diagnóstico Médico com Dados Multimodais

Combinar vários tipos de dados médicos melhora o diagnóstico e o planejamento do tratamento.

2025-04-23T11:11:15+00:00 ― 7 min ler

Computação e linguagem Desafio BabyLM: Conectando Crianças e IA na Aprendizagem de Línguas

Uma competição pra melhorar como as máquinas aprendem línguas, tipo como as crianças fazem.

2025-04-07T04:21:27+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões COEF-VQ: O Futuro da Qualidade de Vídeo nas Redes Sociais

Descubra como o COEF-VQ garante alta qualidade de vídeo para uma experiência do usuário melhor.

2025-03-22T17:36:09+00:00 ― 8 min ler

Aprendizagem de máquinas Revolucionando as Previsões de Ações com Novos Modelos

Transformadores de Ordem Superior melhoram as previsões de movimentação de ações usando várias fontes de dados.

2025-03-16T17:34:20+00:00 ― 11 min ler

Computação e linguagem RapGuard: Um Novo Escudo de Segurança para Modelos de IA

O RapGuard oferece segurança contextualizada para modelos de linguagem grandes e multimodais.

2025-01-25T11:47:51+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Uma Nova Era em Perguntas e Respostas Visuais

Avanços em IA melhoram as capacidades de responder perguntas visuais.

2025-01-18T05:39:18+00:00 ― 7 min ler