Um novo modelo melhora a compreensão de vídeo através de técnicas de treinamento inovadoras.
― 7 min ler
Ciência de ponta explicada de forma simples
Um novo modelo melhora a compreensão de vídeo através de técnicas de treinamento inovadoras.
― 7 min ler
Pesquisadores criam um conjunto de dados pra estudar como as pessoas aprendem imitando os outros.
― 9 min ler
DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.
― 9 min ler
Transforme texto em imagens, vídeos e áudio de boa com o Lumina-T2X.
― 7 min ler
Uma nova abordagem melhora os carros autônomos imitando os padrões de pensamento humano.
― 10 min ler
Este artigo detalha uma abordagem inovadora pra melhorar modelos de linguagem usando modelos menores.
― 8 min ler
Um novo conjunto de dados e modelo melhoram a qualidade da legendagem de vídeo para máquinas.
― 6 min ler
Uma ferramenta pra avaliar a segurança de modelos de linguagem avançados.
― 6 min ler
Nova abordagem melhora o aprendizado a partir de dados intercalados de imagem e texto.
― 8 min ler
Um conjunto de dados completo que junta imagens e texto pra ajudar o aprendizado de máquina.
― 8 min ler
Uma abordagem estruturada pra avaliar modelos de texto pra vídeo com eficiência melhorada.
― 14 min ler
Um novo framework ajuda modelos de linguagem a aprenderem linguagem simbólica sem a ajuda de humanos.
― 8 min ler
Um novo conjunto de dados melhora a capacidade da IA de processar documentos científicos de forma eficaz.
― 6 min ler
Pesquisadores melhoram as habilidades de tradução para mais de 100 idiomas, focando em idiomas com poucos recursos.
― 8 min ler
Esse método facilita a adição de objetos em imagens com textos, garantindo resultados naturais.
― 6 min ler
Um novo modelo revoluciona a geração de imagens a partir de descrições de texto, melhorando várias indústrias.
― 6 min ler
O GigaGS enfrenta desafios na modelagem de grandes cenas 3D com técnicas inovadoras.
― 6 min ler
Um método que melhora o alinhamento do modelo de linguagem com as preferências humanas.
― 6 min ler
Um novo método melhora as habilidades de raciocínio em modelos de linguagem usando otimização de preferências.
― 5 min ler
O SyncVIS melhora o rastreamento e a segmentação de objetos em vídeos pra várias aplicações.
― 6 min ler
Novo método melhora o desempenho de modelos de linguagem multimodal em tarefas visuais.
― 7 min ler
A Vinci torna as tarefas do dia a dia mais fáceis com ajuda sem as mãos e orientações em tempo real.
― 8 min ler