Este artigo apresenta um modelo de codificador único para melhorar a segmentação de imagens com base em descrições de texto.
Seonghoon Yu, Ilchae Jung, Byeongju Han
― 7 min ler
Ciência de ponta explicada de forma simples
Este artigo apresenta um modelo de codificador único para melhorar a segmentação de imagens com base em descrições de texto.
Seonghoon Yu, Ilchae Jung, Byeongju Han
― 7 min ler
Novos métodos melhoram a separação de vozes em ambientes barulhentos.
Tathagata Bandyopadhyay
― 5 min ler
Analisando o impacto dos componentes baseados em quaternions na performance de classificação de imagens.
Gerardo Altamirano-Gómez, Carlos Gershenson
― 6 min ler
A MAPF-GPT traz uma abordagem inovadora pra resolver desafios de pathfinding com vários agentes usando aprendizado de máquina.
Anton Andreychuk, Konstantin Yakovlev, Aleksandr Panov
― 10 min ler
Esse estudo usa aprendizado de máquina pra identificar jatos de quarks estranhos e melhorar a marcação de fragmentação.
Yevgeny Kats, Edo Ofir
― 9 min ler
FPDT oferece uma solução pra treinar LLMs de contexto longo de forma mais eficiente.
Jinghan Yao, Sam Ade Jacobs, Masahiro Tanaka
― 6 min ler
MemLong melhora a capacidade dos modelos de linguagem de lidar com textos longos de forma eficaz.
Weijie Liu, Zecheng Tang, Juntao Li
― 7 min ler
Um olhar sobre como o aprendizado por transferência impacta o desempenho do modelo através das leis de escalonamento.
Matthew Barnett
― 7 min ler
Um novo método pra explicar previsões em dados dependentes de espaço usando Random Forest.
Luca Patelli, Natalia Golini, Rosaria Ignaccolo
― 8 min ler
Pesquisas mostram que robôs podem melhorar o aprendizado usando padrões de movimento de tarefas anteriores.
Li-Heng Lin, Yuchen Cui, Amber Xie
― 7 min ler
Explorando os desafios do Aprendizado Multi-Tarefa e Contínuo em machine learning.
Mohammadamin Banayeeanzade, Mahdi Soltanolkotabi, Mohammad Rostami
― 7 min ler
Um novo método pra extrair eventos de narrativas em português usando modelos avançados.
Luís Filipe Cunha, Ricardo Campos, Alípio Jorge
― 7 min ler
Um novo método melhora o desempenho de redes neurais bayesianas através da simetrização.
Yoav Gelberg, Tycho F. A. van der Ouderaa, Mark van der Wilk
― 6 min ler
Esse trabalho melhora a resolução de co-referência entre idiomas com um novo conjunto de dados e métodos.
Ondřej Pražák, Miloslav Konopík
― 7 min ler
Uma nova abordagem melhora a qualidade da imagem em VAEs multimodais usando decodificadores de difusão.
Daniel Wesego, Amirmohammad Rooshenas
― 9 min ler
Um novo método melhora redes neurais pra resolver equações de física complexas.
Yilong Hou, Xi'an Li, Jinran Wu
― 5 min ler
Uma nova abordagem pra melhorar a justiça e a precisão no reconhecimento facial.
Ayesha Manzoor, Ajita Rattani
― 5 min ler
Um olhar sobre o campo em evolução dos modelos de aprendizado profundo topológicos e suas forças.
Yam Eitan, Yoav Gelberg, Guy Bar-Shalom
― 5 min ler
Um novo método pra reduzir gráficos complexos enquanto mantém as características principais pra classificação.
Arash Rasti-Meymandi, Ahmad Sajedi, Zhaopan Xu
― 7 min ler
Um novo método melhora a qualidade e a eficiência da geração de vídeos.
Liuhan Chen, Zongjian Li, Bin Lin
― 7 min ler
Um novo método melhora a precisão em edições de imagem localizadas usando modelos de difusão.
Theodoros Kouzelis, Manos Plitsis, Mihalis A. Nicolaou
― 5 min ler
Novos métodos melhoram a precisão de completamento de tensores com menos amostras.
Alejandro Gomez-Leos, Oscar López
― 6 min ler
Um novo framework melhora a precisão das legendas de imagens e reduz erros.
Qian Cao, Xu Chen, Ruihua Song
― 6 min ler
PINNs juntam física com dados pra resolver problemas científicos complexos de forma eficiente.
Maziar Raissi, Paris Perdikaris, Nazanin Ahmadi
― 6 min ler
PromptSmooth melhora a precisão dos Med-VLMs contra ataques adversariais de forma eficiente.
Noor Hussein, Fahad Shamshad, Muzammal Naseer
― 5 min ler
Estudo revela que modelos mais baratos podem produzir dados de treinamento melhores para tarefas de raciocínio.
Hritik Bansal, Arian Hosseini, Rishabh Agarwal
― 6 min ler
Uma nova abordagem melhora o manuseio de dados de vídeo enquanto mantém o desempenho em aplicações em tempo real.
Shiwei Wu, Joya Chen, Kevin Qinghong Lin
― 7 min ler
A Rede Neural Dowker Dinâmica melhora a análise de grafos direcionais em evolução.
Hao Li, Hao Jiang, Jiajun Fan
― 8 min ler
Uma nova abordagem melhora a detecção de ações em vídeos, lidando com o colapso de atenção.
Jihwan Kim, Miso Lee, Cheol-Ho Cho
― 8 min ler
Um novo método melhora a inferência gramatical para linguagens de programação com mais precisão e legibilidade.
Feifei Li, Xiao Chen, Xi Xiao
― 9 min ler
Novo método melhora a criação de vídeos realistas de interações de objetos usando orientação de profundidade.
Anisha Jain
― 7 min ler
Uma nova abordagem para melhorar o treinamento do GFlowNet com recompensas dependentes da política.
Puhua Niu, Shili Wu, Mingzhou Fan
― 6 min ler
Redes inovadoras que aprendem com estruturas de dados CW-complex em várias áreas.
Rahul Khorana
― 5 min ler
O PartFormer melhora o reconhecimento de objetos em diferentes condições usando Transformers de Visão.
Lei Tan, Pingyang Dai, Jie Chen
― 7 min ler
Uma nova abordagem melhora as respostas dos modelos de linguagem e reduz o overfitting.
Ziniu Li, Congliang Chen, Tian Xu
― 7 min ler
Novos modelos melhoram a eficiência na busca de informações em várias línguas.
Rohan Jha, Bo Wang, Michael Günther
― 7 min ler
Uma nova abordagem para segmentação de instâncias em vídeo que reduz a necessidade de anotações.
Farnoosh Arefi, Amir M. Mansourian, Shohreh Kasaei
― 7 min ler
Estratégias para melhorar a comunicação em sistemas de controle em rede diante de desafios como perda de pacotes.
Harsh Oza, Irinel-Constantin Morarescu, Vineeth S. Varma
― 6 min ler
Combinando máquinas Tsetlin e vetores hiperdimensionais pra manuseio eficiente de dados.
Christian D. Blakely
― 7 min ler
Um novo modelo melhora a geração de séries temporais ao capturar características de dados simples e complexas.
Johan Vik Mathisen, Erlend Lokna, Daesoo Lee
― 7 min ler