Llama-AVSR junta áudio e vídeo pra melhorar a precisão do reconhecimento de fala.
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 8 min ler
Ciência de ponta explicada de forma simples
Llama-AVSR junta áudio e vídeo pra melhorar a precisão do reconhecimento de fala.
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 8 min ler
Um estudo sobre assistentes de voz pra idosos feito no dia a dia deles.
Amama Mahmood, Chien-Ming Huang
― 5 min ler
Esse artigo fala sobre a integração de dados visuais e acústicos em UUVs para a aquicultura.
David Botta, Luca Ebner, Andrej Studer
― 6 min ler
Usando Modelos de Linguagem Grandes pra melhorar a análise de feedback dos usuários de aplicativos móveis.
Tanmai Kumar Ghosh, Atharva Pargaonkar, Nasir U. Eisty
― 11 min ler
Esse sistema ajuda pesquisadores a melhorar a avaliação de UX para interações com IA.
Qingxiao Zheng, Minrui Chen, Pranav Sharma
― 10 min ler
Um novo robô enfrenta os desafios da polinização para o cultivo de morangos em estufas.
Chuizheng Kong, Alex Qiu, Idris Wibowo
― 6 min ler
Uma nova estrutura melhora a qualidade do diálogo em chatbots educacionais para um aprendizado mais eficaz.
Haoyu Huang, Tong Niu, Rui Yang
― 7 min ler
Estudo revela esforços de desinformação coordenados durante a próxima eleição presidencial.
Marco Minici, Luca Luceri, Federico Cinus
― 7 min ler
PASS usa computação probabilística pra resolver de forma eficiente desafios difíceis em várias áreas.
Saavan Patel, Philip Canoza, Adhiraj Datar
― 7 min ler
Silq simplifica a programação quântica com recursos fáceis de usar.
Viktorija Bezganovic, Marco Lewis, Sadegh Soudjani
― 7 min ler
ZeroSCD detecta mudanças em imagens sem precisar de treinamento prévio ou dados rotulados.
Shyam Sundar Kannan, Byung-Cheol Min
― 7 min ler
Cães-robôs podem mudar a forma como a gente monitora e coleta dados em canteiros de obras.
Miguel Arturo Vega Torres, Fabian Pfitzner
― 6 min ler
Novos métodos usando modelos de linguagem melhoram o processamento de dados em sistemas de observação da Terra.
Hong-fu Chou, Vu Nguyen Ha, Prabhu Thiruvasagam
― 8 min ler
Esse estudo explora como displays do tamanho de uma parede podem melhorar a colaboração com presença mista.
Adrien Coppens, Lou Schwartz, Valérie Maquil
― 7 min ler
Aprenda como vários sensores RGB-D melhoram o rastreamento de movimento humano.
Adrien Coppens, Valérie Maquil
― 6 min ler
Um novo framework melhora a criação de prompts para grandes modelos de linguagem.
Mingqi Li, Karan Aggarwal, Yong Xie
― 7 min ler
Analisando problemas de Dial-a-Ride e MinTurn baseados em linhas pra melhorar a eficiência do transporte.
Antonio Lauerbach, Kendra Reiter, Marie Schmidt
― 6 min ler
Combinar robôs humanoides e drones melhora os esforços de busca e resgate em ambientes difíceis.
Abdulaziz Shamsah, Jesse Jiang, Ziwon Yoon
― 7 min ler
Um método simples pra detectar câmeras escondidas usando dispositivos acessíveis.
Xiang Zhang, Jie Zhang, Zehua Ma
― 6 min ler
O CuRIOS-ED tem como objetivo melhorar nossa visão do universo em rápida mudança com CubeSats.
Hannah Gulick, Jessica R. Lu, Aryan Sood
― 6 min ler
CAMAL combina aprendizado de máquina e métodos tradicionais pra otimizar o desempenho da árvore LSM.
Weiping Yu, Siqiang Luo, Zihao Yu
― 9 min ler
Analisando os avanços em segurança em sistemas de computação de borda móvel com UAVs.
Hongjiang Lei, Mingxu Yang, Ki-Hong Park
― 7 min ler
Um novo banco de dados e técnica melhoram o rastreamento de drones sem necessidade de rotulação manual.
Yu-Hsi Chen
― 5 min ler
Uma nova abordagem melhora a detecção de áudio falso usando modelos pré-treinados.
Zhiyong Wang, Ruibo Fu, Zhengqi Wen
― 6 min ler
Avaliando a eficácia dos LLMs para análise de ameaças.
Sanchana Srikanth, Mohammad Hasanuzzaman, Farah Tasnur Meem
― 12 min ler
EMERS ajuda pesquisadores a monitorar o uso de energia em sistemas de recomendação, promovendo a consciência ambiental.
Lukas Wegmeth, Tobias Vente, Alan Said
― 7 min ler
A VIVRA ajuda a transformar pensamentos em visuais 3D legais pra fazer um brainstorming melhor.
Yunhao Xing, Jerrick Ban, Timothy D. Hubbard
― 7 min ler
Novo método melhora a qualidade e a eficiência da geração de fala.
Xin Qi, Ruibo Fu, Zhengqi Wen
― 5 min ler
Novo método melhora a precisão do mapa de profundidade usando múltiplos pontos de vista.
Jungeon Kim, Soongjin Kim, Jaesik Park
― 8 min ler
Um estudo comparando os LLMs Mistral e LLaMa em diferentes GPUs.
Yannis Bendi-Ouis, Dan Dutarte, Xavier Hinaut
― 7 min ler
Cientistas capturam mudanças moleculares rápidas em tempo real usando técnicas de raio-X em attosegundos.
Henry N. Chapman, Chufeng Li, Saša Bajt
― 8 min ler
Novos métodos mostram como a luz interage em nuvens atômicas densas.
Antoine Glicenstein, Apoorva Apoorva, Daniel Benedicto Orenes
― 7 min ler
Um novo framework melhora a resposta em sistemas que lidam com prioridades de tarefas variadas.
Jiapeng Guan, Ran Wei, Dean You
― 7 min ler
Aprenda sobre técnicas de deep learning pra desfocar automaticamente rostos em gravações de vídeo.
Roman Plaud, Jose-Luis Lisani
― 7 min ler
Uma nova abordagem melhora a detecção de irregularidades em dados industriais usando computação de borda.
Alessio Mascolini, Sebastiano Gaiardelli, Francesco Ponzio
― 6 min ler
O Telescópio Espacial Roman tem como objetivo melhorar a imagem direta de exoplanetas.
Alexis Lau, Élodie Choquet, Lisa Altinier
― 7 min ler
Um novo controlador melhora a precisão do tempo em sistemas críticos de segurança.
Zhe Jiang, Shuai Zhao, Ran Wei
― 8 min ler
Descubra como os vírus misturam genes e criam novas cepas.
Alexey Markin, Catherine A. Macken, Amy L. Baker
― 6 min ler
Examinando a natureza da consciência em máquinas e suas implicações.
Ryan Williams
― 9 min ler
Combinando aprendizado e controle pra melhorar a segurança em robôs com pernas.
Jeonghwan Kim, Yunhai Han, Harish Ravichandar
― 7 min ler