Une nouvelle façon de combiner images et textes pour de meilleurs résultats de recherche.
Yeong-Joon Ju, Ho-Joong Kim, Seong-Whan Lee
― 6 min lire
La science de pointe expliquée simplement
Une nouvelle façon de combiner images et textes pour de meilleurs résultats de recherche.
Yeong-Joon Ju, Ho-Joong Kim, Seong-Whan Lee
― 6 min lire
Derniers articles
Ziyang Jiang, Xinyuan Qian, Jiahe Lei
― 6 min lire
Christopher Tralie, Ben Cantil
― 6 min lire
Felipe Marra, Lucas N. Ferreira
― 8 min lire
Sahibzada Adil Shahzad, Ammarah Hashmi, Yan-Tsung Peng
― 6 min lire
Sanath Budakegowdanadoddi Nagaraju, Brian Bernhard Moser, Tobias Christian Nauen
― 8 min lire
MTFusion combine images et texte pour créer des modèles 3D avancés.
Yu Liu, Ruowei Wang, Jiaqi Li
― 7 min lire
Combiner des enregistrements audio avec des partitions pour mieux pratiquer.
Irmak Bukey, Michael Feffer, Chris Donahue
― 7 min lire
De nouvelles méthodes améliorent considérablement la qualité et la résolution des images.
Brian B. Moser, Stanislav Frolov, Tobias C. Nauen
― 9 min lire
Découvrez comment de nouvelles techniques de filigrane protègent l'art numérique et les idées créatives.
Liangqi Lei, Keke Gai, Jing Yu
― 7 min lire
Une nouvelle méthode améliore la clarté de la parole en utilisant des infos visuelles de l'environnement.
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 6 min lire
TopoCode améliore la communication en se concentrant sur la structure des données pour la détection des erreurs.
Hongzhi Guo
― 7 min lire
Explorer les défis et les implications de la technologie deepfake dans le paysage médiatique d'aujourd'hui.
Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin
― 8 min lire
Modifie tes vidéos sans effort en disant juste tes changements.
Alejandro Pardo, Jui-Hsien Wang, Bernard Ghanem
― 7 min lire
Explore la science fascinante derrière les sons des boissons versées.
Piyush Bagad, Makarand Tapaswi, Cees G. M. Snoek
― 6 min lire
Combiner le langage et les visuels pour une meilleure perception de la profondeur.
Ziyao Zeng, Jingcheng Ni, Daniel Wang
― 6 min lire
Découvrez des méthodes innovantes pour la compression audio et leur impact sur le son immersif.
Toni Hirvonen, Mahmoud Namazi
― 6 min lire
Une nouvelle méthode pour créer des vidéos qui préservent l'identité et améliorent la qualité visuelle.
Shenghai Yuan, Jinfa Huang, Xianyi He
― 7 min lire
Le dataset HARP change notre façon de vivre le son dans les environnements virtuels.
Shivam Saini, Jürgen Peissig
― 6 min lire
Découvre comment la technologie transforme les processus d'évaluation de la qualité d'image.
Shima Mohammadi, João Ascenso
― 10 min lire
Des façons innovantes de gérer les données visuelles tout en protégeant l'environnement.
Peilin Chen, Xiaohan Fang, Meng Wang
― 7 min lire
Découvrez comment les nouvelles techs transforment les images en expériences sonores immersives.
Wei Guo, Heng Wang, Jianbo Ma
― 8 min lire
Les machines prennent de l'avance pour repérer les défauts des produits et améliorer la qualité.
Tsun-Hin Cheung, Ka-Chun Fung, Songjiang Lai
― 7 min lire
HAI-DEF propose des outils pour simplifier le développement de l'IA pour les applications de santé.
Atilla P. Kiraly, Sebastien Baur, Kenneth Philbrick
― 10 min lire
Découvrez comment les SuperGaussiens améliorent la synthèse d'images pour des vues réalistes.
Rui Xu, Wenyue Chen, Jiepeng Wang
― 5 min lire
Découvrez comment DiM-Gestor améliore les gestes des personnages virtuels en temps réel.
Fan Zhang, Siyuan Zhao, Naye Ji
― 5 min lire
LongVALE propose une nouvelle référence pour comprendre les longues vidéos à travers des données audio-visuelles.
Tiantian Geng, Jinrui Zhang, Qingni Wang
― 8 min lire
Une nouvelle méthode rend les modèles multimodaux plus rapides et plus efficaces.
Qiong Wu, Wenhao Lin, Weihao Ye
― 5 min lire
Explorer les évaluations de qualité pour des vidéos 3D affectées par des facteurs environnementaux.
Sria Biswas, Balasubramanyam Appina, Priyanka Kokil
― 7 min lire
Un aperçu des deepfakes, leurs risques et un nouveau dataset en hindi.
Sukhandeep Kaur, Mubashir Buhari, Naman Khandelwal
― 8 min lire
Découvrez comment l'IA transforme du texte en images époustouflantes grâce à une technologie de pointe.
Zeyi Sun, Ziyang Chu, Pan Zhang
― 9 min lire
Une nouvelle méthode génère de la parole à partir de vidéos, améliorant le doublage et l'apprentissage des langues.
Akshita Gupta, Tatiana Likhomanenko, Karren Dai Yang
― 8 min lire
Découvre les avancées dans la création de longues vidéos qui captivent les spectateurs.
Xin Yan, Yuxuan Cai, Qiuyue Wang
― 8 min lire
Des chercheurs trouvent des moyens de réduire les inexactitudes dans les grands modèles de vision-langage.
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 9 min lire
De nouvelles méthodes s'attaquent efficacement à la falsification d'images en télédétection.
Ze Zhang, Enyuan Zhao, Ziyi Wan
― 8 min lire
Révolutionne ton expérience culinaire avec le guide de recettes interactif de SPICE.
Vera Prohaska, Eduardo Castelló Ferrer
― 8 min lire
La technologie FLOAT anime des images fixes, leur donnant vie grâce à la parole.
Taekyung Ki, Dongchan Min, Gyeongsu Chae
― 8 min lire
Explore le monde des deepfakes et leur impact sur la confiance dans les médias.
Muhammad Umar Farooq, Awais Khan, Ijaz Ul Haq
― 9 min lire
Explore comment la nouvelle technologie mélange texte, images et sons pour du contenu créatif.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 8 min lire
SyncFlow fusionne la génération audio et vidéo pour une création de contenu sans accroc.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 5 min lire
SizeGS propose une façon plus intelligente de compresser du contenu 3D sans perdre en qualité.
Shuzhao Xie, Jiahang Liu, Weixiang Zhang
― 7 min lire
L'IA apprend à créer de l'art en se donnant des retours pour mieux aligner les images.
Leigang Qu, Haochuan Li, Wenjie Wang
― 10 min lire
Utiliser l'apprentissage machine pour améliorer l'analyse des matchs de judo et le coaching.
Anthony Miyaguchi, Jed Moutahir, Tanmay Sutar
― 10 min lire
Les systèmes d'IA apprennent à naviguer en utilisant le langage et la conscience spatiale.
Xuesong Zhang, Yunbo Xu, Jia Li
― 8 min lire
Une nouvelle méthode améliore la modélisation 3D à partir de vidéos pour les jeux et la réalité virtuelle.
Jinbo Yan, Rui Peng, Luyang Tang
― 6 min lire
Trouve la musique parfaite adaptée à ton goût unique avec Diff4Steer.
Xuchan Bao, Judith Yue Li, Zhong Yi Wan
― 8 min lire