NaVILA aiuta i robot a navigare usando il linguaggio e la visione.
An-Chieh Cheng, Yandong Ji, Zhaojing Yang
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
NaVILA aiuta i robot a navigare usando il linguaggio e la visione.
An-Chieh Cheng, Yandong Ji, Zhaojing Yang
― 6 leggere min
Nuove tecnologie stanno cambiando il modo in cui rileviamo precocemente il cancro della pelle.
Ramin Mousa, Saeed Chamani, Mohammad Morsali
― 6 leggere min
Scopri come i nuovi modelli rendono la generazione di video più veloce e migliore.
Mohammed Suhail, Carlos Esteves, Leonid Sigal
― 7 leggere min
Nuovi design migliorano l'efficienza dei modelli di linguaggio multimodali nell'IA.
Jun Zhang, Desen Meng, Ji Qi
― 6 leggere min
Scopri come i video parlanti danno vita alle immagini con parole ed emozioni.
Longtao Zheng, Yifan Zhang, Hanzhong Guo
― 7 leggere min
Moto usa l'analisi video per insegnare ai robot movimenti complessi in modo efficiente.
Yi Chen, Yuying Ge, Yizhuo Li
― 5 leggere min
Un nuovo metodo migliora le TC combinando deep learning con la ricostruzione delle immagini.
Elena Loli Piccolomini, Davide Evangelista, Elena Morotti
― 6 leggere min
Scopri come Divot trasforma la comprensione e la generazione dei video.
Yuying Ge, Yizhuo Li, Yixiao Ge
― 7 leggere min
Infinity trasforma il testo in immagini straordinarie con una velocità e qualità senza pari.
Jian Han, Jinlai Liu, Yi Jiang
― 6 leggere min
GRAIN migliora la comprensione delle immagini allineando descrizioni dettagliate con le immagini.
Shaunak Halbe, Junjiao Tian, K J Joseph
― 9 leggere min
Florence-2 e DBFusion ridefiniscono il modo in cui le macchine interpretano immagini e testo.
Jiuhai Chen, Jianwei Yang, Haiping Wu
― 8 leggere min
Scopri come il federated learning mantiene i dati privati mentre spinge l'innovazione.
Pranab Sahoo, Ashutosh Tripathi, Sriparna Saha
― 5 leggere min
Un nuovo modello combina la segmentazione delle azioni e l'anticipazione per interazioni più intelligenti.
Dayoung Gong, Suha Kwak, Minsu Cho
― 7 leggere min
Rivoluziona l'editing delle immagini con la funzione di comandi testuali rapidi di SwiftEdit.
Trong-Tung Nguyen, Quang Nguyen, Khoi Nguyen
― 8 leggere min
Scopri le ultime novità nel catturare il movimento attraverso tecniche di rendering innovative.
Bingbing Hu, Yanyan Li, Rui Xie
― 9 leggere min
Scopri i nuovi metodi per migliorare il riconoscimento degli oggetti nei robot.
Alan Li, Angela P. Schoellig
― 8 leggere min
I robot stanno imparando a muoversi grazie ai video di animali selvatici.
Elliot Chane-Sane, Constant Roux, Olivier Stasse
― 8 leggere min
SCDA migliora la capacità dell'IA di classificare accuratamente il cancro tra gli ospedali.
Ilán Carretero, Pablo Meseguer, Rocío del Amor
― 7 leggere min
Un nuovo modello migliora la segmentazione delle parti 3D per un riconoscimento degli oggetti versatile.
Marco Garosi, Riccardo Tedoldi, Davide Boscaini
― 6 leggere min
Scopri come DEIM migliora la velocità e l'accuratezza del rilevamento degli oggetti in tempo reale.
Shihua Huang, Zhichao Lu, Xiaodong Cun
― 6 leggere min
Uno sguardo alle complessità della trascrizione della musica vocale per l'uso digitale.
Eliseo Fuentes-Martínez, Antonio Ríos-Vila, Juan C. Martinez-Sevilla
― 7 leggere min
La tecnologia FLOAT anima le immagini statiche, portandole in vita attraverso il parlato.
Taekyung Ki, Dongchan Min, Gyeongsu Chae
― 7 leggere min
PANGAEA valuta modelli fondazionali geospaziali con dataset e compiti diversi.
Valerio Marsocci, Yuru Jia, Georges Le Bellier
― 7 leggere min
CrossSDF trasforma fette 2D in modelli 3D precisi, facendo avanzare la tecnologia dell'imaging.
Thomas Walker, Salvatore Esposito, Daniel Rebain
― 7 leggere min
Le iperreti trasformano l'analisi dei dati, colmando lacune e migliorando la precisione nelle simulazioni dinamiche.
Hamid Gadirov, Qi Wu, David Bauer
― 8 leggere min
Scopri come i modelli AI si adattano a ambienti diversi con la Generalizzazione del Dominio e SoRA.
Seokju Yun, Seunghye Chae, Dongheon Lee
― 7 leggere min
Scopri come il deep learning trasforma l'analisi dei vasi sanguigni per migliorare la cura dei pazienti.
Dengqiang Jia, Xinnian Yang, Xiaosong Xiong
― 8 leggere min
TSUBF-Net migliora l'analisi delle scansioni TC per l'iperplasia adenoidea, aiutando nella diagnosi e nel trattamento.
Rulin Zhou, Yingjie Feng, Guankun Wang
― 6 leggere min
I ricercatori migliorano il riconoscimento delle fasi chirurgiche per l'esofagectomia assistita da robot.
Yiping Li, Romy van Jaarsveld, Ronald de Jong
― 7 leggere min
Nuova tecnologia porta a interazioni reali tra esseri umani e personaggi virtuali.
Yongming Zhu, Longhao Zhang, Zhengkun Rong
― 6 leggere min
Esaminare il ruolo e le sfide dell'IA nell'analisi delle immagini mediche.
Théo Sourget, Michelle Hestbek-Møller, Amelia Jiménez-Sánchez
― 7 leggere min
Un modello rivoluzionario crea video di teste che parlano in modo realistico e ad alta velocità.
Sejong Yang, Seoung Wug Oh, Yang Zhou
― 5 leggere min
Scopri l'impatto della levigatura della curvatura locale sui modelli di diffusione basati sul punteggio.
Genki Osada, Makoto Shing, Takashi Nishide
― 6 leggere min
Scopri come l'Ottimizzazione della Misurazione trasforma l'elaborazione delle immagini per risultati più nitidi.
Tianyu Chen, Zhendong Wang, Mingyuan Zhou
― 6 leggere min
Un nuovo modello rivoluziona la creazione dei cartamodelli per i designer.
Kiyohiro Nakayama, Jan Ackermann, Timur Levent Kesdogan
― 7 leggere min
Un nuovo sistema migliora la visualizzazione chirurgica in tempo reale con l'apprendimento multi-task.
Mithun Parab, Pranay Lendave, Jiyoung Kim
― 6 leggere min
Un nuovo dataset migliora il modo in cui i modelli percepiscono colore e contesto.
Ming-Chang Chiu, Shicheng Wen, Pin-Yu Chen
― 7 leggere min
Scopri come i modelli di IA possono essere veloci e facili da capire.
Alireza Maleki, Mahsa Lavaei, Mohsen Bagheritabar
― 8 leggere min
Un nuovo modo per individuare difetti nelle linee di produzione senza dimenticare le conoscenze passate.
Yizhou Jin, Jiahui Zhu, Guodong Wang
― 6 leggere min
Nuove tecniche migliorano la qualità delle immagini dal rumore senza guida.
Donghoon Ahn, Jiwon Kang, Sanghyun Lee
― 6 leggere min