Le Zhuo

LyricWhiz combina modelli avanzati per migliorare l'accuratezza della trascrizione dei testi in diverse lingue.

2025-10-15T09:51:10+00:00 ― 6 leggere min

DiffDance crea sequenze di danza dettagliate che si abbinano alla musica in modo efficace.

2025-09-29T16:31:20+00:00 ― 6 leggere min

Trasforma testo in immagini, video e audio senza sforzo con Lumina-T2X.

2025-08-12T05:14:30+00:00 ― 6 leggere min

Un nuovo modello rivoluziona la generazione di immagini da descrizioni testuali, migliorando vari settori.

2025-07-02T04:22:30+00:00 ― 5 leggere min

LLaVA-MoD crea modelli multimodali più piccoli usando le conoscenze di quelli più grandi.

2025-06-20T22:35:24+00:00 ― 5 leggere min

Un nuovo dataset che migliora la comprensione dei video e il ragionamento dell'IA.

2025-05-12T04:00:00+00:00 ― 5 leggere min