Difan Zou

La ricerca si concentra su come migliorare l'efficienza dell'addestramento nei grafi dinamici.

2025-09-11T11:07:12+00:00 ― 6 leggere min

Esplorando metodi per migliorare il machine learning in ambienti di grafi dinamici.

2025-09-05T23:43:00+00:00 ― 7 leggere min

Questo studio esamina come il precondizionamento possa migliorare le prestazioni del SGD rispetto alla regressione ridge.

2025-08-29T19:14:00+00:00 ― 8 leggere min

Questo studio esamina come la profondità del trasformatore influisce sui compiti di apprendimento.

2025-08-23T19:43:00+00:00 ― 5 leggere min

Un nuovo framework migliora la pianificazione dei viaggi per i modelli di linguaggio grandi.

2025-08-05T18:47:48+00:00 ― 5 leggere min

Investigando come piccoli errori nei dati di addestramento migliorano i contenuti generati dall'IA.

2025-08-04T09:29:06+00:00 ― 5 leggere min

Approccio innovativo per guidare i modelli di linguaggio grandi usando l'auto-valutazione.

2025-08-02T15:05:18+00:00 ― 4 leggere min

Questo studio esplora come i trasformatori apprendono tramite l'attenzione multi-testa nei compiti di regressione.

2025-06-30T11:25:36+00:00 ― 6 leggere min

Indagare sull'impatto della riduzione del tasso sparso sulle prestazioni del modello Transformer.

2025-05-05T16:12:00+00:00 ― 6 leggere min

Scopri come la generazione parallelizzata trasforma la produzione di immagini e video.

2025-02-13T07:36:18+00:00 ― 5 leggere min