Zhihan Liu

Questo studio combina modelli di linguaggio grande con la ricerca Monte-Carlo Tree per prendere decisioni migliori nei giochi.

2025-08-31T06:47:00+00:00 ― 7 leggere min

Un nuovo metodo migliora i modelli linguistici cercando attivamente risposte diverse.

2025-08-05T06:41:00+00:00 ― 6 leggere min

Introducendo un metodo per ridurre l'overoptimization nei modelli addestrati con feedback umano.

2025-07-26T04:46:48+00:00 ― 6 leggere min

Un nuovo metodo unisce l'inferenza bayesiana e il machine learning per un'analisi dei dati migliore.

2025-07-11T11:48:36+00:00 ― 6 leggere min

Un nuovo metodo migliora l'addestramento dei modelli linguistici usando feedback auto-generato.

2025-06-04T15:08:42+00:00 ― 6 leggere min

Un nuovo metodo migliora i modelli di codifica usando test auto-generati.

2025-05-19T03:37:20+00:00 ― 6 leggere min

Scopri come i robot possono migliorare seguendo i comandi umani e adattandosi agli errori.

2025-01-22T09:09:54+00:00 ― 7 leggere min