Tuo Zhao

Este estudio destaca la complejidad de muestra de los algoritmos de Descenso Espejo de Política Neuronal en aprendizaje profundo.

2025-09-18T18:51:28+00:00 ― 6 minilectura

Descubre un método de optimización descentralizada que protege los datos del usuario y mejora la eficiencia.

2025-08-06T22:52:45+00:00 ― 6 minilectura

Un nuevo método para mejorar la alineación de la IA con los valores humanos usando retroalimentación corrupta.

2025-07-25T21:57:54+00:00 ― 6 minilectura

Un nuevo método mejora cómo los modelos de lenguaje siguen instrucciones complejas.

2025-06-14T16:29:24+00:00 ― 6 minilectura