Sicun Gao

Explorando métodos de gradiente de política e seus efeitos na tomada de decisão em aprendizado por reforço.

2025-08-05T12:36:30+00:00 ― 6 min ler

Combinar a alcançabilidade de Hamilton-Jacobi com aprendizado por reforço aumenta a segurança em sistemas de controle.

2025-07-17T12:45:10+00:00 ― 5 min ler