Global optimality of softmax policy gradient with single hidden layer neural networks in the mean-field regime
Andrea Agazzi
;
2021
File in questo prodotto:
Non ci sono file associati a questo prodotto.
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.