Pytorch中的强化学习

torch.distributions.Categorical()

功能:根据概率分布来产生sample,产生的sample是输入tensor的index 如:   >>> m = Categorical(torch.tensor([ 0.25, 0.25, 0.25, 0.25 ]))   >>> m.sample()   # equal probability of 0, 1, 2, 3   tensor(3)

 
    原文作者:pytorch
    原文地址: https://www.cnblogs.com/sbj123456789/p/9692711.html
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞