2022-01-18 08:25

什么是强化学习?

#AI有多智能

与监督学习、无监督学习类似,强化学习并不是某种特定的模型或算法,指的是训练方法。在强化学习中,做出决策的一方被称为主体,它存在于环境中。主体每做出一个动作,环境就会给予反馈,主体会在评估反馈后决定下一个动作。对于强化学习来说,一切动作的依据都是回报。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定