试题详情
- 单项选择题Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。
A、期望值
B、最大值
C、最小值
D、总和
关注下方微信公众号,在线模考后查看

热门试题
- 1977年在斯坦福大学研发的专家系统()
- 语音识别技术的英文缩写为()。
- 与图灵测试相比,中文屋提出了如何判断是否
- 在人工智能当中,图像、语音、手势等识别被
- 强化学习的回报值一个重要特点是具有()。
- 目前还没有成功进行无人自动驾驶的案例。
- 将两个图片每个像素RGB三个分量的差值的
- 智能推荐系统的特点包括()。
- 2016年3月,人工智能程序()在韩国首
- 人工智能(AI)概念最早1956年在达特
- 隐藏层中的池化层作用是()训练参数,对原
- 仿生算法的特点有()。
- 博弈树的每个结点表示一个动作。
- 从公共关注视角来看,人工智能就是机器可以
- 以下属于仿生算法的有()。
- 神经网络中各个隐藏层能提取出和人类看到的
- 梯度下降算法是最常用也是最有效的神经网络
- 智能音箱本质上是音箱、智能语音交互系统、
- 在强化学习中,主体和环境之间交互的要素有
- 现阶段的自动驾驶已经能够到达第五级完全自