点击上方“AI遇见机器学习”,选择“星标”公众号
重磅干货,第一时间送达

一、资源简介
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。
强化学习的常见模型是标准的马尔可夫决策过程(Markov Decision Process, MDP)。按给定条件,强化学习可分为基于模式的强化学习(model-based RL)和无模式强化学习(model-free RL) ,以及主动强化学习(active RL)和被动强化学习(passive RL) 。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数(value function)算法两类。深度学习模型可以在强化学习中得到使用,形成深度强化学习 。
二、主要内容
强化学习是机器学习的一种重要类型,在这种学习中,代理(agent)通过执行动作并观察结果来学习如何在环境中表现。

在这篇文章中,你将学习
  1. 什么是强化学习,奖励是什么是核心。
  2.  强化学习的三种方法
  3. 深度强化学习中的“深度”是什么?
三、资源分享
同时为了方便大家,我们把最新PDF打包好了,可以直接下载哦~
获取方式:
1. 关注我们的公众号“AI遇见机器学习”
2. 后台回复“强化学习入门” 即可以获取资料哈~(建议复制,避免错字)
推荐阅读
欢迎关注我们,看通俗干货
继续阅读
阅读原文