资源|强化学习入门

点击上方“AI遇见机器学习”，选择“星标”公众号
重磅干货，第一时间送达

一、资源简介

强化学习（Reinforcement Learning, RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

强化学习的常见模型是标准的马尔可夫决策过程（Markov Decision Process, MDP）。按给定条件，强化学习可分为基于模式的强化学习（model-based RL）和无模式强化学习（model-free RL），以及主动强化学习（active RL）和被动强化学习（passive RL）。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数（value function）算法两类。深度学习模型可以在强化学习中得到使用，形成深度强化学习。

二、主要内容

强化学习是机器学习的一种重要类型，在这种学习中，代理（agent）通过执行动作并观察结果来学习如何在环境中表现。

在这篇文章中，你将学习

什么是强化学习，奖励是什么是核心。
强化学习的三种方法
深度强化学习中的“深度”是什么?

三、资源分享

同时为了方便大家，我们把最新PDF打包好了，可以直接下载哦~

获取方式：

1. 关注我们的公众号“AI遇见机器学习”

2. 后台回复“强化学习入门” 即可以获取资料哈~（建议复制，避免错字）

推荐阅读

干货|学术论文怎么写

资源|NLP书籍及课程推荐（附资料下载）

干货|全面理解N-Gram语言模型

资源|《Machine Learning for OpenCV》书籍推荐

欢迎关注我们，看通俗干货！

继续阅读

最新评论

推荐文章

作者最新文章

你可能感兴趣的文章

Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].

版权声明：以上内容为用户推荐收藏至CareerEngine平台，其内容（含文字、图片、视频、音频等）及知识版权均属用户或用户转发自的第三方网站，如涉嫌侵权，请通知[email protected]进行信息删除。如需查看信息来源，请点击“查看原文”。如需洽谈其它事宜，请联系[email protected]。