告别动态规划，清华学霸提灯给你讲解DP，听不懂你打我

最近九章算法和阿里云合办了一场在线编程大赛，根据赛后数据显示，超过70%的选手认为动态规划是最难对付的题型。

而自从动态规划出现在算法面试后，同样成为求职者绕不开的“噩梦”。除了Google，TikTok等常面DP的大厂外，现在就连亚麻电面阶段也考DP了，如果没有准备的话，分分钟就可能挂面。

动态规划的一大难点就是题型众多而又没有统一的解法。想要熟练掌握往往需要大量刷题来练习，这么做对于本就不充裕的准备时间来说，性价比太低。

作为清华学霸，全国算法竞赛金牌，ACM全球总决赛选手，FLAG资深面试官，侯卫东老师凭借丰富的刷题和面试经验，总结了一套针对动态规划的“4步解题法”。

今天通过一道经典题，侯老师给大家讲讲如何用4步解题法搞定动态规划题型。

换硬币问题

你有三种硬币，分别面值2元，5元和7元，每种硬币都有足够多。买一本书需要27元。如何用最少的硬币组合正好付清，不需要对方找钱？

可以使用动态规划的问题一般都有以下提问方式：

求最大值/最小值

从左上角到右上角路径的最大数字和、最长上升子序列长度

求方案数

有多少种方式走到右下角

有多少种方法选出K个数使得和是Sum

求存在性

取石子游戏，先手是否必胜

能不能选出K个数使得和是Sum

如果你碰到一个问题是以上提问方式，那么有90%的概率是使用动态规划来求解。要重点说明的是，若问题是让你求出“所有的”方案和结果，则肯定不是使用动态规划。

再回到这道题，“最少的硬币组合”，求最值问题，可以用DP来解。

第一步：确定状态

状态在动态规划中的作用属于定海神针。解动态规划时需要开一个数组，这里的“状态”就是指数组的每个元素f[i]或f[i][j]代表什么。

确定状态需要两个意识：最后一步和子问题

1.最后一步

这道题中，我们不知道最优策略是什么，但最优策略肯定是K枚硬币a1,a2……aK面值加起来是27。

这里的“最后一步”就是存在最后一枚硬币aK。

除去aK，前面的硬币面值和为27-aK。

这里有两个关键点：

① 我们不关心前面的K-1枚硬币是怎么拼出27-aK的，也不知道aK和K，但是可以确定前面的硬币拼出了27-aK。

② 因为是最优策略，所以拼出的27-ak硬币数一定要最少（否则就不是最优策略）

2.子问题

现在问题变成了：最少用多少枚硬币可以拼出27-aK。也就是将原问题（27）转化成了一个子问题，而且规模更小（27-aK）。

这种与原问题内核一致，但是规模更小的问题，就叫子问题。

为了简化定义，我们设状态f(X)=最少用多少枚硬币拼出X。所以问题就从求f(X)变成求f(X-aK)

我们目前还不知道最后的硬币aK面额多少，但它的面额一定只可能是2/5/7之一。

如果aK是2，f(27)应该是f(27-2) + 1 (加上最后面值2的硬币）
如果aK是5，f(27)应该是f(27-5) + 1 (加上最后面值5的硬币）
如果aK是7，f(27)应该是f(27-7) + 1 (加上最后面值7的硬币）

除此以外，没有其他的可能了。

因为要求最少的硬币数，所以问题的解就可以这样表示：

f(27) = min{f(27-2)+1, f(27-5)+1, f(27-7)+1}

第二步：转移方程

设状态f[X]=最少用多少枚硬币拼出X

对于任意X，f[X] = min{f[X-2]+1, f[X-5]+1, f[X-7]+1}

实际面试中，如果正确列出转移方程，问题基本就解决一半了。

很多同学基本也可以做到写出状态转移方程，但真正写程序的时候往往会出现很多错误或问题。

这就涉及到在在代码前的两个重要步骤，就是我们4步解题法的第三步和第四步。

第三步：初始条件和边界情况

f[X] = min{f[X-2]+1, f[X-5]+1, f[X-7]+1}的边界情况是X-2, X-5或者X-7不能小于0（硬币面值为正）

故对边界情况设定如下：

如果硬币面值不能组合出Y，就定义f[Y]=正无穷

例如f[-1]=f[-2]=…=正无穷；

f[1] =min{f[-1]+1, f[-4]+1,f[-6]+1}=正无穷,表示拼不出1

特殊情况：本题的F[0]对应的情况为F[-2]、F[-5]、F[-7]，按照上文的边界情况设定结果是正无穷。

但是实际上F[0]的结果是存在的（即使用0个硬币的情况下），F[0]=0。

这种用转移方程无法计算，但是又实际存在的情况，就必须通过手动定义。

所以这里定义初始条件为：F[0]=0.

而从0之后的数值是没矛盾的，比如F[1]= F[1-2]+1= F[-1]+1=正无穷（正无穷加任何数结果还是正无穷）；F[2]= F[2-2]+1= F[0]+1=1……

第四步，确定计算顺序

那么开始计算时，是从F[1]、F[2]开始？还是从F[27]、F[26]开始呢？

判断计算顺序正确与否的原则是：

当我们要计算F[X]（等式左边，如F[10]）的时候，等式右边（f[X-2], f[X-5], f[X-7]等）都是已经得到结果的状态，这个计算顺序就是OK的。

实际就是从小到大的计算方式（偶有例外的情况我们后边再讲）。

例如我们算到F[12]的时候，发现F[11]、F[10]、F[9]都已经算过了，这种算法就是对的；

而开始算F[27]的时候，发现F[26]还没有算，这样的顺序就是错的。

很显然这样的情况下写一个FOR循环就够了。

回到这道题，采用动态规划的算法，每一步只尝试三种硬币，一共进行了27步。算法时间复杂度（即需要进行的步数）为27*3。

原题练习：LintCode 669.Coin Change

最后总结

动态规划4步解题法

确定状态

研究最优策略的最后一步

转化为子问题

转移方程

根据子问题定义直接得到

初始条件和边界情况

细心，考虑周全

计算顺序

利用之前的计算结果

按照以上4步套路，基本上可以解决绝大多数类型的动态规划题。

除了最值型动态规划，想要了解4步法在更多类型动态规划中的运用，可以来听侯卫东老师的《动态规划专题班》。

在《动态规划专题》试听课中，侯卫东老师毫无保留地详细讲解了4步法具体如何应用。还没搞懂动态规划的同学一定要来听听看哇！

谁来讲

侯卫东ACM世界总决赛选手

清华大学毕业，全国算法竞赛金牌得主，参加过ACM国际大学生程序设计竞赛全球总决赛。斩获Google，Facebook，Microsoft，Uber， Dropbox等多家offer，拥有丰富的面试和面试官经验。

免费试听内容

什么是动态规划

动态规划和递归的区别

动态规划的解题要领

动态规划三大类

求最值/计数/可行性

常见动态规划类型总结

报名免费试听

互动课形式：随时报名，随时听课

长按二维码报名免费试听

福利领取

添加班班九章渔渔微信

回复【搞定DP】,并提供本课程试听报名截图

渔渔会在一个工作日内发送福利

福利领取截止日期：北京 9月30日

继续阅读

阅读原文

关键词

动态规划

问题

枚硬币

状态

就是