量化投资的未来：理解和应对不确定性

作者 | Michael Zhang 麦教授

一个工作玩耍两不误（work hard, play harder）的教授

清华大学经管学院Irwin and Joan Jacobs讲席教授

前香港中文大学商学院讲席教授，副院长，香港深圳联合金融研究中心主任

超量子量化私募基金创始人

麻省理工学院（MIT）博士

清华大学文学学士、工学学士、管理学硕士

前些天，麦教授参加了在深圳举办的《中国量化投资白皮书》研讨会，并以《量化投资的未来：理解和应对不确定性》为题做了主题演讲。

演讲包含了很多干货，都是麦教授经常思考的一些底层逻辑问题，这里分享给大家。

先给大家讲个故事。

1940年代二战期间，德国开发了恩格玛机的加密密码器。因为密码机加密方式的复杂性和情报的及时性，破解密码的时间理论上只有24小时。

如果第一天没有完全破解的话，第二天密码换了就得重新开始。所以英国当时找了很多破密的人。

图灵就说了一句话：”我不想去做暴力破解，我希望开发出底层逻辑的东西，这样的话有任何的密码、信息，我都可以及时地破解。”

图灵从数学的角度提出了全新的方法论，用了逻辑计算——一种底层逻辑的方法来计算，最终大获成功。

故事触发了我们对量化未来的想象。

量化1.0，多因子线性模型。

量化2.0，机器学习非线性关系。

量化3.0，我们认为是数理统计+机器学习+经济金融模型三样东西的结合。

这张图就解释了为什么要将这三者结合起来，因为他们的目标是不一样的。

经济金融模型的目标是做解释，要把底层的逻辑搞清楚。

机器学习就是暴力破解，我不需要知道底层逻辑，只要做预测就好。

数理统计是更好地描述数据的分布，这三者缺一不可。

如下。纵轴是预测能力，传统的机器学习会希望把预测能力往上推。横轴是经济金融理论，希望能解释现象，把底层的逻辑搞清楚。

预测与解释有时候是矛盾的。

比如地心说预测能力很强，但是解释能力很差。它能预测太阳东升西落，但它的解释能力、底层逻辑是错的。

而进化论解释能力很强，预测能力就很差。进化论能解释清楚人为什么从猴子一直进化到现在，但是人未来长成什么样子，难以预测。

给大家分享一下我们超量子的投研体系，也就是我们的底层哲学。

金字塔最顶端是资管业务。很简单，风控、交易、资管业务任何私募都会有。

第二层也是量化私募的一层，包括金融工程、机器学习、模型、因子、策略。

再往下还有两层，都是超量子特有的。

第一层是Science。科学，数学、建模、统计工具。其中统计工具是从底层开发新的统计学模型，去对金融底层的数据做更深刻的理解，从而消除过度拟合，产生因果关系的模型。

再下一层还有Art，艺术的部分，是对不确定性的理解、对价值的思考、对人性的洞察、对优雅的追求。

我们认为每个人对世界的看法都可以拆解成很多小的逻辑，世界一共就4种状态：均衡态、循环态、随机态、复杂态。

其中均衡态就是小球放在碗里，推一推它还会回到碗底。

循环态就是不管东西怎么绕，到后来一定会回来，比如经济有周期。

随机态也是一种状态，没法预测，但它会产生随机的数据。

复杂态就如同蝴蝶效应，一个很小的扰动都会导致最后的结局非常不一样。

这4个状态在金融市场里都是存在的，我们的目标是寻找办法把它拆解出来，从底层去理解这些状态。

比如人的身高，如果用正态分布去描述的话，会描述得比较准确，如果用幂率分布，结论就很容易错。

所以模型是死的，最重要的是我们这些人应该用什么样的逻辑方法去描述这些数据。

股票数据也是如此，尖峰厚尾，但我们现在用的模型大多数是基于正态分布，能不能跳出正态分布去找新的底层，从科学层面去理解金融数据呢？

概率分布实际上经常不存在，很多人对不确定性的理解还不够深刻，认为不确定性就是波动率，波动率一高，不确定性就上来了，但并非如此。

Laplace在1814年就说，概率分布在很多场景下都不存在。这句话是对的，比如战争、选举、研发、婚姻、投资…

Laplace认为，当不知道某一事项概率分布的时候，会认为所有的概率都相等。

这就明显不对了。

所以不确定性有几个级别？

（1）确定性就是我从这里面随机抓小球一定是黄色的，如同太阳东升西落是确定的。

（2）风险是明天有70%的概率股市会涨，30%可能跌，这个70-30的比例就是我的风险。

（3）黑天鹅理论是说，可能有非常小的概率，产生我之前想不到的结果。

（4）第四个是风险之外的不确定性，但是目前没有统计学和数学的工具对其度量。如同我知道明天股市要么涨、要么跌，但我不知道概率分布。

以上四种风险哪种更贴近真实股市的描述？

主流金融模型现在用的模型都是第二个，但实际上是第四个。

我们不知道分布，我们需要有数学工具去解决它。我自己的研究一直在这个方向上。

结果不确定性与分布不确定性。这两种不确定性是必须要区分开的，所以如果你用了传统的模型去分析非常复杂的金融市场，那可能就会有很大的偏差。

风险和不确定性是两个概念。

举个例子。

ABC三个病人，感染病的概率分别为95%、30%和50%。

那谁的风险最高呢？

病人A。

谁的不确定性最大？

病人C，因为我们对他没有信息。

传统机器学习的

局限性在于：你用了神经网络，把损失函数最小化，求了最优解，找到了最低点。

但金融市场的损失函数可能是以下的第三种，从起点出发优化半天，找不到最低点。

所以问题在哪里？

问题就在于损失函数形状非常复杂，里面的不确定性导致用传统的模型也没法找到最优解。

我们放松了独立同分布的假设，基于独立不同分布的假设做了很多推导。

得到的结论是，传统模型认为95%的概率会发生的事，加一点点刚才说的风险之外的不确定性，置信度就从95%降到了60%了。交易时如果按照95%的信心去交易就会承担很大的风险。

所以当我们对不确定性理解更深刻的时候，交易的行为也会相应发生改变。

黑天鹅的厚尾也是一样。

厚尾传统是拿Kurtosis第四阶做分析，尾部厚度3就是正态分布。

当市场上不存在分布不确定性的时候，拿到并不是正态分布这样的尾部，一旦存在一点点不确定性，就发现Kurtosis迅速增长，所以它的尾部厚度立刻就增加了许多，之前用的模型就不可以用了。

我说了半天数学，并不是为了迷惑大家数学很复杂。

给大家举个例子，数学到底能做什么？

2020年1月19号我写了一篇公众号《2020想撒欢儿？去做空美股吧》。

就两个结论：1、有美股的可以减仓避一避，2、想冒险的可以做空一下。

大家都知道2月底美股就发生股灾了。巴菲特也说过：“过去238年有谁靠做空美国赚过钱?”我们团队就笑了，我们确实是在2020年做空美股赚到钱了。

下图黑线是我们的指数，当它从高点迅速地降下来，超过临界值横虚线的时候，就会有信号发生，从信号发生一直到真正的股灾，就是红线部分。

过去30年里，1987年、2008年、2011、2020年的股灾，都给出了非常准确的信号。

如1987年，它在临界线上面迅速穿越之后1个月之内就发生了股灾。

2020年，同样的，1月2号超过临界点，于是我们做空购买TVIX指数，从39块钱，在一个月之内到了1000块，实现单个策略回报率25倍左右。同时以0.25美元价格买了看空期权，最终涨到25美元，实现单个策略100倍。

我们不仅要看结论，也要看结论的逻辑。

股市，即便是猴子去做交易也有50%的胜率。如果机构在过去一个月之内胜率很高，也不一定真的表明个人能力强，底层逻辑对。

所以我们内部会讨论很多类似问题：你的逻辑到底对不对？

停着的钟一天也总有两次时间是对的，所以即便策略是错的从纯概率角度也有可能战胜市场，但如果想要长期战胜市场，底层逻辑必须是对的，而不能是结论暂时正确，这是第一个观点。

第二个观点，我认为金融市场像海洋的生态，不同的投资者是不同的鱼。

但从生态学上看，鲨鱼是不可能吃光所有小鱼的，没有一种策略能完全收割，但强的鲨鱼可以让弱的鲨鱼没有食物可吃，走向灭亡。所以相同策略的情况下，有可能导致非常卷的竞争局面。

量化的未来到底是什么样的？

我们认为现在是量化非常初级的阶段，所有机构都不是鱼，是草履虫。为什么大家觉得策略很卷，很相像，是因为现在处于进化早期，大家都用一样的策略，都吃一样的鱼，于是觉得竞争激烈，行业内卷。

到了未来必须是每一家量化机构都有自己赖以生存的方法论，那各个机构就会变成不同的鱼，形成完整的金融生态。

继续阅读

阅读原文