作者 | Michael Zhang 麦教授
一个工作玩耍两不误(work hard, play harder)的教授
清华大学经管学院Irwin and Joan Jacobs讲席教授
前香港中文大学商学院讲席教授,副院长,香港深圳联合金融研究中心主任
超量子量化私募基金创始人

麻省理工学院(MIT)博士

清华大学文学学士、工学学士、管理学硕士
前些天,麦教授参加了在深圳举办的《中国量化投资白皮书》研讨会,并以《量化投资的未来:理解和应对不确定性》为题做了主题演讲。
演讲包含了很多干货,都是麦教授经常思考的一些底层逻辑问题,这里分享给大家。
01
先给大家讲个故事。
1940年代二战期间,德国开发了恩格玛机的加密密码器。因为密码机加密方式的复杂性和情报的及时性,破解密码的时间理论上只有24小时。
如果第一天没有完全破解的话,第二天密码换了就得重新开始。所以英国当时找了很多破密的人。
图灵就说了一句话:”我不想去做暴力破解,我希望开发出底层逻辑的东西,这样的话有任何的密码、信息,我都可以及时地破解。”
图灵从数学的角度提出了全新的方法论,用了逻辑计算——一种底层逻辑的方法来计算,最终大获成功。
故事触发了我们对量化未来的想象。
量化1.0,多因子线性模型。
量化2.0,机器学习非线性关系。
量化3.0,我们认为是数理统计+机器学习+经济金融模型三样东西的结合。
这张图就解释了为什么要将这三者结合起来,因为他们的目标是不一样的。
经济金融模型的目标是做解释,要把底层的逻辑搞清楚。
机器学习就是暴力破解,我不需要知道底层逻辑,只要做预测就好。
数理统计是更好地描述数据的分布,这三者缺一不可。
如下。纵轴是预测能力,传统的机器学习会希望把预测能力往上推。横轴是经济金融理论,希望能解释现象,把底层的逻辑搞清楚。
预测与解释有时候是矛盾的。
比如地心说预测能力很强,但是解释能力很差。它能预测太阳东升西落,但它的解释能力、底层逻辑是错的。
而进化论解释能力很强,预测能力就很差。进化论能解释清楚人为什么从猴子一直进化到现在,但是人未来长成什么样子,难以预测。
02
给大家分享一下我们超量子的投研体系,也就是我们的底层哲学。
金字塔最顶端是资管业务。很简单,风控、交易、资管业务任何私募都会有。
第二层也是量化私募的一层,包括金融工程、机器学习、模型、因子、策略。
再往下还有两层,都是超量子特有的。
第一层是Science。科学,数学、建模、统计工具。其中统计工具是从底层开发新的统计学模型,去对金融底层的数据做更深刻的理解,从而消除过度拟合,产生因果关系的模型。
再下一层还有Art,艺术的部分,是对不确定性的理解、对价值的思考、对人性的洞察、对优雅的追求。
03
我们认为每个人对世界的看法都可以拆解成很多小的逻辑,世界一共就4种状态:均衡态、循环态、随机态、复杂态。
其中均衡态就是小球放在碗里,推一推它还会回到碗底。
循环态就是不管东西怎么绕,到后来一定会回来,比如经济有周期。
随机态也是一种状态,没法预测,但它会产生随机的数据。
复杂态就如同蝴蝶效应,一个很小的扰动都会导致最后的结局非常不一样。
这4个状态在金融市场里都是存在的,我们的目标是寻找办法把它拆解出来,从底层去理解这些状态。
比如人的身高,如果用正态分布去描述的话,会描述得比较准确,如果用幂率分布,结论就很容易错。
所以模型是死的,最重要的是我们这些人应该用什么样的逻辑方法去描述这些数据。
股票数据也是如此,尖峰厚尾,但我们现在用的模型大多数是基于正态分布,能不能跳出正态分布去找新的底层,从科学层面去理解金融数据呢?
04
概率分布实际上经常不存在,很多人对不确定性的理解还不够深刻,认为不确定性就是波动率,波动率一高,不确定性就上来了,但并非如此。
Laplace在1814年就说,概率分布在很多场景下都不存在。这句话是对的,比如战争、选举、研发、婚姻、投资…
Laplace认为,当不知道某一事项概率分布的时候,会认为所有的概率都相等。
这就明显不对了。
所以不确定性有几个级别?
(1)确定性就是我从这里面随机抓小球一定是黄色的,如同太阳东升西落是确定的。
(2)风险是明天有70%的概率股市会涨,30%可能跌,这个70-30的比例就是我的风险。
(3)黑天鹅理论是说,可能有非常小的概率,产生我之前想不到的结果。
(4)第四个是风险之外的不确定性,但是目前没有统计学和数学的工具对其度量。如同我知道明天股市要么涨、要么跌,但我不知道概率分布。
以上四种风险哪种更贴近真实股市的描述?
主流金融模型现在用的模型都是第二个,但实际上是第四个。
我们不知道分布,我们需要有数学工具去解决它。我自己的研究一直在这个方向上。
05
结果不确定性与分布不确定性。这两种不确定性是必须要区分开的,所以如果你用了传统的模型去分析非常复杂的金融市场,那可能就会有很大的偏差。
风险和不确定性是两个概念。
举个例子。
ABC三个病人,感染病的概率分别为95%、30%和50%。
那谁的风险最高呢?
病人A。
谁的不确定性最大?
病人C,因为我们对他没有信息。
传统机器学习的
局限性在于:你用了神经网络,把损失函数最小化,求了最优解,找到了最低点。

但金融市场的损失函数可能是以下的第三种,从起点出发优化半天,找不到最低点。
所以问题在哪里?
问题就在于损失函数形状非常复杂,里面的不确定性导致用传统的模型也没法找到最优解。
我们放松了独立同分布的假设,基于独立不同分布的假设做了很多推导。
得到的结论是,传统模型认为95%的概率会发生的事,加一点点刚才说的风险之外的不确定性,置信度就从95%降到了60%了。交易时如果按照95%的信心去交易就会承担很大的风险。
所以当我们对不确定性理解更深刻的时候,交易的行为也会相应发生改变。
黑天鹅的厚尾也是一样。
厚尾传统是拿Kurtosis第四阶做分析,尾部厚度3就是正态分布。
当市场上不存在分布不确定性的时候,拿到并不是正态分布这样的尾部,一旦存在一点点不确定性,就发现Kurtosis迅速增长,所以它的尾部厚度立刻就增加了许多,之前用的模型就不可以用了。
06
我说了半天数学,并不是为了迷惑大家数学很复杂。
给大家举个例子,数学到底能做什么?
2020年1月19号我写了一篇公众号《2020想撒欢儿?去做空美股吧》
就两个结论:1、有美股的可以减仓避一避,2、想冒险的可以做空一下。
大家都知道2月底美股就发生股灾了。巴菲特也说过:“过去238年有谁靠做空美国赚过钱?”我们团队就笑了,我们确实是在2020年做空美股赚到钱了。
下图黑线是我们的指数,当它从高点迅速地降下来,超过临界值横虚线的时候,就会有信号发生,从信号发生一直到真正的股灾,就是红线部分。
过去30年里,1987年、2008年、2011、2020年的股灾,都给出了非常准确的信号。
如1987年,它在临界线上面迅速穿越之后1个月之内就发生了股灾。
2020年,同样的,1月2号超过临界点,于是我们做空购买TVIX指数,从39块钱,在一个月之内到了1000块,实现单个策略回报率25倍左右。同时以0.25美元价格买了看空期权,最终涨到25美元,实现单个策略100倍。
07
我们不仅要看结论,也要看结论的逻辑。
股市,即便是猴子去做交易也有50%的胜率。如果机构在过去一个月之内胜率很高,也不一定真的表明个人能力强,底层逻辑对。
所以我们内部会讨论很多类似问题:你的逻辑到底对不对?
停着的钟一天也总有两次时间是对的,所以即便策略是错的从纯概率角度也有可能战胜市场,但如果想要长期战胜市场,底层逻辑必须是对的,而不能是结论暂时正确,这是第一个观点。
第二个观点,我认为金融市场像海洋的生态,不同的投资者是不同的鱼。
但从生态学上看,鲨鱼是不可能吃光所有小鱼的,没有一种策略能完全收割,但强的鲨鱼可以让弱的鲨鱼没有食物可吃,走向灭亡。所以相同策略的情况下,有可能导致非常卷的竞争局面。
量化的未来到底是什么样的?
我们认为现在是量化非常初级的阶段,所有机构都不是鱼,是草履虫。为什么大家觉得策略很卷,很相像,是因为现在处于进化早期,大家都用一样的策略,都吃一样的鱼,于是觉得竞争激烈,行业内卷。
到了未来必须是每一家量化机构都有自己赖以生存的方法论,那各个机构就会变成不同的鱼,形成完整的金融生态。
继续阅读
阅读原文