作者:石川,北京量信投资管理有限公司创始合伙人,清华大学学士、硕士,麻省理工学院博士。《因子投资:方法与实践》领衔作者,《机器学习与资产定价》译者。
封面来源:https://www.pexels.com
未经授权,严禁转载。
由于个股协方差矩阵很难求逆,因此使用因子是必然的选择。然而,在什么情况下,因子能 span SDF,从而不会损失投资机会?

1
令  代表股票数量,  代表公司特征(firm characteristics)数量,令  维矩阵  表示  时刻的所有股票的全部特征(其中第一列是 a vector of ones)。此外,令  代表  个股票  时刻的超额收益率向量。定义如下条件预期收益率和条件协方差矩阵:
如果已知  和  ,则由这  个资产构造的 mean-variance efficient portfolio 的权重为  。根据资产定价理论,该投资组合与 SDF 以及 factor model 等价,即该投资组合作为因子可以给所有股票定价。
To see why:
由权重和个股收益率可知,该组合的超额收益率为  。令  表示该投资组合的条件预期收益率和方差。根据定义并带入  可得:
从上述推导可知,对 mean-variance efficient portfolio 来说,  和  的取值是一样的。
接下来,由  可知  。从这个关系出发做如下推导:
即  。
不幸的是,我们很难根据个股的收益率计算出想要的权重  。先不说事前估计问题,即便是对协方差矩阵  求逆就让我们望而却步。所以,使用个股来构造 mean-variance efficient portfolio 或者 SDF 是不现实的。
因此,人们转而使用多因子模型。
2
一个因子可以看做  个资产的线性组合。假设共有  个因子,它们的投资组合权重由  维权重矩阵  表示,即因子收益率满足  。因子的条件预期收益率和协方差矩阵则为  和  。
当使用因子取代个股进行投资时,人们关心的是所构造的所有因子能否捕捉和使用个股一样的投资机会。换句话说,即这  个因子能否 span SDF,又或者,通过这些因子实现的最大夏普比率平方(即  和通过个股实现的最大夏普比率平方(即  )是否相等?
在实证研究和投资实践中,因子投资组合权重  的确定方式千差万别 —— 比如 Fama and French (1993) 使用根据公司特征进行 portfolio sort(并一举成为研究范式),又比如 Fama and French (2020) 转而使用 OLS(和 Barra 类似),再比如最近几年一些结合机器学习算法的最新文章直接使用经标准化后的公司特征本身作为权重 —— 因此,回答上述问题就显得至关重要。
从本文第一节的论述可知,最大夏普比率平方(或 SDF)和个股的协方差矩阵密切相关(这是因个股的协方差矩阵是计算  的输入之一)。然而,无论是 portfolio sort、OLS 还是直接使用  ,这些构造因子的方法均未直接考虑个股的协方差矩阵。因此,我们有足够的理由怀疑,虽然使用因子绕过了对  求逆这个mission impossible,但是代价也许是丧失和很多投资机会(最大夏普比率平方)。那么,是否在一定的条件下,这种损失是有限的甚至是忽略不计的呢?即构造的因子能够捕捉和使用个股一样的投资机会。
Kozak and Nagel (2022) 就这个问题从三方面展开了精彩的论述:
1. 在什么情况下,不同权重方法构造的因子能够 span SDF;
2. 如果 1 中的条件无法满足,则应该如何解决;
3. 如何进一步降维(即最近几年很火的 PCA、IPCA、PPCA 方法有效的先决条件)。
由于该文的内容非常丰富,因此我打算将其拆成多个部分。本文是系列第一篇,主要关注第一个问题。
3
任何讨论都是从假设开始。Kozak and Nagel (2022) 最基本的假设是个股条件预期收益率  是公司特征  的线性函数,即  ,其中  是  维向量。
在这个假设下,对于任意给定的  维可逆矩阵  ,以权重  构造的因子,即  能够不损失投资机会(即 span SDF)。这个结论是 Kozak and Nagel (2022) 的 Proposition 1。
举个例子,取  。将其代入因子收益率表达式可知  。不难看出,该因子收益率实际就是用个股收益率对公司特征做 GLS 回归得到的回归系数。因此,上述  下,我们得到了 GLS 因子,使用它们代替个股投资可以得到相同的最大夏普比率平方。此外,在该构造方法下,因子的预期收益率  ,而个股对因子的  恰好就是公司特征  。
这是因为,在该  下,  。因此(注意由模型假设有  ,
将  代入  有  ,再联立  ,有  。这个关系的大白话意思是,无论你使用公司特征当做  ,还是先用公司特征(通过 GLS)构造因子再通过个股和因子协方差计算  ,二者是完全等价的。所以,在这个特殊的 case 下,which beta 之争根本就不存在。
再举个更简单的例子,令  为  维单位矩阵  。在这种情况下,因子收益率为  ,且可以推导出个股和因子收益率的协方差  。
上述两个例子虽然给出了不损失投资机会的因子构造方式,但是细心地小伙伴一定注意到了,在构造因子时依然用到了个股协方差矩阵的逆矩阵  ,所以我们并没有绕过这个问题。因此,前面说的这些仅是热身。下面就来看看不使用  的情况。
4
在实际中,我们通过公司特征  构造因子时,往往采用
例如,当  时,相当于用(经过标准化之后的)公司特征直接作为权重(见 Kozak, Nagel, and Santosh 2020);又或者当  时,相当于使用 OLS 求解个股收益率对公司特征回归(见 Fama and French 2020)。由于在这些选择中不涉及  ,因此上述 Proposition 1 并不成立。针对这些情况,Kozak and Nagel (2022) 提出了 Proposition 2。
在  假设下,令  ,其中   是某个可逆  维矩阵,那么利用因子  取代个股时,不损失投资机会(即因子 span SDF)的充要条件是个股的协方差矩阵满足如下分解:
其中  、  以及  是满足相应维数要求的矩阵,且  。在实践中,为了尽可能满足  ,一个可行的做法是让  包含更多的公司特征:哪怕一些特征无法解释预期收益率的截面差异,而是只能解释个股的协方差,只要它们有助于实现  ,那么就应该被包含在  中,并用来构造因子投资组合并确保投资机会。
我们下面来看看,在 Proposition 2 下,  取   (即 OLS)或者  (即直接使用公司特征)时,构造的因子有哪些特点。
当  时,  。此时,  ,因此有
因此,和前述 GLS 情况类似,  且  。
当  ,即  时,  ,此外,可推导出  。
利用  (这是业界非常流行的使用方式),我们再对  这一约束条件做一个直观地解释。为了使多因子模型能够 span SDF(或者给所有个股准确定价),个股和因子之间的  应能够解释预期收益率的所有变化(即   span 预期收益率)。在  时,  由两部分组成:
当  时,上述中第二项为零。由于第一项是  和某个可逆矩阵相乘,且由模型假设已知  和  的线性关系,因此  确实能够完美解释预期收益率。
然而,当  时(即约束条件不满足),上述第二项不为零。因此  会被  之外的部分所“污染”,而这部分是没有被定价的(因为只有  和预期收益率有关)。由于 SDF 只包含被定价的风险,而上述构造的因子中存在未被定价的风险,因此使用上述因子势必会牺牲投资机会。
那么,在实践中,当  不满足时,能否通过某些方法对冲掉未被定价的风险,从而构造更好的因子呢?这就是 Kozak and Nagel (2022) 一文讨论的第二个方面,我们择日再来梳理。
参考文献
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.
Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models. Review of Financial Studies 33(5), 1891 – 1926.
Kozak, S. and S. Nagel (2022). When do cross-sectional asset pricing factors span the stochastic discount factor? Working paper.
Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section. Journal of Financial Economics 135(2), 271 – 292.
免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。
总写量化
分享量化理论和实证心得
继续阅读
阅读原文