量化投资与机器学习微信公众号，是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者，连续2年被腾讯云+社区评选为“年度最佳作者”。

量化投资与机器学习公众号独家解读
量化投资与机器学公众号 QIML Insight——深度研读系列是公众号今年全力打造的一档深度、前沿、高水准栏目。

公众号遴选了各大期刊前沿论文，按照理解和提炼的方式为读者呈现每篇论文最精华的部分。QIML希望大家能够读到可以成长的量化文章，愿与你共同进步！

本期遴选论文
来源：
The Journal of Portfolio Management November 2021

标题：
Should Equity Factors Be Betting on Industries?

作者：
Krishna Vyas、Mihael、Baren

核心观点

大部分大类因子都有行业暴露的倾向，行业暴露对有些因子有利，对有些因子会增加风险；

即使是同一类大类因子，不同定义下，因子的表现也不一致；

因子模型中，对于行业暴露的控制可以精细化到不同的因子中，而不要一刀切的对所有因子进行行业中性化。

在做因子测试时，大家都会进行行业中性化处理，但完全的中性掉因子的行业暴露实际上是不可取的，因为有些因子具有行业选择的预测能力，因子收益的大部分是源自于正确的行业暴露。如何定量的研究因子与行业暴露之间的关系，行业暴露有利于什么样的因子？作者在这篇文章中给出了一定的答案。

作者定义了以下21个常用的风格因子，并通过控制变量与权重调整的方法测试了不同因子与行业暴露之间的关系。

实证

数据

作者选取了FTSE发达国家指数的成分股作为股票池，选取这个股票1994年7月至2018年2月，每月末的数据（包含以上21个因子），这个股票池包含大约2000个中大盘的股票。

验证方法

采用以下公式（等式1）对因子进行行业内标准化，对每个月末某行业i内的所有股票，标准化后的因子为因子原始值减去原始值中位数，再除以k倍的行业内因子的MAD，其中k为1.4826（参考Rousseeuw and Croux 1993）。

作者也尝试了其他标准化的方法，不同方法的结果没有很大的区别，但等式(1)的方法对于异常值更稳健。在后文中，该方法计算出来的因子称为行业内因子（within-industry factor)。这样经过标准化处理后的因子就可以跨行业比较的。为了研究行业本身的影响，作者又定义了跨行业因子（across-industry factor），这个因子的作用是包含行业暴露的信息，该因子定义如等式(2)：

为了研究行业暴露对不同因子的影响，作者定义了以下符合因子，该因子为等式(1)和(2)两者的线性加权，其中w的取值范围为0到1，通过w的变化我们可以定量的研究不同因子与行业暴露的关系（如图3示例）。w越大，行业内因子比重越大，行业暴露的影响占因子的比重越小；w越小，跨行业因子比重越大，行业暴露的影响占因子的比重越大。

在具体研究每个因子与行业暴露的关系时，采用了如等式(4)的截面回归的方法 (Fama and MacBeth 1973) ：

其中controls为控制变量，作者选取了五类风格因子作为控制变量，包括value, quality, momentum, low-volatility, 和size。如momentum的控制变量计算方式如下，将momentum类里的三个因子计算排序后取平均值，再计算排序，这样做的一个目的是减少变量的数量，控制多重共线性。如果所分析的因子属于五类风格因子，则在控制变量中去除这一类风格因子。

最终，把测试期间每个因子的回归系数的t统计量的平均值作为测试结果，关于这个t统计量的解释如下，参考图3：

1、如果靠近w=0端（最左端），t统计均值大于2，说明因子显著性与行业暴露关系不大,因子收益不受行业暴露影响。

2、如果靠近w=1端（最右端），t统计均值大于2，说明因子显著性与行业暴露关系非常明显，因子收益主要受行业暴露影响。

3、如果两端的t统计均值都大于2，说明因子显著性与行业暴露及因子值本身的关系都比较明显。

结果分析

Value因子

作者一共测试了以下7个Value因子，结果如图5所示，其中蓝色横线为通过原始因子值回归计算的t统计量。

可以发现：

随着w的增加，t统计量整体呈上升趋势，说明当因子进行行业中性化之后，因子的显著性增加。也就是说，利用Value因子，并没有选行业带来的Premium，大部分是选股票带来的Premium。（Value因子没有选取行业的能力）

不同的Value因子，表现比较一致。

Quality因子

不同Quality因子的结果之间有很大的差别，不如Value因子的表现那么一直：

ROA、ROE、negEISS随着w的增加，t统计量单调的降低，说明当因子进行行业中性化之后，因子的显著性降低。也就是说，利用Quality因子，可以获得选行业带来的Premium，行业暴露有利于因子表现。但对于ROE，随着w的增加，t统计量并没有显著的降低，说明因子显著性与行业暴露及因子值本身的关系都比较明显。