量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据领域的主流自媒体公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。

核心观点
在控制了市场溢价、规模因素、盈利能力等因素后,无论lead股票和follower股票之间的业务关系如何,他们之间的收益都具有较强的共振效应。新闻共现图的月度degree是一个很好的预测股票横截面收益的指标。一个月的再平衡投资组合测试表明,degree提供了显著的正Alpha(相对Fama-French三因子和五因子模型)。
新闻报道中往往会出现多只股票,这些股票间的收益是否存在关联性?是否能够构建基于新闻中共现股票的有效因子?今天给大家分享的这篇论文,基于美股标普500的近100万篇新闻,详细回答了这个问题。
首先,作者基于股票在新闻中提及的位置,将出现在标题中的股票定义为lead,同时将出现在新闻正文中的其他股票定义为follower。例如下面这篇新闻,Apple出现在新闻标题中,则Apple为leader;Intel、Nike及Peloton出现在正文中,它们就是follower。
定义股票共现图
统计过去 时间段所有新闻 中出现的股票,定义 为股票j出现在标题且股票i出现在正文中的频次。
根据以上 的定义,可以定义以各股票为节点的有向图(Directed Graph),其中边的权重 如下定义:
其中 表示股票i,j在T时间段成对出现(即 )的次数, 。如上定义, 就是股票共现图的邻接矩阵。
我们可以根据股票ij的某些性质来拆解邻接矩阵 (或者说是重构股票共现图)。比如我们可以根据股票i,j是否属于同一行业, 拆解成 (同属一个行业的股票的邻接矩阵)和 (不属于同一行业股票的邻接矩阵):
同样,也可以根据lead股票是不是大盘股,将 拆解为 (lead股票市值为前30%的股票构成的邻接矩阵)和 (lead股票市值为后70%的股票构成的邻接矩阵):
最后,我们也可以根据股票的流动性(使用换手率指标),将 拆解为 (lead股票换手率为前30%的股票构成的邻接矩阵)和 (lead股票换手率为后70%的股票构成的邻接矩阵):
使用不同的维度将 进行拆解(相当于把共现图进行过滤),我们能够研究不同属性的股票收益率之间关联性。比如将邻接矩阵根据行业拆解后,我们能够对比是同一行业的股票的收益共振更强烈,还是不同行业的股票的收益共振更强烈。
定义领先收益(Lead Return)
如上文所述,我们将每篇新闻中出现的股票分为lead股票和follower股票。一个自然而然的问题,follower股票的收益是否会受到lead的影响?由于每个follower有多个lead,所以我们首先需要定义领先收益(lead return):
即每个follower在t时间的lead return,为这个follower股票i所有lead股票j在t时间的加权收益,加权的权重为邻接矩阵的元素 。这里在确定共现图时,使用的是滚动窗口 (即时间t-l至t)的所有新闻。我们也可以根据lead股票的收益的正负,单独计算正(负)lead return:
共现股票收益关联性研究
本文使用以下多元面板回归,研究lead股票与follow股票收益的关联性。当h等于0时,研究的是lead股票与follow股票收益的co-movement;当h大于0时,研究的是lead股票收益对follow股票收益的领先性(预测性)。在后续的实证分析中,用做因变量的follow股票收益数 y ,除了使用原始收益外,还使用了去除Fama-Frech三因子和五因子收益的残差收益。
在实证分析中,作者从50多个网站2016-2020年期间共100多万篇新闻,构建了标普500成分股的新闻共现关系图,使用的滑动窗口为1年。如下图为AAPL和其lead股票收益的关系。可以发现,AAPL和它的lead股票收益存在明显的co-movement;而且如中间子图所示,与同行业的股票co-movement更显著。
基于所有标普500成分股,按以上等式面板回归的结果如下表所示,我们有以下发现:
  • 在去除其他风格因子影响后,follower股票与lead股票之间存在显著的co-movement;
  • follower股票与同行业lead股票的co-movement更加显著,但与不同行业lead股票的co-movement也很显著;
  • 相对市值小的lead股票的co-movement,follower股票与市值更大的lead股票的co-movement更显著。
  • 相对流动性大的lead股票的co-movement,follower股票与流动性小的lead股票的co-movement更显著。
当我们将h设为1时,我们研究了前一天lead股票的收益相对于当天follower股票的预测性,结果如下表所示,我们可以看出:
  • 整体上(如第1列所示),lead股票对于follower股票的收益没有预测性;
  • 非同一行业lead股票收益有明显的反转效应(即前一天它们收益越低,follower股票收益越高);
  • 正lead return的股票有明显的动量效应(即前一天它们收益越高,follower股票收益越高);
根据以上测试结果,我们可以将具有有效预测作用的lead return进行加总,构建以下因子,分组测试结果如下表所示:
除了使用lead return构建因子,我们还可以使用图本身的特征构建因子,比如使用图的degree。下图表展示了使用过去1个月的新闻数据构建共现图,然后使用图节点的degree作为因子的分组测试结果(月度调仓):
综上,我们可以发现,lead return和degree因子的分组测试都有显著的单调性,但考虑交易成本后,degree因子的有效性更加显著。
总结
我们发现,在控制了市场溢价、规模因素、盈利能力等因素后,无论lead股票和follower股票之间的业务关系如何,他们之间的收益都具有较强的共振效应。新闻共现图的月度degree是一个很好的预测股票横截面收益的指标。一个月换仓的投资组合测试表明,degree提供了显著的正Alpha(相对Fama-French三因子和五因子模型)。
我们的结果为投资组合管理提供了两个见解。首先,投资者可以通过考虑资产之间的共振效应来优化他们的投资组合。其次,基于degree的投资组合检验可以很容易地转化为交易策略。
继续阅读
阅读原文