量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据领域的主流自媒体公众号拥有来自、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。
作者:Ralph Sueppel

随着量化基本面研究的发展,很多宏观经济指标的预测,也可以使用量化模型进行建模。今年对于宏观指标的Nowcasting模型一直是很多学者和机构研究的热点。金融市场的Nowcasting主要是预测即将发布的数据,尤其是GDP数据。Nowcasting模型也可以用于可以用于一系列与市场相关的信息的预测,包括通货膨胀、情绪、天气和收割条件。Nowcasting注重信息效率,特别适用于处理大规模的数据。底层模型通常将大型数据集压缩为几个隐含因子。Nowcasting还能处理了混合频率的数据。Nowcasting最流行的模型类是动态因子模型:这些模型有不同的类别,产生不同的结果。一种方法不能适用于所有的目的。当然,因子模型在Nowcasting领域也有竞争对手,如贝叶斯向量自回归、MIDAS模型和Bridge回归。
1、Nowcasting实际上就是预测
Nowcasting的主要目的是预测近期信息流。Nowcasting的基本原则是利用稍早发布的信息,并可能以比目标变量更高的频率发布信息,以便在官方数据公布之前获得‘早期估计。
2、Nowcasting在经济、金融等领域有着广泛的应用
Nowcasting在金融市场的主要应用是基于先前发布的高频数据对GDP进行预测。因此,许多投资者使用“Nowcasting”一词的意思就是跟踪当前的增长。然而,Nowcasting实际上已经在气象学中得到了发展,可以应用于如劳动力市场、通货膨胀、天气和农业收获条件(包括植物可利用土壤水分等细节)等预测。
“Nowcasting与经济学相关,因为有关当前经济状况的关键统计数据的获得有很大的延迟。对于那些按季度收集的数据尤其如此,国内生产总值(GDP)就是一个突出的例子。”
3、Nowcasting是对于信息的降维
在经济学和金融学领域,有太多潜在相关的高频指标需要关注。几乎每天都会披露一些高频数据,这些数据显然与重要的低频指标有关,比如企业收益、国民账户或收成。Nowcasting模型允许预先确定一种方法,定期将许多数据输入一个管道,然后只跟踪少数甚至单个估计指标。
“纽约联邦储备银行Nowcasting模型提取了驱动数据变化的潜在因素,并对每个经济序列做出预测……当该序列的实际数据与模型的预测不同时,这个‘消息’就会影响GDP增长的临近预测。”这种方法将市场参与者和政策制定者传统预测方式的关键特征正式化,这一过程包括监测许多数据的发布,形成对这些数据的预期,然后在事实发生变化时修正对经济状况的评估。”
4、Nowcasting依赖于能够自动处理“大数据”的模型
金融市场面临的挑战是处理大量且不断增加的数据。有效的Nowcasting模型可以自动处理大量数据序列,并将它们浓缩为一小部分信息数据点。关键是要知道哪些信息应该保留,哪些信息应该丢弃。
“从计量经济学的角度来看,每当参数的数量相对于观测的数量较大时,估计就具有挑战性。对大量变量之间的相互作用建模导致参数激增:这很可能意味着估计不确定性,使用传统工具的结果不可靠和不稳定。这一事实通常被称为“维度的诅咒”。建模者面临着过度简单(导致错误说明)和过度复杂(导致不稳定)之间的权衡。大数据计量经济学的目标是以一种简约的方式捕捉多个系列之间相互作用的显著特征,从而将维度的诅咒变为祝福。”
5、大多数Nowcasting模型通过“降维”来使用大数据
从统计学上看,降维就是对特征(解释变量)集进行降维的过程。这意味着,该模型将重点放在解释所有这些数据中大部分变化的几个潜在因素上,而不是所有的数据系列。在这个过程中,有不同的方法,比如动态因子模型、PCA降维或者是Bridge回归:
“使用要因子模型来监测宏观经济状况源于这样一种基本认识,即关于经济的不同方面和部门的信息可以被认为是对一些共同因素的不完善的衡量。动态因子模型建立在这一基本事实的基础上,为宏观经济系列提供一种简约而又合适的表示;它们是今天宏观经济学家用来处理大数据的主要工具之一”-[Bok, Caratelli, Giannone, Sbordone, and Tambalotti]
Bridge方程是季度GDP增长对一小部分预先选定的关键月度指标的回归。这种简单的建模策略在政策机构中很受欢迎,利用大量信息的另一种方法是将预测因子组合在少数公共因子中,然后通过卡尔曼滤波作为桥梁[回归]中的回归因子。[Angelini, Camba-Méndez, Giannone, Rünstler和Reichlin]
6、Nowcasting模型还能处理混频的数据序列
Nowcasting的基础数据序列有不同的频率,对观测周期的滞后程度也不同。抽象地说,两者都会导致丢失数据,而丢失数据的处理取决于数据的性质。对于缺失的观测有一个估计值范围。最优雅的(尽管不一定是最实用的)是基于卡尔曼滤波器。
混合频率问题本质上是缺失数据问题,它们可以通过卡尔曼滤波和平滑器轻松解决。卡尔曼滤波器和平滑器提供了状态向量在信息集上的条件期望。重要的是,卡尔曼滤波器和平滑器可以有效地处理[低频目标序列]中的任何缺失观测,并提供这些观测的条件期望。
7、最受欢迎的Nowcasting模型是因子模型
一个世纪以来,因子模型一直是标准的降维技术,随着大数据的崛起,它变得更加相关。简单的基本思想是,大范围的观察变量是由一小组因素控制的。
“因子模型是一种降维技术,存在于统计文献中已有近百年,最初被引入心理测量学领域。最近的大型数据集的可用性使得它们在过去的二十年中越来越受欢迎。它们现在被公共和私人机构普遍使用,如中央银行和投资银行,用于分析大型时间序列面板。最近,一种被称为近似动态因子模型(approximate dynamic factor models)的模型被认为是“大数据计量经济学”中一个先锋的降维技术。
8、有各种类型的因子模型被用于Nowcasting
不同的模型可以产生截然不同的结果。有两个关键问题有助于对Nowcasting因子模型进行分类。首先,因子是否只对观测数据(特征)有同期影响?如果答案是肯定的,它是一个静态因子模型;如果没有,则为动态因子模型。第二,这些因子是否解释了观察到的特征之间的所有相关性?如果答案是肯定的,那么就有一个精确的因子模型;如果不是,则有一个近似因子模型。例如,采用主成分分析进行降维,随后采用Bridge回归预测目标变量的常用因子模型版本是静态近似因子模型。所以因子模型根据Static/Dynamic及Approximate/Exact,可以分为四个类型。每种类型都可以用于Nowcasting。
9、除了因子模型,其他模型也可以做Nowcasting
因子模型并不是用于Nowcasting的唯一模型类。Bayesian vector autoregression (BVAR)、Bridge Regression和MIDAS模型也经常被使用。虽然后两种方法在计算上要差得多,但如果希望对过程进行判断和控制,或者有理由怀疑完全自动化的过程,那么它们可以相当实用。
10、Nowcasting模型更多的应用领域
各种Nowcasting模型的中间产品可以为投资者提供帮助。最明显的潜在因子或其平滑版本往往与基本面的经济指标有关,如增长、通货膨胀、收入和就业趋势。它们的趋势本身及其变化对所有资产类别都具有相关性。此外,区分趋势因素和暂时性(失真)因素可以极大地帮助解读相关的经济报告。此外,Nowcast的短期变化也可以显示出短期市场环境的变化。
继续阅读
阅读原文