为什么我不是R方的粉丝
人们通常喜欢用R方作为评判模型拟合好坏的标准。与MSE和MAD不同,R方不只是模型误差的函数,它的定义中还隐含了两个模型的比较:一个是当前被分析的模型,一个是所谓的常数模型,即只利用因变量均值进行预测的模型。基于此,R方回答的是这样一个问题:“我的模型是否比一个常数模型更好?”,然而我们通常想要回答的是另一个完全不同的问题:“我的模型是否比真实的模型更差?”
通过一些人为构造的例子我们可以很容易发现,对这两个问题的回答是不可互换的。我们可以构造一个这样的例子,其中我们的模型并不比常数模型好多少,但同时它也并不比真实的模型差多少。同样,我们也可以构造出另一个例子,使得我们的模型远比常数模型要好,但也远比真实模型要差。
我们来考虑一个简单的例子,首先将备选模型与常数模型相比,然后将备选模型与真实模型对比,我们将会发现他们会产生完全相反的结论。假设我们想对函数f(x)进行建模,它在Xmin和Xmax之间均匀分布的n个点上又加入了噪声的观测。
我们首先假定:
在图中,我们可以看到f(x)可以被一条直线很好地近似,所以我们的线性和二次回归模型都可以很好地还原真实模型。这是因为 Xmin和Xmax非常接近,因此真实的函数在这个区域中可以被直线很好地近似,特别是相对于我们观测的噪声水平而言。
我们可以通过两组模型比较来对这些简单回归的效果进行评判:一组是我们的模型与常数模型的对比,另一组是我们的模型与真实的对数函数模型的对比。为了简化计算,我们采用不对回归变量数目进行调整的R方定义,因此模型m(相对于常数模型c)的R方计算方法是:
与“官方”的R方定义一样,这个数值告诉我们,在常数模型留下的残差中,有多大的比例是为备选模型所解释的。这个比较可能会与备选模型和真实模型之间的比较得出不同的结论。为了展示这一点,接下来我们考察一个R方的变种,我们称之为E方,它衡量了备选模型的误差相对于真实模型t而言有多差:
注意,E方在意义上与R方是相反的:拟合更好的模型具有更小的E方取值。
在我们的例子中,可以计算出线性模型的R方=0.007,而真实模型的是R方=0.006。相对而言,线性模型的E方=-0.0008,这说明对于这组数据,备选模型与真实模型之间是很难区分开的。尽管R方表明我们的模型可能不是非常好,但E方的取值说明在当前x的范围内,我们的备选模型已经接近完美了。
那么当Xmin和Xmax之间的间隔变大之后会发生什么呢?对于单调函数,如f(x)=log(x),我们将发现E方会随着间隔的增加而增加,而R方的表现则非常奇特:它先会递增一会儿,然后再下降。
在这个例子中,可以通过上图看出线性模型和二次模型都有系统性的偏差,但它们的R方值都有显著的增长:线性模型是R方=0.760,真实模型是R方=0.997。相比较而言,线性模型的E方=85.582,这说明该数据集提供了有力的证据表明线性模型比真实模型要差。
这个例子说明,尽管大多数人都会同意线性模型对真实模型的近似效果是越来越差的,但R方却有了显著的增长。从前一个例子到后一个的转换过程中,R方看似得到了提升,E方却表明由于Xmin=1和Xmax之间的间隔增加了,备选模型的拟合效果是大打折扣的。这表明R方并不能解释为E方的一个替代量(E方依赖于真实模型,通常是不可测量的)。然而我们的两个极端例子还不是故事的全部:事实上,R方从前一个例子到后一个的转换过程中,其变化并不是单调的。
其次是E方的:
回顾这篇文章的时候,我发现当时应该更加明确地指出,像MSE和MAD这样的模型拟合评判标准也是与模型的应用范围有关的。我之所以更倾向于使用它们,是因为它们没有隐含的归一化过程,也就是说它们看上去可以是任意的数,这意味着它们对于模型的应用范围是非常敏感的——反观R方,由于它是一个归一化的数字,因此它显得不那么“任意”,这可能会让我们忘了它是非常依赖于数据的。
其次,我之前确实应该用一种不同的归一化方法来定义E方。对于模型m,当拿它与常数模型c和真实模型t相比较时,下面这个有界的数值可能使用起来更为简便:
这个数值的意义是,在较差的基准模型(MSEc-MSEt)到最好的模型(MSEt-MSEt=0)之间,当前模型所处的位置是哪里。注意到在之前考察的同方差回归模型中 MSEt=Sigma方,它可以从经验数据利用同方差的可识别性假定和任意固定回归变量 x 上的重复观测进行估计。
另一种对这些想法的表达是将其中涉及到的数量进行偏差/方差分解。在这种视角下,我们可以得到
而补记一中的E方定义则有
在很大程度上,我认为R方难以理解的地方就在于其表达式中分子分母都含有Sigma方项。而E方本质上就是移除了Sigma方之后的结果。我认为这对于理解模型的拟合效果是更有帮助的。
翻译:邱怡轩
原创文章,版权所有。
敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected] ),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都二维码。
统计之都:专业、人本、正直的中国统计学门户网站。
关注方式:扫描下图二维码。或查找公众帐号,搜索 统计之都 或 CapStat 即可。
往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。
统计之都欢迎诸位看官积极投稿,投稿信箱[email protected]
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。