前面提个醒,想及时获取最新科研成果报道?关注上面“国际科学”公号,时时关注科学进展情况!

来源 | 知网
作者 | 王智波 李长洪 
摘要:本文利用1989—2009年中国健康与营养调查数据(CHNS)研究我国男性工资婚姻溢价及其产生的原因。本文发现在控制相关特征变量之后,在婚男性工资比非在婚男性工资显著高出6.8%。究其原因,本文发现我国的男性婚姻溢价无法使用婚后家庭内部专业化分工、男性婚后责任感增强以及女性选择优秀的男性作为配偶来解释,但是可以由妻子的“相夫”特征所解释。这一发现传递出正能量,同等条件下已婚男性收入更高,不是因为好男人都结婚了,而是因为结婚了,他才成为好男人。
关键词:婚姻溢价、相夫效应、选择效应
引言和文献综述
“好男人都结婚了”是网络上的一个热门话题,劳动经济学对男性工资的经验研究为这个说法提供了丰富的证据:在控制相关特征变量之后,已婚男性的工资显著地高于单身男性。这一现象被称为男性婚姻溢价。据Schoeni(1990)对多个国家婚姻溢价现象的研究,各国男性婚姻溢价一般介于3%—31%。
对于男性婚姻溢价产生的原因,文献给出了两种解释:其一,婚姻是因,婚姻溢价是果,即婚姻提高男性生产力;其二,男性的某种不可观测的生产力是因,婚姻和婚姻溢价是果,即某些男性具备不可观测的生产力导致他们更容易结婚并获得更高的工资。经济学家将第一种解释称为婚姻的生产力假说,具体影响机制是已婚男性可以从家庭性别分工中获得间接收入。这一影响机制的理论模型由 Becke(1975)提出,他认为婚姻有利于家庭内部专业化分工,根据比较优势原理,由于女性在家庭劳动方面比男性更有优势,因此男性将更多的精力集中在人力资本积累上,即婚后的家庭分工提高了男性的生产力,这一机制被称为“家庭分工理论”。经济学家将第二种解释称为婚姻的选择性假说,该假说认为并非是婚姻导致男性婚姻溢价,而是已婚男性原本就具有较高的不可观测的生产力,只是女性选择了拥有这种不可观测生产力的男性作为结婚对象,从而表现出婚姻溢价,文献称之为婚姻的“选择效应”。
经验研究对于男性婚姻溢价具体是由何种原因引起的莫衷一是:(1)有文献支持“选择性假说”。Cornwell and Rupert(1997)使用全国青年纵向调查数据,通过利用固定效应模型和随机效应模型研究不可观测因素是否可以解释男性婚姻溢价,他们发现,通过固定效应模型估计的男性婚姻溢价系数比随机效应模型估计的要小得多,他们据此认为男性婚姻溢价应更多地归因于那些与影响婚姻状况相关的不可观测因素;Nakosteen and Zimmer(1997)利用收入动态追踪数据发现高收入的单身男性有着更大的结婚可能性以及更小的离婚可能性;Krashinsky(2004)利用当前人口调查和NLSYM数据,发现已婚男性在结婚之前就已具有高工资增长的特征,在结婚一年以后,其工资增长几乎没变化。他认为这是男性婚姻溢价可以由“选择效应”来解释的证据。(2)更多的文献支持“生产力假说”。Daniel(1992)和Gray(1997)等从妻子的工作时间角度来检验家庭内部分工理论,他们发现妻子的劳动市场工作时间与丈夫的工资溢价呈反向关系;Chun and Lee(2001)利用1999年CPS数据,使用Maddala(1983)提出的干预效应模型修正了婚姻状态作为内生虚拟变量所产生的选择性偏误,发现男性的婚姻溢价可以由家庭分工理论所解释,但无法由选择效应所解释;Antonovicsand Town(2004)使用同卵双胞胎的数据,通过双胞胎之间的一阶差分清除不可观察的遗传禀赋和家庭背景对婚姻溢价的影响后发现,双胞胎差分回归的男性婚姻溢价估计系数比OLS估计的系数还要大,据此,他们认为不能用“具有更高生产力的男性更容易结婚”来解释男性的婚姻溢价。(3)也有文献同时支持家庭专业化分工假说和选择效应假说。Korenman and Neumark(1991)利用NLSYM数据,通过固定效应模型,发现选择效应可以解释男性工资婚姻溢价的50%,同时,他们证明婚姻本身不仅提高了男性在劳动力市场上的生产率,还提高了男性在某些特定岗位(如管理人员或专业人员)升迁的概率;Bardasi and Taylor(2008)利用英国家庭追踪调查数据,使用固定效应模型控制了一系列与个人、家庭、工作及雇主相关的特征变量以及不随时间变化的个体异质性之后,发现妻子的工作时间与丈夫的工资成负向关系,以及妻子所负责的家务数量与丈夫的工资成正向关系,他们据此认为,婚姻溢价部分归因于家庭内部专业化。同时,他们发现固定效应模型估计的婚姻溢价系数比OLS模型估计的要小,他们据此认为,这是因为OLSO没有捕捉到那些与工资正相关且不可观测的个体固定效应,这表明一部分男性婚姻溢价应归因于“选择效应”。
我们认为,已有研究可能存在两个不足:一是识别方法上的不足;二是对中国的情况研究不足。对于后者,我们无须赘述,前期文献使用的样本多是来自西方国家,对婚姻溢价形成机制分析仅围绕“家庭分工理论”和“婚姻选择效应”展开,而对中国文化中特有的妻子“相夫教子”和男性婚后“责任感”对婚姻溢价的影响并没有关注。对于前者———现有文献识别方法上的问题,我们略作展开如下:
“家庭分工理论”和“婚姻选择效应”之间的差别是前者认为男性婚姻工资溢价是婚姻导致的结果,而后者认为婚姻溢价是遗漏不可观测变量导致的内生性偏误。因而,识别男性婚姻溢价形成机制的关键是解决其中涉及的遗漏变量问题。
在我们看到的文献中,解决这一问题的基本思路有三种:一是利用面板数据,通过固定效应模型来控制不随时间变化的不可观测个体异质性;二是利用同卵双胞胎数据进行一阶差分回归控制不可观测异质性;三是利用Maddala(1983)两步估计方法来处理婚姻状态是内生虚拟变量所产生的样本选择偏误问题①5 。在这三种识别方法中,第一种在文献中使用得最多,后两种使用得较少。由于干预效应模型后文将详细介绍,因此,此处仅介绍前两种方法的工作原理和识别上的问题。
固定效应模型和同卵双胞胎数据一阶差分模型的工作原理是,通过比较固定效应模型的估计值或双胞胎一阶差分模型的估计值与混合OLS模型或随机效应模型估计值的大小来识别“选择效应”是否存在。有些研究发现在运用固定效应模型控制不可观测异质性后,较混合OLS模型或随机效应模型,男性婚姻溢价的估计系数剧烈下降或者失去统计上的显著性,他们据此报告了“选择效应”可以解释婚姻溢价;另有文献发现运用固定效应模型估计的男性婚姻溢价回归系数无异于不控制固定效应的混合OLS回归系数估计,他们则报告“选择效应”不可以解释男性婚姻溢价。
固定效应模型存在两个方面的识别问题:(1)固定效应估计量是基于除时间均值的所谓“组内估计量”,其一致性要求解释变量与各期的扰动项均不相关(而不仅是当期解释变量与当期的扰动项不相关,这是相当强的一个假设,而且在婚姻溢价研究中肯定会违背)。如果男性过去的收入影响到其当前的婚姻状况,则固定效应模型估计的婚姻溢价回归系数会出现偏误。例如,男性在得到一份好的工作之后,他更有可能结婚。此时,固定效应的估计系数会出现向下偏误。如果未观察到的生产力是随时间变化的,则固定效应估计的系数也会出现偏误。例如,男性推迟结婚,直到不可观测生产力因素导致更高的工资水平才结婚,那么,固定效应模型所估计的婚姻溢价系数则将会出现向上偏误。上述两种类型的偏误方向相反,因此,依赖固定效应模型的学者有可能会根据某一个样本报告发现“选择效应”的证据,而根据另一个样,本报告发现拒绝“选择效应”的证据 ①6 。(2)测量误差可能会对固定效应模型影响更大。Angrist and Pischke(2009)指出相比于用水平值进行回归,固定效应估计量由于使用了每个个体的组内离差信息,从而导致测量误差造成的偏误会更加严重。
同卵双胞胎数据一阶差分回归的识别问题同样有两个:一是不可观测变量的影响。虽然同卵双胞胎数据一阶差分之后回归能消除已婚和未婚双胞胎之间不随时间变化的不可观测变量,以及一部分随时间变化的不可观测的变量,如“遗传禀赋”和“家庭背景”。但一阶差分无法消除双胞胎之间后天形成(习得或养成)的彼此不同的不可观测因素。而这些不可观测变量仍有可能影响同卵双胞胎在婚姻和工资上的差异,因此,同卵双胞胎的一阶差分估计量对婚姻溢价的估计可能会出现向上偏误。二是测量误差,值得一提的是,Antonovics and Town(2004)使用工具变量法克服测量误差,他们说:“我们在估计婚姻溢价系数时,利用每一个双胞胎汇报另一个双胞胎教育年限作为其婚姻状况的工具变量,其实证结果与没有使用工具变量的实证结果非常相似。”当然,这并不能排除我们对利用双胞胎数据的一阶差分估计可能会产生向上偏误的怀疑。
基于上述分析,前期研究在识别方法上存在较为严重的问题,因而,本文试图从两个方面做出边际贡献:一是在识别方法上,从一个全新的视角来识别男性婚姻溢价的形成机制。二是从中国的国情出发,对生产力效应的具体机制进行进一步研究,提出家庭内部分工理论、男性婚后的责任感、妻子的“相夫效应”都有可能导致男性的婚姻溢价,并分别检验这三种可能性成立与否。
从内容上看,本文将研究两个方面的问题。首先,中国的男性是否同西方国家一样也存在婚姻工资溢价。其次,中国的男性婚姻溢价是否会由于文化传统和社会经济制度的不同,导致婚姻溢价的形成机制与西方国家不同。对此,我们将检验以下几个具体问题:(1)由于中国文化的家庭本位观念不同于西方文化的个人本位观念,因此,如果中国男性存在婚姻溢价的话,那么,逻辑上,中国文化中的家庭观念和妻子的“相夫教子”传统可能会通过“相夫效应”来影响男性婚姻溢价;(2)计划生育政策导致的家庭少子化和中国工薪阶层女性的劳动参与率显著高于国外等原因是否会制约家庭分工理论对男性生产率的解释能力;(3)婚姻提高男性的生产率是否因为男性在结婚以后的家庭责任感增强,从而导致其婚姻的工资溢价;(4)控制可观察因素之后,女性是否观察到男性不可观测的生产力,选择其中优秀的男性作为配偶,从而导致男性婚姻溢价。
本文的实证结果表明:我国男性存在婚姻溢价。在控制了相关特征变量之后,我国男性工资婚姻溢价约为6.8%。究其原因,本文发现我国男性的婚姻溢价可用与妻子的“相夫效应”有关的特征变量来解释,但无法用男性家务劳动时间、男性婚后的“责任感”和妻子的“选择效应”来解释,因此,本文提供的证据表明中国男性婚姻溢价的形成机制是妻子的“相夫效应”。
实证模型与识别方法
本部分,我们将在Mincer(1974)工资决定方程的基础上建立实证模型来检验以下五个问题:(1)男性婚姻溢价存在吗?(2)男性婚姻溢价能够由“家庭分工理论”解释吗?(3)男性婚姻溢价能够由男性婚后“责任感”增强解释吗?(4)男性婚姻溢价能够由妻子的“相夫效应”解释吗?(5)男性婚姻溢价能够由妻子的“选择效应”解释吗?具体模型设置如下:
(一)男性婚姻溢价的识别方程
对于问题(1),本文假设男性的工资是由方程(1)决定的:
lnM_wage=α+βMartial+γX1+ε,(1)
其中,lnM_wage是男性工资的对数,Martial是男性的婚姻状况虚拟变量,X1是男性的特征变量,包括受教育程度、工作经验年数、工作经验年数的平方、工作单位性质、工作单位规模、年份哑变量以及省份哑变量等。α是常数项,ε是误差项。系数β是婚姻带给男性工资的溢价。如果回归系数β为正且显著,则说明存在男性婚姻溢价。
(二)“家庭分工理论”的检验方法
对于问题(2),本文使用“中介作用”模型来验证“家庭分工理论”。所谓的中介作用是指自变量通过中介变量来影响因变量的过程(Baron and Ken-ny,1986;MacKinnonet al.,2002)。“家庭分工理论”认为婚姻通过减少男性的家务劳动时间提高了男性的生产率,这说明家务劳动时间是中介变量。因而,本文在模型中引入家庭劳动时间,通过检验家庭劳动时间的“中介作用”,从而检验“家庭分工理论”是否可以解释男性婚姻溢价。
按照Baron and Kenny(1986)提出的“中介作用”检验模型,我们通过回归以下三个方程来判断是否存在“中介作用”。
上述方程中,X是自变量,M是中介变量,Y是因变量,φ表示截距,ε表示模型的误差项,θ1、θ2、θ3、θ4表示回归系数。若上述方程中的回归系数同时满足下列三个条件,则可以认为中介作用是存在的:(1)若方程2中的回归系数θ1显著,则可表明自变量(X)与因变量(Y)之间存在线性关系;(2)若方程3中的回归系数θ2显著,则可表明自变量(X)与中介变量(M)之间存在线性关系;(3)若方程4中的θ4显著,且方程4中的回归系数θ3与方程2中的θ1相比,数值显著变小,则意味着中介变量(M)有助于预测因变量(Y)。
如果θ2或者θ4不显著(或者两者都不显著),那么说明X与Y之间的影响并不是通过M这一中介来实现的;如果方程(2)、(3)、(4)中的回归系数满足上述三个条件,则可至少说明存在“部分的”中介作用,即X对Y的影响部分是直接的,部分是间接通过M这一中介实现的;如果上述三个条件都得到满足,但θ3不显著,则说明X与Y之间的关系存在一种“完美的”或“完全的”中介作用,即X对Y的影响全部是通过M这一中介间接实现的。
对中介效应的检验,Sobel(1982)提出的方法是检验经过中介变量的路径上的回归系数的乘积是否显著,即检验z=θ2θ4/θ22s2θ4+θ24s2θ槡2是否显著,其中,sθ2是θ2的标准误;sθ4是θ4的标准误。系数乘积项检验法的原假设为H0:θ2θ4=0,即“不存在中介效应”,若拒绝原假设,则中介效应显著。
(三)男性婚后责任感的识别方法
对于问题(3),本文在方程(1)中引入男性责任感特征变量来验证男性婚后责任感是否可以解释其婚姻工资溢价,得到方程(5)
lnM_wage=α+βMartial+γR+γX1+ε,(5)
其中,R是男性婚后家庭责任感,其他变量的定义同方程(1)一致。
男性家庭责任感是一个不可观测的变量,本文使用代理变量表征,由此得到遗漏变量问题的植入解。由于(1)家庭人口规模越大,男性婚后家庭责任的压力会越大;(2)男性婚后家庭责任感越大,男性的工作时间越长。因此,本文分别使用家庭人口规模和男性每周工作的小时数作为男性的家庭责任感代理变量。
如果方程(5)中的男性家庭责任感估计系数显著为正,同时,男性婚姻工资溢价的估计系数比方程(1)的系数小或者不显著,那么,我们就证明了男性婚后家庭责任感可以解释男性婚姻溢价。
逻辑上,家庭人口规模与男性每小时工资收入存在双向的因果关系,即方程(5)中的家庭人口规模变量为内生变量。针对这一问题,本文将采用工具变量法解决。具体检验过程,我们将在实证过程中进行讨论。
(四)“相夫效应”和“选择效应”的识别方法
我们在方程(1)中引入妻子的特征变量来识别男性婚姻溢价是否可由妻子的“相夫效应”或“选择效应”来解释,得到方程(6)
lnM_wage=α+βMartial+γX1+δX2+ε,(6)
其中,X2是妻子的特征变量,其他变量的定义同方程(1)一致。
妻子的“相夫”能力在统计数据上是不可观测的,我们先验地认为女性的受教育年限和收入水平与其“相夫”能力相关,因此,使用它们作为妻子“相夫效应”的代理变量。但是,内生性问题也由此产生,因为妻子的受教育年限和收入水平与她在婚姻市场上的地位相关,这使得我们很难区分妻子受教育程度或收入水平与其丈夫的婚姻溢价之间的正相关是妻子的“相夫效应”还是“选择效应”导致的。对此,我们引入女性的身高变量来解决上述内生性问题,我们认为女性的身材过于矮小不会影响她的“相夫效应”,但是会制约她在婚姻市场上的“选择效应”,即身材过于矮小(例如低于150厘米)的女性在婚姻市场上的竞争力不如身高正常的女性。因此,我们通过设置妻子身材矮小的虚拟变量,对饱和模型(saturated model)进行回归。具体识别过程,我们将在实证结果中详细讨论。
(五)干预效应模型对婚姻溢价的识别方法
所谓“选择效应”是指一个男性是否处于婚姻状态不是一个随机抽样的结果,即男性的婚姻状态变量为虚拟内生变量。为了解决非随机抽样导致的选择性偏误,我们使用Maddala(1983)提出的干预效应模型(treatment effectmodel,TE)对虚拟内生变量建模。Chun and Lee(2001)最早使用干预效应模型对男性婚姻溢价问题进行研究,本文借鉴他们的工作,利用干预效应模型对内生虚拟变量Martial建模,矫正回归方程中的选择性偏差,并使用chi统计量对男性婚姻状态是否存在选择进行判断。具体模型设置如下:
回归方程:lnM_wage=α+βMartial+γX1+ε,(7)
选择方程:Martial*=+ηZ+μ,(8)
其中,方程(7)中各变量与方程(1)一致,而在方程(8)中,被解释变量Martial*是一个非观测变量,刻画了婚姻状况虚拟变量Martial的形成,满足:Martial*>0时,Martial=1;否则,Martial=0。Z是影响婚姻状况的一组变量,包括年龄、年龄的平方、受教育程度、工作单位性质、工作单位规模、年份哑变量以及省份哑变量等。ε和μ服从二元正态分布,且均值为0、协方差矩阵为σε(ρρ)1。ρ是刻画回归方程和选择方程误差项相关性的相关系数。检验方程(7)是否存在样本选择偏差,可以使用似然比检验来检验原假设“H0:ρ=0”,若似然比检验拒绝原假设,则表明模型存在样本偏差,否则,则表明模型不存在样本模型偏差。此外,也有经济学家使用反米尔斯比率(λ)函数来判定是否存在样本选择偏差,其中λ=σερ,σε是回归方程误差项ε的方差,ρ是回归方程和选择方程误差项的相关系数。
使用这一方法识别“选择效应”的风险在于干预效应模型对模型“误设”比较敏感。按《Stata参考手册》(Statacorp,2013)的告诫,“选择方程严重依赖被正确设定的模型,比普通回归更加依赖得多”,由于没有足够的把握证明选择方程不存在遗漏变量问题,因此,本文仅将干预效应模型的结果作为稳健性检验。
数据来源与变量说明
(一)数据来源
本文的数据来自美国北卡罗来纳大学人口中心和中国疾病控制中心联合进行的国际合作项目———中国健康与营养调查(China Health and NutritionSurvey,CHNS)。调查始于1989年,分别于1991年、1993年、1997年、2000年、2004年、2006年及2009年进行了8次,调查内容包括居民人口学特征、经济社会活动等方面,该调查采用了多阶段分层随机整群抽样的方法,覆盖了我国东、中和西部8—9个省份,除省会城市和较低收入的城市之外,该调查也在每个省份依据收入分层(高、中、低)和一定的权重随机抽取4个县,再在每个县中抽取县城镇和按收入分层抽取3个村落,每个村20户,这些城市内的城区和郊区均是随机选取的。由此可见,CHNS数据具有分层随机抽样、大样本等优良性质,非常适用于对我国男性婚姻溢价的研究。
本文选取1989年、1991年、1993年、1997年、2000年、2004年、2006年和2009年9个省份的16—60岁的城市男性作为研究样本,此外,本文剔除受访者的特征变量如纯工资收入、工作时间、工作单位性质、工作单位规模、受教育程度等变量数据缺失或记录为“不知道”等的样本,最终得到8976个观察值的基准样本。
(二)变量说明
1.男性的工资收入
本文将男性的工资指标定义为CHNS收集的受访者主要收入信息中的“去年一般每月的工资收入(元)”,为了便于比较,本文用消费者价格指数(CPI)将每一年的收入换算为1989年不变价格衡量的工资收入。为了检验婚姻对生产率的影响,消除工作时间的差异,本文按照Ginther and Zavordny(2001)的建议,依据平均每周工作时间和周数把月工资收入换算成小时工资,即小时工资收入=月工资收入/(平均每周工作的天数×每天工作的小时数×4)。
2.婚姻状况变量
本文将男性婚姻状况设置为虚拟变量,若受访者的婚姻状况为在婚状态,则设置为1,否则为0。
3.家务时间
以受访者每天做家务的小时数来估算,具体的家务工作包括:为家庭购买食品、为家人做饭、洗熨衣服、打扫房间等。
4.其他控制变量
受教育年限:由于CHNS数据库仅有受访者的受教育程度,因此本文按照我国的教育体制将其转化为相应的受教育年限。
工作经验:用受访者年龄-受教育年限-6来表示。
工作单位性质:设置哑变量,若为国有企业(包括政府机关、国有事业单位、研究所以及国有企业),则设置为1,否则为0;若为小集体(如乡镇所属),则设置为1,否则为0;若为大集体(如县、市、省所属),则设置为1,否则为0;以除这三类性质之外的其他工作单位性质作为省略变量。①
工作单位规模:设置哑变量,以受访者的工作单位人数小于20人作为省略变量;若该样本的工作单位人数介于20—100人,则设置为1,否则为0;若该样本的工作单位人数大于100人,则设置为1,否则为0。
表1为男性相关特征变量的描述性统计,其中第(1)列为全样本信息,第(2)、(3)列分别为处于“在婚状态”和“非在婚状态”下的男性信息。在全部8 976个男性样本中,有1 587个,即17.7%的男性处于“非在婚状态”。
男性的婚姻溢价存在吗
通过对回归方程(1)的估计,本文估计了男性的婚姻状况对其工资收入的影响。表2第(1)、(2)列的回归结果表明,在同等条件下,处于“在婚状况”下的男性工资收入要比“非在婚状况”下的男性高。其中,第(1)列中的回归仅包含“婚姻状况”这个虚拟变量,该变量的系数在1%的水平上显著,其估计值为0.343,这意味着在不考虑其他因素的情况下,在婚男性的平均工资比非在婚男性的要高出34.3%;第(2)列的实证结果显示,在控制了工作经验、工作经验的平方、受教育年限、工作单位性质、工作单位规模、年份虚拟变量和省份虚拟变量等变量后,“婚姻状况”虚拟变量的系数在1%的水平上仍显著,其估计值为0.068。这意味着在控制了其他变量的情况下,相对于“非在婚状态”的男性,处于“在婚状态”下的男性工资溢价为6.8%,这个婚姻溢价数值在Schoeni(1990)测算的婚姻溢价范围内。

关于工资的其他基本影响因素(工作经验、受教育年限、工作单位性质和工作单位规模)的研究结果与以往文献(尹志超和甘犁,2009 ①10 ;卿石松和郑加梅,2013 ②11 )的结论相似。工作经验与其工资待遇是呈倒“U”形曲线关系;受教育年限越长,工资待遇越高,教育回报率为2.4%左右;相对于除国有、小集体和大集体以外的工作单位性质,在大集体单位工作的男性,每小时工资收入在1%水平上显著地少,其估计值为0.113;而在控制了其他变量的基础上,相比于在规模为20人以下的工作单位工作,在规模介于20—100人或100人以上的工作单位工作的男性每小时工资收入要显著地高,约高出3.9%。
为什么存在男性婚姻溢价
(一)“家庭分工理论”可以解释男性婚姻溢价吗
1.代理变量的选择及定义
本文用男性家务时间作为检验“家庭分工理论”的核心变量,按Becker(1975)等文献所述,婚姻通过减少男性家务劳动时间,使其专注于劳动市场的人力资本投资,从而提高了生产率。如前所述,男性家务时间是婚姻和婚姻溢价的中介变量,因此,本文使用中介作用模型来检验“家庭分工理论”是否可以解释男性婚姻溢价。
2.实证结果与分析
具体实证结果如表2第(2)—(5)列所示。由表2第(3)列的回归结果,我们发现婚姻状况对男性的家务劳动时间呈不显著的负向影响,按Baron andKenny(1986)的中介作用模型,这已经表明家庭分工理论不能解释男性婚姻溢价。第(4)列的回归结果表明,男性的家务时间对其工资收入在1%水平上呈显著的负向影响,其估计值为-0.013,即若男性每天能少1小时做家务时间,则其每小时工资能增加1.3%。当然,反向因果关系也能成立,高工资的男性,其做家务的时间会更少,只是这一内生性问题并不影响我们的结论。第(5)列的实证结果表明,在收入婚姻回归方程中加入家务时间后,家务时间对男性工资收入在1%水平上呈显著的负向影响,其估计值为-0.013,与第(4)列对应的估计系数相同,而婚姻状况对男性工资收入仍是在1%水平上显著影响,其估计值为0.067,与没有引入家务时间的婚姻溢价估计值相近。根据Sobel(1982)的Z检验,Z=0.74所对应的单侧概率为P=0.23 ①12 ,无法拒绝原假设“不存在中介效应”。这说明婚姻状况对男性工资收入的影响并不是通过男性的家务劳动时间来实现的。由此,我们可以得出“家庭分工理论”并不能解释男性婚姻溢价的结论。
这一结论与国外研究“家庭内部分工理论”的文献结论不同。Herschand Stratton(2000)等文献报告在其他条件相同的情况下,已婚男性花费在家务上的时间要比单身男性少。而我们发现中国已婚男性花在家务的时间数是多于未婚男性,这可能是我们的发现与国外研究“家庭内部分工理论”的文献结论不同的原因。
(二)“婚后责任感”可以解释男性的婚姻溢价吗
1.代理变量的选择及定义
在排除了“家庭分工理论”之后,我们关注男性婚后责任感是否可以解释男性婚姻溢价。逻辑上,男性婚后责任感与其工资溢价是呈正向的相关关系,即男性在结婚之后,其责任感会增强,投入的工作时间和精力会增加,从而导致婚姻工资溢价。②13由于男性婚后责任感为不可观测的抽象概念,因此,本文基于工作时间与家庭责任感正相关和家庭规模与家庭压力正相关的先验判断,分别选择男性每周工作的小时数和家庭人口规模作为男性“婚后责任感”的代理变量。
考虑到家庭人口规模可能是内生的,本文引入“省级GDP”和“父亲是否住在家里”作为家庭人口规模的工具变量(IV)。 ①14下面从工具变量的外生性和相关性考察这两个变量是否为合适的IV:(1)在控制时间固定效应的条件下,作为宏观变量的省级GDP与影响个体工资的不可观测因素无关,同时,按Becker et.al(1990)建立的理论模型和Liand Zhang(2007)对出生率与经济增长的关系研究,各省级GDP与出生率有较强的相关性,因此,省级GDP是家庭规模的一个合格工具变量。(2)在控制其他因素的条件下,“父亲是否住在家里”也与干扰项无关,同时与家庭人口规模密切有关,因此,本文把它作为第二个工具变量。当然,上述对IV的外生性和IV的相关性的推理是否客观,我们需要通过过度识别检验和弱工具变量检验来考察。
在变量的定义上,本文将男性每周工作的小时数定义为男性每周工作的天数×每天工作的小时数;用消费者价格指数(CPI)将每一年各省级GDP换算为1989年不变价格衡量的各省级GDP;将“父亲是否住在家里”变量设置为虚拟变量,若父亲住在家里,则设置为1,否则为0。
2.回归方程的设计
表3第(1)—(3)列是以男性每周工作的小时数作为男性婚后责任感的代理变量,运用OLS估计的结果。其中,第(1)列为在控制了其他变量的情况下,研究男性的婚姻状况对其每周工作的小时数的影响;第(2)列为在控制了其他控制变量的基础上,研究男性每周工作的小时数对其每小时工资对数的影响;第(3)列则在第(2)列的基础上,将婚姻状况变量纳入模型中。第(4)—(6)列则使用男性家庭人口规模作为男性婚后责任感的代理变量,其中,第(4)列为在控制其他控制变量的情况下,运用OLS模型研究男性的婚姻状况与其家庭人口规模的关系;第(5)列在控制了其他控制变量的情况下,运用OLS模型研究男性家庭人口规模与其每小时工资对数的关系;第(6)列为2SLS估计,在控制其他控制变量的情况下,利用“各省级GDP”和“父亲是否住在家里”作为家庭人口规模的工具变量,研究男性家庭人口规模对其每小时工资对数的影响。
3.实证结果与分析
根据表3,我们发现男性婚后责任感无法解释其婚姻工资溢价。从第(1)列可以看出,男性的婚姻状况对其每周工作的小时数呈不显著的正向影响,这说明男性是否为在婚状况在统计意义上对其每周工作时间没有影响。第(2)列和第(3)列表明,在控制了其他变量的情况下,男性每周工作的小时数对工资在1%水平上呈显著的负向关系。这可能是反向因果关系导致的,即低工资的男性每周工作的小时数更长。遗憾的是,我们找不到男性每周工作的小时数变量的工具变量,因此,我们将更为依赖家庭人口规模对男性工资的影响。
第(4)列结果表明,男性的婚姻状况与其家庭人口规模呈显著的正向关系;第(5)列表明在控制了其他变量的情况下,男性家庭人口规模在5%的显著性水平上负向影响工资。第(6)列的2SLS估计表明,在控制了其他变量的情况下,男性家庭人口规模对其每小时工资对数呈不显著影响。另需说明的是,2SLS估计的第一阶段回归结果符合预期 ①15 ,工具变量过度识别检验的P值为0.201,无法拒绝原假设“所有工具变量均外生”。弱工具变量检验的F统计量为555.956(远大于10),说明工具变量不存在弱工具变量问题。
综上,我们没有发现男性的婚后责任感导致男性婚姻溢价的证据。
(三)“相夫效应”或“选择效应”可以解释男性的婚姻溢价吗
1.代理变量的选择及定义
在排除“家庭分工理论”和“婚后责任感”导致婚姻溢价之后,我们关注妻子的“相夫效应”和“选择效应”能否解释男性婚姻溢价。本文选择妻子的受教育程度和收入水平作为其“相夫效应”的代理变量,并假设,妻子的受教育程度越高,其“相夫”能力越大;妻子的收入水平越高,其“相夫”能力越大。
遗憾的是,根据方程(6),我们无法区分出男性的婚姻溢价到底是妻子的“选择效应”还是“相夫效应”导致的。因为自身条件优秀的女性在婚姻市场上有更多的选择机会,从而导致她更容易选择优秀的男性作为配偶,而条件差的女性则很难选择优秀的男性作为配偶,因此,运用妻子的受教育程度或收入只能同时验证妻子的“相夫效应”或“选择效应”是否可以解释男性的婚姻溢价,而无法区分这两种效应。
2.回归方程的设计
在表4第(1)、(2)列中,本文以处于“非在婚状态”下的男性作为基准组,若男性处于“在婚状态”,且其妻子的受教育程度为初中及以下,则设置为1,否则为0;若男性处于“在婚状态”,且其妻子的受教育程度为高中或中专,则设置为1,否则为0;若男性处于“在婚状态”,且其妻子的受教育程度为大专及以上,则设置为1,否则为0;其中,第(1)列不包括控制变量,而第(2)列包括控制变量,其控制变量和表2第(2)列相同。
在第(3)、(4)列中,本文以处于“非在婚状态”下的男性作为基准组,若男性处于“在婚状态”,且其妻子的工资收入位于当年所处省份的前30%(视为高收入),则设置为1,否则为0;若男性处于“在婚状态”,且其妻子的工资收入是位于当年所处省份的倒数30%(视为低收入),则设置为1,否则为0;若男性处于“在婚状态”,且其妻子的工资收入是位于当年所处省份的30%-70%(视为中等收入),则设置为1,否则为0;其中,第(3)列不包括控制变量,而第(4)列包括控制变量,其控制变量和表2第(2)列相同。在第(5)、(6)列中,为了体现实证结果的“稳健性”,本文将划分妻子工资收入的高中低标准以当年所处省份的女性工资收入作为划分基准。其核心解释变量与控制变量和第(3)、(4)列相同。
3.实证结果与分析
基于表4的回归结果,我们发现妻子受教育程度和妻子的收入水平与其丈夫的工资成正相关关系。第(1)、(2)列的回归模型是以妻子的受教育程度作为核心解释变量,实证结果发现,不管是否控制男性的特征变量,妻子的受教育程度越高,丈夫的工资收入越高。其中,在控制了男性的其他特征变量的情况下,处于“在婚状态”,且妻子受教育程度为初中及以下的男性的工资收入要比“非在婚状态”的男性在10%水平上显著高5.3% ①16 ;处于“在婚状态”,且其妻子的受教育程度为高中或中专的男性的工资收入要比“非在婚状态”的男性在1%水平上显著高8.8%;处于“在婚状态”,且其妻子的受教育程度为大专及以上的男性工资收入要比“非在婚状态”的男性在1%水平上显著高22.3%;
第(3)列表明,在不控制男性的其他特征变量的情况下,处于“在婚状态”下的男性,无论其妻子的收入水平为低收入、中等收入还是高收入,其工资收入均比“非在婚状态”下的男性显著地高,并且妻子的收入越高,其丈夫工资收入越高。第(4)列表明,在控制了男性的其他特征变量之后,处于“在婚状态”,且妻子的收入属于低收入的男性工资收入比“非在婚状态”的男性在1%水平上显著低10.8%;处于“在婚状态”,且其妻子的收入属于中等收入的男性工资收入比“非在婚状态”的男性在1%水平上显著高13.9%;处于“在婚状态”下,且其妻子的收入属于高收入的男性工资收入比“非在婚状态”的男性在1%水平上显著高49.2%;第(5)、(6)列与第(3)、(4)列的不同之处在于对妻子收入高中低定义的标准不同,回归结果除了第(5)列中妻子的收入(低收入)变量系数变得不显著之外,其他的与第(3)、(4)列的回归结果基本一致。
综合表4的实证结果,我们发现,男性婚姻溢价和妻子的受教育程度、妻子的收入水平呈正相关关系,但是,我们还无法区分男性婚姻溢价的形成机制具体是妻子的“相夫效应”还是“选择效应”。
(四)到底是“相夫效应”还是“选择效应”
1.对“选择效应”使用代理变量
由前面的研究结果表明,男性婚姻溢价与妻子的受教育程度和收入水平之间存在正相关。但是由于存在内生性问题,我们无法区分出男性婚姻溢价是由于妻子的“相夫效应”还是“选择效应”导致的。本节我们使用“在婚状态”的男性样本,引入妻子的外貌特征变量作为“选择效应”的代理变量来解决上述问题。
我们认为女性的外貌与其“相夫效应”无关,但与其“选择效应”高度相关。按“郎才女貌”的说法,外表漂亮的女性在婚姻市场上有更大的机会选择优秀的男性作为丈夫,而外表不漂亮的女性则少有此机会。遗憾的是,微观问卷无法获得女性外貌的数据,幸运的是CHNS提供了女性身高信息。我们假设身材过于矮小(例如低于150厘米)的女性在婚姻市场上的竞争力不如身高正常的女性,即妻子的身高矮小会负向影响其“选择效应”,但不影响其“相夫效应”。这样,我们便可使用妻子的身高(低于150厘米)、妻子的受教育程度及其交互项,或者妻子的身高(低于150厘米)、妻子的收入水平及其交互项这些变量的符号和显著性来判断男性的婚姻溢价能否由妻子的“选择效应”解释。我们的判断方法是在控制其他变量之后,若“妻子身材过于矮小的男性的工资显著地低于妻子身高正常的男性工资”,则说明男性的婚姻溢价能由妻子的“选择效应”来解释,否则,男性的婚姻溢价无法由妻子的“选择效应”来解释。
2.回归方程的设计
表5第(1)、(2)列是以妻子身高不低于150厘米的男性作为基准组,即将男性的妻子的身高设置为虚拟变量:若男性的妻子的身高低于150厘米,则设置为1,否则为0。 ①18 以此来检验妻子的“选择效应”是否存在。
第(3)、(4)列是以妻子的身高不低于150厘米,且妻子受教育程度为高中或中专的男性作为基准组,并分别用妻子的受教育程度、妻子的身高及其交叉项变量作为检验男性的婚姻溢价是由妻子的“选择效应”还是“相夫效应”导致的核心变量。其中,第(3)列中的变量包括妻子的身高虚拟变量(低于150厘米)、妻子的受教育程度哑变量以及其他男性控制变量;第(4)列是饱和模型,它在第(3)列的基础上加入妻子的身高与其受教育程度的交叉项变量。
第(5)、(6)列是以妻子的身高不低于150厘米,且妻子收入水平为中等收入的男性作为基准组,并分别用妻子的收入水平、妻子的身高及其交叉项变量作为检验男性的婚姻溢价是由妻子的“选择效应”还是“相夫效应”导致的核心变量。其中,第(6)列中的变量包括妻子的身高虚拟变量(低于150厘米)、妻子的收入哑变量以及其他男性控制变量;第(7)列是饱和模型,它在第(6)列的基础上加入妻子的身高与其收入的交叉项变量。 
3.实证结果与分析
表5第(1)列显示,妻子身高低于150厘米的男性的工资比基准组(妻子身高不低于150厘米的男性)工资平均低14.5%,而且在5%水平上显著。这符合预期———女性身材过于矮小会影响其在婚姻市场选择配偶的范围。第(2)列显示,在控制男性特征变量的情况下,妻子身高低于150厘米的男性的平均工资比妻子身高不低于150厘米的男性的平均工资低1.2%,不过它在统计意义上表现为不显著(伴随概率为0.789)。
综合第(1)列和第(2)列的结果,我们认为女性身高过于矮小会影响其在婚姻市场上的竞争力。但是,“选择效应”没有发生在不可观测的变量上,只发生在可观测的男性特征变量上,从而,在控制了可观测的男性特征变量之后,“选择效应”消失了。这说明,“选择效应”对我们所关注的男性工资婚姻溢价形成机制问题没有解释力。据此,我们可以认为,在婚姻与男性婚姻溢价的关系中,婚姻是因,婚姻溢价是果。在排除婚后家庭内部分工、婚后男性的家庭责任感导致男性婚姻溢价之后,我们怀疑是妻子的“相夫作用”导致了男性的婚姻溢价。下面对此进一步引入妻子受教育程度和妻子收入水平作为妻子“相夫”能力变量,并引入这两者与妻子身高的交互项来检验是“相夫作用”还是“选择效应”导致的男性婚姻溢价。
第(3)列和第(4)列的实证结果表明,在控制其他特征变量的情况下,妻子的受教育程度为大专及以上的男性的工资比基准组(妻子的受教育程度为高中或中专的男性)的工资在1%水平上要显著高出16.2%左右;妻子受教育程度为初中及以下、妻子的身高以及妻子的受教育程度与身高的交叉项变量前的系数均为不显著,即妻子的身材是否过于矮小不会影响其丈夫工资水平。
第(5)列和第(6)列中妻子工资收入的高中低划分标准以当年所处省份的受访者全样本作为划分对象,结果表明,在控制了其他特征变量的情况下,妻子的收入为低收入的男性工资比基准组(妻子的收入为中等收入的男性)的工资在1%水平上显著低23.6%左右;妻子的收入为高收入的男性的工资比基准组(妻子的收入为中等收入的男性)的工资在1%水平上显著高35.6%左右,妻子的身高以及妻子的收入与身高的交叉项变量前的系数均为不显著,即在同一收入水平的情况下,妻子的身高不会显著地影响其丈夫工资水平。
综上,我们发现:(1)当不控制男性特征变量时,女性身材过于矮小会影响其在婚姻市场上的竞争力,其配偶的平均工资显著的低于身高正常的女性的配偶;(2)在控制了男性特征变量之后,妻子的身材过于矮小不再影响其丈夫的工资水平;(3)在控制了男性特征变量之后,妻子的受教育程度和妻子收入水平正向影响丈夫的工资水平,且这一效应不受妻子的身材是否过于矮小的影响。发现(1)说明妻子的“选择效应”存在,但该“选择效应”是基于可观测的男性特征变量。我们关注的问题是,在控制了可观测的男性特征变量之后,为什么已婚男性比未婚男性工资水平高。发现(2)表明不是女性选择了统计上不可观测生产力更高的男性结婚,导致已婚男性比未婚男性工资高。因此“选择效应”并不能解释男性的婚姻溢价。发现(3)说明妻子的“相夫能力”正向影响男性的工资水平,且不受妻子的身材是否过于矮小的影响。这一证据支持了我们的判断,妻子身高异常只影响她的“选择效应”,不影响她的“相夫效应”。上述发现的共同结论是,妻子的“相夫效应”而不是“选择效应”导致了男性婚姻溢价。
(五)稳健性检验
1.干预效应模型的估计结果
表6给出了婚姻与工资的干预效应估计结果,本文同时运用两步法估计(Two-step)和最大似然法(MLE)来估计模型 ①20 。由表6可知,无论是两步法估计,还是最大似然法估计,我们均无法拒绝回归方程与选择方程残差项不相关的原假设,具体表现为两步法估计的反米尔斯比λ和最大似然法估计的ρ均表现为不显著,表明婚姻在工资方程中不是虚拟内生变量(dummy endoge-nous variable),婚姻与影响工资的不可观测因素无关。这一结论与我们在表5中发现婚姻溢价不能由选择效应解释是一致的。
2.婚姻持续时间对男性工资收入的影响
本节研究婚姻持续时间对男性工资收入的影响,并以此作为上一节结论“男性的婚姻溢价不能由‘选择效应’解释,而应由妻子的‘相夫效应’解释”的稳健性检验。我们将婚姻持续时间划分为四个阶段,即0—3年、4—10年、11—20年以及大于20年,并设置为哑变量,以处于“非在婚状态”下的男性作为基准组。表7第(1)列为研究婚姻持续时间对男性工资收入的影响。第(2)—(5)列是依据婚姻持续时间划分的四个子样本的回归结果。
表7表明:不管是全样本还是子样本,与处于“非在婚状态”下的男性工资相比,婚姻持续时间为4—10年、11—20年以及大于20年的男性存在工资溢价;但是男性的婚姻持续时间为0—3年的则呈不显著影响。这一结果可以与“相夫效应”相互印证,却无法用“选择效应”来解释。因为妻子通过为丈夫提供信息、参谋决策、扩大社交网络、监督和激励丈夫努力工作来提高丈夫的生产率需要假以时日,经过一个很长的时间(三年以上)才能体现出来,而且,妻子的“相夫效应”是随婚姻持续时间的增加而逐渐增强的。而女性选择不可观测生产力更高的男性作为配偶所产生的“选择效应”则可以体现在婚姻前期。如果男性婚姻溢价能由其妻子的“选择效应”来解释,则男性婚姻持续时间0—3年的工资收入就应该显著高于“非在婚状态”男性的工资收入。因此,表7再次表明男性的婚姻溢价是由妻子的“相夫效应”而不是“选择效应”导致的。
结论
本文利用1989—2009年中国健康与营养调查数据(CHNS)研究我国男性工资婚姻溢价及其产生的原因。本文的主要发现包括:
第一,在控制了工作经验、受教育年限、工作单位性质、工作单位规模、时间效应和省份效应等特征变量的条件下,我国男性的婚姻溢价为6.8%。
第二,我国男性的婚姻溢价无法由“家庭分工理论”解释。本文运用“中介作用”模型来验证我国男性的婚姻溢价是否可由“家庭分工理论”来解释,即检验婚姻是否通过减少了男性家务时间导致了其工资水平提高。实证结果是,婚姻状况对男性的家务劳动时间呈不显著的负向影响,Sobel检验结果无法拒绝“不存在中介效应”原假设,表明婚姻没有通过减少男性家务时间提高其工资。
第三,我国男性的婚姻溢价无法由“男性婚后责任感”所解释。本文分别以男性每周工作的小时数和家庭人口规模作为男性婚后责任感的代理变量,使用OLS估计和2SLS估计发现,“男性婚后责任感”对男性工资没有显著的影响,因而,婚后责任感无法解释男性的婚姻溢价。
第四,在婚姻与男性婚姻溢价的关系中,我们发现妻子的受教育年限和收入水平显著地正向影响其丈夫的婚姻溢价。为了区分这是妻子的“相夫效应”还是妻子的“选择效应”导致的,我们引入女性身高低于150厘米的虚拟变量,发现女性身高过于矮小影响其在婚姻市场的竞争力,但在控制男性特征变量之后,主效应模型和饱和模型都表明女性身高过于矮小不影响其丈夫工资水平。这说明“选择效应”对男性工资婚姻溢价没有解释力。妻子“相夫”能力相关变量———妻子的受教育程度和妻子的收入水平显著正向影响其丈夫的工资水平,且不受妻子身高过于矮小的影响,则说明“相夫效应”可以解释男性的婚姻溢价。
第五,在稳健性检验中,我们分别估计婚姻溢价的干预效应模型和婚姻持续时间对男性工资收入的回归,结果如下:(1)干预效应模型中,反米尔斯比λ和原假设ρ=0的似然比检验均表现为不显著,表明婚姻影响工资的不可观测因素无关。这进一步支持男性婚姻溢价不能用“选择效应”来解释。(2)在婚姻持续时间对男性工资收入的回归中,发现婚姻初期(0—3年),男性婚姻溢价无异于零;对3年以上的婚姻,则婚姻持续时间越长,溢价越高。这一证据起到了两个方面的作用,一是说明女性没有选择统计上不可观测生产力更高的男性作为配偶;二是间接支持了男性婚姻溢价是妻子“相夫效应”的结果,因为妻子提供信息、参与决策、帮助丈夫扩大社交网络等“相夫”作用需要假以时日才能发挥效果,因而,婚姻持续时间越长,男性溢价越高。
我们的结论非常励志———在同等条件下,已婚男性收入更高,不是因为好男人都结婚了,而是因为结婚了,有了妻子的“相夫”,他才成为能够赚取高工资的好男人。这也印证了一句非常流行的话“一位成功男人的背后总有一位成功的女人”。
▷原标题:《好男人都结婚了吗?———探究我国男性工资婚姻溢价的形成机制》
编辑/审核:Andy

发论文,
画不好插图,怎么办?
高质量科研绘图
找【科藤学术中心】@花博士
扫下方二维码⬇⬇⬇以作备用
(扫码关注,注明“需要绘图”,否则通不过!)
继续阅读
阅读原文