论文部分内容阅读
摘要:文章利用CHNS(中国营养与健康调查)2009年的横截面7 300个微观数据,根据Probit模型和逐步回归法测度了个人的健康状况、生活质量水平、教育程度、年龄、性别以及城乡户籍的差异等因素对就业选择的影响。通过引入教育与性别、户籍的交互项分析了就业市场性别和户籍歧视问题。结果表明,户籍和性别仍然是显著影响就业选择的因素,而农村户口与教育差异的交互项对于就业影响明显,性别与户籍交互项对就业影响呈弱负相关。这证实农村居民通过提高教育程度将有助于其改善其就业环境,农村女性在就业方面困难较大,政府需要给予更多关注。
关键词:性别差异;户口;就业歧视;就业选择
一、 引言
本文探讨的就业问题,主要是为了分析就业的决定因素和就业方面性别、户口两个属性的歧视存在与否及歧视的度量。由于就业与否是一个离散的变量,构造的模型是一个二值模型:个体只有两个取值,比如y=1(就业)或y=0(不就业)。为了考察决定离散二元取值Y的决定因素,本文将选择异方差条件下的Probit模型结合逐步回归法先筛选出影响就业选择的因素,然后主要研究分析户籍和性别两个方面是否存在歧视。来做进一步实证分析。
考虑到文献中的迥异的指标,本文主要在以下几个指标方面进行设计微观的涵盖个人素养一系列特征变量;宏观的包括要素市场在择人时的考虑。个人素养的有身体健康、生活质量、教育水平;而就业市场属于要素市场,所使用的劳动力衡量指标选取年龄,性别和户籍。本文的边际贡献在于,合理设计选取一组量化的指标,并分析就业影响的因素,然后通过模型的修正,定量分析户籍、性别因素在就业方面的歧视问题,从而给出相关政策建议。
二、 指标选取、描述与模型设定
1. 指标选取与数据描述。根据经济学相关理论及相关文献综述,其影响因素主要有健康状况有关的营养状况、性别、年龄、受教育程度、以及造成劳动力分割的户籍制度等。本文基于微观数据,选取CHNS2009年横截面数据,首先考察就业的决定因素,由于调查问卷的特殊性以及问卷回答有的非本人亲自回答,故这里用这一组数据拟合,后面用逐步回归法对于改组变量回归,可遴选出合适的代理变量。
营养状况因为与收入习惯等各方面有关,黄宗智的研究证实随着收入水平的提升,粮食消费下注下降, 基本稳定在年均11公斤/人,而肉、鱼、蛋、奶的消费量逐年递增,其中城镇人口肉类由1980年的人均20公斤/年到2005年的人均32公斤/年。蛋白消费量的增长不仅仅存在于高收入人群中,同样也体现在低收入人群中。这说明收入的增加促进了蛋白摄入量。但如果直接用收入水平衡量时会存在因果倒置的可能:是否是收入高才更拥有更好的就业资源还是就业导致的更好的收入水平,无法厘清,故选取“三餐蛋白质摄入量、脂肪、卡路里、碳水化合物”等指标来做为营养水平的工具变量,这个指标和误差项中其他诸如个人能力、工作经验等可以认为是不相关的,且能体现生活质量,满足了工具变量的一般特征,具有一定的客观性和真实性,可以用来判断一个人的营养水平对就业的影响程度。教育程度衡量,数据中分为7档,信息为0-6,其中文盲半文盲=0,小学=1,中学=2,高中=3,专科=4,本科=5,硕博=6,本文延续这种划分,因为这个比直接计算的教育年限更有层级,可以度量教育的贡献度,如从高中到初中的一个跨度,可以明显通过系数变动方向判断大学教育回报率。
数据处理说明:本文的CHNS首先依据调查住户以及个人的地址进行编号,挑出一致性的个体信息;依据就业信息统计删除学生样本以及其他不确定的样本(就业=0和1之外的信息);年龄删除大于60和小于16的样本(其中有少量样本年龄15.4,不影响总体分析,不适宜筛除所有16岁的保留);性别(男性Male=0;女性Female=1);户口(城镇urban=0;乡村rural=1)。处理后有7 000来个有效的微观数据,数据描述性统计见表1。
2. 模型设定。根据上述分析考察就业市场决定因素,参照可利用的相关的指标,模型设定为:
work=?琢 ■?兹ihealthi ?茁1(health2×health2) ?茁2edu ?茁3age ?茁3gender ?茁4hukou ?滋(1)
根据上述说明,health1、health2指标代表当前城乡居民营养水平,作为收入的替代变量出现,选取三餐蛋白、脂肪的摄入量分别表示;出于对黄宗智(2010)研究的继承,本文选取蛋白质的摄入量指标作为收入的替代指标,初步设定蛋白质摄入量的提高说明城乡居民收入水平相应提高,就业情况将会改善,这一过程为单调递增过。而脂肪的摄入对于收入提高存在两次函数的关系,经济处在起飞阶段,脂肪摄入量的增加意味着收入增加,就业也会增加;而收入的进一步提高,生活品质提高脂肪摄入量会随之下降,可以认为在经济发展到一定高度,脂肪摄入量与就业呈现反比关系。
其他的指标已经根据调查的样本数据进行了定性处理,如户籍(Hukou)指标和性别(Gender)均已转化成二值信息。该模型旨在分析就业市场的决定因素,主要利用逐步回归法来分析变量对模型的贡献程度;性别差异(Gender)、户籍差异(Hukou)是常见的影响就业选择的因素,这里主要分析其对就业的影响,是否涉及歧视留待后面分析。
修正后的模型中引入教育程度和性别的交互项,其经济学含义是通过控制其他变量不变的情况下(特别以教育作为交互项的乘项来保持在教育相同的情况下),以男性为基组(男性为0,女性取值为1);而女性与男性存在不同时,则会出现不同的关于教育项的斜率,该斜率衡量了女性相同于男性在教育相同时教育回报率,藉此考察劳动力市场是否存在性别上的歧视问题,并且定量衡量这种歧视的程度。
同理,上述模型并未对就业者的城乡二元身份进行划分。根据相关文献研究(周世军等,2012),就业市场上存在户籍上的歧视。根据CHNS数据,户籍信息可以转化成定性信息,以城市为基组设为0,农村户口设为1;故引入教育与户口的交互项,可以测度在相同教育水平,和其他因素不变时,因户籍差异带来的就业歧视。
关键词:性别差异;户口;就业歧视;就业选择
一、 引言
本文探讨的就业问题,主要是为了分析就业的决定因素和就业方面性别、户口两个属性的歧视存在与否及歧视的度量。由于就业与否是一个离散的变量,构造的模型是一个二值模型:个体只有两个取值,比如y=1(就业)或y=0(不就业)。为了考察决定离散二元取值Y的决定因素,本文将选择异方差条件下的Probit模型结合逐步回归法先筛选出影响就业选择的因素,然后主要研究分析户籍和性别两个方面是否存在歧视。来做进一步实证分析。
考虑到文献中的迥异的指标,本文主要在以下几个指标方面进行设计微观的涵盖个人素养一系列特征变量;宏观的包括要素市场在择人时的考虑。个人素养的有身体健康、生活质量、教育水平;而就业市场属于要素市场,所使用的劳动力衡量指标选取年龄,性别和户籍。本文的边际贡献在于,合理设计选取一组量化的指标,并分析就业影响的因素,然后通过模型的修正,定量分析户籍、性别因素在就业方面的歧视问题,从而给出相关政策建议。
二、 指标选取、描述与模型设定
1. 指标选取与数据描述。根据经济学相关理论及相关文献综述,其影响因素主要有健康状况有关的营养状况、性别、年龄、受教育程度、以及造成劳动力分割的户籍制度等。本文基于微观数据,选取CHNS2009年横截面数据,首先考察就业的决定因素,由于调查问卷的特殊性以及问卷回答有的非本人亲自回答,故这里用这一组数据拟合,后面用逐步回归法对于改组变量回归,可遴选出合适的代理变量。
营养状况因为与收入习惯等各方面有关,黄宗智的研究证实随着收入水平的提升,粮食消费下注下降, 基本稳定在年均11公斤/人,而肉、鱼、蛋、奶的消费量逐年递增,其中城镇人口肉类由1980年的人均20公斤/年到2005年的人均32公斤/年。蛋白消费量的增长不仅仅存在于高收入人群中,同样也体现在低收入人群中。这说明收入的增加促进了蛋白摄入量。但如果直接用收入水平衡量时会存在因果倒置的可能:是否是收入高才更拥有更好的就业资源还是就业导致的更好的收入水平,无法厘清,故选取“三餐蛋白质摄入量、脂肪、卡路里、碳水化合物”等指标来做为营养水平的工具变量,这个指标和误差项中其他诸如个人能力、工作经验等可以认为是不相关的,且能体现生活质量,满足了工具变量的一般特征,具有一定的客观性和真实性,可以用来判断一个人的营养水平对就业的影响程度。教育程度衡量,数据中分为7档,信息为0-6,其中文盲半文盲=0,小学=1,中学=2,高中=3,专科=4,本科=5,硕博=6,本文延续这种划分,因为这个比直接计算的教育年限更有层级,可以度量教育的贡献度,如从高中到初中的一个跨度,可以明显通过系数变动方向判断大学教育回报率。
数据处理说明:本文的CHNS首先依据调查住户以及个人的地址进行编号,挑出一致性的个体信息;依据就业信息统计删除学生样本以及其他不确定的样本(就业=0和1之外的信息);年龄删除大于60和小于16的样本(其中有少量样本年龄15.4,不影响总体分析,不适宜筛除所有16岁的保留);性别(男性Male=0;女性Female=1);户口(城镇urban=0;乡村rural=1)。处理后有7 000来个有效的微观数据,数据描述性统计见表1。
2. 模型设定。根据上述分析考察就业市场决定因素,参照可利用的相关的指标,模型设定为:
work=?琢 ■?兹ihealthi ?茁1(health2×health2) ?茁2edu ?茁3age ?茁3gender ?茁4hukou ?滋(1)
根据上述说明,health1、health2指标代表当前城乡居民营养水平,作为收入的替代变量出现,选取三餐蛋白、脂肪的摄入量分别表示;出于对黄宗智(2010)研究的继承,本文选取蛋白质的摄入量指标作为收入的替代指标,初步设定蛋白质摄入量的提高说明城乡居民收入水平相应提高,就业情况将会改善,这一过程为单调递增过。而脂肪的摄入对于收入提高存在两次函数的关系,经济处在起飞阶段,脂肪摄入量的增加意味着收入增加,就业也会增加;而收入的进一步提高,生活品质提高脂肪摄入量会随之下降,可以认为在经济发展到一定高度,脂肪摄入量与就业呈现反比关系。
其他的指标已经根据调查的样本数据进行了定性处理,如户籍(Hukou)指标和性别(Gender)均已转化成二值信息。该模型旨在分析就业市场的决定因素,主要利用逐步回归法来分析变量对模型的贡献程度;性别差异(Gender)、户籍差异(Hukou)是常见的影响就业选择的因素,这里主要分析其对就业的影响,是否涉及歧视留待后面分析。
修正后的模型中引入教育程度和性别的交互项,其经济学含义是通过控制其他变量不变的情况下(特别以教育作为交互项的乘项来保持在教育相同的情况下),以男性为基组(男性为0,女性取值为1);而女性与男性存在不同时,则会出现不同的关于教育项的斜率,该斜率衡量了女性相同于男性在教育相同时教育回报率,藉此考察劳动力市场是否存在性别上的歧视问题,并且定量衡量这种歧视的程度。
同理,上述模型并未对就业者的城乡二元身份进行划分。根据相关文献研究(周世军等,2012),就业市场上存在户籍上的歧视。根据CHNS数据,户籍信息可以转化成定性信息,以城市为基组设为0,农村户口设为1;故引入教育与户口的交互项,可以测度在相同教育水平,和其他因素不变时,因户籍差异带来的就业歧视。