技术进步对我国就业与工资水平影响的实证研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

三、数据来源及初步分析

(一)数据来源

本章的主要数据来源为中国健康与营养调查数据(China Health and Nutrition Survey, CHNS)。样本期间包括了7个不连续时间:1989年、1991年、1993年、1997年、2000年、2004年、2006年。涉及就业信息的主要指标有年工资收入、周工作小时、省份、城乡、工作单位类型、工作单位规模等数据,个体信息主要指标有受教育年限、性别、所从事职业、职务、年龄、婚姻状况、是否户主等。2007年,CHNS数据中心对此前7年的调查数据进行了重新整理,发布了面板结构的数据标识,通过将个体与年度指标进行匹配,能识别出某一特定观测个体若干年来的信息变化。

根据本研究的需要,首先对数据进行了选取和整合。我们将劳动者收入相关数据(年工资收入、是否处于正常工作状态、周工作时间等数据)和劳动者个人信息数据(受教育情况、年龄、性别等)进行匹配合并。在合并的基础上我们还对数据进行初步筛选。筛选准则如下:①剔除受访时未处于正常工作状态的工作者,只选取处于正常工作状态的劳动者;②选取18~60周岁的劳动者,剔除超出这个年龄范围的年幼者和老年人;③剔除了年收入大于20万元以及小于120元的极端值。④剔除了受教育年限值缺失的样本。通过以上的数据整合和筛选,我们最后获得了来自9个省份7年间的49512个有效数据。

利用整合和筛选后的数据,我们要关注和挖掘的数据主要有两个方面:一是与劳动者收入相关的数据,二是与收入相对应的劳动力供给数据。在劳动者收入方面,我们以2009年为基期的经过CPI调整的劳动者年收入数据为依据。该项数据全面地包括了劳动者的工资、奖金和其他补贴收入的总收入,最能反映我国劳动者总体收入的变化。由于我们不仅关注总体样本收入的变化,我们还关注性别、受教育年限、工作经验等因素对收入变化的影响,所以,我们不仅要对整体样本进行分析,还要对根据性别、受教育年限、工作经验等特征进行细分的样本组的收入变化情况进行分析。我们的具体分组方法是:根据性别(男、女两组)、5个受教育程度(0~5年、6~8年、9~11年、12~15年和16年及以上)和8个工作经验(0~5年、6~10年、11~15年、16~20年、21~25年、26~35年)将总样本分成80组子样本。在如此细分的前提下,对收入情况进行具体统计。

需要特别说明的是:由于CHNS数据中未直接提供工作经验这项数据,但我们认为工作经验对劳动者收入变化很可能有着较强的影响,因此我们采取了估算的方法。我们使用CHNS中年龄和受教育年限两项数据估算出劳动者的工作经验。具体的估算方法是:如果某样本的受教育年限在12年以上(加上学前时间可知,该样本参加工作时间在18周岁以后),那么该样本的工作经验由年龄减去6年再减去受教育年限计算得到;如果某样本的受教育年限在12年及以下,那么该样本的工作经验由年龄减去18年计算得到。虽然这种计算方法可能存在误差,但能大体上反映某一样本的工作经验,与缺少该项重要变量相比,使用估算所得的变量是可以接受的。

在关注劳动者收入变化的同时,我们要分析对应的劳动供给情况。CHNS数据中为我们提供了一项是否处于正常工作状态的数据。在数据整理时,我们已经剔除受访时未处于正常工作状态的工作者,只选取了处于正常工作状态的劳动者。因此我们分别对总体和根据性别、受教育年限、工作经验细分的80个子样本进行数据统计,得出总体和各个劳动者群体的供给情况。由于CHNS中仅在部分年份对于个体劳动者的每周工作时间进行了调查,而在大多数年份缺失,所以我们很遗憾地舍弃了这项数据,对于劳动供给的统计只能统计到供给人数,而不能精确到以劳动小时数表示的劳动供给。

(二)对数据的初步分析

为了对我国收入的变化情况有一个详尽的了解,如前所述,我们根据性别(男、女两组)、5个受教育程度(0~5年、6~8年、9~11年、12~15年和16年及以上)和8个工作经验(0~5年、6~10年、11~15年、16~20年、21~25年、26~35年)将数据分为了80组,并对这80组数据进行逐年统计。然后,我们根据观察和研究的需要把其中最重要的信息反映在表2-1中。

表2-1 1989—2009年我国劳动者平均收入水平变化情况

通过对80组子数据的统计,我们获得了1989—2009年以及三个子时期(1989—1991年、1991—2000年、2000—2009年)我国劳动力供给的相对变化情况(表2-1)。表2-1中所报告的数据是根据各个时期各个组别劳动者所占当期总劳动供给比例的对数进行计算得到的。第一组数据显示,1989—2009年,我国劳动者对数平均收入(备注:为了全书统一,本书对收入变化情况采用了对数平均增长率)总体增长了147.08%,其中1989—1991年小幅下降了1.97%, 1991—2000年快速增长了68.04%, 2000—2009年增长更加迅速,达到了81.01%。这说明我国劳动者收入在1989年后,除在最初短时间出现小幅下降外,其他时间段均呈增长的状态并且增长速度越来越快。整体平均收入水平的变化从总体上概括了我国收入水平的变化情况。四大组数据就是对收入变化情况更为细致的剖析。

首先我们根据性别对样本进行分组,考察性别对收入变化的影响。数据显示,从整个时间段来看,1989—2009年男性收入增长比女性收入增长快5.5%。相对于男性和女性均达到的140%以上的工资增长率,男性相对于女性收入变化的优势并不明显。从各个时段来看,男性和女性收入变化差距最大的阶段是在1991—2000年,相差10%左右。其他时间段男性和女性收入变化差距相对于整体的增长速度都很小。当然这只是从全体男性和女性的增长速度角度来看的,我们还可以通过数据观察不同受教育程度的女性和男性的工资比值变化情况。

如图2-1所示,1989—2009年,拥有大学学历的女性与拥有大学学历的男性的工资比跟仅拥有高中学历的女性与仅拥有高中学历的男性的工资比的变化情况有很大的不同。拥有大学学历者的性别工资差距,在2000年以前处于平稳波动的状态,2000年以后拥有大学学历者的性别工资差距迅速缩小,而在2006年后,拥有大学学历的女性的平均工资超越了拥有大学学历的男性的平均工资。在同一时期内,拥有高中学历的男、女工资差异的变化情况与拥有大学学历的男、女工资差异的变化情况则恰好相反。1989—2000年,拥有高中学历的女性和男性工资比值有较大幅度的波动上升情况,2000—2009年则是平稳地小幅波动,并没有像拥有大学学历的女性与男性工资差距那样快速缩小。这说明1989—2009年,不同学历的劳动者的性别工资差距有着不同的变化幅度和趋势,拥有较高学历者的性别工资差距的缩小幅度较大。

图2-1 1989—2009年我国大学毕业和高中毕业的男、女收入比值

图2-2则更加清晰地展示了大学毕业的男性和女性的工资水平在1989—2009年的变化情况。2000年以前,大学毕业的男性和女性工资的变化速度相当,2006年以后,大学毕业的女性的收入增长速度明显地超过了大学毕业的男性。

图2-2 1989—2009年我国男性和女性大学毕业生收入变化情况

表2-1中第三组数据描述了受教育程度对收入变化的影响。我们根据CHNS提供的受教育年限指标,将样本分为0~5年、6~8年、9~11年、12~15年和16年及以上五组。数据显示,在1989—2009年整个时间段,劳动者收入的增长速度随着受教育年限的增加而加快,大学毕业的劳动者比高中毕业未完成大学的劳动者收入增长快40%以上,收入呈现出明显的教育偏向型增长。与此同时,在不同时期的教育回报率也随着时间而大幅波动。1989—1991年,大学毕业者收入增长速度比高中毕业未完成大学的劳动者快20%左右。1991—2000年,大学毕业者收入增长速度仅比高中毕业未完成大学的劳动者快3.1%,而2000—2009年又恢复至20%左右的差距。这说明大学学历溢价虽然一直在上升,但是在不同时期的增长速度有很大的不同。

图2-3显示拥有不同工作经验的大学毕业者和高中毕业者的相对工资变化情况。从图中非常容易发现,对于刚进入工作岗位的劳动者来说,大学毕业者与高中毕业者的工资差异明显小于拥有更多工作经验的劳动者。拥有更长工作经验的大学毕业者和高中毕业者的工资比值要比刚参加工作的大学毕业者与高中毕业者的比值高出0.64%左右。这说明在1989—2009年,随着劳动者工作经验的增长,受教育程度对于劳动者工资的影响力随之增长,教育的回报率随着工作经验的积累而得以更好地体现。

图2-3 0~5年工作经验和全部工作经验的大学毕业者与高中毕业者收入比变化情况

图2-4则更加清晰地展示了不同性别的大学毕业者和高中毕业者在1989—2009年的相对工资变化情况。2000年以前,大学毕业者和高中毕业者的性别差异对工资的影响不是那么明显;2000年以后,大学毕业的女性的收入增长速度明显地超过了高中毕业的女性。

图2-4 不同性别的大学毕业者与高中毕业者收入比变化情况

下面我们接着分析工作经验对劳动者收入变化的影响。数据显示,从总体时间段来看,1989—2009年,仅有0~5年工作经验的非熟练工与拥有26~35年工作经验的熟练工的工资变化速度差距不大。熟练工仅比非熟练工的工资增长快6%左右。但是具体到各个时间段内我们可以发现,1991—2000年,非熟练工的收入增长快于熟练工(非熟练工89.27%,熟练工64%),而2000—2009年的情况却相反,熟练工的收入增长快于非熟练工(非熟练工67.25%,熟练工85.74%)。这说明,在不同的时间段内,工作经验对于劳动者收入的影响不同,在2000—2009年,工作经验对劳动者收入的影响大于1991—2000年。或者说,在2000—2009年,工作经验被社会认可和需要的程度大于1991—2000年。

表2-1中第五组数据结合教育和经验的双重因素来分析男性劳动者收入变化情况。从整个时间段来看,不同受教育程度劳动者的收入变化对工作经验的增长的反应存在较大差异。从整体时间段来看,工作经验对于接受了0~5年教育和16年及以上教育的劳动者的收入影响最为突出。1989—2009年,接受了0~5年教育的劳动者之中,拥有26~35年工作经验的熟练工的收入增长比拥有0~5年工作经验的非熟练工快37.9%;接受了16年及以上教育的劳动者中,熟练工的收入增长比非熟练工快50.8%。与这两个受教育程度不同的是,对于接受了9~15年教育的劳动者来说,熟练工的收入增长比非熟练工慢。

图2-5则更清晰地反映了以上所述的变化。从图中可以看出大学毕业者和高中毕业者中,熟练工和非熟练工的工资比值的变化趋势大致相同,但是变化幅度有较大差距。如图所示,除了1989—1991年,大学毕业者的熟练工和非熟练工的工资比值都高于高中毕业者的比值。这说明在1991—2009年,工作经验对于受教育程度更高的大学毕业者收入差距的影响更为明显。

图2-5 大学毕业和高中毕业的拥有26~35年工作经验者与拥有0~5年工作经验者收入比值

图2-6从更为直接的角度比较了高收入者(对数收入的90%分位数)和低收入者(对数收入的10%分位数)工资差距在1989—2009年的变化情况。从图中可以看出,女性高收入者和低收入者的收入差距在1991—2004年越来越大,并且增长速度很快;但在2004年之后差距开始缩小,尤其是在2006—2009年大幅缩小。男性高收入者和低收入者的收入差距变化情况与女性变化趋势基本相同,除了1997年出现小幅下降以外。从整个时间段来看,男性和女性高低收入差距都存在一定幅度的加剧。这说明在1989—2009年,我国收入不平等情况加剧。

图2-6 男性和女性劳动者的90%分位对数工资与10%分位对数工资之差

高收入者和低收入者收入差距的变化是由低收入者收入增长过慢还是由高收入者收入增长过快造成的呢?为了解答这个问题,我们要分别给出高收入者和低收入者的对数收入变化情况。

如图2-7所示,男性高收入者的收入在1991—2009年平稳增长。而男性低收入者的收入在1991—1993年和1997—2004年增长较慢,在2004年后增长速度明显加快,并且超过了高收入者。图2-8中所示的女性收入变化情况与男性基本一致。女性高收入者的收入在1991—2009年平稳增长。而女性低收入者的收入在1989—2004年增长特别缓慢,在2004年后收入增长特别迅速。这是造成女性高低收入差距在1989—2009年波动幅度比男性更大的原因。从整个时间段来看,男性和女性高低收入差距都存在一定幅度的加剧,这说明在1989—2009年我国工资不平等情况加剧。

图2-7 男性劳动者的90%对数收入和10%对数收入变化情况

图2-8 女性劳动者的90%对数收入和10%对数收入变化情况

(三)mincer模型的估计结果

经过以上分析,我们从收入总体以及性别、受教育程度、工作经验等多个维度分析了劳动者收入变化情况。分析发现,性别、受教育程度、工作经验都对劳动者的收入起着一定的影响作用。但我们需要知道的是,这些因素能否解释个体收入差距的全部变化,如果不能,那么能在多大程度上解释收入差距的变化。为了检验这些因素对收入差距变化的解释力度,以及验证是否还存在其他更为重要的影响因素,我们将个体收入和性别、受教育程度、工作经验等表征个体差异的变量放入mincer模型中进行回归。如果回归结果显示这些变量仅能解释小部分的个体收入差距的变化,那么说明还存在其他重要的影响因素。

根据CHNS提供的数据,我们对各个年份分别进行回归。我们利用样本数据获得个体的对数工资、性别、受教育年限、受教育年限的二次方、工作经验和工作经验的二次方。将对数收入作为被解释变量,性别、受教育年限、受教育年限的二次方、工作经验和工作经验的二次方作为解释变量,进行10%、50%、90%的分位数回归。我们选取了1989年、2000年和2009年的回归结果展示在表2-2中。

表2-2 1989年、2000年和2009年mincer模型的10%、50%、90%的分位数回归结果

注:括号内的值为参数估计的t统计量,、、分别代表1 %、5 %、1 0 %的显著性水平,下文不再重复叙述。

首先从回归结果中各变量的显著性来看,性别、受教育程度和工作经验对我国个体劳动者收入都起着显著的影响。其次我们从总体的模型解释力的角度来看,各年份、各分位点的回归结构的R2值都不超过10%。其他研究如甘犁等(2010)在《香烟、美酒和收入》一文中虽然加入了更多的解释变量,例如地域、年龄等控制变量,但mincer回归结果的R2值仍不超过30%。这说明个体收入差距不仅受到这些表征个体差异的变量的影响,还受到其他重要因素的影响。寻找和验证影响个体收入差距的其他重要因素也是本章的目标和需要解决的问题。