995~2002年的数据。
本文使用广东、湖北、云南3个省的数据。广东位于中国东南部,是中国最富裕的省份之一;湖北位于中国中部,处于平均水平;云南作为中国西部的典型,是个贫穷的省份。从每个省选出3个村庄代表不同的发展状况(参阅表2(略))。虽然不能说这组数据能够代表全国,但它们的确能够涵盖不同的地理——经济状况,而且比只依靠一个省份数据的研究更有代表性。
三、回归解析方法和收入函数
回归解析方法是oxaca(1973)20世纪70年代初提出的,但并没引起人们足够的重视,直到最近情况才有所改变(juhn et al.,1993),wan(2002)曾提出了关于这种技术的具体描述。有关这种技术的具体应用可参阅fields&yoo(2000),morduch&sicular (2002),heltberg&rasmus(2003),zhang&zhang(2003),wan(2004)的有关论文。
得到一个收入函数是进行回归解析的第一步。在确定中国农村的收入函数时,有关人力资本理论及生产理论必须被考虑进去。不像工资收入者,农民除了依靠出卖劳动获得收入外,土地和实物资本是他们必须依靠的。因此,农业生产都应当有土地、劳动力和资本投入。按照人力资本理论,这里也应包括技能变量例如教育、训练程度及经验(常由年龄代表)。为了和在发展问题文献中被普遍接受的做法相一致,这里采用农户的受教育水平及年龄。
即使生产投入及人力资本是相同的,考虑那些可能改变收入的其它因素也是必要的。一个因素是农户所从事的商业活动的类型。农研中心依据这些商业活动将农户分成10种不同的类型,包括种植业、林业、畜牧业、渔业、工业、建筑业、交通运输业、零售业、食品业及其他服务业,最后还有不从事任何商业活动的。这些显示了农户取得收入的主要部门。显然,要表达来自不同商业活动的收入水平的差别,设定一系列虚拟变量是很必要的。这些虚拟变量合在一起将被当作一个“行业指标”。在中国,政府经常从行政管理的角度强调粮食生产,是因为种植粮食的收益较低甚至收益为负。结果,仅仅因为一个农户种粮,另一个农户种植蔬菜或其他经济作物,两个农户的收入就会不同,因此,种植结构显得至关重要,它通常被定义为粮食面积与总的种植面积之比。最后,考虑两个具有相同数量资源的农户,其收入来源也可能不同,本研究把农户分为两类:一类领取工资,另一类未领取工资。工资收入者的数量反映了城镇化程度,将它包括在模型中能使人清楚城镇化对中国农村地区收入不平等的影响。在理想状态下,城镇化应被定义在乡镇或县及水平上,然而,在仅仅获取了农户层面数据的情况下,这样做是不可能的。
地理位置是决定收入的一个很重要的因素,因为它与诸如距离市场远近、基础设施、地域文化等一些非流动资源密切相关。数据的不可获得性使得地理变量不能直接进入方程,然而,在实物和人力资本投入及其他要素既定的条件下,应用村庄虚拟变量能够反映地理和所在地的信息。应当指出,虽然模型中使用了村庄虚拟变量,但这里也没必要使用固定效果模型(fixed—effects model),因为家庭层次上的数据将被用来估计收入函数。最后,考虑到技术进步及改革的影响,年份虚拟变量也应被考虑到函数中。
这样,收入函数所包含的变量有:因变量是指收入(个人年纯收入)和自变量。自变量如下(虚拟变量未列):①资本:人均资本存量;②土地:人均可耕地面积;③劳动力:每户劳动力数量;④工资收入者:家庭劳动力中工资收入者所占比例;⑤教育:户主的受教育年限以及受教育年限的平方;⑥培训:家庭成员中接受过职业教育的人的比例;⑦年龄:户主的年龄以及户主年龄的平方;⑧粮食:粮食播种面积占总播种面积的比例。
标准mincer模型规定了如何选择参数,收入函数的公式为:
ln(收入)=f(土地,劳动力,资本,……虚拟变量)(1)
(1)式中,f代表线性函数关系。由于收入变量是符合正态分布的,本文使用了半对数模型(shorrocks and wan,2004)。
很多技术可以用来模拟使用面板数据的模型,尽管如此,笔者发现kmenta (1986 )的迭代gls方法可以用来很好地处理本研究所使用的数据,这种方法不仅可以得到不同家庭的异离中趋势,也可以得到自相关数据。模型结果如表3(略)所示。
除了虚拟变量之外,所有的系数的正负号与预期的相同,而且绝大多数变量都在1%或5%的水平上显著。特别是对变量年龄的平方和受教育年限的平方这两个变量的负的符号的含义的理解是与标准的人力资本理论相吻合的。如所预测的粮食即,表示种植结构的变量的符号为负,且是显著的。
就收入函数而言,其他方法也可以用来解析总体收入不平等(wan,2002)。需要注意的是,就原始收入变量而言,半对数模型显示了一个非线性的收入函数,因此,shorrocks(1999)的夏普里值分解(shapley value framework of shorrocks)方法就可以被接受。一旦原始收入代入半对数模型,常数项就变成了一个常数。一旦使用了相对不平等度量,就可以忽视不平等度量或其分解。这也适合于对年度虚拟变量的处理。可以用来分析年度虚拟变量,区分不同年度的收入产生函数的变量,只是在常数项上有所不同。夏普里值包含有相当多的计算,具体可参见shorrocks(1999)。
怎么处理残差?不得不承认,很难分析残值的影响。但是,如果模型只解释了30%~40%的收入不平等总量,剩下的由残值去解释,那么,政策制定者将会被建议不要依靠分解的结果。在本研究中,对残值的处理是根据wan(2002,2004)的方法。在半对数收入函数中,残值的影响程度可以很容易地由收入不平等总量与其它解释变量影响程度之和的差得到。
四、分解结果与讨论
表4(略)显示了用不同的指标所测算的收入不平等总量。变异系数(cv2)在1999年出现了一个小幅度的下
上一页 [1] [2] [3] [4] 下一页