基尼系数

  • 基尼系数(gini coefficient)表示在全部居民收入中,用于进行不平均分配的那部分收入占总收入的百分比。社会中每个人的收入都一样、收入分配绝对平均时,基尼系数是0;全社会的收入都集中于一个人、收入分配绝对不平均时,基尼系数是1。现实生活中,两种情况都不可能发生,基尼系数的实际数值只能介于0~1之间。一般认为,基尼系数小于0.2时,显示居民收入分配过于平均,0.2 ~ 0.3之间时较为平均,0.3 ~ 0.4之间时比较合理,0.4 ~ 0.5时差距过大,大于0.5时差距悬殊。

    基尼系数是洛伦兹曲线的数据化,并且基尼系数是根据洛伦兹曲线计算得到。根据洛伦兹曲线进行基尼系数的原理说明如下:

    上图为洛伦兹曲线,横坐标为‘累计人口百分比’,纵坐标为‘累计收入百分比’,然后按照‘累计人口百分比’和‘累计收入百分比’打点可打出一条曲线(上图中的绿色),该曲线叫‘洛伦兹曲线’,其越‘直’则表示收入分布越均匀,如果其越‘凹’则表示收入分布越不均匀。那么基尼系数 = 面积A / (面积A+面积B)。面积A+面积B为0.5,此种理解是图示法理解,当然也直接使用数学积分或者数学公式法计算。

基尼系数案例

  • 1、背景

    当前有一份905个人的收入汇总数据,其有收入区间共计20项,并且包括每个收入区间的人数数据,如下图所示:

    需要提示的是:收入区间,比如编号为1时为500~1500,此时将其中间值1000作为收入值,加权数据为60即有60个人收入值为1000。共计20个收入区间即20行数据。数据格式上此种称为加权格式,即两列数据,1列为收入值并且另外1列为权重数据。需要注意的是,数据上收入一定需要从小到大递增才可以,因为计算基尼系数时涉及到数据的累加处理。

    除此之外,如果不是加权数据格式,比如本案例数据为905个人,那么就为905行数据,然后仅一列收入值,从上到下依次收入增加,此种数据放入也可直接进行分析。

  • 2、理论

    SPSSAU进行基尼系数计算时,参考国家统计局官方公布的计算公式进行计算,其计算说明如下链接:

    国家统计局基尼系数计算公式

  • 3、操作

    本例子中操作截图如下,将收入数字值项放入分析项,并且将‘人数(加权项)’放入加权框中。

  • 4、SPSSAU输出结果

    基尼系数一共输出1个表格,并且输出洛伦兹曲线图。

  • 5、文字分析

    上表格展示基尼系数值,本案例共计20行加权数据,总人数为905人。总收入是指所有人(本案例是905人)的收入加和,其为中间过程值无特别意义,最终gini系数值为0.317,介于0.3~0.4之间并且接近0.3,意味着当前研究样本数据的收入合理相对比较平均,无收入不均现象。

    上图为洛伦兹曲线,可以看到,整体上洛伦兹曲线更偏向于右上三角对角线,相对比较‘直’,其意味着各个收入水平的人数与其对应的收入比较接近,也即相对较公平。如果洛伦兹曲线比较‘凹’,此意味着有着小部分的群体,他们的群体明显更多,此时基尼系数应该很高即说明收入不均匀。

    另外,上图中还包括2条线,右上三角对角线即蓝色虚线,其表示绝对的收入公平,还有一条是黑色虚线,其表示绝对的收入不均匀。

  • 6、剖析

    基尼系数分析涉及以下几个关键点,分别如下:

    • 没有输出洛伦兹曲线?
    • 当样本量大于1000时,此时洛伦兹曲线点过多无法直观查看,此情况下不输出。

    • 基尼系数为负数?
    • 基尼系数的数据格式需要特别注意,1是收入不能为负数,2是收入需要从上到下依次递增,3是如果加权数据需要放入加权项到对应框框中。