游程检验

  • 游程检验亦称“连贯检验”,是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。它是 一种非参数性统计假设的检验方法。

    如果数据有上升或下降的趋势,或有呈周期性变化的规律等特征时,均可能表示数据与顺序是有关的,或者说序列不是随机出现的。通俗来讲,游程检验是用于分析数据是否为随机。

    比如原始数据为:1100001110110000111100;原始数据中0和1交替出现,也有可能连续出现0或1;

    • 一个由0或1连续构成的串称为一个游程;

    • 一个游程中数据的个数称为游程长度;

    • 一个序列中游程个数用R表示。表示0和1交替轮换的频繁程度。

    上述数据中:游程长度分别为2,4,3,1,2,4,4,2;游程个数R=8。

    • 如果游程个数过多,则说明0和1交替特征明显;

    • 如果游程个数过少,则说明0和1相对比较集中;

    • 无论游程个数过多,也或者过少,极端情况都说明数据不具有随机性。因而可以通过游程个数过多或过少来定义假设检验的拒绝域,也即通过游程个数来分析数据是否为随机数据。

    • 特别提示
    • 游程分析算法中只能针对0和1进行;但很多时候数据很可能不是这样,比如扔色子时可能出现1,2,3,4,5,6共6个数字。因此SPSSAU算法会默认以中位数作为切割点,将数据切割成两组,并且分别使用0或者1标识,并进一步进行分析,得出研究结论。

  • SPSSAU操作示例如下:

游程检验案例

  • 1、背景

    当前共扔色子100次,随机地扔,并且记录下得到的数字,总共有100个数字,现在想研究数据是否具有随机性,因而使用游程检验进行分析。

  • 2、理论

    游程检验用于检验数据是否具有随机性,其原始假设是数据序列不具有随机性;如果检验结果显示p 值小于0.05,则说明数据不具有随机性,反之p 值大于等于0.05则说明数据具有随机性。

    如果数据有上升或下降的趋势,或有呈周期性变化的规律等特征时,均可能表示数据与顺序是有关的,或者说序列不是随机出现的。通俗来讲,游程检验是用于分析数据是否为随机。

    比如原始数据为:1100001110110000111100;原始数据中0和1交替出现,也有可能连续出现0或1;

    • 一个由0或1连续构成的串称为一个游程;

    • 一个游程中数据的个数称为游程长度;

    • 一个序列中游程个数用R表示。表示0和1交替轮换的频繁程度。

    上述数据中:游程长度分别为2,4,3,1,2,4,4,2;游程个数R=8。

    • 如果游程个数过多,则说明0和1交替特征明显;

    • 如果游程个数过少,则说明0和1相对比较集中;

    • 无论游程个数过多,也或者过少,极端情况都说明数据不具有随机性。因而可以通过游程个数过多或过少来定义假设检验的拒绝域,也即通过游程个数来分析数据是否为随机数据。

    • 特别提示
    • 游程分析算法中只能针对0和1进行;但很多时候数据很可能不是这样,比如扔色子时可能出现1,2,3,4,5,6共6个数字。因此SPSSAU算法会默认以中位数作为切割点,将数据切割成两组,并且分别使用0或者1标识,并进一步进行分析,得出研究结论。

  • 3、操作

    直接拖拽标题到右侧框中,点击开始分析即可:

  • 4、SPSSAU输出结果

    游程分析结果
    名称 样本量 统计量

    p

    扔色子的点数 100 0.419 0.675
    * p <0.05 ** p <0.01

    使用游程检验分析扔色子的点数是否为随机数据序列,其原定假设为数据服从随机分布;p 值 <0.05则说明拒绝原假设数据不服从随机分布;反之p 值> 0.05则说明接受原假设数据服从随机分布,从上表可以看出:扔色子的点数不会表现出显著性(p >0.05),意味着扔色子的点数为随机序列数据。

  • 5、文字分析

    具体文字分析例子如下:

    使用游程检验分析扔色子的点数是否为随机数据序列,其原定假设为数据服从随机分布;p 值<0.05则说明拒绝原假设数据不服从随机分布;反之 p 值> 0.05则说明接受原假设数据服从随机分布,从上表可以看出:扔色子的点数不会表现出显著性(p >0.05),意味着扔色子的点数为随机序列数据。

  • 6、剖析

    游程检验可针对定类数据,也可以针对定量数据;如果是定类数据,一般为二分类数据,如果是定量数据,SPSSAU会自动以其中位数作为切割点,将数据区分为两组然后进行游程检验。

疑难解惑

  • 数据序列是否为随机?
  • 游程检验用于检验数据是否完全随机,提供数据即可进行检验,比如彩票号码是否完全随机。