统计过程控制图(Statistical Process Control Chart)是一种用于监控生产过程稳定性的统计工具。通过绘制数据点在时间序列上的分布,帮助识别过程中的异常变化。统计控制图可实时监控生产过程是否处于统计控制状态,及时发现过程中的异常波动和趋势,为持续改进提供数据支持,以及可在问题发生前进行预警。SPSSAU中共支持9类统计控制图,分别是:Xbar-S/Xbar-R/Xbar/I-MR/I, P/NP/C/U图。涉及到连续(定量)和离散(定类)两种数据类型,如果是连续数据时区分是否包括子组两种数据格式,如果有子组数据则应该使用Xbar-S/Xbar-R/Xbar,如果没有子组数据则应该使用I-MR/I图,如果是离散(定类)数据,应该使用P/NP/C/U图。具体选择使用可参考下图:
如果是监控连续性数据,那么应该选择Xbar-S/Xbar-R/Xbar/I-MR/I,继续区分数据格式,如果是子组数据那么应该选择Xbar-S/Xbar-R/Xbar,反之如果是单值数据则选择I-MR/I图。进一步似子组大小和监控目的而定,如果子组较少关注均值变异性,那么使用Xbar-R图,如果子组较大监控变异图可使用Xbar-S图,如果仅仅监控均值,那么使用Xbar图即可。单值数据并且关注数据波动时可使用I-MR图。
当数据是离散性,似监控对象而定,当关注不合格品时使用NP/P图,如果关注缺陷数则使用C/U图。进一步判断单位信息情况,比如基数大小固定时使用NP图(关注不合格品数),反之使用P图(关注不合格品率)。基数大小固定时可使用C图(关注单位内缺陷数),反之使用U图(关注缺陷率)。
SPSSAU提供九类质量控制图,该九类的汇总说明,如下表所示:
控制图类型 | 数据类型 | 数据格式 | 子组大小 | 说明 |
---|---|---|---|---|
X̄-S图 | 连续(定量) | 子组数据 | n≥10 | 过程均值+标准差,使用很多 |
X̄-R图 | 连续(定量) | 子组数据 | 2≤n≤10 | 过程均值+极差,使用很多 |
X̄图 | 连续(定量) | 子组数据 | n≥2 | 仅监控过程均值 |
I-MR图 | 连续(定量) | 单值数据 | n=1 | 个别值+移动极差,无子组 |
I图 | 连续(定量) | 单值数据 | n=1 | 仅监控个别值,无子组 |
P图 | 离散(定类) | 离散数据 | 可变 | 不合格品率 |
NP图 | 离散(定类) | 离散数据 | 固定 | 不合格品数 |
C图 | 离散(定类) | 离散数据 | 固定 | 缺陷数 |
U图 | 离散(定类) | 离散数据 | 可变 | 单位缺陷率 |
如果是连续数据,并且子组数据格式,则应该选择使用Xbar-S/Xbar-R/Xbar图,并且结合子组大小和监控目的进一步进行选择。如果是连续数据并且是单值数据则应该使用I-MR或I图。当是离散数据时,可使用P/NP/C/U图,进一步判断,如果是单位基数固定和不固定两种情况,一种是监控‘数’,一个是监控‘率’,比如NP和C图分别关注不合格品数和单位缺陷个数,而P图和U图分别 关注不合格率和单位缺陷比率。
以及关于9种控制图的数学计算公式,分别如下述:
如果每次取的样本比较多(通常10个以上)时,用标准差比极差更准确。因为极差只看最大最小值,其忽略掉中间数据的变化,而标准差考虑了所有数据点。均值就是平均数,假设每次取5个零件测量长度,得到5个数据,把这5个数加起来除以5就是均值。
计算公式上:对于每组数据,先算出某组的平均值(均值),然后把所有组的均值再平均一次,得到总均值即控制图的中心线。同样,把所有子组的标准差平均一次,得到平均标准差。控制限就像是"警戒线",超出这条线就要注意了。以及下述中会提及A2、A3、B3、B4、D3、D4等这些SPC系数来计算控制限,这类系数是统计学家根据大量数据总结出来的标准值,不同的样本数量对应不同的系数。均值数和标准差图的控制限计算分别如下述:
X̄图:中心线=总均值,控制限=总均值 ± 3×(平均标准差/平均c4系数/√平均样本数)
S图:中心线=平均标准差,控制限=平均标准差 ± 3×(平均标准差/平均c4系数×√(1-平均c4系数2))
X̄-R是最常见的控制图,适合每次取2-10个产品进行测量的情况。比如每小时从生产线上取5个零件测量尺寸,或者每批次取4个产品检测重量。
极差是最大值减最小值,假设每次取5个零件测量长度,得到5个数据,该5个数据的最大值的减去最小值的就是极差。
计算公式上:对于每组数据,先算出某组的平均值(均值),再算出最大值与最小值的差(极差)。然后把所有组的均值再平均一次,得到总均值即控制图的中心线。同样,把所有组的极差平均一次,得到平均极差。以及其控制限的计算说明分别如下述:
X̄图:中心线=总均值,控制限=总均值 ± 3×(平均极差/平均d2系数/√平均样本数)
R图:中心线=平均极差,控制限=平均极差 ± 3×(平均d3系数/平均d2系数×平均极差)
如果只关心平均水平,不太在意波动大小时使用。或者当过程的变异性已经很稳定,不需要再监控时,此时可只使用均值图。
计算公式上:计算各组数据的平均值,然后画成图表。控制限的计算需要借助极差或标准差的信息,或者使用已知的过程标准差。以及控制线计算如下述:
中心线=总均值(所有子组均值的平均)
控制限:总均值 ± 3×(总体标准差/√平均样本数)
如果每次只能得到一个测量值的情况,比如每天测一次温度、每批测一次pH值等。由于没有多个数据来计算极差,所以用"移动极差"的概念。移动极差就是相邻两个数据之间的差值。比如今天测得25度,昨天是23度,移动极差就是|25-23|=2度。
计算公式上:
I图:中心线=总均值,控制限=总均值 ± 3×标准差
MR图:中心线=平均移动极差,上限=3.267×平均移动极差,下限=0
I图仅监控单个测量值,其计算较为简单,如下述:
中心线=平均值
控制限:平均值 ± 3×标准差
如果关心不合格品占总数的比例时使用,比如客户投诉率、产品缺陷率等。样本大小可以变化,比如这批检查了100个,下批检查了120个。
计算公式上如下述:
不合格品率 = 不合格品数/检查总数
中心线=总体不合格品率
控制限=总体不合格品率 ± 3×√[总体不合格品率×(1-总体不合格品率)/样本量]
如果每次检查的数量都相同,关心不合格品的绝对数量时使用。比如每天都检查100个产品,看有多少个不合格。
计算公式如下:
中心线=平均不合格品数
控制限=平均不合格品数 ± 3×√[平均不合格品数×(1-不合格品率)]
如果每次检查的数量都相同,关心不合格品的绝对数量时使用。比如每天都检查100个产品,看有多少个不合格。
计算公式上如相:
中心线=平均缺陷数
控制限=平均缺陷数 ± 3×√平均缺陷数
如果每次检查的数量都相同,关心不合格品的绝对数量时使用。比如每天都检查100个产品,看有多少个不合格。
计算公式如下:
单位缺陷数 = 缺陷总数/检查单位大小
中心线=加权平均单位缺陷数
控制限=平均单位缺陷数 ± 3×√(平均单位缺陷数/检查单位大小)
n | d2系数 | d3系数 | c4系数 | A3系数 |
---|---|---|---|---|
2 | 1.128 | 0.853 | 0.7979 | 2.659 |
3 | 1.693 | 0.888 | 0.8862 | 1.954 |
4 | 2.059 | 0.88 | 0.9213 | 1.628 |
5 | 2.426 | 0.864 | 0.94 | 1.427 |
6 | 2.534 | 0.848 | 0.9515 | 1.287 |
7 | 2.704 | 0.833 | 0.9594 | 1.182 |
8 | 2.847 | 0.82 | 0.965 | 1.099 |
9 | 2.97 | 0.808 | 0.9693 | 1.032 |
10 | 3.078 | 0.797 | 0.9727 | 0.975 |
11 | 3.173 | 0.787 | 0.9754 | 0.927 |
12 | 3.258 | 0.778 | 0.9776 | 0.866 |
13 | 3.336 | 0.77 | 0.9794 | 0.85 |
14 | 3.407 | 0.763 | 0.981 | 0.817 |
15 | 3.472 | 0.756 | 0.9832 | 0.789 |
16 | 3.532 | 0.75 | 0.9835 | 0.763 |
17 | 3.588 | 0.744 | 0.9845 | 0.739 |
18 | 3.64 | 0.739 | 0.9854 | 0.718 |
19 | 3.698 | 0.734 | 0.9862 | 0.698 |
20 | 3.735 | 0.729 | 0.9869 | 0.68 |
21 | 3.778 | 0.724 | 0.9876 | 0.663 |
22 | 3.819 | 0.72 | 0.9882 | 0.647 |
23 | 3.858 | 0.716 | 0.9887 | 0.633 |
24 | 3.895 | 0.712 | 0.9892 | 0.619 |
25 | 3.931 | 0.708 | 0.9896 | 0.606 |
针对SPC控制系数列,如果n小于25时,SPSSAU使用上表格,如果n>25时,SPSSAU会自动进行额外计算,其计算公式如下:
当样本量n>25时,d2系数通过伽马函数积分法计算,即:d2(n) = √2 × Γ((n+1)/2) / Γ(n/2),d2系数用来将极差转换为标准差的估计值。当样本量超过25时,查表法不够精确,需要用数学积分公式来精确计算。这个公式基于统计学理论,通过伽马函数(Gamma函数)来描述极差分布的数学特性。
当样本量n>25时,d3系数通过近似公式计算:d3(n) = 0.886 / √n,d3系数用来计算极差本身的标准差。当样本量很大时,这个系数会随着样本量增加而减小,遵循"样本量越大,估计越稳定"的统计学原理。0.886是一个经过大量统计验证的常数,就像物理学中的重力加速度9.8一样,是通过理论推导和实验验证得出的固定值。
当样本量n>25时,c4系数通过伽马函数计算:c4(n) = √(2/(n-1)) × Γ(n/2) / Γ((n-1)/2),c4系数用来修正标准差的偏差,让标准差的估计更准确。在统计学中,直接计算的标准差往往会偏小,需要用c4系数来"校正"这个偏差。该公式确保了无论样本量多大,计算出的标准差都是无偏的(即长期平均下来等于真实值)。
当样本量n>25时,A3系数通过组合公式计算:A3(n) = 3 / (c4(n) × √n),A3系数专门用于X̄-S图(均值-标准差图)的控制限计算。它结合了c4系数的修正作用和样本量的影响。数字"3"代表3倍标准差的统计控制原理(99.7%的数据应该在3倍标准差范围内)。这个公式确保了控制限的计算既考虑了标准差的偏差修正,又考虑样本量对控制限宽度的影响。
SPSSAU中进行质量控制图时,需要选择数据类型,数据格式(子组数据还是单个测量值),以及如果是子组数据时,需要确认具体子组的表示方式(单列还是多列)。
如果是单列数据格式需要设置‘子组大小’参数,比如有100个样本点,子组大小为5,那子组个数=100/5=20,设置子组大小后SPSSAU自动计算子组个数。如果是多列数据格式,格式上为‘一行表示一个子组’。
另:SPSSAU默认提供Demo数据,取消‘Demo数据’复选框后则清空默认数据,研究者粘贴实际数据到编辑框后,点击‘开始分析’即可。
默认情况下,SPSSAU提供控制图,以及分析建议。与此同时,SPSSAU提供控制图时,其列出四项异常值监控方式,分别是距离中心线距离多少标准差(单点超出控制限),连续多少点在中心线同一侧(连续点偏向一侧),连续多少点在递增或递减(连续上升或下降趋势),连续多少点上下交错等共4种异常值检测,并且会在控制图中自动进行切换标识。
规则一:单点超出控制限,默认以超出3σ控制限(UCL或LCL)作为标准,正常过程中,数据点落在3σ外的概率仅为0.27%,研究者可自行进行切换修改该标准。此类点超出控制限时,一般意味着过程发生重大偏移。
规则2:连续点偏向一侧,默认以连续9个点落在中心线同一侧,一般情况下连续9点在同侧的概率为(1/2)^9 ≈ 0.2%。此类情况时,一般意味着过程均值发生系统性偏移。
规则3:连续上升或下降趋势,默认以连续6个点呈单调递增或递减作为标准。一般情况下6个点严格单调的概率为2/6! ≈ 0.28%。出现此类异常时,可能意味着过程存在渐进性趋势变化(如设备磨损)。
规则4:上下交错,默认以连续14个点在中心线上下交替出现作为标准。
涉及以下几个关键点,分别如下:
计算公式中会出现,比如d2、d3、c4和A3表等,其都是统计学家通过复杂的数学推导得出的标准系数。这些系数确保了控制图的准确性。当n<=25时,SPSSAU默认查表得到该类系数,当n>时,SPSSAU会自动计算,具体见本文档理论说明。
SPSSAU当前对控制图异常点判断上,默认提供四项异常值监控方式,分别是距离中心线距离多少标准差(单点超出控制限),连续多少点在中心线同一侧(连续点偏向一侧),连续多少点在递增或递减(连续上升或下降趋势),连续多少点上下交错。
SPSSAU中进行控制图时,默认提供Demo数据,取消‘Demo数据’复选框后则清空默认数据,研究者粘贴实际数据到编辑框后,点击‘开始分析’即可。
如果是单列数据格式需要设置‘子组大小’参数,比如有100个样本点,子组大小为5,那子组个数=100/5=20,设置子组大小后SPSSAU自动计算子组个数。如果是多列数据格式,格式上为‘一行表示一个子组’。