等价性检验

等价性检验是一种统计学检验方法,用于判断两个处理组之间是否存在临床上或实际应用中可接受的差异。与传统的显著性检验(比如t 检验)不同,等价性检验的目的是证明两个处理组的效果差异在预设的等价界值范围内,即两个处理组是等价的或其中一个不劣于另一个。

等价性检验通常用于医学研究、工业质量控制相关领域,比如‘证明仿制药的疗效与原研药相当’,也或者证明‘新药疗效不劣于现有标准治疗’,也比如验证‘新产品性能指标达到行业标准’等。

等价性检验

  • 1、理论

    SPSSAU中共支持两种数据类型、两种指标类型,两种样本类型,以及3种检验类型共计2*2*2*3=24种检验,并且输出结果中默认提供检验详细指标和检验公式等,如下述:

    说明
    数据类型 包括均值和率差共两种
    指标类型 高优指标和低优指标两种
    样本类型 双样本和单样本共两种
    检验类型 非劣性检验、等价性检验和优效性检验共3种

    关于数据类型、指标类型、样本类型和检验类型的分别说明如下:

    数据类型 描述 适用数据
    均值差异 比较两组连续型变量的均值差异 连续型数值(如血压、得分、重量等)
    率差 比较两组二分类变量的发生率差异 二分类结果(如有效/无效、成功/失败)

    均值差异用于连续性数据的差异对比,率差用于二分类数据的差异对比。

    指标类型 描述 数值意义 应用示例 解释原则
    高优指标 数值越大表示效果越好 数值↑=效果↑ 有效率、满意度、收入 差异值为正表示试验组优于对照组
    低优指标 数值越小表示效果越好 数值↓=效果↑ 不良率、成本、时间 差异值为负表示试验组优于对照组

    高优指标是指‘数字越大越好’,反之低优指标指‘数字越大越差’。

    样本类型 描述 数据结构 应用场景 比较对象
    双样本 比较两个独立样本组 两组独立观测数据 试验组vs对照组、方案A vs方案B 两组间相互比较
    单样本 样本与预设标准值比较 单组观测数据+标准值 新产品vs行业标准、改进后vs历史数据 样本与标准值比较

    样本类型指提供的原始数据情况,比如试验组和对照组的差异检验时,那应该分别提供试验组和对照组的两项数据。单样本时比如新的药品疗效与行业标准对比,此时仅需要提供新产品疗效数据即可,行业标准是已知数据。

    检验类型 目的 原假设(H0) 备择假设(H1) 事例
    非劣效性检验 证明试验组不比对照组差 差异≤-δ(高优) 或 差异≥δ(低优) 差异>-δ(高优) 或 差异<δ(低优) 仿制药不劣于原研药、简化方案不劣于标准方案
    等价性检验 证明两组效果基本相同 差异≤δL 或 差异≥δU δL<差异<δU 仿制药等效性验证、工艺变更等价性确认
    优效性检验 证明试验组优于对照组 差异≤δ(高优) 或 差异≥-δ(低优) 差异>δ(高优) 或 差异<-δ(低优) 新药优于现有药物、改进方案优于原方案

    非劣效性检验的核心点在于‘不比对照项差’,等价性检验的核心点在于‘两组效果基本一样’,优效性检验的核心点在于‘证明更优’。通常情况下,非劣效性检验使用更多,比如证明新药不比当前药物疗效差,即其实质是想证明替代品并不差。

    接下来具体组合数据类型、指标类型、样本类型和检验类型后进行说明,如下表格:

    数据类型 指标类型 样本类型 检验类型 应用示例
    均值差异 高优指标 单样本 非劣效性 新降压药与标准药比较,证明降压效果不差于标准药
    率差 低优指标 双样本 等价性 比较两种手术方法不良反应率,证明差异在可接受范围内
    均值差异 高优指标 单样本 优效性 新工艺产品强度与历史标准比较,证明显著优于标准
    率差 低优指标 单样本 非劣效性 新检测方法错误率与行业标准比较,证明不差于标准

    比如新的降压药与标准药比较,降压效果是个均值指标来标识(且该指标值越大疗效越好),那么数据类型就是‘均值’,而且是‘高优指标’,并且新药与市场已有的标准药进行对比,那么就是‘单样本’,与此同时其核心目的是证明‘新药不比标准药差’,那就是非劣效性检验。如果是‘不良反应率’,这明显是‘率差’并且是‘低优指标’,因为不良反应率是越小越好。

  • 2、操作

    假设我们正在进行一项临床试验,比较一种新降压药(试验组)与标准降压药(对照组)的疗效。我们的目标是证明新药的降压效果不比标准药差太多(即非劣效性)。

    假定:试验组数据的样本量(n1):100,均值(mean1):1.3(假设为降压幅度),标准差(sd1):1.0。对照组数据:样本量(n2):100,均值(mean2):1.2(假设为降压幅度),标准差(sd2):1.1。

    检验目标是‘证明新药降压效果不比标准药差太多’,此处‘不差太多’的标准是0.1,即非劣性界值(δ):0.1(即允许的最大劣势范围为0.1)。另外还有个默认参数显著性水平(α):0.05,此参数意义为假定检验的准确率不低于1-0.05=95%,即需要有至少95%的可靠性。

    本例子操作截图如下:

    SPSSAU通常会输出下述结果,包括‘分析结果’、‘检验详细信息’和其它输出结果,分别如下:

    上表格展示出均值差刚好为0.1,检验目的是‘证明新药降压效果不比标准药差差0.1’,原假设为‘新药降压效果不比标准差差0.1’,检验结果显示p 值是0.09>0.05,即接受原假设,即说明‘新药降压效果不比标准药差太多’。表格中输出均值差,检验统计量指标结果,除此之外,SPSSAU还输出统计量计算公式,原假设和备择假设的公式信息等。

    检验详细信息表格列出具体的检验类型、检验方式、标准误的具体值、显著性水平参数、界值及相关输入信息指标具体值等。

    如果是均值差检验时,SPSSAU默认判断是否方差比(使用Levene检验法判断),如果方差齐则使用‘合并方差法’计算标准误,反之方差不齐时则使用‘Welch-Satterthwaite方法’计算标准误。并且表格中输出Levene检验的结果,以及对应此时标准误的计算公式和计算结果等。

  • 3、剖析

    涉及以下几个关键点,分别如下:

    • 如何学习等价性检验?
    • SPSSAU中等价性检验共涉及4个关键名词分别是:数据类型、指标类型、样本类型和检验类型,建议结合实际研究目的以及数据情况,分别确定好该4项,对应选择并且输入数据后进行分析即可,输出结果中包括检验分析结果,检验公式等详细信息可直接使用。

    • 均值差时方差齐的判断?
    • 均值差等效性检验时,SPSSAU默认判断是否方差比(使用Levene检验法判断),如果方差齐则使用‘合并方差法’计算标准误,反之方差不齐时则使用‘Welch-Satterthwaite方法’计算标准误。并且表格中输出Levene检验的结果,以及对应此时标准误的计算公式和计算结果等。