推断统计怎么做(浅析临床研究中常用的推断统
开展临床研究时,一般不会直接选择目标人群的总体进行研究,而是先根据合适的样本量计算公式计算出足够的样本量,再采用合适的随机抽样方法进行抽样调查,最后应用统计学原理和方法进行从样本到总体的假设检验和统计推断。下面,达晋编译对临床研究中常用的推断统计方法进行简要阐述。
一、一元定性资料的差异性检验。单组设计的定性资料常用于样本率的参数与总体的已知率之间差异性检验。例如对于有些无法设计对照组的临床试验,采用单组设计的目标值法进行统计分析。资料整理构成一维列表,基于数据的二项分布原理和总体进行比较,大样本时按近似正态分布基于Z分布进行计算,小样本时采用Clopper-Pearson精确法或Blyth-Still的二项式比例计算。在优效、等效和非劣的实验设计中,单个样本的二项比例的可信区间的计算直接关系到结果,需要正确选择方法。
成组设计的定性资料中若响应变量是二分类,则构成常见的四格表。在横断面研究中根据不同的条件选择卡方检验或Fisher精确检验,评价组间构成比的差异。若响应变量是多值有序变量,可采用Wilcoxon秩和检验和Kruskal-Wallis检验。若行和列的属性构成配对结构时,可用McNemar检验或Kappa检验对一致性分布进行定性和定量的检验。若分组变量为有序多分类,而响应变量为二分类时,除了可用卡方检验外,还可使用Cochran-Armitage趋势检验来检验率和有序多分类变量之间是否存在线性趋势。
二、一元定量资料的差异性检验。单组设计的定量资料和单组设计的定性资料的应用范围类似,但样本估计的参数是均值或中位数,根据正态性检验的结果选择统计方法。符合正态分布时,采用单样本t检验,均值的可信区间基于正态分布计算。不满足正态分布时,采用符号秩检验,中位数的可信区间基于非参数方法计算。
对于成组设计的定量资料,若两组定量资料是配对关系,则计算差值后采用单组设计的统计方法。若组间的资料独立,则需根据各组的正态分布检验和方差齐性检验选择独立样本的t检验和Wilcoxon秩和检验,或方差分析和Kruskal-Wallis检验。对于两组以上的检验,如果差异有统计学意义,可能需要根据研究设计选择合适的方法进行事后的两两比较分析。
三、相关分析和回归分析。相关分析常用于衡量两个变量之间线性关系的强度和方向,其结果是描述两个变量的相关关系,没有时间顺序,不能用于因果推断。回归分析可用于探究一个因变量与一个或多个自变量的关系,通过拟合的回归系数直观的定量解释因变量随着自变量变化的变化,从而评价自变量对因变量的独立作用。
在临床研究中回归分析主要用于影响因素的研究和预测模型的建立,在前瞻性研究设计中甚至可用于自变量和因变量之间因果关系推断。根据自变量与因变量之间的关系可分为线性回归和曲线回归,根据连接函数的不同,可将线性回归进一步分为一般线性回归和广义线性回归。在临床研究中常用的回归分析是多重线性回归、Logistic回归、Poisson回归、负二项回归和COX模型回归,在实际应用中根据不同的结局指标类型选择合适的回归模型。
四、生存资料的分析。临床研究的观测结果需要做长期随访才能确定,所以评价影响因素或干预效果时,不仅需要分析感兴趣的重点事件是否发生,还要考虑到达终点时经历的时间长短。生存分析是将终点事件是否发生和所经历的时间结合起来的统计分析方法。生存资料的回归分析可建立多个因素对生存资料的回归模型,以便了解各个因素的独立作用。一般可分为参数模型的回归分析和半参数COX回归分析。
若确定生存资料服从某特定分布,需使用相应的参数模型拟合,能得到更准确的结果。若生存资料的准备分布无法获得时,可采用COX等比例风险模型,其不依赖特定分布的特点,在随访研究中得到非常广泛的应用。COX模型的使用需要满足风险等比例的前提假设,对分类协变量可检验生存曲线是否交叉,对连续协变量需拟合偏残差与生存时间的关系。若不满足前提假设,需采用含时依协变量的COX模型,此外某些协变量在随访过程会发生改变,也需要采用该模型进行分析。
五、重复测量数据。在纵向资料中可能会对结局指标进行多次测量,构成重复测量的数据,该实验设计在临床研究中应用广泛。由于数据的非独立性,不满足一般回归的前提假设,常用的统计方法有重复测量的方差分析、混合效应模型和广义估计模型。重复测量的方差分析的思想是总变异分解成个体内变异和个体间变异,需要满足正态性、方差齐性和球形的前提假设,但数据中存在缺失时,分析会将存在缺失的研究对象数据全部删除,有效样本量大大降低。
混合效应模型和广义估计模型采用纵向数据格式,能有效利用样本的信息,根据不同的协方差矩阵结构保证分析结果更加准确保守,同时能对时变因素进行多重比较。所以针对重复测量数据应主要采用混合效应模型和广义估计模型。混合效应模型考虑随机效应,是对个体水平值的估计,而广义估计模型主要考虑固定效应,是对总体平均水平值的估计,在分析时根据需求选择。
相关文章:
相关推荐: