多组数据的差异性分析用什么方法 (医学统计学
医学统计学已经广泛地应用在医学科学研究中。在文献复习与研究设计、实验或观察实施、数据收集与记录、资料整理与分析、结果表达与解释、报告撰写与论文发表等环节无不涉及统计问题。浅浅所以一下医学统计学常用分析方法。
一、差异性研究
差异性研究就是分析不同数据资料之间的差异性。简单可以分为研究单样本、两样本、多样本资料之间均数的差异性比较以及定类数据之间差异性比较;分类说明如下:
1、单样本均数比较
单样本均数比较是指研究一组定量数据与一个数字之间的差异性。例如研究36名从事铅作业男性的血红蛋白含量与正常男性血红蛋白均数140g/L的差异。当数据满足正态性时,可以使用单样本t检验方法进行研究;当数据不满足正态性时,可以使用单样本wilcoxon检验进行研究。
2两样本均数比较
两样本均数比较是指研究两组定量数据之间的差异性。
例如研究两类胶囊的降血糖效果是否有差异;而两样本设计又可以分为两独立样本和两配对样本。
两样本相互独立时——当两样本数据都满足正态性和方差齐性,则可以使用独立样本t检验或者方差分析(单因素方差分析)进行研究;当数据呈正态且方差不齐时,可以使用t'检验或者welch方差、Brown-Forsythe方差进行研究;当数据非正态且方差不齐时,则不能使用参数检验,应该使用非参数检验法—wilcoxon秩和检验进行分析。
两样本为配对设计时——当两配对数据的差值满足正态性,使用配对样本t检验进行研究;当差值不满足正态性时,使用配对样本wilcoxon检验进行分析。
3、多样本均数比较
多样本均数比较是指研究多组定量数据之间的差异性。
例如研究某种药物不同剂量下小鼠的存活时间;而多样本设计又可分为完全随机设计、随机区组设计、重复测量设计。
完全随机设计——要将研究对象按照某个处理因素随机分配为多个处理组(也称为处理因素的水平),每组接受一种处理,最后判断多个处理组之间有无差别。当满足正态性和方差齐性时,使用方差分析进行研究;不满足时,可以使用Kruskal-wallisH秩和检验进行分析。
随机区组设计——是配对设计的扩展。具体做法是:先按影响实验结果的非处理因素(如性别、体重、病情、病程等)将实验对象配成区组(block),再分别将各区组内的实验对象随机分配到各处理组或对照组。当满足正态和方差齐时,使用方差分析进行研究;不满足时,可以使用Friedman秩检验进行分析。
重复测量设计——当前后测量设计的重复测量次数m≥3时,称重复测量设计或重复测量数据。重复测量数据进行组内项差异分析时,需要进行球对称假设,当满足时,直接使用重复测量方差分析结果;当不满足时,采用Greenhouse-Geisser校正或者Huynh-Feldt校正结果分析。
4、定类数据比较
定类数据之间的差异性研究主要通过卡方检验进行分析。
例如研究患肺癌与是否吸烟之间的差异性;可以将定类数据资料分为四格表资料、R*C资料、2*2*K资料三类。
四格表资料——只有两行两列。又可以分为配对资料和非配对资料两种。
配对资料例如分别使用抗原检测和核酸检测对同一批样本检验***病毒阳性、阴性是否有差异。当为2*2配对设计时,采用McNemar检验;当为n*n配对设计时,采用Bowker检验。非配对资料时,当总样本量n≥40,且期望频率E≥5时,使用Pearson卡方;当n≥40但其中一个格子出现1≤E<5时,使用yates校正卡方;当n<40或者E<1时,使用Fisher卡方进行分析(这一过程SPSSAU将自动选择)。
R*C表资料——当行和列中任意一个大于等于2时,称为R*C表资料。
当E全部>1且 1≤E<5格子的比例小于20%则使用Pearson卡方;否则使用yates校正卡方(SPSSAU将自动选择)。
2*2*K资料——卡方检验研究X和Y的差异,X和Y均是类别数据,当前需要进一步考虑另一个干扰因素分层项时;比如是否吸烟(X)与是否得肺癌(Y)的关系时,将性别纳入考虑范畴此时应该使用分层卡方进行分析。
补充:除此之外,常用的卡方检验还有卡方拟合优度检验,用于分析预期的比例是否与实际的比例有着明显的差异性。
二、相关性研究
研究数据之间的相关性,主要可以使用Pearson相关系数和Spearman相关系数。
当变量X和Y服从双变量正态分布时,可以使用Pearson相关进行进行相关分析;
Pearson相关系数计算公式如下:
当变量X和Y不服从双变量正态分布时,则使用Spearman相关进行相关分析;
当变量X和Y均为多分类有序资料时,可以用Spearman相关进行相关分析。
Spearman相关系数计算公式如下:
相关系数没有单位,其值为-1≤r≤1。r值为正表示正相关,r值为负表示负相关,r的绝对值等于1为完全相关,r=0为零相关。在生物界由于影响因素众多,因此很少完全相关。Pearson相关或者Spearman相关都要求观察单位之间是独立的。
三、影响因素研究
研究因变量Y的影响因素时,按照因变量Y类型的不同,可以分为以下三类:
因变量Y为定量资料时;当自变量个数为1个时,使用一元线性回归分析进行研究;当自变量的个数为多个时,使用多元线性回归分析进行研究。
因变量Y为定类资料时;当Y为二分类变量,如“是否患病”,此时使用二元logistic回归分析进行研究;与此同时,如果是针对配对资料进行分析的,则应该使用条件logistic回归分析。当Y为多分类变量时,使用多分类logistic回归分析。当Y为有序多分类变量时,如“无效、好转、痊愈”,应该使用有序logistic回归分析。
因变量Y为生存资料时:此时共有两个因变量,Y1表示生存时间,Y2表示生存状态,且0表示生存,1表示死亡,两个因变量缺一不可,此时应该使用cox回归。
以上就是今天的全部内容,主要讲了医学统计学比较常用的差异性研究方法、相关性研究方法以及影响因素研究方法。还想看什么其他内容,请留言告诉我哦~
相关文章:
相关推荐: