【word】 医学研究
论文
政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载
中常见统计学错误
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
(4)
医学研究论文中常见统计学错误分析(4)
2007年8月
第27卷第8期
基础医学与临床
Basic&ClinicalMedicine
August2007
Vo1.27No.8
文章编号:1001—6325(2007)08—0956-05讲座
医学研究论文中常见统计学错误分析(4)
定量资料统计分析错误辨析与释疑
胡良平
(军事医学科学院生物医学统计学咨询中心,北京100850)
摘要:通过揭示大量定量资料统计分析方面的错误案例,说明重视判定设计类型和检查资料前提条件,对于合理
选用定量资料统计分析方法是至关重要的.由于不少科研人员缺乏多因素实验设计类型方面的知识,现行很多统
计学教科书在这方面又十分薄弱,因此,广大实际工作者加强这方面知识的学习,是十分必要的.
关键词:实验设计类型;定量资料;前提条件;正态性;方差齐性
中图分类号:R-32文献标志码:A
DiscriminationandexplanationofstatisticalelTOFSintheanalysis
ofquantitativedata
HULiang—ping
(ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China)
Abstract:Inthispaper,agreatmanyexamplesofmisusingstatisticsanalyzingthequantitativedataareunveiled.
Obviously,itisextremelyimportantforpeopletoprocessthequantitativedatacorrectlybycheckingtheprecondi—
tonsofdataanddiscriminatingthetypesofexperimentaldesigns.Itisnecessaryforresearcherstolearnmore
knowledgeofhowtoanalyzethequantitativedatarationally,SOitisimportanttodevelopqualifiedtextbooktosup—
porttheeducation.
Keywords:thetypeofexperimentaldesign;quantitativedata;precondition;normality;homogeneityofvariances
1定量资料统计分析中的概念错误
1.1误将定量资料判为定性资料从而错误选用统
计分析方法
例l
原文
少年中国说原文俱舍论原文大医精诚原文注音大学原文和译文对照归藏易原文
题目:”小儿皮肤血管瘤雌,孕激素受体
盼研究”,原作者意在探讨雌激素受体(ER),孕激素受
体(PR)在血管瘤发生,发展中的意义.采用免疫组化
方法对毛细血管瘤,混合型血管瘤,海绵状血管瘤,淋
巴管瘤及正常皮肤组织的ER,PR受体进行检测.全
部标本经10%甲醛固定,常规石蜡包埋.每例选一典
收稿日期:2007-04—28修回日期:2007—04—28
型蜡块,4—6/on切片,进行免疫组化染色,高倍镜下每
例肿瘤区内计数50O个细胞,计数ER,PR阳性细胞百
分率,资料见表l.统计方法用x.检验.
表1血管瘸,淋巴管瘸中ER,PR检测结果(?)
基础医学与临床Basic&ClinicalMedicine957
对差错的辨析与释疑正确识别统计资料的性
质是合理选择统计分析方法的重要前提.统计资料
一
般分为定量资料和定性资料两大类.其中,定量
资料又可细分为计量资料(可带度量单位和小数
点,如:某人身高为1.73m)和计数资料(一般只带
度量单位,但不可带小数点,如:某人脉搏为73次/
min),定性资料又可细分为名义资料(如血型分为:
A,B,AB,O型)和有序资料(如疗效分为:治愈,显
效,好转,无效,死亡).
判断资料性质的关键是把资料还原为基本观察
单位的具体取值形式,而不要被资料的表现所迷
惑.本资料的受试对象为病例标本,测量指标为
“阳性细胞百分率”,从每个个体身上都可测得
“ER阳性率”或”PR阳性率”的一个具体值,因
而应为定量资料,其涉及一个实验因素,即样品类
别,有5个水平,即”毛细血管瘤”,”混合型血
管瘤”,”海绵状血管瘤”,”淋巴管瘤”和”正常
皮肤”.对于百分率的定量指标,一般根据经验,
宜做平方根反正弦变换,当资料满足正态性和方差
齐性的前提条件后,可采用单因素5水平设计定量
资料的方差分析处理资料;若变量变换后仍不满足
前提条件,则应采用非参数检验,如Kruska1.Wa1.
1is秩和检验.
1.2忽视t检验和方差分析的前提条件
例2原文题目:”血清肿瘤标志在结直肠癌诊
断中的作用”,为研究CEA,CA19.9,CA72-4和
CA242四项肿瘤标志在患者手术前,手术后及转移
复发方面有无差异,分别检测了58名手术前患者,
30名手术后患者及19名转移复发患者,测量其4
项指标,原作者对资料进行了t检验,资料见表2.
表2手术前后4项肿瘤标志检测结果(-I-$)
对差错的辨析与释疑若资料中的数据均为正
值且符合正态分布,通常其
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差要小于均值.本
例中若干个单元格中标准差的数值是均值的2倍以
上,基本上可以认为此资料服从偏态分布,不同组间
标准差也相差悬殊,并不满足方差齐性的要求.作
为参数检验方法,与特定设计类型对应的t检验和
方差分析有其应用前提条件,只有经过正态性和方
差齐性检验,满足条件后才能应用.另外,从实验设
计类型上看,本资料分了术前组,术后组及转移复发
组,相当于一个因素的3个不同水平,从设计类型上
判别应为单因素3水平设计的定量资料,原作者用
了t检验进行分析,显然是错的,因为t检验仅适合
分析单组,配对及成组设计的定量资料,并不适合分
析单因素k(k?3)水平设计定量资料和多因素设计
定量资料.
2单因素分析中实验设计类型判断错误
2.1误用成组设计资料的t检验分析配对设计的
定量资料
例3原文题目:”盆腔动脉插管灌注化疗及栓
塞治疗恶性滋养细胞肿瘤”,用改良的Seldinger’s
插管技术对8例经临床及病理证实的恶性滋养细胞
肿瘤进行选择性盆腔动脉插管灌注化疗.治疗前后
测血hCG放免测定值,资料见表3.原作者采用一
般t检验进行分析,治疗前后血hCG值经统计学处
理有显着性差异(P<0.05).
表3灌注治疗前后血hCG值(pmol/L)
注:1)由于本组数据相差较大,故取其对数使之成为正态分布,经t
检验(P<0.05;2)本院血hCG放免测定正常值为<330pmol/L
对差错的辨析与释疑本资料数据成对出现,
每对数据测自同一个病例,因而为自身配对设计.
对于此类资料,一般计算每对数据的差值,用其差值
的大小,反映两种处理之间效应之差的大小.原作
958基础医学与临床Basic&ClinicalMedicine
者把治疗前后的数据当成是相互独立的数据,直接
将治疗前与治疗后的数据按成组设计定量资料的t
检验进行比较,这种处理方法与设计类型并不相符,
容易增大犯假阴性错误的机会.另外,原作者注意
到原始数据不满足t检验的前提条件之一(即正态
性),因而对其进行对数变换,这种思想是正确的,
但是采取变量变换的目的还是使数据满足正态性,
至于资料经过变量变换后是否满足了正态性要求,
还应对变换后的数据进行正态性检验(注:此时应
对两组数据分别取对数后相减,对其差值进行正态
性检验),本资料取对数后计算差值,经验算,资料
仍然不满足正态性的条件,故不适合进行t检验.
对于配对设计的定量资料,应计算各配对数据
的差值,将资料转换为单组设计的定量资料,比较差
值的平均值与0之间的差别是否具有统计学意义.
当然进行单组设计的t检验前仍要对数据作正态性
检验,如不满足正态性的前提条件,可寻找适当的方
法(如取对数,平方根变换等)对数据进行变量变
换,变量变换后还要进行正态性检验,若资料满足正
态分布的前提条件,可用t检验;若资料仍不满足正
态分布的前提条件,可采用非参数检验,如配对设计
定量资料的符号秩检验进行分析.
2.2误用配对设计定量资料的t检验处理单因素k
(k?3)水平设计的定量资料
例4原文题目:”莪术对大鼠在体子宫肌电活
动的影响及其机制研究”,为观察莪术水煎剂对未
孕大鼠子宫肌电活动的影响,40只大鼠被随机分成
4组,对照组:按10mIJkg鼠重灌服生理盐水,莪术
组:按10mIJkg鼠重分别灌服25%,50%,100%莪
术水煎液.观察每个大鼠子宫肌电爆发波的峰面
积,持续时间和个数.原作者应用配对设计定量资
料的t检验进行统计处理,资料见表4.
表4莪术水煎剂对大鼠子宫肌电活动的影响(?)
对差错的辨析与释疑原文并没有交待将大鼠
按体重等条件分配到各个处理组中去,即大鼠在分
人各剂量组之前,原作者并没有按某些重要的非实
验因素对大鼠进行分组,因而不能直接相减作配对
设计定量资料的t检验.当然对此资料进行成组设
计定量资料的t检验也是不对的,这是因为t检验最
多只能分析单因素2水平设计,且满足”独立性,正
态性和方差齐性”这样三个特定前提条件的定量资
料.本资料有4个剂量,即代表剂量这个因素的4
个水平,应属于单因素4水平设计的定量资料.
针对此种定量资料,如果满足独立性,正态性
和方差齐性3个前提条件,应用单因素4水平设计
定量资料的方差分析,在得出有统计学意义的结论
后,还可进一步采用Dunnett’St检验(它不同于
一
般的t检验)将所有处理组均数分别与对照组均
数进行比较,这样能够控制所有比较中最大的一类
错误概率值不超过事先
规定
关于下班后关闭电源的规定党章中关于入党时间的规定公务员考核规定下载规定办法文件下载宁波关于闷顶的规定
的检验水准理的值.
如果在专业上有必要对3项指标同时进行考察,还
应选用该设计下定量资料的三元方差分析对资料进
行处理.
3多因素分析中实验设计类型判断错误
3.1误用t检验处理多因素非平衡的组合实验定
量资料的实例
例5原文题目:”开胃理脾口服液对脾虚小鼠
肠功能的影响”,某研究者为了研究开胃理脾口服
液对脾虚小鼠胃肠功能的影响,取70只小白鼠随机
分为七组,每组10只,第一组为空白组,给等容生理
盐水,其余各组给100%大黄水煎液一周[远
1次/d],造成脾虚模型.停食24h后,第一,二组ig
含有10%炭末的冷开水,第三至第五组给含10%的
炭末开胃理脾口服液,第六组给含10%炭末的开胃
理脾丸剂,第七组给含有10%炭末的儿康宁.给药
30min后处死小鼠,打开腹腔,剪取小肠,分别测
量小肠总长度和炭末在肠内推进的距离,推进距离
除以小肠总长度计算炭末推进百分率.各组具体剂
量和推进率见表5,原作者对各组数据采取成组设
计定量资料t检验处理.实验表明,模型组与空白
组比较,具有非常显着性的差异,开胃理脾口服液
低,中,高剂量与模型组比较具有显着性差异,提
示本品具有促进小鼠小肠运动功能的作用,其作用
强度较丸剂好.这样处理资料恰当吗?为什么?
2007.27(8)基础医学与临床Basic&ClinicalMedicine959
表5实验条件对小鼠小肠运动的影响
对差错的辨析与释疑很多人简单地把表5资
料视为单因素7水平设计定量资料,在实际进行统
计分析时,又把它视为多个单因素两水平设计(即
成组设计)定量资料,反复采用成组设计定量资料
的t检验处理,这是很不正确的做法.显然,在表5
中,”组别”一词所代表的内容是很多的,既有受试
动物”是否属于脾虚模型”,又有服用开胃理脾口服
液的”剂量”,还有服用的药物剂型”是口服液还是
丸剂”,甚至还有”是否服用药物(不服药,服开胃理
脾药,服儿康宁).但在已做实验的7个组中,没有
将前述的诸因素各水平之间全面组合,而只实施了
其中的一部分,因此,本例中的”组别”所代表的因
素属于”非平衡组合因素”.不考查资料的实验设
计类型,多次用t检验进行两两比较,根据概率计算
原理,这样做会大大增加犯假阳性错误的概率.更
严重的是:有些组之间比较时,在某些重要的非实验
因素方面是很不均衡的,即组间缺乏可比性.就好
比:将一组年轻的男性职业田径运动员与另一组60
多岁的女性业余田径运动员比较100m短跑成绩一
样,两组人之间没有任何比较的基础.
在实际分析时,可根据不同的分析目的,拆分成
若干个组的不同组合,以便于识别设计类型和选用
统计分析方法,这样作出的结论更合理可信.本例
可根据不同的分析目的拆成以下几种组合:
组合1:空白组与模型组
组合2:模型组,低剂量组,丸剂组,儿康宁组
组合3:模型组,中剂量组,丸剂组,儿康宁组
组合4:模型组,高剂量组,丸剂组,儿康宁组
组合5:模型组,低剂量组,中剂量组,高剂量组
成组设计
单因素4水平设计
单因素4水平设计
单因素4水平设计
单因素4水平设计
如果资料满足独立性,正态性和方差齐性,在上
述5种组合中,组合1可用成组设计定量资料的t
检验进行分析;后4种组合可视为单因素4水平设
计,可运用相应设计定量资料的方差分析进行处理.
否则,可运用非参数检验如秩和检验进行分析.对
于后4种组合而言,若各组合下组间的差别经假设
检验具有统计学意义,还可进一步采用Dunnett’St
检验分析其余各组与模型组之间差别是否具有统计
学意义.
3.2误用t检验处理析因设计的定量资料
例6原文题目:”营养不良对幼鼠癫痫持续状
态后海马神经发生影响的研究”,为探讨发育期营
养不良伴发癫痫持续状态对海马神经发生的影响,
将28只新生Wistar大鼠建模分为4组,分别为营养
良好组,营养不良组,营养良好+惊厥组,营养不良
+惊厥组,每组7只,测量各组齿状回Brdu阳性细
胞数,并采用t检验比较各组的差异是否具有统计
学意义,设计和资料见表6.
表6营养状态及有无惊厥幼鼠齿状回brdu阳性
细胞数比较(-I-$)
对差错的辨析与释疑本资料有4个实验组,
实际上涉及到两个实验因素,一个因素为”是否营
养不良”,其有两个水平:是,否;另一个因素为”是
否伴惊厥”,其有两个水平:是,否.两个因素各有
两个水平,它们互相组合,得到4个实验组,见表7.
从实验设计类型上讲,本例应为析因设计类型的资
料,而原作者在统计分析时忽略了这种组合关系,只
是对任何两组一味地用t检验进行比较,这是错误
的分析方法.因为t检验只能分析单组设计,配对
设计和成组设计的定量资料,其只涉及一个因素,且
这个因素最多只有两个水平.误用t检验分析较复
杂设计的定量资料至少具有以下几个缺点:1.割裂
了整体设计,每次进行t检验时,都会用不同的误差
作为比较的尺度,尺度不统一,缺乏可比性;2.资料
的利用率低,作t检验时,每次只用部分数据,此时
960基础医学与临床Basic&ClinicalMedicine
资料的利用率降低;3.误差的自由度变小,结果的
可靠性降低,自由度在检验统计量中的作用相当于
权重,权重越小,意味着由该统计量作出的统计推断
越不可靠;4.增大了犯假阳性错误的概率,多次两
两t检验,根据概率原理,会明显增大犯假阳性错误
的概率;5.无法分析因素之间可能存在的交互作用
的大小,有可能得出错误的结论.
表7营养状态及有无惊厥幼鼠齿状回brdu
阳性细胞数比较(2-:kS)
正确判断资料所涉及的因素及水平组合关系是
确定实验设计类型的关键所在,本资料属于两因素
析因设计的定量资料,当资料满足独立性,正态性和
方差齐性时,应采用与其相对应的方差分析方法进
行统计分析,可以分析出各因素及其可能存在的交
互作用的效应来;若资料不满足参数检验的前提条
件,应设法找到合适的变量变换方法再对变换后的
资料进行相应设计定量资料的方差分析为宜.
3.3误用t检验处理具有一个重复测量的三因素
设计定量资料
例7原文题目:”腹膜透析患者应用ACEI后
对EPO疗效观察”.目的:探讨终末期肾脏病行腹
膜透析(PD)后的患者在服用血管紧张素转换酶抑
制剂(ACEI)之后对促红细胞生成素(EPO)的疗效.
方法:选择16例接受促红细胞生成素(EPO)治疗的
腹膜透析(PD)患者,随机分成A,B两组.另外选
择10名不接受EPO治疗的PD患者,随机分成c,D
两组,A,c两组不接受血管紧张素转换酶抑制剂
(ACEI)治疗,B,D两组还要同时接受ACEI的治
疗.测定实验前后每个患者血清EPO的浓度,结果
以?s表示,统计学采用自身配对t检验及组间t
检验.资料见表8.
对差错的辨析与释疑本例的4个组是2个两
水平因素的组合,一个因素为”是否接受EPO治
疗”,另一个因素为”是否接受ACEI治疗”,它们都
有2个水平,即”是”与”否”,相互组合成4个实验
组,见表9,每个受试者在试验前,后两个不同的时
间点上被重复测量了同一个指标的数值,即试验前
与试验后的数据并不是相互独立的,这种设计类型
属于具有重复测量的实验设计,时间是与”重复测
量”有关的一个实验因素.而采用t检验进行两两
比较,则割裂了整体设计,不能准确地估计和控制误
差,因而不能得到可靠的结论.
表8实验前后血清EPO浓度(U/L)(:kS)
组别
EPO浓度(U/L)
实验前实验后
表9实验前后血清EPO浓度(U/L)(2-:ks)
EPO浓度(U/L)
是否EPO治疗是否ACEI治疗———??————??=
实验前实验后
本例属于具有一个重复测量的3因素设计,应
采用与之相对应的方差分析.通过分析,可以得到
“是否EPO治疗”,”是否ACEI治疗”,”治疗前后”
以及多项交互作用对EPO浓度的影响是否具有统
计学意义.也可以实验前为”协变量”,采用2×2
析因设计定量资料一元协方差分析处理.
参考文献:
[1]胡良平,李子建.医学统计学基础与典型错误辨析[M].
北京:军事医学科学出版社,2003:1—346.
[2]胡良平.统计学三型理论在实验设计中的应用[M].北
京:人民军医出版社,2006:1—264.