病例对照研究
(Case-Control Study,
一、病例对照研究的概念、基本原理
1 概念
比较患某病者与未患该病的对照者暴露于可能危险因素的百分比差异~分析这些因素与疾病的联系及联系强度。
2 基本原理
回顾性暴露收集
暴露
病例组
未暴露
暴露
对照组
未暴露
病例对照研究是以现患有某特定疾病的病人作为病例~以不患有该病但具有可比性的个体作为对照~通过询问~实验室检查或复查病案史~收集既往各种可能的危险因素的暴露史~测量并比较病例组与对照组中各种因素的暴露比例~经统计学检验~若两组差别有意义~则可认为因素与疾病存在统计学联系。在评估了各种偏倚对研究结果的影响之后~
1
在借助病因推断技术~推断出某个或某些因素是疾病的危险因素~达到
探索和验证疾病病因假说的目的。
二、病例对照研究的特点
1. 对比性研究
?能够定量分析因素和疾病的联系。
?病例组与对照组应具有可比性
?理论上要求两组除研究因素与疾病外均应保持同质性。
?潜在的混杂因子在两组保持同质性。
?复合变量在两组保持同质性。 2(由果到因的研究顺序。
?节省时间、物力和人力。
?信息偏性较大。
3(抽样性研究
?病例组能够代表病例的总体。
?对照组能够代表对照的总体。 4(自然观察法
?可行性好~即调查人群依从性较好。
?两组间的可比性较差。
5(一果多因的研究
?研究效率较高~与疾病的病因模式相符。
?两组的可比性较差。
?统计分析较烦琐。
6(对因果关系的初步验证。
2
三、病例对照研究的分析模式
1(描述性研究
特征描述、均衡性检验。
2(比较病例组与对照组暴露率的差异~并作统计学推断。
表1 病例对照研究资料整理表
暴露或特征 病例组 对照组 合计
有 a b n1
无 c d n0
合计 mmN 1 0
病例组暴露率,,/, 对照组的暴露率,,/, ,,
,/,,,/,,/,?,/, ,, ,,
,, ,,,,,,,;,,/,,,, ,,,,
, Df,, ,,?.84 为α,0.05 的分位值。 3(联系强度的计算
?相对危险度,Relative Risk~RR,
暴露组的发病率与非暴露组的发病率的比值。
RR=[a/,a+b,] /[ c/,c+d,]
?比值比,Odds Ratio~OR,——优势比
比值:某事件发生的概率与不发生的概率的比。
不同组的比值的比为比值比。
病例组的比值 [a/,a+c,]/ [c/,a+c,],,,;,
对照组的比值 [b/,b+d,],[d,(b+d)],,,,
两组的比值比,OR,,a,/b;
3
? RR与OR的关系
由于a<
1 危险因素
OR或RR<1 保护性因素
OR或RR,1 无联系 ,(可信区间的估计
? Miettinen估计法:
2(1,1.96/,) OR,OR,ORul
? Woolf 估计法
Var(LnOR),1/a+1/b+1/c+1/d LnOR, LnOR,LnOR?1.96 Var(LnOR) UL
5.结论 可能。
四、用途
1. 广泛探索疾病的可疑危险因素
可比性差~用于病因研究的初级阶段
2.深入检验某个或某几个病因假说
可比性好~用于病因研究的深入阶段
3.提供进一步病因研究的线索
五、种 类
,一,按目的分类
1. 探索性病例对照研究
没有预先形成明确的某种假设~ 而是广泛地收集可能的病因~在
4
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
上不对病例和对照作特别的限制~只是需随机抽取一定数量的两类研究人群的样本。可比性差~因果关系不可靠。
2. 验证性病例对照研究
预先有明确的几种假设~在设计上需对研究的病例和对照作出相应的限制。 可比性好~因果关系较可靠。
,二, 按研究设计的病例与对照的配比分类
1. 病例与对照不匹配
即随机不匹配——探索性病例对照研究
2. 病例与对照匹配
病例与对照在一些非研究因素上保持相同~从而排除因素的干扰~增加可比性。
群体匹配——成组资料(category matching)~配比的因素所占的比例,频数匹配, frequency matching,。
个体匹配(individual matching)——配对资料(pair matching)~以个体为单位。
3 衍生的研究类型
,1,巢式病例对照研究(nested case-control study)
套叠式病例对照研究~队列内病例对照研究(case control study
nested in a cohort)
优点: ?时间顺序清楚。可以有回忆偏倚。
?由于来自相同的队列~可比性好。
?统计学效率和检验效率高。
,2,病例队列研究(case-cohort study)
在队列中按一定比例随机抽取一个样本作为对照组~观察结束
5
时~队列中出现的所研究疾病全部病例作为病例组。
与巢式病例对照研究区别:
A对照为基线随机不与病例匹配
B随机对照如发生研究疾病~则既为对照也是病例
C可同时研究几种疾病~不同的疾病为不同病例组~但对照均为一组。
,3,病例交叉研究,case-crossover design,
日常生活中一些突发事件之后~常会伴随发生某些结果。究竟是这些突发事件导致了这些结果的发生~还是仅仅由于机会原因所致,
病例交叉研究的基本思路是指同一个体的不同时期的暴露信息比较,同一病例前后对照,。
,4,单纯病例研究,case only study,
也称病例病例研究或病例系列研究。
用于分析基因型与环境暴露的关系。应用前提是正常人群中基因型与环境暴露各自独立发生~且研究的疾病为罕见疾病。
,5,病例时间对照设计,case time control design,
病例时间对照设计的基本思路为~采用传统病例对照研究时~疾病严重程度造成的混杂往往不能完全控制。这是因为一般情况下~疾病的严重程度没有精确测量方法~从而无法保证疾病的严重程度在病例和对照分布一致。然而通过病例的自身对照有难以排除医疗措施的改变等因素的影响。因此提出在病例自身对照的基础上~再另设一组对照则可消除该因素的影响。
六、病例对照研究的设计
(一,查阅文献~明确调查目的
6
1(广泛探索危险因素
2(检验某几个病因假设
3(两者兼有
,二,根据研究目的确定研究方法
即随机不匹配、群体匹配、个体匹配、套叠式病例对照研究等。
广泛探索病因—随机不匹配或群体匹配。
验证性病因研究—个体匹配、套叠式病例对照研究。
病例数较少—增加对照的匹配数量提高病例的检验效率。
,三, 病例与对照的来源与选择
来源:医院为基础(hospital-based),社区为基础(community-based)
1.病例的选择
主要是确定判断病人的
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
和怎样获得这些符合判断标准的病人。
1,病例的规定
应具有明确而具体诊断标准~并应有文字
材料
关于××同志的政审材料调查表环保先进个人材料国家普通话测试材料农民专业合作社注销四查四问剖析材料
作为研究
计划
项目进度计划表范例计划下载计划下载计划下载课程教学计划下载
的附件。
,1,采用国际或国内统一标准,有利于与他人结果的比较。
,2,自定义需要平衡诊断标准的误诊率和漏诊率。
2,对病例的一些特征限制
如~性别、年龄等。控制外部条件提高可比性。
3,保证病例质量的手段。
如~必须通过某一级医院的诊断或某项检查~或通过专家诊断等。
2( 对照的选择
1,与病例的来源一致。
2,除研究因素外其他特征应与病例保持同质。
,二,样本量
7
1(保证有代表性
2(不应低于作统计学检验的最低样本量
,三,研究因素的确定
1(根据不同的人群确定明确的执行定义
2(统一的测量标准
,四,资料的收集
1(实验室检查
2(复查病案史
3(调查询问,制定合理的调查表,
1,病例与对照需用统一调查表
2,要有均衡性项目即匹配项目
3,要有疾病诊断项目
4,要有研究因素项目
,五, 资料整理分析
除按上述的分析模式外~还要考虑因素间的混杂协同作用。
,六,写出研究
报告
软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载
七、病例对照的选择
,一,基本原则
1(代表性,2(可比性,3(可靠性,4(可行性
,二,病例的来源
1(医院或门诊已确诊的病例—旧病例。
2(普查,筛选,—新病例。
3(报告病例—旧病例或死亡病例。
8
,三,病例的选择方法
1(病例内外部特征的限制 暴露因素的变更作用
2(病例类型的选择 ——新病例 幸存者偏倚,决定生存因素,
3(病例来源的限制 回忆偏倚
,四,对照的选择
1(注意事项
1,可比性好
缩小混杂偏倚~尤其是不能很很好测量的变量所引起的偏倚。
准确测量变量可以放在分析阶段控制。
2,不选与所研究病因有联系的对照
3,混杂因素
4,最好有个一般人口作对照
但如果病例代表性不好~就应选择与病例相同来源对照。
2(来源
1,医院中对照
2,病例所在住宅区内对照
3,社区中社会团体
4,社区
5,病例配偶、同胞、亲属、同学、同事等
3(对照的类型
1,多组病例一组对照
2,一组病例多组对照
八、个体匹配,配对或配比,
9
,一, 配比的基本含义
根据每个病例的特点~找与其相匹配的一个或几个对照组成一个信
息单元~使其在某些混杂变量上保持同质性。
,二,配比的类型
1:M配比~ 1:1-1:4
,三,配比的作用
1. 控制混杂因素,在设计阶段,
2. 提高统计学效率
3. 提高病例的效率
Pitman效率递增公式 2R/(R+1) 1~1.3~1.5~1.6 ,四,配比过头(over matching)
把不是混杂因素作为配比条件称为配比过头
中间变量
1.非混杂因素作为配比条件
只与研究因素有联系
降低经济效率,降低样本效率
2.研究因素作为配比条件
丢失研究信息
,五,配比因素的确定
已知或非常怀疑某因子为混杂因子
以某些复合变量作为配比条件。
九、样本含量的估计
(一) 影响样本量大小的因素
1. 研究因素在对照组的暴露率P0
2. 估计该因素引起的RR或OR
10
3. 第一类误差的大小α
4. 把握度,1-β,~第二类误差的大小 (二)样本量计算方法
1非匹配设计病例数与对照数相等
22PQ(U,U),,n,2(P,P)10 n 每组的病人数
2 非匹配设计病例数与对照数不等
12(1,)PQ(U,U),,病例数1cn,,2(P,P)对照组c10 设:
nc,对照数 n为病例数
3 1:1匹配设计
2U/2,UP(1,P),,,,m,12(P,)2
ORRRP,,(1,OR)(1,RR) 式中 m 为结果不一致的对子数
mM,(pq,pq)0110需要的对子数为
p与p代表目标人群病例组和对照组的暴露率 10
4 1:R配比病例对照研究
见书P 87
十、暴露因素的收集
1(变量的选定 与研究目的相关
11
2(变量的标准 统一标准或自我定义
3(变量的测量 定量化、客观化
十一、病例对照研究常见的偏性及控制
,一, 选择性偏倚,selection bias,
概念:由于选入的研究对象与未选入的研究对象在某些特征上存在差异引起的系统误差。
分类:
1. 入院率偏倚,admission rate bias; berkson bias,
以医院为病人为病例的选择时产生的偏倚。
2. 现患病例-新发病例偏倚(prevalence-incidence rate)
病例对照研究中如选用现患病例~且暴露与疾病的预后有关时~可发生Neyman偏倚。因为现患病例都是过去新发病例中的幸存者~其暴露特征各异。例如~男性的直结肠癌发病率略高于女性~但女性直结肠癌的生存时间明显长于男性~因此~如选用现患病例作为研究对象~则病例中的女性比例就较新诊断的病例中多。为了除去这种选择性生存(或死亡)的影响~应采用新诊断的病例作为研究对象。
还有一些疾病病例在诊断后可能会改变原有的暴露~如被诊断为肺癌的人~可能立即戒烟。
3. 检出症候偏倚(detection signal bias)
病人常因某些与致病无关的症状就医~从而提高了早期病例的检出率~致使过高地估计了暴露程度而产生的偏倚。
例如:在研究雌性激素和子宫内膜癌的关系中~Horwitz RI 进行的一项病例对照研究中揭示了这种偏倚~
12
控制办法
1, 延长收集病例时间~使其超过早、中、晚发生的时间
2, 选择适当对照
表5 更年期服用雌性激素与子宫内膜癌关系的研究
????????????????????????????????
肿瘤科 妇产科
用药史 ??????????? ????????????
患者 对照 计 患者 对照 计
???????????????????????????
+ 45 7 52 59 42 101
- 72 110 182 89 106 195
计 117 117 234 148 148 296
OR 9.8 1.7
????????????????????????????????
4. 时间效应偏倚(time effect bias)
不能识别病例的早期病变~从而导致将病例错误地认为非病例。
控制方法:
1,敏感的诊断技术
2,延长观察时间
,二,信息偏倚(information bias)
概念:在收集信息过程中~由于测量暴露与结局的方法有缺陷造成的系统误差。
分类:1. 回忆偏倚(recall bias)
2. 调查偏倚(investigation bias)
控制方法
,三,错误分类的偏倚(misclassification bias)
概念:将一个调查对象~一个数值或一个特征错误地分到不是它所属的类别中。
13
控制方法:
1. 提高灵敏度和特异度
2. 保持一致的测量方法
,四,混杂偏倚:
1(基本概念
由于某个因素既与疾病有制约关系~同时又与所研究的因素有联系~从而对研究因素与疾病的关系起到歪曲作用。
2(与其他偏倚的区别
1,混杂偏倚是客观存在的~即混杂因素对疾病产生客观影响~同时和研究因素有统计学联系。
2,混杂偏倚不仅可以在设计中、资料收集中控制~也可以在资料分析中控制。
3(如何判定混杂偏倚
该因素必须同时具备下述两个条件
1,该因素对疾病产生客观影响。
2,该因素和研究因素有统计学联系。
4(作用类型
1,按混杂偏倚结果分类
,1,阳性混杂作用 夸大了研究因素与疾病的关系
,2,阴性混杂作用 掩盖了研究因素与疾病的关系
2,按混杂偏倚作用过程分类
,1,继发关联混杂
研究因素,中间变量,与疾病并不存在因果联系~仅与混在因素存在统计学联系。
14
,2,直接因果关联混杂
研究因素与疾病存在因果关系~同时与混杂因素存在统计学联系
5(控制方法:
? 在设计阶段采用配比和控制
? 分层分析---mantel-haenszel法。
?分析步骤
2?先将所得资料按不分层资料计算总的X, OR, 95%OR可信区间, 即
2CX, COR, COR95%CI
2?按混杂因素分层计算各层的X, OR, OR95%CI ?将各层的OR与COR进行比较 i
OR=OR=COR; OR?OR?COR; OR=OR?COR 12…I12…I12…I
?计算公式
表 病例对照研究分层资料整理表
I层的发病情况 合计 暴露特征 病例 对照
有 abNi i 1i
无 CdNi i 0i
合计 MMt1i 0i i
计算总的OR值 Mantel Haenszel公式
adii(),tiOR ,mhbcii(),ti2 计算总的X值 Mantel Haenszel公式
2aE,,,mn,,i(ai)2ii11, E ,,,,mhai()Vt,(ai)i
Immnn1010iiiiV, i为第几层~I为层数。 ,,()ai2t(t,1),1iii
15
十二、病例对照研究其他分析方法
,一,1:1个体配比资料的分析
1(四格表的整理
表1:1配对病例对照研究资料整理表
病 例 合计 对照 暴露 非暴露
暴露 aba+b
非暴露 c dc+d
合计 a+c b+dt
2 2. χ检验:用McNemar公式计算
2 2 χ =(b-c) /(b+c)
3(计算OR值
OR=c/b
4(计算OR的95%可信区间
Miettinen估计法:
2(1,1.96/,)MH OR,OR,ORul
5.归因分值,attributable fraction,
归因分值,AF,也叫病因分值,EF,~归因危险度百分比(ARP)
是指由于该暴露因素所引起的发病占全部发病的比例
II,OR,1eu AF ,,eIORe
人群归因分值
人群中因暴露引起发病占全部发病的比例
16
I,IP(OR,1)pue AF,, p,,I1,P(OR,1)pe
注意:配对资料的病例对照研究不能拆开分析
例如:
表 吸烟与肺癌1:1配对病例对照研究资料整理表
病 例 合计 对照 吸烟 不吸烟
吸烟 100(a) 150(b)a+b
不吸烟 25(c) 400(d)c+d
合计 a+c b+dt
OR=b/c=150/25=6
将上述配对资料整理为成组资料
是否吸烟 病例 对照 合计
吸 250125375
不吸 425550975
合计 675675 1350
OR=ad/bc=250×550/125×425=2.59
,二,分级暴露资料分析
1(整理分级资料表
病例对照研究分级资料整理表
暴露分级
…… 0 1 2 3 4 合计 病例 a(=c) a a a a n 012341对照 b(=d) b b b b n 012340合计 m m m m m n 01234
17
2(总卡方检验
2kAT(,)2ii ,,,T,i1i
3(各级的OR值及可信区间
通常以不暴露或暴露最低组为参照计算OR值
4(趋势性卡方检验
2TnTn,,,(/2112 ,,Var
2nn(nT,T)1032其中 Var,2n(n,1)
ttt2 T,aXT,mXT,mX,,,12iiii3ii,0,0,iii0
取值有两种办法~一是取每个暴露的中点值~另一种方法是第i暴Xi
露水平的=i(对照组为0)。 Xi
18