首页 第10章[1].病因与因果推断(栾荣生)

第10章[1].病因与因果推断(栾荣生)

第10章[1].病因与因果推断(栾荣生)第四节因果推断的逻辑方法第十章病因与因果推断研究结果的解说涉及到因果推断的问题。病因的研究不仅同疾病的诊断有关，还直接关系到疾病的治疗和预防。因此，基础医学、临床医学和预防医学均非常重视病因的研究。流行病学研究中的病因（cause of disease）与因果推断（causal inference），后者还包括处理－效应关系，实际上是分析或实验流行病学的指导框架和评价准则，对于形成正确的因果思维和准确地理解研究结果，是至关重要的。第一节病因的概念一、病因的定义（一）从决定论因果观到概率论因果观的发展...

第四节因果推断的逻辑方法第十章病因与因果推断研究结果的解说涉及到因果推断的问题。病因的研究不仅同疾病的诊断有关，还直接关系到疾病的治疗和预防。因此，基础医学、临床医学和预防医学均非常重视病因的研究。流行病学研究中的病因（cause of disease）与因果推断（causal inference），后者还包括处理－效应关系，实际上是分析或实验流行病学的指导框架和评价准则，对于形成正确的因果思维和准确地理解研究结果，是至关重要的。第一节病因的概念一、病因的定义（一）从决定论因果观到概率论因果观的发展传统的决定论因果观认为，一定的原因必然导致一定的结果。实际上，从经验证据得出的结论只能是归纳性的，归纳性结论只能是概率性的。而且更重要的是，客观世界本身的发展变化就是概率性的。现代科学产生了概率论因果观或称广义因果律：原因就是使结果发生概率升高的事件或特征，即一定的原因只是可能而不是必然导致一定的结果。（二）现代流行病学的病因定义早期的流行病学着重于研究传染病的流行问题，对病因的注意力主要放在空气、水和居住条件等环境卫生上，如Snow发现伦敦宽街霍乱流行与饮水污染有关。在细菌学兴起以后，对病因的注意力转到特定的病原体上，如Koch发现了结核病和霍乱的病原体。20世纪50年代以后，现代流行病学研究逐渐扩展到非传染性疾病，“病因”也就不仅仅限于传染病的病原体。 Lilienfeld（1980）从流行病学角度这样给出了病因的定义：那些能使人群发病概率升高的因素，就可认为是病因，其中某个或多个因素不存在时，人群疾病频率就会下降。因此，现代流行病学中的病因观是符合概率论因果观的。流行病学中的病因一般称为危险因素（risk factor），它的含义就是使疾病发生概率升高的因素，这里的危险（风险）是指不利事件发生的概率。（三）防治效应的原因定义防治实验研究也是一种因果性研究。研究因果关系的实验是指：在受控条件下，研究者有意改变一个或多个因素（处理），并前瞻地确定其效应的研究。相对地，观察性研究有较多干扰因素（受控较少），甚至有的干扰因素还不清楚，因此可重复性较低，对因果关系的确证性比实验性研究差。防治实验中的处理（treatment, maneuver）可以看成是防治特定效应（结局）的可能原因。如果实验处理使特定效应发生的概率升高，该处理就是特定效应的原因。同病因类似，也就是防治措施与该效应呈相关。二、病因模型病因模型就是用简洁的概念关系图来表达因果关系的概念模型。由于对因果关系有不同的理解或不同的侧重，所以有多种多样的病因模型。目前具有代表性的因果模型有以下三类。（一）生态学模型该类模型将机体与环境作为一个整体来考虑。常见的有动因-宿主-环境模型，又称为流行病学三角（图10-1），以及轮状模型（图10-2），它们给出了寻找病因的分类大框架。该类模型简明，整体性强，但失之于笼统。 1. 流行病学三角从因素间平衡和整体性观点看，它具有古老的思辨性和朴素的合理性，即疾病是三大因素相互作用的结果；它的特点是将启动性必要病因从环境因素或宿主中分离出来成为动因（agent），这是传染病病原体的遗留物，但对非传染病则很难确定什么是启动性必要病因。动因以前又称为致病因子或狭义的病因。图10-1 流行病学三角图10-2 轮状模型 2. 轮状模型将环境进一步分为生物、理化和社会环境，宿主还包括遗传内核，而动因不再单列。轮状模型各部分的相对大小可随不同的疾病而有所变化，如在胰岛素依赖性糖尿病中遗传核较大，而在麻疹中宿主（免疫状态）和生物环境（空气传播）部分较大。（二）疾病因素模型该模型（图10-3）在病因分类上操作性强，具有较强的实践指导意义，没有确定必要病因的困难。它将因素分为两个层次：外围的远因和致病机制的近因。外围的远因包括社会经济、生物学、环境、心理行为和卫生保健因素。基础或临床医学的病因主要是指致病机制的近因，流行病学的危险因素主要是指外围的远因。近因对疾病诊断和治疗的意义较大，而远因对疾病预防的意义较大。图10-3 疾病因素模型（三）病因网模型根据生态学模型或疾病因素模型提供的框架可以寻找多方面的病因，这些病因相互存在联系，按时间先后联接起来就构成一条病因链，多个似有节点 “鱼线”的病因链存在相互联系，交错联接起来就形成一张似“鱼网”的病因网（web of causation）。病因网的每一个节点是前面若干因素的结果，又是后面若干结果的原因之一，最后的“总节点”就是疾病终结局。这就是病因网模型，它提供因果关系的完整路径。例如，肝癌的病因网可以看成由三条主要病因链交错形成，三条病因链的起始端分别为乙肝病毒感染、黄曲霉毒素污染食品和饮水中的藻类毒素。病因网模型的优点是表达清晰具体，系统性强，能很好地阐述复杂的因果关系。（四）因果联接方式因果联接方式包括但因单果、单因多果、多因单果和多因多果。单一病因引起单一疾病，这是传统的简单化病因观，产生于人们早期认识疾病的局限性，也是因果特异性概念的根源。单一病因引起多种疾病，这从病因的多种疾病效应方面来看，无疑是正确的，但所导致的这些疾病又并非仅由这单一病因所致。多个病因引起单一疾病，这从疾病的多因性方面来看，无疑是正确的，但这些多个病因又并非仅仅导致单一疾病。最后，多个病因引起多种疾病，例如，高脂膳食、缺乏体力活动、吸烟和饮酒引起脑血栓形成、心肌梗死、大肠癌和乳腺癌。多种疾病的多个病因，可以是完全共同的，也可以是部分共同的。多因多果实际上是把单因多果与多因单果结合在一起，全面反映了事物的本来面目。（五）寻找病因的条目指南上述病因模型给我们指出了寻找病因的大致方向、类别或联系方式（病因网），对于具体病因，可以分为宿主和环境两大方面。 1. 宿主病因 (1) 先天的包括基因、染色体、性别差异等。 (2) 后天的包括年龄、发育、营养状态、体格、行为类型、心理特征、获得性免疫、既往史等。 2. 环境病因 (1) 生物的包括病原体、感染动物、媒介昆虫、食入的动植物等。 (2) 化学的包括营养素、天然有毒动植物、化学药品、微量元素、重金属等。 (3) 物理的包括气象、地理（位置、地形、地质）、水质、大气污染、电离辐射、噪声、振动等。 (4) 社会的包括社会/人口（人口密度、居室、流动、都市化、交通、战争、灾害）、经济（收入、财产、景气）、家庭（构成、婚姻、家庭沟通）、饮食习惯、嗜好兴趣（烟、酒、茶、运动、消遣）、教育文化、医疗保健、职业（种类、场所、条件、福利、劳保设施）、政治、宗教、风俗等。针对病因的具体研究涉及遗传学、病原生物学（医学微生物学和寄生虫学）、病理学（病因如何起作用）、营养学、环境卫生学、劳动卫生学、行为（心理）医学和社会医学等。三、充分病因和必要病因（一）充分病因和必要病因的概念机械决定论将原因分为充分原因和必要原因。类似地，病因也可以分为充分病因和必要病因。充分病因（sufficient cause）是指有该病因存在，必定（概率为100%）导致疾病发生。必要病因（necessary cause）是指有相应疾病发生，以前必定（概率为100%）有该病因存在。按病因是否充分或必要分类，可以有四种组合：(1) 充分而且必要病因，(2) 必要但不充分病因，(3) 充分但不必要病因，(4) 不充分且不必要病因。 1. 充分而且必要病因有该病因E存在时，疾病D必定发生；有相应疾病D发生，以前必定有该病因E存在。传统的因果观所谓的病因就是指的充分而且必要病因。这种实例几乎不存在，除非将病因和疾病定义成几乎同一事件或特征，如狂犬病毒侵入脑内导致狂犬病恐水期症状。 2. 必要但不充分病因有该病因E存在时，疾病D可能发生；有相应疾病D发生，以前必定有该病因E存在。传染病中的病原体，维生素缺乏症中的维生素不足，它们都是相应疾病中必不可少的病因，又称为动因，但仅有动因还不能使疾病一定发生。 3. 充分但不必要病因有该病因E存在时,疾病D必定发生；有相应疾病D发生，以前可能有该病因E存在。例如各类致死量的毒物，它们的摄入导致中毒死亡D分别是充分的，但对中毒死亡D各自又都不是必要的，即中毒死亡可由不同的致死量毒物（E1, E2, E3...）所致。实际上，只要仔细分析，这种所谓的充分病因，是要附加一些条件的。比如致死量如何确定，用最低、最大或平均致死量？另外摄入者还存在个体差异。要保证中毒死亡结果必定发生，并非由于单一的原因（毒物）。因此，严格意义上的充分但不必要病因实际上也不存在。 4. 不充分且不必要病因有该病因E存在时,疾病D可能发生；有相应疾病D发生，以前可能有该病因E存在。例如吸烟导致肺癌。我们可以听到这样反驳吸烟与肺癌的论证：不是每个吸烟者都会得肺癌，即吸烟不是充分病因，吸烟者肺癌发生率<100%；另外不是每个肺癌病人以前都吸过烟，即吸烟不是必要病因，肺癌病人以前的吸烟率<100%。这些反驳者认为病因应该是充分而且必要的，否则不能成为病因。殊不知，对于绝大多数病因（包括传染病或营养素缺乏病的其他病因）而言，它们既不是充分的，也不是必要的。（二）充分病因和必要病因的局限性 1. 充分病因的局限性充分病因几乎是不存在的，在牵强的例子中，病因和疾病结果几乎是一回事（因果同一），失去了因果关系的意义。例如，乙肝病毒持续感染导致肝癌的概率不等于100%，即不是充分病因；那么乙肝病毒DNA整合进肝细胞DNA，并且导致癌基因表达，产生肝癌细胞，在因果链上癌基因表达是否就是充分病因呢？如果忽略宿主的免疫清除功能，癌基因表达导致肝癌的概率为100%，即将癌基因表达看成是充分病因，但这样的充分病因和疾病结果（肝癌）就几乎是一回事了。如果单一的充分病因不存在，那么，多个病因同时出现（起作用），是否就能成为充分病因呢？这种思维方式可以帮助我们扩大病因研究范围。但是，这种使疾病发生的概率为100%的充分病因“组合”实际上也并不存在；即使存在，每个病人的充分病因“组合”也是不同的，其数目等于所有病人数，这使因果研究失去了实际意义。在实际研究中，我们仅仅能找出并只需要找出主要病因的“组合”，而这种病因“组合”远非充分的。 2. 必要病因的局限性如前所述，传染病的特定病原体为必要病因。例如，我们说乙型肝炎，一定是指的乙肝病毒而不是其他肝炎病毒引起的肝炎，因此乙肝病毒对于乙型肝炎的必要性从字面上就可以确定(语义重复)，而不是一个实证问题。我们不是先诊断乙型肝炎而断定以前必定有乙肝病毒感染，而是根据乙肝病毒感染，来对临床上的肝炎分类为乙型肝炎。对于一般的慢性病，从字面或定义上，我们不可能得到“必要病因”的启示。但对某些按“病因”分类的慢性病，就可以知道它们的必要病因，如“血管性痴呆”，脑血管病变就是它的必要病因。总之，对于按某病因进行分类的疾病（包括非传染病），该病因就是它的必要病因，而正因为有该病因才被分类为该疾病。总之，我们应当放弃因果决定论的充分病因和必要病因概念，而仅对病因的充分性和必要性进行概率测量。第二节因果推断的逻辑方法因果关系研究必然涉及到因果推断的问题，包括逻辑方法、统计关联和判定标准。如何从客观资料得出因果结论，涉及到归纳推理方法；概率因果观在统计学上意味着病因（暴露条件）与疾病呈相关，当然还必须确定该危险因素发生于疾病之前，以及“升高的概率”或相关未受到其他因素的干扰。在实际的因果推断过程中，还可以综合应用因果判定标准。因果推断的逻辑方法主要是归纳推理方法，它包括假设演绎法和Mill准则（消除归纳法），以及概率性推广的归纳统计推理。归纳推理是从个别到一般，从特殊到普遍，它的结论是把前提里的道理扩大范围再讲一次，因而前提真则结论只是可能真。而演绎推理是从一般到个别，从普遍到特殊，它的结论是把前提里的道理缩小范围再讲一次，因而前提真则结论必真。一、假设演绎法描述流行病学研究包括临床多病例观察、生态学研究和横断面研究等，它们主要陈述疾病的图景或现象，一般不涉及疾病的本质或因果关系；它们能提供病因分析的初步线索，形成病因假设。假设是在为数不多的经验事实以及已有理论的基础上，通过逻辑推理或创造性想象或猜测等形成的。得到假设后，描述流行病学通过假设演绎法同检验假设的分析流行病学研究相衔接。 1. 假设演绎法的推理过程假设演绎法（hypothetic deductive method）最早由赫歇尔（Hershel）提出，对近代科学的发展给予了强有力的推动。该名称中的“演绎”仅仅指待观察（检验）的经验事实（证据），可由假设相对于背景知识而演绎地推导出来，从一般的假设导出具体个别的事实（证据），就是一个演绎推理。但从具体个别的事实成立而推出一般的假设也成立，则是一个归纳推理。其推理形式为： (1) 因为假设H，所以推出证据E（演绎推理）； (2) 因为获得证据E，所以反推假设H成立（归纳推理）。假设演绎法的整个推论过程为：从假设演绎地推出具体的证据，然后用观察或实验检验这个证据，如果证据成立，则假设亦成立。从逻辑学上看，反推是归纳的。从一个假设可推出多个具体证据，多个具体证据的经验证实，则可使归纳支持该假设的概率增加。 2. 假设演绎法的应用例如，假设H：乙型肝炎病毒（HBV）持续感染导致原发性肝癌（PHC）；根据该假设H，加上相关背景知识为前提，演绎地推出若干具体经验证据E1（肝癌病例的HBV感染率高于对照）、E2（HBV感染队列肝癌发生率高于对照）、E3（控制HBV感染后，肝癌的发生率下降）。如果证据E1、E2、E3成立，则假设H亦获得相应强度的归纳支持。根据假设推出的具体经验证据可分为两类：已知事实和未知事实。解释已知事实的为一般性检验，而预测未知事实的为严格检验，两者的归纳支持强度是不同的。横断面研究或病例对照研究属于事后解释性研究，它对假设能提供的归纳支持强度较小。队列研究或干预研究属于事前预测性研究，因此其论证强度是高于横断面研究或病例对照研究的。如果经验证据经检验不成立或被否定，对假设该下怎样的结论呢？这样的情况在研究中并不少见。例如：如果乙肝病毒引起肝癌（H），则在乙肝病毒感染率相同的地方，肝癌发病率也应相同（E）；但是，发现那里的肝癌发病率不相同（E不成立），所以乙肝病毒引起肝癌（H）不成立。但是，问题并非如此简单。科学理论（假设）是一个相互联系的整体，经验证据是由理论（假设）和先行条件这一组前提推出来的；如果经验证据被否定，接着否定的是这一组前提中的任何一个，即可能是理论（假设）错了，或（和）可能是先行条件不对。因此，推理的实际形式为：如果假设H而且条件C，则证据E；如果证据E不成立，所以假设H或（和）条件C不成立。在上述乙肝病毒引起肝癌的例子中，先行条件应当为其他重要危险因素状态也相同。因此，肝癌发病率不相同，可能否定的是先行条件，即实际上可能其他重要危险因素状态不相同，而不是否定乙肝病毒引起肝癌的假设。二、Mill准则分析流行病学研究的比较推理，主要应用的是Mill准则（Mill's canon）和统计归纳推理。试图将因果推理的原则加以系统化的第一人是穆勒（Mill），他提出科学实验四法，后人将同异并用法单列，即科学实验五法：求同法、差异法、同异并用法、共变法和剩余法。需要注意的是，如果病因假设清单没有包括真实的病因，Mill准则就并不能提供任何帮助。另外，Mill准则原本是用于能控制干扰条件的实验类型，以及假定原因为确定性的必要或充分条件。因此，对于观察性研究或非确定性条件，Mill准则需要控制混杂或作概率性推广。（一）求同法（method of agreement）是辨别某类事件或属性的必要条件的方法，推理形式为：事件（病例，A）有关（暴露）因素 A, B, C -------- a, b, c A, D, E -------- a, d, e A, F, G -------- a, f, g …… -------- …… 所以，a 是A的必要条件如在全部肝癌病例（A）中或相当一部分病例中（统计地）发现有乙肝病毒感染标记（a），表明乙肝病毒是肝癌的必要条件或具有相当必要性的条件。当然,观察亦可从乙肝病毒感染到肝癌。（二）求异法（method of difference）是辨别某类事件或属性的充分条件的方法，推理形式为：事件（对照，非A）有关（暴露）因素 B, C -------- （a不出现）, b, c D, E -------- （a不出现）, d, e F, G -------- （a不出现）, f, g … -------- …… 所以，a 是A的充分条件如在全部非肝癌个体（对照，非A）中或相当一部分个体中（统计地）发现无乙肝病毒感染标记（非a），表明乙肝病毒是肝癌的充分条件或具有相当充分性的条件。（三）同异并用法（joint method of agreement and difference）是辨别某类事件或属性的必要且充分条件的方法，推理形式为： (1) 求同部分并且 (2) 求异部分所以，a 是A的必要且充分条件如在肝癌病例中发现均有或相当部分（统计地）有乙肝病毒感染标记，而在非肝癌个体（对照）中发现均无或相当部分（统计地）无乙肝病毒感染标记，表明乙肝病毒是肝癌的必要且充分条件或具有相当必要性和充分性的条件。同异并用法是所有比较性研究（有对照组）设计的逻辑学基础。（四）共变法（method concomitant variation）可以看成是求同法的特例。当有关（暴露）因素不是分类的（有或无），而是等级或定量的，并与事件（结局）效应成量变关系（剂量－反应关系），才可以应用共变法。推理形式为：事件（效应，A）有关（暴露）因素 A1, B, C -------- a1, b, c A2, D, E -------- a2, d, e A3, F, G -------- a3, f, g …… -------- …… 所以，a 是A的必要条件如在吸烟与肺癌的研究中，随着吸烟剂量（等级）的增加，肺癌的比值比（OR）或相对危险度（RR）也增加，即呈共变或剂量－反应关系，所以支持吸烟为肺癌的病因。实际上，分类资料的关联强度与定量或等级资料的剂量－反应关系，均表示结局事件与暴露因素的相关，从而支持因果联系。（五）剩余法（method of residues）剩余法可以看成是求异法的特例。对某复合结局事件（A, B, C），已知它的有关（暴露）因素在特定的范围内（a, b, c），通过先前的归纳又知道b说明B，c说明C，那么剩余的a必定说明A。推理形式为：结局事件有关（暴露）因素 A, B, C -------- a, b, c B -------- b C -------- c 所以，剩余a 是A的必要条件用剩余法判明联系，就象算术中的减法，即在一组复杂的现象中，把已知联系的现象减掉，探寻其他（剩余）现象的联系。如在肝癌的病因研究中，肝癌的发病率除了乙肝病毒感染和黄曲霉毒素能解释的部分，还有未能解释的部分，这部分就可归因于暴露因素范围内“剩余”的因素，如饮水中的藻类毒素。（六）归纳统计推理任何经典的归纳推理都可以还原为最初级的形式，即简单枚举法：S类的部分（S1, S2, S3…Sn）具有属性P，并且尚未观察到反例，所以S类全部都具有属性P 。对于概率论因果观而言，需要作概率性推广，这就是归纳统计推理，其基本形式为： S1 -------- P S2-------- P S3-------- 非P …… -------- …… Sn-------- P （其中m/n部分具有P属性）所以，S类的m/n部分具有P属性统计归纳推理的结论同样超出了观察对象（样本）范围，但结论是统计的，不是说“S类全部具有P属性”，而是说“S类的m/n部分具有P属性”。例如，同异并用法的概率性推广中，对病例组与对照组的暴露率做统计学比较，或对暴露组与非暴露组的发病率做统计学比较。也可以这样说，统计学的许多方法在逻辑本质上是归纳的。三、因果性实验中的对照法则（一）设立对照的必要性生物学或医学的研究对象过于复杂，很难仅仅通过实验室或其他外在条件来控制干扰，因此需要将一部分研究对象设置为对照或控制组（control group）。干扰作用（背景或基线）或自发变化体现在对照组上，通过与实验组比较，这些非处理因素的作用就可加以排除。如设实验（处理因素）的效应为T，干扰（非处理因素）的效应为C，则：实验（处理）组表现出来的混合效应 = T + C 对照组表现出来的效应 = C 实验（处理）的净效应 =（T + C）- C = T 如果有两种处理（如实验处理和标准处理）的效应分别为T1、T2，则：处理1组表现出来的混合效应 = T1 + C 处理2组表现出来的混合效应 = T2 + C 两处理净效应差值 =（T1 + C ）-（T2 + C）=T1 - T2 这样，利用实验（处理）组与对照组的比较，从实验（处理）组的混和效应中分离出归因于处理的净效应。需要注意：实验（处理）组所表现出来的混合效应（T + C），是由处理前后两轮测量值之差来确定的。如处理为降血压药，给药前后两轮血压测量值之差，就是降血压药组所表现出来的混合效应（ T + C）。这里“降血压药组给药前”并没有起到所谓对照的作用，即体现出非处理因素效应C。如果不存在非处理因素的干扰（C = 0）,那么降血压药的效应（T）就等于两轮血压测量值“自身前后”比较之差，因而就不需要什么“对照（控制）”了。因此，单纯的处理前后比较是没有对照（控制）的，“自身前后对照”的说法是不准确的。（二）保证对照的有效性根据实验（处理）组与对照的比较，可以得到处理净效应或净效应差值，但还需要假定各组的干扰（非处理因素）效应（C）是相等的，以及各组效应测量的准确度是相等的。这就是各组干扰以及各组效应测量的可比性问题。简而言之，就是各组除了处理因素不同，所有其他因素应尽可能相同。有可比性的对照，才是有效的对照。 1. 各组干扰（非处理因素）的可比性如果各组干扰（非处理因素）可比（均衡），那么表现出来干扰效应（C）就可比（相等），才可以从组间比较中分离出净效应或净效应差值。保证各组干扰（非处理因素）的可比性，除了人为调整（配比），一个很重要的方法就是随机分配，它使得每个受试者进入各组的概率相等，也就使得干扰（非处理因素）在组间的分配是比较均衡的，样本越大均衡程度越高。 2. 各组效应测量的可比性各组效应测量可比（准确度相等），也是做上述比较的前提。保证各组效应测量的可比，除了客观测量工具或方法保持一致，还应当注意主观测量的一致性以及避免测量中的主观干扰，后两者可以通过盲法测量来实现。第三节统计关联到因果关联一、统计学关联狭义的统计学关联（association）指分类资料的相关（correlation），这主要针对流行病学中较多的分类资料；广义的关联等同于相关。可能病因（暴露）E与疾病D存在统计学关联，只说明E与D的关联排除了偶然性（随机误差）的干扰，并不一定存在因果关联。要确定因果关联，还得排除选择偏倚、信息偏倚和混杂偏倚这些系统误差的干扰，以及确定暴露E与疾病D的时间先后关系。在排除或控制了这些偏倚的干扰后，如果还有统计学关联，或者统计学关联虽然有所改变（增强或减弱）但仍存在，就说明存在真实的关联，可以用因果判定标准进行综合评价，得出不同程度的因果关系结论，包括判断有无因果关系或存在因果关系的可能性。二、因果关联根据概率论因果观，因果关系就是有时间先后的相关关系，也就是病因（暴露条件E）与疾病（D）呈相关，或防治措施与特定效应呈相关。因此，统计学关联（相关）是判断因果关系的基础。但是，统计学关联常常受到各种偏倚的干扰，要断定真实的统计学关联并非易事；另外还需确定关联的时间先后，这也并非想象地那么简单。整个因果关联的判断进程如下：暴露E与疾病D 有统计学关联否？有偏倚否？有时间先后否？（提出假设）（排除偶然）（排除虚假）（前因后果）关联的分类总结如图10-4。图10-4 关联分类总结防治措施与效应的因果关联同病因类似，但一般而言，时间先后关系比较明确，存在的偏倚比较少。第四节因果关联的推断标准一、因果推断标准的发展（一）病因推断标准的发展 1. Henle-Koch原理（1882） Henle-Koch原理作为病因推断标准的第一个里程碑，由Henle（1840）首先提出，Koch后来扩展形成的。原始有4条：(1) 在相应疾病患者中总是能检出该病原体（必要病因）；(2) 在其他疾病的患者中不能检出该病原体（效应特异性）；(3) 能从相应疾病患者中分离到该病原体，传过几代的培养物能引起实验动物患相同疾病（充分病因）；(4) 能从患该病动物中分离到相同病原体。有的书中表达为前3条。Koch补充说：即使某传染病不能传给动物，但只要病原体有规律的和排他性的存在（原理(1), (2)条），就能证实因果联系。该原理应用于传染病，虽然还不甚完备和存在局限性，如仅仅从病原体方面把病因看成是特异的，但是毕竟抛弃了主观臆断，有了客观的判定标准。 2. 美国“吸烟与健康报告”委员会提出的标准（1964）它作为病因推断标准的第二个里程碑，包括5条：(1) 关联的时间顺序；(2)关联的强度；(3) 关联的特异性；(4) 关联的一致性或可重复性；(5) 关联的连贯性或合理性（与现有理论知识吻合）。（二）防治效应推断标准的发展防治效应推断标准的发展从实验设计上大致可分成三个阶段： 1. 单纯时间前后的临床病例观察指对处理前后的比较或仅对处理后的单个或少数病例的临床观察，尤其是在传统医学的临床观察中。17世纪，培根就指出：“通过试验来尝试或证实特定疾病疗法的效果”。当时的因果观强调前因后果的时间关系，但尚未认识到人体实验存在大量非处理因素的干扰，以及少数病例的观察难以排除偶然性的问题。 2. 多病例的分组比较观察指有处理组与比较组的临床观察。18世纪，Berkeley提出对照临床试验的观点。早期的流行病学实验主要是针对病人进行的，如18世纪Lind关于坏血病的治疗试验，19世纪高木兼宽关于脚气病的治疗试验，以及20世纪初Goldberg关于燥皮病的治疗试验。这时的临床试验已经有了控制非处理因素的概念，开始出现初步的数量分析。但是，设置的比较（非处理）组与处理组的可比性不太好，因此还不能称之为严格意义上的对照组。因果推断上比较简单，还不够系统化。 3. 随机化对照临床试验严格意义上的对照组（控制组）必须涉及随机分配，一般认为Hill是随机化对照试验之父。他设计的链霉素治疗肺结核的效果评价方案，于1946年由英国医学研究会实施。随着20世纪70年代临床流行病学的兴起，随机化对照临床试验从框架设计、对象选择、资料分析以及结论推断都达到了系统化，成了防治效应推断的权威标准。另外，类实验设计（非随机化分配）也逐渐精致化，较多地应用于预防试验，后者在随机化分配上存在可行性的问题。这时的因果推断对于内部和外部效度（真实性）有了深入细致的考虑。二、常用的因果推断标准这里的因果推断包括病因推断和防治效应推断。（一）关联的时间顺序（temporal sequence of association）如果怀疑病因（或防治处理）X引起疾病（或防治效应）Y（X→Y），则X必须发生于Y之前，这就是前因后果的时间顺序。即使在不能明确断定X与Y的时间顺序时，也必须存在X先于Y发生的可能性。在确定前因后果的时间顺序上，实验和队列研究最好，病例对照（用新病例）和生态学时间序列研究次之，横断面研究较差。病例对照研究中的病因（暴露）信息来自于过去的记录或询问，它与疾病的时间关系尚不够准确。生态学时间序列研究中，例如伦敦烟雾事件后发生的呼吸道和心血管疾病死亡率上升，欧洲反应停大量上市后发生的海豹短肢畸形，都提示了时间前后关系。如果怀疑病因X与疾病Y在同一时点测量，X与Y的时间顺序就难以确定，如某些横断面研究，或病例对照研究中对两组同时测定血液生化指标。对于慢性病，还需注意考虑病因X与疾病Y的时间间隔。例如，石棉暴露到发生肺癌至少要15～20年，如石棉暴露3年后发生了肺癌，显然不能归因于石棉暴露。防治措施与特定效应的前后时间关系，一般比较明确。（二）关联的强度（strength of association）一般而言，关联的强度越大，该关联为因果关联的可能性就越大。如果一个强关联为混杂因素所致，该混杂因素与疾病的关联将更强，所以这种混杂一般是容易被识别的。另一方面，弱的关联更可能是未识别的偏倚所致。当然，也存在少数特殊的例子，如吸烟与心血管疾病有弱关联但为因果的，唐氏综合征与母亲的产次有强关联但为母亲年龄混杂所致。总之，有时间先后的统计关联说明怀疑病因（暴露）可能为危险因素（流行病学层次的病因），而关联强度越大，是偏倚所致的可能性就越小。防治试验多使用绝对效应或归因比例指标，效应指标越大，防治措施与效应的因果性就越强。关联强度的测定，根据资料的性质或来源可以有： (1) 比值比OR（病例对照研究），相对危险度RR（队列研究），预防分数PF或功效比例（实验研究）等反映分类资料关联的指标。 (2) 剂量反应关系（dose response relationship）针对等级或连续性变量的资料，可用等级OR或RR、各等级的绝对效应、等级相关系数和积差相关系数等。 (3) 生态学相关利用群组（分析单位）资料来计算相关系数，反映分布的一致性。例如，各国（群组）人均脂肪摄入量与大肠癌死亡率的相关系数，各国（群组）纸烟销售量与肺癌死亡率的相关系数，以及各地区（群组）乙肝病毒携带率与肝癌死亡率的相关系数等。但生态学相关的分析需要注意生态学假象的干扰。（三）关联的可重复性（replication of association）指关联可以在不同的人群、不同的地区和不同的时间重复观察到，除非有明确的理由来解释不同的结果。与观察性研究相比，实验性研究的可重复性较好，这是因为实验性研究的控制条件要好得多。某些观察性研究结果之间的差异，有可能是背景条件（其他危险因素）的差异所致。多数研究的可重复性使因果关联的可能性增加，而少数或个别研究的不同甚或相反的结果并不能简单反驳因果假设，但需要仔细探究结果差异的缘由。（四）关联的合理性（plausibility of association）此条标准包括两个方面： (1) 对关联的解释与现有的理论知识不矛盾，符合疾病的自然史和生物学规律，这相当于客观评价。例如，高脂血症与冠心病的因果关联，与冠状动脉粥样硬化的病理证据以及动物实验结果吻合。 (2) 研究者或评价者从自身的知识背景出发，支持因果假设的把握度，这相当于主观评价，即科学家团体的意见。例如，吸烟与肺癌的因果关联，设想化学物质随烟雾吸入及沉积在呼吸系统的组织和细胞上，引起癌变不是没有道理的。对于防治试验而言，防治措施的效应与致病机制相对应，或者与处理的作用机制相吻合。主观评价包括研究论文通过同行评议被发表，研究成果获奖等。当然，这种合理性的判断受到当时科技发展水平以及评价者知识背景和能力的局限。对于大多数研究来说，应当能够经受得起这种“保守的”考验。“革命性的”因果假设或关联结果，刚开始也许是不合理的，但后来被确证为正确的毕竟也是少数，大多数将被淘汰。（五）研究的因果论证强度（demonstrability for causality）因果性研究的设计类型与它的论证强度存在密切关系，一个较好的研究设计类型除了满足上述的时间顺序和可重复性，主要还能较好地控制各类偏倚的干扰，所获结论不易被后来的研究所否定。一般而言，在因果论证强度上，实验性研究大于观察性研究，有对照的研究大于无对照的研究，以个体为分析单位的研究大于以群组为分析单位（生态学）的研究。防治效应的因果性研究最好采用随机化对照试验，对于大人群也尽可能采用非等同对照试验。病因研究最好采用前瞻性队列研究，如果有去除病因的干预试验则更好。当然，研究设计类型的选择同研究所处的进展阶段、研究的资源条件和医学伦理有关。实验性研究尤其需要考虑伦理问题，它有时因为伦理问题难以实行。实验性研究控制偏倚的能力大于观察性研究，研究结论本身更可靠；但是，实验的条件可能脱离真实生活环境，使它推论到现实情况时受限。而观察性研究正因为更接近真实生活环境，使它推论到现实情况时更可信；但是，研究结论本身较容易受到干扰。不同研究设计类型的因果论证强度排序如表10-1 。表10-1 研究设计与因果论证强度研究设计类型因果论证强度实验性研究多个随机化对照试验的系统综述强随机化对照试验多组时间序列试验非等同对照（个体分配）试验中非等同对照（群组分配）试验单组时间序列试验无对照前后比较试验弱观察性研究多个队列研究的系统综述强前瞻性队列研究历史性队列研究巢式病例对照研究多个病例对照研究的系统综述中病例对照研究（用新病例更好）横断面研究（含巢式病例对照研究）生态学研究弱系列病例分析报告（无对照）对于特定的研究设计类型，如果还存在研究者造成的其他具体设计缺陷，因果论证强度还要受到削弱。无论如何复杂的统计分析方法，也不能挽救一个设计差的研究。一个因果研究本身必须要达到第1,2条标准（前因后果，关联强度），第3,4条标准（重复性，合理性）是该研究的外部评价，如果不吻合则因果关联的可信度降低。第5条标准（论证强度）决定了因果关联结论的把握度。三、病因推断标准应用举例下面举一个幽门螺杆菌感染与十二指肠溃疡的例子，说明病因推断标准的应用。 1. 时间顺序的证据 324例幽门螺杆菌感染者，10年中有11%发生十二指肠溃疡，而133例非感染者仅有0.8%发生十二指肠溃疡。说明感染在前，发病在后。 2. 关联强度的证据 90%～100%的该病患者存在幽门螺杆菌感染，OR>10；11%的感染者在10年中发生该病，RR>10；十二指肠溃疡患者的感染密度（每平方毫米胃粘膜）高于非患者；幽门螺杆菌感染率与卫生条件有关，在发展中国家较高（可达50%以上），该病患病率亦较高；该病19世纪患病率达最高峰，而那时卫生条件较差，推测幽门螺杆菌感染率也较高；北澳大利亚某土著人群从未发现有幽门螺杆菌感染，也没有十二指肠溃疡发生；吸烟能增加幽门螺杆菌感染者发生该病的危险，但非感染者或已清除感染者的危险不增加；幽门螺杆菌感染无性别差异，十二指肠溃疡患病率在以前男高于女，但近些年来渐趋接近，这与女性吸烟率增加有关。 3. 可重复性证据许多研究者重复得到相同结果。 4. 合理性证据幽门螺杆菌结合部位在胃窦细胞，它可随着胃窦细胞进入十二指肠，引起炎症，削弱粘膜，使其易于遭受酸的损伤。 5. 实验研究（高论证强度）的证据临床试验中清除幽门螺杆菌可使十二指肠溃疡愈合，其效果等同于组胺受体拮抗剂；用三联抗菌治疗清除该菌后，长期溃疡复发率为零，而用组胺受体拮抗剂治疗，复发率为60%～80%。从以上证据可以判定幽门螺杆菌感染与十二指肠溃疡的发生有因果关联。值得注意的是，某些胃溃疡患者甚至无症状健康人也发现有幽门螺杆菌感染，幽门螺杆菌感染与胃癌也有关联。这再次说明“特异性”标准是无效的。四、防治效应推断标准应用举例下面举一个老年人高血压降压治疗以降低心血管疾病危险和死亡率的例子，说明防治效应推断标准的应用。 1. 时间顺序的证据对于防治试验而言，处理与效应的前后时间顺序是比较明确的。 2. 效应强度的证据降压药物的降血压效应已经有明确评价，这里所指的效应是改善老年高血压病人的预后，即降低心血管疾病危险和死亡率。20世纪90年代初Holzgreve等分析了5个随机化对照临床试验结果，显示老年高血压病人降压治疗可使总死亡率降低20%，使心血管病死亡率降低33%，使致命性心血管意外发生率降低40%，使冠心病发病率降低15% 。McMahon等的meta分析和Lever等的综合分析也得到类似结果。降压治疗还提高了患者生活质量，主要涉及疾病症状、精神健康（焦虑或抑郁反应减轻）、工作和社会能力；其次还包括认知功能、生活满意度、性功能和睡眠质量。1997年完成的高血压最佳治疗（HOT）研究，包括了26个国家18790例高血压病人（50～80岁），该随机化对照试验历时近5年，发现主要心血管事件发生率下降15%（RR=0.85），心肌梗死发生率下降36%（RR=0.64）；针对主要心血管事件最佳舒张压应降至82.6mmHg，最佳收缩压应降至138.5mmHg ，即在该血压值水平时，主要心血管事件发生的危险最小。1999年WHO/ISH高血压指南指出：降压改善预后的效应在随机化对照试验中常被低估，这是因为存在治疗组和对照组的交叉（串组），观察时间平均仅5年（时间延长则效应更明显），以及研究对象多属低危人群。 3. 可重复性证据许多研究者重复得到相同结果（同上述）。 4. 合理性证据高血压本身是一种疾病，又是多种心脑血管疾病的危险因素。以往对老年高血压病人降压治疗是否有益，存在一定困惑。Framingham心脏研究中某38年的观察资料，发现低血压老年人的病死率较高，其实是因为这些人心血管状态本来就不好，进入观察时已经患有心血管疾病，而不是因为低血压本身所致。以往还强调高血压降压治疗中出现的“J型曲线”现象，即过度降压会增加心血管病的危险性。但是，在收缩性高血压老年项目（SHEP）试验中，治疗组舒张压降至68 10mmHg，并未见脑卒中、心血管事件或总死亡率增加的危险。我国进行的脑卒中后的抗高血压治疗试验中，即使血压正常者进一步降低血压，也未见不利影响。HOT研究证实收缩压或舒张压从最佳值进一步降低，不会增加心血管病危险，并没有“J型曲线”存在的证据。 5. 研究设计类型的论证强度上述临床试验均为随机化对照试验，在盲法上是双盲、单盲或开放的，达到较高的论证强度。从以上证据，可以判定老年高血压病人降压治疗可以降低心血管病发生和死亡的危险，可获得多方面的益处，老年人高血压降压治疗的目标水平至少应 < 140/90mmHg（WHO/ISH指南，1999）。（栾荣生）图10-1 流行病学三角（保留5版教材图：page156 图8-5）图10-2 轮状模型（保留5版教材图：page156 图8-6）社会经济因素生物学因素环境因素医学生物学因素疾病心理、行为因素（致病机制）卫生保健因素图10-3 疾病因素模型（保留5版教材图，略有修改：page156 图8-7）图10-4 关联分类总结（保留5版教材图，略有修改：page162 图8-8）

                    本文档为【第10章[1].病因与因果推断(栾荣生)】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

第10章[1].病因与因果推断(栾荣生)

你可能还喜欢