卫生统计学课程辅导2005

卫生统计学课程辅导2005卫生统计学课程辅导2005 一、如何学好卫生统计学课程要想学好《卫生统计学》，就首先要知道它是一门什么学科，也就是说要清楚它有哪些内容，这个它的研究对象是什么, 卫生统计学(health statistics) 是运用数理统计的基本原理和方法，通过数据的收集，整理和分析，研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。它是认识事物数量特征的重要工具。透过事物的偶然性阐明事物的必然规律。对不确定性(偶然性)数据做出科学的推断。我们说卫生统计学是通过收集，整理和分析数据，来研究事物规律性的科学。...

卫生统计学课程辅导2005 一、如何学好卫生统计学课程要想学好《卫生统计学》，就首先要知道它是一门什么学科，也就是说要清楚它有哪些内容，这个它的研究对象是什么, 卫生统计学(health statistics) 是运用数理统计的基本原理和方法，通过数据的收集，整理和分析，研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。它是认识事物数量特征的重要工具。透过事物的偶然性阐明事物的必然规律。对不确定性(偶然性)数据做出科学的推断。我们说卫生统计学是通过收集，整理和分析数据，来研究事物规律性的科学。了解了实用卫生统计学的概念和研究对象后，还要掌握好的学习方法才能做到事半功倍，在有限的时间里顺利如期完成学业。 1(学习和研究实用卫生统计学要从实际出发，这应是我们研究和处理一切问题就应当用卫生统计学的思维的基本出发点。学习了卫生统计学的知识和理论后，方法研究和思考工作和生活中的实际问题。2(卫生统计学是一门应用学科，是用数理学理论和方法研究医学科学领域的生物学规律的一门学科。我们应当认真学习和领悟其科学的思维方法，要养成勤于思考的习惯。3(学习和研究实用卫生统计学还要勤于动手，卫生统计学是一门学科严谨、逻辑性和推断性比较强的学科，学习过程中要勤于动手才能真正掌握。4(实用卫生统计学系统性比较强，学习中还应当善于比较和分析众多概念的异同，应当善于总结和归纳，并且不断温故而知新。第一章绪论一、卫生统计学的定义二、卫生统计资料类型三、统计学基本概念四、统计工作的基本步骤一、卫生统计学的定义随机现象随机现象是指在一次试验或观察时，其结果不确定，而在相同条件下，大量试验或观察其结果呈现某种规律性的现象。数理统计是研究随机现象规律性的一门数学学科。卫生统计学(health statistics) 是运用数理统计的基本原理和方法，通过数据的收集，整理和分析，研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。二、卫生统计资料类型计量资料 1 计数资料等级资料 (一)计量资料用度量衡的方法测定每个观察单位的某项指标，表现为数值的大小，通常是有度量衡单位，属于连续性资料。 (二)计数资料将全体观察单位按照某种性质或类别进行分类，然后分别清点各类别的例数，这样得到的数据称为计数资料，也称分类资料。二分类资料:例如，对某医院做人力资源调查。以每个工作人员作为一个观察单位，按技术人员和非技术人员分为两类。多分类资料:如，观察人群的血型，以人为单位，结果分为A型、B型、AB型、O型，为互不相容的多个类别。 (三)等级资料将全体观察单位按照某种性质或类别分类，各类别之间有程度的差别，分别清点各类中观察单位的个数，这种数据资料称为等级资料。三、统计学基本概念总体样本与随机抽样抽样研究误差概率与频率 (一)总体总体是根据研究目的确定的同质观察单位的全体，更确切地说，是同质的所有观察单位某种变量值的集合。 (二)样本与随机抽样从总体中随机抽取部分个体，其实测值的集合称为样本。随机抽样，就是按照随机的原则获得样本，保证总体中每个个体都有同等机会被抽取，使样本对总体有较好的代表性。 (三)抽样研究从所研究的总体中随机抽取一部分有代表性的样本进行研究称为抽样研究。抽样研究的目的是通过样本信息推论总体特征。 (四)误差误差通常指测量值与真值之差。包括系统误差、随机测量误差和抽样误差。 1(系统误差:又称偏倚不是偶然机遇造成的，而是某种必然因素所致，具有一定的倾向性。观察结果一惯性的往一边偏，要高都高，偏低都低。系统误差一旦发生，统计学是无能为力的，因此要尽可能避免。而大多数系统误差可以通过周密的研究设计得到解决。 2 2(随机测量误差:这种误差是偶然因素所致，故无方向性，如对同一样品多次测定，结果有高有低，不完全一致。随机测量误差是不可避免的。 3(抽样误差:抽样研究所抽取的样本，只包含总体中的部分个体，由于存在个体变异，样本指标往往不等于总体参数，这种差异是由抽样造成的，称为抽样误差。 (五)概率来表示。随机事件的概率在0概率是描述随机事件发生的可能性大小的指标，用P 与1之间，常用小数或百分数表示。P越接近1，表明某事件发生的可能性越大，P越接近0，表明某事件发生的可能性越小。小概率事件:随机事件P,0.05或 P,0.01，分别表示事件发生的可能性等于或小于0.05(5%)和可能性等于或小于0.01(1%)，在一次试验或观察时发生的可能性很小，习惯上称为小概率事件。 (六)频率若随机事件在n次重复中出现m次，则n/m比值成为随机事件出现的频率。当n充分大时，随机事件的频率接近概率。四、统计工作的基本步骤 (一)设计 (二)收集资料 (三)整理资料 (四)分析资料统计工作包括设计、收集资料、整理资料、分析资料四个基本步骤。这四个步骤之间紧密联系，环环相扣。一定不要只在分析结果时才想到统计。大家在今后的学习中会发现，统计分析方法是建立在研究设计和分析目的基础上的。 (一)设计研究分析的总设想。包括专业设计和统计设计，也就是除了专业方面的研究目的技术路线外，还包括抽样方法、样本含量等。需要强调的是良好的设计是统计分析的基础。 (二)收集资料资料必须完整、正确和及时。要有足够的数量。注意资料的代表性和可比性。代表性是指样本能很好的代表总体。应遵循随机化原则抽取样本。可比性是指在统计比较时，对比的各组之间，除观察问题或实验因素不同外，其它条件都要求尽量一致。 (三)整理资料原始资料的检查与核对资料的分组设计和归纳汇总 (四)分析资料统计描述:用一些统计指标，统计图表等方法对资料的数量特征和分布规律进行测定和描述。统计推断:用样本信息推断总体特征，包括参数的估计和假设检验。 3 本章为大家介绍了卫生统计学的定义、卫生统计资料类型、统计学基本概念和统计工作的基本步骤。第二章计量资料的统计描述计量资料的频数表第一节一、频数表计量资料需编制频数分布表，频数表编制的步骤参见《实用卫生统计学》第二章第一节中的内容，频数表包括一些有序的组段及落在各或组段内的观察值的个数即频数。从而了解资料的特征和分布类型。二、频数分布两个特征:集中趋势和离散趋势。三、频数分布类型 1(对称分布:是指集中位置在正中，左右两侧频数分布大体对称的分布。 2(偏态分布:偏态分布是指集中位置偏向一侧，两侧频数分布不对称。如果集中位置偏向数值小的一侧，称为正偏态分布;若集中位置偏向数值大的一侧，则称为负偏态分布。 3(对数正态分布:有些偏态分布的资料，其原始数据经过对数转换后(如用原始数据的对数值lgX代替X)服从正态分布，称为对数正态分布。第二节描述集中趋势的指标描述计量资料集中趋势常用的指标有均数，几何均数，中位数。一.算术均数(arithmetic mean) 简称均数。常用μ表示总体均数，用表示样本均数。均数反映一组观察X 值在数量上的平均水平。 (一)均数的适用条件适用于对称分布尤其是正态分布资料。 (二)均数的计算 1(直接法 XXXXX++++,,,,123n (2.1) X=,nn 2(加权法(weighting method) fXfXfX，，,,,，,fX1122kk (2.2) X,,ffff，，,,,，,12k 对已绘制频数表的资料，也可用加权法求均数。这时用各组段的组中值作X，组中值为本组段的下限与下一个组段的下限相加再除以2。二、几何均数(geometric mean) 几何均数用符号G表示。 (一)适用条件 1(等比资料，如医学上血清抗体滴度，人口几何增长等资料。 2(对数正态分布资料(有些偏态分布的资料，原始数据经过对数转换后服从正态分布)，如疾病的潜伏期等资料。 4 (二)几何均数的计算 1(直接法当样本量n较小时，常用直接法求几何均数。其对数形式为 lglglgXXX，，,,,，,lgX,,1112n (2.4) G,,lg()lg()nn 2(加权法当资料中相同观察值个数较多时，或频数表资料，可用下式计算 ,fXlg,1 (2.5) G,lg(),f 公式中X为各组的效价或滴度的倒数(等比资料时)或各组的组中值(对数正态分布资料时)，f为各组的频数。三、中位数(median) 用M表示，它是指一组由小到大顺序排列的观察值中位次居中的那个观察值。 (一)中位数的适用条件 (偏态分布资料。 1 2(分布类型不明确的资料。 3(资料的一端或两端无确定数据不能求均数和几何均数时，可求中位数。 (二)中位数的计算 1(直接法当观察值个数n较小时，可直接由原始数据求中位数。先将观察值由小到大顺序排列，再按公式(2.6)或(2.7)计算。 MX, n为奇数时， (2.6) n，1()2 ，， n为偶数时, (2.7) MXX/2,，nn,,()(1)，22，， 2(频数表法当观察值例数较多时，先将观察值归纳成频数表，按组段由小到大计算累计频数和累计频率，再按公式(2.8)计算中位数。 in (2.8) ()MLf,，,,L2fM 公式中L为包括中位数(即累计频率为50%)的那个组段的下限，i为该组段的组距，f为该组段的频数，?f小于L的各组段的累计频数，n为总例数。 ML 第三节描述离散趋势的指标描述离散趋势常用指标有极差、四分位数间距、方差、标准差和变异系数，其中以方差和标准差最为常用。一、极差(range，R) 极差=最大值-最小值。用极差描述变异度大小，简单明了。缺点为:?除最大值和最小值外，不能反映组内其它数据的变异度。 5 ?易受个别特大值、特小值的影响，即不够稳定。 ?即使样本例数不变，极差的抽样误差亦较大。二、四分位数间距(quartile interval，Q) QQQPP,,,, (2.10) UL7525 它也可被看成是中间一半观察值的极差。它和极差类似，仍未考虑到每个观察值的变异度。但它比极差稳定。它适用于任何分布资料，主要用于偏态分布资料，特别是末端无确定数据的越大，数据分布的变异度越大。资料。Q 三、方差(variance)和标准差(standard deviation) (一)(方差为克服极差的缺点，需全面考虑每个观察值的离散情况，就总体而言，应考虑总体中每个观察值(变量值)X与总体均数μ之差，称为离均差X-μ。由于X-μ有正有负，相互抵消，这样就不能反映变异度大小，故将离均差平方后再相22加，即?(X-μ)，称为离均差平方和。但?(X-μ)大小，除了与变异度有关外，2还与观察值的个数N的多少有关。即使两总体变异度相同，N大则?(X-μ)亦2大。为消除这一影响，求其平均来描述离散趋势，这就是总体方差，用符号б表示。 2,,()X,2 (2.11) ,,N 实际工作中，很难得到总体均数μ和总例数N，常需根据样本均数X和样本 2 例数n，计算出样本方差，用样本方差估计总体方差。样本方差用s表示。样本2方差s的公式为 2,,()XX2 (2.12) s,n,1 公式中n-1，在统计学上称为自由度(degree of freedom)。 22б或s越大，观察值的变异度越大，即离散程度越大。方差适用于描述对称分布，尤其正态分布资料的离散趋势。 (二)(标准差方差的单位是原来测量单位的平方，为了使用原测量单位，常将方差开平方，这就是标准差。总体标准差用符号б表示，样本标准差用符号s表示。 2,,()X,总体标准差 (2.13) ,,N 2,,()XX样本标准差 (2.14) s,n,1 1(标准差适用条件:对称分布资料，尤其正态分布资料。 2(标准差的意义:标准差可反映全部个体观察值的离散程度，标准差越大，观察值的变异越大，数据越分散，均数的代表性越差。标准差越小，说明资料离散程度小，资料较集中，均数的代表性好。 6 3(标准差的计算有直接法和加权法 222 (1)直接法数学上可证明，在计算标准差时，,,,,,,()()XXXXn 可直接将原始数据代入公式(2.15)，从而使得计算更为方便。 22,,,XXn() (2.15) s,n,1 )加权法频数表资料可用加权法计算标准差，公式如下 (2 22,,,fXfXn() (2.16) s,n,1 四、变异系数(coefficient of variation，CV) X与均数之比用百分数表示，公式为变异系数为标准差s s (2.17) CV,，100%X 变异系数常用于: 1.度量衡单位不同的多组资料的变异度的比较。例如，欲比较身高和体重何者变异度大，由于度量衡单位不同，不能直接用标准差来比较，而应用变异系数比较。 2(比较均数相差悬殊的多组资料的变异度。第四节正态分布及其应用一、正态分布的概念和特征 (一)(标准正态变换和标准正态分布为应用方便，常将服从正态分布的原始变量X,N(μ,б)进行变量变换 X,, (2.19) u, , 这种变换叫标准正态变换(或u变换)。u 称为标准正态变量，它服从均数为0，标准差为1的标准正态分布，即u,N(0，1)。通过标准正态变换，可将正态分布变换为标准正态分布。标准正态分布的密度函数如下 21,u/2,ue, ,< u<， (2.20) () 2, 为标准正态分布的密度函数，即纵坐标高度。根据u 的不同取值，就可按,()u 公式(2.20)，绘出标准正态分布的图形。二(正态曲线下面积的分布规律实际工作中，经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数，用以估计该区间的观察例数占总例数的百分数，或变量值落在该区间的频率或概率。 (一)(正态分布及标准正态分布曲线下的面积 7 正态曲线下横轴上一定区间的面积可以通过对公式(2.18)积分来求得，然而对该公式的积分有时是很困难的。标准正态曲线下的面积可通过对公式(2.20)积分求得，即 u21,/2u (2.22) ,,uedu(),,,,2 可得到标准正态曲线下，横轴上自,到u 的面积，即下侧的累计面积(概率)。统计学家已按公式(2.22)求积分，并编制出标准正态分布表(附表1)，我们可以通过查表求出标准正态曲线下某个区间的面积。在实际应用中，对于服从正态分布的数据，只需通过变量变换把正态变量X变换为标准正态变量u，然后再查标准正态分布表，就可很容易地得到正态曲线下某个区间的面积。 (二)(标准正态分布表(附表1) 1(标准正态曲线下横轴上的总面积为1或100%。 2(标准正态曲线以0为中心，左右完全对称，所以曲线下对称于0的区间面积相等，因而附表1只列出, (-u)值(即-到-u的面积值)。横轴上从u = -1.96 到u = 1.96 的区间所对应的曲线下面积为95%;从u = -2.58 到u = 2.58的区间所对应的曲线下面积为99%;从u = -1.64 到u = 1.64 。的区间所对应的曲线下面积为90% 3(对于服从正态分布的资料，若求曲线下任意(X,X)区间的面积,可先将12 已知变量X和X作标准化变换(u变换)，然后借助标准正态分布表求得。当正12 X,,态分布μ和б已知时，，再查表求出相应的面积。若μ和б未知，但u, , 样本量足够大，常用样本均数和标准差s分别代替μ和б，进行u变换，X XX,，再查表求出相应的面积。 u,s 三、正态分布的应用多医学现象服从正态分布或近似正态分布，如身高、体重，同性别健康成人的红细胞、血红蛋白含量、胆固醇含量等，以及实验中的随机误差等均服从正态分布，可按正态分布的规律来进行统计处理。对于一些对数正态分布资料，亦可接正态分布规律处理。 (一)(医学参考值的估计参考值范围又称正常值范围。医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。制定考值范围，应从以下几个方面考虑: (1)首先需要确定一批样本量足够大的“正常人”。 (2)根据研究目的，选择适宜的百分界值，最常用的是95%。 (3)根据指标的实际用途确定单侧或双侧界值。 (4)根据资料的分布特点，选用恰当的界值计算方法。可参阅表2.6。表2.6 医学参考值范围的制定 % 正态分布法百分位数法 8 单侧单侧双侧双侧下限上限下限上限 -P P P P595109090 Xs,1.28Xs，1.28Xs,1.64 -P P P P2.597.559595 Xs,1.96Xs,1.64Xs，1.64 -P P P P0.599.519999 Xs,2.58Xs,2.33Xs，2.33 (二)(质量控制。控制实验误差，常以作为上、下警戒值，以作为XS,2 上、下控制值，这里的2S、3S分别是1.96S和2.58S的近似值。 XS,3 第三章计数资料的统计描述我们已经知道，计数资料是先根据事物的性质或属性分类，然后通过清点得到每一类别的例数。绝对数是统计分析的基本数据。但是绝对数不便于比较。为进一步分析现象间的关系，常需用相对数指标来描述。相对数是由两个有联系的数据之比所组成。第一节常用相对数常用的相对数有率、构成比和相对比。一、构成比又称构成指标，它表示事物内部各组成部分所占的比重或分布。常用百分数表示构成比有两个特点: (1)各部分构成比之和为100,或1。(2)某一部分所占的比重增大，其它部分的比重会相应减少。二、率又称频率指标，说明某现象的发生频率或强度。比例基数可依据使用习惯或保留位数来选择。三、比又称相对比。是A、B两个有关联指标之比，相对比中A、B两指标可以是性质相同的，也可以是性质不同的。可以是绝对数，也可以是相对数或平均数。 9 第二节应用相对数时的注意事项一、构成比与率应用时不能相互混淆。构成比说明事物内部各组成部分所占的比重，而率则说明某事物或现象的发生频率或强度。常见的错误之一是以构成比代替率来说明问题。二、样本含量太小时，不宜计算相对数一般来说观察单位足够多时，计算的相对数比较稳定，能够正确反映实际情况。观察单位少时，偶然性大。观察例数少，最好用绝对数来表示。三、对各组观察例数不等的几个率，不能直接相加求其总率四、在比较相对数时应注意资料的可比性可比性是指对研究结果有影响的非处理因素在各处理组之间应尽可能相同或相近。因为影响结果的因素往往是多方面的，只有控制了其它方面因素的影响才能正确反映处理因素的效应。在实验性研究中，设计和实施阶段均应注意可比性。在观察性研究中，在资料分析时应注意可比性。同样需要考虑可比性问题。但在观察性研究中由于研究者不能采取随机分配的方法来平衡或消除非研究因素对研究结果的影响，同时也不能控制实验条件。因此，在比较研究结果时(如比较不同组的率时)，应考虑影响率的其它因素在各组间构成是否相同。第三节率标准化法率标准化法的基本思想就是采用统一的标准人口构成，以消除人口构成不同对人群总率的影响，使算得标准化率具有可比性。推而广之，两人群发病率、死亡率、出生率、病死率等的比较，常考虑人群性别、年龄等构成的影响，需对率进行标准化。二、标准化率的计算常用的计算方法有:直接法和间接法。应根据现有数据的条件选用直接法或间接法。 (一)直接法计算标化率需要的条件 1(资料条件:已知实际人群的年龄别(组)率，且各年龄组率无明显交叉。年龄组率的交叉是指低年龄组率甲人群高于乙人群，而高年龄组率则乙人群高于甲人群。 10 2(选择标准人群:可选择标准人群的年龄组人口数或构成比。理论上用同一标准人群的年龄组人口数和用其构成比算得的标化率结果应相同，但由于运算中四舍五入的影响可能结果稍有出入。标准人群的选择 (1)可根据研究目的选择有代表性的、较稳定的、数量较大的人群。 (2)选择相互比较的人群合并数据作标准。 (3)选择相互比较的人群之一作标准。 (二)应用标准化法的注意事项 1(标准化只能解决不同人群内部构成不同对其总率有影响的情况，标准化法不能解决所有可比性问题。 2(标化率，已经不再反映当时当地的实际水平，它只表示相互比较的几组资料间的相对水平。 3(由于选择的共同标准不同，计算出来的标准化率会有所不同，但相互比较资料间的相对水平不变，即不论采用何种标准，高者总高，低者总低。标化率仅限于采用共同标准进行标化的组间比较。 4(各年龄组率间若出现明显交叉，如低年龄组死亡率，甲人群高于乙人群，而高年龄组死亡率则乙人群高于甲人群，此时宜比较年龄组死亡率，而不用标准化法。第四节动态数列及其分析指标动态数列是一系列按时间顺序排列起来的统计指标，包括绝对数、相对数或平均数，用以说明事物在时间上的变化和发展趋势。一、绝对增长量 (一) 累计增长量:各年数据减去最初始年数据说明事物在一定时期的绝对增长量。 (二)逐年增长量:即下一年数据减上一年数据。说明相邻两年的绝对增长量。二、发展速度 (一)定基发展速度:以初始数据作基数，以各时间数据与之相比(或×100,)。 11 定基发展速度可以反映事物在一定时期的发展速度。 (二)环比发展速度:以前一个时间(年)数据为作基数，以相邻的后一时间(年)数据与之相比。环比发展速度表示年度之间的波动或发展速度。三、增长速度增长速度,发展速度,1 (一)定基增长速度:定基发展速度,1。表示与初始年相比，一定时期的增长速度。 (二)环比增长速度:环比发展速度,1。表示与前一个时间相比的增长速度，即年度之间的增长速度。四、平均发展速度和平均增和速度平均发展速度，说明一定时期的平均发展速度。平均增长速度,平均发展速度,1 说明一定时期的平均增长速度。第四章统计表与统计图统计表与统计图是统计描述的重要工具。统计表与统计图来表现资料的数量特征及分布规律。统计图是以各种几何图形显示统计数据的大小、升降、分布、结构以及关系等。第一节统计表统计表是将统计指标及数据以表格的形式列出。一、制表原则 1(重点突出，简明扼要。 2(主谓分明，横竖标目的排列要合理。 12 二、统计表的设计 (一)统计表的结构及基本要求统计表由标题、标目、线条、数字四部分构成。 1. 标题:用一句简明扼要的话来说明表的内容，必要时注明资料的时间和地点，写在表的上方。 2. 标目:标目是用以指明表内数字含义的。有横标目和纵标目，必要时可以设计总标目。横标目位于表的左侧，用来指明表内同一横行数字的含义，它在表中作主语，表示被研究事物。纵标目则用来指明表内同一纵列数字的含义，它在表中作谓语，表示被研究事物的各项统计指标。如果将横纵标目连在一起阅读，可以组成一句完整而通顺的话。 3. 线条:统计表中对线条的基本要求是力求简洁，除必须绘制的顶线、底线、标目线之外，应尽量减少其它不必要的线条。在表中如果设计有总标目，并有合计栏的话，也可以对其绘制相应的线条，称为总标目线和合计线。 4. 数字:表内数字是统计表的基本语言，必须准确无误。数字的小数位数应一致，位次对齐。表内不宜留空项，数字为零者用“0”填入，暂缺或未记录用“…”填入，无数字用“一”表示。 5. 备注:不是统计表的必要结构，一般不列入表内，需要说明某一项目时用“*”标记，将备注写在表的底线下方。根据制表原则和基本要求学会对统计表的修改。第二节统计图统计图是以点的位置、线段升降、直条长短或面积大小等几何图形，将被研究事物的数量特征、内部构成、相互关系等形象地表达出来。其作用是将要说明的问题形象化，使人一目了然，印象清晰，容易理解。一、制图的基本要求: 1. 根据资料的性质和分析目的，选择合适的图形。 2. 要有标题:要求能简明扼要地说明图的内容，必要时写明地点、时间。标题写在图体下方的中央位置。 3. 绘制有坐标轴的图形时，纵、横轴所代表的事物名称要说明，并标注单位，纵横轴的长度比例要合适，通常以5:7为宜。 13 4. 在同一张图内比较不同事物时，须用不同颜色或线条区别表示，并附图例说明。摆放图例的位置要与图体协调。二、各种类型的统计图及绘制方法: 卫生统计常见的统计图有:普通线图、半对数线图、直条图、直方图、圆图、百分条图和散点图等。根据分析目的并结合资料的性质来合理选择统计图。 1. 普通线图: 普通线图是用线段的升降来表示某事物随时间推移的发展变化情况，或某现象随另一现象变迁的情况。 (1) 适用资料:随时间变化的连续性资料。 (2) 分析目的:用线段的升降表示某事物在时间上的发展变化趋势。 2. 半对数线图: 半对数线图是用线段的升降来表示某事物的发展速度。 (1) 适用资料:适用于随时间变化的连续性资料，尤其比较数值相差悬殊的多组资料时采用。 (2) 分析目的:半对数线图中线段的升降是用来表示事物发展速度。若两组数据对应的线段平行上升或下降，表示它们的发展变化速度一致。 3. 直条图: 直条图是用等宽直条的长短来表示相互独立的各指标的数值大小。有单式和复式直条图两种。 (1) 适用资料:各自独立的分类资料。 (2) 分析目的:用等宽直条的长短表示各指标数值的大小。 (3) 绘制时注意纵轴应从零开始，中间不要折断。直条宽度、间隔应当相等。按顺序进行排列、以便比较。 4. 直方图: 14 直方图又称频数分布图, 它是用面积表示某个连续变量的频数分布。 (1)适用资料:连续性变量资料。 (2)分析目的:表示连续变量的频数分布。 3)绘制时要求:横轴为连续性变量，纵轴为频数或频率，以各矩形的面 ( 积来表示。要求组距相等，各矩形间不留空隙。 5. 圆图和百分条图: 圆图和百分条图都是用于表示某事物中各部分所占的比重。 (1) 适用资料:两种统计图都适用于构成比资料。 (2) 分析目的:表示事物内部各部分的所占的比重或分布。 6. 散点图: 散点图是用点的密集程度和趋势表示两种现象间的相关关系。 (1) 适用资料:两变量资料。 (2) 分析目的:表示两种事物变化的相关性和趋势。 15 第五章单个样本数据的参数估计一、均数(率)的抽样误差在同一总体中随机抽取样本含量相同的若干样本时，样本指标之间的差异以及样本指标与总体指标的差异，称为抽样误差。统计学上，由于抽样而产生的同一总体中均数之间的差异称为均数的抽样误差，率之间的差异称为率的抽样误差。在抽样研究中，抽样误差是不可避免的，只要存在抽样，就有抽样误差;因为抽样误差产生的根本原因是客观存在的个体变异。 (一)样本均数标准误从正态总体N(,, ,2)中，随机抽取样本含量为n的若干样本，各样本均 2,XXX数的分布服从正态分布N(,,)，各样本均数的总体均数为, ，标准差,,XX为。可按下列公式计算 ,,,Xn ,X为样本均数的标准差，又称为标准误，它反映了样本均数之间的离散程度，也反映了均数抽样误差的大小。在实际应用中，总体标准差, 常常未知，需要用样本标准差s来估计。因此均数标准误的估计值为 ss,Xn 由公式，当样本含量n固定时，均数的标准误与标准差成正比;当标准差固定时，均数的标准误与样本含量n的平方根成反比，即在同一总体中随机抽样，样本含量n越大，抽样误差越小。所以在实际工作中减小均数抽样误差的一个重要途径是增加样本含量n。 (二)率标准误从一个阳性率为 , 的总体中，随机抽取样本含量为n的若干个样本，得到各样本率之间的差异以及样本率与总体率的差异，用率的标准差，又称率的标准误来描述。样本率p 的标准差，它反映了样本率之间的离散程度;也反映了率抽样误差的大小。在实际应用中，总体率, 常常未知，需要用样本率p作为总体率 , 的估计值。二、t分布的特征 t 分布是一簇曲线，因为t值的分布与自由度, 有关。其图形有如下特征: 以0为中心，左右对称的单峰分布。自由度, = n,1越小，则t值越分散，曲线变得越低平，尾部翘得越高。 ?随着自由度, 逐渐增大时，t分布逐渐逼近标准正态分布;当, 趋于, 时， 16 t分布就完全成为标准正态分布。 t界值表与自由度 , 有关。在相同自由度时?t?值越大，概率P越小;在相同t值时，双侧概率P为单侧概率P的两倍。三、参数估计的概念抽样研究的目的是用样本的信息推断总体特征，这叫统计推断。统计推断包括:参数估计和假设检验。参数估计是指用样本指标(称为统计量)估计总体指标(称为参数)。用样本均数估计总体均数以及用样本率估计总体率。点估计直接用样本的统计量估计总体参数的估计值的方法称为点估计。点估计的方法简单，但缺点是没有考虑抽样误差，而抽样误差在抽样研究中是不可忽视的。区间估计区间估计:按一定的概率估计总体参数所在的范围的方法。可信区间:总体参数的所在范围，该区间以一定的概率(如95%或99%)包含总体参数。四、可信区间的计算总体均数可信区间的计算根据总体标准差, 是否已知及样本含量n的大小，总体均数可信区间的计算有t分布和u分布(标准正态分布)两种方法。 t分布方法当总体标准差,未知时，根据t分布的原理得到总体均数可信区间为 sssXXXXXX(,t,/2, , ，+ t,/2, ,)或缩写为, t,/2, , u分布方法 (1)当总体标准差, 已知时，根据u分布的原理得到总体均数可信区间为 ,,,XXXXXX(,u,/2，+ u,/2)或缩写为, u,/2 ,,XXXX即总体均数的95%可信区间为,1.96，99%可信区间为,2.58。 (2)当, 未知但n足够大时(n , 50)，t分布近似u分布，可以用u,/2代替t,/2, ,，总体均数可信区间为: sssXXXXXX(,u,/2，+ u,/2)或缩写为, u,/2 ssXXXX即总体均数的95%可信区间为,1.96，99%可信区间为,2.58。总体率可信区间的计算根据样本含量n和样本率p的大小，可以采用查表法和正态近似法。第六章样本均数比较的假设检验 17 一、假设检验的基本原理和基本步骤建立检验假设，确定检验水准 1.建立检验假设: μ=μ0，两总体均数相等。 ?无效假设，H0。例6.1 H0: ?备择假设，H1。例6.1 H1:,,,0，两总体均数不相等。有时为单侧检验。 2.确定检验水准:检验水准，,。, 是预先规定的概率值，它是“是否拒绝H0的界限”。研究者可以根据研究目的规定,的大小，通常,取0.05。选定检验方法，计算检验统计量要根据统计推断的目的、研究设计的类型和样本量的大小等适用条件，选用不同的检验方法和计算相应的统计量。 3.确定P值，作出推断结论 P值是指从H0所规定的总体中作随机抽样，获得等于及大于(或等于及小于)现有样本的检验统计量值(如t值或u值)的概率。将概率P与检验水准,比较，从而得出结论: 当P , , 时，按所取检验水准,，拒绝H0，接受H1。结合实际资料作出推断。这样作出结论的理由是:在H0成立的条件下，出现等于及大于现有检验统计量值的概率P , ,，是小概率事件，这在一次抽样中是不大可能发生的，即现有的样本信息不支持H0，因而我们拒绝它。当P , , 时，按所取的检验水准,，尚不能拒绝H0。结合实际资料作出推断。一般是将计算得到的检验统计量与相应的统计用表(见附录)中的,对应的临界值比较，确定P , ,或P , ,。 t检验和u检验 t检验的适用条件: 样本含量n较小时，理论上要求样本来自正态分布的总体。完全随机设计的两个小样本均数比较时还要求两总体方差相等。但在实际应用时，与上述条件略有偏离，对结果也影响不大。习惯规定样本含量小于或等于50(n, 50)为小样本。 u检验的适用条件: 总体标准差, 已知(该情况不常见)。当总体标准差,未知，但样本含量n较大(一般n, 50)。选用u检验。u检验在手工计算时的方便之处是计算结果不用查u界值表，只要记住几个常用的u界值。二、t检验 (一)样本均数与已知总体均数比较的t检验又称为单样本t检验。“已知总体均数”一般为理论值、标准值或经过大量观察所得到的稳定值等。令已知总体均数为,0，样本均数所代表的未知总体均数为, ，假设检验的目的:推断样本均数所代表的未知总体均数, 与已知总体均数,0是否相等(双侧检验)。 (二)、完全随机设计的两样本t检验又称为成组t检验或两个独立样本t检验。完全随机设计是指分别从两个研究总体中随机抽取样本，目的是推断这两个独立样本所代表的未知总体均数,1与,2是否相等。 18 在作t检验之前，理论上应先检验相应的两总体方差是否相等，即一般先作方差齐性检验。若两总体方差相等，可以采用两样本t检验; 若两总体方差不等，则可以采用以下方法: tˊ检验; ? ?变量变换所谓变量变换是将原始数据作某种函数转换(如转换为对数值等)，可使转换后的资料达到方差齐性，再作完全随机设计的两样本t检验; ?秩和检验。 (三)、配对t检验适用于: (1)配对设计:根据某些条件选择实验对象，使每一对两个个体在这些条件尽尽可能相同或相近，更好的保证可比性。再随机将两个个体给予不同的处理。 (2)同一受试对象接受不同的处理(如同一份标本分成两部分)。配对设计的目的是推断两种处理结果有无差别。 (3)同一受试对象处理前后的结果进行比较。严格来说，自身对照设计有其相应的统计学方法，但在这里仍然可以用配对t检验方法。配对t检验的基本原理:假设两种处理结果无差别，则同一对子中不同处理的差值d的总体均数,d应为0(,d = 0)。若差值的总体均数,d不为0(,d , 0)，则说明两种处理的结果有差别。因此配对设计假设检验的目的是检验差值的总体均数,d是否为0。三、u检验 (一)、样本均数与已知总体均数比较的u检验 X,,0u, /n,1(当总体标准差,已知时， X,,0u, sn/2(当总体标准差,未知，n较大时， (二)完全随机设计的两样本u检验用于总体标准差,未知且两样本含量较大时的两样本均数比较，目的是推断两总体均数是否不同。检验统计量u值的计算公式如下 XX,12u,22ss12，nn12 四、假设检验的注意事项 1、良好的设计是假设检验的前提统计学处理的主要是抽样误差，设计和实施时造成的偏倚统计学无能为。 2、选择的假设检验方法应符合其应用条件根据研究设计类型检验目的和资料的性质选择检验方法。计量资料根据总体 19 标准差是否已知或样本量大小选择u 检验或t检验。根据设计类型选配对t或u检验及成组的t或u检验。 3、正确理解假设检验过程中，样本均数与总体均数的关系假设检验是通过对样本信息的比较，推断他们代表的总体是否有差异。如对两个样本均数的比较，推断他们所代表的总体均数是否不同。其假设及结论都是关于总体的。 4、正确理解“差别有统计学意义”的含义 P , , 时，按所取检验水准,，“拒绝H0，接受H1”，称为差别有统计学意义。可认为两个总体均数不同;不能直接回答差异的大小，并不意味着两个总体均数相差很大。差别的大小及差别有无实际意义只能进一步根据专业知识来确定。 P , , 时，称为差别无统计学意义，尚不能认为两个总体均数不同。五方差分析两个样本均数的比较，用t检验,两个及两个以上均数的比较用方差分析。方差分析的基本思想方差分析的基本思想就是根据资料设计的类型及研究目的，将总变异分解成两个或多个部分。每个部分的变异可由某因素的作用来解释，通过比较可能由某因素所致的变异与随机误差的均方，从而了解该因素有无作用。方差分析的适用条件是:? 各处理组样本来自正态总体 ?各样本是相互独立的随机样本 ?各处理组的总体方差相等，即方差齐性。第七章样本率(或构成比)比较的假设检验第一节样本率与总体率比较的u检验样本率与总体率(一般为已知的理论值、标准值或经大量观察所得到的稳定值等)比较的目的，是推断该样本所代表的未知总体率π与已知总体率π是否0不同。 u检验的适用条件:当样本含量n足够大，且样本率p和(1,p)均不太小，如np 与n(1,p)均大于5时，样本率的分布近似正态分布，此时样本率与总体率差别的假设检验可利用正态分布的原理作u检验。第二节两个样本率比较的u检验当两样本含量n及n足够大，且两个样本率p、(1,p)及p、(1,p)121122均不太小，如n p和n(1- p)及n p和n(1- p)均大于5时，可根据正态分布11112222 原理，进行u检验。 2第三节四格表资料的χ检验 (两个样本率比较) 20 一、两个样本率资料的四格表形式 21、χ检验的基本思想 22 χ值反映了实际频数和理论频数的吻合程度。χ值越小，说明实际频数与理 2论频数越吻合，χ值越大，说明实际频数与理论频数差异越大。如果检验假设成 2立，则实际频数与理论频数之差一般不会很大，即出现大的χ值的概率是小的。 2若在无效假设下，出现了大的χ值的概率P?α(检验水准)，我们就怀疑假设的 22成立，因此拒绝它。另外χ值的大小，还与自由度有关。故考虑χ值大小的意义时要同时考虑自由度。 22 若χ?χ), 则P?a, 拒绝H，接受H。 a,,(υ01 22、四格表χ检验的的校正公式 (1)当自由度为1的四格表资料，理论数较小时，需做连续性校正。 2(2)四格表χ检验的适用条件 2 当n>40，且所有T?5时，用χ检验的基本公式或四格表专用公式。 2 当n>40，但有10，Y随X增大而增大; b<0，Y随X增大而减小; b的统计学意义是X每增加(减)一个单位,Y平均改变b个单位。 23 a, b的估计是依据最小二乘法原理，可保证各实测点到回归直线的纵向距离的平方和是最小。三、样本回归系数b的假设检验样本回归系数b的假设检验可以采用t检验，在对样本回归系数b进行假设检验时需要计算统计量t值，其计算公式如下 b 第三节直线相关与回归的区别与联系一、区别相关与回归的意义不同:相关反映观察两变量间是否存在直线相关关系，如果有，则根据相关系数确定两变量间的相互关联方向以及相关密切程度。而回归反映两变量间的线性依存关系，即由自变量X来估计因变量Y。二、联系 1. 对同一批资料，相关系数r与回归系数b的符号相同。r为正(或负)则b为正(或负)，均表示X与Y呈同向(或反向)变化 2. 对同一批资料，相关系数r与回归系数b显著性检验结果是等价的，有t=t的关系。 rb 24 第二节应用直线相关与回归时的注意事项 1. 作相关与回归分析要有实际意义。切不可把毫无关联的两个事物或现象用来作相关和回归分析。 2. 相关关系不一定是因果关系，而有可能是伴随关系。要确认事物间的因果关系，必须通过深入的流行病学调查并综合各项实验研究，从专业理论方面加以论证。 3. 对相关系数r经假设检验后，认为两变量有相关关系。根据相关系数的大小来判断相关的密切程度。 4. 概率P值的理解。相关的密切程度高低，需要在相关系数具有显著性的前提下，凭相关系数绝对值的大小去判断。 5. 直线相关、回归分析的结果不能随意外推。 6. 回归方程使用有一定的条件，建立回归方程的条件(时间、地点、方法、测量仪器等等)一旦改变，原回归方程就不宜继续使用，而应建立新的回归方程取代之。第三节等级相关等级相关(rank correlation)又称为秩相关，是用等级数据作直线相关分析，属于非参数统计方法的一种。简单直线相关所分析的资料要求X、Y均为随机变量且服从双变量正态分布。而实际工作中并非所有的数据都能满足简单直线相关的资料要求，这时要分析两变量的直线相关关系可以考虑作等级相关。等级相关分析适用于下列资料:?不服从双变量正态分布而不宜作简单直线相关分析;?总体分布类型未知;?原始数据是用等级表示。第十章常用综合评价方法第一节概述一、基本概念综合评价:综合考察多个有关因素，依据多个有关指标进行总评价的方法。二、综合评价的一般步骤 1、选择恰当的评价指标。考察各指标间的内在联系，选择那些能反映事物本质的评价指标，这些指标应当明确、具体、可行、可靠。 25 2、制定评价标准。 3、确定各指标的权重。 4、确定各单个指标的评价等级及其界限。 5、选择适当的综合评价方法。根据已掌握的历史资料，建立综合评价模型。 6、确定多指标综合评价的等级数量界限。三、评价指标的筛选 (一)、选取评价指标的原则 1、目的明确、 2、比较全面。 3、切实可行 4、区别能力 5、独立性 (二)、评价指标的筛选方法在实际工作中，我们往往综合使用多种方法进行指标筛选，在获得较为满意的专业解释的基础上，优先考虑那些被多种方法同时选入的指标。 1、“系统分析法”，专家对不同类别的指标进行评价，从中挑选主要的指标作为评价指标。2、“文献资料分析优选法”，即全面查阅有关文献资料，分析各指标的优缺点并加以取舍。此外，可用假设检验的方法、多元回归的方法、指标聚类法等方法。四、评价指标的权重估计在利用挑选出来的评价指标建立评估模型时，还应当考虑各指标对评价结果的影响大小，即各个评价指标在评价模型中的权重问题。确定指标权重的常用方法有主观定权法和客观定权法。主观定权法较为常用的一种方法为专家评分法。若评价指标可分层时，可用组合权重的估计方法。第二节几种综合评价方法简介 26 一、综合评分法 (一)、基本概念综合评分法是建立在专家评价法基础上的一种重要的综合评价方法，由专家确定评价指标的权重。二、优序法 (一)、基本概念对各项评价指标分别排序，并分别对各序号(等级)以相应的评分值即优序数，然后综合诸评价指标，分别计算评价对象的总优序数，并按总优序数大小评定其优劣顺序的方法即优序法。三、Topsis法 (一)、基本概念基于归一化的原始数据矩阵，计算出待评对象中的最优方案和最劣方案，通过计算各对象与最优和最劣方案间的距离，获得各待评对象与最优方案的相对接近程度，以此作为评价各方案的优劣依据。本法对样本数据无特殊要求 (二)、Topsis法的一般步骤: 1.建立同趋势化的原始数据矩阵方法是将低优指标转化为高优指标的形式，一般是取低优指标值的倒数。所谓的低优指标就是指标值越低越好的指标，例如死亡率。 2、对同趋势化的原始数据矩阵进行归一化处理，并建立相应的归一化的数据矩阵。 3、据归一化矩阵得到最优值向量和最劣值向量，即将待评方案中的各指标 +最大取值组成最优方案，用符号A表示，将待评方案中的各指标的最小归一化 -取值组成最劣方案，用符号A表示。 +- 4、分别计算诸方案的各评价指标值与最优方案和最劣方案的距离D和D。 ii 5、计算诸评价指标与最优方案的接近程度C,。 i 6、按C值大小将各方案排序，C值越大，表示待评价方案越好。 ii 四、层次分析法 27 层次分析法的特点是把评价目标分解为不同层次的目标，对原始资料按不同层次建立目标树图，并根据经验对各层子目标的重要程度做两两对比打分，用计算得到的各层子目标的权重系数计算组合权重，最后用累加法等方法计算加权总分并进行综合评价。第十一章卫生服务调查统计第一节概述卫生服务调查是指对卫生状况、人群卫生服务的需要和需求、卫生服务资源的分配和利用等进行的一种社会调查。第二节卫生服务调查资料的来源一、卫生机构调查 1、医院调查如:门诊资料、住院资料、医院资源等调查。 2、其他卫生机构调查二、家庭卫生询问调查对家庭进行抽样询问调查可以比较全面地了解与掌握人群健康状况和卫生服务利用状况。家庭卫生询问调查以常住居民，即在调查区域内长期居住一定时期以上(一般为半年)和有长期居住倾向(如新婚夫妇、新生的婴儿等)的人群为调查对象。 (一)、家庭卫生询问调查的设计抽样方法:常用的抽样方法有单纯随机抽样、整群抽样、系统抽样和分层抽样。确定样本量。第三节卫生服务调查的分析指标 28 表9.4 卫生服务调查的常用分析指标卫生服务具体分析指标两周患病率疾病频率指标慢性病患病率需要量指标两周卧床率疾病严重程度指标两周活动受限率两周休工(学)率两周就诊率门诊服务利用指标两周患者未就疹率利用指标住院率住院服务利用指标人均住院天数未住院率每千人口医师数卫生人力资源指标每千人口护士数卫生资源指标每千人口药剂师数每千人口病床数其它卫生资源指标卫生总费用占国内生产总值的比例第十二章疾病统计第一节有关疾病统计的概念一(疾病的含义疾病是机体受到致病原因和发病条件的影响后所发生的一个过程。二(疾病的诊断标准 1(要有科学而切实可行的疾病诊断方法和诊断标准。 2(统计分析，应在统一的标准下进行的。三(疾病的统计对象 29 1( 门诊疾病的统计对象:指患者去医疗机构就诊，并经医师诊断为患病者。 2( 住院疾病的统计对象:诊断为有病的住院病人。 3( 疾病调查的研究对象:与门诊和住院疾病的统计对象不同，疾病调查常以特定人群 (包括健康人和病人)作为研究对象，探讨疾病在人群中的分布。应根据调查目的确定观察对象。并根据研究目的确定研究的疾病及诊断方法和诊断标准。四(疾病的统计单位 1(统计单位:可以“病人”和“病例”为统计单位。 2(以“病例”为统计单位时，可按新发(生)病例或现患病例进行统计。 (1)新发(生)病例:指在观察期间(通常为一年内)新发生的病例，以第一次诊断为准。某些急性病，在观察期间内发病，在此期间内治愈，愈后再发生同一种病，则算作2个新病例。 (2)现患病例:是指在调查时点或调查期间(一般很短的期间)内的检查出的疾病，包括在此之前发生而未愈的病例及本次调查新发现的病例。第二节疾病统计的资料来源主要有以下几种途径: 一、疾病报告二、疾病登记三、疾病防治统计报表四、医疗机构诊治疾病登记五、病伤缺勤登记六、疾病专题调查第三节疾病统计的指标一(反映疾病发生频率的指标 (一)发病率(incidence rate)是指一定时期(年、季、月)内，可能发生某病的人群中发生某病新病例的频率。 30 (二)患病率是指在某时点检查时，接受检查的人群中现患病例所占的比例，又称现患率或流行率。适用于慢性病。 (三)感染率指在调查时所检查的人群中，现有感染者的比例。一般通过病原学或血清学等实验室方法检查感染者。二(反映疾病构成的指标常用疾病构成百分比。反映某病在全部疾病中所占的比重，指出主要的疾病种类，但不反映具体频率。三(反映疾病严重程度的指标反映疾病严重程度的指标主要有表示疾病对生命威胁程度的病死率、死亡率以及疾病对劳动能力影响的因病伤缺勤统计指标。 (一)反映疾病对生命威胁程度的主要指标 1(病死率表示在规定的观察期间内，某病患者中因该病而死亡的频率。病死率常用来说明某疾病对病人生命的威胁程度，它常受疾病的严重程度及医疗水平的影响。 2(某病死亡率)是一定时期内某人群因某病而死亡的频率。四(反映疾病疗效的指标急性病一般用病死率和治愈率等指标。短期内不会有明确治愈结果的恶性肿瘤、心脏病等慢性病，则常用生存率来表示疗效。 1(病死率 2(治愈率表示接受治疗的病人中治愈的频率。 3.有效率表示接受治疗的病人中治疗有效的频率。 4(生存率指病人从病程的某个时点(一般为疾病的确诊日、接受治疗日或出院日期)起，能活到某个时间的生存概率。对于某些慢性病，常常用生存率来表示疗效，该指标要有随访制度为基础。有1年生存率、3年生存率、5年生存率等。第四节疾病分类一(疾病命名和疾病分类的概念 31 疾病命名是按一定体系(多按解剖系统)对每一种法定疾病情况给予确切的名称，一个标准化的术语，并使其对另外的疾病不可混淆，以避免同一名称表示多种疾病。疾病分类是把数千种病伤按一定标准分成若干大类(母类)，大类下面再分成若干小类(子类)，所有病伤都各自分在一个类中，不应有无类可归或可归数类者。疾病命名是以准确反映个别病伤事例为目的，为临床疾病名称的标准化服务;疾病分类是在疾病命名法的基础上建立起来的，以描述和分析疾病在人群中的分布规律为目的，为疾病的预防服务。两者既有区别又有密切联系。三(1CD-10简介国际疾病与有关健康问题的统计分类(International Classification of Diseases, ICD )是将有关疾病与其它健康问题的医学描述与诊断，转化为由字母数字所组成的编码，该编码已成为国际公认的疾病统计标准分类。使用1CD-10优点:(1)便于信息贮存、统计分析。(2)不同国家、不同地区或相同国家、地区的不同医院之间按照这一国际标准，获得的疾病与死因统计资料可以相互比较。四(有关死因分类的一些问题进行死亡统计时，按照国际疾病分类的原则确定根本死亡原因，并按确定的根本死因进行归类。 WHO规定，根本死因是指:“(a)引起直接导致死亡的一系列病态事件的那些疾病或损伤，或者(b)造成致命损伤的事故或暴力的情况”。制定根本死因的想法是从预防死亡的角度出发，去寻找带有根本性的、引起一系列疾病并最终导致死亡的那个原因，不管它发生在死前多长时间都应给予记录。第六节疾病询问调查通过询问取得居民在调查期间内的患病资料，经统计分析用来描述一个国家或一特定地区的居民患病和医疗状况。实施调查时，首先登记户中每一成员一般情况，既往健康状况和自我保健方法等有关基本健康项目。然后询问户中每个成员于调查日的患病情况，患有按规定的疾病者则填写患病调查表。一般只调查当日的患病情况，也可扩展为调查既往一周或一个月内的患病情况( 根据调查资料，可计算时点患病率或期间患病率及期间发病率等指标。 32 第十三章医学人口统计医学人口统计从卫生保健的角度研究和描述人口数量、分布、结构、变动及其规律，研究人口与卫生事业发展的相互关系，是卫生统计学的重要组成部分。医学人口统计资料的来源医学人口统计资料的收集方法如同其它统计资料一样，其主要来源为日常工作记录(报告单、卡、册)、统计报表和人口调查三个方面。第一节静态人口统计指标一、人口总数人口总数一般指一个国家或地区在某一特定时间的人口数，是时点人口。时期人口是指某一时期(或某一年)平均人口数。二、人口构成指标 (一) 人口性别构成 1(性别构成指男、女两性人口分别在总人口中所占的百分比。 2(性别比反映两性人口间比例的指标。指以女性人口为100, 男性人口与女性的比值。 (二) 人口年龄构成 1( 年龄中位数计算方法与一般的中位数相同 2(老年(人口)系数是指65岁(或60岁)及以上人口占总人口的比重，该指标用于反映人口是否老化及老化的程度。我国是以65岁以上人口作为老龄人口的标准。 3(少年儿童(人口)系数指14岁及以下少年儿童人口占总人口的比重。是从另一侧面反映人口老化程度的指标。 4. 老少比指65岁及以上老年人口与0-14岁的少年儿童人口之比，该指标也是用于反映人口老化情况的。 5、负担系数也称抚养人口系数。指每100名劳动年龄人口所负担的非劳动年龄人口数反映了劳动年龄人口与非劳动年龄人口之间的关系。一般以15-64岁者为劳动人口，0-14岁和65岁及以上者为非劳动人口或被抚养人口。 33 (三)人口金字塔人口金字塔是将人口的性别和年龄资料结合起来，以图形的方式表达人口的性别和年龄构成。它以年龄为纵轴，人数或其百分数为横轴，左侧为男，右侧为女而绘制的两个相对应的直方图。人口金字塔形象直观地反映了现有男女性别人口的年龄构成，而且也可以分析过去人口的出生死亡情况以及今后人口的发展趋势。第三节生育和计划生育统计指标生育统计 (一)测量生育水平的指标 1、粗出生率:表示某年某地平均每千人口的活产数，是反映一个国家和地区的人口自然变动的基本指标。 2(总生育率:表示某年某地平均每千名育龄妇女的活产数, 它反映育龄妇女总的生育水平。 3年龄别生育率:表示平均每千名某年龄组育龄妇女的活产数。 4(总和生育率: 当年龄分组为1岁一组时，将年龄别生育率从15岁累加到49岁止，得到15-49岁年龄别生育率的总和，即称总和生育率。若年龄分组为5岁一组时，则年龄别生育率之和再乘5，即得总和生育率。表示每1000名妇女一生平均生多少个孩子,或每个妇女一生平均生多少个孩子.其算式为: 总和生育率 = 5ΣASFR 总和生育率的基本含义是:假定同时出生的一代妇女，按照某年的年龄别生育率度过其一生的生育经历，则年龄别生育率之和乘年龄组组距，就是这一代妇女平均每人可能生育的子女数。总和生育率是用某年横断面的年龄别生育率资料计算的，因此消除了人口的年龄性别构成对生育水平的影响，不同时间、不同地区的总和生育率可以直接进行比较，是测量生育水平较理想的指标。 (二)人口再生产指标 1. 自然增长率:为粗出生率(CBR)与粗死亡率(CDR)之差，表示人口自然增长的情况。粗再生育率(gross reproduction rate, 简写GRR) 表示人口再生产趋势的常用指 34 标。粗再生育率的计算与总和生育率极为近似，不同的地方是活产数特指女婴数，故粗再生育率实际是只计算女婴的总和生育率。 2(生育率(net reproduction rate, 简写NRR) 是在粗再生育率的基础上扣除了 0-49岁的死亡。即扣除了母亲一代所生的女儿中0-49岁的死亡数，剩下的即为真正能取代母亲一代的女儿数。 4. 平均世代年数(mean 1ength Of generation, 简写LG) 是指母亲一代所生的女儿代替母亲执行生育职能平均需要的年数，即产生下一代母亲的速度。它反映两代间隔年数，若间隔年数短，表示人口发展速度快，间隔年数长，则表示人口发展速度慢。有了计算NRR 的基础，平均世代年数的计算是很容易的。一、计划生育统计生育率指标能反映一个人口的生育水平，但不一定能用来评价当地的计划生育工作水平。由于计划生育是我们国家的基本国策，计划生育统计也是卫生事业管理的重要组成之一。因此，将常用的计划生育工作指标和计算方法列入下表。常用的计划生育工作指标和计算指标比例含义分母分子名称基数避孕某年采用避孕措施的人占育某年15-49岁同期内采用避孕现用100% 龄妇女人数的百分比妇女数措施的人率同期内绝育的绝育某年绝育女(男)性人数占某年15-49岁100% 率育龄妇女人数的百分比妇女数女(男)性人数人工某年人工流产次数占育龄妇某年15-49岁同期内人工流产流产100% 女人数的百分比妇女数次数率人流某年人工流产次数与活产数某年活产总同期内人工流产活产100% 之比数次数比某年内符合计划生育要求的某年内符合计划计划某年活产总活产占活产总数的生育要求的生育100% 数率比例活产数 35 1. 某年内采用避 1(同期内意孕措施外的妇女怀孕人数意外人数某年使用避孕的人中意外怀怀孕 2(同期内使100% 孕的人数 2. 某年率用内采用某该方法意外一方法怀孕人数避孕的人第四节死亡统计指标死亡统计是医学人口统计的重要组成部分，主要研究人群死亡水平、死亡原因及其变动规律。常用的死亡统计指标有粗死亡率、性别或年龄别死亡率，按年龄标准化死亡率，婴儿死亡率、新生儿死亡率、围产儿死亡率、死因别死亡率和死因构成等。一、粗死亡率(crude death rate，简称CDR) 或称普通死亡率、总死亡率，指某地某年平均每千人口中的死亡数，说明人群中总的死亡水平。二年龄别死亡率(age specific death rate, 简称ASDR) 或称年龄组死亡率，指某年某年龄别平均每1000人口中的死亡数。三、婴儿死亡率(infant mortality rate，简称IMR) 指某年某地每1000名活产中未满1周岁婴儿的死亡数。四、新生儿死亡率和早期新生儿死亡率(neonatal mortality rate 和early neonatal mortality rate，简称NMR, ENMR) 新生儿死亡率是指某年某地每1000名活产中未满28天的新生儿死亡数。早期新生儿死亡率是指某年某地每1000名活产中未满7天的新生儿死亡数。五、围产儿死亡率(prenatal mortality rate) 36 围产期是指胎儿体重达到1000克及以上,或孕期满28周至出生后7天以内的时期。在此期间内的死亡称为围产儿死亡。其计算为: 死胎指妊娠28周及以上，临产前胎儿死于宫内，出生后无生命征兆者;死产指妊娠 28周及以上，临产前胎儿存活，产程中胎儿死亡，出生后无生命征兆者。围产儿死亡率是反映妇产科、儿科医疗质量和妇婴保健利用及其效果的一个重要统计指标。围产期死亡资料不能从出生报告及死亡报告中直接获得，必须从医院产科病例纪录中查阅。六、5岁以下儿童死亡率(child mortality under age 5) 许多发展中国家，由于婴儿死亡率的资料不易准确，而5岁以下儿童死亡水平又很高，故用5岁以下儿童死亡率来反映婴幼儿的死亡水平。七、孕产妇死亡率(maternal mortality rate，简称MMR) 指某年中由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活产数之比，以万分率或十万分率表示。国际疾病分类第十版(1CD-10)对孕产妇死亡定义为:“妇女在妊娠期至产后42天以内，由于任何与妊娠有关的原因所致的死亡称为孕产妇死亡，但不包括意外事故死亡。” “与妊娠有关的原因”可以分为两类:?直接产科原因:包括对妊娠合并症(妊娠期、分娩期及产褥期)的疏忽、治疗不正确等;?间接产科原因:妊娠之前已存在的疾病，由于妊娠使病情恶化引起的死亡。如同婴儿死亡率一样，孕产妇死亡率也是一个反映国家或地区社会经济发展、卫生保健状况的敏感指标。八、死因别死亡率(cause-specific death rate) 指某年平均每10万人口中死于某病的人数，说明某种疾病对居民健康危害程度。死因别死亡率是死因分析的重要指标，我国死因统计的分类按国际疾病分类的要求进行根本死亡原因的统计，可作国家间或地区间的直接比较。九、死因构成比与死因顺位(proportion of dying of a specific cause) 死因构成又称相对死亡比，指死于某类死因的人数占全部死亡人数的百分比，说明各种死因的相对重要性。死因顺位是将各类死因按死因构成比的大小由高到低排列顺位，可以反映主要死因及各类死因的相对重要性。按国际疾病分类的原则进行死因分类，是应用 37 这一指标的先决条件。在同一地区人口变动不大的情况下，死因构成比可以反映因各种死因所至死亡的严重程度。第十四章寿命表第一节概述一、编制寿命表的基本思想寿命表是根据某一人群的年龄组死亡率编制出来的,说明人群生命过程及死亡过程的一种统计表。假定有同时出生的一代人(一般定为10万人)，按照某年某地人口实际年龄组死亡率而陆续死亡，直到全部死完为止，计算出寿命表指标。由于寿命表是根据某人群年龄组死亡率计算出来的，所以寿命表指标不受人口年龄构成的影响，不同地区、人群的寿命表各指标可以直接进行比较。二、寿命表的种类 1( 定群寿命表:直接研究某固定人群中的每个人从出生到死亡的实际过程。是用纵向随访资料进行编制。 2(现时寿命表:是用某一时间的横断面资料进行编制。完全寿命表及简略寿命表。卫生统计中常用的是现时寿命表中的简略寿命表。三、编制简略寿命表所需的原始资料必须有某时某地分性别、年龄组的平均人口数和死亡数的实际资料，或分性别、年龄组死亡率。第二节简略寿命表的编制一、寿命表中的指标含义及其计算 nPx(平均人口数):表示x岁年龄组的平均人口数。 nDx(实际死亡人数):表示x岁年龄组的实际死亡人数。 nmx(年龄组死亡率):表示x岁年龄组人口的平均死亡率。 38 nqx(死亡概率):表示x岁尚存者在今后n年内死亡的概率。该指标是编制寿命表的关键指标。 lx(尚存人数):表示同时出生的一代人中在刚满x岁时仍存活的人数。 ndx(寿命表死亡人数):表示x岁尚存者，今后n年内死亡的人数。例如:5d10是指10岁尚存，今后5年内死亡的人数。 nLx(生存人年数):表示x岁尚存者，在今后n年内生存的人年数。 Tx(称生存总人年数):表示刚满x岁的人，今后尚能生存的总人年数，即x岁以上各年龄组生存人年数(nLx)的总和。第三节寿命表的分析和应用常用的统计方法。一、反映人群健康状况 39 寿命表指标不象普通死亡率那样受到人口年龄构成的影响，因此具有更好的可比性。寿命表指标，特别是平均预期寿命已成为国内外评价不同地区、时间及人群健康水平的主要指标之一。二、研究死因对居民生命的影响常用的统计方法。三、反映人群健康状况寿命表指标不象普通死亡率那样受到人口年龄构成的影响，因此具有更好的可比性。寿命表指标，特别是平均预期寿命已成为国内外评价不同地区、时间及人群健康水平的主要指标之一。四、研究死因对居民生命的影响研究某种死因或某些死因对居民生命的影响，除了计算死因别死亡率、年龄组死因别死亡率及标准化死因别死亡率等指标，还可编制去死因寿命表，用去某死因后的平均预期寿命等指标分析某种或某类死因对居民生命的影响程度。五、研究人口再生产情况人口净再生育率是多少，生育一代人大约要多少年等六、研究疾病的发展过程和预后我们可以参照寿命表的编制原理和方法，编制疾病表，用以说明疾病的发展过程及预后。如观察一批经手术治疗的肿瘤病人，看三年或五年后尚存活多少人，平均存活率是多少等等。在慢性病临床观察中，只要有随访观察每个病人的结局(治愈/未愈，或存活/死亡)，开始治疗和停止治疗的时间，就可用寿命表的方法计算生存率和平均生存时间。 40

                    本文档为【卫生统计学课程辅导2005】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

卫生统计学课程辅导2005

你可能还喜欢