首页 医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案

医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案

举报
开通vip

医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案4-PAGE\*MERGEFORMAT#一、SPSS基本功能SPSS基能厂Frequencies描述性分析」DeSCriptiveSExplore均数比较ICr0SStabS一般线性模型相关与回归分析非参数检验生存分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等统计资料的类型资料类型「定量资料:用定量的方法获得的数值资料丿计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析两组均[单样本设计脸验广数...

医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案
4-PAGE\*MERGEFORMAT#一、SPSS基本功能SPSS基能厂Frequencies描述性 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 」DeSCriptiveSExplore均数比较ICr0SStabS一般线性模型相关与回归分析非参数检验生存分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等统计资料的类型资料类型「定量资料:用定量的方法获得的数值资料丿计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析两组均[单样本设计脸验广数比钟配对设计脸验正态分布』I成组设计脸验三组及以上均数比较r配对设计秩和检验J偏态分布]单样本设计秩和检验.成组设计秩和检验统计推断总体率的估计检佥定量资料r资料类型计数资料统分析「等级资料统计描述—相对数I假设检验卡方检佥假设检验*r参数检正态分布等级资料偏态分布资料<非参数检验]分布类型未知方差不齐,且不易变换达到齐性I数据一端或两端不确定的资料参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯II型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯II型错误第一章绪论1•举例 说明 关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书 总体和样本的概念。研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。简述误差的概念。误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。简述小概率事件原理。当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章调查研究设计调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。简述调查设计的基本内容。①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。试比较常用的四种概率抽样方法的优缺点。(1)单纯随机抽样优点是:均数(或率)及 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。(2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。(3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。(4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。常用的非概率抽样方法有哪些?有偶遇抽样、立意抽样、定额抽样、雪球抽样等。简述调查问题的顺序安排。调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题在前,难答题在后④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题⑤敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。二、最佳选择题实验性研究与观察性研究的根本区别在于抽样方法不同研究对象不同是否设立对照组假设检验方法不同是否人为施加干预措施以下抽样方法中不属于概率抽样的是单纯随机抽样系统抽样整群抽样D.分层抽样E.雪球抽样条件相同时,下列抽样方法中抽样误差最大的是单纯随机抽样系统抽样分层抽样D.整群抽样E.无法直接比较下列关于调查设计的叙述,正确的是明确调查目的是调查研究最核心的问题采用抽样调查还是普查是由该地区的经济水平决定的调查设计出现缺陷时,可以通过相应的统计分析方法弥补一旦制定了调查研究计划,在实际操作过程中,就不可改变调查的质量控制主要在调查问卷设计阶段为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于单纯随机抽样B.分层抽样系统抽样整群抽样E.多阶段抽样某县有30万人口,其中农村人口占80%,现欲对农村妇女的计划生育措施情况进行调查调查对象应为该县所有的已婚夫妻该县所有的农村妇女该县所有的育龄期妇女该县所有的已婚妇女该县所有已婚育龄期农村妇女欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为单纯随机抽样B.整群抽样C.分层抽样D.典型调查E.普查普查是一种全面调查的方法,与抽样调查相比,叙述正确的是确定普查观察单位非常简单普查适于发病频率较低疾病的调查普查不易获得反映平均水平的统计指标因涉及面广普查可产生较大的抽样误差普查更易统一调查技术,提高调查质量以下五个问题中,最符合调查问卷设计要求的是你一个月工资多少?B•你一个月吃多少克盐?C•你是否有婚外恋:①有②无你和你的妈妈认为女孩几岁结婚比较好?如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可4.A1.E2.E3.D第三章实验研究设计【思考与练习】一、思考题实验设计根据对象的不同可分为哪几类?实验研究中,随机化的目的是什么?什么是配对设计?它有何优缺点?什么是交叉设计?它有何优缺点?临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。三、最佳选择题实验设计的三个基本要素是处理因素、实验效应、实验场所处理因素、实验效应、受试对象受试对象、研究人员、处理因素受试对象、干扰因素、处理因素处理因素、实验效应、研究人员实验设计的三个基本原则是随机化、对照、重复随机化、对照、盲法随机化、重复、盲法均衡、对照、重复盲法、对照、重复实验组与对照组主要不同之处在于A.处理因素B.观察指标C.抽样误差D.观察时间E.纳入、排除受试对象的标准为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是A.空白对照B.安慰剂对照C.实验对照D.标准对照E.自身对照观察指标应具有A.灵敏性、特异性、准确度、精密度、客观性灵敏性、变异性、准确度、精密度、客观性灵敏性、特异性、变异性、均衡性、稳定性特异性、准确度、稳定性、均衡性、客观性灵敏性、变异性、准确度、精密度、均衡性比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A.选择性偏倚测量性偏倚混杂性偏倚D.信息偏倚E.失访性偏倚将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计,.丿;■£I—r 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 是随机区组设计完全随机设计析因设计配对设计交叉设计在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用的控制偏倚的方法有A.单盲、多中心随机化、多中心随机化、单盲随机化、双盲双模拟双盲双模拟、多中心临床试验的统计分析应主要包括A.可比性分析、疗效评价、安全性评价B.可比性分析、优效性分析、劣效性分析可比性分析、安全性评价、可行性分析优效性分析、等效性分析、安全性评价疗效评价、安全性评价、可行性分析药品上市后应用阶段进行的临床试验属于I期临床试验II期临床试验III期临床试验IV临床试验现场试验四、综合分析题欲将16只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组,剩下8只作为对照组。该分组方法是否正确?若不正确,请说明理由。某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠血管紧张素的影响,并欲分析两药联合应用是否更为有效。你认为该研究最好采用何种实验设计方案?并说明理由。请帮该研究者实现32只大鼠的随机分组。【习题解析】一、思考题根据受试对象不同,实验可以分为动物实验、临床试验和现场试验三类。动物实验的受试对象为动物,也可以是器官、细胞或血清等生物 材料 关于××同志的政审材料调查表环保先进个人材料国家普通话测试材料农民专业合作社注销四查四问剖析材料 ;临床试验的受试对象通常为患者,持续时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是未患某种疾病的人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。用以配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、实验效率较高;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低效率。在临床试验中,配对的过程还可能延长实验时间。交叉设计是一种特殊的自身对照设计。其中22交叉设计首先是将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段结束后,两组交换处理措施进行第二阶段的实验,这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适于具有自愈倾向或病程较短的疾病研究。交叉设计的优点有:①节约样本含量;②能够控制个体差异和时间对处理因素的影响;③在临床试验中同等地考虑了每个患者的利益。其缺点有:①处理时间不能太长;②当受试对象的状态发生根本变化时,后一阶段的处理将无法进行;③受试对象一旦在某一阶段退出试验,就会造成数据缺失。临床试验中使用安慰剂,目的在于消除由于受试对象和试验观察者的心理因素引起的偏倚,还可控制疾病自然进程的影响,显示试验药物的效应。二、案例辨析题该结论不正确。研究某治疗方案对某病患者的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有设立了对照才能较好地控制非处理因素对实验结果的影响,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入38例消化性溃疡患者,并未设立相应的对照组。而且这38例患者接受治疗的时间为2000年至2006年,时间跨度太大,可能对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。三、最佳选择题1.B2.A3A.4.A5.A6.C7.C8.D9.A10.D四、综合分析题解:该分组方法不正确。随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,因此破坏了随机化原则。解:先将6对小鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第18行最左端开始横向连续取12个两位数字。事先规定,每一对中,随机数较小者序号为1,对应于A组,随机数较大者序号为2,对应于B组。分配结果见表3-1。表3-1配对设计的12只小鼠随机分组的结果对子数1.1122.23.133.2456动物编号1.22.14.14.25.15.26.16.2随机数129688173165196902836075序号122112121212组别ABBAABABABABSPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量number和pair,再点击DataView标签,录入数据(见图3-1,图3-2)。图3-1VariableView窗口内定义要输入的变量number和pair图3-2DataView窗口内录入数据分析:TransfOrm—RandomNumberGenerators...ActiveGeneratorInitialization"SetStartingPoint口FixedValueValue:键入20071222OKTransfOrm—Compute...TargetValuable:键入randomNumericExpression:RV.Uniform(0,1)OKTransform—RankCases.Variables(s):randomBy:pairOK设定随机种子为20071222产生范围在0~1之间的伪随机数对每个对子中的两个伪随机数进行排序注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。File—New—Syntax,打开Syntax窗口,键入如下程序:inputprogram.开始数据录入程序段numerickbnnumberpair(F8.0)/random(F8.6).stringtreat(A1).computek=2.处理组为2computeb=6.computen=b*k.loopnumber=1ton.computepair=rnd((number-1)/k+0.5).endcase.computek=lag(k).endloop.endfile.endinputprogram.setseed20071222.computerandom=uniform(1).rankvariables=randombypair.formatsrrandom(F3.0).computetreat=substr("ABCDEFGHIJKLMN",rrandom,1).listnumberpairtreat.对子数为6结束数据录入程序段设定随机种子为20071222产生范围在0~1之间的伪随机数对伪随机数排序根据伪随机数的序号进行分组结果中显示受试对象编号及被分到的处理组在Syntax窗口中选择Run—All提交运行。注:程序中的b(即对子数)可根据实际情况赋予不同的值。随机区组设计受试对象的分配也可以用此程序来实现,仅需将k值设为处理组数,b值设为相应的区组数。结果及解释DataView窗口第四章定量资料的统计描述3.解:图3-3SPSS编程实现受试对象随机分配结果Output窗口Listnumberpairtreat11A21B32A42B53B63A74A84B95B105A116B126A编程实现随机分配的结果见dataview窗口(图3-3)或output窗口。可以看出12只小鼠被随机分配到A组和B组。在用此程序进行随机分组前,规定A组表示实验组,B组表示对照组。则1,3,6,7,10,12号小鼠被分到实验组,2,4,5,8,9,11号小鼠被分到对照组。4-13第四章定量资料的统计描述4-PAGE\*MERGEFORMAT#(1)该研究最好采用2x2析因设计的实验方案,如表3-2所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。因此既可分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。表3-2MEL和TXL对32只大鼠血管紧张素影响的析因设计TXLMEL(用)b(不用)b2(用)a(不用)a2a1b1a2b1a1b2a2b2(2)先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第2列最上端开始纵向连续取32个两位数字。对随机数字排序,事先规定,序号为1~8的豚鼠分为A组,序号为9~16的大鼠分为B组,序号为17~24的大鼠分为C组,序号为25~32的大鼠分为D组,分配结果见表3-3。表3-332只大鼠随机分组的结果编号12345678910111213141516随机数17367743282276683971355096938756序号18251154221992071430282715分组AADBAACCBCABDDDB编号17181920212223242526272829303132随机数72969464447617177629804056654396序号21312917132323246261016181232分组CDDCBCAACADBBCBDSPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量number,见图3-4。再点击DataView标签,录入变量number的值,即从1〜32。图3-4VariableView窗口内定义要输入的变量number设定随机种子为20071212产生范围在0~1之间的伪随机数对伪随机数排序原变量名为伪随机数的序号Rrandom新变量名为treatRrandom值为1~8时,treat值为ARrandom值为9~16时,treat值为BRrandom值为17~24时,treat值为C分析:Transform—RandomNumberGenerators...ActiveGeneratorInitialization"SetStartingPoint口FixedValueValue:键入20071222OKTransform—Compute...TargetValuable:键入randomNumericExpression:RV.Uniform(0,1)OKTransform—RankCases.Variables(s):randomOKTransform—Recode—IntoDifferentVariables.InputVariable》OutputVariable:RrandomOutputVariableName:键入treat点击Change点击OldAndNewValues...OldValue口Range:键入1through8OutputvariablesarestringsNewValue口Value:键入AOl^New:点击Add|OldValueRange:键入9through16NewValueValue:键入BOl^New:点击甌OldValueRange:键入17through24NewValueValue:键入COld》New:点击OldValueRange:键入25through32NewValue口Value:键入DRrandom值为25〜32时,treat值为DOld予New:点击AddContinueOK注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。File—New—Syntax打开Syntax窗口,键入如下程序:开始数据录入程序段受试对象总数为324个处理组inputprogram.numericnknumbergroup(F8.0)/random(F8.6).stringtreat(A1).computen=32.computek=4.loopnumber=lton.endcase.computen=lag(n).computek=lag(k).endloop.结束数据录入程序段产生范围在0〜1之间的伪随机数设定随机种子为20071222对伪随机数排序根据伪随机数的序号进行分组结果中显示受试对象编号及被分到的处理组endfile.endinputprogram.computerandom=uniform(1).setseed20071222.rankvariables=random.computegroup=trunc((rrandom-1)*k/n).formatsgroup(F3.0).computetreat=substr("ABCDEFGHIJKLMN",group+1,1)listnumbertreat.注:程序中的n(受试对象总数)、k(即处理组数)可根据实际情况赋予不同的值。输出结果DataView窗口(由于篇幅限制,仅列出前16例受试对象的分组情况)图3-5SPSS编程实现受试对象随机分配结果Output窗口ListnumbertreatnumberTreat1D17C2D18C3B19B4C20C5D21B6D22A7B23C8C24D9D25C10A26A11D27B12B28A13C29A14B30A15A31B16A32D编程实现随机分配的结果见dataview窗口(图3-5)或output窗口。可以看出32只大鼠被随机分配到A、B、C、D组。在用此程序进行随机分组前,事先规定A、B、C、D分别对应于对照组、MEL组、TXL组和MEL+TXL组。从分配结果中可以看出:10,15,16,22,26,28,29,30号大鼠被分到对照组;3,7,12,14,19,21,27,31号大鼠被分到MEL组;4,8,13,17,18,20,23,25号大鼠被分到TXL组;1,2,5,6,9,11,24,32号大鼠被分到MEL+TXL组。第四章定量资料的统计描述【习题解析】一、思考题均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数卩和形态参数b;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间(卩—2.58b,卩+2.58b)内的面积为95.00%;区间(卩—2.58b,卩+2.58b)内的面积为99.00%。①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。二、案例辨析题统计描述时,常见错误是对定量资料的描述均采用均数、标准差。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清胆固醇的频数分布图如下:第四章定量资料的统计描述40-4-PAGE\*MERGEFORMAT#图4-1血清甘油三酯(TG)的频数分布可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:集中趋势指标M=X/2二(1.76+1.75)/2二1.755(mmol心离散程度指标四分位数间距=P75-P25-2.10-1.34二0.76(mmOl/L)三、最佳选择题1.B2.E3.B4.C5.D6.E7.A8.D9.D四、综合分析题解:输出结果图4-4尿总砷的频数分布图由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。输出结果3D第四章定量资料的统计描述4-PAGE\*MERGEFORMAT#图4-5尿总砷对数的频数分布图由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。(2)燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。输出结果DescriptiveStatisticsNMinimumMaximumMeanStd.DeviationlgxValidN(listwise)176176-1.99-.24-1.1831.39685结果中的Mean表示尿总砷对数值的均数为1.1831,求其反对数,得到几何均数G=0.0656(摩/L)。2.解:(1)已知健康人的血清TC服从正态分布,故采用正态分布法制定95%的参考值范围。下限:X—1.96S=4.84—1.96x0.96=2.96(mmol/L)上限:X+1.96S=4.84+1.96x0.96=6.72(mmol/L)该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为2.96mmol/L~6.72mmol/L。(2)45~55岁健康男性居民的血清总胆固醇分布为正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。X-卩3.25-4.84J66Z=—1==—1.661c0.96Z=X2-卩=5.25—4.84=0.432c0.96查标准正态分布曲线下的面积表(附表2)得:①(Z)二①(—1.66)=0.04851Q(Z)=1—0(—0.43)=1—0.3336=0.66642D=0(Z)—0(Z)=0.6664—0.0485=0.6179=61.79%21该市45〜55岁健康男性居民中,血清总胆固醇在3.25mmol/L〜5.25mmol/L范围内的比例为61.79%。(3)作标准化变换Z=X^^=3.80-4.84=-1.08c0.96查标准正态分布曲线下的面积表(附表2)得:0(Z)=0(-1.08)=0.1401=14.01%该市45~55岁健康男性居民中,血清总胆固醇低于3.80mmol/L所占的比例为14.01%。3.解:输出结果跟骨硬度指数图4-8跟骨硬度指数的频数分布图由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。输出结果StatisticsSINValid120Missing0Percentiles2.558.016797.5143.6618即该地区30~35岁健康女性的SI的95%参考值范围为(58.02,143.66)。第五章定性资料的统计描述【习题解析】一、思考题1.①计算相对数应时有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。①标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。②样本的标准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。③注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。二、案例辨析题该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。三、最佳选择题1.B2.A3.D4.E5.D6.D7.C8.C9.B四、综合分析题1.解:表5-3经常吸烟与慢性阻塞性肺病(COPD)的关系分组调查人数-经常吸烟经常吸烟率(%)是否COPD患者35623112564.89非COPD患者47918329638.20COPD患者的经常吸烟率:231/356xl00%=64.89%非COPD患者经常吸烟率:183/479x100%=38.20%COPD患者的经常吸烟率比非COPD患者高26.69%比值比(OR)=231x296=2.989125x183还需进一步对OR作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。输出结果年份符号死亡率绝对增长量累计逐年发展速度定基比环比增长速度定基比环比分组*吸烟情况CrosstabulationCount吸烟情况Total不吸烟吸烟分组非COPD患者296183479COPD患者125231356Total421414835RiskEstimateValue95%ConfidenceIntervalLowerIJpperOddsRatiofor分组(非COPD患者/COPD患者)2.9892.2473.976Forcohort吸烟情况=非经常吸烟1.7601.5032.061Forcohort吸烟情况=经常吸烟.589.513.675NofValidCases8352.解:表5-4某地居民1998〜2004年某病死亡率(1/10万)动态变化1998〜a0160.5——————1999〜a1144.2-16.3-16.30.900.90-0.10-0.102000〜a2130.0-30.5-14.20.810.90-0.19-0.102001〜a3120.2-40.3-9.80.750.92-0.25-0.082002〜a485.6-74.9-34.60.530.71-0.47-0.292003〜a569.5-91.0-16.10.430.81-0.57-0.192004~38.5-122.0-31.00.240.55-0.76-0.45该病死亡率的平均发展速度=nan/a0二6'38.5/160.5二0.79该病死亡率的平均增长速度=平均发展速度-1=0.79-1=-0.213.解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。表5-5直接法计算某地不同年龄、性别人群的HBsAg标准化阳性率(%)年龄组标准人口数Ni男性女性原阳性率pi预期阳性数Npii原阳性率pi预期阳性数Npii0~10812.3024.902.3225.0920~14732.7139.972.7240.0240~15466.0693.636.4699.8660~14087.52105.858.60121.04合计5508(N)5.11264(工np)ii4.86286(工Np)ii男性HBsAg标准化阳性率:p=x100%=4.79%5508女性HBsAg标准化阳性率:286'=x100%=5.19%5508可见,经标准化后女性HBsAg阳性率高于男性。输出结果DescriptiveStatisticsNSumsp45508.00sp14264.35sp24286.01ValidN(listwise)4注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2的和除以sp的和,得女性HBsAg标准化阳性率。第六章总体均数的估计【习题解析】一、思考题1.抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。标准误为2•样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。3.标准差与标准误的区别在于:①计算公式:标准差为;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。标准差与标准误的联系:当样本量n一定时,标准误随标准差的增加而增加,公式为:S=SXx.n4.数理统计的中心极限定理:从均数为卩,标准差为b的正态总体中进行独立随机抽样,其样本均数服从均数为卩,标准差为b/丘的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时(n>50),其样本均数的分布逐渐逼近于均数为卩,标准差为bI、丘的正态分布。◎-越大,抽样误差越大,由样本均数估计总体均数的可靠性越X小。反之,b-越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。X__计算总体均数置信区间的通式为:(X-1S_,X+1S_);当样本含量较大时,aI2yxaI2,vx例如n>100,t分布近似标准正态分布,可用Z值代替t值,作为置信区间的近似计算,相应的置信度为(1-a)时,总体均数的置信区间为:(X-Zs_,X+ZS_)。a/2Xa/2X5.置信区间与医学参考值范围的区别见表6-1。表6-1均数的置信区间与医学参考值范围的区别大多数“正常人”的某项解剖、生理、生化指标的波动范围正态分布法:双侧95%的参考值范围为(X—1.96S,X+1.96S)偏态分布法:单侧下限95%的参考值范围为>P5单侧上限95%的参考值范围为<P95判断观察对象的某项指标正常与否,为临床诊断提供参考区别均数的置信区间医学参考值范围意义按一定的置信度(1-a)估计的总体均数所意义在的区间范围①b未知:(X—ts-,X+1s-)a/2,vXa/2,vX计算②b未知而n较大:公式(X-ZS-,X+Zs-)aI2X_aI2X_③b已知:(X—zb-,X+zb_)TOC\o"1-5"\h\za/2Xa/2X用途用于总体均数的估计或假设检验二、案例辨析题_该学生误用医学参考值范围的公式来计算总体均数的95%置信区间,正确计算公式为:(X-Zs_,X+Zs_),二者的主要区别在于,计算医学参考值范围时应该用“标准a/2Xa/2X差”,计算置信区间时应该用标准误。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.01,122.99)。三、最佳选择题1.C2.E3.E4.A5.E6.A7.E8.B四、综合分析题_1.解:由于该样本为小样本,故用公式X±2.064S&估计总体均数95%置信区间为(8.27,10.03)mmIh;用公式X±2.797S_估计总体均数99%置信区间为(7.96,10.34)mmIh。X输出结果DescriptivesStatisticStd.Error红细胞沉降Mean率9.1481.4256395%ConfidenceIntervalforMeanLowerBound8.2697UpperBound10.02665%TrimmedMean9.1795Median9.4288Variance4.529Std.Deviation2.12816Minimum5.01Maximum12.68Range7.67InterquartileRange2.73Skewness-.250.464Kurtosis-.429.902DescriptivesStatisticStd.Error红细胞沉降率Mean9.1481.4256399%ConfidenceLowerBoundIntervalfor7.9576MeanUpperBound10.33865%TrimmedMean9.1795Median9.4288Variance4.529Std.Deviation2.12816Minimum5.01Maximum12.68Range7.67InterquartileRange2.73Skewness-.250.464Kurtosis-.429.9022•解:①抽样误差为1.82;②由于该样本为大样本,故用公式X士ZS—估计正常人ETa/2x含量的95%置信区间为(77.43,84.57)ng/L。输出结果DescriptivesStatisticStd.Error血浆内皮素Mean80.98911.8203395%ConfidenceLowerBound770771IntervalforMean//・3//1UpperBound84.60105%TrimmedMean80.8639Median79.5837Variance331.362Std.Deviation18.20334Minimum34.02Maximum129.20Range95.17InterquartileRange21.75Skewness.182.241Kurtosis.140.4783•解:①由于两样本均为小样本,故用公式X士爲纫SX估计总体均数95%置信区间’肺心病组血液二氧化碳分压的95%置信区间为(7.86,13.10)kpa;慢性支气管炎合并肺气肿组血液二氧化碳分压的95%置信区间为(5.41,6.83)kpa。②由于方差不齐,应当选择方差不齐时的结果。两组患者的血液二氧化碳分压差值的95%置信区间为(1.66,7.05)kpa,该区间不包含0,可以认为肺心病患者与慢性支气管合并肺气肿患者的均数不同,肺心病患者较高。输出结果Descriptives组别StatisticStd.Error二氧化碳肺心病组Mean10.4781.2656压95%LowerConfidenceBoundIntervalforMean27.86004Upper13.096Bound45%TrimmedMean10.2266Median10.3473Variance38.444Std.Deviation6.20035Minimum1.59Maximum24.30Range22.71InterquartileRange7.13Skewness.615.472Kurtosis-.030.918慢性支气管炎合并肺气肿组Mean6.1228.3380995%LowerConfidenceBoundIntervalforMean5.4151UpperBound6.83045%TrimmedMean6.1266Median6.0160Variance2.286Std.Deviation1.51198Minimum2.93Maximum9.25Range6.32InterquartileRange1.78Skewness-.081.512Kurtosis.192.992GroupStatistics组别NMeanStd.DeviationStd.ErrorMean二氧化碳压•肺心病组2410.47826.200351.26564慢性支气管炎合并肺气肿206.12281.51198.33809组IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpper二氧Equal化碳压variancesassumed17.431.0003.06142.0044.355471.422901.483947.22700Equalvariancesnotassumed3.32526.238.0034.355471.310021.663877.04706第七章假设检验1、解释零假设与备择假设的含义。零假设又称无效假设或无差异假设,记为H0,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示目前的差异是因为比较的对象之间存在本质不同造成的。2、简述假设检验的基本步骤。假设检验的基本步骤如下:(1)建立检验假设,确定检验水准。(2)计算检验统计量。(3)确定P值,作出统计推断。3、比较单侧检验与双侧检验的区别。选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。例如,在临床试验中,比较甲、乙两种治疗方法的疗效有无差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。若从专业角度无法确定的情况下,一般应采用双侧检验。4、解释I型错误、II型错误和检验效能,并说明它们之间的关系。拒绝实际成立的H0所犯的错误称为I型错误,记为a。不拒绝实际不成立的H0所犯的错误称为II型错误,记为B。如果两个总体参数间确实存在差异,即H1:uHuO成立,按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为(1-B)。三者的关系为:当样本量确定时,a与B成反比,与(1-B)成正比。如果把a设置得很小,势必增加犯II型错误的概率,从而降低检验效能;反之,如果把重点放在减少B上,势必增加犯I型错误的概率,从而降低了置信度。要同时减小a和B,只有通过增加样本含量来实现。5、简述假设检验与置信区间估计的联系。假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,且统计推断结论是等价的。此外,置信区间在回答差别有无统计学意义的同时,还能提供一些假设检验不能提供的信息,并可以提示差别是否具有实际意义。因此,置信区间与假设检验的作用是相辅相成的,将两者结合起来,可以提供更为全面的统计推断信息。二、案例辨析题为了比较非洛地平与常规
本文档为【医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
茉莉花开
暂无简介~
格式:doc
大小:1MB
软件:Word
页数:79
分类:高中语文
上传时间:2022-09-17
浏览量:14