首页 SPSS统计及分析讲稿第一章统计学概述

SPSS统计及分析讲稿第一章统计学概述

举报
开通vip

SPSS统计及分析讲稿第一章统计学概述SPSS统计及分析主讲:资源环境学院环境工程系魏祥东Laboroffice:8教北525室或518室Tel.ormobile:84618166or13548661643课程的地位与作用本课程是统计与计算机应用中的计算机应用部分,主要要求在学习掌握统计学基本理论知识的前提下通过学习spss统计软件的基本知识与技能,达到利用spss统计软件实现统计过程的计算机化。课程讲授的基本安排本门课程一共80学时,其中课堂讲授40学时,上机实验40学时。课堂讲授采用多媒体教学方式,主要介绍SPSS的基本知识与使用技巧。上机实验是本...

SPSS统计及分析讲稿第一章统计学概述
SPSS统计及分析主讲:资源环境学院环境工程系魏祥东Laboroffice:8教北525室或518室Tel.ormobile:84618166or13548661643课程的地位与作用本课程是统计与计算机应用中的计算机应用部分,主要要求在学习掌握统计学基本理论知识的前提下通过学习spss统计软件的基本知识与技能,达到利用spss统计软件实现统计过程的计算机化。课程讲授的基本安排本门课程一共80学时,其中课堂讲授40学时,上机实验40学时。课堂讲授采用多媒体教学方式,主要介绍SPSS的基本知识与使用技巧。上机实验是本门课程的重要组成部分。要求通过实际操作,熟练掌握课堂讲授的知识。课程考核方式总分100分,其中平时成绩占30分,结业考试70分。平时成绩主要为平时上机考核,占30分。课程结业考试,占70分,采用上机考试占50%。课程学习目的基本掌握SPSS统计软件在数据统计及分析中的应用,具体表现为:掌握运用spss进行统计分析的基本步骤与方法。掌握spss在科学研究中应用的基本技巧。能熟练的运用SPSS完成基本的统计分析并能读懂常见的统计分析结果。课程学习要求1、认真听讲,反复练习。2、勤于思考,勇于尝试。3、互相帮助,共同进步。上机组织管理方式上机时要求固定位置,只要机器没有问题,各人自始至终使用固定的计算机。自己有计算机并安装有SPSS统计软件的,也必须上上机课。上机以小组为单位,不懂的问题首先寻求小组解决,小组解决不了的,再提交老师解决。课程讲授的基本框架第一部分:统计学基础知识统计学简介统计数据整理统计分析的基本特征数课程讲授的基本框架第二部分:SPSS基本概念与基本操作SPSS简介SPSS应用基本程序与注意事项SPSS数据处理基本技巧课程讲授的基本框架第三部分:利用SPSS进行统计分析基本统计分析相关分析均值比较与检验方差分析回归分析非参数检验统计图形的生成与编辑第一节统计的产生和发展一、统计学概念第一章绪论你想过下面的问题吗?当你买了一台电视时,被告知三年内可以免费保修。你想过厂家凭什么这样说吗?说多了,厂家会损失;说少了,会失去竞争,也是损失。到底这个保修期是怎样决定的呢?大学排名是一个非常敏感的问题。不同的机构得出不同的结果;各自都说自己是客观、公正和有道理的。到底如何理解这些不同的结果呢?你如何理解下面说法?“明天降水概率为40%”“我冬天去新加坡度假的概率为10%”“该节目收视率是30%”“调查结果表明20%的观众喜欢某节目”“抽样调查结果的误差为±3%”“支持率的95%置信区间为(25%,30%)”“某学校排名第一”“某县是贫困县”“某国的综合竞争力排名第43位”“该国家属于发展中国家”“该药品疗效99%”“该国贫富差距大”“这个县收入比那个县高”“该结果统计显著”“消费价格指数为120%”“他的血压已经正常了”关于美国选举的两个例子(1)谁会在1936选举中获胜?AlfLondon还是F.D.R.(罗斯福)?LiteraryDigest(文摘)送出一千万份问卷(返回二百四十万份)后,预测London会赢.而Gallop(盖洛普)只问了5000人说Roosevelt(罗斯福)会赢.最后罗斯福和盖洛普赢了,文摘倒闭了,这是为什么?谁会在1948选举中获胜?ThomasDewey还是HarryTruman(杜鲁门)?Crossley,Gallop(盖洛普),Roper的预测都Dewey赢(每个机构用了5000个问卷).最后(包括盖洛普)他们都输了,而杜鲁门赢了.关于美国选举的两个例子(2)站在一个路口,看到每过去20辆小轿车时,也有100辆自行车通过而且平均每10个轿车载有12个人于是,你认为小汽车和自行车在这个路口的运载能力为24:100,这是否正确?为什么?我们在生活和工作中会接触到大量的信息和数据。我们未来会成为经济管理人员或科研工作者,有些人将成为数据的生产者,但大部分人会成为数据的使用者。你必须有能力弄懂别人向你提供的大量数据的涵义。什么样的专门手段能使你高效率地使用数据?答案是“统计学”。究竟什么是统计??“统计”一词本身就有“计数”和“汇总”的意思,是指对大量事物进行汇总计数,因此可以简单地说统计就是总起来计量,即统而计之。统计是以数据为食物的动物统计的本业是消化数据,并产生有营养的结果。它的本质,和母牛相差不多。Data——Statistics——InformationGrass——Cow——Milk曾有一位资深的海外统计学家说过:“统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”经济学家并不一定也没有必要非要具备实践经验,他所必备的应该是对数字的分析能力。经济学家的发言权就来自他对数字的敏感和从数字中看出“门道”的能力。大多数学生在做学位论文时重观点轻数据,非常注重别人的观点并收集到不少他人的文章,但很少考虑自己是否占有数据,是不是从数据出发来思考问题和解释问题。很多念经济学的学生不知道如何看懂数字,如何从数字中发现研究的问题,如何利用数据从事研究,甚至有的研究生根本不知道怎样找到统计数据,只是听说中国的官方数据不太可信。学者不能离开统计而研究政治家不能离开统计而施政企业家不能离开统计而执业经济学家、教育家、人口学家原北京大学校长马寅初人们常说的统计,一般是泛指统计工作、统计资料和统计学。统计工作是统计的实践活动,是对现象总体的数量方面进行统计 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 、统计调查、统计整理、统计分析、统计预测和统计决策过程的总称。统计工作过程四个阶段统计资料是统计工作的成果,是统计工作过程中所取得的各项数据以及与之相联系的情况说明等资料的总称。是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识的科学。统计工作、统计资料和统计学三者具有密切关系。统计工作和统计资料是过程和成果的关系,统计工作的好坏直接影响着统计资料的数量和质量。统计工作和统计学是理论与实践的关系。二、统计的产生与发展原始社会后期:统计萌芽于计数活动;资本主义的兴起:统计扩展到社会经济各方面。奴隶制国家产生:使统计日显重要;封建社会时期:统计已具规模;1、统计产生发展按照统计学的发展历程,我们可以把统计学划分为古典统计学、近代统计学和现代统计学三个时期,如图1.1.2所示。古典统计学近代统计学现代统计学国势学派政治算术学派数理统计学派社会统计学派数理统计学派社会统计学派社会经济统计学派统计学萌芽统计的实践已有四五千年的历史,它是适应人类社会实践活动的需要而产生和发展的。我国早在原始社会末期,在奴隶社会的形成过程中,就出现了社会经济统计的萌芽。从公元前21世纪夏禹立国开始,中国的统计不仅详细地记录重大历史活动成果,如人口和土地数字记载,而且明显地被新兴的奴隶制国家用作治国的手段。(1)、统计学的产生---古典记录统计学到了西周时期,人口调查开始确立了一些 制度 关于办公室下班关闭电源制度矿山事故隐患举报和奖励制度制度下载人事管理制度doc盘点制度下载 。户籍制度在春秋时期有所发展。古埃及公元前29世纪左右,统一的埃及专制统治机构开始形成。从那时起,就先后开始了全国性的人口和财产调查,有了人口和财产数字记载。“统计”词语的产生统计一词最早出现于中世纪拉丁语的Status,意思指各种现象的状态和状况。由这一语根组成意大利语Stato,表示“国家”的概念,也含有国家结构和国情知识的意思。根据这一语根,最早作为学名使用的“统计”,是在十八世纪德国政治学教授阿亨瓦尔(G.Achenwall)在1749年所著《近代欧洲各国国家学纲要》一书绪言中,把国家学名定为“Statistika”(统计)。原意是指“国家显著事项的比较和记述”或“国势学”,认为统计是关注国家应注意事项的学问。此后,各国相继沿用“统计”这个词,并把这个词译成各国的文字,法国译为Statistique,意大利译为Statistica,英国译为Statistics。日本最初译为“政表”、“政算”、“国势”、“形势”等,直到1880年在太政官中设立了统计院,才确定以“统计”二字正名。1903年(清光绪廿九年)由钮永建、林卓南等翻译了横山雅南所著的《统计讲义录》一书,把“统计”这个词从日本传到我国。1907年(清光绪卅三年)彭祖植编写的《统计学》在日本出版,同时在国内发行,这是我国最早的一本“统计学”书籍。“统计”一词就成了记述国家和社会状况的数量关系的总称。古典记录统计学形成期间在十七世纪中叶至十九世纪中叶。它用文字或数字如实记录与分析国家社会经济状况,初步建立了统计研究的方法和规则。到概率论被引进之后,逐渐成为一项较成熟的方法。把古典概率论引进统计学的是法国天文学家、数学家、统计学家拉普拉斯(P.S.Laplace,1749~1827)。另一位对概率论与统计学的结合研究上作出贡献的是德国大数学家高斯(C.F.Gauss,1777~1855)。古典记录统计学形成代表人物:康令(1606-1681)阿痕瓦尔(1719-1772:1764年首创统计学一词)代表作:《近代欧洲各国国势论》他们在大学中开设“国势学”采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。随后德国经济学家和统计学家克尼斯(KGAKnies,1821-1898)在1850年发表的论文《独立科学的统计学》中主张把“国家论”作为“国势学”的科学命名,“统计学”作为:政治算术学“的科学命名德国的记述学派(国势学派〕代表人物:英国的威廉·配第(WilliamPetty,1623-1687)、约翰·格朗特等(JohnGraunt,1620-1674)代表作:《政治算术》威廉·配第的代表著《政治算术》对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。但未用“统计学”一词政治算术学派代表人物:法国的拉普拉斯,比利时的凯特勒。  拉普拉斯把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。  凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“统计学之父”之称。数理统计学派拉普拉斯的主要贡献发展了概率论的研究(出过四版《概率分析理论》)。推广了概率论在统计中的应用结合概率分布模型和中心极限思想研究最小二乘法,首次为统计学中这项后来最常用的手段奠定了理论基础。明确了统计学的大数法则认为只有进行长期大量观察,才能求得事物发展的真实规律。进行了大样本推断的尝试建立了概率积分,提出“拉普拉斯定理”,初步建立了大样本推断的理论基础和利用样本来推断总体的思想方法。另一位对概率论与统计学的结合研究上作出贡献的是德国大数学家高斯(C.F.Gauss,1777~1855)。高斯的主要贡献建立最小二乘法从观察值(Yi,Xi)中确定线性关系Y=α+βx中的二个系数。发现高斯分布发现观察值x与真正值μ的误差变异,服从正态分布。推导出测量误差的概率分布公式。提出“误差分布曲线”,即今天的正态分布曲线。比利时的凯特勒(LAJQuetelet,1796-1874)凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“统计学之父”之称。1867年,韦特斯坦(TWittstein)把既是数学,又是统计学的新生科学命名为数理统计学近代描述统计学形成在十九世纪中叶至二十世纪上半叶。由一批原是研究生物进化的学者们提出,历史上称为生物统计学派。创始人是英国的高尔登(F.Galton,1822~1911),主将是高尔登的学生毕尔生K.Pearson,1857~1936)。(2)、近代描述统计学代表人物:德国的克尼斯、恩格尔、梅尔等。他们强调统计学是研究社会现象的科学,包括统计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系。社会统计学派代表人物:英国的高尔登(F.Galton,1822~1911),主将是高尔登的学生毕尔生(K.Pearson,1857~1936)使统计学逐渐形成一门独立的应用数学生物统计学派高尔登的主要贡献初创生物统计学引入中位数、百分位数、四分位数、四分位差以及分布、相关、回归等重要的统计学概念与方法,明确提出了“生物统计”(Biometry)一词并给出定义。对统计学的贡献提出“平均数离差法则”,创造统计相关法,提出了高尔登相关函数(即现在常用的相关系数)的计算公式,提出了“回归”概念。毕尔生的主要贡献把生物统计学它上升到通用方法论高度。变异数据的处理首创频数分布表与频数分布图。分布曲线的选配首先把非对称的观察曲线分解为几个正态曲线,利用所谓“相对斜率”的方法得到12种分布函数型。卡方检验的提出发现了卡方分布,并提出了有名的“卡方检验法”。回归与相关的发展得出线性相关计算公式,还提出复相关、总相关、相关比等概念。现代推断统计学形成于二十世纪初叶至二十世纪中叶,产生了“推断”的方法掌握事物总体的真正联系以及预测未来的发展。从描述统计学到推断统计学是一个大飞跃,这场变革是在农业田间试验领域中完成的,因此历史上称之为农业试验学派,对现代推断统计的建立贡献最大的是英国统计学家哥塞特(W.S.Gosset,1876~1937)和费雪(R.A.Fisher,1890~1962)。(3)、现代推断统计学代表人物:哥塞特(W.S.Gosset,1876-1937)和费雪(R.A.Fisher,1890-1962)农业试验学派哥塞特的主要贡献:t检验与小样本思想首次在《生物计量学》杂志上发表了“平均数的概率误差”,即t检验。又连续发表了“相关系数的概率误差”、“非随机抽样的样本平均数分布”、“从无限总体随机抽样平均数的概率估算表”等等。使统计学由大样本向小样本、由描述向推断发展。费雪一生共写作论文329篇,流传最广泛的统计学著作《供研究人员用的统计方法》、《自然选择的遗传原理》、《试验设计》、《供生物学、农学与医学研究用的统计表》、《统计估计理论》、《对数理统计的贡献》、《统计方法和科学推断》等。这位多产作家的研究成果特别适用于农业与生物学领域,但它的影响已经渗透到一切应用统计学。R.费雪的主要贡献“通用方法论”指出“统计学是应用数学的最重要部分,并可以视为对观察得来的材料进行加工的数学”。“假设无限总体”提出“所谓假设的无限总体,即现有的资料就是它的随机样本”。抽样分布发表的“无限总体样本相关系数值的频率分布”被称为现代推断统计学的第一篇论文,导出相关系数r的Z分布,编制了《Z曲线末端面积为0.05、0.01和0.001的Z数值分布表》,对t分布、和Z分布加以综合研究,使哥塞特的t检验也能适用于大样本,毕尔生的检验也能适用于小样本,与耶特斯合编了《F分布显著性水平表》。方差分析首创方差和方差分析两词。并对方差分析以及协方差分析进一步作了完整的叙述,大大提高了试验分析效率。试验设计提出试验设计的随机区组法和拉丁方法,完善了试验设计方法,并首先在农业试验站中得到检验与应用,后来又被推广到许多其它科学领域。随机化原则提出了十分重要的“随机化”原则,和耶特斯合作编制了有名的FisherYates随机数字表,把随机化原则以最明确、最具体化的形式引入统计工作与统计研究中。现代统计学的发展趋势统计学依赖和吸收数学更多;以统计学为基础的边缘学科不断形成;与电子计算机技术相结合,应用范围更广,作用更大。三、统计学在中国的传播在解放前,我国统计的应用和发展受到了很大的限制1913年,顾澄教授(1882-?)翻译了英国统计学家尤尔的著作《统计学之理论》,这是数理统计学传入中国之始。后又翻译了英国爱尔窦登的《统计学原理》、美国金氏的《统计方法》、鲍莱的《统计学原理》、密尔斯的《统计方法》。密尔斯的著作被推崇为统计学范本,R.费雪的理论和方法也很快传入中国20世纪30年代,《生物统计与田间试验》就作为农学系的必修课1935年,王绶(1876-1972)编著出版的《实用生物统计法》是我国出版最早的生物统计专著之一1942年,范福仁出版了《田间试验之设计与分析》解放后,许多学者翻译、编著了统计学论著,推动了数理统计方法在中国的普及和应用新中国成立后,中国科学院杨纪柯在介绍、推广数理统计学上作了大量工作。与汪安琦一起翻译出版了G.W.斯奈迪格著《应用于农学和生物学试验的数理统计方法》,还编写出版了《数理统计方法在医学科学中的应用》。接着,郭祖超的《医用数理统计方法》、范福仁的《田间试验技术》、《生物统计学》、赵仁熔的《大田作物田间试验统计方法》相继问世。七十年代,中国科学院数理研究所数理统计组先后出版了《常用数理统计方法》、《回归分析方法》、《方差分析》、《正交试验法》、《常用数理统计用表》。薛仲三的《医学统计方法和原理》、上海师范大学数学系概率统计研究组的《回归分析及其试验设计》(1978)等都有力地推动了数理统计方法在中国的普及和应用。1978年以后,南京农业大学主编《田间试验和统计方法、贵州农学院主编《生物统计附试验设计》、林德光编著《生物统计的数学原理》、张尧庭、方开泰编著《多元统计分析引论》、莫惠栋编著《农业试验统计》、明道绪主编《兽医统计方法》、吴仲贤主编《生物统计》、俞渭江、郭单元编著《畜牧试验设计》等。译著有杨纪珂、孙长鸣翻译R.G.D.斯蒂尔、J.H.托里著的《数理统计的原理与方法适用于生物科学》,关彦华、王平翻译吉田实著《畜牧试验设计》等。随着计算机的迅速普及,统计电算程序SAS,SPSS等的引进,统计学在中国的应用与研究出现了崭新的局面。一、统计学的总体与总体单位(一)统计学的总体1、定义:凡是客观存在的,在同一性质基础上结合起来的许多个别事物的整体,就是统计总体。统计总体简称总体,是从数理统计中借用来的名词,在数理统计中又称母体,与样本相对应。第二节 统计学常用术语1)、同质性统计总体的同质性,实际上就是总体中的各个单位都具有某一个共同的标志表现。总体的同质性是一切统计研究的最重要的前提。2)、大量性总体是由现实存在的许多个别单位组成的,仅仅个别或少数单位不能形成总体。这是因为统计研究的目的是要揭示现象的规律性,而这种规律只有在大量事物的普遍联系中才能表现出来。2、统计学总体的基本特征3)、差异性构成统计总体的单位在某一方面是同质的,但在其他方面又必须是有差异的。也就是说,各单位必须有某一个共同标志表现作为它们形成统计总体的客观依据,但是其余所要研究的标志又必须有变异的表现。4)客观性、相对性等特点统计总体的种类指总体单位可以合计的总体指总体单位不能合计的总体可加总体不可加总体数量总体属性总体(二)、总体单位构成统计总体的每个基本单位或元素称为总体单位。总体单位简称单位或个体,它是各项统计特征的原始承担者。一般地说,统计学是研究总体现象,综合总体的数量特征,因此仅仅对某一个体单位标志值的记述,还不能称为统计。但是另一方面,统计又离不开个体单位。统计研究的过程就是从个体到总体的综合和分析的过程。统计总体与总体单位是互为存在条件地联结在一起的,没有总体单位,总体也就不存在了。统计总体理解要了解我国工业生产经营状况,则全国工业企业就是一个统计总体,每个工业企业就是总体单位。分析:(1)工业企业是客观存在的;(2)由多个企业组成,但性质都一致;(3)每个个别企业就是属于个别单位.总体、总体单位总体、总体单位总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。(一)标志标志:指总体单位所具有的属性和特征,标志的具体表现是在标志名称之后所表明的属性或数值。1、标志的分类(1)、品质标志与数量标志。品质标志表示事物的质的特征,品质标志的具体表现是属性,是不能用数值表示的;数量标志表示事物的量的特征,数量标志的具体表现是数值,是可以用数值表示的。也称为数量标志值,或标志值。(2)、不变标志与可变标志不变标志为各单位具体表现相同,可变标志为各单位具体表现不同。可变的数量标志又被叫作变量二、标志与指标标志标志表现品质标志数量标志性别民族宗教信仰家庭住址年龄身高体重文字表述数据表述(标志值)男汉族佛教43岁182cm75公斤北京路6号变量是可变的数量标志和统计指标。变量的数值表现就是变量值,也就是可变的数量标志和统计指标的不同取值。常数——表示能代表事物特征和性质的数值,在一定过程中是不变的2、变量一节火车车厢有多少坐位是一个固定的数目,称为常数(constant)或者常量。但是,开车后,坐在这节车厢的旅客有多少就没准了。这有随机性。该车厢的乘客数为变量(variable)。一个学校的注册在校男女生比例是固定的,为常量.但是,该校任意一群学生的男女生比例就不一定和全校的比例一样了,它为变量(variable)。变量按其数值是否连续出现,可分为连续变量和离散变量。连续变量是指在一个区间内可以连续不断取值的变量。度量取得、重叠组限、连续分布、概率密度函数离散变量是指一切可能取值都以整数形式出现的变量。计数取得、间断或连续组限、离散分布(二项分布、泊松分布等)(1)、变量的分类人的身高、体重、年龄产品的产量(重量、体积、面积等),产值、销售额等价值量需要使用度量工具取值身高的例子:离散型变量其一切可能取值都以整数形式出现,并可以一一列举的变量特定范围的人口数、汽车数量、企业数量、林木株数、畜禽数量等等取值不需要用工具度量,用计数的方式即可根据变量取值的特点不同将变量分为定量变量和定性变量当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitativevariable);因为是随机的,也称为随机变量(randomvariable)。它是受某种或某几种随机因素影响的变量。如身高体重,购买某商品的人数等等象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitativevariable,或categoricalvariable)或确定性变量。其变量值的变化受某种或某几种确定性因素影响。这些定性变量也可以由定量变量来描述,如男女生的数目,持有某观点的人数比例等等。定性变量只有用数量来描述时,才有可能建立数学模型,并使用计算机来分析。数据中它们通常用哑元(dummyvariable)代表,比如性别用0、1代表,三种收入用0、1、2代表(或用字母代表)总收入-总成本费用=企业利润总收入↓-总成本费用↓=企业利润(↑或↓)总收入↑-总成本费用↓=企业利润(↑)总收入↓-总成本费用↑=企业利润(↓)总收入↑-总成本费用↑=企业利润(↑或↓)确定性变量指受确定性因素影响的变量根据影响变量的因素不同将变量分为确定性变量和随机变量周一下午1时~3时的股票成交量行情预期、各种消息、购买行为、资金数量、新股上市、其它…随机变量指受随机因素影响的变量1、定义:统计指标是说明总体数量特征的概念,简称指标,用来反映事物质的 规定 关于下班后关闭电源的规定党章中关于入党时间的规定公务员考核规定下载规定办法文件下载宁波关于闷顶的规定 性与量的确定性。对统计指标的概念,一般有两种不同的理解和使用方法:一是指反映现象总体数量特征的概念;二是指反映现象总体数量特征的概念和具体数值。(二)指标(1)、数量性:统计指标是数量范畴,“没有没有数量的指标”。某系男生数量占全系学生数的比重为100%某系学生的性别为男“男”不是数量,因此这不是指标,而是标志。2、统计指标的性质(2)、具体性:总体在具体时间、地点、条件下的数量特征,即统计指标“质的规定性”。  住本地(乡、镇、街道),户口在本地;  住本地半年以上,户口在外地;  住本地不满半年,离开户口登记地半年以上;  住本地,户口待定;  原住本地,现在国外工作或学习。常住人口指标解释(3)、综合性:对总体数量特征的综合说明,是由个体数量综合而来的。平均分数统计指标总量指标(单一计量单位)数量指标按表现形式分类按内容特征分类按时间特征分类时期指标(一段时期累计总量及据此计算的相对、平均指标)时点指标(瞬间的总量及据此计算的相对、平均指标)按计量单位分类劳动指标(工、台时等)价值指标(元、美元等)相对指标(无计量单位)平均指标(双重计量单位)质量指标实物指标(吨、台等)3、统计指标的基本分类标志与指标既有区别,又有联系。其主要联系有:(1)有许多统计指标的数值是从所属的总体单位的数量标志值汇总而来的。(2)统计指标与数量标志之间存在着互换关系。其主要区别有:(1)标志是说明总体单位特征的,而指标是说明总体数量特征。(2)标志有不能用数值表示的品质标志与能用数值表示的数量标志两种,而指标都是能用数值表示的,没有不能用数值表示的统计指标。4、标志与指标的关系变异是指统计中的标志或指标间的差别,也就是标志和指标的具体表现各不相同。变异有属性的变异和数值的变异。变异是普遍存在的,是统计的前提条件。有变异才有统计,没有变异就用不着统计了。同质:指事物的性质、影响条件或背景相同或非常相近。5、变异和同质同质与变异的例子例1调查2003年长沙市7岁男童的身高和体重同质:2003年、长沙市、7岁男童变异:身高和体重各不相同例2研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同三、样本和样本容量1.什么是样本?2.什么是样本容量?抽取样本时应注意的问题由总体的部分单位组成的集合样本所包含的总体单位数1、样本的单位必须取自同一总体2、样本个数的多少和样本所包含的单位数量与抽样方法有关。3、样本的抽取必须排除主观因素的影响4、样本去推断总体的特征总是存在一定的误差。样本统计数——通过从样本计算出来的统计数,如样本平均数、样本 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差等。小样本——一般在生物学研究中,样本容量在30个以下称为小样本,大样本——30个以上称为大样本。在一些计算和分析检验方法上,大样本和小样本是不同的。随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。对样本数据进行观察或计算统计指标,目的是推论总体。四、参数与统计量parameterandstatistic参数:总体的统计指标,如总体均数,采用希腊字母记为μ。固定的常数总体参数一般不可能计算出来。推断inference统计量:样本的统计指标,如样本均数,采用拉丁字母分别记为。统计量是参数附近波动的随机变量,是总体参数的估计值。五、误差error、准确性与精确性误差:实际观察值与客观真实值之差1、系统误差2、随机误差错误——是指在试验过程中,人为的作用所引起的差错1、系统误差systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值有系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。(1)选择偏倚(Selectionbias):指在选择研究对象和分组时的非随机化,造成结果的偏倚。如肝癌手术治疗与化疗的疗效比较中,由于手术对象的选择性造成有利于手术组的结果。(2)信息偏倚(Informationbias):指测量方面的误差,特别是主观因素造成的有倾向性的偏倚。如在临床试验中,实验组是在医院测量,对照组是在家中测量。(3)混杂偏倚(Confounding):指实验组与对照组在一些影响实验结果的非处理因素不均衡造成结果的偏倚。如病情轻重、并发症、辅助治疗和护理等因素不均衡。2、随机误差randomerror排除上述误差后尚存的误差,受多种无法控制的因素的影响。特点:大小方向不一的随机变化。随机测量误差(randommeasurementerror)——提高操作者熟练程度可以减少这种误差随机抽样误差(randomsamplingerror):由抽样造成的样本统计量和总体参数间的差异。——不可避免,但有一定的分布规律,可估计。准确性——用统计数接近参数真值的程度来衡量统计数的高低。精确性——用样本中的各个变量间变异程度的大小,来街量该样本精确性的高低。3、准确性与精确性样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。频率与概率间的关系:样本频率总是围绕概率上下波动样本含量n越大,波动幅度越小,频率越接近概率。六、频率frequency七、概率probability概率:随机事件发生的可能性大小,概率就是频率的稳定值。在试验次数较多时,可以用频率作为概率的近似值。概率是事件在试验结果中出现可能性大小的定量计算,是事件固有的属性,有以下明显的性质:任何事件A的概率均满足:0≤P(A)≤1必然事件W的概率为1,即P(W)=1不可能事件(V)的概率为0,即P(V)=0必然事件P=1不可能事件P=0随机事件0 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 。2、咨询职能通过大量统计信息的分析、评价、研究、预测和预警对国民经济、社会发展和科技进步状况进行有效的监督,是把统计部门建设成为多功能智力型机构的战略目标的需要。监督职能是指通过统计调查和统计分析,及时、准确地从总体上反映经济、社会和科技运行状态,并对其实行全面、系统的定量检查、监测和预警,以促进国民经济按照客观规律的要求持续、稳定、协调地发展。3、监督职能上述三种职能,是相互作用、相辅相成的。搜集和提供信息是统计工作最基本的职能。它是保证统计咨询和监督职能得以有效发挥的基本前提。统计的咨询职能是统计信息职能的延续和深化。统计的监督职能是通过信息反馈来评判、检验决策方案是否科学、可行,并及时对决策执行过程中出现的偏差提出矫正意见。它是在信息、咨询职能基础上的统计职能的进一步扩展。而统计监督职能的强化,又必然要对信息和咨询职能提出更高的要求,从而促进统计信息和咨询职能的优化。统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.本课程内容重点在于介绍数理统计的一些重要概念和典型方法,它们是实际中最常用的知识.二、学习统计学的方法学习统计无须把过多时间用在计算上,重点要把时间用在对基本概念、方法原理的正确理解上.这由于有统计软件包:SAS,SPSS,STAT等,都可以快速、简便地进行数据处理和分析.常用的Excel软件有强大的统计功能,也不需要专门学习其他应用软件就可以完成计算。先要弄清楚统计学的基本原理和基本公式的使用条件科学的统计思维方法必须联系实际,结合专业,了解统计方法的实际应用(多做练习题);必须花足够的时间认真学习不完全按照本教材讲,要给大家补充一些实用的东西要使本课程成为一门有意思的课,强调统计学的应用计算机与统计学希望对大家的学习、生活和未来发展有所帮助或启发需要说明的几点
本文档为【SPSS统计及分析讲稿第一章统计学概述】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
爱赢
公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)
格式:ppt
大小:1MB
软件:PowerPoint
页数:0
分类:教育学
上传时间:2021-02-19
浏览量:13