首页 应用数理统计吴翊版第一章ppt课件

应用数理统计吴翊版第一章ppt课件

举报
开通vip

应用数理统计吴翊版第一章ppt课件*(C)中国民航大学*数理统计**主讲教师张春晓理学院副教授研究兴趣:统计预测与决策、优化与控制办公地点:理学院统计教研室(南1-316)电话:E-mail:**课程成绩考试成绩由期末考试成绩和平时考核成绩两部分组成。平时成绩占15%;期末考试采用闭卷(开卷)笔试方式进行,占85%。答疑时间地点课后或周五下午统计教研室**课程说明⑴教学目的应用数理统计是一门科学,实证的方法,尤其是数量分析方法是统计学研究的基本方法论。通过该门课程教学,使学生掌握统计学的基本理论与方法,并能够建立实用的应用统计模型,解决实际问题。⑵...

应用数理统计吴翊版第一章ppt课件
*(C)中国民航大学*数理统计**主讲教师张春晓理学院副教授研究兴趣:统计预测与决策、优化与控制办公地点:理学院统计教研室(南1-316)电话:E-mail:**课程成绩考试成绩由期末考试成绩和平时考核成绩两部分组成。平时成绩占15%;期末考试采用闭卷(开卷)笔试方式进行,占85%。答疑时间地点课后或周五下午统计教研室**课程说明⑴教学目的应用数理统计是一门科学,实证的方法,尤其是数量 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 方法是统计学研究的基本方法论。通过该门课程教学,使学生掌握统计学的基本理论与方法,并能够建立实用的应用统计模型,解决实际问题。⑵先修课程微积分、线性代数、概率论与数理统计、数学软件、统计学原理。应用数理统计与经济理论、统计学和数学的联系数学统计学数理统计管理学工学其他学科**学习方法⑴理论与应用并重。既要重视理论方法,也要重视应用模型和应用中实际问题的解决;⑵以教材中的经典理论方法为主,也要理解适当引入的、教材中没有的非经典理论方法;⑶对于理论方法,重点是思路而不是数学过程;⑷对于应用模型,重点不是每种模型本身,而是它们演变与发展的方法论;⑸必须十分重视综合练习;⑹必须掌握一种应用软件,注意课堂的软件应用演示,“师傅领进门,修行在个人”,多练。**本课程:应用数理统计;36学时;教材:吴翊等《应用数理统计》,国防科技大学出版社,2003;参考书:清华大学编《现代应用数学手册(数理统计卷)》,科学出版社,2002。统计软件:EXCEL、SPSS、MATLAB(统计分析工具箱)。基础知识见附录I,(以浙江大学《概率论与数理统计》为准)。**能力培养数据的产生:数据怎么得来,非常重要,这是统计当中影响最大的概念;资料分析:你会学到,即使用很简单的方法,也能很睿智地解读数据;概率:利用概率进行思考,可以帮你把事实和无关紧要的干扰信息分离;统计推断:让你学会用手中少量的数据,对一个较大的总体做出结论。**案例许多统计学家在第二次世界大战中发挥了重大的作用,沃德是其中之一。他发明的一些统计方法,在战时被视为军事机密。沃德在被咨询飞机上什么部位的钢板需要加强时,画了飞机的轮廓,并且标出返航的战斗机上受敌军创伤的弹孔位置。资料积累了一段时间后,机身各部位几乎都被填满了。于是沃德建议,把剩下少数几个没有弹孔的位置加强。???因为这些部位被击中的飞机都没有返航。——摘自《统计学的世界》(美)戴维著。**第一章数理统计的基本概念§1.1导言什么是数理统计?统计:指数据的收集、整理和分析,由全部信息(数据)得出正确的唯一结果;数理统计:指有效地收集、整理和分析带有随机性影响的数据,对所观测的部分信息推断合理的结果即进行统计推断,直到为采取决策提供依据。为什么要用数理统计?实际中,数据量大(抽取的数据具有随机性),试验具有破坏性(不可重复)。**数理统计的研究范畴:应用广泛传统上,有生物统计(遗传学、医药)、农业统计、工业统计(民航统计)等;现代,多元统计应用领域:通信、质量控制、气象、地质勘探、市场预测与决策等。数理统计的基本内容:数据采集(抽样理论、试验 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 等)与统计推断(估计、检验等)。统计推断的结果往往有赖于方法,尽可能采用“有效的”方法。“有效的”标准:样本尽可能少,而结果更合理,“大量重复使用该方法总体效果好”——基于概率论原理。**§1.2样本与总体样本:经观察或试验得到的数据——样本(子样);观察或试验的过程——抽样;“抽样调查”:是一种观测研究,抽样的精髓是从检查一部分来得知全体。“你不必吃完整头牛,才知道肉是老的”——西方谚语。**经n次试验得到n个数据——样本容量为n;——一组数据,一个(容量为n的)样本(子样);样本所有可能取值的集合——样本空间(n维空间的子集);数据可以是数值或属性(但要用数值 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示);以一维数据X或Y为研究对象——一元统计;以多维数据(X,Y)为研究对象——多元统计。随机试验(产生样本)要求在相同条件下能够独立重复地进行。样本是随机试验的结果。**(2)样本X1,X2,…,Xn具有二重性:可看成一个n维随机向量,记为(X1,X2,…,Xn);作为样本值记为(x1,x2,…,xn);(1)样本X1,X2,…,Xn相互独立,且与总体X同分布;(3)若总体X具有分布函数F(x),概率密度f(x),则样本(X1,X2,…,Xn)的分布函数及概率密度为:(4)获得简单随机样本的抽样方法称为简单随机抽样.**【例1.3】(P6)设一组抽奖劵共10000张,其中5张有奖。问连续抽取3张有奖的概率为多少?讨论:不放回抽样和放回抽样。随机抽样方式:放回抽样(要求样本独立)由“随机抽样”得到“简单样本”。由于独立同分布,设该分布函数为F(x),则样本联合分布函数为:F(X1)F(X2)…F(Xn);样本联合密度函数为:f(X1)f(X2)…f(Xn)。**总体一般定义:所研究对象的全体的集合——总体。集合的元素——个体。总体和样本的区别是统计里很基本的概念;如,电视收视率调查总体:所有5亿有电视机的中国住户;样本:约5000个住户,住户同意使用“个人电视记录器”来记录该户中每个人收视的节目。所记录的变量包括住户中的人数及其年龄、性别、收视时段、内容等。普查:企图把整个总体纳入样本的抽样调查。**从数学上也可如此定义:总体是指某个随机变量所有可能的取值的全体,或就是一个随机变量X,而样本即是与X同分布且相互独立的一组随机变量X1,X2,…,Xn。【例1.4】两台车床,各车出m,n件零件,尺寸分别为X1,X2,…,Xm和Y1,Y2,…,Yn,视作取自两个总体X,Y的容量分别为m,n的样本。统计推断即由样本推断总体的性质,如上例中,推断两台车床总体上是否有差异。总体的分布——统计模型,统计建模的目的即确定X的分布、参数等。**1.2.3参数与参数空间一般情况下总体分布未知,需要样本信息去推断。【例1.5】(P8)考虑如何由样本X1,X2,…,Xn的实际背景确定统计模型,即总体X的分布函数:(1)样本记录随机抽取的n件产品的正品、废品情况。(2)样本表示同一批n个电子元件的寿命(小时)(3)样本表示同一批n件产品某一尺寸(mm)**1.2.3参数与参数空间当分布类型已知,其中参数未知,则由样本推断参数(估计、检验)。参数的所有可能取值的集合——参数空间(视具体问题而定)统计推断:包括参数推断(分布类型已知)和非参数推断(分布类型未知)两种。**1.3直方图与经验分布函数1.3.1直方图依据概率论的大数定理(附录1柯尔莫哥洛夫强大数定理):频率近似于概率。当总体分布未知,要用样本对总体分布进行非参数推断,常用方法是直方图和经验分布函数。*取a略小于X(1),b略大于X(n),将区间分成m个小区间,记落入小区间中观察值的个数(频数),计算频率;在直角坐标系xoy中画出以为底,为高的矩形,即得到直方图,其对应的分段函数用来近似概率密度函数f(x)直方图的具体做法将所有样本由小到大排序,记为X(1),X(2),…,X(n)*(C)中国民航学院理学院张春晓*【例1.6】P10**【例1.6】(P10)齿轮的径向综合误差ΔFi的直方图**直方图以概率1成立.**1.3.2经验分布函数设总体X的分布函数未知,样本为X1,X2,…,Xn将样本从小到大排序(即求顺序统计量)得到定义:经验分布函数为右连续,间断点处跃度为1/n。以格里文科定理可以证明,*(C)中国民航大学理学院张春晓*0X(1)X(2)X(3)X(n)Fn(x)1xFn(x)的图形为*(C)中国民航大学理学院张春晓*§1.4统计量及其分布在利用样本推断总体的性质时,往往不能直接利用样本,而需要对它进行一定的加工,这样才能有效地利用其中的信息,否则,样本只是呈现为一堆“杂乱无章”的数据.【例1.7】从某地区随机抽取50户农民,调查其人均年收入情况,得到数据(单位:元)如下:试对该地区农民收入的水平和贫富悬殊程度做个大致分析.解:显然,如果不进行加工,面对这一大堆大小参差不齐的数据,很难得出什么印象.但是可以对这些数据稍事加工,如记各农户的人均年收入分别为x1,x2,...,x50,计算得到这样,就可以了解到该地区农民的平均收入和该地区农民贫富悬殊的大致情况:农民的年人均平均收入大约为809.52元,标准差约为155.85元,贫富悬殊不算很大.1.4统计量与抽样分布由此可见对样本的加工是十分重要的.对样本加工,主要就是构造统计量.1.4.1统计量定义设X1,X2,…,Xn为来自总体X的样本,称不含未知参数的样本的函数g(X1,X2,…,Xn)为统计量.若x1,x2,...,xn为样本观测值,则称g(x1,x2,...,xn)为统计量g(X1,X2,…,Xn)的观测值.统计量是处理、分析数据的主要工具.对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数.1.4统计量与抽样分布**几个常用的统计量【例1.8】设X1,X2,…,Xn是来自总体X的一个样本,(x1,x2,…,xn)是其观察值.样本均值样本标准差样本k阶原点矩样本k阶中心矩样本方差**其观察值:样本均值样本标准差样本k阶原点矩样本k阶中心矩样本方差**有关二维总体的统计量:协方差相关系数定义1称E{[X-E(X)][Y-E(Y)]}为随机变量X与Y的协方差,记为Cov(X,Y).即[注]X与Y的相关系数:当XY=0时,称随机变量X与Y是不相关的.若X,Y相互独立,则X与Y不相关;反之不一定成立X和Y的k+l阶混合中心矩设(X1,Y1),(X2,Y2),…,(Xn,Yn)为二维总体(X,Y)的样本,其观测值为(x1,y1),(x2,y2),…,(xn,yn),则下列各量为统计量:(1)样本协方差(2)样本相关系数其中SXY和RXY常分别用来作为总体X和Y的协方差Cov(X,Y)与相关系数XY的估计量.1.4.1统计量【例1.10】设X1,X2,…,Xn是来自总体X的样本,X~N(,2),其中、2为未知参数,则X1,min{X1,X2,…,Xn}均为统计量,但诸如等均不是统计量,因它含有未知参数或.常用的统计量有如下几种:1.4.1统计量**【例1.11】(P14)设△是任意给定的样本空间中的区域,则观察值X1,X2,…,Xn落在△中的频数n△,频率f△=n△/n都是统计量。因为对于固定的x,经验分布函数Fn(x)也是统计量。研究方法时,为随机变量,从而也是随机变量,统计量的分布称为抽样分布.为了研究抽样分布,先研究数理统计中三种重要的分布.**设X1,X2,…,Xn是来自总体N(0,1)的样本,则称统计量的概率密度为这里自由度n表示相互独立的随机变量的个数.来自正态总体的几个常用统计量的分布**f(y)的图形(与n有关):0yf(y)的推导:由前例知,而Xi~N(0,1),由定义Xi2~2(1),再由X1,X2,…,Xn的独立性及分布的可加性即f(y)**分布的可加性【定理1.1】且Y1,Y2,…,Yk相互独立,则有对于给定的正数(0<<1),称满足设由于Xi独立,且注意到N(0,1)的四阶矩为3,可得英国统计学家费歇(R.A.Fisher)曾证明:当n较大时,近似服从【定理1.2】卡方分布的期望与方差**定义1.2设X~N(0,1),Y~2(n),且X与Y相互独立,则称随机变量P(x)图形:(关于x=0对称,其形状与n有关)t(n)分布的概率密度函数为:1.4.3t分布服从自由度是n的t分布(Student分布),记作T~t(n).图**n=(正态)t分布的分位点:注意:若对给定(0<<1),称满足单侧双侧可看出,随着n的增大,t(n)的概率密度曲线与N(0,1)的概率密度曲线越来越接近.可以证明t分布具有下面性质:即当n趋向无穷时,t(n)近似于标准正态分布N(0,1).一般地,若n>30,就可认为t(n)基本与N(0,1)相差无几了.1.4.3t分布**1.4.3F分布F~F(n1,n2)分布的概率密度函数为:服从自由度为(n1,n2)的F分布,记为F~F(n1,n2).设X~2(n1),Y~2(n2),且X与Y相互独立,则称随机变量若F~F(n1,n2),则1/F~F(n2,n1).*(C)中国民航学院理学院张春晓*p(x)的图形F分布的分位点对给定(0<<1),称满足的点F(n1,n2)为F(n1,n2)分布的分位点.F(n1,n2)1.4.4分位数设X为一随机变量,我们知道对于给定的实数x,P{Xx}=,则称x为X的上分位数(点).1.4统计量与抽样分布若X具有密度f(x),P{X>x}=1-说明分位数x右边的一块阴影面积为,即容易看出,X的分位数x是关于的增函数,即增大时x减少.1.4.4分位数1-1.设ZN(0,1),记N(0,1)的上分位数为z,即有P{Z>z}=.由N(0,1)的概率密度的对称性可知所以z1-=–z.2.设2~2(n),记2(n)的上分位数为2(n),即有P{2>2(n)}=.附表中给出了时2(n)的值,当n>40时,由2(n)的渐近性质,有1.4.4分位数【例1.13】求下列分位数(1)z0.975;z0.9(2)t0.25(4);t0.9(25);t0.05(55);(3)20.5(20);20.025(50).(4)F0.05(10,15);F0.1(14,10);解:(1)可由标准正态分布函数表(附表2,P399),对函数值(z0.975)反查表得z0.,975=1.96.z0.9=(1.28+1.29)/2=1.285.(2)t0.25(4)=-t0.75(4)=-0.7407;t0.9(25)=1.3163t0.95(55)z0.95=1.645.1.4.4分位数(3)查附表4得:20.5(20)=31.4104。在附表3表中查不到20.025(200),先查出z0.025=–1.96,再作如下近似计算(4)附表5得到F0.05(10,15)=2.54;在附表5中,查不到F0.1(14,10),但可查出F0.9(10,14)=2.10,故1.4.4分位数*(C)中国民航大學理学院张春晓*1.4.5正态总体的抽样分布【定理1.3】设总体样本(1);(2);(3)与相互独立。*在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究.因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差S2的抽样分布定理.*(C)中国民航学院理学院张春晓*=推导(Ⅰ)所以**(C)中国民航学院理学院张春晓*预备知识相互独立的标准正态随机变量,则n元正态分布向量为,其中为n阶单位矩阵,而,其中。性质:如果,则线性函数仍为正态随机向量,且。(Ⅱ,Ⅲ)证明可以用随机向量方法。(2)证明:令T为正交矩阵所以:**例1.14设X1,X2,…,Xn是来自正态总体N(,2)的样本,证由定理1,定理2且两者独立.由t分布的定义知化简即得结论.***例1.15设X1,X2,…,Xn1与Y1,Y2,…,Yn2分别是来自正态总体N(1,2)和N(2,2)的样本,且这两个样本相互独立.****证明1o由定理2知两者相互独立,由F分布定义可知化简后即得1o。证2o化简后即得2o。**例1设总体X~N(0,1),X1,X2,…,Xn为X的样本,以上列举的几个重要统计量的分布是数理统计中常用的,它们的密度函数形式都较复杂,对于应用者来说,不要求一一推导,但是查表求上分位点是统计中经常遇到的,必须熟练掌握.本节中的四个定理是统计推断的理论依据,要逐步熟悉定理的条件与结论.F(1,1)**答:**样本的性质:1.X1,X2,…,Xn都与总体X同分布;2.X1,X2,…,Xn相互独立.样本均值样本方差本节小结常用的统计量***常用抽样分布t分布F分布来自正态总体X~N(,2):*****(C)中国民航学院理学院张春晓*作业:1.1,1.4,1.7,1.11此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!
本文档为【应用数理统计吴翊版第一章ppt课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
爱赢
公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)
格式:ppt
大小:1MB
软件:PowerPoint
页数:0
分类:互联网
上传时间:2021-03-15
浏览量:25