数量方法笔记

数量方法笔记 1 《数量方法》笔记上海中博专修学院金融管理 2010级王有才第一章数据的整理和描述一、数据的分类：按照描述的事物分类： 1．分类型数据：描述的是事物的品质特征，本质表现是文字形式； 2．数量型数据：事物的数量特征，用数据形式表示； 3．日期和时间型数据。按照被描述的对象与时间的关系分类： 1．截面数据：事物在某一时刻的变化情况，即横向数据； 2．时间序列数据：事物在一定的时间范围内的变化情况，即纵向数据； 3．平行数据：是截面数据与...

1 《数量方法》笔记上海中博专修学院金融管理 2010级王有才第一章数据的整理和描述一、数据的分类：按照描述的事物分类： 1．分类型数据：描述的是事物的品质特征，本质表现是文字形式； 2．数量型数据：事物的数量特征，用数据形式表示； 3．日期和时间型数据。按照被描述的对象与时间的关系分类： 1．截面数据：事物在某一时刻的变化情况，即横向数据； 2．时间序列数据：事物在一定的时间范围内的变化情况，即纵向数据； 3．平行数据：是截面数据与时间序列数据的组合。二、数据的整理和图表显示： 1．组距分组法： 1) 将数据按上升顺序排列，找出最大值 max和最小值 min； 2) 确定组数，计算组距 c； 3) 计算每组的上、下限（分组界限）、组中值及数据落入各组的频数 vi (个数)和频率 if（ å å´» m i m ii v yv 1 1＝频数的和组中值）的和（频数平均数），形成频率分布表； 4) 唱票记频数； 5) 算出组频率，组中值； 6) 制表。 2．饼形图：用来描述和表现各成分或某一成分占全部的百分比。注意：成分不要多于 6个，多于 6个一般是从中选出 5个最重要的，把剩下的全部合并成为“其他”；成分份额总和必须是 100％；比例必须于扇形区域的面积比例一致。 3．条形图：用来对各项信息进行比较。当各项信息的标识（名称）较长时，应当尽量采用条形图。 4．柱形图：如果是时间序列数据，应该用横坐标表示时间，纵坐标表示数据大小，即应当使用柱形图，好处是可以直观的看出事物随时间变化的情况。 5．折线图：明显表示趋势的图示方法。简单、容易理解，对于同一组数据具有唯一性。 6．曲线图：许多事物不但自身逐渐变化，而且变化的速度也是逐渐变化的。具有更加自然的特点，但是不具有唯一性。 7．散点图：用来表现两个变量之间的相互关系，以及数据变化的趋势。 8．茎叶图：把数据分成茎与叶两个部分，既保留了原始数据，又直观的显示出了数据的分布。三、数据集中趋势的度量： 1．平均数：容易理解，易于计算；不偏不倚地对待每一个数据；是数据集地“重心”；缺点是它对极端值十分敏感。 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 2 平均数＝数据的个数全体数据的总和 å = = n i x n x 1 1 1 2．中位数：将数据按从小到大顺序排列，处在中间位置的一个数或最中间的两个数的平均数。它的优点是它对极端值不像平均数那么敏感，因此，如果包含极端值的数据集来说，用中位数来描述集中趋势比用平均数更为恰当。 3．众数：数据中出现次数最多的数。缺点是一个数据集可能没有众数，也可能众数不唯一；优点在于它反映了数据集中最常见的数值，而且它不仅对数量型数据（数据都是数值）有意义，它对分类型数据集也有意义；并且能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。 4．分组数据的平均数（加权平均）： å å´» m i m ii v yv 1 1＝频数的和组中值）的和（频数平均数 m为组数，vi为第 i组频数，yi为第 i组组中值。四、数据离散趋势的度量： 1．极差 R＝最大值 max－最小值 min 2．四分位点：第二四分位点 Q2就是整个数据集的中位数；第一四分位点 Q1是所有小于（或等于）Q2的数据所组成的数据集的中位数；第三四分位点 Q3是所有大于（或等于）Q2的数据所组成的数据集的中位数。四分位极差＝Q3－Q1，它不像极差 R 那么容易受极端值的影响，但是仍然存在着没有充分地利用数据所有信息地缺点。 3．方差：离平均数地集中位置地远近； n ynyv v yv v yv n xnx xx n ii i ii i iin i i i 22 22 1 22 22 )(1 )(1 - = - = - =-= å å å ååå å = s iv 是频数， iy 是组中值， å= ivn 即数据的个数， å å= i ii v yv y 即用分组数据计算的平均数。 4．标准差： 2ss = 。变异系数：表示数据相对于其平均数的分散程度。％100´= x V s 第二章随机事件及其概率一、随机试验与随机事件： 1．随机试验： a) 可以在相同的条件下重复进行； b) 每次试验的可能结果可能不止一个，但是试验的所有可能的结果在试验之前是确切知道的； Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 Administrator 高亮 3 c) 试验结束之前，不能确定该次试验的确切结果。 2．样本空间W： a) 所有基本事件的全体所组成的集合称为样本空间，是必然时间； b) 样本空间中每一个基本事件称为一个样本点； c) 每一个随机事件就是若干样本点组成的集合，即随机事件是样本空间的子集； d) 不包含任何样本点的随机事件就是不可能事件f。 3．样本空间的表示方法： a) 列举法： b) 描述法：二、事件的关系和运算 1. 事件的关系： a) 包含关系：事件 A的每一个样本点都包含在事件 B中，或者事件 A的发生必然导致事件 B 的发生，成为事件 B 包含事件 A，记做 ABBA ÉÌ 或者。若 ABBA ÌÌ 且则称事件 A与事件 B相等，记做 A＝B。 b) 事件的并：事件 A和事件 B至少有一个发生的事件称为事件 A与事件 B的并，记做 BABA +或者U 。 c) 事件的交：事件 A 与事件 B 同时发生的事件称为事件 A 与事件 B 的交，记做 ABBA 或者I 。 d) 互斥事件：事件 A与事件 B中，若有一个发生，另一个必定不发生，则称事件 A与事件 B是互斥的，否则称这两个事件是相容的。 f=BAI 。 e) 对立事件：一个事件 B 若与事件 A 互斥，且它与事件 A 的并是整个样本空间 Ω，则称事件 B是事件 A的对立事件，或逆事件。事件 A的对立事件是 A， W== AAAA UI ，f 。 f) 事件的差：事件 A发生，但事件 B不发生的事件，称为事件 A与事件 B的差，记做 A－B。 2．运算律： a) 交换律： ;ABBAABBA IIUI == ， b) 结合律： ;)()()()( CABBCACBACBA == ，UUUU c) 分配律： )()()()()()( CABACBACABACBA IUIUIUIUIU == ，： d) 对偶律： BABABABA UIIU == ，。三、事件的概率与古典概型： 1. 事件 A 发生的频率的稳定值 p称为事件 A 发生的概率，记做： pAP =)( ， 4 10 ££ p 。 2. 概率的性质： a) 非负性： 0)( ³AP ； b) 规范性： 10 ££ p ； c) 完全可加性： å ¥ = ¥ = = 11 )()( i ii i APAP U ； d) 0)( =fP ； e) 设 A，B 为两个事件，若 BA Ì ，则有 )()()( APBPABP -=- ，且 )()( APBP ³ ； 3. 古典概型试验与古典概率计算： a) 古典概型试验是满足以下条件地随机试验： ① 它的样本空间只包含有限个样本点； ① 每个样本点的发生是等可能的。 b) 古典概率的计算： N N AP A=)( ； c) 两个基本原理： ① 加法原理：假如做一件事情有两类办法，在第一类办法中有 m 种不同方法，而在第二类办法中有 n种不同方法，那么完成这件事情就有 m+n种不同方法。加法原理可以推广到有多类办法的情况； ① 乘法原理：假设做一件事情可以分成两步来做，做第一步有 m 种不同方法，做第二步有 n种不同方法，那么完成这件事情有 mn种不同方法。乘法原理也可以推广到多个步骤的情形。 4. 条件概率：在事件 B发生的条件下（假定 P（B）>0），事件 A发生的概率称为事件 A 在给定事件 B 下的条件概率，简称 A 对 B 的条件概率，记做： )( )()|( BP ABPBAP = ； 5. 概率公式： a) 互逆：对于任意的事件 A， 1)()( =+ APAP ； b) 广义加法公式：对于任意的两个事件 A和 B， )()()()( ABPBPAPBAP -+=+ ，广义加法公式可以推广到任意有限个事件的并的情形，特别地： )()()()()()()()( ABCPBCPACPABPCPBPAPCBAP +---++=++ 5 c) 减法公式： )()()( ABPAPBAP -=- ——→ )()()( BPAPBAPBA -=-É ，则； d) 乘法公式：P（AB）＝P（A）P（B|A），P（A）≠0； e) 全概率公式：设事件 A1，A2，…, An两两互斥，A1+A2+……＋An＝Ω（完备事件组），且 P（Ai）>0，i＝1，2，…，n则对于任意事件 B，有： å = = n i ii ABPAPBP 1 )|()()( ； f) 贝叶斯公式：条件同上, 则对于任意事件 B，如果 P（B）>0，有： å = = n i ii ii i ABPAP ABPAP BAP 1 )|()( )|()( )|( ；第三章随机变量及其分布取值带有随机性，但取值具有概率规律的变量称为随机变量。一、离散型随机变量：取值可以逐个列出 1. 数学期望： 1) 定义： å= i ii pxEx ，以概率为权数的加权平均数； 2) 性质：Ec = c (常数期望是本身) E（ax） = aEx (常数因子提出来) E（ax+b）= aEx+b (一项一项分开算) 2. 方差： 1) 定义： å -=-= i ii pExxExxEDx 22 )()( ； 2) 性质：Dc =0 （常数方差等于 0） D(ax) =a2Dx （常数因子平方提） D (ax+b) =a2Dx 3) 公式： 22 )()( ExxEDx -= （方差＝平方的期望－期望的平方）； 3. 常用随机变量： 1) 0-1分布： ① 随机变量 X只能取 0，1这两个值； ① X～B（1，p）； ① Ex＝p Dx＝p(1-p) 2) 二项分布： a) 分布律： nkppCkXP knkkn ¼¼=-== - ，，，， 210)1()( ； 6 b) X～B（n，p） c) Ex=np d) Dx=np(1-p) e) 适用：随机试验具有两个可能的结果 A或者 A ,且 P（A）=p，P（ A）＝ 1－p，将次贝努里试验重复 n次。 3) 泊松分布： a) 分布律： ¼¼=== - 2,1,0 ! )( k k ekXP k ， ll ，λ>0 b) X～P（λ） c) Ex＝λ d) Dx＝λ e) 适用：指定时间内某事件发生的次数。二、连续型随机变量： 1. 设 X是一个连续型随机变量： 1) X的均值，记做μ，就是 X的数学期望，即 μ＝EX； 2) X的方差，记做 DX或 2s ，是 2)( m-X 的数学期望，即: 222 )(])[( mm -=-= XEXEDX 3) X的标准差，记做σ，是 X的方差 2s 的算术平方根，即 2ss = ； 2. 常用连续型随机变量：名称分布律或密度记法 EX期望 DX方差均匀分布 ïî ï í ì ££ -= ，其他，（ 0 )1 )( bxa abxf ],[~ baUX 2 ba + 12 )( 2ab - 指数分布 î í ì £ > = - 00 0 )( x x xf x ，，lll ，λ>0 )(~ lEX l 1 2 1 l 正态分布 0 2 1)( 2 2 2 )( 2 >= - - s ps s m ， x xp l ）， 2(~ smNX μ 2s 标准正态分布 2 2 1 x x x - = l p f ）（ X～N（0，1） 0 1 3. 正态分布的密度曲线 y=P(x)是一条关于直线 x=μ的对称的钟形曲线，在 x=μ处最高，两侧迅速下降，无限接近 X轴；σ越小大，曲线越高扁。 4. 标准正态分布的密度曲线 y＝φ（x），是关于 Y轴对称的钟形曲线。 7 5. 随机变量的标准化 DX EXXX -® （减去期望除标差）。 6. 标准化定理：设 )1,0(~Z(~ 2 NXNX s m sm - ＝），则，。三、二维随机变量： 1. 用两个随机变量合在一起（X，Y）描述一个随机试验，（X，Y）的取值带有随意性，但具有概率规律，则称（X，Y）为二维随机变量。 2. X，Y的协方差：cov（X，Y）＝E[（X－EX）（Y－EY）]=E (XY)-EX· EY，cov（X， Y）>0 说明 X与 Y之间存在一定程度的正相关关系，cov（X，Y）＝0称 X与 Y不相关，cov（X，Y）<0说明 X与 Y存在一定程度的负相关关系； 3. X，Y 的相关系数： DYDX YXr yx ´ = ),cov( , ，取值范围是 11 , ££- YXr ，越接近 1，表明 X与 Y之间的正线性相关程度越强，越接近于－1，表明 X与 Y之间的负线性相关程度越弱，当等于 0时，X与 Y不相关。 4. 随机变量的线性组合： 1) E(aX+bY)=aEX+bEy; 2) )(),(2)()( 22 YDbYXabCovXDabYaXD ++=+ 四、决策准则与决策树： 1. 对不确定的因素进行估计，从几个方案中选择一个，这个过程称为决策； 2. 决策三准则： 1) 极大极小原则：将各种方案的最坏结果（极小收益）进行比较，从中选择极小收益最大的方案； 2) 最小期望损失原则：选择期望损失最小的方案； 3) 最大期望收益原则：选择期望收益最大的方案。 3. 决策树：使我们把不确定因素的过程以图解的形式表示出来，有简单、直观的优点。第四章抽样方法与抽样分布一、抽样基本概念： 1. 总体：研究对象的全体； 2. 个体：组成总体的每一个个体； 3. 抽样：从总体中抽取一部分个体的过程； 4. 样本：从总体中抽出的一部分个体构成的集合； 5. 样本值：在一次试验或观察以后得到一组确定的值； 6. 随机样本： 1) 个体被抽到的可能性相同； 2) 相互独立； 3) 同分布。二、抽样方法： 1. 简单随机抽样：总体中有 n 个单元，从中抽取 r 个单元作为样本，使得所有可能的样 8 本都有同样的机会被抽中。有放回抽样的样本个数为 rn ；无放回抽样的样本个数为 r nC 。 2. 系统抽样（等距抽样）：将总体单元按照某种顺序排列，按照规则确定一个起点，然后每隔一定的间距抽取样本单元。 3. 分层抽样：在抽样之前将总体划分为互不交叉重叠的若干层，然后从各个层中独立地抽取一定数量的单元作为样本。 4. 整群抽样：在总体中由若干个总体单元自然或人为地组成的群体称为群，抽样时以群体为抽样单位，对抽中的各群的所有总体单元进行观察。三、抽样中经常遇到的三个问题： 1. 抽样选取不当； 2. 无回答：处理无回答常用的方法： 1) 注意调查问卷的设计和加强调查员的培训； 2) 进行多次访问； 3) 替换无回答的样本单元； 4) 对存在无回答的结果进行调整。 3. 抽样本身的误差。四、抽样分布与中心极限定理： 1. 不包含任何未知参数的样本函数称作统计量； 2. 常用的统计量： 1) 样本均值： å= n in xx 11 ； 2) 样本方差： å -= - n in xxS 1 2112 )( ； 3) 样本标差： 2SS = 。 3. 统计量的分布叫做抽样分布，当样本容量 n 增大时，不论原来的总体是否服从正态分布，其样本均值都将趋向于正态分布，当 n≥30 时，样本均值就可以近似的服从正态分布。 4. 中心极限定理：设随机变量 X1，X2，……Xn独立同分布，且 EXi＝μ，DXi＝σ 2 ，i＝1，2，……n， å= n in XX 11 ； )( 11 å= n in XEXE ＝ ån in EX11 ＝μ； ååå = ===== n i nni n nin n in nDXXDXDXD 1 21 1 11 1 1 2 222 )()( ss 1) 设随机变量 X1，X2，……Xn独立同分布，且 EXi＝μ，DXi＝σ2，i＝1，2，……n， å= n in XX 11 ，则），（近似 2 30 smN～X n³ ； )1,0( 30 N～ n X n 近似 ³ - s m ； 2) 设随机变量 X1，X2，……Xn 独立同（0，1）分布，则ån i pn～BX1 ),( ，且 9 å -³ n ni pnpnpN～X 1 30 ))1(,( 近似。五、常用的抽样分布 1. 样本均值的抽样分布：总体均值、方差抽样方式样本的期望样本方差有限总体重复抽样 μ n 2s 有限总体不重复抽样 μ 1 2 - -× N nN n s 无限总体任意 μ n 2s 若有限总体不重复抽样 N n <5%时，其修正系数 1- - N nN 近似为 1，样本均值的方差可以简化为 n 2s 。 2. 样本比例的抽样分布：总体比例抽样方法 EP DP 无限总体任意 p n pp )1( - 有限总体有放回抽样 p n pp )1( - 有限总体无放回抽样 p 1 )1( - -- × N nN n pp 若有限总体无放回抽样 N n <5%时，其修正系数 1- - N nN 近似为 1，样本比例的方差可以简化为 n pp )1( - 。六、三种小样本的抽样分布：名称统计量记法上α分位点 χ2分布 χ1，χ2……χn分布 222 2 2 1 cccc =+¼¼++ n χ2～χ2(n) acc a => )]([ 22 nP t分布 X～N（0，1），Y～χ2（n） X，Y相互独立 )(ntt～ aa => )]([ nttP F分布 )( 1 2 nU c～， )(~ 2 2 nV c U，V相互独立， 2 1 / / nV nUF = )( 21 nnFF ，～ aa => )]([ 21 nnFFP ， ),( 1 21 12 )( nnFnnF aa =- ，七、几种重要统计量的分布：设 X～N（μ，σ2），X1，X2，……Xn 是 X 的样本，样本均值 å= n in XX 11 ，样本方差 å -= - n in xxS 1 2112 )( ： 1. t分布： )1()10()( 2 -¾¾¾¾¾ ®¾¾¾ ®¾ -- ntNNX n S n XsX n ～，～，～代替以样本标差标准化 msms sm ； 2. χ2分布： )1(2)1()( 2 2 2 1 2 -=å - - nSnXX n I c ss ～； 10 3. 设 X1，X2，……Xn是），（ 2 11 smN 的样本，Y1，Y2，……Yn是），（ 2 22 smN 的样本，并且都相互独立，则： )10()( 2 2 2 1 2 1 21 2 2 2 1 2 1 )( 21 ，～，～标准化 NNYX nn YX nn ss mmssmm + ---¾¾ ®¾+-- )2( 21 )( 2 1 1 1 21 -+¾¾¾ ®¾ + --- nnt nnS YXS ～合合代替以 mms å -= - 11 1 21121 )( n in XXS ； å -= - 22 1 21122 )( n in YYS ； 2 )1()1( 21 2 22 2 11 -+ -+-= nn SnSnS合第五章参数估计一、参数估计 1. 参数点的估计：设总体分布中含有未知参数θ，从总体中抽取一个样本 X1，X2，…… Xn，用来估计未知参数θ的统计量 Ù q（X1，X2，……Xn）称为参数θ的一个估计量，若 X1，X2，……Xn是样本的一组观察值，则 Ù q（X1，X2，……Xn）称为参数θ的一个点估计值。 2. 估计量的评价标准： 1) 无偏性：设 Ù q 是总体中未知参数θ的估计量，若 qq = Ù E 则称 Ù q 是θ的无偏估计量。样本均值 X 是总体均值μ的无偏估计量， m=XE ；样本方差 S2是总体方差 σ 2 的无偏估计量，ES 2 ＝σ 2 。 2) 有效性：θ的方差最小的无偏估计量称为θ的有效估计量；正态总体的样本均值 X 是总体均值μ的有效估计量。（以上两种情况在样本容量固定的情况下发生；当样本容量增大是 Ù q越来越接近真值。） 3) 一致性：若当样本容量增大时，估计量 Ù q 的值越来越接近未知参数θ的真值，则称 Ù q是θ的一致估计量。样本均值方差是总体均值方差的一致估计量。二、总体均值的区间估计： 1. 设θ是总体分布中的未知参数，X1，X2，……Xn是总体的一个样本，若对给定的α（0< α<1），参在两个估计量 Ù q 1（X1，X2，……Xn）和 Ù q 2（X1，X2，……Xn），使 aqqq -=<< 1)ˆˆ( 21P ，则称随即区间（ Ù q 1， Ù q 2）位参数θ的置信度位 1－α的置信 11 区间。α称为显著水平。 2. 意义：随机区间（ Ù q 1， Ù q 2）包含θ真值的概率是 1－α。 3. )( 2 XXX 21 n NXn smm ，～估计量待估参数总体均值样本， ¾¾¾¾¾ ®¾ ¼¼ ï ï ï î ï ï ï í ì -±¾¾¾ ®¾- - =¾¾¾¾¾¾¾ ®¾ ±¾¾¾ ®¾ - =¾¾¾¾¾ ®¾ ¾¾¾¾¾¾ ®¾ n SntXnt n S Xt n ZXN n XZ S )1()1( )1,0( 2 2 1 a ss a s a m s s m 置信区间代替未知，以小样本置信区间已知大样本，或－标准化，置信度～～ 4. 总体均值的置信区间（置信度 1－α）总体分布样本量 σ已知 σ未知正态分布大样本 n ZX sa 2 ± n ZX sa 2 ± 正态分布小样本 n ZX sa 2 ± n SntX )1( 2 -± a 非正态分布大样本 n ZX sa 2 ± n ZX sa 2 ± 三、总体比例的区间估计：总体比例的置信区间（置信度 1－α）样本量抽样方式置信区间大样本有放回抽样 n PPZP )1( 2 - ± a 无放回抽样 1 )1( 2 - - ´ - ± N nN n PPZP a 四、两个总体均值之差的置信区间（置信度 1－α）总体分布样本量 σ已知 σ未知正态分布大样本 2 2 2 1 2 1 2 nn ZYX ssa +±- 用 S1代替σ1 用 S2代替σ2 正态分布小样本 2 2 2 1 2 1 2 nn ZYX ssa +±- 21 21 2 11)2( nn SnntYX +´-+±- 合a 12 非正态分布大样本 2 2 2 1 2 1 2 nn ZYX ssa +±- 用 S1代替σ1 用 S2代替σ2 五、大样本，两个总体比例之差（ 21 pp - ）的置信区间，置信度（1－α）： 2 22 1 11 2 21 )1()1( n PP n PPZPP -+-±- a 六、样本容量的确定（置信度 1－α）：抽样方式置信区间允许误差样本容量有放回抽样（或抽样比<5％）总体均值 n ZX sa 2 ± n Z sa 2 =D 22 )( D = saZ n 总体比例 n PPZP )1( 2 - ± a n PPZ )1( 2 - =D a 2 2 2 )1( D - = PPZ n a 不放回抽样总体均值 12 - - ´± N nN n ZX sa 12 - - ´=D N nN n Z sa 先算出有放回抽样的样本容量 n0；然后： N n nn 0 0 1+ = 总体比例 1 )1( 2 - - ´ - ± N nN n PPZP a 1 )1( 2 - - ´ - =D N nN n PPZa 第六章假设检验一、假设检验的基本概念： 1. 小概率原理：小概率事件在一次试验中很难发生，但并不意味着绝对不会发生。 2. 对总体参数的取值所作的假设，称为原假设（或零假设），记做 H0；原假设的对立假设称为备选假设（备择假设），记做 H1。 3. 犯“H0为真，但拒绝 H0”这种错误的概率α称为显著水平；这种错误称为第一类错误（弃真错误）； 4. “H0不成立，但接受 H0”的这种错误称为第二类错误；犯这种错误的概率记做β。 5. 用来判断是否接受原假设的统计量称为检验统计量。 6. 当检验统计量取某个范围 D 内的值时，我们拒绝原假设 H0；这是 D 称为拒绝域；拒绝域的边界点称为临界点。 7. 假设检验的基本思想：先假定 H0成立，在这个前提下用样本数据进行推导、计算，如果导致小概率事件发生，择拒绝 H0，否则就接受 H0。 8. 当检验的统计量～N（0，1）时： 13 H0：μ＝μ0 H1：μ≠μ0 双假检验： 2 || aZZ ³ H0：μ＝μ0 H1：μ＜μ0 左侧检验： aZZ -£ H0：μ＝μ0 H1：μ＞μ0 右侧检验： aZZ ³ 9. 假设检验的五个步骤： 1) 提出原假设与备选假设。原则：1、把含有等号的式子作为原假设；2、从样本做出猜测而希望证实的问题作为备选假设； 2) 选取统计量。通过选取适当的统计量来构造小概率事件； 3) 按 P（拒绝 H0/H0真）＝α确定拒绝域； 4) 计算统计量的值； 5) 做出判断：当样本值落在拒绝域内，小概率事件发生，拒绝 H0；当样本值不落在拒绝域内，小概率事件没发生，接受 H0。二、总体均值的假设检验：已知条件 H0 H1 检验统计量及其分布拒绝域 X～N（μ，σ 2 ） σ＝σ0，已知μ ＝μ0，或大样本 μ＝μ0 μ≠μ0 )1,0( 0 0 0 N n XZ H 为真～ s m- = 2 || aZZ ³ μ<μ0 aZZ -£ μ>μ0 aZZ ³ X～N（μ，σ 2 ） σ未知，小样本 μ＝μ0 μ≠μ0 )1( 0 0 - - = nt n Xt H 为真～ s m )1(|| 2 -³ ntt a μ<μ0 )1( --£ ntt a μ>μ0 )1( -³ ntt a 三、总体比例的假设检验：已知条件 H0 H1 检验统计量及其分布拒绝域大样本 0pp = 0pp ¹ )1,0( )1( 0 00 0 N n pp ppZ H 为真～ - - = 2 || aZZ ³ 0pp < aZZ -£ 0pp > aZZ ³ 三、两个总体均值比例之差的假设检验：已知条件 H0 H1 检验统计量及其分布拒绝域 ),( 211 smNX～ ),( 222 smNY～ , σ1，σ2已知， μ1＝μ2 μ1≠μ2 )1,0( 0 2 2 2 1 2 1 N nn YXZ H 为真～ ss + - = （设 0 21 =- mm ） 2 || aZZ ³ μ1<μ2 aZZ -£ μ1>μ2 aZZ ³ 14 或大样本 ),( 211 smNX～ ),( 222 smNY～ ,σ1，σ2未知，或小样本 μ1＝μ2 μ1≠μ2 )2( 11 21 21 0 -+ + - = nnt nn S YXt H 为真合～ )2(|| 21 2 -+³ nnt ta μ1<μ2 )2( 21 -+-£ nnt ta μ1>μ2 )2( 21 -+³ nnt ta 大样本 21 pp = 21 pp ¹ )1,0( )11)(ˆ1(ˆ 0 21 21 N nn PP PPZ H为真～ +- - = 2 || aZZ ³ 21 pp < aZZ -£ 21 pp > aZZ ³ 第七章相关与回归分析一、相关分析： 1. 线性相关：数量的关系近似线性函数； 1) 正线性相关：变量是同向变化； 2) 负线性相关：变量是反向变化； 2. 非线性相关：变量的关系近似非线性函数； 3. 完全相关：变量是函数关系； 1) 完全线性相关：变量的关系是线性函数； 2) 完全非线性相关：变量的关系是非线性函数； 4. 不相关：变量之间没有任何规律。 5. 协方差： EYEXXYEEYXEXXEYX ×-=--= )())((),cov( 总体相关系数： DYDX YXCovrXY ´ = ),( 样本相关系数： YYXX XYii ll l ii YYXX r YYXX ´´ -- å å -- å ＝＝ )()( 22 ))(( å åå ´-= iiiiXY YXnYXl 1 å å-= 22 )(1 iiXX XnXl 15 å å-= 22 )(1 iiYY YnYl 二、一元线性回归： 1. 若对控制变量 X 的每一个确定值，随机变量的数学期望存在，则此数学期望是 X 的函数，称为 Y关于 X的回归函数，记做：μ（X）； 2. 若医院回归函数是线性幻术，则称为一元线性回归（回归直线）； 3. 回归直线 bxay +=ˆ ，其中 xx xy l l b = 称为斜率， XbYa -= 称为截距。 4. 总变差平方和＝剩余平方和＋回归平方和 SST＝SSE＋SSR å å å -+-=-¾¾ ®¾ 222 )ˆ()ˆ() YYYYYY iiii（分解总变差平方和：Y1，Y2,……Yn的分散程度；回归平方和：X1，X2,……Xn的分散性引起的 Y1，Y2,……Yn的分散程度；剩余平方和：其他因素引起的分散程度。 yylSST = xxlbSSR 2= xxyy lblSSE 2-= 5. 判定系数： yy xx l lb SST SSRr 2 2 == 6. 最小二乘法：是使因变量的观察值 yi与估计值 yˆ的 SSE（剩余平方和）达到最小来求得 a和 b的方法；即： å å =--=-= Ù min)()( 2 iiii bxayyyQ 。 7. 估计标准误差： 222 2 1 2 - -- = - - = - = ååå n yxbyay n lbl n SSES iiixxyyy 8. 判定系数的意义： 0≤r 2 ≤1 SSE 意义 r 2 ＝1 SSE＝0， ii yy ˆ= 观察点落在回归直线上，X,Y 完全线性相关 r 2 →1 SSE→0， ii yy ˆÞ 观察点接近回归直线，X，Y高度线性相关 r 2 ＝0 SSE=SST X的变化与 Y无关，无线性相关关系 9. 给定 0xX = ，置信度为 1－α， 0x 的预测区间与 0Ey 的置信区间： 0y 的点估计： 00 bxay += Ù 0x 的预测区间： xx x l xx n Snty 2 0 2 0 )(11)2( -++-± Ù a ； 16 0Ey 的置信区间： xx x l xx n Snty 2 0 2 0 )(1)2( -+-± Ù a 。三、多元线性回归和非线性回归： 1. 多元线性回归： nn xbxbxbay +¼¼+++= 2211ˆ 2. 可线性化的非线性回归：名称方程变量代换线性回归双曲函数 x bay 1+= x x 1' = 'bxay += 对数函数 xbay log+= xx log'= 'bxay += 幂函数 bAxy = yy log' = xx log' = Aa log= '' bxay += 多项式函数 kk xbxbxbby ¼¼+++= 2 210 xx =1 ， 2 2 xx = ，……， k k xx = nn xbxbxbay +¼¼+++= 2211ˆ 第八章时间数列分析一、时间数列的对比分析： 1. 现象在各个时间上的观察值称为发展水平（规模和发展的程度）； 2. 各个时期发展水平的平均数称为平均发展水平（序时平均数）； 3. 序时平均数： 1) 绝对数时期数列：算术平均法 n Y n YYYY n i i n å == +¼¼++ = 121 绝对数时点数列：首末折半法 17 121 1 1 2 32 1 21 ) 2 () 2 () 2 ( - - - +¼¼++ + +¼¼+ + + + = n n nn TTT T YY T YY T YY Y 其中： 121 ,,, -¼ nTTT 是时间间隔长度如果 121 -=¼¼== nTTT ,则： 1 22 12 1 - ++¼¼++ = - n YYYY Y n n 2) 相对数或平均数时间数列的序时平均数： b aY = 4. 时间数列的速度分析： 1) 增长量＝报告期水平－前期水平； 2) 逐期增长量＝报告期水平－前期水平； 3) 累计增长量＝报告期水平－固定基期水平； 4) 发展速度＝基期水平报告期水平； 5) 环比发展速度＝前期水平报告期水平； 6) 定基发展速度＝固定基期水平报告期水平； 7) 增长速度＝ 1＝发展速度－基期水平报告期水平－基期水平； 8) 环比增长速度＝ 1＝环比发展速度－前期水平报告期水平－前期水平； 9) 定基增长速度＝ 1＝定基发展速度－固定基期水平水平报告期水平－固定基期； 10) 平均增长量＝各个逐期增长量的算术平均数＝ 1－观察值的个数累积增长量＝逐期增长量的个数逐期增长量å ； 11) 平均发展速度＝各环比发展速度的几何平均数；水平法： n nr Y YY 0 = 18 累积法： 0 212 Y YYYYYY nnrrr +¼¼++ =+¼¼++ （查表） 12) 平均增长速度＝平均发展速度－1；二、长期趋势分析及预测： 1. 影响时间数列的因素 T：长期趋势； S：季节变动； C：循环变动； I：不规则变动。 2. 时间数列的模型：乘法模型：Y=T×S×C×I；加法模型：Y＝T＋S＋C＋I；混合模型 3. 移动平均法：适当扩大时间间隔，逐期移动，算出移动平均趋势率，消除短期波动（偶数要算两次）； 4. 线性模型法：把时间 t 做自变量，把发展水平 Yt做因变量，用最小二乘法得趋势直线方程。三、季节变动分析： 1. 季节变动得测定： 1) 按月（季）平均法；计算同月（季）平均数（消除随机影响）；计算总月（季）平均数（数据个数全体数据的和）；计算季节指数（％总月（季）数同月（季）平均数 100´ ）；四季季节指数之和＝400％；平均数＝100％；全年指数的和＝1200％；平均数＝100％ 2) 趋势剔除法：先消除趋势变动，再计算季节指数；算出四季（或全年）的移动平均趋势 T；计算趋势值观察值＝ T Y （％），消除趋势变动；将 T Y 按月（季）重新排列，计算同月（季）平均数。 2. 季节变动的调整：算出 S Y （消除季节变动）；根据 S Y 的数据，配合趋势直线 btaYt +=ˆ ， tbS Ya -= )( ， tt t l l b S Y = （t 为时间顺序号）由趋势直线方程，算出调整后的趋势值。 19 四、循环变动的测定：剩余法：从时间数列中消除趋势变动、季节变动和不规则变动。 1) 消除季节变动，计算 S Y ； 2) 根据 Y的数据，配合趋势直线 btaYt +=ˆ ，算出趋势值 T（即 Ù Y ）； 3) 消除趋势变动，算出 T S Y ＝C×I，得到循环变动与不规则变动的相对数； 4) 将 C×I移动平均，消除不规则运动，得到循环变动的相对数。第九章指数一、指数的概念与分类： 1. 按项目多少分——个体指数、综合指数； 2. 按反映的内容分——数量指数、质量指数。 1) 数量指数：反映现象总体规模变动程度的相对数； 2) 质量指数：反映现象质量指标变动程度的相对数。 3. 按计算的形式分——简单指数、加权指数； 4. 按对比场合分——时间性指数、区域性指数。二、加权指数： 1. 确定权数的原则： 1) 求数量质量指数，用数量质量做权数； 2) 求加权综合平均数量指数，用基期数量质量做权数； 3) 求加权综合平均质量指数，用报告期数量质量做权数； 4) 有时会把权数固定在某一特定时期。 2. 加权综合和加权平均：加权综合加权平均权数质量指数数量指数权数质量指数数量指数基期质量 p0 —— å å= 00 10 0 1 qp qp q 基期总量 00qp —— å å = 00 00 0 1 0 1 qp qp p q q 20 报告期数量 1q å å= 10 11 0 1 qp qp p —— 报告期总量 11qp å å= 11 0 1 11 0 1 1 qp p p qp p —— 3. 拉式指数： å å= 00 01 0 1 qp qp p ； 00 00 0 1 00 10 0 1 qp qp q q qp qp q å å å å == ； 4. 帕式指数： 11 0 1 11 10 11 0 1 1 qp p p qp qp qp p å å å å == ； å å= 01 11 0 1 qp qp q ； 5. 数量“拉式”要蹲基；质量“帕式”快报告。 6. 销售额＝价格×销售量； 7. 总量指数＝ å å 00 11 qp qp ＝基期总量报告期总量 8. 总指数＝指数×指数。三、指数体系： 1. 销售额指数＝价格指数× 销售量指数 2. 总量指数＝质量指数×数量指数； 3. 加权综合指数体系： å å å å å å ´= 00 10 10 11 00 11 qp qp qp qp qp qp åååå å å -+-=- )()( 001010110011 qpqpqpqpqpqp ； 4. 加权平均指数体系： å å å å å å ´= 00 00 0 1 11 0 1 11 00 11 1 qp qp q q qp p p qp qp qp )()1( 0000 0 1 11 0 1 110011 ååååå å -+-=- qpqpq qqp p pqpqpqp 5. 个体指数体系： 0 1 0 1 00 11 q q p p qp qp ´= )()( 001010110011 qpqpqpqpqpqp -+-=- 四、常用指数： (一) 零售价格指数 1. 反映商品零售价格变动的相对数。 21 2. 计算：由小到大，用加权平均指数形式分级计算。 å å= w wk p 0 1 ；其中：k为个体或各层的类指数；w为各层零售额比重权数。 (二) 消费价格指数： 1. 是反映一定时期内生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。 2. å å= w wk p 0 1 ；其中：k 为类指数；w 为权数，分别为消费品零售价格和服务项目营业额占两者总和的比重。 (三) 股票价格指数： 1. 股票价格＝存款利息率预期股息票面价值´ 2. 股价平均数＝ å = n i ipn 1 1 ； ip 为第 i中股票的收盘价，n为样本股票数。 3. 股票价格指数： å å= ii ii qp qp p 0 1 0 1 ； ip1 为第 i种样本股票报告期价格， ip0 为第 i种股票基期价格， iq 为第 i种股票的发行量，一般以报告期为权数。 -------------------------------------------------完 ---------------------------------------------

                    本文档为【数量方法笔记】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

数量方法笔记

你可能还喜欢