~ 学年 第 学期期 末 考试试卷( 1 )卷
一、填空题(每空1分,共10分)
1、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为 ( )。
2、有两个变量数列,甲数列均值为100,标准差为12.8,乙数列均值为14.5,标准差为3.7,比较两数列均值的代表性结果为( )。
3、、最小平方法的条件是( )。
4、已知物价上涨后,居民用同样多的货币购买的商品数量却少15%,则物价指数为( )。
5、某企业1996年产量为125,1997年比上年增长20%,1998年比1997年增长20%,则1998年比1996年增长( )。
6、在重复抽样下,要使抽样允许误差减少2/3,则
样本
保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载
单位数要( )。
7、在某个电视节目的收视率调查中,随机抽取由165个家庭构成的样本,其中观看该节目的家庭有101个。用90%的置信水平构造的估计观看该节目的家庭比率的置信区间为( )
(可供选择的临界值Z0.025=1.96、Z0.05=1.645 Z0.005=2.58)
8、评价估计量的标准有无偏性、有效性和( )。
9、编制总指数的方法有加权综合指数和( )。
10、某企业某年各月月末库存额资料如下(单位:万元):48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。则全年平均库存额为( )。
二、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内,选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
1、统计学的核心内容是 c
A数据的收集 B数据的整理 C数据的
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
D数据的分组 E以上都不对
2、下列指标中属于质量指标的有( )
A 国民收入 B 平均工资 C 计划完成程度 D 出勤率 E 总产量数
3、变量是可以取不同数值的量,变量的数量表现是变量值,所以
A 数量标志和所有统计指标是变量 B 所有标志值和指标值是变量
C “工业企业总产值”是个变量值 D 变量不包括品质标志 E “某企业工业总产值20万元”是个变量值
4、下列项目中属于非全面调查的有
A.重点调查 B.抽样调查 C.典型调查 D.全面统计报表 E.定期调查
5、编制时间数列的可比性原则包括abce
A.时间方面的可比 B.总体空间范围的可比 C.统计指标内容和计算方法的可比
D.统计指标的名称和含义可比 E.统计指标的计量单位和计算价格的可比
6、从一个总体中可以抽取一系列样本,所以
A. 样本指标的数值不是唯一确定的 B. 所有可能样本的平均数的平均数等于总体平均数 C. 总体指标是确定值,而样本指标是随机变量 D.总体指标和样本指标都是随机变量 E. 所有可能样本的标准差等于总体的标准差
7、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题A 现象的变化是否有周期性 B 原数列的项数 C 原数列波动大小
D 是否需要移动平均数列的首尾数值 E是时期数列还是时点数列
8、在编制指数时,确定同度量因素需要考虑的问题有
A 各指标间的经济联系 B 同度量因素的可比性 C 同度量因素固定的时期
D 实际条件和使用上的方便 E 同度量因素是否符合指数形式
9、分类抽样中的类与整群抽样中的群相比,有
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小 E 要求群内差异小,类内差异大
10、一元线形回归方程中的回归系数ac
A 能说明两变量间的变动方向 B不能说明两变量间的变动方向 C 能表明两变量间的变动程度
D不能表明两变量间的变动程度 E 其数值大小受计量单位的影响
二、简答题(每题6分,共30分)
1、 什么叫统计分组?简述等距式组距分组的步骤及应注意的问题。
2、 简述测定季节变动的“趋势-循环剔除法”的基本步骤和原理。
3、什么叫标准差系数?计算它有何意义?
4、平均指标指数是总指数还是一般相对数?可变构成指数、固定构成指数和结构变动影响指数三者在分析意义上有何区别,在数量上又有何联系?
5、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
三、计算题(共40分)(要求:写出公式及计算过程,第3、4题列表计算)
1、某地甲、乙两个农贸市场三种蔬菜价格计销售额资料如下表:
品种
单价 (元/千克)
销售额(元)
甲市场
乙市场
A
B
C
2.00
2.20
2.60
2200
1540
520
800
1320
2600
要求:比较两个市场蔬菜的平均价格,并说明原因。(5分)甲:2.31 乙:2.36
2、1995年2月,某个航线往返机票的平均折扣费是258美元。随机抽取了在3月份中15个往返机票的折扣作为一个简单随机样本,结果如下: 310,260,265,255,300,310,230,250,265,280,290,240,285,250,260。要求:(1)计算样本平均数和标准差。均值:270,
(2)以95%置信水平估计该航线3月的往返机票的平均折扣费及其方差、标准差的置信区间。
(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(14)=2.1448、 t0.05(14)=1.7613,X20.025(14)=26.119、X20.975(14)=5.629、X20.05(14)=23.658、X20.95(14)=6.571 ) (15分)
3、某高校的团委作一项调查,得到五名同学的统计学成绩与其学习时间的资料如下:
学习时间(小时)
考试成绩(分)
4
6
7
10
13
40
60
50
70
90
要求:(1)计算相关系数,说明相关程度;(2)配合简单线性回归方程,并对方程中回归系数的经济意义做出解释(10分)
4某地三种商品的销售情况如下:
商品
计量单位
销售量
价格(元)
基期
报告期
基期
报告期
甲
乙
丙
件
台
个
12500
12000
6000
15000
16800
5700
10.0
60.0
2.0
11.0
54.0
2.3
要求:(1)计算这三种商品销售额指数及销售额增减额;(2)从相对数和绝对数两方面对销售额变动进行因素分析;(3)用文字说明分析结果。(10分)
答案:
统计学卷1答案及评分标准
一、填空题(1分×10)
1. 88,88 2. 甲好于乙 3. 4. 117.7% 5. 44%
6. 扩大到原来的9倍 7. 11%±3% 8.无偏性、有效性和一致性 9.加权综合指数法和加权平均法 10. 41
二、不定向选择(2分×10)
1. C 2. BCD 3.A DE 4. A BC 5 AB CE 6. ABC 7ABC 8ACE 9.BCD 10. AC
三、简答题(6分×5)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N为数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2、在具有明显的长期趋势变动的数列中,为了测定季节变动,必须先将趋势变动因素在数列中加以剔除,然后用平均的方法消除不规则变动,而后计算季节比率的,就称为趋势剔除法。数列的长期趋势可用移动平均或趋势方程拟合法测定。假定包含趋势变动的时间序列的各影响因素以乘法模型形式组合,其结构为Y=T·C·S·I,以移动平均法测定趋势值,则确定季节变动的步骤如下: (1)对原序列进行12个月(或4个季度)移动平均数,消除季节变动S和不规则变动I ,结果只包含趋势变动T和循环变动C ;(2)为剔除原数列中的趋势变动T和循环变动C ,将原数列各项除以移动平均数的对应时间数据(3)将消除趋势变动后的数列各年同月(或同季)的数据平均,消除不规则变动I,再分别除以总平均数,得季节指数S 。(4)对季节指数再调整。
3又称离散系数,是用来对两组数据的差异程度进行相对比较的。因为在比较相关的两组数据的差异程度时,方差和标准差是以均值为中心计算出来的,因而有时直接比较方差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数。计算公式为
4 是一般的相对数,可变构成指数=固定构成指数×结构变动影响指数即
5 二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
四 计算题
1、甲市场H= 2.13元/千克
乙市场H=2.36元/千克 乙高于甲,甲市场价低的A商品比重大,乙市场价高的C商品比重大。(5分)
2、样本均值=270,样本标准差=24. 785 查
3月机票平均折扣费95%的置信区间是270± =270±13.73
由X20.025(14)=26.119、X20.975(14)=5.629,总体方差的置信区间为
即(329.27,1527.83)标准差的置信区间为
(18.15,39.09)(15分)
3. 时间为x, 成绩为y, n=5,
高度相关
设一元线性回归模型为:
学习时间每增加一个单位(一小时),成绩提高5.2分。(10分)
4、指标体系:
126.64%=136.45%×92.81%,
228310=312400+(-84090)
计算结果表明:(1)三种商品的销售量平均增长36.45%,使销售额增长312400元;(2)商品的价格平均降低7.19%,使销售额减少84090元;(3)由于销售量和价格两个因素变动的结果,使销售额增长26.64%,增加228310元。(10分)
~ 学年 第 学期期 末 考试试卷 ( 2 )卷
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
一、判断题(判断正误,正确的在括号内打√,错误的打×,每个判断1分,共10分)
1、在全国人口普查中,总体是全国总人口,总体单位是每一户,全国总人口数是变量。( )
2、对于有限总体只能进行全面调查。( )
3、众数、中位数都是位置代表值,它们不受极值的影响,对于偏态分布它们的代表性好于均值。( )
4、对离散型变量只能编制组距数列,对连续型变量既可以编制组距数列也可以编制单项数列。( )
5、几何平均法适用于变量的连乘积等于总比率或总速度的现象。( )
6、权数本身对加权算术平均数的影响取决于权数绝对值的大小。( )
7、在其他条件不变下,提高估计的置信度,会加大允许误差,要减小允许误差,就要降低估计的可靠程度。( )
8、说明数据分布离散程度的标准差数值越大,则表明平均数的代表性越小。( )
9、最小平方法的思路是使各实际值与估计值之间的离差和为最小,以此估计参数,拟合趋势或回归方程。( )
10、已知物价上涨后,居民用同样多的货币购买的商品数量却少15%,则物价指数为117.7%。( )
二、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内,选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
1、统计学的核心内容是
A数据的收集 B数据的整理 C数据的分析 D数据的分组 E以上都不对
2、下列变量中属于离散变量的有
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
3、编制动态数列的重要条件是动态数列的每个指标必须具有
A 可加性 B 可比性 C 完整性 D 连续型 E 间隔性
4、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为
A 88 、91 B 85、91 C 88、88 D 85、88 E 85、93
5、抽样调查遵循随机原则的原因是
A 样本容量有限 B 保证总体中每个单位有同等机会被抽中 C 能确定抽样方法
D 能确定推断的可靠程度 E 能计算抽样误差
6、在编制指数时,确定同度量因素需要考虑的问题有
A 各指标间的经济联系 B 同度量因素的可比性 C 同度量因素固定的时期
D 实际条件和使用上的方便 E 同度量因素是否符合指数形式
7、分类抽样中的类与整群抽样中的群相比,有
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小 E 要求群内差异小,类内差异大
8、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题
A 现象的变化是否有周期性 B 原数列的项数 C 原数列波动大小
D 是否需要移动平均数列的首尾数值 E是时期数列还是时点数列
9、某企业1996年产量为125,1997年比上年增长20%,1998年比1997年增长20%,则1998年比1996年增长
A 20% B 40% C 60% D 44% E 40%
10、每吨铸件成本(元)和每一工人劳动生产率(吨/人)之间的回归方程是:,这说明劳动生产率每提高一吨,成本
A 平均降低269.5元 B 平均提高269.5元 C 平均降低0.5元 D 平均提高0.5元 E 以上都不正确
二、简答题(每题6分,共30分)
1、描述次数分配表的编制过程。
2、简述测定季节变动的原始资料平均法的基本步骤和原理。
3、什么叫估计量?评价估计量的标准有哪些?
4、平均指标指数是总指数还是一般相对数?可变构成指数、固定构成指数和结构变动影响指数三者在分析意义上有何区别,在数量上又有何联系?
5、简述相关分析和回归分的关系。
三、计算题(共40分)(要求:写出公式及计算过程,第3、4题列表计算)
1、有两个工厂生产三种产品的成本资料如下表:
品种
单位成本(元)
总成本(元)
一厂
二厂
甲
乙
丙
15
20
30
2100
3000
1500
3225
1500
1500
要求:比较两个厂的总平均成本的高低,并说明原因。(5分)
2、在正常生产情况下,某厂生产的圆形零件的直径服从均值为20mm、标准差为1mm的正态分布。从某日生产的零件中随机抽查6个,测得直径分别为:19,19.2,20.5,19.6,20.8,20.1(单位:mm)。
(1)计算样本均值和标准差。
(2)以95%的置信水平估计零件直径及其方差、标准差的置信区间。 (请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(5)=2.5706、 t0.05(5)=2.0150,X20.025(5)=12.833、X20.975(5)=0.831、X20.05(5)=11.072、X20.95(5)=1.145 ) (15分)
3、某工业企业某种产品产量与单位成本资料如下
年份
1993 1994 1995 1996 1997 1998 1999 2000
产品产量(万件)
单位成本(元/件)
2 3 4 3 4 5 6 7
73 72 71 73 69 68 66 65
要求:(1)计算相关系数,说明相关程度;(2)配合简单线性回归方程,并对方程中回归系数的经济意义做出解释(10分)
4、某企业生产三种产品,有关资料如下表:
产品种类
基期
价格(元)
产量(万件)
基期
报告期
个体指数 (%)
甲
乙
丙
10
9
8
20
16
15
21.84
19.44
14.79
109.2
121.5
98.6
要求:用综合指数和平均指数两种方法,计算该企业三种产品产量总指数,结合计算结果分析两种指数编制法区别与联系. (10分)
统计学卷2答案及评分标准
一 判断题(1分×10)
1. × 2. × 3. √ 4. × 5. √ 6. × 7. √ 8. √ 9. × 10 √
二、不定向选择(2分×10)
1. C 2. ABD 3 B 4C 5 BE 6 ACE 7 BCD 8 ABC 9. D 10 C
三、简答题(6分×5)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N为数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2、又称按月(或季)平均法,这种方法不考虑长期趋势影响,根据原始数据直接计算季节指数,测定季节变动。
(1)计算各年同月(季)的平均数 (i=1~12月或i=1~4季),目的消除各年同一季度(月份)数据上的不规则变动;
(2)计算全部数据的总平均数 ,找出整个数列的水平趋势;
(3)计算季节指数S i,即
(i=1~12月或i=1~4季)
3、(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。
(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。
(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。
4、是一般的相对数,可变构成指数=固定构成指数×结构变动影响指数即
5二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
四 计算题
1一厂H= 19.41
二厂H=18.31 前高于后,一厂价低的产品比重小,乙市场价低的产品比重大。(5分)
2、 样本均值=19.87,样本标准差=0.72mm
查
零件直径95%的置信区间是19.87± =19.87±0.76即(19.11,20.63)
由X20.025(5)=12.833、X20.975(5)=0.831,总体方差的置信区间为
即(0.202,3.119)标准差的置信区间为(0.45,1.77)(15分)
3、产量为x, 单位成本为y, n=10,
高度相关
设一元线性回归模型为:
产量每增加一个(一万件)单位,单位成本提高9.05元。(10分)
4、
综合指数法是先综合后对比;平均指数法是先对比后平均,二者计算产量总指数结果相同。(10分)
~ 学年 第 学期 期末 考试试卷 3
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
一、填空题(每空1分,共10分)
1、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,样本是( )。
2、某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为( )。
3、已知物价上涨后,居民用同样多的货币购买的商品数量却减少15%,则物价指数为( )。
4、根据季节时间数列资料计算的各季节比率之和应等于( )。
5、已知一个总体均值95%的置信区间为(122,130),如果样本均值和标准差分别为126和16.07,则研究时应抽取的样本容量为( )。
6、综合评价指数的编制方法有( )和( )。
7、已知总体标志值的平均数为13,各标志值平方和的平均数为174,则标准差系数为( )。
8、对200件产品进行检查,发现合格品为180件,不合格品为20件,则其是非标志的平均数为( )。
9、用水平法求平均发展速度本质上是求( )平均数。
二、不定项选择题(每小题2分,共20分。在备选答案中,有一个或多个是正确的,请把正确答案的题号括号内,错选无分,漏选一个扣0.5分。)
1、下列变量中属于离散变量的有( )。
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
2、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为 ( )。
A 88 、91 B 85、91 C 88、88 D 85、88 E 85、91
3、可变构成指数、结构影响指数和固定构成指数的关系是( )。
A 固定构成指数等于结构影响指数与可变构成指数之积
B 可变构成指数等于结构影响指数与固定构成指数之积
C 结构影响指数等于可变构成指数与固定构成指数之积
D 可变构成指数等于结构影响指数与固定构成指数之和
E固定构成指数等于结构影响指数与可变构成指数之和
4、某企业某年各月月末库存额资料如下(单位:万元):48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。则全年平均库存额为( )。
A 52 B 41 C 41.33 D 50 E 都不正确
5、在编制总指数时同度量因素的作用有( )。
A 同度量作用 B 平衡作用 C 权数作用 D 协调作用
6、在下列叙述中,正确的是( )。
A 如果抽样分布的均值不等于总体参数时,则该统计量被称为参数的有偏估计。
B 样本方差可以估计总体方差 C 样本均值可以估计总体均值
D 样本比率可以估计总体比率 E 以上都不正确
7、统计指数的作用是( )。
A 综合反映现象的变动方向 B 综合反映现象的变动程度 C对复杂现象总体中各因素进行分析
D研究现象在长时期内变动趋势 E 解决不同性质数列之间不能对比的问题 F 反映事物在空间上的变异程度
8、下列对数量指标指数的权数叙述正确的是( )。
A 通常固定在基期水平 B 可以选择固定在计算期水平上
C 可以采用计算期和基期的“交叉”水平 D 以上都正确 E 以上都不正确
9、随机抽取400人的一个样本,发现有26%的上网者为女性。则女性上网者比率95%的置信区间为( )。
A (0.217,0.303) B (0.117,0.403) C(0.217,0.403) D (0.117,0.503)
10、从一个总体中抽取16个样本,其标准差为6.2022,则总体方差的置信度为95%的置信区间为( )。
A (4.58,9.60) B (5.20,9.78) C (4.72,9.20) D (4.90,9.77)
(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
三、简答题(每题6分,共30分)
1、什么叫统计分组?简述对数据进行组距分组的步骤。
2、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
3、简述移动平均法的基本思想。
4、标志与指标的区别与联系?
5、评价估计量的标准有哪些?
四、计算题(每题10分,共40分。要求写出公式及计算过程,第3题列表计算)
1、若已知甲、乙两个企业1980年的产值分别为300万元和500万元,1994年的产值分别为800万元和1500万元。要求:(1)分别计算甲、乙两个企业产值的平均发展速度;
(2)若按各自的速度发展,甲企业从现在起还需几年才能达到乙企业1994年的产值水平?
(3)若要求甲企业在五年内达到乙企业1994年的产值水平,则每年应递增多少?
2、已知某袋装糖果的重量近似服从正态分布,现从一批糖果中随机抽取16袋,检测结果,样本平均重量为503.75克,标准差为6.022克。试求这批袋装糖果的平均重量的置信度为95%的置信区间。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
3、为研究某一化学反应过程中,温度X对产品得率Y的影响,测的数据如下:
温度X
100
110
120
130
140
150
160
170
180
190
得率Y
45
51
54
61
66
70
74
78
85
89
要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程。
4、某商店销售三种商品,有关资料如下表:
商品种类
销售额(元)
基期
报告期
个体价格指数(%)
甲
乙
丙
1000
900
4800
840
720
4968
120
100
90
要求:试根据上述资料建立适当的指数体系,并结合计算结果进行因素分析。
试卷3答案及评分标准
一、填空题(1分×10)
1、100所中学的高中学生 2、65 3、117.7% 4、4 5.62
6、标准比值法、功效系数法 7.17.2% 8、0.9或90% 9、序时
二、不定项选择题(2分×10)
1、ABD 2、C 3、B 4、B 5、AC 6、ABCD 7、ABCDF 8、ABCD 9、A 10、A
三、简答题(6分×5)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N位数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2、二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
3、移动平均法的基本原理,是通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。它是选择一定的用于平均的序时项数N,采用对序列逐项递移的方式,对原数列递移的N项计算一系列序时平均数,由这些序时平均数所形成的新数列,一定程度上消除或削弱了原序列中的由于短期偶然因素引起的不规则变动和其他成分,对原序列的波动起到一定的修匀作用,从而呈现出现象在较长时间的发展趋势。
4、区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数值表示,而标志中的品质标志不能;指标数值是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间、地点等条件,但作为一个完整的指标,一定要受到时间、地点、范围等条件的限制。
联系:许多统计指标的数值都是由总体各单位的数量标志汇总得来的;指标与数量标志在一定条件下可以转化。
5、(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。
(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。
(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。
四、计算题(10分×4)
1、 解:(1)甲企业 =107.26% 乙企业 =108.16%
(2)8.97(年) (3)113.40%-1=13.4% 应递增13.4%
2、解:样本平均重量为, 样本标准差,,则允许误差为
即这批袋装糖果平均重量的置信度为95%的置信区间为:503.75±3.305克,即在(500.45,507.06)之间。
3、解:(1)
编号
X
Y
XY
X2
Y2
1
100
45
4500
10000
2025
2
110
51
5610
12100
2601
3
120
54
6480
14400
2916
4
130
61
7930
16900
3721
5
140
66
9240
19600
4356
6
150
70
10500
22500
4900
7
160
74
11840
25600
5476
8
170
78
13260
28900
6084
9
180
85
15300
32400
7225
10
190
89
16910
36100
7921
合计
1450
673
101570
218500
47225
,计算结果表明X与Y为高度相关。
(2)设一元线性回归模型为:
则
所以回归方程为:
4、解:指标体系:
进一步计算得: 97.43%=103.58%×94.06%,
(6528-6700)=(6940-6700)+(6528-6940) -172=240-412
计算结果表明:(1)三种商品的数量平均增长3.58%,使销售额增长240元;(2)三种商品的价格平均下降5.94%,使销售额减少412元;(3)由于销售量和销售价格两个因素变动的结果,使销售额下降2.57%,减少172元;
XX大学 ~ 学年 第 学期 期末 考试试卷 4
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
注意:请将第一、二题的答案填入下表相应空格内,答错位置不得分。
一、
填空题
1
2
3
4
5
6
7
8
9
10
二、不定项选择题
1
2
3
4
5
6
7
8
9
10
一、填空题(每空1分,共10分)
1、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,样本是( )。
2、某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为( )。
3、按习惯做法,采用加权调和平均形式编制的物量指标指数,其计算公式实际上是( )综合指数公式的变形。
4、根据季节时间数列资料计算的各季节比率之和应等于( )。
5、已知一个总体均值95%的置信区间为(122,130),如果样本均值和标准差分别为126和16.07,则研究时应抽取的样本容量为( )。
6、时间数列的两个基本构成要素是( )和( )。
7、已知总体标志值的平均数为13,各标志值平方和的平均数为174,则标准差系数为( )。
8、对200件产品进行检查,发现合格品为180件,不合格品为20件,则其是非标志的平均数为( )。
9、用水平法求平均发展速度本质上是求( )平均数。
二、不定项选择题(每小题2分,共20分。在备选答案中,有一个或多个是正确的,请把正确答案的题号括号内,错选无分,漏选一个扣0.5分。)
1、下列变量中属于离散变量的有( )。
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
2、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为 ( )。
A 88 、91 B 85、91 C 88、88 D 85、88 E 85、91
3、最小平方法的基本思想是( )。
A、观测值与估计值离差和为零 B、观测值与估计值离差平方和为零C、观测值与估计值离差平方和最小
D、观测值与估计值离差和为最小 E、观测值与估计值离差和小于零
4、已知物价上涨后,居民用同样多的货币购买的商品数量却减少15%,则物价指数为( )。
A 无法计算 B 15% C 85% D 117.7% E 都不正确
5、在编制总指数时同度量因素的作用有( )。
A 同度量作用 B 平衡作用 C 权数作用 D 协调作用
6、进行指数体系分析的作用是( )。
A 解决不同性质数列之间不能对比的问题 B 进行因素分析 C 根据已知推断未知 D 以上都正确
7、统计指数的作用是( )。
A 综合反映现象的变动方向 B 综合反映现象的变动程度 C对复杂现象总体中各因素进行分析
D研究现象在长时期内变动趋势 E 解决不同性质数列之间不能对比的问题 F 反映事物在空间上的变异程度
8、下列对数量指标指数的权数叙述正确的是( )。
A 通常固定在基期水平 B 可以选择固定在计算期水平上
C 可以采用计算期和基期的“交叉”水平 D 以上都正确 E 以上都不正确
9、随机抽取400人的一个样本,发现有26%的上网者为女性。则女性上网者比率95%的置信区间为( )。
A (0.217,0.303) B (0.117,0.403) C(0.217,0.403) D (0.117,0.503)
10、从一个总体中抽取16个样本,其标准差为6.2022,则总体方差的置信度为95%的置信区间为( )。
A (4.58,9.60) B (5.20,9.78) C (4.72,9.20) D (4.90,9.77)
(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
三、简答题(每题6分,共30分)
1、什么叫统计分组?简述对数据进行组距分组的步骤。
2、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
3、概率抽样与非概率抽样有何关系?
4、标志与指标的区别与联系?
5、评价估计量的标准有哪些?
四、计算题(每题10分,共40分。要求写出公式及计算过程,第3题列表计算)
1、若已知甲、乙两个企业1980年的产值分别为300万元和500万元,1994年的产值分别为800万元和1500万元。
要求:(1)分别计算甲、乙两个企业产值的平均发展速度;
(2)若按各自的速度发展,甲企业从现在起还需几年才能达到乙企业1994年的产值水平?
(3)若要求甲企业在五年内达到乙企业1994年的产值水平,则每年应递增多少?
2、已知某袋装糖果的重量近似服从正态分布,现从一批糖果中随机抽取16袋,检测结果,样本平均重量为503.75克,标准差为6.022克。试求这批袋装糖果的平均重量的置信度为95%的置信区间。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
3、为研究某一化学反应过程中,温度X对产品得率Y的影响,测的数据如下:
温度X
100
110
120
130
140
150
160
170
180
190
得率Y
45
51
54
61
66
70
74
78
85
89
要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程。
4、某企业生产三种产品,有关资料如下表:
产品种类
基期
价格(元)
产量(万件)
基期
报告期
个体指数 (%)
甲
乙
丙
10
9
8
20
16
15
21.84
19.44
14.79
109.2
121.5
98.6
要求:用综合指数和平均指数两种方法,计算该企业三种产品产量总指数,结合计算结果进行分析。
试卷4答案及评分标准
一、填空题(1分×10)
1、100所中学的高中学生 2、65 3、117.7% 4、帕氏物量 5.62
6、所属的时间、统计指标数值 7.17.2% 8、0.9或90% 9、序时
二、不定项选择题(2分×10分)
1、ABD 2、C 3、C 4、D 5、AC 6、BC 7、ABCDF 8、ABCD 9、A 10、A
三、简答题(6分×5)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N位数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2、二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
3、联系:二者都属抽样调查、非全面调查。区别:概率抽样是按照随机原则抽取样本,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,可以计算和控制抽样误差,能说明估计结果的可靠程度。非概率抽样是从研究目的出发,根据调查者的经验和判断,从总体中有意识地抽取若干单位构成样本。在及时了解总体大致情况、
总结
初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf
经验教训、进行大规模调查前的试点等方面,非概率抽样具有概率抽样无法取代的优越性。
4、区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数值表示,而标志中的品质标志不能;指标数值是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间、地点等条件,但作为一个完整的指标,一定要受到时间、地点、范围等条件的限制。
联系:许多统计指标的数值都是由总体各单位的数量标志汇总得来的;指标与数量标志在一定条件下可以转化。
5、(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。
(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。
(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。
四、计算题(10分×4)
1、 解:(1)甲企业 =107.26% 乙企业 =108.16%
(2)8.97(年) (3)113.40%-1=13.4% 应递增13.4%
2、解:样本平均重量为, 样本标准差,,则允许误差为
即这批袋装糖果平均重量的置信度为95%的置信区间为:503.75±3.305克,即在(500.45,507.06)之间。
3、解:(1)
编号
X
Y
XY
X2
Y2
1
100
45
4500
10000
2025
2
110
51
5610
12100
2601
3
120
54
6480
14400
2916
4
130
61
7930
16900
3721
5
140
66
9240
19600
4356
6
150
70
10500
22500
4900
7
160
74
11840
25600
5476
8
170
78
13260
28900
6084
9
180
85
15300
32400
7225
10
190
89
16910
36100
7921
合计
1450
673
101570
218500
47225
,计算结果表明X与Y为高度相关。
(2)设一元线性回归模型为:
则
所以回归方程为:
4、解:,计算结果表明,当个体指数与总指数一一对应时,加权算术平均数的数量指标指数与拉氏的数量指标指数结果相同。
XX大学 ~ 学年第 学期 期末 考试试卷 55
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
注意:请将第一、二题的答案填入下表相应空格内,答错位置不得分。
一、
填空题
1
2
3
4
5
6
7
8
9
10
二、不定项选择题
1
2
3
4
5
6
7
8
9
10
一、填空题(每空1分,共10分)
1、某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为( )。
2、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为 ( )。
3、已知物价上涨后,居民用同样多的货币购买的商品数量却减少15%,则物价指数为( )。
4、根据季节时间数列资料计算的各季节比率之和应等于( )。
5、已知一个总体均值95%的置信区间为(122,130),如果样本均值和标准差分别为126和16.07,则研究时应抽取的样本容量为( )。
6、综合评价指数的编制方法有( )和( )。
7、已知总体标志值的平均数为13,各标志值平方和的平均数为174,则标准差系数为( )。
8、某企业某年各月月末库存额资料如下(单位:万元):48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。则全年平均库存额为( )。
9、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,样本是( )。
二、不定项选择题(每小题2分,共20分。错选无分,漏选一个扣0.5分。)
1、统计学的核心内容是( )。
A数据的收集 B数据的整理 C数据的分析 D数据的分组 E以上都不对
2、下列变量中属于连续变量的有( )。
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
3、可变构成指数、结构影响指数和固定构成指数的关系是( )。
A 固定构成指数等于结构影响指数与可变构成指数之积 B 可变构成指数等于结构影响指数与固定构成指数之积
C 结构影响指数等于可变构成指数与固定构成指数之积 D 可变构成指数等于结构影响指数与固定构成指数之和
E固定构成指数等于结构影响指数与可变构成指数之和
4、分类抽样中的类与整群抽样中的群相比,有
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小 E 要求群内差异小,类内差异大
5、在编制总指数时同度量因素的作用有( )。
A 同度量作用 B 平衡作用 C 权数作用 D 协调作用
6、在下列叙述中,正确的是( )。
A 如果抽样分布的均值不等于总体参数时,则该统计量被称为参数的有偏估计。B 样本方差可以估计总体方差
C 样本均值可以估计总体均值 D 样本比率可以估计总体比率 E 以上都不正确
7、在编制指数时,确定同度量因素需要考虑的问题有( )。
A 各指标间的经济联系 B 同度量因素的可比性 C 同度量因素固定的时期
D 实际条件和使用上的方便 E 同度量因素是否符合指数形式
8、一元线形回归方程中的回归系数( )。
A 能说明两变量间的变动方向 B不能说明两变量间的变动方向 C 能表明两变量间的变动程度
D不能表明两变量间的变动程度 E 其数值大小受计量单位的影响
9、随机抽取400人的一个样本,发现有26%的上网者为女性。则女性上网者比率95%的置信区间为( )。
A (0.217,0.303) B (0.117,0.403) C(0.217,0.403) D (0.117,0.503)
10、从一个总体中抽取16个样本,其标准差为6.2022,则总体方差的置信度为95%的置信区间为( )。
A (4.58,9.60) B (5.20,9.78) C (4.72,9.20) D (4.90,9.77)
(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
三、简答题(每题6分,共30分)
1、什么叫统计分组?简述对数据进行组距分组的步骤。
2、水平法计算平均发展速度原因、特点及实质是什么?
3、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
4、标志与指标的区别与联系?
5、什么是估计量?评价估计量的标准有哪些?
四、计算题(每题10分,共40分。要求写出公式及计算过程,第3题列表计算)
1、若已知甲、乙两个企业1980年的产值分别为300万元和500万元,1994年的产值分别为800万元和1500万元。要求:(1)分别计算甲、乙两个企业产值的平均发展速度;
(2)若按各自的速度发展,甲企业从现在起还需几年才能达到乙企业1994年的产值水平?
(3)若要求甲企业在五年内达到乙企业1994年的产值水平,则每年应递增多少?
2、已知某袋装糖果的重量近似服从正态分布,现从一批糖果中随机抽取16袋,检测结果,样本平均重量为503.75克,标准差为6.022克。试求这批袋装糖果总体方差的置信度为95%的置信区间。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
3、某地区8个同类企业的月产量与生产费用的资料如下:
企业编号
月产量(千吨)
生产费用(万元)
1
1.2
62
2
2.0
86
3
3.1
80
4
3.8
110
5
5.0
115
6
6.1
132
7
7.2
135
8
8.0
160
要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程,并对方程中回归系数的经济意义做出解释。(10)
4、某商店销售三种商品,有关资料如下表:
商品
计量单位
价格(元)
销售量
基期
报告期
基期
报告期
甲
米
6.0
7.2
1500
1800
乙
公斤
2.0
2.2
6000
6500
丙
件
3.0
3.1
40000
44000
要求:(1)计算这三种商品销售额指数及销售额增减额;
(2)从相对数和绝对数两方面对销售额变动进行因素分析,并用文字说明分析结果。
试卷5答案及评分标准
一、填空题(1分×10)
1、65 2、88,88 3、117.7% 4、4 5.62 6、标准比值法、功效系数法
7.17.2% 8、41 9、100所中学的高中学生
二、不定项选择题(每小题2分,共20分。在备选答案中,有一个或多个是正确的,请把正确答案的题号括号内,错选无分,漏选一个扣0.5分。)
1、C 2、CE 3、B 4、BCD 5、AC 6、ABCD 7、ACE 8、AC 9、A 10、A
三、简答题(每题6分,共30分)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N位数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2、水平法又称几何平均法,因为各期发展速度之和不是总速度,而是各期发展速度之乘积是总速度,因此用几何平均法计算。其特点是着眼于期末水平,不论中间水平如何,只要期末水平确定,对平均发展速度的计算结果没有影响。隐含假定:从时间序列的最初水平出发,以计算的平均发展速度代替各期的发展速度,计算出的期末水平与实际水平相一致。
3、二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
4、区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数值表示,而标志中的品质标志不能;指标数值是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间、地点等条件,但作为一个完整的指标,一定要受到时间、地点、范围等条件的限制。
联系:许多统计指标的数值都是由总体各单位的数量标志汇总得来的;指标与数量标志在一定条件下可以转化。
5、(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。
(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。
(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。
四、计算题(每题10分,共40分。要求写出公式及计算过程,第3题列表计算)
1、 解:(1)甲企业 =107.26% 乙企业 =108.16%
(2)8.97(年) (3)113.40%-1=13.4% 应递增13.4%
2、解:样本平均重量为, 样本标准差,,,,
则有,即这批袋装糖果总体方差的置信度为95%的置信区间为(20.99,92.14)。
3、解: ,,,,
,计算结果表明X与Y为高度相关。
(2)设一元线性回归模型为:
则
所以回归方程为: ,结果表明,月产量每增加1000吨,生产费用平均增加12.896万元。
4、解:(1)
(2)指标体系:
进一步计算得:
116.07%=110.496%×105.04%,
22660=14800+7860
计算结果表明:(1)三种商品的销售量平均增长10.496%,使销售额增长14800元;(2)商品的价格平均上涨5.04%,使销售额增加7860元;(3)由于销售量和价格两个因素变动的结果,使销售额增长16.07%,增加22660元。
XX大学 ~ 学年第 学期期末 考试试卷 66
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
注意:请将第一、二题的答案填入下表相应空格内,答错位置不得分。
一、
判断题
1
2
3
4
5
6
7
8
9
10
二、不定项选择题
1
2
3
4
5
6
7
8
9
10
一、判断题(判断正误,正确的在括号内打√,错误的打×,每题1分,共10分)
1、用样本推断总体,总是存在一定程度的不确定性。 ( )
2、某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为75。( )
3、已知物价上涨后,居民用同样多的货币购买的商品数量却减少15%,则物价指数为117.7%。 ( )
4、根据季节时间数列资料计算的各季节比率之和应等于12。 ( )
5、对离散型变量只能编制组距数列,对连续型变量既可以编制组距数列也可以编制单项数列。 ( )
6、均值、中位数及众数中,最易受极端值影响的是均值和众数。 ( )
7、只有在重复抽样的条件下,样本均值的期望值才能等于总体均值。 ( )
8、某企业某年各月月末库存额资料如下(单位:万元):48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。则全年平均库存额为41。 ( )
9、移动平均的项数越大,其结果会使序列数据的逐期增长量更接近常数。 ( )
10、用样本估计量的值直接作为总体参数的估计值,这一方法称为无偏估计。 ( )
二、不定项选择题(每小题2分,共20分。错选无分,漏选一个扣0.5分。)
1、下列变量中属于连续变量的有( )。
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
2、离散程度的测度中,最易受极端值影响的是( )。
A 极差 B 方差 C 标准差 D 变异系数
3、四分位差是上四分位数和下四分位数之差,它不可用于( )。
A 数值型数据 B 顺序数据 C 分类数据 D 所有数据 E 以上都不正确
4、分类抽样中的类与整群抽样中的群相比,有
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小 E 要求群内差异小,类内差异大
5、在编制总指数时同度量因素的作用有( )。
A 同度量作用 B 平衡作用 C 权数作用 D 协调作用
6、可变构成指数、结构影响指数和固定构成指数的关系是( )。
A 固定构成指数等于结构影响指数与可变构成指数之积 B 可变构成指数等于结构影响指数与固定构成指数之积
C 结构影响指数等于可变构成指数与固定构成指数之积 D 可变构成指数等于结构影响指数与固定构成指数之和
E 固定构成指数等于结构影响指数与可变构成指数之和
7、对季节变动分析的目的有( )。
A 为了分析与测定季节变动规律 B 为了便于用剩余法测定循环变动 C 为了消除季节变动对时间序列的影响 D 为了便于剔除不规则变动
8、每吨铸件成本(元)和每一工人劳动生产率(吨/人)之间的回归方程是:,这说明劳动生产率每提高一吨,则成本( )。
A 平均降低269.5元 B 平均提高269.5元 C 平均降低0.5元 D 平均提高0.5元
9、随机抽取400人的一个样本,发现有26%的上网者为女性。则女性上网者比率95%的置信区间为( )。
A (0.217,0.303) B (0.117,0.403) C(0.217,0.403) D (0.117,0.503)
10、从一个总体中抽取16个样本,其标准差为6.2022,则总体方差的置信度为95%的置信区间为( )。
A (4.58,9.60) B (5.20,9.78) C (4.72,9.20) D (4.90,9.77)
(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
三、简答题(每题6分,共30分)
1、什么叫统计分组?简述对数据进行组距分组的步骤。 2、什么是均值、众数、中位数?三者的关系是什么?
3、标志与指标的区别与联系? 4、什么是估计量?评价估计量的标准有哪些?
5、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
四、计算题(共40分。要求写出公式及计算过程,第2题列表计算)
1、有两个工厂生产三种产品的成本资料如下表,要求比较两个厂的总平均成本的高低并说明原因。(5分)
品种
单位成本(元)
总成本(元)
A厂
B厂
甲
乙
丙
15
20
30
2100
3000
1500
3225
1500
1500
2、某地区8个同类企业的月产量与生产费用的资料如下:
企业编号
月产量(千吨)
生产费用(万元)
1
1.2
62
2
2.0
86
3
3.1
80
4
3.8
110
5
5.0
115
6
6.1
132
7
7.2
135
8
8.0
160
要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程,并对方程中回归系数的经济意义做出解释。(10)
3、已知某袋装糖果的重量近似服从正态分布,现从一批糖果中随机抽取16袋,称得重量为(单位为克):
506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496,设袋装糖果的重量近似服从正态分布,试求这批袋装糖果平均重量的置信度为95%的置信区间。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)
4、某地三种商品销售情况,有关资料如下表:
商品
计量单位
价格(元)
销售量
基期
报告期
基期
报告期
甲
件
10.0
11.0
12500
1500
乙
担
60.0
54.0
12000
16800
丙
个
2.0
2.3
6000
5700
要求:试根据上述资料计算建立适当的指数体系,并结合计算结果进行因素分析。(10分)
试卷6答案及评分标准
一、判断题(判断正误,正确的在括号内打√,错误的打×,每题1分,共10分)
1. × 2. × 3. √ 4. × 5. × 6. × 7. × 8. √ 9. × 10. ×
二、不定项选择题(每小题2分,共20分。在备选答案中,有一个或多个是正确的,请把正确答案的题号括号内,错选无分,漏选一个扣0.5分。)
1、CE 2、A 3、C 4、BCD 5、AC 6、B 7、ABC 8、AC 9、A 10、C
三、简答题(每题6分,共30分)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N位数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2、均值即算术平均数;众数是一组数据中出现次数最多的变量值;中位数是一组数据按从小到大排列后,处于正中间位置上的变量值。三者的关系是:对于同一组数据资料计算众数、中位数和均值,如果数据具有单一众数,且分布是对称的,则三者相等。若数据为左偏分布,则有,若数据右偏分布,则有。从数值关系上看,三者的关系可表述为。
3、区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数值表示,而标志中的品质标志不能;指标数值是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间、地点等条件,但作为一个完整的指标,一定要受到时间、地点、范围等条件的限制。
联系:许多统计指标的数值都是由总体各单位的数量标志汇总得来的;指标与数量标志在一定条件下可以转化。
4、(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。
(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。
(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。
5、二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
四、计算题(共40分。要求写出公式及计算过程,第2题列表计算)
1、 解:HA= 19.41,HB=18.31 A高于B,A厂价低的产品比重小,B市场价低的产品比重大。
2、解: ,,,,
,计算结果表明X与Y为高度相关。
(2)设一元线性回归模型为:
则
所以回归方程为: ,结果表明,月产量每增加1000吨,生产费用平均增加12.896万元。
3、解:样本平均重量为, 样本标准差,,,,
则有,即这批袋装糖果总体方差的置信度为95%的置信区间为(20.99,92.14)。
4、解:指标体系:
进一步计算得:
126.64%=136.45%×92.81%,
228310=312400+(-84090)
计算结果表明:(1)三种商品的销售量平均增长36.45%,使销售额增长312400元;(2)商品的价格平均降低7.19%,使销售额减少84090元;(3)由于销售量和价格两个因素变动的结果,使销售额增长26.64%,增加228310元。
工程大学 ~ 学年 第 学期期 考试试卷 ( )卷777
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
注意:请将第一、二、三题的答案填入下表相应空格内,答错位置不得分。
一、
填空题
1
2
3
4
5
6
7
8
9
10
二、判断题
1
2
3
4
5
6
7
8
9
10
二、不定项选择题
1
2
3
4
5
6
7
8
9
10
一、填空题(每空1分,共10分)
1、在全国人口普查中,总体单位是( )。
2、对连续大量生产的某种小件产品进行质量检验,最恰当的调查方式是( )。
3、按连续变量分为4组,各组为55-65,65-75,75-85,85以上,则数据65、85分别在( )组。
4、若无季节变动,则季节指数为( )。
5、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数为( ),中位数为( )。
6、有两个变量数列,甲数列均值为100,标准差为12.8,乙数列均值为14.5, 标准差为3.7,比较两数列均值的代表性,结果是( )。
7、同度量因素的作用有( )和( )。
8、最小平方法的条件是( )。
二、判断题(判断正误,正确的在括号内打√,错误的打×,每个判断1分,共10分)
1、进行统计研究的前提条件是统计总体具有同质性的特点。( )
2、在全国工业普查中,所有工业企业都是总体,各企业工资总额都是标志,各企业的劳动生产率是变量。( )
3、统计的三大职能有信息、咨询、监督,其中最基本的职能是信息职能。( )
4、当一组数据中出现零或负值时,则不能计算算术平均数和调和平均数。( )
5、对离散型变量只能编制组距数列,对连续型变量既可以编制组距数列也可以编制单项数列。( )
6、在分组时计算频数密度是因为不等距分组的各组频数分布受组距大小影响,不能真实反映频数分布的实际情况。( )
7、为研究新事物,了解新情况,总结事物发展变化的规律,应选用重点调查这种方式。( )
8、权数本身对加权算术平均数的影响取决于权数绝对值的大小。( )
9、在参数估计中,用来估计总体参数的统计量的名称,称为估计量。评价估计量的标准有无偏性、稳定性、相合性。( )
10、已知物价上涨后,居民用同样多的货币购买的商品数量却少15%,则物价指数为117.7%( )
三、不定项选择题(选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
1、统计学的核心内容是( )
A数据的收集 B数据的整理 C数据的分析 D数据的分组 E以上都不对
2、下列变量中属于离散变量的有( )。
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
3、下列指标中属于质量指标的有( ).
A 国民收入 B 平均工资 C 计划完成程度 D 出勤率 E 总产量
4、在确定组数多少和组距大小时,应考虑的原则有( )。
A 应将总体单位分布的特点显示出来 B 要考虑原始资料的集中程度 C 要考虑组内单位的同质性和组间单位的差异性 D 要考虑组内单位的差异性和组间单位的同质性 E 应考虑极端数值的影响
5、某企业1996年产量为125,1997年比上年增长20%,1998年比1997年增长20%,则1998年比1996年增长( )
A 20% B 40% C 60% D 44% E 40%
6、某公司1,2,3,4月职工平均人数分别为190人,215人,220人和230人,该公司一季度月职工平均人数为( )
A 208 B 215 C 214 D 222 E 212
7、甲乙两种商品的价格报告期分别降低了5%(甲)和10%(乙),报告期销售额二者的比重为40%(甲)和60%(乙),则两种商品价格总指数为( )
A 92.5% B 92.4% C 91.9% D 92.0% E 都不正确
8、在重复抽样下,要使抽样允许误差减少2/3,则样本单位数要( )
A 扩大9倍 B 扩大到原来的9倍 C 扩大4/9倍 D 扩大9/4倍 E扩大原来的9/4倍
9、分类抽样中的类与整群抽样中的群相比,有( )
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小
E 要求群内差异小,类内差异大
10、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题( )
A 现象的变化是否有周期性 B 原数列的项数 C 原数列波动大小
D 是否需要移动平均数列的首尾数值 E是时期数列还是时点数列
四、 简答题(每题6分,共30分)
1、水平法计算平均发展速度原因、特点及实质是什么? 2、什么叫标准差系数?计算它有何意义?
3、总指数有哪两种基本编制方式?两种方法间的区别与联系?4、简述测定季节变动的原始资料平均法的基本步骤和原理。
5、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
五、计算题(每题10分,共40分,要求写出相应的公式,第2、4题列表计算)
1、某地区2000年末人口数为2000万人,假定以后每年以9‰的速度增长,又知该地区2000年GDP为1240亿元。要求到2005年人均GDP达到9500元,试问该地区计算2005年的GDP应达到多少?GDP的年均增长速度应达到多少?
2、某商场销售的甲、乙两种商品的资料如下表,从相对数、绝对数两方面综合分析价格和销售量变动对两种商品销售额的影响。
商品名称
计量
单位
销售量
价格(元)
基期
报告期
基期
报告期
甲
乙
千克
袋
2000
3000
2800
3500
4.0
2.0
3.80
2.10
3、某厂对新试制的一批产品使用寿命进行测试,随机抽取100个零件,测得其平均寿命为
2000小时,标准差为10小时,以95%的概率计算这批产品平均寿命的范围。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645)
4、某地区8个同类企业的月产量与生产费用的资料如下:
企业编号
月产量(千吨)
生产费用(万元)
1
1.2
62
2
2.0
86
3
3.1
80
4
3.8
110
5
5.0
115
6
6.1
132
7
7.2
135
8
8.0
160
要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程,并对方程中回归系数的经济意义做出解释。
统计学卷7答案及评分标准
一、填空题(1分×10)
1. 每个人 2 抽样调查 3 第2、4组 4 为100%或1 5 88,88 6 甲好于乙 7同度量,权数 8
二判断题(1分×10)
1. × 2. × 3. √ 4. × 5. × 6. √ 7. × 8. × 9. × 10 √
二、不定向选择(2分×10)
1. C 2. ABD 3.BC D 4. A BC 5 D 6. A 7 C 8 B 9. BCD 10. ABC
三、简答题(6分×5)
1、水平法又称几何平均法,因为各期发展速度之和不是总速度,而是各期发展速度之乘积是总速度,因此用几何平均法计算。其特点是着眼于期末水平,不论中间水平如何,只要期末水平确定,对平均发展速度的计算结果没有影响。隐含假定:从时间序列的最初水平出发,以计算的平均发展速度代替各期的发展速度,计算出的期末水平与实际水平相一致。
2又称离散系数,是用来对两组数据的差异程度进行相对比较的。因为在比较相关的两组数据的差异程度时,方差和标准差是以均值为中心计算出来的,因而有时直接比较方差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数。计算公式为
3、有加权综合指数法和加权平均法。前者先综合后对比,当编制质量指数时,选择与之有密切关系的数量指标作为同度量因素,为在综合对比过程单纯反映指数化指标的变动或差异程度,需将同度量因素固定在基期或报告期。后者先对比后平均,首先计算个别现象的个体指数,再选择与编制指数密切关系的价值总量pq作为同度量因素,并将其固定,当选择加权算术平均时同度量因素固定在基期,当选择加权调和平均时同度量因素固定在报告期。
4又称按月(或季)平均法,这种方法不考虑长期趋势影响,根据原始数据直接计算季节指数,测定季节变动。
(1)计算各年同月(季)的平均数 (i=1~12月或i=1~4季),目的消除各年同一季度(月份)数据上的不规则变动;
(2)计算全部数据的总平均数 ,找出整个数列的水平趋势;
(3)计算季节指数S i,即
(i=1~12月或i=1~4季)
5 二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
四 计算题
1、 2004年末人口数=2000×(1+9‰)4=2072.9778万人
2005年末人口数=2000×(1+9‰)5=2091.6346万人
2005年平均人口数=2082.3062万人
2005年GDP=9500/2082.3062=1978亿元
增速为
2、指标体系:
128.5%=130%×98.85%,
3990=4200+(-210)
计算结果表明:(1)两种商品的销售量平均增长30%,使销售额增长4200元;(2)商品的价格平均降低1.15%,使销售额减少210元;(3)由于销售量和价格两个因素变动的结果,使销售额增长28.5%,增加3990元。
3样本均值=2000,样本标准差=10 查
该产品平均使用寿命95%的置信区间是2000± =2000±1.96
置信区间为(1998.04,2001.96)小时。
3. 解: ,,,,
,计算结果表明X与Y为高度相关。
(2)设一元线性回归模型为:
则
所以回归方程为: ,结果表明,月产量每增加1000吨,生产费用平均增加12.896万元。
XX大学 ~ 学年 第 学期期 考试试卷 ( )卷888
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
一 填空题(每空1分,共10分)
1、绝对数按其反映的时间状况不同分为( )。
2、对连续大量生产的某种小件产品进行质量检验,最恰当的调查方式是( )。
3、按连续变量分为4组,各组为55-65,65-75,75-85,85以上,则数据65、85分别在( )组。
4、评价估计量优劣的标准有无偏性、( )。
5、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为( )。
6、有两个变量数列,甲数列均值为100,标准差为12.8,乙数列均值为14.5, 标准差为3.7,比较两数列均值的代表性,结果是( )。
7、同度量因素的作用有( )和( )。
8、最小平方法的条件是( )。
9、构成时间数列的两个基本要素是( )。
二、判断题(判断正误,正确的在括号内打√,错误的打×,每个判断1分,共10分)
1、进行统计研究的前提条件是统计总体具有差异性的特点。( )
2、在全国人口普查中,总体是全国总人口,总体单位是每一户,全国总人口数是变量。( )
3、统计的三大职能有信息、咨询、监督,其中最基本的职能是信息职能。( )
4、变量数列中,当标志值较小一组发生的次数较多时,计算的算术平均数接近中间一组。( )
5、对离散型变量只能编制组距数列,对连续型变量既可以编制组距数列也可以编制单项数列。( )
6、在分组时计算频数密度是因为不等距分组的各组频数分布受组距大小影响,不能真实反映频数分布的实际情况。( )
7、全面调查只适用于有限总体。( )
8、几何平均法适用于变量的连乘积等于总比率或总速度的现象。( )
9、在其他条件不变的情况下,样本容量与置信水平、总体方差、允许误差都成正比。( )
10、若物价上涨,销售额持平,则销售量提高。( )
三、不定项选择题(选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
1、统计学的核心内容是( )
A数据的收集 B数据的整理 C数据的分析 D数据的分组 E以上都不对
2、下列变量中属于离散变量的有( )。
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
3、下列指标中属于时期指标的有( ).
A 总人口数 B 计划产量 C 人口增加数 D 计划完成程度 E 序时平均数 E 应考虑极端数值的影响
4、某公司1,2,3,4月职工平均人数分别为190人,215人,220人和230人,该公司一季 度月职工平均人数为( )
A 208 B 215 C 214 D 222 E 212
5、某企业1996年产量为125,1997年比上年增长20%,1998年比1997年增长20%,则1998年比1996年增长( )
A 20% B 40% C 60% D 44% E 40%
6、甲乙两种商品的价格报告期分别降低了5%(甲)和10%(乙),报告期销售额二者的比重为40%(甲)和60%(乙),则两种商品价格总指数为( )
A 92.5% B 92.4% C 91.9% D 92.0% E 都不正确
7、在编制指数时,确定同度量因素需要考虑的问题有( )
A 各指标间的经济联系 B 同度量因素的可比性 C 同度量因素固定的时期
D 实际条件和使用上的方便 E 同度量因素是否符合指数形式
8、分类抽样中的类与整群抽样中的群相比,有( )
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小
E 要求群内差异小,类内差异大
9、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题( )
A 现象的变化是否有周期性 B 原数列的项数 C 原数列波动大小
D 是否需要移动平均数列的首尾数值 E是时期数列还是时点数列
10、抽样调查遵循随机原则的原因是( )
A 样本容量有限 B 保证总体中每个单位有同等机会被抽中 C 能确定抽样方法
D 能确定推断的可靠程度 E 能计算抽样误差
四 简答题(每题6分,共30分)
1、描述次数分配表的编制过程。 2、简述测定季节变动的原始资料平均法的基本步骤和原理。
3、什么是均值、众数、中位数?三者的关系是什么?
4、平均指标指数是总指数还是一般相对数?可变构成指数、固定构成指数和结构变动影响指数三者在分析意义上有何区别,在数量上又有何联系? 5、简述相关分析和回归分析的关系。
五、计算题(共40分)
1、某公司下属三个部门报告期的流通费用率(=流通费/销售额)分别为12%、8%、10%,流通费用额分别为96万元、120万元、100万元。试计算三个部门的平均流通费用率。(5分)
2、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取16户,得样本均值为 6.75小时,样本标准差为2.25小时。
(1)以95%的置信水平估计家庭每天平均看电视的时间;
(2)若已知总体标准差为2.5,允许误差和置信水平不变,求适合的样本容量。
(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.131、 t0.05(15)=1.753)(10分)
3、某地三种商品销售情况,有关资料如下表:
商品
计量单位
价格(元)
销售量
基期
报告期
基期
报告期
甲
件
10.0
11.0
12500
1500
乙
担
60.0
54.0
12000
16800
丙
个
2.0
2.3
6000
5700
要求:试根据上述资料计算建立适当的指数体系,并结合计算结果进行因素分析。(10分)
4、某地区8个同类企业的月产量与生产费用的资料如下:
企业编号
月产量(千吨)
生产费用(万元)
1
1.2
62
2
2.0
86
3
3.1
80
4
3.8
110
5
5.0
115
6
6.1
132
7
7.2
135
8
8.0
160
要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程,并对方程中回归系数的经济意义做出解释。(15分)
统计学卷8答案及评分标准
一、填空题(1分×10)
1. 绝对数、相对数 2 抽样调查 3 第2、4组 4 一致性或相合性、有效性 5 88,88 6 甲好于乙 7同度量,权数 8
9 所属时间、指标数值
二、判断题(1分×10)
1. √ 2. × 3. √ 4. × 5. × 6. √ 7. √ 8. √ 9. × 10×
三、不定向选择(2分×10)
1. C 2. ABD 3 BC 4A 5 D 6 C 7ACD 8 BCD 9. ABC 10 BE
四、简答题(6分×5)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N为数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2、又称按月(或季)平均法,这种方法不考虑长期趋势影响,根据原始数据直接计算季节指数,测定季节变动。
(1)计算各年同月(季)的平均数 (i=1~12月或i=1~4季),目的消除各年同一季度(月份)数据上的不规则变动;
(2)计算全部数据的总平均数 ,找出整个数列的水平趋势;
(3)计算季节指数S i,即
(i=1~12月或i=1~4季)
3、均值即算术平均数;众数是一组数据中出现次数最多的变量值;中位数是一组数据按从小到大排列后,处于正中间位置上的变量值。三者的关系是:对于同一组数据资料计算众数、中位数和均值,如果数据具有单一众数,且分布是对称的,则三者相等。若数据为左偏分布,则有,若数据右偏分布,则有。从数值关系上看,三者的关系可表述为。
4、是一般的相对数,可变构成指数=固定构成指数×结构变动影响指数即
5二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
四 计算题
1
H= =9.58%(5分)
2、 (1)n=16, 样本均值=6.75,样本标准差=2.25
查
该单位平均每个家庭每天看电视的95%的置信区间是6.75± =6. 75±1.20即(5.55,7.95)
(2)据(1)知允许误差E=1.20,又有总体标准差为2.5,95%置信度下,
则
即只需多增加一个样本就能满足要求。(10分)
3、解:指标体系:
进一步计算得:
126.64%=136.45%×92.81%,
228310=312400+(-84090)
计算结果表明:(1)三种商品的销售量平均增长36.45%,使销售额增长312400元;(2)商品的价格平均降低7.19%,使销售额减少84090元;(3)由于销售量和价格两个因素变动的结果,使销售额增长26.64%,增加228310元。(10分)
4、 解: ,,,,
,计算结果表明X与Y为高度相关。
(2)设一元线性回归模型为:
则
所以回归方程为: ,结果表明,月产量每增加1000吨,生产费用平均增加12.896万元。
(15分)
XX大学 ~ 学年第 学期期 考试试卷 ( 99 )卷
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
一、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内,选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
( ) 1、下列指标中属于时期指标的有
A 总人口数 B 计划产量 C 人口增加数 D 计划完成程度 E 序时平均数
( )2、下列变量中属于离散变量的有
A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值
( )3、可以进行经常性调查的是
A 人口普查 B 耕地普查 C 职工工资调查 D 产品质量调查 E农产品产量调查
( )4、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为
A 88 、91 B 85、91 C 88、88 D 85、88 E 85、91
( )5、有两个变量数列,甲数列均值为100,标准差为12.8,乙数列均值为14.5,标准差为3.7,比较两数列均值的代表性结果为
A 甲好于乙 B 乙好于甲 C 相同 D 无法比较 E 以上都不对
( )6、分类抽样中的类与整群抽样中的群相比,有
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小
E 要求群内差异小,类内差异大
( ) 7、从一个总体中可以抽取一系列样本,所以
A. 样本指标的数值不是唯一确定的 B. 所有可能样本的平均数的平均数等于总体平均数 C. 总体指标是确定值,而样本指标是随机变量 D.总体指标和样本指标都是随机变量
E. 所有可能样本的标准差等于总体的标准差
( )8、最小平方法的条件是
A、观测值与估计值离差和为零 B、观测值与估计值离差平方和为零C、观测值与估计值离差平方和为最小D、观测值与估计值离差和为最小 E、观测值与估计值离差和小于零
( )9、已知物价上涨后,居民用同样多的货币购买的商品数量却少15%,则物价指数为
A 无法计算 B 15% C 85% D 117.7% E 都不正确
( )10、某企业某年各月月末库存额资料如下(单位:万元):48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。则全年平均库存额为
A 52 B 41 C 41.33 D 50 E 都不正确
二、简答题(每题6分,共30分)
3、 什么叫统计分组?简述等距式组距分组的步骤及应注意的问题。
2、简述测定长期趋势的移动平均法的基本思想。
3、简述样本容量与置信水平、总体方差、允许误差的关系。
4、平均指标指数是总指数还是一般相对数?可变构成指数、固定构成指数和结构变动影响指数三者在分析意义上有何区别,在数量上又有何联系?
5、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
三、计算题(共40分)(要求:写出公式及计算过程,第3题列表计算)
1、某地区2000年末人口数为2000万人,假定以后每年以9‰的速度增长,又知该地区2000年GDP为1240亿元。要求到2005年人均GDP达到9500元,试问该地区计算2005年的GDP应达到多少?GDP的年均增长速度应达到多少?(10分)
2、已知某种电子管的使用寿命服从正态分布,从一批电子管中随机抽取16只,监测结果,样本平均寿命为1950小时,标准差为300小时。试求(1)这批电子管置信度为95%的平均寿命及其方差和标准差的置信区间。(2)若允许误差为150小时,其他条件不变,试确定样本容量。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261 )(15分)
3、某工业企业某种产品产量与单位成本资料如下
年份
1993 1994 1995 1996 1997 1998 1999 2000
产品产量(万件)
单位成本(元/件)
2 3 4 3 4 5 6 7
73 72 71 73 69 68 66 65
要求:(1)计算相关系数,说明相关程度;(2)配合简单线性回归方程,并对方程中回归系数的经济意义做出解释(10分)
四、分析题(10分)
某企业生产三种产品,有关资料如下表:
产品种类
基期
价格(元)
产量(万件)
基期
报告期
个体指数 (%)
甲
乙
丙
10
9
8
20
16
15
21.84
19.44
14.79
109.2
121.5
98.6
要求:用综合指数和平均指数两种方法,计算该企业三种产品产量总指数,结合计算结果分析两种指数编制法区别与联系.
试卷9答案及评分标准
一、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内,选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
1. BC 2.A BD 3.C DE 4.C 5. A 6.BCD 7.ABC 8.AC 9.D 10. B
二、简答题(每题6分,共30分)
1、是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N为数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。
2移动平均法的基本原理,是通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。它是选择一定的用于平均的序时项数N,采用对序列逐项递移的方式,对原数列递移的N项计算一系列序时平均数,由这些序时平均数所形成的新数列,一定程度上消除或削弱了原序列中的由于短期偶然因素引起的不规则变动和其他成分,对原序列的波动起到一定的修匀作用,从而呈现出现象在较长时间的发展趋势。
3 在其他条件不变的情况下,样本容量与置信水平成正比,与总体方差成正比;与允许误差成反比。
4、是一般的相对数,可变构成指数=固定构成指数×结构变动影响指数即
5二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
三、计算题(共40分)(要求:写出公式及计算过程,第3题列表计算)
1. 2004年末人口数=2000×(1+9‰)4=2072.9778万人
2005年末人口数=2000×(1+9‰)5=2091.6346万人
2005年平均人口数=2082.3062万人
2005年GDP=9500/2082.3062=1978亿元
增速为
2 (1)小样本查 极限误差=
则平均寿命为即
(2)小样本查
代入即 标准区间为 (3) n=18
3.
产量为x, 单位成本为y, n=10,
高度相关 设一元线性回归模型为:
产量每增加一个(一万件)单位,单位成本提高9.05元。
四、分析题(10分)
综合指数法是先综合后对比;平均指数法是先对比后平均,二者计算产量总指数结果相同。
XX大学 ~ 学年第 学期期 考试试卷14 ( 10 )卷
题号
一
二
三
四
五
六
七
八
九
十
总分
评分
评卷教师
一、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内,选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
( ) 1、下列指标中属于质量指标的有( )
A 国民收入 B 平均工资 C 计划完成程度 D 出勤率 E 总产量数
( )2、变量是可以取不同数值的量,变量的数量表现是变量值,所以
A数量标志和所有统计指标是变量 B.所有标志值和指标值是变量
C.“工业企业总产值”是个变量值 D.变量不包括品质标志 E.“某企业工业总产值20万元”是个变量值
( )3、指出下列分组哪些是按数量分组的
A. 人口按性别 B.企业按产值多少 C.产品按合格与不合格 D. 家庭按收入水平 E.成年人按受教育年限
( )4、下列项目中属于非全面调查的有
A.重点调查 B.抽样调查 C.典型调查 D.全面统计报表 E.定期调查
( )5、影响抽样允许误差的因素有
A. 是有限总体还是无限总体 B. 置信水平的大小 C. 是重置抽样还是不重置抽样
D. 总体被研究标志的变异程度 E. 抽样单位数的多少
( )6、最小平方法的条件是
A、观测值与估计值离差和为零 B、观测值与估计值离差平方和为零C、观测值与估计值离差平方和为最小D、观测值与估计值离差和为最小 E、观测值与估计值离差和小于零
( )7、已知物价上涨后,居民用同样多的货币购买的商品数量却少15%,则物价指数为
A 无法计算 B 15% C 85% D 117.7% E 都不正确
( )8、某企业1996年产量为125,1997年比上年增长20%,1998年比1997年增长20%,则1998年比1996年增长
A 20% B 40% C 60% D 44% E 40%
( )9、分类抽样中的类与整群抽样中的群相比,有
A 二者相同 B 二者不一样 C 二者的划分原则相反 D 要求群内差异大,类内差异小
E 要求群内差异小,类内差异大
( )10、在对n=2000的消费者构成的随机样本的调查中,有64%的人说他们购买商品时主要考虑价格因素。消费者群体根据价格做出购买决策的比率的99%的置信区间为
A 0.064±0.078 B 0.064±0.028 C 0.064±0.035 D 0.064±0.045 E 0.064±0.058
(20题可供选择的临界值Z0.025=1.96、Z0.05=1.645 Z0.005=2.58)
二、简答题(每题6分,共30分)
1、简述众数、中位数、均值的各自特点及应用场合。
2、简述测定长期趋势的移动平均法的基本思想。
3、什么叫估计量?评价估计量的标准有哪些?
4、总指数有哪两种基本编制方式?它们各自有何特点?
5、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。
三、计算题(共40分)(要求:写出公式及计算过程,第3题列表计算)
1、某企业第三季度各月总产值和职工人数资料如下表,计算该企业第三季度平均每月人均产值。(10分)
月 份
6 7 8 9
总产值(万元)
月末职工人数(人)
1500 1600 1650 1850
600 615 630 660
2、已知某种电子管的使用寿命服从正态分布,从一批电子管中随机抽取16只,监测结果,样本平均寿命为1950小时,标准差为300小时。试求(1)这批电子管置信度为95%的平均寿命及其方差和标准差的置信区间。(2)若允许误差为150小时,其他条件不变,试确定样本容量。
(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261 )(15分)
3、某高校的团委作一项调查,得到五名同学的统计学成绩与其学习时间的资料如下:
学习时间(小时)
考试成绩(分)
4
6
7
10
13
40
60
50
70
90
要求:(1)计算相关系数,说明相关程度;(2)配合简单线性回归方程,并对方程中回归系数的经济意义做出解释(15分)
四、分析题(10分)
某市场上四种蔬菜的销售资料见下表:
品种
销售量(公斤)
价格(元/公斤)
基期
报告期
基期
报告期
甲
乙
丙
丁
550
224
308
168
560
250
320
170
1.60
2.00
1.00
2.40
1.80
1.90
0.90
3.00
建立指数体系,分析该市场这四种蔬菜的价格、销售量和销售额之间的关系。(10分)
试卷10答案及评分标准
一、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内,选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)
1、BCD 2、A DE 3.BDE 4.A BC 5.BCDE 6.AC 7.D 8 D 9. BCD 10. B
二、简答题(每题6分,共30分)
1、均值即算术平均数;众数是一组数据中出现次数最多的变量值;中位数是一组数据按从小到大排列后,处于正中间位置上的变量值。三者的关系是:对于同一组数据资料计算众数、中位数和均值,如果数据具有单一众数,且分布是对称的,则三者相等。若数据为左偏分布,则有,若数据右偏分布,则有。从数值关系上看,三者的关系可表述为。
2、移动平均法的基本原理,是通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。它是选择一定的用于平均的序时项数N,采用对序列逐项递移的方式,对原数列递移的N项计算一系列序时平均数,由这些序时平均数所形成的新数列,一定程度上消除或削弱了原序列中的由于短期偶然因素引起的不规则变动和其他成分,对原序列的波动起到一定的修匀作用,从而呈现出现象在较长时间的发展趋势。
3、(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。
(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。
(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。
4、二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
5、有加权综合指数法和加权平均法。前者先综合后对比,当编制质量指数时,选择与之有密切关系的数量指标作为同度量因素,为在综合对比过程单纯反映指数化指标的变动或差异程度,需将同度量因素固定在基期或报告期。后者先对比后平均,首先计算个别现象的个体指数,再选择与编制指数密切关系的价值总量pq作为同度量因素,并将其固定,当选择加权算术平均时同度量因素固定在基期,当选择加权调和平均时同度量因素固定在报告期。
三、计算题(共40分)(要求:写出公式及计算过程,第3题列表计算)
1.
(10分)
2、(1)小样本查 极限误差=
则平均寿命为即
(2)小样本查 代入即 标准区间为 (3)
取n=19(15分)
3、时间为x, 成绩为y, n=5,
高度相关 设一元线性回归模型为:
学习时间每增加一个单位(一小时),成绩提高5.2分。(15分)
四、分析题(10分)
指标体系:
111.86%=104.16%×107.39%,
241.8=84.8+157计算结果表明:(1)三种商品的销售量平均增长4.16%,使销售额增长84.8元;(2)商品的价格平均增长7.39%,使销售额增加157元;(3)由于销售量和价格两个因素变动的结果,使销售额增长11.86%,增加241.8元。