首页 应用统计学课程设计

应用统计学课程设计

举报
开通vip

应用统计学课程设计应用统计学课程设计 精编资料 应用统计学课程设计商店的偷窃案例分析南京航空航天大学经济与管理学院 0709234 张巧玲[前记] 经过较为系统的应用统计学的课程学习,本人对统计学的方法有了一定的了解... 统计学 应用统计学课程设计 商店的偷窃案例分析 南京航空航天大学经济与管理学院 0709234 张巧玲 [前记] 经过较为系统的应用统计学的课程学习,本人对统计学的方法有了一定的了解和掌握。本案例是通过网上百度得到的资料,没有任何权威性,但问题来自于实际生活(数据未必真实),能用统计学的方法解决实际问...

应用统计学课程设计
应用统计学课程 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 精编资料 应用统计学课程设计商店的偷窃案例分析南京航空航天大学经济与管理学院 0709234 张巧玲[前记] 经过较为系统的应用统计学的课程学习,本人对统计学的方法有了一定的了解... 统计学 应用统计学课程设计 商店的偷窃案例分析 南京航空航天大学经济与管理学院 0709234 张巧玲 [前记] 经过较为系统的应用统计学的课程学习,本人对统计学的方法有了一定的了解和掌握。本案例是通过网上百度得到的资料,没有任何权威性,但问题来自于实际生活(数据未必真实),能用统计学的方法解决实际问题,是应用统计学的实用案例。 一、案例基本情况 G女士开了一家小超市,开业的前几年,生意相当不错。但在1997年4月收到的近期审计报告里,情况就不同了,刚结束的这个季度情况十分不好,收入明显下降。审计员分析原因有两个:一是自上一个财务年度起(上年10月至本年9月为一个财务年度),市场就开始显露出低迷迹象,另外一个原因是某个员工一直在偷窃商店里的现金或商品。G女士开始留心观察雇员们行为并发现了一个雇员的可疑行为。经向警察局报案,便衣警察来到商店,假装购买商品进行侦察。1997年6月16日,这个雇员因为偷窃而被逮捕。在后来的审讯中,这个雇员承认从1997年2月起,到他被逮捕时,共从商店偷走500美元。根据警察所得到的证据和他自己的供词,他被判定有罪。 但G女士对审判的结果很不满意,因为她怀疑被偷走的钱远多于这个雇员招认的。希望通过对记录数据分析得出一个更接近实际的商店被偷的钱估计值。商店自开业以来,留有详细的原始记录(见 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 1的(1)-(4)栏)。 每位顾客带来的平均收入 钱箱差额 周(1996年11月——顾客数量 商店总收入 1997年10月) (人) (美元) (美元) (美元) (1) (2) (3) (4) (5) 1.68 1955.5 0.36 1 1164 1.68 2249.5 2 1339 4.40 2.04 2443.9 3 1198 1.97 2.32 3454.4 4 1489 10.52 2.76 4206.2 5 1524 11.11 3.16 6449.5 6 2041 2.79 3.84 13213.4 7 3441 9.84 2.04 2639.7 8 1294 12.92 1.44 2175.8 9 1511 3.58 1.53 1712.0 10 1119 6.74 1.41 1663.8 11 1180 0.28 1.39 1855.6 12 1335 4.44 1.39 1875.1 13 1349 1.36 1.44 2028.9 14 1409 5.52 1.41 1714.5 15 1216 0.57 1.44 2047.6 16 1422 1.72 1.32 1947 17 1475 3.79 1.17 1513.98 18 1294 9.48 1.29 1531.2 19 1187 5.35 1.53 2109.8 20 1379 0.45 1.29 1798.2 21 1394 7.99 1.27 1851.6 22 1458 3.96 1.41 1999.3 23 1418 17.16 1.41 2072.7 24 1470 21.67 1.32 1622.2 25 1229 3.82 1.46 1908.2 26 1307 2.00 1.34 1906.8 27 1423 0.26 1.41 2003.6 0.20 28 1421 1.51 1984.1 29 1314 4.00 1.27 1724.6 30 1358 3.75 1.41 1747(0 31 1239 9.40 1.56 2112.2 32 1354 0.36 1.75 2128 33 1216 2.81 1.63 1964.1 34 1205 0.94 1.82 2269.5 35 1247 0.03 1.92 2714.9 0.19 36 1414 1.72 1420.79 37 826 11.85 1.56 1630.2 38 1045 0.68 1.75 1855 39 1060 0.91 1.70 1790.1 40 1053 1.25 1.75 1844.5 41 1054 3.53 1.75 1907.5 42 1090 5.40 1.75 2089.5 43 1194 4.66 1.77 1978.89 44 1118 4.40 1.68 1952.2 45 1162 5.68 1.58 2003.4 46 1268 1.71 1.58 1753.8 47 1110 4.06 1.15 1416.8 48 1232 0.03 1.60 2011.2 49 1257 1.70 1.82 2264.1 50 1244 0.82 1.70 2062.1 51 1213 1.92 1.84 2414.08 52 1312 2.28 二、案例分析思路 为了估计损失的真实钱数,G女士咨询了一个在反欺诈领域有工作经验的审计师。她了解到,如果在收银机上低输商品数量的手法做得很小心的话,通常很难查明。但是,在这种手法下,也有一些征兆比较明显。一是低输商品数量会使每位顾客带来的平均收入减少。因为,顾客总数不变或增加的情况下,销售总额降低,必然导致每位顾客带来的平均收入减少。在这种情况下,每位顾客带来的平均收入和顾客总数在数值对比上有不合理的现象。二是偷窃时,窃贼通常把钱留在钱箱里,直到四周没有顾客时才拿出来,他必须记住每次往收银机里少输的准确数量,并且清楚应属于钱箱的总额。但窃贼一般很难做到这点。由于过于小心,他从钱箱取走的钱一般会少于实际少输入的钱数。这样,钱箱里的钱就会比收银机记录的多,从而产生一个正的差额。而如果是常规失误,多或少的差额从长时间来看会趋于抵消,即平均为零。 G女士列出了一年的各项数据,并计算出每位顾客带来的平均收入。G女士意识到商品销售难免存在物价和季节影响,因而在分析之前有必要对数据进行调整。为此,她又根据前六年的记录分别计算了每周的季节指数,还找到了这段时间内每周的通货膨胀指数。这些数据列入表2的(6)—(8)栏中。 考虑到G女士所列示的通货膨胀指数在计算方法和基期上的不同,我们将其改变为以第一周为基期的环比指数(表2的(9)栏),并对G女士所给出的数据进行了剔除季节影响和物价影响的调整。调整后的数据列入表的后三栏,并分别绘制了有关的散点图。 分组 每位顾客剔除季节与物顾客数以第一周为剔除季节影剔除季节与物价通货膨带来的平价影响后商店次序 量的季基期的环比 响后的顾客影响后每位顾客胀指数 均收入的总收入 节指数 物价指数 数量 带来的平均收入 季节指数 (1) (6) (7) (8) (9) (10) (11) (12) 一 2021.2 1 2 1.029 0.939 1240 1.63 1 2223.32 2 2.059 1 0.982 1364 1.63 1.0295 2066.07 3 2.024 1.135 1.061 1129 1.83 0.9830 2198.12 4 2.021 1.297 1.213 1228 1.79 0.9985 2056.32 5 2.054 1.436 1.401 1088 1.89 1.0163 851.36 6 2.031 4.711 1.63 1252 0.68 0.9888 2675.4 7 2.051 1.95 2.508 1372 1.95 1.0098 1040.06 8 2.024 1.556 1.655 782 1.33 0.9868 1928.27 9 2.069 0.935 1.183 1277 1.51 1.0222 2232.6 10 2.065 0.838 0.917 1220 1.83 0.9981 2223.05 11 2.034 0.829 0.918 1285 1.73 0.9850 2453.48 12 2.071 0.824 0.903 1478 1.66 1.0182 2404.08 13 2.071 0.875 0.892 1.0000 1512 1.59 2597.53 14 2.069 0.853 0.917 0.9990 1537 1.69 2308.32 15 2.107 0.824 0.885 1.0184 1374 1.68 2471.6 16 2.069 0.879 0.961 0.9820 1480 1.67 二 2366.12 17 2.037 0.9 0.929 0.9845 1588 1.49 1777.86 18 2.13 0.885 0.917 1.0457 1411 1.26 2012.43 19 2.077 0.897 0.867 0.9751 1369 1.47 2263.8 20 2.133 0.968 0.938 1.0270 1470 1.54 2096.38 21 2.077 0.929 0.951 0.9737 1466 1.43 2029.17 22 2.12 0.962 0.927 1.0207 1573 1.29 2263.28 23 2.107 0.933 0.952 0.9939 1489 1.52 2343.52 24 2.107 0.933 0.947 1.0000 1552 1.51 1995.1 25 2.115 0.929 0.875 1.0038 1405 1.42 2271.79 26 2.103 0.935 0.903 0.9943 1447 1.57 2336.37 27 2.154 0.929 0.859 1.0243 1657 1.41 2373.12 28 2.185 0.964 0.862 1.0144 1648 1.44 1997.28 29 2.172 1 1 0.9941 1314 1.52 1900.6 30 2.12 1 0.929 0.9761 1462 1.30 1838.54 31 2.185 1 0.923 1.0307 1342 1.37 1692.44 1.16 32 2.241 1.306 0.928 1.0256 1459 三 2216.04 33 2.212 1 0.971 0.9871 1252 1.77 1968 34 2.194 1 1.004 0.9919 1200 1.64 2153.37 35 2.303 0.971 1.037 1.0497 1203 1.79 2410.16 36 2.286 1.029 1.103 0.9926 1282 1.88 2442.18 37 2.323 0.912 0.629 1.0162 1313 1.86 2413.15 38 2.321 0.933 0.723 0.9991 1445 1.67 2246.64 39 2.281 0.97 0.868 0.9828 1221 1.84 2210.25 40 2.29 0.969 0.834 1.0039 1263 1.75 2311.32 41 2.281 0.941 0.853 0.9961 1236 1.87 2215.26 42 2.281 0.941 0.915 1.0000 1191 1.86 2163.18 43 2.281 0.941 1.027 1.0000 1163 1.86 2278.5 44 2.312 0.941 0.913 1.0136 1225 1.86 2214.3 45 2.333 0.909 0.96 1.0091 1210 1.83 2292.25 46 2.357 0.903 0.957 1.0103 1325 1.73 2261 47 2.357 0.903 0.859 1.0000 1292 1.75 2269.75 48 1.655 0.935 0.95 0.7022 1297 1.75 1652.91 49 2.393 0.933 0.905 1.4459 1389 1.19 2741.64 50 2.375 0.914 0.912 0.9925 1364 2.01 2319.68 51 2.367 0.968 0.92 0.9966 1318 1.76 2699.52 52 2.333 0.971 0.933 0.9856 1406 1.92 根据雇员招认的情况,将数据分为3组,即1-16为第一组,雇员没招认有盗窃行为,是否盗窃不清楚(G女士怀疑偷窃16周之前就已经发生);17-32为第二组,雇员招认有盗窃行为,肯定有盗窃行为;33-52为第三组,雇员被逮捕,肯定没有盗窃行为。 三、建模与检验 根据生活实际和已有资料,我们建立如下模型:顾客数量作为随机自变量X,总收入为顾客数量的函数,记为因变量Y,建立模型Y=α+βx+ξ。设每位顾客给商店带来的收入是随机的,期望为μ,方差为σ2,则在大量事件中,服从中心极限定理,而明天顾客的人数都在1000人左右,属于大样本,所以每天顾客给商店带来的平均收入应该是Eμ=μ,即应该是常数,设为模型中的b,而实际每天顾客给商店带来的平均收入,因此我们要做的就是估计实际的β。(若没有盗窃行为,应该模型中α=0) 模型Y=α+βx+ξ满足基本假定,即ξ服从正态分布,Eξ=0,Dξ=σ2,covξx=0,covξiξj =0(i不等于j),同时covβx=0,即每位顾客给商店带来的平均收入与顾客人数是线形无关的。在此基础上,分三组做β的回归。 剔除季节影响后的剔除季节与物价影响XY 第三组序号 X平方 顾客数量X 后商店总收入Y 2216.04 1567504 2774482 33 1252 1968 1440000 2361600 34 1200 2153.37 1447209 2590504 35 1203 2410.16 1643524 3089825 36 1282 2442.18 1723969 3206582 37 1313 2413.15 2088025 3487002 38 1445 2246.64 1490841 2743147 39 1221 2210.25 1595169 2791546 40 1263 2311.32 1527696 2856792 41 1236 2215.26 1418481 2638375 42 1191 2163.18 1352569 2515778 43 1163 2278.5 1500625 2791163 44 1225 2214.3 1464100 2679303 45 1210 2292.25 1755625 3037231 46 1325 2261 1669264 2921212 47 1292 2269.75 1682209 2943866 48 1297 1652.91 1929321 2295892 49 1389 50 1364 2741.64 1860496 3739597 2319.68 1737124 3057338 51 1318 2699.52 1976836 3795525 52 1406 1279.75 2273.955 1643529 2915838 平均 25595 45479.1 32870587 58316760 Σ 得到3=1.776 (假定α=0,否则根据公式得到的结果不合理,原因待查,且ΣY/ΣX约等于ΣXY/ΣXX, 说明假定α=0是合理的) 。 根据公式可得2=1.448, ? 2=43.147 ; 1=1.8414,? 1=263。45。 1. 雇员在承认盗窃的时间内盗窃总额是否和招认的符合, 由以上分析可知,在雇员没有盗窃行为发生的情况下,ΣY/ΣX约等于ΣXY/ΣXX,按公式解得的α 很大,应该直接假设α=0。但当有盗窃行为时,模型Y=α+βx+ξ中,α不等于0,而有了可以解释 的意义,即雇员每天盗窃的钱数。 取95%的置信区间,对第2组的α进行区间估计,则得 ,,X,X,(z, z),/2,/2nn (大样本,尽管期望和方差未知,仍用正态进行检验)其中样本 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差为14。83,得95%的置信区间(43。147-14。83*1。96/4,43。147+14。83*1。96/4),即雇员在承认盗窃的时间内,95%可能性每周盗窃(35。88,50。41),而最少每周盗窃钱数乘以周数:35。88*16=574。08>500,所以她承认总共盗窃500美元是不可信的,少于95%置信度的最小盗窃总额。 2. 雇员在承认盗窃的时间之前是否有盗窃行为, 从得到的 1=1.8414,? 1=263。45可知,有? 1存在,但取值不是十分合理,介于第3组和第2组之间,因此,对于雇员是否在1-16周就有盗窃行为,我们可以根据钱箱的差额进行分析。 由于原始数据中所给钱箱差额没有正负值,所以期望不等于零,我们采用符号检验。先对第3组的数据,其钱箱差额平均数为2.7425,而且大于和小于这一数字的样本单位数分别为9和11,接近于中位,所以我们将2.7425作为钱箱差额的期望,即,没有盗窃的正常情况。H0为没有盗窃行为,分析其符号情况。而对于第2组,其钱箱差额平均数为5。8525,明显大于2.7425,而且大于和小于2.7425的样本单位数分别为11和5,说明因为有盗窃行为的存在,钱箱差额明显变大,出现异常情况。再对第一组进行分析,其钱箱差额平均数为4。8825,也明显大于2.7425,而且大于和小于2.7425的样本单位数分别为10和6,说明有异常情况,盗窃行为有发生,这也和前面的回归分析相吻合。因此,我们可以推测该雇员在他没有招认的1-16周中,有盗窃行为发生。 3. 雇员的盗窃行为具体在什么时间开始, 为了分析这一问题,我们需要引入虚拟变量,即将雇员盗窃行为发生的周次记为i0=i,而i
本文档为【应用统计学课程设计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_731942
暂无简介~
格式:doc
大小:43KB
软件:Word
页数:11
分类:企业经营
上传时间:2017-09-25
浏览量:40