首页 数学建模统计建模论文

数学建模统计建模论文

举报
开通vip

数学建模统计建模论文历年数模竞赛试题的统计分析摘要全国大学生数学建模竞赛作为大学生热门赛事,其试题难度趋势及建模方法是直接关系到比赛好坏。本文也是围绕该问题,利用主成分统计方法及历年赛题相关文献建立一系列数学模型对历年赛题进行综合评价预测和重要性建模方法排序,最后由模型的求解结果提出建设性意见。对于问题一:本文利用主成分分析方法建立了综合评价预测模型,在实际基础上对影响赛题难易度的因素设置合理的值,再利用第一主成分对历年赛题进行综合评价,评价结果为,2010年的赛题最难,其次是2015年,在此基础上建立主成分回归方程,对2016年赛题...

数学建模统计建模论文
历年数模竞赛试题的统计分析摘要全国大学生 数学 数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划 建模竞赛作为大学生热门赛事,其试题难度趋势及建模方法是直接关系到比赛好坏。本文也是围绕该问题,利用主成分统计方法及历年赛题相关文献建立一系列数学模型对历年赛题进行综合评价预测和重要性建模方法排序,最后由模型的求解结果提出建设性意见。对于问题一:本文利用主成分分析方法建立了综合评价预测模型,在实际基础上对影响赛题难易度的因素设置合理的值,再利用第一主成分对历年赛题进行综合评价,评价结果为,2010年的赛题最难,其次是2015年,在此基础上建立主成分回归方程,对2016年赛题难易程度的预测,结果为该年的获奖率较高,难度不大。对于问题二:本文在综合评价预测模型基础上建立了重要性排序模型。通过对历年的赛题解题方法进行统计分析,建立评价函数,最后得到建模方法的重要性排序。建模中所用方法最多、最重要的是运筹规划,次之是网络优化和数值运算。对于问题三,我们在问题一和问题二的求解结果的基础上提出短期建议应提高运筹规划,网络优化和数值运算的掌握与应用,并在长期建议中提出提高阅读能力,拓宽知识面和学习计算机新型算法等建议。该模型思路方法清晰,适合对数模竞赛题进行统计分析。关键字:主成分分析;评价;预测;排序1介绍1.1背景自80年代开始,我国的数学建模教学和数学建模竞赛日益蓬勃地发展起来。到如今,全国数学建模竞赛已成为全国大学生及研究生的重要赛事,且竞赛成绩也成为了衡量一个高等学府实力的一个标准。数学建模竞赛有利于推进高校学生的综合素质教育,还有利于建立高校学生把实际问题和数学方法联立的思想方法。正因为如此,提前的科学性教学以及对历年赛题的分析也变得尤为重要。1.2问题重述全国大学生数学建模竞赛题型众多,对于建模竞赛试题题型及难度趋势的把握,关系到赛前准备工作的落实及比赛成绩的好坏。但是将每个题目都做一遍显然不可能,一种思路是对题目的特点进行分析,作出判断,用于指导赛前的各项准备工作。请根据历年的全国题目(必选)和有关高校的选拔题目(自选)的特点(例如数据、方法、规模等),建立模型进行分析,解决以下问题:1、对建模题目的难度趋势进行综合评价和预测。2、根据这些题目常用的建模方法作统计分析,对常用建模方法的重要性进行排序。3、对建模培训的内容、方式等方面给出建议报告。1.3问题分析针对以上问题,进行如下分析:对于问题一:本问题主要是解决对建模题目的难度进行综合评价,并对建模题目进行预测。首先我们通过查阅文献,对历届的赛题进行难易度分析,选取了针对数模竞赛问题的难易度影响因素,并且根据每一个因素取值不同特点,可将其分为连续变量、分类变量、等级变量,并给出了变量范围。通过主成分分析的方法,对历届的赛题的难易度进行综合评价,然后建立主成分回归方程对2016年建模题目难度进行预测。对于问题二:本问题主要对历代建模题目的题目方法统计,然后对建模方法的重要性进行排列。我们通过查阅文献,对历年的赛题解题方法进行统计分析,然后在问题一模型的基础上,建立评价函数,对建模使用方法的重要性进行排序。最后,对重要的建模的方法进行分析。对于问题三:本问题是在前两问题求解的基础上如何有效地进行建模培训和学习提出建设性意见。利用问题一的历年赛题难度评价结果和问题二的重要性建模方法结果,针对因素分析提出学习内容方面建议,针对使用方法分析提出重点学习使用方法建议。1.4问题假设1.假设影响数模问题的难度趋势因素不完全相关。2.由于各个因素影响数模问题的难度趋势是有差异的,假设随机因素服从2(0,)N。1.5符号解释ijx,ijy:第i组样本数据中第j个变量的值X:样本阵Y:X做标准化后的标准化矩阵jx:矩阵X中第j的均值ja:矩阵X中第j的标准差R:标准化的矩阵Y的样本相关系数阵jF,jQ:第j个主成分YQ:评价函数ic:第i个指标的权重A:重要性综合评价2模型建立与求解2.1综合评价预测模型2.1.1模型的建立由假设1,影响数模问题的难度趋势因素不完全相关,利用统计中主成分思想来筛选因素是有意义的,主成分的基本思想是利用线性代数中的正交变换将一组相关变量生成新的不相关的新的变量,然后对新的变量进行降维处理,以高精度形成低维系统[1]。通过查阅相关文献[2],制定了影响数学建模题目难易程度的因素,具体见表1,而且我们根据每一个因素取值不同特点,可将其分为连续变量、分类变量、等级变量,并给出了变量范围。表1数学建模题目难易程度的因素影响因素变量性质变量范围易.........难题目阅读量连续变量150500n150........500条件的利用情况分类变量0,10..........1考查 知识点 高中化学知识点免费下载体育概论知识点下载名人传知识点免费下载线性代数知识点汇总下载高中化学知识点免费下载 的多少等级变量15n1..........5数学过程的复杂性等级变量15n1..........5数据收集的难易程度等级变量15n1..........5问题的开放性分类变量0,10..........1情景特征的建模难度等级变量15n1..........5问题的可思考性分类变量0,10..........1问题情景的新颖性等级变量15n1..........5问题的表达方式分类变量0,10..........1分布设问情况等级变量15n1..........5计算机算法的容易度分类变量0,10..........1由表1得,设影响因素构成的向量为1212(,,,)xxx。则样本阵为:11121121222212TnTnTnnnnnxxxxxxxxXxxxx(1)其中,ijx表示第i组样本数据中第j个变量的值。对X做标准化变换得标准化矩阵Y为11121121222212TnTnTnnnnnyyyyyyyyYyyyy(2)其中,ijjijjxxya,jx,ja代表矩阵X中第j的均值与标准差。计算标准化的矩阵Y的样本相关系数阵R1TYYRn(3)计算相关系数矩阵R的特征值0nRI(4)解得n个特征值120n,取前m个主成分jF(1,2jm),需要由下式确定:110.8mjjnjj(5)其中(5)式也成为累计贡献率,它的意义是前m个主成分综合原始变量所含信息的能力。在假设2的基础上得到主成分回归方程,此方程可以对未来赛题的难易程度作出预测,方程为:1122nnfxxx(1,2,12n)(6)2.1.2模型的求解通过查阅2009年至2015年全国大学生数学建模赛题分析的相关文献[3],我们由此为依据得到影响题目难易程度的具体变量值,查阅浙江赛区2009年至2015荣获全国一等奖的比率作为衡量题目难易程度的指标,比率越高,题目越简单,具体见表2。表2数模赛题难易程度的具体变量值及获奖率年份2009201020112012201320142015题目阅读量500195387457483302189条件的利用情况1010001考查知识点的多少4544455数学过程的复杂性4534555数据收集的难易程度4423454问题的开放性1101011情景特征的建模难度2323445问题的可思考性0100101问题情景的新颖性3523534问题的表达方式0100001分布设问情况4534444计算机算法的容易度1011111获奖率0.0365850.0529220.0435130.0514590.0526720.0508330.044715由(1)—(5)式,通过SAS编程计算,得到表3的结果表3影响因素的相关参数特征值累计贡献率16.288477490.52421.77314750.671831.567829990.802541.457217330.923950.601554080.97460.311773611由于前三个主成分的累计贡献率已经达到0.8,因此3m,具体主成分见表4,表4影响因素的样本主成分主成分1主成分2主成分3x1-0.2939360.44339-0.051158x2-0.163226-0.4922590.041319x30.329157-0.2635660.259519x40.3599830.2696710.135596x50.2726260.2787890.412325x60.190478-0.1882150.480923x70.264010.1417760.220633x80.3009560.045613-0.404933x90.3199790.271372-0.345077x100.314979-0.405917-0.170298x110.337370.105441-0.071855x12-0.2504540.1844950.37782由于第一主成分的特征值最大,我们选取第一主成分对赛题难易程度排序,结果见表5。表5赛题难易程度排序名次年份12010220153201442013520126200972011由(6)式由SAS软件求得主成分回归方程如下:将表2的结果代入回归方程得到各年获奖率的理论值,具体见表6。表6各年的获奖率实际值与理论值年份实际值理论值相对误差20090.0365850.0446832070.22135320520100.0529220.0517317320.02249098720110.0435130.0410197290.05729945120120.0514590.046703920.09240521620130.0526720.0541448380.02796244720140.0508330.0476260810.06308734520150.0447150.0467833050.046255283将表6结果利用Matlab画出图像,得到图1。图1各年的获奖率实际值与理论值图像大数据近年来是许多学者研究的方向[4],我们以此为背景利用主成分回归方程对2016年赛题的难易程度进行预测,具体结果见表7。表72016年赛题的难易程度预测年份2016题目阅读量300条件的利用情况1考查知识点的多少4123456789101112.0000047480.0023848960.0007970.001094120.0005070.0013732330.0003469810.0016632640.0011664360.0005910370.0012250.03459206310.000836938xxxxxxxxxxxfx数学过程的复杂性4数据收集的难易程度4问题的开放性0情景特征的建模难度5问题的可思考性1问题情景的新颖性5问题的表达方式0分布设问情况4计算机算法的容易度1获奖率0.0501439192.1.3结果分析由主成分分析综合评价结果表5发现,2010年的赛题最难,其次是2015年,这是因为这两年考察知识点、数学过程的复杂性等级较高,而且问题具有一定的开放性、新颖性,建模难度比较大,这些都是和实际情况相符合。由表6和图1结果不难发现,主成分回归方程用来预测的相对误差较小,理论值和实际值的曲线非常接近,说明主成分回归方程用来预测较为合理,利用此方程来预测2016年赛题的难度趋势,由表7得知,该年的获奖率较高,说明试题大家普遍都能做,难度不大。2.2重要性排序模型2.2.1模型的建立我们选取综合评价预测模型的相关方法,即主成分分析方法,建立评价函数,最后对各个数模方法的重要性进行排序。同样,设影响因素构成的向量为12(,,,)nyyy。根据实际数据调查[3],对历年数模问题的方法进行统计,具体见表2,0表示没有用到该方法,1表示用到了该方法。表1对公共安全因素评判打分年份1w2wLw方法1y11y11y1Ly2y21y22y2Lyny1ny2nynLy则样本阵为:11121121222212TnTnTnnnnnyyyyyyyyYyyyy(7)其中,ijy表示第i组样本数据中第j个变量的值。对Y做标准化变换得标准化矩阵Z为11121121222212TnTnTnnnnnzzzzzzzzZzzzz(8)在(3)—(4)式基础上,解得n个特征值120n特征值越大,对应的因素也就越重要,因此根据特征值的大小,可以将方法的重要程度按从大到小排列。一般来说特征值所对应方法无法确定,而主成分最大的优点是利用低维向量系统就可进行评价,只需取部分主成分构造评价函数得到评价权重,即可对重要的影响因素进行筛选,取前m个主成分jQ(1,2jm),需要由(5)式确定,利用前m个主成分构造评价函数:112211(/)mmYjjjLnjjQQbwbwbw(9)由此得到原有指标得分值:1,(1,2,)LYijijjVbyin(10)由(7)式得到各指标的权重:1/niYiYiicVV(11)再由表2的结果,运用模糊评判[5],计算各类方法用到的总数:11Liijjry(1,2,,in)(12)由(12)式得到各类方法归一化的矩阵:11112111111/000/0000/niiniinniirrrrRrr(13)最后得到重要性的综合评判:ijAcR(14)2.2.2模型的求解通过查阅1993年至2015年全国大学生数学建模赛题方法的相关文献[3],得到表8的结果。1表示运用该方法,0表示没有运用该方法。表81993年至2015年赛题的建模方法19931994199519961997199819992000运筹规划11111111网络优化10010111数值计算11101110统计与评价00000000微分方程与差分方程00010000计算机模拟10001011几何与微积分00000000续表820012002200320042005200620072008运筹规划11101110网络优化00010111数值计算10011111统计与评价01011001微分方程与差分方程00100010计算机模拟00000000几何与微积分00000000续表82009201020112012201320142015运筹规划0011101网络优化0000011数值计算1110100统计与评价1111101微分方程与差分方程0000010计算机模拟1000000几何与微积分0100010由(7)、(8)、(3)—(5)式,通过SAS编程计算,得到表9结果。表9建模方法的相关参数特征值贡献率累计贡献率18.936619560.38850.388525.149809310.22390.612533.317915340.14430.756742.783689690.1210.877752.17579720.09460.972360.636168890.02771由于前四个主成分的累计贡献率已经达到0.8,因此4m,表10建模方法样本的主成分主成分1主成分2主成分3主成分4x10.2114820.219838-0.281344-0.016169x20.3015030.050412-0.011771-0.141351x30.3015030.050412-0.011771-0.141351x40.0328730.3433860.2844050.17103x50.2251570.071869-0.204958-0.361372x60.2615590.193988-0.0871310.216168x70.2114820.219838-0.281344-0.016169x80.0853840.28239-0.061541-0.01805x90.3015030.050412-0.011771-0.141351x100.172941-0.1597860.372745-0.014027x110.0509910.2140690.395226-0.190797x120.121161-0.169018-0.1649760.465196x130.283971-0.2084160.120466-0.010924x140.2615590.193988-0.0871310.216168x150.1589720.2808340.0646030.172912x160.121161-0.169018-0.1649760.465196x170.084759-0.291138-0.282804-0.112345x180.017203-0.369235-0.0901920.061307x190.283971-0.2084160.120466-0.010924x200.172941-0.1597860.372745-0.014027x210.283971-0.2084160.120466-0.010924x22-0.2338940.1825660.0737470.243261x230.1441980.0021050.2638830.332398由(9)—(11)式,得到指标的分值及权重,具体见表11。表11指标的分值及权重1YV2YV3YV4YV5YV6YV7YV2.1514681.2475061.3255640.5197530.4534660.2354560.104251c2c3c4c5c6c7c0.3690990.2140180.227410.0891670.0777950.0403940.01788再由(12)—(14)式,得到重要性方法排列结果:0.03566974,0.05513,0.01351,0.004715,0.003(0.1006606,0.00)3,054A2.2.3结果分析由上述结果不难发现,运筹规划方法占的比重是最大的,其次网络优化方法以及数值计算方法也比较大,运筹规划方法包括线性规划、非线性规划、动态规划、决策论、排队论等优化知识,网络优化包括图论等。这和数学建模本身来说是比较相符,在现实意义下,优化问题一直是热门问题,也是一个难点问题,因此求解结果较为合理。3数学建模建设性报告全国大学生数学建模竞赛作为大学生的重要赛事,也作为衡量一个高校实力的一个重要赛事。对竞赛试题的把控对各高校来说具有不可忽视的重要性。本文基于这种情况运用数学模型对2016年的赛事试题进行了预测。预测结果如下:1.按照往年趋势,预测2016年全国大学生数学建模竞赛赛题依然以低阅读量,多知识面,少数据以及较大开放性为主。在此基础上对计算机的算法要求也会相应增加。设问情况以4问或5问为主,设问条理清晰。2.基于往年数据的分析,预测2016年全国大学生数学建模竞赛赛题解法主要以运筹规划,网络优化和数值运算为主。在此主体上,可能存在统计与评价的方法的应用,其他数学方法可能的几率较低。基于以上两点预测结果,提出相应的建议:1.对于短期建议,2016年数模竞赛在即,我们需要的是对主要方法运筹规划,网络优化,数值运算,统计与评价方法重点学习,并能熟练地应用,还需适量了解其他方法的运用。2.对于长期建议,我们应加强在阅读理解题意的能力,未来的趋势是在少阅读量的基础上提出相应问题。还应拓宽知识面,未来发展将有更广的知识面和更大的开放性。在此基础上对计算机新型算法的掌握也有较大的重要性,未来的计算将更依赖于计算机,计算的复杂性也会相应的加大。以上是对教学和学习方面的几项建议。4模型的优缺点及推广优点:1.综合评价预测模型在对难易度分析方面有较为简便的运算和较强的适应性。2.重要性排序模型运用主成分分析法,运用客观数据,可靠性较高,结果较为准确。缺点:综合评价预测模型运用了主成分分析法,对难度打分存在主观意思误差。推广:综合评价预测模型可适用于大多数有历史数据的近期预测,重要性排序模型可适用于事物因素筛选情况。5参考文献[1]张鹏.基于主成分分析的综合评价研究[D].南京:南京理工大学,2004[2]杜明荣.高中物理试题难度的影响因素研究[D].重庆:西南大学,2008[3]中国数学建模网.http://www.shumo.com/home/[4]李金昌.大数据与统计新思维[J].统计研究,2014,31(1):10-17[5]刘运通,胡江碧.模糊评判的数学模型及其参数估计[J],北京工业大学学报,2001,27(1):112-115
本文档为【数学建模统计建模论文】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥18.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
肥猫叫noah
暂无简介~
格式:pdf
大小:596KB
软件:PDF阅读器
页数:0
分类:高中语文
上传时间:2020-04-01
浏览量:15