Minitab全面培训教程精讲

Minitab全面培训教程精讲Minitab介绍Minitab是众多统计软件当中比较简单易懂的软件之一；相对来讲，Minitab在质量管理方面的应用是比较适合的；Minitab的功能齐全，一般的数据分析和图形处理都可以应付自如。Minitab与6Sigma的关系在上个世纪80年代Motolora开始在公司内推行6Sigma，并开始借助Minitab使6Sigma得以最大限度的发挥；6Sigma的MAIC阶段中，很多分析和计算都可以都通过Minitab简单的完成；即使是对统计的知识不怎么熟悉，也同样可以运用Minitab很好的完成各项分析。Min...

Minitab介绍Minitab是众多统计软件当中比较简单易懂的软件之一；相对来讲，Minitab在质量管理方面的应用是比较适合的；Minitab的功能齐全，一般的数据分析和图形处理都可以应付自如。Minitab与6Sigma的关系在上个世纪80年代Motolora开始在公司内推行6Sigma，并开始借助Minitab使6Sigma得以最大限度的发挥；6Sigma的MAIC阶段中，很多分析和计算都可以都通过Minitab简单的完成；即使是对统计的知识不怎么熟悉，也同样可以运用Minitab很好的完成各项分析。Minitab的功能计算功能计算器功能生成数据功能概率分布功能矩阵运算Minitab的功能数据分析功能基本统计回归分析方差分析实验设计分析控制图质量工具可靠度分析多变量分析时间序列列联表非参数估计EDA概率与样本容量Minitab的功能图形分析直方图散布图时间序列图条形图箱图矩阵图轮廓图三维图点图饼图边际图概率图茎叶图特征图课程内容安排由于时间有限，很多内容只是做简单的介绍；在两天的时间里，主要的课程内容安排如下：区分第一天第二天上午基本界面和操作介绍常用图形的Minitab操作特性要因图柏拉图散布图直方图时间序列图4）组间/组内能力分析5）Weibull能力分析基础统计和假设检验1)描述统计2)单样本Z测试3)单样本T测试4)双样本T测试5)成对T测试6)1比率测试7)2比率测试8)正态分布下午SPC的Minitab操作1)Xbar-RChart2)Xbar-SChart3)I-MRChart4)Z-MRChart5)I-MR-R/SChart6)PChart7)NPChart8)CChart9)UChart能力分析1）正态分布图能力分析2）泊松分布图能力分析3）二项分布图能力分析方差分析1)单因数和双因数方差分析回归分析1)简单回归2)逐步回归MSA测量系统分析1)测量重复和再现性(交叉Crossed、嵌套Nested)2)测量走势图3)测量线性研究4)属性测量R&R研究（计数）Minitab界面和基本操作介绍Minitab界面SessionWindow:分析结果输出窗口DataWindow:输入数据的窗口每一列的名字可以写在最前面的列每一列的数据性质是一致的主菜单Minitab界面同一时间只能激活一个窗口.每一个窗口可以单独储存.不同的要求选择不同的保存命令打开文件保存文件打印窗口之前之后命令查找数据查找下一个数据取消帮助显示因子设计当前数据窗口session窗口剪切复制粘贴恢复显示worksheets折叠显示GRAPH折叠状态向导显示session窗口折叠项目窗口关闭所有图形窗口重做编辑最近对话框历史记录报告便栈打开相关文件项目管理窗口插入单元格插入行插入列移除列工具栏的介绍数据的生成(MakeRandomData)例：生成一组男生身高的数据，要求：平均身高175cm，标准偏差5cm，数据个数100.Select:计算>随机数据>正态数据的生成结果生成有规律的数据Select:计算>产生模板化数据>简单数集结果输出数据类型的转换(ChangeDataType)Select:数据>更改数据类型>数字到文本需要转换的列转换后数据存放列，可以是原来的数据列数据类型的转换结果数据的堆栈（Stack&Unstack）Select:数据>堆叠>列数据的堆栈结果数据块的堆栈(StackBlocks)Select:数据>堆叠>列的区组数据块的堆栈结果转置栏（TransposeColumns）Select:数据>转置列输入需要转置的列输入新工作表的位置可以输入注解列转置结果连接（Concatenate）Select:数据>合并连接结果编码（Code）Select:数据>编码>数字到文本编码结果Minitab之常用图形QC手法常用的图形如下:特性要因图控制图(参见SPC部分)柏拉图散布图直方图时间序列图特性要因图练习人机料法环测不够熟练设备没有保养原料没有检查没有设定标准化方法温度太高仪器偏差太大培训不够设备不常清扫原料含s,p太高抽样方式不合理湿度太低仪器R&R太高监督不够没有进行点检输入表中Select:统计>质量工具>因果填好各项需要的参数结果输出:柏拉图练习项次缺陷项数量1虚焊5002漏焊3003强度不够2004外观受损1505其它160输入数据Select:统计>质量工具>Pareto图填好各项参数结果输出下表为STS冷轧工厂ZRM不良现状,试做分析练习:不良项目不良数不良率累计不良率摩擦痕7.780.370.37辊印2.440.120.48污染2.270.110.59划伤2.220.110.70线形裂纹1.970.090.79异物压入1.330.060.85斑痕1.110.050.91微细裂纹0.770.040.94垫纸压入0.680.030.98轧机垫纸印痕0.510.021.00合计21.08　　散布图练习YX65800668106582066830678406785068860688706789068900输入数据Select:图形>散点图输入参数可以选择不同的输出表现形式输出图形可以用直接方式判定，有正相关的倾向。更详细的说明可以参见回归分析直方图练习序号零件重量161.161.361.460.660.662.061.060.6260.660.860.961.361.060.860.760.2361.360.660.360.761.260.661.162.1461.060.861.860.960.961.761.460.4560.960.260.661.561.759.862.162.3661.060.860.960.661.161.061.160.9760.360.761.061.760.561.661.660.7860.561.361.561.161.060.761.260.8961.061.461.060.361.161.161.061.11061.260.960.461.660.660.460.360.61160.460.561.361.261.960.961.060.71260.860.859.760.861.061.260.660.71362.361.261.260.061.060.161.461.11462.260.960.561.662.561.161.061.41560.160.861.061.160.861.561.760.5Select:图形>直方图输入数据例:右表为某零件重量的数据.试作(1)直方图(2)计算均值x和标准差s(3)该特性值的下限是60.2克,上限是62.6克,在直方图中加入规格线并加以讨论.填入参数结果输出请依照直方图分析方法来进行图形分析和判定更深入的分析可以参见制程能力分析部份。时间序列图练习时间销售量2006/11502006/21262006/31352006/41652006/51902006/61702006/71752006/81802006/9176输入数据Select:图形>时间序列图填入参数可以选择不同的输出表现形式时间刻度设置结果输出依此状况来判定未定的销售趋势。Minitab的SPC使用控制图一.控制图原理1.现代质量管理的一个观点--产品质量的统计观点a.产品的质量具有变异性.b.产品质量的变异具有统计规律性.至工业革命以后,人们一开始误认为:产品是由机器造出来的,因此,生产出来的产品是一样的.随着测量理论与测量工具的进步,人们终于认识到:产品质量具有变异性,公差制度的建立是一个标志.产品质量的变异也是有规律性的,但它不是通常的确定性现象的确定性规律,而是随机现象的统计规律.控制图一.控制图原理2.控制图的原理a.计量值产品特性的正态分布如果我们对某一计量值产品的特性值(如:钢卷厚度等）进行连续测试,只要样本量足够大,就可看到它们服从正态分布的规律.控制图一.控制图原理b.3σ控制方式下的产品特性值区间3σ控制方式下产品特性值落在[μ-3σ,μ+3σ]范围内的概率为99.73%,其产品特性值落在此区间外的概率为1-99.73%=0.27%.控制图一.控制图原理c.常规控制图的形成控制图一.控制图原理d.控制图原理的解释第一种解释:1.若过程正常,即分布不变,则点子超过UCL的概率只有1‰左右.2.若过程异常,μ值发生偏移,于是分布曲线上、下偏移,则点子超过UCL或LCL的概率大为增加.结论:点出界就判异以后要把它当成一条规定来记住.控制图一.控制图原理第二种解释:1.偶然因素引起偶然波动。偶然波动不可避免,但对质量的影响微小,通常服从正态分布,且其分布不随时间的变化而改变。过程受控控制图一.控制图原理2.异因引起异波。异波产生后,其分布会随时间的变化而发生变化。异波对质量影响大,但采取措施后不难消除。第二种解释:结论:控制图上的控制界限就是区分偶波与异波的科学界限,休哈特控制图的实质是区分偶然因素与异常因素两类因素.过程失控二.常规控制图及其用途控制图二.常规控制图及其用途控制图Minitab可提供的图形计量型Xbar-RXbar-sI-MRI-MR-sZ-MR计数型PNpCUXbar-R做法Xbar-R是用于计量型判稳准则：连续二十五点没有超出控制界限。判异准则：一点超出控制界限连续六点上升或下降或在同一侧不呈正态分布，大部份点子没有集中在中心线。Xbar-R做法Xbar-R练习Select:统计>控制图>子组的变量控制图>Xbar-R打开Data目录下的凸轮轴.mtw路径：ProgramFiles\Minitab\Minitab16\中文(简体)\样本数据\凸轮轴输入参数根据不同的输入方式选择不同的分析方法决定测试要求可以在这里选择判异准则判异准则准则1:一点超出控制界限准则2:连续9点在中心线的同侧判异准则准则3:连续6点呈上升或下降趋势判异准则准则4:连续14点上下交替判异准则准则5:连续3点中有2点落在中心线同一侧的B区以外判异准则准则6:连续5点中有4点在C区之外(同侧)判异准则准则7:连续15点在中心线附近的C区内判异准则准则8:连续8点在中心线两侧而无一点在C区判异准则决定标准差的估计方法一般选择Rbar的标准差估计方式决定选项进行正态性转换λ值将标准转换变量的标准偏差最小化,当λ≠0，转换结果为Yλ,如λ＝0,转换结果为LOGeYλ值转换值λ＝2Y´=Y2λ＝0.5Y´=√Yλ＝0Y´=logeYλ＝-0.5Y´=1/√Yλ＝-1Y´=1/Y决定选项(续)输入1,2,3StDEV控制限图形输出:判图请判定前图是否有异常请问本图为解析用图或是控制用图Xbar-s做法Xbar-s练习Select:统计>控制图>子组的变量控制>Xbar-s打开数据样本目录下的凸轮轴.mtw输入参数其他参数设置与Xbar-R图相同图形输出:判图请判定前图是否有异常请问本图为分析用图或是控制用图I-MR图做法I-MR练习打开下列档案:Data目录下的涂层.MTWSelect:统计>控制图>单值的变量控制图>I-MR输入参数输入变量图形输出判图请判定前图是否有异常请问本图为解析用图或是控制用图I-MR-R图做法I-MR-R练习打开Data目录下的凸轮轴.mtwSelect:统计>控制图>子组的变量控制图>I-MR-R输入参数输入变量和样本数图形输出判图请判定前图是否有异常请问本图为分析用图或是控制用图Z-MR(标准化的单值移动极差)图做法Z-MR练习Select:统计>控制图>单值的变量控制图>Z-MR打开数据样本目录下的质量控制示例.MTW当过程数据少而无法很好评估过程参数时使用输入参数输入变量输入自变量决定估计选择标准差的估计方法图形输出P图做法判定及采取措施P图练习P图只能适用在二项分布的质量特性性。在做p图时，要注意其样本数必须达到1/p~5/p，如此之下的图才比较具有意义。输入数据打开数据文档Select:统计>控制图>属性控制图>P将数据输入到Minitab表中输入参数输入变量输入样本数决定判异准则选择判异准则计数型的判异准则与计量型的不太一样图形输出NP图做法NP图练习np图只能适用在二项分布的质量特性性。在做np图时，要注意其样本数必须达到1/p~5/p，如此之下的图才比较具有意义。输入数据打开数据文档Select:统计>控制图>属性控制图>NP将数据输入到Minitab表中图形输出C图做法C图练习c图只能适用在泊松分布的质量特性上。在做c图时，要注意其样本数必须达到取样时至少包含一个缺陷以上，如此之下的图才比较具有意义。另外就是基本上c图的样本要一定才可以。如果样本数不一样，则应当使用u图。输入数据打开数据文档将数据输入到Minitab表中Select:统计>控制图>属性控制图>C输入参数输入变量决定判异准则判异准则同P图一样图形输出U图做法U图练习u图只能适用在泊松分布的质量特性上。在做u图时，要注意其样本数必须达到取样时至少包含一个缺陷以上，如此之下的图才比较具有意义。输入数据打开数据文档Select:统计>控制图>属性控制图>U将数据输入到Minitab表中输入参数输入变量输入样本量图形输出EWMA做法EWMA的全称为ExponentiallyWeightedMovingAverage,即指数加权移动平均控制图.EWMA图的特点:1、对过程位置的稍小变动十分敏感;2、图上每一点都综合考虑了前面子组的信息;3、对过程位置的大幅度移动没有Xbar图敏感;4、可应用于单值,也可应用于子组容量大于1的场合.EWMA图的适用场合:可用于检测任意大小的过程位置变化,因此常用于监控已受控过程,以发现过程均值相对于目标值的漂移EWMA练习Select:统计>控制图>时间加权控制图>EWMA输入参数确定权重系数λ的值,λ由所需的EWMA图对位置偏移检测灵敏度所决定,要求检测灵敏度越高,λ值越小.如需检测1σ的过程偏移,λ=0.2,如需检测2σ的过程偏移,λ=0.4.常取λ=0.2,1<λ<2.图形输出CUSUM做法CUSUM的全称为CumulativeSum,即累积和控制图.CUSUM图的特点:1、可以检测每个样本值偏离目标值的偏差的累积和;2、可应用于单值,也可应用于子组容量大于1的场合;3、要求每个子组的样本容量相等.CUSUM图的适用场合:CUSUM图适用于在过程受控时,检测过程实际值偏离目标的异常点,作用与EWMA图类似.CUSUM练习Select:统计>控制图>时间加权控制图>CUSUM例:某机场每天离港、进港航班多达千架次,航班延误情况很是严重.航空公司在6σ管理中把航班延误作为重点解决的质量项目,规定航班起飞时间比时刻表晚5分钟为延误,其中不包括因恶劣天气等无法抗拒因数造成的延误.通过一段时间的治理,航班延误率从过去的10%降到现在的2%左右,公司决定采取过程控制,把航班延误率控制在2%的较好水平.输入参数点击此选项决策区间过程允许偏移量图形输出MINITAB之制程能力分析制程能力之分类MINITAB能力分析的选项(计量型)能力分析(正态)能力分析(组间/组内)能力分析(非正态)能力分析(多变量正态)能力分析(多变量非正态)能力分析(二项)能力分析(Poission)CapabilitySixpack(正态)CapabilitySixpack(组间/组内)CapabilitySixpack(非正态)能力分析(正态)该命令会划出带理论正态曲线的直方图，这可直观评估数据的正态性。输出报告中还包含过程能力统计表，包括子组内和总体能力统计。能力分析(组间/组内)该命令会划出带理论正态曲线的直方图，可以直观评估数据的正态性。该命令适用于子组间存在较大变差的场合。输出报告中还包含过程能力统计表，包括子组间／子组内和总体能力统计。能力分析(非正态)该命会会划出带非正态曲线的直方图，这可直观评估数据是否服从其他分布。输出报告中还包含总体过程总能力统计能力分析　(多变量正态)能力分析　(多变量非正态)---上述两个命令用于对多个变量进行分析制程能力分析做法STEP1决定Y特性Y特性一般是指客户所关心所重视的特性。Y要先能量化，尽量以定量数据为主。Y要事先了解其规格界限，是单边规格，还是双边规格。目标值是在中心，或则不在中心测量系统的分析要先做好。STEP2决定Y特性在收集Y特性时要注意层别和分组。各项的数据要按时间顺序做好相应的整理STEP3决定Y特性将数据输入MINTAB中，或则在EXCEL中都可以。STEP4决定Y特性利用MINITAB>统计>质量工具>能力分析(正态)STEP5决定Y特性利用MINITAB的各项图形来进行结果说明练习样本X1X2X3X4X5199.7098.72100.24101.28101.20299.32100.97100.8799.2498.21399.8999.83101.4899.56100.90499.1599.7199.1799.3098.80599.66100.80101.06101.16100.45697.7498.8299.2498.6498.737101.18100.2499.6299.3399.918101.54100.96100.62100.67100.499101.49100.6799.36100.38102.101097.1698.2697.59100.0999.78输入数据Select:统计>质量工具>能力分析(正态)输入选项根据不同的数据输入方式选择分析方法输入上下规格界限选择标准差的估计方法一般选择复合的标准差估计方式选项的输入如果需要计算Cpm则需要输入目标值选择是否作正态型转换过程能力表现形式的选择以Cpk,Ppk结果的输出Cpm是指样本数值相对于对于目标值的一个能力值，也就是样本是否靠近目标值的概率样本数值超过分析规格界限的分布率模拟曲线落在控制线以外的分布率Cp:过程能力指数,又称为潜在过程能力指数,为容差的宽度与过程波动范围之比.Cp=(USL-LSL)/6σCpk:过程能力指数,又称为实际过程能力指数,为过程中心µ与两个规范限最近的距离min{USL-µ,µ-LSL}与3σ之比.Cpk=min{USL-µ,µ-LSL}/3σCpm:过程能力指数，有时也称第二代过程力　　　　　　指数，质量特性偏离目标值造成的质量损失．Cpm=(USL-LSL)/6σ′其中:σ́2=σ2+(µ-m)2Cpmk称为混合能力指数Pp与Ppk:过程绩效指数，计算方法与计算Cp和Cpk类似，所不同的是，它们是规范限与过程总波动的比值．过程总波动通常由标准差s来估计．过程能力与缺陷率的关系：1、假如过程中心µ位于规范中心M与上规范限USL之间，即M≤µ≤USL时，　p(d)=Φ[-3(2Cp-Cpk)]+Φ(-3Cpk)2、假如过程中心µ位于规范中心M与下规范限LSL之间，即LSL≤µ≤M时，p(d)=Φ[-3(1+K)Cp]+Φ[-3(1-K)Cp]以Zbench方式输出ZUSL=(USL-µ)/σZLSL=(µ-LSL)/σZ=(USL-LSL)/2σ或Z=3Cp双侧规范下综合SigmaLevelZbench需通过总缺陷率进行折算使用SigmaLevelZ来评价过程能力的优点是:Z与过程的不合格率p(d)或DPMO是一一对应的.结果说明请打开Data目录下的Camshaft.mtw，以Zbench方式输出练习填入参数结果输出通过DPMO求SigmaLevelSelect:Calc–ProbabilityDistribution-NormalSelect:Calc–Calculator结果输出合格率Z值,SigmaLevelCapabilityAnalysis(Between/Within)组间的σ组内的σ此处的Ppk>Cpk过程稳定系数dσ=StDev(overall)-StDev(B/W)过程相对稳定系数drσ=[StDev(overall)-StDev(B/W)]/StDev(overall)StDev(overall):长期标准差的估计值StDev(B/W):短期标准差的估计值过程相对稳定系数的评价参考过程相对稳定系数drσ的范围评价drσ<10%接近稳定10%<=drσ<20%不太稳定20%<=drσ<50%不稳定drσ>=50%很不稳定CapabilityAnalysis(Nonnormal)此项的分析是用在当制程不是呈现正态分布时所使用。因为如果制程不是正态分布硬用正态分布来分析时，容易产生误差，所以此时可以使用其他分布来进行分析，会更贴近真实现像。练习请使用同前之数据来进行分析。上规格：103下规格：97规格中心：100输入相关参数Select:Stat>QualityTools>CapabiltyAnalysis(Nonnormal)填入选项要求威布尔分布的参数估计结果图形形状参数正态分布适用性的判定可以使用Stat>basicstatistic>normalitytest但数据要放到同一个column中，所以必须针对前面的数据进行一下处理数据调整填写选项结果输出结果输出(加标0.5概率)计量型制程能力分析总结一般的正态分布使用CapabilityAnalysis(Normal)如果是正态分布且其组内和组间差异较大时可用CapabilityAnalysis(Between/Within)当非正态分布时则可以使用CapabilityAnalysis(Nonnormal)CapabilitySixpack(Normal)复合了以下的六个图形XbarR原始数据分布（plot）直方图正态分布检定CPK,PPK练习请以前面的数据来进行相应的CapabilitySixpack(Normal)练习Select:Stat>QualityTools>CapabiltySixpack(Normal)输入各项参数选定判异准则选择标准差估计方法考虑可选择项结果输出CapabilitySixpack(Between/Within)复合了以下的六个图形IndividualMovingRangeRange直方图正态分布检定CPK,PPK同前练习及结果CapabilitySixpack(Nonnormal)复合了以下的六个图形XbarR原始数据分布直方图正态分布检定CPK,PPK结果输出二项分布制程能力分析二项分布只适合用在好，不好过，不过好，坏不可以用在0,1,2,3等二项以上的选择，此种状况必须使用泊松分布。示例数据在Data目录下的Bpcapa.mtw中Select:Stat>QualityTools>Capabilty>Analysis>Binomial填好各项的参数选好控制图的判异准则结果及输出该线与PChart中的Pbar是相同的不良的比例（希望它是随机分布）累计不良率泊松分布制程能力分析泊松分布只适合用在计数型，有二个以上的选择时例如可以用在外观检验，但非关键项部份0,1,2,3等二项以上的选择，此种状况必须使用泊松分布。示例数据在Data目录下的Bpcapa.mtw中Select:Stat>QualityTools>CapabiltyAnalysis(Poisson)填好各项的参数结果及输出基础统计描述性统计Select:Stat>BasicStatistics>Displaydescriptivestatistics假设想对两组学生的身高进行描述性统计以便比较,数据如右:填入参数输出结果输出结果(续1)输出结果(续2)Select:Stat>BasicStatistics>GraphicalSummary输出结果(续3)假设检验广告宣传的虚假性手机电池的使用寿命不是按年来计算的，而是按电池的充放电次数来计算的。镍氢电池一般可充放电200-300次，锂电池一般可充放电350-700次。某手机电池厂商宣称其一种改良产品能够充放电900次，为了验证厂商的说法，消费者协会对10件该产品进行了充放电试验。得到的次数分别为891，863，903，912，861，885，874，923，841，836。广告宣传是虚假的吗上述数据的均值为878.9，明显少于900。但是，到底均值落在什么范围内我们就认为广告宣传是虚假的呢？假设检验的原理假设检验的原理是逻辑上的反证法和统计上的小概率原理反证法：当一件事情的发生只有两种可能A和B，如果能否定B，则等同于间接的肯定了A。小概率原理：发生概率很小的随机事件在一次实验中是几乎不可能发生的。假设检验的原理(续)由于个体差异的存在，即使从同一总体中严格的随机抽样，X1、X2、X3、X4、、、，也不尽不同。它们的不同有两种（只有两种）可能：（1）分别所代表的总体均值相同，由于抽样误差造成了样本均值的差别。差别无显著性。（2）分别所代表的总体均值不同。差别有显著性。假设检验的几个步骤假设检验的一般步骤，即提出假设、确定检验统计量、计算检验统计量值、做出决策。提出假设构造统计量做出统计决策计算统计量值做出推断提出假设在决策分析过程中，人们常常需要证实自己通过样本数据对总体分布形式做出的某种推断的正确性（比如，总体的参数θ大于某个值θ0），这时就需要提出假设，假设包括零假设H0与备择假设H1。零假设的选取假设检验所使用的逻辑上的间接证明法决定了我们选取的零假设应当是与我们希望证实的推断相对立的一种逻辑判断，也就是我们希望否定的那种推断。零假设的选取(续一)同时，作为零假设的这个推断是不会轻易被推翻的，只有当样本数据提供的不利于零假设的证据足够充分，使得我们做出拒绝零假设的决策时错误的可能性非常小的时候，才能推翻零假设。零假设的选取(续二)所以，一旦零假设被拒绝，它的对立面——我们希望证实的推断就应被视为是可以接受的。构造检验统计量收集样本信息利用样本信息构造检验统计量计算检验统计量值把样本信息代入到检验统计量中，得到检验统计量的值。做出决策1、规定显著性水平α，也就是决策中所面临的风险2、决定拒绝域(criticalregion)和判别值(criticalvalue)3、判定检验统计量是否落在拒绝域内4、得出关于H0和关于H1的结论显著性水平显著性水平α是当原假设正确却被拒绝的概率通常人们取0.05或0.01这表明，当做出接受原假设的决定时，其正确的可能性(概率)为95%或99%判定法则1、如果检验统计量落入拒绝域中，则拒绝原假设2、如果检验统计量落入接受域中，则我们说不能拒绝原假设注意：判定法则2的含义是指我们在这个置信水平下没有足够的证据推翻原假设；实际上，如果我们改变置信水平或样本数量就有可能得到与先前相反的结果。零假设和备择假设可能的零假设和备择假设的情况单侧检验(one-tailedhypothesis)某种果汁的包装上标明其原汁含量至少为90%。假定我们想通过假设检验对这项说明进行检验。检验的方向性如果要检验的问题带有方向性，如灯泡寿命、电池时效、头盔防冲击性等数值是越大越好；零件废品率、生产成本等数值则是越小越好，这类问题的检验就属于单侧检验。单侧检验拒绝域和临界值单侧检验的例子例1:一家食品公司广告说他的一种谷物一袋有24千克。消费者协会想要检验一下这个说法。他们当然不可能打开每袋谷物来检查，所以只能抽取一定数量的样品。取得这个样本的均值并将其与广告标称值作比较就能做出结论。请给出该消费者协会的零假设和备择假设。单侧检验的例子(续一)解：（一）、首先找出总体参数，这里应该是总体的均值m，即谷物的平均重量，给出原假设和备择假设，即用公式表达两个相反的意义。H0:m≥24(均值至少为24)Ha:m<24(均值少于24)（二）、确定概率分布和用来做检验的检验统计量。我们要检验抽取的样本均值是否达到广告宣称的数额，就可以用样本均值离标称值的标准离差个数的多少来判断。因此构造检验统计量单侧检验的例子(续二)（三）、设定置信水平为95%。收集样本信息，假设选取了一个数目为40的样本，计算得计算检验统计量的值为（σ=0.2）（四）、查表可以得出临界值和拒绝域，也可用计算机输出p值。计算出的Z值落入拒绝域，所以拒绝H0，即意味着我们认为谷物的重量达不到厂商宣称的数值。双侧检验一些产品某一项指标必须满足在某一个范围内，如精密零件的尺寸和重量、保险丝适用的电流强度等等，这类问题的检验属于双侧检验。双侧检验图例:拒绝域和临界值两类错误假设检验是基于样本信息做出的结论，而我们知道样本只是代表了总体的一部份信息，因此必须考虑发生误差的概率。H0为真时我们拒绝H0的错误称为第I类错误，犯这种错误的概率用α来表示，简称为α错误或弃真错误；当H0为伪时我们接受H0的错误称为第II类错误，犯这种错误的概率用β来表示，简称为β错误或取伪错误。两类错误出现的场合接受零假设拒绝零假设零假设为真零假设为假正确-无偏差I类错误II类错误正确-无偏差接受H0拒绝H0，接受H1H0为真1－α（正确决策）α（弃真错误）H0为伪β（取伪错误）1－β（正确决策）两类错误发生的概率两类错误发生的概率如下表所示：两类错误的关系单样本Z检验(1-SampleZ)例:右表为测量9个工件所得到的数据.假设工件数据服从正态分布并且总体的σ=0.2,需计算总体均值是否等于5及其在95%置信度下的置信区间.Select:Stat>BasicStatistics>1-SampleZ假设检验的Minitab实现:填入参数输出结果单样本t检验(1-Samplet)Select:Stat>BasicStatistics>1-Samplet例:右表为测量9个工件所得到的数据.假设工件数据服从正态分布并且未知总体的σ,需计算总体均值是否等于5及其在95%置信度下的置信区间.填入参数输出结果双样本t检验(2-Samplet)Select:Stat>BasicStatistics>2-Samplet采用Data目录下的Furnace.mtw填入参数输出结果成对样本t检验(Pairedt)Select:Stat>BasicStatistics>Pairedt采用Data目录下的Exh_stat.mtw填入参数输出结果单样本比例检验(1Proportion)本案例采用总结数据形式,直接填入参数:Select:Stat>BasicStatistics>1Proportion输出结果:双样本比例检验(2Proportion)本案例采用总结数据形式,直接填入参数:Select:Stat>BasicStatistics>2Proportion输出结果其它注意事项选择假设检验方法要注意符合其应用条件；当不能拒绝H0时，即差异无显著性时，应考虑的因素：可能是样品数目不够；单侧检验与双侧检验的问题。正态性检验(Normalitytest)本例采用Data目录下的Scores.MTWSelect:Stat>BasicStatistics>Normalitytest填入参数注：ECDF:(ExperimentalCumulativeDistributionFunction)实验室累计分布函数基于ECDF检验的输出结果基于相关分析检验的输出结果基于相关卡方检验的输出结果报纸报导某地汽油的价格是每加仑115美分，为了验证这种说法，一位学者开车随机选择了一些加油站，得到某年一月和二月的数据如下：一月：119117115116112121115122116118109112119112117113114109109118二月：1181191151221181211201221281161201231211191171191281261181251）分别用两个月的数据验证这种说法的可靠性；2）分别给出1月和2月汽油价格的置信区间；3）给出1月和2月汽油价格差的置信区间.小组讨论与练习方差分析方差分析的引入怎样得到F统计量单因素方差分析的例子检验方差假设多因素方差分析多变量图分析小组讨论与练习本章目标1.理解方差分析的概念2.知道方差分析解决什么样的问题3.掌握单因素和多因素方差分析的原理4.会利用Minitab对实际问题进行方差分析5.能够对方差分析的结果作出解释方差分析的引入假设检验讨论了检验两个总体均值是否相等的问题，但对于多个总体的均值比较，如果仍用假设检验，就会变得非常复杂。总体方差分析的引入(续一)方差分析(ANOVA：analysisofvariance)能够解决多个均值是否相等的检验问题。方差分析是要检验各个水平的均值是否相等，采用的方法是比较各水平的方差。某汽车厂商要研究影响A品牌汽车销量的因素。该品牌汽车有四种颜色，分别是黑色、红色、黄色、银色，这四种颜色的配置、价格、款式等其他可能影响销售量的因素全部相同。从市场容量相仿的四个中等城市收集了一段时期内的销售数据，见下表。方差分析的引入(续二)A品牌汽车在四个城市的销售情况单位：辆城市黑色红色黄色银色145362319241432122338391926439421719方差分析的引入（续三）方差分析实际上是用来辨别各水平间的差别是否超出了水平内正常误差的程度观察值之间的差异包括系统性差异和随机性差异。方差分析的引入(续四)观察值期望值差距总离差组内方差组间方差水平1水平2怎样得到F统计量怎样得到F统计量水平间(也称组间)方差和水平内(也称组内)方差之比是一个统计量。实践证明这个统计量遵从一个特定的分布，数理统计上把这个分布称为F分布。即注意：组间方差(SSB)+组内方差(SSw)=总方差(SST)F=组间方差／组内方差F分布的特征从F分布的式子看出，F分布的形状由分母和分子两个变量的自由度确定，因此F分布有两个参数。F分布的曲线为偏态形式，它的尾端以横轴为渐近线趋于无穷。自由度(25,25)自由度(5,5)自由度(30,100)F分布的特征(续)从上图可以看出，随着分子分母自由度的增加，分布图逐渐趋向正态分布的钟型曲线(但它的极限分布并不是正态分布),以前接触过的t分布、χ2分布的图像也有类似的性质方差分析的前提不同组样本的方差应相等或至少很接近水平1组内方差远远超过两水平组间方差，我无法分离这两种差别！单因素方差分析例1：我们要研究一家有三个分支机构的公司各分支机构的员工素质有无显著差异，已邀请专业的人力评测单位对每一分支机构的员工进行了评测，结果以百分制的分数给出，每一机构抽取五位员工的结果如下表：员工素质人力评测观察值分支一(北京)分支二(上海)分支二(广州)17588692828565376777048569745897280样本均值81.478.271.6样本方差35.366.732.3样本标准差5.948.175.68检验方差是否一致在方差分析之前，我们可利用Minitab对数据作方差一致性检验Minitab能够读取的数据格式与上表给出的格式不同，我们必须把数据转化为Minitab能够理解的形式，具体做法是：将所有变量值输入工作表的第一列，对因素进行编码，按照一定的顺序编为1、2、3...，输入后面几列。对本例：先将素质测评的得分输入工作表列一；三个分支分别编码为1、2、3，对应于变量值填入第二列；数据Stat→ANOVA→TestforEqualVariance菜单方差一致性检验方差一致性检验(续一)方差一致性检验(续二)给出假设因素是方差分析研究的对象，在这个例子里，两个变量分别是分支机构位置和员工素质测评分数，这里分支机构的位置就是一个因素，因素中的内容就称为水平。该因素中有三个水平，即机构的不同位置。学过假设检验的知识后，我们可以给出下面的假设：若零假设为真，则可以认为只有一个抽样分布，此时三个样本均值比较接近。三个样本均值的均值与方差可用于估计该抽样分布的均值与方差。零假设为真零假设为真总体均值的最优估计是三个样本均值的算术平均数，而抽样分布的方差的估计可以由三个样本均值的方差给出，这个估计就是的组间估计又由得到零假设为假为了说明零假设为假时的情况，假定总体均值全不相同，由于三个样本分别来自不同均值的总体，则样本均值不会很接近，此时将变大，使得的组间估计变大。零假设为假(续)每个样本方差都给出的一个估计，这个估计只与每个样本内部方差有关，若样本量相同，各个样本方差的算术平均值就是组内方差的估计值。前面已经讨论过，当零假设为真时，的组间估计和组内估计应该很接近，即其比值应接近于1。而当零假设不成立时，的组间估计将偏大，从而两者的比值会大于1，因此我们构造形如检验统计量的检验统计量，在一定的置信水平下，将这个值和某个临界值作比较，就可以得出接受还是拒绝零假设的结论。深入理解F统计量F统计量实际上是用来比较组间差异与组内差异的大小，造成这种差别既有抽样的随机性，也可能包含系统因素的影响。组间差异是用各组均值减去总均值的离差的平方再乘以各组观察值的个数，最后加总组内差异则是各组内部观察值的离散程度深入理解F统计量(续)上述组间差异与组内差异必须消除自由度不同的影响对SSW，其自由度为n-g，因为对每一种水平，该水平下的自由度为观察值个数-1，共有g个水平，因此拥有自由度个数为对SSB，其自由度为g-1，g为水平的个数。检验方差假设检验步骤对于k个总体均值是否相等的检验：检验统计量为：给定显著性水平α的拒绝域：其中，g-1,n-g分别是F统计量分子分母的自由度计算结果对上例，计算得F=组间方差/组内方差=125/44.8=2.79；查F分布表得到α=0.05时临界值Fcr(2,12)=3.89F 工程师分别用新旧两种计算器对一个工程问题和统计问题进行计算，统计出计算时间数据如右:(交叉数据)填入参数在此模型中输入工程师、问题和计算器类别将工程师作为随机因数加以考虑问题类别和计算器类别间的“|”表示要评估该两个因数交互作用的影响点击“Results”对话框,输入下图所示信息:显示问题、计算机类别及二因数交互作用时的均值结果输出各因数名称、水平数及水平值方差分析表，P值均小于0.05，表明所有因数为影响计算时间的显著因数相关因数不同水平对应的均值，可以看出新型计算器计算时间比旧型的短通用线性模型(GeneralLinearModel)Select:Stat-ANOVA-GeneralLinearModel采用Data目录下的Exh-aov.MTW某农场购买了4个厂家的11种杀虫剂用来杀灭一种飞蛾,农艺师想比较不同公司生产的杀虫剂的有效性，他设计的试验方案为在33个玻璃容器中放入400只飞蛾,分别用11种杀虫剂进行杀灭,重复进行3次试验,4小时后观察容器中尚在生存的飞蛾数量,并据此进行分析判定。公司和杀虫剂之间为嵌套关系。填入参数点击此对话框用此方法成对比较均值结果输出因数、类别、各因数的水平数及各水平的数值方差分析表,从表中的P值可以看出公司及产品均为杀虫效率的重要影响因数。用“Tukey”方法对各公司产品均值差的置信区间测试结果。结果输出(续)本例中A公司与C、D公司，B公司与C、D公司，C公司与D公司的产品均值都存在显著差异全嵌套数据方差分析(FullyNestedANOVA)Select:Stat-ANOVA-FullyNestedANOVA采用Data目录下的Exh-aov.MTW填入参数结果输出平衡数据多响应变量方差分析(BalancedMANOVA)Select:Stat-ANOVA-BalancedMANOVA采用Data目录下的Exh-mvar.MTW一位工程师想研究确定胶卷成型工序的优化条件，他选用三个评价项目:撕扯阻力、表面光泽和透明度。试验因数为成型射出速度和添加剂含量。填入参数撕扯阻力、表面光泽和透明度成型射出速度和添加剂含量“|”表示交互作用点击“Results”对话框,选中下图复选框:结果输出对每个因数用4种方法进行了4种测试,“成型射出速度”的P值为0.003,表示该因数对响应变量有显著影响.SSCP矩阵类似于单因数方差分析中的平方和,可用来评价方差来源.对因数“成型射出速度”,1.740,1.301,0.4205分别相当于单相应变量方差分析中该因数对应的平方和.SSCPforError用于评价误差项评价响应变量间的相关程度,各响应变量间的相关性很若.结果输出(续1)对每个因数用4种方法进行了4种测试,“添加剂含量”的P值为0.025,表示该因数对响应变量有显著影响.“Eigen”分析用来分析各因数的不同水平对响应变量均值的影响,特征值越大,特征向量重要度越高,第二和第三个特征值为0,其特征向量无意义特征向量绝对值最大的对应于响应变量“撕扯阻力”,这表明“撕扯阻力”在两个因数中任何一个的不同水平设置下,均值变化最大.结果输出(续2)交互作用项的P值为0.302,表明其不是显著影响因数.通用多响应变量方差分析(GeneralMANOVA)Select:Stat-ANOVA-GeneralMANOVA采用Data目录下的Exh-mvar.MTW一位工程师想研究确定胶卷成型工序的优化条件，他选用三个评价项目:撕扯阻力、表面光泽和透明度。试验因数为成型射出速度和添加剂含量。填入参数点击显示附加矩阵，特征分析和单响应变量方差分析表结果输出结果输出(续)相关与回归分析相关分析与一元回归相关分析及其实现回归分析基本理论标准的一元线性回归模型一元线性回归模型的估计一元线性回归模型的检验一元线性回归模型的Minitab实现一元线性回归模型预测非线性回归简介小组讨论与练习本章目标1.了解并掌握相关分析的基本理论及应用2.了解并掌握一元回归模型的理论3.理解并掌握一元回归模型的估计方法4.掌握一元回归模型的检验方法5.了解一元回归模型的预测6.学会用Minitab建立模型并用于预测7.了解并熟悉非线性回归知识相关分析及其实现变量之间关系相关分析和回归分析是研究客观现象之间数量联系的重要统计方法，两者在有关现实经济和管理问题的定量分析中，具有广泛的应用价值。相关分析是研究事物的相互关系，测定它们联系的紧密程度，揭示其变化的具体形式和规律性的统计方法，是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。相关关系度量工具不相关符号：r>0正相关；r<0负相关测定两变量是否线性相关？相关系数的检验：统计量t遵从t(n－2)分布，将r变换成t后，可以用t检验方法检验ρ=0是否成立。案例实现例1.某建筑公司想了解位于某街区内的住宅地产的销售价格y与总评估价值x之间的相关程度到底有多大?从该街区去年售出的住宅房地产中随机抽选10所住宅的房地产作样本，分别的总评估价值和销售价格资料如下：总评估价值销售价格房地产x（美元）y（美元）123456789107976098480110655968591008611052309479813985017034115513795000116500156900111000110110100000130000170400211500185000绘制散点图,观察其相关关系输入数据，点击Graph-Scatterplot弹出如下对话框，选择变量进入对话框，点击OK绘制散点图散点图及关系表述从此散点图可以看出，总评估价值x与销售价格y之间存在线性的正相关关系，相关程度比较大，随着总评估价值的增大，销售价格也呈现增长的态势，下面我们确切的计算其两者间的相关系数。计算相关系数点击BasicStatistics—Correlation计算相关系数变量选择及结果选择因变量自变量进入对话框，点击OK结果如下表：计算得出的相关系数r及其检验p值回归分析基本理论回归分析(RegressionAnalysis)的起源及其应用思想。回归分析是寻求一个随机变量y对另一个或一组(随机或非随机)变量x1，x2…，xn的随机相依关系的一种统计分析方法。管理决策中常遇到的回归问题,如:广告支出与营业额售货员工龄与年销售额汽车使用年数与年平均修理成本轮胎等级与其装载能力应用案例及变量分类应用案例：食品连锁店关于餐馆季节性营业额与附近学生总数的回归分析应用回归模型中的变量：因变量或称响应变量y(DependentVariable或Response)自变量或称影响因素x(IndependentVarible或Predicto

                    本文档为【Minitab全面培训教程精讲】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

Minitab全面培训教程精讲

你可能还喜欢