首页 中国地质大学(武汉)石油天然气数学地质(实习指导书)

中国地质大学(武汉)石油天然气数学地质(实习指导书)

举报
开通vip

中国地质大学(武汉)石油天然气数学地质(实习指导书)中国地质大学(武汉)石油天然气数学地质(实习指导书) 石油与天然气数学地质 (实习指导书) Log Fit Polynomial Fit Linear Fit 周江羽 祝春荣 丰 勇 王 斌 中国地质大学(武汉)石油系 1 二OO四年十一月 前 言 为了配合《石油与天然气数学地质》课程的教学,使学生更好的掌握课堂上所学的知识,同时,学习掌握几个基本的数据处理软件的使用。这些软件不仅在地质学领域应用广泛,而且在经济、管理等其它领域也有广泛应用。在这个基础上,我们编写了本实习教材。 本教材安排了大约1...

中国地质大学(武汉)石油天然气数学地质(实习指导书)
中国地质大学(武汉)石油天然气数学地质(实习指导书) 石油与天然气数学地质 (实习指导书) Log Fit Polynomial Fit Linear Fit 周江羽 祝春荣 丰 勇 王 斌 中国地质大学(武汉)石油系 1 二OO四年十一月 前 言 为了配合《石油与天然气数学地质》课程的教学,使学生更好的掌握课堂上所学的知识,同时,学习掌握几个基本的数据处理软件的使用。这些软件不仅在地质学领域应用广泛,而且在经济、管理等其它领域也有广泛应用。在这个基础上,我们编写了本实习教材。 本教材安排了大约10学时的训练 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 ,共分四个单元。目的是让学生在巩固已学内容的基础上,学会使用一些数据处理软件如Surfer、Grapher、Statistics以及SPSS等进行地质数据的处理。第一单元的内容为如何使用Surfer和Grapher,目的是让学生学会使用这两个软件绘制一些基本的地质图形;在第二、三、四单元中,主要讲述了如何使用Statistics和SPSS两个数学统计软件对地质数据进行统计分析(聚类分析、回归分析和判别分析)。教材中每单元都由“目的与要求”、“操作步骤与实例”和“练习”三部分内容组成。其中,“操作步骤与实例”中详细讲解了各个软件的具体使用以及对一些基本数据的处理方法,可供学生自学,也可作为指导老师的授课内容,可根据情况而定。“练习”中安排了各部分的典型 练习题 用券下载整式乘法计算练习题幼小衔接专项练习题下载拼音练习题下载凑十法练习题下载幼升小练习题下载免费 目,由学生自己上机完成。 我们衷心的希望,通过本次的上机实习指导训练,能够使学生更加深刻的掌握所学的知识,对以上几个软件能够熟练操作使用,解决实际问题。也希望大家在使用本实习教材的过程中提出宝贵意见,以便更加完善《石油与天然气数学地质》课程的教学和实习,提高大家应用计算机解决实际问题的能力。 编者 二零零四年十月 2 目 录 第一单元 Grapher和Surfer ................................................................................ 1 第二单元 回归分析 .................................................................................................. 31 第三单元 聚类分析 .................................................................................................. 19 第四单元 判别分析 .................................................................................................. 38 3 第一单元 Grapher和Surfer 一、目的要求 熟悉地质绘图及数据处理软件Grapher和Surfer,学习使用它们进行最基本的数据处理以及基本图形的绘制。 二、操作步骤与实例 在石油地质和石油工程中,Grapher和Surfer是两个比较常用的地质绘图及数据处理软件。本单元中,主要学习使用Grapher进行线图和三角图的绘制以及学习使用Surfer进行井位图、等高线、等厚图、基本线图等的绘制。 1、用Grapher进行线图和三角图的绘制 例1—1:某油田从1978,1996年的含水率、累积产油量和累积产水量如 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 1,1,作出从1978,1996年的变化曲线图。 表1,1: 时间含水率累积产油量Np累积产水量 (年) (,) (万吨) Wp(万吨) 1978 2.4 286.46 29.72 1979 4.5 367.83 33.58 1980 6.7 459.91 40.16 1981 10.8 569.59 53.49 1982 15.1 693.1 75.38 1983 16.4 814.83 99.3 1984 19.8 961.33 135.4 1985 24.9 1134.49 192.68 1986 34.2 1314.63 286.18 1987 43.7 1486.35 419.71 4 1988 51.8 1649.54 595.21 1989 56.5 1810.66 804.73 1990 64.4 1962.16 1073.42 1991 70.5 2107.63 1425.53 1992 75.1 2237.82 1817.36 1993 80 2354.08 2256.73 1994 83.1 2453.28 2693.59 1995 84 2543.22 3164.25 1996 85.5 2623.12 3634.42 步骤: 1、打开Grapher,输入数据并保存; 2、新建一个plot文件,在graph菜单下面选择new graph中的line/symbol.。在弹出的对话 框中做如下选择(图1,1)。点击确定得到关系图(图1,2)。 3、曲线的拟合。在fits栏中(图1,3)选择所需要的拟合线,本例中选择拟合直线。然后 选择add后应用、确定。得到的拟合线如图1,2。 图1,1 5 100 拟合线 80 60 40关系曲 线 20 0 197619801984198819921996 图1,2:某油田含水率变化曲线图 图1,3:曲线的拟合 6 例1-2:已知五个矿物,其石英、长石和岩屑的含量见表1-2,作出其含量三角图。 表1-2: 石英Q 长石F 岩屑L 42 36 22 38 37 25 39 36 25 42 36 22 40 35 25 步骤: 1、打开Grapher,输入数据并保存; 2、新建一个plot文件,在graph菜单下面选择new graph中的Ternary diagramm.。在弹出的对话框中做如下选择(图1,4)。点击确定得到三角图(图1,5)。 7 图1,4: 10 0.80.2 isY Ax0.60.4 Z Axis 0.40.6 0.20.8 01 00.20.40.60.81 X Axis 图1,5:三角图 2、用Surfer绘图。 例1-3:等厚图和井位图的绘制。数据如表1-3 8 表1-3: 井号 厚度 X Y 10-10 1.2 19688112 3609781.5 10-11 1.2 19688309 3610001.5 10-12 1.2 19688591 3610091.5 10-14 2 19689193 3610275.5 10-148 1.6 19689184 3610212 10-16 1.8 19689727 3610499.9 10-198 0.6 19690609 3610640.6 10-202 0.4 19690697 3610960 10-8 1.4 19687514 3609607.2 11-138 1.2 19688808 3610336.5 11-148 1.6 19689343 3610665.2 3-138 2.6 19689621 3608327.1 3-8 1.8 19688582 3607751.4 3-8 1.8 19688582 3607751.4 4-10 0.8 19688870 3608224.9 4-6 0.8 19687787 3608183.3 5-168 1.2 19690370 3609188.4 5-608 0.8 19687608 3608014.2 6-10 0.8 19688590 3608672 6-118 0.6 19688957 3608715.3 6-12 0.8 19689102 3608769.2 6-408 1.4 19687360 3608182.3 6-6 1 19687539 3608335.6 6-708 1 19687991 3608341.7 6-718 1.2 19687737 3608519.9 6-728 1.8 19687866 3608583.3 6-8 2.2 19688176 3608518.5 9 7-118 2 19688632 3608843.6 7-128 0.6 19688888 3609124.1 7-908 1.8 19688053 3608786.8 7-918 0.6 19687992 3608883.2 8-10 1.6 19688124 3609172.2 8-16 0.8 19689943 3609926.2 8-182 1.2 19690415 3610222.2 8-20 1.4 19691011 3610421.4 8-20 1.4 19691011 3610421.4 8-6 1 19687210 3608844 8-708 0.8 19687505 3608717.8 9-108 1.2 19688317 3609593.4 9-176 0.4 19689975 3610295.6 B27 0.8 19687658 3608987 B59 1 19690224 3610727.6 F10-12 1 19688538 3610056.4 F10-16 0.8 19689700 3610450.2 F12-13 1.4 19688576 3610636.2 F12-18 0.6 19690072 3611248.9 F6-8 0.6 19688052 3608515.2 FB59 0.6 19690125 3610676.1 H10-138 1.6 19688998 3610160.8 H10-206 0.2 19690396 3610995 H10-208 0.8 19690466 3611012.2 H10-6 1.4 19687086 3609256.3 H10-708 1.8 19687220 3609554.4 H11-138 1.4 19689041 3610440.3 H11-178 0.8 19689913 3610831.1 H12-11 1.2 19688089 3610328.8 10 H4-308 0.8 19687576 3607750.6 H4-408 1.4 19687970 3607777.8 H4-508 1 19687736 3607854.6 H4-608 0.6 19687959 3607993.3 H4-808 1.2 19688484 3607980.4 H5-108 0.6 19688653 3608516.3 H5-508 0.4 19687422 3607901.3 H5-607 0.6 19687527 3608021.1 H5-708 2.2 19688144 3608286.2 H5-718 1.4 19688193 3608318.8 H6-128 0.6 19688859 3608917 H7-108 1 19688450 3609080.4 H8-108 0.8 19688314 3609317.2 H8-508 0.6 19686820 3608381.9 H8-708 1.4 19687248 3608487.3 H8-718 1 19687753 3608746 H9-178 0.8 19690155 3610451.3 H9-6 1.8 19686986 3609027.1 H9-808 0.8 19687892 3609185.2 J10-118 1.2 19688368 3609962.8 J10-907 1.2 19687883 3609601.5 J7-928 1.6 19688292 3608811.1 J9-808 1 19687765 3609315.7 T10-118 0.8 19688528 3609787.4 T10-158 0.6 19689419 3610385.5 T10-178 0.4 19689889 3610612.3 T10-808 1.4 19687556 3609395.4 T11-11 0.8 19688251 3610133.7 T11-13 1.4 19688759 3610639.5 11 T11-14 1.4 19689029 3610613.7 T11-15 0.6 19689417 3610856.9 T11-157 1.2 19689597 3610776.1 T11-17 0.6 19689642 3611071.7 T11-177 0.6 19689822 3610985.4 T11-187 0.6 19690404 3611221 T11-188 0.6 19690150 3610925.5 T11-9 1.4 19687667 3609843.2 T4-608 0.4 19687748 3608213 T6-808 0.4 19688309 3608513 T7-118 0.4 19688677 3609200.9 T7-118 1.2 19688677 3609200.9 T7-128 0.8 19689129 3609430.9 T7-138 1 19689408 3609414.5 T7-148 0.6 19689291 3609313.6 T7-928 0.8 19688318 3608819.4 T8-108 0.8 19688337 3609114.9 T8-118 0.6 19688513 3609362.2 T8-138 0.8 19688962 3609588.1 T8-148 0.2 19689451 3609824.3 T8-158 1.4 19689620 3609932.2 T8-168 0.6 19689930 3609998.8 T8-176 0 19690173 3610116.4 T8-178 0.2 19690124 3610128.3 T8-708 1.4 19687482 3608733.8 T8-808 1.4 19687714 3608976.2 T8-908 0.8 19687995 3609041.3 T9-108 0.4 19688466 3609380.5 T9-138 1.6 19688863 3609944.9 12 T9-148 1.8 19689162 3609971.1 T9-158 0.8 19689721 3610167.5 T9-188 0.8 19690354 3610500.6 T9-708 1.4 19687379 3609058.2 T9-908 1 19688116 3609442.2 Z2 1 19689664 3609362.5 ?Û 20 1 19687293 3609339.4 ?Û 21 1 19688492 3608303.3 ?Û 23 1 19689446 3610144.2 ÐÂ 6-6 1.4 19687465 3608387.7 ÐÂ 6-708 1.4 19687952 3608355.8 ÐÂ 8-108 1.6 19688047 3609149.7 ÐÂ T10-178 0.4 19689903 3610573.8 ÐÂ T8-118 0.8 19688526 3609283.4 ÐÂ ÃÚ 42 0.4 19688214 3608094.9 步骤: 1、打开Surfer,输入数据并保存。 2、将数据进行Grid。数据的选择如图1-6: 13 -6: 图1 在General中选择定义一个输出的grid文件名称图1-7。这里的文件名称为:12-3夹层厚度.grd 图1-7: 3、选择map菜单栏中的new contour map,打开grid文件:12-3夹层厚度.grd就得到了等厚图(图1-8)。 14 3611000 3610500 3610000 3609500 3609000 3608500 3608000 196870001968750019688000196885001968900019689500196900001969050019691000 图1-8:等厚图 4、选择new post map,打开数据。作如图1-9选择。 -9: 图1 在Labels中选择井号如图1-10。选择自己所需要的Symbol。 15 图1-10 -11: 所作出的井位图如图1 F12-18T11-187 T11-17H10-208H10-206T11-17710-202T11-1883611000T11-15H11-178T11-157B59FB5911-14810-198T11-13F12-13T11-14T10-178新 T10-178T9-18810-16H9-178F10-16H11-1388-208-203610500T10-15811-138H12-119-17610-148-18210-148T9-158H10-138观 23T11-11T8-178T8-17610-12F10-1210-11T8-168T9-148J10-118T9-138T8-1588-163610000T11-9T8-148T10-11810-10 10-8J10-9079-108T8-138H10-708T9-908T7-128T7-138T10-8083609500T9-108T8-118Z2观 20H8-108J9-808T7-148新 T8-118H10-6T7-118T7-1185-168H9-8088-10新 8-1087-128T8-108H7-108T9-708T8-908H9-6B27T8-808H6-12836090007-9188-67-118T7-928J7-9287-9086-12H8-718T8-7088-7086-1186-106-7286-7186-8H5-108F6-8T6-808H8-7083608500新 6-6H8-508新 6-7086-7086-63-138H5-718观 21H5-7084-10T4-6084-66-408新 泌 42H5-6075-608H4-608H4-808H5-5083608000H4-508H4-4083-83-8H4-308 196870001968750019688000196885001968900019689500196900001969050019691000 图1-11:井位图 16 5、选择map菜单下的Overlaps,可以将井位图和等厚图重叠。 6、选择map菜单下的wireframe,打开grid文件:12-3夹层厚度.grd得到网格图,即平面图。(图1,12) 图1,12:剖面地形图 7、选择map菜单下的vector map,打开grid文件:12-3夹层厚度.grd得到矢量图(图1,13)。 3611000 3610500 3610000 3609500 3609000 3608500 3608000 196870001968750019688000196885001968900019689500196900001969050019691000 图1,13:矢量图 17 8、选择map菜单下的Overlaps,将等厚图、平面图和矢量图重叠(图1,14)。 图1,14: 三、练习 1、作出例1-1中的时间和累积产水量和累积产油量之间的关系图,并进行拟合。 (注:在grapher中,可利用线图的绘制进行测井曲线的绘制。) 18 第二单元 回归分析 一、目的要求 1、通过上机实习加深理解三大多元分析方法之一的回归分析方法。 2、学习使用STATISTICA数学统计软件对数据进行聚类分析。 3、学习使用SPSS数学统计软件对数据进行聚类分析。 二、操作步骤与实例 回归分析是研究变量间相互关系的一种统计方法,通过建立一个变量和另一个变量或多个其它变量之间的数学表达式来表示它们之间的定量关系。回归分析可分为多元线性回归和逐步回归分析两种。 A(多元线性回归 运用多元线性回归方法来解决问题时,重点是确定多元回归模型,即多元线性回归方程的确立。 1、运用STATISTICA数学统计软件对数据进行多元线性回归分析 例4,1:我国长江中下游矽卡岩矿床的研究表明:铜铁矿床的指示元素组合为Cu、Ag、As、Mn、Zn等,某地质队为在工作区评价矽卡岩的含矿性,根据成矿元素组合特征预测矿床类型,随机地从一批地球化学晕取样分析结果中取得四元素的12个数据,如表。试建立Cu与 Ag、As、Mn、Zn之间的多元线性回归方程,并确定其显著性。 表4,1: Ag(X) As(X) Mn(X) Cu(Y) 123 1 6.2 5 15 6.5 2 7.0 6 20 7 3 7.5 6.5 25 7.2 19 4 7.5 5 10 7.5 5 7.8 5.5 15 7.7 6 8.0 5 8 8 7 8.5 6 21 8.4 8 8.8 3 7 8.5 9 9.0 5 12 8.8 10 9.0 2.5 6 8 11 9.2 3 7.2 8.5 12 9.5 3.5 10.1 8.7 步骤: ?将数据输入,生成数据文件并保存。 ?在Analysis中选择统计方法为Linear Regression(如图4,1)。在Variables中的选择见图4,2,其它的如图选择。 图4,1:Statistica多元线性回归分析要素选择图 20 图4,2:Statistica多元线性回归分析变量选择图 ,3: ?然后点击ok得到多元线性回归结果。如图4 ,3:Statistica多元线性回归分析结果图 图4 可根据此结果得到多元线性回归的数学模型:Cu=0.6616+1.09Ag+0.5As-0.35Mn。 2、运用SPSS数学统计软件对数据进行多元线性回归分析: 21 对例4,1进行多元线性回归分析。 步骤: ?将数据输入,生成数据文件并保存。 ?在Analyze菜单的Regression项目中选择Linear。在Dependent项目中选择Cu,在 ,4。在Statistics项目Independent(s)项目中,这里选择全部。Method选择Enter,如图4 中可选择你所需要的统计描述,在Plots项目中可选择你所需要的图表等。然后点击ok完成多元线性回归分析。 图4,4:SPSS多元线性回归分析要素选择图 ?在Coefficients一项中可见Standardized Coefficients(即 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化后的Beta值),常数项为0.662。(表4,2) 表4,2:Coefficients(a) Unstandardized Standardized Model Coefficients Coefficients t Sig. B Std. Error Beta 1 (Constant .662 .820 .807 .443 ) 22 Ag_X1 .796 .075 1.088 10.672 .000 As_X2 .274 .096 .500 2.852 .021 Mn_X3 -.041 .019 -.351 -2.227 .057 a Dependent Variable: Cu_Y 由此可得出回归模型:Cu=0.662+1.088Ag+0.5As-0.351Mn。 多元线性回归结果和Statistica统计软件一致。 ?在上机实习中,可以将其它的结果在两个软件之间进行比较。 B(逐步回归分析 在一些实际问题中,都有大量的自变量共选择。逐步回归是一种可选择变量的回归分析方法。它的基本思想是:自变量的选取是逐步进行的,每步只选一个自变量,要求这个自变量是所有选择自变量中对因变量方差贡献最大的一个,同时这个自变量对因变量的作用是显著的。这就需要比较各个供选择自变量对因变量的方差贡献,挑出其中方差贡献最大的一个自变量,并对这一自变量作F检验,若能通过,则引进,否则不予引进。这样保证引进的变量都是重要的变量,而那些不重要的变量可能不会被选进回归方程。 1、 运用STATISTICA数学统计软件对数据进行逐步回归分析 例4,2:某种水泥在凝固时放出的热量y(卡/克)与下列四种化学成分有关: X:3CaO?AlO的成分(,) 123 X:3CaO?SiO的成分(,) 22 X:4CaO?AlO?FeO的成分(,) 32323 X:2CaO?SiO的成分(,) 42 筛选变量X、X、X、X,并建立它们与变量y的线性回归方程。X、X、X、X,y的12341234观测值见下表。 23 表4,3: 编 1 2 3 4 5 6 7 8 9 10 11 12 13 号 X 7 1 11 11 7 11 3 1 2 21 1 11 10 1 X 26 29 56 31 52 55 71 31 54 47 40 66 68 2 X 6 15 8 8 6 9 17 22 18 4 23 9 8 3 X 60 52 20 47 33 22 6 44 22 26 34 12 12 4 y 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4 步骤: ?同多元线性回归分析,输入数据并保存后,选取变量,进入多元线性回归分析结果界面。 ?点击Cancel,出现如下图的窗口。 图4,5:Statistica逐步线性回归分析要素选择图 ?在Method项目中,可以选择Forward stepwise或者Backward stepwise。不同的方法所得出的结果是不一样的(可根据实际情况的需要进行选择)。在Number of steps项中,可根据需要选择逐步回归分析的总步骤。Displaying results指如何显示结果,有两个选项,Summary only是指仅显示结果;At each step指显示每一步的分析。其余的选项选择如图4,5。选择好后点击ok进行逐步回归分析。 24 ?在弹出的窗口中点击next查看下一步分析结果。 ?第一步分析结果(图4,6): 图4,6:Statistica逐步线性回归分析结果图(a) 剔除3个变量,F值为22.7985,复相关系数为0.8213,X的β值为-0.82,常数为117.57。4α值为0.01。由此得出回归方程为:Y,117.57,0.82 X。分析结果显示该方程是显著的。 4?第二步分析结果为图4,7: 25 图4,7:Statistica逐步线性回归分析结果图(b) 剔除2个变量,F值为176.627,复相关系数为0.9862,X的β值为-0.68,X的β值为0.563,41常数为103.0974。α值为0.01。由此得出回归方程为:Y,103.0974,0.563 X,0.68 X。14分析结果显示该方程是显著的。 ?注:在选择哪一步建立回归方程时,要选择F值最大的一步,即关系最显著的一组变量建立回归方程。第二步的F值大于第一步。第三步的分析结果剔除一个变量,F值小于第二步。所以选择第二步所选取的变量和分析系数建立回归方程。 2、运用SPSS数学统计软件对数据进行逐步回归分析 ?输入数据并保存。 ?在Analyze菜单的Regression项目中选择Linear。在Dependent项目中选择Y,在Independent(s)项目中,这里选择全部。Method选择一个逐步回归的方法,stepwise默认为forward。如图4-8,在Statistics项目中可选择你所需要的统计描述,在Plots项目中可选择你所需要的图表等。然后点击ok完成逐步回归分析。 26 ,8:SPSS逐步线性回归分析要素选择图 图4 ?在分析结果中,查看回归效果的方差分析: 表:4,4 ANOVA(c) Model Sum of Squares Df Mean Square (模 F Sig. 型) (变差来源) (平方和) (自由度) (平方均值) 1 Regression 1831.896 1 1831.896 22.799 .001(a) Residual 883.867 11 80.352 Total 2715.763 12 2 Regression 2641.001 2 1320.500 176.627 .000(b) Residual 74.762 10 7.476 Total 2715.763 12 模型2的F值为176.627,大于模型1的F值,所以,选择模型2的变量和系数建立回归方程。 表4,5: Coefficients(a) Unstandardized Standardized Model Coefficients Coefficients 95% Confidence Interval for B B Std. Error Beta Lower Bound Upper Bound 27 1 (Constant 117.568 5.262 105.986 129.150 ) X4 -.738 .155 -.821 -1.078 -.398 2 (Constant 2.124 98.365 107.830 103.097 ) X4 -.614 .049 -.722 -.506 -.683 X1 1.440 .138 1.132 1.748 .563 a Dependent Variable: Y 由此得出回归方程为:Y,103.097,0.563 X,0.683 X。 14 (注:这里的系数采用的是标准化后的数据。) 在实际上机实习中,建议用其它的逐步回归分析方法来建立回归方程,以便增加对两种数学统计软件的熟练使用以及对逐步回归分析方法的更深理解。 三、练习 1、某矿床以Cu为主,伴生多种金属元素,其中Zn与Ag可以综合利用,为了预测Ag的含量,在一个矿段采了十一个样品,其金属元素的含量(取对数)如小表,试分别用Statisica 和Spss数学统计软件建立Ag与Cu、Zn之间的线性回归关系式。 表4,6: Cu Zn Ag 元素 XX Y 样号 1 2 1 3.9590 2.7782 1.1761 2 4.0492 2.7782 1.6021 3 4.1614 2.7782 1.4771 4 4.7966 3.3802 2.1761 5 3.9685 2.7782 0.6960 6 4.5132 3.2553 1.7782 7 4.1987 2.9542 1.6021 28 8 4.5539 2.1761 2.1139 9 3.7160 2.4771 0.6990 10 4.0569 2.7782 1.0000 11 3.6128 2.3010 1.0000 2、河南桐柏银金矿土壤中的Pb、Zn、Ag、As的含量(ppm)为: 表4,7: PB ZN AG AS 样号 1 2.3000 2.7000 1.4800 1.7000 2 1.4800 2.3000 0.8500 0.7000 3 1.7000 2.0000 1.0000 1.1000 4 1.0000 1.8400 0.7000 0.4000 5 1.3000 2.0000 0.7000 0.8800 6 1.0000 1.8400 0.7000 0.6000 7 1.4800 2.0000 1.0000 0.8800 8 1.0000 2.0000 0.7000 0.4000 9 1.3000 2.0000 0.7000 0.9500 10 1.0000 2.0000 1.0000 1.1000 11 2.3000 0.4800 1.7000 1.7000 12 1.0000 2.0000 1.0000 1.7000 13 1.3000 2.0000 0.7000 0.7000 14 2.0000 2.7000 1.0000 1.7000 15 1.0000 1.8400 0.7000 1.3000 16 1.0000 2.0000 1.0000 1.0000 17 1.3000 2.0000 0.7000 0.7000 18 1.3000 2.0000 1.0000 1.2400 19 1.3000 1.8400 1.4800 1.7000 20 1.3000 2.0000 2.0000 0.7000 21 1.3000 2.0000 2.0000 0.8800 29 22 2.0000 2.3000 2.3000 1.3000 23 1.0000 1.8400 1.8400 0.4000 24 1.3000 2.0000 2.0000 1.7000 25 1.7000 2.0000 2.0000 1.7000 26 2.0000 2.3000 2.3000 1.7000 27 1.3000 1.8400 1.8400 0.8800 试分别用Statisica和Spss数学统计软件,运用逐步回归方法建立Ag与其他变量之间的回归 方程。 30 第三单元 聚类分析 一、目的要求 1、通过上机实习加深理解三大多元分析方法之一的聚类分析方法。 2、学习使用STATISTICA数学统计软件对数据进行聚类分析。 3、学习使用SPSS数学统计软件对数据进行聚类分析。 二、操作步骤与实例 在聚类分析方法中,系统聚类法是应用比较频繁的一种方法。其基本思想是:先将要归类的n个样品(或者变量)各自看成一类,共n类;然后按照预先规定好的方法(如相互距离或相似系数等)计算,将关系最密切的两类并为一类,其余不变,即得n-1类;再用上述方法将新类和关系最密切的类并成一类,???如此进行,每次重复都会减少一类,直至最后所有样品(或者变量)归为一类为止。上述归类过程可用一张谱系图来形象的表示出来。 1、运用STATISTICA数学统计软件对数据进行系统聚类分析: 例3,1:某学校地质系在某次二年级《地质填图》教学实习过程中,师生测得4条断层的几何要素如表,用聚类方法研究其异同程度和内在联系。(其中ABCD代表断层号) 表3,1: 变量 倾向 倾角 破碎带宽 水平断距 断层号 A 100 50 10 200 B 110 60 8 168 C 10 15 5 56 D 20 10 10 40 步骤: ?首先,将数据输入,生成数据文件并保存。(如图3,1) 31 图3,1:Statistica聚类分析数据文件图 ?对数据进行变换。这里采用对数据进行标准化处理。(注:一般情况下,由于每个样品各个变量的测试值具有不同的数量级和不同的测量单位,所以有必要进行变换,或者说是调整,以消除其中的不合理现象,提高分类结果的准确性。常用的数据变换方法主要有标准化法、正规化法、极差标准化法、极大值正规化法、均值正规化法、中心化法等。) 具体步骤如下:在Analysis菜单下选择Other Statistics,在弹出的窗口中选择Data Management,选择Switch To。在Data Management中选择Standardize Variables,即对数据进行标准化了,将标准化的数据另存。 ?将标准化后的数据打开,在Other Statistics中选择Cluster Analysis(聚类分析),在Clustering Method里选择第一个Joining(Tree Clustering),即形成谱系图。在弹出的窗口中选择所需要的变量(这里全部选中),Input选择Raw Data,Cluster选择Cases(Rows)(行)。其它选项如图3,2。然后点击ok完成聚类分析。 图3,2:Statistica聚类分析要素选择图 ?查看分析结果(图3,3)。在Horizontal hierarchical tree plot中,可以看到本次聚类分析的谱系图(图3,4)。 32 图3,3:Statistica聚类分析结果显示图 图3,4:Statistica聚类分析谱系图 A和B被分为一类,C和D被分为一类。两类断层之间走向和倾角都存在较大差别,认为是不同性质的两组断裂构造。 2、运用SPSS数学统计软件对数据进行聚类分析: 33 对例3,1进行聚类分析。 步骤: 5)。 ?首先,将数据输入,生成数据文件并保存(如图3, 图3,5:SPSS数据文件图 ?在Analyze菜单的classify项目中选择Hierarchical Clustering。在弹出的窗口中(如图3,6),选择所需要的变量,这里全部选中。Cluster中选择Cases(即对行进行聚类),Display一栏全部选择。其它的选择如图。(可在Statistica和Plots中选择所需要显示的统计分析数据结果和图表) 图3,6:SPSS聚类分析要素选择图(a) 34 ?在Method窗口中的选择(如图3,7),Interval选用Squared Euclidean distance。注意在Transform Values中选择对变量数据处理的方法,这里采用标准化方法。然后点击continue、ok后完成聚类分析。 图3,7:SPSS聚类分析要素选择图(b) ?查看本次聚类分析结果。在dendrogram中可以看到谱系图。分析结果和statistica软件得到的结果一致。 1(A)和2(B)被分为一类,3(C)和4(D)被分为一类。两类断层之间走向和倾角都存在较大差别,认为是不同性质的两组断裂构造。 三、练习 35 题目:对南堡凹陷高尚堡地区16样品序号 井号 层位 取样深度(m) 口井17个样品的高压物性数据进1 高16 ES3 3769.5 行Q型聚类分析(即系统聚类分2 高36 Nm12,11 1815.3 析法),选择9个测试项目作为地3 庙3 Ed1 2290.7 质变量。这9个变量是:地层压力4 柳1 Es3-3 3578.45 系数(x1),饱和压力(x2),地层5 高43-1 Ed2 3043.5 压力梯度(x3),原始油气比(x4), 6 高50 Es1下 3041.9 原油密度(x5),原油粘度(x6), 7 高57 Es1上 2466.3 体积系数(x7),压缩系数(x8), 8 高31 ES3-3 3289.7 )。17个样品的井号溶解系数(x9 9 高13 ES3 3480 层位及取样深度。 10 高36 ES1下 2641 (要求:分别用Statisicas数学统 11 高17 ES3 3651.4 计软件和Spss数学统计软件进行 12 高12 ES3-5 3229.7 聚类分析) 13 高10 ES3-5 3278.5 14 高9 ES1下 2934 15 高5 ES3-3 3138 16 高2 ES3-3 3201.8 17 高12 ES3-3 3585.7 17个样品的9个变量的原始数据 X1 X2 X3 X4 X5 X6 X7 X8 X9 0.873 118 0.318 75 0.733 1.4 1.27 9.32 0.542 1 142 0.336 58 0.818 2.97 1.153 9 0.366 0.908 68 0.371 25 0.823 3.73 1.111 8.28 0.367 0.987 55 0.349 35 0.785 2.98 1.16 93.2 0.545 0.902 126 0.329 64 0.745 1.45 1.159 10.92 0.429 1.071 194 0.325 172 0.653 0.7 1.145 14.89 0.722 0.76 159 0.316 107 0.71 1 1.262 11.96 0.553 36 1.23 62 0.343 38 0.78 2.67 1.157 8.5 0.532 1.038 258 0.373 300 0.576 0.33 1.877 24.35 0.881 1.811 99 0.31 66 0.745 1.39 1.277 9.59 0.566 1.005 105 0.279 73 0.74 1.76 1.241 10.54 0.6 0.918 145 0.375 104 0.697 1.25 1.327 15.71 0.593 1.08 137 0.351 97 0.716 0.94 1.271 11.1 0.584 1.196 173 0.344 133 0.684 1.1 1.373 11.67 0.636 1.006 48 0.323 33 0.778 2.31 1.15 8.6 0.583 1.218 74 0.35 42 0.784 5.24 1.163 12.89 0.5 1.434 205 0.307 153 0.683 2.26 1.445 14.13 0.639 37 第四单元 判别分析 一、目的要求 1、通过上机实习加深理解三大多元分析方法之一的判别分析方法。 2、学习使用STATISTICA数学统计软件对数据进行判别分析。 3、学习使用SPSS数学统计软件对数据进行判别分析。 二、操作步骤与实例 判别分析是判别已知样品所属类型的一种统计方法。与聚类分析不同的是,判别分析的前提是判别的几种类型都是已知的,且每一类型都有已知样品。判别分析的主要思想就是用统计方法将待判的未知样品与已知类型样品进行对比,以确定样品应归属于哪一类。 一般方法是:设有K个总体,希望建立一个准则,对于任意一个样本X依据这个准则就能判断它是属于哪个总体。前提是:要求这个准则在某种意义下是最优的。 本次实习主要学习运用数学统计软件对数据进行多个总体的Fisher判别方法进行逐步判别。 1、 运用STATISTICA数学统计软件对数据进行逐步判别分析 例5,1:取江汉油田某地区13个油层、11个水层和7个油水层的测井资料以建立该地区油、水、油水层三组的判别 函数 excel方差函数excelsd函数已知函数     2 f x m x mx m      2 1 4 2拉格朗日函数pdf函数公式下载 。取自然伽玛、声波时差、深感应电阻率及冲洗带电阻率为原始指标,同时考虑到油水层的侵入特征,将原始指标换算为岩性系数(用x表示)、孔隙度(用1 x表示)、侵入系数(用x表示)及含油气饱和度(用x表示)等四个新指标,表中列出了234 各样品指标。 表5,1: 层位 编号 X1 X2 X3 X4 1 0.276 0.18 0.446 0.683 油层 2 0.378 0.2 0.746 0.673 3 0.325 0.2 0.8 0.633 38 4 0.138 0.21 0.75 0.728 5 0.29 0.241 0.87 0.649 6 0.27 0.19 1.73 0.613 7 0.45 0.23 2.66 0.544 8 0.302 0.23 1.78 0.59 9 0.344 0.24 3.4 0.618 10 0.358 0.21 1.37 0.619 11 0.076 0.26 0.85 0.733 12 0.346 0.27 1.32 0.621 13 0.186 0.3 0.56 0.796 14 0.62 0.24 6.22 0.544 15 0.61 0.25 1.42 0.494 16 0.62 0.27 1.46 0.51 17 0.56 0.13 1.3 0.372 18 0.432 0.215 0.9 0.214 水层 19 0.47 0.2 2.9 0.22 20 0.56 0.2 3 0.221 21 0.29 0.25 4.66 0.395 22 0.302 0.22 3.18 0.25 23 0.347 0.19 17.9 0.23 24 0.269 0.25 8.7 0.145 25 0.36 0.19 3.8 0.56 26 0.42 0.14 0.84 0.54 27 0.357 0.29 4.2 0.5 油水层 28 0.35 0.17 3.18 0.61 29 0.324 0.3 5.2 0.615 30 0.52 0.27 3 0.58 31 0.608 0.18 1.2 0.59 39 步骤: ?输入数据并保存。(注意:数据的输入保存方式如图,在第五Vars中的1代表油层、2代表水层、3代表油水层。)(图5,1) 图5,1:Statistica逐步判别分析数据文件图 ?选择进入Discriminant Analysis(判别分析),打开数据。变量的选择如图5,2,在Codes for grouping variable项目中,选择All,即3组(图5,3)。 图5,2:Statistica逐步判别分析要素选择图(a) 40 图5,3:Statistica逐步判别分析要素选择图(b) ?点击ok进入Model Definition。在Method项目中选择所需的判别方法,本例中选择Forward stepwise;Display of results一项中,可根据需要选择,Summary only表示只显示结果,At each step表示显示逐步分析的每一步。(图5,3) 图5,3:Statistica逐步判别分析要素选择图(c) ?在逐步判别分析中,每一步引入一个变量,并检验其判别能力是否具有显著的判别力,从而决定是否把该变量引入到判别函数中来。分析结果如图5,4。 41 图5,4:Statistica逐步判别分析结果图 ?点击classification functions 查看判别方程的系数。(图5,5) 图5,5:Statistica逐步判别分析结果方程系数显示图 由此建立判别方程为: a、F(X),8.9722x,67.0168x,24.0686 114 b、F(X),28.3696x,27.3555x,12.057 214 c、F(X),20.5085x,55.2361x,21.5554 314 ?将需要判别样品的观测指标带入三个方程分别计算函数值,函数值最大的即为该样品的所 42 属类型。 2、 运用SPSS数学统计软件对数据进行逐步判别分析 步骤: ?将数据输入并保存,输入和保存方式同STATISTICA。 ?在Analyze菜单的classify项目中选择Discriminant Analysis。在弹出的窗口中(如图),Grouping Variable一项中选择Z,将X,X全部选入Independents。选择Use stepwise method。 14 图5,6:SPSS逐步判别分析要素选择图(a) ?在Define Range中定义分组变量的最大值和最小值,这里分了三组。(图5,7) 图5,7:SPSS逐步判别分析要素选择图(b) ?分别在Statistic、Classification中选择所需要显示的统计分析数据;在Method中选择所需要的逐步判别方法,这里选择Wilk’s Lambda。点击Continue后ok,完成逐步判别分析。 ?查看结果。 43 表5,2:Classification Function Coefficients Z 1.0000 2.0000 3.0000 X1 8.972 28.370 20.509 X4 67.017 27.356 55.236 (Constant) -24.298 -12.120 -21.166 Fisher's linear discriminant functions 由此可建立判别方程如下: a、F(X),8.972x,67.017x,24.298 114 b、F(X),28.370x,27.356x,12.120 214 c、F(X),20.509x,55.236x,21.166 314 ?将需要判别样品的观测指标带入三个方程分别计算函数值,函数值最大的即为该样品的所属类型。 三、练习 1、 已知三类盐泉水的七项水化学分析资料如下表,要求对已测试的七个变量:硬化度(g/l)、 3333Br10/Cl、K10/?盐、K10/ Cl、Na/K、Mg10/Cl、εNa/εCl进行逐步筛选,选出“判 别能力”最强的若干变量,并判别下表中的样品属于哪个盐泉。 表5,3: 44 总体 已知含钾盐泉(G) 1 样品编号 1 2 3 4 5 6 7 8 9 10 11 12 硬化度 11.853 45.596 3.525 3.681 48.287 254.643 17.956 7.37 310.748 314.152 183.01 6.742 (g/l) Br10-盐 0.48 0.526 0.086 0.37 0.386 0.43 0.28 0.506 0.493 0.195 0.296 0.19 3/Cl 泉 3K10/水 14.36 13.85 24.4 13.57 14.5 14.5 9.75 13.6 10.94 24.65 8.75 5.93 ?盐 化 3学 K10/ 25.21 24.04 49.3 25.12 25.9 24.7 17.05 34.21 18.31 24.50 14.92 12.01 分Cl 析Na/K 25.21 26.01 11.30 26.00 23.32 25.41 37.20 10.69 33.68 24.72 42.25 57.95 数Mg10- 0.81 0.91 6.82 0.82 2.18 0.41 0.464 8.8 0.667 0.672 0.274 0.99 3值 /Cl εNa/ 0.98 0.96 0.85 1.01 0.93 0.96 0.98 0.56 0.94 0.93 0.97 1.07 εCl 表5,4: 总体 已知钾矿化盐泉(G) 2 样品编号 1 2 3 4 5 6 7 8 9 10 11 12 硬化度盐 4.741 4.223 6.442 16.234 10.585 39.416 37.228 23.535 5.398 92.589 145.228 43.865 (g/l) 泉 Br10-水 0.14 0.34 0.19 0.39 0.42 0.32 0.26 0.23 0.12 0.26 0.30 0.20 3/Cl 化 3学 K10/ 6.9 3.8 4.7 3.4 2.4 2.8 3.0 2.6 2.8 2.7 2.7 2.3 分?盐 3析K10/ 15.7 7.1 9.1 5.4 4.7 5.1 5.6 4.6 6.2 4.8 4.7 4.0 数Cl 值 Na/K 39.2 88.2 23.2 121.5 135.6 129.3 115.6 141.8 111.2 135.6 135.4 161.6 45 Mg10- 3.24 1.11 0.74 0.42 0.87 0.45 0.90 0.31 1.14 0.26 0.24 0.27 3/Cl εNa/ 0.95 0.97 1.08 1.00 0.98 1.01 1.00 1.02 1.07 1.00 0.99 1.01 εCl 表5,5: 总体 已知盐岩盐泉(G) 3 样品编号 1 2 3 4 5 6 7 8 9 10 11 12 硬化度 48.621 288.149 316.604 307.31 82.17 322.515 31.409 78.938 106.281 256.58 304.092 240.446 (g/l) Br10-盐 0.082 0.148 0.317 0.173 0.105 0.312 0.145 0.033 0.053 0.297 0.283 0.042 3/Cl 泉 3K10/水 2.057 1.763 1.453 1.627 1.217 1.382 0.589 0.97 0.941 0.899 0.789 0.741 ?盐 化 3学 K10/ 3.847 2.968 2.432 2.729 2.188 2.320 1.567 1.687 1.658 1.476 1.357 1.266 分Cl 析Na/K 170.15 215.86 263.41 235.70 297.79 282.21 407.34 382.50 391.05 410.30 483.36 5.0077 数Mg10- 0.940 0.140 0.749 0.214 0.33 0.024 0.726 0.244 0.270 0.239 0.193 0.29 3值 /Cl εNa/ 1.00 0.98 0.98 0.99 1.00 1.00 0.98 0.99 1.00 0.93 1.01 0.99 εCl 表5,6: 总体 待判 46 样品编号 1 2 3 4 5 6 7 8 9 10 11 12 硬化度 3.777 14.829 9.532 (g/l) Br10-盐 0.87 0.55 0.45 3/Cl 泉 3K10/水 15.4 19.3 17.0 ?盐 化 3学 K10/ 28.2 33.7 28.2 分Cl 析Na/K 7.6 18.0 13.7 数Mg10- 0.40 0.93 0.04 3值 /Cl εNa/ 0.77 0.96 0.60 εCl 47
本文档为【中国地质大学(武汉)石油天然气数学地质(实习指导书)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_601191
暂无简介~
格式:doc
大小:803KB
软件:Word
页数:43
分类:
上传时间:2018-01-18
浏览量:34