肾炎的诊断
组号 38
组员 赵龙
付成志
林光明
肾炎的诊断
摘要本文针对医院诊断肾炎病人的过程中,如何利用有效的判别准则对就诊人员进行诊断的问题,建立了统计回归模型,最终得到了判别准则。
通过对确诊病例11~50号数据运用Logistic回归思想进行回归分析,得到回归系数,建立了Logistic回归模型Ⅰ,进而得出了诊断肾炎的判别准则。随后,为了简化模型,我们又通过模型Ⅰ残差分析,并利用Matlab软件进行求解,得到了剔除Cu,Mg,Na三种元素后的模型Ⅱ。
对问题一,我们利用病例11~50号的数据得到判别准则,并对1~10与51~60号病例进行Logistic回归诊断检验,得出仅一个病例结果有误,准确率达到95%。
对问题二,通过问题一所得出的判别准则对表B.2的病例数据进行判别,诊断结果是:15名是健康者,15名是患者。
对问题三,从模型Ⅰ的残差分析判断出Xi之间存在线性关系,进而再次借助Matlab软件分析得出Xi之间的相关性(如表2),比较分析找到并剔除相关系数较大的三种元素即X2,X5,X7(Cu,Mg,Na),建立了Logistic回归模型Ⅱ。重复问题一中的操作,准确率仍然为95%。
对问题四,以Logistic回归模型Ⅱ为判别准则对B.2的病例数据进行判别,诊断出13名健康者,17名患者。
对问题五,我们将问题二与问题四所得到的结果进行比较和简要的分析,并对模型Ⅰ与模型Ⅱ做了简单的比较,就模型中存在的问题提出了改进
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
。
关键词:Logistic 回归检验 判别准则
1问题重述
人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1(见附录)是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。表B.2(见附录)是就诊人员的化验结果。
我们所需要解决的的问题是:
1) 根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
2) 按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
3) 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
4) 根据3的结果,重复2的工作。
5) 对2和4的结果作进一步的分析。
2问题分析
本文首先给出30组的健康者和30组的患者肾炎确诊病例的化验结果,需要根据这60组的中Zn,Cu,Fe,Ca,Mg,K,Na七个元素的含量的分析确定一种有效的判别准则,并根据该判别准则来诊断B.2中的病例。
对问题一,运用Logistic回归思想,对病例11~50号进行回归分析,得到回归系数建立Logistic回归模型Ⅰ,将1~10与51~60号病例数据进行Logistic回归诊断检验,进而验证其准确度。
对问题二,通过问题一所建的Logistic回归模型Ⅰ对B.2的病例数据进行判别,得到B.2的病例结果。
对问题三,从模型Ⅰ的残差图中分析得出Xi之间存在线性关系,对其进行编程分析得出表二的线性相关系数,比较分析找到最大的,将其剔除即X2,X5,X7(Cu,Mg,Na),同模型Ⅰ建立Logistic回归模型Ⅱ,将1~10与51~60号病例数据进行Logistic回归诊断检验,进而验证其准确度。
对问题四,通过问题一所建的Logistic回归模型Ⅱ对B.2的病例数据进行判别,得到B.2的病例结果。
对问题五,将问题二与问题四所得到的结果进行比较,进行简要的分析。
3模型假设
1)假设诊断结果只与已知七个元素有关,不考虑其他元素的影响;
2)不考虑其他病情对化验结果元素含量的影响;
3)化验结果数据准确,不考虑误差等因素;
4)诊断结果只有两种:患者与健康者,不存在第三种可能。
4符号说明
X
:Zn的含量;
X
:Cu的含量;
X
:Fe的含量;
X
: Ca的含量
X
:Mg的含量;
X
:K的含量;
X
:Na的含量;
B
: X
Logistic回归系数,i=0,1,2,3,4,5,6,7;
Y :化验的结果,
;
5模型建立与求解
5.1模型建立前的准备
Logistic回归的基本思想是,不是直接对
进行回归,而是先定义一种概率函数
,令
。此时,如果直接对
进行回归,得到的回归方程可能不满足这个条件。在现实生活中,一般有
。直接求
的表达式,是比较困难的一件事,于是,人们改为考虑
一般的,
。人们经过研究发现,令
即,
是一个Logistic型的函数,效果比较理想。于是,我们将其变形得到:
然后,对
进行通常的线性回归。
5.2.1模型Ⅰ建立与求解
根据B.1的诊断病例的化验结果找出规律以确定模型方法,即有以下两种判别方法:
方法一: Logistic回归
我们讨论
,概率
。设
=诊断是健康者的概率。因为40个数据有20个为0,20个为1,所以,取分界值0.5,令
由于我们并不知道诊断后是健康者的概率
的具体值,也不可能通过,X1,X2,X3,X4,X5,X6,X7的数据把这个具体的概率值算出来,于是,为了方便做回归运算,我们取区间的中值,
。取11~50号数据表变为:
表1
π
X1
X2
X3
X4
X5
X6
X7
0.25
132
15.9
17.7
578
92.4
1314
1372
0.25
182
11.3
11.3
767
111
264
672
0.25
186
9.26
37.1
958
233
73
347
0.25
162
8.23
27.1
625
108
62.4
465
0.25
150
6.63
21
627
140
179
639
0.25
159
10.7
11.7
612
190
98.5
390
0.25
117
16.1
7.04
988
95.5
136
572
0.25
181
10.1
4.04
1437
184
101
542
0.25
146
20.7
23.8
1232
128
150
1092
0.25
42.3
10.3
9.7
629
93.7
439
888
0.25
28.2
12.4
53.1
370
44.1
454
852
0.25
154
13.8
53.3
621
105
160
723
0.25
179
12.2
17.9
1139
150
45.2
218
0.25
13.5
3.36
16.8
135
32.6
51.6
182
0.25
175
5.84
24.9
807
123
55.6
126
0.25
113
15.8
47.3
626
53.6
168
627
0.25
50.5
11.6
6.3
608
58.9
58.9
139
0.25
78.6
14.6
9.7
421
70.8
133
464
0.25
90
3.27
8.17
622
52.3
770
852
0.25
178
28.8
32.4
992
112
70.2
169
0.75
169
8
308
1068
99.1
53
289
0.75
247
17.3
8.65
2554
241
77.9
373
0.75
166
8.1
62.8
1233
252
134
649
0.75
209
6.43
86.9
2157
288
74
219
0.75
182
6.49
61.7
3870
432
143
367
0.75
235
15.6
23.4
1806
166
68.8
188
0.75
173
19.1
17
2497
295
65.8
287
0.75
151
19.7
64.2
2031
403
182
874
0.75
191
65.4
35
5361
392
137
688
0.75
223
24.4
86
3603
353
97.7
479
0.75
221
20.1
155
3172
368
150
739
0.75
217
25
28.2
2343
373
110
494
0.75
164
22.2
35.5
2212
281
153
549
0.75
173
8.99
36
1624
216
103
257
0.75
202
18.6
17.7
3785
225
31
67.3
0.75
182
17.3
24.8
3073
246
50.7
109
0.75
211
24
17
3836
428
73.5
351
0.75
246
21.5
93.2
2112
354
71.7
195
0.75
164
16.1
38
2135
152
64.3
240
0.75
179
21
35
1560
226
47.9
330
于是,在Matlab软件包中编程见附录,对
进行通常的线性回归:(具体结果如附录)
回归系数B=
1.0175
-0.0024
0.0332
-0.0036
-0.0006
-0.0017
- 0.0001
0.0006
stats =
0.6417 8.1860 0.0000 0.5406
即,得到:
值=0.6417(说明回归方程刻画原问题不是太好),F_检验值=8.1860>0.0000(这个值比较好),与显著性概率
相关的p值=0.5406>
,说明变量之间存在线性相关关系。回归方程为:
Logistic回归的诊断
将剩余的1~10号与51~60号通过以下公式进行检验
通过MATLAB编程(见附录)进行诊断的如下结果: 图1
从上图中可看出,只有一个数据不同,出错率为5%,即正确率为95%
5.3问题二的结果判别
通过
的公式进行判别结果如下:图2
从以上结果图可得出(0代表患者,1代表正常):表2
病历号
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
结果
0
0
1
0
0
0
1
0
0
1
0
0
0
1
0
病历号
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
结果
0
1
1
0
1
1
1
0
1
0
1
1
1
1
1
从上表总15名健康者,15名患者。
5.4问题三模型Ⅱ建立于求解
通过模型Ⅰ中得到的残插图并进行分析如下
模型Ⅰ以及残差图:
通过残差图看出,残差连续的出现在0的上方,或者连续地出现在0的下方,这也暗示变量X
,X
,X
,X
,X
,X
,X
之间存在线性相关。编程(见附录)计算它们的相关系数:
表3
X
X
X
X
X
X
X
X
0.1168
0.1375
0.4458
0.334
-0.3347
-0.2948
X
0.5769
0.7695
0.8247
0.0119
0.2275
X
0.4642
0.5762
-0.0645
0.0656
X
0.8705
-0.1704
-0.0205
X
-0.1153
0.124
X
0.7291
X
通过上表可分析出并可判断出X2,X5,X7线性相关性最高,通过逐步的剔处最高相关系数,逐步进行LOGISTIC回归,可得到最后的而结果:
B=
1.4365
-0.0057
-0.0017
-0.0004
0.0007
stats =
0.5188 9.4340 0.0000 0.6637
模型Ⅱ以及残差图
残差图仍然显示变量之间的相关性,这说明,最开始调查数据时,7个指标没有选好。最后得到:
Logistic回归的诊断将剩余的1~10号与51~60号通过以下公式进行检验
用
进行检验诊断结果:
图4
从上图中可看出,只有一个数据不同,出错率为5%,即正确率为95%
5.5问题四
通过
公式编程(程序见附录)的进行诊断结果如下:图5
从以上结果图科得出表B.2的诊断结果如下(0代表患者,1代表正常):
表4
病例号
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
结果
0
0
0
0
0
0
0
0
0
1
0
0
0
1
1
病例号
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
结果
0
1
1
0
1
1
1
0
0
0
1
1
1
1
1
上表总共13名健康者,17名患者。
5.6问题五
利用判别准则,首先我们得到剔除元素前,以Zn,Cu,Fe,Ca,Mg,K,Na七个元素作为诊断指标,最终得出表B.2中就诊人员的诊断结果:15名健康者,15名患者;然后通过分析剔除奇异元素Cu,Mg,Na,以Zn,Fe,Ca,K四个元素作为诊断指标,从而得出13名健康者,17名患者。通过分析表2与表4,不难发现两次判别仅63、67、84、85号病例的结果不同。如下表(表5)为剔除奇异元素前后诊断结果对比
表5
病例号
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
剔除前
0
0
1
0
0
0
1
0
0
1
0
0
0
1
0
剔除后
0
0
0
0
0
0
0
0
0
1
0
0
0
1
1
病例号
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
剔除前
0
1
1
0
1
1
1
0
1
0
1
1
1
1
1
剔除后
0
1
1
0
1
1
1
0
0
0
1
1
1
1
1
表6 诊断情况统计
健康
患病
偏差人数
吻合度
剔除前
15
15
4
86.67%
剔除后
13
17
由表6得出:
前后两次对就诊的30人进行诊断结果中有5人存在偏差,吻合度达到86.67%。因此,在诊断病人信息不全,单一,且数据量小的情况下,该判别准则仍有比较高的吻合度,即诊断肾炎可信度较强。
相比之下,模型Ⅱ中只检验四种元素,准确率与模型Ⅰ相同,因此,为了得到较为简洁同时仍保持高效的数学模型,模型Ⅱ应为首选的判别准则。
6 模型的评价与推广
6.1 模型的评价
优点:
1)本文巧妙地运用了Logistic回归思想,利用残差图等分析方法,建立了Logistic回归模型。
2)本文对于得到的判别准则操作性强,对于任意给定的一组数据,都可以快速,直观的得出结果,且准确率较高
缺点:
1)本文中所给病例数据太少,导致Logistic回归的诊断结果与实际的结果产生一定的偏差。
2)本文在模型Ⅱ计算过程中剔除的3个元素可能存在偏差,对判别结果有一定的影响。
3)本文考虑影响患肾炎的因素较为单一,仅仅只有7种元素的含量为唯一的参考量,没有较强的实用性。
6.2 模型的推广
1)若要在原模型的基础上得到更高的准确率,以免造成诊断上的意外事故,我们还可以开发出更优秀的软件,可减少模型的求解规模,提高判别准则的精确度。
2)数据来源的单一性也是造成误差的原因之一,提高数据量的同时,我们不妨尝试找出诊断肾炎病情的其他判别方式,多方面因素共同综合考虑,然后再得到一个新的判别准则,从而提高诊断肾炎的准确度。
参考文献
【1】 毛云英 ,赵岫 ,周楠 ,王惠萍,肾病综合症患儿血清锌、铜、钙、镁及免疫指标水平测定与分析,中国儿童保健杂志,第 11 卷第3 期:2003
【2】 罗登发,条件logistic回归模型的残差分析和影响诊断,中国卫生统计,第14卷第1期:13页1997
【3】 孙荣恒,伊享云,何中市,重庆大学出版社:概率论和数理统计,2006
【4】 赵东方,数学模型与计算,北京:科学出版社,2007
7附录
表B.1 确诊病例的化验结果
病例号
Zn
Cu
Fe
Ca
Mg
K
Na
1
166
15.8
24.5
700
112
179
513
2
185
15.7
31.5
701
125
184
427
3
193
9.80
25.9
541
163
128
642
4
159
14.2
39.7
896
99.2
239
726
5
226
16.2
23.8
606
152
70.3
218
6
171
9.29
9.29
307
187
45.5
257
7
201
13.3
26.6
551
101
49.4
141
8
147
14.5
30.0
659
102
154
680
9
172
8.85
7.86
551
75.7
98.4
318
10
156
11.5
32.5
639
107
103
552
11
132
15.9
17.7
578
92.4
1314
1372
12
182
11.3
11.3
767
111
264
672
13
186
9.26
37.1
958
233
73.0
347
14
162
8.23
27.1
625
108
62.4
465
15
150
6.63
21.0
627
140
179
639
16
159
10.7
11.7
612
190
98.5
390
17
117
16.1
7.04
988
95.5
136
572
18
181
10.1
4.04
1437
184
101
542
19
146
20.7
23.8
1232
128
150
1092
20
42.3
10.3
9.70
629
93.7
439
888
21
28.2
12.4
53.1
370
44.1
454
852
22
154
13.8
53.3
621
105
160
723
23
179
12.2
17.9
1139
150
45.2
218
24
13.5
3.36
16.8
135
32.6
51.6
182
25
175
5.84
24.9
807
123
55.6
126
26
113
15.8
47.3
626
53.6
168
627
27
50.5
11.6
6.30
608
58.9
58.9
139
28
78.6
14.6
9.70
421
70.8
133
464
29
90.0
3.27
8.17
622
52.3
770
852
30
178
28.8
32.4
992
112
70.2
169
31
213
19.1
36.2
2220
249
40.0
168
32
170
13.9
29.8
1285
226
47.9
330
33
162
13.2
19.8
1521
166
36.2
133
34
203
13.0
90.8
1544
162
98.90
394
35
167
13.1
14.1
2278
212
46.3
134
36
164
12.9
18.6
2993
197
36.3
94.5
37
167
15.0
27.0
2056
260
64.6
237
38
158
14.4
37.0
1025
101
44.6
72.5
39
133
22.8
31.0
1633
401
180
899
40
156
135
322
6747
1090
228
810
41
169
8.00
308
1068
99.1
53.0
289
42
247
17.3
8.65
2554
241
77.9
373
43
166
8.10
62.8
1233
252
134
649
44
209
6.43
86.9
2157
288
74.0
219
45
182
6.49
61.7
3870
432
143
367
46
235
15.6
23.4
1806
166
68.8
188
47
173
19.1
17.0
2497
295
65.8
287
48
151
19.7
64.2
2031
403
182
874
49
191
65.4
35.0
5361
392
137
688
50
223
24.4
86.0
3603
353
97.7
479
51
221
20.1
155
3172
368
150
739
52
217
25.0
28.2
2343
373
110
494
53
164
22.2
35.5
2212
281
153
549
54
173
8.99
36.0
1624
216
103
257
55
202
18.6
17.7
3785
225
31.0
67.3
56
182
17.3
24.8
3073
246
50.7
109
57
211
24.0
17.0
3836
428
73.5
351
58
246
21.5
93.2
2112
354
71.7
195
59
164
16.1
38.0
2135
152
64.3
240
60
179
21.0
35.0
1560
226
47.9
330
表B.2 就诊人员的化验结果
病例号
Zn
Cu
Fe
Ca
Mg
K
Na
61
58.2
5.42
29.7
323
138
179
513
62
106
1.87
40.5
542
177
184
427
63
152
0.80
12.5
1332
176
128
646
64
85.5
1.70
3.99
503
62.3
238
762.6
65
144
0.70
15.1
547
79.7
71.0
218.5
66
85.7
1.09
4.2
790
170
45.8
257.9
67
144
0.30
9.11
417
552
49.5
141.5
68
170
4.16
9.32
943
260
155
680.8
69
176
0.57
27.3
318
133
99.4
318.8
70
192
7.06
32.9
1969
343
103
553
71
188
8.28
22.6
1208
231
1314
1372
72
153
5.87
34.8
328
163
264
672.5
73
143
2.84
15.7
265
123
73.0
347.5
74
213
19.1
36.2
2220
249
62.0
465.8
75
192
20.1
23.8
1606
156
40.0
168
76
171
10.5
30.5
672
145
47.0
330.5
77
162
13.2
19.8
1521
166
36.2
133
78
203
13.0
90.8
1544
162
98.9
394.5
79
164
20.1
28.9
1062
161
47.3
134.5
80
167
13.1
14.1
2278
212
36.5
96.5
81
164
12.9
18.6
2993
197
65.5
237.8
82
167
15.0
27.0
2056
260
44.8
72.0
83
158
14.4
37.0
1025
101
180
899.5
84
133
22.8
31.3
1633
401
228
289
85
169
8.0
30.8
1068
99.1
53.0
817
86
247
17.3
8.65
2554
241
77.5
373.5
87
185
3.90
31.3
1211
190
134
649.8
88
209
6.43
86.9
2157
288
74.0
219.8
89
182
6.49
61.7
3870
432
143
367.5
90
235
15.6
23.4
1806
166
68.9
188
模型Ⅰ线性回归在MATLAB程序:
X=[1 132 15.9 17.7 578 92.4 1314 1372;
1 182 11.3 11.3 767 111 264 672;
1 186 9.26 37.1 958 233 73.0 347;
1 162 8.23 27.1 625 108 62.4 465;
1 150 6.63 21.0 627 140 179 639;
1 159 10.7 11.7 612 190 98.5 390;
1 117 16.1 7.04 988 95.5 136 572;
1 181 10.1 4.04 1437 184 101 542;
1 146 20.7 23.8 1232 128 150 1092;
1 42.3 10.3 9.70 629 93.7 439 888;
1 28.2 12.4 53.1 370 44.1 454 852;
1 154 13.8 53.3 621 105 160 723;
1 179 12.2 17.9 1139 150 45.2 218;
1 13.5 3.36 16.8 135 32.6 51.6 182;
1 175 5.84 24.9 807 123 55.6 126;
1 113 15.8 47.3 626 53.6 168 627;
1 50.5 11.6 6.30 608 58.9 58.9 139;
1 78.6 14.6 9.70 421 70.8 133 464;
1 90.0 3.27 8.17 622 52.3 770 852;
1 178 28.8 32.4 992 112 70.2 169;
1 213 19.1 36.2 2220 249 40.0 168;
1 170 13.9 29.8 1285 226 47.9 330;
1 162 13.2 19.8 1521 166 36.2 133;
1 203 13.0 90.8 1544 162 98.90 394;
1 167 13.1 14.1 2278 212 46.3 134;
1 164 12.9 18.6 2993 197 36.3 94.5;
1 167 15.0 27.0 2056 260 64.6 237;
1 158 14.4 37.0 1025 101 44.6 72.5;
1 133 22.8 31.0 1633 401 180 899;
1 156 135 322 6747 1090 228 810;
1 169 8.00 308 1068 99.1 53.0 289;
1 247 17.3 8.65 2554 241 77.9 373;
1 166 8.10 62.8 1233 252 134 649;
1 209 6.43 86.9 2157 288 74.0 219;
1 182 6.49 61.7 3870 432 143 367;
1 235 15.6 23.4 1806 166 68.8 188;
1 173 19.1 17.0 2497 295 65.8 287;
1 151 19.7 64.2 2031 403 182 874;
1 191 65.4 35.0 5361 392 137 688;
1 223 24.4 86.0 3603 353 97.7 479;];
a0=0.25*ones(20,1);a1=0.75*ones(20,1);
y0=[a0;a1];
Y=log((1-y0)./y0);
[b,bint,r,rint,stats] =regress(Y,X)
rcoplot(r,rint)
模型ⅠLogistic回归的诊断程序:
X=[1 132 15.9 17.7 578 92.4 1314 1372;
1 182 11.3 11.3 767 111 264 672;
1 186 9.26 37.1 958 233 73.0 347;
1 162 8.23 27.1 625 108 62.4 465;
1 150 6.63 21.0 627 140 179 639;
1 159 10.7 11.7 612 190 98.5 390;
1 117 16.1 7.04 988 95.5 136 572;
1 181 10.1 4.04 1437 184 101 542;
1 146 20.7 23.8 1232 128 150 1092;
1 42.3 10.3 9.70 629 93.7 439 888;
1 28.2 12.4 53.1 370 44.1 454 852;
1 154 13.8 53.3 621 105 160 723;
1 179 12.2 17.9 1139 150 45.2 218;
1 13.5 3.36 16.8 135 32.6 51.6 182;
1 175 5.84 24.9 807 123 55.6 126;
1 113 15.8 47.3 626 53.6 168 627;
1 50.5 11.6 6.30 608 58.9 58.9 139;
1 78.6 14.6 9.70 421 70.8 133 464;
1 90.0 3.27 8.17 622 52.3 770 852;
1 178 28.8 32.4 992 112 70.2 169;
1 213 19.1 36.2 2220 249 40.0 168;
1 170 13.9 29.8 1285 226 47.9 330;
1 162 13.2 19.8 1521 166 36.2 133;
1 203 13.0 90.8 1544 162 98.90 394;
1 167 13.1 14.1 2278 212 46.3 134;
1 164 12.9 18.6 2993 197 36.3 94.5;
1 167 15.0 27.0 2056 260 64.6 237;
1 158 14.4 37.0 1025 101 44.6 72.5;
1 133 22.8 31.0 1633 401 180 899;
1 156 135 322 6747 1090 228 810;
1 169 8.00 308 1068 99.1 53.0 289;
1 247 17.3 8.65 2554 241 77.9 373;
1 166 8.10 62.8 1233 252 134 649;
1 209 6.43 86.9 2157 288 74.0 219;
1 182 6.49 61.7 3870 432 143 367;
1 235 15.6 23.4 1806 166 68.8 188;
1 173 19.1 17.0 2497 295 65.8 287;
1 151 19.7 64.2 2031 403 182 874;
1 191 65.4 35.0 5361 392 137 688;
1 223 24.4 86.0 3603 353 97.7 479;];
for j=1:40;
f=1/(1+exp(1.0175-0.0024*X(j,2)+0.0332*X(j,3)-0.0036*X(j,4)-0.0006*X(j,5)-0.0017*X(j,6)-0.0001*X(j,7)+0.0006*X(j,8)));
if f<=0.5;
y=0;
plot(j,y,'*')
hold on
else
y=1;
plot(j,y,'*')
hold on
end
end
对B.2的病例判断程序:
X=[58.2 5.42 29.7 323 138 179 513;
106 1.87 40.5 542 177 184 427;
152 0.80 12.5 1332 176 128 646;
85.5 1.70 3.99 503 62.3 238 762.6;
144 0.70 15.1 547 79.7 71.0 218.5;
85.7 1.09 4.2 790 170 45.8 257.9;
144 0.30 9.11 417 552 49.5 141.5;
170 4.16 9.32 943 260 155 680.8;
176 0.57 27.3 318 133 99.4 318.8;
192 7.06 32.9 1969 343 103 553;
188 8.28 22.6 1208 231 1314 1372;
153 5.87 34.8 328 163 264 672.5;
143 2.84 15.7 265 123 73.0 347.5;
213 19.1 36.2 2220 249 62.0 465.8;
192 20.1 23.8 1606 156 40.0 168;
171 10.5 30.5 672 145 47.0 330.5;
162 13.2 19.8 1521 166 36.2 133;
203 13.0 90.8 1544 162 98.9 394.5;
164 20.1 28.9 1062 161 47.3 134.5;
167 13.1 14.1 2278 212 36.5 96.5;
164 12.9 18.6 2993 197 65.5 237.8;
167 15.0 27.0 2056 260 44.8 72.0;
158 14.4 37.0 1025 101 180 899.5;
133 22.8 31.3 1633 401 228 289;
169 8.0 30.8 1068 99.1 53.0 817;
247 17.3 8.65 2554 241 77.5 373.5;
185 3.90 31.3 1211 190 134 649.8;
209 6.43 86.9 2157 288 74.0 219.8;
182 6.49 61.7 3870 432 143 367.5;
235 15.6 23.4 1806 166 68.9 188;];
X=[ones(30,1),X];
for j=1:30;
f=1/(1+exp(1.0175-0.0024*X(j,2)+0.0332*X(j,3)-0.0036*X(j,4)-0.0006*X(j,5)-0.0017*X(j,6)-0.0001*X(j,7)+0.0006*X(j,8)));
if f<=0.5;
y=0;
plot(j,y,'*')
hold on
else
y=1;
plot(j,y,'*')
hold on
end
end
模型Ⅰ线性相关系数求解的程序:
X=[1 132 15.9 17.7 578 92.4 1314 1372;
1 182 11.3 11.3 767 111 264 672;
1 186 9.26 37.1 958 233 73.0 347;
1 162 8.23 27.1 625 108 62.4 465;
1 150 6.63 21.0 627 140 179 639;
1 159 10.7 11.7 612 190 98.5 390;
1 117 16.1 7.04 988 95.5 136 572;
1 181 10.1 4.04 1437 184 101 542;
1 146 20.7 23.8 1232 128 150 1092;
1 42.3 10.3 9.70 629 93.7 439 888;
1 28.2 12.4 53.1 370 44.1 454 852;
1 154 13.8 53.3 621 105 160 723;
1 179 12.2 17.9 1139 150 45.2 218;
1 13.5 3.36 16.8 135 32.6 51.6 182;
1 175 5.84 24.9 807 123 55.6 126;
1 113 15.8 47.3 626 53.6 168 627;
1 50.5 11.6 6.30 608 58.9 58.9 139;
1 78.6 14.6 9.70 421 70.8 133 464;
1 90.0 3.27 8.17 622 52.3 770 852;
1 178 28.8 32.4 992 112 70.2 169;
1 213 19.1 36.2 2220 249 40.0 168;
1 170 13.9 29.8 1285 226 47.9 330;
1 162 13.2 19.8 1521 166 36.2 133;
1 203 13.0 90.8 1544 162 98.90 394;
1 167 13.1 14.1 2278 212 46.3 134;
1 164 12.9 18.6 2993 197 36.3 94.5;
1 167 15.0 27.0 2056 260 64.6 237;
1 158 14.4 37.0 1025 101 44.6 72.5;
1 133 22.8 31.0 1633 401 180 899;
1 156 135 322 6747 1090 228 810;
1 169 8.00 308 1068 99.1 53.0 289;
1 247 17.3 8.65 2554 241 77.9 373;
1 166 8.10 62.8 1233 252 134 649;
1 209 6.43 86.9 2157 288 74.0 219;
1 182 6.49 61.7 3870 432 143 367;
1 235 15.6 23.4 1806 166 68.8 188;
1 173 19.1 17.0 2497 295 65.8 287;
1 151 19.7 64.2 2031 403 182 874;
1 191 65.4 35.0 5361 392 137 688;
1 223 24.4 86.0 3603 353 97.7 479;];
for i=2:1:8
for j=i+1:1:8
a=[i*ones(1),j*ones(1)]
corrcoef(X(:,i),X(:,j))
end
end
模型Ⅱ的线性回归程序:
X=[1 132 15.9 17.7 578 92.4 1314 1372;
1 182 11.3 11.3 767 111 264 672;
1 186 9.26 37.1 958 233 73.0 347;
1 162 8.23 27.1 625 108 62.4 465;
1 150 6.63 21.0 627 140 179 639;
1 159 10.7 11.7 612 190 98.5 390;
1 117 16.1 7.04 988 95.5 136 572;
1 181 10.1 4.04 1437 184 101 542;
1 146 20.7 23.8 1232 128 150 1092;
1 42.3 10.3 9.70 629 93.7