城市生活用水量预测的PLS—ANN模型
城市生活用水量预测的PLS—ANN模型 第23卷第3期
2006年9月
华中科技大学(城市科学版)
J.ofHUST.(UrbanScienceEdition) Vo1.23No.3
Sep.2006
城市生活用水量预测的PLS—ANN模型
曹连海陈南祥徐建新
(1.华北水利水电学院资源与环境学院,河南郑州450008; 2.华北水利水电学院研究生处,河南郑州450008)
摘要:城市生活用水量受到多重因素的影响,这些因素之间的相关性都较大.将偏最小二乘回归与神经网络
耦合,建立了城市生活用水量预测模型.将自变量利用偏最小二乘回归处理,提取对因变量影响强的成分,既可
以克服变量之间的相关性问题,又可以降低神经网络的输入维数;利用神经网络建模可以较好地解决非线性问
题.实例表明本预测模型的拟合和预测精度均较好.
关键词:偏最小二乘回归;神经网络;预测模型;城市生活用水量
中图分类号:X703文献标识码:A文章编号:1672—7037(2006)03—0020—03 科学的供水规划源于对未来的科学分析与准
确预测,用水量的预测即着眼于这一问题.偏最小
二乘回归(PLS)是一种新型的多元统计数据分析
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
L】],其优点在于回归建模过程中采用了信息
综合与筛选技术,它不再直接考虑因变量集合与
自变量集合的回归建模,而是在变量系统中提取
若干对系统具有最佳解释能力的新综合变量(又
称为成分),特别是在解释变量多重相关性及个数 大于观察个体数的情况,是一种具有较好发展前 景的新型数据分析方法l_2].因此,近十几年来,它 在理论,方法和应用方面都得到了迅速发展和应 用.神经网络(ANN)以其独有的结构和处理方 法,具备自组织,自学习和联想记忆功能,理论上 可以实现任意函数的逼近,它克服了模型必须是 基本观测数据的线性和非线性组合的局限.本文 将偏最小二乘回归分析方法和神经网络有机结 合,建立城市生活用水量预报模型.并以北京市为 例,建立偏最小二乘回归和神经网络的城市生活 用水量预报模型,实例计算验汪表明,效果良好. 1偏最小二乘回归的原理
设有g个因变量{Y,Y,…,Y)和P个自变 量{z,z,…,z),为了研究因变量与自变量的统 计关系,采集个样本点,构成自变量与因变量的 数据表,X一[z1,z2,…,zp]和Y—Ey1,Y2,…, Y].偏最小二乘回归分别在X和y中提取主 成分t1和1,t1是z1,z2,…,z的线性组合,1是 Y,Y,…,Y的线性组合.t和应尽可能多地 携带各自数据表中的变异信息,且相关程度达到 最大,这表明t对有最强的解释能力[3]. 在t和被提取后,分别实施X对t的回
归以及y对t的回归,利用X对t解释后的残 余信息以及y被t解释后的残余信息进行第2 个成分提取.如此往复,直到能达到一个较满意的 精度为止,精度可以通过交叉有效性来判别. 偏最小二乘回归方程一般不需要选用全部的 成分t,t.,…,t进行回归建模,而是采用截尾的
方式选用前m个成分(<A,A一秩(X)),仅用 这m个成分t,t,…,t就可以得到预报性能良 好的模型.m的选取可采用类似于抽样测试法的 工作方式:除去某个样本点i的所有样本点组成 新的样本,使用h个成分拟合一个回归方程,得到 Y在样本点i上的拟合值.对每一个样本点 重复上述计算,并定义Y的预测误差平方根和为 PRESS有
n
PRESS^,=:Eyf—Y^(一i)];
=1
定义y的预测误差平方和为PRESS,有 —
PRESS^一>:PRESS"
J1
显然,如果回归方程的稳健性不好,误差很 大,它对样本点的变动就很敏感,这种扰动误差的 作用就会加大PRESS值.若再采用所有的样本 收稿日期:2005—12—14.
作者简介:曹连海(1970一),男,讲师;郑州,华北水利水电学院资源与环境学院
(450008).
基金项目:国家863计划资助项目(2002AA2Z4291);河南省高校杰出科研人才创新
工程资助项目(HAIPURT)(2005KYCX015)
第3期曹连海等:城市生活用水量预测的PLS—ANN模型?21?
点拟合含h个成分的回归方程,这时,第i个样本 点的预测值为,则可定义Y,的误差平方和,即 SS^,一?(Yjl—Yhji);
l=1
定义与y的误差平方和为SS,有
r11'
SS一>:"
,=I
总是有PRESS大于SS,而小于SSh一 (SS一是用全部样本点拟合的具(一1)成分的方 程的拟合误差).如果h个成分回归方程的含扰动 的误差能在一定程度上小于(一1)个成分回归方 程的拟合误差,则认为增加一个成分t,全部预测 的精度明显提高.因此总希望PRESS/ss一的 比值能越小越好.一般认为,当临界值Q;一1一 PRESS/ss一1>1o.0975时,增加t是有益的. 当g一1,则上述问题成为单因变量的偏最小 二乘回归模型,它是多因变量偏最小二乘回归模 型的一种特例.城市生活用水量预测常常可归结 为单因变量回归问题.
2偏最小二乘回归
2.1算法
首先将数据做标准化处理.X经标准化处理 后的数据矩阵记为
E0一[EED2'…,E0p];
y经标准化处理后的数据矩阵记为
F0一IFF…,F0q]q.
记t是E.的第1个成分;w是E.的第1个轴, 它是一个单位向量,即llwll=1. a.求矩阵E.F.F.E.最大特征值所对应的 特征向量w,求成分t,得
t1P1, t1一E0W1;E1=E0--
式中,P1一E.t1/flt1ll.
b.求矩阵E.F.F.E.最大特征值所对应的 特征向量W,求成分t,得
t2=E1W2;E2一E1--t2P2, 式中,P一E1tz/lltll. c.至第m步,求t一E一W,W是矩阵 E一F.F.E一最大特征值所对应的特征向量. 根据交叉有效性,确定其提取m个成分(,, t,…,,)可以得到一个满意的预测模型. 2.2神经网络模型
人工神经网络(ANN)是一种模拟人的神经 系统而建立起来的非线性动力学模型,是有自组 织,自学习和联想记忆功能,并具有分布式,并行 性和高度鲁棒性等特点.采用小脑模型网络 (CMAC)建模(图1),输人层为由采用偏最小 二乘回归求得的h个成分(,,t,…,t)组成的向 量一{t,t,…,t),其量化编码为[],映射
致AC中的c个存储单元(也称联想单元),即被 []激活的单元(c为二进非零单元的数目),可 用下式表示映射后的向量
Rp=S([])一
[([]),S([]),…,S([])],
式中,S,([])一1;一1,2,…,c,c为泛化常数. AC杂散编码AP(gO
,
三二,
一
一
输出
图1CMAC网络
在输入空间的邻近的两个点在AC中有部分 的重叠单元被激励,距离越近,重叠越多. 实际映射是由AC的c个单元用杂散编码技 术映射至AP的c个单元,c个单元中存放着相应 权值,则网络的输出为c个单元的权值和.若其权 值为Wp一[叫1,W2,…,W一,W],则有
YP:(12)
CMAC采用有导师的学习算法,导师信号 rp/d,P一1,2,…,h.由学习
规则
编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf
调整权值,有 Aw,一17(一(,)),([])/llll. 3实例
现以北京城市生活用水量预测为例.生活用 水系统复杂,影响因素多种多样,自变量的选择从 全面性,重点性,可量化及可控制的原则出发,尽 可能包含有效因子,剔除无效因子.主要影响因素 包括城市非农业人口,第三产业状况,建筑面积, 生活水平,绿地和道路等,而绿地和道路用水又与 当年绿地面积和当年降水量有关].城市人口数 量是城市生活用水量的主要影响因素,因而选用 城市非农业人口数量来表示人口因素.第三产业 产值和建筑面积是公共用水的主要影响因素,对 于北京这种公共用水占生活用水量比重很大的城 市,这两个因素应重点考虑,所以选择第三产业产 值和居住面积(建筑面积的数据难以获得,以居住 面积代之)作为影响因素.因为,一方面,人均居住 面积的提高与之伴随的是生活设施的改善,尤其
.22?华中科技大学(城市科学版)
是卫生设施的改善;另一方面,人均居住面积的增
加也是人民经济水平上升的
标志
禁止坐卧标志下载饮用水保护区标志下载桥隧标志图下载上坡路安全标志下载地理标志专用标志下载
,相应地第三产 业用水消费也将增加,所以人均居住面积的增加 必将导致人均用水定额的上升.因此,北京城市生 活用水量的预测主要选择非农业人口,第三产业 产值,居住面积,人均居住面积及绿地因子(当年 绿地面积与当年降水量之比)5个影响因子. 选城市生活用水量作因变量y,非农业人口 ,第三产业产值.,居住面积.,人均居住面 积,绿地因子作自变量,建立城市生活用水 量预测模型,即
y=f(X1,X2,X.,X,X). 选用1986~1999年的北京市生活用水量,非 农业人口,第三产业产值,居住面积,人均居住面 积,绿地面积及年降水量等相关数据[g],求出相关 系数r.由表1可见,自变量之间有较高的相关 性.选取1986,1996年的数据建模,1997~1999
年的数据作预报检验.首先提取成分并作交叉有 效性判别,Q;,Q;及Q;均大于临界值0.0975,而 Q:一0.0931<O.0975,所以选择三个主成分t, t2,t3,其表达式为
表1相关系数
0.04660.1631
0.46970.0621
0.47870.1772
0.47620.2412
0.3252——0.9380
——
0.2057
一
O.2807
——
0.2040
一
O.1561
一
O.9O16
将提取的t,t.和t.作为神经网络模型的输 入,Y作为输出,进行网络训练求解,当训练达到 963次时,误差函数趋于稳定并满足给定的精度 要求(图2).偏最小二乘回归神经网络模型的拟 图2期望输出与实际输出比较
用神经网络进行训练时,由于变量之间的严重相 关性,使得输入的矩阵处于病态,神经网络的收敛 速度慢且不稳,训练2万次仍不能满足精度要求. 利用所建模型进行1997,1999年的生活用 水量预测,从表2可见,该模型的预测效果相当不 错,最大相对误差仅0.87,
说明
关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书
此方法是可行的. 表2模型预测的相对误差
4结论
a.城市生活用水系统中,城市生活用水量受 诸多因素影响,系统建模时,将自变量利用偏最小 二乘回归处理,提取对因变量影响强的成分,既可 以克服变量之间存在的相关性问题,提高模拟精 度;又可以降低神经网络的输入维数,简化网络结 构,增强网络的稳定性.
b.利用神经网络建模可较好地解决非线性问 题.将偏最tb--乘回归与神经网络耦合,建立城市 生活用水量预测模型,实例表明该模型的拟合和 预报相对误差均在5以下,模型精度较高.
参考文献
[1]秦蓓蕾,王文圣,丁晶.偏最小二乘回归模型在水 文相关分析中的应用[J].四川大学(工程科学 版),2003,35(4):115-118. [2]吉海彦,严衍禄.主成分一人工神经网络在近红外 光谱定量分析中的应用[J].分析测试,1999, (5):l1—15.
[3]陈南祥,曹连海,黄强.Applicationofneural
modelcouplingwiththepartialleastmethodfor
forecastingwateryieldofmine[-J1.煤炭(英文
版),2005,(1):40—43.
[4]王惠文.偏最小二乘回归方法及其应用[M].北京: 国防工业出版社,1999.
[5]云舟工作室.MATLAB数学建模基础教程[M]. 北京:人民邮电出版社,2001.
[6]MartinTHangan,HowardBDemuth.神经网络设 计[M].戴葵译.北京:机械工业出版社,2002. [7]曹连海,王安明,陈南祥,等.偏最小二乘法回归神 经网络在城市生活用水量预测中的应用[J].华北 水利水电学院,2005,26(2):9-11. [8]张雅君,刘全胜,冯萃敏.多元线性回归在北京城 市生活用水需水量预测中的应用r-j].给水排水, (下转第27页)
T
第3期丁发兴等:四面均匀受火下圆钢管混凝土温度场非线性分析?27?
[2]
[3]
[4]
[5]
[6]
1ll—lZ6.
BisbvLA.Firebehavioroffibre—reinforcedpoly—
mer(FRP)reinforcedorconfinedconcrete[D]. Canada:Queen'sUniversity,2003.
HanLin—Hai,XuLei,ZhaoXiao—Ling.Testsand
analysisonthetemperaturefieldwithinconcrete filledsteeltubeswithorwithoutprotection subiectedtoastandardfire[J].Advancesin StructuralEngineering.2003,6(2):121—133.
Eurocode2.DesignofConcreteStructures,Part1—
2,GeneralRules——StructuralFireDesign[s]. 1996.
钟善桐.钢管混凝土的防火[J].建筑结构,1999,29
(7):55—57.
HanLin—Hai.ZhaoXiao—Ling,YangYou—Fu,et
a1.Experimentalstudyandcalculationoffire resistanceofconcrete—filledhollowsteelcolumns [J].JournalofStructuralEngineering,2003,129 (3):346-356..
[7]董毓利.混凝土结构的火安全
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
[M].北京:科
学出版社,2001.
[8]李国强,蒋首超,林桂祥.钢结构抗火计算与设计
[M].北京:中国建筑工业出版社,1999.
[9]段文玺.建筑结构的火灾分析和处理(二)[J].工业
建筑,1985,15(8):51—54.
Vl0]KimDong—kyu,ChoiSung—mo,ChungKyungSO0?
StructuralcharacteristicsofCFTcolumnssubject tofireloadingandaxialforce[A].Proceedingof6th ASCCSConference[C].LosAngeles,USA,2000.
271—278.
TemperatureFieldAnalysisofConcreteFilledCircularSteelTubes
inFirebyFinite—DifferenceMethod
DINGFa—xingYUZhi—wu
(1.Schoo1ofCivilEng.&Architecture,CentralSouthUniv.,Changsha410075,China) Abstract:Basedonthethermalpropertiesofconcreteandsteel,usinganelementalenergybalance
approach,thefinitedifferenceequationsforconcretefilledcircularsteeltubes(CFST)infirewas
Dresented.Theinfluenceofthephysicalorchemicalreactionoffreeorcombinedwaterinconcreteon
thetemperaturefieldofconcretecorewasconsideredbymagnifyingthespecificheatofconcrete.The
programforthenonlinearfinitedifferenceanalysisofthetemperaturefieldwithinCFSTwas developed.andthecoefficientofheattransferofsteelandthemagnifyingcoefficientofthespecific
heatofconcreteweredeterminedbymatchingthenumericalresultswithexperimentalresultsfrom
references.Itisindicatedthatthecalculatedresultsfitwiththeexperimentaldatasatisfactorily.This
workisabaseforthefurtherresearchesonthenonlinearfiniteelementanalysisofCFSTinfire. Keywords:concretefilledsteeltube;fire;temperaturefield;finite—
difference;nonlinearanalysis
(上接第22页)
ModelofNeuralNetworkCouplingWithPartialLeast—SquaresMethod
forUrbanLife—waterQuantityPrediction
CAOLian—haiCHENNan—xiangXUJian—xin
(1.SchoolofResourceandEnvir.Sci.,NorthChinaInst.
WaterConservancy&HydroelectricPower,Zhengzhou450008,
2.GraduateStudentCourses,NorthChinaInst.of
WaterConservancy&HydroelectricPower,Zhengzhou,450008
of
China;
China)
Abstract:Theurbanlife—waterquantityisinfluencedbymanycorrelativefactors.Thepaper establishesthemodelfortheurbanlife—
waterquantitypredictionbymeansofcombiningneural
networkwiththepartialleastsquaresmethod.Dealtwithindependentvariablesbythepartialleast
squaresmethod,itcannotonlysolvetherelationshipbetweenindependentvariablesbutalsoreduce
theinputdimensionsinneuralnetworkmodelwhichcansolvethenon—
linearproblembetter.T'he
resultofanexampleshowsthatthepredictionandforecastingprecisionarepreferable. Keywords:partialleastsquaresmethod;neuralnetwork;forecastingmodel;urbanlife—
waterquantity