首页 传染病的自组织神经网络预测研究.doc

传染病的自组织神经网络预测研究.doc

举报
开通vip

传染病的自组织神经网络预测研究.doc传染病的自组织神经网络预测研究.doc 传染病的自组织神经网络预测研究 【摘要】 针对传染病发病趋势的预测需要考虑许多因素的特点,提出了用改进的自组织神经网络方法对传染病发病趋势进行预测。改进的自组织神经网络的算法用免疫克隆选择算法的克隆算子和变异算子去改进自组织神经网络算法中的邻域大小和权值调整规则,使每个神经元的权值学习率和邻域大小随神经元的亲和力发生变化,从而保证网络在很大概率上收敛到全局最优,并克服了自组织神经网络分类效果受输入次序影响的不足。最后实例分析表明了该方法的实用性和有效性。 【关键词】 传染...

传染病的自组织神经网络预测研究.doc
传染病的自组织神经网络预测研究.doc 传染病的自组织神经网络预测研究 【摘要】 针对传染病发病趋势的预测需要考虑许多因素的特点,提出了用改进的自组织神经网络方法对传染病发病趋势进行预测。改进的自组织神经网络的算法用免疫克隆选择算法的克隆算子和变异算子去改进自组织神经网络算法中的邻域大小和权值调整规则,使每个神经元的权值学习率和邻域大小随神经元的亲和力发生变化,从而保证网络在很大概率上收敛到全局最优,并克服了自组织神经网络分类效果受输入次序影响的不足。最后实例分析表明了该方法的实用性和有效性。 【关键词】 传染病; 自组织神经网络; 免疫克隆算法; 预测 长久以来,传染病一直危害着人类的健康。历史上,传染病一次次的流行给人类生存和社会发展带来了巨大的灾难,如刚刚过去的禽流感、SARS以及正流行的甲型H1N1流感都给人类带来了重大威胁。长期以来,人类和各种流行病进行了不屈不挠的斗争,但是我们想要最终征服它,道路依然漫长曲折[1,2]。因此为了能揭示流行病的流行规律,预测其未来变化发展的趋势,已经有很多学者进行了相关的研究,其中建立数学模型研究传染病的传播过程动力学行为成为一个重要的研究方向,并且已取得了一些研究成果[3,6]。 传染病发病会受到许多因素的影响,而且影响因素之间又存在着错综复杂的联系,很难运用结构式的因果模型加以解释,而数据之间的这种相互依存关系恰恰是研究对象最重要和最有用的特性,而且传染病的发生往往同时具有长期趋势、季节性、周期性、短期波动和不规则变动等特点,对这类资料进行预测分析常需要同时考虑这些特点。因此,针对传染病的这些特点,本研究提出用自组织神经网络(SOM)方法对传染病进行预测。SOM根据一定的学习规则,能对输入模式自动进行分类,即在无教师示教情况下,通过对输入模式的自组织学习,在竞争层将分类结果表示出来。这种分类方法减少了人为分类造成的主观性,保证分类结果的客观性。而且自组织神经网络方法与传统的统计方法相比,自组织神经网络方法能更好地从疾病的传播机理方面来反映流行规律,使人们能了解其流行过程中的一些全局性态。但是,SOM网络在应用中存在着分类结果与样本输入次序有关和易陷入局部最优的一些不足,故本研究用免疫克隆算法的克隆和变异机制进行改进,以期提高SOM算法分类的准确性和泛化性能,更好地反映传染病流行规律。 1 自组织神经网络(SOM) 自组织神经网络是在1981年由T.Kohonen提出的,由输入层和竞争层组成。自组织神经网络是一个简单的双层网络,每个输入 节点通过权重W相联系,实现对输入信号的非线性降维映射。映射中保持拓扑不变性,即把拓扑意义下相似的输入映射到最近的输出节点上。SOM的典型结构如图1所示。 图1 自组织神经网络的典型结构 SOM网络由输入层和竞争层组成,输入层与竞争层各神经元之间完全连接。SOM神经网络结构有两个明显特点分别是:一是拓扑映射结构不是通过神经元的运动重新组织实现的,而是由各个神经元在不同兴奋状态下构成一个整体,所形成的拓扑结构;二是这种拓扑映射结构的形成具有自组织的特点。 若输入n 维向量x=(x1,x2,…m) ,建立一个有m 个输出节点的二维网络,SOM网络算法的训练过程一般按照以下步骤来实现: Step1 初始化:对输出层各权向量赋[0,1]之间互不相同的随机数并进行归一化处理,得到W?j,j=1,2,…m ;建立初始优胜邻域Nj*(0) ;学习率η 赋初始值。 Step2 接受输入:从训练集中随机选取一个输入模式并进行归一化处理,得到 X?p, p?{1,2,…,p} 。 Step3 寻找获胜节点:计算X?p 与W?j 的点积,j=1,2,…m ,从中选出点积最大的获胜节点j* 。 Step4 定义优胜邻域Nj*(t) 以j* 为中心确定t 时刻的权值调整域,一般初始邻域Nj*(0) ,训练过程中Nj*(t) 随训练时间逐渐收缩。 Step5 调整权值:对优胜邻域Nj*(t) 内的所有节点调整权值: wji(t+1)=wij(t)+η(t)[xpi-wij(t)], i=1,2,…n,j?Nj*(t) ,式中,η(t) 是训练时间t 和邻域内第j 个神经元与获胜神经元j* 之间的拓扑距离的函数,η(t)=η(0)(1-tT) 。 Step6 结束检查:学习率是否衰减到零或某个预定的正小数。 2 改进的SOM网络 2.1 改进SOM算法的方法 从SOM训练过程看,其权值修正公式 Wij(t+1)=wij(t)+η(t)[xpi-wij(t)],由学习率函数修改公式η(t)=η(0)(1-tT) 可知,学习率函数η(t) 随着样本的输入线性递减,使权值的修改量随样本的输入而缩小,从而保证算法收敛,但是这就造成了网络的分类结果同样本的输入次序有关,另外,SOM网络的阈值Nj*(t)=Int[Nj*(0)(1-tT)] 是墨西哥帽函数的一种具体体现,这是一个随样本输入线性减小的函数,这样随着样本的输入获胜神经元的影响范围逐渐缩小,造成了对后续样本的不公平。因此本研究将免疫 克隆选择算法的克隆和变异机制引入SOM的学习算法中,以克服SOM算法的这些不足。 改进的SOM算法把免疫算法的抗原作为SOM算法的输入;B细胞受体作为SOM的权值;B细胞受体对抗原的识别过程作为SOM算法的学习过程。B细胞克隆的过程对应于SOM算法神经元的邻域调整过程,B细胞受体的变异对应于SOM算法权值的调整过程,亲和力最高的B细胞产生抗体相当于SOM中获胜神经元[7,8]。其具体改进方法如下: ? 改进的SOM网的竞争层神经元数量和邻域大小的调整 设网络的输入模式Xk=(Xk1,Xk2,…,XkN), k=1,2,…q ,q 为样本数:竞争层神经元为A={a1,a2,…,aM) ,M 为神经元数量。竞争层神经元 j与输入层神经元权值矩阵为 Wj=(w1j,w2j,…,wij,…wNj) ,i=1,2,…,N, j=1,2…,M, 其激活函数为二值型函数。 亲和力为φ(aj) :φ(aj)=1‖Xl-Wj‖=1( i(xli-wij)2)12 邻域函数为:Nj=f(M*,φ(aj)) ,取Nj=Int(M* φ(aj) Mi=1φ(ai)), j=1,2,…,M 其中,φ(aj) 为第L个输入样本相对第 j个获胜神经元aj 的亲和力值;Nj 为 aj邻域内的神经元数量;‖‖ 为欧氏空间距离;M* 是克隆规模,且M*>M ,M*= MjNj; Int(*) 为取整符号。 由Nj 的表达式可知,φ(aj) 越大,其克隆的规模也就越大,获胜神经元邻域的神经元数量越多,即可修改的神经元范围扩大了,也就是说,邻域函数的范围大小是与亲和力的值成比例的,克服了传统邻域函数随样本输入线性减小的问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 ,避免后续样本对修改权值的影响程度。 ? 改进的SOM网络的权值学习规则与获胜神经元的选择 竞争层神经元邻域克隆调整后,竞争层神经元变为:A′=(A, A′1, A′2, …,A′M) 。 其中,A′l={ ai1,ai2,…,aiNi-1}, aij=ai, j=1,2,…,Ni-1。 把获胜神经元根据φ(aj) 值的大小的进行克隆繁殖,这就在获胜神经元附近,产生一个变异解的群体,从而扩大了搜索范围,通过获胜神经元的扩张与压缩,将局部搜索与全局搜索结合起来实现问题的求解,这有助于防止早熟和搜索陷入局部最小值,从而克服了SOM算法在寻优搜索容易陷入局部极小的缺点[9,10]。在对权值调整过程中,权值调整不作用到A?A′ ,对作用到神经元ai 的权值Wi 进行如下调整: wji(t+1)=wji(t)+η(t)( xlj-wji(t)) ,η(t)=Nt(0,σ2) , σ=1φ(aj(t)) 其中,Nt(0,σ2) 为满足均值为0, 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差为σ 的正态分布随机变量,用于更新权值,从σ 的表达式可以看出, σ与φ(aj) 的大小成反比,而标准差决定了正态分布随机变量分布范围的大小,因而亲和力越大,则相应产生的正态分布随机变量的分布范围也就越大,这样通过增大权值的调整率以扩大搜索范围,促使其较快地跳出局部极小的区域而转移到另外-个较好的区域进行搜索,避免陷入局部极优。 获胜神经元邻域的神经元权值调整后,重新计算神经元权值与输入向量的亲和力, i=1,2…,M ,若存在权值调整后的神经元 b={ aij(t+1)|max{φ(aij)}}, j=1,2,…,(Ni-1),i=1,2,…M 使得φ(ai)<φ(b),ai?A ,则用b 取代原获胜神经元ai ,从而更新获胜神经元群,使获胜神经元权值更逼近输入向量。 2.2 改进的SOM算法实现的具体步骤 Step1 初始化:初始化权值向量Wj(0), j=1,2,…,M ;M 为竞争层获胜神经元数量。 Step2 采样:获取输入样本Xl 提供给网络的输入层,并进行归一化处理得X?l 。 Step3 对权值向量Wj=(w1j,w2j,…,wNj) 进行归一化处理得W?j ,计算W?j 与X?l 之间的亲和力:{φ(A(0))}={φ(a1(0)), φ(a2(0)),…,φ(aM(0))} 。 Step4 更新邻域范围:克隆获胜神经元: A′(k)=Θ(A(t))=[Θ(a1(t)),Θ(a2(t)),…,Θ(aM(t))] , 其中,Θ(ai)=Ii ai, i=1,2,…,M, Ii 为Ni 维值为1的行向量,Ni 为第i 个获胜神经元的克隆规模。 Step5 根据wji(t+1)=wji(t)+η(t) (xlj-wji(t)) 对克隆的神经元A′(t) 进行权值调整操作:A′(t)?A″(t) 。 Step6 计算亲和力:A″(t): { φ(A″(t))} ,根据η(t)=Nt(0,σ2) 重新选择获胜神经元。 Step7 计算亲和力A(t+1) : {φ(A(t+1))}={φ(a1(t+1)), φ(a2(t+1)),…,φ(aM(t+1))} 。 Step8 根据Nj=Int (M* φ(aj) Mi=1φ(ai)), j=1,2,…,M 和η(t)=Nt(0,σ2) 更新学习率Nj(t) 和η(t) 。 Step9 令t=t+1 返Step2,直到t+1 等于预定的值。3 实例分析 疟疾是全世界重要的虫媒传染病之一。近年研究发现,疟疾发病率上升、流行季节延长、流行疟区扩大的趋势与全球气候异常变暖存在密切关系。下面就以某省3个国家气象站观测站所在县1996年1月,1997年12月当月平均气象数据与后1个月疟疾发病 率等级的历史数据,利用本研究提出的改进的SOM网络方法,并根据1997年12月的气象数据预测该地区1998年1月疟疾发病率等级。从所给历史数据可知,1996年2月,1997年12月疟疾的发病等级为4类,共有23个月,目的是预测第24个月的发病等级。各个月份的发病等级按月序号分为4类,如表1。表1 各月发病等级分类结果 对应表中数据,确定改进的SOM网络输入模式为: Xk=(Xki,Xk2,…,XkN), k=1,2,…23, N=9 即一共23组样本,每个样本中包括9个元素。输入样本经过归一化处理,采用Matlab7.1编程实现。令网络初始权值为[0,1]的随机数,输出获胜神经元克隆规模为320,最大进化代数为1000,按照改进的SOM算法步骤进行分类,训练结束后,经过改进的SOM网络训练后23组样本被分为4类。T1 结果如表2。 从数据表2中能看出,以上聚类结果刚好对应于发病等级分类的1、2、3、4类。将1998年12月的数据代入建立好的SOM网络中得到对1999年1月的预测结果。 X1=[869.2 19.7 30.6 10.7 131.4 16.6 67.1 219.4 203.1]′; T2=(3,1) 。其中括号里的3代表软件分类序号,1代表月份。显然属于第一类发病等级,即1999年1月份的发病等级为1,与实际情况完全相符。表2 改进的SOM方法分类结果 4 结论 本研究根据传染病发病的多种因素提出了用自组织神经网络来对其流行规律进行预测的思想,并把免疫克隆选择和变异的机制引入到SOM网络神经元邻域范围调整和权值的学习中,以克服SOM网络算法自身存在分类结果与样本输入次序有关和易陷入局部最优的不足,提出了改进的SOM网络方法,并建立了相应的学习算法。最后根据某地区疟疾发病受气象因素的影响,把该方法应用于该地区疟疾发病的预测中,预测结果与实际发病情况完全吻合,验证了该方法预测的准确性和客观性,为疟疾这一虫媒传染病的预防和控制提供了有利的理论依据。同时对其他相关领域也有一定的参考价值,笔者希望能起到抛砖引玉的作用。 【
本文档为【传染病的自组织神经网络预测研究&#46;doc】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_212655
暂无简介~
格式:doc
大小:21KB
软件:Word
页数:7
分类:
上传时间:2018-01-31
浏览量:18