首页 蚂蚁蛋白质的提取

蚂蚁蛋白质的提取

举报
开通vip

蚂蚁蛋白质的提取蚂蚁蛋白质的提取 1、相关定义 1.1、PPI提取基本概念 取任务之前,先介绍下信息提取系统。信息提取 系统与信息检索、自动文摘等有实质性的区别,它从指定的文本集中提取用户感兴 趣的信息并以一定的格式输出。信息提取系统不仅是查找信息,而且代替用户理解 信息。如果仅仅利用信息检索系统并不能完成信息提取目标,信息检索只能找出满 足特定查询条件的整篇文档或片段,人们仍然需要阅读找到的文档和片段来获取所 需要的信息。此外,信息提取系统与自动文摘相比,是一个受限的信息处理过程, 要按照预先规定的信息模板来提取,因此信息...

蚂蚁蛋白质的提取
蚂蚁蛋白质的提取 1、相关定义 1.1、PPI提取基本概念 取任务之前,先介绍下信息提取系统。信息提取 系统与信息检索、自动文摘等有实质性的区别,它从指定的文本集中提取用户感兴 趣的信息并以一定的格式输出。信息提取系统不仅是查找信息,而且代替用户理解 信息。如果仅仅利用信息检索系统并不能完成信息提取目标,信息检索只能找出满 足特定查询条件的整篇文档或片段,人们仍然需要阅读找到的文档和片段来获取所 需要的信息。此外,信息提取系统与自动文摘相比,是一个受限的信息处理过程, 要按照预先规定的信息模板来提取,因此信息提取更加注重系统的工程性和可操作 性。 蛋白质相互作用关系及其功能信息的提取是生物学家们非常关心的问题。在生 物体内,每个蛋白质不是单独地完成所赋予的功能,它们通常会与细胞中的其他蛋 白质相互作用形成一个复合体来完成特定的功能,甚至有些蛋白质的功能只有在形 成复合体之后才能显现出来。因此,研究这些相互作用关系和规律之后才能在真正 意义上理解蛋白质功能。虽然研究者们已经建立了一些蛋白质相互作用数据库,但 大量的有关信息仍然以自然语言文本的形式存在于文献中。蛋白质相互作用关系提 取的任务就是实现自动地从生物医学文献中提取出蛋白质相互作用关系,并以结构 化形式描述提取出来的信息,然后存储到数据库中供进一步的研究使用。 在生物医学领域,实体之间的关系特指一个对象作用于另一个对象的行为,或 一个对象与另一 个对象之间的从属关系。例如一种蛋白质对另一种蛋白质的抑制行 为或一种蛋白质与某个蛋白质家族的从属关系等。目前大部分的生物医学关系提取 系统主要是提取特定的命名实体之间的二元关系,例如蛋白质与蛋白质的关系、基 因与基因的关系、蛋白质与疾病的关系等。所以,蛋白质关系提取的任务就是从PPI 语料库中提取存在相互作用的蛋白质实体对。以PPI语料库中的句子”We also found another armadillo-protein, p0071, interacted with PSl”为例,句中 p0071 和 PSl 这两 个蛋白质实体间存在相互作用关系,蛋白质关系提取系统的任务就是准确理解这种 语义并反馈这个事实。 8 t\领士学位 论文 政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载 i/ MASTER?S THESIS 2. 2支撑技术 完整的蛋白质相互作用信息的挖掘过程应该包括五个模块:语料库预处理模 块、蛋白质命名实体识别(Protein Named Entity Recognition)模块、蛋白质相互作 用关系提取模块、蛋白质相互作用注释信息提取模块和蛋白质相互作用网络构建及 可视化模块[,如图232].1所示。目前,大部分研究都集中在命名实体识别和PK[提 取这两个模块上,本文的研究重点是PPI提取。 数据流 ““—I : ;丽I I 语料:文、~?本单元.? ? I~H /”?PPI功能注—(I 丨 一 I 卜-模块 :数据预处理丨 化 I接影响到后面PPI提取系统的性能。 因此,命名实体识别技术在生物文本挖掘中占据重要的地位。 命名实体识别技术的研究起步较早,其在新闻领域的应用中已取得了非常好的 效果,准确率可以达到90%以上,几乎接近人工识别的水平。然而,在生物医学领 域,生物命名实体识别远没有达到这个水平,原因是生物实体不像新闻领域中的实 体具有命名规范(人名)和数量稳定(地名)的 特点,它们具有如下命名特征[32]: 9 额士学位论文 MASTER?S THESIS (1)描述性命名习惯:很多生物实体名称具有描述性,由多个单词组成,名 字很长,难以确定它的边界。 (2)同一实体多种变体:同一个实体可能有多种书写形式,例如:”immuno “globulin和”immuno-globuli”n指的是同一个蛋白质。另夕卜,有些功能 毫不相关的蛋白质可能出现同名的情况。 (3)实体名嵌套:有些实体名字符串可能包含其他生物实体名组成的子串, 例如:”TRKB”和”neurotrophin TRKB “receptor是两个不同的蛋白质 实体名,这种情况下也很难确定蛋白质命名实体的边界。 (4)大量缩写形式:很多生物学家喜欢在文章中用缩写来表示生物命名实 体,并且缩写方法也没有统一的规范,根据习惯的不同一般有以下两种, 一种是使用蛋白质全称中各单词的首字母组合来表示,这种表示方法会 出现不同的生物实体具有相同缩写的问题;另一种是根据单词的音节, 例如蛋白质”irmnunoglobuli”n 的缩写就是”Igl”。 以上这些命名特征使得生物命名实体识别成为一项具有难度和挑战性的任务。 目前,生物命名实体识别方法主要包括以下三种:传统的基于字典的方法、基于规 则的方法和基于机器学习的方法。 基于字典的方法是最早使用的方法,也是最容易想到和最简单的方法。它采用 与字典匹配的方式从文中搜索相同或相似的字符串,从而识别出蛋白质、基因等生 物命名实体。Toiri等人[33]使用生物医学词典来识别蛋白质和基因两类生物实体,其 准确率达到了 88.7%。基于字典的方法简单有效,一般都能找到字典范围内的命名 实体。然而,近年来生物医学的飞速发展使得字典的更新速度赶不上 文献的更新速 度,基于字典的方法无法有效地识别新出现的命名实体,方法的有效性依赖字典的 规模和质量。 基于规则的方法是根据常见的生物实体命名习惯预定义一些规则来匹配文本, 即可识别出生物命名实体。Fuk34uda等人[]采用词形特征和词性特征的规则库来识别 命名实体,系统的综合分类率只有40.7%。基于规则的方法优点是可以根据需要随 时添加新的规则进去,但生物实体命名规则多样化,并且不断涌现出新的形式,很 难列举出所有的命名规则,这需要花费大量的时间和人力。该方法在产生规则的语 料库中效果较好,但可移植性差。另外,有些生物实体(如蛋白质和基因)具有相 似的命名规则,虽然利用规则的方法可以简单地确定实体边界,但却难以进一步判 断其所属类型。 机器学习方法将命名实体识别任务看作词分类问题,其中最重要的一个环节是 10 颂士学位论文 X >y MASTER?S THESIS特征选择,常见的特征有词形特征、词典特征、词性特征等。文本中的每个词都用 这些特征组成的特征向量来表示,然后用分类器来学习]。Li等人[16将识别任务分为 命名实体边界检测和命名实体分类两个子任务,两个子任务都采用了条件随机域 (CRF)方法,其准确率达到了 74.31%。机器学习方法的优势在于不仅可以发现字 典中未包含的实体,而且能够通过上下文语境更准确地判断实体所属类型。但是, 该方法的有效性很大程度上依赖训练语料库的规模和质量,以及特征值的选取。总 体而言,机器学习方法是目前生物命名实体识别的主流方法。 以上几种方法都各有优缺点,现在很多研究都将这三种方法进行一定程度的整 合来提高识别性能。虽然本文实验所使用 的语料库已将蛋白质实体名做了标注,不 需要蛋白质命名实体识别这个步骤,但生物命名实体识别的好坏将从根本上影响 PPI提取系统的性能。 2. 3相关资源及工具 1.2、相似性定义 心理学家认为相似性是存在于两个对象之间的一种关系,是一种心理反应。目前对它的形 32 成机理还不能确定,因此心理学和人工智能的相关研究对相似性并没有严格的定义。相似性的 含义往往通过两个方面来确定,一是通过与其他类似关系的区别来确定,二是通过相似性所具 有的特征来确定。 相关关系是与相似性最难区分的关系。Resnik[44]用轿车、自行车、汽油的事例对这两者之 间存在的区别进行了解释。 “轿车依赖于汽油作为燃料,显然它们之间的相关性比轿车与自行车更为紧密,但人却普 遍认为轿车与自行车之间的相似性大于轿车与汽油。这个例子说明,相关性不能等同于相似性。 即使轿车与汽油是紧密相关的,但由于这两者之间没有共同的特性,人们也不会认为它们是相 似的。而轿车和自行车都是交通工具,都有轮子并且可以载人,因此它们是相似的。” 从这段话的描述中,可以看出,如果两个对象之间存在相似性,那么这两个对象之间必然 有共同的特征和性质。如果说相关性与相似性之间是互斥的关系,也是不成立的,Resnik 认为, 相似性可以被认为是一种特殊的相关性:对象间基于蕴涵关系的相关性。 对象间的相似性常常用对象间的语义距离来度量,两个对象间的语义距离越小,相似性就 越大。 Lin 于 1998 年在 基于信息学理论的基础上给出了相似性的直觉定义[45]。这一直觉定义从对 象之间的共同点和差异性角度出发,考察两个对象之间的相似性。如果两个对象之间的共同点 越多,那么它们的相似性就越大;如果两个对象之间的差异点越多,那么它们的相似性就越小; 如果两个对象之间只存在共同点,那么它们之间的相似性最大;如果两个对象之间只有差异点, 那么它们之间的的相似性最小。 从 Lin 对直觉的定义可以看出,相似性成立的关键是两个对象间有共同点,没有了共同点 相似性也就不存在了,而两个对象间相似性的大小可以通过差异性来反映,差异性可以作为相 似性的补充。 1.3、大豆多肽的概念 肽[peptide]是 α-氨基酸以肽链连接在一起而形成的化合物,它也是蛋白质水解的 中间产物[11]。由两个氨基酸分子脱水缩合而成的化合物叫做二肽,同理类推还有三肽、 四肽、五肽等。通常由 10~100 氨基酸分子脱水缩合而成的化合物叫多肽。它们的分子 量低于 10000Da(Dalton 道尔顿),能透过半透膜,不被三氯乙酸及硫酸铵所沉淀。也 有文献把由 10 以下个氨基酸以下组成的肽称为寡肽(小分子肽);10~50 个氨基酸组成 的肽称为多肽;由 50 个以上的氨基酸组成的肽就称为蛋白质。多肽没有严密并且相对 稳定的空间结构,即其空间结构易变,具有可塑性,蛋白质分子则具有相对严密,比较 稳定的空间结构,多肽和蛋白质都是氨基酸多聚缩合物,而多肽也是蛋白质不完全水解 的产物。 大豆多肽又叫大豆肽,即”肽基大豆蛋白水解物”的简 称,是一种生物活性肽,是大 豆蛋白质经酸、碱、蛋白酶作用,再经特殊处理而得到的蛋白质水解产物。大豆多肽的 必需氨基酸组成与大豆蛋白质完全一样,含量丰富而平衡,且多肽化合物易被人体消化 吸收,并具有防病,治病,调节人体生理机能的作用,大豆多肽是极具潜力的一种功能 性食品基料,已逐渐成为 21 世纪的健康食品。 7 西安科技大学硕士学位论文 1.4、本体的概念提取 流程 快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计 本体的概念语义主要隐含在数据库的实体关系表表名中。然而由于关系数据库表分 为实体表和关联表,并且可能出现多个实体关系表表示的同一个实体、或者不同关系表 之间具有层次关系的情形,因此,不可以把每个关系表一一对应的生成本体概念。本体 概念的提取工作主要根据3.4.1节和3.4.4节的讨论,从以下三个方面入手: 1) 从多个需要合并生成概念的实体关系表中提取一个共同的概念; 2) 从其他不需要合并生成概念的实体关系表中提取概念; 3) 从具有层次关系的实体关系表中提取具有层次关系的子概念。 华南理工大学硕士学位论文 36 图4-2 从关系表提取概念的总流程图 图4-2描述了从关系数据库表提取概念的处理流程,得到以下流程4-1: Tables=所有被待处理的数据库表; while(tables 未遍历完) { A=tables 的下一个表; if(表 A 未生成过本体类) { efkeys=表 A 的所有导出外键; pkeys= 表 A 的所有主键; if(efkeys 的数量大于 0) { 进入多个表合并生成类及具生成具有层次关系的类的处理过程,即图4_3_1中的”X” 节点, 详细处理过程将在流程4-2中说明,流程4-2执行完毕将会从”Z” 节点 返回。 } else { 进入根据实体关系表生成类的处理流程,即图4-2中的”Y”节点,详细处理过程将在 流程4-3中说明,流程4-3将会从”Z”节点返回。 } } } 流程4-1 从关系表提取概念的总流程 1.5、提取与匹配相关概念 3.1.1 特征信息类型3.1.1 特征信息类型 为了建立有效匹配,确定检测哪种类型的特征信息来进行匹配将会直接决定 着三维建模的精度,而在三维特征点云重建中,提取出的特征信息通常都是特征 点。从前期的立体视觉研究开始[29-32],学者们就已经进行着基于特征点的提取与匹 配研究了。点特征可以用来寻找出同一场景不同位置图像的对应位置的稀疏集合, 同时也是计算摄像机内外部参数的基础,摄像机姿态信息对进行立体视觉配准以 及稠密点的配准起着至关重要的作用。因此在进行图像配准或者真实物体建模时, 检测或提取出的图像特征点,应该具有一定的适应能力,即使在出现遮挡问题、 18 旋转变化、大尺度方向的变化时也要能达到鲁棒的匹配效果。 立体匹配是在多幅图像中去建立两两图像之间匹配信息对应关系的过程;广 义上的匹配信息包括几何点元、局部区域以及边缘特征等等,与普通的图像匹配、 图像配准相比而言,立体匹配一般更为复杂,由于立体图像之间的差异主要由照 相机在不同的视角或观察点采集同一场景拍摄所致,而与场景自身的变化运动关 系不大。根据所匹配的信息类型不同,立体匹配又可进一步分为区域匹配和特征 匹配两种类型。区域 匹配是在每个像素确定对应像素,建立稠密的对应关系,由 于该稠密对应场通常呈现出相对规则分布状态,能够直接以像素网格作为区域参 照,而不同像素网格之间的邻近关系简单明了,方便描述并在立体匹配中直接使 用。该方法直接利用了图像的像素值作为匹配特征,通过计算不同图像对应区域 之间在灰度、色差、轮廓、纹理上存在的关联性进行图像区域特征的匹配。 特征匹配[33]是在图像序列中建立比图像像素更少的稀疏特征之间的相互对应 关系,与稠密特征比较而言,稀疏特征的布局区域更不规则,这表示特征间的匹 配关系的描述将变得更为复杂;由于基于特征的匹配算法不同,所利用的特征信 息亦不相同,通常可作为特征信息的包括线段类的直线、边缘线、曲线、局部区 域;特征点类的包括边缘点、角点、拐点、直线交点或者特定区域的中心、重心 等等,当然,由于所使用的特征信息的类别不同,其所匹配后的产生精度差异也 很大。 表 3.1 匹配信息的类型及特点 匹配信息类型 具体内容 匹配复杂度 灰度值 对比度、明暗等 一般 点类 角点、交点、中心点等 较高 线类 直线、边缘线、曲线等 中等 区域类 局部区域、窗口区域等 一般 模型类 精确内部结构 较高 由于不同图像之间的视点变化很大,同一场景在不同的视点下其投影将出现 较大的变化,特别是对于一些倾斜场景图像,此状况尤为严重,在利用基于局部 匹配的算法时更加容易造成错误的匹配,因此就对基于特征点的匹配算法提出了 更多的要求,而 Harris 角点特征检测算法能够应付在图像旋转、灰度变化、视点 变化以及噪声影响情形下的不变性,是一种比较稳定的特征点提取算法。 1.6、本体概念的提取规则研究 从关系数据库里面提取本体概念,主要需要考虑多个表合并生成同一个概念的情况 以及根据单独的实体关系表生成概念的情况两种情况。 1) 多个表合并成同一个概念的情况 由 3.3.1 节分析知道,本体的概念来自实体关系表。当一对一的情形出现时,可能 出现需要把多个实体表合并成生成同一个概念的情况,也就是出现多个实体表相互等价 的情况。 1.7、蛋白质的定义及其特性 定定定义义义义及及及结结构 蛋白质是一种由 DNA 编码的 L 型 α 氨基酸通过 α 碳原子上的氨基和羧基间形成酰 胺键,连接而成肽链,经转译后加工形成的具有特定空间构象和生物功能的生物大分子。 这种生物大分子在三维空间具有特定的复杂而精细的结构,其结构通常分为一级结构、 二级结构、三级结构和四级结构四个层次,蛋白质的二级、三级、四级结构又统称为蛋 白质的空间结构或高级结构[2]。在自然界中存在的蛋白质其结构是具有时间性和空间性 的,并不是单一、固定的平面图形,图 1-1 就给出了立体空间结构的蛋白质模型。 图 1-1 蛋白质结构的立体模型。(a)纤维状蛋白质的二级结构,(b)球状蛋白质的三 级结构,(c)蛋白质四聚体的四级结构。 (a) (b) (c) 东北师范大学硕士学位论文 2 1.1.2 蛋蛋蛋蛋白白白白质质质质的的的性性 质 蛋白质复杂的结构层次和时空特性共同决定了蛋白 质的多功能性,以下仅就蛋白质 的基础性质加以介绍[1]: 蛋白质的两性和等电点。由于与氨基酸相似,蛋白质的侧链上也常含有碱性基团和 酸性基团,所以蛋白质显示具有两性性质(可与强酸,强碱作用生成盐)和等电点(在 一定的 pH 值的溶液中,蛋白质所带的正、负电荷相等,即净电荷为零的偶极离子,在 电场中不向阳极移动,也不向阴极移动,此时溶液的 pH 值称为该蛋白质的等电点。) 与氨基酸类似,在等电点时,蛋白质的溶解度最小,可以通过调节溶液的 pH 值至等电 点,使蛋白质从溶液中分离出来。 蛋白质的胶体性质:蛋白质是大分子化合物,在水溶液中形成直径 1-10 m 的颗粒, 在胶体粒子的直径范围内,并且在其表面有许多 -NH2、-COOH、-OH、-SH 及 -CONH- 等亲水基团,与水分子形成水化层,使颗粒彼此分离,所以蛋白质水溶液具有胶体溶液 的一般特性,不能透过半透膜且具有较强的吸附作用,具有丁铎尔效应(Tyndall),布 朗(Brown)运动等性质。 蛋白质变性:蛋白质受到物理因素(如:加热、高压、强振荡、紫外照射)或化学 因素(如强酸、强碱、重金属盐、乙醇等有机溶剂)的影响时,内部结构发生了变化, 使一些理化性质发生变化,生理活性丧失,这种现象称为蛋白质的变性。蛋白质变性后, 溶解度大为降低,凝固或析出。导致蛋白质变性的原因大致有两方面,一方面是蛋白质 分子中的某些活泼基团与化学试剂发生了反应;另一方面是蛋白质的副键被破坏,原有 的空间结构被改变,疏水基外露。当蛋白质的二级结构被破坏时,它发生的是不可逆变 性;若变性时只是改变了三级结构,则该变性就是可逆的。蛋白质的变性在人们的生产、 生活中并不总是有害的,其对工农业生 产、科学研究还是具有重要意义的。如人们常用 的利用高温和酒精消毒灭菌,其实质就是利用蛋白质的变性使细菌失去生理功能和生物 活性。 蛋白质的颜色反应:蛋白质中含有 20 种氨基酸,其中一些氨基酸可以和多种试剂 产生特殊的显色反应,利用这种颜色反应可以对蛋白质进行定性鉴别。如利用蛋白质与 水合茚三酮反应做纸层析。因为与 α-氨基酸一样,蛋白质具有与水合茚三酮一起加热 会呈现兰色的性质;利用米隆(Millon)反应检验蛋白质中是否含酪氨酸,因为蛋白质 具有遇硝酸汞的溶液时变为红色的性质;同时,蛋白质与硫酸铜碱性溶液反应,呈紫色。 含有芳香族氨基酸,特别是含有酪氨酸,色氨酸残基的蛋白质,遇浓硝酸后会产生白色 沉淀,加热后沉淀变黄色。 1.8、蛋白质组的概念 1994 年,在意大利召开的一次科学大会上由澳大利亚学者威廉姆斯(Keith Williams)和威尔金斯(MarcWilkins)首次提出 “蛋白质组”的概念 [74] 。蛋白质组 是指一种基因组、一种生物或一个细胞(组织)所表达的所有蛋白质总和。因此,蛋 白质组所指的蛋白质数目应该是基因组内所编码的蛋白质的总数。然而,在现实的 生物体内是不存在这样的蛋白质组的,因为植物体内的基因组不可能全部翻译成蛋 白质。列如第一个已知全序列的单细胞酵母的基因组,所能够达表的基因只有 90% 7 左右而不是全部。蛋白质在生物体内被表达时要经过转录水平调控和翻译水平调控 以及翻译后水平调控,此三个水平调控是在 DNA、RNA 到蛋白质的过程中分别起 不同作用。对于信使 RNA 来说,仅包括了转录水平的调控,而并不能代表蛋白质的 表达水平。因此研究蛋白质的表达和功能成为生命科学发展的趋势。随着生物技术 的不断发展,出现了双向电泳和新型质谱技术以及各种先进的生物信息网络,为进 一步研究蛋白质的表达规律提供了理论基础。就在人类基因组研究飞跃的时候,蛋 白质组学的研究便成了新的领域。1995 年 Wasinger 等提出了”蛋白质组学 (Proteomics)”一词 [75] 。标志着蛋白质组学成为生命科学中的一个不可缺少的领域。 蛋白质组学是研究生物体在一定的生理状态下,对体内总蛋白质进行系统研究的科 学,包括蛋白质的特征、数量和功能结构等的研究。 1.9、蛋白质的定义 蛋白质是一种复杂的有机化合物,是生物体最重要的组成成分之一。通常认 为蛋白质是 α 氨基酸通过酰胺键连接而成的长链分子,这一分子的长链也被称为 肽链。但是这样定义蛋白质分子还有若干不严密之处。第一,在自然界存在着许 多种氨基酸,如 ω 氨基已酸,它可以作为单体,也可以通过形成分子间的酰胺 键而成为长链分子,即我们日常生活中的尼龙 6。但是尼龙 6 不可能具有蛋白质 的空间结构,更没有蛋白质的生物活性。第二,一些酸性或碱性的氨基酸,除了 α 氨基和 α 羧基可形成酰胺键外,氨基酸残基侧链上的集团也能形成酰胺键。应 该认为,由 mRNA 转译而成的新生肽链还不能说是蛋白质。转译所得的新生肽 链只有经历一系列转译后的事件才能成为具有特定空间结构、呈现明确生物功能 的蛋白质。因此,对于蛋白质 的一个比较严格的定义应该是:一种由 DNA 编码 的 L 型 α 氨基酸通过 α 碳原子上的氨基和羧基间形成酰胺键,连接而成肽链, 经转译后加工形成的具有特定空间构象和生物功能的生物大分子。当然,有相当 多的蛋白质种除了氨基酸外,还有一些其他的组分,如糖类、脂类、金属和有机 1.10、解空间的模式结构定义 邹鹏 [4]对QAP提出了一种基于近似骨架的解空间结构,解空间I的近似骨架定 义为k个局部最优解的交集: AB(p0,p1,...,pk?1) = p0 ? p1 ? ... ? pk?1,(pi ? n,i ? [0,k ? 1])。 3 第一章 引言 基于解模式的蚂蚁算法在QAP上的应用研究 近似骨架的解空间结构定义还比较简单,并且其效率也不是很高,平均 为73.77%。 本文通过分析解排列的特点和最优解形成的过程,定义了解模式的概念,并将其 应用到蚂蚁算法中,得到了较好的效果。 1.3 研究意意义义 本文的目的是将VNS算法和ACO算法相结合来分析QAP的适应度地形,并在此 基础上提出了解模式的概念,设计了基于解模式的蚂蚁算法,对于提高蚂蚁算法性能 方面做了有益的尝试。说明本文的研究意义主要有以下四个方面: 1.11、副本管理的概念及意义 副本管理是数据网格环境下副本技术最重要的组成部分,它的目标是对所有数据副本 进行有效管理,从而给用户提供高效的透明访问。 通常情况下,数据网格系统会为每个数 据资源建立一个或者多个数据副本,分别存储在不同位置的网格节点上,这种做法带来了 两大好处:第一,数据资源的安全性得到了保证,一旦原始数据发生故障或者暂时性的无 法访问,用户可以转而直接访问该数据的副本资源,同时也可以借助副本来恢复原始数据; 第二,数据的访问效率得到了提高,根据用户对于不同数据资源的需求度,可以将热点数 据拷贝到用户的本地节点或者邻近节点上,这样就缩短了用户的访问时间,减少了访问传 输代价,大大提高了数据的访问效率。在数据网格副本管理系统中,主要的工作模块有: 副本的创建和定位、副本的选择、副本的一致性维护、副本的删除首先,我们先对副 本管理系统中将涉及到的几个基础概念进行以下解释说明: (1)副本:副本就是对于原始数据的拷贝,这些复制出来的副本必须在副本目录中进 行注册,与原始数据进行一对多映射。当原始数据或者某一个副本被修改时,其他的副本 数据也要统一进行修改,来保持数据资源的一致性。副本的创建操作以及它的地理位置对 于用户来说是透明的,也就是说,用户是可以在不清楚准确的位置信息的情况下直接访问 数据副本的。 (2)主副本:由于数据网格环境下的数据都是离散分布存储在不同位置的节点上,而 且数据量非常大,所以理论上的副本一致性维护往往无法控制,主副本的定义解决了这一 难题。在副本管理中,通常设有多个主副本,为对副本进行一致性维护的时候,只要保证 所有的主副本之间的一致性即可。 (3)从副本:从副本的定义是相对于主副本而谈的,所有的副本中,除了主副本的其 他副本即是从副本。 (4)物理数据名:物理数据名是 存储管理系统使用的数据名称,代表的是副本在存储 系统中所处的位置。 (5)逻辑数据名:逻辑数据名是副本在数据网格环境中的全局标识符,它是唯一的。 根据副本的逻辑数据名,可以在副本目录中找到与之相对应的所有副本的物理数据名,也 就是可以映射到某个数据的副本们分别存储在哪些物理位置节点上。 (6)副本目录:副本目里主要是用来存储副本的逻辑数据名和物理数据名之间的映射 关系,可以根据逻辑数据名在副本目录中找到其所有副本的物理数据名。 12 第二章数据网格环境下的副本管理 1.12、标准蚂蚁算法的基本概念 在论述标准蚂蚁算法之前,定义一些变量。蚂蚁算法中的人工蚂蚁有别于真 实蚂蚁,采用信息素来替代外激素一词。 定义 2.1 在蚂蚁外出觅食的过程中,路径上边的信息素浓度τ ,其中τ ij 表示 从结点i 到结点j 的信息素浓度,且有 τ τ ?????iijj => 00 ii =? jj (2.1) 定义 2.2 在蚂蚁外出觅食的过程中,路径上结点的可见度η ,其中η ij 表示结 点i 到结点j 的可见度,且有 5 η η ?????iijj == 10 / d ij ii ?= jj (2.2) 定义 2.3 在蚂蚁外出觅食的过程中,路径上边的可访度 λ ,其中λ iu 表示蚂蚁 的从结点i 出发到未访问列表中结点u 的可访度, ( ) λiu= ??τ iu ??α ? ?? ηiu ?? β , u ? AntVisited k ,i (2.3) 式中α 表示路径上的信息素浓度对结点的可访度的影响指数,其中 β 表示结 点的可见度对可访度的影响指数,u? AntVisited (k ,i ) ,表示结点u 不属于第 k 只蚂蚁在造访结点i 后的已经访问列表,即u 属于未访问的结点列表。 定义 2.4 在蚂蚁外出觅食的过程中,路径上边的可访度概率 p ,其中p ikj 表示 第 k 只蚂蚁从结点i 出发选择下一个结点j 的概率,有 (, ) ij AntVisiil k ij l ted k i p= ?? λ λ (2.4) 标准蚂蚁算法的三个关键策略:下一个结点的选择策略、信息素的局部更新 策略和全局更新策略。 一、下一个结点的选择策略 蚂蚁构造可行解的过程是实施 N 步下一个结点的选择策略的过程。首先需要 确定起点,通常采用指定起点或者随机起点的方式。 迈出第一步以前,首先要初始化信息素矩阵,采用最近邻域法求得当前最优 路径T+,计算得路径值 L+,定义初始信息素浓度均为τ 0 ,有τ 0= 1/ L+ 。引进一个 比例选择参数q 0 (0 (2.5) 二、信息素的局部更新策略 在蚂蚁迈出一步以后,路径上边的信息素会更新变化。信息素的变化分为两 部分,一个是信息素会随着时间而挥发,二个是蚂蚁经过后会对在路径上释放一 定的信息素。 τij(t+1 ) = (1 ? ρ ) ? τ ij (t ) + ρ ? ?τ ij (2.6) ?τ =? ? τ0 k ij ij k a (2.7) 6 其中τ (0 )= τ0 = 1/ L+ , L+ 为当前求得的最优路径长度。当第 k 只蚂蚁从结点 i 访问结点 j,则α ikj 为 1,否则为 0。ρ 则表示信息素的挥发度。 三、信息素的全局更新策略 当蚂蚁外出觅食归巢以后,为了强化当前最优路径,采用了最优路径强化, 较差路径弱化的策略。在蚂蚁算法中,只有构成当前全局最优路径的那些边上的 信息素才能得到增强,其它边上的信息素浓度都会削弱。经过若干次外出觅食之 后,那些最优路径会逐渐被强化,从而加快收敛的速度。 τij(t+1 ) = (1 ? ρ ) ? τ ij (t ) + ρ ? ?τ ij (2.8) 0 k ij ij k ?τ =?b ? τ (2.9) 其中τ (0 )= τ0 = 1/ L+ , L+ 为当前求得的最优路径长度。假若第 k 只蚂蚁搜索到 了当前最优值, 第 k 只蚂蚁从结点 i 访问结点 j,则b ikj 为 1,否则为 0。式中 ρ 表 示信息素的挥发度。 2、相关背景 2.1、课题研究背景 1.1.1 蚕豆简介 蚕豆,学名 Vicia Faba L, 一般认为起源于亚洲西南部、中部和亚洲北部。汉代 自西域传入我国。在世界上 40 多个国家都有种植,其中亚洲的种植面积最大。我国 地域辽阔,生态环境复杂,栽培的蚕豆品种很多,分布也非常广泛,栽培面积和产量 均居世界首位。我国栽培的主要是冬蚕豆,以四川、云南、湖北、湖南、安徽、江苏、 及浙江为最多;广西、福建及贵州等省自治区次之;春蚕豆面积较少,主要分布在甘 肃、青海、宁夏等省自治区。据联合国粮农组织(FAO)2010 年统计数据,全世界蚕 豆种植面积 3720 万亩,总产量 368 万吨。其中,中国蚕豆种植面积 1323 万亩,总产 量 140 万吨,分别占世界种植面积和总产量的 35.6%和 38.0%[1]。 蚕豆含有多种营养物质。蚕豆中蛋白质含量较高,每 100 克蚕豆含有蛋白质约 21-42 克,它是豆类中蛋白含量仅次于大豆的高蛋白作物。淀粉是蚕豆籽粒中含量最 丰富的一类碳水化合物,占籽粒质量的 40%-50%左右,其中直链淀粉含量高,占淀粉 总量的 37%-47%[2]。粗纤维含量达 8-10%,大部分存在于种皮中。据报道,蚕豆膳食 纤维中可溶性部分与不溶性部分比例比较均衡,可有效地降低血糖及血清胆固醇,促 进肠道蠕动 [3,4]。蚕豆中富含硫氨素、核黄素和尼克酸。硫胺素、核黄素含量均高于禾 谷类或某些动物食品,被视为维生素 B1 的最佳来源。蚕豆中钙、磷、铁、锌等矿物 质的含量较高,钠含量低,其是人体矿物元素的重要来源。蚕豆中的钙,有利于骨骼 对钙的吸收与钙化,能促进人体骨骼的生长发育。蚕豆含有丰富的磷脂和胆碱,具有 增强记忆力的健脑作用,因此适当进食蚕豆对脑力工作者有一定的益处[5]。蚕豆中脂 肪含量较低(l.5%),主要脂肪酸为亚油酸、亚麻酸、油酸及软脂酸,其不饱和脂肪酸 含量高于饱和脂肪酸,比动物脂和乳脂要好[6]。蚕豆籽粒中存在多种抗营养成分,如蚕 豆种皮含有单宁,植物血细胞凝集素,蛋白酶抑制剂,植酸,致甲状腺肿素等,这些 成分在一定程度上影响了蚕豆食品的普及,使得蚕豆蛋白质的生物价低于动物性蛋 白。人食用蚕豆后,由于体内缺乏分解棉子糖等低聚糖的酶,易产生胀气等症状。但 是食用之前的去皮、浸泡、蒸煮、发芽和发酵等处理,基本可以完全抑制或去除这些 不利因素,提高蚕豆的营养价值。 2.2、课题研究的背景和意义 我国是蚕豆生产大国,但不是蚕豆利用强国。蚕豆蛋白质可广泛应用于肉制品、 乳制品、面制品等食品领域,提高食品的营养价值、产品质量和企业的经济效益。在 国内,蚕豆主要用作蔬菜、饲料,对于蚕豆的深加工和综合利用还处于起步阶段,加工 主要以初级加工为主,包括传统的蒸煮食品、豆芽、发酵制品、休闲油炸食品等,而 大部分蚕豆用于生产粉丝,这仅仅利用了其中 55%左右的淀粉,而蚕豆中 27%左右的 蛋白质却被混入粉丝废水中被排掉。这样,宝贵的蛋白质资源不仅得不到充分利用, 反而对环境造成严重污染。因此,大规模的生产蚕豆蛋白质可进一步打开其在食品工 业中的应用,使得蚕豆蛋白质成为功能性蛋白质的良好经济来源。为了解决这一问题, 对蚕豆的系统研究和蚕豆蛋白质产品开发势在必行。 蚕豆可以为人类提供所需的植物蛋白质来源,尤其与谷物食品一起食用。但是它 的营养价值因为一些抗营养素,如植物凝集素、植酸和蛋白酶抑制剂等的存在而有所 减小。而一些合理的处理方法可以很好地改善其消化性和营养价值,如热处理、发酵 和酶水解等。而水解蚕豆蛋白质,获得营养价值更高的蚕豆蛋白肽,在食品研究和开 发领域有着广泛的前景。 为了能够充分、合理、高效的利用蚕豆资源,丰富植物蛋白资源,本课题利用等 电点沉淀法提取得到纯度较高的蚕豆蛋白质,一方面对其特性进行研究,另一方面利 用水解的方法得到的蚕豆蛋白肽,并初步探索蚕豆蛋白质在肉制品中的应用。因此, 本课题对蚕豆蛋白质的研究具有一定的理论和现实意义。 2.3、立题背景及意义 目前,蛋白质的辅助分离方法主要是化学提取法和机械破壁法,但前者会造成一 些营养成分的破坏;后者效率低,耗能大;同时两种那个方法都会使得蛋白质的功能 性质受到很大影响。酶解法可以使蛋白质分解成较易吸收利用的氨基酸等小分子物 质;高压脉冲电场可以击穿细胞膜,使细胞内物质渗透到细胞外,从而增加了提取率。 因而, 通过调节电场参数后的高压脉冲电场辅助酶法提取鲍鱼内脏蛋白质,一方面可 以有效的提取氨基酸等各种生物小分子并增加提取率;另一方面温和的高压脉冲电场 可改善或者保持其功能性质,如溶解性,起泡性、乳化性、黏度等。 10 福建农林大学硕士学位论文 PEF 对鲍鱼内脏蛋白水解及其性质变化影响的研究 鲍鱼内脏作为鲍鱼加工中的一个副产物,含有丰富的蛋白质和其他多种营养组 分,也具有十分广阔的开发利用前景。随着近些年鲍鱼养殖业的迅速发展,对鲍鱼内 脏的开发利用将会成为鲍鱼加工中一个重要的辅助分支,如多糖提取,天然海鲜调味 品生产等。这一方面将会促进鲍鱼加工的健康发展,减少环境污染;另一方面,对增 加企业经济效益和社会效益都有很重大的意义。 通过对文献的收集、查阅、研读,发现国内外有许多关于酶解水产品加工下脚 料的研究,进而开发成海鲜调味品。而以鲍鱼内脏为酶解原料提取其蛋白质开发成海 鲜调味品的研究开展较少。关于鲍鱼内脏的研究报道有 4 篇都是关于鲍鱼内脏多糖的 研究。因此,本文在鲍鱼内脏的酶解利用方面做比较系统的研究,为将鲍鱼内脏开发 成海鲜调味品提供理论参考依据。 另外,通过查阅参考文献发现目前关于 PEF 的研究缺乏对蛋白质大分子功能性 质的了解,更不用说 PEF 对鲍鱼内脏蛋白结构和功能性质的影响。因此,本课题通 过 PEF 辅助提取鲍鱼内脏蛋白质结构和功能性质的研究,可以丰富 PEF 对食品组分 蛋白质结构和功能影响了解,进一步推动理论的发展。 2.4、研究背景 速发展,对于各家电商企业来说存在着成千上万的活跃用户,产 生的各类数据更是不可计数。由于各电商内部的运营流程限制,多数企业只能对这些数 据做些基本处理,更多的数据没有进行深层利用,数据在电商企业中没有发挥出提高效 率降低成本这样的作用。 数据挖掘是从数据中提取有价值信息的一种方法。技术包括模式挖掘,发现趋势, 预测。数据挖掘在以下方面起着重要的作用: 产品搜索。当用户搜索一个产品,通常情况下,用户查询几个关键词可以搭配很多 产品。其中的一个原因是用于产品排名的是用户的点击率、产品销售率,这些数据表明 一个产品页面的普及。此外,用户行为的数据给我们一个查询到产品页面视图的链接, 以及购买事件的所有方式。通过对查询日志大规模的数据分析,我们可以创建查询和产 品之间的联系图。我们还可以挖掘数据理解用户的查询意图。当一个用户搜索”本田思 域”,他们正在寻找一个新的汽车,或是修理汽车的零部件?查询意图检测来自理解用 户、其他用户的搜索、查询词的语义等。 产品推荐。推荐类似产品是数据挖掘的一个重要组成部分,一个好的产品推荐可以 节省搜索时间和取悦我们的用户。典型的推荐系统是建立在”协同过滤”的原则,这里聚 集了很多相似的选择,过去的购买用户可以为当前用户提出建议。发现项目相似性需要 了解产品属性,价格范围,用户购买模式和产品类别。数据挖掘提供了工具来解决这个 问题。 欺诈检测。所有的电子商务企业面临的一个问题是系统的滥用,在某些情况下表现 为欺诈。例如,卖家可能故意利用错误的类别列表中的一个 产品来吸引用户的注意,或 出售的项目不是卖家所描述的。零售商面对使用偷来的信用卡购物或注册新用户帐户的 用户的问题。欺诈检测包括在线活动的持续监控,自动触发内部报警。数据挖掘利用统 计分析和机器学习技术的”异常检测”,即检测一个数据序列的异常模式。检测卖方欺诈 需要挖掘卖方的档案数据、项目类别、上市价格和拍卖活动。通过结合所有这些数据, 1 可以实时快速检测。 商业智能。每个公司都需要了解其业务操作,库存和销售模式。库存智能要求我们 使用数据挖掘处理物品并将它们映射到正确的产品类别。这包括文本挖掘,自然语言理 解和机器学习技术。成功的库存分类还可以帮助我们提供更好的搜索体验,给用户最相 关的产品[1]。 我们看到数据挖掘及其在电子商务网站的巨大潜力以及日益增长的需要。一个电子 商务企业的成功是由它提供给其用户的信息来决定,这些都是与数据的理解密切相关。 2.5、立题背景 所需的全部营养物质,是很好的药食同源食品。自然界 中含有丰富的多糖,来源种类多种多样,多糖也是构成生命活动的基本物质之 一。”多糖是生命科学家研究的热点,具有复杂的、多种多样的生物活性,已从 天然产物中分离出 300 多种糖类化合物”[1]。 我国的玉米产量居全球第二位,种植面积广泛,全国各地皆适宜种植玉米。 蛋白质、氨基酸、维生素,矿物质元素,芦丁、玉米素、肌醇等[2]构成了玉米 花粉的营养物质,这些是生命有机体所必须的营养物质,也使得玉 米花粉表现 出多种生物活性。鉴于玉米花粉的营养性、功能性、经济性特点,已进行相关 玉米花粉的研究和产品开发,同时也为开发玉米花粉防辐射保健食品提供了一 定前景。 市场上的多糖产品有香菇多糖、黄芪多糖、人参多糖等[3],而玉米花粉多 糖产品在市场却非常少见,主要原因是玉米花粉多糖的研究比较浅显和单一, 己取得的研究成果还没有应用到多糖的实际工业化生产中,这就成为限制玉米 花粉多糖大规模工业化生产的技术瓶颈[4]。 玉米花粉多糖(PPM)的报道主要有免疫活性、抗菌、抗肿瘤等领域,而 关于玉米花粉多糖辐射防护功能研究方面的报道甚少[5]。因此,本课题以此为 切入点,开展玉米花粉多糖辐射防护作用方面的研究。 2.6、背景 生物质能的特点 生物质能源是植物通过光合作用而固定于地球上的太阳能。经由光合作用生 物质利用空气中的二氧化碳和土壤中的水,将吸收的太阳能转换为碳水化合物和 氧气[1],其作用过程如下: xCO2 yH2O 植物光合作用 Cx(H2O)y XO2 相比化石燃料而言,生物质具有以下几个特点[2-6]: (1)生物质利用过程中二氧化碳的零排放特性从生物质的生成过程显然可见, 生物质利用中 CO2循环如图 1.1 所示。 (2)生物质是一种清洁的低碳燃料,其含硫和含氮都较低,同时灰份含量也很 小,燃烧后 SOx,NOx和灰尘排放量比化石燃料小的多,是一种清洁的燃料。 (3)生物质资源分布广,产量大,转化方式多种多样。 (4)生物质单位质量热值较低,而且一般生物质中水分含量大 而影响了生物质 的燃烧和热裂解特性。 (5)生物质的分布比较分散,收集运输和预处理的成本较高。 (6)可再生性。 图 1.1 生物质能利用二氧化碳零排放的原理[7] 1.1.2 生物质能开发利用的意义 当今社会面临着环境与发展的双重压力。能源是人类社会进步最为重要的物 质基础,纵观人类几千年的文明史,能源结构的重大变革导致了人类社会的巨大 2 进步,国民生产总值的增长始终与能源消费同步增长。石油将在21世纪枯竭,新 的能源结构将在新的世纪中形成[8,9]。可以想象,未来的能源结构将与过去不同, 多种能源并存的能源体系将成为新世纪能源结构的特征,生物质能源极有可能成 为21世纪的主要能源之一。自20世纪70年代以来,人们对石油煤炭天然气的贮量 和可开采时限作过种种的估算与推测几乎都得出一致结论——21世纪化石燃料中 有的将被开采殆尽,有的因开采成本高以及开发使用导致的一系列环境问题而失 去开采价值。地质学家早已明确指出:石油耗竭之日已为期不远了。现在,尽管 地质学家和经济学家们在激烈地争论石油开始匮乏的时间,但无论如何,化石燃 料终将耗尽却是无可争辩的事实(参见表1.1)[10,11]”居安思危”,开发替代能源非常必 要和迫切。 表1.1 非可再生资源占全球能耗比例及可用年限 生物质能源是仅次于煤、石油、天然气的第四大能源,是人类生存和发展的 重要能源之一。在世界能源消耗中,生物质能占总消耗量的 14%,发达国家能源 消耗有 40%来自生物质能源[2, 12]。生物质能的转化利用在整个新能源和可再生能源 中具有相当重要的地位。 另一方面,随着社会经济的加速发展,人类对能源的需求量越来越大,以煤 和石油等化 石燃料为主的世界能源结构,在燃烧利用过程中排放出的有害物质也 相应加速增长,从而造成了越来越严重的全球环境问题。由于能源利用和其它污 染物大量排放,环境污染问题己经成为我国可持续发展的重要制约因素。 生物质能作为一种清洁的低碳燃料,其硫和氮含量均较低,同时灰分份额也 很小,所以燃烧后 SO2、NOx和灰尘排放量比化石燃料小得多[13]。是可再生资源中 理想的清洁燃料之一。同时,大气中的 CO2 和地面上的水经光合作用产生用来形 成生物质的碳水化合物,如将生物质燃烧利用,则大气中的氧和生物质的碳相互 作用生成 CO2 和水,这个过程是循环的,故而生物质同时是一种可再生资源,可 视为取之不尽的永久能源[14],其利用过程中没有增加大气中 CO2 的含量,从而实 现零排放[15],为缓解”温室效应”做出了重要贡献。 世界各国在调整本国能源发展战略中,已把高效利用生物质能摆在技术开发 3 的一个重要地位,作为能源利用中的重要课题。生物质能利用技术和化石燃料的 利用方式具有很大的兼容性,因此以生物质作为原料经过能量转换制造高品位的 气体燃料和液体燃料,不但可以弥补化石燃料的不足,缓解过分依赖大量进口石 油的被动局面,实现我国能源安全战略,而且达到保护生态环境的目的。如何高 效开发利用包括薪炭林在内的生物质能,将可再生的生物质能转化为洁净的高品 位气体和液体燃料作为化石燃料的替代能源用于电力,交通运输,城市煤气等方 面,使人类摆脱对有限的化石燃料资源的依赖,大幅度减低大气污染物及温室气 体的排放量,这个问题已经历史地摆在我们面前。因此,科学地利用生物质能源, 加强应用基础理论, 应用工程技术的研究,具有十分重要的意义。 2.7、蛋白质热稳定性研究背景 在这一章中,我们对有关蛋白质的基础知识做一些简单的介绍。生物体是由多 种复杂成分组成的,其中有许多的有机分子和金属、非金属离子,也有各种各样的 生物大分子,如多糖、脂质、蛋白质、核酸和生物膜。但是蛋白质和核酸的作用最 重要。蛋白质在生物体的生命活动中起着重要的作用,可以说,几乎在所有的生命 过程中都起着关键的作用。专一性的酶蛋白高效地催化生命过程所需要的各种化学 反应;运动蛋白利用化学能实现机体灵活而精巧的机械运动;输运蛋白实现生命体 内的物质循环,把各种有用的成分物质运到机体需要的地方;蛋白质还通过与生物 体内的其它成分(例如核酸、多糖和脂类等)结合,实现生物信号的转录、翻译、表 达、识别和传递等多种复杂的调控机能。因此,蛋白质是生命现象的基础[1, 2]。 2.8、技术背景 可重构计算技术是算法加速器设计的基础,FPGA 是目前应用最广泛的通用可 重构器件[7],是可重构计算技术应用的重要平台。本节首先介绍可重构计算技术的 基本概念,然后介绍 FPGA 的结构和特点,最后对实验中用到的基于 FPGA 的加 速器设计平台进行介绍。 2.9、知识背景 检测技术的研究进展1.1.1 入侵检测技术的研究进展 入侵检测由 Anderson 最早在 1980 年提出,他首先提出了安全威胁模型,将外 部闯入、内部授权用户的越权使用和滥用等三种类型定义为入侵行为,并提出了 入侵检测的概念。定义入侵为”入侵时致使系统不可靠或无法使用的企图,潜在 的、有预谋的、未经授权的访问操作”[1]。Denning[2]首次在 1987 年提出入侵检测 的抽象模型,将入侵检测作为计算机系统安全的防御措施,这对入侵检测系统的 发展具有重要现实意义。1988 年,Teresa Lunt 等人[3]在 Denning 提出的入侵检测 模型基础上做了进一步改进,提出了与系统平台无关的实时检测 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,并创建了 用于对单一主机的入侵检测 IDES(Intrusion Detection Expert System),并在 1995 年 开发了可以用于在多个主机上进行入侵检测的 IDES 完善版本——新一代入侵检 测专家系统 NIDES[4]。在 1988 年美国政府和军方为美国国家计算机安全中心开发 了 Unisys 大型主机使用的 Haystack[5]系统和 Multics 主机使用的 Multics 入侵检测 和预警系统 MIDAS[6];1989 年,LosAlamos 美国国家实验室开发了 W&S 系统[7], Planning Research 公司开发了信息安全助手 ISOA[8]系统;1991年,NADIR(Network Anomaly Detection and Intrusion Reporter)[9]与分布式入侵检测 DIDS(Distribute Intrusion Detection System)[10]提出了通过收集和合并处理来自多个主机的审计信 息,以实现对一系列主机协同攻击检测的方法。1990 年,Heberlein[11]等通过在局 域网上主动地监视网络信息来检测入侵提出了第一个基于网络的入侵检测系统 NSM(Network Security Monitor),此后入侵检测系统分为基于主机和基于网络两 种。1991 年,Heberlein 将 NSM 进一步发展为分布式入侵检测系统[12]。1992 年提 出了基于状态转换分析的入侵检测方法 STAT[13]。1994 年,Mark Crosbie 和 Gene Spaford[14]提出了基于自治代理的入侵检测系统框架 AAFID,进一步提高 IDS 的可 伸缩性、可维护性和容错性。SS Chen 等于 1996 年提出了基于图的入侵检测系统 1 南昌航空大学硕士学位论文 第 1 章 绪论 GRIDS(Graph-based Intrusion Detection System)[15-16],该系统部分地解决了入侵 检测系统伸缩性不足的问题,使得对大规模自动或协同攻击的检测更为快捷。P Porras 于 1997 年提出了入侵检测系统 Emerld[17]。1998 年,Forrest 等提出了基于 计算机免疫学的入侵检测系统[18],将生物免疫原理运用到分布式入侵检测领域; Ross Anderson 和 Abida Khattak 将信息检索技术引进到入侵检测[19];Jake Ryan 提 出了基于神经网络的入侵检测系统 NNID[20];同年,美国伯克利大学成功开发了基 于网络的实时入侵检测系统框架 Bro 系统[21],第一个开放源码的入侵检测工具 Snort 面世;W lee 等人也在这一年首次将数据挖掘引入入侵检测[22],通过对审计 数据采用数据挖掘进行处理的方法,提高检测系统的可扩展性和准确度,此后基 于数据挖掘的入侵检测技术得到了长足的发展[23-25]。2000 年,Cheung 等人将容错 技术引入入侵检测,提出了入侵容忍(Intrusion Tolerance)的概念[26],扩充先前入 侵检测的功能,使系统在不改变现有网络基础设施的前提下不仅能检测到可疑行 为,而且能够进行系 统诊断,查知网络组件的操作错误、违反安全策略的行为, 存储操作状态,并自动阻止攻击行为的扩散,即把检测仅作为整个控制环节中的 一个部分。同时模糊技术和遗传算法也出现在有关入侵检测的文献中[27-30]。2001 年,一种无指导的入侵检测方法[31]由 L Portnoy 提出,该方法不需要任何先验知 识,在未标记的数据上训练模型并检测入侵,可检测新的、未知入侵。针对现有 入侵检测系统触发警报量大的现状,2002 年,K Julisch 和 O Dain 等提出了识别入 侵警报根源的技术[32-34],同年研究者们还提出了基于文本分类的入侵检测技术 [35-36]。 入侵检测系统就是通过分析系统安全相关数据对入侵活动进行检测的系统 [37]。总体说来,入侵检测系统在功能结构上基本一致,均由数据采集、数据分析 以及数据分析响应等几个功能模块组成,只是具体的入侵检测系统在分析数据、 采集数据的方法以及采集数据的类型等方面有所不同。从入侵检测的策略来看, 入侵检测分为异常检测(anomaly detection)和误用检测(misuse detection)两种。误用 检测,也称基于特征的检测(signature-based detection),是根据与已知攻击特征进行 比对匹配来识别入侵的。入侵者常常利用系统和应用软件中的弱点来实施攻击, 系统将这些弱点特征编成某种模式库,如果入侵者的攻击方式正好与检测系统的 模式库中的某些模式匹配,则认为有入侵行为发生。这种方法的优点是对已知攻 击检测率 DR (detection rate)高,误警率 FR(false rate)低,可以有针对性地建立高效 的入侵检测系统。缺点是对未知的入侵活动或已知入侵活动的变异检测能力不足, 需要不断更新知识库,攻击特征提取困难,且知识库的更 新较新攻击的出现有一 定的时延。异常检测又称为基于行为的检测,根据与已知正常行为模式的偏离程 2 南昌航空大学硕士学位论文 第 1 章 绪论 度来识别入侵,其前提是假定所以入侵行为都有区别于正常行为的异常特征。由 于不依赖于对已知入侵的掌握,与系统相对无关,通用性较强,不受已知知识的 限制,因而,它最大的优点是有可能检测出以前从未出现过的未知新攻击行为。 它的缺点是误警率较高,而检测率较低。从时效性来看,可以分为离散检测和在 线检测两种。离散检测属于非实时检测,它在事后分析审核事件,从中检查入侵 活动。在线检测是实时检测,包括对网络数据包的实时分析和主机上活动进程的 实时分析,对系统资源的要求比较高。 基于异常的入侵检测其关键问题主要有:首先是建立正常使用模式(normal usage profile),其次是如何利用该模式对当前系统或用户行为进行比较(即系统特 征量以及阈值的选取)。从而判断出与正常模式的偏离程度,模型应随着系统的运 行动态调整,否则攻击者可以训练模型,达到攻击的目的。 入侵检测技术经过 30 多年的发展,取得了许多成果,然而到今天,面对层出 不穷、变化多端的攻击仍然显得不太成熟,需要不断完善现有的技术,进行新的 思路、技术的研究。 目前在 IDS 研究领域的主要研究方向包括 IDS 的性能评价、IDS 集成中通用 的通讯格式、面向大规模分布式网络的 IDS 框架[38]以及采用一些最新的智能技术 来识别新型未知攻击[39]等等方面。随着网络技术的发展和攻击方法的多样化、复 杂化,导致现有检测方法存在较高的误警率和漏报率,相应地对入侵检测技术提 出了更高的要求。数据挖掘、神经网路、 遗传算法、支持向量机、智能体等各种 智能化方法广泛应用到入侵检测研究中,这使得入侵检测技术的学习能力、自适 应能力不断增强,进一步提高识别新型未知攻击的能力,降低入侵检测误警率和 漏报率,为 IDS 研究提供了好的方向。 2.10、-- TSP 问题的研究背景 esman problem)是组合优化领域中一个著名的经典问题,迄今尚未彻底解决,现 已被归入NP-完全问题类,其可能的路径数目与城市数目是成指数型增长的,所以一般很难精确地求出 其最优解。其一般提法为:有一旅行推销员欲往n个城市推销货物,从城市 1 出发,经过其余各城市至 少一次,然后回到城市 1,问应选择怎样的行走路线,才能使总行程最短(各城市间距离dij为已知)。 TSP 问题已被证明为 NP-完全问题。这意味着: 1.任何 NP-完全问题都不能用任何已知的多项式算法求解。这类问题随着规模的扩大,会遇到组合 爆炸的问题。 2.若任何一个 NP-完全问题有多项式算法,则一切的 NP-完全问题都有多项式算法。 尽管现在计算机的计算速度大大提高,而且已有一些指数级的算法可精确地求解旅行商问题,但随 着它们在大规模问题上的失效(组合爆炸),人们退而求其次,转向寻找近似算法或启发式算法,经过 几十年的努力,取得了一定的进展。目前,一般来说,一万个城市以下的旅行商问题基本可用近似算法 在合理的时间内求得可接受的误差小于 1%近似解或最优解。 2.11、研究背景 线网络的束缚、随时随地进行自由通信的渴望,近 几年来无线移动网络通信得到了迅速地发展。常见的移动网络通常是以蜂 窝网络或无线局域网等形式出现的,这些移动网络和无线通信技术是对固 定有线网络的补充和发展,它们需要固定基础设施的支持,并且一般采用 集中式的控制方式。但是在某些特殊环境或紧急情况下,没有固定基础设 施,或者是有中心的移动通信技术并不能胜任,如战场上部队快速展开或 推进、发生地震等自然灾害后的搜索和营救以及野外考察等。因此在以上 场合中迫切需要一种不依赖基础设施、能够快速和灵活配置的移动通信网 络技术,移动自组网(Mobile Ad Hoc Network, MANET)就是为满足这种特殊 应用需求而产生的。 1.1.1 移动自组网概述 移动自组网可以看作是移动通信和计算机网络的交叉,它是由一组带 有无线收发装置的移动终端组成的一个多跳的临时性自治系统[1],是一种点 对点的对等式网络,不需要基础设施的自创造、自组织和自管理的无中心 分布控制网络。移动自组网中的移动终端具有路由功能,可以通过无线连 接构成任意的网络拓扑,既可以独立工作,也可以与 Internet 或蜂窝无线网 络连接。移动自组网组网方便、快捷,不受时间和空间限制,作为现有网 络的一种补充和扩展,主要应用在没有网络基础设施支持的环境中或现有 网络不能满足移动性、机动性等要求的情况,如移动会议、紧急服务、军 事无线通信、个域网络等。 目前,研究者已在移动自组网领域中的地址接入问题、路由问题、组 播路由问题、电能管理问题、QoS(Quality of Service)问题、 安全问题、传输 2 层问题等方面发布了相关的研究成果[2]。在众多的难题中,组播技术,即一 对多和多对多的信息交互技术,作为通讯网络中的重要功能,在移动自组 网的适用场合中得到了广泛的应用,具有很高的研究及实用价值。 1.1.2 组播技术概述 最近几年来,随着计算机技术和 Internet 技术的飞速发展,许多新的应 用层出不穷,其中不少是高带宽的多媒体应用,如网络视频会议、网络音 频/视频广播、多媒体远程教育、远程会诊、软件或代理缓存更新等。这就 带来了带宽的急剧消耗和网络拥塞问题,为了缓解网络瓶颈的影响,人们 提出了各种方案,如增加互连带宽、服务器的分散与集群、应用 QoS、采 用组播技术等。相比较而言,组播技术有其独特的优越性。 组播技术是一种从单个发送端同时传输数据到多个接收端的有效传输 手段[3],与使用多个单播连接相比,组播可以大大减小数据源和网络的传输 代价。在组播网络中,即使用户数量成倍增长,主干带宽也不需要随之增 加,这个优点使它成为当前有线和无线网络技术中的研究热点之一。 在带宽受限和能量受限的移动自组网网络环境中,使用组播技术可以 提高移动自组网的性能,减少传输开销和能源的消耗[4]。同时,在典型的移 动自组网应用中,工作在一个组的网络主机共同完成给定的任务,如军事 上对人员、装备的指挥与控制、在线游戏、交通管理等。因此组播作为有 效的组计算和组通信技术,在移动自组网中具有重要的研究价值。 由于移动自组网自身的特点,组播技术在移动自组网中的实现受到了 极大的挑战[5,6]。现有的专门为固定有线网络设计的组播路由技术,因节点 的移动和拓扑频繁改变而不能有效 地应用于该领域中。因此移动自组网组 播实现的关键问题,即组播路由算法或 协议 离婚协议模板下载合伙人协议 下载渠道分销协议免费下载敬业协议下载授课协议下载 ,需要进一步地深入研究。 1.1.3 蚂蚁算法概述 在 20 世纪 90 年代,意大利学者 M.Dorigo 等人从生物进化的机理中受 到启发,通过模拟自然界蚂蚁觅食的行为,提出了一种全新的仿生进化算 法:蚂蚁算法(Ant Algorithm, AA),又称为蚁群算法[7]。 3 蚁群有能力在没有任何提示的情况下找到达到食物的最短路径,并能 随环境的变化而变化,适应性地搜索新的路径,产生新的选择。其根本原 因是蚂蚁在寻找食物的过程中,能够在它所经过的路径上留下一种称为信 息素(Pheromone)的物质,后来的蚂蚁选择某路径的概率与该路径上信息素 的强度成正比。当某一路径上通过的蚂蚁数越来越多时,其留下的信息素 强度也越来越强,后来的蚂蚁选择该路径的概率就越来越高,从而更增加 了该路径上的信息素强度,吸引更多的蚂蚁,形成了一种正反馈机制。通 过这种正反馈和自学习的机制,蚁群最终会发现最短路径。不仅如此,蚂 蚁还能够适应环境的变化,当蚁群运动路线上突然出现障碍物时,蚂蚁也 能够很快地重新找到一条最优路径。在整个寻找食物的过程中,虽然单个 蚂蚁的选择能力有限,但是通过信息素的作用,整个蚁群蚂蚁个体之间间 接地交换路径信息,最终找出最优路径。 蚂蚁算法自问世以来表现出了强大的生命力。该算法不依赖于具体问 题的数学描述,具有全局优化能力和本质上的并行性,比遗传算法、模拟 退火算法等早期进化算法具有更强的鲁棒性和适应性,求解时间短,易于 计算机的实现,从而在求解旅行商问题、背包问题、生产调度问题、二次 分配问题、通信网络等方面取得了一系列较好 的实验结果[8]。 蚂蚁算法在通讯网络领域的应用受到了越来越多地关注。由于通讯网 络中信息的分布性、动态性、随机性和异步性与蚂蚁算法非常相似,如利 用局部信息发现解,间接的通讯方式和随机状态的转换等,使得蚂蚁算法 在解决网络路由问题时具有很大的优势[9]。因此,在网络路径寻优的过程中, 人工蚂蚁可以适应网络环境动态的变化,采用分布式的方法寻找到目的地。 由于蚂蚁这种特点再加上蚂蚁算法的本质上并行运算特性,使得蚂蚁算法 在网络路由上的应用成为了具有良好发展前景的方向[10]。 3、研究意义 3.1、本课题研究的目的与意义 12 研究虾青素的薄层层析条件,利用离心式薄层层析法纯化虾青素。 分离提取蛋白质,制成蛋白粉。 利用虾壳制备高生物效价的果酸钙,提高钙的利用率。 制备甲壳素。 13 虾壳:取新鲜南海海水养殖虾,剥壳,除去虾头内容物,清洗,50?干燥, 粉碎,过 20 目筛。 本实验所用主要化学试剂及药品见表 2-1。 表 2-1 实验主要化学试剂一览表 Table 2-1 The main reagents of experiment 实验试剂 级别 生产厂家 虾青素标准品 二氯甲烷 三氯甲烷 乙醇 丙酮 乙酸乙酯 二硫化碳 石油醚 正己烷 柠檬酸 苹果酸 硅胶 硫酸钙 羧甲基纤维素钠 氢氧化钠 乙二胺四乙酸二钠 AR AR AR AR AR AR AR AR AR AR AR AR AR CP AR AR 德国 Dr.Ehrenstorfer 公司 国药集团化学试剂有限公司 广东光华化学厂有限公司 广东光华化学厂有限公司 广东 光华化学厂有限公司 广州化学试剂厂 天津市科密欧化学试剂有限公司 天津市科密欧化学试剂有限公司 杭州炼油厂 天津市科密欧化学试剂有限公司 广州化学试剂厂 青岛海洋化工有限公司 广州化学试剂厂 广东?汕头市西陇化工厂 广东?汕头市西陇化工厂 广东?汕头市西陇化工厂 3.2、课题研究的背景和意义 我国是蚕豆生产大国,但不是蚕豆利用强国。蚕豆蛋白质可广泛应用于肉制品、 乳制品、面制品等食品领域,提高食品的营养价值、产品质量和企业的经济效益。在 国内,蚕豆主要用作蔬菜、饲料,对于蚕豆的深加工和综合利用还处于起步阶段,加工 主要以初级加工为主,包括传统的蒸煮食品、豆芽、发酵制品、休闲油炸食品等,而 大部分蚕豆用于生产粉丝,这仅仅利用了其中 55%左右的淀粉,而蚕豆中 27%左右的 蛋白质却被混入粉丝废水中被排掉。这样,宝贵的蛋白质资源不仅得不到充分利用, 反而对环境造成严重污染。因此,大规模的生产蚕豆蛋白质可进一步打开其在食品工 业中的应用,使得蚕豆蛋白质成为功能性蛋白质的良好经济来源。为了解决这一问题, 对蚕豆的系统研究和蚕豆蛋白质产品开发势在必行。 蚕豆可以为人类提供所需的植物蛋白质来源,尤其与谷物食品一起食用。但是它 的营养价值因为一些抗营养素,如植物凝集素、植酸和蛋白酶抑制剂等的存在而有所 减小。而一些合理的处理方法可以很好地改善其消化性和营养价值,如热处理、发酵 和酶水解等。而水解蚕豆蛋白质,获得营养价 值更高的蚕豆蛋白肽,在食品研究和开 发领域有着广泛的前景。 为了能够充分、合理、高效的利用蚕豆资源,丰富植物蛋白资源,本课题利用等 电点沉淀法提取得到纯度较高的蚕豆蛋白质,一方面对其特性进行研究,另一方面利 用水解的方法得到的蚕豆蛋白肽,并初步探索蚕豆蛋白质在肉制品中的应用。因此, 本课题对蚕豆蛋白质的研究具有一定的理论和现实意义。 3.3、立题背景及意义 目前,蛋白质的辅助分离方法主要是化学提取法和机械破壁法,但前者会造成一 些营养成分的破坏;后者效率低,耗能大;同时两种那个方法都会使得蛋白质的功能 性质受到很大影响。酶解法可以使蛋白质分解成较易吸收利用的氨基酸等小分子物 质;高压脉冲电场可以击穿细胞膜,使细胞内物质渗透到细胞外,从而增加了提取率。 因而,通过调节电场参数后的高压脉冲电场辅助酶法提取鲍鱼内脏蛋白质,一方面可 以有效的提取氨基酸等各种生物小分子并增加提取率;另一方面温和的高压脉冲电场 可改善或者保持其功能性质,如溶解性,起泡性、乳化性、黏度等。 10 福建农林大学硕士学位论文 PEF 对鲍鱼内脏蛋白水解及其性质变化影响的研究 鲍鱼内脏作为鲍鱼加工中的一个副产物,含有丰富的蛋白质和其他多种营养组 分,也具有十分广阔的开发利用前景。随着近些年鲍鱼养殖业的迅速发展,对鲍鱼内 脏的开发利用将会成为鲍鱼加工中一个重要的辅助分支,如多糖提取,天然海鲜调味 品生产等。这一方面将会促进鲍鱼加工的健康发 展,减少环境污染;另一方面,对增 加企业经济效益和社会效益都有很重大的意义。 通过对文献的收集、查阅、研读,发现国内外有许多关于酶解水产品加工下脚 料的研究,进而开发成海鲜调味品。而以鲍鱼内脏为酶解原料提取其蛋白质开发成海 鲜调味品的研究开展较少。关于鲍鱼内脏的研究报道有 4 篇都是关于鲍鱼内脏多糖的 研究。因此,本文在鲍鱼内脏的酶解利用方面做比较系统的研究,为将鲍鱼内脏开发 成海鲜调味品提供理论参考依据。 另外,通过查阅参考文献发现目前关于 PEF 的研究缺乏对蛋白质大分子功能性 质的了解,更不用说 PEF 对鲍鱼内脏蛋白结构和功能性质的影响。因此,本课题通 过 PEF 辅助提取鲍鱼内脏蛋白质结构和功能性质的研究,可以丰富 PEF 对食品组分 蛋白质结构和功能影响了解,进一步推动理论的发展。 3.4、中药有效成分的提取及意义 1.3.1 中药的有效成分1.3.1 中药的有效成分 中草药是我国的国宝,其历史源远流长,中药的研究发展有赖于对中草药化 学成分的认识(包括定性认识和定量认识)。我国中草药资源丰富,共约有 12000 种(尽管药典和部颁标准只收载中药材种类约 500 种)。截至目前为止,我国先 后对 400 余种中药材做了深入研究(定性研究),筛选出 800 余种生物活性成分, 利用中药材治病是我国独有的方法,并且在治疗方面具有的特效、安全等优点[59], 因此,人们利用各种提取方法,从药材中提取有效成分。 3.5、中草药有效成分提取的意义 (1) 减低原植物毒性,并提高疗效:寻找有效部位以及有效成分,能够去除 植物中无效而有毒的成分,从而减轻毒性,提高疗效。 (2) 改进剂型,控制生产质量重要有效成分的含量受产地、采集季节及加工 方法的影响而有所变化,临床疗效往往不同,工业生产时质量较难稳定。分离有 效成分进行生产,可以有效地控制工业生产质量,以保证临床运用的效果。有些 10 情况下经济上并不合算,当其他混合物成分并不影响药效时,一般可用简单方法 处理得到的有效部位来生产,但是分离有效成分并阐明其结构仍然可以帮助我们 控制生产质量[60]。 (3) 扩大中草药的资源:根据有效成分的化学性质和鉴别方法,可以用来检 查其他中草药是否也含有此成分,如果含有就扩大了这一有效成分的资源。 (4) 进行化学合成或结构改造:寻找有效成分并弄清其化学结构就可以使我 们通过人工合成方法生产。中草药有效成分的化学结构可以作为设计新的合成药 的重要借鉴之一,改造其化学结构往往可以得到更为理想的合成药物。 (5) 探索中草药治病的原理,如果分出有效成分就可以研究化学结构与疗效 和毒性的关系,结果就明确可靠。 3.6、海带多糖分离提取研究的目的和意义 海带多糖的药理作用研究表明:海带多糖具有降血糖、降血脂、降血压、 抗凝血、抗肿瘤、抗病毒等多种生理活性,可以调节人体免疫 力,抵抗多种疾 病,因此,进行海带多糖的研究具有重要意义。 多糖是存在于生物体内的一类具有生物活性的天然大分子有机物,是生物 体内不可或缺的重要组成成分,是维持生命不可缺少的结构 材料 关于××同志的政审材料调查表环保先进个人材料国家普通话测试材料农民专业合作社注销四查四问剖析材料 。由于在不同 海域中海带生活环境不同,其体内所蕴藏的多糖活性成分亦有所差别,提取工 艺条件较之其他海域中的海带也有所不同。现有研究主要集中于市售海带,福 建海域海带,浙江海域海带,大连海域海带等,而威海东部海域海带的研究未 见报道。 三面环海的地理优势,使威海海域的海带不仅养殖面积大,而且海带产量 高,质量好。但是由于传统产业的产品附加值低,产品多为未加工或经简单加 工后的海带产品。故本课题以海带多糖提取为研究对象,以期为海带产品的深 加工及海带资源的高效利用开辟新途径。 3.7、蛋白质结构预测的意义 众所周知,生物活性大分子的结构与功能密切相关。而蛋白质做为生物体各项功能 的执行者一直被科研工作者所青睐,对蛋白质结构的研究也随着研究设备的发展而高速 前进着。目前,世界上主要的蛋白质三维立体结构的实验测定方法有二种[36]:一种是 X 光 射 线 晶 体 衍 射 法 (X-ray crystallography) ; 另 一 种 是 多 维 核 磁 共 振 法 (nuclear magneticresonnace-spectroscopy,NMR)。 X 光射线衍射晶体结构分析法[37]是目前研究生物活性大分子的三维结构、分子识别 和作用机理的主要方法。现在还没有一种工具可以直接观察到蛋白质分子的内部原子和 基团的排列,X 光射线晶体衍射法不能 直接将衍射的分散光聚集成像,因此也不能直接 观察到分子晶体中的内部结构。它是通过分析衍射点的排列方式和测量点间距离的大小 来推算分子在晶体结构中的排列方式和重复周期的大小,以及通过测量衍射的强度,应 用一系列的数学方法,借助电子计算机来分析计算每个原子在晶体空间的坐标,从而推 测出整个分子的空间结构和晶体结构。近年来生物大分子的 X 光射线晶体学的研究进展 迅速,而且蛋白质晶体的和转移条件也已经大大的改善,晶体的放置、观测、数据的收 集等工作自动化程度也越来越高,因此,在目前的结构基因组学的研究中,X 光射线晶 体学承担了生物大分子结构测定的大部分工作。但是,X 光射线晶体衍射法在测定生物 大分子的空间结构中亦存在了相当大的局限性[38]: 进行 X 光射线衍射谱的分析,首先对材料的要求较高,通常为高纯度的,实验品要 11 仔细结晶,以获得高品质的适合 X 光射线衍射研究的晶体。 即使获得了合适 X 光射线衍射研究的高纯度结晶,大分子体系结构的测定仍然比小 分子要困难得多。大分子体系结构中数目众多的原子结构的确定还是相当困难的。 利用 X 光射线衍射法测定生物大分子的空间结构对仪器的要求较高,所得结果的数 据分析和计算都需要消耗大量的时间。 X 光射线衍射法必须在分子固相中进行,由此获得的结构信息数据可以与生物大分 子在生物活性状态下的情况有所不同。 总之,利用 X 光射线衍射法测定蛋白质的分子构象,虽然结构相对比较可靠,但是, 利用蛋白质晶体不能测定不稳定的过渡态的构象,而且,很多蛋白质很难获得结晶或很 难得到足够大的用于结构分析的单晶。此外,X 光射线晶 体衍射法测生物大分子的实验 过程和工作流程很长,测定耗时较多,现在,我国清华大学生命科学研究中心平均每周 可以获得一个新的蛋白质晶体并测定。 多维核磁共振技术[39]研究生物大分子的空间结构是做为 X 光射线晶体衍射法的一种 补充,此法也不能直接观察生物大分子的内部原子和基团的排列,它通过提供化学位移 值、耦合常数和吸收峰的面积解析 NMR 谱图,从而间接分析出所测大分子的空间结构。 同样,多维核磁共振也存在着仪器、样品和时间上的局限性,如对样品分子量的要求, 样品的分子量会对谱的复杂性和共振信号的线宽造成影响;对样品溶解度的要求,样品 在所选定的溶剂中必须有足够的溶解度;对样品纯度的要求,少量杂质的存在足以干扰 共振信号的识别与归属,NMR 研究的样品纯度必须在 98%以上;此外,NMR 要求样品 必须稳定。灵敏度低也是 NMR 的局限性之一,为改善信噪比,在实验过程中,数据采 样要重复许多次。 从测定第一个蛋白质的三维结构开始,至今已有近三万个蛋白质的三维结构被测定。 但相对于测序技术的发展,蛋白质的结构测定速度远远不及蛋白质的序列的测定速度。 GenBank 数据库中的序列数据与 PDB 数据库中的结构数据之比相差越来越大[40]。 现在人们发现,试图通过纯粹的实验方法测定所有的蛋白质空间结构是不现实的, 并且在 Anfinsne 发现了蛋白质的变性和复性之后[41],蛋白质的结构预测进入了科研工作 者的视线。生物信息学的工作者利用一些统计和计算机的方法,从蛋白质的一级结构出 发,对其高级结构进行有效的预测。通过对蛋白质结构的预测来更好的研究蛋白质结构 与功能之间的关 系,为医药、食品、环境等诸多领域提供理论基础,应用前景广阔[42]。 3.8、蛋白质吸附的研究意义 蛋白质的吸附现象存在或应用于很多研究领域,如生物医学、生物材料、生 物技术、食品工业等 [31]。 (1) 酶的固定化。酶和抗体在分析技术中应用范围很广,这些分析原理中多 数都涉及到蛋白质分子同界面间的作用。酶的固定化技术决定着酶的稳定性、选 择性和灵敏度等主要功能;酶联免疫吸附技术是使抗原或抗体与某种酶连接成酶 标抗原或抗体,要求这种酶标抗原或抗体既要保留其免疫活性,又要保留酶的活 性,所以对于研究蛋白质与界面的相互作用对固定酶材料的选择有着重要的指导 意义。 (2) 生物材料。生物医学材料植入体内,材料与血液接触,必然要首先发生 蛋白质的吸附[32,33],首先在材料表面有一层蛋白质粘附,然后在短时间内由血细 胞和纤维蛋白形成血栓,因此同血液接触的材料都要求必须具有优异的生物相容 性,才不会导致炎症和病变的产生。要研究材料的生物相容性问题,就必须掌握 蛋白质分子在材料上的吸附机理,从而考虑材料不致使蛋白变性,不影响血液中 存在的酶的活性,不引起有害的免疫反应等诸多问题。 (3) 药物输送。许多药物很大一部分作用因首过效应而代谢失效,如多肽、 蛋白质药物等因此而未获得良好的治疗效果,通常不得不将口服药改为注射静脉 给药途径。由于通过注射途径的非靶向药物可均匀分布于全身血液循环中,在到 达病灶前,要经过同蛋白质结合、排泄、降解等步骤,只有少量药物才能到达病 灶。靶向给药 的目的就是提高靶区的药物浓度,而提高药物的利用率和疗效以降 低药物的副作用一直是医药领域一项重要的研究课题,纳米药物载体的研究有效 地解决了这些问题[34]。当输送多肽或蛋白质药物时,一定要考虑输送药物的材料 和蛋白质的相互吸附作用。 (4) 生物传感器(biosensor)。生物传感器是将生物体的成份(酶、蛋白质、 抗原、抗体、DNA、激素)或生物体本身(细胞、细胞器、组织)固定化在一 器件上作为敏感元件的传感器称为生物传感器,所以对于一些生物传感器,蛋白 质与器件的作用是不可避免的。近年来研究发现用纳米材料构建的生物传感器具 有灵敏度高、反应速度快、性能稳定等优点[35],所以纳米材料的生物传感器的研 究备受重视。充分认识蛋白质和界面的相互作用,对于生物体蛋白质成份在材料 上固定形成的传感器有很大的意义。 10 第一章文献综述 (5) 蛋白质分离。生物色谱分离技术利用吸附剂与不同组分的蛋白质之间吸 附性能的差异,达到分离纯化的目的,蛋白质与固定相表面之间的作用直接影响 着分离效果。对于蛋白质和吸附剂材料直接的作用机理了解,对蛋白质分离领域 的研究至关重要。 (6) 蛋白质检测。对于研究蛋白质天然结构的实验检测方法中基本上都涉及 到蛋白质和检测仪器中界面的接触,这样的界面可能会对蛋白质的构象产生影 响,需要对作用界面的性质进行研究,尽可能使用对蛋白质构象影响较小的界面 进行检测以使结果可靠。所以需要对蛋白质在界面上的吸附机理有很好的掌握, 才能更好的应用到实际中。尤其是对决定蛋白质在不同界面上发生变性的条件的 研究显得非常重要。 另外还有许多,比如在生产设备上 出现蛋白质吸附时,这种吸附作用不仅可 能降低生产效率,还是”生物污染”的生成原因,如长期的食品生产加工过程中, 会在生产设备上出现蛋白质的沉积污垢,这些在生产中出现的不利吸附也需要进 行防治解决。所以蛋白质与界面的相互作用问题也是纳米技术、生物材料和生物 技术中的基本问题,是解决许多技术领域中存在问题的关键[36]。由于在实际中具 有广泛的应用,蛋白质界面相互作用的微观机理对于这些领域的发展是很有价值 的,而且对蛋白质界面作用中构象变化的研究,也会加深我们对蛋白质本身的认 识。因此,对蛋白质在固液界面上吸附现象的基本理解对于理论研究和实际应用 都有着非常重要的意义。 3.9、蛋白质的病理意义 蛋白质是生命活动的重要参与者。许多疾病的产生,都是由蛋白质的病变引起的,如 亨廷顿舞蹈病、阿尔茨海默病、帕金森病、白内障、家族性高胆固醇血症以及癌症等。要 有效治疗上述任何一种疾病,最主要的途径是研发新的治疗药物,而其中很多都是以蛋白 质为靶点。我们只有不断的对蛋白质的结构与功能加深了解,才能更有效的认识蛋白质与 其他大分子之间的相互作用,才能增加我们能治疗疾病的数量。因此,蛋白质的研究对于 生物医学研究及疾病治疗有着重要的意义。 3.10、--2 TSP 问题的研究意义 TSP 问题是一个理想化的问题,大多数对于此问题的研究都不是为了直接的实际应用,但这些研究 可以经转化后用于许多现实的组合优化问题。很自然地可以想到,TSP 问题的成果可以应用于运输和物 流问题。TSP 问题最早的应用是在上个世纪的四十年代,应用于校车路线的优化。现在,TSP 问题在越 来越多的方面得到应用。 1.电路板钻孔进度的安排。在这个应用当中,电路板上的孔代表 TSP 问题中的城市,钻头从一个钻 孔移动到另一个钻孔。寻找最短路径变成了寻找最省时的钻头移动时问。尽管目前钻机的工艺技术发展 很块,但钻头的移动时间仍然是一个令人头疼的问题。 2.基因测序。Concorde 是一种求解 TSP 问题的程序。美国国家卫生机构的研究人员利用这一程序 来进行基因测序。在这一应用中,局部的基因图谱作为城市,城市与城市的距离代表某张图谱与其它图 谱相连的可能性。研究人员试图寻找一种可能性最高的连接方式把这些局部的图谱合成为整张基因图 谱。 3.半导体的线路设计。一家半导体生产厂家应用 Concorde 程序来优化半导体的线路设计,这样可 具有禁忌搜索能力的蚂蚁算法研究 2 以节省刻制半导体的时间,也能减少半导体电路消耗的能量。 4.光缆的线路设计。贝尔电话公司利用 Concorde 程序来设计光缆的铺设线路,同样的方法也应用 于电话和电力线路的铺设当中。 5.在机器人控制等其它方面,TSP 问题也有应用。 同实用价值相比,TSP 问题的理论意义更加重大。事实上,该问题是作为所有组合优化问题的范例 而存在的,有许多问题本质上都可以归结为一个 TSP 或是将其作为一个子问题来处理。它己经成为并 将继续成为测试新算法的 标准问题。这是因为,TSP 问题展示了组合优化的所有方面。它从概念上来讲 非常简单,但是其求解的难度是很大的。如果针对 TSP 问题提出的某种算法能够取得比较好的实算效 果,那么对其进行修改,就可以应用于其它类型的组合优化问题并取得良好的效果。基于上述原因,该 问题吸引了许多不同领域的研究者,包括数学、运筹学、物理、生物和人工智能等领域。 1-2 TSP 问题的研究现状 目前,对于该类问题的研究有两个方向:完全算法能保证得到最优解,但是运行时间是呈指数复杂 度的,因而难以适应大规模计算的要求;近似算法则只要求近似解,可在多项式时间内结束。 在旅行商问题上的近似算法分为两类:构造算法和环路改进算法。前者从某个非法解开始,通过某 种增广策略逐步改变该解,直到得到一个合法解为止。这类算法包括最邻近算法、贪心算法、 Clarke-Wright 算法、Christofides 算法等。环路改进算法则在给定初始的合法解之后,使用某种策略来 改进初始解,这些策略包括局部搜索、模拟退火、遗传算法等,其中最为简单和有效的方法为局部搜索, 如 2-OPT, 3-OPT, LK (Lin-Kernighan) , LKH (Lin-Kernighan-Heslgaun)等。通常这两类算法结合起来使用, 用环路构造算法来构造初始解,而用环路改进算法改进这个初始解。Arora 对欧氏空间的旅行商问题提 出了多项式时间的近似策略,这也是近年来在近似算法的研究中所取得的一项重要进展。Helsgun 则提 出了目前精度最高的近似算法 LKH 算法。 1-2-1 TSP问题的精确解法[1] 1-2-1-1 可解特殊旅行商问题的精确算法 对于旅行商问题的一些特殊情况,已经研究出一系列非常完美的结果,如:机器排序问题(Gilmore 等,1964)、二分图情形(Lawler, 1971)、平面旅行商问题中的一些特例(Burkard, 1989),等等。由于可解 情形的结果都是成熟的定理,因此严格来说已不属算法研究的范畴。 1-2-1-2 线性规划算法 这是求解旅行商问题的最早的一种算法,主要是采用整数规划中的割平面法,即先求解模型中由前 二个约束构成的松弛线性规划问题,然后通过增加不等式约束产生割平面,逐渐收敛到最优解。 河北工业大学硕士学位论文 3 1-2-1-3 分支定界算法 分支定界法是一种应用范围很广的搜索算法,它通过有效的约束界限来控制搜索进程,使之能向着 状态空间树上有最优解的分支推进,以便尽快找出一个最优解。该方法的关键在于约束界限的选取,不 同的约束界限,可形成不同的分支定界法。 3.11、研究意义与目的 由于网络流量数据十分庞大、更新快,攻击行为一般很难被直接、及时发现, 为入侵检测带来了极大的困难。数据挖掘技术的出现提供了解决这一问题的有效 手段,数据挖掘技术被用来进行特征构造和检测。尤其在从大量数据中提取特征 与规则方面所具有的明显优势,使得在入侵检测系统中采用数据挖掘技术的聚类 分析来实现其检测的准确性与时效性成为可能。通过将数据挖掘技术的聚类分析 与入侵检测技术相结合,增加入侵检测系统对海量数据的处理能力,可见,聚类 分析在入侵检测中的应用研究具有重大的理论意义和实用价值。在诸多聚类算法 中,蚁群聚类算法是一种较新且较高效率的算法。具有自治性(聚类不再是根据所 要求的对数据进行原始分割和分 类门,而是通过蚁群搜索行为自然地形成)、灵活 性等优点。 在过去 20 年中,算法的很多进步是基于对自然世界的观察。仿生学的群体智 能特别是在优化领域得到广泛的应用。群智能系统很容易适应,并且个体行为和 相互作用的思想不是很复杂。相反,这些行为和相互作用产生非常简单的规则。 这为蚁群聚类在入侵检测中应用提供新思路及可能。 本文根据蚁群聚类算法的特点,针对其在参数设定影响其聚类效果等不足方 面进行改进研究,提出蚁群聚类的改进方法。入侵检测通常根据聚类的大小来判 断:大的聚类对应正常数据,小的聚类被视为入侵。这对 DoS 等入侵检测(经常 会产生大量的入侵数据,而某些类型的正常形态行为却只产生少量的数据)产生 致命错误。针对这方面的不足,本文对蚁群聚类算法在入侵检测中的应用提出一 种异常入侵检测模型,在入侵检测的应用中,不必预先指定簇的数目,不要求满 足正常行为的数目远远大于入侵行为的数目等条件,能构造任意形状的簇,改善 聚类的质量,提高对未知攻击的有效检测效率,减少误警率。 3.12、论文选题背景与意义 进程中,一直伴随着各式各样的物流活动。可 以这么说,人类的文明史就是一部物流发展和变革的历史,经济的发展和科学技 术的进步促进了物流活动的广度和深度,而物流活动的扩大和深化又进一步推动 了经济和社会的发展。尽管物流活动自古有之,但是直到 1915 年才第一次在书本 上出现了”物流”这个名词。经过近百年的理论研究 和实际运作,人们认识到合 理、高效的物流能够从以下几方面创造社会财富: (1)促进国民经济合理布局,有利于社会资源的优化配置; (2)有效地使用流通设施和设备,节约社会资源; (3)减少流通环节,缩短生产周期,加速资金周转; (4)简化信息流通渠道,增强社会物质财富的可调节性; (5)促进社会分工,加速生产的集中化、规模化。 在现今社会中,物流已经成为企业最重要的竞争领域之一,政府、企业和研究 机构纷纷将注意力转向以系统化、信息化、敏捷化和顾客导向为特征的物流管理 现代化。物流领域涉及很多方面,因此,对物流的研究也逐渐成为研究的热点。 4、研究目的 4.1、本课题的研究目的、意义及主要研究内容 1.4.1 研究目的与意义1.4.1 研究目的与意义 湖北省毗邻长江,湖泊、水塘星罗密布,水产资源非常丰富。小龙虾的加 工与出口是其中很重要的一部分。湖北省潜江市有着”中国小龙虾加工出口第 一市”、”中国小龙虾之乡”的美称,是全国最大的小龙虾加工和出口基地。 2011 年潜江市野生寄养小龙虾 1.2 万公顷,产量 2 万吨,综合产值 35 亿元[39]。 随着小龙虾行业的飞速发展,每年小龙虾生产季节就会产生大量的虾头、 虾壳副产物,据统计,湖北省每年产生小龙虾副产物约 16 万吨[40],如何处理 这些副产物对小龙虾行业的发展至关重要。其实,这些副产物并不是没有利用 价值的”垃圾”,其中蕴含着很大的商机。它们可以作为工业原料进行开发利 用,生产氨基酸螯合钙、 虾青素、甲壳素及其衍生物等产品,通过深加工可增 值 10-100 倍。深加工的发展可以平衡甲壳素及其衍生物的国内需求,可以为小 龙虾行业创造更多的财富,提高小龙虾行业附加值。 目前,很多小龙虾副产物加工基地呈现典型的”小作坊”模式,由于缺乏 资金与技术支持,这些小龙虾副产物加工基地,只是对收集来的副产物进行简 6 武汉轻工大学硕士专业学位论文 单的酸碱处理,再把处理后的副产物作为甲壳素加工原料卖给沿海地区具有甲 壳素深加工能力的厂家。这样不仅降低了小龙虾副产物的利用率及附加值,而 且给环境造成了严重的污染,不利于小龙虾行业的可持续发展。 面对这种现状,湖北省潜江市计划用 5-8 年时间形成 220 亿元产值的甲壳 素深加工产业群,使小龙虾这一传统的农产品加工产业向高科技生物领域转变 [41]。 对小龙虾副产物的综合利用不能局限于制备甲壳素这一种物质,而要把其 中的蛋白质、钙、虾青素等生物活性物质一起利用起来,提取制备方式也应打 破传统的酸碱法,使小龙虾副产物的综合利用朝着绿色、无污染方向发展。 本研究试图把酶解制备蛋白水解物,有机酸制备有机钙,乙醇提取虾青素 结合起来,应用到甲壳素生产工艺中,提取制备小龙虾副产物中蛋白水解物、 虾青素、有机钙、甲壳素这几种生物活性物质的同时做到清洁生产。 4.2、本课题研究的目的与意义 12 研究虾青素的薄层层析条件,利用离心式薄层层析法纯化虾青素。 分离提取蛋白质,制成蛋白粉。 利用虾壳制备高生物效价的果 酸钙,提高钙的利用率。 制备甲壳素。 13 虾壳:取新鲜南海海水养殖虾,剥壳,除去虾头内容物,清洗,50?干燥, 粉碎,过 20 目筛。 本实验所用主要化学试剂及药品见表 2-1。 表 2-1 实验主要化学试剂一览表 Table 2-1 The main reagents of experiment 实验试剂 级别 生产厂家 虾青素标准品 二氯甲烷 三氯甲烷 乙醇 丙酮 乙酸乙酯 二硫化碳 石油醚 正己烷 柠檬酸 苹果酸 硅胶 硫酸钙 羧甲基纤维素钠 氢氧化钠 乙二胺四乙酸二钠 AR AR AR AR AR AR AR AR AR AR AR AR AR CP AR AR 德国 Dr.Ehrenstorfer 公司 国药集团化学试剂有限公司 广东光华化学厂有限公司 广东光华化学厂有限公司 广东光华化学厂有限公司 广州化学试剂厂 天津市科密欧化学试剂有限公司 天津市科密欧化学试剂有限公司 杭州炼油厂 天津市科密欧化学试剂有限公司 广州化学试剂厂 青岛海洋化工有限公司 广州化学试剂厂 广东?汕头市西陇化工厂 广东?汕头市西陇化工厂 广东?汕头市西陇化工厂 4.3、立题背景及研究目的意义 日本、欧美等发达国家对啤酒酵母的综合利用非常重视,他们的研究 历史长、技术水平高、实用化程度高,而我国则从八十年代开始进行研究, 各方面都与国外有着巨大的差距。尤其是 β-(1,3)-D-葡聚糖的提取,目前 Sigma 公司的标准品 β-(1,3)-D-葡聚糖已经达到 52.9 美元/5mg(Sigma, 2005)。日本、美国均有了用于抗癌治疗的水溶性针剂,而我们在口服方 面还刚刚起步。我国的研究大多集中在废酵母泥 上,酵母泥的自溶较快, 且运输困难,尤其是对于 β-(1,3)-D-葡聚糖的提取。对酵母的综合利用也 只是停留在饲料、酵母精、酵母浸膏、饲料蛋白等方面,目前人们也开始 向核糖核酸、β-(1,3)-D-葡聚糖、谷胱甘肽、SOD 等方面展开研究,但相 对国外的研究还比较肤浅。 科学研究已经证明,酵母 β-(1,3)-D-葡聚糖作为一种具有极强免疫激 活与抗肿瘤活性的生物效应调节剂(BRMS),可以通过刺激免疫系统而提 高机体的免疫能力,维持体内各系统的肌体平衡(例如神经系统、内分泌 系统、免疫系统),它帮助机体适应环境和心理压力。而 RNA 也已经被医 学证明具有维持机体免疫功能、抗氧化、提高机体蛋白质和铁的生物利用 率、降低胆固醇和抗衰老等多种生理功能。同时由于赖氨酸的高含量及含 有符合人体需要的八种必需氨基酸,酵母蛋白质的高营养性使其成为人们 的一种优良的食用蛋白质。而啤酒酵母同时具备这三种物质,因此采用一 种较为简单有效的方法,实现对这三种物质的综合提取,是非常有意义的 。 本研究针对以上问题,旨在研究一种废啤酒酵母综合加工利用的有效 方法,在最佳提取条件下实现 RNA、β-(1,3)-D-葡聚糖和蛋白质三种产品 的综合提取,得到高品质的产品。并以干燥的啤酒酵母为原料,解决了废 酵母的集中利用问题和经济效益问题,从而使啤酒酵母的综合利用更有实 际操作意义,对于节能降耗、创建节约型的和谐社会具有非常重要的意义 。 19 4.4、海带多糖分离提取研究的目的和意义 海带多糖的药理作用研究表明:海带多糖具有降血糖、降血脂、降血压、 抗凝血、抗肿瘤、抗病毒等多种生理活性,可以调节人体免疫力,抵抗多种疾 病,因此,进行海带多糖的研究具有重要意义。 多糖是存在于生物体内的一类具有生物活性的天然大分子有机物,是生物 体内不可或缺的重要组成成分,是维持生命不可缺少的结构材料。由于在不同 海域中海带生活环境不同,其体内所蕴藏的多糖活性成分亦有所差别,提取工 艺条件较之其他海域中的海带也有所不同。现有研究主要集中于市售海带,福 建海域海带,浙江海域海带,大连海域海带等,而威海东部海域海带的研究未 见报道。 三面环海的地理优势,使威海海域的海带不仅养殖面积大,而且海带产量 高,质量好。但是由于传统产业的产品附加值低,产品多为未加工或经简单加 工后的海带产品。故本课题以海带多糖提取为研究对象,以期为海带产品的深 加工及海带资源的高效利用开辟新途径。 4.5、研究目的 本研究室在前期研究中[39]从纺织厂废水中分离得到一株产过氧化氢酶菌株,命名为 芽孢杆菌 Bacillus subtilis WSHDZ-01。Bacillus subtilis WSHDZ-01 产过氧化氢酶的合适 种子培养基:糖度为 6?P 的天然麦芽汁,pH 7.5;发酵培养基:每升含葡萄糖 10 g, NaNO3 5 g , MgSO4 7H2O 0.5 g,Na2HPO4 9.52 g,KH2PO4 0.907 g ,FeSO4 7H2O 0.025 g,pH 7.5。通过前述研究发现,要实现过氧化氢酶的工业化生产,并在棉纺织工业上得 到真正的应用,还存在很多问题,本论文的研究 目的为: (1) 确定一种合适的方法有效的提取胞内过氧化氢酶; (2) 通过纯化,并进一步研究过氧化氢酶的分子学性质、酶学性质等; (3) 由于从粗酶性质看反应的适宜温度较高,但酶在 55~60?下稳定性很差,因此寻 求合适的稳定剂以提高该酶的使用稳定性也是研究中的一个主要目的。 4.6、研究蛋白质序列与结构关系的目的意义和研究现状 1.2.1 研究目的和意义 60 年代,著名的 Anfinsen 的关于 RNA 水解酶的实验[4]表明:蛋白质的三级结构 即空间结构是由蛋白质的一级结构即蛋白质的序列决定的。但其中的细节,蛋白质 的序列究竟是如何决定蛋白质的结构的,目前仍然是一大难题。正如前面说明,蛋 白质可以说是最重要的生命物质,弄清蛋白质的结构,并进一步弄清结构对于蛋白 质功能的影响,这对于我们了解蛋白质是如何进行它的生命活动,行使它的功能, 如和其他蛋白质或小分子发生相互作用,是有很重要的贡献的。显而易见,这对于 生物学和医学、药学等牵涉到蛋白质的学科都有十分积极的意义。 弄清蛋白质的序列是如何决定其三维结构的,也就弄清了蛋白质的折叠机制, 即解决了分子生物学中的一个重要问题:蛋白质是如何由无生物活性的多肽折叠成 为具有多种生物活性的蛋白质的。并且为何在不同条件下,同一蛋白质的空间结构 能够完全不同,这其中牵涉到了众多作用力,它们之间是如何相互作用的,这也是 需要我们解决的问题。并且某些疾病就是由于蛋白质折叠异常而发生的,比如老年 痴呆症、疯牛病等。如果我们了解 了蛋白质的折叠机制,就有可能通过分析找出错 误折叠的原因,从而进一步找到彻底治愈目前看来是不治之症的这些疾病[5] [6] [7]。 6 另外,了解了蛋白质的一级结构是如何决定其三维结构的,能够帮助我们更有 目的也更有效率的进行新的蛋白质的分子设计。目前的蛋白质工程已经在越来越多 人类的生产生活领域发挥作用了。比如如何提高蛋白质的热稳定性、酶的专一性等 等。通过对蛋白质序列与结构和功能关系的了解,我们就能根据实际需要设计新的 蛋白质或是改造原有蛋白质,这能大大加快蛋白质分子设计的速度。 最后,随着生命科学的不断发展,尤其是近年来新技术的不断涌现,已经有相 当多的蛋白质的序列都已经被测定了。,但是相当于海量的序列数据来说,蛋白质的 结构的测定速度要慢的多。因为目前测定蛋白质的主流方法都是采用实验测定的方 法,并且实验条件的要求非常高,耗时也比较长[8]。因此,蛋白质的结构与序列在数 量上随着时间就显得越来越不匹配。这也让我们独辟蹊径,通过序列来预测蛋白质 结构的工作越来越紧迫,因为这种方法不需要实验,在速度上足以赶得上序列的测 定速度。 1.2.2 蛋白质序列结构关系研究现状 由于蛋白质序列和结构关系意义重大,因此近年来涌现了大量的算法[9] [10] [11] [12] [13]。比较主流的有手工比对方法,同步法还有步进法。他们的核心内容都是序列比 对,同时它也是对蛋白质进行序列分析的基本方法。而序列比对的理论基础是进化 学说。序列上的进化学说指的是,在生物进化的过程中,某些残基保持不变,而另 外一些残基可能会通过突变变为其他类型,同时还有丢失的残基以及新插入的一些 残基。这导致了序 列的不断进化从而形成今天超大规模的蛋白质序列。蛋白质序列 的进化看起来非常复杂和多样,但是从蛋白质的结构上来看,结构类型和数目是有 限的,研究表明蛋白质进化中,复制起了相当重要的作用,约有 80%的蛋白质的结 构都属于已知的 400 种折叠类型[14][15]。这些结构的复制在一级结构上看来就是序列 的复制,但随着时间推移,因为随机改变和自然选择,这些复制得来的序列会发生 一些突变,但由于变化十分细微,几乎对结构不造成任何影响。那么经过漫长的岁 月,可能不同蛋白质在序列上看来完全不一样,但是在结构上却很相似,并且几乎 7 行使着完全相同的功能。 由于复制的原因,在某些蛋白质序列内部含有重复片段。研究发现 14%的蛋白 质内部都有重复片段[16]。并且有大量的事实证明重复对蛋白质和核酸的稳定性起关 键性的作用[17]。重复能使某些蛋白获得专一的功能和完成特定的生理学功能。 目前已知的序列内寻找重复的算法主要有 RADAR[18] (Rapid Automatic Detection and Alignment of Repeats in protein Sequences)和 TRUST[19] (Tracking Repeats Using Significance and Transitivity)。它们的输入文件都是一个 Fasta 格式的蛋白质序列,输 出为序列重复信息。相比较来说,TRUST 的灵敏度要稍高。除此以外还有一些寻找 重复序列的方法,本课题组所研究的就是其中一种。 研究蛋白质的序列和结构关系的方法还有很多很多,这些方法都各有优劣,它 们都在各自独特的领域起到了不可忽视的作用。但是遗憾的是目前还没有找到一种 能普遍适用的,能够直接从蛋白质的一级结构得到三级结构的方法。所以,蛋白质 序列和结构关系的研究工作, 任重而道远。 4.7、研究目的 对核酸和蛋白质光谱探针的研究与应用一直是人们的焦点。目前,对分析化 学的研究来说,新技术的开发,灵敏的、稳定的、低毒无毒的光谱探针的研制是 非常重要和有意义的工作。 本论文的研究目的是在前人研究基础上,建立核酸和蛋白质灵敏、快速和简 便的分析方法,探讨纳米粒子与核酸、蛋白质之间的相互作用机理。 4.8、玉米种子老化及种子蛋白质组学的研究目的及意义 种子在储藏过程中会发生自然老化直至死亡,这个过程比较复杂,因为随着贮存时 间的延长,它的生理特性、种子活力等都发生变化。会影响到种子的安全贮藏,并给农 业生产带来不便,造成农业损失。有研究表明,在种子自然老化过程中,有关酶的活性 发生变化,甚至导致染色体损失及膜的完整性丧失(Priesty et al. 1980)。尽管关于种子 的老化有很多相关的报道,但在玉米的研究中比较完整的分析老化过程中各项生理指标 的变化及蛋白电泳等系统性研究目前还较少。因此,本试验采用玉米 9417 正常可育系 12 为试验材料,对其进行不同时间的人工加速老化处理,对其进行萌发研究发芽情况,并 通过对种子各项生理指标的测定,获得其与 CDT 处理天数之间的关系。研究人工加速 老化处理对玉米种子生理生化指标的影响,丰富种子生理和种子活力的现有理论,为玉 米种子的保存提供理论依据。此外,本试验 选择玉米 9417 不育系和正常可育系两种玉 米种子,对其不经任何处理,测定其各项生理指标,并对其进行萌发实验,统计发芽率, 分析它们之间的变化。 玉米蛋白质组学虽然在多个领域展开了研究,但大部分蛋白未能得到有效鉴定,对 于玉米蛋白质组的大规模、系统化的研究还相对匾乏;运用于玉米的蛋白质组学主要研 究方法还存在着诸多的局限性;玉米中很多蛋白得不到准确鉴定。这些都要求我们更加 广泛的利用快速发展的蛋白质组学新技术应用于玉米蛋白质组学研究,发展更强大的跨 物种数据库检索、完善玉米基因组和蛋白质组数据库。我们有理由相信随着蛋白质组学 研究更为大规模化和系统化,其在玉米研究中的应用必定会越来越广泛。本试验中选择 玉米9417 不育系种子和经老化处理的正常可育系种子,对其胚乳及种胚进行 SDS-PAGE 电泳分析及质谱鉴定。研究其可育系经不同老化处理后对种胚及胚乳蛋白的影响,以及 不育系与可育系未处理种子在蛋白质上的差异。 13 4.9、本文的目的和主要任务 移动 Ad Hoc 网中,无线通信技术作为其中重要技术之一,己经不满足于 仅仅用于话音通信,数据通信己逐渐成为无线通信的主流业务。随着要求无线 接入、传输数据的节点种类和数量急剧增加,无线网络结构也日趋复杂,面临 很多难点 [7] 。 针对当前的 Ad Hoc 网络技术发展中所遇到的难题,本文主要对以下几方 面进行了研究。 对 MANET 网进行了研究,详细了解了 Ad Hoc 网络的定义、主要功 能、 当前面临的主要技术问题和要达到的主要目标。 研究比较现存的几种 Ad Hoc 网络路由协议(DSR、DSDV、AODV、 TORA),选取 AODV 路由协议作为移动自组织网的网络层路由协议,分析 了协议中的不足之处,运用蚂蚁路由对路径进行探测,并通过遗传算法对 路径种群加以更新,进行路径决策,提出了基于遗传蚂蚁路由的路径选择 算法。 采用 OMNET++网络仿真软件对移动 Ad Hoc 网络进行仿真 [8] ,构建不同节 点的模块,搭建网络仿真平台,在此平台的基础上对传统的 AODV 路由协 议和改进的路由协议进行仿真,仿真结果表明:基于遗传蚂蚁路由的算法 与 AODV 相比,可以有效地提高网络数据包传输的成功率,降低网络传输 数据的延迟时间,减少网络中由于路由工作所带来的网络开销,并提高了 网络中路由的稳定性。 4.10、研究意义与目的 由于网络流量数据十分庞大、更新快,攻击行为一般很难被直接、及时发现, 为入侵检测带来了极大的困难。数据挖掘技术的出现提供了解决这一问题的有效 手段,数据挖掘技术被用来进行特征构造和检测。尤其在从大量数据中提取特征 与规则方面所具有的明显优势,使得在入侵检测系统中采用数据挖掘技术的聚类 分析来实现其检测的准确性与时效性成为可能。通过将数据挖掘技术的聚类分析 与入侵检测技术相结合,增加入侵检测系统对海量数据的处理能力,可见,聚类 分析在入侵检测中的应用研究具有重大的理论意义和实用价值。在诸多聚类算法 中,蚁群聚类算法是一种较新且较高效率的算 法。具有自治性(聚类不再是根据所 要求的对数据进行原始分割和分类门,而是通过蚁群搜索行为自然地形成)、灵活 性等优点。 在过去 20 年中,算法的很多进步是基于对自然世界的观察。仿生学的群体智 能特别是在优化领域得到广泛的应用。群智能系统很容易适应,并且个体行为和 相互作用的思想不是很复杂。相反,这些行为和相互作用产生非常简单的规则。 这为蚁群聚类在入侵检测中应用提供新思路及可能。 本文根据蚁群聚类算法的特点,针对其在参数设定影响其聚类效果等不足方 面进行改进研究,提出蚁群聚类的改进方法。入侵检测通常根据聚类的大小来判 断:大的聚类对应正常数据,小的聚类被视为入侵。这对 DoS 等入侵检测(经常 会产生大量的入侵数据,而某些类型的正常形态行为却只产生少量的数据)产生 致命错误。针对这方面的不足,本文对蚁群聚类算法在入侵检测中的应用提出一 种异常入侵检测模型,在入侵检测的应用中,不必预先指定簇的数目,不要求满 足正常行为的数目远远大于入侵行为的数目等条件,能构造任意形状的簇,改善 聚类的质量,提高对未知攻击的有效检测效率,减少误警率。 4.11、研究目的及意义 公共交通公共汽车驾驶员调度(Bus Driver Scheduling,BDS)专指在公共交通 中公交巴士的驾驶员的调度,以下简称驾驶员调度问题,它是智能公共交通系统 (Intelligent Transport System,ITS)中一个重要的组成部分,并直接关系到公交公 司的运营成本和服务质量。驾驶员调 度问题主要是指在已有行车时刻表和车辆调度 的前提下,为驾驶员分配驾驶的时间和路线区间[1]。它以行车时刻表位依托,又是行 车时刻表的实施。 公交驾驶员调度工作中,目前人工干预的部分还比较大,而驾驶员调度的自动 化系统尚处于研究开发阶段。以现有的方式进行驾驶员调度,既费力费时,又无法 验证排班结果是以一种比较优化的方式;而且在排班过程中,调度人员需要大量的 经验才能进行。而在公共交通这样的大型公共项目中,只要效率提高一点,都可以 华 中 科 技 大 学 硕 士 学 位 论 文 2 为公交公司和相关部门节省大量的时间和资金。有很多的研究人员尝试着用各种方 式解决驾驶员调度问题,虽然有一些方法在商业应用中取得了巨大的成功,但驾驶 员问题本身的还有很多值得研究的地方。现有的软件系统虽说在国外取得了很大的 成功,但这些解决方法并不通用,需要根据不同的情况做出调整,是否适合国内的 环境还有待进一步研究。另外,比较成功的软件系统采用的方法大都为”生成加选 择”模式[2],其中”生成”阶段并非贪婪式的,而又占据了整个算法的大部分时间, 因而很难在较短的时间内求得满意解。因此,有必要对驾驶员调度问题进行更多更 深入的研究。 根据文献[2]指出的研究方向,本文将尝试将蚂蚁算法引入到驾驶员调度问题中。 本文在分析了驾驶员调度问题的特性后,对蚂蚁算法进行了改进,并将其引入到驾 驶员调度问题中,解决带时间窗的驾驶员调度问题,并实现贪婪式的要求,以期在 容许的时间内获得问题的满意解。 5、国内外研究现状 5.1、昆虫蛋白质提取工艺研究现状 研究昆虫蛋白质的提取与纯化技术,是进一步开发与利用昆虫蛋白源的前 提。从 50 年代到 70 年代,动物蛋白主要是以有机溶剂提纯,虽然产量较高,但 对含硫氨基酸破坏性大,灰分含量高,品质差,此后,碱提法为人们广泛采用, 可是,据报道热碱提取使蛋白质变性,严重影响其品质,而低温提取则产量偏低。 昆虫蛋白质提取是 80 年代迅速发展起来的一项新工艺。提纯的昆虫蛋白质是食品 和医药工业中的重要原料。在国外,昆虫蛋白主要以非溶解性提法提炼,由于难 于解决褪色、除臭等问题,加上纯化过程繁琐,而没有广泛应用于工厂化生产。 因此,目前许多学者仍致力于对昆虫蛋白质提取工艺的研究,供试昆虫主要为黄 粉虫和家蝇,而对于其他昆虫蛋白的提取鲜有报道[21]。 目前用于提取昆虫蛋白质的方法主要有,碱提法、盐提法和酶提法,由于研 究者所用的材料和处理方法不同,其结论不尽相同。而由于对提取昆虫蛋白质各 种方法尚无系统的比较研究。因此,对于同一基质物究竟采用那一种方法更理想, 尚不十分清楚。 5.2、蛋白质测定及其提取技术研究现状 4.1 蛋白质测定方法 根据蛋白质的性质和成分,测定蛋白质的方法可分为两大类:一类是利用蛋白 质的共性,即含氮量、肽键和折射率等测定蛋白质含量;另一类是利用蛋白质中特 定氨基酸残基、酸、碱性基团和芳香基团等测定蛋白质含量。 凯氏定氮法[89,90]:原理是含蛋 白质样品与硫酸和催化剂一同加热消化,使蛋白 质分解,分解的氨与硫酸结合生成硫酸铵。然后碱化蒸馏使氨游离,用硼酸吸收后 再以硫酸或盐酸标准溶液滴定,根据酸的消耗量乘以换算系数(6.25),即为蛋白 质含量。根据仪器装置、样品与试剂用量的不同又可分为常量、半微量与微量法。 其中半微量凯氏定氮法是食品中蛋白质含量测定的国家标准方法。 Folin—酚试剂法(Lowry 法)[91]:在碱性溶液中,蛋白质与 Cu2+形成络合物,能 还原磷钼酸—磷钨酸试剂(Folin 试剂),生成蓝色物质。在一定条件下,颜色的深 浅与蛋白质含量的高低成正比例。此法操作简便、灵敏度高,但反应易受多种因素 12 干扰。 紫外分光光度法:由于蛋白质分子中酪氨酸和色氨酸残基的苯环含有共轭双 键,因此蛋白质具有吸收紫外线的性质,吸收高峰在 280nm 波长处。在此波长范 围内,蛋白质溶液的光吸收值(OD280)与其含量呈正比关系,可用作定量测定。此 法测定蛋白质含量的优点是迅速、简便、不消耗样品,低浓度盐类不干扰测定。 考马斯亮蓝染色法(Bradford 法)[92]:考马斯亮蓝在一定蛋白质浓度范围内, 蛋白质和染料结合符合比尔定律,因此可以通过测定染料在 595nm 处光吸收的增 加量得到与其结合的蛋白质量。该法简单、迅速、干扰物质少、灵敏度高(比 Lowry 法灵敏 4 倍)。 蛋白质测定的其他方法还有水杨酸比色法[93]、双缩脲法[94]、皮尼克法、二喹 啉甲酸法(BCA 法)[95]、荧光探针法[96]、近红外透射光谱法[97, 98]、罗丹明 6G 生 物探针[99]、高光谱遥感技术[100]等。 4.2 蛋白质提取技术 目前,动物、植物、微生物中蛋白质提取技术已经比较完善。大部分蛋白质 可 溶于水、稀盐、稀酸或碱溶液,少数与脂类结合的蛋白质则溶于乙醇、丙酮、丁醇 等有机溶剂中,因此,可采用不同溶剂提取蛋白质。 从固体废弃物(如虾壳、米糠、垃圾、污泥等)中提取蛋白质技术尚不完善, 很多方法仍处于实验室研究阶段: A、虾壳蛋白质提取[101,102] 干虾壳在氢氧化钠溶液中进行脱蛋白质反应, 反应终结后,用 KMnO4脱去红色素,过滤。滤液 pH 值调至 5~6 后,加入一定量 氯化钠使蛋白质析出。在优化条件下蛋白质提取纯度可达到 82.3%。 B、米糠蛋白质提取 从米糠中提取蛋白质的方法有化学法(碱法)[103]、酶 法[104,105]和物理分离[106] 等方法。无论采用哪种方法,都是通过破碎米糠的细胞结 构,使米糠蛋白溶出,从而达到提取蛋白的目的,但是方法不同会导致细胞破碎程 度不同,因而蛋白质提取率也会有差别。据报道,酶法对米糠蛋白质提取率可达 91.6%[105],化学法获得的产品中蛋白质含量为 33%~38% [103],物理法蛋白质回收率 最高可达 38.2%[106]。 13 C、垃圾中蛋白质提取 高凤彩[107]等人研究发现,通过向垃圾中添加一些活 性菌种,保持在一定的温度和 pH 值下,有机废物经过厌氧或好氧发酵分解成简单 易被自然界消化的物质。发酵的残渣中含有一定的菌体蛋白质,用硫酸水解法可以 提取大部分蛋白质,提取率达 80%以上。 D、污泥蛋白质提取 污泥细胞破壁的程度直接影响着蛋白质的提取率。王 芬[108]等采用加碱、加热、加热联合加碱 3 种预处理方式,对剩余活性污泥进行细 胞破壁的研究,发现加热联合加碱方法,不仅可以加大水解程度,还可以加快污泥 的破壁,内含物的流出。曹秀芹[109]等研究了不同声能密度 下,超声破解剩余污泥 的情况,结果表明,声能密度为 0.25 W/mL 时,破解污泥 30min,污泥上清液中溶 解性化学需氧量(SCOD)值从 133mg/L 上升到 2566mg/L;而声能密度为 0.5W/mL 下,破解污泥 30min 后,SCOD 值从 133mg/L 上升到 4532mg/L,可见超声波可以 使污泥细胞有效破解,内含物流出。Shier[110]等人采用热解方法从污泥中提取蛋白 质,试验证明,污泥蛋白质提取的最佳温度和时间分别为 150~155?和 20min,此 条件下可获得蛋白质大分子,若高于此温度,蛋白质便会继续分解成小分子片断。 Lau[111]采用机械匀质、酸化和热处理等方法对初沉池和二沉池污泥进行提蛋白试 验,发现从二沉池污泥中提取的蛋白质与初沉池污泥中提取的蛋白质相比,不仅蛋 白含量高而且污染物水平低,经检测所提取的蛋白质富含蛋氨酸、半胱氨酸和赖氨 酸等必需氨基酸。Chishti[84]等分别采用氢氧化钠、氯化钠以及二者结合方法提取污 泥蛋白质,发现使用氢氧化钠提取污泥蛋白提取率较高,pH 值为 12.5 时,最高可 使污泥中 90%的蛋白质溶解。硫酸铵可以有效沉淀溶液中的蛋白质,当硫酸铵的加 入量为 40%时,溶液中的蛋白质回收率最高(即蛋白质沉淀量最大),达到 91%。 综上所述,从固体废弃物中提取蛋白质的方法基本上分三类,即物理法、化学 法和酶法。但是固体废弃物往往含有多种有毒有害成分,在蛋白质提取的过程中, 这些有毒有害成分有可能会伴随蛋白质一起提取出来并混杂在蛋白质中,如果将这 些蛋白质制成饲料或添加剂饲喂动物,其中的有毒有害成分会逐渐在动物体内积累 危害动物健康。因此,从固体废弃物中提取蛋白质制备动物饲料,其安全性 的检测 非常重要。 ?[1] 张晓红. 生活污水中表面活性剂的去除方 法[J]. 太原科技,2006,(9):78-80 ?[2] 顾润南. 我国城市生活污水处 理方法述评[J]. 环境保护,2001,(9):46-47 ?[3] 姚亚男. 城市污水处 理现状分析及其市场化[J]. 辽宁经济, 2006,(11):1 ?[4] 国家城市给 水排水工程技术研究中心. 中国城市污水处理现状及规划[J]. 中国环 保产业, 2003,(1):32-35 ?[5] 刘莎,王洋. 我国城市污水处理工艺及 建议[J]. 商丘职业技术学院学报, 2006,5(2):109-111 ?[6] Low E W, Chase H A. Reducing production of excess biomass during wastewater treatment[J]. Water Research, 1999,33(5):1119-1132 ?[7] 徐强, 张春 敏, 赵丽君. 污泥处理处置技术及装置[M]. 北京:化学工业出版 社,2003,3 ?[8] Cenni R, Janisch B, Spliethoff H, et al. Legislative and environmental issues on the use of ashfrom coal and municipal sewage sludge co-firing as construction material[J]. Waste Management, 2001,21(1):17-31 ?[9] EU EEA. Sludge Treatment and Disposal: Management Approaches and Experiences [M]. Denmark: European Environment Agency, 1997 ?[10] EU EEA. Environmental assessment report No.2 Environment in the European Union at the turn of the century[M]. Denmark: European Environment Agency, 1999 ?[11] 林 云琴, 周少奇. 我国污泥处理、处置与利用现状[J]. 能源环境保 护,2004,18(6):15-18 ?[12] 马娜. 污泥资源化利用标准发展趋势探 讨[J]. 世界标准化与质量管理,2006(4):41-45 ?[13] 梁鹏,黄霞,钱易. 污泥减量化技术研究进展[J]. 环境污染治理技术与设备, 2003,4(1) :44-52 ?[14] 张宗国, 吴永丽, 何梦玲. 城市污水处理厂 污泥的土地利用[J]. 青岛建筑工程学院学报, 2004,25(2): 78-81 ?[15] 金儒霖, 刘永龄. 污泥处置[M]. 北京: 中国建筑工业出版社, 1988. ?[16] Malz F. Heavy metals and chlorinated hydrocarbons in sewage sludge[C]. Proceedings of the Workshop on Removal of Chlorinated Hydrocarbons and Heavy Metals from Wastewater by Advanced Treatment Systems.?. 1986 ?[17] Drescher-Kaden U. Contents of organic pollutants in German sewage sludges[C]. Sewage Sludge on Soil Fertility, Plants and Animals, 1992,14-34 ?[18] Alcock R E, Jones K C. Polychlorinaged biphenyls in digested UK sewage sludges[J]. Chemosphere,1993, 26(12):2199-2207 ?[19] Wang M J, Jones K C. Behavior and fate of chlorobenzenes in spiked and sewage sludge-amended soil. Environ. Sci. Technol., 1994,28:1843-1852 ?[20] 莫测辉, 吴启堂, 蔡全英, 等. 论城市污泥农用资源化与可持续发展 [J]. 应用生态学报, 2000, 11(1):157-160 ?[21] Wang M J. Land application of sewage sludge in China[J]. Science of the Total Environment, 1997,197(1-3):149-160 ?[22] 叶子瑞. 国内外污泥处置 和管理现状[J]. 环境卫生工程, 2002, 10(2):85-88 ?[23] 李亚东, 华 佳, 李海波. 剩余活性污泥的处置及再利用技术[J]. 工业安全与环保, 2005, 31(4): 26-29 ?[24] 李金红, 何群彪. 欧洲污泥处理处置概况 [J]. 中国给水排水, 2005,21(1):101-103 ?[25] Davis R D. The impact of EU and UK environmental pressures on future of sludge treatment and disposal[J]. Water Environ. Manage, 1996,10(2):65-69 ?[26] 林冬, 王 成端. 变废为宝的污泥资源化技术[J]. 环境导报, 2003,(15):9 ?[27] 姚刚. 德国的污泥利用和处置(?)(续)[J]. 城市环境与城市生态, 2000,13(2):24-26 ?[28] 王诗元 , 崔玉波 , 王翠兰 , 等 . 污泥处 理技术展望 [J]. 吉林建筑工程学院学报 , 2000,(1):25-28 ?[29] 赵 丽君, 张大群, 陈宝柱. 污泥处理与处置技术的进展[J]. 中国给水排 水, 2001, 17(6):23-25 ?[30] McGrath S P, Chang A C, Page A L, et al. Land application of sewage sludge: scientific perspectives of hevey metal loading limits in Europe and the United States[J]. Environ Rev, 1994,(2):108-118 ?[31] 日本污泥还田问题研究会. 王化信译. 关于 污泥还田的问题[J]. 国外环境科学技术, 1985,(5):63-67 ?[32] 王敦 球, 解庆林, 李金城, 等. 城市污水污泥的处理及综合利用[J]. 桂林 工学院学报, 1999,19 (4):387-390?[33] 陈荣柱, 任琳. 日本污泥处理 技术现状与动态[J]. 给水排水, 1999, 25(10):20-21 ?[34] 唐近春. 全 国土地资源保护和利用的概况与对策[M]. 中国土壤学会编,中国土壤 学在前进:中国土壤学会成立 50 周年纪念. 北京:中国科学技术出版 社, 1995 ?[35] 薛文源. 城市污水污泥处理与处置的途径[J]. 中国 给水排水, 1992,(8):41-46 ?[36] Kane L. Biological Process Upgrades Wastewater Treatment Units[M]. Hydrocarbon Processing. 2003 ?[37] Henglein A. Sonochemistry Historical developments and modern aspects[J]. Ultrasonics, 1987,(25):6-16 ?[38] 白晓慧. 超声波技术与 污水污泥及难降解废水处理[J]. 工业水处理, 2002,20(12):8-14 ?[39] Neis U. Ultrasound in water, wastewater and sludge treatment[J]. Water 21, 2000,(4):36-39 ?[40] Teihm A, Nickwl K, Neis U. The use of ultrasound to accelerate the anaerobic digestion of sewage sludge[J]. Wat. Sci. Tech., 1997,36(11):121-128 ?[41] Chu C P, Chang B V, Liao G S, et al. Observations on changes in ultrasonically treated waste activated sludge[J]. Wat. Res., 2001,35(4):1038-1046 ?[42] Kitazume M, Ueyama S, Benno Y. Solubilization of Activated Sludge by Isolated Acid-Forming Anaerobes[J]. Journal of Fermentation and Bioengineering, 1991, 72(4): 315-316 ?[43] Rocher M, Goma G, Begue A P, et al. Towards a reduction in excess sludge production in activated sludge processes: biomass physicochemical treatment and biodegradation[J]. Appl. Microbiol. Biotechnol., 1999,(51):883-890 ?[44] 翟小蔚, 潘涛, Ghyoot W, et al. 利用原生动物削减剩余活性污泥产量[J]. 中国给水 排水, 2000,16(11):6-9 ?[45] Wang B Z. A study on simultaneous organics and nitrogen removal by extended aeration submerged biofilm process[J]. Wat. Sci. Tech., 1991,24(5):197-214 ?[46] Song K G, Choung Y K, Ahn K H, et al. Performance of Membrane Bioreactor System with Sludge Ozonation Process for Minimization of Excess Sludge Production[J]. Wat. Res., 2003,157(1-3):353-359 ?[47] 周可新, 许木启, 曹宏, 等. 利用卫星动物削减剩余污泥量的研究[J]. 环境污 染治理技术与设备, 2003,4(1):1-5 ?[48] Chen G H, Mo H K, Liu Y. Utilization of a metabolic uncoupler 3,3’,4’,5-tetrachlorosalicylanilide (TCS) to reduce sludge growth in activated sludge culture[J]. Water Research, 2002, 36(8): 2077-2083 ?[49] Lee N M, Welander T. Reducing Sludge Production in Aerobic Wastewater Treatment Trough Manipulation of the Ecosystem[J]. Water Research,1996,30(8):1781-1790 ?[50] Saby S, Djafer M, Chen G H. Feasibility of using a chlorination step to reduce excess sludge in activated sludge process[J]. Wat. Res., 2002,36(3):656-666 ?[51] Shiota N, Akashi A, Hasegawa S. A Strategy in Wastewater Treatment Process for Significant Reduction of Excess Sludge Production[J]. Wat. Sci. Tech., 2002,45(12):127-134 ?[52] Adcock. P. Reed bed take on industrial waste. Water 21,1999,(2)50-52 ? [53] 李桂芳, 孟范平. 污水污泥对染料废水的吸附脱色性能研究[J]. 中国海洋大学学报(自然版), 2005,35(1):91-94 ?[54] 周少奇. 城市污 泥处理处置与资源化[M]. 广州: 华南理工大学出版社, 2002 ?[55] Okazawa K. Energy saving in sewage sludge incineration with indirect heat drying[A]. Processing of 1986 National Waste Processing Conference[C]. Dener, ASME,1986.177-191. ?[56] Jones R L, Hinesly T D. Nitrate in waters from sewage-sludge amended lysimeters[J].Environmental Pollution,1988,51(1):19-30. ?[57] Davis R D, Carlton-Smith C H, Stark J H, et al. Distribution of metals in grassland soils following surface applications of sewage sludge[J]. Environmental Pollution,1988,49(2):99-115. ?[58] Campbell H W. Sewage sludge treatment and use. London: Elsevier Applied Science,1989, 281-290. ? [59] 赵由才. 固体废物污染控制与资源化[M]. 北京:化学工业出版 社,2002 ?[60] 林志高, 张守中. 废弃活性污泥加碱与处理后厌氧消 化的试验研究[J]. 给水排水, 1997,23(1):10-15 ?[61] Tanaka S, Kobayashi T, Kamiyama K et al. Effects of thermochemical pretreatment on the anaerobic digestion of waste activated sludge. Wat. Sci. Tech., 1997, 35(8): 209-215 ?[62] 特木勒. 蛋白质饲料[J]. 当代畜禽养殖 业. 2004, (10):9 ?[63] 朱亚维, 齐淑德. 植物性蛋白饲料的科学利用 与加工(续)[J]. 河北农业科技, 2002,(2):38 ?[64] 田晓燕. 几种动物 性蛋白质饲料的开发利用[J]. 饲草饲料, 2002,23(5):30-31 ?[65] 周 元军. 昆虫蛋白饲料的开发应用[J]. 资源开发利用, 2005,(2):21-23 ? [66] 汉森. 添加二肽和三肽的蛋白质饲料[P]. 中国专利: 1124442 A, 1996 ?[67] 石栗敏彦. 含有氨基酸的混合饲料[P]. 中国专利: 1282526 A, 2001 ?[68] 孙清, 敖永华, 葛雯, 等. 甜高粱茎秆残渣生 产蛋白饲料的研究[J]. 中国农业科学, 2001,34(1):1-4 ?[69] 汪善锋, 陈安国.白酒糟资源的开发利用途径[J].饲料工业,2003,24(5):43~46 ? [70] 焦洪超, 宋志刚, 袁磊, 等. 5 种非常规蛋白质饲料氨基酸猪回 肠末端消化率的测定[J].饲料工业,2002,23(8):7~10 ?[71] 郭文龙. 解决动物性蛋白饲料紧缺问题的新途径——昆虫动物蛋白的开发[J]. 四川畜牧兽医, 2001,28(11):22 ?[72] 林绍青. 反刍动物对非蛋白氮 的利用原理及能力[J]. 中国奶牛, 2004,(5):25-27 ?[73] 谭支良, 黄 瑞林. 反刍动物蛋白质营养调控新技术[J]. 中国饲料, 2000,(9):12-14 ?[74] 杨贤钦. 非蛋白氮在反刍动物的利用[J]. 广西畜牧兽医, 2005, 21(3):109-111 ?[75] 王文侠, 吴耘红, 吴红艳, 等. 马铃薯渣酶法水 解液制备单细胞蛋白饲料[J]. 食品与机械, 2005,21(2):17-19 ?[76] 董衍明,马雁玲. 单细胞蛋白饲料的开发与利用[J]. 饲料研究, 2005,(9):25~27 ?[77] 马纯艳,王升厚. 菌糠单细胞蛋白饲料生产技 术的研究[J]. 食用菌, 2005,(3):56~58 ?[78] 李大鹏. 利用麦糟生产 单细胞蛋白饲料的研究[J]. 饲料工业, 2002,23(9):34-35 ?[79] 孔玉. 利用菌丝渣和中和滤液生产蛋白饲料[J]. 氨基酸和生物资源, 2002, 24(4):34-36 ?[80] 杨全福, 王首宇. 马铃薯渣半固态发酵生产单细 胞蛋白饲料研究[J]. 中国畜牧兽医, 2006,33(1):22-23 ?[81] 徐抗震, 宋纪蓉, 黄洁, 等. 液固态发酵苹果渣生产饲料蛋白的研究[J]. 化学 工程, 2006,34(9):47-50 ?[82] Caton J S. Effects of dairy biomass protein on ruminal fermentation and site and extent of nutrient digestion by lambs.J.Anim.[J]Sci,1989,67:27-62 ?[83]Clevenger T E,Safety and efficacy of food processing sludges as animal food:chemical characterization[J].Res.J.Water Pllout.Control Fed,1990:62(6):820-827 ?[84]Chishti S S, Hasnain S N, Khan M A. Studies on the recovery of sludge protein[J]. Wat. Res., 1992, 26(2):241-248 ?[85] 高桥俊三(张 自杰译). 活性污泥生物学[M]. 北京:中国建筑工业出版社, 1978 ? [86] 张自杰, 周帆. 活性污泥生物学及反应动力学. 北京:中国环境 科学出版社, 1989?[87] 许保玖, 龙腾锐. 当代给水与废水处理原理 (第二版). 北京:高等教育出版社, 2000 ?[88]Tanaka S, Kobayashi T, Kamiyama K et al. Effects of thermochemical pretreatment on the anaerobic digestion of waste activated sludge[J]. Wat. Sci. Tech., 1997, 35(8): 209-215 ?[89] 回瑞华, 侯冬岩, 李学成, 等. 荞麦中蛋白质 含量的分析[J].食品科学,2004,25(10):230-232 ?[90] 汪家政, 范明. 蛋白质技术手册[M].科学出版社,2000 ?[91] Lowry O H, Rosebrough N J, Farr A L, et al. Protein measurement with the Folin phenol reagent [J]. Biol Chem, 1951,(193):265-275 ?[92] Bradford M M. A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein dyebinding[J].Anal. Biochem.,1976, (72): 248-254 ?[93] 龚仁敏, 张方, 杨朝辉, 等. 水杨酸盐光度法测定蛋 白质[J]. 安徽师范大学学报(自然科学版), 2002,25(1):52-53 ?[94] 刘 邻渭, 陶健, 毕磊. 双缩脲法测定荞麦蛋白质[J].食品科 学,2004,25(10):258-261 ?[95] 魏琴, 吴丹, 张慧, 等. 蛋白质分析技 术的发展趋势[J]. 济南大学学报(自然科学版),2003,17(4): 312-320 ? [96] 姜能座 , 陈剑伟 . 用原子荧光 分 光 光度 计测 定食品中的 蛋白 [J]. 分析 试验室 , 2004,23(8):62-64 ?[97] 谢新华, 肖听, 刘 彦卓, 等. 小批量稻谷种子蛋白质含量的近红外透射光谱分析[J]. 湖 北农业科学,2004(20):16-18 ?[98] 赵环环, 胡跃高, 赵其波, 等. 近 红外光谱分析技术在黑麦草粉粗蛋白测定中的应用[J]. 动物营养学 报,2001,13(4):40-43 ?[99] 刘立明, 宋功武. 罗丹明 6G 生物探针 测定蛋白质[J]. 湖北大学学报,2001(4):363-365 ?[100] 唐延林, 黄 敬峰, 王人潮. 利用高光谱法估测稻穗稻谷的粗蛋白质和粗淀粉含量 [J]. 中国农业科学, 2004,37(9):1282-1287 ?[101] 叶生梅. 龙虾虾壳 蛋白质提取条件的研究[J]. 中小企业科技,2004(1):126-136 ?[102] 丁纯梅, 宋庆平, 张泽正. 正交法虾壳蛋白质提取条件的研究[J]. 安 徽工程科技学院学报, 2003,18(1):8-10 ?[103] Conner M A, Saunders R M, Kohler G O. Rice bran protein concentrates obtained by wet alkaline extraction[J]. Cereal Chemistry. 1976,53:488-496 ?[104]Wang M, Hettiarachchy N S Q, Burk M, et al. Preparation and functional properties of rice bran protein isolate[J]. Journal of Agriculture and Food Chemistry, 1999,47:411-416 ?[105] 李喜红, 代红丽, 魏安池. 酶法 从脱脂米糠中提取蛋白质[J]. 粮油加工与食品机械, 2005,(6):62-64 ?[106]Anderson A K, Gurayaa H S. Extractability of protein in physically processed rice bran[J]. Journal of the American Oil Chemists’ Society,2001,78:969~972 ?[107] 高凤彩, 张学才. 有机生活垃圾发 酵底物提取蛋白质的研究[J]. 安庆师范学院学报(自然科学版), 2001,7(1):31-33 ?[108] 季民, 王芬, 王暄, 等. 剩余污泥细胞破壁 技术初探[M]. 污泥处理处置技术及装置, 2003,150-154 ?[109] 曹秀 芹, 陈珺, 欧阳利, 等. 剩余污泥的超声处理试验研究[J]. 中国给水 排水, 2003,19(2):58-60 ?[110] Shier W T, Purwono S K. Extraction of single-cell protein from activated sewage sludge: thermal solubilization of protein[J]. Bioresource Technology, 1994,49(2): 157-162 ?[111] Lau D C W. Utilization of sewage sludge as a resource for protein extraction and recovery[J]. Conservation & Recycling, 1981,4(3):193-200 19 5.3、剩余污泥蛋白质的研究现状 剩余污泥主要由微生物、微生物自身氧化残余物、吸附在活性污泥表面上尚未 降解或难以降解的有机物和无机物四部分组成,其中,微生物包括细菌、真菌、原 生动物和后生动物等多个种类。细菌是组成微生物的重要成分,主要以菌胶团的形 式存在于剩余污泥中(图 1-2)。菌胶团的形成主要依靠细菌分泌的富含多糖、氨 基酸等物质的粘胶液,促进细菌的胶体粒子发生凝聚反应,进而使更多的细菌能够 进一步的凝聚在一起。由于这种粘胶液的作用,剩余污泥菌胶团的表面有一多糖类 粘质层[85,86]。污泥细菌结构具有如下特点:其细胞由细胞壁、细胞膜、细胞质以及 细胞核质等构成,细胞壁由脂类、蛋白质、多糖的聚合物组成,其外围有一层多糖 类物质称为荚膜,细胞壁内还有一层主要由蛋白质和磷脂组成的细胞膜。在细菌的 荚膜、细胞壁和细胞膜这三层物质的包围下是细胞质,包括核糖体、细胞核以及颗 粒状内含物等,主要化学成分是蛋白质[87]。可见,剩余污泥中的蛋白质主要存在于 污泥细菌的细胞壁及其内部物质中。 图 1-2 几种不同形态的菌胶团 Fig.1-2 Zoogloea of several different forms 处理生活污水产生的剩余污泥(WAS)含有 41%的蛋白质、25%类脂、14%的 碳水化合物和 20%未知成分[88]。三种有机成分中,以碳水化合物的溶解性最大。 经过热化学预处理后,90%的碳水化合物、64%的蛋白质和 61%的类脂是可溶解的。 11 由此可见剩余污泥是一种潜在可利用的饲料蛋白。按我国年排放干污泥 700 万吨计 算,若污泥蛋白质提取率为 30%,则制成的蛋白饲料就可能达到 210 万吨,可以解 决 5%~10%蛋白饲料缺口。由此可见,利用污水处理厂剩余污泥,开发生产代粮饲 料既利于环境保护,又缓和了饲料市场供不应求的局面,降低成本,提高了经济效 益,具有广阔的应用前景。 从剩余污泥中提取蛋白质就是使污泥中的微生物蛋白质释放出来,变成可溶物 质的过程。细菌细胞壁主要由肽聚糖组成,是一种半刚性结构,其分子形成纵横交 叉的网状结构,肽聚糖中任何键的断裂都有可能使其对细菌的保护作用丧失,从而 使细菌破裂,细胞内含物质流出。污泥蛋白质的提取需要首先破坏污泥的结构和细 菌的细胞壁,使污泥絮体结构发生变化,细胞内的内含物溶出,进入水相,从而达 到分离有机质(主要蛋白质)的目的。另外,污泥成分非常复杂,其中的重金属、 病原菌、寄生虫(卵)和有毒有机物在蛋白质提取的同时有可能被一同提取出来。 因此,用何种方法从剩余污泥中高效提取蛋白质,并保证所提取的蛋白质作为动物 饲料的安全性,是污泥提取蛋白技术需要关注的问题。 5.4、花色苷的提取研究现状 目前在花色苷的提取的方法主要有:溶剂浸提法、微波辅助萃取法、超声波辅助提 取法、酶解提取法、超临界萃取法、超高压辅助提取法[J.M. Luque-Rodrluez,2006; Brigita Lapornik,2005 邬元娟等,2008;李晓银,2006;王萍等,2008;彭雪萍等,2008;万水昌,2008;魏安池,2005]。 1.2.3.1 溶剂浸提法 国内关于葡萄色素提取方面报道最多的是溶剂提取法,如马海燕等[马海燕,2005]分别用 1%盐酸甲醇、5%盐酸甲醇、5%盐酸乙醇、60%丙酮水溶液法、醋酸甲醇水溶液、pH为 1.0的酸 水溶液等溶剂对葡萄皮的花色素进行了提取方面的研究。薛海燕等[薛海燕,2005]也用 盐酸-乙醇溶液开展了提取葡萄皮中花色素的研究。 1.2.3.2 微波辅助萃取法 微波萃取则是利用微波能来提高萃取效率的一种较新技术。微波是一种频率300~ 300 000 MHz的电磁波。在微波场中吸收微波能力的差异使得基体物质的某些区域或萃 取体系中的某些组分被选择性加热,从而使得被萃取物质从基体或体系中分离,进入到 介电常数较小、微波吸收能力相对较弱的萃取剂中[邬元娟等,2008]。由于传统提取过程中能量 累积和渗透过程以无规则的方式发生,萃取的选择性较差,只能通过改变溶剂性质或延 长溶剂萃取时间来获得,同时又受限于溶解能力和扩散系数,效果不够理想;微波因其 5 能对萃取体系中不同组分进行选择加热,因而能使目标组分直接从基体分离萃取。微波 萃取受溶剂亲和力的限制较小,可供选择的溶剂较多。另外,微波加热则利用分子极化 或离子导电效应直接对物质进行加热,避免了传统加热过程因热传导、热辐射造成的热 量损失,加热效率高、升温快速均匀,缩短了萃取时间。具有设备简单、适用范围广、 重现性好、萃取效率高、萃取时间短、能耗低、污染轻等特点。 过去微波辅助提取技术主要存在于提取多糖等物质中。随着技术的发展,已经有学 者展开用微波辅助提取植物中花色苷的研究。唐克华、于华忠等[唐克华等,2002]应用微波萃取 法提取天仙果红色素,结果表明微波处理对天仙果红色素有弱的助提作用。蔡金星、刘 秀凤等[蔡金星等,2003]研究了用微波-超声波联用法提取草莓色素,结果表明微波和超声波处 理通过打断色素与组织细胞的结合,在 很大程度上提高草莓色素的提取率。李巧玲[李巧玲, 2003]对微波萃取柚皮色素进行了研究,结果表明微波辅助浸取可以使固液浸取过程得到 明显强化,采用微波技术仅需4min便可使整个浸取过程达到平衡,其OD值为0.632,而 传统方法则需要120min左右才能达到平衡OD值0.570。但是微波处理过度也会引起色素 的破坏。 1.2.3.3 超声波辅助萃取 超声波是指频率为20千赫~50兆赫的电磁波,它是一种机械波,需要通过能量载体 (介质)来传播。超声波在工业清洗、干燥、杀菌、雾化及无损检测等方面,是一种广 泛应用的技术。超声波技术近年来在天然产物提取中有了越来越多的应用。特别是在中 草药有效成分提取分离方面,超声波辅助提取技术目前已成为一种较为成熟的手段。利 用超声波产生的强烈振动、高加速度、强烈空化效应、热效应、搅拌作用等,可以加速 药物有效成分进入溶剂,提高提取效率、缩短提取时间、节约溶剂、避免了高温对提取 成分的破坏。目前,超声波提取技术主要是在提取黄酮类、皂苷类、生物碱类、萜类、 挥发油、有机酸类以及多糖类物质中应用较多。超声波辅助提取技术在一些色素类物质 如番茄红色素和叶绿素的提取研究中有一些报道。左爱仁[左爱仁,2003]研究了超声波提取番 茄红素的工艺条件,结果显示用超声波法提取番茄红素与超临界萃取法提取番茄红素相 比,提取时间缩短,提取率提高。岳辉吉,朱杰[岳辉吉,2006]也用超声波辅助提取叶绿素并 且和单纯浸泡法作了比较,结果表明超声波辅助提取可以提高植物中叶绿素的提取效 率。近来已经有研究将超声波辅助提取技术应用于花色苷等水溶性色素的提取中。阎宁 环等 [阎宁环,2007]用超声波辅助提取黑莓中的花色苷,取得了良好的效果。但超声波辅助提 取法目前由于设备上的原因,在大型生产上的应用较少。 1.2.3.4 超临界流体萃取法 超临界萃取技术(Supercritical Fluid Extraction, SFE)是上世纪 70 代末 80 年代初发 展起来的一项新型的分离方法。超临界流体是指处于超过物质本身的临界温度和临界压 力状态的流体。超临界流体萃取技术是一种以超临界状态下的流体作为溶剂,利用该状 态下流体所具有的高渗透能力和高溶解能力萃取分离混合物的过程[徐兆瑜,2006, 高彦祥,2206]。在 6 各种超临界流体溶剂中,CO2以其安全无毒、廉价易得、不可燃等优势而占主导地位。 特别是超临界 CO2 流体的萃取温度稍高于常温,有利于对温度敏感物质的萃取。并且 整个萃取过程是处于无氧环境中,使产品中的易氧化成分得以保存。通过改变萃取温度、 压力和夹带剂,就可以选择性地提取所需物质,兼有精馏和萃取两种作用。超临界流体 萃取技术在出现以来发展,先后应用于医药、香料、化妆品、保健食品等行业。20 世 纪 80 年代中期,超临界 CO2萃取技术逐步应用于中药有效成分的提取分离及分析,近 来已经有学者开始了将其运用到天然食用色素的提取与纯化方面的研究报道。但目前超 临界 CO2 萃取技术对色素类物质的萃取,主要萃取一些脂溶性色素如辣椒红色素、枸 杞色素、玉米黄色素、番茄红素、类胡萝卜素等物质[李大婧,2005; 曹敏惠,2006; 李守君,2005,陈效忠等,2005] 提取花色苷类等水溶性的色素的报道很少。李雄辉,季清荣[李雄辉.2003]采用乙醇溶液多级 浸取、固液分离、微孔膜过滤、真空薄膜浓缩,再由超临界 CO2 萃取分离、真空冷冻 干燥得到亲水性的栀子黄色素,产品提取率、纯度、色价较传统工艺有明显提高。王振 宇等[王振宇,2005]用 CO2超临界萃取-超声波联用法进行了大花葵花色苷提取方面的研究。 1.2.3.5 酶解法 酶是一种生物催化剂,具有高效性、专一性等特点。在天然食用色素提取生产中, 由于天然色素一般在高温、强酸、强碱发生变化或分解,而酶催化反应条件温和,一般 在较低温度、接近中性的条件下就能进行,所以酶解法非常适合于天然食用色素的提取 与精制[王萍,2008]。目前为止已经有了用酶解法辅助提取花色苷的报道。向道丽[向道丽,2005] 用纤维素酶水解法提取越桔果渣花色苷,并将酶解法与传统乙醇浸提法进行比较,结果 表明在一定条件下用酶解法提取的花色苷色价比用传统乙醇法提取的花色苷色价高30 %。王振宇[王振宇,2004]等研究利用酶解法提取大花葵花苷,通过纤维素酶水解使纤维素的 长链发生断裂、细胞壁破坏,从而使吸附在纤维素及细胞壁上的花色苷得以释放。葡萄 皮纤维素和果胶含量较高,花色苷存在于细胞内或吸附在由纤维素组成的细胞壁上,选 用合适的酶可以较温和地将植物组织分解,加速有效成分的释放,从而提高提取率。虽 然利用酶法提取有上述优点,但也有不足,因为酶解时也可能将花色苷的糖苷键破坏, 并且容易生成其他未知的杂质,为后来的纯化造成一定的麻烦。 1.2.3.6 超高压辅助提取法 超高压技术是近年来引起广泛关注的”高新技术”之一[彭雪萍等,2008; 陈瑞战等,2007]。超高压 技术最初应用于食品保鲜、品质改良、安全控制、乳化和成型等方面,并由此推动了相 关生物技术的基础研究。随着超高压技术应用 范围的逐渐扩展和技术发展的日趋成熟, 已经有学者将超高压技术应用于中药等天然产物的提取中。与传统的煎煮、回流等提取 方法相比,超高压技术辅助提取技术具有时间短、能耗低、溶剂消耗少、杂质成分溶出 少、收率高、环保等优点。另外,超高压技术是常温提取,很大程度上避免了因热效应 而引起的有效成分损失及生理活性降低,可以更好地保持天然色、香、味和营养成分。 但目前为止,由于超高压设备比较昂贵等原因,还未见将超高压技术应用到花色苷提取 7 当中的研究报道。 5.5、PPP 提取的研究现状 目前,国内外有关PPP提取工艺的研究和报道很少,且大多不成熟。陈改荣等(1997) 采用盐沉析法从马铃薯渣中提取果胶,得率为23%[52],果胶纯度为65.15%。张应桂等 (1998)以硫酸铝沉析法从马铃薯渣中提取果胶,得率为23%[53],果胶纯度为64.66%。郑 燕玉(2004)等用微波法提取PPP,平均得率为25%[54],果胶纯度为60.09%。以上报道均 没有对所提取果胶的纯度做进一步研究。Abousteit和Kempf(1974)采用60?以下常压提 取10 h,得到较纯的果胶[22]。Michel Huchette等在用热水预处理过的薯渣中加入葡萄糖 酶去除糖分增加果胶浓度[23]。T.Turquois等(1999)在不同条件下提取果胶,并对其凝胶性 能进行了研究,结论是碱法提取的PPP的凝胶性能比较好[19]。 5.6、酒糟中蛋白质的研究现状 据资料显示,酒精糟中蛋白质的组成主要为: 醇溶蛋白(zein)、球蛋白、 麦白蛋白和谷蛋白。它们的主要特性分别为:麦白蛋白,分子量70KD ,等电点 为4.6~5.8,溶于水、稀盐液、酸、碱中,在酒精糟中含量少;球蛋白,分子量 100KD~300KD ,等电点为4.9~5.7,不溶于水及盐液,溶于酸、碱,在酒精糟 中含量少;醇溶蛋白,分子量21KD~23KD ,等电点为6.5 ,不溶于水及盐液, 溶于体积分数60%~95%的酒精及酸、碱溶液,在酒精糟中含量最多[17]。 5.7、杂豆类蛋白质研究现状 蛋白质是豆类植物种子中最主要的营养成分,杂豆籽粒中的蛋白质含量为 20%~30%。在植物蛋白中,杂豆籽粒的蛋白质含量仅次于大豆,不仅高于禾谷类。杂豆 的蛋白质中含有人体必需的多种氨基酸,特别是谷类蛋白质中缺乏的赖氨酸,在杂豆的 蛋白质之中含量丰富。 由于产量大、含量高、应用广泛等原因,大豆蛋白的研究一直是人们关注的热点, 研究的内容非常广泛,也比较深入。目前已经有专门的厂家来生产各种大豆蛋白制品, 其产品已逐步应用于食品领域的各个行业。 二十世纪七十年代后期,高淀粉、高蛋白质的杂豆类也开始得到关注,特别是一些 种植范围比较广泛、产量较大的杂豆,其蛋白质的性质以及应用的研究逐渐开展起来, 但是相对与大豆蛋白而言,相关研究要少很多。目前,鹰嘴豆[59-61]、豇豆[62-64]、绿豆[65-67]、 蚕豆[68-70]、豌豆[70-72]、芸豆[73-74]等的蛋白质性质均有相关报道。在 大豆蛋白质研究过程 中,已经形成了一系列成熟的分析方法,这些方法方法都可以用于杂豆蛋白质研究。对 15 华南理工大学硕士学位论文 于豆类蛋白的研究主要包括:蛋白质的提取工艺与方法,蛋白质的分子结构与大小,蛋 白质的组分分离及性质,蛋白质的氨基酸组成与比例,蛋白质的营养价值,蛋白质的功 能特性,蛋白质多肽的制备及其功能,蛋白质改性,蛋白质产品开发与应用等方面。由 于国外开展相关研究较早,也较深入,很多研究方法已经成为蛋白质研究的基础方法。 而且,大型蛋白质分析仪器的开发也极大地促进了蛋白质研究的进程,如凝胶电泳装置 用于分离蛋白质组分、凝胶过滤色谱用于测定蛋白质分子量大小、高效液相色谱用于测 定蛋白质氨基酸组成与比例、差示扫描量热仪用于分析蛋白质的热变性情况等。 5.8、昆虫蛋白质的研究现状 1.3.1 昆虫蛋白食品开发的国内外研究现状 人类食用昆虫的习惯古已有之。随着科学技术的进步,人们对昆虫蛋白质的含量 和组成有了深入了解,可食用昆虫蛋白的利用已由原来的整形食用和简单加工的传统 食用方法向保健食品和食用添加剂等方向发展。 1.3.1.1 国外研究现状 有资料显示,国外的食用资源昆虫有知了、蟑螂、蜗牛、蚯蚓、蚂蚁、蟋蟀、蝴蝶、 蚱猛、湖蝇、蜘蛛、螳螂等[27]。墨西哥、日本、德国、法国、美国等国家,昆虫食品产 业起步较早[28]114,目前投放市场的昆虫食品有蜜饯、饼干、面包、罐头、饮料等。墨西 哥已证实了有潜在营养价值的昆虫有2346种,并把60余种可食昆虫 加工成食品出口到美 国、法国、日本和比利时等国家[29];以蚕蛹为原料制取优质蛋白和开发氨基酸系列产品, 这一技术在日本已比较成熟,并取得多项专利[30];德国已可规模化生产昆虫蛋白质;美 国早在90年代就实现了食用资源昆虫的工厂化养殖[31];美国DNAP公司向冰淇淋和冰奶 中加入抗冻蛋白,消除了冰渣,并改善了产品的风味品质和口感[32]。 1.3.1.2 国内研究现状 (1)提纯蛋白粉 工艺流程:虫体?预检?杀灭?脱脂?酸沉淀?脱色?脱臭?烘干?研磨?水沉 淀?洗涤?过滤?除糖?沉淀?过滤?浓缩干燥?虫蛋白成品 提纯蛋白粉常作为食品营养强化剂或特殊营养素,加入到普通食品中,以均衡营 养、提高食品品质。以昆虫蛋白粉的添加量为依据,蛋白制品可分为三类[33]:(1)高 蛋白制品:昆虫蛋白质含量高于 20%,产品包括糕点、面包、饼干、蜜饯等;(2)常 蛋白制品:昆虫蛋白质含量为 10%~15%之间,常为大宗食品;(3)低蛋白制品:昆 虫蛋白质含量低于 10%,为消化不良或肠胃不好的人食用,常见的食品有面条、奶粉、 饼干、面包、糖果及婴幼儿食品等。 (2)复合氨基酸口服液 工艺流程:鲜黄粉虫?挑选?洗涤?微波烘烤?磨粉?酶解?灭酶?粗滤?离心 5 ?脱色?脱臭?调配?防腐?装罐?封口?灭菌?包装?成品。 白虹等使用蛋白酶水解蚕蛹蛋白,并利用其蛋白水解液研制蛋白饮料和复合氨基 酸口服液。由于组成昆虫蛋白的氨基酸含量高,组成合理,易于吸收,其制成的复合 氨基酸口服液适宜人群逐渐从病人、孕妇向儿童、老年人等方向发展。 (3)蛋白肽及其运动饮料 蛋白肽工艺流程:蚕蛹蛋白粉?酶解?蚕蛹蛋白肽?精制?调配?灌装?灭菌 ? 成品 陈静等[34]采用碱性蛋白酶水解脱脂蛋白粉制备蚕蛹蛋白肽,并研制出蚕蛹蛋白肽 运动饮料的最佳工艺,具有缓解体力疲劳的功能。 (4)抗冻蛋白食品添加剂 昆虫抗冻蛋白作为一种食品添加剂,可改善冷冻食品的品质,提高食品的质量[35]。 (5)防腐剂、保藏剂 昆虫抗菌肽具有广谱抗菌活性,对真核细胞基本无作用,用它能够防止食品腐败 变质,且安全可靠;此外,昆虫抗菌肽热稳定性良好,可应用于热加工食品,防止巴 氏杀菌后的再污染和食品发酵过程中的杂菌污染[28]115。 (6)昆虫发酵饮品 1)虫酒 工艺流程:新鲜虫体?预检?清洗?酒精浸泡?发酵?过滤?调配?装瓶?成品 虫酒在我国制作和食用较为普遍。在黑龙江,蚕蛾用来生产的蚕蛾酒[36],远销国 内外;云南、江苏以蚂蚁作原料成功研制的金刚酒,受到人们的追捧;蚂蚁粉在类风 湿和癌症等治疗方面具有独特的效果。 2)发酵蛋白酸奶 工艺流程: 蚂蚁蛋白、蔗糖 工作发酵剂?菌种 ? ? 鲜乳?净化?标准化?调配?均质?杀菌?冷却?接种?过滤?发酵?冷却?灌装 ?后熟?成品 6 赵大军等[37]以蚂蚁为原料,经过酶解制成的蚂蚁蛋白粉,添加到酸奶加工配方中, 研制出一种高蛋白、营养丰富、酸甜适口的凝固型蚂蚁蛋白酸奶产品,具有抑制肠道 致病菌生长、促进益生菌生长、调整肠道的菌群平衡、消化与吸收等作用,且对人体 有一定的保健功能。 3)发酵酱油、豆酱: 生产酱油工艺流程:虫体?预检?脱脂?粉碎?配料?水解?接种?发酵?成品 我国婴幼儿食品营养研究开发中心,采用微生物发酵法,研制出”蚕蛹豆酱”、”营 养酱油”等。 1.3.2 大麦虫资源开发应用和研究现状 目前,我国大麦虫资源主要应 用在饲料、食品粗加工、环保等几个领域,而以其 为原料的深加工产品甚少。但是,大麦虫的营养价值已经引起了更多的科研人员和农 民的关注,相关的试验性研究仍在进行,现总结如下: 1.3.2.1 饲用 (1)蛋白质营养强化剂 大麦虫蛋白质含量高、纤维少、微量元素丰富,如铜、 铁、锌、硒等,氨基酸组成合理,容易被消化吸收,是优质的蛋白质饲料资源[38-39], 在畜禽养殖中应用大麦虫蛋白粉,可显著提高畜禽质量和产量。 (2)活体饵料 大麦虫幼虫体内除营养素含量丰富、营养价值高外,其体壁甲 壳质含量较低,容易被饲喂动物消化吸收。目前,大麦虫已经逐渐代替黄粉虫成为越 来越多的名贵观赏鱼、捕食性动物和两栖爬行类宠物的专用活体饵料。 1.3.2.2 食用 (1)直接食用 在我国,食用昆虫的历史可追溯至 3000 年前。大麦虫作为可食 用资源昆虫,以其独特的营养价值和特殊风味,早已引起人们的重视。大麦虫的主要 制作方法有油炸、烧烤、活体食用以及制作高级菜肴等,深受人们喜爱,在我国南方 更为受欢迎。 (2)大麦虫蛋白质应用 大麦虫作为食品直接被人们食用还需要一个接受的过 程;目前提倡以蛹体或蛹粉为主体原料,改变其食用形式,添加到面包、蛋糕及酱油 7 等;由于大麦虫蛋白质含量较高,应用价值较大,故关于蛋白质提取等相关方面的研 究较多,为大麦虫蛋白质的应用提供一定依据。 郭倩、欧晓峰、张建新、祝海娟等人分别用不同的方法从大麦虫体内提取出蛋白 质,并根据溶解性的不同将大麦虫蛋白质分离出水溶、酸溶、碱溶和醇溶蛋白四类, 并对其抗氧化性进行探究。 1.3.2.3 功能性成分提取 刘娜等[40]采用响应面法对 SOD 的提取工艺进行优化并得出大麦虫的 SOD 活性、 提取率均远高于其他昆虫。欧晓峰等[20]研究了大麦虫蛋白水解液的分子量分布,不同 分子量的抗氧化能力,并分离纯化了抗氧化活性肽。陈雯婷等[41]对大麦虫不同虫态甲 醇粗提物化学成分进行分析和比较,试验结果表明大麦虫蛹甲醇粗提物中提取的化学 物质,有部分在幼虫和成虫甲醇粗提物中不存在,此结论可为大麦虫不同生物阶段的 区分提供理论依据。 1.3.2.4 虫粪基有机肥的应用 蒙健宗等[42]进行培育秀珍菇试验,研究结果表明,施用以大麦虫沙为主要原料的 高效生物有机肥,可提高土地肥力,促进土壤环境生物多样性,改善作物品质,提高 产量等特点。 1.3.2.5 环保 针对大麦虫对塑料制品的食用特点,苗少娟等[43]用不同的粗料制品饲喂大麦虫, 并借助热重分析同步差热分析和傅里叶转换红外光谱分析,对大麦虫取食后的排泄物 组成成分进行分析,结果证实大麦虫对塑料具有一定的降解作用。 5.9、-- 蚂蚁算法的应用研究现状 自从蚂蚁算法在著名的TSP问题[22]和工件调度问题[23]上取得成效以来,现已经陆续渗透到其它领域 中,求解各类问题。蚂蚁算法在若干领域已经获得了成功的应用,其中最成功的是在组合优化问题中的 应用。可以将这些应用分为两类[2,24]:一类应用于静态组合优化问题。静态组合优化问题指的是在解决 问题的时候,该问题的拓扑分布和转换开销不会发生变化;另一类则是应用于动态组合优化问题。与静 态组合优化问题不同,动态组合优化问题的求解过程中,该问题的 拓扑分布或转换开销可能会发生改变。 例如网络路由问题。 河北工业大学硕士学位论文 19 在静态组合优化问题方面,在Dorigo等人于 1991 年将AS应用到TSP问题中之后,1994 年Maniezzo 等人将AS推广到了二次分配问题[24](Quadratic Assignment Problem,QAP)的求解,提出了AS-QAP算 法[25];同年Colorni等人将AS用于求解调度问题,提出了AS-JSP[22]算法;1997 年Stuzle和Hoos也将MMAS 用于求解QAP[26];同年Costa和Hertz将蚁群算法用于图着色问题[27]的求解。 蚂蚁算法在动态组合优化问题方面的应用主要集中在通讯网络方面[28]。这主要是由于网络优化问 题有一些特征,如内部信息和分布计算,非静态随机动态,以及异步的网络状态更新等,这些与蚂蚁算 法的特征匹配得很好。蚂蚁算法已被成功地应用到了网络路由问题上。最早的是Schoonderwoerd等人于 1996 年将AS应用到了电路交换网络中路由负载平衡问题的求解。他们基于蚂蚁算法的思想提出了 ABC[29](Ant Based Control)算法来尝试解决电路交换网络中的负载平衡问题。ABC的提出为以后使用 蚂蚁算法解决动态组合优化问题奠定了基础。 随后,Guerin在ABC的基础上提出了Smart Ants以求解电路交换网络中负载平衡问题;之后Bonabeau 对Smart Ants进行调整并优化算法性能。Subramanian等人基于ABC算法,针对分组交换网络(如Internet) 设计负载平衡算法[30]。另一个由ABC思想衍生出的算法是Heusse提出的CAF[31](Cooperative Asymmetric Forward) 算法。CAF与ABC不同之处在于它使用反向路径开销来确定信息素的更新。 蚂蚁算法在动态组合优化问题另一个非常成功的应用是Di Caro和Dorigo提出的AntNet[32]算法。 AntNet在网络吞吐量和网络延时方面都比当时存在的算法优秀。 并且国外的一些大公司,比如惠普公司和英国电信公司在 20 世纪 90 年代中后期也相继开展了这方 面的研究,他们应用蚁群路由算法(Ant Colony Routing,ACR)。 除了各种组合优化问题之外,蚂蚁算法还在函数优化、系统辨识、机器人路径规划、数据挖掘、大 规模集成电路中的综合布线设计等领域取得了令人注目的成果。 作为通用型随机优化方法,蚂蚁算法自问世以来都表现出了强大的生命力,较之以往的启发式算法 不论在搜索效率上,还是在算法的时间复杂度方面都取得了令人满意的效果。现已陆续应用到组合优化、 人工智能、通讯等多个领域。蚂蚁算法的正反馈性和协同性使其可用于分布式系统,隐含的并行性更使 之具有极强的发展潜力。从数值模拟结果来看,它比目前广泛研究的遗传算法、模拟退火算法等有更好 的适应性。但是必须指出,蚂蚁算法作为一种概率算法,从数学上对它们的正确性与可靠性得证明还是 比较困难的,所做的工作比较少,有许多问题有待进一步研究,如算法的收敛性、理论依据等。但可以 想象,随着研究的深入,蚂蚁算法也将同其他模拟进化算法一样,获得越来越多的应用。 具有禁忌搜索能力的蚂蚁算法研究 20 2-3 蚂蚁算法的基本框架 5.10、--1 蚂蚁算法的理论研究现状 1991 年,Dorigo根据生物界中蚂蚁觅食的群体协作行为提出了最早的蚂蚁算法——蚂蚁系统(Ant System,AS)[10]。并将其应用到了求 解TSP问题的过程中。 虽然大量实验证明,蚂蚁算法具有较强的鲁棒性和搜索较好解的能力,但同时也存在一些缺陷,如 收敛速度慢、易出现停滞现象等。针对算法的不足,学者们相继提出了许多蚂蚁算法的改进策略。 1992 年,Dorigo提出了最早的改进蚂蚁算法-带精英策略的蚂蚁系统[11](Ant System with elitist stradegy,ASelite),其改进思想来源于遗传算法中的精英策略思想。之后,Dorigo等人在AS的基础上提 出称为Ant-Q System[12]的更一般的蚂蚁算法。Ant-Q算法中,蚁群每次环游时都让信息量最大的路径以 较大的概率被选中,以充分利用学习机制,强化最优信息的反馈。该算法建立了AS与Q-learning[12]的联 系。实验模拟表明Ant-Q是一个非常有效的算法。 此外,在 1996 年,Dorigo和德国学者Thomastuzle又分别提出了蚁群系统[13](Ant Colony System, ACS)和最大-最小蚂蚁系统[14](MAX-MIN Ant System,MMAS)。ACS是Ant-Q算法的后继产物。由 具有禁忌搜索能力的蚂蚁算法研究 18 于它比Ant-Q算法简单并且实验证明其性能与Ant-Q相当,因此在很多问题的求解上ACS逐渐取代Ant-Q 算法。ACS对AS的改进之处在于它除了利用蚁群在以前环游中所释放的信息素作为寻路依据,更加重 视其在求解空间中进行新的探索。这是通过两种机制实现的:一方面,它采用了前面所述的精英机制来 更新信息素;另一方面,在个体蚂蚁选择路径的时候,采用一种被称为伪随机概率选择规则[11] (Pseudo-random Proportional Rule)来鼓励蚂蚁探索求解空间中的新解。MMAS的基本思想是对各路径 上能够容纳的信息素总量进行限制,设定其上、下限值,以使蚂蚁不会过分集中在 某几条路径上,鼓励 蚂蚁搜索新解;同时采用与ACS类似的精英机制,仅让每一代中最好的蚂蚁对所走路径上的信息素作调 整,以加快算法收敛速度。实验证明,ACS和MMAS这两种算法在求解效率上要明显好于AS。 1997 年,Bullnheimer、Hartl&Strauss将遗传算法中的排序思想引入到蚂蚁算法中,提出了基于排序 的蚂蚁系统[15](Rank-based Ant System,ASrank)。在每次环游完成之后,ASrank将蚂蚁按各自爬过的路 径长度进行排序,只有前N只最优的蚂蚁被允许对所爬过的路径上的信息素进行更新,并且越优秀的蚂 蚁释放的信息素量越多。ASrank算法保持了精英机制对收敛速度的提高并且在一定程度上得到了比精英 机制更优的解。 近些年来,改进的蚂蚁算法中出现了一些将蚂蚁算法与其他仿生算法结合的改进策略,希望借助优 势互补,取得算法性能上的提高。例如T. White等人受遗传算法的启发,提出了蚂蚁算法和遗传算法相 融合的混合优化算法ASGA[16]。 随着蚂蚁算法的研究发展,国内的学者也开始关注这一算法,并提出了一些改进算法,对蚂蚁算法 的研究与发展也做出了一定的贡献。其中,也有一些将蚂蚁算法与其他智能优化方法相结合的改进算法, 如遗传算法与蚂蚁算法相结合的改进算法:吴庆洪等人提出的具有变异特征的蚂蚁算法[17](Mutation Ant System,MAS);陈烨提出的带杂交算子的蚁群算法[18](Crossed Ant Colony System,CCAS);丁建立 等人提出的遗传算法与蚂蚁算法的融合[19](Genetic Algorithm-Ant Algorithm,GAAA)。免疫算法与蚂 蚁算法相结合的改进算法:胡纯德等人提出的基于人工免疫算法和蚁群算法求解旅行商 问题[20];蒋加 伏等人提出的基于免疫——蚂蚁算法的多约束QoS路由选择[21]。 还有通过自适应性地改变算法的相关参数的改进算法:如自适应调整信息素的蚁群算法;具有分工 的自适应蚁群算法;基于协同学习机制的蚁群算法等。 以上这些改进算法都从不同方面对蚂蚁算法进行了有效的改进,对算法的发展做出了一定的贡献, 为蚂蚁算法在更多领域中的应用奠定了坚实的基础。 5.11、研究现状 目前,国外研究主要集中在将蚂蚁算法应用于其它复杂的问题及蚂蚁算法本 27 天津大学硕士学位论文 第二章 蚂蚁算法 身的完善,最近国外发表的几篇文章用蚂蚁算法来解多重背包问题(Multiple Knapsack) [52]、视频网络路由问题(Optical Netqworks Routing) [53]以及证明 蚂蚁算法的收敛性[54]等。 目前国内对蚂蚁算法的研究还不深入,研究的内容比较局限,研究人员较 少。国内研究的主要方面是将蚂蚁算法应用于通信领域中路由选择问题和组合优 化问题。路由选择问题包括:分布式QOS路由选择[55]、时延受限分布式路由 选择[56]及ATM网的VC路由选择[57]等;组合优化问题有货郎担问题(TSP)。上海理工 大学管理学院马良教授发表了多篇有关蚂蚁算法在货郎担问题(TSP)方面的应 用。 国内外研究目前在组合优化的其他问题上如:任务分配问题(Scheduling Probulem)和JSP(Job-Shop Problem)等NP-hard问题方面的研究仍然是空白。 6、研究方法、思路 6.1、豆渣蛋白质的提取方法研究进展 蛋白质的提取方法主要可分为 4 大类,主要有酸碱度法、酶法、超声波提取法 和反胶束萃取法等[ 53-55]。 其中酸碱度法、酶法和超声波提取法在豆渣蛋白质的提取 中都有应用。 (1)酸碱度法 酸碱度法是利用蛋白质是一种具有等电点的两性电解质的特性来提取蛋白质 的一种方法,先调节溶液的 pH 值使原料中的蛋白质尽可能多的溶解到溶液中,然 后将杂质分离出去,再调节溶液 pH 值到目标蛋白质的等电点,使目标蛋白质沉淀 出来,而提取蛋白质的方法。 张恒等[ 56]和 邵晓芬等[ 57]都 对以豆渣为原料,提取蛋白质进行了研究,他们的研 究结果基本一致。提取蛋白的方法为:豆渣与水的料液比为 1:6 混合搅拌,调节 pH 值为 11-12,提取 30 分钟、离心使液体和固体分离,去其上清液调节 pH 值 5.4 使 蛋白质沉淀并分离。李静等[ 58]以 豆渣为原料,对豆渣中的伸展蛋白进行了提取,结 果表明在最佳提取条件下豆渣粗伸蛋白质提取率为 0.149mg/g,糖基的提取率为 45.56mg/g。丁玉萍等 [59] 人对豆渣进行酸水解生产水解蛋白的工艺进行了研究,确 定的提取条件为:酸与豆渣的比例为 0.22-0.28:1,水解时间不小于 20h 可以得到 无臭味和豆腥味的水解蛋白。 (2)酶法 酶法是在提取蛋白质时添加蛋白酶,使不易提取的大分子蛋白质分解为小分子 的蛋白肽,从而降低蛋白提取难度和提高的提取率。 任海伟等[ 60]以 豆渣为原料制备可溶性蛋白肽,他先用碱性蛋白酶对豆渣进行了 处理,然后又用木瓜蛋白酶对豆渣进行处理,使可溶性蛋白 肽的提取率达到 63.03% 氨基酸态氮含量为 5.15%。胡尚勤等[ 61]将 鲜豆渣、水、脂肪酶和蛋白酶等混合在一 6 起,搅拌发酵处理 1.5h,干燥粉碎可制成蛋白质食品。该产品无臭无味,而且易于 保存。周德红等[ 62]优 化了豆渣酶法提取蛋白质的工艺,去除了添加高温 α-淀粉酶的 除淀粉的过程。得到的酶法制备豆渣水解蛋白质的最佳工艺为:反应温度为 55?, 固液比为 1:12,pH 值为 6.0,提取时间为 3h,复合蛋白酶和风味蛋白酶与底物比 值都为 0.1%;在这个条件下蛋白的提取率为 55.46%, (3)超声波提取法 超声波是利用超声波的波动与能量双重属性,即用超声波空化作用破碎细胞, 用机械作用强化传质,从而使原料中的蛋白成分更好的释放出来,有利于提取。 郭兴凤等[ 63]采 用超声辅助法以黑豆粉为原料,提取黑豆蛋白,并确定了最佳提 取条件为:超声功率 300 瓦,超声提取温度为 40?,超声提取时间为 19min,pH 值为 7.5,固液比 1:11.5,蛋白质提取率可以达到 50.25%。朱旻鹏等[ 64]以 芝麻饼粕 为原料,采用超声波辅助碱液法提取其中的蛋白质。结果表明,超声波辅助法比单 纯的碱液提取蛋白质提取率高 10%-15%。 (4)反胶束萃取法 反胶束是表面活性剂在有机溶剂中形成的一种聚集体,其表面活性剂的非极性 尾在外,与有机溶剂接触,极性头在内形成极性核,该核具有包含水溶液和溶解蛋 白的能力,因而可以用含有反胶束的有机溶剂从水相中提取蛋白。 张洁等[ 65]研 究比较了 2 种反胶束体系对大豆蛋白质的前萃的影响,结果表明十 二烷基磺酸钠/异辛烷/正辛醇的反胶束体系比丁二酸二异辛酯磺酸钠/异辛烷/正辛 醇的反胶束体系对大豆蛋白的前萃率高。赵 晓燕[ 66]用 反胶束法萃取出大豆蛋白质并 对其特性进行了研究。 7 6.2、茶皂素的分离提取及检测方法的研究进展 1.1.4.1 茶皂素的提取方法研究进展1.1.4.1 茶皂素的提取方法研究进展 目前用于茶皂素的提取方法主要有水浸提法、有机溶剂法及在这基础上发展起 来的一些新方法,如水提 沉淀法、水提 醇萃法、超声波辅助提取法、微波辅助提取 法等。 (1) 水浸提法 最早用来提取茶皂素的方法是水浸提法,其原理是利用了热水能够溶解茶皂素 的特点,把热水作为提取剂,其主要工艺流程是:茶籽饼脱脂后粉碎,加入热水浸提, 然后过滤、澄清、再过滤、浓缩之后干燥[5]。其生产成本较低,且工艺简单,投资量 少,效率较高。但生产水处理量大,常规分离困难,能耗大,生产周期长,而且由于 茶饼粕中的淀粉、蛋白质等物质也会溶解于水中,从而得到的浸提液特别混浊,造成 过滤困难,茶皂素产品纯度很低、色泽深,很难进一步纯化,渣处理难度大等缺点。 李秋庭、陆顺忠[6]研究出茶皂素水提法新工艺,结合离心分离技术和真空浓缩提 取茶皂素,得到的最佳工艺参数为:在料液比为 1:5,提取温度为 30~35?的条件下 浸提 2 次,每次浸提 2h。 殷肇君,李红权等[7]采用水提法提取茶皂素,获得的最佳工艺条件为:料液比 1:8, 浸提时间 8h,浸提温度 75?,pH 为 10,茶皂素得率为 12%。 (2) 有机溶剂法 有机溶剂法的提取剂一般采用甲醇或含水乙醇,有时也加其他辅助试剂,如正 丁醇等低级醇。有机溶剂法的优点是获得的茶皂素产品色泽较浅,且纯度较高,有很 好的收率,再纯化简单。但此法的不足 之处是生产工艺较为复杂,对设备要求较高, 且溶剂消耗量大,导致成本偏高。因此需要对茶皂素的这种提取工艺进行改善。 2 余江林等[8]采用乙醇提取法,获得最佳工艺参数乙醇浓度为 90%~95%,料液比 1:10~12,提取温度 80~90?,浸提时间 2h。 周盛敏,杨光等[9]采用混合溶剂法,以 95%乙醇 丙酮混合溶剂(4:1)提取茶皂 素,得到优化的提取工艺为料液比为 1:4,浸提时间为 3.5h,温度为 70?,茶皂素产 率达到 33.3%。 (3) 沉淀法 谢子汝[10]采用水提—沉淀法,在水浸提液中加入了 CaO 作为沉淀剂,使茶皂素 沉淀下来,同时使得杂质与其分离,然后将获得的沉淀物再用离子转换剂,使得沉淀 溶解,从而得到了纯度较高的茶皂素产品。 刘红梅,周建平等[11]对沉淀法制取茶皂素的工艺进行了优化,最佳工艺条件为: 试验温度为室温,反应 3h,加入茶饼原料 16%的 CaO,选用碳酸氢铵为释放剂,反 应温度为 70?,时间为 2.5h,按化学平衡反应率为 50%添加碳酸氢铵量,此种方法 能耗低,可以降低生产成本。 (4) 水提 醇萃法 赵元藩[12]通过对茶皂素的多种提取方法进行试验和比较,在综合了水提法、有 机溶剂法、水提 沉淀法三者的基础上,以热水作为提取剂,然后在浸提液中加入 Al2(SO4)3,使蛋白质等杂质沉淀后再除去,待提取液冷却后,用浓度为 95%的乙醇萃 取获得产品。该法工艺较为简单,茶皂素的得率和纯度都较高。 (5)”一水二醇”法 曾韬等[13]在水提—醇萃的基础上,研究了一种新的茶皂素提取工艺,即先用水浸 提再用乙醇萃取,最后用正丁醇转萃。制得的茶皂素产品颜色浅,纯度高。 (5) 超声波法 超声波提取的机理是利用超声波具有的热效应、空化效应以及机械传质 效应,通 过产生热能,加快媒介物速度和加速度,增大溶剂对植物细胞的渗透力等来进行提取 的方法[14],具有节约能源、效率高、有效成分含量高等优点。 李静等[15]采用超声波法提取茶皂素,确定的最佳工艺条件为:以 80%乙醇为提取 剂,在料液比 1:4、超声功率为 320W、温度为 40?的条件下超声提取 60min。 (6) 微波提取法 微波是一种电磁波,是波长从1mm 1m左右的电磁波。微波具有很强的穿透力, 因此能够对反应物内外部分同时均匀、迅速地加热[16]。所以利用此方法进行的反应具 有高效性和强选择性,而且提取效率较高。 吴雪辉等[17]利用微波法提取茶皂素,确定的微波提取最佳工艺为:微波功率为 800W、辐射时间为280s、料液比1:18、原料粒度不超过180 m。 6.3、研究方法 2.5.1 原料预处理2.5.1 原料预处理 2.5.1.1 干啤酒酵母的预处理 干燥的废啤酒酵母经粉碎机粉碎后得到酵母粉。准确称取 10g 干燥酵 母粉,加入 100mL 水充分洗涤,4800r/min 离心 10min,将沉淀物重复洗 涤、离心至洗涤液澄清为止。 2.5.1.2 啤酒酵母泥的预处理 27 酵母泥先用 2~6?的水洗涤 3~4 次,筛除大型颗粒及表面漂浮杂物, 向沉淀酵母加入 2 倍体积 5%酒石酸,离心后得到干净的啤酒酵母。 2.5.2 啤酒酵母中 RNA 的提取 称取干燥的啤酒酵母粉 2g,放入 100mL 烧杯中,水洗涤两次,离心 后向沉淀物质中加入 0.4%NaOH 30mL,然后放入沸水浴中提取 1h。将上 述提取液取出, 冷却。滴加 2~5 滴冰乙酸,调 pH 至 6.0,装入 50mL 离 心管,以 3600r/min 离心 10min,离心得到的上清液,倒入 100mL 烧杯中, 边搅拌边慢慢加入 15mL 95%乙醇,然后以 3000r/min 离心 10min,得到 RNA 沉淀,弃去上清液,用少量 95%乙醇洗涤 3 次,60?下干燥,得到 RNA 产品。将部分 RNA 产品转入 50mL 三角瓶中。 2.5.3 啤酒酵母中 β-(1,3)-D-葡聚糖的提取研究 2.5.3.1 β-(1,3)-D-葡聚糖的提取方法 ? 酸法提取 准确称取啤酒干酵母10g,分别加入不同浓度的乙酸溶液200mL5,0? 下反应 3h,水浴控制温度,液体转入 200mL 离心杯,4000r/min 下离心 15min。取沉淀物用水洗涤 2 次,然后用无水乙醇脱色并除去有机杂质, 40?下烘箱干燥,得到产品。 ? 碱法提取 准确称取啤酒干酵母 10g,水洗涤预处理后分别加入不同浓度的 NaOH 溶液 100mL,90?水浴锅中加热 2h,溶液离心,沉淀物水洗 2 次, 离心后沉淀物用无水乙醇洗涤,离心后 40?干燥测量。 ? 酸-碱法提取 准确称取啤酒干酵母 10g,水洗涤预处理后加入 4%的 NaOH 溶液 100mL,90?水浴锅中加热 2h,溶液离心,沉淀物水洗 2 次,向沉淀物中 加入 4%的乙酸溶液 400mL,35?水浴处理 2h,离心、水洗,无水乙醇洗 涤后离心干燥测量。 ? 碱-酶法提取 准确称取 10g 干燥酵母粉,加入 100mL 水充分洗涤,4800r/min 离心 10min,将沉淀物重复洗涤、离心至洗涤液澄清为止。向上述沉淀物中加 入 4%的 NaOH 溶液 150mL,80?水浴条件下进行提取 2h。反应后溶液在 28 4800r/min 离心 10min,沉淀物加入 100mL 水充分洗涤,再在 4800r/min 下离心 10min,沉淀物加入 100mL 水后用乙酸调整 pH 值 8.5~9.0。加入 碱性蛋白酶 450U/g,55?水浴 24h,反应后溶液离心分离(4800r/min)。 取沉淀物加入无水乙醇 30mL,50?水浴 1h。溶液再进行离心,分离出沉 淀物,室温干燥即可。 2.5.3.2 不同原料碱法提取 β-(1,3)-D-葡聚糖的方法 ? 酵母泥中碱法提取 β-(1,3)-D-葡聚糖 取酵母泥 100g 加 4%NaOH 溶液 300mL,90 下水浴处理 3h,溶液离 心,沉淀物水洗 2 次,离心后沉淀物用无水乙醇洗涤,离心后 40?干燥 测量。 ? 酵母粉中碱法提取 β-(1,3)-D-葡聚糖 准确称取啤酒干酵母 10g,水洗涤预处理后加入 3%的 NaOH 溶液 100mL,90?水浴锅中加热 2h,溶液离心,沉淀物水洗 2 次,离心后沉淀 物用无水乙醇洗涤,离心后 40?干燥测量。 2.5.3.3 不同酶提取 β-(1,3)-D-葡聚糖的方法 按照碱-酶法提取工艺步骤,改变不同的蛋白酶进行 β-(1,3)-D-葡聚糖 的提取。 6.4、甘草黄酮的提取方法研究 目前对甘草黄酮类物质的提取主要有以下几种方法: 碱性水或碱性稀醇提 有机溶剂提取法、有机溶剂提取法、微波提取法、超声提取法、超临界萃取法 等。由于黄酮类化合物性质之间差别较大,而每种甘草中所含的其他杂质又不 完全相同,故目前尚无一个通用的提取方法。一般主要是先利用溶剂将黄酮类 化合物浸取出来,再对提取出来的混合物作进一步的分离。 6.5、提取方法研究 以柑桔皮渣为原料,研究柑桔类黄酮的加速溶剂萃取新方法,并与 3 种传统 提取方法(回流提取法,索氏提取法和微波辅助提取法)进行对比,分析讨论几 种提取方法的优劣,为柑桔类黄酮的工业化生产提供理论基础和技术支持。 (1) 方法简介 黄酮提取的传统方法主要是回流提取法和索氏提取。回流提取法是利用有机 物”相似相溶”的原理,应用有机溶剂加热提取,需采用回流加热装置,以免溶 剂挥发损失。在烧瓶上连接回流冷凝器。溶剂浸过样品,在水浴中加热回流,保 持一定温度几小时后放冷过滤,再在药渣中加溶剂,做第 2、3 次 加热回流 提取,至有用成份基本提取完全为止。索氏提取法是一种借助于索氏提取器的连 续提取法,原理与回流提取相同,但可以弥补回流提取法中需要溶剂量大、操作 较繁琐的不足。微波辅助提取法是在传统的溶剂浸提基础上加以微波作用辅助提 取,具有溶剂耗量少、时间短、提取率高等特点,但由于其成本高且提取量少等 原因,目前微波法仅在实验室研究阶段,尚未应用于工业生产。 本文重点介绍和研究有效成份提取新方法—加速溶剂法萃取法。加速溶剂法 萃取法是采用国际先进的加速溶剂萃取仪进行提取的方法[66]。加速溶剂萃取仪 是一种可从各种固体或半固体样品中萃取有机组分的自动系统。通过提高溶剂温 度的方法加速传统的萃取处理,在萃取池中加压以使萃取过程中萃取池中填充的 溶剂始终处于液体状态,且提高传质速率,从而加快提取过程。加热后,提取物 从样品池中流动到标准的收集瓶中以备分析使用。整个提取过程,进料和滤液收 集皆为自动控制,在密闭环境下进行,减少了因溶剂挥发引起的损耗和环境污染 。 11 柑桔 皮渣中黄酮类化合物的提取及其抗炎活性研究 图 2-2 ASE200 加速溶剂萃取机外观图 图 2-3 ASE200 加速溶剂萃取机结构特征图 (2)实验操作及工艺流程 将柑桔皮渣于 50~60?恒温干燥,粉碎,过筛,称取适量柑桔皮渣粉分组装 入提取装置(加速溶剂萃取、回流提取、索氏提取、微波辅助提取)内,加热/ 加压提取(加速溶剂萃取法需编制运行程序),收集提取液,测定其黄酮含量, 计算提取率;然后回收溶剂,将提取液浓缩蒸干,即得柑桔黄酮粗品,以备精制 和分析用。工艺流程见图 2-4。 12 重庆工商大学硕士学位论文 回收溶剂 排渣 溶剂 柑桔黄酮粗品 滤液 原料 干燥 粉碎 筛分 提取装置 浓缩蒸干 测定含量 图 2-4 柑桔类黄酮的提取工艺流程图 6.6、多糖的提取方法的研究 目前,提取植物多糖常用的方法有水溶醇沉法、超声法[23]、碱提法[24]、酸提法[25]、 微波法[26]、酶解法[27]、超临界流体萃取法[28]、超滤法[29]等。由于原料不同多糖的提 取方法不同,各种提取法各有利弊。超声法提取具有提取时间短,提取率高的特点, 目前最主要的困难是适合于工业生产的设备尚未普及;虽然碱处理能使多糖得率增 加,但易使多糖发生水解,破坏多糖的结构,所以一般只适用于含果胶物质少,黏度 小的原料;微波提取法具有提取率高、适用范围广、选择性强、节省溶剂、没有污染 等优点,但是在操作过程中要求提取时间适当缩减,否则会因为蒸发而减少溶剂的含 量,这样会降低多糖得率;酶法提取多糖具有提高多糖得率并且容易去除杂质等优点, 但是酶 作为一种蛋白,受多种因素影响,条件不易控制;微波提取在缩短提取时间的 同时,也加速了其他成分的渗透,因此用此法提取的多糖的纯度要低于水提法。另外, 也有人尝试用双水相逆流色谱萃取法和环流泡沫分离法对多糖进行提取[30,31]。其中水 溶醇沉法因其操作简单、成本低而在科研、生产领域广泛使用。但它耗费的时间长, 主要受提取温度、时间、料液比、提取次数的影响。朱晓宦等[32]通过对马齿苋粗多糖 的提取实验证明各因素影响多糖提取率的程度依次为温度>时间>提取次数>固液比。 6.7、蛋白质需要量的研究方法 目前,我国在研究羊的蛋白质需要时,研究方法以饲养试验、消化代谢试验、氮平衡试验和 比较屠宰试验为主。氮平衡试验通过测定营养物质食入、排泄、沉积以及产品中的数量,研究动 物蛋白质的需要,饲料蛋白质的利用率以及比较饲料或饲料蛋白质的质量,测定的方法与消化代 谢试验相同。小肠蛋白质又称为小肠可代谢蛋白质,包括由微生物合成的蛋白质、非降解蛋白质 以及很少量的内源性蛋白质三部分,因其更能反映反刍动物蛋白质消化代谢的特殊性,如何选择 合适的方法测定小肠蛋白质尤为重要。目前主要有体内法、半体内法、实验动物模拟法和体外法。 体内法是利用在十二指肠和回肠之间的相差关系进行的方法,其结果比较准确,需要注意的 是由于动物的差异、瘘管的位置以及食糜标记物的选择都可能造成误差,所以不是最好的方法[30]。 半体内法是将一定量经过瘤胃降解的待测饲料残渣 装入一定规格的尼龙袋中,封口后由真胃 瘘管将尼龙袋投入消化道,从粪便收集排出的尼龙袋,测定待测饲料过瘤胃养分小肠消化率。优 点是不需要测定食糜流量,避免了食糜流量测定带来的误差,省时经济,避免了饲料频繁改变对 消化代谢的影响,且对实验动物刺激较小。存在的缺点有:从粪便收集尼龙袋使养分经过了大肠 微生物的发酵,对测定结果容易造成影响;尼龙袋对肠粘膜有刺激作用,容易在肠道中堵塞且加 快了肠道的蠕动,使尼龙袋在肠道内的评价滞留时间减少,并且不同尼龙袋从粪中排出的时间差 异较大,收集困难;标准方法尚未统一,对测定结果还需要进一步研究。 实验动物模拟法是利用小的实验动物或其他单胃动物的消化率来估算反刍动物过瘤胃养分 的消化率。优点是准备时间短,所用试验材料少,待测样品需要量少,缺点是不可避免地受到实 验动物与反刍动物消化生理上不同的影响,使得所测数据较体内法偏低[26]。 体外法是利用瘤胃液和小肠液模拟体内环境对饲料小肠消化率进行评定的一类方法,最常用 的是酶解法。优点是不需要实验动物,省时省力,成本低,易操作。缺点是在体外不可能完全模 拟体内的消化过程,消化终产物的不断积累会使缓冲液 pH 值变低,同时终产物会对酶产生反馈 抑制,从而影响评定的准确性[31]。解决办法是通过与体内法测定结果的比较,可以逐步建立起与 体内法测定结果相关程度高的体外方法。 5 6.8、蛋白质电化学的研究方法 蛋白质在电极上 的 电化学分析方法 分 为直接电化学分 析 法 和间接 电化 学分 析法。 (1)间接电化学 分 析 蛋白质的电化学 研 究,往往需要借 助 媒介体使蛋白质 分 子与电极 表面的活性基团 键 合,从而实现蛋 白 质与电极之间的 直 接电子转移。 一方面,蛋白质 分 子的电活性中心 与 电极之间的距离 决 定了电子转移 的好坏,而蛋白 质 的电活性中心被 深 埋在其多肽链的 内 部,难于与电 极表面发生反应 , 而媒介体可以在 生 物大分子与电极 之 间起到电子传 递的桥梁作用。 另 一方面,蛋白质 分 子比较难于与电 极 表面发生电子 交换,一些杂质 在 电极表面上的吸 附 或蛋白质本身的 吸 附变性都有可 能阻碍蛋白质与 电 极之间电子传递 的 发生,因而得不 到 有效的响应电 流。媒介体通过 使 蛋白质分子与电 极 表面形成电子传 输 通道,实现蛋 白质与电极的电 子 传递。媒介体作 为 催化生物大分子 氧 化还原的催化 体,大多数情况 下 一些具有电活性 中 心的小分子,在 所 测定的电位范 围内是具有电化 学 活性的。 (2)直接电化学 分 析 蛋白质的直接电 化 学是指蛋白质分 子 直接与电极表面 发 生电子交 换,这种电子转 移 在一定程度上模 拟 了生命体内蛋白 质 与生物膜之间 的电子传递过程 , 因此,蛋白质的 直 接电化学机理的 研 究可用于解释 生命体内蛋白质 的 作用机制,另外 , 利用这种氧化还 原 体系还可以实 现新型生物燃料 电 池的构筑。 氧化还原蛋白质 的 直接电化学有很 多 优点:第一,电 极 作为电子 的给予体或接受 体 ,可以模拟生物 体 系电子传递的机 理 和代谢过程, 其热力学和动力 学 参数真实再现了 生 命体内蛋白质分 子 的氧化还原反 10 武汉工 业学院硕士学位论文 应;第二,无媒 介 体是蛋白质直接 电 子转移的主要优 势 ,这就可以减 少电化学检测过 程 中的干扰反应, 使 制备的电化学生 物 传感器具有非 常优越的选择性 , 从而简化了反应 体 系。 引入纳米材料制 备 修饰电极,可以 改 善蛋白质的空间 结 构且保留 了蛋白质本身的 生 物活性,可以 降 低 蛋白质 空间结构 对 实现蛋白质直 接电化学行为的 影 响,也是近年来研 究的热点。Zhao 等[ 4 3 ]将细胞色素 c 吸附 在 MWCNT 表面,结果表明 经 过 MWCNT 修饰的 C yt c 对 H2O2 具有极高的催化 活 性,米氏常数( )为 857 M,该生 物传感器具有 很好的灵敏性和 稳 定性。用于蛋白质 直接电化学的纳 米 材料还有很多, 纳米材料可以提 高 蛋白质与电极之 间 的选择性和灵敏 度 ,基于此构建 的生物传感器实 现 实时在线检测, 为 蛋白质的电化学 研 究提供更加高 效的分析检验手 段 。 6.9、研究方法 (1) 了解国内外地下水研究现状,收集查阅研究区内的水文、气 象、经济、地质等相关资料,布置水文地质勘察工作、依据勘察资料 绘制钻孔柱状图、区域地质图、水文地质剖面图、区域水文地质图, 查清地层构造、结构及区内水文地质条件,掌握地下水含水层的分布 特征、水力特征、动态特征和循环特征,利用 GMS 软件系统下 Boreholes、Solids 等模块建立研究区三维地质结构模型。 (2) 根据掌握资料,分析、选取、计算研究区域内水文地质(原 汇项)参数,依据 所收集的研究区气象及水文地质资料,计算处理源 汇项,评价地下水资源均衡量,计算地下水可开采资源量。 (3) 依据研究区地貌及水文地质条件,进行径流边界条件概化, 参数分区。利用 GMS 软件系统的 MODFLOW 模块,创建地下水水 流数值模拟模型,并对未来 20 年研究区地下水水位、流场进行预测。 (4) 利用地下水环境质量综合评分法,就研究区地下水水质进行 了综合评价。 (5) 根据研究区地下水水资源利用情况、区域经济发展概况和环 境生态状况,进行水资源可永续开采评价,结合水资源量分析、评价、 预测和水质评价结果,改进设计地下水开采方法;建立研究区地下水 资源永续发展的方案、措施及评价体系。 论文研究的技术路线如图 1.1。 -13- 吉林大学硕士学位论文 收集资料了解国内外研究现状 明确地质条件明确水文地质条件水样点布设 钻孔岩性概化计算水文地质参数水样采集 三维地质结构模型水文地质概念模型水质资料分析 地下水流数学模型水化学特征分析 地下水流数值模拟水化学形成作用分析 模型识别模型验证 模型预测 地下水资源量评价地下水水质评价 合理开发利用方案的提出 归纳总结成果、编写论文 图 1.1 研究技术路线图 -14- 第二章 研究区概况 第 2 章 研究区概况 6.10、选题意义及研究思路 入侵红火蚁是最危险的入侵生物之一,一旦入侵,就会以惊人的速度在当地扩散 蔓延,形成爆发之势,其在我国南部已呈现难以遏制的蔓延势头。入侵红火蚁所到之 处,严重影响了当地的农业生产、货物 运输、人们的身体健康、公共安全及生态环境。 福建省地处我国东南沿海,经济、运输、旅游业、轻工业较为发达,入侵红火蚁的到 来将会影响到我省的经济发展。 入侵红火蚁在我省危害已长达五年以上,自龙岩地区 2005 年发现该虫以来,全 省多个地区接连发现入侵红火蚁。在各个疫区所造成的危害及损失包括人体健康,生 态环境,公共安全,农业生产等方面,在宣传与防控上更是耗费了大量的财力、物力。 因此,在福建省开展红火蚁的入侵机理、入侵地生态调查,从而对入侵红火蚁进行有 效的预防、检疫,对其所侵入的生态环境进行评估等将是研究入侵红火蚁入侵与发展 规律的基础。 目前对于入侵红火蚁如何传入我省,各个地区的种群有无联系,入侵红火蚁在入 侵地定殖之后如何扩散,均只停留在调查访问阶段。另一方面,龙岩市新罗区与上杭 县作为最先成功将入侵红火蚁虫口数降至经济阈值以下,并将其危害降至最小,其疫 区生态恢复状态如何,入侵红火蚁的侵入是否对当地生态环境造成不可恢复的影响, 药剂防治以及不同生境对蚂蚁种群的影响作用有多大,这些问题更值得深入探讨。目 前,这些研究都只处于初步阶段,深入调查本地蚂蚁群落不同时期的连续变化,将有 助于明确本地蚂蚁群落在整个入侵事件中的发展动态,并对生态系统的恢复状态做出 评价。 本论文将对入侵福建省的重大危险性害虫入侵红火蚁进行入侵、扩散规律以及对 11 本地蚂蚁群落生物多样性影响的研究。主要通过分子生物学的方法,对其入侵溯源、 不同地理种群之间与不同入侵事件之间的关系进行对比分析,应用入侵红火蚁基本参 数的模型拟合对我省入侵红火蚁的入侵时间长度进行推测,并 讨论不同条件下基本入 侵参数与入侵时间的关系;同时,对入侵红火蚁对本地蚂蚁群落多样性的影响,以及 本地蚂蚁群落恢复发展动态进行系统研究,为预防入侵红火蚁入侵、传播,探讨入侵 红火蚁发生、分布规律以及化学药剂防治入侵红火蚁后,本地生态环境恢复状态提供 科学依据。 12 7、相关技术 7.1、微波原理及相关提取挥发油技术 1.2.1 微波辅助提取机理1.2.1 微波辅助提取机理 微波是指波长从 1 ×10 -3 m 至 1 m 之间,频率在 3 ×10 Hz~3 ×109 Hz 的电磁 波,是介于红外线和无线电波之间的波段。当微波在传输过程中遇到不同的介质 时,微波将依据介质性质的不同,产生反射、吸收以及穿透等现象。这主要是由 介质物料本身的介电常数、比热、形态以及含水量等的不同所致,即不同的介质 2 物料在受到微波作用时对微波的敏感性不同。微波的加热原理是通过空间或媒质 以电磁波形式将微波电磁能转变为热能,材料在电磁场中由介质损耗而引起的”体 加热”或”内加热”。当微波在提取中药有效成分时,微波辐射能穿透提取介质,微 波能直接到达植物内部维管束和腺细胞内,导致细胞内的温度突然升高。连续的 高温使其内部压力超过细胞壁膨胀的能力,致使细胞破裂,细胞内的物质自由流 出传递至周围的溶剂中且被溶解[14]。不仅增大了被提取成分在提取溶剂溶解度, 而且微波所产生的电磁场同时加速了被提取成分在溶剂中扩散。微波”内加热”方式 的加热效 率优于借助外部热源通过热传导由表及里的常规的热方式,使细胞内传 热和传质方向一致——同为由内向外,具有协同效应,加快了提取速率、缩短了 提取时间[8,15]。 2004年Chemat根据微波辅助提取植物成分的机理[16],结合水蒸气蒸馏的提取 原理,提出了一系列微波辅助提取挥发油技术[8, 17-19]。此后不断有新的改进型微波 辅助提取挥发油技术[11, 20]的报道。微波辅助提取挥发油技术的最大特点在于微波 的能量利用率高、提取速率快、提取率高。由于微波的提取时间短,降低了挥发 油的热降解、氧化的可能性,所得的挥发油气味芳香。 7.2、特征提取的相关技术 3.2.1 特征提取的基本过程3.2.1 特征提取的基本过程 特征提取的过程主要包括:分词、去除停用词、权重的计算和特征选择。 (1)分词:对文本进行预处理的第一步就是分词。中文文本不同于英文文本,英文 中国石油大学(华东)硕士学位论文 21 文本的词与词之间有空格作为分隔符,而中文文本是以字为单位,字与字、词与词之 间都没有明显的分隔标志。对文本进行分类前,就必须将连续的子序列分割成可以代 表文本内容的离散的词的序列。现有的分词技术有多种,下一节将详细介绍各种分词 技术。 (2)去除停用词:停用词主要是指对分类没有贡献的词,在所有的文章中都会出现 的一些词,如”的”、”啊”、”旁边”等,这一类词会增加特征向量的维度,降低分类 准确率。建立停用词库可以为过滤停用词提供方便,达到减少特征项的数量、降低特 征向量的维度的目的。 (3)权重的计算:判断特征词对文本分类贡献的大小,要看其权重的大小,权重越 大,说明该特征词包含的分类信息越多,对分类贡献越大,反之,越小,应该将其滤 除。权重计算函数有:词频函数、TFIDF 函数、平方根函数、对数函数和布尔函数等 。 (4)特征的选择:特征的选择要借助评估函数来完成,经评估作用后,每个特征词 将得到一个评估的分值,按照分值的大小排序,选取一定数目的特征词作为文本的特 征。选用什么评估函数及保留多少个特征词都需要针对具体的问题进行具体分析。 7.3、特征提取相关技术 4.4.1 主成分分析(Principle Components Analysis,PCA)4.4.1 主成分分析(Principle Components Analysis,PCA) PCA 的主要思想是坐标系转换,它的基本根据是如果坐标系统是正交的,那 么不同坐标系得到的总方差和总是相同的。 具体来说,PCA 使用一个特殊的、由数据点决定的坐标系,将第一个坐标轴 设置在数据点方差最大的方向上,从而使这个轴向上的方差最大化。第二个坐标 轴与第一个轴正交。在二维空间没有其他选择,它的方向由第一个轴所决定。但 在三维空间,它可以是在第一个轴正交的平面上的任意位置,在更高维的空间上 甚至有更多的选择,虽然始终限制其必须与第一个轴正交。遵循这个规则,选择 沿轴向方向方差达到最大值的方向作为第二个轴向。如此继续选择每个轴,使该 轴向的方差在所剩方差中占的份额是最大的。 表 4.1 展示了个含 10 个数值属性,即相应的数据点是在一个 10 维 空间上的 数据集的转换结果,这是我们画不出来的。选择方差最大的方向作为第一个轴的 轴向,第二个轴向选择与之正交且方差次大的方向,依此类推。途中列表按照被 选择的顺序,依次列出了沿每个新轴向上的方差。由于方差的总和是一个常量而 与 坐 标 系 无 关 , 因 此 用 方 差 占 总 和 百 分 比 的 形 式 列 出 。 我 们 称 轴 为 分 量 (component),每个分量要”负担”它在方差中的份额。图 3.2 画出了每个分量 31 所负担的方差对应于分量的序号。可以使用所有的分量作为新属性来进行数据挖 掘,也可以只选择前面几个,即主分量(principal component),而丢弃其余的分 量。在这个例子中,3 个主分量负担了数据集 84%的方差;7 个便负担了 95%以 上。 表 4.1 每个分量的方差 对于数值型的数据集,在进行数据挖掘之前使用主分量分析,作为一种数据 清理及属性生成的形式是很常见的。例如,你也许想要替代数值属性,用主分量 轴或它们的一个子集来负担某个给定比例的方差,譬如说 95%。 图 4.1 方差图 轴 方差 累计值 1 61.2% 61.2% 2 18.0% 79.2% 3 4.7% 83.9% 4 4.0% 87.9% 5 3.2% 91.1% 6 2.9% 94.0% 7 2.0% 96.0% 8 1.7% 97.7% 9 1.4% 99.1% 10 0.9% 100% 0246810 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 分量序号 方 差 百 分 比 方差 与 轴 的散点图 32 具体计算方法:设基因表达矩阵 X,行对应于不同的基因,列对应于不同的 实验环境。矩阵中的元素 xij 为第 i 个基因在某个实验环境下的表达水平。 为了计算主成分,n 个特征值以及它们对应的特征向量需要从 n×n 的 X 的 协方差矩阵中计算出来。每个特征向量定义了一个主成份。每 一个主成分可以视 为这些条件的加权和,这里对应特征向量中的系数为其权重。对于一个给定的基 因,n 个主成分中的每一个可以通过如下公式计算: 1 „ i j n it ij t x x v = = ? (4.1) PCA 容易理解,其表现也良好,但它并非经常有效。一个典型的 PCA 失效 的范例如下图所示。图中 2 类数据主成分方向平行,在找到第一个坐标轴后, PCA 无法正确的找到第二个主成份。 图 4.2 PCA 的一种失效情况 7.4、蛋白质组学的研究方法及相关技术 通常情况下,不同个体包含的蛋白质的种类和数量是不相同的,而且同一组织、 同一细胞的蛋白质组成在不同时期也是变化的,因此蛋白质组学的研究比基因组更 复杂。氨基酸残基种类远多于核苷酸残基,同时蛋白质有复杂的翻译后修饰,如磷 酸化和糖基化等,这给分离和分析蛋白质带来很多困难。发展各种高通量、高效率 的分离技术是蛋白质组学研究的关键内容之一。蛋白质组学研究成功与否,很大程 度上取决于其技术方法水平的高低。当前蛋白质组研究的分离技术主要有两类:基 于凝胶电泳的分离体系和基于液相的分离体系。当今蛋白质组学研究的蓬勃发展, 主要归功于以下三大技术的突破:(1) 80 年代固相化 pH 梯度 (Immobilized pH gradient,IPG) 的发展与完善。(2) 80 年代后期电喷雾质谱(Electro-sprayionization, ESI)和基质辅助激光解吸飞行时间质谱(matrix-assisted laser desorption ionization, MALDI)技术的出现,以及它们在蛋白质分析中的成功应用。(3) 蛋白质双向电泳 16 图谱的数字化和分析软件的问世。 1.3.2.1 双向凝胶 电泳 蛋白质组学研究的发展以双向电泳作为核心。1975 年,O?Farrell 等人创建了二 维凝胶电泳蛋白质组分离技术,其原理是根据蛋白质的等电点和分子量,将蛋白质 混合物在第一个方向上按照等电点高低进行分离(等电聚焦,IEF),在第二个方向 上按照分子量大小进行分离(十二烷基硫酸钠一聚丙烯酰胺凝胶电泳,SDS-PAGE)。 双向凝胶电泳技术是蛋白质组学研究中的核心技术,其步骤主要包括样品制备、等 电聚焦电泳、SDS-PAGE 电泳、凝胶染色和图像分析。 1.3.2.1.1 样品制备 样品在系统中的溶解性与双向电泳的分辨结果密切相关,是双向电泳技术成功 的关键。目前,许多改进双向电泳的研究都着眼于增加蛋白的溶解度。样品制备的 一般原则是:(1)使尽可能多的蛋白质处于溶解状态,尤其是疏水性蛋白;(2)防 止样品在制备过程中发生样品提取后的化学修饰(酶性或化学性降解等);(3)完全去 除样品中的核酸和某些干扰蛋白,包括一些高丰度或无关蛋白,保证待研究蛋白的 可检测性;(4)防止样品在聚焦时发生蛋白的聚集和沉淀。通常使用的蛋白质样品 溶解液或细胞裂解液中含有 8-9.8 mol/L 尿素、50-100 mmol/L DTT(二硫基苏糖醇)、 4% CHAPS、40 mmol/L Tris、起载体作用的两性电解质以及蛋白酶抑制剂。 I. 变性剂 变性剂的主要作用是改变或者破坏氢键结构,使蛋白质肽链伸展开来,充分暴 露疏水中心,降低靠近疏水中心的能量域,常用的变性剂是联合使用尿素和 CHAPS, 但这样会使一些蛋白质因吸附在固相干胶条的基质中而丢失,近来常用 2 mol/L 硫脲 和 5 mol/L 尿素联合使用,可以避免蛋白质因吸附作用所导致的丢失,同时可以增加 膜蛋白的溶解性,使所提 取的总蛋白更加接近细胞中蛋白的表达情况。 II. 表面活性剂 蛋白质变性后,会有大量的疏水残基暴露出来,因此需要表面活性剂来溶解这 些疏水基团,常用的表面活性剂有:(1)阴离子去污剂 SDS,但 SDS 不利于稳定等 电聚焦电泳时的等电点,因此不宜在等电聚焦电泳的蛋白质样品提取液中使用;(2) 非离子去污剂 TritonX-100 和 NP-40;(3)两性离子去污剂 CHAPS 和 SB3-10,2 %-5 17 %的 CHAPS 常配合浓度为 8 M 的尿素溶液使用,但在含高浓度硫脲溶液中其作用有 限;SB3-10 是一种含有长线性基团尾端的两性去污剂,其作用要强于 CHAPS,但在 尿素浓度大于 5 M 时不溶解。 III. 还原剂 变性剂和表面活性剂是用来使蛋白质变性,暴露和溶解蛋白质疏水区域的。为 了让大多数蛋白质完全展开,有必要还原二硫键。带有游离琉基的β-琉基乙醇(β -ME)和 DTT 是常用的还原剂。DTT 是带电荷的物质(尤其在碱性条件下),在 IEF 时 则迁移出胶条,导致某些蛋白质的溶解性降低而重新沉淀下来,造成这些蛋白质在 电泳过程中丢失。用不带电荷的三丁基磷(TBP)来代替 DTT 则效果更好,不但能增 加蛋白的溶解性,而且有助于样品在双向电泳过程中从第一向转移到第二向;另外 TBP 不带巯基,不需要被烷基化,可简化 IPG 的平衡过程。 IV. 起载体作用的两性电解质 即使在变性剂和表面活性剂存在的情况下,某些蛋白质也需要在盐离子的作用 下才能保持其溶解状态,否则这些蛋白质在相当于其 pI 的 pH 值下会发生沉淀。两 性电解质的作用在于捕获样品中的少量盐分,从而保证蛋白质的溶解性,两性电解 质浓度过高会使 IEF 的速度降低。为了保证实验的精确性, 在选择不同 pH 范围的 IPG 胶条时,应使两性电解质的 pH 值与之相符合。 V. 蛋白酶抑制剂 在采用机械和化学的方法进行细胞破碎处理时,通常细胞会释放出蛋白酶并作 用于蛋白,蛋白的降解会使最终的二维凝胶图谱复杂化。为了使细胞释放的蛋白酶 和其他引起蛋白质修饰作用的酶迅速失活,一般尽量将样品直接放入加有蛋白酶抑 制剂的细胞裂解液中,并在低温及使用预冷溶液条件下进行操作。一种蛋白酶抑制 剂只能有效地抑制一类蛋白酶的活性,所以一般建议将多种蛋白酶抑制剂混合使用。 因此,蛋白酶抑制剂”鸡尾酒”被广泛用于样本的处理过程。 1.3.2.1.2 等电聚焦 第一相等电聚焦电泳(IEF)是根据蛋白的等电点(pI)将蛋白进行分离的一种 电泳方法。蛋白是一种两性分子,所带电荷的性质与数量取决于它周围环境的 pH 值。 pH 梯度的存在是等电聚焦技术的关键。在电场的作用下,蛋白会沿着 pH 梯度迁移 18 至等电点位置。带正电荷的蛋白在向负极迁移的过程中,所带的正电荷逐渐减少, 当到达等电点位置时,所带的电荷为零。同样,带负电荷的蛋白在向正极迁移的过 程中,所带的负电荷逐渐减少,当所带的电荷为零时即到达了等电点位置。如果蛋 白由于扩散作用而偏离了等电点位置,它马上会得到电荷而再度迁移回来。这就是 IEF 的聚焦效果,它能在等电点处浓缩样品,并且能根据不同蛋白所带电荷的微小差 异将它们分离,其分辨率取决于 pH 梯度的斜率以及电场的强度。 1.3.2.1.3 SDS-PAGE 电泳 在第一向 IEF 结束后,进行第二向十二烷基硫酸钠-聚丙烯酰胺凝胶电泳 (SDS-PAGE),它是根据蛋白的分子量(MW)将蛋白分离的一种传统的电泳方式。 其基本 原理:SDS 是一种阴离子去污剂,能够破坏蛋白质分子间的非共价结合,使 蛋白质改变原有的构象而发生变性,尤其是当蛋白质分子的二硫键在强还原剂的作 用下被还原后,蛋白质大分子与 SDS 充分结合,形成带有负电荷的长椭圆棒状 SDS- 蛋白质复合物。复合物所带的负电荷远远大于蛋白质分子本身所带的电荷数,因而 消除了不同蛋白质分子间的电荷差异,使蛋白质分子在 SDS 电泳系统的迁移率不再 受电荷和分子形状等因素的影响,其电泳速度主要决定子蛋白质分子量的大小。 1.3.2.2 图像分析 双向电泳图像分析的作用是评价和量化电泳结果。双向电泳以后得到的二维凝 胶需要经过固定、染色及脱色处理,使得凝胶上的蛋白点显现出来。然后通过专用 的凝胶图像扫描仪将二维凝胶图像数字化并保存在电脑中,便于随后的图像分析。 图像分析需要利用相关的图像分析软件得以进行,其主要操作包括:(1)蛋白点检 定;(2)定量蛋白点;(3)蛋白点群匹配;(4)蛋白点群统计学分析。通过对正常 和处理后的细胞、组织的电泳图谱上蛋白点的比较,找出差异蛋白质点,通过氨基 酸组成分析、测序或者质谱鉴定分析确定其差异蛋白的名称。 1.3.2.3 质谱鉴定 生物质谱鉴定技术是蛋白质组学研究和应用迅速发展的支柱。由于具有迅速、 灵敏、准确的优点,并能进行蛋白质序列分析和翻译后修饰分析,质谱己经无可争 议地成为蛋白质组学中分析与鉴定肽和蛋白质的最重要的手段。质谱分析主要是通 过测定样品粒子的质量电荷比(m/z)来进行成分和结构分析。常用的生物质谱蛋白质 鉴定方法包括肽质量指纹谱 (Peptide mass fingerprinting,PMF) 技术和肽序列标签 19 (peptide sequence tag,PST) 技术,PMF 是指蛋白质被酶切位点专一的蛋白酶水解后 得到的肽片段质量图谱。由于每种蛋白质的氨基酸序列(一级结构)是不同的,蛋白质 被酶水解后产生的肽片段序列也不相同,其肽混合物质量数也具有特征性,所以称 为指纹谱,可用于蛋白质鉴定,即用实验测得的蛋白质酶解肽段质量数在蛋白质数 据库中检索,寻找具有相似肽指纹谱的蛋白质。PST 就是利用串联质谱先将酶解后 的肽段轰击成碎片,再检测由每一个肽片段所产生的碎片离子信息,并输入蛋白质 数据库搜索以鉴定蛋白质。 生物质谱技术在离子化方法上主要有两种软电离技术,即基质辅助激光解吸电 离 (matrix-assisted laser desorption ionization , MALDI) 和 电 喷 雾 电 离 (Electro-sprayionization,ESI)。 I. 基质辅助激光解吸电离飞行时间质谱 MALDI-TOF MS 是一种软离子化技术质谱,1988 年由 Karas 等人首创,其主要 原理是:待测样品分散在基质分子中并形成晶体,用脉冲式激光照射晶体时,基质 分子吸收激光能量,样品解吸附,基质与样品之间发生电荷转移,样品分子电离; 基质吸收了激光的大部分能量并发生气化,同时将样品分子带入气相,样品只吸收 少量激光能量,避免了样品分子中化学键的断裂;基质在样品离子形成过程中充当 了质子化或去质子化试剂,使样品分子带上正电荷或者负电荷形成离子;带有电荷 的样品离子经过一个加速电场获得动能后进入一个高真空无电场飞行管道,以在加 速电场中获得的速度飞行;质量较小的离子飞行速度快,较早到达检测器,质量较 大的离子飞行速度慢,较晚到达检测器。离子的飞行时间与其质荷比的平方根成正 比,通过测定飞行 时间可以推算出离子的质荷比。MALDI-TOF MS 可广泛应用于通 过肽质量指纹图进行的大规模蛋白质鉴定。MALDI-TOF MS 可测的分子量高达 30 万,对盐和表面活性剂有较强耐受力,适于分析简单的肽混合物,通量较高,因此 在利用肽指纹图谱高通量鉴定蛋白质方面有广泛的应用。 II. 电喷雾电离质谱(ESI-MS)或串联质谱(ESI-MS/MS) ESI 是另一种软电离技术,该技术是利用强静电场作用从溶液中直接产生气态离 子化分子的一种方法。液体蛋白样品在强电场和大气压力下喷雾形成带有高电荷的 液滴,这种带电液滴在向质量分析器移动的过程中,与之相向运动的干燥气体和加 热作用使微小液滴的溶剂不断蒸发,体积不断缩小,而液滴表面的电场强度则逐渐 20 增大。当液滴表面同种电荷的相互排斥力超过液滴的表面张力时,液滴就会发生爆 裂。这样的过程不断重复,最后可产生大量带有一个或者多个电荷的离子,进入质 量分析器。ESI-MS/MS 可用于测定蛋白质和多肽的分子质量,分析多肽和蛋白质的 一级结构,鉴定多肽侧链上的化学修饰作用(如氧化、酰基化、磷酸化、糖基化等 等)位点等。ESI 使分析物从溶液相中电离,常与液相分离等手段(如液相色谱和毛 细管电泳)在线联用,适合复杂样品的分析。 软电离技术的出现大大拓展了质谱的应用空间,质量分析器的改善也大大推动 了质谱仪器技术的发展。对于生物质谱来说,最重要的性能是灵敏度、分辨率、质 量精度和串级质谱能力。生物质谱的质量分析器主要有四种:离子阱(iontrap,IT)、 飞行时间(time of flight,ToF)、四极杆(quadrupole,Q)和付立叶变换离子回旋共振 (Fourier transformaion cyclotron resonance,FTICR)。它们的结构和性能各不相同,每 一种都有自己的长处与不足,它们可以单独使用,也可以互相组合形成功能更强大 的仪器。离子阱质谱灵敏度较高,性能稳定,具备多级质谱能力,因此被广泛应用 于蛋白质组学研究,不足之处是质量精度较低。最近发展起来的线性(或称两维) 离子阱与传统的三维离子阱不同,离子可储存在一个圆柱状的空间内,显著改善了 离子阱质谱的灵敏度、分辨率和质量精度。 1.3.2.4 蛋白质组学研究的生物信息学 生物信息学是随着人类基因组计划、计算机技术、网络技术的发展而诞生的一 门新兴学科,是蛋白质组学的一个重要的技术平台。生物信息学研究生物信息的采 集、加工、分析、存储、传播等各个方面,它通过综合应用数学、计算机科学、工 程科学以及生物学的技术来分析大量而复杂的生物学数据而揭示生物学的奥秘。生 物信息学是蛋白质组学研究的一个不可缺少的部分,其在蛋白质组学中的研究有两 个重要应用:一是构建和分析双向凝胶电泳图谱,二是数据库的搜索与构建。蛋白 质组数据库是蛋白质组研究水平的标志和基础。瑞士的 SWISS-PROT 拥有目前世界 上最大,种类最多的蛋白质组数据库。丹麦、英国、美国等也都建立了各具特色的 蛋白质组数据库。目前应用最普遍的数据库是 NRDB 和 dbEST 数据库。NRDB 由 SWISS-PROT 和 GENPETP 等几个数据库组成。dbEST 是由美国国家生物技术信息 中心(National Centre for Biotechnology Information,NCBI)和欧洲生物信息学研究 所(European Bioinformatics Institute,EBI)共同编辑的核酸数据库,包括许多生物 体的表达序列标 签(expressed sequence tags,EST)。用 PST 或部分序列信息最适合 21 查寻 dbEST 数据库。最近有报道强调用蛋白质质谱分析数据查寻 EST 数据库以鉴定 研究者最感兴趣的未知蛋白质的重要性,表明人类 EST 数据库能满足用质谱数据快 速识别哺乳动物多蛋白质复合物的要求。生物信息学的发展已给蛋白质组研究提供 了更方便有效的计算机分析软件;特别值得注意的是蛋白质质谱鉴定软件和算法发 展迅速,如 SWISS-PROT、Rockefeller 大学、UCSF 等都有自主的搜索软件和数据管 理系统。最近发展的质谱数据直接搜寻基因组数据库使得质谱数据可直接进行基因 注释、判断复杂的拼接方式。随着基因组学的迅速推进,会给蛋白质组研究提供更 多更全的数据库。另外,对肽序列标记的从头测序软件也十分引人注目。 各种不同类型的蛋白质组和基因组数据库既是实现已知蛋白质的分析鉴定和发 现未知蛋白质的前提,也是分析蛋白质结构、性质和功能,实现模拟和预测的基础。 用于蛋白质鉴定的数据库主要有以下几类:(1)蛋白质氨基酸序列数据库;(2)蛋 白质结构域与家族数据库;(3)蛋白质高级结构及分类数据库;(4)蛋白质双向电 泳技术图谱数据库;(5)蛋白质相互作用数据库。应用最为普遍的数据库是 NRDB 和 dbEST 数据库,NRDB 由 SWISSPROT 和 GENPETP 等几个数据库组成,dbEST 为核酸数据库,包括许多生物体的表达序列标签,最适合查询肽序列标签或部分序 列信息。 蛋白质组学研究中使用的工具软件主要有:(1)蛋白质双向电泳图谱分析软件, 如 GE Healthcare 公司的 2-DE 图像分析软件 ImageMaster2-D,Bio-Rad 公司的 2-DE 图像分析软件 PDQest,其他 还有 Melanie11,Tycho,Gellab,GR42,Lips 和 Melani 等的析软件;(2)蛋白质鉴定软件,这类软件可以根据提交的信息类型分为氨基酸 组成比对软件、肽片段质量比对软件和部分肽段序列比对软件三类,常用的有 SEQUEST,AACompldent,PeptideSearch,Mascot,Peptldent,MS-Fit 和 Multildent 等;(3)蛋白质结构和功能预测软件,如 FindMod 等。 22 图 4 经典蛋白质组学流程图 Fig. 4 Classic Proteomics Workflow 样品、二维 凝胶数据库 防止蛋白降解 去除影响双向电泳干扰物 蛋白样品溶解于适合于第 一相电泳的样品缓冲液中 图像分析软件 (ImageMaster 2D Platinum 5.0) 蛋白点的切割 蛋白点的脱色、干燥 蛋白点的酶解 肽段的提取 质谱分析样品(肽段混合 物)的点样 蛋白点自动处理工 作台(Spot Handling Workstation) - 质谱分析软件 - 对肽质量谱数据进行蛋白 序列数据库搜索的软件 生物样品 (细胞,组织,体液等) 蛋白样品的制备 蛋白的分离 胶图成像 第一相等电聚焦电泳 第二相 SDS-PAGE 电泳 凝胶的固定 凝胶图像的显色 图像扫描 图像分析 蛋白点的检测 蛋白点的定量 凝胶的比对,差异点的寻找 质谱分析前的 蛋白点处理 蛋白鉴定 质谱分析 (MALDI-TOF-MS) 蛋白序列数据库的搜索 23 8、应用 8.1、啤酒酵母蛋白质的提取与应用研究 1.1.5.1 蛋白质的生产现状 随着世界人口快速增长,食物缺乏日益 显著,尤其是蛋白质食品出现 缺乏(陈南,1998)。据不完全统计,本世纪初,蛋白质供需之间相差 2500 万吨。解决这一问题的关键就在于大力开发蛋白质食品资源。据联合国粮 农组织最新估计,我国每人每天从食物中摄入的蛋白质总量为 7014mg, 比世界人均低 416mg,其中优质蛋白仅占蛋白质摄入总量的 1/5,而发达 国家为 1/2,摄入量严重不足。从目前的消费水平看,仅仅依靠肉类、蛋 类和乳类等来补充蛋白质是不太现实的,应该大力开发优质的其它蛋白质 资源。由于蛋白质资源缺乏,目前很多国家都把目光集中在单细胞微生物 上,啤酒酵母以其廉价、易得引起了很多关注。 1.1.5.2 啤酒酵母蛋白质的营养价值 啤酒酵母约含 50%的蛋白质,含有 20 种氨基酸,作为营养剂广泛应 用于医药行业(Brown C,1998;Reeds P,1998)。酵母蛋白质的含量和 组成基本保持不变。酵母蛋白质用于人类消费时,最主要的评价是其食用 营养性和安全性。经科学实验证明,酵母蛋白质中富含人体必需的 8 种氨 基酸,特别是谷物中蛋白质含量较少的赖氨酸含量较高(见表 1.2)。啤酒 酵母中氨基酸组成比例接近联合国粮农组织(FAO)推荐的理想氨基酸组 成。因而,啤酒酵母蛋白食品可以改善人类的营养均衡。 表 1.2 啤酒酵母干物质中必需氨基酸含量(g/100g,dw) Table 1.2 Essential Amino acid content in dry beer yeast 氨基酸 FAO 标准 啤酒酵母 氨基酸 FAO 标准 啤酒酵母 赖氨酸 4.2 4.3 亮氨酸 4.8 3.3 色氨酸 1.4 0.4 异亮氨酸 4.2 1.8 苯丙氨酸 2.8 1.3 缬氨酸 4.2 6.0 蛋氨酸 2.2 1.2 苏氨酸 2.8 2.1 蛋白质的营养一般可以采用生物价和可消化率来评价,由表 1.3 可以 看出,干啤酒酵母蛋白与动植物 蛋白营养价值比较,酵母蛋白的营养价值 低于动物蛋白,但高于植物蛋白(常雅宁,2001)。据报道,日本的札幌 17 啤酒公司己利用啤酒酵母蛋白食品与酸奶混合,制备减肥食品。此外,从 蛋白质食用安全性考虑,由于啤酒酵母无病原性和毒性,啤酒酵母酿造用 的麦芽汁也是干净无毒的,因而啤酒酵母蛋白质是一种优良的食用蛋白 质。 表 1.3 干啤酒酵母蛋白与动植物蛋白营养价值比较 Table 1.3 The comparison of nutrition value in dry beer yeast protein with animal and plant protein 蛋白质源 生物价 可消化率(%) 净蛋白质利用(%) 动物蛋白 蛋 100 97 43 奶 93 97 90 植物蛋白 燕麦粉 79 60 47 碎玉米 72 76 55 马铃薯 69 74 51 干啤酒酵母粉 70~80 91~92 64~82 1.1.5.3 酵母蛋白质的提取研究 啤酒酵母中蛋白质的提取主要由破壁、沉淀、纯化三部分组成,其各 部分都有不同的几种方法。其中碱法破壁、调节等电点进行蛋白质的沉淀 是常用的方法。目前,将酵母细胞壁破碎后提取蛋白质的方法主要有:细 胞自溶法、机械破壁法、酶解法和化学处理法。细胞自溶法是利用酵母菌 体本身含有的各种酶(各种蛋白酶、葡聚糖酶、淀粉酶、纤维素酶等)的 综合作用分解细胞壁的方法(张晓鸣,1997)。自溶最适 pH 因菌株以及 菌体成分而不同,温度则以 50~55?为最佳,通常反应时间较长,而蛋 白质提取率却较低(Knorr,1979);机械破壁法需要消耗较大的能量,相 应的其效率就低;酶解法是在酵母自身含有的酶以外,再另行加酶进行分 解的方法(尹象升,1994)。添加的酶一般可用淀粉酶、蛋白分解酶等, 从而提高酵母蛋白的水解率,增加游离氨基酸的含量(AOAC. 1980)。化 学处理法是 在酵母菌体中添加酸或碱后加水分解的方法。菌体成分中的氨 基酸类通过加水分解后可收得比较高的得率,李艳利用碱热处理法得到了 含量在 80%以上的蛋白质,但其中分解而成的有机物和无机物微量营养成 分却在营养上和呈味性上都是低水平的物质,因而用这种方法制成的成品 风味和色泽都很不理想,通常会引起蛋白质的变性(李艳,1996)。化学 18 处理法常用的酸或碱主要是工业上常用的诸如盐酸、硫酸、磷酸、氢氧化 钠等,价格低廉,易于得到,故仍然被广泛应用(Adler-Nissen,1986)。 本实验由于是在碱法提取 RNA 和葡聚糖的基础上进行的综合利用实 验,因此采取碱法提取蛋白质效果较好。而且其破壁工艺即为 β-(1,3)-D- 葡聚糖提取的工艺,条件基本一致。 8.2、酒糟中蛋白质的应用 醇溶蛋白的商业化生产最早开始于19世纪30年代后期,它主要用于生产黏合 剂、涂料、纤维、膜制品等。现在,醇溶蛋白的应用更加广泛,可用于食品、造 纸、印刷、纺织、化工以及医药卫生等方面,还可用来生产玉米肽(高F值寡肽、 降血压肽等)、玉米蛋白油脂模拟品、糖果、口香糖等食品[27-31]。孙庆申等以玉 米醇溶蛋白为原料采用相分离法制备微球,能够改善载药微球悬浮液的稳定性, 抑制药物的突释现象[32]。近年来,zein的一些新的应用得到了开发(表1.4)。 7 表1.4 Zein的应用 Table 1.4 Some uses of zein 应用 参考文献 酸敏感药物传递体系 电泳涂层 脂肪替代物 纤维,纺织品 反刍动物营养 传递系统 照相胶片、照相乳化液 淀粉聚合物 Mazer,1992;Ting 和 Hsiao,1999[33,34] Korinko;Hunt, 1999[35] Akkaway,1999[36] Zhang, 1997;Cuq, 1999[37,38] Morikawa,1999[39] Witt,1999[40] Wang,1998[41] Wang,1999;Takahashi,1995[42,43] 8.3、蚕豆蛋白质的应用研究 植物蛋白质有乳化性、凝胶性等特性,应用于肉制品中,可以赋予其良好的凝胶 组织结构,改善其口感、咀嚼性等,并为肉制品保持水分和脂肪提供了基质,使其具 有较高黏度、可塑性和弹性。 本章研究了添加植物蛋白质和不添加植物蛋白质的火腿肠,在质构上的区别,并 试图选择合适的蚕豆蛋白质添加量,使得火腿肠的质构和感官评价指标达到最佳。 8.4、银耳粗多糖应用研究与提取 1.2.1 银耳粗多糖应用研究1.2.1 银耳粗多糖应用研究 银耳粗多糖具有广泛的药理学作用。调节机体非免疫系统及机体免疫功能是 许多粗多糖的主要药理学作用之一,是粗多糖的共性。 银耳粗多糖可改善非免疫系统[15],据目前的研究结果来看银耳粗多糖可能具 有果寡糖、甘露寡糖、木糖的类似作用,能直接到达肠道作为双歧杆菌和乳酸杆 菌特异性的营养物质,促进肠道理想微生物菌群的形成,增强人体对外源性病原 菌的抵抗能力,改善肠道的健康状况,起到提高非免疫防御系统的作用。 银耳粗多糖与免疫系统的关系,相关研究表明,银耳粗多糖能增强小鼠机体 体液免疫[16];增强淋巴细胞及细胞因子 的活性和功能,促进细胞因子的生成[17-18]; 对红细胞膜的保护作用[19];促进血清蛋白质核酸的生物合成,增强机体抗病能力 [20-21];抗肿瘤作用[22-23];抗衰老作用[24-25];降血脂作用[26-28];抗凝血、抗血栓作 用[29-30];抗溃疡作用[31];抗突变作用[32-34]。 8.5、闪式提取器的应用 刘玉峰等人[40]采用闪式提取器对赤芍总苷进行提取,并通过 L9( 34)正交试验优化了赤芍总苷的提取工艺,以芍药苷和芍药内酯苷 为参照,运用 HPLC 测定其含量,得出赤芍总苷闪式提取的最佳工 10 8.6、蛋白质分子印迹应用 蛋白质分子印迹技术目前主要应用于分析化学和生物化学领域,相关的文献 报道也较多[28-30]。 1.1.5.1 用作分离材料 分子印迹膜(Molecularly Imprinted Membrane,MIM)是基于分子印迹技术制 备的一种分离膜。MIM 对模板分子具有较高的吸附选择性和吸附容量,是一种很 好的分离材料[31]。 蛋白质分子印迹材料还被广泛地用于固相萃取。采用蛋白质分子印迹聚合物 能够分离富集目标蛋白。相比溶剂萃取,固相萃取具有分离富集效率高,使用环 境更广泛等优点,在分离分析应用上具有不可比拟的优势[32]。 蛋白质分子印迹聚合物也可以作为色谱分离中的固定相,建立高效液相萃取 或毛细管电泳分析法,可以对蛋白质进行分离分析或样品的预处理。但是印迹材 料作为固定相也存在一定的问题,容易出现柱效低或拖尾现象。这主 要是由于聚 合物结合位点分布不均匀、容量小[33, 34]。 1.1.5.2 用作抗体或受体模拟物 蛋白质分子印迹材料具有特异识别的特性,类似于抗体或受体,而且聚合物 物理化学性质稳定,能够耐酸碱,机械强度高,抗高温高热,制备方法简单,成 本低。因此,使用 MIP 制取的模拟抗体可以代替天然抗体应用于免疫分析中,这 样就可以避免天然抗体难于回收再利用的缺点,省却了制备抗体所需要的实验动 物及相应技术,同时也能大大降低了使用成本[35,36]。 - 8 - 硕士学位论文 1.1.5.3 用作生物传感器的传感元件 以蛋白质分子为模板制备的分子印迹材料可以用于生物传感器,作为特异性 识别元件。MIP 作为传感元件制得的的生物传感器,与传统的生物传感器相比, 具有寿命长、耐受性高、制作成本低、能重复使用等优点,有利于大规模的应用[37, 38]。 8.7、蛋白质应用 1.1.2.1 蛋白质在医药工业中的应用 蛋白质是一切生命物质的基础,不仅可以维持生命体的健康,还可以促进新 陈代谢,对生命体的生长发育起着至关重要的作用。因此蛋白质在医药行业中的 应用十分广泛。植物蛋白在医药方面有助于生物体内纤维蛋白和血凝块的溶解, 可用于治疗各种炎症及肿痛。随着生化技术的发展,木瓜蛋白酶在医药界体现出 其重要性,人们已利用其做成木瓜酶片和木瓜酶肠溶胶囊,用于驱除肠道内的寄 生虫或抗炎、消肿等方面[3]。 1.1.2.2 蛋白质在食品工业上的应用 除药用价值外,蛋白质在食品工业中的应用 也倍受瞩目。如纤维素酶可以降 解饮料中的纤维残渣,提升口感;在面食加工中添加脂肪酶可以增加并保持弹性、 提高成品率、改良面皮质感;转谷氨酰胺酶可以将低价值的鱼肉和肉中的蛋白质 交联,大大提高其食用价值,而且转谷氨酰胺酶可以增强食物的保水能力;葡萄 糖氧化酶可以起到防止食物腐败的功效;某些植物蛋白可以防止啤酒生产过程中 浑浊的现象,并且可以延长保质期等。汪旭等[4]发现,高能量植物蛋白饮食与常 规饮食相比,对肝硬化患者的营养状态有显著的改善。刘晴晴[5]发现,果胶酶在 1 提高果蔬出汁方面体现出其优越性能,在果蔬榨汁前,加入适量的果胶酶,可以 有效的降低果汁的粘度,使杂质更容易被分离,提高出汁率。 1.1.2.3 蛋白质在日用化工中的应用 蛋白质可根据自身的结构特点与功能对人体(皮肤、头发)起到保护作用; 可以有效的保护衣物,起到护色不伤衣的作用;还可以高效的去除油质。因此, 蛋白质已经广泛应用于日用化工中,包括洗发露、沐浴露、护肤产品、洗衣液和 洗洁精等。应用于护肤产品的蛋白质来源非常广泛,如胶原蛋白、角蛋白、丝蛋 白、小麦蛋白、玉米和各种动物、果蔬蛋白质等。蛋白质能成功应用在日用化工 中,主要因其具有以下功能:促进新陈代谢、对皮肤刺激性小、营养、保湿、美 白、消炎和保护衣物等[6]。在日常生活中充分发挥生物活性成分在自然状态下的 作用,已成为日用化工的发展趋势。 1.1.2.4 蛋白质在农牧业上的应用 粮食作物及饲草中蛋白质的含量是衡量其营养价值的主要指标之一,因此提 高作物中蛋白质的含量,提高作物的使用价值是农牧业的发展必然趋势。目前育 种高蛋白质新品种已引起国 内外的重视,学者们通过使用多倍体杂交、射线诱变、 转基因工程、遗传育种和组织培养等方法选育高蛋白质新品种。在稻米品质方面, Zhou 等[7]将分子标记辅助选择应用于杂交稻”珍汕97”的脂肪含量、蛋白质含量、 糊化温度和翌白的研究。 8.8、蚂蚁算法应用领域 蚂蚁算法作为一种新的且很有前途的研究领域,目前已经成功应用在 一些组合优化问题中,在集成电路布线、网络路由选择、图像处理、数据 挖掘等领域中的应用研究也已经相当广泛,本文列举以下几方面的应用。 (1)二次分配问题(QAP)[28]:指将 n 个设备分配到 n 个位置,求解如何 分配才能使使得分配费用最小。1994 年,有人将蚂蚁算法应用到二次分配 问题产生了 AS-QAP 算法。实验证明该算法与模拟退火和进化计算等启发 式算法具有相同的性能。 (2)网络路由问题:随着网络多媒体应用的发展,多媒体数据流在网络 中传输质量越来越受到关注,提出了服务质量(QoS)的概念,而路由选择是 实现 QoS 的关键问题。将蚂蚁算法用于解决受限路由问题,可以解决包括 O A C B - 13 - 带宽、延时、包丢失率和最小花费等约束条件在内的 QoS 组播路由问题, 比现有的链路状态路由算法具有明显的优越性。 (3)蚂蚁算法在数据挖掘等领域的应用:蚂蚁算法在数据挖掘领域的应 用还处于起步阶段。不过已经有人将蚂蚁算法应用于数据挖掘分类问题, 提出 Ant-Miner 分类算法和相关改进算法。 8.9、蚂蚁算法的应用改进 研究表明,蚂蚁算法在移动自组网组播路由领域的应用具有很大的潜 力,但在实际应用中,仍需对蚂蚁算法进行一些改进。 3.3.1 移动自组网组播问题描述 一般来说,对于移动自组网可采用无向图 G(V,E)来表示,其中V 为移 动终端,E 为链路集合,给定一个组播源节点s? V ,一组目的节点D? V , 并且s? D ,因此组播路由结构可表示为图G(V, E) 的一个包括源节点s、目 的节点D以及图G(V,E ) 的任意子节点集合的子图G′。 移动自组网组播路由问题就是指在开销最小的情况下找到一种组播源 节点s 与一组组播接收节点集合D的最佳连接的子图G′,但由于移动自组 网具有拓扑结构动态变化的特点,导致G′中所包含的V ,E 均为动态变化 的,无法在动态变化的无向图中寻找整体最优的G′。根据动态规划法原理 27 可知,一条最佳路径可以由许多最优子路径组成(即满足最优化子化原理); 同时,由于移动自组网是多跳网络,进行传输时不断地选择下一跳,因此 为了使移动自组网组播路由更加灵活地适应多变的网络环境,可以将其细 化为在选择下一跳时动态地选择较好的下一跳进行传输。 3.3.2 用蚂蚁算法解决自组网组播问题 由移动自组网组播路由模型可知,该问题是一个优化组合问题,可以 利用蚂蚁算法的基本原理解决。 为了用蚂蚁算法解决移动自组网组播路由问题,结合自组网环境对蚂 蚁算法进行引申,将移动自组网组播源节点(发送节点)和组播接收节点分别 当作”蚁穴”和”食物”;将网络中用来寻路和路由维护的控制信息包当 作是蚂蚁;而信息素值则分布在从源节点到接收节点的各条路径上,表示 选择每条路径的可行概率。在组播路由问题中,”蚂蚁”行动的目的就是 要在信息素值的指导下找到从”蚁穴”到多个”食物”的优化路径,从而 得到整体上优化的组播路由。 信息素值的高低表示该信息素所对应的路径被选择机会的大小。信息 值越高,该路径作为传输路径的机率就越大。当信息素值为 1 时,则表示 该条路径是唯一存在的选择;当信息素值为 0 时,则表示该条路径不能到 达目的地。在此,为了使信息素值能够反映链路传输质量和拓扑结构变化, 选择能反映所经过的节点数、链路的传输能力、节点的处理速度以及拥塞 程度的端对端时延作为计算信息素值的关键因素,使端对端时延小的路径 所计算得到信息素值高时,被选择的概率就较大。 另外,由于移动自组网的特殊性和组播路由的需要,蚂蚁算法在此应 用需要改进。蚂蚁算法本身容易陷入局部收敛,使得各条路径上的信息素 值差距过大,当网络中链路的连接或传输状况发生变化时,不能及时地对 路径的选择产生影响。例如,在某一时刻,移动自组网中的节点 A 与节点 B 之间存在着三条不同的路径,分别记为 L1,L2,L3,分别对应不同的信 息素值。蚂蚁算法的局部收敛性可能会导致某一条路径上的信息素值明显 高于其他几个路径上的值,而该路径的值却不是全局最优的。假设,此时 28 L3 上的信息素值为 0.98,而 L2、L3 上的信息素均为 0.01,此时 L3 为最优路 径。而在下一个时刻,网络发生变化,L3 由于传输负载太大、出现拥塞等 原因不再是这三条路径中最好的路径,而 L2成为了较好的路径时,由于这 两条路径上的原信息素值差距过大,L2 上的信息素值根据信息素的更新有 所增加,但在一段时间内被选择的 概率仍小于 L1,信息素值并不能反映当 前网络的情况。因此需要避免各条路径上的信息素值差距过大。 另外,由于移动自组网具有动态变化的拓扑结构,因此应加快算法的 收敛速度,避免出现路由选择滞后于网络拓扑结构的变化等情况。 同时,由于组播中存在着多个组播接收者,也就是说存在着多个”食 物”,需要找到一点到多点的优化路径,要求网络中的节点按需维护组播 路由表;组播路由必须要周期性地进行维护。因此,这里的”蚂蚁”和原 有蚂蚁算法中的”蚂蚁”不同,需要重新定义以及设定其新的行动规则。 3.3.3 影响性能的因素分析 通过分析蚂蚁算法的基本原理和模型,可以发现影响蚂蚁算法的收敛 性和局部收敛性等性能的因素主要包括以下几个方面。 (1)参数设定影响 蚂蚁算法中参数对算法的整体性能有很大影响。但 蚂蚁算法中的参数多为实验所得,或者是各个领域中专家所给的建议,缺 乏理论上的证明和支持,并且在不同的应用领域有不同的取值范围。参数 设定问题的彻底解决有待于蚂蚁算法基本理论研究的成熟。 (2)蚂蚁行为的影响 蚂蚁算法在早期迭代过程中,各路径上信息素值 差别不大,蚂蚁主要根据启发式信息来寻找较好解,此时的蚂蚁算法等价 于贪心算法;当循环几次以后,较好路径上的信息素值会明显高于其它边 上的信息素值,此时蚁群主要通过信息素的交互来寻找较好解。算法在此 阶段的搜索过程主要利用了正反馈原理,容易导致停滞现象[52]。因此可见, 蚂蚁算法在很大程度上受早期发现的较好解的影响,这些解以极大概率引 导蚁群走向局部最优,这是容易出现局部收敛现象的主要原因。 (3)信息素更新机制的影响 文献[53,54]证明信息素 的更新在很大程度 上影响蚂蚁算法的收敛性。在信息素更新的过程中,概率值的大小主要受 29 两个方面的影响:增加的幅度和更新的频率。增加的幅度大,会使信息素 的值因一次更新而变得很大;或者频繁地以较小的增量增加也会导致信息 素值变得很大。信息素更新机制主要包括信息素值何时更新、如何更新、 更新的增量为多少[55],要实现对最优路径上的信息素进行适当加强。信息 素更新机制的合理性会使每条路径上分布的信息素以合理的方式设置、更 新[56],并能在保证收敛速度的基础上有效地避免路径上信息素值相差过大 。 因此,为了使蚂蚁算法更加适用于移动自组网组播领域的应用,可以 从以上三个方面对蚂蚁算法进行合理的改进。 3.3.4 改进的思想 为了使蚂蚁算法能够适用于移动自组网组播路由环境,根据移动自组 网的特点,对基本蚂蚁算法进行应用改进,主要的改进措施如下。 3.3.4.1 引入”制衡”的信息素更新方式 为了避免因不同路径之间的信 息素值的差距过大,不利于选择新的更佳的路径,而使算法过早地陷入局 部收敛,引入了”制衡”的信息素更新方式。用更新前的信息素值作为制 衡因子来控制信息素增加的速度,实现奖低惩高,以有效避免信息素值之 间差距过大。即在相同的条件下,如果节点的当前信息素值较小,那么信 息素更新时信息素值增量的相对值就较大;反之,信息素更新时增量的相 对值就较小。这样当网络环境发生变化时,信息素值能较快地改变,及时 指导路由选择,更好地适应传输流量或拓扑结构的改变。 3.3.4.2 采用双向的信息素更新方式 为了加速算法的收敛速度,采用双向 信息素更新方式。即当节点i经由节点 j 到达目的节点d 的可行概率增加时, 相应地从节点i由除 j 外的邻居节点到目的节点d 的可行概率同时减少。这 样一条链路上信息素值增加时,其他相关链路上对应的信息素值相应减少, 使其较易收敛到一条最优路径上。从而实现对最优路径上的信息素进行适 当加强的同时,对最差路径上的信息素进行适当地削弱。 3.3.4.3 理性的蚂蚁行为规则 由于改进后的蚂蚁算法要应用于组播,需要 对蚂蚁算法进行组播扩展,以用于组播路由的发现和维护过程,因此在算 法中重新定义两种蚂蚁,组播前向蚂蚁和组播后向蚂蚁,具有不同的行动 30 规则。组播前向蚂蚁主要用来寻找组播接收者,组播后向蚂蚁主要在逆向 路径上进行信息素值的更新。在组播前向蚂蚁的行为规则中设置检测回路 的机制,以避免出现环路;设定蚂蚁的生存时间,如时间过长则表明该蚂 蚁携带的信息过于陈旧,让其自动死亡。并将两者设为不同的优先级,使 组播前向蚂蚁能更好地收集网络环境资料,而组播后向蚂蚁能及时地更新 信息素值。 由于移动自组网中的网络拓扑结构动态变化以及链路传输的不断变 化,这就需要前向蚂蚁周期性地进行探路,而提高对网络环境的适应性。 3.3.4.4 合理的设置信息素初值 经研究发现,信息素值的初始化在很大程 度上影响着蚂蚁算法的前期收敛速度。为了提高蚂蚁的使用效率,充分利 用网络本身的先验局部信息来初始化路由概率表,使网络节点的路由表在 启动时就更接近网络的拓扑情况,进一步地说,当其中一个邻节点为目的 节点时,应该有较高的概率值。 3.3.5 改进后的蚂蚁算法 根据 3.3.4 中所描述的改进思想,对蚂蚁算法进行了改进,改进后的蚂 蚁算法可描述如下。 在改进后的 蚂蚁算法中,将蚂蚁分为组播前向蚂蚁和组播后向蚂蚁两 类。组播前向蚂蚁主要用来进行寻找到达组播接收者的路径,而组播后向 蚂蚁主要用来在逆向路径上进行信息素值的更新。 定义 3.1:组播前向蚂蚁是指由源节点出发,到达接收者后死亡的蚂蚁, 简称为前向蚂蚁,记为 fant。 规则 3.1:前向蚂蚁遵循的行为规则。 if (当前节点已经被访问) then fant 死亡,删除环路; else {if (当前节点是目的节点) then 记录逆向路径信息,转换为组播后向蚂蚁; else 31 记录逆向路径信息并向邻节点广播 fant; } 定义 3.2:组播后向蚂蚁是指由前向蚂蚁转化生成的,从组播接收者出 发,到达组播源节点后死亡的蚂蚁,简称为后向蚂蚁,记为 bant。 规则 3.2:组播后向蚂蚁遵循的行为规则。 if (当前节点不是目的节点) then /*发送 fant 的源节点*/ 更新路由表,沿逆向路径的下一跳传播; else 更新路由表,bant 死亡。 前向蚂蚁包具有和普通数据包相同的优先级,在网络中传输时遵循先 进先出的原则,会经历与普通数据包相同的延迟和拥塞,并能在相应的记 录项中体现出来,为后向蚂蚁包更新信息素值提供直接依据。后向蚂蚁包 具有比普通数据包更高的优先级,沿原路返回时能根据时延信息在返回途 中的每个节点上及时地更新组播路由表中信息素值。 假设可行概率P 表示信息素值, Pjd 表示当前节点i通过节点 j 到达目的 节点d 的可行概率,该值越大表明相应链路上的时延越小。M id 为从当前节 点i到达目的节点d 的下一跳节点集合,初始值为空。对于任意k ?M id ,均 应满足式(3-4)。 ? ? = kMid Pkd 1 (3-4) 在算法的初始时刻,网络中所有路径上的信息素值为空,组播源节点 向网络中广播前 向蚂蚁,前向蚂蚁以组播接收者为目的地址在网络中进行 寻路,并沿 途记录下所走过逆向路径。当前向蚂蚁到达组播接收者后转化 为后 向蚂蚁,沿逆向路径返回,对逆向路径上的节点所维护的组播路由表 中的信息素值进行更新。 当后向蚂蚁从目的节点d 通过邻节点 j 到 达当前节点i时,需要进行信 息素值的更新。信息素更新规则如下。 规则 3.3:信息素更新规则。 if (M id =Φ ) then 32 Pjd=1 ; else 信息素 值按信息素更新方程(3-5)和(3-6)进行更新。 Pjndew=Pjodld+r(1 ? p joldd) (3-5) Pkndew=Pkodld?rPkodldk?M i ,k ?j (3-6) 以上两式(3-5)与(3-6)同时进行,即经由节点 j 到达目的节点d 的可行概 率 Pjd 增 加时,经由节点k (除节点 j 以外)从i到d 的信息素值 Pkd 同时减少, 加大了收敛的速度。其中r 为增强因子,其计算如式(3-7)所示。 ?? =???? ? ? ,其他 D e D e r d βt d βt 1 ,1 (3-7) 式(3-7)中β 为制衡因子, 利用原信息素值来制约信息素值增长速度的快慢 , 当原信息素的值 较大时,由于制衡因子的作用会使其增长的幅度变小;反 之,增长幅度 变大。β 的计算方法如式(3-8)所示。 ?( ) ? 0 ,0 4, 1/2 = ? ?? =??? ? old id old iodldid p βpp (3-8) 增强因子 r 的计算公式中的t为相应路由的 端对端时延,设从源节点 s 到目的节点d 的路径为s? ?i?j1? j2? ?j k ? d ,则 bant 从目 的节点d 返回到节点i时,从节点 j1 经过到 达目的节点d 的时延tj d 1 计算如式 (3-9)所示。 jdijjjj kd t=t+t+ +t 1112 (3-9) 式(3-9)中 tij1 为节点 i 到邻居节点 j1 的时延,其余含义 相同。利用 t 来计算 Dd , 计算式由式(3-10)所示。 DdDd tjd 1 =(1?η) + η (3-10) 式(3-10)中η 为学习率。从式(3-9)、(3-10)中可见,路径时延 tj d 1 越小,时延 估计越大,则其对应的信息素值增量就越大。 移动自组网组播环境下的蚂蚁算法改进后的步骤可以简单表述如下。 步骤 1:初始化 fant; 33 组播源节点s向外广播前向蚂蚁 fant,目的地址设置为组播组 接收节点集合D的组播地址。 步骤 2:重复本步骤直到 fant 到达组播接收者。 if (fant 在生存期内)&&(当前节点未访问过) then fant 按照行动规则 3.1 在网络中寻路。 步骤 3:当 fant 到达组播接收者后,转化为 bant。 步骤 4:重复本步骤,直到 bant 到达组播源节点。 if (bant 在生存期内) then bant 沿逆向路径返回,沿途更新组播路由表,同时按照信 息素更新规则 3.3 进行信息素值的计算与更新。 步骤 5:if (组播组有数据要发送) then 周期性地转到步骤 1,进行路由的维护过程; else 终止程序。 从以上 5 个步骤可以看出,改进后的蚂蚁算法与原有蚂蚁算法相比终 止条件不同,需要周期性地循环算法,这是移动自组网按需组播路由算法 或协议的共同特点。 3.3.6 算法分析 可以从以下几个方面对改进后的蚂蚁算法进行分析。 (1)支持组播 从蚂蚁行为规则可见,前向蚂蚁的目的地址为组播地址, 可保证组播接收者接收到前向蚂蚁包。当组播接收者接收到了前向蚂蚁包 以后,用后向蚂蚁包来应答,并沿途设置信息素值,更新组播路由表。 (2)周期性发送前向蚂蚁包 在传统网络中,蚂蚁算法收敛到一个最优 解时,算法的过程结束,而在移动自组网中,网络拓扑结构动态变化,所 以算法的结束时间是该组播源节点不再发送数据,这时网络中才不再维护 该组播组的组播结构。 (3)收敛性 由于移动自组网具有特殊性,蚂蚁算法的改进也是针对移 动自组网组播应用环境进行的, 具有一定的特殊性,其改进主要是要满足 34 移动自组网组播路由应用的需要。当网络环境发生变化时,需要蚂蚁算法 能够及时将链路的传输质量反映到信息素值的改变上,使路由选择能够找 到较优的路径进行传输。 改进后的蚂蚁算法在加快收敛速度的同时有效地避免了过早的局部收 敛。引入”制衡”因子β ,利用原有信息素值来奖低惩高,避免了信息素 值差距过大,能有效地避免过早的局部收敛,使信息素能够对网络拓扑的 变化快速做出反应;使用双向更新方式,文献[53]已经证明该类双向更新的 方式能够在实际应用中加快整个算法的收敛性,采用信息素更新规则 3.3, 以满足网络动态变化的需要。 下面分析一下改进后的蚂蚁算法是否能收敛到最优。假设网络拓扑和 网络传输流量在一段时间内保持不变,当前节点i所维护的从邻节点 j 到目 的节点d 的链路上对应得信息素值P jd 得到增强,端对端时延越小则增幅越 大,同时其他相关的路径上信息素值也相应的下降。当经过邻节点 j 的路径 是最短路径时,信息素更新过程的重复进行必然使得 Pjd 无限趋近于 1,而 其他路径的信息素则会无限趋近于 0,最后收敛于最优的状态。 (4)专用性 该算法具有一定的适用范围,应用于移动自组网组播领域, 将其用于其他领域以及传统网络的组播问题并不适用,性能有所下降。 8.10、蚂蚁算法应用及发展 蚂蚁算法是一种源于大自然的新的仿生类算法。他是模拟自然界蚂蚁觅食过 程中的一种分布式、启发式搜索算法,最早是由意大利学 者Dorigo M.等人提出 的[40]。蚂蚁算法主要是通过蚂蚁群体之间的信息传递而达到寻优的目的,最初又 称蚁群优化方法(ant colony optimization,ACO).由于模拟仿真中使用了人工 蚂蚁的概念,因此亦称蚂蚁系统(ant system,AS)。 AS(Ant System)是最早的随着蚂蚁群这个概念提出来的,它首先被成功的应 用于TSP问题。虽然与己经发展完备的一些算法如遗传算法GA比较起来,基本的 蚂蚁算法计算量比较大,而且效果也并不一定更好,但是它的成功运用还是激起 了人们对蚂蚁算法的极大热情和兴趣,并吸引了一批研究人员从事蚂蚁算法的研 究。AS算法被成功的运用于许多能被表达为图表上的寻找最佳路径的问题。 26 天津大学硕士学位论文 第二章 蚂蚁算法 蚂蚁算法自提出以来,以TSP问题为测试基准,与其他一些常用启发式方法 作了一系列的比较,用于检验的是若干典型的对称型和非对称型的问题(取自 TSPLIB),先后来用了模拟退火法(SA)、遗传算法(GA)、神经网络(NN)(如弹性网 法、自组织映射法等)、进化规划(EP)、遗传退火法、插入法、禁忌搜索法(TS)、 边交换法(2—opt、3—opt等)等多种算法进行求解,除了Lin—Kemighan的局部 改进法之外,优于其他的所有方法。 在TSP问题之后,接着求解的就是经典的二次分配问题(QAP)[41],测试数据来 自算例库QAPLIB,其结果也相当今人满意。随后,工件排序问题[42]、调度问题、 大规模集成电路、通信网负载平衡、序列订货问题(即有结点访问顺序限制的TSP 问题)[43]、QOSR问题[44]、组合优化问题[45]等,相继得到测试、求解和应用。 在标准的蚂蚁算法问世后不久,人们就开始对其设计了各种改进措施.首先 出现的是将蚂蚁算法与Q—学习算法结合而成的Ant—Q算法[46],其中利用了多个 人工蚂蚁的协同效应、其后,MAx—MIN蚂蚁系统[47]在求解TSP中获得了更好的效 果,这种改进型蚂蚁算法对轨迹强度τij设置了上下限τmax和τmin,其中,τmax= n/Zmin,Zmin为当前的目标函数最小值,τmin=c/(d n 2 ),d为平均边弧长度,运 行时,仅对一个蚂蚁实施MAX-MIN法则,并且轨迹强度在初始化时设为τmax在此 基础上,又提出了带有局部改进策略的MAX—MIN蚂蚁算法,其主要步骤为: (1)信息素轨迹和参数初始化, (2)当停机条件不满足时,执行 a、对每个人工蚂蚁构造一个解; b、选择实施局部改进的人工蚂蚁; c、更新信息素轨迹,其中,所有的τij限定在τmax和τmin中 (3)返回最佳解 一般而言,局部改进方法与初始解有关,求解时往往涉及到初始化问题, 而蚂蚁算法在一些组合优化难题上与其他启发式算法相比尽管更具竞争力,但比 之个别精致的局部改进算法仍相形见绌,于是,将蚂蚁算法与局部改进法相结合 可使两者的优越性进一步发挥。 此外,把蚂蚁算法的思想和遗传算法的思想或分支限界法的思想相结合来解 决最优化问题[48~51]已得到应用,这方面的工作做得还不够多,把多种优化算法结 合起来就能发挥各种算法的优势,使优化问题的解决进一步合理化。
本文档为【蚂蚁蛋白质的提取】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_240534
暂无简介~
格式:doc
大小:227KB
软件:Word
页数:114
分类:生活休闲
上传时间:2017-10-21
浏览量:19