色氨酸合成代谢网络的构建与研究（可编辑）

色氨酸合成代谢网络的构建与研究（可编辑）色氨酸合成代谢网络的构建与研究（可编辑）色氨酸合成代谢网络的构建与研究江南大学硕士学位论文色氨酸合成代谢网络的构建与研究姓名:王栋申请学位级别:硕士专业:计算机软件与理论指导教师:须文波 20090801 摘要摘要色氨酸是人体和动物生命活动的8种必需氨基酸之一，对人和动物的生长、发育和新陈代谢起着重要的作用，广泛应用于医药、食品和饲料等方面。如何提高色氨酸发酵产率是目前一个重要课题。为了从系统水平上描述、解释和预测色氨酸合成的行为和功能，加深对生物代谢网络组织...

色氨酸合成代谢网络的构建与研究（可编辑）色氨酸合成代谢网络的构建与研究江南大学硕士学位论文色氨酸合成代谢网络的构建与研究姓名:王栋申请学位级别:硕士专业:计算机软件与理论指导教师:须文波 20090801 摘要摘要色氨酸是人体和动物生命活动的8种必需氨基酸之一，对人和动物的生长、发育和新陈代谢起着重要的作用，广泛应用于医药、食品和饲料等方面。如何提高色氨酸发酵产率是目前一个重要课题。为了从系统水平上描述、解释和预测色氨酸合成的行为和功能，加深对生物代谢网络组织原则的理解，并最终用于指导菌种选取，发酵过程优化等，本文首先由基因组数据重建大肠杆菌的L(色氨酸 L(Try 合成代谢网络，并使用极端路径算法 EPs 分析此代谢网络的整体拓扑结构，网络模块化及其关键代谢途径。随后通过研究色氨酸合成数学模型以及基于惩罚函数的人工免疫网络 P(CoAIN 算法来解决约束优化问题。色氨酸数学模型为多约束优化问题，故将P(CoAIN算法应用在色氨酸合成模型上。具体实验工作如下: 1(代谢网络的重构是对其进行结构和功能分析的前提，本文首先从KEGG等相关数据库中获取L(色氨酸在大肠环境中的基因组和所有代谢途径信息，参照Ma和Zeng 在KEGG代谢反应数据库基础上进行的修正补充后得到的数据库并查阅相关文献对所得的网络进行必要的修正。最后有节点表示代谢物，连线表示代谢物之间的反应，箭头表示反应的方向，即通代谢物图来表示所得的代谢网络，完成色氨酸合成代谢网络的构建。 2(使用极端途径方法对大肠杆菌的L(色氨酸合成代谢进行分析，描述其网络的关键途径和特点，并发现一组不同于传统实验方法所得L(色氨酸合成途径，有望为优化合成过程提供理论指导。 3(提出了P(CoAIN约束优化算法，用于处理约束优化问题。由于在原有人工免疫网络中引入惩罚函数的协作机制，使得人工免疫网络细胞具有处理多约束问题能力。对多约束函数优化的测试表明P(CoAIN与各种进化策略以及遗传算法相比，在寻优能力和执行速度方面效果良好。 4(构建研究色氨酸合成数学模型，通过改变模型中相关参数，一与甜足，调控色氨酸产物达到最优解。由于构建模型属于多约束优化问题，但当今众多算法解决的是无约束线性问题，故使用惩罚函数方法，通过惩罚函数，将目标函数改变为无约束优化问题。 P(CoAIN应用到色氨酸合成模型中，以优化提高色氨酸的产量。关键词:色氨酸合成，代谢网络，极端路径分析，人工免疫网络，约束优化。 Abstract Abstract of aminoacidsinhuman an one essential nutrition，plays Tryptophan，aseight important is in rolein mechanismsfunctions，It not physical widelyappliedonly butalsoin other to the rateof many aspects(Howimproveproduce tryptophanthrough isan this functional of fermentation importanttopic(Inpaper,the capabilitiesTryptophan is and froma to synthesisdescribed， interpretedpredictedsystem-orientedperspectivedeeply understandthe of willbe toselectionof fundamental，It stains， organization veryhelpful offermentationandSO reconstructedthemetabolic optimization process on(Thedissertation networkof inE(colifromits its Tryptohanbiosynthesis genome， andanalyzedglobal andcorrelativemetabolic Extreme topologicalproperties，modularity pathwaysthrough themathematicalmodelofthe Pathwayanalysis EPs method(Subsequently,weinvestigate inbacteria(The artificialimmune biosynthesis L??tryptophan Penalty-basedCooperative tosolveConstrained the network P??CoAIN isproposed mathematicalmodelofthe Canbeviewedasa L-??tryptophanbiosynthesis P-CoAIN to its of isused stabilitytryptophan optimizationproblem，the algorithm Optimize model(ThemaincontributionsofthisdissertationCanbeconcludedasfollows: biosynthesis 1(Itsnetworkofstructuralandfunctionalofmetabolicnetworkisreconstruct， analysis wefirstobtainedallmetabolicreactionsinvolvedinmetabolicnetworkofTryptohan inEscherichiacolifromKEGGandcorrelative allofreactions biosynthesis database， where arerevisedbasedaKEGG―baseddatabase Maand andcorrelative developedby Zeng metabolicnetworkreconstructedis SO―calledmetabolite literatures(Then，the representedby andthelinksarereactions( inwhichthenodesaremetabolites graph thecritical 2(EPsis on inEscherichiacolitodescribe appliedTryptohanbiosynthesis andthecharacteristicofthenetwork(Theresults thattherearesomenovel path suggested whichwill a mechanismto theaccumulationof potential optimize pathways provide Tryptohanbiosynthesis( 3(P(CoAINis forCO cellsoftheartificialimmunenetwork proposedproblem(Memory interactnot butalso onlybycompetitionbycooperation、^，itllsharing 、析tllevolution and P―CoAIN in geneticalgorithms， thepresentsgoodperformance strategies termsof and abilityrunningspeed( optimalsearching ofthe in themathematicalmodel 4(Investigate L― tryptophanbiosynthesisbacteria(By be combinationoftwo Canmodified andcontrolled appropriate elements，which genetically environmentalcallachievestablesolutionfor within by changes(We improvedproductivity as as ismaintained(Asthe of robustness modelisa stability longfeasibility anydegree multi(constrained functionmethodisusedtotransforma optimizationproblem，penalty intoa unconstrained orderto the constrained single optimizationproblem(Ininprove problem rateof P―CoAIN isusedto the optimize produce tryptophan，thealgorithm tryptophan modelhere( biosynthesis Network，Extreme Synthesis，Metabolic pathwayanalysis， Keywords:Tryptophan ArtificialImmune Network，ConstrainedOptimization( ? 独创?? 生声明本人声明所呈交的学位论文是芬人在导师指导下进行的研究工作及取得的研究成果(尽我所知，除了文中特别加以杼注和致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含本人为获得江南大学或其它教育机构的学位或证书而使用过的材料( 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意( 签名: !巫篮日期:弘刀夕年分月f牛日关于论文使用授权的说明本学位论文作者完全了解江南大学有关保留、使用学位论文的规定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘，允许论文被查阅和借阅，可以将学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存、汇编学位论文，并且本人电子文档的内容和纸质论文的内容相一致( 保密的学位论文在解密后也遵守此规定( 签名: 导师签名: f乏怠破日期:娜夕年公月彤日第一章绪论第一章绪论 1(1代谢工程如果说上世纪90年代是分子生物学时代的话，随着人类基因组计划的完成，21世纪前10年就是将新知识用于解决医学，药学，农学领域以及生物技术产业中存在的紧迫问题的时代。随着生物功能基因组学以及对生物基因组成有目的处理的研究取得进展，加上史无前例的计算机应用与普及，生物技术的一个新的分支――-代谢工程产生了。代谢工程为我们描绘了一个不同的研究前景，提供了一种崭新的思维方式。它不仅侧重于有机体生物操纵的新工具研究上，而且强调用系统的，综合的方法深入理解代谢途径。代谢工程是一门交叉学科，它综合利用了分子生物学，生物化学，遗传学，化学工程，生物技术，计算机科学，数学建模和系统分析等诸多学科之中，研究对象通常是微生物中的代谢途径和代谢网络，研究目标是最优化最终代谢物的产率【lJ。 1(代谢网络的基本概念传统的生化途径一般定义为确定的单独反应的链式组合，通常说来是不考虑辅因子和副产物的。现阶段，由于可以获取更加完全的信息和大量重建的代谢网络，逐渐形成了基于网络的途径定义包括辅因子和副产物 [21。目前，传统的途径已经只能作为一个观念上的框架来交流、教学以及作为建立代谢网络的一个基础，由于它们通常只是一组反应的链式组合，因而不能用于系统层次的分析。代谢途径的定义为:一连串可以进行的并可观测的生物化学反应步骤，这些反应步骤是以指定的一组输入和输出所连接【3】。途径通量的定义为:输入代谢物反应生成输出代谢物的速率。胞内代谢通量的确定称为代谢通量反应 MFA ，在代谢工程中处于中心地位。在代谢途径及其通量的框架中，代谢工程的一个基本目标就是阐明代谢通量控制的因素和机理。对代谢通量控制的深入理解为代谢途径进行合理修饰提供了基础，对代谢通量及其控制进行系统的研究包括三个步骤。第一，开发能够观测尽可能多的代谢途径及测定其通量的方法。第二步是向生物反应网络引入一个精确的扰动并在系统达到新的稳态之后确定途径的通量。第三步即最后一步是通量扰动结果的分析【31。一个多世纪以来，还原论在生物学研究中一直占有重要地位。人们已经获得了大量有关细胞组分和组分功能方面的知识。但是经过大量研究人们发现大多数生物功能是由许多细胞分子相互作用共同完成的。因此，21世纪生物学的一个重要挑战就是在系统水平上对多种分子和基因相互作用网络进行分析。理解细胞内复杂的相互作用网络的结构和动力学对生物功能的影响，图1(1给出了生物学研究发展思路的转变【4】。近年来，随着数百种生物的全基因组测序的完成，以及对基因功能不断深入和广泛的了解，从基因组信息可靠地重建物种功能的代谢网络成为了可能。因此，通过代谢网络预测生物学功能，成为后基因组时代生物信息学研究的一个基本问题。江南丈学硕士学位论文还原论方法综合的方法组分生物学系统生物学黼 ,法 20世纪的生物学 2l世纪的l物学图卜1生物学研克方法的转变 1 Theshiftinmethodsof calresearch Fig(1 biologi 2 代谢网络的研究手段复杂网络理论的迅速发展为在系统水平上研究生物网络的结构组成和网络的功能提供了新的平台。近年来，网络生物学的研究表明细胞叫络剧样遵循一定的普遍规律。代谢网络是生物体内发生的多个化学反应的总和。根据研究目的的不同，代谢网络可表达成四种不同形式的图:代谢物图，反应图，酶图，二分图。代谢物图是把代谢网络中的代谢物看成图中的结点，连接代谢物之间的反应看成图中的边;二分图是把代谢物和酶看成两种不同类型的节点。这样代谢恻络就描述为数学意义上的图。在自己研究的范围中，就需要合理的利用到代谢物图，对其色氨酸合成代谢网络进行代谢物图的构建。复杂网络的理论方法已经在代谢网络的研究中得到了广泛的应用，研究表明代谢网络和其他不同领域的网络如万维网，科学英文网络，电影演员台作网络等具有共同的普适性质。对于这些网络的结构性质进行研究有助于进一步的了解这些网络的形成机理和功能。代谢网络极其复杂，用网络分析的方法将代谢网络分解成若干具有相对独立功能 J。的子网络，不仅能够简化问题的复杂性，同时有助于网络功能的预测p 代谢网络的研究是一个多学科交叉的研究领域，结合了生物化学、分子生物学、细胞生理学、化学工程以及计算机科学等众多学科。目前的研究主要集中在代谢网络的重建及其结构功能分析方面详见第2章，研究人员已经成功地重建了多种生物的代谢网络?”，并且建立了多个代谢网络数据库H'9]。在代谢网络被重建和insilico模拟之后，我们就可以通过分析网络来对细胞的生物学功能进行分析、解释和预测”„。然而由于大量反应的动力学参数都是未知的，因此，目前在代谢网络结构功能分析方面，基于网络拓扑结构的静态分析方法得到了广泛的应用，而圈论方法和基于网络的途径分析是目前采用的主要方法。代谢网络与代谢途径的研究前景非常广阔，具有重要的现实意义。在医药领域，其研究成果可用于识别药物作用靶点来进行药物以及基因疗法的设计。相对于传统的以疾第一章绪论病相关单个酶促反应步骤为靶标的研究策略，基于网络的策略有助于在基础医学研究及临床处理中对实验结果进行更好的分析，并且更加合理的选择药物靶标[1l,12】。 1(2人工免疫系统 Immune 人工免疫系统 Artificial 没有一个国际认可的标准定义，JonTimmis博士指出“人工免疫系统是受己知的免疫功 3】"。能、原理和模型以及理论免疫学启发而提出的用于解决实际问题的自适应系统【l D(Dasgupta指出“人工免疫系统是受免疫系统启发而提出的用于解决实际问题的智能方法"。一般认为，人工免疫系统是一类基于生物免疫系统的功能、原理、基本特征以及相关理论免疫学说而建立起来的用于解决各种复杂问题的计算系统【141。近年来，基于免疫系统原理开发的各种模型和算法广泛地应用在科学研究和工程实异常检测包括故障检测、计算机以及网络安全应用;优化包括组合优化、数值函数优化等实际优化应用。 91(--m 图卜2人工免疫系统应用领域分类图 of icationAreasofAIS Fig(1―2SummaryAppl 1(人工免疫网络模型从1974年Jeme发表了具有里程碑意义的文章后，人工免疫网络成为一种关注的对象，免疫系统能够通过网络B细胞间的相互作用实现免疫记忆。构成相互刺激和相互制约的物质基础即为抗原与抗体结合时所表现出的独特型和抗独特型。由于网络的细胞间的抑制作用，产生了网络调节机制。这样网络细胞的相互作用导致即使在没有抗原的情况下网络记忆结构的稳定。随后发展起来的人工免疫网络模型有很多，这里以Juan等人05年提出的模型系谱树【21】为基础，根据当今人工免疫网络模型的发展，绘制出如今的人工免疫网络模型的系谱树，用来描述这些模型发展演变的过程与关系，如图1(3所示。 3 江南大学硕士学位论文 JemeFarmerVarcla perelson TECNO-STREAMSFractalIN CoAIN dopt-aiNet 图1-3人工免疫网络模型系谱树 TreeofAIN Fig(1―3GenealogicaI Models 2(人工免疫网络优化研究 1 opt(aiNet人工免疫网络122j 之一，因此备受关注。对它的研究和改进成为人工免疫中的一个研究热点。 opt(aiNet的执行是首先创建一个抗体种群，抗体通过克隆、适应度成熟、精英选择过程不断进化。被选择的抗体作为记忆细胞被添加到免疫网络中，在那里它们要经受网络压缩过程，即计算记忆细胞的相似度。如果记忆细胞对的相似度小于压缩阀值，那么其中适应度低的记忆细胞就被删除。通过基于网络压缩的免疫记忆细胞删除，防止记忆细胞大量聚集在同一个多峰上的情况，节约“资源’’的同时，提高了网络细胞的多样性，执行过程基于克隆选择和免疫网络原理。opt(aiNet的主要优化特点表现为: ??种群规模动态调节; ? 具有不断扩展搜索空间，探寻最优解能力; ??能够保存局部较优解。英国Kent大学Jon within are networkinteractions 给出了详细的评价。他指出“the opt-aiNetonly suppressive in ofthecellsin natureand donotcontributetothestimulation way刀，【zjJ认为 they any opt(aiNet将记忆细胞间的交互简单的描述为网络抑制作用，丝毫没有考虑细胞间的刺激激励作用。随后他将opt-aiNet算法与BCA B Genetic Algorithm 进行了比较【24】。发现算法存在执行速度慢，寻优能力优势不明显的问题。 4 第,章绪论图卜4opt―aiNet算法流程图 F10Wchartof Fig(1―4 opt― aiNetalgorithm 2 dopt―aiNet人工免疫网络【25】?? OlivettideFranca等人提为了提高搜索能力，加快算法的搜索速度，Fabricio 指出黄金分割的变异步长法在多模问题中不能获得全局最优解，而且增加了计算比较时间。此外，两个新型变异操作由于是对网络细胞的每一维进行操作因此对高维度问题的计算量非常大。 3 CoAIN协作型人工免疫网络【26】具有粒子群行为的协作型人工免疫网络算法CoAIN是在原有人工免疫网络中引入群体智能个体间的协作机制，用于求解多模函数优化问题，使得人工免疫网络细胞具有共享寻优经验的协作能力。对多模函数优化的测试表明协作型人工免疫网络CoAIN与 1(3本文的研究内容及文章结构 1(立论依据色氨酸是人体和动物生命活动的8种必需氨基酸之一，对人和动物的生长、发育和新陈代谢起着重要的作用，广泛应用于医药、食品和饲料等方面‘271。但人体自身不能合江南大学硕士学位论文主要用于制造复方氨基酸营养输液，并可单独作为抗抑郁剂和催眠剂。目前，全世界年 000 000 需求量在10 t以上，而实际产量仅有l t左右，远远不能满足市场需求。我国的色氨酸生产尚处于研发的初级阶段，产量较少，使用上多限于饲料，其它应用领域开发较少，其应用仍然主要依赖进口[28】。提高色氨酸发酵产率、降低生产成本已成为目前一个重要课题。 2(主要研究内容及其基本结构为了从系统水平上来描述、解释和预测色氨酸合成代谢网路的功能及其行为，加深对其细胞组织原则的理解，并最终用于指导菌种优选、发酵过程优化等。本文依据KEGG 数据库建立色氨酸合成代谢网络，选择当今流行的极端路径算法应用在色氨酸合成代谢网络中，分析代谢网络的极端路径。接着通过对协作型人工免疫网络 CoAIN 的学习研究，结合惩罚机制，建立基于惩罚函数的协作型人工免疫网络约束优化算法 P―CoAIN ，用于解决多约束优化问题。最后，研究色氨酸合成的数学模型，并将 P(CoAIN应用到色氨酸合成模型的优化中。本论文的主要研究内容及论文的结构安排如下: 1 首先，简要代谢工程的产生和研究内容，以及代谢网络与代谢途径研究思路、流程和方法的转变，并对色氨酸生物学的研究现状及研究意义做一概括。接着对人工免疫系统的基本理论和研究现状特别是人工免疫网络在优化方向的研究进展进行分析，提出本文的研究思路。从宏观上介绍了本文的研究内容、意义以及论文的整体结构组织。这部分内容对应于论文的第一章。 2 第二章首先详细介绍了用于代谢网络重建的主要数据一般包括生物化学、基因组学和相关的代谢生理学信息以及相关数据库，然后介绍了重建和精炼代谢网络的一般方法并完成了色氨酸合成代谢网络的重建工作，为接下来基于网络的途径分析提供了直接材料。 3 第三章首先简单地介绍的基于网络的途径分析方法的发展简史，随后着重说明了基于凸分析的两种代谢途径分析方法:基元模式和极端途径及它们之间的异同，并详细阐述了这两种方法的具体应用，最后使用后者详细分析了大肠杆菌的色氨酸合成代谢网络。 4 第四章为了实现算法解决多约束优化问题，提出惩罚函数方法，通过将多约束的优化问题转化为带有惩罚函数的无约束优化问题，在目标函数的基础上加入惩罚函数构成最终目标。在CoAIN算法的基础上引入惩罚函数机制，提出了P(CoAIN算法。 Ranking以及PSO算法进行对比，对其求解多约束优化问题能力进行分析。 5 第五章首先介绍色氨酸合成数学模型的建立，将色氨酸合成代谢网络转化为了多约束的函数优化问题，随后使用第四章中的协作型人工免疫网络以及惩罚函数方法对色氨酸数学模型进行优化求解，通过改变色氨酸环境参数浓度使最终色氨酸产物达到满足约束条件的最优值。 6 第六章是论文的主要工作总结及其展望。 6 第二章色氨酸合成代谢网络的构建第二章色氨酸合成代谢网络的构建 2(1引言解释细胞中涉及的代谢和调节网络是系统生物学的一个重要课题，迅速发展的基因组测序技术与功能基因组学提供了这些生物网络的大量信息，这使得我们可以方便的理解细胞生理学以及在系统层次上比较不同的有机物【291。代谢处于生命活动调控的末端，是驱动生命过程的化学引擎，产生能量来驱动各种细胞过程，降解和合成许多不同的分子代谢网络把细胞内所有生化反应表示为一个网络，反映了所有参与代谢过程的化合物以及所有催化这些化学反应的酶之间的相互作用，是对细胞整个代谢活动的抽象表达。研究代谢网络能够帮助我们预测和模拟细胞的功能及其行为，从而更好地认识和利用细胞代谢过程，促进发酵工程、制药工业等产业的发展。事实上，近年来已经有大量的关于基因组规模代谢网络的研究【30-361。本章将讨论通过汇集细胞中的所有的反应以提供细胞代谢的综合模型的方法，详细介绍了用于代谢网络重建的几类主要数据以及相关数据库，然后介绍了重建代谢网络的一般方法并完成了大肠杆菌中色氨酸合成代谢网络的重建工作。显然，仅能考虑所有可能反应中的一少部分，因为其中很多反应甚至还不知道，或将其包括就有可能产生难以处理的大系统。同时，还不清楚增加代谢反应描述的细节能把细胞模型的精确度及实用性提高到什么程度。尽管有很多方法可进行反应的汇集，但其合理性及一致性是最重要的。本章将对构建细胞模型的化学计量学提供一个框架，它也适用于分析很大的反应网络。 2(2细胞反应所需的数据细胞的功能依赖于多种不同的化学成分的相互作用，迅速发展的基因组测序技术与定它们的化学成分，包括:全基因组的测序与注释基因组，给定情形下探测信使RNA 的合成转录组，蛋白质的交互和功能状态蛋白组，代谢物及其浓度以及代谢通量的测量代谢组。结合基因组数据、生物化学以及相关的代谢生理学信息使得我们能够建立包含全细胞组分的生物化学反应网络，这样就可以从系统水平上描述、解释、预测和模拟细胞的功能及其行为【371。基因组规模代谢网络的重建工作实际上是一个将所有有关“组学"数据的整合过程，此过程需要大量的相关数据资源【4J，主要包括: l、生物化学;重建基因组规模代谢网络的最直接有力的证据。如果生物体中某种酶的功能被确定了，那么该酶催化的代谢反应就应该被包括在重建的网络内。对于大肠展，使得所构建的模型具有很强的理论依据。 2、基因组学;基于DNA同源性的序列相似性比对识别基因组序列中的开放阅读框 Ol疆，也可以作为证实生物体中存在某代谢反应的有利证据。 7 江南大学硕士学位论文 3、生理学等其他间接的信息;生理学的证据。比如知道生物体实际可生成某种氨基酸，但是网络中却缺少可以产生该氨基酸的途径，那么就需要加入相应的反应。此过程叫“Gap分析’’，其它的间接信息常用于诊断重建后的网络以作必要的精炼。 4、Insilico模拟数据;模拟与仿真学习通常也可用于精练重建后的网络。比如，代谢网络必须能够产生所有细胞生存必需的某些代谢成分，若不能生成其必需成分，就应也加入相应的反应，此种反应称为“推断性反应’’。通过组合所有不同数据资源得到的反应就可以重建基因组规模的代谢网络，这种网络之所以称为“基因组规模的"，是由于一般来说整个过程是从注释的基因组数据开始的，它包含了所有已经发现的与生物体代谢有关的基因组信息。 2(2(1生物化学信息生物化学信息是确定生物体中是否存在某种反应最可靠的信息，其次，它还给出了反应的可逆性及化学计量系数。例如，葡萄糖激酶的作用是催化葡萄糖与ATP反应生成以得到这组关联信息如下图所示: K如一删:刚7? 0盈o Entry R01786 Reaction l?aM ATP:alpha‘D-glucose6-phosphotxansferase Definition 6-phosphate] ATP+alpha―D-Glucose ADP+alpha―D-Glucose c00002+C00267《 C00008+C00668 Bquation] ‖p《一一、》吧《晰 ? V―_ (哦婚修蚺修 RPai(r RP:RP00003c00002C00008main RP:RP00216C00267C00668main RP:RP06708C00002C00668trans PA朋:rn00010 Pathwny Glycolysi5,GluconcogeneaiB PATR: n00052GalacCose正et(?boli瓤 and PA!H:rn00500S七arch 8UCrOSemeCabollsm 印zym 2(7(1(i 2(7(1(2】 KO:K00844 Orthology hexokinase【EC:2(7(1(12(7(1(2】 KO:K00845 glucoklnase【虻:2(7(i(2】 LinkDBl-(型2巴:J 图2-1酶一反应相关联 ionasSOCiations l!nzyme-reaet Fig(2-1 互连网上有大量的生物化学信息数据库可用，如Swiss(Prot 用的信息，可以作为核查生物化学信息的一个标准。 2(2(2基因组注释信息此外，为了得到高质量的网络，需要仔细校对涉及的所有组分，可以借助一些包含基因组信息的数据库完成这一过程，常用的基因组数据库见表2(1。 8 第二章色氨酸合成代谢网络的构建表2-1(--f用的基因组数据库 Tab(2-IPubl avai1able databases icly genome 2(2(3其它信息完整的代谢网络的重建还需要考虑以下因素:首先，需要考虑到生物体的生存需求。一般情况下，代谢网络应该能够完成那些功能，比如合成生物体在某一生存条件下必需的所有成分。在某些情况下，如果不能通过实验得到某生物体在某一生存条件下必需的所有成分，那么可以使用与之相近的一个生物体来代替。其次，重建的网络应能够产生实验上观察到的生理现象，因此获取生理学信息以确定之是非常重要的。另外，生理学的数据反应了网络的功能，是代谢网络拓扑结构分析的一个基础。 2(3代谢网络的构建 2(3(1代谢网络的构建方法代谢网络的构建是一个复杂反复的过程。一般来说，细胞包括三类主要的高分子代谢物蛋白、核酸、多糖和几类小分子代谢物如氨基酸、脂肪酸、核苷、糖、无机离子等。首先，需要获取重建目标物种代谢网络中的所有基因(酶以及酶-反应的列表。随后，需仔细核查建立一个包含参与细胞新陈代谢的所有代谢组分及其代谢反应的列表。其中，酶在连接基因和相应的代谢反应中起到关键作用，由于确定酶的EC号是唯一的，所以它被广泛运用于代谢网络的重建中。一般说来，通过基因组数据重建针对特定物种的代谢网络，是对代谢网络进行结构和功能分析的基础，基于某一物种的基因组注释信息，结合相关的酶反应数据库如代谢反应。其主要步骤概述如下130J: 1、识别基因组序列中的所有开放阅读框 0I? ; 2、通过序列相似性比对，预测该物种的所有酶(基因的列表; bank nomenclature data 3、查询酶命名数据库 Enzyme database ，如Enzyme number ; http:,,expasy(hcuge(oh, ，将酶对应上相应的编号 EC LIGAND 4、查询酶与反应关系的数据库，如KEGG 的代谢反应。 9 江南大学硕士学位论文表2-2(-j-用的酶和代谢途径数据库 Tab(2-2Publ avai databases lable and icly enzymepathway 类别数据库站点酶 Brenda http:,,(brenda(uni(koeln(de, KEGG http:,,(kegg(corn, IntEnz http:,,(ebi(ae(uk,intenz, 代谢反应 BioCyc http:,,(bioeyc(org, BioSilico or http:,,biosilico(org http:,,biosilico(kaist(ac(kr E御 http:,,(empproject(corn, KEGG http:,,(genome(jp,kegg, MetaCyc http:,,metacyc(ors, ?吸AD http:,,capb(dbi(udel(edu,whisler Phylosopher PIMA2 WIT http:,,wit(mcs(anl(gov,WIT2, 重建工具 MetaFiuxNet http:,,mbel(kaist(ac(kr,mfn ,匝AM吐 http:,,mbel(kaist(ac(kr,mfaml Pathfinder P-蜩’IKA http:,,(patika(org, 上述方法同样适用于重建新测序物种的代谢网络，在因特网上也存在着一些专门的代谢反应数据库，如KEGG http:,,(genome(jp,kegg, ，BioCyc 等针对特定生物的数据库，这些数据库包含了与代谢网络中的酶及其在不同物种中的编码基因相关的信息，可以用于方便地检索某一生物中有哪些代谢反应，这大大加快了网在酶数据库中检索2(7(1(2，所得信息如图2(3所示: I_IGANDcontainsour onthe KEGG knowledgeuniverseofchemicalsubstancesandreactionsthat relevant are tolife(Itisacompositedatabase of consmting RPAIR。andENZYbIEdatabases(whoseentriesareiden石 fied EC byC(D， 8(R?RP(andnumbers。 isderivedfromthe Nomendature(buttheothersare respectively(ENZYME IUBMB,IUPACEnzyme andmaintained( internallydeveloped 1 Databa诣 Identifier content ! eSpn臼Yedapoilizendt Cnumber ChemicaIcompoundstructuresKEGGCOMPOUND l COMPOUND D structures KEGG I DRUG number‘Drug DRUG sO-uctures KEGG 云numbe„r:Glycan GLYCAN RnumberBiochemicaIreactions I G州。(LYCANREAC-兀ON Rp numberReactantpairalignmentsKEG6REACTlON EC l 蒜嚣r number，Enzymenomenclature @bfindmodeObgetmode 图2-2KEGG数据库中LIGAND数据库 LIGANDinKEGGDatabase Fig(2-2 10 第二章色氨酸合成代谢网络的构建，Entry BC2(7(1(2 Enzyme Wa??e glucoklru?se; glucoklnase‘pho皇phot，1atlng' C1a?? Transfezases; Trsnsfezrlugphosphorus― containlnggroups; alcohol with-Ln Phosphotransferasesgzollp-，Iccep七or 啦R盯EH-_trbd Sy，na_” 6-phosphotransferase ATP:D-glucose Reacti?‘Iu日HB 6--phosphat(-e【麟:R00299] ATP+D--glucose ADP+D--glucose R00299 R01600R01786 ]RbaQtion‘KB? 、璺兰篁21J gIII’?t?a1Ee ATP【CPD:C00002】; D-glucose[CPD:C00031】 Prodnct ADP[CPD:C00008】; D’。glucose 6‘’phosphate[CPD:C00092] ‘;口???t，n乞 A oi"enzymes士otmdin group aze for highlyspecl。ficglucose( PIt|呐-Iy PATH:ec00010 G1ycoly5i5,Gluconeogenests PAT丑:ec00051FzuctOSeand皿匹nno， emetab01i矗t PA士H:ec00052Ga工act05e雎tab01ijm PATH:ec00500S七archand5ncz05e丑 eta(b01i砸 PATH:ec08>0521 StrePtomyclnb10synths5is PATH:ec00530 z-e七ab01i5皿 Am,nosugar5 OrthologyKO:K00844hexokina毒e KO:K00845 91ucokin邑Je a???e? C地:I H0276C _匠R:_?NB帛D日j】。T31533 r帆r?棚?-p^’1口，^口图2―3酶2(7(1(2的信息 InformationforEC2(7(1(2 Fig(2-3 该信息列出了该酶所催化的代谢反应 Reaction部分以及其在不同物种中的编码基因 Genes部分。通过这种方式，我们就可以获取基因(酶以及酶(反应的列表。而对于新近测序的或者数据库中暂无的物种，只需先从其基因组注释信息出发，通过序列的相似性比对即可预测该物种的所有酶。值得注意的是，这些数据库通常无法方便地得到一个包含特定生物代谢网络中所有已知反应的反应列表，因而限制了对代谢网络做进二步的数学分析。天津大学的马红武等【38】在KEGG代谢反应数据库的基础上进行修正补充后得到一个新的数据库，包含了所有已完成测序的生物的代谢网络的反应列表目前大约含150种生物，并可利用程序自动更新以包含新的测序生物和新的基因组注释信息。另外，还增加了代谢物连接的相关信息以直接将代谢网络用有向图来表示，为网络的可视化和结构分析奠定了基础。 2(3(2代谢网络数据的精炼尽管代谢网络的重建已经整合了大量的数据信息，但由于下列原因仍然不可避免地会有缺漏的信息【38】。 1、并非所有的代谢反应都是酶促反应，例如下列反应:L― Glutamate 大部分的酶数据库只包含酶催化的主要反应，为了提高网络的精度，这种非酶促反应也应该被加入到代谢网络中。 2、基因(酶(反应之间的对应关系并不是简单的一一对应，一个酶可能催化不同的反应，反之，一个反应也可能由不同的酶催化。例如，脂肪酸合成酶 EC2(3(1(85 催化的脂肪酸合成途径中大约30个反应。另外，如前所述，一般用EC号来连接基因和代谢反应，但是只有化学上良好刻化的酶才会被分配一个确定的EC号，许多酶的EC号并江南大学硕士学位论文包含有这种酶。因此有必要做出一定的核查以更正基因和反应之间的对应关系。 3、数据库本身也不是完全正确的。据库，它包含了超过7000个酶促反应，可以用于作为重建代谢网络的主要数据库。此的所有反应，并根据一定的生理学规则在他们的数据库口s】中加入了反应的可逆性信息，用于精炼网络。最后，为了减少由上述问题引起的信息的缺漏，还需不断加入相关的实验信息或者通过查阅相关的文献来进一步提高网络的可靠性。图2_4描绘了整合注释的基因组序列、代谢与酶数据库、实验确定的生化和生理学信息以及相关文献进而重建代谢网络的完整过程。 p、一，一攀谴。7 2(3(3代谢网络图的建立确定了所研究物种的所有代谢反应后，就可以根据研究问题的需要，将代谢网络表示成不同类型的图。围是图论研究的对象，它表示元素与元素之间的二元关系，其中元素表示为图的顶点，元素之间的关系表示为顶点之间的连线按照图中顶点的不同含义，代谢网络可表示为以下4种类型的图: 第一种，代谢物图;每个顶点对应一种代谢物，若代谢物A能通过反应生成代谢物 B，则在这两个代谢物对应的顶点连线。第二种，反应图;每个顶点对应一个反应。若反应A的一个产物是反应B的一个底物，则在这两个反应对应的顶点连线。第三种，酶图:每个顶点对应一个酶，若酶A的一个产物是酶B的一个底物，则在这两个反应对应的顶点连线。第四种，代谢物一反应二分图:二分图的顶点有两类，仅在不同类的顶点间有连线而同类的顶点间无连线。代谢物一反应二分图的一类顶点对应代谢物，另一类顶点对应反应，在反应与它的底物及产物间连线。第二章色氮酸台威代谢网络的构建另一方面，按照图中的边是否有方向，可以把图分为有向图和无向图，有向图中的边称为弧。因为生化反应是有方向的，即有一些反应是不可逆的，在大多数情况下，代谢网络被表示为有向图。然而，在研究代谢网络的某些结构特征时，可以忽略反应的方向而将网络表示为无向图。 2(4色氨酸合成网络构建的实现和表示因为色氨酸合成理论在众多数据库中以及生物学的教材实验以及各大生物学实验数据库中有详细的讲解和批注，故代谢网络的建模理论依据充足，适合于极端路径的分析。具体构建网络步骤如下: 1( 图2-5所示，随后找到大肠杆菌有机物图2(6 。 KEGG―TabI?ofC口nt(n杠 „5 一^H„„tFTEs„D一 5”而k6G ’fH 1目E目 „?r口’ „„ m „?Y 撩,躲’黧麓i赫篇焉:絮。(;墓慧箍器器器器、四一吓需篇‟一„„„。;鬻巍景„。。图2-5KEGG微据库界面 Databaseinterface Fig(2-5【BGG Tna【ass0Era0Eeudonana 一 IEjmen自„? K( ‘札o”R?eq 一而赢蕊12"。3司1655竺毡趱1997嘉矗;;;;磊丽西丽雨――――一―― ij丽。而 Eschehchia??K12o|ti0B ecd2008 1P,eBeq Bmemhm??0157EUL933 ece2001，Rf4Seq CEHECJ 图2-6KEGG有机物莽面中的史腈杆茵 2-6E(c01iinKE6G interface Fig Organi$ms Maps ，找到氨基酸代谢中的色氨酸合成网络图并打开图2??7 ，在色氨酸合成网络图图2―8 中，绿色方框表示参与色氨酸合成反应的酶，故我们只需要考虑相关的由绿色方框酶参与的反应。提取出所有相关酶的反应信息，构成表 2-3。江南大学硕士学位论文 0110 K陆EscherichiacoliK一12MGl655 00251GIutamatemetaboKsm Gen日 00252Alanineand mebbolism aspartate andthreoninemetabobsm 00260GNdne，serlNe e? Oroanlsm 00271Methioninemetabolism Cvsteinemetabolism Ham E(cali(EC01-I，511145 00272 andisoleuone FullMilleEscherichiacoilK一12MGl655 00280Valine(Ieuone degradKdOn Valine(Ieudneandisoleucine 00290 biosyr坩hesJs EscherichiacoliK??12MGl655 DeflnJtJon 00300 Lysinebiosynthesis 如notatlonmanuaI 00310 LysinedegradaUon 00330Jnineand metaboKsm TaxonomyTAX:51114S Aro proline 00340Histidinemetabolism LineageBacteria;Proteobacteria;Gammal翻n Escher记hia 00350 mel: abolism Tyrosine DatasourceRefSecl DIB OriginalWisconsin，Pasteur,RegulonDB，Eco ChromosomeC打cular a b b (大肠杆茵路径图列表图2-7 a (大肠杆菌信息介绍界面; i ofE(Coli( ofE(col maps Fig(2―7 a (Interfaceinfo; b (Pathway 图2-8大肠杆菌路径图中的色氨酸合成 i is in ofE(coi Fig(2-8TryptophanbiosynthesPathwaymaps 3(由于大部分氨基酸合成实验都是以葡萄糖为起点，先进行糖酵解随后接着进行以及戊糖磷酸途径 Pentose Pathway 之后的基础上完成的，故须将另外两 Phosphate 14 第二章色氨酸合成代谢网络的构建途径中的相关反应加入到最终的色氨酸合成网络中。通过糖酵解途径图2-9 与戊糖图2-9大肠杆茵路径图中的糖酵解途径 S in ofE(coil maps

                    本文档为【色氨酸合成代谢网络的构建与研究（可编辑）】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

色氨酸合成代谢网络的构建与研究（可编辑）

你可能还喜欢