首页 蛋白质-蛋白质相互作用数据库的研究进展

蛋白质-蛋白质相互作用数据库的研究进展

蛋白质-蛋白质相互作用数据库的研究进展垦匪选篮堂盘查!Q塑生!!旦!!旦箜!!鲞箜!塑!!!』鱼!型坠塑：!!：!Q塑：!!!：丝：盟!：! 蛋白质．蛋白质相互作用数据库的研究进展李静傅松滨【摘要】随着人类蛋白质组学的飞速发展，出现了大量的蛋白质相互作用及其网络数据，因此寻找和预测蛋白质相互作用的生物信息学方法成了研究蛋白质互作必不可少的_T具之一，本文主要从生物信息学角度对蛋白质相互作用数据库做一下简单的介绍，包括各数据库的来源、主要功能、应用范围、目前的发展状况及将来的发展方向等方面。【关键词】蛋白质相互作用；蛋白质...

垦匪选篮堂盘查!Q塑生!!旦!!旦箜!!鲞箜!塑!!!』鱼!型坠塑：!!：!Q塑：!!!：丝：盟!：! 蛋白质．蛋白质相互作用数据库的研究进展李静傅松滨【摘要】随着人类蛋白质组学的飞速发展，出现了大量的蛋白质相互作用及其网络数据，因此寻找和预测蛋白质相互作用的生物信息学方法成了研究蛋白质互作必不可少的_T具之一，本文主要从生物信息学角度对蛋白质相互作用数据库做一下简单的介绍，包括各数据库的来源、主要功能、应用范围、目前的发展状况及将来的发展方向等方面。【关键词】蛋白质相互作用；蛋白质相瓦作用网络；蛋白质相互作用数据库；生物信息学预测 TheResearchProgressinProtein-ProteinInteractionsDatabaseUJing‘．FUso唱一bin．(‘Laboratory ofMedicalGenetics，HarbinMedicalUniversity，Harbin15008I，China) Correspondingauthor：FUSong—bin．E—mail：舢6@em$．hrbmu．edu．cn 【Abstract】Withtherapiddevelopmentofproteomics，moreandmoreprotein—proteininteractionand networkdatahavebeenreported．Identifyingandpredictingprotein—proteininteractionbybioinformaticsbecome oneofnecessarytoolsforproteinresearch．Wewillreviewanddiscussprotein-proteininteractiondatabasesre- latedtobioinformatics，includingitsresources，majorfunctions，application，currentdevelopmentandfuture trend． IKeywords】Protein·proteininteractions；Protein—proteininteractionnetwork；Databasesofprotein- proteininteractions；Bioinformaticspredict 蛋白质是生命功能的执行者，也是生命现象的直接体现者，对蛋白质结构和功能的研究将直接阐明生命在生理或病理情况下的变化机制，而蛋白质功能的实现离不开蛋白质与蛋白质或蛋白质与其他生物大分子之间的相互作用。蛋白质的相互作用以细胞结构，生化活性和能动行为为基础，反过来，遗传的相互作用影响着广大蛋白网络功能的联合⋯。研究蛋白质相互作用的网络是理解细胞网络结构及功能，继而理解生命新陈代谢以及疾病发生的基础和关键；与此同时，在蛋白质组研究领域，利用高通量的实验方法来鉴定和分类蛋白质、细胞内的蛋白区域和蛋白质的相互作用，产生了很多的生物信息记录，这就需要有一些标准且特异的数据库来描述和储存这些相互作用的信息，其结果导致了大量的蛋白质相互作用数据库的发展“。。通过蛋白质一蛋白质相互作用(protein-protein DOI：lO．3760／cma．i．issn．1673-4386．200906．003 基金项目：国家自然科学摹金(30771198，30800268， 30801350)；黑龙江省自然科学基金重点项日(7JY0702) 作者单位：150081，哈尔滨医科大学医学遗传学研究窄(李静、傅松滨)；150081哈尔滨，黑龙江省生物良药-r群重点实验室(傅松滨) 通信作者：傅松滨(E．mail：fusb@ems，hrbmu．edu．rn) ·综述· interaction，PPI)的数据库，我们可以构建一个蛋白质相互作用的网络图谱，从基因功能注解、网络对比、文献挖掘角度进一步分析各个蛋白质的定位、功能和相瓦作用的关系。一些基于数据库预测蛋白质相互作用的方法将为实验技术提供有利的依据，同时实验技术义可以为数据库提供充分的数据资源和结果验证，两者对于研究蛋白质相互作用起了至关重要的作用。日前，蛋白质相互作用数据库已经在蛋白质组的研究中做H；了突出的贡献。 l 蛋白质相互作用数据库蛋白质一蛋白质相互作用数据库已经成为研究细胞内乍物学通路和网络的主要资源，是系统理解细胞生命机制的莺要工具"。“。目前大量公共储存蛋}，{质相互作用的数据库都是可用的，每一个数据库都有其f{身的性质，如包括大量多样的数据类型和不同程度的注解。蛋白质相互作用数据资源的来源主要有两个：一个是文献中实验所支持的相互作用，另一个是通过各个数据资源进行网络预测。由于蛋白质相互作用潜在庞大的数目和高通量实验鉴定的不确定性，预测的数据相比实验覆盖率仍然很低，在一定程度上还存在假阳性。下面，将简单介绍一下各蛋白质相互作用数据库的一些特征。万方数据国隧逮佳堂塞圭兰Q螋生12旦!§旦筮丝鲞筮垒塑丛』壁!盟旦堡：!i：!Q螋：!!!：丝：盟!：垒 1．1 String数据库：String是检索基因与蛋白质相互作用的数据库，它集合了大量的信息资源，主要用于储存实验鉴定的PPI数据、计算预测的数据和收集公共的文本等，目前可以预测从原核细胞到其他各种真核生物的直接和间接的相互作用012,13]。在 String数据库中输入全序列基因组，可以搜索到4种类型的基因上下文联合(genomiccontextfusion)：其中包括①保守基因组领域；②基因融合事件；③基因共同发生事件；④基因组的交叉和共表达。这4种选择均是在基因发展进化过程中普通选择压力情况下出现的功能上的联合。同时String数据库针对这些预测的联合都有一个指定的置信度得分来评价它的可信度。String主要选择KEGG(kyotoencyclope— diaofgenesandgenomes)路径作为标准来维系蛋白质的功能团，对于两个蛋白质联合的预测都被指定相同的KEGG通路。在生物体之间String数据库有两个策略来转移已知和预测未知的相互作用，一个是直系同源基因簇(clustersofo／'thologousgroup， COG)模式，依赖于COG数据库提供全或无的正向同源分配和传输相互作用；另一个是蛋白模式，使用定量的序列相似性搜索，可以在目标生物体几个蛋白对之间的网络分布给定蛋白质相互作用的信息，两者均可显示蛋白质的区域、序列和结构模式图，同时还可以链接到其他不同的蛋白数据库，使用者可以根据自己的需要选择合适的策略。最近．String 又开发了两个资源：一个是文本采集；一个是不同生物体相互作用的转移。它们剖析了大量的科学文献文本，包括预测的和确定的相互作用，以更好地研究蛋白质问的相互作用。同时，String所推断的蛋白质相互作用的网络图谱，可以链接到蛋白质的定位、功能等方面，使分析目标蛋白的生物过程变得更容易。String从2000年开始发行，一直在不断地更新，截止至2009年1月已经涵盖了大约630种生物体的250万个蛋白，为寻找和预测蛋白质一蛋白质的相互作用提供了广泛的资源，对研究蛋白互作有着重大的意义‘14|。 1．2 BIND数据库：BIND数据库(biomolecularin- teractionnetworkdatabase，BIND)现在更名为BOND 数据库(biomolecularobjectnetworkdatabank， BOND)。于1999年建立，是一个在线开放的数据库工具。BIND定义了3种主要的数据类型：相互作用、分子复合物和通路【I5I。相互作用的描述包括观察相互作用的实验条件、保守序列、分子定位、化学行为、力学、热力学和化学性质等。互作记录以两个物体的相互作用为基础，这个物体可以是一个蛋白、 DNA、RNA、配体，分子复合物甚至到原子。BIND使用ASN．1(abstractsylltaxnotation．1)、XML(extensi- blemarkuplanguage)、Java等数据特异性语言来管理数据库¨6|，整合了GO(geneontology)的注释信息，并继承了NCBI(nationalcenterforbiotechnology information)数据模型来描述序列、三维结构和出版的文献信息，为BIND的数据特异性提供了稳定的基础。BIND的搜寻结果可以直接在BIND的网页以CystoscapesIF【171的形式存储在硬盘上，使用者可以把存储结果上传到Cytoscape上显示相互作用的网络，可以聚焦在数据集的所有方面，包括：文献信息，分子结构，基因信息(功能、ID、序列、分类)等，可能得到数百或数千的相互作用结构。BIND数据库来源主要包括一些出版的期刊杂志、文献、高通量的实验以及其他PPI数据库，同时还包括一些预出版的文章¨引。目前BIND发展了一些新方法去扩大基因和蛋白质注释的图像，使研究分子间相互作用的网络变得更加容易，同时它的数据增长速率非常快。据预测，在不久的将来会超过100000条记录，而且将会建立一个新的BIND询问和投递的界面，提供关于分子机制的细节信息，例如，化学制品、酶促反应等，均在BIND中被编码。BIND的长远目标是在可计算数据的情况下，在每个主要的模型有机体中取得一套完整而充分的相互作用和反应记录，以作为细胞模拟实验的原料。 1。3 DIP数据库：DIP数据库(tlledatabaseofinter- actingproteins，DIP)于1999年发行，主要是储存经过实验确定的蛋白质-蛋白质相互作用的数据库，具体是指相互结合和作用的氨基酸序列，包括两个蛋白之间和复合物的相互作用；同时研究一些特殊的互作蛋白，探索它们的信号调节和转导途径；还可以从整个细胞水平上来研究蛋白质相互作用网络的整体性和复杂性。此数据库通过生物学过程中浏览和有效抽提蛋白质之间的相互作用和互作网络提供着科学的交流，主要用于理解蛋白质的功能，蛋白质．蛋白质相互作用的关系．研究蛋白质相互作用网络的特性和进化，标准化预测蛋白的相互作用等。 DIP主要由3个表组成：①蛋白信息表：除了包含文献和4个主要序列数据库(SWISS．PROT、PIR、Gen— Bank和ProteinDataBank)的蛋白鉴定编码外，还包括每个蛋白质的基因名称、描述、酶编码和细胞定位；②蛋白互作表：通过之前的蛋白信息表描述蛋白质的相互作用，氨基酸范围和蛋白互作所涉及的蛋白区域；③描述探测蛋白质．蛋白质相互作用的实验细节表：用来检测相关文献的相互作用，包括MED— 万方数据旦隧追佳堂盘查!塑!生!!旦!!旦箜!!鲞箜!塑!!!』堡!!!!Q塑!!：!Q塑：!型：!!．：№：! LINE(nationallibraryofmedicine，MD。USA¨引)标准文章编码(PMID／UID)、作者、文章、杂志和文章出版年份。DIP中有超过20种的实验技术，包括免疫共沉淀、酵母双杂交等，同时可以搜索到目标蛋白所属的生物体、蛋白家族、关键词、实验技术、文献索引等方面，并应用了一个开放的资源PostgreSQL数据库管理系统(http：／／www．postgresql．org)，该系统能有效控制多种类型的数据，进行快速分类和分析。 DIP数据来源主要是不同的科学杂志，例姐。MED— LINE和一些其他的蛋白数据库。来源于实验和预测的高通量的蛋白质相互作用还可以通过DIP中的其他服务来评估，如PVM(paralogousverification method)、EPR(expressionprofilereliability)和DPV (domainpairverification)。PVM验证共生同源的相互作用；EPR验证共同表达相互作用的比较对照； DPV通过区域间的作用参数进行验证。目前，DIP 是研究蛋白质相互作用的主要数据库之一。 1．4 BioGRID数据库：BioGRID数据库(biology generalrepositoryforinteractiondatasets，BioGRID)是一个可以免费使用的生理学和遗传学相互作用的蛋白质数据库，主要包括蛋白质的翻译后修饰和基因互作的特异性表型。每一个相互作用记录都包括实验证据编码，可以链接到支持的出版期刊。Bio— GRID中的相互作用联合Osprey软件显像系统，使用者可以通过固定的模式来询问网络的构成。搜索范围包括基因名称，开放读码框名称，PubMedID和自由正文，注解特征包括基因／蛋白功能，GO生物过程，分子功能和细胞组成术语瑚]。BioGRID的数据下载系统主要用JavaScript和XML数据传输模式操纵管理口¨。数据库来源包括出版发行的高通量相互作用数据库，文献中的焦点研究等‘22J。Bio— GRID每个月都根据酵母基因组数据库(SGD)，Fly- base和EnterzGene，NCBI等数据库进行更新。截止到2009年7月1日，BioGRID已经包含6个不同种系的166002个相百．作用数据记录‘23j，涵盖了13个模型生物体种类饼J，包括酿酒酵母、裂殖酵母、秀丽隐杆线虫、果蝇、小鼠和人类等，同时还增加了大量新的特性，包括改进使用界面来显示不同分布的相互作用，镜像位点和专用的互作管理系统调整不同交叉的定位。目前，BioGRID仍在不断地发展中，它将以记录标签结构的BioGRID图表为基础，通过使用界面的精炼_T．具和显示特征，更好的控制数据图像和下载数据，数据库视图将基于Osprey、Cytoseape 和EdinburghPathwayEditor，同时允许更复杂的网络询问和搜索。为使这个开放资源软件工具传播更广，BioGRID将会竭力与GMOD(geneticmodelor． ganismdatabase)方案兼容，以便更好的为蛋白质．蛋白质相互作用服务。 1．5 MINT数据库：MINT数据库(molecularinterac— liondatabase，MINT)竭力收集一些具有代表性的文献中可用的蛋白质相互作用，极大地增加了数据信息的可靠性ⅢJ。它不仅包括蛋白质的相互作用，还包括一些非蛋白个体，如启动子区域和mRNA转录子的相互作用。蛋白互作信息的形式包括二元和多元的，均是基序特异的。。对于每一个相互作用都有 _个基于实验和文献的置信度得分，同时通过Swis- sProt数据库进行注解。MINT的一个重要特性就在于它把人类的PPl分开评注，称为HomoMINT，包括从其他有机体到人类同源性文献衍生的数据信息。 MINT系统目前主要聚焦在蛋白质的生理相互作用方面，遗传或是计算机预测的相互作用不在其中。 MINT在发展过程中，经历了扩展的修正，在数据模型和数据结构方面深度改造，并且增加了大量储存的相互作用信息，新的MINT以完全改造的数据库结构为基础，提供有效的数据开发和分析，对于每个个体都有很详细的注解，可以通过网络为基础的界面免费在线搜索相互作用关系和数据模式。在 2006年MINT采用了IntAct关系模型，IntAct是一个开放的资源数据库，用于储存、成像和分析分子的相互作用。采用IntAct模型的主要优点是能够将蛋白复合物和其他类型分子作为相互作用的参与者进行分析。MINT主要基于开放的网络资源Post— greSQL数据管理系统，数据库来源于FEBSLetters (sinceJanuary2005)、EMBOJournal和EMBORe— ports(sinceJanuary2006)，同时与其他IMEx(inter- nationalmolecular—interactionexchangeconsortiumht— tp：／／imexsourceforge．net／)m1达成协议，包括DiP、 IntAct、Mpact和BIND，避免工作的重叠。MINT中新数据主要以HTMI。的形式进行投递，有利于自动审核；网络服务直接允许flat—file、PSll．0．XML、 PSl2．5-XML等不同形式的检索。截止到2009年7 月有超过30个有机体模型的1l 1 398个相互作用，其中有29334个蛋白相互作用储存在MINT一7‘中。 1．6 HPRD数据库：HPRI)数据库(humanprotein referencedatabase，HPRD)是来源于实验信息的人类蛋白质组数据库，包括蛋白质-蛋白质相互作用，翻译后修饰，组织表达，同时还包括蛋白、核酸与小分子的相互作用。实验类型主要包括三方面：细胞内、细胞外和酵母双杂交。HPRD的评注程序通过Bio— Builder编辑和管理网络浏览器工具进入蛋白质数万方数据国隧遗笾堂盘查2塑生12旦!§旦筮丝鲞筮!塑!型』鱼鲤堕：!!：!堂：!尘：≥!：盟!：鱼据。I-IPRD创建于2003年，在目前最新的版本中增加了磷酸基序探测器(PhosphoMotifFinder)，包含来源于文献的实验特性磷酸化底物和结合基序，允许用户在超过320个实验中寻找鉴定感兴趣蛋白的磷酸基序汹]。这个新的特征是一个蛋白分布注解系统一Hu眦nProteinpedia(http：／／www．humanprotein- pedia．ors／)，通过这个网站，实验室可以根据它们的数据在HPRD中绘制完整的蛋白质表达图谱，而且，HPRD还通过NetPath(http：／／www．netpath． ors／)链接到人类信号通路摘要。NetPath包含蛋白质相互作用信息，催化反应，蛋白质转位等方面，共 2732个相互作用，其中1793个蛋白包含在癌症和免疫信号通路的注解中。通过最近的更新，HPRD 增加了5500个新蛋白质的序列，使之对人类蛋白质组研究的资源更加广泛。截止到2009年7月，在 HPRD数据库中有27081个蛋白的38806个相互作用o29】。 1．7 IntAct数据库：IntAct包括简略的蛋白质相互作用描述、实验方法、人类和其他种系的文献引文，主要使用PSJ—MICV州1(proteomicsstandardsinitia— tive—molecularinteractionscontrolledvocabulary)描述连贯的相互作用数据。IntAct和之前介绍的MINT 是PSI—MI工作组的核心，IntAct通过使用控制的操作码提供了高质量和经过鉴定的文献相互作用数据，减少了技术上的命名错误和相互作用特征的解释。它的蛋白相互作用信息是基序特异性的，分基本搜索和高级搜索，后者在PSI．MI列表中提供额外的询问选项，如实验方法或对照词汇表等。IntAct 有一个Pay．As．You．Go算法，可以通过实验预测最匹配的蛋白质相互作用，把它们按优先次序排列。同时，还增加了一个软件-HierarchView，通过GO分类显示相互作用网络的二维图像和最显著的结点。 IntAct数据来源于文献或是用户投稿分析蛋白相互作用数据的开放资源数据系统。截止到2009年6 月，IntAct包括194558个二元复合物的相互作用， 58155个蛋白，10495个实验，1493个控制词汇条。 2补充的相互作用数据库生物信息学发展到现在，已经对蛋白质相互作用进行了深人细致的研究，包括预测蛋白质相互作用的方法、高通量蛋白质相互作用数据库的建立、预测蛋白质相互作用的软件和网络服务的开发等。为了满足广大使用者对整个基肉组蛋白质相互作用网络分析的需求，越来越多的蛋白质相互作用数据库不断应运而生，在其基础上还广泛开展了蛋白质相互作用网络、蛋白质功能的预测、新药研发等相关研究。研究蛋白质相互作用的方法很多，决定蛋白质相互作用的因素也多种多样，以下列出了一些附加数据库的简要信息，主要基于不同的实验方法、文献和不同的研究目的，研究者可以根据自己的需要选择适合的数据库。 2．1补充的蛋白质相互作用数据库 2．1．1DAVID数据库DAVID数据库(thedata· baseforannotation，visualizationandIntegrateddis· covery，DAVID)网址：http：／／david．abcc．ncifcrf． gov／，通过给定的基因列表可以发现功能相关基因组，基因通路图谱，相互作用蛋白列表，重要蛋白功能区域等。建立机构：美国国立卫生研究所[nation· alinstituteofallergyandinfectiousdiseases(NIAID)， NIH．] 2．1．2IUPHAR数据库IUPHAR数据库(interna- tionalunionofbasicandclinicalpharmacology，IU- PHAR)网址：http：／／www．iuphar—db．org／index．jsp， G蛋白偶联受体数据库和电压门控通道与受体门控通道的数据库。建立机构：国际科学理事会[inter- nationalcouncilforscience(ICSU)．] 2．1．3Smart数据库网址：http：／／smart．embl—hei— delberg．de／，基于630个种系的全序列基因组的相互作用网络，目前可用的蛋白超过200万，而且易于分析区域的相互作用。建立机构：由欧盟授权号 213037支持(grantnumber213037fromtheEuropean Union．) 2．1．4UniHI数据库UniHI数据库(unifiedhu． maninteractomedatabase。UniHI)网址：http：／／theo． derich．fb3．mdc—berlin．de：8080／unihi／des，提供了丰富的人的PPI，分别以酵母双杂交实验技术、文献、正向同源为基础的相互作用，从14个主要的 PPI资源中收集了22300个蛋白质，253980个相互作用。建立机构：德国柏林理论生物研究所慈善医疗部(Germanyinstitutefortheoreticalbiologycharite— medicaldevisionHunbold—UniversityZUBerlin．) 2．1．5KDBI数据库KDBI数据库(kineticdataof bio—molecularinteractiondatabase，KDBI)网址：ht． tp：／／bioinf．xmu．edu．cn／databases／kdbi／kdbi．php，生物分子相互作用的动态数据，收集来源于实验的蛋白与蛋白，蛋白与RNA，蛋白与DNA，蛋白与配体，RNA与配体，DNA与配体之间的相互作用或是文献中的反应事件。建立机构：厦门大学第二生物学区。 2．1．6PIMRider数据库网址：http：／／pimr．hybri．万方数据旦隧运笾堂苤盘!Q塑生!!旦!i旦筮丝鲞筮!塑!!!』曼!!盟望塑：!i：!Q塑：!!!：!!：丛!：! genics．corn／pimriderext／common／。蛋白质组软件平台，以相互作用图谱为基础，致力于开发蛋白通路，显示其生物学功能。建立机构：法国巴黎遗传学总部(hybrigenics’headquartersandfacilities。Paris— France．) 2．1．7PawsonLab数据库网址：http：／／pawson— lab．mshri．on．ca／index．php，一个实验室的名称，主要研究分子切割，蛋白相互作用的功能、意义、信号转导等。建立机构：Pawson实验室(thePawson lab．) 2．1．8VisANT数据库网址：http：／／visant．bu． edu／，过去的Predictome，基于文献中的实验和不同数据库链接，预测基冈和蛋白相互作用的数据库。建立机构：美国国立卫生研究所(Nationalinstitutes ofhealth．) 2．1．9HPID数据库HPID数据库(humanprotein interactiondatabase，HPID)网址：http：／／wilab．inha． ae．kr／hpid／，通过实验的数据以及不同的数据库链接提供人类蛋白相互作用的信息，可以在线预测。建立机构：韩国f■和大学生物计算实验室，网络智能实验室，计算机科学与信息工程部(Biocomputing lab．webintelligencelab，departmentofcomputersci— enceandinformationengineefinglnhauniversity，Ko· tea．) 2．I．10POINT数据库网址：http：／／point．bioin· formatics．tw／intro／intro．jsp，从各种数据库中收集整理相互作用的蛋白，提供蛋白互作的过滤和网络拓扑结构分析，进而预测蛋白的相互作用。 2．2补充的通路：随着人类基因组计划的完成，高通量的实验拓宽了基因组信息的意义，不仅包括转录组和蛋白质组，还包括代谢组和其他基因组编码的信息。对于代谢组的研究主要基于通路的研究。在细胞水平，生命是一个分子相互作用的网络，分子被合成、降解、转运、与其他分子形成复合物、经历暂时的或永久的修饰。然而，这些复杂的过程町以被分解成简单不同的通路，通过对计算机化的通路研究，有助于我们理解细胞的生命过程和机体行为水平的功能，并且在医疗，制药和环境科学等方面具有重要的实践功能。以下列}{{了两个关于通路研究的数据库，在信号转导、细胞过程和人类疾病等方面具有指导意义。 2．2．1 KEGG数据库KEGG数据库(kyotoency— clopediaofgenesandgenomes，KEGG)网址：http：／／ m哪．genome．jp／kegg／pathway．html，以文献为基础，表示分子相互作用和反应的网络通路数据，包括比较全面的代谢通路图谱。建立机构：京都大学和东京大学人类基因组中心生物信息学实验室(Kanehi— salaboratoriesinthebioinformaticscenterofKyotoU— niversityandthehumangenomecenteroftheuniversi— tyofTokyo．) 2．2．2Reactome数据库网址：http：／／www．reac- tome．org／，可以表示人类生物学的许多不同生物过程和反应网络，包括介导的代谢通路，调控通路，信号转导通路等。建立机构：欧洲生物研究所科尔德斯普林哈博尔实验室和基因本体论团体(Cold SPfingHarborlaboratory，theEuropeanbioinformatics institute，andthegeneontologyconsortium．) 2．3 存在的问题：以上介绍了一些蛋白质相互作用的数据库和一些信号通路的信息，这些数据库在蛋白质组学方面为广大研究者提供了丰富的数据资源与信息，但是还存在着一些不足，如大部分预测蛋白质相互作用网络的方法仪仅限于对真实数据网络的粗略估计；尚存在一些置信度比较低的预测；在数据网络的动态性，稳定性及蛋白互作强度的预测方面也存在着缺陷；数据资源不足，虽然各个数据库的资源有交义，但不是十分全面；各个数掘库有其自身数据语言和模式的限制，mi且相应的评估标准还未建立，使这些数据库在应用方面受到了一些制约。蛋白质相互作用是一个十分复杂的现象，要想取得预期的完美效果还有许多困难，相信通过实验技术和各种预测方法的不断发展和完善，会有一些涵盖数据资源范围更广，操作更为方便，更新速度更快的数据库出现，一定会在蛋白质组学，基因组学等方面取得重大的突破，从而为基础研究提供有利的依据。 3展望蛋白质一蛋白质相互作用数据库从建立到现在，经历了从原核生物到真核生物的研究(增加了数据资源和有机体的种类)；从少数基因到整个基因组的研究；从最示已确定的相互作用到预测未知的蛋白互作，再到功能f：的联合；从相互作片j的研究到代谢、信号、转录通路的研究；从软件分析到在线搜寻，从成对的相互作用到相互作用的网络，所依赖的数据库也在不断的增加和完善，而且发展了不同的数据模式和应用程序。应用生物信息学，统计学的计算方法来评估蛋白质与蛋白质的相互作用正处于发展中，这更加完善了预测蛋白互作的方法，增加了蛋白互作信息的可信度。目前可以通过不同的输人形式如蛋白的名称、ID号、氨基酸序列、不同数据库的代码搜索到该蛋白质或是基因的互作信息。由于蛋万方数据旦匪遗篮堂苤壶!Q塑生!!旦!!旦筮丝鲞复垒期!型』堡!堕旦塑：!§。!螋：y生：!兰：堕!：垒白质相互作用网络的功能预测整合了多种不同的数据信息，可以从整体水平上搜索和预测蛋白的功能和相互作用，并且随着越来越多的蛋白质相互作用数据库的出现和现有蛋白质相互作用数据库的不断完善，会使得蛋白质的相互作用、分子结构、功能、基因信息等数据挖掘方面的资源越来越丰富，对蛋白质等生物分子的研究也会随之越来越深入。但是由于蛋白质相互作用的复杂性与多样性和实验技术的局限性，有些蛋白相互作用是瞬时的，不稳定的，以实验为基础的方法很难检测到这种相互作用，而应用生物信息学方法对于此种情况可以进行弥补。因此，综合各个不同的蛋白质数据库，使其整合和互补，以适应不同的数据信息，从而得到准确的蛋白质相互作用的结果，是将来数据库开发和发展的主要方向。相信随着生物信息学的不断发展和完善，蛋白质组学与蛋白质相互作用数据库的共同联合，通过不同的蛋白质研究技术的发展和完善，蛋白质与蛋白质相互作用数据库将会更广泛的应用于生物制药研发、临床用药、疾病病因学研究、疾病防治乃至环境卫生等诸多领域，从而在生命机制的研究领域发挥更大的作用。 [2] [3] [4] [5] [6] [7] [8] [9] 参考文献 JorgensenP，BreitkreutzBJ，BreitkreutzK．eta1．Harvestingthe genome’8bounty：integrativegenomics．ColdSpringHarbSyrup QuantBi01．2003，68：43l·443． MishraGR，SureshM，KumaranK，ela1．Humanproteinrefer- encedatabase-2006update．NucleicAcidsRes，2006，34：41l一 414． SalwinskiL，MillerCS，SmithAJ，eta1．Thedatabaseofinterae— tingproteins：2004update．NucleicAcidsRes，2004，32：449- 451． MewesHW，FrishmanD，MayerKF，eta1．MIPS：analysisand annotationofproteinsfromwholegenomesin2005．NucleicAcids Bes．2006．34：169·172． KerrienS，Alam—FaruqueY，ArandaB．ela1．IntAct—opensource resourceformolecularinteractiondata．NucleicAcidsRes。2007． 35：561-565． Chatr．AryamontriA，CeolA，PalazziLM，eta1．MINT：theMo- le(·ularINTeractiondatabase．NucleicAcidsRes．2007．35：572． 574． BaderS，KuhnerS，GavinAC．Interactionnetworksforsystems biology．FEBSLett．2008。582：1220·1224． DevosD，RussellRB．Amorecomplete，complexedandstruc- turedinteractome．CurrOpinStructBiol，2007，17：370-377． HuZ，MellorJ，WuJ，eta1．Towardszoomablemultidimensional mapsofthecell．NatBiotechn01．2007．25：547-554． ChristensenC，rhakal"J，AlbertR．Systems—levelins／gII嵋into cellularregulation：inferring，analysing，andmodellingintracel一 [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] lularnetworks．IETSystBi01．2007．1：61-77． KohlerS。BauerS，HornD，eta1．Walkingtheinteractomefor prioritizationofcandidatediseasegenes．AmJHumGenet，2008． 82：949-958． vonMetingC．JensenU，KuhnM．eta1．STRING7—∞centde． velopmentsinthebuintegrationandpredictionofproteininterac- fions．NucleicAcidsRes。2007。35：358．362． ShelB．LehmannG，BorkP．eta1．STRING：aweb一瞬rvqgrtom． trieveanddisplaytherepeatedlyoccurringneishbourhoodofa gene．NucleicAcidsRes，2000，28：3442-3444． JermenU，KuhnM，StarkM．eta1．STRING8--aglobalviewOrl proteinsandtheirfunctionalinteractionsin630organisms．Nu- eleicAcidsRes。2009，37：412-416． BaderGD，HogueCW．Analyzingyeastprotein—proteininterac— t／ondataobtainedfromd／frerent∞ur；c∞．NatBiotechn01．2002． 20：991-997． BaderGD．HogueCW．BIN肛一adataspecificationforstoring anddescribingbiomolecularinteractions，molecularcomplexes andpathways．Bioinformatics，2000，16：465-477． ShannonP，Mark／elA，Ozier0．et且1．Cytoacape：asoftwareen- vironmentforintegratedmodelsofbiomolecularinteractionnet— works．GenomeRes．2003．13：2498．2504． AlfanmoC，AndradeCE，AnthonyK，eta1．TheBiomoleeularIn- teracfionNetworkDatabaseandrelatedtools2005update．Nucle— icAcidsRes，2005．33：418-424． MarcotteE，Xenarios【，EisenbergD．MiningliteratureforPp tein—proteininteractions．Bioinformatics，200l，17，l_7 HarrisMA，ClarkJ，IrelandA，eta1．1rheGeneOntology(GO) databaseandinformaticsregoul℃e．NucleicAcidsRes。2004。32： 258-261． BatadaNN，RegulyT，BreitkreutzA，eta1．Stillstratusnotalto- cumulus：furtherevidenceagF,instthedate／partyhubdistinction． PbSBiol，2007。5：e154 RegulyT。BreitkreutzA，BoucherL．eta1．Comprehensiveculx- t／onandanalysisofglobalinteractionnetworksinSaccharomyces eerevisiac．JBioI．2006。5：11． http：／／www．thebiogrid．org／／ViewNews／72 StarkC。BreitkreutzBJ，RegulyT．eta1．BioGRID：ageneralre· positoryforinteractiondatasets．NucleicAcidsRes，2006，34： 535-539． Chatr·aryamontriA，KertieuS，KhadakeJ，eta1．MINTandIn． tActcontributetotheSecondBioCreativechallenge：servingthe text—miningcommunitywithhighqualitymolecularinteractionda- ta．GenomeBiol，2008．9(Suppl2)：s5． IMExCurationManual[http：／／imex．zoureeforge．net／doc／imex· curalionManual．doc] http：／／mint．bin．unironud．it／raint／Welcome．do MathivananlS，Petia．swamyIB，GandhiTK．etai．Anevalua． t／onofhumanprolein-proteininteractiondatainthepublicdo- main．BMCBioinformatics，2006。7：S19． http：／／www．hprd．ors／ KerrienS，OrchardS，Montecehi—PalazziL，eta1．Broadening thehorizon—level2．5oftheHUPO—PSIformatformolecularin． teractions．BMCBiol，200r7，5：44． (收稿日期：2009-01·19) 万方数据蛋白质-蛋白质相互作用数据库的研究进展作者：李静，傅松滨， LI Jing， FU Song-bin 作者单位：李静,LI Jing(哈尔滨医科大学医学遗传学研究室,150081)，傅松滨,FU Song- bin(150081,哈尔滨医科大学医学遗传学研究室;150081,哈尔滨,黑龙江省生物医药工程重点实验室) 刊名：国际遗传学杂志英文刊名： INTERNATIONAL JOURNAL OF GENETICS 年，卷(期)： 2009,32(6) 参考文献(30条) 1.Jorgensen P;Breitkreutz BJ;Breilkreutz K Harvesting the genome's bounty:integrative genomics[期刊论文]-Cold Spring Harbor Symposia on Quantitative Biology 2003 2.Mishra GR;Suresh M;Kumaran K Human protein reference database-2006 update[期刊论文]-Nucleic Acids Research 2006 3.Salwinski L;Miller CS;Smith AJ The database of interacting proteins:2004 update[期刊论文]-Nucleic Acids Research 2004 4.Mewes HW;Frishman D;Mayer KF MIPS;analysis and annotation of proteins from whole genomes in 2005 [期刊论文]-Nucleic Acids Research 2006 5.Kerrien S;Alam-Faruque Y;Aranda B IntAct-open source resource for molecular interaction data[期刊论文]-Nucleic Acids Research 2007 6.Chatr-Aryamontri A;Ceol A;Palazzi LM MINT;the Molecular INTeraction database[期刊论文]-Nucleic Acids Research 2007 7.Bader S;Kuhner S;Gavin AC Interaction networks for systems biology[外文期刊] 2008 8.Oevos D;Russell RB A more complete,complexed and structured interactome[期刊论文]-Current Opinion in Structural Biology 2007 9.Hu Z;Mellor J;Wu J Towards zoomable multidimensional maps of the cell[期刊论文]-Nature Biotechnology 2007 10.Christensen C;Thakar J;Albert R Systems-level insights into cellular regulation:inferring,analysing,and modelling intracellular networks[期刊论文]-IET Syst Biol 2007 11.Kohler S;Bauer S;Horn D Walking the interactome for prioritization of candidate disease genes[外文期刊] 2008 12.von MeringC;Jensen LJ;Kuhn M STRING 7-recent de-velopments in the buintegration and prediction of protein interactions[期刊论文]-Nucleic Acids Research 2007 13.Snel B;Lehmann G;Bork P STRING:a web-server to retrieve and display the repeatedly occurring neighbourhood of a gene[期刊论文]-Nucleic Acids Research 2000 14.Jensen LJ;Kuhn M;Stark M STRING 8-a global view on proteins and their functional interactions in 630 organisms[期刊论文]-Nucleic Acids Research 2009 15.Bader GD;Hogue CW Analyzing yeast protein-protein interaction data obtained from different sources[外文期刊] 2002(10) 16.Bader GD;Hogue CW BIND-a data specification for storing and describing biomolecular interactions,molecular complexes and pathways[期刊论文]-Bioinformatics 2000 17.Shannon P;Markiel A;Ozier O Cytoscape:a software environment for integrated models of biomolecular interaction networks[期刊论文]-Genome Research 2003 18.Alfarano C;Andrade CE;Anthony K The Biomolecular Interaction Network Database and related tools 2005 update[外文期刊] 2005 19.Marcotte E;Xenarios I;Eisenberg D Mining literature for protein-protein interactions[期刊论文]- Bioinformatics 2001 20.Harris MA;Clark J;Ireland A The Gene Ontology (GO)database and informatics resource[期刊论文]- Nucleic Acids Research 2004 21.Batada NN;Reguly T;Breitkreutz A Still stratus not altocumulus; further evidence against the date/party hub distinction[期刊论文]-PLoS Biology 2007 22.Reguly T;Breitkreutz A;Boucher L Co

                    本文档为【蛋白质-蛋白质相互作用数据库的研究进展】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

蛋白质-蛋白质相互作用数据库的研究进展

你可能还喜欢