垦匪选篮堂盘查!Q塑生!!旦!!旦箜!!鲞箜!塑!!!』鱼!型坠塑:!!:!Q塑:!!!:丝:盟!:!
蛋白质.蛋白质相互作用数据库的研究进展
李静傅松滨
【摘要】 随着人类蛋白质组学的飞速发展,出现了大量的蛋白质相互作用及其网络数据,因此寻
找和预测蛋白质相互作用的生物信息学方法成了研究蛋白质互作必不可少的_T具之一,本文主要从生
物信息学角度对蛋白质相互作用数据库做一下简单的介绍,包括各数据库的来源、主要功能、应用范围、
目前的发展状况及将来的发展方向等方面。
【关键词】 蛋白质相互作用;蛋白质相瓦作用网络;蛋白质相互作用数据库;生物信息学预测
TheResearchProgressinProtein-ProteinInteractionsDatabaseUJing‘.FUso唱一bin.(‘Laboratory
ofMedicalGenetics,HarbinMedicalUniversity,Harbin15008I,China)
Correspondingauthor:FUSong—bin.E—mail:舢6@em$.hrbmu.edu.cn
【Abstract】Withtherapiddevelopmentofproteomics,moreandmoreprotein—proteininteractionand
networkdatahavebeenreported.Identifyingandpredictingprotein—proteininteractionbybioinformaticsbecome
oneofnecessarytoolsforproteinresearch.Wewillreviewanddiscussprotein-proteininteractiondatabasesre-
latedtobioinformatics,includingitsresources,majorfunctions,application,currentdevelopmentandfuture
trend.
IKeywords】Protein·proteininteractions;Protein—proteininteractionnetwork;Databasesofprotein-
proteininteractions;Bioinformaticspredict
蛋白质是生命功能的执行者,也是生命现象的
直接体现者,对蛋白质结构和功能的研究将直接阐
明生命在生理或病理情况下的变化机制,而蛋白质
功能的实现离不开蛋白质与蛋白质或蛋白质与其他
生物大分子之间的相互作用。蛋白质的相互作用以
细胞结构,生化活性和能动行为为基础,反过来,遗
传的相互作用影响着广大蛋白网络功能的联合⋯。
研究蛋白质相互作用的网络是理解细胞网络结构及
功能,继而理解生命新陈代谢以及疾病发生的基础
和关键;与此同时,在蛋白质组研究领域,利用高通
量的实验方法来鉴定和分类蛋白质、细胞内的蛋白
区域和蛋白质的相互作用,产生了很多的生物信息
记录,这就需要有一些标准且特异的数据库来描述
和储存这些相互作用的信息,其结果导致了大量的
蛋白质相互作用数据库的发展“。。
通过蛋白质一蛋白质相互作用(protein-protein
DOI:lO.3760/cma.i.issn.1673-4386.200906.003
基金项目:国家自然科学摹金(30771198,30800268,
30801350);黑龙江省自然科学基金重点项日(7JY0702)
作者单位:150081,哈尔滨医科大学医学遗传学研究窄(李静、
傅松滨);150081哈尔滨,黑龙江省生物良药-r群重点实验室(傅松
滨)
通信作者:傅松滨(E.mail:fusb@ems,hrbmu.edu.rn)
·综述·
interaction,PPI)的数据库,我们可以构建一个蛋白
质相互作用的网络图谱,从基因功能注解、网络对
比、文献挖掘角度进一步分析各个蛋白质的定位、功
能和相瓦作用的关系。一些基于数据库预测蛋白质
相互作用的方法将为实验技术提供有利的依据,同
时实验技术义可以为数据库提供充分的数据资源和
结果验证,两者对于研究蛋白质相互作用起了至关
重要的作用。日前,蛋白质相互作用数据库已经在
蛋白质组的研究中做H;了突出的贡献。
l 蛋白质相互作用数据库
蛋白质一蛋白质相互作用数据库已经成为研究
细胞内乍物学通路和网络的主要资源,是系统理解
细胞生命机制的莺要工具"。“。目前大量公共储存
蛋},{质相互作用的数据库都是可用的,每一个数据
库都有其f{身的性质,如包括大量多样的数据类型
和不同程度的注解。蛋白质相互作用数据资源的来
源主要有两个:一个是文献中实验所支持的相互作
用,另一个是通过各个数据资源进行网络预测。由
于蛋白质相互作用潜在庞大的数目和高通量实验鉴
定的不确定性,预测的数据相比实验覆盖率仍然很
低,在一定程度上还存在假阳性。下面,将简单介绍
一下各蛋白质相互作用数据库的一些特征。
万方数据
国隧逮佳堂塞圭兰Q螋生12旦!§旦筮丝鲞筮垒塑丛』壁!盟旦堡:!i:!Q螋:!!!:丝:盟!:垒
1.1 String数据库:String是检索基因与蛋白质相
互作用的数据库,它集合了大量的信息资源,主要用
于储存实验鉴定的PPI数据、计算预测的数据和收
集公共的文本等,目前可以预测从原核细胞到其他
各种真核生物的直接和间接的相互作用012,13]。在
String数据库中输入全序列基因组,可以搜索到4种
类型的基因上下文联合(genomiccontextfusion):其
中包括①保守基因组领域;②基因融合事件;③基因
共同发生事件;④基因组的交叉和共
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
达。这4种
选择均是在基因发展进化过程中普通选择压力情况
下出现的功能上的联合。同时String数据库针对这
些预测的联合都有一个指定的置信度得分来评价它
的可信度。String主要选择KEGG(kyotoencyclope—
diaofgenesandgenomes)路径作为标准来维系蛋白
质的功能团,对于两个蛋白质联合的预测都被指定
相同的KEGG通路。在生物体之间String数据库有
两个策略来转移已知和预测未知的相互作用,一个
是直系同源基因簇(clustersofo/'thologousgroup,
COG)模式,依赖于COG数据库提供全或无的正向
同源分配和传输相互作用;另一个是蛋白模式,使用
定量的序列相似性搜索,可以在目标生物体几个蛋
白对之间的网络分布给定蛋白质相互作用的信息,
两者均可显示蛋白质的区域、序列和结构模式图,同
时还可以链接到其他不同的蛋白数据库,使用者可
以根据自己的需要选择合适的策略。最近.String
又开发了两个资源:一个是文本采集;一个是不同生
物体相互作用的转移。它们剖析了大量的科学文献
文本,包括预测的和确定的相互作用,以更好地研究
蛋白质问的相互作用。同时,String所推断的蛋白
质相互作用的网络图谱,可以链接到蛋白质的定位、
功能等方面,使分析目标蛋白的生物过程变得更容
易。String从2000年开始发行,一直在不断地更新,
截止至2009年1月已经涵盖了大约630种生物体
的250万个蛋白,为寻找和预测蛋白质一蛋白质的相
互作用提供了广泛的资源,对研究蛋白互作有着重
大的意义‘14|。
1.2 BIND数据库:BIND数据库(biomolecularin-
teractionnetworkdatabase,BIND)现在更名为BOND
数据库(biomolecularobjectnetworkdatabank,
BOND)。于1999年建立,是一个在线开放的数据库
工具。BIND定义了3种主要的数据类型:相互作
用、分子复合物和通路【I5I。相互作用的描述包括观
察相互作用的实验条件、保守序列、分子定位、化学
行为、力学、热力学和化学性质等。互作记录以两个
物体的相互作用为基础,这个物体可以是一个蛋白、
DNA、RNA、配体,分子复合物甚至到原子。BIND使
用ASN.1(abstractsylltaxnotation.1)、XML(extensi-
blemarkuplanguage)、Java等数据特异性语言来管
理数据库¨6|,整合了GO(geneontology)的注释信
息,并继承了NCBI(nationalcenterforbiotechnology
information)数据模型来描述序列、三维结构和出版
的文献信息,为BIND的数据特异性提供了稳定的
基础。BIND的搜寻结果可以直接在BIND的网页
以CystoscapesIF【171的形式存储在硬盘上,使用者可
以把存储结果上传到Cytoscape上显示相互作用的
网络,可以聚焦在数据集的所有方面,包括:文献信
息,分子结构,基因信息(功能、ID、序列、分类)等,
可能得到数百或数千的相互作用结构。BIND数据
库来源主要包括一些出版的期刊杂志、文献、高通量
的实验以及其他PPI数据库,同时还包括一些预出
版的文章¨引。目前BIND发展了一些新方法去扩
大基因和蛋白质注释的图像,使研究分子间相互作
用的网络变得更加容易,同时它的数据增长速率非
常快。据预测,在不久的将来会超过100000条记
录,而且将会建立一个新的BIND询问和投递的界
面,提供关于分子机制的细节信息,例如,化学制品、
酶促反应等,均在BIND中被编码。BIND的长远目
标是在可计算数据的情况下,在每个主要的模型有
机体中取得一套完整而充分的相互作用和反应记
录,以作为细胞模拟实验的原料。
1。3 DIP数据库:DIP数据库(tlledatabaseofinter-
actingproteins,DIP)于1999年发行,主要是储存经
过实验确定的蛋白质-蛋白质相互作用的数据库,具
体是指相互结合和作用的氨基酸序列,包括两个蛋
白之间和复合物的相互作用;同时研究一些特殊的
互作蛋白,探索它们的信号调节和转导途径;还可以
从整个细胞水平上来研究蛋白质相互作用网络的整
体性和复杂性。此数据库通过生物学过程中浏览和
有效抽提蛋白质之间的相互作用和互作网络提供着
科学的交流,主要用于理解蛋白质的功能,蛋白质.
蛋白质相互作用的关系.研究蛋白质相互作用网络
的特性和进化,标准化预测蛋白的相互作用等。
DIP主要由3个表组成:①蛋白信息表:除了包含文
献和4个主要序列数据库(SWISS.PROT、PIR、Gen—
Bank和ProteinDataBank)的蛋白鉴定编码外,还包
括每个蛋白质的基因名称、描述、酶编码和细胞定
位;②蛋白互作表:通过之前的蛋白信息表描述蛋白
质的相互作用,氨基酸范围和蛋白互作所涉及的蛋
白区域;③描述探测蛋白质.蛋白质相互作用的实验
细节表:用来检测相关文献的相互作用,包括MED—
万方数据
旦隧追佳堂盘查!塑!生!!旦!!旦箜!!鲞箜!塑!!!』堡!!!!Q塑!!:!Q塑:!型:!!.:№:!
LINE(nationallibraryofmedicine,MD。USA¨引)标准
文章编码(PMID/UID)、作者、文章、杂志和文章出
版年份。DIP中有超过20种的实验技术,包括免疫
共沉淀、酵母双杂交等,同时可以搜索到目标蛋白所
属的生物体、蛋白家族、关键词、实验技术、文献索引
等方面,并应用了一个开放的资源PostgreSQL数据
库管理系统(http://www.postgresql.org),该系统能
有效控制多种类型的数据,进行快速分类和分析。
DIP数据来源主要是不同的科学杂志,例姐。MED—
LINE和一些其他的蛋白数据库。来源于实验和预
测的高通量的蛋白质相互作用还可以通过DIP中的
其他服务来评估,如PVM(paralogousverification
method)、EPR(expressionprofilereliability)和DPV
(domainpairverification)。PVM验证共生同源的相
互作用;EPR验证共同表达相互作用的比较对照;
DPV通过区域间的作用参数进行验证。目前,DIP
是研究蛋白质相互作用的主要数据库之一。
1.4 BioGRID数据库:BioGRID数据库(biology
generalrepositoryforinteractiondatasets,BioGRID)是
一个可以免费使用的生理学和遗传学相互作用的蛋
白质数据库,主要包括蛋白质的翻译后修饰和基因
互作的特异性表型。每一个相互作用记录都包括实
验证据编码,可以链接到支持的出版期刊。Bio—
GRID中的相互作用联合Osprey软件显像系统,使
用者可以通过固定的模式来询问网络的构成。搜索
范围包括基因名称,开放读码框名称,PubMedID和
自由正文,注解特征包括基因/蛋白功能,GO生物
过程,分子功能和细胞组成术语瑚]。BioGRID的数
据下载系统主要用JavaScript和XML数据传输模式
操纵管理口¨。数据库来源包括出版发行的高通量
相互作用数据库,文献中的焦点研究等‘22J。Bio—
GRID每个月都根据酵母基因组数据库(SGD),Fly-
base和EnterzGene,NCBI等数据库进行更新。截止
到2009年7月1日,BioGRID已经包含6个不同种
系的166002个相百.作用数据记录‘23j,涵盖了13个
模型生物体种类饼J,包括酿酒酵母、裂殖酵母、秀丽
隐杆线虫、果蝇、小鼠和人类等,同时还增加了大量
新的特性,包括改进使用界面来显示不同分布的相
互作用,镜像位点和专用的互作管理系统调整不同
交叉的定位。目前,BioGRID仍在不断地发展中,它
将以记录标签结构的BioGRID图表为基础,通过使
用界面的精炼_T.具和显示特征,更好的控制数据图
像和下载数据,数据库视图将基于Osprey、Cytoseape
和EdinburghPathwayEditor,同时允许更复杂的网
络询问和搜索。为使这个开放资源软件工具传播更
广,BioGRID将会竭力与GMOD(geneticmodelor.
ganismdatabase)方案兼容,以便更好的为蛋白质.蛋
白质相互作用服务。
1.5 MINT数据库:MINT数据库(molecularinterac—
liondatabase,MINT)竭力收集一些具有代表性的文
献中可用的蛋白质相互作用,极大地增加了数据信
息的可靠性ⅢJ。它不仅包括蛋白质的相互作用,还
包括一些非蛋白个体,如启动子区域和mRNA转录
子的相互作用。蛋白互作信息的形式包括二元和多
元的,均是基序特异的。。对于每一个相互作用都有
_个基于实验和文献的置信度得分,同时通过Swis-
sProt数据库进行注解。MINT的一个重要特性就在
于它把人类的PPl分开评注,称为HomoMINT,包括
从其他有机体到人类同源性文献衍生的数据信息。
MINT系统目前主要聚焦在蛋白质的生理相互作用
方面,遗传或是计算机预测的相互作用不在其中。
MINT在发展过程中,经历了扩展的修正,在数据模
型和数据结构方面深度改造,并且增加了大量储存
的相互作用信息,新的MINT以完全改造的数据库
结构为基础,提供有效的数据开发和分析,对于每个
个体都有很详细的注解,可以通过网络为基础的界
面免费在线搜索相互作用关系和数据模式。在
2006年MINT采用了IntAct关系模型,IntAct是一
个开放的资源数据库,用于储存、成像和分析分子的
相互作用。采用IntAct模型的主要优点是能够将蛋
白复合物和其他类型分子作为相互作用的参与者进
行分析。MINT主要基于开放的网络资源Post—
greSQL数据管理系统,数据库来源于FEBSLetters
(sinceJanuary2005)、EMBOJournal和EMBORe—
ports(sinceJanuary2006),同时与其他IMEx(inter-
nationalmolecular—interactionexchangeconsortiumht—
tp://imexsourceforge.net/)m1达成
协议
离婚协议模板下载合伙人协议 下载渠道分销协议免费下载敬业协议下载授课协议下载
,包括DiP、
IntAct、Mpact和BIND,避免工作的重叠。MINT中
新数据主要以HTMI。的形式进行投递,有利于自动
审核;网络服务直接允许flat—file、PSll.0.XML、
PSl2.5-XML等不同形式的检索。截止到2009年7
月有超过30个有机体模型的1l 1 398个相互作用,
其中有29334个蛋白相互作用储存在MINT一7‘中。
1.6 HPRD数据库:HPRI)数据库(humanprotein
referencedatabase,HPRD)是来源于实验信息的人类
蛋白质组数据库,包括蛋白质-蛋白质相互作用,翻
译后修饰,组织表达,同时还包括蛋白、核酸与小分
子的相互作用。实验类型主要包括三方面:细胞内、
细胞外和酵母双杂交。HPRD的评注程序通过Bio—
Builder编辑和管理网络浏览器工具进入蛋白质数
万方数据
国隧遗笾堂盘查2塑生12旦!§旦筮丝鲞筮!塑!型』鱼鲤堕:!!:!堂:!尘:≥!:盟!:鱼
据。I-IPRD创建于2003年,在目前最新的版本中增
加了磷酸基序探测器(PhosphoMotifFinder),包含来
源于文献的实验特性磷酸化底物和结合基序,允许
用户在超过320个实验中寻找鉴定感兴趣蛋白的磷
酸基序汹]。这个新的特征是一个蛋白分布注解系
统一Hu眦nProteinpedia(http://www.humanprotein-
pedia.ors/),通过这个网站,实验室可以根据它们的
数据在HPRD中绘制完整的蛋白质表达图谱,而
且,HPRD还通过NetPath(http://www.netpath.
ors/)链接到人类信号通路摘要。NetPath包含蛋白
质相互作用信息,催化反应,蛋白质转位等方面,共
2732个相互作用,其中1793个蛋白包含在癌症和
免疫信号通路的注解中。通过最近的更新,HPRD
增加了5500个新蛋白质的序列,使之对人类蛋白质
组研究的资源更加广泛。截止到2009年7月,在
HPRD数据库中有27081个蛋白的38806个相互
作用o29】。
1.7 IntAct数据库:IntAct包括简略的蛋白质相互
作用描述、实验方法、人类和其他种系的文献引文,
主要使用PSJ—MICV州1(proteomicsstandardsinitia—
tive—molecularinteractionscontrolledvocabulary)描述
连贯的相互作用数据。IntAct和之前介绍的MINT
是PSI—MI工作组的核心,IntAct通过使用控制的操
作码提供了高质量和经过鉴定的文献相互作用数
据,减少了技术上的命名错误和相互作用特征的解
释。它的蛋白相互作用信息是基序特异性的,分基
本搜索和高级搜索,后者在PSI.MI列表中提供额外
的询问选项,如实验方法或对照词汇表等。IntAct
有一个Pay.As.You.Go算法,可以通过实验预测最
匹配的蛋白质相互作用,把它们按优先次序排列。
同时,还增加了一个软件-HierarchView,通过GO分
类显示相互作用网络的二维图像和最显著的结点。
IntAct数据来源于文献或是用户投稿分析蛋白相互
作用数据的开放资源数据系统。截止到2009年6
月,IntAct包括194558个二元复合物的相互作用,
58155个蛋白,10495个实验,1493个控制词汇条。
2补充的相互作用数据库
生物信息学发展到现在,已经对蛋白质相互作
用进行了深人细致的研究,包括预测蛋白质相互作
用的方法、高通量蛋白质相互作用数据库的建立、预
测蛋白质相互作用的软件和网络服务的开发等。为
了满足广大使用者对整个基肉组蛋白质相互作用网
络分析的需求,越来越多的蛋白质相互作用数据库
不断应运而生,在其基础上还广泛开展了蛋白质相
互作用网络、蛋白质功能的预测、新药研发等相关研
究。研究蛋白质相互作用的方法很多,决定蛋白质
相互作用的因素也多种多样,以下列出了一些附加
数据库的简要信息,主要基于不同的实验方法、文献
和不同的研究目的,研究者可以根据自己的需要选
择适合的数据库。
2.1补充的蛋白质相互作用数据库
2.1.1DAVID数据库DAVID数据库(thedata·
baseforannotation,visualizationandIntegrateddis·
covery,DAVID)网址:http://david.abcc.ncifcrf.
gov/,通过给定的基因列表可以发现功能相关基因
组,基因通路图谱,相互作用蛋白列表,重要蛋白功
能区域等。建立机构:美国国立卫生研究所[nation·
alinstituteofallergyandinfectiousdiseases(NIAID),
NIH.]
2.1.2IUPHAR数据库IUPHAR数据库(interna-
tionalunionofbasicandclinicalpharmacology,IU-
PHAR)网址:http://www.iuphar—db.org/index.jsp,
G蛋白偶联受体数据库和电压门控通道与受体门控
通道的数据库。建立机构:国际科学理事会[inter-
nationalcouncilforscience(ICSU).]
2.1.3Smart数据库网址:http://smart.embl—hei—
delberg.de/,基于630个种系的全序列基因组的相
互作用网络,目前可用的蛋白超过200万,而且易于
分析区域的相互作用。建立机构:由欧盟授权号
213037支持(grantnumber213037fromtheEuropean
Union.)
2.1.4UniHI数据库UniHI数据库(unifiedhu.
maninteractomedatabase。UniHI)网址:http://theo.
derich.fb3.mdc—berlin.de:8080/unihi/des,提供了
丰富的人的PPI,分别以酵母双杂交实验技术、文
献、正向同源为基础的相互作用,从14个主要的
PPI资源中收集了22300个蛋白质,253980个相互
作用。建立机构:德国柏林理论生物研究所慈善医
疗部(Germanyinstitutefortheoreticalbiologycharite—
medicaldevisionHunbold—UniversityZUBerlin.)
2.1.5KDBI数据库KDBI数据库(kineticdataof
bio—molecularinteractiondatabase,KDBI)网址:ht.
tp://bioinf.xmu.edu.cn/databases/kdbi/kdbi.php,
生物分子相互作用的动态数据,收集来源于实验的
蛋白与蛋白,蛋白与RNA,蛋白与DNA,蛋白与配
体,RNA与配体,DNA与配体之间的相互作用或是
文献中的反应事件。建立机构:厦门大学第二生物
学区。
2.1.6PIMRider数据库网址:http://pimr.hybri.
万方数据
旦隧运笾堂苤盘!Q塑生!!旦!i旦筮丝鲞筮!塑!!!』曼!!盟望塑:!i:!Q塑:!!!:!!:丛!:!
genics.corn/pimriderext/common/。蛋白质组软件平
台,以相互作用图谱为基础,致力于开发蛋白通路,
显示其生物学功能。建立机构:法国巴黎遗传学总
部(hybrigenics’headquartersandfacilities。Paris—
France.)
2.1.7PawsonLab数据库网址:http://pawson—
lab.mshri.on.ca/index.php,一个实验室的名称,主
要研究分子切割,蛋白相互作用的功能、意义、信号
转导等。建立机构:Pawson实验室(thePawson
lab.)
2.1.8VisANT数据库网址:http://visant.bu.
edu/,过去的Predictome,基于文献中的实验和不同
数据库链接,预测基冈和蛋白相互作用的数据库。
建立机构:美国国立卫生研究所(Nationalinstitutes
ofhealth.)
2.1.9HPID数据库HPID数据库(humanprotein
interactiondatabase,HPID)网址:http://wilab.inha.
ae.kr/hpid/,通过实验的数据以及不同的数据库链
接提供人类蛋白相互作用的信息,可以在线预测。
建立机构:韩国f■和大学生物计算实验室,网络智能
实验室,计算机科学与信息工程部(Biocomputing
lab.webintelligencelab,departmentofcomputersci—
enceandinformationengineefinglnhauniversity,Ko·
tea.)
2.I.10POINT数据库网址:http://point.bioin·
formatics.tw/intro/intro.jsp,从各种数据库中收集整
理相互作用的蛋白,提供蛋白互作的过滤和网络拓
扑结构分析,进而预测蛋白的相互作用。
2.2补充的通路:随着人类基因组
计划
项目进度计划表范例计划下载计划下载计划下载课程教学计划下载
的完成,高
通量的实验拓宽了基因组信息的意义,不仅包括转
录组和蛋白质组,还包括代谢组和其他基因组编码
的信息。对于代谢组的研究主要基于通路的研究。
在细胞水平,生命是一个分子相互作用的网络,分子
被合成、降解、转运、与其他分子形成复合物、经历暂
时的或永久的修饰。然而,这些复杂的过程町以被
分解成简单不同的通路,通过对计算机化的通路研
究,有助于我们理解细胞的生命过程和机体行为水
平的功能,并且在医疗,制药和环境科学等方面具有
重要的实践功能。以下列}{{了两个关于通路研究的
数据库,在信号转导、细胞过程和人类疾病等方面具
有指导意义。
2.2.1 KEGG数据库KEGG数据库(kyotoency—
clopediaofgenesandgenomes,KEGG)网址:http://
m哪.genome.jp/kegg/pathway.html,以文献为基础,
表示分子相互作用和反应的网络通路数据,包括比
较全面的代谢通路图谱。建立机构:京都大学和东
京大学人类基因组中心生物信息学实验室(Kanehi—
salaboratoriesinthebioinformaticscenterofKyotoU—
niversityandthehumangenomecenteroftheuniversi—
tyofTokyo.)
2.2.2Reactome数据库网址:http://www.reac-
tome.org/,可以表示人类生物学的许多不同生物过
程和反应网络,包括介导的代谢通路,调控通路,信
号转导通路等。建立机构:欧洲生物研究所科尔德
斯普林哈博尔实验室和基因本体论团体(Cold
SPfingHarborlaboratory,theEuropeanbioinformatics
institute,andthegeneontologyconsortium.)
2.3 存在的问题:以上介绍了一些蛋白质相互作用
的数据库和一些信号通路的信息,这些数据库在蛋
白质组学方面为广大研究者提供了丰富的数据资源
与信息,但是还存在着一些不足,如大部分预测蛋白
质相互作用网络的方法仪仅限于对真实数据网络的
粗略估计;尚存在一些置信度比较低的预测;在数据
网络的动态性,稳定性及蛋白互作强度的预测方面
也存在着缺陷;数据资源不足,虽然各个数据库的资
源有交义,但不是十分全面;各个数掘库有其自身数
据语言和模式的限制,mi且相应的评估标准还未建
立,使这些数据库在应用方面受到了一些制约。蛋
白质相互作用是一个十分复杂的现象,要想取得预
期的完美效果还有许多困难,相信通过实验技术和
各种预测方法的不断发展和完善,会有一些涵盖数
据资源范围更广,操作更为方便,更新速度更快的数
据库出现,一定会在蛋白质组学,基因组学等方面取
得重大的突破,从而为基础研究提供有利的依据。
3展望
蛋白质一蛋白质相互作用数据库从建立到现在,
经历了从原核生物到真核生物的研究(增加了数据
资源和有机体的种类);从少数基因到整个基因组
的研究;从最示已确定的相互作用到预测未知的蛋
白互作,再到功能f:的联合;从相互作片j的研究到代
谢、信号、转录通路的研究;从软件分析到在线搜寻,
从成对的相互作用到相互作用的网络,所依赖的数
据库也在不断的增加和完善,而且发展了不同的数
据模式和应用程序。应用生物信息学,统计学的计
算方法来评估蛋白质与蛋白质的相互作用正处于发
展中,这更加完善了预测蛋白互作的方法,增加了蛋
白互作信息的可信度。目前可以通过不同的输人形
式如蛋白的名称、ID号、氨基酸序列、不同数据库的
代码搜索到该蛋白质或是基因的互作信息。由于蛋
万方数据
旦匪遗篮堂苤壶!Q塑生!!旦!!旦筮丝鲞复垒期!型』堡!堕旦塑:!§。!螋:y生:!兰:堕!:垒
白质相互作用网络的功能预测整合了多种不同的数
据信息,可以从整体水平上搜索和预测蛋白的功能
和相互作用,并且随着越来越多的蛋白质相互作用
数据库的出现和现有蛋白质相互作用数据库的不断
完善,会使得蛋白质的相互作用、分子结构、功能、基
因信息等数据挖掘方面的资源越来越丰富,对蛋白
质等生物分子的研究也会随之越来越深入。但是由
于蛋白质相互作用的复杂性与多样性和实验技术的
局限性,有些蛋白相互作用是瞬时的,不稳定的,以
实验为基础的方法很难检测到这种相互作用,而应
用生物信息学方法对于此种情况可以进行弥补。因
此,综合各个不同的蛋白质数据库,使其整合和互
补,以适应不同的数据信息,从而得到准确的蛋白质
相互作用的结果,是将来数据库开发和发展的主要
方向。
相信随着生物信息学的不断发展和完善,蛋白
质组学与蛋白质相互作用数据库的共同联合,通过
不同的蛋白质研究技术的发展和完善,蛋白质与蛋
白质相互作用数据库将会更广泛的应用于生物制药
研发、临床用药、疾病病因学研究、疾病防治乃至环
境卫生等诸多领域,从而在生命机制的研究领域发
挥更大的作用。
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
参考文献
JorgensenP,BreitkreutzBJ,BreitkreutzK.eta1.Harvestingthe
genome’8bounty:integrativegenomics.ColdSpringHarbSyrup
QuantBi01.2003,68:43l·443.
MishraGR,SureshM,KumaranK,ela1.Humanproteinrefer-
encedatabase-2006update.NucleicAcidsRes,2006,34:41l一
414.
SalwinskiL,MillerCS,SmithAJ,eta1.Thedatabaseofinterae—
tingproteins:2004update.NucleicAcidsRes,2004,32:449-
451.
MewesHW,FrishmanD,MayerKF,eta1.MIPS:analysisand
annotationofproteinsfromwholegenomesin2005.NucleicAcids
Bes.2006.34:169·172.
KerrienS,Alam—FaruqueY,ArandaB.ela1.IntAct—opensource
resourceformolecularinteractiondata.NucleicAcidsRes。2007.
35:561-565.
Chatr.AryamontriA,CeolA,PalazziLM,eta1.MINT:theMo-
le(·ularINTeractiondatabase.NucleicAcidsRes.2007.35:572.
574.
BaderS,KuhnerS,GavinAC.Interactionnetworksforsystems
biology.FEBSLett.2008。582:1220·1224.
DevosD,RussellRB.Amorecomplete,complexedandstruc-
turedinteractome.CurrOpinStructBiol,2007,17:370-377.
HuZ,MellorJ,WuJ,eta1.Towardszoomablemultidimensional
mapsofthecell.NatBiotechn01.2007.25:547-554.
ChristensenC,rhakal"J,AlbertR.Systems—levelins/gII嵋into
cellularregulation:inferring,analysing,andmodellingintracel一
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
lularnetworks.IETSystBi01.2007.1:61-77.
KohlerS。BauerS,HornD,eta1.Walkingtheinteractomefor
prioritizationofcandidatediseasegenes.AmJHumGenet,2008.
82:949-958.
vonMetingC.JensenU,KuhnM.eta1.STRING7—∞centde.
velopmentsinthebuintegrationandpredictionofproteininterac-
fions.NucleicAcidsRes。2007。35:358.362.
ShelB.LehmannG,BorkP.eta1.STRING:aweb一瞬rvqgrtom.
trieveanddisplaytherepeatedlyoccurringneishbourhoodofa
gene.NucleicAcidsRes,2000,28:3442-3444.
JermenU,KuhnM,StarkM.eta1.STRING8--aglobalviewOrl
proteinsandtheirfunctionalinteractionsin630organisms.Nu-
eleicAcidsRes。2009,37:412-416.
BaderGD,HogueCW.Analyzingyeastprotein—proteininterac—
t/ondataobtainedfromd/frerent∞ur;c∞.NatBiotechn01.2002.
20:991-997.
BaderGD.HogueCW.BIN肛一adataspecificationforstoring
anddescribingbiomolecularinteractions,molecularcomplexes
andpathways.Bioinformatics,2000,16:465-477.
ShannonP,Mark/elA,Ozier0.et且1.Cytoacape:asoftwareen-
vironmentforintegratedmodelsofbiomolecularinteractionnet—
works.GenomeRes.2003.13:2498.2504.
AlfanmoC,AndradeCE,AnthonyK,eta1.TheBiomoleeularIn-
teracfionNetworkDatabaseandrelatedtools2005update.Nucle—
icAcidsRes,2005.33:418-424.
MarcotteE,Xenarios【,EisenbergD.MiningliteratureforPp
tein—proteininteractions.Bioinformatics,200l,17,l_7
HarrisMA,ClarkJ,IrelandA,eta1.1rheGeneOntology(GO)
databaseandinformaticsregoul℃e.NucleicAcidsRes。2004。32:
258-261.
BatadaNN,RegulyT,BreitkreutzA,eta1.Stillstratusnotalto-
cumulus:furtherevidenceagF,instthedate/partyhubdistinction.
PbSBiol,2007。5:e154
RegulyT。BreitkreutzA,BoucherL.eta1.Comprehensiveculx-
t/onandanalysisofglobalinteractionnetworksinSaccharomyces
eerevisiac.JBioI.2006。5:11.
http://www.thebiogrid.org//ViewNews/72
StarkC。BreitkreutzBJ,RegulyT.eta1.BioGRID:ageneralre·
positoryforinteractiondatasets.NucleicAcidsRes,2006,34:
535-539.
Chatr·aryamontriA,KertieuS,KhadakeJ,eta1.MINTandIn.
tActcontributetotheSecondBioCreativechallenge:servingthe
text—miningcommunitywithhighqualitymolecularinteractionda-
ta.GenomeBiol,2008.9(Suppl2):s5.
IMExCurationManual[http://imex.zoureeforge.net/doc/imex·
curalionManual.doc]
http://mint.bin.unironud.it/raint/Welcome.do
MathivananlS,Petia.swamyIB,GandhiTK.etai.Anevalua.
t/onofhumanprolein-proteininteractiondatainthepublicdo-
main.BMCBioinformatics,2006。7:S19.
http://www.hprd.ors/
KerrienS,OrchardS,Montecehi—PalazziL,eta1.Broadening
thehorizon—level2.5oftheHUPO—PSIformatformolecularin.
teractions.BMCBiol,200r7,5:44.
(收稿日期:2009-01·19)
万方数据
蛋白质-蛋白质相互作用数据库的研究进展
作者: 李静, 傅松滨, LI Jing, FU Song-bin
作者单位: 李静,LI Jing(哈尔滨医科大学医学遗传学研究室,150081), 傅松滨,FU Song-
bin(150081,哈尔滨医科大学医学遗传学研究室;150081,哈尔滨,黑龙江省生物医药工程重点
实验室)
刊名: 国际遗传学杂志
英文刊名: INTERNATIONAL JOURNAL OF GENETICS
年,卷(期): 2009,32(6)
参考文献(30条)
1.Jorgensen P;Breitkreutz BJ;Breilkreutz K Harvesting the genome's bounty:integrative genomics[期刊
论文]-Cold Spring Harbor Symposia on Quantitative Biology 2003
2.Mishra GR;Suresh M;Kumaran K Human protein reference database-2006 update[期刊论文]-Nucleic Acids
Research 2006
3.Salwinski L;Miller CS;Smith AJ The database of interacting proteins:2004 update[期刊论文]-Nucleic
Acids Research 2004
4.Mewes HW;Frishman D;Mayer KF MIPS;analysis and annotation of proteins from whole genomes in 2005
[期刊论文]-Nucleic Acids Research 2006
5.Kerrien S;Alam-Faruque Y;Aranda B IntAct-open source resource for molecular interaction data[期刊
论文]-Nucleic Acids Research 2007
6.Chatr-Aryamontri A;Ceol A;Palazzi LM MINT;the Molecular INTeraction database[期刊论文]-Nucleic
Acids Research 2007
7.Bader S;Kuhner S;Gavin AC Interaction networks for systems biology[外文期刊] 2008
8.Oevos D;Russell RB A more complete,complexed and structured interactome[期刊论文]-Current Opinion
in Structural Biology 2007
9.Hu Z;Mellor J;Wu J Towards zoomable multidimensional maps of the cell[期刊论文]-Nature
Biotechnology 2007
10.Christensen C;Thakar J;Albert R Systems-level insights into cellular
regulation:inferring,analysing,and modelling intracellular networks[期刊论文]-IET Syst Biol 2007
11.Kohler S;Bauer S;Horn D Walking the interactome for prioritization of candidate disease genes[外
文期刊] 2008
12.von MeringC;Jensen LJ;Kuhn M STRING 7-recent de-velopments in the buintegration and prediction of
protein interactions[期刊论文]-Nucleic Acids Research 2007
13.Snel B;Lehmann G;Bork P STRING:a web-server to retrieve and display the repeatedly occurring
neighbourhood of a gene[期刊论文]-Nucleic Acids Research 2000
14.Jensen LJ;Kuhn M;Stark M STRING 8-a global view on proteins and their functional interactions in
630 organisms[期刊论文]-Nucleic Acids Research 2009
15.Bader GD;Hogue CW Analyzing yeast protein-protein interaction data obtained from different
sources[外文期刊] 2002(10)
16.Bader GD;Hogue CW BIND-a data specification for storing and describing biomolecular
interactions,molecular complexes and pathways[期刊论文]-Bioinformatics 2000
17.Shannon P;Markiel A;Ozier O Cytoscape:a software environment for integrated models of
biomolecular interaction networks[期刊论文]-Genome Research 2003
18.Alfarano C;Andrade CE;Anthony K The Biomolecular Interaction Network Database and related tools
2005 update[外文期刊] 2005
19.Marcotte E;Xenarios I;Eisenberg D Mining literature for protein-protein interactions[期刊论文]-
Bioinformatics 2001
20.Harris MA;Clark J;Ireland A The Gene Ontology (GO)database and informatics resource[期刊论文]-
Nucleic Acids Research 2004
21.Batada NN;Reguly T;Breitkreutz A Still stratus not altocumulus; further evidence against the
date/party hub distinction[期刊论文]-PLoS Biology 2007
22.Reguly T;Breitkreutz A;Boucher L Co