首页 构建系统进化树的方法步骤Read

构建系统进化树的方法步骤Read

举报
开通vip

构建系统进化树的方法步骤Read构建系统进化树的方法步骤1.建树前的准备工作1.1相似序列的获得——BLASTBLAST是目前常用的数据库搜索程序,它是BasicLocalAlignmentSearch的缩写,Tool意为“基本局部相似性比对搜索工具”(Altschuletal.,1990[62];1997[63])。国际著名生物信息中心都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序列片段。首先登录到提供BLAST服务的常用网站,比如国...

构建系统进化树的方法步骤Read
构建系统进化树的方法步骤1.建树前的准备工作1.1相似序列的获得——BLASTBLAST是目前常用的数据库搜索程序,它是BasicLocalAlignmentSearch的缩写,Tool意为“基本局部相似性比对搜索工具”(Altschuletal.,1990[62];1997[63])。国际著名生物信息中心都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序列片段。首先登录到提供BLAST服务的常用网站,比如国内的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ。这些网站提供的BLAST服务在界面上差不多,但所用的程序有所差异。它们都有一个大的文本框,用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行,以“>”符号开始,后面是序列的名称、说明等,其中“>”是必需的,名称及说明等可以是任意形式,换行之后是序列)粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可以开始搜索了。如果是DNA序列,一般选择BLASTN搜索DNA数据库。这里以NCBI为例。登录NCBI主页-点击BLAST-点击Nucleotide-nucleotideBLAST(blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得到resultofBLAST。BLASTN结果如何 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 (参数意义):>gi|28171832|gb|AY155203.1|Nocardiasp.ATCC4987216SribosomalRNAgene,completesequenceScore=2020bits(1019),Expect=0.0Identities=1382/1497(92%),Gaps=8/1497(0%)Strand=Plus/PlusQuery:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt60||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt58Query:61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc120|||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:59acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc118Score:指的是提交的序列和搜索出的序列之间的分值,越高说明越相似;Expect:比对的期望值。比对越好,expect越小,一般在核酸层次的比对,expect小于1e-10,就比对很好了,多数情况下为0;Identities:提交的序列和参比序列的相似性,如上所指为1497个核苷酸中二者有1382个相同;Gaps:一般翻译成空位,指的是对不上的碱基数目;Strand:链的方向,Plus/Minus意味着提交的序列和参比序列是反向互补的,如果是Plus/Plus则二者皆为正向。1.2序列格式:FASTA格式由于EMBL和GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数据格式。FASTA格式又称为Pearson格式,该种序列格式要求序列的标 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 行以大于号“>”开头,下一行起为具体的序列。一般建议每行的字符数不超过60或80个,以方便程序处理。多条核酸和蛋白质序列格式即将该格式连续列出即可,如下所示:>E.coli1aaattgaagagtttgatcatggctcagattgaacgctggcggcaggcctaacacatgcaa61gtcgaacggtaacaggaagaagcttgcttctttgctgacgagtggcggac……>AY631071JiangellagansuensisYIM0021gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc……其中的‘>’为ClustalX默认的序列输入格式,必不可少。其后可以是种属名称,也可以是序列在Genbank中的登录号(Accession,No.)自编号也可以,不过需要注意名字不能太长,一般由英文字母和数字组成,开首几个字母最好不要相同,因为有时ClustalX程序只默认前几位为该序列名称。回车换行后是序列。将检测序列和搜索到的同源序列以FASTA格式编辑成为一个文本文件(例:C:\temp\jc.txt),即可导入ClustalX等程序进行比对建树。2.构建系统树的相关软件和操作步骤构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。鉴于以上对于构建系统树的评价,结合本实验室实际情况,以下主要介绍N-JTree构建的相关软件和操作步骤。2.1用ClustalX构建N-J系统树的过程(1)打开ClustalX程序,载入源文件.File-Loadsequences-C:\temp\jc.txt.(2)序列比对Alignment-Outputformatoptions-√Clustalformat;CLUSTALWsequencenumbers:ONAlignment-Docompletealignment(OutputGuideTreefile,C:\temp\jc.dnd;OutputAlignmentfile,C:\temp\jc.aln;)Align→waiting……等待时间与序列长度、数量以及计算机配置有关。(3)掐头去尾File-SaveSequenceas…Format:⊙CLUSTALGDEoutputcase:LowerCLUSTALWsequencenumbers:ONSavefromresidue:39to1504以前后最短序列为准()Savesequenceas:C:\temp\jc-a.alnOK将开始和末尾处长短不同的序列剪切整齐。这里,因为测序引物不尽相同,所以比对后序列参差不齐。一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。剪切后的文件存为ALN格式。(4)File-Loadsequences-Replaceexistingsequences?-Yes-C:\temp\jc-a.aln重新载入剪切后的序列。(5)Trees-OutputFormatOptionsOutputFiles:√CLUSTALformattree√Phylipformattree√PhylipdistancematrixBootstraplabelson:NODECLOSETrees-ExcludepositionswithgapsTrees-BootstrapN-J:TreeRandomnumbergeneratorseed(1-1000):111Numberofbootstraptrails(1-1000):1000SAVECLUSTALTREEAS:C:\temp\jc-a.njbSAVEPHYLIPTREEAS:C:\temp\jc-a.njbphbOK→waiting……等待时间与序列长度、数量以及计算机配置有关。在此过程中,生成进化树文件*.njbphb,可以用TreeView打开查看。(6)Trees-DrawN-JTreesSAVECLUSTALTREEAS:C:\temp\jc-a.njSAVEPHYLIPTREEAS:C:\temp\jc-a.njphSAVEDISTANCEMATRIXAS:C:\temp\jc-a.njphdstOK此过程中生成的报告文件*.nj比较有用,里面列出了比对序列两两之间的相似度,以及转换和颠换分别各占多少。(7)TreeViewFile-Open-C:\temp\jc-a.njbphbTree-phylogram(unrooted,slantedcladogram,Rectangularcladogram多种树型)Tree-Showinternaledgelabels(Bootstrapvalue)(显示数值)Tree-Defineoutgroup…→ingroup>>outgroup→OK(定义外群)Tree-Rootwithoutgroup通常需要对进化树进行编辑,这时首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再进行图片编辑。如果直接Copy至Word则显示乱码,而进化树不能正确显示。2.2Mega建树虽然ClustalX可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Mega因为操作简单,结果美观,很多研究者选择用它来建树。(1)首先用ClustalX进行序列比对,剪切后生成C:\temp\jc-a.aln文件;(同上)(2)打开BioEdit程序,将目标文件格式转化为FASTA格式,File-Open-C:\temp\jc-a.aln,File-SaveAs-C:\temp\jc-b.fas;(3)打开Mega程序,转化为mega格式并激活目标文件,File-ConvertToMEGAFormat-C:\temp\b.fas→jc-C:\temp\jc-b.meg,关闭TextEditor窗口-(Doyouwanttosaveyourchangesbeforeclosing?-Yes);Clickmetoactivateadatafile-C:\temp\jc-b.meg-OK-(Protein-codingnucleotidesequencedata?-No);Phylogeny-Neighbor-Joining(NJ)DistanceOptions-Models-Nucleotide:Kimura2-parameter;√d:Transitions+Transversions;IncludeSites-⊙PairwiseDeletionTestofPhylogeny-⊙Bootstrap;Replications1000;RandomSeed64238OK;开始计算-得到结果;(4)Image-CopytoClipboard-粘贴至Word文档进行编辑。此外,Subtree中提供了多个命令可以对生成的进化树进行编辑,Mega窗口左侧提供了很多快捷键方便使用;View中则给出了多个树型的模式。下面只介绍几种最常用的:Subtree-Swap:任意相邻两个分支互换位置;-Flip:所选分支翻转180度;-Compress/Expand:合并/展开多个分支;-Root:定义外群;View-Topology:只显示树的拓扑结构;-Tree/BranchStyle:多种树型转换;-Options:关于树的诸多方面的改动。2.3TREECON打开ClustalX,File-Loadsequences-jc-a.aln,File-SaveSequenceas…(Format-PHYLIP;Savefromresidue-1to末尾;Savesequenceas:C:\temp\jc.phy);打开TREECON程序,(1)Distanceestimation点击Distanceestimation-Startdistance,打开上面保存的estimationjc.phy文件,SequenceType-NuleicAcidSequence,Sequenceformat-PHYLIPinterleaved,SelectALL,OK;DistanceEstimation-Jukes&Cantor(or,AlignmentKimura)positions-All,Bootstrapanalysis-Yes,Insertions&Deletions-Nottaken,OK;intoaccountBootstrapsamples-1000,OK;运算,等待……Finished-OK。(2)Infertreetopology点击Infertreetopology-Startinferring,Method-Neighbor-joining,treetopologyBootstrapanalysis-Yes,OK.;运算,等待……Finished-OK。(3)Rootunrootedtrees点击Rootunrootedtrees-Startrootingunrooted,Outgrouptreesopition-singlesequence(forced),Bootstrapanalysis-Yes,OK;SelectRoot-X89947,OK;运算,等待……Finished-OK。(4)Drawphylogenetictree点击Drawphylogenetictree,File-Open-(new)tree,Show-Bootstrapvalues/Distancescale。File-Copy,粘贴至Word文档,编辑。TREECON的操作过程看起来似乎较MEGA烦琐,且运算速度明显不及MEGA,如果参数选择一样,用它构建出来的系统树几乎和MEGA构建的完全一样,只在细节上,比如Bootstrap值二者在某些分支稍有不同。在参数选择方面,TREECON和MEGA也有些不同,但总体上相差不大。2.4PHYLIPPHYLIP是多个软件的压缩包,下载后双击则自动解压。当你解压后就会发现PHYLIP的功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。ii,序列数据转变成距离数据后,对距离数据分析的软件。iii,对基因频率和连续的元素分析的软件。iv,把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。v,按照DOLLO简约性算法对序列进行分析的软件。vi,绘制和修改进化树的软件。在此,主要对DNA序列分析和构建系统树的功能软件进行说明。(1)生成PHY格式文件首先用ClustalX等软件打开剪切后的序列文件C:\temp\jc-a.aln另存为C:\temp\jc.phy(使用File-SaveSequences命令,Format项选“PHY”)。用AsBioEdit或记事本打开(2)打开Phylip软件包里的SEQBOOTseqboot.exe:can'tfindinputfile"infile"Pleaseenteranewfilename>C:\temp\jc.phy按路径输入刚才生成的*.PHY文件,显示如下:Bootstrappingalgorithm,version3.6a3Settingsforthisrun:DSequence,Morph,Rest.,GeneFreqs?MolecularsequencesJBootstrap,Jackknife,Permute,Rewrite?BootstrapBBlocksizeforblock-bootstrapping?1RHowmanyreplicates?100WReadweightsofcharacters?NoCReadcategoriesofsites?NoFWriteoutdatasetsorjustweights?DatasetsIInputsequencesinterleaved?Yes0Terminaltypenone1PrintoutthedataatstartofrunNo2PrintindicationsofprogressofrunYesYtoaccepttheseoftypetheletterforonetochangeRNumberofreplicates?10000Settingsforthisrun:DSequence,Morph,Rest.,GeneFreqs?MolecularsequencesJBootstrap,Jackknife,Permute,Rewrite?BootstrapBBlocksizeforblock-bootstrapping?1RHowmanyreplicates?1000WReadweightsofcharacters?NoCReadcategoriesofsites?NoFWriteoutdatasetsorjustweights?DatasetsIInputsequencesinterleaved?Yes0TerminaltypeIBMPC1PrintoutthedataatstartofrunNo2PrintindicationsofprogressofrunYesYtoaccepttheseoftypetheletterforonetochangeYRandomnumberseed(mustbeodd)?5(anyoddnumber)completedreplicatenumber100completedreplicatenumber200completedreplicatenumber300completedreplicatenumber400completedreplicatenumber500completedreplicatenumber600completedreplicatenumber700completedreplicatenumber800completedreplicatenumber900completedreplicatenumber1000上面的D、J、R、I、O、1、2代 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 可选择的选项,键入这些字母后敲回车键,程序的条件就会发生改变。D选项无须改变。J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。R选项让使用者输入republicate的数目。所谓republicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的republicate。当我们设置好条件后,键入Y按回车。得到一个文件outfile:C:\ProgramFiles\Phylip\exe\outfile.重命名outfile→infile。(3)打开dnadist.exeNucleicacidsequenceDistanceMatrixprogram,version3.6a3Settingsforthisrun:DDistance?F84GGammadistributedratesacrosssites?NoTTransition/transversionratio?2.0COnecategoryofsubstitutionrates?YesWUseweightsforsites?NoFUseempericalbasefrequencies?YesLFormofdistancematrix?SquareMAnalyzemultipledatasets?NoIInputsequencesinterleaved?Yes0Terminaltype?1PrintoutthedataatstartofrunNo2PrintindicationsofprogressofrunYesYtoaccepttheseoftypetheletterforonetochangedDDistance?Kimura2-parametermMultipledatasetsormultipleweighs?(typeDorW)dHowmanydatasets?10000Settingsforthisrun:DDistance?Kimura2-parameterGGammadistributedratesacrosssites?NoTTransition/transversionratio?2.0COnecategoryofsubstitutionrates?YesWUseweightsforsites?NoFUseempericalbasefrequencies?YesLFormofdistancematrix?SquareMAnalyzemultipledatasets?Yes,1000datasetsIInputsequencesinterleaved?Yes0Terminaltype?IBMPC1PrintoutthedataatstartofrunNo2PrintindicationsofprogressofrunYesYtoaccepttheseoftypetheletterforonetochangeY选项D有四种距离模式可以选择,分别是Kimura2-parameter、Jin/Nei、Maximum-likelihood和Jukes-Cantor。选项T一般键入一个1.5-3.0之间的数字。选项M键入1000。运行后生成文件C:\ProgramFiles\Phylip\exe\。outfile重命名outfile→infile。(4)打开neighbor.exeNeighbor-Joining/UPGMAmethodversion3.6a3Settingsforthisrun:NNeighbor-JoiningorUPGMAtree?Neighbor-JoiningOOutgrouproot?No,Useasoutgroupspecies1LLower-triangulardatametrix?NoRUpper-triangulardatametrix?NoSSubreplication?NoJRandomizeinputorderofspecies?No,UseinputorderMAnalyzemultipledatasets?No0Terminaltype?1PrintoutthedataatstartofrunNo2PrintindicationsofprogressofrunYes3PrintouttreeYes4Writeouttreesontotreefile?YesYtoaccepttheseoftypetheletterforonetochangemHowmanydatasets?1000Randomnumberseed(mustbeodd)?5Settingsforthisrun:NNeighbor-JoiningorUPGMAtree?Neighbor-JoiningOOutgrouproot?No,Useasoutgroupspecies1LLower-triangulardatametrix?NoRUpper-triangulardatametrix?NoSSubreplication?NoJRandomizeinputorderofspecies?YesMAnalyzemultipledatasets?Yes,1000sets0Terminaltype?IBMPC1PrintoutthedataatstartofrunNo2PrintindicationsofprogressofrunYes3PrintouttreeYes4Writeouttreesontotreefile?YesYtoaccepttheseoftypetheletterforonetochangeY生成文件C:\ProgramFiles\Phylip\exe\。outtree&outfile重命名outtree→intree;outfile→infile。2.4.5打开consense.exeConsensustreeprogram,version3.6a3Settingsforthisrun:CConsensustype?Majorityrule(extended)OOutgrooproot?No,useasoutgroupspecies1RTreestobetreatedasRooted?NoTTerminaltype?1PrintoutthesetsofthespeciesYes2PrintindicationsofprogressofrunYes3PrintouttreeYes4Writeouttreesontotreefile?YesArethesesettingscorrect?RTSettingsforthisrun:CConsensustype?Majorityrule(extended)RTreestobetreatedasRooted?YesTTerminaltype?IBMPC1PrintoutthesetsofthespeciesYes2PrintindicationsofprogressofrunYes3PrintouttreeYes4Writeouttreesontotreefile?YesY生成文件C:\ProgramFiles\Phylip\exe\。outtree重命名outtree→jc.tre。2.4.6打开TreeView打开C:\ProgramFiles\Phylip\exe\。以下操作参照前述详细说明即可。jc.tre
本文档为【构建系统进化树的方法步骤Read】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
吴迪差人
暂无简介~
格式:pdf
大小:251KB
软件:PDF阅读器
页数:11
分类:
上传时间:2023-05-24
浏览量:0