首页 生物信息学及常规工具

生物信息学及常规工具

举报
开通vip

生物信息学及常规工具基因组学前沿基因组与信息技术将带来医疗、农业的革命智慧农业精确耕种精确育种精确医疗2013年,农业生物技术公司孟山都以9.3亿美元的天价收购了一家应用机器学习技术预测天气和其他农业必需元素关联性的天气大数据公司ClimateCorporation,开启了应用大数据技术优化全球农业的先河。数据(genomics)方法(bioinformatics)组学(-Omics)相关专业与领域•基因组学:Genomics组学的统称,或基因组测序•功能基因组学:Functionalgenomics基因表达&bu...

生物信息学及常规工具
基因组学前沿基因组与信息技术将带来医疗、农业的革命智慧农业精确耕种精确育种精确医疗2013年,农业生物技术公司孟山都以9.3亿美元的天价收购了一家应用机器学习技术预测天气和其他农业必需元素关联性的天气大数据公司ClimateCorporation,开启了应用大数据技术优化全球农业的先河。数据(genomics)方法(bioinformatics)组学(-Omics)相关专业与领域•基因组学:Genomics组学的统称,或基因组测序•功能基因组学:Functionalgenomics基因表达•比较基因组学:Comparativegenomics•进化基因组学:Evolutionarygenomics•蛋白组学:Proteomics,蛋白质互作PPI•代谢组学:Metabolomics,测量所有的代谢产物•表观遗传组:Epigenomics,组蛋白修饰、DNA甲基化•宏基因组学:Metagenomics,微生物群落•转录组学:transcriptomics基因表达•脂类组学:lipidomics,•免疫组学:Immunomics,•糖组学:glycomics•RNA组学:Rnomics非编码RNA,小RNA美国加州大学戴维斯分校的进化生物学家乔纳森·艾森曾称它为语言的寄生虫“languageparasite”高通量测序推动基因组学发展生物信息相关领域和专业•生物信息学:Bioinformatics基本生物数据、序列处理•计算生物学:ComputationalBiology算法开发•数学生物学:MathematicalBiology数学模型•生物统计学:BiologicalStatistics数量遗传,群体遗传等•系统生物学:SystemsBiology网络构建、数据整合等•合成生物学:SyntheticBiology,细胞合成生物信息要学习什么•初级阶段:Linux命令操作,Perl编程,Python编程,基本生物信息软件Blast,Clustal,各种数据库查询等等•中级阶段:高通量测序数据处理等,专业分析软件,个性化数据分析,基本统计知识,高级编程,R,做图等。•高级阶段:算法开发,软件开发,系统生物学,数据挖掘,人工智能,解决重要科学问题•应用阶段:解决产业问题,例如基因检测,个性化医疗,基因组辅助育种生物信息学研究的 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 和主要工具•数据库查询与搜索:NCBI,Swissport,MaizeGDB,•生物序列比对分析:Blast,Clustal,WuBlast,•基因预测:FgeneSH,GeneMark,•基因组注释:GeneOntology,KEGGpathways,•分子进化、系统发育:Mega,OrthMCL,•高通量测序数据处理:Bowtie,Cufflinks,Tophat,IGV•RNA二级结构预测:RNAfold,miDeep,•蛋白质结构预测:Coils、nnPredict•基因表达数据分析:Cluster,TreeView,TMV•基因网络分析:Cytoscape高通量测序数据分析•测序序列处理:Fastqc•基因组拼接:SOAPdenovo,Trinity•测序数据处理:Bowtie,SAMtools,BEDtools•ChIP数据分析:MACS,PeakFinder•RNA-Seq数据分析:Tophat,Cufflinks,EdgeR•小RNA测序分析:miDeep•基因组可视化:Integratedgenomevisualizer第一部分:常用生物信息工具生物信息软件的种类和目的•http://www.mybiosoftware.com/biology-software-list共1万余款生物信息软件,大多功能重复,或停止开发了•3Dmolecularmodel蛋白质分子三维结构•Alignment/BLAST序列比对•ClusterAnalysis聚类分析•DNA/GenomeAnalysis基因组分析•AssemblyTools基因组拼接•Genetics&Pedigree遗传谱系分析•MicroarrayAnalysis基因芯片分析•Next-GenSequencing测序数据分析•PhylogeneticAnalysis系统发育分析•Plasmid/ChemicalDrawing质粒绘图•ProteinSequenceAnalysis蛋白序列分析•RNAAnalysisRNA分析•SystemBiology&Modeling系统生物学分析•Bio-chemical/Engineering生化、酶动力学分析•BioinformaticsPlatform生物信息平台、综合分析•ImageAnalysis图像分析•Microbiology微生物分析•Miscellaneous其他,文件转换、文本挖掘、计算管理等FASTA和BLASTFASTA使用的是Wilbur-Lipman算法的改进算法,进行整体联配,重点查找那些可能达到匹配显著的联配。虽然FASTA不会错过那些匹配极好的序列,但有时会漏过一些匹配程度不高但达显著水平的序列。使用FASTA和BLAST,进行数据库搜索,找到与查询序列有一定相似性的序列。一般认为,如果蛋白的序列一致性为25-30%,则可认为序列同源BLAST(BasicLocalAlignmentSearchTool,基本局部联配搜索工具)是基于匹配短序列片段,用一种强有力的统计模型来确定未知序列与数据库序列的最佳局部联配。BLAST是现在应用最广泛的序列相似性搜索工具,相比FASTA有更多改进,速度更快,并建立在严格的统计学基础之上。这两个工具都采用局部比对的方法Blast的六个子程序•BLASTP是蛋白序列到蛋白库中的一种查询。•BLASTX是核酸序列到蛋白库中的一种查询。–先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。•BLASTN是核酸序列到核酸库中的一种查询。•TBLASTN是蛋白序列到核酸库中的一种查询。–与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。•TBLASTX是核酸序列到核酸库中的一种查询。–此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。•PSI-BLAST通过迭代搜索,可以搜索到与查询序列相似性较低的序列基本的BLAST与特制的BLAST全局比对(globalalignment)ACTGCATGCATGGCTACTACTACTACA-TGC----ATGGCTACTACTA-TA-局部比对(localalignment)ACTGCATGCATGGCTACTACTACTACATGGCTACTACTA序列1ACTGCATGCATGGCTACTACTACTAC序列2ATGCATGGCTACTACTATAfasta文件 格式 pdf格式笔记格式下载页码格式下载公文格式下载简报格式下载 >TB1_MAIZE|Transcriptionfactor|TEOSINTEBRANCHED1MFPFCDSSSPMDLPLYQQLQLSPSSPKTDQSSSFYCYPCSPPFAAADASFPLSYQIGSAAAADATPPQAVINSPDLPVQALMDHAPAPATELGACASGAEGSGASLDRAAAAARKDRHSKICTAGGMRDRRMRLSLDVARKFFALQDMLGFDKASKTVQWLLNTSKSAIQEIMADDASSECVEDGSSSLSVDGKHNPAEQLGGGGDQKPKGNCRGEGKKPAKASKAAATPKPPRKSANNAHQVPDKETRAKARERARERTKEKHRMRWVKLASAIDVEAAAASGPSDRPSSNNLSHHSSLSMNMPCAAAELEERERCSSALSNRSAGRMQEITGASDVVLGFGNGGGGYGDGGGNYYCQEQWELGGVVFQQNSRFY>Tb1_japonicaMHPFMDLELEPHGQQLAAAEEDGAGGQGVDAGVPFGVDGAAAAAAARKDRHSKISTAGGMRDRRMRLSLDVARKFFALQDMLGFDKASKTVQWLLNMSKAAIREIMSDDASSVCEEDGSSSLSVDGKQQQHSNPADRGGGAGDHKGAAHGHSDGKKPAKPRRAAANPKPPRRLANAHPVPDKESRAKARERARERTKEKNRMRWVTLASAISVEAATAAAAAGEDKSPTSPSNNLNHSSSTNLVSTELEDGSSSTRHNGVGVSGGRMQEISAASEASDVIMAFANGGAYGDSGSYYLQQQHQQDQWELGGVVYANSRHYC序列名称以>开始第二行是序列如何本地运行blast•比较几百条、几千条序列•ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/•ncbi-blast-2.2.30+-win64.exe•ncbi-blast-2.2.30+-x64-linux.tar.gz•Database.seq目标序列数据库,例如30000个水稻CDS序列•Query.seq查询序列,例如60条序列格式化数据库–i输入文件,-p是否为蛋白数据库还是核酸运行blast-p选择程序–i输入文件,-d数据库文件-o生成结果,-eevalue,cutofffasta格式Blast高级选项:根据比较目的而定例如寻找完全一致的序列,严格参数;寻找近缘物种同源序列:较严格参数;寻找orthologs,寻找paralogs,参数都要不一样有时候还要选择是比较蛋白质还是核酸直系同源和旁系同源•同源蛋白质(homolog)进一步划分为直系同源(ortholog)和旁系同源(paralog)•Ortholog:不同物种之间的同源性蛋白•Paralog:同一物种基因复制而来。BLATvs.Blast•Blat,全称TheBLAST-LikeAlignmentTool•BLAT是将一个序列定位到基因组上geneagainstgenome•Blast是从一个数据里寻找同源序列geneagainstgenesblatdatabase.seqquery.seq–oresult.psl多序列比对http://www.clustal.org/命令行版本XGUI版WWeb版Clustalx2(windows,MACS)Generatetreefile*.phor*.phb,*.aln,tobeviewedbyFigTreeorothertreeviewprogramorastheinputforMEGAforadvancedanalysisFigTreetoviewthephylogenetictreeSeaView4(alignmentandtreeanalysis)MEGA系统发育树构建方法•MEGA:MolecularEvolutionaryGeneticsAnalysis–AligningSequences–EstimatingEvolutionaryDistances–BuildingTreesfromSequenceData–TestingTreeReliability–WorkingWithGenesandDomains–TestingforSelection–ManagingTaxawithGroups–ComputingSequenceStatistics–BuildingTreesfromDistanceData–ConstructingLikelihoodTrees–EditingDataFiles–ConstructingaTimeTree(ML)RNA二级结构预测tRNALongnon-codingRNAmicroRNAmRNA3’UTRhairpinRNA二级结构分析根据吉布斯自由能预测MinimumfreeenergyMFE:生物数据库类GeneOntology•Geneontologywww.geneontology.org•GeneOntology(GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。•建立一套适用于基因功能描述的同一term•为基因功能提供同一的注释条目和分类标准•方便于查询基因,和基因功能注释•注意:GO的term只描述概括性的功能,不代表该基因的真正的生物学功能•主要用于基因组的初步注释•整合来自不同物种的蛋白信息•判定蛋白的结构域•从文献中获得基因http://amigo.geneontology.org/amigoSearchGenesandgeneproductsregulates_closure:GO:0048831GeneOntology(GO)分析EachgenewillbeassignedwithaseriesGOgroupsthatcanbedownloadedfromgeneannotationwebsiteSWISS-PROT蛋白注释数据库TCP转录因子的调控域特征用SWISSPROT里的blast功能鉴定其他物种里的同源基因综合性数据库(信息关联好,冗余少)http://plants.ensembl.org/index.html纵列是基因不同的 样本 保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载 (组织、癌细胞)乳腺癌里特异表达的基因肝癌里特异表达的基因前列腺癌里特异表达的基因肝癌乳腺癌肺癌前列腺癌肺癌里特异表达的基因基因表达谱分析http://www.plexdb.org/植物基因表达数据库TB1在玉米不同发育时期和组织表达http://planttfdb.cbi.pku.edu.cn/植物转录因子数据库SearchTB1http://www.genome.jp/kegg/KEGG:KyotoEncyclopediaofGenesandGenomesAuxin合成pathwayPlanthormonesignaltransduction文献阅读
本文档为【生物信息学及常规工具】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
天山书童
暂无简介~
格式:pdf
大小:4MB
软件:PDF阅读器
页数:0
分类:高中语文
上传时间:2019-11-24
浏览量:1