如何做序列的blast分析

如何做序列的blast分析 * 内容提要 Blast简介 Blast相关问题 Blast的应用示例 Blast简介 BLAST 是NCBI中用来将一个蛋白质或DNA序列和各种数据库中的其他序列进行比对的主要工具。 BLAST搜索是研究一个蛋白质和基因的最基本的方法之一。 Blast具有非常广泛的运用确定特定的蛋白质或核酸序列有哪些已知的直系同源或旁系同源序列确定哪些蛋白质和基因在特定的物种中出现确定一个DNA或蛋白质序列身份发现新基因确定一个特定基因或蛋白质有哪些已经发现了的变种...

* 内容提要 Blast简介 Blast相关问题 Blast的应用示例 Blast简介 BLAST 是NCBI中用来将一个蛋白质或DNA序列和各种数据库中的其他序列进行比对的主要工具。 BLAST搜索是研究一个蛋白质和基因的最基本的方法之一。 Blast具有非常广泛的运用确定特定的蛋白质或核酸序列有哪些已知的直系同源或旁系同源序列确定哪些蛋白质和基因在特定的物种中出现确定一个DNA或蛋白质序列身份发现新基因确定一个特定基因或蛋白质有哪些已经发现了的变种研究可能存在多种剪切方式的表达序列标签寻找对于一个蛋白质的功能和/或结构起关键作用的氨基酸残基 * 主要的blast程序 * * 主要的blast程序程序名查询序列数据库搜索方法 Blastn 核酸核酸核酸序列搜索逐一核酸数据库中的序列 Blastp 蛋白质蛋白质蛋白质序列搜索逐一蛋白质数据库中的序列 Blastx 核酸蛋白质核酸序列6框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。 Tblastn 蛋白质核酸蛋白质序列和核酸数据库中的核酸序列6框翻译后的蛋白质序列逐一比对。 TBlastx 核酸核酸核酸序列6框翻译成蛋白质序列，再和核酸数据库中的核酸序列6框翻译成的蛋白质序列逐一进行比对。 * 具体步骤 1. 登陆blast主页 http://www.ncbi.nlm.nih.gov/Blast.cgi 2. 根据已有序列类型和搜索目标，选择合适的blast程序 Blastn，Blastp，Blastx等 3. 填写表单信息选择要搜索的数据库，并修改一些可选参数等 4. 提交任务 5. 查看和分析结果具体步骤输入要分析的序列 * 三种主要的输入方式剪切然后粘贴DNA或蛋白质序列使用FASTA格式的序列简单地使用索引号码(如一个RefSeq 或GenBank (GI)的序号) 具体步骤选择要搜索的数据库（blastp） * Nr数据库合并了若干个主要的蛋白质或DNA数据库数据库有相同的序列，但nr 数据库只收录一个典型和常用的数据库具体步骤选择要搜索的数据库（blastn） * 具体步骤调整可选参数 1. Limit by Entrez Query * 可以用任何一种范围限定词来限定NCBI BLAST搜索的范围具体步骤调整可选参数 2. Max target sequences：比对之后显示的最大的比对序列的数目 * 具体步骤调整可选参数 3. Expect threshold：期望值E是得分大于或等于某个分值S的不同的比对的数目在随机的数据库搜索中发生的可能性。 * 默认值是10，表示随机出现得分等于或高于比对得分S的期望数为10个。当将期望选项值调小时，返回的数据库搜索结果将变少，匹配被搜索到的概率也会变小。增大E值将返回更多的结果。具体步骤调整可选参数 4. Word size（字段长度） * 蛋白质搜索，默认值是3 核酸序列搜索，默认值是11 改变字段长度可以影响搜索精度和速度具体步骤调整可选参数 5. Matrix （打分矩阵） * 在一次BLAST搜索中，可以尝试使用几种不同的打分矩阵高PAM值取代矩阵适合于差异较大的序列低BLOSUM62值的取代矩阵适合于差异较大的序列具体步骤调整可选参数 6. Compositional adjustments，默认选择，一般来说可改善E值的统计计算和提高灵敏度(减少返回的假阳性结果的数目) * 具体步骤调整可选参数 7. Filter （选择性过滤条件）, 过滤器将锁定诸如组成低复杂序列区(如Alu序列)，用一系列N（任意碱基）替代这些程序 * 过滤对绝大多数序列是有利的，可以帮助避免那些假的数据库匹配但某些情况下可信的匹配也会过滤掉具体步骤 Blast输出结果上部 BLAST搜索的类型、关于查询内容和所搜索的数据库的描述以及一个分类连接可以将结果按照物种进行分类中部数据库中序列与查询序列相匹配的项的列表，分为图像和列表两种描述方式下部一系列的两两序列比对， 4种衡量的分数：比特分数、期望分数、一致性百分比、正性(相似性百分比) * 具体步骤 Blast输出结果 * 具体步骤 Blast输出结果 * 每一个条带表示数据库中的一个与查询序列相匹配的蛋白质或核酸序列，被标以不同颜色表示亲缘关系的远近(根据比对的分)，最接近匹配用红色表示。 High scores low e values * 具体步骤 Blast输出结果 Score 使用打分矩阵对匹配的片段进行打分，这是对各对氨基酸残基（或碱基）打分求和的结果，一般来说，匹配片段越长、相似性越高则Score值越大。 E value 在相同长度的情况下，两个氨基酸残基（或碱基）随机排列的序列进行打分，得到上述Score值的概率的大小。E值越小表示随机情况下得到该Score值的可能性越低。具体步骤 Blast输出结果，改变格式 * BLAST搜索策略总图示例 * *

                    本文档为【如何做序列的blast分析】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

你可能还喜欢

最新资料

资料动态

专题动态

壹笑先生

致力于服务广大学子、教师、社考人员等一份学习的资料！

格式：ppt

大小：1MB

软件：PowerPoint

页数：0

分类：工学

上传时间：2019-03-25

浏览量：59

热点搜索

微电影《在路上》剧本二年级上册美术试题【精品】幼儿个案观察记录表16 宿舍楼建筑施工组织设计上海市三年级上学期数学期中考试试卷(精编) 二级军士长工资待遇,二级军士长是什么级别 04-11年课程与教学论试题[资料] 法制宣传教育重要节日一览健康素养知识问答题库及参考答案投标文件商务标及技术标格式高中作文700字劳动者的作文范文最美的劳动者 2019-2020学年高中数学第三章基本初等函数（Ⅰ）3.2 对数与对数函数 3.2.1 对数及其运算教案新人教B版必修1 柱下条形基础及十字交叉基础 ppt课件饲料级磷酸氢钙之饲料级磷酸氢钙的生产工艺简介.doc 微电影《在路上》剧本二年级上册美术试题【精品】幼儿个案观察记录表16 宿舍楼建筑施工组织设计上海市三年级上学期数学期中考试试卷(精编) 二级军士长工资待遇,二级军士长是什么级别 04-11年课程与教学论试题[资料] 法制宣传教育重要节日一览健康素养知识问答题库及参考答案投标文件商务标及技术标格式高中作文700字劳动者的作文范文最美的劳动者 2019-2020学年高中数学第三章基本初等函数（Ⅰ）3.2 对数与对数函数 3.2.1 对数及其运算教案新人教B版必修1 柱下条形基础及十字交叉基础 ppt课件饲料级磷酸氢钙之饲料级磷酸氢钙的生产工艺简介.doc