ubuntu系统下借助trinity软件将cleandata数据进行拼接组装,此步骤运行需要附加工具,bowtieT和samtoolsV0.1.19用CD-HIT-EST软件进行进一步组装去重得unigenes;在ubuntu系统下运行OrthoMCL对全基因组进行聚类
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
和同源基因查找,但对于RNA-SEQ组装后的转录本,EST数据,要加上HAMSTR这个软件,在此步骤中需要建本地管理数据库,以mysql为例,另外安装mcl软件,并安装和配置orthomcl软件;安装orthomcl数据库的
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
。首先,进入mysql数据库,新建一个名为orthomcl的数据库,然后,使用orthomclInstallSchema命令在数据库中创建一些表,这些表的名字则是orthomcl.config.template配置文件中指定的5个名称;创建orthomcl的输入文件,orthomcl的输入文件为fasta格式文件;过滤序列。对compliantFasta文件夹中的序列进行过滤,允许的最短的protein长度是10,stopcodons最大比例为20%;生成了两个文件goodProteins.fasta和poorProteins.fasta两个文件;对goodProteins.fasta中的序列进行BLAST。下载最新版本的Blast+,和最新版本的OrthoMCLDB的protein序列,将OrthoMCLDB的protein序列加上gooProtein.fasta中的序列合到一起做成一个biast+的数据库。然后对基因组的蛋白质序列进行比对;将similarSequences.txt载入到数据库中。对上一步biast的结果进行处理,从而得到序列的相似性结果,以用于导入到orthomcl数据库中。compliantFasta文件夹中包含下载下来的OrthoMCLDB的所有蛋白质数据的文件orthomcl.fasta;将similarSequences.txt载入到数据库中;寻找成对的蛋白质;将数据从数据库中导出;使用mcl进行对pairs进行聚类;对mcl的聚类结果进行编号;将得到的各个物种的直系同源基因用MEGA建树。