© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 卷 第 期
年 月
生命科学 ,
,
酿酒酵母基因组学研究进展
周 璐 李越中
‘
李
山东大学生命科学学院微生物技术国家重点实验室
健
济南
摘 要 酿酒酵母是第一个完成基因组测序的真核生物 , 在基因组序列信息研究上取得了重大的进展 ,
并且成为后基因组研究的主要模式材料 , 在基因功能 、 转录组 、 蛋白质组等方面获得了许多重要的成果 ,
为高等生物 , 以及人基因组的研究提供了很好的借鉴 , 并为深入认识酵母以及生命的进化提供了基本的
信息 。
关键词 酵母 , 基因组 , 后基因组
分类号
阳吼 乞乞 。
孔 一
’
, 罗
,
,
, 爬 葱
, ,
一 , , , ,
,
就
即饥 艺 , , 一
基因组学 于 年 由
首创 , 至今已发展为一专门的学科领域 ,
包括全基因组的序列
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
、 功熊分析和 比较分析 ,
是结构 、 功能和进化基因组学交织的学科 。 作为第
一个也是 目前唯一完成测序的真核生物 —酿酒
酵母 , 二 ‘‘ 成为功能基因组学
研究的主要模式材料 。 在基因
功能分析 、 转录组 、 蛋白质组
等几个层次上取得飞速的发展 。 另一方面 ,
真核生物 、 细菌 、 古菌 三界重要生物基
因组测序的完成 , 也促使了比较基因组学
的产生 。 本文对酿酒酵母基因组学
的研究进展进行综述 。
酵母基因组的序列信息
基因组 酿酒酵母基因组于 年 月完
成测序 。 序列分析显示 , 基因组有 个 , 理
论上能编码长于 个氨基酸蛋 白质的
。但其中 个目前尚不能确定是否
可以翻译成蛋白质 。 因此认为基因组中存在
个可编码蛋白质的基因 , 即基因组内约 序列
是 。 酿酒酵母基因组只有 编码蛋白质
的基因 主要编码核糖体蛋白质 含小的内含子 ,
每 就有一个编码蛋 白质的基因 , 比其他真核
生物更简单 。 如线虫基因组每 可有一个编码
蛋白质的基因 人基因组约为 或更长 。 其他
酵母 , 如非洲粟酒裂殖酵母由于约 基因有内
含子 , 基因组每 有一可编码蛋 白质的基因
。 这
可能反映了酿酒酵母的许多基因是可转座元
编码的反转录酶产物 的拷贝 。
除 外 , 酵母基因组还包括在染色体
上相邻排列的约 个核糖体 基因 ,
收稿 日期 一 一
通讯联来人
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
生命科学 第 卷
个分布在 条染色体 除州 上的核 内小
基因和 个分散分布的 基因 。
染色体 序列分析显示 , 酵母染色体上交替
分布许多大范围的 一 丰富区和 一 贫瘩区 ,
相应地反映了基因密度的变化 。 在染色体 工上 ,
碱基组成的周期性还与染色体臂的重组频率平行 。
丰富的 “ 波峰 ” 区正是染色体臂中部的高度重
组区 , 而 “ 波谷 ” 常常是极少发生重组的着丝粒和
端粒序列 。 酵母菌各染色体上的重组频率也不同 。
小染色体 , , , 的重组频率高于整个基因
组的平均水平 达 倍 。 推测这些
小染色体的高水平重组频率保证了每次成熟分裂时
至少发生一次交换并正确分开 。 染色体 的序
列长度仅为 , 有 个 , 而两端各有
的基因贫痔区 。 等认为这些末端区域
可能起 “ 填充物 ” 的功能 , 以增加序列大小 , 提高
稳定性 。
遗传冗余与基因组进化 一般认为遗传上的
冗余主要体现在染色体的末端 , 如酵母染色体
的两个末端序列不仅 自身同源 , 而且与 和 染
色体的末端区域也有较高的同源性 。 此外 , 与糖发
酵有关的基因 、 和 均有一些与端
粒结合的拷贝 , 但这些拷贝并非都能
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
达 ’ 。
酿酒酵母基 因组 的绝大多数序列 可转录为
, 似乎表明它含有相对少的冗余信息 。 但用随
机破坏基因组的方法研究表明 , 基因组中
的信息是在含葡萄糖的丰富培养基上生长所不需要
的 , 如当染色体 上的 个 只有 个是必
需的 而 个基因中也只有 种表型 。 为什么这
个小小的基因组会有如此高的冗舍性呢 ’一种解释
是一些重要基因的重复可能提供了一种选择优势
也可能许多基因的功能是为应付实验室中未遇到的
生存挑战的 。 此外 , 染色体 和 明显是由同
一个祖先进化而来的 。 遗传冗余现象是研究新功能
进化的很好素材 。 由于除抗生素产生菌外的其他生
物的次级代谢均被大大忽视了 , 因此新基因的功能
更可能是参与那些至今未涉足研究的 、 属于非组成
型的调控 , 如活性的时序控制 、 凋亡等 。 揭示冗余
的真正本质将是阐明基因功能的主要挑战之一 。
基因功能的分析
序列 同源 比较法 基 因功能分析的简单
方法是利用计算生物学进行序列相似性搜索 。
£ 。 , 提供了有关
酵母的基因组序列 、 基因产物 、 突变株表型和相关
的文献 。 一般一个新 与搜索到的有意义的
匹配有以下四种情况 能预测新基因的生
化 、 生理功能 , 如酵母染色体 上的
与大肠杆菌 一 合成酶 。 可确定基因
产物的生化功能 , 但无法揭示其生理功能 , 如染色
体 上发现的五种新的蛋白激酶 。 匹配基因
的功能未知 , 如染色体 工上的 和与之匹
配的非洲爪蟾的 蛋白 、 线虫和人的某种新基
因 。 由此也表明序列信息的价值只有通过有效的实
验分析才能更好地实现 。 序列匹配但功能不匹
配 , 如与固氮细菌 匹配的酵母染色体 上的
。 乳酸杆菌 、 大肠杆菌和枯草芽抱杆菌等
也有同样的同源物 , 但并不固定分子 。 进一步
研究表明 , 蛋 白是一种依赖磷酸毗哆醛的氨
基酸转移酶 。 等利用序列相似性搜索找到了
酿酒酵母所有编码细胞核糖体蛋白的 个基因 ,
其中 个基因有重复 。 目前已有 个编码
蛋白质的酵母基因的功能通过序列相似性搜索被确
认 , 占可能编码蛋白基因的 。
基因功能的实验分析 采用系统基因敲除方
法 ‘ , 目前已获得了
约 个功能未知的新蛋白基因的单基因缺失或
破坏的突变株 表 。 这些几乎全是 “ 孤儿 ”
基因 。 此外由于遗传冗余的存在 , 以及研究
基因间相互作用的需要 , 构建多基因缺失突变株也
是必要的 , 并且已有相应的方法 ‘ 。 等
对基因缺失或破坏时不能产生可辨别的表型
变化的边缘效应 进行了分析 , 为
功能分析的实验
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
思路提供重要的启示 “ 】。 这
些研究方法赋予酵母被遴选为研究真核细胞普遍功
能的材料的优势 , 并为更高等生物的基因组 “ 功能
图谱 ” 的绘制提供了模式与工具 。
转录水平的研究
微列阵 确定基因组中每个基因的
生物学角色 , 理解整个基因组如何作为一个整体在
自然环境中发挥功能 , 是基因组全序列测定完成后
即将面对的一个艰巨任务和 巨大挑战 。 尽管一个细
胞 中蛋白质丰度的调节决不仅仅是其 的调
节 , 但细胞类型或状态的所有不同与差异均与基因
的 水平相关联 。
等 ‘ 利用商业化的一套引物对 ,
扩增 了酵母的所有 , 再将近 个独立
的 序列 用 一简单 的 自动印刷装置 印到玻
片上 , 构建了酵母菌的 微列 阵 。 将培养不
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 期 周 璐等 酿酒酵母基因组学研究进展
同时间的酵母制备荧光标记的
,
与
微列 阵杂交 。 列 阵中每一元件的不 同荧光 的荧
光 强度即显示 不 同细胞 中 的相对 丰度
。 利用 微列阵分析酵母在葡萄糖培养
基上生长时 , 由厌氧转向有氧代谢的二次生长转
型中基因表达对环境变化的反应 , 结果不仅描绘
出代谢途径中功能 已知基因表达水平的变化 , 揭
示代谢途径本身的一种重新编程过程 , 还观察到
了许多未知基因表达模式的变化 。 此外 ,
采用的另一种简单的控制调控因子活性的方法是
过量表达编码它的基因 】。
介
压
,
次
“ 一 , ,,
万,
“ 一 , ,,
,
“ 一 , ,, ,,
城
“ , ,,
,
“ , ,,,
,
“ 一 , ,,,
矛矛 人
“ 一 , ,,,,,,
、气
“““““ 一 , ,,,,,,
压压
有效囊括酵母所有基因的 微列 阵的建
成 , 为在基因组范围内探索基因的表达模式提供
了一种经济实用的工具 。 大约 个月时间即可完
成 多个基因的扩增 , 日就可把它们印刷到
个微列阵上 。 即使是简单的实验 , 也能产生大
量的信息 。 这一策略在药物筛选中也有实际应用的
价值 。 即用 微列阵确定药物作用的靶基因突
变所导致的基因表达模式特征 , 再用 微列阵
筛选可重复再现所需表达模式特征的化合物 。
与酵母转录组的构建 一个生物体的
表型很大程度上是由其表达的基因决定的 。 转录组
可看作是基因组与表型之间 “ 动态 ” 联系的纽带 。
多年前 一 杂交方法曾对基因表达的模
式进行了大致的分析 , 并估计了每个细胞中转录本
的数目。 但这些数据仅提供了有限的信息 】。 基因
表达的系列分析 罗 ,
可以快速 、 详细分析成千上万个转录本 , 并
且不需要为每个转录本准备杂交用的探针 , 就可以
提供基因表达的定量信息 。 年 等
将 用于酿酒酵母转录组的构建 。
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
生命科学 第 卷
为了最大限度地显现参与细胞正常生长和细胞
周期进程的基因 , 的酵母菌 文库
来 自三种状态的细胞 指数期 、 期和 期 , 共
获得 个转录本的标签 个来 自指数
期 , 个来 自 期 , 个来 自 期 。
这些标签中
, 有 个可与酵母基因组 个
基因精确匹配 , 占已鉴定有功能的 个基因的
个基因 个与线粒体基因组匹配
个与 拜 质粒匹配 。 定量杂交法测得
在每个细胞有 士 个拷贝 【 。 而指数期的
文库有 个拷贝 细胞 , 期和 期
也有相似的表达水平 拷贝 细胞 。 上述表
明 , 两种方法有较好的一致性 。
三种生理状态细胞中基因的表达有惊人的相似
性 , 只有少于 的基因差异显著 , 故 标签的
总和可用于分析基因表达的全局模式 。 另外 , 有将
近 个未预测功能的 ,
的表达可被 检测到 , 其中 仅
在 期的细胞中表达 , 是三种状态中表达丰度变化
最大的转录本 大于 倍 。 对酵母转录组的分析
使得对细胞的 组分有了一种独特的认识 。 与
预期的结果一致 , 拷贝数大于 的转录本大多数是
参与能量代谢和蛋白质合成的酶 , 并且在三种状态
下表达水平近似 关键的转录本 , 如那些编码
复制所需的酶的基因 和 , 着丝粒蛋
白 。和 , 还有许多其他蛋白 , 平均每
个细胞中仅一个或几个拷贝 。 这也许反映了酵母对
丰度有着严谨的控制机制 。
表达的信息与位置信息相结合 , 产生染
色体水平上的表达图谱 。 尽管少数基因在物理图谱
上十分接近并有相似的高表达水平 , 但在任何一条
染色体上似乎并没有成簇的特别高或特别低表达水
平的区域 。 全部的转录本在各染色体上是平均分布
的 , 染色体总的转录本水平与其大小有大致的线性
相关关系 “ 。 构建的染色体表达图谱提供了
描述基因表达水平及其在基因组上位置的“ 目录 ” 。
比较不同生理状态下基因的表达模式 , 可以了解各
种进程中重要的基因 , 找出酵母正常营养生长所需
的最小化的一套基因 , 以及那些对特定的环境刺激
做出反应或处于特殊进程时才表达的基因 。
等 ” 确定了原核生物细胞生活所需的最低限
度为 个基因 。 对酵母转录组的详细分析 , 以及
对其他生物转录组的研究 , 最终也会产生真核细胞
生活所需的最低限度基因数 。
蛋白质组 的研究
酿酒酵母基因组测序工作的完成意味着第一次
获得真核细胞的全蛋白质组成为可能 。 与功能已知
的蛋白质间的序列相似性比较可以鉴定酵母蛋白组
约 的蛋白质的生化功能 , 但并不能提供其扮演
生物学角色的信息 。 可以说 , 计算生物学的方法可
为实验提供指导 , 但仍需要用实验方法确定蛋白质
的生物学功能 。
通过计算机对预测的保守性蛋白质按其功能进
行了划分 , 酵母细胞蛋白质组中 用于代谢
用于能量的产生与贮存 用于 复制 、 修
复和重组 用于转录 用于翻译 。 总共
有 个蛋白质与胞内物质运输有关 个蛋白
是结构蛋白 。 近 个转录因子 川 , 以及 个
一级 、 二级的转载蛋白被鉴定 。 然而 , 以上数据
仅包括有意义的同源区中已发现的酵母蛋白质 。
采用双向凝胶电泳分析可以获得所有酵母蛋白
质组分 【“‘ 。 各个蛋白质由于电荷和分子大小的差
异而被分开 , 获得了 到 个斑点 。 从原理
上讲 , 这种方法不仅能显示出蛋白质的数量 , 还能显
示其经历的翻译后修饰 。 但它有两个不足 许多
转至膜上的蛋 白质难以重新溶解 重复性差 ,
不同实验室很难重复出一致的结果 。 质谱仪
, 方法通过两种基本技术一 激
光解吸附 和 电喷雾 能够准确测得生物大分
子的分子量 , 而这些分子量的数据与数据库中的蛋
白质可以直接进行匹配分析 , 并且电喷雾 还能
产生纯肤的部分序列信息 , 但 应用于大规模的
分析工作中尚需一些时间 , 限制在于如何自动地 、 明
确地鉴定蛋白质 。 欧洲分子生物学实验室
和西雅图华盛顿大学都在积极进行这方面的工作 。
全面了解酵母蛋白质组将为研究人的更加复杂
的蛋 白质组提供模式 。 人类遗传疾病中可检测到的
近半数蛋 白质与酵母蛋 白质有氨基酸顺序的相似
性 , 。 显然
人类基因组中许多蛋白质在酵母蛋白质组中是找不
到的 , 但可以合理地推测出大多数酵母蛋白质在人
蛋白质组中有相应的同源物 。 从而依据与酵母蛋白
质组的成员之间结构功能上的等同性对人的蛋白质
进行分类 。 除序列比较外 , 也可以借助酵母蛋白质
组确定新发现的人类基因的功能 , 或通过遗传损伤
的酵母与人 克隆群的互补作用来分析人的新
基因功能 啤 。 这一研究也会促成一个 “ 最小化酵
母 ” 的诞生 , 并在实验室内复合培养基上生长 , 而
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 期 周 璐等 酿酒酵母基因组学研究进展
剩余的基因可以用人或病毒的序列所替代 。 由于这
样一个菌株的活性会绝对依赖于异源基因 , 故为筛
选抗肿瘤 、 抗病毒药物提供了一个强有力的工具 。
比较基因组学
断言酵母基因组
计划
项目进度计划表范例计划下载计划下载计划下载课程教学计划下载
最显著的发现莫
过于 多个功能未知的 “ 孤儿 ” 基因 。 这些 “ 孤
儿 ” 基因至今没有功能已知的同源物 。 功能未知的
新蛋白在寄生生物体中相对少些 , 而 自由生活生物
竟有 、 。 这些都表明对一个生物体来说 ,
整个基因组的测序完成只是理解与描述该生物体特
征的开始 , 需要研究基因功能的新技术 、 新方法的
发展与创新 。 作为第一个完成测序的真核生物 , 其
基因组序列的公布无疑是比较基因组学上的一个里
程碑 , 意味着可在生命三界系统即真核生物 、 细菌
和古菌的范围内进行基因组的比较 。
随着一些生物基因组测序工作的完成 , 基因比
较研究领域出现了几个论题 是否对所有生物体来
说都存在一组共同的核心基因呢 每种生物体是否
都可当作 “ 模式系统 ” 来研究 多细胞的动物 、 植
物也是按着达尔文模式演绎着进化的历程 , 还是另
有其他模式 对这些属于生物信息学问题的解决方
法 , 一种是全局性的基因组与基因组的比较 基于
精细的计算 , 一种是系统对系统的比较 基于专家
的精细分析 。
等采用全局性策略对三界生物 , 即真核
生物 二 夕 , 。 二 。 葱 , 古菌 对已
。。 葱 和细菌 对剐 夕 夕 ‘ ‘。二 、 对军
叩 , 爪 刀 。二 、 万“ ‘葱 研。
、
及 勺 夕。 ‘, 基因组
的直向同源基因簇 ,
进行了分析 阳 。 研完显示这几种生物有
个共同的 。 它们代表了这几种生物的一组核
心基因 , 当然并不代表完整的核心基因 。 与预期的结
果吻合 , 古菌与真核生物之间有一定数量的
在细菌基因组中无明显的代表物 , 而细菌的 个
在古菌和真核生物中缺乏代表物 。 此外 , 酿
酒酵母的孤儿基因 , 似乎是酵母独有的 。 如此少的
共同基因和大量的独有基因 , 使人怀疑酿酒酵母或
大肠杆菌作为模式生物的合理性 。
等 阳 对已完成测序的七种基因组 来
自五个主要的系统发育种系 所编码的蛋白质进行
比较 , 描绘出 簇 , 包括来自个体的直向
同源基因蛋白或平行进化同源基因 。 可
以说 , 为功能基因组 、 进化基因组的分析构
建了一个框架 。 如果一种蛋 白质在进化上与另一种
蛋 白质相关 , 那么由其中一种蛋白质的功能可以推
断出另一种的功能 , 其准确程度取决于两者进化上
的距离远近 。 检测蛋白质间的进化联系以一级结构
上氨基酸序列的比较较为简单 , 但形态 比较的
结构数据更精细 , 更有说服力 。 即使由于进化历程
中序列变得难以识别 , 其形态上的相似性仍可检测
到 。
结 语
酿酒酵母的基因组学研究的飞速进展 , 不但对
认识酵母菌生命的本质提供了丰富的数据 , 而且对
人类基因组计划有重要的模式意义 。 至 年 月
日 , 已完成基因组测序的有 种生物 , 其中真核
生物只有酿酒酵母 种 、 细菌 种 、 古菌 种 即
将完成的有 种细菌和 种古菌 另外正在进行的
有 种原核生物 、 种真核生物
。 随着
测序方法的不断进步与完善 , 基因组研究将成为一
种常规的研究方法 。 这无疑会促进比较基因组学和
进化基因组学的发展 。 人类基因组计划这一浩大的
工程 , 将为人类从本质上认识生命 、 认识 自我 , 以
及利用 自然和改造 自然产生质的飞跃 。
参 考 文 献
, , , 。 饭几 ££
, 一
, ,
葱口污滋 , 一
, , , £ ” ‘
公口泞注 , 一
, , 亡,
一
,
,
一
, , , 。亡 刃“ 乞
记 。。, 一
刃。 ”陀 , 一
, , 一
, , , 。亡 咫 ,
不
从 , , , 亡 ,
一
一 略