1. “基因组”“蛋白组”“转录组”“代谢组”的异同
基因组:以生物体所有的核酸为研究对象,狭义的基因组定义为生命体的全套DNA,广义的基因组则包含DNA、mRNA、lncRNA等参与到基因表达调控的所有核酸序列。其主要研究手段为基因测序,以华大基因为代表。转录组通常可认为是基因组的简化研究手段,即所有转录本的集合。
蛋白组:生物体基因组所编码的全套蛋白质。鉴于蛋白质表达的时空特异性,各组织器官或者特定亚细胞结构器(如线粒体、叶绿体),甚至是外泌蛋白,也可以成为一个蛋白组。所以蛋白质组是信号转导、分子发育最为直接的手段。其主要研究手段为生物质谱,在国内以牟合蛋白为典型。
代谢组:生物体内源性代谢物质的动态整体,通常只涉及相对分子质量约小于1000的小分子代谢物质。因其与蛋白质组一样可以很好的指针细胞、机体的生命活动状态,所以常常被用作临床生物标志物的筛选。目前,代谢组的研究也只能借助生物质谱完成。
下面这幅图能够很好的呈现基因、代谢、生命活动间的关系:
Figure. Genomic-Proteomic-Phenotype
2. 基因组学总结
基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响 。基因组学还包括基因组测序和分析,通过使用高通量 DNA测序 和生物信息学来组装和分析整个基因组的功能和结构。基因组学同时也研究基因组内的一些现象如上位性(一个基因对另一个基因的影响)、多效性(一个基因影响多个性状)、杂种优势(杂交活力)以及基因组内基因座和等位基因之间的相互作用等。
功能基因组学 是分子生物学的一个领域,它试图利用基因组项目(如基因组测序项目)产生的大量数据来描述基因(和蛋白质)的功能和相互作用 。功能基因组学侧重于基因转录、翻译和蛋白质-蛋白质相互作用的动态变化,与基因组提供的DNA序列或结构等静态信息截然相反。功能基因组学试图从基因、RNA转录本和蛋白质产品三个水平上回答有关DNA功能的问题。功能基因组学研究的一个关键特征是它们对这些问题的全基因组方法,通常涉及高通量方法,而不是传统的“个案基因”方法。
基因组学的一个主要分支仍然关注于对各种生物体基因组的测序,但全基因组的知识为 功能基因组学 关注各种条件下 基因表达 的模式创造了可能。涉及到的最重要的工具是芯片技术和生物信息学 。
试图描述由给定基因组编码的每个蛋白质的三维结构 。这种基于基因组的方法允许通过实验和建模相结合方法高通量进行蛋白结构鉴定。结构基因组学与传统结构预测的主要区别在于,结构基因组学试图确定基因组编码的每一种蛋白质的结构,而不是专注于一种特定的蛋白质。随着全基因组序列的公开,通过实验和建模相结合的方法可以更快完成 蛋白质结构预测 ,特别是由于大量测序基因组和以前解析蛋白质结构的公开,使得科学家可以根据已有同源物的结构对蛋白质结构进行建模。
结构基因组学 涉及到大量的结构鉴定方法,包括利用基因组序列的试验方法、基于已知同源蛋白质的序列或结构同源性基础上的建模方法、或基于没有任何已知结构同源性蛋白质的化学和物理特性的建模方法。与传统的结构生物学相反,结构基因组学来确定的 蛋白质结构 常常(但并不总是)先于对其功能的了解。这对结构生物信息学提出了新的挑战,比如要从蛋白质的三维结构中确定其功能。
表观基因组学 是研究表观基因组,即生物体中所有表观修饰的遗传物质的学科 。 表观遗传修饰 是对细胞DNA或组蛋白的可逆修饰,在不改变DNA序列的情况下影响 基因表达 。两个最具特征的表观遗传修饰是 DNA甲基化 和组蛋白修饰。表观遗传修饰在基因表达和调控中起着重要作用,并参与许多细胞过程,如分化/发育和肿瘤发生。直到最近,通过基因组高通量分析,才可能在全基因组范围研究 表观遗传学
宏基因组学 是研究直接从环境样品中提取的遗传物质的元基因组的学科 。宏基因组学也称为环境基因组学、 生态基因组学 或群落基因组学。传统的微生物学和微生物基因组测序依赖于培养的克隆培养物,而早期的环境基因测序克隆了特定的基因(通常是16S rRNA基因),从而获得自然群体的多样性。这些工作表明,绝大多数微生物的多样性被基于菌落培养的方法所遗漏。宏基因组使用“散弹枪”测序或大规模平行 焦磷酸测序 ,可以无偏好地获得样本群体中所有微生物成员的基因信息。由于宏基因组学能够揭示此前被隐藏的 微生物多样性 ,它为观察微生物世界提供了一个强有力的工具,其结果有可能彻底改变对整个生命世界的认知。
基因组学在许多领域包括医学、生物技术、人类学和其他社会科学等得到了应用。
新一代基因组技术使临床医生和生物医学研究人员能够大幅增加从大规模研究群体中收集的基因组数据量。当结合新的信息学方法将多种数据与基因组数据进行集成后,研究人员就能够更好地理解 药物反应 和疾病的遗传基础 。例如,All of Us 研究计划旨在收集100万参与者的基因组序列数据,并成为精准医学研究平台的重要组成部分。
基因组知识的增长使得 合成生物学 的应用越来越复杂。2010年,克雷格·文特尔研究所的研究人员宣布,成功部分合成了一种细菌-来源于 生殖支原体 基因组的合成支原体。
自然资源保护主义者可以利用基因组测序收集到的信息,更好地评估物种保护的关键遗传因素,如种群的 遗传多样性 ,或个体是否为隐性遗传疾病的携带者。通过使用基因组数据来评估进化过程的影响,并检测特定种群的变异模式,自然资源保护主义者可以制定计划,在不像标准遗传学方法那样留下许多未知变量的情况下,帮助特定物种。
基因组大小是一个拷贝的单倍体基因组中DNA碱基对的总数。
基因组大小与 原核生物 和低等 真核生物 的形态复杂性呈正相关 。然而,在软体动物和上述所有其它高等真核生物之后,这种相关性已不再存在 ,主要是因为重复DNA的缘故。
生物体所有细胞都源自同一个单细胞,因此它们应该具有相同的基因组。但是,在某些情况下,细胞间会出现差异。细胞分裂期间的 DNA复制 和环境诱变剂的作用都可导致体细胞发生 突变 。在某些情况下,这种突变会导致癌症,因为它们会导致细胞更快地分裂并侵入周围组织。 在减数分裂期间, 二倍体细胞 分裂两次以产生单倍体生殖细胞。在此过程中,重组导致遗传物质从 同源染色体 重新洗牌,因此每个配子具有独特的基因组。
3. 比较概述基因组学、转录组学、蛋白质组学和代谢组学的概念、研究方法、优缺点及应用设想
组学omics,研究的是整体. 按照分析目标不同主要分为基因组学,转录组学,蛋白质组学,代谢组学。
基因组学研究的主要是基因组DNA,使用方法目前以二代测序为主,将基因组拆成小片段后再用生物信息学算法进行迭代组装。当然这仅仅是第一步,随后还有繁琐的基因注释等数据分析工作。
转录组学研究的是某个时间点的mRNA总和,可以用芯片,也可以用测序。芯片是用已知的基因探针,测序则有可能发现新的mRNA,
蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。
代谢组分析的代谢产物,是大分子和小分子的混合物,主要也是用液相和质谱。
总而言之,这些技术都想从全局找变量,都是一种top-down的研究方法,原因很简单:避免‘只缘身在此山中’的尴尬。
但因为技术局限,都各有缺点,尤其是转录组和蛋白组数据,基本上颠覆了以前一直认为的mRNA水平能代表蛋白水平的观念,因为这两组数据的重合度太低。
所以目前很多研究都开始使用交叉验证方法。
无论如何,都需要对数据进行分析,有经验的分析往往能化腐朽为神奇。