❶ 比较概述基因组学、转录组学、蛋白质组学和代谢组学的概念、研究方法、优缺点及应用设想
组学omics,研究的是整体. 按照分析目标不同主要分为基因组学,转录组学,蛋白质组学,代谢组学。
基因组学研究的主要是基因组DNA,使用方法目前以二代测序为主,将基因组拆成小片段后再用生物信息学算法进行迭代组装。当然这仅仅是第一步,随后还有繁琐的基因注释等数据分析工作。
转录组学研究的是某个时间点的mRNA总和,可以用芯片,也可以用测序。芯片是用已知的基因探针,测序则有可能发现新的mRNA,
蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。
代谢组分析的代谢产物,是大分子和小分子的混合物,主要也是用液相和质谱。
总而言之,这些技术都想从全局找变量,都是一种top-down的研究方法,原因很简单:避免‘只缘身在此山中’的尴尬。
但因为技术局限,都各有缺点,尤其是转录组和蛋白组数据,基本上颠覆了以前一直认为的mRNA水平能代表蛋白水平的观念,因为这两组数据的重合度太低。
所以目前很多研究都开始使用交叉验证方法。
无论如何,都需要对数据进行分析,有经验的分析往往能化腐朽为神奇。
❷ 转录组学的介绍
转录组学(transcriptomics),是一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。简而言之,转录组学是从RNA水平研究基因表达的情况。转录组即一个活细胞所能转录出来的所有RNA的总和,是研究细胞表型和功能的一个重要手段。

❸ 转录组学有哪些实现手段,数据类型及其格式是什么
研究主要指具体的研究方法、手段和工具。每一课题都要有相应的研究方法,一般可以采取综合的方法,或者以一种方法为主,其它方法为辅。这样有利于收集多方面的信息,可以得到可靠的结论。下面介绍课题中常用的几种研究方法。
❹ 转录组数据分析RNA-seq
转录组学(transcriptomics)的研究对象是全基因组尺度下所有转录本(transcript),即转录组(transcriptome)
将荧光标记的cDNA制成微阵列探针来测定样本中特定转录本含量。又称为 基因芯片(Gene Chip)、微阵列(Microarry)。
获取表达量的步骤:
提取RNA -> 反转录 (->扩增)->标记->杂交->扫描->获得原始数据
局限性:
• 只能检测已知或;确定性的序列
• 无法检测新发现的,未放置到芯片上的基因
• 有部分探针的信号可能会收到非特异性杂交或个体序列差异的影响
基于高通量二代测序技术的转录组学研究方法。
特点:
高通量、低成本;不依赖已知转录本探针,可以测全转录组;对于低表达丰度的转录本灵敏
度高;以reads数量腐酸表达,比芯片的荧光信号更为精确。
应用和最新进展
依据文库要求检查完整性分值,如果不合格将不适合建库测序。一些特殊文库对RNA提取要求很高,如全长转录组文库,需要特殊提取流
程保证RNA 完整性。
需要的数据:参考基因组数据fasta、GFF注释信息、双端测序的fastq文件
我这里用的是普通栽培稻( Oryza sativa L.)的参考基因组和、GFF文件和SRR17439319数据。
参考步骤: https://blog.csdn.net/sunchengquan/article/details/79781366
注意:配置时,需要在bin目录下执行 ./vdb-config --interactive ,然后弹出一大堆乱七八糟的之后,按X退出即可。再执行./fastq-mp,若没有报错,而是帮助信息的话即可以使用。
测序数据分析前需要经过数据预处理,并检查数据GC含量、序列重复成俗、是否存在接头等。
在质控后,再质检一次,对比看看有什么不同。
将 reads 匹配到参考基因组或转录组的相应位置上
• 非剪接比对:转录组
Bowtie、BWA
• 剪接比对:参考基因组
STAR、HISAT、Topha
对鉴定SNP做了优化: GSNAP、MapSplice等
① 建立基因组索引
②利用注释文件比对
没有注释文件的比对方法
③ SAM 文件处理
使用 samtools 对 SAM 文件排序并转化为 BAM 文件。samtools是一个用于操作sam和bam文件的工具合集,包含有许多命令。
④比对结果可视化
比对结果使用 IGV 、Genome Maps 和Sacant 等可视化查看。
例如:IGV 通过读入基因组和注释信息以及BAM 文件展示比对结果。
需要额外添加 BMA 的索引: samtools index test_sorted.bam test_sorted.
⑤比对结果评估
比对结果评估工具:RSeQC、Qualimap
计算FPKM
-p 线程数
-G 参考基因组注释
-e 只估计已给参考基因组注释的基因丰度
-A 基因丰度估计输出文件
-o 输出文件
❺ 转录组高通量测序技术可以解决什么生物学问题
转录组学的研究对象包括mRNA和非编码RNA等。新一代高通量测序技术可以全面快速地获得特定细胞或组织在某一个状态下几乎所有转录本的序列信息和表达信息,从而准确地分析基因表达差异、基因结构变异、筛选分子标记(SNPs或SSR)等生命科学的重要问题。基因表达谱测序是直接对某一物种或特定细胞在某一功能状态下产生的mRNA进行高通量测序,可以用来研究基因的表达差异情况。该技术结合了转录组测序建库的实验方法,与转录组测序相比,基因表达谱测序要求的读长更短,测序通量更小,但仅可用于基因表达差异的研究。转录组测序是RNA水平测序,相当于DNA水平的基因组测序,是一个框架。表达谱主要研究的是基因表达量的变化,上调或下降。先要有转录组或是基因组才可以做表达谱,否则没有Ref做参考。转录组测序和表达谱测序其实都是通过高通量测序技术进行的,转录组测序主要是针对没有参考基因组(即基因组未完成测序)的物种,侧重于获得你材料的全部转录组信息;而表达谱则侧重于检测各个基因的表达量。