导航:首页 > 研究方法 > 蛋白质组学分析方法

蛋白质组学分析方法

发布时间:2022-10-03 17:47:51

1. 蛋白质组学主要包括哪些分析技术及各自特点

为探究生物进程的分子机制,需要确定介导这个过程的蛋白质-蛋白质间的相互作用。研究蛋白质间相互作用的主要技术总结如下:一、酵母双杂交系统酵母双杂交系统是当前广泛用于蛋白质相互作用组学研究的一种重要方法。其原理是当靶蛋白和诱饵蛋白特异结合后,诱饵蛋白结合于报道基因的启动子,启动报道 基因在酵母细胞内的表达,如果检测到报道基因的表达产物,则说明两者之间有相互作用,反之则两者之间没有相互作用。将这种技术微量化、阵列化后则可用于大 规模蛋白质之间相互作用的研究。在实际工作中,人们根据需要发展了单杂交系统、三杂交系统和反向杂交系统等。Angermayr等设计了一个SOS蛋白介 导的双杂交系统。可以研究膜蛋白的功能,丰富了酵母双杂交系统的功能。此外,酵母双杂交系统的作用也已扩展至对蛋白质的鉴定。二、噬茵体展示技术在编码噬菌体外壳蛋白基因上连接一单克隆抗体的DNA序列,当噬菌体生长时,表面就表达出相应的单抗,再将噬菌体过柱,柱上若含目的蛋白,就会与相应抗体 特异性结合,这被称为噬菌体展示技术。此技术也主要用于研究蛋白质之间的相互作用,不仅有高通量及简便的特点,还具有直接得到基因、高选择性的筛选复杂混 合物、在筛选过程中通过适当改变条件可以直接评价相互结合的特异性等优点。目前,用优化的噬菌体展示技术,已经展示了人和鼠的两种特殊细胞系的cDNA文 库,并分离出了人上皮生长因子信号传导途径中的信号分子。三、等离子共振技术表 面等离子共振技术(Surface Plasmon Resonance,SPR)已成为蛋白质相互作用研究中的新手段。它的原理是利用一种纳米级的薄膜吸附上“诱饵蛋白”,当待测蛋白与诱饵蛋白结合后,薄 膜的共振性质会发生改变,通过检测便可知这两种蛋白的结合情况。SPR技术的优点是不需标记物或染料,反应过程可实时监控。测定快速且安全,还可用于检测 蛋白一核酸及其它生物大分子之间的相互作用。………………
详细资料请参考:on
http://proct.bio1000.com/101969/

2. 蛋白质组学样品前处理的方法

要回答这个问题,首先需要理解样品前处理需要达到的目的:减少人为降解和修饰,并且尽量多的释放肽段。

整个过程可以分为以下流程:先从组织、体液或细胞中提取蛋白质,拿到蛋白混合溶液(根据你的研究目的,可以对蛋白先做分离,或者不分离),接下来还原烷基化(还原的过程是将蛋白的二硫键打开,然后烷基化可以修饰巯基,防止游离的巯基再生成二硫键)处理,并酶解成肽段。

1,样品的收集与保存

组织样品

1) 对于人体手术切除的组织,有条件的话,最好用PBS(磷酸缓冲盐溶液,作为溶剂,起溶解保护试剂的作用)取完之后直接去血。如果没有去血,可以-80℃液氮保存,干冰运输。

2)对于小鼠、大鼠、兔子之类的组织样品,建议用灌流的方式来去血,尤其是像肝脏、胃、心脏这类大的组织,可以直接用灌流的方式去血,去得最干净。其次的方案是在后期剪碎的时候去血。

细胞样品

常规实验,建议收到5*1E6~1E7个细胞以上的样品量(有些实验需要的样品量会少一些,后面会详细讲)。细胞取好后,首先用PBS清洗一下细胞表面,因为大部分培养基里面都含有血清,这部分血清得洗干净了先~

如果是做分泌蛋白研究的话,首先用PBS清洗样品几次,再用条件培养基(不含有血清的培养基)进行培养,根据细胞情况,大概12个小时以后,离心,去掉细胞碎片,取上清,就能提取到分泌蛋白了。

血清样品

1)血浆样品:可以通过医院常用的EDTA抗凝管进行收集,收集到的血浆会呈悬浮状态,离心去掉血细胞。

2)血清样品:现在大部分研究都直接针对血清样品,它的成份更简单,没有凝集素,没有大量的血细胞,针对性会更强。收集血清样品时,直接把血清吸到管子里,室温静置让它凝结,上清黄色部分就是血清样品啦。
2,研磨或超声破碎样品,为了减少人为操作引入的修饰,通常会准备大量的冰,进行冰上的操作。同时还需要加入蛋白酶抑制剂,防止在操作过程中蛋白被样品中自带的蛋白酶降解掉。

3,充分熔接蛋白质,如果蛋白没有充分溶解,能提取到的蛋白就会很少,达不到研究目的。

4,充分解旋蛋白质,通常,蛋白质都是成球状的稳定状态,解旋蛋白质就是将球状蛋白中的二硫键打开,让它形成链状结构,以便进行下一步酶切。

5,酶解蛋白质,一般会用多种酶对蛋白质进行酶解。

6,去除杂质,我们要知道,质谱是一个非常灵敏的仪器,它检测的是多肽的质荷比。所有的盐类,以及所有会进行离子化的杂质,都会干扰到肽段的检测。所以我们会要求进入质谱之前的蛋白样品非常干净。在蛋白水平及肽段水平都会进行去除杂质的步骤。

更详细的,下次再聊~

3. 关于蛋白质组学检测结果分析求助

1.蛋白质鉴定:可以利用一维电泳和二维电泳并结合Western等技术,利用蛋白质芯片和抗体芯片及免疫共沉淀等技术对蛋白质进行鉴定研究。
2.翻译后修饰:很多mRNA表达产生的蛋白质要经历翻译后修饰如磷酸化,糖基化,酶原激活等。翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。
3.蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的生物分析/配基-受体结合分析。可以利用基因敲除和反义技术分析基因表达产物-蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。Clontech的荧光蛋白表达系统就是研究蛋白质在细胞内定位的一个很好的工具。
4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质-蛋白质相互作用。
在基础医学和疾病机理研究中,了解人不同发育、生长期和不同生理、病理条件下及不同细胞类型的基因表达的特点具有特别重要的意义。这些研究可能找到直接与特定生理或病理状态相关的分子,进一步为设计作用于特定靶分子的药物奠定基础。 不同发育、生长期和不同生理、病理条件下不同的细胞类型的基因表达是不一致的,因此对蛋白质表达的研究应该精确到细胞甚至亚细胞水平。可以利用免疫组织化学技术达到这个目的,但该技术的致命缺点是通量低。激光捕获显微切割LCM(Laser Capture Microdissection)技术可以精确地从组织切片中取出研究者感兴趣的细胞类型,因此LCM技术实际上是一种原位技术。取出的细胞用于蛋白质样品的制备,结合抗体芯片或二维电泳-质谱的技术路线,可以对蛋白质的表达进行原位的高通量的研究。很多研究采用匀浆组织制备蛋白质样品的技术路线,其研究结论值得怀疑,因为组织匀浆后不同细胞类型的蛋白质混杂在一起,最后得到的研究数据根本无法解释蛋白质在每类细胞中的表达情况。虽然培养细胞可以得到单一类型细胞,但体外培养的细胞很难模拟体内细胞的环境,因此这样研究得出的结论也很难用于解释在体实际情况。因此在研究中首先应该将不同细胞类型分离,分离出来的不同类型细胞可以用于基因表达研究,包括mRNA和蛋白质的表达。
LCM技术获得的细胞可以用于蛋白质样品的制备。可以根据需要制备总蛋白,或膜蛋白,或核蛋白等,也可以富集糖蛋白,或通过去除白蛋白来减少蛋白质类型的复杂程度。相关试剂盒均有厂商提供。 蛋白质样品中的不同类型的蛋白质可以通过二维电泳进行分离。二维电泳可以将不同种类的蛋白质按照等电点和分子量差异进行高分辨率的分离。成功的二维电泳可以将2000到3000种蛋白质进行分离。电泳后对胶进行高灵敏度的染色如银染和荧光染色。如果是比较两种样品之间蛋白质表达的异同,可以在同样条件下分别制备二者的蛋白质样品,然后在同样条件下进行二维电泳,染色后比较两块胶。也可以将二者的蛋白质样品分别用不同的荧光染料标记,然后两种蛋白质样品在一块胶上进行二维电泳的分离,最后通过荧光扫描技术分析结果。
胶染色后可以利用凝胶图像分析系统成像,然后通过分析软件对蛋白质点进行定量分析,并且对感兴趣的蛋白质点进行定位。通过专门的蛋白质点切割系统,可以将蛋白质点所在的胶区域进行精确切割。接着对胶中蛋白质进行酶切消化,酶切后的消化物经脱盐/浓缩处理后就可以通过点样系统将蛋白质点样到特定的材料的表面(MALDI-TOF)。最后这些蛋白质就可以在质谱系统中进行分析,从而得到蛋白质的定性数据;这些数据可以用于构建数据库或和已有的数据库进行比较分析。
LCM-二维电泳-质谱的技术路线是典型的一条蛋白质组学研究的技术路线,除此以外,LCM-抗体芯片也是一条重要的蛋白质组学研究的技术路线。即通过LCM技术获得感兴趣的细胞类型,制备细胞蛋白质样品,蛋白质经荧光染料标记后和抗体芯片杂交,从而可以比较两种样品蛋白质表达的异同。Clontech最近开发了一张抗体芯片,可以对378种膜蛋白和胞浆蛋白进行分析。该芯片同时配合了抗体芯片的全部操作过程的重要试剂,包括蛋白质制备试剂,蛋白质的荧光染料标记试剂,标记体系的纯化试剂,杂交试剂等。
对于蛋白质相互作用的研究,酵母双杂交和噬菌体展示技术无疑是很好的研究方法。Clontech开发的酵母双杂交系统和NEB公司开发的噬菌体展示技术可供研究者选用。
关于蛋白质组的研究,也可以将蛋白质组的部分或全部种类的蛋白质制作成蛋白质芯片,这样的蛋白质芯片可以用于蛋白质相互作用研究,蛋白表达研究和小分子蛋白结合研究。 Science,Vol. 293,Issue 5537,2101-2105,September 14,2001发表了一篇关于酵母蛋白质组芯片的论文。该文主要研究内容为:将酵母的5800个ORF表达成蛋白质并进行纯化点样制作芯片,然后用该芯片筛选钙调素和磷脂分子的相互作用分子。
最后有必要指出的是,传统的蛋白质研究注重研究单一蛋白质,而蛋白质组学注重研究参与特定生理或病理状态的所有的蛋白质种类及其与周围环境(分子)的关系。因此蛋白质组学的研究通常是高通量的。适应这个要求,蛋白质组学相关研究工具通常都是高度自动化的系统,通量高而速度快,配合相应分析软件和数据库,研究者可以在最短的时间内处理最多的数据

4. 蛋白质组学蛋白信号通路分析怎么

蛋白质组学蛋白信号通路分析怎么做
不过信号通路最好还是从蛋白层面进行,分析可能的4条信号通路,做相关蛋白的western blot,检测下游蛋白常见的如磷酸化修饰silicare(站内联系TA)信号通路太复杂了,还是文献吧,当然是 diea了livee(站内联系TA):tiger07:xuec(站内联系TA)多看些英文文献吧,很多有关报道的
看多了你就有思路了
所以还是勤奋点儿吧tongyanna(站内联系TA)我还真不明白啊xp198766(站内联系TA)帮LZ顶,最近我想也知道类似问题的答案,不知道有没有高手会KEGG的,能不能写一点总结出来啊……期待啊……lwiaanngg(站内联系TA)如果你知道大概的途径,可以用上面说的RT-PCR等手段
如果你不知道,你可以使用蛋白microarray/DNA microarray来测定相对变换量sqhnsd(站内联系TA)先做相关的表型观察,看看表型符合那个通路相关的现象,然后做WB、蛋白质相互作用等试验进一步去检测具体的机制如何。但是如何去做,还必须通过看文献才能帮助你解决问题。charlie9(站内联系TA)信号通路的变化,一般与mRNA的变化关系不大。它一般通过关键蛋白分子的修饰有关,因此RT-PCR一般不能说明问题。Western-blots检测被修饰的蛋白分子为好。

5. 蛋白质组学主要包括哪些分析技术及各自特点

双向凝胶电泳
双向凝胶电泳的原理是第一向基于蛋白质的等电点不同用等电聚焦分离,第二向则按分子量的不同用SDS-PAGE分离,把复杂蛋白混合物中的蛋白质在二维平面上分开。由于双向电泳技术在蛋白质组与医学研究中所处的重要位置,它可用于蛋白质转录及转录后修饰研究,蛋白质组的比较和蛋白质间的相互作用,细胞分化凋亡研究,致病机制及耐药机制的研究,疗效监测,新药开发,癌症研究,蛋白纯度检查,小量蛋白纯化,新替代疫苗的研制等许多方面。近年来经过多方面改进已成为研究蛋白质组的最有使用价值的核心方法。

等电聚焦
等电聚焦(isoelectric focusing,IEF)是60年代中期问世的一种利用有pH梯度的介质分离等电点不同的蛋白质的电泳技术。等电聚焦凝胶电泳依据蛋白质分子的静电荷或等电点进行分离,等电聚焦中,蛋白质分子在含有载体两性电解质形成的一个连续而稳定的线性pH梯度中电泳。载体两性电解质是脂肪族多氨基多羧酸,在电场中形成正极为酸性,负极为碱性的连续的pH梯度。蛋白质分子在偏离其等电点的pH条件下带有电荷,因此可以在电场中移动;当蛋白质迁移至其等电点位置时,其静电荷数为零,在电场中不再移动,据此将蛋白质分离。

生物质谱
生物质谱技术是蛋白质组学研究中最重要的鉴定技术,其基本原理是样品分子离子化后,根据不同离子之间的荷质比(M/E)的差异来分离并确定分子量。对于经过双向电泳分离的目标蛋白质用胰蛋白酶酶解(水解Lys或Arg的-C端形成的肽键)成肽段,对这些肽段用质谱进行鉴定与分析。目前常用的质谱包括两种:基质辅助激光解吸电离-飞行时间质谱(MALDI-TOF-MS)和电喷雾质谱(ESI- MS)。

飞行时间质谱
MALDI 的电离方式是 Karas和Hillenkamp于1988年提出。MALDI的基本原理是将分析物分散在基质分子(尼古丁酸及其同系物)中并形成晶体,当用激光(337nm的氮激光)照射晶体时,基质分子吸收激光能量,样品解吸附,基质-样品之间发生电荷转移使样品分子电离。它从固相标本中产生离子,并在飞行管中测定其分子量,MALDI-TOF-MS一般用于肽质量指纹图谱,非常快速(每次分析只需3~5min),灵敏(达到fmol水平),可以精确测量肽段质量,但是如果在分析前不修饰肽段,MALDI-TOF-MS不能给出肽片段的序列。

电喷雾质谱(ESI-MS)
ESI- MS是利用高电场使质谱进样端的毛细管柱流出的液滴带电,在N2气流的作用下,液滴溶剂蒸发,表面积缩小,表面电荷密度不断增加,直至产生的库仑力与液滴表面张力达到雷利极限,液滴爆裂为带电的子液滴,这一过程不断重复使最终的液滴非常细小呈喷雾状,这时液滴表面的电场非常强大,使分析物离子化并以带单电荷或多电荷的离子形式进入质量分析器。ESI-MS从液相中产生离子,一般说来,肽段的混合物经过液相色谱分离后,经过偶联的与在线连接的离子阱质谱分析,给出肽片段的精确的氨基酸序列,但是 分析时间一般较长。 目前,许多实验室两种质谱方法连用,获得有意义的蛋白质的肽段序列,设计探针或引物来获得有意义的基因。随着蛋白质组研究的深入,又有多种新型质谱仪出现,主要是在上述质谱仪的基础上进行改进与重新组合。

6. 4. 蛋白质组学数据分析基础(1)

说明:此篇笔记系2016-2017年由克里克学院与康昱盛主办的蛋白质组学网络大课堂整理而成,侵删。该课程由上海易算生物科技有限公司CEO沈诚频博士所授。

话说,蛋白质质谱从十几年前就形成了固定的数据结构和格式。现在常用的搜库格式,比如mascot的mgf,从十年前就基本固定下来。

到目前为止,质谱界的数据格式因为仪器的不同,有几个不同的大类:

这些数据格式的扩展名有一定的差别,且原始数据里包含的内容也有所不同。具体包含哪些重要的信息,稍后我们还会详细讲到。

数据分析,最终都是为了拿到一个可信的结果。所以,我们在讲具体的分析原理之前,先得来聊聊,我们做一次高通量的蛋白质定性、定量实验,以及搜库鉴定及定量分析等步骤,对结果报告有哪些质控要求。

首先,我们做完实验,在拿到下机数据的时候,大多数小伙伴们都会把数据放到各种搜库软件中,比如Mascot或者Thermo的Proteome Discoverer,导入原始数据,设定一些搜库参数,就可以得到结果了。

但是,作为一个严谨的实验方案设计来说,在分析的过程中,是需要对自己的数据有一个前期质控的,这样可以帮助大家判断数据分析结果的可靠性。所以说,基本的质控可以帮助我们对实验结果进行一个预判。

举个例子。

我们打开一个实验的下机数据,就可以预判我们的样品中是否发生了高分子塑料的PEG污染,有没有超高丰度的蛋白,或者有没有被严重的盐类污染。这些数据都可以从原始数据的可视化视图中看到。

不同的质谱软件,打开原始数据的方式不同,但这些信息都是可见的。另外,当两次实验搜索到的蛋白数量差异比较大时,也可以从TIC图来判断其原因。此外还可以判断分离的效率,以及是否出现喷雾中断等情况。

对于蛋白鉴定的结果,或者绝大多数的搜库算法,都要求对结果进行FDR控制,以及unique peptide的控制等等。如果我们要发表这些数据,绝大多数的期刊杂志也都会要求提供这些质控的信息。

那么,问题就来了,为什么要做这样的要求呢?

事实上,我们做好了质控,就能够看到一个总的鉴定的比例。比如说像常规的定量实验,用的最多的是iTRAQ。

举个例子。

假设总蛋白数只有2446个,算是比较少的,而总的谱图数是53万张,那么它的谱图鉴定率在当前条件下是32%(有些质控软件可以直接报告谱图鉴定率,比如Scaffold),我们可以判断当前的实验并没有出现重大的问题,鉴定率不高主要是因为存在高丰度蛋白,而这个后续可以进行详细的查看。

对于定量实验,不管我们使用的是SILAC,iTRAQ还是Label Free,都需要对定量结果进行准确性控制(详细内容,后续课程还会展开讲解)。一般来说,我们需要用相应的软件和统计方法来进行质控。

经过这几步的判断之后,可以得到一个初步的结果,比如说谱图数量是否和之前的结果差不多,质量精度及鉴定率如何,高丰度蛋白的存在与否,是否受污染,分离效率如何,定量是否准确,标记效率是否ok,等等,这些信息都可以得到。这样,我们最终可以得到一个准确可靠的蛋白质组学鉴定或定量结果用于后续的分析了。

那么,如何通过查看原始数据来进行初步质控呢?

首先,我们从原始数据出发,可以看到下图(以Data-dependent-acquisiton数据依赖性扫描为例),是从色谱出来的一个LC分离得到的TIC图,其中的信号采集都是在质谱中完成的,它其实就是将色谱逐渐通过喷雾的方式进入质谱的那些信号进行逐一的扫描,然后在其中挑选高强度的谱峰进行二级碎裂。

关于LC分离,以及TIC图的详细介绍,请参考上一节课的内容:

下图就是色谱离子流图的某个瞬间。横坐标是质荷比,纵坐标是信号强度。这个瞬间进入色谱的有这样一些信号,信号强度最高的是质荷比为477.31的肽段,其他一些肽段也可以进行查看。

这是我们在打开质谱的下机数据所能看到的最直观的结果。我们需要了解的是,这只是我们所有结果的某一个瞬间,某一个scan。这一个scan是否能够反映整个结果的好坏是不确定的,所以后续我们需要进一步的展开。

对于质谱来说,在这一步会自动选择其中一个比较强的峰,比如说477,它会进行一个动态的排除,这也是Data-dependent-acquisiton的一个重要参数。就是说,在多少秒之内,这么强的一个峰如果一直反复出现的话,那么在后续的扫描过程中,我们不去再对它进行进行MS2碎裂了。

比如说如图的477.31,我们质谱仪器记录时发现前面已经对它做过二级碎裂了,那么我们就有可能选择另外一个比较弱的谱峰。比如552.80,将它进行二级碎裂。

我们再来看一眼二级谱峰,如下图,就是对我们全长的进入质谱的肽段信息进行打碎,得到相应的B/Y离子,如下图,这些在后面我们会进行详细的讲解。

下图是Thermo质谱的原理示意图(由Thermo工程师提供)。这是QE的原理图,我们先在绿色的范围内进行一次full scan的mass扫描,然后判断当前选择的离子信号强度,以及在最近的几十秒钟之内是否对其进行扫描过。

如果没有,那么在紧接着的循环过程中,我们会对之前30秒之内(假设当前的仪器速度可以达到10个MS)没有扫描过的最强的十个谱峰进行二级碎裂,那么质谱就会依次将色谱推进来的喷雾中的肽段进行依次碎裂。

这就是DDA模式基本的原理。我们的数据也是根据这样的一个过程来记录的。

如果将刚才的扫描过程二维展开,可以得到下图,看上去跟二维凝胶电泳图很像吧?横坐标是质荷比,纵坐标是保留时间,而刚才那张图横坐标是保留时间,纵坐标是强度(LC seperation图),所以,此图没有质荷比信息。

我们知道,在进入full scan的MS扫描时是有质荷比信息的。所以简单的讲,上图是将刚才的两张图的信息拼接,然后将整个下机数据所有的瞬间都进行了一个拼接,由于维度的限制,因此信号强度信息无法再展示了。

但在此图中用了颜色的深浅来表示保留时间,颜色深的就是相对信号较强的肽段。而图中的每一根小线段都代表一个肽段,小线段的长度对应着肽段的保留时间,加上横坐标质荷比的信息,因此通过这张全局纵览图,就能够看到我们这次实验分离的效果如何,有没有PEG、盐、或者其它污染,有没有喷雾中断等情况发生,这些都能在这张图中有一个大致的把握。

因此,这张图对于我们进行数据质控非常有用。不同的软件和仪器有不同的方法来提供这张图。此次举例用的图是由Peaks软件得来的。

我们可以在上图中选定自己感兴趣的部分,画一个小方框,将方框中的内容进行打开放大,就得到了下图我们存储数据的结果形式了。这是在Qual Browser里打开我们的数据看到的结果。

其实这就是将我们的模拟图转换成数据信号,储存在我们的Raw文件中,或者说进一步提取成MGF文件所用到的相关信息。

这里主要包含两大类信息:MS1和MS2的信息,也就是full scan mass和二级碎裂的信息。这两类信息的结构式是一模一样的,都是包含质核比、强度值,以及相对信号强度。

比如说794.03谱峰,相对信号强度是100,也就是在这张谱图中,这是最强的一个峰,信号强度是3558210.8。那么对于我们质谱的搜索来说,一级信息和二级信息都是需要用到的,其中一级信息是首要的,也就是图中MS1部分,是后续搜库的关键信息。而二级谱图的强度信息一般用于定量,也就是说如果不是做SILAC或者非标记定量,这些信息不是最重要的。

另外,第一栏的信息准确性也是非常重要的。比如图上红框内,我们可以得到的信息是,794.03和794.36强度大约差了1.5倍,后面的峰强度差了大约2倍,再看下红框内四个数据的质荷比相差并不大,我们的质谱仪器因此会判断这四个峰非常符合一个肽段的同位素分布(肽段同位素分段的性状,后续将会讲解)。

回到此图,794.03应该是一个肽段,后面三个数据是同一个肽段,这就是我们进行precursor识别的原理。有些时候质谱会识别错误,认为红框上一行的793.69更可能是同位素,这个就需要我们自己进行校正。

质谱在搜集信号的时候,会告诉我们794.03是一个母离子或者说是肽段的谱峰,因此在后续进行MS2碎裂的时候,会挑选这样一个谱峰,以及在质谱中我们会设定相应的窗口去打碎它。因为仅仅设定一个非常小的窗口,可能信号不够。我们会设计比如正负1.5个道尔顿的窗口,把这些信号全部采集进去进行二级碎裂得到二级信号。

现在高分辨质谱中,二级信号也会包含同位素信息,因此数据分析软件需要对这些信息进行有效的处理。

大家可以看到,这样一个例子中,软件记录的是794.03,但实际我们可以通过肉眼观察,793.69跟794.03就只相差0.33~0.34,也是一个三电荷同位素的差值(1除以0.33是3,这就是质荷比中的Z的计算原理)。两者分别的强度271万和355万差别也不是非常大,我们会判断出793.69更可能是零同位素峰(如何判断后面会再讲解)。

我们进行后续数据提取和采集的时候,也就是用了这样的信息来进行分析。我们记录的一级质谱数据,以及二级质谱对应的列表,其中最重要的是m/z和intensity,在一级质谱数据中,强度并不用于蛋白鉴定的打分,但二级质谱数据中的强度值却会被用于打分。

下篇将聊聊同位素的问题,以及如何解读原始谱图包含的信息。

7. 蛋白质组学常用的研究方法

酵母双杂交系统、抗体芯片、LCM技术、mic Solution Inc、SPR技术、色谱分离技术、双相电泳技术、有机质谱等等。
LCM技术获得的细胞可以用于蛋白质样品的制备。
蛋白质样品中的不同类型的蛋白质可以通过二维电泳进行分离。
胶染色后可以利用凝胶图象分析系统成像,然后通过分析软件对蛋白质点进行定量分析,并且对感兴趣的蛋白质点进行定位。
Genomic Solution可以为研究者提供除质谱外的所有蛋白质组学研究工具,包括二维电泳系统,成像系统及分析软件,胶切割系统,蛋白质消化浓缩工作站,点样工作站等;同时还可以提供相关试剂和消耗品。
蛋白质相互作用的研究,酵母双杂交和噬菌体展示技术无疑是很好的研究方法。
LCM-二维电泳-质谱的技术路线是典型的一条蛋白质组学研究的技术路线,除此以外,LCM-抗体芯片也是一条重要的蛋白质组学研究的技术路线。

………………
详细资料请参考:on
http://proct.bio1000.com/101969/

8. 1. 蛋白质组学研究方法概述(上)

说明:此篇笔记系2016-2017年由克里克学院与康昱盛主办的蛋白质组学网络大课堂整理而成,侵删。该课程由上海交通大学系统生物医学研究院助理研究员库鑫博士所授。

大伙儿都知道,蛋白质组学(proteomics),是研究一种细胞或者一种生物体所表达的全部蛋白质。虽说现在基因组测序火得一塌糊涂,但是,我们不要忽略了,蛋白质才是执行生命体功能的基本单元,而且蛋白质都是通过形成各种复合物,组成通路网络,去行使各种生物学功能的!所以,有很多生物学问题只能在蛋白质层面上去研究去探索,而且需要站在系统的层面去考察,比如说:蛋白-蛋白相互作用、蛋白的细胞定位、翻译后修饰、信号通路及代谢通路的调控和功能等。这就是为啥蛋白质组学如此重要啦!

既然重要,科学家们自然是想尽办法来研究了!最开始使用的技术就是传说中的双向凝胶电泳(2-DE),由于分辨率低、蛋白质重叠等各种问题,无论是通量还是准确度,都不尽如人意。当质谱技术兴起以后,就迅速被替代了。

说起质谱技术的诞生,估计很多小伙伴都听过那个着名的diao丝逆袭的段子,讲的就是2002年诺贝尔化学奖得主田中耕一,作为蛋白质谱发明人之一,由于一个不小心在实验时错加了甘油,结果神奇地将质谱技术引入到鉴定生物大分子的应用领域。想想,大到整个人类的科技发展史,小到每个个体的人生,都充满了多少不可思议~

当质谱技术与蛋白质组学碰到了一起,真是天雷引了地火,产生出强烈的化学反应,迅速引爆整个学科的发展!也就十几年的时间吧,蛋白质组学的研究目标从细胞模型、动物模型,到人的体液、组织等人体样本,应用范围的生物复杂度越来越高。研究目的呢,也从最初的肽段序列推导,到多肽和蛋白质的定性定量分析,翻译后修饰,再到如今成为新热点的靶向蛋白质组学,总之,势不可挡啊!

说到靶向蛋白质组学,咱们都知道,一直以来蛋白质组学的应用领域主要是针对基础生物学,比如研究通路、蛋白复合物、互作网络,表征细胞和组织的类型,观察细胞周期内蛋白质的表达等。近年来,由于技术的飞速发展,蛋白质组学开始被用于医学研究和药物研究。比如说药物研究,国内可能用得还不多,但在欧美已经开始越来越广泛。以肝毒性为例,蛋白质组学可以为药物研发前期的肝毒性评估提供研究手段。

那么,怎么将蛋白质组学应用到临床及药物研发中呢?就是需要靶向蛋白质组学技术了!以前,蛋白质组学技术主要用于发现新的未知物,比如肽段、蛋白复合物、蛋白的翻译后修饰等。这部分的应用很广,技术门槛比较低,方法比较通用。但问题是,这种方法思路没办法应对大量的临床样本,可重复性和准确性达不到要求。

于是,靶向分析开始兴起,就是说,分析之前我们就明确知道需要分析的物质是什么,然后把它挑出来,进行一个精确的定量和分析!我们不需要一次性验证成千上万的蛋白,但我们需要在成百上午的样本中验证十几种或者几十种我们关心的蛋白质,而且这些蛋白质常常都是浓度很低的蛋白,用传统的方法基本上只有被遗漏的命(后面我会详细讲为什么会遗漏)。有了靶向技术,对于研究临床诊断的生物标志物,就有了更大的可能和更强的支撑了!

那么接下来,根据老师讲课的思路,我就从定性检测、定量检测和靶向蛋白质组学三个方面来分享下听课的收获。

无论是定性还是定量检测,样品制备是跑不掉的准备工作。用于质谱的蛋白质样品,来源非常广泛,只要你是包含了蛋白质的东西,都可以作为来源。对于复杂的样品,比如人体体液或组织样本,蛋白质的提取及去高峰度,常常需要复杂的精细的处理,而且处理流程根据样本和研究目的的不同而不同。这部分内容呢,第二讲“样品前处理”会详扒,感兴趣的小伙伴可以期待我的下一篇听课笔记吧~

话说,蛋白质的定性检测有两种思路:Bottom-up和Top down。Top down是指从一个完整的蛋白出发,在质谱中进行碎片化处理,通过对碎片分子的检测,推导出蛋白的序列。而在使用中真正占绝大多数是Bottom-up方法,也就是我们常说的shotgun方法,它充分利用了蛋白质自身的特点:可以被特定的酶在特定的位点切断。基本思路是,先用蛋白酶把蛋白序列进行酶切,再针对酶切后的肽段进行鉴定,所以进入质谱的检测对象永远是肽段,再根据肽段序列再推导出蛋白序列。

1. 样本处理 :拿到蛋白来源的各种样本,进行前处理和优化。

2. 蛋白分离 :根据研究需要,用凝胶分离,提取所需的蛋白,或者不分离,全部拿来检测,需要注意去杂质;

3. 酶切 :用序列特异性的酶,对蛋白进行酶切;

4. 肽段分离 :酶切后的肽段进入HPLC(高压液相色谱),这也就是我们常说的LC-MS中的LC,肽段会因为在色谱柱填料上的保留时间的不同,得到预分离;

5. 电离 :分离后的肽段,加电压使其离子化(ESI);或者用MALDI基质辅助的激光解离,就不需要HPLC的过程;

6. 质谱解析 :将带上电荷的肽段送入质谱,肽段会在磁场中发生偏转(质谱仪的基本原理),在质谱里收集信号,得到谱图。

7. 搜库 :用搜索软件对质谱图进行自动化的分析,得到肽段及蛋白序列信息。

换个角度,对Shotgun方法的流程,我们可以这样来总结:

这里面最关键的一个指标,我们叫Peptide-Spectrum matching(PSM),就是指谱图与肽段的匹配。匹配得越好,则反推出的蛋白就越准确。这个匹配的过程,也就是我们常说的搜库。那么接下来我就来分享一下从课程中学习到的搜库背景知识、搜库工具和算法,以及对搜索结果的评估。

质谱,听上去很高大上,无论有多贵重,都是由三部分组成的:离子源+质量分析器+检测器。

一台质谱可以不止一个离子源\分析器\检测器,可以把几种串联起来,针对不同分析需要来使用。

离子源

我们先来说说离子源。蛋白质谱所使用的ESI(Electrospray ionization)电喷雾离子化,对蛋白质组学来说是一个标志性的发明!因为是直接从液相进行离子化,使它与LC(液相色谱)的联用变得更加容易了,我们可以先用LC将非常复杂的肽段混合物进行预分离,减少每次分析物的复杂度,然后分离的肽段可以直接进入ESI,形成电离喷雾。

那么,ESI喷雾是怎么形成的呢?简单来说,分离柱前端有一个小开口,被分析物根据质量及电荷的不同,依次通过前端的小开口。小开口处加了电压,刚开始,静电力与表面张力相同,当加大静电力使它大于表面张力的时候,液膜破裂,形成无数带电的小液滴,就形成喷雾了。像现在比较新的nanoESI技术,LC的流速就更加慢,离子化的效果也更好。觉得以上描述还不够形象的童鞋,直接看图吧:

质量分析器

说完了离子源,接下来我们来说质量分析器,这是质谱仪里最重要的一部分。我们通常听到的各种质谱仪的名字,就是根据质量分析器的类型来命名的。我们样品中各组分在离子源中发生电离,并经加速电场的作用后,形成离子束,进入质量分析器中。质量分析器将带电离子根据其质荷比加以分离,记录各种离子的质量数和丰度,用于后续定性与定量的分析。

质量分析器有两个主要的技术参数:质量范围和分辨率。质量范围是指是所能测定的质荷比的范围,它决定了咱们能检测到的离子的范围。比如,ESI离子源能产生许多m/z大于3000的离子,如果你选的质量分析器的上限达不到3000,那么3000以上的离子你就检测不出来了。

然而,另一个更为重要的指标,就是质量分析器的分辨率!先上个公式描述:

分辨率=观测的一个质谱峰的质荷比/半峰高处的峰宽(FWHM)

啥意思呢?比如下图中最左边的那个峰,它的质荷比是1,085.55,峰高一半的地方的峰宽值是0.217,于是:

分辨率=1,085.55/0.217=5,000

如果这么讲还是不太明白,那你可以简单理解为,质谱分辨率越高,我们将得到越尖越细的谱峰。你可能会问:谱峰又尖又细的好处是什么?这是个好问题!事实上,分辨率可以表征两个相邻的谱峰在质谱中被区分开的能力。大家通过下图感受一下不同分辨率的质谱仪能给我们多么不同的谱峰图。

图中以Glucagon(胰高血糖素)为例,展示了不同分辨率的质谱仪给出的谱峰。当分辨率是1000时,只能看一个很宽的峰(蓝色);分辨率增加到3000时,峰窄一些(红色),但还感受不到明显的差别;当提高到10000时,很明显能看到,其实这里包含了8个峰(绿色);再提高到30000的时候,半峰宽更窄,两个相邻的峰可以彻底地被分开(黑色)。显然,我们在分辨率为1000或3000,不能准确的检测被分析肽段的精确分子量, 从而导致谱图无法匹配或者发生错配。

不同的质量分析器有不同的分辨率,通常的顺序是:傅里叶变换质谱分辨率最高,但造价太贵;其次是Orbitrap(轨道阱系列),分辨率远远高于其它质谱;再次是TOF(时间飞行质谱);然后是离子阱(Ion Trap);最后是四级杆质谱(Quadrupole)。

这里我多说一句,分辨率高固然好,但价格肯定就贵,选择质谱仪的时候要根据咱们自己的研究目的以及预算范围啦!

二级质谱

然而,要对肽段进行鉴定,一级质谱显然是办不到的,我们没法根据肽段离子m/z的值就推断出这个肽段由哪些氨基酸残基组成(可能的组合非常多),以及序列顺序是怎么样的,对吧?所以,鉴定肽段还需要二级质谱。

什么是二级质谱呢?简单来说,肽段混合物通过一级质谱得到了一级谱图,然后从中选择一个肽段,通过一些方法,比如,与随性气体进行碰撞,把肽段碰碎,得到碎片离子,再形成二级谱图。我们通过观察碎片离子的质量分布来推断肽断的残基组成,最后再反推出蛋白质是什么。上个图,帮助大家理解一下二级质谱是怎么来的。

在上一段,我提到是从一级质谱中“选择”一个肽段进入二级质谱。这里看似讲得云淡风轻,事实上怎么选却是一个很关键的问题!通常选择的方法我们可以叫做“TOP”法(这是我自己起的名字),比如TOP15就是指从一级谱里选前15个高度的峰,每一次分离一个肽段,然后对这个肽段进行扫描,得到二级谱图。

大家发现了没有?如果一个肽段在一级谱图中没有进入TOP15,那它连打二级谱图的资格都没有!原来质谱的世界竞争也是如何残酷!二级质谱能扫描哪些肽段是由一级质谱决定的,所以我们将这种方法称为“数据依赖性采集(DDA, data dependent acquisition)!

明白了吧,DDA这个名字就是这么来的!下次大伙儿再听到有人说DDA,心里不会再一百个问号飞过了吧?

咱们细想一下就不难发现,如果一个蛋白的浓度不够高,也就是说,它的肽段在一级谱图中很难成为那些TOPs,那么它能进入二级质谱的可能性基本上没有。这就是为什么低峰度蛋白很难被鉴定到!这也就是为什么我们在做比如血液这种样品的时候,一定要去除血红蛋白等高峰度蛋白(如果你想鉴定的蛋白不是血红蛋白的话)!

很显然,DDA方法的局限性就摆在那里!这叫想要研究低峰度蛋白的科学家们怎么忍?于是,一种叫做数据非依赖性采集(DIA)的新方法就应运而生了!关于这种方法的原理,下一篇推文会详扒。

我们再通过以下这个图来感受一下一级谱图与二级谱图之间的关系:

比如,第一个时间点,我们先进行MS1扫描,然后选一个峰高的肽段进行MS2扫描,依次类推。在一些扫描速度比较快的质谱仪里,一个MS1谱图可以进行80张MS2的扫描。

鉴定碎片离子

好,我们搞清楚了二级质谱是怎么来的,那么我们怎么根据检测到的离子信息来推测这是什么氨基酸呢?可能你会说,这还不简单么?根据分子量呀!

没错,不同的氨基酸,它的分子量不就是一个简单的值吗?然而,这件事却并没有这么简单,因为这个世界上还存在一个神奇的东西,它的名字叫同位素!

比如说碳元素,最常见的是原子量12的这种,我们叫C12,然而它还有一个同样很稳定的好基友,C13(多一个中子)。于是,我们得考虑到这两种稳定同位素的含量(网络说C13占 1.11%,C12占98.89%),对于一个氨基酸而言,我们就会得到两个不同的分子量:

为啥说平均呢?因为当肽段分子量越大,含有各种同位素的可能性及不同组合就越多,我们如果把每一种组合都算一遍分子量,这样会得到一个长长的list,到时候做谱图匹配时用哪一个值呢?也没谱。所以干脆用一个平均值来表示。

我们通过下表来感受一下各种不同的氨基酸残基的单同位素分子量与平均分子量有多大的区别:

可能你又会问,这两个不同的分子量分别在什么情况下用呢?这里又要说到分辨率了,如果咱们用的是高分辨率质谱仪,不同的同位素峰会被明显地分开,也就是说,谱图里我们能看几个同位素峰,这时我们就可以使用单同位素分子量,可以与相应的单同位素峰准确对应。但在低分辨率质谱仪里,这些峰很可能混在一起,看上去只是一个峰,这种情况下,也没办法,只能用平均分子量去近似一下了。

下面这个图可以很形象地展示出,单同位素分子量与平均分子量在质谱图上差别有多大。在高分辨质谱看来,这完全就是两种不同的离子了。上面我们也说了,根据平均分子量来计算,结果并不准确,但用单同位素分子量来计算,就可以准确对应了。

除了同位素,还有一个因素我们也需要考虑,那就是肽段碎裂进入二级质谱时,可能会形成三种不同的离子类型,这就是我们通常所说的by离子,ax离子和cz离子。

之所以会形成不同的离子对,是因为不同的碎裂方法,造成肽段断裂的位置不同。大伙儿看看上面这个图就明白了。当我们使用CID(碰撞诱导解离)或HCD(High-energy C-trap Dissociation)碎裂时,与惰性气体碰撞的是C-N键这里,C端生成y离子,N端生成b离子,这是二级质谱产生的最常见的离子对了。当我们使用ETD(电子转移解离)碎裂时,因为有一个电子反应的过程,在加上电子后才产生的碎裂,它的断裂位置可能出现在N-C键这里,形成cz离子,而TOF类仪器可能会产生ax离子。

离子类型的信息需要传递给后续的搜库步骤(通常我们在搜库软件中指定了仪器类型,软件就会自动匹配离子类型),计算机需要模拟最可能的碎裂位置,生成对应的理论谱图,然后拿来与实际谱图比对。我们以by离子为例,来看看对一个肽段来说,它可能碎裂成哪些碎片离子:

那么它可能会生成如下这样的谱图:

从谱图上看,这个肽段所有的by离子都检测到了。通常来说,对于丰度不错,长短合适的肽段,在高精度质谱仪上被完整捕获到的情况是很常见的。通常情况下50%-80%的by离子都能被捕获到。

下篇继续讲定性检测里的搜库工具、结果评估,以及定量检测的各种背景知识。

阅读全文

与蛋白质组学分析方法相关的资料

热点内容
幼儿心理发展研究最基本的方法 浏览:50
商业研究方法和人力资源管理问题 浏览:245
帆布包变黄有什么方法解决 浏览:786
轻感冒怎么办速效方法 浏览:9
焦油含量检测方法 浏览:289
草酸用什么方法能够去掉 浏览:224
红参原液的使用方法 浏览:1002
用电脑键盘关机操作方法 浏览:741
牛皮癣运动治疗方法有哪些 浏览:504
喷雾香水使用方法 浏览:683
戒除美沙酮的最佳方法 浏览:14
大池过滤器安装方法 浏览:508
测量方法技术的起源 浏览:363
岗位分析方法的选择依据是 浏览:985
食用铸铁消除内应力最好的方法 浏览:518
测量透镜焦距的方法哪个好 浏览:196
3x97简便计算方法 浏览:557
益节美国氨糖食用方法 浏览:561
飞利浦温奶器使用方法 浏览:925
FDMS颗粒物测量方法 浏览:777