1. 蛋白質組學主要包括哪些分析技術及各自特點
為探究生物進程的分子機制,需要確定介導這個過程的蛋白質-蛋白質間的相互作用。研究蛋白質間相互作用的主要技術總結如下:一、酵母雙雜交系統酵母雙雜交系統是當前廣泛用於蛋白質相互作用組學研究的一種重要方法。其原理是當靶蛋白和誘餌蛋白特異結合後,誘餌蛋白結合於報道基因的啟動子,啟動報道 基因在酵母細胞內的表達,如果檢測到報道基因的表達產物,則說明兩者之間有相互作用,反之則兩者之間沒有相互作用。將這種技術微量化、陣列化後則可用於大 規模蛋白質之間相互作用的研究。在實際工作中,人們根據需要發展了單雜交系統、三雜交系統和反向雜交系統等。Angermayr等設計了一個SOS蛋白介 導的雙雜交系統。可以研究膜蛋白的功能,豐富了酵母雙雜交系統的功能。此外,酵母雙雜交系統的作用也已擴展至對蛋白質的鑒定。二、噬茵體展示技術在編碼噬菌體外殼蛋白基因上連接一單克隆抗體的DNA序列,當噬菌體生長時,表面就表達出相應的單抗,再將噬菌體過柱,柱上若含目的蛋白,就會與相應抗體 特異性結合,這被稱為噬菌體展示技術。此技術也主要用於研究蛋白質之間的相互作用,不僅有高通量及簡便的特點,還具有直接得到基因、高選擇性的篩選復雜混 合物、在篩選過程中通過適當改變條件可以直接評價相互結合的特異性等優點。目前,用優化的噬菌體展示技術,已經展示了人和鼠的兩種特殊細胞系的cDNA文 庫,並分離出了人上皮生長因子信號傳導途徑中的信號分子。三、等離子共振技術表 面等離子共振技術(Surface Plasmon Resonance,SPR)已成為蛋白質相互作用研究中的新手段。它的原理是利用一種納米級的薄膜吸附上「誘餌蛋白」,當待測蛋白與誘餌蛋白結合後,薄 膜的共振性質會發生改變,通過檢測便可知這兩種蛋白的結合情況。SPR技術的優點是不需標記物或染料,反應過程可實時監控。測定快速且安全,還可用於檢測 蛋白一核酸及其它生物大分子之間的相互作用。………………
詳細資料請參考:on
http://proct.bio1000.com/101969/
2. 蛋白質組學樣品前處理的方法
要回答這個問題,首先需要理解樣品前處理需要達到的目的:減少人為降解和修飾,並且盡量多的釋放肽段。
整個過程可以分為以下流程:先從組織、體液或細胞中提取蛋白質,拿到蛋白混合溶液(根據你的研究目的,可以對蛋白先做分離,或者不分離),接下來還原烷基化(還原的過程是將蛋白的二硫鍵打開,然後烷基化可以修飾巰基,防止游離的巰基再生成二硫鍵)處理,並酶解成肽段。
1,樣品的收集與保存
組織樣品
1) 對於人體手術切除的組織,有條件的話,最好用PBS(磷酸緩沖鹽溶液,作為溶劑,起溶解保護試劑的作用)取完之後直接去血。如果沒有去血,可以-80℃液氮保存,乾冰運輸。
2)對於小鼠、大鼠、兔子之類的組織樣品,建議用灌流的方式來去血,尤其是像肝臟、胃、心臟這類大的組織,可以直接用灌流的方式去血,去得最干凈。其次的方案是在後期剪碎的時候去血。
細胞樣品
常規實驗,建議收到5*1E6~1E7個細胞以上的樣品量(有些實驗需要的樣品量會少一些,後面會詳細講)。細胞取好後,首先用PBS清洗一下細胞表面,因為大部分培養基裡面都含有血清,這部分血清得洗干凈了先~
如果是做分泌蛋白研究的話,首先用PBS清洗樣品幾次,再用條件培養基(不含有血清的培養基)進行培養,根據細胞情況,大概12個小時以後,離心,去掉細胞碎片,取上清,就能提取到分泌蛋白了。
血清樣品
1)血漿樣品:可以通過醫院常用的EDTA抗凝管進行收集,收集到的血漿會呈懸浮狀態,離心去掉血細胞。
2)血清樣品:現在大部分研究都直接針對血清樣品,它的成份更簡單,沒有凝集素,沒有大量的血細胞,針對性會更強。收集血清樣品時,直接把血清吸到管子里,室溫靜置讓它凝結,上清黃色部分就是血清樣品啦。
2,研磨或超聲破碎樣品,為了減少人為操作引入的修飾,通常會准備大量的冰,進行冰上的操作。同時還需要加入蛋白酶抑制劑,防止在操作過程中蛋白被樣品中自帶的蛋白酶降解掉。
3,充分熔接蛋白質,如果蛋白沒有充分溶解,能提取到的蛋白就會很少,達不到研究目的。
4,充分解旋蛋白質,通常,蛋白質都是成球狀的穩定狀態,解旋蛋白質就是將球狀蛋白中的二硫鍵打開,讓它形成鏈狀結構,以便進行下一步酶切。
5,酶解蛋白質,一般會用多種酶對蛋白質進行酶解。
6,去除雜質,我們要知道,質譜是一個非常靈敏的儀器,它檢測的是多肽的質荷比。所有的鹽類,以及所有會進行離子化的雜質,都會干擾到肽段的檢測。所以我們會要求進入質譜之前的蛋白樣品非常干凈。在蛋白水平及肽段水平都會進行去除雜質的步驟。
更詳細的,下次再聊~
3. 關於蛋白質組學檢測結果分析求助
1.蛋白質鑒定:可以利用一維電泳和二維電泳並結合Western等技術,利用蛋白質晶元和抗體晶元及免疫共沉澱等技術對蛋白質進行鑒定研究。
2.翻譯後修飾:很多mRNA表達產生的蛋白質要經歷翻譯後修飾如磷酸化,糖基化,酶原激活等。翻譯後修飾是蛋白質調節功能的重要方式,因此對蛋白質翻譯後修飾的研究對闡明蛋白質的功能具有重要作用。
3.蛋白質功能確定:如分析酶活性和確定酶底物,細胞因子的生物分析/配基-受體結合分析。可以利用基因敲除和反義技術分析基因表達產物-蛋白質的功能。另外對蛋白質表達出來後在細胞內的定位研究也在一定程度上有助於蛋白質功能的了解。Clontech的熒光蛋白表達系統就是研究蛋白質在細胞內定位的一個很好的工具。
4.對人類而言,蛋白質組學的研究最終要服務於人類的健康,主要指促進分子醫學的發展。如尋找葯物的靶分子。很多葯物本身就是蛋白質,而很多葯物的靶分子也是蛋白質。葯物也可以干預蛋白質-蛋白質相互作用。
在基礎醫學和疾病機理研究中,了解人不同發育、生長期和不同生理、病理條件下及不同細胞類型的基因表達的特點具有特別重要的意義。這些研究可能找到直接與特定生理或病理狀態相關的分子,進一步為設計作用於特定靶分子的葯物奠定基礎。 不同發育、生長期和不同生理、病理條件下不同的細胞類型的基因表達是不一致的,因此對蛋白質表達的研究應該精確到細胞甚至亞細胞水平。可以利用免疫組織化學技術達到這個目的,但該技術的致命缺點是通量低。激光捕獲顯微切割LCM(Laser Capture Microdissection)技術可以精確地從組織切片中取出研究者感興趣的細胞類型,因此LCM技術實際上是一種原位技術。取出的細胞用於蛋白質樣品的制備,結合抗體晶元或二維電泳-質譜的技術路線,可以對蛋白質的表達進行原位的高通量的研究。很多研究採用勻漿組織制備蛋白質樣品的技術路線,其研究結論值得懷疑,因為組織勻漿後不同細胞類型的蛋白質混雜在一起,最後得到的研究數據根本無法解釋蛋白質在每類細胞中的表達情況。雖然培養細胞可以得到單一類型細胞,但體外培養的細胞很難模擬體內細胞的環境,因此這樣研究得出的結論也很難用於解釋在體實際情況。因此在研究中首先應該將不同細胞類型分離,分離出來的不同類型細胞可以用於基因表達研究,包括mRNA和蛋白質的表達。
LCM技術獲得的細胞可以用於蛋白質樣品的制備。可以根據需要制備總蛋白,或膜蛋白,或核蛋白等,也可以富集糖蛋白,或通過去除白蛋白來減少蛋白質類型的復雜程度。相關試劑盒均有廠商提供。 蛋白質樣品中的不同類型的蛋白質可以通過二維電泳進行分離。二維電泳可以將不同種類的蛋白質按照等電點和分子量差異進行高解析度的分離。成功的二維電泳可以將2000到3000種蛋白質進行分離。電泳後對膠進行高靈敏度的染色如銀染和熒光染色。如果是比較兩種樣品之間蛋白質表達的異同,可以在同樣條件下分別制備二者的蛋白質樣品,然後在同樣條件下進行二維電泳,染色後比較兩塊膠。也可以將二者的蛋白質樣品分別用不同的熒光染料標記,然後兩種蛋白質樣品在一塊膠上進行二維電泳的分離,最後通過熒光掃描技術分析結果。
膠染色後可以利用凝膠圖像分析系統成像,然後通過分析軟體對蛋白質點進行定量分析,並且對感興趣的蛋白質點進行定位。通過專門的蛋白質點切割系統,可以將蛋白質點所在的膠區域進行精確切割。接著對膠中蛋白質進行酶切消化,酶切後的消化物經脫鹽/濃縮處理後就可以通過點樣系統將蛋白質點樣到特定的材料的表面(MALDI-TOF)。最後這些蛋白質就可以在質譜系統中進行分析,從而得到蛋白質的定性數據;這些數據可以用於構建資料庫或和已有的資料庫進行比較分析。
LCM-二維電泳-質譜的技術路線是典型的一條蛋白質組學研究的技術路線,除此以外,LCM-抗體晶元也是一條重要的蛋白質組學研究的技術路線。即通過LCM技術獲得感興趣的細胞類型,制備細胞蛋白質樣品,蛋白質經熒光染料標記後和抗體晶元雜交,從而可以比較兩種樣品蛋白質表達的異同。Clontech最近開發了一張抗體晶元,可以對378種膜蛋白和胞漿蛋白進行分析。該晶元同時配合了抗體晶元的全部操作過程的重要試劑,包括蛋白質制備試劑,蛋白質的熒光染料標記試劑,標記體系的純化試劑,雜交試劑等。
對於蛋白質相互作用的研究,酵母雙雜交和噬菌體展示技術無疑是很好的研究方法。Clontech開發的酵母雙雜交系統和NEB公司開發的噬菌體展示技術可供研究者選用。
關於蛋白質組的研究,也可以將蛋白質組的部分或全部種類的蛋白質製作成蛋白質晶元,這樣的蛋白質晶元可以用於蛋白質相互作用研究,蛋白表達研究和小分子蛋白結合研究。 Science,Vol. 293,Issue 5537,2101-2105,September 14,2001發表了一篇關於酵母蛋白質組晶元的論文。該文主要研究內容為:將酵母的5800個ORF表達成蛋白質並進行純化點樣製作晶元,然後用該晶元篩選鈣調素和磷脂分子的相互作用分子。
最後有必要指出的是,傳統的蛋白質研究注重研究單一蛋白質,而蛋白質組學注重研究參與特定生理或病理狀態的所有的蛋白質種類及其與周圍環境(分子)的關系。因此蛋白質組學的研究通常是高通量的。適應這個要求,蛋白質組學相關研究工具通常都是高度自動化的系統,通量高而速度快,配合相應分析軟體和資料庫,研究者可以在最短的時間內處理最多的數據
4. 蛋白質組學蛋白信號通路分析怎麼做
蛋白質組學蛋白信號通路分析怎麼做
不過信號通路最好還是從蛋白層面進行,分析可能的4條信號通路,做相關蛋白的western blot,檢測下游蛋白常見的如磷酸化修飾silicare(站內聯系TA)信號通路太復雜了,還是文獻吧,當然是 diea了livee(站內聯系TA):tiger07:xuec(站內聯系TA)多看些英文文獻吧,很多有關報道的
看多了你就有思路了
所以還是勤奮點兒吧tongyanna(站內聯系TA)我還真不明白啊xp198766(站內聯系TA)幫LZ頂,最近我想也知道類似問題的答案,不知道有沒有高手會KEGG的,能不能寫一點總結出來啊……期待啊……lwiaanngg(站內聯系TA)如果你知道大概的途徑,可以用上面說的RT-PCR等手段
如果你不知道,你可以使用蛋白microarray/DNA microarray來測定相對變換量sqhnsd(站內聯系TA)先做相關的表型觀察,看看錶型符合那個通路相關的現象,然後做WB、蛋白質相互作用等試驗進一步去檢測具體的機制如何。但是如何去做,還必須通過看文獻才能幫助你解決問題。charlie9(站內聯系TA)信號通路的變化,一般與mRNA的變化關系不大。它一般通過關鍵蛋白分子的修飾有關,因此RT-PCR一般不能說明問題。Western-blots檢測被修飾的蛋白分子為好。
5. 蛋白質組學主要包括哪些分析技術及各自特點
雙向凝膠電泳
雙向凝膠電泳的原理是第一向基於蛋白質的等電點不同用等電聚焦分離,第二向則按分子量的不同用SDS-PAGE分離,把復雜蛋白混合物中的蛋白質在二維平面上分開。由於雙向電泳技術在蛋白質組與醫學研究中所處的重要位置,它可用於蛋白質轉錄及轉錄後修飾研究,蛋白質組的比較和蛋白質間的相互作用,細胞分化凋亡研究,致病機制及耐葯機制的研究,療效監測,新葯開發,癌症研究,蛋白純度檢查,小量蛋白純化,新替代疫苗的研製等許多方面。近年來經過多方面改進已成為研究蛋白質組的最有使用價值的核心方法。
等電聚焦
等電聚焦(isoelectric focusing,IEF)是60年代中期問世的一種利用有pH梯度的介質分離等電點不同的蛋白質的電泳技術。等電聚焦凝膠電泳依據蛋白質分子的靜電荷或等電點進行分離,等電聚焦中,蛋白質分子在含有載體兩性電解質形成的一個連續而穩定的線性pH梯度中電泳。載體兩性電解質是脂肪族多氨基多羧酸,在電場中形成正極為酸性,負極為鹼性的連續的pH梯度。蛋白質分子在偏離其等電點的pH條件下帶有電荷,因此可以在電場中移動;當蛋白質遷移至其等電點位置時,其靜電荷數為零,在電場中不再移動,據此將蛋白質分離。
生物質譜
生物質譜技術是蛋白質組學研究中最重要的鑒定技術,其基本原理是樣品分子離子化後,根據不同離子之間的荷質比(M/E)的差異來分離並確定分子量。對於經過雙向電泳分離的目標蛋白質用胰蛋白酶酶解(水解Lys或Arg的-C端形成的肽鍵)成肽段,對這些肽段用質譜進行鑒定與分析。目前常用的質譜包括兩種:基質輔助激光解吸電離-飛行時間質譜(MALDI-TOF-MS)和電噴霧質譜(ESI- MS)。
飛行時間質譜
MALDI 的電離方式是 Karas和Hillenkamp於1988年提出。MALDI的基本原理是將分析物分散在基質分子(尼古丁酸及其同系物)中並形成晶體,當用激光(337nm的氮激光)照射晶體時,基質分子吸收激光能量,樣品解吸附,基質-樣品之間發生電荷轉移使樣品分子電離。它從固相標本中產生離子,並在飛行管中測定其分子量,MALDI-TOF-MS一般用於肽質量指紋圖譜,非常快速(每次分析只需3~5min),靈敏(達到fmol水平),可以精確測量肽段質量,但是如果在分析前不修飾肽段,MALDI-TOF-MS不能給出肽片段的序列。
電噴霧質譜(ESI-MS)
ESI- MS是利用高電場使質譜進樣端的毛細管柱流出的液滴帶電,在N2氣流的作用下,液滴溶劑蒸發,表面積縮小,表面電荷密度不斷增加,直至產生的庫侖力與液滴表面張力達到雷利極限,液滴爆裂為帶電的子液滴,這一過程不斷重復使最終的液滴非常細小呈噴霧狀,這時液滴表面的電場非常強大,使分析物離子化並以帶單電荷或多電荷的離子形式進入質量分析器。ESI-MS從液相中產生離子,一般說來,肽段的混合物經過液相色譜分離後,經過偶聯的與在線連接的離子阱質譜分析,給出肽片段的精確的氨基酸序列,但是 分析時間一般較長。 目前,許多實驗室兩種質譜方法連用,獲得有意義的蛋白質的肽段序列,設計探針或引物來獲得有意義的基因。隨著蛋白質組研究的深入,又有多種新型質譜儀出現,主要是在上述質譜儀的基礎上進行改進與重新組合。
6. 4. 蛋白質組學數據分析基礎(1)
說明:此篇筆記系2016-2017年由克里克學院與康昱盛主辦的蛋白質組學網路大課堂整理而成,侵刪。該課程由上海易算生物科技有限公司CEO沈誠頻博士所授。
話說,蛋白質質譜從十幾年前就形成了固定的數據結構和格式。現在常用的搜庫格式,比如mascot的mgf,從十年前就基本固定下來。
到目前為止,質譜界的數據格式因為儀器的不同,有幾個不同的大類:
這些數據格式的擴展名有一定的差別,且原始數據里包含的內容也有所不同。具體包含哪些重要的信息,稍後我們還會詳細講到。
數據分析,最終都是為了拿到一個可信的結果。所以,我們在講具體的分析原理之前,先得來聊聊,我們做一次高通量的蛋白質定性、定量實驗,以及搜庫鑒定及定量分析等步驟,對結果報告有哪些質控要求。
首先,我們做完實驗,在拿到下機數據的時候,大多數小夥伴們都會把數據放到各種搜庫軟體中,比如Mascot或者Thermo的Proteome Discoverer,導入原始數據,設定一些搜庫參數,就可以得到結果了。
但是,作為一個嚴謹的實驗方案設計來說,在分析的過程中,是需要對自己的數據有一個前期質控的,這樣可以幫助大家判斷數據分析結果的可靠性。所以說,基本的質控可以幫助我們對實驗結果進行一個預判。
舉個例子。
我們打開一個實驗的下機數據,就可以預判我們的樣品中是否發生了高分子塑料的PEG污染,有沒有超高豐度的蛋白,或者有沒有被嚴重的鹽類污染。這些數據都可以從原始數據的可視化視圖中看到。
不同的質譜軟體,打開原始數據的方式不同,但這些信息都是可見的。另外,當兩次實驗搜索到的蛋白數量差異比較大時,也可以從TIC圖來判斷其原因。此外還可以判斷分離的效率,以及是否出現噴霧中斷等情況。
對於蛋白鑒定的結果,或者絕大多數的搜庫演算法,都要求對結果進行FDR控制,以及unique peptide的控制等等。如果我們要發表這些數據,絕大多數的期刊雜志也都會要求提供這些質控的信息。
那麼,問題就來了,為什麼要做這樣的要求呢?
事實上,我們做好了質控,就能夠看到一個總的鑒定的比例。比如說像常規的定量實驗,用的最多的是iTRAQ。
舉個例子。
假設總蛋白數只有2446個,算是比較少的,而總的譜圖數是53萬張,那麼它的譜圖鑒定率在當前條件下是32%(有些質控軟體可以直接報告譜圖鑒定率,比如Scaffold),我們可以判斷當前的實驗並沒有出現重大的問題,鑒定率不高主要是因為存在高豐度蛋白,而這個後續可以進行詳細的查看。
對於定量實驗,不管我們使用的是SILAC,iTRAQ還是Label Free,都需要對定量結果進行准確性控制(詳細內容,後續課程還會展開講解)。一般來說,我們需要用相應的軟體和統計方法來進行質控。
經過這幾步的判斷之後,可以得到一個初步的結果,比如說譜圖數量是否和之前的結果差不多,質量精度及鑒定率如何,高豐度蛋白的存在與否,是否受污染,分離效率如何,定量是否准確,標記效率是否ok,等等,這些信息都可以得到。這樣,我們最終可以得到一個准確可靠的蛋白質組學鑒定或定量結果用於後續的分析了。
那麼,如何通過查看原始數據來進行初步質控呢?
首先,我們從原始數據出發,可以看到下圖(以Data-dependent-acquisiton數據依賴性掃描為例),是從色譜出來的一個LC分離得到的TIC圖,其中的信號採集都是在質譜中完成的,它其實就是將色譜逐漸通過噴霧的方式進入質譜的那些信號進行逐一的掃描,然後在其中挑選高強度的譜峰進行二級碎裂。
關於LC分離,以及TIC圖的詳細介紹,請參考上一節課的內容:
下圖就是色譜離子流圖的某個瞬間。橫坐標是質荷比,縱坐標是信號強度。這個瞬間進入色譜的有這樣一些信號,信號強度最高的是質荷比為477.31的肽段,其他一些肽段也可以進行查看。
這是我們在打開質譜的下機數據所能看到的最直觀的結果。我們需要了解的是,這只是我們所有結果的某一個瞬間,某一個scan。這一個scan是否能夠反映整個結果的好壞是不確定的,所以後續我們需要進一步的展開。
對於質譜來說,在這一步會自動選擇其中一個比較強的峰,比如說477,它會進行一個動態的排除,這也是Data-dependent-acquisiton的一個重要參數。就是說,在多少秒之內,這么強的一個峰如果一直反復出現的話,那麼在後續的掃描過程中,我們不去再對它進行進行MS2碎裂了。
比如說如圖的477.31,我們質譜儀器記錄時發現前面已經對它做過二級碎裂了,那麼我們就有可能選擇另外一個比較弱的譜峰。比如552.80,將它進行二級碎裂。
我們再來看一眼二級譜峰,如下圖,就是對我們全長的進入質譜的肽段信息進行打碎,得到相應的B/Y離子,如下圖,這些在後面我們會進行詳細的講解。
下圖是Thermo質譜的原理示意圖(由Thermo工程師提供)。這是QE的原理圖,我們先在綠色的范圍內進行一次full scan的mass掃描,然後判斷當前選擇的離子信號強度,以及在最近的幾十秒鍾之內是否對其進行掃描過。
如果沒有,那麼在緊接著的循環過程中,我們會對之前30秒之內(假設當前的儀器速度可以達到10個MS)沒有掃描過的最強的十個譜峰進行二級碎裂,那麼質譜就會依次將色譜推進來的噴霧中的肽段進行依次碎裂。
這就是DDA模式基本的原理。我們的數據也是根據這樣的一個過程來記錄的。
如果將剛才的掃描過程二維展開,可以得到下圖,看上去跟二維凝膠電泳圖很像吧?橫坐標是質荷比,縱坐標是保留時間,而剛才那張圖橫坐標是保留時間,縱坐標是強度(LC seperation圖),所以,此圖沒有質荷比信息。
我們知道,在進入full scan的MS掃描時是有質荷比信息的。所以簡單的講,上圖是將剛才的兩張圖的信息拼接,然後將整個下機數據所有的瞬間都進行了一個拼接,由於維度的限制,因此信號強度信息無法再展示了。
但在此圖中用了顏色的深淺來表示保留時間,顏色深的就是相對信號較強的肽段。而圖中的每一根小線段都代表一個肽段,小線段的長度對應著肽段的保留時間,加上橫坐標質荷比的信息,因此通過這張全局縱覽圖,就能夠看到我們這次實驗分離的效果如何,有沒有PEG、鹽、或者其它污染,有沒有噴霧中斷等情況發生,這些都能在這張圖中有一個大致的把握。
因此,這張圖對於我們進行數據質控非常有用。不同的軟體和儀器有不同的方法來提供這張圖。此次舉例用的圖是由Peaks軟體得來的。
我們可以在上圖中選定自己感興趣的部分,畫一個小方框,將方框中的內容進行打開放大,就得到了下圖我們存儲數據的結果形式了。這是在Qual Browser里打開我們的數據看到的結果。
其實這就是將我們的模擬圖轉換成數據信號,儲存在我們的Raw文件中,或者說進一步提取成MGF文件所用到的相關信息。
這里主要包含兩大類信息:MS1和MS2的信息,也就是full scan mass和二級碎裂的信息。這兩類信息的結構式是一模一樣的,都是包含質核比、強度值,以及相對信號強度。
比如說794.03譜峰,相對信號強度是100,也就是在這張譜圖中,這是最強的一個峰,信號強度是3558210.8。那麼對於我們質譜的搜索來說,一級信息和二級信息都是需要用到的,其中一級信息是首要的,也就是圖中MS1部分,是後續搜庫的關鍵信息。而二級譜圖的強度信息一般用於定量,也就是說如果不是做SILAC或者非標記定量,這些信息不是最重要的。
另外,第一欄的信息准確性也是非常重要的。比如圖上紅框內,我們可以得到的信息是,794.03和794.36強度大約差了1.5倍,後面的峰強度差了大約2倍,再看下紅框內四個數據的質荷比相差並不大,我們的質譜儀器因此會判斷這四個峰非常符合一個肽段的同位素分布(肽段同位素分段的性狀,後續將會講解)。
回到此圖,794.03應該是一個肽段,後面三個數據是同一個肽段,這就是我們進行precursor識別的原理。有些時候質譜會識別錯誤,認為紅框上一行的793.69更可能是同位素,這個就需要我們自己進行校正。
質譜在搜集信號的時候,會告訴我們794.03是一個母離子或者說是肽段的譜峰,因此在後續進行MS2碎裂的時候,會挑選這樣一個譜峰,以及在質譜中我們會設定相應的窗口去打碎它。因為僅僅設定一個非常小的窗口,可能信號不夠。我們會設計比如正負1.5個道爾頓的窗口,把這些信號全部採集進去進行二級碎裂得到二級信號。
現在高分辨質譜中,二級信號也會包含同位素信息,因此數據分析軟體需要對這些信息進行有效的處理。
大家可以看到,這樣一個例子中,軟體記錄的是794.03,但實際我們可以通過肉眼觀察,793.69跟794.03就只相差0.33~0.34,也是一個三電荷同位素的差值(1除以0.33是3,這就是質荷比中的Z的計算原理)。兩者分別的強度271萬和355萬差別也不是非常大,我們會判斷出793.69更可能是零同位素峰(如何判斷後面會再講解)。
我們進行後續數據提取和採集的時候,也就是用了這樣的信息來進行分析。我們記錄的一級質譜數據,以及二級質譜對應的列表,其中最重要的是m/z和intensity,在一級質譜數據中,強度並不用於蛋白鑒定的打分,但二級質譜數據中的強度值卻會被用於打分。
下篇將聊聊同位素的問題,以及如何解讀原始譜圖包含的信息。
7. 蛋白質組學常用的研究方法
酵母雙雜交系統、抗體晶元、LCM技術、mic Solution Inc、SPR技術、色譜分離技術、雙相電泳技術、有機質譜等等。
LCM技術獲得的細胞可以用於蛋白質樣品的制備。
蛋白質樣品中的不同類型的蛋白質可以通過二維電泳進行分離。
膠染色後可以利用凝膠圖象分析系統成像,然後通過分析軟體對蛋白質點進行定量分析,並且對感興趣的蛋白質點進行定位。
Genomic Solution可以為研究者提供除質譜外的所有蛋白質組學研究工具,包括二維電泳系統,成像系統及分析軟體,膠切割系統,蛋白質消化濃縮工作站,點樣工作站等;同時還可以提供相關試劑和消耗品。
蛋白質相互作用的研究,酵母雙雜交和噬菌體展示技術無疑是很好的研究方法。
LCM-二維電泳-質譜的技術路線是典型的一條蛋白質組學研究的技術路線,除此以外,LCM-抗體晶元也是一條重要的蛋白質組學研究的技術路線。
………………
詳細資料請參考:on
http://proct.bio1000.com/101969/
8. 1. 蛋白質組學研究方法概述(上)
說明:此篇筆記系2016-2017年由克里克學院與康昱盛主辦的蛋白質組學網路大課堂整理而成,侵刪。該課程由上海交通大學系統生物醫學研究院助理研究員庫鑫博士所授。
大夥兒都知道,蛋白質組學(proteomics),是研究一種細胞或者一種生物體所表達的全部蛋白質。雖說現在基因組測序火得一塌糊塗,但是,我們不要忽略了,蛋白質才是執行生命體功能的基本單元,而且蛋白質都是通過形成各種復合物,組成通路網路,去行使各種生物學功能的!所以,有很多生物學問題只能在蛋白質層面上去研究去探索,而且需要站在系統的層面去考察,比如說:蛋白-蛋白相互作用、蛋白的細胞定位、翻譯後修飾、信號通路及代謝通路的調控和功能等。這就是為啥蛋白質組學如此重要啦!
既然重要,科學家們自然是想盡辦法來研究了!最開始使用的技術就是傳說中的雙向凝膠電泳(2-DE),由於解析度低、蛋白質重疊等各種問題,無論是通量還是准確度,都不盡如人意。當質譜技術興起以後,就迅速被替代了。
說起質譜技術的誕生,估計很多小夥伴都聽過那個著名的diao絲逆襲的段子,講的就是2002年諾貝爾化學獎得主田中耕一,作為蛋白質譜發明人之一,由於一個不小心在實驗時錯加了甘油,結果神奇地將質譜技術引入到鑒定生物大分子的應用領域。想想,大到整個人類的科技發展史,小到每個個體的人生,都充滿了多少不可思議~
當質譜技術與蛋白質組學碰到了一起,真是天雷引了地火,產生出強烈的化學反應,迅速引爆整個學科的發展!也就十幾年的時間吧,蛋白質組學的研究目標從細胞模型、動物模型,到人的體液、組織等人體樣本,應用范圍的生物復雜度越來越高。研究目的呢,也從最初的肽段序列推導,到多肽和蛋白質的定性定量分析,翻譯後修飾,再到如今成為新熱點的靶向蛋白質組學,總之,勢不可擋啊!
說到靶向蛋白質組學,咱們都知道,一直以來蛋白質組學的應用領域主要是針對基礎生物學,比如研究通路、蛋白復合物、互作網路,表徵細胞和組織的類型,觀察細胞周期內蛋白質的表達等。近年來,由於技術的飛速發展,蛋白質組學開始被用於醫學研究和葯物研究。比如說葯物研究,國內可能用得還不多,但在歐美已經開始越來越廣泛。以肝毒性為例,蛋白質組學可以為葯物研發前期的肝毒性評估提供研究手段。
那麼,怎麼將蛋白質組學應用到臨床及葯物研發中呢?就是需要靶向蛋白質組學技術了!以前,蛋白質組學技術主要用於發現新的未知物,比如肽段、蛋白復合物、蛋白的翻譯後修飾等。這部分的應用很廣,技術門檻比較低,方法比較通用。但問題是,這種方法思路沒辦法應對大量的臨床樣本,可重復性和准確性達不到要求。
於是,靶向分析開始興起,就是說,分析之前我們就明確知道需要分析的物質是什麼,然後把它挑出來,進行一個精確的定量和分析!我們不需要一次性驗證成千上萬的蛋白,但我們需要在成百上午的樣本中驗證十幾種或者幾十種我們關心的蛋白質,而且這些蛋白質常常都是濃度很低的蛋白,用傳統的方法基本上只有被遺漏的命(後面我會詳細講為什麼會遺漏)。有了靶向技術,對於研究臨床診斷的生物標志物,就有了更大的可能和更強的支撐了!
那麼接下來,根據老師講課的思路,我就從定性檢測、定量檢測和靶向蛋白質組學三個方面來分享下聽課的收獲。
無論是定性還是定量檢測,樣品制備是跑不掉的准備工作。用於質譜的蛋白質樣品,來源非常廣泛,只要你是包含了蛋白質的東西,都可以作為來源。對於復雜的樣品,比如人體體液或組織樣本,蛋白質的提取及去高峰度,常常需要復雜的精細的處理,而且處理流程根據樣本和研究目的的不同而不同。這部分內容呢,第二講「樣品前處理」會詳扒,感興趣的小夥伴可以期待我的下一篇聽課筆記吧~
話說,蛋白質的定性檢測有兩種思路:Bottom-up和Top down。Top down是指從一個完整的蛋白出發,在質譜中進行碎片化處理,通過對碎片分子的檢測,推導出蛋白的序列。而在使用中真正占絕大多數是Bottom-up方法,也就是我們常說的shotgun方法,它充分利用了蛋白質自身的特點:可以被特定的酶在特定的位點切斷。基本思路是,先用蛋白酶把蛋白序列進行酶切,再針對酶切後的肽段進行鑒定,所以進入質譜的檢測對象永遠是肽段,再根據肽段序列再推導出蛋白序列。
1. 樣本處理 :拿到蛋白來源的各種樣本,進行前處理和優化。
2. 蛋白分離 :根據研究需要,用凝膠分離,提取所需的蛋白,或者不分離,全部拿來檢測,需要注意去雜質;
3. 酶切 :用序列特異性的酶,對蛋白進行酶切;
4. 肽段分離 :酶切後的肽段進入HPLC(高壓液相色譜),這也就是我們常說的LC-MS中的LC,肽段會因為在色譜柱填料上的保留時間的不同,得到預分離;
5. 電離 :分離後的肽段,加電壓使其離子化(ESI);或者用MALDI基質輔助的激光解離,就不需要HPLC的過程;
6. 質譜解析 :將帶上電荷的肽段送入質譜,肽段會在磁場中發生偏轉(質譜儀的基本原理),在質譜里收集信號,得到譜圖。
7. 搜庫 :用搜索軟體對質譜圖進行自動化的分析,得到肽段及蛋白序列信息。
換個角度,對Shotgun方法的流程,我們可以這樣來總結:
這裡面最關鍵的一個指標,我們叫Peptide-Spectrum matching(PSM),就是指譜圖與肽段的匹配。匹配得越好,則反推出的蛋白就越准確。這個匹配的過程,也就是我們常說的搜庫。那麼接下來我就來分享一下從課程中學習到的搜庫背景知識、搜庫工具和演算法,以及對搜索結果的評估。
質譜,聽上去很高大上,無論有多貴重,都是由三部分組成的:離子源+質量分析器+檢測器。
一台質譜可以不止一個離子源\分析器\檢測器,可以把幾種串聯起來,針對不同分析需要來使用。
離子源
我們先來說說離子源。蛋白質譜所使用的ESI(Electrospray ionization)電噴霧離子化,對蛋白質組學來說是一個標志性的發明!因為是直接從液相進行離子化,使它與LC(液相色譜)的聯用變得更加容易了,我們可以先用LC將非常復雜的肽段混合物進行預分離,減少每次分析物的復雜度,然後分離的肽段可以直接進入ESI,形成電離噴霧。
那麼,ESI噴霧是怎麼形成的呢?簡單來說,分離柱前端有一個小開口,被分析物根據質量及電荷的不同,依次通過前端的小開口。小開口處加了電壓,剛開始,靜電力與表面張力相同,當加大靜電力使它大於表面張力的時候,液膜破裂,形成無數帶電的小液滴,就形成噴霧了。像現在比較新的nanoESI技術,LC的流速就更加慢,離子化的效果也更好。覺得以上描述還不夠形象的童鞋,直接看圖吧:
質量分析器
說完了離子源,接下來我們來說質量分析器,這是質譜儀里最重要的一部分。我們通常聽到的各種質譜儀的名字,就是根據質量分析器的類型來命名的。我們樣品中各組分在離子源中發生電離,並經加速電場的作用後,形成離子束,進入質量分析器中。質量分析器將帶電離子根據其質荷比加以分離,記錄各種離子的質量數和豐度,用於後續定性與定量的分析。
質量分析器有兩個主要的技術參數:質量范圍和解析度。質量范圍是指是所能測定的質荷比的范圍,它決定了咱們能檢測到的離子的范圍。比如,ESI離子源能產生許多m/z大於3000的離子,如果你選的質量分析器的上限達不到3000,那麼3000以上的離子你就檢測不出來了。
然而,另一個更為重要的指標,就是質量分析器的解析度!先上個公式描述:
解析度=觀測的一個質譜峰的質荷比/半峰高處的峰寬(FWHM)
啥意思呢?比如下圖中最左邊的那個峰,它的質荷比是1,085.55,峰高一半的地方的峰寬值是0.217,於是:
解析度=1,085.55/0.217=5,000
如果這么講還是不太明白,那你可以簡單理解為,質譜解析度越高,我們將得到越尖越細的譜峰。你可能會問:譜峰又尖又細的好處是什麼?這是個好問題!事實上,解析度可以表徵兩個相鄰的譜峰在質譜中被區分開的能力。大家通過下圖感受一下不同解析度的質譜儀能給我們多麼不同的譜峰圖。
圖中以Glucagon(胰高血糖素)為例,展示了不同解析度的質譜儀給出的譜峰。當解析度是1000時,只能看一個很寬的峰(藍色);解析度增加到3000時,峰窄一些(紅色),但還感受不到明顯的差別;當提高到10000時,很明顯能看到,其實這里包含了8個峰(綠色);再提高到30000的時候,半峰寬更窄,兩個相鄰的峰可以徹底地被分開(黑色)。顯然,我們在解析度為1000或3000,不能准確的檢測被分析肽段的精確分子量, 從而導致譜圖無法匹配或者發生錯配。
不同的質量分析器有不同的解析度,通常的順序是:傅里葉變換質譜解析度最高,但造價太貴;其次是Orbitrap(軌道阱系列),解析度遠遠高於其它質譜;再次是TOF(時間飛行質譜);然後是離子阱(Ion Trap);最後是四級桿質譜(Quadrupole)。
這里我多說一句,解析度高固然好,但價格肯定就貴,選擇質譜儀的時候要根據咱們自己的研究目的以及預算范圍啦!
二級質譜
然而,要對肽段進行鑒定,一級質譜顯然是辦不到的,我們沒法根據肽段離子m/z的值就推斷出這個肽段由哪些氨基酸殘基組成(可能的組合非常多),以及序列順序是怎麼樣的,對吧?所以,鑒定肽段還需要二級質譜。
什麼是二級質譜呢?簡單來說,肽段混合物通過一級質譜得到了一級譜圖,然後從中選擇一個肽段,通過一些方法,比如,與隨性氣體進行碰撞,把肽段碰碎,得到碎片離子,再形成二級譜圖。我們通過觀察碎片離子的質量分布來推斷肽斷的殘基組成,最後再反推出蛋白質是什麼。上個圖,幫助大家理解一下二級質譜是怎麼來的。
在上一段,我提到是從一級質譜中「選擇」一個肽段進入二級質譜。這里看似講得雲淡風輕,事實上怎麼選卻是一個很關鍵的問題!通常選擇的方法我們可以叫做「TOP」法(這是我自己起的名字),比如TOP15就是指從一級譜里選前15個高度的峰,每一次分離一個肽段,然後對這個肽段進行掃描,得到二級譜圖。
大家發現了沒有?如果一個肽段在一級譜圖中沒有進入TOP15,那它連打二級譜圖的資格都沒有!原來質譜的世界競爭也是如何殘酷!二級質譜能掃描哪些肽段是由一級質譜決定的,所以我們將這種方法稱為「數據依賴性採集(DDA, data dependent acquisition)!
明白了吧,DDA這個名字就是這么來的!下次大夥兒再聽到有人說DDA,心裡不會再一百個問號飛過了吧?
咱們細想一下就不難發現,如果一個蛋白的濃度不夠高,也就是說,它的肽段在一級譜圖中很難成為那些TOPs,那麼它能進入二級質譜的可能性基本上沒有。這就是為什麼低峰度蛋白很難被鑒定到!這也就是為什麼我們在做比如血液這種樣品的時候,一定要去除血紅蛋白等高峰度蛋白(如果你想鑒定的蛋白不是血紅蛋白的話)!
很顯然,DDA方法的局限性就擺在那裡!這叫想要研究低峰度蛋白的科學家們怎麼忍?於是,一種叫做數據非依賴性採集(DIA)的新方法就應運而生了!關於這種方法的原理,下一篇推文會詳扒。
我們再通過以下這個圖來感受一下一級譜圖與二級譜圖之間的關系:
比如,第一個時間點,我們先進行MS1掃描,然後選一個峰高的肽段進行MS2掃描,依次類推。在一些掃描速度比較快的質譜儀里,一個MS1譜圖可以進行80張MS2的掃描。
鑒定碎片離子
好,我們搞清楚了二級質譜是怎麼來的,那麼我們怎麼根據檢測到的離子信息來推測這是什麼氨基酸呢?可能你會說,這還不簡單么?根據分子量呀!
沒錯,不同的氨基酸,它的分子量不就是一個簡單的值嗎?然而,這件事卻並沒有這么簡單,因為這個世界上還存在一個神奇的東西,它的名字叫同位素!
比如說碳元素,最常見的是原子量12的這種,我們叫C12,然而它還有一個同樣很穩定的好基友,C13(多一個中子)。於是,我們得考慮到這兩種穩定同位素的含量(網路說C13占 1.11%,C12佔98.89%),對於一個氨基酸而言,我們就會得到兩個不同的分子量:
為啥說平均呢?因為當肽段分子量越大,含有各種同位素的可能性及不同組合就越多,我們如果把每一種組合都算一遍分子量,這樣會得到一個長長的list,到時候做譜圖匹配時用哪一個值呢?也沒譜。所以乾脆用一個平均值來表示。
我們通過下表來感受一下各種不同的氨基酸殘基的單同位素分子量與平均分子量有多大的區別:
可能你又會問,這兩個不同的分子量分別在什麼情況下用呢?這里又要說到解析度了,如果咱們用的是高解析度質譜儀,不同的同位素峰會被明顯地分開,也就是說,譜圖里我們能看幾個同位素峰,這時我們就可以使用單同位素分子量,可以與相應的單同位素峰准確對應。但在低解析度質譜儀里,這些峰很可能混在一起,看上去只是一個峰,這種情況下,也沒辦法,只能用平均分子量去近似一下了。
下面這個圖可以很形象地展示出,單同位素分子量與平均分子量在質譜圖上差別有多大。在高分辨質譜看來,這完全就是兩種不同的離子了。上面我們也說了,根據平均分子量來計算,結果並不準確,但用單同位素分子量來計算,就可以准確對應了。
除了同位素,還有一個因素我們也需要考慮,那就是肽段碎裂進入二級質譜時,可能會形成三種不同的離子類型,這就是我們通常所說的by離子,ax離子和cz離子。
之所以會形成不同的離子對,是因為不同的碎裂方法,造成肽段斷裂的位置不同。大夥兒看看上面這個圖就明白了。當我們使用CID(碰撞誘導解離)或HCD(High-energy C-trap Dissociation)碎裂時,與惰性氣體碰撞的是C-N鍵這里,C端生成y離子,N端生成b離子,這是二級質譜產生的最常見的離子對了。當我們使用ETD(電子轉移解離)碎裂時,因為有一個電子反應的過程,在加上電子後才產生的碎裂,它的斷裂位置可能出現在N-C鍵這里,形成cz離子,而TOF類儀器可能會產生ax離子。
離子類型的信息需要傳遞給後續的搜庫步驟(通常我們在搜庫軟體中指定了儀器類型,軟體就會自動匹配離子類型),計算機需要模擬最可能的碎裂位置,生成對應的理論譜圖,然後拿來與實際譜圖比對。我們以by離子為例,來看看對一個肽段來說,它可能碎裂成哪些碎片離子:
那麼它可能會生成如下這樣的譜圖:
從譜圖上看,這個肽段所有的by離子都檢測到了。通常來說,對於豐度不錯,長短合適的肽段,在高精度質譜儀上被完整捕獲到的情況是很常見的。通常情況下50%-80%的by離子都能被捕獲到。
下篇繼續講定性檢測里的搜庫工具、結果評估,以及定量檢測的各種背景知識。